Detail publikace

BUT OpenSAT 2017 speech recognition system

KARAFIÁT Martin, BASKAR Murali K., SZŐKE Igor, MALENOVSKÝ Vladimír, VESELÝ Karel, GRÉZL František, BURGET Lukáš a ČERNOCKÝ Jan. BUT OpenSAT 2017 speech recognition system. In: Proceedings of Interspeech 2018. Hyderabad: International Speech Communication Association, 2018, s. 2638-2642. ISSN 1990-9772. Dostupné z: https://www.isca-speech.org/archive/Interspeech_2018/abstracts/2457.html
Název česky
VUT systém rozpoznávání řeči pro OpenSAT 2017
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

Článek pojednává o VUT systému rozpoznávání řeči pro OpenSAT 2017 evaluace, které proběhly pro dvě domény: Low Resourced Languages and Public Safety Communications. První doména byla náročná kvůli nedostatku tréninkových dat, proto byly pro trénink BLSTM použity vícejazyčné přístupy a byly použity nedávno publikované sítě Residual Memory Networks vyžadující méně tréninkových dat. Kombinace obou přístupů vedla k vynikajícímu výkonu. Druhá doména byla náročná kvůli nahrávání v extrémních podmínkách: specifický kanál, reproduktor ve stresu, vysoká úroveň šumu. Proces získávání dat byl velmi důležitý pro dosažení přiměřeně dobrého výkonu.

Rok
2018
Strany
2638-2642
Časopis
Proceedings of Interspeech - on-line, roč. 2018, č. 9, ISSN 1990-9772
Sborník
Proceedings of Interspeech 2018
Konference
Interspeech Conference, Hyderabad, India, IN
Vydavatel
International Speech Communication Association
Místo
Hyderabad, IN
DOI
UT WoS
000465363900553
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB11838,
   author = "Martin Karafi\'{a}t and K. Murali Baskar and Igor Sz\H{o}ke and Vladim\'{i}r Malenovsk\'{y} and Karel Vesel\'{y} and Franti\v{s}ek Gr\'{e}zl and Luk\'{a}\v{s} Burget and Jan \v{C}ernock\'{y}",
   title = "BUT OpenSAT 2017 speech recognition system",
   pages = "2638--2642",
   booktitle = "Proceedings of Interspeech 2018",
   journal = "Proceedings of Interspeech - on-line",
   volume = 2018,
   number = 9,
   year = 2018,
   location = "Hyderabad, IN",
   publisher = "International Speech Communication Association",
   ISSN = "1990-9772",
   doi = "10.21437/Interspeech.2018-2457",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/11838"
}
Nahoru