Ústav počítačové grafiky a multimédií
Multiligvální rozpoznávání a vyhledávání v řeči pro elektronické slovníky |
| Hlavní řešitel: | Černocký Jan |
| Spoluřešitelé: | Burget Lukáš, Grézl František, Karafiát Martin, Matějka Pavel, Schwarz Petr, Žižka Josef |
| Další řešitelé: | Kubalík Jakub, Tomášek Pavel, Veselý Karel |
| Agentura: | MPO ČR |
| Kód: | FR-TI1/034 |
| Začátek: | 2009 |
| Konec: | 2013 |
| Klíčová slova: | multiligvalita, rozpoznávání řeči, detekceklíčových slov, elektronické slovníky
|
| Anotace: |
| Projekt je zaměřen na výzkum, vývoj a ověření technologií, které umožní prototypovat systémy pro rozpoznávání a vyhledávání v řeči pouze s několika hodinami přepsaných trénovacích dat, bez fonetické a lingvistické expertízy. Tyto technologie budou ověřeny v oblasti elektronických slovníků. |
Předcházející projekty
Publikace
| 2013 | Janda Miloš: Automatic Generation Of Pronunciation Dictionaries Based On Diarization, In: Proceedings of the 19th Conference Student EEICT 2013, Brno, CZ, VUT v Brně, 2013, s. 228-232, ISBN 978-80-214-4695-3 |
| 2012 | Brummer Niko, Cumani Sandro, Glembek Ondřej, Karafiát Martin, Matějka Pavel, Pešán Jan, Plchot Oldřich, Soufifar Mehdi, de Villiers Edward, Černocký Jan: Description and analysis of the Brno276 system for LRE2011, In: Proceedings of Odyssey 2012: The Speaker and Language Recognition Workshop, Singapur, SG, ISCA, 2012, s. 216-223, ISBN 978-981-07-3093-2 |
| | Janda Miloš, Karafiát Martin, Černocký Jan: Dealing with Numbers in Grapheme-Based Speech Recognition, In: Proceedings of 15th International Conference on Text, Speech and Dialogue, Springer-Verlag Berlin Heidelberg 2012, DE, Springer, 2012, s. 438-445, ISBN 978-3-642-32789-6, ISSN 0302-9743 |
| | Janda Miloš: Grapheme Based Speech Recognition, In: Proceedings of the 18th Conference STUDENT EEICT 2012, Brno, CZ, VUT v Brně, 2012, s. 441-445, ISBN 978-80-214-4460-7 |
| | Karafiát Martin, Janda Miloš, Černocký Jan, Burget Lukáš: Region Dependent Linear Transforms in Multilingual Speech Recognition, In: Proc. International Conference on Acoustics, Speech, and Signal Processing 2012, Kyoto, JP, IEEESP, 2012, s. 4885-4888, ISBN 978-1-4673-0044-5 |
| | Kombrink Stefan, Mikolov Tomáš, Karafiát Martin, Burget Lukáš: Improving Language Models for ASR Using Translated In-domain Data, In: Proceedings of 2012 IEEE International Conference on Acoustics, Speech and Signal Processing, Kyoto, JP, IEEESP, 2012, s. 4405-4408, ISBN 978-1-4673-0044-5 |
| | Plchot Oldřich, Karafiát Martin, Brummer Niko, Glembek Ondřej, Matějka Pavel, de Villiers Edward, Černocký Jan: Speaker vectors from Subspace Gaussian Mixture Model as complementary features for Language Identification, In: Proceedings of Odyssey 2012, The Speaker and Language Recognition Workshop, Singapur, SG, ISCA, 2012, s. 330-333, ISBN 978-981-07-3093-2 |
| | Szőke Igor, Fapšo Michal, Veselý Karel: BUT2012 přístup pro Spoken Web Search úkol na MediaEval2012, In: CEUR Workshop Proceedings, roč. 2012, č. 927, DE, s. 1-2, ISSN 1613-0073 |
| | Tejedor Javier, Fapšo Michal, Szőke Igor, Černocký Jan, Grézl František: Comparison of methods for language-dependent and language-independent query-by-example spoken term detection, In: ACM Transactions on Information Systems (TOIS), roč. 2012, č. 30, New York, US, s. 1-34, ISSN 1046-8188 |
| | Veselý Karel, Karafiát Martin, Grézl František, Janda Miloš, Egorova Ekaterina: The Language-Independent Bottleneck Features, In: Proceedings of IEEE 2012 Workshop on Spoken Language Technology, Miami, US, IEEESP, 2012, s. 336-341, ISBN 978-1-4673-5124-9 |
| 2011 | Grézl František, Karafiát Martin, Janda Miloš: Study of Probabilistic and Bottle-Neck Features in Multilingual Environment, In: Proceedings of ASRU 2011, Hilton Waikoloa Village, Big Island, Hawaii, US, IEEESP, 2011, s. 359-364, ISBN 978-1-4673-0366-8 |
| | Karafiát Martin, Burget Lukáš, Matějka Pavel, Glembek Ondřej, Černocký Jan: iVector-Based Discriminative Adaptation for Automatic Speech Recognition, In: Proceedings of ASRU 2011, Hilton Waikoloa Village, Big Island, Hawaii, US, IEEESP, 2011, s. 152-157, ISBN 978-1-4673-0366-8 |
| | Mikolov Tomáš, Deoras Anoop, Povey Daniel, Burget Lukáš, Černocký Jan: Strategies for Training Large Scale Neural Network Language Models, In: Proceedings of ASRU 2011, Hilton Waikoloa Village, Big Island, Hawaii, US, IEEESP, 2011, s. 196-201, ISBN 978-1-4673-0366-8 |
| | Mikolov Tomáš, Kombrink Stefan, Deoras Anoop, Burget Lukáš, Černocký Jan: RNNLM - Recurrent Neural Network Language Modeling Toolkit, In: Proceedings of ASRU 2011, Hilton Waikoloa Village, Big Island, Hawaii, US, IEEESP, 2011, s. 1-4, ISBN 978-1-4673-0366-8 |
| | Povey Daniel, Burget Lukáš, Agarwal Mohit, Akyazi Pinar, Ghoshal Arnab, Glembek Ondřej, Goel Nagendra K., Karafiát Martin, Rastrow Ariya, Rose Richard, Schwarz Petr, Thomas Samuel a kol.: The subspace Gaussian mixture model-A structured model for speech recognition, In: Computer Speech and Language, roč. 25, č. 2, 2011, Amsterdam, NL, s. 404-439, ISSN 0885-2308 |
| | Povey Daniel, Karafiát Martin, Ghoshal Arnab, Schwarz Petr: A Symmetrization of the Subspace Gaussian Mixture Model, In: Proceedings of 2011 IEEE International Conference on Acoustics, Speech, and Signal Processing, Praha, CZ, IEEESP, 2011, s. 4504-4507, ISBN 978-1-4577-0537-3 |
| | Veselý Karel, Karafiát Martin, Grézl František: Convolutive Bottleneck Network Features for LVCSR, In: Proceedings of ASRU 2011, Big Island, Hawaii, US, IEEESP, 2011, s. 42-47, ISBN 978-1-4673-0366-8 |
| 2010 | Burget Lukáš, Schwarz Petr, Agarwal Mohit, Akyazi Pinar, Feng Kai, Ghoshal Arnab, Glembek Ondřej, Goel Nagendra K., Karafiát Martin, Povey Daniel, Rastrow Ariya, Rose Richard, Thomas Samuel: Multilingual acoustic modeling for speech recognition based on Subspace Gaussian Mixture Models, In: Proc. International Conference on Acoustictics, Speech, and Signal Processing, Dallas, US, IEEESP, 2010, s. 4334-4337, ISBN 978-1-4244-4296-6, ISSN 1520-6149 |
| | Ghoshal Arnab, Povey Daniel, Agarwal Mohit, Akyazi Pinar, Burget Lukáš, Feng Kai, Glembek Ondřej, Goel Nagendra K., Karafiát Martin, Rastrow Ariya, Rose Richard, Schwarz Petr, Thomas Samuel: A novel estimation of feature-space MLLR for full-covariance models, In: Proc. International Conference on Acoustics, Speech, and Signal Processing, Dallas, US, IEEESP, 2010, s. 4310-4313, ISBN 978-1-4244-4296-6, ISSN 1520-6149 |
| | Goel Nagendra K., Thomas Samuel, Agarwal Mohit, Akyazi Pinar, Burget Lukáš, Feng Kai, Ghoshal Arnab, Glembek Ondřej, Karafiát Martin, Povey Daniel, Rastrow Ariya, Rose Richard, Schwarz Petr: Approaches to automatic LEXICON learning with limited training examples, In: Proc. International Conference on Acoustics, Speech, and Signal Processing, Dallas, US, IEEESP, 2010, s. 5094-5097, ISBN 978-1-4244-4296-6, ISSN 1520-6149 |
| | Povey Daniel, Burget Lukáš, Agarwal Mohit, Akyazi Pinar, Feng Kai, Ghoshal Arnab, Glembek Ondřej, Goel Nagendra K., Karafiát Martin, Rastrow Ariya, Rose Richard, Schwarz Petr, Thomas Samuel: Subspace Gaussian mixture models for speech recognition, In: Proc. International Conference on Acoustics, Speech, and Signal Processing, Dallas, US, IEEESP, 2010, s. 4330-4333, ISBN 978-1-4244-4296-6, ISSN 1520-6149 |
|
|