Ústav počítačové grafiky a multimédií

Multiligvální rozpoznávání a vyhledávání v řeči pro elektronické slovníky

Hlavní řešitel:Černocký Jan
Spoluřešitelé:Burget Lukáš, Grézl František, Karafiát Martin, Matějka Pavel, Schwarz Petr, Žižka Josef
Další řešitelé:Kubalík Jakub, Tomášek Pavel, Veselý Karel
Agentura:MPO ČR
Kód:FR-TI1/034
Začátek:2009
Konec:2013
Klíčová slova:multiligvalita, rozpoznávání řeči, detekceklíčových slov, elektronické slovníky
Anotace:
Projekt je zaměřen na výzkum, vývoj a ověření technologií, které umožní prototypovat systémy pro rozpoznávání a vyhledávání v řeči pouze s několika hodinami přepsaných trénovacích dat, bez fonetické a lingvistické expertízy. Tyto technologie budou ověřeny v oblasti elektronických slovníků.

Předcházející projekty

2006Výzkum a vývoj korpusových a hlasových technologií v nové generaci elektronických slovníků, MPO ČR, FT-TA3/006, 2006-2009, ukončen
Řešitel: Černocký Jan
Spoluřešitelé: Fapšo Michal, Grézl František, Pešán Jan, Schwarz Petr, Szőke Igor

Publikace

2013Janda Miloš: Automatic Generation Of Pronunciation Dictionaries Based On Diarization, In: Proceedings of the 19th Conference Student EEICT 2013, Brno, CZ, VUT v Brně, 2013, s. 228-232, ISBN 978-80-214-4695-3
2012Brummer Niko, Cumani Sandro, Glembek Ondřej, Karafiát Martin, Matějka Pavel, Pešán Jan, Plchot Oldřich, Soufifar Mehdi, de Villiers Edward, Černocký Jan: Description and analysis of the Brno276 system for LRE2011, In: Proceedings of Odyssey 2012: The Speaker and Language Recognition Workshop, Singapur, SG, ISCA, 2012, s. 216-223, ISBN 978-981-07-3093-2
 Janda Miloš, Karafiát Martin, Černocký Jan: Dealing with Numbers in Grapheme-Based Speech Recognition, In: Proceedings of 15th International Conference on Text, Speech and Dialogue, Springer-Verlag Berlin Heidelberg 2012, DE, Springer, 2012, s. 438-445, ISBN 978-3-642-32789-6, ISSN 0302-9743
 Janda Miloš: Grapheme Based Speech Recognition, In: Proceedings of the 18th Conference STUDENT EEICT 2012, Brno, CZ, VUT v Brně, 2012, s. 441-445, ISBN 978-80-214-4460-7
 Karafiát Martin, Janda Miloš, Černocký Jan, Burget Lukáš: Region Dependent Linear Transforms in Multilingual Speech Recognition, In: Proc. International Conference on Acoustics, Speech, and Signal Processing 2012, Kyoto, JP, IEEESP, 2012, s. 4885-4888, ISBN 978-1-4673-0044-5
 Kombrink Stefan, Mikolov Tomáš, Karafiát Martin, Burget Lukáš: Improving Language Models for ASR Using Translated In-domain Data, In: Proceedings of 2012 IEEE International Conference on Acoustics, Speech and Signal Processing, Kyoto, JP, IEEESP, 2012, s. 4405-4408, ISBN 978-1-4673-0044-5
 Plchot Oldřich, Karafiát Martin, Brummer Niko, Glembek Ondřej, Matějka Pavel, de Villiers Edward, Černocký Jan: Speaker vectors from Subspace Gaussian Mixture Model as complementary features for Language Identification, In: Proceedings of Odyssey 2012, The Speaker and Language Recognition Workshop, Singapur, SG, ISCA, 2012, s. 330-333, ISBN 978-981-07-3093-2
 Szőke Igor, Fapšo Michal, Veselý Karel: BUT2012 přístup pro Spoken Web Search úkol na MediaEval2012, In: CEUR Workshop Proceedings, roč. 2012, č. 927, DE, s. 1-2, ISSN 1613-0073
 Tejedor Javier, Fapšo Michal, Szőke Igor, Černocký Jan, Grézl František: Comparison of methods for language-dependent and language-independent query-by-example spoken term detection, In: ACM Transactions on Information Systems (TOIS), roč. 2012, č. 30, New York, US, s. 1-34, ISSN 1046-8188
 Veselý Karel, Karafiát Martin, Grézl František, Janda Miloš, Egorova Ekaterina: The Language-Independent Bottleneck Features, In: Proceedings of IEEE 2012 Workshop on Spoken Language Technology, Miami, US, IEEESP, 2012, s. 336-341, ISBN 978-1-4673-5124-9
2011Grézl František, Karafiát Martin, Janda Miloš: Study of Probabilistic and Bottle-Neck Features in Multilingual Environment, In: Proceedings of ASRU 2011, Hilton Waikoloa Village, Big Island, Hawaii, US, IEEESP, 2011, s. 359-364, ISBN 978-1-4673-0366-8
 Karafiát Martin, Burget Lukáš, Matějka Pavel, Glembek Ondřej, Černocký Jan: iVector-Based Discriminative Adaptation for Automatic Speech Recognition, In: Proceedings of ASRU 2011, Hilton Waikoloa Village, Big Island, Hawaii, US, IEEESP, 2011, s. 152-157, ISBN 978-1-4673-0366-8
 Mikolov Tomáš, Deoras Anoop, Povey Daniel, Burget Lukáš, Černocký Jan: Strategies for Training Large Scale Neural Network Language Models, In: Proceedings of ASRU 2011, Hilton Waikoloa Village, Big Island, Hawaii, US, IEEESP, 2011, s. 196-201, ISBN 978-1-4673-0366-8
 Mikolov Tomáš, Kombrink Stefan, Deoras Anoop, Burget Lukáš, Černocký Jan: RNNLM - Recurrent Neural Network Language Modeling Toolkit, In: Proceedings of ASRU 2011, Hilton Waikoloa Village, Big Island, Hawaii, US, IEEESP, 2011, s. 1-4, ISBN 978-1-4673-0366-8
 Povey Daniel, Burget Lukáš, Agarwal Mohit, Akyazi Pinar, Ghoshal Arnab, Glembek Ondřej, Goel Nagendra K., Karafiát Martin, Rastrow Ariya, Rose Richard, Schwarz Petr, Thomas Samuel a kol.: The subspace Gaussian mixture model-A structured model for speech recognition, In: Computer Speech and Language, roč. 25, č. 2, 2011, Amsterdam, NL, s. 404-439, ISSN 0885-2308
 Povey Daniel, Karafiát Martin, Ghoshal Arnab, Schwarz Petr: A Symmetrization of the Subspace Gaussian Mixture Model, In: Proceedings of 2011 IEEE International Conference on Acoustics, Speech, and Signal Processing, Praha, CZ, IEEESP, 2011, s. 4504-4507, ISBN 978-1-4577-0537-3
 Veselý Karel, Karafiát Martin, Grézl František: Convolutive Bottleneck Network Features for LVCSR, In: Proceedings of ASRU 2011, Big Island, Hawaii, US, IEEESP, 2011, s. 42-47, ISBN 978-1-4673-0366-8
2010Burget Lukáš, Schwarz Petr, Agarwal Mohit, Akyazi Pinar, Feng Kai, Ghoshal Arnab, Glembek Ondřej, Goel Nagendra K., Karafiát Martin, Povey Daniel, Rastrow Ariya, Rose Richard, Thomas Samuel: Multilingual acoustic modeling for speech recognition based on Subspace Gaussian Mixture Models, In: Proc. International Conference on Acoustictics, Speech, and Signal Processing, Dallas, US, IEEESP, 2010, s. 4334-4337, ISBN 978-1-4244-4296-6, ISSN 1520-6149
 Ghoshal Arnab, Povey Daniel, Agarwal Mohit, Akyazi Pinar, Burget Lukáš, Feng Kai, Glembek Ondřej, Goel Nagendra K., Karafiát Martin, Rastrow Ariya, Rose Richard, Schwarz Petr, Thomas Samuel: A novel estimation of feature-space MLLR for full-covariance models, In: Proc. International Conference on Acoustics, Speech, and Signal Processing, Dallas, US, IEEESP, 2010, s. 4310-4313, ISBN 978-1-4244-4296-6, ISSN 1520-6149
 Goel Nagendra K., Thomas Samuel, Agarwal Mohit, Akyazi Pinar, Burget Lukáš, Feng Kai, Ghoshal Arnab, Glembek Ondřej, Karafiát Martin, Povey Daniel, Rastrow Ariya, Rose Richard, Schwarz Petr: Approaches to automatic LEXICON learning with limited training examples, In: Proc. International Conference on Acoustics, Speech, and Signal Processing, Dallas, US, IEEESP, 2010, s. 5094-5097, ISBN 978-1-4244-4296-6, ISSN 1520-6149
 Povey Daniel, Burget Lukáš, Agarwal Mohit, Akyazi Pinar, Feng Kai, Ghoshal Arnab, Glembek Ondřej, Goel Nagendra K., Karafiát Martin, Rastrow Ariya, Rose Richard, Schwarz Petr, Thomas Samuel: Subspace Gaussian mixture models for speech recognition, In: Proc. International Conference on Acoustics, Speech, and Signal Processing, Dallas, US, IEEESP, 2010, s. 4330-4333, ISBN 978-1-4244-4296-6, ISSN 1520-6149

Vaše IPv4 adresa: 72.44.48.122
Přepnout na IPv6 spojení

DNSSEC [dnssec]