Dolování infoRmAcí z řeči Pořízené vzdÁlenými miKrofony (DRAPÁK)

Název v angličtině:Information mining in speech acquired by distant microphones
Hlavní řešitel:Černocký Jan
Spoluřešitelé:Malenovský Vladimír, Matějka Pavel, Plchot Oldřich, Veselý Karel
Další řešitelé:Kesiraju Santosh, Ondel Lucas
Agentura:Ministerstvo vnitra České republiky - Bezpečnostní výzkum České republiky 2015-2020
Kód:VI20152020025
Zahájení:2015-10-01
Ukončení:2020-09-30
Klíčová slova:dolování informací z řeči, rozpoznávání řeči, rozpoznávání mluvčího, identifikace jazyka, detekce klíčových slov, vzdálené mikro
Anotace:
Dolování informací z řeči se stává nepostradatelné pro složky bojující proti kriminalitě a terorismu. Současné verze dovolují úspěšné nasazení na signálech získaných pomocí close-talk" mikrofonů. Cílem projektu DRAPÁK je zvýšit úspěšnost dolování v řeči pořízené vzdálenými mikrofony v reálném prostředí a generovat relevantní informace v odpovídajících operačních scénářích. Výstupem je sada softwarových nástrojů, které budou k disposici pro testování PČR a státními složkami.

Produkty

2016Software pro umělé zašumování a reverberování řečových nahrávek, software, 2016
Autoři: Szőke Igor, Malenovský Vladimír, Novotný Ondřej

Publikace

2019NOVOTNÝ Ondřej, PLCHOT Oldřich, GLEMBEK Ondřej, ČERNOCKÝ Jan a BURGET Lukáš. Analysis of DNN Speech Signal Enhancement for Robust Speaker Recognition. Computer Speech and Language. Amsterdam: Elsevier Science, 2019, roč. 2019, č. 58, s. 403-421. ISSN 0885-2308.
 ZEINALI Hossein, BURGET Lukáš, ROHDIN Johan A., STAFYLAKIS Themos a ČERNOCKÝ Jan. How To Improve Your Speaker Embeddings Extractor in Generic Toolkits. In: Proceedings of ICASSP 2019. Brighton: IEEE Signal Processing Society, 2019, s. 6141-6145. ISBN 978-1-5386-4658-8.
2018ALAM Jahangir, BHATTACHARYA Gautam, BRUMMER Niko, BURGET Lukáš, DIEZ Sánchez Mireia, GLEMBEK Ondřej, KENNY Patrick, KLČO Michal, LANDINI Federico Nicolás, LOZANO Díez Alicia, MATĚJKA Pavel, MONTEIRO Joao, MOŠNER Ladislav, NOVOTNÝ Ondřej, PLCHOT Oldřich, PROFANT Ján, ROHDIN Johan A., SILNOVA Anna, SLAVÍČEK Josef, STAFYLAKIS Themos a ZEINALI Hossein. ABC NIST SRE 2018 SYSTEM DESCRIPTION. In: Proceedings of 2018 NIST SRE Workshop. Athens: United States Department of Commerce, National Institute of Standards and Technology, 2018, s. 1-10.
 BARTOS Anthony L., CIPR Tomáš, NELSON Douglas J., SCHWARZ Petr, BANOWETZ John a JERABEK Ladislav. Noise-robust speech triage. The Journal of the Acoustical Society of America. 2018, roč. 143, č. 4, s. 2313-2320. ISSN 1520-8524.
 BRUMMER Niko, SILNOVA Anna, BURGET Lukáš a STAFYLAKIS Themos. Gaussian meta-embeddings for efficient scoring of a heavy-tailed PLDA model. In: Proceedings of Odyssey 2018. Les Sables d'Olonne: International Speech Communication Association, 2018, s. 349-356. ISSN 2312-2846.
 DIEZ Sánchez Mireia, LANDINI Federico Nicolás, BURGET Lukáš, ROHDIN Johan A., SILNOVA Anna, ŽMOLÍKOVÁ Kateřina, NOVOTNÝ Ondřej, VESELÝ Karel, GLEMBEK Ondřej, PLCHOT Oldřich, MOŠNER Ladislav a MATĚJKA Pavel. BUT system for DIHARD Speech Diarization Challenge 2018. In: Proceedings of Interspeech 2018. Hyderabad: International Speech Communication Association, 2018, s. 2798-2802. ISSN 1990-9772.
 KARAFIÁT Martin, BASKAR Murali K., SZŐKE Igor, MALENOVSKÝ Vladimír, VESELÝ Karel, GRÉZL František, BURGET Lukáš a ČERNOCKÝ Jan. BUT OpenSAT 2017 speech recognition system. In: Proceedings of Interspeech 2018. Hyderabad: International Speech Communication Association, 2018, s. 2638-2642. ISSN 1990-9772.
 LOZANO Díez Alicia, PLCHOT Oldřich, MATĚJKA Pavel a GONZALEZ-RODRIGUEZ Joaquin. DNN Based Embeddings for Language Recognition. In: Proceedings of ICASSP 2018. Calgary: IEEE Signal Processing Society, 2018, s. 5184-5188. ISBN 978-1-5386-4658-8.
 LOZANO Díez Alicia, PLCHOT Oldřich, MATĚJKA Pavel, NOVOTNÝ Ondřej a GONZALEZ-RODRIGUEZ Joaquin. Analysis of DNN-based Embeddings for Language Recognition on the NIST LRE 2017. In: Proceedings of Odyssey 2018 The Speaker and Language Recognition Workshop. Les Sables d'Olonne: International Speech Communication Association, 2018, s. 39-46. ISSN 2312-2846.
 MOŠNER Ladislav, MATĚJKA Pavel, NOVOTNÝ Ondřej a ČERNOCKÝ Jan. Dereverberation and Beamforming in Far-Field Speaker Recognition. In: Proceedings of ICASSP 2018. Calgary: IEEE Signal Processing Society, 2018, s. 5254-5258. ISBN 978-1-5386-4658-8.
 MOŠNER Ladislav, PLCHOT Oldřich, MATĚJKA Pavel, NOVOTNÝ Ondřej a ČERNOCKÝ Jan. Dereverberation and Beamforming in Robust Far-Field Speaker Recognition. In: Proceedings of Interspeech 2018. Hyderabad: International Speech Communication Association, 2018, s. 1334-1338. ISSN 1990-9772.
 NOVOTNÝ Ondřej, MATĚJKA Pavel, PLCHOT Oldřich a GLEMBEK Ondřej. On the use of DNN Autoencoder for Robust Speaker Recognition. Brno: Fakulta informačních technologií VUT v Brně, 2018.
 NOVOTNÝ Ondřej, PLCHOT Oldřich, MATĚJKA Pavel, MOŠNER Ladislav a GLEMBEK Ondřej. On the use of X-vectors for Robust Speaker Recognition. In: Proceedings of Odyssey 2018. Les Sables d´Olonne: International Speech Communication Association, 2018, s. 168-175. ISSN 2312-2846.
 PLCHOT Oldřich, MATĚJKA Pavel, NOVOTNÝ Ondřej, CUMANI Sandro, LOZANO Díez Alicia, SLAVÍČEK Josef, DIEZ Sánchez Mireia, GRÉZL František, GLEMBEK Ondřej, KAMSALI Veera Mounika, SILNOVA Anna, BURGET Lukáš, ONDEL Lucas, KESIRAJU Santosh a ROHDIN Johan A. Analysis of BUT-PT Submission for NIST LRE 2017. In: Proceedings of Odyssey 2018 The Speaker and Language Recognition Workshop. Les Sables d'Olonne: International Speech Communication Association, 2018, s. 47-53. ISSN 2312-2846.
 SILNOVA Anna, MATĚJKA Pavel, GLEMBEK Ondřej, PLCHOT Oldřich, NOVOTNÝ Ondřej, GRÉZL František, SCHWARZ Petr a ČERNOCKÝ Jan. BUT/Phonexia Bottleneck Feature Extractor. In: Proceedings of Odyssey 2018. Les Sables d´Olonne: International Speech Communication Association, 2018, s. 283-287. ISSN 2312-2846.
 ZEINALI Hossein, BURGET Lukáš a ČERNOCKÝ Jan. Convolutional Neural Networks and X-Vector Embedding for DCASE2018 Acoustic Scene Classification Challenge. In: Proceedings of DCASE 2018 Workshop. Surrey: Tampere University of Technology, 2018, s. 1-5. ISBN 978-952-15-4262-6.
2017KARAFIÁT Martin, VESELÝ Karel, ŽMOLÍKOVÁ Kateřina, DELCROIX Marc, WATANABE Shinji, BURGET Lukáš, ČERNOCKÝ Jan a SZŐKE Igor. Training Data Augmentation and Data Selection. New Era for Robust Speech Recognition: Exploiting Deep Learning. Heidelberg: Springer International Publishing, 2017, s. 245-260. ISBN 978-3-319-64679-4.
 MATĚJKA Pavel, NOVOTNÝ Ondřej, PLCHOT Oldřich, BURGET Lukáš, DIEZ Sánchez Mireia a ČERNOCKÝ Jan. Analysis of Score Normalization in Multilingual Speaker Recognition. In: Proceedings of Interspeech 2017. Stockholm: International Speech Communication Association, 2017, s. 1567-1571. ISSN 1990-9772.
 MATĚJKA Pavel, PLCHOT Oldřich, NOVOTNÝ Ondřej, CUMANI Sandro, LOZANO Díez Alicia, SLAVÍČEK Josef, DIEZ Sánchez Mireia, GRÉZL František, GLEMBEK Ondřej, KAMSALI Veera Mounika, SILNOVA Anna, BURGET Lukáš, ONDEL Lucas, KESIRAJU Santosh a ROHDIN Johan A. BUT- PT System Description for NIST LRE 2017. In: Proceedings of NIST Language Recognition Workshop 2017. Orlando, Florida: United States Department of Commerce, National Institute of Standards and Technology, 2017, s. 1-6.
 PLCHOT Oldřich, MATĚJKA Pavel, SILNOVA Anna, NOVOTNÝ Ondřej, DIEZ Sánchez Mireia, ROHDIN Johan A., GLEMBEK Ondřej, BRÜMMER Niko, SWART Albert du Preez, PRIETO Jesús J., GARCIA Perera Leibny Paola, BUERA Luis, KENNY Patrick, ALAM Jahangir a BHATTACHARYA Gautam. Analysis and Description of ABC Submission to NIST SRE 2016. In: Proceedings of Interspeech 2017. Stockholm: International Speech Communication Association, 2017, s. 1348-1352. ISSN 1990-9772.
 SILNOVA Anna, BURGET Lukáš a ČERNOCKÝ Jan. Alternative Approaches to Neural Network based Speaker Verification. In: Proceedings of Interspeech 2017. Stockholm: International Speech Communication Association, 2017, s. 1572-1575. ISSN 1990-9772.
 VESELÝ Karel, BASKAR Murali K., DIEZ Sánchez Mireia a BENEŠ Karel. MGB-3 but system: Low-resource ASR on Egyptian YouTube data. In: Proceedings of ASRU 2017. Okinawa: IEEE Signal Processing Society, 2017, s. 368-373. ISBN 978-1-5090-4788-8.
 ZEINALI Hossein, SAMETI Hossein a BURGET Lukáš. HMM-Based Phrase-Independent i-Vector Extractor for Text-Dependent Speaker Verification. IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING. New York City: IEEE Signal Processing Society, 2017, roč. 25, č. 7, s. 1421-1435. ISSN 2329-9290.
 ZEINALI Hossein, SAMETI Hossein, BURGET Lukáš a ČERNOCKÝ Jan. Text-dependent speaker verification based on i-vectors, Neural Networks and Hidden Markov Models. Computer Speech and Language. Amsterdam: Elsevier Science, 2017, roč. 2017, č. 46, s. 53-71. ISSN 0885-2308.
 ŽMOLÍKOVÁ Kateřina, DELCROIX Marc, KINOSHITA Keisuke, HIGUCHI Takuya, OGAWA Atsunori a NAKATANI Tomohiro. Speaker-aware neural network based beamformer for speaker extraction in speech mixtures. In: Proceedings of Interspeech 2017. Stocholm: International Speech Communication Association, 2017, s. 2655-2659. ISSN 1990-9772.
2016BRUMMER Niko, SWART Albert du Preez, PRIETO Jesús J., GARCIA Perera Leibny Paola, MATĚJKA Pavel, PLCHOT Oldřich, DIEZ Sánchez Mireia, SILNOVA Anna, JIANG Xiaowei, NOVOTNÝ Ondřej, ROHDIN Johan A., GLEMBEK Ondřej, GRÉZL František, BURGET Lukáš, ONDEL Lucas, PEŠÁN Jan, ČERNOCKÝ Jan, KENNY Patrick, ALAM Jahangir, BHATTACHARYA Gautam a ZEINALI Hossein a kol. ABC NIST SRE 2016 SYSTEM DESCRIPTION. San Diego: United States Department of Commerce, National Institute of Standards and Technology, 2016.
 LOZANO Díez Alicia, SILNOVA Anna, MATĚJKA Pavel, GLEMBEK Ondřej, PLCHOT Oldřich, PEŠÁN Jan, BURGET Lukáš a GONZALEZ-RODRIGUEZ Joaquin. Analysis and Optimization of Bottleneck Features for Speaker Recognition. In: Proceedings of Odyssey 2016. Bilbao: International Speech Communication Association, 2016, s. 352-357. ISSN 2312-2846.
 MATĚJKA Pavel, GLEMBEK Ondřej, NOVOTNÝ Ondřej, PLCHOT Oldřich, GRÉZL František, BURGET Lukáš a ČERNOCKÝ Jan. Analysis Of DNN Approaches To Speaker Identification. In: Proceedings of the 41th IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2016), 2016. Shanghai: IEEE Signal Processing Society, 2016, s. 5100-5104. ISBN 978-1-4799-9988-0.
 NOVOTNÝ Ondřej, MATĚJKA Pavel, GLEMBEK Ondřej, PLCHOT Oldřich, GRÉZL František, BURGET Lukáš a ČERNOCKÝ Jan. Analysis of the DNN-Based SRE Systems in Multi-language Conditions. In: Proceedings of SLT 2016. San Diego: IEEE Signal Processing Society, 2016, s. 199-204. ISBN 978-1-5090-4903-5.
 NOVOTNÝ Ondřej, MATĚJKA Pavel, PLCHOT Oldřich, GLEMBEK Ondřej, BURGET Lukáš a ČERNOCKÝ Jan. Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge. In: Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016, s. 828-832. ISBN 978-1-5108-3313-5.
 PEŠÁN Jan, BURGET Lukáš a ČERNOCKÝ Jan. Sequence Summarizing Neural Networks for Spoken Language Recognition. In: Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016, s. 3285-3289. ISBN 978-1-5108-3313-5.
 PLCHOT Oldřich, BURGET Lukáš, ARONOWITZ Hagai a MATĚJKA Pavel. Audio Enhancing With DNN Autoencoder For Speaker Recognition. In: Proceedings of the 41th IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2016), 2016. Shanghai: IEEE Signal Processing Society, 2016, s. 5090-5094. ISBN 978-1-4799-9988-0.
 PLCHOT Oldřich, MATĚJKA Pavel, FÉR Radek, GLEMBEK Ondřej, NOVOTNÝ Ondřej, PEŠÁN Jan, VESELÝ Karel, ONDEL Lucas, KARAFIÁT Martin, GRÉZL František, KESIRAJU Santosh, BURGET Lukáš, BRUMMER Niko, SWART Albert du Preez, CUMANI Sandro, MALLIDI Sri Harish a LI Ruizhi. BAT System Description for NIST LRE 2015. In: Proceedings of Odyssey 2016, The Speaker and Language Recognition Workshop. Bilbao: International Speech Communication Association, 2016, s. 166-173. ISSN 2312-2846.
 VESELÝ Karel, WATANABE Shinji, ŽMOLÍKOVÁ Kateřina, KARAFIÁT Martin, BURGET Lukáš a ČERNOCKÝ Jan. Sequence Summarizing Neural Network for Speaker Adaptation. In: Proceedings of the 41th IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2016), 2016. Shanghai: IEEE Signal Processing Society, 2016, s. 5315-5319. ISBN 978-1-4799-9988-0.
 ZEINALI Hossein, SAMETI Hossein, BURGET Lukáš, ČERNOCKÝ Jan, MAGHSOODI Nooshin a MATĚJKA Pavel. i-vector/HMM Based Text-dependent Speaker Verification System for RedDots Challenge. In: Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016, s. 440-444. ISBN 978-1-5108-3313-5.
2015HSIAO Roger, MA Jeff, HARTMANN William, KARAFIÁT Martin, GRÉZL František, BURGET Lukáš, SZŐKE Igor, ČERNOCKÝ Jan, WATANABE Shinji, CHEN Zhuo, MALLIDI Sri Harish, HEŘMANSKÝ Hynek, TSAKALIDIS Stavros a SCHWARTZ Richard. Robust Speech Recognition in Unknown Reverberant and Noisy Conditions. In: Proceedings of 2015 IEEE Automatic Speech Recognition and Understanding Workshop. Scottsdale, Arizona: IEEE Signal Processing Society, 2015, s. 533-538. ISBN 978-1-4799-7291-3.

Vaše IPv4 adresa: 18.232.53.231