Zvýšení spolehlivosti v automatickém rozpoznávání řečníka

Název v angličtině:Improving Robustnes in Automatic Speaker Recognition
Hlavní řešitel:Glembek Ondřej
Spoluřešitelé:Fér Radek, Novotný Ondřej
Agentura:Grantová agentura České republiky - Juniorské granty
Kód:GJ17-23870Y
Zahájení:2017-01-01
Ukončení:2019-12-31
Klíčová slova:automatické rozpoznávání řečníka;robustnost;adaptace;řeč
Anotace:
Systémy pro automatické rozpoznávání řečníka dosáhly za posledních několik let vysokých rozpoznávacích úspěšností. Přesto při jejich nasazení v nových doménách, tedy za zcela jiných podmínek než za jakých byly postaveny, jejich úspěšnost dramaticky klesá. K takovým faktorům patří například jazyk mluvčích, styl mluvy, společenské podmínky mluvčích, akustické prostředí, nahrávací zařízení, přítomnost neřečových událostí, ruchy, přenosový kanál, atp. Řešením tohoto problému je a) vývoj metod pro robustní modelování nebo b) adaptace daného systému na novou doménu pomocí adaptačních dat. V tomto projektu se chceme zaměřit na obě tyto oblasti.
Popis projektu:
Cíle tohoto projektu jsou výzkum, vývoj a analýza obecných adaptačních technik a technik pro zvýšení robustnosti systémů pro automatické rozpoznávání mluvčího.

Publikace

2018MOŠNER Ladislav, MATĚJKA Pavel, NOVOTNÝ Ondřej a ČERNOCKÝ Jan. Dereverberation and Beamforming in Far-Field Speaker Recognition. In: Proceedings of ICASSP 2018. Calgary: IEEE Signal Processing Society, 2018, s. 5254-5258. ISBN 978-1-5386-4658-8.
 ROHDIN Johan A., SILNOVA Anna, DIEZ Sánchez Mireia, PLCHOT Oldřich, MATĚJKA Pavel a BURGET Lukáš. End-to-End DNN Based Speaker Recognition Inspired by i-Vector and PLDA. In: Proceedings of ICASSP. Calgary: IEEE Signal Processing Society, 2018, s. 4874-4878. ISBN 978-1-5386-4658-8.
2017PLCHOT Oldřich, MATĚJKA Pavel, SILNOVA Anna, NOVOTNÝ Ondřej, DIEZ Sánchez Mireia, ROHDIN Johan A., GLEMBEK Ondřej, BRÜMMER Niko, SWART Albert du Preez, PRIETO Jesús J., GARCIA Perera Leibny Paola, BUERA Luis, KENNY Patrick, ALAM Jahangir a BHATTACHARYA Gautam. Analysis and Description of ABC Submission to NIST SRE 2016. In: Proceedings of Interspeech 2017. Stockholm: International Speech Communication Association, 2017, s. 1348-1352. ISSN 1990-9772.
 SILNOVA Anna, BURGET Lukáš a ČERNOCKÝ Jan. Alternative Approaches to Neural Network based Speaker Verification. In: Proceedings of Interspeech 2017. Stockholm: International Speech Communication Association, 2017, s. 1572-1575. ISSN 1990-9772.

Vaše IPv4 adresa: 54.198.170.159
Přepnout na IPv6 spojení

DNSSEC [dnssec]