NTT - Speech enhancement front-end for robust automatic speech recognition with large amount of training data

Název v češtině:Parametrizace s obohacováním řeči pro robustní automatické rozpoznávání řeči s velkým objemem trénovacích dat
Hlavní řešitel:Žmolíková Kateřina
Spoluřešitelé:Černocký Jan
Agentura:NTT Corporation
Zahájení:2019-01-01
Ukončení:2019-12-31
Klíčová slova:rozpoznávání řeči, odolnost, velký objem dat,
Anotace:
Cílem společného výzkumu je vyvinout technologie parametrizace s obohacováním řeči pro robustní automatické rozpoznávání řeči s velkým objemem trénovacích dat v rámci spolupráce mezi VUT a NTT. Práce je založena na nízkodimenzionálních reprezentacích dat (embeddings) produkovaných neuronovými sítěmi v různých místech řetězce zpracování.

Publikace

2019ROHDIN Johan A., SILNOVA Anna, DIEZ Sánchez Mireia, PLCHOT Oldřich, MATĚJKA Pavel, BURGET Lukáš a GLEMBEK Ondřej. End-to-end DNN based text-independent speaker recognition for long and short utterances. Computer Speech and Language. Amsterdam: Elsevier Science, 2019, roč. 2020, č. 59, s. 22-35. ISSN 0885-2308.

Vaše IPv4 adresa: 3.226.251.205