Detail publikace

On the use of X-vectors for Robust Speaker Recognition

NOVOTNÝ Ondřej, PLCHOT Oldřich, MATĚJKA Pavel, MOŠNER Ladislav a GLEMBEK Ondřej. On the use of X-vectors for Robust Speaker Recognition. In: Proceedings of Odyssey 2018. Les Sables d´Olonne: International Speech Communication Association, 2018, s. 168-175. ISSN 2312-2846.
Název česky
K použití x-vektorů pro robustní rozpoznávání mluvčího
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

Textově nezávislé ověřování mluvčích (SV) je v současné době v procesu přijímání DNN modelování v každé fázi systému SV. Přístupy založené na DNN, jako je end-to-end modelování a systémy založené na vkládání DNN, pomalu začínají být konkurenceschopné i v náročných a rozmanitých podmínkách kanálu nedávných SRN NIST. Přizpůsobení domény a potřeba velkého množství tréninkových dat jsou stále výzvou pro současné diskriminační systémy a (na rozdíl od generativních modelů) vidíme významné zisky z rozšiřování dat, simulace a dalších technik určených k překonání nedostatku tréninkových dat. Představujeme analýzu systému SV založeného na vložení DNN (vektory x) a zaměřujeme se na robustnost napříč různými datovými doménami, jako jsou standardní telefonní a mikrofonní konverzace, a to jak v čistém, hlučném, tak i reverberantním prostředí. Vyhodnocujeme také systém podle náročných dat ze vzdáleného pole vytvořených opětovným přenosem podmnožiny rozhovorů s mikrofony NIST SRE 2008 a 2010. Porovnáváme naše výsledky s nejmodernějším i-vektorovým systémem. Obecně jsme byli schopni dosáhnout lepšího výkonu se systémy založenými na DNN, ale co je nejdůležitější, potvrdili jsme robustnost těchto systémů napříč více datovými doménami.

Rok
2018
Strany
168-175
Časopis
Proceedings of Odyssey: The Speaker and Language Recognition Workshop, roč. 2018, č. 6, ISSN 2312-2846
Sborník
Proceedings of Odyssey 2018
Konference
Odyssey 2018, Les Sables d'Olonne, France, FR
Vydavatel
International Speech Communication Association
Místo
Les Sables d´Olonne, FR
DOI
BibTeX
@INPROCEEDINGS{FITPUB11787,
   author = "Ond\v{r}ej Novotn\'{y} and Old\v{r}ich Plchot and Pavel Mat\v{e}jka and Ladislav Mo\v{s}ner and Ond\v{r}ej Glembek",
   title = "On the use of X-vectors for Robust Speaker Recognition",
   pages = "168--175",
   booktitle = "Proceedings of Odyssey 2018",
   journal = "Proceedings of Odyssey: The Speaker and Language Recognition Workshop",
   volume = 2018,
   number = 6,
   year = 2018,
   location = "Les Sables dOlonne, FR",
   publisher = "International Speech Communication Association",
   ISSN = "2312-2846",
   doi = "10.21437/Odyssey.2018-24",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/11787"
}
Nahoru