Detail publikace

Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge

NOVOTNÝ Ondřej, MATĚJKA Pavel, PLCHOT Oldřich, GLEMBEK Ondřej, BURGET Lukáš a ČERNOCKÝ Jan. Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge. In: Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016, s. 828-832. ISBN 978-1-5108-3313-5. Dostupné z: https://www.researchgate.net/publication/307889224_Analysis_of_Speaker_Recognition_Systems_in_Realistic_Scenarios_of_the_SITW_2016_Challenge
Název česky
Analýza systémů pro ověřování mluvčího v realistických podmínkách SITW 2016 Challenge
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

V tomto příspěvku shrnujeme naše úsilí týkající se výzvy Speakers In The Wild (SITW) a prezentujeme naše poznatky s tímto novým souborem dat pro rozpoznávání mluvčích. Kromě standardního srovnání různých systémů SRE analyzujeme použití diarizace pro práci se zvukovými segmenty obsahujícími více reproduktorů, protože v rámci nově zavedených registračních a testovacích protokolů je diarizace nezbytnou součástí systému. Naše nejmodernější systémy použité v této práci využívají jak cepstrální, tak DNN úzké hrdlo a jsou založeny na i-vektorech následovaných klasifikátorem Pravděpodobnostní lineární diskriminační analýzy (PLDA) a kalibrací / fúzí logistické regrese. Představujeme úzkopásmové (8 kHz) i širokopásmové (16 kHz) systémy společně s jejich fúzí.

Rok
2016
Strany
828-832
Sborník
Proceedings of Interspeech 2016
Konference
Interspeech Conference, San Francisco, US
ISBN
978-1-5108-3313-5
Vydavatel
International Speech Communication Association
Místo
San Francisco, US
DOI
UT WoS
000409394400173
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB11270,
   author = "Ond\v{r}ej Novotn\'{y} and Pavel Mat\v{e}jka and Old\v{r}ich Plchot and Ond\v{r}ej Glembek and Luk\'{a}\v{s} Burget and Jan \v{C}ernock\'{y}",
   title = "Analysis of Speaker Recognition Systems in Realistic Scenarios of the SITW 2016 Challenge",
   pages = "828--832",
   booktitle = "Proceedings of Interspeech 2016",
   year = 2016,
   location = "San Francisco, US",
   publisher = "International Speech Communication Association",
   ISBN = "978-1-5108-3313-5",
   doi = "10.21437/Interspeech.2016-981",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/11270"
}
Nahoru