Detail publikace

BUT/Phonexia Bottleneck Feature Extractor

SILNOVA Anna, MATĚJKA Pavel, GLEMBEK Ondřej, PLCHOT Oldřich, NOVOTNÝ Ondřej, GRÉZL František, SCHWARZ Petr a ČERNOCKÝ Jan. BUT/Phonexia Bottleneck Feature Extractor. In: Proceedings of Odyssey 2018. Les Sables d´Olonne: International Speech Communication Association, 2018, s. 283-287. ISSN 2312-2846.
Název česky
BUT/Phonexia extraktor parametrů z úzkého hrdla neuronové sítě (Bottleneck)
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
URL
Abstrakt

Tento dokument doplňuje veřejné vydání extraktoru funkcí úzkého místa BUT / Phonexia (BN). Počínaje krátkou historií přístupů k extrakci řečových funkcí založených na neuronových sítích (NN) a přístupech založených na BN popisuje strukturu vydaného softwaru. Z toho vyplývá popis tří poskytovaných NN: první dva vyškoleni v americkém anglickém korpusu Fisher s cíli monofonního a vázaného stavu a třetí síť trénována vícejazyčným způsobem v 17 jazycích Babel. NN byli technicky vyškoleni pro klasifikaci akustických jednotek, avšak sítě byly optimalizovány s ohledem na úlohu rozpoznávání jazyků, která je hlavním zaměřením tohoto příspěvku. Přesto stojí za zmínku, že kromě rozpoznávání jazyků lze poskytnutý software použít pro jakýkoli úkol související s řečí. Příspěvek končí komplexním shrnutím výsledků získaných při plnění úkolů NIST 2015 a 2017 Language Recognition Evaluation.

Rok
2018
Strany
283-287
Časopis
Proceedings of Odyssey: The Speaker and Language Recognition Workshop, roč. 2018, č. 6, ISSN 2312-2846
Sborník
Proceedings of Odyssey 2018
Konference
Odyssey 2018, Les Sables d'Olonne, France, FR
Vydavatel
International Speech Communication Association
Místo
Les Sables d´Olonne, FR
DOI
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB11789,
   author = "Anna Silnova and Pavel Mat\v{e}jka and Ond\v{r}ej Glembek and Old\v{r}ich Plchot and Ond\v{r}ej Novotn\'{y} and Franti\v{s}ek Gr\'{e}zl and Petr Schwarz and Jan \v{C}ernock\'{y}",
   title = "BUT/Phonexia Bottleneck Feature Extractor",
   pages = "283--287",
   booktitle = "Proceedings of Odyssey 2018",
   journal = "Proceedings of Odyssey: The Speaker and Language Recognition Workshop",
   volume = 2018,
   number = 6,
   year = 2018,
   location = "Les Sables dOlonne, FR",
   publisher = "International Speech Communication Association",
   ISSN = "2312-2846",
   doi = "10.21437/Odyssey.2018-40",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/11789"
}
Nahoru