Detail publikace

Sequence Summarizing Neural Networks for Spoken Language Recognition

PEŠÁN Jan, BURGET Lukáš a ČERNOCKÝ Jan. Sequence Summarizing Neural Networks for Spoken Language Recognition. In: Proceedings of Interspeech 2016. San Francisco: International Speech Communication Association, 2016, s. 3285-3289. ISBN 978-1-5108-3313-5. Dostupné z: https://www.researchgate.net/publication/307889421_Sequence_Summarizing_Neural_Networks_for_Spoken_Language_Recognition

Název česky

Sekvenční sumarizační neuronové sítě pro rozpoznávání mluveného jazyka

Typ

článek ve sborníku konference

Jazyk

angličtina

Autoři

Pešán Jan, Ing. (UPGM FIT VUT)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT)

URL

Abstrakt

Tento článek zkoumá použití Sequence Summarizing Neural Sítě (SSNN) jako varianta hlubokých neuronových sítí (DNN) pro klasifikaci sekvencí. V této práci je aplikována k rozpoznávání mluveného jazyka. Na rozdíl od jiné klasifikace úkoly při zpracování řeči tam, kde to DNN potřebuje produkují výstup na snímek, jazyk je považován za konstantní během promluvy. Zavádíme souhrnnou komponentu do struktury DNN produkující jednu sadu jazykových posteriorů za promluvu. Výcvik DNN provádí vhodně upravený algoritmus přechodu a sestupu. V našem počáteční experimenty jsou výsledky SSNN porovnány s jediným nejmodernější základní systém založený na i-vektorech s podobným složitost (tj. žádná fúze systému atd.). Za určitých podmínek SSNN jsou schopny poskytovat výkon srovnatelný se základní úrovní Systém. Relativního zlepšení až o 30% se dosáhne s fúze úrovně skóre základní linie a systémů SSNN.

Rok

2016

Strany

3285-3289

Sborník

Proceedings of Interspeech 2016

Konference

Interspeech Conference, San Francisco, US

ISBN

978-1-5108-3313-5

Vydavatel

International Speech Communication Association

Místo

San Francisco, US

DOI

10.21437/Interspeech.2016-764

UT WoS

000409394402038

EID Scopus

2-s2.0-84994361899

BibTeX

@INPROCEEDINGS{FITPUB11273,
   author = "Jan Pe\v{s}\'{a}n and Luk\'{a}\v{s} Burget and Jan \v{C}ernock\'{y}",
   title = "Sequence Summarizing Neural Networks for Spoken Language Recognition",
   pages = "3285--3289",
   booktitle = "Proceedings of Interspeech 2016",
   year = 2016,
   location = "San Francisco, US",
   publisher = "International Speech Communication Association",
   ISBN = "978-1-5108-3313-5",
   doi = "10.21437/Interspeech.2016-764",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/11273"
}

Soubory

pdf pesan_interspeech2016_IS160764.pdf 234 KB