Detail publikace

Subspace Gaussian mixture models for speech recognition

POVEY Daniel, BURGET Lukáš, AGARWAL Mohit, AKYAZI Pinar, FENG Kai, GHOSHAL Arnab, GLEMBEK Ondřej, GOEL Nagendra K., KARAFIÁT Martin, RASTROW Ariya, ROSE Richard, SCHWARZ Petr a THOMAS Samuel. Subspace Gaussian mixture models for speech recognition. In: Proc. International Conference on Acoustics, Speech, and Signal Processing. Dallas: IEEE Signal Processing Society, 2010, s. 4330-4333. ISBN 978-1-4244-4296-6. ISSN 1520-6149.

Název česky

Sub-space gaussovské modely pro rozpoznávání řeči

Typ

článek ve sborníku konference

Jazyk

angličtina

Autoři

Povey Daniel (JHU)
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT)
Agarwal Mohit (IIIT)
Akyazi Pinar (UBOGAZ)
Feng Kai (HKUST)
Ghoshal Arnab (UEDIN)
Glembek Ondřej, Ing., Ph.D. (UPGM FIT VUT)
Goel Nagendra K. (GOVIVACE)
Karafiát Martin, Ing., Ph.D. (UPGM FIT VUT)
Rastrow Ariya (JHU)
Rose Richard (MCGILL)
Schwarz Petr, Ing., Ph.D. (UPGM FIT VUT)
Thomas Samuel (JHU)

URL

http://www.fit.vutbr.cz/research/groups/speech/publi/2010/povey_icassp2010_4330.pdf PDF

Abstrakt

Článek pojednává o sub-space gaussovských modelech pro rozpoznávání řeči. Popisujeme přístup akustického modelování, ve kterém všechny stavy fonetiky sdílejí stejnou gaussovskou strukturu.

Rok

2010

Strany

4330-4333

Časopis

Proc. International Conference on Acoustics, Speech, and Signal Processing, roč. 2010, č. 3, ISSN 1520-6149

Sborník

Proc. International Conference on Acoustics, Speech, and Signal Processing

Konference

International Conference on Acoustics, Speech, and Signal Processing 2010, Dallas, US

ISBN

978-1-4244-4296-6

Vydavatel

IEEE Signal Processing Society

Místo

Dallas, US

BibTeX

@INPROCEEDINGS{FITPUB9311,
   author = "Daniel Povey and Luk\'{a}\v{s} Burget and Mohit Agarwal and Pinar Akyazi and Kai Feng and Arnab Ghoshal and Ond\v{r}ej Glembek and K. Nagendra Goel and Martin Karafi\'{a}t and Ariya Rastrow and Richard Rose and Petr Schwarz and Samuel Thomas",
   title = "Subspace Gaussian mixture models for speech recognition",
   pages = "4330--4333",
   booktitle = "Proc. International Conference on Acoustics, Speech, and Signal Processing",
   journal = "Proc. International Conference on Acoustics, Speech, and Signal Processing",
   volume = 2010,
   number = 3,
   year = 2010,
   location = "Dallas, US",
   publisher = "IEEE Signal Processing Society",
   ISBN = "978-1-4244-4296-6",
   ISSN = "1520-6149",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/9311"
}