Článek ve sborníku konference

KARAFIÁT Martin, BURGET Lukáš, MATĚJKA Pavel, GLEMBEK Ondřej a ČERNOCKÝ Jan. iVector-Based Discriminative Adaptation for Automatic Speech Recognition. In: Proceedings of ASRU 2011. Hilton Waikoloa Village, Big Island, Hawaii: IEEE Signal Processing Society, 2011, s. 152-157. ISBN 978-1-4673-0366-8.
Jazyk publikace:angličtina
Název publikace:iVector-Based Discriminative Adaptation for Automatic Speech Recognition
Název (cs):Diskriminativní adaptace pro automatické rozpoznávání řeči založená na i-vektorech
Strany:152-157
Sborník:Proceedings of ASRU 2011
Konference:IEEE 2011 Workshop on Automatic Speech Recognition and Understanding
Místo vydání:Hilton Waikoloa Village, Big Island, Hawaii, US
Rok:2011
ISBN:978-1-4673-0366-8
Vydavatel:IEEE Signal Processing Society
URL:http://www.fit.vutbr.cz/research/groups/speech/publi/2011/karafiat_asru2011_00152.pdf [PDF]
Klíčová slova
Automatic speech recognition, I-vector, Discriminative adaptation
Anotace
I-vektor je nízkodimensionální representace o mluvčím a akustickém prostředí. Region dependent lineární transformace (RDLT) jsou použity pro zakomponování této informace pro adaptaci. RDLT jsou diskriminativně trénovány s použitím MPE kriteria na velkém množství trenovacích dat. Tato technika byla testována na telefonní řeči (CTS). Byla zjištěna komplemetarita ke standartním adaptačním technikám (CMLLR). Na dobře nalazeném RDLT systému jsme dosáhli 0.8% absolutního zlepšení. 
Abstrakt
This work describes a novel technique for discriminative feature-level adaptation for automatic speech recognition. The concept of iVectors popular in speaker recognition is used to extract information about a speaker or acoustic environment from a speech segment. The iVector is a low-dimensional fixed-length representation of such information. To utilize iVectors for adaptation, region dependent linear transforms (RDLT) are discriminatively trained using the MPE criterion on large amounts of annotated data to extract the relevant information from iVectors and to compensate speech features. The approach was tested on standard CTS data. We found it to be complementary to common adaptation techniques. On a well-tuned RDLT system with standard CMLLR adaptation we reached an 0.8% additive absolute WER improvement.
BibTeX:
@INPROCEEDINGS{
   author = {Martin Karafi{\'{a}}t and Luk{\'{a}}{\v{s}} Burget and Pavel
	Mat{\v{e}}jka and Ond{\v{r}}ej Glembek and Jan
	{\v{C}}ernock{\'{y}}},
   title = {iVector-Based Discriminative Adaptation for Automatic Speech
	Recognition},
   pages = {152--157},
   booktitle = {Proceedings of ASRU 2011},
   year = {2011},
   location = {Hilton Waikoloa Village, Big Island, Hawaii, US},
   publisher = {IEEE Signal Processing Society},
   ISBN = {978-1-4673-0366-8},
   language = {english},
   url = {http://www.fit.vutbr.cz/research/view_pub.php.cs.iso-8859-2?id=9762}
}

Vaše IPv4 adresa: 54.234.0.2
Přepnout na IPv6 spojení

DNSSEC [dnssec]