Topic of PhD thesis

Advisor:Cernocký Jan, doc. Dr. Ing.
Student:Schwarz Petr, Ing.
Topic:Phoneme recognition based on long temporal context
Start:2001/2002
Date of Defense:2009-05-28
Title of Dissertation:Phoneme recognition based on long temporal context
PhD thesis subject:

    Rozpoznávace mluvené reci vytvorené v kontrolovaných laboratorních podmínkách (cistota signálu a transkripcí, výber mluvcích, omezení slovníku, atd.) dosahují úspesností témer 100%. Pri nasazení do reálných podmínek (napr. dialogový systém, který má zpracovávat hovory z mobilních telefonu), vsak jejich úspesnost klesá az k hranici, kdy jejich pouzití spíse obtezuje nez pomáhá - to brání jejich masovému rozsírení. Tématem navrzeného doktorského projektu jsou robustní algoritmy, tedy postupy, které funkcnost rozpoznávace zachovají i za nepríznivých sumových podmínek, ci pri nesouladu trénovacích a testovacích dat (mismatched training-test conditions). Obsah projektu lze shrnout do techto bodu:
  • robustní detekce recové aktivity a ticha (Voice Acitivity Detector VAD)
  • robustní parametrizace (príznaky trénované na datech a získané pomocí znalostí o lidském sluchovém ústrojí).
  • problémy odmítnutí slov, která nejsou obsazena ve slovníku (standardní problém rozpoznávacu s malým slovníkem, kdy je jakékoliv príchozí slovo klasifikováno jako jedno ze rozpoznávaných slov).
  • rozpoznávání (akustické dekódování) v reálném case, kdy není mozné cekat na konec promluvy, ale výsledek je nutné prezentovat s daným maximálním zpozdením.

    Pri resení tohoto doktorského projektu budou v maximální míre vyuzívány statistické metody, jako skryté Markovovy modely (HMM) a neuronové síte. Od projektu jsou ocekávány i aplikacní výstupy v podobe rozpoznávacu pracujících s on-line vstupem ze zvukové karty, a z digitální telefonní linky ISDN.

Part of research project: