Topic of PhD thesis| Advisor: | Cernocký Jan, doc. Dr. Ing. |
|---|
| Student: | Schwarz Petr, Ing. |
|---|
| Topic: | Phoneme recognition based on long temporal context |
|---|
| Start: | 2001/2002 |
|---|
| Date of Defense: | 2009-05-28 |
|---|
| Title of Dissertation: | Phoneme recognition based on long temporal context |
|---|
| PhD thesis subject: |
|---|
Rozpoznávace mluvené reci vytvorené v kontrolovaných laboratorních podmínkách (cistota signálu a transkripcí, výber mluvcích, omezení slovníku, atd.) dosahují úspesností témer 100%. Pri nasazení do reálných podmínek (napr. dialogový systém, který má zpracovávat hovory z mobilních telefonu), vsak jejich úspesnost klesá az k hranici, kdy jejich pouzití spíse obtezuje nez pomáhá - to brání jejich masovému rozsírení. Tématem navrzeného doktorského projektu jsou robustní algoritmy, tedy postupy, které funkcnost rozpoznávace zachovají i za nepríznivých sumových podmínek, ci pri nesouladu trénovacích a testovacích dat (mismatched training-test conditions). Obsah projektu lze shrnout do techto bodu:
- robustní detekce recové aktivity a ticha (Voice Acitivity Detector VAD)
- robustní parametrizace (príznaky trénované na datech a získané pomocí znalostí o lidském sluchovém ústrojí).
- problémy odmítnutí slov, která nejsou obsazena ve slovníku (standardní problém rozpoznávacu s malým slovníkem, kdy je jakékoliv príchozí slovo klasifikováno jako jedno ze rozpoznávaných slov).
- rozpoznávání (akustické dekódování) v reálném case, kdy není mozné cekat na konec promluvy, ale výsledek je nutné prezentovat s daným maximálním zpozdením.
Pri resení tohoto doktorského projektu budou v maximální míre vyuzívány statistické metody, jako skryté Markovovy modely (HMM) a neuronové síte. Od projektu jsou ocekávány i aplikacní výstupy v podobe rozpoznávacu pracujících s on-line vstupem ze zvukové karty, a z digitální telefonní linky ISDN. | | Part of research project: |
|---|
|
|