Téma disertační práce

Školitel:Černocký Jan, doc. Dr. Ing.
Téma:Segmentální metody ve zpracování řečového signálu
Zahájení v ak.r.:1999/2000
Obhajoba disertace:2003-11-24
Název disertace:Modeling of Spectra and Temporal Trajectories in Speech Processing
Charakteristika řešeného problému:

    Většina moderních metod ve zpracování řeči je založena na slovnich segmentech. Klasicky se tyto jednotky odvozuji pomoci fonetického přepisu řeči (fonémy, slabiky, atd). Dr. Černocký pracoval během své vlastní disertace na automatickem určování takových jednotek za použití technik označovaných jako ALISP (Automatic Language Independent Speech Processing). Algoritmy byly vyzkoušeny na dvou úlohách: kódování řeči na velmi nízkých bitových rychlostech a na rozpoznávání mluvčího.

    Tento doktorandsky projekt je zaměřen na další výzkum a vývoj v této oblasti. V kódování je cílem tvorba kodéru pracujícího s bitovým tokem 600 b/s a jeho využití pro komunikaci na Internetu. V rozpoznávání mluvčího je cílem segmentální předzpracování pro systemy pracující se známými algoritmy, tak, aby se co nejlépe využily charakteristické segmenty jednotlivých mluvčích. Dalším krokem je využití těchto segmentů v systému pro rozpoznávání řeči. Zde je nutné řešit přechod do oblasti jazykové (slova, věty).

  • Seznámení se základními algoritmy. Tvorba sady řečových jednotek pro kódování na velmi nízkých rychlostech.
  • Ověření algoritmu na kodéru s jednoduchou syntézou. Zlepšení syntézy některou z moderních metod (PSOLA, HNM).
  • Úprava algoritmu pro práci v režimu nezávislém na mluvčím (adaptace kodéru a dekodéru). Dokončení kodéru na velmi nízkých bitových rychlostech.
Součást výzkumného projektu:

Vaše IPv4 adresa: 18.204.48.40
Přepnout na https