Téma disertační práce

Školitel:Černocký Jan, doc. Dr. Ing.
Téma:Aplikace lineárních transformací pro trénování systémů rozpoznávání spojité řeči s velkým slovníkem adaptovaný napříč doménami
Zahájení v ak.r.:2001/2002
Obhajoba disertace:2009-05-28
Název disertace:Aplikace lineárních transformací pro trénování systémů rozpoznávání spojité řeči s velkým slovníkem adaptovaný napříč doménami
Charakteristika řešeného problému:

Algoritmy pro zpracování řeči vytvořené ve výzkumných a vývojových pracovištích sou nejčastěji testovány na velkých řečových databázích v tzv. batch-módu (řečový signál je načten a pak teprve zpracováván). Při uvádění těchto algoritmů (kódování, rozpoznávání) do praxe je však potřeba, aby algoritmus reagoval na řečový vstup s minimálním zpožděním. To přináší řadu požadavků, které se dotýkají nejen implementace algoritmů, ale také jejich teorie (např. nutnost změny klasického Viterbiho algoritmu pro rozpoznávání).

Tématem navrženého doktorského projektu jsou algoritmy pro rozpoznávání a kódování řeči se zaměřením na reálný čas. Při řešení tohoto doktorského projektu budou v maximální míře využívány statistické metody, jako skryté Markovovy modely (HMM). V rozpoznávání je očekáván vývoj algoritmu, který umožní výstup hypotéz o rozpoznané řeči po uplynutí předem určeného časového intervalu. Dále bude pozornost věnována metodám pro omezení prohledávaného prostoru fonémů a slov (search beam limitations). V kódování se pozornost zaměří na realizaci kodéru řeči na velmi nízkých bitových rychlostech (Very Low Bit Rate - VLBR) s automaticky určenými řečovými jednotkami typu ALISP. Od projektu je jako aplikační výstup očekáván VLBR kodér řeči realizující komunikaci mezi dvěma uživateli pomocí protokolu TCP/IP.

Součást výzkumného projektu:

Vaše IPv4 adresa: 18.204.48.40
Přepnout na https