Název:

Zpracování řečových signálů (v angličtině)

Zkratka:ZREe
Ak.rok:2018/2019
Semestr:letní
Studijní plán:
ProgramObor/
specializace
RočníkPovinnost
IT-MGR-2MGMe1.povinný
Vyučovací jazyk:angličtina
Aktuální informace:
* This course is prepared for incoming Erasmus+ students only, and it is instructed in English.
* This course will be open if a certain/sure minimum of enrolled students is at least five students.

Kredity:5 kreditů
Ukončení:zkouška (kombinovaná)
Výuka:
hod./sempřednáškasem./cvič.lab. cvič.poč. cvič.jiná
Rozsah:2600260
 zkouškatestycvičenílaboratořeostatní
Body:54200620
Garant:Černocký Jan, doc. Dr. Ing. (UPGM)
Přednášející:Černocký Jan, doc. Dr. Ing. (UPGM)
Grézl František, Ing., Ph.D. (UPGM)
Cvičící:Grézl František, Ing., Ph.D. (UPGM)
Fakulta:Fakulta informačních technologií VUT v Brně
Pracoviště:Ústav počítačové grafiky a multimédií FIT VUT v Brně
Rozvrh:
DenVýukaTýdenMístnostOdDoPSKSkupiny
Čtpřednáška - Semestralní zkouška2019-05-16M103 14:0016:50INTE
 
Cíle předmětu:
  Seznámit studenty se základními charakteristikami řečového signálu v návaznosti na tvorbu a slyšení řeči lidmi. Popsat základní algoritmy analýzy řeči společné mnohým aplikacím. Podat přehled aplikací (rozpoznávání, syntéza, kódování) a informovat o praktických stránkách implementace řečových algoritmů.
Anotace:
  Aplikace počítačového zpracování řeči, číslicové zpracování řečových signálů, tvorba a slyšení řeči, úvod do fonetiky, předzpracování a základní parametry, lineárně-prediktivní model, cepstrum, určování základního tónu hlasu, kódování - časová oblast a vokodéry, rozpoznávání - DTW a HMM, syntéza. Software a knihovny pro zpracování řeči.
Získané dovednosti, znalosti a kompetence:
  Studenti se seznámí se základními charakteristikami řečového signálu v návaznosti na tvorbu a slyšení řeči lidmi. Pochopí základní algoritmy analýzy řeči společné mnohým aplikacím. Získají přehled o aplikacích (rozpoznávání, syntéza, kódování) a o praktických stránkách implementace řečových algoritmů. Budou schopni navrhnout jednoduchý systém pro zpracování řeči (detektor řečové aktivity, rozpoznávač několika izolovaných slov), včetně implementace do aplikačních programů.
Osnova přednášek:
 
 • Úvod, aplikace zpracování řeči, relevatní vědní obory, informační obsah.
 • Číslicové zpracování řečových signálů
 • Tvorba a slyšení řeči, základní pojmy z psychoakustiky, aplikace ve zpracování řeči.
 • Úvod do fonetiky, mezinárodní normy pro označování fonémů.
 • Předzpracování a základní parametry. 
 • Lineárně-prediktivní model, spektrum pomocí lineární predikce. Aplikace LP.
 • Cepstrální analýza, Mel-frekvenční cepstrum
 • Určování základního tónu hlasu
 • Kódování řeči.
 • Rozpoznávání řeči, dynamické programování DTW, skryté Markovovy modely HMM
 • Syntéza řeči
 • Software a knihovny pro zpracování řeči.
Osnova numerických cvičení:
 
 • Paramatrizace, DTW, HMM.
 • Prezentace projektů.
Osnova počítačových cvičení:
 
  V laboratořích (kromě poslední) je používán Matlab.
 • Rámce, okna, spektrum, předzpracování.
 • Lineární predikce (LPC).
 • Určování základního tónu.
 • Kódování.
 • Rozpoznávání - Dynamic time Warping (DTW).
 • Rozpoznávání - skryté Markovovy modely (Hidden Markov Model Toolkit - HTK).
Literatura studijní:
 
 • Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia, Praha, 1995, ISBN 80-200-0203-0
 • Gold, B., Morgan, N.: Speech and Audio Signal Processing, John Wiley & Sons, 2000, ISBN 0-471-35154-7
Průběžná kontrola studia:
  
 • půlsemestrální test
 • prezentace projektů
 • presentace výsledků na poč. cvičeních
 

Vaše IPv4 adresa: 54.167.47.248
Přepnout na https