Název:

Klasifikace a rozpoznávání

Zkratka:KRD
Ak.rok:2012/2013
Semestr:letní
Studijní plán:
ProgramOborRočníkPovinnost
VTI-DR-4DVI4-volitelný
Vyučovací jazyk:čeština
Ukončení:zkouška
Výuka:
hod./sempřednáškasem./cvičenílab. cvičenípoč. cvičeníjiná
Rozsah:390000
 zkouškatestycvičenílaboratořeostatní
Body:6000040
Garant:Smrž Pavel, doc. RNDr., Ph.D., UPGM
Přednášející:Burget Lukáš, Ing., Ph.D., UPGM
Fakulta:Fakulta informačních technologií VUT v Brně
Pracoviště:Ústav počítačové grafiky a multimédií FIT VUT v Brně
 
Cíle předmětu:
Porozumět pokročilým technikám a postupům v oblasti klasifikace a rozpoznávání a naučit se aplikovat algoritmy a metody v této oblasti na problémy  rozpoznávání mluvené řeči, počítačové grafiky a zpracování přirozeného jazyka. Seznámit se způsoby vyhodnocování úspěšnosti metod. Pochopit specifika diskriminativního trénování a vytváření hybridních systémů.
Anotace:
Odhady parametrů pomocí metody maximální věrohodnosti a algoritmu Expectiation-Maximization, formulace objektivní funkce diskriminativního trénování, kritérium Maximum Mutual information (MMI), adaptace GMM modelů, transformace parametrů pro rozpoznávání, modelování prostoru parametrů pomocí diskriminativních podprostorů, faktorová analýza, kernelové techniky, kalibrace a fúze klasifikátorů, aplikace v rozponávání řeči, videa a textu.
Požadované prerekvizitní znalosti a dovednosti:
Základní znalost statistiky, teorie pravděpodobnosti, matematické analýzy a algebry.

Získané dovednosti, znalosti a kompetence z předmětu:
Studenti se v rámci předmětu seznámí s pokročilými technikami klasifikace a rozpoznávání a naučí se aplikovat  metody v této oblasti na vybrané problémy rozpoznávání mluvené řeči, počítačové grafiky a zpracování přirozeného jazyka.
Dovednosti, znalosti a kompetence obecné:
Studenti si vyzkouší obecné přístupy k řešení problémů klasifikace a rozpoznávání.
Osnova přednášek:
  1. Odhad parametrů Gaussova rozdělení pravděpodobnosti pomocí Maximum Likelihood (ML)
  2. Odhad parametrů směsi Gaussových rozdělení pravděpodobnosti (Gaussian Mixture Model - GMM) pomocí Expectiation-Maximization (EM)
  3. Diskriminativní trénování, úvod, formulace objektivní funkce
  4. Diskriminativní trénování s kritériem Maximum Mutual information (MMI)
  5. Adaptace GMM modelů - Maximum A-Posteriori (MAP), Maximum Likelihood Linear Regression (MLLR)
  6. Transformace parametrů pro rozpoznávání - základy, Principal component analysis (PCA)
  7. Diskriminativní transformace parametrů - Linear Discriminant Analysis (LDA) a Heteroscedastic Linear Discriminant Analysis  (HLDA)
  8. Modelování prostoru parametrů pomocí diskriminativních podprostorů - faktorová analýza
  9. Kernelové techniky, SVM
  10. Kalibrace a fúze klasifikátorů
  11. Aplikace v rozponávání řeči, videa a textu
  12. Presentace frekventantů kursu I
  13. Presentace frekventantů kursu II
Osnova ostatní - projekty, práce:
  1. Individuálně zadávané projekty
Literatura referenční:
  1. Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
  2. Fukunaga, K. Statistical pattern recognition, Morgan Kaufmann, 1990, ISBN 0-122-69851-7.
Literatura studijní:
  1. Mařík,V., Štěpánková,O., Lažanský, J. a kol.: Umělá inteligence (1-4), ACADEMIA Praha, 1998-2003, ISBN 80-200-1044-0.
Kontrolovaná výuka:
Kontrolovaná výuka zahrnuje individuální projekt.