Název:

Klasifikace a rozpoznávání

Zkratka:IKR
Ak.rok:2018/2019
Semestr:letní
Studijní plán:
ProgramObor/
specializace
RočníkPovinnost
BIT-2.volitelný
IT-BC-3BIT-volitelný
IT-BC-3BIT2.volitelný
Vyučovací jazyk:čeština
Informace veřejné:http://www.fit.vutbr.cz/study/courses/IKR/public/
Kredity:5 kreditů
Ukončení:zkouška (kombinovaná)
Výuka:
hod./sempřednáškasem./cvič.lab. cvič.poč. cvič.jiná
Rozsah:26130013
 zkouškatestycvičenílaboratořeostatní
Body:60150025
Garant:Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Zástupce garanta:Černocký Jan, doc. Dr. Ing. (UPGM)
Přednášející:Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Černocký Jan, doc. Dr. Ing. (UPGM)
Španěl Michal, Ing., Ph.D. (UPGM)
Cvičící:Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Fakulta:Fakulta informačních technologií VUT v Brně
Pracoviště:Ústav počítačové grafiky a multimédií FIT VUT v Brně
Prerekvizity: 
Signály a systémy (ISS), UPGM
Základy počítačové grafiky (IZG), UPGM
Rozvrh:
DenVýukaTýdenMístnostOdDoPSKSkupiny
Útzkouška - řádná2019-05-21E104 15:0016:502BIA 2BIB 3BIT
Stzkouška - 2. oprava2019-06-05E104 15:0016:502BIA 2BIB 3BIT
Čtzkouška - 1. oprava2019-05-30E105 14:0015:502BIA 2BIB 3BIT
 
Cíle předmětu:
  Porozumět základům strojového učení se zaměřením na problém klasifikace a rozpoznávání vzorů. Naučit se aplikovat základní algoritmy a metody v této oblasti na problémy rozpoznávání mluvené řeči a obrazu. Pochopit základní principy různých generativních a diskriminativních modelů pro statistického rozpoznávání vzorů. Seznámit se se způsoby vyhodnocování úspěšnosti těchto metod..
Anotace:
  Klasifikační úloha a rozpoznávání vzorů, základní schéma klasifikátoru, data a vyhodnocování úspěšnosti jednotlivých metod, statistické rozpoznávání vzorů, extrakce příznaků, baysovské učení, odhad s maximální věrohodnosti (ML), vícerozměrné Gaussovo rozložení, směs gaussovských rozložení (GMM), algoritmus maximalizace očekávání (EM algorithm), lineární klasifikátory, perceptron, gaussovský lineární klasifikátor, logistická regrese, SVM, dopředné neuronové sítě, konvoluční a rekurentní neuronové sítě, rozpoznávání sekvencí, skryté Markovovy model (HMM). Aplikace probraných metod na zpracování řeči a obrazu.
Požadované prerekvizitní znalosti a dovednosti:
  Základní znalost běžného matematického formalismu.
Získané dovednosti, znalosti a kompetence z předmětu:
  Studenti se v rámci předmětu seznámí s problematikou strojového učení aplikovaného na problém klasifikace a rozpoznávání vzorů. Naučí se aplikovat základní algoritmy a modely v této oblasti na vybrané problémy zpracování mluvené řeči a počítačové grafiky. Porozumí rozdílům mezi jednotlivými metodami a dokáží využít výhod existujících klasifikátorů při řešení prakticky orientovaných projektů.
Dovednosti, znalosti a kompetence obecné:
  Studenti se seznámí s knihovnami jazyka python zaměřenými na matematické operace, lineární algebru a strojové učení. Zdokonalí se v praktickém užívání matematiky (teorie pravděpodobnosti, statistika, lineární algebra, ...) a programátorských nástrojů. Naučí se řešit týmové projekty.

Proč je předmět vyučován:
  V současné době jsme svědky velkého rozmachu aplikací využívajících strojové učení či automatické rozpoznávání vzorů. Množí se nám různá zařízení jež je možné ovládat hlasem čí gesty. Digitální foťáky samy detekují obličeje ve snímaném obraze, aby na ně automaticky zaostřily či nějak reagovaly. Virtuální asistenti v mobilních telefonech umí rozpoznat řeč a vyhledat relevantní odpovědi na naše dotazy. Kvalita automatického rozpoznávání identity člověka z hlasové nahrávky nebo fotky obličeje již dnes výrazně přesahuje lidské schopnosti.

V tomto předmětu studenti získají dobrou představu o tom jak tyto technologie fungují. Seznámí se se základním algoritmy a modely, které se z dat samy učí jak rozpoznávat netriviální vzory v audio nahrávkách, obrázcích či jiných signálech a vstupních datech.
Osnova přednášek:
 
  1. Úlohy klasifikace a rozpoznávání, základní schéma klasifikátoru, datové množiny a vyhodnocování úspěšnosti.
  2. Pravděpodobnostní rozdělení, statistické rozpoznávání vzorů.
  3. Generativní a diskriminativní modely.
  4. Víverozměrné gaussovo rozložení, odhad parametrů s maximální věrohodnosi.
  5. Směs gaussovských rozložení (GMM), maximalizace očekávání  (EM).
  6. Extrakce příznaků, Mel-frekvenční kepstrální koeficienty.
  7. Aplikace pravděpodobnostních modelů ve zpracování řeči a obrazu.
  8. Lineární klasifikátory, perceptron
  9. Gaussovský lineární klasifikátor, logistická regrese
  10. Support vector machines (SVM), jádrové (kernel) funkce
  11. Neuronové sítě - dopředné, konvoluční a rekurentní
  12. Skryté markovovy model (HMM) a jejich aplikace na rozpoznávání řeči.
  13. Prezentace projektů
Osnova ostatní - projekty, práce:
 
  • Individuálně zadávané projekty
Literatura referenční:
 
  • Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
  • Hart, P. E., Stork, D. G.:Pattern Classification (2nd ed), John Wiley &
    Sons, 2000, ISBN: 978-0-471-05669-0
  • Ian Goodfellow, Yoshua Bengio, and Aaron Courville. 2016. Deep Learning. The MIT Press.
Literatura studijní:
 
  • Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
  • Hart, P. E., Stork, D. G.:Pattern Classification (2nd ed), John Wiley &Sons, 2000, ISBN: 978-0-471-05669-0
Kontrolovaná výuka:
  Kontrolovaná výuka zahrnuje půlsemestrální test, individuální projekt a písemnou zkoušku. Půlsemestrální test nemá náhradní termín, závěrečná zkouška má dva možné náhradní termíny.
Průběžná kontrola studia:
  
  • Půlsemestrální test - až 15 bodů
  • Projekt - až 25 bodů
  • Závěrečná písemná zkouška - až 60 bodů
 

Vaše IPv4 adresa: 54.234.227.202
Přepnout na https