Název:

Získávání znalostí z databází

Zkratka:ZZN
Ak.rok:2011/2012
Semestr:zimní
Studijní plán:
ProgramOborRočníkPovinnost
IT-MGR-2MBI2.povinný
IT-MGR-2MBS-povinně volitelný - skupina S
IT-MGR-2MGM2.volitelný
IT-MGR-2MGM.2.volitelný
IT-MGR-2MIN2.povinný
IT-MGR-2MIN.2.povinný
IT-MGR-2MIS2.povinně volitelný - skupina N
IT-MGR-2MIS.2.volitelný
IT-MGR-2MMI-volitelný
IT-MGR-2MMM-volitelný
IT-MGR-2MPS-volitelný
IT-MGR-2MPV1.povinně volitelný - skupina D
IT-MGR-2MSK2.povinně volitelný - skupina M
Vyučovací jazyk:čeština
Informace pro zapsané:http://www.fit.vutbr.cz/study/courses/ZZN/private/
Kredity:5 kreditů
Ukončení:zápočet+zkouška (písemná)
Výuka:
hod./sempřednáškasem./cvič.lab. cvič.poč. cvič.jiná
Rozsah:3900013
 zkouškatestycvičenílaboratořeostatní
Body:51150034
Garant:Zendulka Jaroslav, doc. Ing., CSc. (UIFS)
Přednášející:Bartík Vladimír, Ing., Ph.D. (UIFS)
Burgetová Ivana, Ing., Ph.D. (UIFS)
Zendulka Jaroslav, doc. Ing., CSc. (UIFS)
Cvičící:Bartík Vladimír, Ing., Ph.D. (UIFS)
Burgetová Ivana, Ing., Ph.D. (UIFS)
Hlosta Martin, Ing. (UIFS)
Šebek Michal, Ing. (UIFS)
Fakulta:Fakulta informačních technologií VUT v Brně
Pracoviště:Ústav informačních systémů FIT VUT v Brně
 
Cíle předmětu:
  Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami, algoritmy a nástroji používanými při tomto procesu.
Anotace:
  Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí -  asociační pravidla, klasifikace a predikce, shlukování. Dolování v netradičních datech - proudech dat, časových řadách a posloupnostech, grafech, prostorových a časoprostorových datech, multimediálních datech. Dolování v textu a na webu. Vypracování projektu využitím dostupného nástroje pro dolování v datech.
Získané dovednosti, znalosti a kompetence:
  Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází. Jsou schopni nástroje pro získávání znalostí používat i vytvářet.
Osnova přednášek:
 
  1. Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie. 
  2. Datové sklady a technologie OLAP pro získávání znalostí z databází.
  3. Předzpracování dat v procesu získávání znalostí - metody předzpracování.
  4. Předzpracování dat v procesu získávání znalostí - charakteristiky dat.
  5. Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
  6. Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
  7. Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
  8. Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
  9. Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody. Další metody shlukování.
  10. Úvod do dolování v proudech dat, časových řadách a posloupnostech.
  11. Úvod do dolování v grafech, časoprostorových datech a datech pohybujících se objektů.
  12. Dolování v biologických datech.
  13. Dolování textu a na webu.
Osnova ostatní - projekty, práce:
 
  • Vypracování projektu v prostředí dostupného nástroje pro získávání znalostí z databází.
Literatura referenční:
 
  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.  
  • Berka, P.: Dobývání znalostí za databází. Academia, 2003, 366 s., ISBN 80-200-1062-9. 
  • Dunham, M.H.: Data Mining. Introductory and Advanced Topics. Pearson Education, Inc., 2003, 315 p.
Literatura studijní:
 
  • Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.  
  • Berka, P.: Dobývání znalostí za databází. Academia, 2003, 366 s., ISBN 80-200-1062-9. 
  • Zendulka, J. a kol.: Získávání znalostí z databází. FIT VUT v Brně, 160 s., 2009. (elektronicky)
  • Zendulka, J., Kunc, M., Stryka, L.: Získávání znalostí z databází. FIT. Extrakce informací a získávání znalostí na Webu. FIT VUT v Brně, 65 s., 2010. (elektronicky)
Kontrolovaná výuka:
  Půlsemestrální písemná zkouška, formulace dolovací úlohy, prezentace projektu. Pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 20 body. V opačném případě bude zkouška hodnocena 0 body.
Průběžná kontrola studia:
  Půlsemestrální písemná zkouška, formulace dolovací úlohy, obhajoba projektu.
Podmínky zápočtu:
  Udělení zápočtu je podmíněno vypracováním projektu a ziskem minimálně 24 bodů za bodované aktivity v průběhu semestru.
 

Vaše IPv4 adresa: 54.156.39.245
Přepnout na IPv6 spojení

DNSSEC [dnssec]