Název:

Získávání znalostí z databázi

Zkratka:ZZD
Ak.rok:2002/2003
Semestr:zimní
Studijní plán:
ProgramOborRočníkPovinnost
IT-DR-3DIT3-volitelný
Vyučovací jazyk:čeština
Ukončení:zkouška (ústní)
Výuka:
hod./sempřednáškasem./cvičenílab. cvičenípoč. cvičeníjiná
Rozsah:3900013
 zkouškatestycvičenílaboratořeostatní
Body:5000050
Garant:Zendulka Jaroslav, doc. Ing., CSc., UIFS
Přednášející:Zendulka Jaroslav, doc. Ing., CSc., UIFS
Fakulta:Fakulta informačních technologií VUT v Brně
Prerekvizity: 
Pokročilé databázové systémy (PDB-IT), UIFS
Získávání znalostí z databází (ZZN-IT), FIT
Nahrazuje:
Získávání znalostí z databází (ZZD), FIT
 
Cíle předmětu:
Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami a nástroji používanými pří tomto procesu.
Anotace:
Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí - charakterizace a diskriminace, asociační pravidla, klasifikace a predikce, shlukování. Dolování ve složitě strukturovaných datech. Trendy v získávání znalostí z dat. Zpracování a prezentace zadaného tématu.
Získané dovednosti, znalosti a kompetence:
Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z dat. Hlubší znalosti získají především v oblasti související s tématem disertační práce.
Osnova přednášek:
  1. Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí.
  2. Datové sklady a technologie OLAP pro získávání znalostí z dat.
  3. Předzpracování dat v procesu získávání znalostí.
  4. Systémy pro dolování dat - specifikace úlohy, dotazovací jazyky pro dolování, architektura systému.
  5. Dolování charakteristik pojmů (tříd) - charakterizace a diskriminace.
  6. Dolování asociačních pravidel z transakčních databází.
  7. Dolování asociačních pravidel z relačních databází a datových skladů.
  8. Klasifikace - rozhodovací strom, bayesovská klasifikace, využití neuronových sítí.
  9. Další metody klasifikace. Predikce.
  10. Shluková analýza.
  11. Dolování ve složitě strukturovaných datech - dolování v objektových, prostorových a textových databázích.
  12. Dolování v multimediálních databázích, časových posloupnostech a na WWW.
  13. Aplikace a trendy v získávání znalostí z dat.
Osnova ostatní - projekty, práce:
  1. Prostudování a zpracování vybraného vědeckého článku s tématikou získávání znalostí z dat v oblasti související se zamýšlenou disertační prací studenta.
Literatura referenční:
  1. Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers, 2001, 550 p.
  2. Dunham, M.H.: Data Mining: Introductory and Advanced Topics. Prentice Hall, 2002, 336 p
Literatura studijní:
  1. Fayyad U.M. (Ed.): Advances in Knowledge Discovery and Data Mining. AAAI Press/the MIT Press, 1996, 560 p.
  2. Weiss, S.M., Indurkhya, N.: Predictive Data Mining. Morgan Kaufman Publishers, Inc., 1998, 238 p.
  3. Hand, D.J., Mannila, H., Smyth, P.: Principles of Data Mining. The MIT Press, 2001, 425 pp.
  4. Chakrabarti, S.: Mining the Web: Discovering Knowledge from Hypertext Data. Morgan Kaufmann Publishers, 2002, 352 p.
  5. Theodoridis, S.K. : Pattern Recognition. Academic Press. 1998, 624.
Kontrolovaná výuka:
Přednašky a zpracovaní projektu.
Průběžná kontrola studia:
Kontrolní otázky v průběhu přednášek.