| Název: | Vybrané problémy získávání znalostí z databází |
|---|
| Zkratka: | ZZD |
|---|
| Ak.rok: | 2012/2013 |
|---|
| Semestr: | zimní |
|---|
| Studijní plán: | |
|---|
| Vyučovací jazyk: | čeština |
|---|
| Ukončení: | zkouška (ústní) |
|---|
| Výuka: | | hod./sem | přednáška | sem./cvičení | lab. cvičení | poč. cvičení | jiná |
|---|
| Rozsah: | 39 | 0 | 0 | 0 | 13 |
|---|
| | zkouška | testy | cvičení | laboratoře | ostatní |
|---|
| Body: | 51 | 0 | 0 | 0 | 49 |
|---|
|
|---|
| Garant: | Zendulka Jaroslav, doc. Ing., CSc., UIFS |
|---|
| Přednášející: | Zendulka Jaroslav, doc. Ing., CSc., UIFS |
| Fakulta: | Fakulta informačních technologií VUT v Brně |
|---|
| Pracoviště: | Ústav informačních systémů FIT VUT v Brně |
|---|
| Prerekvizity: | |
|---|
| Nahrazuje: | |
|---|
| | | Cíle předmětu: |
|---|
Prohloubit znalosti studentů v oblasti získávání znalostí z databází a jiných datových zdrojů se zaměřením na teoretické základy používaných technik, algoritmů a modelů. | | Anotace: |
|---|
- Prohloubení znalostí základů získávání znalostí z databází - základy metod předzpracování (statistické veličiny používané při sumarizaci, přístupy k číštění, transformaci a redukci dat), základy datových skladů, základní metody a algoritmy dolování frekventovaných vzorů a asociačních pravidel (algoritmus Apriori, FP-strom, víceúrovňová asociační pravidla, dolování vícedimenzionálních asociačních pravidel z relačních databází), základní metody a algoritmy klasifikace (rozhodovací strom, bayesovská klasifikace, klasifikace využitím neuronových sítí, SVM) a predikce (lineární a nelineární regrese), základní metody a algoritmy shlukové analýzy (způsoby vyjadřování vzdálenosti dat, rozčleňovací metody, hierarchické metody, CF-strom, metody založené na hustotě, metody založené na mřížce a na modelu).
- Pokročilé techniky dolování dat - pokročilé techniky dolování znalostí z 'klasických' zdrojů dat, techniky dolování v proudech dat, časových řadách a posloupnostech, dolování v biologických datech, dolování v grafových strukturách, multirelační dolování, dolování v objektových, prostorových a multimediálních datech, dolování v textu, dolování na WWW.
Část 1 představuje základní témata.Dobrá znalost v této oblasti se očekává od všech absolventů předmětu. Tato část odpovídá kapitolám 1 až 7 v učebnici [1]. V části 2 se očekává od studentů přehled a porozumění základům (formulace problému, základní charakteristika přístupů k řešení) u všech témat. Hlubší znalosti se vyžaduje u tématu, které zpracovali a prezentovali na závěrečném semináři předmětu. Toto téma zpravidla nějak souvisí se zaměřením disertační práce. Tato část odpovídá kapitolám 8 až 10 v učebnici [1], ale zejména se předpokládá využití nejnovějších zdrojů informací dostupných ve sbornících z konferencí a v časopisech. | | Požadované prerekvizitní znalosti a dovednosti: |
|---|
Studenti by měli mít základní znalosti ze statistiky, databázových systémů, teorie informace, strojového učení, neuronových sítí. Předpokládá se rovněž absolvování nějakého předmětu zaměřeného na základy získávání znalostí z databází v rámci magisterského studia. | | Získané dovednosti, znalosti a kompetence: |
|---|
Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z dat. Hlubší znalosti získají především v oblasti související s tématem disertační práce. | | Osnova přednášek: |
|---|
- Předzpracování dat.
- Datové sklady.
- Asociační analýza.
- Klasifikace a predikce.
- Shluková analýza.
- Pokročilé techniky dolování znalostí z 'klasických' zdrojů dat.
- Dolování v proudech dat.
- Dolování v časových řadách a posloupnostech.
- Dolování v biologických datech.
- Dolování v grafových strukturách.
- Multirelační dolování.
- Dolování v objektových, prostorových a multimediálních datech.
- Dolování v textu a na WWW.
| | Osnova ostatní - projekty, práce: |
|---|
- Prostudování a zpracování vybraného tématu týkajícího se získávání znalostí z dat, zpravidla souvisejícího s tématem disertační práce studenta. Prezentace zpracovaného tématu na závěrečném semináři.
| | Literatura referenční: |
|---|
- Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.
| | Literatura studijní: |
|---|
- Dunham, M.H.: Data Mining: Introductory and Advanced Topics. Prentice Hall, 2002, 336 p Fayyad U.M. (Ed.): Advances in Knowledge Discovery and Data Mining. AAAI Press/the MIT Press, 1996, 560 p.
- Aggarwal, Ch.C. (ed.): Data Streams: Models and Algorithms. Advances in Database Systems. Springer, 2006, 358 p., ISBN 0387287590.
- Wang, J. (ed.): Encyclopedia of Data Warehousing and Mining, Hershey, US, IDEA, 2005, 1382 p., ISBN 1-59140-557-2.
- Příspěvky v dostupných časopisech a sbornících konferencí (včetně dostupných v ACM Digital library, IEEE Digital library a jiných elektronických zdrojích).
| | Kontrolovaná výuka: |
|---|
Konzultace, zpracování zadaného tématu, písemná zpráva a prezentace na závěrečném semináři. | | Průběžná kontrola studia: |
|---|
Kontrolní otázky v průběhu konzultací. | | |
|