| Název: | Zpracování přirozeného jazyka |
|---|
| Zkratka: | ZPJ |
|---|
| Ak.rok: | 2011/2012 |
|---|
| Semestr: | zimní |
|---|
| Studijní plán: | |
|---|
| Vyučovací jazyk: | čeština |
|---|
| Informace pro zapsané: | http://www.fit.vutbr.cz/study/courses/ZPJ/private/ |
|---|
| Kredity: | 5 kreditů |
|---|
| Ukončení: | zápočet+zkouška (písemná) |
|---|
| Výuka: | | hod./sem | přednáška | sem./cvičení | lab. cvičení | poč. cvičení | jiná |
|---|
| Rozsah: | 26 | 0 | 0 | 0 | 26 |
|---|
| | zkouška | testy | cvičení | laboratoře | ostatní |
|---|
| Body: | 51 | 10 | 0 | 0 | 39 |
|---|
|
|---|
| Garant: | Smrž Pavel, doc. RNDr., Ph.D., UPGM |
|---|
| Fakulta: | Fakulta informačních technologií VUT v Brně |
|---|
| Pracoviště: | Ústav počítačové grafiky a multimédií FIT VUT v Brně |
|---|
| | | Cíle předmětu: |
|---|
Porozumět počítačovému zpracování přirozeného jazyka a naučit se aplikovat základní algoritmy a metody v této oblasti. Seznámit se s algoritmickým popisem jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické a se zdroji jazykových dat - korpusy. Pochopit základní principy reprezentace znalostí, inference a vztahů k umělé inteligenci. Na každé rovině se vždy seznámit s teoretickými východisky, ale i používaným algoritmickým popisem a nástroji. Seznámit se s možnostmi kombinace těchto nástrojů do složitějších systémů. | | Anotace: |
|---|
Východiska počítačového zpracování přirozeného jazyka, jazyková data v korpusech, roviny: fonetika, fonologie, morfologie, syntax, sémantika, pragmatika, klasické a formální gramatiky: reprezentace morfologických a syntaktických struktur, reprezentace významu, bezkontextové gramatiky a jejich kontextová rozšíření, gramatiky DCG (Definite Clause Grammars), algoritmus CKY (Cocke-Kasami-Younger), chart-parsing, problém víceznačnosti, počítačové slovníky: reprezentace znalostí o lexikálních jednotkách, typy slovníků, lexikální sémantika, reprezentace významu věty, princip kompozicionality: skládání významů, sémantické klasifikace: valenční rámce, predikáty, ontologie, transparentní intenzionální logika a její aplikace na analýzu významů vět přirozeného jazyka, pragmatika: sémantická a pragmatická povaha jmenných skupin, struktura promluvy, deiktické výrazy, kontexty, porozumění jazyku: význam, inference a reprezentace znalostí. | | Požadované prerekvizitní znalosti a dovednosti: |
|---|
Základní znalost programování v C/C++ nebo v některém skriptovacím jazyce (Perl, Python, Ruby) | | Získané dovednosti, znalosti a kompetence z předmětu: |
|---|
Studenti se v rámci předmětu seznámí s problematikou počítačového zpracování přirozeného jazyka a naučí se aplikovat základní algoritmy a metody v této oblasti. Porozumí algoritmickému popisu jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické a práci se zdroji jazykových dat - korpusy. Pochopí rovněž základní principy reprezentace znalostí, inference a vztahů k umělé inteligenci. | | Dovednosti, znalosti a kompetence obecné: |
|---|
Studenti se naučí řešit týmové projekty. Zdokonalí se v praktickém užívání programátorských nástrojů. | | Osnova přednášek: |
|---|
- Úvod, historie oboru, aplikace a obory zpracování přirozeného jazyka
- Jak si postavit vyhledávač typu Google, kategorizace textů, podobnost dokumentů
- Morfologická analýza na počítači, flektivní a derivativní morfologie, struktura trie pro uložení slovníku
- Syntaktická analýza přirozeného jazyka, složkový a závislostní přístup, příznakové struktury, formáty specifikace gramatik
- Formalismy pro zápis gramatik, kategoriální gramatiky, systémy LFG, HPSG, LTAG
- Metody syntaktické analýzy, algoritmus CKY, chart-parsing
- Korpusová lingvistika, stromové korpusy, metoda TBL
- Pravděpodobnostní syntaktická analýza, automatické zarovnávání textů, strojový překlad
- Lexikální sémantika, slovníky vs. encyklopedie, princip kompozicionality
- Transparentní intenzionální logika pro popis významu promluv
- Pragmatika, kontextové vazby významu, dynamická sémantika
- Reprezentace znalostí, sémantika možných světů, inference
- Technologie sémantického webu, ontologie, OWL
| | Osnova ostatní - projekty, práce: |
|---|
- Individuálně zadávané projekty
| | Literatura referenční: |
|---|
- Allen, J., Natural language understanding. 2nd ed. Redwood City : Benjamin/Cummings Publishing Company, 1995. ISBN 0-8053-0334-0.
- Manning, C. D., Schütze, H., Foundations of Statistical Natural Language Processing, MIT Press, 1999, ISBN 0-262-13360-1.
| | Literatura studijní: |
|---|
- Hajičová, E., Panevová, J., Sgall, P., Úvod do teoretické a počítačové lingvistiky, sv. I., Teoretická lingvistika, Praha: Karolinum, 2002, ISBN 8024604701.
- Mařík,V., Štěpánková,O., Lažanský, J. a kol.: Umělá inteligence (4), ACADEMIA Praha, 2003, ISBN 80-200-1044-0.
| | Kontrolovaná výuka: |
|---|
Kontrolovaná výuka zahrnuje půlsemestrální test, individuální projekt a písemnou zkoušku. Půlsemestrální test nemá náhradní termín, závěrečná zkouška má dva možné náhradní termíny. | | Průběžná kontrola studia: |
|---|
- Půlsemestrální test - až 10 bodů
- Individuální projekt - až 39 bodů
- Závěrečná písemná zkouška - až 51 bodů
| | Podmínky zápočtu: |
|---|
- Zpracování individuálního projektu
| | |
|