Článek ve sborníku konference | |
| Chmelař, P., Hellebrand, D., Hrušecký, M., Bartík, V.: Nalezení slovních kořenů v češtině, In: Znalosti 2011: Sborník příspěvků 10. ročníku konference, Stará Lesná, SK, VŠB TU, 2011, s. 66-77, ISBN 978-80-248-2369-0 | | Jazyk publikace: | čeština |
|---|
| Název publikace: | Nalezení slovních kořenů v češtině |
|---|
| Název (en): | Czech Stemming Algorithm |
|---|
| Strany: | 66-77 |
|---|
| Sborník: | Znalosti 2011: Sborník příspěvků 10. ročníku konference |
|---|
| Konference: | Znalosti 2011 |
|---|
| Místo vydání: | Stará Lesná, SK |
|---|
| Rok: | 2011 |
|---|
| ISBN: | 978-80-248-2369-0 |
|---|
| Vydavatel: | VŠB Technická univerzita Ostrava |
|---|
| Klíčová slova |
|---|
| Lemmatizace, stematizace, Snowball, český jazyk, gramatika. |
| Anotace |
|---|
| Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball implementace stematizačního algoritmu českého jazyka na základě kompletní sady všech předpon a přípon, které se mohou v českém jazyce vyskytovat. |
| BibTeX: |
|---|
@INPROCEEDINGS{
author = {Petr Chmelař and David Hellebrand and Michal Hrušecký and
Vladimír Bartík},
title = {Nalezení slovních kořenů v češtině},
pages = {66--77},
booktitle = {Znalosti 2011: Sborník příspěvků 10. ročníku konference},
year = {2011},
location = {Stará Lesná, SK},
publisher = {VŠB-Technical University of Ostrava},
ISBN = {978-80-248-2369-0},
language = {czech},
url = {http://www.fit.vutbr.cz/research/view_pub.php?id=9473}
} |
|