| Chmelař, P., Hellebrand, D., Hrušecký, M., Bartík, V.: Nalezení slovních kořenů v češtině, In: Znalosti 2011: Sborník příspěvků 10. ročníku konference, Stará Lesná, SK, VŠB TU, 2011, p. 66-77, ISBN 978-80-248-2369-0 | | Publication language: | czech |
|---|
| Original title: | Nalezení slovních kořenů v češtině |
|---|
| Title (en): | Czech Stemming Algorithm |
|---|
| Pages: | 66-77 |
|---|
| Proceedings: | Znalosti 2011: Sborník příspěvků 10. ročníku konference |
|---|
| Conference: | Znalosti 2011 |
|---|
| Place: | Stará Lesná, SK |
|---|
| Year: | 2011 |
|---|
| ISBN: | 978-80-248-2369-0 |
|---|
| Publisher: | VŠB-Technical University of Ostrava |
|---|
| Keywords |
|---|
| Lemmatization, stemming, Snowball, Czexh language, grammar. |
| Annotation |
|---|
| The goal was to create an algorithm for stemming Czech language based on grammatical rules, in addition to methods using vocabulary for retrieval and mining of Czech texts. The article includes the basics of Czech word formation for different word classes, description of problems and several stemming and lemmatization algorithms. The main contribution of this work is the implementation of the Snowball stemming algorithm for the Czech language based on complete sets of all prefixes and suffixes, which may occur in Czech words. |
| BibTeX: |
|---|
@INPROCEEDINGS{
author = {Petr Chmelař and David Hellebrand and Michal Hrušecký and
Vladimír Bartík},
title = {Nalezení slovních kořenů v češtině},
pages = {66--77},
booktitle = {Znalosti 2011: Sborník příspěvků 10. ročníku konference},
year = {2011},
location = {Stará Lesná, SK},
publisher = {VŠB-Technical University of Ostrava},
ISBN = {978-80-248-2369-0},
language = {czech},
url = {http://www.fit.vutbr.cz/research/view_pub.php?id=9473}
} |
|