Článek ve sborníku konference

 
Chmelař, P., Hellebrand, D., Hrušecký, M., Bartík, V.: Nalezení slovních kořenů v češtině, In: Znalosti 2011: Sborník příspěvků 10. ročníku konference, Stará Lesná, SK, VŠB TU, 2011, s. 66-77, ISBN 978-80-248-2369-0
Jazyk publikace:čeština
Název publikace:Nalezení slovních kořenů v češtině
Název (en):Czech Stemming Algorithm
Strany:66-77
Sborník:Znalosti 2011: Sborník příspěvků 10. ročníku konference
Konference:Znalosti 2011
Místo vydání:Stará Lesná, SK
Rok:2011
ISBN:978-80-248-2369-0
Vydavatel:VŠB Technická univerzita Ostrava
Klíčová slova
Lemmatizace, stematizace, Snowball, český jazyk, gramatika.
Anotace
Cílem bylo vytvořit stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Článek obsahuje základy slovotvorby českého jazyka pro různé slovní druhy, popis problematiky stematizace a několika stematizačních a lematizačních algoritmů. Hlavním přínosem této práce je Snowball implementace stematizačního algoritmu českého jazyka na základě kompletní sady všech předpon a přípon, které se mohou v českém jazyce vyskytovat.
BibTeX:
@INPROCEEDINGS{
   author = {Petr Chmelař and David Hellebrand and Michal Hrušecký and
	Vladimír Bartík},
   title = {Nalezení slovních kořenů v češtině},
   pages = {66--77},
   booktitle = {Znalosti 2011: Sborník příspěvků 10. ročníku konference},
   year = {2011},
   location = {Stará Lesná, SK},
   publisher = {VŠB-Technical University of Ostrava},
   ISBN = {978-80-248-2369-0},
   language = {czech},
   url = {http://www.fit.vutbr.cz/research/view_pub.php?id=9473}
}