Český stemmer v jazyce Snowball |
| Autoři: | Hellebrand David, Chmelař Petr |
| Typ: | software |
| Vznik: | 2010 |
| Licence: | vyžadována - zdarma | | Soubory: | |
|---|
|
| | Klíčová slova: | Lemmatizace, stematizace, Snowball, český jazyk, gramatika. |
| Popis: |
Produktem je stematizační algoritmus pro český jazyk založený na gramatických pravidlech jako doplněk k metodám používajícím slovník pro vyhledávání a dolování českého textu. Snowball implementace stematizačního algoritmu českého jazyka je vytvořena na základě kompletní sady všech předpon, přípon a koncovek, které se mohou v českém jazyce vyskytovat.
Dokumentace jazyka Snowball na adrese snowball.tartarus.org a text diplomové práce www.fit.vutbr.cz/study/DP/rpfile.php?id=7988
(v češtině). Publikace vztahující se k tomuto produktu je uvedena na www.fit.vutbr.cz/research/view_pub.php?id=9473.
|
| Umístění: |
| http://www.fit.vutbr.cz/research/view_product.php?id=133 |
| Výzkumné skupiny: |
|---|
|
| Pracoviště: |
|---|
|
| Licenční podmínky: |
|---|
Copyright (C) 2010 Vysoké učení technické v Brně
Stažením, kopírováním,
instalováním, nebo používáním souhlasíte s GNU General Public License (přiložena). |
|