Článek ve sborníku konference | |
| Otrusina, L., Smrž, P.: A New Approach to Pseudoword Generation, In: Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10), Valletta, MT, ELRA, 2010, s. 1-5, ISBN 2-9517408-6-7 | | Jazyk publikace: | angličtina |
|---|
| Název publikace: | A New Approach to Pseudoword Generation |
|---|
| Název (cs): | Nový přístup ke generování pseudo-slov |
|---|
| Strany: | 1-5 |
|---|
| Sborník: | Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10) |
|---|
| Konference: | Language Resources and Evaluation Journal 2010 |
|---|
| Místo vydání: | Valletta, MT |
|---|
| Rok: | 2010 |
|---|
| ISBN: | 2-9517408-6-7 |
|---|
| Vydavatel: | European Language Resources Association |
|---|
| Klíčová slova |
|---|
pseudo-words, word sense disambiguation, evaluation, SVM
|
| Anotace |
|---|
| Korpusy tagované na významy slova jsou používány na vyhodnocování algoritmů pro zjednoznačňování slovních významů. Ruční tvorba takových korpusů je velmi náročná. Kvůli tomu byl představen koncept pseudo-slov, která byla integrována do procesu vyhodnocování systému pro zjednoznačňování slovních významů. Tento článek prezentuje nový přístup ke generování pseudo-slov, založený na sémantické blízkosti kandidátních slov pro tvorbu pseudo-slov. Tato nová metoda je porovnána se standardními přístupy a je ukázáno, že dává lepší výsledky. K tvorbě pseudo-slov jsou využity dvě techniky využívající sémantickou blízkost. První využívá ručně vytvořených slovníků jako je WordNet a druhá pak automaticky spočítaná statistická data z velkých korpusů. Na závěr jsou diskutovány výhody a nevýhody našeho přístupu. |
| BibTeX: |
|---|
@INPROCEEDINGS{
author = {Lubomír Otrusina and Pavel Smrž},
title = {A New Approach to Pseudoword Generation},
pages = {1--5},
booktitle = {Proceedings of the Seventh conference on International
Language Resources and Evaluation (LREC'10)},
year = {2010},
location = {Valletta, MT},
publisher = {European Language Resources Association},
ISBN = {2-9517408-6-7},
language = {english},
url = {http://www.fit.vutbr.cz/research/view_pub.php?id=9193}
} |
|