Články na konferencích
| Polok, L., Smrž, P.: Implementing Random Indexing on GPU, In: Proceedings of the 19th High Performance Computing Symposia, Boston, US, SCS, 2011, s. 134-142, ISBN 978-1-61782-840-9 | | Jazyk publikace: | angličtina |
|---|
| Název publikace: | Implementing Random Indexing on GPU |
|---|
| Název (cs): | Implementace algoritmu Random Indexing na GPU |
|---|
| Strany: | 134-142 |
|---|
| Sborník: | Proceedings of the 19th High Performance Computing Symposia |
|---|
| Konference: | Spring Simulation Multi-Conference |
|---|
| Řada knih: | HPC '11 |
|---|
| Místo vydání: | Boston, US |
|---|
| Rok: | 2011 |
|---|
| URL: | http://dl.acm.org/citation.cfm?id=2048577.2048595 |
|---|
| ISBN: | 978-1-61782-840-9 |
|---|
| Vydavatel: | SCS Publication House |
|---|
| Klíčová slova |
|---|
random indexing, word space models, term co-occurence, GPGPU
|
| Anotace |
|---|
| Modely založené na vektorových prostorech (také word space nebo term space modely) jsou algebraické modely, používané pro reprezentaci dokumentů pomocí vektorů termů. V poslední době jim byla věnováno mnoho pozornosti díky jejich širokému spektru aplikací jako například filtrování a extrakce informací, indexování a přiřazení relevance. Oproti ostatním modelům mohou být výhodnější protože jsou matematicky dobře definované a existuje velká množina nástrojů pro jejich manipulaci. Random indexing je jedna z metod, použitelná pro výpočet vector space modelu ze sady dokumentů, založená na statistice distribuce spoluvýskytu jednotlivých termů. Aby tato metoda dala použitelné výsledky, je třeba velkého množství dat a značná výpočetní síla. Zde prezentujeme efektivní implementaci algoritmu random indexing na GPU, dovolující rychlé trénování i na velkých datasetech. Je omezená jen množstvím paměti, dostupné na GPU, avšak jsou navrženy i metody jak toto omezení obejít. Bylo dosaženo zrychlení řádově desetkrát pro trénování z náhodných seed vektorů, a ještě větší pro přetrénování. Implementace škáluje dobře jak s délkou term tak i seed vektorů. |
| BibTeX: |
|---|
@INPROCEEDINGS{
author = {Lukáš Polok and Pavel Smrž},
title = {Implementing Random Indexing on GPU},
pages = {134--142},
booktitle = {Proceedings of the 19th High Performance Computing Symposia},
series = {HPC '11},
year = {2011},
location = {Boston, US},
publisher = {SCS Publication House},
ISBN = {978-1-61782-840-9},
language = {english},
url = {http://www.fit.vutbr.cz/research/view_pub.php?id=9711}
} |
|