Články na konferencích

Polok, L., Smrž, P.: Implementing Random Indexing on GPU, In: Proceedings of the 19th High Performance Computing Symposia, Boston, US, SCS, 2011, s. 134-142, ISBN 978-1-61782-840-9
Jazyk publikace:angličtina
Název publikace:Implementing Random Indexing on GPU
Název (cs):Implementace algoritmu Random Indexing na GPU
Strany:134-142
Sborník:Proceedings of the 19th High Performance Computing Symposia
Konference:Spring Simulation Multi-Conference
Řada knih:HPC '11
Místo vydání:Boston, US
Rok:2011
URL:http://dl.acm.org/citation.cfm?id=2048577.2048595
ISBN:978-1-61782-840-9
Vydavatel:SCS Publication House
Klíčová slova
random indexing, word space models, term co-occurence, GPGPU 
Anotace
Modely založené na vektorových prostorech (také word space nebo term space modely) jsou algebraické modely, používané pro reprezentaci dokumentů pomocí vektorů termů. V poslední době jim byla věnováno mnoho pozornosti díky jejich širokému spektru aplikací jako například filtrování a extrakce informací, indexování a přiřazení relevance. Oproti ostatním modelům mohou být výhodnější protože jsou matematicky dobře definované a existuje velká množina nástrojů pro jejich manipulaci.

Random indexing je jedna z metod, použitelná pro výpočet vector space modelu ze sady dokumentů, založená na statistice distribuce spoluvýskytu jednotlivých termů. Aby tato metoda dala použitelné výsledky, je třeba velkého množství dat a značná výpočetní síla.

Zde prezentujeme efektivní implementaci algoritmu random indexing na GPU, dovolující rychlé trénování i na velkých datasetech. Je omezená jen množstvím paměti, dostupné na GPU, avšak jsou navrženy i metody jak toto omezení obejít. Bylo dosaženo zrychlení řádově desetkrát pro trénování z náhodných seed vektorů, a ještě větší pro přetrénování. Implementace škáluje dobře jak s délkou term tak i seed vektorů.

BibTeX:
@INPROCEEDINGS{
   author = {Lukáš Polok and Pavel Smrž},
   title = {Implementing Random Indexing on GPU},
   pages = {134--142},
   booktitle = {Proceedings of the 19th High Performance Computing Symposia},
   series = {HPC '11},
   year = {2011},
   location = {Boston, US},
   publisher = {SCS Publication House},
   ISBN = {978-1-61782-840-9},
   language = {english},
   url = {http://www.fit.vutbr.cz/research/view_pub.php?id=9711}
}

Vaše IPv4 adresa: 50.16.17.90
Přepnout na IPv6 spojení

DNSSEC [dnssec]