Ústav počítačové grafiky a multimédií
Články na konferencích
| Polok Lukáš, Smrž Pavel: Fast Linear Algebra on GPU, In: IEEE conference proceedings, Liverpool, GB, IEEE CS, 2012, s. 6, ISBN 978-0-7695-4749-7 | | Jazyk publikace: | angličtina |
|---|
| Název publikace: | Fast Linear Algebra on GPU |
|---|
| Název (cs): | Rychlá lineární algebra na GPU |
|---|
| Strany: | 6 |
|---|
| Sborník: | IEEE conference proceedings |
|---|
| Konference: | The 14th IEEE International Conference on High Performance Computing and Communications |
|---|
| Místo vydání: | Liverpool, GB |
|---|
| Rok: | 2012 |
|---|
| ISBN: | 978-0-7695-4749-7 |
|---|
| Vydavatel: | IEEE Computer Society |
|---|
| Soubory: | |
|---|
|
| | Klíčová slova |
|---|
| GPU; parallel reduction; linear algebra;
BLAS; OpenCL; CUDA |
| Anotace |
|---|
| GPU jsou úspěšně využívané k akceleraci mnoha matematických funkcí a knihoven. Běžnou limitací těchto knihoven je minimální velikost problému, nutná k dosažení podstatného zrychlení, v porovnání s CPU ekvivalentem. Toto kritérium může pro mnoho aplikací znamenat nemožnost jejich implementace na GPU. Je však možné jej obejít pomocí slučování operací do dávek tak, aby GPU mělo dostatek dat k efektivnímu zpracování. V této publikaci navrhujeme rychlou OpenCL implementaci dvou základních vektorových funkcí - redukci a násobení skalárem. Rychlost implementace byla změřena na dvou dnes nejpoužívanějších typech GPU (Tesla a Fermi). V porovnání s dnešním de-facto standardem, knihovnou CUBLAS, je naše implementace výrazně rychlejší. |
| BibTeX: |
|---|
@INPROCEEDINGS{
author = {Lukáš Polok and Pavel Smrž},
title = {Fast Linear Algebra on GPU},
pages = {6},
booktitle = {IEEE conference proceedings},
year = {2012},
location = {Liverpool, GB},
publisher = {IEEE Computer Society},
ISBN = {978-0-7695-4749-7},
language = {english},
url = {http://www.fit.vutbr.cz/research/view_pub.php?id=10039}
} |
|