Článek ve sborníku konference

POLOK Lukáš, ILA Viorela S. a SMRŽ Pavel. Cache Efficient Implementation for Block Matrix Operations. In: Proceedings of the 21st High Performance Computing Symposium (HPC'13). San Diego: Association for Computing Machinery, 2013, s. 698-706. ISBN 1-56555-350-0. Dostupné z: http://dl.acm.org/citation.cfm?id=2499972
Jazyk publikace:angličtina
Název publikace:Cache Efficient Implementation for Block Matrix Operations
Název (cs):Paměťově efektivní implementace operací pro blokové matice
Strany:698-706
Sborník:Proceedings of the 21st High Performance Computing Symposium (HPC'13)
Konference:21st High Performance Computing Symposium
Místo vydání:San Diego, US
Rok:2013
URL:http://dl.acm.org/citation.cfm?id=2499972
ISBN:1-56555-350-0
Vydavatel:Association for Computing Machinery
Soubory: 
+Typ Jméno Název Vel. Poslední změna
iconhpc13_final_with_link.pdf220 KB2013-04-15 15:17:31
^ Vybrat vše
S vybranými:
Klíčová slova
block matrix, high performance, sparse BLAS, nonlinear least squares
Anotace
Efektivní manipulace a operace nad blokovými maticemi jsou užitečné v mnoha aplikacích, například těmi jež zahrnují iterativní řešení nelineárních systémů. Tyto typy problémů sestávají z opakovaného skládání a řešení lineárních soustav rovnic. Bez opatrné manipulace s odpovídajícími maticemi může být řešení časově velmi náročné, zejména ve velkých systémech.

Tento článek navrhuje paměťovou strukturu, vhodnou k ukládání blokových matic, výhodnou pro jejich strukturální i numerickou modifikaci a efektivní aritmetické operace. Tato struktura byla využita při implementaci jednoduché knihovny s rozhraním typu BLAS. Výhody navržené struktury jsou demonstrovány vyčerpávající sadou testů na datasetu UFLSMC. Tato knihovna byla dále použita k řešení několika nelineárních optimizací grafových problémů.

Abstrakt
Tento článek se zabývá efektivní implementací operací nad řídkými blokovými maticemi na CPU, pomocí efektivního návrhu struktur pro uložení matic v paměti a pomocí agresivní optimalizace pomocí instrukčních sad SSE, AltiVec nebo NEON.

Dosahuje se velmi dobrých výsledků, jak s implementací samotnou, tak s jejím využití při řešení robotických problémů typu nonlinear least squares.

BibTeX:
@INPROCEEDINGS{
   author = {Luk{\'{a}}{\v{s}} Polok and S. Viorela Ila and
	Pavel Smr{\v{z}}},
   title = {Cache Efficient Implementation for Block Matrix
	Operations},
   pages = {698--706},
   booktitle = {Proceedings of the 21st High Performance Computing Symposium
	(HPC'13)},
   year = {2013},
   location = {San Diego, US},
   publisher = {Association for Computing Machinery},
   ISBN = {1-56555-350-0},
   language = {english},
   url = {http://www.fit.vutbr.cz/research/view_pub.php.cs?id=10265}
}

Vaše IPv4 adresa: 35.172.201.102
Přepnout na IPv6 spojení

DNSSEC [dnssec]