Detail publikace

Cache Efficient Implementation for Block Matrix Operations

POLOK Lukáš, ILA Viorela S. a SMRŽ Pavel. Cache Efficient Implementation for Block Matrix Operations. In: Proceedings of the 21st High Performance Computing Symposium (HPC'13). San Diego: Association for Computing Machinery, 2013, s. 698-706. ISBN 1-56555-350-0. Dostupné z: http://dl.acm.org/citation.cfm?id=2499972

Název česky

Paměťově efektivní implementace operací pro blokové matice

Typ

článek ve sborníku konference

Jazyk

angličtina

Autoři

Polok Lukáš, Ing. (UPGM FIT VUT)
Ila Viorela S., Ing., Ph.D. (UPGM FIT VUT)
Smrž Pavel, doc. RNDr., Ph.D. (UPGM FIT VUT)

URL

http://dl.acm.org/citation.cfm?id=2499972

Abstrakt

Efektivní manipulace a operace nad blokovými maticemi jsou užitečné v mnoha aplikacích, například těmi jež zahrnují iterativní řešení nelineárních systémů. Tyto typy problémů sestávají z opakovaného skládání a řešení lineárních soustav rovnic. Bez opatrné manipulace s odpovídajícími maticemi může být řešení časově velmi náročné, zejména ve velkých systémech.

Tento článek navrhuje paměťovou strukturu, vhodnou k ukládání blokových matic, výhodnou pro jejich strukturální i numerickou modifikaci a efektivní aritmetické operace. Tato struktura byla využita při implementaci jednoduché knihovny s rozhraním typu BLAS. Výhody navržené struktury jsou demonstrovány vyčerpávající sadou testů na datasetu UFLSMC. Tato knihovna byla dále použita k řešení několika nelineárních optimizací grafových problémů.

Anotace

Tento článek se zabývá efektivní implementací operací nad řídkými blokovými maticemi na CPU, pomocí efektivního návrhu struktur pro uložení matic v paměti a pomocí agresivní optimalizace pomocí instrukčních sad SSE, AltiVec nebo NEON.

Dosahuje se velmi dobrých výsledků, jak s implementací samotnou, tak s jejím využití při řešení robotických problémů typu nonlinear least squares.

Rok

2013

Strany

698-706

Sborník

Proceedings of the 21st High Performance Computing Symposium (HPC'13)

Konference

21st High Performance Computing Symposium, San Diego, USA, US

ISBN

1-56555-350-0

Vydavatel

Association for Computing Machinery

Místo

San Diego, US

BibTeX

@INPROCEEDINGS{FITPUB10265,
   author = "Luk\'{a}\v{s} Polok and S. Viorela Ila and Pavel Smr\v{z}",
   title = "Cache Efficient Implementation for Block Matrix Operations",
   pages = "698--706",
   booktitle = "Proceedings of the 21st High Performance Computing Symposium (HPC'13)",
   year = 2013,
   location = "San Diego, US",
   publisher = "Association for Computing Machinery",
   ISBN = "1-56555-350-0",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/10265"
}

Soubory

pdf hpc13_final_with_link.pdf 220 KB