Článek ve sborníku konference

ČUDOVÁ Marta. Framework for Planning, Running and Monitoring Cooperating Computations. In: Počítačové architektúry & diagnostika PAD 2017. Bratislava: Slovenská technická univerzita v Bratislavě, 2017, s. 20-23. ISBN 978-80-972784-0-3.
Jazyk publikace:angličtina
Název publikace:Framework for Planning, Running and Monitoring Cooperating Computations
Název (cs):Systém pro plánování, spouštění a monitorování kooperujících výpočtů
Strany:20-23
Sborník:Počítačové architektúry & diagnostika PAD 2017
Konference:Počítačové architektury a diagnostika 2017
Místo vydání:Bratislava, SK
Rok:2017
ISBN:978-80-972784-0-3
Vydavatel:Slovenská technická univerzita v Bratislavě
Soubory: 
+Typ Jméno +Název Vel. Poslední změna
iconPAD_2017_zbornik.pdf10,1 MB2017-10-09 12:35:10
^ Vybrat vše
S vybranými:
Klíčová slova
Automation, distributed computing, execution planning, job submission, monitoring, HPC, multiscale modelling, model coupling, service
Anotace
Reálné simulace jsou velice výpočetné náročné a vyžadují využití vysoce výkonných výpočetních strojů. Takové výpočetní stroje jsu postaveny na paralelní architektuře a jsou velmi různorodé. Toto vede na použití sofistikovanějších výpočetních technik, aby bylo možné plně využít sílu takových strojů. K popisu komplexních jevů je nutné použít množinu rozdílných kooperujících modelů. Toto zvyšuje nárok na uživatele, aby vytvářeli, spouštěli, uměli validovat a analyzovat tyto modely. Situace je o to obtížnější, pokud uživatel není expertem v IT. Uživatelé jsou pak nuceni vynaložit velké usílí na akce, které jsou často mimo jejich obor. Tyto akce by však mohly být zuatomatizavány. Tato práce představuje nástroj provádějící automatické plánování, spouštění  a monitorování kooperujících a rozsáhlých výpočtů. Použitý přístup představuje HPC jako službu. Modulární návrhje rozšiřitelný a sjednocuje přístup k různých HPC systémům díky jednoduchému klient-server rozhraní založeného na standardních webových službách. Dispatch server umí detekovat a spouštět úlohy běžící souběžně a umožňuje určitou úroveň detekce chyb.
Abstrakt
Realistic simulations need for their run very powerful computers. Computing infrastructures are growing in parallelism and becoming more diverse. This heads towards using more sophisticated computational techniques to take full advantage of the machine power. To describe a scientific problem, a number of different and cooperating models is used. This tends to force users to construct, execute, validate and analyse these models. The situation is much more complicated if the user is not an IT specialist. This causes a huge human effort to actions that might be out of a scientist's scope or could be provided automatically. This work presents a tool providing an automated planning, executing and monitoring cooperating and extensive computations. The approach used introduces the HPC as a service. Modular design enables extensions and unifies the access to different HPC systems through a simple client-server interface using standard web services. The dispatch server detects and enables concurrent execution of tasks and offers a level of fault tolerance.  
BibTeX:
@INPROCEEDINGS{
   author = {Marta {\v{C}}udov{\'{a}}},
   title = {Framework for Planning, Running and Monitoring
	Cooperating Computations},
   pages = {20--23},
   booktitle = {Po{\v{c}}{\'{i}}ta{\v{c}}ov{\'{e}} architekt{\'{u}}ry \&
	diagnostika PAD 2017},
   year = 2017,
   location = {Bratislava, SK},
   publisher = {Slovak University of Technology in Bratislava},
   ISBN = {978-80-972784-0-3},
   language = {english},
   url = {http://www.fit.vutbr.cz/research/view_pub.php.cs?id=11475}
}

Vaše IPv4 adresa: 18.205.176.100