Článek ve sborníku konference

BURGET Radek. Automatic Web Document Restructuring Based on Visual Information Analysis. In: Advances in Intelligent Web Mastering - 2, Proceedings of the 6th Atlantic Web Intelligence Conference - AWIC'2009. Prague: Springer Verlag, 2010, s. 61-70. ISBN 978-3-642-10686-6.
Jazyk publikace:angličtina
Název publikace:Automatic Web Document Restructuring Based on Visual Information Analysis
Název (cs):Automatická úprava struktury webových dokumentů na základě analýzy vizuální informace
Strany:61-70
Sborník:Advances in Intelligent Web Mastering - 2, Proceedings of the 6th Atlantic Web Intelligence Conference - AWIC'2009
Konference:6th Atlantic Web Intelligence Conference
Řada knih:Advances in Intelligent and Soft Computing , Vol. 67
Místo vydání:Prague, CZ
Rok:2010
ISBN:978-3-642-10686-6
Vydavatel:Springer Verlag
Klíčová slova
document restructuring, page analysis, page segmentation, block importance
Anotace
Mnoho dokumentů přístupných přes současný web má poměrně složitou strukturu, která umožňuje prezentovat různé druhy informací. Kromě hlavního obsahu proto stránky obvykle obsahují záhlaví a zápatí, navigační část a další druhy dodatečných informací. Pro mnoho aplikací, jako například indexování dokumentů nebo jejich prohlížení na speciálních zařízeních je vhodné, aby v HTML kódu dokumentu hlavní obsah předcházel ostatní informace. V tomto příspěvku představujeme metodu předzpracování dokumentů, která automaticky upraví strukturu dokumentu podle tohoto kritéria. Metoda využívá algoritmus segmentace stránek pro detekci základních bloků stránky. Relevance jednotlivých bloků je pak odhadnuta na základě jejich vizuálních vlastností.
BibTeX:
@INPROCEEDINGS{
   author = {Radek Burget},
   title = {Automatic Web Document Restructuring Based on Visual
	Information Analysis},
   pages = {61--70},
   booktitle = {Advances in Intelligent Web Mastering - 2, Proceedings of
	the 6th Atlantic Web Intelligence Conference - AWIC'2009},
   series = {Advances in Intelligent and Soft Computing , Vol. 67},
   year = {2010},
   location = {Prague, CZ},
   publisher = {Springer Verlag},
   ISBN = {978-3-642-10686-6},
   language = {english},
   url = {http://www.fit.vutbr.cz/research/view_pub.php.cs?id=9027}
}

Vaše IPv4 adresa: 54.224.18.114
Přepnout na IPv6 spojení

DNSSEC [dnssec]