Ústav informačních systémů

Článek v časopise

ZELENÝ Jan, BURGET Radek a ZENDULKA Jaroslav. Box Clustering Segmentation: A New Method for Vision-based Page Preprocessing. Information Processing and Management. 2017, roč. 53, č. 3, s. 735-750. ISSN 0306-4573. Dostupné z: http://www.sciencedirect.com/science/article/pii/S0306457316301169
Jazyk publikace:angličtina
Název publikace:Box Clustering Segmentation: A New Method for Vision-based Page Preprocessing
Název (cs):Box Clustering Segmentation: Nová metoda vizuálně orientovaného předzpracování stránek
Strany:735-750
Místo vydání:NL
Rok:2017
URL:http://www.sciencedirect.com/science/article/pii/S0306457316301169
Časopis:Information Processing and Management, roč. 53, č. 3, NL
ISSN:0306-4573
DOI:10.1016/j.ipm.2017.02.002
Klíčová slova
box clustering, graph clustering, vision-based page segmentation, VIPS
Anotace
Článek prezentuje nový přístup k sementaci webových stránek. Na rozdíl od běžně dostupných současných metod, které pracují nad stromovým modelem stránky a produkují opět stromovou strukturu na výstupu, popisovaná metoda je založena na shlukování atomických částí obsahu a vytváří plochý segmentační model. Experimentální výsledky ukazují, že metoda je téměř o 90 % rychlejší, než srovnatelné existující přístupy.
BibTeX:
@ARTICLE{
   author = {Jan Zelen{\'{y}} and Radek Burget and Jaroslav
	Zendulka},
   title = {Box Clustering Segmentation: A New Method for
	Vision-based Page Preprocessing},
   pages = {735--750},
   journal = {Information Processing and Management},
   volume = 53,
 number = 3,
   year = 2017,
   ISSN = {0306-4573},
   doi = {10.1016/j.ipm.2017.02.002},
   language = {english},
   url = {http://www.fit.vutbr.cz/research/view_pub.php.cs?id=10821}
}

Vaše IPv4 adresa: 34.204.179.0
Přepnout na https