Článek ve sborníku konference

 
Bartík, V.: Text-Based Web Page Classification with Use of Visual Information, In: 2010 International Conference on Advances in Social Network Analysis and Mining, Odense, DK, IEEE CS, 2010, s. 416-420, ISBN 978-0-7695-4138-9
Jazyk publikace:angličtina
Název publikace:Text-Based Web Page Classification with Use of Visual Information
Název (cs):Klasifikace webových stránek založená na textu s využitím vizuální informace
Strany:416-420
Sborník:2010 International Conference on Advances in Social Network Analysis and Mining
Konference:International Symposium on Open Source Intelligence & Web Mining 2010
Místo vydání:Odense, DK
Rok:2010
ISBN:978-0-7695-4138-9
Vydavatel:IEEE Computer Society
Klíčová slova
web page classification, term weights, text classification, TF-IDF weight, visual information, visual  blocks
Anotace
S neustále rosoucím počtem stránek na webu je potřeba tyto stránky klasifikovat do kategorií, aby bylo možné jejich indexování a vyhledávání. Je zde popsána metoda, která využívá textovou i vizuální informaci pro reprezentaci obsahu webové stránky. Je zde popsáno několik vah pro termy, které jsou modifikacemi TF a TF-IDF. Modifikae jsou založeny na vizuálních oblastech stránky, v nichž se text nachází a jejich vizuálních vlastnostech. Na konci článku je obsaženo několik výsledků experimentů.
BibTeX:
@INPROCEEDINGS{
   author = {Vladimír Bartík},
   title = {Text-Based Web Page Classification with Use of Visual
	Information},
   pages = {416--420},
   booktitle = {2010 International Conference on Advances in Social Network
	Analysis and Mining},
   year = {2010},
   location = {Odense, DK},
   publisher = {IEEE Computer Society},
   ISBN = {978-0-7695-4138-9},
   language = {english},
   url = {http://www.fit.vutbr.cz/research/view_pub.php?id=9274}
}