Článek ve sborníku konference | |
| Bartík, V.: Text-Based Web Page Classification with Use of Visual Information, In: 2010 International Conference on Advances in Social Network Analysis and Mining, Odense, DK, IEEE CS, 2010, s. 416-420, ISBN 978-0-7695-4138-9 | | Jazyk publikace: | angličtina |
|---|
| Název publikace: | Text-Based Web Page Classification with Use of Visual Information |
|---|
| Název (cs): | Klasifikace webových stránek založená na textu s využitím vizuální informace |
|---|
| Strany: | 416-420 |
|---|
| Sborník: | 2010 International Conference on Advances in Social Network Analysis and Mining |
|---|
| Konference: | International Symposium on Open Source Intelligence & Web Mining 2010 |
|---|
| Místo vydání: | Odense, DK |
|---|
| Rok: | 2010 |
|---|
| ISBN: | 978-0-7695-4138-9 |
|---|
| Vydavatel: | IEEE Computer Society |
|---|
| Klíčová slova |
|---|
| web page classification, term weights, text classification, TF-IDF weight, visual information, visual blocks |
| Anotace |
|---|
| S neustále rosoucím počtem stránek na webu je potřeba tyto stránky klasifikovat do kategorií, aby bylo možné jejich indexování a vyhledávání. Je zde popsána metoda, která využívá textovou i vizuální informaci pro reprezentaci obsahu webové stránky. Je zde popsáno několik vah pro termy, které jsou modifikacemi TF a TF-IDF. Modifikae jsou založeny na vizuálních oblastech stránky, v nichž se text nachází a jejich vizuálních vlastnostech. Na konci článku je obsaženo několik výsledků experimentů. |
| BibTeX: |
|---|
@INPROCEEDINGS{
author = {Vladimír Bartík},
title = {Text-Based Web Page Classification with Use of Visual
Information},
pages = {416--420},
booktitle = {2010 International Conference on Advances in Social Network
Analysis and Mining},
year = {2010},
location = {Odense, DK},
publisher = {IEEE Computer Society},
ISBN = {978-0-7695-4138-9},
language = {english},
url = {http://www.fit.vutbr.cz/research/view_pub.php?id=9274}
} |
|