Článek ve sborníku konference | |
| Burget, R.: Hierarchies in HTML Documents: Linking Text to Concepts, In: 15th International Workshop on Database and Expert Systems Applications, Zaragoza, ES, IEEE CS, 2004, s. 186-190, ISBN 0-7695-2195-9 | | Jazyk publikace: | angličtina |
|---|
| Název publikace: | Hierarchies in HTML Documents: Linking Text to Concepts |
|---|
| Název (cs): | Hierarchie v HTML dokumentech: Přiřazování textu ke konceptům |
|---|
| Strany: | 186-190 |
|---|
| Sborník: | 15th International Workshop on Database and Expert Systems Applications |
|---|
| Konference: | International Workshop on Web Semantics |
|---|
| Místo vydání: | Zaragoza, ES |
|---|
| Rok: | 2004 |
|---|
| ISBN: | 0-7695-2195-9 |
|---|
| Vydavatel: | IEEE Computer Society |
|---|
| Klíčová slova |
|---|
| HTML, Extrakce informace, Ontologie, Logická struktura dokumentu |
| Anotace |
|---|
| Pro úspěšné nasazení sémantického webu je nezbytné zajistit nástroje pro přiřazování velkých objemů dat, která jsou v současnosti dostupná v dokumentech HTML, k ontologiím sémantického webu. Vzhledem ke značné variabilitě kódu HTML je velmi omezující definovat přímé vazby mezi konkrétními vzory HTML kódu a jednotlivými koncepty. Navrhujeme proto přístup založený na modelování vizuální stránky dokumentů a na obecném popisu klíčových charakteristik vizuální prezentace dat. Jako další krok navrhujeme způsob využití tohoto modelu pro vyhledávání instancí konceptů v dokumentech s použitím algoritmů pro přibližné vyhledávání podstromů a regulárních výrazů. |
| BibTeX: |
|---|
@INPROCEEDINGS{
author = {Radek Burget},
title = {Hierarchies in HTML Documents: Linking Text to Concepts},
pages = {186--190},
booktitle = {15th International Workshop on Database and Expert Systems
Applications},
year = {2004},
location = {Zaragoza, ES},
publisher = {IEEE Computer Society},
ISBN = {0-7695-2195-9},
language = {english},
url = {http://www.fit.vutbr.cz/research/view_pub.php?id=7549}
} |
|