Článek ve sborníku konference

 
Burget, R.: Hierarchies in HTML Documents: Linking Text to Concepts, In: 15th International Workshop on Database and Expert Systems Applications, Zaragoza, ES, IEEE CS, 2004, s. 186-190, ISBN 0-7695-2195-9
Jazyk publikace:angličtina
Název publikace:Hierarchies in HTML Documents: Linking Text to Concepts
Název (cs):Hierarchie v HTML dokumentech: Přiřazování textu ke konceptům
Strany:186-190
Sborník:15th International Workshop on Database and Expert Systems Applications
Konference:International Workshop on Web Semantics
Místo vydání:Zaragoza, ES
Rok:2004
ISBN:0-7695-2195-9
Vydavatel:IEEE Computer Society
Klíčová slova
HTML, Extrakce informace, Ontologie, Logická struktura dokumentu
Anotace
Pro úspěšné nasazení sémantického webu je nezbytné zajistit nástroje pro přiřazování velkých objemů dat, která jsou v současnosti dostupná v dokumentech HTML, k ontologiím sémantického webu. Vzhledem ke značné variabilitě kódu HTML je velmi omezující definovat přímé vazby mezi konkrétními vzory HTML kódu a jednotlivými koncepty. Navrhujeme proto přístup založený na modelování vizuální stránky dokumentů a na obecném popisu klíčových charakteristik vizuální prezentace dat. Jako další krok navrhujeme způsob využití tohoto modelu pro vyhledávání instancí konceptů v dokumentech s použitím algoritmů pro přibližné vyhledávání podstromů a regulárních výrazů.
BibTeX:
@INPROCEEDINGS{
   author = {Radek Burget},
   title = {Hierarchies in HTML Documents: Linking Text to Concepts},
   pages = {186--190},
   booktitle = {15th International Workshop on Database and Expert Systems
	Applications},
   year = {2004},
   location = {Zaragoza, ES},
   publisher = {IEEE Computer Society},
   ISBN = {0-7695-2195-9},
   language = {english},
   url = {http://www.fit.vutbr.cz/research/view_pub.php?id=7549}
}