Téma disertační práce

Školitel:Zendulka Jaroslav, doc. Ing., CSc.
Téma:Segmentace webových stánek
Zahájení v ak.r.:2010/2011
Obhajoba disertace:2017-06-23
Název disertace:Segmentace webových stránek s využitím shlukovacích technik
Charakteristika řešeného problému:

Téměř veškeré dokumenty z různých oborů lidské činnosti jsou v dnešní době připravovány v elektronické podobě. Vzhledem k množství dostupných dokumentů (zejména na WWW ale i v jiných zdrojích) se stávají nezbytnými nástroje pro automatické zpracování dokumentů, například pro jejich indexování a vyhledávání, porovnávání nebo extrakci dat z dokumentů. V souvislosti s WWW je také stále více aktuální výzkum získávání znalostí z obsahu webu (web content mining) a související problematika předzpracování slabě strukturovaných dokumentů. Vzhledem k současným možnostem tvorby elektronických dokumentů se ukazuje, že není postačující se v oblasti zpracování dokumentů zabývat pouze textovým obsahem, ale je nutné uvažovat i formátování dokumentů, strukturu odkazů a další faktory. Téma disertační práce zahrnuje výzkum metod zpracování dokumentů, které využívají i těchto doplňkových informací v dokumentech. Cíle projektu lze shrnout do následujících oblastí:

  • Studium moderních technologií pro prezentaci dat na WWW
  • Studium současných přístupů k modelování a využití různých složek informace v elektronických dokumentech
  • Modifikace existujících, resp. návrh nových algoritmů a technik zpracování elektronických dokumentů
  • Experimentální ověření na reálných datech.
  • Formalizace řešeného problému.

Doktorand bude řešen v návaznosti na výzkumný záměr MSM 0021630528 "Výzkum informačních technologií z hlediska bezpečnosti" s perspektivní možností přímého zapojení do řešení, včetně finanční odměny. Navíc se očekává, že doktorand podá projekt do Fondu rozvoje vysokých škol. Z těchto zdrojů (v případě přijetí) a z institucionálních prostředků se předpokládá technické i hospodářské zajištění projektu.

Doktorand bude zapojen do výuky podle potřeb ústavu a fakulty.

Školitel-specialista: Ing. Radek Burget, Ph.D.

Vaše IPv4 adresa: 34.204.189.171
Přepnout na https