Disertační práce

Szőke, I.: Hybrid word-subword spoken term detection, Brno, CZ, FIT VUT, 2010, s. 137
Jazyk publikace:angličtina
Název publikace:Hybrid word-subword spoken term detection
Název (cs):Hybridní slovní a pod-slovní detekce klíčových frází
Strany:137
Místo vydání:Brno, CZ
Rok:2010
Vydavatel:Fakulta informačních technologií VUT v Brně
URL:http://www.fit.vutbr.cz/~szoke/publi/dis.pdf [PDF]
Klíčová slova
detekce klíčových slov, detekce frází v řeči, míry
konfidence,  rozpoznávání spojité řeči
s velkým slovníkem, kombinovaný slovní-podslovní systém, slova mimo slovník
Abstrakt
Tato disertační práce se zabývá detekcí klíčových slov (keyword
spotting) a frází (spoken term detection -- STD), které jsou považovány
za podmnožinu vyhledávání v řečových dokumentech (spoken document
retrieval). Týká se dvoufázových přístupů, ve kterých je řeč nejprve
přepsána rozpoznávačem, vyhledávání dotazů pak probíhá ve výstupu tohoto
rozpoznávače. Na začátku testujeme standardní rozpoznávač
spojité řeči s velkým a fixním slovníkem (large vocabulary continuous speech
recognizer -- LVCSR), a diskutujeme jeho hlavní
nevýhodu -- neschopnost detekovat slova mimo slovník (out-of-vocabulary
words -- OOV). Zkoumáme rovněž systémy založené na pod-slovních jednotkách
 (subword), důraz klademe na jednotky, které jsou automaticky
určeny pomocí fonémových multigramů s omezujícími podmínkami. Dalším
krokem je tvorba hybridního systému pro vyhledávání dotazů -- ten
kombinuje obě části (slovní i pod-slovní) v jedné rozpoznávací síti. V
experimentech testujeme různé varianty tohoto přístupu, výsledky
uvádíme na standardních datech z NIST STD 2006  evaluace. Přesnost
hybridního systému je o něco menší než u kombinace samostatného
slovního a pod-slovního systému, tato nevýhoda je však převážena
jednoduchostí a efektivitou námi navrženého přístupu.
BibTeX:
@PHDTHESIS{
   author = {Igor Szőke},
   title = {Hybrid word-subword spoken term detection},
   pages = {137},
   year = {2010},
   location = {Brno, CZ},
   publisher = {Faculty of Information Technology BUT},
   language = {english},
   url = {http://www.fit.vutbr.cz/research/view_pub.php?id=9375}
}

Vaše IPv4 adresa: 23.22.212.158
Přepnout na IPv6 spojení

DNSSEC [dnssec]