Disertační práce
| Szőke, I.: Hybrid word-subword spoken term detection, Brno, CZ, FIT VUT, 2010, s. 137 | | Jazyk publikace: | angličtina |
|---|
| Název publikace: | Hybrid word-subword spoken term detection |
|---|
| Název (cs): | Hybridní slovní a pod-slovní detekce klíčových frází |
|---|
| Strany: | 137 |
|---|
| Místo vydání: | Brno, CZ |
|---|
| Rok: | 2010 |
|---|
| Vydavatel: | Fakulta informačních technologií VUT v Brně |
|---|
| URL: | http://www.fit.vutbr.cz/~szoke/publi/dis.pdf [PDF] |
|---|
| Klíčová slova |
|---|
detekce klíčových slov, detekce frází v řeči, míry konfidence, rozpoznávání spojité řeči s velkým slovníkem, kombinovaný slovní-podslovní systém, slova mimo slovník |
| Abstrakt |
|---|
Tato disertační práce se zabývá detekcí klíčových slov (keyword spotting) a frází (spoken term detection -- STD), které jsou považovány za podmnožinu vyhledávání v řečových dokumentech (spoken document retrieval). Týká se dvoufázových přístupů, ve kterých je řeč nejprve přepsána rozpoznávačem, vyhledávání dotazů pak probíhá ve výstupu tohoto rozpoznávače. Na začátku testujeme standardní rozpoznávač spojité řeči s velkým a fixním slovníkem (large vocabulary continuous speech recognizer -- LVCSR), a diskutujeme jeho hlavní nevýhodu -- neschopnost detekovat slova mimo slovník (out-of-vocabulary words -- OOV). Zkoumáme rovněž systémy založené na pod-slovních jednotkách (subword), důraz klademe na jednotky, které jsou automaticky určeny pomocí fonémových multigramů s omezujícími podmínkami. Dalším krokem je tvorba hybridního systému pro vyhledávání dotazů -- ten kombinuje obě části (slovní i pod-slovní) v jedné rozpoznávací síti. V experimentech testujeme různé varianty tohoto přístupu, výsledky uvádíme na standardních datech z NIST STD 2006 evaluace. Přesnost hybridního systému je o něco menší než u kombinace samostatného slovního a pod-slovního systému, tato nevýhoda je však převážena jednoduchostí a efektivitou námi navrženého přístupu.
|
| BibTeX: |
|---|
@PHDTHESIS{
author = {Igor Szőke},
title = {Hybrid word-subword spoken term detection},
pages = {137},
year = {2010},
location = {Brno, CZ},
publisher = {Faculty of Information Technology BUT},
language = {english},
url = {http://www.fit.vutbr.cz/research/view_pub.php?id=9375}
} |
|