Vývoj modelů pro technologii převodu mluvené řeči do textu (automatic speech recognition) pro francouzský jazyk - dialekt evropská francouzština.

Název v angličtině:Development of models for technology of trnasfer of oral speech into the text (automatic speech recognition) for French language
Hlavní řešitel:Karafiát Martin
Spoluřešitelé:Grézl František, Chalupníček Kamil
Agentura:Jihomoravské inovační centrum
Zahájení:2015-07-23
Ukončení:2015-11-30
Klíčová slova:slovník, rozpoznání řeči
Anotace:
Řešitelský tým zpracuje přesné požadavky zadavatele (Phonexia s.r.o.) na modely pro ASR (formát dat, velikost modelů, ...). Na základě těchto požadavků vytvoří pro rozpoznávání spontánní konverzační francouzštiny výslovnostní slovník, akustický a jazykový model. Při řešení budou využity softwarové nástroje pro extrakci příznaků a databáze řeči dodané zadavatelem a částečně vlastní data Poskytovatele. Poskytovatel znalostí použije své know-how a výpočetní kapacity. Know-how je velmi důležité pro trénování přesného a robustního akustického modelu. Řešitelský tým má v této oblasti mnohaleté zkušenosti. Trénovaní takového akustického modelu je také výpočetně náročný proces, pro který je nutné využít výkonného výpočetního clusteru. Natrénované modely budou před předáním evaluovány na standardní testovací sadě formou slovní úspěšnosti rozpoznávání. Předpokládané dodání modelů pro ASR je 3 měsíce od podpisu smlouvy a dodání vstupů, ke kterým se zaváže zadavatel.
Realizační výstupy:
  • sada fonémů pro francouzský jazyk (dialekt evropská francouzština)

  • výslovnostní slovník: alespoň 50tisíc slov, pokrývající běžnou hovorovou francouzštinu (dialekt evropská francouzština) a televizní/rozhlasové zpravodajství - akustický model: GMM/HMM, diskriminativně trénovaný s příznaky generovanými neuronovými sítěmi, trénovaný na telefonním pásmu (8kHz)

  • jazykový model: 3-gramové statistiky, postavený na výše uvedeném výslovnostním slovníku

  •  protokol s dosaženými výsledky při rozpoznávání slov na standardní (nebo dohodnuté) evaluační sadě.

Publikace

2015KARAFIÁT Martin a GRÉZL František. Souhrnná zpráva k projektu "ASR-FR" za rok 2015. Brno: Phonexia s.r.o., 2015.

Vaše IPv4 adresa: 54.225.17.239
Přepnout na IPv6 spojení

DNSSEC [dnssec]