Přejít k obsahu


A Morpho-graphemic Approach for the Recognition of Spontaneous Speech in Agglutinative Languages - like Hungarian

Citace:
MIHAJLIK, P., FEGYÓ, T., TÜSKE, Z., IRCING, P. A Morpho-graphemic Approach for the Recognition of Spontaneous Speech in Agglutinative Languages - like Hungarian. In 8th Annual Conference of the International Speech Communication Association (Interspeech 2007). New York: Curran Associates, 2007. s. 421-424. ISBN: 978-1-60560-316-2
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: A Morpho-graphemic Approach for the Recognition of Spontaneous Speech in Agglutinative Languages - like Hungarian
Rok vydání: 2007
Místo konání: New York
Název zdroje: Curran Associates
Autoři: Péter Mihajlik , Tibor Fegyó , Zoltán Tüske , Pavel Ircing
Abstrakt CZ: Článek představuje sdružený postup pro akustické a jazykové modelování pro rozpoznávání spontánní řeči, především pro aglutinační jazyky. Efektivita tohoto přístupu k rozpoznávání spontánní řeči je ilustrována na příkladu maďarské části korpusu z projektu MALACH. Slova jsou dělena na morfémy pomocí statistického segmentačního nástroje a mapování slov na grafémy je triviální operace založená pouze na rozdělení slov na jednotlivá písmena. Použití morfémů místo slov v jazykovém modelování významně snižuje WER.
Abstrakt EN: A coupled acoustic- and language-modeling approach is presented for the recognition of spontaneous speech primarily in agglutinative languages. The effectiveness of the approach in large vocabulary spontaneous speech recognition is demonstrated on the Hungarian MALACH corpus. The derivation of morphs from word forms is based on a statistical morphological segmentation tool while the mapping of morphs into graphemes is obtained trivially by splitting each morph into individual letters. Using morphs instead of words in language modeling gives significant WER reductions.
Klíčová slova

Zpět

Patička