Přejít k obsahu


A Morpho-graphemic Approach for the Recognition of Spontaneous Speech in Agglutinative Languages - like Hungarian

Citace: [] MIHAJLIK, P., FEGYÓ, T., TÜSKE, Z., IRCING, P. A Morpho-graphemic Approach for the Recognition of Spontaneous Speech in Agglutinative Languages - like Hungarian. Interspeech 2007, 2007, roč. 2007, č. 1, s. 1497-1500. ISSN: 1990-9772
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: A Morpho-graphemic Approach for the Recognition of Spontaneous Speech in Agglutinative Languages - like Hungarian
Rok vydání: 2007
Místo konání: Bonn
Název zdroje: ISCA 2007
Autoři: Péter Mihajlik , Tibor Fegyó , Zoltán Tüske , Pavel Ircing
Abstrakt CZ: Článek představuje sdružený postup pro akustické a jazykové modelování pro rozpoznávání spontánní řeči, především pro aglutinační jazyky. Efektivita tohoto přístupu k rozpoznávání spontánní řeči je ilustrována na příkladu maďarské části korpusu z projektu MALACH. Slova jsou dělena na morfémy pomocí statistického segmentačního nástroje a mapování slov na grafémy je triviální operace založená pouze na rozdělení slov na jednotlivá písmena. Použití morfémů místo slov v jazykovém modelování významně snižuje WER.
Abstrakt EN: A coupled acoustic- and language-modeling approach is presented for the recognition of spontaneous speech primarily in agglutinative languages. The effectiveness of the approach in large vocabulary spontaneous speech recognition is demonstrated on the Hungarian MALACH corpus. The derivation of morphs from word forms is based on a statistical morphological segmentation tool while the mapping of morphs into graphemes is obtained trivially by splitting each morph into individual letters. Using morphs instead of words in language modeling gives significant WER reductions.
Klíčová slova

Zpět

Patička