Přejít k obsahu


Towards automatic transcription of spontaneous Czech speech in the MALACH project

Citace:
PSUTKA, J., IRCING, P., PSUTKA, J., RADOVÁ, V., BYRNE, W., VENKATARAMANI, V., HAJIČ, J., GUSTMAN, S. Towards automatic transcription of spontaneous Czech speech in the MALACH project. Lecture Notes in Artificial Intelligence, 2003, roč. 2807, č. 2807, s. 214-219. ISSN: 0302-9743
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Towards automatic transcription of spontaneous Czech speech in the MALACH project
Rok vydání: 2003
Místo konání: Berlin
Název zdroje: Springer
Autoři: Josef Psutka , Pavel Ircing , Josef Psutka , Vlasta Radová , William Byrne , Veera Venkataramani , Jan Hajič , Samuel Gustman
Abstrakt CZ: Článek diskutuje pokrok dosažený během jednoročního úsilí s budováním českého systému rozpoznávání souvislé spontánní řeči v projektu MALACH. Obtíže s řešením tohoto projektu vyplývají z vysoké flektivnosti českého jazyka a množství hovorových slov přítomných ve spontánní české řeči.
Abstrakt EN: Our paper discusses the progress achieved during one-year effort with building the Czech LVCSR system for an automatic transcription of spontaneously pronounced testimonies in the MALACH project. The difficulty of this task stems from the highly inflectional nature of the Czech language and is further multiplied by the presence of many colloquial words in spontaneous Czech speech and also by the need to handle emotional speech filled with disfluencies, heavy accents, age-related coarticulation and language switching. In this paper we concetrate mainly on the acoustic issues - the proper choice of the front-end parameterization, handling the non-speech events in acoustic modeling and especially the unsupervised usage of the MLLR adaptation technique. A method for selecting suitable language model data is also briefly mentioned.
Klíčová slova

Zpět

Patička