Přejít k obsahu


Adaptive language model in automatic online subtitling

Citace:
PRAŽÁK, A., PSUTKA, J., HOIDEKR, J., KANIS, J., MÜLLER, L., PSUTKA, J. Adaptive language model in automatic online subtitling. In Proceedings of the second IASTED international conference on Computational intelligence. Anaheim: ACTA Press, 2006. s. 479-483. ISBN: 0-88986-602-3
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Adaptive language model in automatic online subtitling
Rok vydání: 2006
Místo konání: Anaheim
Název zdroje: ACTA Press
Autoři: Aleš Pražák , Josef Psutka , Jan Hoidekr , Jakub Kanis , Luděk Müller , Josef Psutka
Abstrakt CZ: V článku je popsán adaptivní jazykový model pro rozpoznávací úlohy, ve kterých jsou osobní jména specifická pro každé rozpoznávání a musí být přidána do rozpoznávacího slovníku. Tvorba adaptivního jazykového modelu se slovními (jmennými) třídami je ilustrována na dvou rozdílných úlohách automatického titulkování: titulkování parlamentních zasedání(1,5 % jmen) a zápasů ledního hokeje (15 % jmen). Druhá část článku se zabývá systémem pro automatické online titulkování se slovníkem do 100000 slov v reálném čase. Rozpoznávací systém je založen na Skrytých Markovových modelech, lexikálních stromech a bigramovém jazykovém modelu. Závěrem jsou podány a diskutovány experimentální výsledky s a bez adaptivního jazykového modelu.
Abstrakt EN: This paper describes an adaptive language model for recognition tasks, where person names are specific for each recognition session and have to be added to the recognition vocabulary. Creation of an adaptive language model with word (name) classes is illustrated on two different tasks of automatic online subtitling: subtitling of parliament meetings (1.5 % of names) and ice-hockey matches (15 % of names). The second part outlines the system for automatic online subtitling with vocabulary up to 100 000 words in real-time. The recognition system is based on Hidden Markov Models, lexical trees and bigram language model. Finally, experimental results with and without the adaptive language model are reported and discussed.
Klíčová slova

Zpět

Patička