Přejít k obsahu


Automatic transcription of audio archives for spoken document retrieval

Citace: [] IRCING, P., PSUTKA, J., RADOVÁ, V. Automatic transcription of audio archives for spoken document retrieval. In Proceedings of the second IASTED international conference on Computational intelligence. Anaheim: ACTA Press, 2006. s. 448-452. ISBN: 0-88986-602-3
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Automatic transcription of audio archives for spoken document retrieval
Rok vydání: 2006
Místo konání: Anaheim
Název zdroje: ACTA Press
Autoři: Pavel Ircing , Josef Psutka , Vlasta Radová
Abstrakt CZ: Článek představuje systém pro automatický přepis spontánní mluvené češtiny pro účely vyhledávání informací. Zaměřuje se hlavně na techniky jazykového modelování, které zlepšují rozpoznávání slov náležejících do kategorií důležitých pro vyhledávání - tzv. pojmenovaných entit. S použitím speciálně navrženého třídového jazykového modelu založeného na morfologických značkách se nám podařilo úspěšnost rozpoznávání těchto slov skutečně zlepšit.
Abstrakt EN: The paper presents a system for automatic transcription of spontaneous Czech speech for the spoken document retrieval purposes. It focuses mainly on the language modeling technique that improves the recognition of words belonging to categories which proved to be important for the information retrieval purposes - the named entities. Using a specially designed class language model based on the morphological tags, we have managed to boost the transcription accuracy of the named entities.
Klíčová slova

Zpět

Patička