Přejít k obsahu


System for fast lexical and phonetic spoken term detection in a Czech cultural heritage archive

Citace: [] PSUTKA, J., ŠVEC, J., PSUTKA JR., J., VANĚK, J., PRAŽÁK, A., ŠMÍDL, L., IRCING, P. System for fast lexical and phonetic spoken term detection in a Czech cultural heritage archive. EURASIP Journal on Audio, Speech and Music Processing, 2011, roč. 2011, č. 10, s. 1-19. ISSN: 1687-4714
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: System for fast lexical and phonetic spoken term detection in a Czech cultural heritage archive
Rok vydání: 2011
Autoři: Prof. Ing. Josef Psutka CSc. , Ing. Jan Švec , Ing. Mgr. Josef Psutka jr. Ph.D. , Ing. Jan Vaněk Ph.D. , Ing. Aleš Pražák Ph.D. , Ing. Luboš Šmídl Ph.D. , Ing. Pavel Ircing Ph.D.
Abstrakt CZ: Hlavním cílem práce představené v tomto článku bylo vyvinout kompletní systém, který by dosáhl cílů vytčených v rámci projektu MALACH. Těmito cíli bylo použít metody automatického rozpoznávání řeči a vyhledávání informací pro zpřístupnění rozsáhlého videoarchivu obsahujícího nafilmovaná svědectví lidí, kteří přežili Holokaust. Systém v současné době pracuje pouze nad částí archivu, v níž se hovoří česky. Hlavní výhodou systému je využití špičkových technik rozpoznávání řeči a jejich pečlivého propojení s vlastním vyhledáváním.
Abstrakt EN: The main objective of the work presented in this paper was to develop a complete system that would accomplish the original visions of the MALACH project. Those goals were to employ automatic speech recognition and information retrieval techniques to provide improved access to the large video archive containing recorded testimonies of the Holocaust survivors. The system has been so far developed for the Czech part of the archive only. It takes advantage of the state-of-the-art speech recognition system tailored to the challenging properties of the recordings in the archive (elderly speakers, spontaneous speech and emotionally loaded content) and its close coupling with the actual search engine.The design of the algorithm adopting the spoken term detection approach is focused on the speed of the retrieval. The resulting system is able to search through the 1,000 h of video constituting the Czech portion of the archive and find query word occurrences in the matter of seconds.
Klíčová slova

Zpět

Patička