Přejít k obsahu


Phonetic Spoken Term Detection in Large Audio Archive Using the WFST Framework

Citace: VAVRUŠKA, J., ŠVEC, J., IRCING, P. Phonetic Spoken Term Detection in Large Audio Archive Using the WFST Framework. In Text, Speech, and Dialogue. Heidelberg: Springer, 2013. s. 402-409. ISBN: 978-3-642-40584-6 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Phonetic Spoken Term Detection in Large Audio Archive Using the WFST Framework
Rok vydání: 2013
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Jan Vavruška , Ing. Jan Švec , Ing. Pavel Ircing Ph.D. ,
Abstrakt CZ: Článek představuje metodu pro fonetické vyhledávání ve velkém řečovénm archivu. Navržená technika je vyvinuta v rámci notace konečných automatů a využívá poměrně nedávno vyvinutý postup - aplikaci tzv. faktorového automatu, který námi navržená metoda obohatila o normalizaci skóre a postup pro systematické rozšíření vstupních dotazů, které umožní kompenzovat běžně se vyskytující nedostatky ve výslovnosti. Výsledky experimentů, rovněž v článku zmíněné, ukazují, že námi vyvinutá metoda je efektivnější a rychlejší než metoda základní.
Abstrakt EN: The paper presents a technique for phonetic spoken term detection in large audio archive. It is designed within the framework of weighted finite-state transducers and utilizes the rather recently developed notion of factor automata, which we have enhanced with a score normalization and a technique for systematic query expansion which allows for phone deletions and substitutions and consequently compensates for frequent pronunciation imperfections and systematic phoneme interchanges occurring during the ASR decoding process. The experiments presented in the paper show that the new WFST-based method outperforms the baseline system both in terms of search performance and speed. Finally, the paper discusses the issues of the proposed techniques that need to be addressed before the application in real-life tasks.
Klíčová slova

Zpět

Patička