Přejít k obsahu


Semantic Entity Detection From Multiple ASR Hypotheses Within The WFST Framework

Citace: ŠVEC, J., ŠMÍDL, L., IRCING, P. Semantic Entity Detection From Multiple ASR Hypotheses Within The WFST Framework. In IEEE 2013 Workshop on Automatic Speech Recognition and Understanding. Piscataway: IEEE Signal Processing Society, 2013. s. 84-89. ISBN: 978-1-4799-2756-2
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Semantic Entity Detection From Multiple ASR Hypotheses Within The WFST Framework
Rok vydání: 2013
Místo konání: Piscataway
Název zdroje: IEEE Signal Processing Society
Autoři: Ing. Jan Švec , Ing. Luboš Šmídl Ph.D. , Ing. Pavel Ircing Ph.D. ,
Abstrakt CZ: Článek prezentuje nový přístup k detekci sémantických entit z ASR mřížek. Navržená metoda detekuje nejen pojmenované entity, ale také přiděluje podrobný sémantický význam. Všechny algoritmyvyužívají operace automatů definované v rámci vážených konečných převodníků (WFST) - ASR mřížky jsou v dnešní době často reprezentovány jako vážené akceptory. Expertní znalosti o sémantice úlohy jsou vyjádřeny v podobě kontextové gramatiky, které je převedena do FST. Používáme WFST optimalizaci pro získání kompaktní reprezentace ASR mřížky. Rámec WFST také umožňuje použít confufion network jako další reprezentaci několika ASR hypotéz. Díky tomu je možné vyžít operace kompozice a optimalizace OpenGFST toolkitu.Součástí práce je experimentální vyhodnocení navrženého algoritmu a porovnání detekce pro nejlepší hypotézu, confusion network a optimalizovované slovní mřížky.
Abstrakt EN: The paper presents a novel approach to named entity detection from ASR lattices. Since the described method not only detects the named entities but also assigns a detailed semantic interpretation to them, we call our approach the semantic entity detection. All the algorithms are designed to use automata operations defined within the framework of weighted finite state transducers (WFST) the ASR lattices are nowadays frequently represented as weighted acceptors. The expert knowledge about the semantics of the task at hand can be first expressed in the form of a context free grammar and then converted to the FST form. We use a WFST optimization to obtain compact representation of the ASR lattice. The WFST framework also allows to use the word confusion networks as another representation of multiple ASR hypotheses. That way we can use the full power of composition and optimization operations implemented in the OpenFST toolkit for our semantic entity detection algorithm. The devised method also employs the concept of a factor automaton; this approach allows us to overcome the need for a filler model and consequently makes the method more general. The paper includes experimental evaluation of the proposed algorithm and compares the performance obtained by using the one-best word hypothesis, optimized lattices and word confusion networks.
Klíčová slova

Zpět

Patička