Přejít k obsahu


Word-Semantic Lattices for Spoken Language Understanding

Citace:
ŠVEC, J., ŠMÍDL, L., VALENTA, T., CHÝLEK, A., IRCING, P. Word-Semantic Lattices for Spoken Language Understanding. In Proceedings - ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing. New York: IEEE, 2015. s. 5266-5270. ISBN: 978-1-4673-6997-8 , ISSN: 1520-6149
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Word-Semantic Lattices for Spoken Language Understanding
Rok vydání: 2015
Místo konání: New York
Název zdroje: IEEE
Autoři: Ing. Jan Švec Ph.D. , Ing. Luboš Šmídl Ph.D. , Ing. Tomáš Valenta , Ing. Adam Chýlek , Ing. Pavel Ircing Ph.D. ,
Abstrakt CZ: Publikace přestavuje konverzi slovní mřížky do slovně sémantické mřížky, které současně obsahuje sémantickou entitu. Slovní mřížka je výstupem automatického rozpoznávání mluvené řeči a jsou v ní obsaženy alternativní hypotézy. Pro převod do slovně sémantické mřížky jsou využity gramatiky definované expertem, které popisují jednotlivé sémantické entity. Slovně sémantické mřížky jsou následně vstupem modulu porozumění mluvené řeči a přispívají k vyšší úspěšnosti detekci sémantických konceptů.
Abstrakt EN: The paper presents a method for converting word-based automatic speech recognition (ASR) lattices into word-semantic (W-SE) lattices that contain original words together with a partial semantic information ? so-called semantic entities. Semantic entity detection algorithm generates semantic entities based on the expert-defined knowledge. The generated W-SE lattices have smaller vocabulary and consequently reduce the sparsity of the training data. The format of the W-SE lattices also naturally preserves the inherent uncertainty of the ASR output that can be exploited in subsequent dialog modules. The presented technique employs the framework of weighted finite state transducers which allows for efficient optimization of word-semantic lattices. We have evaluated the method in two different spoken language understanding tasks and obtained more than 10% reduction of concept error rate in comparison with using 1-best word hypothesis in both of those tasks.
Klíčová slova

Zpět

Patička