Přejít k obsahu


Efficient Combination of N-gram Language Models and Recognition Grammars in Real-Time LVCSR Decoder

Citace:
PRAŽÁK, A., IRCING, P., ŠVEC, J., PSUTKA, J. Efficient Combination of N-gram Language Models and Recognition Grammars in Real-Time LVCSR Decoder. In 9th International Conference on Signal Processing Proceedings. Beijing: IEEE, 2008. s. 587-591. ISBN: 978-1-4244-2178-7
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Efficient Combination of N-gram Language Models and Recognition Grammars in Real-Time LVCSR Decoder
Rok vydání: 2008
Místo konání: Beijing
Název zdroje: IEEE
Autoři: Aleš Pražák , Pavel Ircing , Jan Švec , Josef Psutka
Abstrakt CZ: Článek prezentuje metodu pro začlenění regulárních gramatik do n-gramových jazykových modelů. Navržený kombinovaný model využívá oba přístupy k jazykovému modelování - gramatika poskytuje robustní odhady pravděpodobnosti pro dobře definované fráze s pevnou strukturou, zatímco n-gram lépe pokrývá běžnou řeč. Gramatika navíc umožňuje přidávání nových slov do modelu s využitím existující strukturální (kontextové) informace. Navržená metoda pro začlenění gramatiky umožňuje použít kombinované modely v našem vlastním real-time dekodéru, který pracuje pouze se standardními n-gramovými jazykovými modely. Přínos kombinovaného modelu byl testován na diktovací úloze, do které byla navržena jednoduchá gramatika pro reprezentaci datumů. Dosaženo bylo statisticky významného zlepšení WER.
Abstrakt EN: The paper presents a method for incorporation of regular grammars into n-gram language models. Such composite model then benefits from both language modeling formalisms - a grammar yields robust probability estimates for well-defined phrases with fixed structure whereas the n-gram provides better coverage of casual speech. Moreover, the grammar allows adding new words to the phrase pattern while taking advantage of the existing structural (context) information. The proposed method for grammar incorporation allows the use of combined models in our in-house real-time decoder which is designed to work only with standard n-gram language model. The performance of the combined model was tested in the dictation task where a simple grammar was designed for date entries. A statistically significant improvement of WER was achieved.
Klíčová slova

Zpět

Patička