Přejít k obsahu


Digging Language Model – Maximum Entropy Phrase Extraction

Citace:
KANIS, J. Digging Language Model – Maximum Entropy Phrase Extraction. In Text, Speech, and Dialogue 19th International Conference, TSD 2016, Brno , Czech Republic, September 12-16, 2016, Proceedings. Heidelberg: Springer, 2016. s. 46-53. ISBN: 978-3-319-45509-9 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Digging Language Model – Maximum Entropy Phrase Extraction
Rok vydání: 2016
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Jakub Kanis Ph.D. ,
Abstrakt CZ: Tato práce představuje vlastní metodu pro extrakci frází založenou na modelu maximální entropie pro úlohu překladu z češtiny do angličtiny. Dva různé korpusy a dva jazykové modely rozdílné velikosti byly použity k prozkoumání potenciálu této nové metody pro extrakci frází a z toho plynoucí optimalizace obsahu frázové tabulky. Dále byla také porovnána dvě rozdílná estimační kritéria modelu maximální entropie se stávající metodou pro extrakci frází. V případě doménově orientovaného překladu extrakce frází založená na modelu maximální entropie významně zlepšuje přesnost překladu.
Abstrakt EN: This work introduces our maximum entropy phrase extraction method for the Czech – English translation task. Two different corpora and language models of the different sizes were used to explore a potential of the maximum entropy phrase extraction method and phrase table content optimization. Additionally, two different maximum entropy estimation criteria were compared with the state of the art phrase extraction method too. In the case of a domain oriented translation, maximum entropy phrase extraction significantly improves translation precision.
Klíčová slova

Zpět

Patička