Přejít k obsahu


Topic Models for Comparatie Summarization

Citace: CAMPR, M., JEŽEK, K. Topic Models for Comparatie Summarization. In TSD 2013. Heidelberg: Springer, 2013. s. 568-574. ISBN: 978-3-642-40584-6 , ISSN: 0302-9743
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Topic Models for Comparatie Summarization
Rok vydání: 2013
Místo konání: Heidelberg
Název zdroje: Springer
Autoři: Ing. Michal Campr , Prof. Ing. Karel Ježek CSc.
Abstrakt CZ: Tento článek si klade za cíl shrnout naší práci v oblasti komparativní sumarizace a prezentovat naše výsledky. Účelem komparativní sumarizace je analýza vstupních dokumentů a vytvoření souhrnů jejich nejdůležitějších rozdílů. Experimentovali jsme se dvěmi metodami - Latentní Sémantickou Analýzou a Latentní Dirichletovo Alokací - pro získání skrytých témat v dokumentech. Tato témata pak mohou být porovnána a tím pádem získáme jejich faktické rozdíly a můžeme podle toho vybrat nejdůležitější věty do výsledných souhrnů. Naše algoritmy jsou popsány ve druhé sekci a jejich vyhodnocení na datech z konference TAC 2011 pomocí nástroje ROUGE je v sekci 3.
Abstrakt EN: This paper aims to sum up our work in the area of comparative summarization and to present our results. The focus of comparative summarization is the analysis of input documents and the creation of summaries which depict the most significant differences in them. We experiment with two well known methods ? Latent Semantic Analysis and Latent Dirichlet Allocation ? to obtain the latent topics of documents. These topics can be compared and thus we can learn the main factual differences and select the most significant sentences into the output summaries. Our algorithms are briefly explained in section 2 and their evaluation on the TAC 2011 dataset with the ROUGE toolkit is then presented in section 3.
Klíčová slova

Zpět

Patička