Přejít k obsahu


Contrastive Summarization: Comparing Opinions of Czech Senators

Citace:
CAMPR, M., JEŽEK, K. Contrastive Summarization: Comparing Opinions of Czech Senators. Journal of Theoretical and Applied Information Technology, 2015, roč. 77, č. 1, s. 62-68. ISSN: 1992-8645
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Contrastive Summarization: Comparing Opinions of Czech Senators
Rok vydání: 2015
Autoři: Ing. Michal Campr , Prof. Ing. Karel Ježek CSc.
Abstrakt CZ: V tomto článku prezentujeme nový přístup ke kontrastivní sumarizaci, tzn. ke speciálnímu typu sumarizace, který má za cíl porovnat dva dokumenty (nebo skupiny dokumentů) na sémantické a zároveň názorové úrovni. Výstupem kontrastivní sumarizace je pár souhrnů, které zachycují témata o nichž se často diskutuje s největším rozdílem v názorech autorů. Zkoumáme zde možnosti kombinování latentní sémantické informace s informací o názorech autorů. Nejprve popisujeme relevantní články, které dokazují, že tento problém lze řešit mnoha různými způsoby. Poté popisujeme svůj vlastní algoritmus na bázi Latentní Sémantické Analýzy, který počítá ohodnocení částí originálních textů a na jejich základě vybírá ty nejlepší do výsledných souhrnů. Nakonec prezentujeme vyhodnocení našeho algoritmu použitím promluv z českého senátu.
Abstrakt EN: In this paper, we present a novel approach to contrastive summarization, i.e. a specific type of summarization, which aims to compare two documents (or groups of documents) on semantic and also sentiment level. The final output of contrastive summarization is a pair of summaries, depicting what topics are most often discussed with the largest difference in opinions of the authors. We explore the possibilities of combining the latent semantic information with the information about the opinions of the authors. First, we describe related works, which show, that this problem can be approached from many different directions. Next, we present our own algorithm, based on Latent Semantic Analysis, which computes scores for excerpts of the original text and based on these, it chooses best excerpts that should be included into the final summaries. Finally, we present the evaluation of our algorithm, using speeches from Czech senate.
Klíčová slova

Zpět

Patička