Přejít k obsahu


Determining Compositionality of Word Expressions Using Vord Space Models

Citace: KRČMÁŘ, L., JEŽEK, K., PECINA, P. Determining Compositionality of Word Expressions Using Vord Space Models. In 9th Workhop on Multivord Expressions MWE 2013. Stroudsburg: ACL, 2013. s. 42-50. ISBN: 978-1-937284-47-3
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Determining Compositionality of Word Expressions Using Vord Space Models
Rok vydání: 2013
Místo konání: Stroudsburg
Název zdroje: ACL
Autoři: Ing. Lubomír Krčmář , Prof. Ing. Karel Ježek CSc. , Pavel Pecina
Abstrakt CZ: Tento výzkum se zaměřuje na určování sémantické kompozicionality slovních výrazů pomocí sémantických prostorů (WSMs). V práci analyzujeme předchozí výsledky využívající WSMs a prezentujeme rozdíly v navržených přístupech zahrnující různé typy WSMs, korpusy, předzpracování, techniky, metody pro určování kompozicionality a způsoby vyhodnocení. Také prezentujeme výsledky našeho vlastního přístupu pro určování sémantické kompozicionality, který je založen na porovnávání distribučních vektorů výrazů a jejich částí. Vektory byly získány pomocí Latentní sémantické analýzy (LSA) aplikované na ukWaC korpus. Naše výsledky překonávají výsledky všech účastníků sdílené úlohy Distributional Semantics and Compositionality (DISCO) 2011.
Abstrakt EN: This research focuses on determining semantic compositionality of word expressions using word space models (WSMs). We discuss previous works employing WSMs and present differences in the proposed approaches which include types of WSMs, corpora, preprocessing techniques, methods for determining compositionality, and evaluation testbeds. We also present results of our own approach for determining the semantic compositionality based on comparing distributional vectors of expressions and their components. The vectors were obtained by Latent Semantic Analysis (LSA) applied to the ukWaC corpus. Our results outperform those of all the participants in the Distributional Semantics and Compositionality (DISCO) 2011 shared task.
Klíčová slova

Zpět

Patička