Přejít k obsahu


Latent Semantics in Named Entity Recognition

Citace:
KONKOL, M., BRYCHCÍN, T., KONOPÍK, M. Latent Semantics in Named Entity Recognition. Expert Systems with Applications, 2015, roč. 42, č. 7, s. 3470-3479. ISSN: 0957-4174
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Latent Semantics in Named Entity Recognition
Rok vydání: 2015
Autoři: Ing. Michal Konkol , Ing. Tomáš Brychcín , Ing. Miloslav Konopík Ph.D. ,
Abstrakt CZ: V tomto článku jsme navrhli nové příznaky pro rozpoznávání pojmenovaných entit (NER) založené na skryté sémantice. Dále zkoumáme vliv morphologické informace získané bez supervize na tyto příznaky a NER systém jako celek. Nově vytvořený NER systém je plně jazykově nezávislý, jelikož navržené příznaky lze získat bez supervize. Systém jsme ověřili na angličtině, španělštině, holandštině a češtině a porovnali výsledky v závislosti na flexi daného jazyka. Náš systém dosahuje stejných nebo lepších výsledků než současné jazykově závislé systémy. Navržené příznaky se ukázaly jako velmi užitečné a jsou důvodem našich slibných výsledků.
Abstrakt EN: In this paper, we propose new features for Named Entity Recognition (NER) based on latent semantics. Furthermore, we explore the effect of unsupervised morphological information on these methods and on the NER system in general. The newly created NER system is fully language-independent thanks to the unsupervised nature of the proposed features. We evaluate the system on English, Spanish, Dutch and Czech corpora and study the difference between weakly and highly inflectional languages. Our system achieves the same or even better results than state-of-the-art language dependent systems. The proposed features proved to be very useful and are the main reason of our promising results.
Klíčová slova

Zpět

Patička