Přejít k obsahu


Influence of word normalization on text classification

Citace: [] TOMAN, M., TESAŘ, R., JEŽEK, K. Influence of word normalization on text classification. In Current research in information sciences and technologies. Multidisciplinary approaches to global information systems. Vol. II. Badajoz: Instituto Abierto del Conocimiento, 2006. s. 354-358. ISBN: 84-611-3105-3
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Influence of word normalization on text classification
Rok vydání: 2006
Místo konání: Badajoz
Název zdroje: Instituto Abierto del Conocimiento
Autoři: Michal Toman , Roman Tesař , Karel Ježek
Abstrakt CZ: V této práci se zaměřujeme na porovnání různých metod lemmatizace a stemmingu. Predzentujeme také výsledky získané naší metodou založenou na využití tezauru EWN. Součástí práce je porovnání s ostatními metodami.
Abstrakt EN: In this paper we focus our attention on the somparison of various lemmatization and stemming algorithms. We present promising results obtained by our EWN-based lemmatization approach in comparison to other techniques.
Klíčová slova

Zpět

Patička