Přejít k obsahu


Vliv normalizace slov na klasifikaci textů

Citace: [] TOMAN, M., TESAŘ, R., JEŽEK, K. Vliv normalizace slov na klasifikaci textů . In Znalosti 2007. Ostrava: VŠB - Technická univerzita , 2007. s. 360-363. ISBN: 978-80-248-1279-3
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: cze
Anglický název: Impact of Word Normalization on Text Classification
Rok vydání: 2007
Místo konání: Ostrava
Název zdroje: VŠB - Technická univerzita
Autoři: Michal Toman , Roman Tesař , Karel Ježek
Abstrakt CZ: Příspěvek porovnává vliv různých normalizačních metod na klasifikační úlohu. Část článku je věnována popisu naší lemmatizační metody založené na použití tezauru EWN.
Abstrakt EN: In this pqper we focus our attention on the comparison of various lemmatization and stemming algorithms, which are often used in natural language processing (NLP). We present a novel lemmatization algorithm that utilizes the multilingual thesaurus Eurowordnet (EWN).
Klíčová slova

Zpět

Patička