Přejít k obsahu


Kategorizace textů metodou NBCI

Citace: [] KUČERA, M., JEŽEK, K., HYNEK, J. Kategorizace textů metodou NBCI. In Znalosti 2003. Ostrava : VŠB-Technická univerzita , 2003. s. 33-42. ISBN: 8024802295
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: cze
Anglický název: Text categorization using NBCI method
Rok vydání: 2003
Místo konání: Ostrava
Název zdroje: VŠB-Technická univerzita
Autoři: Martin Kučera , Karel Ježek , Jiří Hynek
Abstrakt CZ: Příspěvek uvádí novou metodu pracujícína principu induktivního strojového učení, jež je kombinací naivní Bayesovy metody a metody Itemsets. Stručně ji lze popsat buďto jako metodu Itemsets používající ke klasifikaci naivní Bayesův klasifikátor, nebo jako naivní Bayesův klasifikátor využívající aproximace vlastních dokumentů častými množinami položek. Implementace této nové robustní metody je poměrně nenáročná. Metoda byla testována na kolekci Reuters-21578. V článku jsou prezentovány výsledky dokladující kvality nové metody.
Abstrakt EN: Research in methods of text categorization and retrieval in digital libraries represents a challenging task. This conference paper introduces a new method based on the principles of inductive machine learning, combining the Naive Bayes classifier and our original Itemsets classification method. We can describe it briefly either as the Itemsets method utilizing Naive Bayes classifier, or as the Naive Bayes Methodapproximating documetns by frequent itemsets. This new and robust method is relatively easy to implement. We have tested the method on Reuters-21578 document collection. Results presented in the paper demonstrate quality of the method being proposed.
Klíčová slova

Zpět

Patička