Přejít k obsahu


Linked Data and pageRank based classification

Citace: NYKL, M., JEŽEK, K., DOSTAL, M., FIALA, D. Linked Data and pageRank based classification. In Proceedings of the IADIS International conference Theory and Practice in Modern Computing 2013. Praha: IADIS Press, 2013. s. 61-64. ISBN: 978-972-8939-94-6
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Linked Data and pageRank based classification
Rok vydání: 2013
Místo konání: Praha
Název zdroje: IADIS Press
Autoři: Ing. Michal Nykl , Prof. Ing. Karel Ježek CSc. , Ing. Martin Dostal , Ing. Dalibor Fiala Ph.D.
Abstrakt CZ: V tomto článku bychom rádi představili nový přístup ke klasifikaci s využitím Linked Data a PageRank. Náš výzkum se soustředí na klasifikační metody, které jsou rozšířeny o sémantické informace. Sémantické informace lze získat z ontologie nebo z Linked Data. V našem případě byla použita DBPedia jako zdroj Linked Data. Metoda volby vlastnosti vychází ze sémantických informací, takže vlastnost může být rozpoznána neprofesionálním uživatelem, protože je v čitelné a srozumitelné formě. PageRank je používán ve fázi výběru vlastnosti a ve fázi klasifikace pro rozšíření základních vlastností na více obecné vlastnosti. To znamená, že volba vlastnosti a zpracování PageRankem jsou založeny na síti vztahů získaných z Linked Data. Nalezené vlastnosti lze použít standardními klasifikačními algoritmy. My prezentujeme slibné předběžné výsledky, které ukazují snadnou použitelnost tohoto přístupu v různých sadách dat.
Abstrakt EN: In this article, we would like to present new approach to classification with Linked Data and PageRank. Our research is focused on classification methods that are enhanced by semantic information. The semantic information can be obtained from ontology or from Linked Data. DBpedia was used as source of Linked Data in our case. Feature selection method is semantically based so features can be recognized by nonprofessional users because they are in a human readable and understandable form. PageRank is used during feature selection and generation phase for expansion of basic features into more general representatives. It means that feature selection and processing is based on a network relations obtained from Linked Data. The features can be used by standard classification algorithms. We will present the promising preliminary results that show the easy applicability of this approach to different datasets.
Klíčová slova

Zpět

Patička