Přejít k obsahu


Cluster labeling with linked data

Citace: DOSTAL, M., NYKL, M., JEŽEK, K. Cluster labeling with linked data. Journal of Theoretical and Applied Informatrion Technology, 2013, roč. 53, č. 3, s. 340-345. ISSN: 1992-8645
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Cluster labeling with linked data
Rok vydání: 2013
Autoři: Ing. Martin Dostal , Ing. Michal Nykl , Prof. Ing. Karel Ježek CSc.
Abstrakt CZ: V tomto článku bychom chtěli představit náš přístup pro pojmenování shluků s využitím Linked Data. Shlukování webových stránek do sémanticky podobných skupin slibuje zvýšení výkonnosti při prohledávání webu. V dnešní době pouze speciální sémantické vyhledávače umožňují shlukování výsledků vyhledávání. Ostatní nástroje umožňují pouze hrubé interní shlukování výsledků, které není viditelné uživateli z důvodu absence systému pro pojmenovávání shluků. Linked Data je množina pravidel pro publikaci výsledků ve strojově čitelné podobě s ohledem na propojení s dalšími webovými zdroji. Tento přístup umožňuje identifikovat vazby mezi daty a dotazování přes Internet. Obsažená témata jsou reprezentována jako zdroje z Linked Data a jsou použita pro dobře čitelné pojmenovávání shluků.
Abstrakt EN: In this article, we would like to introduce our approach to cluster labeling with Linked Data. Clustering web pages into semantically related groups promises better performance in searching the Web. Nowadays, only special semantic search engines provide clustering of results. Other engines are doubtful as far as the quality of clusters and moreover a dependable system for labeling these clusters is lacking. Linked Data is a set of principles for publishing structured data in a machine readable way with regards to linking with other Web resources. This enables data from different sources to be connected and queried over the Internet. The information from Linked Data can be used for preliminary estimates of topics covered by a set of documents. Topics are represented as resources from Linked Data and are used for smooth humanreadable labeling of clusters.
Klíčová slova

Zpět

Patička