Přejít k obsahu


Automatic tagging based on Linked Data

Citace: [] DOSTAL, M., JEŽEK, K. Automatic tagging based on Linked Data. In SOCA´10. New York: IEEE, 2010. s. 105-108. ISBN: 978-1-4244-9801-7
Druh: STAŤ VE SBORNÍKU
Jazyk publikace: eng
Anglický název: Automatic tagging based on Linked Data
Rok vydání: 2010
Místo konání: New York
Název zdroje: IEEE
Autoři: Ing. Martin Dostal , Doc. Ing. Karel Ježek CSc.
Abstrakt CZ: V rámci tohoto příspěvku bychom chtěli prezentovat systém pro sběr oznámeních typu Call for papers. Náš webový robot získává CFP oznámení z webových stránek, nebo zvoleného emailu. Většina důležitých informací je automaticky extrahována a publikována na speciální webové stránce v uživatelsky i strojově čitelné podobě. Jeden z nejdůležitějších problémů je klasifikace, kategorizace a clustrování. V tomto článku popisujeme nesupervizované metody pro automatické štítkování založené na extrakci informací z Linked data. Tyto metody jsou použitelné v případě, kdy nemáme k dispozici žádný korpus pro učící se metody. Štítkovaná data mohou mít podobu krátkých zpráv z RSS, krátkých příspěvků na blogu, nebo emailů. Automatické štítkování může být použito např. i pro klasifikaci konferencí. Uživatelé mohou použít naší webovou službu k vyhledávání zajímavých událostí a mohou je řadit dle vlastních preferencí. Štítky z Linked data jsou získávány včetně jejich vztahů, což lze využít pro automatické clustrování nashromážděných událostí.
Abstrakt EN: We have created a web agent for collecting Call for Papers (CFP) announcements. Our web agent obtains CFP announcements from websites or from mailbox. The most important information is extracted and published on our own special website in a user and machine readable way. One of the most important problems is event classification, categorization and clustering. In this paper we describe unsupervised methods for automatic tagging based on information extraction from Linked data. These methods are usable in situations where we have to tag unknown data and we have no corpus for learning methods. Tagged data can have the form of short messages from RSS, short blog posts or emails. The automatic tags can be used for classifying the conferences. Users can use our web service to search for interesting events and sort them by their own preferences. We obtain tags with their relationship parameters and we can use them for automatic clustering of collected events.
Klíčová slova

Zpět

Patička