Přejít k obsahu


Time-aware pageRank for bibliographic networks

Citace: [] FIALA, D. Time-aware pageRank for bibliographic networks. Journal of Informetrics, 2012, roč. 6, č. 3, s. 370-388. ISSN: 1751-1577
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Time-aware pageRank for bibliographic networks
Rok vydání: 2012
Autoři: Ing. Dalibor Fiala Ph.D. ,
Abstrakt CZ: V minulosti se rekurzivní algoritmy typu PageRank, který byl původně vymyšlen pro web, s úspěchem použily k řazení uzlů v citačních sítích článků, autorů nebo časopisů. Ukázalo se, že na rozdíl od počtu citací určují prestiž a ne popularitu. Ale oproti webu mají citační sítě některé zvláštní vlastnosti, které umožňují dávat citacím různou váhu a tedy vkládat do procesu hledání prominence další informace. Například citace mezi dvěma autory může mít rozdílnou váhu v závislosti na tom, jestli a kdy spolu tito dva autoři spolupracovali, což je informace, kterou lze najít v grafu spolupráce. V této studii definujeme několik verzí PageRanku, které dávají citacím mezi autory různou váhu na základě informací z grafu spolupráce. Navíc klademe důraz na čas publikací a citací. Naše algoritmy jsme testovali na datech z databáze Web of Science pro články z informatických časopisů a určili jsme nejvýznamnější počítačové odborníky v období 1996-2005. Vedle korelační analýzy jsme také porovnali naše žebříčky se seznamy laureátů cen ACM A. M. Turing Award a ACM SIGMOD E. F. Codd Innovations Award a došli jsme k závěru, že nové metody zohledňující čas jsou lepší než standardní PageRank a jeho vážené varianty, které čas ignorují.
Abstrakt EN: In the past, recursive algorithms, such as PageRank originally conceived for the Web, have been successfully used to rank nodes in the citation networks of papers, authors, or journals. They have proved to determine prestige and not popularity, unlike citation counts. However, bibliographic networks, in contrast to the Web, have some specific features that enable the assigning of different weights to citations, thus adding more information to the process of finding prominence. For example, a citation between two authors may be weighed according to whether and when those two authors collaborated with each other, which is information that can be found in the co-authorship network. In this study, we define a couple of PageRank modifications that weigh citations between authors differently based on the information from the co-authorship graph. In addition, we put emphasis on the time of publications and citations. We test our algorithms on the Web of Science data of computer science journal articles and determine the most prominent computer scientists in the 10-year period of 1996?2005. Besides a correlation analysis, we also compare our rankings to the lists of ACM A. M. Turing Award and ACM SIGMOD E. F. Codd Innovations Award winners and find the new time-aware methods to outperform standard PageRank and its time-unaware weighted variants.
Klíčová slova

Zpět

Patička