Přejít k obsahu


Network-based statistical comparison of citation topology of bibliographic databases

Citace:
ŠUBELJ, L., FIALA, D., BAJEC, M. Network-based statistical comparison of citation topology of bibliographic databases. Scientifc Reports, 2014, roč. 4, č. 6496, s. 1-10. ISSN: 2045-2322
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Network-based statistical comparison of citation topology of bibliographic databases
Rok vydání: 2014
Autoři: Lovro Šubelj , Doc. Ing. Dalibor Fiala Ph.D. , Marko Bajec
Abstrakt CZ: Moderní bibliografické databáze poskytují základnu pro vědecký výzkum a jeho hodnocení. I když se jejich obsah a struktura značně odlišují, o jejich spolehlivosti existují pouze neformální doklady. V tomto článku porovnáváme topologickou konsistenci citačních sítí získaných ze šesti populárních bibliografických databází včetně Web of Science, CiteSeeru a arXiv.org. Sítě jsou ohodnoceny bohatou sadou lokálních a globálních grafových statistik. Nejprve odhalíme statisticky významné nekonsistence mezi některými databázemi s ohledem na jednotlivé statistiky. Například zavedená „motýlková! dekompozice databáze DBLP se značně odlišuje od ostatních kvůli jejímu obsahu a citační informace v databázi arXiv.org jsou nejrozsáhlejší ze všech. Na závěr porovnáme všechny databáze několika grafovými statistikami s využitím diagramu kritických rozdílů. Citační topologie DBLP je nejméně konsistentní se všemi ostatními, zatímco Web of Science je (bez velkého překvapení) významně spolehlivější z hlediska konsistence. Tato práce může sloužit jako reference vědcům v oboru bibliometrie a scientometrie nebo vládním a výzkumným agenturám jako vodítko při hodnocení výzkumu.
Abstrakt EN: Modern bibliographic databases provide the basis for scientific research and its evaluation. While their content and structure differ substantially, there exist only informal notions on their reliability. Here we compare the topological consistency of citation networks extracted from six popular bibliographic databases including Web of Science, CiteSeer and arXiv.org. The networks are assessed through a rich set of local and global graph statistics. We first reveal statistically significant inconsistencies between some of the databases with respect to individual statistics. For example, the introduced field bow-tie decomposition of DBLP Computer Science Bibliography substantially differs from the rest due to the coverage of the database, while the citation information within arXiv.org is the most exhaustive. Finally, we compare the databases over multiple graph statistics using the critical difference diagram. The citation topology of DBLP Computer Science Bibliography is the least consistent with the rest, while, not surprisingly, Web of Science is significantly more reliable from the perspective of consistency. This work can serve either as a reference for scholars in bibliometrics and scientometrics or a scientific evaluation guideline for governments and research agencies.
Klíčová slova

Zpět

Patička