Přejít k obsahu


Mining citation information from CiteSeer data

Citace:
FIALA, D. Mining citation information from CiteSeer data. Scientometrics, 2011, roč. 86, č. 3, s. 553-562. ISSN: 0138-9130
Druh: ČLÁNEK
Jazyk publikace: eng
Anglický název: Mining citation information from CiteSeer data
Rok vydání: 2011
Místo konání: Berlin
Název zdroje: Springer
Autoři: Ing. Dalibor Fiala Ph.D.
Abstrakt CZ: Digitální knihovna CiteSeer je užitečným zdrojem bibliografických informací. Umožňuje vyhledávat citace, spoluautory, adresy a afiliace autorů a publikací. Přesto je poměrně zřídka využívána k automatickým citačním analýzám. Tento článek popisuje výsledky našeho rozsáhlého zkoumání dat ze CiteSeeru. Prozkoumali jsme citace mezi autory a sestavili žebříčky nejvlivnějších vědců různými evaluačními metodami včetně citací, uzlových stupňů grafu, HITSu, PageRanku a jeho variant založených na citačním grafu i grafu spolupráce. Výsledné žebříčky porovnáváme se seznamy držitelů ocenění udělovaných významným informatikům a zjišťujeme, že ocenění vědci jsou v žebříčcích téměř vždy umístěni vysoko. Docházíme k závěru, že CiteSeer je hodnotným, avšak ne zcela doceněným repozitářem citačních dat a že je vhodný pro testování nových bibliometrických metod.
Abstrakt EN: The CiteSeer digital library is a useful source of bibliographic information. It allows for retrieving citations, co-authorships, addresses, and affiliations of authors and publications. In spite of this, it has been relatively rarely used for automated citation analyses. This article describes our findings after extensively mining from the CiteSeer data. We explored citations between authors and determined rankings of influential scientists using various evaluation methods including citation and in-degree counts, HITS, PageRank, and its variations based on both the citation and collaboration graphs. We compare the resulting rankings with lists of computer science award winners and find out that award recipients are almost always ranked high. We conclude that CiteSeer is a valuable, yet not fully appreciated, repository of citation data and is appropriate for testing novel bibliometric methods.
Klíčová slova

Zpět

Patička