说明:本博客与微信公众号《林墨》同步更新,所有内容均为原创,可授权转载。请扫码关注《林墨》公众号。
谷歌遴选的图情经典论文具有哪些特征,清华大学杨超、李思敏与黄萃一一为你解读。
杨超 李思敏 黄萃 / 清华大学
注:图片中的 10 篇论文是由谷歌学术按照被引次数筛选的图书情报学领域 TOP10 论文
不知你是否想得起自己十年前发表的文章?如果自己都遗忘了,别人是否会记得呢?学术界确实有一些文章,随着时间的发展,不但不会沉寂,反而逐渐成为经典。今年 6 月, Google Scholar 从 2006 年发表的论文中,按照被引用频次,评选出各领域的经典论文。我们从中摘录了社会科学( Social Science )领域下图书馆与信息科学 (Library & Information Science) 学科的 10 篇被引次数最高的论文,希望对读者有所启发。
从主题角度来看,有四篇文章(文章 3 、 5 、 6 、 8 )的研究都与 h 因子( h-index )有关;两篇文章(文章 4 、 9 )涉及开放存取( open access )研究;排名第一的文章 1 主要研究协作标签( collaborative tagging systems )的使用;其他三篇文章分别讲述文献计量软件 citespace 的具体应用(文章 2 )、网络信息的作者识别( authorship identification )问题(文章 7 )期刊影响因子( Impact Factor )的新计算方法。
从文献所在期刊角度来看,发表在科学计量权威杂志 Scientometrics 上的文章多达 5 篇,占据了一半; Journal of the American Society forInformation Science and Technology (现更名为 Journal of theAssociation for Information Science and Technology ,简称均为 JASIST )有 2 篇;其他期刊各一篇。值得注意的是,文章 “Ten-yearcross-disciplinary comparison of the growth of open access and how it increasesresearch citation impact” 来自开放存取数据库 arXiv ,而文章本身也讲 open access ,可称得上论据充足。
进一步的,我们对文章参考文献进行了分析,被引频次较高的期刊分别为 Nature 、 Scientometrics 、 PNAS 、 JASIST 、 Information Processing & Management ,有趣的是,在期刊共被引网络(期刊引用构成的网络)中, Scientometrics 作为被引较高的期刊,其中介中心性较高,这表明,它是联系不同期刊的桥梁。
通过分析文章所引用的学者,发现被引频次较高的作者为 Hirsch JE 、 Ball P 、 Braun T 、 Batista PD 、 Garfiel DE 、 Moed HF 等,这些作者的研究多涉及 open access 和文献计量指标,如 Hirsch JE 设计了 h-index 指标。
这些文章为何能够历久弥新,十年之后仍获较大关注呢?这主要在于它们的 “ 工具性 ” ,即其研究内容为其他研究提供了基础工具、规划了解决方案的框架。例如,排名第一的 “Usage patterns ofcollaborative tagging systems” ,该文主要介绍协作标签( Collaborativetagging )在知识共享过程中的应用和特征。文章不但详细介绍了协作标签系统的结构及其动态特征,而且提出了协作标签动态模型,为后来研究打下了基础。再例如,排名第二的 “CiteSpace II:Detecting and visualizing emerging trends and transient patterns in scientificliterature”,本身就是一个对软件 citespace 使用的经典案例,其他研究者可依据该案例指导自己的可视化分析流程。
最后,我们将十篇文章的摘要翻译附于文末,以供感兴趣的读者查看。
附录 —— 图情高被引论文摘要选译
1. Usage Pattern of Collaborative Tagging Systems
协作标签使得用户可以用标注关键字的形式将元数据添加到共享内容之中。最近,协作标签在网络上越来越流行,它允许用户标记书签,照片和其他网站内容。本文分析了协作标签系统的结构及其动态特征。本文还提出了一个协作标签动态模型,该模型可以预测标签稳定模式,并将它们与共享知识联系起来。
2. CiteSpace II Detecting and visualizing emerging trendsandtransient patterns in scientific literature
本文介绍了如何在科学文献中识别和可视化新兴主题发展趋势和动态发展模式,并描述了相关研究的最新发展。本研究为知识领域可视化作出了重要的理论和方法贡献。一个特征被概念化和可视化了,以表征 “ 研究前沿 ” 和 “ 知识基础 ” 之间的时变二元性。研究前沿被定义为一组新出现的概念和潜在研究问题。研究前沿的知识基础被定义为科学文献的引用和共引轨迹,即由被引用科学文献构成的演化网络。
3. Theory and practise of the g-index
g-index 是对 h-index 的改进,用以测度一个论文集合的引用表现。如果这个文章集合按照被引次数降序排列,则 g-index 是其中最大的数字,使得前 g 篇文章至少被引用 g^2 次。本文以普赖斯奖获得者为研究对象(职业生涯: 1972- 目前),计算其 g-index ,并将其与 h-index 进行比较。结果表明 g-index 继承了 h-index 的良好特性,而且, g-index 更好地考虑了顶级文章的引用分数,这可以更好地区分科学家的学术成就。
4. Citation advantage of open access articles
开放获取( OA )是否能加快我们对研究结果的识别和传播,是有争议的。本文是针对 2004 年 6 月 8 日至 2004 年 12 月 20 日在 PNAS 上发表的 OA 和非 OA 文章的纵向文献计量分析。本文一共分析了 OA 文献 212 篇(占全部文献的 14.2 %),非 OA 文献 1,280 篇(占 85.8 %)。在期刊网站上直接发表的 OA 文章比自我归档或其他可公开访问的 OA 文章(未在学术期刊上发表)具有更高的影响力。强有力的证据表明,即使在图书馆广泛使用的杂志上, OA 文章也比同期刊物上发表的非 OA 文章更能被同行认可和引用。
5. Comparison of the Hirsch-index with standardbibliometric indicators and with peer judgment for 147 chemistry researchgroups
本文指出了 h 指数和几个标准文献计量指标之间的统计相关性特征,以及 h 指数与同行评议结果的相关性特征。我们利用荷兰 147 所大学化学研究小组进行了大量评估研究,涵盖了 1991- 2000 年期间约 700 名高级研究人员的工作。结果表明, h 指数和常用文献计量指标都与同行评议结果相符。但是对于拥有较少引用量的小研究团体,常用文献计量指标似乎更适合用于评价研究产出。
6. A Hirsch-type index for journals
本文提出了一个面向期刊的 h 型指数(与评价作者的 h-index 相似),即:如果目标期刊已经发表了 h 篇论文,且每篇论文至少有 h 个被引,那么该期刊的 h 指数是数值 “h” 。这对期刊影响因子是一个有益的补充。
7. A framework for authorship identification of onlinemessages Writing ‐ style features andclassification techniques
随着互联网技术和应用的迅速普及,不当甚至非法的网络信息滥用已成为社会的关注点。在线消息的 “ 匿名 ” 性质使身份追踪成为一个难题。我们开发了一个用于识别网络信息作者身份的识别框架,以解决身份追踪问题。在这个框架中,我们识别并提取四种写作风格特征(词汇,句法,结构和内容),并使用归纳学习算法构建基于特征的分类模型来识别在线消息的作者。以英文和中文在线新闻组消息为数据源的实验结果表明,本文提出的方法能够识别在线消息的作者,准确度为 70 %至 95 %。
8. Is it possible to compare researchers with differentscientific interests
一名科研人员的 h 指数是指他至多有 h 篇论文分别被引用了至少 h 次,该指数常被用来评价个体学者的科研产出。这个指标在很多方面都具有鲁棒性,但也受研究领域影响。本文提出了一个改善的指数 h_I=h⁄ 〈 N_a 〉 =h^2⁄(N_a^((T) ) ) ,其中 N_a^((T) ) 是所考虑的 h 篇论文中作者的总数。 一个研究者如果具有指数 h_I ,那么表明他拥有 h_I 篇论文分别被引用了至少 h_I 次(间接展示了他 / 她独自发表论文的能力)。我们获得了四个巴西科学团体的 h 和 h_I 排名。与 h 指数相反, h_I 指数图塌陷成一条单一的曲线,允许对不同领域的学者进行比较。
9. Ten-year cross-disciplinary comparison of the growthof open access and how it increases research citation impact
Lawrence2001 年发现,在计算机科学领域,网络上可公开访问的文章( OA 文章)比那些非 OA 文章获得了更多的被引量。我们在物理学领域发现了同样的情况。为了进一步检验该特性的跨学科一般性,我们使用 10 个学科(生物,心理学,社会学,卫生,政治学,经济学,教育,法律,商业,管理)在 12 年间( 1992-2003 )发表的 1,307,038 篇文章进行了验证。在同一期刊中, OA 和非 OA 文章比较, OA 文章同样被更多引用,被引优势依据学科和年度的不同,在 36 % -172 %间浮动。我们未能从这些数据中发现明显的因果关系,但是根据我们以前在物理学领域的发现, OA 文章的被引优势不太可能是因为作者的选择偏好。
10. Journal status
一个演员的社会地位通常由两个因素决定:该演员( A )从其他演员( Bs )获得的认可的数量,以及演员 Bs 的知名度。这两个因素反映了演员具有人气( popularity )和被专家欣赏之间的区别。 ISI 影响因子( ISIIF )被定义为:杂志在两年内收到的平均被引次数。因此 IF 是一个评价流行性的指标,而未考虑引用者的威望。本文展示了如何使用 “ 加权 PageRank” 算法对期刊进行全面的度量(考虑流行性和威望)。我们比较了这两种方法( IF 和加权 PageRank )下的期刊排名,并对两个分析结果的异同点进行了分析。此外,我们还引入了 Y 因子(它是 IF 和加权 PageRank 的简单组合),并发现由此产生的期刊排名与人们心中的期刊排名认知基本一致。
转载本文请联系原作者获取授权,同时请注明本文来自李江科学网博客。 链接地址: http://blog.sciencenet.cn/blog-1792012-1068995.html