为什么期刊影响因子不适合评价科学家个人的学术成就？

虫子 · 发表于 2017-7-28 13:05

　　尽管近年遭受了诸多质疑，但影响因子仍然一直被广泛应用，并在各个层面的科研评价中产生深远影响。那么，为什么期刊影响因子不适合评价科学家个人成就？华北水利水电大学的张琳教授等学者在PloS ONE上最新发表的一篇论文从大规模实证数据的角度回答了以上问题。
　　张琳
　　/ 华北水利水电大学；步一
　　/ IndianaUniversity

　　注：图片来源于参考文献[1]中的论文（论文的被引频次指标与其所属期刊的影响因子之间的关系）
　　风口浪尖的影响因子
　　近年来，“讨伐”影响因子的民间呼声似乎越来越高。2016年7月5日，多名科学家和多家著名期刊（Science、EMBO、eLife）与出版社（PLoS和SpringNature）的主编及高管联合发文指出影响因子存在的理论问题并提出可能的替代方案。三天后，2016年7月8日，Nature就影响因子被滥用的问题对几位出版界和学术界精英进行采访，高调发表了评论文章：Beat it， impactfactor!Publishing elite turns against controversial metric，宣称要“打倒影响因子”。仅仅三天之后，2016年7月11日，美国微生物协会（ASM）表示不再在其旗下的所有杂志上公布影响因子信息，同时在旗下的9份杂志上发表了相关社论，并希望其它期刊在其网站也删掉影响因子信息。而2017年4月27日，Nature Research正式签署了著名的旧金山宣言（DORA），宣言建议：影响因子是评价期刊的指标，不应使用类似期刊影响因子这类的基于期刊的指标来直接衡量个体论文的质量和评价相关作者的贡献，更不应基于此做出雇用、晋升和基金资助的决定。
　　然而，处于风口浪尖的影响因子指标本身，究竟有何过错呢？让我们简单回顾一下影响因子的诞生过程。
　　1963年，SCI的创始人Garfield博士正式提出“期刊影响因子（Journal Impact Factor）”，将影响因子定义为某期刊前两年发表的论文在统计当年被引用总次数除以该期刊在前两年内发表的论文总数，即在统计当年的篇均被引频次。1975年，美国科学信息学习所 (ISI) 将影响因子作为SCI筛选核心期刊的定量指标。后来该指标被人们广泛用于评价科技期刊质量及其作者乃至科研机构学术水平的定量指标，是完全出乎Garfield博士本人意料的，也并非他设计此指标的初衷。
　　那么，为什么在众多的批判声和Garfield博士本人的公开声明之下，在世界各地的科研评价活动中，人们至今仍然喜欢甚至“坚持”用影响因子进行科研评价呢？其中主要原因有两点：第一，在理论上，人们通常假定，发表在特定期刊上的文章预期收获的引文数量与该期刊的影响因子，也就是篇均被引频次基本一致。第二，在现实中，评审专家通常都非常繁忙，很难逐一去阅读和鉴定申请人的论文成果。因此当有了影响因子这个评价指标，评审专家就可以节省宝贵的时间和精力，认为不需要阅读论文全文，甚至不需要计算论文本身的引文数量，直接根据所发表期刊的影响因子就可以判断论文质量。
　　三十年前的实证学习
　　事实上，人们对于影响因子的感情十分复杂，一方面热衷于激烈的批判影响因子，另一方面又不免追捧和使用影响因子。然而，无论是批判，还是滥用，绝大多数的探讨都停留在理论或假设层面。基于影响因子在科学家个人评价层面的大规模实证学习迄今还十分少见。在可以查到的文献中，最有影响的实证学习可能当属上世纪八十年代挪威生物医学家Seglen博士的学习成果。作为挪威最高产的生物医学家之一，Seglen博士和他领导的团队在1980年代曾被作为科研评估的对象。这项依据期刊影响因子作为主要评价指标的评估报告对Seglen博士所领导的团队和其他15个挪威国家级团队进行了排名。Seglen博士发现排名结果与实际情况大相径庭，由此他发现了基于期刊影响因子的评价方法存在诸多不合理之处，并发表了多篇论文探讨此问题。在『Why the impactfactor of journals should not be used forevaluating research』这篇论文中，Seglen批评了用期刊影响因子来衡量期刊上刊载论文的学术水准，以及进而评价作者个人学术成就的片面性。这篇论文不仅在学术界反响强烈（Google Scholar中被引2200余次），而且对于科学评价指标的使用和科学政策的制定等都产生了深远影响，该成果曾被Garfield博士本人及著名的旧金山宣言和莱顿宣言等多次引用。
　　三十年前的结论今天是否仍然成立？
　　Seglen博士的学习数据距今已有30年，而且是只包含16位作者，907篇论文的小样本分析。虽然该学习成果影响十分广泛，但是迄今为止，尚未有人验证Seglen博士的结论。
　　今年3月，张琳等学者在PLoS ONE期刊上发表了题为Science deserves to be judgedby its contents， not by itswrapping: Revisiting Seglen'swork on journal impactand research evaluation的论文，尝试在更大、更新、更全面的数据基础上，再现Seglen博士三十年前的学习，并提出了一些新的学习问题和政策思考。学习选取1992-2013年间，WoS收录挪威学者在生物医学领域发表29952篇论文为学习对象，在挪威科学部的Cristin系统里精确对应899位生物医学学者（包括每位学者的相关背景信息）。学习结果表明：
　　第一，论文的引文频次分布偏倚性极高，在绝大多数期刊中，20%左右的论文贡献了期刊50%以上的引文；50%的论文贡献了所在期刊80%以上的引文。
　　第二，论文的引文频次与期刊影响因子的整体相关性较弱。在各个期刊上都会存在高被引和低被引论文。很多高被引论文发表在低影响期刊上，而高影响期刊也刊发了大量的低被引论文。
　　第三，期刊影响因子受少数高被引论文的影响极大，单篇论文的被引频次接近期刊平均水平（期刊影响因子）的机会微乎其微。举例而言，著名综合期刊Nature在2015年的影响因子高达38.1，然而在2013-2014年Nature刊发的论文中，75%的论文在2015年的实际被引频次低于38.1。25%左右的高被引论文，特别是少量的极高被引论文，拉升了Nature期刊的篇均被引频次（即影响因子），而大量的“普通被引”、甚至“零被引”论文却远未达到所谓的Nature 影响因子值。因此，在科研评价中，被人们所预期的“发表在特定期刊上的文章预期收获的引文数量与该期刊的影响因子，也就是篇均被引频次基本一致”的假设，在现实中完全不能成立。
　　第四，在科学家个人层面上，虽然一些科学家的论文被引频次与所发表期刊的影响因子呈正相关关系，但学习也发现了大量有趣的实际案例：例如某些挪威生物医学家在其发表的论文成果中，所发表的期刊影响因子越高，其对应的论文被引频次反而越低。
　　第五，高影响科学家与低影响科学家之间存在差异吗？在张琳等人的学习中，将564位最高产的挪威生物医学家按照发表论文的平均被引频次分为了四组，选取排名最高的141位和最低的141位分别作为“高影响”科学家和“低影响”科学家进行对比学习。学习结果表明，“高影响”科学家发表在各个层次期刊上的论文平均被引频次都高于期刊影响因子，而“低影响”科学家的论文被引频次则整体低于其发表期刊的影响因子。“高影响”科学家的论文被引频次随其所发表期刊影响因子的升高而显著甚至急速上升，而“低影响”科学家的论文被引频次随其所发表期刊影响因子的升高却只有缓慢的增长，甚至停滞。换言之，“低影响”科学家即使偶然“撞大运”发表一篇论文在高影响期刊上，也并不见得能收获到预期的引文影响。
　　影响因子在科研评价中应被完全抛弃吗？
　　张琳等的计量结果验证了Seglen博士三十年前的结论，从大规模实证数据的角度再次证明，期刊影响因子不能直接用于评价单篇论文的价值，以及论文作者的学术水平。
　　然而，实证数据却揭示了另一个值得关注的现象：“高影响”科学家的论文被引频次随其所发表期刊影响因子的升高而显著甚至急速上升。这种现象或许可以解释为，“高影响”科学家更能客观准确的判断自己论文成果的价值，从而更善于选择与论文成果质量相匹配的期刊，将更好的成果发表在更高影响的期刊上，从而相得益彰，收获更大的引文影响。因此，期刊影响因子可以作为评判此类科学家成果的一个参考指标：假如一位科学家能持续的在高影响期刊上发表论文，且论文实际被引频次能保持较高的水准，那么这名科学家很可能是一位高水平和高影响的科学家。反之，当一位整体表现平平的科学家偶然在高影响期刊上发表了一篇论文，但该论文并未能收获相应的关注，在对该科学家进行评价时，期刊影响因子就不适合作为一个可靠的参考指标。

为什么期刊影响因子不适合评价科学家个人的学术成就？

naina · 发表于 2017-8-13 21:14

受益匪浅啊！领教领教

虫子 · 发表于 2017-8-14 08:33

naina 发表于 2017-8-13 21:14
受益匪浅啊！领教领教

彼此彼此

lllzhang · 发表于 2017-8-24 23:13

25%左右的高被引论文，特别是少量的极高被引论文，拉升了Nature期刊的篇均被引频次（即影响因子），而大量的“普通被引”、甚至“零被引”论文却远未达到所谓的Nature 影响因子值。因此，在科研评价中，被人们所预期的“发表在特定期刊上的文章预期收获的引文数量与该期刊的影响因子，也就是篇均被引频次基本一致”的假设，在现实中完全不能成立。

同行评价，和引用综合起来看

小飞123 · 发表于 2017-10-11 14:55

25%左右的高被引论文，特别是少量的极高被引论文，拉升了Nature期刊的篇均被引频次（即影响因子），而大量的“普通被引”、甚至“零被引”论文却远未达到所谓的Nature 影响因子值。因此，在科研评价中，被人们所预期的“发表在特定期刊上的文章预期收获的引文数量与该期刊的影响因子，也就是篇均被引频次基本一致”的假设，在现实中完全不能成立。

ztszxxmbzcjq · 发表于 2018-6-21 17:36

这篇文章不错，我可以收藏吗，楼主大人

账号		自动登录	找回密码
密码			注册新账号

为什么期刊影响因子不适合评价科学家个人的学术成就？

晓木虫

为什么期刊影响因子不适合评价科学家个人的学术成就？

评分