路人战队|打破SCI与“影响因子”的神话


路人战队|打破SCI与“影响因子”的神话《科学引文索引》(SCIence Citation Index , 简称SCI)是影响世界科学界几十年的指挥棒 , 在中国更是评判科研成果的核心指标 , 成为“信仰级”的指标 。 国内对SCI的通行评价是: SCI(科学引文索引)、EI(工程索引)、ISTP(科技会议录索引)是世界著名的三大科技文献检索系统 , 是国际公认的进行科学统计与科学评价的主要检索工具 , 其中以 SCI 最为重要 。 可见SCI在中国科学界的崇高地位 。
千千万万个中国科研人员、大学教师和专业人士殚精竭虑、皓首穷经 , 梦想在核心期刊多发文章 , 结果成为SCI影响因子的“奴隶” 。 在今年新冠疫情之中 , 国内学者争相在海外发表论文 , 再度引发社会各界对专业人士追逐SCI的讨论和怀疑 。 上海交通大学的江晓原与穆蕴秋所做的研究和历史梳理 , 揭示了SCI与影响因子游戏中的问题 。
SCI于1957 年由美国科学信息研究所(Institute for Scientific Information, 简称 ISI)在美国费城创办 。 SCI创办人尤金?加菲尔德(Eugene Garfield , 1925-2017年)是一位善于玩弄信息的高手 。 ISI这家听起来就很像政府科学机构的“研究所” , 其实是一家地道的商业公司——ISI曾用名“尤金?加菲尔德学会” , 1960年才改为目前的名字 , 而1992年起又被汤森路透收购至旗下 。 其创始人加菲尔德曾坦率地承认 , 以科学信息研究所(ISI)来命名公司 , 希望的就是这种鱼目混珠的效果 。
但是 , SCI与影响因子本身存在不少的问题 。
国内对影响因子的具体计算方法 , 长期存在误读 。 影响因子的算法如下:“N年度期刊的影响因子=该刊物[(N-1)+(N-2)]年所有源刊文本在第N年度的引用总数/该刊物[(N-1)+(N-2)]年发表的引用项总数” 。 而国内对此存在普遍误读 , 将“引用项总数”直接替换成了“发表论文数” 。 国外期刊采取了多种方式来“做高”影响因子 , 具体思路可以分为两种:降低分母、扩大分子 , ISI并没有针对这种“数据操纵”做出过系统性、机制性修正 。
【路人战队|打破SCI与“影响因子”的神话】操纵分母 , 降低引用项数量 , 是推高影响因子的第一种思路 , 主要操作则分两类 。 一是稀释内容、二是直接协商 。 稀释内容方面 , 可以加入大量非学术文本 , 变“学术”期刊为两栖期刊 。 以Nature为例 , 其每期刊文中有18个栏目 , 但只有3个栏目属于学术文本 。 据SCI数据库统计 , 其学术内容仅占全刊1/3 , 《柳叶刀》也是如此 , 其学术内容仅占1/4-1/5 。 2007年《皇家医学会杂志》曾发表一项研究 , 发现在1994-2005年间 , 《内科学年鉴》、《美国医学会杂志》、《新英格兰医学杂志》等著名医学期刊 , 学术文本数量都在逐年大幅下降 , 而影响因子则步步高升 。
直接协商的方式更加不透明 。 《柳叶刀》2000年原本计入引用项的数量为821 , 而经过与ISI“沟通”之后 , “纠正”为了684项;而另一著名医学期刊 , 美国《公共科学图书馆医学杂志》(PLOS Medicine)曾在2006年披露 , 杂志2005年首次被SCI收录时 , 曾尝试对ISI展开说服工作 , 试图少算分母 。 PLOS Medicine的分母项如果只算“原创论文” , 影响因子为11;如果包含所有文本 , 影响因子则为3 。 从其2005年被定位到8的影响因子来看 , 说服产生了一定效果 。 虽然每年的JCR都会公布影响因子公式 , 不过像“分母数值如何计算”等细节 , ISI与汤森路透从未公布过 。
即使分母不变 , 也可以用不少的方式来拉高分子 。 分子的操纵方式相比分母 , 更是“八仙过海 , 各显神通” 。
第一种是刊登综述 。 由于目前国际上通行的学术论文写作框架中 , 要求有一个几乎固定的“前人工作概述”部分 , 而在写这部分时 , 少不了查引综述文章 , 这也就使得综述成为了引用数字的常青树 。 通过玩综述 , 使得不少期刊获得了超高影响因子 , 比如1950年创刊的《临床医师癌症杂志》(CA: A Cancer Journal for Clinicians)影响因子高达187 , 已连续12年蝉联第一 , 是排名第二的两倍有余 , Nature的4倍不止 。 其高引用的来源 , 主要归功于两种报告:逐年发布的《癌症统计报告》和不定期发表的《全球癌症统计报告》 。 据统计 , 两种报告对刊物影响因子的贡献始终超过70% 。