即便我们不引用维基百科,我们依然在被他雕刻

维基百科是世界上最为流行的多语言百科全书之一。尽管长久以来,科研人员不喜欢引用维基百科的内容,但最近的一项研究却发现,维基百科雕刻了学术论文语言。

编译作者:步一 /Indiana  University    

原文作者:MarkZastrow

素材推荐人:赵一鸣 / 武汉大学          

图文编辑:李江 / 浙江大学

即便我们不引用维基百科,我们依然在被他雕刻

注:图片来源于维基百科主页

维基百科(Wikipedia),是一个基于维基技术的多语言百科全书协作计划,用多种语言编写的网络百科全书;其目标及宗旨是为全人类提供自由的百科全书。『维基百科』一词取自于维基百科网站的核心技术“Wiki”以及具有百科全书之意的“encyclopedia”两词而共同创造出来的新混成词“Wikipedia”。维基百科是由非营利组织维基媒体基金会负责营运,并接受捐赠。

学术界不喜欢维基百科

长期以来,相当多的科研人员甚少在他们的著作中引用维基百科的内容;甚至有不少科研人员诟病引用维基百科的著作——缺乏学术性、引用“不靠谱”的来源等等。很多老师都建议或警告学生不要在学术论文或者课程作业里引用维基百科的内容。正如麻省理工学院Neil Thompson指出的那样:“学术界不喜欢维基百科”(Academia isfighting with Wikipedia)。

维基百科塑造了学术论文的语言

今年9月在SSRN(SocialScience Research Network)上发表的一项研究(参考文献[2])发现了维基百科对于科研人员研究和文章语言的影响。在该研究中,作者让博士生写了43篇化学专业的学术论文,这些论文的研究主题未被维基百科收录。2015年1月,该研究的作者在这些论文中随机选了一半并发表在维基百科上,另一半作为控制组则没有发表或上传。

截止2017年2月,这些发表出来的论文一共被浏览了超过200万次。随后,作者分析了化学领域最高影响力的50本Elsevier期刊的全文(截止2016年11月),以便分析这些学术论文的语言是否有一定的变化。从用词角度看,作者发现当新词汇或术语进入科研领域时,论文中的用词有所变化,大约正文中平均每250个单词中就有一个新词产生。

该研究还发现,这些文章的用词和上传到维基百科的化学论文中的用词具有一定的相似性,但与控制组中论文的相似性有显著差异。这揭示了维基百科对于科研论文语言的影响。这项研究由于使用了一定的对照试验方式,因此得到了某种可能的因果关系——维基百科在一定程度上塑造了学术论文语言。本质上,科研论文中的用词是科研人员思想和观点的反映。因此,这项研究揭示了维基百科对于科研人员潜在的更大影响。

澳大利亚的数据科学家Adam Dunn表示,这项研究的因果关系还有待进一步考证;不过,他承认,该项研究确实发现了维基百科和科研论文的语言之间存在一定的相关关系。

[1] Zastrow, M. (2017). Wikipedia shapeslanguage inscience papers. Nature, doi:10.1038/nature.2017.22656

[2] Thompson, N., & Hanley, D. (2017).Science is shaped by wikipedia: evidence from a randomized control trial. SocialScience Electronic Publishing.

[3] http://baike.baidu.com/item/维基百科/106382?fr=aladdin

即便我们不引用维基百科,我们依然在被他雕刻