新闻里那些“死掉”的超链接,是如何被灰产给占用的?


在网页新闻中 , 超链接时常作为一种补充资料出现 , 用户能够点击超链接阅读媒体所引用的资料原文 。
但随着信息数据的不断堆积 , 网络上的许多超链接其实已经失效了 , 比如有时候点击一个十几年前的文章链接 , 会反馈一个类似于“页面已消失”的提示 。
大部分用户并不会特别关注一个超链接是否还有效 , 但在网络上 , 有一些人却像盗墓者一般搜寻着这些沉睡已久的超链接并用其牟利 。
超链接怎么了?谁在利用那些已经“死去”的超链接?
本期全媒派(ID:quanmeipai)将聚焦于那些已经无效的超链接 , 汇编并分析国外媒体所经历的无效超链接被篡改的困扰 , 试图揭示当下新闻归档存在的问题以及无效超链接背后巨大的灰色利益 。
超链接之“死”
根据哈佛大学法学院一个团队对于《纽约时报》的调查 , 他们发现在该报553,693篇文章中的一百七十多万个深度链接(Deeplink)已经有25%完全无法使用 。 当用户点击这些深度链接 , 曾经的页面已经变成一片空白 。 [1]
这样的情形被称为链接无效(linkrot) , 页面会出现“404”的提示 。
新闻里那些“死掉”的超链接,是如何被灰产给占用的?
本文插图
深度链接是指能够导向外部网站页面的渠道 , 使用者能够通过该链接进入某个特定的外部页面 。 如果没有采用深度链接技术 , 则使用者需要自行搜寻相关的内容 。 深度链接大大缩短了用户的使用路径 , 在图文内容消费场景里 , 基本上可以将深度链接理解为我们更为熟悉的超链接 。
而超链接变无效链接 , 主要原因则是原有内容消失、变更或者位置改变 , 这使得服务器无法返回有效的页面 。
如《好莱坞报道》曾为前华特·迪士尼CEO罗伊·迪士尼的妻子发表一篇讣告 , 并附上了一个纪念网站的链接 , 读者可以在该网站中向慈善机构捐款以纪念逝者 。 之后 , 其家人关闭了该网站 。 尽管网站不复存在 , 但《好莱坞报道》所引用的超链接依然能够跳转 , 这样的超链接就成了无效链接 。
新闻里那些“死掉”的超链接,是如何被灰产给占用的?
本文插图
无效的情况会随着超链接年份的累积变得更为普遍 , 因为随着时间的流逝 , 当初所引用的大量网站都可能已经不再被使用 。
在对《纽约时报》的这项调查结果显示 , 发表于2018年的文章有6%的超链接已经无效;而2008年的文章则有43%的无效超链接;到了1998年 , 这一指标竟达到72%之高 。 在整体上 , 53%的文章中至少存在一个无效的超链接 , 也就是两篇文章中至少有一篇文章有一个无效的链接 。
超链接的失效也与文章类型有关 , 不同板块的文章在无效链接的比例上也存在差异 。