「脑极体」靠AI预测一场“流行病”,不可忽视的歧变节点


利用AI模型来预测病毒或谣言的传播走向 , 已经不再是什么新鲜事物 。
要知道 , 现实情况往往比训练AI的数据集复杂N倍 , 而研究人员打造的模型 , 往往只是研究传播对象的前几个步骤 , 然后将这个速率引入复杂的数学模型之中 , 来预测传播的广度和速度 。
但如果病原体发生变异 , 或新闻内容被修改 , 传播速度和方式也将发生变化 , 这时候 , 原本的AI模型还能成功应对呢?
这也使我们不得不思考更进一步的问题——将AI看成防范病毒/谣言的利器 , 但技术本身也必须在复杂环境中持续迭代 。
七十二变:比疾病更难预测的“病毒”
疾病变异 , 可以通过基因比对来追根溯源 。 那么信息变异呢?
在以T为单位的网络世界 , 内容信息往往会以闪电般的速度在社交媒体上传播 。 在这次疫情中大家可能也发现了 , 谣言往往轻易获得“万转” , 而辟谣信息的转发却十分可怜 。
这也说明了一个传播学的难题 , 一条信息是否会传播 , 取决于原始信息是如何被篡改的 。
有些错误是故意的 , 也就是“造谣” 。 但有的改变则是出于增加电话、加入交互等成分而自然发展出来的 。
比如一则关于2014年俄罗斯战斗机与美国驱逐舰在黑海对峙的旧闻 , 经过一些八卦网站(Parody website)的篡改 , 变成了:俄罗斯空军配备一种神秘电磁武器 , 瞬间弄瘫了整艘美国军舰 。
此消息经过社交媒体发酵 , 最后甚至登上了主流媒体福克斯新闻网站的头条 。
「脑极体」靠AI预测一场“流行病”,不可忽视的歧变节点
本文插图
那么 , 一条看似枯燥的信息是否能演变成病毒式传播的博文 , 能够预测出来吗?
此时 , 原本用于预测流行病趋势的传染病动力学 , 就开始与信息传播联系到了一起 。
早在上个世纪 , 科学家们就开始基于传染病动力学模型 , 研究复杂网络下信息的传播模型了 。
经典的谣言传播模型理论研究源于20世纪 60年代。
1965年 , 研究者Dalay和Kendall提出了谣言传播的数学模型 , 后来人们命名该模型为DK模型 。 它把人群按照谣言传播效果 , 分成谣言易染类人群、谣言感染类人群及谣言移出类人群 , 认为其中两类会以随机过程来相互转换 。
到了1973年 , 麦基和汤普森两人对当时主流的谣言传播模型DK模型进行了改进 , 引入了免疫人群 。
2001年 , Zanetee则将复杂网络引入到谣言传播模型中 , 建立了具有网络拓扑结构特征的传播模型 。 2004年 , 莫瑞奥等人在小世界网络和无标度网络中研究了谣言传播动力学 。
但是 , 这些模型均未将信息老化理论考虑进去 。
到了2011年 , 中国研究者则将以往机制引入谣言传播类型 , 认为人们关注谣言的热度会随着时间的推移而下降 , 尤其是在纷繁复杂的网络世界中 , 人们的吸引力也容易被其他事物所转移 。 无知者转化为谣言传播者或真相传播者的概率会下降 , 并将其慢慢遗忘 。
「脑极体」靠AI预测一场“流行病”,不可忽视的歧变节点
本文插图
诚然 , 数学模型严密的逻辑性和抽象性 , 为舆论管理带来了一定的预测可能性 。
但其中有两个问题却始终存在:
一是时间滞后 。 谣言传播与传染病传播在机理上有很多的相似性 , 就像病毒存在潜伏期一样 , 网络谣言从被更改、发布、发酵、传播、消失等一系列过程 , 个体的时间滞后程度都不一样 。 有的可能当下非常关心 , 有的则沉迷学业一个月后才赶来吃瓜……种种不确定性 , 也给预测网络信息传播带来了一定的难度 。
其次 , 则是变异突发 。 正如同我们很难追溯病毒是如何在扩散过程中逐渐变异的 , 对谣言的改造和增删 , 都有可能改变其传播路径与效果 。 比如新冠期间 , 从宠物可能感染新型肺炎 , 到养宠可以预防 , 再到有宠物被检测出阳性……反转一波接一波 , 有的则是披着辟谣皮的新谣言 , 这些都会让对信息的预测出现误差 。