传染病与网络爆红热点内容传播背后的数学模型( 二 )


更一般地说,一个受 Kermack 和 McKendrick 的思想启发而建立的基于 S, I 和 R 三种流行病学分类的流行病数学模型,被称为 SIR 模型 。当然,也存在其他不同类型的模型:例如,如果该疾病不涉及免疫接种(譬如感冒),则 R 类型没有理由存在,那么人们所探讨的就是 SI 模型 。
SIR 模型的主要目标是预测流行病的演变,并估计将会感染该疾病的人口比例 。如果存在某些假设,则可以使用 SIR 模型,具体如下:

  • (a) 在流行病期间,没有新增人口;
  • (b) 在流行病期间,死亡的主要原因是该流行病本身;
  • (c) 人口是被隔离的,即对于外部来说没有入流量与出流量;
  • (d) 该疾病没有潜伏期;
  • (e) 治愈康复后立即获得免疫力;
  • (f) 无论感染后经过多长时间,所有受感染的个体都具有相同的传染性 。
很容易直观感受到,这些假设与现实中的实际情况相比非常简化 。比方说,新冠病毒所致的 COVID-19 的潜伏期有 14 天,而且,治愈后的免疫力也并没有被证实,更何况,至少来说很显然假设 a 与假设 b 是不现实的 。从另一方面讲,在建模的过程中,很自然地,会从着眼于现象的关键要素的描述而展开,从而忽略一些被认为是次要的细节:就有点像在确定弹道轨迹的时候忽略与空气的摩擦阻力,因为这对计算不是很重要 。
基于以上假设,SIR 模型的动态学非常简单 。在流行病疫情的开始,由于传染,易感人群(即尚未感染的个体)的数量将会逐渐减少,而感染人群的数量将由于相同原因而增长 。随着感染人数的增长,一个易感个体被感染的可能性将会更大,因此,感染人群的增长将会从一开始就趋于加速 。(尽管伯努利虽然从不同的假设着手,却也预估到了指数趋势)
但是,在某些时候,一些个体将会开始从感染群体这个类型转变到治愈群体类型,因为与此同时,他们治愈康复了,或者死亡,也或者被隔离 。从这个时候开始往后,所有的分析都游走在这两个转变过程之间的差值上 : 只要感染者数量多于移出者数量 (移出者数量=治愈数+死亡数+被隔离数),该流行病将会处于其上升阶段,但是,当移出者数量开始占上风之后,就又会处于其下降阶段 。有一个事实是确定的:易感人群的数量总是在减少而移出者数量总是在增加 。

传染病与网络爆红热点内容传播背后的数学模型

文章插图
【传染病与网络爆红热点内容传播背后的数学模型】
▲ 根据 SIR 模型呈现的一个流行病的典型趋势
上面是一个用 SIR 呈现的一个流行病可能趋势的图:你会立即注意到感染数量的上升阶段,该阶段达到一个峰值,之后是一个下降阶段 。同时,易感数量总是减少,而治愈数量总是增加 。
现在,我们花点时间回到之前的那个类比——互联网中病毒式疯传的内容:人们能迅速理解 Kermack 和 McKendrick 的想法也能运用在这个场景下 。
我们假设今天有人发布了一个可能成为网络爆红的推文 。
在发布的时候,与模因的"病毒传染"潜力相比,整个世界网络社交人群都属于易感人群类型,因为还没有人看到模因但将来可能会 。渐渐地,当人们发现这个模因并且他们也转发分享的时候,就从易感人群变为感染人群:实际上,他们成为病毒性内容的“受害者”(转发者),也就是说,他们对这些内容充满热情并积极地将其传播给其他人 。随着时间的推移,总是会有越来越多的人将不再对这些内容感兴趣并将停止传播它,从而过渡到“治愈类” 。

传染病与网络爆红热点内容传播背后的数学模型

文章插图

▲ "The dress"图片
2015 年,Tumblr 上有一张因视错觉而爆红的的服装图片开始在平台上疯传,引发了公众一个问题:“这件衣服是白色和金色?或者是蓝色和黑色?” |
这张图片迅速在网上传播开来:仅 48 小时内,帖子就获得了 40 万次互动;最随后的几天里,成千上万的人看到了该图片并通过主要的社交网络分享了它 。
上面这张“Sharing of #TheDress”图,以简化的方式反映了名为“The Dress”的网络爆红现象是如何呈现在其病毒式疯传效应中的:同样在这种情况下,也分为三类,即: