G可解释 生物医学( 二 )



G可解释 生物医学
文章插图


G可解释 生物医学
文章插图

同样在疫情期间,尹凌研究员团队研发传染病时空预测与精准防控系统,基于大数据做疫情防控研究,形成了十余份内参文档和政策建议,为政府决策提供依据。
他们团队的方法是基于大规模手机信令数据、居民出行调查记录等多源时空大数据,对传染病时空传播过程进行城市级别的高分辨率模拟与预测,得出病毒的变种归规律、传播规律、感染规律等等。
? 新型冠状病毒2019-nCoV动物宿主朔源、及分子遗传变异规律研究
? 本地家庭、社区人群中传播效能、传播规律和驱动因素研究
? 人群大样本感染水平研究,确定病例隔离周期、评估隐性感染情况

G可解释 生物医学
文章插图


G可解释 生物医学
文章插图

所以,我们总是能够看到很多人工智能技术发挥医学价值的例子。但说到人工智能,Artificial intelligence,它到底是什么?
“假智能”?“伪智能”?还是“人造的智能”?
不管大家如何定义,我要说的一点是,我们不要神化AI。
第一代人工智能出现在三、四十年前。
在我求学时,我学习的“专家系统”是一个最典型的AI例子。它和中医诊断系统中的“因果说”很相似。比如说舌苔发黄,眼睛发红,很可能是得了感冒。专家系统也是一样的逻辑,就是用知识驱动知识。

G可解释 生物医学
文章插图

那么,专家的知识从何而来?从老师那学,从书本上学,从经验里学。
那时候的AI技术为什么不成功?原因很简单,它只是一个很小的“玩具”。专家们只能搞点小玩意儿,发点小文章。在60年代到90年代,如果你说你是搞人工智能,是找不到的工作的。
那么,为什么现在的人工智能会被大家熟知?关键节点是出现了第二代AI系统。
如果说第一代AI系统是“照葫芦画瓢”,那么第二代AI系统是“无师自通”。

G可解释 生物医学
文章插图

第二代系统由数据驱动,无需阐明数据之间的逻辑性,只需要放进大量的数据,利用深度学习就能找到数据背后的统计规律。
说得好听一点是深度学习,说得不好听就是算法,算法里面就是统计规律。
但是这时候的AI系统没有逻辑、也没有可解释性。
举个例子,AlphaGo第一次在围棋上打败人类,掀起了人工智能研究的热潮,但其实AlphaGo只是把五千年来所有的棋谱输入系统,然后在博弈的时候搜索最可能获胜的招数,以数据、算力和算法获胜。

G可解释 生物医学
文章插图

当时我们也推出了一款新产品,命名为ShouZhuo,成功打败了AlphaGo,并尝试继续迭代算法,一举写出一篇好论文。不幸的是,两周以后Alpha Zero出来了。它不断跟自己对弈,不需要五千年的棋谱,练到最后棋法越来越好,把所有人类都打败了。
我们的想法是类似的,但是我们为什么不能成功呢?我们发觉,假如我们的算法也像Alpha Zero这样无休止对弈、训练,凭借我们实验室的硬件,大概要用1000多年的时间,1000多年之后这个算法肯定就没用了。
说到底,人工智能还不聪明,还是依靠“数据+硬件”驱动。在拼设备的年代,还能拼什么?
所以,这时出现了第三代AI系统。它将知识和数据结合起来,融汇了第一代AI系统和第二代AI系统。

G可解释 生物医学
文章插图

举个例子,什么叫知识驱动?我女儿两岁的时候被蜜蜂蛰了一个大包,以后再见到蜜蜂就会跑开,这是数据驱动。什么是知识驱动呢?从小你家里人告诉你,猫不能碰、狗不能碰、蜜蜂不能碰、蛇不能碰,以后你见到这些东西就会远离。
但是知识驱动是有缺点的,因为图片是有限的,以后你遇到老虎、遇到大象还是会碰,因为没有先验知识。数据驱动也是有问题的,需要通过大量的数据完成“原始学习”,过程很慢。
如何将两种学习方式结合起来,将知识嵌入到机器脑中,这是第三代AI系统的问题。

G可解释 生物医学
文章插图

举个例子,假如现在用100万张猫和狗图像训练好了一个神经网络,也就是设置好了参数,它会很轻松地分辨猫还是狗,但是准确性如何升高,如何再调整参数?