傻大方


首页 > 潮·科技 > >

机器学习|Bengio 终于换演讲题目了!生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”?



按关键词阅读: 试运行 调度 电厂 南网 虚拟电厂 南网科研院 网地

机器学习|Bengio 终于换演讲题目了!生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”?
文章插图

作为深度学习的大牛,Bengio 对系统 1 和系统 2 是真爱,以往的演讲主题基本离不开这两个概念,今年终于换题目了!那么,Bengio 新推的人工智能算法 GFlowNets 究竟有何特别之处?
作者 | 杏花
编辑 | 青暮
2021 年 11 月 1 日至 11 月 2 日,三星在线上举行为期两天的 2021三星人工智能论坛(Samsung AI Forum 2021)。今年是论坛举办的第 5 年,主题为「未来的人工智能研究」,聚集了世界知名的人工智能领域学者和行业专家,交流思想、见解和研究成果,探讨人工智能未来的方向。
三星人工智能论坛第一天的主题演讲由蒙特利尔大学的 Yoshua Bengio 教授发表,Bengio 也是三星人工智能论坛的联合主席,是三星人工智能教授。在题为 GFlowNets for Scientific Discovery 的主题演讲中,Bengio 提出了一种名为 GFlowNets 的新算法,不局限于在单一性质指标下寻找某一个最佳匹配的分子,而是将目标放大,基于生成模型,学习到满足性质指标的足够好的多种分子候选,更一般地说,是满足此性质指标的分子结构的概率分布函数。
也就是说,结合生成模型来学习科学实验数据,GFlowNets 使得获取的可行实验设置不局限于在单一的量化目标下的单一候选,而可以生成多样化的实验候选分布,不仅可以提高对科学实验和测试数据的预测精度,更重要的是提高实验设置的多样性。
机器学习|Bengio 终于换演讲题目了!生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”?
文章插图

实现这一点的关键在于“流”的建模,也就是从一个侯选开始,逐步采样其它候选,同时在采样过程中,要通过奖励函数设置保证流入和流出是平衡的,也就是流守恒。具体而言,如上图所示,就是从初始候选 s_0 到达终端候选 s_12 的奖励,与从第二候选 s_1 到达终端候选 s_12 的奖励,是相等的。
Bengio 表示,这种采样方式与 MCMC 有相似之处,但是相比之下少了很多随机性,从而计算量大幅降低。
此外,这种基于历史候选逐步生成新候选的采样方式,与人类在进行科学探索时,参考前人成果的方式有相似之处,也就是阅读和学习——构建世界模型——提出问题(实验候选)——向现实世界提问和查询——获取反馈——修改世界模型——提出新问题。对于这种不同于传统的、静态的监督学习的范式,Bengio 将其称为生成式主动学习,它让我们不再局限于寻找“一个分子”,而可以寻找“一类分子”。
相关论文已经发表在arXiv上,代码也已经开源。
机器学习|Bengio 终于换演讲题目了!生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”?
文章插图

项目地址:http://folinoid.com/w/gflownet/
Yoshua Bengio:蒙特利尔大学的全职教授,也是魁北克人工智能研究所 Mila 的创始人和科学主任,全球公认的人工智能领域的领先专家之一。因在深度学习方面的开创性工作而闻名,与 Geoffrey Hinton 和 Yann LeCun 一起获得了 2018年AM 图灵奖。2019年,Yoshua Bengio 获得了著名的基拉姆奖,并于 2021 年成为世界上被引用次数第二多的计算机科学家。
Yoshua Bengio 教授作为高级研究员共同指导 CIFAR 机器和大脑学习计划,并担任 IVADO 的科学总监。他是伦敦和加拿大皇家学会的会员,也是加拿大勋章的官员。
以下是报告全文,AI科技评论进行了不改变原意的整理。

1

论文摘要
这篇论文是关于从一系列动作中学习生成对象(如分子图)的随机策略的问题,这样生成对象的概率与该对象的给定正奖励成正比。虽然标准回报最大化趋向于收敛到单个回报最大化序列,但在某些情况下,我们希望对一组不同的高回报解决方案进行采样。
例如,在黑盒函数优化中,当可能有几轮时,每轮都有大量查询,其中批次应该是多样化的,例如,在新分子的设计中。也可以将其视为将能量函数近似转换为生成分布的问题。虽然 MCMC 方法可以实现这点,但它们很昂贵并且通常只执行局部探索。
相反,训练生成策略可以分摊训练期间的搜索成本并快速生成。使用来自时间差异学习的见解,我们提出了 GFlowNets ,基于将生成过程视为流网络的观点,使得处理不同轨迹可以产生相同最终状态的棘手情况成为可能,例如,有很多方法可以顺序地添加原子以生成一些分子图。我们将轨迹集转换为流,并将流一致性方程转换为学习目标,类似于将 Bellman 方程转换为时间差分方法。


稿源:(雷峰网)

【傻大方】网址:/c/112cO5222021.html

标题:机器学习|Bengio 终于换演讲题目了!生成式主动学习如何让科学实验从寻找“一个分子”变为寻找“一类分子”?


上一篇:新零售|视觉反射,掌握这几点就能掌控新零售时代的中台

下一篇:洪湖|年轻人正在抛弃沃尔玛