「AI科技评论aitechtalk」直播丨华为诺亚方舟ICLR满分论文:基于强化学习的因果发现

ICLR2020系列论文解读公开课第四期 , 就在本周二20:00整(北京时间) 。
AI科技评论xAI研习社联合出品
针对ICLR2020不能现场参会的特殊情况 , AI研习社联合AI科技评论组织策划了【ICLR2020系列专题】活动 , 【ICLR2020系列论文解读公开课】是其中重要的组成部分 , 另外还包括系列论文文字解读 , 会议数据分析 , 会议资源下载等 。
疫情拉开了大家的距离 , 但是学术交流是不会就因为疫情被阻挡的 , 我们愿架起这座学者之间的桥梁 , 以最短路径 , 让更多学者能更快的参与其中 , 促进学术交流 , 让知识真正流动!
本次直播为【ICLR2020系列论文解读公开课】第四期 , 此论文来自华为诺亚实验室的ICLR2020满分论文《CausalDiscoverywithReinforcementLearning》 , 我们有幸请到了论文的一作、华为诺亚方舟实验室高级研究员朱胜宇博士带来“基于强化学习的因果发现”的分享 。
论文简介如下:
「AI科技评论aitechtalk」直播丨华为诺亚方舟ICLR满分论文:基于强化学习的因果发现
文章图片
论文地址:https://arxiv.org/pdf/1906.04477.pdf
因果研究作为下一个潜在的热点 , 已经吸引了机器学习/深度学习领域的的广泛关注 , 例如YoushuaBengio和Fei-FeiLi近期都有相关的工作 。 因果研究中一个经典的问题是“因果发现”问题——从被动可观测的数据中发现潜在的因果图结构 。
华为诺亚方舟实验室因果研究团队将强化学习应用到打分法的因果发现算法中 , 通过基于自注意力机制的encoder-decoder神经网络模型探索数据之间的关系 , 结合因果结构的条件 , 并使用策略梯度的强化学习算法对神经网络参数进行训练 , 最终得到因果图结构 。
【「AI科技评论aitechtalk」直播丨华为诺亚方舟ICLR满分论文:基于强化学习的因果发现】在学术界常用的一些数据模型中 , 该方法在中等规模的图上的表现优于其他方法 , 包括传统的因果发现算法和近期的基于梯度的算法 。 同时该方法非常灵活 , 可以和任意的打分函数结合使用 。