峰记汽车来|中国工程院院士陈左宁详述:人工智能模型和算法的七大发展趋势

在近日举行的“第十六届CCF全过高性能计算学术年会”上 , 中国工程院副院长、中国科协副主席、中国工程院院士陈左宁发表了题为《人工智能进展对算力需求分析》的演讲 。 在演讲中 , 她阐述了人工智能模型和算法的七大发展趋势 。
峰记汽车来|中国工程院院士陈左宁详述:人工智能模型和算法的七大发展趋势
文章图片
陈左宁表示 , 经典的HPC的算力环境可支持现有人工智能的模型算法 , 但性能功耗比和性价比都较低 , 并非最适合的 , 需要创新体系结构和软件架构 。
据介绍 , 人工智能的发展经历了三个历程 。 从符合主义到连接主义再到行为主义 。 符号主义主要是用公理和逻辑体系搭建一套人工智能系统 。 连接主义源于仿生学 , 主张模仿人类的神经元 , 用神经网络的连接机制连接人工智能 。 行为主义控制论意为假设智能取决于感知和行动 。
陈左宁称 , 三大流派日趋融合 , 协同发展 , 人工智能的核心特征之一是“关系” 。
据介绍 , “关系”计算的表现形式有三种 。 一是连接关系 , 神经网络中神经网元间的连接 。 反向传播算法中的梯度传播;进化算法中的变异 。 二是逻辑关系 。 RNN中的循环连接以及知识图谱中的关联关系 。 三是因果关系 , 贝叶斯、决策树以及强化学习中的控制连接 。
在演讲中 , 陈左宁详细介绍了人工智能模型和算法发展的七大趋势 。
趋势一、向无监督的方向发展 。 主要表现为:适应“小数据” , 减少标注需求 , 减少计算开销 。 要向无监督方向发展要经历几个阶段 。 人工智能主动学习阶段 , 算法主动提出标注请求 , 将一些经过筛选的数据提交给专家标注 。 迁移学习阶段 , 增强训练好的模型 , 解决目标领域中仅有的少量有标签样本数据的问题 。 强化学习阶段 , 用agents构成系统来描述行为并给予评价和反馈学习 。
趋势二、可解释(XAI)越来越重要 。 深度学习如何进一步设计算法和参数 , 提高泛化能力 , 需要模型算法可解释 。 对抗样本导致模型失效 , 训练数据不可理的被局部放大 。 模型愈加复杂 , 失去了可调式性和透明度 。
“此时 , 对于技术的需求就是将可解释技术融入软件环境中去 。 有两个方法 。 第一为现有软件框架增加可解释技术接口 。 提供事后解释的基本技术 , 比如可视化能力 , 局部数据分析 , 特征关联等 。 现有的软件原生支持多种可解释算法 。 提供算法或指标评估模型的可解释能力 。 第二是“人—AI”系统结合 。 以人为中心 , 由决策理论驱动的XAI的概念框架 。 ”陈左宁表示 。
趋势三、人工智能的自学习、自演化 。 这个过程有三个阶段 。 一是自动化机器学习 , 主要是利用数据驱动方式来做决策 。 而是限制约束条件的AutoML 。 三是不舍初始条件 , 搜索空间极大丰富的自演化AutoML 。 这一趋势对于技术的需求有计算框架支撑、大算力支撑以及辅助设备支撑 。
趋势四、多种算法、模型的有机结合 。 单一的算法或模型难以解决实际问题 。 比如问题分解和多种模型有机组合 。 人工智能模型的发展希望融入多种技术来解决已有问题 。 比如 , 通过贝叶斯技术增强因果关系分析;通过数据生成技术减少标注数据需求;通过AutoML技术提高搜索和挖掘能力 。 与此同时 , 人工智能的应用流程也越来越复杂 , 如 , 不同流程设计的设备以及环境多样;需要不同的算法和模型组合 。 多种算法、模型的有机组合的需求是计算存储等可拓展能力 。 基础软件能力提升 , 支持复杂模型 , 不同类型软件的协同和交互 。
趋势五、人工智能应用需求需要关注全生命周期 。 全周期不同人物具有不同时间 , 空间和计算需求 。 全生命周期都要考虑可解释、公平等需求 。
趋势六、分布式、分散式的需求越来越突出 。 首先 , 大型、复杂模型 , 海量数据需要并行 , 分布式计算 。 其次 , 联邦学习等分散场景需要分布式ML原生算法 。 使多个参与者可以在不共享数据的情况下构建通用的 , 健壮的机器学习模型 , 从而解决关键问题 。 不同节点上的数据集异构(分布不相同) , 大小可跨越几个数量级 。 节点可能不可靠 , 节点之间的互联可能不稳定 。 类别优集中式、分散式以及迭代式 。 这一趋势对安全性、架构、提升效率和效用、健壮性有需求 。