ZAKER生活 什么是小样本学习?这篇综述文章用166篇参考文献告诉你答案
来源:机器之心
参与:魔王
什么是小样本学习?它与弱监督学习等问题有何差异?其核心问题是什么?来自港科大和第四范式的这篇综述论文提供了解答 。
数据是机器学习领域的重要资源 , 在数据缺少的情况下如何训练模型呢?小样本学习是其中一个解决方案 。 来自香港科技大学和第四范式的研究人员综述了该领域的研究发展 , 并提出了未来的研究方向 。
这篇综述论文已被ACMComputingSurveys接收 , 作者还建立了GitHubrepo , 用于更新该领域的发展 。
论文地址:https://arxiv.org/pdf/1904.05046.pdf
GitHub地址:https://github.com/tata1661/FewShotPapers
机器学习在数据密集型应用中取得了很大成功 , 但在面临小数据集的情况下往往捉襟见肘 。 近期出现的小样本学习(Few-ShotLearning , FSL)方法旨在解决该问题 。 FSL利用先验知识 , 能够快速泛化至仅包含少量具备监督信息的样本的新任务中 。
这篇论文对FSL方法进行了综述 。 首先 , 该论文给出了FSL的正式定义 , 并厘清了它与相关机器学习问题(弱监督学习、不平衡学习、迁移学习和元学习)的关联和差异 。 然后指出FSL的核心问题 , 即经验风险最小化方法不可靠 。
基于各个方法利用先验知识处理核心问题的方式 , 该研究将FSL方法分为三大类:
数据:利用先验知识增强监督信号;
模型:利用先验知识缩小假设空间的大小;
算法:利用先验知识更改给定假设空间中对最优假设的搜索 。
最后 , 这篇文章提出了FSL的未来研究方向:FSL问题设置、技术、应用和理论 。
论文概览
该综述论文所覆盖的主题见下图:
文章图片
我们选取介绍了该综述论文中的部分内容 , 详情参见原论文 。
什么是小样本学习?
FSL是机器学习的子领域 。
我们先来看机器学习的定义:
计算机程序基于与任务T相关的经验E学习 , 并得到性能改进(性能度量指标为P) 。
基于此 , 该研究将FSL定义为:
小样本学习是一类机器学习问题 , 其经验E中仅包含有限数量的监督信息 。
下图对比了具备充足训练样本和少量训练样本的学习算法:
文章图片
FSL方法分类
根据先验知识的利用方式 , FSL方法可分为三类:
文章图片
FSL方法解决少样本问题的不同角度 。
基于此 , 该研究将现有的FSL方法纳入此框架 , 得到如下分类体系:
文章图片
数据
此类FSL方法利用先验知识增强数据D_train , 从而扩充监督信息 , 利用充足数据来实现可靠的经验风险最小化 。
文章图片
如上图所示 , 根据增强数据的来源 , 这类FSL方法可分为以下三个类别:
模型
基于所用先验知识的类型 , 这类方法可分为如下四个类别:
算法
根据先验知识对搜索策略的影响 , 此类方法可分为三个类别:
文章最后从问题设置、技术、应用和理论四个层面探讨了小样本学习领域的未来发展方向 。
转一转
赞一赞
【ZAKER生活 什么是小样本学习?这篇综述文章用166篇参考文献告诉你答案】看一看
- ZAKER娱乐|反抗后竟被掰断手指?客人:该怎么判怎么判!,足疗师被客人骚扰
- 马诚奠费楚淮|各大官媒齐翻车,援鄂女护士身份造假被曝私生活混乱
- 什么值得买|全家最危险的是这3㎡,难打理还易爆炸
- ZAKER生活|暗打手势 是什么原因让司机如此动作?,出租司机
- 前有iPhone 12,后有Mate 40,为什么我却攥着中兴天机Axon 20 5G不放
- 品牌营销新时空|不主动沟通,一副不合作姿态,这类员工不知道在想什么
- 扒王娱姬|“凤姐”罗玉凤直播谈“美国梦”:生活的连狗都不如
- 游侠网|英国人都在玩什么?英国销量榜:《FIFA21》稳居第一
- 机核网|为什么我觉得《刺客信条》越来越差了:游戏性篇
- 九游网|《DNF》无形残香作用是什么 无形残香作用介绍