机器之心Pro|7 Papers & Radios | 南加大游戏AI玩转《毁灭战士》;少样本NLP元学习综述( 二 )
在具体配置上 , 研究者分别采用了一个具有 10 核 CPU 和 GTX 1080 Ti GPU 的工作站级 PC , 以及配备了服务器级 36 核 CPU 和单个 RTX 2080 Ti GPU 的系统 。
本文插图
Sample Factory 的架构图 。
本文插图
硬件系统 1 和系统 2 。
本文插图
在 Atari、VizDoom 和 DMLab 三个模拟环境中 , 与 DeepMind IMPALA、RLlib IMPALA、SeedRL V-trace 和 rlpyt PPO 等基线方法相比 , Sample Factory 更接近于理想的性能 。
推荐:完虐「机器人」 , 36 核 CPU 单机设置 , 南加大游戏 AI 在 Doom 中实现 SOTA 性能 。
论文 3:Searching to Exploit Memorization Effect in Learning with Noisy Labels
- 作者:Quanming Yao、Hansi Yang、Bo Han、Gang Niu、James T. Kwok
- 论文链接:https://arxiv.org/abs/1911.02377
在本研究中 , 受 AutoML 的启发 , 来自第四范式、清华大学等机构的研究者将此问题建模为一个函数逼近问题 。 具体来说 , 他们基于记忆效应的通用模式设计了一个特定于领域的搜索空间 , 同时提出以一种新的牛顿法(Newton algorithm)来有效地解决双层优化问题 。
此外 , 研究者还进一步对该算法进行了理论分析 , 保证了算法对临界点的良好逼近 。 在基准和真实世界数据集上的实验结果表明 , 该方法优于当前最优的噪声标签学习方法 , 并且比现有 AutoML 算法更加高效 。
本文插图
在 CIFAR-10、CIFAR-100 和 MNIST 上 , 使用不同架构、优化器和优化器设置下的训练和测试准确率曲线 。
本文插图
算法 2 。
本文插图
MNIST 上 MentorNet、Co-teaching、Co-teaching + 和 S2E 的标签精度(lable precision)变化曲线 。
推荐:论文二作杨瀚思(Hansi Yang)为清华大学本科生 , 现为第四范式机器学习研究组实习生 。
论文 4:Meta-learning for Few-shot Natural Language Processing: A Survey
- 作者:Wenpeng Yin
- 论文链接:https://arxiv.org/abs/2007.09604
本文插图
多任务学习 VS 元学习 。
本文插图
Reptile(OpenAI)元学习(batched version) 。
本文插图
一些代表性的基于优化的(optimization-based)元学习模型 。
- 第一代iPod touch原型曝光:采用Mac Pro亮面黑色工艺
- 小i机器人|小i机器人对苹果提起侵权诉讼索赔人民币100亿元
- 天气早知道|操纵“魔杖”、和AI机器人互动……科技课原来可以这么好玩
- 黄子韬和机器人吵起来了|【铁憨憨的日常】黄子韬和机器人吵起来了 幼稚鬼韬三岁无疑了
- 小i机器人对苹果提起诉讼并索赔100亿人民币
- 疑似,PS5,Pro,专利曝光,将采用多,GPU,解决方案
- 黄子韬和机器人吵起来了|黄子韬和机器人吵起来了什么情况?终于真相了,原来是这样!
- Redmi|2299元起!Redmi 10X Pro喜提MIUI 12:天玑820/AMOLED水滴屏
- 野史来探究|iPhone 12 Pro提前泄漏,豪侈品牌定制版iPhone 12 Pro曝光
- 机智万象 华为Mate40 Pro钢化膜再曝光,5nm麒麟芯片成本高于苹果A14