机器之心Pro|7 Papers & Radios | 南加大游戏AI玩转《毁灭战士》;少样本NLP元学习综述
_本文原题:7 Papers & Radios | 南加大游戏AI玩转《毁灭战士》;少样本NLP元学习综述
机器之心 & ArXiv Weekly Radiostation
参与:杜伟、楚航、罗若天
本周的重要论文有南加大开发的玩转《毁灭战士》游戏的 AI 智能体 , 以及Salesforce 研究者的少样本 NLP 元学习综述 。
目录:
- Stabilizing Differentiable Architecture Search via Perturbation-based Regularization
- Searching to Exploit Memorization Effect in Learning with Noisy Labels
- Meta-learning for Few-shot Natural Language Processing: A Survey
- Towards Deeper Graph Neural Networks
- Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog
- A Knowledge-Enhanced Recommendation Model with Attribute-Level Co-Attention
- ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)
- 作者:Xiangning Chen、Cho-Jui Hsieh
- 论文链接:https://arxiv.org/pdf/2002.05283.pdf
为了支持梯度下降 , DARTS 对于搜索空间做了连续化近似 , 并始终在优化一组连续可微的框架权重 A 。 但是在生成最终框架时 , 需要将这个权重离散化 。
在本文中 , 来自加州大学洛杉矶分校的研究作者观察到这组连续框架权重 A 在验证集上的损失函数非常不平滑 , DARTS 总是会收敛到一个非常尖锐的区域 。 因此对于 A 轻微的扰动都会让验证集性能大幅下降 , 更不用说最终的离散化过程了 。 这样尖锐的损失函数还会损害搜索算法在架构空间中的探索能力 。
于是 , 他们提出了新型 NAS 框架 SmoothDARTS(SDARTS) , 使得 A 在验证集上的损失函数变得十分平滑 。
本文插图
CIFAR-10 上架构权重 A 的验证准确率 。
本文插图
SDARTS 训练算法 。
本文插图
在 ImageNet 上与其他 SOTA 分类器的 test error 结果比较 。
推荐:本文提出的方法可以广泛应用于各种可微架构算法 。 在各种数据集和搜索空间上 , 研究者发现 SDARTS 可以一贯地取得性能提升 。
论文 2:Sample Factory: Egocentric 3D Control from Pixels at 100000 FPS with Asynchronous Reinforcement Learning
- 作者:Aleksei Petrenko、 Zhehui Huang、Tushar Kumar、Gaurav Sukhatme、Vladlen Koltun
- 论文链接: https://arxiv.org/pdf/2006.11751.pdf
在这项研究中 , 研究者展示了如何使用单个高端工作站 , 在第一人称射击电子游戏《毁灭战士》(Doom)中训练具有 SOTA 性能的 AI 。 不仅如此 , 他们使用正常计算能力的一小部分解决了 DeepMind 创建的 30 种不同的 3D 挑战套件 。
- 第一代iPod touch原型曝光:采用Mac Pro亮面黑色工艺
- 小i机器人|小i机器人对苹果提起侵权诉讼索赔人民币100亿元
- 天气早知道|操纵“魔杖”、和AI机器人互动……科技课原来可以这么好玩
- 黄子韬和机器人吵起来了|【铁憨憨的日常】黄子韬和机器人吵起来了 幼稚鬼韬三岁无疑了
- 小i机器人对苹果提起诉讼并索赔100亿人民币
- 疑似,PS5,Pro,专利曝光,将采用多,GPU,解决方案
- 黄子韬和机器人吵起来了|黄子韬和机器人吵起来了什么情况?终于真相了,原来是这样!
- Redmi|2299元起!Redmi 10X Pro喜提MIUI 12:天玑820/AMOLED水滴屏
- 野史来探究|iPhone 12 Pro提前泄漏,豪侈品牌定制版iPhone 12 Pro曝光
- 机智万象 华为Mate40 Pro钢化膜再曝光,5nm麒麟芯片成本高于苹果A14