#ICLR 2021# 论文推荐:
论文名称:Parrot: Data-Driven Behavioral Priors for Reinforcement Learning
【ICLR 2021 论文推荐】论文链接: Parrot: Data-Driven Behavioral Priors for Reinforcement Lear...
推荐理由:该论文入选ICLR oral 。强化学习(Reinforcement learning , RL)为灵活决策和控制提供了一个通用框架 , 但代理需要学习的每个新任务都需要进行大量的数据收集工作 。在其他机器学习领域(例如 , 自然语言处理或计算机视觉领域) , 研究者们通常在之前收集的大型数据集上进行预训练 , 以引导学习新任务 。那么 , 如何能够为RL代理实现类似的预训练?对此 , 作者提出了一种用于预训练的行为先验方法 , 它能够从广泛的历史任务中捕获成功试验中观察到的复杂的输入-输出关系 。在本文中 , 作者展示了如何将这类习得先验知识用于快速学习新任务之中 , 而不妨碍RL代理尝试新行为的能力 。同时 , 实验证明了该方法在涉及图像观测和稀疏奖励函数的机器人操作领域中的有效性 。
会议链接:AMiner - AI赋能科技情报挖掘
订阅了解更多论文信息 , 定制您的个人科研动态信息流:用户画像论文推荐-学术订阅 - AMiner
文章插图
文章插图
文章插图
文章插图
文章插图
- 2021年全球智能手机市场出炉,OPPO排名前四!
- 近期,日本娱乐杂志评选出2021年日本女星颜值排行,快来看看你的老婆入选没有
- 收储即将来袭 收储
- 刚刚帮大家看完苹果秋季发布会2021,有非常多的新品,下面帮大家总结一下
- 建设空间站有什么用 空间站有什么用
- PS2021正式版2月9日更新 ACR13.1.1 win版 photoshop最新版本是什么版
- 中国音数协游戏工委与中国游戏产业研究院今日发布了2021年中国游戏产业报告
- 特技赛车 特技赛车表演
- 2021年最好用的8款录屏软件 2021录屏软件哪个比较好用
- 冬日动漫剧场2021海贼王官方实力排行是什么?