ICLR 2021 论文推荐 _游戏世界

#ICLR 2021# 论文推荐：
论文名称：Parrot: Data-Driven Behavioral Priors for Reinforcement Learning
【ICLR 2021 论文推荐】论文链接: Parrot: Data-Driven Behavioral Priors for Reinforcement Lear...
推荐理由：该论文入选ICLR oral 。强化学习（Reinforcement learning ， RL）为灵活决策和控制提供了一个通用框架，但代理需要学习的每个新任务都需要进行大量的数据收集工作。在其他机器学习领域（例如，自然语言处理或计算机视觉领域），研究者们通常在之前收集的大型数据集上进行预训练，以引导学习新任务。那么，如何能够为RL代理实现类似的预训练？对此，作者提出了一种用于预训练的行为先验方法，它能够从广泛的历史任务中捕获成功试验中观察到的复杂的输入-输出关系。在本文中，作者展示了如何将这类习得先验知识用于快速学习新任务之中，而不妨碍RL代理尝试新行为的能力。同时，实验证明了该方法在涉及图像观测和稀疏奖励函数的机器人操作领域中的有效性。
会议链接：AMiner - AI赋能科技情报挖掘
订阅了解更多论文信息，定制您的个人科研动态信息流：用户画像论文推荐-学术订阅 - AMiner

文章插图