【前沿】谷歌推出新技术,用视频训练机器人

【前沿】谷歌推出新技术,用视频训练机器人

近期,谷歌公司的研究人员提出了一种训练机器人的新方法,

让机器人仅仅通过观看视频,就能在无人监督的情况下,模拟视频动作的全过程。

目前该方法已经能成功应用于训练机器人完成倒水、放置碗碟以及姿势模仿等任务。

 

【前沿】谷歌推出新技术,用视频训练机器人

机器人可通过观看视频学习倒水

 

该方法被称为“

时间对比网络

,简称为TCN

Time-Contrastive Networks

),主要分为两步:

第一步

对需要模仿的动作录制多角度的多部视频,以时间作为参照系,让机器人对同一动作不同角度的视频进行分解镜头的识别。经过以上的视频识别过程,产生一组嵌入向量,其中含有和任务相关的有效动作,以及一些随机行为,来体现真实世界中的各种可能状态。随后,

使用Triplet loss误差函数对以上向量数据进行处理。在同一帧的多视角观察数据的基础上,将多视角下同时出现的各帧图像,在嵌入向量中互相关联起来。

 

【前沿】谷歌推出新技术,用视频训练机器人

学习视频由同一动作的多角度多部视频组成

 

第二步

根据第一步对真人示范视频识别产生的TCN嵌入向量,构建一套奖励函数。机械臂起初会尝试一些随机动作,然后与奖励函数进行反复对比修正,进而产生并保留获得最高奖励的动作,最后达成重现视频任务的效果。

据谷歌公司的研究人员称,

向量模型在仅仅经历了9次迭代后就能成功收敛,即大约相当于需要15分钟的训练。

例如在移碟任务中,机器人最初尝试随机运动,然后很快就学会了拿起和移动一个盘子。

 

内容整理自:科普中国

【前沿】谷歌推出新技术,用视频训练机器人