【前沿】谷歌推出新技术，用视频训练机器人近期

近期，谷歌公司的研究人员提出了一种训练机器人的新方法，

让机器人仅仅通过观看视频，就能在无人监督的情况下，模拟视频动作的全过程。

目前该方法已经能成功应用于训练机器人完成倒水、放置碗碟以及姿势模仿等任务。

机器人可通过观看视频学习倒水

该方法被称为“

时间对比网络

”

，简称为TCN

（

Time-Contrastive Networks

），主要分为两步：

第一步

对需要模仿的动作录制多角度的多部视频，以时间作为参照系，让机器人对同一动作不同角度的视频进行分解镜头的识别。经过以上的视频识别过程，产生一组嵌入向量，其中含有和任务相关的有效动作，以及一些随机行为，来体现真实世界中的各种可能状态。随后，

使用Triplet loss误差函数对以上向量数据进行处理。在同一帧的多视角观察数据的基础上，将多视角下同时出现的各帧图像，在嵌入向量中互相关联起来。

学习视频由同一动作的多角度多部视频组成

第二步

根据第一步对真人示范视频识别产生的TCN嵌入向量，构建一套奖励函数。机械臂起初会尝试一些随机动作，然后与奖励函数进行反复对比修正，进而产生并保留获得最高奖励的动作，最后达成重现视频任务的效果。

据谷歌公司的研究人员称，

向量模型在仅仅经历了9次迭代后就能成功收敛，即大约相当于需要15分钟的训练。

例如在移碟任务中，机器人最初尝试随机运动，然后很快就学会了拿起和移动一个盘子。

内容整理自：科普中国