【前沿】谷歌推出新技术,用视频训练机器人
近期,谷歌公司的研究人员提出了一种训练机器人的新方法,
让机器人仅仅通过观看视频,就能在无人监督的情况下,模拟视频动作的全过程。
目前该方法已经能成功应用于训练机器人完成倒水、放置碗碟以及姿势模仿等任务。
机器人可通过观看视频学习倒水
该方法被称为“
时间对比网络
”,简称为TCN
(Time-Contrastive Networks
),主要分为两步:第一步
对需要模仿的动作录制多角度的多部视频,以时间作为参照系,让机器人对同一动作不同角度的视频进行分解镜头的识别。经过以上的视频识别过程,产生一组嵌入向量,其中含有和任务相关的有效动作,以及一些随机行为,来体现真实世界中的各种可能状态。随后,
使用Triplet loss误差函数对以上向量数据进行处理。在同一帧的多视角观察数据的基础上,将多视角下同时出现的各帧图像,在嵌入向量中互相关联起来。
学习视频由同一动作的多角度多部视频组成
第二步
根据第一步对真人示范视频识别产生的TCN嵌入向量,构建一套奖励函数。机械臂起初会尝试一些随机动作,然后与奖励函数进行反复对比修正,进而产生并保留获得最高奖励的动作,最后达成重现视频任务的效果。
据谷歌公司的研究人员称,
向量模型在仅仅经历了9次迭代后就能成功收敛,即大约相当于需要15分钟的训练。
例如在移碟任务中,机器人最初尝试随机运动,然后很快就学会了拿起和移动一个盘子。
内容整理自:科普中国
- DNF:韩服推出领主宠物,你们希望哪个领主被做成宠物呢?
- 加拿大证交所:推出受监管的代币募资平台
- 用了下谷歌翻译,是时候来一场说走就走了旅行了....
- 《神界:原罪2》中文版即将推出 汉化还在完善中
- 【恭贺新禧】包装前沿给读者朋友们拜年啦!新春大吉大利!
- 消息:南非中央银行将推出了基于ethereum的区块链PoC
- 雅达利宣布推出自家虚拟货币Atari Token
- 法拉第未来或获 15 亿美元融资 贾跃亭要推出第二款电动车了
- 更进一步!谷歌的 AI 自己就能玩多人游戏了
- LG 即将推出自己的手机 AI 助手,但好像为时已晚?