懒人福音!谷歌AI整理房间、收盘子、叠罗汉,样样拿手!
文章图片
新智元报道
编辑:Q
【新智元导读】谷歌AI研究院的研究人员提出了「TransporterNetwork」 , 用全新方式实现3D理解 , 可以让机械臂更好更快的进行操作 。
重新排列物体(比如整理书架上的书籍 , 移动餐桌上的餐具 , 或者推一堆咖啡豆)是机械臂一项基本技能 , 它可以让机器人与我们多样化、非结构化的世界进行身体互动 。
尽管对于人们来说很容易 , 但是对于具身机器学习系统(embodiedmachinelearningsystems)来说 , 完成这些任务仍然是一个开放的研究挑战 , 因为它需要高水平和低水平兼备的感知推理 。 例如 , 当堆叠一堆书时 , 你可以考虑书应该堆放在哪里、以何种顺序 , 同时确保书的边缘彼此对齐形成一堆整齐的书 。
文章图片
在机器学习的许多应用领域中 , 模型结构中的简单差异可以表现出大不相同的泛化特性 。 因此 , 人们可能会问 , 是否有某些深层网络结构支持重新排列问题的简单底层元素 。
例如 , 卷积结构在计算机视觉中很常见 , 因为它具有平移不变性 , 即使图像发生移动也会产生相同的响应 , 而Transformer结构在语言处理中很常见 , 因为它们利用自注意力来捕捉长距离的上下文相关性 。 在机器人技术应用中 , 一个常见的结构是在学习模型中使用以对象为中心的表示 , 例如姿势、关键点或对象描述符(objectdescriptors) , 但是这些表示需要额外的训练数据(通常是手动注释) , 并且很难描述复杂的场景 , 例如变形物(例如playdough)、液体(蜂蜜)或成堆的东西(剁洋葱) 。
最近 , 谷歌AI的研究人员提出了TransporterNetwork , 这是一个用于学习基于视觉的重排任务的简单模型结构 。
TransporterNetwork使用一种新颖的方法来实现3D空间理解 , 避免了依赖于以对象为中心的表示 , 使得它们对基于视觉的操作更加通用 , 但是比基准的端到端的替代方法更有效率 。 因此 , 它适合快速和实用的训练真正的机器人 。 同时研究人员还发布了一个与Ravens一起的TransporterNets的开源实现 , 这是基于十项视觉的操作任务的新的模拟基准套件 。
TransporterNetwork:为机器操作重新排列视觉世界
TransporterNetworks背后的关键思想是:人们可以将重新排列问题表述为学习如何移动一块三维空间 。
3D空间并不依赖于对象的明确定义(这一定会在捕捉所有边缘情况方面遇到困难) , 而是对可以作为被重新排列的原子单元(atomicunits)的更广泛的定义 , 它可以广泛地包含一个对象、一个对象的一部分或多个对象等 。
TransporterNets通过捕捉3D视觉世界的深层表征来利用这种结构 , 然后将其部分覆盖在自身上 , 以想象各种可能的3D空间重排 。 然后 , 它选择在训练过程中看到的最匹配的重新排列方式(如来自专家演示的结果) , 并使用它们来参数化机器人的动作 。
这个方式允许TransporterNets泛化到看不见的对象 , 并使它们能够更好地利用数据中的几何对称性 , 以便它们能够外推到新的场景配置当中去 。 TransporterNets适用于机器人操作的各种各样的重新排列任务 , 扩展了早期的模型 , 比如基于启示(affordance-based)的操作和TossingBot , 它们只关注抓取和抛掷 。
TransporterNets捕捉了视觉世界的深层表征 , 然后将其部分覆盖在自身上 , 想象各种可能的3D空间重组 , 以找到最好的一个 , 并通知机器人的行动 。
RavensBenchmark
为了在一致的环境中评估TransporterNets的性能 , 以便与基线和消融进行公平的比较 , 谷歌研究人员开发了Ravens , 这是一个由10个基于视觉的重排任务组成的基准测试套件 。
Ravens提供了一个内置随机oracle的GymAPI来评估模仿学习方法的样本效率 。 Ravens避免了不能转化为实际设置的假设:观察数据只包含RGB-D图像和摄像机参数;动作是终端执行器姿态(与逆运动学转换到关节位置) 。
对这10个任务的实验表明 , TransporterNets比其他端到端方法的效率高出数量级的区别 , 并且只需100个演示就可以在许多任务上获得90%以上的成功率 , 而基线方法很难用同样数量的数据进行泛化 。
在实践中 , 这使得收集足够的演示成为在真实机器人上训练这些模型的一个更可行的选择 。
文章图片
Highlights
这里给出10个例子演示 , TransporterNets可以学习挑选和放置任务 , 如堆叠盘子;多模态任务 , 如对齐任何一个角落的一个盒子上的桌面标记 , 或建立一个金字塔的块 。
- DNF:玩家福音,侠客行、讨伐战加速护石毕业,你准备好了吗?
- 温婉又时尚的显瘦穿搭,白色上衣+牛仔裤穿搭,轻松完成!米白色短袖+白色小外套,精致温婉 。白色上衣+阔腿牛仔裤,微胖女生的福音!浅色穿搭+
- 3月6日六大地区谷歌商店畅销榜排行:《F/GO》日区排名上升
- 10月份鸿蒙几乎不会使用Android和谷歌代码,对此你是怎么看的_创业者李孟博客
- 颜值党福音来啦!新派策略回合游戏《梦想世界3》重磅上线
- 爆料称谷歌 “亲儿子”Pixel 5a 将于 6 月 11 日发布
- 一脚踢死焊门员?realme真我GT正式发布,游戏党的福音!
- 微软 Whiteboard 白板上线谷歌 Play Store
- 香檬汁也是上班族们的福音,你值得拥有!
- 谷歌关键字匹配类型简化更新解读