论坛|CNCC新设仿生机器人论坛:仿生机器人的春天来了吗?( 四 )


语音交互技术牵涉到计算,但是由于对算力要求比较高,要考虑将一部分的计算放到云端,一部分的计算放到边缘侧,或者端侧。又因为计算牵扯到大量的不同类型的知识和数据,又会出现异构计算( Heterogeneous computing)的需求。同时在语音层面还有多模态交互、情感感知等需求,所以每一个技术分支都是非常具有挑战性的任务,特别在机器人这个领域。
AI科技评论:有人提到,将来人工肌肉和人工皮肤也会逐渐出现,具身学习和触觉--感知能力会使机器人再上一层楼。而最近的诺奖发现,视觉和本体感觉的连接需要一个分子大小的、像大门一样的感受器(piezo2),通过双目视觉,再通过这个感受器,身体上的受力得以进入神经系统,转化为电脉冲再上升至意识。两种说法分别提到了两种感知通路,皮肤感知和视觉感知,您认为未来仿生机器人发展的最佳感知路径是什么?
庞建新:毫无疑问,仿人机器人需要多维度的感知,建立视觉、听觉、触觉三合一的感知系统。
如果是视觉感知,最简单的方法是给机器人安装更多的视觉感知器件。人是双目感知,只能感知前方,并且存在对焦盲区。那么仿人机器人就可以通过多目视觉技术,建立360度的感知能力;红外感知技术,建立不可见光的感知技术。
第二个是听觉感知系统。人能够通过环境声音和人际交互声音辨别发生方位和发生内容,但是目前机器人的听觉感知源更多来自与人的交互。
第三个是触觉感知,当机器人碰到一个物体的时候,能够通过肢体感知到力,再通过关节输出力,完成控制任务。因为当机器人执行任务的时候,一定是有视觉盲区或者非结构的有人环境,所以这个时候能够让机器人有触觉感知,就具有非常好的应用价值。
AI科技评论:刚才也提到面向机器人这些人工智能技术其实还是很重要的,黄老师目前是侧重AI方面的研究。您现在所在的深圳市人工智能与机器人研究院的一些工作重点是什么,有哪些研究进展?
黄巍伟:我现在所在的深圳市人工智能与机器人研究院是深圳市的十大基础研究机构之一,在仿生领域,研究院团队已经做了一些非常不错的工作,包基于毛毛虫爬行机理的攀爬机器人,可以用于桥梁检测。我们现在也在做触觉传感材料,已经能够具有三维的力感知能力。我们也探讨多机器人间的联邦学习,因为一个机器人它能够学到的东西毕竟是少数,如果有成千上万个机器人分布在不同的场景中,每一个机器人学到单一功能之后,运用联邦学习将技能汇总,那么它们就可以快速进化。
我从事在机器人的智能研究方面,将重点放在了AI领域。我原来是做人形机器人以及机器人的控制,主要是基于机器人全身关节的动力学控制研究。这个也是一个很难的课题,但是机器人是一个复杂的系统,其中一块短板就是智能部分,所以我从机器人控制转移到机器人智能方面的研究。当然这两部分也可以很好地结合起来,比如强化学习和大规模预训练模型等。大规模预训练模型研究已经在语言处理、视觉方面取得了显著的成果,那是否能和复杂的全身关节动力学控制结合,形成机器人的控制的新突破,这个也未可知。
AI科技评论:黄老师这边您谈到现在主要做的是AI领域的研究,涉及大型预训练模型、规则学习、联邦学习等,您现在看来,AI如何赋能仿生机器人?
黄巍伟:对于机器人来说,一个是本体的运动机能,二是智能。目前对于机器人来说,一个很大的制约是自适应性。人和动物都具有自适应能力,我们遇到一些情况时会依据环境的反馈及时、实时调整。那么如何能够达到自适应的控制,需要学习参考人和动物的神经反应和运动机能的特性。这种自适应能力中,一个重要方面就是感知。现在应用较多的是基于深度学习的视觉感知,视觉算法在识别、分割和体态预估等方面具有很好的准确率。皮肤的传感对于生物的控制起了非常大的作用。对于一个大规模又比较复杂的系统,如果它信号源非常多,又比较难以做量化分析的时候, AI的深度学习模型可以帮组模拟皮肤感知。
另外一个方面是决策,我们用AI去更好的模拟决策实现自适应。目前,我们对于大脑的研究,还是处于一个非常不清晰的过程。不管是人脑的运动机理、信息处理机理,很多时候只能通过我们看到的结果去做近似地模拟。未来如果面向机器人的技术能够有突破的话,需要有理论性的突破或者是生物学参照,使得我们用 AI模拟的时候更有方向性。