#人工智能#扎根多模态，是新基建中AI走向未来的必由之路？ |技术|美好，一直在身边|物联网|

随着AI发展和信息化的迭代，不同信息从不同方位、不同传感器一拥而入，单一识别技术已经很难满足这样的发展，在这种情况下，多模态技术应场景而生。但多模态并不是单... ...

本文插图
作者：珍珍
编辑：杨阳
近日，由蚂蚁金服牵头制定的“生物特征识别多模态融合国际标准”正式立项，这一标准的制定，对于多模态领域发展与技术规范产生了重大影响。
为此，笔者与眼神科技、云从、银河水滴等多个企业方，进行了关于多模态领域发展主题的对话。相较于多模态，我们应该先了解单模态。在对话中笔者了解到，对于指纹识别、人脸识别、虹膜识别、指静脉识别等每一种生物识别技术，通过每一种算法用一个传感器去解决一个问题的模式，即为单模态。
后来，随着AI发展和信息化的迭代，不同信息从不同方位、不同传感器一拥而入，单一识别技术已经很难满足这样的发展，在这种情况下，多模态技术应场景而生。但多模态并不是单模态的简单叠加或组合替代，而是基于数据融合的算法融合、并依托平台决策为支撑，是单模态生物识别技术的重大突破，也是识别技术的未来发展方向。
目前，多模态技术主要应用于线上娱乐、身份认证、医疗健康、智慧金融、安防、教育、军工、园区等领域。
应用驱动下，多模态成AI行业发展新风向多模态从2018年开始成为技术行业的焦点。那时，很多国内大企业，如华为、腾讯、百度、阿里等公司，都开始逐渐把目光瞄向多模态；很多创业公司，如眼神科技、云从、依图、银河水滴等也在思考这个方向性的发展问题。
腾讯AI Lab的博士俞栋曾说“多模态是迈向通用人工智能的重要方向” ，通用人工智能是弱人工智能时代需要走的一个方向，弱人工智能是“见多识广” ，解决的是感知问题。
在眼神科技创始人兼CEO周军看来：“通用人工智能具有几个属性：自学习、增量学习、增强学习，这些内容结合在一块，是强人工智能。从弱人工智能到强人工智能的奇点，截止目前还没有突破。 ”“见少知多”、“不见而预知”的强人工智能时代，这是国际前沿人工智能公司一直努力多年的事情，但是技术遇到了天花板。
据了解，眼神科技从早期就已经完成了指纹识别、人脸识别、虹膜识别技术的研发，形成基础算法，其在面向市场推广中发现，单一技术决策存在局限，并在应用驱动下推出多模态融合生物识别技术。 “多模态融合生物识别可以提升识别精准度，也能在一定程度提升生物识别技术的场景适应性和隐私安全性。 ”眼神科技表示。
简单来说，模态就是“感官” ，多模态就是将多种感官融合的方式。云从科技解释道：“如果把‘模态’通俗地理解为感官，那么智能音箱就是一台只具备听觉模态的物联网设备，而加载AI分析能力的摄像头可以视为视觉模态的物联网设备，把听觉、视觉甚至更多模态组合到一起，可诞生多模态物联网” 。
与眼神科技、云从科技领域略有不同的步态识别企业银河水滴表示， “多模态技术在我国早已得到广泛应用，如在公共安防领域。另外，指纹和人脸识别等技术的配合使用也比较成熟，目前正在向更深入更广泛的程度迈进，在这个过程中，步态识别技术越来越受到重视” 。
据悉，步态识别是一种新兴的生物特征识别技术，相较于其他识别方式，步态识别的识别距离更远。例如，普通高清摄像机下识别距离最远可达50米，属于非受控识别，无需识别对象主动配合。步态识别是由体型、头型、肌肉力量、运动神经灵敏度、走路姿态等共同决定，局部变化并不会影响识别结果。