#人工智能#扎根多模态,是新基建中AI走向未来的必由之路?


随着AI发展和信息化的迭代 , 不同信息从不同方位、不同传感器一拥而入 , 单一识别技术已经很难满足这样的发展 , 在这种情况下 , 多模态技术应场景而生 。 但多模态并不是单... ...
#人工智能#扎根多模态,是新基建中AI走向未来的必由之路?
本文插图
作者:珍珍
编辑:杨阳
近日 , 由蚂蚁金服牵头制定的“生物特征识别多模态融合国际标准”正式立项 , 这一标准的制定 , 对于多模态领域发展与技术规范产生了重大影响 。
为此 , 笔者与眼神科技、云从、银河水滴等多个企业方 , 进行了关于多模态领域发展主题的对话 。 相较于多模态 , 我们应该先了解单模态 。 在对话中笔者了解到 , 对于指纹识别、人脸识别、虹膜识别、指静脉识别等每一种生物识别技术 , 通过每一种算法用一个传感器去解决一个问题的模式 , 即为单模态 。
后来 , 随着AI发展和信息化的迭代 , 不同信息从不同方位、不同传感器一拥而入 , 单一识别技术已经很难满足这样的发展 , 在这种情况下 , 多模态技术应场景而生 。 但多模态并不是单模态的简单叠加或组合替代 , 而是基于数据融合的算法融合、并依托平台决策为支撑 , 是单模态生物识别技术的重大突破 , 也是识别技术的未来发展方向 。
目前 , 多模态技术主要应用于线上娱乐、身份认证、医疗健康、智慧金融、安防、教育、军工、园区等领域 。
应用驱动下 , 多模态成AI行业发展新风向 多模态从2018年开始成为技术行业的焦点 。 那时 , 很多国内大企业 , 如华为、腾讯、百度、阿里等公司 , 都开始逐渐把目光瞄向多模态;很多创业公司 , 如眼神科技、云从、依图、银河水滴等也在思考这个方向性的发展问题 。
腾讯AI Lab的博士俞栋曾说“多模态是迈向通用人工智能的重要方向” , 通用人工智能是弱人工智能时代需要走的一个方向 , 弱人工智能是“见多识广” , 解决的是感知问题 。
在眼神科技创始人兼CEO周军看来:“通用人工智能具有几个属性:自学习、增量学习、增强学习 , 这些内容结合在一块 , 是强人工智能 。 从弱人工智能到强人工智能的奇点 , 截止目前还没有突破 。 ”“见少知多”、“不见而预知”的强人工智能时代 , 这是国际前沿人工智能公司一直努力多年的事情 , 但是技术遇到了天花板 。
据了解 , 眼神科技从早期就已经完成了指纹识别、人脸识别、虹膜识别技术的研发 , 形成基础算法 , 其在面向市场推广中发现 , 单一技术决策存在局限 , 并在应用驱动下推出多模态融合生物识别技术 。 “多模态融合生物识别可以提升识别精准度 , 也能在一定程度提升生物识别技术的场景适应性和隐私安全性 。 ”眼神科技表示 。
简单来说 , 模态就是“感官” , 多模态就是将多种感官融合的方式 。 云从科技解释道:“如果把‘模态’通俗地理解为感官 , 那么智能音箱就是一台只具备听觉模态的物联网设备 , 而加载AI分析能力的摄像头可以视为视觉模态的物联网设备 , 把听觉、视觉甚至更多模态组合到一起 , 可诞生多模态物联网” 。
与眼神科技、云从科技领域略有不同的步态识别企业银河水滴表示 , “多模态技术在我国早已得到广泛应用 , 如在公共安防领域 。 另外 , 指纹和人脸识别等技术的配合使用也比较成熟 , 目前正在向更深入更广泛的程度迈进 , 在这个过程中 , 步态识别技术越来越受到重视” 。
据悉 , 步态识别是一种新兴的生物特征识别技术 , 相较于其他识别方式 , 步态识别的识别距离更远 。 例如 , 普通高清摄像机下识别距离最远可达50米 , 属于非受控识别 , 无需识别对象主动配合 。 步态识别是由体型、头型、肌肉力量、运动神经灵敏度、走路姿态等共同决定 , 局部变化并不会影响识别结果 。