与非网|3D识别的想象空间,深度对话

艾迈斯半导体OPC部门业务发展经理徐冰博士和旷视科技产品市场总经理沈瑄的交流 , 刷新了我们对iPhone人脸识别背后的3D结构光技术的认知 , 也让我们看到这一技术未来的更多可能性 。
与非网|3D识别的想象空间,深度对话
文章图片
左:艾迈斯半导体OPC部门业务发展经理徐冰博士右:旷视科技产品市场总经理沈瑄
厘清3D识别的概念
徐冰博士首先澄清 , 人脸识别的实现方式有多种 , 如果具体讨论iPhone人脸识别功能背后 , 采用的是3D结构光的技术 , 这种技术本身并不能等同于生物识别 。
从手机的内部结构来看 , 除了基本的前置摄像头外 , 还集成了六七个传感器 。 其中点阵投影器会投射出高达30000个光点 , 红外镜头能就能获取人脸各个部分位置的形变数据 , 即脸的“结构” , 加上前置镜头记录的人脸图像 , 两者借助算法结合 , 就能得出一张精准的3D人脸数据图 。 比起单纯的基于2D平面图进行分析 , 这种三维深度数据显然更加真实有效 , 也更有价值 。
【与非网|3D识别的想象空间,深度对话】搞清楚3D结构光的背后原理就会发现 , 人脸识别解锁 , 只是这一技术的一个应用场景 , 背后包含了对更高维度信息的掌握和运用—让手机能够感知到现实世界的3D信息 , 才是结构光技术真正想要达成的目的 。
在这次疫情期间 , 对那些用惯了人脸识别解锁的用户而言 , 首先带来的不便就是手机打不开了 , 要回到传统的密码解锁模式 。 而很快我们发现多家科技公司实现了戴着口罩也可以进行人脸识别的技术 。 对此 , 徐冰博士解释 , “随着技术进步 , 这是完全可能而且是可行的 。 3D结构光这一技术是通过光打在人脸或物体上面来探测不同部分的深度 , 也叫人脸的特征点 , 不戴口罩的情况下 , 探测的特征点集中在耳朵、鼻子、嘴巴、眼睛这些部分 , 可以还原出整个人脸的轮廓特性 。 现在戴了口罩怎么办?当然有解决办法 , 就是把特征点选择在口罩以上部分 , 人的眼、眉毛、额头 , 都可以作为特征点 。 这时可能产生一个问题 , 从技术角度 , 这些特征点比过去少很多 , 怎么办?我们也有技术解决的路线 。 比如增加探测的特征点 , 因为这些特征点是通过光照上去的 , 将点密度增加 , 以上提到的眼、眉毛、额头的特征点就会体现的更加完整 , 更加精确 。 这就是随着技术进步说我们戴着口罩在某些场合某些设备是完完全全可以识别人脸的 。 ”
沈瑄补充 , “实现戴口罩解锁 , 关键点是在瞳孔的距离 , 瞳孔与鼻尖的距离 , 这些数据其实都在我们的设备里面 , 现在只是来比对口罩以上的部分 。 引出的另一个讨论是不戴口罩的时候 , 半侧脸是否也可以接受 , 因为现在我们必须要正对着摄像头才能接受 。 从误识率的角度 , 是完全没有任何问题的 , 算法已经可以完美的解决戴口罩的识别问题 。 ”
那些问题
协同设计问题 。 3D识别以及手机里各种传感部分部分的增多 , 引出的一个问题就是处理的数据量不断激增 , 带来的是端侧传感、处理等部分的协同设计问题 。 对此 , 沈瑄表示 , “解决这个问题 , 要尽可能在端侧 , 包括手机的主芯片里有一个加密区 , 以及另一个趋势是往sensor端 , 明年会看到很多摄像头的sensor开始有数据处理能力 , 包括人工智能的计算单元在sensor端 , 可以将一些原始数据进行预处理 。 这样做的好处是 , 一方面让主芯片、边缘侧以及云端的数据量的计算减少很多;另一方面 , 我们会把用户的个人隐私的数据在这部分进行剥离 , 做不可逆的脱敏处理 , 也是为了保护个人隐私 。 这里数据量我觉得不是问题 , 问题还是把sensor端、主芯片、端侧、云侧这些分布式的算力提高上来 。 ”
“从技术角度 , 在光源方面 , 3D人脸识别发出来的是主动光源 , 是点状的光源 , 用于3D人脸识别 , 有非常多的发光点 , 这个时候信息的处理量就非常大 。 ”徐冰博士从上游芯片供应商的角度提到 , “我们在重新设计光源 , 可以实现分片、分区或分条点亮 , 这样的处理带来两个好处 , 第一是数据处理量可以急剧减小 , 第二是明显降低功耗 。 ”