搞算法还要当“美学家”?旷视要用AI重新定义计算摄影( 二 )


旷视的工程师告诉智东西 , 对于“超画质” , 旷视追求的是整体影像拍照好看 , 这个好看主要是对于光的处理 。
“光有三个域 , 分别是时域、频域、空域 。 旷视超画质做的核心工作 , 就是对三个域上的信号进行增强 , 或者优化处理 。 ”
就比如对于噪声的优化 , 旷视算法的核心就是对时域和空域信号的补充 。
首先AI会对自然光谱进行学习并总结特性 , 然后就可以借此对相机传感器所捕捉的信号进行分辨 , 哪些是噪声 , 哪些是成像需要的信号 。 最后把需要的部分还原 , 把噪声的部分去掉 , 这就是AI在降噪算法上的一个典型应用 。
三、计算摄影的本质 , 是“光感知”的协同设计从超画质技术 , 我们可以看出旷视对于计算摄影的发展路径有着自己的理解和判断 。
其实拍摄本质上是一个“光感知”的过程 。 光:光线本身及光学路径;感:接收光线做光电转化;知:将光信号做计算处理 。
形象的来理解 , 其实可以比作人眼看到物体的过程 。 人眼中的晶状体和角膜是光学系统 , 而感知的部分是视网膜 , 处理的部分是大脑 。
以前手机相机硬件之间的交流是通过相对固定的信息参数 , 光的部分以镜头为媒介 , 把参数给到感的部分(传感器) , 基于这些信息感的部分来做优化设计 , 这是单一“小水管”形式 , 各个部分单打独斗 , 各自提升 。
搞算法还要当“美学家”?旷视要用AI重新定义计算摄影文章插图
而现在通过AI算法 , 旷视在各硬件之间搭建了一个类似神经网络的链接 , 从最优影像效果出发 , 优化各个硬件的参数 。
搞算法还要当“美学家”?旷视要用AI重新定义计算摄影文章插图
旷视的工程师特别强调说 , 光感知系统是一个整体 , 他们一定是协调工作的 。 逻辑上是通过扩大整体信息管道的通量 , 让不同硬件设备之间形成更有效的全局优化 , 使整个系统的效果更往上走一个台阶 。
旷视将这种思路和方法称为:用AI重新定义光感知系统 。 而AI计算摄影就是旷视在手机影像领域应用这种方法的体现 。
四、为了让AI更懂“什么是美” , 先要把自己训练成“美学家”可以看到 , AI的加入让影像系统的算法之争又上升到了一个更高的维度 , 而这也需要大量研发人员、大量研发资金的投入来慢慢打磨 。
九年前 , 旷视进入了AI视觉这条赛道 。 从面部识别到计算摄影算法 , 他们一直在拓展自己在AI算法领域的研究边界 。
目前旷视研究院已经拥有500多位研究员 , 据称这样的规模在全球范围内也属于比较领先 。
为了提升超画质的实际表现 , 旷视搭建了自己的光学实验室、图卡实验室等专业实验室 。
旷视的工程师告诉智东西 , 为了让AI更懂“什么是美” , 他们从事超画质研发的同学 , 在训练算法前 , 都要先将自己训练成能够辨识美的“美学家” , 只有自己能够熟练辨识什么是好照片 , 才能开发出实际表现更贴近用户需求的超画质算法 。
就比如 , 色彩的表现力和自然真实之间如何做取舍?这就是一个非常令人纠结的问题 。 这时候 , 就不能盲目训练算法 , 而是要先通过人来评判 。
旷视的超画质工程师们会跟专业的图像质量测评集去打交道 , 也会跟客户一起讨论 , “先把自己训练出来 , 知道怎样做好看了 , 才知道自己做的图是不是好 。 ”
凭借研发人员这种认真和执着 , 依托旷视Brain++平台的能力 , 在不到2年的时间里 , 旷视超画质技术已经迭代到3.0版本 , 整体研发及交付效率提升了6倍 。
搞算法还要当“美学家”?旷视要用AI重新定义计算摄影文章插图
从算法驱动到价值驱动 。 旷视的工程师说 , 客户曾有一句评价令他们印象很深刻:“旷视只要选好方向 , 就非常坚定 , 最终能够做出来好的产品 。 ”