『懂懂笔记』让计算机看懂世界:格灵深瞳与华为Atlas AI的故事


『懂懂笔记』让计算机看懂世界:格灵深瞳与华为Atlas AI的故事
本文插图
人脸识别已经被广泛应用在各个领域 , 但当新冠肺炎来袭的时候 , 戴着口罩的你如何证明你是你?
发现一个犯罪嫌疑人 , 但是视频没有捕捉到他的脸 。 能不能通过衣服的颜色、布料的纹理 , 查找相似的ID?
有违章或是犯罪行为的车辆 , 往往会遮挡号牌或是使用套牌 , 那么用车牌号就不能正确辨识车辆的身份 , 能不能通过更细致的外观把它找出来?
视频识别在我们现实中的应用越来越广泛 , 很多我们想得到的、想不到的 , AI已经带给我们越来越多的惊喜与惊叹 。 但 , 这也都是在进程当中 , 现实的应用场景对AI不断提出更高的挑战:以前只要能识别人脸就可以了 , 现在你要能识别戴口罩的人;以前通过人脸照片追查罪犯 , 现在看不到脸也能把他找出来;以前通过车牌号码辨别车辆身份 , 现在则要通过车身细节去追踪……
“人们往往高估一项技术的短期表现 , 而低估一项技术的长期表现 。 ” 已经从事17年计算机视觉研究的格灵深瞳信息技术有限公司CTO邓亚峰深有体会 , AI是一个长跑 , 自己的实力很重要 , 陪伴的伙伴也很重要 。
从看见到看懂 , AI在各行各业中落地才有价值 关于AI , 我们常常听到智慧城市、机器人、自动驾驶、智慧医疗、工业视觉、AR等 , 这些都是AI的应用场景 。 如果说到AI的核心技术 , 主要是三个方向:计算机视觉、语音识别、自然语言理解 。 也就是说 , 在三个技术方向上的深入 , 可以应用到各种场景当中去发挥价值 。
【『懂懂笔记』让计算机看懂世界:格灵深瞳与华为Atlas AI的故事】
『懂懂笔记』让计算机看懂世界:格灵深瞳与华为Atlas AI的故事
本文插图
在我们人类物理世界来看 , 视觉可以占到人体各种感觉器官接受信息的80% 。 所以 , 视觉是人与外界沟通最重要的途径 。 同样 , 在数字世界里 , 计算机视觉的发展也决定着AI的走向与能力 。 “计算机视觉是智慧物联网时代最大的数据入口 , 拥有广阔的应用场景 。 ” 格灵深瞳信息技术有限公司CTO邓亚峰表示 , 无论智慧城市、机器人、自动驾驶、智慧医疗、智能制造 , 所有这些应都离不开计算机视觉这一项AI基础技术 。
在智慧城市的应用中 , 可以通过人的行为轨迹分析找线索、发现规律 , 甚至提前预知异常 。 比如某个人白天不出门 , 经常是后半夜出门 , 而且行为轨迹也不是去某个固定的工作场所 , 那么这个人就有可能是犯罪嫌疑人 。
再比如在智能商业应用中 , 通过人脸识别将同一个人多次到店关联起来 , 利用人脸将商品购买记录关联起来 , 并形成动线和热力图 。 有时候 , 通过海量数据汇集后 , AI真的可以“比你更了解你” 。
“看见”这个世界并不能 , 但“看懂”这个世界却非常难 。 在中国现在有近2亿的安防摄像头 , 但其产生的视频数据有80%是冗余信息 。 AI如何通过深度学习、高性能运算及大数据技术 , 在这些数据中筛出有用的价值 。
格灵深瞳就是一家以“让计算机看懂世界”为愿景的公司 。 他们与华为联合打造的全目标结构化系统 , 集结构化分析、数据存储、数据应用于一体的高性能、高密度计算系统 , 以解决对人体、机动车、非机动车、人脸等全目标的特征识别和快速检索 。 其主要功能包括目标检测、跟踪、分类、全目标特征识别、以图搜图、轨迹分析、综合布控、违法分析等应用 。 这个系统能够有效处理大规模视频数据 , 将广泛具备并发能力强、分析识别准、运算速度快、检索效率高等优势 , 可实现预警、布控、研判等多种应用 , 提高办案效率 。 应用于包括智慧城市、公共安全领域各类场景 。
没必要重复造轮子 , 让算法工程师的工作变得简单而极致 单机实现384路极致高密视频实时分析 , 支持图片分析(检测、结构化、特征提取)不低于1200张/秒——这些听起来不明觉厉的技术 , 是如何在高效的机器视觉系统上实现的呢?