『懂懂笔记』让计算机看懂世界：格灵深瞳与华为Atlas AI的故事

本文插图
人脸识别已经被广泛应用在各个领域，但当新冠肺炎来袭的时候，戴着口罩的你如何证明你是你？
发现一个犯罪嫌疑人，但是视频没有捕捉到他的脸。能不能通过衣服的颜色、布料的纹理，查找相似的ID?
有违章或是犯罪行为的车辆，往往会遮挡号牌或是使用套牌，那么用车牌号就不能正确辨识车辆的身份，能不能通过更细致的外观把它找出来？
视频识别在我们现实中的应用越来越广泛，很多我们想得到的、想不到的， AI已经带给我们越来越多的惊喜与惊叹。但，这也都是在进程当中，现实的应用场景对AI不断提出更高的挑战：以前只要能识别人脸就可以了，现在你要能识别戴口罩的人；以前通过人脸照片追查罪犯，现在看不到脸也能把他找出来；以前通过车牌号码辨别车辆身份，现在则要通过车身细节去追踪……
“人们往往高估一项技术的短期表现，而低估一项技术的长期表现。 ” 已经从事17年计算机视觉研究的格灵深瞳信息技术有限公司CTO邓亚峰深有体会， AI是一个长跑，自己的实力很重要，陪伴的伙伴也很重要。
从看见到看懂， AI在各行各业中落地才有价值关于AI ，我们常常听到智慧城市、机器人、自动驾驶、智慧医疗、工业视觉、AR等，这些都是AI的应用场景。如果说到AI的核心技术，主要是三个方向：计算机视觉、语音识别、自然语言理解。也就是说，在三个技术方向上的深入，可以应用到各种场景当中去发挥价值。
【『懂懂笔记』让计算机看懂世界：格灵深瞳与华为Atlas AI的故事】

本文插图
在我们人类物理世界来看，视觉可以占到人体各种感觉器官接受信息的80% 。所以，视觉是人与外界沟通最重要的途径。同样，在数字世界里，计算机视觉的发展也决定着AI的走向与能力。 “计算机视觉是智慧物联网时代最大的数据入口，拥有广阔的应用场景。 ” 格灵深瞳信息技术有限公司CTO邓亚峰表示，无论智慧城市、机器人、自动驾驶、智慧医疗、智能制造，所有这些应都离不开计算机视觉这一项AI基础技术。
在智慧城市的应用中，可以通过人的行为轨迹分析找线索、发现规律，甚至提前预知异常。比如某个人白天不出门，经常是后半夜出门，而且行为轨迹也不是去某个固定的工作场所，那么这个人就有可能是犯罪嫌疑人。
再比如在智能商业应用中，通过人脸识别将同一个人多次到店关联起来，利用人脸将商品购买记录关联起来，并形成动线和热力图。有时候，通过海量数据汇集后， AI真的可以“比你更了解你” 。
“看见”这个世界并不能，但“看懂”这个世界却非常难。在中国现在有近2亿的安防摄像头，但其产生的视频数据有80%是冗余信息。 AI如何通过深度学习、高性能运算及大数据技术，在这些数据中筛出有用的价值。
格灵深瞳就是一家以“让计算机看懂世界”为愿景的公司。他们与华为联合打造的全目标结构化系统，集结构化分析、数据存储、数据应用于一体的高性能、高密度计算系统，以解决对人体、机动车、非机动车、人脸等全目标的特征识别和快速检索。其主要功能包括目标检测、跟踪、分类、全目标特征识别、以图搜图、轨迹分析、综合布控、违法分析等应用。这个系统能够有效处理大规模视频数据，将广泛具备并发能力强、分析识别准、运算速度快、检索效率高等优势，可实现预警、布控、研判等多种应用，提高办案效率。应用于包括智慧城市、公共安全领域各类场景。
没必要重复造轮子，让算法工程师的工作变得简单而极致单机实现384路极致高密视频实时分析，支持图片分析（检测、结构化、特征提取）不低于1200张/秒——这些听起来不明觉厉的技术，是如何在高效的机器视觉系统上实现的呢？