第四届全球智能驾驶峰会|商汤科技移动智能事业群智能驾驶副总裁石建萍:高效解决长尾场景是智驾场景覆盖度提升的前提 | 石建萍( 三 )



第四届全球智能驾驶峰会|商汤科技移动智能事业群智能驾驶副总裁石建萍:高效解决长尾场景是智驾场景覆盖度提升的前提 | 石建萍
文章插图

目前商汤在内部搭建了整套的数据闭环系统,我们会在车端部署小模型,通过触发机制识别有价值的数据并自动存储下来进入数据平台。
在数据平台中,我们有大算力中心、海量的存储、高精度大模型,都能自动处理这样的数据。同时经过自动化标注、人工质检和精修实现干净标签数据集后,再回流到系统中。
因此,我们整个系统良好的运转,对各个环节的数据处理、高精度算法和海量算力都提出了更高的要求,这些就是商汤持续在积累的核心能力。
商汤过去在海量数据的基础上积累了非常多的能力,通过处理各行各业的数据,包括智慧城市、智慧商业、智慧生活中各种海量的数据,我们在此过程中沉淀出我们数据的自动、半自动标注手段。同时商汤的数据隐私处理能力,也能有效地避免数据上的敏感问题。
在算力方面,目前商汤有超过20个超算集群。明年初,我们也会在上海临港投入试运营临港AIDC,这将是亚洲最大的超算中心之一。同时在算法部分,我们更是在持续积累,我们有自研的训练框架、自研的超算系统,也有非常多的开源算法,与开发者社区进行更好的打通与资源共享。

第四届全球智能驾驶峰会|商汤科技移动智能事业群智能驾驶副总裁石建萍:高效解决长尾场景是智驾场景覆盖度提升的前提 | 石建萍
文章插图

在数据的部分,大家相对比较关注的,我们怎么样能灵活地提取信息同时,又保护了相关数据的隐私,也是我们持续布局的方向。除了软件数据脱敏相关的工作,我们在硬件、超算底层也是有独立的物理机房做完全的物理隔离和资源隔离,保证不同的数据完全在物理上的安全可控。
我们新建的AI超算中心基本上比行业最领先的超算中心的规模都要更大,将会支撑非常多的行业企业、科研单位等的研究与智能化落地。
在算力的性能指标上和对整个训练系统的极致优化上,我们也都有非常多的积累。基于人工智能基础设施底座,我们自研了训练框架,主要在优化工业级生产中的大规模数据以及并行计算能力。
同时,我们也形成了强大的科研联盟,在持续地研发领先的、顶级的算法,商汤的整个算法开源体系在行业中是最有影响力的,相信非常多的同学在最开始接触深度学习的算法方案时,也是从我们的OpenLab开源体系中获得的支撑。
基于以上能力的积累,我们把它沉淀成SenseAuto Empower产品,这个产品是我们为车企打造的数据闭环产品解决方案,包含车端数据筛选-车端数据上传-AI中心-AIDC数据中心,能进行数据自动化标注,包括进行自动化模型训练与优化、场景检测、影子模型优化,通过一系列的迭代,我们前台和后台的模型会持续更新发布。
在此过程中,我们的客户可以通过我们的系统,去进行他认为的困难场景问题和任务的管理。
而商汤沉淀出的数据、模型、集群及算力的管理能力,使得汽车摄像头在收集到海量场景后,我们能够将无意义的数据变成真正有意义的数据,并结合场景做整体的结构化处理,这也是我们认为未来自动驾驶系统最核心要迭代的功能。
第四届全球智能驾驶峰会|商汤科技移动智能事业群智能驾驶副总裁石建萍:高效解决长尾场景是智驾场景覆盖度提升的前提 | 石建萍】雷峰网#雷峰网#雷峰网