傻大方


首页 > 潮·科技 > >

数据|自动驾驶规模化落地的“三座大山”



按关键词阅读:

数据|自动驾驶规模化落地的“三座大山”
文章插图
图片来源@视觉中国
文丨AI商业周刊
深度学习技术很玄幻。它不可解释,又蕴含人生哲学。
比如它需要喂大量的感知数据,且数据的质量直接影响算法精度。对比我们为人,多与优秀、厚德之人交友,更能提升修养——也解释了环境为何能影响人。
数据是机器认知世界的“粮食”,算法就像大脑和思维方式,算力如身体。如果你有强大的脑力,但缺乏强壮的体魄,再好的算法亦如过眼云烟。中国的传统思想很强调提升个人思想与修养,但体魄是我们实现这些的基础。
算法又与人类解决实际问题很相通,比如计算机的车牌检测是一种算法,垃圾检测是一种算法,识别犯罪团伙也是一种算法,医学影像又是一种算法……计算机处理大事小事均有不同类型的算法。相比较人类,处理工作当中的人际关系是一种算法,财务管理是一种算法,写代码是一种算法……方式方法分门别类。反之推理,人类要更好解决问题,可参考计算机的认知世界的模式:不断寻找和优化最好的方式方法,就像算法迭代和升级那样。
为何要讲深度学习与人类处理实际问题的关联?因为本文涉及自动驾驶技术发展的面临的关键问题:伦理道德。在讨论这个问题之前,须先探讨行业面临的关键技术难题,自动驾驶规模化商业落地,技术才是源头和根本。
视觉技术:自动驾驶破局的核心如果站在未来回顾科技发展,2021年一定很特别,这一年,世界与中国都发生了深刻变革。全球气候危机逼近,新冠疫情关键转折,中国生育率首次低于日本,互联网巨头垄断时代落幕,汽车产业也到了巨变的前夜。
数据|自动驾驶规模化落地的“三座大山”】2021年,也是移动互联网时代的结束,一个全新的硬科技创新的周期敲响钟声了。在这个新的技术周期里,自动驾驶如灿烂星空的一道耀眼的光。
今年,大量车厂发布了L3和L2自动驾驶解决方案,接下来将有大量带着这些解决方案的车在路上跑。2021年也被称为自动驾驶元年。
特斯拉CEO埃隆·马斯克在2021年新能源世界大会上说,“特斯拉相信自动辅助驾驶可以完全通过视觉神经网络来实现,因为人就是生物意义上的视觉神经网络驾驶的,所以计算机也一定可以。”
与人类一样,机器感知世界最重要的方式就是视觉,占比近60%,远超听觉、嗅觉、味觉。马斯克也表示,视觉可以应对95%-99%的辅助驾驶场景。
数据|自动驾驶规模化落地的“三座大山”
文章插图
但马斯克说的纯视觉技术路径也存在一个很大的BUG,由于深度学习的通用能力局限,机器很难把看到过的场景泛化到一个全新陌生的环境,车在路上遇到未看过的场景就会“不知所措”。
要应对这个行业痛点,AI商业评论认为,主要有三种方法:
其一,通用人工智能(AGI)技术取得飞跃。谷歌、微软以及商汤科技等前沿AI企业均在大力研发通用AI。
今年10月30日,谷歌人工智能主管Jeff Dean发文,称他们正在研究下一代AI框架Pathways,目标直指AGI。
仅不到一个月,11月17日,上海人工智能实验室联合商汤科技SenseTime、香港中文大学、上海交通大学共同发布了新一代通用视觉技术体系“书生”(INTERN),该体系旨在系统化解决当下人工智能视觉领域中存在的任务通用、场景泛化和数据效率等一系列瓶颈问题。
微软也于2019年向OpenAI投资10亿美元,以支持构建具有广泛经济效益的通用人工智能技术(AGI)。
因为通用人工智能拥有强大的泛化能力,能做到“触类旁通”,以少量的数据就可完成数据训练。
其二,为深度学习算法喂大量数据,让其准确率达到自动驾驶上路要求。特斯拉今年8月份开始陆续抛弃毫米波雷达,彻底选择了纯视觉技术路线,离不开其长期大量的数据积累和数据训练。特斯拉首席财务官Zachary Kirkhorn说,到目前为止,特斯拉已经收集了超过1亿英里的驾驶数据。算法与算力相辅相成,特斯拉的AI超算也排名世界前三。
其三,多传感器融合方案,即视觉+激光雷达+毫米波雷达。视觉相当于人的眼睛,但还有听觉,多种感知结合能让机器成为一个更健全的“人”。
马斯克说的“视觉可以解决95%-99%的辅助驾驶场景”限定得很清楚,仅“辅助驾驶”场景。因为视觉无法应对阳光直射、超低能见度情况,无法应对,而通过多传感器融合方案能有效提高自动驾驶鲁棒性和应对复杂场景的能力。


稿源:(钛媒体APP)

【傻大方】网址:/c/1130a9B42021.html

标题:数据|自动驾驶规模化落地的“三座大山”


上一篇:奇绩|2021年陆奇眼中的未来:“元宇宙”、“智能汽车”与中国新经济时代的主旋律

下一篇:出货量|我国 5G 终端用户达 4.5 亿户,占全球 80% 以上