脑极体|正在城市上空上演,智能计算的武侠美学( 二 )


既要抗打 , 又要灵巧 , 各路招式融会贯通 , 显然需要一次底层硬件和软件的整体进化 。 想要回答这个时代命题 , 产业领军者的战略选择与具体动作就十分值得关注了 。
比武台上的江湖:领军者华为如何应对算力大考?
早在2017年 , 中国工程院院士李国杰就曾提到 , 人工智能可能是中国在超算上弯道超车的一条途径 。 在本届超级算力大会上 , 中国工程院院士郑纬民也进一步强调 , 高性能AI算力基础设施对促进经济发展、产业升级和科技进步具有重要意义 。
而华为作为ICT产业的“头雁”企业 , 在过去数年间正是按照这一发展方向布局数据基础设施 。 也凭借其在“大国算力”领域所做出的成绩 , 获得“大数据和智能计算领军企业”这一荣誉 。
这样的重磅奖项 , 显然不是无的放矢 。 根据评选标准我们发现 , 这个奖项是授予那些在计算领域开展架构创新 , 在通用计算与人工智能计算产业的发展中做出巨大贡献的企业 。 那么 , 华为在计算领域的先进性到底体现在哪些方面 , 或许能够帮我们解决当下关键历史时期关于智能计算的种种困惑 。
脑极体|正在城市上空上演,智能计算的武侠美学
文章图片
目前看来 , 华为针对前面提到的三个关键算力问题 , 做了以下工作:
1.底层研发“基本功” , 软硬件协同突破算力性能瓶颈 。
正如前面所说 , 单纯地升级制造工艺或堆叠芯片硬件 , 并不足以打破高性能计算的性能增长放缓问题 。 华为所提供的解决方案 , 则从计算架构、处理器、基础软件 , 以及华为云服务等一整个计算链条 , 通过长周期的研发投入 , 进而共同完成高性能计算集群的性能突围 。
比如华为基于新一代2U双插槽机架式服务器 , 其功耗比竞争对手低20% 。 软件层面 , 华为独创IO智能预取和SPARK机器学习算法及图增强算法 , 使能鲲鹏在大数据场景获得倍级性能提升 。 推出的开源数据虚拟化引擎openLooKeng , 则支持跨数据格式、跨数据源、跨数据中心的海量分析 , 华为合作伙伴北明软件所打造的北明数据资产管理平台V4.0 , 就基于openLooKeng大幅度提升了性能 。
以江苏电信为例 , 去年7月成功上线了全球首个基于鲲鹏处理器的运营商大数据平台 。 经过双方携手完成基于鲲鹏处理器的开源Hadoop源代码编译 , 让关键的大数据业务组件在华为TaiShan服务器上的成功部署 , 实现了两种不同架构的服务器有效兼容 。
软硬件的底层深度开发 , 是华为能够在智能计算领域厚积薄发的根本保障 。
脑极体|正在城市上空上演,智能计算的武侠美学
文章图片
2.AI与HPC融会贯通 , 打造全面智能的计算系统 。
武侠迷可能都知道 , 混练两种属性不同的上乘武功 , 可不是一加一等于二那么简单 , 很容易走火入魔 。 融合的过程就如同“增熵” , 在增加新事物的过程中也会让原本无伤大雅的小问题持续叠加 , 不及时纠正最终会导致整个系统走向混乱、失序 。
而人工智能算力系统更是具备高度异构、复杂多样、动态性强等等难题 , 极大地增加了系统的潜在不稳定性 。 如何将人工智能AI与高性能计算HPC融会贯通 , 提供弹性、泛在的算力服务 , 对于ICT厂商来说并非易事 。
华为的多样性计算解决方案 , 则覆盖了云、边、端的全栈AI , 一方面 , 建构了全面的AI产品创新矩阵 , 包含着昇腾系列AI芯片、全场景AI计算框架MindSpore、Atlas全系列产品和基于昇腾云服务等组成部分 。 无论是加速卡、加速模块、服务器等终端计算硬件 , 还是智能小站这样可以在边缘部署的产品 , 丰富的智能计算产品让不同场景各取所需 。
同时 , 算力系统与人工智能协同发挥各自优势 , 实现统一的散热设计、交换网络和运维管理 。 这种整体层面的规划部署 , 通过有机整合 , 能够较为容易地同时满足科学性、先进性、稳定性、经济性等需求 , 也更容易去适应政府、金融、电信、互联网、大企业等不同行业应用需求 , 让计算系统智能化得以实现 。