注意,英特尔和Arm不约而同“不务正业”!
我们对英特尔和 Arm 的印象,分别是 PC 与服务器市场,及移动应用领域的霸主,虽然这些厂商过去都曾尝试跨入对手的领域,但都不算太成功,
但在这次 2018 年 Computex 大会上,“不务正业”却成了主轴。
传统上,英特尔是 PC 与服务器方案大厂,但这次却没有太着墨于这两块主力产品,反而是没有公开展示的量子计算与云端 AI 方案布局有着较为精彩演出。
而 Arm 则是偏离过去的主旋律
,其在 Computex 前就已经发布新款架构,但这些架构不是针对过去所独霸的移动领域,而是瞄准了 PC 计算及 IoT 终端 AI 架构等应用,不仅威胁目前市场上的 X86 架构与独立 AI 芯片方案供应者,Arm 副总裁 Nandan Nayampally 也不讳言未来包含英特尔或 NVIDIA 都将成为其挑战的目标。
两大芯片架构公司不走过去的寻常路,不介意踩到过去传统观念中难以被撼动的固有领域,甚至也勇于挑战全新的市场技术,其实也是因为两家芯片架构公司在面临应用发展瓶颈的情况之下所不得不为的策略。
面临发展瓶颈的应对之策
图|PC 市场的不断衰退逼迫英特尔不得不另寻出路
英特尔在传统 PC 市场中已经陷于发展泥沼之中相当久的时间
,由于 PC 市场出货规模逐年衰退,光是要维持业绩不退就已经煞费苦心,而且还要花费巨资维持工艺技术与新架构的持续开发,若不增加新应用来扩充收入基础,那往后可能连工艺的维持费用都将难以为继,而过去其在移动终端的努力失败对英特尔亦造成相当大的打击,因此这次的布局可说是英特尔的背水一战,有不得不成功的压力。
图|中国智能手机出货在 2017 年反转向下,是对 Arm 的一声警钟
至于 Arm,
在移动智能终端市场虽占有极大的比重,但移动终端其实也面临与 PC 市场类似的情况,
那就是出货已经由成长逐渐迈入稳定,甚至在中国市场先一步进入微幅衰退的格局
,而其在被软银收购后喊到震天价响的 IoT 布局,也在近年的 AI 应用热潮中被抢了锋头,大家不关心 IoT 市场会怎么长,或是最后会长到多大,反而介意有没有办法把网络或者是 AI 功能引入这些领域。
另外,Arm 对 PC 市场的布局也可视为其在移动生态以及 PC 生态的的延伸和补充,通过 Arm 擅长的作法,扩大 Arm 架构的应用空间。由于 Arm 过去两年大幅扩充人力,但移动终端授权收入的停滞,以及来自 IoT 领域的应用并没有与人力的扩增幅度相对应的成长,让 Arm 蒙受很大的压力,虽然通过 Arm mini China 的成立稍微抒解资金的压力,并同时确保市场,但如果产品本身格局无法有效扩大,再加上 RISC-V 等新架构的挑战,那么未来 Arm 的发展仍会是个相当大的问号。
也因此,
英特尔与 Arm 近来的产品与技术布局乍看之下是不务正业,但实际上却是为了求生存的必要经营方向。
英特尔带来平淡的 PC 产品线更新,背后却藏了精彩的 AI 与“常温量子布局”
英特尔虽在今年的 Computex 发表了年度产品更新,但基本上就是惯例性的挤个牙膏,主打的 Whiskey Lake 和 Amber Lake 没有太多吸引人的特性,纯粹是为了补上低能耗的产品空缺,而其 28 核高效能平台图|Arm 的三大 AI 方案,补足了过去几年的空白单纯就是从服务器平台下放,而且在发表次日就被 AMD 的 32 核方案夺走了风采。
图|英特尔从服务器下放的 28 核产品将走向消费端,但面临来自 AMD 的 32 核方案的挑战
也因为英特尔在 PC 产业能使出来的招式所剩不多,近来在行销策略面就转向未来应用为主,包含了 AI 与 5G 方案的建构。
英特尔过去几年其实在 AI 方面做了很多的努力,包括收购了 Movidus 以及 Nervana,前者重点在于终端与边缘计算的 AI 方案生态的建立,后者则是希望能够结合创造足够强大的云端计算生态。
图|英特尔的 AI 也是从云到端的完整方案,与 Arm 的平台规划类似
目前,在 AI 云计算领域,英特尔已经被 NVIDIA 狠狠甩了好几条街,而业界转向以 GPU 为核心的计算方式,也让英特尔忧心未来 CPU 被取代的问题。虽然 CPU 在服务器中还是有不少 GPU 取代不了的应用,但如果业界推动以较其他架构核心来取代英特尔的 X86,就如美国最新推出的超算架构 Summit 中采用了来自 IBM 的 Power 9 处理芯片,并成为业界的共识,那么对英特尔而言将是致命的一击。
为了避免最坏的情况发生,英特尔也在推动其自有的 AI 加速方案,由于英特尔没有 GPU,因此选择了当初收购 Altera 而来的 FPGA 架构,并结合英特尔自家的 X86 技术,推出异质计算架构 Lake Crest。
图|CPU 与 FPGA 结合的异构计算方式是未来英特尔针对 AI 计算所提出的答案,要以之对抗 NVIDIA 的 GPU 霸权
Lake Crest 采用的 FPGA 架构在 AI 计算中,不论是训练或是推理,都展现出相当出色的效能与弹性,甚至不下于 GPU 架构,也因此,Lake Crest 肩负了英特尔对抗 NVIDIA 的 GPU 霸业、并同时阻止其他包含 Arm、IBM、AMD 等对服务器 CPU 市场虎视眈眈的对手进犯的重责大任。
不过 Lake Crest 只是英特尔庞大计算布局中的一小部分,另
一个重点发展项目,就是基于半导体工艺技术的量子计算芯片。
目前主流的量子计算架构几乎都是基于超低温冷却的超导方式,借以维持稳定的量子态,过去 D-wave System 公司的 CEO 在接受 DT 君的专访时,就曾表示常温量子技术在相当长的一段时间内都还很难现身,但
英特尔却突破了业界的认知,成功推出常温下的半导体量子计算芯片。
图|英特尔在超导量子计算方面进展相当快速
自去年宣布推出 17 个量子位的超导体量子芯片后,英特尔再接再厉于今年 CES 2018 展示了 49 个量子位的测试芯片,而在 Computex 2018 前夕,英特尔又宣布推出采取微缩体积设计的自旋量子位芯片,成为目前业界少数成功试产的半导体常温量子芯片之一。
图|英特尔成功试产基于半导体工艺的量子芯片,具备 26 个量子位,甚至比指甲还小很多
英特尔目前试产的半导体常温量子芯片拥有 26 个量子位,而根据英特尔量子硬件总监 Jim Clarke 的说法,该芯片最终目标将拓展为超过 1000 个量子位,目前还在想办法突破因为温度波动造成的热涨冷缩,导致量子位难以增加的技术难题。
目前该芯片在英特尔于俄勒冈州的 D1D Fab 厂生产,采用的半导体制造工艺为 50nm,预期未来在整体产能方面将远大于现有的主流超导量子位,不仅推动英特尔在量子芯片的技术布局,并可望借此提高未来对自有晶圆厂的产能利用率。
采用半导体量子架构还有另外一个好处,那就是可以通过多芯片并联,最终达到极高规模的量子位计算架构,而其目标可以瞄准 100 万量子位的超高规模,并希望在 10 年内达成。
图|英特尔另一个不务正业是宣布正式进军独立 GPU 市场,为此还挖走了 AMD 的几员大将
英特尔其实还有另一个不务正业之举,那就是 GPU 事业的发展。
英特尔计划在 2020 年推出自有的独立 GPU 芯片,挑战包含 NVIDIA、AMD 在内的市场领导者,而该独立 GPU 除针对专业与消费绘图市场,也有可能瞄准诸如 AI 的计算领域。为此英特尔从 AMD 挖了首席架构师 Raja Koduri 及前营销主管 Chris Hook,并成立 GPU 部门,而根据内部消息,其试作 GPU 架构已经大致确定,并开始进行测试。
多样化的芯片与应用布局一方面是为了确保英特尔在各计算领域仍能占有一席之地,而另一个重要的目的,就是要消耗未来晶圆厂工艺发展后所增加的产能。芯片的生产要有足够的规模才能有效分摊成本,且才有馀力推动未来更进一步的芯片制造技术革新,毕竟台积电已经进入 7nm 的量产,而英特尔主力工艺却还停留在 14nm,其 10nm 虽在技术特性上可和台积电的 7nm 相提并论,但实际大量生产仍须一点时间,但也因为这点时间差,让英特尔从半导体制造的领导者成为跟随者,若无法急起直追,恐怕会连带影响未来所有计算产品的竞争力。
Arm 再次尝试打入 PC 领域,并在 AI 应用急起直追
Arm 对 PC 市场其实早就垂涎已久,2012 年就曾与微软合作推出基于 Windows RT 系统的平板电脑,当初采用的方案是来自 NVIDIA 的 Tegra 3 芯片,基于 Cortex A9 多核架构,在当初可说是 Arm 架构中性能数一数二的产品。
图|当初 Windows RT 喊的震天价响,但实际成绩极为惨淡,迫使微软重新思考 Windows on Arm 的定位
不过这款产品却面临了彻底的失败。原因主要有几个。首先,微软 Windows RT 不支持传统的 Windows 桌面程序,微软特地为其创造了理论上更适合触控操作的 Metro 桌面,然而 Metro 桌面的操作逻辑非常差劲,让使用惯 iOS 与 Android 系统的使用者无法接受,最终导致应用开发者拒绝了 Metro 桌面,Windows RT 也因为缺乏第三方应用,对消费者难以产生吸引力。
其次,当初 Tegra 3 方案的确是最强大的 Arm 架构,但实际性能仍远低于英特尔最低端的移动处理器,导致 Windows RT 在系统与应用的执行流畅度方面的体验极差。
有了前车之鉴,Arm 这次为了推动新款的 Windows on Arm 平台,在方案性能方面自然是做了充分的准备,当然,作为早期开发的 Windows on Arm 是基于高通的修改版 Arm 架构 Snapdragon 835/845/850,性能稍弱,但功耗表现与 GPU 性能要比标准 Arm 架构优秀,而为了满足未来 Windows on Arm 的进一步发展,Arm 推出新款 Cortex A-76 架构,号称拥有标准笔记本电脑等级的性能,且功耗表现远远优于英特尔的架构。
虽然 Cortex-A76 才刚推出,但是高通已经宣布要在下一代 Windwos on Arm 处理芯片 Snapdragon 1000 中采用该架构,预计可带来极为明显的效能成长,有机会与英特尔的主流 CPU 方案平起平坐。
至于在另一个重头戏,也就是 AI 领域方面,继今年初 Arm 发表 Project Trillium 之后,Arm 也终于在 Computex 2018 发表了更多关于 AI 方案的细节,除了之前提过的 CPU 与 GPU 协同计算的机器学习能力,这次也推出
独立的 AI 芯片 IP。
图|Arm 的三大 AI 方案,补足了过去几年的空白
这些 IP 包含了三大类,分别是机器学习处理器、视觉识别处理器,以及神经网络SDK。
图|机器学习处理器可扩增到 16 个单元的核心,理论上可达到主流人工智能服务器计算平台的效能水准
其中 ML 处理器可在 7nm 工艺下以标准规模设定达到 4.6TOPs 的操作性能表现,每 W 可达 3TOPs 的能效,具备相当的竞争力。而 Arm 也强调他们的架构都是可规模化的,换言之,理论上客户需要什么等级的性能表现,就可以把规模扩充到所需要的程度,当然,规模的增加也代表功耗和成本的同步增长。Arm 虽强调其可扩充能力,但谈到可否将规模加大到与主流用于云端 AI 计算的 GPU 架构相提并论,仍语带保留。
图|视觉识别处理器则是能够实时应对各种物体识别场景,并可和其他计算架构合作在本地端处理相关计算
视觉识别处理器则是在之前 Project Trillium 中有提到过,采用优化的算法与电路设计,让芯片的面积效能比达到一流水准,同时又能肩负主流视觉识别计算需求的能力。目前该芯片可以做到 1080P 每秒 60 张画面的实时物体侦测,且物体的大小可以从 50*60 像素延伸到全画面,另外,同一画面中的物体数量没有限制。
而该视觉识别处理器还能与 CPU、GPU 或 Arm 的机器学习处理器合并使用,增加在边缘的计算能力,减轻服务器端的工作计算负担。
图|神经网络 SDK 铺平了个别神经网络框架在 Arm 架构核心上执行的道路,让开发者可以无障碍在 Arm 平台上执行主流 AI 应用。
而最后的神经网络 SDK,则是号称可以支持目前主流的神经网络框架,并实行高效能的转换,使其能够在 Arm 架构的 CPU 与 GPU 上无接缝执行,完全不需要修改程序,当然,这个是通过 Arm 所开发的神经网络执行层来进行转换,客户不需要自己重新开发转换的工具。
通过这几个架构,Arm 终于补上了这几年在 AI 市场的空白,而其提出的架构也足够应对几乎所有应用场景的需求,甚至包含了服务器等高端计算平台。Arm 方面对此也自信的表示,生态是所有计算平台最重要的一环,即便个别单一方案性能再强大,如果缺少了生态的共同经营能力,开发者还需要重头发明轮子,那这样就无法满足客户需求,时间一久,必定会被具备完整生态的方案所取代。
-End-
- 高胆固醇的人听好:饮食时不注意这3点,离生病不远了
- 入秋吃什么好 入秋了应该注意什么
- 练瑜伽的4大好处,你不得不知!但这3类人练习要注意
- 减肥吃肉必须注意的3件事
- 恩爱夫妻需注意,身体此部位切不可深吻,可能会影响健康
- 手上什么会长小水泡?这些细节千万要注意!
- 一个痛风胖子的自述,痛风性肾病更容易钟爱胖子,生活要注意这些
- @所有人,你的大脑是否健康?有这七个症状要注意
- 去奥特莱斯“血拼”的市民注意啦!这些路段有交通管制
- 心理学:你觉得哪两个人是真情侣?测你在交往中应该注意什么