量子位|英特尔发布第3代至强处理器,推理速度提升80%,阿里腾讯云都在用,CPU也支持AI加速
AI时代 , 英特尔最担心的是什么?当然是自家的CPU被GPU、TPU等AI硬件的冲击 。 现在英特尔的新一代CPU也带来了全新的AI加速能力 。
【量子位|英特尔发布第3代至强处理器,推理速度提升80%,阿里腾讯云都在用,CPU也支持AI加速】今天 , 英特尔发布了三款硬件产品 , 都是为了AI而准备:第三代至强(Xeon)可扩展处理器、新一代的傲腾(Optane)存储器以及StratixAIFPGA 。
文章图片
至强可扩展CPU
首先 , 英特尔发布了CooperLake至强可扩展处理器 , 也就是英特尔的第三代至强可扩展服务器CPU 。
在英特尔的路线图中 , 还有IceLake至强处理器将在今年晚些时候推出 , 也属于第三代 , 只是支持的CPU数量比CooperLake更少 , 应该是一款面向中低端的产品 。
文章图片
对于CooperLake平台 , 英特尔加入了一项重要更新 , 增加了基于AVX-512的BF16指令 , 引入了全新的BF16数字格式 。
现在 , 用于“深度学习增强”(DLBoost)的AVX-512指令集也支持全新的BF16数据类型 。
文章图片
过去 , 英特尔在CPU上的AI训练主推INT8整数格式 , 在精度要求不高的模型中 , 使用INT8还是可以的 。 但是许多高精度模型需要使用FP32浮点数格式 。
新一代的至强CPU加入了对16位浮点数支持 , 不过此16位浮点并非常见的FP16 , 而是英特尔称之为bfloat16(BF16)的格式 。
BF16将FP32模型的位宽减少一半 , 除了加速处理速度外 , 更重要的是 , 它将模型保留在内存中所需的空间减少了一半 。
文章图片
△
图片来自AnandTech
BF16可以执行许多通常在FP32或FP16中实现的AI任务 , 它只是比FP32的范围稍低 , 但是却能有与FP16几乎相同的吞吐量 。
国内的阿里云、腾讯云都已经在其数据集上使用了支持BF16的CPU , 实现了1.6倍左右的吞吐量加速和1.8倍左右的推理加速 。
文章图片
英特尔还对CooperLake处理器之间的互连进行了升级 。
至强处理器使用超路径互连(UPI)将多个CPU连接在一起 。 在CooperLake中 , 每个CPU到CPU的连接现在都包含两个UPI链接 , 链接速度达到了20.8GT/s 。
傲腾SSD和StratixFPGA
英特尔还宣布了新一代的傲腾(Optane)“持久内存”200系列 , 带宽相比前代提升了25% 。
200系列傲腾提供128GB、256GB和512GB三个不同存储容量 , 并且将以与DDR4-2666内存相同的速度运行 。
文章图片
该系列为每个插槽提供高达4.5TB的内存支持 , 以更好地处理数据密集型的AI工作负载 。
最后 , 英特尔发布了Stratix10NXFPGA , 这是英特尔第一个针对AI优化的FPGA 。
文章图片
Stratix10NXFPGA加入了为AI设计的张量模块 , 在INT8数据类型上 , 相比现在的Stratix10MXFPGA带来了15倍的运算加速 。
- 红蛋儿儿|可以试试,自媒体发布神器:一键让文章发布到多个平台
- ZAKER汽车|却处处受限于英特尔,浪潮也遭“断供”之痛?市场份额第一
- 于九野|苹果新iMac现身跑分网站!外媒:或用“特别版”英特尔处理器
- AI数码控|7.09英寸+5000毫安电池,入手值不值?,华为新机发布
- 博科园|再连接光量子通信网络,就能实现量子互联网啦!,量子计算机诞生
- 黑评|反向快充+高刷刘海屏,价格也感人!,iPhone12将于9月正式发布
- 爱集微APP|12,如期发布?外媒:苹果今年或将生产8000万部5G版iPhone
- 『华为荣耀』华为发布5G新机,7英寸+2亿定制屏,仅1899元!
- 「iphone12」iPhone12系列将于9月发布:四版本+更低价格,性能是主打亮点!
- 「华为荣耀」从1599降至1059,发布1年的华为千元机,依然是同价位最好的选择