20年后重返独显战场!深度分析英特尔Xe GPU战略( 二 )


20年后重返独显战场!深度分析英特尔Xe GPU战略文章插图
和上一代架构相比 , Xe-LP架构一大更新便是执行单元(EU) 。 全新EU集成了8-wide FP/INT ALU8和2-wide extended math ALU 。 8-wide FP/INT ALU8运算速度可达1 FP32/INT32 ops/clock、2 FP16/INT16 ops/clock和4 INT8 ops/clock , 以更好地处理AI工作负载产生的各类数据 。 同时 , 两个EU共享线程控制(Thread Control) , 从而节省空间 。
20年后重返独显战场!深度分析英特尔Xe GPU战略文章插图
如若所有FP/INT ALU均以1.35GHZ的频率工作 , Tiger Lake的高端Xe-LP iGPU可提供约2.1 TFLOPS的FP32图形处理性能 , 近乎是英特尔上一代Iris Plus G7显卡(1.12 TFLOPS)的两倍 。 此外 , 英特尔还提供了入门版本的Xe-LP iGPU , 入门版本的EU等单元数量较少 , 性能也相对弱一些 。
20年后重返独显战场!深度分析英特尔Xe GPU战略文章插图
Xe-LP GPU还配备了英特尔最新的显示引擎(Display Engine)和媒体引擎(Media Engine) 。 新款媒体引擎具有12-bit end-to-end video pipeline , 可播放BT.2020等格式的视频 , 同时能为最新编解码器(例如AV1)提供硬件加速解码功能 。
由于集成显卡主要用于办公和媒体浏览 , 媒体引擎对集显的重要性不言而喻 , 同时对各类流媒体应用也有不可或缺的作用 。
显示引擎支持四个video pipeline以及eDP、DisplayPort 1.2、HDMI 2.0、Thunderbolt 4/USB4 Type-C输出 , 足以满足当今的集成显卡和入门级独显的需求 。
20年后重返独显战场!深度分析英特尔Xe GPU战略文章插图
三、英特尔集显市占率达70% , Xe-LP市场潜力巨大英特尔将Xe-LP集成显卡和独立显卡的用户群体定位为游戏玩家和创作者 。
游戏方面 , 英特尔在提升硬件性能的同时 , 还努力优化驱动程序等软件表现 。
例如 , Xe-LP驱动程序支持硬件/软件调度代码签名(hardware/software scheduling codesign) , 为基于DirectX 11的游戏增加了灵活性 。 此外 , 这一系列还支持VRS可变帧率渲染 , 根据渲染场景的不同来选择降低或者提升渲染内容 , 以免在次要场景上浪费过多算力 。
同时 , 英特尔还增加了游戏锐化(GS)技术 , 该技术可在分辨率不变的情况下提高游戏图像的清晰度 , 从而节省带宽 , 不过有可能增加GPU的其他部分的负荷 , 用户可以选择自行启用/禁用GS技术 。
Jon Peddie Research的研究指出 , 全球近70%的PC搭载了英特尔的集成显卡 。 因此 , 英特尔一旦过渡到其新的Xe-LP架构 , “吃”内置显卡的游戏必须相应作出调整 。 此外 , 英特尔还可以定制驱动程序 , 保持产品竞争力 。
“ Xe-LP是英特尔显卡战略的第一步 , ”英特尔发言人布鲁斯·费恩伯格(Bruce Fienberg)说 , “它是英特尔系列产品的节能基础 , 同时让英特尔20年来首款独显成为现实 。 Xe-LP面向的集显市场相当庞大 , 每年都有成千上万的新用户 。 Xe-LP将会支持全球大多数人的视觉体验 。 ”
值得注意的是 , 在所有英特尔Xe微架构中 , Xe-LP节能效果最佳、面积最优 。 英特尔表示 , Xe-LP架构未来定将应用于PC和各类可拆卸式平板电脑 。
四、英特尔Xe DG1:英特尔二十年来首款独显二十年来磨一剑 。
英特尔二十年里推出的首款商用独显名为Iris Xe Max(以前被称为代号DG1) 。 该GPU基于Xe-LP微架构 , 其配置和Tiger Lake集成GPU顶配版相同 。
这款显卡包含96个EU , 每周期Texel纹理、Pixel像素渲染能力也提升到48、24 , 支持多达4 GB LPDDR4X的128位内存控制器以及PCIe 4.0 x4接口 , 可连接到笔记本电脑的CPU , 没有太多的备用PCIe通道 。
英特尔Xe DG1采用10nm SuperFin工艺生产 , 和Tiger Lake CPU所使用的节点相同 。
由于英特尔Xe DG1专为笔记本电脑设计 , 其时钟频率为1650 MHz , 可提供高达2.46 FP32 TFLOPS的性能 。 这款独显虽然具有英特尔顶配集成GPU的同等配置(尽管频率提高了22%) , 但更好的散热设计(TDP)封装结合128位内存 , 为其带来了更强劲的性能 。
英特尔称 , 英特尔Xe DG1不受Tiger Lake的TDP约束 , 总内存带宽为68 GB/s , 可为全高清游戏以及附加的AI工作负载提供出色性能 。 显然 , 英特尔的野心不止于入门级游戏 , 还希望利用DG1解决消费级应用(通常计算需求高 , 如Topaz Labs的Gigapixel AI)的需求 。
从游戏性能的角度来看 , 英特尔Xe DG1 GPU的主要竞争对手是AMD的Radeon RX 560(2016年GPU) , 英伟达的GeForce GTX 1050 Ti(2017年GPU)或低端MX350同类产品 , 但尚未能够与英伟达基于Turing架构的GeForce MX450匹敌 。