英特尔|说人话系列:英特尔酷睿12代详解(2): 单核性能为何长期停滞?

英特尔|说人话系列:英特尔酷睿12代详解(2): 单核性能为何长期停滞?

文章图片

【英特尔|说人话系列:英特尔酷睿12代详解(2): 单核性能为何长期停滞?】英特尔|说人话系列:英特尔酷睿12代详解(2): 单核性能为何长期停滞?

文章图片

英特尔|说人话系列:英特尔酷睿12代详解(2): 单核性能为何长期停滞?

文章图片

英特尔|说人话系列:英特尔酷睿12代详解(2): 单核性能为何长期停滞?



世界牙膏大厂?
在讲CPU之前 , 我先来介绍一下我的朋友小明 , 身高1米75 , 体重100公斤 。 右边小明的肠子 , 长9米 。 为何1米7多的小明有近10米的肠子?因为肠子是曲折卷曲在一起的 , 而不是一条直线 。 这是重点 , 等下要考 。

这位就是小明 , 右边是4倍小明身高长度的大小肠
话题回到CPU , CPU的基本结构是晶体管 , 可以通过晶体管的通电断电实现0跟1的二进制变化 , 数百万数千万的晶体管构成了CPU的计算单元 。 晶体管可以是二极管三极管先不说 , 但是密密麻麻的晶体管构成了一条条电路 。 一直以来 , 晶体管是平面铺设的 。 如果让我们把镜头拉近看芯片本身呢 。

芯片本身是密密麻麻的晶体管电路集合
像不像小明的肠道?这就很好理解了 。 如果在理想状态下 , 我们假设一个单核处理器 , 那这个芯片最外边的距离 , 离芯片中间是最远的 , 这就造成了核心内部的延迟 。 因为芯片电路结构不是平均分布 , 而是类似人肠道系统的排布 , 折叠延伸 , 所以这个延迟不是简单的加减关系 , 而是倍数关系 。 芯片过大的影响还有其他方面 。 比如电阻增大 , 发热 , 漏电率增加 , 抗干扰能力差 。 那成千上万的指令 , 就在这些无数小毛病的堆积中错误频繁 , 效率不增反降 。
就跟小明体重增加 , 腰围加大 , 也不能增加多少智力一样 , 单核心芯片过大并不会造成性能显著提高 , 反而功耗暴涨 , 发热 , 处理效率低下 。 为了规避芯片自己的问题 , 就有了新的设计 , 多核 。 实际上 , 在2003年前后 , AMD跟英特尔都玩不转单核性能增加了 , 纷纷走向了多核设计 。

说:谢谢小明!
多核设计的思路就是 , 多个单核连在一起 。 而多核之间是有通信的 , 要受芯片内部指令调度 , 还要操作系统支持 , 而我们敬爱的微软大人有先见之明 , 让windowsXP支持最多4个核心的调度 。 而多核处理器本身 , 也要讲设计 。 一般CPU芯片最外围的部分 , 都是内存控制器跟连接电路之类优先级低的模块 , 先不用考虑复杂的公式跟英特尔内部的考虑 , 我们就以酷睿E5300一直到酷睿i7-8700k这些跨越15年的处理器来看 , 共同点是 , 核心计算单元都围绕在离中心6-8mm的距离之内 , 超过10mm延迟就会变得很大 。 CPU的计算速度是每秒钟数GHZ的 , 这一丁点儿的延迟差距 , 能造成巨大影响 。

45nm志强8核 , 涂成红蓝色的两个核心 , 距离差距目测2倍 , 实际延迟更大
如何规避这些问题?那就控制单核心处理器的大小跟规模 , 控制在一个合理的范围 。 不同核心的距离也要保证 , 从而保证通信速度 。 实际上 , 从奔腾2开始 , 整个英特尔CPU单核芯都被限制在了40-50平方毫米左右的面积 。

本人就是这么懒 , 但是可见单核心面积多年来没多少长进
2013年 , 英特尔创造性的发明了3D晶体管工艺 , 从而可以让32nm缩小为更先进的22nm , 以便让摩尔定律延续下去 。 更先进的工艺带来更多问题 。 比如 , 平面排列的晶体管 , 现在成了堆叠 。 更高的单位密度 , 也造成了同样面积更大的延迟 , 更大的电阻 , 更高的热量 。 到了14nm时代 , 两倍于22nm的堆叠晶体管密度 , 让发热 , 电阻 , 漏电这些问题终于成了大问题 。 2015年 , 英特尔第一代14nm工艺问世 。 结果是令人惊讶的 , 那高昂的发热功耗 , 漏电带来的性能下降 , 让用户苦不堪言 。 甚至于 , i7-5700HQ笔记本处理器 , 它的设计温度就是105℃都属正常 , 而用户觉得英特尔脑子不正常 。
如何解决这个问题呢?在这什么都soc的时代 , 英特尔14nm第二代却反集成化 。 将很多芯片功能拿出来放到主板 , 精简了部分CPU核心的功能 , 减少了芯片的发热跟漏电 , 这造就了6代酷睿i系列的成功 。 实话讲 , 6代酷睿i系列的能耗比追平2年前22nm的haswell架构 , 这是进步吗?而随着英特尔的不断打磨 , 14nm也随着后面+号的增加越来越好用 。 而可以预见的是 , 14nm时代 , 单核心性能同频率进步有限 , 更多是优化跟精简 。 6代酷睿i系列反SOC化来削减芯片提高能耗比 , 反而比较稳定 。