AMD|发展史系列:锐龙的前世今生(4)推土机/APU的设计缺陷

AMD|发展史系列:锐龙的前世今生(4)推土机/APU的设计缺陷

文章图片

AMD|发展史系列:锐龙的前世今生(4)推土机/APU的设计缺陷

文章图片

AMD|发展史系列:锐龙的前世今生(4)推土机/APU的设计缺陷

文章图片

AMD|发展史系列:锐龙的前世今生(4)推土机/APU的设计缺陷

上回说到 , AMD因为资金问题 , 现金问题 , 英特尔打价格战后的利润不够问题 , 就寻求一款类似K8一样的多面手产品 , 成本低 , 功耗低 , 性能强 , 笔记本桌面都可以用 , 多核性能不差的 , 德智体美全能型产品 。 这显然不是一个可以完成的任务 。 AMD都没有考虑过 , 2006年K8上了笔记本发热感人的历史吗?

但是AMD依据历史惯性选择了梭哈 , 从2006年开始一门心思研究多核强势 , 不注重浮点性能的推土机架构 。 实际上 , AMD的选择不能说完全错误 , 因为英特尔已经放话 , 在搞3d堆叠晶体管工艺 , 就是低于32nm平面技术的芯片制程 。 在那个年代 , 32nm被认为是芯片工艺的尽头 , 前提是它是平面铺设的话 。 对于AMD来说 , 这是完全未知的技术路线 , AMD引以为傲的一直是绝缘铜技术 , 就是SOI工艺 。 不例外 , AMD为新的推土机架构倾注了大量心血 , 用上了改良过的32nm SOI工艺 。

(如果对平面铺设晶体管的历史感兴趣 , 可以跳转观看本人发布的一篇文章 , 说人话系列:英特尔酷睿12代详解(4)摩尔定律之殇 , 就是芯片制造3D跟平面技术之争的故事 。 )
另一方面 , windows7后期跟未来的win8操作系统 , 都是注重触摸 , 多媒体 , 交互的方向 , 即将到来的移动互联网时代也是交互 , 聊天 , 上网为主 , 这就让高性能浮点计算无用武之地 。 低浮点数计算场合 , 交给显卡就可以了嘛 , 毕竟AMD刚收购了ATI , 英特尔没这个优势 。 隔壁英伟达在推CUDA计算 , 甚至剪辑视频都用上了显卡 。 站在当时看 , 怎么看 , 推土机架构都不会失败 。 大不了价格战 , 反正AMD的soi工艺管够 。 再说 , 隔壁英特尔也在搞上网本 , 浮点处理性能几乎为0的atom凌动处理器笔记本 , 卖的也是越来越多 。
下图 , 这玩意儿熟悉不?某硕EeePC , 靠着颜值骗了多少少女的钱包 , 到手卡成狗 。 估计也少不了跟电脑城奸商的斗智斗勇故事 , 泪目 。

实际上 , windows系统一直是避免使用浮点指令的 , 来规避性能损失跟功耗问题 。 调用浮点性能的程序 , 也都控制百分比在10%以下 。 这是不是很反直觉?win自带的程序 , word , excel这种几乎都是整数计算的 , 当然包含大量长小数的话也会拖累性能 。 比如计算器程序 , 就算是小数输入输出 , 实际也是用的整数二进制来模拟 。 对浮点性能话题有兴趣的可以看我发的 , 认识计算机:浮点数乘除法那一篇 。 推土机跟APU舍弃浮点的做法不能说错误 。
康康win8的界面 , 浓浓的触摸风 。

本人下次换amd平台 , 就可以用免费的AMD性能分析工具来康康win10自带软件的浮点性能测试了 , 到时候发出来 。 下次一定 。
但是 , AMD低估了两件事 。 1 , 是分辨率在未来几年快速增高 。 2 , 是主机游戏机战场 , 开放世界游戏突然成了潮流 。 分辨率增加 , 让显卡剪视频变得不现实 , 低精度浮点计算让剪的视频清晰度差 , 分辨率越高看越明显 。 开放世界游戏非常依赖单核性能 , 比如预测能力 , 缓存性能 , 吞吐指令的能力 , 不太差的浮点性能 。 推土机在这两个方面都是如此的劣势 。 加上分辨率增加后 , 需要处理的像素数量指数级增加 , CPU的负担就更重了 。

如果是为了堆多核性能 , 推土机因为单核孱弱 , 需要高频率 , 这就让当年还在32nm徘徊的AMD芯片大火炉了 , 桌面端芯片超频的结果不必多说 , 功耗暴涨 。 低功耗的设计目标落败 。 同时 , AMD不知道为啥 , 在并不缺钱的2009年 , 区区6500万美元把移动芯片部门打包卖给了高通 , 成为今天骁龙芯片的图形技术基础 , 在移动互联网风口卖优质资产 , 这个思维搞不懂 。
不过在笔记本 , AMD还是找到了一条路 。 2010年 , AMD精简了双核推土机 , 并降低频率节省功耗 , 集成了不错的显卡 , 搞出来了fusion的概念 。 第一款就是大名鼎鼎的APU芯片 , AMD E350 , 双核1.6GHZ , 集成了堪比入门独显的核显 , 低价格加上不俗的图形性能 , 直接把英特尔上网本市场干爆了 , 同时逼得英特尔去搞核显 。 但是随着平板市场兴起 ,