傻大方


首页 > 潮·科技 > >

功耗|既快又准并且低开销!一作亲解MICRO 2021最佳论文:一种自动化功耗模拟架构( 二 )



按关键词阅读: 人工智能 机器人 疫苗 初创公司 快公司 cobi


如图所示,起初电压保持不变,假设这一段时间CPU处于睡眠状态,没有执行任何指令。然后突然运行一个很大的程序,此时功耗和电流会突然增大。di/dt(即电流对时间求导)电流的变化量也会变得非常大。此时voltage-droop从1伏变成0.9伏,这会造成很多问题。要避免这个问题也并非容易,由于发生时间非常短暂,因此对应的处理策略也必须要在极短的时间内将其控制住。
既然输电上存在这么多问题,因此在芯片设计时,就要充分模拟芯片CPU上会遇到的各种问题。但如果要做到真实模拟代价是非常大。
功耗|既快又准并且低开销!一作亲解MICRO 2021最佳论文:一种自动化功耗模拟架构
文章插图
工业界标准的 Power模拟流程
上图所示的模式是非常准确的,但可能需要花费几周时间,并且非常昂贵,反复花几周时间进行模拟是非常困难的。即使花费了几周时间,拿到了准确的power,但得到的power是平均power,这中间可能存在几千甚至几百万个周期,一个平均power是不够用的。我们还关心最大power、一瞬间的最大power、快速变化时power的变化等等。
功耗|既快又准并且低开销!一作亲解MICRO 2021最佳论文:一种自动化功耗模拟架构
文章插图
不同类型的power simulation的方法
Netlist Simulation是上述介绍的最准确的,但可能需要花费几周时间。APOLLO位于蓝点位置,在保持速度快的同时,准确率很高(虽然不是最准确但准确率可达90%)。

2

APOLLO优异性质概括
  • 首先,它在设计和运行时,都能够对power进行既快又准地预测。在商业化的CPU上能够做到90%~95%的正确率,我们把它在Neoverse N1 CPU上进行实现,我们发现它面积的overhead只有0.2%。
  • 其次,对于任何一个设计该模型都可以自动生成。
  • 不仅如此,每个cycle都能得到一个准确的power,时间分辨率非常好。
  • 而且我们认为APOLLO模型可以延展到更高层次的模拟。
预测结果实例
功耗|既快又准并且低开销!一作亲解MICRO 2021最佳论文:一种自动化功耗模拟架构
文章插图

我们在Neoverse N1商业化的CPU上面,运行了一个workload。这个workload非常大,一共有1700万个时钟周期。我们对这1700万个时钟周期的每一个cycle都进行预测,上图展示的是4万个。在工业界用传统的方法可能需要两个星期的时间,而用我们的方法的,几分钟就可以做完。
准确率高、速度快的同时,对存储的要求减少了100倍以上,只需要存我们感兴趣的信号,这也是一个非常大的提升。保持这样的速度、准确度,得到每个周期的power这在之前的工作中几乎是做不到的。

3

APOLLO的组成部分
功耗|既快又准并且低开销!一作亲解MICRO 2021最佳论文:一种自动化功耗模拟架构
文章插图
图注:APOLLO的组成部分
APOLLO由两大部分组成。
在设计时,它是一个又快又准的 power 模型。如图所示假如对信号模拟追踪,所有信号都在不停的运动,根据这些可以得到一个准确的power估计。
在CPU运行时,它就会成为一个片上功率表(on-chip power meter)。我可以直接把它做的到CPU里面变成CPU的一个模块,相当于一个监测工具,可以每时每刻提供CPU的功耗。

4

研究方法
功耗|既快又准并且低开销!一作亲解MICRO 2021最佳论文:一种自动化功耗模拟架构
文章插图
如图,对于任何一个design我们得到的都是RTL level。然后运行一些程序,就会得到一个fsdb/VCD 文件,得知每个信号在每一个周期的一些信息,这是最基本的input。
基于此,每个cycle就可以进行这样处理。每个cycle中,对每个信号(ABCDE)用1表示它翻转了,0表示没有翻转,要翻转就肯定会有功耗。这是cycle0,同样可以得到cycle1、cycle2等等,翻转活动就是模型的输入,然后来预测功耗。
如图,得到的矩阵的宽度是M, M表示design里面一共有M个signal,因此一共有M个输入,每个cycle就是一个sample。接着每个cycle都会做power simulation,得到最准确的power(p0、p1、p2……),将此作为一个vector。vector也是从p0开始的准确的功耗,有x、y,有输入有label,就可以训练一个machine learning模型,得出F(x)=y。


稿源:(雷锋网)

【傻大方】网址:/c/1122a10022021.html

标题:功耗|既快又准并且低开销!一作亲解MICRO 2021最佳论文:一种自动化功耗模拟架构( 二 )


上一篇:频段|T-Mobile:已经提前实现2021年的目标,5G网络覆盖2亿人

下一篇:小米科技|华为最新平板电脑首发:黑科技满满,外形酷似微软Surface Pro 8