按关键词阅读: 人工智能 机器人 疫苗 初创公司 快公司 cobi
文章插图
文章插图
- 首先,它在设计和运行时,都能够对power进行既快又准地预测。在商业化的CPU上能够做到90%~95%的正确率,我们把它在Neoverse N1 CPU上进行实现,我们发现它面积的overhead只有0.2%。
- 其次,对于任何一个设计该模型都可以自动生成。
- 不仅如此,每个cycle都能得到一个准确的power,时间分辨率非常好。
- 而且我们认为APOLLO模型可以延展到更高层次的模拟。
文章插图
我们在Neoverse N1商业化的CPU上面,运行了一个workload。这个workload非常大,一共有1700万个时钟周期。我们对这1700万个时钟周期的每一个cycle都进行预测,上图展示的是4万个。在工业界用传统的方法可能需要两个星期的时间,而用我们的方法的,几分钟就可以做完。
准确率高、速度快的同时,对存储的要求减少了100倍以上,只需要存我们感兴趣的信号,这也是一个非常大的提升。保持这样的速度、准确度,得到每个周期的power这在之前的工作中几乎是做不到的。
文章插图
在CPU运行时,它就会成为一个片上功率表(on-chip power meter)。我可以直接把它做的到CPU里面变成CPU的一个模块,相当于一个监测工具,可以每时每刻提供CPU的功耗。
文章插图
如图,得到的矩阵的宽度是M, M表示design里面一共有M个signal,因此一共有M个输入,每个cycle就是一个sample。接着每个cycle都会做power simulation,得到最准确的power(p0、p1、p2……),将此作为一个vector。vector也是从p0开始的准确的功耗,有x、y,有输入有label,就可以训练一个machine learning模型,得出F(x)=y。
稿源:(雷锋网)
【傻大方】网址:/c/1122a10022021.html
标题:功耗|既快又准并且低开销!一作亲解MICRO 2021最佳论文:一种自动化功耗模拟架构( 二 )