HSPICE仿真时间从30天缩减到17小时!42倍效率提升是如何做到的?

蓝字关注我们
HSPICE仿真时间从30天缩减到17小时!42倍效率提升是如何做到的?文章插图
HSPICE仿真时间从30天缩减到17小时!42倍效率提升是如何做到的?文章插图
作为最早的电子设计自动化软件 , 我们的EDA云实证系列从SPICE开始 , 再合适不过 。
在它出现之前 , 人们分析电路 , 用的是纸笔或者搭电路板 。 随着电路规模增大 , 手工明显跟不上 。
于是 , 1971年 , SPICE诞生了 。 全称“Simulation Program with Integrates Circuit Emphasis" 。
H-SPICE是随着产业环境及电路设计技术的发展与升级 , 以“SPICE2”为基础加以改进而成的商业软件产品 , 现在属于Synopsys 。
既然有了新的计算机辅助工具 , 那问题就来了:
怎么才能跑得更快一点?
怎么才能运行更大规模的集成电路?
第一个答案是算法改进 。 这属于数学领域 , 很难 。
第二个答案是摩尔定律 。 从上世纪70年代初到如今 , SPICE从只能仿真十几个元器件到今天可以仿真上千万个元器件的电路 。 但已经几十年没有太大的变化了 。
第三个答案是计算架构升级 , 从单核到多核 , 单线程到多线程 。
第四个答案是Cloud HPC云端高性能计算 。 谈概念过于抽象 , 我们今天拿实证说话 。
实证背景信息
用户需求
作为一家纯IC设计公司 , C社成立已超过十年 。
公司在本地部署了由十多台机器组成的计算集群 , 但目前面临的最大问题依然是算力不足 。 特别是面对每年十次左右的算力高峰期时 , 基本上没有太好的办法 。
对云的认知
C社相关负责人表示:算力不足是目前IC设计行业普遍面临的问题 。 对于EDA上云 , 公司之前没有尝试过 , 对云模式和架构也并不了解 , 在数据安全性方面也存在一定的顾虑 。
不过该负责人对于EDA上云早有耳闻 , 也颇感兴趣 , 愿意进行一定的尝试 。 毕竟上云若真的能够加快运算速度 , 就意味着可以更早展开研究 , 从而提升项目的整体进度 。
实证目标
1、HSPICE任务能否在云端运行?
2、云端资源是否能适配HSPICE任务需求?
3、fastone平台能否有效解决目前业务问题?
4、相比传统手动模式 , 云端计算集群的自动化部署 , 有哪些好处?
实证参数
平台:
fastone企业版产品
应用:
HSPICE
适用场景:
仿真模拟电路、混合信号电路、精确数字电路、建立SoC的时序及功耗单元库、分析系统级的信号完整性等
技术架构图:
用户登录VDI , 使用fastone算力运营平台根据实际计算需求自动创建、销毁集群 , 完成计算任务 。
HSPICE仿真时间从30天缩减到17小时!42倍效率提升是如何做到的?文章插图
License配置:
EDA License Server设置在本地 。
步骤一:硬件选择
选择适合HSPICE应用的配置
云端可以选择的机型有几百种 , 配置、价格差异极大 。
我们首先需要挑选出既能满足HSPICE应用需求 , 又具备性价比的机型 。
已知用户的本地硬件配置:
Xeon(R) Gold 6244 CPU @ 3.60GHz , 512GB Memory
本地配置不仅主频高 , 内存也相当大 。
我们推荐的云端硬件配置:
96 vCPU, 3.6GHz, 2nd Gen Intel Xeon Platinum 8275CL, 192 GiB Memory
HSPICE仿真时间从30天缩减到17小时!42倍效率提升是如何做到的?文章插图
推荐理由:
1、该应用对CPU主频要求较高 , 但内存要求并不大;
2、我们选择了计算优化型云端实例 , 即具备高性价比的高主频机器 。
C社的本地硬件在HSPICE以外 , 还需处理一些需要大内存的后端任务 , 所以需要在配置上兼顾各种资源需求 , 在当前项目不可避免会造成一定的资源浪费 。
步骤二:云端部署
手动模式 VS 自动部署
我们先看手动模式:
第一步:不管你需要用哪朵云 , 你都得先熟悉那家云的操作界面 , 掌握正确的使用方法;
第二步:构建大规模算力集群:

  • 配置计算节点 , 存储节点 , VPC , 安全组等等
  • 安装应用 , 把HSPICE安装在集群环境
  • 配置集群调度器 , 比如slurm
第三步:上传任务数据 , 开启计算;
第四步:任务完成后及时下载结果并关机 。
不要笑 , 这一点很重要 。 我们在切换七种视角 , 我们给各位CXO大佬算算上云这笔账有讲到原因 。
此外 , 还有一个需要考虑的点 , 时间 。
第一步 , 需要多少时间说不好;
第二步 , 大概需要专业IT人员平均3-5天;
第三步/第四步 , 如果数据量较大 , 需要考虑断点续传和自动重传;