日本超级计算机“富岳”蝉联四冠:为疫情防控显身手

中文导报讯 日本理化学研究所11月17日宣布 , 计算科学研究中心(神户市)的超级计算机“富岳”在四个部门的性能排名中继上一次6月之后再次位居世界首位 , 成为连续两期蝉联“四项冠军”的全球首例 。 在其中被称为“TOP500”的部门 , 运算速度达到每秒44.201京次(1亿亿为1京) , 性能是排名第二的美国橡树岭国家实验室超算(每秒14.86京次)的约3倍 。
日本超级计算机“富岳”蝉联四冠:为疫情防控显身手文章插图
富岳:搭载ARM芯片且创造新纪录
曾在2011年的时候 , 日本凭借“京”超级计算机拿下了TOP500冠军 , 是世界上第一台每秒执行10万亿次运算的超级计算机 , 使用的是日本富士通研发的SPARC64处理器 。 去年 , “京”超算退役 。
“富岳”超算由日本理化研究所联合富士通打造 , 此前的代号叫Post-K , 也就是京超算后一代的意思 , 最终以富士山的别名正式命名为“富岳” 。
值得注意的是这台超级计算机竟然是基于ARM架构的 , 这也是 TOP500 排行榜里首个采用ARM芯片的超级计算机 。
从传统观念来看 , ARM是移动芯片 , 性能比较低 。 目前 , 多数超级计算机仍然采用的是英特尔和AMD的芯片组 。
与现有超算相比 , 这代超算最大的变化就是采用ARM架构 , 由富士通的48核A64FX SoC提供支持 。
“富岳”的目标是要比上一代京计算机强100倍(即性能目标为1 exaflop), 并在世界上具有高度的实用性 。 “富岳”使用了158,976个 A64FX 处理器 , 使用富士通专有的环面融合互联技术连接在一起 。
“富岳”超算最大的变化就是CPU采用了ARM架构 , 峰值浮点性能高达 537PFLOPS(53.7亿亿次) , Rmax性能为 442PFLOPS(PFLOPS指的是每秒1千万亿次浮点运算) , 是第二名超算 Summit 的近3倍 , 不过功耗也达到了29MW , 也是 Summit 的接近3倍 。
同时 , 富岳拥有442 PetaFLOPS , 这也创造了新的世界纪录 , 使其领先榜单中排名第二的系统三倍 。
目前“富岳”超算的性能还不是完整版 , 后续还会继续升级到1000PFLOPS , 也就是百亿亿次 , 最终要在2021年左右投入使用 。
据理化研究所称 , 除了运算速度 , “富岳”在其他三个部门也是第一 , 成为全球首个获得四项冠军 。 其他三个部门是产业方面利用较多的计算手法性能 , 用于AI领域的计算性能 , 以及成为大数据解析指标的解析性能 。
日本超级计算机“富岳”蝉联四冠:为疫情防控显身手文章插图
“富岳”在新冠疫情防治领域显身手
有专家曾介绍说 , 无论是的国防、材料科学、天文学 , 还是距离我们生活更近的天气预报、灾害监测、交通管理 , 超算都大有用武之地 。 在抗击新冠疫情的过程中 , 各国超算也都倾尽全力 。 此次夺冠的日本“富岳”超算也在为探索新药及解析飞沫扩散方式等新冠疫情防治领域大显身手 。
日本文部科学省4月7日宣布 , 为应对新型冠状病毒疫情 , 使用“富岳”展开研究 , 将用于探索候选治疗药和预测病毒表面的蛋白质变化等 。
日本京都大学教授奥野恭史等人7月3日发布消息称 , 使用超级计算机“富岳” , 找到了数十种可作为新冠传染病候选治疗药物的物质 。 这些物质有望阻碍病毒在细胞内增殖 。 担任理化学研究所项目副总监的奥野教授等人借助“富岳”的超高计算能力 , 以2000多种现有药物为对象进行了模拟实验 。 调查了这些药物和关系到病毒增殖的蛋白质结合后阻碍蛋白质发挥作用的效果 。 模拟实验锁定了有望对治疗新冠产生效果的数十种药物 。
日本理化学研究所在8月宣布 , 富岳的计算结果显示 , 不织布制作的口罩对阻挡携带病毒的口沫 , 效果最佳 , 但其他材质的口罩也有效果 。
有关棉、聚脂和不织布等材质对阻挡戴口罩的人咳嗽时产生的飞沫 , 研究团队说 , 仅管不织布口罩几能阻挡咳嗽喷出的所有飞沫 , 但三种口罩均能挡下至少大约80%的飞沫 , 也就是对减缓疫情散布都有效果 。
“富岳”的运算模型显示 , 不织布口罩会让逾10%直径小于20微米的飞沫 , 经口罩和脸部的空隙散出 。
中国超算总数实力霸榜
此次公布的全球超算Top500中 , 在运算速度方面 , 第二名Summit , 是IBM在田纳西州橡树岭国家实验室(ORNL)建造的系统 , 以148.8 PetaFLOPS的性能保持着美国最快的系统 。 拥有4356个节点 , 每个节点都容纳了两个22核Power9 CPU和6个NVIDIA Tesla V100 GPU 。
第三名是位于加利福尼亚州劳伦斯-利弗莫尔国家实验室的系统Sierra , 以94.6 PetaFLOPS的HPL排名第三 。 其架构与Summit非常相似 , 其4320个节点中的每个节点都配备了两颗Power9 CPU和四颗NVIDIA Tesla V100 GPU 。