光一样的少年|向大数据异构系统的神威并行存储系统
面向大数据异构系统的神威并行存储系统
何晓斌1,蒋金虎2
1国家并行计算工程技术研究中心
2复旦大学计算机科学技术学院
论文引用格式:
何晓斌,蒋金虎.面向大数据异构系统的神威并行存储系统[J].大数据,2020,6(4):30-39.
HEXB,JIANGJH.Sunwayparallelstoragesystemforbigdataheterogeneoussystem[J].BigDataResearch,2020,6(4):30-39.
1引言大数据应用越来越广泛 , 也在很多方面影响着传统高性能计算(highperformancecomputing , HPC)应用 。 大数据与高性能计算相互融合 , 相互影响 , 主要体现在以下几个方面:一是异构并行计算应用与大数据应用融合交互;二是异构并行计算向大数据处理方式转变;三是大数据应用融入了高性能异构并行计算模式 。 这些新型的融合应用对传统的高性能计算机系统提出了新的要求 。 当前 , 大数据分析框架具有一些吸引人的特性 , 如容错性和与Hadoop生态系统的互操作性 。 但是 , 与使用高性能计算工具(如消息传递接口(messagepassinginterface , MPI))编写的本机实现相比 , 大数据框架中的许多分析操作是低效的或更慢的 , 在异构系统中 , 为了更好地发挥异构系统特性 , 有很多关于异构、存储的并行和优化工作 。 为了让大数据框架更好地在高性能计算系统中运行 , 只需基于MPI实现大数据框架 , 将大数据计算卸载到MPI , 就能达到融合效果 。 但将大数据处理的数据访问向高性能计算存储上适配 , 则存在许多问题 , 尤其是作为大数据处理系统的关键存储系统 , 其针对大数据处理的数据访问模式的设计和构建尤为重要 。 为了让大数据应用更好地使用高性能计算机系统的存储系统 , 研究者提出了多种方法 , 有的针对应用进行了数据访问优化 , 有的基于网络优化实现了加速 , 有的通过在高性能计算上重新构建大数据软件栈来实现优化 , 但从根本上来说 , 从架构层面构建两级存储模型是一种很好的解决方法 。
国产超级计算平台“神威·太湖之光”的并行存储系统为了增强对大数据应用的支持 , 在支持高性能计算应用的基础上 , 对设计和架构采用了一系列改造和优化关键技术 。 2背景介绍2.1“神威·太湖之光”异构系统结构简介“神威·太湖之光”是中国第一台全部采用自主技术构建的超级计算机 , 也是世界上首台峰值运算速度超过10亿亿次量级的超级计算机 。 考虑到面向的应用的复杂性 , “神威·太湖之光”计算机系统体系结构引入了融合体系架构 , 架构的一部分是面向传统高性能计算的高速计算系统 , 另一部分是面向大数据等新型应用的辅助计算系统 , 两部分通过高速计算互联网络进行内部和相互之间的高速互联 。 系统总体架构如图1所示 。
- 科技日日说|realme真我X7全方位评测:不一样的颜值,不一样的体验!,原创
- 少年帮|纯国产“龙芯”即将来临,正式确认?中科院宣布决定
- 功夫财经|猪肉也被人卡脖子了,种猪大危机:和芯片一样
- 中小企业数据交易中心|未来市场发展广阔,通证的五大核心价值
- 互联网集中营|京东C2M引领定制家电消费潮流,大数据+营销创新催生新市场
- 天文在线|而我们终于有了绘制它的数据,火星确有一个磁场
- 显卡|最新显卡天梯图显卡性能排行
- 上游新闻|腾讯西部云计算数据中心二期一半的项目规划已建成
- 就是爱搞机|嫌你家音箱外观太单调?哈曼卡顿给你不一样的视觉冲击感
- 数字营销|助推企业数字化,久其数字CEO邓晨:释放大数据价值