惠普Z8 G4工作站评测:中小型AI模型训练“神器”


惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图
工欲善其事 , 必先利其器 。 AI研究与开发离不开算力支持 , 尤其是在进行模型训练的时候 , 一台强力的GPU工作站必不可少 。 其中处理器、内存/硬盘、显卡、以及散热表现都是选择GPU工作站时需要考虑的因素 。
然而由于实际应用环境的差异 , 开发者对GPU工作站的性能需求都有所不同 。 目前市面上也有一些面向机器学习开发的GPU工作站 , 但对于个人开发者 , 或者在中小企业、传统企业的开发人员而言 , 如何选择一台可满足性能需求的GPU工作站 , 并不容易 。
作为一名“野生”AI开发者 , 有幸在最近一周深度体验了一台HP Z8 G4工作站 , 从开发环境的安装、测试 , 以及深度学习算法模型 , 如CIFAR-10和ResNet50分类模型 , 以及YOLOv3的检测模型的训练 , 都进行完整的开发训练 。 下面是我对这一周的开发工作和使用体验的总结整理 , 供大家参考 , 希望能有所帮助 。
一、关键参数和散热表现在为大家介绍关键参数和散热表现之前 , 我拍了几张产品实图 , 为大家直观的介绍一下HP Z8 G4工作站的外观设计和内部结构 。
惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图
先说一下外观部分 , 机身外体采用的是铝制结构 , 并且以黑色磨砂呈现(比较符合开发者的颜色审美) , 给人一种很精致的感觉 。 然后是机体部分 , 整体采用模块化的设计(符合程序设计的模块化理念) , 内部布局让人感到整洁无暇 。 最后是主机后端的电源部分 , 可以进行免工具进行拆卸 , 极大的方便了后续的性能扩展 。
1、关键参数
惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图

  • – CPU
图片中的①部分是两颗英特尔? Xeon(R) Gold 6240处理器 , 可提供72核心144线程 , 2.6GHz的主频 , 以及35.75MB的三级缓存 。 在Linux下可以通过命令cat /proc/cpuinfo查看处理器信息 。 如下图所示 。
惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图
  • – GPU
图片中的②部分是两块NVIDIA Quadro RTX 8000处理器 。 NVIDIA Quadro RTX 8000采用了光线追踪技术 , 配备海量的48 GB超快速GDDR6显存和 NVIDIA NVLink? , 可为深度学习带来超凡的性能和可扩展性 。 在Linux下可以通过命令lspci | grep -i vga看GPU信息 。 如下图所示 。
48G的显存是什么概念呢?RTX 4000的显存是8G、RTX 3090的显存是24G , 目前还没有其他的48G显存的GPU 。 而在深度学习模型训练过程中 , 48G的显存可以增大batch(批处理数 , 表示每次输入的图片数量)的大小 , 一定程度上可以提高模型的泛化能力以及稳定性 。
惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图
  • – 内存/硬盘
在侧面图右下角的位置 , 如图中的③所示 , 是4个3.5/2.5英寸存储托架 , 其中预装了2个企业级SATA 的4TB 7200RPM , 留有2个可做扩展 。 同时具有384G内存+1T 大小的M.2 2280 PCIe NVMe TLC SSD , 提供了高效的存储读写能力 。 并且在主机右上靠中间的光驱位还可以再加一块3.5寸大容量硬盘 。 在Linux下可以通过命令grep MemTotal /proc/meminfo看内存信息 。 如下图所示 。
惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图
  • – 散热表现

惠普Z8 G4工作站评测:中小型AI模型训练“神器”文章插图