NVIDIA RTX3090冷冻电镜方向深度实测及分析:快、准、稳!

前言

众所周知,上一代的RTX2080Ti以极高的性能服务于冷冻电镜领域已达两年之久。今年9月NVIDIA不负众望,给大家带来了新一代GPU,今天我们就来看看其中作为旗舰产品的RTX 3090有哪些提升?

RTX3090采用了NVIDIA最新的Ampere架构,基于三星8nm先进工艺制造,核心频率1440MHz,CUDA核心数量多达10,496个,拥有24GB GDDR6X显存,显存位宽384bit。参数上相比于上一代RTX2080Ti有了大幅度的提升。NVIDIA给RTX3090的定位更接近于一张专业卡,虽然1499美元的官方首发价格要比当年的RTX2080Ti高出许多,但是如果和上一代定位相当的Titan RTX相比,这价格还是很亲民的。

(上图为显卡核心参数对比)

在冷冻电镜领域,GPU的超高运算速度早在2016年初就在流行的cryo-EM软件Relion中有所体现;对于拥有双倍于 RTX2080Ti的CUDA核心数,RTX3090能否大幅提升工作站的性能,实现翻倍式碾压RTX2080Ti?为了弄清楚这些问题,Single Particle公司开展了本次的测试并将结果分享给大家,如果您已购买设备或者正在购买中,或者希望了解任何相关本次测试的其他细节,请联系我们。

正文

本次测试主要分为两个部分:

  • 稳定性测试,对GPU进行加压测试,主要工具为gpuburn和RELION benchmark;GPU长时间全功率运转,观察是否出现死机、重启、自动关机或其他情况。
  • RELION benchmark性能测试,主要针对2D,3D的不同状态下的性能测试,除了考虑硬件性能、配置合理的运行环境外,我们对软件参数进行了一定优化,从而统计出实际的运行时间和GPU运行时间。

测试结果

  1. RTX3090与NVDIA其他系列显卡对比

在2D分类计算中,RTX 3090的GPU Time约140mins

  • 比GTX 1080Ti 提升了约–82%
  • 比 RTX 2080Ti 提升了约–69%
  • 比RTX 5000也提升了约– 47%

在3D分类计算中, RTX 3090的GPU Time约32mins

  • 比GTX 1080Ti 提升了约–81%
  • 比 RTX 2080Ti 提升了约–34%
  • 与RTX 5000 的运行时长接近
  1. RTX3090在数量不超过4张卡的时,会随着数量增加其性能呈现几乎翻倍式的提升;超过4张RTX3090后,运行速度呈非线性提升;
  2. 优化参数后,在2D和3D分类时,运行时长相对有明显减少。在2D分类计算中,RTX3090 对比 RTX2080Ti加速效果明显,达到超过80%的加速效果;在3D分类中,RTX3090对比RTX2080Ti,运行时长有约34%的提升;
  3. RTX3090运行稳定,在gpuburn和benchmark测试中未发生死机、卡顿等情况;
  4. RTX3090功耗有所增加,但性能的提升幅度要超过功耗的提升,在运行程序时RTX3090 GPU利用率能达到90~100%,满载温度基本稳定在75~80℃,比上一代低了近10℃(相同风冷条件下)。

01  RTX 3090 与“GTX1080Ti, RTX2080Ti, RTX5000”性能对比

测试配置单

OSCent 7.8
CPUDual Intel Xeon Gold 6230R
内存256GB
SSD1.92TB NVme
显卡选项14x NVIDIA RTX 3090
显卡选项24x NVIDIA GTX 1080Ti
显卡选项34x NVIDIA RTX 2080Ti
显卡选项44x NVIDIA RTX 5000
<图1. 测评不同类型显卡 2D Class的运行时长结果>
<图2. 测评不同类型显卡 3D Class的运行时长结果>

在测评过程中,除了考虑硬件性能、配置环境等,我们还对参数进行了优化。从上面两张图可以看出,RTX3090作为RTX2080Ti的升级版,提升效果还是非常明显的;4张3090显卡运行的3D分类时间已经接近8张2080Ti的显卡运行速度( 8卡2080Ti参数优化后的运行时间为Real Time 42mins, GPU time 22mins);在和同价位的RTX5000对比中,其2D分类运行时间差距较为明显;相对于1080Ti,3090的运行速度也几乎是翻倍式的提升。

02  显卡数量对运行速度的影响

测试配置单

OSCent 7.8
CPUDual Intel Xeon Gold 5118
内存256GB
SSD1.2TB NVme
显卡NVIDA RTX 3090 (数量:1,2,4,8,10)
<图3. 不同数量 RTX 3090 3D Class的运行时长结果>

通过上图性能测试的数据,我们观察到,随着显卡数量增加,运行速度不断提升。从1卡到4卡,几乎线性的性能提升;值得注意的是,当超过4张显卡后,运行速度呈非线性提升。(特别鸣谢 Dr. Ming Sun 对上述1x RTX3090测试结果的指正)

03  优化参数对运行时间的影响

<图4. 测评不同参数在 2D Class的运行下的时长结果>
<图5. 测评不同参数在 3D Class的运行下的时长结果>

从这轮测试环节的结果来看,在软件运行时,设置不同的参数,运算所需时间都会有所差异。优化参数后,在2D和3D分类时,运行时长相对有明显减少。在2D分类计算中,RTX3090对比 RTX2080Ti加速效果明显,达到超过80%的加速效果;在3D分类中,RTX3090对比RTX2080Ti,运行时长有约34%的提升。

04 满载压测

我们采用gpuburn进行了满负载测试,RTX 3090的温度控制不错,20多摄氏度室温下显卡满载运行,GPU的核心温度基本稳定在80℃以下,而使用率高达90%-100%。再说说3090显卡的稳定性,在不同环境下,测试出来4卡工作站的gflop值为14227s, 10卡工作站的为14407s,稳定性能达到理论值的80%。

单张3090功耗为350瓦,对比之前2080Ti 250瓦的功耗多出了不少,4张或以上3090显卡上机后,总功耗在1700瓦以上,对于使用220V电路的机房可正常运行;(需要说明一点的是,针对某些地区有可能是110V电路的机房,则需要考虑单电路供电不足的问题。)

新出的RTX3090香不香,相信大家看了这篇文章都会有自己的判断。

参考资料

此次RELION benchmark性能测试,主要采用RELION官网上的公开数据库RELION benchmark(the Palsmodium ribosome, 10万个particles, box size为360, Wong et al, eLife 2014)作为测试数据。同样选择的是2D classification 和3D classification来进行运行速度的测评,测试方法和数据来源基于RELION官网:

(本次测评皆是Relion 3.1版本的测试结果)

Close Menu