前言
众所周知,上一代的RTX2080Ti以极高的性能服务于冷冻电镜领域已达两年之久。今年9月NVIDIA不负众望,给大家带来了新一代GPU,今天我们就来看看其中作为旗舰产品的RTX 3090有哪些提升?
RTX3090采用了NVIDIA最新的Ampere架构,基于三星8nm先进工艺制造,核心频率1440MHz,CUDA核心数量多达10,496个,拥有24GB GDDR6X显存,显存位宽384bit。参数上相比于上一代RTX2080Ti有了大幅度的提升。NVIDIA给RTX3090的定位更接近于一张专业卡,虽然1499美元的官方首发价格要比当年的RTX2080Ti高出许多,但是如果和上一代定位相当的Titan RTX相比,这价格还是很亲民的。
(上图为显卡核心参数对比)
在冷冻电镜领域,GPU的超高运算速度早在2016年初就在流行的cryo-EM软件Relion中有所体现;对于拥有双倍于 RTX2080Ti的CUDA核心数,RTX3090能否大幅提升工作站的性能,实现翻倍式碾压RTX2080Ti?为了弄清楚这些问题,Single Particle公司开展了本次的测试并将结果分享给大家,如果您已购买设备或者正在购买中,或者希望了解任何相关本次测试的其他细节,请联系我们。
正文
本次测试主要分为两个部分:
- 稳定性测试,对GPU进行加压测试,主要工具为gpuburn和RELION benchmark;GPU长时间全功率运转,观察是否出现死机、重启、自动关机或其他情况。
- RELION benchmark性能测试,主要针对2D,3D的不同状态下的性能测试,除了考虑硬件性能、配置合理的运行环境外,我们对软件参数进行了一定优化,从而统计出实际的运行时间和GPU运行时间。
测试结果
- RTX3090与NVDIA其他系列显卡对比
在2D分类计算中,RTX 3090的GPU Time约140mins
- 比GTX 1080Ti 提升了约–82%
- 比 RTX 2080Ti 提升了约–69%
- 比RTX 5000也提升了约– 47%
在3D分类计算中, RTX 3090的GPU Time约32mins
- 比GTX 1080Ti 提升了约–81%
- 比 RTX 2080Ti 提升了约–34%
- 与RTX 5000 的运行时长接近
- RTX3090在数量不超过4张卡的时,会随着数量增加其性能呈现几乎翻倍式的提升;超过4张RTX3090后,运行速度呈非线性提升;
- 优化参数后,在2D和3D分类时,运行时长相对有明显减少。在2D分类计算中,RTX3090 对比 RTX2080Ti加速效果明显,达到超过80%的加速效果;在3D分类中,RTX3090对比RTX2080Ti,运行时长有约34%的提升;
- RTX3090运行稳定,在gpuburn和benchmark测试中未发生死机、卡顿等情况;
- RTX3090功耗有所增加,但性能的提升幅度要超过功耗的提升,在运行程序时RTX3090 GPU利用率能达到90~100%,满载温度基本稳定在75~80℃,比上一代低了近10℃(相同风冷条件下)。
01 RTX 3090 与“GTX1080Ti, RTX2080Ti, RTX5000”性能对比
测试配置单
OS | Cent 7.8 |
---|---|
CPU | Dual Intel Xeon Gold 6230R |
内存 | 256GB |
SSD | 1.92TB NVme |
显卡选项1 | 4x NVIDIA RTX 3090 |
显卡选项2 | 4x NVIDIA GTX 1080Ti |
显卡选项3 | 4x NVIDIA RTX 2080Ti |
显卡选项4 | 4x NVIDIA RTX 5000 |
在测评过程中,除了考虑硬件性能、配置环境等,我们还对参数进行了优化。从上面两张图可以看出,RTX3090作为RTX2080Ti的升级版,提升效果还是非常明显的;4张3090显卡运行的3D分类时间已经接近8张2080Ti的显卡运行速度( 8卡2080Ti参数优化后的运行时间为Real Time 42mins, GPU time 22mins);在和同价位的RTX5000对比中,其2D分类运行时间差距较为明显;相对于1080Ti,3090的运行速度也几乎是翻倍式的提升。
02 显卡数量对运行速度的影响
测试配置单
OS | Cent 7.8 |
---|---|
CPU | Dual Intel Xeon Gold 5118 |
内存 | 256GB |
SSD | 1.2TB NVme |
显卡 | NVIDA RTX 3090 (数量:1,2,4,8,10) |
通过上图性能测试的数据,我们观察到,随着显卡数量增加,运行速度不断提升。从1卡到4卡,几乎线性的性能提升;值得注意的是,当超过4张显卡后,运行速度呈非线性提升。(特别鸣谢 Dr. Ming Sun 对上述1x RTX3090测试结果的指正)
03 优化参数对运行时间的影响
从这轮测试环节的结果来看,在软件运行时,设置不同的参数,运算所需时间都会有所差异。优化参数后,在2D和3D分类时,运行时长相对有明显减少。在2D分类计算中,RTX3090对比 RTX2080Ti加速效果明显,达到超过80%的加速效果;在3D分类中,RTX3090对比RTX2080Ti,运行时长有约34%的提升。
04 满载压测
我们采用gpuburn进行了满负载测试,RTX 3090的温度控制不错,20多摄氏度室温下显卡满载运行,GPU的核心温度基本稳定在80℃以下,而使用率高达90%-100%。再说说3090显卡的稳定性,在不同环境下,测试出来4卡工作站的gflop值为14227s, 10卡工作站的为14407s,稳定性能达到理论值的80%。
单张3090功耗为350瓦,对比之前2080Ti 250瓦的功耗多出了不少,4张或以上3090显卡上机后,总功耗在1700瓦以上,对于使用220V电路的机房可正常运行;(需要说明一点的是,针对某些地区有可能是110V电路的机房,则需要考虑单电路供电不足的问题。)
新出的RTX3090香不香,相信大家看了这篇文章都会有自己的判断。
参考资料
此次RELION benchmark性能测试,主要采用RELION官网上的公开数据库RELION benchmark(the Palsmodium ribosome, 10万个particles, box size为360, Wong et al, eLife 2014)作为测试数据。同样选择的是2D classification 和3D classification来进行运行速度的测评,测试方法和数据来源基于RELION官网:
(本次测评皆是Relion 3.1版本的测试结果)