AMD RX 7900 XT,作为AMD旗下的高端显卡,搭载了先进的ROCm技术,为Linux系统的AI性能带来了质的飞跃。ROCm,专为高性能计算而设计,与AMD的RDNA架构完美契合,使得RX 7900 XT在AI应用中展现出了卓越的性能。在Linux系统的支持下,RX 7900 XT能够高效地进行深度学习训练和推理,大大提升了图形渲染的速度。无论是复杂的图像处理,还是智能数据分析,RX 7900 XT都能轻松应对,为用户提供前所未有的AI体验。
随着人工智能时代的到来,显卡已经不仅仅用于游戏,尤其是在Stable Diffusion风靡网络之后,越来越多的人开始将显卡视为AIGC(人工智能生成内容)的生产力工具。然而,Stable Diffusion的早期版本对AMD显卡的支持并不理想,导致人们普遍认为只有NVIDIA显卡才适合进行AI计算。实际上,AMD的Radeon GPU同样适用于深度学习,并且性能相当出色。去年12月,AMD推出了ROCm 6.0开发平台,进一步提升了RX 7000系列显卡的AI性能,特别是在Stable Diffusion的出图效率方面实现了翻倍提升。
AMD ROCm:助力RX 7900 XT实现AI性能翻倍
首先,让我们了解一下AMD ROCm。ROCm(Radeon Open Compute Platform)是AMD基于开源项目的GPU计算生态系统,类似于NVIDIA的CUDA。ROCm支持多种编程语言、编译器、库和工具,旨在加速科学计算、自动驾驶、人工智能和机器学习等领域的应用。此外,ROCm还支持多种加速器厂商和架构,提供了开放的可移植性和互操作性。目前,深度学习开发主要使用Python,而大数据平台通常部署在Linux操作系统上,因此AMD ROCm目前主要专注于Linux系统,Windows端的优化仍在进行中。
得益于双发射设计的流处理器单元,RX 7900 XT凭借5376个流处理器实现了52TFOPS的单精度浮点运算性能,而拥有10240个流处理器的RTX 4080 Super浮点性能为55TFOPS。RX 7900 XTX的单精度浮点性能更是接近60TFOPS。Stable Diffusion主要依赖于GPU的单精度浮点性能以及显存容量与带宽,在这方面,RX 7900 XT与RTX 4080 SUPER相当,甚至显存容量更大。有了AMD ROCm 6.0的加持,RX 7900 XT终于能够充分发挥其强大的AI算力。
Stable Diffusion出图速度对比:Linux系统下出图效率近乎翻倍
为了验证AMD ROCm的性能提升,我们对比了RX 7900 XT/XTX在Ubuntu和Windows系统下的出图效率。以下是测试平台:
RX 7900 XT对比测试
首先,我们在Windows 11系统下进行测试。打开Stable Diffusion,设置DPN++ 2M Karras采样、迭代步数50、Euler a采样、1024x768分辨率、CFG为7、总批次10,单批数量1。结果显示,RX 7900 XT基于DirectML加速模式生成10张图共耗时9分51秒,即591秒。
接下来,我们在Ubuntu 22.04.3 LTS系统下进行测试。在设置好ROCm后,使用相同的参数和模型生成10张图仅需5分05秒,即305秒。相比之下,在Ubuntu 22.04.3 LTS系统下,RX 7900 XT的出图效率比Windows系统高出了94%。
RX 7900 XTX对比测试
使用相同的参数测试RX 7900 XTX显卡。在Windows系统下,RX 7900 XTX基于DirectML加速模式生成10张图共耗时9分18秒,即558秒。而在Ubuntu 22.04.3 LTS系统下,同样的参数和模型生成10张图仅需4分45秒,即285秒。在Ubuntu 22.04.3 LTS系统下,RX 7900 XTX的出图效率比Windows系统高出了96%,几乎实现了翻倍性能提升。
总结:高性价比的AIGC显卡
目前,非公版RX 7900 XT的售价约为5299元,而非公版RTX 4080 Super的售价为8599元,后者比前者贵60%。实际上,这两款显卡在游戏性能方面的差距并不大。AMD已经认识到AI应用对GPU的重要性,并加大了对ROCm平台的投入。经过不断更新,AMD ROCm 6.0在AI算力方面的提升已经超出了大多数玩家的预期。在我们的测试中,RX 7900 XT在Linux系统下使用Stable Diffusion ROCm 6.0版本时,其出图效率几乎是Windows系统的两倍。再加上55TFOPS的单精度浮点运算性能和20GB GDDR6X超大容量显存,对于有较高专业AIGC应用需求的专业用户而言,RX 7900 XT无疑是一个非常划算的选择。当然,我们也期待AMD能够继续优化ROCm在Windows系统下的性能表现,让更多的AMD用户能够享受到高性价比的AIGC显卡。