AMD GPU大飞跃!Stable Diffusion模型性能提升最高达3.8倍

   发布时间:2025-04-18 14:31 作者:唐云泽

近期,NVIDIA在人工智能领域的领先地位不仅得益于其强大的硬件性能,还归功于其生态系统的高度优化,使得AI应用能够发挥最佳效能。相比之下,AMD虽然在这一领域起步稍慢,但正奋力追赶,不断缩小与NVIDIA的差距。

值得注意的是,Stability AI近期发布了一项针对ONNX框架优化的Stable Diffusion模型,该模型在AMD Radeon显卡及锐龙集成显卡上的运行效率显著提升,最高可达3.8倍。这一突破无疑为AMD硬件在AI应用上的表现注入了新的活力。

AMD方面表示,过去一年中,他们积极与操作系统供应商(OSV)、原始设备制造商(OEM)以及独立软件供应商(ISV)合作,对AMD硬件上的AI应用进行全面优化,涵盖硬件设计、驱动程序、编译器以及机器学习模型等多个层面。这一努力如今已初见成效。

据AMD官方公布的数据显示,经过优化后的SDXL 1.0和SDXL Turbo在AMD硬件上的推理性能相较于基础的PyTorch模型有了显著提升,最高可达3.8倍。而SD3.5模型则能提升最多2.6倍的性能。在实际的图片和视频生成应用中,这些优化带来的性能提升同样显著。例如,在RX 9070 XT显卡上,SDXL 1.0、SDXL Turbo、SD3.5 Large以及SD3.5 Large Turbo的效率分别提升了3.1倍、1.5倍、3.3倍和2.1倍。

在锐龙AI MAX+ 395处理器上,SDXL 1.0、SD3.5 Large以及SD3.5 Large Turbo的效率也分别提升了1.4倍、3.3倍和3.0倍。这些数据充分证明了AMD在AI硬件优化方面所取得的显著进展。

AMD硬件优化版的Stable Diffusion模型具有一个特殊的“_amdgpu”后缀标记,方便用户进行识别。目前,这些优化后的模型已经可以在Stability AI或Hugging Face等平台上下载使用。同时,AMD还与TensorStack AI联合推出了最新版的Amuse 3.0软件,进一步提升了AMD硬件在AI应用中的表现。

为了确保用户能够充分利用这些优化带来的性能提升,AMD还提醒用户注意GPU驱动版本的选择。建议使用不低于24.30.31.05预览版的AMD GPU驱动,或者等待即将发布的25.4.1正式版驱动。这些更新将确保用户的AMD硬件能够充分发挥其在AI应用中的潜力。

 
 
更多>同类内容
全站最新
热门内容
本栏最新