Blackwell RTX 50架构大起底:AI与DLSS 4如何引领未来?

   发布时间:2025-01-22 15:38 作者:钟景轩

在图形渲染和高性能计算领域,NVIDIA一直保持着领先地位,然而他们并未停下创新的脚步。最新推出的Blackwell GPU架构,不仅再次提升了性能,还同时兼顾了图形处理和计算两大领域的需求。

随着RTX 50系列的发布,NVIDIA揭开了Blackwell架构的神秘面纱,详细介绍了其架构设计、AI神经网络渲染以及DLSS 4技术。在CES 2025大展期间,受NVIDIA官方邀请,我们有幸参加了Editor’s Day活动,提前了解了Blackwell的设计细节,并亲眼见证了多项技术演示。

首先,让我们回顾一下NVIDIA在2022年推出的Ada Lovelace架构,通过对比,我们可以更清晰地看到Blackwell架构的革新之处。NVIDIA承认,当前GPU行业面临着用户对画质和帧率要求日益提高,但摩尔定律逐渐放缓的双重挑战。为了应对这一矛盾,NVIDIA推出了支持神经网络渲染和AI算力飙升的Blackwell架构。

尽管AI渲染技术已经存在多年,并逐渐普及,但仍有不少玩家坚持认为原生渲染性能才是衡量GPU性能的标准,对基于AI算法的DLSS等技术持怀疑态度。然而,这种观点可能过于片面。实际上,在现有技术条件下,AI渲染的画面虽然与原生渲染有所不同,但目标都是为了提供更好的画质和更高的帧率。而且,随着AI技术和算法的不断进步,AI渲染的画质正在逐渐逼近甚至超越原生渲染。

为了应对这些挑战,NVIDIA为Blackwell架构设定了四大主要目标:优化神经网络负载、降低显存占用、优化AI精度与大模型、提高能效。通过第五代Tensor Core和FP4数据精度,Blackwell架构实现了高达4000 AI TOPS的超高算力。同时,第四代RT Core带来了360 RT TFLOPS的性能提升,并加入了全新的AI管理处理器(AMP),可以同步管理AI模型与图形,自动拆分并调度不同类型的任务。

Blackwell架构在优化神经网络负载方面做了大幅变革。首先,将传统的着色器改造为神经网络着色器,并加入了多个神经网络处理单元。其次,将FP32/INT32、FP32两种不同的着色器核心统一为FP32/INT32,提高了处理效率和灵活性。第三代Tensor Core也升级为第四代,进一步提升了性能。

在降低显存占用方面,Blackwell架构通过升级RT Core,提升了检测光线、路径与三角形相交的性能和效率。新增的三角形集群碰撞引擎和线性扫描球体技术,使得在处理复杂场景时能够显著减少显存占用。据NVIDIA称,Blackwell的三角形交互处理效率比Ada架构提升了2倍,显存占用量降低了25%。

在优化AI精度与大模型方面,Blackwell架构支持的数据类型越来越多,精度越来越低,速度越来越快。通过增加FP4精度,Blackwell架构在性能上实现了翻番。同时,AMP处理器能够自动识别并区分不同类型的指令,将其分配给最适合的硬件单元执行,特别是优先处理大语言模型(LLM),提高了整体效率。

在提高能效方面,Blackwell架构通过时钟门控、电源门控和电路门控等技术,显著降低了功耗。同时,加速频率切换技术的引入,使得GPU在需要时能够更稳定地运行在更高频率,一旦完成工作则快速降低频率进入低功耗模式。据NVIDIA称,Blackwell架构相比上一代可以节省多达50%的功耗。

除了硬件架构的革新,Blackwell还在媒体能力方面进行了提升。支持DisplayPort 2.1和UHBR20模式,单通道带宽高达20Gbps,总带宽可达80Gbps。同时,NVDEC解码引擎升级到第九代,NVENC编码引擎升级到第六代,支持AV1格式的UHQ超高质量模式以及HEVC格式的MV-HEVC多视图功能。

在AI技术方面,Blackwell首次引入了神经网络着色器,为开发者带来了全新的编程方式。通过神经网络纹理压缩、神经网络材质、神经网络体积等技术,Blackwell能够在保证画质的同时显著降低显存占用。RTX神经网络辐射缓存(NRC)技术利用AI力量更准确地估算游戏场景中的间接光照效果,提升了画面质量和运行帧数。

在DLSS技术方面,全新的DLSS 4引入了Transformer模型支持,这是图形领域的第一个实时Transformer应用场景。Transformer模型的引入使得DLSS在画质、稳定性和细节表现上都有了显著提升。同时,DLSS 4还引入了多帧生成(MFG)技术,AI可以生成更多的像素和帧,进一步提升了帧率。据NVIDIA称,DLSS 4可以将帧率提升至传统渲染的最多8倍。

NVIDIA还在AI角色生成方面取得了显著进展。通过NVIDIA ACE套件和G-Assist技术,开发者可以在游戏中生成可自然交互的虚拟数字人物,提升玩家的游戏体验。目前已有多款游戏计划加入ACE AI角色或系统,为玩家带来更加生动、动态的游戏世界。

总的来说,Blackwell架构的推出标志着NVIDIA在GPU领域的又一次重大突破。通过将AI技术融入GPU架构的方方面面,NVIDIA不仅提升了性能和能效,还为开发者带来了更多的可能性。未来,我们期待看到更多基于Blackwell架构的优秀产品问世。

 
 
更多>同类内容
全站最新
热门内容
本栏最新