英伟达推出基于Ada Lovelace架构的GeForce RTX 40系列GPU

导读 在今天的 GeForce Beyond 主题演讲中,Nvidia 推出了采用最新 Ada Lovelace 架构的 GeForce RTX 40 系列。Ada Lovelace GPU

在今天的 GeForce Beyond 主题演讲中,Nvidia 推出了采用最新 Ada Lovelace 架构的 GeForce RTX 40 系列。Ada Lovelace GPU 建立在台积电的新 4nm 工艺之上,Nvidia 称该工艺针对 GPU 进行了优化,并且在其着色器核心、RT 核心和 Tensor 核心上进行了大量改进。GPU 还配备了新的 GDDR6X 内存。

Nvidia GeForce RTX 40 系列规格

Nvidia 的 Ada Lovelace GPU 配备了一些令人印象深刻的规格。在着色器方面,Nvidia Ada Lovelace GPU 配备了新的流式多处理器,支持高达 83 TFLOPS 的性能,仅用于着色。它可以提供高达现有 Nvidia GPU 两倍的性能,这是一个非常重要的升级。

光线追踪方面,英伟达 GeForce RTX 40 系列搭载第三代 RT 核心,承诺高达 191 TFLOPS 的光线追踪性能,较上一代提升 2.8 倍。最后,在人工智能方面,这些 GPU 配备了第四代 Tensor Core,可提供高达 1.32 的 Tensor PFLOPS (petaflops),与使用 FP8 加速时的上一代相比大幅提升 5 倍。

除此之外,Nvidia 还启用了一项名为 Shader Execution Reordering 的新功能。顾名思义,这允许 GPU 以更好地利用 GPU 的方式动态重新排序着色器工作负载。通常,工作负载按顺序交付给 GPU,并非所有工作负载都使用 GPU 的全部功能。通过对它们进行重新排序,这些 GPU 可以一次处理更多此类工作负载,并利用其全部功能提供更好的性能。Nvidia声称这将光线追踪性能提高了3倍,并且可以将游戏的帧速率提高25%。

描绘使用 Shade Execution Reorderint 充分利用 GPU 性能的过程的插图

尽管性能有所提高,但由于与台积电合作设计的新 4nm 工艺,Nvidia 承诺将功率效率提高到上一代产品的两倍。性能的提高不应该伴随着功耗的大幅增加,考虑到现代 GPU 已经非常耗电,这是个好消息。

GPU 还配备了双 Nvidia 编码器 (NVENC),除了支持 AV1 编码外,还可将视频的导出时间缩短一半。英特尔是第一个在其 Arc GPU 中吹捧支持 AV1 编码的公司,但现在,Nvidia 正在迎头赶上。

DLSS 3

Nvidia GeForce RTX 40 系列的一大新功能是支持 DLSS 3,这是 Nvidia 的第三代深度学习超级采样技术。DLSS 3 进行了更多改进,以进一步提高帧速率,通过允许 GPU 使用 DLSS 帧生成完全自行渲染整个帧来克服 CPU 限制。在Microsoft Flight Simulator等 CPU 密集型游戏中 ,由于 DLSS 帧生成,您可以获得两倍的帧速率。

还有新的 Ada 光流加速器,它允许 DLSS 3 中的神经网络预测场景中的运动,在保持图像质量的同时进一步提高帧速率。Nvidia 表示,使用 DLSS 3,与传统渲染技术相比,您可以获得高达四倍的游戏性能。