NVIDIA齐新RTX 40显卡收布 杀青“消耗降级”:价钱猛涨立异下

9月20日的GTC活动上,英伟达CEO黄仁勋在演讲中发布了万众瞩目的英伟达新一代游戏显卡 RTX40系列。

本次英伟达共发布了三款显卡,分别是RTX 40系旗舰显卡RTX 4090与定位高端的RTX 4080 16GB、RTX 4080 12GB。

RTX 40系列显卡采用了新一代RTX架构,计算能力再次实现跨越式发展。而光追技术的全新升级与DLSS3的加入,也为游戏玩家带来了全新的升级体验。

RTX 4090显卡将在10月12日上市,而RTX 4080显卡则将在11月上市。

加量也加价,40系显卡性能、价格双「越级」

RTX4090采用了全新的第三代RTX架构,并使用台积电4N工艺制造。

新一代RTX以世界上第一位计算机程序员Ada Lovelace的名字命名,黄仁勋在演讲中表示,得益于英伟达与台积电的紧密合作,专为GPU制造优化的4N工艺让Ada Lovelace架构能够集成760亿个晶体管和超过18000个CUDA核心,较上一代Ampere架构多70%,能耗比相较Ampere则提升一倍。

采用了Ada架构的40系显卡在性能表现上远远超过前辈30系显卡。

旗舰定位的RTX 4090集成了760亿个晶体管、16384个CUDA核心,并拥有24GB显存。

英伟达表示,在强大硬件指标的加持下,RTX 4090显卡即使在4K分辨率下,依然可以获得超过100FPS的流畅游戏体验。

能效方面,RTX 4090功率为450W,与RTX 3090Ti保持一致,但英伟达称在同样功率下,4090的游戏表现较RTX 3090Ti提升一倍。

定位低一档的RTX 4080则有16GB与12GB两个显存版本,16GB版本集成了9728个DUDA核心。英伟达称RTX 4080 16GB的游戏性能两倍于RTX 3080,并超过了上一代旗舰RTX 3090 Ti。

而12GB版本的RTX 4080则集成了7680个CUDA核心,理论性能也超越了上一代旗舰RTX 3090 Ti。

全新架构还搭载了Opacity Micromap引擎,将光线追踪的Alpha-Test集合性能提升2倍。全新的Micro-Mesh引擎则能够在不带来更多的BVH构建和存储资源消耗的前提下提升图形的丰富度。

最后,全新Tensor Core新增了Hooper FP8 Transformer Engine可以提供1.4 petaFLOPS张量处理性能。在性能获得巨大升级的同时,这一代英伟达游戏显卡的价格也再创新高。

RTX 4090建议零售价为12999人民币起,相比上一代RTX 3090 11999元的其售价涨价1000元。

而RTX 4080价格则上探到了9499元,相较上一代RTX 3080 5499元的起售价可谓完成 消费升级 。即使结合英伟达本代显卡将没有RTX 4080Ti的传闻,RTX 4080 16GB的其售价也比上一代同定位的RTX 3080 Ti的9499元略有提价。

更低配置的RTX 4080 12GB的其售价也高达7199元,与上一代同定位的RTX 3070Ti的4499元售价也涨势凶猛。

光追再升级,游戏中AI 偷天换日

本次RTX 40系列显卡最重要的升级之一就是对光线追踪技术的升级。

RTX系列显卡最初问世就以光线追踪为特色功能,本次40系的更新更是 牙膏挤爆 ,正如英伟达CEO黄仁勋所说: 英伟达重新定义了图形。

新的Ada Lovelace架构具有高达90TFLOPs的着色器能力,吞吐量超过上一代产品两倍。除此之外,Ada架构的SM多单元流处理器还使用了着色器重排序技术(SER),可实现对任务的实时重新调度。黄仁勋强调这项技术对GPU来说是革命性的,原理上与CPU的乱序执行技术类似。

对于这项技术,黄仁勋在演讲中解释道,光线追踪的工作负载需要不同的线程处理,不同着色器之间很难合并工作,SER技术则能够即时安排着色器负载,从而提高执行效率,更好地利用GPU资源,打造更好的光线追踪效果。

这项技术能够让英伟达显卡光线追踪性能提升2-3倍,整体游戏性能提升25%。

在提升计算能力之外,英伟达还通过多种方式提升终端游戏体验。在演讲中,黄仁勋表示,和加速计算一样,计算机图形的也是一项全栈挑战。要实现突破还需要在架构、设计和算法上创新。

此前在RTX显卡上始终扮演着重要角色的DLSS技术本次也迎来了重大更新。

在RTX显卡上,DLSS技术一直是光线追踪技术的重要 搭档 :光线追踪模拟出更真实、更贴近现实效果的游戏场景,DLSS技术则利用AI算法降低模拟这样的真实物理环境所需要的计算量,保证用户流畅的游戏体验。

这次,第三代DLSS技术同RTX 40系显卡一同登场,并带来了开创性的光学多帧生成功能。

与之前最大的不同在于,第三代DLSS技术生成的不再是像素,而是全面的画面帧。

基于Ada Lovelace架构的新光流加速器,第三代DLSS技术可以分析两帧连续的游戏图像,并向神经网络输入像素级的从帧到帧的运动方向和速度信息,此后神经网络模型将据此计算出中间帧。

这样的中间帧由神经网络计算生成,不再涉及图形渲染,完全独立于游戏。这能蓝狮在线够大大减轻游戏中即时演算的运算量。

通俗的讲,游戏中的画面是由GPU这个 画家 通过算力的 画笔 创造的,DLSS3技术能在两张画作之间插入了一张AI生成的 照片 ,从而彻底解放GPU 画家 的双手。

英伟达表示第三代DLSS技术相较于单纯渲染的方式可以将游戏性能提高4倍。

黄仁勋表示,DLSS 3能够为Ada GPU带来远高于CPU可计算的帧率,从而让一些对CPU要求较高的游戏也从中受益。

在现场,英伟达展示了两款对CPU要求较高的游戏,在开启DLSS3后,《赛博朋克2077》与《微软模拟飞行》的帧率增加都超过一倍,达到90帧以上。

《传送门》连接过往与将来,英伟达冲向元宇宙

游戏,是RTX 40系列发布时一个重要话题。

在发布40系显卡的同时,本次英伟达还颇有复古精神的带来了经典游戏《传送门》重制版。

这款被称为《传送门RTX》的游戏,实际上是英伟达基于其元宇宙创作平台onmiverse创建的一个mod。

英伟达巧妙地用《传送门》,连接起了过去和未来。

正如这一经典游戏的玩法:开启传送门,走向另一端。

在英伟达看来,传送门的另一端无疑是属于元宇宙的世界。

黄仁勋表示,mod是一种受众庞大的游戏文化,各种游戏mod每年下载量已经突破数十亿次。在10款最热门的竞技游戏中,有9款都能见到mod的身影。

英伟达为游戏mod设计者打造了一款名为RTX Remix的Ominverse应用。

基于该工具,游戏开发者可以为各种经典游戏制作mod添加RTX光追效果。

基于该工具,mod制作者需要将游戏导入USD中,然后使用modding工具来创建光线追踪mod,并导出至RTX渲染器。该工具还使用AI技术,以提升mod材质的质感。

英伟达在几年前就已经创建了名为Onmiverse的元宇宙创意平台,让元宇宙开发者可以通过这个3D平台互相连接并共同协作。

无论是RTX 40系列显卡更强的GPU算力,还是更真实的光追效果,都无疑将会为元宇宙的生态贡献更强的力量。

在老黄演讲的开头,是一段RacerX演示的demo。RacerX是基于Omniverse构建的全交互式仿真演示,其中所有的基于现实物理规律,所有光照、反射和折射则采用光线追踪技术。

这也许昭示着英伟达眼中的未来:在更加强大的显卡性能与AI能力加持下的更加真实的游戏体验和元宇宙场景。