性能翻倍 RTX 40系显卡尾批7199元起很本心?老黄:以后游戏像素皆AI猜测非盘算
矿难来袭、玩家盘算何时下山之际,老黄带着他的40系显卡来了!首发三款高端型号,RTX4090 24GB、RTX4080 16GB和12GB显存两版。话不多说,直接上规格:
三款游戏帧数测试,在4K分辨率、全高设置、开启光追与 DLSS 情况下,4090提高到上代旗舰 3090Ti 的2-4倍,4080与3080Ti对比也提高到原来的 2-3 倍。
另外英伟达还与波兰蠢驴合作,给《赛博朋克 2077》开发了 全极致光线追踪模式 ,软硬协作榨干所有性能,帧数直接x4。要达成这些效果,靠的是全新GPU在制程工艺、硬件架构、软件算法上的一系列改进。
台积电工艺、DLSS 放大招
全新架构 Ada Lovelace,切换到台积电 4N 定制工艺(5nm),专为生产GPU优化的那种,而Ampere时代用的还是三星8nm。新工艺加持下,RTX4090 塞进了 760 亿个晶体管、1.8 万个 CUDA 核心,比上一代增加70%。同时与上一代架构Ampere对比,能效比也有较大提升。
一个重头戏是DLSS3,这一次AI能力不仅用于超分辨率,还会用于插帧。老黄说,以后你看到的游戏画面中大部分像素都不是直接渲染出来的,而是AI预测的。
接下来,英伟达把新架构下的 SM 多单元流处理器、负责AI计算的Tensor Core与负责光追的RT Core都升级至新一代。SM多单元流处理器方面,最大的更新是 Shader 执行重排列 技术(Shader Execution Reordering)。
老黄讲到,光追吃性能的主要原因是GPU内部高度并行化、擅长做大量重复性高的工作。而光追场合下光线不断反射与全场景内不同材质交互并不能发挥 GPU 优势。
这项技术负责动态调度工作负载、合理安排计算资源,能给光追带来2-3倍性能提升,光追之外的综合游戏性能也提升25%左右。这是与CPU乱序执行同等重要的计算革新。
张量核心Tensor Core,用了数据中心GPU H100的同款,新增FP8精度数据格式支持,吞吐量增加5倍。
光线追踪核心 RT Core 方面,ray-triangle 交叉吞吐量提高两倍以上,还新增了 Opacity Micromap 引擎专攻树叶、粒子和栅栏这种光线通过缝隙的场景。
总的看下来,新显卡架构主要性能提升都是围绕光追,还有那么多不支持光追的老游戏怎么办?为解决这个问题,英伟达推出游戏 MOD 开发工具 RTX Remix。
一边玩游戏一边打开它,就能直接从 GPU 渲染指令里拦截游戏的图形资产,包括几何建模、材质、灯光、摄像机位置等。
在 AI 辅助下给这些资产增加细节、超分辨率、增加物理性质、添加光追和DLSS支持都不在话下。还能一键打包成MOD发布,让老游戏也能焕发第二春,比如让 20 年前的《上古卷轴?晨风》画质超过最新的《上古卷轴 天际》。
相较于RTX30系列,40系列显卡的性能增强够有诚意了,那么价格如何呢?直接来看黄老板给出的价格:
RTX 4090 定价 1599美元
RTX 4080(16GB)定价1199美元
RTX 4080(12GB)定价899美元。
在国内,目前给出的售价是:
RTX 4090 12999 元起
RTX 4080(16GB)9499 元
RTX 4080(12GB)7199 元。
为了方便比较,也顺便把之前国内RTX30系列的官方售价摆上来:
RTX 3090 11999元
RTX 3080 5499元
RTX 3070 3799元
从给出的定价来看,90系列的变化幅度并不是很大,国内售价在原来的基础上涨了一点,算得上是 高性价比 (但这价格依旧是普通网友可望不可及)。
对比之下,80系列新蓝狮在线出的两款显卡涨价就比较明显,RTX 4080(16GB)相较于 3080 涨价近 50%,被外界认为是对标 RTX 3070 的 RTX 4080(12GB)也涨了近 50%。网友直呼:这根本没想让我们买40啊。
不过游戏发烧友们也可以再等等。在得知英伟达要发布 40 系列显卡后,AMD 也坐不住了,后脚就透露消息称:11 月 3 日会发布 RX 7000 系列显卡。并且还放出了一张性能对比图,称其性价比高,能效好。
值得一提的是,虽然这次RTX40系列相较于30系列性能翻倍,但功耗方面却没有很大的涨幅。RTX 4090功耗正如之前传言一样为450W与3090Ti持平,RTX 4080(16GB)为 340W,RTX 4080(12GB)为285W。
对于 RTX4090,英伟达建议使用 850W 的电源,12GB 的 RTX 4080 需要 700W 的电源,16GB 需要 750W 的电源。不仅如此,英伟达此次还升级了散热系统,进一步优化了双轴流通系统,将风扇尺寸和翅片体积增加了10% ,并升级为 23 相电源。
除此之外,大家的AI导师李沐也第一时间给出了自己的看法。4090相比3090Ti,AI训练来说重要的参数都没增强,增强多卡并行的NVlink还给砍了,不如再等等 4090Ti。
这次的40系新卡,你冲吗?