Nvidia GeForce RTX 4090 创始人版评测

Nvidia GeForce RTX 4090 创始人版评测

5
Play game
游戏介绍:
Nvidia GeForce RTX 4090 创始人版评测
Nvidia GeForce RTX 4090 创始人版评测

自从我开始对显卡进行评测以来,已经有很长一段时间了,全球供应链问题、半导体短缺和加密货币的繁荣使得这一切变得无关紧要,因为大多数人找不到一个,甚至买不起一个。如果他们这样做了。但 Nvidia 的新一代强大产品 GeForce RTX 4090 出现时,这些问题已基本被我们抛在了身后,我们可以重新惊叹于高端的高得离谱的帧速率,但价格却并非离谱。感觉很好!上周我对 RTX 4090 Founders Edition 进行了测试,测试了综合基准测试和现实游戏中的性能。它是一个大家伙,而且它的价格标签更高——具体来说是 1,599 美元——但当我们谈论一款能够在一帧上以 4K 格式(带有光线追踪)运行《赛博朋克 2077》(Cyber??punk 2077)之类的游戏硬件时的速率实际上可以利用 144Hz 显示器,很难说它不值得每一分钱。

Nvidia GeForce RTX 4090 – 设计和功能

首先,我们必须解决房间里的大象——即 RTX 4090 本身。这是一款巨大的显卡,与之前同样巨大的 3090 Ti 尺寸大致相同。它是一个三插槽显卡,重量仅超过五磅半。但它又大又漂亮,采用与两年前在 Nvidia 30 系列卡上首次亮相的相同的银黑配色方案。

Nvidia 的工程师提交了一份令人印象深刻的规格表,即使与仍然很棒的 RTX 3090 Ti 进行比较也是如此。它具有 16,384 个 CUDA 核心,高于 RTX 3090 Ti 的 10,752 个。它的基本时钟频率为 2.23GHz,可提升至 2.52Ghz,并配备 24GB GDDR6 VRAM,使其能够实现 83 万亿次着色器万亿次浮点运算,而 3090 Ti 为 40 次; Tensor teraflops 从 320 增加到 1,321;光线追踪每秒 191 万亿次浮点运算,高于 78 次。

这些都是巨大的跳跃。然而,正如我们之前多次看到的那样,简单地将核心或着色器数量加倍并不意味着您会在游戏中看到双倍的性能。不过,在这种情况下,Nvidia 已经取得了一些实质性成果,而且我在大多数测试中看到的改进绝对不仅仅是增量升级。这是真正的代际飞跃。

显然,这是一张专为主导 4K 游戏而设计的显卡,但创作者和专业人士应该会在其 24GB GDDR6X 显存中找到很多值得喜爱的地方。即使对于当今要求最苛刻的游戏来说,这也显得有些过分了,但如果您要创建 3D 模型,那么这种能力会在渲染时间上带来好处。在 24GB 时,OctaneRenderer 很少需要占用系统内存,而是利用卡本身更快的帧缓冲区,从而显着提高其渲染速度。同样,在 Blender 中,当渲染在后台完成时,您可以继续在视口中工作。

这些应用程序中的工作也得到了显着改善。得益于 GPU 的 AI 核心,去噪渲染速度要快得多。但是,如果您是使用 Unity、Unreal Engine 或 Nvidia Omniverse 工作的游戏开发人员,最令人印象深刻的改进可能就是对 DLSS 3 的支持。游戏的同样优势也适用于此:实时光线追踪渲染性能成本的一小部分。 Nvidia 声称渲染性能比 RTX 3090 Ti 快四倍。

如果您是专业 3D 艺术家,专用工作站 GPU 仍然是最合适的。就像 RTX 卡针对游戏进行优化一样,Nvidia 的工作站卡也针对专业创作者进行了特定的优化。但这些优化的代价是价格大幅上涨。如果您在一家小公司工作或独自进行在家工作项目,RTX 4090 是一个出色的中间产品,与同等工作站相比,它可以为您节省数千美元。

这一代的另一个重大升级是支持 AV1 编码。 AV1 是一种压缩编解码器,可让您以更少的带宽以更高的质量渲染和流式传输视频。虽然 RTX 30 系列支持 AV1 解码,但编码器支持对于创作过程来说非常重要。它非常高效,因此您可以提高实时流的视频质量,而无需增加带宽。同样,DaVinci Resolves 中的视频渲染时间最多可缩短 50%。

强大的性能带来了强大的热量,但 Nvidia 在其冷却器设计方面也取得了进步。从表面上看,事情看起来基本相同。它采用与我们看到的上一代类似的双轴设计,带有大型重叠散热器。这使得后风扇可以直接吹过,并将热空气向上排出机箱。这一次,Nvidia 选择了更大的流体轴承风扇来增加气流并降低噪音。翅片之间的空间也经过优化,可将气流增加高达 15%。当它在 30 系列上首次亮相时,我们对这种设计印象深刻。那时效果很好,现在也一样。在我们的测试中,4090 的峰值温度为 64.7C,这对于使用 OEM 冷却器的高性能卡来说令人印象深刻。

Nvidia GeForce RTX 4090 – 游戏性能

测试系统:Z390 Asus ROG Maximus XI Extreme 主板、Intel Core i9-9900K CPU(库存)、Corsair H115i PRO RGB 280mm AIO CPU 散热器、32GB Corsair Vengeance RGB Pro DDR4-3200、1TB Samsung EVO Plus NVMe SSD、Corsair HX1200 1200-瓦电源。

从我们的综合基准测试开始,4090 不仅出现了,它还像酷爱人喝着自己的果汁一样冲破了墙壁。在 3DMark Fire Strike Ultra 中,4090 取得了令人瞠目结舌的 21,872 分。从长远来看,它比 RX 6950 XT 的 14,512 分高出约 50%(这是我们迄今为止在室内记录的最好成绩),并且与 Fire Strike Ultra 之前的超频世界纪录持平,不仅如此一个,但同时有两个 GPU。

Unigine Heaven 讲述了同样的故事:4090 的得分远远领先于我们测试过的所有显卡,与 3090 Ti 相比,1080p 时提高了 26%,1440p 时提高了 39%,4K 时提高了 31%。

光线追踪合成材料延续了这一趋势,4090 的分数几乎是 3090 Ti 的一倍,在某些情况下实际上是一倍。这些都是一些令人印象深刻的数字。

继续我们的游戏基准测试,4090 继续占据主导地位。我们的标准四游戏测试套件包括《无主之地 3》、《战争机器:战略版》、《地铁:离去》和《全面战争:三个王国》。所有测试均在可用的最高图形预设下运行,并启用光线追踪和 DLSS(如果可用)。

正如在综合测试中一样,在测试的每个游戏和分辨率中,4090 都明显领先于我们测试过的所有其他显卡。当然,它 应该 。这是新一代产品线中的顶级产品,因此只有 3090 Ti(比 4090 的上一代产品进行了半步升级)才有机会与新卡保持竞争力。

问题是,4090 领先多少?从更广泛的游戏选择(特别是 4K 游戏)来看,4090 比 3090 Ti 拥有更大的优势,从《地铁:离去》的 14% 提升到《古墓丽影:暗影》的 90%。这意味着帧速率约为 100 fps 左右或高于 100 fps - 请记住,这是在 4K、最大设置、光线追踪打开的情况下进行的。同样,这些数字令人印象深刻。

Nvidia GeForce RTX 4090 – DLSS

4090 的成功无疑要归功于 Nvidia 对 DLSS(即深度学习超级采样)的持续改进。这种支持 AI 的技术可以让游戏以较低的分辨率(在本例中为 1440p)渲染,但仍然输出 4K,其视觉质量与原生 4K 几乎没有区别。由于人工智能上采样魔法在幕后发生,DLSS 的早期版本在保真度方面做出了一些牺牲,但该技术现在已经进步到了这样的程度,当你使用 DLSS 时,游戏看起来和你使用 DLSS 时一样好,甚至更好。不是。

最新版本 DLSS 3 是 40 系列卡独有的,但它提供了一个新功能,可以自行生成帧。有一个非常技术性的解释 Nvidia 的网站 如果你有兴趣的话,但简而言之,GPU 会查看两个连续的帧,计算它们之间的差异,然后使用其 AI 功能在它们之间生成一个帧。

与上一代相比,这是一个重大进步,可以彻底改变 fps 性能。 DLSS 2 查看运动矢量数据和单个帧以智能地升级图像并提高性能,而 RTX 4090 的光流加速器则确定运动路径并自行创建新帧,与游戏引擎的本机帧分开。它与 Nvidia Reflex 协同工作,消除了可能使游戏感觉缓慢的任何延迟。 Nvidia 的数据称,DLSS 3 在开启时有可能提供高达 4 倍的 fps。

在测试以 4K 分辨率和最大设置(包括光线追踪)运行的《赛博朋克 2077》时,我发现使用 DLSS 与不使用 DLSS 相比,性能有显着提升,在打开帧生成时更是如此。在禁用 DLSS 的情况下,4090 在游戏中一分钟的基准测试中得分为 41.9 fps。启用 DLSS 但关闭帧生成后,得分跃升至 84 fps。随着帧生成的开启……令人难以置信的 136 fps,同时看起来仍然绝对华丽。

现在,帧生成确实需要进行一些权衡,即由于 GPU 正在生成额外的帧,因此在将这些帧插入流中时会引入一点点延迟。请记住,这些是在游戏引擎外部创建的 GPU 帧。就其本身而言,DLSS 3 看起来可能是 120 fps,但实际感觉却是 60 fps。但不用担心:Nvidia Reflex 可以补偿这种延迟,甚至还可以弥补一些。事实上,在打开帧生成功能玩《赛博朋克》时,我感觉不到增加的延迟。但在其他游戏中情况可能并非如此,而且在每一毫秒都很重要的快速抽动电子竞技游戏中,问题可能更大。尽管如此,以超过 120 的帧速率玩赛博朋克这样对视觉要求很高的游戏(4K、光线追踪)确实令人印象深刻。

另一件需要注意的事情是 Nvidia 为 RTX 4090 建??议的相当严格的系统要求。为了充分发挥 GPU 的潜力,Nvidia 建议您运行最新的处理器和 DDR5 内存。它还需要 DirectX 12、硬件加速 GPU 调度,并且与 v-sync 不兼容(G-Sync 也可以)。正如您从我们的测试平台中可以看出的那样,硬件要求并不是硬性规则,如果您最近没有升级系统,您和我们一样仍然可以受益。

最后一个难题当然是价格。通常,新一代显卡都会推出我所认为的主流显卡的高端产品——就 Nvidia 而言,是上几代的 3080、2080 和 1080。不过,这一次,4090 是第一个到达的,这意味着我只有上一代作为比较点。虽然我们知道 4080 的定价——16GB 版本为 1,199 美元,12GB 版本为 899 美元——但在我们有机会亲自测试之前,不可能知道这些卡的性能如何。

因此,4090 当然会击败一切——它是新一代的发烧友级显卡。但这是否物有所值?这还有待观察。

尽管如此,与你现在可以购买的所有其他产品(包括 3090 Ti)相比,它的数字令人印象深刻,而且该卡今年早些时候才刚刚推出,零售价为 2,000 美元,尽管此后价格已降至最低售价 1,100 美元。我之前说过,在 4K 分辨率下,4090 比 3090 Ti 至少领先 15%,最高领先 90%。考虑到这些数字,与前国王相比,价格溢价 45% 似乎并不算太??糟糕。

判决

RTX 4090 可能体积庞大且价格昂贵,但如果它不能在竞争中脱颖而出,那就太好了。这有点不公平,因为它是目前唯一可用的新一代卡牌,所以我们只有过去几年的卡牌可以与它进行比较。但在该卡的其他产品能够迎头赶上之前,在其令人印象深刻的硬件规格和 DLSS 3 AI 魔法之间,即使是 1,599 美元的价格对于这张卡可以产生的无与伦比的帧速率来说似乎也不是不合理的。

游戏截图:
  • Nvidia GeForce RTX 4090 创始人版评测
标签:

评估:

    留言