等等党的胜利?RTX 4070Ti首发体验:2K游戏帧数翻倍,价格只有4090的一半

老黄掏出6499元的中端显卡“杀手锏”,性能翻倍、功耗暴降。

 |  芯东西

文|芯东西 云鹏

编辑|心缘

芯东西1月4日报道,刚刚英伟达新一代RTX 40系显卡的中高端型号GeForce RTX 4070Ti显卡正式解禁,并将于明天发售,国行起售价为6499元。这也是RTX 40系显卡中目前价格最为“亲民”的一款。

芯东西此次提前拿到了七彩虹RTX 4070Ti战斧豪华版(后文简称RTX 4070Ti)并进行了几天的深度测试体验。先说结论,RTX 4070Ti在DLSS 3的加持下,性能相比RTX 3080Ti最高有着翻倍式的提升,而且平均功耗降低近40%,能效比提升明显。

七彩虹RTX 4070Ti战斧豪华版

此次测试中,RTX 4070Ti对比的对象为发售价8999元的上代RTX 30系显卡RTX 3080Ti。如果RTX 4070Ti能够更胜一筹,那么它在性价比上应该具有不错的竞争力。

在去年10月13日的RTX 40系显卡的发布会上,英伟达曾分别推出了两种规格的RTX 4080显卡,其配置和定价一度引起玩家层的广泛热议。后来英伟达取消了RTX 4080 12GB版本的发布,此次的RTX 4070Ti大概率就是由此调整而来。

相比售价9499元的RTX 4080,RTX 4070Ti的玩家受众群体会更加广泛,并且新一代Ada架构的核心升级、DLSS 3等关键游戏特性以及对于AV1编解码的支持在RTX 4070Ti上均有体现。

这次英伟达给RTX 4070Ti的定位是“120帧流畅游玩2K游戏”,要知道,哪怕是上代卡皇RTX 3090都无法在2K最高画质下“通吃”所有3A大作。如果英伟达所言属实,那么RTX 4070Ti的确可以说在“性价比”上大幅提升了。

接下来,芯东西将带你详细了解RTX 4070Ti的新特性,以及其在游戏、生产力两个核心方面的提升情况。

01 外观延续家族设计,散热规格豪华,Ada架构新特性配齐

由于我手上有一张七彩虹RTX 4090战斧豪华版,因此通过对比可以发现,这次七彩虹RTX 4070Ti战斧豪华版的外观设计基本与RTX 4090老大哥保持一致,红黑撞色外观继续延续,有棱角的切割设计也一直是战斧系列的标志性元素。

战斧系列家族式红黑撞色设计,图中为七彩虹RTX 4090战斧豪华版

此次七彩虹RTX 4070Ti战斧豪华版采用了6根6mm热管设计,散热模具的尺寸上与七彩虹RTX 4090战斧豪华版长度相同,厚度略减,这样的散热模具,也能够充分保证显卡的散热效果。

上:七彩虹RTX 4090战斧豪华版,下:七彩虹RTX 4070Ti战斧豪华版

RTX 4070Ti的电源供电接口采用了单个16pin供电,包装内附赠了16pin转2个8pin的供电转接线。

深入RTX 4070Ti的内部,这次在架构的升级方面,大部分新特性,我们在RTX 4090上就已经看到了,并不陌生了,而且RTX 4070Ti基本上继承了老大哥RTX 4090的全部优势项目。

RTX 4070Ti支持的部分新特性一览

比如我们熟悉的SER着色器执行重排序技术、第三代光追核心、DLSS 3“帧生成”功能以及当下在生产力视频渲染领域大火的AV1编解码支持。

不论是SER还是Ada光流加速器等新技术,如果用比较通俗的话来讲,就是让这些核心在处理跟以前相同的任务时,变得效率更高。同样时间内,“以前搬一块砖,现在能搬三块了”。

根据英伟达官方数据,SER能够让游戏在光线追踪下的性能提升3倍,而Ada光流加速器则可以带来DLSS方面2倍的性能提升。

此外,芯片工艺制程的进步一直是推动芯片能效比提升的核心驱动力之一,这次的RTX 40系列也深受台积电4N英伟达定制工艺优势的赋能。

在核心配置方面,RTX 4070Ti上配备了7680个CUDA核心,相比RTX 4080的9728个,减少幅度约为20%,显存容量为12GB。

02 2K游戏帧数暴涨103%DLSS 3兼顾性能和延迟

近两年来,2K 144Hz显示器出货量大幅上涨,2K分辨率与高帧率兼得成为了许多玩家追求的“优质游戏体验”。因此这张显卡能否以2K最高画质、120FPS流畅游玩各类游戏,是此次体验RTX 4070Ti的过程中我最为关注的一点。

其实目前大部分主流网游对于配置的要求并不高,比如《英雄联盟》和《CS:GO》这样的游戏,RTX 4070Ti都可以轻松跑到2K 240帧以上,而一些稍微吃一点配置的网游,比如《PUBG》和《守望先锋2》,也可以很好的满足2K 144帧的“电竞”体验。

大部分射击类网游,为了流畅度,绝大部分玩家会选择1080P显示器。这次我的目标是要看RTX 4070Ti在2K分辨率下的表现,因此我们的重点就放在了单机大作上面,包括一些刚上市的3A单机游戏。

参与此次测试的游戏

在这些测试中,我们并没有特别关注传统光栅渲染性能,也就是关闭DLSS后的帧数,这里有必要说明一下。

实际上,目前英伟达DLSS技术经过多轮迭代,画质的损失已经基本可以忽略不计,开启DLSS功能基本上已经等于“获得免费性能提升”,而且这种提升往往是翻倍式的,因此普通玩家没有不开启的理由。

最主要的是,得益于英伟达的强大的生态号召力,如今几乎所有新出的主流PC游戏均已支持DLSS技术,尤其是近年来的国产单机游戏,对于DLSS技术的支持都十分积极,比如《暗影火炬城》、《光明记忆》、《生死轮回》等游戏甚至已经支持了最新的DLSS 3。

到今年CES,已经有50款DLSS 3游戏已发布或即将发布,同时有超过250款游戏和创意应用现已支持DLSS,可以说,DLSS生态推进速度十分可观。

DLSS不仅好用,而且是一个绝大部分用户都可以用到,在游戏中真正用起来的功能,而不支持DLSS的游戏,往往本身帧数已经很高了,例如一些电竞网游。

因此我们这次的测试均在开启DLSS的模式下进行,RTX 4070Ti可以开启最新的DLSS 3,而作为对比的RTX 3080Ti则开启DLSS 2,具体DLSS 2的版本根据游戏可能会有所不同。

在测试DLSS游戏前,我还是先跑了一下传统的3DMark测试软件中的Time Spy测试,这个项目测试的是显卡在2K下的传统光栅渲染性能,根据最终成绩,RTX 4070Ti大约领先RTX 3080Ti 13%左右。

3DMark TS测试,左:RTX 4070Ti,右:RTX 3080Ti

回到DLSS游戏表现,最新的DLSS 3是我此次体验的重点,核心就是要看,帧数提升幅度有多少,而画面是否会因为帧是“生成”的而有劣化现象,或者不真实的效果出现。

提到DLSS 3,《赛博朋克2077》基本上属于PC端的“原神”,是每个显卡的传统必测项目,在这个游戏中,RTX 4070Ti的提升幅度超过了62%。

开启DLSS后帧数对比

不过在《赛博朋克2077》之外,最新支持DLSS 3的3A经典大作《巫师3》给了我更多惊喜,在《巫师3》中,RTX 4070Ti相比RTX 3080Ti的帧数领先达到了103%,实现了“翻倍”的提升。

开启DLSS后帧数对比

帧数直接从RTX 3080Ti的60帧“可玩”水平,变成了RTX 4070Ti的123帧“电竞”水平。

在游戏内的流畅度提升感知是非常明显的,这种感觉就像从60Hz的手机换到120Hz手机时带来的流畅度提升。

并且值得注意的是,在仔细对比开启DLSS 3和普通DLSS 2两种模式下画面时,我并没有发现明显不同,或者更准确的说,如果盲测,我是完全分辨不出来两者之间的差别的。

《巫师3》,左:DLSS 3,右:DLSS 2

可以说,DLSS 3在带来大幅帧数提升的基础上,并没有牺牲画质。

DLSS 3功能开启后,系统中我们还可以开启英伟达独有的Reflex延迟优化功能,而DLSS 3与Reflex功能是深度绑定的,在游戏中只要开启DLSS 3,就会自动打开Reflex功能。

在实际游戏过程中,DLSS 3+Reflex模式下,游戏的延迟相比DLSS 2+Reflex模式,仅有小幅增加,在体验端几乎无法感知。

在最新的3A大作《瘟疫传说:安魂曲》中,RTX 4070Ti的提升幅度也来到了59%,提升幅度比较明显。

另外,在《蜘蛛侠:迈尔斯莫拉莱斯》、《生死轮回》、《光明记忆:无限》、《毁灭全人类2》等几款单机游戏中,RTX 4070Ti的帧数提升幅度在35%-40%左右。

均开启DLSS功能

整体来看,RTX 4070Ti基于13%左右的传统光栅渲染性能提升,在DLSS 3的加持下,实现了最高翻倍式的性能提升,可以说,DLSS 3依然是RTX 40系显卡的杀手锏。

并且值得注意的是,这些游戏的实际游戏帧数已经远超了120FPS的标准,甚至多款游戏帧数已经超过了200帧,已经可以完全满足主流2K 144显示器“满帧”运行,甚至可以说是游刃有余。

均开启DLSS 3功能,分辨率为2K,画质设置最高

另外,除了游戏平均帧数的提升,在1%最低帧方面,RTX 4070Ti的提升同样明显,比如在巫师3中,1%最低帧从RTX 3080Ti的41帧直接提升到了81帧,几乎翻倍。

这样的翻倍式1%最低帧提升,在《赛博朋克2077》等游戏中也有所体现。

其实在实际游戏中,1%最低帧是非常影响游戏体验的,偶发性的帧数降低,反映在实际游戏中就是突发的“卡顿”。在这次的实际游戏体验中,最直观的一个感受就是,RTX 4070Ti发生偶发性卡顿的次数要远远少于RTX 3080Ti。

RTX 4070Ti的游戏流畅度体验要明显优于RTX 3080Ti,提升还是比较明显的,这种平均帧与1%最低帧的同步大幅提升,可以真正给游戏体验带来“质变”,这一点是RTX 4070Ti在游戏方面最有价值的提升之一。

03 视频渲染效率翻倍,支持最新AV1编解码

聊完了核心的游戏场景,生产力场景也是不能少的,RTX 4070Ti的12GB大显存,对于视频渲染等场景来说也是非常关键的。

这次在RTX 40系显卡上,英伟达也加入了最新的AV1编解码支持,简单理解,AV1编解码已经逐渐应用于各大主流视频平台,最直观的效果就是用更少的数据量传输更高质量的视频,因此支持这一技术的意义不言而喻。

我也重点测试了AV1和H.265两种编解码的视频导出渲染。在实际测试中,同样导出一段大小12GB、时长2分钟的4K 30帧视频,在H.265格式下,RTX 4070Ti的用时为16秒,而RTX 3080Ti用时则为34秒,提升幅度达到一倍以上。

而同样一段视频,RTX 4070Ti在AV1格式下的导出时间仅为15秒,速度同样很快。

达芬奇视频AV1编解码导出渲染测试

可以说,针对核心的生产力场景,RTX 4070Ti的发挥空间很大,尤其是在视频渲染等场景中,对于效率的提升是非常明显的。

04 能效比成“杀手锏”,功耗温度控制亮眼

整体看下来,RTX 4070Ti在游戏和生产力场景中的表现都令人惊喜,不过如今谈及芯片,大家最关心的三个字莫过于“能效比”,只要功耗高,性能再强都会显得“黯然失色”。

RTX 4070Ti这次着实没有令人失望。在游戏实际测试中,RTX 4070Ti的平均功耗仅有200W左右,甚至没有一款游戏会达到250W功耗。但相比之下,跑同样的几款游戏,RTX 3080Ti的平均功耗却在324W左右。

游戏功耗表现,单位:瓦

也就是说,在性能提升一半以上的同时,RTX 4070Ti的功耗还平均下降了40%左右,能效比提升十分明显。

相比功耗上的优势,在温度表现上,RTX 4070Ti并没有明显领先,两张显卡的温度可以说是“不分伯仲”,在多款游戏中都出现“打平”现象,当然,两款显卡在2K分辨率压力下,温度几乎都在65度以内,温度控制都比较优秀。

游戏温度表现,单位:摄氏度

05 结语:英伟达用AI让“2K电竞”游戏体验普及化

综合看下来,RTX 4070Ti在相比RTX 3080Ti性能大幅提升基础上,价格却下降了近30%,能效比更为出色,同时对最新Ada架构的众多新特性都予以支持,可以说,这款中高端显卡,已经实现了绝大部分游戏的“2K电竞级”体验。

在这样的游戏体验背后,基于AI的DLSS 3功能是关键技术,AI的融入,让游戏显卡开始有能力主动“生成”游戏画面帧,仿佛让显卡拥有了“思考”的能力,这一点难能可贵,也不由得令我们感叹AI技术对各领域赋能的潜力之高。

正式发售之后,RTX 4070Ti大概率会成为中高端消费级显卡市场中的一匹黑马,其出色的性价比也会使其承接不少中高端用户的换机需求。不过,能否保证“原价”显卡的充足供货,或许会成为对英伟达和各家AIC厂商的一大考验。