随着NVIDIAGeForceRTX显卡的正式上市,定位高端的GeForceRTX也在11月15日迎来解禁。与RTX一样,RTX同样采用AdaLovelace架构和台积电定制的4N工艺,全新核心架构和先进的制程工艺,为GPU的性能表现带来飞跃。
AdaLovelace架构升级
与此同时,AdaLovelace架构带来新的全景光线追踪、着色器执行重排序(SER)和DLSS3三大创新,带来更出色的游戏体验。七彩虹近期送测iGameGeForceRTX16GBVulcanOC显卡。那么GeForceRTX的游戏体验如何?显卡的功耗和温度控制是否达到预期?
NVIDIA在AdaLovelace架构中引入全景光线追踪,通过追踪场景中每个像素的光照信息,实现像素级的阴影、反射和水面折射,提供如照片般逼真的画面细节。同时让画面的表面、纹理拥有基于物理效果的细节,确保光追的效果能够以自然、逼真的方式交互,增强画质和沉浸感。
画质模式下,游戏画面的每个像素会执行约次光线追踪计算;作为对比,首次引入实时光线追踪技术的《战地5》对每个像素执行约39次光线追踪计算,是初代光追的16.2倍。在没有技术革新的情况下,GPU的晶体管数目需要增长16倍才能满足需求;但NVIDIA却再晶体管数量增加约4倍的情况下,带来将近16倍的计算性能。
本次评测的GeForceRTX采用AD核心,从官方提供的核心图来看,AD的核心规模与GA大同小异。架构设计上,AdaLovelace架构依旧是GPC-TPC-“流式多处理器”层级架构,满血版的AD核心依然拥有7个GPC,每个GPC有6个TPC,每个TPC则由2个流式多处理器组成,每个流式多处理器内建个CUDA。
从GPC架构图可以看到,每组GPC包含6组TPC、1个独立光栅引擎、2个ROP分区(每个包含8个ROP单元),每组TPC又包含2组流式多处理器。每个流式多处理器单元4个计算模块,每个模块包含1个RT光追核心、1个TensorCore张量核心以及KBL1数据缓存/共享内存。
第三代RTCore可提供2倍的光线与三角形求交性能,并加入OpacityMicro-Map引擎和DisplacedMicro-Mesh引擎两个全新的硬件单元。OpacityMicro-Map引擎将光线追踪的Alpha-Test几何性能提升2倍;全新的DisplacedMicro-Mesh可提升几何图形的丰富度,并不会占用过多的图形处理性能和存储成本。
第四代Tensor核心新增HopperFP8TransformerEngine,可提供TFLOPS的张量处理性能,大幅提升深度学习性能。在第四代Tensor核心、着色器执行重排序(SER)和OpticalFlowAccelerator光流加速器的加持下,带来新一代DLSS3技术,拥有全新的帧生成技术、DLSS2超分辨率技术和NVIDIAReflex技术,可全方位提升游戏流畅度、延迟以及画质。
AdaLovelace架构支持NVIDIA第八代编码器(NVENC),开始支持AV1编码。与H.格式视频相比,AV1编码效率高40%,意味着存储、传输同质量视频时可以节省约30的数据量,而且AV1是免费、开放的协议,也能让厂商节省费用。目前支持AV1编码的软件有“剪映专业版”、DaVinciResolve18以及AdobePremierePro等。
得益于台积电定制4N工艺,让AdaLovelace的能耗比、晶体管数量、核心面积和晶体管密度得到质的飞跃。AD内建亿个晶体管,核心面积仅有.6mm2,密度达到1.亿/平方毫米。不仅如此,4N工艺在相同工号下,GPU核心频率也有超过50%的提升。
iGameGeForceRTX16GBVulcanOC解析
除了NVIDIA提供的公版外,国内玩家也可以选择由AIC提供的非公版本。iGameGeForceRTX16GBVulcanOC是高端产品的代表之一。iGameGeForceRTXVulcanOC灵感来源于「后·赛博时代」的地底世界,将线条、三角构造、金属框架等元素进行融合,带来全新的视觉体验。
iGameGeForceRTXVulcanOC配备了三把mm的大口径风扇,独特的「聚风镰环」扇叶能够使空气形成漩涡聚风吸入,有效提升风压、增加进风量。扇叶采用超长寿命的双滚珠轴承,拥有柔滑顺畅、结实耐用等特点。
iGameGeForceRTXVulcanOC显卡背部配备了金属背板,背板尾部进行镂空处理,进一步提升显卡的空气交换速度,快速将核心热量散出。
输出接口提供3个DisplayPort1.4a和1个HDMI2.1接口,均可实现最高4KHz的画面输出。作为iGame系列的标配,显卡依旧配备了一键超频的按钮,按下后自动切换到高性能模式。
iGameGeForceRTXVulcanOC采用全新的12VHPW供电接口,一条12VHPW电源线能满足显卡的供电需求。为了照顾使用ATX2.0标准电源的玩家,包装盒内附赠了12VHPWR转4*8Pin延长线。
iGameGeForceRTXVulcanOC除了配备有4*8Pin转12VHWRP的供电线外,包装海附赠了手套、螺丝刀、显卡支架等配件。其中最值得
iGameGeForceRTXVulcanOC在显卡侧面配备磁吸式的触点,玩家通过触点来连接显卡「智屏」或者灯光组件。「智屏」支持横式和竖式两种角度摆放,万家无论是将显卡直接安装在主板上、还是竖插显卡,都能看到屏幕显示的内容。另外,显卡还配备一个「智屏」底座,玩家也可将「智屏」通过USB接口,放置到桌面上。
iGameGeForceRTXVulcanOC拆解
iGameGeForceRTXVulcanOC的PCB保持较小尺寸,对PCB的考验电气要求极高。
PCB正中就是RTX的AD-核心,周围有8颗显存颗粒围绕,均是美光的GDDR6X显存,型号为美光的D8BZC,单颗2GB容量,32-bit位宽,8颗一共组成16GB-bit显存,带宽位GB/s。
显存左右两侧设计对称的核心供电,两边均为11相供电,带来踪迹22相的核心供电。显存供电为4相。设置在显存4个角上。
散热器部分,iGameGeForceRTXVulcanOC采用七彩虹的旋涡(Vortex)散热装置,导流型鳍片拥有更大的间隙因此更利于风流进入。9根8mm的热管与鳍片减采用回流焊工艺,拥有更紧密的连接特性,配合真空冰片技术的热管拥有超扁平的密闭腔体,大幅提升散热效率。
本次首发评测显卡包括iGameGeForceRTXVulcanOC、七彩虹战斧GeForceRTX豪华版和AMD阵营的RadeonRXXT。操作系统为最新的MicrosoftWindowsH-bit版,系统的电源选项为高性能模式,在BIOS开启XMP,让内存运行在MHz,其他均采用默认设置。
基准性能测试
基准性能测试则是传统的3DMark,测试项目包括FireStrike、FireStrikeExtreme、FireStrikeUltra、TimeSpy、TimeSpyExtreme以及PortRoyal、DLSS七个项目。其中FireStrike、FireStrikeExtreme、FireStrikeUltra三个项目,分别测试显卡在DX11游戏中2K、4K分辨率下的性能;TimeSpy、TimeSpyExtreme两个项目测试显卡在DX12游戏中2K分辨率和4K分辨率的性能;PortRoyal测试显卡实时光线追踪的性能;DLSS则是测试在2K、4K和8K分辨率下,DLSS2、DLSS3对游戏的性能提升。
考虑到P分辨率的瓶颈来自CPU,笔者不再测试P的3DMark跑分。对比RTX和AMDRadeonRXXT显卡。在TimeSpyExtreme的跑分钟,RTX领先RXXT约38%,落后RTX约37%。
光追性能方面,RTX升级到第三代RTCore,光追性能提升巨大。在PortRoyal跑分钟,RTX领先RXXT约70%,落后RTX约43%。
4K分辨率游戏性能测试选择《瘟疫传说·安魂曲》、《赛博朋克》、《暗影火炬城》、《生死轮回》、《毁灭全人类2:重新探测》进行测试。考虑到AMDFSR和光追性能,游戏测试仅对比GeForceRTX和RTX两款显卡。
《瘟疫传说·安魂曲》开启光线追踪,画面效果均设为“高”,DLSS选择“质量”。在游戏测试中,未开启DLSS的平均游戏帧数为59,开启DLSS3之后可以达到,提升幅度达57%。与RTX相比,RTX性能落后约44%,但畅玩4K《瘟疫传说·安魂曲》毫无压力。
《赛博朋克》同样开启光线追踪,画面效果均为最高,DLSS选择质量。在游戏测试中,未开启DLSS的RTX平均游戏帧数为22.55,开启DLSS3之后可以达到35.44,提升幅度达%。与RTX相比,RTX性能落后约38%。
《暗影火炬城》同样开启光线追踪,画面效果均为最高,DLSS选择质量。在游戏测试中,未开启DLSS的RTX平均游戏帧数为77,开启DLSS3之后可以达到,提升幅度达67%。与RTX相比,RTX性能落后约40%。
《生死轮回》同样开启光线追踪,画面效果均为最高,DLSS选择质量。在游戏测试中,未开启DLSS的RTX平均游戏帧数为74,开启DLSS3之后可以达到,提升幅度达64%。与RTX相比,RTX性能落后约42%。
《毁灭全人类2:重新探测》同样开启光线追踪,画面效果均为最高,DLSS选择质量。在游戏测试中,未开启DLSS的RTX平均游戏帧数为88,开启DLSS3之后可以达到,提升幅度达90%。与RTX相比,RTX性能落后约37%。
烤机测试
作为测试的最后项目,使用FurMark进行烤机测试是经典的保留项目。在经过半小时的烤机测试后,显卡的核心温度仅有66.2度,整卡功耗维持在W左右。
评测总结:与定位专业显卡的GeForceRTX不同,RTX是一款面对游戏玩家打造的产品,虽然性能上与RTX存在约40%的差距,但已经能够轻松满足4K分辨率下各种游戏的光追需求,其性能甚至超过上代Ampere的旗舰。
更重要的是,AdaLovelace带来了全景光线追踪的游戏,通过DLSS3技术的加持,可以带来远超想象的画面渲染能力,保证画质的情况下还能兼顾流畅度、低延迟的完美游戏体验。在DLSS3技术的加持下,游戏最大的帧率提升幅度达%,最小也有57%。