在看过NVIDIAGeForce RTX 5090 显卡效能表现以及AIC版卡厂推出的OC超频版本效能表现后,接着陈拔测试了这次RTX50 系列显示卡在4K解析度等级中的主流款式:售价订在3万5990元起的RTX5080 显示卡,在惊人的RTX5090 显示卡后,RTX5080 这次算是在一般消费者比较容易接受的价格带中,提供4K解析度等级的游戏效能表现以及AI运算能效。当然在NVIDIA官方的介绍中,RTX5080 可以提供RTX4080 两倍的效能,并且加入了新的具备DLSS4 画质提升技术的NeuralRendering 设计,另外在AI算力以及光线追踪渲染效能部分有所提升,加上更新到GDDR7显示记忆体所带来的记忆体频宽,在整体规格上都比起RTX4080 有着相当显着的提升。(点击可看大图) 在4K解析度设定的游戏与应用程式效能表现部分,跟RTX4080 相比RTX5080 最高也有接近2倍的效能提升表现,不过这毕竟就是简报内容,真正的比较接下来就来看陈拔的开箱实测报告!同样的因为这次篇幅较长,陈拔在这边也提供了文章段落索引来方便大家阅读:
开箱与外观设计
硬体规格与测试平台
3DMark效能测试
4K解析度游戏效能测试
光线追踪效能测试
DLSS效能测试
内容创作效能测试
AI应用效能测试
温度与功耗纪录
测试总结
NVIDIAGeForce RTX 5080 创始版显示卡开箱与外观设计
首先先来看NVIDIAGeForce RTX 5080 创始版显示卡的开箱与外观设计,基本上NVIDIAGeForce RTX 5080 创始版显示卡这部分就跟RTX5090 创始版显示卡一样,仅在外观涂装颜色跟型号涂装/蚀刻文字上有所不同,这部分若没有仔细看还真的容易搞混。这次NVIDIAGeForce RTX 5080 创始版显示卡的盒装外箱,包装方式是跟RTX5090 创始版显示卡是一样的。开启方式则是在角落的部分撕开固定纸胶带后就能开启外箱。撕开后一样有『Inspiredby Gamers. Enhanced by AI. Built by NVIDIA.』的字样。开启外箱后跟RTX5090 创始版显示卡是一样的配置,内层采用纸板结构来保护显示卡。NVIDIAGeForce RTX 5080创始版显示卡的内层包装,上方还有包装内容物的小图示。显示卡下方一样有配件盒的设置。配件和部分包括快速使用指南以及显示卡电源线转接线。由于电源需求规格降低至360W,所以在随附的电源转接线部分也改为一转三的配置。NVIDIAGeForce RTX 5080创始版显示卡的内部缓衝设计,一样透过厚纸板纸材多层结合来包覆,抽出上下两侧的固定板后就可以开启缓衝设计。包装内的NVIDIAGeForce RTX 5080 创始版显示卡本体。NVIDIAGeForce 5080 创始版显示卡本体的设计,基本上跟RTX5090 创始版显示卡在外观上是完全相同的,采用304mm x 137 mm 的显示卡尺寸设计,卡身厚度一样是2Slot 双插槽厚度,加上同面双风扇的Doubleflow through 双风流通过设计,基本上除了卡身上方的型号标示跟蚀刻字样以外,都是相同的,当然NVIDIA也透过涂装颜色的差异来做出更明显的识别,RTX5090 创始版显示卡的颜色较深、RTX5080 创始版显示卡的颜色较浅一点。跟RTX5090 创始版显示卡(左)比较一下,可以看到右边的RTX5080 创始版的卡身颜色比较偏金色一点。叠叠乐来比较一下(抖),可以看到两张显示卡的外型尺寸跟设计是相同的。NVIDIAGeForce RTX 5080 创始版显示卡的正面部分,同样采用同面双风扇的Doubleflow through 双风流通过设计,将主要的PCB板集中在显示卡中央,在IO视讯输出埠以及PCIe插槽接点的部分均采用软排线的延伸设计,所以可以看到在两端的风扇内侧都有相当大面积的鏤空开口,让散热气流加速通过,这个设计在RTX5090 创始版显示卡上已经证明有足够的散热能力,但是相对的在机壳内的散热气流部分就要安排得更为流畅。靠近IO视讯连接埠的前端风扇部分,可以看到风扇内侧的鳍片与热导管配置。尾端风扇的内侧也一样有大面积的气流通过开口,此外也可看到内侧的散热鳍片与热导管设计。风扇部分采用同样七片扇叶的风扇设计,在边缘则是具备风扇环设计来集中散热风流。NVIDIAGeForce RTX 5080 创始版显示卡中段的X型结构,这部分一样藏有灯效设计。采用垂直安装的时候,中央的X型白色灯效会设计会亮起。在X型的金属框架上有RTX5080 的蚀刻字样。传统横置安装时的NVIDIAGeForce RTX 5080 创始版显示卡面向机壳外侧的侧面,在中央处同样也具备了两道散热开口以及斜向的PCIeGen 5 电源插座设计。电源插座设计部份的特写。显示卡侧面的GEFORCERTX 字样也具备白色灯效,图为通电开机后灯效亮起的状态。在背板设计部分,则是跟RTX5090 创始板显示卡一样具备大面积的散热鳍片开口,另外在X框架旁还有比较醒目的型号标示。中央的X框架内侧也有白色灯效的设计。传统横置安装时面向主机板的侧面,同样在中央具备两道散热的沟槽开口。尾端部分同样采用封闭设计,并且具备两组提供显示卡固定架安装的螺丝孔。NVIDIAGeForce RTX 5080 创始版显示卡的IO背板配置,同样采用封闭设计,连接埠部分提供三组DisplayPort2.1b(UHBR20)连接埠以及一组HDMI2.1b 连接埠。来跟上一代的RTX4080 Super 创始版显示卡比较。可以看到RTX5080 创始版显示卡在改用新设计后,跟下方的RTX4080 Super 创始板显示卡在厚度上的差异,另外在中央部分的散热结构跟电源插座设计走向也不相同。
NVIDIAGeForce RTX 5080 创始版显示卡硬体规格
同样的先来看一下NVIDIAGeForce RTX 5080 创始版显示卡的硬体规格,规格比较部分除了上一代的RTX4090 Super 外,陈拔也加入了RTX4090 创始版显示卡跟 RTX5090 创始版显示卡,来让大家了解一下规格面上的差距:
RTX 5080
RTX 4080 Super
RTX 5090
RTX 4090
架构
Blackwell
Ada Lovelace
Blackwell
Ada Lovelace
CUDA Core 数
10752
10240
21760
16384
Tensor Core(算力)
第五代 1801 AI TOPS
第四代 836 AI TOPS
第五代 3352 AI TOPS
第四代 1321 AI TOPS
RT Core(算力)
第四代 171 TFLOPS
第三代 121 TFLOPS
第四代 318 TFLOPS
第三代 191 TFLOPS
GPU 基础时脉
2300 MHz
2290 MHz
2010 MHz
2230 MHz
GPU 加速时脉
2620 MHz
2550 MHz
2410 MHz
2520 MHz
显示记忆体容量
16 GB GDDR7
16 GB GDDR6x
32 GB GDDR7
24 GB GDDR6x
记忆体介面
256 bit
256 bit
512 bit
384 bit
记忆体频宽
960 GB/s
736 GB/s
1792 GB/s
1008 GB/s
TGP 功耗
360W
320W
575W
450W
可以看到就CUDA核心数量来说,RTX5080 仅比RTX4080 Super 要多出5%左右,并没有像是RTX5090 从RTX4090 提升32%那样的多,在传统光栅化游戏以及非光线追踪/非AI应用上效能提升幅度应该有限,但是同样的可以看到在AI算力部分,TensorCore 除了代数更换外,整体算力也比RTX4080 Super 提升了2.15倍,甚至比起RTX4090 还要高,另外在光线追踪的RTCore 部分也比起RTX4080 Super 要提升41%,可说在这代的RTX50 系列显示卡中,不开启光线追踪/DLSS功能,感觉就浪费了其提升的效能。接着进入到实测环节,测试平台继续沿用测试NVIDIAGeForce RTX 5090 创始版显示卡的配置,采用AMDRyzen 7 9800X3D 搭配X870E晶片组主机板的组合,以下是测试平台的配置:处理器:AMDRyzen 7 9800X3D 处理器主机板:ROGCROSSHAIR X870E HERO 主机板处理器散热器:CORSAIRiCUE H170i ELITE LCD 420 AIO记忆体:G.SkillTrident Z5 Neo DDR5-6000 CL30 16GB x2系统SSD:三星980Pro PCIe Gen4 NVMe M.2 SSD 1TB电源供应器:CORSAIRHX1500i 1500W作业系统:Windows11 Pro 24H2版(电源部分采用『最佳效能』设定,并且关闭记忆体隔离保护功能,显示卡硬体加速设定为开启)测试平台的配置。另外在测试比较部分,除了前面规格比较时的RTX4080 Super 创始版显示卡、RTX4090 创始版显示卡、RTX5090 创始版显示卡外,陈拔也在同一平台上测试了AMD的相应位阶竞争对手:RadeonRX 7900 XTX 公版显示卡,虽说AMD目前没有在新一代RDNA4 显示晶片上推出高阶产品的计画,但是毕竟目前RadeonRX 7900 XTX 显示卡还在市场上贩售,所以在这边也进行测试列入比较,提供给大家参考。安装好作业系统后,同样先来看NVIDIAGeForce RTX 5080 创始版显示卡在GPU-Z内显示的资讯:同样是尚未显示完整资讯的状态。
NVIDIAGeForce RTX 5080 创始版显示卡传统显示效能测试
首先先来看传统显示效能的部分,这部分陈拔利用GeekBench6 Pro 的GPU效能评估,以及3DMark测试软体进行测试,首先在GeekBench6 Pro 的测试部分,这部分分为使用OpenCL以及Vulkan影像引擎两个测试项目,以下是测试结果:(点击可看大图)
OpenCL
Vulkan
在GeekBench6 Pro GPU 的测试中,NVIDIAGeForce RTX 5080 创始版显示卡在OpenCL的设定中获得了256224的分数,而在Vulkan的设定中,则是得到了269934分的成绩。 跟对照组显示卡比较的结果(点击可看大图),AMDRadeon RX 7900 XTX 在这部分仅支援Vulkan测试项目,所以在OpenCL部分就没有成绩。而NVIDIAGeForce RTX 5080 创始版显示卡在OpenCL部分有,对比RTX4080 Super 创始版显示卡差距在1%内,而比起RTX4090 创始版显示卡有约22.2%左右的落差,而对比RTX5090 创始版显示卡,则是有约33.5%的差距。至于在Vulakn测试项目部分,NVIDIAGeForce RTX 5080 创始版显示卡对比RTX4080 Super 创始版显示卡效能提升36.7%,对比AMDRadeon RX 7900 XTX 显示卡效能领先约2.76%,比起RTX4090 创始版显示卡效能提升约3.68%,而对比RTX5090 创始版显示卡,则是依然有约32.15%的差距。接着在3DMark显示效能测试部分,这部分陈拔利用Speedway、SteelNomad、TimeSpy、TimeSpy Extreme、FireStrike Extreme 以及FireStrike Ultra 等六个项目、进行对DirectX12 Ultimate、DirectX12、DirectX11 等API的显示效能测试,测试结果如下:(点击可看大图)
SpeedWay
SteelNomad
TimeSPY
TimeSPY Extreme
FireStrikeExtreme
FireStrikeUltra
直接用比较图表来看分项的测试数据好了: (点击可看大图)在应用DirectX12 Ultimate API、具备DirectXRaytracing 即时光追全域照明、光线追踪反射、MeshShade 等配置的SpeedWay 测试项目中,NVIDIAGeForce RTX 5080 创始版显示卡的得分为8845,对比RTX4080 Super 创始版显示卡效能提升18.6%,对比AMDRadeon RX 7900 XTX 显示卡效能领先约49.66%,比起RTX4090 创始版显示卡效能差距约8.4%,而对比RTX5090 创始版显示卡,则是有约39.27%的差距。 (点击可看大图)在非光线追踪的效能部分,则是以使用DirectX12/VulkanAPI 的SteelNomad 项目进行测试,在这项目中NVIDIAGeForce RTX 5080 创始版显示卡的得分为8013,对比RTX4080 Super 创始版显示卡效能提升21.24%,对比AMDRadeon RX 7900 XTX 显示卡效能领先约23.6%,比起RTX4090 创始版显示卡效能差距约8.6%,而对比RTX5090 创始版显示卡,则是有约64.2%的差距。 (点击可看大图)接着来看比较不那么新、针对DirectX12 API、1440p解析度的TimeSPY 测试项目,在这部分NVIDIAGeForce RTX 5080 创始版显示卡在显示部分的得分为31908,对比RTX4080 Super 创始版显示卡效能提升13.58%,对比AMDRadeon RX 7900 XTX 显示卡效能领先约12.36%,比起RTX4090 创始版显示卡效能差距约3.7%,而对比RTX5090 创始版显示卡,则是有约34.7%的差距。 (点击可看大图)而在将测试解析度提升到4K后的TimeSPY Extreme 测试项目部分,NVIDIAGeForce RTX 5080 创始版显示卡在显示部分的得分为15954,对比RTX4080 Super 创始版显示卡效能提升15.08%,对比AMDRadeon RX 7900 XTX 显示卡效能领先约12.33%,比起RTX4090 创始版显示卡效能差距约11.6%,而对比RTX5090 创始版显示卡,则是有约37.7%的差距。 (点击可看大图)而在使用DirectX11 API,解析度设定为1440p的FireStrike Extreme 测试项目中,NVIDIAGeForce RTX 5080 创始版显示卡在显示部分的得分为41284,对比RTX4080 Super 创始版显示卡效能提升17.29%,对比AMDRadeon RX 7900 XTX 显示卡效能领先约4.39%,比起RTX4090 创始版显示卡效能差距约3.2%,而对比RTX5090 创始版显示卡,则是有约23.7%的差距。 (点击可看大图)接着在提升到4K解析度,使用DirectX11 API 的FireStrike Ultra 测试项目中,NVIDIAGeForce RTX 5080 创始版显示卡在显示部分的得分为21206,对比RTX4080 Super 创始版显示卡效能提升20.96%,对比AMDRadeon RX 7900 XTX 显示卡效能领先约6.32%,比起RTX4090 创始版显示卡效能差距约10.2%,而对比RTX5090 创始版显示卡,则是有约36.7%的差距。在3DMark的测试结果来看,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡效能有13.5%至21%不等的提升幅度,而跟AMDRadeon RX 7900 XTX 显示卡相比,则是在DirectX12/Direct12 Ultimate API 的领先幅度较大,都有约12%的领先差异,而开启光追后领先更加明显,但是在较旧的DirectX11 API 落差就变小了,如果是只是要玩较旧款的DX11游戏的话,老实说 RadeonRX 7900 XTX 显示卡目前的售价还是比较甜一点。至于在跟上位阶的RTX4090 创始版显示卡/RTX5090 创始版显示卡的比较部分,这部分老黄的刀法还是相当厉害,RTX5080 创始版显示卡比起RTX4090 创始版显示卡在这部分仍有最多10%的效能差距,加上8GB显示记忆体容量以及售价上差距,对于消费者来说仍然有拉出差异化(如果还买得到RTX4090 的话),没有以下犯上的空间,而对比RTX5090 创始版显示卡,更是有约23%至64%的落差,毕竟差一倍的价格跟显示记忆体配置就是摆在那里。
NVIDIAGeForce RTX 5080 创始版显示卡4K解析度游戏效能测试
接着来看实际游戏的效能表现部分,陈拔在这部分仍然维持4K解析度测试设定,虽然说价格仅有RTX5090 的一半,但是RTX5080 的定位仍在4K解析度设定下的游戏效能显示,以下就来看看RTX5080 创始版显示卡在这部分的表现仍否让游戏玩家接受,在这部分的测试陈拔仍使用十八款3A大作游戏进行测试,游戏名单包括:《星际大战:亡命之徒》(StarWars Outlaws)、《阿凡达:潘朵拉边境》(Avatar:FrontiersOf Pandora)、《刺客教条:幻象》(Assassin'sCreed Mirage)、《极地战嚎6》(FarCry 6)、《看门狗:自由军团》(WatchDogs:Legion)、《黑神话:悟空》(Blackwith Wukong)、《漫威争锋》(MARVELRIVALS)、《霍格华兹的传承》(HogwartsLegacy)、《闇龙纪元:纱帐守护者》(DragonAge)、《边缘禁地3》(Borderland3)、《电驭叛客2077》(Cyberpunk2077)、《大地长征5》(Dirt5)、《F1@24》、《地平线:期待黎明》(HORIZONZERO DAWN)、《漫威星际异攻队》(Marvel'sGuardians of the Galaxy)、《古墓奇兵:暗影》(Shadowof the Tomb Raider)、《德军总部:血气方刚》(Wolfenstein:Youngblood)、《心灵杀手2》(ALANWAKE II)等,均以最高画面效果与精细度设定进行测试,先不开启光线追踪与DLSS功能,仅就单纯的游戏显示效能进行比较,以下是测试结果: (点击可看大图)NVIDIAGeForce RTX 5080 创始版显示卡在4K解析度下的游戏实际效能表现Part1,因为数据量比较多,所以分为两张图表,下面还有一张: (点击可看大图)NVIDIAGeForce RTX 5080 创始版显示卡在这十八款3A游戏大作、最高画质设定下的平均帧率为113.2fps,比起RTX4080 Super 创始版显示卡效能提升17.3%,对比AMDRadeon RX 7900 XTX 显示卡效能领先约16.38%,比起RTX4090 创始版显示卡效能差距约11.5%,而对比RTX5090 创始版显示卡,则是有约35.5%的差距,可以看到在传统游戏显示的效能表现上,就刚好卡在RTX4080 Super 跟RTX4090 的中间点,真的卡的刚刚好呢(老黄刀法再度发威)。另外可以看到RTX5080 在《星际大战:亡命之徒》(StarWars Outlaws)、《黑神话:悟空》(Blackwith Wukong)、《心灵杀手 2》(ALANWAKE II)这几款比较吃显示资源的游戏部分,在4K解析度、最高画质设定下就没有达到60fps 以上的水准,需将降低画质设定或是开启DLSS来达到流畅的游戏画面,这部分就是跟RTX5090 的差异了。
NVIDIAGeForce RTX 5080 创始版显示卡光线追踪效能测试
接下来看NVIDIAGeForce RTX 5080 创始版显示卡在光线追踪显示效能部分的表现,这次RTX5080 的RTCore 算力由RTX4080 Super 的121TFLOPS 提升到171TFLOPS,提升幅度为41%,加上导入RTXNeural Material 材质以及RTXMega 计算等技术,在光线追踪的fps流畅度有所提升,至于在实际上的效能表现,陈拔首先利用3DMark测试软体里面的PortRoyal 以及DirectXRaytracing 两个测试项目,测试NVIDIAGeForce RTX 5080 创始版显示卡的光线追踪显示效能表现。 首先在3DMarkPort Royal 光线追踪效能测试中,NVIDIAGeForce RTX 5080 创始版显示卡所得到的分数为21953。(点击可看大图) (点击可看大图)而与对照组显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡效能提升20.26%,对比AMDRadeon RX 7900 XTX 显示卡效能领先约38.09%,比起RTX4090 创始版显示卡效能差距约9.6%,对比RTX5090 创始版显示卡,则是有约41.1%的差距。 NVIDIAGeForce RTX 5080 创始版显示卡在3DMarkDirectX Raytracing 光线追踪效能测试的效能表现,所得到的分数为60.46fps,同样的在这部分也有效能偏低的状况,NVIDIA表示目前他们正在与UL合作修正这部分。(点击可看大图) (点击可看大图)与对照组显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡效能落后约30.4%,对比AMDRadeon RX 7900 XTX 显示卡效能领先约24.53%,比起RTX4090 创始版显示卡效能落差约53.2%,对比RTX5090 创始版显示卡,则是有约44.2%的差距。至于在实际发行游戏部分的光线追踪效能表现部分,这部分陈拔透过具备光线追踪功能的游戏,包括《星际大战:亡命之徒》(StarWars Outlaws)、《极地战嚎6》(FarCry 6)、《看门狗:自由军团》(WatchDogs:Legion)、《黑神话:悟空》(Blackwith Wukong)、《漫威争锋》(MARVELRIVALS)、《霍格华兹的传承》(HogwartsLegacy)、《闇龙纪元:纱帐守护者》(DragonAge)、《电驭叛客2077》(Cyberpunk2077)、《大地长征5》(Dirt5)、《F1@24》、《漫威星际异攻队》(Marvel'sGuardians of the Galaxy)、《古墓奇兵:暗影》(Shadowof the Tomb Raider)、《德军总部:血气方刚》(Wolfenstein:Youngblood)、《心灵杀手2》(ALANWAKE II)共十四款游戏进行测试,测试时均将光线追踪设定开到最高、游戏画面设定开至最高、关闭DLSS功能,在4K解析度进行测试,以下是测试结果: (点击可看大图)NVIDIAGeForce RTX 5080 创始版显示卡在4K解析度下、开启最高光线追踪设定的游戏实际效能表现,平均显示帧率为69.09fps,与对照组显示卡相比,比起RTX4080 Super 创始版显示卡效能提升约10.8%,对比AMDRadeon RX 7900 XTX 显示卡(排除不能开启光追的《德军总部:血气方刚》(Wolfenstein:Youngblood)游戏)效能领先约72.02%,比起RTX4090 创始版显示卡效能落差约20.4%,对比RTX5090 创始版显示卡,则是有约42.15%的差距。至于在个别游戏部分,除了《心灵杀手 2》(ALANWAKE II)、《星际大战:亡命之徒》(StarWars Outlaws)、《黑神话:悟空》(Blackwith Wukong)、《电驭叛客2077》(Cyberpunk2077)这四款游戏在开启最高光线追踪设定时,会掉到20fps以下,需要降低画质设定或是开启DLSS外,其余的游戏都有55fps以上的水准,基本上要用RTX5080 来玩4K高画质/高光线追踪设定的游戏,基本上是符合一般人的水准的。
NVIDIAGeForce RTX 5080 创始版显示卡DLSS效能测试
既然在RTX5080 上面有比较多开启DLSS的机会,所以接下来陈拔就来进行这部分的测试,首先同样利用NVIDIA提供、支援DLSS4、DLAA设定的3DMarkDLSS Beta 测试项目进行测试,测试时均采用DLSS4 设定、4K解析度、『品质』设定取向,并且开启DLSSFRAME GENERATION 帧间生成补帧功能,在RTX5080 创始版显示卡上再加测4X的测试设定,以下是测试结果: (点击可看大图)在帧间生成功能设定为2X的状况下,NVIDIAGeForce RTX 5080 创始版显示卡在DLSS4 开启前的4K显示效能测试结果为48.26fps,开启DLSS4 后的测试结果为136.54fps,效能提升约2.8倍。 (点击可看大图)可以看到在开启前后,NVIDIAGeForce RTX 5080 创始版显示卡都比起RTX4080 Super 创始版显示卡都有约19%的效能提升,而跟RTX4090 创始版显示卡相比,虽然在DLSS关闭时有约13.6%的差距,但是在开启DLSS4 后,差距缩小至3.1%左右,而与RTX5090 创始版显示卡相比,DLSS开启前后则是有约37%至42.2%不等的效能差异。 (点击可看大图)而在开启MultiFrame Generation 技术,将帧间生成提升到4倍后,NVIDIAGeForce RTX 5080 创始版显示卡的平均显示器帧率可以来到234.85fps,效能提升约4.86X,也超越了RTX4090 创始版显示卡在2倍帧间生成设定下的140.88fps,虽然没有到2倍那么多,但是也有1.66倍的效能领先。至于比起RTX5090 创始版显示卡的372.75fps,仍然有约37%的效能差距。至于在支援DLSS功能的真实游戏效能表现上,陈拔则是利用支援DLSS的十三款游戏,包括《星际大战:亡命之徒》(StarWars Outlaws)、《阿凡达:潘朵拉边境》(Avatar:FrontiersOf Pandora)、《刺客教条:幻象》(Assassin'sCreed Mirage)、《黑神话:悟空》(Blackwith Wukong)、《漫威争锋》(MARVELRIVALS)、《霍格华兹的传承》(HogwartsLegacy)、《闇龙纪元:纱帐守护者》(DragonAge)、《电驭叛客2077》(Cyberpunk2077)、《F1@24》、《地平线:期待黎明》(HORIZONZERO DAWN)、《漫威星际异攻队》(Marvel'sGuardians of the Galaxy)、《古墓奇兵:暗影》(Shadowof the Tomb Raider)、《心灵杀手2》(ALANWAKE II)等,在 4K解析度、最高画质、若有光线追踪则开启的设定下进行测试、DLSS设定均为『品质』取向,另外在AMDRadeon RX 7900 XTX 显示卡部分,则是开启自家的FSR画质提升技术,同样是设定在『品质』取向,先是在未开启帧间生成,仅有SR画质提升技术时的测试结果: (点击可看大图)在测试的游戏中,《古墓奇兵:暗影》(Shadowof the Tomb Raider)因不支援FSR,所以AMDRadeon RX 7900 XTX 显示卡的分数为零,陈拔在比较时会不计入计算。而NVIDIAGeForce RTX 5080 创始版显示卡在4K解析度下,仅开启DLSS中的SR解析度提升技术、品质取向设定时的游戏实际效能表现平均帧率为97.65fps,比起RTX4080 Super 创始版显示卡的87.36fps要提升约6.25%左右的效能,比起RTX4090 创始版显示卡有约18.2%的效能差距,比起RTX5090 创始版显示卡有约37.8%的效能落差。而排除掉《古墓奇兵:暗影》(Shadowof the Tomb Raider)这款不支援FSR的游戏后,与AMDRadeon RX 7900 XTX 公版显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡则是有约51.3%的效能领先,主要是在开启光线追踪后AMDRadeon RX 7900 XTX 公版显示卡的效能减损较多,在开启FSR品质设定后的提升幅度也有限的缘故。在单项游戏部分,在《星际大战:亡命之徒》(StarWars Outlaws)、《黑神话:悟空》(Blackwith Wukong)、《电驭叛客2077》(Cyberpunk2077)这三款游戏的游戏显示帧率仍然在30fps 的水准,需要再进一步的开启FG帧间生成功能,而且在《心灵杀手 2》(ALANWAKE II)这款游戏中有效能偏低的状况,反覆测试后仍然是这个情形,这部分就看之后驅动程式调整会不会修正回来了。接着导入DLSS3.5 架构中的2X帧间生成以及RG光线重建技术进行测试,这部分则是透过支援帧间生成光线重建技术的八款游戏进行,包括《星际大战:亡命之徒》(StarWars Outlaws)、《黑神话:悟空》(Blackwith Wukong)、《漫威争锋》(MARVELRIVALS)、《霍格华兹的传承》(HogwartsLegacy)、《闇龙纪元:纱帐守护者》(DragonAge)、《电驭叛客2077》(Cyberpunk2077)、《F1@24》、《心灵杀手2》(ALANWAKE II)等,测试时也均采用『品质』设定取向,并且开启最高画质设定以及光线追踪功能,AMDRadeon RX 7900 XTX 公版显示卡则是也开启FSR的帧间生成进行测试,以下是测试结果: (点击可看大图)在测试的游戏中,《漫威争锋》(MARVELRIVALS)、《霍格华兹的传承》(HogwartsLegacy)、《闇龙纪元:纱帐守护者》(DragonAge)、《心灵杀手2》(ALANWAKE II)这四款游戏不支援FSR的帧间生成功能,同样的在比较的时候将以不计入这四项游戏的成绩进行比较。NVIDIAGeForce RTX 5080 创始版显示卡在4K解析度下,加入DLSS3.5 的2X帧间生成技术、品质取向设定时的游戏实际效能表现,平均帧率为103.44fps,比起RTX4080 Super 创始版显示卡的87.25fps要提升约18%左右的效能,比起RTX4090 创始版显示卡有约12.4%的效能差距,比起RTX5090 创始版显示卡有约37.4%的效能落差。而排除掉《漫威争锋》(MARVELRIVALS)、《霍格华兹的传承》(HogwartsLegacy)、《闇龙纪元:纱帐守护者》(DragonAge)、《心灵杀手2》(ALANWAKE II)这四款游戏不支援FSR的帧间生成功能的游戏后,与AMDRadeon RX 7900 XTX 公版显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡则是有约82.3%的效能领先,同样的是因为光线追踪效能差异所产生的差距导致。至于在单项游戏表现的部分,可以看到NVIDIAGeForce RTX 5080 创始版显示卡在开启2X帧间生成功能后,所有游戏都可以达到60fps以上的显示性能表现,而在《心灵杀手 2》(ALANWAKE II)的游戏表现也回复正常水准。最后来看这次RTX50 系列显示卡所导入的DLSS4 Multi Frame Generation 4X 帧间生成性能部分,这部分利用《星际大战:亡命之徒》(StarWars Outlaws)、《漫威争锋》(MARVELRIVALS)、《霍格华兹的传承》(HogwartsLegacy)、《闇龙纪元:纱帐守护者》(DragonAge)、《电驭叛客2077》(Cyberpunk2077)、《心灵杀手2》(ALANWAKE II)等六款游戏具备测试版本可进行测试,以下是测试结果: (点击可看大图)NVIDIAGeForce RTX 5080 创始版显示卡在4K解析度下,加入DLSS4 的4X帧间生成技术、在最高画质设定、开启光线追踪、光线重建功能,以『品质』取向设定时的游戏效能测试结果,平均游戏显示效能为184.85fps,虽然说比起RTX5090 创始版显示卡仍有36.7%左右的效能差距,但是可以看到包括测试的游戏包括《星际大战:亡命之徒》(StarWars Outlaws)、《电驭叛客2077》(Cyberpunk2077)、《心灵杀手2》(ALANWAKE II)等这三款重度3A游戏都有100fps 以上的显示效能表现,而跟RTX4090 创始版显示卡在这六款游戏中2X帧间生成设定的115.195fps平均帧率相比,NVIDIAGeForce RTX 5080 创始版显示卡也有60%的效能提升表现,这部分跟3DMarkDLSS 测试项目的表现差不多。
NVIDIAGeForce RTX 5080 创始版显示卡内容创作效能测试
看完了游戏相关的表现,接着来看NVIDIAGeForce RTX 5080 创始版显示卡在内容创作部分的效能表现,基本上NVIDIAGeForce RTX 5080 创始版显示卡这部分跟RTX5090 相比也有缩减,虽说NVENC编码器/解码器仍维持第9代/第6代的配置,但是编码器的数量由RTX5090 的3组缩减成2组,加上显示记忆体大小以及频宽的缩减,以及CUDA核心数量的差异,在影片编码/内容渲染的部分效能还是会比RTX5090 差一截(老黄刀法名不虚传,想要最高内容编辑效能还是请选RTX5090),但究竟会差多少?陈拔也进行了这部分的测试:在内容创作这部分的效能测试,陈拔则是利用测试软体搭配AdobePremiere Pro、V-Ray、Blender等软体进行效能测试,首先来看利用ULProcyon 的VideoEditing BenchMark 测试项目,针对AdobePremiere Pro 进行影片编辑效能测试的结果: NVIDIAGeForce RTX 5080 创始版显示卡在ULProcyon 测试软体中对AdobePremiere Pro 进行影片编辑效能测试,在开启GPU加速的设定下,所得到的成绩为69722分。(点击可看大图) (点击可看大图)跟对照组显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡有约26.22%左右的效能提升,比起AMDRadeon RX 7900 XTX 公版显示卡约有21.42%的效能领先,比起RTX4090 创始版显示卡也有约27.95%的效能提升,比起RTX5090 创始版显示卡有约12%的效能落差。 进入分项测试结果来看,可以看到NVIDIAGeForce RTX 5080 创始版显示卡主要在1080p解析度H.264节省较多的输出时间,跟RTX4080 Super 创始版显示卡相比可以缩减25%至30%左右,而在4KH.265 的部分则是要缩短12%至16%的运算时间。(点击可看大图)至于在影像渲染效能部分,陈拔则是利用V-Ray以及Blender的测试套件对NVIDIAGeForce RTX 5080 创始版显示卡进行测试,首先是在V-Ray6 的部分,以下是测试结果:
V-RayGPU Cuda
V-RayGPU RTX
NVIDIAGeForce RTX 5080 创始版显示卡在V-Ray6 影像渲染的测试结果,在CUDA测试项目得到的分数为2446vpaths、在RTX的测试项目得到的分数为9248vpaths。(点击可看大图) (点击可看大图)在与对照组显示卡的比较部分,因为AMDRadeon RX 7900 XTX 公版显示卡不支援这个测试项目所以没有列入,NVIDIAGeForce RTX 5080 创始版显示卡在RTX的部分,比起RTX4080 Super 创始版显示卡有约22.47%左右的效能提升,比起RTX4090 创始版显示卡有约15.2%的效能落差,比起RTX5090 创始版显示卡有约38.7%的效能差距。至于在CUDA测试项目的部分则是跟RTX5090 创始版显示卡测试的结果类似,比起RTX40 系列的效能表现都差上一截。 至于在另外一套3D建模软体Blender的部分,NVIDIAGeForce RTX 5080 创始版显示卡在测试套件中得到的成绩为:在Monster测试项目获得了4421.834194Samples/分,在Junkshop项目获得了2301.908460Samples/分,在Classroom项目获得了2235.083267Samples/分的成绩。(点击可看大图) (点击可看大图)跟对照组显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡平均有约6.59%左右的效能提升,比起AMDRadeon RX 7900 XTX 公版显示卡约有2.16倍的效能领先,比起 RTX4090 创始版显示卡有约18%的效能落差,比起RTX5090 创始版显示卡有约40.5%的效能差距。可以说在影片编辑的部分,虽然NVIDIAGeForce RTX 5080 创始版显示卡在NVENC编码器仅有两组配置,但是跟同样是两组配置的RTX4090 创始版显示卡相比,因为更新到第九代编码器,所以效能部分也有明显的提升。至于在渲染效能部分,就跟游戏一样介于RTX4080 Super 与RTX4090 间。
NVIDIAGeForce RTX 5080 创始版显示卡AI效能测试
接着来看NVIDIAGeForce RTX 5080 创始版显示卡在AI应用部分的效能测试,虽说NVIDIA将RTX5080 的显示记忆体维持在16GB的等级,记忆体介面也维持在256bit,但是透过比较高速的GDDR7配置,在整体显示记忆体的频宽上也有30%的提升幅度,对于AI应用的效能表现来说应该也有所助益,加上这次更新到第五代的TensorCore,在整体AI算力上比起RTX4080 Super 提升为2.15倍,而实际呈现出的效能表现如何?以下是陈拔利用系统化的GeekBenchAI 以及ULProcyon 测试软体中的AI测试项目进行测试的结果: 首先利用GeekBenchAI 的测试结果,以ONNX框架搭配DirectML后端进行运算,NVIDIAGeForce RTX 5080 创始版显示卡在单精度部分的分数为36443、在半精度的测试分数为61027,在量化后所得到的分数为27783。(点击可看大图) (点击可看大图)跟对照组显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡平均有约9.98%左右的效能提升,比起AMDRadeon RX 7900 XTX 公版显示卡约有13.22%的效能领先,比起RTX4090 创始版显示卡有约9.17%的效能提升,比起RTX5090 创始版显示卡有约18.7%的效能差距。主要是在半精度的部分NVIDIAGeForce RTX 5080 创始版显示卡的效能提升幅度比较明显,在单精度跟量化后的数据上表现则是跟24GB显示记忆体配置的RTX4090 创始版显示卡以及AMDRadeon RX 7900 XTX 公版显示卡差不多。接着来看ULProcyon AI 的测试成绩,首先是在物件辨识的AIComputer Vision Benchmark 测试项目部分,提供包括WindowsML/NIVIDIATensor RT/IntelOpenVINO 等框架,以及Float32/Float16/Integer三种精度进行测试,而在先前RTX5090 创始版显示卡上无法使用NVIDIA自家的TensorRT 框架进行测试的问题,在测试RTX5080 创始版显示卡时还没解决,所以还是不能利用TensorRT 框架进行测试,以下是在WindowsML 框架下的测试结果:(点击可看大图)
Float32
Float16
Integer
在测试结果部分,NVIDIAGeForce RTX 5080 创始版显示卡在ULProcyon AI Computer Vision BenchMark 测试项目中,以微软WindowsML 框架,在Float32精度设定下的分数为1415,在Float16 精度设定下的分数为2545,在Integer精度设定下的分数为719。(点击可看大图) (点击可看大图)跟对照组显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡平均有约9.46%左右的效能提升,比起AMDRadeon RX 7900 XTX 公版显示卡约有61.86%的效能领先,比起RTX4090 创始版显示卡有约5.85%的效能落差,比起RTX5090 创始版显示卡有约25.5%的效能差距。接着来看在个人生成式AI应用比较热门的图片生成效能部分,这部分陈拔是利用ULProcyon 测试软体中的AIImage Generation Benchmark 项目进行测试,这个测试项目主要利用StableDiffusion 1.5 与StableDiffusion XL 进行测试,并且使用FP16与INT8 精度配置,支援ONNX/NIVIDATensor RT/IntelOpen VINO 等框架,而先前在测试RTX5090 创始版显示卡时遇到不支援NIVIDATensor RT 框架的问题,在这次测试RTX5080 创始版显示卡时,NVIDIA以提供特殊ULProcyon Beta 版本的方式来解决,以下是测试结果:
SD1.5 ONNX FP16
SDXLONNX FP16
首先是在ONNX框架,在FP16设定下的测试结果部分,NVIDIAGeForce RTX 5090 创始版显示卡在SD1.5 的分数为3386,在SDXL的分数为3018。(点击可看大图) (点击可看大图)跟对照组显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡平均有约7.16%左右的效能提升,比起AMDRadeon RX 7900 XTX 公版显示卡约有89.78%的效能领先,比起RTX4090 创始版显示卡有约22.6%的效能落差,比起RTX5090 创始版显示卡有约43.7%的效能差距。
SD1.5 TensorRT FP16
SD1.5 TensorRT INT8
SDXL TensorRT FP16
至于在利用TensorRT 框架的部分,NVIDIAGeForce RTX 5080 创始版显示卡在SD1.5 FP16 精度设定下的分数为4873,在SD1.5 INT8 精度设定下的分数为56600,在SDXLFP16 精度设定下的分数为4336。 (点击可看大图)因为AMDRadeon RX 7900 XTX 显示卡并不支援TensorRT,所以在这部分就没有分数。而跟其他对照组显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡平均有约23.48%左右的效能提升,比起RTX4090 创始版显示卡有约6.5%的效能落差,比起RTX5090 创始版显示卡有约28.9%的效能差距。至于在这次NVIDIA在RTX50 系列显示卡上新推出的FP4精度支援的部分,陈拔也同样利用了NVIDIA提供的ULProcyon AI Image Generation Benchmark Beta 版FLUX.1测试套件进行测试,以下是测试结果:
FLUX1FP8
FLUX1FP4
NVIDIAGeForce RTX 5080 创始版显示卡在FP4的成绩为每张需要9.406秒的生成时间,而FP8的成绩为每张需要14.471秒的生成时间。(点击可看大图) (点击可看大图)同样的因为AMDRadeon RX 7900 XTX 显示卡并不支援TensorRT,所以在这部分就没有分数。而跟其他对照组显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡,在FP8测试中缩短的时间仅有8.56%左右,但是到了FP4设定就加大到67.63%。而跟RTX4090 创始版显示卡对比,在FP8测试时还慢了27.34%的时间,但是FP4设定反而快了46.1%。而跟RTX5090 创始版显示卡相比,都有约2.2倍至2.3.倍的时间落后。最后来看在文字生成的AIText Generation Benchmark 部分,这个部分陈拔则是利用ULProcyon 的AIText Generation Benchmark 测试项目进行测试,ULProcyon 在这部分提供了基于LLM大型语言模型的运算效能,使用包括ONNX(DirectML)与 IntelOpenVINO 框架的AI模型效能测试,测试的LLM模型包括Phi-3.5-mini、Mistral-7B、Llama-3.1-8B以及Llama-2-13B四款,以下是NVIDIAGeForce RTX 5080 创始版显示卡在这项测试的效能表现: NVIDIAGeForce RTX 5080 创始版显示卡在ULProcyon AI Text Generation Benchmark 测试项目中,以ONNX框架测试的结果,在Phi-3.5-mini模型的分数为4558、在Mistral-7B模型的分数为4721、在Llama-3.1-8B模型的分数为4508以及在Llama-2-13B模型的分数为4717。(点击可看大图) (点击可看大图)跟对照组显示卡相比,NVIDIAGeForce RTX 5080 创始版显示卡比起RTX4080 Super 创始版显示卡平均有约18.1%左右的效能提升,比起AMDRadeon RX 7900 XTX 公版显示卡约有96.88%的效能领先,比起RTX4090 创始版显示卡有约5%的效能落差,比起RTX5090 创始版显示卡有约28.43%的效能差距。从测试结果来看,NVIDIAGeForce RTX 5080 创始版显示卡比起上一代的RTX4080 Super 创始版显示卡在AI应用的效能部分基本上有7%至23%不等的效能提升,比起规格表上的算力提升幅度低了不少,只能说这部分的效能表现仍要看所使用的框架/应用/精度设定而定,不过比较令人意外的是跟24GB 配置的RTX4090 创始版显示卡相比,16GB 配置的RTX5080 创始版显示卡在效能表现落差上并没有想像中的大,尤其是在精度较低的测试部分,表现可说是相当接近。
NVIDIAGeForce RTX 5080 创始版显示卡测试时温度与功耗表现
最后来看NVIDIAGeForce RTX 5080 创始版显示卡在测试时的温度与功耗表现,在散热设计上NVIDIAGeForce RTX 5080 创始版显示卡采用跟RTX5090 创始版显示卡相同的Doubleflow through 双风流通过设计,所以理论上散热效果跟RTX5090 创始版显示卡是相同的,而且RTX5080 创始版显示卡的TGP功耗降低至360W,这个散热设计应该可以更有效的降低显示卡的温度,所以首先就先来看温度部分,以下是陈拔在测试过程中,以软体纪录了NVIDIAGeForce RTX 5080 创始版显示卡GPU的最高温度表现,所记录到的数值如下: (点击可看大图)可以看到在进行3DMark的效能测试项目时,NVIDIAGeForce RTX 5080 创始版显示卡的最高平均温度为68.78℃,跟在相同条件下进行测试的对照组显示卡相比,比起RTX4080 Super 创始版显示卡的62.5℃要高了约6.25℃左右,比起AMDRadeon RX 7900 XTX 公版显示卡的80.28℃要低了约11.5℃左右,比起RTX4090 创始版显示卡的66℃要高了约2.78℃左右,比起RTX5090 创始版显示卡的71.13℃要低了约2.35℃左右。另外陈拔也利用红外线仪,在NVIDIAGeForce RTX 5080 创始版显示卡进行压力测试时,拍摄显示卡外部的表面温度,所拍摄到的数值如下:
正面
侧面
背板
尾端
显示IO
(点击可看大图)基本上的表面温度都控制在60℃以下,比起RTX5090 创始版显示卡在背板出现接近73℃的数值要低了许多,两侧巨大的散热鳍片与热导管设计可说充分的将热度导至Doubleflow through 双风流通过设计进行散热,整体散热压力比起RTX5090 创始版显示卡要小了不少。至于在功耗部分,陈拔同样利用NVIDIA外接的PCAT测试套件(请见:NVIDIARTX 显卡测试新工具亮相新增延迟时间测试与独立功耗测量),在进行跑分效能与游戏效能测试时,纪录了NVIDIAGeForce RTX 5080 创始版显示卡的最高功耗,以下是测试的结果: (点击可看大图)在效能测试时NVIDIAGeForce RTX 5080 创始版显示卡的最高功耗平均值为387.76W,跟在相同条件下进行测试的对照组显示卡相比,比起RTX4080 Super 创始版显示卡的373.88W要高了约3.68%左右,比起AMDRadeon RX 7900 XTX 公版显示卡的411.93W要低了约5.77%左右,比起RTX4090 创始版显示卡的488.5W要低了约20.6%左右,比起RTX5090 创始版显示卡的620.16W要低了约37.4%左右。 (点击可看大图)而在游戏部分的功耗表现上,陈拔是在使用十八款3A大作游戏、以4K解析度、最高画质设定进行测试时进行最高全卡功耗的纪录,NVIDIAGeForce RTX 5080 创始版显示卡的最高功耗平均值为353.1W,比起RTX4080 Super 创始版显示卡的341.65W要高了约11.45W左右,比起AMDRadeon RX 7900 XTX 公版显示卡的397.03W要低了约43.93W左右,比起RTX4090 创始版显示卡的446.58W要低了约93.48W左右,比起RTX5090 创始版显示卡的595.916W要低了约242.816W左右。以效能提升的幅度对上功耗提升的幅度,NVIDIAGeForce RTX 5080 创始版显示卡在这部分明显的就比RTX5090 创始版要好了挺多,跟RTX4080 Super 创始版显示卡相比,仅需要2%左右的功耗增加,就能获得17%的游戏效能提升,而跟RTX4090 创始版显示卡相比,仅需要79%的相对功耗就能获得88.5%的效能表现,而且功耗控制在360W以下,对于电源供应跟散热的压力都没有那么大。
NVIDIAGeForce RTX 5080 创始版显示卡测试总结
NVIDIAGeForce RTX 5080 创始版显示卡。在RTX5090 显示卡来到惊人的7万1990元起价格带后,定价为3万5990元起的RTX5080 显示卡就成为一般消费者能够负担得起的4K解析度新显示卡选择(隔壁两家暂时也没有可以选择的产品),而在实测过后的结果,NVIDIAGeForce RTX 5080 创始版显示卡也能够在360W的功耗配置下,提供接近上代旗舰RTX4090 显示卡90%的效能表现,也比起RTX4080 Super 创始版显示卡效能提升15%左右,再度展现了老黄精湛的切割刀法,让RTX5080 的效能刚好卡在RTX4080 Super 跟RTX4090 间,当然也跟上一阶RTX5090 拉开了不小的差距,避免了RTX4090 与RTX4080 间的尴尬境地。当然对于一般消费者来说,跟RTX4080 Super 仅有15%的效能提升幅度,可能还稍嫌不足,不过以目前市场上的选项来说,除非能买到便宜的RTX4090 显示卡(售价还可能跟RTX5080 差不多),否则在现阶段要买一张具备新功能的的4K解析度游戏显示卡,具备4K3A 大作游戏解析度平均113fps 的RTX5080(还可以开启DLSS提升),在现阶段在性能/售价交换比来说,还算是相对划算的选择。不过16GB/256bit 的显示记忆体配置,仍然是RTX5080 显示卡这次的硬伤,在AI应用以及部分游戏中,仍可以看出因显示记忆体不足而造成的效能瓶颈,只能说若是要在这部分的工作应用中获得更快的结果,那就直接攻顶RTX5090 吧。
发表评论 取消回复