1还不满意GTX980?那就超频吧
GeForce GTX 980发布一周了,对它的评价用两个字就能直接概括了——很棒。它的功耗很低,性能不错,价钱也不算贵(虽说只是相对的……),无论性价比还是性能功耗比都相当强。我们讲了架构,测了性能,跑了SLI,看了性价比,基本上算是把这款新架构旗舰的方方面面都看全了。还剩什么是我们所不知道的呢?没错,超频。既然所有测试都已经做完了,那也确实是时候体验一下GeForce GTX 980的超频潜力了。
直接切入主题吧,我们今天来玩玩儿超频。
GTX980是否好超?
与以往使用非公版或者首发超公版显卡进行超频测试不同,GeForce GTX 980极低的功耗和强大的性能功耗比给了我们信心,让我们有了使用公版直接进行高频挑战的想法。GeForce GTX 980是否真如我们所预期的那样保有巨大的工程设计及功耗余量?公版的它能否直接硬上高频呢?接下来的测试将会为我们带来答案。不过在这之前,还是先来让我们一起回顾一下这款新旗舰的各项新特性吧。
2从4x4x4到大改缓存
● 从4x4x4到大改缓存
作为全新一代架构,GeForce GTX 980所基于的Maxwell架构是NVIDIA的新技术集大成者。NVIDIA对Maxwell架构的一系列重要改进,首先要被提及的就是GPU并行结构的改进。
在Maxwell架构当中,NVIDIA改变了ALU团簇的绑定方式,在GPC-ALU之间添加了SMM和SM两级,这改变了新架构的宏观并行结构和等级。现在的Maxwell架构拥有4 GPC的宏观并行结构,每GPC下辖4组SMM单元,每组SMM下辖4组SM单元,每组SM单元包含32个ALU。整个架构的宏观并行结构也因此而从之前的二阶三级原则变成了GPC-SMM-SM-ALU的三阶四级原则,因此GM204的宏观并行结构从Fermi/Kepler的4x4/5x3变成了4x4x4。
完整规格GM204架构图
NVIDIA采用的Setup以及Rasterizer同GPC绑定的方案在Maxwell当中没有变化,因此GM204架构可以实现单周期输出4多边形,在同频下拥有了和先辈们相当的多边形泵出能力,但光栅化处理能力由于新技术的加入而实现了部分场合的提升。
ALU团簇方面,GM204采用了最新的SMM单元设计,在保留完整的几何前端的前提下,SMM单元在内部将ALU团簇再次划分成了4个并行的独立子团簇SM,每个SM包含32个ALU,并且都拥有独立的Scheduler/Dispatch以及Register,每两组SM共享一组统一的Texture/L1 D\$ cache,这与SMX单元192个ALU共享同一组Scheduler、Dispatch、L1 D\$ cache以及Register形成了鲜明的对比,而且也进一步提升了每个ALU所能够获得的Register资源量。
与Kepler架构的Shared+L1 D\$ Cache/L1 I\$ Cache/Texture Cache的体系相比,Maxwell架构的Cache体系进化到了L1 D\$+Texture Cache/L1 I\$ Cache。两者最本质的区别,在于Maxwell架构的Shared从L1 Cache当中被独立出去,而L1 D\$ Cache则与Texture Cache合并,可以同时完成运算数据和材质的缓冲工作。 另外,Maxwell还大幅提升了L2 Cache的密度和总容量,Kepler架构的L2密度为128K per MC,这一密度在Maxwell架构的GM204中被提升4倍到了512KB per MC,而且到目前为止的所有Maxwell架构的L2总量都达到了史无前例的2048KB,这一数值已经超越了Kepler旗舰GK110。更大的L2 Cache所带来的好处是显而易见的,它能够为GPU提供比过去更好的数据缓冲,可以改善运算和材质操作环境,还能提升显存体系的效率。
3更多新技术一览
● 积沙成山,更多新技术一览
一如既往的,除了架构层面的改进之外,NVIDIA还为GeForce GTX 980/970搭载了包括TDCC、DSR、MFAA、保守光栅化、VXGI等等在内的多项新技术,这些技术针对领域不同,但都会对架构效率及游戏画质带来积极的影响。
TDCC技术
在GM204当中,NVIDIA为提升有限显存带宽的利用率而列装了改进后的TDCC技术(Third generation Delta Clolr Compression,第三代色彩压缩技术),该项技术可以将相同色彩的像素信息进行压缩,能够时情况不同带来平均20%以上的数据量下降,这等于等效提升了对应比例的显存带宽。值得注意的是,在本月早些时候发布的Tonga架构当中,AMD同样加入了作用类似的色彩压缩机制,双方不约而同的选择了堆砌硬件规模之外的方式来提升硬件的使用效率,这是一个相当好的现象。
DSR是另一项出现在GM204当中的新技术,该项技术允许显卡将游戏画面以4K分辨率进行渲染,然后采样为1080P分辨率输出至屏幕当中。该项技术与早年间在DIY界曾经名骚一时并被传为“佳话”的“resizeAA”有异曲同工之妙(有兴趣的朋友们可以自行搜索那段历史),它利用高分辨率渲染结果来进行低分辨率采样并输出至屏幕上,不仅可以利用显卡的闲置性能,规避低分辨率渲染+采样所导致的像素细节丢失问题,而且可以让1080P分辨率的显示器呈现出接近4K超高分辨率的画面效果。对很多老游戏而言,这是一项可以再次提升画质的技术。
MFAA是一项全新的抗锯齿技术,传统的MSAA等抗锯齿技术采用当前帧复数采样来作为边缘颜色混合的依据,MFAA则将采样范围扩展到了前帧+当前帧两张画面,这可以在取得相近采样效果的前提下大幅降低采样次数。以MSAA为例,4xMSAA需要在当前帧采样4次以获得色差边缘的像素颜色信息并完成混合,且每帧画面皆如此处理,而MFAA则会在前帧(第n-1帧)及当前帧(第n帧)当中分别采样2次来完成颜色信息采集。每当新的一帧(第n+1帧)出现时,由于当前帧(第n帧)已经变成了新一帧的前帧(第n+1-1帧),之前采样的信息已经存在,所以MFAA无需再次重复采样,仅需再对新帧采样2次即可完成过去需要采样4次才能完成的混合效果。所以理论上,MFAA可以以MSAA一半的性能消耗实现相近的抗锯齿效果。
除上述技术之外,GM204还列装了更多与游戏引擎联动的新技术,比如基于立体像素及光锥追踪的新光照渲染技术VXGI等,但这些技术需要游戏引擎的特别支持,无法在现有游戏及应用当中发挥作用,因此在这里不予赘述。不过,VXGI技术本身确实是光线追踪实用化之前的一次极有意义的尝试,它甚至可以作为光线追踪的前置技术出现,因此在后续的技术解读类文章当中,我们会予以深入介绍。
4测试平台及超频结果
● 测试平台及超频结果
为保证测试能够发挥显卡的最佳性能,本次测试平台由Intel酷睿i7-3970X处理器、ANTEC H1200水冷散热器、技嘉X79芯片组主板、威刚4GB DDR3-1600×4四通道内存、ANTEC HCP-1300电源组建而成。详细硬件规格如下表所示:
测 试 平 台 硬 件 环 境 | ||||
中央处理器 | Intel Core i7-3970X | |||
(6核 / 12线程 / 3.5GHz / 15MB L3) | ||||
散热器 | Intel RTS2011LC | |||
(原厂水冷散热器 / 选配件) | ||||
内存模组 | ADATA XPG DDR3-1600 4GB × 4 | |||
(SPD:9-9-9-24-1T) | ||||
主板 | GIGABYTE GA-X79-UD7 | |||
(Intel X79 Chipset) | ||||
硬盘 | 影驰战将系列240GB | |||
(240GB / SSD / 64MB缓存 / SATA3) | ||||
电源 | 安钛克 HCP-1300 Platinum | |||
(80Plus Platinum / 1300W) | ||||
显示器 | DELL Ultra Sharp 3008WFP | |||
(30英寸LCD / 2560×1600分辨率) |
测试平台软件环境一览
为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 7正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
测 试 平 台 软 件 环 境 | ||||
操作系统 | Microsoft Windows7 Ultimate RTM SP1 | |||
(64bit / 版本号:7601) | ||||
主板芯片组驱动 | Intel Chipset Device Software | |||
(WHQL / 版本号:9.2.3.1022) | ||||
AMD Catalyst/NVIDIA GeForce GTX | ||||
(版本号:14.4 WHQL/344.07 Beta) | ||||
桌面环境 | Microsoft Windows7 Ultimate RTM SP1 | |||
(2560×1600 / 32bit / 60Hz) |
我们使用半官方性质的NVIDIA Inspector软件来完成超频动作,在未进行任何改造的全默认形态下,我们将公版GeForce GTX 980的频率提升到了1390/7300MHz,并顺利通过了所有测试。
5理论性能测试
● 理论性能测试
PC游戏随Windows 7的发布进入DirectX 11时代,众多DirectX 11显卡早已摩拳擦掌上阵厮杀,却迟迟没有一个权威性的基准测试软件来衡量游戏显卡DirectX 11性能的高低。终于,DirectX 11时代的3DMark 11来到大家面前。3DMark 11使用原生DirectX 11引擎,测试场景包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DirectX 11特性。
3DMark 11
GeForce GTX 980在经过超频之后的性能提升是令人印象深刻的。在理论测试当中,我们几乎收获了与核心频率提升幅度相当的测试结果提升,而且毫无疑问的,如果对这块公版卡加以改造或者采用超公版,成绩还会有更大幅度的增长。
6游戏性能测试之《孤岛危机2》
● 游戏性能测试之《孤岛危机2》
《孤岛危机2》是《孤岛危机》的续作,游戏采用CryENGINE 3引擎制作。《孤岛危机2》在游戏内容上与一代也有很大变化,已经从秘密的丛林作战转向了公开、大规模的现代城市战争。故事发生在距一代3年后的2023年,外星人在地球上的大片区域挑起了战争,各大城市都遭到攻击,人口锐减,玩家将要进行捍卫地球的末日战争。
《孤岛危机2》
凭借超频之后更高的效率,OC后的GeForce GTX 980在Crysis2当中同样表现出了明显的性能提升。
7游戏性能测试之《地铁:最后的曙光》
● 游戏性能测试之《地铁:最后的曙光》
《地铁:最后的曙光》讲述一场为争夺足以毁灭人类的世界末日装置的内战。人类依旧苟活在地下等死,不同派系之间的战争还在继续,晚上依旧有各种变异生物潜伏在暗处。地面依旧是各种毒气,但有传言冰层开始融化,阳光开始穿透云层。
《地铁:最后的曙光》
在地铁:最后的曙光的游戏测试中,OC之后提升的效率再一次帮助GeForce GTX 980获得了最强公版单芯游戏显卡的称号。
8游戏性能测试之《杀手:赦免》
● 游戏性能测试之《杀手:赦免》
《杀手:赦免》采用IO Interactive自主研发的冰川2(Glacier 2)引擎制作,游戏内容都是在引擎下实时进行反馈的,所有动作都是即时生成的。新作主要场景发生在芝加哥,名为代号47的主角在本作中将更加灵活,更好控制。他将可以攀在悬崖边,还可以保持平衡,游戏融入了掩护系统,挟持人持的功能回归。
《杀手:赦免》
毫无悬念,超频之后的GeForce GTX 980再次以大幅增长的性能取得了最快公版显卡的称号。
9游戏性能测试之《古墓丽影9》
● 游戏性能测试之《古墓丽影9》
《古墓丽影9》将讲述劳拉的首次冒险之旅,主角劳拉·克劳馥的年龄被设定在21岁,那时的她还只是一名刚出茅庐的新人,经验欠缺。随着游戏剧情的发展,玩家将与劳拉共同成长,获得新的武器和道具并习得新技能。在冒险的小岛上,玩家可以在营地对道具进行组合,有些特定区域就需要特定道具和技能才能通过。岛上的各个营地之间可以快捷传送,玩家无需长途跋涉。而除了劳拉外还将有其他角色出现在岛上。
古墓丽影9
GeForce GTX 980的超频对于古墓丽影而言完全可以满足流畅所需,如果您已经OC,我们建议您挑战4K分辨率来获得不(su)一(liao)样(gan)的画质体验。
10测试总结——28nm芯片巅峰
● 测试总结——28nm芯片巅峰
在做工并不出众的公版显卡上随意达到贴近1.4G的核心频率,这不仅出乎了我们的预料,相信也是屏幕前的您始料未及的。公版GeForce GTX 980不仅能耗比相当优秀,同时还拥有很大的超频潜力,超过20%的超频幅度并不罕见甚至应该比较普遍。这再一次验证了我们在首发测试当中的结论——公版GeForce GTX 980/970拥有巨大的功耗余量和工程设计余量,其最终性能是经过权衡之后加以限制甚至是克制的结果。
即便是公版,GeForce GTX 980也具备惊人的超频潜能
同样基于28nm且规模均在400平方毫米左右的芯片,NVIDIA的表现已经与其他厂商形成了鲜明且强烈的反差。公版PCB那求稳甚至可以说是贫弱的设计仍旧可以维持如此高的频率上限,这无疑折射出了Maxwell架构的高效率以及在D线当中的良好控制力,同时也再次反映了D线无形的威力。综合各方面因素考虑,GeForce GTX 980应该已经达到了28nm工艺芯片的巅峰,在相同工艺下很难会再有超越者出现。
NVIDIA在接下来的GeForce 900时代应该会继续维持全线产品的高性能功耗比表现,所有基于Maxwell架构的公版产品都将会拥有比过去更好的功耗表现,而非公版以及超公版产品则拥有了更大的发挥空间和可利用余量,可以预见,基于Maxwell的非公版显卡的性能将会比过去更为“疯狂”。所以无论是常规的游戏用户,还是关注硬件可玩性和绝对性能的传统DIY,GeForce 900时代都将会值得期待。
最后还是那句话,尽管超频能够带来更多乐趣并让显卡的性能和价值进一步提升,尽管GeForce GTX 980拥有巨大的余量可供挖掘,尽管NVIDIA的公版显卡做工卖相还都挺牢靠的,尽管……但是,超频有风险,尝试需谨慎。
搭载GM204核心的GeForce GTX 980其超频性能如何呢?相比很多玩家都对其很好奇,基于20nm的它能否为我们带来新惊喜?本文作者通过公版产品,默认风冷散热器条件下,看看其超频潜力究竟如何。
推荐经销商