1SLI,土豪升级新选择
北京时间2014年9月19日上午10时30分,NVIDIA全球正式发布了Maxwell架构的第二组作品:定位旗舰级的GeForce GTX 980。NVIDIA交给GeForce GTX 980的主要任务,在于在性能优异的同时以性能功耗比属性把旗舰级显卡从纯炫耀物、高温怪兽或者功耗强盗之流变回畅享游戏的工具,“还游戏以游戏,还显卡以显卡”。
GeForce GTX 980是一款定位性能功耗比表现的单芯显卡,这并不代表它彻底抛弃了绝对性能要素。它不仅拥有不输前代旗舰的单卡性能,同时其性能延展性与Kepler架构相比同样有过之而无不及。在预(tu)算(hao)允(ji)许(mo)的前提下,GeForce GTX 980同样可以透过SLI来帮助用户打造性能突破极限的骨灰级游戏平台。而且得益于Maxwell架构卓越的性能功耗比,这一过程比过去还更加容易了。
GTX980一样能够通过SLI打造极限游戏平台
一如既往的,为土豪们提供有参考价值的采购建议一直都是我们追求的目标(…………),所以在接下来的文章中,就让我等只能眼馋却没机会享受的穷苦人家一起沾沾大户们的光,来看一看两块GeForce GTX 980组成SLI究竟有怎样令土豪们心动的游戏性能吧。
2从4x4x4到大改缓存,GM204特性一览
● 从4x4x4到大改缓存,GM204特性一览
作为全新一代架构,GeForce GTX 980所基于的Maxwell架构是NVIDIA的新技术集大成者。NVIDIA对Maxwell架构的一系列重要改进,首先要被提及的就是GPU并行结构的改进。
在Maxwell架构当中,NVIDIA改变了ALU团簇的绑定方式,在GPC-ALU之间添加了SMM和SM两级,这改变了新架构的宏观并行结构和等级。现在的Maxwell架构拥有4 GPC的宏观并行结构,每GPC下辖4组SMM单元,每组SMM下辖4组SM单元,每组SM单元包含32个ALU。整个架构的宏观并行结构也因此而从之前的二阶三级原则变成了GPC-SMM-SM-ALU的三阶四级原则,因此GM204的宏观并行结构从Fermi/Kepler的4x4/5x3变成了4x4x4。
完整规格GM204架构图
NVIDIA采用的Setup以及Rasterizer同GPC绑定的方案在Maxwell当中没有变化,因此GM204架构可以实现单周期输出4多边形,在同频下拥有了和先辈们相当的多边形泵出能力,但光栅化处理能力由于新技术的加入而实现了部分场合的提升。
ALU团簇方面,GM204采用了最新的SMM单元设计,在保留完整的几何前端的前提下,SMM单元在内部将ALU团簇再次划分成了4个并行的独立子团簇SM,每个SM包含32个ALU,并且都拥有独立的Scheduler/Dispatch以及Register,每两组SM共享一组统一的Texture/L1 D\$ cache,这与SMX单元192个ALU共享同一组Scheduler、Dispatch、L1 D\$ cache以及Register形成了鲜明的对比,而且也进一步提升了每个ALU所能够获得的Register资源量。
与Kepler架构的Shared+L1 D\$ Cache/L1 I\$ Cache/Texture Cache的体系相比,Maxwell架构的Cache体系进化到了L1 D\$+Texture Cache/L1 I\$ Cache。两者最本质的区别,在于Maxwell架构的Shared从L1 Cache当中被独立出去,而L1 D\$ Cache则与Texture Cache合并,可以同时完成运算数据和材质的缓冲工作。 另外,Maxwell还大幅提升了L2 Cache的密度和总容量,Kepler架构的L2密度为128K per MC,这一密度在Maxwell架构的GM204中被提升4倍到了512KB per MC,而且到目前为止的所有Maxwell架构的L2总量都达到了史无前例的2048KB,这一数值已经超越了Kepler旗舰GK110。更大的L2 Cache所带来的好处是显而易见的,它能够为GPU提供比过去更好的数据缓冲,可以改善运算和材质操作环境,还能提升显存体系的效率。
3积沙成山,更多新技术一览
● 积沙成山,更多新技术一览
一如既往的,除了架构层面的改进之外,NVIDIA还为GeForce GTX 980/970搭载了包括TDCC、DSR、MFAA、保守光栅化、VXGI等等在内的多项新技术,这些技术针对领域不同,但都会对架构效率及游戏画质带来积极的影响。
TDCC技术
在GM204当中,NVIDIA为提升有限显存带宽的利用率而列装了改进后的TDCC技术(Third generation Delta Clolr Compression,第三代色彩压缩技术),该项技术可以将相同色彩的像素信息进行压缩,能够时情况不同带来平均20%以上的数据量下降,这等于等效提升了对应比例的显存带宽。值得注意的是,在本月早些时候发布的Tonga架构当中,AMD同样加入了作用类似的色彩压缩机制,双方不约而同的选择了堆砌硬件规模之外的方式来提升硬件的使用效率,这是一个相当好的现象。
DSR是另一项出现在GM204当中的新技术,该项技术允许显卡将游戏画面以4K分辨率进行渲染,然后采样为1080P分辨率输出至屏幕当中。该项技术与早年间在DIY界曾经名骚一时并被传为“佳话”的“resizeAA”有异曲同工之妙(有兴趣的朋友们可以自行搜索那段历史),它利用高分辨率渲染结果来进行低分辨率采样并输出至屏幕上,不仅可以利用显卡的闲置性能,规避低分辨率渲染+采样所导致的像素细节丢失问题,而且可以让1080P分辨率的显示器呈现出接近4K超高分辨率的画面效果。对很多老游戏而言,这是一项可以再次提升画质的技术。
MFAA是一项全新的抗锯齿技术,传统的MSAA等抗锯齿技术采用当前帧复数采样来作为边缘颜色混合的依据,MFAA则将采样范围扩展到了前帧+当前帧两张画面,这可以在取得相近采样效果的前提下大幅降低采样次数。以MSAA为例,4xMSAA需要在当前帧采样4次以获得色差边缘的像素颜色信息并完成混合,且每帧画面皆如此处理,而MFAA则会在前帧(第n-1帧)及当前帧(第n帧)当中分别采样2次来完成颜色信息采集。每当新的一帧(第n+1帧)出现时,由于当前帧(第n帧)已经变成了新一帧的前帧(第n+1-1帧),之前采样的信息已经存在,所以MFAA无需再次重复采样,仅需再对新帧采样2次即可完成过去需要采样4次才能完成的混合效果。所以理论上,MFAA可以以MSAA一半的性能消耗实现相近的抗锯齿效果。
除上述技术之外,GM204还列装了更多与游戏引擎联动的新技术,比如基于立体像素及光锥追踪的新光照渲染技术VXGI等,但这些技术需要游戏引擎的特别支持,无法在现有游戏及应用当中发挥作用,因此在这里不予赘述。不过,VXGI技术本身确实是光线追踪实用化之前的一次极有意义的尝试,它甚至可以作为光线追踪的前置技术出现,因此在后续的技术解读类文章当中,我们会予以深入介绍。
4测试平台硬件环境
● 测试平台硬件环境
为保证测试能够发挥显卡的最佳性能,本次测试平台由Intel酷睿i7-3970X处理器、ANTEC H1200水冷散热器、技嘉X79芯片组主板、威刚4GB DDR3-1600×4四通道内存、ANTEC HCP-1300电源组建而成。详细硬件规格如下表所示:
测 试 平 台 硬 件 环 境 | ||||
中央处理器 | Intel Core i7-3970X | |||
(6核 / 12线程 / 3.5GHz / 15MB L3) | ||||
散热器 | Intel RTS2011LC | |||
(原厂水冷散热器 / 选配件) | ||||
内存模组 | ADATA XPG DDR3-1600 4GB × 4 | |||
(SPD:9-9-9-24-1T) | ||||
主板 | GIGABYTE GA-X79-UD7 | |||
(Intel X79 Chipset) | ||||
硬盘 | 影驰战将系列240GB | |||
(240GB / SSD / 64MB缓存 / SATA3) | ||||
电源 | 安钛克 HCP-1300 Platinum | |||
(80Plus Platinum / 1300W) | ||||
显示器 | DELL Ultra Sharp 3008WFP | |||
(30英寸LCD / 2560×1600分辨率) |
测试平台软件环境一览
为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 7正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
测 试 平 台 软 件 环 境 | ||||
操作系统 | Microsoft Windows7 Ultimate RTM SP1 | |||
(64bit / 版本号:7601) | ||||
主板芯片组驱动 | Intel Chipset Device Software | |||
(WHQL / 版本号:9.2.3.1022) | ||||
AMD Catalyst/NVIDIA GeForce GTX | ||||
(版本号:14.4 WHQL/344.07 Beta) | ||||
桌面环境 | Microsoft Windows7 Ultimate RTM SP1 | |||
(2560×1600 / 32bit / 60Hz) |
在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用游戏自带Benchmark来衡量性能,数值同样越高越好。
5理论性能测试
● 理论性能测试
PC游戏随Windows 7的发布进入DirectX 11时代,众多DirectX 11显卡早已摩拳擦掌上阵厮杀,却迟迟没有一个权威性的基准测试软件来衡量游戏显卡DirectX 11性能的高低。终于,DirectX 11时代的3DMark 11来到大家面前。3DMark 11使用原生DirectX 11引擎,测试场景包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DirectX 11特性。
3DMark 11
GeForce GTX 980 SLI的理论测试结果依旧超过了前代旗舰GeForce GTX 780Ti,而且SLI效率相当不错。如果您是一位以跑分为人生乐趣的土豪巨巨,GeForce GTX 980 SLI很明显是理想的选择。
6游戏性能测试之《孤岛危机2》
● 游戏性能测试之《孤岛危机2》
《孤岛危机2》是《孤岛危机》的续作,游戏采用CryENGINE 3引擎制作。《孤岛危机2》在游戏内容上与一代也有很大变化,已经从秘密的丛林作战转向了公开、大规模的现代城市战争。故事发生在距一代3年后的2023年,外星人在地球上的大片区域挑起了战争,各大城市都遭到攻击,人口锐减,玩家将要进行捍卫地球的末日战争。
《孤岛危机2》
凭借更高的SLI效率,GeForce GTX 980 SLI在Crysis2当中以明显的优势完成了测试,它是这款游戏最理想的运行平台。
7游戏性能测试之《地铁:最后的曙光》
● 游戏性能测试之《地铁:最后的曙光》
《地铁:最后的曙光》讲述一场为争夺足以毁灭人类的世界末日装置的内战。人类依旧苟活在地下等死,不同派系之间的战争还在继续,晚上依旧有各种变异生物潜伏在暗处。地面依旧是各种毒气,但有传言冰层开始融化,阳光开始穿透云层。
《地铁:最后的曙光》
在地铁:最后的曙光的游戏测试中,卓越的SLI效率再一次帮助GeForce GTX 980获得了最强双卡SLI平台的地位。
8游戏性能测试之《杀手:赦免》
● 游戏性能测试之《杀手:赦免》
《杀手:赦免》采用IO Interactive自主研发的冰川2(Glacier 2)引擎制作,游戏内容都是在引擎下实时进行反馈的,所有动作都是即时生成的。新作主要场景发生在芝加哥,名为代号47的主角在本作中将更加灵活,更好控制。他将可以攀在悬崖边,还可以保持平衡,游戏融入了掩护系统,挟持人持的功能回归。
《杀手:赦免》
杀手5的测试结果非常有趣,待测对象出现一模一样的测试结果在我们的历次对比测试当中都是绝少出现的。单卡GeForce GTX 980在杀手5当中的性能是不济GeForce GTX 780Ti的,能够取得打平的成绩,更好的SLI效率显然是重要要素之一。
9游戏性能测试之《古墓丽影9》
● 游戏性能测试之《古墓丽影9》
《古墓丽影9》将讲述劳拉的首次冒险之旅,主角劳拉·克劳馥的年龄被设定在21岁,那时的她还只是一名刚出茅庐的新人,经验欠缺。随着游戏剧情的发展,玩家将与劳拉共同成长,获得新的武器和道具并习得新技能。在冒险的小岛上,玩家可以在营地对道具进行组合,有些特定区域就需要特定道具和技能才能通过。岛上的各个营地之间可以快捷传送,玩家无需长途跋涉。而除了劳拉外还将有其他角色出现在岛上。
古墓丽影9
再一次的近百帧,GeForce GTX 980 SLI在古墓丽影9中依旧获得了性能上的胜利。如果您真是一位土豪,换装4K显示器才是对得起GeForce GTX 980 SLI的决定。
10测试总结——物有所值之选
● 测试总结——物有所值之选
托不差钱儿的大户们的福,吾等平民们今天又免费开了一把眼界了。在3Dmark跑分以及大部分游戏当中,GeForce GTX 980 SLI都表现出了令人印象深刻的延伸后性能。双卡互联之后的GeForce GTX 980无疑是当前最强的游戏平台之一,它的性能甚至足以应付4K分辨率下任何游戏的需求,如果您真的是一位不差钱儿的大户,用这套平台在4K分辨率的显示设备上畅爽最高极限设置下的超高清游戏才是您应该做的事情。
很遗憾,这不是我自己的……
当然,这并不代表GeForce GTX 980 SLI的表现就完美无瑕无懈可击。尽管其性能令人印象深刻,但与以往一样,SLI的性能延伸率并非在所有游戏当中都能达到令人满意的程度。而且当前常规的交错帧渲染模式无法很好地解决最低帧问题,甚至还可能会因为Max/Min FPS之间拉大的落差而进一步导致卡顿感的升级。无法全天候提升游戏体验的问题,是每一个想用GeForce GTX 980组成SLI的大户们都要注意的。
尽管如此,GeForce GTX 980 SLI依旧是我们能够找到的最好的PC平台图形硬件解决方案,它提供了最强大的性能,能够让极限玩家“肆无忌惮”的把钱包内容物变成更大显示环境下的极限游戏过程,而且功耗发热代价也堪称历代旗舰最低。如果您想挑战更高的测试分数或者体验极清画质的游戏画面,两块甚至三块GeForce GTX 980是相当不错的选择。
推荐经销商