1Maxwell震撼登场
我们很难形容自己最开始的感受,作为一款中端显卡,它竟然能够在工艺制程完全相同的前提下将性能功耗比提升至比前代产品多近4成。时隔两年,NVIDIA在Kepler架构之后再次为我们带来了十足的震撼。这款不依赖工艺进步,转而向高效率的半导体逻辑结构设计寻求性能增长和功耗控制的架构,就是我们期盼已久的NVIDIA全新GPU架构——Maxwell。
2014年2月18日北京时间22时,NVIDIA正式发布了全新的中端GPU产品,基于Maxwell架构的GeForce GTX 750Ti以及GeForce GTX 750。这两款面向中端的全新显卡拥有出色的游戏性能以及令人称奇的高性能功耗比表现,不仅为游戏PC、普通家用PC平台、网吧业者带来了相当理想的新选择,而且还将28nm工艺芯片的每瓦特性能推向了全新的高度。
一般来讲,当前业界的半导体芯片性能进步大多依赖于制程工艺提升所带来的频率和集成度提升,在同代工艺的前提下连续实现性能功耗比的大幅提升是一件相当罕见的事。所以在今天的测试当中,我们将会深入解析GeForce GTX 750Ti/GeForce GTX 750,以及Maxwell架构的各种先进特性,为您揭开这两款显卡每瓦特性能居高的秘密。
GeForce GTX 750京东商城购买连接:http://sale.jd.com/act/cg8QvKkI05D.html
2GTX750Ti/750规格一览
● GTX750Ti/750规格一览
GeForce GTX 750Ti/750与我们之前所见的GeForce GTX 700系列完全不同。它们基于全新的Maxwell架构,采用GM107-400/300芯片,拥有18.7亿的晶体管规模,核心面积仅略超过150平方毫米(封装测量数据),这一数值处于上代Kepler架构的甜点/中端,也就是GK106/GK107之间。与GK107相比,其运算资源总量从384个ALU上升到了640/512个,Texture Filter Unit上升到了32/40个,构成后端的ROP则维持了中端常见的16个。GeForce GTX 750Ti为我们带来了Maxwell初代架构的MC结构,衔接于GPC单元之后的2个64bit双通道显存控制器组合形成了128bit显存控制单元,GeForce GTX 750Ti/750因此采用了2048/1024MB的尺寸的显存体系。
注:市场售价均为官方首发限价
尽管GM107芯片仍旧基于28nm,但得益于优秀的架构设计、适度的规模和成熟的生产工艺控制,GeForce GTX 750Ti/750的默认核心达到了1020MHz,默认Pixel Fillrate能力均为16.3Gpixels/S,默认Texture Fillrate能力分别为40.8G/S和32.6G/S,显存带宽分别为86.4GB/S以及80.2GB/S。GeForce GTX 750Ti拥有1.3T Flops/S的单精度浮点运算能力,而GeForce GTX 750的运算能力则为1.04T Flops/S。
GeForce GTX 750Ti/750采用的Maxwell架构是NVIDIA全新设计的新一代DirectX 11图形架构,该架构由以下主要的部分所组成:
>> 完全重新设计的底层并行架构,GPC/ALU团簇关系从Kepler时代的2/3SMX per GPC提升到了5SMM per GPC。
>> GM107架构包含一组GPC单元,未来更高端的其他Maxwell架构将会包含更多GPC单元。
>> 5组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMM单元。每个SMM单元均包含一组与Kepler架构类似的,负责处理几何任务需求的PolyMorph Engine,128个负责处理运算任务及Pixel Shader的ALU,8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及与它们对应的shared+unified cache等缓冲体系。
>> 更为巨大的cache体系资源,L1 cache与Shared彻底分离,与Texture cache完成统一且密度翻倍,L2 cache的密度则提升了8倍。
在既往的分析当中,我们已经为大家勾勒出了NVIDIA图形架构发展的完整路线图以及因果关系,Kepler构架在NVIDIA的架构演进过程中扮演了极端重要的角色,这份重要性不仅让NVIDIA在GTX600/700时代拥有了对竞争对手的明确优势,同时也让Maxwell从中受惠。摆在我们面前的Maxwell架构,可以说是NVIDIA消化吸收并利用Kepler架构改进红利的结果,它的各项改进都是对Kepler架构的延伸和进一步优化。接下来,就让我们一起抵近观察这款全新架构的细节吧。
3大改,从SMX到SMM
● 大改,从SMX到SMM
从G80到Kepler,NVIDIA一直在改进GPU的ALU团簇基本单元,从G80到Fermi,NVIDIA一直在使用并调整着分频电路+大规模仲裁机制+32ALU捆绑的SM单元方案,而Kepler则采用了取消分频电路+瘦身仲裁机制+192ALU捆绑的SMX单元方案。如今,NVIDIA在Maxwell架构中进一步改进了ALU团簇,新的团簇方案名称为SMM。
SMX单元结构
新的SMM单元较之原先的SMX单元有了本质性的结构变化,在保留完整的几何前端的前提下,SMM单元在内部将ALU团簇再次划分成了4个并行的独立子团簇,每个团簇包含32个ALU,并且都拥有独立的Scheduler/Dispatch以及Register,每两组ALU团簇共享一组统一的Texture/L1 D\$ cache,这与SMX单元192个ALU共享同一组Scheduler、Dispatch、L1 D\$ cache以及Register形成了鲜明的对比,而且也进一步提升了每个ALU所能够获得的Register资源量。
ALU团簇结构的改变同时也带来了纹理单元分布的变化,材质资源方面,新的SMM单元包含2组共计8个Texture Array,相对于Kepler,Maxwell的运算/材质密度有了进一步下降,所以相对而言,我们可以认为Kepler是一个更偏重于图形操作的架构,而初代的Maxwell则将注意力更多地集中在了运算和任务效率层面。
总体而言,在这一全新设计上,每个SMM的尺寸得到大幅缩减,而性能却能够达到一个 Kepler SMX的90%。更小的面积让NVIDIA能够在每颗GPU中实现更多数量的SMM。通过对比GK107和GM107SM总数的相关指标可发现,GM107有五个SM,而前者只有两个。GM107 的峰值纹理性能比前者高 25%,CUDA 核心数量多1.7倍,着色器性能大约高2.3倍。
值得一提的是,尽管AMD在Hawaii当中进一步提升了架构的宏观并行度,但Maxwell架构对于SMM单元的修改再次将竞争拉到了新的高度。所以跟先前的情况相同,除了没有后端之外,可以说一个SMM单元在结构上依旧接近于竞争对手的一颗标准GPU了。
4扩展并行的下级仲裁管理机制
● 扩展并行的下级仲裁管理机制
我们曾经多次强调过,在整个Kepler构架当中,产生影响最为深远的改进来自任务调度以及仲裁过程的巨大变化。果如我们所言,Maxwell架构最核心的改进直接获益于该项改进,那就是SMM架构的任务仲裁机制。
通常来讲,可重复性较低且需要运算过程的判断性工作并不适合固定单元来执行,更加灵活的具有可编程性的通用单元来完成这类工作会比较得心应手。而那些具有较高可重复性,过程相对固定且基本具备可预期性的控制类工作,则更加适合具有特定针对性功能的电路来完成。如果我们以可编程的通用处理单元来完成判断性工作,让控制工作更多地被特定功能电路所执行,就可以达到最高效率的利用不同单元,以最低的能耗来完成最多工作的目的。
Kepler构架与Fermi构架执行Scheduling过程的差异
正是在这种思想的指导下,Kepler完成了“送出去,请进来”的改进,NVIDIA把一部分Scheduling过程从本地“送出去”,也就是转移到了CPU中以运算的形式来完成,同时通过引入GMU单元以及添加Dynamic Parallelism特性来降低CPU控制对任务的介入和影响,将控制工作更多地“请进来”,亦即移动到本地的GMU完成。这种执行位置和执行对象的互换扭转了过去“满拧”的局面,将适合通用处理单元的工作从GPU中拿出来交给了通用处理单元,也将不适合通用处理单元完成的工作交还给了GPU中的固定单元来完成,从而达到了各种单元均可以以更合适的功耗完成更多工作的目的。
Pre-Scheduling过程变化(图片修改自后藤弘茂先生博客)
Kepler的这项改进不仅保障了流水线的执行效率,同时也完成了相当关键的工作——对下级仲裁管理机制的“瘦身”和“减负”,Kepler架构SMX单元当中的下级仲裁管理机制不仅打破了整体性,所占资源比例明显下降,效率也并未因此而变低,这为Maxwell提供了良好的基础。
在Maxwell架构的SMM单元中,NVIDIA进一步延伸了仲裁机制瘦身的成果,它将SMX单元中的scheduler/dispatch拆解成了并行的四等份“子仲裁机制”,每组新的仲裁机制虽然比原先缩小了75%,但其所面对的ALU数量却也进一步下降了83.3%,每组scheduler/dispatch所面对的ALU从48个下降到了32个,所以这种拆解实际上提升了任务管理机制的等效规模,让每一个ALU都获得了比过去更多的管理资源。
在此基础上,scheduler/dispatch的拆分还使得任务管理过程进一步受益于并行化结构,进一步减少了ALU单元用于等待管理机制作出决策并分派任务的周期,这种等待周期的减少直接提高了ALU的效率,从而让Maxwell架构拥有了比Kepler更强的性能和能耗比属性。
5大改II,更加完善的Cache体系
● 大改II,更加完善的Cache体系
在Unified Cache体系方面,Maxwell架构同样在结构上做出了大幅改进,不仅结构有了本质性的不同,容量和密度层面也有了大幅提升,其变化程度完全和所产生的影响完全不下于SMX到SMM的改进。
更为强劲的SMX性能
与Kepler架构的Shared+L1 D\$ Cache/L1 I\$ Cache/Texture Cache的体系相比,Maxwell架构的Cache体系进化到了L1 D\$+Texture Cache/L1 I\$ Cache。两者最本质的区别,在于Maxwell架构的Shared从L1 Cache当中被独立了出去,独立之后的Shared为整个SMM单元内部的所有单元所共享,容量被提升到了64K。L1 D\$ Cache则与Texture Cache合并,可以同时完成运算数据和材质的缓冲工作。
分离shared的过程改善了Maxwell架构L1 D\$ Cache的效率和工作状态,传统的Fermi/Kepler架构所采用的Cache共享L1 D\$ Cache的做法(总量64K,采用16K/32K/48K可编程划分)虽然在资源利用率和灵活度上有一定优势,但Shared只读不可写的操作形式会影响到L1 D\$ Cache的使用,不断改变的L1 D\$ Cache/Shared空间干扰了L1 D\$ Cache本身的命中率和使用,L1 D\$ Cache与Texture Cache也因此而无法得到统一,这一系列弊端在Maxwell当中都得到了修正,当前的Maxwell架构,终于彻底进化到了真正意义上的Unified Cache体系。
除了L1 Cache体系之外,Maxwell还大幅提升了L2 Cache的密度和总容量,Kepler架构的L2密度为128K per MC,这一密度在Maxwell架构中被提升8倍到了1024KB per MC,GM107架构的L2总量也因此达到了史无前例的2048KB,这一数值已经超越了Kepler旗舰GK110。更大的L2 Cache能够为GPU提供比过去更好的数据缓冲,可以改善运算和材质操作环境,还能提升显存体系的效率。
6Maxwell更多特性一览
● 更多特性一览
在执行效率层面之外,Maxwell架构还引入了一些新的功能性技术改进,主要面向视频处理以及能源管理方向。
NVENC特性
为了提高视频性能,Maxwell采用了改进的NVENC模块,该模块提供了更快的编码速度 ,根据NVIDIA官方公布的数据,新一代NVENC模块的H.264实时编码速度提升到了Kepler架构的1.5~2倍,速度达到了传统方式的6~8倍,解码速度也进一步提升到了传统方式的8-10倍。Maxwell架构还引入了全新的本地解码器高速缓存,它为视频解码带来了更高的显存使用效率,从而在视频解码上实现了更高的效率和更低的功耗。
Maxwell还引入了全新的GC5功率状态,GC5是一种针对轻载负荷的低功耗休眠状态,这一level的能耗状态能够在视频播放等轻载型使用场合进一步降低GPU的功耗,让这些轻载使用场合下的GPU节能性有进一步的增强。
7Maxwell架构GTX750Ti拆解赏析
● Maxwell架构GTX750Ti拆解赏析
GeForce GTX 750Ti
8Maxwell架构GTX750拆解赏析
● Maxwell架构GTX750拆解赏析(非公版)
GeForce GTX 750
GeForce GTX 750
9参测显卡之七彩虹iGame750Ti烈焰战神U
● 参测显卡之七彩虹iGame750Ti 烈焰战神U-Twin-2GD5
七彩虹iGame750Ti 烈焰战神U-Twin-2GD5
10参测显卡之七彩虹iGame750烈焰战神U
● 参测显卡之七彩虹iGame750 烈焰战神U-Twin-1GD5
七彩虹iGame750 烈焰战神U-Twin-1GD5
11参测显卡之华硕GTX750Ti-OC-2GD5
● 参测显卡之华硕GTX750Ti-OC-2GD5
华硕GTX750Ti-OC-2GD5
12参测显卡之微星GTX750Ti GAMING
● 参测显卡之微星GTX750Ti GAMING
微星GTX750Ti GAMING
13参测显卡之微星GTX750 GAMING
● 参测显卡之微星GTX750 GAMING
微星GTX750 GAMING
14参测显卡之索泰GTX750Ti霹雳版
● 参测显卡之索泰GTX750Ti 霹雳版
索泰GTX750Ti霹雳版
15参测显卡之索泰GTX750霹雳版
● 参测显卡之索泰GTX750霹雳版
索泰GTX 750霹雳版
16参测显卡之影驰GTX750Ti大将
● 参测显卡之影驰GTX750Ti大将
影驰GTX750Ti大将
17参测显卡之影驰GTX750黑将
● 参测显卡之影驰GTX750黑将
影驰GTX750黑将
18参测显卡之耕升GTX750Ti关羽版
● 参测显卡之耕升GTX750Ti关羽版
耕升GTX750Ti关羽版
19参测显卡之耕升GTX750关羽版
● 参测显卡之耕升GTX750关羽版
耕升GTX750关羽版
20参测显卡之技嘉N75TOC-2GI
● 参测显卡之技嘉N75TOC-2GI
技嘉N75TOC-2GI
21参测显卡之技嘉N750OC-1GI
● 参测显卡之技嘉N750OC-1GI
技嘉N750OC-1GI
22参测显卡之铭瑄GTX750Ti终结者
● 参测显卡之铭瑄GTX750Ti终结者
铭瑄GTX750Ti终结者
23参测显卡之铭瑄GTX750终结者
● 参测显卡之铭瑄GTX750终结者
铭瑄GTX750终结者
24参测显卡之映众GTX750Ti游戏至尊版
● 参测显卡之映众GTX750Ti游戏至尊版
映众GTX750Ti游戏至尊版
25参测显卡之映众GTX750游戏战神版
● 参测显卡之映众GTX750游戏战神版
映众GTX750游戏战神版
26参测显卡之盈通GTX750Ti游戏高手
● 参测显卡之盈通GTX750Ti游戏高手
盈通GTX750Ti游戏高手
27参测显卡之盈通GTX750极速版
● 参测显卡之盈通GTX750极速版
盈通GTX750极速版
28参测显卡之翔升GTX750
● 参测显卡之翔升GTX750 1G D5
翔升GTX750 1G D5
29测试平台软、硬件环境一览
● 测试平台硬件环境一览
为保证测试能够发挥显卡的最佳性能,本次测试平台由Intel酷睿i7-3970X处理器、ANTEC H1200水冷散热器、技嘉X79芯片组主板、威刚4GB DDR3-1600×4四通道内存、ANTEC HCP-750电源组建而成。详细硬件规格如下表所示:
● 测试平台软件环境一览
为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 7正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用游戏自带Benchmark来衡量性能,数值同样越高越好。
30理论性能测试:3DMark FireStrike
● 理论性能测试:3DMark FireStrike
于北京时间2013年2月5日推出的新3DMark,采用全新界面设计,除了测试分数,还会展现每个场景测试期间的实时曲线,全程记录帧率、CPU温度、GPU温度、CPU功耗。新3DMark取消了传统的E、P、X模式,取而代之的是根据负载不同所推出的三个场景,其中FireStrike专为基于DirectX 11显卡搭建的高端游戏平台,而CloudGate则支持基于DirectX 10环境的主流硬件,IceStorm则支持入门级DirectX 9设备、手机、平板电脑等等。
3DMark FireStrike
通过3DMark FireStrike理论性能测试可以看出,在Extreme模式下,GeForce GTX 750Ti得分领先GeForce GTX 650Ti BOOST和Radeon R7-260X,由于GeForce GTX 750在测试中出现“爆显存”状况,因此成绩与GeForce GTX 650Ti/650、Radeon HD7770、R7-250/240一样无法进行对比。
31理论性能测试:3DMark 11
● 理论性能测试:3DMark 11
PC游戏随Windows 7的发布进入DirectX 11时代,众多DirectX 11显卡早已摩拳擦掌上阵厮杀,却迟迟没有一个权威性的基准测试软件来衡量游戏显卡DirectX 11性能的高低。终于,DirectX 11时代的3DMark 11来到大家面前。3DMark 11使用原生DirectX 11引擎,测试场景包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DirectX 11特性。
3DMark 11
通过3DMark 11理论性能测试可以看出,在Extreme模式下,GeForce GTX 750Ti得分领先Radeon R7-260X,略低于GeForce GTX 650Ti BOOST;GeForce GTX 750在得分上领先GeForce GTX 650Ti和Radeon HD7770。
32理论性能测试:Heaven Benchmark 4.0
● 理论性能测试:Heaven Benchmark 4.0
Heaven Benchmark 4.0是一款专门测试DirectX 11效率的软件,由俄罗斯Unigine游戏公司自主研发的引擎设计。该软件拥有类似阿凡达的悬浮岛场景,其中龙雕塑运用了细分曲面技术,抱括岛上的路径和房子的砖块等23个场景的测试得出显卡的最终实际效能,并通过DirectX 11环境带来很强的真实感。
Heaven Benchmark 4.0
通过Heaven Benchmark 4.0理论性能测试可以看出,在2560×1600分辨率、8倍抗锯齿、其它特效最高环境下,GeForce GTX 750Ti得分领先GeForce GTX 650Ti BOOST和Radeon R7-260X。由于GeForce GTX 750测试中出现“爆显存”状况,成绩无法进行对比。同时,Radeon R7-250/240两款产品无法在2560×1600分辨率下运行,因此在该项测试中没有成绩。
注意:Radeon R7-250/240随后测试中2560×1600分辨率环境下无成绩的原因与上面所述相同,特此声明,后面不再赘述。
33DirectX 11游戏测试:《孤岛危机2》
● DirectX 11游戏测试:《孤岛危机2》
《孤岛危机2》是《孤岛危机》的续作,游戏采用CryENGINE 3引擎制作。《孤岛危机2》在游戏内容上与一代也有很大变化,已经从秘密的丛林作战转向了公开、大规模的现代城市战争。故事发生在距一代3年后的2023年,外星人在地球上的大片区域挑起了战争,各大城市都遭到攻击,人口锐减,玩家将要进行捍卫地球的末日战争。
《孤岛危机2》
通过DirectX 11游戏《孤岛危机2》测试可以看出,在开启4倍抗锯齿、其它特效最高环境下,GeForce GTX 750Ti在两种分辨率下的平均帧数均领先Radeon R7-260X,略微落后于GeForce GTX 650Ti BOOST;GeForce GTX 750在两种分辨率下的平均帧数分别领先和等于GeForce GTX 650Ti。
34DirectX 11游戏测试:《古墓丽影9》
● DirectX 11游戏测试:《古墓丽影9》
《古墓丽影9》将讲述劳拉的首次冒险之旅,主角劳拉·克劳馥的年龄被设定在21岁,那时的她还只是一名刚出茅庐的新人,经验欠缺。随着游戏剧情的发展,玩家将与劳拉共同成长,获得新的武器和道具并习得新技能。在冒险的小岛上,玩家可以在营地对道具进行组合,有些特定区域就需要特定道具和技能才能通过。岛上的各个营地之间可以快捷传送,玩家无需长途跋涉。而除了劳拉外还将有其他角色出现在岛上。
《古墓丽影9》
通过DirectX 11游戏:《古墓丽影9》测试可以看出,在1920×1200分辨率环境下,GeForce GTX 750Ti平均帧数领先Radeon R7-260X,略微落后于GeForce GTX 650Ti BOOST;在2560×1600分辨率环境下,GeForce GTX 750Ti平均帧数略微落后于GeForce GTX 650Ti BOOST和Radeon R7-260X,GeForce GTX 750在两种分辨率环境下再次出现“爆显存”状况。
35DirectX 11游戏测试:《杀手:赦免》
● DirectX 11游戏测试:《杀手:赦免》
《杀手:赦免》采用IO Interactive自主研发的冰川2(Glacier 2)引擎制作,游戏内容都是在引擎下实时进行反馈的,所有动作都是即时生成的。新作主要场景发生在芝加哥,名为代号47的主角在本作中将更加灵活,更好控制。他将可以攀在悬崖边,还可以保持平衡,游戏融入了掩护系统,挟持人持的功能回归。
《杀手:赦免》
通过DirectX 11游戏《杀手:赦免》测试可以看出,GeForce GTX 750Ti在两种分辨率环境下的平均帧数均领先于Radeon R7-260X,并落后于GeForce GTX 650Ti BOOST;GeForce GTX 750在1920×1200分辨率环境下领先GeForce GTX 650Ti,在2560×1600分辨率环境下落后GeForce GTX 650Ti。
36DirectX 11游戏测试:《地铁:最后曙光》
● DirectX 11游戏测试:《地铁:最后曙光》
《地铁:最后的曙光》讲述一场为争夺足以毁灭人类的世界末日装置的内战。人类依旧苟活在地下等死,不同派系之间的战争还在继续,晚上依旧有各种变异生物潜伏在暗处。地面依旧是各种毒气,但有传言冰层开始融化,阳光开始穿透云层。
《地铁:最后的曙光》
通过DirectX 11游戏《地铁:最后的曙光》测试可以看出,在两种分辨率环境下,GeForce GTX 750Ti平均帧数领先Radeon R7-260X,略微落后和等于GeForce GTX 650Ti BOOST;GeForce GTX 750平均帧数均领先GeForce GTX 650Ti。
37DirectX 11游戏测试:《尘埃3》
● DirectX 11游戏测试:《尘埃3》
《尘埃3》是由Codemasters制作发行的一款赛车竞速单机游戏,《尘埃3》采用与《F1 2010》同样的Ego引擎,拥有更加拟真的天气系统及画面效果。游戏将包含冰雪场景、动态天气、经典的赛车、分屏对战、party模式、开放世界、更多真实世界中的赞助商和车手等特点。
《尘埃3》
通过DirectX 11游戏《尘埃3》测试可以看出,在两种分辨率环境下,GeForce GTX 750Ti平均帧数领先Radeon R7-260X,略微落后于GeForce GTX 650Ti BOOST;GeForce GTX 750平均帧数分别等于和落后于GeForce GTX 650Ti。
38DirectX 11游戏测试:《蝙蝠侠:阿甘之城》
● DirectX 11游戏测试:《蝙蝠侠:阿甘之城》
《蝙蝠侠:阿卡姆之城》(Batman: Arkham City)是2009年最佳动作游戏《蝙蝠侠:阿卡姆疯人院》的续作,由华纳兄弟出品,该作由Rocksteady工作室负责开发,世界架构仍然建立在《阿卡姆疯人院》的气氛上,不过这次上升至阿卡姆之城——高谭市内戒备森严的,关押了大量暴徒的监狱之中。新作汇集了众多明星参与的配音阵容以及蝙蝠侠中的极度凶残的恶棍,并改进和加强了一游戏特点,让玩家们拥有像《蝙蝠侠:黑暗骑士》一般的终极游戏体验。
《蝙蝠侠:阿卡姆之城》
通过DirectX 11游戏《蝙蝠侠:阿卡姆之城》测试可以看出,在两种分辨率环境下,GeForce GTX 750Ti平均帧数领先Radeon R7-260X,落后于GeForce GTX 650Ti BOOST;GeForce GTX 750平均帧数分别领先和落后于GeForce GTX 650Ti。
39DirectX 11游戏测试:《生化奇兵:无限》
● DirectX 11游戏测试:《生化奇兵:无限》
《生化奇兵:无限》将玩家带往1912年,那是巨型飞艇和浮空飞行器的全盛时期,在此背景下诞生了海底销魂城的前辈,即天空之城“哥伦比亚”:这座远离美国海岸自成一体的空中城市在信众的欢呼声中扶摇直上,寄托了美利坚强国之梦,但因其不可告人的目的使其似锦前程不久便急转直下,武装到牙齿的狰狞面目把原本光荣正确伟大的阿波罗登月变成邪恶的死星计划,整座城市消失在云端中自此再无人知晓。
《生化奇兵:无限》
通过DirectX 11游戏《生化奇兵:无限》测试可以看出,GeForce GTX 750Ti在1920×1200分辨率环境下的平均帧数领先Radeon R7-260X,落后GeForce GTX 650Ti BOOST;在2560×1600分辨率环境下的平均帧数落后Radeon R7-260X和GeForce GTX 650Ti BOOST;GeForce GTX 750的平均帧数则均落后于GeForce GTX 650Ti。
40温度/功耗及性能功耗比测试
● GeForce GTX 750Ti/750满载温度测试
GTX 750Ti满载温度
● GeForce GTX 750Ti/750满载功耗测试
● GeForce GTX 750Ti/750性能功耗比测试
通过测试可以看出,相比Kepler架构GeForce GTX 650Ti BOOST/650Ti,全新Maxwell架构GeForce GTX 750Ti/750的每瓦特性能分别提升了38%和46%,我们要再次重申这一进步是在工艺制程相同的前提下取得的。这种令人印象深刻的性能功耗比,正是Maxwell架构最大的优势和进步。
41生生不息 繁荣永续
● 生生不息,繁荣永续
无论是Maxwell架构还是基于GM107芯片的GeForce GTX 750Ti/750,我们都要给予很高的评价。NVIDIA对GPU架构的改进务实且卓有成效,通过改进架构并进一步提升单元复用率,同时更有效率的使用晶体管和能源,NVIDIA再次将GPU产品的每瓦特性能提升到了新的高度。
重设的SMM单元以及cache体系是GeForce GTX 750Ti/750以及本代NVIDIA显卡产品的核心要素,它们的出现再次增强了NVIDIA产品的竞争力。凭借SMM单元以及cache的各种全新设计,Maxwell架构拥有了超越Kepler架构的单元复用率以及任务执行效率,这种单元复用率和效率的极大提升为Maxwell架构带来了性能功耗比的再次飞跃。在Kepler时代,我们曾为NVIDIA的性能功耗比提升而雀跃,在即将到来的Maxwell时代,我们相信这种雀跃将得到切实的延续。
七彩虹iGame750Ti烈焰战神U
GeForce GTX 750Ti/750最大的进步意义,在于在同样工艺制成的前提下实现了以更低的能耗换来更棒性能的目的。它与前代的GeForce GTX 650Ti Boost均采用相同的28nm工艺且性能相近,但其芯片面积及功耗却均远小于后者,公版的GeForce GTX 750Ti甚至无需外接供电接口。这种不单纯依赖工艺制程,而是转向从逻辑结构合理性层面入手来寻求性能提升的方式,才是半导体逻辑电路进步的正确方向。
GeForce GTX 750Ti/750均属于出色的游戏显卡产品,它们的性能符合中端需求,能够在1080P分辨率上提供理想的游戏性能,同时功耗及温度控制出色,是一款适合普通的游戏玩家以及注重使用感受的常规用户的值得推荐的显卡。HTPC,普通家用PC以及常规游戏PC均是这两款显卡理想的发挥场所,网吧业者更可以凭借其出色的性能功耗比属性以及无外接供电的重要特性轻松快速地完成网吧硬件的升级,并快速的从显卡性能的大幅提升当中获益。
除此之外,GeForce GTX 750Ti/750的优秀性能功耗比还让其成为了steambox等客厅游戏平台的理想选择。在steambox这类体积小巧,在需要图形性能同时对功耗噪音等使用感受更加侧重的平台上,GeForce GTX 750Ti/750这类显卡的出现是及时而且必要的。steambox的竞争力,将会因为GeForce GTX 750Ti/750以及其他更多Maxwell架构产品的出现而进一步增强。
值得一提的是,GeForce GTX 750Ti/750的GM107基于“初代”Maxwell,该款架构的结构规模较小,仅拥有一个GPC,因此并不存在传统的一级宏观并行结构,对任务管理等资源的需求也并未上升到应有的高度,所以我们先期预测的改进型前端及一级仲裁机制并未在该架构当中出现,我们甚至可以称其为简化版的maxwell架构。随着时间的推移以及更新半导体工艺制程的部署,NVIDIA还将会推出更为完整且强大的Maxwell架构,后续到来的高端及旗舰级Maxwell产品还将会有进一步改进的空间,NVIDIA如何应对SMM所带来的新一级并行机制,是否会以此为契机来强化上级任务仲裁管理机制以便充分发挥Maxwell架构的效率,这是相当值得期待的未来图景。
GeForce GTX 750Ti/750以及全新的Maxwell架构的出现都是令人兴奋的,它们身上体现了正确的半导体逻辑结构进步方向,不仅给所有人带来了全新的希望与期待,同时向整个业界展示了显卡进步的不息动力和不懈追求。即便是在其他行业都进步乏力的前提下,GPU依旧能够在正确的方向上维持着自己快速的革新和演进,这不仅体现了GPU旺盛的生命力,同时也是我们以及每一个显卡爱好者所乐见的。所以在本文的结尾,我们打算以这样一句著名的台词来表达我们的内心感受——
GPU,may you live long and prosper。