1千元市场的新王者
千元级的中端市场曾经是一个“经典辈出”的地方,HD5770、9600GT、甚至是传奇一般的9600GSO和HD4850,总有那么一群显卡在这里迸发出耀眼的光芒。接受度更为广泛的价格以及较为“适度”的性能表现,让千元混战始终都能牢牢地抓住更多用户尤其是中国用户们的眼球。2012年10月9日,这一市场迎来了一位新的入住者,GeForce GTX 650 Ti来了。
伴随着GK106的发布,NVIDIA在Kepler时代的架构线布局终于在3周前完成了。以GK104/106/107这一4变3的全新架构线为骨架,NVIDIA在旗舰级、甜品级以及低端市场的产品布局也已基本完成,整个Kepler市场布局的拼图现在只剩中端市场这一块空白。能不能在缺少一款架构的前提下将整条产品线填充完全,这样的问题始终萦绕在我们的心头。3周后的今天,NVIDIA终于携GeForce GTX 650 Ti来为我们补完这最后的一块拼图了。
作为一款面向上位中端级定位的产品,GeForce GTX 650 Ti所面临的需求跟以往有了巨大的差异。随着技术的进步,1920分辨率已经成为了当前保有量最大的显示器主流分辨率,分辨率的提升为中端显卡的性能提出了更高的要求。是继续将性能等级停留在满足1680甚至更低分辨率的水平上,还是积极的面对新的市场需求,提供全高清分辨率显示器需要的更强的性能,这是摆在GeForce GTX 650 Ti面前的一大问题。
除此之外,竞争对手AMD早在半年前便以HD7700完成了新一代中端显卡产品的布局,但HD7700与HD7800之间存在着不小的空档。GeForce GTX 650 Ti的性能是否足够挑战竞争对手?它又能否利用AMD的市场空档进行一次成功的突袭呢?在今天的测试中,我们将为大家揭晓这些问题的答案。
2GTX650Ti规格总览
● GTX650Ti规格总览
GeForce GTX 650 Ti采用了基于Kepler图形构架的GK106核心,它拥有221平方毫米的芯片面积。与GeForce GTX 660相比,GeForce GTX 650 Ti运算资源总量从960个ALU下降到了768个,Texture Filter Unit由80个减少到了64个,构成后端的ROP从24个下降到了16个。与ROP相对应的,GeForce GTX 650 Ti的MC结构也变成了2个64bit双通道显存控制器,显存位宽128bit,显存容量1024MB。
GeForce GTX 650 Ti 显 卡 对 位 产 品 规 格 比 较 表 | |||||
显卡型号 | GeForce GTX 650 Ti | GeForce GTX 650 | Radeon HD 7770 | Radeon HD 7750 | GeForce GTX 660 |
市场定价* | 1099元 | 799~899元 | 999元 | 799~899元 | 1799 元 |
GPU代号 | GK106 | GK107 | CapeVerde | CapeVerde | GK106 |
GPU工艺 | 28 nm | 28 nm | 28 nm | 28 nm | 28 nm |
GPU晶体管 | ?亿 | 13 亿 | 15 亿 | 15 亿 | ?亿 |
着色器数量 | 768 | 384 | 640 | 512 | 960 |
着色器组织 | 1D*768 | 1D*384 | Vector*640 | Vector*512 | 1D*960 |
ROPs数量 | 16 | 16 | 16 | 16 | 24 |
纹理单元数量 | 64 | 32 | 40 | 32 | 80 |
核心频率 | 925 MHz | 1058 MHz | 1000 MHz | 900 MHz | 980 MHz |
着色器频率 | 925 MHz | 1058 MHz | 1000 MHz | 900 MHz | 980 MHz |
理论计算能力 | 1.42 TFLOPs |
0.81 TFLOPs |
1.28 TFLOPs |
0.92 TFLOPs |
1.88 TFLOPs |
等效内存频率 | 5400 MHz | 5000 MHz | 4500 MHz | 4500 MHz | 6008 MHz |
内存位宽 | 128 bit | 128 bit | 128 bit | 128 bit | 192 bit |
内存带宽 | 84.6 GB/S | 72 GB/s | 72 GB/s | 72 GB/s | 144.2 GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
内存容量 | 1024 MB | 1024 MB | 1024 MB | 1024 MB | 2048 MB |
DX版本支持 | 11.1 | 11.1 | 11.1 | 11.1 | 11.1 |
HD视频技术 | PureVideo HD+NVENC | PureVideo HD+NVENC | UVD3+VCE | UVD3+VCE | PureVideo HD+NVENC |
通用计算接口 | CUDA | CUDA | Stream | Stream | CUDA |
GeForce GTX 650 Ti可以被视为完整的GK106芯片屏蔽一整组GPC的产物,它拥有2组完整的GPC,其同频几何能力、数学能力以及材质能力均为旗舰级架构的一半,功能特性则与旗舰级架构相同,我们完全可以将其看做刚好一半大的GK104。
公版GeForce GTX 650 Ti的默认核心频率为925MHz,默认显存频率为5400MHz。由于NVIDIA并未严格限制产品规格,因此首发版产品的频率通常都高于这一数值。另外,值得注意的是GeForce GTX 650 Ti并不支持GPU Boost功能,其频率以及性能不会随运行状态的改变而改变。
既然我们可以将GeForce GTX 650 Ti看做是缩小一半的GK104,那我们不妨先来回忆一下Kepler架构的各种通用特性,这将有助于我们了解GeForce GTX 650 Ti的架构细节。
3ALU团簇改进:SMX单元
● ALU团簇改进:SMX单元
SM曾经是NVIDIA GPU的ALU团簇基本单元,这一单元在Kepler中的改进十分巨大,NVIDIA采用的全新的SMX单元彻底改变了传统的SM单元的内涵。
Kepler架构所采用的SMX单元与Fermi的SM单元在逻辑结构上十分近似,都拥有完整的几何前端,线程仲裁机制,ALU团簇,Texture Array以及unified cache/shared和Register。除了没有后端之外,一个SM/SMX单元在结构上可以说趋近等同于一颗标准GPU。
GK104逻辑构架
与Fermi的SM单元规模对应线程粒度单位warp(32 ALU VS 32 Thread)不同,Kepler的SMX单元急剧放大了ALU团簇的整体规模,其ALU总量从过去的32个增加到了192个。与此同时,SMX单元的线程仲裁管理机制也得到了放大。负责线程分派和发放管理的Warp Scheduler从过去的两个增加到了4个,与之对应的Dispatch Unit从过去的2个增加到了8个,Warp Scheduler与Dispatch Unit的比例提升到了1:2,这些举措可以有效的改善单元规模增大带来的线程分派及管理压力。
SMX单元结构
在放大ALU团簇以及线程仲裁机制的同时,NVIDIA还进一步放大了与ALU团簇对应的Register。根据NV提供的资料,Kepler中每个SMX的Register较之Fermi的SM放大了一倍,达到了65536X32bit的规模。
在Unified Cache体系方面,Kepler与传统的Fermi在结构上没有多大的差异,其L1/shared以及L2 cache的大小和比例均未发生变化,仍旧维持64K的L1/Shared以及128K/MC的L2尺寸。整个体系中最值得关注的变动来自L2 cache速度以及带宽的提升,NVIDIA称GTX680的L2 cache目前运行在分频状态下,默认运行频率是核心频率的一倍,这为GTX680提供了比过去大得多的L2带宽,这为通用计算性能以及Texture性能的提升创造了有利的条件。
更为强劲的SMX性能
更大的ALU规模、更多的线程仲裁机制以及更大的寄存器缓冲为SMX带来了全新的性能表现,新的逻辑设计让Kepler的运算单元拥有了远强于Fermi的性能
4全新Scheduling过程
● 全新Scheduling过程
除了SMX单元的出现之外,在整个Kepler构架中产生影响最为深远的改进来自任务调度以及仲裁过程的变化。
GPU的逻辑结构决定了它并不适合被用来执行关联度过高过深的条件分支过程,因此对于任务的关联性检查是整个GPU任务队列执行过程中一个非常重要的步骤。在以Fermi为代表的传统仲裁体系中,任务会在解码过程之后完成指令的关联性检查,如果指令存在超过一定限度的关联性,为了规避条件分支对性能产生的影响,这些指令会被重新打包以便ALU团簇进行吞吐。在完成这些关联性检查之后,明确执行方向的指令才会被送入流水线中进行执行。为了加快这一过程的速度,Fermi构架为这个过程提供了Multiport Post decode Queue以及对应Register的硬件支持。
Kepler构架与Fermi构架执行Scheduling过程的差异
在Kepler构架中,这一传统的过程发生了很大的变化,NVIDIA®称在Kepler中任务会在解码之前根据Sched.info进行选择,然后直接进行解码并被送入流水线中完成后续处理。整个关联性检查以及指令重组等过程被一个简单的Sched.info-select所取代。在该过程下,指令从解码到执行几乎没有延迟,整个流水线因此获得了更高的执行效率。
Kepler与Fermi架构对处理器依赖性测试
由于新的Scheduling过程在CPU中基于软件形式完成,因此传统Logic controller中与Pre-Scheduling相关的硬件,比如Fermi中的Multiport Post decode Queue(解码后队列)以及对应的Register(寄存器)等等DCA(Dependency check Architecture,负责依赖性检查的逻辑结构)也就没有了存在的必要,它们所占用的晶体管资源可以被释放出来,Logic controller的规模也因此得以大幅削减。尽管目前的Pre-Scheduling只涉及中等以下关联性的延迟可预期指令的检查,并没有完全取代全部的Scheduling动作,关联度较深的指令依旧需要传统的硬件DCA来快速执行,但这一改进还是促使NVIDIA®将SMX中Warp Scheduler的密度削减到了Fermi的1/3。
Fermi架构SM单元内部的Scheduler以及Dispatch Unit比例
除此之外,Pre-Scheduling让指令从解码到执行之间的过程变得更加简洁,从线程进入SMX到抵达ALU进行执行这一过程的延迟也被降低。延迟的缩短缓解了线程派发效率带来的负担,让硬件不再需要配备大量的分派资源来提升任务分派的效率,以便抵充前面延迟所带来的性能损失,因此SMX单元中的Dispatch Unit密度也随之得以降低。在SMX中,NVIDIA®配给的Dispatch Unit密度只有Fermi的66%。
DCA的大量削减以及Warp Scheduler和Dispatch Unit密度的下降促成了Logic controller的的最终瘦身,这不仅直接导致了NVIDIA®可以放心大胆的扩张SMX单元的规模,将更多ALU资源纳入到GPU体系中去,更成功的将传统DCA硬件运行过程的功耗转移到了CPU当中。有了更多直接运算资源带来的性能,同时功耗矛盾也得到了缓解,GK104超过Fermi以及Tahiti的性能功耗比也就不是什么奇怪的事情了。
Kepler构架Pre-Scheduling过程变化(图片修改自后藤弘茂先生博客)
Kepler的表现非常直观地反映了NVIDIA®解决问题的哲学,不论Pre-Scheduling还是GPU Boost,它们都具有将某些内部无法解决的矛盾转移到外部环境中并寻求适当的方式加以解决的特征。拥有这种弹性的思维模式的NVIDIA®显然没有进入僵化以及固步自封的状态,这让NVIDIA®最终得以克服了大量的困难,为我们奉上了一款性能功耗比以及绝对性能均十分出色的图形架构。
5第二代几何处理引擎
● 第二代几何处理引擎
在上一代的Fermi构架中,NVIDIA®为每个SM都配备了完整的PolyMorph Engine(几何处理引擎),16个SM单元意味着Fermi拥有16个能够进行Tessellation处理的几何引擎。在Kepler中,由于SMX单元结构的巨变以及总量的减少,8个SMX单元理论上仅能对应8组几何引擎,因此NVIDIA®对PolyMorph Engine进行了改进,使之能够在总量减少的前提下维持性能。
PolyMorph Engine 2.0以及线程仲裁机制
PolyMorph Engine 2.0引擎在结构上与PolyMorph Engine 1.0差异不大,均由Vertex Fetch、Tessellator、Viewport Transform、Setup以及Output单元构成。但在PolyMorph Engine 2.0引擎中,NVIDIA®加大了Tessellator单元的规模,同时还借鉴了AMD在Cayman以及Tahiti中的经验,通过优化线程以及Stream流的方式进一步加强了PolyMorph Engine在低负载下的几何处理能力。
完整版GK104曲面细分性能
通过改进,PolyMorph Engine 2.0拥有了2倍于Fermi的单位性能,这使得GK104在PolyMorph Engine数量减少一倍的前提下依旧维持了极为强劲的几何性能和高负载下较低的性能衰减,同时在低负载下的几何性能也变得更加高效。
6Adaptive VSync——自适应垂直同步
● Adaptive VSync——自适应垂直同步
Adaptive VSync是NVIDIA®在Kepler中引入的另一个重要新功能。其最大的意义,在于改变传统垂直同步分段式的帧数管理模式,用更加平滑的帧数曲线来最大限度的避免画面撕裂的情况发生。
传统的垂直同步依旧会带来画面撕裂和顿挫的问题
在传统的垂直同步设定中,帧数一般会被机械的划分成30以及60帧两档,当游戏帧数大于60帧时,垂直同步程序会将帧数限定在60帧,而当游戏实际帧数跌落到60帧以内时,垂直同步会将帧数限定成30帧。巨大的帧数落差不仅会给玩家们的游戏过程带来明显的顿挫感,同时还会导致画面撕裂等问题的出现,这不仅影响了游戏过程本身,更与垂直同步技术本身消除画面撕裂的初衷相悖。
GK104的Adaptive VSync技术
在Adaptive VSync中,NVIDIA®打破了传统垂直同步技术对帧数下限的限制,当游戏帧数低于60帧之后,Adaptive VSync将会尽量让帧数维持在当前水平,而不是像过去那样直接进入30帧档位。而当游戏帧数大于60帧时,传统的垂直同步机制依旧会发挥作用,游戏帧数依旧会如果去那样被限定在60帧上。
Adaptive VSync选单
相比与传统的垂直同步,Adaptive VSync技术能够带来更加平滑的帧数体验,避免帧数突然暴跌带来的最小帧问题,提升整个游戏的流畅度体验。在此基础上,Adaptive VSync并没有干扰帧数大于60时垂直同步机制的正常工作,因此从深层意义上来讲,Adaptive VSync才是真正实现垂直同步初衷的帧数控制机制。
7出乎意料的p2p——GTX650Ti拆解
● 出乎意料的p2p——GTX650Ti拆解
精简和短小,是我们与整个Kepler体系产品接触时最多的感受,因此GeForce GTX 650 Ti短小的身形并没有让我们感到太多意外。真正出乎我们意料的,是其所采用的PCB方案竟然与基于GK107芯片的GeForce GTX 650完全相同。
GeForce GTX 650 Ti
PCB方案的相同意味着芯片焊接针脚的P2P(点对点)兼容,也就是说GK107芯片在设计之初,其芯片针脚的定义就已经与GK106保持了一致。由此可见,整个Kepler系列产品的规划方案,在最初就是一个完整的相互关联的体系。
GeForce GTX 650 Ti采用的GK106-220核心
由于采用了相同的PCB方案,NVIDIA GeForce GTX 650 Ti采用同NVIDIA GeForce GTX 650相同的2+1相供电设计(核心2相、显存1相),元器件采用全固态电容以及全铁素体电感,外接单6pin外接供电接口。
NVIDIA GeForce GTX 650 Ti搭载海力士GDDR5高速显存颗粒,显存容量1024MB,显存带宽128bit,默认频率为5400MHz。
NVIDIA GeForce GTX 650 Ti采用双DVI+HDMI输出组合,与更高级别NVIDIA显卡的区别是取消了DisplayPort视频输出接口。
8索泰650Ti-1G雷霆版
● 索泰650Ti-1G雷霆版
索泰650Ti-1G雷霆版
9七彩虹iGame650Ti烈焰战神X
● 七彩虹iGame650Ti烈焰战神X
七彩虹 iGame650Ti 烈焰战神X D5 1024M
10昂达GTX650Ti典范
● 昂达GTX650Ti典范
昂达GTX650Ti典范
11翔升GTX650Ti+金刚版
● 翔升GTX650Ti+金刚版
翔升GTX650Ti+金刚版
12映众GTX650Ti游戏至尊版
● 映众GTX650Ti游戏至尊版
映众GTX650Ti游戏至尊版
13微星N650Ti Hawk
● 微星N650Ti Hawk
微星N650Ti Hawk
14影驰GTX650Ti黑将
● 影驰GTX650Ti黑将
影驰GTX650Ti黑将
15耕昇GTX650Ti赵云版
● 耕昇GTX650Ti赵云版
耕昇GTX650Ti赵云版
16更多品牌GTX650Ti展示
● 更多品牌GTX650Ti展示
铭瑄GTX650Ti巨无霸
17测试平台软硬件环境简介
● 测试平台软硬件环境简介
性能测试使用的硬件平台由Intel Core i7-3960X、X79 Chipset和4GB*4四通道DDR3-1600内存构成。细节及软件 环境设定见下表:
测 试 平 台 硬 件 | |
中央处理器 | |
Intel Core i7-3960X | |
(6核 / 12线程 / 100MHz*33 / 15MB L3 Cache ) | |
散热器 | |
Intel RTS2011LC | |
(原厂水冷散热器 / 选配件 ) | |
内存模组 | |
Samsung 黑武士 DDR3-1600 4GB*4 | |
(SPD:9-9-9-24-1T) | |
主板 | |
ASUS Rampage IV Extreme | |
(Intel X79 Chipset) | |
硬盘 | |
Hitachi 1T | |
(1TB / 7200RPM / 16M 50GB NTFS | |
电源供应器 | |
NERMAX 白金冰核 1500W | |
(CSCI Platinum 80Plus / 1500W) | |
显示器 | |
DELL UltraSharp 3008WFP | |
(30英寸LCD / 2560*1600分辨率) |
为保证系统平台具有最佳的稳定性,此次硬件评测中所使用的操作系统均为Microsoft Windows 7 正版授权产品。使用Windows 7正版软件能够获得最好的兼容性以及系统升级更新服务。
用户在体验或购买安装Windows 7的操作系统时请认准所装系统是否已经获得正版授权许可!未经授权的非正版软件将无法获得包括更新等功能在内的Windows 7服务。
操 作 系 统 及 驱 动 | |
操作系统 | |
Microsoft Windows 7 Ultimate RTM SP1 | |
(64bit / 版本号7601) | |
主板芯片组驱动 | |
Intel Chipset Device Software for Win7 | |
(WHQL / 版本号 9.2.3.1022) | |
AMD 显卡驱动 | |
AMD Catalsyt | |
(官方正式版 / 版本号 12.8) | |
NVIDIA 显卡驱动 | |
NVIDIA Forceware | |
(Beta / 版本号 306.38) | |
|
桌面环境 |
2560*1600_32bit 60Hz |
在本次测试中,我们沿用了参测游戏项目的分布情况,减小DirectX 9/10游戏的测试部分,加大了DirectX 11及较新发售的游戏的比重。具体变更如下:以《暗黑破坏神3》取代《魔兽世界》测试,取消了因uplay升级而无法正常进行的《H.A.W.X 2》测试,取消了较老的《Crysis》以及《Farcry2》测试,分别用DirectX 11游戏《幕府将军2:武士之殇》、《Dirt 3》、《蝙蝠侠:阿克汉姆之城》以及《上古卷轴5:天际》来替换上述游戏及其他被取消游戏进行测试。经过调整,非DirectX 11游戏在测试游戏中的总数下降到了2款,这将会让整体测试结果更加贴近当前应用更新的趋势。我们将会在今后的测试环节中保留这样的测试布置。
18理论性能测试:3DMark Series
● 理论性能测试:3DMark Series
3DmarkVantage及3Dmark11是Futuremark推出的显卡3D性能测试,两款软件分别针对DirectX 10及DirectX 11显卡。测试成绩主要由显卡测试和CPU测试两部分总和构成,整个测试软件更加偏重整机性能。
3Dmark Vantage
3Dmark 11
3Dmark Vantage X模式测试
3Dmark 11 X模式测试
在理论测试环节,GeForce GTX 650 Ti表现出了与其定位相称的性能,明显领先于竞争对手HD7770。
19非DirectX 11游戏测试:暗黑破坏神3
《暗黑破坏神3》是著名动作角色扮演游戏《暗黑破坏神2》的续作,游戏故事发生于《暗黑破坏神2》的20年之后。玩家可以在五种不同的职业中进行选择,每种职业都有一套独特的魔法和技能。玩家在冒险中可以体验丰富多样的设置、感受史诗般的故事情节,挑战无以计数的恶魔、怪物和强大的BOSS,逐渐累积经验,增强能力,并且获得具有神奇力量的物品。
暗黑破坏神3
我们采用的测试场景选择伪第三幕戍卫要塞的第一个任务——点燃篝火。该场景存在大量激烈群战以及快速场景切换,场景地形复杂且变化较多,玩家在进行这里的游戏时会经历比平时更大幅度的FPS变化。测试方法为获得首个任务之后移动到天冠城垛入口并开始记录帧数,然后以相同的由近至远的顺序点燃篝火并以相同单一技能与沿途敌人进行战斗且消灭之,直至最后一个篝火被点燃为止。测试平均时长417秒,测试进行3次,取平均帧数作为测试结果。
以一款定位中端的显卡来说,能够在1920分辨率下完美的应付暗黑3应该是很不错的表现了。我们建议采用GeForce GTX 650 Ti打开自适应垂直同步选项,以便获得更好的游戏体验。
20非DirectX 11游戏测试:Call of Duty MW3
● 非DirectX 11游戏测试:Call of Duty MW3
由动视暴雪于2011年11月初发布的使命召唤:现代战争3延续了前作的诸多特色,其完美的剧情创造了良好的代入感。图形引擎方面则沿用和改进了已经服役两年的IW4.0+引擎,因此拥有良好的硬件“亲和力”。
使命召唤8
我们选择游戏第一关过场动画结束主角翻车至玩家再次恢复控制之间的即时渲染部分作为测试场景,无人为控制干扰因素,测试时长50秒,测试执行3次,取期间的平均帧数作为最终测试结果。
GeForce GTX 650 Ti在第一人称视角射击游戏中的表现同样令人满意,超过60帧但又不过剩的平均帧数完全可以用“适宜”来形容。
21DirectX 11游戏测试:Crysis2
● DirectX 11游戏测试:Crysis2
《孤岛危机2》是《孤岛危机》的续作,游戏采CryENGINE 3引擎所制作,故事发生在距一代3年后的2023年。外星人在地球上的大片区域挑起了战争,各大城市都遭到攻击,人口锐减,玩家将要进行捍卫地球的末日战争。
孤岛危机2
我们采用Crysis2 BenchmarkTool来完成测试,场景选择Downtown,测试进行三次,取最高成绩作为最终测试结果。
画面标杆Crysis2亦可在1920分辨率下达到30帧的测试结果,让我们对GeForce GTX 650 Ti的性能有了更加深刻的认识,中端显卡不适应顶级游戏需求的时代已经过去了。
22DirectX 11游戏测试:Metro 2033
● DirectX 11游戏测试:Metro 2033
本作题材基于俄罗斯最畅销小说Dmitry Glukhovsky。由乌克兰4A游戏工作室开发,采用4A游戏引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,世界被一次灾难性事件毁灭,几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所里,人类文明进入了新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。
地铁2033
我们采取游戏提供的Benchmark程序来完成测试,该Benchmark所包含的场景具有光照系统,烟雾系统,DOF表现以及秘籍交战场景,能够全面反映显卡在面对Compute Shader以及超高分辨率材质时的表现。
地铁2033一如既往的在我们的测试中充当了“黑脸”的角色,DOF领先的各种特效的压迫只有顶级显卡才能应付,在这里强求GeForce GTX 650 Ti这样的千元级显卡并不合适。
23DirectX 11游戏测试:幕府将军2武士之殇
● DirectX 11游戏测试:幕府将军2武士之殇
《幕府将军2:武士之殇》背景设在在关原之战四百年后,19世纪的日本再次陷入动乱,引进西洋兵器军制的尊皇派与代表守旧武士传统的江户幕府剑拔弩张,大战一触即发。 西洋列强三国英法美将在游戏中出场,坚船利炮轰开国门,激起了一场改变日本国运的血腥内战。玩家将从6个重要强藩中选择一家,为各自所持的正义而战。
幕府将军2:武士之殇
我们采用运行游戏自定义历史战役第一关开场即时渲染部分的方式来完成测试,测试由开始战役起至进入玩家控制环节为止,整个过程包含大量人物角色、植被、复杂模型等渲染需求,无人为控制干扰。测试进行三次,取三次平均值作为最终结果。
在幕府将军2:武士之殇这样注重大场景复杂环境刻画的游戏中,GeForce GTX 650 Ti很明显的触碰到了fillrate瓶颈,我们建议用户在该游戏中适当降低分辨率,以便缓解MC及ROP不足带来的性能损失。
24DirectX 11游戏测试:LostPlanet 2
● DirectX 11游戏测试:LostPlanet 2
《失落的星球2》背景设在原来第一季的十年后。气候变化融化冰雪覆盖的大陆,创造了新的环境,如丛林。在EDN-3rd的改变下,10年过去了。地球发生了重大改变,冰川已经融化,热带丛林,沙漠冷酷无情。玩家将进入新的环境,与雪贼战斗,以抓住不断变化的地球控制权。玩家将控制他们的英雄跨越6个相互关联的事件,创造一个真正独特的互动体验。有了这个概念,玩家将会有机会从不同的发展角度来动态的改变故事情节。
失落星球2
我们采用游戏自带的Benchmark来完成测试,测试进行三次,取三次平均值作为最终结果。
在失落星球2的测试中,GeForce GTX 650 Ti再次恢复了流畅同时不过剩的性能表现,中端显卡产品应该具备的“适宜”的性能表现,在这里得到了很好地体现。
25DirectX 11游戏测试:Dirt 3
● DirectX 11游戏测试:Dirt 3
《Dirt 3》是Codemasters制作发行的一款赛车竞速单机游戏,作为AMD Gaming Evolution的一款游戏,它采用与《F1 2010》同样的Ego引擎,支持DirectX 11 API,拥有更加拟真的天气系统及画面效果。游戏将包含冰雪场景、动态天气、YouTube上传、经典的赛车、分屏对战、party模式、开放世界、更多真实世界中的赞助商和车手等特点。
我们采用游戏自带的Benchmark来完成测试,最终结果以显示平均帧数为准。
帧数在45~60之间,完全适度的流畅体验,GeForce GTX 650 Ti在Dirt3中的表现不仅与HD7770形成了鲜明对比,同时也再次为我们展现了中端显卡的本质特性。
26DirectX 11游戏测试:蝙蝠侠2
● DirectX 11游戏测试:蝙蝠侠阿克汉姆之城
蝙蝠侠:阿甘之城(Batman: Arkham City)是2009年最佳动作游戏《蝙蝠侠:阿甘疯人院》的续作,由华纳兄弟出品,该作由Rocksteady工作室负责开发,世界架构仍然建立在《阿克汉姆疯人院》的气氛上,不过这次上升至阿克汉姆之城——高谭市内戒备森严的,关押了大量暴徒的监狱之中。新作汇集了众多明星参与的配音阵容以及蝙蝠侠中的极度凶残的恶棍,并改进和加强了一游戏特点,让玩家们拥有像《蝙蝠侠:黑暗骑士》一般的终极游戏体验。
蝙蝠侠:阿克汉姆之城
我们采用游戏自带Benchmark进行性能测试。测试进行三次,取三次平均值作为最终结果。
在蝙蝠侠2:阿克汉姆之城的测试中,GeForce GTX 650 Ti继续保持了对HD7770的明显超越。
27DirectX 11游戏测试:上古卷轴5
《上古卷轴5:天际》是Bethesda五年磨一剑的《上古卷轴》系列新作,Bethesda将提供充满无限期待与幻想的诺德大陆,本作将会和上古卷轴4拥有同等大小的地图。在这广阔的地图之上,Bethesda工作室给玩家提供了超过120个不重复的地下迷宫,以及5个规模宏大的城市供玩家探索,而玩家将在这个奇异自由的世界踏上史诗性的征程,使用自己心仪的武器装备自己擅长的技能,去和巨兽,飞龙战斗。前作作为引领PC硬件新潮流的RPG,续作的配置则平易近人,不过Bethesda依然为该作注入了新元素,那就是新引擎“创造”打造的重峦叠嶂的规模与细节的华丽。
上古卷轴5:天际
我们采用运行游戏开始场景直至马车进入村庄且玩家恢复对角色控制为止,并记录过程平均帧数的方式来完成测试,测试过程无人为控制干扰。测试进行三次,取三次平均值作为最终结果。
上古卷轴5更加偏向于对材质性能的考验,得益于Kepler体系的优秀架构,GeForce GTX 650 Ti在该游戏中依旧维持了适度流畅的表现。
28DirectX 11应用测试:天堂3.0
● DirectX 11应用测试:天堂3.0
《Heaven Benchmark 3.0》是由俄罗斯Unigine游戏公司开发设计的一款Benchmark程序的最新版本,该程序是由Unigine公司自主研发的游戏引擎设计,支持DirectX 9、DirectX 10、DirectX 11与OpenGL 3.2 API,通过数十个场景的测试最终得出显卡的实际效能。
天堂3.0
天堂3.0的测试为GeForce GTX 650 Ti的性能测试环节画上了句号,它依旧表现出了适合自己定位以及初衷的性能,既确保领先竞争对手HD7770,又不会出现过剩的问题。
29游戏性能综合比率
● 游戏性能综合比率
我们收集了全部9款参测游戏以及天堂3.0的帧数数据,以GeForce GTX 650 Ti为基础(100%)将在游戏中的表现与所有参测显卡进行了一一对比,下面就是所有参测显卡在全部测试游戏中相对于GeForce GTX 650 Ti性能比率的平均值。需要注意的是我们并未对天堂3.0进行关闭抗锯齿的测试,因此noAA组数据并不包含该数据。
数据统计结果显示,GeForce GTX 650 Ti的综合游戏性能大体上位于HD6870~HD6850之间,在开启AA的前提下,其性能领先HD7770超过15%,关闭AA设置下则加大到了20%左右。从性能层面出发,GeForce GTX 650 Ti对HD7770的性能优势还是明显的。
30furmark平台功耗及满载温度情况
● furmark平台功耗及满载温度情况
在功耗温度测试环节,我们采用Furmark满载的方式让显卡达到全负荷工作的方式,来收集GeForce GTX 650 Ti的满载平台功耗以及温度数据。
GeForce GTX 650 Ti平台待机功耗
由于同样采用GK106架构的芯片,GeForce GTX 650 Ti的满载平台功耗与GeForce GTX 660相差无几,那么平台在实际游戏中的功耗状况又是怎样的呢?
31实际性能功耗比及性价比情况
同之前在GeForce GTX 660/650首测中采用的方式相同,我们分别以1W和5W为单位电量,精确记录测试平台在游戏测试过程中消耗1W以及5W电量所消耗的时间,以此来求的平台的每秒电量消耗状况,并以此来求得平台每小时消耗电量的情况。由于目标值固定,场景和负载对功耗的影响会被正确的反映在最终的时间数据中,因此我们获得的数据可以最大限度的避免低可重复性导致的错误数据陷阱,反映游戏测试过程中平台以及显卡最真实的功耗状态。以下就是我们通过该方法得出的GeForce GTX 650 Ti以及Radeon HD7770在相同测试平台下运行不同游戏时的真实平台功耗值。
通过更真实的游戏运行过程功耗情况,我们以实际游戏帧数为基础分别计算出了GeForce GTX 650 Ti以及Radeon HD7770针对不同游戏的性能功耗比以及性能价格比,亦即每瓦特功耗能够产生的帧生成速率以及每元人民币能够产生的帧生成速率。
由于并不具备GPU Boost功能,GeForce GTX 650 Ti的性能功耗比无法达到高阶Kepler的最佳表现,其游戏实际功耗相对较高而且出现了常规显卡拥有的波动,但得益于其出色的性能表现,其最终的性能功耗比依旧能够超越作为竞争对手的HD7770,并且与出色的首发定价一起创造了极高的性价比数值。
32测试总结:NVIDIA的“突出部战役”
● 测试总结:NVIDIA的“突出部战役”
突出部战役是第二次世界大战期间西线最大的阵地反击战,由于1944年冬季的美军在阿登地区只有4个师且无工事依托的薄弱防御,纳粹德国利用这一契机越过防线发动反击并取得了先期胜利,他们撕开美军防线,向西推进出了一个纵深约100公里、宽30公里的狭长突出部地区。如果突出部进一步延伸,欧洲大陆上的美军将被切断补给线并陷入绝境。但是突出部地带过于狭长,所以在美军重整战线之后,巴顿指挥的第三集团军于突出部南侧展开了大规模反攻并成功击退了德军。突出部战役之后,希特勒再无后备力量可以补充,德军在西线也已无力阻档盟军的前进了。
2012年的显卡市场与二战中的欧洲西线战事是非常相近的。AMD先期完成了整条GCN产品线的布局,NVIDIA则在AMD完成布局之后才开始透过Kepler的陆续发布实现反击并成功收复失地。在GeForce GTX 650 Ti到来之前,中端市场对于NVIDIA来说就如同未设防的阿登地区。尽管在其他战线上表现卓越,但中端市场的分断以及对手HD7700产品的楔入始终是一个威胁。而以我们今天的测试结果来看,GeForce GTX 650 Ti确实如同巴顿将军的第三集团军一样,成功地抓住突出部纵深过大的弱点对AMD发起了一次漂亮的侧击攻势。
在先期进行的诸多AMD显卡产品测试中,我们曾经多次对AMD的整条产品线布局进行过预警。由于Tahiti与Pitcairn的相互挤压,HD7900与HD7800之间的差距过于紧密狭小,而HD7800与HD7700之间的空档又过于松散和绵长,虽然HD7700先期占领了对手没有新品的市场空档,但固守市场分级而非需求定位的策略所导致的不合时宜的首发价格不仅无法给消费者带来好处,近50%性能差距的漫长战线就好像狭长的突出部地带一样充满被侧击的风险。这种头重脚轻的产品线布局隐患,最终还是被NVIDIA抓住了。
因错误市场运作方式而被牵连的CapeVerde核心
GeForce GTX 650 Ti的性能领先HD7770达15%,同时又与更上层的HD7850保持了近30%的性能差距,这一空档的切入让AMD的中端市场陷入了尴尬的境地。已经是GHz Edition的HD7770很难通过常规手段的将自身性能提升到与GeForce GTX 650 Ti相当的水平,而如果以HD7850为蓝本通过削减性能来应对,又要面对芯片及产品供应能力和成本限制的问题。在如此困难的前提下,如何以更加合理的方式来应对GeForce GTX 650 Ti的侧击,尽快弥合这一历经半年仍未被修补的巨大软肋,是AMD当前最迫切的任务。
以性能以及定价综合衡量,GeForce GTX 650 Ti的表现无疑是优秀的。它第一次以中端显卡的身份成功满足了1920分辨率的性能要求,为绝大多数游戏带来了45~60帧这样一个流畅但并不过剩的帧数体验,达到了适应需求变化并予以满足的目的,而这一切的代价又是1099这一并不过分的售价。结合它对HD7700系列准确且充分的侧击,我们认为GeForce GTX 650 Ti是NVIDIA在Kepler时代市场定位最为出色的一款产品。
当然,GeForce GTX 650 Ti并非完美,它并不具备Kepler赖以成名的GPU Boost功能,这让它在功耗和性能功耗比层面受到了一定的限制。它的MC和ROP削减的较为严重,因此虽然可以满足1920分辨率的大部分需求,但也仅能止步于此,开启AA或者进一步提高分辨率都会给它带来较大的负担。另外,GeForce GTX 650 Ti虽然成功的在定价和性能层面对HD7770造成了侧击,但它与GeForce GTX 660之间的差距同样存在过大的问题,如果控制不当,AMD完全有机会抓住空档进行一次“反冲击”。如何解决这些问题,同样是NVIDIA必须面对的。
以GeForce GTX 650 Ti为标志,AMD与NVIDIA在GCN1.0/Kepler1.0时代的产品线布局已经全部完成,双方应对各级市场分类的路线图产品已经悉数登场。在接下来的日子了,我们将会迎来以价格调整和少量特型产品(比如说“GTX650Ti Boost版”或者“HD7850 1G版” )为主的市场运作周期。双方能否在这一阶段进行深刻的价格战,消费者能否从中获益,就让我们一起期待吧。
推荐经销商