1RX 480最强劲敌杀到
2016年7月7日晚9点,NVIDIA正式发布Pascal架构的甜点级产品——GeForce GTX 1060,以正面迎战上月末正式开售的AMD Radeon RX 480。作为GTX 960的继任者,GTX 1060有着远超GTX 960的强大性能,官方宣称其性能在老旗舰GTX 980之上,与之相对的,RX 480的性能则是介于GTX 970和GTX 980之间。很明显,GTX 1060针对的就是RX 480所在的2000元级主流游戏市场,而RX 480仅仅独占这块市场20余天便迎来了新制程下的首位对手,看来并不像外界所传,NVIDIA和AMD在各自的市场“井水不犯河水”,聪明的老黄怎么会放任老对手在利益更大的市场抢占先机?
那么这个市场利益有多大?据称,RX 480在上市的20天内已经售出约10000片,这个数字是非常惊人的,率先发布的GTX 1080和GTX 1070加起来的销量也不足RX 480的一半,由此可见该市场的利润之大。同样是据称,GTX 1060本来没打算7月初便发布,正是RX 480在市场上的优秀表现引得老黄提早发布了GTX 1060。其实甜点级市场的利润一直很高,出货量也是旗舰级显卡远不能及的。举例来说,上代GTX 900系列在京东出货量最大的显卡型号就是GTX 960,同样地,AMD那边出货量最大的显卡型号是R9 380。
NVIDIA在这个时候推出GTX 1060无疑是非常正确的选择,首先我们看看GTX 1060的几个特点:1、性能上强于GTX 980。根据之前GTX 1080/1070发布的先例,既然NVIDIA称GTX 1060强于GTX 980,那么GTX 1060就一定不会比GTX 980弱,哪怕只是略强;2、建议零售价为1999元。1999元恰恰是RX 480的售价,这也就是说AMD此次将不会在性价比上占优,再考虑到NVIDIA目前的市场份额,无疑GTX 1060将会比RX 480更畅销;3、TDP为120W。120W的TDP同GTX 960持平,但性能却达到了GTX 980的级别,这也就是说GTX 1060的能耗比又达到了一个新的高度。此外,对手RX 480的TDP为150W,更低的功耗肯定会带来更好的温度表现。综上所述,似乎RX 480在性能、功耗以及价格上均不占优势,GTX 1060或许会成为RX 480的“天敌”。
GeForce GTX 1060 Founders Edition
当然,一切的前提是在GTX 1060的确有着GTX 980之上的性能下,RX 480之前也被传出性能强于GTX 980,但首测证明这只是谣传。那如果GTX 1060真的强于GTX 980呢?有的玩家可能会说:“OC版的RX 480也是可以强于GTX 980的,因此RX 480不输GTX 1060。”的确,RX 480对频率很敏感,更高的频率的确会带来性能的大幅提升,但别忘了,GTX 1060用的可是搭载GPU Boost 3.0技术的Pascal架构,有着良好供电散热设计的非公GTX 1070也可以在温度较低时自动超频至约2GHz,非公版的GTX 1060在该技术的辅助下想必也会发挥出更强大的实力,因此OC版的RX 480能不能和OC版的GTX 1060平起平坐?这事还真不好说。
除却性能和一些硬指标,全新的GTX 1060 Founders Edition在外观上也可谓是大升级,新卡采用了大量在GTX 1080/1070 Founders Edition采用的几何多边形设计,整体层次分明。此外,GTX 1060一改GTX 960的大塑料散热罩,整个散热罩均采用金属材料制造,无论是观感还是质感都非常好。此外,GTX 1060 FE将正面的亚克力板去掉,将黑色均热板直接露出,这无疑会大大增强显卡的散热效果。
不过颜值颇高的GTX 1060有一些比较让人匪夷所思,甚至无语的设计,首先一点就是GTX 1060居然取消了SLI金手指,也就是说以后小伙伴们再也不能愉快地用双甜点组SLI战旗舰了。NVIDIA官方解释是说购买GTX 1060这个级别显卡的用户很少会考虑去组建多卡SLI平台,因此SLI功能是没用的。对此我真想吐槽一句:NVIDIA是怕双GTX 1060 SLI会抢GTX 1080的市场吧!还有一种可能是新的桥SLI需要2根SLI金手指,而甜点级显卡一向只配备1根金手指,既然不能使用新桥,干脆就取消SLI设计。除此之外,还有一个不得不吐槽的地方,那就是GTX 1060 Founders Edition的6pin辅助供电接口居然不在PCB上!6pin接口被放置在显卡尾部,通过一根线连接至PCB上,这种设计让那些想要改装散热器的玩家们彻底放弃了,不过好消息是目前我们收到的非公版GTX 1060均未采用这种反人类设计。
说了这么多相信大家已经十分期待我们的测试部分了,还是那句老话,我们会用各类基准测试软件和游戏来考验GeForce GTX 1060的性能。这次我们主要引入GTX 1060、GTX 980以及RX 480三张卡的数据进行横向对比,同时改进了数据的呈现形式,在条形图数据的尾部加上“±百分比”,选定RX 480为基准值,力图给各位玩家一个更直观的更易看的首测,请大家拭目以待!
2架构,砍了一半的GP104-400
架构,砍了一半的GP104-400
GeForce GTX 1060采用全新的16nm制程的Pascal架构,核心代号为GP106,具体型号为GP106-400。GP104核心面积约为200平方毫米,得益于16nm的制程优势,核心内集成了44亿晶体管,是GTX 960晶体管数量的1.5倍,核心面积却仅为GTX 960的87.7%。
GeForce GTX 1060 Founders Edition GPU-Z截图
基于Pascal架构的GP106-400芯片运算资源总量为1280个ALU,正好为GP104-400的一半。其TMUs数量为80个,后端的ROPs数量为48个,3个带宽为64bit的双通道显存控制器组成了总量192bit的显存控制单元,大小为6GB。同GTX 960相比,其各项参数均有所提升,尤其是显存带宽达到了192GB/s,是GTX 960显存带宽的1.7倍。
显 卡 规 格 比 较 表 | ||||
显卡型号 | GTX 1060 | RX 480 | GTX 980 | GTX 960 |
首发限价 | ¥1999 | ¥1999 | ¥3999 | ¥1499 |
GPU代号 | GP106 | Ellesmere XT | GM204 | GM206 |
GPU工艺 | 16nm | 14nm | 28nm | 28nm |
GPU晶体管 | 4.4B | 5.7B | 5.2B | 2.94B |
着色器数量 | 1280 | 2304 | 2048 | 1024 |
单精度浮点 | 4.4T | 5.8T | 4.6T | 2.6T |
ROPs数量 | 48 | 32 | 64 | 32 |
纹理单元数量 | 80 | 144 | 128 | 64 |
核心频率 | 1506MHz | 1120MHz | 1126MHz | 1127MHz |
boost频率 | 1709MHz | 1266MHz | 1216MHz | 1178MHz |
架构 | Pascal | GCN 4.0 | Maxwell 2 | Maxwell 2 |
显存频率 | 8012 MHz | 8000 MHz | 7012 MHz | 7012 MHz |
内存位宽 | 192 bit | 256 bit | 256 bit | 128 bit |
内存带宽 | 192 GB/s | 256 GB/s | 224 GB/s | 112 GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
内存容量 | 6 GB | 8 GB | 4 GB | 2/4 GB |
注:表中售价均为官方首发限价
我们可以看到GeForce GTX 1060的默认核心频率达到了惊人的1506MHz,Boost频率更是高达1708MHz,显存带宽为192GB/s。这款产品完整支持DirectX 12 API以及异步运算,在DX12中有着更好的表现。GTX 1060的默认Pixel Fillrate能力达到了72.3Gpiexls/S,默认Texture Fillrate能力为120.5Gtexels/S。各项参数照比GTX 960均有大幅提高。
Pascal架构GP106-400芯片由以下主要的部分组成:
1、基于TSMC的16nm FinFET工艺。
2、双单元的宏观并行结构,10组SMs单元被分为2个GPC,每个GPC包含5组SMs。
3、10组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。
4、GP106拥有6个32位显存控制器,总计192位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计48个ROPs单元和1.5M二级缓存。
5、改进型的4.0版本PolyMorph Engine,包含了为VR设计的The Simultaneous Multi-Projection Engine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。
在GeForce GTX 1060上,我们看到了其与上代基于Maxwell 2.0架构显卡相类似的设计,主要区别就是每个GPC中多了一组SMs单元。这就让这款显卡能够支持所有在GeForce GTX 900系列中的特性,以后使用到这款显卡的玩家能够获得与其他采用基于Maxwell 2.0架构设计的显卡的体验。
3显卡全新技术解析
Simultaneous Multi-Projection技术
面对即将大爆发的VR市场,NVIDIA显然要让GPU承担起更多任务,来协助建立VR生态圈。在GeForce GTX 1080/1070的发布会上,NVIDIA为旗下VR SDK——VRworks添加了新的内容。首先是Simultaneous Multi-Projection技术,该技术直译为“同步多重投射”。
老黄讲解Simultaneous Multi-Projection技术
经常组多联屏的玩家一定知道,当屏幕组成一个小于180°的夹角,也就是两块显示器之间形成角度的时候,显卡渲染场景一直有个很难纠正的扭曲现象,就是看上去渲染的图形依然看上去是一个180°平面的图形,却被硬生生地被放在两块形成夹角的显示器上,看上去根本没有任何的扭曲和形变。换句话说,虽然显示端已经是曲面屏了,但是画面还是180°的平面,比如左边这幅图:
Simultaneous Multi-Projection技术示意
可以看到对于右边的部分GPU还是基于一个180°的平面渲染的,问题在于我们的显示器摆放是有角度的,并且呈一个弧形,但是GPU并不知道显示器之间的夹角会影响输出的图形,它只是机械的渲染,所以右边这部分场景其实是渲染错误的,正确的输出应该是如右图这个样子。Simultaneous Multi-Projection技术可以根据显示器之间的角度,在生成图像的同时动态调整图像,将渲染的场景按照一定的角度生成,也就是让生成的图像保持有角度的渲染,而不只是机械地生成一张平面,换句话说,可以将本身是平面的画面曲面化以贴合曲面的屏幕。
除了解决了这个尴尬角度的问题,Simultaneous Multi-Projection还针对VR渲染进行了特别的优化,并且引入了新的Single Pass Stereo技术,Single Pass Stereo可有效减少传统VR渲染一半的工作量,上图所示的这个场景,启用Single Pass Stereo后帧率从60~70帧增加到90多帧,提升幅度超过30%,而90帧正是VR游戏的最低要求。
VRWorks Audio技术
VR主要是通过视觉来让用户拥有身临其境的体验,然而光有视觉是不够的,想要获得足够的沉浸感,听觉也是十分重要的一环。在会上,NVIDIA展示了一项有关VR听觉的加强技术,名为VRWorks Audio,该技术是全球首款实时物理模型的声学仿真技术。
老黄讲解VRWorks Audio(图片来自BenchLife)
有物理基础的空间或3D音效,即虚拟场景内产生的音效,在到达用户虚拟的耳朵之前会受到一定的影响,这一过程后才产生的。影响的因素可能包括:由于墙壁或门的封闭,使声音呈现的静音状态;或者声音在经过多个物理表明反射后产生的回音等。
NVIDIA提到,他们在做音频模型或渲染的过程很像光线追踪的过程,光线追踪对处理器要求很高,但在渲染图像上及其精确,它能够计算出一个场景中从来源到目的地这一路径上的每一束光线。NVIDIA宣称可以追踪声波在虚拟场景内的路径,并将根据扭曲的声波来应用到其“物理”能力和经过渲染的音频上。事实上,VRWorks Audio使用了NVIDIA现有的光线追踪引擎OptiX来模拟在某一个环境内的声音运动或其传播轨迹,同时根据你所处的虚拟世界的大小、形状和环境材质来实时改变该声音。
Ansel截图技术
NVIDIA发布了一个全新的截图工具,工具的名称叫做Ansel,该名称是为了纪念伟大的摄影师Ansel Adams。说起这个摄影师,它还是很有名气的,是自然风光摄影殿堂级人物,还曾获得美国公民的最高褒奖——总统自由勋章。以Ansel的名字来命名新的截图软件,一来是为了纪念这位大师,二来是为了表明,截图也可以是一种艺术。
凭借Ansel,游戏玩家能够合成自己喜欢的游戏画面,可以在游戏世界中的任何有利位置将镜头指向任意方向。游戏玩家最高能够以32倍的屏幕分辨率捕捉屏幕截图,然后即可在截图上选择某个位置放大显示并做到不失真。凭借照片过滤器,游戏玩家可以实时添加特效,然后截取完美的照片。游戏玩家可以捕捉360度立体光球图像,以便在虚拟现实头戴式显示器或谷歌Cardboard中进行观看。
没听懂?通俗点讲,就是你可以在游戏中截取一个超大的截图,这个截图是360°环绕式的,这个截图包含了所有角度和位置信息,你可以在任意一点观看在该点的游戏图像。截好了图你就可以在VR眼镜中查看了,看到的效果就如同身处在游戏中。听起来很酷炫是不是?这个截图不仅能体现在VR显示器上,还能通过APP传递给手机,通过手机也能直观的感受到这张游戏截图的震撼性。并且这项技术并非空谈,《全境封锁》、《见证者》、《巫师3》、《无人深空》、《虚幻竞技场2014》在现场都宣布将支持Ansel技术。
4显卡改进技术解析
第四代delta色彩压缩技术
显存压缩技术对于提高显卡性能是很有帮助的。同之前的NVIDIA GPU一样,全新的GTX 1080也采用了这样一种无损压缩技术。这种技术有以下几点好处:减少显存数据写入量;减少数据从显存到GPU二级缓存的数据传输量,有效增加了GPU二级缓存的容量以及降低纹理单元和帧缓存间的数据传输量。
第四代delta色彩压缩技术
显存压缩技术中最重要的一种就是“delta色彩压缩技术”,这种技术让GPU计算每一个块中像素的差异,然后将相同色彩的像素信息进行压缩,在极端状况下,压缩储存后的参考像素还不及未经压缩像素一半的大小,这无疑大大减小了数据传输量。
GTX 1060搭载了全新的增强型delta色彩压缩技术,可以更高效地实现2:1的压缩比,同时,全新的4:1、8:1高压缩比模式也已被GTX 1060所采用,这使得显存利用率再次达到一个新高度,相当于等效提升了对应比例的显存带宽。
异步运算技术
从传统角度上看,GPU主要承担的任务是图形渲染,系统会将待处理的工作按照指定流程传递给GPU,以便让图像能够以正确的顺序显示出来,这点对于图形渲染来说非常重要。而现如今随着GPU功能的不断挖掘以及架构的不断升级,许多计算、复制的工作也会交由GPU来做,如果仍然只有一条序列的话,渲染、计算、复制三项任务将会互相抢占,造成“交通拥堵”,运行效率自然大打折扣。因此多条序列分别处理渲染、计算、复制等工作才能大大提升GPU效率,这种技术就是异步运算技术。
说起异步运算技术,大家可能会首先想到AMD的GCN架构,GCN的异步着色器技术让GCN架构的A卡在DX12中拥有了出色的性能表现。随着DX12时代的全面到来,NVIDIA的全新GTX 1060自然也是在异步运算上狠下功夫。官方宣称,GTX 1060有着完全的异构计算能力,借助异构着色器,GPU可以并行处理多任务,而非按优先级进行候选或者抢占。
首先为大家介绍的是Pascal架构引入的全新技术——动态负载平衡。为了让大家能够更直观地了解这项技术,我们看上面这张图:横坐标是时间,纵坐标是GPU资源分配百分比,浅绿色是图形工作量,深绿色部分是计算工作量,而灰色斜纹部分为空闲。首先看上半部分的静态平衡,如果计算工作量所需的时间比图形工作量的时间长,而两个工作需要同时完成才能进行新的工作,那么进行图形工作的GPU就会有一部分闲置出来,这就浪费了GPU的性能;接着我们看下图的动态平衡,当计算工作量先完成时,负责计算工作的GPU资源就会去帮助完成剩余的图形工作,这样就不会有闲置的GPU资源,并且大大降低了工作所需的时间,这就是Pascal的动态负载平衡技术。
然后是有关GPU抢占的技术。了解VR的朋友们一定听说过“异步时间扭曲”技术,异步时间扭曲是指在一个线程(称为ATW线程)中进行处理,这个线程和渲染线程平行运行(异步),在每次同步之前,ATW线程根据渲染线程的最后一帧生成一个新的帧。(有关异步时间扭曲的知识请参见《小菜硬件杂谈 说说VR里的异步时间扭曲》)实现异步时间扭曲需要GPU支持合理的抢占粒度,那么抢占指的是什么意思呢?所谓抢占,就是指为了使重要工作得以快速运行,GPU会选择性关闭不太重要的工作,从而提高重要工作的运行效率。Pascal架构是史上首个支持像素级抢占的GPU架构,当接收抢占请求时,Pascal的图形单元会记录下那些优先级较低的工作被中断时的位置,优先处理那些重要的工作;当抢占结束后,其余的工作从之前被中断的位置开始继续执行。
Pascal的抢占不仅作用于图形工作中,在计算工作中也可以实现。线程级的抢占和像素级抢占的实现方式类似,都是停下当前优先级较低的线程块的工作,去支援优先级较高的SMs运算线程,当抢占结束后,从之前中断的地方开始继续计算工作。对于游戏来说,像素级抢占和线程级抢占相结合让Pascal架构GPU可以以极快的速度和最小的性能开销实现抢占,同时对于CUDA计算任务,Pascal也可以以最好的抢占粒度去实现抢占。
Fast Sync技术
Fast Sync是一种替代传统垂直同步的防止画面撕裂的技术。同V-Sync不同的是,开启Fast Sync后,在做到防止画面撕裂的同时能够不降低显卡的性能,也就是说Fast Sync能够实现V-Sync开启时的流畅画面,并且有着如同未开启V-Sync一样的低延迟。从下图可以看出,Fast Sync的延迟仅比关闭V-Sync时的延迟多了8ms,这点差距还是十分令人满意的。最后,Fast Sync技术可以搭配G-Sync技术一起使用,为玩家带来更好的视觉效果。
GPU Boost 3.0
GPU Boost是NVIDIA推出的GPU动态提速技术,能够在TDP允许的范围内,尽可能地提高GPU运行频率,进而提升GPU工作效率。全新的GTX 1060为我们带来了这个技术的最新升级版——GPU Boost 3.0。GPU Boost 3.0可以设置各个电压点的频率偏移。GPU Boost 2.0及以前的版本只能实现固定的频率偏移,也就是说频率的提升只能呈线性的方式,提升后的频率无法达到此电压下对应的最大频率。
GPU Boost 3.0就很好地解决了这个问题,频率偏移可以对应到单个电压点,而不是像之前的线性相关,这样就可以使得GPU的频率达到该电压下所能实现的最大值,大大提升了GPU Boost的效果。全新的GPU Boost 3.0还能与超频软件相结合,让玩家可以手动调整频率偏移曲线,来达到理想的GPU频率。
5GTX 1060 FE拆解赏析
GTX 1060 FE拆解赏析
显卡包装设计
6七彩虹非公版GTX 1060赏析
七彩虹非公版GTX 1060赏析
七彩虹 iGame1060 烈焰战神X-8GD5 TOP
7影驰非公版GTX 1060赏析
影驰非公版GTX 1060赏析
影驰 GTX 1060 HOF
8索泰非公版GTX 1060赏析
索泰非公版GTX 1060赏析
索泰 GTX 1060-6GD5 至尊Plus OC
9华硕非公版GTX 1060赏析
华硕非公版GTX 1060赏析
华硕 STRIX-GTX1060-O6G-GAMING
10技嘉非公版GTX 1060赏析
技嘉非公版GTX 1060赏析
GV-N1060G1Gaming-6GD
11微星非公版GTX 1060赏析
微星非公版GTX 1060赏析
微星 GTX 1060 GAMING X
GeForce GTX 1060 GAMING X
12映众非公版GTX 1060赏析
映众非公版GTX 1060赏析
映众GTX 1060冰龙海量版
13耕升非公版GTX 1060赏析
耕升非公版GTX 1060赏析
耕升GTX 1060 G魂
14铭瑄非公版GTX 1060赏析
铭瑄非公版GTX 1060赏析
铭瑄 GTX1060 终结者 6G
15测试平台环境一览
测试平台硬件环境一览
为保证测试能够发挥显卡的最佳性能,本次测试平台采用最强酷睿芯——Intel酷睿i7-5960X处理器、技嘉X99芯片组主板、影驰 Gamer DDR4-2400 8GB 四通道内存、安钛克1200w金牌电源组建而成。详细硬件规格如下表所示:
测 试 平 台 软 硬 件 配 置 | ||
核心配件 | ||
CPU | Intel | 酷睿i7-5960X |
主板 | 技嘉 | GA-X99-Gaming G1 WIFI |
核芯显卡 | 无 | 无 |
内存 | 影驰 | Gamer DDR4-2400 8GB x4 |
硬盘 | 浦科特 | PX-512M6S+ |
电源 | 安钛克 | HPC-1200 |
系统及驱动程序 | ||
操作系统 | Microsoft Windows 10 | |
主板驱动 | Intel芯片组驱动 | |
显卡驱动 | NVIDIA GeForce Game Ready Driver(368.64 beta) | |
DirectX环境 | DirectX 11 | |
帧数监控 |
测试用主板:技嘉GA-X99-Gaming G1 WIFI
测试用内存:影驰 GAMER DDR4-2400 8GB*4(玩家主场 电竞内存)
测试平台软件环境一览
为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 10正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
测 试 平 台 软 件 环 境 | ||||
操作系统 | Microsoft Windows 10 专业版 | |||
(64bit / 版本号:10240) | ||||
主板芯片组驱动 | Intel Chipset Device Software | |||
(WHQL / 版本号:9.2.3.1022) | ||||
显卡驱动 | NVIDIA GeForce Game Ready Driver | |||
(版本号:368.64 beta) | ||||
桌面环境 | Microsoft Windows 10 专业版 | |||
(2560×1600 / 32bit / 60Hz) |
在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用游戏自带Benchmark及游戏中平均帧数来衡量性能,数值同样越高越好。
16理论性能测试:3DMark FireStrike
理论性能测试:3DMark FireStrike
于北京时间2013年2月5日推出的新3DMark,采用全新界面设计,除了测试分数,还会展现每个场景测试期间的实时曲线,全程记录帧率、CPU温度、GPU温度、CPU功耗。新3DMark取消了传统的E、P、X模式,取而代之的是根据负载不同所推出的三个场景,其中FireStrike专为基于DirectX 11显卡搭建的高端游戏平台,而CloudGate则支持基于DirectX 10环境的主流硬件,IceStorm则支持入门级DirectX 9设备、手机、平板电脑等等。
3DMark FireStrike
3DMark FireStrike GPU成绩
在3DMark FireStrike Extreme测试中,我们主要看白色和蓝色数据,GTX 1060的成绩超过GTX 980,但仅仅领先3分,基本可以说在理论性能上GTX 1060=GTX 980。此外我们还要注意一下AMD的RX 480,作为GTX 1060的对手,其落后GTX 1060约10.5%。参考我们之前RX 480的首测数据,即使是OC版的RX 480,GTX 1060依然有着5%的领先。
17DX12性能测试:3DMark Time Spy
DX12性能测试:3DMark Time Spy
Futuremark于近日宣布,3DMark Time Spy基准测试软件已经正式发布,这也是其第一个专门针对DX12环境设计的测试项目。该测试由Futuremark和AMD、Intel、微软、NVIDIA等众多基准测试开发项目(BDP)合作伙伴共同开发,从零开始完全面向DX12,核心引擎也是完全基于DX12,可彻底释放新API的各种潜力,包括降低处理器负载、高效利用GPU硬件、异步计算、混合多显卡、多线程等等。
3DMark Time Spy
Time Spy是第一个针对DX12的独立第三方基准测试工具,整个引擎完全基于DX12设计,可充分压榨显卡的DX12性能,测试负载也远远高于此前的DX11 FireStrike。值得一提的是,测试中可以开启或者关闭异步计算(Async Compute),因为不是每一种GPU架构都支持该特性。AMD GCN架构一直支持,NVIDIA则只有最新的Pascal才支持。
在此项测试中,我们可以看到,GTX 1060要领先RX 480约3%,而两者均领先GTX 980 5%以上。在AMD的优势项目DX12测试下,GTX 1060依然能够领先RX 480,这说明全新的Pascal架构的确在异步计算方面得到了长足的改进。
18VR性能测试
VR性能测试
在VR测试部分,我们选择了Steam平台推出的一款名为“SteamVR Performance Test”的软件程序,该程序可以全面检测用户的PC性能,考验PC是否能够支持VR设备稳定流畅运行。SteamVR效能测试会透过一段2分钟由Valve制作的《光圈科技机械人维修VR展示》来评估玩家电脑的渲染力。在收集相关数据后,它将判断玩家所使用的系统能否维持在90fps的帧率运作以及VR内容的视觉保真能否够校调至建议的水平标准。
《SteamVR Performance Test》
GTX 1060保真度为7.8
经过实际测试显示,GeForce GTX 1060可以跑出7.8分,比RX 480整整高出1分,这已经完全属于VR Ready的范围,也就是能够流畅运行绝大多数VR应用。
19游戏性能测试:《古墓丽影:崛起》
游戏性能测试:《古墓丽影:崛起》
《古墓丽影:崛起》是由Crystal Dynamics开发,Square Enix负责发行的一款单机游戏。游戏中玩家控制主角劳拉去探索劳拉以前不相信的超自然现象和未知的世界,寻找永生的秘密。游戏地图包括了世界上的多个地点,可探寻的场所将比前作大三倍,地图的开放度比前作更大,充满优美和危险并存的场景。
在NVIDIA的主场自然要先来点NVIDIA擅长的,首先是年初的3A大作《古墓丽影:崛起》,该作是“A粉转A黑”的典型代表。我们还是选择DX12模式,结果比较出乎预料,在1080p分辨率下,GTX 1060竟领先RX 480 38%,而在2K分辨率下也领先近25%,这样的差距能跨越2个性能级,差距非常悬殊。此外,GTX 1060平均领先GTX 980 15-20%,也是领先得非常多。难道GTX 1060真的比对手RX 480强这么多?我们接着往下看。
20游戏性能测试:《杀手6》
游戏性能测试:《杀手6》
《杀手6》是一款Io Interactive制作、Square Enix发行的动作冒险游戏。在本作中,主角要进行的任务地点包括了广州,香港,维也纳等地,我们熟悉的老牌杀手47,要在ICA的帮助下展开全球范围的猎杀行动。该作依旧包含了系列核心元素,玩家可以使用众多道具在全球各种奢华,奇异的地方完成暗杀任务,除了借助新引擎营造超逼真的细节,该作还将是一款开放世界,非线性的游戏,随意存档的沙盒玩法。
《杀手6》
接下来选择一个AMD比较擅长的项目,自从《杀手6》宣布引入DX 12模式,该作就成为测试A卡必测的一个项目了,因为同性能级的A卡比N卡在该作中的表现要好很多。在此次测试中,RX 480扳回一局,在1080p和2K分辨率下分别领先GTX 1060 6%和7%。此外我们可以看出,GTX 1060照比GTX 980也有着5%左右的领先,折算成帧数约为2帧。
21游戏性能测试:《全境封锁》
游戏性能测试:《全境封锁》
《全境封锁》是一款开放世界第三人称射击角色扮演大型多人在线网络游戏。游戏设定在瘟疫爆发后的美国,玩家作为“全境封锁”计划的部队,在“黑色星期五”后的美国寻找一线生机。该作的大背景同《辐射》系列很类似,都是描绘大灾难后的世界,玩家需要在这个混乱的世界中寻找一线生机,可以说生存是玩家唯一的选择。
《汤姆克兰西:全境封锁》
在《全境封锁》的测试中,GTX 1060依然领先RX 480,领先幅度约为2%,两者基本算是不相上下,而老旗舰GTX 980则是宝刀不老,对GTX 1060保持着约4%的领先。
22游戏性能测试:《孤岛惊魂:原始杀戮》
游戏性能测试:《孤岛惊魂:原始杀戮》
《孤岛惊魂:原始杀戮》是一款动作游戏,玩家扮演Takkar,他是一名游牧猎人,努力重建自己的部落。从第一人称视角来看,玩家进行的任务涉及到追踪/猎杀动物,收集资源,对抗敌对部落。玩家可以使用弓箭,长矛,以及棍棒在狂热的战斗中杀死敌人,有些时候玩家可以秘密偷袭一些头部负伤或者比较虚弱的敌人。
《孤岛危机:原始杀戮》也是一个对我们评测编辑很友好的大作,因为其自带benchmark。无论是在1080p分辨率还是在2K分辨率下,GTX 1060照比GTX 980都有8帧左右的领先,领先幅度约为18%,领先幅度明显。GTX 1060照比GTX 980也有着10-15%的领先,是三款卡中2K分辨率下唯一称得上成绩及格的显卡。
23游戏性能测试:《奇点灰烬》
游戏性能测试:《奇点灰烬》
《奇点灰烬》是一款Stardock制作的即时战略游戏。该作采用Oxide Games的Nitrous引擎打造,背景设定在遥远的未来,那时人类完全以意识形态存在,人们已经掌握了上帝一样的力量。但是人类发现自己已经处于战争之中,敌人就是一个叫做“Haalee”的具有意识形态的AI,企图推翻人类在宇宙之中的统治地位。
《奇点灰烬》
《奇点灰烬》是全球首款DX12游戏,其自带的benchmark对游戏DX12性能有着很好的考量。在DX12测试中,比较出乎我们意料的是,RX 480并未取得领先地位,落后GTX 1060约3.5%,更落后GTX 980约8%,这也是少见的同级别N卡战胜A卡的情况。
24游戏性能测试:《战锤:全面战争》
游戏性能测试:《战锤:全面战争》
《战锤:全面战争》是由Creative Assembly制作、SEGA发行的一款奇幻策略游戏,也是《全面战争》系列第一次以“战锤”为题材,本作一改系列那种“历史百科”的风格,将充满奇幻风格的中古战锤世界展现在玩家面前。
《战锤:全面战争》
玩家们可以在《战锤:全面战争》中自由选择DX11或DX12 API,而我们自然是采用DX12模式。在该模式下,RX 480领先GTX 1060约1%,可以说两者不分上下,在2K分辨率下,GTX 980也有着差不多的帧数,因此可以说在这款游戏中,三块卡的性能表现相当。
25游戏性能测试:《辐射4》
游戏性能测试:《辐射4》
《辐射4》是由Bethesda开发的一款角色扮演类游戏,于2015年11月10日发行,为《辐射》系列游戏作品的第四代。此系列也包括了延伸作品如《辐射战略版:钢铁兄弟会》。游戏叙述了发生在核爆前(200年前,与前三代故事相同),主角目暏核爆后,被Vault-Tec(避难所科技)的工作人员送到111号避难所。200年后玩家作为111号避难所唯一的幸存者重返地表,并向着波士顿市区出发,展开冒险。
《辐射4》
在开始《辐射4》的测试前,我们先修改配置文件,接触垂直同步。从测试结果可以看出,GTX 1060和RX 480差距并不大,1080p分辨率下GTX 1060领先4.5%,而2K分辨率下两者几乎相当。无论是1080p还是2K分辨率,两块卡都可以在特效全开状态下完美运行。
26游戏性能测试:《巫师3:狂猎》
游戏性能测试:《巫师3:狂猎》
《巫师3:狂猎》采用Redengine3引擎,作为一款次世代的RPG游戏作品,本作栩栩如生的真实环境还原以及全新角色面部动作和人物面部表情都成为了一大亮点。Redengine3引擎在支持各种全新图形技术的同时也加快了地图载入速度,经由无缝地图打造的宏大世界让玩家可以自由无限制的漫游在游戏世界当中。
《巫师3:狂猎》
最后我们来测试一下素有显卡杀手之称的《巫师3》。作为一款真正意义上的次世代游戏《巫师3:狂猎》对硬件有着极高的要求,只有旗舰级显卡才能在1080p分辨率下特效全开达到绝对流畅的60帧,而即便是上代的顶级旗舰也无法在2K分辨率下达到绝对流畅的60帧。通过测试我们可以看出,在1080p分辨率下,GTX 1060领先RX 480约11%,两者均能较为流畅地运行游戏,而2K分辨率下领先幅度有所拉大,前者领先后者12%,但在此分辨率下二者均不能十分流畅地运行游戏。
274K网游测试:《守望先锋》
4K网游测试:《守望先锋》
《守望先锋》是一款团队第一人称射击游戏,游戏的故事发生在科学技术高度发达的未来地球。在全球危机时期,全球范围内的优秀军人、科学家、冒险者和奇人异士集结在一起,组成了一支旨在拯救这个被战争撕碎的世界的特别部队,他们就是“守望先锋”。《守望先锋》是一款将FPS和MOBA结合得恰到好处的大作,喜欢FPS游戏的玩家可以在游戏中找到射击游戏的快感,而喜欢MOBA游戏的玩家可以在游戏中找到英雄、技能、配合、走位等乐趣。
《守望先锋》
《守望先锋》是当下玩家关注度最高的游戏,作为一款网游,其配置要求还是比较亲民的。我们可以看到,即使是在4K分辨率,渲染倍数为100%的最高画质下,GTX 1060也能在极高画质下达到57帧,平均领先RX 480约16%,领先幅度较大。
28OpenCL运算性能测试:LuxMark
OpenCL运算性能测试:LuxMark
LuxMark考验的是显卡的OpenCL运算能力,测试时使用GPU-Only模式,单纯考验显卡GPU的性能。进入软件后将测试环境设置为Room(Complex Benchmark:2016K triangles),以下是参测显卡在该项测试中的表现:
LuxMark V2.0
LuxMark是一款可以很好考量显卡OpenCL运算性能的专业软件,多用于专业卡的测试。在这里我们可以看到,三张卡中性能最强的还是老旗舰GTX 980,其同GTX 1060比拥有更多的运算核心,因此得分也更高。而RX 480虽然拥有最多的运算核心,但由于其单核效率较低,因此分数也是垫底,落后GTX 1060约8%。
29OpenCL运算性能测试:Cinebench R15
OpenCL运算性能测试:Cinebench R15
CineBench R15使用针对电影电视行业开发的Cinema 4D特效软件引擎,可以测试CPU和显卡的性能。测试包括两项,分别针对处理器和显卡的性能指标。第一项测试纯粹使用CPU渲染一张高精度的3D场景画面,在单处理器单线程下只运行一次,如果系统有多个处理器核心或支持多线程,则第一次只使用一个线程,第二次运行使用全部处理器核心和线程;第二项测试则针对显卡的OpenGL性能,我们就用第二项测试来考验一下三卡的渲染性能究竟如何。
Cinebench R15
CineBench是很有说服力的一套测试系统,可以准确体现系统性能指标,通过CineBench R15的测试结果,我们可以看出,GTX 980和GTX 1060在此项测试下的结果相近,均领先RX 480约18%,当然,这也是因为OpenCL一直是N卡的优势项目,能体现A卡性能优势的API还得是Vulkan。
30Vulkan游戏性能测试:《DOOM》
Vulkan游戏性能测试:《DOOM》
《毁灭战士4》是Bethesda开发的第一人称射击(FPS)游戏,它由id Tech 6引擎制作,也是在该引擎上之作的第一款游戏,强有力的引擎支持,为《毁灭战士4》带来了精美逼真的游戏画面,游戏的世界比上一代更加庞大,敌人也将更加难应付,同时射击感也更加优秀。多人模式可以自建游戏元素,包括装甲、建筑及怪物等,这将带给玩家高度定制的游戏体验。在近日,《毁灭战士4》引入了Vulkan升级补丁,成为继《DOTA2》之后第二款正式支持这一全新API的游戏,官方称可比OpenGL带来更好的性能,而我们就用这款游戏来测试显卡的Vulkan运算性能。
《毁灭战士4》
在《DOOM》原本的OpenGL 4.5 API中,N卡原本完全压制A卡,但是切换到Vulkan之后完全变了,A卡性能暴增,RX 480原本稍稍落后GTX 970,现在完全超越GTX 980,更是超过GTX 1060近10%,可见GCN架构在新API下的表现的确非常优异。
31显卡超频性能测试
显卡超频性能测试
我们本次超频测试使用的是在业界广受好评,由微星制作的Afterburner显卡超频软件。Afterburner是微星基于RivaTuner内核开发的一款显卡辅助工具,凭借简单快捷、功能强大的特点吸引了不少用户,并且这是一款A/N显卡通吃的工具,所以在玩家中口碑一直不错。此次使用的软件版本为4.1.1,采用全新的MSI家族设计,同时具备龙盾和火箭两大logo,科技感更强。
MSI Afterburner
我们按照50MHz的频率间隔提升核心频率,不改变显存频率,然后进行3DMark FireStrike Extreme测试,测试结果如下:
通过测试我们可以看出,随着频率的升高,GTX 1060的3DMark FSE得分逐渐升高,在提升250MHz后,GTX 1060最终得到了6438分,这个分数照比之前提升了约5.5%,最终频率为1706MHz,相信各AIC的顶级非公版GTX 1060的频率应该可以达到这个数值。而且这还只是在公版的3+1相供电设计下,当供电和散热更豪华时,GP106所能达到的频率肯定也会更高。
32显卡功耗及温度测试
显卡功耗及温度测试
对于游戏显卡来说,功耗和温度仍旧是我们参考的必要数据,因为这些数据听起来好像是和性价比没什么关心,但它作为辅助属性密切影响玩家的实际游戏体验,更高的功耗会带来更多噪音和温度,因此我们应该全角度评价产品,而不是仅仅通过性能和价格。
温度方面我们将继续采用FurMark来进行测试,考虑到不同游戏之中,显卡的负载率不同,尤其是低分辨率和高分辨率的负载率差异会让显卡的功耗完全无法测算平均数值。因此我们需要采用Furmark这样的权威性烤机软件,让GPU芯片之中每一个运算单元完全满载,充分发挥供电最大化的状态才能得出准确的成绩。
参测显卡烤机温度汇总
我们可以看到,RX 480的烤机温度稳定为84℃,而相对的,GTX 980的烤机温度则要比RX 480要低2℃。而GTX 1060的满载温度没有超过80℃,比对手RX 480低了足足7℃。
满载功耗方面,由于GTX 1060的TDP最低,仅为120W,所以GTX 1060的平台满载功耗也最低,仅为203W,比对手RX 480低了约30W,而RX 480的TDP恰恰为150W。空载功耗方面,同样是GTX 1060最低,仅为61W,而RX 480则和GTX 980相当,比GTX 1060高6W,总体来说相差不大。
33后发制人的高性价比甜点
后发制人的高性价比甜点
有关GeForce GTX 1060的全部测试至此已经结束,其性能及各项特性相信各位看官应该都有所认知了。从实际测试成绩上看,传统的DX11游戏中,GTX 1060的性能全面超越RX 480,综合平均超幅在10%左右,在大多数项目也超越了GTX 980,这个性能表现还是十分让人满意的。在一些DX12游戏中,GTX 1060也能战平或稍稍领先RX 480,说明全新的Pascal架构的确提升了N卡DX12下的表现以及异步运算能力,因此可以说GTX 1060是GTX 960的完美继任者。
Name Is GTX 1060
如果说RX 480让我们看到了AMD一贯较高的性价比的话,那么GTX 1060当真让我们刮目相看,原来N卡也可以有这么高的性价比,老黄果然听取了玩家对GTX 960低规格的吐槽,真正良心了一回。在同样的价格下,后发制人的GTX 1060的性能更强、功耗更低、更清凉,唯独显存比RX 480少了2个G,但这种级别的卡,6G显存和8G显存的区别并不明显,因此可以说这一轮“军备竞赛”是NVIDIA占了上风。
当然,GTX 1060能有如此价格也是因为率先发布的RX 480,在性能层面,根据GTX 1080和GTX 1070来看,性能提升两级是这代Pascal的惯例了,也就是说GTX 1060一开始就被设定为GTX 980级别的性能,但价格则完全是根据先发布的RX 480来定的。可以说这一次老黄没有手软,价格拉到和A卡一样,继续挤压AMD的市场份额,不让AMD通过主流消费市场收复失地,这无疑会对AMD产生较强的冲击,AMD要想继续保证RX 480的销量就不得不下调价格。然而根据小道消息,RX 480成本很高,1999元的售价已经算是薄利多销,不知道AMD未来是否会对RX 480的价格有一个较大的调整。
优点已经显而易见了,那么这卡的缺点在哪里?SLI功能的取消无疑算是很大的一个缺点,虽然用甜点级显卡组SLI的人确实不多,但仍有一部分“囊中羞涩”的朋友愿意选择双卡而不是旗舰单卡。另外,该卡的用料也是符合NVIDIA一贯的“寒酸”设计。GTX 1060 Founders Edition采用3+1相供电,与对手RX 480的6+1相供电相比的确没啥可比性。此外,192bit位宽也是稍微低了点,AMD的甜点级显卡则一直使用256bit的位宽,NVIDIA这样设计无非是拉开不同定位产品间的差距,更是出于节约成本的考虑。最后,有关GTX 1060 FE辅助供电接口的问题我已经不想再吐槽了,只能说确实比放中间好看一点......
由于GTX 1060的性能接近GTX 980,所以在首测中笔者我更多地是用它们俩相互对比,但别忘了,GTX 1060是GTX 960的继任者,那么同GTX 960比,GTX 1060有了多大的提升?官方称GTX 1060有着GTX 960大约2倍的游戏性能和3倍的VR性能,在TDP不变的情况下,这个数字是相当惊人的而根据基准测试显示,GTX 1060有着GTX 960约1.8倍的性能,这种提升可以称之为飞跃。
最后跟大家说一说GTX 1060的版本问题。就目前情报来看,GTX 1060在国内只有非公版产品,这也正是为什么在前几天NVIDIA公布GTX 1060价格时,官方并未向之前一样透漏GTX 1060 Founders Edition价格的原因,这可能会让对GTX 1060公版感兴趣的玩家大失所望了,想要买一块就只能海淘或托友人代购。新的GTX 1060将甜点级显卡性能拉到新高度的同时,也将NVIDIA甜点级显卡的价格抬升到了一个前所未有的高度,不管怎样,全新GTX 1060的性价比还是非常之高的,喜欢的朋友不用犹豫,赶紧入手一块吧!