1开普勒终极旗舰正式发布
当所有人都以为Kepler的故事已经落幕的时候,NVIDIA带来了返场的高潮。
也许NVIDIA的粉丝们还沉浸在GeForce GTX 780Ti强悍性能所带来的震撼当中,这震撼的余韵并没有持续太长时间。2014年2月18日北京时间22时,NVIDIA再次将自己旗下的单芯旗舰级显卡推到了新的高度。这次所发布的,是新一代的“不是显卡”的显卡——GeForce GTX Titan Black Edition。
GeForce GTX Titan Black Edition
其实关于GeForce GTX Titan Black Edition的传闻一直都有存在,只不过各种神乎其神的坊间消息都在左或者右之间摇摆。现在,谜底终于可以揭晓了,GeForce GTX Titan Black Edition真正地摆在了人们的面前。事实证明,这是一款强大,但又可以说并不出人意料的旗舰产品。因为GeForce GTX Titan的经验,GeForce GTX Titan Black Edition的许多特质都是我们所熟悉的。
那么关于这块全新的“不是显卡”的显卡,究竟有那些特质在等待着我们呢?在接下来的测试当中,就让我们一起亲眼目睹这块新卡皇的真容吧。
2GTX TITAN Black规格一览
● Titan Black规格一览
GeForce GTX Titan Black Edition与我们之前所见的GeForce GTX Titan同属GK110架构。它采用全规格的GK110-430-B1芯片,拥有71亿的晶体管规模,核心面积因此达到了533平方毫米(此为NVIDIA公布数据),这一数值并未超越NVIDIA在DirectX 11时代所划D线上空间(什么是D线和D线上空间上限? 它会导致怎样的问题?)的上限(529+52.9平方毫米),甚至进一步下行到了D线本身的附近,只要再小5平方毫米就可以到达D线以下了。与GeForce GTX Titan相比,其运算资源总量从2688个ALU上升到了2880个,Texture Filter Unit由224个上升到了240个,构成后端的ROP则维持了满规格的48个。GeForce GTX Titan Black Edition拥有Kepler架构中最庞大的MC结构,6个64bit双通道显存控制器组合形成了384bit显存控制单元,GeForce GTX Titan Black Edition采用了6188MB的尺寸的显存体系。
注:市场售价均为官方首发限价
得益于生产经验累积所带来的可制造性要素提升,GeForce GTX Titan Black Edition的默认核心及显存运行频率在Titan的基础上被进一步提升到了889/7000MHz,默认Pixel Fillrate能力为42.6Gpixels/S,默认Texture Fillrate能力为207.3G/S,显存带宽336GB/S。Titan Black Editon拥有5.11T Flops/S的单精度浮点运算能力,同时其Titan的身份也带来了近乎完整的生产力属性,Titan Black Edition的双精度浮点运算能力未被限制,GeForce GTX Titan Black Edition保留了1/3速DP的运算特征,双精度浮点运算能力为1.7T Flops/S。
GeForce GTX Titan Black Edition
GeForce GTX Titan Black Edition是最完整规格的Kepler架构显卡产品,其上开放了Kepler架构全部功能性设计和特点,这些特点主要由以下主要的部分组成:
1、更加成熟的基于HKMG的TSMC 28nm工艺。
2、5单元的宏观并行结构,15组SMX单元被分为5个GPC,每个GPC包含3组SMX。
3、15组包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMX单元。每个SMX单元的细节同GK104完全相同,均包含一组改进型的负责处理几何任务需求的PolyMorph Engine,192个负责处理运算任务及Pixel Shader的ALU,16个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,二级线程管理机制以及与它们对应的shared+unified cache等缓冲体系。
4、基于Dynamic Parallelism的全新本地任务管控机制,以及由此带来的更高的单元复用率。
5、调节粒度更细同时频率控制范围更大的新一代GPU Boost。
6、由GPU Boost 2.0发展而来的新一代Power Balance功能。
Kepler构架曾经是一个充满了神秘感的存在,伴随着GK104以及GK110的陆续发布,我们在过去的一年多里曾经对它的各种细节,诸如ALU团簇单元、Cache、线程仲裁机制、动态频率调节体系等等进行过相关的分析。值此GeForce GTX Titan Black Edition发布之际,Kepler架构的最终形态最完整的展现在了我们的面前。所以接下来,就让我们一起深入的回顾一下Kepler架构“黑科技”的真正内幕吧。
3再读GK110的宏观并行体系
● 再读GK110的宏观并行体系
NVIDIA于Fermi架构中首次引入了宏观并行结构设计,它将若干组ALU团簇绑定为一个GPC,并辅以完整的几何处理及光栅化流水线,这让每个GPC因此成了与传统GPU同等级的存在。在执行符合DirectX 11特征的程序时,一级任务管理机制只需将Kernel并行的发放给不同的GPC,即可达成整个架构的并行kernel处理过程。因此这种设计不仅可以比较直接的为架构带来更好的几何和光栅化处理能力,同时还可以提升任务的执行效率。
与去年发布的GK104不同,NVIDIA在GK110架构中使用了新的宏观并行结构。GK104的8组SMX单元被两两分组结合成一个GPC,整个架构的8组SMX单元被划分成了4 GPC并行的形式。而GK110则是将15组SMX单元以三组为单位结合成一个GPC,整个架构被划分成了5 GPC并行的形式。
完整规格GK110架构图
由于NVIDIA采用了Setup以及Rasterizer同GPC绑定的方案,因此GK110架构可以实现单周期输出5多边形,在同频下拥有了比GK104多20%的多边形泵出能力以及光栅化处理能力。
宏观并行度的进一步提升有助于体系在处理并行Kernel时的效率,但从外表上来看GK110对于宏观并行度的提升与其运算单元(SMX/ALU)规模的提升并不成比例,单个GPC的规模较之GK104提升了50%,这样的做法给人一种整个架构开始偏重于吞吐而非强调任务效率以及单元复用率的感觉。这是否意味着NVIDIA打算放弃坚持了多年的既有设计思路,开始放弃效率并转向提升架构的吞吐能力了呢?
完整规格GK110恐怖的规格和吞吐能力是否意味着效率会下降呢?
事实并非如此,因为NVIDIA在GK110中为我们带来了另外两个重要的特性——Dynamic Parallelism和Hyper-Q,这两个特性不仅极大地提升了整个架构的任务效率/密集度,同时将单元复用率以及整个Kepler架构的意义提升到了一个全新的高度。
4最重要特性——Dynamic Parallelism
● 最重要特性——Dynamic Parallelism
在GK110架构中,NVIDIA在传统的二级仲裁机制CWD(CUDA Work Distributor,CUDA分配器)之外加入了全新的GMU(Grid Management Unit,Grid管理单元),GMU可以对CWD收到的Grid进行启停管理、回收、判断、挂起以及重排序等操作,令其以更加灵活的方式在必要时进入执行单元,这避免了Grid像过去那样以缺乏排序的顺序模式被送入SM,而且一旦进入SM之后就只能等到全部执行结束才能出来。
Dynamic Parallelism特性
GMU的引入为动态片上创建Kernel提供了条件,所以NVIDIA在GK110中引入了全新的Dynamic Parallelism(动态并行)特性,该特性允许GPU根据需要直接对Grid的结果进行判断并在本地创建新的Kernel,这与传统的Kernel执行完毕之后由CPU进行回收判断并创建新的Kernel再行发放有了很大的不同。
Dynamic Parallelism带来的变化(传统模式 VS Dynamic Parallelism)
Dynamic Parallelism减少了GPU同CPU之间的通讯需求,减轻了与CPU频繁通讯所带来的等待周期产生的延迟影响,提升了GPU内部的Kernel密度和执行连贯度,对于低负载高密集任务中单元复用率改善有不小的帮助。
5“送出去,请进来”
● “送出去,请进来”
从去年GK104架构发布之后起,我们在过去接近一年的时间里一直都在尝试着去解析Kepler架构的真实目的和意义。但遗憾的是由于NVIDIA的产品定位以及发布策略的困扰,Kepler架构的特性并没有在GK104中得到完整的阐释,我们的讨论也仅能止步于“黑科技”以及“将寄存器设计水平优势转化成性能功耗比”这样的程度。
伴随着GK110的发布,Kepler架构的完整特性终于全部来到了我们的面前,尤其是Dynamic Parallelism和Hyper-Q的出现,为我们进一步勾勒出了更加丰满的Kepler架构的轮廓。它们与已经先期在GK104及其后的所有Kepler架构中出现的新Scheduling过程一起为我们带来了Kepler区别于以往架构的最大特点,那就是“送出去,请进来”。
Kepler构架与Fermi构架执行Scheduling过程的差异
通常来讲,可重复性较低且需要运算过程的判断性工作并不适合固定单元来执行,更加灵活的具有可编程性的通用运算单元来完成这类工作会比较得心应手。而那些具有较高可重复性,过程相对固定且基本具备可预期性的控制类工作,则更加适合具有特定针对性功能的电路来完成。如果我们以可编程的通用处理单元来完成判断性工作,让控制工作更多地被特定功能电路所执行,就可以达到最高效率的利用不同单元,以最低的能耗来完成最多工作的目的。
但是很遗憾,Kepler之前的GPU并没有这样的获得最高性能功耗比的幸运。传统结构的GPU会在芯片本地以固定电路自行处理绝大部分具有判断性特征的Scheduling过程,而Kernel的启停和发放则完全依赖CPU,这实际上等于是通过通用处理单元来完成本该由更高效的特定功能电路或者说专用单元来完成的工作。这种让专用电路干通用电路的事,让通用处理器做专用单元的事的局面,与性能功耗比的诉求完全是相反的。
Pre-Scheduling过程变化(图片修改自后藤弘茂先生博客)
在Kepler中,NVIDIA实际上完成了一个“送出去,请进来”的过程——把一部分Scheduling过程从本地“送出去”,也就是转移到了CPU中以运算的形式来完成,同时通过引入GMU单元以及添加Dynamic Parallelism特性来降低CPU控制对任务的介入和影响,将控制工作更多地“请进来”,亦即移动到本地的GMU完成。这种执行位置和执行对象的互换扭转了过去“满拧”的局面,将适合通用处理单元的工作从GPU中拿出来交给了通用处理单元,也将不适合通用处理单元完成的工作交还给了GPU中的固定单元来完成,从而达到了各种单元均可以以更合适的功耗完成更多工作的目的。
Dynamic Parallelism的片上直接Kernel创建特性减小了CPU对控制的介入
关于将Scheduling移交给通用处理器完成的目的和意义,我们在过去的一年多里已经进行了详尽的分析和解读,这是一个与NVIDIA未来架构发展息息相关的系列过程,在这里不再赘述,有兴趣的朋友可以点击这里阅读。而引入Dynamic Parallelism则带来了更多显而易见的好处,无论是计算任务还是图形处理任务,Kernel现在都无需亦步亦趋的频繁与CPU进行交换,GPU本地的任务密度将会得到进一步的提升,在此基础上,Hyper-Q的出现让更多的CPU线程可以向GPU发送Kernel,这进一步减少了GPU等待前端发放任务的周期并提高了任务密度。两者的共同作用导致了必然的结局——GK110架构的单元任务密度将进一步提升,单元复用率也将会因此而获益,这对于GPU的图形执行效率和运算执行效率是同样有益的。
6再议Kepler架构的目的和意义
● 再议Kepler架构的目的和意义
通过GK110的“送出去,请进来”,我们已经可以明确的掌握Kepler架构的目的和意义了——Kepler架构的目的在于在NVIDIA从G80一直延伸到Maxwell及其后架构的路线图中扮演承前启后的角色,它尝试着将一部分逻辑判断性任务交给通用处理器执行,同时将一部分不适合通用处理器执行的控制性工作转移到对应的专用单元来处理,以厘清任务执行地点和执行特征、优化任务处理对象的选定、积累通用处理器使用经验以及收集执行过程中的能耗比特征等一系列手段,为未来Maxwell融合架构中最终接纳ARM架构通用处理器打下了必要的基础。
Maxwell的后续——Echelon架构细节
而Kepler架构的意义则更加单纯,那就是强调性能功耗比属性。让合适的单元以尽可能合适的功耗去完成尽可能合适它们完成的任务,进而让整个架构以更小的功耗达成更大的性能输出能力,这就是Kepler架构最突出的特征和意义。我们在过去一年间面对的以及等待的各色“黑科技”,包括高效的register体系、新Scheduling过程、GPU Boost以及Dynamic Parallelism等等,全部都是为这一意义而存在的。
通过调节SMX结构提升体系的吞吐能力,同时以优秀的缓冲体系、合理的仲裁和任务管理机制以及各种全新的技术来保证体系的单元复用率以及执行效率,这种平衡的理念赋予了Kepler架构强大的性能和成熟稳健的性能功耗表现。Kepler架构的注意力并没有片面的集中在某些特性或者单纯运算能力的提升上,它对任务分派管理机制的调整和改进属于最底层的架构效率优化,正是这种能够让所有架构中运行的任务,无论是运算任务还是图形任务均能受益的改动,为Kepler带来了令人难忘的表现。
G80~GF100架构发展示意,向你们致敬(图片引自后藤弘茂先生博客)
当然,我们同样不能忘记那些站在Kepler背后的英雄们,Kepler之前诸架构对于任务管理体系的不断完善,寄存器及寄存器溢出缓冲体系使用经验的积累,架构设计理念的逐步验证、检讨和补充修正同样是造就Kepler架构的成功的重要因素,而正确平衡成本关系并在DirectX 11时代的起点划下了空间充分的D线,又在可制造型层面为Kepler架构的最终实现奠定了最根本的基础。NVIDIA充分的计划性和推进这些计划的执行力,逐渐将这些积累转化成了实际的架构和产品,并最终带来了今天我们所见到的基于GK110架构的产品——GeForce GTX Titan Black Edition。
除此Dynamic Parallelism之外,GK110架构还将更多更新的技术引入到了体系当中,其中最典型的就是全新的GPU Boost——GPU Boost 2.0。
7GPU Boost 2.0+G-SYNC
● GPU Boost 2.0+G-SYNC
GPU Boost是NVIDIA在GK104中首先引入的动态功耗/性能平衡调节机制,它可以动态游戏及应用负载,并将负载同设计功耗上限进行比较,接着将实际负载同设计功耗上限之间的差值转化成实时频率的提升,同时还能根据用户自定义的游戏帧数上限来判断性能需求,进而将多余的性能以降频的形式予以消去,并最终让用户获得更低的使用能耗。
GPU Boost 2.0
伴随着GK110架构的到来,NVIDIA将GPU Boost从1.0升级到了全新的2.0版本,新版本GPU Boost支持以下新特性:
>> 更细腻和敏感的频率调节段位。
>> 温度监控出现在控制要素中。
>> 更加集中于“常规使用温度区间”的性能调节区间。
>> 拥有更大的电压调节上限。
>> 支持全新的电压上限/温度联动调节功能,GPU温度越低,可用的电压上限就越高。
>> 支持温度目标值设定及对应的自动调节频率功能。
>> 更多可调节选项。
>> 显示器刷新率调节功能。
GPU Boost 2.0比1.0版本更加敏感,可以更加积极的完成功耗和性能之间的互换,其调节模式也发生了变化,监控机制对GPU频率的调节判断机制将不仅限于功耗数值,温度因素现在也已经被纳入到了判断机制当中。在GPU Boost 2.0默认控制下,Kepler架构GPU将会在更多的时间里处于80度附近这样一个小范围的温度区间中。玩家现在除了可以通过限定自定义帧数上限来达到节能降耗的目的之外,还能通过设定任意的自定义温度上限来达到相同的目的。
除了加入温度要素之外,GPU Boost 2.0还开放了电压控制的上限,玩家在进行超频时可以拥有更大的电压可调空间。另外,电压上限还可以与温度因素进行联动,如果玩家有能力改造散热并达到更低的使用温度,那么在GPU Boost 2.0中将可以获得比常规散热更多地电压上限空间。
GPU Boost 2.0引入的最后一个值得注意的变化来自全新的显示器刷新率调节能力,该能力目前已经演化成了更为完善的G-SYNC技术,这项NVIDIA于2013年蒙特利尔媒体日上发布的全新技术从根本上解决了画面的卡顿及撕裂问题。我们会在未来展开针对该项特性的专门解析和测试,敬请期待。
8精彩的分享——ShadowPlay
● 精彩的分享——ShadowPlay
作为NVIDIA全新推出的游戏分享技术,ShadowPlay并非GeForce GTX Titan Black Edition的专属新特性,但它在后者的服役生涯中同样会扮演重要的角色。该技术由Kepler GPU以及GFE软件两部分所组成,其作用在于以近乎无损性能的方式在游戏过程当中实时完成高清游戏视频的截取,同时完成近乎实时的上传分享。
全新游戏视频截取技术——ShadowPlay
ShadowPlay的视频截取过程可以充分GK110 GPU的硬件来完成视频编码过程,整个过程不会占用额外的CPU以及其他系统资源,因此对实际游戏帧数影响甚小。根据大会现场NVIDIA所演示的游戏实况,ShadowPlay即便是在进行1080P分辨率视频的实时录制时,对游戏的帧数影响也可以控制在1~2帧左右,几乎达到了无损的程度。
ShadowPlay同时支持从普通的480/720P一直到Full HD的1080P在内的多种不同分辨率的视频录制,同时还可以通过GFE软件简单实时地完成视频分享过程,视频上传到网络中的整体延迟仅为当前画面后2~3秒左右,这几乎等同于现场直播你的游戏过程。借由GeForce GTX Titan Black Edition来实现实时的将逼真的高清分辨率游戏过程进行分享的感受,这是传统硬件以及其他解决方案无法提供的。
9映众TITAN Black游戏至尊版拆解赏析
● 映众GTX TITAN Black游戏至尊版拆解赏析
映众GTX TITAN Black游戏至尊版
映众GTX TITAN Black游戏至尊版
映众GTX TITAN Black游戏至尊版
GTX TITAN Black/GTX TITAN产品PCB对比
GTX TITAN/TITAN Black/780Ti显卡PCB对比
10测试平台软、硬件环境一览
● 测试平台硬件环境一览
为保证测试能够发挥显卡的最佳性能,本次测试平台由Intel酷睿i7-3970X处理器、ANTEC H1200水冷散热器、技嘉X79芯片组主板、威刚4GB DDR3-1600×4四通道内存、ANTEC HCP-750电源组建而成。详细硬件规格如下表所示:
● 测试平台软件环境一览
为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 7正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用游戏自带Benchmark来衡量性能,数值同样越高越好。
11理论性能测试:3DMark FireStrike
● 理论性能测试:3DMark FireStrike
于北京时间2013年2月5日推出的新3DMark,采用全新界面设计,除了测试分数,还会展现每个场景测试期间的实时曲线,全程记录帧率、CPU温度、GPU温度、CPU功耗。新3DMark取消了传统的E、P、X模式,取而代之的是根据负载不同所推出的三个场景,其中FireStrike专为基于DirectX 11显卡搭建的高端游戏平台,而CloudGate则支持基于DirectX 10环境的主流硬件,IceStorm则支持入门级DirectX 9设备、手机、平板电脑等等。
3DMark FireStrike
通过3DMark FireStrike理论性能测试可以看出,在Extreme模式下,GeForce GTX TITAN Black得分超越所有对手,同时与GeForce GTX 780Ti的性能差距并不明显。
12理论性能测试:3DMark 11
● 理论性能测试:3DMark 11
PC游戏随Windows 7的发布进入DirectX 11时代,众多DirectX 11显卡早已摩拳擦掌上阵厮杀,却迟迟没有一个权威性的基准测试软件来衡量游戏显卡DirectX 11性能的高低。终于,DirectX 11时代的3DMark 11来到大家面前。3DMark 11使用原生DirectX 11引擎,测试场景包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DirectX 11特性。
3DMark 11
通过3DMark 11理论性能测试可以看出,在Extreme模式下,GeForce GTX TITAN Black得分超越所有对手,与GeForce GTX 780Ti的性能差距同样并不明显。
13理论性能测试:Heaven Benchmark 4.0
● 理论性能测试:Heaven Benchmark 4.0
Heaven Benchmark 4.0是一款专门测试DirectX 11效率的软件,由俄罗斯Unigine游戏公司自主研发的引擎设计。该软件拥有类似阿凡达的悬浮岛场景,其中龙雕塑运用了细分曲面技术,抱括岛上的路径和房子的砖块等23个场景的测试得出显卡的最终实际效能,并通过DirectX 11环境带来很强的真实感。
Heaven Benchmark 4.0
通过Heaven Benchmark 4.0理论性能测试可以看出,在2560×1600分辨率、开启8倍抗锯齿,其它特效最高环境下,GeForce GTX TITAN Black的得分再次超越其它产品。
14DirectX 11游戏测试:《孤岛危机2》
● DirectX 11游戏测试:《孤岛危机2》
《孤岛危机2》是《孤岛危机》的续作,游戏采用CryENGINE 3引擎制作。《孤岛危机2》在游戏内容上与一代也有很大变化,已经从秘密的丛林作战转向了公开、大规模的现代城市战争。故事发生在距一代3年后的2023年,外星人在地球上的大片区域挑起了战争,各大城市都遭到攻击,人口锐减,玩家将要进行捍卫地球的末日战争。
《孤岛危机2》
通过DirectX 11游戏《孤岛危机2》测试可以看出,在两种分辨率环境下,GeForce GTX TITAN Black的平均帧数均超过其它对手,不过与GeForce GTX 780Ti的性能差距并不明显。
15DirectX 11游戏测试:《古墓丽影9》
● DirectX 11游戏测试:《古墓丽影9》
《古墓丽影9》将讲述劳拉的首次冒险之旅,主角劳拉·克劳馥的年龄被设定在21岁,那时的她还只是一名刚出茅庐的新人,经验欠缺。随着游戏剧情的发展,玩家将与劳拉共同成长,获得新的武器和道具并习得新技能。在冒险的小岛上,玩家可以在营地对道具进行组合,有些特定区域就需要特定道具和技能才能通过。岛上的各个营地之间可以快捷传送,玩家无需长途跋涉。而除了劳拉外还将有其他角色出现在岛上。
《古墓丽影9》
通过DirectX 11游戏《古墓丽影9》测试可以看出,1920×1200分辨率环境下,GeForce GTX TITAN Black的平均帧数领先优势较为明显,不过在2560×1600分辨率环境下,GeForce GTX TITAN Black与GeForce GTX 780Ti并没有拉开明显的距离。
16DirectX 11游戏测试:《杀手:赦免》
● DirectX 11游戏测试:《杀手:赦免》
《杀手:赦免》采用IO Interactive自主研发的冰川2(Glacier 2)引擎制作,游戏内容都是在引擎下实时进行反馈的,所有动作都是即时生成的。新作主要场景发生在芝加哥,名为代号47的主角在本作中将更加灵活,更好控制。他将可以攀在悬崖边,还可以保持平衡,游戏融入了掩护系统,挟持人持的功能回归。
《杀手:赦免》
通过DirectX 11游戏《杀手:赦免》测试可以看出,在两种分辨率环境下,GeForce GTX TITAN Black的平均帧数领先其它对手,同样的与GeForce GTX 780Ti没有拉开多少差距。
17DirectX 11游戏测试:《地铁:最后曙光》
● DirectX 11游戏测试:《地铁:最后曙光》
《地铁:最后的曙光》讲述一场为争夺足以毁灭人类的世界末日装置的内战。人类依旧苟活在地下等死,不同派系之间的战争还在继续,晚上依旧有各种变异生物潜伏在暗处。地面依旧是各种毒气,但有传言冰层开始融化,阳光开始穿透云层。
《地铁:最后的曙光》
通过DirectX 11游戏《地铁:最后的曙光》测试可以看出,1920×1200分辨率环境下,GeForce GTX TITAN Black的平均帧数领先优势较为明显,不过在2560×1600分辨率环境下,GeForce GTX TITAN Black与GeForce GTX 780Ti并没有拉开明显的距离。
18DirectX 11游戏测试:《尘埃3》
● DirectX 11游戏测试:《尘埃3》
《尘埃3》是由Codemasters制作发行的一款赛车竞速单机游戏,《尘埃3》采用与《F1 2010》同样的Ego引擎,拥有更加拟真的天气系统及画面效果。游戏将包含冰雪场景、动态天气、经典的赛车、分屏对战、party模式、开放世界、更多真实世界中的赞助商和车手等特点。
《尘埃3》
DirectX 11游戏《尘埃3》的测试结果刚好与《地铁:最后的曙光相反》,GeForce GTX TITAN Black在1920×1200分辨率环境下的平均帧数与GeForce GTX 780Ti没能拉开差距,反到2560×1600分辨率环境下的平均帧数差距比较明显。
19DirectX 11游戏测试:《蝙蝠侠:阿甘之城》
● DirectX 11游戏测试:《蝙蝠侠:阿甘之城》
《蝙蝠侠:阿卡姆之城》(Batman: Arkham City)是2009年最佳动作游戏《蝙蝠侠:阿卡姆疯人院》的续作,由华纳兄弟出品,该作由Rocksteady工作室负责开发,世界架构仍然建立在《阿卡姆疯人院》的气氛上,不过这次上升至阿卡姆之城——高谭市内戒备森严的,关押了大量暴徒的监狱之中。新作汇集了众多明星参与的配音阵容以及蝙蝠侠中的极度凶残的恶棍,并改进和加强了一游戏特点,让玩家们拥有像《蝙蝠侠:黑暗骑士》一般的终极游戏体验。
《蝙蝠侠:阿甘之城》
GeForce GTX TITAN Black在DirectX 11游戏《蝙蝠侠:阿卡姆之城》中的测试结果与《尘埃3》其本相同,GeForce GTX TITAN Black同样在2560×1600分辨率环境下明显领先GeForce GTX 780Ti。
20DirectX 11游戏测试:《生化奇兵:无限》
● DirectX 11游戏测试:《生化奇兵:无限》
《生化奇兵:无限》将玩家带往1912年,那是巨型飞艇和浮空飞行器的全盛时期,在此背景下诞生了海底销魂城的前辈,即天空之城“哥伦比亚”:这座远离美国海岸自成一体的空中城市在信众的欢呼声中扶摇直上,寄托了美利坚强国之梦,但因其不可告人的目的使其似锦前程不久便急转直下,武装到牙齿的狰狞面目把原本光荣正确伟大的阿波罗登月变成邪恶的死星计划,整座城市消失在云端中自此再无人知晓。
《生化奇兵:无限》
通过DirectX 11游戏《生化奇兵:无限》测试可以看出,在两种分辨率环境下,GeForce GTX TITAN Black的平均帧数均领先其它产品,同时也没有与GeForce GTX 780Ti拉开明显的差距。
21GTX TITAN Black运行温度/功耗测试
● GTX TITAN Black运行温度测试
GTX TITAN Black待机温度
旗舰显卡满载温度测试对比
通过温度测试可以看出,GeForce GTX TITAN Black的Furmark满载温度与GeForce GTX 780Ti基本相同,略高于GeForce GTX TITAN。同时相比Radeon R9-290X/290,前者的温度优势也要更明显一些。
● GTX TITAN Black运行功耗测试
通过功耗测试可以看出,GeForce GTX TITAN Black的满载功耗与GeForce GTX 780Ti基本相同,略高于GeForce GTX TITAN。与满载温度相同的,GeForce GTX TITAN Black的满载功耗相比Radeon R9-290X/290仍然拥有不小的优势。
22全文总结:返场的高潮
● 测试总结——返场的高潮
对于GeForce GTX Titan Black Edition而言,结局其实早在测试开始之前就已经注定了。这是一款当之无愧的单芯性能旗舰,它承袭了GK110的全部特征,在没有明显提升功耗和使用温度的前提下提供了当前最强的游戏性能,在继续维持功耗和温度优势的同时进一步扩大了NVIDIA的性能优势。在此基础上,保留生产力属性的GeForce GTX Titan Black Edition在定价方面比Tesla更有亲和力,它比后者更适合个人及非集群超级运算场合的应用。
GTX TITAN Black/TITAN
GeForce GTX Titan Black Edition为GK110架构的单芯显卡画上了完美的句号,在同样的制程和工艺下,它在功耗和性能功耗比层面的表现依旧与竞争对手形成了鲜明的对比,这让它成了D线作用的完美阐释,同时也为我们进一步发展D线理论提供了极其重要的支撑和补充。
GeForce GTX Titan Black Edition是当之无愧的单芯王者
GeForce GTX Titan Black Edition的定位于Titan相同,因此除了追求超大分辨率和极限设置的骨灰级游戏玩家以及NVIDIA最忠实的拥趸之外,程序员、个人及小型团体、还有资金并不充裕的院校科研组织都是这款显卡的目标用户。GeForce GTX Titan Black Edition的特性虽然注定了其无法同Tesla一样搭建大规模集群,但以单节点而言,两者并没有本质区别,这让GeForce GTX Titan Black Edition成了程序迁移/快速调试、小规模个人超级计算以及通用计算属性试用体验的理想选择。当然,如果您想获得最完整的生产力属性,购买成规模的Tesla来组建集群依旧是最佳选择。
作为单芯Kepler架构产品的绝唱,GeForce GTX Titan Black Edition无疑是冲击单芯显卡性能及性能功耗比顶峰的又一位胜利者,它的强大源自NVIDIA的长期积累以及对Kepler架构的成功释放,而这些积累则获益于NVIDIA对GPU业务的专注和坚韧。随着Maxwell架构的发布,NVIDIA正在用自己的实际行动延续着这种专注和坚韧,我们希望更为强大的完整版Maxwell架构能够给我们带来更多的惊喜,再次为我们带来激动人心的强大GPU产品。
Titan的传奇能否延续,就让我们拭目以待吧。