热点:
    ZOL首页 > 显卡 > 评测 > 正文
    首席编辑

    GPU炼金试验室 GK110核心/显存关系解密

      [  中关村在线 原创  ]   作者:
    收藏文章 分页阅读 暂无评论
    返回分页阅读本文导航
    产品:GeForce GTX 780 NVIDIA 显示芯片

    1Kepler架构依赖显存带宽么?

      前言:在间隔将近一年之后,《GPU炼金试验室》终于又回来了。在这档探讨显卡性能现象背后本质的连载文章中,我们曾经和屏幕前的您一起观察过Tahiti与Pitcairn的效率之谜,直面了Kepler架构对处理器的依赖以及新Scheduling过程背后的真相及意义,还探讨过非对称显存的种种是非功过,我们非常享受这些过程,希望您也同我们一样享受发掘现象背后的本质的过程。在中断近一年之后,重新恢复连载的《炼金试验室》又将面对哪些新的隐藏在现象背后的真实呢?

      伴随着GK110的到来,完整的Kepler架构终于在2013年初正式来到了世人的面前。从“不是显卡”的Titan一直到最小号的GeForce GT 640,Kepler架构已经成了NVIDIA在民用显卡市场中的销售主体。这不仅意味着一个全新显卡时代的来临,同时也意味着我们全面审视这一架构的时机已经成熟了。

      那么,Kepler架构究竟是一个怎样的架构?

    GPU炼金试验室 GK110核心/显存关系解密

      抛去“性能功耗比新高”或者“游戏玩家甄选”之类没多少具体意义的名号,我们眼前的kepler架构其实是这样的——这是一个核心面积从118一路延伸到560平方毫米的庞大芯片家族,同时也是显存位宽“花样”最多的芯片家族,64bit、128bit、192bit、256bit以及384bit的全员到齐不仅像一次显存控制器博览会,而且还在细分市场并产生产品性能及定位差距的同时引发了玩家们层出不穷的疑问甚至论战。

      Kepler架构通过显存位宽进行的市场细分多于对手,这是不是说明Kepler是一个对显存依赖度极高的架构么?显存带宽对Kepler架构意味着什么?我们手中的GeForce GTX 7XX/6XX显卡,其显存带宽究竟够不够用呢?如果不够用,我们又该怎么办呢?

    拉开新一代显卡的帷幕 GTX780首发测试
    Kepler架构究竟是不是一款“适宜”的架构?

      为了探寻这些问题的答案,我们企划了一次多篇连载的全新《GPU炼金试验室》内容。在这一系列的炼金试验室栏目当中,我们将对Kepler架构的大部分成员,包括GK110、GK104以及GK106进行一些有趣的实验,并为您解析这些数据背后的意义。

      以结构而言,本篇以及即将到来GK104/GK106篇均为实验过程及结果展示,我们并不会在这一准备环节进行大规模的深入探讨,所以屏幕前的各位大可放心的轻松阅读,您完全可以先把它们看作是告诉您“Kepler架构怎么超频更划算”的应用文字。等到您确实做好准备之后,我们将会在最终篇当中总结庞大数据间深层次的规律,并为您呈现这些数字与现象背后的意义。

    频道文章推广模板(更新日期:2013.06.06)

    频道文章推广模板(更新日期:2013.06.06)

    频道文章推广模板(更新日期:2013.06.06)

    频道文章推广模板(更新日期:2013.06.06)

    频道文章推广模板(更新日期:2013.06.06)

    频道文章推广模板

    频道文章推广模板(更新日期:2013.06.06)

    频道文章推广模板(更新日期:2013.06.06)

    频道文章推广模板(更新日期:2013.06.06)

    频道文章推广模板(更新日期:2013.06.06)


     

    》现在去显卡道转转《 | 》看看今日最新文章《

    》显卡精彩美图汇总《

    产品:GeForce GTX 780 NVIDIA 显示芯片

    2在混沌中寻找规律

      ● 在混沌中寻找规律

      既然是GPU炼金试验室的内容,做实验并以实验结果来推导出结论就成了必不可少的环节。那么我们的问题就来了——一个架构对显存的依赖程度,究竟要以怎样的实验形式来进行体现呢?

      显卡是一个将运算和缓冲结构合并在一起的复杂体系,其运算结构尤为复杂。硬件渲染过程会被划分成多个不同的步骤并交由GPU内部的不同部件去完成,无论几何处理、光栅化、材质操作、Pixel Shader还是最终的输出,任何一步执行的快慢都会对显卡的最终性能产生影响,如果要细化的去探讨每一个细节,我们很有可能会迷失在一片由细节构成的混沌的迷宫当中。

    GPU大百科全书最终章:33毫秒的咏叹调
    想迷失在这样的流水线当中么

      所以,我们决定暂时略去过多的细节(当然,仅仅是“暂时”略去。随着实验的继续,我们还是会不可避免的触及某些细节。不过敬请放心,我们会控制好深度,而且这些细节也不会在本文中出现。),先将纷繁复杂的GPU逻辑架构看成一个不可划分的整体。以GPU作为整体来讨论的话,显卡就可以被划分成负责运算和操作的核心,以及负责为运算以及操作过程提供缓冲的显存两个部分了。而决定这两个部分性能表现的要素,也就可以被相对简单的转化成频率这一直接表征要素了。

      对于一颗GPU核心而言,更高的频率意味着更大的运算能力,意味着同样的任务将可以被更快的执行完毕。而更高的显存频率则意味着显存体系可以提供更大的带宽,并且更好的为GPU的运算和操作过程提供缓冲。对于一块“搭配适宜”的架构,或者说非显存依赖性架构而言,GPU核心运算能力增长应该总能够带来最终性能的提升。显存带宽的提升对于这样的GPU架构而言应该是锦上添花而非雪中送炭,甚至在某些特定的频率范围内,显存带宽的提升将可能无法被转化成直接的性能提升。

    继续后发制人?新开普勒GTX780架构展望
    GeForce GTX 780架构图

      用更加通俗直白的语言来形容,就是“如果超核心所带来的性能提升大于超显存所带来的提升,同时超显存可能还会遇到没什么性能提升的时候,那这就是款非显存依赖的架构”。所以如果想要回答前页中的那些问题,我们要做的事其实就是观察不同核心及显存频率下显卡的性能。

      基于这样的原则,我们决定设计如下实验过程:以测试显卡的默认核心频率(以下简称CC,Core Clock)及默认显存频率(以下简称MC,Memory Clock)为基准,以10%为频率调节幅度,对不同核心/显存频率的显卡性能进行测试。在将核心频率从90%调节至120%的同时,我们分别将显存频率在特定核心频率状态下从80%调节至120%,由此便产生了共计20组不同的核心及显存频率搭配方案,以及与之相对应的20组性能测试结果。  

    GPU炼金试验室 GK110核心/显存关系解密
    达成频率组合的工具:NVIDIA Inspector(Titan+320.39驱动视角)

      以我们今天测试的GeForce GTX 780为例,测试产生的第一组数据为“90%CC+80%MC”,其含义为90%默认核心频率搭配80%默认显存频率。公版GeForce GTX 780的默认频率为863/6008MHz,此基准频率便是CC+MC搭配方案的频率,而90%CC+80%MC数据组的频率即为777/5408MHz。相对应的,最后一组120%CC+120%MC的含义为核心及显存同时超频20%,即频率为1035/6608MHz。中间各组搭配方案,其频率皆依此规则来确定。

      测试方案虽然复杂,但这样的测试过程可以带来不少好处——我们不仅可以在一个相对宽泛的频率区间(30%核心频率变化,40%显存频率变化)内观察不同核心及显存频率搭配之后的显卡性能情况,同时还能收获一个额外的副产品,那就是不同核心及显存频率提升幅度对显卡性能提升的贡献程度,这对于超频玩家来说应该算是一个不错的好消息。

      好了,接下来就让我们从GK110架构的旗舰级显卡——GeForce GTX 780开始我们的实验之旅吧。

    产品:GeForce GTX 780 NVIDIA 显示芯片

    3测试平台一览

      ● 测试平台一览 

      本次测试的平台由Intel 酷睿i7-3960X处理器、X79芯片组主板、威刚16GB DDR3-1600四通道内存组成。详细硬件规格如下表所示:

    测 试 平 台 硬 件 环 境
    中央处理器 Intel Core i7-3960X
      (6核 / 12线程 / 3.3GHz / 15MB L3)
    散热器 Sapphire Vapor-X
      (单塔风冷散热器)
    内存模组 ADATA XPG DDR3-1600 4GB × 4
      (SPD:9-9-9-24-1T)
    主板 GIGABYTE GA-X79S-UP5-WIFI
      (Intel X79 Chipset)
    硬盘 Seagate Barracuda 1TB
      (1TB / 7200RPM / 32MB缓存 / SATA3)
    电源 Antec HCP-1000
      (80Plus Platinum / 1000W)
    显示器 DELL Ultra Sharp 3008WFP
      (30英寸LCD / 2560×1600分辨率)

    ● 测试平台软件环境一览

          为保证系统平台具有最佳稳定性,本次测试所使用的操作系统为Microsoft Windows 7正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示:

    测 试 平 台 软 件 环 境
    操作系统 Microsoft Windows7 Ultimate RTM SP1
      (64bit / 版本号:7601)
    主板芯片组驱动 Intel Chipset Device Software
      (WHQL / 版本号:9.2.3.1022)
    NVIDIA显卡驱动 NVIDIA Forceware
      (WHQL / 版本号:320.18)
    声卡驱动 Realtek HD Audio Driver
      (WHQL / 版本号:R3.65)
    桌面环境 Microsoft Windows7 Ultimate RTM SP1
      (2560X1600/32bit/60Hz)

       我们使用NVIDIA Inspector软件对频率进行调节,在进行120%CC+120%MC这样的幅度相对较大的超频时,我们会将PowerLimit从默认的100%提升至106%,同时进一步提升核心的工作电压,特此说明。

    产品:GeForce GTX 780 NVIDIA 显示芯片

    4跑分爱好者的“行为指南”

      ● 跑分爱好者的“行为指南”

      虽然我们今天要进行的主要活动是对于GK110架构核心/显存关系的探讨,但这一探讨所产生的副产品其实更容易吸引人们的兴趣——既然关于核心/显存与性能的关系可以非常直接的转化成OC爱好者们超频跑分的指导意见,那么在实验数据收集环节,我们就先行展示理论测试部分,亦即3Dmark 11的测试结果吧。

    性能已超GTX680四成? Titan性能首测
    3Dmark 11

    GPU炼金试验室 GK110核心/显存关系解密
    GeForce GTX 780不同核心/显存频率搭配方案3Dmark 11测试结果

      在3Dmark 11的测试中,GeForce GTX 780所在的GK110架构表现出了明显的非显存带宽依赖特征。核心频率无论处在最低的777MHz(90%CC)还是最高的1035MHz(120%CC),我们让显存频率波动40%所带来的分数变化都不明显。与之相对应的,核心频率提升10%所带来的分数提升甚至超过了显存频率提升40%所带来的增长幅度。

      好吧,这样的结果应该无需我们多言了,如果您以OC然后刷新3Dmark 11名人堂的排名为乐,那么对您而言,超GeForce GTX 780的核心频率所带来的收益要明显大于超显存。

    产品:GeForce GTX 780 NVIDIA 显示芯片

    5更有意义的部分——游戏性能测试

      ● 更有意义的部分——游戏性能测试

      显卡最终的目的依旧是游戏,无论我们是要研究规律还是要获取有意义的超频建议,这些事最终都还是要落到游戏环节,落到显卡实实在在的表征性能也就是帧数当中的。不同的游戏对于显卡的前端和后端有着不同的需求,想要寻找一个能够涵盖所有游戏特征的样本出来是不可能做到的事。本着尽可能贴近全面考验显卡需求的目的,我们决定采用2560X1600分辨率,4XAA特效全开设置下的Crysis2来完成测试。  

    DirectX11性能大跃进 HD7970首发评测
    孤岛危机2

    GPU炼金试验室 GK110核心/显存关系解密
    GeForce GTX 780不同核心/显存频率搭配方案Crysis2游戏帧数测试

      相对于3Dmark 11测试结果的“单纯”,游戏测试部分要显得稍微复杂一些。在实验结束之前,我们曾经猜测GK110架构会在游戏中表现出更为明显的对显存带宽的依赖倾向,因为毕竟显存带宽决定了包括材质操作效率以及AA过程等在内的许多重要图形处理过程的效率,而这些过程在实际游戏中的重要性要高于测试软件,但最终的测试结果并没有完全落入我们的预测。

      在Crysis2中,GeForce GTX 780在全默认频率下所提供的显存带宽并没有完全“触顶”,在默认核心频率以及110%核心频率的前提下,提升10%的显存带宽是可以为显卡进一步带来可见的性能增长的,但这种增长仅止于此,如果在此基础上(110%默认显存频率)再行提升显存带宽,GK110架构将无法继续获得性能增长。另外,即便提升显存带宽能够为我们带来“可见”的性能增长,但其增长幅度依旧如同3Dmark 11测试中所表现的那样明显低于核心频率提升所带来的幅度,无论在任何频率起点上,提升10%核心频率所带来的性能增长均远远大于提升10%显存带宽所带来的增长。  

      换句话说,即便是在游戏环境下,当前GK110架构及其显卡产品的默认频率部署依旧是合适的,并没有留下明显的“显存带宽依赖倾向”。

    产品:GeForce GTX 780 NVIDIA 显示芯片

    640组数据究竟告诉了我们什么?

      ● 40组数据究竟告诉了我们什么?

      在分别运行了20次3Dmark 11以及20次Crysis2 Benchmarktool之后,我们总算完成了新一轮《GPU炼金实验室》的第一篇测试。虽然测试过程繁琐枯燥,但我们依旧觉得这是值得的。

      如果您是一位天天盯着3Dmark 11的超频玩家,我们刚刚所获得的这些测试结果应该会让您感到兴奋——在3Dmark 11的测试中,GK110架构表现出了强烈的非显存依赖性特性,提升核心频率所带来的分数增长要明显甚至是远远大于提升显存。尽管随着核心频率的提升,GPU对于显存带宽的依赖性略有增强,但整体而言提升核心频率依旧是在3Dmark 11中取得高分的最直接手段。

    拉开新一代显卡的帷幕 GTX780首发测试
    对于GeForce GTX 780而言,超核心更对跑分儿爱好者的胃口

      游戏玩家同样能够从今天的测试中获得有用的信息——NVIDIA在GeForce GTX 780上部署的显存带宽已经足够充盈,在当前的默认频率条件下,这款GK110架构的显卡并没有表现出什么明显的显存带宽依赖倾向,提升核心频率依旧比单纯提升显存带宽更为有效。但与3Dmark 11不同的是,如果您想在大部分骨灰级游戏中进一步获得帧数提升,我们建议您依旧优先在核心频率提升,在对核心进行超过20%幅度的超频之后,显存带宽的重要性才会变得更加明显。

      也许今天的测试结果并没有出乎太多人的意料,毕竟作为旗舰级架构,在NVIDIA为它们配置的合理的规模及频率组合方案的影响下,GK110架构业已发布的GeForce GTX Titan/GeForce GTX 780显卡均完成了十分出色的表现,关于它们的争议并不多。但请别匆忙的认为这样的测试没什么意义——我们在开篇时就已经说过了,真正有趣的东西往往蕴藏在数字和现象的背后。随着《GPU炼金实验室》的持续推进,当我们最终将所有测试结果摆在一起进行横向对比时,更大的惊喜将会自行来到我们的面前。

    这才是“104”的本来面目 GTX770首发测试
    下一篇测试的主角——GK104架构

      在下一期的《GPU炼金实验室》当中,我们将会来到Kepler架构的争论的“重灾区”——GK104。这是一个个已经发布近一年半,曾经横亘于旗舰/sweetspot之间,同时背负了“帮助NVIDIA重夺主动的功臣”之美名与“非对称显存一定有问题”之中伤的传奇架构。GK104架构对显存带宽的依赖程度究竟如何?它会不会表现出与GK110明显不同的结果?我们的测试能否进一步解开更多关于GK104架构的秘密呢?关于这些问题的答案,就让我们一起拭目以待吧。

    频道文章推广模板(更新日期:2013.06.21)

    频道文章推广模板(更新日期:2013.06.21)

    7NVIDIA GeForce GTX 780详细参数

    《GPU炼金实验室》精品栏目,时隔几个月强势归来。本期我们要讨论的是GK110核心频率与显存频率之间的关系,看看基于GK110核心的现阶段产品对什么频率更加“敏感”。

    返回分页阅读本文导航
    不喜欢(0) 点个赞(0)

    推荐经销商

    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海

    显卡文章推荐