嘹亮的反击号角？ AMD新旗舰表现预测

2015-06-11 05:00:00 [ 中关村在线原创 ] 作者：

1蓄势

也许你已经感觉到了，最近的显卡要闻正在渐渐变成红色，甚至连空气中都飘荡着一丝淡淡的不安定。尽管令人印象深刻的GeForce GTX 980Ti刚刚发布，但一切关注似乎都正在转向AMD阵营，因为令人期待的全新红色架构——Fiji就要来了。

毫无疑问，从Tahiti架构开始，AMD已经太久没有迎来属于自己的机会和节奏了。架构更新的乏力由很多因素所导致，这不仅是资源调配、财力许可或者研发实力那么简单，更重要的是命运和机会，AMD一直缺少能够让自己“名正言顺”的去颠覆现有架构设计的机会。现在，这种机会摆在了AMD的面前。

嘹亮的反击号角？ AMD新旗舰表现预测

与以往的技术进步不同，Fiji架构拥有了一次颠覆性的改变架构的契机，那就是HBM显存的列装。HBM显存不仅能提供更高的存储密度、更大的显存带宽以及更优秀的能耗比表现，同时还将会彻底改变图形架构以及显卡周边的设计现状。这种由内到外的彻底改变，正是AMD一直都需要的机会。

AMD的革命将从这里开始

Fiji架构为什么是AMD一直期盼的“机会”？这款架构将会作出那些形式的调整和改进？它的性能或者说擅长的领域又会有哪些呢？在今天的解析中，我们将会与您一起直面这些问题。

2梦想

梦想

我们首先要明确一点，那就是AMD最希望获得的是什么？以GPU架构而言，AMD在过去数年间曾经拥有然后又失去，接着一直渴望再次获得的东西无疑是当前计算逻辑结构上最重要的属性：性能功耗比。能耗比属性不仅仅意味着更好的综合表现和使用感受，可以让设计者更轻松的控制公版方案的布局和成本，同时还意味着设计者能够拥有更高的功耗余量来转化性能。

对能耗比属性的渴求并不代表一定要提供卓越的最终能耗比比例而忽略绝对性能，在刚刚进入DirectX 11的Evengreen架构当中，AMD为我们带来了十分夸张的能耗比属性，但遗憾的是过于简单粗暴的核心架构发展方向以及对能耗比的直接追求导致它处在了错误的节奏上，自此之后，AMD便陷入了因为D线的压迫而陷入了严重的绝对性能上限瓶颈。无论Tahiti的GHz Edition还是后续的Hawaii，都在功耗超过对手的前提下未能提供与之相对应的性能。

嘹亮的反击号角？ AMD新旗舰表现预测
即便是完成“华丽转身”的R9-290X，在能耗比属性上也依旧表现不佳

要突破能耗比瓶颈并释放由此而被压制的绝对性能上限，同时在成本、性能以及功耗三者之间获得更大的自由度，进而释放由此被压制的利润率，这是AMD发起反击必须围绕的两个重要方向。可以说达成这两个方向是Fiji最重要的任务，同时也是我们对Fiji架构的性能方向进行预期时必须面对的问题。那么究竟是什么让AMD在漫长的两个产品周期之后才在Fiji上获得了这样的反击机会呢？

这位幕后黑手已经是我们的老朋友了，它就是D线。

很遗憾，DirectX 12的更新起码目前看来很少，并不足以单独推动D线更迭

如果对D线的定义进行适当的提炼，我们就能很轻松的发现D线更迭的诱因，那就是GPU逻辑结构的重大改变。随着GPU逻辑结构的重大改变，整个芯片的工作状态都将发生巨大的变化，这给了芯片设计者一次重新规划芯片可制造性以及性能功耗比属性的机会。与此同时，GPU逻辑结构的重大改变不会经常发生，每次至关重要的结构改变通常都会通过补充和扩展规模的形式延续两代甚至数代之久，这就为D线发挥制衡作用提供了前提。一切有关于D线的故事，起点都在于那些巨大且影响深远的逻辑结构变化。

那么逻辑结构的重大变化又是由谁来充当诱因和界定标准的呢？对于之前的D线而言，答案毫无疑问的是DirectX。每次DirectX的版本变迁都会提出更加先进的图形处理过程以及实现技术，并由此而对硬件设计提出全新的要求。无论是DirectX 9.0C的SM3.0，DirectX 10的Unified Shader还是DirectX 11的Compute Shader，都从本质上改变了GPU逻辑结构的形态并诱发了一系列的硬件革命。

在通常情况下，每一代DirectX版本都会持续30~36个月的时间，DirectX 11发布至今已经远远超过了这一周期。AMD和NVIDIA在这一版本当中都已经数次更新并完善了自己的逻辑结构，无论软件还是硬件基本上都已经耗尽了这一版本的可优化余地和性能发掘余地，该是时候以新版本DirectX来催生全新一代的逻辑结构了。

Fiji架构将肩负起重置AMD阵营D线的任务

可惜的是，尽管新一代的DirectX 12肯定会为我们带来更多先进的新特性，但这些特性大多针对overdraw等对强大GPU并不会造成过多影响的领域。伴随着图形业界环境的变化以及微软自身的种种考量，单就目前的信息来看，DirectX 12所要服务的对象毫无疑问的将会是CPU性能羸弱且与GPU性能并不对称的本代家用机平台，能够带来的对纯GPU逻辑结构部分的刺激相对很低。AMD，NVIDIA甚至是Intel都已经宣称自己当前的显卡产品即可支持DirectX 12，基于Pitcairn架构的XBOX ONE同样能够完美支持DirectX 12。老显卡来架构都能支持的“新版”DirectX，很难想象能够为GPU架构带来一次彻底的革命。在这种前提下，我们还能实现D线更迭所需要的重大逻辑结构更新么？

答案是肯定的，因为我们幸运的遇上了另一个能够诱发逻辑结构巨变的进步，那就是HBM显存。

3契机

契机

Fiji架构最大的特点，在于采用了基于堆叠显存技术的HBM显存体系，HBM显存能够以大并行存储模式提升显存体系的综合表现，同时通过减少互联线长降低信号延迟，由此带来的更大的显存带宽和容量不仅会给GPU的高效运算提供更充沛的缓冲，让设计者能够更加大胆地改进并运算单元以及cache体系，而且还将直接改变GPU内部占比巨大的MC单元甚至整个后端部分的设计，对这一动辄占比近半的逻辑结构进行改进无疑将会深刻的影响GPU的研发方向并改变其逻辑结构。

一场“站起来”的革命堆叠内存技术解析
二级存储管理机制是HBM实现大并行存储的基础

有介于此，原本由于DirectX 12更新不力所导致的无法推动GPU逻辑结构发生巨大变化的可能性现在已经被堆叠显存的到来所弥补（这个长句有点拗口，希望您能理解并抓住重点……），两者的共同作用为D线的更迭提供了充沛的动力，这正是我们在先前的文章中将AMD列装HBM显存的第一代架构以及NVIDIA列装3D Memory的Pascal架构视为新一代D线起点之一的最重要原因。GPU的时代，将会以此为分界线而开启新的大幕。

源于大并行存储的特性，HBM显存需要引入了一级新的沟通机制，亦即独立于每一颗TSV颗粒最底层的Base Die，其上集成了能够管理整簇堆叠颗粒的芯片，这些芯片将与显存控制器直接沟通并被用来收集堆叠颗粒当中的数据，帮助显存控制器对其实施管理，这种二级存储管理机制的引入从本质上改变了Fiji架构MC的结构设计。

拥有Base Die的8通道HBM DRAM颗粒（图片源自后藤弘茂blog）

尽管显存位宽和容量均已激增，但基于堆叠显存的显存控制器的规模不仅不会如当下那样需要进行数倍的放大，甚至其整体规模和工作量还会有进一步的缩减。MC不再需要像现行结构这样直管所有DRAM以及地址，它只需要面向Base/Logic Die当中的芯片即可，对每簇颗粒当中各层DRAM的管理将由Base/Logic Die完成，工作模式的改变正是MC结构发生变化的最根本原因。

以此为诱因，随着HBM/HMC堆叠显存的列装以及MC结构的大改，Base/Logic Die将带走相当一部分传统MC结构所进行的工作，原本核心内部的晶体管以及资源压力得以外泄，GPU架构的工作状态将发生很大的改观，传统的由后端工作所导致的能耗将会减少，GPU内部因此而获得了更多空间余量和资源余量。再加上DirectX 12所带来的对逻辑结构的新需求，对于逻辑结构设计者来说，无论修改ALU团簇、任务管理机制以及cache等基本逻辑结构还是进一步放大运算单元规模都有了更充分的余地。

Hawaii身上所体现的“取舍的艺术”便来自MC结构的改进

事实上这并不是AMD第一次拥有“以MC换资源”的机会，早在上代的Hawaii架构当中，AMD就曾经借由大幅改进MC单元的结构设计，以更节约资源的显存控制器来缓解由D线压迫所导致的核心内部资源紧张问题。R9-290X能够在艰难的时刻表现出稳住局面的成绩，可以说完全是由AMD在MC结构上的华丽转身所带来的。如今，更为彻底的一次转身的机会摆在了AMD面前，如果能够抓住并善加利用，Fiji GPU架构的未来无疑将会拥有更多的希望。

4荆棘

荆棘

认清事物的两面性是我们看待问题的标准方式，所以同样的，尽管Fiji架构因为HBM显存的列装而获得了很好的机会，但它同样面临了艰巨的挑战。

根据过往的经验来看，历代DirectX在版本周期内的硬件发展规律其实很简单，从Shader Program出现的DirectX 8开始，不同时代的GPU架构在各个版本的DirectX生命周期内就都遵循“新版本前期侧重于基础结构更新、运算/Shader效率提升以及修正各种bug/低效结构，后期DirectX版本发展并稳定且各方面效率都已达到Shader Program能力界限制约之后才转去突出材质”的特点。我们可以用一个相对简单的定义来对其进行概括，那就是“先ALU后TMU”。以这个顺序来调整架构，能耗比属性的提升是可以得到保障的。

嘹亮的反击号角？ AMD新旗舰表现预测
AMD在整个DirectX 11时代的表现，相当程度上就是违背“先ALU后TMU”的原则而导致的

作为AMD的DirectX 12初代GPU架构，Fiji应该顺应规律去调整运算结构并完成“趟雷”的任务，这些任务需要GPU架构做出系统而且全面的更新，需要对内部结构进行调整并重新划分不同架构部分的比例和结构，这些调整需要晶体管余量作为基础和回旋余地，而HBM确实提供了这样的机会。但公允来讲，AMD目前的资源，无论是资金还是精力都不算充足，它很难彻底改变GCN发布以来的基本运算结构和整体缓冲结构。再加上制程没有更改，芯片的可接受总面积上限严重制约了设计者的发挥，这一切都将会让AMD不得不做出更简单的选择——从“推翻整个架构重新来过”变成“修改细节+放大现有架构规模”。

这样调整的结果是可以预期的——Fiji架构将会利用MC结构改变带来的机会进一步释放GCN架构，将更多的Shader Engines（在Fiji架构中也许会更名，但本质不变）塞入芯片当中，这带来的结果便是吞吐能力的大幅提升，以及Textrue Array和ROP的规模激增。这种用规模换性能的方式对GPU来说是一把双刃剑，它能带来相当直接的理论性能提升，同时也必须面对功耗激增以及实际性能无法线性增长的烦恼。能耗比得到缓解的程度，将很有可能没有我们预期的大。

很遗憾，Fiji依旧可能会违背“先ALU后TMU”的原则……

我们并不敢断言AMD的这次尝试依旧是一次节奏性错误，但起码目前来看，Fiji巨大的功耗可能很难为其带来大幅超越GM200架构的性能。作为一款重置D线的架构而言，巨大的功耗是可以忍耐的现象，但这种现象应该要带来必要的性能提升才对，所以我们不认为这是最理想的选择。

当然，要确定这件事的答案，或者说检验Fiji架构的选择是否正确是需要参照物的，我们得等待另一个同样采用了堆叠显存设计的GPU架构——NVIDIA的Pascal架构出现并成为对比参照之后才可以。所以起码在眼前，Fiji只需要应付好GM200架构的即可。那么Fiji会以怎样的姿态来迎战GM200呢？或者说它究竟会有怎样的性能特征呢？

5待发

待发

图形处理过程是一个前后端平衡的整体过程，不同处理过程需要的资源并不相同。整体而言，后端和材质对于显存带宽的依赖明显高于前端：处理Shader的过程更倚重于任务分派、cache的能力以及ALU的整体复用率，对于显存带宽的依赖程度要低于材质，而基于后效处理的AA过程对显存的需求也明显不如后端直接处理AA。所以可以说在图形处理过程中，HBM显存的直接受益者应该是纹理操作以及后端输出而非Shader。

值得一提的是，后端的这种对显存的依赖仅会出现在重载场合，在像素压力较小的中低分辨率或者低AA等后端轻载场合，显存带宽的增长并不会带来性能提升。因此HBM列装能够带来的优势将会集中体现在高分辨率、高AA操作以及大分辨率材质操作的重载场合。

嘹亮的反击号角？ AMD新旗舰表现预测
单屏4K分辨率游戏将会是Fiji的重要“主场”

以Fiji架构已经可知的结构特点，也就是“改进自GCN架构的逻辑结构，启用全新MC单元和显存体系，同时大幅放大规模”来看，更加倚重材质的游戏当中，以及包括4K分辨率在内的超高分辨率应用场合将会成为Fiji发挥性能的舞台。所以毫无疑问的，我们将在3Dmark的测试当中看到Fiji拥有上佳的表现，尤其是侧重贴图的3Dmark 11以及能够带来4K分辨率压力的3Dmark FireStrike Ultra。

游戏中的情况则要相对复杂一些，整体而言Fiji的Shader处理能力应该仍处在GCN体系的常规效率之内，其所增加的吞吐能力并不能带来线性的或者说对等的Shader效率提升，整体架构的能力提升更偏重于材质操作和高分辨率耐压能力，因此我们预计Fiji架构在游戏中的实际表现将会是Hawaii的“趋势放大”。在诸如看门狗、杀手：赦免或者4K分辨率的古墓丽影9之类游戏当中，Fiji应该能够表现出令人惊叹的相对Hawaii的性能提升幅度，而在其他更偏重于Shader的游戏当中，Fiji的提升幅度将会相对保守一些。

Fiji将会以怎样的面目示人呢？

当然，架构以外的变数也是存在的。根据目前的情报，并非所有Fiji都会完全不顾功耗压力的去追求最极致的性能，非水冷版Fiji架构显卡的表现可能会因为巨大的功耗和温度压力而相对低迷。除此之外，一直困扰AMD的驱动稳定性问题也可能会在首发期间干扰Fiji架构的真实表现。希望AMD能够在首发期间将这些问题成功解决，为我们带来一个完美全面的新旗舰产品。

不管怎么说，Fiji架构已经箭在弦上，马上就要来到我们的面前了，它所产生的预热效应已经开始充分显现，仅仅是HBM显存的列装，就已经再次唤醒了很多已经淡出显卡圈的玩家们的热情和关注，单纯从营造新鲜感和冲击感的角度来讲，HBM显存无疑是相当出色的，它所带来的提升直观而且贴近公众最容易理解的部分，由其所带来的关注本身就是绝佳的宣传工具。可以预见的是，如果能很好的抓住这次机会，充分利用HBM显存所带来的各种有利要素来调整架构，AMD应该可以为自己的未来打开新的局面。我们希望AMD能够很好地利用HBM显存列装的契机再一次华丽的转身，为我们带来一个性能强大到令人窒息的全新旗舰。