● 模块化的奇妙关联
在进行今天的展望和探讨之前,我们首先要引入一个既熟悉又陌生的概念,那就是体系化。体系化的概念不仅可以让我们更好地了解DirectX 11时代GPU设计理念的变迁,更可以大幅简化我们进行性能预测时所需要订立的目标。
在进入DirectX 11时代之后,尤其是以Tahiti架构为代表的GCN出现之后,GPU架构的设计已经彻底进入了一个模块化并行的时代。无论是NVIDIA的SM/SMX还是AMD的CU,它们都是由ALU集群、独立且完整的缓冲体系、完整的Texture Array、任务仲裁/分派控制机制以及相关互联以体系化的形式结成运算模块单元所构成的。作为二级并行机制的一部分,这些体系化的运算模块单元已经变成了整个架构中最基本的组成部分。
Tahiti构架细节,“GCN”区域即为CU单元
一个SM/SMX/CU的构成,从逻辑结构的层面上来讲已经达到了一整颗传统GPU,比如RV870之类的复杂程度。我们所面对的最基本单元,也因此而从传统的ALU/流处理器+Texture Unit+几何部分变成了这些运算模块单元。新的属于DirectX 11时代的这种设计理念与DirectX 11本身打破运算与图形操作界限的特性,让GPU架构的整体效率对决从传统的不同单元的各自为战,变成了宏观并行度统御和影响下微观运算模块单元效率之间的对决。
由于一个模块内部包含了从运算到操作的全部单元,同时具备了自己的缓冲体系、任务管理机制以及互联模式,因此一旦单元设计凝固,整个架构的效率也就大体上固定了。与此同时,虽然并不会发生直接联系和转换,但诸如材质之类的纯图形“操作”单元的能力也因此和单元内部ALU所具备的总运算能力以一个固定的比例对应了起来。比如说CU单元的Vector ALU与Texture Filter单元的比例为16:1,无论ALU单元总量怎样增减,GCN体系的Texture Filter都会以1/16的比例进行同步增减。
GTX680逻辑构架
这导致了一个有趣的结果,那就是只要运算模块的结构保持不变,我们就可以非常直接的以特定的运算能力来作为衡量新架构整体性能的基本要素,而不用像过去那样还要考虑诸如Texture之类大幅变化对图形性能的影响。
推荐经销商