● Cayman具备进一步改进空间
Cayman芯片的出现并不令人惊讶,但是AMD选择在HD6000架构后期才放出这一架构,确实没有踏准节奏。实际上Cayman芯片出现最理想的时间,就在R800时代,而当时为了追求一时的爽快,将传统架构流处理器数量提升到1600个,忘记了R600以来积累的问题并不在执行端,而在GPU几何与仲裁方面。
但是AMD不得不面对一个重要问题,那就是数量较高的流处理器需要更庞大的仲裁机制,同时DirectX 11的核心问题曲面细分也是包含在几何端的两种Shader综合运行结果。所以Cayman按照这个思路改进之后,面临芯片面积较大而流处理器数量受到限制这一窘境,在和GTX580的对比中让出了顶级性能皇冠。
Cayman芯片有价值延续到HD7000
首先一大改进在于Cayman XT核心采用了双图形引擎设计,不言而喻Tessellation单元将会由此设计倍增,从而更好的适应目前DirectX 11应用。当然加倍的不仅仅是Tessellation单元,在顶点、几何等计算中也会相对老核心架构有双倍提升。
首先Cayman在几何执行端做到了并行处理,这是AMD一直希望自己做到的,也是对当今GPU架构设计最具挑战性的难题。AMD在这颗芯片上使用的双图形引擎设计,不言而喻Tessellation单元将会由此设计倍增,从而更好的适应目前DirectX 11应用。当然加倍的不仅仅是Tessellation单元,在顶点、几何等计算中也会相对老核心架构有双倍提升。
全新的VLIW4线程处理器
我们知道Cayman核心最大的改进之处就是使用了全新的ALU计算单元组织形式,VLIW4(超长指令字,Very long instruction word)架构指的是一种被设计为可以利用指令级并行(ILP)优势的体系结构。VLIW4相比于VLIW5最特殊的地方就是去掉了体积最大、可同时处理普通整数/浮点操作和超越操作的第五个SP单元,或者说特殊功能单元(SFU)。这就意味着,每个SPU可以一次性处理的普通整数/浮点操作数从五个减少到四个,同时还可以将三个SP合并起来处理一个超越操作,这样能有效地提升了GPU运算效率。
本次在Cayman芯片中所采用的VLIW4线程处理器单元中的ALU阵列减为4个(删除了1个较大的ALU.transcendental单元),ALU阵列数量减少了20%,但是这种设计减少了指令调度和寄存器管理,反而提升了利用率。由于取消了原本5-WAY VLIW中带ALU.Trans的1D ALU,现在Cayman将通过占用3个1D ALU的资源来完成特殊函数的运算。
近日AMD向开发人员推出的Catalyst 11.7预览版驱动程序,意外的公布了AMD下一代南方群岛的全部代号。从图片里分析,南方群岛将会采用新的VLIW4 SIMD架构和Graphic Core Next架构混合搭配出整条HD7000产品线,工艺方面已经确定采用新一代的28nm工艺。
推荐经销商