● VLIW 4
按照时间顺序来看,今年最初到来的一系列新技术,基本上都是围绕着去年年底发布并于今年年初大量上市的Cayman构架进行的。除了Dual ACE之外,AMD GPU构架吞吐模式的改变同样值得被记住,因为它与Dual ACE一样,也是一项着眼于未来的技术进步。
VLIW 4 ALU结构
传统的RV870构架的运算部分采用了VLIW SIMD的结构设计,ALU团簇由4个非全功能ALU+1个拥有ALU.Trans的全功能ALU组成4+1D非对称结构,程序需要将指令尽可能的剔除关联性,然后以5条指令打包成一个超长字节的VLIW指令的形式来满足RV870构架的吞吐需求。Cayman改变了这种结构,将ALU团簇改为由4个结构完全对等的ALU单元4D对称形式,同时对程序端指令的VLIW结合需求需求也从5条指令打包变成了4条指令打包。因此,我们也可以将Cayman的这种改进成为VLIW 4。
VLIW 4的出现对AMD有着巨大的意义。它不仅降低了程序找齐指令对称性和关联性的难度,降低了编程端和优化端的负担,更提高了单位ALU所能够获得的资源密度,提升了整个GPU运算部分的单元复用率。更好的单元复用率可以提升GPU执行Shader的效率,也可以为其带来更好的功耗表现。
同Dual ACE一样,VLIW 4也显示着AMD纠正过去错误的决心。DirectX 11要求构架拥有更好的ALU灵活度和通用计算能力,而非传统意义上的单纯吞吐能力。RV870自R600构架中继承的高吞吐低灵活性的衣钵,在通用计算就是图形计算的今天已经显得很不“合身”了。VLIW 4的出现,正是AMD在意识到需要加强通用计算性能来获取更好的图形表现之后所做出的重大转变。相信以VLIW 4为标志,我们将在未来看到AMD做出越来越多符合DirectX图形需求的优秀设计。
推荐经销商