RV770和RV870架构追求不断改进_迪兰恒进 HD5970 2G

AMD统一渲染GPU架构历程回顾与评测

CBSi中国·ZOL 作者：中关村在线濮元恺 责任编辑：龚力成【原创】 2010年04月30日 05:16 评论

● RV770和RV870架构追求不断改进

现在的AMD，最大的追求就是在尽可能保证小尺寸核心的基础上，提供尽可能多的性能。或者这话应该换一种方式说——堆垛晶体管的临界点，出现在增加晶体管所导致的性能增加出现拐点的那一刻。当堆垛晶体管所能够换来的性能增幅明显下降的时候，就停止堆垛晶体管。

疯狂的ALU运算器规模堆砌，让NVIDIA毫无招架之力，同时坚持以效率致胜的MIMD结构流处理器长期无法摆脱晶体管占用量大的烦恼，运算器规模无法快速增长。Fermi架构完全放弃了一味追求吞吐的架构设计方向，这一点在通用计算或者说复杂的Shader领域值得肯定，但是遇到传统编程方式的图形运算，还是因为架构过于超前显得适应性不足。

RV770可以说是AMD化腐朽为神奇的力作，较之R600，RV770不仅将公共汽车一般缓慢的Ringbus换成了高速直连的Crossbar，而且还追加了大量的资源，比如为16个VLIW CORE配置了16K的Local Data Share，同时将原有的Global Data Share容量翻倍到了16K，在此基础上，还将VLIW CORE规模整体放大到了R600的250%（320个提升到800个），另外，在后端配置的RBE单元以及更加完善的TA/TF也促成了RV770的脱胎换骨。

AMD统一渲染GPU架构历程回顾与评测
GT200和RV770运算单元架构

在扩展ALU资源的基础之上，AMD还在做着另外一件事，那就是尽一切可能逐步优化较为古老和低效的SIMD结构。在RV7中对LDS的空间直接读写操作管理等改进就是这类努力地开始。这导致了R600和R700在Shader Program执行方面有很大差别。R600的Shader Program是Vertical Mode（5D）+Horizontal Mode（16x5D）的混合模式。而RV770是单纯的Vertical Mode（16x4D=64D & 16*1D=16D，即64D+16D）。

简单的说，RV770更加趋紧于NV50 Shader Unit的执行方式，而R600则相去甚远。总的来说，NV更加趋紧于使用基于硬件调度器的Superscalar方式来开发ILP，而AMD更加趋紧于基于软件编译器调度的VLIW方式来开发ILP。

AMD RV870芯片显微照片与功能分析