A卡第二、三次GPU统一架构设计革新
进过了R600架构设计的阵痛期,AMD似乎要在第二次GPU架构革新战争中扬眉吐气。而事实也证明了:这款相比于GT200更小巧的芯片,却永远着更大的魔力。
●A卡第三次GPU统一架构设计革新
AMD在RV770这款GPU核心架构上的革新可谓“大刀阔斧”,几乎对所有的模块都进行了改进,而从市场端所反应的销量来看:这确实是一次很不错的架构革新。
RV770 GPU系统架构图
通过上面的架构图我们首先来看看流处理器部分:RV670/R600是纵向4组SIMD阵列,每组16个Shader,每个Shader 5个流处理器;RV770是横向10组SIMD阵列,每组16个Shader,每个Shader 5个流处理器,也就是说流处理器部分只是单纯的规模扩充;其次、纹理单元和光栅单元部分数量翻了2.5倍,且抗锯齿算法已经由R600/RV670的流处理器部分转移至光栅单元部分,因此RV770的AA效率大幅提高;最后、RV770放弃了使用多年沿用的环形总线,回归了交叉总线结构设计,有效提高了显存利用率,并节约了显存带宽。总之:RV770的整体架构的全面革新使得其相比RV670有了前所未有的改变。
●A卡第三次GPU统一架构设计革新
虽然说AMD抢在竞争对手NVIDIA之前发布了DX11显卡,但是相比较晚发布的GF100核心架构而言,RV870架构在改进方面显得有些微不足道。
对比RV870和RV770核心架构我们发现,RV870并非RV770一样将1600个流处理器设计在同一区域,而是将1600个流处理器分为2组各800个流处理器。所以我们可以这样认为:除了显存位宽维持256bit不变之外,Cypress的其它所有规格都正好是RV770的两倍,而且在流处理器部分可以看作是双核心的设计,几乎就是并排放置了两颗RV770核心。
在RV870核心架构设计中,AMD仅为其配备了合乎DirectX 11要求的寄存器资源,改进了UTDP对多线程的支持,在前端的几何单元中插入了一组TS单元,同时将运算单元中的GDS提升到了64K。除此之外,我们仅能见到进一步放大的VLIW core规模和其他配套的纹理资源及后端资源。各资源的整体比例较之RV770并未发生本质性的改变,VLIW(Very Long Instruction Word,超长指令字) core的操作管理方式及周边资源密度也未见任何实质性的变化,甚至其UTDP单元也依旧维持着抢占式多线程的管理方式。
总之:除了增加了对DX11的支持,RV870(Cypress)相比RV770的改进而言可谓十分有限。也许AMD将HD5000系列显卡的宣传重心转移到了40nm工艺制程、新一代GDDR5显存和Eyefinity多屏显示器技术上面去了。