架构—800SPs的RV770威力如何
● RV770 GPU的基本状况
800 vs 320的2.5倍标量着色器绝对数目提升是RV770最吸引人的地方,AMD为此这个提升付出的芯片成本是44%的晶体管数目和37%的核心表面积的增加,但在运行频率略微调低的前提下,仍然是55nm工艺制造的RV770 GPU的功耗和发热水平被控制的都很不错。
RV770仍旧由台积电制造,晶体管数目9.56亿、核心表面积260平方毫米,在Radeon HD 4850的625MHz频率设定上,它仅需单槽厚度的中型散热器就可正常工作。RV770的其他特点还有内置256bit位宽的内存控制器及符合PCI Express 2.0规范的I/O接口,其着色器和整个GPU运行频率同步。
RV770也内置了符合HD Audio规格的音频逻辑,可以直接输出完整的HDMI信号。这个集成在GPU内的“声卡”支持AC3规范的Dolby Digital和DTS编码格式,支持32kHz、44.1kHz、48kHz的16bit音频流,能够满足主流高清视频回放需求,并拿到了Windows Vista Premium Logo。
RV770不是从某个顶级GPU精简规模而来,它是在RV670基础上开发的加强版本,实现相对简单但效果却相当好。
● RV770 GPU的架构分析
>>着色器
从以上的RV770核心架构图来看,它仍然基于R600/RV670的4D+1D模式1D*5基本着色器组结构,每5个标量着色器组成一个类似以前的向量着色器样式拥有自己的基本资源进行操作。
在更宏观一步,R600/RV670的320个标量着色器被分成[(1D*5)*16]*4的模式,在RV770就扩展成了[(1D*5)*16]*10,直接增加了6个16联的1D*5组织,而前端的超级仲裁机构等部分基本没有发生变化。
>>纹理单元
和着色器树木比例递增的是纹理单元,RV770的纹理单元也增加到了10组,在结构上和RV670完全相同。
>>ROPs
但是在端部分,RV770虽然仍旧使用4组16个ROPs,但这些部分却得到了AMD的改良以增强抗锯齿能力。改良的关键是加倍了Z模板的采样数,标准MSAA的运行效率有希望在这项改进后提升100%性能,因此在实际3D游戏应用中也会有明显的提速。
>>内存控制器
RV770继续使用256bit的环形总线内存控制器,最高支持1GB的本地内存容量,在性能细节和速度方面较RV670的版本的一点变化是加入显存读写缓冲区以增强数据读写命中率,此外还增加了GDDR5类型的内存芯片支持。
● 更充沛的计算能力和强化的AA
RV770相对于RV670的底层结构变化并不算很大,增进的主要是着色器的规模,这将直接提升GPU面对着色器编程类图形及其他计算类应用程序时的性能,最主要的改善就是最新的复杂3D游戏速度。
不过2.5倍的着色器规模提升在旧有外部框架内的性能发挥能否出色还是个疑问,AMD方面一直没有公布过其仲裁机构的计算能力和着色器寄存器规模的细节,这些对于GPU的性能也是至关重要的。
抗锯齿性能的强化对玩家是最好的消息,Radeon的上代产品因此曾饱受批评。