温故而知新 1600SPs高标RV870
● 1600SPs核心亮相 核心面积并不大
AMD的RV870流处理器数量可谓大幅激增,相对上一代RV770/RV790的800SPs有了翻倍设计,同时21.5亿的晶体管数量也相对有了2.2倍以上的增加,我们知道基于55nm工艺的RV770核心面积为260mm2,如果想使用55nm工艺制造RV870核心,这几乎是一项可以实现但不切实际的做法,接近600mm2的核心面积成本不菲。Radeon HD 4770的40nm核心——RV740为RV870奠定了量产基础,从而解决了RV870在工艺及成本上的问题。
40nm工艺RV870核心
Radeon HD 5870搭载的RV870核心由台积电(TSMC)采用40nm工艺生产,其拥有1600个流处理器、32个光栅处理器和80个纹理单元。此次AMD的产品线升级,最重要的就是完美支持DirectX 11 API和Shader Model 5.0,而且值得一提的是DirectX 11 API中新加入了Direct Compute Shader,这也是微软在GPU通用计算上的一次大踏步跃进,而且这也证明GPU未来在通用计算领域的重要性。
前文我们说过RV870如果不采用全新的40nm工艺制造,将会带来高成本、高功耗、高发热量的诸多弊端,而采用40nm工艺后可以说药到病除,问题迎刃而解。
RV870相对RV770在增加了2.2倍以上晶体管数量的前提下,核心面积仅增加了不到27%,即从RV770的260mm2仅增加到330mm2。RV870核心为正方形设计,我们使用电子游标卡尺实际测量边长约为18.92mm,与实际的18.17mm有测量误差。
对比RV870和RV770核心架构我们发现,RV870并非RV770一样将1600个流处理器设计在同一区域,而是将1600个流处理器分为2组各800。
我们知道统一架构能够更加合理的利用每一个流处理器(Stream Processor),而且每个流处理器均能服务于顶点、像素、几何乃至DirectX 11引入的Direct Compute Shader,这种通用性可以充分利用GPU的并行架构。
在从AMD第一代统一架构图形芯片出世以来,均是采用SIMD设计,与以往不同的是RV870的SMID Cores被分为两部分。这样的设计更有理由图形核心的设计以及产品良率的提高,但这样的弊端就是需要对核心内部的线程控制器及驱动仲裁机制提出了严峻挑战。
首先核心需要一个叫做“Ultra-Threaded Dispatch Processor”(超级线程控制器)来整体分配流处理器处理,然后交由两组的流处理器进行计算,最后交由ROP(光栅处理器)最后进行AA(反锯齿)处理,同时在“Global Data Share”中的纹理贴图直接进入L2 Cache。最终在每组内存控制器的作用下,将ROP和L2 Cache的数据汇总输出。
本章节文字源于《摧垮上代GPU AMD首款DX11显卡5870测试》