NVIDIA G84/G86 GPU 3D加速相关分析一
● G80衍生出两款轻量级GPU
内含6亿8千万晶体管、使用90nm工艺制造的G80 GPU非常复杂,以G80-300为例,它拥有128个通用标量着色器(被NVIDIA称作SP:Streaming Processor)、可以维持最多4096个线程的GigaThread逻辑、24个光栅处理器(Raster Opteration)以及384bit位宽的内存控制器。

G80 GPU体系架构示意图
G80 GPU的128个通用标量着色器分成16组,每组着色器联合着一组均衡配置的纹理过滤、纹理地址单元和对应的L1/L2 Cache一起工作。这样一个着色器组是模块化设计的,并且脱离于后端的ROP和内存控制器。制造简化型Geforce 8系列GPU的工作就是基于这个基本的着色器组展开。比如一款32 SPs配置的GPU,实际上就是16SPs*2的配置,设计起来灵活而便利。

每个通用标量着色器组的结构
NVIDIA基于上述G80的体系结构和基本特性设计了两款全新的中档GPU,分别是G84和G86,可以简单的把它们分别理解为拥有25%和12.5%管线规模的、改用80nm工艺制造的G80。因为在3D加速特性支持上,G84和G86和G80没有任何区别,或者说只要G80能够支持的特效,G84和G86也能实现,它们的区别仅仅是运行速度。
G84和G86都能够直接配置在PCI-Express上,标准模式是16lanes宽度的单个连接。
● 32SPs的G84和16SPs的G86
NVIDIA G84 GPU具有两个型号,分别是G84-400和G84-300,两者区别仅在频率设定上。G84内含有32个通用标量着色器,分为2组配置,这些着色器和G80的着色器/ROP异步配置相似,都运行在大约ROP频率2倍多一点的频率上。
G84-400用于Geforce 8600 GTS,G84-300则用于Geforce 8600 GT,它们的内存控制器都是128bit位宽,远较G80的384bit/320bit低。G84由台基电(TSMC)使用80nm工艺制造,内含约2.89亿个晶体管。
NVIDIA G86 GPU比G84更加精简,它目前只有G86-300这一个型号,内含16个通用标量着色器,着色器/ROP以接近2:1的比例频率异步。
G86-300用于实现Gefprce 8500 GT产品,在内存控制器位宽上它也是128bit。G86的芯片核心面积比G84小上一圈。G86亦由台基电(TSMC)使用80nm工艺制造,内含晶体管数目为2.10亿个。
在ROP配置方面,NVIDIA目前还没有给出确切的规格,根据G80核心每组4个*6组的方案,G84的有可能使用了4*2=8的ROP配置,G86则是4*1=4继续减半。
● G84和G86的其他信息
G84和G86都支持SLI多GPU加速技术,其中G84的SLI可以使用SLI连接器连接和PCI Express连接两种方案,G86则仅支持PCI Express连接。
G84和G86 GPU内部都设计了过热自动保护电路,当核心温度过高时会自动降频来保护核心不受损害,这也是从Geforce 6时代就一直存在的技术。
G84、G86 GPU内置双400MHz的RAMDAC,支持双路最高2048*1536_85Hz的模拟输出,同时它们内置的TDMS都能够支持双路Dual-Link的DVI数字输出,分辨率高达2560*1600。