NVIDIA G84/G86 GPU 3D加速相关分析二
● G84、G86和G73的对比分析
G84、G86 GPU内置的128bit内存控制器逻辑和Geforce 6600的NV43及Geforce 7600的G73相同,因此在芯片封装上,这三代中档GPU使用了相同基板面积的FCBGA封装,并且在针脚上做到了pin-to-pin兼容,这也直接促成了新一代Geforce中档显卡在PCB使用上对上两代同档产品的继承。后文我们将会谈到,Geforce 8600 GT的官方样板和Geforce 7600 GT几乎完全相同。
虽然很难直接比较SIMD标量着色器和MIMD 4D向量着色器的实际计算能力,但这里还是需要把Geforce 8和Geforce 7相同定位的产品在基本3D加速速度上作一分析。
从3D基本支持特性来说,G84、G86比G73优势明显,它们继承了G80的全部。其核心部分是ShaderModel 4,0的DirectX 10和OpenGL 2.0,而G73仅支持到ShaderModel 3,0的DirectX 9.0 C。其它G84、G86的进步还包支持最高到16倍的抗锯齿、FP32 HDR及Qunatum Effects物理效果加速。
| GPU_Memory 子 系 统 能 力 对 比 | ||||||
| 显卡 | Geforce 8600GTS | Geforce 8600GT | Geforce 8500GT | Geforce 7900GS | Geforce 7600GT | Geforce 7300GT |
| GPU | G84-400 | G84-300 | G86-300 | G71 | G73-t | G73-vz |
| 顶点着色器数目 | 32SPs | 32SPs | 16SPs | 7(4D+1D) | 5(4D+1D) | 4(4D+1D) |
| 像素着色器数目 | 20(4D+4D) | 8(4D+4D) | 4(4D+4D) | |||
| 着色器频率 | 1458MHz | 1242MHz | 918MHz | 约450MHz | 约560MHz | 约500MHz |
| 着色器计算能力 | 93.3 GFLOPS | 79.5 GFLOPS | 29.4 GFLOPS | 175.5 GFLOPS | 99.7 GFLOPS | 52 GFLOPS |
| ShaderModel | 4.0 | 4.0 | 4.0 | 3.0 | 3.0 | 3.0 |
| ROP抗锯齿支持 | 16x | 16x | 16x | 8x | 8x | 8x |
| 标准频率设定内存带宽 | 32.3 GB/s | 22.4 GB/s | 12.8 GB/s | 42.2 GB/s | 22.4 GB/s | 22.4 GB/s |
以675MHz ROP频率/1458MHz Shader频率的G84-400 GPU为例,它的32个通用Shaders能够实现像素、顶点合计约93.3 GFLOPS的运算能力(动态分配像素着色、顶点着色的负载量),而560MHz ROP/Shader(近似同步)的G73对应的Shader运算能力为28 GFLOPS的顶点着色运算能力+71.7 GFLOPS的像素着色运算能力。前后两者对比为93.3:99.7,可以说是基本相当。只是理论上G84-400的通用Shader在GigaThread的超级并行控制器维持下运作效率比8Pixel:5Vertex的G73固定比例Shader更有效率。

通用着色器设计在3D加速时更为灵活
到这里,可以看到,G84基本上和G73拥有相当的硬件规格和实现成本,G86则对应G73-V。这固然很好的控制了成本并能保证优秀的良品率,但在单纯的计算能力上,远没有两代顶级产品G80相对G71在计算能力上提升的多。这样的设计能带来性能上的显著提升吗?
本文截稿前,笔者获悉一个重要的信息:G84、G86 GPU的通用着色器相对于G80的着色器具有重大改进,支持Co-Issue,从而能够在理论计算能力上提高0.5倍,即上述675MHz ROP频率/1458MHz Shader频率的G84-400 GPU的理论运算能力将达到139.95 GFLOPS。 GFLOPS!这个消息还未得到证实,如果属实,无疑将增强G84、G86 GPU显卡产品的实际3D速度。
Co-Issue特性指着色器可以同一周期执行标量+矢量指令。虽然G80发部之初NVIDIA宣称其通用标量着色器可以实现Daul Issue MAD+MUL,但后来修改为不支持,即G80的SP只能每周期Daul Issue MAD。现在G84、G86 GPU很有可能已经完善了至Daul Issue MAD+MUL。
接下来我们将分析G84、G86两个GPU带来的一个全新的特性,这一部分甚至连最高端的G80都不具备,即强化高清内容回放能力的最新版本PureVideo HD。