NVIDIA G84/G86 GPU 3D加速相关分析二
● G84、G86和G73的对比分析
G84、G86 GPU内置的128bit内存控制器逻辑和Geforce 6600的NV43及Geforce 7600的G73相同,因此在芯片封装上,这三代中档GPU使用了相同基板面积的FCBGA封装,并且在针脚上做到了pin-to-pin兼容,这也直接促成了新一代Geforce中档显卡在PCB使用上对上两代同档产品的继承。后文我们将会谈到,Geforce 8600 GT的官方样板和Geforce 7600 GT几乎完全相同。
虽然很难直接比较SIMD标量着色器和MIMD 4D向量着色器的实际计算能力,但这里还是需要把Geforce 8和Geforce 7相同定位的产品在基本3D加速速度上作一分析。
从3D基本支持特性来说,G84、G86比G73优势明显,它们继承了G80的全部。其核心部分是ShaderModel 4,0的DirectX 10和OpenGL 2.0,而G73仅支持到ShaderModel 3,0的DirectX 9.0 C。其它G84、G86的进步还包支持最高到16倍的抗锯齿、FP32 HDR及Qunatum Effects物理效果加速。
GPU_Memory 子 系 统 能 力 对 比 | ||||||
显卡 | Geforce 8600GTS | Geforce 8600GT | Geforce 8500GT | Geforce 7900GS | Geforce 7600GT | Geforce 7300GT |
GPU | G84-400 | G84-300 | G86-300 | G71 | G73-t | G73-vz |
顶点着色器数目 | 32SPs | 32SPs | 16SPs | 7(4D+1D) | 5(4D+1D) | 4(4D+1D) |
像素着色器数目 | 20(4D+4D) | 8(4D+4D) | 4(4D+4D) | |||
着色器频率 | 1458MHz | 1242MHz | 918MHz | 约450MHz | 约560MHz | 约500MHz |
着色器计算能力 | 93.3 GFLOPS | 79.5 GFLOPS | 29.4 GFLOPS | 175.5 GFLOPS | 99.7 GFLOPS | 52 GFLOPS |
ShaderModel | 4.0 | 4.0 | 4.0 | 3.0 | 3.0 | 3.0 |
ROP抗锯齿支持 | 16x | 16x | 16x | 8x | 8x | 8x |
标准频率设定内存带宽 | 32.3 GB/s | 22.4 GB/s | 12.8 GB/s | 42.2 GB/s | 22.4 GB/s | 22.4 GB/s |
以675MHz ROP频率/1458MHz Shader频率的G84-400 GPU为例,它的32个通用Shaders能够实现像素、顶点合计约93.3 GFLOPS的运算能力(动态分配像素着色、顶点着色的负载量),而560MHz ROP/Shader(近似同步)的G73对应的Shader运算能力为28 GFLOPS的顶点着色运算能力+71.7 GFLOPS的像素着色运算能力。前后两者对比为93.3:99.7,可以说是基本相当。只是理论上G84-400的通用Shader在GigaThread的超级并行控制器维持下运作效率比8Pixel:5Vertex的G73固定比例Shader更有效率。
通用着色器设计在3D加速时更为灵活
到这里,可以看到,G84基本上和G73拥有相当的硬件规格和实现成本,G86则对应G73-V。这固然很好的控制了成本并能保证优秀的良品率,但在单纯的计算能力上,远没有两代顶级产品G80相对G71在计算能力上提升的多。这样的设计能带来性能上的显著提升吗?
本文截稿前,笔者获悉一个重要的信息:G84、G86 GPU的通用着色器相对于G80的着色器具有重大改进,支持Co-Issue,从而能够在理论计算能力上提高0.5倍,即上述675MHz ROP频率/1458MHz Shader频率的G84-400 GPU的理论运算能力将达到139.95 GFLOPS。 GFLOPS!这个消息还未得到证实,如果属实,无疑将增强G84、G86 GPU显卡产品的实际3D速度。
Co-Issue特性指着色器可以同一周期执行标量+矢量指令。虽然G80发部之初NVIDIA宣称其通用标量着色器可以实现Daul Issue MAD+MUL,但后来修改为不支持,即G80的SP只能每周期Daul Issue MAD。现在G84、G86 GPU很有可能已经完善了至Daul Issue MAD+MUL。
接下来我们将分析G84、G86两个GPU带来的一个全新的特性,这一部分甚至连最高端的G80都不具备,即强化高清内容回放能力的最新版本PureVideo HD。
- 第1页:压倒性优势 Geforce 8全系列成员到齐
- 第2页:NVIDIA G84/G86 GPU 3D加速相关分析一
- 第3页:NVIDIA G84/G86 GPU 3D加速相关分析二
- 第4页:高清视频回放的革命:PureVideo HD
- 第5页:高性能DirectX 10游戏显卡Geforce 8600 GTS
- 第6页:灵活的中端DirectX 10杀手Geforce 8600 GT
- 第7页:入门级DirectX 10选择Geforce 8500 GT
- 第8页:应用前瞻:Windows Vista和DirectX 10、统一渲染架构
- 第9页:测试准备:驱动程序、产品选型和测试内容
- 第10页:主要性能测试部分的硬件、软件系统说明
- 第11页:系统功耗测试
- 第12页:D3D合成软件测试:3DMark 03
- 第13页:D3D合成软件测试:3DMark 05
- 第14页:D3D合成软件测试:3DMark 06
- 第15页:D3D即时战略游戏:Age of Empires III
- 第16页:D3D即时战略游戏:Company of Heroes
- 第17页:D3D第一人称视角射击游戏:Far Cry
- 第18页:D3D竞速类游戏:Need for Speed:Carbon
- 第19页:OpenGL第一人称视角射击游戏:Prey
- 第20页:OpenGL第一人称视角射击游戏:Quake 4
- 第21页:D3D第一人称视角射击游戏:S.T.A.L.K.E.R.
- 第22页:D3D即时战略游戏:SupermeCommander
- 第23页:D3D竞速类游戏:Test Drive Unlimited
- 第24页:D3D第三人称视角PRG游戏:The Elder Scrolls IV Oblivion
- 第25页:GF8600/8500在A64X2 3600+下的应用分析一
- 第26页:GF8600/8500在A64X2 3600+下的应用分析二
- 第27页:GF8600/8500在C2D E6300下的应用分析
- 第28页:GF8600/8500的DirectX 9 SLI性能测试
- 第29页:GF8600/8500的高清视频回放和CPU占用率测试
- 第30页:GF8600/8500的超频及硬件改造测试
- 第31页:性能总体评价:实话实说优势和不足
- 第32页:市场预测和展望:又一代当红小生诞生
- 第33页:Geforce 8600/8500显卡汇集:七彩虹(Colorful)
- 第34页:Geforce 8600/8500显卡汇集:小影霸(Paradise)
- 第35页:Geforce 8600/8500显卡汇集:精英(ECS)
- 第36页:Geforce 8600/8500显卡汇集:华硕(ASUS)
- 第37页:Geforce 8600/8500显卡汇集:富彩(Forsa)
- 第38页:Geforce 8600/8500显卡汇集:翔升(ASL)
- 第39页:Geforce 8600/8500显卡汇集:铭瑄(Maxsun)
- 第40页:Geforce 8600/8500显卡汇集:影驰(Galaxy)
- 第41页:Geforce 8600/8500显卡汇集:盈通(Yeston)
- 第42页:Geforce 8600/8500显卡汇集:旌宇(Sparkle)
- 第43页:Geforce 8600/8500显卡汇集:讯景(XFX)
- 第44页:Geforce 8600/8500显卡汇集:金鹰(Eagle)
- 第45页:Geforce 8600/8500显卡汇集:映众(Inno3D)
- 第46页:Geforce 8600/8500显卡汇集:双敏(Unika)
- 第47页:Geforce 8600/8500显卡汇集:丽台(Leadtek)