64流处理器G94:新技术小步快跑
● Geforce 9600 GT 规格对比
下表是Geforce 9600 GT和Geforce 8800 GT / GS及Geforce 8600 GTS的规格对比。上市之初的Geforce 9600 GT产品定位即在Geforce 8800 GT和Geforce 8600 GTS之间,取代数量稀少并已停止供应的Geforce 8800 GS。
Geforce 9600 GT 及 系 列 显 卡 规 格 表 | ||||
显卡型号 | Geforce 8800 GT | Geforce 8800 GS | Geforce 9600 GT | Geforce 8600 GTS |
核心代号 | G92 - 270 | G94 | G84 - 400 | |
制造工艺 | 65nm | 80nm | ||
核心晶体管数目 | 7.54亿 | -- | 2.89亿 | |
DirectX 版本支持 | DirectX 10 | |||
着色器数量 (标量通用着色器) |
112 | 96 | 64 | 32 |
纹理拾取单元数量 | 56 | 48 | 32 | 8 |
光栅处理器数量 | 16 | 12 | 16 | 8 |
核心频率 | 600MHz | 600MHz | 650MHz | 675MHz |
着色器频率 | 1500MHz | 1500MHz | 1625MHz | 1460MHz |
内存频率 | 1800MHz | 1800MHz | 1800MHz | 2000MHz |
内存位宽 | 256bit | 192bit | 256bit | 128bit |
内存类型 | GDDR3 | GDDR3 | GDDR3 | GDDR3 |
内存容量 | 512MB | 768MB | 512MB | 256MB |
视频加速相关 | PureVideo HD | PureVideo HD | PureVideo HD | PureVideo HD |
产品定价 | 2000元 | 1500元 | 1500元 | 900元 |
从枯燥的数字看去,Geforce 9600 GT拥有和Geforce 8800 GT相当的内存带宽而超过Geforce 8800 GS,但GPU的纸面计算能力较Geforce 8800 GT和Geforce 8800 GS都来得弱。
和自家上代“6”档型号Geforce 8600 GTS相比,Geforce 9600 GT的内存带宽和GPU计算能力都有约100%的提升,在微架构改良的帮助下,整体3D性能无疑会大幅攀升。
● 加入全新压缩技术的G94 GPU
Geforce 9600 GT配置的GPU产品研发代号为G94。和G8X系列GPU相比,G94的最大变化是改进了制造工艺,它由台积电使用65nm工艺制造,和去年末的G92 GPU工艺相同。NVIDIA没有提供G94的晶体管数量信息,但这款GPU显然经过了新的设计,核心部分旋转45度于封装基板,面积也比G92小,但它仍旧能和G92共用相同的PCB,pin-to-pin兼容。
NVIDIA G94 GPU
G94在3D加速功能支持和硬件体系结构方面和G80如出一辙,也是由超级仲裁机构GigaThread支持的海量通用标量着色器群构成3D计算的基础。其64个流处理器以4个16单元小组配置。这个GPU继续使用着色器频率与核心频率的异步设计,比例固定在约2.5:1。G94的内存控制器为256bit,支持256MB/512MB/1GB的本地内存容量,可以运行在PCI Express 2,0 x16上,3D API版本支持到DirectX 10。
G94在3D加速细节方面的提升是全新的压缩技术,G94的ROP较G92进一步改良,以提升纹理填充率。这是在G92相对G80倍增纹理拾取单元之后的再次微调,G92 GPU的3D游戏能力也因此会空前的富有效率。
NVIDIA方面给出的新压缩技术提升幅度如上图,G92可以比同硬件规模的G80快3%-18%,以下是笔者使用3DMark 06在1280分辨率下做的底层性能测试数据:
3DMark 06 底 层 性 能 测 试 - 1280 | |||
显卡型号 | Geforce 8800 GT 600/1500/1800 |
Geforce 8800 GS 600/1500/1800 |
Geforce 9600 GT 650/1625/1800 |
Fill Rate -Single - Texturing (MTexels/s) |
4843 | 3638 | 5330 |
Fill Rate -Multi - Texturing (MTexels/s) |
25036 | 21423 | 15443 |
Pixel Shader (FPS) |
447 | 386 | 319 |
Vertex Shader - Simple (MVercites/s) |
235 | 234 | 255 |
Vertex Shader - Complex (MVercites/s) |
149 | 146 | 133 |
Shader Particles (SM3.0) (FPS) |
94 | 82 | 98 |
Perlin Noise (SM3.0) (FPS) |
145 | 125 | 97 |
可以看到,G94的单纹理填充率相当突出,同时在简单的顶点着色环境和SM3.0粒子物理系统中占据优势。这可能使Geforce 9600 GT在那些非重度复杂着色操作游戏中有较好表现。
G94的多媒体相关部分笔者将在后文介绍,以下我们将首先进入3D性能测试。