千元以下神卡GTS450架构沿革
GF100、GF104和GF106都是基于Fermi架构打造,不过在规格矩阵上为了适应不同成本、定位的产品,进行了合理化的调整。例如GF100拥有超过30亿的晶体管、原生具备512个流处理器,而GF104拥有接近20亿的晶体管、原生384个流处理器。
而GF106核心具备11.7亿晶体管、192个流处理器、128bit显存控制器,这些规格细心的用户能够发现正好是GF104的一半,难道二者有着相对更加紧密的关系?
GF100/GF104/GF106市场定位
根据NVIDIA针对GF100、GF104和GF106的定位为除了一个较为形象的比喻,GF100拥有最猛火力的重装战士,而GF104是具备杀伤力武器的机动战士。而GF106被定义为“Sniper”(狙击手),拥有一击毙命的本事,足见NVIDIA对这款产品的厚望。
通过上面GF100、GF104和GF106的核心架构图,我们发现虽然在整体架构上三者保持了Fermi的完整性,例如GPC→SM→CUDA Core由广到微的等级结构,例如独立的Polymorph Engine和Raster Engine的设计等。
而且从GF104和GF106架构图中不难看出,就GPC、SM、CUDA Cores、MC控制器而言,GF106正好均为GF104的一半。
GF100 SM vs. GF104/GF106 SM | |||
Graphics Core | Graphics Core | GF100 | GF104/GF106 |
SM | CUDA Cores | 32 | 48 |
Warp Scheduler | 2 | 2 | |
Dispatch Unit | 2 | 4 | |
SFU | 4 | 8 | |
LD/ST | 16 个 | 16 个 | |
INT Unit | 32 | 48 | |
FP Unit | FP32:32 FP64:16 | FP32:48 FP64:24 | |
Texture Unit | 4 | 8 |
不过在微架构上,例如SM的CUDA Core等功能模块的组成,GF106延续了GF104的设计,即每组SM中包含48个CUDA Core、8个SFU和8个纹理单元等改良设计。相比拥有庞大规格的GF100而言,GF104的微架构的优化能够弥补先天规格不足的弊端,所以GF106传承了GF104微架构体系设计。
相 关 显 卡 规 格 对 比 | |||||||
显卡型号 | GeForce GTX 480 | GeForce GTX 460 | GeForce GTS 450 | GeForce GTS 250 | Radeon HD 5770 | Radeon HD 5830 | Radeon HD 5870 |
市场定价 | 3500元 | 1499元 | 129美元 | 799 元 | 899 元 | 1499元 | 2999元 |
GPU代号 | GF100 | GF104 | GF106 | G92 | RV840 | RV870 | RV870 |
GPU工艺 | 40nm | 40 nm | 40 nm | 40 nm | 40 nm | 40 nm | 40 nm |
GPU晶体管 | 32亿 | 19.5 亿 | 11.7 亿 | 19.5 亿 | 10.4 亿 | 21.5亿 | 21.5亿 |
着色器数量 | 480 | 336 | 192 | 128 | 800 | 1120 | 1600 |
着色器组织 | 1D*480 | 1D *336 | 1D *192 | 1D *128 | (1D+4D)*160 | (1D+4D)*224 | 1D+4D)*320 |
ROPs数量 | 48 | 32 | 16 | 16 | 16 | 16 | 32 |
纹理单元数量 | 60 | 56 | 32 | 64 | 40 | 56 | 80 |
核心频率 | 700 MHz | 675 MHz | 783 MHz | 738 MHz | 850 MHz | 800 MHz | 850 MHz |
着色器频率 | 1401 MHz | 1350 MHz | 1566 MHz | 1836 MHz | 850 MHz | 800 MHz | 850 MHz |
理论计算能力 | 2.02 TFLOPs | 1.36 TFLOPs | 0.902 TFLOPs | 0.705 TFLOPs | 1.36 TFLOPs | 1.79 TFLOPs | 2.72 TFLOPs |
等效内存频率 | 3696 MHz | 3600 MHz | 3600 MHz | 2200 MHz | 4800 MHz | 4000 MHz | 4800 MHz |
内存位宽 | 384 bit | 256 bit | 128 bit | 256 bit | 128 bit | 256 bit | 256 bit |
内存带宽 | 177.4 GB/s | 115.2 GB/s | 57.6 GB/s | 70.4 GB/s | 76.8 GB/s | 128.0 GB/s | 153.6GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR3 | GDDR5 | GDDR5 | GDDR5 |
内存容量 | 1024 MB | 1024 MB | 1024 MB | 1024 MB | 1024 MB | 1024 MB | 1024 MB |
DX版本支持 | 11 | 11 | 11 | 10 | 11 | 11 | 11 |
HD视频技术 | PureVideo HD | PureVideo HD | PureVideo HD | PureVideo HD | UVD2 | UVD2 | UVD2 |
通用计算接口 | CUDA | CUDA | CUDA | CUDA | Stream | Stream | Stream |