● GF116核心特性回顾
NVIDIA在将核心打造成统一架构设计后,第一款千元级的产品是GeForce 8600 GT,最新一代的则是今天的主角GeForce GTX 550 Ti,二者的综合性能四年间提升6倍。虽然这种关公战秦琼的比喻略显不恰当,但是还是足以证明NVIDIA在产品研发速度上的高效。
公版GF116核心近照
GeForce GTX 550 Ti标配核心代号GF116,GeForce GTS 450标配核心代号GF106,根据以往GF110与GF100和GF114和GF104之间的关系,我们从而可以得出GF116相对于GF106而言是款全规格升级核心,二者的理论全规格是完全相同的。
从GF114和GF116架构图中不难看出,就GPC、SM、CUDA Cores、MC控制器而言,GF106正好均为GF114的一半。
GF110 SM vs. GF114/GF116 SM | |||
Graphics Core | Graphics Core | GF110 | GF114/GF116 |
SM | CUDA Cores | 32 | 48 |
Warp Scheduler | 2 | 2 | |
Dispatch Unit | 2 | 4 | |
SFU | 4 | 8 | |
LD/ST | 16 个 | 16 个 | |
INT Unit | 32 | 48 | |
FP Unit | FP32:32 FP64:16 |
FP32:48 FP64:24 | |
Texture Unit | 4 | 8 |
不过在微架构上,例如SM的CUDA Core等功能模块的组成,GF116延续了GF114的设计,即每组SM中包含48个CUDA Core、8个SFU和8个纹理单元等改良设计。相比拥有庞大规格的GF110而言,GF114的微架构的优化能够弥补先天规格不足的弊端,所以GF116传承了GF114微架构体系设计。
GF116的一个SM中现在拥有48个CUDA Core,每个CUDA Core由两个Dispatch Port、Operand Collector、Result Queue以及INT整型数单元与FP浮点数单元构成。其中GF116的ALU和FPU均继承了GF110中CUDA Core的优良特性,例如ALI可以支持64bit精度指令运算,还有比较、布尔和移位等指令计算,值得一提的是Fermi架构的ALU通过改进现已完整支持32bit整数算法。
我们可以看到GF116每个SM中CUDA Core数量和Texture Unit数量均有大幅增加,这都会增加SM的3D计算能力,从而让用户在游戏体验上获得更好的效果。不过相反每个CUDA Core和Texture Unit分得的各类Cache有所减少,这应该是NVIDIA GPU架构工程师针对主流用户使用需求的前提下,在性能、晶体管平衡取舍上得出的最佳比例。