● GF116核心特性与改进之处
和前辈GTS450相比,这一代使用GF116核心的GTX550Ti显卡在多个层面增强了性能,当然它所瞄准的是预算在1000元人民币之内的高性价比市场。不过这颗芯片给我们一些惊喜,特别是在显存位宽方面,市场原以为GF106已经是一颗完整的芯片,但是大家没想到GF106-116也有保留升级功能,就是被影藏的64bit显存控制器。
从GF114和GF116架构图中不难看出,就GPC、SM、CUDA Cores、MC控制器而言,GF106正好均为GF114的一半。
GF110 SM vs. GF114/GF116 SM | |||
Graphics Core | Graphics Core | GF110 | GF114/GF116 |
SM | CUDA Cores | 32 | 48 |
Warp Scheduler | 2 | 2 | |
Dispatch Unit | 2 | 4 | |
SFU | 4 | 8 | |
LD/ST | 16 个 | 16 个 | |
INT Unit | 32 | 48 | |
FP Unit | FP32:32 FP64:16 |
FP32:48 FP64:24 | |
Texture Unit | 4 | 8 |
不过在微架构上,例如SM的CUDA Core等功能模块的组成,GF116延续了GF114的设计,即每组SM中包含48个CUDA Core、8个SFU和8个纹理单元等改良设计。相比拥有庞大规格的GF110而言,GF114的微架构的优化能够弥补先天规格不足的弊端,所以GF116传承了GF114微架构体系设计。
GF116的一个SM中现在拥有48个CUDA Core,每个CUDA Core由两个Dispatch Port、Operand Collector、Result Queue以及INT整型数单元与FP浮点数单元构成。其中GF116的ALU和FPU均继承了GF110中CUDA Core的优良特性,例如ALI可以支持64bit精度指令运算,还有比较、布尔和移位等指令计算,值得一提的是Fermi架构的ALU通过改进现已完整支持32bit整数算法。
混合显存位宽的构成方式
我们可以看到GF116每个SM中CUDA Core数量和Texture Unit数量均有大幅增加,这都会增加SM的3D计算能力,从而让用户在游戏体验上获得更好的效果。不过相反每个CUDA Core和Texture Unit分得的各类Cache有所减少,这应该是NVIDIA GPU架构工程师针对主流用户使用需求的前提下,在性能、晶体管平衡取舍上得出的最佳比例。
混合显存可以使用最少数量的显存颗粒达到1024MB的显存容量,同时符合192Bit显存位宽。对于一款中端产品来说,1024MB显存容量无疑是一个黄金比例,既能满足GPU的性能需求,又不会浪费产品自身成本。根据NVIDIA给出的官方示意图得到,GeForce GTX 550 Ti的1024MB显存容量是由4颗32M*32bit规格显存搭配2颗64M*32bit显存混合搭建。
推荐经销商