卓越的Pascal大核心
NVIDIA TITAN X采用全新16nm制程的Pascal架构,核心代号为GP102,具体型号为GP102-400-A1,而Quadro P6000的核心代号为GP102-425-A1。GP102核心面积约为471平方毫米,得益于16nm的制程优势,核心内集成了12亿晶体管,是GTX TITAN X晶体管数量的1.5倍,核心面积却仅为GTX TITAN X的78.4%。
显 卡 规 格 比 较 表 | ||||
显卡型号 | NVIDIA TITAN X | GTX TITAN X | GTX 1080 | R9 Fury X |
首发限价 | \$1200 | \$999 | \$699 | \$650 |
GPU代号 | GP102 | GM200 | GP104 | Fiji XT |
GPU工艺 | 16nm | 28nm | 16nm | 28nm |
GPU晶体管 | 12B | 8B | 7.2B | 8.9B |
着色器数量 | 3584 | 3072 | 2560 | 4096 |
单精度浮点 | 11 T | 7 T | 9 T | 8.6 T |
ROPs数量 | 96 | 96 | 64 | 64 |
纹理单元数量 | 224 | 192 | 160 | 256 |
核心频率 | 1418MHz | 1002MHz | 1607MHz | 1050MHz |
boost频率 | 1531MHz | 1076MHz | 1733MHz | 1050MHz |
架构 | Pascal | Maxwell 2 | Pascal | GCN 1.2 |
显存频率 | 1251 MHz | 1753 MHz | 1250 MHz | 500 MHz |
内存位宽 | 384 bit | 384 bit | 256 bit | 4096 bit |
内存带宽 | 505 GB/s | 336.6 GB/s | 320 GB/s | 512 GB/s |
内存类型 | GDDR5X | GDDR5 | GDDR5X | HBM |
内存容量 | 12 GB | 12 GB | 8 GB | 4 GB |
注:表中售价均为官方首发限价
基于Pascal架构的GP102-400芯片运算资源总量为3584个ALU,比GP102-425少了256个;GP102-400的TMUs数量为224个,后端的ROPs数量为96个,6个带宽为64bit的双通道显存控制器组成了总量为384bit的显存控制单元,大小为12GB。同GTX TITAN X相比,其各项参数均有所提升,尤其是显存带宽达到了505GB/s,这是因为其采用了GDDR5X显存,GDDR5X显存的改进使得NVIDIA TITAN X在位宽相同的情况下拥有更高的带宽。
GP102-400架构图
我们可以看到,NVIDIA TITAN X的默认核心频率为1418MHz,Boost频率为1531MHz,达到了上代GTX TITAN X频率的1.4倍,提升幅度非常明显。NVIDIA TITAN X的默认Pixel Fillrate能力达到了155.8Gpiexls/S,默认Texture Fillrate能力为363.6Gtexels/S。凭借超高的基础频率和庞大的运算规模,NVIDIA TITAN X拥有11 TFLOPS的超高单精度浮点运算能力,照比GTX TITAN X提升了57%,为目前单精度浮点运算性能最高的单芯显卡。
Pascal架构GP104-400芯片由以下主要的部分组成:
1、基于TSMC的16nm FinFET Plus工艺,相比28nm HPM提升了65%的性能或者减少了70%的能耗,同时晶体管密度翻倍。
2、6单元的宏观并行结构,30组SMs单元被分为6个GPC,每个GPC包含5组SMs,但砍掉了2祖SMs单元,因此总量为28个,相对应地,纹理单元缩减为224个。
3、28组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。
4、GP102拥有12个32位显存控制器,总计384位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计96个ROPs单元和3M二级缓存。
5、改进型的4.0版本PolyMorph Engine,包含了为VR设计的The Simultaneous Multi-Projection Engine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。
在NVIDIA TITAN X上,我们看到了其与上代基于Maxwell 2.0架构显卡相类似的设计,主要区别就是每个GPC中多了一组SMs单元,这就让这款显卡能够支持所有在GeForce GTX 900系列中的特性。
本文属于原创文章,如若转载,请注明来源:地球最强单芯卡王 NVIDIA TITAN X首测//vga.zol.com.cn/628/6284160.html
推荐经销商