● Titan规格一览
GeForce GTX Titan与我们之前所见的Kepler架构存在巨大的规模差异。它拥有71亿的晶体管规模,核心面积因此达到了573.4平方毫米(23.5X24.4毫米),这一数值十分接近但并未超越NVIDIA在DirectX 11时代所划D线(什么是D线? 它会导致怎样的问题?)的上限(529+52.9平方毫米)。与GeForce GTX 680相比,其运算资源总量从1536个ALU上升到了2688个,Texture Filter Unit由128个上升到了224个,构成后端的ROP则从32个提升到了48个。Titan拥有Kepler架构中最庞大的MC结构,6个64bit双通道显存控制器组合形成了384bit显存控制单元,Titan也因此采用了容量高达6144MB的尺寸空前的显存体系。
GeForce GTX Titan 显 卡 对 位 产 品 规 格 比 较 表 | |||||
显卡型号 | GeForce GTX Titan | GeForce GTX 680 | Radeon HD 7970 |
Radeon HD 6970 | GeForce GTX 580 |
市场定价 | 7999 元 | 3999 元 | 4299 元 | 2999 元 | 3999 元 |
GPU代号 | GK110 | GK104 | Tahiti | Cayman | GF110 |
GPU工艺 | 28nm | 28 nm | 28 nm | 40 nm | 40 nm |
GPU晶体管 | 71亿 | 35.5 亿 | 43 亿 | 26.7 亿 | 30 亿 |
着色器数量 | 2688 | 1536 | 2048 | 1536 | 512 |
着色器组织 | 1D*2688 | 1D*1536 | Vector*2048 | 4D*384 | 1D *512 |
ROPs数量 | 48 | 32 | 32 | 32 | 48 |
纹理单元数量 | 224 | 128 | 128 | 96 | 64 |
核心频率 | 837 MHz | 1006 MHz | 925 MHz | 880 MHz | 772 MHz |
着色器频率 | 837 MHz | 1006 MHz | 925 MHz | 880 MHz | 1544 MHz |
理论计算能力 | 4.5 TFLOPs | 3.09 TFLOPs | 3.79 TFLOPs |
2.7 TFLOPs |
2.37 TFLOPs |
等效内存频率 | 6008 MHz | 6008 MHz | 5500 MHz | 5500 MHz | 4008 MHz |
内存位宽 | 384 bit | 256 bit | 384 bit | 256 bit | 384 bit |
内存带宽 | 288.4 GB/S | 192.3 GB/S | 264 GB/s | 176 GB/s | 192.4 GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
内存容量 | 6144MB | 2048 MB | 3072 MB | 2048 MB | 1536 MB |
DX版本支持 | 11.1 | 11.1 | 11.1 | 11 | 11 |
HD视频技术 | PureVideo HD+NVENC | PureVideo HD+NVENC | UVD3.0 VCE |
UVD3 | PureVideo HD |
通用计算接口 | CUDA | CUDA | Stream | Stream | CUDA |
注:市场定价均为官方首发限价
Titan的默认核心及显存运行频率为837/6008MHz,默认Pixel Fillrate能力为40.2G/S,默认Texture Fillrate能力为182.3G/S,显存带宽288.4GB/S。Titan拥有4.5T Flops的单精度浮点运算能力,同时并未对双精度浮点运算能力进行限制,因此也就保留了1/3速DP的运算特征,双精度浮点运算能力为1.3T Flops。
值得注意的是,Titan的双精度浮点运算能力是可以手动开启或者关闭的。当我们在驱动中关闭双精度浮点运算能力时,Titan仅提供1/24速的双精度浮点运算能力,而当我们开启双精度浮点运算能力时,Titan将会运行在Tesla K20X的默认频率上,因此其双精度浮点运算能力为1.3T Flops。
GeForce GTX Titan恐怖的规模
Titan采用的GK110与GK104同属Kepler架构,但只有GK110开放了Kepler架构全部功能性设计和特点,我们甚至可以这样说——只有GK110才是真正意义上的Kepler架构。由以下主要的部分组成:
1、更加成熟的基于HKMG的TSMC 28nm工艺。
2、与GK104不同的宏观并行结构,15组SMX单元(Titan开放14组)被分为5个GPC,每个GPC包含3组SMX。
3、14组包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMX单元。每个SMX单元的细节同GK104完全相同,均包含一组改进型的负责处理几何任务需求的PolyMorph Engine,192个负责处理运算任务及Pixel Shader的ALU,16个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,二级线程管理机制以及与它们对应的shared+unified cache等缓冲体系。
4、基于Dynamic Parallelism的全新本地任务管控机制,以及由此带来的更高的单元复用率。
5、调节粒度更细同时频率控制范围更大的新一代GPU Boost。
Kepler构架曾经是一个充满了神秘感的存在,伴随着GK104的发布,我们在过去的一年里曾经对它的各种细节,诸如ALU团簇单元、Cache、线程仲裁机制、动态频率调节体系等等进行过相关的分析,但这些分析都不足以完全为我们揭示Kepler架构的全部特色、目的以及意义。随着GK110的到来,Kepler架构终于完整的展现在了我们的面前,接下来就让我们一起正式深入Kepler架构,来一睹“黑科技”的真正内幕吧。
推荐经销商