● GTX980/970规格一览
GeForce GTX 980/970同属GM204架构。它们分别采用了GM204-400-A1以及GM204-200-A1芯片,拥有52亿的晶体管规模,核心面积为398平方毫米(此为NVIDIA公布数据),这一数值距离NVIDIA在DirectX 11时代所划D线上空间(什么是D线和D线上空间上限? 它会导致怎样的问题?)的上限(529+52.9平方毫米)还有相当一段距离,它成了GM204拥有卓越性能功耗比的重要因素之一。
与Kepler架构的GK110相比,GM204架构的运算资源总量从2880个ALU分别下降到了GeForce GTX980的2048以及GeForce GTX 970的1664个,Texture Filter Unit则由240个下降到了128个以及104个,但构成后端的ROP在GM204当中被提升到了64个,更庞大的ROP阵列为GM204带来了理想的像素处理能力。GeForce GTX 980/970均拥有4个64bit双通道显存控制器组合形成的256bit显存控制单元,也都采用了4096MB的尺寸的显存体系。
显 卡 对 位 产 品 规 格 比 较 表 | ||||
显卡型号 | GeForce GTX 980 | GeForce GTX 970 | GeForce GTX 780Ti | Radeon R9 290X |
市场售价 | 3999 元 | 2499 元 | 4999 元 | 4599 元 |
GPU代号 | GM204 | GM204 | GK110 | Hawaii |
GPU工艺 | 28nm | 28nm | 28nm | 28 nm |
GPU晶体管 | 52 亿 | 52 亿 | 71 亿 | 62 亿 |
着色器数量 | 2048 | 1664 | 2880 | 2816 |
着色器组织 | 1D×2048 | 1D×1664 | 1D×2880 | Vector×2816 |
ROPs数量 | 64 | 64 | 48 | 64 |
纹理单元数量 | 128 | 104 | 240 | 176 |
核心频率 | 1126MHz | 1050MHz | 876MHz | 1000MHz |
着色器频率 | 1126MHz | 1050MHz | 876MHz | 1000MHz |
理论计算能力 | 4.6 TFLOPs | 2.44 TFLOPs | 5.04 TFLOPs | 5.6 TFLOPs |
等效内存频率 | 7008 MHz | 7008 MHz | 7008 MHz | 5000MHz |
内存位宽 | 256 bit | 256 bit | 384 bit | 512 bit |
内存带宽 | 224 GB/s | 224 GB/s | 336.4 GB/s | 320 GB/s |
内存类型 | GDDR 5 | GDDR 5 | GDDR 5 | GDDR 5 |
内存容量 | 4096 MB | 4096 MB | 3072 MB | 4096 MB |
DX版本支持 | 12 | 12 | 11.1 | 11.1 |
注:市场售价均为官方首发限价
得益于生产经验累积所带来的可制造性要素提升,GeForce GTX 980的默认核心及显存运行频率提升到了1126/7008MHz。随着ROP以及频率的提升,其默认Pixel Fillrate能力提升到了72Gpixels/S,默认Texture Fillrate能力为144.1G/S,显存带宽224GB/S。GeForce GTX 980拥有4.6T Flops/S的单精度浮点运算能力,但受限于游戏旗舰显卡的定位,NVIDIA对其生产力属性,也就是双精度浮点运算能力进行了限制,GeForce GTX 980保留了1/32速DP的运算特征,双精度浮点运算能力为143G Flops/S。
GeForce GTX 970自发布起便开放了非公版设计限制,因此各款产品的基本参数数据会因频率的不同而发生变化,因此在这里不一一列举。
由于GeForce GTX 980采用了完整规格的GM204架构,我们可以从中勾勒出Maxwell 2.0架构的特点,这些特点主要由以下主要的部分组成:
1、基于HKMG的TSMC 28nm工艺。
2、4单元的宏观并行结构,16组SMM单元被分为4个GPC,每个GPC包含4组SMM。
3、16组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMM单元。每个SMM单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖四组更基本的SM单元,每个SM单元包含32个负责处理运算任务及Pixel Shader的ALU,每个SMM单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。
4、重设且更为巨大的Cache体系资源,L1D\$ Cache与Shared彻底分离并与Texture cache完成统一,Shared独立之后容量提升50%,L2 cache的密度则提升至Kepler的4倍。
5、改进型的3.0版本PolyMorph Engine,重负载环境下可以实现2倍以上于PolyMorph Engine 2.0的性能。
GM204核心
Kepler构架曾经被我们冠以“黑科技”的存在,NVIDIA在其上进行了多项有序且精彩的技术创新。与之相比,Maxwell架构的技术改进更为有序且有效,一系列技术变革不仅为GeForce GTX 980/970带来了理想的性能和更高的性能功耗比,同时也为我们展现了GPU逻辑结构领域的正确发展方向。接下来,就让我们看看这些进一步推升GM204能耗比至全新高度的功臣们吧。
推荐经销商