似是故人的新架构
GeForce GTX 1080采用了两年前就已在GTC上被老黄透漏的全新架构——Pascal,“Pascal”依然取自一位著名物理学家的名字,国际单位制中压力的单位“Pa”即以其姓氏命名。Pascal架构的第一款产品是4月初发布的Tesla P100,其采用GP100大核心,而这次发布的GTX 1080则是采用GP104核心,具体型号为GP104-400,次旗舰GTX 1070为GP104-200。GP104核心面积约为314平方毫米,得益于16nm的制程优势,核心内集成了72亿晶体管,是GTX 980晶体管数量的1.38倍,核心面积却仅为GTX 980的78.9%。
NVIDIA GP104-400核心
基于Pascal架构的GM204-400芯片运算资源总量为2560个ALU,TFU数量为160个,后端的ROPs数量为64个,四个带宽为64bit的双通道显存控制器组成了总量为256bit的显存控制单元,大小为8GB。同GTX 980相比,其各项参数均有所提升,尤其是显存带宽达到了320GB/s,这是因为其率先采用了GDDR5X显存,GDDR5X显存的改进使得GTX 1080在位宽相同的情况下拥有更高的带宽,初期即可达到10-12Gbps,而随着进一步的研发最高能够提升到16Gbps。
显 卡 规 格 比 较 表 | ||||
显卡型号 | GTX 1080 | R9 Fury X | GTX 980 | GTX Titan X |
首发限价 | \$599 | \$649 | \$549 | \$999 |
GPU代号 | GP104 | Fiji XT | GM204 | GM200 |
GPU工艺 | 16nm | 28nm | 28nm | 28nm |
GPU晶体管 | 7.2B | 8.9B | 5.2B | 8B |
着色器数量 | 2560 | 4096 | 2048 | 3072 |
单精度浮点 | 9 T | 8.6 T | 5 T | 7 T |
ROPs数量 | 64 | 64 | 64 | 96 |
纹理单元数量 | 160 | 256 | 128 | 192 |
核心频率 | 1607MHz | 1050MHz | 1126MHz | 1000MHz |
boost频率 | 1733MHz | 1050MHz | 1216MHz | 1075MHz |
架构 | Pascal | GCN | Maxwell | Maxwell |
显存频率 | 2500 MHz | 500 MHz | 1753 MHz | 1753 MHz |
内存位宽 | 256 bit | 4096 bit | 256 bit | 384 bit |
内存带宽 | 320 GB/s | 512 GB/s | 224 GB/s | 336 GB/s |
内存类型 | GDDR5X | HBM | GDDR5 | GDDR5 |
内存容量 | 8 GB | 4 GB | 4 GB | 12 GB |
注:表中售价均为官方首发限价
我们可以看到GeForce GTX 1080的默认核心频率达到了惊人的1607MHz,Boost频率为1733MHz,显存带宽为320GB/s,这款产品完整支持DirectX 12 API以及异步运算,在DX12中有着更好的表现。GTX 1080的默认Pixel Fillrate能力达到了102.8Gpiexls/S,默认Texture Fillrate能力为277.3Gtexels/S。凭借超高的基础频率和庞大的运算规模,GTX 1080拥有9 TFLOPS的超高单精度浮点运算能力,照比GTX Titan X提升了28%,甚至超越了R9 Fury X的8.6 TFLOPS单精度浮点运算能力,成为目前单精度浮点运算性能最高的游戏显卡。
Pascal架构GP104-400芯片由以下主要的部分组成:
1、基于TSMC的16nm FinFET工艺。
2、4单元的宏观并行结构,20组SMs单元被分为4个GPC,每个GPC包含5组SMs。
3、20组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。
4、GP 104拥有8个32位显存控制器,总计256位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计64个ROPs单元和2M二级缓存。
5、改进型的4.0版本PolyMorph Engine,包含了为VR设计的The Simultaneous Multi-Projection Engine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。
在GeForce GTX 1080上,我们看到了其与上代基于Maxwell 2.0架构显卡相类似的设计,主要区别就是每个GPC中多了一组SMs单元。这就让这款显卡能够支持所有在GeForce GTX 900系列中的特性,以后使用到这款显卡的玩家能够获得与其他采用基于Maxwell 2.0架构设计的显卡的体验。
本文属于原创文章,如若转载,请注明来源:缔造性能神话 GeForce GTX 1080首发评测//vga.zol.com.cn/582/5829805.html