● GTX780规格一览
承袭自Titan,GeForce GTX 780拥有了远比GK104更为巨大的规模。它拥有71亿的晶体管规模,核心面积超过560平方毫米,这一数值十分接近但并未超越NVIDIA在DirectX 11时代所划D线(什么是D线? 它会导致怎样的问题?)的上限(529+52.9平方毫米),这种核心面积为其功耗及可制造性表现打下了基础。与GeForce GTX 680相比,GeForce GTX 780的运算资源总量从1536个ALU上升到了2304个,Texture Filter Unit由128个上升到了192个,构成后端的ROP则从32个提升到了48个。GeForce GTX 780拥有同Titan一样庞大的MC结构,6个64bit双通道显存控制器组合形成了384bit显存控制单元,GeForce GTX 780的显存容量也因此而从GeForce GTX 680的2048MB提升到了3072MB。
GeForce GTX 780的默认核心及显存运行频率为863/6008MHz,Boost频率达到了900MHz,默认Pixel Fillrate能力为35.4G/S,默认Texture Fillrate能力为161.1G/S,显存带宽288.4GB/S。GeForce GTX 780拥有近4T Flops的单精度浮点运算能力,理论上拥有1.3T的双精度浮点运算能力,但出于旗舰级游戏显卡的定位,它并未同Titan一样提供完全的双精度浮点运算能力,NVIDIA在它身上进行了一定的限制,仅开放了单精度1/24的双精度浮点运算能力。
GeForce GTX 780架构图
GeForce GTX 780采用的GK110与GK104同属Kepler架构,但只有GK110开放了Kepler架构全部功能性设计和特点,我们甚至可以这样说——只有GK110才是真正意义上的Kepler架构。GeForce GTX 780架构由以下主要的部分组成:
1、与Titan相同的基于HKMG的TSMC 28nm工艺。
2、与GK104不同的宏观并行结构,12组SMX单元被分为4个GPC,每个GPC包含3组SMX。
3、12组包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMX单元。每个SMX单元的细节同GK104完全相同,均包含一组改进型的负责处理几何任务需求的PolyMorph Engine,192个负责处理运算任务及Pixel Shader的ALU,16个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,二级线程管理机制以及与它们对应的shared+unified cache等缓冲体系。
4、由于关闭了一个GPC,GeForce GTX 780的同频几何处理处理能力、运算能力以及材质操作能力均为完整规格GK110的80%。
5、基于Dynamic Parallelism的全新本地任务管控机制,以及由此带来的更高的单元复用率。
6、调节粒度更细同时频率控制范围更大的新一代GPU Boost。
Kepler构架曾经是一个充满了神秘感的存在,伴随着GK104和GK110的发布,我们在过去的一年里曾经对它的各种细节和意义进行过详尽的相关分析,这些分析就像一组拼图游戏,我们不断的从NVIDIA发布的架构及芯片中拾取Kepler的意义,并经由3月份发布的GeForce GTX Titan最终完成了整幅拼图。现在,随着GeForce GTX 780的到来,Kepler架构的绝大部分GPU都已经来到了我们的面前,所以我们不妨再次深入Kepler架构,来回顾一下种种“黑科技”的真正内幕吧。
推荐经销商