随着NVIDIA于2012年5月公布的Tesla Compute Arch,外界对GK110架构的了解变的日趋清晰起来。作为即将到来的下一代NVIDIA图形/运算架构,GK110与GK104之间存在着明显的结构差异。这些差异在为GK110创造性能基础的同时,也为其可制造型凭添了更多的关卡。这些差异中最重要的两点,来自GPC结构以及芯片布局的改变。
最完整的Kepler——GK110架构推测版
Fermi第一次引入GPC并行结构起,NVIDIA的宏观并行结构从GF100到GF110再到GK104一直都维持着偶数ALU团簇构成GPC的传统。无论是SM时代还是SMX时代,2个SM/SMX组合成一个GPC的做法都是通行的。但到了GK110时代,这种结构发生了改变,按照目前流行的观点来看,GK110的每个GPC模块都具有3个SMX单元,整个GK110架构由5个GPC模块共计15个SMX/2880个ALU所组成。
另一方面,从芯片的单元布局角度来讲,GK110同样NVIDIA在GK110上放弃了从G80开始沿用了长达6年之后的轴对称/十字对称单元布局,ALU团簇不再以芯片中心的cache以及Thread Engine为轴进行轴对称/十字对称分布,而是采用了“凹”字形的布局方式,一部分cache单元以及一级线程管理机制被ALU团簇以半包围的形式簇拥到了芯片中上部分。
GPC结构的改进关系到光栅化/几何单元配比、任务的分配管理以及执行模式等等一系列细节的变化,同时还会让GPC间的并行细节发生变化,而布局的变化则关系到了互联模式、信号同步性处理以及可制造性等重要的问题。按照NVIDIA的固有行为模式以及强烈的目的性行事风格来看,不在GK110到来之前提前面对甚至干脆处理掉这些问题几乎是不可能的。
满足市场对性能的需求,同时为GK110提前积累一定的经验,这就是NVIDIA新的sweet spot芯片以及中端芯片所要面临的任务,同时也是导致我们认为GeForce GTX 660 Ti会采用旗舰级芯片,而新研芯片将会是GeForce GTX 660的重要原因。
推荐经销商