● 命运的阶梯
2006年11月,MVIDIA发布了具有划时代意义的G80架构。G80首次引入了完整可用的GPGPU能力,它通过引入Shared Memory这一全新的缓冲存储体系、强调TLP的并行线程管理及吞吐模式以及宏观SIMD与微观MIMD的结合等一系列举措,正式将通用计算性能带入了GPU的世界。
G80架构细节
接下来发布的GT200对G80进行了进一步的完善,除了SM单元和缓冲规模的放大以及Thread并行吞吐能力的提升之外,GT200进一步将寄存器密度提升到了G80的一倍,同时引入了Atomic(原子操作,一种将若干线程凝固成一个不可再分的线程块的管理手段)等更加先进的线程管理机制,完善了与通用计算相关的各种特性的全面支持。
2010年3月到来的Fermi架构构成了NVIDIA一系列稳步计划的第三步。在Fermi架构中,NVIDIA首次引入了GPC为基础的宏观并行模块化设计,将整个GPU划分成了可以并行运行的4组SM团簇;加入了Unified cache体系作为全新的缓冲机制;还将构架的双精度通用计算性能提升到了单精度的1/2。
在最后登场的Kepler架构中,NVIDIA在维持GPC并行结构的前提下大幅改进了SM单元。如同我们前面所提到的那样,新的SMX单元将Logic controller的占比大幅调低,把相当一部分Scheduling过程从GPU中剥离出来交给了CPU去处理,并利用节省下来的晶体管和面积资源扩充了SMX单元以及整个GPU的吞吐能力。
6年时间,4组构架,NVIDIA为我们摆下了一个通往命运的阶梯。接下来,就让我们继续向前,来看看这阶梯究竟通向何方吧。
推荐经销商