● 收获成熟——SMX
SM是NVIDIA GPU的ALU团簇基本单元,而这一单元在NVIDIA开普勒时代的首款架构GK104中的改进可谓翻天覆地,NVIDIA采用的全新的SMX单元彻底改变了传统的SM单元的内涵。
SMX单元与Fermi的SM单元在逻辑结构上十分近似,都拥有完整的几何前端,线程仲裁机制,ALU团簇,Texture Array以及unified cache/shared和Register。除了没有后端之外,可以说一个SM/SMX单元在结构上已经趋近等同于一颗标准GPU了。
与SM单元相比,SMX单元急剧放大了ALU团簇的整体规模,其ALU总量从过去的32个增加到了192个。与此同时,SMX单元的线程仲裁管理机制也得到了放大。负责线程分派和发放管理的Warp Scheduler从过去的两个增加到了4个,与之对应的Dispatch Unit从过去的2个增加到了8个,Warp Scheduler与Dispatch Unit的比例提升到了1:2,这些举措可以有效的改善单元规模增大带来的线程分派及管理压力。
在放大ALU团簇以及线程仲裁机制的同时,NVIDIA还进一步放大了与ALU团簇对应的Register。GK104中每个SMX的Register较之Fermi的SM放大了一倍,达到了65536X32bit的规模。
从SM到SMX的改进,主旨在于削减硬件管理机制与ALU的比例,开始尝试将控制管理工作交由性能功耗比更高的组件来完成,它标志着NVIDIA在长达8年的逻辑结构发展路线上进入了全新的阶段。它对从G80到GF100的诸多努力进行了收获和总结,并为NVIDIA后续的架构打开了大门。
推荐经销商