● 大改,从SMX到SMM
从G80到Kepler,NVIDIA一直在改进GPU的ALU团簇基本单元,但整体上一直在使用并调整着分频电路+大规模仲裁机制+32ALU捆绑的SM单元方案,而Kepler则采用了取消分频电路+瘦身仲裁机制+192ALU捆绑的SMX单元方案。如今,NVIDIA在Maxwell架构中进一步改进了ALU团簇,新的团簇方案名称为SMM。
SMX单元结构
新的SMM单元较之原先的SMX单元有了本质性的结构变化,在保留完整的几何前端的前提下,SMM单元在内部将ALU团簇再次划分成了4个并行的独立子团簇SM,每个SM包含32个ALU,并且都拥有独立的Scheduler/Dispatch以及Register,每两组SM共享一组统一的Texture/L1 D\$ cache,这与SMX单元192个ALU共享同一组Scheduler、Dispatch、L1 D\$ cache以及Register形成了鲜明的对比,而且也进一步提升了每个ALU所能够获得的Register资源量。
ALU团簇结构的改变同时也带来了纹理单元分布的变化,材质资源方面,新的SMM单元包含2组共计8个Texture Array,相对于Kepler,Maxwell的运算/材质密度有了进一步下降,所以相对而言,我们可以认为Kepler是一个更偏重于图形操作的架构,而Maxwell则将注意力更多地集中在了运算和任务效率层面。
值得一提的是,尽管AMD在Hawaii/Tonga架构当中进一步提升了架构的整体宏观并行度并改进了前端,但Maxwell架构对于SMM单元的修改再次将竞争拉到了新的高度。跟先前的情况相同,除了没有后端之外,可以说一个SMM单元在结构上依旧接近于竞争对手的一颗标准GPU了。
推荐经销商