● 大改,从SMX到SMM
从G80到Kepler,NVIDIA一直在改进GPU的ALU团簇基本单元,从G80到Fermi,NVIDIA一直在使用并调整着分频电路+大规模仲裁机制+32ALU捆绑的SM单元方案,而Kepler则采用了取消分频电路+瘦身仲裁机制+192ALU捆绑的SMX单元方案。如今,NVIDIA在Maxwell架构中进一步改进了ALU团簇,新的团簇方案名称为SMM。
SMX单元结构
新的SMM单元较之原先的SMX单元有了本质性的结构变化,在保留完整的几何前端的前提下,SMM单元在内部将ALU团簇再次划分成了4个并行的独立子团簇,每个团簇包含32个ALU,并且都拥有独立的Scheduler/Dispatch以及Register,每两组ALU团簇共享一组统一的Texture/L1 D\$ cache,这与SMX单元192个ALU共享同一组Scheduler、Dispatch、L1 D\$ cache以及Register形成了鲜明的对比,而且也进一步提升了每个ALU所能够获得的Register资源量。
ALU团簇结构的改变同时也带来了纹理单元分布的变化,材质资源方面,新的SMM单元包含2组共计8个Texture Array,相对于Kepler,Maxwell的运算/材质密度有了进一步下降,所以相对而言,我们可以认为Kepler是一个更偏重于图形操作的架构,而初代的Maxwell则将注意力更多地集中在了运算和任务效率层面。
总体而言,在这一全新设计上,每个SMM的尺寸得到大幅缩减,而性能却能够达到一个 Kepler SMX的90%。更小的面积让NVIDIA能够在每颗GPU中实现更多数量的SMM。通过对比GK107和GM107SM总数的相关指标可发现,GM107有五个SM,而前者只有两个。GM107 的峰值纹理性能比前者高 25%,CUDA 核心数量多1.7倍,着色器性能大约高2.3倍。
值得一提的是,尽管AMD在Hawaii当中进一步提升了架构的宏观并行度,但Maxwell架构对于SMM单元的修改再次将竞争拉到了新的高度。所以跟先前的情况相同,除了没有后端之外,可以说一个SMM单元在结构上依旧接近于竞争对手的一颗标准GPU了。
推荐经销商