热点:
    编辑
    本是同根生 GT640/GTX650技术规格解析
      [  中关村在线 原创  ]   作者:
    收藏文章 阅读全文 暂无评论

    ● SMX单元概念解析

           SM曾经是NVIDIA GPU的ALU团簇基本单元,这一单元在GK104图形核心中的改进可谓翻天覆地,NVIDIA采用全新的SMX单元彻底改变了传统SM单元的观念内涵。

           GT640/GTX650以及其它Kepler架构所采用的SMX单元与Fermi的SM单元在逻结构上十分相近,两者都拥有完整的几何前端、线程仲裁机制、ALU团簇、Texture Array、unified cache/shared和Register。除了没有后端之外,一个SM/SMX单元在结构上可以说趋近等同于一颗标准GPU。

    本是同根生 GT640/GTX650技术规格解析
    SMX单元结构

           与Fermi的SM单元规模对应线程粒度单位warp(32 ALU VS 32 Thread)不同,Kepler的SMX单元急剧放大了ALU团簇的整体规模,其ALU总量从过去的32个增加到192个。与此同时,SMX单元的线程仲裁管理机制也得到放大,负责线程分派和发放管理的Warp Scheduler从过去的两个增加到4个,与之对应的Dispatch Unit从过去的2个增加到8个,Warp Scheduler与Dispatch Unit的比列提升到1:2,这些举措可以有效改善单元规模增大所带来的线程分派及管理压力。

           在放大ALU团簇以及线程仲裁机制的同时,NVIDIA还进一步放大了与ALU团簇对应的Register。根据NVIDIA提供的资料,Kepler中每个SMX单元中的Register较Fermi的SM单元放大一倍,达到了65536×32bit的规模。

    本是同根生 GT640/GTX650技术规格解析
    更为强劲的SMX性能

          在Unified Cache体系方面,Kepler与传统的Fermi在结构上没有多大的差异,其L1/shared以及L2/cache的大小和比例均未发生变化,仍旧维持64K的L1/shared和128K/MC的L2尺寸。整个体系中最值得关注的变动来自L2 cache速度以及带宽的提升,NVIDIA称GTX680的L2 cache目前运行在分频状态下,默认运行频率是核心频率的一倍,这为GTX680提供了比过去大得多的L2带宽,这为通用计算性能以及Texture性能的提升创造了有利的条件。

           更大的ALU规模、更多的线程仲裁机制以及更大的寄存器缓冲为SMX带来了全新的性能表现,新的逻辑设计让GK104的运算单元拥有2倍于Fermi的性能。

    vga.zol.com.cn true //vga.zol.com.cn/323/3234982.html report 1638 ● SMX单元概念解析    SM曾经是NVIDIA GPU的ALU团簇基本单元,这一单元在GK104图形核心中的改进可谓翻天覆地,NVIDIA采用全新的SMX单元彻底改变了传统SM单元的观念内涵。    GT640/GTX650以及其它Kepler架构所采用的SMX单元与Fermi的SM单元在逻结...
    提示:支持键盘“← →”键翻页阅读全文
    本文导航
    不喜欢(0) 点个赞(0)

    推荐经销商

    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海