热点:
    编辑
    定制典范 七彩虹iGame600系列性能测试
      [  中关村在线 原创  ]   作者:
    收藏文章 阅读全文 暂无评论

    ★ NVIDIA Kepler架构改进

           ● 放弃ALU分频方案

           在Kepler架构中,NVIDIA放弃了沿用长达6年之久的ALU分频方案,而是回归到ALU与整个核心同频的常规方案上。分频设计对ALU而言是把双刃剑,它可以让NVIDIA以更少的运算资源总量来实现更大的吞吐,而更少的运算资源总量可以减轻对包括互联资源在内的很多周边资源造成的压迫,但由分频导致的过高的ALU运行频率也会给整个GPU芯片带来极为沉重的负担。

    iGame600系列测试
    ALU分频被弃用

           通过启用同频方案,NVIDIA获得了比过去多80%的逻辑结构余量以及50%的单位频率功耗空间,对这部分资源的应用让Kepler获得了极其出色的性能功耗比,同时也有了更好的余量来进行ALU总量的释放。

           ● 庞大的SMX以及更快速的Cache

           与Fermi的SM单元规模对应线程粒度单位warp不同,Kepler的SMX单元急剧放大了ALU团簇的整体规模,其ALU总量从过去的32个增加到192个。与此同时,SMX单元的线程仲裁管理机制也得到了放大。负责线程分派和发放管理的Warp Scheduler从过去的2个增加到4个,与之对应的Dispatch Unit从过去的2个增加到8个,Warp Scheduler与Dispatch Unit的比列提升到1:2,这些举措可以有效地改善单元规模增大带来的线程分派及管理压力。

    iGame600系列测试
    SMX单元结构

           在Unified Cache体系方面,Kepler与传统的Fermi在结构上没有多大差异,其L1/Shared以及L2 Cache的大小和比例均未发生变化,仍旧维持64K的L1/Shared以及128K/MC的L2尺寸。整个体系中最值得关注的变动来自L3 Cache速度以及带宽的提升,这为通用计算性能以及Texture性能的提升创造了有利的条件。

           ● 第二代几何处理引擎

           PolyMorph Engine 2.0引擎在结构上与PolyMorph Engine 1.0差异不大,均由Vertex Fetch、Tessellator、Viewport Transform、Setup以及Output单元构成。但在PolyMorph Engine 2.0引擎中,NVIDIA放大了Tessellator单元的规模,同时还借鉴了AMD在Cayman以及Tahiti中的经验,通过优化线程以及Stream流的方式进一步加强了PolyMorph Engine在低负载下的几何处理能力。

    iGame600系列测试
    PolyMorph Engine 2.0以及线程仲裁机制

           通过改进,PolyMorph Engine 2.0拥有了2倍于Fermi的单位性能,这使得Kepler在PolyMorph Engine数量减少一倍的前提下依旧维持了极为强劲的几何性能和高负载下较低的性能衰减,同时在低负载下的几何性能也变得更加抢眼。

           ● Scheduling过程

           NVIDIA称在Kepler中任务会在解码之前根据Sched.info进行选择,然后直接进行解码并被送入流水线中完成后续处理。整个关联性检查以及指令重组等过程被一个简单的Sched.info-select所取代。在该过程下,指令从解码到执行几乎没有延迟,整个流水线因此获得了极高的执行效率。

    vga.zol.com.cn true //vga.zol.com.cn/322/3223232.html report 2260 ★ NVIDIA Kepler架构改进   ● 放弃ALU分频方案   在Kepler架构中,NVIDIA放弃了沿用长达6年之久的ALU分频方案,而是回归到ALU与整个核心同频的常规方案上。分频设计对ALU而言是把双刃剑,它可以让NVIDIA以更少的运算资源总量来实现更大的吞吐,而...
    提示:支持键盘“← →”键翻页阅读全文
    本文导航
    不喜欢(0) 点个赞(0)

    推荐经销商

    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海