GPU存储体系特点与变化_ATI Radeon HD 4850

超越图形界限 AMD并行计算技术全面解析

CBSi中国·ZOL 作者：中关村在线濮元恺 责任编辑：王胤韬【原创】 2010年08月25日 06:20 评论

● GPU存储体系特点与变化

GPU存储体系是GPU的显著优势，当然从某一方面讲也是GPU的明显劣势。其优势是可以借助显卡PCB上焊接的GDDR3或者GDDR5显存，加上GPU内部充足的显存控制器资源获得CPU无法比拟的带宽，劣势是GPU没有足够大的Cache，并且存储体系构成与管理方式相对于CPU来说还是过于简单。

相对于串行CPU的主存储器、Cache和寄存器，图形处理器具有他们自己的存储体系结构。然而，这个存储器体系结构是针对图形加速操作设计的，适合于流式编程模型，而不是通用串行的计算。而且图形API进一步将这个存储器限制成为只能使用图形专用的图元、如顶点、纹理和显存。

超越图形界限 AMD并行计算技术全面解析
CPU与GPU存储体系简析

上图演示了简单的CPU和GPU存储体系结构。GPU的存储器系统建立了现代计算机存储体系的一个分支。GPU和CPU类似，它也有自己的Cache和寄存器来加速计算中的数据访问。然而GPU自己的主存储器也有它自己的存储器空间——这意味着在程序运行之前，程序员必须明确地把数据复制写入GPU存储器。这个传输传统上是很多应用程序的一个瓶颈，但是新的PCI-Express总线标准可能使存储器在CPU和GPU之间共享数据在不远的未来变得更为可行。

具体到显存带宽方面，当前桌面级顶级产品3通道DDR3-1333的峰值是32GB/s，实测中由于诸多因素带宽在20GB/s上下浮动。HD 5870 1024MB使用了8bit预取位带宽超高的GDDR5显存，内存总线数据传输率为150GB/s的总线带宽。而主流GPU普遍拥有40-60 GB/s显存带宽。存储器的超高带宽让巨大的浮点运算能力得以稳定吞吐，也为数据密集型任务的高效运行提供了保障。

AMD GPU存储体系（RV870）

在Cache方面，为了适应更复杂的数据，在GPU内部加入Cache是一种有效的方式：最近使用的数据的副本可以由存储器传递到Cache中并根据替换协议不断更改。但是Cache由于对晶体管消耗较大，缓存协议难以实现，延迟难以控制，一直是GPU设计的重要障碍之一。

又如NVIDIA在G80架构中加入的Shared Memory和AMD在RV770架构加入的LDS（Local Data Share）。这个共享寄存器位于每个流处理器单元内部的所有运算单元中，它在通用计算时负责共享数据和临时挂起线程。容量足够大的共享缓存可以在运算时提高线程的挂起能力，还有很多东西比如乱序，分支等等都会受益于Cache的加入。

上一页 1 ...38 39 40 41 42 ...53 下一页

在本页阅读全文

本文导航

频道热词：华硕主板 Intel AMD