GPU统一虚拟寻址

提高多GPU编程与执行效率 CUDA 4.0初探

CBSi中国·ZOL 作者：中关村在线濮元恺 责任编辑：林光楠【原创】 2011年03月07日 05:00 评论

　　● GPU统一虚拟寻址

　　在2011年2月28日，NVIDIA发布了最新版本的CUDA工具包——CUDA 4.0。借助该工具包，开发人员能够开发出在GPU上运行的并行应用程序。本次NVIDIA历经两年时间发布了CUDA 4.0版本，这一版本为我们带来了3个核心的编程与执行方式提升，它们分别是：

　　1、统一的虚拟寻址；
　　2、更直接的GPU间通信；
　　3、增强型C++模板库。

　　这3个关键性提升让更多开发人员能够利用GPU计算，它们也成为CUDA 4.0的核心提升之处。接下来我们通过NVIDIA官方公布的资料来简单分析CUDA 4.0的不同之处。

多个GPU及其显存可以被视为一体

　　首先提出的是“GPU统一虚拟寻址”概念，我们第一次见到这一概念在Fermi架构发布的报道中，Fermi架构带领GPU全面走向高性能计算的重要表现就在于存储体系的结构完善和GPU统一的虚拟寻址，结构部分中关村在线显卡频道之前进行了大量分析，细心的读者肯定收藏了我们的技术分析类文章。

　　Fermi的发布彻底统一了GPU寻址空间，将不同的寻址简化为一种指令，这在以前的的GPU中是不敢想象的，内存地址取决于存储位置：最低位是本地，然后是共享，剩下的是全局。这种统一寻址空间也是支持C++的必需前提。

　　本次CUDA 4.0版本的发布可以让多个GPU以及CPU统一调用GPU显存以及CPU内存，并将处理器（CPU+GPU）和存储器（内存+显存）视为统一整体。在最大显存为6GB的Tesla产品中，多CPU和多GPU融合之后可以为整个系统带来大容量存储设备并且进行统一寻址。

本文导航

频道热词：华硕主板 Intel AMD

视觉焦点

精彩内容推荐

显卡评测热点

排行文章标题