ZOL首页 > 显卡 > 评测 > 横向评测 >

CUDA-Z软件核心界面分析（二）

明星编辑

通用计算对决四代NV显卡激战CUDA-Z

CBSi中国·ZOL 作者：中关村在线濮元恺 责任编辑：龚力成【原创】 2010年04月10日 06:55 评论

在本页阅读全文（共15页）

● CUDA-Z软件核心界面分析（二）

下面结合刚才所提及到的重要概念，让我们进入CUDA-Z的具体界面中。第一个参数Name表示NVIDIA给GPU的命名，这里的Name不是复杂难懂的核心代号，而是市场上经常能看到的GPU核心型号名称。

Compute Capability翻译为计算能力，它表示该GPU的运算层级而不是性能。在下表中大家可以找到自己的GPU型号并做对比，表中仅列出桌面级GPU，专业级GPU用户请和桌面级芯片对对比，找到自己的计算能力定位。

Compute Capability（设备计算能力）
GPU核心
GPU核心	核心代号	计算能力
Geforce 8系列 GPU 8800 GTS、GTX、Ultra	G80	1.0
其他Geforce 8系列 GPU和Geforce 9全系列	G92	1.1
Geforce GT 200系列（GT210、220、240）
Geforce GT 200系列（GT210、220、240）	GT215	1.2
Geforce GTX 200全系列	GT200	1.3
Geforce GTX 400全系列	GF100	2.0

Compute Capability 计算能力说明
计算能力1.0规格说明	每个Block中的最大线程数量为512；一个线程块的x、y和z维最大规格为512、512和64；线程块网格各维度的最大规格为65535； Warp 块的大小是32个线程；每个多处理器的寄存器数量是8192；每个多处理器可用的共享存储器数量是 16KB，组织为 16 个存储体；固定存储器的总量是64KB；固定存储器的缓存工作区是每个多处理器8KB；\| 纹理存储器缓存工作区介于每个多处理器6到8KB之间；每个多处理器的最大活动块数是8；每个多处理器的最大活动warp块数是24；每个多处理器的最大活动线程数是768；对于绑定到一维CUDA数组的纹理参考，最大宽度为213；对于绑定到二维CUDA数组的纹理参考，最大宽度为216，最大高度为215；对于绑定到三维CUDA数组的纹理参考，最大宽度为211，最大高度为211，最大深度为 211；对于绑定到线性存储器的纹理参考，最大宽度为227；内核大小限制为200万PTX指令；每个多处理器都由8个处理器组成，因此一个多处理器能够在 4 个时钟周期内处理一个warp块的32个线程。
计算能力1.1规格说明	在计算能力1.0的基础上；支持在全局存储器的32位字上操作的原子函数。
计算能力1.2规格说明	在计算能力1.1的基础上；支持在共享存储器中操作的原子函数以及在全局存储器的 64 位字上操作的原子函数；支持warp vote函数；每个多处理器的寄存器数量是16384；每个多处理器的最大活动warp块数量是32；每个多处理器的最大活动线程数是1024。
计算能力1.3规格说明	在计算能力1.2的基础上；支持双精度浮点数。

在Clock Rate中，我们可以看到自己的CUDA设备运行频率，当然这里的频率已经不是GPU的核心频率，而是流处理器频率。因为CUDA的运算部件就是GPU中曾今的着色器——流处理器。当然这个说法也不是完全准确，因为GPU核心中的某些单元，比如说仲裁器和Atomic单元工作频率还是和固定单元（也就是GPU核心）一样，这些单元为流处理器提供的源源不断的数据支持和控制，当然他们几乎没有参与实际的运算工作。

跨时空对决四代NV显卡激战CUDA-Z
CUDA-Z软件的Core核心界面

Multiprocessors代指流多处理器，也被称为SM（Stream Multiprocessors），在CUDA架构GPU，8个流处理器为一组，当然每个SM还包括两个SFU（Super Function Unit）特殊运算单元，GTX200架构中每个SM中增加了一个DPU（Double Precision Unit）双精度运算单元。

Warp Size表示每个warp块包含的线程数，也可以称作粒度。线程发射粒度越小，代表GPU线程管理能力越强，但这会付出很大的硬件开销代价。目前市面上的所有N卡Warp Size都是32，但特殊情况下存在Half Warp，也就是说可以16个指令发射一次，这样可以进一步提高线程管理能力。

Regs per Block代表每个多处理器的寄存器数量。

Threads per Block代表每个Block中的最大线程数量。

Watchdog Enabled代表GPU“监护人”能力，是一种特殊的防火墙功能。

最下方的Threads Dimentions代表一个线程块的 x、y 和 z 维最大规格。

Grid Dimentions则代表线程块网格各维度的最大规格。