● CUDA-Z软件核心界面分析(二)
下面结合刚才所提及到的重要概念,让我们进入CUDA-Z的具体界面中。第一个参数Name表示NVIDIA给GPU的命名,这里的Name不是复杂难懂的核心代号,而是市场上经常能看到的GPU核心型号名称。
Compute Capability翻译为计算能力,它表示该GPU的运算层级而不是性能。在下表中大家可以找到自己的GPU型号并做对比,表中仅列出桌面级GPU,专业级GPU用户请和桌面级芯片对对比,找到自己的计算能力定位。
Compute Capability(设备计算能力) | ||
GPU核心 | ||
核心代号 | 计算能力 | |
Geforce 8系列 GPU 8800 GTS、GTX、Ultra | G80 | 1.0 |
其他Geforce 8系列 GPU和Geforce 9全系列 | G92 | 1.1 |
Geforce GT 200系列(GT210、220、240) | ||
GT215 | 1.2 | |
Geforce GTX 200全系列 | GT200 | 1.3 |
Geforce GTX 400全系列 |
GF100 |
2.0 |
Compute Capability 计算能力说明 | |
计算能力1.0规格说明 |
每个Block中的最大线程数量为512; |
计算能力1.1规格说明 |
在计算能力1.0的基础上; |
计算能力1.2规格说明 |
在计算能力1.1的基础上; |
计算能力1.3规格说明 |
在计算能力1.2的基础上; |
在Clock Rate中,我们可以看到自己的CUDA设备运行频率,当然这里的频率已经不是GPU的核心频率,而是流处理器频率。因为CUDA的运算部件就是GPU中曾今的着色器——流处理器。当然这个说法也不是完全准确,因为GPU核心中的某些单元,比如说仲裁器和Atomic单元工作频率还是和固定单元(也就是GPU核心)一样,这些单元为流处理器提供的源源不断的数据支持和控制,当然他们几乎没有参与实际的运算工作。
CUDA-Z软件的Core核心界面
Multiprocessors代指流多处理器,也被称为SM(Stream Multiprocessors),在CUDA架构GPU,8个流处理器为一组,当然每个SM还包括两个SFU(Super Function Unit)特殊运算单元,GTX200架构中每个SM中增加了一个DPU(Double Precision Unit)双精度运算单元。
Warp Size表示每个warp块包含的线程数,也可以称作粒度。线程发射粒度越小,代表GPU线程管理能力越强,但这会付出很大的硬件开销代价。目前市面上的所有N卡Warp Size都是32,但特殊情况下存在Half Warp,也就是说可以16个指令发射一次,这样可以进一步提高线程管理能力。
Regs per Block代表每个多处理器的寄存器数量。
Threads per Block代表每个Block中的最大线程数量。
Watchdog Enabled代表GPU“监护人”能力,是一种特殊的防火墙功能。
最下方的Threads Dimentions代表一个线程块的 x、y 和 z 维最大规格。
Grid Dimentions则代表线程块网格各维度的最大规格。