热点推荐
ZOL首页 > 显卡 > 评测 > 横向评测 >

CUDA-Z软件核心界面分析(二)

通用计算对决 四代NV显卡激战CUDA-Z

CBSi中国·ZOL 作者:中关村在线 濮元恺 责任编辑:龚力成 【原创】 2010年04月10日 06:55 评论
在本页阅读全文(共15页)

● CUDA-Z软件核心界面分析(二)

    下面结合刚才所提及到的重要概念,让我们进入CUDA-Z的具体界面中。第一个参数Name表示NVIDIA给GPU的命名,这里的Name不是复杂难懂的核心代号,而是市场上经常能看到的GPU核心型号名称。

    Compute Capability翻译为计算能力,它表示该GPU的运算层级而不是性能。在下表中大家可以找到自己的GPU型号并做对比,表中仅列出桌面级GPU,专业级GPU用户请和桌面级芯片对对比,找到自己的计算能力定位。


Compute Capability(设备计算能力)
GPU核心
核心代号 计算能力
Geforce 8系列 GPU 8800 GTSGTXUltra G80 1.0
其他Geforce 8系列 GPU和Geforce 9全系列 G92 1.1
Geforce GT 200系列(GT210、220、240)
GT215 1.2
Geforce GTX 200全系列 GT200 1.3
Geforce GTX 400全系列

GF100

2.0

Compute Capability 计算能力说明
计算能力1.0规格说明

每个Block中的最大线程数量为512
一个线程块的
xyz维最大规格为51251264

线程块网格各维度的最大规格为
65535
Warp 块的大小是32个线程;
每个多处理器的寄存器数量是
8192
每个多处理器可用的共享存储器数量是
16KB,组织为 16 个存储体;
固定存储器的总量是
64KB
固定存储器的缓存工作区是每个多处理器
8KB;|
纹理存储器缓存工作区介于每个多处理器
68KB之间;
每个多处理器的最大活动块数是
8
每个多处理器的最大活动
warp块数是24
每个多处理器的最大活动线程数是
768
对于绑定到一维
CUDA数组的纹理参考,最大宽度为213
对于绑定到二维
CUDA数组的纹理参考,最大宽度为216,最大高度为215
对于绑定到三维
CUDA数组的纹理参考,最大宽度为211,最大高度为211,最大深度为 211

对于绑定到线性存储器的纹理参考,最大宽度为
227
内核大小限制为
200PTX指令;
每个多处理器都由
8个处理器组成,因此一个多处理器能够在 4 个时钟周期内处理一个warp块的32
个线程。

计算能力1.1规格说明

在计算能力1.0的基础上;
支持在全局存储器的
32位字上操作的原子函数。

计算能力1.2规格说明

在计算能力1.1的基础上;
支持在共享存储器中操作的原子函数以及在全局存储器的
64 位字上操作的原子函数;
支持
warp vote函数;
每个多处理器的寄存器数量是
16384
每个多处理器的最大活动
warp块数量是32
每个多处理器的最大活动线程数是
1024

计算能力1.3规格说明

在计算能力1.2的基础上;
支持双精度浮点数。

    在Clock Rate中,我们可以看到自己的CUDA设备运行频率,当然这里的频率已经不是GPU的核心频率,而是流处理器频率。因为CUDA的运算部件就是GPU中曾今的着色器——流处理器。当然这个说法也不是完全准确,因为GPU核心中的某些单元,比如说仲裁器和Atomic单元工作频率还是和固定单元(也就是GPU核心)一样,这些单元为流处理器提供的源源不断的数据支持和控制,当然他们几乎没有参与实际的运算工作。

跨时空对决 四代NV显卡激战CUDA-Z
CUDA-Z软件的Core核心界面

    Multiprocessors代指流多处理器,也被称为SM(Stream Multiprocessors),在CUDA架构GPU,8个流处理器为一组,当然每个SM还包括两个SFU(Super Function Unit)特殊运算单元,GTX200架构中每个SM中增加了一个DPU(Double Precision Unit)双精度运算单元。

    Warp Size表示每个warp块包含的线程数,也可以称作粒度。线程发射粒度越小,代表GPU线程管理能力越强,但这会付出很大的硬件开销代价。目前市面上的所有N卡Warp Size都是32,但特殊情况下存在Half Warp,也就是说可以16个指令发射一次,这样可以进一步提高线程管理能力。

    Regs per Block代表每个多处理器的寄存器数量。

    Threads per Block代表每个Block中的最大线程数量。

    Watchdog Enabled代表GPU“监护人”能力,是一种特殊的防火墙功能。

    最下方的Threads Dimentions代表一个线程块的 x、y 和 z 维最大规格。

    Grid Dimentions则代表线程块网格各维度的最大规格。

上一页 1 ...3 4 5 6 7 ...15 下一页
频道热词:华硕主板  Intel  AMD  
视觉焦点
显卡评测热点
排行 文章标题
TOP10周热门显卡排行榜
  • 热门
  • 新品