也许是因为属于计算密集型测试的缘故,PCIE 的影响在这里相对小一些。 MD5Hash:SHOC 目前并未给出这个测试项目的细节,但是顾名思义,这是测试 MD5 哈希性能的项目。
测试成绩
MD5 目前在很多场合都有使用,例如文件下载,往往文件的提供者会有 md5 或者其它固定长度的字符串给下载者,用作检验文件的完整性。从测试来看,考虑到其功耗、单槽设计等特点,W7100 的表现不错,在这方面可以说是有较高竞争力的产品。归约(Reduction):用于测量大规模浮点加运算规约的性能。
归约测试分为本地和 PCIE 两种模式,测试结果单位是 GiB/s,NVIDIA 的 CUDA 手册中将这种计算作为按照 GPU 计算思想而逐步优化的经典范例。SHOC 给出的四种归约求解规模是以向量大小为单位的,分别是 1、8、32、64,单位是 MiB。
这里出现了双精度浮点测试比单精度更快的情况,原因之一就是双精度计算的存取数据要比单精度更高。并行前缀求和(Scan):测量对大规模浮点矩阵执行并行前缀求和的性能。
scan 就是给定一个数列,然后计算出另一个数列出来。例如: 有一个给定的数列: [3, 1, 7, 0, 4, 1, 6, 3]经过前缀求和后,就会得出另一个类似下面这样的数列:[3, 4, 11, 11, 15, 16, 22, 25] 这个例子的规律并不难看出,相信你稍微心算一下就明了了。
scan 的应用非常多,例如树操作、Quicksort、直方图等等。SHOC 提供的四个求解规模分别是 1、8、32、64 MiB,我们采用的是最高的64MiB,测试结果单位均为GiB/s,类似于前面的归约测试。蓝宝 PGS AMD FirePro W9100 的测试结果是38GiB/s 略低于蓝宝 PGS AMD FirePro W9000 的 42 GiB/s,这很可能是因为代码未充分优化导致的。
推荐经销商