Stencil2d:测量对一个二维 9 点单精度 stencil执行计算的性能(包括 PCIe 传输)。
测试成绩
Stencil2D 在早期的 SHOC 版本中是以秒为测试结果单位的,不过在新版本中已经改用 GFLOPS 作为测试结果。在 SHOC 提供的资料中,没有明确说明 Stencil2D 的求解规模,只是写着待定,我们在测试的时候所有都是指定为 -s 4,所以我假定这里的求解规模是最高的。
从测试结果来看,双精度时候的性能基本上是单精度的一半,估计代码尚有一定的优化空间,但是既然都是跑同样的代码,目前的测试结果也是有一定参考价值的。Triad:就是Stream 中Triad的OpenCL 版本,所谓的 Triad 就是把 Copy、Scale、Add 三种操作组合起来进行测试,在这里采用的是单精度执行计算。
Triad 的测试规模不受 -s 参数影响,测试的规模从 64KiB 到 16MiB,测试的结果是一个大规模向量点积操作的带宽,默认的测试结果单位是 GiB/s,涉及到 PCIE 总线传输,因此该测试对 GPU 来说瓶颈是在 PCIE 总线上。既然是卡在 PCIE 总线上,那么出现测试结果都是 6.x GiB/s 也就不奇怪了。
推荐经销商