SHOC 提供了四个级别的 fft 求解规模,分别是 1、8、、96、256(单位是 MiB),我们设置为第四级即 256 MiB。 这个测试出来的性能比较容易受到驱动和 SDK 版本影响,不过因为我们都是使用同样的驱动和 SDK,所以测试出来的结果都比较合乎预期的样子。
如果数据是透过 PCIE 传输的话,对测试结果会有明显的影响。分子动力学(Molecular Dynamics,MD):测量进行分子动力学中的兰纳-琼斯势性能,该测试采用了在像 LAMMPS 应用中成品级 MD 代码所使用的 neighbor-list 算法。数据类型有单精度和双精度。
兰纳-琼斯势性能
在 SHOC 中,MD 项目有四种求解规模:12288、24576、36864、73728,代表了求解对象的原子规模数,我们在这里采用了最高的 73728 个原子求解规模。在这个测试中,各个子项目均有两个测试值,例如 md_sp_flops 和 md_sp_bw,分别表示以单精度执行 md 求解的浮点操作数性能和带宽性能,单位自然分别是 GFLOPS 和 GiB/s。
推荐经销商