● 构架底层延展测试
在构架底层性能的延展测试环节,我们使用基于OpenCL的通用计算测试软件——GPCBenchmark来完成数据的收集。GPCBenchmark使用最为通用的函数库及API接口进行编写,并未对任何构架进行针对性的优化,测试基于构架的底层能力,且第一次以常规数学方法全面的考验了构架的灵活度和运算应对能力。通过该款软件,我们不仅可以直接读取许多底层构架信息,更能获得构架最真实的特性。
在测试总分环节,HD7970取得了令人惊讶的近6000分的测试结果,即便是相对于以灵活通用计算能力见长的GTX580,其领先幅度也达到了51%之多。
在读写测试环节,我们注意到HD7970的数据传输平滑度较之Cayman有了很大的进步,无论单纯的读写能力还是拷贝能力,HD7970均达到了较高的水平。
局域存储器测试环节考验的是构架局域存储器,也就是Shared以及cache的读写和操作能力。Tahiti构架由于引入了完整且十分灵活的unified cache体系,同时进一步改进了传统Shared的分布形式及操作方式,因此在局域存储器测试环节的结果较之Shared操作方式落后且不支持unified cache的Cayman要抢眼得多。局域存储器的性能直接关系着构架对缓冲的使用能力,而对缓冲的使用和操作能力又直接影响着构架运行Compute Shader以及其他要求灵活度的图形和运算操作的性能。
在这个环节的测试中,我们注意到Cayman的双精度测试存在问题,无法进行任何双精度相关的运算过程。由于使用相同驱动的Tahiti构架在双精度方面的表现良好,因此我们认为AMD目前还无法在Cayman构架中很顺利地实现非ALU.Trans进行的DP过程。与此同时,Tahiti构架的局域存储器吞吐存在较大的单双精度差异,因此我们认为AMD目前在维持3个构架同时正常工作方面遇到了较大的挑战,同时在未来的驱动挖掘方面仍旧也还存在很大的余地。
推荐经销商