● 与设计师的灵魂对话
每一款GPU芯片都是辛勤汗水的结晶,它们凝聚了设计者灵魂的力量。透过GPU芯片的特性、性能以及表现的全面了解,我们可以从不同角度不同方向体会到设计师在设计芯片时的想法以及希望表达的意图。
对GPU底层构架的了解,可以让我们获取很多有用的信息
但想要真正的跟设计师的灵魂对话似乎并不容易,图形处理过程的顺序特性仿佛有意在保护着设计师们内心深处的隐私一般,当我们想要了解某个单元比如TMU的性能时,图形流水线的特质决定了我们在绝大多数图形化测试过程中都必须经历这个单元前后的所有处理过程,这导致我们很难在常规的图形化测试过程中获得令人满意的特定单元“纯净”性能。我们获得的结果,或多或少都受到了来自其他单元进行图形化过程的干扰和影响。与“不纯净”的结果对话,是无法让我们真正直达设计者的灵魂深处的。
有没有什么办法能够让我们避开各种干扰,收集到“纯净”的Tahiti构架的底层性能,并直达AMD工程师的内心深处呢?
图形过程的本质,其实就是GPU各个单元对不同数学过程执行的集合,常规的图形化测试方法之所以无法避开干扰,是因为它们大多拘泥于“图形化”的形式当中,无论测试过程还是结果都包含在了一个完整的图形化处理和输出过程中,这让这些测试的几何关联达到了无法忽略的地步。所以,只要绕开这层几何关联,直接测试构架底层单元执行对应数学过程的能力,就可以避开其他单元以及图形化本身对测试的干扰了。
GPCBenchmark是一款基于Open CL的GPU通用性能测试软件,它不仅使用最为通用的函数库及API接口进行编写,并未对任何构架进行针对性的优化,所有测试更基于从图形过程以及通用计算过程中抽离出来的数学过程,能够进行我们所期望获得的,能够绕开几何关联和图形化过程的特定底层硬件纯执行能力测试。通过该款软件,我们不仅可以直接读取许多底层构架信息,更能获得构架最真实的特性。
有了合适的测试手段,接下来的测试对象就成了我们要面对的另一个问题了——要通过测试了解Tahiti构架的特质,并且回答我们在上一页中提到的关于单元复用率与性能之间联系的问题,我们必须先找到合适的测试对象。
有介于HD7950仅删减了CU单元部分,对于ACE引擎、缓冲资源以及显存控制器等对单元复用率能够产生影响的部分未做改动的特性,我们决定采用如下测试法:先将显存统一调整并固定至统一的频率,然后将核心频率从较低水平逐步调整至较高水平的方式,一路收集不同频率下两款缓冲体系相同但运算体系不同的Tahiti构架GPU的各项测试数据,并从中分析它们随频率增加而获得的性能增长以及性能差距状况。这种测试法不仅可以让我们获得Tahiti构架不同资源密度环境下的单元运算效率,更可以更加直观的体会HD7950与同频的HD7970之间的性能差距。
想了解更加真实的Tahiti构架么?想与AMD的构架设计师来一场灵魂的交流么?接下来,就让我们开始今天这场略显晦涩但绝对能带来更多有用信息的底层构架测试吧。
推荐经销商