● shader灵活度测试:矩阵乘法
矩阵乘法是线性代数的基本构成之一,它是各种通用计算以及shader处理过程中非常常见的数学操作方式,矩阵乘法的过程可以将许多非常复杂的模型转换成相对简单的表现形式,因此被广泛应用在了光栅化(坐标变换)、光照(亮度直方操作)、阴影边缘平滑(针对像素块的切比雪夫不等式群)等几乎所有图形处理过程中。可以说只要进行图形处理过程,GPU就必定会进行大量的矩阵乘法操作。
矩阵乘法
矩阵乘法可以被解离成大量的行列式运算,并行化的处理这些行列式,同时为操作过程提供合理的缓冲空间来释放临时结果势必会极大地加快矩阵乘法操作的效率,进而加快整个图形过程的进度。因此,对于矩阵乘法效率的测试,不仅可以让我们获得构架并行度以及缓冲资源情况的信息,更能在趋势上反映GPU执行shader尤其是灵活shader的执行效率。所以,我们将矩阵乘法测试作为构架延展测试的第一个项目,通过它将Tahiti构架的ALU团簇部分剥离出来进行专门的性能测试。
HD7950的运算单元规模比HD7970缩减了12.5%,但各项缓冲资源比如L2 unified cache的总量并未见变化,所以HD7950的每一个ALU所能够获得的寄存器溢出缓冲会高于HD7970。正因为此,虽然同为Tahiti构架,但伴随着频率的提升,HD7970以及HD7950在执行矩阵乘法时的性能差距在快速的缩小,更大的缓冲密度为HD7950带来了更好的单元复用率,这种更好的单元动作效率不仅成功的弥合了由运算单元吞吐规模带来的差异,更让HD7950拥有了更好的执行各种灵活shader指令的能力。
推荐经销商