● shader灵活度测试:矩阵转置
矩阵转置同矩阵乘法一样,也广泛分布在包括坐标变换等过程在内的大量图形处理过程中。矩阵转置可以被理解成矩阵沿特定方向“翻转”之后产生的镜像,这导致了矩阵转置操作会涉及到大量数据,比如稀疏矩阵的对角线数据等的临时存储,因此矩阵转置操作对于体系的缓冲密度是相当敏感的。
矩阵转置操作
同矩阵乘法一样,伴随着频率的不断提升,HD7950的矩阵转置性能提升速度较之HD7970要高出许多,两者之间的性能差异在迅速的收窄甚至趋同。由于矩阵转置的操作过程较之矩阵乘法更加“规整”,能够产生瞬间高延迟的因素较少,因此矩阵转置测试所得的趋势也更加明显和直观。
矩阵转置测试
由于矩阵转置对缓冲体系的敏感,缓冲密度相同但总量更少的Pitcairn在这项测试中遇到了不小的问题,不足以应对测试需求的缓冲体系总量导致了大量的访存过程,这直接拖累HD7800的矩阵转置性能。这个过程在Tahiti中同样存在,但拥有巨大显存带宽的HD7900系列成功的以更好的显存性能应对了缓冲溢出的问题。sweet spot级的HD7800并不具备旗舰级的384bit显存位宽,因此只能接受150G显存带宽带来的测试结果。
推荐经销商