● 延展测试下半场:为何DX11快了这么多
DirectX 11性能或者说Compute Shader性能,归根结底考验的是构架应对灵活自然的数学方法应用时的性能。GPCBenchmark的常规数学方法及图形处理过程测试,有助于我们了解构架在应对常规数学方法及图形处理相关数学操作时的表现,进而让我们对构架的Compute Shader性能提升有更加直观的感受。
原子操作能够将线程块凝固,并使其在执行完毕之前不可再分,因此高亮直方图的局域存储器原子操作是最接近发挥构架纯吞吐能力的常规应用。Tahiti构架先进的缓冲体系有助于将吞吐过程平顺化,同时可以大幅增加单元复用率,因此即便抛弃了有助于提升吞吐的VLIW,在该项测试以及后续的单精度浮点吞吐能力测试中HD7970依旧取得了高于HD6970的吞吐表现,这既证明了Tahiti构架的先进性,同时也正式宣判了VLIW最终的死刑。
Compute Shader应用基本上都是围绕着常规的数学方法进行的,这些常规数学方法主要包括了矩阵操作、并行规约以及递归等操作。这类自然的常规数学方法大多并不十分强调构架的吞吐能力,但却对构架的灵活度,比如吞吐模式、缓冲操作形式以及线程管理能力有极高的要求。在这部分测试中,Tahiti构架从前端ACE、缓冲体系以及吞吐模式的改进上获得了极大的好处。其性能相对于上代的Cayman有了长足的进步,在于Fermi构架的比较中也取得了令人满意的结果。
通过GPCBenchmark的测试,我们可以得出这样的结论——Tahiti构架改进的缓冲体系,前端ACE以及吞吐模式大大加强了其应对常规数学方法应用的能力,同时并未令其丢失传统的吞吐优势。这种改进是正确的,同时也是极端有效的。在更加自然的非吞吐数学应用场合,Tahiti构架能够表现出相当强劲的灵活性和绝对性能,而强调吞吐的场合中Tahiti构架凭借出色的单元复用率一样可以获得令人满意的结果。这种全面表现,让HD7970在常规数学方法及通用计算负荷更重的DirectX 11领域拥有了长足的性能进步。
推荐经销商