● 构架底层延展测试:Fluid simulation
架构底层延展测试是ZOL显卡频道传统的测试环节,我们会通过底层架构直接运行数学应用的形式来反应GPU的通用计算及图形通用计算效率。由于300以及301系列驱动对OpenCL的支持存在问题,同时GPU Boost对于频率的调节会干扰底层运算性能的“纯净度”,因此我们决定放弃基于OpenCL的通用计算测试软件——GPCBenchmark,改用DirectX SDK来完成底层性能数据的收集。待到NVIDIA的官方驱动能够提供正确的OpenCL支持以及可以关闭GPU Boost的设置之后,我们将会补上GPCBenchmark的相关测试。
我们首先进行的DirectX SDK测试,是使用Direct Compute完成的流体力学模拟——Fluid dynamics simulation。Fluid dynamics simulation基于弹性力/黏着力/重力为基础的颗粒碰撞模拟,每一个颗粒均拥有独立的力学参数,通过对颗粒本身在统一的重力参数作用下自有力学参数以及交互作用的计算,可以模拟大量颗粒的行为并达到模拟由它们构成的“流体”特性的目的。
Fluid dynamics simulation
Fluid dynamics simulation分别提供了对shared性能以及Grid性能的测试,力学计算本身需要应用包括矩阵运算在内的多种数学方法,颗粒之间的力学交互作用存在条件分支关系,因此该项测试可以全面考验不同构架对图形通用计算以及有针对性的物理特效计算的性能。
测试结果在意料之中,与我们先前进行的GTX680首测中的Fluid Simulation一样,基于GK104架构的GTX670表现出了相当理想的通用计算性能,在常规场合表现出了领先于HD7970的测试结果。我们同时也注意到了NVIDIA在驱动开发方面遇到的问题,缓冲性能最近成了困扰Kepler甚至Fermi架构的一大障碍,在我们目前进行的部分OpenCL测试中,GK104的寄存器-cache/shared双精度带宽竟然大幅超过了单精度带宽,这种不正常的表现被忠实的反映到了Fluid Simulation shared memory上,在该测试中GTX670不仅只达到了GTX680性能的65.9%,明显低于双方的理论性能差距,同时也被HD7970所反超。希望NVIDIA能够尽早解决驱动方面的问题,完全释放Kepler架构的运算性能。
推荐经销商