在本页阅读全文(共15页)
● CUDA-Z理论性能测试:单精度浮点性能
第二个测试属于更为重要的底层运算单元性能测试,它测试了GPU的单精度浮点能力,这个能力主要由流处理器结构影响。
基于同样原因,我们将频率和计算单元数量全部除掉,最后形成了1个流处理器1MHz性能供读者参考。
我们从测试结果看到,Fermi架构代号为GF100的GTX480在单精度浮点运算中取得了巨大提升。这个提升大约是GT200架构的两倍,单纯从这个数据来看,这是一个可喜的结果。
但是精细到1个流处理器1MHz效率方面,我们看到情况发生了一些变化,实际上NVIDIA从G92到GF100的架构更替中,单个运算单元的单精度浮点性能没什么增长,如果忽略测试误差可以得知,GT200是靠提升芯片规模或者说运算器数量来实现单精度性能提升,GF100同样是靠这种手段。