在本页阅读全文(共15页)
● CUDA-Z理论性能测试:32位整数性能
第五个测试同样属于的底层运算单元性能测试,它是第四个测试的补充和完善。
GPU最初拥有的整数能力就是24位,随后运算位数出现了提升,当然这种提升是在周边控制单元和寄存器规模不断提升的前提下完成的。越充裕的周边资源,在精度提升时将带来越小的性能衰减。
基于同样原因,我们将频率和计算单元数量全部除掉,最后形成了1个流处理器1MHz性能供读者参考。
看到这个结果,相信各位读者都会有不小的惊喜,Fermi架构的特性和设计飞方向体现地淋漓尽致,在更为科学的运算单元组织形式和更充裕的周边资源配合下,GTX480远远超越了对手。这种超越不但来自于规模的放大,而且来自于底层运算单元的改进。
细心的读者已经发现,GTX480的32位整数性能和24位整数性能实际上是一样的,这款GPU已经达到了完整的32位整数运算能力,我们得到的差距只是测试误差。当然我们还是不能排除软件版本的问题,同时我们暂时保留意见,在以后的文章中向各位读者详细讲解。