在本页阅读全文(共15页)
● CUDA-Z理论性能测试:双精度浮点性能
第三个测试同样属于的底层运算单元性能测试,它测试了GPU的双精度浮点能力,这个能力主要由流处理器结构影响。在GT200架构之前,NVIDIA的通用计算GPU是没有双精度运算能力的,而在GT200和GF100中,双精度能力出现并不断提升。
基于同样原因,我们将频率和计算单元数量全部除掉,最后形成了1个流处理器1MHz性能供读者参考。
按照最后的效率值看,我们认为Fermi架构的GF100桌面产品Geforce系列,在双精度能力上和上一代产品是几乎相同的。GT240和GTS250由于没有双精度计算能力,很遗憾在这项测试中只能得到0分。
当然我们知道,NVIDIA已经在Fermi架构中改进了双精度运算单元,让双精度能力提升到单精度的1/2,但是NVIDIA同时发表声明称:Fermi提供给图形处理的GPU产品中,这个衰减度还是1/8,和GT200一样。只有专门面向通用计算市场的Tesla产品,才拥有1/2的衰减度。我们的测试印证了这个结果。