通用计算应用是目前图形构架重点的发展方向及产品应用推广方向。自从微软将越来越多的数学方法引入图形处理过程中,并逐步将ALU的使用权从单纯图形应用中解放出来,GPU的运算能力就一直在方方面面影响着我们的生活。利用GPU卓越的数学处理能力,GPU一直活跃在诸多民用及HPC领域的应用场合中。
无论NVIDIA还是AMD都很重视通用计算
与一般的CPU不同,GPU由于存在板卡和接口的物理限制,其平台最大可扩展的能力取决于PCI-Experss通道的占用数。不论民用还是专业领域,每块主板所能够负载的最大PCI-Experss通道数是有限的,因此GPU通用计算应用中也就出现了运算密度的问题。如何能够在占用尽可能少的PCI-Experss通道的前提下在单块板卡上集成更多的运算能力,成了制约GPU通用计算发展的瓶颈之一。
目前最强的8 PCI-Experss系统
GTX590的出现,在某种程度上缓解了这种瓶颈所带来的影响。作为一款单卡双芯显卡,GTX590通过NF200-P-SLI-A3芯片将两颗完整规格的GF110连接在了一起,通过NF200-P-SLI-A3提供的32条PCI-Experss通道进行通讯,这等于在一块显卡上提供了1024个CUDA core。
技嘉GTX590
由于数学运算讲求效率,所以理论吞吐能力并不是我们考量运算密度的标准。以Fermi构架的运算效率,这将是目前最为恐怖的单卡运算密度。在接下来的测试中,我们将使用斯坦福大学发布的分布式通用计算程序Folding@home来展示该卡的实际运算密度。