热点推荐
ZOL首页 > 显卡 > 评测 > 横向评测 >

两种架构运算能力不同

显卡只能玩游戏? 10年GPU通用计算回顾

CBSi中国·ZOL 作者:中关村在线 濮元恺 责任编辑:李鹏飞 【原创】 2010年04月06日 08:42 评论
在本页阅读全文(共14页)

● 两种架构运算能力不同

    CPU的整数计算、分支、逻辑判断和浮点运算分别由不同的运算单元执行,此外还有一个浮点加速器。因此,CPU面对不同类型的计算任务会有不同的性能表现。而GPU是由同一个运算单元执行整数和浮点计算,因此,GPU的整型计算能力与其浮点能力相似。如果你仔细观察一个串行程序的运行结果,你就会发现与浮点计算能力相比,CPU的整数计算能力与GPU中流处理器的整型计算能力更接近,这是因为CPU的设计更侧重于整数计算能力。

    举例来说,一个3GHz的双核CPU每秒能完成60亿条整数指令,而NVIDIA的G80芯片,有128个工作频率为1.5GHz的流处理器,每个流处理器每个计算周期可以执行两条整数指令,把这些数据相乘的结果大约是每秒3500亿~3750亿条指令,这大概是CPU运算能力的50~100倍。GPU在整型计算方面并没有任何劣势。尽管不如在浮点计算方面优势那么大,但是GPU的整型计算能力几乎是CPU的100倍。


无心插柳柳成荫 GPU通用计算十年发展
CPU与GPU芯片面积对比

    现在的CPU和GPU相比芯片规模也呈现出巨大的差异。从相关资料中我们可以了解到,GTX200使用台积电65nm工艺生产,集成多达14亿个晶体管,核心面积576平方毫米,是有史以来规模最庞大的图形芯片。45纳米Penryn家族处理器中的双核心版本内建4.1亿个晶体管,分析图片我们可知其中约2亿个晶体管用于SRAM二级缓存。

    以当前高端GPU为例,AMD HD 4870拥有800个SIMD流处理器,是上一代产品的2.5倍,晶体管总数为9.65亿个,同时它是首款浮点运算能力超过1TeraFLOPS(1000GFLOPS)的GPU芯片。NVIDIA GTX280则使用MIMD流处理器架构,拥有240个SP单元,浮点运算效率出众,分支能力强大。HD 4870和GTX280的并发可执行线程数同样达到了30720条,而CPU在正常情况下可执行线程数是与核心数目相等的,具备超线程技术的四核I7处理器也只能同时运算8条线程。所以在大规模的多线程运算中,GPU可以体现出上百倍于CPU的运算能力。

    凭借强大的可编程流处理器阵容,GPU在单精度浮点运算方面将CPU远远甩在身后。以我们现在最顶级的英特尔Core i7 965处理器来说,在默认情况下,它的浮点计算能力只有NVIDIA GeForce GTX 280 的1/13,与AMD Radeon HD 4870相比差距就更大了。当然这里仅仅是理论峰值,也就是说当GPU的所有流处理器都满载时得到的运算能力。

上一页 1 ...8 9 10 11 12 ...14 下一页
频道热词:华硕主板  Intel  AMD  
视觉焦点
显卡评测热点
排行 文章标题
TOP10周热门显卡排行榜
  • 热门
  • 新品