● 全文总结与未来架构展望
作为本世纪初计算机行业的最大变革,GPU所能处理的任务已经远超图形界限。通过全文分析,相信用户已经了解到了AMD在并行计算技术方面的发展历程和现状,无论是通过Stream技术将GPU用于高性能并行计算领域,还是通过计算机内的CPU-GPU异构模式来完成更多任务,AMD都在努力为用户提供更全面效率更高的解决方案。
关于未来硬件和应用环境的适用方面,Intel是从CPU往中间走,NVIDIA是从GPU往中间走,AMD则是直接空降到了中间。Intel的CPU产品所代表的是极强的逻辑控制包括分支循环等能力和单线程处理能力,ATI和NVIDIA的GPU产品代表的是极强的数据吞吐和并行任务能力。在这两者中间,是目前高性能计算和未来的图形计算所需求的应用,也是AMD想通过CPU-GPU异构计算和Fusion所达到的目标——更为强大的分支仲裁能力和更高的并行度。让我们共同期待在CPU和GPU技术领域长期蛰伏的AMD能借助融合之势回到巅峰状态。
CPU和GPU都在演变过程中
回到我们现在所处的编程环境来考虑,Fusion所提出的融合概念是一条非常好的解决途径。从绝对性能角度来考虑,AMD目前没有最好的CPU,ATI又没有最好的GPU,但是它可能将来会有最好的运算解决方案。而在Intel这边Larrabee还没有放弃,反而加速了。尤其是看到了Fermi之后,Intel更加确信自己的路并没有错。
但是目前的CPU加GPU分离式异构结构并不是万灵药,它需要更复杂的节点设置和控制,还有存储以及更加特异的任务拆解方式。而融合刚好可以很大幅度的消减异构带来的影响,融合不光是成本,还有整个系统的复杂度都可以得到有效降低。当然确实想要真正融合的话,必须要有对应的指令集。
从经济学角度讲,AMD这种直接放流处理器单元进入CPU逻辑的方法相对于开发新的指令集来的更快。AMD所提出的融合的确是个很好的方向,它能够绕开控制型结构,直接给核心提供现成的运算单元。使用这种简易直接的融合方式可以在高性能计算和并行计算领域为AMD赢得一块领地,而长远考虑仍然需要优秀的指令集和更为深层次的融合方式。
融合与异构或许都能够受惠于Intel提出的全新AVX指令集。这种指令集可大大提高浮点、媒体和处理器密集型程序的性能,重点在于AVX从当前的128bit向量指令增加到256bit的向量指令。作为Sandybridge架构中的一个重要属性,AVX指令集可以大幅提升处理器的浮点运算功能,或许也能成为不同硬件逻辑融合的接口。
今后一段时间内,CPU+GPU的异构计算结构将引领处理器的发展方向,这也成为下一代超级计算的发展方向,而融合还需要不断改进和成熟。目前设计GPU+CPU架构平台的指导思想是:让CPU的更多资源用于缓存,GPU的更多资源用于数据计算。把两者放在一起,不但可以减小在传输带宽上的花销,还可以让CPU和GPU这两个PC中运算速度最快的部件互为辅助。
在文章末尾特别感谢艾维硕科技媒体公关经理,朱亮先生。从我策划这篇文章开始,他就为本文提供了重要的参考资料支持,文中有很多准确辅助内容的配图正是来自这些资料。
本文参考与引用文献:
[1] 《定分止争-细研GPU架构流程工作原理》
[2] 《高性能运算之CUDA》 第一章 GPU通用计算
[3] 《高性能并行计算》 并行计算机发展历程
[4] 《Introduction to Parallel Computing》What is Parallel Computing
[5] 《Introduction to Parallel Computing》Flynn's Classical Taxonomy
[6] 《流处理器缘何差6倍 A/N GPU架构解析》
[7] 《ATI Radeon™ HD 5800 Series Graphics》
[8] 《图形硬件与GPU体系结构》
[9] 《DirectX支配游戏 历代GPU架构全解析》
[10] 《GPUs - Graphics Processing Units》Introduction
[11]《ATI Xenos: XBOX360 GPU》
[12]《GPU精粹2》 第29章 高性能计算的关键
[13]《GPU精粹2》 第32章 了解浮点
[14]《GPU精粹2》 第31章 把计算概念映射到GPU
[15]《ATI Stream Computing User Guide》
[16]《AMD Fusion™ Family of APUs: Enabling a Superior Immersive PC Experience》
[17]《基于图形处理器(GPU)的通用计算》
[18]《GPU Computing: Past, Present and Future with ATI Stream Technology》
[19]《Havok FX Next Gen Physics on ATI GPUs》
[20]《通用计算核动力:OpenCL技术解析》
[21]《GPU精粹3》 第31章 使用CUDA进行快速N-body仿真
[22]《GPU精粹3》 第35章 使用GPU进行病毒特征的快速匹配
[23]《GPU精粹3》 第37章 使用CUDA进行高效的随机数生成及应用
濮元恺所写过的技术分析类文章索引(持续更新) | |
7、 显卡只能玩游戏? 10年GPU通用计算回顾 | |
2、改变翻天覆地 最全Fermi架构解读 | |
3、从裸奔到全身武装 CPU功能集成之路探秘 | |
4、AMD统一渲染架构 历程回顾与评测 | |
6、别浪费你的电脑 分布式计算在中国 | 12、Computex独家泄密 解析AMD下代GPU |
- 相关阅读:
- ·AMD下一代高端GPU终极曝光:和三星共享
//vga.zol.com.cn/559/5591184.html - ·科幻?科技?VR和AR技术的不同与发展
//vga.zol.com.cn/559/5591187.html - ·王者再创新 七彩虹iGame980Ti九段评测
//vga.zol.com.cn/558/5589497.html - ·超迷你的GTX960 索泰EN970定制960评测
//vga.zol.com.cn/558/5586664.html - ·蓝宝石推AMD R9显卡:DX12有主机体验
//vga.zol.com.cn/558/5587433.html
- 第1页:全文导读与内容简介
- 第2页:前言:通过GPU见证行业变革
- 第3页:第一章:GPU工作原理与并行计算
- 第4页:21世纪视觉需求与GPU变化
- 第5页:从山峰渲染了解GPU图形流水线
- 第6页:CPU与GPU的设计方向决定运算能力
- 第7页:GPU并行编程为何加速发展
- 第8页:GPU并行计算已成未来趋势
- 第9页:初识高性能并行计算
- 第10页:高性能并行计算发展历程
- 第11页:高性能并行计算单元分类
- 第12页:初识基于GPU系统的云计算
- 第13页:第二章:GPU结构与ATI产品发展
- 第14页:统一着色器架构释放GPU运算能力
- 第15页:传统GPU发展与着色器管线
- 第16页:传统SIMD结构流处理器指令细节
- 第17页:MIMD结构流处理器指令细节
- 第18页:R600时代对SIMD架构补充与优化
- 第19页:两种结构流处理器优劣对比
- 第20页:R300以来的芯片架构及其影响
- 第21页:ATI第一代统一渲染架构Xenos
- 第22页:统一渲染GPU R600临危受命
- 第23页:AMD对GPU架构的不断改进和优化
- 第24页:未来ATI图形芯片架构预测
- 第25页:第三章:GPU通用计算发展与细节
- 第26页:多核并行计算困惑与发展
- 第27页:基于AMD CPU+GPU异构计算平台
- 第28页:着色器模型变化历程与总结
- 第29页:Shader计算能力快速发展
- 第30页:揭秘GPU高性能计算关键
- 第31页:CPU与GPU的区别和发展方向
- 第32页:如何将GPU功能单元映射为通用单元
- 第33页:分支对GPU结构体系的挑战
- 第34页:GPU与CPU将如何演绎融合与吞并
- 第35页:第四章:GPU内部计算实现细节
- 第36页:GPU主要计算单元分布和职能
- 第37页:GPU内部通用计算代码运算过程
- 第38页:认识GPU浮点计算精度
- 第39页:整数运算能力与未来融合架构
- 第40页:GPU存储体系特点与变化
- 第41页:ATI GPU吞吐特性对比与分析
- 第42页:ATI GPU OPEN CL综合性能分析
- 第43页:先进混合架构之Larrabee展望
- 第44页:概念型融合架构之Fusion APU展望
- 第45页:GPU进化架构之Fermi分析
- 第46页:第五章:ATI GPU通用计算实例
- 第47页:ATI Stream技术发展与现状
- 第48页:OPEN CL接口技术与异构运算
- 第49页:Havok引擎与CPU+GPU异构运算
- 第50页:BOINC平台充沛的ATI GPU加速项目
- 第51页:最具影响力的Folding@home项目
- 第52页:GPU架构对于其他实例的适应性
- 第53页:全文总结与未来架构展望