● RV870的设计思路和诞生背景
将R600的流处理器数目翻2.5倍,其他单元做进一步优化,AMD造就了成功的RV770,那RV770的规模还能否继续放大?放大后发热和功耗是否能够控制?是冒险尝试新工艺还是使用稳定的55nm工艺制造……在RV770诞生之后,图形业界对于AMD的下一款产品充满了期待。NVIDIA也计划在G92的基础上再度推出GT2X0等中低端芯片规格以抢占市场,当然AMD没有忘记,单卡单芯性能最强的仍然是GTX285,而并非自己的产品。
在这种紧要关头,AMD下一代旗舰——RV870的规格备受瞩目,它肩上的责任也异常重大,首先AMD寄希望于这款核心能够完全扭转高端市场的战局,击败后的GTX280;同时AMD希望能够通过RV870核心衍生出纷繁复杂的产品线,这样就能进一步加大市场占有率。
当然我们所期待的RV870,并不是此时开始设计,按照GPU的设计周期和最后的资料推断,2006年AMD在内部已经开始了对RV870芯片的讨论,它起初被命名为“Evergreen”。
在2007年秋天,对“Evergreen”将来具体会什么样,ATI已经有了粗略的轮廓。ATI对DirectX 11和微软在Win7方面的计划已经有相当了解,虽然不知道GPU具体什么时间发布,但他们知道应该什么时间准备好。这将是又一轮的市场增长点,必须根据这个增长点调整产品发布策略。“Evergreen”必须在2009年第3季度前准备好。
2007年8月至11月期间,AMD遭遇到市场方面的巨大压力,R600几乎失败,RV770的小芯片战略更得不到公司上下的支持,但Carrell Killerbrew还是非常自信地劝说所有开发团队的成员,让他们相信未来能够成功。果然RV770获得了市场的好评,但是AMD后来对RV870芯片已经产生了分歧。Rick Bergman(AMD绘图部门总经理)认为AMD这次应该出其不意地将RV870设计为大芯片,起码在芯片面积方面和NVIDIA的GT200b相当,但是Carrell Killerbrew还是坚持小芯片战略。
对于RV870的芯片面积,AMD举棋不定
在ATI公司里,有一份称之为《产品必备特性》的文件,简称为PRS。这起初是一个大文本文件,后用Word写成。这是一份AMD内部的绝密文档,它对芯片设计的优先级做出严格规定,高优先级的特性绝不能取消,低优先级的特性则可以忽略。但是关于RV870设计方向的最后讨论结果,AMD内部竟然没有达成一致,也就是说PRS文档上迟迟没有限定芯片面积。
2008年2月,台积电开始对AMD发出种种暗示:关于40nm制程的成本,AMD不要过于兴奋。AMD先前可能还有点乐观情绪,但从台积电返回的工程师说,RV870的制造成本将会非常昂贵,并建议重新考虑芯片架构。
在包括Carrell在内的众多员工经历了诸多艰辛工作和牺牲后,ATI将边长为22mm的RV870削减成大约18mm×18mm的芯片。其中被牺牲的包括负责芯片间通讯的“Sideport”模块和其他一些特性。
此时台积电的工艺已经越来越完备,AMD也把RV870的芯片规模进一步缩小,已经掌握了市场主动权和研发节奏的AMD首先在2009年初使用一款规模较小的RV740核心试水40nm工艺。作为AMD的首款40nm工艺图形核心,RV740将配备640个流处理器、32个纹理单元、16个光栅处理单元,位宽128-bit,标配512MB GDDR5显存,频率800MHz(等效3200MHz),可以弥补显存减半造成的带宽损失,同时浮点计算能力大约900GFlops。
这次工艺试水获得了成功,不但为RV870使用40nm工艺铺平了道路,RV740这颗投石问路的芯片也成为“100美元内速度最快的芯片”。
- 第1页:AMD统一渲染GPU架构 历程回顾与评测
- 第2页:R520和R580对NVIDIA的影响
- 第3页:R600与G80的不均衡对抗
- 第4页:RV670开始改进 绝境求生
- 第5页:GT200体现NVIDIA变化方向
- 第6页:RV770的策略与成功
- 第7页:AMD的赌注与HD4850的改变
- 第8页:RV870的设计思路和诞生背景
- 第9页:RV870芯片概况与策略
- 第10页:Fermi架构的困惑
- 第11页:R600芯片设计之初遇到的问题
- 第12页:RV770和RV870架构追求不断改进
- 第13页:Fermi未来的性能亮点与优势
- 第14页:回顾统一渲染架构,探寻SIMD极限
- 第15页:基本信息分析——Radeon HD2900 XT
- 第16页:基本信息分析——Radeon HD3870
- 第17页:基本信息分析——Radeon HD4890
- 第18页:基本信息分析——Radeon HD5870
- 第19页:性能测试的硬件、软件平台状况
- 第20页:DX9理论性能测试:3DMark 06
- 第21页:DX10理论性能测试:3Dmark Vantage
- 第22页:GPGPU着色器性能-单精度Shader
- 第23页:GPGPU着色器性能-双精度Shader
- 第24页:3Dmark Vantage 贴图填充率测试
- 第25页:3Dmark Vantage 视差闭塞映射
- 第26页:3Dmark Vantage GPU粒子模拟
- 第27页:3Dmark 06 Shader Particles 3.0
- 第28页:Furmark Open GL 性能测试
- 第29页:Lightsmark 光照渲染测试
- 第30页:DirectX 10 SDK Cube Map GS
- 第31页:DirectX 10 SDK N Body Gravity
- 第32页:测试总结与回顾