● RV770的策略与成功
“让NVIDIA取得性能王座,让NVIDIA获得光环效应,我们要做的是设计在\$200-\$300价格段最好的GPU。”这句话出自RV770的首席设计师Carrell Killerbrew之口。在2005年夏,ATI决定瞄准性能级市场,而非狂热级市场来设计GPU。你可以认为性能级市场正是2002年R300竞争的市场。当然你更难以想象ATI在一念之间放弃了顶级GPU产品的设计,转而为用户设计一颗使用体验更好的芯片。
如今Carrell Killerbrew先生在AMD的6屏技术展示台前
AMD在R600丢掉了GPU性能王座,AMD最大的芯片不能和NVIDIA竞争,其后一年,AMD的营收和市场占有率都不断下降。而与此同时,Carrell仍然不停的让AMD内部每个人都信服RV770的设计走了一条正确的道路,他的论调在当时听起来就像是一个疯子说的一样。
事实上AMD在2005年已经感受到了功耗对于整个GPU设计的影响,所以较小的芯片战略已经在公司内部获得认同,整个RV770设计花了大约三年时间。这意味着当我们讨论R600的失败时,那帮工程师正在设计RV770并对此持乐观态度。当然,这很艰难,ATI因为R600完全丢掉了性能王座。Carrell Killerbrew(AIT工程院院士、RV770首席架构师)以及RV770的团队高层和其他人要求整个团队忘记发生在R600上的事情,忘掉ATI丢掉性能王座这个事情,致力于做好RV770这颗关键的GPU芯片。
这对于AMD是一个极度冒险的决定,因为一旦GPU设计定位降低之后,可能生产出性能较差的GPU产品,同时自己在高端市场完全没有控制力,这样的设计有可能重蹈R600失败的覆辙。要知道出于大幅亏损中的AMD,已经无力一次次承受这样的挫折……
RV770首先决定使用新工艺,AMD在RV670上已经试水了这种做法,效果一般。不过这并非策略问题,RV670平庸的销量是因为时间上来不及,继承了R600满身的BUG,RV770可不会如此,它是一个健全人。
放弃最大的芯片并不意味着放弃性能。RV770成功的修复了R600上臭名昭著的ROP bug,现在能获得比较正常的抗锯齿性能了。但仅这样这是不够的,为了取得优势,RV770最初的性能目标是1.5倍于R600。Carrell Killerbrew和他的团队评估后,把这个数字提升到了2.5——你没有看错,Carrell Killerbrew和他的团队要把两颗半R600塞进一颗比R600还要小的芯片里面。
前面我们说过,R600架构虽然效率并非最高,但它的规模是非常容易扩充的。现在,终于到了使用这个技能的时候了。R600和RV670都具备4个渲染核心,总共320个流处理器。而在RV770上,AMD把这两个数字分别扩大到了10和800,整整2.5倍的运算能力提升。扩充后的RV770已经拥有了1TFLOPS以上的运算能力。
RV770运算资源的大幅度扩充带来Shader单元的性能提升,但是让NVIDIA更没有想到的是ATI潜心研究改进了R600以来GPU的后端设计,主要是RBE(Render Back-End)单元,也就是NVIDIA所称的ROP单元。RBE单元主要用来实现多重采样和抗锯齿以提高画质或者降低高画质下GPU的性能衰减。
最初ATI认为先进的R600 Ringbus环形内存控制器总线被舍弃
RV770另一个值得称道的地方在于它彻底摒弃了一直处于争议的R600 Ringbus环形内存控制器总线,使用AMD擅长的Crossbar总线。Ringbus最大的优势在于可以用最少的晶体管来实现最大的带宽,但是Ringbus的代价是极大地整体延迟和粗糙的数据流动管理。业界公认的最快的互联方式只有Crossbar,NVIDIA虽然承受着高集成度带来的苦恼,但一直坚持使用Crossbar。
- 第1页:AMD统一渲染GPU架构 历程回顾与评测
- 第2页:R520和R580对NVIDIA的影响
- 第3页:R600与G80的不均衡对抗
- 第4页:RV670开始改进 绝境求生
- 第5页:GT200体现NVIDIA变化方向
- 第6页:RV770的策略与成功
- 第7页:AMD的赌注与HD4850的改变
- 第8页:RV870的设计思路和诞生背景
- 第9页:RV870芯片概况与策略
- 第10页:Fermi架构的困惑
- 第11页:R600芯片设计之初遇到的问题
- 第12页:RV770和RV870架构追求不断改进
- 第13页:Fermi未来的性能亮点与优势
- 第14页:回顾统一渲染架构,探寻SIMD极限
- 第15页:基本信息分析——Radeon HD2900 XT
- 第16页:基本信息分析——Radeon HD3870
- 第17页:基本信息分析——Radeon HD4890
- 第18页:基本信息分析——Radeon HD5870
- 第19页:性能测试的硬件、软件平台状况
- 第20页:DX9理论性能测试:3DMark 06
- 第21页:DX10理论性能测试:3Dmark Vantage
- 第22页:GPGPU着色器性能-单精度Shader
- 第23页:GPGPU着色器性能-双精度Shader
- 第24页:3Dmark Vantage 贴图填充率测试
- 第25页:3Dmark Vantage 视差闭塞映射
- 第26页:3Dmark Vantage GPU粒子模拟
- 第27页:3Dmark 06 Shader Particles 3.0
- 第28页:Furmark Open GL 性能测试
- 第29页:Lightsmark 光照渲染测试
- 第30页:DirectX 10 SDK Cube Map GS
- 第31页:DirectX 10 SDK N Body Gravity
- 第32页:测试总结与回顾