Radeon HD 2900 XT的更多硬件优势
● 重度强化的几何应用性能AMD称R600的着色器设计很大程度上偏重于3D场景中的几何应用,比如构建非常复杂的模型、物理加速等。在顶点应用片内缓存容量方面是R580 GPU的8倍,能够创建复杂得多的3D模型。同时它还具有全功能的顶点纹理获取指令,和像素着色共享同一纹理单元。
R600的所有流处理单元都能够被分配于进行顶点着色或几何着色,硬件和编译器都没隐性进行像素着色、顶点着色及几何着色硬件使用比例的限制。在需要的情况下,R600顶点处理能力可达到R580的10倍之高。
这些看起来都是统一架构着色器本身所具有的优势,然而R600还沿袭了Xbox 360上就出现了的功能:可编程的Tessellation。
可编程的Tessellation的实现效果
可编程的Tessellation可以比普通Tessellation实现15倍提升的几何数据压缩效率,这种功能可以在预先设定的简单几何建模上于每个小三角形内自动生成海量的新顶点和三角形,直线提升简单建模的视觉细致程度。
可编程的Tessellation是充分利用DirectX 10几何着色器可以在GPU内生成顶点功能实现的,用GPU生成顶点,比DirectX 9时期使用CPU生成在顶点速度快上一个数量级。R600可以承受创建大于5亿个多边形的几何负载,实现接近CG级别的仿真3D角色、极度真实复杂的地形等。
虽然几何着色器作为DirectX 10的基本功能之一可以在任何统一着色器架构的GPU上实现,但R600相对G80的优势在于它在顶点缓存做出优化、应用的真实开发上已经有了Xbox的实例,不难想象移植自Xbox的大量使用可编程Tessellation的最新3D游戏会在R600上运行的更快。
R600使用完全分布式的环形总线(Ring Bus)内存控制器提升可用内存带宽,其物理位宽为512bit,超越NVIDIA Geforce 8800 GTX之前创下的最高点384bit,成为继Matrox Parhelia后全球第2个512bit内存位宽的GPU。
GPU内存控制器的演变
提高内存带宽的手段包括提升内存运行频率或者是增加控制器的内存位宽,除了硬件的直接提升bit宽度外,还可以在内存控制器总线上做文章。ATI从R520 GPU开始引入了环形总线的内存控制器,在中央控制器外设置4个控制器环站共同控制内存存取,环站使用两套对行的256bit环路连接,总线内部带宽可达512bit。
R600的内存控制器工作模式
R600进一步强化了环形总线内存控制器,取消了中央控制器,真正做到了完全分布式设计。它使用4套,2、2对行的512bit环路连接64bit*2的4个内存控制器环站,总线内部带宽为惊人的1Gbit!
事实上环形总线结构并不会像其内部带宽提升那样巨幅提升总体内存带宽,这种分布式设计更多的意义是缓解极度复杂的GPU核心内设定单一内存控制器的硬件压力。在宏观上,4个环站可以看作是Crossbar类内存控制器内部分组的一种外部表象,只是在环站之间引入环形高速连接降低了部分情况下需要向内存回写数据时的延迟,因为内部接口可以直接从环站位通过环性总线向内存写数据,可略过内存控制器的参与。
值得一提的是R600的外部通路PCI Express x16也是直接挂接在环形总线上,可以在系统内存和显卡本地内存之间直接建立高速通信模式。
● 多GPU并行计算:Crossfire
双Radeon HD 2900 XT能实现接近1TFLOPsd的计算能力,这需要使用ATI Crossfire(交叉火力)技术连接,以实现多GPU的并行计算。
R600是AMD-ATI首款内置Crossfire Compositing Engine的旗舰级别GPU,上代旗舰R580+的Crossfire需要外置第三方Compositing Engine,提升成本并增加PCB复杂度。从后来发布的首个80nm工艺GPU RV570开始,Compositing Engine已经被集成进GPU中,并通过PCB间内部连接器连接,有效提升了Crossfire性能、降低了操作复杂度。
Radeon HD 2900 XT Crossfire
根据不同的3D应用程序,Radeon HD 2900 XT Crossfire的双GPU并行计算可以使用隔帧渲染、水平均分渲染同帧或网格混合均分渲染同帧的三种不同方式运作,这些方式的设计思想都是让3D图形负载尽可能的平均分担在2个GPU上,努力实现200%的运行速度。此外,Crossfire还可以实现更高倍数的抗锯齿,极致优化画面质量。
- 第1页:挑战者终于就位 完美10号Radeon HD 2900 XT
- 第2页:历史简溯和Radeon HD 2900 XT规格摘要
- 第3页:Radeon HD 2900 XT的通用着色器深度解析
- 第4页:Radeon HD 2900 XT的3D娱乐质量提升手段
- 第5页:Radeon HD 2900 XT的更多硬件优势
- 第6页:DirectX 10的幻虚化境
- 第7页:Radeon HD 2900 XT的高清视频解码和信号输出
- 第8页:Radeon HD 2900 XT实物大赏
- 第9页:Radeon HD 2900 XT硬件构成剖析
- 第10页:Radeon HD 2900 XT散热器分析
- 第11页:Radeon HD 2900 XT提前捆绑3部未发布游戏
- 第12页:驱动、操作系统选择及测试方向
- 第13页:性能测试部分的硬件、软件系统说明
- 第14页:系统功耗测试和产品重量测试
- 第15页:首个DirectX 10游戏测试:COJ DX10 Benchmark
- 第16页:D3D合成测试软件测试:3DMark05、3DMark 06
- 第17页:D3D即时战略游戏:COH和SupermeCom
- 第18页:D3D第一人称视角射击游戏:Far Cry、F.E.A.R
- 第19页:D3D第一人称视角射击游戏:Rainbow Six Vegas和S.T.A.L.K.E.R.
- 第20页:OpenGL游戏Quake 4及D3D PRG游戏The Elder Scrolls IV Oblivion
- 第21页:高质量游戏测试:抗锯齿和各向异性过滤开启
- 第22页:新抗锯齿模式对比:8xMSAA和16xAA
- 第23页:Radeon HD 2900 XT超频挑战Geforce 8800 Ultra
- 第24页:Radeon HD 2900 XT高清回放测试
- 第25页:399美元的2900XT成为Radeon HD 2000家族先锋
- 第26页:未来愿景:R600的通用计算应用构想
- 第27页:Radeon HD 2000系列预览:比同类产品更强大、更实用
- 第28页:首批上市Radeon HD 2900 XT图赏:两AIB、三通路