Cayman核心三大升级 铸就DX11高性能
通过前文的介绍,我们已经稍微聊了一些Radeon HD 6900核心Cayman的变化,下面就让我们更进一步了解为何会有这些变化,同时这些变化又会带来何种功效。
● VLIW5到VLIW4的转变
NVIDIA采用的1D+MIMD的设计和AMD采用的(4D+1D)搭配SIMD的设计,可以说二者各有优势平分秋色。不过AMD选择的4D+1D的设计必须要面临一个问题,那就是在非对称环境下编译4个简单流处理器器和1个复杂流处理器的完美搭配,这对驱动的仲裁机制算法及效率十分依赖。
同时,工程师通过实践了解到,在用户的实际应用中3-4个流处理器处于忙时工作状态较为普遍,而。那么如让每组以4个流处理器为单位,这样设计不仅降低了ALU/BW比值,还符合了绝大多数用户使用习惯。
全新的VLIW4架构
在全新的VLIW4里,4个流处理器地位相同,不再区分简单、复杂运算能力,降低里显卡对驱动仲裁的过分依赖,从而变相提升核心计算效能,如果将这样的改良转化为核心单位面积性能的话,没平方毫米约有10%的性能提升。
Cayman核心的的渲染器后端计算也得以改善。每个组件表面16bit整数和每组件32bit浮点操作前提下,整数运算颗提升2倍、浮点运算颗提供2-4倍,总体性能客观。当然事实上,AMD工程师已经在驱动程序当中优化表面操作的地方,就是这种优化极大帮助提升性能的案例。
● 两组双向DMA引擎 激增内存带宽利用率
当GPU再进一步的计算方面,老核心架构虽然能够做到同一周期运行多个流处理器计算,但是无奈老架构设计中只有一条命令通道,从而造成整体计算瓶颈。所以在Cayman核心中,AMD引入了异步调度的概念,从而最终实现命令队列根据优先级最终计算。
在数据吞吐能力上,AMD工程师在原有核心架构上增加了2个DMA,更有效率的利用带宽资源。相同物理带宽模式下,加入两个双向DMA引擎后,带宽利用率翻倍。
● 双图形引擎 提供更强视觉计算
双图形引擎设计,不言而喻Tessellation单元将会由此设计倍增,从而更好的适应目前DirectX 11应用。当然加倍的不仅仅是Tessellation单元,在顶点、几何等计算中也会相对老核心架构有双倍提升。
- 第1页:HD6900高调发布 挤压对手高端
- 第2页:全新架构设计 AMD迎来Cayman核心
- 第3页:追忆HD5800 回忆HD6800 分析HD6900
- 第4页:Cayman三大升级 铸就DX11高性能
- 第5页:HD6900双胞胎亮相 外观设计全解析
- 第6页:大家来找茬 新老两代顶级对抗
- 第7页:HD6900全系拆解 顶级用料搭配奢华
- 第8页:HD6900新宽域技搭配双BIOS设计
- 第9页:显卡功耗金钟罩 PowerTune技术介绍
- 第10页:新AA模式 HD6000秀最佳反锯齿效果
- 第11页:全新界面设计 Catalyst 10.12驱动预览
- 第12页:首批送测样卡-讯景Radeon HD 6900
- 第13页:首批送测样卡-镭风Radeon HD 6900
- 第14页:首批送测样卡-迪兰Radeon HD 6900
- 第15页:首批样卡-蓝宝石Radeon HD 6970
- 第16页:同期发布品牌-其他品牌产品展示
- 第17页:测试平台及测试项目简介
- 第18页:理论性能测试-3DMark Vantage
- 第19页:理论性能测试-3DMark 11
- 第20页:DX9.0c游戏-使命召唤之黑色行动
- 第21页:DX9.0c游戏-星际争霸2
- 第22页:DX10游戏-英雄连之前线
- 第23页:DX10游戏-孤岛危机
- 第24页:DX11游戏-战地之叛逆连队2
- 第25页:DX11游戏-科林麦克雷之尘埃2
- 第26页:DX11游戏-失落星球2
- 第27页:DX11游戏-地铁2033
- 第28页:DX11游戏-潜行者之晴空
- 第29页:Tessellation测试-天堂2.1
- 第30页:应用性测试-超频及交火性能测试
- 第31页:应用性测试-产品实际功耗考验
- 第32页:应用性测试-产品温度检验
- 第33页:应用性测试-Tessellation性能衰减
- 第34页:应用性测试-EQAA及MLAA性能测试
- 第35页:应用性测试-PowerTune功能测试
- 第36页:HD6900掠地成功 继续保持DX11辉煌