Cayman核心三大升级 铸就DX11高性能
通过前文的介绍,我们已经稍微聊了一些Radeon HD 6900核心Cayman的变化,下面就让我们更进一步了解为何会有这些变化,同时这些变化又会带来何种功效。
● VLIW5到VLIW4的转变
NVIDIA采用的1D+MIMD的设计和AMD采用的(4D+1D)搭配SIMD的设计,可以说二者各有优势平分秋色。不过AMD选择的4D+1D的设计必须要面临一个问题,那就是在非对称环境下编译4个简单流处理器器和1个复杂流处理器的完美搭配,这对驱动的仲裁机制算法及效率十分依赖。
同时,工程师通过实践了解到,在用户的实际应用中3-4个流处理器处于忙时工作状态较为普遍,而。那么如让每组以4个流处理器为单位,这样设计不仅降低了ALU/BW比值,还符合了绝大多数用户使用习惯。
全新的VLIW4架构
在全新的VLIW4里,4个流处理器地位相同,不再区分简单、复杂运算能力,降低里显卡对驱动仲裁的过分依赖,从而变相提升核心计算效能,如果将这样的改良转化为核心单位面积性能的话,没平方毫米约有10%的性能提升。
Cayman核心的的渲染器后端计算也得以改善。每个组件表面16bit整数和每组件32bit浮点操作前提下,整数运算颗提升2倍、浮点运算颗提供2-4倍,总体性能客观。当然事实上,AMD工程师已经在驱动程序当中优化表面操作的地方,就是这种优化极大帮助提升性能的案例。
● 两组双向DMA引擎 激增内存带宽利用率
当GPU再进一步的计算方面,老核心架构虽然能够做到同一周期运行多个流处理器计算,但是无奈老架构设计中只有一条命令通道,从而造成整体计算瓶颈。所以在Cayman核心中,AMD引入了异步调度的概念,从而最终实现命令队列根据优先级最终计算。
在数据吞吐能力上,AMD工程师在原有核心架构上增加了2个DMA,更有效率的利用带宽资源。相同物理带宽模式下,加入两个双向DMA引擎后,带宽利用率翻倍。
● 双图形引擎 提供更强视觉计算
双图形引擎设计,不言而喻Tessellation单元将会由此设计倍增,从而更好的适应目前DirectX 11应用。当然加倍的不仅仅是Tessellation单元,在顶点、几何等计算中也会相对老核心架构有双倍提升。
本章节源自《AMD发布杀手锏 榜眼级HD6970全国首测》第四页
- 第1页:新卡皇降临 HD6990定价5000元上市
- 第2页:双剑合璧 HD6990标配最新Cayman核心
- 第3页:Cayman核心三大升级 铸就DX11高性能
- 第4页:成熟的PCB设计 双核助力HD6990
- 第5页:AMD打造首款功耗支持450瓦怪兽
- 第6页:强力HD6990必须面对的散热难题
- 第7页:Eyefinity宽域再升级 组建多屏更随意
- 第8页:双BIOS设计 官方提供高性能超频版
- 第9页:显卡功耗也超频 PowerTune技术介绍
- 第10页:新模式 HD6000提供最佳反锯齿效果
- 第11页:国内AIB主力展示Radeon HD 6990成品
- 第12页:HD6990测试平台及项目简介
- 第13页:DX10理论性能测试-3DMark Vantage