升级DX11体验HDAO高画质特效
● 什么是HDAO?和SSAO有何关系?
在HDAO和SSAO中,"AO"为Amblent Occlusionde的缩写,中文译为环境光遮蔽。在DirectX 10.1 API推出后,Amblent Occlusionde升级为SSAO;而在微软推出DirectX 11 API后,SSAO升级至HDAO。
其实现有采用统一架构的图形核心都能实现环境光遮蔽效果,仅是SSAO在DirectX 10.1引入后,得到了更优的代码/函数能够更有效的实现环境光遮蔽效果,例如支持DirectX 10.1的图形核心和仅支持DirectX 10的图形核心在处理同一画面,前者较后者有10%以上的效能提升。而DirectX 11引入的HDAO,相较SSAO和AO又有了效能提升。了解了AO、SSAO、HDAO之间的关系后,让我们看一下实际有效效果。
1:1细节对比(每组对比 左侧为AO开启 右侧为AO关闭)
首先,也许很多网友对比完图片后感觉并没有明显区别,笔者需要提醒大家本页图片最好点击放大后对比;其次,也许很多网友点击放大后确实发现了区别,不过还会有很多反对的声音,例如“升级显卡为了这么一点提升不值”,但是笔者需要说的是每一代产品、每一代API的升级画质都是一个循序渐进的过程,这种积少成多的画质量变才能引起画质的质变。
DX11什么功能带来更细腻画质?
每一代DirectX API的升级或者游戏引擎的升级都会带来游戏画质提升,而其中DirectX API的升级会具有更广的应用性。而在DirectX 11 API上除了前文介绍的HDAO技术外,我们还应该了解另外两个技术,它们分别是Tessellation和Order-Independent Transparency,中文字面意译就是镶嵌细面曲分技术和顺序无关半透明技术。
那么二者又有何作用呢?
● Tessellation镶嵌细面曲分技术
我们知道,3D渲染简单来说就是一个建立三角形的过程,三角形越多越小渲染出来的结果就会越细致,人眼识别起来就更真实。不过在现有人力和硬件资源上,并不能为了获得更细致的画面而过分损耗编程人员和硬件资源,所以一种能够自动处理并且相对以前硬件架构有质的改变才能有效实现更高画质的梦想。
Tessellation就这样应运而生,首先图形核心架构从原来像素、顶点等Shader转变为统一架构的流处理器,这样就能够最大化应用图形核心的并行计算能力优势;而Tessellation能够在编程人员仅勾勒出简单轮廓后,自动镶嵌细化三角形模型。上图就能让我们最直观的感受Tessellation的优势。
下面我们就以目前仅有的DirectX 11 API测试软件《Heaven Benchmark》截图为例,视觉区别一下启用Tessellation的画质提升。
《Heaven Benchimark》开启Tessellation
《Heaven Benchimark》关闭Tessellation
上面两副图中,也许缩略图不能一下分别出差距,笔者建议点击放大后观察较为容易。其实如果仔细看,龙的身体和房屋的瓦片开启Tessellation前后差距最为明显。
《Heaven Benchimark》开启Tessellation
《Heaven Benchimark》关闭Tessellation
上面两副图的效果差异非常明显,石路和石桥上的石块凹凸感明显是在开启Tessellation后更具立体感。
DirectX 11提供的Tessellator单元本身不具备可编程性,因此DirectX11向Tessellator单元输入或者从中输出的过程是通过两个传统的管线阶段完成的:Hull Shader (HS,外壳着色器)和Domain Shader (DS,域着色器)。Hull Shader负责接收琐碎的图形数据和资料,而control points将会基于如何配置Tessellator来产生数据。可以说,Tessellator就是一个固定功能模块,用来处理一些基于一定参数的输入数据。最后Domain Shader将会接收由Tessellator产生出的点,并依照终点控制(control points)置换贴图将这些点形成一个合适的几何图形。
GF100拥有更多的PolyMorph(多形体引擎),是以SM(流处理器)为单位分配的,拥有多达16组。多形体引擎则要负责顶点拾取(Vertex Fetch)、细分曲面(Tessellation)、视口转换(Viewport Transform)、属性设定(Attribute Setup)、流输出(Stream Output)等五个方面的处理工作。
DirectX 11中最大的变化之一细分曲面单元(Tessellator)就在这里,因此GF100的理论Tessellation性能将会远超HD 5870(核心代号Cypress),因为Cypress只有一个Tessellator单元。这些硬件上的设计,让GF100在进行Tessellation操作时,性能下降很少。
总体来看,Fermi的多形体引擎相对于以前绝非几何单元改头换面、增强速度而已,它融合了之前的固定功能硬件单元,使之成为一个有机整体。虽然每一个多形体引擎都是简单的顺序设计,但16个作为一体就能像CPU那样进行乱序执行(OoO)了,也就是趋向于并行处理。NVIDIA还特地为这些多形体引擎设置了一个专用通信通道,让它们在任务处理中维持整体性。
当然这种变化复杂得要命,也消耗了NVIDIA工程师无数的精力、资源和时间。有一种传言说,多形体引擎是GF100核心变化的重要组成部分,也是GF100无法在去年及时发布的最主要原因。这么做也是不得已而为之。考虑到细分曲面单元的几何复杂性,固定功能流水线已经不适用,整个流水线都需要重新平衡。通过多形体引擎的并行设计,几何硬件不再受任何固定单元流水线的局限,可以根据芯片尺寸弹性伸缩。
注:(本章节作者由林光楠和濮元恺合作完成)
- 第1页:NVIDIA首款DX11显卡 GTX480诞生
- 第2页:最强DX11单卡诞生 米人装机要费米
- 第3页:公版GTX480金属质感 全新散热设计
- 第4页:暴力拆解GTX480 展示最真实的它
- 第5页:独立核心散热器 镇压32亿晶体管
- 第6页:6+2相供电 协助GTX480全速运转
- 第7页:亲民型高端作品 GTX470全面解析览
- 第8页:4+1相经济实惠供电组合 助力GTX470
- 第9页:揭开GTX470神秘面纱 探秘物理设计
- 第10页:麻雀小五脏全 GTX470同样5热管
- 第11页:看N卡和A卡高端 了解10.5和9.5故事
- 第12页:GTX480/GTX470身份亮相 蓄势待发
- 第13页:Fermi架构GF100核心 新增强劲神器引擎
- 第14页:可读写缓存引入GPU 计算能力倍增
- 第15页:Fermi架构针对GPU通用计算优化
- 第16页:升级DX11体验HDAO高画质特效
- 第17页:强大性能实现更高反锯齿/阴影效
- 第18页:浮点能力翻4倍 GF100不再仅是显卡
- 第19页:性能测试的硬件、软件平台状况
- 第20页:理论性能测试-3Dmark 06
- 第21页:理论性能测试-3Dmark Vantage
- 第22页:DX9.0c游戏-使命召唤之现代战争2
- 第23页:DX9.0c游戏-求生之路
- 第24页:DX10游戏-英雄连之前线
- 第25页:DX10游戏-孤岛危机
- 第26页:DX10.1游戏-孤岛惊魂2
- 第27页:DX10.1游戏-汤姆克兰西之鹰击长空
- 第28页:DX11游戏-异形大战铁血战士
- 第29页:DX11游戏-战地之叛逆连队2
- 第30页:DX11游戏-科林麦克雷之尘埃2
- 第31页:DX11测试-Heaven Benchmark 1.0
- 第32页:DX11测试-Heaven Benchmark 2.0
- 第33页:DX11游戏-地铁2033
- 第34页:DX11游戏-潜行者之普里皮亚召唤
- 第35页:PhysX游戏-蝙蝠侠之阿卡姆疯人院
- 第36页:PhysX游戏-黑暗虚空
- 第37页:应用测试-系统功耗检测
- 第38页:Tesslation测试-Stone Giant
- 第39页:Tesslation测试-Heaven Benchmark 1.0
- 第40页:视频解析-Tessellation和PhysX
- 第41页:GPU通用计算-Folding@Home
- 第42页:应用测试-产品温度检测
- 第43页:专项PK—GTX480 SLI对决GTX480
- 第44页:专项PK—GTX470 SLI对决GTX470
- 第45页:专项PK—GTX480 SLI对决HD5970
- 第46页:专项PK—GTX480对决GTX470
- 第47页:专项PK—GTX480对决GTX285
- 第48页:专项PK—GTX480对决HD5870
- 第49页:专项PK—GTX470对决HD5850
- 第50页:ZOL独家活动 百片GTX480等你领取