热点推荐
ZOL首页 > 显卡 > 新闻 > DX11 大战不再是独角戏

DX11 大战不再是独角戏


CBSi中国·ZOL 2010年05月19日 00:50 评论

    自从 AMD 与 2009 年 9 月上市 RADEON HD 5870、RADEON HD 5850 开始,我们正式进入 DirectX 11 世代,到如今市场上已经有上至 RADEON HD 5970 下至 RADEON HD 5450 的完整 DX11 产品可供大家选择,而它们的出品商则是曾经在 DX10 时代处于落后状态的 AMD。

    反观NVIDIA,这次 Fermi 之所以晚于微软 DirectX 11 的发布,原因有两点:芯片异常复杂以及重新设计的图形架构。

    从GPU诞生那一刻开始,DX7-DX8-DX9-DX9C-DX10,每逢微软更新重大版本API之时,NVIDIA和ATI双方的GPU架构都会有大幅度的改进,甚至是经过全新的设计,无一例外。

    下面我们来看看每逢DirectX版本有重大更新时,NVIDIA与ATI是如何博弈的,克敌制胜的关键到底是什么?

DirectX黄金时代:DirectX 7.0

    当时间进入到1999年时,此时的中国迎来了电脑发展的黄金时期,网络也从这一年逐步普及开来。而微软推出的DirectX在历经多年发展已经不在是DirectX 1.0那个不成功的版本,此时DirectX进入了堪称辉煌的DirectX 7.0时代。


DX11 大战不再是独角戏

    DirectX 7.0最大的特色就是支持T&L,中文名称是“坐标转换和光源”。3D游戏中的任何一个物体都有一个坐标,当此物体运动时,它的坐标发生变化,这指的就是坐标转换;3D游戏中除了场景+物体还需要灯光,没有灯光就没有3D物体的表现,无论是实时3D游戏还是3D影像渲染,加上灯光的3D渲染是最消耗资源的。虽然OpenGL中已有相关技术,但此前从未在民用级硬件中出现。

DX11 大战不再是独角戏

    在T&L问世之前,位置转换和灯光都需要CPU来计算,CPU速度越快,游戏表现越流畅。使用了T&L功能后,这两种效果的计算用显示卡的GPU来计算,这样就可以把CPU从繁忙的劳动中解脱出来。换句话说,拥有T&L显示卡,使用DirectX 7.0,即使没有高速的CPU,同样能流畅的跑3D游戏。

  DirectX 7的发布无疑给了GLIDE的致命的一击,DirectX 7提供的特效更丰,D3D函数库的引入方便了开发人员的使用,迅速得到游戏厂商的青睐。为了挽回局面,3DFX甚至还开放GLIDE源代码,但最终GLIDE还是被广大开发人员所离弃。没有了GLIDE的3DFX最终也以被自己的老对手NVIDIA收购而告终。

千禧年首次引入像素渲染的DirectX 8.0

    2000年9月,微软正式推出了划时代的DirectX 8 ,DirectX 8.0又一次引领了一场显卡革命,它首次引入了“像素渲染”概念,同时具备顶点渲染引擎Vertex Shader与顶点渲染引擎Pixel Shader,反映在特效上就是动态光影效果。通过Vertex Shader和Pixel Shader的渲染,可以很容易的营造出真实的水面动态波纹光影效果,从而令3D游戏画面质量得到史无前例的提高。

DX11 大战不再是独角戏

    然而DirectX 8.0的普及之路并不顺畅,这与巨大的成本压力有着很大关系。nVIDIA的Geforce3 Ti系列迟迟未能在主流市场普及,而后续升级到DirectX 8.1的Geforce4 Ti4200以及Radeon 8500系列也在成本上差强人意。从2001年年初发布DirectX 8.0开始,这项技术直到2003年年末才得到普及。

    2001年底,Microsoft推出了DirectX8.1,主要的改进是增加了PixelShader 1.2/1.3/1.4。在此之前,Microsoft差不多每年推出一个DirectX新版本,到DX8以后,这个速度开始减缓,以后的DirectX9也是如此,主要的原因是自 DirectX 7以后,每一个版本(major release)实际对应于一代新的显示核心,硬件的更新周期要长于软件,所以作为图形API的DirectX要照顾到软件更新的速度。另外,游戏开发的复杂程度也越来越高,开发周期也越来越长,而游戏开发人员并不希望在开发过程中更新API。

经典时代的DirectX9.0-9.0C

    2002年底,微软发布DirectX9.0。DirectX 9中PS单元的渲染精度已达到浮点精度,传统的硬件T&L单元也被取消。全新的VertexShader(顶点着色引擎)编程将比以前复杂得多,新的VertexShader标准增加了流程控制,更多的常量,每个程序的着色指令增加到了1024条。

DX11 大战不再是独角戏

    DirectX 9.0c和Shader Model 3.0标准的推出,可以说是DirectX发展历程中的重要转折点。在DirectX 9.0c中,Shader Model 3.0除了取消指令数限制和加入位移贴图等新特性之外,更多的特性都是在解决游戏的执行效率和品质上下功夫,Shader Model 3.0诞生之后,人们对待游戏的态度也开始从过去单纯地追求速度,转变到游戏画质和运行速度两者兼顾。因此Shader Model 3.0对游戏产业的影响可谓深远。

DirectX 10.0:统一渲染架构和几何着色

DX11 大战不再是独角戏

    DX10又是一次大革命,除了将ShaderModel从3.0升级至4.0版本外,还有两项非常重要技术:

第一:引入统一渲染架构,从此不再区分像素与顶点着色单元,而是由流处理器单元按照负载动态的执行包括像素和顶点在内的各种着色指令:

DX11 大战不再是独角戏

第二,引入全新的几何着色单元,它第一次允许由GPU来动态的生成和销毁几何图元数据,使GPU可以在不用CPU干涉的条件下进行反复运算,许多以前无法实时使用的算法现在都可以在GPU中使用了。

DX11 大战不再是独角戏

    此外,DX10还引入了两种新的HDR格式,避免了HDR和AA不兼容的情况出现,并提升了HDR效率;DX10还大大改进了纹理贴图的精度和效率;其它大大小小的改进有数十项之多,这里就不多做介绍了。

    统一渲染架构的引入要求NVIDIA和ATI双方必须放弃以往的模式,重新设计全新的GPU架构,G80和R600之争拉开了帷幕……

很有可能成为经典的DirectX11

    DX9C和DX10听起来非常完美,但也有明显的缺点,就是系统资源开销很大,运算效率比较低,所以DX11的重点就落在了改进渲染效能方面。DX11除了将ShaderModel从4.0升级至5.0外,还有两项最重要的改进就是Tessellation和DirectCompute,其中DirectCompute的指令集主要来源于ShaderModel 5.0。

DX11 大战不再是独角戏

    Tessellation被译为曲面细分,就是一种能让GPU在模型内部自动插入新的顶点,从而让几何图形变得无比复杂细腻的技术,它可以在很少的性能损失下换取明显的画质提升。DX11游戏在画面上的改进主要来自于曲面细分技术,而且曲面细分还能带来很多意想不到的特效!

DX11 大战不再是独角戏

    为了配合Tessellation技术,微软还专门设计了两种全新的Shader着色器,Hull和Domain,以便更精确的控制镶嵌位置,并置换位移贴图。这就与DX9/DX10时代的Tessellation有着本质区别,无法照抄照搬。

    DirectCompute则是微软的GPU计算API,可以让GPU处理一些非图形类指令,获得远超CPU的性能。不过目前DirectCompute主要还是用在图形渲染后处理器方面,可以产生非常逼真的景深、透明效果。

首款DX11显卡——HD5800

    早在2009年9月份就已经亮相的Radeon HD 5870当中,就包含了ATI的首款DX11显示核心——Cypress(RV870,官方正式代号为Cypress)。Cypress核心可以看到两组SIMD阵列呈对称型排列,其中每组阵列当中均有800个流处理单元设计。在单一SIMD引擎当中,ATI采用的排列方式依然是RV770的设计方式。也就是说,每个SIMD阵列当中包含10组SIMD阵列,而每个SIMD阵列当中又包含16个流处理器,每个流处理器包含5个流处理单元,因此总计1600个流处理单元。两者通过相同的高速数据总线与L2 Cache相连,同时也连通到Global Data Share上进行数据共享。 ATI为了抢先发布DX11显卡,只是在上代产品的技术上添加了DX11指令集而已,并没有针对DX11新的渲染流程和关键技术做优化。如此一来HD5000在DX9C/DX10游戏中的表现依然出色,但在DX11游戏中就出现了瓶颈,DX11特性使用越多,其性能就越差。

DX11 大战不再是独角戏

    从上面的架构图可以看出,Cypress更像是两个RV770核心的合体,而对于DX11技术的升级,主要集中在Graphics Engine当中。这样的设计方式,无疑更加简单,对于ATI的研发周期来说也会大幅缩短,这也是为何ATI的DX11产品会如此之早就能发布的一个重要原因。

完全针对DX11而设计的显卡——GTX480

    HD5800这一领先,又是半年,这次NVIDIA的阵脚并没有像NV30那样被打乱,而是按部就班的按照既定的设计目标推出全新架构的一代产品,而不是像ATI那样在上代产品基础上改改就发布新品,因为DX11是全新的API,必须为DX11新的特性做相应的优化,才能获得最出色的DX11效能。

DX11 大战不再是独角戏

    GF100核心是既G80和R600之后,近4年来GPU架构改进最大的一次。GF100核心主要划分为Host Interface(主接口,负责PCI-E通讯传输,包括读取CPU指令等)、GigaThread Engine(主线程调度引擎)、4组Graphics Processing Clusters(后文简称GPC,图形处理集群,GPU的核心部分)、6组Memory Controller(显存控制器,每组显存控制器位宽为64bit,总位宽384bit)、L2 Cache(二级缓存,容量为768KB)、6组ROP单元(每组包含8个ROP,共48个)。

    通过以上分析可以看出,由于HD5800的架构与HD4800完全相同,只是流处理器规模翻倍而已,因此它确实拥有出色的DX10/10.1性能,但DX11的性能却很一般。因为DX11是一款全新的API,并不是针对DX10的小修小补,很多特性不是兼容SM5.0指令集就能做得到的。

    ATI虽然通过抢先发布DX11显卡赚得了满堂彩,但却没能经得住时间的考验,未能重现DX9时代R300的辉煌。因为时代变了,当年的R300是全新的架构,完美支持DX9,而NV30架构存在很多缺陷。而现在正好相反,Cypress完全是新瓶装旧酒,而GF100则是真正的DX11架构,这在所有DX11测试中都得到了证实。

HD5000只是过渡产品,ATI真DX11显卡尚未露面

    或许我们现在下结论还为时过早,但ATI的做法已经证明了DX11确实需要一套全新的GPU架构,HD5000只不过是临时性架构,ATI下一代的DX11核心尚未真正露面。

    想要在DX11性能方面取得突破,就必须将现有的架构推倒重新来过,NV30的混合型架构一败涂地就是很好的例子。HD5000确实拥有不俗的DX10性能,但现在越来越多的用户需要真正的DX11显卡,因为DX11是大势所趋,其普及速度之快超越了以往任何一代API。

    目前来看,真正为DX11设计的GPU只有GF100这一颗,GTX480/470定位较高难入平常百姓家。不过其后续产品也非常值得期待,我们知道GF100强悍的动力源自于内部的光栅化引擎和多形体引擎,即便将GF100的规格削减为1/2甚至1/4,它依然拥有不俗的几何性能和Tessellation性能,而且功耗将会控制的更好,非常值得中端主流用户期待。

给文章打分 5分为满分(共0人参与) 查看排行>>
频道热词:华硕主板  Intel  AMD  
视觉焦点
显卡新闻热点
排行 文章标题
TOP10周热门显卡排行榜
  • 热门
  • 新品