DirectX 8时代两强争霸、你追我赶
面向图形计算,让GPU逐渐找到了自己的方向,那就是给予用户更真更快地视觉体验,但是GPU架构也遇到一些问题亟待解决。首要问题就是,要实现更加复杂多变的图形效果,不能仅仅依赖三角形生成和固定光影转换,虽然当时游戏画面的提高基本上都是通过大量的多边形、更复杂的贴图来实现的。
但后期的发展中,顶点和像素运算的需求量猛增。每个顶点都包含许多信息,比顶点上的纹理信息,散光和映射光源下表现的颜色,所以在生成多边形的时候带上这些附加运算,就可以带来更多的效果,但这也更加考验顶点和像素计算能力。研究人员发现,同硬件T&L仅仅实现的固定光影转换相比,VS和PS单元的灵活性更大。
2001年从DirectX 8发布开始,Shader Model(渲染单元模式)在DirectX体系中的地位就日趋重要,其版本和渲染单元的规格也成为了决定显卡性能高低的关键因素。第一个实践DirectX 8可编程特性的是NVIDIA Geforce3 Ti图形卡。这片代号NV15的Geforce3 GPU首次在内部加入了Pixel Shader处理器和Vertex Shader处理器。为了保险起见,Geforce3内部还同时保留了T&L硬连线为老游戏提供最佳的执行效率。
Shader概念的提出,意味着程序员可通过它们实现3D场景构建的难度大大降低。通过VS和PS的渲染,可以很容易的宁造出真实的水面动态波纹光影效果。此时DirectX的权威地位终于建成。
Pixel Shader(顶点着色器)和Vertex Shader(像素着色器)硬件逻辑,真正支持像素和顶点的可编程。虽然当时可编程性很弱,硬件限制太多,顶点部分出现可编程性,像素部分可编程性有限。但这的确是硬件T&L之后PC图形技术的又一重大飞跃。3D娱乐的视觉体验也因此向接近真实迈进了一大步,波光粼粼的水面是那个时期用于演示Shader能力的典型DEMO,相比之下DirectX 7绘制的水面效果就单调得多。
Shader单元概念提出之后,无论NVIDIA还是ATI,都在做强显卡前端(Setup Engine及其相关部分,如光栅器Rasterizer、设定Setup和顶点装配器Vertex Assembler)的同时,逐渐将竞争重点放在显卡核心部分——Pixel Shader(顶点着色器)和Vertex Shader(像素着色器),无论是Radeon 8500还是Geforce Ti 4200都内置的规格和频率更强的PS和VS单元。同时显卡的后端ROP(光栅化引擎,负责完成像素的输出)也逐渐强大,各种各样的多重采样AA模式和更高的抗锯齿模式逐步得以实现。
在此基础上,GPU的负担从以前的纹理和像素填充率方面,逐渐开始转向Shader的执行能力。在DirectX 8时代诞生了一系列经典显卡,同时ATI在DirectX 7的不利局面得到逆转。而曾今的3DFX、MATROX、SIS、TRIDENT等厂商,或被收购或再也没有能力登台表演,GPU领域的两强争霸在DirectX 8时代彻底确立。
图注:NVIDIA公司的创始人黄仁勋先生和ATI公司的创始人何国源先生
1963年,黄仁勋出生于中国台北。1983年,黄仁勋大学毕业后毫不犹豫地搬到硅谷,并应聘AMD公司,成为一名芯片设计工程师,两年后跳槽到偏向于图形处理的芯片商LSI Logic。在职期间苦读6年后成为斯坦福电子工程硕士。1993年1月,NVIDIA正式成立,作为创始人之一的他担任NVIDIA首席执行官。
1950年,何国源出生在广东省新会地区。1974年,何国源大学毕业回到香港,在那里找到了他平生第一份正式工作。何国源的第一份工作是在“Control Data”电脑公司做部门主管。1983年,何国源决定去加拿大发展之前,年轻的他在王氏电子公司已经做到了总经理。1985年,何国源和另外两名香港移民Benny Lau(产品开发副总裁)和Lee Lau(策略计划副总裁)共同创建的ATI(Array Technology Inc)。公司在多伦多北部的万锦市宣告成立。
2001年2月,NVIDIA终于发布了具有划时代意义的GeForce 3。Geforce 3采用0.15微米工艺制程,在晶体管数量上多达5700万个,这个数据整整是RIVA 128显卡的8倍,已经超高当时最强的P4处理器4200万个。GeForce 3拥有4个Pixel Shader和1个Vertex Shader(顶点处理单元)。同时,NVIDIA为游戏开发者提供了完整的Geforce架构开发工具,允许游戏开发者编制他们自己的程序来控制像素的效果,给游戏和应用开发者带来了极大的方便。
●GeForce 3 Ti系列产品 技术优势:★★★★ 市场优势:★★★★
微软在2002年对DirectX 8.0进行升级诞生了DirectX 8.1,新标准对VS和PS的渲染加强,增加对大纹理水波纹的处理效果,新的DirectX 8.1使你获得更好的图像显示质量,使多人游戏更具可伸缩性,以及包括更优异的音频效果。ATI则利用这个机会,通过代号R200的Radeon 8500显卡首次超过了NVIDIA的GeForce 3。在当时,做工优秀、画面显示质量出色的Radeon 8500显卡成为业界公认性能最出色的显卡,一举超越了压制NVIDIA的Geforce 3 Ti系列显卡。
●Radeon 8500系列产品 技术优势:★★★★★ 市场优势:★★★★
代号R200的Radeon 8500的基本结构与当时的其他显卡差不多;它拥有四个像素单元,每个像素单元拥有两个纹理单元。它亦支持DirectX 8.1的顶点着色引擎和像素着色引擎,它的两个顶点着色引擎被称为Charisma Engine II,为新的顶点着色程序和旧的DirectX 7硬件T&L都提供出色的效能。Radeon 8500支持像素着色器版本1.4,相对1.x版本的设计,这个修订版本是意义重大的。鉴于PS1.2和1.3只是PS1.1的改进版, 8500拥有第一和唯一的ATI硬件加速细分曲面绘图引擎,名为“Truform”,这个引擎通过十年的艰难发展后,最终成为我们在HD5870显卡中看到的Tessellation引擎。
但是回头看DirectX 8时代的GPU,我们发现无论是NVIDIA还是ATI,都没有推出一款低端产品,而巨大的低端市场正面临产品断档的危险。
2001年,在高端产品Radeon 8500之前,ATI发布了Radeon 7000系列显卡,因为这一系列显卡已经是ATI的第七代产品了。Radeon 7000系列总共有两款芯片,高端的R100(7200)和低端的RV100(7000)都使用了0.18微米工艺制造,拥有三千万晶体管,支持DirectX 7。这种以RV代表低端产品的做法被沿用至今。
图注:深受消费者喜爱的Radeon 7500代表了当时最高的性价比
●Radeon 7500系列产品 技术优势:★★★ 市场优势:★★★★★
Radeon 7500是款特别的显卡,核心代号为RV200,因为它是与ATI下一代的8500(R200)一同发布的,但仅支持DirectX 7。客观的讲,作为DirectX7平台下的Radeon7500带给我们的是与GeForce2 TI同等的性能,而且它还具备其他的特点,比如超高的芯片运行频率及显存带宽、Hydra Vision双头显示、优秀的视频流回放与2D显示画面等,更重要的是它有一个吸引人的价格。
总体来说,Radeon 7500等经典显卡为ATI打下了低端和中端市场,市场份额渐渐接近NVIDIA。Radeon 8500在此时也诞生了大量的衍生物,他们包括9000、9100、9200、9250等等,规格型号甚至令人眼花缭乱。
图注:巩固性能王位的GeForce4 Ti 4600高端显卡
●GeForce4 Ti系列产品 技术优势:★★★★ 市场优势:★★★☆
面对竞争对手ATI的步步紧逼,GeForce4 Ti于2002年2月应运而生。GeForce4 Ti基于改良版本的TSMC 0.15微米工艺,采用了最新nfiniteFX II引擎,Vertex Shader增加至2个。在高工作频率下,使得GeForce4 Ti的处理能力有可能高于GeForce3将近三倍。而在全屏反锯齿方面,GeForce4 Ti采用新的Accuview AA技术,改善了取样方式并且优化了渲染的过程,可以进一步保证在高分辨率下的显示速度。显存带宽也一直是制约显卡性能的瓶颈,GeForce4 Ti为了摆脱瓶颈的限制,引入了LightSpeed Memory Architecture II(LMA II)光速显存构架II技术,它的原理就是优化渲染过程和压缩技术的采用。
GeForce4 Ti的性能领先程度巨大让ATI根本无力翻身,同时它完整支持DirectX 8.1也让NVIDIA在GPU着色器规格上没有任何遗憾。聪明的NVIDIA顺势推出了GeForce4 Ti4600、TI4400、Ti4200以及GeForce4 MX,其中最受用户欢迎的就是GeForce4 Ti4200,这是NVIDIA首次尝试高端产品低成本化(只有频率区分,没有架构改动),结果大获成功,持续热卖至2004年。
图注:在低端显卡市场,GeForce4 MX系列取得了骄人战绩
●GeForce4 MX系列产品 技术优势:★★★ 市场优势:★★★★★
而面向低端用户的GeForce4 MX更是由于对手产品线的空缺,这款显卡采用的核心实际上是GeForce 2 Ti,而显存控制器和抗锯齿功能则属于GeForce 4 Ti系列,虽然只支持DirectX 7,但它迅速取代GeForce 2 MX,创造了当时最好销量,成为最受欢迎的产品。