首 页 新闻 | 行情 | 评测 | 调研 | 数码 | DIY | 学院 | 专题 | 报价 | 论坛 | 二手 | 下载 | 博客 | 商城 | Vista | 网址 | 分类
显卡新闻 | 显卡行情 | 显卡导购 | 显卡评测 | 驱动下载 | 选卡中心 | 显卡论坛 | 品牌专区
显卡二手 | HDTV资讯 | 经销商大全 | 促销热点 | 工具下载 | 最新文章 | 显卡排行
 导航:ZOL首页 > 显卡频道 > 评测 > ATI显卡 近日更新 

Radeon 9700全面测试:理论技术篇

中关村在线 【原创】 作者:中关村在线 清水反应 2002年09月10日 14:32


·Radeon 9700 VPU详解

Radeon 9700 VPU的核心研发代号为R300,它应该是正式上市的最复杂的图形处理器了,由大约1亿700万个晶体管组成,将会完全支持DirectX 9.0,具有同目前市面上的图形处理器完全不同的特性。首先让我们来把其主要技术特点同市场的高端产品做对比:


无论是AGP传输带宽、显存带宽,还是像素处理管线、材质处理能力都有了大幅度的提高,这样的提高使得我们对于这款VPU充满了期待,它真的能因此带来2倍以上的性能提高吗?



RADEON9700结构图

下面我们将会对于Radeon 9700的各项改进进行较为详细的论述:

支持AGP 8X,ATi宣称RADEON 9700是第一颗完全支持AGP 8X规格的图型处理器(显然它认为目前市面上的其它宣称支持AGP 8x接口规范的),显卡所需要的所有数据都需要通过AGP 8x总线来传输。AGP 8x总线的带宽可以达到2.0 GB/s,相对于AGP 4x的带宽有了1倍的提高:


AGP总线发展

传输带宽带宽增加仅仅是AGP 8x的重要的改进之一,它的工作电压也从现在的1.5v降低到了0.8v,部分引脚的定义也有修改。

显存接口,RADEON 9700采用了全新的高效256bit DDR内存控制接口,它能够提供每秒超过20GB的图形内存频宽。这套控制接口包含了4个独立的64位内存控制器,每个控制器可以独立的将数据写入内存或是从图形处理器中读回所需要的数据。精密的逻辑序列发生器能确保所有的通道都能达到最高的利用率。


图2: RADEON9700内存接口

RADEON 9700的显存控制器也可以支持下一代DDRII的内存技术。不过,采用这种技术的产品要到明年年初才能发布,届时显卡的性能将会有再次的飞跃。

顶点处理引擎(Vertex Processing Engine),一个3D的场景是由许多三角形的组合构成的肉眼可见的物体表面。而组成这些物体表面的三角形的定位、绘制、模拟、上色、打光等处理过程都是由vertex shaders程序来控制的,图形处理芯片中的顶点处理引擎则是负责执行的核心。

RADEON 9700的顶点处理引擎中整合了四条同步Vertex Shaders管线,两两成对,每一对共同配合形成了一个高效的三角形设定引擎(triangle setup engine)。RADEON 9700是第一款可以在单一时钟中处理一个顶点和一个三角形的图形处理器,它也是第一颗完全支持Vertex Shaders 2.0的图形处理器。


RADEON9700顶点处理引擎结构示意图

在RADEON 9700中的每一个Vertex Shaders管线都可以同时控制向量(Vector)与数量(Scalar)的运算。向量的运算是应用在多重元素的组合,像是3D的坐标组合 (X,Y还有Z)以及色彩组合(红、绿以及蓝)。数量运算则是针对单一元素不同值的运算成果。


RADEON9700可编程Vertex Shader管线细节

延续Radeon 8500的技术体系,RADEON 9700的顶点处理引擎中包含了对于TRUFORM 2.0的支持,它运用了一种叫做“tessellation”(棋盘型嵌石饰) 的运算技术来增加多边形的计算,进而把3D物体的曲面、对象以及地形加以平滑处理--是较之前的高维曲面更先进的技术。这种技术的使用,使得现有的程序不必做任何修改就可以得到更加逼真的效果。

TRUFORM 2.0支持连续性tessellation,这再次得益于其浮点处理能力。而且可以根据对象在3D场景中的位置和距离观察者远近来调整对象的tessellation等级,使得邻近对象的表面生成更多的多边形,表达更多的细节。

TRUFORM 2.0还支持移位绘图(displacement mapping)功能,这项技术能够在3D对象与表面的外形的上方提供更多控制。它的工作原理是从一个特殊种类贴图的取样值来进行顶点位置的修改,我们称这个技术为移位绘图(displacement mapping)功能。它的视觉效果类似凹凸映射 (bump mapping),但是它比凹凸映射来的更逼真、更细致。如下图所示:


常规N-Patch过程,控制点由数学计算生成


Displacement Mapped N-Patch过程,控制点由Displacement map生成


3D渲染引擎(3D Rendering Engine),当一个3D场景由三角形构建好之后,紧紧接着的就是进行光照处理,然后就是给像素进行着色处理。每一个像素的色彩都是由分配给三角形所适用的材质贴图、光线状态以及材质属性来决定。这个过程是图形处理器中的渲染引擎调用Pixel Shaders处理单元来控制的。

Radeon 9700具有8条128bit渲染管线,每一条都具有独立的贴图单元和Pixel Shader处理单元,可以在一个流程中处理16个贴图,这些贴图可以是双线过滤、三线过滤或者各向异性过滤应用。


Radeon 9700渲染引擎架构图

需要再次强调的是Radeon 9700中的Pixel Shader引擎是利用浮点(96bit)运算控制的,这相对于早期的整数运算大幅度的提高了处理的范围和精度。其Pixel Shader处理单元可以同时处理三个指令:一个材质查询、一个材质地址处理和一个色彩处理,在3D图像处理中这种混合运算是非常需要的,这种能力可以进一步提高Radeon 9700的效能。


RADEON9700 3D渲染引擎细节

前面介绍的Vertex Shader和Pixel Shader的组合基本就是Radeon 9700的SMARTSHADER 2.0,如果在加上对于OpenGL的支持,这个概念就比较完整了。

HYPER Z III,包括了Hierarchical Z、Z Compression和Fast Z Clear三个组建,它们的主要作用都是进一步提高显存带宽的利用效率。所谓的3D场景处理平面坐标之外,还有一个景深的概念,在3D场景中的物体距离观察点的距离是不同的,这些数据都储存在被称之为Z缓冲的缓存中,图像处理器通过比较这些数据就可以知道哪个对象在前哪个对象在后了。


HYPER Z III – Hierarchical Z

结合上图我们来了解一下HyperZ(Hierarchical Z)的工作原理,其中红色区域代表被检测的对象。首先,它被划分到若干区块中,如果发现这个区块不能被看到那么这部分数据将会被清除,如果区块中有可见的部分,比如绿色的部分,它们就会被分为更小的区块来进行处理,直至所有的隐藏像素都被去除。


HYPERZ III – Z压缩(Z Compression)

Z 压缩(Z Compression)通过一定的算法在保证损失尽可能少的情况下压缩数据并送往Z缓冲器。HYPERZ III中的最小压缩比为2:1,最大可以达到4:1。在全屏抗锯齿模式下,它的压缩率甚至可以达到24:1,这样将会大大降低Z数据对于内存带宽的占用。


HYPERZ III – 快速Z清除

快速Z清除(Fast Z Clear)可以迅速的清除前一帧图像留在Z缓冲器中的数据,这个处理过程在高分辨率的模式下尤其重要。比如,在1600x1200的分辨率下,必须写入大约总数为7.7MB数据才能够清除Z缓冲器中所有数据。HYPERZ III只需要64分之1的数据量就可以清除Z缓冲器,这样带来的效能是显而易见的。

视频处理引擎(Video Processing Engine),ATi在数字视频处理方面的优势是业界所公认的,在RADEON 9700中整合了VIDEOSHADER技术,从名字上可以看出它利用了可编程Pixel Shader处理单元来增强实时的视频捕捉与播放。



RADEON 9700 视频处理引擎

利用VideoShader,Radeon 9700可以实现流媒体的de-blocking处理、影像捕捉时所产生噪声过滤、3D动画中Photoshop式的过滤功能,从而提供更锐利、更清楚的视频播放。这一点是Radeon 9700相当有创意的地方,它把3D渲染和视频功能结合在了一起。这里特别需要强调的是其VideoShader在对流媒体进行de-blocking处理的功能,在ATi显卡的驱动光盘中有一个特别版本的RealplayerONE播放器,可以显示更加出色的RM的视频。我们对此做了简单的测试:


长度为28秒的广告片,采样率为150kbps,realplayer plus 8.0播放效果


长度为28秒的广告片,采样率为150kbps,特别版本realplayerONE播放效果

这两张图片都是利用数码相机从显示屏上拍摄下来的,我个人是感觉不出来什么差别。

显示接口(Display Interface),在这个方面RADEON 9700也做了明显的改进,比如开始支持10bpc色彩精度,这样可以还原10亿中不同的色彩,使得输出结果的色彩更加真实。在RADEON 9700内部整合了两个显示控制器,它们可以同时驱动两个显示不同图像、具有不同分辨率和刷新率的显示器:

  • 2个400Mhz DAC

  • 1个165Mhz的TMDS传送器

  • 电视输出的分辨率可以到达1024x768

     



RADEON9700显示接口

小结

ATi把RADEON 9700称之为视觉处理器(Visual Processing Unit),并没有继续沿用nVIDIA最早使用的GPU,也是希望自己的产品同其区分开来,并且具有更强的吸引力。从上面的介绍来看,Radeon 9700的确具有了很多新东西,特别是具有浮点运算的处理能力和完全可编程的架构,使得它成为一颗现阶段用户可以买到的最强大的图形处理器。在明天的文章中我们将会对于ATi Radeon 9700显卡进行详尽的介绍,敬请关注。

硬件精选
我要评评 买笔记本,台式机 拨打800-858-2399,为您量身打造!
相关经销商 免费注册 我要在此被推荐 
电话:010-82667853
电话:010-82667853
电话:010-51285313
电话:010-82852468
电话:82537391
电话:58958972
 显卡 热门品牌专区

盈通 华硕 升技
讯景 技嘉 艾尔莎
迪兰恒进 影驰 微星
Dell Flash movie