热点推荐
ZOL首页 > 显卡 > 评测 > 横向评测 > 镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试


CNET中国·ZOL 作者:中关村在线 王胤韬 责任编辑:王胤韬 【原创】 2007年05月15日 06:00 评论
本文导航
回到顶部阅读

挑战者终于就位 完美10号Radeon HD 2900 XT

挑战者终于就位 完美10号Radeon HD 2900 XT

  ● 迟到良久 ATI Radeon别来无恙?

   本来应该在一个季度之前就拼杀得血肉横飞的新一轮3D娱乐显卡大战因为AMD-ATI产品的缺席而变得索然无味,NVIDIA不得不在零DirectX 10应用的旧战场上唱独角戏。直到今天,这样的局面终于发生改变,Radeon HD 2000系列已经正式发布,AMD以ATI Radeon HD 2900 XT作为Radeon HD 2000系列的先锋出现在擂台的另一角,千呼万唤始出来的挑战者是更完美的角色么?


镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2000 — A Perfect 10!

   正如这幅Ruby的宣传画所示,Radeon HD 2000系列标榜完美的DirectX 10应用性能,这是Geforce 8800上市时无法真正利用的角度:去年末甚至连供DirectX 10演示DEMO的操作系统都没有。而姗姗来迟的Radeon HD 2900 XT却可以从容的携上市在即的大量DirectX 10游戏,和有针对性的架构优势来体现自己的“完美”。

  ● 田忌赛马玩法?Radeon HD 2900 XT错位对阵

  出于一些原因,AMD在这最新一代的Radeon产品上使用了让人意外的策略:Radeon HD 2900 XT,这款ATI Radeon首代DirectX 10中目前的最高规格产品,并不是和NVIDIA争夺绝对性能No,1的角色,它的市场价格399美金(含3款完整版3D游戏)仅和NVIDIA Geforce 8800 GTS 640MB相当,低于499美元的Geforce 8800 GTX更远低于829美元的Geforce 8800 Ultra

镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT

  考虑到Radeon HD 2900 XT已经是使用全功能R600 GPU的显卡,而Geforce 8800 GTS的则配置着色器规模简化后的G80,这种做法让人不由想起田忌赛马的“上马对中马”战术。不管究竟AMD没有第一时间拿出R600的极限版本出于怎样的初衷,Radeon HD 2900 XT的现实使命都非常明确:在这个价格上实现比竞争对手更强大的性能。

  Introducing Immersive DirectX10 Gaming at a Great Price”  这是Radeon HD 2900 XT的官方宣传主题。用户对后来者的性能期许无疑高于对先进者的要求,AMD又特别的在高端产品线上引入性价比概念,是对Radeon HD 2900 XT的胸有成竹、剑走偏锋?还是对迟到半年的无奈?笔者将通过本文为您揭晓。

  ● 全文检索

  本文将依以下次序逐步推进,希望能覆盖到读者关于Radeon HD 2900 XT的绝大部分疑问,读者亦可点击问题链接跳转到自己感兴趣的部分。

Radeon HD 2900 XT 深 度 测 试 全 文 检 索

全文铺垫 以GF8800 GTS为对手的全面测试
前言
历史简溯和R600/G80规格摘要
功耗测试和“重量”测试
DirectX 10测试Call of Juarez
DirectX  9合成测试3DMark
DirectX  9游戏测试COH和SupermeCom
DirectX  9游戏测试Far Cry和F.E.A.R
DirectX  9游戏测试Vegas和S.T.A.L.K.E.R.
DirectX  9游戏测试Oblivion
OpenGL游戏Quake 4
4MSAA+16AF测试
8MSAA和16CFAA测试
超频测试挑战Geforce 8800 Ultra
高清视频解码测试VC-1和H.264
 
R600核心技术解析
通用标量着色器
纹理和抗锯齿
几何能力、内存控制器和交火

高清解码和HDMI
DirectX 10游戏展示
Ruby Whiteout
The Black BOX
Call of Juarez
Radeon HD 2900 XT展示 结论和展望
显卡外部状况功用
显卡硬件构成分析
显卡散热器拆解分析
最超值的高端产品 但仍需更强
R600的通用计算应用初探
Radeon HD 2000系列预览
测试前准备 产品展示
驱动程序和测试方向
测试平台明细
2家AIB和3家通路商的第一波产品图秀


  全球数十家专业媒体共庆AMD HD X2900 XT盛大发布!

Anandtech:<Calling a Spade a Spade>
 Beyond3D:<AMD R600 Architecture and GPU Analysis>
 Bjorn3D:<Jetway HD2900XT>
 clubic:<AMD Radeon HD 2900 XT : DirectX 10 par ATI !>
 ComputerBase:<ATi Radeon HD 2900 XT>
 DriverHeaven:<ASUS & Sapphire Radeon HD 2900 XT>
 EliteBastadr:<AMD Radeon HD 2000 series technology preview>
 ExtremeTech:<Finally: ATI's Radeon HD 2900 XT Arrives>
 FiringSquad:<AMD-ATI Radeon HD 2900 XT Performance Preview>
 FX57:<ATi Radeon HD 2900XT Test Sonuçları - Etap 1>
 gurn3D:<ATI Radeon HD 2900 XT 512MB review>
 HardwareSecrets:<ATI Radeon HD 2900 XT Review>
 HardOCP:<ATI Radeon HD 2900 XT>
 HEXUS:<AMD (HIS) Radeon HD 2900 XT>
 Inquirer:<AMD's R600 has something of the flawed diamond about it>
 IT-Revirw:<HD2900XT vs 8800>
 OCworkbench:<ASUS EAH2900XT 512M ATi Radeon HD 2900XT Review>
 phoronix:<AMD Radeon HD 2900XT Preview>
 Presence-PC:<AMD Radeon HD 2900 XT : la carte DirectX10 ultime ?>
 t-break:<Radeon HD2900 XT>
 techPowerUP:<ATI Radeon HD 2900 XT>
 TechReport:<AMD's Radeon HD 2900 XT graphics processor>
 TweakTown:<AMD's long awaited R600 DX10 GPU arrives>
 Tom's Hardware:<R600: Finally DX10 Hardware from ATI>
 VR-Zone:<ATi Radeon 2000 Series Launch: X2900XT Review>

  对Radeon HD 2900 XT兴趣浓厚的朋友不妨通过以上其它媒体测试中验证我们的测试成绩,全面掌握这款产品的相关信息。

回到顶部阅读

历史简溯和Radeon HD 2900 XT规格摘要

历史简溯和Radeon HD 2900 XT规格摘要

  ● R300到R600!型号翻番背后

  回顾历史是面对全新产品时自然涌现的情绪,R600比较4年半之前的划时代显示芯片R300具有许多相当有趣的数字巧合。以Radeon HD2900 XT和Radeon 9700相比,核心代号翻番、本地内存容量翻番、内存位宽翻番;但同时核心晶体管数目飙升6倍!同比向量着色器数提升10倍!着色器理论计算能力提升超过20倍!3D图形技术无疑是PC硬件领域进步最快的部分。


镭获新生 HD2900XT对GF8800深度测试
Radeon 9700

  ATINVIDIA对抗的大多数时期都扮演着追逐者的角色,唯有Radeon 9700这一代例外的获得领先,务实且先进的核心技术构架和在3D API换代期准确的设计方向把握是R300成功的两大因素,而这次R600也适逢3D API的再一次换代,机会就摆在眼前,Radeon HD 2900 XT能重塑辉煌么?

镭获新生 HD2900XT对GF8800深度测试
Radeon系列GPU计算能力历史

镭获新生 HD2900XT对GF8800深度测试
Radeon系列GPU 内存配置历史

  Radeon品牌在2000年到现在已经发展了6代产品,产品风格一直是趋向于在生存期内3D加速性能最大化,性价比最优,罕有太过追逐前卫技术的先例,Radeon HD 2900 XT也承袭这样的设计思路,AMD-ATI研发团队的设计目标就是把R600打造成能和DirectX 10完美配合的GPU。

镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT

  ● Radeon HD 2900 XT是统一渲染架构产品

  Radeon HD 2900 XT相对于Radeon X1900系列以及更早Radeon产品的最大变革是它使用了统一架构的着色器设计,这种变革的意义可以和显示芯片实现3D加速功能、实现硬件光影变换、显示芯片中引入可编程的处理单元——着色器这样的事件比肩,通用着色器架构也是DirectX 10对图形硬件最核心最基本的要求。

镭获新生 HD2900XT对GF8800深度测试
统一架构的着色器设计

  在传统的GPU管线模型里,数据流的开始是各种不同从CPU至GPU的属性、指针、命令和纹理。然后主要的处理阶段遵循相当线性方式,包括顶点着色、像素着色、栅格化, 一直到完成处理的像素输入到缓冲区。在统一的管线/着色器架构里,GPU把顺序流方式改成了循环执行。信号被输入到统一着色器核心处理后输出至寄存器,然后再被重复输入至着色器核心进行下一步处理。

  再一步深入图形程序,通常来说都是像素着色应用多于顶点着色应用,这是早先着色器分离架构中像素着色器多于顶点着色器的原因,也是ATI Radeon X1900系列强化像素着色器数量打造出DirectX 9末代性能传奇3:1架构的现实背景。不过这只是总体上的统计情况,而在具体3D应用程序中,某个时段还是有所不同。因此,统一着色器架构的GPU的动态着色器处理能力将比传统的着色器分离架构更有效率,并且理论上消除着色器比例配比产生的瓶颈

镭获新生 HD2900XT对GF8800深度测试
统一渲染架构是这一代GPU的最大进步

  以这样一幅图来说明问题。在着色器总数一致的分离架构和统一架构的对比中,分离架构为顶点着色+像素着色的配置,而统一架构是所有着色器动态配置执行着色任务。两种着色器架构分别执行极端3D顶点处理和极端像素填充的两种应用中差异立显。分离架构在两种极端应用中分别遭遇了顶点着色和像素着色的瓶颈,而统一架构则能够最大限度的发挥所有着色器的能力,以相同着色器数量规模实现更高的性能。

  笔者还是以一个涵盖Radeon上代产品、Geforce同代产品和Radeon HD 2900 XT对比的表格来直观的说明问题。

AMD / NVIDIA 高 端 3D 加 速 卡 规 格 对 比
显卡型号 Radeon X1950 XTX Radeon HD2900 XT Geforce 8800 GTS Geforce 8800 GTX Geforce 8800 Ultra
核心代号 R580+ R600 G80 - 100 G80 - 300 G80 - 450
制造工艺 90nm 80nm 90nm 90nm 90nm
核心晶体管数目 3.84亿 7亿 6.81亿 6.81亿 6.81亿
DirectX 版本支持 DirectX 9 DirectX 10 DirectX 10 DirectX 10 DirectX 10
着色器数量 8VS+48PS 320SP 96SP 128SP 128SP
着色器组织形式 8*(4D+1D)
48*4D
64*(1D*5) 96*1D 128*1D 128*1D
着色器计算能力 301.6
GFLOPS
473.6
GFLOPS
230.4
GFLOPS
345.6
GFLOPS
384
GFLOPS
光栅处理器数量 24 16 20 24 24
抗锯齿模式支持 6xMSAA 8xMSAA
24xCFAA
8xMSAA
16xCSAA
8xMSAA
16xCSAA
8xMSAA
16xCSAA
核心频率 650MHz 740MHz 513MHz 575MHz 615MHz
着色器频率 650MHz 740MHz 1200MHz 1350MHz 1500MHz
内存频率 2000MHz 1650MHz 1584MHz 1800MHz 2160MHz
内存位宽 256bit 512bit 320bit 384bit 384bit
内存带宽 64GB/s 106GB/s 63.4GB/s 86.4GB/s 103.7GB/s
内存类型 GDDR4 GDDR3 GDDR3 GDDR3 GDDR3
内存容量 512MB 512MB 320MB
640MB
768MB 768MB
视频加速相关 Avivo Avivo PureVideo HD PureVideo HD PureVideo HD
产品价格定位 399美元 399美元 299美元
399美元
499美元 829美元

  Radeon HD2900 XT的能量惊人,着色器理论计算能力高达473.6GFLOPs,甚至高于NVIDIA的829美元旗舰Geforce 8800 Ultra,内存带宽更是达到了106GB/s,同样是当今显卡No.1。

  这些数字部分决定了产品的3D加速能力,但GPU内部设计的详细信息还需近一进行阐述和讨论,我们接下来会深入到R600的着色器、纹理单元、内存控制器的各个方面技术实现细节,并尝试用基本构架分析R600的真实性能。

回到顶部阅读

Radeon HD 2900 XT的通用着色器深度解析

Radeon HD 2900 XT的通用着色器深度解析

  ● 以量取胜 R600含320个通用着色器单元

  正如上页表格中所示,Radeon HD 2900 XT使用的R600 GPU内置惊人数量的通用标量着色器,共计达320个!在数量上远远超过G80的128个。但由于这些着色器组织形式、调度及运行频率等规格在两款顶级GPU上存在很大差异,我们并不能仅从着色器个数来判断GPU整体性能优劣。


镭获新生 HD2900XT对GF8800深度测试
R600 体系架构图

  全规格R600的体系结构示意图如上,核心机构着色器设计上相对R580变化巨大,但在外围基本逻辑和内存控制器方面则是在R580的基础上小幅改进。按照指令程序走向的顺序,基本上可分为Setup引擎、流处理单元阵、纹理单元、后端渲染(ROP)4个模块。ATI特色的流控制单元、前期Z轴处理单元、后期Z/Stencil压缩单元均被予以保留。

镭获新生 HD2900XT对GF8800深度测试
G80 体系架构图

  R600和G80的核心架构设计思路差异明显,R600虽然也将流处理单元分组,但并没有给每个这样的小组配置纹理单元及缓存,而是在整个流处理器阵外设计了纹理单元+缓存模块。而对整体性能影响更大的是,R600的标量流处理器运行模式以及它们和线程管理机构、编译器的互动和G80都是完全不同的,下一小节笔者会详细阐述这个部分。

  ● 标量还是矢量?R600着色器谜团

  R600虽然宏观上是320个流处理单元的超标量体系,但在微观实现上,却差别于G80的彻底标量化结构,反而具有浓厚传统4D向量着色器特征。

  历史上的高性能GPU一直都使用向量着色器,因为在3D图形处理过程中产生的数据大多数都是向量,正如包括R-G-B-A的像素着色信息和X-Y-Z-W的顶点空间信息。对这样的数据进行操作的话,单指令流多数据流架构(SIMD :single instruction/multiple data)的4D向量着色器结构是最为快捷的解决方案。

镭获新生 HD2900XT对GF8800深度测试
R600流处理单元组的标量化实现

  然而这种看起来高速的体系存在灵活性不足和硬件利用率不高的问题,在海量的图形着色处理数据中,并不是每一个片断都是对4D向量结构中的所有数据均进行计算的,更为复杂多样性编程现实让数据流中出现了大量不足4D的操作,甚至是许许多多1D标量操作,死板的4D向量结构在最糟情况—处理1D标量数据时每周期硬件利用率只有25%,大量的硬件资源被浪费。之前出现过的一种改进是让向量模式GPU都支持双指令发射,如R580的定点着色器使用“4D+1D”模式,允许同时发射一个4段向量指令和一个标量指令。

  R600的流处理单元被每5个分成一组,事实上形成一种4D+1D模式的5D向量着色器,不过这种着色器和传统向量着色器不同的是,它能够理论上实现每周器发射最多5个标量指令,形成逻辑上的1D*5着色执行模式,当然它也可以进行2D+2D+1D这样的多标量+向量指令的混合发射。不过和G80每个流处理器都是完整的拥有自己执行资源的ALU不同的是,R600的每5个流处理单元才能行使完整的ALU功能,向外部申请执行资源。R600和G80的着色器整体运行模式还在线程调度、管理模式上存在巨大差异。

镭获新生 HD2900XT对GF8800深度测试
R600的流处理单元组  

  R600的流处理单元组单时钟周期最大5个标量MAD(乘加)指令,5个流处理单元当中有1个功能更强的流处理单元负责处理超越指令(SIN, COS, LOG, EXP, 等等),并且可以处理32-bit 浮点精度,支持整数和逐位操作等。分支执行单元负责进行流控制和条件运算。而空闲的流处理单元负责这项任务,这样完全除去流控制性能上的开销,通用目的寄存器存储输入数据、暂时数值和输出数据。

  ● R600着色器指令并行实现

  R600超标量执行性能优劣的体现,很大程度由调度多样化的1D~4D各类指令以塞满5D向量流处理单元组的中间机构决定,它负责提高R600的着色器并行处理能力。

镭获新生 HD2900XT对GF8800深度测试
R600超级线程分支处理逻辑

  从AMD官方给出的架构图来看,明示出的超级线程分支处理逻辑(Ultra-Threaded Dispatch Porcessor)本身是R580上这个部分的加强版本,它负责调度不同类型的着色器命令,仲裁并排序,然后把数据输入进320个流处理单元阵进行处理,而它并不能把着色器数据本身进行分解组合,也就是说在硬件上R600并不能把各种向量指令分解成若干1D标量指令,它现程分支处理逻辑只能进行保持数据原结构基础上的调度。这和G80的GigaThread逻辑完全把向量指令分解成1D标量指令在进行超大规模的标量化线程调度,直接输出给流处理器的运行模式完全不同。

  那么R600的320流处理单元阵超标量执行是如何实现的呢?AMD的解决方式是依靠硬件软件之间的中间件、编译器来完成向量、标量指令的组合。也就是说编译器负责在编译具体3D应用程序中的着色器代码时,将不同段数的向量指令、标量指令进行组合,统一封装成5D总段数的片段再输入给线程分支处理逻辑,实现指令的并行化处理,充分利用大量可自由培植的5D向量着色器,这一过程时间上是在超级线程分支处理逻辑之前阶段进行。  

  ● 并行性级别差异 殊途同归提高GPU计算能力

  这样一来事情就变得清晰了,R600的着色器设计思路是把大量晶体管用在堆积海量流处理单元上,而向量、标量指令的并行推动力则交由编译器实现,提高并行处理的方式是对原始指令进行组合,封装成流处理器组适应的形式。

  对应的G80则走的更彻底些,GigaThread硬件逻辑一视同仁的把任何指令拆成1D标量指令,在强大的硬件线程调度能力和高容量缓存资源的支撑下去管理128个1D标量着色器执行这些指令。考虑到片内缓存的高实现成本,G80在GigaThread上耗费了大量晶体管,标量着色器绝对数目处于劣势,转而使用着色器频率异步来提高计算能力。

镭获新生 HD2900XT对GF8800深度测试
R600 vs G80

  很难直接定义出R600和G80这两种不同设计思路在产品应用性能上的优劣,宏观上的判断可以简单归纳为R600的理论绝对着色器性能更高,对传统应用中的4D向量数据偏重环境表现会更好,但对编译器(体现在驱动上)的依赖程度高。G80则能够在所有应用中保持稳定的均一性能,更高的着色器资源利用率,但不更改硬件前提下的可提升空间有限。

回到顶部阅读

Radeon HD 2900 XT的3D娱乐质量提升手段

Radeon HD 2900 XT的3D娱乐质量提升手段

  ● 8倍MSAA 和未知上限的CFAA

   抗锯齿(AA:Antialiasing)仍然是提升3D游戏画面质量的最有效手段之一,R600像历代旗舰GPU一样在抗锯齿性能及功能上有所突破。

   R600支持最高8倍的标准MSAA(Multisampling Antialiasing),和NVIDIA G80能力持平,高于R580的最高6倍。同时R600还能支持NarrowTent过滤模式下的最高12倍CFAA(Customfilter Antialiasing),换用WideTent过滤模式则更高达16倍CFAA。


镭获新生 HD2900XT对GF8800深度测试
R600的MSAA

镭获新生 HD2900XT对GF8800深度测试
R600的CFAA

镭获新生 HD2900XT对GF8800深度测试
R600的增强型CFAA

  CFAA是通过不同过滤方式在可编程取样范围实现的一种灵活的抗锯齿模式,它的核心部分基于主流应用的MSAA,但在扩展取样范围后可以实现更高级别的AA品质,不同的过滤模式也在ATI Catalyst驱动中被不断的扩展出来。

  和MSAA在单个像素范围内取样取均值确定像素输出值相比,NarrowTent过滤可以扩展到周围4个相邻像素范围取样,WideTent过滤更可扩展到周围8个相邻像素范围取样,这两种可编程AA还会追加取样位置权重,比如在中心范围增加取样点,实现更准确更平滑的CFAA,但因为存在大量的共享取样,绝对取样点数量远低于MSAA,所以执行速度远较同级别的MSAA高。和NVIDIA G80支持的高性价比AA模式CSAA相比,CFAA的重要优势是支持stencil shadow,idsoftware公司的DOOM3大量使用这种技术。

  据称R600能够在EdgeDetect过滤模式下支持最高24倍CFAA!但目前笔者测试使用的驱动还未提供这种模式,可选择项目最高为WideTent过滤16倍CFAA。

镭获新生 HD2900XT对GF8800深度测试
Adaptive开启下的16倍CFAA

  Adaptive抗锯齿模式仍然被R600保留,通过开关在驱动中开启关闭,开启Adaptive能够有改善普通MSAA无法有效解决的线条密集区域的抗锯齿,比如网格和树枝,但也会部分损失细节和对比度。

  ● 对应DirectX 10的纹理单元

镭获新生 HD2900XT对GF8800深度测试
R600的纹理单元图

  R600支持极高分辨率的纹理,最高达8192*8192分辨率,符合DirectX 10规范,同时它也能支持纹理阵列在低开销下实现更复杂的视觉效果。在纹理缓存方面,R600拥有很高的自由度,无论是像素、顶点还是最新的几何着色器程序都能够访问全部纹理缓存。

  HDR(High dynamic range rendering)从支持浮点色彩格式的DirectX 9时代开始流行,但浮点格式比整数格式占用更多的寄存器空间而限制了其性能的发挥,如典型的16bit浮点精度格式的每个色彩数据需要占用16bit,这两倍于整数格式的空间占用。

  R600拥有强大的纹理过滤功能:它支持全速64bit双线性HDR纹理过滤和半速的128bit浮点精度纹理过滤,所有格式的三线性和各向异性过滤。配合DirectX 10,它还能支持使用一个5bits共享首位存储所有色彩然后每个色彩拥有9bits尾址的32bit浮点精度HDR以节约存储空间。在最高级别的HDR方面,R600支持DirectX 10 的每色彩32bit浮点精度HDR。

  R600的所有抗锯齿模式都和HDR兼容,支持AA+HDR的DirectX 9/DirectX 10应用。

回到顶部阅读

Radeon HD 2900 XT的更多硬件优势

Radeon HD 2900 XT的更多硬件优势

  ● 重度强化的几何应用性能

  AMD称R600的着色器设计很大程度上偏重于3D场景中的几何应用,比如构建非常复杂的模型、物理加速等。在顶点应用片内缓存容量方面是R580 GPU的8倍,能够创建复杂得多的3D模型。同时它还具有全功能的顶点纹理获取指令,和像素着色共享同一纹理单元。

  R600的所有流处理单元都能够被分配于进行顶点着色或几何着色,硬件和编译器都没隐性进行像素着色、顶点着色及几何着色硬件使用比例的限制。在需要的情况下,R600顶点处理能力可达到R580的10倍之高。

  这些看起来都是统一架构着色器本身所具有的优势,然而R600还沿袭了Xbox 360上就出现了的功能:可编程的Tessellation。


镭获新生 HD2900XT对GF8800深度测试
可编程的Tessellation的实现效果

  可编程的Tessellation可以比普通Tessellation实现15倍提升的几何数据压缩效率,这种功能可以在预先设定的简单几何建模上于每个小三角形内自动生成海量的新顶点和三角形,直线提升简单建模的视觉细致程度。

  可编程的Tessellation是充分利用DirectX 10几何着色器可以在GPU内生成顶点功能实现的,用GPU生成顶点,比DirectX 9时期使用CPU生成在顶点速度快上一个数量级。R600可以承受创建大于5亿个多边形的几何负载,实现接近CG级别的仿真3D角色、极度真实复杂的地形等。

  虽然几何着色器作为DirectX 10的基本功能之一可以在任何统一着色器架构的GPU上实现,但R600相对G80的优势在于它在顶点缓存做出优化、应用的真实开发上已经有了Xbox的实例,不难想象移植自Xbox的大量使用可编程Tessellation的最新3D游戏会在R600上运行的更快。

  512bit 环形总线内存控制器

  R600使用完全分布式的环形总线(Ring Bus)内存控制器提升可用内存带宽,其物理位宽为512bit,超越NVIDIA Geforce 8800 GTX之前创下的最高点384bit,成为继Matrox Parhelia后全球第2个512bit内存位宽的GPU。

镭获新生 HD2900XT对GF8800深度测试
GPU内存控制器的演变

  提高内存带宽的手段包括提升内存运行频率或者是增加控制器的内存位宽,除了硬件的直接提升bit宽度外,还可以在内存控制器总线上做文章。ATI从R520 GPU开始引入了环形总线的内存控制器,在中央控制器外设置4个控制器环站共同控制内存存取,环站使用两套对行的256bit环路连接,总线内部带宽可达512bit。

镭获新生 HD2900XT对GF8800深度测试
R600的内存控制器工作模式

  R600进一步强化了环形总线内存控制器,取消了中央控制器,真正做到了完全分布式设计。它使用4套,2、2对行的512bit环路连接64bit*2的4个内存控制器环站,总线内部带宽为惊人的1Gbit!

  事实上环形总线结构并不会像其内部带宽提升那样巨幅提升总体内存带宽,这种分布式设计更多的意义是缓解极度复杂的GPU核心内设定单一内存控制器的硬件压力。在宏观上,4个环站可以看作是Crossbar类内存控制器内部分组的一种外部表象,只是在环站之间引入环形高速连接降低了部分情况下需要向内存回写数据时的延迟,因为内部接口可以直接从环站位通过环性总线向内存写数据,可略过内存控制器的参与。

  值得一提的是R600的外部通路PCI Express x16也是直接挂接在环形总线上,可以在系统内存和显卡本地内存之间直接建立高速通信模式。

  ● 多GPU并行计算:Crossfire

   双Radeon HD 2900 XT能实现接近1TFLOPsd的计算能力,这需要使用ATI Crossfire(交叉火力)技术连接,以实现多GPU的并行计算。

  R600是AMD-ATI首款内置Crossfire Compositing Engine的旗舰级别GPU,上代旗舰R580+的Crossfire需要外置第三方Compositing Engine,提升成本并增加PCB复杂度。从后来发布的首个80nm工艺GPU RV570开始,Compositing Engine已经被集成进GPU中,并通过PCB间内部连接器连接,有效提升了Crossfire性能、降低了操作复杂度。

镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT Crossfire

  根据不同的3D应用程序,Radeon HD 2900 XT Crossfire的双GPU并行计算可以使用隔帧渲染、水平均分渲染同帧或网格混合均分渲染同帧的三种不同方式运作,这些方式的设计思想都是让3D图形负载尽可能的平均分担在2个GPU上,努力实现200%的运行速度。此外,Crossfire还可以实现更高倍数的抗锯齿,极致优化画面质量。

回到顶部阅读

DirectX 10的幻虚化境

DirectX 10的幻虚化境

  ● DirectX 10应用的显性推动

  DirectX 10作为最新的3D API和微软的超人气最新操作系统Window Vista捆绑推出,这是一个革命性的API,在着色器方面做出了巨大的改进。DirectX 10核心部分的Shader Model 4.0技术将完全放弃GPU当中的固定比率顶点/像素着色器分工模式,转而使用统一架构的着色器,将GPU行为的自由化,支持多种任务并引入一种新的几何着色器,它能够在GPU内创建顶点、对象并对其进行各种操作,大大降低CPU系统开销。 DirectX 10还支持Higher Level Shading Language 10。


镭获新生 HD2900XT对GF8800深度测试
DirectX 10游戏的画面表现值得期待

镭获新生 HD2900XT对GF8800深度测试
DirectX 10着色器编程可用资源的巨幅提升

  Shader Model 4.0的引入除了以统一着色器架构让着色器操作的硬件执行更为灵活有效外,还大大的提升了着色器可用资源。DirectX 10还引入纹理阵列来鼓励游戏编程者使用DirectX 9时代限于硬件资源而不敢使用的巨型纹理。并还特别引进流输出模式绘制预测来降低CPU在3D应用时的负载,这些都使得DirectX 10游戏能够在3D建模、场景和物件的复杂度大大提升,整体提升了游戏的真实度和游戏体验。

镭获新生 HD2900XT对GF8800深度测试
你能找出DirectX 10画面的标志性符号么?

  显而易见,此次DirectX版本升级的意义在于给3D娱乐应用开发者提供更开放、更强大更灵活的基础平台,并进一步剥离通用CPU在3D处理时的参与度,这些手段的目的在于推动实现更为逼真、更为震撼的虚拟现实视觉效果。但就目前我们所掌握的资料而言,DirectX 10暂时还缺乏典型的特效改进符号来证明自身的存在,比如DirectX8出现的波光粼粼的水面、DirectX 9出现的HDR眩目光照,我们能通过看到复杂的粒子特效或者是更出色的地形表面就判断是DirectX 10游戏么?

  ● DirectX 10应用的隐性忧虑

  另一方面事实是,在目前DirectX 9平台供给的功能上,如果开发者重度使用着色器资源,已经能够实现非常漂亮的3D场景、并同时让即使是最新DirectX 10级别产品都不堪重负,Direct X10更加复杂的着色器编程实现是否能在目前水平的显卡产品上实现那些美仑美奂的场景的同时也满足速度需求还是未知。

  同时还不得不考虑的是,虽然Geforce和Radeon的最新一代产品都宣称对DirectX 10拥有完全兼容的硬件资质,但它们之间的硬件实现方式和功能侧重还是存在巨大差异,尽管统一渲染架构大大淡化了着色器资源配置不同带来的性能差距,我们在大量真正DirectX 10游戏问世之前还是不能准确判断究竟哪种设计和DirectX 10的契合度更高。一切基于DirectX 9级别游戏性能作出的判断和推测都只能作为参考。

  ● DirectX 10实景展示分析:Ruby Whiteout

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
Radeon虚拟角色Ruby的前两次出场

镭获新生 HD2900XT对GF8800深度测试
Ruby的DirectX 10演示Whiteout

  为配合Radeon HD2000系列产品的发布,Ruby也有了最新的展示舞台,这次的短片名为Whiteout,Ruby穿上毛皮冬装,在高山速降滑雪过程中和恶势力周旋。像Radeon显卡的进步一样,Ruby的形象细致度再次升级。

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
基本构架数量上的巨变

镭获新生 HD2900XT对GF8800深度测试
亦真亦幻的粒子系统实现雪雾效果

镭获新生 HD2900XT对GF8800深度测试
DirectX 10应用的底层数据增长

  这一代的Ruby,在人物角色多边形使用上是上代的2.5倍,画面每帧生成三角形数量也翻番,峰值达210万三角形/帧!而DirectX 10的引用,减少了像素着色程序的数量,但每个程序的长度大大增加。

  几何着色器的引入,实现了Ruby嘴唇附近自动生成顶点、并改变多边形的形状和位置,极大地提高了人物形象的真实度。

回到顶部阅读

Radeon HD 2900 XT的高清视频解码和信号输出

Radeon HD 2900 XT的高清视频解码和信号输出

  ● 略显遗憾 R600不支持UVD

  Radeon HD 2900 XT中的“HD”直白的强调着最新一代Radeon产品对于高清类型应用的专业支持度,前文的R600核心架构表述让我们对其的高分辨率游戏性能充满信任,但可惜的是,R600内不包含Radeon HD中档产品才具有的UVD(Unified Video Decoder)高清视频解码逻辑。


镭获新生 HD2900XT对GF8800深度测试
UVD能够对VC-1、H.264两种编码格式的高清视频全程解码

  65nm工艺制造的RV630和RV610将内置UVD逻辑,而最先释放的Radeon HD 2900 XT的高清视频解码逻辑Avivo版本和Radeon X1900系列相同,缺乏Bitstream处理能力,但可对高清视频解码的其他步骤执行硬件操作,包括对CPU能力要求不低的De-Blocking操作,由CPU来执行Bitstream处理。

  R600的这个特征与G80不具备H.264 BSP十分相似,我们应该从几个方面认识这种事实:第一、这一代顶级GPU研发时间较早,设计蓝图未规划全硬件的高清解码逻辑;第二,顶级GPU内部结构过度复杂,增加并不简单的全硬件的高清解码逻辑会恶化芯片良品率;第三,选择这个级别显卡的用户无疑会拥有超高性能的CPU,GPU全硬件解码需求不太迫切。

  ● Radeon HD 2900 XT直接输出HDMI

镭获新生 HD2900XT对GF8800深度测试
R600 GPU拥有Windows Vista Premium Logo

  虽然R600在高清硬件解码上并不能称作完美,但它在其它高清应用相关方面的功能非常全面,Radeon HD 2900 XT的2个Dual-Link规格的DVI输出都支持HDCP数字内容保护内容的播放,R600 GPU中已经内置了密钥。同时R600还是首款GPU内置音频逻辑的高性能产品,它可以无需外置音频设备的配合实现HDMI完整视频+音频信号的输出。R600也继承了Avivo重点特征之一的10bit颜色精确度(总共30bit)规格。

  R600 GPU内置了符合HD Audio规格的音频逻辑,它支持AC3规范的Dolby Digital和DTS编码格式,支持32kHz、44.1kHz、48kHz的16bit音频流,能够满足主流高清视频回放需求,并拿到了Windows Vista Premium Logo。正是这一部分的功劳,Radeon HD 2900 XT可以直接输出完整的HDMI信号。

镭获新生 HD2900XT对GF8800深度测试
Radeon X1950 CF的设备识别

镭获新生 HD2900XT对GF8800深度测试
Vista直接识别Radeon HD 2900 XT的HDMI

  上两图显示了Windows Vista下Radeon HD 2900 XT和Radeon X1950 CF的区别,Radeon HD 2900 XT自带的HD Audio音频逻辑已经被Vista自动识别并安装了驱动,声音控制面板也多出了HDMI的数字输出设备。

回到顶部阅读

Radeon HD 2900 XT实物大赏

Radeon HD 2900 XT实物大赏

  ● 红色烈火战车 史上最美型的显卡

  虽然只是一款399美金的次顶级产品,但Radeon HD 2900 XT却是目前最复杂的3D加速卡。正如我们看到的,AMD研发团队在外形上做足了文章:ATI传统的周身亮色纯红基调、覆盖了PCB正面85%面积的巨型散热器上以银色火焰涂装点缀,强悍的3D计算能力似乎喷薄欲出。


镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT

镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT 背面特写

  Radeon HD 2900 XT在产品设计方面克服了重重困难,尽可能的保证了在各类PC机箱内配置的可行性,它PCB长度和标准ATX主板宽度刚好相等,外接电力输入接口也是垂直于长度方向。也就说只要是非low profile型、能安装标准宽度主板的机箱,使用Radeon HD 2900 XT就不存在问题。

  之前网络上流行的超长版本R600显卡实际上是在PCB后方安装了用于在机箱内固定的拉杆,以配合整机供应商实现PC机作为一个整体通过运输跌落试验等要求,而面向零售市场的产品则不需这些累赘。

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT细节

  Radeon HD 2900 XT是双槽位的显卡产品,同时需要8pin+6pin双路外接电力输入。6pin+6pin外接电力也可以让它正常工作,但驱动控制面板中的Overdrive功能不会出现。在Crossfire实现方面,Radeon HD 2900 XT和Radeon X1950 PRO的方案相同,使用两个软性PCB联结器。

镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT直接HDMI输出

  前文已述,Radeon HD 2900 XT的一个过人之处是可以直接简便实现HDMI输出,通过上图这种DVI—HDMI转接头,可以将Radeon HD 2900 XT的DVI输出转成HDMI信号输出,众所周知HDMI中的视频信号和DVI并无二致,但标准HDMI输出还包含了音频信号,Radeon HD 2900 XT实现了这一点。

镭获新生 HD2900XT对GF8800深度测试
Radeon X1950 CF和Radeon HD 2900 XT的对比

  和Radeon X1950 Crossfire Edition显卡相比Radeon HD 2900 XT稍长,外形设计的曲线元素较少,显得更为硬朗、更具魄力。

  两块Radeon HD 2900 XT组成的Crossfire是目前AMD能提供的最强3D娱乐加速解决方案,可以在AMD RD580/RD600芯片组主板及Intel 965/975 Express芯片组主板上实现。AMD官方给出的Radeon HD 2900 XT Crossfire操作电源供应器需求是750W。

  ● PCB状况及和其他产品对比

  Radeon HD 2900 XT的使用了14层PCB,在R600规格未透明的时期,业内普遍认为在显卡有限的PCB面积上实现超密pin脚的512bit位宽内存控制器GPU,以及和GDDR3内存芯片之间的连接是不可能完成的任务,不过现在AMD的工程师在不算夸张的PCB规模上实现了设计目标!

镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT PCB正面

镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT PCB背面

  Radeon HD 2900 XT的PCB设计风格和Radeon X1800/X1900系列类似,GPU和Memory紧邻PCI Express接口布置,供电部分的高频开关电路远离信号输出电路,被安置在PCB的最外侧。

  因为要配置最高1GB容量512bit位宽的本地内存,Radeon HD 2900 XT不得不在PCB的背面设计和正面对称的8个内存芯片安装位,这是ATI Radeon系列在Radeon X800之后首款如此设计的产品,会增加散热器设计的难度和整体成本。

镭获新生 HD2900XT对GF8800深度测试
Radeon X1950 CF和Radeon HD 2900 XT的对比

镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT和两款Geforce 8800的PCB尺寸比较

  以上是Radeon HD 2900 XT和自家上代旗舰Radeon X1950 CF及NVIDIA Geforce 8800系列产品的PCB对比图示。可以看到大幅增加的GPU晶体管数目、功率以及内存位宽并没有让Radeon HD 2900 XT呈现出过于夸张的面貌,它只比Radeon X1950 CF复杂一点,但还不如Geforce 8800 GTX庞大。

回到顶部阅读

Radeon HD 2900 XT硬件构成剖析

Radeon HD 2900 XT硬件构成剖析

  ● GPU、Memory等核心部分

  Radeon HD 2900 XT核心配置包括R600 GPU和512MB容量的GDDR3本地内存。在OEM领域,AMD还供给1GB本地内存的Radeon HD 2900 XT 产品


镭获新生 HD2900XT对GF8800深度测试
R600 GPU

  R600 GPU内含7亿晶体管!超过G80的6亿8千万成为当今GPU复杂度的No.1。这款芯片由台积电使用改进型80nm工艺制造,称为80HS工艺,新工艺有效提升GPU可达到的运行频率,并在成熟的技术下实现较高的良品率。AMD方面宣称,R600比普通80nm工艺同规模芯片能达到的运行频率高30%!Radeon HD 2900 XT上的R600运行在740MHz,全芯片内的所有逻辑频率同步,它运行在PCI Express x16上。

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
R600 GPU更多细节

  R600使用核心裸露的FCBGA封装,没有安装金属上盖保护,但基板周有一圈金属垫片和核心顶等高起辅助保护作用,芯片的生产相关信息也蚀刻在金属垫片上,GPU核心顶部光滑如镜。

镭获新生 HD2900XT对GF8800深度测试
hynix 1ns GDDR3芯片

  送测这款Radeon HD 2900 XT上搭载了hynix HY5RS573225A FP-1 GDDR3芯片,单颗芯片为8M*32bit组织形式,16枚芯片组成512MB容量和512bit位宽,如果需1GB容量配置,可直接将芯片换装为16M*32bit型号。1ns速度的芯片额定运行频率高达2000MHz(DDR),但Radeon HD 2900 XT设定的内存频率仅为1650MHz,预留了相当大的可提升空间。

镭获新生 HD2900XT对GF8800深度测试
ATI Theater200多媒体解码芯片

  久违的ATI Theater200终于再度出现在Wonder系列之外的Radeon系列产品上,这是一枚模拟视频解码、音频解码的整合型芯片,支持视频输入的捕捉,协助实现HD Avivo。它虽然已经不是Theater系列最先进的芯片,但其基本功能仍然足够使用,包括2个12bit的ADC单元、高质量的可调2D梳状滤波器等。

  ● 供电等外围支持部分

镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT供电电路特写

  在GPU、Memory供电设计方面,ATI Radeon X1800/X1900系列不惜血本的做法再次被复制。Radeon HD 2900 XT的这一部分集中了大量高成本高性能元件,包括VOLTERRA的两种电源IC、PULSE的一体式多路并联电感和大量高容量陶瓷电容。这样的方案可以在有限的PCB空间内布置好给GPU、Memory供电的所有元件,并且还能在一体式散热器下完成对它们的有效散热。

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
VOLTERRA VT1165M和VT1195S

  GPU和Memory的供电分别由一颗VOLTERRA VT1165M配合4枚和3枚VOLTERRA VT1195S构成,后端配以3只PULSE的一体式多路并联电感(PA1314NL、PA1312NL、PA0511101NL)整流,两排密集的高容量陶瓷电容滤波,阵容十分强大。充沛的供电设计余量可以支撑GPU、Memory的高频率运作,740MHz/1650MHz的GPU、Memory默认设定频率可以说是相当保守,较早拿到Radeon HD 2900 XT的某些极限玩家已经动手把这两个频率双双突破1GHz!

镭获新生 HD2900XT对GF8800深度测试
PCB背面的少量供电相关元件

  PCB背面的对应位置供电相关元件寥寥,因为这些高集成度的高性能电源IC需要进行有效的散热,而缺乏散热条件的显卡背面显然不行。

回到顶部阅读

Radeon HD 2900 XT散热器分析

Radeon HD 2900 XT散热器分析

  ● 散热器拆解

  因为需要照顾PCB背面内存芯片的散热,Radeon HD 2900 XT的散热器相对复杂,但整体上仍较Radeon X1950 XT的各部件完全分离式散热器简洁。它主要由正反两块铝质内存、供电元件散热兼固定板+铜质GPU吸热散热块+离心式风扇及导流罩构成,完全拆解它们也并不麻烦。


镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT散热器完全分解

镭获新生 HD2900XT对GF8800深度测试
GPU吸热散热块为全铜+双热管配置

镭获新生 HD2900XT对GF8800深度测试
散热器和GPU核心接触部分凸起

  GPU吸热散热块部分和我们熟悉的CPU散热器结构类似,和GPU核心表面接触的铜底吸热储热,通过热管元件内部工质相变迅速把热量传递给密集的铜鳍片,由离心式风扇提供流动空气,空气流经鳍片进行热交换,最后把热量带出机箱

镭获新生 HD2900XT对GF8800深度测试
Millennium品牌的离心风扇 12V_0.94A标称规格

  散热器配置的12V_0.94A标称规格Millennium离心风扇支持PWM自动调速,为4pin接口,全速运行噪音不低,不过大多数时候它都会以低速模式运行。

  ● 和其他顶级显卡散热器对比

镭获新生 HD2900XT对GF8800深度测试
比Radeon X1950 CF的GPU吸热散热块规模更大

镭获新生 HD2900XT对GF8800深度测试
和Geforce 8800 GTX散热器整体规模相当

回到顶部阅读

Radeon HD 2900 XT提前捆绑3部未发布游戏

Radeon HD 2900 XT提前捆绑3部未发布游戏

  ● 游戏白条再现 这次是3款

  还记得Radeon 9800 XT发布时ATI随卡附赠的Half-Life 2游戏因上市延期而只送了换领CD-Key的“白条”么,这次的Radeon HD 2900 XT更是随卡附赠多达3款游戏,可惜的是它们仍然是一张“白条”,不,也许叫“黑条”更合适些,因为官方的名称是“The Black BOX”!


镭获新生 HD2900XT对GF8800深度测试
The Black BOX

镭获新生 HD2900XT对GF8800深度测试
The Black BOX

  看来这次又是动作缓慢的Value坏了事,不过有总好过没有,如果你有意购买Radeon HD 2900 XT,那么不妨通过以下的游戏截图来了解它们,然后决定是否以后去网上换领CD-Key。

  ● Half-Life 2 Episode Two

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试

  ● Portal

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  ● Team Fortress 2

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试

回到顶部阅读

驱动、操作系统选择及测试方向

驱动、操作系统选择及测试方向

  到此为止,我们已经从纸面上全面了解了Radeon HD 2900 XT的技术特色和产品状况,以下将进入性能测试环节,真正的战斗马上开始。

  ● Catalyst 8支持Radeon HD 2900 XT

  ATI在4月末提供了Catalyst 8.374系列驱动程序用于配合Radeon HD 2900 XT系列产品的发布。它们分别对应Windows Vista和Windows XP,均为32位版本,未通过WHQL认证。这版Catalyst驱动目前仅支持Radeon HD 2000系列显卡,Radeon X1000和更早的Radeon等产品均不支持。


镭获新生 HD2900XT对GF8800深度测试
Catalyst 8.374的CCC界面

镭获新生 HD2900XT对GF8800深度测试
各部分驱动识别信息

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试
抗锯齿模式调节部分发生的变化

  Catalyst 8.374的自动解压运行安装包容量达60MB,解压后更高达120MB,远高于Forceware 158.18解压后33MB的水平,复杂的编译器有可能是驱动容量增加的原因。

  ● 测试内容

  >>Radeon HD 2900 XT和其他高性能显卡在顶级处理器平台下的系统功耗对比;
  >>Radeon HD 2900 XT和其他高性能显卡在首个DirectX 10游戏中的速度比较;
  >>Radeon HD 2900 XT和其他高性能显卡在DirectX 9合成测试软件和游戏中的速度比较;
  >>Radeon HD 2900 XT和Geforce 8800的8倍MSAA和16倍AA的速度、画面质量比较;
  >>Radeon HD 2900 XT和Geforce 8800在Windows Vista下的高清视频回放CPU负载测试;
  >>Radeon HD 2900 XT超频,及对抗829美元Geforce 8800 Ultra的可能。

  因为测试内容涉及到DirectX 10,这次显卡测试将正式移植至32位Windows Vista操作系统内进行,虽然还有不少3D游戏和Vista存在兼容性问题,但这种测试还是能够代表未来应用的方向。

  在绝对性能测试里,我们将选用1280*1024、1600*1200和2560*1600三个分辨率进行,前两个分辨率可以覆盖市场主流:17至22英寸宽屏LCD的标准分辨率,最后的超高分辨率用于研究旗舰级GPU的极限状态下3D加速能力。考虑到LCD只有在标准分辨率下才有最好的显示效果,所以降低1280*1024以下分辨率的测试将不再加入。

回到顶部阅读

性能测试部分的硬件、软件系统说明

性能测试部分的硬件、软件系统说明

  ● 测试系统的硬件环境

  显卡绝对性能测试部分使用的硬件平台由Core 2 Extreme X6800 CPU、975X Express主板1GB*2双通道DDR2-800内存构成。细节及软件环境设定见下表。


系 统 硬 件 环 境
中央处理器 Intel Core 2 Extreme X6800
( 双核 / 266MHz*11 / 4MB共享L2缓存 )
内存模组 ADATA Vitesta Extreme Edition DDR2-1066 1GB *2
( 运行在800@5-5-5 )
主板 Intel Deskboard D975XBX
( 975X Express / PCB版本303 / BIOS版本1142 )
显示卡 Radeon HD 2900 XT
( Radeon HD 2900 XT / 256MB / 核心:740MHz / 内存:1650MHz )

Radeon X1950 XTX (用X1950 CF模拟)
( Radeon X1950 XTX / 512MB / 核心:650MHz / 内存:2000MHz )
NVIDIA Geforce 8800 GTX

( Geforce 8800 GTS / 768MB / 核心:580MHz / 内存:1800MHz  )
NVIDIA Geforce 8800 GTS
( Geforce 8800 GTS / 640MB / 核心:513MHz / 内存:1584MHz )
NVIDIA Geforce 8800 GTS
( Geforce 8800 GTS / 320MB / 核心:513MHz / 内存:1584MHz )
硬盘 WestDigital Caviar SE WD1600JS
( 160GB / 7200RPM / 8M缓存 / 50GB NTFS系统分区 )
电源供应器 Topwer TOP-900W
( ATX12V 2.0 / 900W )
显示器 SAMSUNG SyncMaster 305T
( 30英寸LCD / 2560*1600分辨率 )

  ● 测试系统的软件环境

操 作 系 统 及 驱 动
操作系统 Microsoft Windows Vista Ultimate 32bit
( 中文版 )
主板芯片组驱动 Intel Chipset Software Installation Utility
( WHQL / 版本号8.1.1.1009 )
显卡驱动 ATI Catalyst for Radeon X1000
( WHQL / 版本号7.3 )
ATI Catalyst for Radeon HD 2000
( beta / 版本号8.374 )
NVIDIA Forceware for Geforce 8
( WHQL / 版本号158.18 )
桌面环境 1280*1024_32bit@60Hz

  测试内容除了包括D3D合成测试软件3DMark、DirectX 9 3D游戏和OpenGL D3D扩展3D游戏外,还最新加入首个DirectX 10游戏的测试包Call of Juarez DirectX 10 Benchmark。合成测试软件3DMark用总分衡量性能,3D游戏用平均fps来衡量性能,两者都是越高越好。

性 能 测 试 软 件
3D合成测试软件 3DMark 05
( Futuremark / 版本号1.20  )
3DMark 06
( Futuremark / 版本号1.02  )
3D游戏 Call of Juarez DirectX 10 Benchmark
( Ubi / 版本号1.0 )
Company of Heroes
( Relic / 版本号1.4 )
F.E.A.R.
(  Monolith / 版本号1.0.1 )
Far Cry
( Ubi / 版本号1.3 build1325 )
Quake 4
( Raven Software / 版本号1.0.1262 )
Rainbow 6 Vegas
( Ubi / 版本号1.0 )
S.T.A.L.K.E.R.
( iGSC Game World / 版本号1.0 )
SupermeCommander
( Gas Powered Games / 版本号1.0.3189 )
The Elder Scrolls IV Oblivion
( Bethesda Softworks / 版本号1.1 )
 测 试 辅 助 软 件
速度记录软件 Fraps
( beepa / 版本号2.8.2 )

回到顶部阅读

系统功耗测试和产品重量测试

系统功耗测试和产品重量测试

  我们使用Seasonic PowerAngel功率计测试整个系统的实时功率,CPU关闭了EIST等自动降频功能以减少误差,空载为系统进入操作系统待机时、满载为运行3DMark 06软件,取值均是相当长一段时期观察达到过的最大值。

  ● 系统功耗-空载


镭获新生 HD2900XT对GF8800深度测试

  ● 系统功耗-满载

镭获新生 HD2900XT对GF8800深度测试

  7亿晶体管的R600功耗的确惊人,无论空载还是满载,Radeon HD 2900 XT系统整体功耗都是测试中最高的。不过两款Radeon系列显卡均有更好的功耗管理功能,2D下它们会大幅降频以节能,因此空载测试部分所有产品差距不大。

镭获新生 HD2900XT对GF8800深度测试
Overdrive的自动降频功能

  从Catalyst控制面板的Overdrive中可以读到Radeon HD 2900 XT的2D工作频率为核心/内存—507MHz/514MHz。大约只有满载频率的2/3,此时的GPU核心温度也在相对较低。

  ● 产品重量

  用电子秤测试显卡?不要意外,这里只是测试一下它们的重量,重量级性能当然也要有重量级的身板。首先出场的是庞然大物Geforce 8800 Ultra和Geforce 8800 GTS。

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
两款Geforce 8800双双上阵

  Geforce 8800 Ultra为764克、Geforce 8800 GTS为676克,都超过了1市斤。再来看看松下的10.4寸屏的笔记本电脑(拆掉了电池)的成绩,这可是一整套PC系统哦。

镭获新生 HD2900XT对GF8800深度测试
10.4寸屏的笔记本电脑有多重

  微型笔记本电脑的成绩是677克,比Geforce 8800 GTS重那么一点。

镭获新生 HD2900XT对GF8800深度测试
重量级产品登场!

  真正的重量级角色来了,Radeon HD 2900 XT的重量测试成绩拿到第一,952克,接近2市斤!可谓“人间凶器”。

  此小节仅供娱乐,并不计入整体性能评估,特此声明......

回到顶部阅读

首个DirectX 10游戏测试:COJ DX10 Benchmark

首个DirectX 10游戏测试:COJ DX10 Benchmark

  ● Call of Juarez DirectX 10 Benchmark

  Call of Juarez是一款较新的西部题材第一人称视角射击游戏,以出色的DirectX 9 HDR效果闻名。4月末,Call of Juarez的DirectX 10 Beta版本和测试包问世,它能够支持Radeon HD 2000系列和Geforce 8系列产品,是第一款正式发布的可运行DirectX 10游戏。


镭获新生 HD2900XT对GF8800深度测试
Call of Juarez DirectX 10 Benchmark

  这里使用Call of Juarez DirectX 10 Benchmark进行性能测试,它的测试内容是Flyby过场,通过区域分别着重展示最新的3D特效,其中的重点包括几何着色器生成的粒子系统特效,复杂的材质纹理着色、AA+HDR等。

镭获新生 HD2900XT对GF8800深度测试
几何着色器生成的水滴溅射

镭获新生 HD2900XT对GF8800深度测试
实时全动态光影生成

镭获新生 HD2900XT对GF8800深度测试
接近真实的树干表面着色

镭获新生 HD2900XT对GF8800深度测试
AA+HDR

镭获新生 HD2900XT对GF8800深度测试
Call of Juarez DirectX 10 Benchmark界面

镭获新生 HD2900XT对GF8800深度测试
Call of Juarez DirectX 10 Benchmark分辨率支持

  Call of Juarez DirectX 10 Benchmark支持最高1920*1200的分辨率,两种尺寸的Shadowmap切换,x2、x4的MSAA开关和3个档位的Shadows品质,以下测试是在最高画质设定下关闭AA和声音完成的。

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  Radeon HD 2900 XT在这唯一一款第三方DirectX 10游戏测试中比Geforce 8800 GTS快约20%,不过就绝对速度而言,所有产品的性能都不够快。

回到顶部阅读

D3D合成测试软件测试:3DMark05、3DMark 06

D3D合成测试软件测试:3DMark05、3DMark 06

  ● 3DMark 05

  3DMark 05是完全基于DirectX 9 3D API的测试软件,并全面改用微软提供的HLSL进行渲染引擎的编写,以让引擎自动适应测试显卡的硬件架构。


镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  ● 3DMark 06

  3Dmark 06是目前为止最新版本的3DMark,所有测试都需要支持SM3.0的DirectX 9硬件,并且支持HDR特性,这款软件的最终得分里CPU性能占有不小的权重,因此它更适宜分析整个系统的3D加速能力。

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  在3DMark 05和3DMark 06的三个分辨率测试中,Radeon HD 2900 XT最终都获得了第一名,其中领先Radeon X1950 XTX约50%-60%,超过Geforce 8800 GTS 640MB约20%-25%。

回到顶部阅读

D3D即时战略游戏:COH和SupermeCom

D3D即时战略游戏:COH和SupermeCom

  ● Company of Heroes

  二战是几年来长盛不衰的3D游戏题材,Company of Heroes就是从101空降师诺曼底登陆后在欧洲战场血战题材入手的最新战略游戏,不过其自带测试并非针对即时战略的实际场景,反而更像第一人称视角游戏。

  >>游戏类型:DirectX9 即时战略游戏
  >>测试方式:游戏自带性能测试工具,内容为3D实时运算的剧情过场回放
  >>画质设定:全部最高


镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  Company of Heroes的测试场景更像是第一人称视角射击游戏而不是即时战略游戏,因此可以排除太多单位造成CPU性能瓶颈,Radeon HD 2900 XT在这里速度惊人,大幅度超越竞争对手产品,同时在高分辨率下提供大约自家上代产品近200%的性能。

 ● SupermeCommander

  即时战略游戏历史上唯一可与Starcraft争夺王位的是Total Annihilation,这部SupermeCommander即可看作是Total Annihilation的正统续作,它延续了超大场景、超多单位、立体作战的TA风格,对PC系统的性能需求也提升到空前程度。

  >>游戏类型:DirectX9 即时战略游戏
  >>测试方式:游戏自带性能测试工具,内容为3D实时运算的战役回放
  >>画质设定:全部最高

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  Radeon HD 2900 XT在SupermeCommander这个最新游戏中同样表现优秀。SupermeCommander测试更趋向于即时战略游戏的真实情况,同一画面海量的单位使CPU更多的参与进来,3D加速卡的性能提升被部分淡化。

回到顶部阅读

D3D第一人称视角射击游戏:Far Cry、F.E.A.R

D3D第一人称视角射击游戏:Far Cry和F.E.A.R

  ● Far Cry

  经典的FPS游戏,虽然已经显得有些古老,但仍能体现DirectX 9高品质游戏应具的特征,HDR、复杂的光影等,同时这款游戏对显卡的加速能力提升反应敏感,适合做测试评估。

  >>游戏类型:DirectX9 第一人称视角射击游戏
  >>测试方式:外挂HardwareOC Far Cry Benchmark V1.7,运行Volcano场景游戏录像
  >>画质设定:全部最高,HDR关闭


镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  ● F.E.A.R

  F.E.A.R.是05年最佳第一人称视角射击游戏,虽然对款屏支持不足,但因其自带测试工具并且画质调节功能丰富,仍被大量用于衡量系统的3D娱乐性能,这款较早开发的游戏对显卡本地内存容量要求不太高。

  >>游戏类型:DirectX9 第一人称视角射击游戏
  >>测试方式:游戏自带性能测试工具,内容为3D实时运算的飞行过场回放
  >>画质设定:全部最高,SoftShadow开启

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  在Far Cry和F.E.A.R两个相对古老的DirectX 9游戏中,Radeon HD 2900 XT取得较大优势的胜利,事实上Radeon X1950 XTX的速度就已经非常接近Geforce 8800 GTS了。

回到顶部阅读

D3D第一人称视角射击游戏:Rainbow Six Vegas和S.T.A.L.K.E.R.

D3D第一人称视角射击游戏:Rainbow Six Vegas和S.T.A.L.K.E.R.

  ● Rainbow Six Vegas

  Vegas采用了大名鼎鼎的Unreal 3引擎,画面异常华丽,不少现实维加斯的场景都在游戏中被真实的还原出来,并且在视觉拟真方面做出了突破,比如快速移动带来的视觉模糊、被击中后的视觉模糊及闪光弹强光后的缓慢视觉恢复等。Rainbow Six Vegas是目前PC上对显卡要求最高的游戏之一,不过它提供的分辨率有限,最高只到1600*1200。

  >>游戏类型:DirectX9 第一人称视角射击游戏
  >>测试方式:白天室外场景,沿同一固定路线跑完3次取平均值,Fraps计速
  >>画质设定:全部最高


镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  Rainbow Six Vegas给这些顶级显卡带来了非常大的压力,新一代的DirectX 10级别产品可以在1280*1024分辨率下流畅运行,而在1600*1200下,Radeon HD 2900 XT拿到第一名的成绩只是24 fps。

  ● S.T.A.L.K.E.R.

  跳票王S.T.A.L.K.E.R.终于在不久前正式发售,这款游戏的3D引擎素质一般,但游戏内设计出的室外、室内场景相当复杂,对显卡着色器的负载较大。

  >>游戏类型:DirectX9 第一人称视角射击游戏
  >>测试方式:白天室外场景,沿同一固定路线跑完3次取平均值,Fraps计速
  >>画质设定:全部最高

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  S.T.A.L.K.E.R.是除了Quake 4之外Geforce 8800 GTS的另一个反击点,但是Radeon HD 2900 XT的表现也不算差,两者互有胜负。注意这是个对显卡本地内存容量敏感的游戏,能和R600对抗的只有640MB版Geforce 8800 GTS,320MB版性能很差。

回到顶部阅读

OpenGL游戏Quake 4及D3D PRG游戏The Elder Scrolls IV Oblivion

OpenGL游戏Quake 4及D3D PRG游戏The Elder Scrolls IV Oblivion

  ● Quake 4

  使用idsoftware Doom3引擎,但由Raven制作的经典游戏续作。Quake 4小幅度加强了Doom3基础上的游戏复杂度,并且支持多核处理器的加速,这款游戏和Quake3、Doom3等idsoftware游戏一样对CPU内存子系统表现敏感,是出色的PC系统测试软件。

  >>游戏类型:OpenGL 第一人称视角射击游戏
  >>测试方式:外挂HardwareOC Quake4 Benchmark V1.3,运行id自带Deathmatch模式场景游戏录像
  >>画质设定:全部最高


镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  idsoftware独步天下的OpenGL系列引擎一直都是Radeon和Geforce对抗时的软肋,Radeon HD 2900 XT相对Radeon X1950 XTX有了长足的进步,并且在高分辨率设定下表现出了极强的性能:相对1280*1204设定速度下降极小!在2560*1600分辨率下超越Geforce 8800 GTS。

  The Elder Scrolls IV Oblivion

  The Elder Scrolls IV Oblivion是06年度最佳游戏,这款游戏气势宏大,系统复杂,深受喜欢欧美RPG的玩家推崇,Oblivion对系统尤其是显卡的要求非常高。在测试中我们用强制在显卡驱动中开启AA和游戏中开启HDR来实现AA+HDR设定

  >>游戏类型:DirectX9 第一 / 第三人称视角RPG游戏
  >>测试方式:白天室外场景,第三人称视角为操作沿同一固定路线跑完3次取平均值,Fraps计速
  >>画质设定:全部最高,HDR开启
  >>AA、AF控制:显卡驱动程序内
  >>其它:无

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  The Elder Scrolls IV Oblivion的超高像素/顶点着色器负载设计促成了R600优势的放大,Radeon HD 2900 XT在这个非常漂亮的游戏中比Geforce 8800 GTS快20%!

回到顶部阅读

高质量游戏测试:抗锯齿和各向异性过滤开启

高质量游戏测试:抗锯齿和各向异性过滤开启

  这一部分测试选择部分对抗锯齿、各项异性过滤功能支持较好的游戏进行,统一在驱动控制面板中开启4倍MSAA和16倍的AF。

  NVIDIA显卡在Far Cry 的最新1.4版本中AA+HDR仍存在像素Z轴信息错乱、处于下层的贴图被透明显示至上层的现象,因此Far Cry测试所有显卡统一没有开启HDR。而The Elder Scrolls IV Oblivion的AA+HDR可以被所有产品正确支持,测试在HDR开启下完成。

  ● Far Cry


镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  ● F.E.A.R

镭获新生 HD2900XT对GF8800深度测试

  ● Quake 4

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  The Elder Scrolls IV Oblivion

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  Radeon HD 2900 XT在不同游戏中开启AA、AF后的表现不够稳定。

  其中Far Cry和The Elder Scrolls IV Oblivion中AA+AF都会让Radeon HD 2900 XT速度下降较多,幅度甚至高于同比的Radeon X1900 XTX,标准设定下相对Geforce 8800 GTS的优势也被追上。

  但另一方面F.E.A.R.和Quake 4中,Radeon HD 2900 XT令人满意,其中的Quake 4的1600*1200 AA+AF速度非常接近1600*1200标准设定,即使是2560*1600 AA+AF,仍旧有高于45的平均fps能力,远高于Geforce 8800 GTS。

回到顶部阅读

新抗锯齿模式对比:8xMSAA和16xAA

新抗锯齿模式对比:8xMSAA和16xAA

  ● 8xMSAA和16xCFAA vs 16xCSAA

  在标准多重采样抗锯齿模式上,R600和G80同样支持最高8倍设定,较各自上代旗舰的6倍、4倍水平有所突破,毕竟MSAA是实用的AA模式中适用范围最广的,新增的8倍设定给Radeon HD 2900 XT和Geforce 8800的速度带来多大的影响也是游戏玩家关心的部分。

  此外,在目前驱动条件下,Radeon HD 2900 XT和Geforce 8800也能在自家的特色AA模式下实现16倍抗锯齿,分别是Radeon HD 2900 XT的16xCFAA和Geforce 8800的16xCSAA,两者的速度比较也将加入。

  测试这个项目使用The Elder Scrolls IV Oblivion,并追加一个单独测试8xMSAA的3DMark06 Deep Freeze场景。


镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  Radeon HD 2900 XT的8倍MSAA较4倍MSAA以及16倍CFAA速度下降幅度和Geforce 8800 GTS 640MB大致相当,320MB本地内存的Geforce 8800 GTS在这种高品质抗锯齿测试中显得较为吃力。在绝对速度对比上,Radeon HD 2900 XT仍然是第一。

  ● 抗锯齿画质比较

  以下是一些游戏开启抗锯齿的截图,左侧为Radeon HD 2900 XT,右侧为Geforce 8800 GTS。

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
8xMSAA画面质量比较

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
16xCFAA和16xCSAA 画面质量比较

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
8xMSAA画面质量比较

  两块显卡的高品质抗锯齿游戏能提供的画面质量基本相当,除非数倍放大原图,否和很难看出差别。

回到顶部阅读

Radeon HD 2900 XT超频挑战Geforce 8800 Ultra

Radeon HD 2900 XT超频挑战Geforce 8800 Ultra

  ● 用Catalyst中的Overdrive超频

  前文提及过,Catalyst控制面板中的Overdrive选单会在使用8pin+6pin外接电力输出情况下出现,这并不会直接让显卡的性能获得提升,但开放了Overdrive的调节可能,也就是超频。


镭获新生 HD2900XT对GF8800深度测试
Overdrive控制面板在内存超频上存在瓶颈

  在这个选单中超频实际上是超频Radeon HD 2900 XT的3D满载运行频率,2D工作频率并不会变化,其中提供了核心上限858MHz,内存上限1900MHz的幅度。笔者在22摄氏度开放环境下超频最终达到的稳定频率是核心/内存—848MHz/1800MHz,其中内存频率已经抵达上限,1ns GDDR3内存芯片显然还有进一步提升频率的空间。

  ● 超频后和Geforce 8800 Ultra的对比

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  848MHz/1800MHz的Radeon HD 2900 XT已经能在3DMark 05和3DMark 06测试中干掉价格是它两倍还多的Geforce 8800 Ultra,并在半数游戏中非常接近Geforce 8800 Ultra的速度,但诸如Vegas这样的游戏中,差距还是相当明显。

回到顶部阅读

Radeon HD 2900 XT高清回放测试

Radeon HD 2900 XT高清回放测试

  ● PowerDVD 7.3全面支持GPU高清加速

  AMD提供了CyberLink PowerDVD的最新版本7.3,它能够全面支持Radeon和Geforce的高清硬件解码功能,并同时支持BlueRay和HD DVD。比WinDVD更方便的是,PowerDVD支持.ts格式的视频文件的直接播放,这方便了我们的测试。


镭获新生 HD2900XT对GF8800深度测试
PowerDVD 7.3

镭获新生 HD2900XT对GF8800深度测试
安装Radeon HD 2900 XT被自动识别Avivo加速

镭获新生 HD2900XT对GF8800深度测试
安装Geforce 8800 GTS被自动识别PureVideo加速

  ● 对Geforce 8800 GTS 结果半斤八两

  笔者使用Radeon HD 2900 XT对Geforce 8800 GTS比较它们的高清视频解码能力和回放效果。鉴于这两款最新一代的显卡内高清视频解码逻辑都和自家上代产品一样水准,均不能支持Bitstream处理,这里还是使用了Core 2处理器,毕竟它们和100% GPU硬件解码在性能上存在差距,需要强力CPU的支持。

  影片的选择则分别是VC-1编码的1080p Aeon Flux和H.264编码的1080p X-Man 3,前者峰值码率超过33Mbps,后者则在少部分场景达到过42Mbps。

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  以上截图包含了实时码率信息、CPU占用率信息和显卡信息,使用数码相机拍摄,读者可自行判断两种显卡的画面色彩风格取向。

  在CPU占用率对比上,两个系统基本相当,Geforce 8800 GTS似乎稍占上风,但优势微弱。

回到顶部阅读

399美元的2900XT成为Radeon HD 2000家族先锋

399美元的2900XT成为Radeon HD 2000家族先锋

  ● Radeon HD 2900 XT 3D加速性能总结

  作为AMD首款DirectX 10级别GPU的实体显卡产品,Radeon HD 2900 XT的在非AA环境下3D娱乐加速能力大约是NVIDIA G80 GPU次顶级产品Geforce 8800 GTS 640MB的110%-125%,同比超出Geforce 8800 GTS 320MB更多,但无法和全规格的G80显卡Geforce 8800 GTX、Geforce 8800 Ultra正面交锋。

  在和Radeon上代旗舰Radeon X1950 XTX相比时,Radeon HD 2900 XT可以完成换代者角色的任务,几乎所有的情况下,它都比Radeon X1950 XTX运行的更快,并且幅度已经是断代的区隔。


镭获新生 HD2900XT对GF8800深度测试
DirectX 10应用中Radeon HD 2900 XT更快速

  Radeon HD 2900 XT目前存在问题是驱动程序,笔者测试使用的Catalyst 7.374在抗锯齿性能上表现一般,使Radeon HD 2900 XT的速度下降幅度大于Radeon X1950 XTX和Geforce 8800 GTS,影响了它在高质量游戏应用中的综合表现。此外,这一版驱动的控制面板也会间歇性的和操作系统“不合”,有时无法呼出。

  ● 高端也谈性价比

  谈及性能,就不能割裂开价格去判断,Radeon HD 2900 XT的399美元上市价格(还包括3款DirectX 10游戏)和Geforce 8800 GTS 640MB相当,前文的测试已经明显的给出了两者质量的优劣排位,除了那些对功耗要求苛刻或者偏执需要640MB本地内存的用户,Radeon HD 2900 XT都是更合适的选择,更值得注意的是在唯一一个DirectX 10游戏测试中,Radeon的优势明显,这在一定意义上说明了Radeon HD 2900 XT对未来游戏的支持能力会更佳。

镭获新生 HD2900XT对GF8800深度测试
1+3=399

  通常来讲,位于这个梯队的产品都是在以不计成本的设计追求极限性能,Radeon HD 2900 XT应该是首款强调性价比的旗舰显卡。不得不说这种手法似曾相识,AMD也许把销售其CPU产品时的灵活策略也转到了图形产品线上,不失是一种务实的思路,毕竟Geforce 8800系列已经在半年来的市场独占期创造了高端显卡的销售记录,追求极限性能的用户群已经近乎饱和,Radeon HD 2900 XT需要用明显的性价比优势拉动预算有限的摇摆者入住高端。

  ● Radeon HD 2900 XT亟待增援 Radeon HD 2900 XTX身在何方

  不管Radeon HD 2900 XT多么能值回399美元的票价,少数Radeon产品的忠实Fans都无法对现今的这款次级旗舰满意,长久的等待需要一种真正振奋人心的刺激——拿到3D娱乐性能王冠,而之前曾多次非官方曝光的Radeon HD 2900 XTX并没有如期到达,甚至没有出现在AMD的Roadmap上。

镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2900 XT期待后援

  前期拿到Radeon HD 2900 XT产品的极限超频玩家已经成功把它的核心频率超频至1GHz以上(修改电压),在我们的测试中它也能达到848MHz并以此状态实现接近Geforce 8800 Ultra的速度,笔者实在无法理解AMD此时不推出Radeon HD 2900 XTX把Geforce 8800 Ultra撼下王位的原因,唯一理由大概是AMD已经决定停止在这时间落后太久的一代上纠葛而正在全力研发第2代DirectX 10高端GPU。

回到顶部阅读

未来愿景:R600的通用计算应用构想

未来愿景:R600的通用计算应用构想

  ● R600的通用计算硬件可能

  超标量风格的最新GPU设计变得和通用型CPU越来越相似,着色器可以执行的指令也越来越灵活、可用的资源越来越多,GPU的浮点计算能力也爆发式的增长。作为R600的缔造者AMD同时也是CPU的制造商,R600比G80更有实现通用计算的外部条件。


镭获新生 HD2900XT对GF8800深度测试
X86 CPU计算的演变

  几十年来X86的应用,工作和使用都快速趋于多样化,综合因素导致了这个变革:CPU,GPU,以及半导体技术的局限性。这将是AMD下一步主要战略的发起点,AMD同时推动着CPU和GPU技术,丰富的硬件和软件战略。通用计算功将被应用于医疗影像,数据虚拟,高性能计算,视频等更多领域。

镭获新生 HD2900XT对GF8800深度测试
R600的流计算架构

  Radeon HD 2900的低延迟、高吞吐量线程,可以用于交互计算应用、物理、AI、HPC、图像处理等运算。320个矢量流处理单元同时支持浮点数与整形数操作,符合IEEE754标准。合理利用这些计算资源,理论上程序缓存可以让程序无限扩展,而常用缓存同样没有限制。

  ● 规划中的R600的通用计算方案

镭获新生 HD2900XT对GF8800深度测试
AMD的整体软件解决方案

  对于GPU通用计算只有硬件是不够的,开源的软件系统,对于创造丰富的开发环境及开发工具必不可少。为此,AMD开发了通用高速运算软件包。2005年问世的CTM 硬件抽象层宣告GPU上的流处理器诞生。自动编译为C, C++提供编译扩展,程序开发者可以工作在自己熟悉的开发环境中,依然采用原有的编程语言,现在他们已经成为新的操作者,可以将代码交给流处理器去编译。

镭获新生 HD2900XT对GF8800深度测试
流媒体实时编码

镭获新生 HD2900XT对GF8800深度测试
医学立体仿真

  GPU进行即时光线计算,进行等值面提取,借助功能转换设计,进行即时分类,为虚像外科手术提供必需的元素,将镜面和直接体绘制合并,以达到最佳结果。

镭获新生 HD2900XT对GF8800深度测试
流体动态分析

  这些都是充分利用R600通用标量着色器群超级计算能力的一些构想,目前还都为进入实际应用,但值得关注,CPU和GPU的融合,是未来PC发展的一个可能的方向。

回到顶部阅读

Radeon HD 2000系列预览:比同类产品更强大、更实用

Radeon HD 2000系列预览:比同类产品更强大、更实用

  ● 中端主力稍后抵达:Radeon HD 2600和Radeon HD 2400

  AMD这次Radeon旗舰赶晚集,但同系中端产品将会很快到达,它们是Radeon HD 2600和Radeon HD 2400,为Radeon HD 2900的重度减化型显卡,对阵NVIDIA的Geforce 8600系列和Geforce 8500系列。


镭获新生 HD2900XT对GF8800深度测试
Radeon HD 2000系列规格表

  Radeon HD 2600的核心代号为RV630,Radeon HD 2400的核心为RV610,两者均使用TSMC的65nm工艺制造,频率进一步提升并降低功耗,其中Radeon HD 2400还可实现全被动散热方案。

  可以看到,RV630的流处理单元规模大约是R600的3/8,高于G84相对G80的1/4,并且运行频率也较高,Radeon HD 2600有希望战胜Geforce 8600系列成为中端DirectX 10显卡的更好选择。RV610的内存控制器只有64bit,能有效降低DRAM配套成本,主攻OEM市场。

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
两种板型的Radeon HD 2600 XT

镭获新生 HD2900XT对GF8800深度测试   镭获新生 HD2900XT对GF8800深度测试
两种散热方案的的Radeon HD 2400

  ● R600简化型GPU集成最强高清解码:UVD

  高清视频能提供前所未有的细致入微画面,但视频文件所需存储空间巨大,因此用于实现尽量高的压缩比,并保持良好画面质量的更先进编码格式不断涌现。之中最流行并被DVD标准制定组织DVD Forum认可的VC-1和H,264。而用户在播放使用这些编码的高清视频的时候,就需要对进行过复杂编码后的视频进行实时解码,如果没有专门的解码器硬件支持,这个软件解码的过程对于CPU是一个非常严峻的考验,因为运算量非常巨大。

  Radeon HD 2600及Radeon HD 2400具备比Radeon HD 2900更强的高清视频解码功能,这一点和Geforce 8600、Geforce 8400相对Geforce 8800更强类似。

镭获新生 HD2900XT对GF8800深度测试
Avivo HD核心:UVD

  这个专门用于高清视频解码的部分被称为UVD(Unified Video Decoder),它包含在RV630和RV610芯片中,UVD能够对VC-1、H.264两种编码格式的高清视频全程硬件解码,可以做到应对40Mbps码率影片的流畅全尺寸播放,100%释放CPU在这一过程中的参与。

镭获新生 HD2900XT对GF8800深度测试
UVD相对于BSP优势明显

  以G84、G86 GPU为核心的Geforce 8600/8500系列显卡仅可以对H,264高清视频做Bitstream处理、De-Blocking等一系列操作,缺乏对VC-1编码的同类支持,比较起来显然RV630和RV610的高清视频解码更全面。

回到顶部阅读

首批上市Radeon HD 2900 XT图赏:两AIB、三通路

首批上市Radeon HD 2900 XT图赏:两AIB、三通路

  首上市的Radeon HD 2900 XT无一例外都是和AMD官方样品完全相同的样式,据了解,各家自主研发的诸如水冷散热器版、超频版Radeon HD 2900 XT已经在规划中,相信不久之后就能纷纷出台。

  以下几种Radeon HD 2900 XT零售产品中,盈通R2900XT豪华版现已经抢先上市,官方报价3299元人民币,和399美元的折算价相当。

  ● 盈通


镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  ● 蓝宝石

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  ● 迪兰恒进

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  ● 七彩虹

镭获新生 HD2900XT对GF8800深度测试

镭获新生 HD2900XT对GF8800深度测试

  ●  铭瑄

镭获新生 HD2900XT对GF8800深度测试

查看本文作者 王胤韬 的其他文章>>
给文章打分 5分为满分(共0人参与) 查看排行>>
频道热词:华硕主板  Intel  AMD  
视觉焦点
显卡评测热点
排行 文章标题
TOP10周热门显卡排行榜
  • 热门
  • 新品