
千元极限超频谁更强
● 千元极限超频谁更强
千元级价位目前已经成为中国显卡市场的兵家必争之地,特别是在最近两年,千元级市场的显卡销量成倍增长,无论是GPU芯片生产商还是板卡厂商都希望自己在这一层级的市场中有所建树。不过当我们认真考虑用户需求的时候,也许会注意到用户希望得到的不一定是直接的性能等级,而是更多的性能潜力。
如果我们提问哪一项指标能够用最准确的方式突出显卡的性能潜力?相信大家会把所有眼光集中在超频方面,的确显卡的超频能力不但代表了显卡电气性能的稳定程度,还可以透露出设计者对于一款的市场定位思考。
显卡型号 | Radeon HD 6850 | Radeon HD 6790 | GeForce GTX 550 Ti |
市场定价 | 1299 元 | 1099~999 元 | 1099 元 |
GPU代号 | Barts | Barts | GF116 |
GPU工艺 | 40 nm | 40 nm | 40 nm |
GPU晶体管 | 17 亿 | 17 亿 | 11.7 亿 |
着色器数量 | 960 | 800 | 192 |
着色器组织 | (1D+4D)*192 | (1D+4D)*160 | 1D *192 |
ROPs数量 | 32 | 16 | 16 |
纹理单元数量 | 48 | 40 | 32 |
核心频率 | 775 MHz | 840 MHz | 900 MHz |
着色器频率 | 775 MHz | 840 MHz | 1800 MHz |
理论计算能力 | 1.49 TFLOPs | 1.34 TFLOPs | 1.04 TFLOPs |
等效内存频率 | 4000 MHz | 4200 MHz | 4104 MHz |
内存位宽 | 256 bit | 256 bit | 192 bit |
内存带宽 | 128 GB/s | 134.4 GB/s | 98.5 GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 |
内存容量 | 1024 MB | 1024 MB | 1024 MB |
DX版本支持 | 11 | 11 | 11 |
HD视频技术 | UVD3 | UVD3 | PureVideo HD |
通用计算接口 | Stream | Stream | CUDA |
今天登场的正是两款千元级主力显卡,他们分别来自AMD最新发布的HD6000系列首款千元级产品——Radeon HD 6790;另一款则是NVIDIA目前正在捍卫千元市场的主力军GeForce GTX 550 Ti。
AMD千元主力Radeon HD 6790显卡
在价格方面这是两款势均力敌的产品,而架构和最终GPU规格定位方面,我们看到了AMD和NVIDIA完全不同的两种思路。Radeon HD 6790是目前Barts芯片中最低端的产品,它屏蔽了大量流处理器,但是保全了256Bit显存位宽,高分辨率下性能不会受到显存频率压制。
NVIDIA千元主力GeForce GTX 550 Ti显卡
GeForce GTX 550 Ti可以看做是GTS450的衍生版产品,因为它的GF116核心实际上是GF106核心打开了所有192Bit显存位宽构成的,所以它是完整版的GF116芯片代言产品。
同时我们需要注意到Radeon HD 6790的ROP单元问题,由于其拥有800个流处理器和16个光栅单元,而16个光栅单元在目前已经不是主流配置,所以这款显卡虽然浮点吞吐和显存带宽资源充沛,但是光栅混合能力可能成为瓶颈。

GF116与Barts芯片特性分析
● GF116与Barts芯片特性分析
Geforce GTX 550Ti显卡是Fermi架构中首款采用192Bit显存位宽的产品,而上代GTX460 SE缩减的只是流处理器数量,并没有缩减显存位宽。那么192个流处理器配合192Bit显存位宽会给GPU带来哪些直接提升呢?Geforce GTX 550Ti能否在特性测试中展现出显存位宽提升带来的性能飞跃?
根据NVIDIA针对不同的市场对产品做了不同定义,本次发布的GF116被定义为“Sniper”(狙击手),这款产品相对与GF106有哪些提升相信在昨天的显卡频道芯片级首测中大家已经看到了这款产品的相关特性——显存控制器全部打开192Bit,同时使用混合显存实现1024MB容量。
混合显存可以使用最少数量的显存颗粒达到1024MB的显存容量,同时符合192Bit显存位宽。对于一款中端产品来说,1024MB显存容量无疑是一个黄金比例,既能满足GPU的性能需求,又不会浪费产品自身成本。
让我们把目光集中在Barts核心身上,HD6000发布之后我们看到了一颗核心面积更小的芯片融聚了更高的浮点运算能力,我们看到通过改善线程控制能力流处理器和特殊功能运作效率进一步提升,当然这一切的背后,还有AMD利用TSMC改进后的40nm CMP碱洗工艺提升整体频率带来的线性性能提升。
RV870与HD6000前端设计
本次Barts在核心架构上的变化主要有三点:
1、Tessellator数量仍为1组,但是为增强型的Tessllator Gen7。
2、线程控制器由Cypress的一组变为Barts现在的两组。
3、UVD引擎升级至第三代,提供了更多功能及格式的图形核心计算模式。
其中线程控制器分为两组,是HD6800系列Barts核心性能提升的主要因素,两组线程控制器同时工作能够更有效的发挥流处理器的并行计算能力。这一改革让HD6000拥有更丰富的指令缓存和发射端资源,虽然两个UTDP单元还是采用抢占式资源分配模式,但是面对庞大的流处理器阵列时效果会比一个UTDP单元好很多。
Radeon HD 6790系列Barts芯片Tessellator单元
Radeon HD 6790所集成的Tessellator单元数量仍为1组,但是为增强型的Tessllator Gen7,这是第一个改进。而第二个改进正是上文提到的线程控制器由Cypress的一组变为Barts现在的两组,这减轻了UDTP的仲裁负担,改善了三角形吞吐负载不足的情况,所以几何性能在曲面细分系数Factor较低的时候可以做到2倍以上提升。

两款公版显卡超频概况
● 两款公版显卡概况与超频
GeForce GTX 550 Ti标配的GF116-400-A1核心源于台积电采用40nm工艺制造,其由11.7亿晶体管构成,拥有全规格的192个流处理器、32个纹理单元、16个光栅单元和完整的192bit显存控制器。GF116完美支持DirectX 11,拥有4个Tessellator单元,在做Tessellation操作时会提供更强力的支持。
GF116芯片
GeForce GTX 550 Ti既然是为大众游戏爱好者量身定做,自然其会设定性价比更高的规格搭配,192流处理器、192bit显存位宽的双“192”规格奠定了其会有较强的性能表现。
Radeon HD 6790使用了40nm工艺的Barts核心,其由17亿晶体管构成。其核心编号为215-0798002,这款核心拥有800流处理器、16个光栅单元和40个纹理单元,虽然上述硬件规格均非Barts核心的满规格设定,但是在显存控制器上Radeon HD 6790保留了完成的256bit设计,从而确保与上一代Radeon HD 5770之间性能差距。
Radeon HD 6790规格方面,其拥有800个流处理器和16个光栅单元,显存规格为256bit/1024MB,默认频率为840MHz/4200MHz,产品满载功耗为150瓦。
GeForce GTX 550 Ti标配的GF116核心超频能力很强,笔者在室温26°C左右环境下进行超频,在默认风冷条件下显卡整体频率提升至1000MHz/2000MHz/5450MHz,核心轻松破GHz。后期上市的GTX550Ti产品中我们可以看到很多显卡额定频率达到1GHz。
AMD方面我们超频软件使用驱动控制面板,由于后期大量上市的HD6790产品并没有使用6+6pin辅助电源方案,所以我们将其频率稳定在900/4400MHz,这已经是一个比较高的额定频率,同时相对于公版产品840/4200MHz有一定幅度的提升。

测试系统软硬件环境
● 测试系统硬件环境
性能测试使用的硬件平台由Intel Core i7-870 3.52GHz
测 试 平 台 硬 件
中央处理器
Intel Core i7-870 Extreme Edition
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存 )
散热器
Thermalright Ultra-120 eXtreme
内存模组
Apacer 猎豹二代双通道套装/PC3-12800
(SPD:1757 9-9-9-24-1T)
主板
技嘉P55-UD4 GIGABYTE GA-P55-UD4
(Intel P55 + ICH10R Chipset)
显示卡
NVIDIA 产 品
GeForce GTX 550 Ti
(GF116 / 1GB / 核心:900 MHz / Shader:1800 Mhz / 显存:4104 Mhz)
AMD 产 品
Radeon HD 6790 1024MB
(Barts / 1GB / 核心:840 MHz / Shader:840 Mhz / 显存:4200 Mhz)
硬盘
Hitachi 1T
(1TB / 7200RPM / 16M
电源供应器
鑫谷GP850 80PLUS金牌电源
(ATX12V 2.0 / 750W)
显示器
DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)
AcBel R8 ATX-700CA-AB8FB
我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,电源供应器、CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供。
● 测试系统的软件环境
为保证系统平台具有最佳的稳定性,此次硬件评测中所使用的操作系统均为Microsoft Windows 7 正版授权产品。使用Windows 7正版软件能够获得最好的兼容性以及系统升级更新服务。
用户在体验或购买安装Windows 7的操作系统时请认准所装系统是否已经获得正版授权许可!未经授权的非正版软件将无法获得包括更新等功能在内的Windows 7服务。
操 作 系 统 及 驱 动 | |
操作系统 | |
Microsoft Windows 7 Ultimate RTM | |
(中文版 / 版本号7600) | |
主板芯片组 驱动 |
Intel Chipset Device Software for Win7 |
(WHQL / 版本号 9.1.1.1125) | |
显卡驱动 | |
AMD Catalyst | |
(Beta / 版本号 11.4) | |
|
2560*1600_32bit 60Hz |
测 试 平 台 软 件 | ||
3D合成 测试软件 |
3Dmark Vantage | |
Futuremark / 版本号1.2 | ||
3Dmark 11 | ||
Futuremark / 版本号1.0.1 | ||
3D游戏 测试项目 | ||
DirectX 11游戏 | ||
Battlefield:Bad Company 2 | ||
EA / 版本号 1.0 | ||
Colin McRae DiRT 2 | ||
Codemasters / 版本号 1.01 | ||
F1 2010 | ||
Codemasters / 版本号 1.00 | ||
S.T.A.L.K.E.R.:Call of Pripyat | ||
Koch / 版本号 1.0 | ||
辅助测试软件 | Fraps | |
beepa / 版本号 3.2.3 |
各类测试软件和直接测速软件都用得分来衡量性能,数值越高越好。

理论性能测试:3DMark
● 理论性能测试:3DMark系列
3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。
● DX11理论性能测试:3DMark 11
3DMark 11是Futuremark在2010年12月07日推出的全新3D性能测试软件,该款软件仅支持DirectX 11系统和DirectX 11显卡。显卡测试的主要以产品的DirectX 11效能为主,同时还兼顾PhysX等方面平台性能。
3DMark Vantage和3DMark 11两个基准测试项目体现出了完全不同的结果,因为3DMark Vantage总成绩包含PhysX同时偏重Shader计算,而3DMark 11对GPU几何与贴图纹理方面的压榨比较严重。
在我们的测试中GTX550Ti在3DMark Vantage领先,同时超频后的性能提升潜能非常清晰,频率线性增长基本上能够带来性能的线性增长,而HD6790则比较吃力,不过HD6790默认性能强大是无可厚非的。

4款DirectX 11游戏性能测试
● 4款DirectX 11游戏性能测试
接下来我们使用了4款目前最为火爆的DirectX 11游戏进行超频后性能增长测试。它们分别是:
使用多款游戏进行性能测试可以很好地考验显卡的GPU Shader与纹理单元、光栅单元、显存等各个子系统,用户可以通过仔细对比GTX550Ti和HD6790在游戏中的性能提升来寻找适合自己的显卡。
测试总结:本次测试中HD6790显卡凭借较强的综合能力赢得了大量测试项目,不过由于AMD将HD6790的ROP单元直接缩减至16个,所以还是导致核心的最终性能被过低的混合、填充以及采样能力所限制。通过超频我们将核心频率提升了7%,但在游戏和理论测试中我们仅能取得1%~2%的总提升。
GTX550Ti显卡在提升了将近10%的频率之后,性能能够做到线性提升,的确这是一款架构非常平衡的产品,它可以很好展现超频带来的性能提升。特别是在DirectX 11游戏部分,由于GPU架构特性GTX550Ti取得了一个项目的领先。
相信看过评测之后用户已经明白了自己适合哪一类型的产品。HD6790显卡拥有较强的默认综合性能,我们建议玩家不用通过超频去探索性能提升,而GTX550Ti显卡超频可以带来更大幅度性能提升,条件允许可以适当提升频率享受性能优惠。