NVIDIA和AMD均发布了DirectX 11产品,而二者在DirectX 11产品设计思路和产品功能搭配理念上,显而易见的不同。同时围绕着谁是真DirectX 11产品的讨论在用户、厂商中展开。
如果就DirectX 11产品架构设计上,NVIDIA产品在架构设计上显而易见更适合Tessellation计算,因为NVIDIA目前即使最低端的GeFore GT 430也拥有2组Tessellation计算单元。而AMD方面所有DirectX 11产品,无论Radeon HD 5000还是Radeon HD 6000现已发布产品均只有一组Tessellation计算单元。
这样架构上的迥异自然造成了NVIDIA和AMD在DirectX 11计算上的差异,不得不说NVIDIA更适合现在DirectX 11游戏的计算,同时也能满足未来DirectX 11游戏的计算而不用频繁升级。谁是真DirectX 11产品不言而喻,不过下面还是通过实际测试来分析到底谁更适合DirectX 11计算。
● GTX400-HD6800超频性能对决
NVIDIA在2010年3月27日发布的第一代Fermi架构GF100芯片让无数用户看到了架构改进带来的至强DirectX 11性能和前所未有的游戏体验,但是基于第一代架构的GTX480/470/465显卡免不了忍受高发热高功耗的苦恼。同时NVIDIA过于偏向HPC领域的设计方向让GF100芯片在通用计算方面的性能不容置疑,图形处理则反倒受到牵制。
各家厂商提供的GTX460产品
其实与GF100芯片同期设计的还有NVIDIA改进版Fermi架构——GF104芯片。它仅有19.5亿晶体管规模,但是效能比达到了前所未有的高度。同时在1200-1500价格段,这款被命名为GTX460的显卡拥有竞争对手无可比拟的优势。
GTX460芯片特性回顾
作为AMD第二代DirectX 11架构GPU芯片,HD6000系列的发布对整个显卡市场带来了巨大影响,在NVIDIA发布GTX400仅半年时间后AMD就升级了其GPU产品线,无论是对厂商还是用户而言都有些出乎意料。
虽然HD6000系列显卡在硬件架构方面选择优化和延续上代产品,但是由于额定高频和增加的一组线程发射器,还是能够在2000元和1300元价位上轻松战胜自家上一代产品和竞争对手的GTX470/GTX460等经典显卡。
Radeon HD 6800 系 列 显 卡 对 位 产 品 规 格 比 较 表 | |||||
显卡型号 | Radeon HD 6870 | Radeon HD 6850 | GeForce GTX 470 | GeForce GTX 460 | GeForce GTX 460 |
市场定价 | 1999-1899 | 1399-1299 | 2888 元 | 1499 元 | 1299 元 |
GPU代号 | Barts | Barts | GF100 | GF104 | GF104 |
GPU工艺 | 40 nm | 40 nm | 40 nm | 40 nm | 40 nm |
GPU晶体管 | 17 亿 | 17 亿 | 32 亿 | 19.5 亿 | 19.5 亿 |
着色器数量 | 1120 | 960 | 448 | 336 | 336 |
着色器组织 | (1D+4D) *224 | (1D+4D) *192 | 1D *448 | 1D *336 | 1D *336 |
ROPs数量 | 32 | 32 | 40 | 32 | 24 |
纹理单元数量 | 56 | 48 | 56 | 56 | 56 |
核心频率 | 900 MHz | 775 MHz | 607 MHz | 675 MHz | 675 MHz |
着色器频率 | 900 MHz | 775 MHz | 1215 MHz | 1350 MHz | 1350 MHz |
理论计算能力 | 2.02 TFLOPs | 1.49 TFLOPs | 1.63 TFLOPs | 1.36 TFLOPs | 1.36 TFLOPs |
等效内存频率 | 4200 MHz | 4000 MHz | 3398 MHz | 3600 MHz | 3600 MHz |
内存位宽 | 256 bit | 256 bit | 320 bit | 256 bit | 192bit |
内存带宽 | 134.4 GB/s | 128 GB/s | 135.9 GB/s | 115.2 GB/s | 86.4 GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
内存容量 | 1024 MB | 1024 MB | 1280 MB | 1024 MB | 768 MB |
DX版本支持 | 11 | 11 | 11 | 11 | 11 |
HD视频技术 | UVD3 | UVD3 | PureVideo HD | PureVideo HD | PureVideo HD |
通用计算接口 | Stream | Stream | CUDA | CUDA | CUDA |
今天我们的测试主要针对1000-2000元市场上的5款明星产品——GTX460 768MB、GTX460 1024MB、GTX470、HD6850、HD6870进行默认性能和超频性能测试,所有显卡均为公版设计并正在市售的普通显卡,驱动采用NVIDIA和AMD近期发布的WHQL认证最新版本。
濮元恺所写过的技术分析类文章索引(持续更新) | |
8、 通用计算对决 四代N卡激战CUDA-Z | |
2、改变翻天覆地 最全Fermi架构解读 | |
3、从裸奔到全身武装 CPU功能集成之路探秘 | |
4、AMD统一渲染架构 历程回顾与评测 | |
6、别浪费你的电脑 分布式计算在中国 | 13、超越图形界限 AMD并行计算技术全面解析 |
7、显卡只能玩游戏? 10年GPU通用计算回顾 | 14、并非老马甲新穿法 HD6000改进性能揭秘 |
GTX400系列产品新特性
● GTX400系列产品新特性
如果说DirectX 10是微软为了提供更多特效同时大幅度改进GPU架构所设计的一套图形API,那最新问世的DirectX 11就是对DirectX 10的完美补充。在全新的DirectX 11世界中,我们看到了更加合理的图形渲染方式和更真实的3D渲染。而这些特效的支持,离不开一块性能优秀的显卡做支持。
AMD用最快速度将产品推向市场,虽然它所设计的DirectX 11产品特性并不十分突出,但是它完全符合新一代技术对于硬件的要求。而一心要做图形业界Intel的NVIDIA这次选择了设计一款完美的产品,它重新设计架构,大幅度增强了GPU的几何处理能力。我们在之前已经对Fermi架构Geforce GTX400系列的首发产品GTX470和GTX480进行了深度测试,带领玩家了解了GTX400系列显卡在DirectX 11游戏。
GF100 GPU基于图形处理团簇(翻译为GPC),可扩展流阵列多处理器(SM)和内存控制器(MC)。一个完整GF100实现四个GPC,16个SM和6个内存控制器。通过对GPC的开启和关闭,对SM和内存控制器不同的配置,可以划分出满足不同价位的产品。所以我们也可以称GF100为一个4 GPC核心的GPU。
Fermi架构GF100功能单元分布
图中我们可以看到GF100的总线接口、GigaThread线程调度器、四个完整的GPC单元、六个内存控制器、六个ROP簇和768KB二级缓存。每个GPC单元包含四个多边形引擎。六个ROP簇紧邻二级缓存。
GF104这款核心在NVIDIA首款支持DirectX 11的GPU核心GF100之后发布,在性能和发热方面达到业界公认的最佳平衡。GF100核心上市以来虽在效能上取得一定幅度的领先,但也受到许多批评,中端市场向来是兵家必争之地,所以NVIDIA对新GF104核心想必是寄予厚望。
GF104的一个SM中现在拥有48个CUDA Core,每个CUDA Core由两个Dispatch Port、Operand Collector、Result Queue以及INT整型数单元与FP浮点数单元构成。其中GF104的ALU和FPU均继承了GF100中CUDA Core的优良特性,例如ALI可以支持64bit精度指令运算,还有比较、布尔和移位等指令计算,值得一提的是Fermi架构的ALU通过改进现已完整支持32bit整数算法。同时FPU支持IEEE 754-2008标准,这一切一切的改变和支持都为Fermi架构在GPU通用计算上打下坚实基础。
GF106这款GPU拥有出色的DX9/10、GTX 400系列级别的DirectX 11游戏效能及热门的3D Vision支持FULL HD分辨率。
从上面的架构图我们可以看到GF104保留了Fermi架构的精髓,特别是完整的多形体引擎和可读写的二级缓存都在其中,同时这款架构在晶体管数量极其有限的情况下增加了TUM单元数量。在GTX460首测文章中,我们可以看到这款GF104芯片拥有的56个TMU单元已经大幅度提升了芯片的纹理处理能力。
通过NVIDIA Inspector软件识别我们能够了解到,两款GeForce GTX 460拥有相同的336个流处理器和相同的675MHz/1800MHz/2300MHz频率,此外二者还拥有相同的2个GPC数量、7个SM数量和56个纹理单元数量等。
两 款 GeForce GTX 460 具 体 规 格 对 比 | |||
Graphics Card | Graphics Card | GeForce GTX 460 768MB |
GeForce GTX 460 1024MB |
Price | Price(China) | ¥1299 | ¥1499 |
Processing Units | Graphics Processing Clusters | 2 | 2 |
Streaming Multiprocessors | 7 | 7 | |
CUDA Cores | 336 | 336 | |
Texture Units | 56 | 56 | |
Clock Speeds | ROP Units | 24 | 32 |
Graphica Clock (Fixed Function Units) |
675 Mhz | 675 Mhz | |
Pocessor Clock (CUDA Cores) |
1350 MHz | 1350 Mhz | |
Memory Clock (Clock rate / Data rate) |
900 Mhz / 3600 MHz | 900 Mhz / 3600 MHz | |
Memory | L2 Cache Size | 384 KB | 512 KB |
Total Video Memory | 768 MB GDDR5 | 1024 MB GDDR5 | |
Mempry Interface | 192-bit | 256-bit | |
Fillrate | Total Memory Bandwidth | 86.4 GB/s | 115.2 GB/s |
Texture Filltering Rate (Bilinear) |
37.8 Giga Texels/sec | 37.8 Giga Texels/sec | |
Fabrication Process | 40 nm | 40 nm | |
Transistor Count | 1.95 billion | 1.95 billion | |
Physical & Thermal | Connectors | 2 * Dual-Link DVI-I 1 * Mini HDMI |
2 * Dual-Link DVI-I 1 * Mini HDMI |
Form Factor | Dual Slot | Dual Slot | |
Power Connectors | 2 * 6-pin | 2 * 6-pin | |
Recommended Power Supply | 450 Watts | 450 Watts | |
Thermal Design Power (TDP) |
150 Watts | 160 Watts | |
Thermal Threshold | 104°C | 104°C |
而两个版本的不同主要集中在本地显存相关的参数上,例如1GB版本拥有256bit显存位宽、32个光栅处理器、512KB的L2缓存和115.2GB/s内存带宽;而768MB版本则拥有192bit显存位宽、28个光栅处理器、384KB的L2缓存和86.4GB/s内存带宽。
HD6800系列产品新特性
● HD6800系列产品新特性
本次发布的HD6800系列显卡作为第二代DirectX 11架构设计,并没有像我们之前所预期的对RV870架构进行伤筋动骨的改进,而是通过提高固定单元频率和改进线程分配能力达到了更高的流处理器资源利用率。最重要的是HD6800并非最高端单卡,它不代表HD6000系列的顶级性能,但是它在1200-1800元人民币之间的市场定位使之成为甜蜜点战略的核心。
HD6800系列所使用的Barts核心定位
Barts核心的设计目标主要有以下几点:
1、在较低功耗和价格上对AMD Radeon HD 5800系列进行性能优化
2、提供当前最佳性能/性能/平方毫米
3、功耗低于150瓦显卡市场当中性能最高产品
为达成以上目标,AMD在设计Barts核心时选择了以下几种方式:
1、设计一颗集成度不高于19亿的核心,和对手的GF104相仿
2、改进HD5000的线程分配能力和固定单元几何处理能力
3、必须严格控制功耗,依靠半导体工艺来提升性耗比
这里我们使用价格/面积比值来对比一下,可以发现AMD相比NVIDIA在单位面积里面能够创造更多的价值。Barts核心比值为0.98美元/mm2,GF 104核心则为0.46美元/mm2。这样的情况也出现在了高端芯片组方面,Cayman[HD 6900]比值为1.05美元/mm2,NVIDIA方面的GF 100为0.94美元/mm2。通过这次的更新换代,AMD在芯片方面的利润走在了NVIDIA的前面。
核心价格-面积比值 | ||
核心型号 |
核心面积(mm2) |
比值(美元/mm2) |
GF 100 |
529 |
0.94 |
GF 104 |
367 |
0.46 |
Antilles |
760 |
N/A |
Cypress |
336 |
N/A |
Cayman |
380 |
1.05 |
Barts |
230 |
0.98 |
Juniper |
166 |
N/A |
AMD的Cayman[HD 6900]核心实际面积是380mm2,相对于Cypress[HD 5850/5870/5970]核心多了43mm2。Barts核心面积为230mm2,相对于其前辈Juniper的166mm2增加了不少。
本次Barts在核心架构上的变化主要有三点:
1、Tessellator数量仍为1组,但是为增强型的Tessllator Gen7。
2、线程控制器由Cypress的一组变为Barts现在的两组。
3、UVD引擎升级至第三代,提供了更多功能及格式的图形核心计算模式。
其中线程控制器分为两组,是HD6800系列Barts核心性能提升的主要因素,两组线程控制器同时工作能够更有效的发挥流处理器的并行计算能力。这一改革让HD6000拥有更丰富的指令缓存和发射端资源,虽然两个UTDP单元还是采用抢占式资源分配模式,但是面对庞大的流处理器阵列时效果会比一个UTDP单元好很多。
HD6870相对与HD5850的性能提升
如果不考虑运行频率,HD5850和HD6870的区别只在于SIMD Core组数,也就是流处理器数量,两款芯片的固定单元数量是基本相等的(HD6800纹理单元有减少,UTDP单元翻倍)。但是当HD6870披上高频外衣之后,其线程分配能力、几何吞吐能力、光栅化与Z轴处理能力都获得了线性提升。
GTX400系列做工用料回顾
● GTX460/470做工用料回顾
GeForce GTX 460沿用了GeForce GTX 200以来在中高端采用100%导风罩的设计,不过散热器风扇的位置发生了明显变化,由右侧离心式风扇改为中央的轴流式风扇。接口方面延续了GeForce GTX 400系列的双DVI搭配Mini HDMI的组合。
显卡供电设计
显卡采用了3+1相供电设计,每相供电模组均为铁素屏蔽式电感搭配2个电容的组合。同时产品标配2个6pin外接供电,最大提供225瓦的能源输入。
GeForce GTX 470的拆解过程我们在GTX480首测中已经详细分析过,现在让我们再来简单回顾。与GeForce GTX 480的拆解一样,相对以往高端系列而言要较为轻松,尤其是卡口式导风罩的引入。
GeForce GTX 470的供电部分全部被设计在PCB正面的右侧,核心供电模组与显存供电模组位于上下两边,右上角为两个6pin外接供电,搭配PCI-Express提供的75w,共能实现225w的电能供应。
4相核心供电采用铁素体屏蔽式电感、优质Mosfet和固态电容组成。1相显存供电采用1个屏蔽式电感、2个固态电容和3个Mosfet的组合。除了PCB正面我们能够看到的供电模组电气件外,PCB背面还有核心、显存4+1相供电的钽电容。
HD6800系列做工用料回顾
● HD6800系列做工用料回顾
我们知道Radeon HD 6800系列并非6系的旗舰系列产品,而是主攻1000元至2000元高性能端性价比产品,所以其产品在用料及设计上在充分考虑稳定、冗余的前提下做到高性价比。首先让我们来欣赏一下Radeon HD 6870 PCB设计。
公版Radeon HD 6870 PCB
显卡供电采用了4+1的模组设计,其中4相位核心供电、1相为显存供电。公版产品为了保证供电模组的滤波效能,每相供电均使用了屏蔽式铁素电感、固态电容和优质Mosfet的组合。同时为了保证公版频率下151瓦的TDP,显卡还标配有2个pin外接供电。
公版Radeon HD 6850的散热器整体设计思路和外观,与Radeon HD 6870产品大同小异,可以看作是其小号版。而XFX讯景这款散热器完全与公版产品设计思路不同,我们会在后面的散热器拆解中详细介绍。
公版Radeon HD 6850的PCB设计与Radeon HD 6870思路相同,核心、显存供电居左,避开显存颗粒的电气干扰。同时核心居中,8颗显存呈"L"型围绕Barts核心展开。
公版Radeon HD 6850采用了3+1的供电模组设计,每相供电均采用屏蔽式铁素电感、固态电容和优势Mosfet的组合。同时为了满足130多瓦的TDP设计,显卡还标配有1个6pin外接供电。
值得一提的是,在核心3相供电和外接供电中,均预留有增配位置,这也许是为未来Radeon HD 6850高频产品的生产而预留。
5款显卡超频性能展示
● 5款显卡超频性能展示
本次我们选用的显卡全部为市售公版或最接近公版的产品,这些显卡可以轻易买到并且价格实惠,我们没有选用特殊的加强散热或供电非公版产品。值得一提的是所有显卡不论AMD还是NVIDIA产品,我们在超频时都没有榨取全部性能。
我们使用Furmark 1.8.0来检测5款显卡的超频结果,进入软件后选择稳定性测试,极端折磨模式。当GPU核心温度运行平稳之后图退出。虽然在后期的3DMark和天堂2测试中证明目前Furmark不是负载最大的测试项目,不过Furmark的确是最为简单易行的稳定性测试软件,其温度绘制功能也能较为清晰地展示显卡工作状态。
GTX460 1024MB超频结果
本次测试的两款GTX460产品,没有能够迈过900MHz核心频率门槛。因为笔者不想给它施加非常高的电压,这种状态下显卡无法长期运行。
HD6800系列的两款显卡同样采用驱动超频方式,没有电压调节选项,不过我们最后取得的成绩对AMD还是非常有利的。本次测试中Radeon HD 6870的频率超至1000MHz/4980MHz,Radeon HD 6850超至850/4800MHz。
测试系统软硬件环境
● 测试系统硬件环境
性能测试使用的硬件平台由Intel Core i7-870 3.5GHz
测 试 平 台 硬 件 | |
中央处理器 | Intel Core i7-870 Extreme Edition |
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存 ) | |
散热器 | Thermalright Ultra-120 eXtreme |
内存模组 | Apacer 猎豹二代双通道套装/PC3-12800 |
(SPD:1757 9-9-9-24-1T) | |
主板 | ASUS P7P55D Deluxe |
(Intel P55 + ICH10R Chipset) | |
显示卡 | |
AMD 产 品 | |
Radeon HD 6870 | |
(Barts / 1024MB / 核心:900MHz / Shader:900Mhz / 显存:4200 Mhz) | |
Radeon HD 6850 | |
(Barts / 1024MB / 核心:775MHz / Shader:775Mhz / 显存:4000 Mhz) | |
NVIDIA 产 品 | |
GeForce GTX 470 1280MB | |
(GF100 / 1280MB / 核心:607MHz / Shader:1215Mhz / 显存:3348 Mhz) | |
GeForce GTX 460 1024MB | |
(GF104 / 768MB / 核心:675MHz / Shader:1350Mhz / 显存:3600 Mhz) | |
GeForce GTX 460 768MB | |
(GF104 / 768MB / 核心:675MHz / Shader:1350Mhz / 显存:3600 Mhz) | |
硬盘 | Hitachi 1T |
(1TB / 7200RPM / 16M | |
电源供应器 | 鑫谷GP850 80PLUS金牌电源 |
(ATX12V 2.0 / 750W) | |
显示器 | DELL UltraSharp 3008WFP |
(30英寸LCD / 2560*1600分辨率) |
ASUS P7P55D
Thermalright Ultra-120 eXtreme
我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供,电源系统有鑫谷提供。
● 测试系统的软件环境
操 作 系 统 及 驱 动 | |
操作系统 | |
Microsoft Windows 7 Ultimate RTM | |
(中文版 / 版本号7600) | |
主板芯片组 驱动 |
Intel Chipset Device Software for Win7 |
(WHQL / 版本号 9.1.1.1125) | |
显卡驱动 | |
AMD Catalyst for Win7 | |
(WHQL / 版本号 10.10) | |
NVIDIA Forceware for Win7 | |
(WHQL / 版本号 260.89) | |
|
2560*1600_32bit 60Hz |
测 试 平 台 软 件 | ||
3D合成 测试软件 | ||
3Dmark Vantage | ||
Futuremark / 版本号1.2 | ||
3D游戏 测试项目 | ||
DirectX 11游戏 | ||
Colin McRae DiRT 2 | ||
Codemasters / 版本号 1.01 | ||
Lost Planet 2 | ||
Copcom / 版本号 1.0 | ||
Tessellation测试 | ||
Heaven Benchmark 2.1 | ||
UNIGINE / 版本号 2.1 | ||
辅助测试软件 | Fraps | |
beepa / 版本号 3.2.3 |
各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。
DX10理论性能测试:3Dmark Vantage
● DX10理论性能测试:3Dmark Vantage
3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。
DX11理论测试-天堂2.1
● DX11理论测试-天堂2.1
《Heaven Benchmark 2.1》是由俄罗斯Unigine游戏公司开发设计的一款Benchmark程序,该程序是由Unigine公司自主研发的游戏引擎设计,其支持DirectX 9、DirectX 10、DirectX 11与OpenGL 3.2 API,通过26个场景的测试最终得出显卡的实际效能。
>>游戏类型:DirectX 9/10/11及OpenGL Benchmark
>>
>>画质设定:全部最高
DX11游戏-科林麦克雷之尘埃2
● Colin McRae:DiRT2
《科林麦克雷:尘埃》本身是一款为纪念去世的英国拉力赛车手科林.麦克雷(Colin McRae)而制作的游戏,因此在游戏过程中不难见到许多麦克雷过往的身影,距前作将近二年多之久的《科林麦克雷:尘埃2》于2009月12月11日正式发售。值得一提的是,这款游戏不仅拥有很高的可玩性,同时还是率先支持DirectX 11 API的游戏,一经上市就得到广大游戏爱好者争相追捧。
>>游戏类型:DirectX 11竞速类游戏
>>测试方式:
>>画质设定:全部最高
DX11游戏-失落星球2
● Lost Planet 2
《失落的星球2》背景设在原来第一季的十年后。气候变化融化冰雪覆盖的大陆,创造了新的环境,如丛林。在EDN-3rd的改变下,10年过去了。地球发生了重大改变,冰川已经融化,热带丛林,沙漠冷酷无情。玩家将进入新的环境,与雪贼战斗,以抓住不断变化的地球控制权。玩家将控制他们的英雄跨越6个相互关联的事件,创造一个真正独特的互动体验。有了这个概念,玩家将会有机会从不同的发展角度来动态的改变故事情节。
>>游戏类型:DirectX11 第一人称视角射击游戏
>>
>>画质设定:全部最高
DX11游戏-战地:叛逆连队2
● Battlefield: Bad Company 2
《战地:叛逆连队2 (Battlefield: Bad Company 2) 》是EA DICE研发的第9款“战地”系列作品。它是2008年上市的同系列的游戏战地:叛逆连队的续作。两在单人游戏剧情上亦有很多交叉点。游戏仍然沿用前作的寒霜引擎,并有所改进。除了完善了代码的优化,本作在破坏效果上也有所加强,可破坏的物件由92%上升到99%。前作里不能破坏的小物件以及建筑物框架,在本作中也可以被破坏。
>>游戏类型:DirectX11第一人称射击类游戏
>>测试方式:沿同一固定路线跑完3次取平均值,Fraps计速
>>画质设定:全部最高
DX11游戏-鹰击长空2
● H.A.W.X.2
《鹰击长空2(H.A.W.X.2)》是一款结合了拟真与空战要素而成的模拟飞行游戏,玩家可驾驶多种高性能战机,在高空中进行巡逻、护航、轰炸等任务。值得一提的是,游戏中的地面场景乃参考GeoEye卫星空照图所构建而成,这项游戏与现实生活的科技结合,让玩家仿佛置身于战机的驾驶舱内,逼真的地表风貌一览无遗。
>>游戏类型:DirectX11 第一人称视角射击游戏
>>
>>画质设定:全部最高
A卡陷入尴尬境界 N卡才是真DX11
● 出乎意料的尴尬结果
我们抱着对TSMC 40nm CMP碱洗工艺的信心,在之前多篇新闻和评论分析之后完成了这篇测试文章,但是结果有点差强人意。也许是我个人太期待新工艺带给HD6800系列Barts核心的改进,而忽略了这款产品特别是HD6870已经高达900MHz的核心频率和暂时难以逾越的显存频率。
用于Radeon HD 6870的Barts核心
回忆前文所分析的HD6800系列在做工方面的特性,我们认为公版前置4+1的模组设计存在很大程度的成本考虑,毕竟这是一颗需要冲击1000-2000元市场的GPU核心。同时40nm CMP碱洗工艺目前不能提供令AMD满意的良率,所以在板卡设计方面更要小心翼翼。在目前4+1项前置供电方案下,HD6870核心可以达到1GHz左右,外站有测试可以达到1030MHz,因体质而异。
此外Barts核心的显存频率和GF100核心刚上市时遇到了同样的问题,提升非常艰难,我们猜测这和显存控制器的调试存在一定关系,当然有网友用“铅笔大法”短路电阻提高显存电压,但最终只是超到1180MHz,这个频率还没有达到我们本次测试的HD6870层级。
超 频 结 果 对 比 | ||||
核心型号 |
默认核心频率 |
超频核心频率 |
超频幅度 | 3DMark提升(P模式) |
GTX460 768MB |
675 |
875 |
29.62% | 25.46% |
GTX460 1024MB |
675 |
880 |
30.37% | 26.47% |
GTX470 |
608 |
800 |
31.57% | 28.66% |
HD6870 |
900 |
1000 |
11.11% | 6.78% |
HD6850 |
775 |
850 |
9.67% | 7.61% |
本次超频测试我们得到以上结果,其中两块GTX460我们没有挖掘最终潜力,所以都没有超越900MHz这个门槛,而GTX470在发布8个月后已经日渐成熟,可以拥有30%以上的超频幅度。两款HD6800因为额定频率和做工限制,只能在10%的超频幅度徘徊,这不得不说是本次测试的最大遗憾。
换个角度来看,如果将所有的用户体验提升都寄托在芯片频率上,所有的性能提升都寄托在半导体工艺的进步上,这肯定不是一个合理的选择。尽管有TSMC使用了新的碱洗工艺不断提升频率并平衡芯片良率,尽管Barts核心此次晶体管集成度已经下降到17亿个晶体管,但是这种工艺上的优势基本上要被耗尽了。也许放大流处理器规模是一个不错的选择,但是未来芯片内的线长问题又会不断困扰AMD。这一点我们在《AMD统一渲染架构》一文中已经做过分析。
也许2006年收购ATI是一个艰难而又不得不完成的任务,也许AMD早已仔细分析过独立显卡的市场份额和GPU的发展轨迹,并看到了Fusion架构的前景。所以从HD2000到HD6000期间,AMD在每一代产品中都选择了最小的研发代价,攻占“甜蜜点”市场将成为AMD GPU产品的主要任务。面对长期无大幅度改进的GPU架构,面对已经被自己消耗殆尽的半导体工艺余量,的确AMD目前正在经历煎熬。
无论如何,AMD在本次HD6800系列中采取提升频率的方式来换取固定单元和几何性能提升是一种可取的思路。首先精简流处理器数量,尽力缩小芯片集成度和面积,在此基础上加之TSMC 40nm CMP碱洗工艺做支撑,将HD6800系列运行频率提升到前所未有的高度,使线程分配能力和几何处理能力依靠高频的固定单元获得重要提升,进一步减弱了RV870架构的设计短板。
通过市售产品的之间的对比,尤其是在超频后状态下的产品性能PK,NVIDIA产品显然最终性能和增长性能高于竞争对手。同时NVIDIA的GeForce GTX 580产品即将面试,其更能巩固NVIDIA在真DirectX 11产品上的地位。但AMD的Radeon HD 6900即将发布,第二轮谁是真DX11显卡的对决即将拉开帷幕。
濮元恺所写过的技术分析类文章索引(持续更新) | |
8、 通用计算对决 四代N卡激战CUDA-Z | |
2、改变翻天覆地 最全Fermi架构解读 | |
3、从裸奔到全身武装 CPU功能集成之路探秘 | |
4、AMD统一渲染架构 历程回顾与评测 | |
6、别浪费你的电脑 分布式计算在中国 | 13、超越图形界限 AMD并行计算技术全面解析 |
7、显卡只能玩游戏? 10年GPU通用计算回顾 | 14、并非老马甲新穿法 HD6000改进性能揭秘 |
- 相关阅读:
- ·超震撼对决!火焰喷射器vs消防水管
//vga.zol.com.cn/558/5585729.html - ·GOC高手强强对决 怒斩14项超频世界纪录
//vga.zol.com.cn/558/5584116.html - ·价格低性能强 北影GTX960猛禽售1299元
//vga.zol.com.cn/558/5583570.html - ·专业性能 蓝宝石AMD FirePro W9100特价
//vga.zol.com.cn/558/5583219.html - ·低价格享受高性能 时下甜品级显卡推荐
//vga.zol.com.cn/557/5578964.html