1Tahiti架构HD7870震撼上市
喜欢日本动漫和赛车的读者一定看过早期风靡荧屏的动画连续剧——头文字D。在求学之余帮父亲送豆腐的藤原拓海有着非常出色的漂移技巧,因此在秋名山迎来许多对手的挑战。虽然在与京一的比赛中发动机爆缸,但经过父亲藤原文太的精心改装,一辆拥有澎湃核心的丰田AE86由此诞生......
AE86是丰田制造的一款小巧、轻量、经济型的汽车,在头文字D动画片推出之前,这款汽车很少有人关注。但该片一经播出,AE86便成为漫迷们茶余饭后的话题。动画片中AE86的核心部件(发动机)经藤原文太更换后,外形还是AE86,但不起眼的车身里面,却隐藏着恐怖的动力。
相信许多汽车迷们在看完头文字D动画片后,都梦想拥有一辆如AE86般的座驾。而在DIY界,游戏玩家们同样期待类似的显卡出现:没有高端的定位,甚至没有华丽的外表,但散热器下面却压着一颗强劲的核心。今天,这样的产品终于出现在我们面前——采用Tahiti架构设计的Radeon HD7870。
虽然AMD在媒体沟通会上一再强调,至少到第三季度,AMD不会推出任何Radeon HD8000系列产品,但从近期的动向上看,Radeon HD7000似乎内藏玄机。前期,海外已经发布了针对中低端市场的Radeon HD7000系列新品HD7790,虽然该产品已经确定不会在中国大陆上市,但在“愚人节”即将来临之际,中关村在线显卡频道还是收到了令大家为之一震的新品。下面,就让我们与读者一起揭开Tahiti架构Radeon HD7870的神秘面纱。
2Tahiti架构HD7870规格及特色一览
★ Tahiti架构Radeon HD7870规格及特色一览
AMD之前发布的Radeon HD7870均基于Pitcairn架构设计,而本次测试的Radeon HD7870则基于Tahiti架构设计(我们姑且称之为Radeon HD7870T),而旗舰级Radeon HD7970和次旗舰Radeon HD7950使用的正是该架构。因此从另一方面说,Radeon HD7870T理论上应该拥有Tahiti架构的全部特性。
显 卡 对 位 产 品 规 格 比 较 表 | ||||||
显卡型号 | 迪兰 HD7870 | Radeon HD7870 | Radeon HD7850 | Radeon HD7950 | Radeon HD7970 | Radeon HD6970 |
市场售价 | 1849 元 | 1699 元 | 1399 元 | 2099 元 | 2999 元 | * |
GPU代号 | Tahiti | Pitcairn | Pitcairn | Tahiti | Tahiti | Cayman |
GPU工艺 | 28nm | 28nm | 28nm | 28 nm | 28 nm | 40 nm |
GPU晶体管 | 43 亿 | 28 亿 | 28 亿 | 43 亿 | 43 亿 | 26.7 亿 |
着色器数量 | 1536 | 1280 | 1024 | 1792 | 2048 | 1536 |
着色器组织 | Vector ×1536 | Vector ×1280 | Vector ×1024 | Vector ×1792 | Vector ×2048 | 4D×384 |
ROPs数量 | 32 | 32 | 32 | 32 | 32 | 32 |
纹理单元数量 | 96 | 80 | 64 | 112 | 128 | 96 |
核心频率 | 925MHz | 1000MHz | 860MHz | 800MHz | 925MHz | 880MHz |
着色器频率 | 925MHz | 1000MHz | 860MHz | 800MHz | 925MHz | 880MHz |
理论计算能力 | 2.84 TFLOPs | 2.56 TFLOPs | 1.76 TFLOPs | 2.87 TFLOPs | 3.79 TFLOPs | 2.7 TFLOPs |
等效内存频率 | 6000MHz | 4800MHz | 4800MHz | 5000MHz | 5500MHz | 5500MHz |
内存位宽 | 256 bit | 256 bit | 256 bit | 384 bit | 384 bit | 256 bit |
内存带宽 | 192 GB/s | 153.6 GB/s | 153.6 GB/s | 240 GB/s | 264 GB/s | 176 GB/s |
内存类型 | GDDR 5 | GDDR 5 | GDDR 5 | GDDR 5 | GDDR 5 | GDDR 5 |
内存容量 | 2048 MB | 2048 MB | 2018 MB | 3072 MB | 3072 MB | 2048 MB |
DX版本支持 | 11.1 | 11.1 | 11.1 | 11.1 | 11.1 | 11 |
HD视频技术 | UVD 3.0 VCE | UVD 3.0 VCE | UVD 3.0 VCE | UVD 3.0 VCE | UVD 3.0 VCE | UVD 3.0 |
通用计算接口 | Stream | Stream | Stream | Stream | Stream | Stream |
Radeon HD7870T拥有1536个Shader单元,比Radeon HD7870多一组,比Radeon HD7950少一组,比Radeon HD7970少两组。后端方面,Radeon HD7870T的ROP阵列规模与旗舰级Radeon HD7970相同,均为32个;纹理单元Radeon HD7870多一组,比Radeon HD7950少一组,比Radeon HD7970少两组,而显存部分仍然由4个64bit MC进行管理,构成256bit显存位宽,与Radeon HD7870相同。
其他方面,Radeon HD7870T的默认核心/显存频率为925/6000MHz(Radeon HD7870为1000/4800MHz),支持AMD PowerTune自动超频技术,核心频率可动态提升至975MHz。显存容量为2048MB,显存带宽升至192.0GB/s(Radeon HD7870为153.6GB/s),同样支持DirectX 11.1、Open CL 1.2、以及C++ AMP。从规格不难看出,Radeon HD7870T的定位处于Radeon HD7870和Radeon HD7950之间。
★ Tahiti架构Radeon HD7870特色由六个主要部分组成:
● 基于HKMG的TSMC全新28nm制程工艺;
● 包含了几何引擎、光栅化引擎以及一级线程管理机制的前端ACE(Asynchronous Compute Engine);
● 负责处理运算任务及Pixel Shader的32个CU(Compute Unit)集群,包含在CU内部负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,二级线程管理机制以及它们对应的Shader + Unified Cache等缓冲体系;
● 负责完成Fillrate过程以及输出最终画面的ROP阵列,显存控制器MC(Memory Controller)以及PCI Express 3.0部线传输控制端;
● 全新抗锯齿——MLAA 2.0和SSAA For DirectX Based Games;
● 负责视频回放及处理的UVD 3.0单元,以及全新的负责视频编码部分的VCE;
● Eyefinity(宽域)2.0引擎。
3异步运算引擎
● 异步运算引擎
ACE全称Asynchronous Compute Engine,译为异步计算引擎。作为AMD GPU最前端的组成部分,它的实际作用其实与几何以及光栅化等图形过程并没有直接的联系。ACE位于整个GPU的最前端管理任务队列,它会将线程块规整的分发给后面的ALU团簇。ACE是所有GPU任务的起点,它的存在和表现直接关系到了GPU进行图形及通用计算任务是的效率表现。
由于ACE与几何引擎直接相连,同时也在一定程度上决定了构架的多边形搏出能力,因此我们可以笼统的把它理解成前端/几何引擎与线程管理机制的结合体。Tahiti中的Dual ACE不仅改变了RV870构架几何性能较弱的局面,更为AMD向并行处理构架的进化打开了大门。
Daul ACE首次出现于Cayman构架,区别于传统的AMD构架,Cayman拥有了第二套完整的光栅化-几何处理单元阵列,该阵列拥有Rasterizer、Hierarchical-Z以及Tessellator/Germetry等全部的前端资源体系,与原有的前端部分完全对等,并且与流水线中的线程仲裁器UTDP直接对应。
Dual ACE的价值是显而易见的,它让Cayman拥有了双倍于RV870的几何处理能力,这极大地改善了RV870在面对曲面细分等领域时的表现。同时,由于单位周期的三角形搏出能力也从1个提升到了2个,Dual ACE的出现让Crysis这样对于传统多变形输出能力有很大需求的游戏也能获益。最后,更快的光栅化处理能力带来了更快的坐标变换和像素化速度,这降低了后续流水线步骤的等待延迟,从而为最低帧表现的提升提供了帮助。
Cayman中Dual ACE的表现,让AMD看到了提升体系线程管理能力以及宏观并行度的好处,因此在Tahiti构架中,AMD对ACE进行了进一步的强化。根据AMD公布的数据,Tahiti构架拥有了4倍于Cayman的曲面细分能力,同时通用计算性能也有了长足的进步,这从侧面表明Tahiti构架的线程能力较之Cayman有了更进一步的提升。
4ALU团簇:Compute Unit
● ALU团簇:Compute Unit
Tahiti构架最大的改进来自ALU集群部分。与传统AMD构架的VLIW结构ALU团簇不同,Tahiti构架的ALU集群撤消了来自超长字节指令的限定,所有ALU全部以SIMD的形式来完成吞吐,不再需要打包和解包的过程。
在Tahiti构架中,ALU团簇的名称从VLIW SIMD变成了Compute Unit,名称的改变不仅标志着功能及用途的变迁,更暗示了内部结构的方向性变化。Tahiti拥有32个CU单元,CU内部包含4组SIMD CORE,每组SIMD CORE由16个标准Vector ALU构成,所以Tahiti的一个CU单元拥有64个Vector ALU,32个CU单元合计拥有2048个Vector ALU。
除了负责浮点吞吐的SIMD CORE之外,Tahiti构架的每个CU单元还拥有在一个Scalar Unit,Scalar单元中包含Int ALU单元,可以用来处理整数指令以及特殊函数。另外,对线程效率至关重要的原子操作(Atomic)也在该单元中执行。
运算单元之外,Tahiti构架的每个CU还绑定了由Branch和Scheduler构成的二级线程控制机制,以及一个完整的Texture Array,Texture Arroy的作用与传统AMD构架中的TMU基本相同,包含了完整的Texture Fetch Load/Store Unit以及Texture Filter Unit。
由此不难看出,Tahiti构架CU单元的结构在逻辑层面上已经与Fermi构架的SM单元和Larrabee的Vector Unit存在极大的相似性。三者均由浮点吞吐部分(Tahiti的Vector ALU团簇,Fermi的SP单元集群,Larrabee的Vector集群),整数、特殊函数及原子操作部分(Tahiti的Scalar Unit,Fermi的SFU,Larrabee的Scalar pipeline)以及二级线程控制机制(三方的Scheduler等)。除此之外,CU还与Fermi的SM一样拥有完整的Texture Arroy,甚至每一个运算单元(Tahiti的Vector ALU,NVIDIA的SP单元)都拥有完全相同的4K寄存器。
一个CU/SM/Vector Unit就是一个独立的处理单元,能够面对一个标准的指令集群或者说线程块,也就是AMD的wavefront以及NVIDIA的warp。Tahiti的CU能够在一个周期内处理一个64线程的wavefront,这与Fermi一个周期处理一个32线程的warp是相同的,但AMD目前上不存在类似half warp的线程块子划分机制。
Tahiti支持WinZip最新版带来的Open CL加速
更新之后的CU单元在计算能力和效率方面有了长足的进步,不仅令Compute Shader处理能力大幅提升,进而提升了GPU在DirectX 11环境下的图形性能,而且在通用计算领域也获得了更加广阔的前景和更多样化的发展可能。
5统一缓冲体系
● 统一缓冲体系
Tahiti另一个巨大的改进,来自缓冲体系的大幅调整。Tahiti构架的缓冲体系不仅对原有的GDS以及LDS等Shared资源进行了调整和重新布置,更引入了非常重要的多级unified cache。
不同于传统的被所有VLIW CORE共享使用的整体GDS,Tahiti构架的每个CU拥有独立的32K GDS(Golbal Data Share),这个尺寸完全符合微软在DirectX 11中的硬性规定。其中可以划分出16K作为L1 Data cache,Tahiti构架的多级cache体系属于包含式结构,L2保存了全部的L1数据且能够允许L1数据进行回写,结合AMD的官方描述,我们认为在宏观范围内Tahiti的Shared存在32K GDS+0K L1 Data cache+16K L2 Data cache或者16K GDS+16K L1 Data cache两种组合方式。
除了GDS+L1共享构成的以及缓冲体系,Tahiti构架的每个CU还拥有独享的LDS(Local Data Share),LDS在RV770以后的AMD构架中均有出现并为所有VLIW CORE共享,而此次在Tahiti中,LDS与GDS一样被打散到了每一个CU中,变成了专享的二级补充Shared。
除了一级缓冲和Shared,Tahiti的CU单元还拥有共享的L1 Instruction cache和Kernel cache,每4个CU共享16K的L1 Instruction cache和32K的Kernel cache。
最后,Tahiti构架拥有沟通上级缓冲与显存的L2 Data cache,L2 cache与MC一一对应,因此Tahiti共拥有6组合计768K的L2 cache。L2 cache面向所有CU中的单元开放,ALU可以用它缓冲数据,TMU也可以用它充当Texture cache。
整体来说,Tahiti的缓冲体系与Fermi存在极大的相似度,无论是可共享/切换的一级Shared/L1机制,还是面向所有单元并可以同时充当Texture cache的L2,Tahiti与Fermi在缓冲体上都已经处在了一致的状态。两者最大的区别,在于Tahiti采用了指令和数据缓存分离的方式,同时在L1与Shared的切换方式及尺寸上与Fermi存在差异。相对来说,Tahiti的切换及分配方式更加灵活多样,但同时也对cache的操作切换控制提出了更高的要求。
6全新的PRT技术
● 全新的PRT技术
Tahiti构架全面引入了一种新的超大尺寸材质处理技术,这便是全新出现的PRT(Partially Resident Textures)。
PRT技术类似之前在ID Tech5中出现过的MegaTexture技术,他们都是将整块大尺寸材质分割成小块,然后按照材质的使用概率对其进行不同位置的存放。在预处理mipmaps的过程中,GPU会根据mipmaps的状况来对材质整体使用情况进行预测和判断,并从材质库中直接进行抓取。如果这个抓取动作快速拾取的材质“命中”的通过mipmaps进行的判断,则Texture会直接进行快速贴图操作。
如果被拾取的材质并未“命中”,整个GPU体系将会对接下来进行的工作进行预测并维持整个流水线的动作,贴图需求将以常规的形式被Texture Array加以满足。直到下一帧画面再次出现通过mipmaps进行判断的时候为止。
PRT技术可以借由上述这个带有分支预测性质的动作过程大幅加快材质操作的速度,让体系具备实现32TB级别大小的材质操作的能力,同时还可以大幅降低Texture Array对材质进行操作时产生的延迟激增以及“塞车”现象。
7全新的MLAA 2.0以及SSAA
● 全新的MLAA 2.0以及SSAA抗锯齿特性
我们知道与Radeon HD7850/HD7870一同发布的还有AMD全新的抗锯齿特性——MLAA 2.0和SSAA For DirectX Based Games,该特性在Tahiti架构Radeon HD7870中同样被很好地继承下来。
MLAA是AMD开发的基于通用计算完成的抗锯齿模式,该模式允许ALU以通用计算的形式对物体边缘多边形进行颜色混合处理,已达到边缘柔化和抗锯齿的目的,NVIDIA的FXAA在功能上与之类似。全新的MLAA2.0带来了更加高级的边缘形态算法,能够允许显卡完成更加锐利的抗锯齿输出表现。该项功能将于新版本催化剂中获得实现。
基于稀疏网格的SSAA
与MSAA相比,SSAA(SuperSample Anti-Aliasing,超级采样抗锯齿)能过获得更加优秀的抗锯齿效果,但性能损耗也更为巨大。SSAA for DirectX Based Games允许支持DirectX 9及以上的大多数游戏在AMD显卡环境下以稀疏网格(Sparse Grid)的方式来实现SSAA过程,在保证画面质量的同时将SSAA的性能损耗降到了可以接受的范围内。
8新各向异性过滤及DX11.1支持
● 无损各向异性过滤及DirectX 11.1支持
在Cayman发布时,AMD曾宣称自己的各向异性过滤算法是世界上最好的算法,不仅性能近乎无损而且可视角度方面的表现也完美无缺。但事后有大量媒体证明,Cayman的AF实际上在部分场合会导致LOD错误、闪烁等问题,AMD于Cayman发布后也承认了该方面的问题。
在此次的HD7970中,AMD引入了一种全新的非角度依赖算法,在解决Cayman纹理闪烁问题的同时提供了更好的AF性能表现。
通过新算法的引入,HD7970中的AF重写了整个内核,AMD为其引入了全新的自动调用机制,并承诺不会再出现纹理闪烁以及波浪状扭曲等错误,同时还承诺了新的AF算法将真正实现全角度有效。
除此之外,Tahiti构架的另一个重要特性在于DirectX 11.1的支持,DirectX 11.1中包含了DP Shader等诸多对未来图形化过程有深远影响的更新,可以说是一个具有开端意义的API升级。HD7970对DirectX 11.1特性提供了全面的支持,用户可以在未来快速的进入全新API的应用环境,获得全新的图形体验。
9VCE视频编码处理引擎
● VCE视频编码处理引擎
VCE技术是AMD在Tahiti构架中引入的另一个重要改进,相较于UVD3.0的原地踏步,VCE技术的出现可以说是Tahiti构架在视频相关方面最引人注目的亮点。
VCE技术从本质上来说是一组专门负责编码操作的硬件电路,该单元在操作方式上类似Intel Quick Sync Video高速视频编码处理电路,都是通过固定单元来高速完成视频编码过程的Preprossing以及Encode过程,这也是整个视屏编码过程中最为消耗系统运算能力的部分。以专门的电路来完成类似的操作不仅能够提升处理速度,同时还可以大幅降低处理过程所带来的功耗压力。
VCE与Quick Sync Video最大的不同,同时也是VCE意义最重大的设计,来自它的异构式处理结构。VCE对视频编码的操作分为两种模式,在Full Mode下,VCE会以自身的硬件单元来完成Preprossing以及Encode的全部过程。而Hybird Mode下,VCE单元会调用Tahiti构架丰富的ALU资源来更高速的完成Preprossing过程,以VCE自身的硬件单元来完成Encode过程。在性能最理想的状态下,VCE可以实现1080P分辨率视频的60帧速率实时编码。
VCE技术的意义是巨大的,除了在GPU单元中第一次引入了低功耗的专用高速视频编码处理电路之外,VCE体现了AMD多年来一直强调并不断付诸实施的异构计算操作结构。Fusion的精髓便是异构处理和加速,这种整体思路正在逐步融入AMD的每一个产品线甚至每一个适合的产品中。VCE技术的出现,不仅进一步实践了异构处理的想法,更向我们表达了AMD正在逐渐恢复的坚定的执行力。
10Eyefinity(宽域)2.0技术
● Eyefinity(宽域)2.0技术
民用低成本多屏拼接的Eyefinity技术一直是AMD的长处。在HD7970中,AMD将Eyefinity技术升级到了2.0版本,新的Eyefinity宽域技术为我们带来了更多富有特色的输出方案和视觉体验。
在Eyefinity 2.0技术中,AMD首次将多屏输出技术和HD3D立体技术结合在了一起,HD7970的用户仅需使用一块显卡便可以在多屏系统上同时体验立体游戏和电影。NVIDIA在SLI系统中虽然早就实现了3D Vision,但始终需要至少两块显卡才能完成输出工作。
新的Eyefinity 2.0率先采用了DisplayPort 1.2认证接口和HDMI 1.4a规范,在传输带宽和速度上能够通过更高的速度,为多屏3D应用提供更好的条件。AMD提供的HD3D技术是开放的,这让更多的厂商能够参与到AMD的HD3D立体显示技术当中,AMD单卡通过DisplayPort 3D显示器可以单卡实现三屏Stereo 3D效果。
Eyefinity2.0最重大的更新来自分辨率的多样化及组建屏幕要求的降低,Eyefinity1.0至少需要3台分辨率一致的显示器才能组建多屏输出,这要求很多用户采购新显示器,组建成本并不低。而在Eyefinity2.0中,AMD允许不同尺寸显示器组成一套Eyefinity多屏显示系统,这进一步降低了多屏输出的成本。但受限于现在的游戏输出技术,Eyefinity2.0在多个不同尺寸显示器组合的方案中还存在部分场景及物体显示不全等问题,相信随着技术的不断进步,这些问题终将得到解决。
音频输出能力的改进也是Eyefinity2.0的革新之一,HD7970支持独立数字多点音频(Discrete Digital Multi-Point Audio),简称DDM Audio。Eyefinity1.0只能输出一路音频信号,而HD7970显卡已经可以实现独立多路音频输出了,这样多屏看电影或者玩游戏时,每个屏幕都可以进行独立的音画输出。
11Tahiti架构首款HD7870拆解介绍
● Tahiti架构首款Radeon HD7870拆解介绍
首款到达中关村在线显卡频道的Radeon HD7870T显卡为迪兰HD7870 酷能+2G Extreme。该显卡与Pitcairn架构Radeon HD7870究竟有哪些不同之处,接下来就开始我们的拆解介绍:
迪兰HD7870 酷能+2G Extreme采用28nm制程工艺,GCN架构设计的Tahiti图形核心,核心面积365 mm2。该显卡拥有1536个流处理器,32个ROPs单元和96个纹理单元,完美支持DirectX 11.1游戏特效、CrossFire双卡交火等技术。
迪兰HD7850酷能+ 2G Extreme非公版PCB正面
迪兰HD7850酷能+ 2G Extreme非公版PCB背面
迪兰HD7870 酷能+2G Extreme采用非公版PCB设计,供电部分采用核心与显存独立的4+2相数字式PWM供电方案,元器件采用全固态电容与亚铁盐芯电感,辅以双6pin外接供电接口,为显卡的稳定运行提供了充足的保障。
迪兰HD7870 酷能+2G Extreme搭载海力士GDDR5高速显存颗粒,显存容量2048MB,显存位宽256bit,显存带宽192.0GB/s,显卡的默认核心/显存频率为925/6000MHz,且支持AMD PowerTune自动超频技术,核心频率可动态提升至975MHz。
迪兰HD7870 酷能+2G Extreme搭载自主研发设计的PCS+散热系统。92毫米PWM自能温控风扇可以根据显卡运行状态自主调节转速,在散热效能和噪音控制方面取得了良好的平衡;一根8mm S形热管加两根6mm S+U形热管全面覆盖并直接接触图形核心,有效增加了散热器的散热效率。
迪兰HD7870 酷能+2G Extreme采用DVI-D+HDMI+双Mini DisplayPort输出组合,支持市面上绝大多数显示器的接口需要。同时该显卡支持单卡多屏输出技术,满足了不同用户对显卡的不同使用需要。
12测试平台软硬件环境一览
● 测试平台硬件环境一览
为保证测试能够发挥显卡的最佳性能,本次Radeon HD7870T首发测试平台由Intel酷睿i7-3970X处理器、技嘉X79芯片组主板、芝奇4GB DDR3-1600×4四通道内存组建而成。详细硬件规格如下表所示:
测 试 平 台 硬 件 环 境 | |
中 央 处 理 器 | |
Intel Core i7-3970X | |
(6核/12线程/3.5GHz/15MB L3) | |
散 热 器 | |
Intel RTS2011LC | |
(原厂水冷散热器 / 选配件) | |
内 存 模 组 | |
G.SKILL RipjawsX DDR3-1600 16GB | |
(SPD:11-11-11-28-1T) | |
主 板 | |
GIGABYTE GA-X79-UD7 | |
(Intel X79 Chipset) | |
硬 盘 | |
Seagate Barracuda 1TB | |
(1TB/7200RPM/32MB缓存/SATA3) | |
电 源 | |
NERMAX 白金冰核 1500W | |
(CSCI Platinum 80Plus/ 1500W) | |
显 示 器 | |
DELL UltraSharp 3008WFP | |
(30英寸LCD / 2560×1600分辨率) |
● 测试平台软件环境一览
为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 7正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
操 作 系 统 及 驱 动 | |
操作系统 | |
Windows 7 Ultimate RTM SP1 | |
(64bit / 版本号7601) | |
主板芯片组驱动 | |
Intel Chipset Device Software | |
(WHQL / 版本号 9.2.3.1022) | |
AMD显卡驱动 | |
AMD Catalyst | |
(Beta / 版本号 13.3 Beta3) | |
NVIDIA显卡驱动 | |
NVIDIA GeForce GTX | |
(Beta / 版本号 314.21) | |
桌面环境 | |
Windows 7 Ultimate RTM SP1 | |
2560×1600_32bit 60Hz |
在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用Fraps记录平均帧数来衡量性能,数值同样越高越好。
特别说明:为保证测试过程中AMD/NVIDIA驱动程序特效设置完全相同,公平起见,我们调整了AMD催化剂驱动的AI控制功能,将镶嵌等级从驱动默认的“AMD优化”改回“应用程序控制”。在这样的设置下,AMD显卡才会在游戏中使用正确的游戏自身设置的曲面细分等级,而不是AMD预设的更低的曲面细分等级。
13理论性能测试:3DMark FireStrike
● 理论性能测试:3DMark FireStrike
于北京时间2013年2月5日推出的新3DMark,采用全新界面设计,除了测试分数,还会展现每个场景测试期间的实时曲线,全程记录帧率、CPU温度、GPU温度、CPU功耗。新3DMark取消了传统的E、P、X模式,取而代之的是根据负载不同所推出的三个场景,其中FireStrike专为基于DirectX 11显卡搭建的高端游戏平台,而CloudGate则支持基于DirectX 10环境的主流硬件,IceStorm则支持入门级DirectX 9设备、手机、平板电脑等等。
通过3DMark FireStrike理论性能测试可以看出,在Performance模式下,Radeon HD7870T测试成绩与Radeon HD7950基本相同;而在Extreme模式下,虽然测试成绩基本相同,但Radeon HD7870T却小幅领先于Radeon HD7950。
14理论性能测试:3DMark 11
● 理论性能测试:3DMark 11
PC游戏随Windows 7的发布进入DirectX 11时代,众多DirectX 11显卡早已摩拳擦掌上阵厮杀,却迟迟没有一个权威性的基准测试软件来衡量游戏显卡DirectX 11性能的高低。终于,DirectX 11时代的3DMark 11来到大家面前。3DMark 11使用原生DirectX 11引擎,测试场景包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DirectX 11特性。
通过3DMark 11理论性能测试可以看出,在Performance模式下,Radeon HD7870T成绩超越Radeon HD7950,领先幅度约为4.7%;在Extreme模式下,Radeon HD7870T与Radeon HD7950成绩基本相同,并以26分的优势小幅领先。
15DX11性能测试:Heaven Benchmark 3.0
● DirectX 11性能测试:Heaven Benchmark 3.0
Heaven Benchmark 3.0是由俄罗斯Unigine游戏公司开发设计的一款Benchmark程序,该软件采用类似阿凡达的悬浮岛场景,其中龙雕塑运用了细分曲面技术,还有岛上的路径和房子的砖块。Heaven Benchmark 3.0支持DirectX 9、DirectX 10、DirectX 11与OpenGL 3.2 API,通过23个场景测试最终得出显卡的实际效能。
通过Heaven Benchmark 3.0理论性能测试可以看出,Radeon HD7870T成绩再次超越Radeon HD7950,领先幅度约为1.4%;同时,与Pitcairn核心Radeon HD7870性能差距更为明显,领先幅度约为7.7%。
16DX11性能测试:Heaven Benchmark 4.0
● DirectX 11性能测试:Heaven Benchmark 4.0
Heaven Benchmark 4.0是一款专门测试DirectX 11效率的软件,由俄罗斯Unigine游戏公司自主研发的引擎设计。该软件拥有类似阿凡达的悬浮岛场景,其中龙雕塑运用了细分曲面技术,抱括岛上的路径和房子的砖块等23个场景的测试得出显卡的最终实际效能,并通过DirectX 11环境带来很强的真实感。
通过Heaven Benchmark 4.0理论性能测试可以看出,Radeon HD7870T成绩同样领先Radeon HD7950,领先幅度约为4%;且与Pitcairn核心Radeon HD7870差距更为明显,领先幅度约为7.1%。
17DirectX 11游戏测试:《孤岛危机3》
《孤岛危机3》是《孤岛危机》的最新续作,游戏采CryENGINE 3引擎所制作,其卓越的画面表现以及精彩的剧情相信已无需多言。作为硬件杀手的第三代,只支持DirectX 11的Crysis3 PC版再次将游戏的画面精美程度和硬件需求提升到了新的高度。
通过DirectX 11游戏《孤岛危机3》测试可以看出,在2560×1600分辨率下,Radeon HD7870T成绩与Radeon HD7950基本相同,并且领先于Pitcairn核心Radeon HD7870,领先幅度约为9.4%;在1920×1200分辨率下,Radeon HD7870T成绩同样与Radeon HD7950基本相同,领先Pitcairn核心Radeon HD7870幅度高达11.1%。
18DirectX 11游戏测试:《孤岛危机2》
《孤岛危机2》是《孤岛危机》的续作,游戏采用CryENGINE 3引擎制作。《孤岛危机2》在游戏内容上与一代也有很大变化,已经从秘密的丛林作战转向了公开、大规模的现代城市战争。故事发生在距一代3年后的2023年,外星人在地球上的大片区域挑起了战争,各大城市都遭到攻击,人口锐减,玩家将要进行捍卫地球的末日战争。
通过DirectX 11游戏《孤岛危机2》测试可以看出,在2560×1600分辨率下,Radeon HD7870T的平均帧数与Radeon HD7950基本相同,领先Pitcairn核心Radeon HD7870的幅度约为7.1%;在1920×1200分辨率下,Radeon HD7870T平均帧数略微落后于Radeon HD7950,同时与Pitcairn核心Radeon HD7870的性能差距约为7.6%。
19DirectX 11游戏测试:《古墓丽影9》
《古墓丽影9》将讲述劳拉的首次冒险之旅,主角劳拉·克劳馥的年龄被设定在21岁,那时的她还只是一名刚出茅庐的新人,经验欠缺。随着游戏剧情的发展,玩家将与劳拉共同成长,获得新的武器和道具并习得新技能。在冒险的小岛上,玩家可以在营地对道具进行组合,有些特定区域就需要特定道具和技能才能通过。岛上的各个营地之间可以快捷传送,玩家无需长途跋涉。而除了劳拉外还将有其他角色出现在岛上。
通过DirectX 11游戏《古墓丽影9》测试可以看出,在2560×1600分辨率下,Radeon HD7870T在成绩上领先Radeon HD7950,领先幅度约为4.1%;在1920×1200分辨率下,Radeon HD7870T的平均帧数与Radeon HD7950基本相同,并且略微领先。
20DirectX 11游戏测试:《杀手5:赦免》
● DirectX 11游戏测试:《杀手5:赦免》
《杀手5:赦免》采用IO Interactive自主研发的冰川2(Glacier 2)引擎制作,游戏内容都是在引擎下实时进行反馈的,所有动作都是即时生成的。新作主要场景发生在芝加哥,名为代号47的主角在本作中将更加灵活,更好控制。他将可以攀在悬崖边,还可以保持平衡,游戏融入了掩护系统,挟持人持的功能回归。
通过DirectX 11游戏《杀手5:赦免》测试可以看出,在2560×1600分辨率下,Radeon HD7870T成绩落后于Radeon HD7950;在1920×1200分辨率下,Radeon HD7870T的平均帧数同样落后于Radeon HD7950,但领先Pitcairn架构Radeon HD7870的幅度却高达12.4%。
21DirectX 11游戏测试:《失落星球2》
● DirectX 11游戏测试:《失落星球2》
《失落星球2》采用CAPCOM公司原创引擎MT Framework的最新版VER 2.0进行开发。相比上一代,游戏世界的表现将更加细致和美丽。变化不仅仅是画面上的,《失落星球2》将会在前作玩家要求基础上追加大量全新要素,新场景、新角色、新武器自然不必多说,角色的动作也比前作更加丰富多彩。
通过DirectX 11游戏《尘埃3》测试可以看出,无论2560×1600分辨率,还是1920×1200分辨率,Radeon HD7870T的平均帧数均与Radeon HD7950基本相同,且Radeon HD7870T在两种分辨率下均领先于Pitcairn架构的Radeon HD7870。
22DirectX 11游戏测试:《尘埃3》
《尘埃3》是由Codemasters制作发行的一款赛车竞速单机游戏,《尘埃3》采用与《F1 2010》同样的Ego引擎,拥有更加拟真的天气系统及画面效果。游戏将包含冰雪场景、动态天气、经典的赛车、分屏对战、party模式、开放世界、更多真实世界中的赞助商和车手等特点。
通过DirectX 11游戏《尘埃3》测试可以看出,与《失落星球2》相同的,Radeon HD7870T无论在2560×1600分辨率,还是1920×1200分辨率下平均帧数均与Radeon HD7950基本相同,并且略微领先,Pitcairn架构Radeon HD7870已经被彻底打败。
23DirectX 11游戏测试:《地铁2033》
● DirectX 11游戏测试:《地铁2033》
《地铁2033》由乌克兰4A游戏工作室开发,采用4A游戏引擎,PC版支持NVIDIA PhysX物理特效。2013年,由于大面积的核战,导致几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所,人类文明进入新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。
在DirectX 11游戏《地铁2033》测试中,在2560×1600分辨率下,Radeon HD7950以不到1帧的平均帧数稍微领先Radeon HD7870T;而在1920×1200分辨率下,Radeon HD7950在平均帧数上却与Radeon HD7870T相差无几。
24DirectX 11游戏测试:《蝙蝠侠》
● DirectX 11游戏测试:《蝙蝠侠:阿克汉姆之城》
蝙蝠侠:阿克汉姆之城之城(Batman: Arkham City)是2009年最佳动作游戏《蝙蝠侠:阿甘疯人院》的续作,由华纳兄弟出品,该作由Rocksteady工作室负责开发,世界架构仍然建立在《阿克汉姆疯人院》的气氛上,不过这次上升至阿克汉姆之城——高谭市内戒备森严的,关押了大量暴徒的监狱之中。新作汇集了众多明星参与的配音阵容以及蝙蝠侠中的极度凶残的恶棍,并改进和加强了一游戏特点,让玩家们拥有像《蝙蝠侠:黑暗骑士》一般的终极游戏体验。
Radeon HD7870T在DirectX 11游戏《蝙蝠侠:阿甘之城》中的表现并不出彩,通过该项测试可以看出,Radeon HD7950无论在2560×1600分辨率还是1920×1200分辨率下均领先Radeon HD7870T,领先幅度分别为4.7%和5.5%。
25DirectX 11游戏测试:《无主之地2》
《无主之地2》为一款RPG风格合作FPS游戏,作为《无主之地》的续作,这款卡通渲染风格的二代游戏可以让玩家仍然扮演来自前作的自定义英雄,同时引入了名为“圣安德列斯风格”的升级系统。并且该作取消在线多人模式,支持合作模式。
而在DirectX 11游戏《无主之地2》测试中,Radeon HD7870T优势尽显,无论在2560×1600分辨率还是1920×1200分辨率下均领先于Radeon HD7970,领先幅度分别为6.2%和5.9%,而Pitcairn架构Radeon HD7870已经被彻底甩在后面,性能差距过于明显。
26Tahiti架构HD7870温度/功耗测试
通过前面的测试可以看出,采用Tahiti架构设计的Radeon HD7870在性能上有着非常明显的优势,大部分测试中的平均帧数均领先于同架构的次旗舰产品Radeon HD7950,而Pitcairn架构Radeon HD7870在性能上已毫无任何优势可言。那么Tahiti架构Radeon HD7870在温度和功耗方面的表现又如何呢,下面我们就一起来看下。
● Tahiti架构Radeon HD7870温度测试
通过温度测试可以看出,Radeon HD7870T的待机温度与Pitcairn核心Radeon HD7870基本相同,而满载温度却比Pitcairn核心Radeon HD7870低3℃,这与非公版热管散热器更好的散热效能不无关系。
● Tahiti架构Radeon HD7870功耗测试
Tahiti架构的功耗劣势再次显现出来,通过功耗测试可以看出,采用Tahiti架构设计的Radeon HD7870无论待机功耗还是满载功耗均要高出Pitcairn架构Radeon HD7870不少,看来用户要在性能和功耗两个方面进行取舍了。
27Tahiti架构HD7870超频测试
● Tahiti架构Radeon HD7870超频测试
通过一番调整,我们使用Catalyst驱动自带的超频工具成功将迪兰HD7870酷能+ 2G Extreme的频率超至1200/6000MHz,并稳定通过3DMark 11和3DMark FireStrike测试。那么超频后的迪兰HD7870酷能+ 2G Extreme性能表现究竟如何,下面我们就一起来看下。
通过该项测试可以看出,Radeon HD7870T在超频至1200/6000MHz后,已将Radeon HD7950远远甩在身后,性能直逼公版Radeon HD7970。而在3DMark 11 Performan测试环节,Radeon HD7870T以9484分的成绩超越Radeon HD7970(9253分),实力不容小视。
28测试总结:中高端显卡市场新的选择
● Tahiti架构Radeon HD7870测试总结
至此,Tahiti核心Radeon HD7870的测试阶段就正式告一段落。说实话,测试成绩是我们之前没有想到的。虽然Radeon HD7870T采用与Radeon HD7950/HD7970相同的Tahiti架构,但规格较Radeon HD7950减少一组,较Radeon HD7970减少二组,但通过测试可以看出,Radeon HD7870T大部分的测试成绩均超过Radeon HD7950,并将Pitcairn架构Radeon HD7870远远甩在身后,看来Tahiti核心加默认925/6000MHz的高频率占了绝对的优势。同时,与Pitcairn架构Radeon HD7870不同的是,Radeon HD7870T拥有Tahiti核心的全部优势,特别是PowerTune自动超频技术,让Radeon HD7870T在性能和功耗上较Radeon HD7870有了更好的平衡。
● Tahiti架构功耗劣势再次显现
虽然Radeon HD7870T的性能表现令我们意外,但Radeon HD7870T的功耗表现却在意料之中,Tahiti核心在温度和功耗上的劣势再次显现。通过前面的测试可以看出,虽然Radeon HD7870T的规格较Radeon HD7950减少一组,但温度和功耗却丝毫没有降低(难怪Radeon HD7870T没有公版产品,看来只有非公版散热器才能搞得定了)。
● Radeon HD7870T将成为中高端显卡市场新的选择
根据Radeon HD7870T的参数,我们可以看出该显卡的定位在Radeon HD7870和Radeon HD7950之间,但绝大部分性能却超越Radeon HD7950。通过前面的测试也可以看出,部分游戏的测试成绩超过GeForce GTX 660Ti,性能直逼GeForce GTX 670。虽然首发的只有迪兰HD7870酷能+ 2G Extreme一款产品,但1849元的零售价格确实诱人,中高端显卡市场将会掀起新一轮的A/N之争。
● Radeon HD7950何去何从?
高于公版Radeon HD7950的性能,低于公版Radeon HD7950的售价,非公版品质更高的元器件和效能更好的散热器,很难想象这样一款产品为什么会出现,但是这样的产品确实出现了,而且与原本的定位并不相符,难道Radeon HD7950要提前退出中高端市场?或者AMD显卡新一轮的降价热潮会提前来临?目前官方还没有任何的消息,我们只能继续期待了。
迪兰HD7870酷能+2G Extreme为中国大陆首款,也是唯一一款采用Tahiti架构设计的Radeon HD7870产品。迪兰HD7870酷能+2G Extreme目前仅在京东商城销售,对该显卡感兴趣的读者可点击链接进入产品页面:http://www.360buy.com/product/807050.html
29迪兰HD7870 酷能+ 2G Extreme详细参数
Radeon HD 7870并非是一个新型号,但是使用Tihiti图形处理器版本确是新鲜,我们知道Tihiti是用于Radoen HD 7900系列产品,此次通过缩减规格用于Radeon HD 7870,势必会增加这个型号的竞争力,那么它的性能几何?让我们通过详细的测试来解读这款产品。
推荐经销商