1迟来的王者
它是一位的备受关注的“王者”。尽管它的对手发布于357天前,但它仍旧是一张A饭们翘首企盼的旗舰显卡。它是一张被AMD定性为“最快,最强”的旗舰卡皇。
它是世人瞩目的双子皇帝:HD7990。
在几经cancel传闻之后,2013年4月24日北京时间下午1点,AMD终于正式发布了Tahiti时代的A卡卡皇——Radeon HD 7990。在距离Tahiti架构首次公布近两年,距离首款Tahiti架构单芯旗舰Radeon HD 7970发布一年零四个月之后,这款单卡双芯产品最终在形式上补完了Tahiti家族的全部重要成员。 即便算上Radeon HD 7970 GHz Edition,AMD产品线的单卡性能界限也已经有10个月没有任何拓展了。Radeon HD 7990究竟拥有怎样的性能表现呢?在接下来的测试中,我们将会为您带来这个问题的答案。 如果您想参与Radeon HD 7990的预购活动,请点击此处。
2HD7990规格一览
● HD7990规格一览
同Radeon HD 7970一样,Radeon HD 7990基于Tahiti图形构架,它集成了两颗完整规格的低功耗HD7970芯片,所以拥有86亿的晶体管规模。其运算资源总量因为这种叠加而提升到了4096个ALU,Texture Fetch Load/Store Unit则提升至恐怖的1024个,Texture Filter Unit增加到了256个,构成后端的ROP为64个。两颗芯片的形式也为它带来了共计12个64bit双通道显存控制器组合的384bit*2显存控制单元以及容量达3072MB*2的显存体系。
HD 7900 显 卡 对 位 产 品 规 格 比 较 表 | |||||
产品名称 | Radeon HD7990 | Radeon HD7970 | GeForce GTX690 | GeForce GTX680 | GeForce GTX TITAN |
市场定价 | 7999元 | 3399元 | 7999元 | 3999元 | 7999元 |
GPU代号 | Tahiti | Tahiti | GK 104 | GK 104 | GK 110 |
GPU工艺 | 28nm | 28nm | 28nm | 28nm | 28nm |
GPU晶体管 | 86 亿 | 43 亿 | 71 亿 | 35.5 亿 | 71 亿 |
着色器数量 | 4096 | 2048 | 3072 | 1536 | 2688 |
着色器组织 | Vector×4096 | Vector×2048 | 1D×3072 | 1D×1536 | 1D×2688 |
ROPs数量 | 64 | 32 | 64 | 32 | 48 |
纹理单元数量 | 256 | 128 | 256 | 128 | 224 |
核心频率 | 1000 MHz | 925 MHz | 915 MHz | 1006 MHz | 837 MHz |
着色器频率 | 1000 MHz | 925 MHz | 915 MHz | 1006 MHz | 837 MHz |
理论计算能力 | 4.09 TFLOPs×2 |
3.79 TFLOPs | 2.81 TFLOPs×2 |
3.09 TFLOPs | 4.5 TFLOPs |
等效内存频率 | 6000 MHz | 5500 MHz | 6008 MHz | 6008 MHz | 6008 MHz |
内存位宽 | 384 bit | 384 bit | 256 bit | 256 bit | 384 bit |
内存带宽 | 288 GB/s | 264 GB/s | 192.3 GB/s | 192.3 GB/s | 288.4 GB/s |
内存类型 | GDDR 5 | GDDR 5 | GDDR 5 | GDDR 5 | GDDR 5 |
内存容量 | 3072 MB×2 | 3072 MB | 2048 MB×2 | 2048 MB | 6144 MB |
DX版本支持 | 11.1 | 11.1 | 11 | 11 | 11 |
HD视频技术 | UVD3.0+VCE | UVD3.0+VCE | PureVideo HD+NVENC | PureVideo HD+NVENC | PureVideo HD+NVENC |
通用计算接口 | Stream | Stream | CUDA | CUDA | CUDA |
Radeon HD 7990的默认核心及显存运行频率为1000/6000MHz,核心频率可以通过AMD Boost技术动态调节至950MHz,显存带宽288GB/S。拥有4.09TFlops*2的单精度浮点运算能力以及1.02TFlops*2的IEEE双精度浮点运算能力。
Tahiti构架
与之前的Radeon HD 7970相比,Radeon HD 7990无论从架构还是从制造性层面来讲均没有任何区别。除了更高的频率、默认电压以及更低的功耗之外,最主要的一点改进来自Radeon HD 7970 GHz Edition上加入的AMD Boost功能,接下来就让我们一起来看一看AMD Boost功能究竟有怎样的特点吧。
3控耗功臣——AMD Boost
● 控耗功臣——AMD Boost
伴随着NVIDIA的GeForce GTX 680的发布,GPU Boost功能首次出现在了人们面前。该项技术可以透过动态分析GPU实时负载情况,以实时调节GPU默认运行频率的方式在TDP上限之内尽可能的抬升显卡的运行性能。由于存在TDP上限的限制,这种动态调节能够在保证用户获得更多性能的同时维持显卡的安全稳定运行。
作为最主要的改进,AMD在HD 7970 GHz Edition中同样引入了名为“AMD Boost”的GPU频率动态调节机制,但与NVIDIA的GPU Boost完全不同,AMD Boost的作用并不是提升显卡性能,它的作用是通过降频来保护GPU的运行安全。
相比性能挖掘,AMD版本的Boost技术更接近一个高负载保护机制
AMD Boost功能基于改进型的Power Tuner,AMD在新HD 7900系列,包括Radeon HD 7970 GE和Radeon HD 7950 BE的BIOS中加入了新的一档P-State(运行频率段位通称,并非官方命名),该档P-State对应新HD 7900的默认运行频率以及默认运行电压,在此基础上又添加了将默认频率降低50MHz和并使用更低电压的P-State段位。在正常状态下,运行游戏应用以及测试程序所产生的负载如果未达到显卡功耗设计上限,显卡就会维持最高档P-State。当某些特定的游戏以及测试程序,比如Furmark导致显卡的运行功耗超过设计上限时,AMD Boost功能会通过Power Tuner实时的将显卡的默认运行频率和电压直接拉回到低位,同时降低GPU占有率。
AMD Boost实际游戏GPU状态(HD7950 BE)
简单来说,NVIDIA GPU Boost技术的目的和结果是在需要时在安全范围内提升性能,它会在显卡安全时实时动作,而AMD Boost技术的目的和结果则是在必要时通过降低性能来保证显卡处于安全范围内,进而降低整卡的实时运行功耗和温度。它会在显卡处于高负载时实时动作,而显卡负载不高时它并不会介入运行过程,两者的目的和意义是完全不同的。
Radeon HD 7990的默认频率为1000MHz,当AMD Boost机制发挥作用时,它会自动降至950MHz甚至更低的水平,同时主动调低核心电压。这一动作,是Radeon HD 7990能够以双8Pin维持整卡运行的重要原因之一。
4异步运算引擎
● 异步运算引擎
ACE全称Asynchronous Compute Engine,译为异步计算引擎。作为AMD GPU最前端的组成部分,它的实际作用其实与几何以及光栅化等图形过程并没有直接的联系。ACE位于整个GPU的最前端管理任务队列,它能将非单纯几何关联任务的线程块规整的直接分发给后面的ALU团簇,同时也能接受几何引擎处理完毕的带有几何关联的任务线程块并完成接下来的发放工作。ACE是所有GPU任务的起点,它的存在和表现直接关系到了GPU进行图形及通用计算任务时的效率表现。
Tahiti构架Dual ACE细节
由于ACE与几何引擎直接相连,这种关联关系也在一定程度上改变了构架的多边形搏出能力,因此我们可以笼统的把它理解成前端/几何引擎与线程管理机制的结合体。Tahiti中的Dual ACE不仅改变了RV870架构几何性能较弱的局面,让未来的GPU架构拥有几何处理/线程处理能力同步提升的机会,更为AMD向并行处理构架的进化打开了大门。
Daul ACE首次出现于Cayman架构,区别于传统的AMD架构,Cayman拥有了第二套完整的光栅化-几何处理单元阵列,该阵列拥有Rasterizer、Hierarchical-Z以及Tessellator/Germetry等全部的前端资源体系,与原有的前端部分完全对等,并且与流水线中的线程仲裁器UTDP直接对应。
Cayman构架的Dual ACE
Dual ACE的价值是显而易见的,它让Cayman拥有了双倍于RV870的几何处理能力,这极大地改善了RV870在面对曲面细分等领域时的表现。同时,由于单位周期的三角形搏出能力也从1个提升到了2个,Dual ACE的出现让Crysis这样对于传统多变形输出能力有很大需求的游戏也能获益。最后,更快的光栅化处理能力带来了更快的坐标变换和像素化速度,这降低了后续流水线步骤的等待延迟,从而为最低帧表现的提升提供了帮助。
Tahiti大幅提升的曲面细分性能
Cayman中Dual ACE的表现,让AMD看到了提升体系线程管理能力以及宏观并行度的好处,因此在Tahiti构架中,AMD对ACE进行了进一步的强化。根据AMD公布的数据,Tahiti架构拥有了4倍于Cayman的曲面细分能力,同时通用计算性能也有了长足的进步,这从侧面表明Tahiti构架的线程能力较之Cayman有了更进一步的提升。
5ALU团簇:Compute Unit
● ALU团簇:Compute Unit
Tahiti架构最大的改进来自ALU集群部分。与传统AMD构架的VLIW结构ALU团簇不同,Tahiti构架的ALU集群撤消了来自超长字节指令的限定,所有ALU全部以SIMD的形式来完成吞吐,不再需要打包和解包的过程。在保留传统的通用执行特色,比如执行bitcoin这样暴力吞吐运算能力的同时,Tahiti架构的灵活度和运算效率也有了不小的提升。
在Tahiti构架中,ALU团簇的名称从VLIW SIMD变成了Compute Unit,名称的改变不仅标志着功能及用途的变迁,更暗示了内部结构的方向性变化。Tahiti拥有32个CU单元,CU内部包含4组SIMD CORE,每组SIMD CORE由16个标准Vector ALU构成,所以Tahiti的一个CU单元拥有64个Vector ALU,32个CU单元合计拥有2048个Vector ALU。
Tahiti构架CU结构细节
除了负责浮点吞吐的SIMD CORE之外,Tahiti构架的每个CU单元还拥有在一个Scalar Unit,Scalar单元中包含Int ALU单元,可以用来处理整数指令以及特殊函数。另外,对线程效率至关重要的原子操作(Atomic)也在该单元中执行。
运算单元之外,Tahiti构架的每个CU还绑定了由Branch和Scheduler构成的二级线程控制机制,以及一个完整的Texture Array,Texture Arroy的作用与传统AMD构架中的TMU基本相同,包含了完整的Texture Fetch Load/Store Unit以及Texture Filter Unit。
Intel Larrabee构架
由此不难看出,Tahiti构架CU单元的结构在逻辑层面上已经与Fermi构架的SM单元和Larrabee的Vector Unit存在极大的相似性。三者均由浮点吞吐部分(Tahiti的Vector ALU团簇,Fermi的SP单元集群,Larrabee的Vector集群),整数、特殊函数及原子操作部分(Tahiti的Scalar Unit,Fermi的SFU,Larrabee的Scalar pipeline)以及二级线程控制机制(三方的Scheduler等)。除此之外,CU还与Fermi的SM一样拥有完整的Texture Arroy,甚至每一个运算单元(Tahiti的Vector ALU,NVIDIA的SP单元)都拥有完全相同的4K寄存器。
CU进行wavefront吞吐示意
一个CU/SM/Vector Unit就是一个独立的处理单元,能够面对一个标准的指令集群或者说线程块,也就是AMD的wavefront以及NVIDIA的warp,但AMD目前上不存在类似half warp的线程块子划分机制。
Tahiti支持WinZip最新版带来的Open CL加速
更新之后的CU单元在计算能力和效率方面有了长足的进步,不仅令Compute Shader处理能力大幅提升,进而提升了GPU在DirectX 11环境下的图形性能,而且在通用计算领域也获得了更加广阔的前景和更多样化的发展可能。
6统一缓冲体系
● 统一缓冲体系
Tahiti另一个巨大的改进来自缓冲体系的大幅调整。Tahiti架构的缓冲体系不仅对原有的GDS以及LDS等Shared资源进行了调整和重新布置,更引入了非常重要的多级unified cache。
不同于传统的被所有VLIW CORE共享使用的整体GDS,Tahiti架构的每个CU拥有至少32K的独立的GDS(Golbal Data Share),这个尺寸完全符合微软在DirectX 11中的硬性规定。GDS中可以划分出16K空间作为L1 Data cache,Tahiti构架的多级cache体系属于包含式结构,L2保存了全部的L1数据且能够允许L1数据进行回写,结合AMD的官方描述,我们认为在宏观范围内Tahiti的Shared存在32K GDS+0K L1 Data cache+“16K L2 Data cache”或者16K GDS+16K L1 Data cache两种组合方式。
Tahiti构架缓冲体系
除了GDS+L1共享构成的以及缓冲体系,Tahiti构架的每个CU还拥有独享的LDS(Local Data Share),LDS在RV770以后的AMD构架中均有出现并为所有VLIW CORE共享,而此次在Tahiti中,LDS与GDS一样被打散到了每一个CU中,变成了专享的二级补充Shared。
除了一级缓冲和Shared,Tahiti的CU单元还拥有共享的L1 Instruction cache和Kernel cache,每4个CU共享16K的L1 Instruction cache和32K的Kernel cache。
Tahiti构架缓冲体系细节(引自后藤弘茂blog)
最后,Tahiti构架拥有沟通上级缓冲与显存的L2 Data cache,L2 cache与MC一一对应,因此Tahiti共拥有6组合计768K的L2 cache。L2 cache面向所有CU中的单元开放,ALU可以用它缓冲数据,TMU也可以用它充当Texture cache。
Fermi构架缓冲与单元的关系
整体来说,Tahiti的缓冲体系与Fermi存在很大的相似度,无论是可共享/切换的一级Shared/L1机制,还是面向所有单元并可以同时充当Texture cache的L2,Tahiti与Fermi在缓冲体上都已经处在了一致的状态。两者最大的区别,在于Tahiti采用了指令和数据缓存分离的方式,同时在L1与Shared的切换方式及尺寸上与Fermi存在差异。相对来说,Tahiti的切换及分配方式更加灵活多样,但同时也对cache的操作切换控制提出了更高的要求。
7无损各向异性过滤及DirectX 11.1支持
● 无损各向异性过滤及DirectX 11.1支持
在Cayman发布时,AMD曾宣称自己的各向异性过滤算法是世界上最好的算法,不仅性能近乎无损而且可视角度方面的表现也完美无缺。但事后有大量媒体证明,Cayman的AF实际上在部分场合会导致LOD错误、闪烁等问题,AMD于Cayman发布后也承认了该方面的问题。
新各向异性过滤细节
在此次的HD7970中,AMD引入了一种全新的非角度依赖算法,在解决Cayman纹理闪烁问题的同时提供了更好的AF性能表现。
全新的非角度依赖算法
通过新算法的引入,HD7970中的AF重写了整个内核,AMD为其引入了全新的自动调用机制,并承诺不会再出现纹理闪烁以及波浪状扭曲等错误,同时还承诺了新的AF算法将真正实现全角度有效。
DirectX 11.1技术细节之TBDR
除此之外,Tahiti构架的另一个重要特性在于DirectX 11.1的支持,DirectX 11.1中包含了DP Shader等诸多对未来图形化过程有深远影响的更新,可以说是一个具有开端意义的API升级。HD7970对DirectX 11.1特性提供了全面的支持,用户可以在未来快速的进入全新API的应用环境,获得全新的图形体验。
8超长卡身的内在——HD7990拆解
● 超长卡身的内在——HD7990拆解直播
Radeon HD 7990拥有超长的卡身尺寸,其散热系统也采用了公版显卡史上空前的3X92mm口径风扇方案,接下来,就让我们一起看一看这块巨无霸的内含吧。
拆解准备
经过一番努力,我们终于见到了Radeon HD 7990的真容。不得不说,我们已经很久没有见过用料如此殷实的显卡了。巨大的功耗对元件数量和品质均提出了极高的要求,这促使AMD为我们奉上了这样一款给人“踏实感”的作品。
9测试平台硬件环境一览
● 测试平台硬件环境一览
为保证测试能够发挥显卡的最佳性能,本次测试平台由Intel酷睿i7-3960X处理器、技嘉X79芯片组主板、芝奇4GB DDR3-1600×4四通道内存组建而成。详细硬件规格如下表所示:
测 试 平 台 硬 件 环 境 | |
中 央 处 理 器 | Intel Core i7-3960X |
(6核 / 12线程 / 3.3GHz / 15MB L3) | |
散 热 器 | Intel RTS2011LC |
(原厂水冷散热器 / 选配件) | |
内 存 模 组 | G.SKILL RipjawsX DDR3-1600 16GB |
(SPD:11-11-11-28-1T) | |
主 板 | GIGABYTE GA-X79-UD7 |
(Intel X79 Chipset) | |
硬 盘 | Seagate Barracuda 1TB |
(1TB / 7200RPM / 32MB缓存 / SATA3) | |
电 源 | NERMAX 白金冰核 1500W |
(CSCI Platinum 80Plus/1500W) | |
显 示 器 | DELL Ultra Sharp 3008WFP |
(30英寸LCD/2560×1600分辨率) |
● 测试平台软件环境一览
为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 7正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
测 试 平 台 软 件 环 境 | |
操 作 系 统 | Microsoft Windows7 Ultimate RTM SP1 |
(64bit / 版本号:7601) | |
主 板 芯 片 组 驱 动 | Intel Chipset Device Software |
(WHQL / 版本号:9.2.3.1022) | |
AMD 显 卡 驱 动 |
AMD Catalyst |
(Beta / 版本号:12.102.3-130412a for HD7990) | |
NVIDIA 显 卡 驱 动 |
NVIDIA Forceware |
(WHQL / 版本号:314.22) | |
桌 面 环 境 | Microsoft Windows7 Ultimate RTM SP1 |
(2560×1600_32bit 60Hz) |
在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用FPS记录平均帧数来衡量性能,数值同样越高越好。
特别说明:为保证测试过程中AMD/NVIDIA驱动程序特效设置完全相同,我们调整了AMD催化剂驱动的AI控制功能,将镶嵌等级从驱动默认的“AMD优化”改回“应用程序控制”。在这样的设置下,AMD显卡才会在游戏中使用正确的游戏自身设置的曲面细分等级,而不是AMD通过驱动预设的更低的曲面细分等级。
我们所有的理论测试均采用软件预设画质或单独交代设置细节,游戏测试则统一采用1920及2560两个分辨率下开启全部特效及4XAA的设置来完成,如有调整会另行交代。所有参测显卡均完成1920分辨率游戏测试,而2560分辨率游戏测试因性能因素只开放给Radeon HD 7950以及GeForce GTX 660Ti以上级别显卡。
10理论性能测试:3DMark FireStrike
● 理论性能测试:3DMark FireStrike
于北京时间2013年2月5日推出的新3DMark,采用全新界面设计,除了测试分数,还会展现每个场景测试期间的实时曲线,全程记录帧率、CPU温度、GPU温度、CPU功耗。新3DMark取消了传统的E、P、X模式,取而代之的是根据负载不同所推出的三个场景,其中FireStrike专为基于DirectX 11显卡搭建的高端游戏平台,而CloudGate则支持基于DirectX 10环境的主流硬件,IceStorm则支持入门级DirectX 9设备、手机、平板电脑等等。
新3Dmark测试结果
Radeon HD 7990运行新3Dmark成绩及帧数曲线情况
在新3Dmark中,Radeon HD 7990取得了最高的单卡测试结果,结果细节及帧数曲线情况见上图。
11理论性能测试:3DMark 11
● 理论性能测试:3DMark 11
PC游戏随Windows 7的发布进入DirectX 11时代,众多DirectX 11显卡早已摩拳擦掌上阵厮杀,却迟迟没有一个权威性的基准测试软件来衡量游戏显卡DirectX 11性能的高低。终于,DirectX 11时代的3DMark 11来到大家面前。3DMark 11使用原生DirectX 11引擎,测试场景包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DirectX 11特性。
3Dmark 11 extreme模式测试
因为某些原因,3Dmark11的测试结果对Tahiti架构的友好度并不如新3Dmark,但Radeon HD 7990依旧表现出了出众的性能。
12DirectX 11性能测试:天堂4.0
● DirectX 11性能测试:Heaven Benchmark 4.0
Heaven Benchmark 4.0是一款专门测试DirectX 11效率的软件,由俄罗斯Unigine游戏公司自主研发的引擎设计。该软件拥有类似阿凡达的悬浮岛场景,其中龙雕塑运用了细分曲面技术,抱括岛上的路径和房子的砖块等23个场景的测试得出显卡的最终实际效能,并通过DirectX 11环境带来很强的真实感。
天堂4.0极限环境测试
我们采用了极限环境的天堂4.0设置来完成测试,在单屏最高极限的重压之下,Radeon HD 7990再次完成了对GeForce GTX 690的超越。
13游戏测试:Crysis3
● 游戏测试:Crysis3
《孤岛危机3》是《孤岛危机》的最新续作,游戏采CryENGINE 3引擎所制作,其卓越的画面表现以及精彩的剧情相信已无需多言。作为硬件杀手的第三代,只支持DirectX 11的Crysis3 PC版再次将游戏的画面精美程度和硬件需求提升到了新的高度。
孤岛危机3
我们采用运行Origin平台启动游戏并进行第一关流程至进入建筑物为止,同时收集期间的平均帧数的方式来完成测试,测试进行三次,取平均成绩作为最终测试结果。
在最高特效设置环境下,Crysis3已经彻底取代二代成为了新的硬件杀手。在维持可玩性的前提下,Radeon HD 7990想要达到更好的流畅度看来还需要驱动进一步完善的协助。
14游戏测试:Crysis2
● 游戏测试:Crysis2
《孤岛危机2》是《孤岛危机》的续作,游戏采CryENGINE 3引擎所制作,故事发生在距一代3年后的2023年。外星人在地球上的大片区域挑起了战争,各大城市都遭到攻击,人口锐减,玩家将要进行捍卫地球的末日战争。
孤岛危机2
我们采用Crysis2 BenchmarkTool来完成测试,场景选择Downtown,测试进行三次,取最高成绩作为最终测试结果。
2560分辨率Crysis2测试
新一代硬件的性能提升在Crysis2中体现的还是很充分的,这位曾经的硬件杀手已经被Radeon HD 7990彻底征服。
15游戏测试:Metro 2033
● 游戏测试:Metro 2033
本作题材基于俄罗斯最畅销小说Dmitry Glukhovsky。由乌克兰4A游戏工作室开发,采用4A游戏引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,世界被一次灾难性事件毁灭,几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所里,人类文明进入了新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。
地铁2033
我们采取游戏提供的Benchmark程序来完成测试,该Benchmark所包含的场景具有光照系统,烟雾系统以及激烈交战场景,能够全面反映显卡在面对Compute Shader以及超高分辨率材质时的表现。需要注明的是,有介于既往测试的经验,我们在本次测试中关闭了所有参测显卡的DOF选项设置,以期获得“可以用来玩的帧数”数据。
在关闭了DOF选项之后,地铁2033变得具有一定的可玩性了,但它依旧是我们所有测试游戏中对硬件压迫力最强的测试对象。Radeon HD 7990对于AMD阵营单卡性能的拓展是非常可观的,我们认为驱动的完善能够进一步提升该卡的表现。
16游戏测试:杀手5
● 游戏测试:杀手5
《杀手5:赦免》采用IO Interactive自主研发的冰川2(Glacier 2)引擎制作,游戏内容都是在引擎下实时进行反馈的,所有动作都是即时生成的。新作主要场景发生在芝加哥,名为代号47的主角在本作中将更加灵活,更好控制。他将可以攀在悬崖边,还可以保持平衡,游戏融入了掩护系统,挟持人持的功能回归。
杀手5:赦免
我们使用游戏自带的Benchmark程序来完成设置,测试进行三次,取平均值为最终结果:
杀手:赦免是我们所有测试项目中表现最好的游戏,Radeon HD 7990在该款游戏中甚至表现出了1+1>2的水准。由此可见,驱动对于显卡性能的影响还是十分巨大的,伴随着驱动的进一步完善,Radeon HD 7990应该可以给我们带来更好的性能体验。
17Bitcoin算力测试
● Bitcoin算力测试
bitcoin(BTC,比特币)是一个由Satoshi Nakamoto开发的具有分布式运算特征的实验性货币体系,它具有强烈的非央行依赖性和通缩特性。bitcoin的发行并不与一般本位物和冲物挂钩,它的价值依靠自身2200万的货币上限总量以及逐步攀升的获取难度来维系。bitcoin的获取方式来自计算,它将任务广播至网路中,每个参与者通过计算获得bitcoin后都会增加下一枚bitcoin的获取难度。当前bitcoin的运算内容主要为哈希加密算法,CPU/显卡/DSP以及专门研制的ASIC均可直接计算。
bitcoin算力测试
以结果来看,Radeon HD 7990是目前挖矿算力最强的单显卡。但关于挖矿以及Bitcoin,我们认为有两点需要重点强调。
bitcoin采用的最基本的哈希算法是一种仅需要暴力穷举能力的算法,它只要求最暴力的吞吐和最基本的处理能力,并不需要运算者强调灵活的任务处理效率,为灵活高效执行复杂任务而存在的大规模多级任务管理体系在这里反倒有可能会变成效率的阻碍,处理任务越灵活高效的运算架构,处理bitcoin的效率也就越低。这就好比一个单位或者团体处理一件复杂庞大而且充满变数的工程时,组织架构越细腻合理,现场应对能力和针对性越强,整体的工程进行效率也就越高。但如果把工程换成只是吃一碗炸酱面,这事儿也要找8个中层领导打上10份报告的话,那效率就很难提升了。
以bitcoin的执行效率而言,整体情况严格遵循CPU<GPU<DSP<ASIC的顺序,面对复杂任务时最灵活高效的CPU因为牺牲了吞吐能力,因此效率和性能功耗比都最低;同样吞吐能力下越灵活越高效的GPU跑bitcoin的效率比也越低;牺牲一定可编程性和几乎全部前端,借以强调吞吐能力的DSP方案效率明显超过GPU;而不可编程同时可以肆无忌惮的真对吞吐的ASIC方案效率最高。这是一个适合肌肉矿工的领域,挖矿者只需要肌肉不需要脑子,脑子想得越多,bitcoin挖的也就越慢,挖的越快同时能耗比越高的矿工,脑子也越简单。用显卡来挖矿究竟合不合适,诸位请自行判断。
接下来,同时也是比前一点更加重要的事,就是bitcoin的合法性问题。bitcoin并不依赖于任何其他货币的最重要要素:受法律保护的一般等价属性/对冲体系,它的价值没有任何普适世俗观点的认可,它的发行不需要黄金或者外汇储备来维系,却能从世界各国的货币体系中随时搬走实实在在的黄金或者钞票,可以以完全的空手套白狼形式完成对实体货币体系的冲击,同时其隐秘性还隐藏着被用来进行危险不合法交易的可能,因此其合法性以及受保护性可以说完全为0。实际上不仅没有任何一部法律会对bitcoin的货币地位及拥有者所谓的财富进行承认和保护,甚至bitcoin还会因为前面提到的危险性而处在每时每刻都可能在被法律绞杀的风险。如果您打算介入bitcoin,我们强烈建议您三思而行。
18测试总结:
● 测试总结:
区别于以往,我们没有在本次测试的结尾继续深入的讨论Radeon HD 7990的意义,它的出现时机、它对AMD和NVIDIA当前以及未来的影响也同样不在我们的探讨范围。这款产品的意义究竟如何,它是否能够改变AMD和NVIDIA的命运及所处地位,还请屏幕前的各位自行判断。
对于这块卡的意义,我们不再深入探讨
受限于驱动问题,我们只提供了上述游戏及理论性能的测试结果。在其他ZOL测试规范包含的项目中,Radeon HD 7990目前还存在不少兼容性和CrossFireX无法正确生效导致的性能问题,基于同样的原因,我们亦无法获得该卡的满载功耗及温度表现情况。这一方面说明了AMD在驱动的道路上依旧任重道远,同时也给我们留下了很多希望——Radeon HD 7990在完善驱动之后应该还有值得期待的性能提升和使用感受提升。
今天您所看到的关于Radeon HD 7990的种种,就是AMD在2013年二季度伊始为我们带来的最新力作。如果您真的喜欢这款AMD新卡皇产品的表现,并且认同和支持AMD的举动,那就请以实际行动来表达自己的感情,直接购买一块来亲身体验一下吧。
19AMD Radeon HD 7990详细参数
经过1年多的等待,我们终于迎来了全新的单卡皇者Radeon HD 7990,这款来自AMD采用Tahiti核心设计的双芯产品在性能、功耗、噪音等方面都带来了新的里程碑,同时在“比特币”方面的分布式计算更加犀利,让我们看看这款产品的综合实力吧!
推荐经销商