1如此短小的次旗舰?
自从AMD在2015年6月发布了旗下的新产品之后,沉寂的显卡业界就进入了另一个觉醒期,虽然目前全世界仅有两家公司有能力为我们提供图形解决方案,但层出不穷的新品还是让我们看的眼花缭乱。北京时间2015年9月10日20点,距AMD Radeon R9 Fury X发布仅仅不到3个月的时间,AMD再次发布旗下的划时代产品——AMD Radeon R9 Fury Nano。
早在R9 Fury X发布的时候,AMD就放出了他们会推出我们今天即将要测试的R9 Nano的消息,不过当时给我们的感觉是非常的朦胧,我们只是根据它的名字推测它会是一张比较短小但性能非常强劲的显卡。这张显卡既然是比Fury X低一级别的产品,我们原本以为它将会采用Fury的规格,也就是3586个流处理器来进行制造,但当我们真正得知了它的规格之外还是比较意外的。因为它采用了全规格的Fiji核心,开放了全部4096个流处理器。
AMD Radeon R9 Fury Nano是一款mini-ITX的产品,能够将这种规格的显卡做的这么小,主要还是得益于新的HBM显存,由于它采用了与核心封装在一起的先进技术,所以能够极大的节省原来GDDR5显存所需要占用的PCB空间,能够制造出如此小的显卡就不足为奇了。
如今,这款小型的mini-ITX次旗舰产品已经发布,ZOL早就已经拿到了AMD给出的样卡以及官方正式版的驱动,我们将第一时间为玩家们带来丰富的评测内容,下面我们我们就开始我们今天针对AMD Radeon R9 Fury Nano的测试,看看它如此小的身体能够带给我们什么样性能以及使用体验呢?让我们拭目以待吧!
另:我们在首测之前有幸拿到了首款DirectX 12游戏《奇点灰烬》的Benchmark程序,虽然这款游戏还没有正式发布,但毫无疑问它的出现对于我们来说的意义是巨大的,这就代表着一大批基于DX12 API开发的游戏即将来到我们的面前。不过由于时间关系,我们仅会放出A/N两家的旗舰产品在这款游戏中的性能表现,让大家一睹两家高端显卡产品在新API上的性能表现。
2小身材 大能量
小身材 大能量
作为Graphic Core Next的最新改型,Radeon R9 Fury Nano采用的Fiji架构拥有了AMD史上最为庞大的规模。它集成89亿晶体管,核心面积上升到了590平方毫米以上,这如果连带封装为一体的显存的话,那么这个数字将会上升到超过1000平方毫米。
显 卡 对 位 产 品 规 格 比 较 表 | ||||
显卡型号 | Radeon R9 Fury Nano | Radeon R9-FuryX | GeForce GTX 980 Ti | Radeon R9 290X |
首发限价 | ? 元 | 5099 元 | 4699 元 | 4599 元 |
GPU代号 | Fiji | Fiji | GM200 | Hawaii |
GPU工艺 | 28nm | 28nm | 28nm | 28 nm |
GPU晶体管 | 89 亿 | 89 亿 | 80 亿 | 62亿 |
着色器数量 | 4096 | 4096 | 2816 | 2816 |
着色器组织 | Vector×4096 | Vector×4096 | 1D×2816 | Vector×2816 |
ROPs数量 | 64 | 64 | 96 | 64 |
纹理单元数量 | 256 | 256 | 256 | 256 |
核心频率 | 1000MHz | 1050MHz | 1000MHz | 1000MHz |
着色器频率 | 1000MHz | 1050MHz | 1000MHz | 1000MHz |
理论计算能力 | 8.6 TFLOPs | 8.19 TFLOPs | 5.6 TFLOPs | 5.6 TFLOPs |
等效内存频率 | 1000 MHz | 1000 MHz | 7010 MHz | 5000MHz |
内存位宽 | 4096 bit | 4096 bit | 384 bit | 512 bit |
内存带宽 | 512 GB/s | 336.5 GB/s | 336.5 GB/s | 320 GB/s |
内存类型 | HBM | GDDR 5 | GDDR 5 | GDDR 5 |
内存容量 | 4096 MB | 6144 MB | 6144 MB | 4096 MB |
DX版本支持 | 12 | 12 | 12 | 11.2 |
注:市场售价均为官方首发限价
与Radeon R9-290X的Hawaii架构相比,Fiji架构的运算资源总量从2816个ALU大幅上升到了4096个,Texture Filter Unit由176个上升到了256个,构成后端的ROP则维持在64个。Fiji拥有全新设计的MC结构,新MC直接对接4枚Logic Die所管理的HBM堆叠显存体系,总显存位宽4096bit,显存容量为4096MB。
Radeon R9 Fury Nano的默认核心及显存运行频率为1000/1000MHz,理论性能参数十分夸张,其默认Pixel Fillrate能力达到了64Gpiexls/S,默认Texture Fillrate能力为256Gtexels/S,显存带宽达到了惊人512GB/S。凭借庞大的运算规模,Radeon R9 Fury Nano拥有8.19T Flops的超高单精度浮点运算能力。
Fiji架构芯片由以下主要的部分组成:
1、GPU部分依旧基于HKMG的TSMC 28nm工艺,与HBM显存的最终封测在海力士完成。
2、与Hawaii完全相同的宏观并行结构,64组CU单元被分为4个Shader Engines,每个Shader Engines包含16组CU。
3、与Shader Engines一一对应的4组Geometry Unit(几何处理单元)以及4组Rasterizer(光栅化单元)。
4、ACE异步计算单元的总量由GCN1.0的2组提升至8组,与Hawaii一致。
5、重设结构的显存体系,4枚Logic Die控制的4颗HBM显存颗粒以2.5D的形式封装在GPU核心周围,可以实现高达4096bit的显存位宽,可在500MHz显存频率上实现512GB/S的理论位宽,并且大幅降低了显存体系的能耗进而明显降低了整卡功耗。
6、因显存体系改变而重设的PCB结构,传统的显存颗粒及布线占位均已消失,整卡尺寸因此更为短小。
可以说是新的HBM显存体系造就了Fury X以及Fury的短小,如今又出现了Fury Nano这种专门为ITX主机所设计的更加小型的显卡产品。它的出现虽然因为种种原因无法彻底改变格局,但其与Fury X相同的规格就注定了Fury Nano将会有着不俗的性能表现。
3HBM显存体系助力Fiji
HBM显存体系助力Fiji
与以往的显存形式不同,HBM显存的最大特点在于向“空间”要“空间”。前一个“空间”指的是立体空间,后一个“空间”则指存储空间。传统显存的存储模式以平面分布为基础,所有存储颗粒均分布于二维平面当中,除了使用更大容量的单颗颗粒之外,如果要拓展容量就只能占用更多的平面空间(在PCB上敷设更多颗粒并使用更长的连线)。HBM显存改变了这一传统,将颗粒集中在一起并向“上”进行了空间的延伸,在相同的“占地面积”下,HBM显存能够实现数倍于传统显存的存储容量。
堆叠内存
无论内存、显存或者SSD,甚至是手机/平板电脑的NAND,传统DRAM体系在提升容量时都会受到来自PCB面积的约束,互联线长/带宽以及通讯延迟也会随之增大。相对于传统内存,堆叠显存所做的改进在于将若干片DRAM颗粒垂直叠放在一起,这相当于使用同样的PCB面积布置了比过去多数倍的DRAM颗粒。不仅如此,因为楼房楼层的垂直距离短于平面延伸平房的距离,人与人之间的物理距离也比平房时缩短了许多,沟通更加便利且可以实现更大规模的并行化通讯。所以相对于传统内存,堆叠内存的联线、带宽以及延迟均拥有很大的优势。
HBM显存的出现带来了很多与过去截然不同的存储模式,它将更多颗粒布置在了更小的面积当中,这在提升容量和带宽的同时也导致了新的问题,那就是内存控制器所面临的管理层级和管理范围有了显著的变化。突然激增的内存颗粒和并行存储链路对内存控制器提出了极大的挑战,如果依旧采用传统结构,让全部内存颗粒都去对应单一且统一的内存控制器的话,GPU芯片可能要做到巴掌大。
拥有Logic Die的HBM内存(图片源自后藤弘茂blog)
为了解决这一问题,HBM显存在解决内存控制器瓶颈的过程中也引入了一级新的沟通机制,每一簇HBM显存颗粒的最底层都拥有独立的Logic Die,其上集成了能够管理整簇堆叠颗粒的芯片,这些芯片将与内存控制器直接沟通,可被用来收集堆叠颗粒当中的数据、并帮助内存控制器对其实施管理。在HBM显存体系当中,内存控制器的规模不仅不会放大,甚至还会出现一定程度的缩减,它只需要面向这些Logic Die当中的芯片即可,对每簇颗粒当中各层DRAM的管理将由Logic Die完成。
当然,HBM显存在获得超高带宽大并行存储的同时所付出的代价也同样明显而且深刻——随着集成度的上升,过去相对均匀分布在大面积PCB空间上的总热量,现在也随之而几乎完全集中在了GPU周围的核心区域。
热密度的提升带来了很多新的考验,尽管PCB的尺寸和设计难度都已经随着HBM的列装而大幅下降,但这种下降同时也导致了散热器尺寸和有效散热面积的下降。在此基础上,传统散热器上应付自如的,分布在更大面积的总热量现在几乎全部集中到了GPU核心的周围,散热器与热源的有效接触面积因此而大幅下降,吸热窗口的减少令如何快速将这部分热量分散转移并有效传递到散热鳍片中进而散逸出去就成了一个全新的课题。
整体而言,初期的HBM显存拥有超高带宽和大并行度存储能力,可以简化PCB设计并明显降低整卡总功耗,但也存在频率提升困难,容量上限较低,Logic Die管理复杂以及对驱动依赖较高等问题。这正反两方面因素,最终决定了Fury Nano的实际表现。
其实就我们看来,目前HBM显存最为短板的地方就是其容量了,我们可以看到采用GDDR5显存的Radeon R9 390X都已经配备了8GB的显存容量,反观采用HBM体系的Fury系列全部为4GB显存,这并不是AMD为了节省成本降低显存容量,是因为技术原因不得不做出的妥协。
4一览Fury Nano真容
一览Fury Nano真容
散热风扇
大家可能注意到我们在Fury X的首测当中并没有放出我们所拍摄的拆解图片,因为Fury X采用了一体冲压的工艺,我们无法在不损坏显卡的前提下进行拆解,所以也就没有真正的看到Fury X在PCB内部到底是什么样的,但是很幸运,Fury Nano并没有采用这种工艺,所以我们本次提供的产品图片均为ZOL产品库实拍。
5测试平台环境一览
测试平台环境一览
为了能够让测试具备超前性,我们特意采用了Intel最新的Z170主板以及i7 6700K作为平台,另外还采用了DDR4内存。保证能够让显卡完整的发挥出自己的性能。
测 试 平 台 硬 件 环 境 | ||||
中央处理器 | Intel Core i7-5960X | |||
(8核 / 16线程 / 3.0GHz / 20MB L3) | ||||
散热器 | 超频3黄海至尊版 | |||
(风冷散热器 / 选配件) | ||||
内存模组 | Corsair Vengeance 8GB DDR4 *2 | |||
(SPD:14-16-16-31-1T) | ||||
主板 | GIGABYTE X99 Gaming 5 | |||
(Intel X99 Chipset) | ||||
硬盘 | 海盗船Neutron GTX 480GB | |||
(480GB / SSD / 64MB缓存 / SATA3) | ||||
电源 | 安钛克 HCP-1300 Platinum | |||
(80Plus Platinum / 1300W) | ||||
显示器 | ASUS PB287Q | |||
(28英寸LCD / 3840×2160分辨率) |
测试平台软件环境一览
为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 10正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
测 试 平 台 软 件 环 境 | ||||
操作系统 | Microsoft Windows 10 | |||
(64bit / 版本号:10240) | ||||
主板芯片组驱动 | Intel Chipset Device Software | |||
(WHQL / 版本号:9.2.3.1022) | ||||
AMD Catalyst | ||||
(版本号:15.201 Pre WHQL) | ||||
桌面环境 | Microsoft Windows 10 | |||
(3840*2160 / 32bit / 60Hz) |
理论性能测试我们将采用自带的评分系统,游戏测试方面我们将采用游戏自带的Benchmark以及Fraps来得出最终的成绩,分数越高越好。
6参测产品之蓝宝石R9 Nano
参测产品之蓝宝石R9 Nano
蓝宝石R9 Nano 4GB HBM
参测产品之迪兰R9 Nano
迪兰R9 Nano 4GB HBM
8理论性能测试:3DMark FireStrike
理论性能测试:3DMark FireStrike
于北京时间2013年2月5日推出的新3DMark,采用全新界面设计,除了测试分数,还会展现每个场景测试期间的实时曲线,全程记录帧率、CPU温度、GPU温度、CPU功耗。新3DMark取消了传统的E、P、X模式,取而代之的是根据负载不同所推出的三个场景,其中FireStrike专为基于DirectX 11显卡搭建的高端游戏平台,而CloudGate则支持基于DirectX 10环境的主流硬件,IceStorm则支持入门级DirectX 9设备、手机、平板电脑等等。
3DMark FireStrike
在理论性能测试当中,这样的成绩还是比较让我们满意的,不过与采用同规格芯片的Fury X还是有着一定的差距的,这其中最大的原因就只有频率了。
9游戏性能测试:《蝙蝠侠:阿卡姆起源》
游戏性能测试:《蝙蝠侠:阿卡姆起源》
《蝙蝠侠:阿甘起源》由华纳蒙特利尔工作室打造,使用优化版“虚幻”引擎打造。正如游戏名称所述,本作将会发生在《蝙蝠侠:阿甘》系列作品之前,是一部前传性质的作品,游戏聚焦蝙蝠侠年轻时,他将首次遭遇众多超级反派。除传统的单机游戏模式之外,本作将首次包含多人在线联网的游戏模式。在联网模式中,玩家将可以选择扮演小丑(Joker)或贝恩(Bane)两个团伙的邪恶角色,目标以干掉蝙蝠侠与罗宾为胜利。
《蝙蝠侠:阿卡姆起源》
这款游戏在目前看来已经不能对高端显卡造成什么挑战了,不过我们并不知道在4K分辨率下会有什么样的情况发生,我们将在之后推出基于Fury Nano的4K游戏测试。
10游戏性能测试:《杀手:赦免》
游戏性能测试:《杀手:赦免》
《杀手:赦免》采用IO Interactive自主研发的冰川2(Glacier 2)引擎制作,游戏内容都是在引擎下实时进行反馈的,所有动作都是即时生成的。新作主要场景发生在芝加哥,名为代号47的主角在本作中将更加灵活,更好控制。他将可以攀在悬崖边,还可以保持平衡,游戏融入了掩护系统,挟持人持的功能回归。
《杀手:赦免》
这样的成绩并没有出乎我们的预料,不过我们可以看到在这款游戏当中Fury Nano与Fury X的性能差距似乎拉小了。
11游戏性能测试:《地铁:最后的曙光》
游戏性能测试:《地铁:最后的曙光》
《Metro LastLight》基于俄罗斯最畅销小说Dmitry Glukhovsky,依旧由乌克兰4A游戏工作室开发并采用改进后的4A游戏引擎。最后的曙光讲述了一场为争夺足以毁灭人类的世界末日装置的内战。人类依旧苟活在地下等死。不同派系之间的战争还在继续,晚上依旧有各种变异生物潜伏在暗处。地面依旧是各种毒气,但有传言冰层开始融化,阳光开始穿透云层。
Metro: LastLight
在这款游戏当中,Radeon R9 Fury Nano凭借其强劲的性能,能够在两个分辨率下都给我们相当不错的游戏体验。
12游戏性能测试:《古墓丽影9》
游戏性能测试:《古墓丽影9》
《古墓丽影9》将讲述劳拉的首次冒险之旅,主角劳拉·克劳馥的年龄被设定在21岁,那时的她还只是一名刚出茅庐的新人,经验欠缺。随着游戏剧情的发展,玩家将与劳拉共同成长,获得新的武器和道具并习得新技能。在冒险的小岛上,玩家可以在营地对道具进行组合,有些特定区域就需要特定道具和技能才能通过。岛上的各个营地之间可以快捷传送,玩家无需长途跋涉。而除了劳拉外还将有其他角色出现在岛上。
古墓丽影9
作为动作冒险类游戏,对于帧数的要求还是比较高的,不过Fury Nano在《古墓丽影9》当中的表现还是非常让我们满意。
13游戏性能测试:《巫师3:狂猎》
游戏性能测试:《巫师3:狂猎》
《巫师3:狂猎》采用Redengine3引擎,作为一款次世代的RPG游戏作品,本作栩栩如生的真实环境还原以及全新角色面部动作和人物面部表情都成为了一大亮点。Redengine3引擎在支持各种全新图形技术的同时也加快了地图载入速度,经由无缝地图打造的宏大世界让玩家可以自由无限制的漫游在游戏世界当中。
巫师3
作为次世代游戏的代表作之一,《巫师3:狂猎》对于图形性能的要求可以说是苛刻的,Fury Nano虽然无法达到60帧的完美运行帧,但保证玩家正常游戏是完全没问题的。毕竟连各家的旗舰级产品都不能在高分辨率下维持绝对的流畅。
14Direct 12游戏测试:《奇点灰烬》
Direct 12游戏测试:《奇点灰烬》
《奇点灰烬》是真正意义上的DirectX 12游戏,我们通过各方渠道获得了它的Benchmark程序,《奇点灰烬》是目前首款基于DirectX 12 API开发并且能够供我们进行测试的游戏,但我们认为它并不能代表之后A/N显卡在DirectX 12之中的表现,毕竟目前还没有大量的DirectX 12游戏出现,两家公司还没有针对这类游戏的驱动程序,所以我们本次的测试结果仅作为一个参考。
Benchmark场景
通过测试我们可以看出之前传言的AMD显卡在DX12有巨大提升这确实不假,在提升幅度这方面确实是AMD有着相当大的优势。NVIDIA显卡在DX12当中相对DX11来说性能有着一定的下降,但是下降幅度并不是很大。
15温度、功耗测试
温度、功耗测试
我们在这个环节依旧是采用老方法,Furmark来进行测试,看看显卡在温度以及功耗方面是否能够达到让我们满意的标准。
平台空闲功耗(不包括显示器)
在功耗方面的表现还是相当让我们满意的,这也就是说如果采用一个ITX机箱无法放入标准ATX电源的话,那么小型的350w电源也是可以接受的。
我们可以在前面的拆解中看到这款产品在散热底座部分大量的使用的铜材质,内部造型也是十分夸张,不过我们可以看到散热的效果还是不错的。
小体型并不妨碍怒火的燃烧
规格对于显卡来说是相当重要的,规格一般来说都会直接影响到显卡在性能上的表现,而且卡身短小的显卡一般都会采用屏蔽过的核心,其中最为重要的一点就是可以控制发热量,不过本次我们可以看到AMD在Fury Nano身上采用了全规格的Fiji核心,显然也是对这款小型散热器有着极大的信心。最终的温度表现也比较让人满意,不过需要注意的是我们所有的测试场合均为开放环境,当显卡进入机箱,尤其是ITX机箱这样的狭小密闭环境之后,其表现还是会因场合不同而有所差异的。
可以看到产品规格与Fury X完全相同
目前看来,R9 Fury Nano与Fury X唯一的差距就是在频率上,我们从技术规格上来看,R9 Radeon Fury X的基础频率为1000MHz,Boost频率为1050MHz,不过由于其采用了水冷的原因,Boost频率很可能会高过1050MHz,再反观R9 Fury Nano,它的基础频率我们没有在技术文档中明确的得知,但Boost频率为1000MHz,所以呈现出了较大的性能反差
根据我们的测试发现,R9 Fury Nano的实际运行频率在900MHz左右,在规格相同的情况下,频率就成为了制约显卡性能的唯一因素。换句话说,R9 Fury Nano是具有达到Fury X性能的潜力的。不过需要说的是R9 Fury Nano从核心的角度上来说超频是可行的。但是显卡的散热,供电都没有太多的冗余,所以从这个角度上来看,我们是很难能够让Fury Nano运行在更高频率上的。
我们今天测试特殊的地方就在于添加了目前第一款DirectX 12的游戏测试,我们在这当中可以看出显卡AMD在DirectX 12游戏上确实有着不小的提升,相对来说N卡性能有着一定幅度的下降。不过因为原本的性能差距。
AMD Radeon R9 Fury Nano是目前相对较小的高性能显卡产品,我们可以看到它的性能是介于GTX980和GTX980Ti之间的,不过与GTX980Ti还是有着一段不小的差距。我们不认为AMD推出这款产品是希望与某一款竞品在市场上竞争。从我们评测人员的角度来看,没有什么能够与其对位的产品,它应该是一款独立存在的产品,竞品最短小的产品在性能以及价格方面与AMD Radeon R9 Fury Nano都有着长足的差距,所以R9 Fury Nano是目前性能尺寸比较高的产品之一。
迷你主机占用空间小已经成为一个非常鲜明的特点以及优点,近几年迷你PC占有量明显的有着一些提升,不过很多的游戏玩家因为迷你PC的性能原因一直对之嗤之以鼻,因为绝大多数的迷你PC是无法给人比较完美的游戏体验的,不过在R9 Fury Nano出现之后,这种情况势必会发生一些改观。
Radeon R9 Fury Nano可轻松放入ITX机箱当中
下面我们就不得不来说说DirectX 12了,我们通过测试成绩可以看出同样一张R9 Fury Nano在DX11和DX12这两个API下性能差距是相当大的,在DX12模式下,这张显卡的性能领先DX11模式接近100%,在DX12下R9 Fury Nano的性能已经非常接近于GTX980Ti,足以看出其在DX12下的威力。
DX12与DX11不同的地方就在于新API属于直接访问硬件底层的API,GCN架构的AMD显卡硬件原生支持DX12的异步计算,这是竞争对手在目前架构当中所做不到的,所以能够在《奇点灰烬》的Benchmark当中获得更好的性能就不足为奇了。
总体来说AMD Radeon R9 Fury Nano在性能上的表现相当的令人满意,常规测试中如此,在DX12游戏的测试当中更是如此。另外,尺寸较小的散热器能够有这么高的散热效率也比较少见。因为我们都知道HBM显存是与核心封装在一起,虽然功耗相对之前的GDDR5有着巨大的缩小,但还是有不小的发热量,对于散热还是有一定要求的。
HBM的出现还是对于目前的显卡市场有着一定的影响的,我们也可以看到AMD已经基于HBM技术将自家的产品进行了一系列的优化,包括功耗,性能,尺寸等。将该技术推广到玩家中间,虽然传言的良率问题可能是真实存在的,不可否认的是AMD还是为推进显卡业界的发展做出了相当大的贡献。我们也希望AMD能够在显卡的道路上越走越好,并且能够给我们提供更多拥有高性价比的产品。