回首多卡互联历史 分析7卡可能性
回首多卡互联历史 分析7卡可能性
还记得《太可怕了 7块GTX260+插在X58上啥效果?》这篇文章吗?七张影驰GTX260+无双和一张华硕P6T7 SuperComputer主板组成的平台,暂不论这个平台是否能组成我们预期的7-Way SLI,就凭配置中七张GeForce GTX 260+和一张X58主板的万元总价,就足以在让很多用户望眼欲穿。
在进入21世纪后,NVIDIA和ATI两家显示芯片厂商脱颖而出,成为目前独立显卡市场中的绝对主流显卡显示芯片提供商。而这两大品牌在极限3D性能方面,二者都不约而同的选择了多卡互联技术,分别是NVIDIA的SLI和ATI的CrossFire。这种技术的出现粗略数来有以下三大好处:
1)降低研发成本,只需用当代芯片就能有大幅3D效能提升;
2)随着多卡互联技术的成熟,同芯片厂商不同芯片之间可以组建多卡技术,提升产品利用率;
3)为现阶段单卡多芯产品奠定了技术基础。
影驰GTX260+无双7卡准备就绪
目前,NVIDIA推出了2-Way SLI、3-Way SLI和Quad SLI,这就局限了单卡单芯产品最多3卡,单卡双芯最多双卡的组合;而AMD在多卡互联技术上较为宽松,目前已知4张单卡单芯产品组建CrossFireX是不成问题的。
那么是为什么造成这种情况,笔者分析主要有三点原因:
一、首先中高端显卡,在表现出强劲性能同时付出的代价就是高功耗、高发热量,面对这两个弊端除了提高GPU制程外,高效能散热器对高热量来说可谓药到病除。不过俗话说的好“是药三分毒”,高效能散热器的弊端就是大尺寸的厚重双Slot散热器。
二、从主板设计角度看,目前主流显卡产品尤其是千元中高端产品均采用双Slot的设计,这也就意味着,目前标准的ATX大板最多拥有7个PCI-Express和PCI插槽(当然这得排除类似EVGA X58这样拥有8个扩展槽的特殊版本),也就是说最多只能插4个中高端显卡,同时这还需要较大空间的机箱,因为最下面的一块双Slot显卡需要空间让冷空气在风扇作用下对显卡散热,所以设计4槽PCI-Express x16是常规主板的最大极限。
三、主板和显卡的物理设计确实相互制约了对方的设计,不过从实际应用角度来看,大于4卡互联的技术在娱乐级民用产品中确实用处不大。首先,过多独立显卡间互联成本高,同时就每代显卡而言4卡以内的互联已经能够满足当时所需,更多的投入只会造成资源、性能浪费;其次,我们可以观察NVIDIA的GeForce GTX 295和AMD的Radeon HD 4870x2,均标配了一个多卡互联桥,也就是说两大芯片厂商不约而同的选择了最多4核心互联的设计。
综上所述,在硬件(主板、显卡厂商)和软件(驱动、应用程序提供商)方面,都在娱乐级民用产品上不赞同过多卡间互联技术。
虽然软硬件官方不发布相关技术,那么在实际使用中我们是否能够实现4张以上的单芯单卡的互联呢?在《太可怕了 7块GTX260+插在X58上啥效果?》一文中,我们已经克服了上述硬件层面第一点和第二点的困难,现在就需验证第三点成败十分关键。
困难1-千元单槽唯有GTX260+无双
克服困难1—影驰GTX260+无双 高端单Slot独一份
如果想要让千元以上中高端显卡拥有轻薄身材,唯用在散热器上狠下功夫。影驰GTX260+无双就是这么一款产品,在风冷条件下目前仅有影驰设计并量产了单Slot GeForce GTX 260+,虽然在《太可怕了 7块GTX260+插在X58上啥效果?》一文中我们早已领略其风采,不过还是让我们温故而知新一下。
“薄”!就一个字
● 均热板散热技术成轻薄身材关键
影驰为了在满足GeForce GTX 260+产品散热的前提下要保证散热器厚度,目前唯有均热板技术才能满足这类高端显卡的需求。
首款单Slot设计的影驰GTX260+无双产品,其厚度比1角钱直径还小。不过由于采用纯铜材质的吸热底、热管及散热鳍,所以产品整体依然厚重,当平台插上7块该产品时,笔者不得不感叹这是一个体力活。
使用游标卡尺测量显卡局部厚度约为16.55mm,这是目前最薄尺寸的GeForce GTX 260+。
影驰GTX260+无双散热系统主要由两部分组成,分别是核心/显存主散热模块和供电被动散热模块。其中核心散热吸热底采用纯铜材质均热板技术,显存和NVIO2芯片由铝制骨架做吸热底,最后由铜制热管和铜制散热鳍将热量散发。
风扇设计位于显卡正面左侧,通过离心式风扇在散热鳍组成的风道下为核心、显存、NVIO2芯片和供电被动散热鳍散热。
● 非公PCB 打造完美无双GTX260+
对于GeForce GTX 260+来说,这款NVIDIA目前顶级系列的产品很多用户都不会陌生,下面就针对影驰GTX260+无双的产品设计进行一个简单介绍。
影驰GTX260+无双采用非公版设计,整体设计思路沿用P897公版二次开发而来。其共有原生14颗显存位,适用于GeForce GTX 260+和GeForce GTX 275。
核心采用台积电使用55nm工艺制造的G200-103-B3芯片,其拥有216个流处理器和28个光栅处理器,能够满足目前绝大部分高画质3D效能所需。其次NVIDIA倡导的CUDA并行计算和PhysX物理应用,G200核心也能够提供足够性能。影驰GTX260+无双核心、Shader默认频率为576MHz/1242MHz。
显卡标配14颗规格为16M*32bit的hynix H5RS5223CFR N2C颗粒,构成448bit/896MB的组合,默认频率为2000MHz。
供电模组采用4+1相设计,每相均有全屏蔽式电感、固态电容和优质Mosfet组成,同时为了满足显卡整体供电需求,其标配2个6pin外接供电。
显卡的视频信号输出接口十分丰富,标配DVI + HDMI 1.3 + S-Video的组合,同时附件中赠送的DVI to D-Sub转换器,齐全的接口能够满足绝大部分用户所需。
困难2-行货仅有华硕售7槽PCIEx16
克服困难2—华硕SuperComputer主板 7槽PCI-E x16设计
千元以上中高端显卡无单槽设计产品,我们用影驰新近推出的影驰GTX260+无双版解决。我们迎来的的第二个困难就是寻找一张拥有多于4槽PCI-Express x16的主板。
目前在中国大陆正规零售市场,只有华硕型号为P6T7 WS SuperComputer的主板满足我们需求,其拥有7条PCI-Express x16槽,当然全速运行在x16下只有当在少于4张显卡且特定PCI-Express槽位上才能实现。不过本文我们将验证7-Way SLI,所以每个PCI-Express槽均会上显卡,所以每张影驰GTX260+无双仅能运行在x8速度上,不过这已能满足我们的影驰GTX260+无双需求。
华硕P6T7 WS SuperComputer主板
华硕P6T7 WS SuperComputer主板采用Intel目前娱乐级顶级芯片组——X58 Chipset,从该款的型号不难看出这张主板的应用范畴。首先“WS”为WorkStation缩写,即工作站;其次SuperComputer译为超级计算机。通过型号定义让我们了解,这款主板是针对民用级高端用户设计。
华硕旗下拥有数款基于X58 Chipset设计的主板,而这款有别于其他型号的特色莫过于拥有7条全规格PCI-Express x16接口,这也是本文为何选择这款主板测试的最根本原因,其有能力提供7-Way SLI的主板平台。
X58芯片组支持LGA 1366处理器
最大支持24BG的三通道内存插槽
LGA 1366处理器插座及3通道内存插槽,都是目前仅有X58 Chipset独有的特色,高端的设计、高端产品的搭配必定会带来高端的性能。
南桥散热器及主板“身份证”
随着内存控制器功能逐渐被CPU所集成,北桥功能被削弱,随后Intel推出的P55 Chipset便拥有了单芯片设计(即只有主要提供I/O功能的南桥),不过在X58 Chipset上还保留有南北桥设计。
在上图中的硕大散热鳍下,不仅仅“隐藏”着南桥芯片,还有为PCI-Express提供更多line的NF200芯片。在该散热鳍上标注着SuperComputer字样,再一次印证这款主板的用途。
困难3-双电源解决功率及6pin数量
克服困难3—高功率双电源组合 满足6pin*14需求
解决了显卡厚度问题、解决了主板PCI-Express x16槽数问题,下一步我们需要面对的是7张GeForce GTX 260+显卡和整套平台的功率需求问题。我们知道,GeForce GTX 260+单卡TDP为182W,也就是说7张GeForce GTX 260+满负载运行下将需要1274W,再加上整套平台其它设备需求,1500W的电源将成为起步选择。
我们知道就中低端电源市场来说,1W等于1块钱说法非常贴切,不过随着电源额定功率的增加1W就不仅需要1块钱了,而且像我们需求的1500W起步的电源更是在民用级市场中难以寻觅,即使找到也会价格不菲。
双电源组合
既然额定高于1500W的电源难求,我们可以选择两个电源完成这个任务。这样的组合,相对成本较低同时实现起来也非常简便。
这种用于组建双电源的连接线价格不高,实现起来也非常简单,只需将两个电源的24pin公头与连接线母头接好,同时将连接线24pin公头与主板24pin母头连接。
型号:Delta DPS-700MB A 额定功率:700W
我们选择的两个电源分别是Andyson G1000额定功率1000W和Delta DPS-700MB A额定功率700W,这样我们就有了“一个”1700W的高额定功率电源。
双电源的组合不仅解决了平台高功率需求,同时更多的供电接口满足了6pin显卡外接供电需求。两个电源标配8个6pin外接供电,此时笔者又使用了6个4pin转6pin电源线,从而满足了7张GeForce GTX 260+的14个6pin外接供电需求。
在两个电源分配上,Andyson G1000将负载5张GeForce GTX 260+,而Delta DPS-700MB A负责两张GeForce GTX 260+和平台其他设备。
性能测试的硬件、软件平台状况
性能测试的硬件、软件平台状况
● 测试系统硬件环境
测 试 平 台 硬 件
中央处理器
Intel Core i7-975 Extreme Edition
散热器
Thermalright Ultra-120 eXtreme
内存模组
G.SKILL F3-12800CL9T-6GBNQ 2GB*3
(SPD:1600 9-9-9-24-2T)
主板
ASUS P6T7 WS SuperComputer
(Intel X58 + ICH10R Chipset)
显示卡
影驰GTX 260+无双
(G200 / 896MB / 核心:576MHz / Shader:1242MHz / 显存:1998MHz)
硬盘
Western Digital Caviar Blue
(640GB / 7200RPM / 16M
电源供应器
Andyson G1000 & Delta DSP-700MB A
(ATX12V 2.0 / 1000W + 700W)
显示器
DELL UltraSharp 3007WFP
(30英寸LCD / 2560*1600分辨率)
G.SKILL F3-12800CL9T-6GBNQ
Thermalright Ultra-120 eXtreme
我们的硬件评测使用的内存模组、电源供应器、CPU散热器均由COOLIFE玩家国度俱乐部提供,COOLIFE玩家国度俱乐部是华硕(ASUS)玩家国度官方店、英特尔(Intel)至尊地带旗舰店和芝奇(G.SKILL)北京旗舰店,同时也是康舒(AcBel)和利民(Thermalright)的北京总代理。
● 测试系统的软件环境
操 作 系 统 及 驱 动 | |
操作系统 | |
Microsoft Windows 7 Ultimate RTM | |
(中文版 / 版本号7600) | |
主板芯片组 驱动 |
Intel Chipset Device Software for Win7 |
(WHQL / 版本号 9.1.1.1120) | |
显卡驱动 | |
NVIDIA Forceware for Win7 | |
(WHQL / 版本号 191.07) | |
|
2560*1600_32bit 60Hz |
测 试 平 台 软 件 | ||
3D合成 测试软件 |
3Dmark 06 | |
Futuremark / 版本号1.10 | ||
3Dmark Vantage | ||
Futuremark / 版本号1.01 | ||
3D游戏 测试项目 | ||
PhysX游戏 | Batman | |
Eidos / 版本号 1.1 | ||
Cryostasis: The Sleep of Reason | ||
1C / 版本号 1.0 | ||
Mirror's Edge | ||
EA DICE / 版本号1.0 | ||
DirectX 10游戏 | ||
Crysis | ||
Crytek / 版本号1.2.1 | ||
辅助测试软件 | Fraps | |
beepa / 版本号 3.0.0 |
各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。
7-Way计划破灭 待机400W让你愁电费
7-Way计划破灭 待机400W让你愁电费
7张GeForce GTX 260+搭配Core i7、X58 Chipset的组合究竟会需要多大功率电源支持?我们选择的1000W加700W电源是否能够满足平台需求呢?
测试平台特写
这是刚刚组装好的测试平台,我们看到平台能够正常开机并稳定运行。笔者需要说明的是,整个测试都是在Windows 7操作系统下完成,而图中的Windows Vista界面仅是笔者亮机时所用的系统,待笔者确认7卡可以正常开机后重新安装了Windows 7系统。
在装完Windows 7系统后,进入一个干净的系统待机功耗稳定在397W下,此时SLI模式为关闭状态。将近400W的待机功耗也许对于普通个人电脑来说是一个庞大数字,不过对于我们这一套拥有7张影驰GTX260+无双的平台来说一点不让人意外。
正确识别7张影驰GTX260+无双
在正确安装了NVIDIA目前最新的ForeWare 191.07 WHQL版驱动后,我们在GPU-Z及系统设备管理器中能够清楚的看到7张GeForce GTX 260+,这也是笔者至今见过的最多单平台下显卡数量。
不过遗憾的是,笔者在显卡控制面板中点击组建SLI模式后,系统仅能实现2-Way SLI,也就是说有5张GeForce GTX 260+处于闲置中,它们仅是在无意义的浪费电能。
随后笔者又尝试了6卡、5卡及4卡,无论如何软件设置和SLI MIO桥连接方式,均无法实现6-Way SLI、5-Way SLI甚至4-Way SLI。
我们使用Furmark 1.70版本测试,在未组建任何SLI模式下,7卡中仅有主卡负责平台的3D计算,我们查看7张GeForce GTX 260+的温度提升就能够轻易获得上述结论(由于截图软件问题,仅能将2560*1600分辨率画面截成1920*1200,所以导致有一张卡的运行曲线图未被截取到)。
当平台和一张影驰GTX260+无双满载时,此时整个平台为547W,这其中主要是6张“闲置”的影驰GTX 260+无双导致高功耗。
既然非官方的N-Way SLI无法实现,笔者选择了3-Way SLI作为本次测试平台设定(此环节测试平台上仅有3张影驰GTX260+无双)。在3-Way SLI模式下,平台满载功耗为678W,如果有用户想使用影驰GTX260+无双组建3-Way SLI平台,一个额定高于700W的电源成为必须。
NV地盘它做主 SLI只能3-Way测
NV地盘它做主 SLI只能3-Way测
笔者通过常规方法,最终无法组建大于3张单卡的SLI模式,这与NVIDIA目前的SLI实现策略有着密不可分的关系。虽然无法组建3卡以上的SLI,那么笔者就针对3-Way SLI进行了测试,同时本环节测试也是针对下文做了一个测试数据铺垫。
影驰GTX260+无双 3-Way SLI测试 | |
理 论 性 能 测 试 | |
3Dmark 06 | |
1280*1024 NA AA / NA AF | 21821 |
2560*1600 NA AA / NA AF | 19961 |
2560*1600 4X AA / 16X AF | 17927 |
2560*1600 8X AA /16X AF | 15100 |
3Dmark Vantage | |
Performance | 27077 |
High | 19048 |
Extreme | 此分数为猜分送显卡环节,链接 |
PhysX 游 戏 性 能 测 试 | |
Batman | |
1920*1200 NA AA / NA AF | 73 |
1920*1200 4X AA / 16X AF | 52 |
2560*1600 NA AA / NA AF | 48 |
2560*1600 4X AA / 16X AF | 24 |
Cryostasis: The Sleep of Reason | |
1920*1200 NA AA / NA AF | 59.2 |
2560*1600 NA AA / NA AF | 43.6 |
Mirror's Edge | |
1920*1200 NA AA / NA AF | 101.1 |
1920*1200 4X AA / 16X AF | 93.3 |
2560*1600 NA AA / NA AF | 81.4 |
2560*1600 4X AA / 16X AF | 72.1 |
DirectX 10 游 戏 性 能 测 试 | |
Crysis | |
1920*1200 NA AA / NA AF | 48.6 |
1920*1200 4X AA / 16X AF | 38.1 |
2560*1600 NA AA / NA AF | 31.7 |
2560*1600 4X AA / 16X AF | 16.1 |
通过3Dmark系列软件的测试,让我们了解到3-Way SLI的实力,尤其是在目前主流的3Dmark Vantage测试中,Performance档竟高达27077分数。
在实际游戏测试中,笔者选择了3款PhysX游戏和一款对显卡目前要求最为苛刻的《Crysis》。
3-Way SLI的实力毋庸置疑,在所有游戏测试中,仅《Crysis》测试中2560*1600 4X AA / 16X AF极端画质下无法流畅运行。其中《Batman》游戏对3-Way SLI支持程度较差,这组成绩仅表现了单卡的性能。
四卡计划 3-Way+PhysX方案达成
四卡计划 3-Way+PhysX方案达成
随着NVIDIA将Ageia公司的收购,PhysX物理引擎技术成功融入到NVIDIA GPU中,原来昂贵的PPU现在只需购买NVIDIA显卡就能够免费获得。
不过PhysX-GPU技术对于中高端显卡来说能够轻松应对,但是对于一些极端游戏爱好者或者使用低阶显卡的用户来说,PhysX-GPU技术有一些弊端。
根据官方表示,NVIDIA通过驱动和BIOS设定令PhysX计算最高仅使用GPU的10%计算能力,驱动会自动识别PhysX计算情况而动态分配GPU资源用于PhysX计算。这10%的GPU资源也许对于极端游戏爱好者和低阶显卡用户来说非常宝贵,此时就需要专用的GPU来负责PhysX计算。当然,NVIDIA第一时间根据用户的需求,设计了一项技术,用户可以根据自己需求在多GPU(均为N卡)平台下,指定某一显卡专职PhysX计算,释放其他显卡的3D计算能力。
上述陈词,最终让笔者决定组建一套3-Way SLI + PhysX-GPU的平台,也就是说用4张影驰GTX260+无双,这是目前官方能够实现的最多单卡的平台组合(非最多GPU平台)。那么性能方面呢?
影驰GTX260+无双 3-Way SLI测试 | ||
3-Way SLI | 3-Way SLI + PhysX-GPU | |
理 论 性 能 测 试 | ||
3Dmark 06 | ||
1280*1024 NA AA / NA AF | 21821 | 21821 |
2560*1600 NA AA / NA AF | 19961 | 19961 |
2560*1600 4X AA / 16X AF | 17927 | 17927 |
2560*1600 8X AA /16X AF | 15100 | 15100 |
3Dmark Vantage | ||
Performance | 27077 | 28046 |
High | 19048 | 19983 |
Extreme | 此分数为猜分送显卡环节,链接 | 13476 |
PhysX 游 戏 性 能 测 试 | ||
Batman | ||
1920*1200 NA AA / NA AF | 73 | 79 |
1920*1200 4X AA / 16X AF | 52 | 56 |
2560*1600 NA AA / NA AF | 48 | 51 |
2560*1600 4X AA / 16X AF | 24 | 27 |
Cryostasis: The Sleep of Reason | ||
1920*1200 NA AA / NA AF | 59.2 | 64.9 |
2560*1600 NA AA / NA AF | 43.6 | 47.8 |
Mirror's Edge | ||
1920*1200 NA AA / NA AF | 101.1 | 112.1 |
1920*1200 4X AA / 16X AF | 93.3 | 99.3 |
2560*1600 NA AA / NA AF | 81.4 | 87.9 |
2560*1600 4X AA / 16X AF | 72.1 | 79.5 |
DirectX 10 游 戏 性 能 测 试 | ||
Crysis | ||
1920*1200 NA AA / NA AF | 48.6 | 48.6 |
1920*1200 4X AA / 16X AF | 38.1 | 38.1 |
2560*1600 NA AA / NA AF | 31.7 | 31.7 |
2560*1600 4X AA / 16X AF | 16.1 | 16.1 |
由于3Dmark 06和Crysis中并没有PhysX-GPU计算,所以两个项目成绩不变。
再看3Dmark Vantage和3款PhysX游戏测试,整体性能有了10%左右的性能提升,这对于很多硬件爱好者和游戏爱好者来说是一个不小的提升幅度。
7-Way是噱头 轻薄GTX260世间无双
7-Way是噱头 轻薄GTX260世间无双
● "偏方治百病" 也许真有N-Way
笔者不得不承认7-Way SLI对于本文来说是一个噱头,不过通过这样的噱头让大家了解到了目前千元级别以上中高端显卡仅有轻薄的影驰GTX260+无双做到。虽然在实际测试中仅能实现官方发布的3-Way SLI,不过由于影驰GTX260+无双的轻薄可以让显卡之间腾出更大的热交换空间,有利于显卡散热及稳定的性能发挥。
纵然,笔者在本次测试中没有实现7-Way SLI,不过群众的力量是伟大的,正所谓“偏方治百病”也许一些DIY爱好者已经研究出了实现N-Way SLI的“偏方”,例如修改驱动、更换桥连接模式等等,仅是笔者没有发现、NVIDIA没有发布而已。
7卡平台
● 7槽PCI-E主板有何用 影驰无双显神力
我们选用的主板为华硕P6T7 WS SuperComputer,前文介绍过其从命名中就能体现出设计目的是为了应用于超级计算,例如多显卡互联技术的3D计算,或者目前NVIDIA和AMD都在倡导GPU非3D高性能计算应用。
提及GPU科学计算,肯定会让很多用户想起NVIDIA的Tesla产品,Tesla产品的出现让原本基于CPU集群设计的昂贵超级计算机,变为性能相当价格相对低廉的GPU集群超级计算机,这对于很多专业领域提升工作效率有极大帮助。
而且值得一提的是,GPU的非3D并行计算无需多卡互联技术,即SLI和CrossFire,也就是说在同一平台上能够安置更多的GPU性能就会有相应的提升。例如在Folding@Home计算上,如果我们使用华硕P6T7 WS SuperComputer和7张影驰GTX260+无双,就可实现目前使用娱乐级桌面产品能够实现的最强计算平台。
当然,笔者必须承认上述的极端例子,在现实生活非常少,不过随着影驰GTX260+无双的出现会给专业领域,甚至我们大众型用户未来使用的产品带来深远影响。
● 测试意外收获 7显平台达成
在测试中,当笔者将7块影驰正确安装后,在显示设置中笔者发现该系统下能够连接7台显示器,虽然相比AMD目前推出的Eyefinity技术实现成本高很多,而且NVIDIA也有专门针对多显平台设计的产品,不过得到这样的功能验证是笔者的一个意外收获。
当然,不会有用户用这种平台来仅是来完成7显方案,不过笔者需要说的是,想在千元中高端产品中实现这个功能,仅有影驰GTX260+无双才能实现,足见轻薄身材设计的重要性。
● ZOL显卡频道观点
通过本文的测试很多用户都会对无法组建7-Way SLI感到失望,不过通过该测试让我们了解到影驰GTX260+无双在多卡使用过程中的优势,例如其不会浪费主板扩展接口、增大机箱散热效能,同时影驰GTX260+无双不会为了轻薄而牺牲散热效能,纯铜材质均热板散热技术的加入,让其成为主流千元市场中的一颗耀眼新星。
同时,在GPU芯片供货紧张的今天,很多低价位GeForce GTX 260+有价无货,而影驰从用户角度出发不仅将价格定在1299元上,还同时保障产品供货量需求。
优势:唯一一款单槽风冷GeForce GTX 260+;
散热器使用纯铜材质均热板技术;
价格仅为1299元;
附件中免费赠送NVIDIA的3D Discover眼镜;
原生HDMI 1.3接口,方便高清用户使用;
劣势:产品虽然采用轻薄散热器设计,但是由于散热器材质为纯铜,所以显卡整体自重很大,在没有PCB加固条情况下有可能造成PCB弯曲。