在DIY板卡发展差异化愈加明显的今天,国内板卡厂商铭瑄为了迎合现时游戏用户的口味,强势推出了全新的“黑武士”系列游戏显卡。铭瑄针对该系列显卡的超频能力而对PCB电路进行优化,选取体质极佳的GPU芯片和显存颗粒,配合“黑武士”上出色的做工和用料,使得“黑武士”系列显卡比普通显卡的超频能力获得明显提升。
继7月中旬发布的GeForce GTX460后,面向千元以下级别市场基于新一代Fermi架构的核心GF106产品GeForce GTS450也终于正式问世。核心规格方面,GTS450将会拥有192个流处理器、4个多边形引擎、32个纹理单元,核心规格就刚好是GF104核心的一半(完整的GF104拥有384个流处理器、8个多边形引擎、64个纹理单元)。
根据NVIDIA针对GF100、GF104和GF106的定位为除了一个较为形象的比喻,GF100拥有最猛火力的重装战士,而GF104是具备杀伤力武器的机动战士。而GF106被定义为“Sniper”(狙击手),拥有一击毙命的本事,足见NVIDIA对这款产品的厚望。
通过上面GF100、GF104和GF106的核心架构图,我们发现虽然在整体架构上三者保持了Fermi的完整性,例如GPC→SM→CUDA Core由广到微的等级结构,例如独立的Polymorph Engine和Raster Engine的设计等。
今天来到中关村在线显卡频道的是由铭瑄送测的黑武士系列GTS450显卡,这款显卡为非公版PCB和风扇设计。同时显卡频率也不同幅度超越公版设计,为了检测这款显卡的性能,我们对比了公版GTS450和AMD HD5770显卡。铭瑄在以星际争霸2为代表的众多游戏中能否为用户带来精彩表现,我们将在今天的评测中为关注非公版GTX400系列的用户揭晓。
● 铭瑄黑武士GTS450拆解赏析
铭瑄黑武士GTS450使用了GF106核心,它的规模可以视为GF104芯片的一半。继7月中旬发布的GeForce GTX460后,面向千元以下级别市场基于新一代Fermi架构的核心GF106产品GeForce GTS450也终于正式问世。
铭瑄Geforce GTS450黑武士显卡基于全新40nm工艺制造的GF106显示核心,核心规格方面,GTS450将会拥有192个流处理器、4个多边形引擎、32个纹理单元,核心规格就刚好是GF104核心的一半(完整的GF104拥有384个流处理器、8个多边形引擎、64个纹理单元)。
和GF100使用专门的DP双精度单元来运算64-bit双精度浮点不同,GF104和GF106芯片舍弃了这个单元,这节省了大量的寄存器所占用的晶体管,但是回归了使用SFU单元来运算双精度的方式,这是在GT200芯片中已经被大家熟知的运算方式。它的特点是双精度性能大约是单精度的1/8-1/12。
铭瑄Geforce GTS450黑武士显卡散热器
铭瑄Geforce GTS450黑武士显卡核心散热器采用了轴流式风扇搭配开放式散热鳍的组合。而散热鳍的组合为铜质吸热底加铝挤散热模块组合,吸热底吸收的热量直接传送到上端的大面积铝制散热块中。
供电方面,由于此卡定位于高频超频级显卡所以在供电设计上也较比公版有提升,显卡采用了高品质的3+1相的供电设计,并选用R30封闭式电感配以富士通FP全固态电容制作,并且每相供电均配备了3个传统三脚MOSFET管。
显存方面,铭瑄Geforce GTS450黑武士显卡自带1GB容量GDDR5显存,显存位宽分别为256bit,默认频率设定在880/3900MHz(核心/显存),如果玩家将核心超至1000MHz,游戏性能还将可大幅提升。
接口方面,铭瑄Geforce GTS450黑武士显卡采用了类似AMD 5系列显卡的上下布局DVI接口的方式,并且加入了VGA接口,HDMI接口依然得到保留。可看作在原有公版接口布局的基础上添加了VGA接口以增加通用性,十分实用。
在这个环节,我们使用了常用的GPU-Z软件和EVEREST系统信息检测软件来测试这款显卡的基本信息。
铭瑄Geforce GTS450黑武士 GPU-Z信息
在GPU-Z信息测试中,软件识别出了这款产品的基本情况,我们可以看到它使用了集成192个流处理器的GF106核心,40nm工艺。这款显卡的频率和中国版的875MHz相近,达到880MHz,核心与Shader比为1:2,着色器频率达到1760MHz。
在GPU通用计算能力方面GPU-Z也做了功能识别,GF106图形核心支持GPU-Z软件能够识别的所有功能,OpenCL、CUDA、PhysX和DirectCompute 5.0。
显存方面,受益于DDR5的高预取位带来的高频率,加之GTS450使用的128位显存控制器,最终显存带宽达到了62.4GB/s,当然我们看到显存向上提升的空间还很大,同时128位显存控制器可以最大限度节省晶体管使用量,这符合GF106芯片的市场定位。
在传感器页面,我们看到了这款显卡的传感器能够准确识别显卡的工作状态,没有一个参数错误或者遗漏,特别是GPU温度侦测比较全面。我们用Furmark做了一个简单的3D负载,发现传感器对于温度的检测非常准确,GPU核心也支持频率自适应变化以降低功耗,风扇转速同样随温度变化。其强大的频率控制能力让核心频率最低能下探到50MHz,这可以更大程度上降低芯片功耗。
上图是EVEREST检测结果,我们首先选择“图形处理器”,但是由于软件版本限制没有检测到可用信息。我们换用“GPGPU”页面,得到了这款核心的通用计算能力。但是具体参数仍然大量识别错误。它的Warp粒度为每个Warp拥有32个线程。
当然对于32位和64位原子操作,GTS450都是支持的。同时值得注意的还有从GT200架构开始支持的双精度能力和Warp Vote功能。这些特性使得Fermi架构的计算性能获得前所未有的提升。在低端产品中同样提供双精度支持,是本次Fermi架构带给用户的重要特性。
我们使用了SiSoftware Sandra 2010版软件来检测这款显卡所搭载的GPU理论浮点吞吐量。这个测试可以检测GPU的Shader单元运算能力,虽然它是面向通用计算程序设计的,但是在一些较为高端的对Shader负载较重的游戏中,Shader单元运算能力强的显卡可以有更强劲的发挥和更小的性能衰减。
需要注意的是这里检测的仅是理论浮点值,实际运算环境中将会包含大量跳转嵌套分支等指令,只有运算器组织得当的GPU,才能有效避免理论值的大幅度衰减。测试对N卡和A卡都默认基于Open CL编程接口,同时测试者可以自行选择编程接口,所以测试结果无论是对于NVIDIA还是AMD都比较公正。
我们使用的版本号是16.36.2010,测试方法是进入程序后,选择界面中的Benchmark工具,然后选择GPGPU Processing项目。
铭瑄Geforce GTS450黑武士 SiSoftware Sandra GPGPU检测
在所列出的几个对比测试中,我们看到铭瑄Geforce GTS450黑武士显卡继承了Fermi架构的全部特性,特别是在理论值上完全放弃FLOPS,转向更深层次的架构优化设计。所以我们在理论值测试中看到它没有什么特别的表现,而未来我们将测试实际运算能力,铭瑄Geforce GTS450黑武士将体现出大幅超越前代产品的态势。我们可以通过图表读出铭瑄Geforce GTS450黑武士单精度能力低于GTS250,而双精度能力超越GTX260+。
这个测试图表的横轴是单精度Shader型浮点,而纵轴是双精度Shader型浮点,我们能够看到铭瑄Geforce GTS450黑武士单精度浮点性能符合Geforce类型的桌面型产品,而目前在Fermi架构GF100芯片中只有高性能计算级别的Tesla专用加速卡才拥有业界顶级的双精度运算能力,民用的GF106产品在双精度能力上做了限制。
在正式图形性能测试开始之前我们对铭瑄Geforce GTS450黑武士显卡的稳定性也做了测试,使用的软件是大家公认的也是常用的Furmark,版本号1.8.0。
稳定性与温度测试FurMark是oZone3D开发的一款OpenGL基准测试工具,通过皮毛渲染算法来衡量显卡的性能,同时还能借此考验显卡的稳定性。
通过测试我们看到,铭瑄Geforce GTS450黑武士的轴流式风扇搭配开放式散热鳍发挥出了较强的性能。测试起始温度48度,最高温度没有超过78度。在满载过程中,铭瑄Geforce GTS450黑武士显卡表现稳定,但是散热器热容量较小,需要借助较高的风扇转速才能完成对GF106核心的散热。
● GPU通用计算-Media Coder NT for CUDA
MediaCoder是一个免费的通用影音转码工具,它将众多来自开源社区的优秀音频视频编解码器和工具进行整合,让用户可以自由地转换音频和视频文件,可满足各种场合下的转码需求。软件自2005年问世以来,被全球广大多媒体爱好者广泛使用,曾经入围SourceForge.net优秀软件项目,被众多网站和报刊杂志介绍和推荐,其中包括:《CNET》、《PC World》、《ZDnet》、《USA Today》、《New York Times》、印度《Techtree》、德国《Der Spiegel》、德国《Bild》、德国《La Nación》、墨西哥《El Universal》、泰国《Bangkok Post》、德国《Chip》、俄罗斯《Computerra》。
软件识别GF106计算能力为2.1版本
对于MediaCoder NT这款针对CUDA变成的软件,对于所有N卡用户来说都是一个好消息。
● GTS450实战Adobe Photoshop
Adobe Photoshop CS4、Adobe After Effects CS4、Adobe Premiere Pro CS4三款软件支持CUDA技术。Adobe Photoshop CS4包含在Design Standard版本中,而Adobe After Effects CS4及Adobe Premiere Pro CS4则包含在Production Premium、Master Collection版本中。
Adobe After Effects适用于从事设计和视频特技的机构,包括电视台、动画制作公司、个人后期制作工作室以及多媒体工作室。通过CUDA技术,After Effects CS4可以实现诸如景深、双向模糊、有机纹理等特效,可以帮助开发人员迅速的将思维中的设计构想展示出来。
NVIDIA给Fermi的定义是:新一代CUDA计算与图形架构。它采纳了用户在使用G80和GT200架构时给出的建议,针对双精度运算、ECC内存容错能力、Cache体系结构、上下文切换和原子读写操作等方面进行了全新的设计。
Fermi架构的GTX400系列产品通过新的架构设计不仅仅增加了计算能力,并且支持更好的可编程能力和计算效果。所以我们看到沿用了3代的流处理器概念,在Fermi架构中,已经被改为CUDA Cores,这再次说明NVIDIA对通用计算的重视程度。
勾选启用NVIDIA OPENGL绘图:并将下面高级设置中的所有选项都勾上,NVIDIA CUDA设备就开始为PHOTOSHOP CS4工作了。这里显示Adobe Photoshop CS4已经识别出我们的显卡。
Photoshop是我们都熟知的软件,在以下的两个视频中可以观察到使用GPU与CPU分别对图片进行局部缩放的不同,通过视频我们可以看到图片大小在100MB以上,在我们日常见到的图片中已属巨大。
开启GPU加速:
关闭GPU加速:
仔细观察你就会发现有无GPU加速之间的差距是如此的明显,在使用GPU加速时图片在放大缩小时可以做到完全的实时,非常的平滑,给人一种非常流畅的感觉,而没有使用GPU加速每次进行放大和缩小时都会先卡一下,而且在也不平滑,会发现画面在缩放时先是被切割成几个像素块,然后才能拼凑成操作后的样子。
“在家里就能得到好莱坞式的体验,借助PowerDVD(CyberLink)等软件,利用HDMI 1.3/1.4线缆与A/V功放相连,可以欣赏24bit/192KHz的多声道音频,或者是无损的DTS-HD Master Audio和Dolby TrueHD。”,在NVIDIA的介绍文档中,GTX460、GTS450已经对源码输出实现支持,而最新的GT430也提供了完美的支持,在完善的驱动和软件支持下,N卡终于可以而实现次世代源码输出。
铭瑄GTS450黑武士实战源码输出
硬件方面,由铭瑄GTS450黑武士、GT430巨无霸实现源码输出,音频解码则由次世代功放天龙AVR-1610负责,显示设备未长虹42寸LCD,链接方式HDMI 1.3。
软件部分,显卡驱动程序使用了最新的Forceware 260.99 WHQL,播放软件则是著名的PowerDVD10 Ultra 2113,播放片源为《Category 7 The End of the World》蓝光盘,音轨DTS-HD Master。
我们的测试平台 铭瑄GTS450黑武士显卡
可以看到,在PowerDVD中播放,能够选择高清源码输出(输出到外接设备的未解码高清音频),并且能正确输出到天龙功放上,显示DTS HD Master,HD Audio蓝灯顺利亮起。同时可以看到,铭瑄GT430/GTS450能够实现GPU高清完美硬解码,CPU占用率基本徘徊在1%左右。
经过对蓝光的源码输出的实测,NVIDIA新一代显卡终于能够完美支持源码输出,虽然比对手支持要晚,但毕竟做到了,在高清逐渐普及的同时,源码输出也渐渐成为高清用户新的追求,配合独用的PureVideo HD高清技术,相信GT430/GTS450系列产品会为用户带来更完美的享受,在高清应用方面大放异彩。
● 性能测试的硬件、软件平台状况
● 测试系统硬件环境
测 试 平 台 硬 件 | |||||||||||||
| |||||||||||||
显示卡 | |||||||||||||
NVIDIA 产 品 | |||||||||||||
铭瑄黑武士GeForce GTS 450 | |||||||||||||
(GF106 / 1024MB / 核心:880MHz / Shader:1760Mhz / 显存:3900 Mhz) | |||||||||||||
GeForce GTS 450 国际版 | |||||||||||||
(GF106 / 1024MB / 核心:783MHz / Shader:1566Mhz / 显存:3600 Mhz) | |||||||||||||
AMD 产 品 | |||||||||||||
Radeon HD 5770 | |||||||||||||
(RV840 / 1024MB / 核心:850MHz / Shader: 850MHz / 显存:4600MHz) | |||||||||||||
硬盘 | Hitachi 1T | ||||||||||||
(1TB / 7200RPM / 16M | |||||||||||||
电源供应器 | AcBel R8 ATX-700CA-AB8FB | ||||||||||||
(ATX12V 2.0 / 700W) | |||||||||||||
显示器 | DELL UltraSharp 3008WFP | ||||||||||||
(30英寸LCD / 2560*1600分辨率) |
ASUS P7P55D
Thermalright Ultra-120 eXtreme
我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,电源供应器、CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供。
● 测试系统的软件环境
操 作 系 统 及 驱 动 | |
操作系统 | |
Microsoft Windows 7 Ultimate RTM | |
(中文版 / 版本号7600) | |
主板芯片组 驱动 |
Intel Chipset Device Software for Win7 |
(WHQL / 版本号 9.1.1.1125) | |
显卡驱动 | |
AMD Catalyst for Win7 | |
(WHQL / 版本号 10.8a) | |
NVIDIA Forceware for Win7 | |
(Beta / 版本号 260.52) | |
|
2560*1600_32bit 60Hz |
测 试 平 台 软 件 | ||
3D合成 测试软件 | ||
3Dmark Vantage | ||
Futuremark / 版本号1.2 | ||
3D游戏 测试项目 | ||
DirectX 9游戏 | ||
Star Craft II | ||
Blizzard / 版本号 1.0 | ||
DirectX 10游戏 | Company of Heroes | |
Relic / 版本号1.7.1 | ||
DirectX 11游戏 | ||
Heaven Benchmark 2.1 | ||
UNIGINE / 版本号 2.1 | ||
Colin McRae DiRT 2 | ||
Codemasters / 版本号 1.01 | ||
辅助测试软件 | GPU通用计算测试 | Folding@home分布式计算项目 |
GPU3客户端 任务10632 | ||
Fraps | ||
beepa / 版本号 3.2.3 |
各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。
● DX10理论性能测试:3Dmark Vantage
3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。
● Heaven Benchmark 2.1
《Heaven Benchmark 2.1》是由俄罗斯Unigine游戏公司开发设计的一款Benchmark程序,该程序是由Unigine公司自主研发的游戏引擎设计,其支持DirectX 9、DirectX 10、DirectX 11与OpenGL 3.2 API,通过26个场景的测试最终得出显卡的实际效能。
>>游戏类型:DirectX 9/10/11及OpenGL Benchmark
>>
>>画质设定:全部最高
● StarCraft II
星际争霸2(StarCraft II)是著名即时战略游戏《星际争霸》的续篇, 由2007年5月19日在韩国首尔开幕的暴雪全球邀请赛宣布。目前以Windows XP、Windows Vista和Mac OS X为支援平台。这款游戏的开发在2003年《魔兽争霸III:冰封王座》出版后就开始。至今,公测版免费试玩。
>>游戏类型:DirectX9 即时战略游戏
>>测试方式:开始场景一段游戏的自行录像回放
>>画质设定:可设置的全部最高
● Company of Heroes
Company of Heroes(英雄连)是一款即时战略类游戏。二战是几年来长盛不衰的3D游戏题材,Company of Heroes就是从101空降师诺曼底登陆后在欧洲战场血战题材入手的最新战略游戏,不过其自带测试并非针对即时战略的实际场景,反而更像第一人称视角游戏。
>>游戏类型:DirectX10 即时战略游戏
>>测试方式:游戏自带性能测试工具,内容为3D实时运算的剧情过场回放
>>画质设定:全部最高
● Colin McRae:DiRT2
《科林麦克雷:尘埃》本身是一款为纪念去世的英国拉力赛车手科林.麦克雷(Colin McRae)而制作的游戏,因此在游戏过程中不难见到许多麦克雷过往的身影,距前作将近二年多之久的《科林麦克雷:尘埃2》于2009月12月11日正式发售。值得一提的是,这款游戏不仅拥有很高的可玩性,同时还是率先支持DirectX 11 API的游戏,一经上市就得到广大游戏爱好者争相追捧。
>>游戏类型:DirectX 11竞速类游戏
>>测试方式:
>>画质设定:全部最高
● Folding@home运算测试
Folding@home是一个研究蛋白质折叠,误折,聚合及由此引起的相关疾病的分布式计算项目。我们使用联网式的计算方式和大量的分布式计算能力来模拟蛋白质折叠的过程,并指引我们近期对由折叠引起的疾病的一系列研究,找到相关疾病的发病原因和治疗方法。
Folding@home能了解蛋白质折叠、误折以及相关的疾病。目前进行中的研究有:癌症、阿兹海默症(老年失智症)、亨廷顿病、成骨不全症、帕金森氏症、核糖体与抗生素。
GTS450显卡运行Folding@Home项目
该项目在中国拥有约2000多名参与者,其中最强大的China Folding@Home Power(Folding@Home中国力量,团队编号3213)团队已经拥有2585人,最近活跃用户200人以上,目前贡献计算量排名世界第33位,团队整体运算能力约为80到100TFLOPS。
铭瑄黑武士系列显卡
铭瑄Geforce GTS450黑武士显卡
铭瑄在第一时间推出了公版GTS450显卡,而后又迅速推出了这款超公版设计GTS450黑武士版本。铭瑄黑武士显卡代表了目前Geforce GTX400芯片中较强的做工和散热能力,黑武士系列不但默认频率较高,同时还留出一定超频空间。同时这款显卡基于第二代Fermi核心,在性能、功耗、发热方面达到了前所未有的平衡。
优势:基于代号GF106的40nm工艺Fermi第二代核心;
供电设计稳重,性能表现超越公版;
产品定价有诚意,渠道与质保建设完善。
劣势:散热器体积导致热容量小,风扇转速较高,满载噪音稍高于其他产品。