双芯G92终极形态全球首测
● 单卡双芯G92终极形态全球首测
在图形领域,有这样一颗核心,虽然在它大部分生命周期中都被冠以马甲的称呼,但不可否认,它超脱了摩尔定律延续了长达3年甚至以上的生命周期本身就铸就了它的经典地位,它就是NVIDIA有史以来最成功的图形核心——G92。历数我们所熟知的众多中高端显卡,没有一款核心能像NVIDIA发布的G92这样经典不衰,从2007年10月29日最初版本Geforce 8800GT发布至今,高产的G92核心创造了无数经典产品,并长期控制中高端市场。
NVIDIA G92核心
在将近3年的时间中,G92核心的制造工艺从成熟的65nm演变为更加注重节能的55nm工艺,核心频率也获得了不断提升,除了让人羡慕的性能之外还有什么能引起我们的关注,还有什么性能亮点值得厂商不断挖掘?
在GTX480/470公版显卡发布之后,索泰用自己的研发实力给所有玩家展现了G92核心最后的辉煌,仅有7.54亿个晶体管的G92芯片在组成单卡双芯阵容之后,击败了19.5亿个晶体管如日中天的GF104芯片,虽然不支持先进的DirectX11技术,但这款显卡无论是从收藏意义还是从性价比方面都达到了资深显卡玩家追求的目标。
索泰GTS250双雄首发版正面
今天送测中关村在线显卡频道评测室的是一款由索泰提供的单卡双芯GTS250显卡,按照之前索泰厂商爆料出的新闻来看,这款显卡的正式名称为“索泰GTS250双雄首发版”,这款显卡的面世并不代表G92还有更长远的历程可以探索,反倒是索泰希望用自己AIC的身份为NVIDIA G92芯片划上圆满的句号。
这款显卡将两颗G92-462-B1芯片制作在一张PCB上,同时使用了豪华的供电元件以提供优良的电气性能。这款显卡实际上和双核心9800GX2的设计思路是相同的,只不过索泰使用一张PCB将两颗G92芯片和NF200桥接放上去,这种设计对显卡的研发功力是一次极大的考验,因为要在尽量控制成本的前提下使用高端供电设备,同时要保证这两颗高频GPU芯片正常工作。
也许很多用户觉得G92核心已经失去存在的意义,或者说相对于Fermi架构的巨大改进,G92已经在很多领域失去了自己的控制力,但实际上处于生命末期的G92芯片还是能够提供一些令人意想不到的性能。特别是在高性能计算领域,G92核心可以凭借较高的浮点吞吐能力在很多项目中压制GF104等核心的表现,这是一个让人惊讶的结果。今天我们的评测,正是希望和用户通过索泰扎实的研发实力,一起分析G92最后的优势和特性。
【每日三大件报价】i5-760跌出性价比 1TB硬盘惊爆395元
索泰GTS250双雄首发做工赏析
● 索泰GTS250双雄首发做工赏析
索泰GTS250双雄首发版使用了单张PCB承载两颗GPU核心的模式,让每颗核心都用充分的热量排放空间,同时整卡使用了两个一体化的开放式散热器,虽然体积比起公版GTS250要小很多,但是高转速和合理的散热鳍片设计会增强这款显卡的散热能力。
索泰GTS250双雄首发版正面
这款显卡散热器使用了4pin风扇接口,这样可以有效侦测GPU核心温度,同时对风扇转速做出实时控制。同时在顶部供电部分也搭载了散热片,高温工作下的“八爪鱼”MOSFET管能够得到更稳定的发挥。
显卡采用了索泰高端显卡惯用的越肩式设计,在合理控制PCB长度的同时,还能够提供足够的空间布放复杂电路。在PCB的最上端,布置着由8爪鱼高效供电元件、钽电容、磁屏电感组成的豪华7相供电,其中的6相是对应到两颗GTS250核心,额外的一相对应PCI-E供电。
在PCB左下端,还布置着两相供电,则是分别对应到两套显存的供电。也就是说,索泰GTS250双雄首发版每颗核心采用了3+1相供电设计。
翻看显卡背面,我们可以发现两颗类似显存的元件,其实如果对高端板卡,特别是索泰至尊系列显卡比较了解的用户,都知道这是Proadlizer去耦滤波元件,由于拥有极为出色的高频特性,所以在保证显卡高频稳定运行方面具有非常重要的意义。
这款显卡基于G92-426-B1核心,核心采用55nm工艺制程,拥有完整的128个流处理器,7.54亿个晶体管,核心支持DX 10.0和SM 4.0特效,支持Phsyx物理引擎、CUDA并行运算。这款核心代表了G92家族最高规格和最平衡设计,同时拥有出色的通用计算能力,可以在日常操作中优化很多软件的运行速度。
这颗芯片相信大家不会陌生,NVIDIA显卡在做单卡双芯产品是都离不开它——NF200。它可以将PCI-E总线分配给两颗核心,并进行通信联系,让显卡更高效有序的处理数据。
索泰GTS250双雄首发版使用了速度为1.0ns的hynix GDDR3颗粒,总共配备了16颗,也就意味着每颗GTS250核心都将拥有512MB/256bit显存可使用。显卡额定频率使用了NVIDIA定义的GTS250绿色版频率:675/1620/2000MHz,但我们在后文的测试中发现每颗GPU拥有3项供电设计的索泰GTS250双雄首发版显卡完全可以工作在公版单卡单芯GTS250的738/1836/2200MHz高频下。
索泰GTS250双雄首发版显卡标配DVI + D-Sub + HDMI的组合,这样的组合不仅能够满足普通用户在终端显示设备上的选择,同时在HTPC和高清用户方面,HDMI接口的引入能够更加方便高清欣赏。
GTS250双雄首发基本信息展示
● 索泰GTS250双雄首发版基本信息展示
在这个环节,我们使用了常用的GPU-Z软件和EVEREST系统信息检测软件来测试索泰GTS250双雄首发版显卡的基本信息。
索泰GTS250双雄首发版显卡GPU-Z信息
在GPU-Z信息测试中,软件识别出了这款产品的基本情况,我们可以看到它使用了集成完整128个流处理器的G92核心,55nm工艺(GPU-Z识别出错)、7.54亿个晶体管。
索泰决定将这款节能版显卡的频率设定在低于GTS250公版的绿色版频率:675/1620/2000MHz,这种设计给用户留下了足够的余量来进一步探索显卡潜能。我们在NVIDIA SLI选项中看到了SLI加速模式已经打开,这意味着两颗GPU芯片将会协同图形渲染。
显存方面,索泰GTS250双雄首发版显卡使用了256位显存控制器,相对于最初的Geforce 8800GTX显卡的384位显存控制器减小了芯片面积,降低芯片是生产成本和功耗,但是搭配高速DDR3显存之后,最终显存带宽还是达到了63.9GB/s。
在传感器页面,我们看到了这款显卡的传感器能够准确识别显卡的工作状态。我们用Furmark做了一个简单的3D负载,发现传感器对于温度的检测非常准确,但是GPU核心无法根据频率自适应变化以降低功耗,风扇转速也能够正常侦测,显卡在满载时没有超过80度,这个结果印证了显卡散热器的设计是足够压制核心的。
上图是EVEREST软件检测结果,我们选择“图形处理器”,得到了这款显卡的相关信息。EVEREST软件的检测结果和GPU-Z完全吻合。当然我们比较遗憾的看到这款显卡不支持频率等级调节,也就是说在2D和轻3D负载中,这款显卡频率不会发生自动下调,这可能是P360节能版的设计特性,也有可能是送测产品的BIOS没有写入这项功能。
着色器计算能力与温度和稳定性检测
● 着色器计算能力与温度和稳定性检测
我们使用了SiSoftware Sandra 2010版软件来检测这款显卡所搭载的GPU理论浮点吞吐量。这个测试可以检测GPU的Shader单元运算能力,虽然它是面向通用计算程序设计的,但是在一些较为高端的对Shader负载较重的游戏如Crysis中,Shader单元运算能力强的显卡可以有更强劲的发挥和更小的性能衰减。
需要注意的是这里检测的仅是理论浮点值,实际运算环境中将会包含大量跳转嵌套分支等指令,只有运算器组织得当的GPU,才能有效避免理论值的大幅度衰减。测试能够对不同的GPU核心自适应选择最佳的编程接口,所以测试结果无论是对于NVIDIA还是AMD都比较公正。
我们使用的版本号是16.36.2010,测试方法是进入程序后,选择界面中的Benchmark工具,然后选择GPGPU Processing项目。
索泰GTS250双雄首发版显卡 SiSoftware Sandra GPGPU检测
在所列出的几个对比测试中,我们看到索泰GTS250双雄首发版显卡的单精度Shader型浮点性能和老版本的G92核心9800GX2几乎相当,这印证了高频率所带来的性能。
SiSoftware Sandra GPGPU检测中的双精度Shader型浮点不是严格限定必须支持双精度才能进行,在遇到不支持双精度的显卡时,Shader型浮点可以用单精度来模拟双精度运算,但是此时难免带来性能衰减。索泰GTS250双雄首发版显卡所搭载的G92核心就遇到了这个问题,模拟双精度Shader型浮点的运算能力无法和GT200芯片的GTX260+原生双精度能力相比。
在正式图形性能测试开始之前我们对索泰GTS250双雄首发版显卡的稳定性也做了测试,使用的软件是大家公认的也是最为常用的Furmark,版本号1.8.0。
FurMark是oZone3D开发的一款OpenGL基准测试工具,通过皮毛渲染算法来衡量显卡的性能,同时还能借此考验显卡的稳定性。
通过测试我们看到这款显卡的散热器发挥出了较强的性能,和其他显卡的温度曲线不同,索泰GTS250双雄首发版显卡温度上升较为平滑,这说明在待机模式下显卡风扇转速很低,所以GPU温度维持在一个较为稳定的区域。由于我们在温度测试中没有打开SLI选项,所以造成另外一颗核心没有图形负载,所以随着风扇速度的加快另外一颗核心温度逐步下降。
实测温度显示这款显卡在搭载了两个开放式铝鳍散热器后,温度控制能力令人满意,最高温度没有超过80度,这远低于公版9800GX2运行时的极限温度。不过我们还是我们建议用户使用这款显卡后一定要做好机箱风道设计,否则在重度3D负载中可能引起不稳定。
性能测试的硬件、软件平台状况
性能测试的硬件、软件平台状况
● 测试系统硬件环境
测 试 平 台 硬 件 | |
中央处理器 | Intel Core i7-870 |
散热器 | Thermalright Ultra-120 eXtreme |
内存模组 | Apacer 猎豹二代双通道套装/PC3-12800 |
(SPD:1757 9-9-9-24-1T) | |
主板 | ASUS P7P55D |
(Intel P55 + ICH10R Chipset) | |
显示卡 | |
NVIDIA 产 品 | |
NVIDIA GTX460 768MB | |
(GF104 / 768MB / 核心:675MHz / Shader:1350Mhz 显存:3600 Mhz) | |
索泰GTS250双雄首发版 | |
(G92 / 512MB / 核心:675MHz / Shader:1620MHz / 显存:2000MHz) | |
AMD 产 品 | |
Radeon HD 5830 | |
(RV870 / 1024MB / 核心:800MHz / Shader: 800MHz / 显存:4000MHz) | |
Radeon HD 5770 | |
(RV840 / 1024MB / 核心:850MHz / Shader: 850MHz / 显存:4800MHz) | |
硬盘 | Hitachi 1T |
(1TB / 7200RPM / 16M | |
电源供应器 | AcBel R8 ATX-700CA-AB8FB |
(ATX12V 2.0 / 700W) | |
显示器 | DELL UltraSharp U2410 |
(24英寸LCD / 1920*1200分辨率) |
ASUS P7P55D
Thermalright Ultra-120 eXtreme
我们的硬件评测使用的内存模组、电源供应器、CPU散热器均由COOLIFE玩家国度俱乐部提供,COOLIFE玩家国度俱乐部是华硕(ASUS)玩家国度官方店、英特尔(Intel)至尊地带旗舰店和芝奇(G.SKILL)北京旗舰店,同时也是康舒(AcBel)和利民(Thermalright)的北京总代理。
● 测试系统的软件环境
操 作 系 统 及 驱 动 | |
操作系统 | |
Microsoft Windows 7 Ultimate RTM | |
(中文版 / 版本号7600) | |
主板芯片组 驱动 |
Intel Chipset Device Software for Win7 |
(WHQL / 版本号 9.1.1.1125) | |
显卡驱动 | |
AMD Catalyst for Win7 | |
(WHQL / 版本号 10.6) | |
NVIDIA Forceware for Win7 | |
(WHQL / 版本号 257.21) | |
NVIDIA Forceware for GTX460 | |
(Beta / 版本号 258.50) | |
|
2560*1600_32bit 60Hz |
测 试 平 台 软 件 | ||
3D合成 测试软件 |
3Dmark 06 | |
Futuremark / 版本号1.2 | ||
3Dmark Vantage | ||
Futuremark / 版本号1.2 | ||
3D游戏 测试项目 | ||
DirectX 9游戏 | ||
Street Fighter IV | ||
Comcap / 版本号1.0 | ||
DirectX 10游戏 | ||
Crysis | ||
Crytek / 版本号1.2.1 | ||
Farcry2 | ||
Ubisoft / 版本号 1.0 | ||
GPU通用计算 | Sisoft GPGPU着色器性能 | |
单精度Shader型浮点 | ||
Sisoft GPGPU着色器性能 | ||
双精度Shader型浮点 | ||
DirectX 10 SDK Nbody Gravity | ||
Microsoft / 版本号 Demo | ||
Foldine@home分布式计算项目 | ||
GPU3客户端 任务10632 | ||
辅助测试软件 | Fraps | |
beepa / 版本号 3.2.3 |
DX9理论性能测试:3DMark 06
● DX9理论性能测试:3DMark 06
3Dmark 06作为上一代3DMark系列巅峰之作,所有测试都需要支持SM3.0的DirectX 9硬件,并且支持HDR特性,这款软件的最终得分里CPU性能占有不小的权重,因此它更适宜分析整个系统的3D加速能力。
DX10理论性能测试:3Dmark Vantage
● DX10理论性能测试:3Dmark Vantage
3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。
DirectX9游戏测试《街头霸王4》
● DirectX9游戏测试《街头霸王4》
由CAPCOM负责开发的格斗游戏《街头霸王4》(Street Fighter 4)早已在电视游戏机上发售,经过漫长的等待,街霸迷们终于盼到了PC版的发布。本作不仅继承了TV Game版的所有特色,还增加更多诸如画面风格等特色。
>>游戏类型:DirectX9格斗类游戏
>>测试方式:游戏自带性能测试工具,内容为3D实时运算的战斗回放
>>画质设定:全部最高
DX10游戏-孤岛危机
● Crysis
跳票多时、万众期待的DirectX 10游戏大作Crysis,把目前PC 3D娱乐的视觉体验发挥到极致的游戏,大量使用DirectX 10的硬件功能,对显卡的负载也提升至空前水平。
>>游戏类型:DirectX10 第一人称视角射击游戏
>>测试方式:游戏自带GPU性能测试工具,为3D实时运算的飞行过场回放
>>画质设定:全部最高
DX10.1游戏-孤岛惊魂2
● FarCry2
使用CryENGINE®和PolyBump™折服世人的经典之作FarCry推出了第二代作品——FarCry2,这款作品无论是游戏引擎还是画面设计都有了长足进步,该作仍然由Ubisoft发布。
>>游戏类型:DirectX10 第一人称射击游戏
>>测试方式:游戏自带性能测试工具,内容为3D实时运算的战斗回放
>>画质设定:全部最高
GPGPU着色器性能-单精度Shader
● Sisoft GPGPU着色器性能-单精度Shader型浮点
我们使用了SiSoftware Sandra 2010版软件来检测这款所搭载的GPU理论浮点吞吐量。这个测试可以检测GPU的Shader单元运算能力,虽然它是面向通用计算程序设计的,但是在一些较为高端的对Shader负载较重的游戏中,Shader单元运算能力强的显卡可以有更强劲的发挥和更小的性能衰减。
我们使用的版本号是16.36.2010,测试方法是进入程序后,选择界面中的Benchmark工具,然后选择GPGPU Processing项目。
在本回合竞争中,索泰GTS250双雄首发版显卡取得圆满胜利,两颗核心带来的几乎无人能敌的单精度实力证明了它在通用计算领域存在的价值。
需要注意的是单精度Shader型浮点检测的同样是理论浮点值,实际运算环境中将会包含大量跳转嵌套分支等指令,只有运算器组织得当的GPU,才能有效避免理论值的大幅度衰减。
GPGPU着色器性能-双精度Shader
● Sisoft GPGPU着色器性能-双精度Shader型浮点
在双精度测试中,我们同样使用SiSoftware Sandra 2010版软件来检测显卡所搭载的GPU理论浮点吞吐量。对于没有双精度单元或者不支持双精度运算的GPU,则使用单精度模拟的方式来测试它的双精度Shader型浮点性能,因此一些低端显卡或HD3000系列之前的显卡双精度性能不可能为零。
我们使用的版本号是16.36.2010,测试方法是进入程序后,选择界面中的Benchmark工具,然后选择GPGPU Processing项目。
本回合竞争中,索泰GTS250双雄首发版显卡由于不支持原生双精度能力而败给Fermi架构和GT200架构,很明显通过软件转换的双精度Shader型浮点测试让这款显卡的运算能力比起原生双精度支持损失了很多。
需要注意的是双精度检测的同样是理论浮点值,实际运算环境中将会包含大量跳转嵌套分支等指令,只有运算器组织得当的GPU,才能有效避免理论值的大幅度衰减。并且双精度运算在目前的图形计算中是没有任何用处的,所以被取消的双精度单元GPU不会在游戏中出现任何性能下降。
DirectX 10 SDK N Body Gravity
● DirectX 10 SDK N Body Gravity
DirectX 10 SDK N Body Gravity应用于高级实时渲染的3D图形和游戏,它首次出现在2007年的SIGGRAPH会议中所表现的三个应用之一。Direct3D 10样本显示N体粒子系统管理完全由GPU进行处理。
该示例显示了计算系统中的所有粒子之间的相互作用。在这种情况下,涉及的互动之间所有可能的paritcle对重力的影响。在计算N*N相互作用的过程中,我们使用了Splatting。
N Body Gravity测试具备两个显著的特点,首先是高并行度,该测试拥有大量相互碰撞的粒子,粒子之间会产生复杂而又数量较多的力量变化。同时该测试拥有较高的运算密度,GPU在处理此类问题时可以有效展现其强大的并行运算能力。对于该测试的意义我们在之后的文章中会详细阐释。
我们的测试结果显示单卡双芯的GTS250首发双雄版获得了较大幅度的领先,当然这个结果是我们在单颗GPU核心上得到的,本测试对多颗GPU组成SLI或者CrossFire的支持并不完善。
Folding@home通用计算测试
● Folding@home通用计算测试
Folding@home是一个研究蛋白质折叠,误折,聚合及由此引起的相关疾病的分布式计算项目。我们使用联网式的计算方式和大量的分布式计算能力来模拟蛋白质折叠的过程,并指引我们近期对由折叠引起的疾病的一系列研究,找到相关疾病的发病原因和治疗方法。
Folding@home能了解蛋白质折叠、误折以及相关的疾病。目前进行中的研究有:癌症、阿兹海默症(老年失智症)、亨廷顿病、成骨不全症、帕金森氏症、核糖体与抗生素。
索泰GTS250双雄首发版 Folding@Home项目
这项测试是科学实用项目Folding@home项目,该项目使用了CUDA或者Stream加速的Gromacs引擎,NVIDIA的GPU架构由于流处理器设计原因,非常适合这种充满了大量跳转嵌套分支等指令的应用环境,我们的测试得到了非常理想的运算速度。
该项目在中国拥有约2000多名参与者,其中最强大的China Folding@Home Power(Folding@Home中国力量,团队编号3213)团队已经拥有2585人,最近活跃用户200人以上,目前贡献计算量排名世界第38位,团队整体运算能力约为50到100TFLOPS。
这个项目在未来可以作为显卡通用计算能力衡量的重要标准之一,通过本次索泰GTS250双雄首发版在双开模式下运行Folding@home项目,我们得到如下PPD速度值供大家参考:
这个测试项目是目前GPU高端玩家最为关注的项目之一,同时它代表了基于GPU编程的GROMACS分子动力学引擎计算性能。Folding@home所研究的是人类最基本的特定致病过程中蛋白质分子的折叠运动。
项目的核心原理在于求解任务目标分子中每一个原子在边界条件限制下由肽键和长程力等作用所导致的运动方程,进而达到实现模拟任务目标分子折叠运动的目的。每一个原子背后都附庸这若干个方程,每一个方程都可以转换成一组简单的向量指令。同时由于长程力的影响,条件分支也随处可见,Folding@home在GPU使用量上也要大于图形编程。
附:在中国分布式计算总站,我们为读者提供了比较简洁明快的参与教程,很适合新手加入Folding@home项目:
http://www.equn.com/forum/thread-21586-1-1.html
应用测试-系统功耗检测
● 应用测试-系统功耗检测
我们
索泰GTS250双雄首发版显卡运行Furmark测试
索泰GTS250双雄首发版显卡在功耗测试的成绩并不是十分理想,毕竟两颗G92芯片无论是在节能技术方面还是在功耗控制能力方面都不及Fermi架构的产品理想。当然我们看到ATI的HD5000系列显卡功耗控制能力同样优秀。
超频能力与测试总结
● 超频能力与测试总结
在分析了这款索泰GTS250双雄首发版显卡的PCB分布和供电元件之后,我们决定对它做一次超频测试,由于在单块PCB板上集成两颗G92芯片和一颗GF200芯片外加大量辅助供电元件已经非常艰难了,所以我们没有对它进行耗尽式的测试,而是为用户找到一个满意的可以稳定工作的频率。
我们使用NVIDIA Inspector 1.87版本对产品进行超频,这款软件本站曾进行过详细的介绍,对其有兴趣的读者可以去翻阅相关文章。
我们选择了公版单卡GTS250的频率,然后使用NVIDIA Inspector 1.87版本对两颗核心分别进行了频率设定,结果非常令人满意,这款显卡可以运行在GTS250的738/1836/2200MHz高频下。随后我们对它进行了3DMark Vantage测试,结果如下:
中关村在线显卡频道观点:
索泰GTS250双雄首发版显卡
索泰GTS250双雄首发版显卡代表了G92核心末期厂商对于这颗芯片性能的终极挖掘能力,同时我们看到它并没有让用户失望,一款本是为了体现研发实力而设计的显卡却在最后战胜了NVIDIA近期如日中天的GF104改进版Fermi核心GTX460显卡。
本次评测加入了针对GPU通用计算的测试项目,其中Sisoft GPGPU着色器性能代表了GPU的理论浮点吞吐性能(偏重理论),DirectX 10 SDK Nbody Gravity代表了GPU的动力学离子计算能力(高并行度与运算密度),Foldine@home分布式计算项目则全面检测了这款显卡的通用计算性能(偏重环境中的复杂分支性能)。在未来的测试中,我们将尽力加入更多对比性强的通用计算测试项目。
在本次评测的最后,我们希望给认真阅读整篇评测的读者留下一个问题,希望大家能在评论栏中对这款显卡的价格进行竞猜。大家可以在评论栏里写下自己对这款由索泰打造的“收藏版”显卡的心理价位。同时大家可以对以这款显卡为代表的G92核心最后的辉煌发表自己的看法。
优势:G92核心极端成熟后的产物,双核心显卡同样表现优秀;
奢华的用料和稳健的PCB设计能力;
无论是收藏还是使用都具备实用价值。
在GPU并行通用计算领域具备竞争优势。
劣势:G92核心已颇显老矣,无法支持最新的Direct X标准。
- 相关阅读:
- ·AMD下一代高端GPU终极曝光:和三星共享
//vga.zol.com.cn/559/5591184.html - ·华硕显卡助力WCA2015 全球总决赛落幕
//vga.zol.com.cn/559/5592374.html - ·猎人还是猎物?怪物猎人Onlin显卡测试
//vga.zol.com.cn/558/5584378.html - ·请叫我内存杀手 980Ti使命召唤12测试
//vga.zol.com.cn/555/5558998.html - ·挑战新的巅峰 GOC2015全球超频盛典
//vga.zol.com.cn/555/5556745.html