热点推荐
ZOL首页 > 显卡 > 评测 > 平衡与妥协 GTX560Ti能否找回Ti系荣誉

平衡与妥协 GTX560Ti能否找回Ti系荣誉


CBSi中国·ZOL 作者:中关村在线 濮元恺 责任编辑:林光楠 【原创】 2011年01月27日 05:00 评论
产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

GTX560Ti的平衡与妥协

前言:

  今天我们发布“ZOL显卡探索与发现”的第二篇文章,之所以选择在这个时间点发布,因为文章的主要分析对象是Geforce GTX 560 Ti显卡,这是NVIDIA在GF104芯片发布半年之后推出的增强版GF110芯片。

  而选择Ti作为后缀则显示了NVIDIA希望这款芯片能够长久保持优势的信心。但是现在的Ti已经不能和2002年的Geforce 4800 Ti相比了,NVIDIA并没有在这款芯片上使用最新的技术,而是在不断平衡或者说不断妥协……


       ● GTX560Ti诞生背景

        2002年初NVIDIA正式发布了开发代号为NV25的图形芯片,取名为Geforce 4800 Ti,这款产品在当时获得了前所未有的成功,也极大的打击了对手ATI在中高端市场上的火热销售的Radeon 8500、7500系列显卡。Ti系列不仅借助其先进的技术赢得了消费者的认同,更为NVIDIA收复了大量市场份额。Ti系列塑造了多重辉煌,特别是Geforce Ti4200显卡在几年后仍然热销。

        时隔9年,NVIDIA再次恢复了Ti(中文名:钛)这一名称在显卡产品中的使用,NVIDIA想要达到什么目的,NVIDIA希望厂商、市场和用户如何面对这款产品,为什么GF104、114核心要加大每个CUDA核心的发射端和纹理资源,NVIDIA面对目前的图形市场发展有哪些无奈,这些问题都会成为我们分析的重点。当然后文的测试部分我们会放出一些GF114核心对比GF104核心的性能优势。


平衡与妥协 GTX560Ti能否找回Ti系荣誉

       在当年GeForce 4 Ti 4000产品中,NVIDIA在原有的nfiniteFX图形架构引擎上做了相当完整的改进,并命名为nfiniteFX II引擎。其中在原来有的一个Vertex Shader的基础上,又增加了第二并行运行的Vertex Shader,即双Vertex Shader,因此可以使芯片的顶点处理速度加快一倍,使困惑图形界很久的皮毛渲染成为了可能。在人们对Shader单元发展还还有疑惑的时候,NVIDIA不但提升了Vertex Shader性能而且也提升了Pixel Shader版本从1.1到1.3,这是一种毫无疑问的技术进步。

步步为营 GTX560Ti能否找回9年Ti系荣誉
缔造辉煌的GeForce 4 Ti NV25芯片

       随着微软不断提升其图形API也就是DirectX版本,业界期待一款并行计算和可编程能力极其强大的GPU,因为已经有很多程序员和图形设计师体会到了微软DirectX 11在技术特性方面的转向,尽管家用机平台图形引擎由于更新缓慢等问题停滞在DirectX 9.0时代,但是PC游戏和图形业界的前进速度已经远远超乎想象。

       回到2010年初,尽管我们确信Fermi架构代表了先进的技术发展方向,但是初期GF100核心表现令人不免失望,或许是期望越高失望越大,在DirectX 9游戏中Fermi架构没有建树,DirectX 10游戏中又不能大幅度领先晶体管数仅有其66%的RV870核心……Fermi似乎面临到很多问题,你怀疑过这款核心的未来发展吗?

再续Ti系辉煌 GTX560Ti单挑A/N群英会
基于40nm工艺制造的GF114-400-A1核心

       2010年7月,一款删减版的Fermi核心诞生了,它正是拥有19.5亿个晶体管的GF104核心,虽然流处理器剩下336个,显存位宽等资源都变小了,但是它凭借出色的性价比和性耗比获得了市场的认同,甚至厂商和超频用户发现在高频下运行的GTX460显卡可以获得与GTX480几乎相当的游戏性能。最后的市场反应是:精简版产品获得了认同,而代表Fermi架构全部特性的GF100却成为高功耗高发热的代名词。

       北京时间2011年1月25日22点,Geforce GTX560 Ti发布了,如果说GTX580补全了GTX480的遗憾,那么GTX560 Ti则大幅度提升了GTX460的性能并带给用户更多选择,虽然价格较高达到2000元人民币,不过产品性能和定位确实带来了芯片厂商、板卡厂商、渠道商的多赢局面。不过和9年前取名Ti不同,GTX560Ti和上代产品相比实在没有什么值得称道的技术,不过Ti系列的命名规则让我们体会到NVIDIA希望制造一款长期控制市场的GPU产品。

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

GF114从何而来,有何提升

       ● GF114从何而来,有何提升

       通过ZOL显卡频道昨天的芯片级首测,我们了解到GF114核心相对与GF104核心打开了屏蔽的一组SM单元并提升了频率,不过这颗芯片还是让我们有点意外,毕竟它的超频能力太强劲,且相对与GF104的发热功耗拐点有较大区别。不过GF114到底从何而来,现在的确是个问题,它是完整版的GF104还是NVIDIA重新优化设计的芯片?

       目前流传作为广泛的说法是GF114核心和GF110核心一样,经过了彻底推倒重来的EDA设计,我们之前在GF110核心中分析过这些问题。如果经过了EDA设计则芯片功耗下降,工作频率带上升或加宽,这就是显卡玩家所说的低温运行、超频能力强劲等优势。


再续Ti系辉煌 GTX560Ti单挑A/N群英会
GeForce GTX 560 Ti公版显卡

       不过第二种说法相对保守很多,这种观点的坚持者认为GF114是没有经过屏蔽的GF104芯片,也就是说NVIDIA没有做任何改进只是在今年年初推出了这一批完整版的384SP芯片。毕竟GF104芯片在性耗比方面已经很优秀,优化空间较小。

       对于送测产品或者高端GTX560Ti产品的芯片需求,NVIDIA挑选了一些电气性能优异的GF104产品作为GTX560Ti的核心。在我们没有获得稳定详细资料之前,关于GF114芯片的来历问题还是不评论为好。

       下面这张表格列出的是GF104和GF114芯片的特性对比:

GeForce GTX 560 Ti 显 卡 特 性 提 升 对 比
显卡型号 GeForce GTX 560Ti GeForce GTX 460 特性对比
GPU代号 GF114 GF104
GPU工艺 40 nm 40 nm
GPU晶体管 19.5 亿 19.5 亿
着色器数量 384 336 提升14%
ROPs数量 32 32
纹理单元数量 64 56 提升14%
核心频率 822 MHz 675 MHz 提升21%
着色器频率 1645 MHz 1350 MHz 提升21%
理论计算能力 1.89 TFLOPs 1.36 TFLOPs 提升38%
等效内存频率 4008MHz 3600 MHz 提升11%
内存位宽 256 bit 256 bit
内存带宽 128.0 GB/s 115.2 GB/s 提升11%
内存类型 GDDR5 GDDR5
内存容量 1024 MB 1024 MB
DX版本支持 11 11
通用计算接口 CUDA CUDA

       在补全384个流处理器和8个TMU纹理单元之后,GTX560Ti选择了继续提升频率,我们看到相对与GTX460核心和显存频率分别提升了21%和11%,而综合浮点吞吐能力则提升了38%,可以说在并行度和频率方面的提升为GTX560Ti塑造了一个满意的市场定位,或者说的通俗一些可以卖出更好的价格

       设计一块可制造性较高的芯片,是基于多种考虑后的结果,当GPU芯片可制造性提高之后,良品率、性耗比等指标会提升,利好GPU芯片厂商。而TDP等指标则会下降,最终带来显卡成本下降,利润上升,利好显卡制造厂商。GF104和GF114在这方面几乎达到了目前我们所见到的GPU中表现最好的,相关产品在市场上颇受追捧,单价利润都不低,利好渠道商。

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

两次平衡,两次妥协

       ● 两次平衡,两次妥协

       事实上GF104并不十分完美,但是它的缺憾恰好造就了这颗芯片在3D游戏方面的高性价比和性耗比。有些问题在GTX460发布之时就应该摆出来讨论,但是这些浮华的测试成绩掩盖了太多人的视线,貌似GTX460可以一统天下了。而GF104和GF114芯片偏重纹理填充、压抑Shader功能的设计思路实际上是对整个图形业界现状的妥协,或者说为了设计更符合现在图形编程环境。


步步为营 GTX560Ti能否找回9年Ti系荣誉

GF100/110与GF104/114 SM对比

两 款 Fermi 架 构 核 心 全 规 格 对 比
Graphics Core Graphics Core GF110 GF114 总体下降
Processing Units Graphics Processing Clusters 4 2 50%
Streaming Multiprocessors 16 8 50%
CUDA Cores 512 384 25%
Texture Units 64 64
ROP Units 48 32 33%
Other Memory Interface 384-bit 256-bit 33%
L1 Cache 64 KB
(16 KB + 48 KB)
64 KB
(16 KB + 48 KB)
L2 Cache 768 KB 512 KB 33%
Warp 32 16 50%

        让我们通过对比来看下GF100/110和GF104/114中分别SM拥有功能模块的比例。抛开GF100/110和GF104/114的整体规格不看单比SM规格,GF104/114 SM的功能模块数量相比GF100/110 SM的功能模块数量只多不少,也就是说GF104/114单个SM的性能要强于GF100/110单个SM,但是GF100/110拥有16个SM,而GF104/114只有8个,因此效率受到较大影响。

GF100/110 SM vs. GF104/114 SM
Graphics Core Graphics Core GF100/110 GF104/114 总体提升与对比 SP平均资源提升
SM CUDA Cores 32 48 提升50%
Warp Scheduler 2 2 降低50%
Dispatch Unit 2 4 提升100% 提升25%
SFU 4 8 提升100% 提升25%
LD/ST 16 个 16 个
INT Unit 32 48 提升50%
FP Unit FP32:32
FP64:16
FP32:48
FP64:24
提升50%
Texture Unit 4 8 提升100% 提升25%

       总体对比而言,我们可以看到每个SM中CUDA Core数量和Texture Unit数量均有大幅增加,这都会增加SM的3D计算能力,从而让用户在游戏体验上获得更好的效果。不过相反每个CUDA Core和Texture Unit分得的各类Cache有所减少,这应该是NVIDIA GPU架构工程师在性能、晶体管平衡取舍上得出的比例。

        以上特性我们可以总结为,NVIDIA在设计GF104/114时因为晶体管数量所限,减少了SP数量,降低了运算并行度,但是为每个SP配备了更多的纹理和发射端等资源,特别是纹理单元在SM中的翻倍让GPU更加适应当前的图形环境。不过在基于GPU的高性能计算测试中,我们会明显发现GF104/114的这种思路导致性能较幅度下降。

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

GTX560Ti与GF114芯片概况

       ● GTX560Ti与GF114芯片概况

       在显卡设计环节上,由于GF114芯片流处理器达到了384个且运行频率更高,所以需要更好的供电、散热器来辅助。本次GTX560Ti主要采用了4+1项供电和3热管铜底散热器,毕竟面对一款发热并不是很高的GPU核心,不需要在板卡设计方面投入太多成本。


再续Ti系辉煌 GTX560Ti单挑A/N群英会

4+1相供电设计

再续Ti系辉煌 GTX560Ti单挑A/N群英会
三热管散热器特写

       在这个环节,我们使用了常用的GPU-Z软件和Furmark1.8.0软件来测试这款显卡的基本信息和满负载温度曲线。这GPU-Z软件可以帮助我们最直观的了解一款GPU的基本概况,EVEREST软件作为经典的信息识别软件,可以识别GPU基本参数特别是通用计算方面的特性。

步步为营 GTX560Ti能否找回9年Ti系荣誉

       GPU-Z第一屏可以显示显卡的GPU规格和额定频率等信息,而第二屏则可以显示显卡在低功耗模式下的自己降频特性,如果显卡不具备节能特性,则在桌面模式下不会自动降低功耗。

步步为营 GTX560Ti能否找回9年Ti系荣誉

       我们看到这款公版GTX560Ti显卡的额定频率为823/4000MHz,高于GTX460公版产品675/3600MHz。节能方面GPU频率在低功耗下能过下探到50MHz,显存达到135MHz(原始频率),这一点和GF104芯片完全一样。

步步为营 GTX560Ti能否找回9年Ti系荣誉

       EVEREST软件最新版并未成功检测GF114芯片详细信息,所以我们选择了“GPGPU”页面来查看GPU通用计算特性。我们看到GF114和GF104一样支持32/64位原子操作、双精度性能和Warp Vote特性。

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

性能测试的硬件、软件平台状况

● 性能测试的硬件、软件平台状况

  ● 测试系统硬件环境

  性能测试使用的硬件平台由Intel Core i7-870 3.5GHz、GIGABYTE GA-P55-UD4主板2GB*2双通道DDR3-1600内存构成。细节及软件环境设定见下表:


测 试 平 台 硬 件
中央处理器 Intel Core i7-870 OC3.5GHz
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存
散热器 Thermalright Ultra-120 eXtreme
单个120mm*25mm风扇 / 1600RPM)
内存模组 Apacer 猎豹二代双通道套装/PC3-12800
(SPD:1757 9-9-9-24-1T)
主板 GIGABYTE GA-P55-UD4
(Intel P55 + ICH10R Chipset)
显示卡
NVIDIA 产 品
GeForce GTX 560 Ti 1024MB
(GF104 / 1024MB / 核心:823MHz / Shader:1646Mhz / 显存:4008 Mhz)
GeForce GTX 460 1024MB
(GF104 / 1024MB / 核心:675MHz / Shader:1350Mhz / 显存:3600 Mhz)
GeForce GTX 580 1536MB
(GF110 / 1536MB / 核心:772MHz / Shader:1544Mhz / 显存:4008Mhz)
GeForce GTX 480 1536MB
(GF100 / 1280MB / 核心:700MHz / Shader:1401Mhz / 显存:3696 Mhz)
AMD 产 品
Radeon HD 6870
(Barts / 1024MB / 核心:900MHz / Shader:900Mhz / 显存:4200 Mhz)
Radeon HD 6850
(Barts / 1024MB / 核心:775MHz / Shader:775Mhz / 显存:4000 Mhz)
Radeon HD 5850
(RV870 / 1024MB / 核心:725MHz / Shader:725MHz / 显存:4000MHz)
Radeon HD 5830
(RV870 / 1024MB / 核心:800MHz / Shader: 800MHz / 显存:4000MHz)
Radeon HD 5770
(RV840 / 1024MB / 核心:850MHz / Shader: 850MHz / 显存:4800MHz)
硬盘 Hitachi 1T
1TB / 7200RPM / 16M缓存  / 50GB NTFS系统分区
电源供应器 AcBel R8 ATX-700CA-AB8FB
(ATX12V 2.0 / 700W)
显示器 DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)

散热最夸张 耕昇GTX570 Phantom幻影评测
技嘉P55-UD4 GIGABYTE GA-P55-UD4

散热最夸张 耕昇GTX570 Phantom幻影评测
Apacer 猎豹二代双通道套装/PC3-12800

很寂寞 蓝宝4GB双核HD5970无对手测试
AcBel R8 ATX-700CA-AB8FB

很寂寞 蓝宝4GB双核HD5970无对手测试
Thermalright Ultra-120 eXtreme

  我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,电源供应器、CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供。

        为保证系统平台具有最佳的稳定性,此次硬件评测中所使用的操作系统均为Microsoft Windows 7 正版授权产品。使用Windows 7正版软件能够获得最好的兼容性以及系统升级更新服务。

竟践踏3DMark11 NV最新GTX570全球首测

        用户在体验或购买安装Windows 7的操作系统时请认准所装系统是否已经获得正版授权许可!未经授权的非正版软件将无法获得包括更新等功能在内的Windows 7服务。

  ● 测试系统的软件环境 

操 作 系 统 及 驱 动
操作系统
Microsoft Windows 7 Ultimate RTM
(中文版 / 版本号7600)
主板芯片组
驱动
Intel Chipset Device Software for Win7
(WHQL / 版本号 9.1.1.1125)
显卡驱动
AMD Catalyst for Win7
(WHQL / 版本号 10.12)
NVIDIA Forceware for Win7
(WHQL / 版本号 265.56)

桌面环境

2560*1600_32bit 60Hz

测 试 平 台 软 件

3D合成
测试软件

3Dmark Vantage

Futuremark / 版本号1.2

DirectX 11
 理论测试项目

DX11 SDK Test:Sub D11

Microsoft / 版本号 Demo

DirectX 11 SDK Nbody Gravity

Microsoft / 版本号 Demo

HDRToneMapping CS11

Microsoft / 版本号 Demo

OIT 11

Microsoft / 版本号 Demo

MultiThreadedRendering11

Microsoft / 版本号 Demo

基准性能测试

GPCBenchMarkOCL

HPC Tech / 版本号1.1

辅助测试软件

Fraps

beepa / 版本号 3.2.3

  各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

3Dmark Vantage特性测试

       ● DX10理论性能测试:3Dmark Vantage特性测试

  3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。

       我们本次测试使用了3DmarkVantage的6个子项测试,这些子项可以很好地体现GPU的图形处理特性,也可以发现不同GPU架构对于不同渲染场景的适应性。


DX11新秀HD6800终发布 继续超前NV一代

步步为营 GTX560Ti能否找回9年Ti系荣誉

步步为营 GTX560Ti能否找回9年Ti系荣誉

步步为营 GTX560Ti能否找回9年Ti系荣誉

步步为营 GTX560Ti能否找回9年Ti系荣誉

步步为营 GTX560Ti能否找回9年Ti系荣誉

步步为营 GTX560Ti能否找回9年Ti系荣誉

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

SubD11曲面细分性能衰减

       ● SubD11曲面细分性能衰减

       Direct X11 SDK Test:Sub D11是集成在微软的DirectX SDK开发包中的测试组件之一,它主要测试GPU的Tessellation性能。这个测试一共包含31个层级,从第一级的轻度曲面细分到31级重度曲目细分,对显卡的几何处理能力考验不断升级。


Fermi的第二代 千元霸主GTX460全面测试

步步为营 GTX560Ti能否找回9年Ti系荣誉

步步为营 GTX560Ti能否找回9年Ti系荣誉

步步为营 GTX560Ti能否找回9年Ti系荣誉

步步为营 GTX560Ti能否找回9年Ti系荣誉

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

3项 DirectX 11 SDK特性测试

       ● DirectX 11 SDK Nbody Gravity

       DirectX 11 SDK Nbody Gravity项目源于Nbody仿真,它在数值上近似地表示一个多体系统的演化过程,该系统中的一个体(Body)都持续地与所有其他的体相互作用。一个相似的例子是天体物理学仿真,在该仿真中,每个体代表一个星系或者一个独立运行的星系,各个体之间通过万有引力相互吸引,如图所示。

       在很多其他计算机科学问题中也会用到N-body仿真,例如蛋白质折叠就用到Nbody仿真计算静电荷范德华力。其他使用N-body仿真的例子还有湍流流场仿真与全局光照计算等计算机图形学中的问题。


AMD统一渲染GPU架构 历程回顾与评测

步步为营 GTX560Ti能否找回9年Ti系荣誉

       ● HDRToneMapping CS11

       HDRToneMapping CS11测试项目同样是针对Computer Shader能力进行测试,该项目展示了如何设置和运行计算着色器(Computer Shader),这是最令人兴奋的Direct3D 11的新功能之一。虽然该测试只是检验了这项技术在HDR(High-Dynamic Range)高动态光照渲染中的加速能力,但是这个概念应该很容易扩展到其他后处理算法,以及更一般的计算。

A/N谁占上风 14款显卡底层性能全揭秘

       这项测试我们选择了DirectX 11所推荐的Computer Shader渲染模式,在测试中NVIDIA显卡出现了负载不饱和状态,所以整体得分不理想。联系到NVIDIA在Fermi架构中对并行计算的支持和多级多分配多线程能力,这个得分还是比较让人失望的,我们只能希望NVIDIA通过新驱动开发继续优化带有缓存的Fermi架构。

步步为营 GTX560Ti能否找回9年Ti系荣誉

       ● OIT11次序无关透明

A/N谁占上风 14款显卡底层性能全揭秘

       OIT11示例演示了在Direct3D 11独立透明度的技术。换句话说,基元(Primitives),可以得出在任何秩序,透明度将正确处理。该技术提供的作品,因为它们是由缓冲透明的像素。这些像素,然后按深度,并在后端到前端与tranparency秩序呈现。本示例使用计算着色器生成一个前缀之和排序前最后的渲染的像素片段。

步步为营 GTX560Ti能否找回9年Ti系荣誉

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

多线程渲染SDK项目测试

       ● MultiThreadedRendering11单线程

       MultiThreadedRendering11项目是一个典型的多线程渲染测试,此示例说明了如何提升多线程环境中的分割渲染效率。全新的Direct3D 11渲染功能的核心,拥有一个驻留在D3D设备的新接口,称为D3D设备上下文。

       D3D设备上下文可以完成两种效果之一:立即或延迟。一个直接的上下文命令直接提交到设备驱动程序,如传统的渲染。递延范围内分批为在命令列入名单的命令,该命令列表可以执行在任何时候通过一个即时的范围内,可能在不同的线程运行。


A/N谁占上风 14款显卡底层性能全揭秘

A/N谁占上风 14款显卡底层性能全揭秘

       第一部分的测试使用了单线程模式,线程数量可以在程序中自动控制。我们通过监控任务管理器看到单线程模式下,一颗4核心CPU的占用率大约在25%。也就是说只有一个CPU核心带领GPU执行渲染任务,这是以往DirectX的渲染模式。

步步为营 GTX560Ti能否找回9年Ti系荣誉

       ● MultiThreadedRendering11多线程

       MultiThreadedRendering11项目是一个典型的多线程渲染测试,此示例说明了如何提升多线程环境中的分割渲染效率。全新的Direct3D 11渲染功能的核心,拥有一个驻留在D3D设备的新接口,称为D3D设备上下文。

       D3D设备上下文可以完成两种效果之一:立即或延迟。一个直接的上下文命令直接提交到设备驱动程序,如传统的渲染。递延范围内分批为在命令列入名单的命令,该命令列表可以执行在任何时候通过一个即时的范围内,可能在不同的线程运行。

A/N谁占上风 14款显卡底层性能全揭秘

A/N谁占上风 14款显卡底层性能全揭秘

       第二次测试我们开启了多线程渲染模式,我们看到CPU占用率提升到了50%左右,其中一颗核心负载将近100%,其他核心负载也相应有所提升。

步步为营 GTX560Ti能否找回9年Ti系荣誉

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

GPCBenchMark整体与子项得分

       ● GPCBenchMark整体与子项得分

       首款国人开发的支持GPU的OpenCL通用计算测试程序OpenCL General Purpose Computing Benchmark (简称GPCBenchMarkOCL)是由国内几名高性能计算从业人员和爱好者合作编写的,目的是为了评估在不同的OpenCL平台上一些基本算法和应用的性能。


超越图形界限 AMD并行计算技术全面解析
GPCBenchMarkOCL软件界面

    与目前流行的一些OpenCL、DirectCompute通用计算测试程序的不同在于,目前这些测试程序测试项目过于单一,基本上就是某一两种算法的性能测试,甚至干脆就是理论峰值计算性能的测试。而GPCBenchMarkOCL软件可以进行带有针对性的多个项目的具体测试,对运算和吞吐各有侧重。

步步为营 GTX560Ti能否找回9年Ti系荣誉

步步为营 GTX560Ti能否找回9年Ti系荣誉

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

Folding@home GPU分布式计算

       ● Folding@home GPU分布式计算

  Folding@home是一个研究蛋白质折叠,误折,聚合及由此引起的相关疾病的分布式计算项目。我们使用联网式的计算方式和大量的分布式计算能力来模拟蛋白质折叠的过程,并指引我们近期对由折叠引起的疾病的一系列研究,找到相关疾病的发病原因和治疗方法。

  Folding@home能了解蛋白质折叠、误折以及相关的疾病。目前进行中的研究有:癌症、阿兹海默症(老年失智症)、亨廷顿病、成骨不全症、帕金森氏症、核糖体与抗生素。


步步为营 GTX560Ti能否找回9年Ti系荣誉
GTX460Ti显卡运行Folding@Home项目

       该项目在中国拥有约2000多名参与者,其中最强大的China Folding@Home Power(Folding@Home中国力量,团队编号3213)团队已经拥有2585人,最近活跃用户200人以上,目前贡献计算量排名世界第33位,团队整体运算能力约为80到100TFLOPS。

步步为营 GTX560Ti能否找回9年Ti系荣誉

       Folding@home分布式计算项目偏重实际运算环境,这项测试是科学实用项目Folding@home项目,该项目使用了CUDA或者Stream加速的Gromacs引擎,NVIDIA的GPU架构由于流处理器设计原因,非常适合这种充满了大量跳转嵌套分支等指令的应用环境,我们的测试得到了非常理想的运算速度。

       在提高频率和提高并行度的情况下,GF114终于在经典通用计算项目Folding@home中获得了大幅度提升,当然我们不排除这个测试任务对GF104/114核心有优化,因为GTS450也能通过高频在这项测试中取得接近GTX460的成绩,看来还是基准软件更让我们放心。

产品:GeForce GTX560Ti nVIDIA 显示芯片 回到顶部阅读

GF104/114为什么要诞生?

       ● GF104/114为什么要诞生?

       NVIDIA通过自己的努力让我们看到了改变,在2010年中我们得到了一块发热与性能都非常理想的GF104芯片,而2011年初我们则得到了一款性耗比更高的GF114芯片。不过为Fermi架构添加更多的纹理资源并减少Shader运算强度,的确不是NVIDIA本来想要的结果,GF104/114正是这种妥协之下的产物,本来很强大的GF100/110芯片能够出色完成基于GPU的高性能计算任务,但是并不能很好适应目前的图形编程环境,这让我们感到很可惜。

       在文章末尾我们可以这样理解GF104/114诞生的原因:Fermi架构设计之初预想PC图形业界能按照微软的API指引来理性发展,Shader自由度、复杂度与纹理材质能做到平行发展,这样GPU不用大规模的TMU和ROP单元即可完成更为精准的图形渲染。不过DirectX 10和11时代的各种游戏需求还是让NVIDIA倍感压力。


步步为营 GTX560Ti能否找回9年Ti系荣誉

孤岛危机Crysis游戏截图

       既然Shader负载无法提升而纹理压榨日渐明显,只能选择为GF100/110芯片添加更多的纹理、发射等辅助资源来应对图形编程要求。上图来自DirectX 10时代的游戏代表作Crysis,巨量的三角形生成和纹理贴图让GPU只能通过增加规模来应对。本来随着Shader发展,最终的光线追踪和直接像素纹理会渐渐地取代传统的烘焙纹理贴图和光栅化过程,现在看来这条道路太过于艰辛漫长。

       也许很多用户还不知道,设计GF104/114的代价和设计GF100/110的开销几乎相同,NVIDIA为了在进军高性能计算领域的同时不失去图形芯片市场,万不得已做了两套Fermi架构,消耗了巨大精力。因为NVIDAI发现它的努力并没有改变目前基于DirectX 10或者11的游戏发展,那些用了一点新特效也称自己是DirectX 11的PC游戏实在是让人无语。

步步为营 GTX560Ti能否找回9年Ti系荣誉
过去、现在与未来的NVIDIA GPU架构

       Tesla(特斯拉)、Fermi(费米)、Kepler(开普勒)和Maxwell(麦克斯韦),这是NVIDIA从2006年到2013年要完成的4代高性能计算芯片架构。在Tesla时代图形芯片和计算芯片都是G80/92和GT200,而在Fermi时代,基于GF100/110的高性能计算芯片显然在专用领域大幅度超越了图形芯片GF104/114的表现,同时GF100/110的双精度能力也可以被打开提升4倍。

       到了Kepler时代,我们预计NVIDIA将把最大的一块GPU芯片放在高性能计算领域,显卡中采用的图形芯片并不是最为顶级的产品。显然从这个时候开始,NVIDIA把两条产品线划分的更为明晰,两条产品线也更具备自己独立的特色不再通用。到了Maxwell时代,NVIDIA已经放出消息要把“丹佛计划”(Project Denver)的CPU集成在GPU里,这样的GPU产品很明显不能适用于PC图形领域。

Project Denver NV进军CPU领域的号角
NVIDIA在CES展会上公布的丹佛计划

       根据现在的资料推断,NVIDIA已经走上了艰难的转型道路,更多产品线不能通用一块GPU的前提下,它正在完成研发资源的分割。GF100/110和GF104/114的分道扬镳只是一个开始,未来我们或许能够见到两款架构相似却有鲜明针对性的GPU芯片在同一时代诞生。这是为了更好的把握高性能计算市场,也是为了向PC图形环境的现状做出妥协,但是设计多套GPU核心并不是什么好事。

       本来一套架构能完成的任务非要通过另一套架构来优化,难道PC图形编程和高性能计算真的不能协同发展。是NVIDIA做错了,还是这个产业发生了问题?

查看本文作者 濮元恺 的其他文章>>
给文章打分 5分为满分(共0人参与) 查看排行>>
频道热词:华硕主板  Intel  AMD  
视觉焦点
NVIDIA GeForce GTX560Ti
    显卡评测热点
    排行 文章标题