前言:1951年10月17日,CBS公布了新商标—CBS之眼。这一图标历经半个世纪,成为了美国史上广为世界欢迎和接受的,最精心构思,最广泛认同和最成功的公司标志。这只眼睛告诉我们每一位媒体从业者,要用心发现社会与行业中隐藏的各种细节,要解开一些光鲜外表下不为人知秘密。
在这CBS之眼概念的引导下,《探索与发现》成为CBSi中国•中关村在线显卡频道2011年推出的一档新节目,它在尽力为读者寻找行业细枝末节,发出自己的声音,也在帮助读者组织思维,通过思考和对比做出属于自己的判断。
● 3Dmark发展历程简介
基准测试软件是整个行业内最为重要的一个环节,它可以通过合理制定测试标准来有效评定目标系统的综合或子项性能,基准测试软件的结果往往可以直接影响下游厂商或者用户的采购决定。1999年,Madonion发布了其史上首款3D显卡测试软件——3DMark99,在11年之后,该系列软件已经发展到3Dmark11,Madonion(中文译名:疯洋葱)这个由几个爱好者成立的团体,膨胀成为一个叫做Futuremark的性能测试服务商。
留给笔者印象最深的有Futuremark发布的以下几个图形性能测试软件,首先是3DMark2001,2001年它的发布紧随微软DirectX 8的发布,无论从测试结果和画面的精细度都达到了当时的顶级水准,同时Pixel Shader和Vertex Shader的引入加强了图形创作的自由度和真实性,虽然对GPU造成较高要求,当时这款软件的方向性之明确在当时成为图形发展史的一盏明灯。
后来发布的3DMark03也有四个游戏测试场景,其Mother Nature场景运用DirectX 9规范将天空水面地表等物体的真实度做到了当时竞争对手难以逾越的程度。
再后来就是DirectX 9.0c标准的3DMark06,这款软件新增的两个SM3.0场景非常华丽,同时06年开始大量SM3.0及HDR特效运用在真实游戏之中,这也使得Futruemark在最新的作品中加入这一项测试显得水到渠成。在每次芯片级测试中,我们除了测试DirectX 9.0c游戏之外,这款软件也是必选项目。
就在两年前,当Wineows Vista和DirectX 10.0标准提出不久,我们迎来了3DMark Vantage这款全新的基准测试软件,如果你的显卡不支持DirectX 10.0则完全无法运行。3DMark Vantage巨量的三角形模型和自由的Shader效果带给用户很多新奇体验,而PhysX引擎的加入也对这款软件增色不少。
3DMark Vantage作为图形领域较为权威和应用较广的测试软件,已经成为目前我们测试显卡的必选项目,因为它能够有针对性地测试GPU的各子项和整体能力,PhysX物理测试项目的复杂度和负载都值得游戏引擎借鉴。这款软件和3DMark2001一样精准地诠释了Futuremark公司对于微软图形API的理解程度,其对于GPU和图形学的发展影响非常积极,必将让后人对它留下深刻印象。
● 3DMark11整体思路与构成
2010年12月7日,当AMD和NVIDIA都已经开赴DirectX 11战场一年来,Futuremark终于推出了全面基于新API的基准测试项目——3DMark11。3DMark11的出现主要是用来对应当前的DirectX 11显卡做性能测试,所以软件采纳了原生DirectX 11引擎,全面加入和利用DirectX 11的特性,包括Tessellation(曲面细分)、compute shaders(计算着色器)和multi-threading(多线程渲染)等,从而来衡量整机的DirectX 11游戏运算能力。
DirectX 11提出的5项关键技术
上图是微软提出的DirectX 11特性,微软希望DirectX 11能够补全上一代API的遗憾,同时促使GPU发展从堆量走向进一步高效,在全新API的指引下,GPU光栅化和贴图压力将得到减缓,曲面细分也能带来复杂模型的简化,ComputerShader则能显著提升复杂效果的可实现性。
本次发布的3DMark11拥有几个各具特色的测试子项,下面让我们来逐个分析它们的特性和针对目标:
图形测试1——深海(Deep Sea)。该场景渲染大量的投影、非投影聚光源、非投影点光源,使用噪声调节光密度的体积光照,不包含曲面细分几何。该场景拥有较为浓厚的贴图色彩,而几乎没有涉及到DirectX 11特性,而噪声调节效果为了制造胶片机特效,图形计算量很小,这个场景的美工能力优秀,制作时花费了大量心思。
场景1官方介绍
图形测试2——深海(Deep Sea)。场景源于“深海”(Deep Sea),渲染中等数量的投影、非投影聚光源、非投影点光源,使用噪声调节光密度的体积光照,包含曲面细分几何。曲面细分主要用于潜艇、沉船、珊瑚、岩石、海床。测试2可以看做是测试1的DX11特性补全,在近观珊瑚和潜艇海床底部时我们可以明显发现图形表面沟壑效果明显。
图形测试3——神庙(High Temple)。渲染一个投影线光源和中等数量的非投影点光源,体积光照仅用于投影线光源,光密度因空间高度不同而异,包含曲面细分几何。曲面细分主要用于台柱、雕像和部分植被。这个场景中丰富细节的场景通过Tesssellation仅需初始模型不多的多边形就可以达成。
场景3官方介绍
图形测试4——神庙(High Temple)。场景源于上一个“神庙”(High Temple),主要是使用延迟渲染,绘制目标的几何模型首先被渲染,然后纹理和反射、散射、环境光屏蔽、深度信息、法线贴图则储存在G-Buffer里。光照处理会与视角产生互动和不会产生互动的点光源则会分成两个绘制调(Draw Call)用,动态顶点缓冲的光照参数则会送到GPU。图形测试4相比3主要是差别是负载来于Tessellation多边形产生的阴影贴图和G-Buffer。
物理测试场景。从3DMarkVantage开始,物理测试成为众多用户关注的焦点,如果说PhysX效果真实但是无法开源,那本次Futuremark补全了这个遗憾,免费开源的Bullet Physics引擎被引入到本项测试中。
物理测试官方介绍
综合测试场景。该场景在物理测试场景的基础上增加软体的模拟和渲染,以及包括一些曲面细分、体积光照和后期处理效果在内的适量图形负载,其中CPU负责刚体物理,GPU负责软体物理和图形负载,而且软体物理使用DirectCompute进行模拟,然后再嫁接到Bullet物理引擎上做处理。
综合测试官方介绍
不过这种全面可编程化发展也遇到了一些障碍,起码我们看到NVIDIA和AMD对于DirectX 11的理解是不同的,有可能是Intel和AMD不希望GPU过于接近CPU,也有可能是NVIDIA力不从心无法支撑GPU拥有更强的可编程性。NVIDAI希望借助Fermi架构实现更强的几何性能和复杂Shader效果高效处理,AMD则在原有架构上不断更改已增强三角形和贴图等传统固定单元能力。
● 3DMrak11关键技术运用程度
相比于3DMark Vantage,3DMark 11的测试模式由四种精简至三种,分别是Entry(入门级)、Performance(性能级)、Extreme(极致级),三种模式分别对应不同的分辨率及画质。在运行部分玩家可以选择以何种方式运行,包括完整体验、演示和基准测试。
标准测试界面
如果你希望自定义测试细节,点击Advanced即可进入自定义测试环节,下图就是自定义测试环节,该环节的最终结果前没有E、P、X字样,不同设置结果不具备可比性。
3DMark 11在不同的测试等级中设定了不同的特性负载,而不是简单以分辨率和抗锯齿做区别。比如贴图大小、曲面细分等级、景深质量等选项在3个级别中有不同定义。
通过这个自定义面板,我们可以自行调整画质参数进行自定义测试。具体而言可以自行调整的参数包括分辨率、MSAA抗锯齿等级、纹理过滤模式及等级、镶嵌系数、阴影贴图大小、阴影级联计数、阴影质量、景深质量等共计19个选项。
通过这张图片我们可以看出以下几个明确信息:
阴影贴图大小在Extreme模式中达到了最高4096*4096。阴影贴图是一种渲染器在预渲染场景通道时生成的位图。阴影贴图不会显示透明或半透明对象投射的颜色。高精度贴图必然带来更为真实的效果和更弱的锯齿,但是贴图大小越大,所需的显存就越多,生成时间也就越长。4096行的阴影贴图所占用的内存是至少64MB(4096 x 4096 x 4)。
最大曲面细分层级只有16级,同时这里的层级是Futuremark自己定义的,无法和微软DirectX SDK做对比分析。同时曲面细分的处理手段和更多也没有提及。
环境光遮蔽与景深效果实现方式不明确。在DirectX 10环境下,这两种特效可以由Shader执行实现,但是实现方式困难编程门槛较高。而在DirextX 11环境下两种特效可以由Computer Shader实现,方法更为高效简洁,符合API发展方向。不过我们并没有获知3DMark 11的实现方式。
● 测试思路构建与解释鉴于前文分析,我们本次测试重点在3DMrak11对微软全新API的理解程度和考核力度方面,这是一款完全测试DirectX 11特性的测试软件,还是一款特性并不明晰的测试软件,将在我们精心设计的测试环节中为大家展现。
本次测试将针对3DMrak11软件的以下几个子项:
1、曲面细分性能影响
2、环境光遮蔽性能影响
3、景深性能影响
4、AFAA性能影响
5、阴影贴图大小、级联层数性能影响
6、不同显卡物理成绩
每个测试子项以3DMrak11 Performance(性能级)为基础,在自定义测试面板中将该项特性调到最低和最高,然后测试局部特性对整体成绩的性能影响。
● 性能测试的硬件、软件平台状况
● 测试系统硬件环境
测 试 平 台 硬 件 | |
中央处理器 | Intel Core i7-870 OC3.5GHz |
散热器 | Thermalright Ultra-120 eXtreme |
内存模组 | Apacer 猎豹二代双通道套装/PC3-12800 |
(SPD:1757 9-9-9-24-1T) | |
主板 | ASUS P7P55D |
(Intel P55 + ICH10R Chipset) | |
显示卡 | |
NVIDIA 产 品 | |
GeForce GTX 580 1536MB | |
(GF110 / 1536MB / 核心:772MHz / Shader:1544Mhz / 显存:4008Mhz) | |
A M D 产 品 | |
Radeon HD 6970 | |
(Cayman / 2048MB / 核心:880MHz / Shader:880Mhz / 显存:5500 Mhz) | |
硬盘 | Hitachi 1T |
(1TB / 7200RPM / 16M | |
电源供应器 | AcBel R8 ATX-700CA-AB8FB |
(ATX12V 2.0 / 700W) | |
显示器 | DELL UltraSharp 3008WFP |
(30英寸LCD / 2560*1600分辨率) |
ASUS P7P55D
AcBel R8 ATX-700CA-AB8FB
Thermalright Ultra-120 eXtreme
我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,电源供应器、CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供。
● 测试系统的软件环境
操 作 系 统 及 驱 动 | |
操作系统 | |
Microsoft Windows 7 Ultimate RTM | |
(中文版 / 版本号7600) | |
主板芯片组 驱动 |
Intel Chipset Device Software for Win7 |
(WHQL / 版本号 9.1.1.1125) | |
显卡驱动 | |
AMD Catalyst for Win7 | |
(WHQL / 版本号 10.11) | |
NVIDIA Forceware for Win7 | |
(Beta / 版本号 262.99) | |
|
2560*1600_32bit 60Hz |
为保证系统平台具有最佳的稳定性,此次硬件评测中所使用的操作系统均为Microsoft Windows 7 正版授权产品。使用Windows 7正版软件能够获得最好的兼容性以及系统升级更新服务。
用户在体验或购买安装Windows 7的操作系统时请认准所装系统是否已经获得正版授权许可!未经授权的非正版软件将无法获得包括更新等功能在内的Windows 7服务。
操 作 系 统 及 驱 动 | |
操作系统 | |
Microsoft Windows 7 Ultimate RTM | |
(中文版 / 版本号7600) | |
主板芯片组 驱动 |
Intel Chipset Device Software for Win7 |
(WHQL / 版本号 9.1.1.1125) | |
显卡驱动 | |
AMD Catalyst for Win7 | |
(WHQL / 版本号 10.11e) | |
NVIDIA Forceware for Win7 | |
(WHQL / 版本号 259.22) | |
|
2560*1600_32bit 60Hz |
测 试 平 台 软 件 | |
3D合成 测试软件 | |
3Dmark 11 | |
Futuremark / 版本号1.0 | |
辅助测试软件 | Fraps |
beepa / 版本号 3.2.5 |
各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。
● DX11核心技术考核力度
在这一页我们考察3个自定义子项对整体性能的影响,他们分别是曲面细分、环境光遮蔽和景深质量。每个选项我们将特效开到最低最高分别测试一遍,然后选择“结合分数”作为总评。
DX11核心技术考核重点希望得到3DMark11对于微软DirectX 11的测试深度,如果我们反复调节特效在最低最高之间变化而性能没有太大影响,则证明这款软件在它允许的自定义控制中没有对DirectX 11做深入考察。
● DX10核心技术考核力度
在这一页我们考察2个自定义子项对整体性能的影响,他们分别是AA、AF性能影响和景深质量影响。和上一个阶段的测试一样,每个选项我们将特效开到最低最高分别测试一遍,然后选择“结合分数”作为总评。
和上一页的考察方式一样,我们关注DirectX 10的几个核心技术点对最终性能的影响力度。
● 不同显卡物理成绩对比
物理测试的考察方式很简单,我们让显卡只运行物理测试而不运行其他测试即可,最终取“物理分数”而不取其他成绩。第二张图表各项性能总评则希望读者看出物理成绩和不同显卡最终成绩的对比关系。
● 3DMark11电影级画质背后隐忧
通过以上测试,我们已经看到了3DMark11对于GPU各子项的测试结果,在上述测试中,我们应用了软件自带的自定义面板对3个DirectX 11、2个DirectX 10特性和1个物理场景做测试,下面让我们简要分析测试结果。
从测试中我们得到3DMark11作为一款基于DirectX 11的图形基准测试软件并没有突出其DirectX 11特性,这些特性中最重要的曲面细分和Computer Shader并没有拉开差距,同时据我们得到的资料Computer Shader作为微软重要的DX11特性仅在3DMark11的综合测试中获得了一定支持(如下图的软体Futuremark旗帜渲染)。
综合测试场景分析
而在物理测试中我们看到Bullet物理引擎并没有体现出不同GPU的计算性能差异,这是一款跨平台的开源物理引擎,AMD在2009年末公布的的“开放物理”计划以OpenCL为核心,在其基础上引申出Bullet等物理引擎,扩展OpenCL和DirectCompute技术。
AMD希望大量厂商利用OpenCL通用计算标准和Bullet Phyics物理引擎开发物理中间件,所以Bullet应该是可以透过OpenCL通用计算标准来支持CPU-GPU异构并行计算的,但本次测试结果显示GPU显然未做任何物理模拟工作。
Bullet作为一款物理引擎制作出的效果我们不予评价,毕竟这掌握在图形设计师手中。但是本次3DMark11所引入的物理效果明显偏弱,首先样本数量我们可以用眼睛轻易数出,同时这个物理测试没有软体模拟,当球下落到房顶时整个平台的分离和散落进程以飞溅为主,这样的一次物理碰撞又降低了计算压力。
最后让我们返回到电影级画质的问题上来。本来按照正常的发展,Shader和纹理材质的发展是平行的,但是家用机和一些不科学的GPU发展直接导致了纹理和材质发展的爆发。各种2048X2048甚至4096X4096大小的材质大量占用GPU资源,Shader正在被逐步遗忘。随着贴图材质不断放大,纹理定址与拾取也就是GPU的TMU单元叶需要越要强劲,资源就越要充足。但是在晶体管数量有限的情况下做更大的TMU和ROP单元就要舍弃Shader的晶体管开销。
3DMark11电影级画质的背后确实充满了各种各样复杂的问题,看似亦真亦幻的特效可以借助特色鲜明的DirectX 11技术实现,同样也可以用传统的复杂原始模型来通过大块材质贴图实现,可惜我们通过测试结果看到3DMark11偏向使用后者,5项测试中DirectX 11特性的强弱基本上对整体性能没有影响,而DirectX 10特性只要经过微调都会大范围影响测试结果。
笔者认为:如果一款基准软件在测试方向上和业界的一贯追求发生了偏差,则它并不利于先进架构的性能体现,不利于GPU可编程性的提高。过多依赖低等级的材质堆砌和传统的特效实现方式,并不是我们希望看到的一款DirectX 11测试软件。更高等级的编程接口,更轻易的特效实现方式和更复杂真实的电影级画质,永远是图形业界不变的追求。
- 相关阅读:
- ·提升画质有利器 市售千元左右显卡推荐
//vga.zol.com.cn/558/5586588.html - ·悲剧了!Intel桌面级10核心CPU还得半年
//vga.zol.com.cn/556/5569463.html - ·只为高端玩家 热门旗舰级游戏显卡推荐
//vga.zol.com.cn/555/5559081.html - ·耕升GTX970G魂 助你享受网游极限画质
//vga.zol.com.cn/555/5556818.html - ·七彩虹九段大片你来造 创意电影大畅想
//vga.zol.com.cn/555/5556697.html