● OIT11次序无关透明与总结
OIT11示例演示了在Direct3D 11独立透明度的技术。换句话说,基元(Primitives),可以得出在任何秩序,透明度将正确处理。该技术提供的作品,因为它们是由缓冲透明的像素。这些像素,然后按深度,并在后端到前端与tranparency秩序呈现。本示例使用计算着色器生成一个前缀之和排序前最后的渲染的像素片段。
在DirectX 11 SDK Nbody Gravity项目中,A卡全线表现优异,HD5870在这种高密度运算中表现非常出色。该项目对着色器单元个数和频率都提出的很高要求,同时高并行度也保证了这类高端显卡的发挥。不过A卡在这个项目的高画质模式下平均衰减大于N卡大约5个百分点,我们希望NVIDIA通过驱动优化不断释放Fermi架构的运算能力。
HDRToneMapping CS11测试同样成为A卡的领地,这项测试使用Computer Shader技术进行HDR渲染,我们原来预计并行计算能力较强的NVIDIA显卡能够获得较好的成绩,但是结果告诉我们已经发布将近1年的HD5000系列显卡显然更为成熟和优秀。
OIT11次序无关透明由于大量使用了Computer Shader 5.0原子操作,所以原子操作性能较差的GPU显然遇到了严重问题,无法流畅完成测试。虽然GT200支持很好的原子操作,但是效率会被代码循环模式和路径的所影响。再加上CS4.1的寄存器仅仅是CS5.0的1/4,我们怀疑出现了寄存器严重溢出,所以这些老架构产品几乎全军覆没。
本次测试中,在197.75和258.96驱动下,NVIDIA Fermi架构GF100显卡出现了大幅度性能波动,其中不得不提的是258.96驱动提升HDRToneMapping CS11成绩将近40%。我们随后通过GPC Benchmark软件分析得到的结果佐证了这一波动。原因是自257.15驱动以来,NVIDIA大幅度提升了GF100系列GPU的全局存储器性能(约为50%),这一优化导致常用数学方法测试也获得了重大提升。
我们期待未来的驱动程序还能继续对Fermi架构带来有益帮助,我们也相信加入全能缓存之后的GPU拥有更大优化空间,据此我们建议用户不断更新驱动版本以获得最新最可靠的性能。
本次测试我们承接《浅析DirectX11技术带给图形业界的改变》进行,我们补足了在上一篇文章中缺失的多线程渲染、ComputerShader等技术,同时这次测试的显卡种类更全,项目更有特色,希望给读者选购自己适合的产品带来帮助。