游戏画质进一步改善
由于ROP和TMU单元的资源空前充沛,Fermi可以给玩家更好的游戏画质体验,包括更先进的采样技术和性能衰减更小的抗锯齿加速。
代号RV770的HD4870是AMD非常成功的一款产品,它用最小的晶体管消耗,打击了对手NVIDIA的痛处——GPU后端设计。所以我们看到在开启高倍AA等效果时,GPU的性能衰减能够得到控制。而这次Fermi架构也增强了后端,而且力度不小。
众多资料中,我们首先了解到的是Fermi架构的GF100所支持的Gather4抖动采样指令。DirectX 11详细定义了显卡需要提供的特性,但对渲染后端的工作涉及甚少,所以NVIDIA做了多形体引擎,还有抖动采样。抖动采样不是新技术,长期用于阴影贴图和各种后期处理,通过对临近纹素(Telex/纹理上的像素点)进行采样来创建更柔和的阴影边缘。它的缺点也是非常消耗资源。
DirectX 9/10上抖动采样是分别拾取每一个纹素,DirectX 10.1开始改用Gather4指令,NVIDIA则在硬件上使用单独一条矢量指令。NVIDIA自己的测试显示,这么做的性能大约是非矢量执行的两倍。

Gather4抖动采样指令细节图解
Gather4指令,使四个纹理映射到一个128×128的单纹理指令像素。GF100的DirectX 11实现4倍节省硬件资源的Gather4,大大加快阴影映射、环境闭塞和后期处理算法。随着抖动取样的应用,游戏可以实现平滑柔和阴影或自定义纹理过滤效率。对游戏开发者来说,这意味着消耗的硬件资源更少;对游戏玩家来说,则意味着更好的画质。
在采样过程优化的同时,游戏玩家关注的抗锯齿效果也在不断发展。CSAA全称 Coverage Sample Anti-Aliasing(覆盖采样抗锯齿),G80时代已经被NVIDIA引入,不过当时只支持到16X,Fermi将这个数值提升到了32X,并且将色彩取样和覆盖取样分开处理:8个色彩取样,24个覆盖取样,画质和性能都显著提升。
Alpha to Coverage可以使用全部采样点,拥有33个透明级别,上图是GT200不使用覆盖采样与GF100采用32X CSAA的效果对比,32X CSAA效果更为温润出色。相比传统的抗锯齿模式,Fermi执行CSAA性能下降非常低,32X CSAA性能下降只有传统8X的0.7%左右。
这一切性能衰减方面的优秀表现,都离不开NVIDIA对GF100的ROP和TMU单元做出的改进。关于GPU后端这部分资源,我们将在以后的评测中为大家详细分析。

就为那一抹红 iGame GTX 1660 Ultra图赏
A卡真旗舰 蓝宝石RX 5700 XT 超白金图赏
华硕P8Z77-V DELUXE新功能解析
全汉蓝暴经典版550电源评测