热点推荐
ZOL首页 > 显卡 > 技术应用 > HDTV >

RADEON X1000系的Pixel Shader结构

来自ATI的Shader Model3——RADEON X1000系列技术分析

http://review.gzeasy.com/ 【转载】 2005年10月08日 13:48 评论
在本页阅读全文(共14页)

RADEON X1000系的Pixel Shader结构——Pixel Shader Core


来自ATI的Shader Model3——RADEON X1000系列技术分析


    表面上看的话,RADEON X1000系的Pixel Shader非常非常类似于R420,所不同的是,主要是增加了一个分支单元,并且计算精度从原来的FP24提升到了Shader Model 3.0要求的FP32。

在每个周期里,X1000系各个Pixel Shader处理器能够跑5条指令:

1条vec3 ADD指令(Vector ALU1)
1条scalar ADD指令(Scalar ALU1)
1条vec3 ADD/MUL/MADD指令(Vector ALU2)
1条scalar ADD/MUL/MADD指令(Scalar ALU2)
1条流控制指令

    此外,由于采用的是R300以来就使用的独立纹理单元,因此在遇到纹理操作的时候,X1000系的Pixel Shader一共最高能执行5条Pixel Shader指令和1条纹理操作指令。

相比之下,NVIDIA的GeForce 7800的Pixel Shader又如何呢?

来自ATI的Shader Model3——RADEON X1000系列技术分析

    在上图中,我们可以看到G70拥有两个能运行MADD指令的4D ALU,这两个ALU都能以4D、1D/3D或者2D/2D的方式完成指令,在运算能力上要强于R520。同样的频率下,G70的每个pixel shader能完成16FLOPS(FP32),而R520就最多只能做到12FLOPS(FP32),如果遇到相邻两条MADD指令或者相邻的MUL指令+MADD指令的话,R520就只能做到8FLOPS,是G70的1/2。此外,G70的ALU1还能够免费地执行一条FP16的nrm指令,nrm指令是用于计算法线的,对于Unreal Engine3中大量使用Normal Mapping计算有明显的加速作用。

    但是和R520相比,G70又存在一个不足,那就是ALU1兼负了纹理寻址计算(例如纹理坐标透视纠正的计算),在遇到纹理操作的时候,ALU1就不能自行像素着色器指令转而执行纹理操作指令,只剩下ALU2能够跑像素着色器指令。不过现在的游戏程序中,纹理操作的指令数量基本上都是低于像素着色器指令的数量,因此NVIDIA这样的设计也不失其合理性。

上一页 1 ...3 4 5 6 7 ...14 下一页
频道热词:华硕主板  Intel  AMD  
视觉焦点
显卡技术应用热点
排行 文章标题
TOP10周热门显卡排行榜
  • 热门
  • 新品