热点推荐
ZOL首页 > 显卡 > 评测 > 1000元以上 >

阵痛依旧没有过去

忠实微软是否有用 A/N统一构架细节分析

CBSi中国·ZOL 作者:中关村在线 顾杰 责任编辑:林光楠 【原创】 2011年03月08日 05:00 评论
在本页阅读全文(共15页)

  ● 阵痛依旧没有过去

  随着时间的推移,NVIDIA在GF100中正式完成了并行化设计。透过真正的多级cache体系的引入,数据和指令真正体会到了一致性和不强制要求延迟透明所带来的好处。正是得益于cache的引入,一致性的L2使得TA单元即便在SM内部也可以方便的实现各种定址和共享操作。GF100的TA单元终于可以和TF单元再次“团聚”了,在GF100中,我们再次看到了久违的单一完整的TMU设计。再次统一的纹理单元因为与流水线的高度融合以及构架并行度的成功而获得了比过去更高的执行效率,这也算是对过去为了收获而进行的艰苦耕耘的一种回报吧。


忠实随从为何不快 A/N统一构架细节分析

GF100中终于团聚的TMU

  但是,如果你觉得好日子终于要来了,那就错了。

  实际上我们之前曾多次提到过,为了迎合微软追求更高效shader的需求,NVIDIA在ALU集群部分的设计一直是不惜血本的。让ALU具备更加灵活的操作方式和更高的效率,充足的周边资源必不可少。与此同时,为了不被对手在绝对吞吐能力上甩开太远,NVIDIA还要不断地放大ALU的整体规模,这进一步加大了周边资源的需求负担。一颗半导体芯片在其使用的工艺阶段所能够承受的晶体管上限是一定的,超过上限将使芯片丧失可制造性以及成本的可控性。总晶体管上限既然无法打破,这里多了,那里自然就要少。

忠实随从为何不快 A/N统一构架细节分析
芯片的可用晶体管上限由可制造性决定

  按照NVIDIA对DirectX、光栅化过程以及图形业界发展历程的理解,对shader的灵活应用才是未来发展的必由之路,其原因我们会在后面的像素阶段进行分析。基于这种判断,再加上自身其他发展方向如通用计算在HPC领域的需求,NVIDIA在shader和材质的天平中选择了前者。于是自G80开始,NVIDIA构架的纹理资源和运算资源的比例一直维持在一个很低的水准上,甚至发展到GF100的时候,其运算资源相对于之前的GT200放大了100%,但绝对纹理资源却还出现了缩减,这使得其比例还出现了巨大的下降。

  反观AMD,其简单的直接扩展资源的发展方式被同时应用在了ALU和纹理单元部分。尽管采用了最为传统而且直接的设计,但方便的可扩展性使其在绝对数量上达到了一个空前的规模。与此同时,纹理资源相对运算资源的比例也一直维持在一个比较高的水平之上。

忠实随从为何不快 A/N统一构架细节分析
双方各代构架的TMU/ALU单元比例

  显而易见的,如果应用场合集中在传统的重材质领域的话,NVIDIA的传统构架会因为分离设计而导致效率下降,而采用了更加先进的结构设计的GF100会因为其绝对数量的不足依旧会导致效率提升被冲淡,从而无法取得高于大幅放大规模的竞争对手的表现。

  我们要的是事实,这就是事实,谁都抹不去的事实。

  走到这里,图形过程从步骤上来讲已经完成接近一半了。我们接下来面对的将是影响图形表现及环境真实度的最重要环节——像素。

上一页 1 ...6 7 8 9 10 ...15 下一页
频道热词:华硕主板  Intel  AMD  
视觉焦点
NVIDIA GeForce GTX560Ti
    显卡评测热点
    排行 文章标题