ZOL首页 > 显卡 > 评测 > 1000元以上 >

阵痛依旧没有过去

nVIDIA GeForce GTX560Ti

明星编辑

忠实微软是否有用 A/N统一构架细节分析

CBSi中国·ZOL 作者：中关村在线顾杰 责任编辑：林光楠【原创】 2011年03月08日 05:00 评论

在本页阅读全文（共15页）

　　● 阵痛依旧没有过去

　　随着时间的推移，NVIDIA在GF100中正式完成了并行化设计。透过真正的多级cache体系的引入，数据和指令真正体会到了一致性和不强制要求延迟透明所带来的好处。正是得益于cache的引入，一致性的L2使得TA单元即便在SM内部也可以方便的实现各种定址和共享操作。GF100的TA单元终于可以和TF单元再次“团聚”了，在GF100中，我们再次看到了久违的单一完整的TMU设计。再次统一的纹理单元因为与流水线的高度融合以及构架并行度的成功而获得了比过去更高的执行效率，这也算是对过去为了收获而进行的艰苦耕耘的一种回报吧。

GF100中终于团聚的TMU

　　但是，如果你觉得好日子终于要来了，那就错了。

　　实际上我们之前曾多次提到过，为了迎合微软追求更高效shader的需求，NVIDIA在ALU集群部分的设计一直是不惜血本的。让ALU具备更加灵活的操作方式和更高的效率，充足的周边资源必不可少。与此同时，为了不被对手在绝对吞吐能力上甩开太远，NVIDIA还要不断地放大ALU的整体规模，这进一步加大了周边资源的需求负担。一颗半导体芯片在其使用的工艺阶段所能够承受的晶体管上限是一定的，超过上限将使芯片丧失可制造性以及成本的可控性。总晶体管上限既然无法打破，这里多了，那里自然就要少。

芯片的可用晶体管上限由可制造性决定

　　按照NVIDIA对DirectX、光栅化过程以及图形业界发展历程的理解，对shader的灵活应用才是未来发展的必由之路，其原因我们会在后面的像素阶段进行分析。基于这种判断，再加上自身其他发展方向如通用计算在HPC领域的需求，NVIDIA在shader和材质的天平中选择了前者。于是自G80开始，NVIDIA构架的纹理资源和运算资源的比例一直维持在一个很低的水准上，甚至发展到GF100的时候，其运算资源相对于之前的GT200放大了100%，但绝对纹理资源却还出现了缩减，这使得其比例还出现了巨大的下降。

　　反观AMD，其简单的直接扩展资源的发展方式被同时应用在了ALU和纹理单元部分。尽管采用了最为传统而且直接的设计，但方便的可扩展性使其在绝对数量上达到了一个空前的规模。与此同时，纹理资源相对运算资源的比例也一直维持在一个比较高的水平之上。

双方各代构架的TMU/ALU单元比例