Fermi GPC运算架构

改变翻天覆地史上最全Fermi架构解读

CBSi中国·ZOL 作者：中关村在线濮元恺 责任编辑：龚力成【原创】 2010年03月26日 06:14 评论

●Fermi GPC运算架构

我们可以这样认为：NVIDIA的第一代CUDA机构是从G80开始延伸至GT200，而GF100将是第二代CUDA架构产品。G80核心的诞生奠定了NVIDIA未来核心架构的主方向，并一直延续至GT200，当然在发展的过程中NVIDIA还是会对核心整体进行优化调整，但总体来说就是累积晶体管增加硬件规格，功能方面并无变化。反观Fermi，核心硬件规格数量相比GT200确实也有大幅增长，但是在产品整体架构上Fermi做了很大改动，可以说是颠覆性改动，它不仅仅是借鉴以前成熟的架构体系，还调整并在架构上新增功能模块，令Fermi不再简简单单的是图形核心，而是一个复合型功能核心。

在NVIDIA产品进入DirectX 10的统一架构后，我们看到核心中引入了TPC（Thread Processing Cluster）、SM（Streaming Mulitporcessor）和SP（Streaming Processor）等新概念。例如，G80拥有8个TPC，每个TPC拥有2个SM，每个SM拥有8个SP，这种由繁化简的结构一直延续在NVIDIA的图形产品中。

30亿晶体管的咆哮
G80和GT200的TPC构成，图片来自Anandtech网站

通过对比G80、GT200到GF100的发展模式，我们看到SM矩阵数量在减少，而每个GPC中SM数量和每组SM中SP数量在增加。在这中架构设计理念上GF100虽然是延续了G80的组成设计，但是每个组成模块的数量优化上有了大幅改变。

GF100图形架构核心，从硬件的块数称为图形处理团簇（GPC）。每个GPC包含一个光栅引擎和四个SM单元。GPC是GF100占主导地位的高层次的硬件模块。除了计算单元它还包括两个重要特点——分别是一个可升级的光栅引擎（Raster Engine）、Z-cull和一个带有属性提取和细分曲面的多边形引擎（Polymorph Engine）。

Fermi架构GPC架构图