我们可以这样认为NVIDIA的第一代CUDA机构是从G80开始延伸至GT200,而Fermi将是第二代CUDA架构产品。G80核心的诞生奠定了NVIDIA未来核心架构的主方向,并一直延续至GT200,当然在发展的过程中NVIDIA还是会对核心整体进行优化调整,但总体来说就是累积晶体管增加硬件规格,功能方面并无变化。反观Fermi,核心硬件规格数量相比GT200确实也有大幅增长,但是在产品整体架构上Fermi做了很大改动,可以说是颠覆性改动,它不仅仅是借鉴的以前的成熟架构体系,还调整并在架构上新增功能模块,令Fermi不再简简单单的是图形核心,而是一个复合型功能核心。
NVIDIA Fermi GF100 SM架构
在NVIDIA产品进入DirectX 10的统一架构后,我们看到核心中引入了TPC(Thread Processing Cluster)、SM(Streaming Mulitporcessor)和SP(Streaming Processor)等新概念。例如,G80拥有8个TPC,每个TPC拥有2个SM,每个SM拥有8个SP,这种由繁化简的结构一直延续在NVIDIA的图形产品中。那么Fermi GF100呢?下面笔者用表格进行一个汇总:
理 论 性 能 测 试 | ||||
G80 | G92 | GT200 | GF100 | |
每颗GPU含TPC数量 | 8 TPCs | 8 TPCs | 10 TPCs | 4 GPCs |
每个TPC含SM数量 | 2 SMs | 2 SMs | 3 SMs | 4 SMs |
每个SM含SP数量 | 8 SPs | 8 SPs | 8 SPs | 32 SPs |
通过上面的GF100 SM架构图以及各代顶级芯片的组成我们可以看出,SM矩阵数量在减少(上表中的GPC和TPC),而每个GPC中SM数量和每组SM中SP数量在增加。在这中架构设计理念上GF100虽然是延续了G80的组成设计,但是每个组成模块的数量优化上有了大幅改变。
GF100图形架构核心,从硬件的块数称为图形处理团簇(GPC)。每个GPC包含一个光栅引擎和四个SM单元。GPC是GF100占主导地位的高层次的硬件模块。除了计算单元它还包括两个重要特点——分别是一个可升级的光栅引擎(Raster Engine)、Z-cull和一个带有属性提取和细分曲面的多边形引擎(Polymorph Engine)。正如其名称所示,所有的GPC都集成了关键的图形处理单元。它包括顶点,几何,光栅,纹理均衡设置和像素处理资源。随着ROP单元功能的不断增强,一个GPC单元可以被看作是一个配置齐全的GPU,而GF100拥有4个这样的核心。
- 第1页:NV发布第二代DX11旗舰 GTX580登场
- 第2页:30亿晶体管 打造GF100和GF110核心
- 第3页:温故而知新 复习GF100预习GF110
- 第4页:由繁化简 GF110/GF100结构组成细说
- 第5页:Fermi架构核心 新增强劲神器引擎
- 第6页:可读写缓存引入GPU 计算能力倍增
- 第7页:Fermi架构针对GPU通用计算优化
- 第8页:传承尊贵/豪华 GTX580全景赏析
- 第9页:完全拆解GTX580 PCB零距离接触
- 第10页:NV旗舰不用热管 引入均热板技术
- 第11页:大家来找茬 GTX580/GTX480外观对比
- 第12页:大家来找茬 GTX580/GTX480之PCB对比
- 第13页:GTX580测试平台及测试项目简介
- 第14页:理论性能测试-3Dmark 06
- 第15页:理论性能测试-3Dmark Vantage
- 第16页:DX9.0c游戏-星际争霸2
- 第17页:DX9.0c游戏-街头霸王4
- 第18页:DX10游戏-英雄连之前线
- 第19页:DX10游戏-孤岛危机
- 第20页:DX11游戏-异形大战铁血战士
- 第21页:DX11游戏-战地之叛逆连队2
- 第22页:DX11游戏-科林麦克雷之尘埃2
- 第23页:DX11游戏-失落星球2
- 第24页:DX11游戏-地铁2033
- 第25页:DX11游戏-潜行者之普利皮亚召唤
- 第26页:DX11游戏-汤姆克兰西之鹰击长空2
- 第27页:Tessellation测试-天堂2.1
- 第28页:PhysX游戏-蝙蝠侠之阿卡姆疯人院
- 第29页:应用性测试-Media Coder NT
- 第30页:应用性测试-超频及SLI性能测试
- 第31页:应用性测试-反锯齿性能衰减
- 第32页:应用性测试-Tessellation性能衰减
- 第33页:应用性测试-产品实际功耗考验
- 第34页:应用性测试-产品温度/噪音考验
- 第35页:百花齐放 GTX580发布厂商集体跟进
- 第36页:旗舰也有性价比产品 GTX580可以买