热点推荐
ZOL首页 > 显卡 > 评测 > 1000元以上 >

GT200 核心架构基础状况

首次驯服Crysis 地球最强GTX280测试

CNET中国·ZOL 作者:中关村在线 林光楠 责任编辑:王胤韬 【原创】 2008年06月16日 21:00 评论
在本页阅读全文(共20页)

GT200 核心架构基础状况

  ● 成本高昂的GT200芯片

        由于GT200核心是一款全新理念设计的产品,架构上也发生了改变,本章节将围绕核心架构设计展开,毕竟将14亿的庞大晶体管群设计在576mm2上需要非常合理的布局设计 。


万亿次计算狂潮 GeForce GTX 280全球首测
G80(左)与G200(右)核心对比

        拥有6.81亿晶体管的G80核心与拥有14亿晶体管的GT200核心外观设计上相同,采用类似于CPU的封装设计,外面这层“盖”既有保护核心的功能,又有增加核心表面积提高散热效果的功效。那么GT200相对G80多出一倍以上的晶体管数量,主要用于了哪方面呢?

万亿次计算狂潮 GeForce GTX 280全球首测
还未切割的GT200晶圆

        这是台积电生产的GT200半成品硅晶圆,虽然还未切割,但是“每颗”GT200的雏形已经清晰可见。在相同晶圆上切割的GPU越多成本越低,而像GT200这种拥有14亿晶体管的怪兽单颗面积已经576mm2,这也就是为什么基于越高端GPU设计的显卡越贵原因。

  ● GT200芯片基础架构

万亿次计算狂潮 GeForce GTX 280全球首测
GT200晶体管布局

        这是GT200核心的透视图,每个功能区域错落有致、各司其职,具体功能如下:

万亿次计算狂潮 GeForce GTX 280全球首测
GT200各区域职能

        绿色的区域代表240个流处理器,分布在GPU的四个角;紧挨流处理器的紫色区域为纹理拾取单元,其次为黄色区域的光栅处理单元。从图中查看这三个功能单元的面积,也能了解到它们占据了绝大多数核心晶体管数量。

        在从G80、GT200硬件规格上对比,G80拥有128SPs+24ROPs+32TEXs,而GT200拥有240SPs+32ROPs+80TEXs,几乎每项翻倍的规格增加也就不难理解GT200为何需要14亿晶体管来构建。

万亿次计算狂潮 GeForce GTX 280全球首测
GT200核心架构示意图

        240个流处理器分为10组流处理器阵列,当然每个流处理器的功能依然是能够兼职Pixel Shader、Vertex Shader和Geometry Shader,这也是DirectX 10显卡的一个特性。

万亿次计算狂潮 GeForce GTX 280全球首测
每个处理阵列的结构

        每个流处理器阵列中有3组流处理器,每组8个流处理器独享本地存储,每个流处理器阵列独享8个纹理拾取单元和16K的一级缓存。

        在此需要说明的是,有些用户对AMD-ATINVIDIA的流处理器有些疑问,为何两家对位产品上A卡流处理器总是大幅领先N卡,但是实际效能却不尽人意?

        抛开核心其他架构不说,NVIDIA采用SIMT技术,每个流处理器独立运行,通过提高着色器速度(异步与核心频率)来提升流处理器效能;而AMD-ATI产品的设计为5个打包运行,需要驱动仲裁分组,驱动性能会直接影响显卡性能。以RV670核心为例,其拥有320个流处理器,但实际却等效为320/5=64。即使AMD-ATI还未发布的RV770核心,无论传说中的480个流处理器还是800个流处理器,即使是800个才等效160。AMD-ATI也看到这种设计的弊端,在马上释放的RV770产品中也加入了核心、Shader频率异步的设计。

上一页 1 2 3 4 5 ...20 下一页
频道热词:华硕主板  Intel  AMD  
视觉焦点
显卡评测热点
排行 文章标题
TOP10周热门显卡排行榜
  • 热门
  • 新品