底层运算单元改进（二）

改变翻天覆地史上最全Fermi架构解读

CBSi中国·ZOL 作者：中关村在线濮元恺 责任编辑：龚力成【原创】 2010年03月26日 06:14 评论

●4个特殊功能单元Four Special Function Units （SFU）

特殊函数处理单元处理超越函数，包括sin、cosine、求倒数、平方根。每一个SFU在一个周期内每一个线程可以执行一个指令操作，每一个warp执行需要8个周期。指令分发器可以按照当前SFU的运行情况来分发指令，当一个SFU在进行运算的时候，可以将指令分发到其他的SFU处理单元。

●双精度设计Designed for Double Precision

Fermi的双精度浮点（FP64）性能也大幅度提升，峰值执行率可以达到单精度浮点（FP32）的1/2，而过去只有1/8，AMD现在也不过1/5，比如Radeon HD 5870分别为单精度2.72TFlops、双精度544GFlops。由于最终核心频率未定，所以暂时还不清楚Fermi的具体浮点运算能力（双精度预计可达624GFlops）。

双精度的浮点计算在高性能计算中有着核心的重要位置，在求解线性代数中，数值计算量子化学中都会需要双精度浮点运算。Fermi架构为支持双精度浮点运算进行了特别设计每一个SM在一个时钟周期内可以完成16个双精度浮点数的FMA操作。是在GT200架构以后又一激动人心的设计。

30亿晶体管的咆哮
双精度运算中Fermi架构的性能提升

●快速原子内存操作

在多进程（线程）的操作系统中不能被其它进程（线程）打断的操作就叫原子操作，文件的原子操作是指操作文件时的不能被打断的操作。原子操作在并行计算中非常重要，它可以让线程对共享的内存结构做正确的读写操作。

原子操作包括add、min、比较和交换、读、修改和写操作，它们都不用打断其他的正在运行的线程。原子操作被大量使用在并行存储、缩减和并行的建立数据结构中，而不需要锁定线程的执行。

Fermi原子操作能力提升

大量原子操作单元和L2缓存的使用，大大增强了FermiGPU架构中的原子操作能力。在相同位置的原子操作，Fermi的速度比GT200快20倍，连续的内存操作是GT200的7.5倍。

在GPU支持的内存寻址空间方面，GT80/GT200都是32-bit的，最多搭配4GB GDDR3显存，而Fermi一举支持64-bit寻址，即使实际寻址只有40-bit，支持显存容量最多也可达惊人的1TB，目前实际配置最多6GB GDDR5——仍是Tesla。

同时Fermi统一了寻址空间，简化为一种指令，内存地址取决于存储位置：最低位是本地，然后是共享，剩下的是全局。这种统一寻址空间是支持C++的必需前提。而以前的架构里多种不同载入指令，取决于内存类型：本地（每线程）、共享（每组线程）、全局（每内核）。这就和指针造成了麻烦，程序员不得不费劲清理。

上一页 1 ...12 13 14 15 16 下一页

在本页阅读全文

本文导航

频道热词：华硕主板 Intel AMD

显卡报价热门显卡显卡品牌上升最快的显卡

品牌: Colorful 七彩虹 GALAXY 影驰 ZOTAC 索泰 msi微星蓝宝石耕升 MAXSUN 铭瑄迪兰昂达映众华硕

价格: 2599元以下 2600-5999元 6000-9999元 10000元以上

显卡类型: 发烧级中端级入门级专业级

视觉焦点

精彩内容推荐

组图
视频

查看更多显卡美图>>

显卡评测热点

排行文章标题

A卡真旗舰蓝宝石RX 5700 XT 超白金图赏

TOP10周热门显卡排行榜

热门
新品

华硕 ROG STRIX-GTX 1070-
- 商家报价：￥3799
- ZOL评分：
- 184用户点评
[评测] 别样的情怀一样的ROG 华硕STRIX1070评测
蓝宝石 RX 580 8G D5 超白
- 商家报价：￥2199
- ZOL评分：
- 2用户点评
七彩虹 iGame1050Ti 烈焰战
- 商家报价：￥1199
- ZOL评分：
- 19用户点评
[评测] 旧电脑也能焕发第二春小郎の老机升级记
影驰 GeForce GTX 1060 GA
- 商家报价：￥2199
- ZOL评分：
- 42用户点评
[评测] 相信榜样的力量先锋G90主机VS主流游戏
影驰 GeForce GTX 1070名人
- 商家报价：￥3499
- ZOL评分：
- 17用户点评
[评测] 兼备颜值与性能影驰1070HOF限量版评测
索泰 GeForce GTX 1070-8G
- 商家报价：￥3299
- ZOL评分：
- 7用户点评
[评测] 一卡四风扇索泰GTX 1070至尊PLUS评测
七彩虹 iGame750Ti 烈焰战
- 商家报价：￥880
- ZOL评分：
- 113用户点评
[评测] 宁静使用体验 iGame750Ti挑战被动散热
华硕 ROG STRIX-GTX 1060-
- 商家报价：￥2799
- ZOL评分：
- 59用户点评
[评测] 书写时代的新篇章 15款A/N显卡年度对决
铭瑄 GTX 1060 终结者6G
- 商家报价：￥2099
- ZOL评分：
- 5用户点评
[评测] 融合太极之道铭瑄GTX 1060终结者评测
七彩虹 iGame1070 烈焰战神
- 商家报价：￥2999
- ZOL评分：
- 18用户点评
[评测] 电竞跨界之作 iGame 1070 定制版评测

查看完整榜单>>

苹果发布会 AWE Chinajoy IFA mwc CES Asia CES