在本页阅读全文(共11页)
● CPU还是GPU,这是个问题
尽管困难重重,但NVIDIA还是选择了坚持,于是在GT200之后,我们看到了更加翻天覆地,同时也是将G80以来的构架路线最终引向明确方向的新构架——GF100。
代号Fermi的GF100构架最显著的特点,就是他的并行化模块设计以及过去只有CPU才有的诸多单元和功能,如多级Cache体系、统一定址、基于CTA(线程块)级别的Branch Predication(分支论断)和乱序执行等。
4组完全对等的GPC单元将整个GPU划分成了4个独立的可执行区域,GPC内部具备完整的warp scheduler、Instruction Dispatch Unit以及可以与shared和Tex Cache实时互换的L1 cache,GPC间可以通过L2 Cache进行通讯和协作,并统一通过最外围的GigaThread Engine进行平行调配。
这种大并行度的结构在动作方面颇像CPU的行事风格。当游戏中的像素等通过程序以kernel的形式出现时,GF100可以将不同的kernel同时分发给不同的GPC,GPC通过L2 Cache进行缓冲以及涉及分支或CS任务的数据共享,再辅以分支论断和乱序执行,整个GF100看上去就像一个经过了充分优化的4核CPU一样。
同样采用大并行度设计的I7处理器
这样的Fermi,到底是GPU还是CPU啊?难道说Fermi已经是一颗CPU级别的GPU了么?
本文导航