● 真正的比赛,现在开始!
常规的SIMD吞吐形式,逐步强调的宏观并行度和多级线程管理机制,几乎完全相同的运算单元结构以及unified cache体系的引入,让Tahiti构架在结构上明显接近了Fermi构架,如果不考虑资源总量等技巧性差异,两者在逻辑层面甚至可以说已经完全一样了。在经历了5年曲折的摸索和前进之后,AMD终于不再一个人孤独地在迷雾中奔跑了。它现在几乎已经冲出了迷茫的包围,并第一次站在了与NVIDIA相同的起跑线上。
HD7970核心照
在Tahiti构架出现之前,AMD一直处在追随者的状态下,迷雾中的它脚下的道路虽然不少,但前进的方向却只有提升单元复用率或者与之宏观等价的构架有效动作总次数。Tahiti构架的出现,让AMD基本完成了在这个方向上的追赶。拥有了Tahiti构架的AMD,已经具备了与NVIDIA一同探索并提出与过去不同的发展方向的资格了。
Fermi构架单元对缓冲的调用过程
因为ALU团簇结构的趋同,Tahiti与Fermi构架之间有了一定的可比性,我们可以近似的将之看做两个运算结构相同,但缓冲比例搭配不同的体系。以各自在当前制程下所能够接受的资源总量来衡量,Fermi在缓冲资源部分投注的比例相对更大,而Tahiti构架则更加倾向于大量运算单元配备少量缓冲,这种倾向,让Tahiti看上去更加接近原教旨的GPU以及GPGPU。
我们在前页提到过,缓冲资源的缺失并不是不可逾越的障碍,它甚至还能像维纳斯缺失的双臂那样令人产生美好的遐想,Tahiti构架因为这种缺失,反倒获得了多样化的前进方向。补足了灵活度所需的结构和缓冲资源基本需求的Tahiti构架如果继续维持原教旨的GPU/GPGPU的发展路线,那么它可以进一步的通过放大运算部分同时维持并适当改进现有的缓冲操作体系来取得性能的提升。如果AMD继续坚持提升单元复用率,向更加灵活的应用能力方向去进行拓展,则可以维持现有运算资源规模或对其进行缓慢放大,同时积极增加缓冲资源的总量以及操作灵活度。跨过了unified cache门槛并甩掉VLIW束缚的AMD,无论选择哪条路都将会比过去走得更加轻松。
Tahiti及其之后的构架表现令人期待
最重要的是,NVIDIA在未来同样会面对一模一样的选择,不论是转向偏重原教旨GPGPU强调的并行吞吐,维持现有的多样化应用要求的更大的灵活性,亦或是在两者之间寻找unified cache资源配置的平衡点,NVIDIA未来与AMD所做的事情将趋于相同。这不仅能够让游戏编程界在思想上获得统一,更能让双方将更多的精力投注到构架逻辑结构的优化方面并为我们带来更多更加精彩的产品,而不是像现在这样将大量资源投放到与研发和技术进步无关的某些……非常特殊的公共关系领域中去。
Tahiti的出现创造和改变了很多东西,它的结构精巧的令人赏心悦目,它扭转了AMD在单元复用率方面的劣势,它的灵活度远超任何一款曾经出现的ATI/AMD图形构架,它拥有比过去好得多的DirectX 11游戏性能,它带来的通用计算性能的巨幅提升为AMD未来进一步拓展HPC市场奠定了基础,它将AMD从长达5年的错误或者说迷茫中拉了出来,并为AMD的未来发展指明了道路。
对于HD7970的实测成绩,请努力遐想吧
有关Tahiti构架的更多特性解析以及相关的性能测试,我们将在北京时间2012年1月9日13点NDA失效的同时准时为你奉上,敬请期待吧。
推荐经销商