● 没错,这就是Tahiti
如果说Cayman的表现为AMD找到了前进的方向,那么Tahiti的出现,就可以被看做是AMD沿着这条路一直走下去的重要标志了。因为Tahiti的诸多改进不仅延续了Cayman的大方向,更第一次相当直接的将所有改进的目的非常明确的集中到了单元复用率的身上。
Tahiti系列构架代号南方群岛
在Tahiti构架中,AMD彻底放弃了简单粗暴的扩充法,改为从构架的逻辑层面着手努力来寻找更优秀的构架设计方案。其最主要的改进,包括前面提到的撅弃VLIW、进一步改进线程能力以及全面引入unified cache,几乎已经让AMD走出了长达五年的迷途。
改进Dual ACE并进一步加强线程管理能力,为Tahiti构架带来了更加强大的线程管理能力,与此同时,每一个CU中增加的二级线程管理机制,也让Tahiti拥有了密度上与Fermi相当,理论总量上甚至超越Fermi的ALU团簇内部任务管理能力。线程能力的大幅加强可以让ALU更快更有效率的获得指令和任务,对单元复用率的提升贡献颇大。
HD7000家族
VLIW 4在Cayman中的表现验证了削减吞吐限制对提升单元复用率的贡献,同时也坚定了AMD彻底抛弃VLIW的决心。较之VLIW繁冗的打包规则以及由条件分支等多种原因导致的单元等待,单纯而且无限制的SIMD吞吐形式显然能够让单元更加畅快的获得指令并进行执行。对ALU团簇结构以及VLIW的最终摒弃不仅让AMD甩掉了禁锢自己4年以上的沉重枷锁,从根本上大幅提升了ALU部分的单元复用率,同时也断绝了再次迷失在吞吐还是效率这个抉择中的可能,让RV870这种恶例再也没有了出现的机会。
Cayman中经过改良的线程模式对提升单元复用率起到了帮助作用
unified cache的引入,为已经获得解放的ALU团簇提供了远比过去灵活和充沛的缓冲资源。相对于只读且延迟必须透明的Shared,可写的unified cache可以为单元提供更好的寄存器溢出缓冲,搭配被进一步强化的线程能力, unified cache可以以极大的带宽和极低的延迟大量减少运算单元等待任务以及释放中间结果造成的周期浪费,减少这部分浪费的直接结果,自然也是单元复用率的提升。
HD7970产品信息
没错,这就是Tahiti,一个在历经错误和彷徨,甚至险些与机会失之交臂之后,终于变得清晰并坚定前进的结果。Tahiti构架的诸多改进不仅环环相扣,而且每一步都是Cayman转身的延续。所有改进的目的性都十分明确,那就是尽一切可能提升运算单元的单元复用率,进而提升整个构架的灵活性以及绝对性能。对于Tahiti构架的三大改进,我们只能用一个词来形容,那就是精彩!
推荐经销商