● “Venus48”:最和谐但也最困难的选择
以个人而言,我是一个轻度的强迫症患者,追求“完美事物”,“Venus40”的ROP和CU/MC对齐度较低,而“Venus40 II”的结构改变和显存带宽同样让其显得并不完美,这让这款图形架构看起来多少让人觉得有些“别扭”。
“Venus48”逻辑架构示意图
“Venus48”的整体规模较之“Venus40”又有了进一步的放大,它拥有48组CU,3072个Vector ALU,192个Texture Array以及48组ROP,这些结构依旧以Dual ACE达成宏观的对称并行。“Venus48”的晶体管规模预估为60亿左右,芯片面积预估为505平方毫米,在达到1.2T DP Flops的性能指标时,其核心频率为770MHz。
强大同时看上去非常“和谐”,这是“Venus48”架构最为突出的特点。它不仅运算单元规模充足,前后端以及传统图形/运算资源的分布也更加对称和适宜,在实现相同性能指标时需要的频率更低,我们认为这是不考虑各种外部环境因素影响前提下最为强大和完整的GCN架构。
TSMC 28nm Wafer恐怕难以承载“Venus48”的压力
尽管我们甚至已经用上了“和谐”这样的形容词,但这并不意味着“Venus48”就是“无敌”的存在,它要面对的困难和挑战在三款架构中最为根本,同时也最难以逾越。同“Venus40”一样,“Venus48”的芯片面积大幅超越了AMD面前的D线,其对D线的跨越幅度(37.6%)甚至超过了ATI的末代产品R580(25.2%),500平方毫米级别的芯片尺寸虽然在GPU发展史上并非没有先河,但对于已经5年未曾涉足大尺寸芯片布局及制造过程的AMD来说,无论从经验、能力还是可以投注的资源总量来衡量,这样的芯片被制造出来的可能性对现在的它来说都是极小的。除此之外,庞大的运算部分本身虽然带来了可观的理论运算资源,但也对管理机制提出了更大的要求,以Tahiti的Dual ACE对这样的运算部分进行管理,“Venus48”的单元复用率以及整个架构的效率将面临不小的考验。
推荐经销商