● GTX660的新AB面
在之前的《少数派报告 GTX660Ti/660图形架构猜想》一文中,我们已经在预测GeForce GTX 660Ti架构的同时预测了GK106以及GeForce GTX 660的架构细节。现在我们重新带来了经过“制图过程优化”之后的新版本GeForce GTX 660架构图,它与先前的版本并没有逻辑结构的本质区别,只是改变了部分单元在架构图中的位置。与此同时,由于添加了比过去更加全面的要素作为限定条件,出于将风险最小化的考虑,我们摒弃了之前改变SMX内部结构的方案,并将之替换成经过时间成本和研发难度成本更佳的另一种GeForce GTX 660架构形式,也就是维持SMX偶数配对的3GPC并行方案。
根据我们最初的推测,GK106架构将可能会与GK110发生联系,因此我们认为GK106将会改变GK104以及NVIDIA自Fermi时代坚持至今的偶数SM/SMX配对构成GPC的形式。但经过长时间的思索和权衡之后,我们认为这种方式的操作风险较大,无论前后端还是并行模式都将发生改变,这种改变势必会影响整个内核的运作效率,同时还会给架构带来setup性能相对较弱等问题,所以我们进一步发展出了结构区域常规、研发时间成本和研发风险相对较小的另一种GK106架构。它与之前预测的第一种形态在运算规模、显存带宽以及后端性能方面没有差异,两者最大的不同来自宏观并行度不同导致的几何能力差异。
在第一种架构中,我们假设的芯片将具备6组SMX单元,分别居于2个GPC中来组成并行结构。最初出现的GK106将会在960 ALU的原则限定下关闭一组SMX单元。双GPC意味着双前端以及光栅化处理部分,其单周期的几何输出以及光栅化能力为同频旗舰级架构的一半。它与GK110之间存在一定的相似度和亲缘关系,但并行度和GPC结构的调整让它在时间成本和研发方面需要承受较大的风险,同时这种架构的几何能力被削弱的较为明显。
经过细致考虑后被我们废弃的GK106预测架构
在第二种架构中,我们依旧假设的芯片将具备6组SMX单元,但会分别居于3个GPC中来组成并行结构。3 GPC的传统结构让它具备了3套前端以及光栅化处理部分,其单周期的几何输出以及光栅化能力为同频旗舰级架构的75%。更好的几何性能、更低的时间成本以及研发成本是它的优势,对于NVIDIA来说这样的架构显然具备更好的可操作性。这种架构丧失了为GK110积累经验的能力,但我们认为更好的性能以及更低的成本依旧让这种架构具有相当大的吸引力。
以上就是我们给出的经过更全面考虑并多次修正后获得的2种GK106的架构,它们各具特色但又具有统一的特点,那就是960 ALU的运算规模,是什么让我们做出了这样的运算规模判断呢?
推荐经销商