我们在前一篇GPU大百科全书中曾经提到过,除了精度战之外,像素单元的发展中还曾经发生过谍报战。谍报战?你以为NVIDIA是峨眉峰,ATI是佛龛么?开什么玩笑,几个ALU单元的设计,还能闹出谍报战这么玄乎的东西出来?
能,不仅能,而且异常精彩和成功。
CeBIT2004上NVIDIA的一系列情报战,让这届展会声名鹊起
还记得CeBIT2004上那个“完美支持DirectX 9.0,8条流水线,每条流水线2组TMU单元,单周期能够进行16次浮点像素操作及贴图操作,特别包含来自3Dfx未发布的rampage所使用的先进技术”的“NV40”么?这个看上去像是NV35放大一倍,同时有火星科技加持的东西几乎欺骗了全世界,不仅包括竞争对手ATI,全世界所有的玩家以及关注者,投资家,股评人,甚至还包括一部分尚未得到芯片的显卡厂商。4月之前,ATI不紧不慢的维持着自己R400系列的研发工作,整个世界则几乎都在热火朝天的讨论着3Dfx这个曾经的图形帝国,在崩溃之前究竟留下了怎样的黑科技,甚至黑到可以帮助弱到不行的NV3X去争夺性能王座。而关于这个构架本身的真实度嘛……
至于你信不信,我反正信了。
在经历了NV3X的溃败之后,颜面尽失且市占率受到冲击的NVIDIA十分急于收复失地,重新确立自己图形霸主的地位。有介于NV3X的失败,他必须快速的,起码是比竞争对手更加快速的推出一款改进型构架,在抢得发布先机的同时重新赢回性能王座。又要发布快又要性能快,最最大的可能就是把NV3X的规模各种放大,然后以新工艺+高频的形式快速放出。这一点你知道,我知道,ATI知道,所有人都知道。
所以,我们就都被骗了。
NVIDIA成功的抓住了包括竞争对手在内的所有人的心理,让所有人都认为自己会为了短期效益脑袋发热的去继续走NV35缝缝补补的老路。这不仅极大地麻痹了竞争对手,同时也为后来的NV40上市创造了破纪录的惊喜感。因为它太过出乎意料,太过超越人们设想的底线,甚至几乎完全站到了NV3X构架的对立面上,成了先进高效构架的典型。
相对于NV3X,NV40的改进可谓大刀阔斧。它彻底去掉了只属于DirectX 8的Combine,代之以具备完整功能mini ALU且支持co-issue的shader Unit 2,完全修正了愚蠢的Register bank问题、Output Buffer与Register使用同区域以及极少Register总量的错误,NV40构架可以做到同时调用4个FP32 Register或者8个FP 16 Register,像素填充率仍然不出现下降。有了这些改进,再加上整体放大的规模,NV40的各方面性能均可以达到NV35的2倍以上,在很多DirectX 9类得场合甚至可以达到4倍以上。与此同时,NV40还完整支持了全新的DirectX 9.0C。Shader Modle3.0的地位和意义我们在以前的文章中曾经反复强调过了,NV40作为业界第一个完整支持它的构架,其意义可想而知。再加上IBM fishkill fab亲自操刀带来的130nm铜互连工艺以及冗余晶体管设计等等耀眼的光环,可以说NV40一出,全世界瞬间便为之疯狂和兴奋。
当然,除了一个人之外,那就是ATI。
之所以说NVIDIA在NV40上发动的谍报战是成功的,相当大一部分原因在于他成功的麻痹了竞争对手ATI,这种麻痹甚至过于成功,成功到拖慢了竞争对手的研发速度的同时让对手彻底乱了节奏。
NV40的发布让ATI陷入了空前的尴尬和窘迫之中,因为根据之前多方面汇总的情报,ATI已经做出了确认NVIDIA要推出“完美支持DirectX 9.0,8条流水线,每条流水线2组TMU单元,单周期能够进行16次浮点像素操作及贴图操作,特别包含来自3Dfx未发布的rampage所使用的先进技术”的新构架的判断,同时将自己完整支持DirectX 9.0C的R400构架的研发速度控制在了一个相对缓慢的程度。R3XX的成功让ATI充满了自豪和满足感,这种自豪和满足感最终发展成了过度的自我膨胀以及对对手的轻视。NV3X的设计不足以对R3XX构成威胁,那么在此基础上进行的修补自然也就不会对R3XX构成威胁,更不要说更加先进的R400了。
可是谁都没想到,最终到来的NV40,却是这么个大炸弹……
根据预研周期判断,我们有理由相信ATI并不是在NV40发布当天才获知其真面目的,因为一款构架的研发不是过家家,说上就能上。但我们同样有理由相信,NV40的确在相当长的一段时间内成功的欺骗了ATI。在NV40发布前后,陷入巨大慌乱的ATI彻底乱了阵脚,本来计划中利用R350的结构基础+支持DirectX 9.0b,用来对付那个不存在的软弱对手的构架显然不能应付目前的局面了。ATI不得不紧急停止了一切原计划的R400的研究工作,转而将先前的改进型构架放大规模到与NV40同等规模,同时尽可能多的提高频率,以便让其获得与NV40抗衡的可能。至于DirectX 9.0C,那实在是没有办法说上就上了。于是在NV40发布后,我们又看到了似曾相识的一幕——ATI站出来反复强调和攻击DirectX 9.0C,称其是不合时宜以及缺乏支持度的。
在第三代像素处理单元的战争中,胜利者毫无疑问是NVIDIA,仓促上阵的R420虽然得益于R3XX的优秀基因而具备了不错的Shader Modle2.0性能,但相对于NV40来说,在效能上始终乏善可陈,而且缺乏对Shader Modle3.0的支持让其注定无法与NV40同场竞技。像NV30时代的NVIDIA一样,ATI输了,而且连输的理由都跟先前NVIDIA的一摸一样。
也许你已经注意到了,尽管像素处理单元的设计之战精彩纷呈而且花样翻新,但似乎胜负的决定要素都是一样的,而且这个要素,跟绝对研发实力似乎根本没有关联。