领先一代 NVIDIA的进行时和将来时
● 威力双联装 Geforce 7950 GX2
2006年3月,随着Geforce 7900/7600系列显卡问世,G7X系列显示核心全部实现了90nm化。新的制造工艺使Geforce 7900/7600系列显卡制造成本和功耗降低、频率和性能提升。另外,Geforce 7900/7600都提供DualLink规格的DVI输出、支持2560x1600高分辨率显示,PureVideo的高清加速能力还通过Forceware程序得到性能提升。
NVIDIA还推出了顶级位置的的Quad SLI技术,这种技术采用4枚GPU协同运作,最高能够实现32倍抗锯齿,提供了比双GPU SLI更高的图像质量和速度表现,为适应未来的高端超负荷运算奠定了基础。对应此技术,
NVIDIA5月发布了当时世界上最快单显卡的Geforce 7950 GX2。Geforce 7950 GX2显卡包含两个7900 GTX GPU,核心频率为500MHz,每个核心512MB GDDR3 1.2GHz的本地内存配置。该卡设计极为精良,基于SLI技术但可以在非SLI主板上正常使用,还能够使用两块Geforce 7950 GX2在支持SLI的主板上实现Quad SLI,搭建远超竞争对手的超级3D加速平台。
NVIDIA Geforce 7950 GX2
Geforce 7950 GX2是NVIDIA有史以来最华丽的技术能力演示,象征意义大于实用意义。
● 统一渲染新时代 Geforce 8800 GTX
06年11月发布、完整支持DirectX 10、彻底统一渲染架构风格的Geforce 8800 GTX是自Geforce 256以来NVIDIA受到关注最高的革命性产品,这款产品领先3D API标准3个月,领先比自己慢的竞争对手半年上市,创下了NVIDIA旗舰级3D娱乐显卡的销售记录。通过Geforce 8800 GTX,NVIDIA进入了一个近乎无对手的帝国时代,独立于3D图形硬件行业的巅峰。
Geforce 8800 GTX使用的GPU为G80,它提供对ShaderModel 4.0、NVIDIA Quantum Effects物理处理技术的支持,NVIDIA Lumenex引擎的引入则实现了128位浮点高动态范围光照和8倍多重取样抗锯齿效果。G80带来前所未有的设计:统一Shader架构(Unified Shader)带来强劲的性能,完全硬件支持DirectX10的各项先进特性,具备128个通用标量着色器的Geforce 8800 GTX具备万亿浮点处理能力(Teraflops of floating point),GigaThread逻辑支持数千个线程并行运行,有效调度所有着色器的均衡负载,最大化3D计算,对DX9和DX10级别的3D应用都有理论上趋于完美的适应性。Geforce 8800 GTX还支持384bit的内存位宽,搭配将近2GHz频率的768MB本地内存,即使在30英寸LCD上游戏也不会遭遇本地内存容量瓶颈。
Geforce 8800 Ultra出现后,Geforce 8800 Ultra已经不是最快速的3D加速卡,但他问世之初时的震撼仍然让人无法忘却,超上代旗舰100%的加速能力,风驰电掣的游戏速度,甚至还有部分场合代替CPU的通用计算能力,NVIDIA已经在领先的道路上越走越远。
● 平民高清+DX10 Geforce 8600 GT
ATI、NVIDIA双雄并进的趋势持续了7年之后,被AMD收购后的AMD-ATI在产品推出速度上显现颓势,相反NVIDIA则具有强悍的创新力和生命力。在领先竞争对手半年时间推出首款DircectX 10的顶级3D加速卡Geforce 8800之后,NVIDIA于4月17日又把Geforce 8产品线扩充完整,Geforce 8600和Geforce 8500两个显卡系列延伸到主流市场。
Geforce 8600 GT以灵活宽松的产品规格配置、合理的价格、均衡的DX9/DX10应用加速能力、新锐的高清硬件解码逻辑已经成为新一代中端主流独立显卡的代表型产品,和竞争对手的Radeon HD 2600 PRO/XT相比,Geforce 8600 GT在相同档次频率设定下速度更快、驱动表现更稳定,市场可选余地也更大。
Geforce 8600 GT使用的GPU为G84-300,由台基电(TSMC)使用80nm工艺制造,G80革命性的可以维持最多4096个线程的GigaThread逻辑部分被完全保留,并且其内部还集成了G80不具备的新版Video Processor和H.264 BSP引擎,强化了高清视频解码能力。Geforce G84-300 GPU基本上是G80硬件指标的25%。它是一款32通用着色器的GPU,实际上它就是16SPs*2的配置。G84内的32个通用标量着色器频率和ROP标准频率的675MHz异步运行,比例大致在2.16:1,它的内存控制器仅为128bit位宽,远较G80的384bit/320bit低。
NVIDIA的GPU在NV4x一代开始便引入辅助高清解码技术的PureVideo HD,并在06年初增加了对H.264编码格式视频的解码支持。PureVideo HD已经能有效缓解CPU的压力,只是解码过程仍然需要CPU很高的参与度,不能彻底释放CPU负载。PureVideo HD最新版本现在在NVIDIA G84和G86 GPU上被引入,它的最大改进是:高清视频解码可以100%交由GPU计算!CPU彻底解放。
G7X和G80 GPU的PureVideo HD特性依靠内部的VP(VideoProcessor)提供,在对高清视频进行解码时,能够完成除了Bitstream处理和InverseTransform之外的其它操作,包括对CPU能力要求不低的De-Blocking操作。但以H,264编码的高码率影片播放时,即使CPU被PureVideo HD从De-Blocking解放出来,Bitstream处理仍旧给CPU沉重的压力。
G84 GPU在内部设计上大大增强了视频解码逻辑,除了VP版本更新并加强了性能之外,还新增了针对H.264解码的BSP(Bitstream Processor)引擎,解决原来G7X和G80 GPU的PureVideo HD仍需CPU进行Bitstream处理的问题,彻底接手高清视频解码的所有工作。以G84GPU为核心的Geforce 8600系列显卡,现在能够基本不需CPU计算能力的支持,就能流畅播放高码率H.264压缩格式的高清视频,BSP支持CABAC/CAVLC两种方式的Bitstream处理,即使使用的是低速CPU,CPU占用率也可以保持在40%以下,系统响应度和播放顺畅度都能够保证。
● 写在最后
半年更新、一年换代是NVIDIA长期奉行的产品更新策略,正是这样的赶超自我的驱动力让NVIDIA在激烈的技术市场厮杀中胜出,回顾近年来NVIDIA高端产品的发展历程,几乎半年一次的新产品更替速度不仅让竞争对手疲于应付,还有效的进行了优胜劣汰,让懦弱者沉沦于历史长河之底,让勇敢者抵达光辉的彼岸。