●第二代统一构架硬件综述
经过了第一轮较量,双方再一次回到了相对公平的起跑线上。无论G80/G92还是R600/RV670都可以被看作是一个完美的tick-tock过程,NVIDIA通过第一代统一构架积累了丰富的面向DirectX 10的硬件设计经验,并根据其直接面向ALU的理念创造性的将流计算向前迈进了一步,直接使用ALU进行通用计算的CUDA体系成了今天NVIDIA的重要卖点和未来发展方向。AMD亦通过一次完美的tick-tock过程修正了R600上很多非常致命的错误和缺陷,成功完成了构架瘦身,为未来的新构架打下了良好的基础。机会对双方来说都是均等的了。
在经历了漫长的等待之后,我们终于看到了第二代统一构架的硬件,相对于第一代有些一边倒式的乏味格局,第二代统一构架可以说是一场灿烂的对撞。
GT200与RV770的对决
首先是NVIDIA的GT200,GT200最大限度的利用了DirectX 10在shader上的开放性和灵活性。他是第一个尝试以通用计算性能来阐释和对应图形性能的构架。在NVIDIA的眼中,符合DirectX 10要求的ALU可以被用来执行任何的shader指令,那么用它来实现符合shader格式要求的通用计算指令是一个很好的应用方向,更加强劲的通用计算性能势必需要更加灵活和高效的ALU单元,而更加灵活和高效的ALU单元在执行DirectX 10所要求的更加灵活和自由的shader指令时效率也绝对不会差,这也是NVIDIA自身对微软推出DirectX 10的目的理解。GT200的出现标志着NVIDIA对DirectX 10意义和应用手段,甚至是未来发展方向的理解正式走向了完美和成熟。
而AMD这边的RV770一样让人激动不已,激增的运算能力,激增的纹理性能,激增的后端规模,激增的显存带宽,同时还有没有跟着一起激增的优秀的功耗。无论从哪一个角度来看,RV770都是一款极为成功的产品。相对于R600,RV770上反映了AMD极大的野心,希望通过最平衡的资源搭配和极端完美的后端应用在实际应用中压制对手高效构架的野心,希望将对手拖入极端消耗技术积累的工艺战的野心,希望通过对软件环境的影响力为自己争取最大利益的野心,甚至是妄图以SIMD巨大的吞吐直接压制延迟的野心。
尽管双方在第二代统一构架中的表现都可圈可点,但这并不代表双方的第二代统一构架就都是完美的。实际上不论是NVIDIA还是AMD,大家都有着自己不得不面对的甚至可以说是性命攸关的危险。