NVIDIA近日宣布,IBM已经为其最新款高性能计算(HPC)服务器配备了Fermi新架构的Tesla 2000系列高性能计算处理器,这也是NVIDIA Tesla第一次出现在主流HPC系统中。IBM System x系列的“iDdataPlex dx360 M3”是一套半深式2U Flex或者3U高性能计算系统,专为需要高性能但占地空间、电源和散热基础设施受限的数据中心而设计。
因为从某种角度上讲,Tesla可以看作是一款HPC的协服务器,专用门用于浮点运算加速。而从CPU的历史来看,CPU以前也有一个专门用于浮点运算的外置协处理器,最后慢慢移植到了CPU内部。
高性能计算(HPC)已经成为NVIDIA的重要产品线
如果说虚拟化是近年来服务器领域的一大热门,那么在高性能计算(HPC)领域中,通用图形处理器(GPGPU,General-purpose comPuting on Graphics Processing Units),或者说GPU通用计算(下文简称GPU计算)在这几年也越来越火热了。
NVIDIA作为一个出色的商人,它当然知道卖一片Tesla所得的利润,远高于传统的GPU核心Geforce。尽管他们都是GF100芯片,448个流处理器CUDA Cores,但是2500元人民币能够买到的GTX470和2500美元买到的Tesla M2050,在利润贡献方面是完全两个概念。
2009年中国研发的基于CPU+GPU混合计算架构的“天河一号”一举夺得了中国TOP100超级计算的排名的桂冠,闯入全球TOP500强的前五位,让人们见到了GPU计算的威力所在。完全可以说,GPU通用计算已经是一个不可阻挡的潮流。而此次设置于深圳中国国家超级计算机中心(National Supercomputing Centre)的“星云”,采用Intel的X5650处理器,搭配NVIDIA的Tesla C2050绘图处理器做为加速器。
但是不可否认的是,同时兼顾HPC和显卡两条产品线,已经让NVIDIA心力憔悴。因为在HPC领域受欢迎的是大芯片战略,GPU必须拥有更强的ALU运算器组织能力而不仅是大量的运算单元。换而言之,每个运算器的后备资源必须足够充沛,才能保证芯片在遇到复杂的运算环境时降低理论性能衰减。
将GPU的应用范围扩展到HPC领域,实际上和传统的图形渲染是有一定冲突的,这一点谁都不敢否认。因为由此造成运算器发射端和寄存器容量增长,会导致GPU晶体管数量快速上升,所以我们看到NVIDIA和AMD对阵过程中,Fermi架构使用32亿晶体管换取的DirectX 10图形性能和RV870芯片HD5870用21亿个晶体管换取的性能不相上下。HPC领域的大幅度领先导致了传统图形渲染的每瓦特性能远逊于对手AMD,这就是NVIDIA这一代GPU产品面临的最大困境。