● 继续用固定硬件单元实现特殊功能
计算机体系结构的基本原理是,任何软件能够实现的,硬件都能够实现,相反也成立,这被成为硬件软件等效原理。这一原理只是功能等效,性能来说,良好优化和设计的硬件通常要比同样水平的软件快很多,同样,开发周期长,开发的成本,也要高不少,体系结构研究的重点就是从需要出发,寻求最佳的软硬件平衡点,在一定的成本约束下,获得最高的性能。
GPU中也是一样,在目前统一渲染成为主题的今天,统一渲染着色器(Unified Shader)和固定功能单元(Fixed Function)是配合的,当我们重点看SP规模的时候,其实GPU性能的很大程度是由固定功能单元来完成的。
从固定功能单元的发展历程来看,在一项新技术最初被提出时,一般厂商都希望使用一个特定的硬件IC去实现这项技术。而在这项技术经历一段时间之后,特定功能单元一般都会被大规模的可编程单元替代,尤其是在GPU的发展历程中非常普遍。
曲面细分单元(Tessellator)会被替代吗
比如说当年的T&L技术最初是由特定硬件完成的,后来逐渐被替代。顶点、像素、几何三项着色工作在DirectX10出现之前也是由各自对应的着色器来负责的,但是统一渲染架构提出之后它们被统一渲染着色器替代。
Intel也知道这条道理,它认为固定渲染单元最终可以被Shader指令替换,Shader指令也可以由x86扩充指令替换。所以Larrabee简单而又庞大的架构运用而生。实际上整个IC设计领域都在实现“去功能化”这个方向,所有人都明白添加固定功能单元换取性能提升不是长久之计。
在5月28日我们对NVIDIA首席执行官黄仁勋先生的专访中,黄先生赞成不断增强曲面细分能力,但是这种能力的增强,依靠的是使用固定功能单元或者说特定硬件IC,实际上也就是曲面细分单元(Tessellator)。
黄仁勋先生向我们解释到,在考虑每瓦特性能的今天,追求性能的提升必须要衡量其他因素的影响以及控制这种影响,特别是用户最为关注的功耗问题。图形渲染能力(Rendering)和几何能力(Geometry)是目前GPU最为主要的两个发展方向,这两个方向所需要的硬件是不同的。
曲面细分性能或者说业界对曲面细分的依赖,再次造就出独立的Tessellation单元。当然虽然它不太符合通用处理单元的发展方向,但是如果计算晶体管的投入与性能回报,特定硬件实现Tessellation功能是目前最好的选择。所以黄仁勋先生坚持以增添特定硬件IC的方式来提升GPU几何处理能力。