全新GCN 4.0架构的几何引擎性能得到了一定程度的提升,其内置的Primitive Discard Accelerator将在初始建模之前,会筛选出根据3D图像的距离逻辑,省略掉较远处物体建模的曲面细分指令。由于距离远,对远处物体的建模是无用的,虽然视觉上看不到,但还是会一样消耗性能,因此AMD选择放弃这一部分,不进行曲面细分,从而提升几何引擎的效率。而新建索引缓存则可为更小的几何实例服务,以便减少数据移动,释放内部带宽资源,并提高原始吞吐量。
改进的几何引擎
在经过AMD的优化后,通过减少流水线停顿、增加指令缓冲区容量、提高单线程、调整L2缓存等多项措施,GCN 4.0架构中每组CU的性能提升了15%。
CU单元性能提升
GCN 4.0的显存控制器也得到了更新,显存频率高达8Gbps,同时带宽也达到了256GB/s。色彩压缩技术的加入,让很多重复的材质和信息可以被压缩存储,提高存储空间利用率,增加数据传输速度。因为图像是由不同颜色构成的,颜色相似度越高的像素,它就能以更高的比率压缩,最多可以达到1:8,这点同NVIDIA的Pascal架构相同。
显存和色彩压缩技术
在GCN 4.0架构中出现一个全新的HWS(硬件寄存器)单元,它是为异步计算和VR设立的特殊模块,意在针对VR虚拟现实的音频、视频与实时任务进行优化,提高硬件资源的利用率,并进一步提高GCN架构异步计算能力。
HWS单元
AMD在显示技术方面做了改进,GCN 4.0架构显卡开始支持DP 1.3及HDMI 2.0,并预先支持DP 1.4接口,可以输出10bit画面。此外,AMD还实现了单根DP 1.3线缆进行5K@60Hz分辨率的输出,这在现在来看还是非常先进的。
支持DP1.4-HDR
DP1.3单线输出5K@60Hz
视频解码编码方面,GCN 4.0架构也做了改进,H.264编码支持4K 30Hz编码,HEVC/H.265则可以支持到4K 60Hz编码。现在视频编码解码不仅关系到玩家看高清视频内容,很多游戏直播、录播软件也流行开了,支持高效率的编码有助于减少CPU占用率。
全新架构使能耗比得到显著提升
半导体工艺对芯片性能、功耗的影响是根本性的,根据官方资料,AMD选择的三星14nm FinFET工艺使得显卡运行电压降低了150mV,功耗降低了30%,所以GCN 4.0架构使用的14nm工艺相比28工艺能提升70%的每瓦性能比,但在AMD优化之后,新显卡的能效比最终达到了前代水平的2.8倍。
推荐经销商