精简核心的RX 470
Radeon RX 470采用14nm FinFET “Ellesmere Pro”核心,核心面积为232平方毫米,共包含57亿个晶体管。基于GCN 4.0架构的该核心共有1792个流处理器,运算单元数量为28个,TMUs总数量为112个,ROPs数量为32个,四个带宽为64bit的双通道显存控制器组成了总量为256bit的显存控制单元,大小为4GB。
显 卡 规 格 比 较 表 | ||||
显卡型号 | RX 470 | R9 380 | RX 470D | GTX 1050Ti |
首发限价 | ¥1599 | ¥1499/1699 | ¥1299 | ¥1099 |
GPU代号 | Ellesmere | Antigua | Ellesmere Pro | GP107 |
GPU工艺 | 14nm | 28nm | 14nm | 16nm |
GPU晶体管 | 5.7B | 5B | 5.7B | 3.3B |
着色器数量 | 2048 | 1792 | 1792 | 768 |
单精度浮点 | 4.9 T | 3.5 T | 4.3 T | 2.1 T |
ROPs数量 | 32 | 32 | 32 | 32 |
纹理单元数量 | 128 | 112 | 112 | 48 |
核心频率 | 926MHz | ?MHz | 926MHz | 1290MHz |
boost频率 | 1206MHz | 970MHz | 1206MHz | 1392MHz |
架构 | GCN 4.0 | GCN 1.2 | GCN 4.0 | Pascal |
显存频率 | 1750 MHz | 1425 MHz | 1750 MHz | 1752 MHz |
内存位宽 | 256 bit | 256 bit | 256 bit | 128 bit |
内存带宽 | 224 GB/s | 182 GB/s | 224 GB/s | 192 GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
内存容量 | 4 GB | 2/4 GB | 4 GB | 4 GB |
注:表中售价均为官方首发限价
我们可以看到,Radeon RX 470的默认核心频率虽然仅为926MHz,但Boost频率却高达1206MHz,与RX 470持平,这个频率可以说还是很高的。RX 470显存带宽为224GB/s,完整支持DirectX 12 API以及异步运算,在DX12中有着更好的表现。RX 470的默认Pixel Fillrate能力达到了39.2Gpiexls/S,默认Texture Fillrate能力为137.3Gtexels/S。凭借高频和庞大的运算规模,RX 470拥有4.3 TFLOPS的高单精度浮点运算能力,是对手GTX 1050Ti的2倍。
GCN 4.0架构Ellesmere芯片由以下主要的部分组成:
1、基于三星的14nm FinFET工艺,照比之前的28nm工艺,为每个CU单元带来15%的性能提升,以及高达2.8倍的能耗比提升。
2、与“Fiji”相同的宏观并行结构,36组CU单元被分为4个Shader Engines,每个Shader Engines包含9组CUs。每个CU的Shader效率照比前代提升了15%,同时几何引擎也有所改进。
3、与Shader Engines一一对应的4组Geometry Unit(几何处理单元)以及4组Rasterizer(光栅化单元)。
4、ACE异步计算单元的总量为4组,同时,还有2组全新的,为异步运算设计的HWS加入到架构中。HWS用来更好地对硬件资源进行调度,提高异步运算效率。
5、二级缓存是之前的2倍,在降低显存带宽需求的同时改善电源效率,在显存运行上更节能。
RX 470D GPU-Z截图
Ellesmere架构的核心设计,即CU单元与Fiji甚至Hawaii相差甚微,绝大部分uncore部分的结构也完全沿用了Fiji的设计,两者甚至连宏观并行结构和缓冲体系都一模一样。Ellesmere与Fiji之间除了CU总量和显存控制器之外,可以说并没有本质性的差异。最大的改进点在于HWS单元的引入,让新的GCN 4.0架构在异步运算方面可以取得更好的表现。
推荐经销商