完整Polaris 11核心
Radeon RX 460 1024sp采用14nm FinFET “Baffin”核心,核心面积为123平方毫米,共包含30亿个晶体管。基于GCN 4.0架构的该核心共有1024个流处理器,运算单元数量为16个,TMUs总数量为64个,ROPs数量为16个,两个带宽为64bit的双通道显存控制器组成了总量为128bit的显存控制单元,大小为4GB。
显 卡 规 格 比 较 表 | ||||
显卡型号 | RX 460 1024sp | RX 460 | GTX 1050 | R9 370 |
首发限价 | ¥999 | ¥899/1099 | ¥899 | ¥1099/1199 |
GPU代号 | Baffin | Baffin Pro | GP107 | Trinidad |
GPU工艺 | 14nm | 14nm | 14nm | 28nm |
GPU晶体管 | 3 B | 3 B | 3.3 B | 2.8 B |
着色器数量 | 1024 | 896 | 640 | 1024 |
单精度浮点 | 2.5 T | 2.2 T | 1.8 T | 2 T |
ROPs数量 | 16 | 16 | 32 | 32 |
纹理单元数量 | 64 | 56 | 40 | 64 |
核心频率 | 1090MHz | 1090MHz | 1354MHz | ?MHz |
boost频率 | 1250MHz | 1200MHz | 1455MHz | 975MHz |
架构 | GCN 4.0 | GCN 4.0 | Pascal | GCN 1.2 |
显存频率 | 1750MHz | 1750MHz | 1752MHz | 1400MHz |
内存位宽 | 128 bit | 128 bit | 128 bit | 256 bit |
内存带宽 | 112 GB/s | 112 GB/s | 112 GB/s | 179.2 GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
内存容量 | 4 GB | 2/4 GB | 2 GB | 2/4 GB |
注:表中售价均为官方首发限价
我们可以看到,Radeon RX 460 1024sp的核心频率高达1250MHz,比RX 460高50MHz,这个频率可以说是相当之高的。RX 460 1024sp显存带宽为112 GB/s,完整支持DirectX 12 API以及异步运算,在DX12中有着更好的表现。RX 460 1024sp的默认Pixel Fillrate能力达到了20 Gpiexls/S,默认Texture Fillrate能力为80 Gtexels/S。
RX 460 1024sp架构图
GCN 4.0架构Baffin芯片由以下主要的部分组成:
1、基于三星的14nm FinFET工艺,照比之前的28nm工艺,为每个CU单元带来15%的性能提升,以及高达2.8倍的能耗比提升。
2、与“Fiji”相同的宏观并行结构,16组CU单元被分为2个Shader Engines,每个Shader Engines包含8组CUs。每个CU的Shader效率照比前代提升了15%,同时几何引擎也有所改进。
3、与Shader Engines一一对应的2组Geometry Unit(几何处理单元)以及2组Rasterizer(光栅化单元)。
4、ACE异步计算单元的总量为4组,同时,还有2组全新的,为异步运算设计的HWS加入到架构中。HWS用来更好地对硬件资源进行调度,提高异步运算效率。
5、二级缓存是之前的2倍,在降低显存带宽需求的同时改善电源效率,在显存运行上更节能。
RX 460 1024sp GPU-Z截图
Baffin架构的核心设计,即CU单元与Fiji甚至Hawaii相差甚微,绝大部分uncore部分的结构也完全沿用了Fiji的设计,两者甚至连宏观并行结构和缓冲体系都一模一样。Baffin与Fiji之间除了CU总量和显存控制器之外,可以说并没有本质性的差异。最大的改进点在于HWS单元的引入,让新的GCN 4.0架构在异步运算方面可以取得更好的表现。
本文属于原创文章,如若转载,请注明来源:春节前的诚意之作 RX 460 1024sp首测//vga.zol.com.cn/623/6235702.html
推荐经销商