那个小窗也可以容纳世界
前言:你用过ipad吗?在使用ipad2、tegra2、XOOM的过程中,你是否想过是谁在支撑着这些华丽的特效?我经常在想象这样一个场景——某天,我忽然掉进了一个电闪雷鸣的空洞,穿越回了10年前。惊慌失措的我走在街上,我的衣着,我的说话方式,甚至我不知所措的询问都不会引起人们太多的关注。但如果我当街掏出一台iPhone4或者iPad2,就很有可能会第一时间引起一阵骚动,甚至我还可能会被当做外星生物抓起来。如果换成你,你是否会有相同的感受呢?
在10年前的人们眼中,具备SGX535 GPU的iPhone4或者搭载了SGX543MP2的iPad2无异于超自然的机器。10年来移动设备3D芯片的发展是如此的突飞猛进,足以对当时的世界产生极为强烈的不真实感。
个人消费电子产品的巨大发展是最近10年来IT界最耀眼的事件。智能手机的崛起和迅速普及,让我们手中的移动电话成了过去科幻小说中才会出现的一台小巧但强大的袖珍电脑。手机的功能早已不限于电话、短信甚至拍照了,我们现在可以通过手机上网,看电影,聊QQ,看word、ppt乃至PDF,运行甚至是基于强大的UE3引擎的各种炫目游戏。这一切的一切,都与移动3D图形芯片的飞速发展有着密不可分的关系。
移动领域这些年来究竟发生了什么?手机平台为什么会有GPU?目前手机平台和平板电脑的GPU又发展到了怎样的阶段呢?iPad、iPad2和Xoom之类的平板电脑中的GPU性能又是怎样的呢?在本期的ZOL显卡探索与发现节目中,就让我为你一一解答这些问题吧。
顾杰所写过的技术分析类文章索引(持续更新) | |
2、 忠实微软是否有用 A/N统一构架细节分析 | |
3、揪出幕后罪魁祸首 是谁拖累了统一架构 | |
5、融聚的未来在哪里 APU构架方向发展分析 | |
7、NV也玩融合 探GTX700核心CPU+GPU构架 | |
|
帝国分裂微缩版
● 帝国分裂微缩版
曾几何时,我们的手机屏幕只是一个一点几寸见方的单色小窗,上面移动的一个个深色的色块就是画面的全部。再看今天动辄4寸左右,甚至如iPad2那样达到了10寸,分辨率也超过几十万像素的锐利屏幕,以及上面所显示的各种眼花缭乱的游戏和应用效果,你不觉得似曾相识么?没错,桌面PC图形发展的故事跟这个的起点是相同的,甚至连故事的经过都一摸一样。
motorola生产的第一代“大哥大”
我们不妨来回顾一下电脑图形界的发展历程——最开始的电脑屏幕只是一个圆滚滚的墨绿色小窗,上面移动的都是些白色的色块,他们构成了我们PC图形的最初搭配。后来,随着人们需求的不断提升,屏幕里渐渐有了色彩,色块也越来越小。渐渐的,色彩和分辨率的提升以及由此拉动起来的图形效果需求的不断增加终于累积到了CPU难以承受的地步。于是,GPU利用这一可乘之机从完整的CPU帝国版图中分裂出去了。
既然手机拥有与之相同的起点和经过,会不会故事的走向也一致呢?
随着人们需求的不断变化,手机屏幕从计算器一般的液晶条慢慢变成了一个方形小窗,然后这个小窗有了色彩,彩屏的出现直接催生了更好的游戏和应用体验的出现,然后为了进一步提升体验,屏幕发色数以及像素数也开始了攀升,这快速加大了手机CPU的处理的压力。而屏幕更大,应用环境更加开放的智能手机及平板电脑的性能需求终于让手机CPU走到了不堪重负的崩溃边缘。
在手机和平板电脑这个“小小的”世界里,帝国分裂的微缩版也改头换面再次上演了。
也许你会问,即便屏幕再怎么大,平板电脑也不过只有10寸左右,手机更是鲜有超过4寸的,两者的分辨率也很少会超过1024*768,这么小的屏幕和分辨率怎么会让CPU变得不堪重负,并最终分裂成出了SoC GPU这一接近桌面结构的特殊产物呢?这一切,都要从一个我们熟悉的定律——摩尔定律说起。
优化晶体管效率?你在做梦么?
● 优化晶体管效率?你在做梦么?
6个晶体管一个单元的sram,10个晶体管一个的1bit加法器,144个晶体管一个的4bit曼彻斯特进位链加法器,187个晶体管一个的4bit超前位加法器。1个基本的32bit寄存器由4组32个单元的sram组成,一个16bit加法器由4个4bit曼彻斯特进位链加法器构成,一个128bit ALU可以由8个16bit加法器组成……这些,就是我们面前这台PC里所有芯片最基本的构成。
SRAM单元结构
也许你已经发现了,其实这也就是摩尔定律的核心——我们的PC构架日新月异眼花缭乱的发展着,但各种天花乱坠的构架结构在本质上却是一样的,都是在现有工艺允许的前提下对上面那几位同志外加他们对应的控制电路进行的“简单”堆砌。构架的演进,只不过是让这种堆砌行为在宏观上变得更加合理一些,让数据有地方呆,同时在必要的时候到必要的单元中去,仅此而已。
构架性能的强劲与否,与这些重复单元的数量呈直接正比,只要宏观结构不出现重大的堆砌失误,更多的执行单元和充足的资源以及控制电路一定意味着更加强劲的性能,而那些所谓的“晶体管效率优化”的作品,实际上跟“晶体管优化”一毛钱联系都没有。正是因为戈登·摩尔博士敏锐的注意到了这一点,摩尔定律才可以规定芯片面积每上翻一倍的同时芯片性能也可以提升一倍,在衡量现代PC部件的性能时,我们也可以不甚严谨的直接用晶体管总数进行考量。
在工艺确定的前提下,每个晶体管工作的环境,如亚阀电压,载流子强度等等都是一定的,换句话说,性能与功耗之间基本上也是划等号的,更强劲的性能需要更多的运算单元、更多的缓冲以及更多的控制电路,也就需要更多的晶体管,自然也就会有更多的功耗需求。给多少电就跑多少活儿,这是通用构架乃至全部电子产品的最基本特征。
手机和平板电脑作为拥有独立处理和完整运算能力的设备,自然也不例外。
桌面甚至所有非移动平台都有稳定的电源可以供电,原则上想要多少就可以得到多少。不考虑成本,芯片切下来脸盆大,封装之后井盖大都无所谓,反正有电有散热就能动。问题是,手机和平板电脑可以么?
高科技手表和它的电池
● 高科技手表和它的电池
关于移动设备的功耗和性能的关系,有这么一个古老的笑话——
马克在机场候机。他叫住经过的一个年轻人:先生,能请问你现在几点?
满头大汗的年轻人提着两个沉重的手提箱,戴着一块大大的高科技手表,神气的答到:当然,哪个国家?
“你能提供几个国家的时间?”马克有兴趣的问。
“世界上所有的国家!”
“哇,太妙了!”
“那没什么,此表的功能还有全球定位系统、传真、EMAIL,甚至还能接收高清电视节目并在它的彩色液晶显示屏上播放!”
“太令人难以相信了!你不介意……不介意把它卖给我吧? 什么条件都行!”
“好,我的新鲜感已过去了。如果你真想要……900美元,怎么样?”
马克急不可耐地抽出支票薄,递给年轻人一张900美元的支票。年轻人脱下手表递给马克:“这是你的‘高科技’ 手表”。然后又递出那两只沉重的手提箱,“这是它的电池”。
个人消费电子产品不同于PC,它的便携移动性要求使得其整体体积不得不控制在一个非常小的范围之内,上面那个笑话就生动的说明了体积问题的重要性——以设备本身的空间,其电池容量不可能随心所欲的想做多大就做多大,如果你想要高科技手表具备那些新奇的功能,电池只能外置并且要做到旅行箱那么大。
芯片的功耗和性能一直处在矛盾的状态
手机和平板电脑的电池不仅要给整个运算和控制部分供电,还要驱动液晶屏以及照明部分,再加上其体积以及移动性对电池容量的双重限制,目前的锂离子电池已经到达了输出极限的瓶颈。在没有决定性的全新反应组分和输出方式出现之前,电池成了手机及平板电脑处理器性能最沉重的枷锁。移动设备的CPU既要基本的续航能力,又要输出强劲的性能以应对不断增长的各种应用需求,这种不给马儿吃草又要马儿日行千里的好事显然是不现实的。
这就是摆在手机和平板电脑面前的困境——要电没有,要空间就那么小一个。我们不可能在燃料电池甚至核电池应用之前停下发展的脚步,所以要解决功耗和性能的矛盾,同时满足高速增长的图形需求,可用的途径只有一个——尽可能放弃通用性,将专门的任务交给专门的电路来完成。
是的,GPU同学,我说的就是你。
西线无战事?
● 西线无战事?
既然CPU帝国在手机领域也上演了分裂的悲喜剧,那么桌面GPU惨烈的战火是否会延伸到这里呢?有人的地方,就有江湖。有商业的地方,就是战场。桌面GPU的惨烈战火,已经彻底燃遍整个手机及平板电脑领域了。
高通密集的roadmap应证了竞争的激烈
与桌面PC界不同,手机领域一直不具备DIY市场特殊的深入参与性以及快速更新周期,几乎所有用户在十几甚至几十个月之内都是成品的最终使用者,因此大多数人并未感受到传统手机显示领域激烈竞争产生的的浓烈火药味。我们买来手机之后,通常只会关注屏幕清不清楚、通话质量是否优秀、电池能续航几天或者键盘输入好不好用这类问题,里面用的什么显示芯片,它是由哪家供应商提供的、它的性能到底如何等问题对90%甚至99.9%的手机用户而言曾经都是完全无关紧要的话题。在民众眼中,手机显示领域的激烈竞争曾经是一个与自己全然无关的话题,那里好像一片风平浪静,什么都没发生似的。
其实这里一直都是一个惨烈的战场,TI、高通、三星、Bitboy、Imagination,再算上后来加入的NVIDIA以及被苹果收购的Intrinsity,手机显示领域几乎重演了上世纪90年代桌面3D领域那金戈铁马一般的阵仗。由于缺乏比较统一的应用性能标准以及足以一锤定音的决定性事件出现,手机显示领域的混战曾经一直非常处于胶着状态,谁都无法给别人致命一击,只能靠相对均衡的出货量来维系一种脆弱的平衡关系,这种僵局一直持续到智能手机及平板电脑的出现才被打破。
智能手机平台高度的开放性和用户参与度将用户的目光从单纯的通讯性能吸引到了硬件平台的处理能力方面,Symbian、IOS、Android、windows mobile以及其背后大量可以随意安装的开放型软件让人们意识到了手机处理能力的重要性,用起来越来越像电脑这一特性使得智能手机在性能需求方面也越来越接近电脑,而平板电脑的出现最终将这一趋势彻底推向了不可逆转的地步。手机及平板电脑的快速发展不仅催生了移动领域GPU从CPU中的分离,更使得能够提供智能手机/平板电脑通用的强大SoC GPU构架成了在这个行业生存下去的唯一标准。
于是,在经历了快速同时惨烈的洗牌过程之后,连曾经出货量最大的高通旗下的Adeno也不得不暂时退居二线,依旧矗立于一片狼烟残阳之中的,就只剩下了NVIDIA的Tegra2以及Imagination的SGX Series5了。
有像素的地方,就会有NVIDIA
● 有像素的地方,就会有NVIDIA
作为世界上最大的独立GPU供应商,NVIDIA在桌面领域的风光可以说无人不知无人不晓的,其在桌面领域的成绩和成就无需多言。但在移动显示领域,似乎NVIDIA还是个新丁,人们真正开始大量见到NVIDIA在移动领域的实际产品是在CES2011之后。其实NVIDIA进入移动SoC领域的时间,说长不长,说短也不短了。
由于桌面GPU单一路线的发展模式明显不利于公司未来的发展以及生存,NVIDIA很早就开始了在其他领域寻找发展突破口的努力和尝试。在移动领域,NVIDIA的第一次尝试来自09年得Tegra一代芯片。Tegra一代芯片被微软的ZuneHD播放器,Kin手机以及奥迪的MMI touch车载人机交互界面系统所使用,尽管被微软和奥迪这种财大气粗的款爷看中,但第一代Tegra事实上非常失败,没多少人见过第一代Tegra的尊荣及其产品就是明证。是什么导致第一代Tegra芯片在这种被超重量级厂商采用却依旧失败的呢?这其中固然有承载产品本身的运作方式问题,但NVIDIA自身在Tegra上所犯下的低级错误也是问题的关键。
Tegra一代芯片的思路直接源于桌面的Geforce,NVIDIA认为简单的将ARM11与一枚经过削减规模的桌面GPU直接封装在一起,就可以万事大吉了,这种看上去甚至有些幼稚的想法让Tegra在成型之后便有了数不清的问题。SoC芯片不同于桌面和笔记本平台,它对功耗的敏感性使得其具有了非常细腻和敏感的频率及休眠/唤醒管理机制,特殊的需求导致SoC芯片的工作模式及延迟管理手段比其他领域的芯片都要复杂许多,即便最省电的笔记本平台也无法与之相提并论。想法过于简单的NVIDIA很快就发现自己从来没有面对过如此复杂的延迟管理问题,这不仅使得Tegra芯片的功耗表现一直非常不理想,还使得其驱动及配置程序变得异常复杂,从而最终导致了海量的BSP Bug,于是NVIDIA又不得不花费了相当长的时间来清除这些BSP Bug……这个debug过程不仅浪费了非常多的时间周期和财力,更严重影响了Tegra一代芯片的推广。
Tegra初期的失败,对于经历过桌面GPU腥风血雨的考验并最终屹立不倒的NVIDIA来说显然不会意味着一切的终结。凭借着在桌面积累的丰富经验,以及誓要让“有像素的地方,就会有NVIDIA”的劲头,NVIDIA很快就从失败中总结了经验,完成了Tegra2的图形部分的研发。
有介于Tegra一代的经验教训,NVIDIA在Tegra2上并没有进行多少大胆的尝试,Geforce ULP的设计并没有采用一些激进的比如US单元之类的设计,NVIDIA将大量的研发周期投注到了平衡SoC相关的问题方面上,尽管依旧经历了近1年得时间,但Tegra2的debug过程进行的比Tegra顺利许多。下面,就让我们来看一看Tegra2的图形部分究竟有哪些特点吧。
ULP? 6600? 小号PS3?
● ULP? 6600? 小号PS3?
Trgea2的图形部分名为Geforce ULP(Ultra Low Power),由一组标准光栅化流水线组成,它包括4组Vertex Shader,4组Piexl Shader以及1组TMU单元,200MHz时具备3.2Gflops的理论浮点运算能力,API方面则提供了Open GL ES2.0的完整支持。涉及到IP Core的保密问题,NVIDIA并没有透露其关键性的ROP单元的规模和结构细节,因此我们不敢妄论Geforce ULP的后端结构,只能通过各种测试和公布的理论数据来衡量其基本性能。
Geforce ULP构架
在Geforce ULP上,我们处处都能看到异构和Ultra Low Power的影子。我们前面曾经提到过,专用单元的性能功耗比会优于通用单元,究其原因在于专用单元会根据自身需要搭配适当的寄存器资源,这部分寄存器资源的需求会小于需要面对多种场合的通用单元。Geforce ULP采用VS和PS分离的单元,其初衷就在于通过专有的针对性单元将Vertex Shader和Pixel Shader指令分开进行吞吐。当面对无需处理分支而且格式始终是规整4D,但有可能包含特殊三角函数的Vertex Shader指令时,具备标量处理器的VS单元可以以最低的功耗来完成最高效率的吞吐,而场合转换到更加复杂的Pixel Shader指令时,PS单元又可以较好的给予适当的应对。
另外,NVIDIA通过异构控制的方式将整个Geforce ULP的结构控制到最简,全部的控制工作,如线程调度和发放等由片外的一枚ARM7处理器来完成,这枚ARM7处理器通过统一共享内存与Geforce ULP和系统的其它部件项链,同时还负责着整个Tegra2构架其他部位的控制工作。此外,NVIDIA还将类似pure video的功能以单独的双解码芯片的方式加以实现,并通过剥离部分ROP单元的功能形成独立的PBU(Programmable Blend Unit)来实现可编程的混合加速,如flash应用等。
Geforce ULP无论从哪个角度来讲,都非常接近曾经的经典桌面构架——NV43。采用经典分离式shader构架的NV43曾经是NVIDIA在NV3X大失败之后绝地反击战的主力之一,它通过专门的VS和PS单元分别处理Vertex Shader和Pixel Shader指令,完整支持DirectX 9.0C以及Open GL1.4等API。Geforce ULP的处理核心结构与NV43如出一辙,NVIDIA也不断地在各种场合宣称其具有Geforce 6级别GPU的性能表现,甚至我们完全可以将其看成一款非常经典的产品——32bit版本的Geforce 6200TC(Turbo Cache)。
而从异构和API的角度出发,Geforce ULP身上又有颇多PS3的影子,同样是通过异构处理的方式将大量GPU的执行的工作分担给其他单元,同样是CPU作用巨大,同样支持Open GL ES,这些特点又可以让我们将其视为一个超低功耗的移动版PS3。正是这些特点以及由此带来的相对较好的性能功耗比,造就了CES2011上Tegra2的大放异彩。
又是异构又是Geforce6的,呼声如此之高的Tegra2到底是以怎样的先进构架作为对手设计的呢?接下来我们要面对的,将是一个在桌面领域消失了很久的老牌强者——Power VR构架。
大家好,我叫Imagination
● 大家好,我叫Imagination
老牌的家用级玩家对Power VR的名字一定不会陌生,经典的SEGA游戏主机DreamCast所采用的显示芯片就是基于PVR250DC构架。只不过由于PVR250DC及其桌面版本Neon250均有NEC代工,因此不少用户误以为Power VR是NEC负责开发的显示构架,其实不然,整个Power VR构架,全部来自英国公司VideoLogic,而VideoLogic的母公司,就是著名的Imagination。
Imagination公司LOGO
Imagination/VideoLogic成立至今累计推出了6代Power VR构架,其中PCX属于第一代,DreamCast采用的PVR250DC属于第二代,接下来的Kyro以及KyroII属于第三代,第四代的KyroIII因为种种原因未能成型,因为在进行第四代Power VR构架的研发时,桌面3D领域的激烈竞争实际上已经进入了尾声。
虽有PVR250却被SH4 CPU拖累的DreamCast主机
上世纪90年代的桌面3D大战相信很多人都还记忆犹新,3DFX、NVIDIA、ATI、S3、Trident、Imagination、Matrox、3D-lab、SIS、STM……经过一系列惨烈的较量之后,被收购的被收购,撤退的撤退,在激烈的竞争中失利的Imagination不得不从桌面市场退下来,转入移动及SoC领域进行发展。
KyroII 4500显卡
尽管从桌面领域暂时撤退了下来,但是惨烈的桌面3D大战考验使得Imagination变得比过去更加成熟也更具竞争力。通过过去积累的先进技术,比如TBDR(Tile Based Deferred Rendering),Imagination在SoC领域的发展远较桌面领域来的顺利,先后推出的PXA2700系列等第五代Power VR构架产品。凭借TBDR极其优秀的culling特性,Power VR成为一款对显存依赖极低的构架,这使得PXA2700仅具备384K的显存,却可以在640*480的分辨率下流畅运行Quake3,这在当时引起了业界的轰动。
经过了一系列的积累和沉淀之后,Imagination终于将其第六代Power VR构架产品——SGX Series5带到了人们的面前。
手机也能玩GP-GPU?
● 手机也能玩GP-GPU?
也许你并不熟悉Power VR曾经的图形构架,从惨烈的桌面GPU战争中撤退下来之后,卧薪尝胆的Imagination长期以来一直在移动及SoC领域发展着自己独特的构架,SGX Series5系列构架就是其中的代表作。
SGX Series5系列构架
SGX Series5系列构架分为SGX Series5以及SGX Series5XT部分,其中SGX Series5部分包含SGX 520、SGX530、SGX531、SGX535、SGX540及SGX545,而SGX Series5XT部分则包含SGX 543MP1-16、SGX544MP1-16、SGX554MP1-16等。SGX Series5系列构架支持的API非常广泛,不仅支持家用机及移动平台的Open GL ES,桌面平台的DirectX以及Open GL,甚至还提供了Open CL的完整支持。
SGX Series5系列构架从外观上来看与现代桌面GPU非常接近,由完整的前端几何部分,shader单元及后端组成流水线。其中包括Geometry部分,CGS(Coarse Grain Scheduler)线程块调度单元,USSE(Universal Scalable Shader Engine)通用shader单元以及完整的Rasterization阵列,整条流水线通过内部总线共享多级cache,并最终与64bit内存控制器与内存总线相连。这与桌面GPU常规的Geometry+Shader+Rasterization的流水线过程几乎是完全一样的,甚至在进行常规构架介绍时,我们可以直接将SGX Series5系列描述成“拥有1至4个US单元,2个TMU单元,64bit显存带宽的GPU”。此外,从SGX 543MP开始,Imagination在构架中引入了特殊的multi-core设计,多个SGX54xMP芯片可以近乎于无损的完成多核心并联,达到性能倍增的目的。
整个SGX Series5构架最引人瞩目的地方,在于USSE单元以及通过总线与cache相连的CGS。
USSE单元是Imagination为SGX Series5搭配的MIMD可编程浮点单元,透过USSE单元,SGX Series5可以实现对Vertex Shader和Pixel Shader的无差别吞吐。USSE单元内部被描述成多个并联的MTEU(Multi-Thread Execution Unit),但从本质角度来讲USSE单元更像是一个混合体,Imagination在其官方PDF中宣称USSE2在USSE的基础上添加了一组新的指令集,以协助单元完成向量吞吐及co-issue操作,因此我们认为它既有常规GPU的流处理器单元ALU/EU,又有类似larrabee中的Vector Unit,两者在不同吞吐场合共同完成特殊函数、shader及其他Vector指令的吞吐。在这种设计的帮助下,最新的SGX543MP芯片可以在200MHz的频率上取得6.4Gflops的吞吐能力,这个成绩已经达到了Geforce ULP理论性能的2倍。
CGS的作用则类似桌面级GPU的线程调度机制,如AMD的UTDP单元,它能够实现线程块级别的管理,吞吐及发放功能。CGS与可以任意吞吐的USSE结合的这种组合方式,及其特殊的操作方式不仅使得SGX Series5能够像桌面GPU一样轻松面对各种GLSL和HLSL所编写的shader指令,还使其在寄存器资源允许的前提下具备了吞吐通用计算指令的能力。
换句话说,从某种意义上来讲,在寄存器允许的条件下,SGX Series5构架甚至可以执行桌面高级GPU才能执行的通用计算任务,各种任务只要经过合适的通用计算优化,都可以利用USSE单元进行加速,这种在移动领域颇为超前的GPGPU设计,为SGX Series5系列的应用打开了一扇通向无限可能的大门。
战场在哪儿?我指给你看
● 战场在哪儿?我指给你看
一个异构设计,一个超前设计,两个构架究竟谁能胜出,就让我们测试见分晓吧。
采用SGX 543MP2的苹果iPad
采用GeforceULP(Tegra2)的Motorola Xoom
在性能测试环节,我们使用GLBenchmark 2.0作为基准性能。GLBenchmark 2.0是目前广泛采用的智能手机及平板移动平台图形性能测试软件,该软件完整支持Open GL ES2.0,可以被用来进行包括纹理、直接光照,碰撞,环境及凹凸映射,柔和阴影,基于VS的皮肤系统,多线程延迟渲染,噪声纹理以及ETC1材质压缩等不同特效的测试。
测试硬件包括采用SGX543MP2的苹果iPad2,采用GeforceULP(Tegra2)的Motorola Xoom以及采用SGX535的iPad。测试结果如下:
测试成绩显示,采用SGX543MP2的iPad2取得了超过采用GeforceULP(Tegra2)的Motorola Xoom一倍有余的测试成绩,领先自己的前辈SGX535更是达2.2倍之多。但这个测试成绩中的细节同样不应该被我们所忽视。
由于平板电脑不支持桌面及使用环境分辨率调整,因此GLBenchmark2.0本身会直接采用待测设备所支持的分辨率进行测试,这使得测试环境产生了一定的偏差干扰。另外,SGX543MP2采用双核结构,实际上是由2颗SGX543MP组合而成,由此我们可以大体上了解SGX543MP的性能,以及它与GeforceULP以及SGX535之间的性能差异。
最漫长的一天
● 最漫长的一天
从测试成绩我们不难发现,尽管由两颗SGX543MP组成的SGX543MP2拥有4倍于Geforce ULP的理论吞吐性能,领先自家的前辈SGX535更是多达8倍,但实际应用中单颗SGX543MP的性能仅能达到SGX535的两倍,与Geforce ULP也只是处在伯仲之间。
SoC GPU理论性能汇总
这种勉强打和,只能靠牺牲续航能力和发热特性来换取性能的现状导致了移动3D芯片之争再次陷入了胶着状态——SGX543MP被智能移动平台最大的供应商苹果看中,而Tegra2也凭借不错的综合性能以及NVIDIA自身的影响力以及推广占领了大量安卓平台的市场。以应用表现来看,双方目前暂时都无法将对方置于死地,智能手机平台及平板电脑领域处在一种极其脆弱而又微妙的平衡状态,渐渐的陷入了“最漫长的一天”。
在对移动3D构架特性有了基本的了解之后,我们所面对的问题不仅没有减少,反而渐渐的多了起来。理论性能领先许多的SGX543MP为何无法在测试中取得同样优异的成绩呢?是怎样的构架细节导致了这种测试结果?这些构架对双方未来的发展以及市场定位又会造成怎样的影响?
我们本次的测试中仅涉及了两种移动3D构架的3D应用性能,实际上在日常应用中,智能手机平台以及平板电脑还有其他相当重要的应用需求,比如flash加速性能,视频解码性能,各向异性过滤性能以及休眠表现等等。目前的移动3D芯片对这些功能的支持度以及实际表现会是怎样的呢?这些问题的答案,就让我们留待下期ZOL显卡探索与发现节目中继续去解开吧。