2013年全球微處理器銷售額將以史上最快的增長速度突破610億美元,這主要歸功于連接到互聯網的手機和平板電腦的強勁需求。據調研機構Gartner的預測,2015年全球200~300美元中價位智能移動設備(智能手機/平板電腦)出貨量將達5.8億臺,并且用戶主要使用的功能是影音編輯和分享。 得益于浮點運算優勢,GPU可以有效地接替來自CPU在圖形渲染過程中產生的幾乎所有計算負荷,并且速度十分驚人。因此,當系統檢測需要更復雜的計算時,運算會從CPU切換到GPU工作模式,在一些測試環境下,渲染性能可以輕易地從十幾幀每秒加速到上百幀每秒。在GPU技術的支持下,芯片供應商和設備制造商可提供諸如3D UI、實時視頻圖像處理、具有逼真圖像體驗的游戲應用和增強實境等豐富的應用模式。 所以,今后整個行業對GPU的重視會大大超過CPU本身,因為今后主流消費者使用移動設備主要的用處是多媒體娛樂,視頻和游戲的處理都更加依賴GPU的計算能力。GPU在移動處理器中的重要程度已經日益凸顯,高通移動處理器的一大賣點就是自己的Adreno GPU。 當然在移動GPU市場的老大是Imagination,根據市場研究公司Jon Peddie Research的報告,Imagination以37.6%的市場份額,依然穩坐2013年移動GPU領先供應商頭把交椅。但它的最大競爭對手ARM在GPU的市場份額也達到了18.4%,由于Adreno GPU的市場份額全部來自自家的處理器,不會對外授權,所以今后的GPU市場競爭主要是Imagination和ARM之間的戰爭。這兩家IP巨頭除了在CPU領域展開競爭以外,在GPU領域的戰火也燒到了下一代GPU內核。 PowerVR 6系列GPU與競爭對手Mali-T600系列GPU的規格對比 PowerVR 6系列Rogue GPU 公布于2011 年第三季度。CES 2012 上,PowerVR Rogue GPU 首批兩款產品,PowerVR G6200 和 PowerVR G6400 亮相。2013 年 Imagination 又公布了 PowerVR Series 6XE 和 PowerVR Series 6XT 兩個子系列產品。6系列GPU都支持DirectX 10,部分型號可支持最新的DirectX 11.1,還支持OpenGL 3.x/4.x、OpenGL ES 3.0,以及通用計算領域的OpenCL 1.x、Renderscript Compute。根據配置的不同,PowerVR 6系列GPU的浮點性能在100Gflops到最高1Tflops之間,可帶來最多60倍于5系列的圖形和計算性能提升。 Intel Atom 處理器 Z3480、蘋果 iPhone 5S 的A7處理器乃至聯發科MT8135等都集成了Imagination 最新一代的PowerVR Rogue GPU。 Mali-T600 系列于2012 年露面,開發代號Midgard,是 ARM 的首個統一渲染架構。Mali-T600全系列支持OpenGL ES 2.0/1.1,OpenCL 1.1,DirectX 11,其中Mali-T622、Mali-T624、Mali-T628、Mali-T678還能夠支持OpenGL ES3.0。露面最早的Mali-T604 是第一代,Mali-T624 / 628 / 678 等后續產品則是第二代。Mali-T624的規格參數基本與T604一致,不過核心升級到了第二代Midgard,T628最多能支持8核配置。曇花一現的Mali-658還是第一代Midgard架構,現在已經被二代Midgard架構的T678取代,之前的資料顯示T658的性能是Mali-400 MP的10倍,計算性能是后者的4倍,Mali-678只會比這個指標更強。 以上的對比可以看出,PowerVR 6系列支持的API更加全面,多了OpenGL的支持,雖然在移動消費端用處還不大,但在工業級應用還是有很大優勢的。 PowerVR的看家本領——TBDR渲染技術 首先說說Imagination最具優勢的移動渲染技術TBDR。由于功耗和內存帶寬的限制,移動平臺的GPU相對于桌面平臺,會有一些不同。目前幾乎所有的桌面GPU(nVIDIA,AMD)都是IMR(Immediate Mode Rendering,直接模式渲染)架構,在移動領域,nVIDIA的GeForce ULP和Vivante的GC系列GPU都是屬于IMR架構。IMR架構的GPU渲染完物體后,都會把結果寫到系統內存中的幀緩存里,因此就可能出現GPU花了大量的時間渲染了一個被遮擋的看不見的物體,而最后這些結果在渲染完遮擋物后被覆蓋,做了無用功。這個問題稱之為Overdraw。另外,由于IMR架構的GPU頻繁的讀寫和修改幀緩存,因此對帶寬的要求比較高,同時也增加了電力的消耗。所以,大部分的移動GPU都采用TBR(Tile Based Rendering,分塊渲染)的架構。 ARM的Mali GPU和高通的Adreno GPU采用TBR架構,實際上Imagination的PowerVR也是分塊渲染的。TBR架構在把三角形場景變成像素圖前,先把整個畫面分成小塊,這些小塊的渲染在GPU上的高速緩存里進行,這樣就可以避免對幀緩存(位于系統內存里)的頻繁讀寫和修改。但是,除去PowerVR外的TBR GPU同IMR一樣,還是不能避免Overdraw的問題。而PowerVR的不同之處在于,它采用的TBDR(Tile Based Deferred Rendering,分塊延時渲染)架構,可以徹底避免Overdraw的問題。相比TBR更進一步的是,TBDR在光柵化之后,有一個HSR(Hidden Surface Removal,隱藏曲面消除)硬件單元,通過對一個塊內的三角形進行測試,剔除掉被遮擋的三角形,合成一幅由所有可見部分組成的畫面,交給后續的流水線去渲染。這樣不可見部分就不需要著色器去做相應的計算,也不需要去拾取相應的紋理,節省了計算量的同時也節省了帶寬,對移動設備來說有很大的幫助。 GPU的競爭也是軟件生態系統的競爭 移動GPU的硬件架構是影響游戲流暢度以及省電的重要因素,但在軟件支持方面,紋理壓縮格式也是影響游戲支持度高低的重要因素,由于移動GPU并不像桌面GPU以及游戲都有統一的DirectX標準,造成不同移動GPU所支持的紋理壓縮格式技術互不兼容,也造就了移動GPU 多強鼎立的局面。 移動GPU主流的紋理壓縮格式分別為ETC、PVRTC、S3TC、ATITC,在3D游戲中豐富的紋理和細節對游戲的質量可說是相當重要。不過,由于顯示內存和帶寬受限的緣故,所有紋理都必須經過壓縮,否則會帶給顯示內存和帶寬極大的壓力,而紋理壓縮格式便是用來解決這項問題。在OpenGL ES 2.0版本規范里,將ETC(Ericsson Texture Compression)列為移動GPU紋理壓縮格式的固定班底,并且要求各個移動GPU都必須支持此種紋理壓縮格式技術。 Imagination 的PowerVR Rogue GPU 系列支持的是 PVRTC (PowerVR Texture Compression) 和 ETC,ARM的Mali-T600 系列支持的是ETC 和ASTC。ASTC由ARM 提出,2012 年被 Khronos 組織認可,納入到OpenGL ES 3.0 標準中。不過 ASTC 并非強制性的標準,目前也只有 Mali-T600 系列支持。PowerVR 可以做到將紋理壓縮至最小體積(原圖十分之一不到)但仍保持清晰,比OpenGL ES 官方標準的S3TC 和ETC 要小了一半體積,這也算是PowerVR的技術優勢。 ETC 是最通用的紋理壓縮格式,幾乎所有的安卓設備都可以支持 ETC 壓縮的文件。不過ETC 并不招廠商待見,因為 ETC 紋理壓縮不支持 Alpha 通道,只能用于壓縮不透明的材質,且只能將單一紋理拆解成2個間接執行。S3TC是桌面顯卡通用的壓縮格式,看起來是最完美的選擇,可惜 S3TC 還是一種私有的標準,有專利上的麻煩。 盡管PVRTC 是PowerVR 專有的格式,但PowerVR 已占據最大的移動GPU市場份額,開發者做紋理時勢必會考慮到這一標準。加之本身這一標準具有高壓縮率的優勢,更能推動3D游戲技術的進步。ASTC 則太新鮮,現在還鮮有開發者支持這個標準,市場上Mali GPU的占有率也還不足以幫助這一標準推廣。 總結 ARM的Mali GPU給人的感覺更像是PC中的公版顯卡一樣,積極支持各種最新標準,注重性能功耗比。但是Mali GPU的問題在于目前授權使用的大部分還是Mali-450 MP以下的,Mali-T604除了在三星的Exynos 5250中有過應用,發布過一年多以來未見其他處理器集成。即便是三星這個老朋友,新一代的Exynos 5 Octa也改用PowerVR的GPU核心了,感覺業界的接受度還是不夠高。 PowerVR Rogue GPU 延續了 Imagination 一貫的技術優勢:TBDR渲染技術獨步天下,且對各類 API 的支持領先于業界。這一代顯卡的性能甚至超越了部分桌面 GPU,能耗卻比桌面 GPU 更低,適合多種嵌入式移動設備。相比另一主要競爭者ARM Mali-T600系列,PowerVR Rogue GPU 優勢在于紋理壓縮標準已有健壯的生態系統支持,而Mali 的標準目前還沒能贏得開發者首肯,紙面的技術優勢無法體現出來。GPU的性能和軟件的優化有極大關系,這是現在PowerVR系列GPU能夠領先市場的最大優勢。 Imagination能成為移動GPU的老大顯然會有很多獨特優勢和技術。它的GPU不是理論性能最強的,不過單位功耗性能、單位面積性能表現都很強,多核集成、配套的開發工具、PVRTC紋理壓縮格式、TBDR渲染技術都是它沖鋒陷陣的利器,綜合起來PowerVR還是表現最優秀的移動GPU。 |