作者:上方文Q 蘋果表面上是一家手機廠商,但這幾年已經悄然在移動處理器行業占據了一定的地位,尤其是CPU:A6首次使用自主設計架構Swift,A7首次使用64位ARMv8架構Cyclone。A8又能帶來什么驚喜呢? 很可惜,如果你期待又一次革命,那恐怕要失望了。無論CPU還是GPU,A8都只是一次穩健的進步,并不算很激進。 A8 A8內核照片與基本布局 【新工藝、內存】 A8最大的亮點其實是制造工藝,并且創造了多個第一: 它是第一批采用20nm工藝制造的移動處理器之一,也是最重要的一個。 這是蘋果第一次使用最先進的半導體工藝(28nm誕生了一年多采用上)。 這是蘋果第一次使用非三星工廠代工,當然也是第一次使用臺積電代工,而且一下子就搶走了絕大部分產能。 臺積電宣稱,20nm工藝相比于28nm可使芯片速度提升30%,或者集成度提高90%,或者功耗降低25%,具體如何權衡就看芯片設計了。A8晶體管數量翻了一番,核心面積小了13%,性能……稍后再說。 A8的內存子系統基本沒變,只有一些細微的調整。SRAM緩存依然存在,繼續同時為CPU、GPU服務(可視為三級緩存),容量還是4MB,而內存控制器還是支持LPDDR3-1600。 經過測試發現,A8的內存帶寬比A7略有增加,2-9%的樣子,很小,說明來自進一步優化。 更有趣的是內存延遲,1-4MB SRAM緩存區域、6+MB內存區域都降低了大約20ns,但具體如何實現的仍有待考察。 除了CPU、GPU、緩存、內存,A8里還有其他大量的固頂功能模塊(或者最多時彈性很有限的DSP),包括音頻控制器、USB控制器、視頻編解碼器、閃存控制器、攝像頭ISP等等。具體在芯片的哪個位置、特性如何還不清楚,但至少知道,A8支持H.265格式視頻編碼,不過目前只會用于FaceTime視頻通話。 A8、A7對比 蘋果自主處理器歷史 【CPU架構:沒有革命 仍然驚喜】 兩年多過去了,我們對A6、A7 CPU架構仍然知之甚少,蘋果始終不肯公布任何技術細節。A8仍是如此,這一次甚至連架構代號都還不知道(以前兩代分別是Swift、Cyclone)。 就目前所知,A8 CPU架構設計并沒有像A6、A7上那樣有著革命性的地方,也就是個增強版的Cyclone,但也并不算是壞事。A7架構已經十分優秀:較寬、較高的IPC設計,延遲很低,可以在很低的頻率下取得很高的性能。(Intel酷睿的理念也與此類似) A7的頻率只有1.3GHz,A8也不過區區1.4GHz,但正因為如此,蘋果無需在頻率上投入太多,就能獲得理想的性能,同時保證功耗足夠低,這對移動設備來說顯然是再理想不過的。 換句話說,蘋果在去年就完成了其他芯片廠商明年才有可能做到的。 盡管不用再費力挖掘架構細節,但我們仍然想知道,A8究竟改變了什么。 根據估量,A8 CPU部分面積約12.2平方毫米,相比于A7 17.1平方毫米縮小了29%,也就是說在塞入了更多晶體管后,蘋果憑借更新的工藝,反而減小了CPU所占面積。 從測試數據看,A8、A7 CPU的確是如出一轍,很多底層測試中都表現得就像同一顆芯片,只是浮點加法和整數乘法延遲更短了一些,緩沖和分支預測也可能略有不同。 A7只有1個整數乘法單元,需要4個周期執行,A8則只需3個周期,更神奇的是整數乘法性能翻了一番還多,這意味著現在有2個整數乘法單元了。 浮點加法也有很大提升,不過幅度沒這么高,執行周期從5個縮短到4個,貌似仍是3個浮點ALU單元。 總體而言,A8、A7的變化有點像是Intel Tick-Tock的后一步,即升級工藝,架構上只是微調增強。 接下來看一些更接近表層的測試。這里使用多年前用于PC系統的SPEC CPU2000,如今移動處理器的檔次拿來跑它正合適。 A8的頻率高了100MHz,也就是大約7.7%,排除這一因素后,A8的性能仍然明顯高于A7,12個子項全部有提升,尤其是MCF、GCC、PerlMmk、GAP的幅度都很高,最高達55%。 再來看Geekbench 3,包括整數、浮點兩部分。 仍然普遍有提升,幅度也不錯,最高達到了37%,但是加解密差點,排除頻率因素后偶爾甚至還有所倒退。 浮點部分更好些,各項提升相對比較均勻。 總體而言,A8 CPU沒有再次革命,但憑借架構優化、內存延遲改進、頻率提升,仍然有了不小的進步,完成了“A7升級版”的基本任務。 明年,大批的64位ARM處理器將陸續登場,既有公版的A57,也會有非公版的自主設計,蘋果將面臨嚴峻的挑戰,但相信A8仍然能有自己的立足之地。 雖然四核、六核、八核將大行其道,蘋果依然只是個雙核,但是已經可以看出,蘋果的單線程IPC一直十分優秀,而現在很多工作任務仍然無法很好地支持多核,A8根本不用怕。 當然了,下一代A9能再次帶來什么驚喜更值得期待。 【GPU架構:六核?沒必要】 庫克宣稱A8 GPU性能提升最多50%,這很自然讓我們以為是從四核變成了六核,會用上Imagination最頂級的PowerVR GX6650。 但是經過對芯片的觀察,卻只發現了四個GPU核心,排除了六核的可能性。 再結合其他信息,尤其是蘋果的Metal編程指導,最終確認A8采用的是四核PowerVR GX6450,也就是A7 G6430的升級版,基于最新的PowerVR Series6XT架構,年初的CES大會上才宣布。 Series6XT是此前2012年誕生的Series6架構的增強版(G6430就屬于后者),重點是通過架構上的各種調整和優化,提升性能、增加功能,比如支持下一代紋理壓縮技術ASTC(自適應可擴展紋理壓縮)。 該技術來自出品了OpenGL、OpenGL ES等標準規范的行業組織Khronos,可提供更好的紋理壓縮性能、更精細的質量控制,同時也是所有GPU都可以支持的通用格式。 蘋果一直都在用PowerVR GPU,一直支持PVRTC、PVRTC2,ATSC則可以進一步提升游戲畫質和性能。 Series6XT架構還有新的電源管理技術,能降低待機、輕負載時的功耗,比如說“PowerGearing G6XT”門控技術可以單獨開關每個GPU核心(著色器簇/USC),自然能夠延長手機的待機時間。 Series6XT通過一系列底層優化,提升了總體性能,官方宣稱最多可達50%,正好也是蘋果宣傳的數據,但具體怎么做的,Imagination并未公開。 我們只知道,新架構對核心(著色器簇)本身做了改進,仍然是16寬度的SIMD結構,但每條流水線都增加了一組中等/半精度FP16 ALU,也就是從2×3變成了2×4,理論上性能可提升33%。 FP16操作比FP32節省帶寬和功耗,但是需要精心編程才能高效利用,否則性能提升會很有限。 FP32部分仍然是每條流水線兩個ALU,每時鐘周期最多四個FP32浮點操作,或者說128個MAD(乘加運算)。 前端和后端的幾何處理、紋理填充同樣有所改進,但還是細節不詳。 最后是GPU計算性能。iOS仍然沒有提供這方面的良好支持,OpenCL也沒有相應的版本。iOS 8增加了Metal API,可以同時用于圖形、計算,但效果如何還有待觀察。 GPU頻率完全不知道,也不太容易測試。 總體而言,GX6450可以在部分優化、支持到位的項目中獲得50%的性能提升,有的則可能只會看到15-20%,一般來說也就是30-35%的樣子吧。 為什么還是四核? 其實,Imagination已經有了更強大的六核心型號G6630、GX6650,完全可以更好地滿足更大屏幕的iPhone 6、iPhone 6 Plus,而且有了新工藝的支持,晶體管、核心面積都可以更好地控制,為什么還是堅持四核心呢? 這再次體現了蘋果的設計原則:絕不盲目追新,夠用就好。 A8 CPU上只是一次進化,GPU也不必急著革命,尤其是G6430本來就已經很強大了,iPad Air 2048×1536的屏幕都不在話下,iPhone 6 Plus 1080p又算什么,GX6450本身的改進加上頻率提升(如果有的話)確實正好。 A7 GPU部分的面積是22.1平方毫米,A8縮小到了19.1平方毫米。看起來很理想,但別忘了20nm理論上可以讓它縮小11.1平方毫米的。這說明A8 GPU還是增強了很多的,尤其是那兩塊清晰可見的共享紋理單元,將對紋理性能產生至關重要的影響。 說到最后,對明年的A9更期待了:16nm工藝、CPU新架構、六核心GPU…… |