來源:arstechnica.com 報道:文強、三石 【新智元導讀】馬云為何成立“平頭哥半導體”?蘋果2018 iPad Pro便是自研芯片好處的最佳例證。實測之下,A12X仿生芯片各項性能爆表,蘋果芯片團隊更是豪言“在給定的外形尺寸和封裝設計下,沒人能比我們做得更好”。A12X架構究竟如何,為什么蘋果會這么做,又是如何做到的呢? 還記得名震一時的“平頭哥”嗎? 沒錯,說的就是馬云在此前賜名成立的阿里半導體公司。 許是名字的殺傷力太大,反而沖淡了公眾對自研芯片配合自家應用強大優勢的認知。不過,蘋果最新發布的2018 iPad Pro及其搭載的A12X仿生芯片,無論是CPU、GPU,還是機器學習和神經引擎,各項爆表的性能指標,以及只有在A12X 仿生芯片支撐下才得以實現的眾多高端AI應用,不難讓人看到了加上了“平頭哥”的阿里動物軍團升級打怪的未來。 ![]() 平頭哥(蜜獾)號稱“世界上最無所畏懼的動物” 平頭哥半導體技術負責人驕旸在接受新智元采訪時曾表示,只有自己內部的人才真正懂得內部業務的需求,從而設計并提供針對每項不同業務都能達到性能功耗比最優的硬件。 蘋果的芯片團隊還不止如此,一切的規劃都從芯片開始,他們會不斷地追問其他團隊:你們到底想要什么,要實現什么功能,瓶頸在哪里,我們如何制造與你們系統完美契合的芯片? 多年來,蘋果對其從底層硬件到頂層應用都采取“in-house”的做法諱莫如深。這一次,蘋果硬件技術部門的 Anand Shimpi 和市場營銷高級副總裁 Phil Schiller 坐下來,與 ArsTechnica 的記者分享了蘋果A12X仿生芯片的細節,以及蘋果內部芯片團隊的運作機制。 “芯片團隊是其他團隊的偵探。”Anand Shimpi說。 規劃從芯片開始,“在給定的外形尺寸、封裝設計下,沒有人能做出更好、更高性能的芯片。” A12X仿生芯片全面拆解,爆表式性能碾壓 在介紹蘋果芯片團隊之前,還是讓我們首先來看看他們的最新成果。 全新發布的 2018 iPad Pro 有許多亮點,但最亮眼的莫過于A12X仿生芯片。蘋果在產品發布會上展示了A12X芯片的強大:圖像處理性能是A10X的兩倍,速度比8年前發布的iPad快1000倍,甚至用筆記本電腦這種便攜式PC相比,92%的市售產品都會敗下陣來。 蘋果最新一代的iOS設備并非完美,但哪怕是最刁鉆的“果黑”,也不得不承認這家公司在移動CPU和GPU方面的領先優勢——不是一點點,而是甩開一條街。 所有這些,都歸功于蘋果內部自研的定制芯片。實際上,包括FaceID、AR應用在內的各種2018 iPad Pro高端 AI應用,離開了A12X芯片完全沒有實現可能。 但并不是每個人,甚至是iPad Pro針對的“專業”消費者,都意識到了這個差距。A12X仿生芯片的架構究竟是怎樣的?為什么蘋果會這樣做,而它又是如何做到的呢? ![]() A12X與最貴系列蘋果手機所搭載的A12芯片是密切相關的。后者采用的是第一款可在消費類設備中使用的7nm工藝制造芯片,而A12X是首次應用于平板電腦。 雖然蘋果公司肯定不會透漏有關A12X非常細節的信息,但是根據Anandtech最近對A12的分析,我們也能知道A12X的大致“輪廓”: CPU:中央處理器; GPU:用于處理圖形,從主屏幕的顯示到3D游戲中的效果,再到增強現實應用程序的資源; 神經引擎:處理神經網絡和機器學習相關的任務; IMC(集成內存控制器):有效地管理進出內存的數據; ISP(圖像信號處理器):分析拍攝照片時所創建的圖像,并對其進行處理和改進等; Secure Enclave處理器:處理敏感數據(如生物識別標識符),使陌生人無法訪問。 當然還有諸如顯示引擎、存儲控制器、HEVC解碼器和編碼器等其它組件。 眾所周知,上述列表中最為核心的組件就是神經引擎、CPU和GPU。接下來,我們就對這三個組件進行詳細解讀。 神經引擎和機器學習 神經引擎的設計目的是加快與機器學習相關的任務能夠在本地設備上執行,這種方式比在CPU或GPU上執行效率更高、性能更高。 事實上,新款iPad Pro的神經引擎與前一款完全不同,因為前一款根本沒有芯片。再來看一看蘋果手機,2017年的A11可以每秒處理6000億次操作;2018年的A12 iPhone手機能夠達到5萬億次。 那么問題來了,蘋果為什么如此注重神經引擎的構建呢? 首先,你需要了解神經引擎所應用的場景和功能。這些場景和功能包括但不限于:通過iPad Pro中的人臉ID和TrueDepth傳感器陣列來識別你的面部、掃描圖像并在照片應用程序中提供搜索功能、處理語音,以及大量與增強現實相關的任務。 A12X的神經引擎有8個核心,但蘋果對其架構的細節守口如瓶。根據Shimpi和Schiller的描述,它不是從蘋果GPU中改編而來的。這種芯片為iPad Pro內置的許多功能提供了動力,但第三方應用程序開發人員也可以通過一種名為CoreML的軟件開發API以各種方式利用它。 ![]() 在10月30日發布新款iPad Pro時,蘋果在臺上討論了A12X和神經引擎 值得注意的是,這里的重點是在本地設備上執行機器學習任務。有一種觀點認為,如果某些機器學習模型能夠從數百萬臺正在使用的設備中提取用戶數據,并在龐大的云計算網絡上運行,那么它們將是最強大的。 但蘋果不是這樣做的。它的機器學習API允許開發者在用戶許可的情況下在云中使用機器學習模型,但這種云基礎設施并不是蘋果直接提供的。另一種方法是,蘋果向應用程序開發人員提供Create ML這種工具,可以讓他們在自己的開發機器上運行模型。 蘋果表示,它并不專注于將用戶數據放到云中并在云中運行模型,其原因有二:首先,與競爭對手相比,蘋果把自己打造成一個重視隱私的公司;其次,在本地設備上運行時,許多其他用例的效率會更高。 正如Shimpi所說:“低延遲非常重要,隱私也非常重要!” CPU iPad Pro的CPU有8個核,其中4個核關注性能,4個核關注效率。與早期的一些蘋果芯片不同的是,所有的核可以同時激活。 對此,蘋果對外是這么聲稱的:“當你運行高線程工作負載時,A12X比A10性能會改進90%;對于單核性能,A12X比A10快35%。” Ars便對iPad Pro進行了測評,驗證上述“聲稱”是否準確的時刻到了! 首先,我們亮相一下測評中各個設備情況,如下圖所示: ![]() 測評所涉及的平板及規格 ![]() 測評所涉及的手機及規格 ![]() 測評所涉及的臺式機和筆記本及它們的規格 接下里便是測評結果! ![]() 單核/多核,2018iPad Pro與以往iPad及三星Tab S4比較 ![]() 單核/多核,2018iPad Pro與MacBook Pro及三星Dell XPS比較 ![]() 單核/多核,2018iPad Pro與iPhone及谷歌Pixel比較 從測評結果來看,單核性能方面并沒有達到35%的提高(但比較接近)。多核的性能也得到了驗證。 iPad Pro的性能超過了我們測試的所有MacBook Pro,除了最近才推出的15英寸MacBook Pro和第8代英特爾酷睿i9處理器。一般來說,這些筆記本電腦的價格是iPad Pro的三倍。 iPad Pro的性能應當說是“前所未有”的。除了能夠同時使用所有內核之外,我們有理由相信A12中的緩存大小(因此很可能是A12X)是驅動這種性能的一個重要因素。 也可以說,A12X的性能總體上之所以如此強大,部分原因是蘋果的架構是優化異構計算中的一個主控類,即巧妙地使用架構良好的專用處理器類型來匹配專用任務。 雖然A12X與ARM的big.LITTLE架構脫不了關系,但蘋果在此做了大量工作,獲得了其他人無法達到的結果。 GPU A12X中的GPU有7個核心,比A10X多了一個核心,可能是由于采用了7nm工藝。但一如既往,核的數量并不代表一切。 蘋果在GPU方面是這么聲稱的:“這是我們自己定制設計的GPU的第一個7核實現。每一個核都比我們在A10X中的速度更快,效率更高。你可以獲得2倍的圖形性能提升。這種形式是前所未聞的,堪比Xbox One S的GPU!再強調一次,它的設計完全沒有風扇!” 話不多說,上結果! ![]() Offscreen和Compute方面,iPad Pro與以往版本性能對比 ![]() Offscreen和Compute方面,iPad Pro與MacBook Pro性能對比 ![]() Offscreen和Compute方面,iPad Pro與iPhone性能對比 一般來說,這種GPU在移動領域有巨大的領先優勢。 它并沒有不像CPU那樣對筆記本也造成一定影響。不過,它相對于其他移動設備的優勢是顯著的,在以往的iPad Pro和iPhone性能對比中,堪稱無人能及。對此,Shimpi說,“內存帶寬是其中的一部分”。 Shimpi指出:“這不僅會影響游戲中的3D圖形,還會影響iOS本身的許多UI效果。不僅僅是關于峰值內存帶寬,而是有效地提供比特。 擁有這個動態范圍非常重要,因為有時為了提高效率和電池壽命,你需要在性能較低的情況下工作。” 蘋果多次將新款iPad Pro的GPU性能描述得為與Xbox One S相當。 圖形性能方面,手機和平板電腦通常不會接近游戲機或游戲PC的性能。 A12X和Xbox One S至少有一個共同之處,那就是它們不適用于游戲PC,但這并不意味著它們在架構上與其他方式相似。 A12X在GPU和CPU之間共享內存,非常類似于筆記本電腦中的Xbox One或Intel集成的GPU,但與游戲PC中的獨立內存不同。 蘋果芯片團隊:在給定的外形尺寸、封裝設計下,沒人能做出更好的芯片 看到這里,A12X芯片的強大已無需贅言。我們更為關心的,還是這款強大芯片背后的團隊。 蘋果硬件技術部門的Anand Shimpi 在接受 ArsTechnica 采訪時表示,“從根本上說,我們制造芯片的原因,是服務于產品的無限可能(vision and its ambition)。無論設定的目標是什么,但凡需要定制芯片,我們就一定會把這樣一款芯片做出來。” “在給定的外形尺寸、封裝設計下,沒有人能做出更好、更高性能的芯片。” 說實話,用于iPhone的蘋果A11仿生芯片和用于平板的A10X芯片已經夠好了,為什么還要提高性能呢?對此,Shimpi 給出了一段激情澎湃的回答: 人們常說,你看看這家公司或那家公司。但我們不;我們真正關注的只有自己。對手想做什么就讓他們做去,我們只是盡全力做出我們自己所知道的最好的東西。這樣,我們在做的時候,就不用擔心跟對手相比做得怎么樣。比對手做得好還不夠,我們要不斷超越自己。 我們能做什么?我們還能做什么?當你知道你能做出神經引擎時,你就會想要做出更好的神經引擎!這只會加速,不斷加快組織內部的速度。 你的團隊做出了一款超棒的蘋果自己設計的A系列芯片,好,明年你就想要一款更好的,對吧?那就是我們的激情所在。整個蘋果公司都一樣,不斷超越自己,不用去管別人。 我們不關心別人在做什么,那些事情我們也不關心。我們也不在乎比別人落后。落后就落后,落后10倍也無所謂。因為我們的芯片是服務用戶的,不是用來競爭的。 當然,蘋果提升芯片性能的原因肯定不止如此,很明顯,最新版iOS側重增強現實(AR)功能。如果蘋果能在確保其他方面不落后的前提下,最先建立起世界上最強大的消費者AR平臺,那么未來它的強勢地位就多了一重保障。 至于Mac,為了將蘋果在機器學習和人工智能方面的技術用于Mac,也離不開定制芯片。看英特爾和AMD的芯片路線圖,似乎與蘋果的長期目標有一些明顯不同。部分原因可能是,蘋果的最終目標是為 Mac Platform 制作定制的筆記本或臺式機,以此對抗英特爾的最強芯片。 但蘋果是如何做到這一點的呢? 就像你想的那樣,開發芯片的過程在發布產品前很多年就開始了,首先是團隊會議,并討論如何解決特定設備上的特定用戶問題。雖然沒有提供很多深入的技術細節,但 Schiller 將其定制芯片的成功歸功于團隊在蘋果內部的合作。 芯片團隊是其他團隊的偵探,他們會說,“好,我們來規劃吧,我們需要更多信息。你們究竟想要什么,想要如何實現這個功能?瓶頸在哪里,我們從哪里開始創建最終與你們系統完美契合的芯片?” 這樣的會議一周會開好幾次,也不是什么年度大型會議,就是確保進度一致。芯片團隊和其他團隊真的每周都聚在一起,討論的問題也越來越多。要討論的東西是沒有止盡的。 多年來,蘋果公司對其如何以及為何能做到這一切的回應都歸結為同樣的觀點。當你在公司內部做所有事情,從頭到尾整合所有的東西,無論是技術還是組織,這樣做必然有其優勢。 這也可以用來解釋谷歌自研TPU,以及阿里成立平頭哥半導體。 蘋果的CPU在移動方面處于行業領先地位,但并不完美。蘋果專注于性能,但安卓系統基本上是由高通壟斷。但高通的優勢在于連接性(高通的調制解調器行業領先,但CPU不是)。 有趣的是,蘋果一直避諱不談的,是Mac的麥克風仍然使用英特爾的芯片。這或許也是阿里投資寒武紀、深鑒和耐能的原因。 雞蛋還是不能放在一個籃子里。 參考鏈接: https://arstechnica.com/gadgets/2018/11/apple-walks-ars-through-the-ipad-pros-a12x-system-on-a-chip/ |