作者 張國斌 隨著智能手機平板電腦進入視網膜屏高清時代,GPU的重要性日益凸顯,用戶在使用這些電子設備時,首先關注的是高清視頻、3D游戲以及flash動畫的體驗,而這些體驗和GPU性能有直接聯系,一款性能出色的GPU不但可以給用戶以最佳體驗,更兼顧低功耗特性,在CPU核戰已無懸念的情況下,未來GPU將如何發展?近日,電子創新網總編張國斌獨家采訪了ARM公司媒體處理部門戰略營銷副總裁Kevin Smith,就ARM GPU未來發展進行了交流,歸納為ARM GPU的三個發展趨勢。 趨勢一:關注可擴展性,GPU核戰爆發在即 在PC領域,曾經爆發過有關CPU與GPU誰更重要的口水大戰,現在看來,兩者都重要,因為它們架構不同、側重不同,CPU和GPU都是具有高速運算能力的芯片,CPU更像“通才”——指令運算+數值運算,GPU更像“專才”——圖形計算,不同類型的運算速度決定了它們的能力。因此CPU更擅長像操作系統、系統軟件和通用應用程序這類擁有復雜指令調度、循環、分支、邏輯判斷的程序任務,而GPU則擅長圖形類和非圖形類的高度并行數值計算。因此,在一部手機或者平板中,兩者需要均衡搭配才能發揮出最大效能。 到目前為止,ARM共發布了人Mali100、Mali300、Mali400、Mali450和Mali T600等五個系列的GPU,在MaliT600以后,ARM GPU在結構上發上了很大改變,以桌面應用看齊,在性能上有很大提升。 Mali400結構功能圖 Mali-t604功能圖 Kevin Smith介紹說實際上在發布T600系列時,ARM已經考慮到了與未來64位處理器的兼容問題,所以Mali-T600的第二代支持64位雙精度,可以與ARM最新的A50系列64位處理器緊密關聯。“另外,T600系列采用了這色器內核架構和三管道體系,更容易實現多核,這比其他架構GPU更有優勢。” Kevin Smith強調。“未來ARM會重點優化T600系列產品,例如我們最新發布的T624\T628\T678就比T604在同等裸片面積性能提升50%!” 他解釋說性能的提升源自對架構的增強,例如這三款系列GPU可在同樣的內核面積下提供更高的時鐘頻率、更高的IPC(每時鐘周期指令數)、更高的能效,所以每個型號的性能都可以提升50%。 另外,這三款GPU也首次次支持ASTC(適應性可擴展紋理壓縮):這是一種由ARM開發、Khronos Group已將其納入OpenGL ES規范的紋理壓縮技術,能在系統級別提高效率,并改進紋理質量和彈性,“而且,ARM GPU也是率先支持OpenGL ES 3.0版新標準的處理器。”他指出,“我們的GPU支持OpenGL Full Profile的GPU計算,不但支持OpenGL ES 1.1/2.0/3.0、DX 11/11 FL 9_3,此外還支持Google RenderScript計算語言。實際上已經向桌面應用看齊。也向GPGPU更邁進了一步。當然,這也是增強兼容性的舉措,我們的策略是就是支持公開的各類標準和API。” Mali-T678功能框圖 由于GPU的并行架構更適合實現多核,因此為未來多核GPU將是一大亮點,Kevin表示依托ARM的獨特優勢,未來不管是16核還是24核均可以輕易實現。 ARM GPU的擴展性示意圖 在我采訪Imagination時,他們也勾勒了一幅未來處理器發展的藍圖,顯然,多核GPU是亮點。 未來處理器發展的藍圖 那么2013年,主流的GPU產品將是多是核心?Kevin認為8核GPU會出現但將是高端市場,主流市場仍將是四核為主,不過他認為明年市場上GPU跨度較大,從單核到雙核到四核到8核都有出現,滿足市場從低到高的需求。 近日,谷歌Nexus 10平板電腦已經面市,它的真實面貌。該機采用一塊10英寸屏幕,分辨率高達2560×1600像素,像素密度為300ppi,超過了iPad4和新iPad,它采用了1.7GHz主頻的三星Exynos 5250雙核處理器,配備2GB RAM,集成Mali T604四核GPU,Kevin強調這樣高端機型足以說明ARM GPU可以支持高端應用。 在GPU的發展策略上,Kevin介紹說ARM會堅持以較小的面積實現更高的性能,即堅持高能效的策略,同時,會考慮高性能方向,向桌面GPU看齊。 以下是各類GPU的功耗對比,可以看出,ARM GPU在單位功耗方面的性能突出,能達到每瓦48GFLOPS的特性,原高于桌面GPU的能效。
趨勢二:關注一致性,與CPU融合 在PC處理器領域,AMD以融合CPU和GPU的APU開創了新的PC處理器領域,在移動處理器領域,這個趨勢仍將延續,從近日Imagination對MIPS的收購已經顯現端倪。Kevin也認同這個趨勢,“ARM的GPU不但注重圖形處理更看重通用計算,未來CPU與GPU要走融合的道路,所以ARM在布局GPU時就考慮與未來CPU的搭配,比如我們的GPU是支持64位處理器的,所以未來處理器升級到64位我們都可以支持。”他指出,“ARM考慮到是讓用戶用最快的方式實現低功耗高性能處理器,未來融合CPU與GPU的Soc內部會采用ARM的AMBA總線。” 實際上,在ARM的的Mali-T600 系列 GPU 內的有個作業管理器,它可以任務管理從 CPU 卸載到 GPU,并在活動著色器內核之間實現無縫負載平衡。這個功能估計已經為未來的CPU與GPU融合埋下了伏筆,通過 ARM 的一致性和互連技術,計算任務在異類系統中進行共享處理時,可以輕松跨越 CPU、GPU 和其他可用計算資源,更高效地訪問數據。 他強調ARM GPU還關注通用計算,因此,未來也將壓縮DSP市場,CEVA是否感受到了壓力? 從支持64位處理里來看,未來采用融合CPU與GPU的處理器將是A50系列處理器,按照某些芯片廠商的估計,預計2014年此類芯片可以面市。 趨勢三:工藝升級,2014年ARM處理器采用finFET技術? 很多人認為ARM處理器在傳統工藝上的升級空間已經不大,在英特爾大張旗鼓地宣傳3D晶體管技術的時候,ARM 其實也也已經開始了下一代工藝技術的研發,Kevin透露ARM的PIP(物理IP)部門早與TSMC以及Global Foundries合作開始了下一代工藝finFET晶體管工藝技術的研發,這是前所未有的,預計新的工藝技術將在TSMC的16nm工藝 和Global Foundries上的14nm上實現,而新工藝可能會用于ARM下一代64位處理器上。 在具體產品發展上,在ARM公布了最新的A50系列處理器后,已經有AMD、博通(Broadcom)、Calxeda、海思半導體、三星及意法半導體等七家公司獲得A53與A57處理器授權,其中,STE聲稱將在2014年出貨A53處理器,這是否意味著2014年ARM處理器將采用finFET工藝技術? 在今年1月召開的2012國際電子器件會議(IEDM)上,TSMC已經展示有關finFET晶體管工藝技術,臺積電將提供的16nm工藝金屬布線部分直接沿襲20nm工藝,將晶體管部分換成16nm工藝的FinFET。與20nm工藝相比,可使晶體管的工作速度提高20%~25%,使耗電量降低35%。由于金屬布線部分在20nm工藝和16nm工藝間通用,因此兩工藝的芯片面積相同。與intel的工藝不同,臺積電的finFET晶體管摻入了鍺材料。 TSMC展示有關finFET晶體管工藝技術 以下為采用主要GPU的處理器性能對比
|