作者 張國斌 隨著智能手機平板電腦進入視網(wǎng)膜屏高清時代,GPU的重要性日益凸顯,用戶在使用這些電子設(shè)備時,首先關(guān)注的是高清視頻、3D游戲以及flash動畫的體驗,而這些體驗和GPU性能有直接聯(lián)系,一款性能出色的GPU不但可以給用戶以最佳體驗,更兼顧低功耗特性,在CPU核戰(zhàn)已無懸念的情況下,未來GPU將如何發(fā)展?近日,電子創(chuàng)新網(wǎng)總編張國斌獨家采訪了ARM公司媒體處理部門戰(zhàn)略營銷副總裁Kevin Smith,就ARM GPU未來發(fā)展進行了交流,歸納為ARM GPU的三個發(fā)展趨勢。 趨勢一:關(guān)注可擴展性,GPU核戰(zhàn)爆發(fā)在即 在PC領(lǐng)域,曾經(jīng)爆發(fā)過有關(guān)CPU與GPU誰更重要的口水大戰(zhàn),現(xiàn)在看來,兩者都重要,因為它們架構(gòu)不同、側(cè)重不同,CPU和GPU都是具有高速運算能力的芯片,CPU更像“通才”——指令運算+數(shù)值運算,GPU更像“專才”——圖形計算,不同類型的運算速度決定了它們的能力。因此CPU更擅長像操作系統(tǒng)、系統(tǒng)軟件和通用應用程序這類擁有復雜指令調(diào)度、循環(huán)、分支、邏輯判斷的程序任務,而GPU則擅長圖形類和非圖形類的高度并行數(shù)值計算。因此,在一部手機或者平板中,兩者需要均衡搭配才能發(fā)揮出最大效能。 到目前為止,ARM共發(fā)布了人Mali100、Mali300、Mali400、Mali450和Mali T600等五個系列的GPU,在MaliT600以后,ARM GPU在結(jié)構(gòu)上發(fā)上了很大改變,以桌面應用看齊,在性能上有很大提升。 Mali400結(jié)構(gòu)功能圖 Mali-t604功能圖 Kevin Smith介紹說實際上在發(fā)布T600系列時,ARM已經(jīng)考慮到了與未來64位處理器的兼容問題,所以Mali-T600的第二代支持64位雙精度,可以與ARM最新的A50系列64位處理器緊密關(guān)聯(lián)!傲硗,T600系列采用了這色器內(nèi)核架構(gòu)和三管道體系,更容易實現(xiàn)多核,這比其他架構(gòu)GPU更有優(yōu)勢! Kevin Smith強調(diào)!拔磥鞟RM會重點優(yōu)化T600系列產(chǎn)品,例如我們最新發(fā)布的T624\T628\T678就比T604在同等裸片面積性能提升50%!” 他解釋說性能的提升源自對架構(gòu)的增強,例如這三款系列GPU可在同樣的內(nèi)核面積下提供更高的時鐘頻率、更高的IPC(每時鐘周期指令數(shù))、更高的能效,所以每個型號的性能都可以提升50%。 另外,這三款GPU也首次次支持ASTC(適應性可擴展紋理壓縮):這是一種由ARM開發(fā)、Khronos Group已將其納入OpenGL ES規(guī)范的紋理壓縮技術(shù),能在系統(tǒng)級別提高效率,并改進紋理質(zhì)量和彈性,“而且,ARM GPU也是率先支持OpenGL ES 3.0版新標準的處理器。”他指出,“我們的GPU支持OpenGL Full Profile的GPU計算,不但支持OpenGL ES 1.1/2.0/3.0、DX 11/11 FL 9_3,此外還支持Google RenderScript計算語言。實際上已經(jīng)向桌面應用看齊。也向GPGPU更邁進了一步。當然,這也是增強兼容性的舉措,我們的策略是就是支持公開的各類標準和API! Mali-T678功能框圖 由于GPU的并行架構(gòu)更適合實現(xiàn)多核,因此為未來多核GPU將是一大亮點,Kevin表示依托ARM的獨特優(yōu)勢,未來不管是16核還是24核均可以輕易實現(xiàn)。 ARM GPU的擴展性示意圖 在我采訪Imagination時,他們也勾勒了一幅未來處理器發(fā)展的藍圖,顯然,多核GPU是亮點。 未來處理器發(fā)展的藍圖 那么2013年,主流的GPU產(chǎn)品將是多是核心?Kevin認為8核GPU會出現(xiàn)但將是高端市場,主流市場仍將是四核為主,不過他認為明年市場上GPU跨度較大,從單核到雙核到四核到8核都有出現(xiàn),滿足市場從低到高的需求。 近日,谷歌Nexus 10平板電腦已經(jīng)面市,它的真實面貌。該機采用一塊10英寸屏幕,分辨率高達2560×1600像素,像素密度為300ppi,超過了iPad4和新iPad,它采用了1.7GHz主頻的三星Exynos 5250雙核處理器,配備2GB RAM,集成Mali T604四核GPU,Kevin強調(diào)這樣高端機型足以說明ARM GPU可以支持高端應用。 在GPU的發(fā)展策略上,Kevin介紹說ARM會堅持以較小的面積實現(xiàn)更高的性能,即堅持高能效的策略,同時,會考慮高性能方向,向桌面GPU看齊。 以下是各類GPU的功耗對比,可以看出,ARM GPU在單位功耗方面的性能突出,能達到每瓦48GFLOPS的特性,原高于桌面GPU的能效。
趨勢二:關(guān)注一致性,與CPU融合 在PC處理器領(lǐng)域,AMD以融合CPU和GPU的APU開創(chuàng)了新的PC處理器領(lǐng)域,在移動處理器領(lǐng)域,這個趨勢仍將延續(xù),從近日Imagination對MIPS的收購已經(jīng)顯現(xiàn)端倪。Kevin也認同這個趨勢,“ARM的GPU不但注重圖形處理更看重通用計算,未來CPU與GPU要走融合的道路,所以ARM在布局GPU時就考慮與未來CPU的搭配,比如我們的GPU是支持64位處理器的,所以未來處理器升級到64位我們都可以支持!彼赋,“ARM考慮到是讓用戶用最快的方式實現(xiàn)低功耗高性能處理器,未來融合CPU與GPU的Soc內(nèi)部會采用ARM的AMBA總線! 實際上,在ARM的的Mali-T600 系列 GPU 內(nèi)的有個作業(yè)管理器,它可以任務管理從 CPU 卸載到 GPU,并在活動著色器內(nèi)核之間實現(xiàn)無縫負載平衡。這個功能估計已經(jīng)為未來的CPU與GPU融合埋下了伏筆,通過 ARM 的一致性和互連技術(shù),計算任務在異類系統(tǒng)中進行共享處理時,可以輕松跨越 CPU、GPU 和其他可用計算資源,更高效地訪問數(shù)據(jù)。 他強調(diào)ARM GPU還關(guān)注通用計算,因此,未來也將壓縮DSP市場,CEVA是否感受到了壓力? 從支持64位處理里來看,未來采用融合CPU與GPU的處理器將是A50系列處理器,按照某些芯片廠商的估計,預計2014年此類芯片可以面市。 趨勢三:工藝升級,2014年ARM處理器采用finFET技術(shù)? 很多人認為ARM處理器在傳統(tǒng)工藝上的升級空間已經(jīng)不大,在英特爾大張旗鼓地宣傳3D晶體管技術(shù)的時候,ARM 其實也也已經(jīng)開始了下一代工藝技術(shù)的研發(fā),Kevin透露ARM的PIP(物理IP)部門早與TSMC以及Global Foundries合作開始了下一代工藝finFET晶體管工藝技術(shù)的研發(fā),這是前所未有的,預計新的工藝技術(shù)將在TSMC的16nm工藝 和Global Foundries上的14nm上實現(xiàn),而新工藝可能會用于ARM下一代64位處理器上。 在具體產(chǎn)品發(fā)展上,在ARM公布了最新的A50系列處理器后,已經(jīng)有AMD、博通(Broadcom)、Calxeda、海思半導體、三星及意法半導體等七家公司獲得A53與A57處理器授權(quán),其中,STE聲稱將在2014年出貨A53處理器,這是否意味著2014年ARM處理器將采用finFET工藝技術(shù)? 在今年1月召開的2012國際電子器件會議(IEDM)上,TSMC已經(jīng)展示有關(guān)finFET晶體管工藝技術(shù),臺積電將提供的16nm工藝金屬布線部分直接沿襲20nm工藝,將晶體管部分換成16nm工藝的FinFET。與20nm工藝相比,可使晶體管的工作速度提高20%~25%,使耗電量降低35%。由于金屬布線部分在20nm工藝和16nm工藝間通用,因此兩工藝的芯片面積相同。與intel的工藝不同,臺積電的finFET晶體管摻入了鍺材料。 TSMC展示有關(guān)finFET晶體管工藝技術(shù) 以下為采用主要GPU的處理器性能對比
|