ARM公司供稿 您可能會(huì)發(fā)覺(jué)每年到了這個(gè)時(shí)候,我們都會(huì)開(kāi)始討論最新的高端GPU。2017年也不例外,ARM Mali團(tuán)隊(duì)宣布Mali-G72加入高端GPU產(chǎn)品系列。 2017年高級(jí)移動(dòng)設(shè)備GPU 跟隨去年Mali-G71的腳步,ARM今年在Computex2017 大會(huì)上發(fā)布了基于Bifrost 架構(gòu)的Mali-G72,在更小面積與更低功耗的基礎(chǔ)上,提供更強(qiáng)大的效能。Mali-G72不僅能應(yīng)用到高保真手機(jī)游戲以及機(jī)器學(xué)習(xí)設(shè)備,還能將VR能力提升至全新境界。采用Mali-G72的設(shè)備,整體圖形性能是前一代的1.4倍,無(wú)論業(yè)界要推出多么炫酷的應(yīng)用,Mali-G72都已做好準(zhǔn)備迎接挑戰(zhàn)。 • Mali-G72 的亮點(diǎn): o 相較現(xiàn)有產(chǎn)品,設(shè)備性能提升40% o 能效提升25%,芯片面積效能提升20% o 機(jī)器學(xué)習(xí)效率提升17% o 眾多針對(duì)Bifrost的優(yōu)化,包括緩沖記憶、區(qū)塊拓展性,L1 緩存尺寸 ![]() 高保真移動(dòng)游戲崛起 移動(dòng)端設(shè)備高保真游戲的崛起是催生Mali-G72的重要力量。盡管《糖果傳奇》(Candy Crush)等簡(jiǎn)單游戲仍有龐大市場(chǎng),但復(fù)雜的游戲卻也在不斷地創(chuàng)收,中國(guó)移動(dòng)游戲產(chǎn)業(yè)43%的收入都是由此而來(lái)。例如Digital Legends公司的個(gè)人射擊游戲《電磁風(fēng)暴》(Afterpulse),在過(guò)去是不可能出現(xiàn)在移動(dòng)平臺(tái)上的。高頂點(diǎn)數(shù)所需的耗電量、眾多圖形命令、更復(fù)雜的頂點(diǎn)與像素著色器,以及諸如動(dòng)態(tài)陰影等先進(jìn)的圖形效果,對(duì)于過(guò)去而言,實(shí)在是要求過(guò)高,且會(huì)降低質(zhì)量與游戲時(shí)間。我們與生態(tài)系統(tǒng)內(nèi)的伙伴和開(kāi)發(fā)商共同探討,通力合作,確保我們的產(chǎn)品能滿足他們的不同需求。ARM與Digital Legends的合作能支持最新的圖形技術(shù),并搭配ARM的優(yōu)化工具以實(shí)現(xiàn)效能與效率最大化,與Mali-G71相比,Mali-G72寫(xiě)入帶寬可節(jié)省42%。加上使用像素本地儲(chǔ)存(PLS),可以再額外節(jié)省45%,讓整體寫(xiě)入帶寬一舉節(jié)省68%。此類(lèi)合作造就了Mali-G72的各種創(chuàng)新,并讓移動(dòng)游戲商得以實(shí)現(xiàn)如《電磁風(fēng)暴》般的多功能游戲。 ![]() * Newzoo 對(duì)營(yíng)收排名前200名的游戲所進(jìn)行之研究 支持下一代虛擬現(xiàn)實(shí) 虛擬現(xiàn)實(shí)也在不斷發(fā)展,所以ARM 也要不斷精進(jìn)自己的技術(shù),在市場(chǎng)中繼續(xù)保有領(lǐng)先地位。超過(guò)50%現(xiàn)有的移動(dòng)VR設(shè)備由Mali驅(qū)動(dòng),而搭載Mali的Mate 9,是市面上第一個(gè)取得Daydream平臺(tái)認(rèn)證的VR設(shè)備之一,因此,我們首要任務(wù)是繼續(xù)推動(dòng)創(chuàng)新。你或許曾見(jiàn)過(guò)ARM最近在2017 游戲開(kāi)發(fā)者大會(huì)(GDC)中發(fā)布的Circuit VR展示,我們正致力開(kāi)發(fā)移動(dòng)Multiview等技術(shù),以降低多次繪制同一圖形的額外負(fù)擔(dān)–就如同你通常會(huì)在VR環(huán)境中做的事一樣(實(shí)際上你的兩只眼睛需要一個(gè)完整的渲染繪制)。另外還要加上注視點(diǎn)渲染技術(shù),也就是你只會(huì)看見(jiàn)與視網(wǎng)膜在一直線上的高解析影像,而當(dāng)你突然需要渲染繪制四個(gè)或更多視野時(shí),Multiview就真正派上用場(chǎng)了。其他像多重采樣抗鋸齒(MSAA)等技術(shù)則會(huì)讓線條的某一邊增加融入像素,使其看起來(lái)比較平滑,以降低VR頭盔在近距離空間內(nèi)偶爾會(huì)看到的鋸齒效果。Mali-G72在最低的效能成本下,可達(dá)成8倍或16倍的MSAA。上述所提,當(dāng)然是基于現(xiàn)存的創(chuàng)新科技,包括全調(diào)適紋理壓縮技術(shù)(ASTC),讓我們能整合高質(zhì)量的紋理,且不需要與帶寬進(jìn)行妥協(xié)。 ![]() 優(yōu)化設(shè)備上的機(jī)器學(xué)習(xí) 如前所述,機(jī)器學(xué)習(xí)也是另一關(guān)鍵移動(dòng)的使用案例,如今,機(jī)器學(xué)習(xí)通常在云端上進(jìn)行,運(yùn)用訓(xùn)練神經(jīng)網(wǎng)絡(luò)的大量數(shù)據(jù)集實(shí)現(xiàn)智能連接,但越來(lái)越多的數(shù)據(jù)也需要在設(shè)備端進(jìn)行,比如像翻譯這樣的簡(jiǎn)單任務(wù),通過(guò)云端持續(xù)傳送大量數(shù)據(jù),不但增加成本,而且速度也很慢。我希望智能手機(jī)能在我需要的時(shí)候干我所想;如果連接或數(shù)據(jù)傳送需要等很長(zhǎng)時(shí)間,那么這個(gè)設(shè)備再好我也不太想用,這也是為何業(yè)界開(kāi)始研究“將機(jī)器學(xué)習(xí)界面放到設(shè)備本身”的原因。華為已預(yù)料到會(huì)有這種需求,以飛快的速度在八個(gè)月內(nèi)推出搭載Mali-G71的Mate 9。在這款手機(jī)上,機(jī)器學(xué)習(xí)算法會(huì)找出你最常用的應(yīng)用程序,,并對(duì)其能耗性能進(jìn)行優(yōu)先設(shè)置,保證實(shí)現(xiàn)最優(yōu)性能。基于Bifrost架構(gòu)的Mali-G71已經(jīng)相當(dāng)擅長(zhǎng)機(jī)器學(xué)習(xí)界面,如下圖表- 華為Mate 9搭載Mali-G71 MP8在執(zhí)行AlexNet時(shí),比具有類(lèi)似圖形性能的低階獨(dú)立顯卡還要快上87%。 而Mali-G72性能更好,我們之前討論的算法優(yōu)化及增加的高速緩存已經(jīng)非常成熟,借由此大幅降低帶寬,Mali-G72可以實(shí)現(xiàn)機(jī)器學(xué)習(xí)最大的效率與效能。我們是如何實(shí)現(xiàn)的呢? ![]() Bifrost 架構(gòu)的創(chuàng)新 除了繼續(xù)保持Bifrost最主要的高效能特色,像是CPU與GPU彼此間完整的系統(tǒng)一致性、索引式定位著色器等,Mali-G72同時(shí)還有多項(xiàng)新武器。優(yōu)化算法效率以及強(qiáng)化復(fù)雜的圖形性能與可擴(kuò)展性,讓Mali-G72 成為明年橫跨智能手機(jī)、虛擬現(xiàn)實(shí)、機(jī)器學(xué)習(xí)與其它高端移動(dòng)產(chǎn)品中的最佳選擇。看看ARM實(shí)際上在其中做了哪些改進(jìn)? ARM增加了區(qū)塊緩沖存儲(chǔ)器(tile buffer memory),以便讓GPU在每個(gè)運(yùn)行區(qū)塊(tile)支持更多的儲(chǔ)存空間。這可在輕負(fù)載情況下提升數(shù)據(jù)吞吐量,也讓多重采樣抗鋸齒(MSAA, Multi Sample Anti-Aliasing)與像素本地儲(chǔ)存(PLS, Pixel Local Storage) 技術(shù)獲得更佳的利用率,同時(shí)也顯著提升效能與視覺(jué)質(zhì)量。我們也重新平衡了執(zhí)行引擎的數(shù)據(jù)路徑,以移除某些鮮少使用的指令,并以更簡(jiǎn)單的指令順序取而代之,以便降低使用面積與耗電,為我們的合作伙伴降低實(shí)施成本,并提升整套系統(tǒng)的效率。為了支持更高的圖形復(fù)雜性,ARM已針對(duì)更多復(fù)雜運(yùn)算進(jìn)行優(yōu)化,例如最頻繁使用的互反平方根,并增加區(qū)塊的緩存以加速數(shù)據(jù)存取。這些改變能改善高效能系統(tǒng)的性能擴(kuò)展能力,同時(shí)也提供終端使用者更佳的圖形體驗(yàn)。為了進(jìn)一步降低帶寬,ARM同時(shí)增加了一級(jí)緩存與寫(xiě)回緩存的大小,同時(shí)也改變指令緩存邏輯,以便在不增加整體面積與耗電情況下進(jìn)行更佳利用,并減少對(duì)復(fù)雜內(nèi)容產(chǎn)生的緩存遺漏情況。對(duì)于合作伙伴而言,如此細(xì)心地在效能與效率間取得平衡,對(duì)某些應(yīng)用是極為重要的。 ![]() 總結(jié) 比起前一代產(chǎn)品,這款基于Bifrost架構(gòu)的Mali-G72實(shí)現(xiàn)了多種創(chuàng)新,包括效能提升25%、每平方毫米的芯片面積效能提升20%,以及機(jī)器學(xué)習(xí)效率提升17%。除此之外,它還能讓整體設(shè)備效能提升40%。Mali-G72在明年高端智能手機(jī)的表現(xiàn)超出預(yù)期已指日可待。 ![]() |
image006.jpg (34.56 KB)