近日,在由易維訊主辦的第九屆年度中國電子ICT媒體論壇暨2021產業和技術展望研討會上,安謀科技高級FAE經理鄒偉為業界深度解讀Arm歷經十年打磨才新發布的針對不同層次算力需求、機器學習(ML)發展路徑的全新一代Armv9架構,其不僅是Arm架構演進的又一個里程碑,也將成為Arm未來十年及更遠時代推進行業創新的基礎。 安謀科技高級FAE經理鄒偉現場演講 Armv9:憑何改變高性能計算方式? 縱觀半導體設計在過去十多年的發展,特別是在終端消費等領域,算力帶來的生產力的提升,通過移動互聯網把大量的計算力放到每一個消費者的手中。與此同時,傳統依賴于人工采集和分析數據的過程在第五波計算浪潮中正演變成機器對機器之間的數據采集、存儲、分析和服務。由此產生的海量數據需要在云端、邊緣側配置更為強大的算力,并通過數據中心對獲得的數據進行分析、構建和決策。 Arm在成為移動浪潮主流架構之外,已進入到邊緣端和云端等新場景,其獨特的定位可為行業實現穩固的安全基礎,同時確保開發者以最簡便、快速的方式來使用Arm的安全技術。據鄒偉介紹,截止至2020年底,基于Arm IP的芯片累計售出1800億顆,涵蓋在各行各業每一個角落,每一個地方。共享的數據一定會有一個或多個環節經過Arm處理器計算,無論是數據采集的IoT設備,還是日常使用的手機、智能電腦,甚至服務器、超級計算機等。 據Arm預測,未來十年合作伙伴基于Arm芯片的出貨量將超過3000億,100%的共享數據將在Arm芯片上進行處理,無論是在終端還是在云端。因此,亟需一款全新的處理器架構在未來十年內改變計算的方式,以提供更高的性能、改善安全功能并增強工作負載功能。 鄒偉現場介紹全新Armv9架構特性 “為此,Arm正式推出了面向未來十年的新一代架構Armv9,是在目前已經廣泛使用的Armv8的基礎上,繼續使用AArch64作為基準指令集,保持了向下兼容性,在此基礎上分別在安全性、AI與ML以及可伸縮矢量擴展和DSP上做出改進,擴展了應用范圍。”鄒偉表示,“Armv9構架實現的處理器可用于移動計算、HPC高性能計算、汽車和AI等市場等,以滿足全球對功能日益強大的安全、人工智能和專用處理的需求,這意味著基于 Arm 架構的計算技術也將在智能手機以外的市場上獲得領導地位,借助移動生態系統帶來的巨大規模優勢,在筆記本電腦、臺式機、云等應用領域打造領先的解決方案。” Arm全面計算解決方案賦能終極數字體驗 盡管近些年全球半導體產業風云變幻,但提供先進算力始終是產業發展的根本目標。從這個角度來看對芯片設計企業又將面臨哪些挑戰呢?鄒偉分析道,首先是CPU的負載越來越復雜,多樣化不同的場景中會需求不一樣,每個環節面臨的挑戰都不一樣;而摩爾定律雖然減緩,但市場對性能、功耗的追求依然沒有停歇,這也是一大挑戰;此外,高昂的掩膜價格以及生產周期變長,設計一款5納米的芯片成本會非常高、生產周期又非常長。“我們希望芯片設計不僅覆蓋當前的應用,也能覆蓋以后的應用,以獲得更長的生命周期,這要求我們通過架構、設計、IP來應對這些客戶遇到的挑戰。”他強調道。 如果賦能終極的數字體驗是Arm構建未來計算愿景的驅動力,那Arm提出最新全面計算解決方案則是開啟Armv9時代未來十年之旅的第一步。Arm全面計算解決方案采用系統范圍的整體優化方法,橫跨硬件IP、物理IP、軟件、工具和標準,為Arm的合作伙伴提供更為廣泛的選擇,滿足所有終端細分市場的應用場景和成本區間,讓他們能夠滿懷信心地通過最新的技術,將高性能的產品快速推向市場。 作為Arm全面計算解決方案的基石,全新的Arm Cortex CPU包括Arm目前性能最強大的Arm Cortex-X2、首款基于Armv9架構的大核CPU Arm Cortex-A710以及Arm過去四年來推出的首款高效率小核Arm Cortex-A510和Armv9-A CPU 群集。為支持生態系統對于性能的需求,Arm的全球合作伙伴正在努力確保所有app都將在今年年底前支持64位。正如鄒偉在演講中所述,算力多樣化時代,Arm認為CPU的算力水準依然非常重要,它搭建了數字未來的基礎底座。 而在每代CPU性能動輒20-30%的大幅提升背后,是Arm對頻率、帶寬、時延、緩存、工藝水平等各項指標一點點提升的不懈追求,在計算基礎架構的創新上一直牽引著行業的進展。因此除了提升CPU性能之外,Arm全面計算解決方案同樣希望做系統級的提升,為客戶帶去更好的設計體驗。 此外,視覺體驗是消費者與設備交互、并享用設備的關鍵。據悉,最新的Arm的Mali系列GPU正搭配全面計算解決方案中的Armv9 CPU,可以提供卓越的用戶體驗。據鄒偉透露,未來Mali系列GPU也將持續超越大家的期待,帶來光線追蹤技術、可變速率著色VSR技術以及其他高級渲染技術等。 Arm 的互連技術對于提高系統性能同樣至關重要。最新的CoreLink CI-700一致性互連技術和CoreLink NI-700片上網絡互連技術與Arm CPU、GPU和NPU IP無縫搭配,可跨SoC解決方案增強系統性能。CoreLink CI-700和CoreLink NI-700對新的Armv9-A功能提供硬件級支持,并支持更高的安全性、改進的帶寬和延遲。 引入全新安全性功能,守護數據核心資產 隨著全球聯網設備激增,芯片的安全性日益重要。對安全性的根本需求是重新思考如何處理安全性,而Armv9架構則通過引入Arm機密計算體系結構(Confidential Compute Architecture, CCA)來重新設計安全應用程序的工作方式。機密計算通過打造基于硬件的安全運行環境來執行計算,保護部分代碼和數據,免于被存取或修改,甚至不受特權軟件的影響。 鄒偉進一步解釋道,Arm CCA將引入動態創建機密領域(Realms)的概念,機密領域面向所有應用,運行在獨立于安全或非安全環境之外的環境中,是存儲數據和執行代碼的動態安全區域,與操作系統或管理程序的特權模式分離,以實現保護數據安全的目的。例如,在商業應用中,機密領域可以保護系統中商用機密數據和代碼,無論它們正被使用、閑置或正在傳輸中。Arm機密計算體系結構建立在Arm的TrustZone技術之上,是軟件容器的硬件版本,允許應用程序輕松地在不同的系統上運行。例如在非安全區的運行的應用程序可以動態申請機密領域,以保護自己的算法或數據。 “Arm還與合作伙伴共同開發平臺安全架構PSA,作為一套標準的威脅模型、措施及時間,提供給終端設計人員使用,它與分級認證相結合后可以讓此設備的采購者對資產的安全性更放心。例如在國內我們便和中國信息通信研究院泰爾實驗室等聯合,以支持基于PSA框架的安全物聯網解決方案大規模部署。” 鄒偉補充道。 打造新計算時代的大計算平臺 除了安全性之外,機器學習也被視為Armv9的重要組成部分,因為在未來幾年中越來越多的機器學習工作負載將變得司空見慣,在機器學習方面Armv9架構支持BFloat16格式,從而更好地去支撐Int8計算和BFloat16 的機器學習;可伸縮矢量擴展2(SVE2)的引入,則能夠更好地幫助開發者對高階的應用場景進行開發,在處理 5G、虛擬現實和增強現實以及圖像和語音識別等任務負載時具有很大增益。 放眼瞬息萬變的數字世界,智能終端不僅需要具備靈活性強、功耗低的特點,同時還要滿足AI/ML的工作負載需求,這些挑戰正推動更安全和專用處理的發展,也是打開新市場、抓住新機遇的關鍵。Armv9架構的發布與全面計算解決方案以安全技術作為基礎,將解鎖整個生態系統的新體驗,為未來十年構建可信的數字化服務。 鄒偉總結到:“新一代Armv9架構將賦能開發者通過彌合軟硬件之間的關鍵差距,構建和編程未來的可信計算平臺,幫助我們的合作伙伴在更快的上市時間和成本控制之間取得平衡。安謀中國則致力于從技術到生態全面推動算力革命,并將在自研架構上加大投入,持續攜手生態合作伙伴,依托領先的Arm全球生態深入做強本土研發,持續賦能本土產業創新的企業戰略。” |