国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

打造 “CPU+” 異構計算平臺,Arm 靈活應對各類 AI 工作負載

發布時間:2024-12-4 17:22    發布者:eechina
關鍵詞: Arm , AI加速 , AI推理
作者:Arm

對于人工智能 (AI) 而言,任何單一硬件或計算組件都無法成為適合各類工作負載的萬能解決方案。AI 貫穿從云端到邊緣側的整個現代計算領域,為了滿足不同的 AI 用例和需求,一個可以靈活使用 CPU、GPU 和 NPU 等不同計算引擎的異構計算平臺必不可少。

依托于 Arm CPU 的性能、能效、普及性、易于編程性和靈活性,從小型的嵌入式設備到大型的數據中心,Arm CPU 已經為各種平臺上的 AI 加速奠定了基礎。

就靈活性而言,這對生態系統大有裨益的三個主要原因是,首先,Arm CPU 可以處理廣泛的 AI 推理用例,其中許多用例通常用于數十億臺設備,例如當今的智能手機、云和數據中心。不僅如此,除了推理之外,CPU 還經常用于技術棧中的數據預處理和編排等其他任務。其次,開發者能夠在更多種類的數據格式中運行更廣泛的軟件,而無需構建多個版本的代碼。最后,CPU 的靈活性使之成為加速 AI 工作負載的理想工具。

提供多樣性和選擇,助力行業靈活部署 AI 計算

除了 CPU 產品組合外,Arm 計算平臺還包括 GPU 和 NPU 等 AI 加速器技術,許多市場都在將這些技術與 CPU 進行集成。

在移動端領域,Arm 終端計算子系統 (CSS) 包含 Armv9.2 CPU 集群,并與 Arm Immortalis-G925 GPU 集成,可為各種 AI 用例提供加速功能,包括圖像分割、對象檢測、自然語言處理和語音轉文本等用例。在物聯網 (IoT) 方面,Arm Ethos-U85 NPU 可與需要加速 AI 性能的基于 Arm Cortex-A 的系統一起設計,例如工廠自動化等場景。

此外,除了 Arm 自己的加速器技術外,合作伙伴借助 Arm 的 CPU 靈活定制具有差異化的芯片解決方案。例如,NVIDIA 用于 AI 基礎設施的 Grace Blackwell 和 Grace Hopper 超級芯片均采用了 Arm CPU 和 NVIDIA 的 AI 加速器技術,從而顯著提升 AI 性能。

NVIDIA Grace Blackwell 超級芯片將 NVIDIA 的 Blackwell GPU 架構與基于 Arm Neoverse 的 Grace CPU 相結合。Arm 獨特的產品組合使 NVIDIA 能夠進行系統級設計優化,與 NVIDIA H100 GPU 相比,其能耗降低了 25 倍,單個 GPU 性能提高了 30 倍。具體來說,得益于 Arm Neoverse 平臺的靈活性,NVIDIA 能夠實現自有的高帶寬 NVLink 互連技術,并提升 CPU、GPU 和內存之間的數據帶寬和延遲。

Arm 致力于通過 Arm 全面設計生態項目,為整個生態系統注入 AI 加速的機遇。通過該生態項目,開發者可以更快訪問 Arm CSS 技術,賦能軟硬件技術進步,以此驅動 AI 和芯片創新,并加快開發和部署 AI 優化的芯片解決方案。

Arm 架構滿足 AI 所需的獨特靈活性

Arm CPU 設計所具有靈活性關鍵在于 Arm 領先的架構。它提供了一個可以與 AI 加速器技術緊密集成的基礎平臺,并支持從 128 位到 2,048 位的各種向量長度,可以在許多不同的數據點上輕松執行多個神經網絡

Arm 架構的靈活性為整個芯片生態系統提供了多樣化的定制機會,Arm 一直致力于幫助合作伙伴更快地構建自己的差異化芯片解決方案。這種獨特的靈活性也使 Arm 能夠不斷進行架構創新,定期推出關鍵指令和功能來加速 AI 計算,進而惠及整個生態系統,其中包括領先的芯片合作伙伴,以及在 Arm 計算平臺上構建應用的 2,000 多萬軟件開發者等。

這一切始于 Armv7 架構,該架構引入了高級單指令多數據 (SIMD) 擴展,例如 Neon 技術,這是 Arm 首次涉足機器學習 (ML) 工作負載。在過去幾年中,該架構不斷增強,Armv8 中增加了向量點積和矩陣乘法特性,之后在 Armv9 中又引入了 Arm SVE2 和新的 Arm SME 技術,為廣泛的生成式 AI 工作負載和用例提高了計算性能并降低了功耗。

與 AI 加速器技術無縫集成

Arm 是 AI 時代的計算平臺,推動了持續的架構創新,以滿足速度更快、互動性更好和沉浸感更強的 AI 應用的發展。Arm CPU 作為靈活處理 AI 工作負載的異構計算方法中的一部分,可以無縫增強和集成 GPU 和 NPU 等 AI 加速器技術。

Arm CPU 是處理眾多 AI 推理工作負載的實用之選,憑借出色的靈活性,它能夠與加速器技術無縫集成,打造更強大、更高性能的 AI 功能,精準滿足特定用例和計算需求。對于 Arm 的技術合作伙伴而言,出色的靈活性有助于實現豐富的定制選擇,使他們能夠為 AI 工作負載構建完整的芯片解決方案。

本文地址:http://m.qingdxww.cn/thread-877867-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • FPGA設計流程培訓教程
  • Chiptorials ——使用ATECC608 TrustFLEX實現基本非對稱身份驗證
  • 無線充電基礎知識及應用培訓教程
  • Chiptorials ——如何將CryptoAuthLib庫用于Microchip安全身份驗證IC
  • 貿澤電子(Mouser)專區

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: chengren网站| 精品小视频在线观看 | 高清一区二区三区免费 | 麻豆传煤适当放松一下自己 | 国产区精品 | 幸福宝草莓视频 | 国产精品日韩 | 国产一级免费在线观看 | 91看片入口| 日本不卡视频在线视频观看 | 99re99.nat| 日韩福利在线 | 花季传媒3.0.3黄版每天三次 | 日韩黄色在线 | 国产高清一区二区三区视频 | 亚洲欧洲一区二区三区 | 日韩黄色小视频 | 四虎www成人影院免费观看 | 亚洲色图 在线视频 | 天天摸日日 | 99热这里只 | 在线三级播放 | 亚洲欧美日韩伦中文 | 久久三级视频 | 三级网站国产 | 向日葵app看片视频在线观看 | 4hu影院永久在线播放 | 国内精品久久久久影 | 久久精品国产欧美日韩99热 | 99热在线免费观看 | 四虎sihu新版影院亚洲精品 | 欧美精品v国产精品v日韩精品 | 国产欧美日韩一区二区三区视频 | 欧美羞羞视频 | 国产成人综合亚洲亚洲欧美 | 巨人万梓良国语免费观看 | 日本欧美一区二区 | 狠狠狠色丁香婷婷综合激情 | 精品视频一区二区三三区四区 | 狠狠88综合久久久久综合网 | 91成人高清在线播放 |