來源: 第一財經資訊 隨著人工智能技術和應用的發展,作為深度學習和人工智能領域的專用芯片,NPU正逐漸走向舞臺中央。 NPU,神經網絡處理單元,用于高效執行神經網絡的計算,通常具有優化的硬件架構,如向量處理單元、矩陣乘法單元、卷積單元和激活函數單元等,能夠在硬件級別上執行大規模矩陣運算和卷積運算,以提高神經網絡計算效率。 當前各類AI算法主要利用深度神經網絡等算法模擬人類神經元和突觸,NPU能夠實現更高效率、更低能耗處理人工神經網絡、隨機森林等機器學習算法和深度學習模型。如今,多家手機廠商已搭載NPU,AIPC也將通過“CPU(中央處理器)+NPU+GPU(圖形處理器)”打造本地混合計算。那么,NPU會是繼GPU之后的又一風口嗎? NPU:高效能、低功耗、更擅長推理 “相比于CPU和GPU,NPU的優勢在于高效能、低功耗、易于編程、降低了開發門檻,同時支持多種語言和框架方便開發者進行模型開發和部署。”IDC中國分析師杜昀龍告訴第一財經。 傳統的CPU通常用于執行通用計算任務,但對于處理大規模的神經網絡計算,CPU的處理效率相對較低。 GPU通常作為CPU的協處理器,和CPU相比邏輯運算單元更少,處理并行計算優勢明顯,能夠分擔CPU的計算量,也是目前數據中心側應用最廣的加速計算芯片。 NPU采用“數據驅動并行計算”的架構,在電路層模擬人類神經元和突觸,特別擅長處理視頻、圖像類的海量多媒體數據。區別于CPU、GPU所遵循的馮諾依曼架構,NPU能夠通過突觸權重實現存儲計算一體化,提高運行效率,因此比GPU更擅長推理。且NPU芯片設計邏輯更為簡單,在處理推理工作負載時具有顯著的能耗節約優勢。 不過,由于GPU已經具備英偉達CUDA等完善的生態,杜昀龍認為,缺少像GPU那樣完善的生態環境是目前NPU滲透率提升最大的瓶頸。 據IDC數據,2022年中國實現數據中心計算加速仍以GPU為主,GPU在人工智能芯片市場中出貨量占比達86%;NPU占比為12%,較以往具有明顯增長。 多用于端側和邊緣側 與云側不同的是,端側對于功耗更加敏感,對低功耗芯片的需求更明顯。因此,隨著人工智能應用場景陸續落地,NPU易開發、高效能、低功耗等優勢逐漸突顯。業內普遍認為,在大算力需求爆發下,云側的算力需求將傳遞至端側。目前,實現智能終端算力的最常用方式是在SoC芯片中內置NPU模塊。 “NPU是專門為人工智能應用而設計的芯片,目前看NPU通常用于邊緣側和端側場景更多,比如人臉識別、人臉解鎖、影像處理等。”杜昀龍表示。 AIPC有望在2024年批量上市,而AIPC普遍搭載NPU,與CPU、GPU共同構成AIPC核心算力。 英特爾近期發布了內置NPU的第14代酷睿Ultra移動處理器。英特爾表示,2024年,將有230多款機型搭載酷睿Ultra。蘋果也將在2024年發布搭載M3處理器的MacBook,并透露其M3處理器的NPU性能相較于M1提升了60%。 手機端則更早開始搭載NPU,華為最早在Mate10采用寒武紀NPU,后在990系列上采用自研的達芬奇NPU。蘋果從A11SoC開始加入Neuralengine,最新公布的A14SoC中,NPU算力已有巨大提升,Neuralengine結合CPU上的機器學習加速器能夠大大提高AI應用體驗。 除智能手機、AIPC外,在汽車、邊緣側如XR及各類物聯網智能終端中,NPU也有應用。隨著大模型走進千行百業,端側AI、邊緣側AI滲透率提升,也將帶來更多NPU需求。 國產芯片廠商深入布局 目前,國內芯片廠商正奮力自研NPU,以把握AI浪潮。以阿里平頭哥為代表的芯片公司已推出面向數據中心AI應用的人工智能推理芯片,目前含光800已成功應用在數據中心、邊緣服務器等場景。 國產SoC廠商也在深入布局NPU,以豐富和提升SoC人工智能處理能力。 NPU在SoC中的典型應用為機器視覺。以瑞芯微(603893.SH)的新一代機器視覺方案RV1106及RV1103為例,兩顆芯片在NPU、ISP、視頻編碼、音頻處理等性能均有顯著升級,集成度與性價比較高,可以在低待機功耗的同時提供優秀的邊緣AI算力。瑞芯微高性能的RV1126具備四核ARMCortex-A7和RISC-VMCU,2.0TopsNPU,活體檢測率可以高達98.48%,最新旗艦芯片RK3588支持6Tops的NPU算力。 晶晨股份(688099.SH)A311D在采用高性能A73內核的同時,搭載了5TOPS的高性能NPU,可以廣泛用于各類中高端AIOT(人工智能物聯網)設備。 NPU IP方面,芯原股份(688521.SH)通過2016年對圖芯美國的收購,芯原獲得了圖形處理器(GPU)IP,在此基礎上自主開發出了NPU IP。芯原股份此前告訴第一財經,目前,在AIoT領域,公司用于人工智能的神經網絡處理器IP已經被50多家客戶的100多款芯片所采用,被用在物聯網、可穿戴設備、安防監控、服務器、汽車電子等10個應用領域。 |