2024年11月5日消息,炬芯科技創(chuàng)新性的采用了基于模數(shù)混合設(shè)計(jì)的電路實(shí)現(xiàn)存內(nèi)計(jì)算Computing-in-Memory(簡稱CIM)技術(shù),在SRAM介質(zhì)內(nèi)用客制化的模擬設(shè)計(jì)實(shí)現(xiàn)數(shù)字計(jì)算電路,既實(shí)現(xiàn)了真正的CIM,又保證了計(jì)算精度和量產(chǎn)一致性。炬芯科技面向電池驅(qū)動的低功耗IoT領(lǐng)域成功落地了第一代基于模數(shù)混合電路實(shí)現(xiàn)的SRAM based CIM(Mixed-mode SRAM based CIM,簡稱MMSCIM)在500MHz時實(shí)現(xiàn)了0.1TOPS的算力,并且達(dá)成了6.4TOPS/W的能效比,受益于其對于稀疏矩陣的自適應(yīng)性,如果有合理稀疏性的模型(即一定比例參數(shù)為零時),能效比將進(jìn)一步得到提升,依稀疏性的程度能效比可達(dá)成甚至超過10TOPS/W。基于此核心技術(shù)的創(chuàng)新,炬芯科技打造出了下一代低功耗大算力、高能效比的端側(cè)AI音頻芯片平臺。 炬芯科技正式宣布發(fā)布全新一代基于MMSCIM端側(cè)AI音頻芯片,共三個芯片系列:第一個系列是 ATS323X,面向低延遲私有無線音頻領(lǐng)域;第二個系列是ATS286X,面向藍(lán)牙AI音頻領(lǐng)域;第三個系列是 ATS362X,面向AI DSP領(lǐng)域。 三個系列芯片均采用了CPU(ARM)+ DSP(HiFi5)+ NPU(MMSCIM)三核異構(gòu)的設(shè)計(jì)架構(gòu),炬芯的研發(fā)人員將MMSCIM和先進(jìn)的HiFi5 DSP融合設(shè)計(jì)形成了炬芯科技“Actions Intelligence NPU(AI-NPU)”架構(gòu),并通過協(xié)同計(jì)算,形成一個既高彈性又高能效比的NPU架構(gòu)。在這種AI-NPU架構(gòu)中MMSCIM支持基礎(chǔ)性通用AI算子,提供低功耗大算力。同時,由于AI新模型新算子的不斷涌現(xiàn),MMSCIM沒覆蓋的新興特殊算子則由HiFi5 DSP來予以補(bǔ)充。 以上全部系列的端側(cè)AI芯片,均可支持片上1百萬參數(shù)以內(nèi)的AI模型,且可以通過片外PSRAM擴(kuò)展到支持最大8百萬參數(shù)的AI模型,同時炬芯科技為AI-NPU打造了專用AI開發(fā)工具“ANDT”,該工具支持業(yè)內(nèi)標(biāo)準(zhǔn)的AI開發(fā)流程如Tensorflow,HDF5,Pytorch和Onnx。同時它可自動將給定AI算法合理拆分給CIM和HiFi5 DSP去執(zhí)行。 ANDT是打造炬芯低功耗端側(cè)音頻AI生態(tài)的重要武器。借助炬芯ANDT工具鏈輕松實(shí)現(xiàn)算法的融合,幫助開發(fā)者迅速地完成產(chǎn)品落地。 根據(jù)炬芯科技公布的第一代(GEN1)MMSCIM和HiFi5 DSP能效比實(shí)測結(jié)果的對比顯示: 當(dāng)炬芯科技GEN1 MMSCIM與HiFi5 DSP均以500MHz運(yùn)行同樣717K參數(shù)的Convolutional Neural Network(CNN)網(wǎng)路模型進(jìn)行環(huán)境降噪時,MMSCIM相較于HiFi5 DSP可降低近98%功耗,能效比提升達(dá)44倍。而在測試使用935K 參數(shù)的CNN網(wǎng)路模型進(jìn)行語音識別時,MMSCIM相較于HiFi5 DSP可降低93%功耗,能效比提升14倍。 另外,在測試使用更復(fù)雜的網(wǎng)路模型進(jìn)行環(huán)境降噪時,運(yùn)行Deep Recurrent Neural Network模型時,相較于HiFi5 DSP可降低89%功耗;運(yùn)行Convolutional Recurrent Neural Network模型時,相較于HiFi5 DSP可降低88%功耗;運(yùn)算Convolutional Deep Recurrent Neural Network模型時,相較于HiFi5 DSP可降低76%功耗。 最后,相同條件下在運(yùn)算某CNN-Con2D算子模型時,GEN1 MMSCIM的實(shí)測AI算力可比HiFi5 DSP的實(shí)測算力高16.1倍。 綜上所述,炬芯科技此次推出的最新一代基于MMSCIM端側(cè)AI音頻芯片,對于產(chǎn)業(yè)的影響深遠(yuǎn),有望成為引領(lǐng)端側(cè)AI技術(shù)的新潮流。 炬芯科技選擇基于模數(shù)混合電路的SRAM存內(nèi)計(jì)算(Mixed-Mode SRAM based CIM,簡稱MMSCIM)的技術(shù)路徑,具有以下幾點(diǎn)顯著的優(yōu)勢:第一,比純數(shù)字實(shí)現(xiàn)的能效比更高,并幾乎等同于純模擬實(shí)現(xiàn)的能效比;第二,無需ADC/DAC, 數(shù)字實(shí)現(xiàn)的精度,高可靠性和量產(chǎn)一致性,這是數(shù)字化天生的優(yōu)勢;第三,易于工藝升級和不同F(xiàn)AB間的設(shè)計(jì)轉(zhuǎn)換;第四,容易提升速度,進(jìn)行性能/功耗/面積(PPA)的優(yōu)化;第五,自適應(yīng)稀疏矩陣,進(jìn)一步節(jié)省功耗,提升能效比。 而對于高質(zhì)量的音頻處理和語音應(yīng)用,MMSCIM是最佳的未來低功耗端側(cè)AI音頻技術(shù)架構(gòu)。由于減少了在內(nèi)存和存儲之間數(shù)據(jù)傳輸?shù)男枨螅梢源蠓档脱舆t,顯著提升性能,有效減少功耗和熱量產(chǎn)生。對于要在追求極致能效比電池供電IoT設(shè)備上賦能AI,在每毫瓦下打造盡可能多的 AI 算力,炬芯科技采用的MMSCIM技術(shù)是真正實(shí)現(xiàn)端側(cè)AI落地的最佳解決方案。 炬芯科技還公布了MMSCIM路線規(guī)劃,從路線圖中顯示:1、炬芯第一代(GEN1)MMSCIM已經(jīng)在2024年落地, GEN1 MMSCIM采用22 納米制程,每一個核可以提供100 GOPS的算力,能效比高達(dá)6.4 TOPS/W @INT8;2、到 2025 年,炬芯科技將推出第二代(GEN2)MMSCIM,GEN2 MMSCIM采用22 納米制程,性能將相較第一代提高三倍,每個核提供300GOPS算力,直接支持Transformer模型,能效比也提高到7.8TOPS/W @INT8;3、到 2026 年,推出新制程12 納米的第三代(GEN3)MMSCIM,GEN3 MMSCIM每個核達(dá)到1 TOPS的高算力,支持Transformer,能效比進(jìn)一步提升至15.6TOPS/W @INT8。 每一代MMSCIM技術(shù)均可以通過多核疊加的方式來提升總算力,比如MMSCIM GEN2單核是300 GOPS算力,可以通過四個核組合來達(dá)到高于1TOPS的算力。 從ChatGPT到Sora,文生文、文生圖、文生視頻、圖生文、視頻生文,各種不同的云端大模型不斷刷新人們對AI的預(yù)期。然而,AI發(fā)展之路依然漫長,從云到端將會是一個新的發(fā)展趨勢,AI的世界即將開啟下半場。 以低延遲、個性服務(wù)和數(shù)據(jù)隱私保護(hù)等優(yōu)勢,端側(cè)AI在IoT設(shè)備中扮演著越來越重要的角色,在制造、汽車、消費(fèi)品等多個行業(yè)中展現(xiàn)更多可能性。基于SRAM的模數(shù)混合CIM技術(shù)路徑,炬芯科技新產(chǎn)品的發(fā)布踏出了打造低功耗端側(cè) AI 算力的第一步,成功實(shí)現(xiàn)了在產(chǎn)品中整合 AI 加速引擎,推出CPU+ DSP + NPU 三核 AI 異構(gòu)的端側(cè)AI音頻芯片。 未來,炬芯科技將繼續(xù)加大端側(cè)設(shè)備的邊緣算力研發(fā)投入,通過技術(shù)創(chuàng)新和產(chǎn)品迭代,實(shí)現(xiàn)算力和能效比進(jìn)一步躍遷,提供高能效比、高集成度、高性能和高安全性的端側(cè) AIoT 芯片產(chǎn)品,推動 AI 技術(shù)在端側(cè)設(shè)備上的融合應(yīng)用,助力端側(cè)AI生態(tài)健康、快速發(fā)展。 |