国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

全新CMSIS-NN神經(jīng)網(wǎng)絡內(nèi)核讓微控制器效率提升5倍

發(fā)布時間:2018-1-30 17:46    發(fā)布者:eechina


目前,在許多需要在本地進行數(shù)據(jù)分析的“永遠在線”的物聯(lián)網(wǎng)邊緣設備中,神經(jīng)網(wǎng)絡正在變得越來越普及,主要是因為可以有效地同時減少數(shù)據(jù)傳輸導致的延時和功耗。 而談到針對物聯(lián)網(wǎng)邊緣設備上的神經(jīng)網(wǎng)絡,我們自然會想到Arm Cortex-M系列處理器內(nèi)核,那么如果您想要強化它的性能并且減少內(nèi)存消耗,CMSIS-NN就是您最好的選擇。基于CMSIS-NN內(nèi)核的神經(jīng)網(wǎng)絡推理運算,對于運行時間/吞吐量將會有4.6X的提升,而對于能效將有4.9X的提升。

CMSIS-NN庫包含兩個部分: NNFunction和NNSupportFunctions。 NNFunction包含實現(xiàn)通常神經(jīng)網(wǎng)絡層類型的函數(shù),比如卷積(convolution),深度可分離卷積(depthwise separable convolution),全連接(即內(nèi)積inner-product), 池化(pooling)和激活(activation)這些函數(shù)被應用程序代碼用來實現(xiàn)神經(jīng)網(wǎng)絡推理應用。 內(nèi)核API也保持簡單,因此可以輕松地重定向到任何機器學習框架。NNSupport函數(shù)包括不同的實用函數(shù),如NNFunctions中使用的數(shù)據(jù)轉換和激活功能表。 這些實用函數(shù)也可以被應用代碼用來構造更復雜的NN模塊,例如, 長期短時記憶(LSTM)或門控循環(huán)單元(GRU)。

對于某些內(nèi)核(例如全連接和卷積),會使用到不同版本的內(nèi)核函數(shù)。 我們提供了一個基本的版本,可以為任何圖層參數(shù)“按原樣”通用。 我們還部署了其他版本,包括進一步的優(yōu)化技術,但會對輸入進行轉換或對層參數(shù)有一些限制。 理想情況下,可以使用簡單的腳本來分析網(wǎng)絡拓撲,并自動確定要使用的相應函數(shù)。



我們在卷積神經(jīng)網(wǎng)絡(CNN)上測試了CMSIS-NN內(nèi)核,在CIFAR-10數(shù)據(jù)集上進行訓練,包括60,000個32x32彩色圖像,分為10個輸出類。 網(wǎng)絡拓撲結構基于Caffe中提供的內(nèi)置示例,具有三個卷積層和一個完全連接層。 下表顯示了使用CMSIS-NN內(nèi)核的層參數(shù)和詳細運行時結果。 測試在運行頻率為216 MHz的ARM Cortex-M7內(nèi)核STMichelectronics NUCLEO-F746ZG mbed開發(fā)板上進行。



整個圖像分類每張圖像大約需要99.1毫秒(相當于每秒10.1張圖像)。 運行此網(wǎng)絡的CPU的計算吞吐量約為每秒249 MOps。 預量化的網(wǎng)絡在CIFAR-10測試集上達到了80.3%的精度。 在ARM Cortex-M7內(nèi)核上運行的8位量化網(wǎng)絡達到了79.9%的精度。 使用CMSIS-NN內(nèi)核的最大內(nèi)存占用空間為〜133 KB,其中使用局部im2col來實現(xiàn)卷積以節(jié)省內(nèi)存,然后進行矩陣乘法。 沒有使用局部im2col的內(nèi)存占用將是〜332 KB,這樣的話神經(jīng)網(wǎng)絡將無法在板上運行。

為了量化CMSIS-NN內(nèi)核相對于現(xiàn)有解決方案的好處,我們還使用一維卷積函數(shù)(來自CMSIS-DSP的arm_conv),類似Caffe的pooling和ReLU來實現(xiàn)了一個基準版本。 對于CNN應用,下表總結了基準函數(shù)和CMSIS-NN內(nèi)核的比較結果。 CMSIS-NN內(nèi)核的運行時間/吞吐量比基準函數(shù)提高2.6至5.4倍。 能效提高也與吞吐量的提高相一致。



高效的NN內(nèi)核是充分發(fā)揮ARM Cortex-M CPU能力的關鍵。 CMSIS-NN提供了優(yōu)化的函數(shù)來加速關鍵的NN層,如卷積,池化和激活。 此外,非常關鍵的是CMSIS-NN還有助于減少對于內(nèi)存有限的微控制器而言至關重要的內(nèi)存占用。 更多細節(jié)在我們的白皮書中您可以讀到,您可以使用下面的按鈕從康奈爾大學圖書館網(wǎng)站下載。

CMSIS-NN內(nèi)核可在github.com/ARM-software/CMSIS_5上找到。 應用 代碼可以直接使用這些內(nèi)核來實現(xiàn)Arm Cortex-M CPU上的神經(jīng)網(wǎng)絡算法。 或者,這些內(nèi)核可以被機器學習框架用作原語函數(shù)(primitives)來部署訓練過的模型。

如需進一步資源,更詳細的產(chǎn)品信息和教程,幫助您解決來自邊緣ML的挑戰(zhàn),請訪問我們的新機器學習開發(fā)者網(wǎng)站。

參考:CMSIS-NN: Efficient Neural Network Kernels for Arm Cortex-M CPUs White Paper

本文地址:http://m.qingdxww.cn/thread-522715-1-1.html     【打印本頁】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內(nèi)容、版權和其它問題,我們將根據(jù)著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區(qū)
  • Dev Tool Bits——使用MPLAB® Discover瀏覽資源
  • Dev Tool Bits——使用條件軟件斷點宏來節(jié)省時間和空間
  • Dev Tool Bits——使用DVRT協(xié)議查看項目中的數(shù)據(jù)
  • Dev Tool Bits——使用MPLAB® Data Visualizer進行功率監(jiān)視
  • 貿(mào)澤電子(Mouser)專區(qū)

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 青青草原亚洲 | 国产羞羞事1000部在线观看 | 婷婷久久综合九色综合绿巨人 | 91啦视频在线观看 | 天天色综合久久 | 日本加勒比在线精品视频 | 天天爆操 | 星空影院在线影视 | 男人天堂一区 | 欧美黑人成人免费全部 | 97国产免费全部免费观看 | 亚洲一区二区精品视频 | 国产日韩欧美综合一区 | 69av在线视频 | 精品视频91 | 日韩中文欧美 | 干操网 | 国产午夜精品免费一二区 | 精品国产人成在线 | 欧美影院在线观看完整版 mp4 | 在线精品视频成人网 | 久久羞羞| 国产成人污污网站在线观看 | 天堂网在线观看在线观看精品 | 岛国在线视频 | 四虎视屏| 男人的天堂在线免费视频 | 热re99久久精品国产99热 | 久久笫一福利免费导航 | 热久久最新视频 | 欧美激情亚洲激情 | 全国最大色 | 羞羞视频免费网站欧美 | 欧美成人免费高清网站 | 四虎影视在线麻豆国产 | 欧美高清正版在线 | 日韩欧美视频一区二区 | 杰罗德游戏在线观看完整版免费 | 4虎最新网址| 四虎永久在线精品免费影视 | 免费看一级毛片 |