引言隨著AI技術(shù)不斷發(fā)展,越來越多的嵌入式設(shè)備開始集成NPU(神經(jīng)網(wǎng)絡(luò)處理單元),以實(shí)現(xiàn)更高效的AI推理。作為國產(chǎn)芯片廠商的佼佼者,瑞芯微推出的RK3588、RK3576、RK3568、RK3562系列芯片在市場中占據(jù)了重要地位。今天,我們一起深入對比、測評上述芯片的NPU性能,快速解決在項(xiàng)目選型中帶來的困擾。 測試數(shù)據(jù)匯總巔峰對決:RK3576 VS RK3588 圖1 輕量角逐:RK3562 VS RK3568圖2 數(shù)據(jù)解讀與應(yīng)用指南通過在不同平臺上對yolov5s(640×640)目標(biāo)檢測模型的推理性能測試對比,可以看出RK3588憑借6TOPS NPU算力,49fps的推理實(shí)測性能,成為圖像識別、多模態(tài)分析等高性能AI應(yīng)用的首選。 其次,RK3576的推理實(shí)測性能是45fps。其具備超高性價(jià)比,在中高性能場景下更占據(jù)優(yōu)勢。以工業(yè)控制領(lǐng)域?yàn)槔趯υO(shè)備運(yùn)行狀態(tài)進(jìn)行實(shí)時監(jiān)測與故障診斷時,RK3576既能滿足對數(shù)據(jù)處理速度和精度的要求,又能為企業(yè)有效控制成本,毫無疑問成為工業(yè)自動化升級的不二之選。 RK3568與RK3562均為輕量級NPU性價(jià)比方案,RK3568基于yolov5s(640×640)模型的實(shí)測推理性能達(dá)到17fps,適合用于如AGV機(jī)器人等基礎(chǔ)的AI擴(kuò)展場景。而RK3562以21fps的實(shí)測推理性能,在低功耗邊緣設(shè)備領(lǐng)域表現(xiàn)出色,如IoT門禁系統(tǒng)。這兩款芯片均為1TOPS算力,能更好滿足用戶對于輕量化是我需求,以顯著的成本優(yōu)勢,為大規(guī)模普及AI應(yīng)用提供了可能。 RK3576全國產(chǎn)工業(yè)核心板創(chuàng)龍科技基于瑞芯微RK3576J/RK3576,推出了工業(yè)核心板和評估板。其中,瑞芯微RK3576J/RK3576處理器集成了四核ARM [email protected] + 四核1.8GHz ARM [email protected] + ARM Cortex-M0,搭載6TOPS NPU。 創(chuàng)龍科技的RK3576J/RK3576核心板的ARM、ROM、RAM、電源、晶振、連接器等所有元器件均采用國產(chǎn)工業(yè)級方案,國產(chǎn)化率100%,可提供報(bào)告。此外,RK3576J/RK3576評估板具備豐富的接口資源,包括4路Ethernet、3路USB3.2、2路CAN-FD、2路RS485、PCIe 2.1等通信接口,以及MIPI CSI、LVDS OUT、MIPI DSI、DP(DisplayPort)、HDMI OUT、MIC IN、HP OUT、LINE IN等音視頻接口,滿足您的項(xiàng)目評估需求! RK3576工業(yè)核心板典型應(yīng)用場景圖3 開發(fā)環(huán)境Windows開發(fā)環(huán)境:Windows 7 64bit、Windows 10 64bit U-Boot:U-Boot-2017.09 Kernel:Linux-6.1.75 LinuxSDK:LinuxSDK-[版本號] (基于rk3576_linux6.1_release_v1.0.0_20240620) 硬件平臺:創(chuàng)龍科技TL3576-EVM工業(yè)評估板 案例功能案例基于RKNN API實(shí)現(xiàn)對圖片中目標(biāo)對象的識別,并將識別結(jié)果以加水印的方式添加至圖像,并保存成圖片文件。案例循環(huán)測試10次,統(tǒng)計(jì)出推理的平均處理耗時。 程序原理流程圖如下所示: 圖4 案例測試請通過網(wǎng)線將評估板千兆網(wǎng)口ETH1 RGMII連接至路由器。請將案例bin目錄下的所有文件拷貝至評估板文件系統(tǒng)任意目錄下。 圖5 在可執(zhí)行文件所在目錄,執(zhí)行如下命令,對圖片目標(biāo)對象進(jìn)行模型推理。 備注:模型運(yùn)行的時間會有抖動。 Target# ./yolov5_object_detect yolov5s-640-640_rk3576.rknn car.jpg 圖6 從輸出信息可知,本案例程序識別出測試圖片包含person、car、bus、truck等對象,運(yùn)行1次模型耗時為31.48ms;循環(huán)運(yùn)行10次模型平均耗時為22.26ms(約為45fps)。 圖7 案例程序?qū)y試圖片的目標(biāo)對象標(biāo)記成功后將輸出名稱為out.jpg的標(biāo)記圖片至當(dāng)前目錄,請將out.jpg文件拷貝至Windows下,并使用PC端相關(guān)軟件對比查看car.jpg與out.jpg,測試結(jié)果如下所示。 圖 8 圖9 從out.jpg圖片可知,案例程序能正確框選出人物、汽車等物體,同時顯示person、car等文字標(biāo)簽和置信度,標(biāo)記對象的數(shù)量及信息等與程序打印信息一致。 本程序能夠支持識別的目標(biāo)數(shù)據(jù)集類型說明位于案例目錄"bin\model\"目錄下的coco_80_labels_list.txt文件,用戶可根據(jù)相關(guān)目標(biāo)類型進(jìn)行測試驗(yàn)證。 圖10 同時可以測得CPU占用率約為14%,NPU占用率約為36%,內(nèi)存占用率約為8%。 圖11 圖12 到這里,我們的演示步驟結(jié)束。查看更多RK3576相關(guān)的案例演示 ,歡迎各位工程師在公眾號(Tronlong創(chuàng)龍科技)查閱,快來試試吧! |