国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

STM32的代碼,跑在RAM里快?還是跑在Flash里快?

發(fā)布時間:2009-11-25 18:04    發(fā)布者:STM32
關(guān)鍵詞: Flash , RAM , 代碼
這肯定是很多人關(guān)心的問題,下面通過一個例子看看會有什么樣的結(jié)論:

測試手段如下:

主循環(huán)一直在做一個變量的自加(sum1++),當(dāng)然前提保證不會溢出。

Cortex-M3內(nèi)部的Systick計數(shù),以一秒鐘為限,這個sum1的數(shù)值大小,可以判斷哪種方式比較快。為了嚴(yán)密,我們觀察第一秒到第二秒之間的計數(shù)效果;而不是從第0秒到第1秒(因為使能Systick到真正開始執(zhí)行sum1++可能有間隙)。在第一次進(jìn)入Systick的ISR時,記錄下sum1的值;第二次進(jìn)入Systick的ISR時,再次記錄sum1的值,兩次值之差即為一秒鐘間隔中sum1執(zhí)行了多少次自加。由此看出哪種方式比較快。

同樣的測試前提:Prefetch Buffer Enable + Flash Latenty="2" (根據(jù)Flash Programming Manual中要求的那樣,當(dāng)48MHz
測試結(jié)果如下:

不對代碼優(yōu)化,在RAM中執(zhí)行程序:sum1計數(shù)69467/秒
不對代碼優(yōu)化,在FLASH中執(zhí)行程序:sum1計數(shù)43274/秒 (Flash里跑得慢)

/***********循環(huán)體內(nèi)代碼為N個以下的block*************/
(1)LDR R0,[PC, #0x154]
(2)LDR R1,[PC, #0x154]

(3)LDR R1,[R1,#0]
(4)ADDS R1, R1,#0x1

(5)STR R1,[R0, #0]

    ......
/****************************************************/

打開速度優(yōu)化開關(guān),在RAM中執(zhí)行程序:sum1計數(shù)98993/秒
打開速度優(yōu)化開關(guān),在FLASH中執(zhí)行程序:sum1計數(shù)115334/秒 (Flash里跑得快)

/***********循環(huán)體內(nèi)代碼為N個以下的block*************/
(1)LDR R1,[R1,#4]
(2)ADDS R1, R1,#0x1
(3)STR R1,[R0, #0]
    ......
/****************************************************/

結(jié)論就是:

1)程序運行在RAM里速度快還是運行在Flash里速度快,不是絕對的一概而論的,取決于代碼;

2)就以上兩種具體的代碼情況來說,我覺得無優(yōu)化時,如果在Flash里執(zhí)行:(1)(2)的取指(讀flash)->譯碼->執(zhí)行 (讀flash);取指和執(zhí)行階段flash的目標(biāo)地址不是連續(xù)的,因此是non-sequencial access,所以會很慢;
打開優(yōu)化時,(1)(2)(3)都不會造成flash的non-sequential access,所以在flash里的優(yōu)勢(取指和取數(shù)據(jù)走不同的總線ICode和DCode以及Prefetch)就體現(xiàn)出來了。

再進(jìn)一步的分析,又有這樣一些結(jié)論:

沒有優(yōu)化時,指令執(zhí)行時要到Flash中取常數(shù),結(jié)果造成指令預(yù)取隊列的取指中斷,取完常數(shù)后需要重新填充指令預(yù)取隊列,而Flash訪問需要插入等待周期,當(dāng)然時間就比較長了。

經(jīng)過代碼優(yōu)化后,指令執(zhí)行時不用再到Flash中取常數(shù),指令預(yù)取隊列不會被打斷,而Flash訪問需要插入等待周期的效應(yīng)被下面貼子中介紹的取指緩沖區(qū)抵消,所以自然速度就快了;而這個時候在RAM中執(zhí)行反而慢了是因為RAM不在ICode總線上,從RAM取指需要繞一圈,當(dāng)然要比在ICode總線上的Flash慢了。

關(guān)于Flash的性能,請看我的另一篇分析:【分析】STM32從Flash中運行程序的時序分析

另外,STR9與STM32的總線架構(gòu)是一樣的,這里有一個在STR9上實現(xiàn)的FFT函數(shù)的實測數(shù)據(jù),可以進(jìn)一步說明在Flash中運行代碼可以比在RAM中快!

在ST的網(wǎng)站上有一個DSP的函數(shù)庫,這是它的文檔《STR91x DSP library (DSPLIB)》,在這篇文檔中有一節(jié)討論FFT運算速度的,那里給出了實際的運算時間比較,摘錄如下:

Radix-4
Complex FFT     Operation Mode     Cycle Count     Microseconds
64 Point     Program in Flash & Data in SRAM     2701     28.135
64 Point     Program & Data in SRAM     3432     35.75
64 Point     Program & Data in Flash     3705     38.594
256 Point     Program in Flash & Data in SRAM     13740     143.125
256 Point     Program & Data in SRAM     18079     188.323
256 Point     Program & Data in Flash     19908     207.375

最初發(fā)表日期:2008-8-28
本文地址:http://m.qingdxww.cn/thread-5774-1-1.html     【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé);文章版權(quán)歸原作者及原出處所有,如涉及作品內(nèi)容、版權(quán)和其它問題,我們將根據(jù)著作權(quán)人的要求,第一時間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區(qū)
  • FPGA設(shè)計流程培訓(xùn)教程
  • Chiptorials ——使用ATECC608 TrustFLEX實現(xiàn)基本非對稱身份驗證
  • Chiptorials ——如何將CryptoAuthLib庫用于Microchip安全身份驗證IC
  • 無線充電基礎(chǔ)知識及應(yīng)用培訓(xùn)教程
  • 貿(mào)澤電子(Mouser)專區(qū)

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權(quán)所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 狠狠亚洲婷婷综合色香 | 99久久免费午夜国产精品 | 国产一区第一页 | 亚洲欧美视频二区 | 国外欧美一区另类中文字幕 | 亚洲国产成人欧美激情 | 两个人的高清在线观看 | 国产伦一区二区三区四区久久 | 自拍偷自拍亚洲精品情侣 | 国产高清一区二区 | 有人有在线观看的片吗www | 黑人一区二区三区中文字幕 | 手机在线免费不卡一区二 | 日日操日日舔 | 特级av毛片免费观看 | 日本久久久久亚洲中字幕 | 四虎毛片 | 日本久久黄色 | 99热只有 | h视频在线观看免费网站 | 日本中文字幕第一页 | 91麻豆精品国产一级 | 黄瓜视频色www在线观看 | 亚洲麻豆视频 | 亚洲另类在线观看 | 青青青在线视频国产 | 羞羞视频导航 | jizz日本在线观看 | 亚洲一区在线视频观看 | 四虎永久免费地址在线观看 | 日韩伦理免费在线观看 | 国产网红在线观看 | 色花堂中文字幕98堂网址 | 亚洲mm色国产网站 | 99久久国产综合精品国 | 99爱这里只有精品 | 亚洲免费播放 | 日干夜干天天干 | 思久久 | 日本免费看片网站 | 日本视频网站在线www色 |