單片機因具有體積小、功能強、成本低以及便于實現分布式控制而有非常廣泛的應用領域[1]。單片機開發者在編制各種應用程序時經常會遇到實現精確延時的問題,比如按鍵去抖、數據傳輸等操作都要在程序中插入一段或幾段延時,時間從幾十微秒到幾秒。有時還要求有很高的精度,如使用單總線芯片DS18B20時,允許誤差范圍在十幾微秒以內[2],否則,芯片無法工作。用51匯編語言寫程序時,這種問題很容易得到解決,而目前開發嵌入式系統軟件的主流工具為C語言,用C51寫延時程序時需要一些技巧[3]。因此,在多年單片機開發經驗的基礎上,介紹幾種實用的編制精確延時程序和計算程序執行時間的方法。 實現延時通常有兩種方法:一種是硬件延時,要用到定時器/計數器,這種方法可以提高CPU的工作效率,也能做到精確延時;另一種是軟件延時,這種方法主要采用循環體進行。 1 使用定時器/計數器實現精確延時 單片機系統一般常選用11.059 2 MHz、12 MHz或6 MHz晶振。第一種更容易產生各種標準的波特率,后兩種的一個機器周期分別為1 μs和2 μs,便于精確延時。本程序中假設使用頻率為12 MHz的晶振。最長的延時時間可達216=65 536 μs。若定時器工作在方式2,則可實現極短時間的精確延時;如使用其他定時方式,則要考慮重裝定時初值的時間(重裝定時器初值占用2個機器周期)。 在實際應用中,定時常采用中斷方式,如進行適當的循環可實現幾秒甚至更長時間的延時。使用定時器/計數器延時從程序的執行效率和穩定性兩方面考慮都是最佳的方案。但應該注意,C51編寫的中斷服務程序編譯后會自動加上PUSH ACC、PUSH PSW、POP PSW和POP ACC語句,執行時占用了4個機器周期;如程序中還有計數值加1語句,則又會占用1個機器周期。這些語句所消耗的時間在計算定時初值時要考慮進去,從初值中減去以達到最小誤差的目的。 2 軟件延時與時間計算 在很多情況下,定時器/計數器經常被用作其他用途,這時候就只能用軟件方法延時。下面介紹幾種軟件延時的方法。 2.1 短暫延時 可以在C文件中通過使用帶_NOP_( )語句的函數實現,定義一系列不同的延時函數,如Delay10us( )、Delay25us( )、Delay40us( )等存放在一個自定義的C文件中,需要時在主程序中直接調用。如延時10 μs的延時函數可編寫如下: Delay10us( )函數中共用了6個_NOP_( )語句,每個語句執行時間為1 μs。主函數調用Delay10us( )時,先執行一個LCALL指令(2 μs),然后執行6個_NOP_( )語句(6 μs),最后執行了一個RET指令(2 μs),所以執行上述函數時共需要10 μs。可以把這一函數當作基本延時函數,在其他函數中調用,即嵌套調用[4],以實現較長時間的延時;但需要注意,如在Delay40us( )中直接調用4次Delay10us( )函數,得到的延時時間將是42 μs,而不是40 μs。這是因為執行Delay40us( )時,先執行了一次LCALL指令(2 μs),然后開始執行第一個Delay10us( ),執行完最后一個Delay10us( )時,直接返回到主程序。依此類推,如果是兩層嵌套調用,如在Delay80us( )中兩次調用Delay40us( ),則也要先執行一次LCALL指令(2 μs),然后執行兩次Delay40us( )函數(84 μs),所以,實際延時時間為86 μs。簡言之,只有最內層的函數執行RET指令。該指令直接返回到上級函數或主函數。如在Delay80μs( )中直接調用8次Delay10us( ),此時的延時時間為82 μs。通過修改基本延時函數和適當的組合調用,上述方法可以實現不同時間的延時。 2.2 在C51中嵌套匯編程序段實現延時 在C51中通過預處理指令#pragma asm和#pragma endasm可以嵌套匯編語言語句。用戶編寫的匯編語言緊跟在#pragma asm之后,在#pragma endasm之前結束。 如:#pragma asm … 匯編語言程序段 … #pragma endasm 延時函數可設置入口參數,可將參數定義為unsigned char、int或long型。根據參數與返回值的傳遞規則,這時參數和函數返回值位于R7、R7R6、R7R6R5中。在應用時應注意以下幾點: ◆ #pragma asm、#pragma endasm不允許嵌套使用; ◆ 在程序的開頭應加上預處理指令#pragma asm,在該指令之前只能有注釋或其他預處理指令; ◆ 當使用asm語句時,編譯系統并不輸出目標模塊,而只輸出匯編源文件; ◆ asm只能用小寫字母,如果把asm寫成大寫,編譯系統就把它作為普通變量; ◆ #pragma asm、#pragma endasm和 asm只能在函數內使用。 將匯編語言與C51結合起來,充分發揮各自的優勢,無疑是單片機開發人員的最佳選擇。 2.3 使用示波器確定延時時間 熟悉硬件的開發人員,也可以利用示波器來測定延時程序執行時間。方法如下:編寫一個實現延時的函數,在該函數的開始置某個I/O口線如P1.0為高電平,在函數的最后清P1.0為低電平。在主程序中循環調用該延時函數,通過示波器測量P1.0引腳上的高電平時間即可確定延時函數的執行時間。方法如下: 把P1.0接入示波器,運行上面的程序,可以看到P1.0輸出的波形為周期是3 ms的方波。其中,高電平為2 ms,低電平為1 ms,即for循環結構“for(j=0;j 2.4 使用反匯編工具計算延時時間 對于不熟悉示波器的開發人員可用Keil C51中的反匯編工具計算延時時間,在反匯編窗口中可用源程序和匯編程序的混合代碼或匯編代碼顯示目標應用程序。為了說明這種方法,還使用“for (i=0;i: 可以看出,0x000F~0x0017一共8條語句,分析語句可以發現并不是每條語句都執行DlyT次。核心循環只有0x0011"0x0017共6條語句,總共8個機器周期,第1次循環先執行“CLR A”和“MOV R6,A”兩條語句,需要2個機器周期,每循環1次需要8個機器周期,但最后1次循環需要5個機器周期。DlyT次核心循環語句消耗(2+DlyT×8+5)個機器周期,當系統采用12 MHz時,精度為7 μs。 當采用while (DlyT--)循環體時,DlyT的值存放在R7中。相對應的匯編代碼如下: 循環語句執行的時間為(DlyT+1)×5個機器周期,即這種循環結構的延時精度為5 μs。 通過實驗發現,如將while (DlyT--)改為while (--DlyT),經過反匯編后得到如下代碼: C:0x0014DFFE DJNZR7,C:0014//2T 可以看出,這時代碼只有1句,共占用2個機器周期,精度達到2 μs,循環體耗時DlyT×2個機器周期;但這時應該注意,DlyT初始值不能為0。 這3種循環結構的延時與循環次數的關系如表1所列。 表1 循環次數與延時時間關系單位:μs 注意:計算時間時還應加上函數調用和函數返回各2個機器周期時間。 2.5 使用性能分析器計算延時時間 很多C程序員可能對匯編語言不太熟悉,特別是每個指令執行的時間是很難記憶的,因此,再給出一種使用Keil C51的性能分析器計算延時時間的方法。這里還以前面介紹的for (i=0;i 當然也可以不用打開Performance Analyzer window,這時觀察左邊工具欄秒(SEC)項。全速運行時,時間不變,只有當程序運行到斷點處,才顯示運行所用的時間。 3 總結 本文介紹了多種實現并計算延時程序執行時間的方法。使用定時器進行延時是最佳的選擇,可以提高MCU工作效率,在無法使用定時器而又需要實現比較精確的延時時,后面介紹的幾種方法可以實現不等時間的延時: 使用自定義頭文件的優點是,可實現任意時間長短的延時,并減少主程序的代碼長度,便于對程序的閱讀理解和維護。編寫延時程序是一項很麻煩的任務,可能需要多次修改才能滿足要求。掌握延時程序的編寫,能夠使程序準確得以執行,這對項目開發有著重要的意義。本文所討論的幾種方法,都是來源于實際項目的開發經驗,有著很好的實用性和適應性。 |