單片機軟件三重監視抗干擾技術

發布時間：2010-7-27 09:32 發布者：lavida

應用于工業過程控制和智能化儀器儀表的單片機，由于現場條件往往十分惡劣，不可避免地會受到各種各樣的電磁干擾。當串入系統的干擾作用于單片機內部的CPU部件時，后果更加嚴重，將導致系統失控。最典型的失控故障是破壞程序計數器PC的狀態，導致程序在地址空間內“亂飛”，或者陷入“死循環”。因此，盡可能早地發現程序失控，并采取相應的補救措施，是單片機應用系統抗干擾設計的重要內容。

使程序從“亂飛”狀態納入正軌的方法稱為程序攔截技術，包括指令冗余技術、軟件陷阱技術等。使程序擺脫“死循環”，通常多采用硬件電路實現的監視技術，又稱“看門狗”技術（Watchdog）。常見的硬件“看門狗”電路有單穩態型“看門狗”電路、計數器型“看門狗”電路、微處理器監控專用芯片等。上述的抗干擾方法可參閱有關資料文獻。本文將討論由軟件實現的“看門狗”技術。

由硬件電路實現的“看門狗”技術，可以有效地克服主程序或中斷服務程序由于陷入“死循環”而帶來的不良后果。但在工業應用當中，嚴重的干擾有時會破壞中斷方式控制字，導致中斷關閉，這時一般的硬件“看門狗”將不能使中斷恢復正常。依靠軟件進行多重監視，可以彌補上述不足。

軟件“看門狗”技術的基本思路是：在主程序中對中斷服務程序的運行進行監視；在中斷服務程序中對主程序的運行進行監視；采用兩個中斷實施相互監視，稱之謂軟件三重監視抗干擾技術。從概率觀點，這種相互依存，相互制約的抗干擾措施，將使系統的可靠性大大提高。

本文以MCS—51單片機為例，說明軟件三重監視的基本原理。系統軟件包括主程序、T0定時中斷子程序和T1定時中斷子程序3部分，將T0設計成高級中斷，T1設計成低級中斷，從而形成中斷嵌套。

1主程序監視過程設計

主程序完成系統測控功能的同時，還要監視T0中斷服務程序因干擾而引起的中斷關閉故障。A0為T0中斷服務程序運行狀態的觀測單元，T0每發生一次中斷，A0計數單元少一次中斷（T0定時溢出時間小于測控功能模塊運行時間），引起A0的變化。在測控功能模塊的出口處，將A0值與E0值進行比較，以判斷A0是否發生變化。若A0發生變化，說明T0中斷運行正常；若A0不變化，說明T0中斷關閉，則轉到程序入口0000H處，進行出錯處理后，程序恢復正常運行。

設A0、E0、M計數單元分別為內RAM中的30H、40H和50H單元，監視程序如下：
loop1：MOV 50H，＃00H；清M單元
MOV 40H， 30H；暫存A0單元
  …；測控功能模塊
CLR C
MOV A， 30H
SUBB A， 40H；判斷A0變化
JZ loop
MOV 30H，＃00H
LJMP loop1
loop：LJMP0000H

2T1中斷服務程序監視過程設計

T1中斷服務程序在完成特定測控功能的同時，還要監視主程序的運行狀態。在中斷服務程序中設置一個主程序運行計時器M1，T1每中斷一次，M便自行加1。M中的數值與T1定時溢出時間之積表示時間值。若由M表示的時間值大于主程序的運行時間，說明主程序因干擾而陷入了“死循環”，T1中斷服務程序便修改斷點地址，返回0000H，進行出錯處理。若M不大于主程序運行時間，說明主程序運行正常，中斷服務程序也正常返回。M單元在系統主程序運行中循環清“0”。

設單片機晶振頻率為6MHz，T1以工作方式1產生2ms的定時中斷，則T1的計數初值為：

（216－N）×2×10－6＝2×10－3
N＝64536D＝FC18H

主程序的最大循環時間為200ms，T取值應不小于64H，可取68H。A1為T1中斷程序運行狀態監測單元，取內RAM 31H單元，M仍取50H單元，60H、61H為暫存單元，則T1中斷監視程序如下：

PUSH PSW ；保護現場
PUSH ACC
MOV TH1，＃0FCH；T1置初值
MOV TL1，＃18H
INC 31H ；A1單元加1
INC 50H ；M單元加1
CLR C
MOV A，＃68H
SUBB A，50H ；T≥M？
JC loop
… ；中斷測控程序
POP ACC ；恢復現場
POP PSW
RETI ；返回
loop：POP ACC ；恢復現場
POP PSW
POP 60H ；原斷點彈出
POP 61H
MOV 60H，＃00H ；斷點修改為0000H
MOV 61H，＃00H
PUSH 60H
PUSH 61H
RETI；返回

3T0中斷服務程序監視過程設計

T0中斷的功能是監視T1中斷服務程序的運行狀態。由于T0中斷服務程序較短，因干擾而引起的“死循環”的幾率很小，重點考慮中斷關閉故障。A1、B1為T1中斷運行狀態觀測單元。A1的初值為00H，T1每中斷一次，A1便加1，T0中斷服務程序中若檢測到A1＞0，說明T1中斷正常；若A1＝0，則B1單元加1（B1的初值為00H），若B1的累加值大于Q，說明T1中斷失效，失效時間為T0定時溢出時間與Q值之積。例如：T0的定時溢出時間為4ms，T1的定時溢出時間為2 ms，當Q＝5時，說明允許T1的失效時間為20 ms，在這樣長的時間內，T1并沒有發生中斷，說明T1中斷發生了故障。由于T0中斷級別高于T1中斷級別，所以T1的任何故障（如死循環、中斷關閉）都會由T0檢測出來。T0中斷服務程序一般很短，發生“死循環”的幾率很小。

設單片機晶振頻率為6MHz，T0以工作方式1產生4 ms的定時中斷，則T0的計數初值為：

（216－N）×2×10－6＝4×10－3
N＝63536D＝F830H
設計數單元A0、A1、B1分別為內RAM30H、31H、32H，Q＝5，60H、61H為暫存單元，則T0中斷監視程序如下：
PUSHPSW；保護現場
PUSH ACC
MOV TH0，＃0F8H ；設T0初值
MOV TL0，＃30H
INC 30H ；A0加1
MOV A，31H ；A1單元判0
JZ loop1
CLR A ；清A1、B1單元
MOV 31H，A
MOV 32H，A
loop0：POP ACC ；恢復現場
POP PSW
RETI ；返回
loop1：INC 32H ；B1加1
CLR C
MOV A ，32H；B1≥Q？
SUBB A，＃05H
JC loop0
POP ACC ；恢復現場
POP PSW
POP 60H ；原斷點彈出
POP 61H
MOV 60H，＃00H ；修改斷點0000H
MOV 61H，＃00H
PUSH 60H
PUSH 61H
RETI

當系統受到干擾后，主程序可能發生“死循環”，中斷服務程序也可能陷入“死循環”，或因中斷方式字的破壞而關閉中斷。主程序的“死循環”可由T1中斷服務程序監視；T1中斷服務程序的“死循環”和中斷關閉故障由T0中斷服務程序監視；T0的中斷故障可由主程序監視。由于采取了三重軟件監測方法，大大提高了系統運行的可靠性。

作者：王雷王閃王幸之

本文地址：http://m.qingdxww.cn/thread-17227-1-1.html 【打印本頁】

本站部分文章為轉載或網友發布，目的在于傳遞和分享信息，并不代表本網贊同其觀點和對其真實性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問題，我們將根據著作權人的要求，第一時間更正或刪除。