應用于工業過程控制和智能化儀器儀表的單片機,由于現場條件往往十分惡劣,不可避免地會受到各種各樣的電磁干擾。當串入系統的干擾作用于單片機內部的CPU部件時,后果更加嚴重,將導致系統失控。最典型的失控故障是破壞程序計數器PC的狀態,導致程序在地址空間內“亂飛”,或者陷入“死循環”。因此,盡可能早地發現程序失控,并采取相應的補救措施,是單片機應用系統抗干擾設計的重要內容。 使程序從“亂飛”狀態納入正軌的方法稱為程序攔截技術,包括指令冗余技術、軟件陷阱技術等。使程序擺脫“死循環”,通常多采用硬件電路實現的監視技術,又稱“看門狗”技術(Watchdog)。常見的硬件“看門狗”電路有單穩態型“看門狗”電路、計數器型“看門狗”電路、微處理器監控專用芯片等。上述的抗干擾方法可參閱有關資料文獻。本文將討論由軟件實現的“看門狗”技術。 由硬件電路實現的“看門狗”技術,可以有效地克服主程序或中斷服務程序由于陷入“死循環”而帶來的不良后果。但在工業應用當中,嚴重的干擾有時會破壞中斷方式控制字,導致中斷關閉,這時一般的硬件“看門狗”將不能使中斷恢復正常。依靠軟件進行多重監視,可以彌補上述不足。 軟件“看門狗”技術的基本思路是:在主程序中對中斷服務程序的運行進行監視;在中斷服務程序中對主程序的運行進行監視;采用兩個中斷實施相互監視,稱之謂軟件三重監視抗干擾技術。從概率觀點,這種相互依存,相互制約的抗干擾措施,將使系統的可靠性大大提高。 本文以MCS—51單片機為例,說明軟件三重監視的基本原理。系統軟件包括主程序、T0定時中斷子程序和T1定時中斷子程序3部分,將T0設計成高級中斷,T1設計成低級中斷,從而形成中斷嵌套。 1主程序監視過程設計 主程序完成系統測控功能的同時,還要監視T0中斷服務程序因干擾而引起的中斷關閉故障。A0為T0中斷服務程序運行狀態的觀測單元,T0每發生一次中斷,A0計數單元少一次中斷(T0定時溢出時間小于測控功能模塊運行時間),引起A0的變化。在測控功能模塊的出口處,將A0值與E0值進行比較,以判斷A0是否發生變化。若A0發生變化,說明T0中斷運行正常;若A0不變化,說明T0中斷關閉,則轉到程序入口0000H處,進行出錯處理后,程序恢復正常運行。 設A0、E0、M計數單元分別為內RAM中的30H、40H和50H單元,監視程序如下: loop1:MOV 50H,#00H; 清M單元 MOV 40H, 30H;暫存A0單元 …; 測控功能模塊 CLR C MOV A, 30H SUBB A, 40H; 判斷A0變化 JZ loop MOV 30H, #00H LJMP loop1 loop:LJMP0000H 2T1中斷服務程序監視過程設計 T1中斷服務程序在完成特定測控功能的同時,還要監視主程序的運行狀態。在中斷服務程序中設置一個主程序運行計時器M1,T1每中斷一次,M便自行加1。M中的數值與T1定時溢出時間之積表示時間值。若由M表示的時間值大于主程序的運行時間,說明主程序因干擾而陷入了“死循環”,T1中斷服務程序便修改斷點地址,返回0000H,進行出錯處理。若M不大于主程序運行時間,說明主程序運行正常,中斷服務程序也正常返回。M單元在系統主程序運行中循環清“0”。 設單片機晶振頻率為6MHz,T1以工作方式1產生2ms的定時中斷,則T1的計數初值為: (216-N)×2×10-6=2×10-3 N=64536D=FC18H 主程序的最大循環時間為200ms,T取值應不小于64H,可取68H。A1為T1中斷程序運行狀態監測單元,取內RAM 31H單元,M仍取50H單元,60H、61H為暫存單元,則T1中斷監視程序如下: PUSH PSW ;保護現場 PUSH ACC MOV TH1, #0FCH;T1置初值 MOV TL1, #18H INC 31H ;A1單元加1 INC 50H ;M單元加1 CLR C MOV A,#68H SUBB A,50H ;T≥M? JC loop … ;中斷測控程序 POP ACC ;恢復現場 POP PSW RETI ;返回 loop:POP ACC ;恢復現場 POP PSW POP 60H ;原斷點彈出 POP 61H MOV 60H,#00H ;斷點修改為0000H MOV 61H,#00H PUSH 60H PUSH 61H RETI;返回 3T0中斷服務程序監視過程設計 T0中斷的功能是監視T1中斷服務程序的運行狀態。由于T0中斷服務程序較短,因干擾而引起的“死循環”的幾率很小,重點考慮中斷關閉故障。A1、B1為T1中斷運行狀態觀測單元。A1的初值為00H,T1每中斷一次,A1便加1,T0中斷服務程序中若檢測到A1>0,說明T1中斷正常;若A1=0,則B1單元加1(B1的初值為00H),若B1的累加值大于Q,說明T1中斷失效,失效時間為T0定時溢出時間與Q值之積。例如:T0的定時溢出時間為4ms,T1的定時溢出時間為2 ms,當Q=5時,說明允許T1的失效時間為20 ms,在這樣長的時間內,T1并沒有發生中斷,說明T1中斷發生了故障。由于T0中斷級別高于T1中斷級別,所以T1的任何故障(如死循環、中斷關閉)都會由T0檢測出來。T0中斷服務程序一般很短,發生“死循環”的幾率很小。 設單片機晶振頻率為6MHz,T0以工作方式1產生4 ms的定時中斷,則T0的計數初值為: (216-N)×2×10-6=4×10-3 N=63536D=F830H 設計數單元A0、A1、B1分別為內RAM30H、31H、32H,Q=5,60H、61H為暫存單元,則T0中斷監視程序如下: PUSHPSW;保護現場 PUSH ACC MOV TH0,#0F8H ;設T0初值 MOV TL0,#30H INC 30H ;A0加1 MOV A,31H ;A1單元判0 JZ loop1 CLR A ;清A1、B1單元 MOV 31H,A MOV 32H,A loop0:POP ACC ;恢復現場 POP PSW RETI ;返回 loop1:INC 32H ;B1加1 CLR C MOV A ,32H;B1≥Q? SUBB A,#05H JC loop0 POP ACC ;恢復現場 POP PSW POP 60H ;原斷點彈出 POP 61H MOV 60H,#00H ;修改斷點0000H MOV 61H,#00H PUSH 60H PUSH 61H RETI 當系統受到干擾后,主程序可能發生“死循環”,中斷服務程序也可能陷入“死循環”,或因中斷方式字的破壞而關閉中斷。主程序的“死循環”可由T1中斷服務程序監視;T1中斷服務程序的“死循環”和中斷關閉故障由T0中斷服務程序監視;T0的中斷故障可由主程序監視。由于采取了三重軟件監測方法,大大提高了系統運行的可靠性。 作者:王雷 王閃 王幸之 |