Windows CE的陷阱調(diào)度是嵌入式系統(tǒng)開發(fā)的一個重要內(nèi)容,陷阱調(diào)度的好壞關(guān)系到系統(tǒng)的健壯性和穩(wěn)定度。陷阱調(diào)度看起來只有幾個常用語句,故有些開發(fā)人員常常會對陷阱調(diào)度輕視和在使用上思路模糊。 近期我在一個嵌入式開發(fā)項目中就體驗到輕視陷阱調(diào)度的慘痛教訓(xùn),因為對陷阱調(diào)度沒有處理好,后果是嚴(yán)重影響系統(tǒng)穩(wěn)定性。因此,我認(rèn)為陷阱調(diào)度并不是表面看起來的那么簡單。本文分享在此項目過程中對陷阱調(diào)度的一些看法。 一.什么是陷阱調(diào)度機制? 一般來說,嵌入式操作系統(tǒng)主要由兩部分組成:運行在核心態(tài)的內(nèi)核系統(tǒng)和運行在用戶態(tài)的環(huán)境子系統(tǒng)組成。因此,Windows CE系統(tǒng)被劃分為兩層:執(zhí)行體和內(nèi)核。而內(nèi)核始終運行在核心態(tài)下,除了中斷服務(wù)例程(Interrupt Service Routine,ISR),正在運行的線程是不能搶先內(nèi)核的。為此,Windows CE為執(zhí)行體、內(nèi)核、設(shè)備驅(qū)動程序等核心態(tài)提供了一些基礎(chǔ)系統(tǒng)機制。 (1)Windows CE系統(tǒng)機制 Windows CE系統(tǒng)機制包括陷阱調(diào)度、執(zhí)行體對象管理器、各種同步對象以及本地過程調(diào)用等。一般來說,可以分成兩種對象類型:執(zhí)行體對象和內(nèi)核對象。內(nèi)核以內(nèi)核對象的形式給執(zhí)行體提供其它的同步機構(gòu),稱為“調(diào)度程序?qū)ο蟆薄0ㄟM(jìn)程、線程、事件、信號量、互斥體、可等待的定時器、文件等同步對象。每個同步對象有兩種狀態(tài):“有信號”,“無信號”。內(nèi)核還提供一組嚴(yán)格定義的、可預(yù)測的、使操作系統(tǒng)得以工作的基礎(chǔ)設(shè)施,這為執(zhí)行體的高級組件提供了必須的低級功能接口。內(nèi)核除了執(zhí)行線程調(diào)度外,幾乎將所有的策略制定留給了執(zhí)行體。同時,Windows CE運行中的CPU 會支持兩個級別的權(quán)限,其中較高級別的權(quán)限稱為內(nèi)核態(tài),較低級別的權(quán)限稱為用戶態(tài)。 (2)陷阱調(diào)度(Trap Dispatching)機制 Windows CE的基本機制之一是陷阱調(diào)度,屬于內(nèi)核功能。包括中斷調(diào)度、延遲過程調(diào)用(DPC)、異步過程調(diào)用(APC)、異常調(diào)度、系統(tǒng)服務(wù)調(diào)度。 陷阱處理程序是Windows CE用來處理意外事件的硬件機制。當(dāng)異常或中斷發(fā)生時,硬件或軟件就能檢測到它們,并捕獲正在執(zhí)行的線程,CPU會從用戶態(tài)切換到核心態(tài),將暫停正在處理的事情,把控制轉(zhuǎn)交給內(nèi)核的陷阱處理程序。同時,該模塊還能檢測異常和中斷的類型,并將控制交給處理相應(yīng)情況的代碼。因此,陷阱調(diào)度機制是當(dāng)異常或者中斷發(fā)生時,能夠保存當(dāng)前線程狀態(tài)并轉(zhuǎn)向相應(yīng)處理的一種系統(tǒng)機制。 在Windows CE系統(tǒng)里,內(nèi)核通過以下方式來分辨中斷和異常:中斷是一個異步事件(可以在任何時間產(chǎn)生),不管處理器在執(zhí)行什么程序。典型的中斷由I/O設(shè)備、時鐘、定時器產(chǎn)生,必要時可以屏蔽中斷。而異常是一個同步事件,它是由正在執(zhí)行的特定代碼產(chǎn)生的,重新執(zhí)行相同的代碼會重復(fù)產(chǎn)生特定的異常。比如訪問非法內(nèi)存、除數(shù)為0等。系統(tǒng)把系統(tǒng)服務(wù)也作為異常來處理。 二.陷阱調(diào)度核心:中斷機制 在Windows CE陷阱調(diào)度中最重要之一是中斷機制。當(dāng)陷阱處理程序被調(diào)用時,將在記錄機器狀態(tài)時暫時禁用中斷,它會創(chuàng)建一個陷阱幀(Trap Frame)來保存被中斷線程運行現(xiàn)場,并在合適的時候恢復(fù)線程執(zhí)行時使用。陷阱幀通常是完整的線程描述表的子集。 (1)中斷調(diào)度 不同的CPU中斷機制是不一樣的,Windows CE的中斷調(diào)度程序會將硬件中斷級映射到由操作系統(tǒng)識別的中斷請求級別(Interrupt ReQuest Level,IRQL)的標(biāo)準(zhǔn)集上。這與線程的調(diào)度優(yōu)先級是完全不同的含義,調(diào)度優(yōu)先級是線程的屬性,而IRQL則是中斷源的屬性。因此,每個CPU都具有一個IRQL設(shè)置,其值隨著操作系統(tǒng)代碼的執(zhí)行而改變。內(nèi)核定義了一組可移植的IRQL,如果CPU具有與中斷相關(guān)的特性,則可以增加IRQL。IRQL按優(yōu)先級排列中斷,并進(jìn)行中斷服務(wù),較高優(yōu)先級的中斷服務(wù)可以搶占較低優(yōu)先級的中斷服務(wù)。 一般來說,IRQL從高往低到設(shè)備都是為硬件中斷保留,而DPC和APC級中斷是內(nèi)核和設(shè)備驅(qū)動器產(chǎn)生的軟件中斷。低優(yōu)先級(也稱作被動級)實際上并不是真正的中斷級,在該級上執(zhí)行的是普通線程,并允許發(fā)生所有的中斷。IRQL設(shè)置決定了每個處理器可以接收的中斷。當(dāng)核心態(tài)線程運行時,可以提高或降低處理器的IRQL來屏蔽一些事件。 如果中斷源的IRQL高于當(dāng)前中斷設(shè)置,則中斷可以中斷該處理器;如果中斷源的IRQL等于或低于當(dāng)前中斷設(shè)置,則中斷將被封鎖或“屏蔽”,直到一個正在執(zhí)行的線程降低了IRQL。當(dāng)產(chǎn)生中斷時,陷阱處理程序能提高處理器的IRQL直到與中斷源所指定的IRQL相同,這可以保證服務(wù)于該中斷的處理器不會被同級或較低級的中斷搶先。被屏蔽的中斷將被另一個處理器處理或阻擋,直到IRQL降低。因為改變處理器的IRQL對操作系統(tǒng)具有如此重要的影響,所以它只能在核心態(tài)下改變。 (2)硬件中斷 最典型的硬件中斷是由I/O設(shè)備產(chǎn)生的,當(dāng)這些設(shè)備需要服務(wù)時,必須通知處理器。中斷驅(qū)動的設(shè)備允許操作系統(tǒng)通過將指令執(zhí)行與I/O操作重疊進(jìn)行,以獲得處理器的最大利用率。處理器啟動發(fā)往設(shè)備的I/O傳送或來自設(shè)備的I/O傳送,然后在設(shè)備完成傳送時執(zhí)行其它線程。當(dāng)設(shè)備執(zhí)行完后,中斷處理器就能獲得服務(wù)。定點設(shè)備、打印機、鍵盤、磁盤驅(qū)動器以及網(wǎng)卡通常都是中斷驅(qū)動的。 大多數(shù)硬件中斷允許設(shè)備驅(qū)動程序注冊其設(shè)備的ISR,包含內(nèi)核所需的設(shè)備ISR與中斷特定級相聯(lián)系的所有信息,包括ISR的地址、設(shè)備中斷的IRQL以及與ISR相聯(lián)系的內(nèi)核入口。當(dāng)中斷對象被初始化后,稱為調(diào)度代碼的一些匯編語言代碼指令就會被存儲在對象中。當(dāng)中斷發(fā)生時,這些代碼會調(diào)用真正的中斷調(diào)度程序,并傳遞一個指向中斷對象的指針。中斷對象包含了第二個調(diào)度程序例程所需要的信息,以便定位和正確地調(diào)用設(shè)備驅(qū)動程序提供的ISR。需要兩步過程的原因是自硬件完成初始調(diào)度后,沒有方法可以在初始調(diào)度上傳遞一個指向中斷對象的指針。 (3)軟件中斷 軟件也可以產(chǎn)生中斷,包括:啟動線程調(diào)度、處理定時器到時、在特定線程的描述表中異步執(zhí)行一個過程,以及支持異步I/O操作等。例如,內(nèi)核可以發(fā)布啟動線程調(diào)度的軟件中斷,內(nèi)核也可以禁用中斷以使處理器不被中斷,但這種情況很少出現(xiàn),只在處理中斷或調(diào)度異常的關(guān)鍵時刻才這樣做。軟件中斷由中斷調(diào)度程序的子模塊響應(yīng),它確定中斷源并將控制轉(zhuǎn)交給處理中斷的外部例程(ISR),或轉(zhuǎn)交給響應(yīng)中斷的內(nèi)核例程。 三.Windows CE如何進(jìn)行中斷處理? (1)Windows CE中斷處理流程 ①硬件設(shè)備向Kernel發(fā)送中斷異常的代碼,如果檢測到這個中斷異常,就會被Kernel層的異常處理所截獲。然后,中斷服務(wù)調(diào)度程序會調(diào)用OAL例程中的OEMInterruptDisable函數(shù),這個函數(shù)會通知硬件在處理完這一中斷前關(guān)閉特殊的中斷,但其它的中斷仍然處于開放狀態(tài),中斷服務(wù)例程ISR會被調(diào)用來決定如何處理這一中斷。 ②Kernel接收到ISR的返回值可得知如何處理這一中斷。它的響應(yīng)結(jié)果之一是忽略掉這一中斷不作處理(SYSINTR_NOP),或另一結(jié)果是準(zhǔn)備執(zhí)行IST。然后,Kernel引發(fā)中斷服務(wù)調(diào)度程序去喚醒中斷服務(wù)線程。IST是常規(guī)的Win32線程,一旦啟動后,它會創(chuàng)建必要的EVENT,然后等待該EVENT被激發(fā)。中斷服務(wù)調(diào)度通過調(diào)用PulseEvent函數(shù)來激發(fā)EVENT,從而喚醒IST線程運行。當(dāng)喚醒以后,IST會對中斷進(jìn)行處理。 ③當(dāng)IST處理完成后,還需要調(diào)用InterruptDone函數(shù)通知Kernel。Kernel則調(diào)用OEMInterruptDone函數(shù)完成此次中斷的處理過程。最后,OAL例程通知硬件設(shè)備重新啟用中斷。 (2)中斷處理涉及的幾個常用函數(shù) Windows CE在處理中斷時會涉及到兩類函數(shù)的使用,第一類是供OAL調(diào)用的ISR函數(shù),例如HookInterrupt函數(shù)在OEMInit函數(shù)中被調(diào)用以關(guān)聯(lián)IRQ和ISR,UnhookInterrupt函數(shù)用來終止IRQ和ISR的關(guān)聯(lián)。第二類是供驅(qū)動程序調(diào)用的IST函數(shù),例如InterruptInitialize函數(shù)用來將EVENT對象和邏輯中斷號關(guān)聯(lián)并允許中斷,InterruptDone函數(shù)用來通知中斷處理的結(jié)束,InterruptDisable函數(shù)被驅(qū)動程序調(diào)用以關(guān)閉中斷同時取消被InterruptInitialize初始化的EVENT對象。 ISR函數(shù)屬于OAL層,它將CPU寄存器中的數(shù)據(jù)移動到內(nèi)存緩沖區(qū)中,但是它不能做更多的工作,其中一個原因是它不能訪問用戶態(tài)的存儲區(qū),它要把這些工作交給IST來完成。ISR函數(shù)做的另一項工作是進(jìn)行物理中斷號和邏輯中斷號的映射。經(jīng)過ISR后,就能把這一物理中斷轉(zhuǎn)換成Windows CE標(biāo)準(zhǔn)的SYSINTR_KEYBOARD邏輯中斷。Kernel會根據(jù)這個邏輯中斷值找到對應(yīng)的EVENT,從而喚醒IST。 最后,需要提醒一下的是,常常有一些開發(fā)人員習(xí)慣拖延或忽視陷阱調(diào)度的編寫。因為輕視陷阱調(diào)度這一壞習(xí)慣是如此常見,它甚至已經(jīng)影響到了Windows CE系統(tǒng)的研發(fā)。因此,建議從開始時就應(yīng)該著手進(jìn)行陷阱調(diào)度研發(fā)和計劃,應(yīng)該投入大精力把陷阱調(diào)度的策略融合到嵌入式產(chǎn)品中。 |