嵌入式軟件中基于棧的錯(cuò)誤追蹤機(jī)制設(shè)計(jì)
嵌入式軟件開發(fā)往往缺乏必要的調(diào)試工具和調(diào)試手段,同時(shí)需要有較高的容錯(cuò)處理能力,程序正常運(yùn)行過程中盡量不因?yàn)槌霈F(xiàn)異常而導(dǎo)致系統(tǒng)停止。一旦發(fā)生錯(cuò)誤或異常,開發(fā)人員需要盡量多的錯(cuò)誤環(huán)境信息來查找問題的原因。從程序編寫的角度來講,一般嵌入式軟件都采用C語言開發(fā)。C語言本身的特點(diǎn)決定了無法利用語言本身的功能實(shí)現(xiàn)對(duì)異常的跟蹤與處理,只能通過良好的編程模型與習(xí)慣,以及后期的大量測(cè)試,來發(fā)現(xiàn)和解決異常。因此,如何進(jìn)一步提升程序開發(fā)中的可調(diào)試性,對(duì)于運(yùn)行中的異常如何保存現(xiàn)場(chǎng),從而方便進(jìn)行異常追蹤等,是開發(fā)者需要考慮的重要問題。本文針對(duì)嵌入式C語言開發(fā)的特點(diǎn),提出一種基于堆棧模式的異常追蹤編程模型,能夠?qū)崿F(xiàn)有效的異常現(xiàn)場(chǎng)保存與恢復(fù),并為后期的問題分析與解決打好基礎(chǔ)。同時(shí),本文所提出的思路亦可作為實(shí)際運(yùn)行階段提升可調(diào)試性的一種手段應(yīng)用于嵌入式軟件編程中,最大限度實(shí)現(xiàn)對(duì)于異常發(fā)生環(huán)境的保存與定位,提升系統(tǒng)的可維護(hù)性。 1 建立全局錯(cuò)誤代碼表 對(duì)于嵌入式軟件來說,盡量節(jié)省內(nèi)存資源、降低程序代碼量是十分重要的。因此,將程序中所有錯(cuò)誤、異常情況都進(jìn)行了統(tǒng)一編碼,提高了錯(cuò)誤處理代碼的規(guī)范化與可讀性。設(shè)計(jì)8位整數(shù)編碼格式如下: 每個(gè)錯(cuò)誤代碼在程序中僅需要1個(gè)字節(jié)進(jìn)行存儲(chǔ)。對(duì)于程序中每個(gè)可能異常的地方(如COM1沒打開),都設(shè)定1個(gè)唯一編號(hào),當(dāng)出現(xiàn)錯(cuò)誤或異常時(shí)根據(jù)該編號(hào)可以直接定位到源程序?qū)?yīng)文件和程序段,并確定錯(cuò)誤類型。 采用錯(cuò)誤代碼的形式存儲(chǔ)錯(cuò)誤信息,不僅可以精確描述錯(cuò)誤的類型、位置等信息,還可以最大限度地節(jié)省寶貴的可執(zhí)行內(nèi)存資源,降低程序?qū)?nèi)存的需求。 2 建立全局異常堆棧 在一個(gè)復(fù)雜的嵌入式實(shí)時(shí)系統(tǒng)中,程序處理流程復(fù)雜,不同資源之間往往在操作上存在著交叉。當(dāng)出現(xiàn)程序錯(cuò)誤或異常時(shí),不能簡(jiǎn)單地退出程序,而是應(yīng)當(dāng)盡量將錯(cuò)誤處理掉,實(shí)在無法處理的錯(cuò)誤應(yīng)進(jìn)行記錄,但整個(gè)程序的運(yùn)行不應(yīng)當(dāng)中斷。對(duì)此,使用1個(gè)錯(cuò)誤堆棧來保存錯(cuò)誤信息。該棧用下面數(shù)組定義: ERROR_STACK為全局錯(cuò)誤棧類型定義,MainErrStack為全局棧實(shí)例,其元素個(gè)數(shù)由ERR_STACK_SIZE確定。ErrorParm為字符數(shù)組,當(dāng)錯(cuò)誤發(fā)生時(shí)可以依次保存函數(shù)的人口參數(shù)以及異常發(fā)生之前局部變量的值等。實(shí)際數(shù)組長(zhǎng)度ERR_ENV_LEN可以根據(jù)情況調(diào)整,一般情況下開發(fā)階段可以設(shè)置大一些,保證存放更多的錯(cuò)誤信息用于調(diào)試;進(jìn)入實(shí)際運(yùn)行階段可以適當(dāng)縮小該錯(cuò)誤環(huán)境棧長(zhǎng)度,減少內(nèi)存空間的占用。 為了確保錯(cuò)誤處理機(jī)制本身不會(huì)給程序引入新的異常,因此將堆棧的操作完全封裝為Push和Pop兩個(gè)函數(shù),并引入當(dāng)前堆棧指針stackCu-rrentPos(初始為一1表示堆棧為空,有效取值范圍為一1~ERR_STlACK_SIZE一1,該指針始終指向棧頂元素)。算法說明如下: 3 建立統(tǒng)一的錯(cuò)誤描述字典表 為了進(jìn)一步提高代碼規(guī)范化程度并降低內(nèi)存需求,可以將每種類型的錯(cuò)誤定義一個(gè)錯(cuò)誤描述保存在單獨(dú)的文件或緩沖區(qū)中。當(dāng)發(fā)生錯(cuò)誤時(shí),系統(tǒng)根據(jù)錯(cuò)誤代碼取出該錯(cuò)誤的詳細(xì)描述并顯示給用戶。以上操作可以封裝為ShowErrorMessage函數(shù),定義為Char*ShowErrorMessage(int errorId)。在錯(cuò)誤發(fā)生位置并不直接描述錯(cuò)誤信息的方法,不僅可以降低可執(zhí)行內(nèi)存需求,而且避免了由于不同開發(fā)者對(duì)錯(cuò)誤文字描述的差異而導(dǎo)致對(duì)用戶的提示信息不統(tǒng)一。例如錯(cuò)誤提示“數(shù)組越下界!代碼:53017010”,530即表示數(shù)組越下界異常,17表示編號(hào)為“17”的C源程序文件,010表示文件中第10個(gè)錯(cuò)誤位置。部分錯(cuò)誤代碼描述示例如表1所列。 4 應(yīng)用說明 下面以1個(gè)簡(jiǎn)單的例子來說明本文方法的運(yùn)行。假設(shè)程序需要提供1個(gè)通過GPRS發(fā)送數(shù)據(jù)的函數(shù)GprsSendData(char*ip,char*buf,int size),實(shí)現(xiàn)將buf緩沖區(qū)指定長(zhǎng)度為size的字符串通過TCP方式發(fā)送到給定IP地址。示例代碼如下: 由上面可以看出,可能出現(xiàn)錯(cuò)誤的位置都加入了錯(cuò)誤壓棧操作,當(dāng)GprsSendData函數(shù)的返回值為假時(shí),上級(jí)調(diào)用函數(shù)會(huì)繼續(xù)將其異常時(shí)的運(yùn)行狀態(tài)(局部變量、參數(shù)等)繼續(xù)壓棧,以此類推直到需要處理該異常的最頂級(jí)。開發(fā)人員后期調(diào)試時(shí)可以將棧頂元素依次出棧,構(gòu)成一條完整的函數(shù)調(diào)用鏈,比較容易找出上述產(chǎn)生ip為空串的根本原因。 在軟件開發(fā)階段及運(yùn)行的初期階段,適當(dāng)加大錯(cuò)誤堆棧容量,可以儲(chǔ)存更多信息輔助調(diào)試。隨著設(shè)備軟件可靠性、穩(wěn)定性的增加,在正式投入運(yùn)行后可以將異常棧設(shè)定為較小的容量,以降低存儲(chǔ)需求。 可以設(shè)想,若整個(gè)嵌入式軟件在開發(fā)中嚴(yán)格按照本文思路處理異常,應(yīng)當(dāng)可以很方便地進(jìn)行異常的查找與處理。當(dāng)嵌入式設(shè)備投入運(yùn)行后,定期對(duì)該設(shè)備的錯(cuò)誤棧進(jìn)行分析,對(duì)于棧中存儲(chǔ)的錯(cuò)誤信息進(jìn)行及時(shí)處理,可以迅速有效地增加設(shè)備軟件的運(yùn)行可靠性。一個(gè)經(jīng)過嚴(yán)格測(cè)試的設(shè)備在絕大多數(shù)情況下錯(cuò)誤棧應(yīng)為空。 結(jié)語 本文對(duì)于基于C語言的嵌入式軟件開發(fā)中的錯(cuò)誤追蹤機(jī)制進(jìn)行了詳細(xì)描述。該機(jī)制可以有效地降低軟件異常發(fā)生的概率,提升軟件的可靠性,減少開發(fā)成本。同時(shí),該機(jī)制亦可以用于正常開發(fā)階段的輔助調(diào)試中,在關(guān)鍵程序段將環(huán)境信息壓棧實(shí)現(xiàn)后期分析,也為改進(jìn)嵌入式軟件的調(diào)試手段提供了新的輔助思路。文中所述機(jī)制已經(jīng)在作者主持的電力GPRS集抄終端的軟件設(shè)計(jì)中得到了實(shí)際應(yīng)用,取得了良好的效果。 |