現代計算機系統的規模越來越龐大,越來越復雜,導致計算機系統的可靠性保障的難度也越來越大。因此,計算機系統的可靠性已為社會所廣泛關注。面對這種形勢,國際上越來越重視軟件可靠性工程理論的研究發展,將軟件質量管理逐漸納入規范化、科學化的軌道。軟件可靠性工程也逐漸在信息技術、可靠性工程、用戶需求等綜合因素的作用下發展起來,并形成了一門綜合眾多學科的成果以解決軟件可靠性為出發點的邊緣學科。 軟件可靠性工程主要研究對象為軟件產品或系統的失效發生原因、消除和預防措施,以保證軟件產品的可靠性和可用性,降低維護費用,提高軟件產品的用效益。軟件可靠性已經成為軟件業界和可靠性工程界關注的焦點、研究的熱點、實踐的重點。 1 軟件可靠性數據 不同的軟件錯誤、缺陷及其故障在表現形式、性質乃至數量方面可能大相徑庭,對其進行全面、詳細的闡述是非常困難的,也是不客觀、不現實的。但是現實中,為了簡單易行,通常假設軟件可靠性模型所有失效等級相同,或屬于同一類,即不再區分軟件錯誤、缺陷及其故障。如果要區分失效等級和失效類型,將隨之帶來很多問題。例如,同一模型是否適用于不同類型的失效數據;由于分類后各類失效數據樣本一般極少,將會影響模型給出結果的精度。因此一般情況下,不再對失效數據進行分類。 經典的軟件可靠性模型有1)1972年,Jelinski和Moranda首次提出了軟件可靠性模型的概念,并建立了具體的可靠性模型——J-M模型[4-5]; (2)1973年,Littlewood和Verall采用Bayes方法進行軟件可靠性測試;(3)1979年,Goel和Okumoto提出了改進J-M模型的非齊次泊松過程模型,即G-O模型;(4)1983年,Yamada和Osaki發現錯誤數在預測初期增長緩慢隨后快速增長,最后趨于飽和,即延時S形增長模型,稱為Y-O模型。 任意選取一組如表1所示的MUSA J M的軟件可靠性數據,使用筆者開發的軟件可靠性預測系統,驗證上述4個軟件可靠性模型,得到的擬合曲線如圖1所示。由圖可以看出,由于原始的軟件可靠性數據間隔時間的不平穩性,導致其最終預測結果產生極大的誤差,特別是在波峰波谷處。 通過對大量軟件可靠性數據的研究分析發現,軟件發生缺陷的間隔時間具有較大的波動性,而這也正是導致其預測結果誤差較大的主要原因。描繪其波動性趨勢,構建軟件可靠性數據的波動模型,是解決問題的關鍵。 2 軟件可靠性數據的預處理 為解決上述問題,本研究將軟件可靠性數據分解成獨立的兩部分數據。一部分描繪軟件可靠性數據的總體趨勢;另外一部分描繪軟件可靠性數據隨時間的波動趨勢。通過兩部分數據的分別預測和組合,得到最終的可靠性結果。 設軟件失效間隔時間分別為:x(1),x(2),…x(n),失效時間分別為:t(1),t(2),…t(n),其中t(i)為軟件開始運行到第i次失效發生的時間,x(i)為軟件第i-1次失效到第i次失效發生的時間間隔,即x(i)=t(i)-t(i-1)。 假定t時刻的軟件可靠性數據M(t)=P(t)+Q(t),其中P(t)用來描繪軟件可靠性數據的總體趨勢,Q(t)用來描繪軟件可靠性數據隨缺陷出現的波動趨勢。 按上述算法,對表1所列數據進行處理得出表2結果。 表2所估算的預測數據P(t)的時間間隔曲線如圖2所示。由圖可以看出,其整個趨勢相對于原始數據相對平穩,且其大致趨勢與原始數據曲線趨同。 根據原始數據與預測數據P(t)的差值曲線,尋找并預測Q(t)的變化規律。由圖3可以看出,對于波動程度的取值,必須要考慮波動的正負和波動的幅度兩方面因素。 同樣根據早期數據對預測未來行為作用很小,而現時失效間隔數據可以比更早之前觀測的失效間隔數值更好地預測未來這個原理,本研究選取Q(t)之前的5個失效數據點進行波動值Q(t)的預測。 首先根據之前5個點波幅4次正負切換的次數,預測時刻t相對于上一時刻t-1波幅的異號或同號的可能性。 波動的幅度通過取5個點的振幅絕對值平均值得到。同時可以發現對于點Q(t-1)的振幅與Q(t)的預測也有較大聯系,假設Q(t)=a×Q(t)+b×|Q(t-1)|,a取值0.7,b取值0.3。 按照上述算法,將估算的P(1)…P(t-1)值代入軟件可靠性模型,得到P(t),最終得到時刻t的預測時間P′(t)+Q(t)。 3 算法驗證 (1)使用Littlewood-Verall模型對P(t)進行運算,根據P(t)…P(t-1)求得預測的P′(t),結果如表3所示。 定義可靠性模型評價標準: 剔除失效數據點1、2、3,其他的14個失效數據點RE的為0.349 351,而初始的失效間隔的RE值為1.595?梢娡ㄟ^平穩處理失效數據點,可以得到更高的擬合度。 (2)求值Q′(t),按照之前算法,得到的值如表4所示。 由于前5個失效數據點的預測Q′(t)缺少有效的數據,所以計算ESS時,將其剔除,剔除后的點求得RE的值為1.23,相對于使用未經處理的點獲得的RE值(1.595)誤差減小近20%。同時,可以看到其產生誤差的主要原因是失效數據點11所導致的。MUSA J M軟件可靠性數據及最終預測數據如表5所示。 軟件可靠性評估日益受到重視,作為其核心的軟件可靠性模型理論的研究也勢必要深入下去。本文的研究開啟了軟件可靠性理論研究的入口,以后的研究除了對可靠性數據進行進一步處理外,也將對軟件可靠性模型進行進一步的改進。 本文在傳統方法僅關注軟件可靠性模型的基礎上,拓寬至對可靠性數據的預處理,提出了一種對軟件可靠性數據處理的新方法,解決了可靠性數據采集過程中出現波動性大的缺陷,而且算法簡單、穩健性好,可以適用于各種工程應用。但其中還有很多問題值得進一步研究,例如,如何實現新算法中Q(t)系數的自適應等。 |