1 引言 近年來,我國電力通信網絡的發展迅速。但是,與此相對應的監視、控制、維護能力卻較落后.電力通信網絡的運行存在維護難度大,響應速度慢,服務質量差,人力成本和管理成本高,維護工作不透明,不量化,不主動等問題,使之無法適應現代化和自動化的總體需求。為徹底解決上述問題,需要開發和建設綜合化、集中化、智能化的網管系統,以提升電力通信網的綜合化集中維護水平,變被動維護為主動維護,變面向設備為面向客戶、面向業務,從而有效提高客戶服務質量、業務響應能力和網絡管控能力嘲。為了有效防止因采集和處理來自交換、傳輸、數據、動力環境等專業網的海量告警數據,保證關注告警,確保快速發現、定位和處理故障,必須設計和實施有效的告警過濾機制。為此,通過詳細分析告警數據,提出了一種新的告警過濾模型和策略。將告警過濾規則以知識庫的形式存儲,使網管人員直接參與規則的定制和維護,大大減少了綜合化集中維護系統的成本,提高系統的靈活性。 2 告警相關性 2.1 告警相關性分析 告警相關性分析是指合并和轉化告警,即將多個告警合并成一條具有更多信息量的告警,以確定能否反應故障根本原因的告警,并準確定位故障。告警事件關聯可形式化定義為告警事件a與告警事件集合{a1,a2,…,ak}關聯,表示為:a=>a{a1,a2,…,ak}。 告警事件關聯的類型可形式化定義為:①告警壓縮;②告警過濾;③告警抑制;④告警記數;⑤告警泛化;⑥告警特化;⑦告警時序關系。其具體定義形式參見參考文獻。 2.2 告警相關性方法 傳統的告警相關性分析方法主要有:一是通過實驗,人為制造一些故障并記錄導致的告警信息;二是充分利用電信領域專家平時維護通信網積累的經驗和知識。為了克服傳統方法人為因素不確定性的缺陷,目前采用的告警關聯方法有范例推理法、模糊邏輯法、貝葉斯網絡法、神經網絡法、規則法、關聯規則挖掘法等。 2.3 知識庫 知識的獲取源自知識工程師、智能編輯程序和歸納學習程序。其一,領域專家通過與知識工程師的反復接觸、交談,把自己擁有的知識告訴給知識工程師,由知識工程師和專家一起將這些知識歸納整理成專家系統知識。其二,通過智能編輯程序將專家的經驗知識送到專家系統知識庫中。該程序應具備靈活的人機對話能力和有關知識庫結構方面的知識。其三,通過歸納和總結大量的實驗數據,得到一些新的規律和知識。利用歸納學程序,模擬人類思維過程,以便從有關知識庫中發現新知識,然后將這些新知識添加到知識庫中,供專家系統使用。在此,基于歸納學習和知識工程師編寫智能程序,自動形成關聯規則,將其寫入知識庫。 3 告警過濾機制設計 3.1 告警過濾功能和目標 告警過濾的主要功能有支持告警收斂功能、支持告警次數的閾值越界告警功能、支持告警延時功能、支持制定網元和時間段進行忽略性過濾功能、支持屏蔽衍生告警功能及支持告警呈現過濾功能。 告警過濾機制的目標是:①設計合理的告警過濾機制,以實現快速、準確的過濾瞬斷告警、無效告警和次要告警,從而有效防止告警風暴,保證關注告警,降低故障時延,提高系統的穩定性、適應性和軟件質量,增強客戶滿意度;②能快速地確定故障位置,快速地進行故障處理和故障恢復;③改善網絡性能和網絡管理員工作。 3.2 告警過濾模型 為保證告警過濾的正確性、有效性和靈活性,系統采用多層過濾機制。圖1給出多層過濾模型。其中,采集層的過濾策略主要是抑制和忽略。它依據設定的過濾規則,對原始告警數據實施預過濾,屏蔽無用或無需關心的告警數據,以減輕數據處理負荷。處理層過濾是整個過濾機制中的重點。主要用于建立高度收斂的告警過濾模型。其基本流程是:原始告警數據經過采集層過濾后開始分流,并進行延時、閉值、歸并、壓縮等處理.以對濾掉不關心的告警數據。過濾策略是可修正的,經過修正后的策略進行前轉,對此后的告警數據實施新的策略。表現層過濾按照告警屬性域設定組合條件,過濾出關心的告警類型。發布層過濾根據設定的過濾規則,從而決定相關信息的發布形式、時間及內容等。 4 實驗與分析 告警壓縮率=(系統采集的告警總數一系統呈現的告警總數)/系統采集的告警總數。采用告警壓縮率體現告警過濾效果。對某本地電力通信網網管綜合化集中維護系統的用戶提供的統計數據進行測試,測試時間為10 h,測試規則滿足瞬斷告警不入庫,重復告警歸并,較低級別告警不呈現的原則。表1給出測試結果。需說明的是,在計算告警壓縮率時,關聯告警中只計算了根告警數量,而系統呈現的告警數量中沒有計入衍生告警數量。 由實驗結果可見,經過模型過濾后,電力通信網發布的告警數量明顯降低,這說明了該方法的有效性。另外,由此還可見,告警主要來源于交換告警和數據方面,因此應關注這兩個方面告警數據的關聯性研究。 5 結語 采用數據挖掘技術獲取告警關聯規則,構建了告警規則知識庫,形成了用于實際系統的較完整的告警過濾機制及實現方案。該過濾機制能依據告警的重要程度不同,分別從采集層、處理層、呈現層、發布層對告警逐層收斂,從而實現快速、準確地過濾瞬斷告警、無效告警和次要告警,以防止告警風暴,保證關注告警,并快速發現、定位和處理故障,降低故障時延,提高客戶響應速度,改進服務質量。實驗證明了該告警過濾機制的實用性和有效性。 |