專利名稱:網(wǎng)絡(luò)管理系統(tǒng)中的告警消息處理方法及網(wǎng)絡(luò)管理系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信網(wǎng)絡(luò)領(lǐng)域中的網(wǎng)絡(luò)管理技術(shù)領(lǐng)域,尤其涉及一種網(wǎng)絡(luò)管理系統(tǒng)中的告警消息處理方法及網(wǎng)絡(luò)管理系統(tǒng)。
背景技術(shù):
通信網(wǎng)絡(luò)的特點是規(guī)模大、結(jié)構(gòu)復(fù)雜、異構(gòu)性、高度分布。在網(wǎng)絡(luò)管理技術(shù)領(lǐng)域,故障被定義為產(chǎn)生功能異常的原因。故障是產(chǎn)生告警的原因,告警消息是特定的事件發(fā)生時, 被管對象發(fā)出的事件通知,用于傳遞告警信息。無論是早期的國際電信聯(lián)盟ITU提出的TMN(Telecom ManagementNetwork,電信管理網(wǎng))規(guī)范,還是后來3GPP(3rd Generation Partnership Project,第三代合作伙伴計劃)提出的通信網(wǎng)絡(luò)管理接口定義,都對網(wǎng)元設(shè)備側(cè)和網(wǎng)絡(luò)管理系統(tǒng)側(cè)的告警數(shù)據(jù)接口進(jìn)行了規(guī)范。通常各通信設(shè)備廠家提供的原始告警信息包括網(wǎng)元名稱、告警標(biāo)題、告警級別、 設(shè)備廠家、告警正文、發(fā)生時間等信息,通信網(wǎng)管系統(tǒng)根據(jù)需要進(jìn)行細(xì)分、重定義或直接使用?,F(xiàn)有的告警消息的處理流程如圖1所示,包括步驟S101、告警信息采集步驟從網(wǎng)元設(shè)備上采集原始告警信息,并生成攜帶告警信息的告警消息。步驟S102、告警消息過濾步驟將采集到的各告警消息中的無效或無用告警消息進(jìn)行簡單的過濾,具體的過濾規(guī)則一般可以根據(jù)業(yè)務(wù)需要制定。步驟S103、告警消息處理步驟將告警消息中的原始告警信息進(jìn)行翻譯、規(guī)范,以及告警消息關(guān)聯(lián)定位和告警消息派單等操作。通過對告警消息的處理,例如通過交易中間件或者其他中間件的方式進(jìn)行處理,可以將各廠家的原始告警信息進(jìn)行規(guī)范和二次處理, 從而形成符合日常告警監(jiān)控人員習(xí)慣和需要的告警信息,實現(xiàn)盡量消除廠家差異的集中監(jiān)控。本步驟是告警消息處理的核心步驟。步驟S104、告警信息的呈現(xiàn)將對告警消息處理后得到的處理結(jié)果,如規(guī)范后的各告警信息,呈現(xiàn)給告警監(jiān)控人員。具體可以通過處理界面的形式進(jìn)行呈現(xiàn),供告警監(jiān)控人員了解告警信息,以實現(xiàn)進(jìn)一步針對該告警的后續(xù)處理。由于告警信息是通信網(wǎng)絡(luò)管理中最基本的也是最重要的信息類型之一,所以告警監(jiān)控和對告警消息的處理就越發(fā)的非常重要。然而,當(dāng)網(wǎng)絡(luò)發(fā)生大量的設(shè)備維護(hù)(如網(wǎng)絡(luò)擴(kuò)容或者割接)或設(shè)備故障中斷時,就會在短時間內(nèi)出現(xiàn)大量的告警,其數(shù)量大大超出平
時的告警數(shù)量。根據(jù)通信網(wǎng)絡(luò)管理監(jiān)控的實際情況,業(yè)內(nèi)普遍認(rèn)可的告警消息處理能力要求為告警消息平均處理時延的要求告警平均處理時延<=20秒;告警消息平均處理時延=SUM(告警入庫時間-告警接收時間)/網(wǎng)管系統(tǒng)入庫告警消息的數(shù)量;系統(tǒng)峰值處理能力的要求系統(tǒng)峰值處理能力>=5條/萬TPCC/秒;
峰值處理能力[條數(shù)/TPCC/秒]=告警消息總數(shù)量/TPCC值/總耗時(秒)。當(dāng)短時間內(nèi)出現(xiàn)大量的告警,使得有大量的告警消息需要處理時,則由于網(wǎng)絡(luò)管理系統(tǒng)處理告警消息的能力的限制,出現(xiàn)無法滿足上述處理要求的情況,從而影響到網(wǎng)絡(luò)管理系統(tǒng)正常的告警監(jiān)控和告警消息處理時,即認(rèn)定發(fā)生“告警風(fēng)暴”。一般情況下,對于上述圖1所示的告警消息的處理流程,在告警信息采集步驟,可以通過分布式部署、分區(qū)域采集的方式來實現(xiàn)負(fù)荷分擔(dān),并且在該步驟的處理邏輯比較簡單,僅進(jìn)行基本的數(shù)據(jù)拆分,在實際中極少在這一步驟出現(xiàn)處理任務(wù)的積壓。通過簡單的告警消息過濾步驟,可以在平時告警消息數(shù)量相對正常的情況下滿足告警消息處理的及時性和準(zhǔn)確性要求,但是一旦出現(xiàn)“告警風(fēng)暴”,面對短時間內(nèi)大量告警消息的沖擊,將在告警消息處理步驟,出現(xiàn)大量待處理的告警消息的積壓,嚴(yán)重降低了告警消息的處理效率和及時性。目前現(xiàn)有技術(shù)中,針對“告警風(fēng)暴”情況的處理,可以通過丟棄采集到的告警消息, 或者通過減少采集告警信息的頻次,減少需要處理的告警消息的數(shù)量,緩解告警消息處理的壓力,但可能導(dǎo)致對突發(fā)故障的告警失去監(jiān)控,降低了對告警監(jiān)控的完整性,同時會影響監(jiān)控人員的監(jiān)控和后續(xù)的分析定位;還可以通過增加處理告警消息的處理資源,以提高對告警消息處理的效率,但是在未出現(xiàn)“告警風(fēng)暴”情況時,大量處理資源的閑置導(dǎo)致處理資源的利用率較低;并且,在“告警風(fēng)暴”情況發(fā)生時,還可以由于待處理的告警消息的積壓, 導(dǎo)致嚴(yán)重故障引起的告警消息無法得到及時處理,進(jìn)而使得由于未及時監(jiān)控到嚴(yán)重故障引起的告警,而未能及時對嚴(yán)重故障進(jìn)行處理,導(dǎo)致整個通信網(wǎng)絡(luò)的性能下降。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種網(wǎng)絡(luò)管理系統(tǒng)中的告警消息處理方法及網(wǎng)絡(luò)管理系統(tǒng),用以實現(xiàn)對告警消息的分類處理,以避免因某一類的待處理的告警消息的積壓導(dǎo)致其它類的告警消息無法得到及時的處理。本發(fā)明實施例提供一種網(wǎng)絡(luò)管理系統(tǒng)中的告警消息處理方法,包括將采集到的網(wǎng)元設(shè)備的告警消息,緩存到與所述告警消息的類型對應(yīng)的告警隊列中;對各告警隊列中分別緩存的不同類型的告警消息進(jìn)行并行處理。本發(fā)明實施例還提供一種處理告警消息的網(wǎng)絡(luò)管理系統(tǒng),包括告警接收緩存裝置,用于將采集到的網(wǎng)元設(shè)備的告警消息,緩存到與所述告警消息的類型對應(yīng)的告警隊列中;告警處理裝置,應(yīng)用于對各告警隊列中分別緩存的不同類型的告警消息進(jìn)行并行處理。本發(fā)明實施例提供的方法中,對于采集到的網(wǎng)元設(shè)備的告警消息,按照告警消息的類型的不同,分別緩存到與其類型對應(yīng)的告警隊列中,并對各告警隊列中分別緩存的不同類型的告警消息進(jìn)行并行處理。從而實現(xiàn)了對告警消息的分類處理,進(jìn)而當(dāng)某一類的待處理的告警消息較多時,并不會影響對其它類的告警消息的及時處理;并且,通過對各告警隊列中的告警消息進(jìn)行并行處理,提高了處理告警消息的效率。
圖1為現(xiàn)有技術(shù)中的告警消息的處理流程圖;圖2為本發(fā)明實施例中提供的網(wǎng)絡(luò)管理系統(tǒng)中的告警消息處理方法的流程圖;圖3為本發(fā)明實施例1中提供的告警消息處理方法的流程圖;圖4為本發(fā)明實施例2中提供的告警消息處理方法的流程圖;圖5為本發(fā)明實施例3中提供的告警消息處理方法的流程圖;圖6為本發(fā)明實施例4中提供的告警消息處理方法的流程圖;圖7為本發(fā)明實施例5中提供的處理告警消息的網(wǎng)絡(luò)管理系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施例方式為了給出實現(xiàn)對告警消息的分類處理,以避免因某一類的待處理的告警消息的積壓導(dǎo)致其它類的告警消息無法得到及時的處理的方案,本發(fā)明實施例提供了一種網(wǎng)絡(luò)管理系統(tǒng)中的告警消息處理方法及網(wǎng)絡(luò)管理系統(tǒng),以下結(jié)合說明書附圖對本發(fā)明的優(yōu)選實施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。并且在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。本發(fā)明實施例提供一種網(wǎng)絡(luò)管理系統(tǒng)中的告警消息處理方法,如圖2所示,包括步驟S201、將采集到的網(wǎng)元設(shè)備的告警消息,緩存到與所述告警消息的類型對應(yīng)的告警隊列中。步驟S202、對各告警隊列中分別緩存的不同類型的告警消息進(jìn)行并行處理。下面結(jié)合附圖,用具體實施例對本發(fā)明提供的方法和相應(yīng)系統(tǒng)進(jìn)行詳細(xì)描述。實施例1 基于對目前網(wǎng)絡(luò)管理系統(tǒng)中采集到的告警消息的分析發(fā)現(xiàn),在對通信網(wǎng)絡(luò)中的某一干線進(jìn)行工程處理時,例如,工程建設(shè)和工程調(diào)試等,由于涉及到較多網(wǎng)元設(shè)備的改動, 所以將采集到大量這些網(wǎng)元設(shè)備的告警信息,導(dǎo)致出現(xiàn)大量相關(guān)的告警消息需要進(jìn)行處理,可將這些告警消息稱作工程類告警消息,工程類告警消息也是目前通信網(wǎng)絡(luò)中出現(xiàn)“告警風(fēng)暴”情況的一個重要原因。工程類告警消息在短時間內(nèi)的急劇增加,將導(dǎo)致對告警消息處理的整體效率的降低,并且影響了對其它類告警消息的及時處理。所以,本發(fā)明實施例1中提出將工程類告警消息與非工程類告警消息進(jìn)行分類并行處理的方案,如圖3所示,具體包括步驟S301、從網(wǎng)元設(shè)備上采集原始告警信息,并生成攜帶告警信息的告警消息。步驟S302、判斷采集到的告警消息是否為工程類告警消息,如果是,進(jìn)入步驟 S303,否則,進(jìn)入步驟S304。本實施例1中,考慮到目前通信網(wǎng)絡(luò)中在進(jìn)行工程處理時,每個工程所涉及的網(wǎng)元設(shè)備是可預(yù)知的,并且,在采集的告警消息中均會攜帶產(chǎn)生告警的網(wǎng)元設(shè)備的標(biāo)識,還可能攜帶產(chǎn)生告警的網(wǎng)元設(shè)備的對端網(wǎng)元設(shè)備的標(biāo)識,所以,本步驟中,可以預(yù)先設(shè)置該工程處理涉及的各網(wǎng)元設(shè)備的標(biāo)識為指定網(wǎng)元設(shè)備標(biāo)識,并在判斷時,根據(jù)告警消息中是否攜帶指定網(wǎng)元設(shè)備標(biāo)識,確定告警消息是否為工程類告警消息。步驟S303、將工程類告警消息緩存到與工程類對應(yīng)的告警隊列中,具體還可以針對每個工程處理建立告警隊列,將與每個工程處理相關(guān)的告警消息分別緩存到與該工程處理對應(yīng)的告警隊列中。步驟S304、將非工程類告警消息緩存到與非工程類對應(yīng)的告警隊列中。步驟S305、對與工程類對應(yīng)的告警隊列中的工程類告警消息和與非工程類對應(yīng)的告警隊列中的非工程類告警消息,進(jìn)行并行處理。具體可以將不同的告警隊列部署在同一個處理服務(wù)器上,也可以分別部署在不同的告警服務(wù)器上。本實施例1中,考慮到工程類告警消息是產(chǎn)生“報警風(fēng)暴”的主要告警消息,所以, 在對工程類告警消息進(jìn)行處理時,為了提高處理效率,還可以采用動態(tài)負(fù)載均衡機(jī)制對工程類告警消息進(jìn)行處理,即當(dāng)與工程類對應(yīng)的告警隊列中的工程類告警消息的數(shù)量超過設(shè)定數(shù)量閾值時,增加處理工程類告警消息的處理資源,實現(xiàn)處理效率的提高。步驟S306、將對告警消息的進(jìn)行處理后得到的處理結(jié)果,呈現(xiàn)給告警監(jiān)控人員。上述實施例1提供的告警消息處理方法中,基于工程類告警消息是產(chǎn)生“告警風(fēng)暴”的主要類型的告警消息,提出針對工程類告警消息和非工程類告警消息分類并行處理的方案,避免了因工程類告警消息的急劇增加,導(dǎo)致對非工程類告警消息的處理不夠及時, 并且,通過動態(tài)負(fù)載均衡機(jī)制,提高對工程類告警消息的處理效率,能夠快速消除“告警風(fēng)
顯”
萊 ο實施例2 基于對目前網(wǎng)絡(luò)管理系統(tǒng)中采集到的告警消息的分析發(fā)現(xiàn),當(dāng)通信網(wǎng)絡(luò)中的某一網(wǎng)元設(shè)備出現(xiàn)重大故障時,則與該網(wǎng)元設(shè)備相關(guān)的各種業(yè)務(wù)處理任務(wù)由于處理異常,而產(chǎn)生大量的告警消息,例如,通信網(wǎng)絡(luò)中的某一 L局設(shè)備發(fā)生重大故障,則各地市均將產(chǎn)生大量的與該L局設(shè)備相關(guān)的告警消息,如目的信令點不可達(dá)告警,可將這些由于網(wǎng)元設(shè)備出現(xiàn)重大故障而產(chǎn)生的告警消息稱作重大故障累告警消息,重大故障類告警消息也是目前通信網(wǎng)絡(luò)中出現(xiàn)“告警風(fēng)暴”情況的一個重要原因。重大故障類告警消息在短時間內(nèi)的急劇增加,將導(dǎo)致對該重大故障類告警消息處理的效率的降低,并且也影響了對其它類告警消息的及時處理。所以,本發(fā)明實施例2中提出將重大故障類告警消息與非重大故障類告警消息進(jìn)行分類并行處理的方案,如圖4所示,具體包括步驟S401、從網(wǎng)元設(shè)備上采集原始告警信息,并生成攜帶告警信息的告警消息。步驟S402、判斷采集到的告警消息是否為重大故障類告警消息,如果是,進(jìn)入步驟 S403,否則,進(jìn)入步驟S404。本實施例2中,考慮到目前通信網(wǎng)絡(luò)中大量的重大故障類告警消息一般都攜帶有發(fā)生故障的網(wǎng)元設(shè)備的標(biāo)識,即均會攜帶相同網(wǎng)元設(shè)備標(biāo)識,所以,本步驟中,可以通過對當(dāng)前緩存有告警消息的非重大故障類告警隊列中的告警消息中攜帶的網(wǎng)元設(shè)備標(biāo)識進(jìn)行分析,當(dāng)當(dāng)前緩存有告警消息的非重大故障類告警隊列中攜帶某一相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量超過第一設(shè)定數(shù)量閾值時,即可確定出該相同網(wǎng)元設(shè)備標(biāo)識,從而基于該相同網(wǎng)元設(shè)備標(biāo)識,對于后續(xù)采集到的告警消息的判斷,則將攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,確定為重大故障類告警消息,對于未攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,確定為非重大故障類告警消息。
即上述判斷步驟具體為當(dāng)未確定出用于確定重大故障類告警消息的該相同網(wǎng)元設(shè)備標(biāo)識時,將采集到的告警消息,確定為非重大故障類告警消息,以及當(dāng)已確定出用于重大故障類告警消息的該相同網(wǎng)元設(shè)備標(biāo)識時,將未攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,也確定為非重大故障類告警消息;當(dāng)已確定出用于重大故障類告警消息的該相同網(wǎng)元設(shè)備標(biāo)識時,將攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,確定為重大故障類告警消息。實質(zhì)上,基于上述對工程類告警消息的分析可知,各工程類告警消息同樣存在攜帶有某一相同網(wǎng)元設(shè)備標(biāo)識的特點,所以,基于上述是否攜帶有確定出的該相同網(wǎng)元設(shè)備標(biāo)識作為判斷條件,所確定出的重大故障類告警消息,可能包括工程類告警消息,但本實施例2中將工程類告警消息歸屬為重大故障類告警消息,并不影響方案的實現(xiàn)和技術(shù)效果的獲得。步驟S403、將重大故障類告警消息緩存到與重大故障類對應(yīng)的告警隊列中。具體還可以針對確定出的各相同網(wǎng)元設(shè)備標(biāo)識分別建立對應(yīng)的告警隊列,將攜帶每個相同網(wǎng)元設(shè)備標(biāo)識的告警消息,分別緩存到與該相同網(wǎng)元設(shè)備標(biāo)識對應(yīng)的告警隊列中。通過對確定出的不同的該相同網(wǎng)元設(shè)備標(biāo)識建立對應(yīng)的告警隊列,實質(zhì)上,即實現(xiàn)了對工程類告警消息和重大故障類告警消息的分類并行處理。較佳的,本步驟還可以包括當(dāng)確定出該相同網(wǎng)元設(shè)備標(biāo)識時,即確定出重大故障類告警消息的判定條件時,還可以將當(dāng)前緩存有告警消息的非重大故障類告警隊列中攜帶該相同網(wǎng)元設(shè)備的告警消息,遷移到與重大故障類對應(yīng)的告警隊列中,并且可以將遷移的重大故障類告警消息排列在告警隊列的前面,以便盡快得到處理。步驟S404、將非重大故障類告警消息緩存到與非重大故障類對應(yīng)的告警隊列中。步驟S405、對與重大故障類對應(yīng)的告警隊列中的重大故障類告警消息和與非重大故障類對應(yīng)的告警隊列中的非重大故障類告警消息,進(jìn)行并行處理,即對各不同告警隊列中的告警消息進(jìn)行并行處理。具體可以將不同的告警隊列部署在同一個處理服務(wù)器上,也可以分別部署在不同的告警服務(wù)器上。本實施例2中,考慮到重大故障類告警消息是產(chǎn)生“報警風(fēng)暴”的主要告警消息, 所以,在對重大故障類告警消息進(jìn)行處理時,為了提高處理效率,還可以采用動態(tài)負(fù)載均衡機(jī)制對重大故障類告警消息進(jìn)行處理,即當(dāng)與重大故障類對應(yīng)的告警隊列中的重大故障類告警消息的數(shù)量超過第二設(shè)定數(shù)量閾值時,增加處理重大告警類告警消息的處理資源,實現(xiàn)處理效率的提高。在處理重大故障類告警消息的同時,還可以判斷當(dāng)前與重大故障類對應(yīng)的告警隊列中的重大故障類告警消息的數(shù)量是否小于第三設(shè)定數(shù)量閾值,或者判斷當(dāng)前單位時間段內(nèi)緩存到與重大故障類對應(yīng)的告警隊列中的告警消息的數(shù)量是否小于第四設(shè)定數(shù)量閾值, 如果小于,則表示由該重大故障類告警消息引起的“告警風(fēng)暴”情況已經(jīng)消除,可以進(jìn)入正常告警消息的處理環(huán)節(jié),即更改上述步驟S402中對重大故障告警消息的判斷條件,清除該相同網(wǎng)元設(shè)備標(biāo)識,即對采集到的告警消息均確定為非重大故障類告警消息。步驟S406、將對告警消息的進(jìn)行處理后得到的處理結(jié)果,呈現(xiàn)給告警監(jiān)控人員。
8
上述實施例2提供的告警消息處理方法中,基于重大故障類告警消息是產(chǎn)生“告警風(fēng)暴”的主要類型的告警消息,提出針對重大故障類告警消息和非重大故障類告警消息分類并行處理的方案,提高了對重大故障類告警消息的處理的及時性,且還可以避免因重大故障類告警消息的急劇增加,導(dǎo)致對非重大故障類告警消息的處理不夠及時,并且,通過動態(tài)負(fù)載均衡機(jī)制,可以進(jìn)一步的提高對重大故障類告警消息的處理效率,快速消除“告警風(fēng)暴”。實施例3 基于上述實施例1和實施例2中分別對工程類告警消息和重大故障類告警消息的分析可知,工程類告警消息和重大故障類告警消息為產(chǎn)生“告警風(fēng)暴”的主要告警消息,所以,本發(fā)明實施例3提出將告警消息劃分為重大故障類告警消息、工程類告警消息和其它告警消息(即非重大故障類也非工程類的告警消息),進(jìn)行分類并行處理的方案,處理流程圖為圖5,具體包括步驟S501、從網(wǎng)元設(shè)備上采集原始告警信息,并生成攜帶告警信息的告警消息。步驟S502、判斷采集到的告警消息是否為重大故障類告警消息,如果是,進(jìn)入步驟 S503,否則,進(jìn)入步驟S504?;谏鲜鰧嵤├?中對重大故障類告警消息的分析,且為了區(qū)分重大故障類告警消息和工程類告警消息,上述判斷步驟具體可以如下對于上述實施例2中步驟S402中,通過判斷當(dāng)前緩存有告警消息的非重大故障類告警隊列中攜帶某一相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量是否超過第一設(shè)定數(shù)量閾值,確定出的用于確定重大故障類告警消息的相同網(wǎng)元設(shè)備標(biāo)識,還需要滿足該相同網(wǎng)元設(shè)備標(biāo)識與指定網(wǎng)元設(shè)備標(biāo)識不同(指定網(wǎng)元設(shè)備標(biāo)識用于確定工程類告警消息);當(dāng)未確定出用于確定重大故障類告警消息的該相同網(wǎng)元設(shè)備標(biāo)識時,將采集到的告警消息,確定為非重大故障類告警消息,以及當(dāng)已確定出用于重大故障類告警消息的該相同網(wǎng)元設(shè)備標(biāo)識時,將未攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,也確定為非重大故障類告警消息;當(dāng)已確定出用于重大故障類告警消息的該相同網(wǎng)元設(shè)備標(biāo)識時,將攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,確定為重大故障類告警消息。步驟S503、將重大故障類告警消息緩存到與重大故障類對應(yīng)的告警隊列中。具體還可以針對確定出的各相同網(wǎng)元設(shè)備標(biāo)識分別建立對應(yīng)的告警隊列,將攜帶每個相同網(wǎng)元設(shè)備標(biāo)識的告警消息,分別緩存到與該相同網(wǎng)元設(shè)備標(biāo)識對應(yīng)的告警隊列中。通過對確定出的不同的該相同網(wǎng)元設(shè)備標(biāo)識建立對應(yīng)的告警隊列,實質(zhì)上,即實現(xiàn)了對工程類告警消息和重大故障類告警消息的分類并行處理。較佳的,本步驟還可以包括當(dāng)確定出該相同網(wǎng)元設(shè)備標(biāo)識時,即確定出重大故障類告警消息的判定條件時,還可以將當(dāng)前緩存有告警消息的非重大故障類告警隊列中攜帶該相同網(wǎng)元設(shè)備的告警消息,遷移到與重大故障類對應(yīng)的告警隊列中。步驟S504、判斷采集到的非重大故障類告警消息是否為工程類告警消息,如果是, 進(jìn)入步驟S505,否則,進(jìn)入步驟S506。具體可以預(yù)先設(shè)置工程處理涉及的各網(wǎng)元設(shè)備的標(biāo)識為指定網(wǎng)元設(shè)備標(biāo)識,并在判斷時,根據(jù)告警消息中是否攜帶指定網(wǎng)元設(shè)備標(biāo)識,確定告警消息是否為工程類告警消肩、ο步驟S505、將工程類告警消息緩存到與工程類對應(yīng)的告警隊列中,具體還可以針對每個工程處理建立告警隊列,將與每個工程處理相關(guān)的告警消息分別緩存到與該工程處理對應(yīng)的告警隊列中。步驟S506、將其它告警消息緩存到與其它類對應(yīng)的告警隊列中。步驟S507、對與重大故障類對應(yīng)的告警隊列中的重大故障類告警消息,與工程類對應(yīng)的告警隊列中的工程類類告警消息,以及與其它類對應(yīng)的告警隊列中的其它告警消息,進(jìn)行并行處理,即對各不同告警隊列中的告警消息進(jìn)行并行處理。具體可以將不同的告警隊列部署在同一個處理服務(wù)器上,也可以分別部署在不同的告警服務(wù)器上。本實施例3中,考慮到重大故障類告警消息是產(chǎn)生“報警風(fēng)暴”的主要告警消息, 且重大故障類告警消息處理的及時性要求更高,所以,在對重大故障類告警消息進(jìn)行處理時,為了提高處理效率,還可以采用動態(tài)負(fù)載均衡機(jī)制對重大故障類告警消息進(jìn)行處理,即當(dāng)與重大故障類對應(yīng)的告警隊列中的重大故障類告警消息的數(shù)量超過第二設(shè)定數(shù)量閾值時,增加處理重大告警類告警消息的處理資源,實現(xiàn)處理效率的提高。在處理重大故障類告警消息的同時,還可以判斷當(dāng)前與重大故障類對應(yīng)的告警隊列中的重大故障類告警消息的數(shù)量是否小于第三設(shè)定數(shù)量閾值,或者判斷當(dāng)前單位時間段內(nèi)緩存到與重大故障類對應(yīng)的告警隊列中的告警消息的數(shù)量是否小于第四設(shè)定數(shù)量閾值, 如果小于,則表示由該重大故障類告警消息引起的“告警風(fēng)暴”情況已經(jīng)消除,可以進(jìn)入正常告警消息的處理環(huán)節(jié),即更改上述步驟S502中對重大故障告警消息的判斷條件,清除該相同網(wǎng)元設(shè)備標(biāo)識,即對采集到的告警消息均確定為非重大故障類告警消息。步驟S508、將對告警消息的進(jìn)行處理后得到的處理結(jié)果,呈現(xiàn)給告警監(jiān)控人員。上述實施例3提供的告警消息處理方法中,基于重大故障類告警消息和工程類告警消息是產(chǎn)生“告警風(fēng)暴”的主要類型的告警消息,提出針對重大故障類告警消息、工程類告警消息和其它類告警消息分類并行處理的方案,提高了對重大故障類告警消息和工程類告警消息的處理的及時性,快速消除“告警風(fēng)暴”,并且,通過動態(tài)負(fù)載均衡機(jī)制,可以進(jìn)一步的提高對重大故障類告警消息的處理效率。實施例4 基于對目前網(wǎng)絡(luò)管理系統(tǒng)中采集到的告警消息的分析發(fā)現(xiàn),從告警消息所指示的告警信息的性質(zhì),可以劃分為兩大類,一類是由于網(wǎng)元設(shè)備故障或異常產(chǎn)生的告警消息,另一類是當(dāng)之前的產(chǎn)生的告警已清除后,產(chǎn)生的指示該告警已清除的告警消息,可以將第一類告警消息稱為非清除類告警消息,將第二類告警消息稱為清除類告警消息?;谏鲜龇治隹芍扛婢⒅袑⒋嬖诮话氲那宄惛婢?,而清除類告警消息相對非清除類告警消息而言,其處理的及時性要求相對較低。并且,在由于非清除類告警消息在短時間內(nèi)急劇增加而產(chǎn)生“告警風(fēng)暴”,并在故障解除或工程結(jié)束后,雖然非清除類告警消息的數(shù)量將降低,但與之前產(chǎn)生“告警風(fēng)暴”的非清除類告警消息相關(guān)的清除類告警消息將大量產(chǎn)生,進(jìn)而使得“告警風(fēng)暴”狀況仍將持續(xù)。并且,由于存在大量清除類告警消息需要處理,將導(dǎo)致對后續(xù)采集到的非清除類告警消息無法及時處理。所以,本發(fā)明實施例4提出將告警消息劃分為清除類告警消息和非清除類告警消息,進(jìn)行分類并行處理的方案,處理流程圖為圖6,具體包括步驟S601、從網(wǎng)元設(shè)備上采集原始告警信息,并生成攜帶告警信息的告警消息。步驟S602、判斷采集到的告警消息是否為清除類告警消息,如果是,進(jìn)入步驟 S603,否則,進(jìn)入步驟S604。具體可以通過告警消息中攜帶的清除類指示信息進(jìn)行判斷,如果告警消息中攜帶有清除類指示信息,則確定該告警消息為清除類告警消息,否則,確定為非清除類告警消肩、O步驟S603、將清除類告警消息緩存到清除類告警隊列中。步驟S604、本實施例4中,對于非清除類告警消息進(jìn)一步的進(jìn)行劃分,考慮到對于目前網(wǎng)絡(luò)管理系統(tǒng)中采集到的告警消息已進(jìn)行了級別劃分,從高到低劃分為四級,而最低級別類告警消息(即第四級告警消息)一般為指示類和事件通知類的告警消息,例如,指示某一網(wǎng)元設(shè)備的某一處理任務(wù)的當(dāng)前處理階段等,對該最低級別類告警消息的處理及時性一般要求較低,而該最低級別類告警消息在非清除類告警消息中所占的比重又很大,所以, 為了提高對非最低級別類告警消息處理的及時性,本步驟中對非清除類告警消息,進(jìn)一步劃分為最低級別類告警消息和非最低級別類告警消息,并進(jìn)行分類并行處理,具體為判斷采集到的非清除類告警消息是否為最低級別類告警消息,如果是,進(jìn)入步驟 S605,否則,進(jìn)入步驟S606。具體可以基于告警消息中的級別指示信息進(jìn)行判斷,當(dāng)告警消息中攜帶的級別指示信息為最低級別指示信息時,則確定該告警消息為最低級別類告警消息,否則,為非最低級別類告警消息。步驟S605、將最低級別類告警消息緩存到最低級別類告警隊列中。步驟S606、本實施例4中,對于非最低級別類告警消息,還可以進(jìn)一步將其劃分為重大故障類告警消息、工程類告警消息和其它類告警消息。判斷非最低級別類告警消息是否為重大故障類告警消息,如果是,進(jìn)入步驟S607、 否則,進(jìn)入步驟S608。具體的判斷方式可采用上述實施例3中的相同方式,在此不再進(jìn)行描述。步驟S607、將重大故障類告警消息緩存到重大故障類告警隊列中。步驟S608、判斷非重大故障類告警消息是否為工程類告警消息,如果是,進(jìn)入步驟 S609、否則,進(jìn)入步驟S610。具體的判斷方式可采用上述實施例3中的相同方式,在此不再進(jìn)行描述。步驟S609、將工程類告警消息緩存到工程類告警隊列中。步驟S610、將其它類告警消息緩存到其它類告警隊列中。步驟S611、對清除類告警隊列、最低級別類告警隊列、重大故障類告警隊列、工程類告警隊列和其它類告警隊列中的告警消息,進(jìn)行并行處理,即對各不同告警隊列中的告警消息進(jìn)行并行處理。具體可以將不同的告警隊列部署在同一個處理服務(wù)器上,也可以分別部署在不同的告警服務(wù)器上。其中,對于重大故障類告警隊列中的重大故障類告警消息的處理,可以采用與上述實施例3中相同的具體方式,以便提高對重大故障類告警消息處理的及時性,快速消除“告警風(fēng)暴”,在此不再進(jìn)行詳細(xì)描述。步驟S612、將對告警消息的進(jìn)行處理后得到的處理結(jié)果,呈現(xiàn)給告警監(jiān)控人員。上述實施例4提供的告警消息處理方法中,首先將告警消息劃分為清除類告警消息和非清除類告警消息,并對非清除類告警消息又進(jìn)一步劃分為最低級別類告警消息和非最低級別類告警消息,并對非最低級別類告警消息又進(jìn)一步劃分為重大故障類告警消息和非重大故障類告警消息,并對非重大故障類告警消息又進(jìn)一步劃分為工程類告警消息和其它類告警消息,并基于上述告警消息的類型的劃分,實現(xiàn)了對告警消息的分類處理,進(jìn)而當(dāng)某一類的待處理的告警消息較多時,并不會影響對其它類別的告警消息的及時處理;并且, 通過對告警隊列中的告警消息進(jìn)行并行處理,提高了處理告警消息的效率。實施例5:基于同一發(fā)明構(gòu)思,根據(jù)本發(fā)明上述實施例提供的網(wǎng)絡(luò)管理系統(tǒng)中的告警消息處理方法,相應(yīng)地,本發(fā)明實施例5還提供了一種處理告警消息的網(wǎng)絡(luò)管理系統(tǒng),其結(jié)構(gòu)示意圖如圖7所示,具體包括告警接收緩存裝置701,用于將采集到的網(wǎng)元設(shè)備的告警消息,緩存到與該告警消息的類型對應(yīng)的告警隊列中;告警處理裝置702,應(yīng)用于對各告警隊列中分別緩存的不同類型的告警消息進(jìn)行并行處理。較佳的,告警接收緩存裝置701,具體用于將采集到的未攜帶指定網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到第一告警隊列中,并將采集到的攜帶指定網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到第二告警隊列中;和/或當(dāng)當(dāng)前緩存有告警消息的告警隊列中攜帶相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量超過第一設(shè)定數(shù)量閾值時,將后續(xù)采集到的攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到第三告警隊列中;第一告警隊列、第二告警隊列和第三告警隊列為分別不同的告警隊列。較佳的,告警接收緩存裝置701,還用于當(dāng)當(dāng)前緩存有告警消息的告警隊列中攜帶相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量超過第一設(shè)定數(shù)量閾值時,將當(dāng)前緩存有告警消息的告警隊列中攜帶該相同網(wǎng)元設(shè)備的告警消息,遷移到第三告警隊列中。較佳的,告警處理裝置702,具體用于當(dāng)?shù)谌婢犃兄械母婢⒌臄?shù)量超過第二設(shè)定數(shù)量閾值時,增加處理第三告警隊列中的告警消息的處理資源,對第三告警隊列中的告警消息進(jìn)行處理。較佳的,告警接收緩存裝置701,具體用于將采集到的清除類告警消息,緩存到清除類告警隊列中;并將采集到的非清除類告警消息,緩存到非清除類告警隊列中,清除類告警消息為指示告警已清除的告警消息。較佳的,告警接收緩存裝置701,具體用于將采集到的非清除類告警消息中的最低級別類告警消息,緩存到非清除類告警隊列中的最低級別類告警隊列中;并將采集到的非清除類告警消息中的非最低級別類告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中。較佳的,告警接收緩存裝置701,具體用于將采集到的非清除類告警消息中的非最低級別類告警消息中的未攜帶指定網(wǎng)元設(shè)備設(shè)備標(biāo)識的告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中的第一告警隊列中;并將采集到的非清除類告警消息中的非最低級別類告警消息中的攜帶指定網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中的第二告警隊列中;和/或當(dāng)當(dāng)前緩存有告警消息的非清除類告警隊列中的非最低級別類告警隊列中,攜帶相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量超過第一設(shè)定數(shù)量閾值時,將后續(xù)采集到的非清除類告警消息中的非最低級別類告警消息中的攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中的第三告警隊列中。綜上所述,本發(fā)明實施例提供的方案,包括將采集到的網(wǎng)元設(shè)備的告警消息,緩存到與所述告警消息的類型對應(yīng)的告警隊列中;并對各告警隊列中分別緩存的不同類型的告警消息進(jìn)行并行處理。采用本發(fā)明實施例提供的方案,實現(xiàn)了對告警消息的分類處理,并避免了因某一類的待處理的告警消息的積壓導(dǎo)致其它類的告警消息無法得到及時的處理。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權(quán)利要求
1.一種網(wǎng)絡(luò)管理系統(tǒng)中的告警消息處理方法,其特征在于,包括將采集到的網(wǎng)元設(shè)備的告警消息,緩存到與所述告警消息的類型對應(yīng)的告警隊列中;對各告警隊列中分別緩存的不同類型的告警消息進(jìn)行并行處理。
2.如權(quán)利要求1所述的方法,其特征在于,將采集到的網(wǎng)元設(shè)備的告警消息,緩存到與所述告警消息的類型對應(yīng)的告警隊列中,具體包括將采集到的未攜帶指定網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到第一告警隊列中;并將采集到的攜帶指定網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到第二告警隊列中;和/或當(dāng)當(dāng)前緩存有告警消息的告警隊列中攜帶相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量超過第一設(shè)定數(shù)量閾值時,將后續(xù)采集到的攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到第三告警隊列中;所述第一告警隊列、所述第二告警隊列和所述第三告警隊列為分別不同的告警隊列。
3.如權(quán)利要求2所述的方法,其特征在于,當(dāng)當(dāng)前緩存有告警消息的告警隊列中攜帶相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量超過第一設(shè)定數(shù)量閾值時,還包括將當(dāng)前緩存有告警消息的告警隊列中攜帶該相同網(wǎng)元設(shè)備的告警消息,遷移到所述第三告警隊列中。
4.如權(quán)利要求2或3所述的方法,其特征在于,對所述第三告警隊列中緩存的告警消息進(jìn)行處理,具體包括當(dāng)所述第三告警隊列中的告警消息的數(shù)量超過第二設(shè)定數(shù)量閾值時,增加處理所述第三告警隊列中的告警消息的處理資源,對所述第三告警隊列中的告警消息進(jìn)行處理。
5.如權(quán)利要求1所述的方法,其特征在于,將采集到的網(wǎng)元設(shè)備的告警消息,緩存到與所述告警消息的類型對應(yīng)的告警隊列中,具體包括將采集到的清除類告警消息,緩存到清除類告警隊列中,所述清除類告警消息為指示告警已清除的告警消息;并將采集到的非清除類告警消息,緩存到非清除類告警隊列中。
6.如權(quán)利要求5所述的方法,其特征在于,將采集到的非清除類告警消息,緩存到非清除類告警隊列中,具體包括將采集到的非清除類告警消息中的最低級別類告警消息,緩存到非清除類告警隊列中的最低級別類告警隊列中;并將采集到的非清除類告警消息中的非最低級別類告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中。
7.如權(quán)利要求6所述的方法,其特征在于,將采集到的非清除類告警消息中的非最低級別類告警消息中,緩存到非清除類告警隊列中的非最低級別類告警隊列中,具體包括將采集到的非清除類告警消息中的非最低級別類告警消息中的未攜帶指定網(wǎng)元設(shè)備設(shè)備標(biāo)識的告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中的第一告警隊列中;并將采集到的非清除類告警消息中的非最低級別類告警消息中的攜帶指定網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中的第二告警隊列中;和/或當(dāng)當(dāng)前緩存有告警消息的非清除類告警隊列中的非最低級別類告警隊列中,攜帶相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量超過第一設(shè)定數(shù)量閾值時,將后續(xù)采集到的非清除類告警消息中的非最低級別類告警消息中的攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中的第三告警隊列中。
8.一種處理告警消息的網(wǎng)絡(luò)管理系統(tǒng),其特征在于,包括告警接收緩存裝置,用于將采集到的網(wǎng)元設(shè)備的告警消息,緩存到與所述告警消息的類型對應(yīng)的告警隊列中;告警處理裝置,應(yīng)用于對各告警隊列中分別緩存的不同類型的告警消息進(jìn)行并行處理。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述告警接收緩存裝置,具體用于將采集到的未攜帶指定網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到第一告警隊列中,并將采集到的攜帶指定網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到第二告警隊列中;和/或當(dāng)當(dāng)前緩存有告警消息的告警隊列中攜帶相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量超過第一設(shè)定數(shù)量閾值時,將后續(xù)采集到的攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到第三告警隊列中;所述第一告警隊列、所述第二告警隊列和所述第三告警隊列為分別不同的告警隊列。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述告警接收緩存裝置,還用于當(dāng)當(dāng)前緩存有告警消息的告警隊列中攜帶相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量超過第一設(shè)定數(shù)量閾值時,將當(dāng)前緩存有告警消息的告警隊列中攜帶該相同網(wǎng)元設(shè)備的告警消息,遷移到所述第三告警隊列中。
11.如權(quán)利要求9或10所述的系統(tǒng),其特征在于,所述告警處理裝置,具體用于當(dāng)所述第三告警隊列中的告警消息的數(shù)量超過第二設(shè)定數(shù)量閾值時,增加處理所述第三告警隊列中的告警消息的處理資源,對所述第三告警隊列中的告警消息進(jìn)行處理。
12.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述告警接收緩存裝置,具體用于將采集到的清除類告警消息,緩存到清除類告警隊列中;并將采集到的非清除類告警消息,緩存到非清除類告警隊列中,所述清除類告警消息為指示告警已清除的告警消息。
13.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述告警接收緩存裝置,具體用于將采集到的非清除類告警消息中的最低級別類告警消息,緩存到非清除類告警隊列中的最低級別類告警隊列中;并將采集到的非清除類告警消息中的非最低級別類告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中。
14.如權(quán)利要求13所述的系統(tǒng),其特征在于,所述告警接收緩存裝置,具體用于將采集到的非清除類告警消息中的非最低級別類告警消息中的未攜帶指定網(wǎng)元設(shè)備設(shè)備標(biāo)識的告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中的第一告警隊列中;并將采集到的非清除類告警消息中的非最低級別類告警消息中的攜帶指定網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中的第二告警隊列中;和 /或當(dāng)當(dāng)前緩存有告警消息的非清除類告警隊列中的非最低級別類告警隊列中,攜帶相同網(wǎng)元設(shè)備標(biāo)識的告警消息的數(shù)量超過第一設(shè)定數(shù)量閾值時,將后續(xù)采集到的非清除類告警消息中的非最低級別類告警消息中的攜帶該相同網(wǎng)元設(shè)備標(biāo)識的告警消息,緩存到非清除類告警隊列中的非最低級別類告警隊列中的第三告警隊列中。
全文摘要
本發(fā)明公開了一種網(wǎng)絡(luò)管理系統(tǒng)中的告警消息處理方法及系統(tǒng),涉及通信網(wǎng)絡(luò)領(lǐng)域中的網(wǎng)絡(luò)管理技術(shù)領(lǐng)域,包括將采集到的網(wǎng)元設(shè)備的告警消息,緩存到與所述告警消息的類型對應(yīng)的告警隊列中;并對各告警隊列中分別緩存的不同類型的告警消息進(jìn)行并行處理。采用本發(fā)明實施例提供的方案,實現(xiàn)了對告警消息的分類處理,并避免了因某一類的待處理的告警消息的積壓導(dǎo)致其它類的告警消息無法得到及時的處理。
文檔編號H04L12/24GK102546216SQ20101061494
公開日2012年7月4日 申請日期2010年12月30日 優(yōu)先權(quán)日2010年12月30日
發(fā)明者劉軼蘇, 宋春詠, 李渝燕, 林琳, 王呈雪, 胡立全, 陳剛, 馬英香 申請人:中國移動通信集團(tuán)山東有限公司