專利名稱:報警管理系統(tǒng)的制作方法
技術(shù)領域:
本發(fā)明涉及對監(jiān)控系統(tǒng)中的報警(alarm)信號的管理。這種系統(tǒng)被 構(gòu)造為在出現(xiàn)超出預定值的情況、或指示故障的某些其它情況或需要關(guān) 注或記錄的其它情況時,從正被監(jiān)控的設備接收信號。
背景技術(shù):
在該報警管理環(huán)境中,出現(xiàn)故障的設備或服務通常會向該監(jiān)控系統(tǒng) 發(fā)出大量報警。為了以便于用戶理解的方式來記錄這些報警,通常將重 復報警記錄為單個事件,并采用遞增計數(shù)器(tally)來記錄事件出現(xiàn)的次 數(shù)。這使得用戶可以容易地識別生成大量報警的系統(tǒng)單元。這也使得從 大量報警中識別出來自僅作出一個或幾個報警的其它單元的報警更加容 易。
然而,過大數(shù)量的報警事件可能使系統(tǒng)負擔過重,并且可能無法合 理地處理(rationalise)這些事件洪流(event flood),從而導致生成大量 的事件報告。如果不在源頭盡快地停止這些事件洪流,則它們將對該報 警管理系統(tǒng)產(chǎn)生破壞性的影響。
已知其中應用過濾標準(filter criteria)來防止由具有預定特征的重 復報警而導致的過載的系統(tǒng)。然而,這需要對所要識別的過載狀況進行 預特征化。
發(fā)明內(nèi)容
本發(fā)明通過識別和限制事件洪流來避免上述情況的發(fā)生。根據(jù)本發(fā)
明,提供了一種針對事件報告對系統(tǒng)進行監(jiān)控的方法,其中,傳送事件
報告并將其存儲在第一數(shù)據(jù)庫中,并且其中,通過監(jiān)控該第一數(shù)據(jù)庫以 識別具有其在所述第一數(shù)據(jù)庫中的出現(xiàn)超出了預定洪流閾值的特征的事件報告,來識別數(shù)據(jù)洪流狀況,所述特征被存儲在第二數(shù)據(jù)庫中,并且 其中,通過從所述第二數(shù)據(jù)庫獲取所存儲的特征以識別具有所獲取的特
征的后續(xù)事件報告,來抑制(contain)所述數(shù)據(jù)洪流狀況。
根據(jù)另一方面,提供了一種事件監(jiān)控系統(tǒng),該事件監(jiān)控系統(tǒng)包括 第一數(shù)據(jù)庫,其用于接收和存儲來自一個或更多個外部系統(tǒng)的事件報告; 洪流識別裝置,其用于監(jiān)控所述第一數(shù)據(jù)庫以識別具有其在所述第一數(shù) 據(jù)庫中的出現(xiàn)超出預定洪流閾值的特征的事件報告;第二數(shù)據(jù)庫,其用 于存儲所述特征;以及洪流抑制裝置,其包括用于從所述第二數(shù)據(jù)庫獲 取所存儲的特征的裝置,以及對具有所獲取的特征的后續(xù)事件報告進行 識別的裝置。
因此,該系統(tǒng)的操作基于兩個并行線程,即,洪流識別(flood identification)和洪流抑制(flood containment)。一旦已經(jīng)檢測到事件洪 流,則可以通過從該第一數(shù)據(jù)庫中清除具有所述特征的事件報告,來從 該監(jiān)控系統(tǒng)中去除來自特定組件和設備的任意報警。
可以周期性進行該識別處理和抑制處理。優(yōu)選的是,該抑制處理比 識別處理更頻繁。
可以針對向該系統(tǒng)報告的不同設備來設定不同的洪流閾級,此外(以 較低的級別來)針對這些設備的單個單元設定不同的洪流閾級。根據(jù)所 報告事件的性質(zhì),可以采用向人工操作員報警的形式或采用僅對事件洪 流進行記錄的形式來進行對該事件洪流的報告。
在優(yōu)選設置中,通過具有預定特征的事件報告來生成發(fā)生了超出預 定洪流閾值的報告,使得不是生成大量的單個報警,而是生成或遞增通 知該事件洪流本身的單個報警。
參照附圖,將通過示例的方式來對本發(fā)明的實施方式進行描述,在 附圖中
圖1例示了彼此協(xié)作以形成本發(fā)明的各種單元以及在各個單元之間 的消息流。
圖2是例示了洪流識別處理的流程圖。 圖3是例示了洪流抑制處理的流程圖。
具體實施例方式
首先,參照圖l,圖中示出了監(jiān)控數(shù)據(jù)庫12和抑制數(shù)據(jù)庫13。根據(jù) 相應的控制處理器11和15,在相應的時鐘10和14的控制下以循環(huán)方式 對數(shù)據(jù)庫12和13中的每一個進行監(jiān)控。各個控制處理器11和15使用 從這些數(shù)據(jù)庫中的一個數(shù)據(jù)庫(分別是12和13)獲得的數(shù)據(jù),來修改另 一數(shù)據(jù)庫(分別是13和12)中的數(shù)據(jù),如下所述。
當故障報警20發(fā)生時,被監(jiān)控的系統(tǒng)16向監(jiān)控數(shù)據(jù)庫12傳送故障 報警20。發(fā)生故障的單元或其它問題可能導致傳送大量的這種報警。這 可能使數(shù)據(jù)庫12過載,從而導致數(shù)據(jù)丟失。此外,即使該數(shù)據(jù)庫沒有過 載,用戶也很難從來自發(fā)生故障的單元的大量報警報告中識別出來自其 它單元的任意單個報警。
根據(jù)本發(fā)明的系統(tǒng)以在圖2和圖3中詳細示出的兩個分離但相關(guān)的 處理(即,洪流識別(步驟20-29)和洪流抑制(步驟31-39))進行操作。 (圖1中的對角點劃線將這些處理彼此分隔開)。這些處理在相應的時鐘 10和14的控制下以不同的周期獨立地進行操作。通常,該抑制處理的時 鐘周期(dock cycle) 21每15秒進行操作,而該識別處理的時鐘周期31 以較低的頻度(例如,1分鐘)進行操作。
圖2更詳細地示出了洪流識別處理。最初,設置閾值(步驟20)。 根據(jù)報警的源、報警的嚴重性和其它標準來將閾值設置為不同的值。通 過來自時鐘10的信號21來啟動該洪流識別處理本身,響應于該操作, 獲得監(jiān)控數(shù)據(jù)庫12的當前狀態(tài)的快照(snapshot) 22。然后,通過根據(jù) 事件的特征簽名對事件進行分組并對事件進行計數(shù),來針對可能的事件 洪流對快照進行分析23。這種簽名通常包括與事件的源、事件的嚴重性 以及從該事件的前一次發(fā)生開始所經(jīng)過的時間有關(guān)的信息。
然后,更新抑制數(shù)據(jù)庫13。首先,清除在前一周期中生成的數(shù)據(jù)(步 驟24)。然后,依次獲取具有公共簽名的各個事件組(步驟25、 28),并
對這些事件組進行分析(步驟26)。然后,將滿足在初始化處理20中設 定的洪流閾值標準的任意組記錄在抑制數(shù)據(jù)庫13中(步驟27)。
圖3更詳細地示出了洪流抑制處理。通過來自時鐘14的信號31啟 動該洪流抑制處理。通常,該時鐘信號比識別處理的時鐘信號的頻度高。 該處理響應于該時鐘,獲得存儲在抑制數(shù)據(jù)庫13中的任意事件洪流的簽 名(步驟32)。然后,該處理依次對由它們的簽名所識別的事件洪流中的 每一個進行處理(步驟33、 39)。針對各個簽名,處理器15通過獲得與 當前考慮的事件洪流的簽名匹配的新的任意事件,來修改監(jiān)控數(shù)據(jù)庫12 中的數(shù)據(jù)(步驟34)。依次對該洪流中的各個這種事件進行處理(步驟 35、 38)。對于各個這種事件,抑制處理器15都會生成計數(shù)器或?qū)τ嫈?shù) 器進行遞增(步驟36),并且可以在從監(jiān)控數(shù)據(jù)庫12中刪除該事件(步 驟37)以前,發(fā)送信號以將該問題通知給相關(guān)保障人員。
通過這種方式,可以通過將分離系統(tǒng)36專門構(gòu)造為對與事件洪流相 關(guān)的大量數(shù)據(jù)進行處理,來清除監(jiān)控數(shù)據(jù)庫12中的與事件洪流相關(guān)的大 量數(shù)據(jù)。這使得監(jiān)控數(shù)據(jù)庫12可以更有效地處理其余數(shù)據(jù)。
權(quán)利要求
1、一種針對事件報告對系統(tǒng)進行監(jiān)控的方法,其中,傳送事件報告并將其存儲在第一數(shù)據(jù)庫中,并且其中,通過監(jiān)控所述第一數(shù)據(jù)庫以識別具有其在所述第一數(shù)據(jù)庫中的出現(xiàn)超出了預定洪流閾值的特征的事件報告,來識別數(shù)據(jù)洪流狀況,所述特征被存儲在第二數(shù)據(jù)庫中,并且其中,通過從所述第二數(shù)據(jù)庫獲取所存儲的特征以識別具有所獲取的特征的后續(xù)事件報告,來抑制所述數(shù)據(jù)洪流狀況。
2、 根據(jù)權(quán)利要求1所述的方法,其中,當已經(jīng)從所述第二數(shù)據(jù)庫獲 取所存儲的特征時,將具有所述特征的事件報告從所述第一數(shù)據(jù)庫中清 除。
3、 根據(jù)權(quán)利要求1或2所述的方法,其中,生成各個被抑制事件洪 流的報告。
4、 根據(jù)權(quán)利要求l、 2或3所述的方法,其中,周期性地進行所述 識別處理。
5、 根據(jù)權(quán)利要求l、 2、 3或4所述的方法,其中,周期性地進行所 述抑制處理。
6、 根據(jù)前述權(quán)利要求中的任意一項所述的方法,其中,所述抑制處 理比所述識別處理更頻繁。
7、 根據(jù)前述權(quán)利要求中的任意一項所述的方法,其中,針對向所述 系統(tǒng)進行報告的不同設備來設定不同的洪流閾級。
8、 根據(jù)前述權(quán)利要求中的任意一項所述的方法,其中,針對向所述 系統(tǒng)進行報告的多個完整設備并針對這些設備的單個組件來設定不同的 洪流閾級。
9、 一種事件監(jiān)控系統(tǒng),該事件監(jiān)控系統(tǒng)包括第一數(shù)據(jù)庫,其用于接收和存儲來自一個或更多個外部系統(tǒng)的事件 報告;洪流識別裝置,其用于監(jiān)控所述第一數(shù)據(jù)庫以識別具有其在所述第 一數(shù)據(jù)庫中的出現(xiàn)超出預定洪流閾值的特征的事件報告; 第二數(shù)據(jù)庫,其用于存儲所述特征;以及洪流抑制裝置,其包括用于從所述第二數(shù)據(jù)庫獲取所存儲的特征的 裝置,以及對具有所獲取的特征的后續(xù)事件報告進行識別的裝置。
10、 根據(jù)權(quán)利要求9所述的事件監(jiān)控系統(tǒng),該事件監(jiān)控系統(tǒng)還包括 用于當己經(jīng)從所述第二數(shù)據(jù)庫獲取所存儲的特征時,將具有所述特征的 事件報告從所述第 一數(shù)據(jù)庫中清除的裝置。
11、 根據(jù)權(quán)利要求9或10所述的事件監(jiān)控系統(tǒng),該事件監(jiān)控系統(tǒng)還 包括用于生成各個被抑制事件洪流的報告的裝置。
12、 根據(jù)權(quán)利要求9、 10或11所述的事件監(jiān)控系統(tǒng),該事件監(jiān)控系 統(tǒng)包括用于對所述洪流識別裝置的周期性操作進行控制的時鐘裝置。
13、 根據(jù)權(quán)利要求9、 10、 11或12所述的事件監(jiān)控系統(tǒng),該事件監(jiān) 控系統(tǒng)包括用于對所述洪流抑制裝置的周期性操作進行控制的時鐘裝 置。
14、 根據(jù)權(quán)利要求9、 10、 11、 12或13所述的事件監(jiān)控系統(tǒng),其中, 所述洪流識別裝置被設置為針對向所述系統(tǒng)進行報告的不同設備來設定 不同的洪流閾級。
15、 根據(jù)權(quán)利要求9、 10、 11、 12、 13或14所述的事件監(jiān)控系統(tǒng), 其中,所述洪流識別裝置被設置為針對向所述系統(tǒng)進行報告的多個完整 設備并針對這些設備的單個組件來設定不同的洪流閾級。
全文摘要
針對事件報告對系統(tǒng)進行監(jiān)控,傳送所述事件報告并將其存儲在第一數(shù)據(jù)庫(12)中。通過監(jiān)控所述第一數(shù)據(jù)庫(12)以識別具有其出現(xiàn)超出了預定洪流閾值的特征的事件報告,來識別數(shù)據(jù)洪流狀況,所述特征被存儲在第二數(shù)據(jù)庫(13)中。通過從所述第二數(shù)據(jù)庫(13)獲取所存儲的特征并從所述第一數(shù)據(jù)庫(12)中清除具有這些特征的事件報告,來抑制所述數(shù)據(jù)洪流狀況。
文檔編號H04L12/24GK101385002SQ200780005465
公開日2009年3月11日 申請日期2007年1月16日 優(yōu)先權(quán)日2006年2月16日
發(fā)明者奈杰爾·巴克, 布蘭登·肖恩·麥肯羅 申請人:英國電訊有限公司