專利名稱:業(yè)務(wù)系統(tǒng)可用性評估方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及業(yè)務(wù)系統(tǒng)可用性評估方法及系統(tǒng)。
背景技術(shù):
隨著信息技術(shù)的反展,基于計算機(jī)軟件技術(shù)構(gòu)建的業(yè)務(wù)系統(tǒng)在社會經(jīng)濟(jì)運行中的 重要性越來越高,特別是在金融、通信、醫(yī)療和政務(wù)等行業(yè)。例如銀行的業(yè)務(wù)系統(tǒng)故障,儲蓄 和貸款等最基本的金融業(yè)務(wù)將無法展開;證券業(yè)務(wù)系統(tǒng)故障,每天數(shù)百億的股票和基金交 易將無法進(jìn)行;醫(yī)療業(yè)務(wù)系統(tǒng)故障,醫(yī)生將無法查閱病人的歷史病例和檢查數(shù)據(jù),甚至不能 開處方。業(yè)務(wù)系統(tǒng)的穩(wěn)定運行和持續(xù)可用,對于各行業(yè)順利開展各種業(yè)務(wù)是不可或缺的,因 此能夠?qū)I(yè)務(wù)系統(tǒng)的可用性進(jìn)行正確評估是極為重要的。圖1為業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)拓?fù)鋱D。如圖1所示,該業(yè)務(wù)系統(tǒng)包括柜臺終端、接入交換機(jī)、 核心交換機(jī)、服務(wù)器區(qū)接入交換機(jī)和用于提供業(yè)務(wù)服務(wù)的業(yè)務(wù)系統(tǒng)服務(wù)器。當(dāng)評估圖1所 示的業(yè)務(wù)系統(tǒng)的可用性時,現(xiàn)有技術(shù)中通常是分別對構(gòu)成業(yè)務(wù)系統(tǒng)的多個節(jié)點,即柜臺終 端、接入交換機(jī)、核心交換機(jī)、服務(wù)器區(qū)接入交換機(jī)和業(yè)務(wù)系統(tǒng)服務(wù)器的性能指標(biāo)或故障狀 態(tài)進(jìn)行評估,并通過將評估結(jié)果進(jìn)行簡單累加來評估當(dāng)前業(yè)務(wù)系統(tǒng)的可用性。當(dāng)利用上述方法評估系統(tǒng)的可用性時,僅將業(yè)務(wù)系統(tǒng)的可用性作為多個節(jié)點的簡 單集合,并未考慮節(jié)點之間的關(guān)聯(lián)性。但在實際應(yīng)用中,例如圖1中的第一核心交換機(jī)Al 和第二核心交換機(jī)A2組成雙核心冗余結(jié)構(gòu),如果第一核心交換機(jī)Al宕機(jī),則只會導(dǎo)致第一 業(yè)務(wù)系統(tǒng)服務(wù)器H、第二業(yè)務(wù)系統(tǒng)服務(wù)器N和第三業(yè)務(wù)系統(tǒng)服務(wù)器M的可用性存在隱患;如 果第二核心交換機(jī)A2也宕機(jī),則會導(dǎo)致第一業(yè)務(wù)系統(tǒng)服務(wù)器H、第二業(yè)務(wù)系統(tǒng)服務(wù)器N和第 三業(yè)務(wù)系統(tǒng)服務(wù)器M完全不能訪問;如果第二服務(wù)器區(qū)接入交換機(jī)C與第二業(yè)務(wù)系統(tǒng)服務(wù) 器N之間的鏈路斷開,則只有第二業(yè)務(wù)系統(tǒng)服務(wù)器N無法訪問,而第一業(yè)務(wù)系統(tǒng)服務(wù)器H和 第三業(yè)務(wù)系統(tǒng)服務(wù)器M可正常運用??梢钥闯?,業(yè)務(wù)系統(tǒng)中節(jié)點間的關(guān)系與系統(tǒng)可用性之 間存在密切關(guān)聯(lián),按照上述現(xiàn)有技術(shù)中的評估方法不能夠準(zhǔn)確獲知業(yè)務(wù)系統(tǒng)的當(dāng)前真實狀 態(tài)。
發(fā)明內(nèi)容
針對上述缺陷,本發(fā)明提供一種業(yè)務(wù)系統(tǒng)可用性評估方法及系統(tǒng),用以實現(xiàn)業(yè)務(wù) 系統(tǒng)可用性的有效、準(zhǔn)確評估。本發(fā)明提供的業(yè)務(wù)系統(tǒng)可用性評估方法包括監(jiān)測業(yè)務(wù)系統(tǒng)中網(wǎng)元故障事件,根據(jù)預(yù)設(shè)規(guī)則獲取網(wǎng)元的健康分值,所述網(wǎng)元包 括節(jié)點和鏈路;根據(jù)節(jié)點在業(yè)務(wù)系統(tǒng)路徑中出現(xiàn)的次數(shù)獲取節(jié)點的權(quán)重;根據(jù)鏈路關(guān)聯(lián)節(jié)點獲取鏈路的權(quán)重;根據(jù)所述網(wǎng)元的健康分值和所述網(wǎng)元的權(quán)重按照預(yù)定算法評估業(yè)務(wù)系統(tǒng)可用性。本發(fā)明提供的業(yè)務(wù)系統(tǒng)可用性評估系統(tǒng)包括
健康分值計算模塊,用于監(jiān)測業(yè)務(wù)系統(tǒng)中各網(wǎng)元故障事件,根據(jù)預(yù)設(shè)規(guī)則獲取網(wǎng) 元的健康分值,所述網(wǎng)元包括節(jié)點和鏈路;節(jié)點權(quán)重計算模塊,根據(jù)節(jié)點在業(yè)務(wù)系統(tǒng)路徑中出現(xiàn)的次數(shù)獲取節(jié)點的權(quán)重;鏈路權(quán)重計算模塊,用于根據(jù)鏈路關(guān)聯(lián)節(jié)點獲取鏈路的權(quán)重;業(yè)務(wù)系統(tǒng)可用性評估模塊,用于根據(jù)所述網(wǎng)元的健康分值和所述網(wǎng)元的權(quán)重按照 預(yù)定算法評估業(yè)務(wù)系統(tǒng)可用性。根據(jù)本發(fā)明的業(yè)務(wù)系統(tǒng)可用性評估方法及系統(tǒng),由于不僅通過監(jiān)測節(jié)點和鏈路的 故障事件獲取網(wǎng)元的健康分值,還通過分析業(yè)務(wù)系統(tǒng)中各網(wǎng)元之間的關(guān)聯(lián)性,即業(yè)務(wù)系統(tǒng) 的路徑,根據(jù)各網(wǎng)元對于業(yè)務(wù)系統(tǒng)可用性的影響度的不同為各網(wǎng)元設(shè)置不同的權(quán)重,并結(jié) 合網(wǎng)元的權(quán)重及其健康分值來評估業(yè)務(wù)系統(tǒng)的可用性,所以能夠根據(jù)業(yè)務(wù)系統(tǒng)的具體架構(gòu) 對其當(dāng)前可用狀態(tài)進(jìn)行有效、準(zhǔn)確的評估。
圖1為業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)拓?fù)鋱D。圖2為本發(fā)明業(yè)務(wù)系統(tǒng)可用性評估方法的流程圖。圖3為廣度優(yōu)先遍歷算法的遍歷流程示意圖。圖4為本發(fā)明業(yè)務(wù)系統(tǒng)可用性評估系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖,對本發(fā)明的技術(shù) 方案進(jìn)行清楚、完整地描述。圖2為本發(fā)明業(yè)務(wù)系統(tǒng)可用性評估方法的流程圖。如圖2所示,該業(yè)務(wù)系統(tǒng)可用 性評估方法包括步驟S100,監(jiān)測業(yè)務(wù)系統(tǒng)中網(wǎng)元故障事件,根據(jù)預(yù)設(shè)規(guī)則獲取網(wǎng)元的健康分值,所 述網(wǎng)元包括節(jié)點和鏈路;具體地,以圖1中所示的業(yè)務(wù)系統(tǒng)為例,對該業(yè)務(wù)系統(tǒng)可用性評估方法進(jìn)行說明。 如圖1所示的拓?fù)浣Y(jié)構(gòu)包括以下節(jié)點第一接入交換機(jī)D、第二接入交換機(jī)E、第三接入交換 機(jī)F、第四接入交換機(jī)G、第一核心交換機(jī)Al、第二核心交換機(jī)A2、第一服務(wù)器區(qū)接入交換機(jī) B、第二服務(wù)器區(qū)接入交換機(jī)C、第一業(yè)務(wù)系統(tǒng)服務(wù)器H、第二業(yè)務(wù)系統(tǒng)服務(wù)器N和第三業(yè)務(wù) 系統(tǒng)服務(wù)器M。圖1中包括分別對應(yīng)于三個業(yè)務(wù)系統(tǒng)服務(wù)器的業(yè)務(wù)系統(tǒng)。各業(yè)務(wù)系統(tǒng)的網(wǎng) 元除包括以上節(jié)點中的相關(guān)節(jié)點之外,還包括任意兩個相連節(jié)點之間的鏈路,例如第一接 入交換機(jī)D與第一核心交換機(jī)Al之間的鏈路和第一核心交換機(jī)Al與第一服務(wù)器區(qū)接入交 換機(jī)B之間的鏈路等。對圖1中的各網(wǎng)元進(jìn)行監(jiān)測,以獲知其是否發(fā)生故障事件,例如設(shè)備CPU利用率超 過閾值事件、接口閃斷事件和以太網(wǎng)地址解析協(xié)議(ARP)攻擊等故障事件,所需進(jìn)行監(jiān)測 的故障事件類型可預(yù)先設(shè)定。獲知各網(wǎng)元是否發(fā)生預(yù)定的各種故障事件后,可根據(jù)預(yù)設(shè)規(guī) 則獲取網(wǎng)元的健康分值。步驟S200,根據(jù)節(jié)點在業(yè)務(wù)系統(tǒng)路徑中出現(xiàn)的次數(shù)獲取節(jié)點的權(quán)重;具體地,在圖1中所示的業(yè)務(wù)系統(tǒng)中,柜臺終端A通過四個接入交換機(jī)接入業(yè)務(wù)系統(tǒng)(圖1中以通過第二接入交換機(jī)E接入該業(yè)務(wù)系統(tǒng)為示例),要獲取一業(yè)務(wù)系統(tǒng)服務(wù)器H 提供的業(yè)務(wù)服務(wù)時,即需形成柜臺終端A至第一業(yè)務(wù)系統(tǒng)服務(wù)器H的路徑。符合上述條件 的路徑有16條,與各接入交換機(jī)對應(yīng)的有4條,以第二接入交換機(jī)E為例,包括第一路徑 (柜臺終端A、第二接入交換機(jī)E、第一核心交換機(jī)Al、第一服務(wù)器區(qū)接入交換機(jī)B、第一業(yè)務(wù) 系統(tǒng)服務(wù)器H);第二路徑(柜臺終端A、第二接入交換機(jī)E、第二核心交換機(jī)A2、第一服務(wù)器 區(qū)接入交換機(jī)B、第一業(yè)務(wù)系統(tǒng)服務(wù)器H);第三路徑(柜臺終端A、第二接入交換機(jī)E、第二 核心交換機(jī)A2、第一核心交換機(jī)Al、第一服務(wù)器區(qū)接入交換機(jī)B、第一業(yè)務(wù)系統(tǒng)服務(wù)器H); 第四路徑(柜臺終端A、第二接入交換機(jī)E、第一核心交換機(jī)Al、第二核心交換機(jī)A2、第一服 務(wù)器區(qū)接入交換機(jī)B、第一業(yè)務(wù)系統(tǒng)服務(wù)器H)。可以得知,在全部的16條路徑中,第二接入 交換機(jī)E出現(xiàn)在其中4條路徑中,則第二接入交換機(jī)E對于由業(yè)務(wù)系統(tǒng)服務(wù)器H提供業(yè)務(wù) 服務(wù)的業(yè)務(wù)系統(tǒng)的權(quán)重是0. 25。步驟S300,根據(jù)鏈路關(guān)聯(lián)節(jié)點獲取鏈路的權(quán)重;具體地,與節(jié)點相類似,不同節(jié)點間的鏈路在業(yè)務(wù)系統(tǒng)中所占的權(quán)重也不相同,并 且兩節(jié)點之間的鏈路的權(quán)重取決于該兩個關(guān)聯(lián)節(jié)點的權(quán)重。該鏈路權(quán)重值例如為兩節(jié)點權(quán) 重的平均值或為其中任一節(jié)點的權(quán)重,優(yōu)選地,根據(jù)鏈路關(guān)聯(lián)的兩個節(jié)點中距離業(yè)務(wù)系統(tǒng) 中的業(yè)務(wù)系統(tǒng)服務(wù)器較遠(yuǎn)的節(jié)點獲取鏈路的權(quán)重,例如計算第二接入交換機(jī)E與第一核心 交換機(jī)Al之間的鏈路權(quán)重時,由于第二接入交換機(jī)E相對于第一核心交換機(jī)Al距離第一 業(yè)務(wù)系統(tǒng)服務(wù)器H較遠(yuǎn),因此應(yīng)取第二接入交換機(jī)E的權(quán)重作為該鏈路的權(quán)重。步驟S400,根據(jù)所述網(wǎng)元的健康分值和所述網(wǎng)元的權(quán)重按照預(yù)定算法評估業(yè)務(wù)系 統(tǒng)可用性。具體地,根據(jù)在步驟SlOO中獲取的業(yè)務(wù)系統(tǒng)中各網(wǎng)元的健康分值、在步驟S200中 獲取的節(jié)點的權(quán)重和在步驟S300中獲取的鏈路的權(quán)重按照預(yù)定算法來評估業(yè)務(wù)系統(tǒng)的可 用性。其中,該預(yù)定算法可包括多種,例如將業(yè)務(wù)系統(tǒng)中各網(wǎng)元健康分值與其對應(yīng)的網(wǎng)元權(quán) 重的乘積進(jìn)行累加,或根據(jù)網(wǎng)元健康分值及網(wǎng)元權(quán)重計算業(yè)務(wù)系統(tǒng)中的各路徑健康度,并 綜合業(yè)務(wù)系統(tǒng)中的全部路徑的健康度計算業(yè)務(wù)系統(tǒng)的可用性。根據(jù)上述實施例的業(yè)務(wù)系統(tǒng)可用評估方法,由于不僅通過監(jiān)測節(jié)點和鏈路的故障 事件獲取網(wǎng)元的健康分值,還通過分析業(yè)務(wù)系統(tǒng)中各網(wǎng)元之間的關(guān)聯(lián)性,即業(yè)務(wù)系統(tǒng)的路 徑,根據(jù)各網(wǎng)元對于業(yè)務(wù)系統(tǒng)可用性的影響度的不同為各網(wǎng)元設(shè)置不同的權(quán)重,并結(jié)合網(wǎng) 元的權(quán)重及其健康分值來評估業(yè)務(wù)系統(tǒng)的可用性,所以能夠根據(jù)業(yè)務(wù)系統(tǒng)的具體架構(gòu)對其 當(dāng)前可用狀態(tài)進(jìn)行有效、準(zhǔn)確的評估。進(jìn)一步地,在上述實施例的業(yè)務(wù)系統(tǒng)可用評估方法中,所述監(jiān)測業(yè)務(wù)系統(tǒng)中各網(wǎng) 元故障事件,根據(jù)預(yù)設(shè)規(guī)則,獲取網(wǎng)絡(luò)網(wǎng)元的健康分值的步驟包括步驟S101,建立網(wǎng)元健康評估列表,所述網(wǎng)元健康評估列表包括網(wǎng)元故障事件和 與所述網(wǎng)元故障事件對應(yīng)的評分原則;步驟S102,監(jiān)測網(wǎng)元故障事件并通過查詢所述網(wǎng)元健康評估列表獲取故障事件對 應(yīng)的評分原則;步驟S103,根據(jù)所述評分原則獲取網(wǎng)元的健康分值。具體地,表1為健康評估列表的一個示例。表 權(quán)利要求
1.一種業(yè)務(wù)系統(tǒng)可用性評估方法,其特征在于,包括監(jiān)測業(yè)務(wù)系統(tǒng)中網(wǎng)元故障事件,根據(jù)預(yù)設(shè)規(guī)則獲取網(wǎng)元的健康分值,所述網(wǎng)元包括節(jié) 點和鏈路;根據(jù)節(jié)點在業(yè)務(wù)系統(tǒng)路徑中出現(xiàn)的次數(shù)獲取節(jié)點的權(quán)重; 根據(jù)鏈路關(guān)聯(lián)節(jié)點獲取鏈路的權(quán)重;根據(jù)所述網(wǎng)元的健康分值和所述網(wǎng)元的權(quán)重按照預(yù)定算法評估業(yè)務(wù)系統(tǒng)可用性。
2.根據(jù)權(quán)利要求1所述的業(yè)務(wù)系統(tǒng)可用性評估方法,其特征在于,所述監(jiān)測業(yè)務(wù)系統(tǒng) 中各網(wǎng)元故障事件,根據(jù)預(yù)設(shè)規(guī)則獲取網(wǎng)元的健康分值的步驟包括建立網(wǎng)元健康評估列表,所述網(wǎng)元健康評估列表包括網(wǎng)元故障事件和與所述網(wǎng)元故障 事件對應(yīng)的評分原則;監(jiān)測網(wǎng)元故障事件并通過查詢所述網(wǎng)元健康評估列表獲取故障事件對應(yīng)的評分原則;根據(jù)所述評分原則獲取網(wǎng)元的健康分值。
3.根據(jù)權(quán)利要求1所述的業(yè)務(wù)系統(tǒng)可用性評估方法,其特征在于,所述根據(jù)節(jié)點在業(yè) 務(wù)系統(tǒng)路徑中出現(xiàn)的次數(shù)獲取網(wǎng)元的權(quán)重的步驟包括獲取業(yè)務(wù)系統(tǒng)路徑;若檢測獲知某一路徑未包含其他任一路徑的全部節(jié)點,則確定所述路徑為有效路徑; 根據(jù)節(jié)點出現(xiàn)在所述有效路徑中的次數(shù)獲取節(jié)點的權(quán)重。
4.根據(jù)權(quán)利要求1所述的業(yè)務(wù)系統(tǒng)可用性評估方法,其特征在于,所述根據(jù)鏈路關(guān)聯(lián) 節(jié)點獲取鏈路的權(quán)重的步驟包括根據(jù)鏈路關(guān)聯(lián)的兩個節(jié)點的權(quán)重的平均值或其中任一節(jié)點的權(quán)重確定鏈路的權(quán)重。
5.根據(jù)權(quán)利要求1所述的業(yè)務(wù)系統(tǒng)可用性評估方法,其特征在于,所述根據(jù)所述網(wǎng)元 的健康分值和所述網(wǎng)元的權(quán)重按照預(yù)定算法評估業(yè)務(wù)系統(tǒng)可用性的步驟包括根據(jù)網(wǎng)元的健康分值和網(wǎng)元的權(quán)重獲取路徑健康分值; 根據(jù)所述路徑健康分值計算所述業(yè)務(wù)系統(tǒng)的可用性分值。
6.一種業(yè)務(wù)系統(tǒng)可用性評估系統(tǒng),其特征在于,包括健康分值計算模塊,用于監(jiān)測業(yè)務(wù)系統(tǒng)中各網(wǎng)元故障事件,根據(jù)預(yù)設(shè)規(guī)則獲取網(wǎng)元的 健康分值,所述網(wǎng)元包括節(jié)點和鏈路;節(jié)點權(quán)重計算模塊,根據(jù)節(jié)點在業(yè)務(wù)系統(tǒng)路徑中出現(xiàn)的次數(shù)獲取節(jié)點的權(quán)重; 鏈路權(quán)重計算模塊,用于根據(jù)鏈路關(guān)聯(lián)節(jié)點獲取鏈路的權(quán)重; 業(yè)務(wù)系統(tǒng)可用性評估模塊,用于根據(jù)所述網(wǎng)元的健康分值和所述網(wǎng)元的權(quán)重按照預(yù)定 算法評估業(yè)務(wù)系統(tǒng)可用性。
7.根據(jù)權(quán)利要求6所述的業(yè)務(wù)系統(tǒng)可用性評估系統(tǒng),其特征在于,所述健康分值計算 模塊包括網(wǎng)元評估列表建立單元,用于建立網(wǎng)元健康評估列表,所述網(wǎng)元健康評估列表包括網(wǎng) 元故障事件和與所述網(wǎng)元故障事件對應(yīng)的評分原則;網(wǎng)元監(jiān)測單元,用于監(jiān)測網(wǎng)元故障事件并通過查詢所述網(wǎng)元健康評估列表獲取故障事 件對應(yīng)的評分原則;健康分值計算單元,用于根據(jù)所述評分原則獲取網(wǎng)元的健康分值。
8.根據(jù)權(quán)利要求6所述的業(yè)務(wù)系統(tǒng)可用性評估系統(tǒng),其特征在于,所述節(jié)點權(quán)重計算 模塊包括路徑獲取單元,用于獲取業(yè)務(wù)系統(tǒng)路徑;路徑檢測單元,用于若檢測獲知某一路徑未包含其他任一路徑的全部節(jié)點,則確定所 述路徑為有效路徑;節(jié)點權(quán)重獲取單元,用于根據(jù)節(jié)點出現(xiàn)在所述有效路徑中的次數(shù)獲取節(jié)點的權(quán)重。
9.根據(jù)權(quán)利要求6所述的業(yè)務(wù)系統(tǒng)可用性評估系統(tǒng),其特征在于,所述鏈路權(quán)重計算 模塊包括相關(guān)節(jié)點權(quán)重獲取單元,用于獲取鏈路關(guān)聯(lián)的兩個節(jié)點的權(quán)重;鏈路權(quán)重獲取單元,用于根據(jù)鏈路關(guān)聯(lián)的兩個節(jié)點的權(quán)重的平均值或其中任一節(jié)點的 權(quán)重確定鏈路的權(quán)重。
10.根據(jù)權(quán)利要求6所述的業(yè)務(wù)系統(tǒng)可用性評估系統(tǒng),其特征在于,所述業(yè)務(wù)系統(tǒng)可用 性評估模塊包括路徑健康分值獲取單元,用于根據(jù)網(wǎng)元的健康分值和網(wǎng)元的權(quán)重獲取路徑健康分值;業(yè)務(wù)系統(tǒng)可用性分值評估單元,用于根據(jù)所述路徑健康分值計算所述業(yè)務(wù)系統(tǒng)的可用 性分值。
全文摘要
本發(fā)明提供業(yè)務(wù)系統(tǒng)可用性評估方法及系統(tǒng)。該業(yè)務(wù)系統(tǒng)可用性評估方法包括監(jiān)測業(yè)務(wù)系統(tǒng)中網(wǎng)元故障事件,根據(jù)預(yù)設(shè)規(guī)則獲取網(wǎng)元的健康分值,所述網(wǎng)元包括節(jié)點和鏈路;據(jù)節(jié)點在業(yè)務(wù)系統(tǒng)路徑中出現(xiàn)的次數(shù)獲取節(jié)點的權(quán)重;根據(jù)鏈路關(guān)聯(lián)節(jié)點獲取鏈路的權(quán)重;根據(jù)所述網(wǎng)元的健康分值和所述網(wǎng)元的權(quán)重按照預(yù)定算法評估業(yè)務(wù)系統(tǒng)可用性。本發(fā)明的業(yè)務(wù)系統(tǒng)可用性評估方法及系統(tǒng)能夠?qū)崿F(xiàn)業(yè)務(wù)系統(tǒng)可用性的有效、準(zhǔn)確評估。
文檔編號H04L12/26GK102123052SQ20111007819
公開日2011年7月13日 申請日期2011年3月30日 優(yōu)先權(quán)日2011年3月30日
發(fā)明者宋立華 申請人:北京星網(wǎng)銳捷網(wǎng)絡(luò)技術(shù)有限公司