一種it系統(tǒng)運行指標(biāo)動態(tài)閾值分析方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及IT運維領(lǐng)域,主要是一種IT系統(tǒng)運行指標(biāo)動態(tài)閾值分析方法。
【背景技術(shù)】
[0002]IT系統(tǒng)運行狀態(tài)監(jiān)測是現(xiàn)代信息化建設(shè)發(fā)展中不可或缺的組成部份,它為運維人 員提供7x24小時的IT系統(tǒng)運行狀態(tài)信息,實時監(jiān)測存在故障的點提供及時準(zhǔn)確的預(yù)警,對 于降低IT系統(tǒng)運維成本,實現(xiàn)其長期穩(wěn)定運行有極大的幫助。
[0003] IT系統(tǒng)運行狀態(tài)往往反映于其各類軟硬件運行指標(biāo)上,包含底層的網(wǎng)絡(luò)流量到高 層的業(yè)務(wù)交易量。對這些運行指標(biāo)進行收集后,需要進行進一步的分析,以判斷IT系統(tǒng)的 運行健康狀態(tài)。
[0004] 傳統(tǒng)運行指標(biāo)分析技術(shù)往往使用人為建立若干靜態(tài)閾值來進行監(jiān)測分析,其存在 人為經(jīng)驗誤差。并且一個大規(guī)模的IT系統(tǒng)包含的各類軟硬件指標(biāo)可多達數(shù)萬個,因此使用 靜態(tài)規(guī)則人為為這些指標(biāo)配置合理的靜態(tài)規(guī)則更不可能。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)存在的不足,而提供一種IT系統(tǒng)運行指標(biāo)動態(tài) 閾值分析方法,通過人工智能算法,實現(xiàn)大規(guī)模IT系統(tǒng)運行狀態(tài)的自動化監(jiān)測。
[0006] 本發(fā)明的目的是通過如下技術(shù)方案來完成的。這種IT系統(tǒng)運行指標(biāo)動態(tài)閾值分 析方法,利用性能指標(biāo)運行規(guī)律特征計算當(dāng)前時間點正常值區(qū)間,生成動態(tài)閾值基線,以判 斷當(dāng)前運行狀態(tài)是否正常,步驟如下:
[0007]1)、查詢運行指標(biāo)歷史變化情況;
[0008] 2)、基于正態(tài)分布的原理計算當(dāng)前時間粒度下的指標(biāo)正常值區(qū)間R,其上限標(biāo)記為 RU,下限標(biāo)記為RD ;
[0009] 3)、將各時間粒度的RU連接作為動態(tài)閾值上基線,RD連接作為動態(tài)閾值下基線;
[0010] 4)、判斷當(dāng)前時間粒度下新采集到的運行指標(biāo),如〉RU則為值過高異常,如〈RD則 為值過低異常。
[0011] 本發(fā)明的有益效果為:解決靜態(tài)閾值存在的不足,通過智能學(xué)習(xí)運行指標(biāo)的歷史 運行規(guī)律,計算不同時間點運行指標(biāo)正常取值范圍,來生成動態(tài)閾值基線,以用于運行指標(biāo) 的監(jiān)測分析。由于本發(fā)明無需大量人為操作,計算量小,且分析準(zhǔn)確,因此可大量減少運維 人力成本,提高監(jiān)測覆蓋面與準(zhǔn)確率。
【附圖說明】
[0012] 圖1為本發(fā)明的動態(tài)閾值分析流程不意圖;
[0013]圖2為本發(fā)明所涉及的指標(biāo)正態(tài)分布規(guī)律示意圖;
[0014] 圖3為本發(fā)明的閾值計算流程示意圖;
[0015] 圖4為本發(fā)明生成的動態(tài)閾值基線示意圖。
【具體實施方式】
[0016] 下面將結(jié)合附圖和實施例對本發(fā)明做詳細的介紹:
[0017] 實施例:本發(fā)明所述的這種IT系統(tǒng)運行指標(biāo)動態(tài)閾值分析方法,利用性能指標(biāo)運 行規(guī)律特征計算當(dāng)前時間點正常值區(qū)間,生成動態(tài)閾值基線,以判斷當(dāng)前運行狀態(tài)是否正 常。本發(fā)明可有效判斷IT環(huán)境中一些性能指標(biāo)的運行狀態(tài),并實現(xiàn)自動學(xué)習(xí)能力,減少實 施大規(guī)模IT監(jiān)測時的人為配置與分析工作。
[0018]圖1為下述各模塊的運行流程圖,描述了數(shù)據(jù)流向;本發(fā)明共涉及4個模塊:指標(biāo) 接收模塊、動態(tài)閾值分析模塊、監(jiān)測展現(xiàn)模塊、告警通知模塊。1.指標(biāo)接收模塊提供標(biāo)準(zhǔn)的 數(shù)據(jù)接口,完成對各IT系統(tǒng)最新上報運行指標(biāo)的接收預(yù)處理,并保存為歷史數(shù)據(jù);2.動態(tài) 閾值分析模塊,即本發(fā)明算法實現(xiàn)模塊,根據(jù)指標(biāo)歷史情況與當(dāng)前情況,計算動態(tài)閾值基線 與發(fā)送指標(biāo)運行異常事件;3.監(jiān)測展現(xiàn)模塊通過趨勢圖實現(xiàn)運行指標(biāo)變化軌跡以及動態(tài) 基線的顯示,提供對比分析;4.告警通知模塊根據(jù)指標(biāo)運行狀態(tài)變更,給用戶發(fā)送告警。
[0019] 圖2為IT運行指標(biāo)的正態(tài)分布示意圖,由于IT運行指標(biāo)往往與具體信息系統(tǒng)業(yè) 務(wù)吞吐量有關(guān),而用戶的業(yè)務(wù)吞吐量則具備峰谷特征,因此從某個同周期的歷史時間段來 看,其指標(biāo)實際值總是處于某個特定的區(qū)間范圍,體現(xiàn)出正態(tài)分布的特征。
[0020] 圖3為本發(fā)明計算動態(tài)閾值的過程;具體步驟如下:
[0021] 1)、接收到IT資源產(chǎn)生的新指標(biāo)P ;
[0022] 2)、查詢指標(biāo)P過去歷史數(shù)據(jù),如下:
[0023](1)、前小時平均值尋與標(biāo)準(zhǔn)差
[0024] (2)、前一天同小時平均值PMd與標(biāo)準(zhǔn)差PSD d
[0025] (3)、過去8周同一天同小時平均值PMW1? PM吧與標(biāo)準(zhǔn)差PSD W1?PSD ws
[0026]3)、計算正常值平均值:
【主權(quán)項】
1. 一種IT系統(tǒng)運行指標(biāo)動態(tài)閾值分析方法,其特征是:利用性能指標(biāo)運行規(guī)律特征計 算當(dāng)前時間點正常值區(qū)間,生成動態(tài)閾值基線,以判斷當(dāng)前運行狀態(tài)是否正常,步驟如下: 1) 、查詢運行指標(biāo)歷史變化情況; 2) 、基于正態(tài)分布的原理計算當(dāng)前時間粒度下的指標(biāo)正常值區(qū)間R,其上限標(biāo)記為RU, 下限標(biāo)記為RD ; 3) 、將各時間粒度的RU連接作為動態(tài)閾值上基線,RD連接作為動態(tài)閾值下基線; 4) 、判斷當(dāng)前時間粒度下新采集到的運行指標(biāo),如〉RU則為值過高異常,如〈RD則為值 過低異常。
2. 根據(jù)權(quán)利要求1所述的IT系統(tǒng)運行指標(biāo)動態(tài)閾值分析方法,其特征在于:該方法的 具體步驟如下: 1) 、接收到IT資源產(chǎn)生的新指標(biāo)P ; 2) 、查詢指標(biāo)P過去歷史數(shù)據(jù),如下: (1) 、前小時平均值PMk與標(biāo)準(zhǔn)差PSD h; (2) 、前一天同小時平均值PMd與標(biāo)準(zhǔn)差PSD d (3) 、過去8周同一天同小時平均值PMW1? PM we與標(biāo)準(zhǔn)差PSD W1?PSD W8;
3) 、計算正常值平均值 4) 、計算正常值標(biāo)準(zhǔn)差 5) 、計算當(dāng)前小時正常值區(qū)間上閾值RU = RM+RSDX3 ; 6) 、計算當(dāng)前小時正常值區(qū)間下閾值RD = RM-RSDX3 ; 7) 、計算當(dāng)天動態(tài)基線,將當(dāng)天生成的所有小時RU作為上基線,所有小時RD作為下基 線; 8) 、如果指標(biāo)P > RU則為超上閾值異常,如果指標(biāo)P < RD則為超下閾值異常,其它則 為正常情況。
【專利摘要】本發(fā)明涉及一種IT系統(tǒng)運行指標(biāo)動態(tài)閾值分析方法,步驟如下:1、查詢運行指標(biāo)歷史變化情況;2、基于正態(tài)分布的原理計算當(dāng)前時間粒度下的指標(biāo)正常值區(qū)間R,其上限標(biāo)記為RU,下限標(biāo)記為RD;3、將各時間粒度的RU連接作為動態(tài)閾值上基線,RD連接作為動態(tài)閾值下基線;4、判斷當(dāng)前時間粒度下新采集到的運行指標(biāo),如>RU則為值過高異常,如<RD則為值過低異常。本發(fā)明的有益效果為:解決靜態(tài)閾值存在的不足,通過智能學(xué)習(xí)運行指標(biāo)的歷史運行規(guī)律,計算不同時間點運行指標(biāo)正常取值范圍,生成動態(tài)閾值基線,以用于運行指標(biāo)的監(jiān)測分析。本發(fā)明有益的效果:本發(fā)明無需大量人為操作,計算量小,且分析準(zhǔn)確,因此可大量減少運維人力成本,提高監(jiān)測覆蓋面與準(zhǔn)確率。
【IPC分類】G06F11-30
【公開號】CN104536868
【申請?zhí)枴緾N201410697138
【發(fā)明人】蔣君偉, 劉東海, 張宜凡
【申請人】北京廣通信達科技有限公司
【公開日】2015年4月22日
【申請日】2014年11月26日