專利名稱::具有預(yù)警功能的服務(wù)器監(jiān)控方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及監(jiān)控網(wǎng)絡(luò)設(shè)備、服務(wù)器及服務(wù)器上應(yīng)用的監(jiān)控方法及其系統(tǒng),尤其涉及應(yīng)用在互聯(lián)網(wǎng)領(lǐng)域的具有預(yù)警功能的服務(wù)器監(jiān)控方法及其系統(tǒng)。
背景技術(shù):
:由于互聯(lián)網(wǎng)產(chǎn)品的特殊性,所以需要保證互聯(lián)網(wǎng)產(chǎn)品的高可用率,在故障發(fā)生前、發(fā)生后能得到及時(shí)的處理。開源的監(jiān)控系統(tǒng)有很多,例如Nagios應(yīng)用軟件,在一臺(tái)中心服務(wù)器上運(yùn)行,中心服務(wù)器可以采用Linux或者Unix操作系統(tǒng)。每一臺(tái)需要被監(jiān)視的設(shè)備都運(yùn)行一個(gè)與中心服務(wù)器進(jìn)行通信的Nagios軟件的后臺(tái)程序。中心服務(wù)器根據(jù)讀取的配置文件中的指令與遠(yuǎn)程的后臺(tái)程序通信,并且指示遠(yuǎn)程的后臺(tái)程序?qū)π枰槐O(jiān)視的設(shè)備進(jìn)行必要的檢查。Nagios應(yīng)用軟件必須在Linux或者Unix操作系統(tǒng)上運(yùn)行。Cacti網(wǎng)絡(luò)流量監(jiān)測(cè)圖形分析工具,基于PHP(個(gè)人的超級(jí)文本預(yù)處理語(yǔ)言)、MySQL(—種小型關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng))、SNMP(簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議)及RRDtool(環(huán)狀數(shù)據(jù)庫(kù)工具)而被開發(fā)出來。Cacti通過snmpget(PHP中的數(shù)據(jù)采集函數(shù)或命令)來獲取數(shù)據(jù),使用RRDtool繪畫圖形。Cacti只能檢測(cè)流量。Jwebap分析工具,用于JAVAWEB(網(wǎng)絡(luò))應(yīng)用。它不采用JVMPI(虛擬機(jī)監(jiān)視程序接口)提供的特性實(shí)現(xiàn)監(jiān)控,而是一個(gè)純粹的JAVA應(yīng)用。然而,上述監(jiān)控系統(tǒng)中存在如下缺點(diǎn)(1)雖然上述監(jiān)控系統(tǒng)都有監(jiān)控應(yīng)用系統(tǒng)是否運(yùn)行正常的功能,但是是在故障發(fā)生時(shí)發(fā)出報(bào)警信息。但這時(shí)故障可能已經(jīng)對(duì)系統(tǒng)造成嚴(yán)重影響,比如整個(gè)應(yīng)用系統(tǒng)崩潰。最好是能在應(yīng)用系統(tǒng)故障發(fā)生前或未造成嚴(yán)重后果之前,提前發(fā)出預(yù)警信息。(2)上述監(jiān)控系統(tǒng)不能有效地回溯故障的歷史信息。當(dāng)故障發(fā)生后,不能或不能完整重現(xiàn)故障發(fā)生時(shí)、發(fā)生前、發(fā)生后那段時(shí)間的系統(tǒng)情況,這樣技術(shù)人員就很難找出故障發(fā)生的原因。(3)上述監(jiān)控系統(tǒng)或者是對(duì)操作系統(tǒng)有特定依賴性(如Nagios),或者對(duì)服務(wù)器的監(jiān)控只能是局部的(如Cacti)。
發(fā)明內(nèi)容為了克服上述缺點(diǎn),根據(jù)本發(fā)明的一個(gè)方面,提出了一種具有預(yù)警功能的服務(wù)器監(jiān)控方法,包括在監(jiān)控前臺(tái)的控制終端來配置被監(jiān)控服務(wù)器的監(jiān)控參數(shù)并設(shè)定與所述監(jiān)控參數(shù)相應(yīng)的閾值;經(jīng)由WEB服務(wù)器將所述監(jiān)控參數(shù)和所述閾值記錄到數(shù)據(jù)庫(kù)中;由監(jiān)控后臺(tái)的監(jiān)控服務(wù)器從所述數(shù)據(jù)庫(kù)中提取所述監(jiān)控參數(shù)和所述閾值;由所述監(jiān)控服務(wù)器根據(jù)所述監(jiān)控參數(shù)和所述閾值來監(jiān)控所述被監(jiān)控服務(wù)器,并產(chǎn)生監(jiān)控結(jié)果;由所述監(jiān)控服務(wù)器將所述監(jiān)控結(jié)果記錄到所述數(shù)據(jù)庫(kù)中;以及由所述WEB服務(wù)器從所述數(shù)據(jù)庫(kù)提取所述監(jiān)控結(jié)果并將所述監(jiān)控結(jié)果呈現(xiàn)在所述控制終端,其中,當(dāng)所述監(jiān)控結(jié)果為所述監(jiān)控參數(shù)與所述閾值不相匹配時(shí),所述監(jiān)控服務(wù)器就調(diào)用所述監(jiān)控后臺(tái)的報(bào)警系統(tǒng)進(jìn)行報(bào)警。根據(jù)本發(fā)明的另一個(gè)方面,提出了一種具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng),包括監(jiān)控前臺(tái),所述監(jiān)控前臺(tái)包括控制終端和WEB服務(wù)器;數(shù)據(jù)庫(kù);以及監(jiān)控后臺(tái),所述監(jiān)控后臺(tái)包括監(jiān)控服務(wù)器和報(bào)警系統(tǒng),其中,在所述監(jiān)控前臺(tái)的控制終端來配置被監(jiān)控服務(wù)器的監(jiān)控參數(shù)并設(shè)定與所述監(jiān)控參數(shù)相應(yīng)的閾值;經(jīng)由WEB服務(wù)器將所述監(jiān)控參數(shù)和所述閾值記錄到數(shù)據(jù)庫(kù)中;由所述監(jiān)控后臺(tái)的監(jiān)控服務(wù)器從所述數(shù)據(jù)庫(kù)中提取所述監(jiān)控參數(shù)和所述閾值;由所述監(jiān)控服務(wù)器根據(jù)所述監(jiān)控參數(shù)和所述閾值來監(jiān)控所述被監(jiān)控服務(wù)器,并產(chǎn)生監(jiān)控結(jié)果;由所述監(jiān)控服務(wù)器將所述監(jiān)控結(jié)果記錄到所述數(shù)據(jù)庫(kù)中;以及由所述WEB服務(wù)器從所述數(shù)據(jù)庫(kù)提取所述監(jiān)控結(jié)果并將所述監(jiān)控結(jié)果呈現(xiàn)在所述控制終端,其中,當(dāng)所述監(jiān)控結(jié)果為所述監(jiān)控參數(shù)與所述閾值不相匹配時(shí),所述監(jiān)控服務(wù)器就調(diào)用所述監(jiān)控后臺(tái)的報(bào)警系統(tǒng)進(jìn)行報(bào)警。通過本發(fā)明的服務(wù)器監(jiān)控方法及其系統(tǒng),在監(jiān)控前臺(tái)配置被監(jiān)控服務(wù)器的監(jiān)控參數(shù)并設(shè)定與監(jiān)控參數(shù)相應(yīng)的閾值,由監(jiān)控后臺(tái)通過監(jiān)控參數(shù)和閾值來監(jiān)控被監(jiān)控服務(wù)器并產(chǎn)生監(jiān)控結(jié)果,當(dāng)監(jiān)控結(jié)果為監(jiān)控參數(shù)與閾值不相匹配時(shí),監(jiān)控后臺(tái)就調(diào)用報(bào)警系統(tǒng)進(jìn)行報(bào)警,從而實(shí)現(xiàn)監(jiān)控系統(tǒng)的預(yù)警功能。通過本發(fā)明的服務(wù)器監(jiān)控方法及其系統(tǒng),由于監(jiān)控后臺(tái)從多種渠道定時(shí)抓取的數(shù)據(jù)(包括生成的表格或圖形等展示數(shù)據(jù))被記錄在數(shù)據(jù)庫(kù)中,因此,不但能夠確保實(shí)現(xiàn)監(jiān)控系統(tǒng)的預(yù)警功能,而且,當(dāng)監(jiān)控系統(tǒng)發(fā)出故障報(bào)警時(shí),技術(shù)人員通過分析數(shù)據(jù)庫(kù)中的數(shù)據(jù)(包括從被監(jiān)控服務(wù)器上的應(yīng)用系統(tǒng)的訪問日志中抓取的數(shù)據(jù)),能夠有效地回溯故障的歷史信息,從而技術(shù)人員可以通過之前記錄的數(shù)據(jù)、表格和圖形來分析故障出現(xiàn)的原因,從而有效地為技術(shù)人員解決問題提供幫助。而且,本發(fā)明的服務(wù)器監(jiān)控方法及其系統(tǒng)在不依賴特定的操作系統(tǒng)的同時(shí),還能夠?qū)Ψ?wù)器進(jìn)行全方位的監(jiān)控。通過以下參照附圖對(duì)本發(fā)明實(shí)施例的說明,本發(fā)明的上述以及其它目的、特征和優(yōu)點(diǎn)將更加明顯。下面將參照所附附圖來描述本發(fā)明的實(shí)施例,其中圖1示例性示出了根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng)的架構(gòu)圖;圖2示例性示出了根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控方法來監(jiān)控被監(jiān)控服務(wù)器的網(wǎng)絡(luò)狀況的流程圖;圖3示例性示出了被監(jiān)控服務(wù)器上的各TOB應(yīng)用在某一時(shí)間點(diǎn)的應(yīng)用程序狀態(tài)的實(shí)例的一部分;圖4示例性示出了被監(jiān)控服務(wù)器上的各TOB應(yīng)用在某一時(shí)間點(diǎn)的線程狀態(tài)的實(shí)例的一部分;圖5示例性示出了被監(jiān)控服務(wù)器上的各WEB應(yīng)用在某一時(shí)間點(diǎn)的連接狀態(tài)的實(shí)例;圖6示例性示出了被監(jiān)控服務(wù)器上的包含多種監(jiān)控參數(shù)的應(yīng)用處理狀態(tài)的實(shí)例的一部分;圖7示例性示出了根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控方法來監(jiān)控被監(jiān)控服務(wù)器上的訪問日志的流程圖;圖8示例性示出了由根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng)發(fā)出的預(yù)警信息的實(shí)例;以及圖9示例性示出了通過根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng)查看預(yù)警信息來定位被監(jiān)控服務(wù)器上的故障的實(shí)例。具體實(shí)施例方式圖1示例性示出了根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng)的架構(gòu)圖。如圖1中所示,根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng)1包括監(jiān)控前臺(tái)10、監(jiān)控后臺(tái)20和數(shù)據(jù)庫(kù)(DB)30。監(jiān)控前臺(tái)10包括控制終端101和TOB服務(wù)器102。監(jiān)控后臺(tái)20包括監(jiān)控服務(wù)器201和報(bào)警系統(tǒng)202。根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控方法,監(jiān)控人員在監(jiān)控前臺(tái)10的控制終端101配置被監(jiān)控服務(wù)器40的監(jiān)控參數(shù)并設(shè)定與監(jiān)控參數(shù)相應(yīng)的閾值,經(jīng)由WEB服務(wù)器102將監(jiān)控參數(shù)和閾值記錄到數(shù)據(jù)庫(kù)30中。優(yōu)選地,本發(fā)明的WEB服務(wù)器102是TomcatWEB服務(wù)器(Tomcat是一種TOB應(yīng)用服務(wù)器,支持JSP(JAVA服務(wù)器頁(yè)面))。監(jiān)控后臺(tái)20的監(jiān)控服務(wù)器201可從數(shù)據(jù)庫(kù)30中提取監(jiān)控參數(shù)和閾值,并由監(jiān)控服務(wù)器201根據(jù)監(jiān)控參數(shù)和閾值來監(jiān)控被監(jiān)控服務(wù)器40,從而產(chǎn)生監(jiān)控結(jié)果并由監(jiān)控服務(wù)器201將監(jiān)控結(jié)果記錄到數(shù)據(jù)庫(kù)30中??梢钥吹?,在本發(fā)明中,監(jiān)控前臺(tái)10和監(jiān)控后臺(tái)20并不直接通信,而是通過數(shù)據(jù)庫(kù)30來傳遞信息。另外,本發(fā)明中提到的被監(jiān)控服務(wù)器40不限于單個(gè)服務(wù)器,而是可以是服務(wù)器集群或其他網(wǎng)絡(luò)設(shè)備。TOB服務(wù)器102從數(shù)據(jù)庫(kù)30提取監(jiān)控結(jié)果,并將監(jiān)控結(jié)果呈現(xiàn)在控制終端101,從而監(jiān)控人員能夠察看監(jiān)控結(jié)果。通過本發(fā)明的監(jiān)控方法和系統(tǒng),能夠?qū)崿F(xiàn)對(duì)被監(jiān)控的服務(wù)器進(jìn)行多種渠道的監(jiān)控。例如,進(jìn)行被監(jiān)控服務(wù)器的網(wǎng)絡(luò)監(jiān)控、被監(jiān)控服務(wù)器的性能監(jiān)控、被監(jiān)控服務(wù)器上的應(yīng)用運(yùn)行狀態(tài)監(jiān)控、通過監(jiān)控安裝在被監(jiān)控服務(wù)器中的Probe對(duì)被監(jiān)控服務(wù)器的Probe監(jiān)控、以及被監(jiān)控服務(wù)器上的日志監(jiān)控等各種監(jiān)控。其中,Probe是免費(fèi)開源工具,基于TOB+AJAX,可以用來實(shí)時(shí)管理一個(gè)單獨(dú)的主機(jī),即被監(jiān)控服務(wù)器。當(dāng)所述監(jiān)控結(jié)果示出監(jiān)控參數(shù)與監(jiān)控人員設(shè)定的閾值不相匹配時(shí),監(jiān)控服務(wù)器201就調(diào)用監(jiān)控后臺(tái)20的報(bào)警系統(tǒng)202進(jìn)行報(bào)警,從而實(shí)現(xiàn)監(jiān)控系統(tǒng)的預(yù)警功能。本發(fā)明的報(bào)警系統(tǒng)202還包括郵件報(bào)警、短信報(bào)警、以及MSN報(bào)警等報(bào)警手段。一旦被監(jiān)控服務(wù)器40出現(xiàn)故障,技術(shù)人員能夠在監(jiān)控前臺(tái)10通過查看記錄在數(shù)據(jù)庫(kù)30中的監(jiān)控結(jié)果來回溯故障的歷史信息,從而技術(shù)人員可以通過之前記錄的數(shù)據(jù)、表格和圖形來分析故障出現(xiàn)的原因,從而有效地為技術(shù)人員解決問題提供幫助。下面通過更多的實(shí)例來進(jìn)一步闡述本發(fā)明能夠通過多種渠道來進(jìn)行監(jiān)控。圖2示例性示出了根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控方法來監(jiān)控被監(jiān)控服務(wù)器的網(wǎng)絡(luò)狀況的流程圖。監(jiān)控服務(wù)器從數(shù)據(jù)庫(kù)中提取由監(jiān)控人員在監(jiān)控前臺(tái)預(yù)先設(shè)置的監(jiān)控參數(shù)和閾值(未示出)之后,通過Ping(因特網(wǎng)包探索器)訪問被監(jiān)控服務(wù)器,向被監(jiān)控服務(wù)器發(fā)送ICMP(互聯(lián)網(wǎng)控制報(bào)文協(xié)議)包。監(jiān)控服務(wù)器接收被監(jiān)控服務(wù)器返回的結(jié)果,并將返回的結(jié)果與預(yù)設(shè)的閾值進(jìn)行比較,以產(chǎn)生監(jiān)控結(jié)果。如果監(jiān)控結(jié)果為正常則將監(jiān)控結(jié)果記錄到數(shù)據(jù)庫(kù)中。如果監(jiān)控結(jié)果為不正常則啟動(dòng)報(bào)警裝置進(jìn)行預(yù)警,然后將監(jiān)控結(jié)果為不正常的監(jiān)控結(jié)果記錄到數(shù)據(jù)庫(kù)中以供將來回溯故障。圖2中的過程對(duì)應(yīng)于圖1中的被監(jiān)控服務(wù)器的網(wǎng)絡(luò)監(jiān)控。類似地,本發(fā)明也能夠進(jìn)行被監(jiān)控服務(wù)器的性能監(jiān)控、被監(jiān)控服務(wù)器上的應(yīng)用運(yùn)行狀態(tài)監(jiān)控、通過監(jiān)控安裝在被監(jiān)控服務(wù)器中的Probe對(duì)被監(jiān)控服務(wù)器的Probe監(jiān)控、以及被監(jiān)控服務(wù)器上的日志監(jiān)控等各種監(jiān)控。本發(fā)明能夠進(jìn)行對(duì)被監(jiān)控服務(wù)器的服務(wù)器性能監(jiān)控,即對(duì)被監(jiān)控服務(wù)器整體性能的監(jiān)控,比如CPU資源參數(shù)、內(nèi)存資源參數(shù)、輸入輸出(I/O)資源參數(shù)等性能參數(shù)的監(jiān)控。根據(jù)事先設(shè)定的閾值來判斷被監(jiān)控服務(wù)器當(dāng)前性能是否正常,如果出現(xiàn)異常則報(bào)警。本發(fā)明對(duì)被監(jiān)控服務(wù)器上的應(yīng)用運(yùn)行狀態(tài)監(jiān)控包括監(jiān)控JBoss(—種開放源代碼的應(yīng)用服務(wù)器)應(yīng)用服務(wù)器、TomcatWEB服務(wù)器上部署的應(yīng)用系統(tǒng)是否運(yùn)行正常,通過模擬訪問事先放在這些應(yīng)用系統(tǒng)中的JSP文件,獲得返回結(jié)果,判斷應(yīng)用系統(tǒng)是否運(yùn)行正常。如果出現(xiàn)異常則報(bào)警。本發(fā)明通過監(jiān)控安裝在這些被監(jiān)控服務(wù)器中的Probe對(duì)被監(jiān)控服務(wù)器進(jìn)行監(jiān)控。Probe是一種開源監(jiān)控軟件,適合例如TomcatWEB服務(wù)器或應(yīng)用服務(wù)器上使用。監(jiān)控安裝在被監(jiān)控服務(wù)器中的Probe的目的是因?yàn)橛袝r(shí)候在被監(jiān)控服務(wù)器故障發(fā)生后想回溯查找故障發(fā)生原因,但Probe通常只會(huì)保留一段時(shí)間內(nèi)的監(jiān)控結(jié)果,所以這就要求本發(fā)明的監(jiān)控服務(wù)器實(shí)時(shí)地從被監(jiān)控服務(wù)器的Probe抓取監(jiān)控?cái)?shù)據(jù)。由于Probe采用身份認(rèn)證方式登錄,本發(fā)明配置監(jiān)控服務(wù)器使其通過模擬瀏覽器而登陸到Probe中,訪問要監(jiān)控內(nèi)容的URL(網(wǎng)頁(yè)地址),抓取其頁(yè)面內(nèi)容。Probe監(jiān)控主要包括4個(gè)監(jiān)控指標(biāo)=Probe應(yīng)用程序監(jiān)控、Probe線程狀態(tài)監(jiān)控、Probe連接狀態(tài)監(jiān)控、Probe應(yīng)用處理狀態(tài)監(jiān)控。當(dāng)系統(tǒng)發(fā)生故障報(bào)警時(shí),技術(shù)人員可以方便的查看故障發(fā)生前、后那段時(shí)間的系統(tǒng)情況,并以此為依據(jù)縮小排查錯(cuò)誤的范圍。(I)Probe應(yīng)用程序監(jiān)控主要監(jiān)控被監(jiān)控服務(wù)器上的WEB應(yīng)用下各應(yīng)用程序的運(yùn)行情況,監(jiān)控參數(shù)包括Status(狀態(tài))、描述、Req.(請(qǐng)求)、sess.(會(huì)話)、S.Attr(會(huì)話屬性)、C.Attr(屬性數(shù))、SESS.TIMEOUT(超時(shí))、JSP、JDBC(JAVA數(shù)據(jù)庫(kù)連接)使用量、集群、序列化中的任一個(gè)或任意組合。通過抓取被監(jiān)控服務(wù)器上的應(yīng)用程序的監(jiān)控頁(yè)面內(nèi)容,在返回結(jié)果中讀取頁(yè)面內(nèi)容中表格(table)標(biāo)簽部分,逐個(gè)解析表格下每個(gè)單元格(td)標(biāo)簽下的值,然后拼成一個(gè)表格的超文本標(biāo)記語(yǔ)言(html)字符串并返回。圖3示例性示出了被監(jiān)控服務(wù)器上的各WEB應(yīng)用在某一時(shí)間點(diǎn)的應(yīng)用程序狀態(tài)的實(shí)例的一部分。(2)Probe線程狀態(tài)監(jiān)控主要監(jiān)控被監(jiān)控服務(wù)器上所有程序下的線程運(yùn)行情況,監(jiān)控參數(shù)包括P(優(yōu)先級(jí))、應(yīng)用、類加載、組、線程類、正在運(yùn)行、D(線程是一個(gè)后臺(tái)程序)、L(線程被掛起)中的任一個(gè)或任意組合。線程狀態(tài)監(jiān)控的程序處理方式同應(yīng)用程序監(jiān)控處理方式一樣,也是抓取頁(yè)面然后讀取數(shù)據(jù),最后拼字符串并返回。圖4示例性示出了被監(jiān)控服務(wù)器上某一時(shí)間點(diǎn)的線程狀態(tài)的實(shí)例的一部分。(3)Probe連接狀態(tài)監(jiān)控主要監(jiān)控被監(jiān)控服務(wù)器上的WEB應(yīng)用接收到的請(qǐng)求數(shù)目,通過正則分析REQUESTSCOUNT(請(qǐng)求計(jì)數(shù))和ERRORCOUNT(錯(cuò)誤計(jì)數(shù))關(guān)鍵字,獲取這兩個(gè)關(guān)鍵字的值,最后返回這兩個(gè)關(guān)鍵字的值的比值。REQUESTSCOUNT與ERRORCOUNT的值的比值越大就說明連接狀態(tài)越好。圖5示例性示出了被監(jiān)控服務(wù)器上的各WEB應(yīng)用在某一時(shí)間點(diǎn)的連接狀態(tài)的實(shí)例。(4)Probe應(yīng)用處理狀態(tài)監(jiān)控的監(jiān)控參數(shù)包括遠(yuǎn)程IP、STAGE(階段)、PR0C.TIME(處理時(shí)間)、IN(輸入)、0UT(輸出)、URL等,處理方式也是抓取頁(yè)面、讀取數(shù)據(jù),最后拼字符串并返回。圖6示例性示出了被監(jiān)控服務(wù)器上的包含多種監(jiān)控參數(shù)的應(yīng)用處理狀態(tài)的實(shí)例的一部分。本發(fā)明還能夠進(jìn)行被監(jiān)控服務(wù)器上的日志監(jiān)控,也就是說,本發(fā)明的監(jiān)控系統(tǒng)還能夠通過對(duì)被監(jiān)控服務(wù)器上的日志進(jìn)行分析,找出應(yīng)用系統(tǒng)中的隱患,從而實(shí)現(xiàn)監(jiān)控系統(tǒng)的預(yù)警功能。本發(fā)明的監(jiān)控系統(tǒng)分析被監(jiān)控服務(wù)器上的訪問日志,獲取訪問日志中記錄的請(qǐng)求的字節(jié)數(shù)、請(qǐng)求的響應(yīng)時(shí)間等信息。如果日志中某段時(shí)間記錄中請(qǐng)求的響應(yīng)時(shí)間比較長(zhǎng)(比如200ms),響應(yīng)時(shí)間比較長(zhǎng)的請(qǐng)求的數(shù)量超過預(yù)期設(shè)定值,監(jiān)控系統(tǒng)會(huì)發(fā)出預(yù)警信息;當(dāng)請(qǐng)求返回的字節(jié)數(shù)普遍都很低時(shí),低于閾值時(shí),這說明該請(qǐng)求返回的僅僅是字節(jié)數(shù)很少的錯(cuò)誤指示頁(yè)面,也會(huì)發(fā)出預(yù)警信息提醒技術(shù)人員及時(shí)處理,避免系統(tǒng)出現(xiàn)更嚴(yán)重錯(cuò)誤。圖7示例性示出了根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控方法來監(jiān)控被監(jiān)控服務(wù)器上的訪問日志的流程圖,其流程與圖2中所示的流程類似。技術(shù)人員也可以根據(jù)本發(fā)明的監(jiān)控系統(tǒng)對(duì)被監(jiān)控服務(wù)器上的訪問日志中記錄的請(qǐng)求的字節(jié)數(shù)、請(qǐng)求的響應(yīng)時(shí)間等信息的分析結(jié)果來有效地回溯故障。圖8示例性示出了由根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng)發(fā)出的預(yù)警信息的實(shí)例,這是曾經(jīng)接收過的一條根據(jù)本發(fā)明的監(jiān)控系統(tǒng)發(fā)出的預(yù)警信息。圖9示例性示出了通過根據(jù)本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng)查看預(yù)警信息來定位被監(jiān)控服務(wù)器上的故障的實(shí)例。當(dāng)出現(xiàn)預(yù)警信息時(shí),通過本發(fā)明的監(jiān)控系統(tǒng)來查看從數(shù)據(jù)庫(kù)提取的記錄,能夠查看到被監(jiān)控服務(wù)器上的一些連接請(qǐng)求所花費(fèi)的時(shí)間,技術(shù)人員據(jù)此找出的比較慢的請(qǐng)求為contentProductFrontService(本實(shí)例中存在的某個(gè)請(qǐng)求的名稱)。借助于本發(fā)明的具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng)和方法,最后被定位出的問題原因?yàn)閿?shù)據(jù)庫(kù)索引問題。一般的監(jiān)控系統(tǒng)無(wú)法監(jiān)控到被監(jiān)控服務(wù)器上的應(yīng)用系統(tǒng)內(nèi)部的隱患,上面這個(gè)問題如果不被預(yù)警功能發(fā)現(xiàn),就會(huì)造成服務(wù)器CPU占用率升高,等CPU占用率很高的時(shí)候才會(huì)被一般監(jiān)控系統(tǒng)發(fā)現(xiàn),而根據(jù)本發(fā)明的預(yù)警功能則可以在第一時(shí)間發(fā)現(xiàn)問題。而且,本發(fā)明的服務(wù)器監(jiān)控方法及其系統(tǒng)在不依賴特定的操作系統(tǒng)的同時(shí),還能夠?qū)Ψ?wù)器進(jìn)行全方位的監(jiān)控。本申請(qǐng)具有上述優(yōu)點(diǎn)之一或任意組合,但不限于上述優(yōu)點(diǎn)。雖然已參照典型實(shí)施例描述了本申請(qǐng),但應(yīng)當(dāng)理解,所用的術(shù)語(yǔ)是說明和示例性、而非限制性的術(shù)語(yǔ)。由于本申請(qǐng)能夠以多種形式具體實(shí)施而不脫離發(fā)明的精神或?qū)嵸|(zhì),所以應(yīng)當(dāng)理解,上述實(shí)施例不限于任何前述的細(xì)節(jié),而應(yīng)在隨附權(quán)利要求所限定的精神和范圍內(nèi)廣泛地解釋,因此落入權(quán)利要求或其等效范圍內(nèi)的全部變化和改型都應(yīng)為隨附權(quán)利要求所涵蓋。權(quán)利要求一種具有預(yù)警功能的服務(wù)器監(jiān)控方法,包括在監(jiān)控前臺(tái)的控制終端來配置被監(jiān)控服務(wù)器的監(jiān)控參數(shù)并設(shè)定與所述監(jiān)控參數(shù)相應(yīng)的閾值;經(jīng)由WEB服務(wù)器將所述監(jiān)控參數(shù)和所述閾值記錄到數(shù)據(jù)庫(kù)中;由監(jiān)控后臺(tái)的監(jiān)控服務(wù)器從所述數(shù)據(jù)庫(kù)中提取所述監(jiān)控參數(shù)和所述閾值;由所述監(jiān)控服務(wù)器根據(jù)所述監(jiān)控參數(shù)和所述閾值來監(jiān)控所述被監(jiān)控服務(wù)器,并產(chǎn)生監(jiān)控結(jié)果;由所述監(jiān)控服務(wù)器將所述監(jiān)控結(jié)果記錄到所述數(shù)據(jù)庫(kù)中;以及由所述WEB服務(wù)器從所述數(shù)據(jù)庫(kù)提取所述監(jiān)控結(jié)果并將所述監(jiān)控結(jié)果呈現(xiàn)在所述控制終端,其中,當(dāng)所述監(jiān)控結(jié)果為所述監(jiān)控參數(shù)與所述閾值不相匹配時(shí),所述監(jiān)控服務(wù)器就調(diào)用所述監(jiān)控后臺(tái)的報(bào)警系統(tǒng)進(jìn)行報(bào)警。2.根據(jù)權(quán)利要求1所述的具有預(yù)警功能的服務(wù)器監(jiān)控方法,其中,所述被監(jiān)控服務(wù)器是服務(wù)器集群。3.根據(jù)權(quán)利要求1所述的具有預(yù)警功能的服務(wù)器監(jiān)控方法,其中,所述監(jiān)控參數(shù)包括所述被監(jiān)控服務(wù)器的CPU資源參數(shù)、內(nèi)存資源參數(shù)、輸入/輸出資源參數(shù)、網(wǎng)絡(luò)資源參數(shù)、或應(yīng)用系統(tǒng)的運(yùn)行參數(shù)。4.根據(jù)權(quán)利要求1所述的具有預(yù)警功能的服務(wù)器監(jiān)控方法,其中,所述監(jiān)控結(jié)果通過安裝在所述被監(jiān)控服務(wù)器中的開源監(jiān)控軟件而獲得。5.根據(jù)權(quán)利要求1所述的具有預(yù)警功能的服務(wù)器監(jiān)控方法,其中,所述監(jiān)控服務(wù)器向所述被監(jiān)控服務(wù)器發(fā)送指定數(shù)量的互聯(lián)網(wǎng)控制報(bào)文協(xié)議包,并對(duì)所述被監(jiān)控服務(wù)器返回的結(jié)果進(jìn)行分析,以便產(chǎn)生所述被監(jiān)控服務(wù)器的網(wǎng)絡(luò)狀況的所述監(jiān)控結(jié)果。6.根據(jù)權(quán)利要求1所述的具有預(yù)警功能的服務(wù)器監(jiān)控方法,其中,所述監(jiān)控服務(wù)器模擬訪問事先存放在所述被監(jiān)控服務(wù)器上的應(yīng)用系統(tǒng)中的JAVA服務(wù)器頁(yè)面文件,獲得所述被監(jiān)控服務(wù)器返回的結(jié)果,以便產(chǎn)生所述被監(jiān)控服務(wù)器上的應(yīng)用系統(tǒng)的所述監(jiān)控結(jié)果。7.根據(jù)權(quán)利要求1所述的具有預(yù)警功能的服務(wù)器監(jiān)控方法,其中,所述監(jiān)控服務(wù)器監(jiān)控所述被監(jiān)控服務(wù)器上的WEB應(yīng)用下的各應(yīng)用程序的運(yùn)行,其中,所述監(jiān)控參數(shù)包括所述應(yīng)用程序的狀態(tài)、描述、請(qǐng)求、會(huì)話、會(huì)話屬性、屬性數(shù)、超時(shí)、JAVA服務(wù)器頁(yè)面、JAVA數(shù)據(jù)庫(kù)連接使用量、集群、與序列化中的任一個(gè)或任意組合。8.根據(jù)權(quán)利要求1所述的具有預(yù)警功能的服務(wù)器監(jiān)控方法,其中,所述監(jiān)控服務(wù)器監(jiān)控所述被監(jiān)控服務(wù)器上的所有程序的線程,其中,所述監(jiān)控參數(shù)包括優(yōu)先級(jí)、應(yīng)用、類加載、組、線程類、是否正在運(yùn)行、是否線程是一個(gè)后臺(tái)程序、與是否線程被掛起中的任一個(gè)或任思組合。9.根據(jù)權(quán)利要求1所述的具有預(yù)警功能的服務(wù)器監(jiān)控方法,其中,所述監(jiān)控服務(wù)器監(jiān)控所述被監(jiān)控服務(wù)器上的訪問日志,對(duì)所述訪問日志進(jìn)行分析并返回所述監(jiān)控結(jié)果。10.根據(jù)權(quán)利要求1所述的具有預(yù)警功能的服務(wù)器監(jiān)控方法,其中,通過在所述監(jiān)控前臺(tái)查看記錄在所述數(shù)據(jù)庫(kù)中的所述監(jiān)控結(jié)果來回溯故障的歷史信息。11.一種具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng),包括監(jiān)控前臺(tái),所述監(jiān)控前臺(tái)包括控制終端和WEB服務(wù)器;數(shù)據(jù)庫(kù);以及監(jiān)控后臺(tái),所述監(jiān)控后臺(tái)包括監(jiān)控服務(wù)器和報(bào)警系統(tǒng),其中,在所述監(jiān)控前臺(tái)的控制終端來配置被監(jiān)控服務(wù)器的監(jiān)控參數(shù)并設(shè)定與所述監(jiān)控參數(shù)相應(yīng)的閾值;經(jīng)由WEB服務(wù)器將所述監(jiān)控參數(shù)和所述閾值記錄到數(shù)據(jù)庫(kù)中;由所述監(jiān)控后臺(tái)的監(jiān)控服務(wù)器從所述數(shù)據(jù)庫(kù)中提取所述監(jiān)控參數(shù)和所述閾值;由所述監(jiān)控服務(wù)器根據(jù)所述監(jiān)控參數(shù)和所述閾值來監(jiān)控所述被監(jiān)控服務(wù)器,并產(chǎn)生監(jiān)控結(jié)果;由所述監(jiān)控服務(wù)器將所述監(jiān)控結(jié)果記錄到所述數(shù)據(jù)庫(kù)中;以及由所述WEB服務(wù)器從所述數(shù)據(jù)庫(kù)提取所述監(jiān)控結(jié)果并將所述監(jiān)控結(jié)果呈現(xiàn)在所述控制終端,其中,當(dāng)所述監(jiān)控結(jié)果為所述監(jiān)控參數(shù)與所述閾值不相匹配時(shí),所述監(jiān)控服務(wù)器就調(diào)用所述監(jiān)控后臺(tái)的報(bào)警系統(tǒng)進(jìn)行報(bào)警。12.根據(jù)權(quán)利要求11所述的具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng),其中,所述被監(jiān)控服務(wù)器是服務(wù)器集群。13.根據(jù)權(quán)利要求11所述的具有預(yù)警功能的服務(wù)器監(jiān)控系統(tǒng),其中,通過在所述監(jiān)控前臺(tái)查看記錄在所述數(shù)據(jù)庫(kù)中的所述監(jiān)控結(jié)果來回溯故障的歷史信息。全文摘要一種具有預(yù)警功能的服務(wù)器監(jiān)控方法,包括在監(jiān)控前臺(tái)的控制終端來配置被監(jiān)控服務(wù)器的監(jiān)控參數(shù)并設(shè)定與所述監(jiān)控參數(shù)相應(yīng)的閾值;經(jīng)由WEB服務(wù)器將所述監(jiān)控參數(shù)和所述閾值記錄到數(shù)據(jù)庫(kù)中;由監(jiān)控后臺(tái)的監(jiān)控服務(wù)器從所述數(shù)據(jù)庫(kù)中提取所述監(jiān)控參數(shù)和所述閾值;由所述監(jiān)控服務(wù)器根據(jù)所述監(jiān)控參數(shù)和所述閾值來監(jiān)控所述被監(jiān)控服務(wù)器,并產(chǎn)生監(jiān)控結(jié)果;由所述監(jiān)控服務(wù)器將所述監(jiān)控結(jié)果記錄到所述數(shù)據(jù)庫(kù)中;以及由所述WEB服務(wù)器從所述數(shù)據(jù)庫(kù)提取所述監(jiān)控結(jié)果并將所述監(jiān)控結(jié)果呈現(xiàn)在所述控制終端,其中,當(dāng)所述監(jiān)控結(jié)果為所述監(jiān)控參數(shù)與所述閾值不相匹配時(shí),所述監(jiān)控服務(wù)器就調(diào)用所述監(jiān)控后臺(tái)的報(bào)警系統(tǒng)進(jìn)行報(bào)警。文檔編號(hào)H04L12/26GK101997925SQ20101055425公開日2011年3月30日申請(qǐng)日期2010年11月22日優(yōu)先權(quán)日2010年11月22日發(fā)明者王碩,齊賀申請(qǐng)人:北京亮點(diǎn)時(shí)間科技有限公司