本發(fā)明屬于服務(wù)器技術(shù)領(lǐng)域,特別是涉及一種中央服務(wù)器、業(yè)務(wù)服務(wù)器及其異常檢測(cè)方法和系統(tǒng)。
背景技術(shù):
大數(shù)據(jù)(big data),指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,需要經(jīng)過處理模式的處理才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
集群一般由數(shù)量龐大的業(yè)務(wù)服務(wù)器組成,集群中的大數(shù)據(jù)的分析處理,如通過對(duì)集群中各業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息的分析處理,一般通過大數(shù)據(jù)平臺(tái)進(jìn)行,以得到集群中業(yè)務(wù)服務(wù)器的運(yùn)行異常檢測(cè)結(jié)果。
但是,現(xiàn)有的集群中業(yè)務(wù)服務(wù)器的運(yùn)行異常檢測(cè)方法,存在著成本高且效率低下的問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例解決的問題是如何在對(duì)集群中的業(yè)務(wù)服務(wù)器進(jìn)行異常檢測(cè)時(shí)節(jié)省成本,并提高效率。
為解決上述問題,本發(fā)明實(shí)施例提供了一種業(yè)務(wù)服務(wù)器異常檢測(cè)方法,所述方法包括:提取自身的系統(tǒng)特征信息并發(fā)送至預(yù)設(shè)的中央服務(wù)器,以使得所述中央服務(wù)器對(duì)集群中的業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行匯總得到總系統(tǒng)特征信息;接收所述中央服務(wù)器發(fā)送的所述總系統(tǒng)特征信息;基于接收所述中央服務(wù)器發(fā)送的所述總系統(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值;將計(jì)算得到的檢測(cè)返回值發(fā)送至所述中央服務(wù)器,以使得所述中央服務(wù)器根據(jù)所有業(yè)務(wù)服務(wù)器發(fā)送的距離返回值確定存在異常的業(yè)務(wù)服務(wù)器的信息。
可選地,所述基于接收所述中央服務(wù)器發(fā)送的所述總系統(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算對(duì)應(yīng)的檢測(cè)返回值,包括:?;谒隹傁到y(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算自身所屬的聚簇;基于自身所屬的聚簇,計(jì)算自身的系統(tǒng)特征系統(tǒng)與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離;基于計(jì)算得到的自身的系統(tǒng)特征系統(tǒng)與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值。
可選地,所述系統(tǒng)特征信息包括系統(tǒng)日志、應(yīng)用日志、進(jìn)程、流量、CPU用量和內(nèi)存用量。
本發(fā)明實(shí)施例還提供了另一種業(yè)務(wù)服務(wù)器異常檢測(cè)方法,包括:接收集群中各業(yè)務(wù)服務(wù)器發(fā)送的系統(tǒng)特征信息;將所接收的集群中各業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行匯總,得到所述集群的總系統(tǒng)特征信息;將所得到的總系統(tǒng)特征信息分別發(fā)送至所述集群中的業(yè)務(wù)服務(wù)器,以使所述集群中的業(yè)務(wù)服務(wù)器基于接收的所述總系統(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算對(duì)應(yīng)的檢測(cè)返回值;基于所接收到的集群中的各業(yè)務(wù)服務(wù)器發(fā)送的檢測(cè)返回值,確定存在異常的業(yè)務(wù)服務(wù)器的信息。
可選地,所述基于所接收到的集群中的各業(yè)務(wù)服務(wù)器發(fā)送的檢測(cè)返回值,確定存在異常的業(yè)務(wù)服務(wù)器的信息,包括:將集群中的各業(yè)務(wù)服務(wù)器發(fā)送的檢測(cè)返回值按照遞減的排序進(jìn)行排序,并將排列在頭部的預(yù)設(shè)數(shù)量的檢測(cè)返回值對(duì)應(yīng)的業(yè)務(wù)服務(wù)器作為存在異常的業(yè)務(wù)服務(wù)器。
可選地,所述方法還包括:基于所確定的存在異常的業(yè)務(wù)服務(wù)器的信息,生成對(duì)應(yīng)的告警信息并輸出。
可選地,所述系統(tǒng)特征信息包括系統(tǒng)日志、應(yīng)用日志、進(jìn)程、流量、CPU用量和內(nèi)存用量。
本發(fā)明實(shí)施例還提供了一種業(yè)務(wù)服務(wù)器,包括:提取單元,適于提取自身的系統(tǒng)特征信息;第一發(fā)送單元,適于將所提取的自身的系統(tǒng)特征信息發(fā)送至預(yù)設(shè)的中央服務(wù)器,以使得所述中央服務(wù)器對(duì)集群中的業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行匯總得到總系統(tǒng)特征信息;第一接收單元,適于接收所述中央服務(wù)器發(fā)送的所述總系統(tǒng)特征信息;計(jì)算單元,適于基于接收所述中央服務(wù)器發(fā)送的所述總系統(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值;第二發(fā)送單元,適于將計(jì)算得到的檢測(cè)返回值發(fā)送至所述中央服務(wù)器,以使得所述中央服務(wù)器根據(jù)所有業(yè)務(wù)服務(wù)器發(fā)送的距離返回值確定存在異常的業(yè)務(wù)服務(wù)器的信息。
可選地,所述計(jì)算單元,適于基于所述總系統(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算自身所屬的聚簇;基于自身所屬的聚簇,計(jì)算自身的系統(tǒng)特征系統(tǒng)與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離;基于計(jì)算得到的自身的系統(tǒng)特征系統(tǒng)與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值。
可選地,所述系統(tǒng)特征信息包括系統(tǒng)日志、應(yīng)用日志、進(jìn)程、流量、CPU用量和內(nèi)存用量。
本發(fā)明實(shí)施例還提供了一種中央服務(wù)器,包括:第二接收單元,適于接收集群中各業(yè)務(wù)服務(wù)器發(fā)送的系統(tǒng)特征信息;匯總單元,適于將所接收的集群中各業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行匯總,得到所述集群的總系統(tǒng)特征信息;第三發(fā)送單元,適于將所得到的總系統(tǒng)特征信息分別發(fā)送至所述集群中的業(yè)務(wù)服務(wù)器,以使所述集群中的業(yè)務(wù)服務(wù)器基于接收的所述總系統(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算對(duì)應(yīng)的檢測(cè)返回值;確定單元,適于基于所接收到的集群中的各業(yè)務(wù)服務(wù)器發(fā)送的檢測(cè)返回值,確定存在異常的業(yè)務(wù)服務(wù)器的信息。
可選地,所述確定單元,適于將集群中的各業(yè)務(wù)服務(wù)器發(fā)送的檢測(cè)返回值按照遞減的排序進(jìn)行排序,并將排列在頭部的預(yù)設(shè)數(shù)量的檢測(cè)返回值對(duì)應(yīng)的業(yè)務(wù)服務(wù)器作為存在異常的業(yè)務(wù)服務(wù)器。
可選地,所述中央服務(wù)器還包括:告警單元,適于基于所確定的存在異常的業(yè)務(wù)服務(wù)器的信息,生成對(duì)應(yīng)的告警信息并輸出。
可選地,所述系統(tǒng)特征信息包括系統(tǒng)日志、應(yīng)用日志、進(jìn)程、流量、CPU用量和內(nèi)存用量。
本發(fā)明實(shí)施例還提供了一種業(yè)務(wù)服務(wù)器異常檢測(cè)系統(tǒng),包括多個(gè)上述的業(yè)務(wù)服務(wù)器和上述的中央服務(wù)器。
與現(xiàn)有技術(shù)相比,本發(fā)明的技術(shù)方案具有以下的優(yōu)點(diǎn):
上述的方案,通過集群中的各業(yè)務(wù)服務(wù)器將自身的系統(tǒng)特征信息發(fā)送至預(yù)設(shè)的中央服務(wù)器,所述中央服務(wù)器對(duì)集群中所有業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行將匯總得到集群總特征信息并發(fā)送至集群中的各業(yè)務(wù)服務(wù)器,再由集群中的各業(yè)務(wù)服務(wù)器基于所接收的總系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算得到自身的異常檢測(cè)結(jié)果,由于無(wú)需搭建專門的數(shù)據(jù)分析平臺(tái)便可以對(duì)集群中的業(yè)務(wù)服務(wù)器進(jìn)行異常檢測(cè),因而可以節(jié)省成本,并可以提高效率。
附圖說明
圖1是本發(fā)明實(shí)施例中一種的業(yè)務(wù)服務(wù)器異常檢測(cè)方法的流程圖;
圖2是本發(fā)明實(shí)施例中另一種的業(yè)務(wù)服務(wù)器異常檢測(cè)方法的流程圖;
圖3是本發(fā)明實(shí)施例中的一種業(yè)務(wù)服務(wù)器異常檢測(cè)系統(tǒng)的結(jié)構(gòu)示意圖;
圖4是本發(fā)明實(shí)施例中的一種業(yè)務(wù)服務(wù)器異常檢測(cè)方法對(duì)應(yīng)的信令流程圖;
圖5是本發(fā)明實(shí)施例中的業(yè)務(wù)服務(wù)器的結(jié)構(gòu)示意圖;
圖6是本發(fā)明實(shí)施例中的中央服務(wù)器的結(jié)構(gòu)示意圖。
具體實(shí)施方式
正如背景技術(shù)所言,現(xiàn)有的集群中業(yè)務(wù)服務(wù)器的運(yùn)行異常檢測(cè)方法,一般通過搭建專門的數(shù)據(jù)處理平臺(tái)或者通過專門設(shè)置的一臺(tái)服務(wù)器對(duì)集群中的所有業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行提取和分析,以得到集群中各業(yè)務(wù)服務(wù)器的運(yùn)行異常檢測(cè)結(jié)果。
但是,采用上述的方式,一方面,搭建專門的數(shù)據(jù)處理平臺(tái),需要消耗大量的資源,存在成本高的問題;另一方面,采用單臺(tái)服務(wù)器對(duì)集群中數(shù)量龐大的業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行分析處理,存在著效率低下的問題。
為解決上述問題,本發(fā)明實(shí)施例中的技術(shù)方案通過集群中的各業(yè)務(wù)服務(wù)器將自身的系統(tǒng)特征信息發(fā)送至預(yù)設(shè)的中央服務(wù)器,所述中央服務(wù)器對(duì)集群中所有業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行將匯總得到集群總特征信息并發(fā)送至集群中的各業(yè)務(wù)服務(wù)器,再由集群中的各業(yè)務(wù)服務(wù)器基于所接收的總系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算得到自身的異常檢測(cè)結(jié)果,可以節(jié)省成本,并可以提高效率。
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更為明顯易懂,下面結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施例做詳細(xì)的說明。
圖1是本發(fā)明實(shí)施例中的一種業(yè)務(wù)服務(wù)器異常檢測(cè)方法的流程圖。如圖1所示的業(yè)務(wù)服務(wù)器異常檢測(cè)方法,可以包括:
步驟S101:提取自身的系統(tǒng)特征信息并發(fā)送至預(yù)設(shè)的中央服務(wù)器。
在具體實(shí)施中,集群中的業(yè)務(wù)服務(wù)器可以分別提取自身的系統(tǒng)特征信息并發(fā)送至預(yù)設(shè)的中央服務(wù)器,從而可以使得所述中央服務(wù)器可以獲取集群中所有業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息并進(jìn)行匯總,以得到對(duì)應(yīng)的總系統(tǒng)特征信息。
在具體實(shí)施中,業(yè)務(wù)服務(wù)器所提取的自身的系統(tǒng)特征信息可以業(yè)務(wù)服務(wù)器的異常檢測(cè)的需要進(jìn)行設(shè)置,如包括系統(tǒng)日志、應(yīng)用日志、進(jìn)程、流量、CPU用量以及內(nèi)存用量的信息等。
步驟S102:接收所述中央服務(wù)器發(fā)送的所述總系統(tǒng)特征信息。
在具體實(shí)施中,所述中央服務(wù)器在接收到集群中的所有業(yè)務(wù)服務(wù)器發(fā)送的集群總特征信息時(shí),可以將所接收的集群中的所有業(yè)務(wù)服務(wù)器的總系統(tǒng)特征信息進(jìn)行匯總,并分別發(fā)送至集群中的各業(yè)務(wù)服務(wù)器,以使得集群中的各業(yè)務(wù)服務(wù)器可以獲取所述總系統(tǒng)特征信息。
步驟S103:基于接收所述中央服務(wù)器發(fā)送的所述總系統(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值。
在具體實(shí)施中,業(yè)務(wù)服務(wù)器在接收到中央服務(wù)器發(fā)送的集群總特征信息時(shí),便可以基于所接收的總系統(tǒng)特征信息以及自身的系統(tǒng)特征信息,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值并發(fā)送至中央服務(wù)器,使得中央服務(wù)器可以獲取對(duì)應(yīng)的檢測(cè)返回值。
步驟S104:將計(jì)算得到的檢測(cè)返回值發(fā)送至所述中央服務(wù)器,以使得所述中央服務(wù)器根據(jù)所有業(yè)務(wù)服務(wù)器發(fā)送的距離返回值確定存在異常的業(yè)務(wù)服務(wù)器的信息。
在具體實(shí)施中,各業(yè)務(wù)服務(wù)器在計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值時(shí),可以將對(duì)應(yīng)的檢測(cè)返回值發(fā)送至中央服務(wù)器,以使得中央服務(wù)器可以基于各業(yè)務(wù)服務(wù)器基于各業(yè)務(wù)服務(wù)器的檢測(cè)返回值確定集群中存在異常的業(yè)務(wù)服務(wù)器的信息。
圖2示出了本發(fā)明實(shí)施例中的另一種業(yè)務(wù)服務(wù)器異常檢測(cè)方法的流程圖。參見圖2,本發(fā)明實(shí)施例中的業(yè)務(wù)服務(wù)器異常檢測(cè)方法,可以具體采用如下的操作實(shí)現(xiàn):
步驟S201:接收集群中各業(yè)務(wù)服務(wù)器發(fā)送的系統(tǒng)特征信息。
在具體實(shí)施中,在進(jìn)行集群中的業(yè)務(wù)服務(wù)器的異常檢測(cè)時(shí),可以首先接收集群中的各業(yè)務(wù)服務(wù)器發(fā)送的系統(tǒng)特征信息。
步驟S202:將所接收的集群中各業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行匯總,得到所述集群的總系統(tǒng)特征信息。
在具體實(shí)施中,中央服務(wù)器在接收到各業(yè)務(wù)服務(wù)器發(fā)送的各自的系統(tǒng)特征信息時(shí),可以將所接收的集群中的所有業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行匯總,從而得到集群的總系統(tǒng)特征信息。例如,中央服務(wù)器可以生成對(duì)應(yīng)的列表,在所述列表中包括集群中的各個(gè)業(yè)務(wù)服務(wù)器的標(biāo)識(shí)以及該業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息。其中,各個(gè)業(yè)務(wù)服務(wù)器的標(biāo)識(shí)可以為IP地址等。
步驟S203:將所得到的總系統(tǒng)特征信息分別發(fā)送至所述集群中的業(yè)務(wù)服務(wù)器。
在具體實(shí)施中,中央服務(wù)器在匯總得到對(duì)應(yīng)的總系統(tǒng)特征信息時(shí),可以將所述總系統(tǒng)特征信息分別發(fā)送至集群中的各個(gè)業(yè)務(wù)服務(wù)器,以使所述集群中的業(yè)務(wù)服務(wù)器可以基于所接收的總系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算得到自身對(duì)應(yīng)的檢測(cè)返回值并發(fā)送。
步驟S204:基于所接收到的集群中的各業(yè)務(wù)服務(wù)器發(fā)送的檢測(cè)返回值,確定存在異常的業(yè)務(wù)服務(wù)器的信息。
在具體實(shí)施中,中央服務(wù)器可以基于集群中各個(gè)業(yè)務(wù)服務(wù)器發(fā)送的檢測(cè)返回值的信息,確定集群中存在異常的業(yè)務(wù)服務(wù)器的信息。
上述的方案,通過集群中的各業(yè)務(wù)服務(wù)器將自身的系統(tǒng)特征信息發(fā)送至預(yù)設(shè)的中央服務(wù)器,以使得所述中央服務(wù)器對(duì)集群中所有業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行將匯總得到集群總特征信息并發(fā)送至集群中的各業(yè)務(wù)服務(wù)器,再由集群中的各業(yè)務(wù)服務(wù)器基于所接收的總系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算得到自身的異常檢測(cè)結(jié)果,由于無(wú)需搭建專門的數(shù)據(jù)分析平臺(tái)便可以是集群中業(yè)務(wù)服務(wù)器的異常檢測(cè),因而可以節(jié)省成本,并可以提高效率。
下面將對(duì)本發(fā)明實(shí)施例中的業(yè)務(wù)服務(wù)器異常檢測(cè)方法進(jìn)行詳細(xì)的介紹。
為了便于理解,下面首先對(duì)本發(fā)明實(shí)施例中的業(yè)務(wù)服務(wù)器異常檢測(cè)系統(tǒng)的結(jié)構(gòu)進(jìn)行介紹。
參見圖3,本發(fā)明實(shí)施例中的一種業(yè)務(wù)服務(wù)器異常檢測(cè)系統(tǒng)可以包括由多個(gè)業(yè)務(wù)服務(wù)器3011~301n組成的集群和中央服務(wù)器302。其中,集群中的業(yè)務(wù)服務(wù)器3011~301n分別與中央服務(wù)器302連接。
參見圖4,本發(fā)明實(shí)施例中的一種業(yè)務(wù)服務(wù)器異常檢測(cè)方法,用于對(duì)集群中的所有的業(yè)務(wù)服務(wù)器的運(yùn)行異常狀態(tài)進(jìn)行檢測(cè),具體可以采用如下的操作實(shí)現(xiàn):
步驟S401:集群中的業(yè)務(wù)服務(wù)器提取自身的系統(tǒng)特征信息并發(fā)送至中央服務(wù)器。
在具體實(shí)施中,在進(jìn)行業(yè)務(wù)服務(wù)器異常檢測(cè)時(shí),可以首先設(shè)定相應(yīng)的檢測(cè)周期,當(dāng)達(dá)到對(duì)應(yīng)的檢測(cè)周期時(shí),可以啟動(dòng)業(yè)務(wù)服務(wù)器的異常檢測(cè)。此時(shí),確定達(dá)到對(duì)應(yīng)的檢測(cè)周期時(shí),集群中的各業(yè)務(wù)服務(wù)器可以分別按照對(duì)應(yīng)的系統(tǒng)特征信息的設(shè)置,從自身的系統(tǒng)中提取對(duì)應(yīng)的系統(tǒng)特征信息,作為自身的系統(tǒng)特征信息并發(fā)送至中央服務(wù)器。其中,所設(shè)置的檢測(cè)周期可以根據(jù)需要,如客戶的需求進(jìn)行設(shè)置等。
步驟S402:所述中央服務(wù)器接收業(yè)務(wù)服務(wù)器的總系統(tǒng)特征信息并進(jìn)行匯總得到對(duì)應(yīng)的總系統(tǒng)特征信息。
步驟S403:所述中央服務(wù)器將所述總系統(tǒng)特征信息發(fā)送至集群中的各個(gè)業(yè)務(wù)服務(wù)器。
在具體實(shí)施中,中央服務(wù)器在接收到集群中的所有業(yè)務(wù)服務(wù)器發(fā)送的集群總特征信息時(shí),可以將所接收的集群中的所有業(yè)務(wù)服務(wù)器的總系統(tǒng)特征信息進(jìn)行匯總,并分別發(fā)送至集群中的各業(yè)務(wù)服務(wù)器,以使得集群中的各業(yè)務(wù)服務(wù)器可以獲取所述總系統(tǒng)特征信息。
步驟S404:所述業(yè)務(wù)服務(wù)器接收所述總系統(tǒng)特征信息。
在具體實(shí)施中,集群中的各個(gè)業(yè)務(wù)服務(wù)器所接收的系統(tǒng)總特征信息中不僅包括集群中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息,還包括自身的系統(tǒng)總特征信息。
步驟S405:各個(gè)業(yè)務(wù)服務(wù)器基于所接收到的系統(tǒng)總特征信息與自身的系統(tǒng)特征信息,確定自身所屬的聚簇,并計(jì)算自身的系統(tǒng)特征信息與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離。
在具體實(shí)施中,集群中的各個(gè)業(yè)務(wù)服務(wù)器在接收到所述總系統(tǒng)特征信息時(shí),采用相應(yīng)的聚類算法確定自身所屬的聚簇,也即是確定與自身屬于同一聚簇中的其他業(yè)務(wù)服務(wù)器的信息。
當(dāng)確定自身所屬聚簇中的其他業(yè)務(wù)服務(wù)器的信息時(shí),各個(gè)業(yè)務(wù)服務(wù)器可以采用自身的系統(tǒng)特征信息和聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息以及自身的系統(tǒng)特征信息,計(jì)算自身的系統(tǒng)特征信息與聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離。
步驟S406:所述業(yè)務(wù)服務(wù)器基于計(jì)算自身的系統(tǒng)特征信息與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值。
在具體實(shí)施中,當(dāng)計(jì)算得到自身的系統(tǒng)特征信息與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離時(shí),各個(gè)業(yè)務(wù)服務(wù)器可以采用計(jì)算得到自身的系統(tǒng)特征信息與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值。
在具體實(shí)施中,各個(gè)業(yè)務(wù)服務(wù)器可以采用計(jì)算得到的自身的系統(tǒng)特征信息與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值的方法可以根據(jù)實(shí)際的需要進(jìn)行選取。例如,可以將計(jì)算得到的自身的系統(tǒng)特征信息與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離進(jìn)行相加,得到對(duì)應(yīng)的檢測(cè)返回值等。
步驟S407:所述業(yè)務(wù)服務(wù)器將計(jì)算得到的對(duì)應(yīng)的檢測(cè)返回值發(fā)送至中央服務(wù)器。
在具體實(shí)施中,當(dāng)計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值時(shí),集群中的各個(gè)業(yè)務(wù)服務(wù)器可以將對(duì)應(yīng)的檢測(cè)返回值發(fā)送至中央服務(wù)器。
步驟S408:所述中央服務(wù)器接收集群中各業(yè)務(wù)服務(wù)器發(fā)送的檢測(cè)返回值的信息。
在具體實(shí)施中,中央服務(wù)器所接收的檢測(cè)返回值與集群中的各個(gè)業(yè)務(wù)服務(wù)器一一對(duì)應(yīng)。
步驟S409:所述中央服務(wù)器基于所接收的集群中各業(yè)務(wù)服務(wù)器的檢測(cè)返回值確定存在異常的業(yè)務(wù)服務(wù)器的信息。
在具體實(shí)施中,當(dāng)接收到集群中各業(yè)務(wù)服務(wù)器的檢測(cè)返回值時(shí),中央服務(wù)器可以基于集群中各業(yè)務(wù)服務(wù)器的檢測(cè)返回值確定存在異常的業(yè)務(wù)服務(wù)器。其中,系統(tǒng)特征信息與聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離越大時(shí),也即聚簇中的離群點(diǎn)對(duì)應(yīng)的檢測(cè)返回值也較大。因此,可以將集群中各業(yè)務(wù)服務(wù)器的檢測(cè)返回值進(jìn)行排序,并將數(shù)值較大的預(yù)設(shè)數(shù)量的檢測(cè)返回值對(duì)應(yīng)的業(yè)務(wù)服務(wù)器,作為存在異常的業(yè)務(wù)服務(wù)器。
步驟S410:基于確定存在異常的業(yè)務(wù)服務(wù)器的信息,生成對(duì)應(yīng)的告警信息并輸出。
在具體實(shí)施中,中央服務(wù)器在確定集群中存在異常的離群點(diǎn)的信息時(shí),便可以生成對(duì)應(yīng)的告警信息并輸出,從而可以使得用戶獲取存在異常的業(yè)務(wù)服務(wù)器的信息,以便客戶可以采取相應(yīng)的措施消除業(yè)務(wù)服務(wù)器的運(yùn)行異常,從而可以提高集群的運(yùn)行可靠性。
采用上述的方案對(duì)集群中業(yè)務(wù)服務(wù)器進(jìn)行異常檢測(cè),可以顯著提高異常檢測(cè)的速度。以集群中包括20000臺(tái)業(yè)務(wù)服務(wù)器為例,采用本發(fā)明實(shí)施例中異常檢測(cè)方法時(shí),最消耗計(jì)算資源的地方在于聚簇算法中需要計(jì)算每個(gè)業(yè)務(wù)服務(wù)器與其他業(yè)務(wù)服務(wù)器之間的距離。其中,當(dāng)計(jì)算一臺(tái)業(yè)務(wù)服務(wù)器與19999臺(tái)其他業(yè)務(wù)服務(wù)器之間的距離分別需要0.4秒時(shí),采用現(xiàn)有技術(shù)中的方法,需要消耗的時(shí)間為:0.4*20000=2.2小時(shí)。但是,采用本發(fā)明實(shí)施例中的服務(wù)器異常檢測(cè)方法,每臺(tái)業(yè)務(wù)服務(wù)器僅消耗0.4秒上傳對(duì)應(yīng)的檢測(cè)返回值,中央服務(wù)器僅需做一個(gè)20000個(gè)數(shù)值的檢測(cè)返回值的排序即可得到對(duì)應(yīng)的異常檢測(cè)結(jié)果,因而可以提高業(yè)務(wù)服務(wù)器的異常檢測(cè)速度。
上述對(duì)本發(fā)明實(shí)施例中的業(yè)務(wù)服務(wù)器異常檢測(cè)方法進(jìn)行了詳細(xì)的描述,下面將對(duì)上述的方法對(duì)應(yīng)的裝置進(jìn)行介紹。
圖5示出了本發(fā)明實(shí)施例中的一種業(yè)務(wù)服務(wù)器的結(jié)構(gòu)。參見圖5,本發(fā)明實(shí)施例中的一種業(yè)務(wù)服務(wù)器500可以包括提取單元501、第一發(fā)送單元502、第一接收單元503、計(jì)算單元504和第二發(fā)送單元505,其中:
提取單元501,適于提取自身的系統(tǒng)特征信息。
第一發(fā)送單元502,適于將所提取的自身的系統(tǒng)特征信息發(fā)送至預(yù)設(shè)的中央服務(wù)器,以使得所述中央服務(wù)器對(duì)集群中的業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行匯總得到總系統(tǒng)特征信息。
第一接收單元503,適于接收所述中央服務(wù)器發(fā)送的所述總系統(tǒng)特征信息。
計(jì)算單元504,適于基于接收所述中央服務(wù)器發(fā)送的所述總系統(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值。
第二發(fā)送單元505,適于將計(jì)算得到的檢測(cè)返回值發(fā)送至所述中央服務(wù)器,以使得所述中央服務(wù)器根據(jù)所有業(yè)務(wù)服務(wù)器發(fā)送的距離返回值確定存在異常的業(yè)務(wù)服務(wù)器的信息。
在本發(fā)明一實(shí)施例中,所述計(jì)算單元504,適于基于所述總系統(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算自身所屬的聚簇;基于自身所屬的聚簇,計(jì)算自身的系統(tǒng)特征系統(tǒng)與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離;基于計(jì)算得到的自身的系統(tǒng)特征系統(tǒng)與所屬聚簇中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息之間的距離,計(jì)算得到對(duì)應(yīng)的檢測(cè)返回值。
在具體實(shí)施中,所述系統(tǒng)特征信息可以包括系統(tǒng)日志、應(yīng)用日志、進(jìn)程、流量、CPU用量和內(nèi)存用量。
圖6示出了本發(fā)明實(shí)施例中的一種中央服務(wù)器的結(jié)構(gòu)。參見圖6,一種中央服務(wù)器600可以包括第二接收單元601、匯總單元602、第三發(fā)送單元603和確定單元604,其中:
第二接收單元601,適于接收集群中各業(yè)務(wù)服務(wù)器發(fā)送的系統(tǒng)特征信息。
匯總單元602,適于將所接收的集群中各業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行匯總,得到所述集群的總系統(tǒng)特征信息。
第三發(fā)送單元603,適于將所得到的總系統(tǒng)特征信息分別發(fā)送至所述集群中的業(yè)務(wù)服務(wù)器,以使所述集群中的業(yè)務(wù)服務(wù)器基于接收的所述總系統(tǒng)特征信息中其他業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算對(duì)應(yīng)的檢測(cè)返回值。
確定單元604,適于基于所接收到的集群中的各業(yè)務(wù)服務(wù)器發(fā)送的檢測(cè)返回值,確定存在異常的業(yè)務(wù)服務(wù)器的信息。
在具體實(shí)施中,所述確定單元,適于將集群中的各業(yè)務(wù)服務(wù)器發(fā)送的檢測(cè)返回值按照遞減的排序進(jìn)行排序,并將排列在頭部的預(yù)設(shè)數(shù)量的檢測(cè)返回值對(duì)應(yīng)的業(yè)務(wù)服務(wù)器作為存在異常的業(yè)務(wù)服務(wù)器。
在本發(fā)明一實(shí)施例中,為了使得用戶可以及時(shí)地獲知業(yè)務(wù)服務(wù)器的異常信息,所述中央服務(wù)器600還可以包括告警單元605,其中:
告警單元605,適于基于所確定的存在異常的業(yè)務(wù)服務(wù)器的信息,生成對(duì)應(yīng)的告警信息并輸出。
在具體實(shí)施中,所述系統(tǒng)特征信息包括系統(tǒng)日志、應(yīng)用日志、進(jìn)程、流量、CPU用量和內(nèi)存用量。
采用本發(fā)明實(shí)施例中的上述方案,通過集群中的各業(yè)務(wù)服務(wù)器將自身的系統(tǒng)特征信息發(fā)送至預(yù)設(shè)的中央服務(wù)器,以使得所述中央服務(wù)器對(duì)集群中所有業(yè)務(wù)服務(wù)器的系統(tǒng)特征信息進(jìn)行將匯總得到集群總特征信息并發(fā)送至集群中的各業(yè)務(wù)服務(wù)器,再由集群中的各業(yè)務(wù)服務(wù)器基于所接收的總系統(tǒng)特征信息與自身的系統(tǒng)特征信息,計(jì)算得到自身的異常檢測(cè)結(jié)果,由于無(wú)需搭建專門的數(shù)據(jù)分析平臺(tái)便可以是集群中業(yè)務(wù)服務(wù)器的異常檢測(cè),因而可以節(jié)省成本,并可以提高效率。
本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲(chǔ)于計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括:ROM、RAM、磁盤或光盤等。
以上對(duì)本發(fā)明實(shí)施例的方法及系統(tǒng)做了詳細(xì)的介紹,本發(fā)明并不限于此。任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),均可作各種更動(dòng)與修改,因此本發(fā)明的保護(hù)范圍應(yīng)當(dāng)以權(quán)利要求所限定的范圍為準(zhǔn)。