本發(fā)明涉及計算機技術(shù)領(lǐng)域,具體涉及一種判斷集群中的服務(wù)器是否需要回收的方法和裝置。
背景技術(shù):
隨著計算機和互聯(lián)網(wǎng)的普及,基于服務(wù)器的業(yè)務(wù)不斷的發(fā)展。在服務(wù)器提供業(yè)務(wù)服務(wù)的過程中,隨著時間的推移,有些服務(wù)器會面臨過保或未被充分使用等情況的出現(xiàn),若服務(wù)器出現(xiàn)問題,會對整個系統(tǒng)業(yè)務(wù)造成嚴(yán)重的影響;若服務(wù)器未被充分使用,則會造成資源的浪費。為了避免上述情況的出現(xiàn),需要對這些面臨過保或未被充分使用的服務(wù)器進行回收以進行淘汰或者重新分配。
現(xiàn)有技術(shù)中,往往是通過人工手段根據(jù)每臺服務(wù)器的整體運行狀態(tài),判斷哪些服務(wù)器需要進行回收處理。但是,通過人工手段導(dǎo)致判斷過程中人為因素過多,人工成本高,整體效率低。
技術(shù)實現(xiàn)要素:
鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的判斷集群中的服務(wù)器是否需要回收的方法和相應(yīng)的裝置。
依據(jù)本發(fā)明的一個方面,提供了一種判斷集群中的服務(wù)器是否需要回收的方法,其中,該方法包括:
獲取多組已判斷數(shù)據(jù);其中每組已判斷數(shù)據(jù)包括多條數(shù)據(jù),每條數(shù)據(jù)對應(yīng)一臺服務(wù)器且包括兩部分:第一部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器的一組指標(biāo)參數(shù)值,第二部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器是否需要回收的判斷結(jié)果;
將一組已判斷數(shù)據(jù)輸入到指定機器學(xué)習(xí)模型中,供該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);
將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次輸入到所述機器學(xué)習(xí)模型中,并將該機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與所述多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;
根據(jù)比較結(jié)果確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù);
對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的關(guān)鍵指標(biāo)參數(shù)值并輸入到所述機器學(xué)習(xí)模型中,接收所述機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
可選地,獲取多組已判斷數(shù)據(jù)包括:
采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,以及接收根據(jù)所采集的指標(biāo)參數(shù)值做出的各服務(wù)器是否需要回收的判斷結(jié)果。
可選地,所述采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,以及接收根據(jù)所采集的指標(biāo)參數(shù)值做出的各服務(wù)器是否需要回收的判斷結(jié)果包括:
采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,并通過指定渠道顯示輸出;
通過所述指定渠道接收輸入的各服務(wù)器是否需要回收的人工判斷結(jié)果。
可選地,另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)所包含的指標(biāo)參數(shù)各不相同;
所述根據(jù)比較結(jié)果確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù)包括:從另外的多組已判斷數(shù)據(jù)中,選取所述機器學(xué)習(xí)模型輸出的判斷結(jié)果與相應(yīng)的第二部分?jǐn)?shù)據(jù)最為接近的一組已判斷數(shù)據(jù);將選取的該組已判斷數(shù)據(jù)的第一部分?jǐn)?shù)據(jù)中包含的一組指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。
可選地,該方法進一步包括:
選取多種不同類型的機器學(xué)習(xí)模型;
將同一組已判斷數(shù)據(jù)輸入到所述多種機器學(xué)習(xí)模型中,供各機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);
將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次分別輸入到各機器學(xué)習(xí)模型中,并將各機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與所述多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;根據(jù)比較結(jié)果確定各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù);
根據(jù)各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)確定最終的關(guān)鍵指標(biāo)參數(shù);
再選取一組或多組已判斷數(shù)據(jù),將其第一部分?jǐn)?shù)據(jù)中的與最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值輸入到各機器學(xué)習(xí)模型中,并根據(jù)其第二部分?jǐn)?shù)據(jù)計算出各機器學(xué)習(xí)模型輸出的判斷結(jié)果的準(zhǔn)確率;選取準(zhǔn)確率最高的機器學(xué)習(xí)模型;
根據(jù)所述最終的關(guān)鍵指標(biāo)參數(shù)和準(zhǔn)確率最高的機器學(xué)習(xí)模型判斷集群中的服務(wù)器是否需要回收。
可選地,所述根據(jù)各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)確定最終的關(guān)鍵指標(biāo)參數(shù)包括:
選取在各組關(guān)鍵指標(biāo)參數(shù)中均出現(xiàn)的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù);
或者,
選取在各組關(guān)鍵指標(biāo)參數(shù)中出現(xiàn)的次數(shù)高于預(yù)設(shè)閾值的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù)。
可選地,根據(jù)所述最終的關(guān)鍵指標(biāo)參數(shù)和準(zhǔn)確率最高的機器學(xué)習(xí)模型判斷集群中的服務(wù)器是否需要回收包括:
對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的與所述最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值并輸入到所述準(zhǔn)確率最高的機器學(xué)習(xí)模型中,接收所述準(zhǔn)確率最高的機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
可選地,所述指標(biāo)參數(shù)包括如下中的一種或多種:
最后登錄時長;
CPU負載;
磁盤輸入輸出狀況;
核心文件最近修改時長;
已建立連接狀態(tài)的連接數(shù)。
可選地,該方法進一步包括:
每隔預(yù)設(shè)時間間隔,根據(jù)集群的當(dāng)前運行狀態(tài),重新獲取多組已判斷數(shù)據(jù);
根據(jù)重新獲取的多組已判斷數(shù)據(jù)重復(fù)執(zhí)行上述流程,獲取新的關(guān)鍵指標(biāo)參數(shù);
依據(jù)新的關(guān)鍵指標(biāo)參數(shù)判斷集群中的服務(wù)器是否需要回收。
根據(jù)本發(fā)明的另一方面,提供了一種判斷集群中的服務(wù)器是否需要回收的裝置,其中,該裝置包括:
數(shù)據(jù)獲取單元,適于獲取多組已判斷數(shù)據(jù);其中每組已判斷數(shù)據(jù)包括多條數(shù)據(jù),每條數(shù)據(jù)對應(yīng)一臺服務(wù)器且包括兩部分:第一部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器的一組指標(biāo)參數(shù)值,第二部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器是否需要回收的判斷結(jié)果;
訓(xùn)練單元,適于將一組已判斷數(shù)據(jù)輸入到指定機器學(xué)習(xí)模型中,供該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次輸入到所述機器學(xué)習(xí)模型中,并將該機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與所述多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;根據(jù)比較結(jié)果確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù);
回收判斷單元,適于對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的關(guān)鍵指標(biāo)參數(shù)值并輸入到所述機器學(xué)習(xí)模型中,接收所述機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
可選地,所述數(shù)據(jù)獲取單元,適于采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,以及接收根據(jù)所采集的指標(biāo)參數(shù)值做出的各服務(wù)器是否需要回收的判斷結(jié)果。
可選地,所述數(shù)據(jù)獲取單元,適于采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,并通過指定渠道顯示輸出;通過所述指定渠道接收輸入的各服務(wù)器是否需要回收的人工判斷結(jié)果。
可選地,另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)所包含的指標(biāo)參數(shù)各不相同;
所述訓(xùn)練單元,適于從另外的多組已判斷數(shù)據(jù)中,選取所述機器學(xué)習(xí)模型輸出的判斷結(jié)果與相應(yīng)的第二部分?jǐn)?shù)據(jù)最為接近的一組已判斷數(shù)據(jù);將選取的該組已判斷數(shù)據(jù)的第一部分?jǐn)?shù)據(jù)中包含的一組指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。
可選地,所述訓(xùn)練單元,進一步適于選取多種不同類型的機器學(xué)習(xí)模型;將同一組已判斷數(shù)據(jù)輸入到所述多種機器學(xué)習(xí)模型中,供各機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次分別輸入到各機器學(xué)習(xí)模型中,并將各機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與所述多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;根據(jù)比較結(jié)果確定各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù);根據(jù)各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)確定最終的關(guān)鍵指標(biāo)參數(shù);再選取一組或多組已判斷數(shù)據(jù),將其第一部分?jǐn)?shù)據(jù)中的與最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值輸入到各機器學(xué)習(xí)模型中,并根據(jù)其第二部分?jǐn)?shù)據(jù)計算出各機器學(xué)習(xí)模型輸出的判斷結(jié)果的準(zhǔn)確率;選取準(zhǔn)確率最高的機器學(xué)習(xí)模型;
所述回收判斷單元,進一步適于根據(jù)所述最終的關(guān)鍵指標(biāo)參數(shù)和準(zhǔn)確率最高的機器學(xué)習(xí)模型判斷集群中的服務(wù)器是否需要回收。
可選地,所述訓(xùn)練單元,進一步適于選取在各組關(guān)鍵指標(biāo)參數(shù)中均出現(xiàn)的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù);或者,適于選取在各組關(guān)鍵指標(biāo)參數(shù)中出現(xiàn)的次數(shù)高于預(yù)設(shè)閾值的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù)。
可選地,所述回收判斷單元,適于對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的與所述最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值并輸入到所述準(zhǔn)確率最高的機器學(xué)習(xí)模型中,接收所述準(zhǔn)確率最高的機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
可選地,所述指標(biāo)參數(shù)包括如下中的一種或多種:
最后登錄時長;
CPU負載;
磁盤輸入輸出狀況;
核心文件最近修改時長;
已建立連接狀態(tài)的連接數(shù)。
可選地,數(shù)據(jù)獲取單元,進一步適于每隔預(yù)設(shè)時間間隔,根據(jù)集群的當(dāng)前運行狀態(tài),重新獲取多組已判斷數(shù)據(jù);
所述訓(xùn)練單元,進一步適于根據(jù)重新獲取的多組已判斷數(shù)據(jù)重復(fù)執(zhí)行上述流程,獲取新的關(guān)鍵指標(biāo)參數(shù);
所述回收判斷單元,進一步適于依據(jù)新的關(guān)鍵指標(biāo)參數(shù)判斷集群中的服務(wù)器是否需要回收。
根據(jù)本發(fā)明的技術(shù)方案,采用機器學(xué)習(xí)模型,將一組已判斷數(shù)據(jù)輸入到指定機器學(xué)習(xí)模型中,供該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);再將其他多組已判斷數(shù)據(jù)依次輸入到所述機器學(xué)習(xí)模型中,比較該機器學(xué)習(xí)模型輸出的判斷結(jié)果和其他多組已判斷數(shù)據(jù),確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù),這樣就可以確定出對判斷結(jié)果影響最大的一個或多個關(guān)鍵指標(biāo)參數(shù),當(dāng)真正去判斷待判斷服務(wù)器的時候,只需要獲取該服務(wù)器的關(guān)鍵指標(biāo)參數(shù)值并輸入到所述機器學(xué)習(xí)模型中,既可以直接獲得該服務(wù)器是否需要回收的判斷結(jié)果。綜上所述,本發(fā)明采用機器學(xué)習(xí)的方法,自動獲得出待判斷服務(wù)器是否回收的判斷結(jié)果,替代人工判斷,成本降低,整體效率提高。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。
附圖說明
通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1示出了根據(jù)本發(fā)明一個實施例的一種判斷集群中的服務(wù)器是否需要回收的方法的流程示意圖;
圖2示出了根據(jù)本發(fā)明一個實施例的一種判斷集群中的服務(wù)器是否需要回收的裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當(dāng)理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
圖1示出了根據(jù)本發(fā)明一個實施例的一種判斷集群中的服務(wù)器是否需要回收的方法的流程示意圖。如圖1所示,該方法包括:
步驟S110,獲取多組已判斷數(shù)據(jù);其中每組已判斷數(shù)據(jù)包括多條數(shù)據(jù),每條數(shù)據(jù)對應(yīng)一臺服務(wù)器且包括兩部分:第一部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器的一組指標(biāo)參數(shù)值,第二部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器是否需要回收的判斷結(jié)果。
這里的指標(biāo)參數(shù)值是服務(wù)器中的各指標(biāo)參數(shù)在當(dāng)前狀態(tài)中的數(shù)值,根據(jù)服務(wù)器中的各指標(biāo)參數(shù)值對服務(wù)器是否需要回收進行判斷,這里的判斷可以通過人工方式或者其它算法進行判斷。將對應(yīng)服務(wù)器的各指標(biāo)參數(shù)值,以及對應(yīng)服務(wù)器是否需要回收的判斷結(jié)果作為一條數(shù)據(jù)。這里的各指標(biāo)參數(shù)值可以是服務(wù)器中的各指標(biāo)參數(shù)的一個或者多個。
例如,獲取三組已判斷數(shù)據(jù)組分別是數(shù)據(jù)組A、數(shù)據(jù)組B和數(shù)據(jù)組C。每組數(shù)據(jù)包含有對應(yīng)1000個服務(wù)器的1000條數(shù)據(jù)。每條數(shù)據(jù)包括的兩部分是:第一部分是對應(yīng)服務(wù)器的一組指標(biāo)參數(shù)值,每組中有若干個指標(biāo)參數(shù)值,例如:CPU負載、磁盤輸入輸出狀況、核心文件最近修改時長、已建立連接狀態(tài)的連接數(shù)分等指標(biāo)參數(shù)的值;第二部分是對應(yīng)服務(wù)器是否需要回收的判斷結(jié)果,例如“回收”或者“不回收”;或者通過標(biāo)識進行判斷結(jié)果的標(biāo)記,用“1”代表“回收”,“0”代表“不回收”;又或者也可以用百分?jǐn)?shù)代表服務(wù)器需要回收的概率,其中判斷結(jié)果為80%的回收的可能性要低于判斷結(jié)果為90%的服務(wù)器的回收可能性。
需要說明的是,每組已判斷數(shù)據(jù)組內(nèi)的各條數(shù)據(jù)的指標(biāo)參數(shù)的個數(shù)和類型相同,但是組與組之間的各條數(shù)據(jù)的指標(biāo)參數(shù)的個數(shù)和類型可以相同也可以不同。
步驟S120,將一組已判斷數(shù)據(jù)輸入到指定機器學(xué)習(xí)模型中,供該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí)。
從獲取的多組已判斷數(shù)據(jù)中選取一組數(shù)據(jù)輸入到指定的機器學(xué)習(xí)模型中,該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí),以便獲得判斷服務(wù)器是否回收的判斷依據(jù)。
這里的機器學(xué)習(xí)模型可以是現(xiàn)有的一些機器學(xué)習(xí)模型,如決策樹模型或向量機模型等。
步驟S130,將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次輸入到機器學(xué)習(xí)模型中,并將該機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較。
為了從服務(wù)器的多個指標(biāo)參數(shù)中獲得對判斷服務(wù)器是否需要回收影響最大的關(guān)鍵指標(biāo)參數(shù),本發(fā)明獲得多組已判斷數(shù)據(jù),將其中一組數(shù)據(jù)作為機器學(xué)習(xí)的數(shù)據(jù),其它組的數(shù)據(jù)用來確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù),例如,將數(shù)組A的數(shù)據(jù)輸入到指定機器學(xué)習(xí)模型中,供該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí),利用數(shù)組B和數(shù)組C的數(shù)據(jù)確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù)。具體做法就是將其它組的已判斷數(shù)據(jù)(數(shù)組B和數(shù)組C)的第一部分?jǐn)?shù)據(jù)依次輸入到該機器學(xué)習(xí)模型中,并將該機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與多組已判斷數(shù)據(jù)(數(shù)組B和數(shù)組C)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較。
步驟S140,根據(jù)比較結(jié)果確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù)。
通過比較,會獲得機器學(xué)習(xí)的判斷結(jié)果與已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)中的判斷結(jié)果是否一致,以及兩者判斷結(jié)果一致的程度。將一致程度最大的那組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)中的指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。例如,將數(shù)組B和數(shù)組C的第一部分?jǐn)?shù)據(jù)依次輸入到該機器學(xué)習(xí)模型中,并將該機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與數(shù)組B和數(shù)組C中的的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較后,發(fā)現(xiàn)數(shù)組C的第二部分?jǐn)?shù)據(jù)與機器學(xué)習(xí)的判斷結(jié)果抑制的概率較大,那么就將數(shù)組C的第一部分?jǐn)?shù)據(jù)中的指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。
步驟S150,對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的關(guān)鍵指標(biāo)參數(shù)值并輸入到機器學(xué)習(xí)模型中,接收機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
當(dāng)利用機器學(xué)習(xí)獲得的判斷依據(jù)開始對集群中的待判斷服務(wù)器進行是否需要回收的判斷的時候,只需要獲取該服務(wù)器的關(guān)鍵指標(biāo)參數(shù)值并輸入到機器學(xué)習(xí)模型中,就可以直接獲得該服務(wù)器是否需要回收的判斷結(jié)果。獲得判斷結(jié)果可以是“回收”或者“不回收”,也可能是個百分?jǐn)?shù)。如果是百分?jǐn)?shù),就可以進一步的根據(jù)具體實際情況確定是否進行回收處理。例如,獲得的回收概率是80%,但是暫時沒有更好的服務(wù)器代替該服務(wù)器,那么就可以先不進行回收。
需要說明的是,本發(fā)明中的“回收”并不完全是根據(jù)服務(wù)器的忙或閑進行判斷的,例如一臺機器從資源利用率看很閑,但上面有重要的業(yè)務(wù)在運行或者仍然有訪問,則不能回收,所以要根據(jù)服務(wù)器的整體運行狀態(tài)綜合進行判斷。
可見,本發(fā)明采用機器學(xué)習(xí)的方法,自動獲得出待判斷服務(wù)器是否回收的判斷結(jié)果,替代人工判斷,成本降低,整體效率提高。
在本發(fā)明的一個實施例中,步驟S110中的獲取多組已判斷數(shù)據(jù)包括:采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,以及接收根據(jù)所采集的指標(biāo)參數(shù)值做出的各服務(wù)器是否需要回收的判斷結(jié)果。這里的判斷可以通過人工方式或者其它算法進行判斷。
在本發(fā)明的一個實施例中,通過人工的方法,根據(jù)指標(biāo)參數(shù)值依次做出的各服務(wù)器是否需要回收的判斷結(jié)果。那么,上述方法具體包括:采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,并通過指定渠道顯示輸出,以便人工可以通過顯示獲得各服務(wù)器的指標(biāo)參數(shù)值;然后再通過指定渠道接收輸入的各服務(wù)器是否需要回收的人工判斷結(jié)果。最終組成多組已判斷數(shù)據(jù)。
各組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)所包含的指標(biāo)參數(shù)的個數(shù)和類型可以相同也可以不同。在本發(fā)明的一個實施例中,另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)所包含的指標(biāo)參數(shù)各不相同。例如,數(shù)據(jù)組A的第一部分?jǐn)?shù)據(jù)所包括的指標(biāo)參數(shù)為:CPU負載、磁盤輸入輸出狀況、核心文件最近修改時長;數(shù)據(jù)組B的第一部分?jǐn)?shù)據(jù)所包含的指標(biāo)參數(shù)為:CPU負載、磁盤輸入輸出狀況、核心文件最近修改時長、已建立連接狀態(tài)的連接數(shù);數(shù)據(jù)組C的第一部分?jǐn)?shù)據(jù)所包括的指標(biāo)參數(shù)為:磁盤輸入輸出狀況、核心文件最近修改時長。
則步驟S140中的根據(jù)比較結(jié)果確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù)包括:從另外的多組已判斷數(shù)據(jù)中,選取機器學(xué)習(xí)模型輸出的判斷結(jié)果與相應(yīng)的第二部分?jǐn)?shù)據(jù)最為接近的一組已判斷數(shù)據(jù);將選取的該組已判斷數(shù)據(jù)的第一部分?jǐn)?shù)據(jù)中包含的一組指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。
這里的最為接近的一組已判斷數(shù)據(jù),可以理解為機器學(xué)習(xí)模型輸出的判斷結(jié)果與多組已判斷數(shù)據(jù)中第二部分?jǐn)?shù)據(jù)一致性最高,那么就將該組已判斷數(shù)據(jù)的第一部分?jǐn)?shù)據(jù)中包含的指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。
在機器學(xué)習(xí)模型中存在很多種的模型可以進行本發(fā)明的技術(shù)方案,為了得到更準(zhǔn)確的最終關(guān)鍵指標(biāo)參數(shù),可以根據(jù)不同機器學(xué)習(xí)模型的關(guān)鍵指標(biāo)參數(shù)進行確定。在本發(fā)明的一個實施例中,選取多種不同類型的機器學(xué)習(xí)模型;從多組已判斷數(shù)據(jù)中選擇一組已判斷數(shù)據(jù),將選擇的同一組已判斷數(shù)據(jù)輸入到多種機器學(xué)習(xí)模型中,供各機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次分別輸入到各機器學(xué)習(xí)模型中,并將各機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;根據(jù)比較結(jié)果確定各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)。
每個機器學(xué)習(xí)模型都會獲得相應(yīng)的關(guān)鍵指標(biāo)參數(shù),然后再根據(jù)各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)確定最終的關(guān)鍵指標(biāo)參數(shù)。例如,可以將每個機器學(xué)習(xí)模型均出現(xiàn)的關(guān)鍵指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù)。
為了從多個機器學(xué)習(xí)模型中獲得一個最適合本發(fā)明技術(shù)方案以及判斷結(jié)果相對最準(zhǔn)確的模型。在本發(fā)明的一個實施例中,可以再選取一組或多組已判斷數(shù)據(jù),將其第一部分?jǐn)?shù)據(jù)中的與最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值輸入到各機器學(xué)習(xí)模型中,并根據(jù)其第二部分?jǐn)?shù)據(jù)計算出各機器學(xué)習(xí)模型輸出的判斷結(jié)果的準(zhǔn)確率;選取準(zhǔn)確率最高的機器學(xué)習(xí)模型作為最終判斷服務(wù)器是否需要回收的機器學(xué)習(xí)模型。
最后,根據(jù)確定的最終的關(guān)鍵指標(biāo)參數(shù)和準(zhǔn)確率最高的機器學(xué)習(xí)模型判斷集群中的服務(wù)器是否需要回收。
進一步地,上述的根據(jù)各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)確定最終的關(guān)鍵指標(biāo)參數(shù)包括以下的兩種方法確定:
(1)選取在各組關(guān)鍵指標(biāo)參數(shù)中均出現(xiàn)的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù)。
例如,在機器學(xué)習(xí)模型M1中的關(guān)鍵指標(biāo)參數(shù)是服務(wù)器的最后登錄時長、CPU負載和磁盤輸入輸出狀況;在機器學(xué)習(xí)模型M2中的關(guān)鍵指標(biāo)參數(shù)是服務(wù)器的CPU負載、磁盤輸入輸出狀況和核心文件最近修改時長。那么就將CPU負載和磁盤輸入輸出狀況最為最終的關(guān)鍵指標(biāo)參數(shù)。
(2)選取在各組關(guān)鍵指標(biāo)參數(shù)中出現(xiàn)的次數(shù)高于預(yù)設(shè)閾值的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù)。
例如,對于三種機器學(xué)習(xí)模型,設(shè)定預(yù)設(shè)閾值為1。在機器學(xué)習(xí)模型M1中的關(guān)鍵指標(biāo)參數(shù)是服務(wù)器的最后登錄時長、CPU負載和磁盤輸入輸出狀況;在機器學(xué)習(xí)模型M2中的關(guān)鍵指標(biāo)參數(shù)是服務(wù)器的CPU負載、磁盤輸入輸出狀況、核心文件最近修改時長;在機器學(xué)習(xí)模型M3的關(guān)鍵指標(biāo)參數(shù)是服務(wù)器的CPU負載、最后登錄時長和已建立連接狀態(tài)的連接數(shù)。那么出現(xiàn)的次數(shù)為2次的最后登錄時長和磁盤輸入輸出狀況以及出現(xiàn)次數(shù)為3次的CPU負載最為最終的關(guān)鍵指標(biāo)參數(shù)。
那么,在本發(fā)明的一個實施例中,根據(jù)最終的關(guān)鍵指標(biāo)參數(shù)和準(zhǔn)確率最高的機器學(xué)習(xí)模型判斷集群中的服務(wù)器是否需要回收包括:對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的與最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值并輸入到準(zhǔn)確率最高的機器學(xué)習(xí)模型中,接收準(zhǔn)確率最高的機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
服務(wù)器的各指標(biāo)參數(shù)有很多種,在本發(fā)明中的一個實施例中,指標(biāo)參數(shù)包括如下中的一種或多種:最后登錄時長、CPU負載、磁盤輸入輸出狀況、核心文件最近修改時長、已建立連接狀態(tài)的連接數(shù)。這些參數(shù)可以作為判斷服務(wù)器是否需要回收的指標(biāo),但不一定都是關(guān)鍵指標(biāo)參數(shù),要根據(jù)具體運行狀態(tài),通過機器學(xué)習(xí)進行關(guān)鍵指標(biāo)參數(shù)的確定。
前述中已經(jīng)說明在判斷服務(wù)器是否需要回收,要根據(jù)具體的實際運行狀態(tài)進行判斷,服務(wù)器的實際運行狀態(tài)是不斷的變化的,那么多組已判斷數(shù)據(jù)值會隨著實際運行狀態(tài)的不同而變化,通過機器學(xué)習(xí)確定的關(guān)鍵指標(biāo)參數(shù)也不是一成不變的,為了適應(yīng)服務(wù)器不同的運行情況,需要對關(guān)鍵指標(biāo)參數(shù)進行定期的更新。所以,在本發(fā)明的一個實施例中,圖1所示的方法進一步包括:每隔預(yù)設(shè)時間間隔,根據(jù)集群的當(dāng)前運行狀態(tài),重新獲取多組已判斷數(shù)據(jù);根據(jù)重新獲取的多組已判斷數(shù)據(jù)重復(fù)執(zhí)行上述流程,獲取新的關(guān)鍵指標(biāo)參數(shù);依據(jù)新的關(guān)鍵指標(biāo)參數(shù)判斷集群中的服務(wù)器是否需要回收。這里的預(yù)設(shè)時間間隔可以根據(jù)需求進行設(shè)定,例如,預(yù)設(shè)時間間隔可以是5天,那么每隔5天,就會進行關(guān)鍵指標(biāo)參數(shù)的更新。
圖2示出了根據(jù)本發(fā)明一個實施例的一種判斷集群中的服務(wù)器是否需要回收的裝置的結(jié)構(gòu)示意圖。如圖2所示,該判斷集群中的服務(wù)器是否需要回收的裝置200包括:
數(shù)據(jù)獲取單元210,適于獲取多組已判斷數(shù)據(jù);其中每組已判斷數(shù)據(jù)包括多條數(shù)據(jù),每條數(shù)據(jù)對應(yīng)一臺服務(wù)器且包括兩部分:第一部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器的一組指標(biāo)參數(shù)值,第二部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器是否需要回收的判斷結(jié)果。
這里的指標(biāo)參數(shù)值是服務(wù)器中的各指標(biāo)參數(shù)在當(dāng)前狀態(tài)中的數(shù)值,根據(jù)服務(wù)器中的各指標(biāo)參數(shù)值對服務(wù)器是否需要回收進行判斷,這里的判斷可以通過人工方式或者其它算法進行判斷。將對應(yīng)服務(wù)器的各指標(biāo)參數(shù)值,以及對應(yīng)服務(wù)器是否需要回收的判斷結(jié)果作為一條數(shù)據(jù)。這里的各指標(biāo)參數(shù)值可以是服務(wù)器中的各指標(biāo)參數(shù)的一個或者多個。
例如,獲取三組已判斷數(shù)據(jù)組分別是數(shù)據(jù)組A、數(shù)據(jù)組B和數(shù)據(jù)組C。每組數(shù)據(jù)包含有對應(yīng)1000個服務(wù)器的1000條數(shù)據(jù)。每條數(shù)據(jù)包括的兩部分是:第一部分是對應(yīng)服務(wù)器的一組指標(biāo)參數(shù)值,每組中有若干個指標(biāo)參數(shù)值,例如:CPU負載、磁盤輸入輸出狀況、核心文件最近修改時長、已建立連接狀態(tài)的連接數(shù)分等指標(biāo)參數(shù)的值;第二部分是對應(yīng)服務(wù)器是否需要回收的判斷結(jié)果,例如“回收”或者“不回收”;或者通過標(biāo)識進行判斷結(jié)果的標(biāo)記,用“1”代表“回收”,“0”代表“不回收”;又或者也可以用百分?jǐn)?shù)代表服務(wù)器需要回收的概率,其中判斷結(jié)果為80%的回收的可能性要低于判斷結(jié)果為90%的服務(wù)器的回收可能性。
需要說明的是,每組已判斷數(shù)據(jù)組內(nèi)的各條數(shù)據(jù)的指標(biāo)參數(shù)的個數(shù)和類型相同,但是組與組之間的各條數(shù)據(jù)的指標(biāo)參數(shù)的個數(shù)和類型可以相同也可以不同。
訓(xùn)練單元220,適于將一組已判斷數(shù)據(jù)輸入到指定機器學(xué)習(xí)模型中,供該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次輸入到機器學(xué)習(xí)模型中,并將該機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;根據(jù)比較結(jié)果確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù)。
從獲取的多組已判斷數(shù)據(jù)中選取一組數(shù)據(jù)輸入到指定的機器學(xué)習(xí)模型中,該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí),以便獲得判斷服務(wù)器是否回收的判斷依據(jù)。
這里的機器學(xué)習(xí)模型可以是現(xiàn)有的一些機器學(xué)習(xí)模型,如決策樹模型或向量機模型等。
為了從服務(wù)器的多個指標(biāo)參數(shù)中獲得對判斷服務(wù)器是否需要回收影響最大的關(guān)鍵指標(biāo)參數(shù),本發(fā)明獲得多組已判斷數(shù)據(jù),將其中一組數(shù)據(jù)作為機器學(xué)習(xí)的數(shù)據(jù),其它組的數(shù)據(jù)用來確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù),例如,將數(shù)組A的數(shù)據(jù)輸入到指定機器學(xué)習(xí)模型中,供該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí),利用數(shù)組B和數(shù)組C的數(shù)據(jù)確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù)。具體做法就是將其它組的已判斷數(shù)據(jù)(數(shù)組B和數(shù)組C)的第一部分?jǐn)?shù)據(jù)依次輸入到該機器學(xué)習(xí)模型中,并將該機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與多組已判斷數(shù)據(jù)(數(shù)組B和數(shù)組C)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較。
通過比較,會獲得機器學(xué)習(xí)的判斷結(jié)果與已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)中的判斷結(jié)果是否一致,以及兩者判斷結(jié)果一致的程度。將一致程度最大的那組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)中的指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。例如,將數(shù)組B和數(shù)組C的第一部分?jǐn)?shù)據(jù)依次輸入到該機器學(xué)習(xí)模型中,并將該機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與數(shù)組B和數(shù)組C中的的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較后,發(fā)現(xiàn)數(shù)組C的第二部分?jǐn)?shù)據(jù)與機器學(xué)習(xí)的判斷結(jié)果抑制的概率較大,那么就將數(shù)組C的第一部分?jǐn)?shù)據(jù)中的指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。
回收判斷單元230,適于對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的關(guān)鍵指標(biāo)參數(shù)值并輸入到機器學(xué)習(xí)模型中,接收機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
當(dāng)利用機器學(xué)習(xí)獲得的判斷依據(jù)開始對集群中的待判斷服務(wù)器進行是否需要回收的判斷的時候,只需要獲取該服務(wù)器的關(guān)鍵指標(biāo)參數(shù)值并輸入到機器學(xué)習(xí)模型中,就可以直接獲得該服務(wù)器是否需要回收的判斷結(jié)果。獲得判斷結(jié)果可以是“回收”或者“不回收”,也可能是個百分?jǐn)?shù)。如果是百分?jǐn)?shù),就可以進一步的根據(jù)具體實際情況確定是否進行回收處理。例如,獲得的回收概率是80%,但是暫時沒有更好的服務(wù)器代替該服務(wù)器,那么就可以先不進行回收。
需要說明的是,本發(fā)明中的“回收”并不完全是根據(jù)服務(wù)器的忙或閑進行判斷的,例如一臺機器從資源利用率看很閑,但上面有重要的業(yè)務(wù)在運行或者仍然有訪問,則不能回收,所以要根據(jù)服務(wù)器的整體運行狀態(tài)綜合進行判斷。
可見,本發(fā)明采用機器學(xué)習(xí)的方法,自動獲得出待判斷服務(wù)器是否回收的判斷結(jié)果,替代人工判斷,成本降低,整體效率提高。
在本發(fā)明的一個實施例中,數(shù)據(jù)獲取單元210,適于采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,以及接收根據(jù)所采集的指標(biāo)參數(shù)值做出的各服務(wù)器是否需要回收的判斷結(jié)果。這里的判斷可以通過人工方式或者其它算法進行判斷。
在本發(fā)明的一個實施例中,通過人工的方法,根據(jù)指標(biāo)參數(shù)值依次做出的各服務(wù)器是否需要回收的判斷結(jié)果。那么,數(shù)據(jù)獲取單元210,適于采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,并通過指定渠道顯示輸出,以便人工可以通過顯示獲得各服務(wù)器的指標(biāo)參數(shù)值;然后再通過指定渠道接收輸入的各服務(wù)器是否需要回收的人工判斷結(jié)果。最終組成多組已判斷數(shù)據(jù)。
各組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)所包含的指標(biāo)參數(shù)的個數(shù)和類型可以相同也可以不同。在本發(fā)明的一個實施例中,另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)所包含的指標(biāo)參數(shù)各不相同;例如,數(shù)據(jù)組A的第一部分?jǐn)?shù)據(jù)所包括的指標(biāo)參數(shù)為:CPU負載、磁盤輸入輸出狀況、核心文件最近修改時長;數(shù)據(jù)組B的第一部分?jǐn)?shù)據(jù)所包含的指標(biāo)參數(shù)為:CPU負載、磁盤輸入輸出狀況、核心文件最近修改時長、已建立連接狀態(tài)的連接數(shù);數(shù)據(jù)組C的第一部分?jǐn)?shù)據(jù)所包括的指標(biāo)參數(shù)為:磁盤輸入輸出狀況、核心文件最近修改時長。
訓(xùn)練單元220,適于從另外的多組已判斷數(shù)據(jù)中,選取機器學(xué)習(xí)模型輸出的判斷結(jié)果與相應(yīng)的第二部分?jǐn)?shù)據(jù)最為接近的一組已判斷數(shù)據(jù);將選取的該組已判斷數(shù)據(jù)的第一部分?jǐn)?shù)據(jù)中包含的一組指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。
這里的最為接近的一組已判斷數(shù)據(jù),可以理解為機器學(xué)習(xí)模型輸出的判斷結(jié)果與多組已判斷數(shù)據(jù)中第二部分?jǐn)?shù)據(jù)一致性最高,那么就將該組已判斷數(shù)據(jù)的第一部分?jǐn)?shù)據(jù)中包含的指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。
在機器學(xué)習(xí)模型中存在很多種的模型可以進行本發(fā)明的技術(shù)方案,為了得到更準(zhǔn)確的最終關(guān)鍵指標(biāo)參數(shù),可以根據(jù)不同機器學(xué)習(xí)模型的關(guān)鍵指標(biāo)參數(shù)進行確定。在本發(fā)明的一個實施例中,訓(xùn)練單元220,進一步適于選取多種不同類型的機器學(xué)習(xí)模型;將同一組已判斷數(shù)據(jù)輸入到多種機器學(xué)習(xí)模型中,供各機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次分別輸入到各機器學(xué)習(xí)模型中,并將各機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;根據(jù)比較結(jié)果確定各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù);根據(jù)各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)確定最終的關(guān)鍵指標(biāo)參數(shù)。
每個機器學(xué)習(xí)模型都會獲得相應(yīng)的關(guān)鍵指標(biāo)參數(shù),然后再根據(jù)各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)確定最終的關(guān)鍵指標(biāo)參數(shù)。例如,可以將每個機器學(xué)習(xí)模型均出現(xiàn)的關(guān)鍵指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù)。
為了從多個機器學(xué)習(xí)模型中獲得一個最適合本發(fā)明技術(shù)方案以及判斷結(jié)果相對最準(zhǔn)確的模型。在本發(fā)明的一個實施例中,可以再選取一組或多組已判斷數(shù)據(jù),將其第一部分?jǐn)?shù)據(jù)中的與最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值輸入到各機器學(xué)習(xí)模型中,并根據(jù)其第二部分?jǐn)?shù)據(jù)計算出各機器學(xué)習(xí)模型輸出的判斷結(jié)果的準(zhǔn)確率;選取準(zhǔn)確率最高的機器學(xué)習(xí)模型;
回收判斷單元230,進一步適于根據(jù)最終的關(guān)鍵指標(biāo)參數(shù)和準(zhǔn)確率最高的機器學(xué)習(xí)模型判斷集群中的服務(wù)器是否需要回收。
進一步地,訓(xùn)練單元220,進一步適于:
選取在各組關(guān)鍵指標(biāo)參數(shù)中均出現(xiàn)的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù);例如,在機器學(xué)習(xí)模型M1中的關(guān)鍵指標(biāo)參數(shù)是服務(wù)器的最后登錄時長、CPU負載和磁盤輸入輸出狀況;在機器學(xué)習(xí)模型M2中的關(guān)鍵指標(biāo)參數(shù)是服務(wù)器的CPU負載、磁盤輸入輸出狀況和核心文件最近修改時長。那么就將CPU負載和磁盤輸入輸出狀況最為最終的關(guān)鍵指標(biāo)參數(shù)。
或者,適于選取在各組關(guān)鍵指標(biāo)參數(shù)中出現(xiàn)的次數(shù)高于預(yù)設(shè)閾值的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù)。例如,對于三種機器學(xué)習(xí)模型,設(shè)定預(yù)設(shè)閾值為1。在機器學(xué)習(xí)模型M1中的關(guān)鍵指標(biāo)參數(shù)是服務(wù)器的最后登錄時長、CPU負載和磁盤輸入輸出狀況;在機器學(xué)習(xí)模型M2中的關(guān)鍵指標(biāo)參數(shù)是服務(wù)器的CPU負載、磁盤輸入輸出狀況、核心文件最近修改時長;在機器學(xué)習(xí)模型M3的關(guān)鍵指標(biāo)參數(shù)是服務(wù)器的CPU負載、最后登錄時長和已建立連接狀態(tài)的連接數(shù)。那么出現(xiàn)的次數(shù)為2次的最后登錄時長和磁盤輸入輸出狀況以及出現(xiàn)次數(shù)為3次的CPU負載最為最終的關(guān)鍵指標(biāo)參數(shù)。
那么,在本發(fā)明的一個實施例中,回收判斷單元230,適于對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的與最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值并輸入到準(zhǔn)確率最高的機器學(xué)習(xí)模型中,接收準(zhǔn)確率最高的機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
服務(wù)器的各指標(biāo)參數(shù)有很多種,在本發(fā)明中的一個實施例中,指標(biāo)參數(shù)包括如下中的一種或多種:最后登錄時長;CPU負載、磁盤輸入輸出狀況、核心文件最近修改時長、已建立連接狀態(tài)的連接數(shù)。這些參數(shù)可以作為判斷服務(wù)器是否需要回收的指標(biāo),但不一定都是關(guān)鍵指標(biāo)參數(shù),要根據(jù)具體運行狀態(tài),通過機器學(xué)習(xí)進行關(guān)鍵指標(biāo)參數(shù)的確定。
前述中已經(jīng)說明在判斷服務(wù)器是否需要回收,要根據(jù)具體的實際運行狀態(tài)進行判斷,服務(wù)器的實際運行狀態(tài)是不斷的變化的,那么多組已判斷數(shù)據(jù)值會隨著實際運行狀態(tài)的不同而變化,通過機器學(xué)習(xí)確定的關(guān)鍵指標(biāo)參數(shù)也不是一成不變的,為了適應(yīng)服務(wù)器不同的運行情況,需要對關(guān)鍵指標(biāo)參數(shù)進行定期的更新。所以,在本發(fā)明的一個實施例中,數(shù)據(jù)獲取單元210,進一步適于每隔預(yù)設(shè)時間間隔,根據(jù)集群的當(dāng)前運行狀態(tài),重新獲取多組已判斷數(shù)據(jù)。訓(xùn)練單元220,進一步適于根據(jù)重新獲取的多組已判斷數(shù)據(jù)重復(fù)執(zhí)行上述流程,獲取新的關(guān)鍵指標(biāo)參數(shù)?;厥张袛鄦卧?30,進一步適于依據(jù)新的關(guān)鍵指標(biāo)參數(shù)判斷集群中的服務(wù)器是否需要回收。這里的預(yù)設(shè)時間間隔可以根據(jù)需求進行設(shè)定,例如,預(yù)設(shè)時間間隔可以是5天,那么每隔5天,就會進行關(guān)鍵指標(biāo)參數(shù)的更新。
綜上所述,根據(jù)本發(fā)明的技術(shù)方案,采用機器學(xué)習(xí)模型,將一組已判斷數(shù)據(jù)輸入到指定機器學(xué)習(xí)模型中,供該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);再將其他多組已判斷數(shù)據(jù)依次輸入到所述機器學(xué)習(xí)模型中,比較該機器學(xué)習(xí)模型輸出的判斷結(jié)果和其他多組已判斷數(shù)據(jù),確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù),這樣就可以確定出對判斷結(jié)果影響最大的一個或多個關(guān)鍵指標(biāo)參數(shù),當(dāng)真正去判斷待判斷服務(wù)器的時候,只需要獲取該服務(wù)器的關(guān)鍵指標(biāo)參數(shù)值并輸入到所述機器學(xué)習(xí)模型中,既可以直接獲得該服務(wù)器是否需要回收的判斷結(jié)果??梢?,本發(fā)明采用機器學(xué)習(xí)的方法,自動獲得出待判斷服務(wù)器是否回收的判斷結(jié)果,替代人工判斷,成本降低,整體效率提高。
需要說明的是:
在此提供的算法和顯示不與任何特定計算機、虛擬裝置或者其它設(shè)備固有相關(guān)。各種通用裝置也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類裝置所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權(quán)利要求書由此明確地并入該具體實施方式,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進行自適應(yīng)性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的判斷集群中的服務(wù)器是否需要回收的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
本發(fā)明公開了A1、一種判斷集群中的服務(wù)器是否需要回收的方法,其中,該方法包括:
獲取多組已判斷數(shù)據(jù);其中每組已判斷數(shù)據(jù)包括多條數(shù)據(jù),每條數(shù)據(jù)對應(yīng)一臺服務(wù)器且包括兩部分:第一部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器的一組指標(biāo)參數(shù)值,第二部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器是否需要回收的判斷結(jié)果;
將一組已判斷數(shù)據(jù)輸入到指定機器學(xué)習(xí)模型中,供該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);
將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次輸入到所述機器學(xué)習(xí)模型中,并將該機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與所述多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;
根據(jù)比較結(jié)果確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù);
對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的關(guān)鍵指標(biāo)參數(shù)值并輸入到所述機器學(xué)習(xí)模型中,接收所述機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
A2、如A1所述的方法,其中,獲取多組已判斷數(shù)據(jù)包括:
采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,以及接收根據(jù)所采集的指標(biāo)參數(shù)值做出的各服務(wù)器是否需要回收的判斷結(jié)果。
A3、如A2所述的方法,其中,所述采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,以及接收根據(jù)所采集的指標(biāo)參數(shù)值做出的各服務(wù)器是否需要回收的判斷結(jié)果包括:
采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,并通過指定渠道顯示輸出;
通過所述指定渠道接收輸入的各服務(wù)器是否需要回收的人工判斷結(jié)果。
A4、如A1所述的方法,其中,
另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)所包含的指標(biāo)參數(shù)各不相同;
所述根據(jù)比較結(jié)果確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù)包括:從另外的多組已判斷數(shù)據(jù)中,選取所述機器學(xué)習(xí)模型輸出的判斷結(jié)果與相應(yīng)的第二部分?jǐn)?shù)據(jù)最為接近的一組已判斷數(shù)據(jù);將選取的該組已判斷數(shù)據(jù)的第一部分?jǐn)?shù)據(jù)中包含的一組指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。
A5、如A1所述的方法,其中,該方法進一步包括:
選取多種不同類型的機器學(xué)習(xí)模型;
將同一組已判斷數(shù)據(jù)輸入到所述多種機器學(xué)習(xí)模型中,供各機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);
將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次分別輸入到各機器學(xué)習(xí)模型中,并將各機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與所述多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;根據(jù)比較結(jié)果確定各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù);
根據(jù)各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)確定最終的關(guān)鍵指標(biāo)參數(shù);
再選取一組或多組已判斷數(shù)據(jù),將其第一部分?jǐn)?shù)據(jù)中的與最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值輸入到各機器學(xué)習(xí)模型中,并根據(jù)其第二部分?jǐn)?shù)據(jù)計算出各機器學(xué)習(xí)模型輸出的判斷結(jié)果的準(zhǔn)確率;選取準(zhǔn)確率最高的機器學(xué)習(xí)模型;
根據(jù)所述最終的關(guān)鍵指標(biāo)參數(shù)和準(zhǔn)確率最高的機器學(xué)習(xí)模型判斷集群中的服務(wù)器是否需要回收。
A6、如A5所述的方法,其中,所述根據(jù)各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)確定最終的關(guān)鍵指標(biāo)參數(shù)包括:
選取在各組關(guān)鍵指標(biāo)參數(shù)中均出現(xiàn)的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù);
或者,
選取在各組關(guān)鍵指標(biāo)參數(shù)中出現(xiàn)的次數(shù)高于預(yù)設(shè)閾值的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù)。
A7、如A5所述的方法,其中,根據(jù)所述最終的關(guān)鍵指標(biāo)參數(shù)和準(zhǔn)確率最高的機器學(xué)習(xí)模型判斷集群中的服務(wù)器是否需要回收包括:
對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的與所述最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值并輸入到所述準(zhǔn)確率最高的機器學(xué)習(xí)模型中,接收所述準(zhǔn)確率最高的機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
A8、如A1所述的方法,其中,所述指標(biāo)參數(shù)包括如下中的一種或多種:
最后登錄時長;
CPU負載;
磁盤輸入輸出狀況;
核心文件最近修改時長;
已建立連接狀態(tài)的連接數(shù)。
A9、如A1-A8中任一項所述的方法,其中,該方法進一步包括:
每隔預(yù)設(shè)時間間隔,根據(jù)集群的當(dāng)前運行狀態(tài),重新獲取多組已判斷數(shù)據(jù);
根據(jù)重新獲取的多組已判斷數(shù)據(jù)重復(fù)執(zhí)行上述流程,獲取新的關(guān)鍵指標(biāo)參數(shù);
依據(jù)新的關(guān)鍵指標(biāo)參數(shù)判斷集群中的服務(wù)器是否需要回收。
本發(fā)明還公開了B10、一種判斷集群中的服務(wù)器是否需要回收的裝置,其中,該裝置包括:
數(shù)據(jù)獲取單元,適于獲取多組已判斷數(shù)據(jù);其中每組已判斷數(shù)據(jù)包括多條數(shù)據(jù),每條數(shù)據(jù)對應(yīng)一臺服務(wù)器且包括兩部分:第一部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器的一組指標(biāo)參數(shù)值,第二部分?jǐn)?shù)據(jù)是對應(yīng)服務(wù)器是否需要回收的判斷結(jié)果;
訓(xùn)練單元,適于將一組已判斷數(shù)據(jù)輸入到指定機器學(xué)習(xí)模型中,供該機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次輸入到所述機器學(xué)習(xí)模型中,并將該機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與所述多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;根據(jù)比較結(jié)果確定服務(wù)器的一個或多個關(guān)鍵指標(biāo)參數(shù);
回收判斷單元,適于對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的關(guān)鍵指標(biāo)參數(shù)值并輸入到所述機器學(xué)習(xí)模型中,接收所述機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
B11、如B10所述的裝置,其中,
所述數(shù)據(jù)獲取單元,適于采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,以及接收根據(jù)所采集的指標(biāo)參數(shù)值做出的各服務(wù)器是否需要回收的判斷結(jié)果。
B12、如B11所述的裝置,其中,
所述數(shù)據(jù)獲取單元,適于采集集群中的各服務(wù)器的指標(biāo)參數(shù)值,并通過指定渠道顯示輸出;通過所述指定渠道接收輸入的各服務(wù)器是否需要回收的人工判斷結(jié)果。
B13、如B10所述的裝置,其中,另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)所包含的指標(biāo)參數(shù)各不相同;
所述訓(xùn)練單元,適于從另外的多組已判斷數(shù)據(jù)中,選取所述機器學(xué)習(xí)模型輸出的判斷結(jié)果與相應(yīng)的第二部分?jǐn)?shù)據(jù)最為接近的一組已判斷數(shù)據(jù);將選取的該組已判斷數(shù)據(jù)的第一部分?jǐn)?shù)據(jù)中包含的一組指標(biāo)參數(shù)作為關(guān)鍵指標(biāo)參數(shù)。
B14、如B10所述的裝置,其中,
所述訓(xùn)練單元,進一步適于選取多種不同類型的機器學(xué)習(xí)模型;將同一組已判斷數(shù)據(jù)輸入到所述多種機器學(xué)習(xí)模型中,供各機器學(xué)習(xí)模型進行訓(xùn)練學(xué)習(xí);將另外的多組已判斷數(shù)據(jù)中的第一部分?jǐn)?shù)據(jù)依次分別輸入到各機器學(xué)習(xí)模型中,并將各機器學(xué)習(xí)模型輸出的各服務(wù)器是否需要回收的判斷結(jié)果與所述多組已判斷數(shù)據(jù)中的第二部分?jǐn)?shù)據(jù)對應(yīng)進行比較;根據(jù)比較結(jié)果確定各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù);根據(jù)各機器學(xué)習(xí)模型分別對應(yīng)的一組關(guān)鍵指標(biāo)參數(shù)確定最終的關(guān)鍵指標(biāo)參數(shù);再選取一組或多組已判斷數(shù)據(jù),將其第一部分?jǐn)?shù)據(jù)中的與最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值輸入到各機器學(xué)習(xí)模型中,并根據(jù)其第二部分?jǐn)?shù)據(jù)計算出各機器學(xué)習(xí)模型輸出的判斷結(jié)果的準(zhǔn)確率;選取準(zhǔn)確率最高的機器學(xué)習(xí)模型;
所述回收判斷單元,進一步適于根據(jù)所述最終的關(guān)鍵指標(biāo)參數(shù)和準(zhǔn)確率最高的機器學(xué)習(xí)模型判斷集群中的服務(wù)器是否需要回收。
B15、如B14所述的裝置,其中,
所述訓(xùn)練單元,進一步適于選取在各組關(guān)鍵指標(biāo)參數(shù)中均出現(xiàn)的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù);或者,適于選取在各組關(guān)鍵指標(biāo)參數(shù)中出現(xiàn)的次數(shù)高于預(yù)設(shè)閾值的指標(biāo)參數(shù)作為最終的關(guān)鍵指標(biāo)參數(shù)。
B16、如B14所述的裝置,其中,
所述回收判斷單元,適于對于集群中的待判斷服務(wù)器,獲取該服務(wù)器的與所述最終的關(guān)鍵指標(biāo)參數(shù)對應(yīng)的參數(shù)值并輸入到所述準(zhǔn)確率最高的機器學(xué)習(xí)模型中,接收所述準(zhǔn)確率最高的機器學(xué)習(xí)模型輸出的該服務(wù)器是否需要回收的判斷結(jié)果。
B17、如B10所述的裝置,其中,所述指標(biāo)參數(shù)包括如下中的一種或多種:
最后登錄時長;
CPU負載;
磁盤輸入輸出狀況;
核心文件最近修改時長;
已建立連接狀態(tài)的連接數(shù)。
B18、如B10-B17中任一項所述的裝置,其中,
數(shù)據(jù)獲取單元,進一步適于每隔預(yù)設(shè)時間間隔,根據(jù)集群的當(dāng)前運行狀態(tài),重新獲取多組已判斷數(shù)據(jù);
所述訓(xùn)練單元,進一步適于根據(jù)重新獲取的多組已判斷數(shù)據(jù)重復(fù)執(zhí)行上述流程,獲取新的關(guān)鍵指標(biāo)參數(shù);
所述回收判斷單元,進一步適于依據(jù)新的關(guān)鍵指標(biāo)參數(shù)判斷集群中的服務(wù)器是否需要回收。