管理云端主機(jī)的監(jiān)控系統(tǒng)及其監(jiān)控方法
【專利摘要】本發(fā)明公開了一種管理云端主機(jī)的監(jiān)控系統(tǒng)及其監(jiān)控方法,監(jiān)控系統(tǒng)包括一云端主機(jī)及多個監(jiān)控服務(wù)器,其中,每一臺監(jiān)控服務(wù)器分別用以處理不同類別的信息。云端主機(jī)主要可偵測本身的各項(xiàng)主機(jī)狀態(tài),并且據(jù)以產(chǎn)生多個狀態(tài)信息,其中多個狀態(tài)信息分別記錄不同類別的信息。接著,云端主機(jī)將所述多個不同類別的狀態(tài)信息,分別傳送至相對應(yīng)的監(jiān)控服務(wù)器,由多個監(jiān)控服務(wù)器來分類儲存云端主機(jī)的狀態(tài)信息,并且各自執(zhí)行后續(xù)的處理動作。由此降低由單一服務(wù)器來儲存、處理所有狀態(tài)信息所造成的負(fù)擔(dān)。
【專利說明】管理云端主機(jī)的監(jiān)控系統(tǒng)及其監(jiān)控方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明有關(guān)于監(jiān)控系統(tǒng)及監(jiān)控方法,尤其有關(guān)于可避免于云端數(shù)據(jù)中心的單點(diǎn)服務(wù)器或單點(diǎn)數(shù)據(jù)庫損壞時,造成監(jiān)控機(jī)制失效的監(jiān)控系統(tǒng)及監(jiān)控方法。
【背景技術(shù)】
[0002]—般來說,一個云端的數(shù)據(jù)中心需具備各式各樣的主機(jī),例如實(shí)體機(jī)器(PhysicalMachine, PM)、虛擬機(jī)器(Virtual Machine, VM)、網(wǎng)絡(luò)交換機(jī)(Switch)、路由器(Routine)、不斷電系統(tǒng)(Uninterruptible Power Supply, UPS)、防火墻(Firewall)等,以分別處理不同的信息。
[0003]為了方便管理并監(jiān)控數(shù)據(jù)中心的狀態(tài),管理人員通常會通過硬件或軟件的方式,在主機(jī)內(nèi)部設(shè)置偵測器(sensor),以監(jiān)控所述多個主機(jī)的各項(xiàng)信息,例如溫度、濕度、風(fēng)扇速率、CPU、存儲器、網(wǎng)絡(luò)狀態(tài)及硬盤容量等。并且,將所述多個偵測所得的信息定期回報并儲存于數(shù)據(jù)中心的一數(shù)據(jù)庫中,管理人員可進(jìn)一步存取該數(shù)據(jù)庫,以監(jiān)控數(shù)據(jù)中心內(nèi)各主機(jī)的各項(xiàng)信息。
[0004]現(xiàn)行的數(shù)據(jù)中心,多是由單點(diǎn)的監(jiān)控服務(wù)器與數(shù)據(jù)庫來和各主機(jī)進(jìn)行連接,由此各主機(jī)各自偵測本身的主機(jī)信息、由單點(diǎn)的監(jiān)控服務(wù)器來監(jiān)控所述多個主機(jī)信息、并由單點(diǎn)的數(shù)據(jù)庫來儲存所述多個主機(jī)信息。惟,所述多個主機(jī)需要持續(xù)地偵測本身的信息,并且周期性地將信息回報給該監(jiān)控服務(wù)器,并儲存于該數(shù)據(jù)庫中。因此,當(dāng)云端數(shù)據(jù)中心的主機(jī)數(shù)量過多、回報的頻率過于頻繁、或是同時間回報的信息量太大時,都可能會使得監(jiān)控服務(wù)器或數(shù)據(jù)庫過載,進(jìn)而造成信息的遺失。并且如上所述,一般的云端數(shù)據(jù)中心通常僅設(shè)置單點(diǎn)的監(jiān)控服務(wù)器與數(shù)據(jù)庫,因此當(dāng)監(jiān)控服務(wù)器或數(shù)據(jù)庫損壞時,云端數(shù)據(jù)中心的監(jiān)控機(jī)制將徑而失效。
[0005]再者,若云端數(shù)據(jù)中心內(nèi)的主機(jī)數(shù)量太多,也可能會導(dǎo)致數(shù)據(jù)庫的儲存空間不足,因此會需要管理人員即時添加數(shù)據(jù)庫的容量,相當(dāng)不便。
【發(fā)明內(nèi)容】
[0006]為解決現(xiàn)有技術(shù)中的上述問題,本發(fā)明的主要目的,在于提供一種管理云端主機(jī)的監(jiān)控系統(tǒng)及其監(jiān)控方法,通過分散的多個監(jiān)控服務(wù)器來分別監(jiān)控、儲存并處理相對應(yīng)的信息,以避免在單點(diǎn)服務(wù)器或單點(diǎn)數(shù)據(jù)庫損壞時,造成云端數(shù)據(jù)中心的監(jiān)控機(jī)制失效。
[0007]為達(dá)上述目的,本發(fā)明主要提供一監(jiān)控系統(tǒng),包括一云端主機(jī)及多個監(jiān)控服務(wù)器,其中,每一臺監(jiān)控服務(wù)器分別用以處理不同類別的信息。云端主機(jī)主要可偵測本身的各項(xiàng)主機(jī)狀態(tài),并且據(jù)以產(chǎn)生多個狀態(tài)信息,其中多個狀態(tài)信息分別記錄不同類別的信息。接著,云端主機(jī)將所述多個不同類別的狀態(tài)信息,分別傳送至相對應(yīng)的監(jiān)控服務(wù)器,由多個監(jiān)控服務(wù)器來分類儲存云端主機(jī)的狀態(tài)信息,并且各自執(zhí)行后續(xù)的處理動作。
[0008]本發(fā)明對照先前技術(shù)所能達(dá)成的功效在于,依據(jù)云端數(shù)據(jù)中心的預(yù)定規(guī)則來規(guī)劃多個臺的監(jiān)控服務(wù)器,并且讓每一臺監(jiān)控服務(wù)器分別監(jiān)控、儲存并處理云端主機(jī)的不同類別的信息,例如CPU、硬盤、存儲器、流量等等。由此,可以解決傳統(tǒng)通過單點(diǎn)服務(wù)器來監(jiān)控并處理所有云端主機(jī)的所有信息時,服務(wù)器的負(fù)擔(dān)太大而容易損壞的問題。
[0009]再者,傳統(tǒng)的云端數(shù)據(jù)中心,主要是通過單點(diǎn)數(shù)據(jù)庫來儲存所有云端主機(jī)的所有信息,因此,當(dāng)云端主機(jī)的數(shù)量太多時,較容易發(fā)生數(shù)據(jù)庫的儲存空間不足,而需要擴(kuò)充數(shù)據(jù)庫容量的問題。本發(fā)明讓每一臺監(jiān)控服務(wù)器可以同時擔(dān)任數(shù)據(jù)庫的角色,也就是說,數(shù)據(jù)庫的數(shù)量即等同于監(jiān)控服務(wù)器的數(shù)量,這樣可以有效解決單一數(shù)據(jù)庫的儲存空間不足的問題。
[0010]由于本發(fā)明是通過多臺監(jiān)控服務(wù)器,分別監(jiān)控、儲存并處理對應(yīng)類別的信息,因此當(dāng)任一監(jiān)控服務(wù)器損壞時,并不會影響其他監(jiān)控服務(wù)器的運(yùn)作,系統(tǒng)只要重新建立一臺新的監(jiān)控服務(wù)器,或是將云端主機(jī)導(dǎo)向備用的監(jiān)控服務(wù)器即可。因此通過此一技術(shù)方案,實(shí)可以大幅降低監(jiān)控服務(wù)器損壞時對云端數(shù)據(jù)中心所造成的影響。并且,每一臺監(jiān)控服務(wù)器彼此知道其他監(jiān)控服務(wù)器所負(fù)責(zé)的信息類別為何,因此當(dāng)使用者要查詢云端主機(jī)的特定信息時,不會因?yàn)楸O(jiān)控服務(wù)器的分散而有查詢不到數(shù)據(jù)的問題。
【專利附圖】
【附圖說明】
[0011]圖1為本發(fā)明的第一較佳具體實(shí)施例的系統(tǒng)架構(gòu)圖。
[0012]圖2為本發(fā)明的第一較佳具體實(shí)施例的時序示意圖。
[0013]圖3為本發(fā)明的第一較佳具體實(shí)施例的云端主機(jī)方塊圖。
[0014]圖4為本發(fā)明的第一較佳具體實(shí)施例的主機(jī)數(shù)據(jù)池方塊圖。
[0015]圖5為本發(fā)明的第一較佳具體實(shí)施例的監(jiān)控服務(wù)器方塊圖。
[0016]圖6為本發(fā)明的第一較佳具體實(shí)施例的監(jiān)控流程圖。
[0017]圖7為本發(fā)明的第二較佳具體實(shí)施例的監(jiān)控流程圖。
[0018]圖8為本發(fā)明的第二較佳具體實(shí)施例的系統(tǒng)架構(gòu)圖。
[0019]圖9為本發(fā)明的第一較佳具體實(shí)施例的查詢流程圖。
[0020]圖10為本發(fā)明的第三較佳具體實(shí)施例的系統(tǒng)架構(gòu)圖。
[0021]其中,附圖標(biāo)記說明如下:
[0022]1:云端主機(jī)
[0023]11:第一控制單元
[0024]12:感測單元
[0025]13:第一傳輸單元
[0026]14:主機(jī)數(shù)據(jù)池
[0027]141:隊(duì)列
[0028]142:本地端數(shù)據(jù)庫
[0029]2、5:監(jiān)控服務(wù)器
[0030]21:第二控制單元
[0031]22:數(shù)據(jù)庫
[0032]23:第二傳輸單元
[0033]24:分析單元
[0034]25:通知單元[0035]3:應(yīng)用程序界面服務(wù)器
[0036]4:外部終端
[0037]51:代理服務(wù)器
[0038]52:儲存服務(wù)器
[0039]53:分析服務(wù)器
[0040]54:通知服務(wù)器
[0041]201:第一監(jiān)控服務(wù)器
[0042]202:第二監(jiān)控服務(wù)器
[0043]203:第三監(jiān)控服務(wù)器
[0044]Il:狀態(tài)信息
[0045]T1、T2:分散雜湊表
[0046]S10?S16:步驟
[0047]S20?S28:步驟
[0048]S30"S38:步驟
[0049]S40"S48:步驟
【具體實(shí)施方式】
[0050]茲就本發(fā)明的一較佳實(shí)施例,配合圖式,詳細(xì)說明如后。
[0051]首請參閱圖1,為本發(fā)明的第一較佳具體實(shí)施例的系統(tǒng)架構(gòu)圖。如圖所示,本發(fā)明的監(jiān)控系統(tǒng)主要包括至少一臺云端主機(jī)I及多個臺監(jiān)控服務(wù)器2,并且該多個監(jiān)控服務(wù)器2分別連接該至少一云端主機(jī)I。本發(fā)明中,該多個監(jiān)控服務(wù)器2用以監(jiān)控該至少一云端主機(jī)I的主機(jī)狀態(tài),并且儲存、處理該至少一云端主機(jī)I的狀態(tài)信息。為方便說明,下面將于說明書內(nèi)文中,僅以一臺該云端主機(jī)I為例來舉例說明,并且將該云端主機(jī)I簡稱為該主機(jī)I。
[0052]該主機(jī)I及所述多個監(jiān)控服務(wù)器2皆可視為云端數(shù)據(jù)中心內(nèi)的一個端點(diǎn)(node),可由實(shí)體機(jī)器(Physical Machine, PM)或虛擬機(jī)器(Virtual Machine, VM)來實(shí)現(xiàn),不加以限定。更甚者,該監(jiān)控系統(tǒng)會依實(shí)際所需來指定任意一或多個端點(diǎn)當(dāng)作該監(jiān)控服務(wù)器2的角色,因此,當(dāng)以VM來實(shí)現(xiàn)時,則同一臺PM可同時擔(dān)任該主機(jī)I及該監(jiān)控服務(wù)器2的角色。也就是說,該主機(jī)I及所述多個監(jiān)控服務(wù)器2不一定得存在于PM中,也不一定要單獨(dú)存在,因?yàn)橐慌_PM可以同時擔(dān)任多種角色,以此讓本系統(tǒng)極具彈性。
[0053]續(xù)請參閱圖2,為本發(fā)明的第一較佳具體實(shí)施例的時序示意圖。本發(fā)明中,該監(jiān)控系統(tǒng)在指派多個端點(diǎn)的角色,以令多個端點(diǎn)成為該多個監(jiān)控服務(wù)器2時,即對該多個監(jiān)控服務(wù)器2進(jìn)行分類,由此可由多個臺該監(jiān)控服務(wù)器2來分別監(jiān)控該主機(jī)I的不同類別的信息。圖2所不的實(shí)施例中,該多個監(jiān)控服務(wù)器2以一第一監(jiān)控服務(wù)器201、一第二監(jiān)控服務(wù)器202及一第三監(jiān)控服務(wù)器203為例,然而,該多個監(jiān)控服務(wù)器2的數(shù)量,應(yīng)視實(shí)際的分類狀況而定,不以三臺為限。
[0054]舉例來說,可由該第一監(jiān)控服務(wù)器201來監(jiān)控該主機(jī)I的CPU信息、由該第二監(jiān)控服務(wù)器202來監(jiān)控該主機(jī)I的硬盤信息、由該第三監(jiān)控服務(wù)器203來監(jiān)控該主機(jī)I的網(wǎng)絡(luò)流量等。如此一來,若云端數(shù)據(jù)中心具有一千臺主機(jī),則該一千臺主機(jī)的CPU信息皆由該第一監(jiān)控服務(wù)器201來監(jiān)控、硬盤信息皆由該第二監(jiān)控服務(wù)器202來監(jiān)控、而網(wǎng)絡(luò)流量信息皆由該第三監(jiān)控服務(wù)器203來監(jiān)控。
[0055]并且,該監(jiān)控系統(tǒng)也可通過大量的該監(jiān)控服務(wù)器2,將該主機(jī)I的信息的類別再加以細(xì)分。舉例來說,可由該第一監(jiān)控服務(wù)器201來監(jiān)控CPU的使用率、由該第二監(jiān)控服務(wù)器202來監(jiān)控CPU的溫度、由該第三監(jiān)控服務(wù)器203來監(jiān)控CPU的風(fēng)扇轉(zhuǎn)速等,并由該三臺監(jiān)控服務(wù)器201-203來共同監(jiān)控該主機(jī)I的CPU信息。然而,以上所述僅為本發(fā)明的較佳具體實(shí)例,不應(yīng)以此為限。
[0056]如圖2所示,當(dāng)該主機(jī)I啟動后,會先對外進(jìn)行多重播送(Multicast)(步驟S10),同時發(fā)送封包至該監(jiān)控系統(tǒng)中的所有該監(jiān)控服務(wù)器2。接著,由第一個接收該封包的監(jiān)控服務(wù)器(以該第一監(jiān)控服務(wù)器201為例)接受該主機(jī)I的注冊動作,并且于注冊完成后,該主機(jī)I會收到該第一控監(jiān)服務(wù)器201以單點(diǎn)播送(unicast)動作回復(fù)的配置信息(步驟S12)。值得一提的是,該主機(jī)I及該多個監(jiān)控服務(wù)器2分別具有一網(wǎng)絡(luò)協(xié)議(InternetProtocol, IP)地址,彼此通過有線/無線網(wǎng)絡(luò)來傳輸數(shù)據(jù),因此,一般來說,當(dāng)該主機(jī)I發(fā)出封包時,會由IP地址最接近該主機(jī)I的IP地址者,最先接收該封包。舉例來說,若該主機(jī)I的IP地址為1.1.1.1、該第一監(jiān)控服務(wù)器201的IP地址為1.1.1.5、該第二監(jiān)控服務(wù)器202的IP地址為1.1.3.1、該第三監(jiān)控服務(wù)器203的IP地址為1.7.1.1,可斷定該第一監(jiān)控服務(wù)器201的IP地址最接近該主機(jī)I的IP地址,因此會由該第一監(jiān)控服務(wù)器201最先接收到該封包,并且接受該主機(jī)I的注冊動作。
[0057]該主機(jī)I接收的該配置信息中,主要包含了該第一監(jiān)控服務(wù)器201所提供的一分散雜湊表(如圖3中所示的分散雜湊表Tl),該分散雜湊表Tl中記錄了該多個監(jiān)控服務(wù)器2各自對應(yīng)的類別。是以,該主機(jī)I可依據(jù)該分散雜湊表Tl對本身的各項(xiàng)信息進(jìn)行分類,并且依照類別,分別傳送至對應(yīng)的所述多個監(jiān)控服務(wù)器2 (步驟S14)。例如前文所述,將CPU信息傳送到該第一監(jiān)控服務(wù)器201、將硬盤信息傳送到該第二監(jiān)控服務(wù)器202、將網(wǎng)絡(luò)流量信息傳送至該第三監(jiān)控服務(wù)器203。并且,各該監(jiān)控服務(wù)器2在被指派角色的同時,即已確定要負(fù)責(zé)監(jiān)控、儲存與處理哪一個類別的信息,因此其內(nèi)部會被設(shè)定有對應(yīng)該類別的信息的規(guī)則。各該監(jiān)控服務(wù)器2在接收并儲存了該主機(jī)I傳來的信息后,即可依據(jù)上述規(guī)則,各自對所述多個信息進(jìn)行后續(xù)的處理動作(步驟S16)。
[0058]如圖2所示,本發(fā)明通過該多個監(jiān)控服務(wù)器2,分別監(jiān)控、儲存并處理對應(yīng)類別的信息,因此可以有效解決傳統(tǒng)單一的服務(wù)器或數(shù)據(jù)庫的負(fù)擔(dān)太大的問題。
[0059]參閱圖3,為本發(fā)明的第一較佳具體實(shí)施例的云端主機(jī)方塊圖。如圖所示,該主機(jī)I主要包括一第一控制單元11、一感測單元12、一第一傳輸單元13及一主機(jī)數(shù)據(jù)池14,其中該第一控制單元11連接該感測單元12、該第一傳輸單元13及該主機(jī)數(shù)據(jù)池14。該第一控制單元用以處理該主機(jī)I中的各項(xiàng)信息。該感測單元12用以偵測該主機(jī)I本身的主機(jī)狀態(tài),例如CPU、存儲器、硬盤及網(wǎng)絡(luò)流量等,并且再依據(jù)偵測結(jié)果,產(chǎn)生多個的狀態(tài)信息II,其中,該多個狀態(tài)信息Il分別記錄不同類別的信息。舉例來說,該主機(jī)I可產(chǎn)生四項(xiàng)類別的該狀態(tài)信息II,分別為CPU類別、存儲器類別、硬盤類別及網(wǎng)絡(luò)類別,并且將該四項(xiàng)不同類別的狀態(tài)信息II,分別傳送至四臺對應(yīng)的該監(jiān)控服務(wù)器2中,以通過該多個監(jiān)控服務(wù)器2來分類儲存所述多個狀態(tài)信息II。其中,每一個類別的該狀態(tài)信息Il皆可為單筆或多筆,其數(shù)量并不以一為限。
[0060]該第一傳輸單元13用以連接該多個監(jiān)控服務(wù)器2,以將所述多個狀態(tài)信息11依類別傳送至對應(yīng)的該多個監(jiān)控服務(wù)器2。該主機(jī)數(shù)據(jù)池(Storage pool) 14則用以暫存該感測單元12偵測所得的所述多個狀態(tài)信息II。如上所述,該主機(jī)I內(nèi)部更具有該分散雜湊表Tl,并且該分散雜湊表Tl中記錄該多個監(jiān)控服務(wù)器2分別對應(yīng)至哪一個類別的該狀態(tài)信息II。是以,當(dāng)該主機(jī)I要對外傳送所述多個狀態(tài)信息Il時,主要參照該分散雜湊表Tl,以將所述多個狀態(tài)信息Il傳送至正確、對應(yīng)的該多個監(jiān)控服務(wù)器2,以利該多個監(jiān)控服務(wù)器2分類儲存所述多個狀態(tài)信息II,并且依照預(yù)定規(guī)則,分別對所述多個狀態(tài)信息Il進(jìn)行后續(xù)處理。
[0061]請同時參閱圖4,為本發(fā)明的第一較佳具體實(shí)施例的主機(jī)數(shù)據(jù)池方塊圖。如圖所示,該主機(jī)數(shù)據(jù)池14主要包括一隊(duì)列141及一本地端數(shù)據(jù)庫142,分別連接該第一控制單元
11。其中,該隊(duì)列141主要用以對待處理的數(shù)據(jù)進(jìn)行排序,而該本地端數(shù)據(jù)庫142則用以暫存該主機(jī)I的所述多個狀態(tài)信息II。
[0062]更具體而言,當(dāng)該多個監(jiān)控服務(wù)器2的其中的一損壞時,該主機(jī)I可通過該本地端數(shù)據(jù)庫142,暫存該損壞的監(jiān)控服務(wù)器2對應(yīng)的類別的所述多個狀態(tài)信息II。舉例來說,若該第一監(jiān)控服務(wù)器201用以儲存CPU的相關(guān)信息,則當(dāng)該第一監(jiān)控服務(wù)器201損壞時,該主機(jī)I會將CPU以外的所述多個狀態(tài)信息Il依類別傳送至對應(yīng)的該多個監(jiān)控服務(wù)器2,并將CPU的信息暫存于該本地端數(shù)據(jù)庫142中。當(dāng)該第一監(jiān)控服務(wù)器201被修復(fù)后,該主機(jī)I再將該本地端數(shù)據(jù)庫142內(nèi)暫存的信息傳送至該第一監(jiān)控服務(wù)器201。如此一來,不會因?yàn)樵摱鄠€監(jiān)控服務(wù)器2損壞,而造成該主機(jī)I的所述多個狀態(tài)信息Il遺失的問題。
[0063]參閱圖5為本發(fā)明的第一較佳具體實(shí)施例的監(jiān)控服務(wù)器方塊圖。如圖所示,該多個監(jiān)控服務(wù)器2中分別包括一第二控制單元21、一數(shù)據(jù)庫22、一第二傳輸單元23、一分析單元24及一通知單元25,其中該第二控制單元21連接該數(shù)據(jù)庫22、該第二傳輸單元23、該分析單元24及該通知單元25。
[0064]該第二控制單元21用以處理該監(jiān)控服務(wù)器2內(nèi)部的各項(xiàng)信息。該第二傳輸單元23用以連接該主機(jī)1,以接收該主機(jī)I所傳送的對應(yīng)類別的所述多個狀態(tài)信息II。該數(shù)據(jù)庫22用以儲存該第二傳輸單元23所接收的所述多個狀態(tài)信息II,因此,該監(jiān)控系統(tǒng)中,不再需要設(shè)置額外的數(shù)據(jù)庫來儲存該主機(jī)I的信息,而是將該多個監(jiān)控服務(wù)器2分別當(dāng)作多臺數(shù)據(jù)庫來使用。
[0065]值得一提的是,該多個監(jiān)控服務(wù)器2中分別具有一分散雜湊表T2,并且該分散雜湊表T2與該主機(jī)I中的該分散雜湊表Tl具有一樣的內(nèi)容。如上所述,該分散雜湊表T2中記錄該多個監(jiān)控服務(wù)器2所各自對應(yīng)的類別,因此,每一臺該監(jiān)控服務(wù)器2皆可查詢該分散雜湊表T2,得知其他的該監(jiān)控服務(wù)器2對應(yīng)至哪一個類別的信息。由此,當(dāng)任一臺該監(jiān)控服務(wù)器2接受外部的查詢請求時,皆可通過該分散雜湊表T2的查詢,得知外部所要尋找的信息存在哪一臺該監(jiān)控服務(wù)器2中。雖然本發(fā)明是通過分散式的方式來監(jiān)控、儲存并處理該主機(jī)I的多項(xiàng)狀態(tài)信息II,但是絕不會有找不到數(shù)據(jù)的問題。
[0066]該分析單元24用以對該數(shù)據(jù)庫22中儲存的所述多個狀態(tài)信息Il進(jìn)行分析,以判斷該主機(jī)I是否有異常事件發(fā)生,更具體而言,是判斷該主機(jī)I是否有對應(yīng)類別的異常事件發(fā)生。舉例來說,若該第二監(jiān)控服務(wù)器202用以監(jiān)控硬盤的相關(guān)信息,則該第二監(jiān)控服務(wù)器202中的該分析單元24,即用以分析該主機(jī)I的硬盤信息,并判斷該I是否有硬盤容量不足、壞道或數(shù)據(jù)損毀等問題。[0067]于一實(shí)施例中,各該監(jiān)控服務(wù)器2可依照類別來設(shè)定一預(yù)設(shè)門限值,并且該分析單元24于該狀態(tài)信息Il超過該預(yù)設(shè)門限值時,判斷該主機(jī)I發(fā)生異常。例如,該第一監(jiān)控服務(wù)器201監(jiān)控CPU的信息,并設(shè)定CPU的溫度門限值為60° C,于此實(shí)施例中,當(dāng)該狀態(tài)信息Il指出該主機(jī)I的CPU溫度超過60° C時,該第一監(jiān)控服務(wù)器201即判斷該主機(jī)I發(fā)生異常。然而以上所述僅為本發(fā)明的較佳具體實(shí)例,不應(yīng)以此為限。
[0068]該通知單元25用以當(dāng)該主機(jī)I被判定發(fā)生異常事件時,對外執(zhí)行一通知程序。更具體而言,各該監(jiān)控服務(wù)器2可預(yù)先設(shè)定一預(yù)定規(guī)則,設(shè)定發(fā)生哪些狀況時,需要執(zhí)行怎樣的通知程序。舉例來說,可由該預(yù)定規(guī)則規(guī)定,當(dāng)該主機(jī)I的CPU溫度超過60° C時,發(fā)出一通知信息給該主機(jī)1,并命令該主機(jī)I提高風(fēng)扇的轉(zhuǎn)速;并且,由該預(yù)定規(guī)則規(guī)定,當(dāng)該主機(jī)I的CPU溫度超過70° C時,發(fā)出另一通知信息給該監(jiān)控系統(tǒng)的管理人員,請管理人員至現(xiàn)場了解并排除狀況。然而以上所述僅為本發(fā)明的較佳具體實(shí)例,不應(yīng)以此為限。
[0069]續(xù)請參閱圖6,為本發(fā)明的第一較佳具體實(shí)施例的監(jiān)控流程圖。要達(dá)到本發(fā)明的監(jiān)控方法,則該主機(jī)I被啟動后,需與該多個監(jiān)控服務(wù)器2取得連線。首先,該主機(jī)I先對外進(jìn)行多重播送(步驟S20),接著,由該多個監(jiān)控服務(wù)器2中,最先接收該主機(jī)I的播送封包的該監(jiān)控服務(wù)器2來接受該主機(jī)I的注冊(步驟S22)。在該主機(jī)I注冊完成之后,該多個監(jiān)控服務(wù)器2即可為該主機(jī)I提供服務(wù)。并且,一般來說,會由IP地址最接近該主機(jī)I的IP地址者,最先接收到該播送封包,并接受該主機(jī)I的注冊,下述以該第一監(jiān)控服務(wù)器201為例來說明,但不加以限定。
[0070]當(dāng)該第一監(jiān)控服務(wù)器201接受了該主機(jī)I的注冊之后,該主機(jī)I即可由該第一監(jiān)控服務(wù)器201得到相關(guān)的配置信息(步驟S24),并且,該配置信息中包含了該分散雜湊表Tl。在該步驟S24的后,該主機(jī)I即可由該分散雜湊表Tl來得知該多個監(jiān)控服務(wù)器2分別對應(yīng)至哪一個類別,因此,該主機(jī)I不必再向其他的該監(jiān)控服務(wù)器2逐一進(jìn)行注冊動作。
[0071]接著,該主機(jī)I即可通過內(nèi)部的該感測單元12,偵測本身的主機(jī)狀態(tài),并且依據(jù)偵測結(jié)果產(chǎn)生多個的該狀態(tài)信息II,其中該多個狀態(tài)信息Il分別記錄不同類別的信息(步驟S26)。最后,該主機(jī)I參照該分散雜湊表Tl,將所述多個狀態(tài)信息Il依類別傳送至對應(yīng)的該多個監(jiān)控服務(wù)器2 (步驟S28)。值得一提的是,在該主機(jī)I尚未被關(guān)閉(如運(yùn)作于PM),或是尚未被刪除(如運(yùn)作于VM)之前,該主機(jī)I都會持續(xù)偵測本身的狀態(tài)、產(chǎn)生所述多個狀態(tài)信息I1、并依類別傳送至對應(yīng)的該多個監(jiān)控服務(wù)器2。
[0072]接續(xù)請參閱圖7,為本發(fā)明的第二較佳具體實(shí)施例的監(jiān)控流程圖。當(dāng)該主機(jī)I依類別來分別傳送所述多個狀態(tài)信息Il后,該多個監(jiān)控服務(wù)器2將可分別接收自己所負(fù)責(zé)的類別的所述多個狀態(tài)信息Il (步驟S30),并且,可通過內(nèi)部的該數(shù)據(jù)庫22分別儲存所述多個同類別的狀態(tài)信息Il (步驟S32)。接著,對所述多個狀態(tài)信息Il進(jìn)行分析,以判斷該主機(jī)I是否有異常事件發(fā)生(步驟S34)。
[0073]更具體而言,各該監(jiān)控服務(wù)器2內(nèi)部分別為所負(fù)責(zé)的類別設(shè)定有上述的預(yù)設(shè)門限值,各該監(jiān)控服務(wù)器2分析所述多個狀態(tài)信息Il是否超過該預(yù)設(shè)門限值(步驟S36),并且于超過該預(yù)設(shè)門限值時,認(rèn)定該主機(jī)I發(fā)生異常事件。若分析后發(fā)現(xiàn)沒有異常,則回到該步驟S30,各該監(jiān)控服務(wù)器2持續(xù)接收該主機(jī)I傳來的所述多個狀態(tài)信息II。然而,若分析后發(fā)現(xiàn)該主機(jī)I發(fā)生異常事件,則該監(jiān)控服務(wù)器2依據(jù)上述的該預(yù)設(shè)規(guī)則,對外執(zhí)行該通知程序(步驟S38),以直接控制該主機(jī)I,或是通知相關(guān)的管理人員。[0074]接續(xù)請同時參閱圖8及圖9,分別為本發(fā)明的第二較佳具體實(shí)施例的系統(tǒng)架構(gòu)圖,以及第一較佳具體實(shí)施例的查詢流程圖。如圖8所示,該監(jiān)控系統(tǒng)還可包括一應(yīng)用程序界面(Application Programing Interface, API)服務(wù)器3,連接該多個監(jiān)控服務(wù)器2。該API服務(wù)器3主要是作為該監(jiān)控系統(tǒng)的一查詢界面,接收外部終端4通過網(wǎng)絡(luò)系統(tǒng)所傳來的查詢請求。該API服務(wù)器3內(nèi)部亦具有該分散雜湊表(圖未標(biāo)示),因此,當(dāng)該API服務(wù)器3收到該外部終端4對于一特定類別(例如CPU)的該狀態(tài)信息Il的查詢請求時,可依據(jù)內(nèi)部的分散雜湊表,連結(jié)到對應(yīng)該特定類別的該監(jiān)控服務(wù)器2來進(jìn)行查詢。
[0075]以該第三監(jiān)控服務(wù)器203為例,當(dāng)該第三監(jiān)控服務(wù)器203收到一查詢請求時,會先判斷本身是否有儲存該特定類別(例如上述的CPU)的該狀態(tài)信息II,若有,則該第三監(jiān)控服務(wù)器203可直接以內(nèi)部儲存的該狀態(tài)信息Il回復(fù)該查詢請求;若沒有,則該第三監(jiān)控服務(wù)器203會再參照該分散雜湊表T2,并建議該API服務(wù)器3或該外部終端4可以到哪一臺該監(jiān)控服務(wù)器2去尋找。
[0076]接著如圖9所示,首先,當(dāng)使用者要查詢該特定類別的該狀態(tài)信息Il時,該API服務(wù)器3會收到該外部終端4發(fā)出的該查詢請求(步驟S40),接著,即可依據(jù)該分散雜湊表,連結(jié)至對應(yīng)該特定類別的該監(jiān)控服務(wù)器2中進(jìn)行查詢(步驟S42)。當(dāng)該監(jiān)控服務(wù)器2收到該查詢請求后,需判斷其本身是否儲存有該特定類別的該狀態(tài)信息Il (步驟S44)。若該監(jiān)控服務(wù)器2對應(yīng)至該特定類別,則該監(jiān)控服務(wù)器2可直接以該特定類別的該狀態(tài)信息Il回復(fù)該查詢請求(步驟S46);若該監(jiān)控服務(wù)器2并非對應(yīng)至該特定類別,則該監(jiān)控服務(wù)器2查詢內(nèi)部的該分散雜湊表T2,并且建議該API服務(wù)器3到可能對應(yīng)該特定類別的其他監(jiān)控服務(wù)器2中進(jìn)行查詢(步驟S48)。
[0077]前述實(shí)施例中,各該監(jiān)控服務(wù)器2系分別以單個端點(diǎn)(node)來實(shí)現(xiàn),并且由該端點(diǎn)中的各個單元來分別執(zhí)行各項(xiàng)工作。然而,若該監(jiān)控系統(tǒng)中的該主機(jī)I數(shù)量過多,例如上萬臺甚至數(shù)十萬臺時,即使單一臺該監(jiān)控服務(wù)器2只負(fù)責(zé)監(jiān)控、儲存并處理單一類別的該狀態(tài)信息II,但仍可能發(fā)生過載的問題。是以,于另一實(shí)施例中,還可將各該監(jiān)控服務(wù)器2分別拆開,以多臺實(shí)體或虛擬的服務(wù)器來共同擔(dān)任一臺該監(jiān)控服務(wù)器2的角色,以此減低每一臺服務(wù)器的負(fù)擔(dān)。
[0078]參閱圖10,為本發(fā)明的第三較佳具體實(shí)施例的系統(tǒng)架構(gòu)圖。本實(shí)施例中,一監(jiān)控服務(wù)器5的角色,主要由數(shù)臺的服務(wù)器來共同擔(dān)任。如圖中所示,該監(jiān)控服務(wù)器5主要包括了一代理服務(wù)器51、一儲存服務(wù)器52、一分析服務(wù)器53及一通知服務(wù)器54。然而,本實(shí)施例中以四臺服務(wù)器為例,但應(yīng)視該監(jiān)控系統(tǒng)的實(shí)際所需而定,不應(yīng)加以限定。
[0079]該代理服務(wù)器51主要用以連接該主機(jī)1,并接收該主機(jī)I傳送的對應(yīng)類別的所述多個狀態(tài)信息II,以將該代理服務(wù)器51做為該監(jiān)控服務(wù)器5與該主機(jī)I之間的連接界面。該儲存服務(wù)器52用以儲存該代理服務(wù)器51所接收的所述多個狀態(tài)信息II,以做為該監(jiān)控服務(wù)器5的一數(shù)據(jù)庫。
[0080]該分析服務(wù)器53內(nèi)部具有演算法及上述預(yù)定門限值,主要用以對該儲存服務(wù)器52所儲存的所述多個狀態(tài)信息Il進(jìn)行分析,進(jìn)而判斷該主機(jī)I是否有異常事件發(fā)生。其中,不同的該分析服務(wù)器53內(nèi)部具有的演算法及預(yù)定門限值皆不相同,可由多臺該分析服務(wù)器53,分別分析該主機(jī)I的不同類別的所述多個狀態(tài)信息II。該通知服務(wù)器54用以當(dāng)該主機(jī)I被判定發(fā)生異常事件時,依據(jù)上述的預(yù)定規(guī)則,對外執(zhí)行相對應(yīng)的通知程序,例如,命令該主機(jī)I解決該異常事件,或通知管理人員到場進(jìn)行了解與狀況排除等。
[0081]通過上述實(shí)施例的作法,可以將服務(wù)器的負(fù)擔(dān)更進(jìn)一步地分散,例如,若將所述多個狀態(tài)信息Il分別五個類別,并且每一該監(jiān)控服務(wù)器5皆由四臺服務(wù)器來共同擔(dān)任,則該監(jiān)控系統(tǒng)中,共由二十臺服務(wù)器來監(jiān)控、儲存并處理該主機(jī)I的所述多個狀態(tài)信息II。如此一來,絕不會發(fā)生單一服務(wù)器或數(shù)據(jù)庫因過載而損壞的問題。
[0082]以上所述僅為本發(fā)明的較佳具體實(shí)例,非因此即局限本發(fā)明的專利范圍,故舉凡運(yùn)用本
【發(fā)明內(nèi)容】
所為的等效變化,均同理皆包含于本發(fā)明的范圍內(nèi),合予陳明。
【權(quán)利要求】
1.一種管理云端主機(jī)的監(jiān)控系統(tǒng),包括: 一云端主機(jī),具有一感測單元,偵測該云端主機(jī)的狀態(tài),并依據(jù)偵測結(jié)果產(chǎn)生多個狀態(tài)信息,該多個狀態(tài)信息分別記錄不同類別的信息; 多個監(jiān)控服務(wù)器,分別連接該云端主機(jī),各該監(jiān)控服務(wù)器分別對應(yīng)至該多個狀態(tài)信息中的一個類別; 其中,該云端主機(jī)依據(jù)各該監(jiān)控服務(wù)器所對應(yīng)的類別,將該多個狀態(tài)信息分別傳送至對應(yīng)的該多個監(jiān)控服務(wù)器,通過該多個監(jiān)控服務(wù)器分類儲存該云端主機(jī)的所述多個狀態(tài)信肩、O
2.如權(quán)利要求1所述的監(jiān)控系統(tǒng),其中該云端主機(jī)具有一分散雜湊表,記錄該多個監(jiān)控服務(wù)器各自對應(yīng)的類別,該云端主機(jī)依據(jù)該分散雜湊表,將所述多個狀態(tài)信息依類別傳送至對應(yīng)的該多個監(jiān)控服務(wù)器。
3.如權(quán)利要求2所述的監(jiān)控系統(tǒng),其中該云端主機(jī)包括: 一第一傳輸單元,連接該多個監(jiān)控服務(wù)器,將所述多個狀態(tài)信息依類別傳送至對應(yīng)的該多個監(jiān)控服務(wù)器; 一主機(jī)數(shù)據(jù)池,暫存?zhèn)蓽y所得的所述多個狀態(tài)信息 '及 一第一控制單元,連接該第一傳輸單元、該主機(jī)數(shù)據(jù)池及該感測單元,處理該云端主機(jī)的各項(xiàng)信息。
4.如權(quán)利要求3所述的監(jiān)控系統(tǒng),其中該主機(jī)數(shù)據(jù)池包括一隊(duì)列及一本地端數(shù)據(jù)庫,該隊(duì)列對待處理的數(shù)據(jù)進(jìn)行排序,并且當(dāng)該多個監(jiān)控服務(wù)器的其中之一損壞時,該云端主機(jī)通過該本地端數(shù)據(jù)庫暫存該損壞的監(jiān)控服務(wù)器對應(yīng)的類別的所述多個狀態(tài)信息。
5.如權(quán)利要求3所述的監(jiān)控系統(tǒng),其中該多個監(jiān)控服務(wù)器分別包括: 一第二傳輸單元,連接該云端主機(jī),接收該云端主機(jī)傳送的對應(yīng)類別的所述多個狀態(tài)信息; 一數(shù)據(jù)庫,儲存所接收的所述多個狀態(tài)信息;及 一第二控制單元,連接該第二傳輸單元及該數(shù)據(jù)庫,處理該監(jiān)控服務(wù)器的各項(xiàng)信息。
6.如權(quán)利要求5所述的監(jiān)控系統(tǒng),其中該多個監(jiān)控服務(wù)器分別包括該分散雜湊表,當(dāng)該多個監(jiān)控服務(wù)器的其中之一接受該云端主機(jī)的注冊時,將該分散雜湊表傳送至該云端主機(jī)。
7.如權(quán)利要求6所述的監(jiān)控系統(tǒng),其中該多個監(jiān)控服務(wù)器分別包括: 一分析單元,連接該第二控制單元,對儲存的所述多個狀態(tài)信息進(jìn)行分析,判斷該云端主機(jī)是否有異常事件發(fā)生;及 一通知單元,連接該第二控制單元,當(dāng)該云端主機(jī)發(fā)生異常事件時,依據(jù)一預(yù)定規(guī)則對外執(zhí)行一通知程序。
8.如權(quán)利要求7所述的監(jiān)控系統(tǒng),其中還包括一應(yīng)用程序界面服務(wù)器,連接該多個監(jiān)控服務(wù)器,并具有該分散雜湊表,該應(yīng)用程序界面監(jiān)控服務(wù)器接收外部終端對于一特定類別的狀態(tài)信息的查詢請求時,依據(jù)該分散雜湊表,至對應(yīng)該特定類別的該監(jiān)控服務(wù)器進(jìn)行查詢。
9.如權(quán)利要求3所述的監(jiān)控系統(tǒng),其中該多個監(jiān)控服務(wù)器分別包括: 一代理服務(wù)器,連接該云端主機(jī),接收該云端主機(jī)傳送的對應(yīng)類別的所述多個狀態(tài)信息; 一儲存服務(wù)器,儲存該代理服務(wù)器接收的所述多個狀態(tài)信息; 一分析服務(wù)器,對儲存的所述多個狀態(tài)信息進(jìn)行分析,判斷該云端主機(jī)是否有異常事件發(fā)生 '及 一通知服務(wù)器,當(dāng)該云端主機(jī)發(fā)生異常事件時,依據(jù)一預(yù)定規(guī)則對外執(zhí)行一通知程序。
10.一種管理云端主機(jī)的監(jiān)控方法,包括: a)一云端主機(jī)偵測本身的狀態(tài),并產(chǎn)生多個狀態(tài)信息,其中該多個狀態(tài)信息分別記錄不同類別的信息; b)連接多個監(jiān)控服務(wù)器,其中各該監(jiān)控服務(wù)器分別對應(yīng)至所述多個狀態(tài)信息中的一個類別; c)依據(jù)各該監(jiān)控服務(wù)器所對應(yīng)的類別,將所述多個狀態(tài)信息依類別傳送至對應(yīng)的該多個監(jiān)控服務(wù)器。
11.如權(quán)利要求10所述的監(jiān)控方法,其中該步驟a之前包括下列步驟: aOl)該云端主機(jī)對外進(jìn)行多重播送; a02)由最先接收該云端主機(jī)播送的封包的該監(jiān)控服務(wù)器接受該云端主機(jī)的注冊; a03)傳送一分散雜湊表至注冊完成的該云端主機(jī),其中該分散雜湊表記錄該多個監(jiān)控服務(wù)器各自對應(yīng)的類別。
12.如權(quán)利要求11所述的監(jiān)控方法,其中該步驟a02中,由該多個監(jiān)控服務(wù)器中,IP地址最接近該云端主機(jī)的IP地址者最先接收該封包。
13.如權(quán)利要求10所述的監(jiān)控方法,其中還包括下列步驟: d)該多個監(jiān)控服務(wù)器分別接收對應(yīng)類別的所述多個狀態(tài)信息; e)儲存所述多個狀態(tài)信息; f)分析所述多個狀態(tài)信息,并判斷該云端主機(jī)是否有異常事件發(fā)生'及 g)當(dāng)該云端主機(jī)發(fā)生異常事件時,依據(jù)一預(yù)設(shè)規(guī)則對外執(zhí)行一通知程序。
14.如權(quán)利要求13所述的監(jiān)控方法,其中該多個監(jiān)控服務(wù)器分別針對所對應(yīng)的類別設(shè)置一預(yù)設(shè)門限值,并且該步驟f包括: fl)分析所述多個狀態(tài)信息是否超過該預(yù)設(shè)門限值 '及 ?2)當(dāng)所述多個狀態(tài)信息超過該預(yù)設(shè)門限值時,認(rèn)定該云端主機(jī)發(fā)生異常事件。
15.如權(quán)利要求10所述的監(jiān)控方法,其中還包括下列步驟: h)該多個監(jiān)控服務(wù)器的其中之一接收一特定類別的狀態(tài)信息的查詢請求; i)判斷該監(jiān)控服務(wù)器中是否儲存有該特定類別的狀態(tài)信息; j)若該監(jiān)控服務(wù)器中儲存有該特定類別的狀態(tài)信息,依據(jù)該狀態(tài)信息回復(fù)該查詢請求 '及 k)若該監(jiān)控服務(wù)器中沒有該特定類別的狀態(tài)信息,該監(jiān)控服務(wù)器查詢一分散雜湊表,并建議發(fā)出該查詢請求的一外部終端至其他監(jiān)控服務(wù)器中查詢,其中該分散雜湊表記錄該多個監(jiān)控服務(wù)器各自對應(yīng)的類別。
16.一種管理云端主機(jī)的監(jiān)控系統(tǒng),包括: 多個監(jiān)控服務(wù)器,分別對應(yīng)處理不同類別的信息,各該監(jiān)控服務(wù)器分別具有一分散雜湊表,記錄各該監(jiān)控服務(wù)器各自對應(yīng)的類別 '及一云端主機(jī),連接該多個監(jiān)控服務(wù)器,該云端主機(jī)具有一感測單元,偵測該云端主機(jī)的狀態(tài),并依據(jù)偵測結(jié)果產(chǎn)生多個狀態(tài)信息,其中該多個狀態(tài)信息分別記錄不同類別的信息; 其中,該云端主機(jī)由該多個監(jiān)控服務(wù)器的其中之一接收該分散雜湊表,并且依據(jù)該分散雜湊表,將該多個狀態(tài)信息分別依類別傳送至對應(yīng)的該多個監(jiān)控服務(wù)器,通過該多個監(jiān)控服務(wù)器分類儲存該云端主機(jī)的所述多個狀態(tài)信息。
17.如權(quán)利要求16所述的監(jiān)控系統(tǒng),其中還包括一應(yīng)用程序界面服務(wù)器,連接該多個監(jiān)控服務(wù)器,并具有該分散雜湊表,該應(yīng)用程序界面監(jiān)控服務(wù)器接收外部終端對于一特定類別的狀態(tài)信息的查詢請求時,依據(jù)該分散雜湊表,連結(jié)到對應(yīng)該特定類別的該監(jiān)控服務(wù)器進(jìn)行查詢。
18.如權(quán)利要求16所述的監(jiān)控系統(tǒng),其中該云端主機(jī)包括: 一第一傳輸單元,連接該多個監(jiān)控服務(wù)器,將所述多個狀態(tài)信息依類別傳送至對應(yīng)的該多個監(jiān)控服務(wù)器; 一隊(duì)列,對待處理的所述多個狀態(tài)信息進(jìn)行排序; 一本地端數(shù)據(jù)庫,當(dāng)該多個監(jiān)控服務(wù)器的其中的一損壞時,暫存該損壞的監(jiān)控服務(wù)器對應(yīng)的類別的所述多個狀態(tài)信息;及 一第一控制單元,連接該第一傳輸單元、該隊(duì)列、該本地端數(shù)據(jù)庫及該感測單元,處理該云端主機(jī)的各項(xiàng)信息。
19.如權(quán)利要求16所述的監(jiān)控系統(tǒng),其中該多個監(jiān)控服務(wù)器分別包括: 一第二傳輸單元,連接該云端主機(jī),接收該云端主機(jī)傳送的對應(yīng)類別的所述多個狀態(tài)信息; 一數(shù)據(jù)庫,儲存所接收的所述多個狀態(tài)信息; 一分析單元,對儲存的所述多個狀態(tài)信息進(jìn)行分析,判斷該云端主機(jī)是否有異常事件發(fā)生; 一通知單元,當(dāng)該云端主機(jī)發(fā)生異常事時,依據(jù)一預(yù)定規(guī)則對外執(zhí)行一通知程序 '及 一第二控制單元,連接該第二傳輸單元、該數(shù)據(jù)庫、該分析單元及該通知單元,處理該監(jiān)控服務(wù)器的各項(xiàng)信息。
20.如權(quán)利要求16所述的監(jiān)控系統(tǒng),其中該多個監(jiān)控服務(wù)器分別包括: 一代理服務(wù)器,連接該云端主機(jī),接收該云端主機(jī)傳送的對應(yīng)類別的所述多個狀態(tài)信息; 一儲存服務(wù)器,儲存該代理服務(wù)器接收的所述多個狀態(tài)信息; 一分析服務(wù)器,對儲存的所述多個狀態(tài)信息進(jìn)行分析,判斷該云端主機(jī)是否有異常事件發(fā)生 '及 一通知服務(wù)器,當(dāng)該云端主機(jī)發(fā)生異常事件時,依據(jù)一預(yù)定規(guī)則對外執(zhí)行一通知程序。
【文檔編號】H04L12/26GK103716195SQ201210370453
【公開日】2014年4月9日 申請日期:2012年9月28日 優(yōu)先權(quán)日:2012年9月28日
【發(fā)明者】洪瑞聰, 許秉慧 申請人:臺達(dá)電子工業(yè)股份有限公司