專利名稱::機柜系統(tǒng)及機柜系統(tǒng)的監(jiān)控方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種服務(wù)器監(jiān)控技術(shù),尤其涉及一種收集與監(jiān)控多臺服務(wù)器的溫度信息的機柜系統(tǒng)以及機柜系統(tǒng)的監(jiān)控方法。
背景技術(shù):
:為了應(yīng)付在云端科技及網(wǎng)絡(luò)應(yīng)用領(lǐng)域中龐大的運算效能,廠商便將多臺服務(wù)器整合成可集中管理的機柜(RACK)設(shè)備,并且將這些機柜設(shè)備整合成機柜系統(tǒng)。此處的機柜系統(tǒng)也可以稱為是貨柜式計算機(containercomputer)。機柜系統(tǒng)將可統(tǒng)一監(jiān)控這些服務(wù)器的散熱、供電...等環(huán)境因素,節(jié)省營運成本。每臺服務(wù)器的主機板通常會在重要組件及特定區(qū)域設(shè)置溫度感測器。溫度感測器可偵測這些組件的表面溫度或是服務(wù)器中的環(huán)境溫度,從而產(chǎn)生相對應(yīng)的溫度信息,使得服務(wù)器本身可藉以判斷中央處理器(CPU)、芯片組...等組件或是環(huán)境溫度是否過熱。詳言之,機柜系統(tǒng)會先通過特定服務(wù)器或特定計算機進行溫度數(shù)據(jù)的收集與判斷,在此可將特定服務(wù)器或特定計算機稱為主控伺服端(servernode),此主控伺服端則可控制相對應(yīng)的控制器來集中統(tǒng)一管控散熱裝置(例如,風(fēng)扇裝置、水冷系統(tǒng))。因此,如何有效收集與監(jiān)控散落于機柜系統(tǒng)中的服務(wù)器及其溫度數(shù)據(jù),進而即時調(diào)整機柜系統(tǒng)的散熱裝置,便是許多廠商所欲解決的問題。
發(fā)明內(nèi)容本發(fā)明提供一種機柜系統(tǒng)及機柜系統(tǒng)的監(jiān)控方法,此機柜系統(tǒng)利用階層式服務(wù)器結(jié)構(gòu)來收集與監(jiān)控每個區(qū)域中的最高溫度信息,并通過階層式服務(wù)器的替代機制,以解決當(dāng)主要節(jié)點無法連線時,無法持續(xù)匯報此區(qū)域的溫度信息的缺點。本發(fā)明提出一種機柜系統(tǒng),此機柜系統(tǒng)包括多個服務(wù)器與一主控伺服端。服務(wù)器配置于N個區(qū)域中,N為正整數(shù)。主控伺服端耦接至所述服務(wù)器,主控伺服端選擇第i個區(qū)域中多個服務(wù)器的其中之一作為第i個區(qū)域的主要節(jié)點,i為正整數(shù)且I<i<N。此主要節(jié)點用以收集第i個區(qū)域中這些服務(wù)器的溫度信息,并且統(tǒng)整這些溫度信息,以傳遞最高溫度信息至主控伺服端。當(dāng)主控伺服端無法連線至所述的主要節(jié)點時,主控伺服端在第i個區(qū)域中選擇與主控伺服端連線的其它服務(wù)器的其中之一作為替代節(jié)點,并且將此替代節(jié)點調(diào)整為第i個區(qū)域的主要節(jié)點,以持續(xù)收集第i個區(qū)域中的溫度信息。在本發(fā)明的一實施例中,上述的機柜系統(tǒng)還包括N個散熱裝置以及一散熱控制器。N個散熱裝置分別相對應(yīng)的配置于N個區(qū)域。散熱控制器耦接至所述主控伺服端與所述散熱裝置。主控伺服端依據(jù)N個區(qū)域各自配置的最高溫度信息來傳送一散熱控制請求至散熱控制器,以調(diào)整對應(yīng)于N個區(qū)域的N個散熱裝置的散熱效率。在本發(fā)明的一實施例中,上述的主控伺服端讀取一服務(wù)器地址映像表(mappingtable)以解析第i個區(qū)域所配置的服務(wù)器,并依序發(fā)送一測試請求至第i個區(qū)域中的服務(wù)器,以尋找可作為主要節(jié)點的服務(wù)器。并且,主控伺服端將可作為主要節(jié)點的服務(wù)器記錄于所述服務(wù)器地址映像表。在本發(fā)明的一實施例中,當(dāng)主控伺服端無法連線至主要節(jié)點時,主控伺服端將會讀取所述服務(wù)器地址映像表,藉以依序?qū)勺鳛橹饕?jié)點的服務(wù)器發(fā)送此測試請求。并且,主控伺服端將回傳一測試回應(yīng)的服務(wù)器的其中之一設(shè)定為替代節(jié)點。從另一角度來看,本發(fā)明提出一種機柜系統(tǒng)的監(jiān)控方法。此機柜系統(tǒng)包括配置于N個區(qū)域的多個服務(wù)器,N為正整數(shù)。此監(jiān)控方法包括下列步驟:解析并選擇第i個區(qū)域中多個服務(wù)器的其中之一,藉以作為第i個區(qū)域的主要節(jié)點。依序?qū)γ總€區(qū)域的主要節(jié)點發(fā)出一匯報請求,使得主要節(jié)點收集第i個區(qū)域中各個服務(wù)器的多個溫度信息,統(tǒng)整這些溫度信息,并傳遞一最高溫度信息。當(dāng)無法連線至所述主要節(jié)點時,在第i個區(qū)域中選擇連線的其它服務(wù)器的其中之一作為一替代節(jié)點,并將此替代節(jié)點調(diào)整為第i個區(qū)域的主要節(jié)點,以持續(xù)收集第i個區(qū)域中的溫度信息。機柜系統(tǒng)的監(jiān)控方法的其余實施細節(jié)請參照上述說明,在此不加贅述?;谏鲜?,本發(fā)明實施例所述的機柜系統(tǒng)的主控伺服端在每個區(qū)域的服務(wù)器中選定一主要節(jié)點,藉以利用階層式服務(wù)器結(jié)構(gòu)來收集與監(jiān)控此區(qū)域的最高溫度信息。并且,在主要節(jié)點無法與主控伺服端進行連線時,利用階層式服務(wù)器的替代機制,也就是說,主控伺服端在此區(qū)域中便可選擇其它與主控伺服端連線的服務(wù)器作為替代節(jié)點,并將此替代節(jié)點調(diào)整為主要節(jié)點。藉此,便可在主要節(jié)點無法連線時,通過替代節(jié)點來持續(xù)匯報溫度信息。為讓本發(fā)明的上述特征和優(yōu)點能更明顯易懂,下文特舉實施例,并配合附圖作詳細說明如下。圖1是根據(jù)本發(fā)明一實施例說明機柜系統(tǒng)的示意圖。圖2為符合本發(fā)明一實施例所述的機柜系統(tǒng)的監(jiān)控方法的流程圖。主要組件符號說明:100:機柜系統(tǒng)110:機柜裝置120:服務(wù)器130:風(fēng)扇裝置140:水冷裝置150:交換機160:主控伺服端170:風(fēng)扇控制器ZlZN:區(qū)域S210S240:步驟具體實施例方式現(xiàn)將詳細參考本發(fā)明的示范性實施例,在附圖中說明所述示范性實施例的實例。另外,凡可能之處,在圖式及實施方式中使用相同標(biāo)號的組件/構(gòu)件/符號代表相同或類似部分。圖1是根據(jù)本發(fā)明一實施例說明機柜系統(tǒng)100的示意圖。機柜系統(tǒng)100可以包括多個機柜裝置110與主控伺服端160,主控伺服端160例如是獨立設(shè)置于眾多機柜裝置110外的計算機或是位于機柜裝置HO中的其中一個服務(wù)器。每個機柜裝置110具有多個服務(wù)器120、符合以太網(wǎng)絡(luò)規(guī)格的交換機150以及散熱裝置。服務(wù)器120配置于N個區(qū)域ZlZN,N為正整數(shù)。于本實施例中,每個服務(wù)器120中包括一基板管理控制器(boardmanagementcontroller;簡稱BMC)。本實施例中所揭示的監(jiān)控方法主要是藉由主控伺服端160利用軟體執(zhí)行的伺服引擎(serviceengine)以及各個服務(wù)器120的基板管理控制器加以執(zhí)行,然而本發(fā)明并不受限于此。于其它實施例中,亦可以通過主控伺服端160及服務(wù)器120中的其它組件來實現(xiàn)本發(fā)明,例如,以主控伺服端160與各個服務(wù)器120的中央處理器、配合執(zhí)行本發(fā)明實施例中所述功能的應(yīng)用程序來加以實現(xiàn)。機柜系統(tǒng)100還包括散熱控制器,例如是風(fēng)扇控制器170。風(fēng)扇控制器170耦接至主控伺服端160與各個機柜裝置110中的散熱裝置。每個機柜裝置110中的散熱裝置則包括N個風(fēng)扇裝置130以及水冷裝置140。每個風(fēng)扇裝置130以及水冷裝置140分別配置于相對應(yīng)的區(qū)域ZlZN。此外,本實施例的主控伺服端160通過以太網(wǎng)絡(luò)以及交換機150,以有線網(wǎng)絡(luò)的型態(tài)耦接至位在各個區(qū)域ZlZN中的服務(wù)器120。因此,為了維持機柜系統(tǒng)100中各個服務(wù)器120能夠在適合的環(huán)境溫度下正常運作,又能達到節(jié)省能源的功效,主控伺服端160需要持續(xù)不斷地對每臺服務(wù)器120的基板管理控制器進行輪詢,以收集每個服務(wù)器120的溫度信息,才能即時調(diào)整散熱裝置,從而增強/減弱環(huán)境散熱的效果。例如,即時地增加/減少風(fēng)扇裝置130的轉(zhuǎn)速來調(diào)節(jié)對應(yīng)區(qū)域的環(huán)境溫度。然而,由于每個風(fēng)扇裝置130可以吹拂對應(yīng)的整個區(qū)域,例如,在此以第i個區(qū)域Zi作為舉例,i為正整數(shù)且I<i<N,因此應(yīng)只需要得知第i個區(qū)域Zi中服務(wù)器120內(nèi)的基板管理控制器所偵測得到的最高溫度信息即可,不需要對每個服務(wù)器120的基板管理控制器進行輪詢。藉此,本發(fā)明實施例的主控伺服端160在每個區(qū)域的眾多服務(wù)器120中選擇其中一個服務(wù)器120,并使其作為主要節(jié)點,藉以形成階層式的服務(wù)器結(jié)構(gòu)。其功能在于,此主要節(jié)點的基板管理控制器可用來收集位于第i個區(qū)域Zi中所有服務(wù)器120的溫度信息,并且統(tǒng)整這些溫度信息,以取得這個區(qū)域Zi中最高的溫度信息,并將此最高溫度信息傳遞至主控伺服端160。主控伺服端160將會分別依據(jù)每個區(qū)域各自的最高溫度信息來產(chǎn)生一散熱控制請求,并將此散熱控制請求傳送至風(fēng)扇控制器170,以調(diào)整對應(yīng)于N個區(qū)域的N個散熱裝置的散熱效率,例如,調(diào)整各個風(fēng)扇裝置130的轉(zhuǎn)速,水冷裝置140的進水溫度、進水壓力、水閥開關(guān)...等。由于主控伺服端160僅需對每個區(qū)域中的主要節(jié)點進行輪詢,便可取得各個區(qū)域的最高溫度信息,因此可大幅降低主控伺服端160的運算效能需求。并且,主控伺服端160可通過風(fēng)扇控制器170來準(zhǔn)確地控制各個機柜裝置110的散熱裝置。需要特別說明的是,當(dāng)主要節(jié)點因某些原因而造成無法跟主控伺服端160匯報區(qū)域Zi的溫度信息時,舉例來說,主要節(jié)點的基板管理控制器芯片或電路毀損的網(wǎng)絡(luò)IP被更改,而無法與網(wǎng)絡(luò)連線或是主要節(jié)點的基板管理控制器芯片與主控伺服端160的伺服引擎之間的連線中斷時,主控伺服端160無法得知區(qū)域Zi的溫度信息,僅能使區(qū)域Zi所對應(yīng)的風(fēng)扇裝置130全速運轉(zhuǎn)。如此一來,不僅造成常態(tài)性噪音、電源供應(yīng)的泛濫以及風(fēng)扇的持續(xù)性耗損以外,上述階層式服務(wù)器結(jié)構(gòu)的相關(guān)機制也會成為雞肋,甚至可能會讓主控伺服端160的伺服引擎成為拖累系統(tǒng)效能的無用程序。于此,本發(fā)明實施例的精神在于,以上述階層式服務(wù)器結(jié)構(gòu)作為基礎(chǔ),藉此來收集與監(jiān)控每個區(qū)域中的最高溫度信息,并在各個區(qū)域中服務(wù)器120之間進行替代機制,利用可以進行連線的服務(wù)器取代無法連線的主要節(jié)點。藉此,便可以解決當(dāng)主要節(jié)點無法連線時,無法將此區(qū)域的溫度信息進行匯報的缺點。換句話說,當(dāng)主控伺服端160無法連線至第i個區(qū)域Zi的主要節(jié)點時,主控伺服端160便會在第i個區(qū)域Zi中偵測選擇目前可以與主控伺服端160連線的其它服務(wù)器,并在這些服務(wù)器中選擇其中之一作為替代節(jié)點。并且,主控伺服端160將此替代節(jié)點調(diào)整為第i個區(qū)域Zi的主要節(jié)點,以讓此替代節(jié)點可以持續(xù)收集第i個區(qū)域Zi中的溫度信息,因此主控伺服端160便不需要對舊的主要節(jié)點進行輪詢。圖2為符合本發(fā)明一實施例所述的機柜系統(tǒng)100的監(jiān)控方法的流程圖。本監(jiān)控方法適用于如圖1所示的機柜系統(tǒng)100,因此部份關(guān)于機柜系統(tǒng)100的實施方式請參照上述說明,在此不再贅述。請同時參考圖1與圖2,于步驟S210中,主控伺服端160解析并選擇區(qū)域Zi中其中一個服務(wù)器120,藉以使其作為區(qū)域Zi的主要節(jié)點。在此詳細說明步驟S210。在本實施例中,主控伺服端會讀取一服務(wù)器地址映像表(mappingtable)以解析每個區(qū)域所配置的服務(wù)器。此服務(wù)器地址映像表中包含每個機柜裝置110、區(qū)域ZlZN的標(biāo)號及對應(yīng)的網(wǎng)絡(luò)協(xié)定(IP)地址。因此,主控伺服端160可通過服務(wù)器地址映像表來解析出每個區(qū)域中各個服務(wù)器的網(wǎng)絡(luò)地址、位在機柜系統(tǒng)100中的實際位置、以及每個區(qū)域?qū)?yīng)的散熱裝置。此外,服務(wù)器地址映像表也應(yīng)包含有一主要節(jié)點欄位,藉以記錄每個區(qū)域中哪個服務(wù)器為主要節(jié)點。并且,服務(wù)器地址映像表將會依序發(fā)送一測試請求至區(qū)域Zi中的服務(wù)器,以尋找可作為主要節(jié)點的服務(wù)器120。由于不是每個服務(wù)器120皆可支持符合本發(fā)明實施例中所述的監(jiān)控方法,有部份運算量大的服務(wù)器120可以不用、也不需要作為本發(fā)明實施例中所述的主要節(jié)點。因此,主控伺服端160利用發(fā)送測試請求的方式,將會回傳一測試回應(yīng)的服務(wù)器120視為可作為主要節(jié)點的服務(wù)器,并將這些服務(wù)器記錄于服務(wù)器地址映像表中,以待后續(xù)使用。然后,本實施例的主控伺服端160依據(jù)服務(wù)器地址映像表中區(qū)域Zi所列的服務(wù)器的順序,選擇在表中此區(qū)域Zi上第一個可以回傳上述測試回應(yīng)的服務(wù)器120,以作為區(qū)域Zi中的主要節(jié)點。接著,于步驟S220中,主控伺服端160依序?qū)γ總€區(qū)域的主要節(jié)點發(fā)出匯報請求(reportrequest),使得主要節(jié)點得以被喚醒,并開始收集第i個區(qū)域Zi中各個服務(wù)器120的溫度信息,然后統(tǒng)整這些溫度信息以得出最高的溫度信息,并將此最高的溫度信息傳遞至主控伺服端160。于本實施例中,步驟S230可在步驟S220當(dāng)中進行。換句話說,在主控伺服端160對每個區(qū)域的主要節(jié)點進行輪詢并發(fā)出匯報請求,藉以取得各個區(qū)域的最高的溫度信息時,主控伺服端160還會同時判斷區(qū)域Zi中的主要節(jié)點是否無法連線。如果在步驟S220中并沒有發(fā)現(xiàn)主要節(jié)點無法連線的情形,則會持續(xù)不斷地執(zhí)行步驟S220,藉以維持每個服務(wù)器120的環(huán)境溫度。特別說明的是,本實施例的步驟S230中,主控伺服端160判斷是否可以與主要節(jié)點進行連線的步驟,將如下所述。當(dāng)主控伺服端160在輪詢動作中對區(qū)域Zi的主要節(jié)點發(fā)出匯報請求,但并未接收到主要節(jié)點回傳的最高溫度信息的次數(shù)超過一斷線預(yù)設(shè)值時,主控伺服端160便會將此主要節(jié)點判斷為無法連線。換句話說,若是主控伺服端160遇到主要節(jié)點并未收到回傳的最高溫度信息時(本實施例將此情況稱為回傳錯誤),主控伺服端160便會針對此區(qū)域從“O”計數(shù)為“1”,表示此區(qū)域發(fā)生回傳錯誤一次。由于主要節(jié)點可能因為正在忙碌而沒有回傳最高溫度信息至主控伺服端160而造成超時(timeout),因此在限定的次數(shù)內(nèi)發(fā)生回傳錯誤應(yīng)該可以容許。因此,如果上述的回傳錯誤次數(shù)累積到斷線預(yù)設(shè)值之前,例如,回傳錯誤次數(shù)累積一次與兩次的時候,主控伺服端160還是有接收到主要節(jié)點所回傳的最高溫度信息,表示此主要節(jié)點還是可以與主控伺服端160進行連線。然而,若是上述的回傳錯誤次數(shù)累積到斷線預(yù)設(shè)值的時候(例如,回傳錯誤次數(shù)累積三次),表示此主要節(jié)點的基板管理控制器可能因為網(wǎng)絡(luò)斷線、IP設(shè)定錯誤、服務(wù)器過載...等原因而失去聯(lián)系。因此,主控伺服端160便將區(qū)域Zi中的主要節(jié)點判斷為無法連線,而由步驟S230進入步驟S240。當(dāng)經(jīng)由步驟S230的判斷,得知主控伺服端160無法連線至所述主要節(jié)點時,便進入步驟S240,主控伺服端160在區(qū)域Zi中偵測可以與主控伺服端160進行連線的其它服務(wù)器,并在這些服務(wù)器中選擇其中之一作為一替代節(jié)點。然后,主控伺服端160將此替代節(jié)點調(diào)整為區(qū)域Zi的主要節(jié)點,以持續(xù)收集區(qū)域Zi中的溫度信息,并舍棄對就主要節(jié)點的輪詢。在此詳細說明步驟S240。于本實施例中,當(dāng)主控伺服端160無法連線至主要節(jié)點時,主控伺服端160將會讀取上述步驟S210的服務(wù)器地址映像表,并且依序?qū)勺鳛橹饕?jié)點的服務(wù)器120發(fā)送此測試請求。然后,主控伺服端160依據(jù)服務(wù)器地址映像表中區(qū)域Zi所列的服務(wù)器的順序,選擇在表中此區(qū)域Zi上第二個可以回傳上述測試回應(yīng)、并且可與主控伺服端160連線的服務(wù)器120,并將此服務(wù)器120設(shè)定為替代節(jié)點。接著,主控伺服端160修改服務(wù)器地址映像表中的主要節(jié)點欄位,將舊的主要節(jié)點欄位移除,并將替代節(jié)點所對應(yīng)的主要節(jié)點欄位進行標(biāo)記,以將此替代節(jié)點調(diào)整為區(qū)域Zi的主要節(jié)點。藉此,回到步驟S220,主控伺服端160便可依據(jù)服務(wù)器地址映像表中所記錄的主要節(jié)點來進行機柜系統(tǒng)100中各個服務(wù)器120的環(huán)境溫度收集、監(jiān)控與調(diào)整。綜上所述,本發(fā)明實施例所述的機柜系統(tǒng)100的主控伺服端160在每個區(qū)域的服務(wù)器中選定一主要節(jié)點,藉以利用階層式服務(wù)器結(jié)構(gòu)來收集與監(jiān)控此區(qū)域的最高溫度信息。并且,在主要節(jié)點無法與主控伺服端160進行連線時,利用階層式服務(wù)器的替代機制,也就是說,主控伺服端160在此區(qū)域中便選擇其它可與主控伺服端160連線的服務(wù)器作為替代節(jié)點,并將此替代節(jié)點調(diào)整為主要節(jié)點。藉此,便可在主要節(jié)點無法連線時,主控伺服端160通過替代節(jié)點來持續(xù)匯報此區(qū)域的溫度信息。雖然本發(fā)明已以實施例揭示如上,但其并非用以限定本發(fā)明,任何所屬
技術(shù)領(lǐng)域:
的技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作適當(dāng)?shù)母膭雍屯忍鎿Q,故本發(fā)明的保護范圍應(yīng)當(dāng)以本申請權(quán)利要求所界定的范圍為準(zhǔn)。權(quán)利要求1.一種機柜系統(tǒng),其特征在于,包括:多個服務(wù)器,配置于N個區(qū)域,N為正整數(shù);以及一主控伺服端,耦接至該些服務(wù)器,該主控伺服端選擇第i個區(qū)域的該些服務(wù)器其中之一作為第i個區(qū)域的一主要節(jié)點,該主要節(jié)點收集第i個區(qū)域中該些服務(wù)器的多個溫度信息,并傳遞一最高溫度信息至該主控伺服端,i為正整數(shù)且I<i<N,其中,當(dāng)該主控伺服端無法連線至該主要節(jié)點時,該主控伺服端在第i個區(qū)域中選擇與該主控伺服端連線的其它服務(wù)器其中之一作為一替代節(jié)點,并將該替代節(jié)點調(diào)整為第i個區(qū)域的該主要節(jié)點,以持續(xù)收集第i個區(qū)域中的該些溫度信息。2.根據(jù)權(quán)利要求1所述的機柜系統(tǒng),其中該主控伺服端通過一以太網(wǎng)絡(luò)與多個交換機以耦接至該些服務(wù)器。3.根據(jù)權(quán)利要求1所述的機柜系統(tǒng),還包括:N個散熱裝置,分別相對應(yīng)的配置于N個區(qū)域;以及一散熱控制器,耦接至該主控伺服端與該些散熱裝置,其中該主控伺服端依據(jù)N個區(qū)域各自的該最高溫度信息傳送一散熱控制請求至該散熱控制器,以調(diào)整對應(yīng)于N個區(qū)域的N個散熱裝置的散熱效率。4.根據(jù)權(quán)利要求1所述的機柜系統(tǒng),其中該主控伺服端讀取一服務(wù)器地址映像表以解析第i個區(qū)域所配置的該些服務(wù)器,依序發(fā)送一測試請求至第i個區(qū)域中的該些服務(wù)器,以尋找可作為該主要節(jié)點的該些服務(wù)器,并將可作為該主要節(jié)點的該些服務(wù)器記錄于該服務(wù)器地址映像表。5.根據(jù)權(quán)利要求4所述的機柜系統(tǒng),當(dāng)該主控伺服端無法連線至該主要節(jié)點時,該主控伺服端讀取該服務(wù)器地址映像表,依序?qū)勺鳛樵撝饕?jié)點的該些服務(wù)器發(fā)送該測試請求,并將回傳一測試回應(yīng)的該些服務(wù)器其中之一設(shè)定為該替代節(jié)點。6.—種機柜系統(tǒng)的監(jiān)控方法,該機柜系統(tǒng)包括配置于N個區(qū)域的多個服務(wù)器,N為正整數(shù),其特征在于,該監(jiān)控方法包括:解析并選擇第i個區(qū)域的該些服務(wù)器其中之一作為第i個區(qū)域的一主要節(jié)點;依序?qū)γ總€區(qū)域的該主要節(jié)點發(fā)出一匯報請求,使該主要節(jié)點收集第i個區(qū)域中該些服務(wù)器的多個溫度信息,并傳遞一最高溫度信息;以及當(dāng)無法連線至該主要節(jié)點時,在第i個區(qū)域中選擇連線的其它服務(wù)器其中之一作為一替代節(jié)點,并將該替代節(jié)點調(diào)整為第i個區(qū)域的該主要節(jié)點以持續(xù)收集第i個區(qū)域中的該些溫度信息。7.根據(jù)權(quán)利要求6所述的監(jiān)控方法,解析并選擇第i個區(qū)域的該些服務(wù)器其中之一作為第i個區(qū)域的該主要節(jié)點包括下列步驟:讀取一服務(wù)器地址映像表,以解析第i個區(qū)域所配置的該些服務(wù)器;以及依序發(fā)送一測試請求至第i個區(qū)域中的該些服務(wù)器,以尋找可作為該主要節(jié)點的該些服務(wù)器,并將可作為該主要節(jié)點的該些服務(wù)器記錄于該服務(wù)器地址映像表。8.根據(jù)權(quán)利要求6所述的監(jiān)控方法,解析并選擇第i個區(qū)域的該些服務(wù)器其中之一作為第i個區(qū)域的該主要節(jié)點還包括下列步驟:將回傳一測試回應(yīng)的該些服務(wù)器其中之一設(shè)定為該主要節(jié)點。9.根據(jù)權(quán)利要求7所述的監(jiān)控方法,在第i個區(qū)域中選擇連線的其它服務(wù)器其中之一作為該替代節(jié)點包括下列步驟:讀取該服務(wù)器地址映像表,并依序?qū)勺鳛樵撝饕?jié)點的該些服務(wù)器發(fā)送該測試請求;以及將回傳一測試回應(yīng)的該些服務(wù)器其中之一設(shè)定為該替代節(jié)點。10.根據(jù)權(quán)利要求6所述的監(jiān)控方法,判斷無法連線至該主要節(jié)點包括下列步驟:對該主要節(jié)點發(fā)出該匯報請求,但并未接收到該主要節(jié)點回傳該最高溫度信息的次數(shù)超過一斷線預(yù)設(shè)值時,將該主要節(jié)點判斷為無法連線。全文摘要本發(fā)明涉及一種機柜系統(tǒng)及機柜系統(tǒng)的監(jiān)控方法。機柜系統(tǒng)包括多個服務(wù)器與一主控伺服端。服務(wù)器配置于N個區(qū)域中。主控伺服端耦接至所述服務(wù)器,主控伺服端選擇第i個區(qū)域中多個服務(wù)器的其中之一作為第i個區(qū)域的主要節(jié)點。此主要節(jié)點收集第i個區(qū)域中這些服務(wù)器的溫度信息,以傳遞最高溫度信息至主控伺服端。當(dāng)主控伺服端無法連線至所述的主要節(jié)點時,主控伺服端在第i個區(qū)域中選擇與主控伺服端連線的其它服務(wù)器的其中之一作為替代節(jié)點,并且將此替代節(jié)點調(diào)整為第i個區(qū)域的主要節(jié)點,以持續(xù)收集第i個區(qū)域中的溫度信息。文檔編號G06F11/30GK103176516SQ20111043762公開日2013年6月26日申請日期2011年12月23日優(yōu)先權(quán)日2011年12月23日發(fā)明者邱國書,陳建州,李思賢,陳星邑申請人:英業(yè)達股份有限公司