国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng)的制作方法與工藝

      文檔序號(hào):11995568閱讀:354來源:國知局
      用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng)的制作方法與工藝
      本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及一種用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng)。

      背景技術(shù):
      在現(xiàn)有的服務(wù)器集群運(yùn)算系統(tǒng)中,對服務(wù)器狀況進(jìn)行監(jiān)控并報(bào)警的技術(shù)主要通過3個(gè)模塊來實(shí)現(xiàn),分別為監(jiān)控?cái)?shù)據(jù)采集模塊(reader)、監(jiān)控?cái)?shù)據(jù)處理模塊(processer)和發(fā)送報(bào)警模塊(alarm)。其中監(jiān)控?cái)?shù)據(jù)采集模塊負(fù)責(zé)采集各種需要的數(shù)據(jù),如采集cpu的空閑率等;監(jiān)控?cái)?shù)據(jù)處理模塊將采集的數(shù)據(jù)和預(yù)先設(shè)定規(guī)則進(jìn)行比較,符合規(guī)則就觸發(fā)發(fā)送報(bào)警模塊,發(fā)送報(bào)警模塊負(fù)責(zé)將報(bào)警信息以郵件或短信形式發(fā)給指定的人或組。通常在每臺(tái)服務(wù)器上都部署并運(yùn)行了上述3個(gè)模塊,以便監(jiān)控發(fā)現(xiàn)問題,進(jìn)而組成整個(gè)系統(tǒng)的監(jiān)控。常規(guī)的監(jiān)控技術(shù)在少量服務(wù)器時(shí)能夠解決監(jiān)控問題,但服務(wù)器變多時(shí)容易帶來報(bào)警泛濫的問題。例如,某天突然來了一個(gè)大任務(wù)或某個(gè)突發(fā)事件,所有服務(wù)器的cpu占用都高,然后每臺(tái)服務(wù)器都發(fā)出報(bào)警,報(bào)警數(shù)量就會(huì)很多。為了解決這個(gè)問題,現(xiàn)有技術(shù)提供了一種報(bào)警合并方案,具體為:僅在每臺(tái)服務(wù)器上部署監(jiān)控?cái)?shù)據(jù)采集模塊,另外單獨(dú)找一臺(tái)服務(wù)器部署監(jiān)控?cái)?shù)據(jù)處理模塊和發(fā)送報(bào)警模塊,并在監(jiān)控?cái)?shù)據(jù)處理模塊中加入預(yù)先配置的報(bào)警去重邏輯。例如,配置按某個(gè)關(guān)鍵字進(jìn)行去重的邏輯,在上面的例子中可以配置按“cpu占用高”這個(gè)關(guān)鍵字進(jìn)行去重的邏輯,這樣當(dāng)遇到上面這種情況時(shí),不再是每臺(tái)服務(wù)器都報(bào)警,而是將報(bào)警集中到部署監(jiān)控?cái)?shù)據(jù)處理模塊和發(fā)送報(bào)警模塊的服務(wù)器中,經(jīng)過報(bào)警合并處理后再報(bào)警。經(jīng)過實(shí)際操作驗(yàn)證,這樣報(bào)警數(shù)量能減少到原來的20%左右?,F(xiàn)有技術(shù)提供的報(bào)警合并方案能解決一定數(shù)量的報(bào)警泛濫問題,但也存在如下問題:由于服務(wù)器所面臨的問題多種多樣,部署監(jiān)控?cái)?shù)據(jù)采集模塊的服務(wù)器所上報(bào)的數(shù)據(jù)類型也是多種多樣,但是在監(jiān)控?cái)?shù)據(jù)處理模塊中配置的報(bào)警去重邏輯比較單一,在對數(shù)據(jù)進(jìn)行去重處理時(shí)具有一定的局限性。如果根據(jù)需求對報(bào)警去重邏輯進(jìn)行添加、刪除和修改,則需要重新修改編譯整個(gè)監(jiān)控?cái)?shù)據(jù)處理模塊,技術(shù)改造成本較高,系統(tǒng)靈活性很差。

      技術(shù)實(shí)現(xiàn)要素:
      鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng),用以提高系統(tǒng)的靈活性。根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng),包括:分別部署在多個(gè)第一服務(wù)器中的多個(gè)監(jiān)控?cái)?shù)據(jù)采集模塊;以及,部署在第二服務(wù)器中的監(jiān)控?cái)?shù)據(jù)處理模塊、一個(gè)以上去重模塊和發(fā)送報(bào)警模塊,每個(gè)去重模塊中預(yù)先配置有至少一種報(bào)警去重邏輯;所述一個(gè)以上去重模塊與所述監(jiān)控?cái)?shù)據(jù)處理模塊連接,用于向監(jiān)控?cái)?shù)據(jù)處理模塊提供所述報(bào)警去重邏輯;所述監(jiān)控?cái)?shù)據(jù)處理模塊與所述多個(gè)監(jiān)控?cái)?shù)據(jù)采集模塊連接,用于將所述監(jiān)控?cái)?shù)據(jù)采集模塊采集的數(shù)據(jù)與預(yù)先設(shè)定的規(guī)則進(jìn)行比較,根據(jù)符合規(guī)則的數(shù)據(jù)得到報(bào)警信息,然后根據(jù)所述報(bào)警去重邏輯處理對所述報(bào)警信息進(jìn)行去重處理后發(fā)送給所述發(fā)送報(bào)警模塊;所述發(fā)送報(bào)警模塊與所述監(jiān)控?cái)?shù)據(jù)處理模塊連接,用于根據(jù)所述監(jiān)控?cái)?shù)據(jù)處理模塊的發(fā)送的報(bào)警信息發(fā)送報(bào)警信號(hào)。根據(jù)本發(fā)明提供的監(jiān)控系統(tǒng),將報(bào)警去重邏輯配置在與監(jiān)控?cái)?shù)據(jù)處理模塊獨(dú)立設(shè)計(jì)的去重模塊中,并且本系統(tǒng)支持多個(gè)去重模塊,根據(jù)需求,不同的去重模塊可以應(yīng)用于不同的數(shù)據(jù)源。如果根據(jù)需求要添加、刪除和修改新的報(bào)警去重邏輯,只要對應(yīng)地添加、刪除和修改新的去重模塊,無需修改編譯整個(gè)監(jiān)控?cái)?shù)據(jù)處理模塊,降低了技術(shù)改造成本,提高了系統(tǒng)的靈活性。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。附圖說明通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng)的結(jié)構(gòu)框圖;圖2示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng)的結(jié)構(gòu)框圖。具體實(shí)施方式下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng)的結(jié)構(gòu)框圖。本實(shí)施例中,該系統(tǒng)用于對多個(gè)第一服務(wù)器的狀況進(jìn)行監(jiān)控。如圖1所示,該系統(tǒng)包括多個(gè)監(jiān)控?cái)?shù)據(jù)采集模塊、一個(gè)監(jiān)控?cái)?shù)據(jù)處理模塊、一個(gè)以上去重模塊和一個(gè)發(fā)送報(bào)警模塊。圖1具體示出了3個(gè)監(jiān)控?cái)?shù)據(jù)采集模塊和3個(gè)去重模塊,但本發(fā)明不僅限于此。其中多個(gè)監(jiān)控?cái)?shù)據(jù)采集模塊分別部署在多個(gè)第一服務(wù)器中,用于采集各自第一服務(wù)器中的與運(yùn)行狀況有關(guān)的數(shù)據(jù)。其中與運(yùn)行狀況有關(guān)的數(shù)據(jù)包括以下數(shù)據(jù)的一項(xiàng)或多項(xiàng):第一服務(wù)器的cpu的空閑率、內(nèi)存占用率、硬盤IO使用率、網(wǎng)卡進(jìn)出流量使用率、日志數(shù)據(jù)、以及與其它第一服務(wù)器的連通情況。第一服務(wù)器的cpu的空閑率、內(nèi)存占用率、硬盤IO使用率、網(wǎng)卡進(jìn)出流量使用率、日志數(shù)據(jù)反應(yīng)了第一服務(wù)器的各種運(yùn)行狀態(tài),監(jiān)控?cái)?shù)據(jù)采集模塊實(shí)時(shí)采集其所在的第一服務(wù)器的這些運(yùn)行狀態(tài),并將該數(shù)據(jù)上報(bào)給監(jiān)控?cái)?shù)據(jù)處理模塊。監(jiān)控?cái)?shù)據(jù)采集模塊還可以實(shí)時(shí)檢測與其它第一服務(wù)器是否能夠連通,如果不能連通,則將與哪個(gè)第一服務(wù)器不能連通的情況上報(bào)給監(jiān)控?cái)?shù)據(jù)處理模塊。例如,對于具有3個(gè)第一服務(wù)器A、B和C的系統(tǒng),如果A不能與B和C連通,那么A中的監(jiān)控?cái)?shù)據(jù)采集模塊會(huì)將“Bdead”和“Cdead”的數(shù)據(jù)上報(bào)給監(jiān)控?cái)?shù)據(jù)處理模塊,同時(shí)B中的監(jiān)控?cái)?shù)據(jù)采集模塊會(huì)將“Adead”的數(shù)據(jù)上報(bào)給監(jiān)控?cái)?shù)據(jù)處理模塊,C中的監(jiān)控?cái)?shù)據(jù)采集模塊也會(huì)將“Adead”的數(shù)據(jù)上報(bào)給監(jiān)控?cái)?shù)據(jù)處理模塊。上述一個(gè)監(jiān)控?cái)?shù)據(jù)處理模塊、一個(gè)以上去重模塊和一個(gè)發(fā)送報(bào)警模塊部署在第二服務(wù)器中,一個(gè)以上去重模塊與監(jiān)控?cái)?shù)據(jù)處理模塊連接,用于向監(jiān)控?cái)?shù)據(jù)處理模塊提供報(bào)警去重邏輯;監(jiān)控?cái)?shù)據(jù)處理模塊與多個(gè)監(jiān)控?cái)?shù)據(jù)采集模塊連接,用于將監(jiān)控?cái)?shù)據(jù)采集模塊采集的數(shù)據(jù)與預(yù)先設(shè)定的規(guī)則進(jìn)行比較,根據(jù)符合規(guī)則的數(shù)據(jù)得到報(bào)警信息,然后根據(jù)報(bào)警去重邏輯對報(bào)警信息進(jìn)行去重處理后發(fā)送給發(fā)送報(bào)警模塊;發(fā)送報(bào)警模塊與監(jiān)控?cái)?shù)據(jù)處理模塊連接,用于根據(jù)監(jiān)控?cái)?shù)據(jù)處理模塊發(fā)送的報(bào)警信息匯總發(fā)送報(bào)警信號(hào),發(fā)送報(bào)警信號(hào)時(shí),會(huì)判斷是否發(fā)送成功,如果不成功會(huì)等待一段時(shí)間重試,直到成功。同時(shí)會(huì)從另外的渠道發(fā)送提醒信息給系統(tǒng)維護(hù)者,提醒發(fā)送有問題,需要解決。如果發(fā)送成功后,這些報(bào)警信息便會(huì)被系統(tǒng)丟棄,不再保存。監(jiān)控?cái)?shù)據(jù)處理中預(yù)先設(shè)定的規(guī)則可以根據(jù)不同類型的數(shù)據(jù)源設(shè)定不同的規(guī)則。例如,對于第一服務(wù)器的cpu的空閑率,其對應(yīng)的預(yù)先設(shè)定的規(guī)則就是cpu的空閑率低于預(yù)設(shè)閾值(其它內(nèi)存、硬盤IO、網(wǎng)卡的相關(guān)數(shù)據(jù)等也是如此)。如果監(jiān)控?cái)?shù)據(jù)采集模塊上報(bào)的第一服務(wù)器的cpu的空閑率低于該預(yù)設(shè)閾值,則表明該數(shù)據(jù)為符合規(guī)則的數(shù)據(jù),監(jiān)控?cái)?shù)據(jù)處理模塊根據(jù)該數(shù)據(jù)得到“cpu占用高”的報(bào)警信息。對于與其它第一服務(wù)器的連通情況的數(shù)據(jù),其對應(yīng)的預(yù)設(shè)設(shè)定的規(guī)則就是包含“dead”信息。如果監(jiān)控?cái)?shù)據(jù)采集模塊上報(bào)的與其它第一服務(wù)器的連通情況的數(shù)據(jù)包含“dead”信息,則表明該數(shù)據(jù)為符合規(guī)則的數(shù)據(jù),監(jiān)控?cái)?shù)據(jù)處理模塊根據(jù)該數(shù)據(jù)得到“××dead”的報(bào)警信息。本發(fā)明所提供的上述實(shí)施例與現(xiàn)有技術(shù)不同的是,將原本應(yīng)在監(jiān)控?cái)?shù)據(jù)處理模塊中配置的報(bào)警去重邏輯獨(dú)立出來,將其模塊化為去重模塊,也即將報(bào)警去重邏輯配置在與監(jiān)控?cái)?shù)據(jù)處理模塊獨(dú)立的去重模塊中。具體地,將報(bào)警去重邏輯的代碼從原有的實(shí)現(xiàn)監(jiān)控?cái)?shù)據(jù)處理模塊的代碼中剝離出來,獨(dú)立成單個(gè)類或文件,單獨(dú)編譯形成可執(zhí)行文件。并且,可選地,該系統(tǒng)支持多個(gè)去重模塊存在,根據(jù)需求,將不同種類的報(bào)警去重邏輯配置在不同的去重模塊中,每個(gè)去重模塊中僅配置一種報(bào)警去重邏輯。例如,針對上述第一服務(wù)器的cpu的空閑率、內(nèi)存占用率、硬盤IO使用率、網(wǎng)卡進(jìn)出流量使用率、日志數(shù)據(jù)等數(shù)據(jù),分別在兩個(gè)去重模塊中配置針對這些數(shù)據(jù)源的報(bào)警去重邏輯。在兩個(gè)去重模塊中配置的報(bào)警去重邏輯分別為根據(jù)預(yù)定時(shí)間進(jìn)行去重處理的邏輯,以及根據(jù)預(yù)定數(shù)量進(jìn)行去重處理的邏輯。以cpu的空閑率為例,如果按照“cpu占用高”的關(guān)鍵字進(jìn)行去重,它可以使用上述兩種邏輯中的任一種進(jìn)行去重,如對預(yù)定時(shí)間內(nèi)(如1分鐘)內(nèi)包含“cpu占用高”關(guān)鍵字的報(bào)警信息進(jìn)行去重處理,或,對預(yù)定數(shù)量(如100條)的包含“cpu占用高”關(guān)鍵字的報(bào)警信息進(jìn)行去重處理。其它內(nèi)存、硬盤IO、網(wǎng)卡的相關(guān)數(shù)據(jù)等也與此類似,針對這些類型的數(shù)據(jù)可以分別使用上述兩種邏輯中的任一種。如果按照現(xiàn)有技術(shù),針對其它第一服務(wù)器的連通情況也使用上述邏輯進(jìn)行處理,那么針對上述具有3個(gè)第一服務(wù)器A、B和C的系統(tǒng)的例子,如果按照“dead”關(guān)鍵字進(jìn)行去重,監(jiān)控?cái)?shù)據(jù)處理模塊會(huì)將A發(fā)送的“Bdead”和“Cdead”、B發(fā)送的“Adead”以及C發(fā)送的“Adead”一共4條信息合并處理為1條信息,這樣當(dāng)管理者看到該報(bào)警信息時(shí),不知道哪臺(tái)服務(wù)器出現(xiàn)故障??紤]到這樣的問題,本發(fā)明實(shí)施例在另外一個(gè)去重模塊中配置針對與其它第一服務(wù)器的連通情況的報(bào)警去重邏輯,該報(bào)警去重邏輯為:在上述邏輯的基礎(chǔ)上加以智能分析邏輯,該智能分析邏輯為根據(jù)各個(gè)第一服務(wù)器上報(bào)的包含“dead”的信息的條數(shù)分析出現(xiàn)故障的第一服務(wù)器是哪個(gè)。在上述示例中,通過智能分析邏輯獲知第一服務(wù)器A上報(bào)了2條包含“dead”的信息,第一服務(wù)器B和C各上報(bào)了1條包含“dead”的信息,由此分析得到出現(xiàn)故障的是第一服務(wù)器A,因此監(jiān)控?cái)?shù)據(jù)處理模塊可以將“Adead”的報(bào)警信息發(fā)送給發(fā)送報(bào)警模塊,發(fā)送報(bào)警模塊根據(jù)該報(bào)警信息發(fā)送報(bào)警信號(hào)之后,管理者可以清楚地獲知第一服務(wù)器A出現(xiàn)不能連通的故障。上述說明僅為本發(fā)明的一個(gè)具體事例,本發(fā)明不僅限于此,根據(jù)實(shí)際需求,對于不同類型的數(shù)據(jù)源可以配置完全不同的報(bào)警去重邏輯。監(jiān)控?cái)?shù)據(jù)處理模塊根據(jù)不同種的報(bào)警去重邏輯對根據(jù)符合規(guī)則的不同類型的數(shù)據(jù)得到的報(bào)警信息進(jìn)行去重處理。根據(jù)本實(shí)施例提供的監(jiān)控系統(tǒng),將報(bào)警去重邏輯配置在與監(jiān)控?cái)?shù)據(jù)處理模塊獨(dú)立設(shè)計(jì)的去重模塊中,并且本系統(tǒng)支持多個(gè)去重模塊,根據(jù)需求,不同的去重模塊可以應(yīng)用于不同的數(shù)據(jù)源。如果根據(jù)需求要添加、刪除和修改新的報(bào)警去重邏輯,只要對應(yīng)地添加、刪除和修改新的去重模塊,無需修改編譯整個(gè)監(jiān)控?cái)?shù)據(jù)處理模塊,降低了技術(shù)改造成本,提高了系統(tǒng)的靈活性。舉例來說,當(dāng)系統(tǒng)中僅有關(guān)鍵字去重這一種報(bào)警去重邏輯時(shí),在系統(tǒng)運(yùn)行過程中針對其它第一服務(wù)器的連通情況也會(huì)使用關(guān)鍵字去重進(jìn)行處理,這樣會(huì)出現(xiàn)管理者不知道哪臺(tái)服務(wù)器出現(xiàn)不能連通的故障的問題。在本實(shí)施例提供的系統(tǒng)中,針對這種情況可以再配置一種專門用于處理與其它第一服務(wù)器的連通情況這一數(shù)據(jù)源的報(bào)警去重邏輯,即在系統(tǒng)中添加預(yù)先配置有相應(yīng)報(bào)警去重邏輯的去重模塊。對于較為復(fù)雜的情況,去重模塊提供的報(bào)警去重邏輯不僅可以用于去重處理,還可以用于智能分析,提煉出真正有問題的源頭,便于盡快解決問題。圖2示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng)的結(jié)構(gòu)框圖。本實(shí)施例與上述實(shí)施例的不同之處在于,第二服務(wù)器有多個(gè),每個(gè)第二服務(wù)器中都部署有一個(gè)監(jiān)控?cái)?shù)據(jù)處理模塊、一個(gè)以上去重處理模塊和一個(gè)發(fā)送報(bào)警模塊。在圖2所示的監(jiān)控系統(tǒng)中,共有4個(gè)第二服務(wù)器,每個(gè)第二服務(wù)器中部署了1個(gè)去重模塊,但本發(fā)明不僅限于此。本實(shí)施例將監(jiān)控?cái)?shù)據(jù)處理模塊和發(fā)送報(bào)警模塊進(jìn)行了分布式化改造,將其遷移到分布式的流式計(jì)算平臺(tái)上運(yùn)行。下面以分布式的流式計(jì)算平臺(tái)為storm平臺(tái)為例進(jìn)行說明。需要注意的是,本發(fā)明不僅限于該storm平臺(tái)。storm平臺(tái)是twitter一個(gè)開源的分布式實(shí)時(shí)計(jì)算系統(tǒng),一個(gè)模塊在該平臺(tái)上以一個(gè)任務(wù)的形式運(yùn)行。經(jīng)過分布式化改造后,監(jiān)控?cái)?shù)據(jù)處理模塊和發(fā)送報(bào)警模塊就是以任務(wù)的形式運(yùn)行。在圖2所示的例子中,一個(gè)storm平臺(tái)上有4個(gè)第二服務(wù)器a、b、c和d,其中每個(gè)第二服務(wù)器中都部署有1個(gè)監(jiān)控?cái)?shù)據(jù)處理模塊、1個(gè)去重處理模塊和1個(gè)發(fā)送報(bào)警模塊。這4個(gè)第二服務(wù)器對外提供(如向多個(gè)第一服務(wù)器提供)一個(gè)虛域名和一個(gè)虛IP,該虛域名和虛IP與這4個(gè)第二服務(wù)器中的任一個(gè)具有綁定關(guān)系,上游的監(jiān)控?cái)?shù)據(jù)采集模塊在采集到各自第一服務(wù)器中的與運(yùn)行狀況有關(guān)的數(shù)據(jù)(具體過程與上述實(shí)施例所描述的相同,在此不再贅述)后,向該虛域名和虛IP發(fā)送數(shù)據(jù)。例如,虛域名和虛IP與第二服務(wù)器a具有綁定關(guān)系,那么第二服務(wù)器a就負(fù)責(zé)接收上游的監(jiān)控?cái)?shù)據(jù)采集模塊發(fā)送過來的數(shù)據(jù)。storm平臺(tái)可以對部署在多個(gè)第二服務(wù)器上的監(jiān)控?cái)?shù)據(jù)處理模塊和發(fā)送報(bào)警模塊進(jìn)行任務(wù)調(diào)度。具體地,如果監(jiān)控?cái)?shù)據(jù)采集模塊所發(fā)送的數(shù)據(jù)需要由第二服務(wù)器b上的模塊進(jìn)行處理,比如由監(jiān)控?cái)?shù)據(jù)采集模塊所發(fā)送的數(shù)據(jù)的類型確定該類型所對應(yīng)的報(bào)警去重邏輯配置在第二服務(wù)器b的某個(gè)去重模塊中,那么storm平臺(tái)負(fù)責(zé)將第二服務(wù)器a接收的數(shù)據(jù)傳給第二服務(wù)器b。第二服務(wù)器b中的監(jiān)控?cái)?shù)據(jù)處理模塊將數(shù)據(jù)與預(yù)先設(shè)定的規(guī)則進(jìn)行比較,根據(jù)符合規(guī)則的數(shù)據(jù)得到報(bào)警信息,然后根據(jù)對應(yīng)的報(bào)警去重邏輯對報(bào)警信息進(jìn)行去重處理后發(fā)送給第二服務(wù)器b中的發(fā)送報(bào)警模塊;該發(fā)送報(bào)警模塊用于根據(jù)接收到的報(bào)警信息發(fā)送報(bào)警信號(hào)。有關(guān)監(jiān)控?cái)?shù)據(jù)處理模塊和發(fā)送報(bào)警模塊的處理過程的描述可以參見上述實(shí)施例,在此不再贅述。在本實(shí)施例提供的系統(tǒng)中,如果多個(gè)第二服務(wù)器中的任一個(gè)宕機(jī),通過storm平臺(tái)的合理調(diào)度都能使得整個(gè)系統(tǒng)正常運(yùn)行。舉例來說,如果與虛域名和虛IP具有綁定關(guān)系的第二服務(wù)器a宕機(jī),可以通過手動(dòng)切換或自動(dòng)切換,將虛域名和虛IP切換到第二服務(wù)器b(也可以切換到第二服務(wù)器c或d),由第二服務(wù)器b負(fù)責(zé)接收上游的監(jiān)控?cái)?shù)據(jù)采集模塊發(fā)送的數(shù)據(jù)。如果與虛域名和虛IP不具有綁定關(guān)系的第二服務(wù)器b宕機(jī),在storm平臺(tái)負(fù)責(zé)將第二服務(wù)器a接收的數(shù)據(jù)傳給第二服務(wù)器b后,檢測到第二服務(wù)器b處理數(shù)據(jù)失敗,那么storm平臺(tái)將自動(dòng)將任務(wù)調(diào)度給第二服務(wù)器c或d,或者重新調(diào)度給第二服務(wù)器a,將數(shù)據(jù)接著傳給第二服務(wù)器c或d或a,由第二服務(wù)器c或d或a中的監(jiān)控?cái)?shù)據(jù)處理模塊對數(shù)據(jù)進(jìn)行處理。由此保證了整個(gè)監(jiān)控系統(tǒng)的正常運(yùn)行。在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。本領(lǐng)域那些技術(shù)人員可以理解,可以對實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中。可以把實(shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng)中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。應(yīng)該注意的是上述實(shí)施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。本發(fā)明還公開了A1、一種用于服務(wù)器集群運(yùn)算中對服務(wù)器狀況報(bào)警的監(jiān)控系統(tǒng),包括:分別部署在多個(gè)第一服務(wù)器中的多個(gè)監(jiān)控?cái)?shù)據(jù)采集模塊;以及,部署在第二服務(wù)器中的監(jiān)控?cái)?shù)據(jù)處理模塊、一個(gè)以上去重模塊和發(fā)送報(bào)警模塊,每個(gè)去重模塊中預(yù)先配置有至少一種報(bào)警去重邏輯;所述一個(gè)以上去重模塊與所述監(jiān)控?cái)?shù)據(jù)處理模塊連接,用于向監(jiān)控?cái)?shù)據(jù)處理模塊提供所述報(bào)警去重邏輯;所述監(jiān)控?cái)?shù)據(jù)處理模塊與所述多個(gè)監(jiān)控?cái)?shù)據(jù)采集模塊連接,用于將所述監(jiān)控?cái)?shù)據(jù)采集模塊采集的數(shù)據(jù)與預(yù)先設(shè)定的規(guī)則進(jìn)行比較,根據(jù)符合規(guī)則的數(shù)據(jù)得到報(bào)警信息,然后根據(jù)所述報(bào)警去重邏輯處理對所述報(bào)警信息進(jìn)行去重處理后發(fā)送給所述發(fā)送報(bào)警模塊;所述發(fā)送報(bào)警模塊與所述監(jiān)控?cái)?shù)據(jù)處理模塊連接,用于根據(jù)所述監(jiān)控?cái)?shù)據(jù)處理模塊的發(fā)送的報(bào)警信息發(fā)送報(bào)警信號(hào)。A2、根據(jù)A1所述的系統(tǒng),每個(gè)去重模塊中預(yù)先配置有一種報(bào)警去重邏輯,不同種的報(bào)警去重邏輯配置在不同的去重模塊中。A3、根據(jù)A1或A2所述的系統(tǒng),所述監(jiān)控?cái)?shù)據(jù)處理模塊根據(jù)不同種的報(bào)警去重邏輯對根據(jù)符合規(guī)則的不同類型的數(shù)據(jù)得到的報(bào)警信息進(jìn)行去重處理。A4、根據(jù)A1所述的系統(tǒng),所述部署在第一服務(wù)器中的監(jiān)控?cái)?shù)據(jù)采集模塊所采集的數(shù)據(jù)包括以下數(shù)據(jù)的一項(xiàng)或多項(xiàng):第一服務(wù)器的cpu的空閑率、內(nèi)存占用率、硬盤IO使用率、網(wǎng)卡進(jìn)出流量使用率、日志數(shù)據(jù)、以及與其它第一服務(wù)器的連通情況。A5、根據(jù)A1所述的系統(tǒng),所述發(fā)送報(bào)警模塊還用于在發(fā)送報(bào)警信號(hào)成功之后丟棄報(bào)警信息;或者,在發(fā)送報(bào)警信號(hào)失敗之后重新發(fā)送并向系統(tǒng)維護(hù)者發(fā)送提醒信息。A6、根據(jù)A1所述的系統(tǒng),所述報(bào)警去重邏輯包括:根據(jù)預(yù)定時(shí)間進(jìn)行去重處理的邏輯;或,根據(jù)預(yù)定數(shù)量進(jìn)行去重處理的邏輯。A7、根據(jù)A6所述的系統(tǒng),所述報(bào)警去重邏輯還包括:智能分析邏輯。A8、根據(jù)A1-A7任一項(xiàng)所述的系統(tǒng),所述第二服務(wù)器有多個(gè),每個(gè)第二服務(wù)器中都部署有監(jiān)控?cái)?shù)據(jù)處理模塊、一個(gè)以上去重模塊和發(fā)送報(bào)警模塊。A9、根據(jù)A8所述的系統(tǒng),多個(gè)第二服務(wù)器運(yùn)行在分布式的流式計(jì)算平臺(tái)上。A10、根據(jù)A9所述的系統(tǒng),所述分布式的流式計(jì)算平臺(tái)向多個(gè)第一服務(wù)器提供虛域名和虛IP,所述虛域名和虛IP與多個(gè)第二服務(wù)器中的任一個(gè)具有綁定關(guān)系。A11、根據(jù)A10所述的系統(tǒng),所述分布式的流式計(jì)算平臺(tái)能夠切換虛域名和虛IP與多個(gè)第二服務(wù)器中的任一個(gè)的綁定關(guān)系。A12、根據(jù)A9所述的系統(tǒng),所述分布式的流式計(jì)算平臺(tái)為storm平臺(tái)。
      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
      1