国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種系統(tǒng)故障預(yù)警方法和系統(tǒng)的制作方法_2

      文檔序號(hào):9432440閱讀:來源:國知局
      障或存在故障可能從而提前對(duì)系統(tǒng)進(jìn)行預(yù)警,保證系統(tǒng)的正常穩(wěn)定運(yùn)行。因此獲取到該告警信息后,可以從告警信息中獲取故障節(jié)點(diǎn)設(shè)備的告警類型。本實(shí)施例所述的節(jié)點(diǎn)設(shè)備可以包括集群系統(tǒng)中的服務(wù)器等設(shè)備。
      [0031]步驟104,依據(jù)所述告警類型確定所述故障節(jié)點(diǎn)設(shè)備對(duì)應(yīng)的相關(guān)節(jié)點(diǎn)設(shè)備。
      [0032]系統(tǒng)中的具有相同屬性的節(jié)點(diǎn)設(shè)備存在共性,例如同一廠家生產(chǎn)的設(shè)備,又如類型相同的設(shè)備等,因此可以將具有相同屬性的節(jié)點(diǎn)設(shè)備作為相關(guān)節(jié)點(diǎn)設(shè)備,可以依據(jù)告警類型確定屬性,從而查找具有該屬性的其他節(jié)點(diǎn)設(shè)備作為故障節(jié)點(diǎn)設(shè)備對(duì)應(yīng)的相關(guān)節(jié)點(diǎn)設(shè)備。
      [0033]步驟106,對(duì)所述相關(guān)節(jié)點(diǎn)設(shè)備進(jìn)行檢測(cè),對(duì)檢測(cè)異常的相關(guān)節(jié)點(diǎn)設(shè)備進(jìn)行故障預(yù)塾目ο
      [0034]本實(shí)施例中主動(dòng)對(duì)相關(guān)節(jié)點(diǎn)設(shè)備進(jìn)行檢測(cè),以檢測(cè)相關(guān)節(jié)點(diǎn)設(shè)備是否存在同類隱患,從而提前預(yù)警。例如可以調(diào)用系統(tǒng)中的主動(dòng)檢測(cè)工具對(duì)相關(guān)節(jié)點(diǎn)設(shè)備進(jìn)行主動(dòng)檢測(cè),其中可以依據(jù)告警類型確定主動(dòng)檢測(cè)的項(xiàng)目,例如故障節(jié)點(diǎn)設(shè)備是CPU出現(xiàn)故障,則可以檢測(cè)其他設(shè)備的CPU利用率等CPU相關(guān)性能,通過主動(dòng)檢測(cè)確定相關(guān)節(jié)點(diǎn)設(shè)備是否出現(xiàn)異常,例如若CPU利用率過高,則認(rèn)為相關(guān)節(jié)點(diǎn)設(shè)備異常,可以在系統(tǒng)中進(jìn)行預(yù)警。使得系統(tǒng)盡早發(fā)現(xiàn)問題,防止問題堆積最終影響系統(tǒng)的正常運(yùn)行。
      [0035]綜上,通過獲取的故障節(jié)點(diǎn)設(shè)備的告警信息,從所述告警信息中獲取告警類型,然后依據(jù)告警類型確定所述故障節(jié)點(diǎn)設(shè)備對(duì)應(yīng)的相關(guān)節(jié)點(diǎn)設(shè)備,對(duì)所述相關(guān)節(jié)點(diǎn)設(shè)備進(jìn)行檢測(cè),能夠在一個(gè)節(jié)點(diǎn)設(shè)備出現(xiàn)故障時(shí)主動(dòng)對(duì)與其相關(guān)的其他節(jié)點(diǎn)設(shè)備進(jìn)行檢測(cè),從而對(duì)檢測(cè)異常的相關(guān)節(jié)點(diǎn)設(shè)備進(jìn)行故障預(yù)警,有效對(duì)系統(tǒng)內(nèi)設(shè)備進(jìn)行維護(hù)并預(yù)警,保證系統(tǒng)的正常、穩(wěn)定運(yùn)行。
      [0036]實(shí)施例二
      [0037]在上述實(shí)施例的基礎(chǔ)上,本實(shí)施例詳細(xì)論述基于故障節(jié)點(diǎn)設(shè)備對(duì)系統(tǒng)進(jìn)行預(yù)警的方法。
      [0038]參照?qǐng)D2,示出了本發(fā)明的另一種系統(tǒng)故障預(yù)警方法實(shí)施例的步驟流程圖。
      [0039]步驟202,將具有相同配置信息的節(jié)點(diǎn)設(shè)備標(biāo)注相同類型的標(biāo)簽。
      [0040]本實(shí)施例可以預(yù)先為系統(tǒng)中的節(jié)點(diǎn)設(shè)備標(biāo)注標(biāo)簽,以便后續(xù)確定相關(guān)節(jié)點(diǎn)設(shè)備,其中,標(biāo)簽的標(biāo)注方式包括靜態(tài)標(biāo)注和/或動(dòng)態(tài)標(biāo)注。
      [0041]靜態(tài)標(biāo)注即依據(jù)節(jié)點(diǎn)設(shè)備的靜態(tài)屬性標(biāo)注標(biāo)簽,即可以確定節(jié)點(diǎn)設(shè)備的配置信息,配置信息是節(jié)點(diǎn)設(shè)備的固有屬性,依據(jù)配置信息為節(jié)點(diǎn)設(shè)備設(shè)置標(biāo)簽,將具有相同配置信息的節(jié)點(diǎn)設(shè)備標(biāo)注相同類型的標(biāo),其中,所述配置信息包括節(jié)點(diǎn)設(shè)備的硬件配置信息和網(wǎng)絡(luò)架構(gòu)信息。
      [0042]其中,硬件配置信息包括:設(shè)備類型、性能參數(shù)、購買廠商、采購批次等,網(wǎng)絡(luò)架構(gòu)信息指的是集群中設(shè)備的的網(wǎng)絡(luò)拓?fù)湫畔?,如包括每臺(tái)節(jié)點(diǎn)設(shè)備如服務(wù)器連接到哪臺(tái)交換機(jī)、交換機(jī)之間的帶寬和連接、是否跨機(jī)房等。通過確定配置信息即可確定標(biāo)注的標(biāo)簽,如基于網(wǎng)絡(luò)架構(gòu)信息,處于同一個(gè)機(jī)架的服務(wù)器是相關(guān)的,即標(biāo)注相同標(biāo)簽;處于同一個(gè)交換機(jī)下的服務(wù)器是相關(guān)的,即標(biāo)注相同標(biāo)簽;處于同一個(gè)數(shù)據(jù)中心的服務(wù)器是相關(guān)的,即標(biāo)注相同標(biāo)簽。又如基于硬件配置信息,同一廠商同一批次的服務(wù)器是相關(guān)的,即標(biāo)注相同標(biāo)簽;具有相同容量和性能參數(shù)的服務(wù)器是相關(guān)的,即標(biāo)注相同標(biāo)簽。
      [0043]步驟204,收集第一時(shí)間閾值內(nèi)發(fā)生故障的節(jié)點(diǎn)設(shè)備的故障信息,依據(jù)所述故障信息統(tǒng)計(jì)分析所述發(fā)生故障的節(jié)點(diǎn)設(shè)備的關(guān)聯(lián)關(guān)系,將具有關(guān)聯(lián)關(guān)系的節(jié)點(diǎn)設(shè)備標(biāo)注相同類型的標(biāo)簽。
      [0044]標(biāo)簽還可以采用動(dòng)態(tài)標(biāo)注的方式,即通過統(tǒng)計(jì)的方法,收集第一時(shí)間閾值內(nèi)發(fā)生故障的節(jié)點(diǎn)設(shè)備的故障信息,故障信息包括節(jié)點(diǎn)設(shè)備的故障類型等信息,即記錄一段時(shí)間內(nèi)故障告警的服務(wù)器(一種節(jié)點(diǎn)設(shè)備)及故障類型,然后對(duì)故障信息進(jìn)行統(tǒng)計(jì)分析所述發(fā)生故障的節(jié)點(diǎn)設(shè)備的關(guān)聯(lián)關(guān)系,例如分析這些服務(wù)器是否經(jīng)常同時(shí)或先后發(fā)生故障,如果是確認(rèn)這些服務(wù)器具有關(guān)聯(lián)關(guān)系,將具有關(guān)聯(lián)關(guān)系的節(jié)點(diǎn)設(shè)備標(biāo)注相同類型的標(biāo)簽。
      [0045]本實(shí)施例中,每一個(gè)節(jié)點(diǎn)設(shè)備可以標(biāo)注一種或多種類型的標(biāo)簽,對(duì)節(jié)點(diǎn)設(shè)備標(biāo)注標(biāo)簽的方法也很多,本實(shí)施例對(duì)此不做限定。
      [0046]步驟206,獲取故障節(jié)點(diǎn)設(shè)備的告警信息,從所述告警信息中獲取所述故障節(jié)點(diǎn)設(shè)備的告警類型。
      [0047]在系統(tǒng)中任一節(jié)點(diǎn)設(shè)備發(fā)生故障后,故障的節(jié)點(diǎn)設(shè)備會(huì)自動(dòng)發(fā)出告警信息,其中該告警信息用于告知節(jié)點(diǎn)設(shè)備的故障以進(jìn)行系統(tǒng)預(yù)警,告警信息中包括:故障節(jié)點(diǎn)設(shè)備的告警類型,告警類型用于標(biāo)識(shí)節(jié)點(diǎn)設(shè)備的屬性信息,以便于后續(xù)確定同種屬性的其他節(jié)點(diǎn)設(shè)備是否也發(fā)生故障或存在故障可能從而提前對(duì)系統(tǒng)進(jìn)行預(yù)警,保證系統(tǒng)的正常穩(wěn)定運(yùn)行。因此獲取到該告警信息后,可以從告警信息中獲取故障節(jié)點(diǎn)設(shè)備的告警類型。如圖2,告警接收裝置接收系統(tǒng)故障節(jié)點(diǎn)設(shè)備的告警信息,并將告警信息存儲(chǔ)在告警信息庫中。因此,從告警信息庫中獲取故障節(jié)點(diǎn)設(shè)備的告警信息。
      [0048]步驟208,依據(jù)所述告警類型確定所述故障節(jié)點(diǎn)設(shè)備的至少一種標(biāo)簽。
      [0049]步驟210,針對(duì)每種標(biāo)簽,在系統(tǒng)中查找具有所述標(biāo)簽的節(jié)點(diǎn)設(shè)備,確定所述故障節(jié)點(diǎn)設(shè)備對(duì)應(yīng)的相關(guān)節(jié)點(diǎn)設(shè)備。
      [0050]本實(shí)施例預(yù)先對(duì)節(jié)點(diǎn)設(shè)備的標(biāo)簽進(jìn)行了標(biāo)注,此后在節(jié)點(diǎn)設(shè)備出現(xiàn)故障上傳告警信息后,可以依據(jù)告警類型獲取相應(yīng)的標(biāo)簽,例如,對(duì)于磁盤/網(wǎng)卡等硬件故障告警,可能與配置信息有關(guān),因此可以查找相關(guān)配置信息的標(biāo)簽,又如性能有關(guān)的告警,如RPC時(shí)間,可能與機(jī)架的相關(guān)節(jié)點(diǎn)有關(guān),因此可以查找網(wǎng)絡(luò)架構(gòu)相關(guān)的標(biāo)簽,又如應(yīng)用相關(guān)的告警,如GC次數(shù)等,可能與相同應(yīng)用的相關(guān)節(jié)點(diǎn)有關(guān),可以查找配置信息相關(guān)的標(biāo)簽,上述各種告警均可以查找動(dòng)態(tài)標(biāo)注的標(biāo)簽。
      [0051]針對(duì)每種標(biāo)簽,在集群系統(tǒng)中查找具有所述標(biāo)簽的節(jié)點(diǎn)設(shè)備,將與故障節(jié)點(diǎn)設(shè)備具有相同標(biāo)簽的節(jié)點(diǎn)設(shè)備作為相關(guān)節(jié)點(diǎn)設(shè)備。
      [0052]步驟212,在第二時(shí)間閾值內(nèi),檢測(cè)標(biāo)簽類型相同的故障節(jié)點(diǎn)設(shè)備的數(shù)量是否達(dá)到檢測(cè)閾值。
      [0053]為了防止頻繁的檢測(cè)影響集群系統(tǒng)的運(yùn)行,本實(shí)施例可以在第二時(shí)間閾值內(nèi)對(duì)各故障節(jié)點(diǎn)設(shè)備的標(biāo)簽進(jìn)行分類統(tǒng)計(jì),確定每種標(biāo)簽的數(shù)量即標(biāo)簽類型相同的故障節(jié)點(diǎn)設(shè)備的數(shù)量,然后檢測(cè)標(biāo)簽類型相同的故障節(jié)點(diǎn)設(shè)備的數(shù)量是否超過檢測(cè)閾值,若是,即標(biāo)簽類型相同的故障節(jié)點(diǎn)設(shè)備的數(shù)量達(dá)到檢測(cè)閾值,則執(zhí)行步驟214 ;若否,即標(biāo)簽類型相同的故障節(jié)點(diǎn)設(shè)備的數(shù)量為達(dá)到檢測(cè)閾值,則返回步驟212繼續(xù)收集檢測(cè)。
      [0054]其中,檢測(cè)閾值可以看作是執(zhí)行主動(dòng)檢測(cè)的門限,用于對(duì)主動(dòng)檢測(cè)進(jìn)行判斷,即確定當(dāng)前故障的節(jié)點(diǎn)設(shè)備是否足以引起對(duì)相關(guān)節(jié)點(diǎn)設(shè)備的主動(dòng)檢測(cè)。
      [0055]即在集群系統(tǒng)有告警發(fā)生時(shí),可以觸發(fā)一次主動(dòng)檢測(cè)決策判斷,即記錄故障節(jié)點(diǎn)設(shè)備的告警類型,確定相關(guān)節(jié)點(diǎn)設(shè)備。當(dāng)在一定時(shí)間內(nèi)(第二時(shí)間閾值內(nèi))發(fā)生同類告警的故障節(jié)電設(shè)備的數(shù)目超過閾值時(shí),則觸發(fā)對(duì)相關(guān)節(jié)點(diǎn)設(shè)備的主動(dòng)檢測(cè)。
      [0056]步驟214,針對(duì)每一個(gè)相關(guān)節(jié)點(diǎn)設(shè)備,分別獲取所述相關(guān)節(jié)點(diǎn)設(shè)備的每一種標(biāo)簽對(duì)應(yīng)的性能檢測(cè)項(xiàng)。
      [0057]步驟216,分別對(duì)所述性能檢測(cè)項(xiàng)進(jìn)行檢測(cè),確定所述性能檢測(cè)項(xiàng)的檢測(cè)值。
      [0058]為了防止集群系統(tǒng)由于大量設(shè)備故障而導(dǎo)致運(yùn)行出現(xiàn)問題,在檢測(cè)出故障節(jié)點(diǎn)設(shè)備的相關(guān)節(jié)點(diǎn)設(shè)備后,可以調(diào)用對(duì)應(yīng)的主動(dòng)檢測(cè)工具對(duì)相關(guān)節(jié)點(diǎn)設(shè)備進(jìn)行主動(dòng)探測(cè),以主動(dòng)檢測(cè)故障節(jié)點(diǎn)設(shè)備的相關(guān)節(jié)點(diǎn)設(shè)備是否出現(xiàn)異常,從而在其異常時(shí)提起進(jìn)行預(yù)警,確保集群系統(tǒng)的穩(wěn)定運(yùn)行。
      [0059]因此,針對(duì)每個(gè)相關(guān)節(jié)點(diǎn)設(shè)備,分別獲取所述相關(guān)節(jié)點(diǎn)設(shè)備的每一種標(biāo)簽對(duì)應(yīng)的性能檢測(cè)項(xiàng),從而根據(jù)故障節(jié)點(diǎn)設(shè)備的故障類型進(jìn)行檢測(cè),故障節(jié)點(diǎn)設(shè)備是網(wǎng)絡(luò)相關(guān)故障,檢測(cè)項(xiàng)可以包括網(wǎng)絡(luò)延時(shí)、帶寬等,則對(duì)相關(guān)節(jié)點(diǎn)的網(wǎng)絡(luò)延時(shí)、帶寬等進(jìn)行檢測(cè)。又如故障節(jié)點(diǎn)設(shè)備是硬件付賬
      當(dāng)前第2頁1 2 3 4 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1