国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      管理系統(tǒng)和管理方法

      文檔序號:7620675閱讀:234來源:國知局
      專利名稱:管理系統(tǒng)和管理方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及管理系統(tǒng)和裝置的管理系統(tǒng)和管理方法,特別涉及適合確定在系統(tǒng)和裝置中所發(fā)生的故障的原因的管理系統(tǒng)和管理方法。
      背景技術(shù)
      近幾年,隨著移動電話終端等裝置和系統(tǒng)的高功能化,軟件和硬件的構(gòu)成單元不斷增加,裝置和系統(tǒng)日趨復(fù)雜化。一般,在高度化和復(fù)雜化的裝置和系統(tǒng)中,根絕缺陷和脆弱性是困難的,故障發(fā)生不可避免。而且,隨著構(gòu)成單元的增加,單元間的相互依存的數(shù)量以平方形式增加,所以在故障發(fā)生時愈發(fā)難以確定其根本原因。
      另一方面,例如,移動電話終端和網(wǎng)絡(luò)等,作為進(jìn)行緊急通報等通信的基礎(chǔ)設(shè)施,要求具有較高的可靠性。因此,即使由于利用脆弱性的攻擊和軟件的缺陷,在攜帶電話終端和網(wǎng)絡(luò)等中發(fā)生故障的情況,也要求迅速除去該原因,復(fù)原其功能。因而,要求高效確定故障原因的功能。
      目前,作為容易確定故障原因的裝置,具有網(wǎng)絡(luò)管理裝置(特開2001-125854號公報,以下稱「文獻(xiàn)1」),該裝置在某個構(gòu)成單元的故障會影響到其他構(gòu)成單元,故障傳播的網(wǎng)絡(luò)中,在某個構(gòu)成單元中發(fā)生了故障時,通過對在依存于該構(gòu)成單元的構(gòu)成單元中發(fā)生的故障設(shè)定抑制標(biāo)志,能夠抑制由同一故障引起的冗長警告的發(fā)生,容易跟蹤根本原因。
      此外,提出了一種方案(特開平11-308221號公報,以下稱「文獻(xiàn)2」),該方案根據(jù)故障事件間的傳播模型和網(wǎng)絡(luò)結(jié)構(gòu)信息,推論輸入的多個故障事件的原因。在該技術(shù)中提出了一種原因推斷方法,該方法以認(rèn)為各個故障原因是在傳播模型上引起的故障事件的個數(shù)上限值予先已知為前提,對每個故障原因賦予指針,存儲器使用量少。而且,還公開了一種反饋單元,該單元根據(jù)故障事件的歷史計算故障事件間的相互相關(guān)值,檢測存在記述遺漏的故障傳播規(guī)則,更新傳播模型。
      而且,還提出了一種根據(jù)在計算機(jī)的操作系統(tǒng)(基本軟件)上發(fā)生的事件的記錄,構(gòu)筑操作系統(tǒng)所管理的對象間的依存模型的方法(S.King,P.Chen,“Backtracking Intrusions”,ACM SOSP 2003,以下稱「文獻(xiàn)3」)。在該技術(shù)中,通過在故障事件發(fā)生后分析事件記錄,生成并顯示以故障事件為基點(diǎn)的依存模型,支援原因分析。
      但是,文獻(xiàn)1公開的網(wǎng)絡(luò)管理裝置從多個構(gòu)成單元引起的故障事件中確定成為根本原因的故障事件,能成為原因的故障事件以事先被選擇為前提。即,該網(wǎng)絡(luò)管理裝置能跟蹤的原因限于事先能識別的故障事件。因此,在成為根本原因的事件事先不能識別時,就不能跟蹤該事件。然而,成為故障根本原因的事件各式各樣,難以在故障事件發(fā)生時判定是否成為原因。
      此外,文獻(xiàn)2公開的系統(tǒng)所必須的前提為故障事件的個數(shù)上限值是預(yù)先已知的。該前提僅在事先構(gòu)筑了妥當(dāng)?shù)膫鞑ツP蜁r成立。因此,即使是像簡單網(wǎng)絡(luò)那樣系統(tǒng)結(jié)構(gòu)管理者已知,在能預(yù)測故障原因和由其引起的故障事件的情況下可以適用,但在復(fù)雜網(wǎng)絡(luò)和用戶能夠自由擴(kuò)充軟件及硬件的構(gòu)成單元的裝置中不能適用。此外,使用該技術(shù)雖然能檢測存在記述遺漏的故障傳播規(guī)則,更新傳播模型,但到底還是補(bǔ)足記述遺漏的程度,無法由故障傳播規(guī)則完全不存在的狀態(tài)構(gòu)筑高精度的傳播模型。
      而且,在文獻(xiàn)3中公開的方法根據(jù)操作系統(tǒng)所記錄的事件記錄構(gòu)筑對象間的依存模型,所以不需要與故障原因有關(guān)的事先知識。但是,由于必須存儲動作中全部的事件記錄,所需要的存儲容量隨著執(zhí)行增加。
      即,在所有的現(xiàn)有技術(shù)中,存在前提條件和存儲容量等制約,在不滿足前提條件和存儲容量不充分的情況下,無法適當(dāng)?shù)卮_定故障原因。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于提供一種在各式各樣裝置和系統(tǒng)中能確定故障原因的管理系統(tǒng)以及管理方法。
      涉及本發(fā)明一實(shí)施例的管理系統(tǒng)具有檢測發(fā)生的事件的事件監(jiān)視部;提取與事件有關(guān)的依存關(guān)系的依存關(guān)系提取部;保存事件和依存關(guān)系的保存部;根據(jù)更新規(guī)則更新由保存部保存的事件和依存關(guān)系的更新部;參照保存部,根據(jù)事件和依存關(guān)系確定發(fā)生的故障的原因的原因確定部。
      根據(jù)這樣的管理系統(tǒng),在檢測裝置和系統(tǒng)中發(fā)生的事件,提取與事件有關(guān)的依存關(guān)系,根據(jù)事件和依存關(guān)系可以確定故障原因。因此,管理系統(tǒng)無需必須事先已知事件和依存關(guān)系、與故障原因有關(guān)的信息的前提條件。而且,管理系統(tǒng)能根據(jù)更新規(guī)則更新保存部保存的事件和依存關(guān)系。所以,管理系統(tǒng)不僅無需預(yù)先保存信息,而且還能夠適當(dāng)更新已檢測出的事件和已提取出的依存關(guān)系,僅保存必要的信息。因此,管理系統(tǒng)能削減所必要的存儲容量和信息的處理量。根據(jù)以上內(nèi)容,管理系統(tǒng)由于不受到來自前提條件和存儲容量等方面的制約,所以在各式各樣的裝置和系統(tǒng)中能夠確定故障原因。特別地,管理系統(tǒng)具有即使是在存儲容量和運(yùn)算能力有限的裝置和系統(tǒng)中也能夠確定故障原因的優(yōu)點(diǎn)。
      涉及本發(fā)明一實(shí)施例的管理方法檢測已發(fā)生的事件,提取與事件有關(guān)的依存關(guān)系,根據(jù)更新規(guī)則更新在保存部中已保存的事件和依存關(guān)系,參照保存部,根據(jù)事件和依存關(guān)系確定已發(fā)生的故障的原因。


      圖1是表示本發(fā)明第1實(shí)施例的管理系統(tǒng)的方框圖。
      圖2是表示本發(fā)明第1實(shí)施例的數(shù)據(jù)庫的圖。
      圖3是表示本發(fā)明第1實(shí)施例的更新規(guī)則存儲部的圖。
      圖4是表示本發(fā)明第1實(shí)施例的故障原因探測程序的概念圖。
      圖5是表示本發(fā)明第1實(shí)施例的事件和依存關(guān)系的管理方法的流程圖。
      圖6是表示本發(fā)明第1實(shí)施例的原因確定部的處理程序的流程圖。
      圖7是表示本發(fā)明第1實(shí)施例的故障原因的確定程序的流程圖。
      圖8表示本發(fā)明第2實(shí)施例的管理系統(tǒng)的方框圖。
      圖9是表示本發(fā)明第2實(shí)施例的數(shù)據(jù)庫的圖。
      圖10表示本發(fā)明第2實(shí)施例的故障原因探測程序的概念圖。
      圖11表示本發(fā)明第2實(shí)施例的事件和依存關(guān)系的管理方法的流程圖。
      圖12是表示本發(fā)明第2實(shí)施例的原因特定部的處理程序的流程圖。
      圖13是表示本發(fā)明第2實(shí)施例的故障原因的特定程序的流程圖。
      圖14是表示本發(fā)明第3實(shí)施例的管理系統(tǒng)的結(jié)構(gòu)的方框圖。
      具體實(shí)施例方式
      (第1實(shí)施例)如圖1所示,管理系統(tǒng)100具備事件監(jiān)視部1、依存關(guān)系提取部2、存儲部3、數(shù)據(jù)庫4、原因確定部5、故障檢測部6、更新部7a、契機(jī)檢測部7b和更新規(guī)則存儲部8。
      事件監(jiān)視部1檢測在作為管理系統(tǒng)100的管理對象的系統(tǒng)和裝置中發(fā)生的事件。例如,事件監(jiān)視部1將在操作系統(tǒng)(OS)上執(zhí)行的處理所生成的系統(tǒng)引入和系統(tǒng)設(shè)定文件的寫入等作為事件進(jìn)行監(jiān)視并進(jìn)行檢測。
      而且,事件監(jiān)視部1從更新規(guī)則存儲部8取得規(guī)則ID。更新規(guī)則存儲部8存儲與管理系統(tǒng)100保存的信息更新有關(guān)的更新規(guī)則。對更新規(guī)則給予規(guī)則ID作為用于識別更新規(guī)則的識別符。事件監(jiān)視部1根據(jù)檢測出的事件選擇適用于該事件的更新規(guī)則。例如,事件監(jiān)視部1能夠根據(jù)事件的重要度等選擇更新規(guī)則。而且,事件監(jiān)視部1取得對選擇出的更新規(guī)則所給予的規(guī)則ID。事件監(jiān)視部1將檢測出的事件、該事件的發(fā)生時間、規(guī)則ID輸入到存儲部3。而且,事件監(jiān)視部1將檢測出的事件輸入到依存關(guān)系提取部2。例如,事件監(jiān)視部1可以作為操作系統(tǒng)(OS)內(nèi)的模塊被安裝。
      依存關(guān)系提取部2提取與事件有關(guān)的依存關(guān)系。依存關(guān)系提取部2取得由事件監(jiān)視部1檢測出的事件。依存關(guān)系提取部2根據(jù)作為管理對象的系統(tǒng)和裝置中包含的構(gòu)成單元、系統(tǒng)和裝置進(jìn)行的處理、檢測出的事件提取依存關(guān)系。在依存關(guān)系中有事件間的依存關(guān)系、事件的構(gòu)成單元間的依存關(guān)系、事件的處理間的依存關(guān)系、事件和構(gòu)成單元的依存關(guān)系、事件和處理間的依存關(guān)系等。在構(gòu)成單元中具有存儲器和文件等。構(gòu)成單元,例如,在操作系統(tǒng)(OS)上執(zhí)行的處理等利用。
      例如,依存關(guān)系提取部2在從事件監(jiān)視部1取得系統(tǒng)設(shè)定文件寫入事件時,將系統(tǒng)設(shè)定文件的文件名和向系統(tǒng)設(shè)定文件的路徑作為依存于系統(tǒng)設(shè)定文件寫入事件的「依存源」的構(gòu)成單元進(jìn)行提取,將發(fā)生系統(tǒng)設(shè)定文件寫入事件的處理名稱作為系統(tǒng)設(shè)定文件寫入事件依存的依存對像的處理進(jìn)行提取。依存關(guān)系提取部2將提取的依存關(guān)系輸入到存儲部3。
      此外,依存關(guān)系提取部2可以根據(jù)提取出的依存關(guān)系選擇適用于該依存關(guān)系的更新規(guī)則。此時,例如,依存關(guān)系提取部2能根據(jù)依存關(guān)系選的重要度等選擇更新規(guī)則。依存關(guān)系提取部2取得給予給更新規(guī)則的規(guī)則ID,該更新規(guī)則是從更新規(guī)則存儲部8選擇出的。而且,依存關(guān)系提取部2將規(guī)則ID與提取出的依存關(guān)系一同輸入到存儲部3。
      存儲部3取得由事件監(jiān)視部1檢測出的事件、事件發(fā)生時間、規(guī)則ID,取得由依存關(guān)系提取部2提取的依存關(guān)系。存儲部3將已取得的事件、事件發(fā)生時間、規(guī)則ID和依存關(guān)系對應(yīng)地存儲在數(shù)據(jù)庫4。
      數(shù)據(jù)庫4是保存事件和依存關(guān)系的保存部。數(shù)據(jù)庫4不僅保存事件和依存關(guān)系,而且還能夠與事件或依存關(guān)系相對應(yīng)地保存事件或依存關(guān)系的屬性信息。在屬性信息中有與事件發(fā)生時間和更新規(guī)則有關(guān)的信息等。作為與更新規(guī)則有關(guān)的信息,存在對更新規(guī)則進(jìn)行識別的識別符(規(guī)則ID)等,上述更新規(guī)則是適用于事件和依存關(guān)系的更新的更新規(guī)則。在事件和依存關(guān)系的更新中適用更新規(guī)則時參照與更新規(guī)則有關(guān)的信息。
      如圖2所示,數(shù)據(jù)庫4具有事件ID、事件、依存對象、依存源、事件發(fā)生時間和更新規(guī)則的區(qū)域。依存關(guān)系通過依存對象和依存源來表示。在更新規(guī)則的區(qū)域中存儲規(guī)則ID。在沒有適用的規(guī)則ID時,在更新規(guī)則的區(qū)域中設(shè)定NULL值。存儲部3對事件給予作為事件的識別符的事件ID,與事件ID對應(yīng)地將事件、依存關(guān)系、事件發(fā)生時間、規(guī)則ID存儲到數(shù)據(jù)庫4中。
      更新部7a根據(jù)更新規(guī)則更新數(shù)據(jù)庫4保存的事件和依存關(guān)系等。更新部7a從更新規(guī)則存儲部8取得更新規(guī)則。更新規(guī)則可以決定對重要度低的信息和臨時信息進(jìn)行刪除、使多個事件與其依存關(guān)系衰減等的規(guī)則。具體地說,如圖3所示,更新規(guī)則存儲部8具有存儲更新規(guī)則的更新規(guī)則表81、存儲更新契機(jī)規(guī)則的更新契機(jī)規(guī)則表82。更新規(guī)則表81將規(guī)則ID、適用條件、更新內(nèi)容相對應(yīng)地存儲。這樣,更新規(guī)則包含更新內(nèi)容和適用該更新內(nèi)容的適用條件,對各更新規(guī)則給予規(guī)則ID。
      更新契機(jī)規(guī)則表82將更新契機(jī)和根據(jù)該更新契機(jī)適用的更新規(guī)則的規(guī)則ID相對應(yīng)地保存。這樣,更新契機(jī)規(guī)則可以使用記述了更新契機(jī)和根據(jù)該更新契機(jī)適用的更新規(guī)則的識別符的規(guī)則。更新契機(jī)規(guī)則表82在與一個更新契機(jī)相對應(yīng)保存多個規(guī)則ID的情況下,按更新規(guī)則的適用順序保存規(guī)則ID。更新契機(jī)例如可以根據(jù)作為管理對象的系統(tǒng)和裝置的各種契機(jī)的負(fù)荷和存儲器使用量等進(jìn)行設(shè)定。因此,管理系統(tǒng)100容易適用于計算機(jī)能力和存儲容量等資源有限的裝置和系統(tǒng)。
      契機(jī)檢測部7b檢測適用這些更新規(guī)則的更新契機(jī),將該檢測出的更新契機(jī)通知給更新部7a。更新部7a接收由契機(jī)檢測部7b檢測出的更新契機(jī)的通知。更新部7a根據(jù)更新規(guī)則更新數(shù)據(jù)庫4,該更新規(guī)則是由契機(jī)檢測部7b通知的更新契機(jī)所適用的更新規(guī)則。具體地說,更新部7a根據(jù)已通知的更新契機(jī)檢索更新契機(jī)規(guī)則表82,取得由檢測出的更新契機(jī)適用的更新規(guī)則的規(guī)則ID。更新部7a根據(jù)已取得的規(guī)則ID,從更新規(guī)則表81取得適用條件和更新內(nèi)容,作為更新規(guī)則。而且,更新部7a根據(jù)已取得的適用條件和更新內(nèi)容更新數(shù)據(jù)庫4。
      而且,更新部7a參照數(shù)據(jù)庫4,根據(jù)更新規(guī)則對事件和依存關(guān)系進(jìn)行更新,該事件和依存關(guān)系是由檢測出的更新契機(jī)適用的更新規(guī)則的規(guī)則ID所對應(yīng)的事件和依存關(guān)系。這樣,更新部7a根據(jù)與作為事件或依存關(guān)系的屬性信息的更新規(guī)則有關(guān)的信息,更新數(shù)據(jù)庫4。具體地說,更新部7a參照數(shù)據(jù)庫4,首先,判斷是否有與事件和依存關(guān)系對應(yīng)的規(guī)則ID,適用于該事件和依存關(guān)系的更新規(guī)則是否存在。更新部7a在規(guī)則ID對應(yīng)的情況下,根據(jù)由該規(guī)則ID確定的更新規(guī)則更新數(shù)據(jù)庫4。更新部7a在不存在適用的更新規(guī)則的情況下,能判斷不更新數(shù)據(jù)庫4。此外,在圖2所示的數(shù)據(jù)庫4中,對1個事件對應(yīng)1個規(guī)則ID,但不限定對1個事件適用的更新規(guī)則的數(shù)量。因此,數(shù)據(jù)庫4也可以對1個事件相對應(yīng)地保存多個規(guī)則ID。
      例如,契機(jī)檢測部7b檢測新事件向數(shù)據(jù)庫4的存儲,通知給更新部7a。接收到通知的更新部7a參照更新契機(jī)規(guī)則表82,判斷執(zhí)行與更新契機(jī)「新事件追加」對應(yīng)的規(guī)則ID「0x02」的更新規(guī)則。而且,更新部7a根據(jù)更新規(guī)則表81存儲的適用條件和更新內(nèi)容,對在數(shù)據(jù)庫4中規(guī)則ID「0x02」作為屬性信息所對應(yīng)的事件和依存關(guān)系進(jìn)行更新。此時,在數(shù)據(jù)庫4中被給予了規(guī)則ID「0x02」的事件成為更新對象事件,新事件成為比較事件。
      更新部7a在滿足適用條件「更新對象事件的事件發(fā)生時間比比較事件的事件發(fā)生時間更早,而且更新對象事件的依存源和比較事件的依存對象相等」的情況下,進(jìn)行更新內(nèi)容「將與更新對象事件有關(guān)的信息置換成與比較事件有關(guān)的信息」。因此,例如,更新部7a在關(guān)于經(jīng)由了共有存儲器的處理間通信在數(shù)據(jù)庫4中進(jìn)行存儲的情況下,能將向共有存儲器的寫入事件置換成來自共有存儲器的讀出事件。因此,能夠削除冗長的依存關(guān)系。
      故障檢測部6檢測在作為管理對象的裝置和系統(tǒng)中發(fā)生的故障。例如,故障檢測部6通過取得由核心進(jìn)行的處理異常結(jié)束通知或由用戶進(jìn)行的通知等檢測故障。故障檢測部6向原因確定部5通知故障檢測。故障檢測部6通知發(fā)生了故障的構(gòu)成單元和處理名稱(以下稱為「故障發(fā)生單元」、故障發(fā)生時間。例如,故障檢測部6向原因確定部5發(fā)送故障檢測信號。
      原因確定部5,參照數(shù)據(jù)庫4,根據(jù)事件和依存關(guān)系確定已發(fā)生的故障原因。原因確定部5當(dāng)從故障檢測部6接收故障檢測的通知時,開始原因確定處理。原因確定部5通過參照數(shù)據(jù)庫4分析事件和依存關(guān)系等來確定原因。在圖4中表示原因確定部5的故障原因探測程序的概念圖。在圖4中多個圓表示事件?!窷」~「N-12」為事件名稱。而且,從依存源的事件向依存對象的事件表示箭頭。從圖4的上方向下方表示時間的經(jīng)過。
      原因確定部5追溯由故障檢測部6通知的故障發(fā)生單元,例如,以故障發(fā)生處理為起點(diǎn)追溯依存關(guān)系。原因確定部5從通知的故障發(fā)生時間開始,沿與時間的經(jīng)過相反的方向以故障發(fā)生處理為起點(diǎn)追溯依存關(guān)系。因此,原因確定部5探測故障發(fā)生處理直接或間接依存的事件,確定為故障原因的候補(bǔ)。在圖4的情況下,原因確定部5確定事件「N」、「N-2」、「N-3」、「N-5」、「N-6」、「N-7」、「N-10」、「N-12」為故障原因的候補(bǔ)。原因確定部5向管理對象的裝置和系統(tǒng)的控制部和顯示部等輸出已確定的故障原因的候補(bǔ)。
      在故障原因中例如具有系統(tǒng)設(shè)定文件的修正錯誤、包含缺陷的的操作和裝置驅(qū)動器的安裝、因病毒等有惡意的程序引起的系統(tǒng)改變等。
      這樣的管理系統(tǒng)100可以設(shè)置為作為管理對象的裝置和系統(tǒng)的一部?;蛘?,管理系統(tǒng)100也可以設(shè)置為與作為管理對象的裝置和系統(tǒng)相連接。這樣的管理系統(tǒng)可以通過由計算機(jī)執(zhí)行程序來實(shí)現(xiàn),改程序是指作為檢測已發(fā)生的事件的事件監(jiān)視部、提取與事件有關(guān)的依存關(guān)系的依存關(guān)系提取部、保存事件和依存關(guān)系的保存部、根據(jù)更新規(guī)則對在保存部中保存的事件和依存關(guān)系等進(jìn)行更新的更新部、和參照保存部根據(jù)事件和依存關(guān)系確定已發(fā)生的故障原因的原因確定部,來發(fā)揮功能的程序。
      然后,使用圖5~7對圖1所示的管理系統(tǒng)100進(jìn)行的管理方法的程序進(jìn)行說明。圖5表示事件和依存關(guān)系的管理方法。管理系統(tǒng)100檢測在管理對象的裝置和系統(tǒng)中已發(fā)生的事件(S101)。管理系統(tǒng)100選擇與檢測出的事件有關(guān)的更新規(guī)則(規(guī)則ID)(S102)。管理系統(tǒng)100提取與檢測出的事件有關(guān)的依存關(guān)系(S103)。管理系統(tǒng)100將事件、依存關(guān)系、規(guī)則ID等存儲在數(shù)據(jù)庫4中(S104)。管理系統(tǒng)100檢測更新契機(jī)(S105)。管理系統(tǒng)100從更新規(guī)則存儲部8中取得由檢測出的更新契機(jī)適用的更新規(guī)則(S106)。管理系統(tǒng)100根據(jù)已取得的更新規(guī)則更新數(shù)據(jù)庫4(S107)。
      圖6表示原因確定部5的處理程序。原因確定部5從故障檢測部6取得故障發(fā)生單元和故障發(fā)生時間。原因確定部5在鍵(key)中代入故障發(fā)生單元,在時間(time)中代入故障發(fā)生時間(S201)。原因確定部5以故障發(fā)生單元為鍵(key),也使用故障發(fā)生時間(time)來確定故障原因的侯補(bǔ)(S202)。原因確定部5輸出已確定的故障原因的侯補(bǔ)(S203)。
      圖7表示故障原因的確定程序,即圖6所示的步驟(S202)更為詳細(xì)的程序。原因確定部5根據(jù)已取得的故障發(fā)生時間(time)檢索數(shù)據(jù)庫4,確定故障發(fā)生時間之前的事件。而且,原因確定部5將之前的事件的事件發(fā)生時間代入到時間(time)(S301)。原因確定部5判定之前的事件的依存源是否與已取得故障發(fā)生單元(key)一致(S302)。一致時,原因確定部5判斷為故障發(fā)生單元依存于之前的事件,確定之前的事件作為故障原因的侯補(bǔ)并進(jìn)行存儲(S303)。
      而且,原因確定部5為了探測作為故障原因的侯補(bǔ)確定的事件(以下稱為「確定完成事件」)依存的其他事件,將確定完成事件的依存對像代入到鍵(key),再次調(diào)用按照圖4所示的故障原因探測程序的處理(S304)。而且,原因確定部5根據(jù)確定完成事件的依存對像(key)和故障發(fā)生時間(time)檢索數(shù)據(jù)庫4(S305)。
      原因確定部5接著步驟(S305),或在步驟(S302),在之前的事件依存源與故障發(fā)生單元(key)不一致的情況下,嘗試對確定完成事件之前的事件進(jìn)行確定。而且,原因確定部5將確定完成事件之前的事件的事件發(fā)生時間代入到時間(time)(S306)。原因確定部5在步驟(S306)判斷是否能夠確定之前的事件(S307)。即,原因確定部5判斷之前的事件是否存在(NULL)。
      原因確定部5在之前的事件存在的情況下,確定該事件作為故障原因的侯補(bǔ)。而且,只要之前的事件存在,返回步驟(S302),反復(fù)執(zhí)行步驟(S302)~(S307)。另一方面,原因確定部5在之前的事件不存在的情況下,結(jié)束處理。
      根據(jù)這樣的管理系統(tǒng)100和管理方法,檢測在作為管理對象的裝置和系統(tǒng)中已發(fā)生的事件,提取與事件有關(guān)的依存關(guān)系,根據(jù)事件和依存關(guān)能夠確定故障原因。因此,管理系統(tǒng)100無需必須預(yù)先已知事件和依存關(guān)系、與故障有關(guān)的信息這個前提條件。而且,管理系統(tǒng)100能夠根據(jù)更新規(guī)則更新數(shù)據(jù)庫4保存的事件和依存關(guān)系。因而,管理系統(tǒng)100不僅不需要預(yù)先保存信息,而且能夠?qū)z測出的事件和提取出的依存關(guān)系進(jìn)行適當(dāng)更新,僅保存必要的信息。因此,管理系統(tǒng)100能夠削減所需要的存儲容量和信息的處理量。
      根據(jù)以上內(nèi)容,管理系統(tǒng)100由于不受到來自前提條件和存儲容量方面的制約,所以可以在各式各樣的裝置和系統(tǒng)中確定故障原因。而且,由于能夠削減信息的處理量,所以故障原因的確定變得容易,能夠減少故障修復(fù)所需要的時間。
      例如,管理系統(tǒng)100由于不需要保存并管理與全部事件有關(guān)的信息,所以可以防止在包含多個構(gòu)成單元的復(fù)雜的裝置和系統(tǒng)中保存的信息量的膨脹。此外,能夠防止隨著從故障原因的發(fā)生到實(shí)際故障的發(fā)生的時間間隔的增加,應(yīng)保存的信息量和分析所需要的處理量增加,存儲容量和運(yùn)算能力有限的裝置和系統(tǒng)的故障原因的確定變得困難。因而,管理系統(tǒng)100即使在存儲容量和運(yùn)算能力有限的移動電話終端那樣的裝置和系統(tǒng)中也能夠確定故障原因。
      而且,在管理系統(tǒng)100中,契機(jī)檢測部7b檢測適用更新規(guī)則的更新契機(jī),將該檢測出的更新契機(jī)通知給更新部7a。而且,更新部7a可以根據(jù)由契機(jī)檢測部7b通知的更新契機(jī)適用的更新規(guī)則更新數(shù)據(jù)庫4。因此,通過管理系統(tǒng)100能夠明確地指定執(zhí)行根據(jù)更新規(guī)則的更新的更新契機(jī)。
      此外,作為事件或依存關(guān)系的屬性信息,數(shù)據(jù)庫4保存與更新規(guī)則有關(guān)的信息,更新部7a能夠根據(jù)與更新規(guī)則有關(guān)的信息更新數(shù)據(jù)庫4。因此,管理系統(tǒng)100可以對每個事件和依存關(guān)系控制更新,能夠進(jìn)行較彈性的控制。例如,管理系統(tǒng)100能夠控制適用于每個事件和依存關(guān)系的更新規(guī)則,根據(jù)事件和依存關(guān)系的重要度等可以彈性地控制更新。
      特別地,通過管理系統(tǒng)100能夠作為屬性信息來使用規(guī)則ID,更新部7a能夠根據(jù)由規(guī)則ID確定的更新規(guī)則更新數(shù)據(jù)庫4。因此,通過管理系統(tǒng)100能夠明確地指定適用于各事件和依存關(guān)系的更新規(guī)則。
      (第2實(shí)施例)如圖8所示,管理系統(tǒng)200具有事件監(jiān)視部201、依存關(guān)系提取部2、存儲部203、數(shù)據(jù)庫204、原因確定部205、故障檢測部6、更新部207a、契機(jī)檢測部7b、更新規(guī)則存儲部8和相似性決定規(guī)則存儲部9。在圖8中,對與圖1所表示的管理系統(tǒng)100實(shí)際相同的結(jié)構(gòu)附以相同的符號并省略說明。
      事件監(jiān)視部201對檢測出的事件給予相似性。事件監(jiān)視部201最好根據(jù)檢測出的事件的種類或依存于檢測出的事件的事件相似性中的至少1個來決定給予的相似性。具體地說,事件監(jiān)視部201根據(jù)相似性決定規(guī)則決定給予的相似性。相似性決定規(guī)則由相似性決定規(guī)則存儲部9存儲。在相似性決定規(guī)則中,例如包含根據(jù)事件的種類和相似性的對應(yīng)或根據(jù)依存于檢測出的事件的事件相似性來決定相似性的決定規(guī)則。根據(jù)事件種類的相似性,例如可以根據(jù)對作為管理對象的裝置和系統(tǒng)給予的影響的大小來設(shè)定。例如,對系統(tǒng)設(shè)定文件的變更事件等設(shè)定高的相似性。
      數(shù)據(jù)庫204與事件對應(yīng)地保存相似性。如圖9所示,數(shù)據(jù)庫204具有事件ID、事件、依存對象、依存源、事件發(fā)生時間、相似性和更新規(guī)則的區(qū)域。存儲部203對事件給予事件ID,與事件ID對應(yīng)地存儲事件、依存關(guān)系、事件發(fā)生時間、相似性、規(guī)則ID。更新部207a也更新相似性。
      原因確定部205根據(jù)相似性確定故障原因。圖10表示原因確定部205的故障原因探測程序的概念圖。圖10與圖4相同地表現(xiàn)事件間的關(guān)系等。原因確定部205和圖4的情況同樣,以故障檢測部6所通知的故障發(fā)生單元(故障發(fā)生處理等)為起點(diǎn)追溯依存關(guān)系,探測故障發(fā)生處理直接或間接依存的事件。
      然后,原因確定部205將故障發(fā)生處理直接或間接依存的各事件的相似性與變量Mi(i表示事件名稱)進(jìn)行累積加法運(yùn)算。而且,原因確定部205只確定變量Mi比預(yù)先規(guī)定的閥值大的事件作為故障原因的侯補(bǔ)。在圖10中,原因確定部205確定具有超過閥值的變量「MN-5」、「MN-7」、「MN-12」的事件「N-5」、「N-7」、「N-12」作為故障原因的侯補(bǔ)。
      或者,原因確定部205也可以比較故障發(fā)生處理直接或間接依存的事件的相似性,選擇相似性高,作為故障原因的可能性高的事件作為故障原因的侯補(bǔ)。例如,原因確定部205也可以根據(jù)相似性對事件附加序號,選擇上位規(guī)定數(shù)的事件作為故障原因的侯補(bǔ)。事件監(jiān)視部201、存儲部203、原因確定部205、更新部207a除這些點(diǎn)以外,和圖1表示的事件監(jiān)視部1、存儲部3、原因確定部5、更新部7a實(shí)際上是相同的。
      然后,使用圖11~13對圖8所示的管理系統(tǒng)200進(jìn)行的管理方法的程序進(jìn)行說明。圖11表示事件和依存關(guān)系的管理方法。管理系統(tǒng)200檢測在管理對象的裝置和系統(tǒng)中已發(fā)生的事件(S401)。管理系統(tǒng)200選擇與檢測出的事件有關(guān)的更新規(guī)則(規(guī)則ID)。而且,管理系統(tǒng)200根據(jù)相似性決定規(guī)則決定檢測出的事件的相似性,對事件給予相似性(S402)。管理系統(tǒng)200提取與檢測出的事件有關(guān)的依存關(guān)系(S403)。管理系統(tǒng)200將事件、依存關(guān)系、相似性、規(guī)則ID等存儲在數(shù)據(jù)庫204中(S404)。管理系統(tǒng)200檢測更新契機(jī)(S405)。管理系統(tǒng)200從更新規(guī)則存儲部8取得由檢測出的更新契機(jī)適用的更新規(guī)則(S406)。管理系統(tǒng)200根據(jù)已取得的更新規(guī)則更新數(shù)據(jù)庫204(S407)。
      圖12表示原因確定部205的處理程序。原因確定部205從故障檢測部6取得故障發(fā)生單元(key)和故障發(fā)生時間(time)。原因確定部205在鍵(key)中代入故障發(fā)生單元,在時間(time)中代入故障發(fā)生時間。原因確定部205在使用變量Mi確定故障原因的情況下,對變量Mi進(jìn)行初始化(S501)。原因確定部205以故障發(fā)生單元為鍵(key),也使用故障發(fā)生時間,根據(jù)相似性來確定故障原因的侯補(bǔ)(S502)。原因確定部5同時輸出已確定的故障原因的侯補(bǔ)和其的相似性(S503)。
      圖13表示故障原因的確定程序,即圖12所示的步驟(S502)一例的更為詳細(xì)的程序。原因確定部205把對相似性進(jìn)行累積加法運(yùn)算的變量,即存儲相似性累積值的變量Mi代入到局部變量Mi′(S601)。原因確定部205根據(jù)已取得的故障發(fā)生時間(time)檢索數(shù)據(jù)庫204,確定故障發(fā)生時間之前的事件。而且,原因確定部205將之前的事件的事件發(fā)生時間代入到時間(time)(S602)。
      原因確定部205判定之前的事件的依存源是否與已取得故障發(fā)生單元(key)一致(S603)。一致時,原因確定部205將之前的事件的相似性與變量Mi進(jìn)行累積加法運(yùn)算(S604)。原因確定部205判斷累積加法運(yùn)算后的變數(shù)Mi是否比閥值大(S605)。原因確定部205在判斷為累積加法運(yùn)算后的變數(shù)Mi比閥值大的情況下,確定之前的事件作為故障原因的侯補(bǔ)并進(jìn)行存儲(S606)。接著步驟(S606)進(jìn)入到步驟(S607)。此外,在步驟(S605),在判斷為累積加法運(yùn)算后的變數(shù)Mi比閥值小的情況下,原因確定部205繞過步驟(S606),進(jìn)入到步驟(S607)。
      原因確定部205,將確定完事件的依存對方代入到鍵(key),再次調(diào)用按照圖10所示的故障原因探測程序的處理(S607)。原因確定部205根據(jù)確定完事件的依存對方(key)和事件發(fā)生時間(time)檢索數(shù)據(jù)庫204(S608)。
      原因確定部205接著步驟(S608),或在步驟(S603),在之前的事件的依存源與故障發(fā)生單元(key)不一致時,嘗試確定完成事件的之前的事件的確定。而且,原因確定部205將確定完成事件之前的事件的事件發(fā)生時間代入到時間中(time)(S609)。
      原因確定部205在步驟(S609)判斷是否可以確定之前的事件(S610)。即,原因確定部205判斷之前的事件是否存在(NULL)。原因確定部5在之前的事件存在時,返回步驟(S603),只要之前的事件存在就反復(fù)執(zhí)行步驟(S603)~(S610)。另一方面,原因確定部205在之前的事件不存在(NULL)時,將局部變量Mi′代入到變量Mi(S611),結(jié)束處理。
      根據(jù)這樣的管理系統(tǒng)200和管理方法,除了得到通過圖1所示的管理系統(tǒng)100和圖5~7所示的管理方法得到的效果之外,還能夠得到以下的效果。管理系統(tǒng)200能夠根據(jù)相似性選擇可能性高的故障原因,能提高故障原因確定的精度。而且,根據(jù)管理系統(tǒng)200,即使是在故障發(fā)生單元依存于多個事件的情況下,也可以通過根據(jù)相似性的確定來抑制故障原因的侯補(bǔ)數(shù)量的增加,能夠更容易地確定故障原因。而且,管理系統(tǒng)200能夠給予與事件的種類對應(yīng)的相似性、和根據(jù)依存關(guān)系將事件的相似性傳播給依存的事件。因而,管理系統(tǒng)200可以較適當(dāng)?shù)亟o予相似性,更加提高故障原因確定的精度。
      如圖14所示,管理系統(tǒng)300具有事件監(jiān)視部201、依存關(guān)系提取部2、存儲部303、第1數(shù)據(jù)庫304a、第2數(shù)據(jù)庫304b、原因確定部305、故障檢測部6、更新部307a、契機(jī)檢測部7b、更新規(guī)則存儲部8、和相似性決定規(guī)則存儲部9。在圖14中,與圖1、8所示的管理系統(tǒng)100、200實(shí)際相同的結(jié)構(gòu)附以相同的符號,省略說明。
      管理系統(tǒng)300具有作為保存部的第1保存部的第1數(shù)據(jù)庫304a和作為保存部的第2保存部的第2數(shù)據(jù)庫304b。第1數(shù)據(jù)庫304a可以使用易失性的存儲媒體。易失性的存儲媒體雖然記錄速度為高速,但存儲容量有限,容量單價高。例如,作為第1數(shù)據(jù)庫304a,可以使用主存儲器。第2數(shù)據(jù)庫304b可以使用非易失性的存儲媒體。非易失性的存儲媒體雖然記錄速度是低速,但存儲容量大,容量單價低廉。即,第2數(shù)據(jù)庫304b能夠以低成本保存大量的數(shù)據(jù)。例如,作為第2數(shù)據(jù)庫304b能夠使用磁性存儲裝置和網(wǎng)絡(luò)上的數(shù)據(jù)庫服務(wù)器。第1數(shù)據(jù)庫304a、第2數(shù)據(jù)庫304b與圖9表示的數(shù)據(jù)庫204相同地保存數(shù)據(jù)。
      存儲部303在第1數(shù)據(jù)庫304a存儲從事件監(jiān)視部201和依存關(guān)系提取部2取得的事件發(fā)生時的信息。因為能夠向第1數(shù)據(jù)庫304a高速存儲信息,所以管理系統(tǒng)300能夠降低隨著信息存儲的總開銷。
      更新部307a從第1數(shù)據(jù)庫304a取得信息,并存儲在第2數(shù)據(jù)庫304b。即,更新部307a從第1數(shù)據(jù)庫304a向第2數(shù)據(jù)庫304b轉(zhuǎn)錄、轉(zhuǎn)移信息。更新部307a例如在事先已規(guī)定的定時轉(zhuǎn)移信息。例如,更新部307a能夠在第1數(shù)據(jù)庫304a所保存的信息量超過閥值時,和對作為管理對象的裝置和系統(tǒng)進(jìn)行升級時轉(zhuǎn)移信息。
      而且,更新部307a從第1數(shù)據(jù)庫304a取得事件和依存關(guān)系進(jìn)行更新,并將更新后的事件和依存關(guān)系存儲在第2數(shù)據(jù)庫304b中。即,更新部307a在信息轉(zhuǎn)移的同時進(jìn)行更新。
      例如,如圖3所示,由于更新契機(jī)規(guī)則表82保存著更新契機(jī)「向第2數(shù)據(jù)庫的存儲」,更新部307a在轉(zhuǎn)移信息時能夠執(zhí)行更新。更新部307a以規(guī)則ID「0x02」、「0x04」的序號執(zhí)行根據(jù)更新規(guī)則的更新。更新部307a根據(jù)規(guī)則ID「0x02」的更新內(nèi)容更新從第1數(shù)據(jù)庫304a取得的信息,存儲在第2數(shù)據(jù)庫304b之后,根據(jù)規(guī)則ID「0x04」的更新內(nèi)容,刪除第1數(shù)據(jù)庫304a保存的信息。
      原因確定部305參照第1數(shù)據(jù)庫304a和第2數(shù)據(jù)庫304b,使用第1數(shù)據(jù)庫304a和第2數(shù)據(jù)庫304b保存的信息確定故障原因。存儲部303、原因確定部305和更新部307a除了這些功能之外,和圖8所示的存儲部203、原因確定部305和更新部207a實(shí)際上相同。
      根據(jù)這樣的管理系統(tǒng)300,除了得到使用圖1、8所示的管理系統(tǒng)100、200所取得的效果之外,還能夠得到以下的效果。通過管理系統(tǒng)300可以暫時將信息保存在第1數(shù)據(jù)庫304a中,僅將必要的更新后的信息保存在第2數(shù)據(jù)庫304b中。而且,由于是更新后的信息,可以削減第2數(shù)據(jù)庫304b保存的信息量。
      而且,管理系統(tǒng)300使用特性不同的2個存儲媒體作為第1數(shù)據(jù)庫304a和第2數(shù)據(jù)庫304b。而且,管理系統(tǒng)300能夠?qū)⑿畔簳r存儲在可以高速記錄的第1數(shù)據(jù)庫304a中,并向第2數(shù)據(jù)庫304b進(jìn)行適當(dāng)?shù)霓D(zhuǎn)移。因而,管理系統(tǒng)300能降低在收集信息并將其存儲在第1數(shù)據(jù)庫304a時的總開銷。
      這樣的管理系統(tǒng)300對存儲容量有限的裝置和系統(tǒng)特別有用。例如,在攜帶電話終端中,對存儲容量的限制十分嚴(yán)格,為了保存用于確定故障原因的必要的信息而使用大量的存儲器是不太現(xiàn)實(shí)的,但通過管理系統(tǒng)300就能夠回避這樣的情況。
      權(quán)利要求
      1.一種管理系統(tǒng),其特征在于,具有檢測已發(fā)生的事件的事件監(jiān)視部;提取與上述事件有關(guān)的依存關(guān)系的依存關(guān)系提取部;保存上述事件和上述依存關(guān)系的保存部;根據(jù)更新規(guī)則對由上述保存部保存的上述事件和上述依存關(guān)系進(jìn)行更新的更新部;和參照上述保存部,根據(jù)上述事件和上述依存關(guān)系確定已發(fā)生的故障原因的原因確定部。
      2.根據(jù)權(quán)利要求1所述的管理系統(tǒng),其特征在于,具有檢測適用上述更新規(guī)則的更新契機(jī),并向上述更新部通知該檢測出的更新契機(jī)的契機(jī)檢測部,上述更新部根據(jù)由上述契機(jī)檢測部通知的上述更新契機(jī)所適用的上述更新規(guī)則,來更新上述保存部。
      3.根據(jù)權(quán)利要求1所述的管理系統(tǒng),其特征在于,上述保存部保存與上述更新規(guī)則有關(guān)的信息作為上述事件或上述依存關(guān)系的屬性信息,上述更新部根據(jù)與上述更新規(guī)則有關(guān)的信息更新上述保存部。
      4.根據(jù)權(quán)利要求3所述的管理系統(tǒng),其特征在于,上述屬性信息是識別上述更新規(guī)則的識別符,上述更新部根據(jù)通過上述識別符所確定的更新規(guī)則更新上述保存部。
      5.根據(jù)權(quán)利要求1所述的管理系統(tǒng),其特征在于,上述事件監(jiān)視部對上述事件給予相似性,上述保存部將上述相似性與上述事件對應(yīng)地保存,上述原因確定部根據(jù)上述相似性確定上述故障原因。
      6.根據(jù)權(quán)利要求5所述的管理系統(tǒng),其特征在于,上述事件監(jiān)視部根據(jù)上述事件的種類,或依存于上述事件的事件相似性中的至少一個來決定上述給予的相似性。
      7.根據(jù)權(quán)利要求1所述的管理系統(tǒng),其特征在于,上述保存部具有第1保存部和第2保存部,上述更新部從上述第1保存部取得上述事件和上述依存關(guān)系進(jìn)行更新,并將更新后的事件和依存關(guān)系存儲在上述第2保存部中。
      8.一種管理方法,其特征在于,檢測已發(fā)生的事件;提取與上述事件有關(guān)的依存關(guān)系;根據(jù)更新規(guī)則對由保存部所保存的上述事件和上述依存關(guān)系進(jìn)行更新;參照上述保存部,根據(jù)上述事件和上述依存關(guān)系確定已發(fā)生的故障原因。
      全文摘要
      管理系統(tǒng)具有檢測已發(fā)生的事件的事件監(jiān)視部;提取與上述事件有關(guān)的依存關(guān)系的依存關(guān)系提取部;保存上述事件和上述依存關(guān)系的保存部;根據(jù)更新規(guī)則對由上述保存部所保存的上述事件和上述依存關(guān)系進(jìn)行更新的更新部;參照上述保存部,根據(jù)上述事件和上述依存關(guān)系確定已發(fā)生的故障原因的原因確定部。
      文檔編號H04L12/24GK1722678SQ20051008407
      公開日2006年1月18日 申請日期2005年7月12日 優(yōu)先權(quán)日2004年7月12日
      發(fā)明者鈴木敬 申請人:株式會社Ntt都科摩
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1