專利名稱:以不取得事件信息的it裝置為對象的根本原因分析方法、裝置及程序的制作方法
技術(shù)領(lǐng)域:
本申請說明中公開的技術(shù)涉及對包含服務(wù)器計算機、網(wǎng)絡(luò)裝置、存儲裝置的信息 處理系統(tǒng)的操作進(jìn)行管理的操作管理方法、裝置、系統(tǒng)、程序、包含程序的介質(zhì)以及程序的 分發(fā)裝置。
背景技術(shù):
近年來,IT系統(tǒng)(IT是Information Technology的略稱。以下有時將IT系統(tǒng)稱 為信息處理系統(tǒng))通過經(jīng)由網(wǎng)絡(luò)連接各種IT裝置(以后稱為信息處理裝置)而變得復(fù)雜 化、大規(guī)模化,故障經(jīng)由網(wǎng)絡(luò)對各種IT裝置造成影響。作為用于確定這些故障的部位及原 因的根本原因分析技術(shù),在專利文獻(xiàn)1中公開了一種使用從IT裝置通知故障內(nèi)容的事件信 息來分析故障部位和原因的事件相關(guān)技術(shù)。另外,事件相關(guān)技術(shù)也可以說是利用故障時從 計算機發(fā)送來的事件的相關(guān)性來推測根本原因的技術(shù)。另外,在非專利文獻(xiàn)2中公開了如下技術(shù)把該技術(shù)和故障時的事件的組合與推 測的根本原因組成對并進(jìn)行規(guī)則化,由此使用基于專家系統(tǒng)的推論引擎來迅速地查明根本 原因。專利文獻(xiàn)1 美國專利第6249755號說明書非專利文獻(xiàn) 1 :"Rete :A Fast Algorithm for the Many Pattern/Many Object Pattern Match Problem,,,ARTIFICIAL INTELLIGENCE Vol. 19,no. 1,1982,pp. 17-3
發(fā)明內(nèi)容
進(jìn)行操作管理所需要的處理的操作管理服務(wù)器無法取得連接在網(wǎng)絡(luò)上的所有的 IT裝置的事件,因此操作管理服務(wù)器局限于接收(或者取得)事件信息的IT裝置,使用根 本原因分析技術(shù)來顯示分析結(jié)果。但是,該分析技術(shù)是以能夠從連接在網(wǎng)絡(luò)上的所有IT裝置取得事件信息為前提 的。結(jié)果是當(dāng)在操作管理服務(wù)器不取得事件信息的IT裝置中發(fā)生事件(例如故障)、正在 取得事件信息的IT裝置受到該故障的影響時,由于發(fā)生故障IT裝置不是分析對象,所以無 法應(yīng)用規(guī)則,不能查明故障的根本原因。本發(fā)明提供一種分析事件的裝置、系統(tǒng)、方法、程序以及存儲介質(zhì),該事件發(fā)生在 由多個信息處理裝置、畫面輸出裝置以及具有處理器和存儲器的操作管理服務(wù)器構(gòu)成的信 息處理系統(tǒng)中的、所述多個信息處理裝置中。根據(jù)本發(fā)明的一個實施方式,關(guān)于所述操作管理服務(wù)器,為了所述多個信息處理 裝置中的每一個信息處理裝置作為客戶機來使用網(wǎng)絡(luò)服務(wù),而將作為訪問對象的所述多個 信息處理裝置中的一部分信息處理裝置即服務(wù)器裝置的識別信息存儲到所述存儲器具有 的結(jié)構(gòu)信息中,將作為所述操作管理服務(wù)器取得事件信息的對象的多個事件取得對象裝置 登錄到所述存儲器具有的結(jié)構(gòu)信息中,該多個事件取得對象裝置是所述多個信息處理裝置
5中的一部分,當(dāng)檢測到在所述多個信息處理裝置中發(fā)生的包含與所述網(wǎng)絡(luò)服務(wù)相關(guān)聯(lián)的第 一事件類別的事件和包含不同于與所述網(wǎng)絡(luò)服務(wù)相關(guān)聯(lián)的所述第一事件類別的第二事件 類別的事件時,將表示因與所述第二事件類別對應(yīng)的事件發(fā)生而可能導(dǎo)致與所述第一事件 類別對應(yīng)的事件發(fā)生的相關(guān)分析規(guī)則信息存儲到所述存儲器中,將從所述多個事件取得對 象裝置收集到的多個所述事件信息存儲到所述存儲器中,根據(jù)所述相關(guān)分析規(guī)則信息,從 存儲于所述存儲器的多個所述事件信息中確定包含所述第一事件類別的第一事件信息,根 據(jù)所述結(jié)構(gòu)信息來確定作為已發(fā)送了所述第一事件信息的事件取得對象裝置中之一的第 一事件取得對象裝置、以及與所述第一事件類別對應(yīng)的所述網(wǎng)絡(luò)服務(wù)中的所述第一事件取 得對象裝置的服務(wù)器裝置即故障主要原因裝置,根據(jù)所述相關(guān)分析規(guī)則信息和所述結(jié)構(gòu)信 息,當(dāng)所述故障主要原因裝置不是所述多個事件取得對象裝置時,向所述畫面輸出裝置發(fā) 送用于確定所述第一事件取得對象裝置、所述第一事件類別、所述故障主要原因裝置以及 所述第二事件類別的信息,由此,使所述畫面輸出裝置顯示關(guān)于在所述第一事件取得對象 裝置中所發(fā)生的與所述第一事件信息對應(yīng)的事件,推定為在所述故障主要原因裝置中發(fā)生 所述第二事件類別的事件是主要原因。另外,所述相關(guān)分析規(guī)則信息包含拓?fù)錀l件信息,該拓?fù)錀l件信息表示在發(fā)生了 所述第一事件類別的作為所述多個信息處理裝置中之一的第一信息處理裝置和發(fā)生了所 述第二事件類別的作為所述多個信息處理裝置中之一的第二信息處理裝置之間的拓?fù)錀l 件,所述主要原因確定步驟也可以根據(jù)所述拓?fù)錀l件信息來確定所述故障主要原因裝置。另外,也可以根據(jù)所述相關(guān)分析規(guī)則信息和所述結(jié)構(gòu)信息,來確定作為所述多個 事件取得對象裝置的服務(wù)器裝置的、不包含在所述多個事件取得對象裝置中的、作為所述 多個信息處理裝置中一部分的事件關(guān)聯(lián)信息處理裝置,對是否能夠從所述事件關(guān)聯(lián)信息處 理裝置中取得事件信息進(jìn)行調(diào)查,在根據(jù)所述調(diào)查結(jié)果能夠從所述事件關(guān)聯(lián)信息處理裝置 中取得事件信息時,向所述畫面輸出裝置發(fā)送用于確定所述事件關(guān)聯(lián)信息處理裝置的信 息,由此使所述畫面輸出裝置顯示能夠從所述事件關(guān)聯(lián)信息處理裝置中取得事件信息。另外,所述事件信息取得可否調(diào)查步驟也可以是基于所述操作管理服務(wù)器根據(jù) 預(yù)定的步驟對作為所述多個信息處理裝置、具有在事先作為調(diào)查范圍所設(shè)定的IP地址的 范圍中包含的IP地址的信息處理裝置進(jìn)行訪問而得的結(jié)果。另外,所述故障主要原因裝置是具有控制器、并提供邏輯卷的存儲裝置,所述網(wǎng)絡(luò) 服務(wù)是根據(jù)塊訪問形式的協(xié)議來提供所述邏輯卷的服務(wù),所述第一事件類別是所述存儲裝 置發(fā)生故障,所述第一事件類別也可以是向所述邏輯卷的訪問失敗。另外,也可以根據(jù)所述相關(guān)分析規(guī)則信息和所述結(jié)構(gòu)信息,在所述故障主要原因 裝置是所述多個事件取得對象裝置中之一時,從多個所述事件信息中確定包含所述第二事 件類別、且所述故障主要原因裝置為取得源的第二事件信息,并向所述畫面輸出裝置發(fā)送 用于確定所述第一事件取得對象裝置、所述第一事件信息、所述故障主要原因裝置以及所 述第二事件信息的信息,由此,使所述畫面輸出裝置顯示關(guān)于與在所述第一事件取得對象 裝置中所發(fā)生的所述第一事件信息對應(yīng)的事件,發(fā)生與在所述故障主要原因裝置中所發(fā)生 的所述第二事件信息對應(yīng)的事件是主要原因。另外,根據(jù)本發(fā)明的另一個實施例,通過操作管理服務(wù)器,將事件信息取得對象的 信息處理裝置作為事件取得對象裝置登錄到結(jié)構(gòu)信息中,從在操作管理服務(wù)器中所存儲的多個事件信息中確定與事先所述存儲的規(guī)則相符合的事件信息,確定與該事件信息相關(guān)聯(lián) 的網(wǎng)絡(luò)服務(wù)的服務(wù)器裝置,并顯示推定為在生成事件信息的客戶機信息處理裝置中所發(fā)生 的該事件的主要原因是在服務(wù)器裝置中所發(fā)生的與網(wǎng)絡(luò)服務(wù)相關(guān)的事件。根據(jù)本發(fā)明,在不取得事件信息的IT裝置中發(fā)生了事件時也能夠顯示分析結(jié)果。
圖1表示本發(fā)明的操作管理系統(tǒng)的整體結(jié)構(gòu)圖。圖2示意地表示本發(fā)明中的一個實施方式的故障分析的全體處理流程。圖3示意地表示以本發(fā)明為對象的IT系統(tǒng)的代表結(jié)構(gòu)例中的一個。圖4示意地表示在本發(fā)明的操作管理系統(tǒng)中所使用的相關(guān)分析規(guī)則信息。圖5示意地表示通過圖4所示的相關(guān)分析規(guī)則信息指定為應(yīng)用對象的拓?fù)洹D6示意地表示對成為規(guī)則的應(yīng)用目標(biāo)的IT裝置的列表進(jìn)行管理的表狀數(shù)據(jù)結(jié) 構(gòu)的一個例子、即規(guī)則應(yīng)用目標(biāo)管理表。圖7是本發(fā)明的一個實施方式的相關(guān)分析規(guī)則信息的應(yīng)用信息的生成處理流程。圖8示意地表示通過成為本發(fā)明的第一實施方式中的IP-SAN的客戶機的計算機 所取得的IP-SAN存儲裝置的連接信息。圖9示意地表示本發(fā)明的第一實施方式中的與通過結(jié)構(gòu)管理保存的管理對象IT 裝置的IP-SAN存儲裝置相關(guān)的結(jié)構(gòu)信息。圖10是本發(fā)明的第一實施方式中的向用戶提議將非管理IT裝置包含在管理對象 中的畫面顯示例。圖11示意地表示本發(fā)明的第一實施方式中的用于管理非管理IT裝置的表狀數(shù)據(jù) 結(jié)構(gòu)的一個例子、即非管理IT裝置管理表。圖12示意地表示本發(fā)明的第一實施方式中的保存規(guī)則的應(yīng)用目標(biāo)IT裝置的列表 的規(guī)則應(yīng)用目標(biāo)管理表。圖13示意地表示通過成為本發(fā)明的第一實施方式中的FC-SAN的客戶機的計算機 所取得的FC-SAN存儲裝置的連接信息。圖14示意地表示本發(fā)明的第一實施方式中的與通過結(jié)構(gòu)管理保存的管理對象IT 裝置的FC-SAN存儲裝置相關(guān)的信息。圖15示意地表示本發(fā)明的第一實施方式中的能夠在成為文件服務(wù)器的計算機中 取得的與文件服務(wù)器相關(guān)的識別信息和公開名。圖16示意地表示本發(fā)明的第一實施方式中的故障分析結(jié)果的畫面顯示處理流程。圖17示意地表示本發(fā)明的第一實施方式中的、非管理IT裝置為故障原因時的故 障分析結(jié)果數(shù)據(jù)的一個例子。圖18示意地表示本發(fā)明的第一實施方式中的、非管理IT裝置為故障原因時的故 障分析結(jié)果的畫面顯示的結(jié)構(gòu)例。圖19示意地表示本發(fā)明的第一實施方式中的、非管理IT裝置為故障原因時的故 障分析結(jié)果的畫面顯示圖20示意地表示本發(fā)明的第二實施方式中的故障分析的全體處理流程。
7的一個實施方式的相關(guān)分析規(guī)則信息的應(yīng)用信息的生成處理流程。符號說明NO、操作管理服務(wù)器;附 N3、計算機;N4、網(wǎng)絡(luò)(NW)交換器;N5、存儲裝置;01、計 算機;02、NW交換器;03、存儲裝置;Ml、畫面輸出裝置
具體實施例方式下面對本發(fā)明的實施方式進(jìn)行說明。(實施例1)圖1是表示用于實施本發(fā)明的信息處理系統(tǒng)的一個結(jié)構(gòu)的概要圖。信息處理系統(tǒng)由操作管理系統(tǒng)和操作管理服務(wù)器構(gòu)成。操作管理系統(tǒng)將構(gòu)成IT 系統(tǒng)的計算機、網(wǎng)絡(luò)交換器(NW交換器)以及存儲裝置作為管理對象,通過操作管理服務(wù)器 NO來監(jiān)視/管理這些管理對象。本發(fā)明的操作管理服務(wù)器NO具備事件接收部C0,其接收管理對象IT裝置中的 狀態(tài)變化、故障信息、通知信息等事件信息;規(guī)則引擎C1,其根據(jù)接收到的事件信息,根據(jù) 事先所定義的規(guī)則R0進(jìn)行故障分析;結(jié)構(gòu)管理C3,其管理管理對象IT裝置的結(jié)構(gòu)信息;以 及畫面顯示部C2,其將為了操作管理這些裝置而需要的信息輸出到畫面。另外,在操作管理系統(tǒng)中有根據(jù)畫面顯示部的控制和輸出數(shù)據(jù)、將用于操作管理 的信息顯示到畫面上的裝置即畫面輸出裝置M1,該畫面輸出裝置Ml與操作管理服務(wù)器NO 連接。另外,作為畫面輸出裝置Ml首先考慮與操作管理服務(wù)器連接的顯示器裝置,但只要 能夠?qū)⒎治鼋Y(jié)果信息顯示給操作管理系統(tǒng)的管理者,也可以由其它裝置來代替。作為畫面 輸出裝置Ml的其它例子有是作為畫面輸出裝置接收操作管理服務(wù)器NO發(fā)送的電子郵件 并能夠顯示的便攜式終端;或者是根據(jù)操作管理服務(wù)器N0發(fā)送的分析結(jié)果將信息提供信 息給管理者、還接受來自管理者的輸入并發(fā)送給操作管理服務(wù)器N0的帶有顯示器的計算 機。規(guī)則引擎C1由規(guī)則應(yīng)用部C11、規(guī)則存儲器C13以及事件分析處理部C12構(gòu)成。 規(guī)則應(yīng)用部C11讀取用于事件相關(guān)分析的分析規(guī)則信息R0 (以后有時稱為相關(guān)分析規(guī)則信 息)、從結(jié)構(gòu)管理C3中取得結(jié)構(gòu)信息T0、進(jìn)行用于將規(guī)則應(yīng)用到IT系統(tǒng)的IT裝置中的處 理;規(guī)則存儲器C13是用于管理規(guī)則應(yīng)用目標(biāo)管理表C130、并進(jìn)行規(guī)則的分析處理的工作 存儲器,該規(guī)則應(yīng)用目標(biāo)管理表C130管理應(yīng)用信息,該應(yīng)用信息是用于在規(guī)則應(yīng)用部中將 規(guī)則應(yīng)用到IT裝置中的信息;事件分析處理部C12接受通過事件接收部C0接收到的事件 信息、并進(jìn)行事件的相關(guān)分析。另外,規(guī)則應(yīng)用目標(biāo)管理表C130只要存儲在操作管理服務(wù) 器N0的存儲器中即可,即使不存在于規(guī)則存儲器C13中也可以。另外,相關(guān)分析規(guī)則信息可以通過操作管理服務(wù)器N0的管理者生成/存儲,也可 以通過在后述的本發(fā)明的程序中包含相關(guān)分析規(guī)則信息,存儲到存儲器中,或者也可以通 過本發(fā)明的程序的初始化處理,將相關(guān)分析規(guī)則信息存儲到存儲器中。另外,作為構(gòu)成操作管理服務(wù)器N0的硬件,有處理器、存儲器(包含以半導(dǎo)體存儲 器及HDD為代表的可擦寫存儲裝置)、網(wǎng)絡(luò)端口。各硬件通過總線等內(nèi)部網(wǎng)絡(luò)連接。另外, 首先考慮將事件接收部C0、規(guī)則引擎C1、畫面顯示部C2以及結(jié)構(gòu)管理C3存儲在操作管理
8服務(wù)器NO的存儲器中、作為通過處理器執(zhí)行的程序來實現(xiàn),但也可以通過硬件來實現(xiàn)這些 功能的一部分或者全部。另外,在以后的說明中,將包含事件接收部CO、規(guī)則引擎C1、畫面 顯示部C2及結(jié)構(gòu)管理C3的程序稱為事件分析程序。另外,將相關(guān)分析規(guī)則信息R0、結(jié)構(gòu)信息TO、規(guī)則應(yīng)用目標(biāo)管理表C130存儲在操 作管理服務(wù)器NO的存儲器中。另外,結(jié)構(gòu)信息TO包含后面說明的IP-SAN存儲裝置的連接 信息(圖8)、與IP-SAN存儲裝置相關(guān)的信息(圖9)、FC-SAN存儲裝置的連接信息(圖13)、 與FC-SAN存儲裝置相關(guān)的信息(圖14)以及與文件服務(wù)器相關(guān)的識別信息和公開名(圖 15)中的至少一個信息。另外,關(guān)于后面說明的非管理IT裝置管理表(圖11),也作為包含 在結(jié)構(gòu)信息中的內(nèi)容進(jìn)行說明,但如果存儲在操作管理服務(wù)器NO的存儲器中的話,則也可 以存儲為結(jié)構(gòu)信息TO以外的信息。另外,關(guān)于相關(guān)分析規(guī)則信息R0、結(jié)構(gòu)信息T0、規(guī)則應(yīng)用目標(biāo)管理表C130、IP_SAN 存儲裝置的連接信息、與IP-SAN存儲裝置相關(guān)的信息、FC-SAN存儲裝置的連接信息、與 FC-SAN存儲裝置相關(guān)的信息、與文件服務(wù)器相關(guān)的識別信息和公開名、以及非管理IT裝置 管理表,只要包含后面說明的信息即可,而不必為文本文件或表、隊列結(jié)構(gòu)等特定的格式、 數(shù)據(jù)結(jié)構(gòu)。由于在以后的說明和權(quán)利要求中明確記載作為更加一般性的信息,因此有時將 相關(guān)分析規(guī)則信息R0、結(jié)構(gòu)信息T0、規(guī)則應(yīng)用目標(biāo)管理表C130、IP-SAN存儲裝置的連接信 息、FC-SAN存儲裝置的連接信息、與IP-SAN存儲裝置相關(guān)的信息、與FC-SAN存儲裝置相關(guān) 的信息、與文件服務(wù)器相關(guān)的識別信息和公開名、以及非管理IT裝置管理表分別稱為相關(guān) 分析規(guī)則信息、結(jié)構(gòu)信息、規(guī)則應(yīng)用目標(biāo)管理信息、IP-SAN存儲裝置的連接信息、FC-SAN存 儲裝置的連接信息、與IP-SAN存儲裝置相關(guān)的信息、與FC-SAN存儲裝置相關(guān)的信息、與文 件服務(wù)器相關(guān)的識別和公開名信息、以及非管理IT裝置管理信息。另外,雖然未圖示,但是操作管理服務(wù)器將從作為管理對象的各種IT裝置接收的 事件信息作為事件表目(event entry)存儲到在存儲器內(nèi)所定義的事件數(shù)據(jù)庫中。另外, 事件數(shù)據(jù)庫可以為任何形式的數(shù)據(jù)結(jié)構(gòu),只要包含一個以上的事件表目即可。另外,事件信息包含事件內(nèi)容,但是也可以包含事件發(fā)生時間。另外,事件數(shù)據(jù)庫 也可以根據(jù)所決定的條件將過去的事件信息作為履歷保留。另外,當(dāng)包含在事件數(shù)據(jù)庫中 并存儲在存儲器中時,操作管理服務(wù)器的程序(特別是結(jié)構(gòu)管理C3)也可以把作為事件信 息取得對象的IT裝置的識別信息、和通過操作管理服務(wù)器而得的事件信息接收時間關(guān)聯(lián) 起來一起進(jìn)行包含。另外,事件內(nèi)容至少要包含事件的類別,根據(jù)情況也可以包含用于確定 該事件發(fā)生的IT裝置內(nèi)的硬件以及軟件的信息。另外,作為事件的類別,例如考慮了以下的類別,但是也可以存在這些之外的類 別。(A)該IT裝置的工作狀態(tài)為預(yù)定的狀態(tài)(例如其中包含發(fā)生硬件故障或軟件故 障)(B)健康診斷結(jié)果為預(yù)定的結(jié)果(例如其中包含一定時間沒有健康診斷應(yīng)答的情 況)(C)處理速度、或者作為構(gòu)成IT裝置的組件的處理器或存儲器、HDD等的消費資源 量已與預(yù)定的條件相符合(例如其中包含HDD的剩余容量低于10%的情況)(D) IT裝置接收到滿足預(yù)定的條件的網(wǎng)絡(luò)訪問(例如,其中包含IT裝置接收到的請求超過了預(yù)定的次數(shù)、接收到預(yù)定次數(shù)的被請求的DoS攻擊和被識別的網(wǎng)絡(luò)數(shù)據(jù)包、從 所規(guī)定的IT裝置以外的IT裝置接收到請求等情況)另外,考慮通過如下方法向存儲器存儲事件分析程序從存儲有該程序的 DVD-ROM或CD-ROM等介質(zhì)安裝或者拷貝的方法,或者從能夠與操作管理服務(wù)器NO通信的程 序分發(fā)服務(wù)器接收該程序(或者能夠在存儲器上生成該程序的信息)的方法。但也可以是 這些之外的方法。另外,關(guān)于向操作管理服務(wù)器NO存儲程序,也可以是事先存儲后使其分 配給操作管理服務(wù)器NO的方式。通過以上說明的操作管理服務(wù)器N0來分析信息處理系統(tǒng)故障的根本原因。另外,在操作管理系統(tǒng)中,事先指定管理對象IT裝置,將事件信息作為相關(guān)分析 的分析對象從該IT裝置接收需要的信息。如此,在操作管理系統(tǒng)中,確定進(jìn)行接收的IT裝 置是因為如果對與網(wǎng)絡(luò)連接的所有IT裝置進(jìn)行管理,則為了管理所需要的管理服務(wù)器的 處理器、存儲器、硬盤等存儲裝置等的消費量就變得龐大,實際上難以進(jìn)行監(jiān)視,所以通過 縮小管理對象來避免上述問題。另外,如果管理工具是商用的,則基本上存在通過管理的IT 裝置的種類或臺數(shù)等限制許可數(shù)量的情況。因此在IT系統(tǒng)中,為了分析事件信息存在操 作管理服務(wù)器N0取得事件信息或者被允許取得的IT裝置(以后,有時表現(xiàn)為被監(jiān)視的IT 裝置、或被管理的IT裝置或管理IT裝置或管理內(nèi)IT裝置或事件取得對象裝置。另外,同 樣的表現(xiàn)對作為IT裝置的實際形態(tài)的計算機、交換器、路由器、存儲裝置也適用)、以及操 作管理服務(wù)器N0不取得事件信息或者被限制取得的IT裝置(以后有時表現(xiàn)為未被監(jiān)視的 IT裝置、或未被管理的IT裝置或非管理的IT裝置或非管理IT裝置或事件關(guān)聯(lián)信息處理裝 置來表示。另外,同樣的表現(xiàn)對作為IT裝置的實際形態(tài)的計算機、交換器、路由器、存儲裝 置也適用)。在操作管理服務(wù)器N0中,關(guān)于未被監(jiān)視/管理的IT裝置,又被分類為在操作管 理服務(wù)器N0中一度被發(fā)現(xiàn)存在、或被確認(rèn)、或被管理的IT裝置;以及在操作管理服務(wù)器N0 中一次也沒被發(fā)現(xiàn)存在、或被確認(rèn)、或被管理的IT裝置。關(guān)于通過操作管理服務(wù)器N0—度 被管理過的IT裝置,或發(fā)現(xiàn)、或確認(rèn)過的IT裝置,雖然無法說與被監(jiān)視/管理的IT裝置等 同,但是也有將通過該發(fā)現(xiàn)或者確認(rèn)而取得的結(jié)構(gòu)信息例如IT裝置的IP地址、或主計算機 名、或FQDN(Fully Qualified Domain Name)等保存在內(nèi)部并進(jìn)行管理的。在本發(fā)明中,定 義為非管理對象的IT裝置包含操作管理服務(wù)器N0不具有對應(yīng)的結(jié)構(gòu)信息的非管理對象 的IT裝置;以及已經(jīng)將對應(yīng)的結(jié)構(gòu)信息中的一部分或全部結(jié)構(gòu)信息存儲在操作管理服務(wù) 器N0中的非管理對象的IT裝置。關(guān)于作為操作管理系統(tǒng)的非管理對象的情況,有管理對象內(nèi)的IT裝置使用如 DNS服務(wù)器那樣提供給全球的服務(wù)的情況;以及由于防火墻、訪問權(quán)限的問題、網(wǎng)絡(luò)結(jié)構(gòu)、 訪問手段的缺陷等原因,操作管理系統(tǒng)無法充分進(jìn)行用于管理的信息的收集的情況。另外,本發(fā)明將網(wǎng)絡(luò)上存在的多個IT裝置之間的相關(guān)分析作為對象。但是,即使 是由于原本具有相關(guān)性的多個裝置為主要原因引起的事件同時發(fā)生時,在各裝置的時鐘中 也會發(fā)生偏差,并且事件信息轉(zhuǎn)發(fā)的時間也發(fā)生偏差,因此,操作管理服務(wù)器N0分析作為 分析對象的事件信息,是對在程序開發(fā)者所預(yù)定的時間寬度(期間)或者在管理者所規(guī)定 的期間內(nèi)所發(fā)生的或所接收的事件信息進(jìn)行分析。另外,即使產(chǎn)生了某種主要原因,有時 也會發(fā)生與該主要原因相關(guān)的事件產(chǎn)生偏差的情況(例如Web服務(wù)或DNS服務(wù)等經(jīng)由高速緩沖存儲處理從服務(wù)器計算機接受預(yù)定的網(wǎng)絡(luò)服務(wù)的情況),因此,需要以期間為對象的分 析,而不是特定的時間。另外,作為事件,期望優(yōu)選的是在某種程度上動態(tài)地發(fā)生的事項。另外,更加優(yōu)選 的是發(fā)生預(yù)定的主要原因從而成為主要原因的IT裝置中的事件發(fā)生(或操作管理服務(wù)器 接收)的時間與受該主要原因的影響而在另外的IT裝置中的事件發(fā)生(或操作管理服務(wù) 器接收)的時間差為在所述期間內(nèi)的事件的主要原因。關(guān)于作為另一方面的結(jié)構(gòu)信息所考慮的信息,優(yōu)選構(gòu)成IT裝置的硬件的種類及 個數(shù)、或為了與該裝置通信所必要的通信識別信息或名稱這樣的信息,雖然能夠通過一部 分IT裝置的管理者進(jìn)行變更,但是優(yōu)選準(zhǔn)靜態(tài)的信息。圖2表示基于上述結(jié)構(gòu)的本發(fā)明中的一個實施方式的概要的處理的流程。在S1中,規(guī)則引擎C1事先讀取相關(guān)分析規(guī)則信息R0,從結(jié)構(gòu)管理C3中取得管理 對象的結(jié)構(gòu)信息T0,再從TO中檢索規(guī)則群R0的應(yīng)用目標(biāo)IT裝置的識別信息,然后存儲到 規(guī)則應(yīng)用目標(biāo)管理表C130中。S1的處理是其后進(jìn)行的由事件引起的故障分析處理的準(zhǔn)備, 只要在分析處理之前進(jìn)行即可。在作為實施方式之一的第一實施方式中,在操作開始前進(jìn) 行分析處理,事先將規(guī)則應(yīng)用目標(biāo)管理表C130保存在規(guī)則存儲器C13內(nèi)。在S2中,通過事件接收部CO等待接收從操作管理系統(tǒng)內(nèi)的管理對象IT裝置發(fā)出 的事件。S3是與操作管理系統(tǒng)的運行操作相關(guān)的、用于確認(rèn)是否已指示停止處理的步驟, 是用于進(jìn)行操作停止的步驟。在S4中,判斷是否已通過事件接收部CO接收到了事件。當(dāng)已接收到時,在S5中 將通過事件接收部CO接收到的事件輸入到事件分析處理部C12,然后根據(jù)規(guī)則應(yīng)用目標(biāo)管 理表C130求出相應(yīng)的規(guī)則,并根據(jù)該規(guī)則確定故障原因。在S5中,將所確定的故障原因輸出到畫面顯示部C14。畫面顯示部C14根據(jù)所接 受的分析結(jié)果輸出數(shù)據(jù)發(fā)送分析信息,由此將操作管理所需要的畫面輸出/顯示到畫面輸 出裝置Ml。另外,作為S2及S4的處理的代替,也可以將接收到的事件信息臨時存儲在事件數(shù) 據(jù)庫中。本發(fā)明的一個效果是在該概要的處理流程中,通過修改規(guī)則應(yīng)用部的處理,就能 夠?qū)Ψ枪芾韺ο蟮腎T裝置的故障原因進(jìn)行分析,而不用大幅度地改變結(jié)構(gòu)或其后的處理 流程。圖3是表示本發(fā)明的實施方式所設(shè)想的IT系統(tǒng)的一個結(jié)構(gòu)的概要圖。圖3的IT 系統(tǒng)由如下裝置構(gòu)成作為操作管理對象的操作管理系統(tǒng),其由管理服務(wù)器NO進(jìn)行操作管 理的計算機mo、計算機mi、計算機m2、作為網(wǎng)絡(luò)交換器的IP交換器N21和FC交換器 N31、以及存儲裝置N40和存儲裝置N41構(gòu)成;作為管理服務(wù)器N0不進(jìn)行管理的非管理對象 的IT裝置的存儲裝置U2和計算機U5 ;以及經(jīng)由路由器N20與網(wǎng)絡(luò)G0連接的存儲裝置U1、 計算機U3和計算機U4。另外,在此所述的計算機、交換器、路由器、存儲裝置等IT裝置的個 數(shù)只是一個例子,在操作管理系統(tǒng)中至少包含具有提供網(wǎng)絡(luò)服務(wù)的服務(wù)器功能的IT裝置 和具有接受提供該網(wǎng)絡(luò)服務(wù)的客戶機功能的IT裝置即可。非管理對象的IT裝置的存儲裝置U1是具備IP-SAN接口的存儲裝置,對管理對象計算機N10提供邏輯卷。另外,非管理對象的存儲裝置U2是具備FC-SAN接口的存儲裝置, 經(jīng)由管理對象FC交換器N31,對管理對象計算機附3提供邏輯卷。非管理對象的IT裝置 的計算機U3或計算機U5是文件服務(wù)器,分別對管理對象計算機mo、Nil兩者公開文件系 統(tǒng),但計算機U3屬于與操作管理系統(tǒng)不同的網(wǎng)絡(luò)區(qū)段(network segment),與計算機U3相 關(guān)的詳細(xì)的信息不能從網(wǎng)絡(luò)上取得。另一方面,計算機TO的文件服務(wù)器與操作管理系統(tǒng)屬于同樣的網(wǎng)絡(luò)區(qū)段,是能夠 通過操作管理系統(tǒng)自動地發(fā)現(xiàn)存在的計算機,是雖然操作時被發(fā)現(xiàn)但沒有成為管理對象的 IT裝置。另外,非管理對象的IT裝置的計算機U4是DNS服務(wù)器,對圖3的IT系統(tǒng)的所有 的IT裝置應(yīng)用名稱解決功能。在此,為了理解,在闡述第一實施方式前,說明如何對管理對象IT裝置應(yīng)用事件 相關(guān)技術(shù)的規(guī)則。圖4是暗示對于圖1所示的IT系統(tǒng),存儲裝置的控制器故障是根本原因的規(guī)則的 例子。如此用于確定故障分析的根本原因的規(guī)則大多根據(jù)事件相關(guān)性,以if-then形式將 預(yù)測為發(fā)生的事件的組合與成為根本原因的故障作為一對來表示。在if-then形式的規(guī)則 表現(xiàn)中,列出“如果if中所述的條件成立,則then部分為真”這樣的意思的規(guī)則。在實施例中,與專家系統(tǒng)等一般性的規(guī)則一樣,用if-then的形式來記述規(guī)則,與 成為規(guī)則的應(yīng)用對象的IT裝置相關(guān)的信息是if 條件部分中預(yù)先定義的信息。另外,規(guī)則 的記述形式本身也可以不是if-then形式,作為能夠確定成為應(yīng)用規(guī)則的對象的IT裝置的 任何的連接/關(guān)系信息,事先定義拓?fù)浼纯?。另外,實際上存儲各規(guī)則的信息是規(guī)則表目。相關(guān)分析規(guī)則信息包含一個以上的 規(guī)則表目。另外,如果更加抽象化,也可以說該規(guī)則表目包含以下的信息(A)表示包含了符合該規(guī)則的事件類別的條件的條件表目。如上所述,該條件表目 中可以將拓?fù)浒瑸闂l件。(B)在符合了該條件時,表示成為原因的事件、以及與該事件相關(guān)的IT裝置或IT 裝置的硬件/軟件的部位的原因表目。作為第一實施例,如圖4所示那樣事先定義了如下規(guī)則使用了 iSCSI的IP-SAN 的存儲裝置的控制器故障為根本原因的規(guī)則R1 ;使用了 Fibre Channel的FC-SAN的存儲 裝置的控制器故障為根本原因的規(guī)則R2 ;文件服務(wù)器故障為根本原因的規(guī)則R3 ;以及網(wǎng)絡(luò) 無法到達(dá)DNS服務(wù)器為根本原因的規(guī)則R4。另外,在圖6中表示了作為針對規(guī)則保存應(yīng)用 該規(guī)則的IT裝置的信息的規(guī)則應(yīng)用目標(biāo)管理表。規(guī)則應(yīng)用目標(biāo)管理表是由欄C101和欄 C102構(gòu)成的信息,不需要是數(shù)據(jù)庫上的圖表,其中欄C101是指示該規(guī)則的識別信息的欄、 欄C102是應(yīng)用目標(biāo)IT裝置的列表的欄,其存儲應(yīng)用該規(guī)則的對象IT裝置的識別信息。另 外,本表狀的數(shù)據(jù)結(jié)構(gòu)可以通過對表進(jìn)行標(biāo)準(zhǔn)化來分割為多個表狀的數(shù)據(jù)結(jié)構(gòu)進(jìn)行管理。圖5表示了對于圖3所示的規(guī)則R1 R4,應(yīng)用各規(guī)則的拓?fù)涞哪J健D5中 的(1)表示表示規(guī)則R1的IF部暗示的連接/關(guān)系信息的拓?fù)?,表示計算機的Computer 具有iScsiInitiator,經(jīng)由表示IP交換器的IpSwitch與表示存儲裝置的Storage的 iScsiTarget連接。iScsiTarget是用于識別iScsilnitiator的連接目的地的iSCSI名, 對計算機具有的連接目的地的iScsiTarget、以及與存儲裝置具有的iScsi的端口的iSCSI 名一致的計算機和存儲裝置的組合應(yīng)用規(guī)則R1。在圖3所示的IT系統(tǒng)中,規(guī)則R1的應(yīng)用
12目標(biāo)IT裝置為如圖6的行L101和L102所示的裝置。另外,關(guān)于圖5中的⑵也同樣,表示如規(guī)則R2的IF部暗示的那樣,計算機具備 FcHba,FcHba經(jīng)由FcSwitch與存儲裝置的PcPort連接。此時,作為具有連接關(guān)系的裝置, 將FcHba具有的連接目的地端口 WWN(ffffN :WorldWide Name)和與FcPortffffN—致的裝置作 為規(guī)則R2的應(yīng)用對象,其中FcPortffffN為存儲裝置的Fibre Channel的端口即FcPort的 WWN。在圖3的IT系統(tǒng)中,作為這些計算機和存儲裝置的組合,規(guī)則R2的應(yīng)用目標(biāo)的IT裝 置為圖6的行L103所示的裝置。關(guān)于圖5中(3),規(guī)則R3的IF部表示文件服務(wù)器-客戶機的拓?fù)洹>哂斜硎景惭b 有文件服務(wù)器的文件系統(tǒng)的信息ImportedFileShare的計算機T31和具有表示對外部公開 文件系統(tǒng)的信息ExportedFileShare的計算機T33經(jīng)由IP交換器T32各自是客戶機-文 件服務(wù)器的關(guān)系。此時,在ImportedFileShareTSll中,作為與安裝源的文件服務(wù)器相關(guān)的 信息,具有文件服務(wù)器的識別信息(IP地址或FQDN(Fully Qualified Domain Name)等) 和所公開的文件系統(tǒng)的公開名,在EXp0rtedFileShareT331中具有所公開的文件系統(tǒng)的場 所和公開名(也稱為共享名)。將通過ImportedFileShare所指的文件服務(wù)器的識別信息表示的計算機、且該 計算機具有ExportedFileShare的信息、ExportedFileShare的公開名與計算機T31的 ImportedFileShare所指的公開名一致的計算機的對作為文件客戶機-文件服務(wù)器的拓?fù)?應(yīng)用規(guī)則R3。因此,在圖3的IT系統(tǒng)中,作為滿足其的組合,規(guī)則R3的應(yīng)用目標(biāo)IT裝置為 圖6的行L104所示的裝置。關(guān)于圖5中的(4),是規(guī)則R4所暗示的DNS服務(wù)器和客戶機的拓?fù)?,提供解決名稱 服務(wù)器的DNS服務(wù)器的計算機T42和通過DNS服務(wù)器解決IP地址和FQDN的名稱的客戶機 計算機T41成為一對,存儲在圖6所示的應(yīng)用目標(biāo)管理表中。針對與記述為這樣規(guī)則的連接或關(guān)系有關(guān)的拓?fù)湫畔⒌慕Y(jié)構(gòu),能夠事先通過系統(tǒng) 被定義,并能根據(jù)規(guī)則描述而被唯一地確定。關(guān)于針對規(guī)則的應(yīng)用目標(biāo)IT裝置,具有圖6的應(yīng)用目標(biāo)管理表,由此能夠通過在 事件發(fā)生時參照該表,判斷事件與哪個規(guī)則相關(guān)聯(lián),從而選擇應(yīng)該應(yīng)用的規(guī)則。以上是針對 管理對象IT裝置的規(guī)則的應(yīng)用方法。圖7及圖21是關(guān)于圖2的規(guī)則應(yīng)用部C11中的步驟S1,將本發(fā)明的一個實施方式 進(jìn)行細(xì)分后的流程圖。根據(jù)該處理流程,假設(shè)圖3的IT系統(tǒng)和圖4的規(guī)則R1 R4來說明 第一實施方式。另外,圖7及圖21的處理全部是在規(guī)則應(yīng)用部中進(jìn)行的。另外,操作管理系 統(tǒng)事先對曾經(jīng)發(fā)現(xiàn)過的IT裝置進(jìn)行存儲,作為能夠判斷為已經(jīng)發(fā)現(xiàn)的IT裝置的前提?;?者,操作管理系統(tǒng)在不具有自動發(fā)現(xiàn)IT系統(tǒng)內(nèi)的IT裝置的功能時,或者,即使具有自動發(fā) 現(xiàn)的功能、卻不具有對所發(fā)現(xiàn)的IT裝置進(jìn)行存儲的功能時,作為不存在已發(fā)現(xiàn)的IT裝置, 進(jìn)行圖7及圖21的處理。(關(guān)于一般的流程的說明及應(yīng)用了規(guī)則R1的情況)在S101中,判斷是否存在要讀取到相關(guān)分析規(guī)則信息R0中的規(guī)則、即不是已讀 取的規(guī)則。判斷的結(jié)果是,如果存在要讀取的規(guī)則(“是”),則遷移到S102。否則(“否” 時),結(jié)束處理。由于要讀取的規(guī)則存在R1 R4,所以在此為“是”、遷移到S102。在S102中,讀取一個規(guī)則,為了表明已讀取,例如加上標(biāo)識,或者作為已讀取的規(guī)則進(jìn)行存儲。在實施方式中,讀取規(guī)則R1,將規(guī)則R1作為已讀取規(guī)則進(jìn)行存儲,然后遷移到 S103。在S103中,求出與規(guī)則中所記述的拓?fù)湫畔?yīng)的IT裝置的檢索條件,然后遷移 到S4。在實施方式中,作為規(guī)則R1的拓?fù)湫畔?,具有iScsilnitiator的計算機、具有通過 iScsiTarget識別的iSCSI的端口的存儲裝置、以及與這些相連接的IP交換器成為應(yīng)用規(guī) 則R1的IT裝置的檢索條件。檢索條件是事先針對規(guī)則的描述而定義的。在S104中,從管理對象IT裝置的結(jié)構(gòu)信息中檢索拓?fù)湫畔⒅械?、客戶機端的IT 裝置。另外,關(guān)于結(jié)構(gòu)信息的檢索,如果管理結(jié)構(gòu)信息的是數(shù)據(jù)庫,則對數(shù)據(jù)庫進(jìn)行檢索,如 果是文件,則對文件進(jìn)行檢索,而作為不管檢索對象的存儲介質(zhì)或裝置等。在實施方式中, 在規(guī)則R1的拓?fù)渲校瑥慕Y(jié)構(gòu)信息中檢索表示客戶機的具有iScsilnitiator的計算機。在 本實施例中,如果計算機WO或計算機mi具有iScsilnitiator,則通過檢索,發(fā)現(xiàn)計算機 N10或計算機mi的識別信息。由于對于多個計算機的情況執(zhí)行S106以后的處理,因此在步驟S105中判斷在通 過檢索所發(fā)現(xiàn)的IT裝置中是否有未選擇的IT裝置。在本實施例中,計算機mo或計算機 Nil為未選擇的IT裝置,因此前進(jìn)到S106。在S106中,從未選擇的IT裝置中選擇一個,作為已選擇。在本實施方式中,選擇 計算機附0,并將計算機N10作為已選擇,前進(jìn)到S107。在107中,取得與在S106中所選擇的IT裝置在拓?fù)渖舷鄬Φ姆?wù)器一側(cè)的IT裝 置的信息。在此,作為服務(wù)器一側(cè)的IT裝置的信息有用于識別服務(wù)器一側(cè)的IT裝置的信 息(IP地址、或者主計算機名、FQDN等)、與提供的服務(wù)有關(guān)的信息(文件服務(wù)器中的公開 文件系統(tǒng)的公開名(也稱為共享名)、或者用于識別存儲裝置的磁盤卷的LUN號碼、或者連 接目的地的iSCSI名、或者FC Port的WWN)。在本實施例中,取得圖8所示的連接目的地 的iSCSI名即CormectedlscsiTarget作為與計算機N10相對的服務(wù)器一側(cè)的存儲裝置的 fn息o在S108中,判斷在與通過S107所取得的服務(wù)器一側(cè)的IT裝置相關(guān)的信息中是否 存在對與該信息對應(yīng)的IT裝置沒有進(jìn)行檢索的,當(dāng)存在(“是”)時,遷移到S109,當(dāng)不存在 時(“否”),遷移到S105。在本實施例中,如圖8所示,至少存在3個未檢索的信息(“是”), 因此遷移到S109。另外,在此,若對圖8中包含的信息進(jìn)行說明,則該信息中具有用于表示IT裝置 (更加具體地講為計算機)的識別信息和該IT裝置為連接目的地的存儲裝置的iSCSI中的 識別信息。在S109中,選擇一個通過S107所取得的服務(wù)器一側(cè)的IT裝置的信息中的、未檢 索的信息。根據(jù)該信息從管理對象的結(jié)構(gòu)信息中檢索服務(wù)器一側(cè)的IT裝置。在本實施例 中,從管理對象的結(jié)構(gòu)信息中檢索存儲裝置,該存儲裝置在iScsiTarget中具有從計算機 N10所取得的如圖8所示的CormectedlscsiTarget的行L201表示的iSCSI名。在S110中,當(dāng)S109的檢索結(jié)果是不存在相當(dāng)于管理對象IT裝置的裝置(“否”) 時,遷移到S111。另一方面,當(dāng)存在相當(dāng)于管理對象IT裝置(“是”)時,成為與通常的規(guī) 則應(yīng)用處理同樣的處理,遷移到S121。在本實施例中,與管理對象存儲裝置的iScsiTarget 有關(guān)的結(jié)構(gòu)信息為圖9所示的信息。此時,如圖9所示那樣,在管理對象中不存在具有與圖
148的L201行的ConnectedlscsiTarget —致的iScsiTarget的存儲裝置,因此遷移到S111。另外,在此對圖9中所包含的信息進(jìn)行說明,該信息中具有用于表示存儲裝置的 識別信息、和該存儲裝置具有的iscsi中的識別信息。另外,在結(jié)構(gòu)信息TO中包含表示針對已經(jīng)發(fā)現(xiàn)的一個以上的IT裝置中的每一個 IT裝置該裝置是否為事件取得對象(即該裝置是否為被監(jiān)視的裝置,換言之,是許可還是 抑制該裝置取得事件)的事件取得可否信息,通過參照該數(shù)據(jù),進(jìn)行S110的判斷。在S111中,判斷是否為已經(jīng)在操作管理系統(tǒng)中發(fā)現(xiàn)過的IT裝置。S卩,在此判斷是 否為在操作管理系統(tǒng)中曾經(jīng)被發(fā)現(xiàn)存在、或者被確認(rèn)過、或者被管理過的IT裝置、并且為 部分地操作管理系統(tǒng)具有靜態(tài)結(jié)構(gòu)信息的IT裝置。在本實施例中,沒有任何具有與圖8的 L201行的ConnectedlscsiTarget—致的iScsiTarget的存儲裝置有關(guān)的結(jié)構(gòu)信息、作為不 是已發(fā)現(xiàn)資源的裝置(“否”),前進(jìn)到S112,。另外,關(guān)于S111的判斷,有通過在結(jié)構(gòu)信息中是否存在與該裝置相關(guān)的信息(例 如,事件取得可否信息)進(jìn)行判別的方法。在S112中,嘗試從非管理的IT裝置中發(fā)現(xiàn)具有與圖8的L201行的 ConnectedlscsiTarget 一致的iScsiTarget的存儲裝置。作為S112的有無非管理IT裝 置的檢索方法的一個例子,有如下方法針對從結(jié)構(gòu)信息中取得、或與成為通過用戶所輸入 的對象的資源對應(yīng)的IP地址或F0DN等通信識別符,或者從結(jié)構(gòu)信息中取得、或?qū)εc包含成 為用戶所輸入的對象的資源的網(wǎng)絡(luò)區(qū)段相對應(yīng)的IP地址即網(wǎng)絡(luò)地址內(nèi)的地址IP地址、或 FQDN等通信識別符,發(fā)送尋求與成為對象的資源相關(guān)的服務(wù)提供的請求,等待有無應(yīng)答來 確認(rèn)存在成為對象的資源。在本實施例中,嘗試從圖3所示的IT系統(tǒng)中發(fā)現(xiàn)。在S113中,判斷通過S112所嘗試的發(fā)現(xiàn)是否已成功。當(dāng)已成功(“是”)時,遷移 到S14。如果沒有成功(“否”),則遷移到S116。在本實施例中,圖3所示的存儲裝置U3作 為相應(yīng)的存儲裝置而被發(fā)現(xiàn),遷移到S114。在S114中,判斷是否能夠?qū)⒃赟113中發(fā)現(xiàn)的IT裝置作為操作管理系統(tǒng)的管理對 象。關(guān)于是否能夠作為管理對象的判斷,通過是否能夠從對象IT裝置中取得為了該操作管 理系統(tǒng)進(jìn)行監(jiān)視/管理而所需要的信息來判斷。關(guān)于為了監(jiān)視/管理所需要的信息,針對 每個操作管理系統(tǒng)有各種信息,但是作為共通的信息是用于識別該IT裝置的信息,例如 IP地址、或WWN(World Wide Name),或任何的唯一的識別信息(號碼)、裝置名(主計算機 名)、FQDN等至少一個以上的信息。另外,期待也能夠在某種程度上取得與構(gòu)成該IT裝置的硬件的種類或個數(shù)相關(guān) 的一個以上的信息。在本發(fā)明中,操作管理服務(wù)器N0具有預(yù)定的判斷基準(zhǔn),根據(jù)該判斷基 準(zhǔn)進(jìn)行該判斷。在本實施例中,作為與存儲裝置U3有關(guān)的信息,該存儲裝置具備iSCSI端 口、能夠取得iScsiTarget的信息作為該iSCSI端口的iSCSI名,并作為判斷為能夠成為管 理對象的裝置,前進(jìn)到S115。另外,因為在后續(xù)的處理中有將該裝置作為管理對象的情況, 因此,也可以在本步驟中,除進(jìn)行確認(rèn)能夠從該IT裝置中接收事件信息的處理外,僅在能 夠確認(rèn)時,前進(jìn)到S115。在S115中,對用戶提示是否將已在S113中發(fā)現(xiàn)的IT裝置作為管理對象。在本實 施例中,提示作為計算機m的存儲裝置服務(wù)器,發(fā)現(xiàn)了存儲裝置U3,以及是否將存儲裝置 U3歸為管理對象。提示畫面為圖10。
15
在S116中,操作管理服務(wù)器NO(尤其是規(guī)則引擎)接收來自管理畫面輸出裝置的 輸入。在S117中,判斷用戶是否將所發(fā)現(xiàn)的IT裝置作為管理對象,作為管理對象(“是”) 時,前進(jìn)到S118,否則(“否”)前進(jìn)到S119。在本實施例中,假設(shè)用戶沒有將存儲裝置U3 作為管理對象,因此前進(jìn)到S119。在S118中,針對用戶進(jìn)行了包含在管理對象中的判斷的IT裝置取得信息,作為管 理對象IT裝置將信息存儲到結(jié)構(gòu)管理中。在本實施例中,在該時刻還沒有來到這些分叉
點o在S119中,將成為與客戶機相對的服務(wù)器作為非管理IT裝置,在非管理IT裝置 管理表中存儲關(guān)于能夠取得的信息,進(jìn)行管理,然后前進(jìn)到S120。在本實施例中,關(guān)于存儲 裝置U3,作為識別裝置的信息,設(shè)為FQDN和存儲裝置的IP端口的iSCSI名即iScsiTarget 能夠取得的信息,并將其存儲到圖11的非管理IT裝置表TL3中。另外,若在此處對圖11進(jìn)行說明,則在非管理IT裝置表TL3中,關(guān)于所發(fā)現(xiàn)的非 管理IT裝置的每一個,包含以下的信息(A)非管理IT裝置的識別信息;(B)作為非管理IT裝置的類別的C401 ;(C)作為非管理IT裝置的通信識別信息的C402 ;(D)作為為了訪問非管理IT裝置的服務(wù)所需要的識別信息的C403。在S120中,對非管理IT裝置的識別信息通過附加能夠明白該IT裝置為非管理的 標(biāo)志,如圖12所示存儲到規(guī)則應(yīng)用目標(biāo)管理表TL1中。在本實施例中,根據(jù)與存儲裝置U3 有關(guān)的非管理IT裝置管理表的信息,將識別信息存儲到規(guī)則應(yīng)用目標(biāo)管理表TL1中。存儲 后,關(guān)于是否存在與所選擇的客戶機一側(cè)相對的服務(wù)器一側(cè)的IT裝置有關(guān)的檢索信息,返 回到S8。在本實施例中,如果返回到S108,則判斷與在S107中所取得的服務(wù)器一側(cè)的存儲 裝置有關(guān)的檢索信息中是否存在未檢索的信息,但因為關(guān)于與計算機N10有關(guān)的服務(wù)器一 側(cè)的存儲裝置有關(guān)的檢索信息存在圖8的L202行,因此遷移到S109。如果遷移到S109,則通過結(jié)構(gòu)管理檢索與L202對應(yīng)的存儲裝置。在實施例中,如 圖9所示,存儲與L202對應(yīng)的存儲裝置,因此可知對應(yīng)L202的IT裝置是管理對象,因此, 在S110中判斷為管理對象IT裝置,遷移到S120。在S120中,作為管理對象IT裝置,將存 儲裝置N40和計算機WO的列表作為規(guī)則R1的應(yīng)用目標(biāo)IT裝置存儲到圖11的規(guī)則應(yīng)用 目標(biāo)管理表的L101中。通過以上的步驟,能夠應(yīng)用規(guī)則R1包括對計算機mo提供邏輯卷的非管理對象的 存儲裝置U1。接下來,使用圖11的規(guī)則應(yīng)用目標(biāo)管理表,作為圖2的S6的一個例子,即在非管 理的存儲裝置U1中發(fā)生了故障時,對將所述存儲裝置U1作為故障的根本原因進(jìn)行畫面顯 示的處理進(jìn)行說明。從存儲裝置U1發(fā)生控制器的故障事件,一旦在圖1的事件分析處理部C12中,當(dāng) 基于圖11的規(guī)則應(yīng)用目標(biāo)管理表根據(jù)規(guī)則的事件相關(guān)性確定了故障的原因部位時,則將 該分析結(jié)果的信息發(fā)送到畫面顯示部C2。在畫面顯示部C2中,根據(jù)圖16的流程來判斷根
16本原因的IT裝置是否為管理對象,并將適當(dāng)?shù)漠嬅骘@示在畫面顯示裝置Ml中。在圖16的步驟601 603中,在畫面顯示部C2中,從規(guī)則引擎C1中取得表示圖 17所示的規(guī)則引擎中的故障分析的結(jié)果的故障分析結(jié)果數(shù)據(jù)D1。另外,規(guī)則引擎C1 (特別 是事件處理分析部C 12)進(jìn)行通過圖2的S4及圖4和圖5所說明的處理。故障分析結(jié)果數(shù)據(jù)D1由包含與故障原因IT裝置有關(guān)的信息的故障原因IT裝置 信息、和與操作管理系統(tǒng)所接受到的管理對象IT裝置的事件有關(guān)的信息即接收事件列表 的數(shù)據(jù)構(gòu)成。故障原因IT裝置信息D11包含表示故障原因IT裝置的信息、和與故障位置 的部位有關(guān)的信息。與故障位置的部位有關(guān)的信息與能夠從作為非管理對象的IT裝置的 故障原因IT裝置中取得怎樣程度的故障信息有關(guān)。當(dāng)根本無法取得故障信息時,如圖17 所示那樣為不明。接收事件列表,在關(guān)于該故障所定義的規(guī)則中,包含作為與有關(guān)聯(lián)的接 收事件有關(guān)的信息的、作為與接收事件的發(fā)送源有關(guān)的信息的接收事件發(fā)送源;以及表示 與事件的內(nèi)容有關(guān)的信息的事件類別。在S604中,根據(jù)所取得的故障分析結(jié)果數(shù)據(jù)D11的故障原因IT裝置的信息判斷 是管理對象還是非管理對象。在本實施例中,因為是非管理對象的IT裝置,所以前進(jìn)到 S605。在S605中,根據(jù)故障分析結(jié)果數(shù)據(jù)D11的故障原因IT裝置的信息來檢索圖11的 非管理IT裝置管理表,取得與該非管理IT裝置有關(guān)的信息,前進(jìn)到S606。在本實施例中, 關(guān)于存儲裝置U1,從圖11的L401中取得。在S606中,包含通過S605所取得的信息,將發(fā)生的故障的根本原因為非管理的 IT裝置是原因顯示到畫面上。關(guān)于此時的畫面的結(jié)構(gòu)例,如圖18所示那樣,將包含了如 下信息的窗口或?qū)υ捒虻蕊@示畫面輸出到畫面輸出裝置Ml 傳達(dá)非管理IT裝置為故障的 根本原因的消息;對于故障原因進(jìn)行分析而得的結(jié)果即故障分析結(jié)果;以及操作管理系統(tǒng) 對于所發(fā)生的故障正在進(jìn)行檢測的故障信息,例如正在接收的事件等。關(guān)于作為本實施例 的非管理IT裝置的存儲裝置U1的故障為根本原因的例子中的顯示畫面例為如圖19所示 那樣。例如是包含如下內(nèi)容的畫面顯示知道故障原因IT裝置為非管理對象的信息,該 IT裝置的類別是什么、例如是IP-SAN存儲裝置,作為IT裝置的識別信息、例如IP地址為 192. 168. 100. 15。通過以上的步驟,能夠在非管理對象IT裝置的存儲裝置U1中發(fā)生故障時,對于由 非管理對象所引起如規(guī)則R1那樣的IP-SAN存儲裝置的故障情況也能夠應(yīng)用,能夠在畫面 上顯示根本原因是非管理對象的IP-SAN存儲裝置。(關(guān)于規(guī)則R2的處理流程)關(guān)于規(guī)則R2,根據(jù)以圖3的IT系統(tǒng)為對象的實施例對流程進(jìn)行說明。在S101中,因為有規(guī)則R2,所以前進(jìn)到S102,在S102中讀取規(guī)則R2,并給R2附加 已讀取的標(biāo)志。在S103中,關(guān)于規(guī)則R2中所記述的拓?fù)湫畔?,作為圖4中的(2)的FC-SAN 拓?fù)?,將在客戶機一側(cè)具有Fibre Channel的Host Bus Adapter即FcHbaT211的計算機 T21經(jīng)由FC交換器T22與在服務(wù)器一側(cè)具有Fibre Channel端口即FcPortT231的存儲裝 置T23連接的拓?fù)涠闄z索條件。在S104中,作為客戶機一側(cè)的IT裝置,設(shè)為發(fā)現(xiàn)具有FcHba的計算機即計算機 N13。
在S105中,因為計算機附3為未選擇的IT裝置,所以前進(jìn)到S106。在S107中,如圖13所示,從計算機N13收集表示FCPort的WWN的 ConnectedFcPortffffN C502,該FCPort是連接目的地服務(wù)器一側(cè)的存儲裝置的 FibreChannel 端 口。另外,當(dāng)說明圖13的FC-SAN存儲裝置的連接信息時,作為與每個IT裝置對應(yīng)的 信息包含連接目的地存儲裝置具有的FibreChannel的識別信息。在S108中,關(guān)于與計算機附3中的連接目的地的存儲裝置有關(guān)的檢索信息即 ConnectedFcPortffffN,是未檢索的,因此前進(jìn)到S109。在S109中,使用行L501的C502的值作為通過計算機N13所取得的 ConnectedFcPortffffN,在結(jié)構(gòu)管理中檢索在FCPort的WWN中具有該WWN的存儲裝置。在S110中,因為S109檢索的結(jié)果是如圖14所示在管理對象的結(jié)構(gòu)信息中不存在 具有將圖13的行L501的C502的值作為FCPort的WWN的存儲裝置,因此前進(jìn)到S111。另外,在此對圖14中包含的信息進(jìn)行說明,在該信息中具有用于表示存儲裝置 的識別信息、和該存儲裝置具有的FibreChannel中的通信識別信息。在S111中,因為在已發(fā)現(xiàn)的存儲裝置中,發(fā)現(xiàn)了具有將圖13的行L501的C502的 值作為FCPort的WWN的存儲裝置U2,所以前進(jìn)到S115。在S115中,顯示提議將已發(fā)現(xiàn)的存儲裝置U2包含在管理內(nèi)的畫面。雖然圖10是 規(guī)則R1中的畫面顯示例,但是顯示畫面的結(jié)構(gòu)基本相同,只是將消息的內(nèi)容替換為實際的 IT裝置的內(nèi)容。在S116中,從管理者接收存儲裝置U2的識別信息和將該裝置作為管理對象的指 /J^fn 息。在S117中,確認(rèn)用戶是否已包含在管理對象中,因為在本實施例中為已包含在管 理對象中,所以前進(jìn)到S118。在S118中,關(guān)于作為管理對象新追加的存儲裝置U2,收集作為管理對象IT裝置需 要取得的信息。作為管理對象取得的信息為事件信息和結(jié)構(gòu)管理信息。在S121中,將存儲裝置U2作為管理對象IT裝置,與計算機W4 —起作為規(guī)則R2 的應(yīng)用目標(biāo)IT裝置,登錄到規(guī)則應(yīng)用目標(biāo)管理表中。在該種情況的例子中,登錄到由圖12 所示的規(guī)則的欄C101、和存儲成為該規(guī)則的應(yīng)用目標(biāo)的IT裝置列表的欄C102構(gòu)成的表狀 的數(shù)據(jù)結(jié)構(gòu)中。通過如上所述,關(guān)于規(guī)則R2,能夠通過現(xiàn)有的規(guī)則庫的事件相關(guān)性進(jìn)行作為非管 理對象的IT裝置的FC-SAN存儲裝置的故障分析。另外,根據(jù)故障分析的結(jié)果數(shù)據(jù),關(guān)于當(dāng)作為非管理對象的IT裝置的FC-SAN存儲 裝置為故障的根本原因時輸出畫面顯示的處理,與規(guī)則R1的非管理對象的IP-SAN存儲裝 置為故障的根本原因時進(jìn)行畫面顯示的處理一樣在圖16的步驟進(jìn)行。通過上述的處理步驟,在非管理對象的IT裝置的存儲裝置U2中發(fā)生了故障時,對 于由非管理對象引起如規(guī)則R2的FC-SAN存儲裝置的故障,也能夠應(yīng)用規(guī)則R2,并能夠在畫 面上顯示根本原因是非管理對象的FC-SAN存儲裝置。(關(guān)于規(guī)則R3的處理流程)關(guān)于規(guī)則R3,根據(jù)以圖3的IT系統(tǒng)為對象的實施例對流程進(jìn)行說明。
18
在S101中,因為有規(guī)則R3,所以前進(jìn)到S102,在S102中讀取規(guī)則R3,并 給R103附加已讀取的標(biāo)志。在S103中,關(guān)于規(guī)則R3中所記述的拓?fù)湫畔?,作?圖4中的(3)的文件服務(wù)器/客戶機的拓?fù)?,將在客戶機一側(cè)具有表示安裝有已公 開的文件系統(tǒng)的Imp0rtedFileShareT311的計算機T31經(jīng)由IP交換器T32與在服 務(wù)器一側(cè)具有EXp0rtedFileShareT331的計算機T33連接的拓?fù)涠闄z索條件,該 ExportedFileShareT331表示具有在其它的計算機中公開的文件系統(tǒng)。在S104中,作為圖4中的(3)的拓?fù)涞目蛻魴C一側(cè)的IT裝置,設(shè)為發(fā)現(xiàn)圖3的計 算機mo。在S105中,作為檢索到的客戶機一側(cè)的IT裝置有計算機附0,因為是未選擇,所以 前進(jìn)到S106。在S106中,選擇圖3的計算機N10作為未選擇的客戶機一側(cè)的IT裝置,并設(shè)定為 已選擇。在S107中,取得表示安裝了哪個文件服務(wù)器的公開文件系統(tǒng)的 ImportedFileShare的信息作為計算機的檢索信息,該計算機作為圖4中的(3)的拓?fù)涞姆?務(wù)器一側(cè)的IT裝置、與計算機N10相對。作為管理從客戶機一側(cè)取得的、與文件服務(wù)器有 關(guān)的信息的表,通過包含圖15所示的客戶機一側(cè)的計算機的欄C701、與欄C701對應(yīng)的文件 服務(wù)器有關(guān)的識別信息的欄C702、以及與文件服務(wù)器的公開名有關(guān)的欄C703的數(shù)據(jù)結(jié)構(gòu), 例如通過表等進(jìn)行管理。另外,從客戶機取得的與文件服務(wù)器有關(guān)的信息可以作為結(jié)構(gòu)信 息事先通過圖15的表取得完成,也可以在S7的處理中從客戶機一側(cè)的IT裝置取得。艮口, 取得的時刻在S107的處理完成之前進(jìn)行即可。另外,在此對圖15中包含的信息進(jìn)行說明,在該信息中針對每個文件服務(wù)器包含 以下的信息(A)作為文件服務(wù)器的IT裝置的識別信息;(B)作為一個以上文件服務(wù)器的識別信息和公開名。在S108中,通過S107所取得的與客戶機一側(cè)的文件服務(wù)器有關(guān)的信息為圖15的 L701,因為是未檢索,所以前進(jìn)到S9。在S109中,檢索具有圖15的行L701的文件服務(wù)器的識別信息的欄C702的值,即 檢索具有稱為exp0rtfs. domain2. com的FQDN的IT裝置。在SI 10中,因為在管理對象的結(jié)構(gòu)信息TO中不存在具有稱為exportfs. domain2. com的FQDN的計算機,所以前進(jìn)到S111。在S111中,因為在已發(fā)現(xiàn)資源中不存在具有稱為exportfs. domain2. com的FQDN 的計算機,所以前進(jìn)到S112。在S112中,嘗試發(fā)現(xiàn)稱為exportfs. domain2. com的計算機。關(guān)于發(fā)現(xiàn),詢問DNS 服務(wù)器來解決IP地址,然后通過Ping對是否存在該IP地址進(jìn)行確認(rèn),再通過telnet、 或ssh、或Windows (注冊商標(biāo))的遠(yuǎn)程連接等來嘗試訪問。在本實施例中,成功返回針對 exportfs. domain2. com對應(yīng)的IP地址的ping,因此能夠確認(rèn)存在該IP地址,但是,因為沒 有該服務(wù)器的認(rèn)證信息,所以其他的訪問失敗,無法登錄,前進(jìn)到S114。在S114中,雖然所發(fā)現(xiàn)的exportfs. domain2. com的計算機返回通過ping的應(yīng) 答,但無法取得其以外的信息,無法成為管理對象,因此前進(jìn)到S119。
在SI 19中,將exportfs. domain2. com的計算機登錄到圖11的非管理IT裝置管 理表中。具體來講,如圖10的L403所示,存儲文件服務(wù)器識別信息和服務(wù)識別信息中在客 戶機一側(cè)所取得的信息。在S120中,生成針對由客戶機一側(cè)的計算機N10和exportfs. domain2. com的計 算機U組成的對的規(guī)則應(yīng)用信息。具體來講,如圖12的L107所示,針對規(guī)則R3,將計算機 N10和作為非管理IT裝置的計算機U3登錄到應(yīng)用目標(biāo)IT裝置列表中。通過如上所述,也能夠?qū)ψ鳛橛嬎銠Cmo的文件服務(wù)器的非管理的IT裝置即計算 機U3進(jìn)行故障分析。同樣,通過S101 S104的步驟,說明關(guān)于規(guī)則R3、作為客戶機一側(cè)的IT裝置發(fā)現(xiàn) 了計算機mi時的實施方式的處理流程。通過S105 S107的步驟,作為與計算機Nil相對的文件服務(wù)器取得如圖15的 L703的行所示的文件服務(wù)器的信息。在S109中,因為沒有在管理對象IT裝置中發(fā)現(xiàn)圖15 的行L703所示的文件服務(wù)器,所以前進(jìn)到S111。在S111中,因為在已發(fā)現(xiàn)的資源中存在具 有圖15的行L703所示的IP地址的計算機TO,所以前進(jìn)到S115。在S115中,顯示提議將計算機TO包含在管理對象中的畫面,通過S116接收用戶 將計算機U5作為管理對象的指示作為用戶輸入。在S117中,因為接收到了 S116用戶將計算機U5作為管理對象的指示,所以前進(jìn) 到 S118。在S118中,在作為已發(fā)現(xiàn)資源而保存的IT裝置的識別信息、用于訪問的信息以 外、還取得包含計算機U5的連接裝置的結(jié)構(gòu)信息、工作狀態(tài)以及性能信息的監(jiān)視信息作為 將計算機U5作為管理對象的信息,存儲到結(jié)構(gòu)管理C3的管理對象的結(jié)構(gòu)信息T0中。在S121中,作為圖12的行L108那樣的數(shù)據(jù)結(jié)構(gòu)存儲到規(guī)則存儲器中,以便能夠 對作為管理內(nèi)IT裝置把計算機Nil作為客戶機、把計算機TO作為文件服務(wù)器的拓?fù)鋺?yīng)用 規(guī)則R3。通過上述的處理,能夠根據(jù)圖2的流程對已發(fā)現(xiàn)的IT裝置、且為非管理對象的文 件服務(wù)器的計算機U5進(jìn)行故障分析,能夠通過在畫面顯示部C2中進(jìn)行圖16的流程,將故 障原因輸出到畫面顯示裝置Ml中。(關(guān)于規(guī)則R4的處理流程)關(guān)于R4,根據(jù)以圖3的IT系統(tǒng)為對象的實施例對流程進(jìn)行說明。關(guān)于規(guī)則R4,作為客戶機一側(cè)的IT裝置,能夠通過S101 S104的步驟發(fā)現(xiàn)計算 機mo。作為針對計算機mo的DNS服務(wù)器的檢索信息,能夠通過S105 S107的步驟從 計算機WO取得DNS服務(wù)器的IP地址192. 168. 100. 1。通過S108 S110的步驟,使用所 取得的IP地址192. 168. 100. 1來確認(rèn)在結(jié)構(gòu)管理C3的管理對象的結(jié)構(gòu)信息T0中不存在 DNS服務(wù)器,然后前進(jìn)到S111。在S111中判斷DNS服務(wù)器不是已發(fā)現(xiàn)IT裝置,然后前進(jìn)到 S112,在S112中嘗試從實際IT系統(tǒng)對IP地址192. 168. 100. 1的節(jié)點的訪問。雖然訪問的 結(jié)果是確認(rèn)通過ping能夠到達(dá)網(wǎng)絡(luò),但是因為不具有認(rèn)證信息,所以無法登錄,在S114中 判斷為無法作為管理對象,前進(jìn)到S119。在S119中,將IP地址192. 168. 100. 1的計算機 作為非管理對象IT裝置,如圖11的L404所示那樣作為DNS服務(wù)器,通過識別信息U4來存 儲/管理信息,然后前進(jìn)到S120。在S120中,將客戶機的計算機N10和DNS服務(wù)器即非管
20理IT裝置的計算機U4作為規(guī)則R4的應(yīng)用目標(biāo)IT裝置列表,如圖12的行L109那樣進(jìn)行存儲。通過以上的步驟,能夠根據(jù)現(xiàn)有的規(guī)則的事件相關(guān)性進(jìn)行作為非管理的DNS服務(wù) 器的計算機U4的故障分析,能夠確定非管理的DNS服務(wù)器是故障原因。關(guān)于針對圖3中的其它IT裝置的規(guī)則R4的應(yīng)用,也同樣能夠通過針對作為非管 理的DNS服務(wù)器的計算機U4生成應(yīng)用信息來進(jìn)行。另外,能夠與其它的規(guī)則的實施例一樣、通過在畫面顯示部C2中進(jìn)行圖16的流 程,將作為非管理的IT裝置的DNS服務(wù)器是故障的根本原因顯示在畫面上。(實施例2)關(guān)于本發(fā)明的第二實施方式,通過如圖20所示那樣,將生成規(guī)則應(yīng)用部CI 1中的 應(yīng)用信息的步驟S4b放在事件接收的步驟S3b之后、且在事件分析部C12中的事件分析處 理的步驟S5b之前的步驟來進(jìn)行在第一實施方式中、如圖2所示的故障分析的全體處理流 程的處理步驟。該第二實施方式和第一實施方式的區(qū)別僅僅是生成規(guī)則的應(yīng)用信息的時刻不同。如上述那樣,即使改變規(guī)則的應(yīng)用信息的時刻來實施本發(fā)明,也能夠?qū)⒎枪芾韺?象的IT裝置為故障的根本原因裝置顯示到畫面上,而不會損害該發(fā)明的效果。以上描述的程序,其用于實現(xiàn)根據(jù)本申請說明書的實施例1和實施例2的、與多個 信息處理裝置和畫面輸出裝置連接且具有處理器和存儲器的操作管理服務(wù)器中的、事件的 分析,該事件發(fā)生在所述多個信息處理裝置中,該程序具有下述處理的一部分或者全部(a)結(jié)構(gòu)信息存儲處理,為了所述多個信息處理裝置中的每一個信息處理裝置作 為客戶機來使用網(wǎng)絡(luò)服務(wù),而將作為訪問對象的所述多個信息處理裝置中的一部分信息處 理裝置即服務(wù)器裝置的識別信息存儲到所述存儲器具有的結(jié)構(gòu)信息中;(b)登錄處理,將作為所述操作管理服務(wù)器取得事件信息的對象的多個事件取得 對象裝置登錄到所述存儲器具有的結(jié)構(gòu)信息中,該多個事件取得對象裝置是所述多個信息 處理裝置中的一部分;(c)規(guī)則存儲處理,當(dāng)檢測到在所述多個信息處理裝置中發(fā)生的包含與所述網(wǎng)絡(luò) 服務(wù)相關(guān)聯(lián)的第一事件類別的事件和包含不同于與所述網(wǎng)絡(luò)服務(wù)相關(guān)聯(lián)的所述第一事件 類別的第二事件類別的事件時,將表示因與所述第二事件類別對應(yīng)的事件發(fā)生而可能導(dǎo)致 與所述第一事件類別對應(yīng)的事件發(fā)生的相關(guān)分析規(guī)則信息存儲到所述存儲器中;(d)事件存儲處理,將從所述多個事件取得對象裝置收集到的多個所述事件信息 存儲到所述存儲器中;(e)事件信息確定處理,根據(jù)所述相關(guān)分析規(guī)則信息,從存儲于所述存儲器的多個 所述事件信息中確定包含所述第一事件類別的第一事件信息;(f)主要原因確定處理,根據(jù)所述結(jié)構(gòu)信息來確定作為已發(fā)送了所述第一事件 信息的事件取得對象裝置中之一的第一事件取得對象裝置、以及與所述第一事件類別對應(yīng) 的所述網(wǎng)絡(luò)服務(wù)中的所述第一事件取得對象裝置的服務(wù)器裝置即故障主要原因裝置;(g)分析結(jié)果發(fā)送處理,根據(jù)所述相關(guān)分析規(guī)則信息和所述結(jié)構(gòu)信息,當(dāng)所述故障 主要原因裝置不是所述多個事件取得對象裝置時,向所述畫面輸出裝置發(fā)送用于確定所述 第一事件取得對象裝置、所述第一事件類別、所述故障主要原因裝置以及所述第二事件類
21別的信息,由此,使所述畫面輸出裝置顯示關(guān)于在所述第一事件取得對象裝置中所發(fā)生的 與所述第一事件信息對應(yīng)的事件,推定為在所述故障主要原因裝置中發(fā)生所述第二事件類 別的事件是主要原因。另外,所述相關(guān)分析規(guī)則信息包含拓?fù)錀l件信息,該拓?fù)錀l件信息表示在發(fā)生了 所述第一事件類別的作為所述多個信息處理裝置中之一的第一信息處理裝置和發(fā)生了所 述第二事件類別的作為所述多個信息處理裝置中之一的第二信息處理裝置之間的拓?fù)錀l 件,所述主要原因確定步驟也可以根據(jù)所述拓?fù)錀l件信息來確定所述故障主要原因裝置。 因為通過這樣的處理能夠?qū)l(fā)生了事件的信息處理裝置限定在實際上正在使用的信息處 理裝置中并由此提示推測,所以對操作管理服務(wù)器的使用者來講便利性更高。另外,操作管理服務(wù)器也可以具有以下的處理。(h)關(guān)聯(lián)裝置確定處理,根據(jù)所述相關(guān)分析規(guī)則信息和所述結(jié)構(gòu)信息,來確定作為 所述多個事件取得對象裝置的服務(wù)器裝置的、不包含在所述多個事件取得對象裝置中的、 作為所述多個信息處理裝置中一部分的事件關(guān)聯(lián)信息處理裝置;(i)事件信息取得可否調(diào)查處理,對是否能夠從所述事件關(guān)聯(lián)信息處理裝置中取 得事件信息進(jìn)行調(diào)查;(j)事件信息取得對象追加提議處理,在根據(jù)所述調(diào)查結(jié)果能夠從所述事件關(guān)聯(lián) 信息處理裝置中取得事件信息時,向所述畫面輸出裝置發(fā)送用于確定所述事件關(guān)聯(lián)信息處 理裝置的信息,由此使所述畫面輸出裝置顯示能夠從所述事件關(guān)聯(lián)信息處理裝置中取得事 件{曰息。這樣的處理,通過信息處理裝置的管理者或者管理方法的變更,能夠從操作管理 服務(wù)器中需要重新監(jiān)視事件或者能夠監(jiān)視事件的時刻開始,迅速地催促登錄到操作管理服 務(wù)器,而不忘記登錄。另外,所述事件信息取得可否調(diào)查處理也可以是基于所述操作管理服務(wù)器根據(jù) 預(yù)定的步驟對作為所述多個信息處理裝置、具有在事先作為調(diào)查范圍所設(shè)定的IP地址的 范圍中包含的IP地址的信息處理裝置進(jìn)行訪問而得的結(jié)果。有時為了防止對信息處理裝 置(特別是經(jīng)由網(wǎng)絡(luò)進(jìn)行訪問的服務(wù)器計算機)非法訪問或者非法攻擊,而監(jiān)視來自該裝 置外部的訪問的情況,有時也會把通過監(jiān)視訪問將通過該調(diào)查處理進(jìn)行訪問的情況視為非 法訪問或非法攻擊。因此,通過確定明顯不是事件監(jiān)視對象的信息處理裝置的IP地址、或 者可能成為事件監(jiān)視對象的信息處理裝置的IP地址的范圍,能夠抑制這樣的被誤認(rèn)為非 法訪問或非法攻擊的通信。另外,所述故障主要原因裝置是具有控制器、提供邏輯卷的存儲裝置,所述網(wǎng)絡(luò)服 務(wù)是根據(jù)塊訪問形式的協(xié)議(例如有FibreCharmel、iSCSI)來提供所述邏輯卷的服務(wù),所 述第一事件類別可以是所述存儲裝置發(fā)生故障,所述第一事件類別也可以是像所述邏輯卷 的訪問失敗。另外,所述故障主要原因裝置是將DNS作為網(wǎng)絡(luò)服務(wù)來提供的計算機,所述第一 事件類別可以是DNS請求失敗,所述第一事件類別也可以是DNS服務(wù)器通信中斷。另外,所述故障主要原因裝置是具有從所述多個信息處理裝置中的至少一個信息 處理裝置接收數(shù)據(jù)的NIC、向所述多個信息處理裝置中的至少一個信息處理裝置提供所存 儲的文件的文件服務(wù)器計算機,所述網(wǎng)絡(luò)服務(wù)是將所述文件服務(wù)器計算機所存儲的文件共享的網(wǎng)絡(luò)文件共享服務(wù),所述第一事件類別可以是所述文件服務(wù)器發(fā)生故障(例如NIC發(fā) 生故障、文件服務(wù)器具有的處理器執(zhí)行的軟件發(fā)生問題、發(fā)生其它文件服務(wù)器的通信功能 停止的故障),所述第一事件類別也可以是對由所述網(wǎng)絡(luò)文件共享服務(wù)所提供的文件的訪 問失敗。另外,也可以根據(jù)所述相關(guān)分析規(guī)則信息和所述結(jié)構(gòu)信息,在所述故障主要原因 裝置是所述多個事件取得對象裝置中之一時,從多個所述事件信息中確定包含所述第二事 件類別、且所述故障主要原因裝置為取得源的第二事件信息,并向所述畫面輸出裝置發(fā)送 用于確定所述第一事件取得對象裝置、所述第一事件信息、所述故障主要原因裝置以及所 述第二事件信息的信息,由此,使所述畫面輸出裝置顯示關(guān)于與在所述第一事件取得對象 裝置中所發(fā)生的所述第一事件信息對應(yīng)的事件,發(fā)生與在所述故障主要原因裝置中所發(fā)生 的所述第二事件信息對應(yīng)的事件是主要原因。另外,所述第一信息處理裝置是計算機,所述第二信息處理裝置是存儲裝置,所述 拓?fù)錀l件信息也可以包含表示連接所述計算機和所述存儲裝置的拓?fù)溥B接關(guān)系的、與所 述計算機對應(yīng)的通信識別信息和與所述存儲裝置對應(yīng)的通信識別信息的組合。另外,將 iSCSI名、IP地址、以及FibreChannel中的WffN中的至少一個作為這些通信識別信息。另外,所述第一信息處理裝置是計算機,所述第二信息處理裝置是通過文件共享 服務(wù)向所述多個信息處理裝置提供所存儲的文件的文件服務(wù)器計算機,所述拓?fù)錀l件信息 也可以包含表示連接所述計算機和所述文件服務(wù)器計算機的拓?fù)溥B接關(guān)系的、與所述計 算機對應(yīng)的通信識別信息和與所述文件服務(wù)器計算機對應(yīng)的通信識別信息或者公開所述 文件的輸出名的組合。另外,所述第一信息處理裝置是計算機,所述第二信息處理裝置是作為網(wǎng)絡(luò)共享 服務(wù)對所述多個信息處理裝置提供DNS的DNS服務(wù)器計算機,所述拓?fù)錀l件信息也可以包 含表示連接所述計算機和所述DNS服務(wù)器計算機的拓?fù)溥B接關(guān)系的、與所述計算機對應(yīng) 的通信識別信息和與所述DNS服務(wù)器計算機對應(yīng)的通信識別信息的組合。另外,與所述計 算機對應(yīng)的通信識別信息和與所述DNS服務(wù)器計算機對應(yīng)的通信識別信息是IP地址或 FQDN。并且,所述操作管理服務(wù)器可以由一個以上的計算機構(gòu)成。
2權(quán)利要求
一種操作管理服務(wù)器中的事件分析方法,該操作管理服務(wù)器與多個信息處理裝置和畫面輸出裝置連接、且具有處理器和存儲器,該事件發(fā)生在所述多個信息處理裝置中,該事件分析方法的特征在于,具有以下步驟結(jié)構(gòu)信息存儲步驟,為了所述多個信息處理裝置中的每一個信息處理裝置作為客戶機來使用網(wǎng)絡(luò)服務(wù),而將作為訪問對象的所述多個信息處理裝置中的一部分信息處理裝置即服務(wù)器裝置的識別信息存儲到所述存儲器具有的結(jié)構(gòu)信息中;登錄步驟,將作為所述操作管理服務(wù)器取得事件信息的對象的多個事件取得對象裝置登錄到所述存儲器具有的結(jié)構(gòu)信息中,該多個事件取得對象裝置是所述多個信息處理裝置中的一部分;規(guī)則存儲步驟,當(dāng)檢測到在所述多個信息處理裝置中發(fā)生的包含與所述網(wǎng)絡(luò)服務(wù)相關(guān)聯(lián)的第一事件類別的事件和包含不同于與所述網(wǎng)絡(luò)服務(wù)相關(guān)聯(lián)的所述第一事件類別的第二事件類別的事件時,將表示因與所述第二事件類別對應(yīng)的事件發(fā)生而可能導(dǎo)致與所述第一事件類別對應(yīng)的事件發(fā)生的相關(guān)分析規(guī)則信息存儲到所述存儲器中;事件存儲步驟,將從所述多個事件取得對象裝置收集到的多個所述事件信息存儲到所述存儲器中;事件信息確定步驟,根據(jù)所述相關(guān)分析規(guī)則信息,從存儲于所述存儲器的多個所述事件信息中確定包含所述第一事件類別的第一事件信息;主要原因確定步驟,根據(jù)所述結(jié)構(gòu)信息來確定作為已發(fā)送了所述第一事件信息的事件取得對象裝置中之一的第一事件取得對象裝置、以及與所述第一事件類別對應(yīng)的所述網(wǎng)絡(luò)服務(wù)中的所述第一事件取得對象裝置的服務(wù)器裝置即故障主要原因裝置;以及分析結(jié)果發(fā)送步驟,根據(jù)所述相關(guān)分析規(guī)則信息和所述結(jié)構(gòu)信息,當(dāng)所述故障主要原因裝置不是所述多個事件取得對象裝置時,向所述畫面輸出裝置發(fā)送用于確定所述第一事件取得對象裝置、所述第一事件類別、所述故障主要原因裝置以及所述第二事件類別的信息,由此,使所述畫面輸出裝置顯示關(guān)于在所述第一事件取得對象裝置中所發(fā)生的與所述第一事件信息對應(yīng)的事件,推定為在所述故障主要原因裝置中發(fā)生所述第二事件類別的事件是主要原因。
2.根據(jù)權(quán)利要求1所述的事件分析方法,其特征在于,所述相關(guān)分析規(guī)則信息包含拓?fù)錀l件信息,該拓?fù)錀l件信息表示在發(fā)生了所述第一事 件類別的作為所述多個信息處理裝置中之一的第一信息處理裝置和發(fā)生了所述第二事件 類別的作為所述多個信息處理裝置中之一的第二信息處理裝置之間的拓?fù)錀l件,所述主要原因確定步驟,根據(jù)所述拓?fù)錀l件信息來確定所述故障主要原因裝置。
3.根據(jù)權(quán)利要求2所述的事件分析方法,其特征在于,具有關(guān)聯(lián)裝置確定步驟,根據(jù)所述相關(guān)分析規(guī)則信息和所述結(jié)構(gòu)信息,來確定作為所述多 個事件取得對象裝置的服務(wù)器裝置的、不包含在所述多個事件取得對象裝置中的、作為所 述多個信息處理裝置中一部分的事件關(guān)聯(lián)信息處理裝置;事件信息取得可否調(diào)查步驟,對是否能夠從所述事件關(guān)聯(lián)信息處理裝置中取得事件信 息進(jìn)行調(diào)查;以及事件信息取得對象追加提議步驟,在根據(jù)所述調(diào)查結(jié)果能夠從所述事件關(guān)聯(lián)信息處理 裝置中取得事件信息時,向所述畫面輸出裝置發(fā)送用于確定所述事件關(guān)聯(lián)信息處理裝置的信息,由此使所述畫面輸出裝置顯示能夠從所述事件關(guān)聯(lián)信息處理裝置中取得事件信息。
4.根據(jù)權(quán)利要求3所述的事件分析方法,其特征在于, 所述事件信息取得可否調(diào)查步驟是基于所述操作管理服務(wù)器根據(jù)預(yù)定的步驟對作為 所述多個信息處理裝置、具有在事先作為調(diào)查范圍所設(shè)定的IP地址的范圍中包含的IP地 址的信息處理裝置進(jìn)行訪問而得的結(jié)果。
5.根據(jù)權(quán)利要求1所述的事件分析方法,其特征在于,所述故障主要原因裝置是具有控制器、并提供邏輯卷的存儲裝置,所述網(wǎng)絡(luò)服務(wù)是根據(jù)塊訪問形式的協(xié)議來提供所述邏輯卷的服務(wù),所述第一事件類別是所述存儲裝置發(fā)生故障,所述第一事件類別是向所述邏輯卷的訪 問失敗。
6.根據(jù)權(quán)利要求5所述的事件分析方法,其特征在于,所述塊訪問形式的協(xié)議是FibreCharmel或者iSCSI。
7.根據(jù)權(quán)利要求1所述的事件分析方法,其特征在于,所述故障主要原因裝置是將DNS作為網(wǎng)絡(luò)服務(wù)來提供的計算機,所述第一事件類別是 DNS請求失敗,所述第一事件類別是DNS服務(wù)器通信中斷。
8.根據(jù)權(quán)利要求1所述的事件分析方法,其特征在于,所述故障主要原因裝置是對所述多個信息處理裝置中至少一個提供已存儲的文件的 文件服務(wù)器計算機,所述網(wǎng)絡(luò)服務(wù)是將所述文件服務(wù)器計算機所存儲的文件共享的網(wǎng)絡(luò)文件共享服務(wù),所述第一事件類別是所述文件服務(wù)器計算機發(fā)生故障,所述第一事件類別是對由所述 網(wǎng)絡(luò)文件共享服務(wù)所提供的文件的訪問失敗。
9.根據(jù)權(quán)利要求1所述的事件分析方法,其特征在于,具有第二分析結(jié)果發(fā)送步驟,根據(jù)所述相關(guān)分析規(guī)則信息和所述結(jié)構(gòu)信息,在所述故障主 要原因裝置是所述多個事件取得對象裝置中之一時,從多個所述事件信息中確定包含所述 第二事件類別、且所述故障主要原因裝置為取得源的第二事件信息,并向所述畫面輸出裝 置發(fā)送用于確定所述第一事件取得對象裝置、所述第一事件信息、所述故障主要原因裝置 以及所述第二事件信息的信息,由此,使所述畫面輸出裝置顯示關(guān)于與在所述第一事件取 得對象裝置中所發(fā)生的所述第一事件信息對應(yīng)的事件,發(fā)生與在所述故障主要原因裝置中 所發(fā)生的所述第二事件信息對應(yīng)的事件是主要原因。
10.根據(jù)權(quán)利要求2所述的事件分析方法,其特征在于,所述第一信息處理裝置是計算機,所述第二信息處理裝置是存儲裝置,所述拓?fù)錀l件信息包含表示連接所述計算機和所述存儲裝置的拓?fù)溥B接關(guān)系的、與 所述計算機對應(yīng)的通信識別信息和與所述存儲裝置對應(yīng)的通信識別信息的組合。
11.根據(jù)權(quán)利要求10所述的事件分析方法,其特征在于,與所述計算機對應(yīng)的計算機通信識別信息和與所述存儲裝置對應(yīng)的通信識別信息是 iSCSI名、IP地址以及FibreChannel中的WWN中至少一個。
12.根據(jù)權(quán)利要求2所述的事件分析方法,其特征在于,所述第一信息處理裝置是計算機,所述第二信息處理裝置是通過文件共享服務(wù)向所述 多個信息處理裝置提供所存儲的文件的文件服務(wù)器計算機,所述拓?fù)錀l件信息包含表示連接所述計算機和所述文件服務(wù)器計算機的拓?fù)溥B接關(guān) 系的、與所述計算機對應(yīng)的通信識別信息和與所述文件服務(wù)器計算機對應(yīng)的通信識別信息 或者公開所述文件的輸出名的組合。
13.根據(jù)權(quán)利要求2所述的事件分析方法,其特征在于,所述第一信息處理裝置是計算機,所述第二信息處理裝置是作為網(wǎng)絡(luò)共享服務(wù)對所述 多個信息處理裝置提供DNS的DNS服務(wù)器計算機,所述拓?fù)錀l件信息包含表示連接所述計算機和所述DNS服務(wù)器計算機的拓?fù)溥B接關(guān) 系的、與所述計算機對應(yīng)的通信識別信息和與所述DNS服務(wù)器計算機對應(yīng)的通信識別信息 的組合。
14.根據(jù)權(quán)利要求13所述的事件分析方法,其特征在于,與所述計算機對應(yīng)的通信識別信息和與所述DNS服務(wù)器計算機對應(yīng)的通信識別信息 是IP地址或FQDN。
全文摘要
本發(fā)明提供一種以不取得事件信息的IT裝置為對象的根本原因分析方法、裝置及程序。在操作管理服務(wù)器中,將事件信息取得對象的信息處理裝置作為事件取得對象裝置登錄到結(jié)構(gòu)信息中,并從在操作管理服務(wù)器中所存儲的多個事件信息中確定與預(yù)先所存儲的規(guī)則相符合的事件信息,確定該事件信息關(guān)聯(lián)的網(wǎng)絡(luò)服務(wù)的服務(wù)器裝置,顯示在生成事件信息的客戶機信息處理裝置中所發(fā)生的該事件的主要原因是與在服務(wù)器裝置中所發(fā)生的網(wǎng)絡(luò)服務(wù)相關(guān)的事件。
文檔編號G06F11/30GK101981546SQ200980111739
公開日2011年2月23日 申請日期2009年1月26日 優(yōu)先權(quán)日2008年9月30日
發(fā)明者森村知弘, 永井崇之, 荒砥偉浩, 菅內(nèi)公德, 黑田澤希 申請人:株式會社日立制作所