專利名稱:用于管理替換單元的測試的、具有可替換單元的計算機化存儲系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的方法、裝置或軟件,用于管理一個或多個替換單元的測試。
背景技術(shù):
計算機系統(tǒng)通常由一組互連的相異組件構(gòu)成。當(dāng)單元發(fā)生故障時,需要用正確地運行的單元替換所述單元。一些計算機系統(tǒng)(諸如高可用性存儲系統(tǒng))具有內(nèi)建式冗余, 其中關(guān)鍵單元被重復(fù)。關(guān)鍵單元可為諸如盤陣列、接口卡及連接線纜的單元,其中任一都可能發(fā)生故障且需要替換。在這種系統(tǒng)中,由重復(fù)單元提供的冗余可用來在替換有故障的單元時提供連續(xù)的服務(wù)。例如,若檢測到表明需要替換連接線纜的故障或錯誤,則在執(zhí)行替換時將用戶輸入/輸出(I/O)轉(zhuǎn)向至重復(fù)單元。一旦替換單元在適當(dāng)位置,便使其可用于與用戶I/O—起使用。然而,若故障或錯誤未被正確診斷、替換單元發(fā)生故障、或者如果一個以上單元造成故障,則故障或錯誤可能復(fù)發(fā)。另外,若所替換的單元未校正所檢測到的故障或錯誤,則這是因為用戶I/O可能被中斷。
發(fā)明內(nèi)容
在第一方面,本發(fā)明相應(yīng)地提供一種用于在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的方法,用于管理一個或多個替換單元的測試,所述方法包含以下步驟 a)識別存儲系統(tǒng)中用于替換的可替換單元,且將所述存儲系統(tǒng)切換至服務(wù)模式;b)響應(yīng)于用替換單元替換所述可替換單元而自動將所述存儲系統(tǒng)切換至測試模式;c)根據(jù)預(yù)定測試策略測試所述替換單元,以便驗證所述替換單元的運行;以及d)若對所選組件的所述測試成功,則使所述存儲系統(tǒng)返回至在線模式。優(yōu)選地,選擇來自所述存儲系統(tǒng)的一個或多個另外的單元用于結(jié)合所述替換單元使用以用于測試。優(yōu)選地,選擇另外的單元用于結(jié)合所述替換單元使用以便提供合適的輸入/輸出(I/O)路徑,用于測試所述替換單元的完全操作能力。優(yōu)選地,自動地識別和選擇所述另外的單元用于在所述測試中使用。優(yōu)選地,若在所述測試中未檢測到故障,則所述存儲系統(tǒng)自動地返回至在線模式。 優(yōu)選地,若在所述測試期間檢測到預(yù)定級別的故障,則所述存儲系統(tǒng)自動地返回至所述服務(wù)模式。優(yōu)選地,所述測試策略包含排他性地將測試數(shù)據(jù)發(fā)送至所述替換單元。優(yōu)選地, 所述測試策略包含將測試數(shù)據(jù)發(fā)送至所述替換單元,所述測試數(shù)據(jù)的級別被配置為對至所述替換單元的用戶數(shù)據(jù)的級別進行補充,以便將預(yù)定級別的I/O提供至所述替換單元。優(yōu)選地,當(dāng)所述測試包含將數(shù)據(jù)寫入一個或多個數(shù)據(jù)存儲單元時,將所述數(shù)據(jù)寫入存儲單元的保留區(qū)域。優(yōu)選地,所述存儲系統(tǒng)包含用于提供冗余的多個重復(fù)存儲系統(tǒng)。優(yōu)選地,當(dāng)給定存儲系統(tǒng)中的替換單元處于測試模式中時,將所有用戶I/O轉(zhuǎn)向所述重復(fù)存儲系統(tǒng)。優(yōu)選地,所述存儲系統(tǒng)包含一個或多個光纖信道仲裁回路(FCAL)。在第二方面,提供了用于在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的裝置,用于管理一個或多個替換單元的測試,所述裝置可操作來識別存儲系統(tǒng)中用于替換的可替換單元,并將所述存儲系統(tǒng)切換至服務(wù)模式;響應(yīng)于用替換單元替換所述可替換單元而自動地將所述存儲系統(tǒng)切換至測試模式;根據(jù)預(yù)定測試策略測試所述替換單元, 以便驗證所述替換單元的運行;以及若對所選組件的所述測試成功,則使所述存儲系統(tǒng)返回至在線模式。優(yōu)選地,選擇來自所述存儲系統(tǒng)的一個或多個另外的單元用于結(jié)合所述替換單元使用以用于所述測試。優(yōu)選地,選擇所述另外的單元用于結(jié)合所述替換單元使用以便提供合適的輸入/輸出(I/O)路徑,用于測試所述替換單元的完全操作能力。優(yōu)選地,自動地識別和選擇所述另外的單元用于在所述測試中使用。優(yōu)選地,若在所述測試中未檢測到故障,則所述存儲系統(tǒng)自動地返回至所述在線模式。優(yōu)選地,若在所述測試期間檢測到預(yù)定級別的故障,則所述存儲系統(tǒng)自動地返回至所述服務(wù)模式。優(yōu)選地,所述測試策略包含排他性地將測試數(shù)據(jù)發(fā)送至所述替換單元。優(yōu)選地, 所述測試策略包含將測試數(shù)據(jù)發(fā)送至所述替換單元,所述測試數(shù)據(jù)的級別被配置為對至所述替換單元的用戶數(shù)據(jù)的級別進行補充,以便將預(yù)定級別的I/O提供至所述替換單元。優(yōu)選地,當(dāng)所述測試包含將數(shù)據(jù)寫入一個或多個數(shù)據(jù)存儲單元時,將所述數(shù)據(jù)寫入存儲單元的保留區(qū)域。優(yōu)選地,所述存儲系統(tǒng)包含用于提供冗余的多個重復(fù)存儲系統(tǒng)。優(yōu)選地,當(dāng)給定存儲系統(tǒng)中的替換單元處于測試模式中時,將所有用戶I/O轉(zhuǎn)向所述重復(fù)存儲系統(tǒng)。優(yōu)選地,所述存儲系統(tǒng)包含一個或多個光纖信道仲裁回路(FCAL)。在第三方面中,提供了一種含有一個或多個程序的群組,所述一個或多個程序被配置為使得含有一個或多個可編程器件的群組能夠執(zhí)行第一方面的方法,或者提供第二方面的裝置。在第四方面中,提供了一種計算機程序,其包含計算機程序代碼,當(dāng)該計算機程序代碼被加載到計算機系統(tǒng)中并在其中執(zhí)行時,使得所述計算機系統(tǒng)執(zhí)行根據(jù)第一方面的方法的所有步驟。可以以可加載到數(shù)字計算機的內(nèi)存中的計算機程序產(chǎn)品的形式提供該計算機程序,其包括當(dāng)所述產(chǎn)品在計算機上運行時執(zhí)行所述第一方面的方法的計算機代碼部分。本發(fā)明的一個實施例提供了一種用于在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的方法,用于管理一個或多個替換單元的測試,所述方法包含以下步驟a)識別存儲系統(tǒng)中用于替換的可替換單元并將所述存儲系統(tǒng)切換至服務(wù)模式;b)響應(yīng)于用替換單元替換所述可替換單元而自動地將所述存儲系統(tǒng)切換至測試模式;c)根據(jù)預(yù)定測試策略測試所述替換單元,以便驗證所述替換單元的運行;以及d)若對所選組件的測試成功,則使所述存儲系統(tǒng)返回在線模式。可選擇來自所述存儲系統(tǒng)的一個或多個另外的單元用于結(jié)合所述替換單元使用以用于測試??蛇x擇另外的單元用于結(jié)合所述替換單元使用,以便提供合適的輸入/輸出 (I/O)路徑,用于測試所述替換單元的完全操作能力。可自動地識別和選擇所述另外的單元用于在所述測試中使用。若在所述測試中未檢測到故障,則所述存儲系統(tǒng)可自動地返回至在線模式。若在所述測試期間檢測到預(yù)定級別的故障,則所述存儲系統(tǒng)可自動地返回至所述服務(wù)模式。所述測試策略可包含排他性地將測試數(shù)據(jù)發(fā)送至所述替換單元。所述測試策略可包含將測試數(shù)據(jù)發(fā)送至所述替換單元,所述測試數(shù)據(jù)的級別被配置為與對至所述替換單元的用戶數(shù)據(jù)的級別進行補充,以便將預(yù)定級別的I/O提供至所述替換單元。當(dāng)所述測試包含將數(shù)據(jù)寫入一個或多個數(shù)據(jù)存儲單元時,可將所述數(shù)據(jù)寫入存儲單元的保留區(qū)域。所述存儲系統(tǒng)可包含用于提供冗余的多個重復(fù)存儲系統(tǒng)。當(dāng)給定存儲系統(tǒng)中的替換單元處于測試模式中時,可將所有用戶I/O轉(zhuǎn)向所述重復(fù)存儲系統(tǒng)。所述存儲系統(tǒng)可包含一個或多個光纖信道仲裁回路(FCAL)。另一實施例提供用于在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的裝置,用于管理一個或多個替換單元的測試,所述裝置可操作來識別存儲系統(tǒng)中用于替換的可替換單元并將所述存儲系統(tǒng)切換至服務(wù)模式;響應(yīng)于用替換單元替換所述可替換單元而自動地將所述存儲系統(tǒng)切換至測試模式;根據(jù)預(yù)定測試策略測試所述替換單元,以便驗證所述替換單元的運行;以及若對所選組件的所述測試成功,則使所述存儲系統(tǒng)返回至在線模式。再一實施例提供提供了一種含有一個或多個程序的群組,所述一個或多個程序被配置為使得含有一個或多個可編程器件的群組能夠執(zhí)行用于在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的方法,用于管理一個或多個替換單元的測試,所述方法包含以下步驟a)識別存儲系統(tǒng)中用于替換的可替換單元并將所述存儲系統(tǒng)切換至服務(wù)模式;b)響應(yīng)于用替換單元替換所述可替換單元而自動地將所述存儲系統(tǒng)切換至測試模式;c)根據(jù)預(yù)定測試策略測試所述替換單元,以便驗證所述替換單元的運行;以及d)若對所選組件的測試成功,則使所述存儲系統(tǒng)返回在線模式。再一實施例提供提供了一種含有一個或多個程序的群組,所述一個或多個程序被配置為使得含有一個或多個可編程器件的群組能夠提供用于在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的裝置,用于管理一個或多個替換單元的測試,所述裝置可操作來識別存儲系統(tǒng)中用于替換的可替換單元并將所述存儲系統(tǒng)切換至服務(wù)模式;響應(yīng)于用替換單元替換所述可替換單元而自動地將所述存儲系統(tǒng)切換至測試模式;根據(jù)預(yù)定測試策略測試所述替換單元,以便驗證所述替換單元的運行;以及若對所選組件的所述測試成功,則使所述存儲系統(tǒng)返回至在線模式。再一實施例提供一種可加載至數(shù)字計算機的內(nèi)存中的計算機程序產(chǎn)品,其包含軟件代碼部分,當(dāng)所述產(chǎn)品在計算機上運行時,所述軟件代碼部分執(zhí)行用于在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的方法,用于管理一個或多個替換單元的測試, 所述方法包含以下步驟
a)識別存儲系統(tǒng)中用于替換的可替換單元并將所述存儲系統(tǒng)切換至服務(wù)模式;b)響應(yīng)于用替換單元替換所述可替換單元而自動地將所述存儲系統(tǒng)切換至測試模式;c)根據(jù)預(yù)定測試策略測試所述替換單元,以便驗證所述替換單元的運行;以及d)若對所選組件的測試成功,則使所述存儲系統(tǒng)返回在線模式。
現(xiàn)在將參照附圖通過示例說明本發(fā)明的實施例,其中圖1為包含計算機化存儲系統(tǒng)的計算機網(wǎng)絡(luò)的示意圖;圖2為更詳細(xì)地展示圖1的計算機化存儲系統(tǒng)的示意圖;圖3a為說明圖2的計算機化存儲系統(tǒng)內(nèi)的單元的連接的表;圖北為說明用于圖2的計算機化存儲系統(tǒng)的測試策略的表;圖4為說明由圖2的計算機化存儲系統(tǒng)執(zhí)行的處理的流程圖;及圖5為說明由圖2的計算機化存儲系統(tǒng)執(zhí)行的進一步處理的流程圖。
具體實施例方式
參照圖1,計算機系統(tǒng)包含加載有存儲服務(wù)器應(yīng)用程序103且連接至存儲系統(tǒng)104 的第一計算機102。第一計算機102經(jīng)由局域網(wǎng)(LAN) 106形式的網(wǎng)絡(luò)而連接至兩個第二計算機105。所述第二計算機105各自加載有數(shù)據(jù)處理應(yīng)用程序107,該數(shù)據(jù)處理應(yīng)用程序 107被配置為經(jīng)由該存儲服務(wù)器103存儲和訪問該存儲系統(tǒng)104上的數(shù)據(jù)。換言之,數(shù)據(jù)處理應(yīng)用程序107將用戶輸入/輸出(I/O)提供至存儲服務(wù)器103及存儲系統(tǒng)104。參照圖2,存儲服務(wù)器應(yīng)用程序103包含配置為提供用戶接口和處理用戶I/O的存儲控制器201 ;以及配置為合作地管理對存儲系統(tǒng)104的提供、服務(wù)及測試的重復(fù)存儲適配器202、203,如下文更詳細(xì)地描述。存儲系統(tǒng)104包含三個盤陣列204、205、206,所述盤陣列204、205、206各自包含四個盤207及兩個接口卡208、209。每個接口卡208、209提供用于連接至適配器202、203的連接端口。提供一組鏈路210、211用于將適配器202、203中的每一個以串聯(lián)方式連接至每個盤陣列204、205、206的兩個接口卡208、209。在圖2中,為了清楚起見,省略了對一些重復(fù)項(諸如鏈路210、211)的每次出現(xiàn)的標(biāo)記。多個重復(fù)適配器202、203、鏈路210、211、盤207及接口卡208、209的提供對存儲系統(tǒng)104提供了多重冗余。在本實施例中,將每個單元207、208、209、210、211重復(fù)至少一次,以便通過事實上提供兩個重復(fù)存儲系統(tǒng)來提供冗余。存儲控制器201被配置為使用重復(fù)存儲系統(tǒng)來提供高可用性,這是因為,若一個重復(fù)存儲系統(tǒng)離線,則它的重復(fù)存儲系統(tǒng)被配置來提供所需服務(wù)。在本實施例中,多個鏈路210、211、盤207及接口卡208、209中的每一者被提供為可單獨地替換的相異單元,其通常被稱為現(xiàn)場可替換單元(FRU)。存儲控制器201包含用以檢測鏈路210、211、盤207及接口卡208、209中的故障及錯誤的范圍的功能,且一旦檢測到便警告工程師。為了替換有故障的FRU,使相關(guān)重復(fù)存儲系統(tǒng)從在線模式進入服務(wù)模式,其中通過該冗余重復(fù)存儲系統(tǒng)維持可用性。在本實施例中,當(dāng)給定的重復(fù)存儲系統(tǒng)處于服務(wù)模式中時,將所有用戶I/O轉(zhuǎn)向至該冗余的重復(fù)存儲系統(tǒng)。在各個存儲適配器202、203之間合作地執(zhí)行在線或服務(wù)模式的切換,以便確保兩者不同時處于服務(wù)模式中,由此維持可用性。在本實施例中,存儲適配器202、203被配置為具有測試模式的形式的另一模式, 該模式是服務(wù)模式與在線模式之間的中間模式。當(dāng)工程師已替換FRU且指示重復(fù)存儲系統(tǒng)可返回到在線模式時,相關(guān)存儲適配器202、203被配置為自動地將該重復(fù)存儲系統(tǒng)置于測試模式中。在測試模式中,對替換FRU執(zhí)行一組一個或多個預(yù)定測試,以確保其正確地運行以及該替換已修復(fù)檢測到的故障。在本實施例中,取決于已被替換的FRU的類型而選擇測試。在本實施例中,在測試模式中,在給定重復(fù)存儲系統(tǒng)上準(zhǔn)許用戶I/O。然而,在各個存儲適配器202、203之間合作地執(zhí)行測試模式切換,以便確保兩者不同時處于測試模式中。這被配置來避免兩個系統(tǒng)同時返回到服務(wù)模式的可能性。參照圖3a,在測試策略301中定義測試,該測試策略301針對存儲系統(tǒng)104中的每個FRU的類型識別適當(dāng)?shù)臏y試、以及該測試的持續(xù)時間(若可用)。例如,若被替換的FRU 為鏈路,則對替換鏈路壓力測試十分鐘。若FRU為盤,則執(zhí)行盤驗證測試,該盤驗證測試運行不定的時間,直至完成或異常中止為止。在給定的重復(fù)存儲系統(tǒng)處于測試模式中時,針對任何新的或復(fù)發(fā)的故障監(jiān)視該系統(tǒng)。若檢測到任何故障,則自動使重復(fù)存儲系統(tǒng)轉(zhuǎn)到服務(wù)模式。然而,若測試完成且未檢測到故障,則自動使重復(fù)存儲系統(tǒng)返回至在線模式。如上所述,參照圖3a,對替換鏈路執(zhí)行壓力測試。壓力測試被配置為通過經(jīng)由替換后的鏈路饋送適當(dāng)級別的測試I/O且在測試時段內(nèi)監(jiān)視其性能,來測試該鏈路的最大數(shù)據(jù)速率。然而,若鏈路具有比其直接下游組件(諸如盤)大的能力,則可能需要選擇若干下游組件以提供適當(dāng)帶寬來執(zhí)行壓力測試。例如,若替換后的鏈路具有2(ib/S的最大數(shù)據(jù)速率且連接于各自具有50MB/S的最大數(shù)據(jù)速率的盤的上游,則將需要使用四個盤來吸收測試 I/O的2(ib/S形式的測試數(shù)據(jù)。參照圖3b,每個存儲適配器202、203被配置為維持呈FRU連接表形式的表302,其記錄存儲系統(tǒng)104中的每個FRU的唯一識別符(FRU ID),連同給定FRU的類型以及直接下游單元的FRU ID。存儲適配器202、203被配置為使用FRU連接表302來識別在替換單元下游的、為測試I/O提供適當(dāng)目標(biāo)的單元,以便使得能夠提供適當(dāng)級別的測試I/O用于該替換單元。現(xiàn)將參照圖4的流程圖進一步描述存儲適配器202、203響應(yīng)于由于在它們各自的重復(fù)存儲系統(tǒng)上檢測到故障而被置于服務(wù)模式中而執(zhí)行的處理。在步驟401處,響應(yīng)于重復(fù)存儲系統(tǒng)被置于服務(wù)模式中而開始處理,且處理移至步驟402,以等待有故障的FRU的替換。當(dāng)有故障的FRU已被替換時,如被安裝工程師所指示,處理移至步驟403,在步驟403處, 重復(fù)存儲系統(tǒng)自動進入測試模式,且處理移至步驟404。在步驟404處,識別替換FRU的類型,且處理移至步驟405。在步驟405處,使用所識別的FRU類型根據(jù)測試策略301識別適當(dāng)測試,且處理移至步驟406。在步驟406處,執(zhí)行所識別的測試,且處理移至步驟407。在步驟407處,執(zhí)行故障監(jiān)視,且若在測試的持續(xù)時間內(nèi)未檢測到故障,則處理移至步驟408。 在步驟408處,自動將重復(fù)存儲系統(tǒng)置于在線模式中,且處理結(jié)束于步驟409處。若在步驟 407處檢測到一預(yù)定組的一個或多個故障,則處理移至步驟410。在步驟410處,記載該故障或每一故障,且重復(fù)存儲系統(tǒng)自動地返回至服務(wù)模式。處理接著移至步驟402,以等待另外的服務(wù)動作,且接著如上文所描述而繼續(xù)進行?,F(xiàn)在將參照圖5的流程圖來描述響應(yīng)于壓力測試的開始而由存儲適配器202、203執(zhí)行的處理。在步驟501處,響應(yīng)于在圖4的流程圖中的步驟405處對壓力測試的識別而開始處理,且處理移至步驟502。在步驟502處,根據(jù)FRU連接表302識別替換FRU的最大操作數(shù)據(jù)速率,且處理移至步驟503。在步驟503處,再次使用FRU連接表302,選擇來自重復(fù)存儲系統(tǒng)的一組已連接單元,以形成能夠處理或吸收在替換FRU的最大操作數(shù)據(jù)速率下的I/O的測試群組。處理接著移至步驟504,在步驟504處判定用戶I/O的當(dāng)前級別。如上所述,在本實施例中,在測試模式中,在重復(fù)存儲系統(tǒng)上準(zhǔn)許用戶I/O。一旦判定了用戶I/O 的級別,處理便移至步驟505。在步驟505處,計算所需要的擴充(top-up)測試I/O的量, 即,將測得的用戶I/O擴充至替換FRU的最大操作數(shù)據(jù)速率所需要的測試1/0,且處理移至步驟506。在步驟506處,產(chǎn)生該擴充測試1/0,并在所規(guī)定的用于壓力測試的時段內(nèi)將該擴充測試I/O路由到在步驟503中所選擇的單元的測試群組。一旦在所規(guī)定的時段內(nèi)已提供該測試1/0,則處理移至步驟507并結(jié)束。在本實施例中,將擴充測試I/O發(fā)送至相關(guān)盤驅(qū)動器的為此目的而保留的區(qū)域。 換言之,明確地將用戶I/O排除在測試I/O目標(biāo)盤驅(qū)動器的保留區(qū)域之外,以便避免任何用戶I/O被測試I/O覆寫或破壞。當(dāng)重復(fù)存儲系統(tǒng)被置于測試模式中時,用戶I/O的至少一部分被配置為從使用冗余重復(fù)存儲系統(tǒng)返回到檢查中的重復(fù)存儲系統(tǒng)。若識別了任何錯誤,諸如回路的意外重組或丟失的幀,則這導(dǎo)致測試模式立即失敗以及返回到服務(wù)模式,其接著僅沿著冗余重復(fù)存儲系統(tǒng)重新驅(qū)動用戶I/O。這不會對客戶訪問造成風(fēng)險,因為冗余存儲系統(tǒng)仍為用于數(shù)據(jù)的良好路徑。若測試模式失敗,則可重新檢查替換FRU且執(zhí)行進一步的修復(fù)動作。例如,當(dāng)正修復(fù)的問題為間歇性的且不能容易地識別為單一 FRU失敗時,這提高給定修復(fù)的可信度。在另一實施例中,在系統(tǒng)中未提供冗余,且在系統(tǒng)處于服務(wù)模式中時不能處理用戶I/O。在另一實施例中,提供部分冗余,即,為系統(tǒng)中的一些單元但并非所有單元提供冗余。在另一實施例中,每個FRU自身被配置為具有單獨的服務(wù)、測試及在線模式,而非整體地用于系統(tǒng)的全局模式。在另一實施例中,在處于測試模式期間在給定系統(tǒng)上不使用用戶 1/0,且若執(zhí)行壓力測試,則測試數(shù)據(jù)被配置為提供替換FRU的最大操作數(shù)據(jù)速率。如本領(lǐng)域的技術(shù)人員將理解的,替換單元可能并非對現(xiàn)有的或有故障的單元的直接替換,而可能為例如添加至系統(tǒng)以修復(fù)故障或提供額外功能的升級單元或新安裝的單元。此外,在給定服務(wù)動作期間可替換一個以上的FRU,其可導(dǎo)致在給定測試中測試一個以上的FRU。如本領(lǐng)域的技術(shù)人員將理解的,可針對測試中的傳輸設(shè)備的類型而特別地配置測試I/O的格式。例如,可通過包含低頻地改變值的比特流的I/O模式來最好地對光纖信道仲裁回路(FCAL)系統(tǒng)加壓。本領(lǐng)域的技術(shù)人員將理解,實施本發(fā)明的一部分或全部的裝置可為具有被配置為提供本發(fā)明的實施例的一部分或全部的軟件的通用設(shè)備。該設(shè)備可為單一設(shè)備或一群設(shè)備,且該軟件可為單一程序或一組程序。此外,用來實施本發(fā)明的任何或所有軟件可經(jīng)由任何適當(dāng)?shù)膫鬏敾虼鎯κ侄渭右詡鬟f,以使得該軟件可加載至一個或多個設(shè)備上。雖然已經(jīng)通過對本發(fā)明的實施例的描述來說明本發(fā)明,且雖然已相當(dāng)詳細(xì)地描述了所述實施例,但對本領(lǐng)域的技術(shù)人員而言,其它優(yōu)點及修改將顯而易見。
權(quán)利要求
1.一種用于在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的方法,用于管理一個或多個替換單元的測試,所述方法包含以下步驟a)識別存儲系統(tǒng)中用于替換的可替換單元,并將所述存儲系統(tǒng)切換至服務(wù)模式;b)響應(yīng)于用替換單元替換所述可替換單元,自動地將所述存儲系統(tǒng)切換至測試模式;c)根據(jù)預(yù)定的測試策略測試所述替換單元,以便驗證所述替換單元的運行;以及d)若對所選組件的測試成功,則使所述存儲系統(tǒng)返回至在線模式。
2.如權(quán)利要求1的方法,其中,選擇來自所述存儲系統(tǒng)的一個或多個另外的單元,用于結(jié)合所述替換單元使用,以用于所述測試。
3.如權(quán)利要求2的方法,其中,選擇所述另外的單元用于結(jié)合所述替換單元使用,以便提供適當(dāng)?shù)妮斎?輸出(I/O)路徑用于測試所述替換單元的完全操作能力。
4.如前述權(quán)利要求中任一項的方法,其中,若在所述測試中未檢測到故障,則所述存儲系統(tǒng)自動地返回至所述在線模式;并且若在所述測試期間檢測到預(yù)定級別的故障,則所述存儲系統(tǒng)自動地返回至所述服務(wù)模式。
5.如前述權(quán)利要求中任一項的方法,其中,所述測試策略包含排他性地將測試數(shù)據(jù)發(fā)送至所述替換單元。
6.如權(quán)利要求1至4中任一項的方法,其中,所述測試策略包含將測試數(shù)據(jù)發(fā)送至所述替換單元,所述測試數(shù)據(jù)的級別被配置為對至所述替換單元的用戶數(shù)據(jù)的級別進行補充,以便將預(yù)定級別的I/O提供至所述替換單元。
7.如前述權(quán)利要求中任一項的方法,其中,當(dāng)所述測試包含將數(shù)據(jù)寫入至一個或多個數(shù)據(jù)存儲單元時,將所述數(shù)據(jù)寫入所述存儲單元的保留區(qū)域。
8.一種用于在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的裝置,用于管理一個或多個替換單元的測試,所述裝置可操作來 識別存儲系統(tǒng)中用于替換的可替換單元,并將所述存儲系統(tǒng)切換至服務(wù)模式;響應(yīng)于用替換單元替換所述可替換單元,自動地將所述存儲系統(tǒng)切換至測試模式;根據(jù)預(yù)定測試策略測試所述替換單元,以便驗證所述替換單元的運行;以及若對所選組件的測試成功,則使所述存儲系統(tǒng)返回至在線模式。
9.如權(quán)利要求8的裝置,其中,選擇來自所述存儲系統(tǒng)的一個或多個另外的單元用于結(jié)合所述替換單元使用,以用于所述測試。
10.如權(quán)利要求9的裝置,其中,選擇所述另外的單元用于結(jié)合所述替換單元使用,以便提供適當(dāng)?shù)妮斎?輸出(I/O)路徑用于測試所述替換單元的完全操作能力。
11.如權(quán)利要求8至10中任一項的裝置,其中,若在所述測試中未檢測到故障,則所述存儲系統(tǒng)自動地返回至所述在線模式;并且,若在所述測試期間檢測到預(yù)定級別的故障,則所述存儲系統(tǒng)自動地返回至所述服務(wù)模式。
12.如權(quán)利要求8至11中任一項的裝置,其中,所述測試策略包含排他性地將測試數(shù)據(jù)發(fā)送至所述替換單元。
13.如權(quán)利要求8至11中任一項的裝置,其中,所述測試策略包含將測試數(shù)據(jù)發(fā)送至所述替換單元,所述測試數(shù)據(jù)的級別被配置為對與至所述替換單元的用戶數(shù)據(jù)的級別進行補充,以便將預(yù)定級別的I/O提供至所述替換單元。
14.如權(quán)利要求8至13中任一項的裝置,其中,當(dāng)所述測試包含將數(shù)據(jù)寫入至一個或多個數(shù)據(jù)存儲單元時,將所述數(shù)據(jù)寫入所述存儲單元的保留區(qū)域。
15. 一種計算機程序,其包含計算機程序代碼,當(dāng)所述計算機程序代碼被加載到計算機系統(tǒng)中并在其中執(zhí)行時,使得所述計算機系統(tǒng)執(zhí)行根據(jù)權(quán)利要求1至7中的任一個的方法的所有步驟。
全文摘要
本發(fā)明公開了一種在包含一個或多個可替換單元的計算機化存儲系統(tǒng)中使用的方法、裝置或軟件,用于管理一個或多個替換單元的測試,其中,響應(yīng)于給定單元被替換而自動地將該存儲系統(tǒng)置于測試模式中,且若測試失敗,則該存儲系統(tǒng)自動恢復(fù)至服務(wù)模式。
文檔編號G06F11/27GK102171662SQ200980138802
公開日2011年8月31日 申請日期2009年10月1日 優(yōu)先權(quán)日2008年10月2日
發(fā)明者喬納森·I·塞特爾, 喬納森·W·L·肖特, 保羅·N·卡什曼, 羅德里克·G·穆爾, 蒂莫西·F·麥卡錫 申請人:國際商業(yè)機器公司