專利名稱:自動和動態(tài)優(yōu)化應(yīng)用數(shù)據(jù)資源以滿足業(yè)務(wù)目標的系統(tǒng)和方法
技術(shù)領(lǐng)域:
一般說來,本發(fā)明涉及計算機系統(tǒng)中的數(shù)據(jù)存儲器,更確切地說,涉及在該數(shù)據(jù)存儲器上備份和恢復(fù)被物理地或邏輯地損壞的資源所用的系統(tǒng)。本發(fā)明尤其涉及一種備份和數(shù)據(jù)恢復(fù)系統(tǒng),它根據(jù)環(huán)境和工作負載,不斷動態(tài)地調(diào)整備份和恢復(fù)過程,以便滿足根據(jù)業(yè)務(wù)目標定義的應(yīng)用數(shù)據(jù)可用性。
背景技術(shù):
數(shù)據(jù)庫管理員(DBA)的任務(wù)就是照看和管理運行企業(yè)的業(yè)務(wù)關(guān)鍵應(yīng)用的數(shù)據(jù)庫環(huán)境的健全。這包括確保包括若干應(yīng)用的數(shù)據(jù)庫對象的持續(xù)可用,以及確保數(shù)據(jù)庫狀態(tài)良好,以便提供業(yè)務(wù)應(yīng)用所期望的需要性能。例如,數(shù)據(jù)庫管理員負責(zé)數(shù)據(jù)備份,以便在系統(tǒng)出現(xiàn)故障的情況下進行數(shù)據(jù)恢復(fù)??蛻舳x了系統(tǒng)出現(xiàn)故障之后和恢復(fù)之前,他們能夠容忍的最長時間。在許多情況下,恢復(fù)的時間長度取決于使用的技術(shù)和數(shù)據(jù)備份的頻率。
從應(yīng)用數(shù)據(jù)可用性的觀點來看,DBA的挑戰(zhàn)是面對數(shù)據(jù)庫對象數(shù)目、對象規(guī)模以及對象易失性的變化,按照業(yè)務(wù)應(yīng)用的需求,對應(yīng)用數(shù)據(jù)可用性提供所需的服務(wù)質(zhì)量(QoS)。此外,DBA在應(yīng)付對硬件/軟件配置的改變、應(yīng)用工作負載的變化以及對業(yè)務(wù)應(yīng)用本身的QoS的潛在改變的同時,也應(yīng)當保持所需的QoS。尤其是對于每個應(yīng)用的數(shù)據(jù)庫和文件對象,DBA需要使用最優(yōu)的技術(shù)來進行備份和恢復(fù),確定最優(yōu)的備份頻率以節(jié)省計算資源,以及使用最優(yōu)的備份和恢復(fù)策略來提供所需的QoS。
所以,應(yīng)用數(shù)據(jù)恢復(fù)是一種技能密集度很高的需求,導(dǎo)致企業(yè)擁有總成本提高。這種提高的成本是由于幾種因素,包括系統(tǒng)資源的非最優(yōu)化使用。例如,DBA趨向于實施過度補償?shù)娜舾刹呗?,以避免設(shè)計復(fù)雜的最優(yōu)備份計劃。在應(yīng)用對象、應(yīng)用工作負載、硬件和軟件基礎(chǔ)設(shè)施發(fā)生變化時,應(yīng)用數(shù)據(jù)恢復(fù)可能需要手工監(jiān)控和事件日程重新安排。在執(zhí)行對應(yīng)用數(shù)據(jù)的完整性和無法提供期望的QoS二者之間進行折衷的備份/恢復(fù)策略時,這些復(fù)雜情況導(dǎo)致了許多人為錯誤。
典型情況下,DBA根據(jù)最不利的情況以及在恢復(fù)期間業(yè)務(wù)需求可容忍或者說可接受的停機時間,為系統(tǒng)確定備份的頻率。在發(fā)生故障的情況下,數(shù)據(jù)庫中的數(shù)據(jù)不丟失;對數(shù)據(jù)庫中數(shù)據(jù)的全部更新都寫入一份日志。為了把系統(tǒng)恢復(fù)到故障點上,就從最后的備份恢復(fù)數(shù)據(jù),并且按照從最后的備份直至故障點期間在日志中記錄的變化,使恢復(fù)過程向前滾動。
通過這個過程,數(shù)據(jù)庫讀取和應(yīng)用日志中遞增的全部變化,數(shù)據(jù)就恢復(fù)到了故障點上。如果每七天進行一次備份,DBA很可能假設(shè)最不利的情況下,故障點發(fā)生在第七天進行備份之前。在這種情況下,恢復(fù)時間最長。
根據(jù)恢復(fù)期間客戶對停機時間的容忍程度,為了達到約定的服務(wù)質(zhì)量(QoS),DBA可以保證,進行恢復(fù)期間的停機時間少于客戶允許的停機時間。因此,從最后的備份恢復(fù)數(shù)據(jù)以及從日志的遞增變化向前滾動所需的時間,應(yīng)當少于客戶允許的停機時間。
為了確定最優(yōu)的備份方法和計劃,DBA應(yīng)當分析數(shù)據(jù)庫及其環(huán)境的許多方面,包括可能需要恢復(fù)的數(shù)據(jù)量、運行數(shù)據(jù)庫的機器、操作系統(tǒng)、數(shù)據(jù)庫類型和版本等。給定了數(shù)據(jù)量之后,DBA應(yīng)當判斷即使在最不利的情況下是否還可能恢復(fù)數(shù)據(jù)以及滿足QoS保證。總的說來,DBA應(yīng)當清楚地了解運行環(huán)境、硬件、軟件和性能。雖然這種方法可以產(chǎn)生最優(yōu)的備份方法和計劃,但是它是勞動密集型的,而且僅僅適用于初始狀態(tài)。所有這些因素都可能隨時間而改變,所以在最優(yōu)的備份方法和計劃中需要不停的改進。
目前,DBA手工確定備份計劃。DBA確定要備份的數(shù)據(jù)量以及恢復(fù)過程可以耗用多長時間。例如,DBA可以確定備份可以包括100GB的數(shù)據(jù),以及數(shù)據(jù)庫是帶有并行恢復(fù)的IBM DB2。
DBA確定從備份恢復(fù)可以耗用例如5分鐘。然后DBA計算向前滾動所需的時間。如果在每個星期一進行備份,那么最不利的情況就是故障點在下一個星期日。對應(yīng)用數(shù)據(jù)已經(jīng)作出的改變越多,恢復(fù)應(yīng)用數(shù)據(jù)所耗用的時間就會越長。在這個實例中,進行向前滾動可能要耗用15分鐘。那么,恢復(fù)應(yīng)用所需的總時間將是20分鐘5分鐘用于從備份恢復(fù),15分鐘用于進行向前滾動??蛻艨赡芤呀?jīng)約定了停機時間極限為10分鐘的QoS保證。為了確保該QoS保證得到滿足,對于DBA最容易的選擇將是提高備份的頻率,或許頻繁至每日進行。雖然這樣做確保了該QoS保證得到滿足,但是這卻最可能不是最有效率的資源使用方式。
許多數(shù)據(jù)庫和第三方軟件廠商都提供數(shù)據(jù)庫級別的備份和恢復(fù)解決方案,某些廠商還聲稱也提供應(yīng)用級別的數(shù)據(jù)恢復(fù)。幾乎所有廠商都提供備份和恢復(fù)服務(wù),利用執(zhí)行備份和恢復(fù)功能所需的相關(guān)對象名稱和句法,以及對產(chǎn)生的若干備份進行跟蹤的若干管理工具輔助產(chǎn)生若干作業(yè)。
使數(shù)據(jù)恢復(fù)的問題復(fù)雜化的是應(yīng)用數(shù)據(jù)可用性的規(guī)范。業(yè)務(wù)應(yīng)用取決于數(shù)據(jù)。應(yīng)用數(shù)據(jù)可用性是業(yè)務(wù)連續(xù)運轉(zhuǎn)的關(guān)鍵。需要在應(yīng)用級別上的應(yīng)用數(shù)據(jù)可用性規(guī)范,即對于業(yè)務(wù)應(yīng)用中涉及的全部數(shù)據(jù)類型。不僅如此,規(guī)范還應(yīng)當在應(yīng)用級別按照業(yè)務(wù)的語義來規(guī)定,而不是在傳統(tǒng)的各個數(shù)據(jù)對象的級別(它不影響對整體應(yīng)用可用性的影響,尤其是當應(yīng)用包括多個數(shù)據(jù)對象時)。
挑戰(zhàn)在于對若干應(yīng)用的可用性定義一套業(yè)務(wù)級別度量,再把它轉(zhuǎn)換到域內(nèi)特定的業(yè)務(wù)度量中。這些業(yè)務(wù)級別度量最終驅(qū)動潛在的許用硬件和軟件信息技術(shù)(IT)基礎(chǔ)設(shè)施,提供所需的若干業(yè)務(wù)級別目標??捎眯砸酝獾挠?qū)嵗ㄐ阅堋?br>
尤其是從可用性域的觀點來看,一種應(yīng)用的數(shù)據(jù)(既包括數(shù)據(jù)庫也包括文件)又應(yīng)當滿足該應(yīng)用的可用性和恢復(fù)的特定業(yè)務(wù)目標。一旦定義了這種業(yè)務(wù)語義的若干規(guī)范,一個企業(yè)或者一個服務(wù)供應(yīng)商(xSP)就具有一致的方法來指定其對可用性的需求,以提供所需的QoS,而與特定的潛在基礎(chǔ)設(shè)施無關(guān)。
對于可能跨越多個不同系統(tǒng)的數(shù)據(jù)恢復(fù),應(yīng)用可用性的常規(guī)方法,缺乏對一種應(yīng)用的所有數(shù)據(jù)存儲器(數(shù)據(jù)庫和文件)的通盤考慮。此外,目前還不存在使用業(yè)務(wù)目標/語義,以說明方式指定應(yīng)用數(shù)據(jù)恢復(fù)需求的能力。不僅如此,對于把業(yè)務(wù)目標映射到許用的一套技術(shù)的系統(tǒng)性方法,目前也沒有這種機制。
對于最優(yōu)的備份方法和計劃,QoS應(yīng)當視為包括以下部分●探測的時間●決定的時間●過程的執(zhí)行常規(guī)方法僅僅涉及執(zhí)行恢復(fù)過程所需的時間。除了執(zhí)行恢復(fù)過程以外,還可以在QoS極限之內(nèi)探測故障并且確定最優(yōu)恢復(fù)計劃的一個系統(tǒng),才是所需要的。
若干數(shù)據(jù)恢復(fù)系統(tǒng)所用的常規(guī)方法缺乏一種機制,所以不能把應(yīng)用數(shù)據(jù)可用性的業(yè)務(wù)目標轉(zhuǎn)換到為了滿足期望的QoS而設(shè)計和執(zhí)行的一種最優(yōu)備份和恢復(fù)策略中。此外,這些數(shù)據(jù)恢復(fù)系統(tǒng)也缺乏確定備份和恢復(fù)任務(wù)所用的最優(yōu)技術(shù)的一種機制。目前還沒有可用于制定最優(yōu)備份計劃的機制。另外,也沒有確定最優(yōu)恢復(fù)策略的機制。
不僅如此,若干數(shù)據(jù)恢復(fù)系統(tǒng)所用的常規(guī)方法也缺乏一種機制,所以不能在以上的所有環(huán)境中進行調(diào)整和改進,這些環(huán)境中的應(yīng)用工作負載、業(yè)務(wù)目標和硬件/軟件基礎(chǔ)設(shè)施技術(shù)都在動態(tài)變化。因此,需要一種數(shù)據(jù)恢復(fù)系統(tǒng)和方法,它能夠自動和動態(tài)優(yōu)化備份資源。迄今為止,對這種系統(tǒng)和方法的需要尚未得到滿足。
發(fā)明內(nèi)容
本發(fā)明滿足了這種需要,并且提供了一種系統(tǒng)、一種計算機程序產(chǎn)品和一種相關(guān)的方法(本文中一并稱為“本系統(tǒng)”),用于備份和數(shù)據(jù)恢復(fù)系統(tǒng),它按照環(huán)境和工作負載,連續(xù)地動態(tài)調(diào)整自身,以達到客戶的業(yè)務(wù)目標。對恢復(fù)和備份造成的停機時間的容忍,對客戶的業(yè)務(wù)或系統(tǒng)運作形成了影響。本系統(tǒng)從高級別的業(yè)務(wù)環(huán)境確定備份和恢復(fù)計劃的細節(jié)。
本系統(tǒng)接受基于業(yè)務(wù)目標的應(yīng)用數(shù)據(jù)可用性策略,并且設(shè)計、執(zhí)行和改進一種資源最優(yōu)化備份和恢復(fù)策略,以便在應(yīng)用工作負載、業(yè)務(wù)目標和硬件/軟件基礎(chǔ)設(shè)施技術(shù)內(nèi)容動態(tài)變化的環(huán)境中,提供期望的服務(wù)質(zhì)量(QoS)。此外,本系統(tǒng)還在客戶指定的窗口(本文中也稱為閉鎖的窗口)外部進行備份,以便對客戶的系統(tǒng)影響最小。本系統(tǒng)也避免冗余的備份。
本系統(tǒng)按照業(yè)務(wù)目標,對應(yīng)用數(shù)據(jù)恢復(fù)需求采用一種說明性規(guī)范。業(yè)務(wù)目標按照應(yīng)用維度來定義。一個或多個定性的服務(wù)質(zhì)量度量(也稱為服務(wù)提供元素或SOE),關(guān)聯(lián)到這些應(yīng)用維度中的每一個。正如本文中的用法,一個服務(wù)提供包(SOP)就是一個定性的QoS度量,它表示了每個單獨的SOE的一個且僅有一個實例的集合。
本系統(tǒng)提供的應(yīng)用數(shù)據(jù)恢復(fù)需求,其定義方式隱含地包括了與一種應(yīng)用相關(guān)聯(lián)的一切數(shù)據(jù)對象,無論其數(shù)據(jù)存儲在何處,以及它們駐留在何種系統(tǒng)上。這些應(yīng)用數(shù)據(jù)恢復(fù)需求是按照業(yè)務(wù)目標指定的。應(yīng)用數(shù)據(jù)恢復(fù)關(guān)聯(lián)到一個定性度量,它是按照應(yīng)用數(shù)據(jù)恢復(fù)維度來定義的,這些維度表示了業(yè)務(wù)語義??蛻艨梢园堰@個定性度量用作一個載體,不斷設(shè)計和驅(qū)動一種執(zhí)行策略,它通過利用許用的潛在IT基礎(chǔ)設(shè)施技術(shù),達到了應(yīng)用數(shù)據(jù)恢復(fù)QoS。
本系統(tǒng)有助于許用技術(shù)的優(yōu)化,以提供期望的QoS。這類似于在關(guān)系DBMS中SQL語言提供的抽象,它不包括訪問路徑構(gòu)建,因此方便了查詢優(yōu)化。
本系統(tǒng)允許SOP實施客戶透明地利用與一個SOP相關(guān)聯(lián)之潛在IT技術(shù)中的變化,以便確保應(yīng)用數(shù)據(jù)恢復(fù)SOP QoS需求連續(xù)地得到滿足。潛在IT技術(shù)中的這些變化可能會導(dǎo)致期望的QoS不可達到。那么本系統(tǒng)就警告客戶,建議升級到一種更高的QoS。如果更高的QoS無法以現(xiàn)有的基礎(chǔ)設(shè)施來實現(xiàn),本系統(tǒng)也能夠識別提供更高的QoS級別時,硬件和軟件的先決條件。
本系統(tǒng)使用更高的QoS允許使用的特性和技術(shù)以及硬件/軟件平臺的專有性能模型,重新評估應(yīng)用的工作負載,從而實現(xiàn)了這一點。然后,本系統(tǒng)識別出能夠提供所需QoS但是目前在現(xiàn)有的基礎(chǔ)實施中缺少的特性和技術(shù)。
本系統(tǒng)能夠指定使用備份和恢復(fù)資源的若干應(yīng)用。例如,一位客戶可能具有一種零售應(yīng)用,包括一個存貨管理系統(tǒng)、一個銷售和配送系統(tǒng)以及一個記帳系統(tǒng)。客戶指定了各個系統(tǒng)時,本系統(tǒng)能夠使備份和恢復(fù)系統(tǒng)定位在一個更高的抽象級別。在這種情況下,最重要的系統(tǒng)獲得最高級別的服務(wù),并且恢復(fù)得更快。本系統(tǒng)也能夠在客戶的許多應(yīng)用、系統(tǒng)和部門之間,動態(tài)分配資源。
本系統(tǒng)為客戶提供了根據(jù)發(fā)展的業(yè)務(wù)需求和優(yōu)先權(quán),改變QoS規(guī)范的靈活性,而針對新業(yè)務(wù)目標所需的技術(shù)實施方案,則不必指定。例如,改變一種應(yīng)用對一個SOP的關(guān)系(或者升級或者降級,對應(yīng)于業(yè)務(wù)目標中的變化),能夠由本系統(tǒng)透明地管理,以提供新的QoS需求。
如果利用許用的技術(shù)無法滿足新的QoS需求,本系統(tǒng)有潛力產(chǎn)生一個警告,說明利用給定的IT基礎(chǔ)設(shè)施和/或SOE能力無法提供所需的QoS。如果利用現(xiàn)有的基礎(chǔ)設(shè)施無法達到更高的QoS,也能夠識別出(在升級的情況下)提供更高的QoS的硬件和軟件先決條件。
本系統(tǒng)通過定義應(yīng)用數(shù)據(jù)恢復(fù)業(yè)務(wù)度量的一種標準規(guī)范,提供了業(yè)務(wù)級別度量和提供所需QoS所需的潛在IT基礎(chǔ)設(shè)施技術(shù)之間的自動映射。這種分離允許或者改變QoS規(guī)范,或者改變潛在的IT技術(shù),而不影響另一方。本系統(tǒng)設(shè)計、執(zhí)行和改進了執(zhí)行策略,以確保提供期望的QoS。
本系統(tǒng)增強了其SOP/SOE規(guī)范能力,以確定對于一項給定任務(wù)所用的最優(yōu)技術(shù)。這些最優(yōu)技術(shù)來自許用的若干技術(shù),受到應(yīng)用環(huán)境的約束。除了應(yīng)用的工作負載和數(shù)據(jù)易失性以外,本系統(tǒng)也使用實際性能、基準和估計值的統(tǒng)計結(jié)果來確定最優(yōu)的備份和恢復(fù)策略。
本系統(tǒng)根據(jù)所獲得的最優(yōu)技術(shù),產(chǎn)生智能和最優(yōu)的計劃,以提供期望的QoS。此外,本系統(tǒng)在日程約束和資源利用極限之內(nèi)運行,而且分析實際執(zhí)行的結(jié)果。本系統(tǒng)確定最優(yōu)的備份和恢復(fù)策略,以提供期望的QoS。環(huán)境中的應(yīng)用數(shù)據(jù)對象、應(yīng)用工作負載、業(yè)務(wù)目標以及硬件/軟件基礎(chǔ)設(shè)施技術(shù)在動態(tài)改變,根據(jù)這些變化,連續(xù)地改進備份和恢復(fù)執(zhí)行策略。
一般說來,本系統(tǒng)類似于關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS)中的一種查詢優(yōu)化器,它根據(jù)訪問路徑和被查詢對象的統(tǒng)計結(jié)果,選擇最優(yōu)執(zhí)行策略。本系統(tǒng)從若干技術(shù)的許用選擇中,選擇最優(yōu)的備份/恢復(fù)技術(shù)。
RDBMS中的查詢優(yōu)化器自動地或者按要求再次優(yōu)化一項查詢的訪問路徑。觸發(fā)了再次優(yōu)化時,它就自動地考慮對象尺寸的變化和影響查詢的可用訪問路徑。本系統(tǒng)再次優(yōu)化備份和恢復(fù)執(zhí)行策略,以便適應(yīng)數(shù)據(jù)庫對象數(shù)目變化、對象的尺寸、對象的易失性、硬件/軟件配置的變化、應(yīng)用工作負載的變化以及業(yè)務(wù)應(yīng)用對QoS的潛在變化。
本系統(tǒng)設(shè)計和執(zhí)行一種最優(yōu)的備份和恢復(fù)策略,以便達到應(yīng)用數(shù)據(jù)可用性的QoS。此外,本系統(tǒng)還確定備份和恢復(fù)任務(wù)相關(guān)的最優(yōu)硬件和軟件技術(shù)。本系統(tǒng)從許用的技術(shù)中選擇最優(yōu)的可用技術(shù),連同從實際執(zhí)行、基準和解析模型收集的性能度量,以便達到業(yè)務(wù)目標。許用技術(shù)可能受到全系統(tǒng)的限制、SOP和應(yīng)用的約束。
本系統(tǒng)提供了多機種產(chǎn)品的支持,包括從許多客戶進行備份/恢復(fù)的工具。
本系統(tǒng)確定一種最優(yōu)的恢復(fù)執(zhí)行策略。在確定最優(yōu)恢復(fù)策略時考慮的因素包括●被損壞數(shù)據(jù)對象的相對重要性,●數(shù)據(jù)對象的損壞程度,●過去用于進行備份的技術(shù),以及●DBA對是否自動安排恢復(fù)任務(wù)的約束。
本系統(tǒng)通過運行時事件反饋、試探法和數(shù)據(jù)挖掘,對上述因素進行調(diào)整和改進。為了對備份和恢復(fù)執(zhí)行策略進行自動調(diào)整和改進,本系統(tǒng)監(jiān)視系統(tǒng)環(huán)境(既包括硬件也包括軟件)、應(yīng)用工作負載、數(shù)據(jù)庫對象的數(shù)目和尺寸、對象級別的數(shù)據(jù)易失性、業(yè)務(wù)目標和異常事件(比如任務(wù)失敗和數(shù)據(jù)庫對象故障)中的變化。
附圖簡要說明下面將參考以下的說明、權(quán)利要求書和附圖,更加詳細地介紹本發(fā)明的多種特性以及獲得它們的方式,適當時重復(fù)使用若干引用號,以指明所引用部件之間的對應(yīng)關(guān)系,其中
圖1是一幅示意圖,展示了一種示范性運行環(huán)境,其中能夠使用本發(fā)明的資源優(yōu)化系統(tǒng);圖2是一幅框圖,展示了圖1中資源優(yōu)化系統(tǒng)的高級別架構(gòu);圖3是一幅示意圖,描繪了圖1和圖2中資源優(yōu)化系統(tǒng)的操作;圖4是一幅處理流程圖,展示了圖1和圖2中資源優(yōu)化系統(tǒng)操作的一種方法;圖5表示了以上圖件中資源優(yōu)化系統(tǒng)的高級別框圖。
具體實施例方式
以下的定義和解釋提供了本發(fā)明的技術(shù)領(lǐng)域所屬的背景信息,并且意在有助于理解本發(fā)明而不限于其范圍因特網(wǎng)公共的和私有的計算機網(wǎng)絡(luò)的互聯(lián)集合,按照一套標準協(xié)議以路由器把它們鏈接在一起,形成一個全球分布的網(wǎng)絡(luò)。
并行技術(shù)為了備份或恢復(fù),同時使用不止一臺計算機,或者在同一計算機之內(nèi),同時使用不止一個處理器工作。
萬維網(wǎng)(WWW,也稱為Web)一個因特網(wǎng)客戶-服務(wù)器超文本分布式信息檢索系統(tǒng)。
圖1描繪了一個示范性整體環(huán)境,其中可以使用依據(jù)本發(fā)明自動和動態(tài)優(yōu)化資源的系統(tǒng)和相關(guān)的方法。資源優(yōu)化系統(tǒng)10包括一種軟件程序代碼或者說計算機程序產(chǎn)品,典型情況下它至少部分地嵌入或者說安裝在客戶提供的主機服務(wù)器15中。另外,系統(tǒng)10也能夠保存在一種適當?shù)拇鎯橘|(zhì)中,比如軟盤、CD、硬盤等設(shè)備。雖然將連同WWW介紹系統(tǒng)10,但是系統(tǒng)10也能夠與一個獨立的系統(tǒng)一起使用,比如數(shù)據(jù)庫、存儲系統(tǒng)等,只要它們已經(jīng)從WWW和/或其他來源獲得。
云形網(wǎng)絡(luò)20包括通信線路和交換機。網(wǎng)絡(luò)20提供了到例如WWW或因特網(wǎng)的通信路徑??蛻舻挠嬎銠C表示為多種計算機,比如計算機40、45、50。系統(tǒng)10利用直接連接,或者如圖1所示通過網(wǎng)絡(luò)20,控制著計算機40、45和50的資源優(yōu)化。
在一個實施例中,系統(tǒng)10嵌入在一臺主機服務(wù)器15中。主機服務(wù)器15能夠通過一條通信鏈接,比如電話、線纜、衛(wèi)星鏈接等連接方式,連接到網(wǎng)絡(luò)20。
系統(tǒng)10按照業(yè)務(wù)目標,也稱為應(yīng)用維度,對應(yīng)用數(shù)據(jù)恢復(fù)需求使用一種說明性規(guī)范。一種或多種定性的服務(wù)質(zhì)量(QoS)度量,關(guān)聯(lián)到這些應(yīng)用維度中的每一種。這種QoS度量稱為服務(wù)提供元素(SOE)。為了把關(guān)聯(lián)到每種應(yīng)用維度的定性QoS映射到所配置硬件和軟件產(chǎn)品(比如DBMS、存儲控制器)的一套技術(shù),提供了一種系統(tǒng)的方法,以達到業(yè)務(wù)目標。對于一種SOE之每個實例的集合,也定義了一種定性QoS。這種集合稱為服務(wù)提供包(SOP)。
系統(tǒng)10識別應(yīng)用數(shù)據(jù)恢復(fù)有關(guān)的一套業(yè)務(wù)級別的關(guān)鍵因素;這些因素稱為應(yīng)用數(shù)據(jù)恢復(fù)維度。維度的實例包括恢復(fù)時間(至故障點)、性能影響、保留時段(對于備份)以及邏輯數(shù)據(jù)恢復(fù)時間(也稱為時內(nèi)點恢復(fù)時間)。應(yīng)用數(shù)據(jù)恢復(fù)既應(yīng)用于遠程故障恢復(fù)站點,也應(yīng)用于在本地站點的恢復(fù)。在目前階段,故障恢復(fù)的考慮因素還沒有完全定義,因為另外的應(yīng)用維度還可能需要定義,以支持故障恢復(fù)能力。應(yīng)用數(shù)據(jù)恢復(fù)維度可以是可擴展的。
系統(tǒng)10允許每種維度具有一種或多種相關(guān)聯(lián)的定性度量與其關(guān)聯(lián)。每種定性度量都映射到潛在的IT基礎(chǔ)設(shè)施中的一種或多種潛在技術(shù),它們能夠用于提供應(yīng)用數(shù)據(jù)恢復(fù)維度的若干需求。每種這樣的定性度量都稱為一種服務(wù)提供元素(SOE)。對于恢復(fù)時間維度,SOE的實例可以包括“NORMAL(正常)”SOE、“FAST(快速)”SOE和“ULTRAFAST(特快)”SOE?!癗ORMAL”SOE可能僅僅使用數(shù)據(jù)庫順序備份、順序恢復(fù)和順序向前滾動技術(shù)。“FAST”SOE可能使用數(shù)據(jù)庫順序和并行技術(shù)。“ULTRAFAST”SOE可能使用數(shù)據(jù)庫順序技術(shù)、并行技術(shù)和存儲子系統(tǒng)“快照”/“快速拷貝”技術(shù)。對于一種給定的維度,可以定義任何數(shù)目的這種定性度量。
由系統(tǒng)10識別為關(guān)聯(lián)到SOE的潛在特性和技術(shù)既應(yīng)用于硬件,也應(yīng)用于軟件,它們都屬于不止一位客戶即15。能夠支持多客戶15的技術(shù)折衷混合,使系統(tǒng)10能夠?qū)崿F(xiàn)的QoS提供對硬件和軟件不偏不倚。
系統(tǒng)10定義了一個或多個SOP,每個SOP都表示一種具體的定性服務(wù)度量。圖2展示了系統(tǒng)10形成一種備份方法所用的元素;定性度量205、定量度量210以及客戶的獨特環(huán)境215。定性度量205包括若干SOE;每個SOE都把一種備份特性或技術(shù)轉(zhuǎn)換為一種備份能力級別,比如正常、快速等??蛻舻莫毺丨h(huán)境215包括受到備份的應(yīng)用、工作負載、客戶所用的機器、操作系統(tǒng)等。定量度量210提供了驅(qū)動該策略的若干數(shù)值。
示范性SOP可能包括白金SOP、金SOP、銀SOP等。圖3展示了業(yè)務(wù)級別可用性域300之內(nèi)的層次關(guān)系,包括應(yīng)用數(shù)據(jù)恢復(fù)維度305、SOP 310、SOE 315以及潛在的特性/技術(shù)320。在圖3中,一套示范的特性/技術(shù)320轉(zhuǎn)換為一套示范的SOE 315。
系統(tǒng)10允許客戶如服務(wù)器15按照客戶的獨特環(huán)境215,定義定制的SOE 315。系統(tǒng)10提供若干默認的SOE 315,客戶15也可以對其進行定制,以適應(yīng)他們的具體情況??蛻?5也可以對所提供的若干默認的SOP 310進行定制,以適應(yīng)他們的具體情況。系統(tǒng)10也允許客戶15定義若干定制的SOP 310,每一個都單獨映射到若干SOE 315??蛻?5也能夠修改所提供的默認SOP 310和SOE 315。
不需要客戶理解若干備份技術(shù)的多種細微差別。其實,向客戶呈現(xiàn)了幾種級別的SOP 310以及這些SOP 310中的每一個關(guān)于恢復(fù)響應(yīng)、性能影響和成本的隱含意義。反之,目前許用的大多數(shù)備份服務(wù)僅僅提供一種類型的備份,而沒有考慮客戶的需要。
圖3中一套示范的應(yīng)用維度305包括恢復(fù)時間325、性能影響330、數(shù)據(jù)保留期限335和邏輯恢復(fù)時間340。對于這些維度中的每一個,都存在著一定的許用技術(shù)或定量度量320,以達到客戶以及約定的QoS。系統(tǒng)10使用效率最高的許用技術(shù)320,在特定的應(yīng)用維度305之內(nèi)達到該QoS。因此,系統(tǒng)10沒有鎖定在任何一種特定的備份和恢復(fù)技術(shù)320中。
恢復(fù)時間325是指恢復(fù)數(shù)據(jù)到故障點所需的時間。為了示范的目的,恢復(fù)時間325可以按照正常、快速和特快來定義。如果客戶15期望恢復(fù)時間325的級別更多,也是可能做到的。系統(tǒng)10許可使用的可能技術(shù)為順序備份、順序恢復(fù)、順序向前滾動、并行備份、并行恢復(fù)、并行向前滾動、快速拷貝備份和快速拷貝恢復(fù)。這套技術(shù)是示范性的,在客戶15調(diào)整或去除新技術(shù)時,可以改變。
在這個實例中,一個正常恢復(fù)時間325使用了順序備份,順序恢復(fù)和順序向前滾動。一個快速恢復(fù)時間325除了實現(xiàn)正?;謴?fù)時間325使用的技術(shù)以外,還可能使用并行備份、并行恢復(fù)和并行向前滾動。一個特快恢復(fù)時間325除了實現(xiàn)快速恢復(fù)時間325使用的技術(shù)以外,還可能使用快速拷貝備份和快速拷貝恢復(fù)。
數(shù)據(jù)保留期限335是關(guān)于數(shù)據(jù)備份可以保留多長時間的應(yīng)用維度。在圖3的實例中,能夠選擇正常SOE 315——提供一個月的數(shù)據(jù)保留期限335,長SOE 315——提供6和月的保留期限或者一種定制值SOE 315。在這個實例中,客戶已經(jīng)選擇了18個月的數(shù)據(jù)保留期限335。
邏輯恢復(fù)時間340把應(yīng)用的數(shù)據(jù)恢復(fù)到期望的時點所需的時間量。
一種應(yīng)用可以關(guān)聯(lián)到一個具體的定性度量205(即SOP 310),客戶能夠隨后修改它,對一個現(xiàn)有的QoS級別,或者升級或者降級。典型情況下,一項應(yīng)用數(shù)據(jù)恢復(fù)需求映射到一個定性SOP 310。應(yīng)用數(shù)據(jù)恢復(fù)需求也應(yīng)當映射到每種應(yīng)用維度305的一個定量度量(例如,對于恢復(fù)時間325的維度是15分鐘),以便幫助客戶了解所承諾之定性QoS級別的每個方面。
對于一個給定的定性度量,定量度量取決于這個應(yīng)用運行的硬件和軟件平臺。系統(tǒng)10提供了一種模型,從一個定性度量映射到一個定量度量,以及反向映射。在所需的定量度量值已知并且必須確定對應(yīng)的定性度量的情況下,該模型從一個定量度量映射到一個定性度量。應(yīng)用關(guān)聯(lián)到一個定性度量而不是一個定量度量。這個模型最初開始于若干估計值和若干基準,隨后以多種配置的環(huán)境中的實測值來改進自身。
恢復(fù)時間325以分或秒測量,數(shù)據(jù)保留期限335以月測量,性能影響330以百分比測量,等等。例如,備份任務(wù)在其執(zhí)行的系統(tǒng)中不應(yīng)當消耗多于10%的非空閑資源。恢復(fù)時間325包括以下成分探測是否需要一次恢復(fù)的時間、決定恢復(fù)應(yīng)當何時進行及其延遲所需的時間以及對損壞的資源進行實際恢復(fù)的時間。大多數(shù)情況下,對損壞的資源進行恢復(fù)的時間就是QoS承諾的時間。
對于一個應(yīng)用的數(shù)據(jù)的可用性,系統(tǒng)10接受若干定性和定量的業(yè)務(wù)級別度量。按照這些度量,系統(tǒng)10設(shè)計、執(zhí)行和改進一種備份和恢復(fù)策略,以提供期望的QoS。系統(tǒng)10按照可變的業(yè)務(wù)目標、應(yīng)用工作負載和系統(tǒng)環(huán)境,使用最優(yōu)的技術(shù)和最優(yōu)的計劃,以提供期望的QoS。業(yè)務(wù)目標映射到所配置之硬件和軟件產(chǎn)品(比如DBMS、存儲控制器等)的一套技術(shù),以提供服務(wù)的若干層次。
為了執(zhí)行備份和/或恢復(fù)任務(wù),系統(tǒng)10從一套許用的技術(shù)(由SOP310定義)中選擇最優(yōu)的技術(shù)。連同從實際執(zhí)行、基準和解析模型收集的性能度量(包括應(yīng)用工作負載、數(shù)據(jù)易失性),選擇這些技術(shù)。
例如,一位客戶可能希望選擇一個白金級別的SOP 310。在圖3的情況下,一個白金級別的SOP 310允許系統(tǒng)10使用任何許用的備份、恢復(fù)或向前滾動技術(shù)320。性能影響330為最小,降低了10%(這是可消耗的非空閑資源的百分比)。數(shù)據(jù)保留期限335是可定制的;在這種情況下,客戶選擇18個月。
客戶請求一個級別的服務(wù),系統(tǒng)10就把該級別的服務(wù)轉(zhuǎn)換為若干應(yīng)用維度305和若干定量性能指標,比如擔(dān)保的恢復(fù)時間325、性能影響330、數(shù)據(jù)保留期限335和邏輯恢復(fù)時間340。相反,系統(tǒng)10也能夠把定量性能指標轉(zhuǎn)換為定性的度量,比如SOP 310。例如,客戶不在意SOP 310是銀、金還是白金,但是卻關(guān)注其系統(tǒng)的停機時間少于10分鐘以及實現(xiàn)該QoS的成本。
使用選定的技術(shù),系統(tǒng)10設(shè)計一種最優(yōu)的備份計劃,在客戶施加的應(yīng)用級別約束之內(nèi),達到應(yīng)用數(shù)據(jù)可用性的期望QoS。這些約束包括許用的產(chǎn)品/特性、備份計劃約束(操作的閉鎖窗口,以及一個任務(wù)運行之前或之后)以及執(zhí)行期間可用資源的許用消耗。系統(tǒng)10執(zhí)行以上設(shè)計的計劃,以提供期望的QoS,并且改進原始的執(zhí)行策略,以確保QoS需求持續(xù)地得到滿足。
圖4中的處理流程圖展示了系統(tǒng)10的操作方法400。系統(tǒng)10最初在方框405中標定資源使用模型和模板。系統(tǒng)10監(jiān)控業(yè)務(wù)目標、應(yīng)用的工作負載以及系統(tǒng)環(huán)境(比如硬件和軟件)中的變化,通過改進策略,按照需要對工作負載中的周期性變化以及系統(tǒng)配置中的改變進行調(diào)整,以便提供擔(dān)保的QoS。
在判斷框410,系統(tǒng)10判斷在業(yè)務(wù)目標、應(yīng)用的工作負載或者系統(tǒng)環(huán)境中是否發(fā)生了變化。如果發(fā)生了任何變化,并且如果需要(判斷框411),系統(tǒng)就在方框415修改現(xiàn)有的備份策略。系統(tǒng)10使用應(yīng)用工作負載和對象中的變化、異常事件、硬件和軟件配置中的變化、QoS一致性度量、對應(yīng)用數(shù)據(jù)可用性目標的改變以及資源使用模型和模板來修改現(xiàn)有的策略。隨著時間的流逝,若干算法自動使用在應(yīng)用環(huán)境中過去運行時測量的數(shù)目,以達到更準確的備份計劃,優(yōu)化系統(tǒng)資源的消耗。如果方法400在判斷框411判定即使已經(jīng)發(fā)生了變化(判斷框410),也不應(yīng)當修改現(xiàn)有的策略,那么系統(tǒng)10就記憶事件情況,換言之,已經(jīng)出現(xiàn)了變化而現(xiàn)有的策略沒有修改,以響應(yīng)這些變化。
系統(tǒng)10在方框420設(shè)計出一個最優(yōu)的執(zhí)行策略。在修改后的策略中包括在方框410中對應(yīng)用數(shù)據(jù)可用性目標已經(jīng)出現(xiàn)的任何變化。確定最優(yōu)恢復(fù)策略時考慮的因素包括●數(shù)據(jù)對象的損壞程度,以及●過去用于進行備份的技術(shù)。
本系統(tǒng)通過運行時事件反饋、試探法和數(shù)據(jù)挖掘,對以上全部因素進行調(diào)整和改進。為了對備份和恢復(fù)執(zhí)行策略進行自動調(diào)整和改進,本系統(tǒng)監(jiān)視系統(tǒng)環(huán)境(既包括硬件也包括軟件)、應(yīng)用工作負載、數(shù)據(jù)庫對象的數(shù)目和尺寸、對象級別的數(shù)據(jù)易失性、業(yè)務(wù)目標和異常事件(比如任務(wù)失敗和數(shù)據(jù)庫對象故障)中的變化。
在方框425,系統(tǒng)10執(zhí)行最優(yōu)策略。
在方框430,系統(tǒng)10采集若干度量并跟蹤若干變化,以便在修改備份和恢復(fù)策略時使用。這些度量包括運行時采集的執(zhí)行度量、捕捉異常事件以及自動發(fā)現(xiàn)應(yīng)用工作負載和應(yīng)用事件中的變化。此外,系統(tǒng)10還監(jiān)控系統(tǒng)的硬件和軟件配置以發(fā)現(xiàn)變化。然后,方法400的運行返回方框405,并且重復(fù)方框405至方框430。
系統(tǒng)10不斷監(jiān)控應(yīng)用的對象,尋找實際的或臨近的故障,并且以一種恢復(fù)策略來響應(yīng),以提供期望的QoS。判斷點包括是否根據(jù)DBA約束自動安排恢復(fù)、被損壞對象的相對重要性以及數(shù)據(jù)對象的損壞程度。此外,系統(tǒng)10還確定恢復(fù)任務(wù)使用哪個可用的備份影像,例如,恢復(fù)任務(wù)是使用一個存儲系統(tǒng)快速拷貝影像,還是使用一個數(shù)據(jù)庫系統(tǒng)備份影像。
例如,一個稱為Inventory Mgmt(存貨管理)的應(yīng)用注冊為金SOP 310。應(yīng)用環(huán)境包括以下部件操作系統(tǒng)AIX數(shù)據(jù)庫DB2 Version(版本)8數(shù)據(jù)駐留在DAS(直接附屬存儲)歸檔服務(wù)器TSM
應(yīng)用數(shù)據(jù)總規(guī)模25 GB日更新百分比應(yīng)用總數(shù)據(jù)的1%。對于這個實例,有一個模型可用,它根據(jù)所涉及的基礎(chǔ)設(shè)施、應(yīng)用的數(shù)據(jù)對象的數(shù)目和尺寸以及數(shù)據(jù)對象的易失性(在此列舉了涉及的幾個考慮因素),把金SOP 310轉(zhuǎn)換為若干定量的度量,用于其各個SOE 315。這個模型選擇快速恢復(fù)時間325、最小性能影響330以及數(shù)據(jù)長保留335。這些定性選擇的定量項示范表達如下RECOVERY_TIME_FAST->許用的技術(shù)為AIX_DB2_v8_backup_parallel,AIX_DB2_v8_recovery_parallel,AIX_DB2_v8_backup_incremental,AIX_DB2_v8_recovery_parallel,TSM_Backup_Compress,IBM_ESS_FLASHCOPY定量數(shù)為15分鐘PERFORMANCE_IMPACT_MINIMAL->許用的技術(shù)320為AIX_DB2_v8_throttle定量數(shù)對非空閑資源20%影響DATA_RETENTION_LONG->許用的技術(shù)320為TSM_Archive_Compress,定量數(shù)6個月根據(jù)允許金SOP 310使用的技術(shù)320,性能度量比如實際測量值、基準和估計值,應(yīng)用工作負載和數(shù)據(jù)易失性,系統(tǒng)10發(fā)現(xiàn),對于備份事件,使用的最優(yōu)技術(shù)為AIX_DB2_v8_backup_parallel(并行備份)和TSM_Backup_Compress(壓縮備份)。根據(jù)獲得的最優(yōu)技術(shù)、安排約束、資源使用極限,系統(tǒng)10發(fā)現(xiàn),為了達到QoS,應(yīng)當安排為每兩天備份一次。
一段時間之后,這個示范性應(yīng)用環(huán)境改變了。數(shù)據(jù)從DAS移向IBM ESS,應(yīng)用數(shù)據(jù)的總尺寸加倍至50GB。發(fā)現(xiàn)應(yīng)用數(shù)據(jù)尺寸中的這個顯著變化,是解析和挖掘引擎(圖5)的分析結(jié)果,并且確定為對提供期望QoS之能力的一個實際的或一個臨近的威脅。為了探索新的執(zhí)行策略,以便提供期望的QoS,觸發(fā)了一個自動改進過程。
系統(tǒng)10的改進過程導(dǎo)致對最優(yōu)技術(shù)的選擇進行修改,以及對備份和恢復(fù)計劃進行修改。對于備份事件,系統(tǒng)10發(fā)現(xiàn),它應(yīng)當使用IBM_ESS_FLASHCOPY(快速拷貝),TSM_Archive_Compress(壓縮歸檔)。系統(tǒng)10也發(fā)現(xiàn),現(xiàn)在能夠安排為每4天備份一次,仍然提供期望的QoS。
對于以下情況,應(yīng)當改進備份和恢復(fù)執(zhí)行策略●應(yīng)用轉(zhuǎn)換到另一個SOP 310。這可能是一次升級(青銅至白金)或者一次降級(金至青銅)。
●SOP 310映射到一套不同的SOE 315。
●SOE 315映射到一套不同的硬件和軟件技術(shù)。
●系統(tǒng)環(huán)境改變了,即增加了硬件、刪除硬件以及若干軟件技術(shù)/特征。
●應(yīng)用工作負載改變了,即數(shù)據(jù)庫對象的數(shù)目和尺寸、數(shù)據(jù)易失性和異常事件(比如任務(wù)失敗和數(shù)據(jù)庫對象故障)。
●對期望的QoS甚至對于實現(xiàn)服務(wù)有潛在或?qū)嶋H的不一致。
對于受影響的應(yīng)用,除了使可能已經(jīng)安排的事件潛在失效以外,系統(tǒng)10進行的重新評估還包括一項判斷,對于注冊到一個具體SOP310的應(yīng)用,是否能夠提供期望的QoS。重新評估進一步包括自動重新產(chǎn)生一種修改的執(zhí)行策略,以達到期望的QoS。
現(xiàn)在參考圖5,它表示資源優(yōu)化系統(tǒng)10的一幅示范性高級別框圖。在圖5中,附注505、510和515指的是示范性度量,把它們輸入到系統(tǒng)10中,以便設(shè)計一項最優(yōu)執(zhí)行策略(方框530)。在最優(yōu)執(zhí)行策略正在執(zhí)行時(方框540),系統(tǒng)10收集多種信息,包括但是不限于若干執(zhí)行度量、若干異常事件、應(yīng)用工作負載和對象的若干變化以及系統(tǒng)的硬件和軟件配置中的若干變化(方框545)。
在方框545收集的信息,饋入解析和挖掘引擎555。解析和挖掘引擎555分析應(yīng)用工作負載和對象變化565、異常事件570、QoS一致性度量575以及目標系統(tǒng)的硬件和軟件配置中的變化,并且使用這種信息,在需要時修改現(xiàn)有的策略(方框535),其中考慮了若干可變的條件(方框520、525)。
同時,解析和挖掘引擎555使用解析信息,在需要時標定資源使用模型和模板(方框550)。解析和挖掘引擎555存放標定后的資源使用模型和模板(方框525),把它們反饋到系統(tǒng)10(方框535),以便在需要時修改現(xiàn)有的策略。
然后,系統(tǒng)10在方框540執(zhí)行修改后的策略。
應(yīng)當理解,已經(jīng)介紹的本發(fā)明若干特定實施例僅僅展示了本發(fā)明原理的一定應(yīng)用。對本文介紹的自動和動態(tài)優(yōu)化備份資源的系統(tǒng)和方法發(fā)明,可以作出許多修改,而不脫離本發(fā)明的實質(zhì)和范圍。例如,雖然本文中連同若干備份和恢復(fù)應(yīng)用,僅僅為了展示的目的而介紹了本系統(tǒng),但是本領(lǐng)域的普通技術(shù)人員應(yīng)當充分清楚,本系統(tǒng)也能夠用于許多其他應(yīng)用。本文中介紹的服務(wù)提供包(SOP)和服務(wù)提供元素(SOE)概念,能夠超越應(yīng)用數(shù)據(jù)可用性,擴展到其他要求,比如性能。
權(quán)利要求
1.一種動態(tài)優(yōu)化多種應(yīng)用數(shù)據(jù)資源的方法,包括根據(jù)可變的系統(tǒng)環(huán)境和可變的系統(tǒng)工作負載,調(diào)整執(zhí)行策略;以及動態(tài)改進執(zhí)行策略,以提供約定的服務(wù)質(zhì)量并且優(yōu)化所述多種應(yīng)用數(shù)據(jù)資源。
2.根據(jù)權(quán)利要求1的方法,其特征在于,可變的系統(tǒng)環(huán)境包括改變的硬件。
3.根據(jù)權(quán)利要求1的方法,其特征在于,可變的系統(tǒng)環(huán)境包括改變的軟件。
4.根據(jù)權(quán)利要求1的方法,其特征在于,應(yīng)用數(shù)據(jù)資源包括若干備份和恢復(fù)對象。
5.根據(jù)權(quán)利要求1的方法,其特征在于,可變的工作負載考慮了在對備份和恢復(fù)對象產(chǎn)生數(shù)據(jù)修改的系統(tǒng)中,查詢、事務(wù)處理和使用的次數(shù)。
6.根據(jù)權(quán)利要求1的方法,其特征在于,如果可變的系統(tǒng)環(huán)境或可變的系統(tǒng)工作負載中的任何一種或多種確定為可能對要向一個系統(tǒng)提供的所擔(dān)保服務(wù)質(zhì)量QoS造成有利或不利影響,就重新調(diào)整執(zhí)行策略,以提供擔(dān)保的QoS。
7.根據(jù)權(quán)利要求6的方法,其特征在于,如果可變的系統(tǒng)環(huán)境和可變的系統(tǒng)工作負載確定為不會可能對擔(dān)保的QoS造成有利或不利的影響,就使執(zhí)行策略保持不變并且記錄執(zhí)行策略沒有改變的事實,以響應(yīng)可變的系統(tǒng)環(huán)境和工作負載。
8.根據(jù)權(quán)利要求4的方法,其特征在于,執(zhí)行策略包括一份備份和恢復(fù)計劃。
9.根據(jù)權(quán)利要求8的方法,其特征在于,調(diào)整執(zhí)行策略包括在新的對象加入或現(xiàn)有的對象去除時,判斷是否需要調(diào)整備份頻率。
10.根據(jù)權(quán)利要求9的方法,其特征在于,調(diào)整執(zhí)行策略包括確定要使用的備份技術(shù)。
11.根據(jù)權(quán)利要求10的方法,其特征在于,調(diào)整執(zhí)行策略包括確定要使用的恢復(fù)技術(shù)。
12.根據(jù)權(quán)利要求1的方法,其特征在于,動態(tài)改進執(zhí)行策略包括連續(xù)地監(jiān)控和響應(yīng)可變的系統(tǒng)環(huán)境和工作負載,而無須客戶輸入。
13.根據(jù)權(quán)利要求12的方法,其特征在于,動態(tài)改進執(zhí)行策略包括根據(jù)運行時的實際統(tǒng)計結(jié)果,改進執(zhí)行策略的粗糙性,以改善擔(dān)保的服務(wù)質(zhì)量QoS。
14.根據(jù)權(quán)利要求1的方法,其特征在于,應(yīng)用數(shù)據(jù)資源包括應(yīng)用數(shù)據(jù)資源的折衷混合。
15.根據(jù)權(quán)利要求1的方法,其特征在于,動態(tài)改進執(zhí)行策略包括使執(zhí)行策略跨越多個系統(tǒng)。
16.根據(jù)權(quán)利要求1的方法,其特征在于,所述多種應(yīng)用數(shù)據(jù)資源在應(yīng)用級別許用。
17.根據(jù)權(quán)利要求1的方法,進一步包括將多個應(yīng)用維度關(guān)聯(lián)到若干許用的技術(shù)。
18.根據(jù)權(quán)利要求17的方法,其特征在于,所述多個應(yīng)用維度包括恢復(fù)時間、性能影響、數(shù)據(jù)保留期限和邏輯恢復(fù)時間。
19.根據(jù)權(quán)利要求18的方法,其特征在于,將多個應(yīng)用維度關(guān)聯(lián)到若干許用的技術(shù)的步驟包括引入與每個應(yīng)用維度關(guān)聯(lián)的多個服務(wù)提供元素SOE。
20.根據(jù)權(quán)利要求19的方法,其特征在于,對于每個服務(wù)提供包SOP,存在與每個應(yīng)用維度關(guān)聯(lián)的一個且僅有一個SOE;以及其中,每個SOE關(guān)聯(lián)到至少一項許用技術(shù)。
21.一種計算機程序產(chǎn)品,具有多個嵌入在介質(zhì)上的指令代碼,用于動態(tài)優(yōu)化多種應(yīng)用數(shù)據(jù)資源,包括第一指令代碼集,用于根據(jù)可變的系統(tǒng)環(huán)境和可變的系統(tǒng)工作負載,調(diào)整執(zhí)行策略;以及第二指令代碼集,用于動態(tài)改進執(zhí)行策略,以提供約定的服務(wù)質(zhì)量并且優(yōu)化所述多種應(yīng)用數(shù)據(jù)資源。
22.根據(jù)權(quán)利要求21的計算機程序產(chǎn)品,其特征在于,如果可變的系統(tǒng)環(huán)境或可變的系統(tǒng)工作負載中的任何一種或多種被確定為可能對要向一個系統(tǒng)提供的所擔(dān)保服務(wù)質(zhì)量QoS造成有利或不利影響,第一指令代碼集就重新調(diào)整執(zhí)行策略,以提供擔(dān)保的QoS。
23.根據(jù)權(quán)利要求22的計算機程序產(chǎn)品,其特征在于,如果可變的系統(tǒng)環(huán)境和可變的系統(tǒng)工作負載被確定為不會可能對擔(dān)保的QoS造成有利或不利的影響,第一指令代碼集就使執(zhí)行策略保持不變,并且有第三指令代碼集記錄執(zhí)行策略沒有改變的事實,以響應(yīng)可變的系統(tǒng)環(huán)境和工作負載。
24.根據(jù)權(quán)利要求21的計算機程序產(chǎn)品,其特征在于,執(zhí)行策略包括一份備份和恢復(fù)計劃。
25.根據(jù)權(quán)利要求21的計算機程序產(chǎn)品,其特征在于,第二指令代碼集根據(jù)運行時的實際統(tǒng)計結(jié)果,改進執(zhí)行策略的粗糙性,以改善擔(dān)保的服務(wù)質(zhì)量QoS。
26.根據(jù)權(quán)利要求21的計算機程序產(chǎn)品,其特征在于,第二指令代碼集使執(zhí)行策略跨越多個系統(tǒng)。
27.根據(jù)權(quán)利要求21的計算機程序產(chǎn)品,其特征在于,進一步包括第四指令代碼集,用于將多個應(yīng)用維度關(guān)聯(lián)到若干許用的技術(shù)。
28.根據(jù)權(quán)利要求27的計算機程序產(chǎn)品,其特征在于,所述多個應(yīng)用維度包括恢復(fù)時間、性能影響、數(shù)據(jù)保留期限和邏輯恢復(fù)時間。
29.根據(jù)權(quán)利要求28的計算機程序產(chǎn)品,其特征在于,第四指令代碼集將多個應(yīng)用維度關(guān)聯(lián)到若干許用的技術(shù)的步驟,包括引入與每個應(yīng)用維度相關(guān)聯(lián)的多個服務(wù)提供元素SOE。
30.根據(jù)權(quán)利要求29的計算機程序產(chǎn)品,其特征在于,對于每個服務(wù)提供包SOP,存在與每個應(yīng)用維度關(guān)聯(lián)的一個且僅有一個SOE;以及其中,每個SOE關(guān)聯(lián)到至少一項許用技術(shù)。
31.一種動態(tài)優(yōu)化多種應(yīng)用數(shù)據(jù)資源的系統(tǒng),包括根據(jù)可變的系統(tǒng)環(huán)境和可變的系統(tǒng)工作負載,調(diào)整執(zhí)行策略所用的裝置;以及動態(tài)改進執(zhí)行策略所用的裝置,以提供約定的服務(wù)質(zhì)量并且優(yōu)化所述多種應(yīng)用數(shù)據(jù)資源。
32.根據(jù)權(quán)利要求31的系統(tǒng),其特征在于,如果可變的系統(tǒng)環(huán)境或可變的系統(tǒng)工作負載中的任何一種或多種被確定為可能對要向一個系統(tǒng)提供的所擔(dān)保服務(wù)質(zhì)量QoS造成有利或不利影響,調(diào)整裝置就重新調(diào)整執(zhí)行策略,以提供擔(dān)保的QoS。
33.根據(jù)權(quán)利要求32的系統(tǒng),其特征在于,如果可變的系統(tǒng)環(huán)境和可變的系統(tǒng)工作負載確定為不會可能對擔(dān)保的QoS造成有利或不利的影響,調(diào)整裝置就使執(zhí)行策略保持不變并且記錄執(zhí)行策略沒有改變的事實,以響應(yīng)可變的系統(tǒng)環(huán)境和工作負載。
34.根據(jù)權(quán)利要求31的系統(tǒng),其特征在于,執(zhí)行策略包括一份備份和恢復(fù)計劃。
35.根據(jù)權(quán)利要求31的系統(tǒng),其特征在于,改進裝置根據(jù)運行時的實際統(tǒng)計結(jié)果,改進執(zhí)行策略的粗糙性,以改善擔(dān)保的服務(wù)質(zhì)量QoS。
36.根據(jù)權(quán)利要求31的系統(tǒng),其特征在于,改進裝置使執(zhí)行策略跨越多個系統(tǒng)。
37.根據(jù)權(quán)利要求31的系統(tǒng),進一步包括用于將多個應(yīng)用維度關(guān)聯(lián)到若干許用技術(shù)的裝置。
38.根據(jù)權(quán)利要求31的系統(tǒng),其特征在于,所述多個應(yīng)用維度包括恢復(fù)時間、性能影響、數(shù)據(jù)保留期限和邏輯恢復(fù)時間。
39.根據(jù)權(quán)利要求38的系統(tǒng),其特征在于,關(guān)聯(lián)裝置引入對應(yīng)于每個應(yīng)用維度的多個服務(wù)提供元素SOE。
40.根據(jù)權(quán)利要求39的系統(tǒng),其特征在于,對于每個服務(wù)提供包SOP,存在與每個應(yīng)用維度關(guān)聯(lián)的一個且僅有一個SOE;以及其中,每個SOE關(guān)聯(lián)到至少一項許用技術(shù)。
全文摘要
一種系統(tǒng)和方法,自動地和動態(tài)地優(yōu)化可用的若干資源,以滿足應(yīng)用數(shù)據(jù)可用性和業(yè)務(wù)目標。在一個實施例中,一種備份和數(shù)據(jù)恢復(fù)系統(tǒng)按照客戶的環(huán)境、工作負載和業(yè)務(wù)目標,連續(xù)地動態(tài)調(diào)整備份和恢復(fù)過程。對恢復(fù)和備份造成的停機時間的可接受容忍,影響客戶的業(yè)務(wù)或系統(tǒng)運作。本系統(tǒng)從高級別的業(yè)務(wù)環(huán)境確定備份和恢復(fù)計劃的細節(jié)。本系統(tǒng)接受基于業(yè)務(wù)目標的應(yīng)用數(shù)據(jù)可用性策略,并且設(shè)計、執(zhí)行和改進資源最優(yōu)化備份和恢復(fù)策略,以便在應(yīng)用工作負載、業(yè)務(wù)目標和硬件/軟件基礎(chǔ)設(shè)施技術(shù)都在動態(tài)可變的環(huán)境中,提供期望的服務(wù)質(zhì)量。此外,本系統(tǒng)還在閉鎖的窗口外部進行備份,以便對客戶的系統(tǒng)影響最小。
文檔編號H02H3/05GK1595365SQ20041006964
公開日2005年3月16日 申請日期2004年7月15日 優(yōu)先權(quán)日2003年7月16日
發(fā)明者納格拉伊·拉馬昌德蘭·阿魯爾, 維特哈爾·M·高蓋特, 英德帕爾·辛格·納郎, 拉馬尼·蘭加恩·魯特萊伊, 馬哈德萬·蘇布拉馬年 申請人:國際商業(yè)機器公司