用于融合、存儲(chǔ)和檢索增量式備份數(shù)據(jù)的方法和系統(tǒng)的制作方法
【專(zhuān)利摘要】一種管理備份數(shù)據(jù)的方法。該方法包括經(jīng)由備份管理器存取初始快照的索引數(shù)據(jù)并經(jīng)由所述備份管理器存取隨后快照的索引數(shù)據(jù)。該方法還包括經(jīng)由所述備份管理器判斷所述隨后快照的索引數(shù)據(jù)是否與所述初始快照的索引數(shù)據(jù)不同。響應(yīng)于判斷所述隨后快照的索引數(shù)據(jù)與所述初始快照的索引數(shù)據(jù)不同,創(chuàng)建更新的索引數(shù)據(jù)并采用所述更新的索引數(shù)據(jù)來(lái)創(chuàng)建更新的快照。
【專(zhuān)利說(shuō)明】用于融合、存儲(chǔ)和檢索增量式備份數(shù)據(jù)的方法和系統(tǒng)
[0001]相關(guān)申請(qǐng)的交叉引用
[0002]本專(zhuān)利申請(qǐng)要求于2011年11月18日提交的U.S.專(zhuān)利申請(qǐng)N0.61/561,621的優(yōu)先權(quán),該申請(qǐng)以應(yīng)用的方式結(jié)合于此。
【技術(shù)領(lǐng)域】
[0003]本發(fā)明一般設(shè)計(jì)計(jì)算機(jī)系統(tǒng)并且更特別地,設(shè)計(jì)用于有效融合、存儲(chǔ)和檢索增量式備份數(shù)據(jù)的方法和系統(tǒng),但并不限于該限定的方式。
現(xiàn)有技術(shù)
[0004]現(xiàn)在,可靠的數(shù)據(jù)備份是計(jì)算機(jī)系統(tǒng)的重要需求。傳統(tǒng)的備份系統(tǒng)通常通過(guò)將文件系統(tǒng)復(fù)制到數(shù)據(jù)存儲(chǔ)媒介(諸如磁帶或光盤(pán))上來(lái)執(zhí)行備份。對(duì)于包含大量數(shù)據(jù)的文件系統(tǒng),復(fù)制處理常?;ㄙM(fèi)很長(zhǎng)的時(shí)間。因此,傳統(tǒng)的備份執(zhí)行得相對(duì)少,諸如每日或每周。最近,已經(jīng)提供了 “快照”型備份系統(tǒng)和/或程序,該系統(tǒng)和/或程序能夠在每次用戶請(qǐng)求的情況下更加頻繁地存儲(chǔ)備份數(shù)據(jù)。然而,使用備份數(shù)據(jù)來(lái)恢復(fù)特定文件或其他存儲(chǔ)的對(duì)象,諸如特定的之前版本的文件,用戶需要經(jīng)歷漫長(zhǎng)的恢復(fù)操作。可能包括文件的每個(gè)備份數(shù)據(jù)設(shè)置被用于將源數(shù)據(jù)設(shè)置“恢復(fù)”為與備份數(shù)據(jù)相關(guān)聯(lián)的狀態(tài),并接著所恢復(fù)的數(shù)據(jù)設(shè)置的文件系統(tǒng)被遍歷以搜索需要的文件。這種恢復(fù)和瀏覽方式消耗過(guò)多的時(shí)間和資源,特別地利用越來(lái)越頻繁地產(chǎn)生的備份數(shù)據(jù),允許如“快照”及相關(guān)的技術(shù)。因此,具有一種使用戶更快并更容易訪問(wèn)備份數(shù)據(jù)中的特定文件和其他對(duì)象的方式是有益的。
[0005]此外,隨著信息的價(jià)值和使用的持續(xù)增長(zhǎng),個(gè)人和商業(yè)尋求處理和存儲(chǔ)信息的其他方式。一種可用于用戶的選擇是信息處理系統(tǒng)。信息處理系統(tǒng)一般對(duì)信息或數(shù)據(jù)進(jìn)行處理、編譯、存儲(chǔ)和/或傳達(dá),以用于商業(yè)、個(gè)人或其他目的,因而允許用戶利用信息的價(jià)值。因?yàn)榧夹g(shù)和信息處理需要并要求在不同用戶或應(yīng)用之間進(jìn)行變化,信息處理系統(tǒng)還可以改變關(guān)于處理什么信息、怎樣處理、存儲(chǔ)或傳達(dá)信息,以及怎樣快速并有效地處理、存儲(chǔ)或傳達(dá)信息。信息處理系統(tǒng)中的改變?cè)试S信息處理系統(tǒng)被整體或配置用于特定用戶或特定的使用,諸如金融事務(wù)處理、飛機(jī)票預(yù)訂、企業(yè)數(shù)據(jù)存儲(chǔ)或全球通信。此外,信息處理系統(tǒng)可以包括可以被配置為處理、存儲(chǔ)和傳達(dá)信息的各種硬件和軟件組件,還可以包括一個(gè)或多個(gè)計(jì)算機(jī)系統(tǒng)、數(shù)據(jù)存儲(chǔ)系統(tǒng)和網(wǎng)絡(luò)連接系統(tǒng)。
【發(fā)明內(nèi)容】
[0006]一種管理備份數(shù)據(jù)的方法。該方法包括經(jīng)由備份管理器存取初始快照的索引數(shù)據(jù)以及經(jīng)由所述備份管理器存取隨后快照的索引數(shù)據(jù)。該方法還包括經(jīng)由所述備份管理器判斷所述隨后快照的索引數(shù)據(jù)是否與所述初始快照的索引數(shù)據(jù)不同。響應(yīng)于判斷所述隨后快照的索引數(shù)據(jù)與所述初始快照的索引數(shù)據(jù)不同,創(chuàng)建更新的索引數(shù)據(jù)以及采用所述更新的索引數(shù)據(jù)來(lái)創(chuàng)建更新的快照。
[0007]—種信息處理系統(tǒng)。該系統(tǒng)包括備份管理器,可互操作地耦合至客戶端,并適于提供以預(yù)定間隔進(jìn)行初始快照和隨后快照并創(chuàng)建初始索引數(shù)據(jù)和隨后索引數(shù)據(jù)的指示。所述備份管理器存取所述初始索引數(shù)據(jù)和所述隨后索引數(shù)據(jù),并響應(yīng)于判斷所述隨后索引數(shù)據(jù)與所述初始索引數(shù)據(jù)不同來(lái)存取更新的快照和更新的索引數(shù)據(jù)。
[0008]一種用于管理備份數(shù)據(jù)的產(chǎn)品,包括至少一個(gè)計(jì)算機(jī)可讀介質(zhì)和處理器指令,該處理器指令包含在所述至少一個(gè)計(jì)算機(jī)可讀介質(zhì)上,所述處理器指令被配置為通過(guò)至少一個(gè)處理器可讀所述至少一個(gè)計(jì)算機(jī)可讀介質(zhì)并因而使所述至少一個(gè)處理器操作以執(zhí)行:經(jīng)由備份管理器存取初始快照的索引數(shù)據(jù)、經(jīng)由所述備份管理器存取隨后快照的索引數(shù)據(jù)、經(jīng)由所述備份管理器判斷所述隨后快照的索引數(shù)據(jù)是否與所述初始快照的索引數(shù)據(jù)不同。響應(yīng)于判斷所述隨后快照的索引數(shù)據(jù)與所述初始快照的索引數(shù)據(jù)不同,創(chuàng)建更新的索引數(shù)據(jù)并采用所述更新的索引數(shù)據(jù)來(lái)創(chuàng)建更新的快照。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0009]可以通過(guò)參照以下結(jié)合附圖的具體說(shuō)明獲得對(duì)本發(fā)明的方法和系統(tǒng)的更加完整的理解,其中:
[0010]圖1是根據(jù)示例性實(shí)施方式的用于執(zhí)行備份操作的備份系統(tǒng)的框圖;
[0011]圖2示出了根據(jù)示例性實(shí)施方式的快照的索引結(jié)構(gòu);
[0012]圖3示出了根據(jù)示例性實(shí)施方式的匯總操作;以及
[0013]圖4是根據(jù)示例性實(shí)施方式示出數(shù)據(jù)匯總的流程圖。
【具體實(shí)施方式】
[0014]將參照附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行更加充分的描述。然而,本發(fā)明可以以多種不同的形式實(shí)施,并且不應(yīng)當(dāng)被限制于這里所述的實(shí)施方式。本發(fā)明應(yīng)當(dāng)被考慮僅由現(xiàn)在及與其等同的權(quán)利要求所限定。
[0015]隨著備份數(shù)據(jù)的量繼續(xù)呈指數(shù)增長(zhǎng),更需要有效的存檔和檢索數(shù)據(jù)的機(jī)制?,F(xiàn)代的備份處理包括,例如,基于影像的備份和增量式備份。基于影像的備份處理為用于計(jì)算機(jī)或虛擬機(jī)(VM)的備份處理,該備份處理創(chuàng)造了操作系統(tǒng)(OS)及所有與其相關(guān)聯(lián)的數(shù)據(jù)(包括系統(tǒng)狀態(tài)和應(yīng)用配置)的復(fù)制品。備份被保存為單個(gè)文件,該單個(gè)文件被稱(chēng)為影像。相反,增量式備份是僅幅值自上次備份以后改變的文件的備份處理。例如,如果全部備份在星期一執(zhí)行,星期二的增量式備份將僅備份自星期一的備份以后改變的文件。星期三的增量式備份將僅備份自星期二的增量式備份以后改變的文件。增量式備份的至少一個(gè)好處在于每天備份較少的文件,允許較短的備份窗口。
[0016]圖1是根據(jù)示例性實(shí)施方式的用于執(zhí)行備份操作的備份系統(tǒng)的框圖。備份系統(tǒng)100包括客戶端102、信息存儲(chǔ)104、備份管理器105和存儲(chǔ)設(shè)備112??蛻舳?02包括至少一個(gè)數(shù)據(jù)代理107。在一般的實(shí)施方式中,數(shù)據(jù)代理107可以被實(shí)施為例如計(jì)算機(jī)代碼、硬件設(shè)備、軟件/硬件組合或任何其他適當(dāng)?shù)南到y(tǒng)。通常,數(shù)據(jù)代理107負(fù)責(zé)從信息存儲(chǔ)104中檢索數(shù)據(jù)。存儲(chǔ)在信息存儲(chǔ)104中的數(shù)據(jù)從屬于備份操作并系統(tǒng)性地包括所組織的數(shù)據(jù)組,諸如文件、目錄、數(shù)據(jù)庫(kù)或其他適當(dāng)?shù)臄?shù)據(jù)對(duì)象。數(shù)據(jù)代理107提供至信息存儲(chǔ)104的接口以執(zhí)行數(shù)據(jù)備份,該數(shù)據(jù)備份包括例如復(fù)制數(shù)據(jù)、獲取數(shù)據(jù)并攜帶數(shù)據(jù)組的大量快照106。[0017]在典型的實(shí)施方式中,數(shù)據(jù)管理器105可以為例如軟件模塊或協(xié)調(diào)并控制備份系統(tǒng)100的其他組件(例如,客戶端105和存儲(chǔ)設(shè)備1112)的應(yīng)用程序。備份管理器105包括例如索引服務(wù)模塊108和索引數(shù)據(jù)庫(kù)110。在典型的實(shí)施方式中,索引服務(wù)模塊108管理索引數(shù)據(jù)庫(kù)110。備份管理器105與數(shù)據(jù)代理107進(jìn)行通信以控制和管理備份操作,諸如,快照創(chuàng)建、數(shù)據(jù)轉(zhuǎn)移、數(shù)據(jù)恢復(fù)及其他備份操作。根據(jù)示例性實(shí)施方式,備份數(shù)據(jù)文件可以被存儲(chǔ)在信息存儲(chǔ)104、索引數(shù)據(jù)庫(kù)110和存儲(chǔ)設(shè)備112中的至少一者中。在典型的實(shí)施方式中,存儲(chǔ)設(shè)備112可以為面向?qū)ο蟮臄?shù)據(jù)庫(kù),諸如對(duì)象存儲(chǔ)(Objectstore)數(shù)據(jù)庫(kù)。對(duì)象存儲(chǔ)數(shù)據(jù)庫(kù)是商業(yè)對(duì)象數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)被設(shè)計(jì)為處理通過(guò)使用面向?qū)ο缶幊碳夹g(shù)的應(yīng)用程序來(lái)創(chuàng)建的數(shù)據(jù)。
[0018]如圖1所示的示例,備份系統(tǒng)100包括從屬于備份操作的數(shù)據(jù)。例如,用于備份的數(shù)據(jù)包括各種類(lèi)型的系統(tǒng)上組織的數(shù)據(jù)組,該數(shù)據(jù)組包括文件、目錄、數(shù)據(jù)庫(kù)或其他適當(dāng)?shù)臄?shù)據(jù)對(duì)象。在典型的實(shí)施方式中,用于備份的數(shù)據(jù)文件可以位于例如數(shù)據(jù)存儲(chǔ)104中。根據(jù)示例性實(shí)施方式,數(shù)據(jù)組的多個(gè)快照106在不同的時(shí)間進(jìn)行。這里所使用的術(shù)語(yǔ)”快照”是指文件或設(shè)備的虛擬復(fù)制品以及模仿文件或設(shè)備在進(jìn)行快照的精確時(shí)間的狀況??煺詹皇菙?shù)據(jù)組的復(fù)制品,而僅是在數(shù)據(jù)組怎樣被組織的時(shí)間的圖片。在典型的實(shí)施方式中,快照可以固定的間隔進(jìn)行并提供用于備份操作的數(shù)據(jù)組的一致看法。
[0019]各種用于進(jìn)行快照的技術(shù)在不同的系統(tǒng)實(shí)施中被采用。例如,在一些系統(tǒng)中,特定目的的設(shè)備驅(qū)動(dòng)器在數(shù)據(jù)組被創(chuàng)建或修改時(shí)復(fù)制在多個(gè)盤(pán)上的數(shù)據(jù)組。在系統(tǒng)發(fā)出進(jìn)行快照的命令時(shí),指定的盤(pán)上的數(shù)據(jù)組被保存并用作用于備份目的的數(shù)據(jù)組的快照。最大數(shù)量的快照依賴于備份系統(tǒng)的實(shí)施。不同的快照可以使用例如各種數(shù)字、時(shí)間戳或其他適當(dāng)?shù)淖R(shí)別技術(shù)而被識(shí)別。在一些實(shí)施方式中,為了給新的快照騰出空間,較舊的快照可以被刪除或重寫(xiě)。
[0020]根據(jù)示例性實(shí)施方式,備份管理器105發(fā)出以預(yù)定間隔(諸如每三十分鐘)對(duì)信息存儲(chǔ)104內(nèi)的數(shù)據(jù)組進(jìn)行快照106的命令。備份管理器105可以進(jìn)一步實(shí)施需要對(duì)自初始快照106以后發(fā)生改變的數(shù)據(jù)組進(jìn)行快照106的規(guī)則、策略或指令集合。同樣地,隨后快照106僅復(fù)制改變的數(shù)據(jù)組。在典型的實(shí)施方式中,數(shù)據(jù)代理107監(jiān)控信息存儲(chǔ)104中的數(shù)據(jù)組以為了得到任何的改變。當(dāng)在數(shù)據(jù)組中的改變被識(shí)別時(shí),數(shù)據(jù)組被公開(kāi)并且他們的內(nèi)容通過(guò)索引服務(wù)模塊108進(jìn)行索引。
[0021]在典型的實(shí)施方式中,索引服務(wù)模塊108管理索引數(shù)據(jù)庫(kù)110。所以數(shù)據(jù)庫(kù)110包括對(duì)應(yīng)于有關(guān)在多個(gè)快照106中的數(shù)據(jù)對(duì)象的信息的索引數(shù)據(jù)。索引數(shù)據(jù)為備份系統(tǒng)100提供用于定位、瀏覽、搜索或另外索引存儲(chǔ)在多個(gè)快照106中的數(shù)據(jù).對(duì)象的有效的機(jī)制。在典型的實(shí)施方式中,索引服務(wù)模塊108被配置為基于對(duì)在多個(gè)快照106中的數(shù)據(jù)對(duì)象的修改來(lái)更新索引數(shù)據(jù)庫(kù)110內(nèi)的索引數(shù)據(jù)。
[0022]為了避免存儲(chǔ)大小的增長(zhǎng),諸如備份系統(tǒng)100的備份系統(tǒng)采取保留策略。例如,考慮以每15分鐘或一天96個(gè)增量式備份而進(jìn)行增量式快照的備份系統(tǒng)。在這種設(shè)置中,組織保留策略可以規(guī)定兩周之前的備份應(yīng)當(dāng)減少至30分鐘的分辨率(resolution)或?qū)⒁粋€(gè)月之前的備份應(yīng)當(dāng)減少至一個(gè)小時(shí)的分辨率。此外,保留策略可以進(jìn)一步規(guī)定三個(gè)月之前的備份應(yīng)當(dāng)減少至一天的分辨率。這種減少快照分辨率的保留策略大大減少了磁盤(pán)存儲(chǔ)塊中大量的重復(fù)復(fù)制品。這通過(guò)將更高分辨率的快照與單個(gè)較低分辨率快照融合來(lái)實(shí)現(xiàn)。將更高分辨率的快照與單個(gè)較低分辨率快照融合簡(jiǎn)稱(chēng)是匯總操作。
[0023]為了實(shí)施匯總操作,備份系統(tǒng)閱讀連續(xù)快照集合中的所有索引數(shù)據(jù),其中索引數(shù)據(jù)標(biāo)識(shí)了在該快照中改變的特定磁盤(pán)頁(yè)以及對(duì)應(yīng)的快照數(shù)據(jù)文件中磁盤(pán)頁(yè)的內(nèi)容的位置。接下來(lái),匯總操作將磁盤(pán)頁(yè)的最近復(fù)制品寫(xiě)出至新的快照數(shù)據(jù)文件并將其對(duì)應(yīng)的索引數(shù)據(jù)寫(xiě)入新的快照索引文件。該操作繼續(xù)進(jìn)行直至連續(xù)快照集合中所有快照索引數(shù)據(jù)入口均用完。以上公開(kāi)的實(shí)施保留策略的方法在需要的存儲(chǔ)讀取和寫(xiě)入操作的數(shù)量上是昂貴的。而索引數(shù)據(jù)入口很小(如,很少比特),磁盤(pán)頁(yè)通常非常大(如,幾百個(gè)比特至即使/幾百個(gè)千比特)。讀取磁盤(pán)頁(yè)并將其寫(xiě)入新的快照文件代表在匯總處理中是非常昂貴的操作,并且,這種為了適度大小的備份操作的保留策略誘發(fā)的融合操作通常要花費(fèi)超過(guò)八個(gè)小時(shí)。
[0024]文件系統(tǒng)中存儲(chǔ)的基本單位是被配置為存儲(chǔ)任意大量的數(shù)據(jù)的文件。文件系統(tǒng)保持非常大量的元數(shù)據(jù)以追蹤每個(gè)文件的內(nèi)容。因此,文件系統(tǒng)不適于存儲(chǔ)小片段的數(shù)據(jù)。與文件系統(tǒng)相反,在對(duì)象存儲(chǔ)中,提取的基本單位是表示固定量數(shù)據(jù)的對(duì)象。對(duì)象存儲(chǔ)提供了創(chuàng)建、讀取或?qū)懭肴繉?duì)象的方法。通過(guò)更多的限制該文件系統(tǒng),對(duì)象存儲(chǔ)需要非常少的元數(shù)據(jù)來(lái)表示對(duì)象并且高效地用于存儲(chǔ)小數(shù)據(jù)。
[0025]為了融合文件系統(tǒng)中兩個(gè)文件的內(nèi)容,每個(gè)文件的內(nèi)容被讀取并被寫(xiě)入第三個(gè)文件,即使兩個(gè)文件的內(nèi)容未發(fā)生改變。這導(dǎo)致了極高的IO負(fù)載,這種極高的IO負(fù)載使匯總操作出現(xiàn)高度的效率低下。為了給匯總操作創(chuàng)建有效機(jī)制,示例性實(shí)施方式利用存儲(chǔ)小單元數(shù)據(jù)中的對(duì)象存儲(chǔ)的效率。根據(jù)示例性實(shí)施方式,每個(gè)磁盤(pán)頁(yè)被存儲(chǔ)為通過(guò)對(duì)象存儲(chǔ)中的對(duì)象標(biāo)識(shí)符標(biāo)識(shí)的唯一對(duì)象。相應(yīng)地,快照索引文件將改變的頁(yè)關(guān)聯(lián)至對(duì)象存儲(chǔ)中的對(duì)象。利用用于匯總操作的對(duì)象存儲(chǔ)的示例性實(shí)施方式現(xiàn)在包括在磁盤(pán)頁(yè)與包含其數(shù)據(jù)的對(duì)象的對(duì)象標(biāo)識(shí)符之間創(chuàng)建新的映射。同樣地,示例性匯總操作不需要讀取或?qū)懭雽?duì)象自身,而僅僅是他們的標(biāo)識(shí)符。因?yàn)闃?biāo)識(shí)符比所引用的對(duì)象的內(nèi)容小幾千倍,所以示例性匯總操作相應(yīng)地比當(dāng)前備份系統(tǒng)快幾千倍。
[0026]在一個(gè)替代的解決方案中,每個(gè)磁盤(pán)頁(yè)可以被存儲(chǔ)在文件系統(tǒng)中的不同文件中,而不是對(duì)象存儲(chǔ)中的對(duì)象。該過(guò)程因?yàn)閷?duì)應(yīng)于包含磁盤(pán)頁(yè)的文件的文件系統(tǒng)元數(shù)據(jù)幾乎與導(dǎo)致存儲(chǔ)的無(wú)效使用的磁盤(pán)頁(yè)一樣大而不是有效的。此外,包含對(duì)應(yīng)于磁盤(pán)頁(yè)的文件的文件系統(tǒng)目錄包含使文件訪問(wèn)極其慢的極其大量的文件(如,幾百萬(wàn)至幾十億的文件)。同樣地,不是很喜歡使用文件系統(tǒng)。
[0027]圖2示出了快照的示例性索引結(jié)構(gòu)。在典型的實(shí)施方式中,索引結(jié)構(gòu)200屬于至少一個(gè)快照106(如圖1所示)。在示例性實(shí)施方式中,索引結(jié)構(gòu)200以表格形式實(shí)施,該表格形式包括例如第一列202和第二列204。第一列202代表第一索引項(xiàng)而第二列204代表第二索引項(xiàng)。在典型的實(shí)施方式中,第一索引項(xiàng)將快照106內(nèi)的數(shù)據(jù)對(duì)象與對(duì)象標(biāo)識(shí)符(OI1-OIn)相關(guān)聯(lián)。第二索引項(xiàng)標(biāo)識(shí)快照IOe(P1-Pn)內(nèi)的數(shù)據(jù)對(duì)象的位置或頁(yè)碼。對(duì)象標(biāo)識(shí)符(OI1-OIn)和頁(yè)碼(P1-Pn)包括用于訪問(wèn)快照106中的數(shù)據(jù)對(duì)象的信息。
[0028]在典型的實(shí)施方式中,由對(duì)象標(biāo)識(shí)符OI1-OIn表示的對(duì)象數(shù)據(jù)被存儲(chǔ)為唯一對(duì)象并且被進(jìn)一步分派了唯一對(duì)象存儲(chǔ)標(biāo)識(shí)符Ob1-Olv唯一對(duì)象存儲(chǔ)標(biāo)識(shí)符Ob1-Obn被存儲(chǔ)在例如存儲(chǔ)設(shè)備112(如圖1所示)中。在典型的實(shí)施方式中,可以為面向?qū)ο蟮臄?shù)據(jù)庫(kù)的存儲(chǔ)設(shè)備112諸如對(duì)象存儲(chǔ)數(shù)據(jù)庫(kù)。唯一對(duì)象存儲(chǔ)標(biāo)識(shí)符Ob1-Obn由參考數(shù)字206示出。在圖2的示例中,對(duì)象標(biāo)識(shí)符OI1對(duì)應(yīng)于快照106內(nèi)的特定數(shù)據(jù)組,而頁(yè)HP1指向快照106內(nèi)的數(shù)據(jù)組OI1的位置。對(duì)象標(biāo)識(shí)符OI1進(jìn)一步由唯一對(duì)象存儲(chǔ)標(biāo)識(shí)符Ob1標(biāo)識(shí)。
[0029]圖3示出了根據(jù)示例性實(shí)施方式的匯總操作。在典型的實(shí)施方式中,示例性匯總操作利用示例性備份系統(tǒng)100來(lái)操作?,F(xiàn)在參照?qǐng)D1-3,快照A-B示出了連續(xù)快照集合中的索引結(jié)構(gòu)302、306。根據(jù)示例性實(shí)施方式,快照A是在由備份管理器105定義的間隔而執(zhí)行的數(shù)據(jù)組的快照。備份管理器105可以進(jìn)一步實(shí)施需要對(duì)自初始快照A以后發(fā)生改變的數(shù)據(jù)組進(jìn)行快照的規(guī)則、策略或指令集合。同樣地,隨后快照B顯示了僅復(fù)制自初始快照A以后改變的數(shù)據(jù)組。
[0030]在例性實(shí)施方式中,索引結(jié)構(gòu)302以表格形式實(shí)施,該表格形式包括例如第一列304和第二列305。第一列304包括第一索引項(xiàng)而第二列305包括第二索引項(xiàng)。如以上關(guān)于圖2所公開(kāi)的,在典型的實(shí)施方式中,第一索引項(xiàng)304將快照A內(nèi)的數(shù)據(jù)對(duì)象與對(duì)象標(biāo)識(shí)符(OI1, OI2, OI3, OI18)相關(guān)聯(lián)。第二索引項(xiàng)305標(biāo)識(shí)快照A (P1, P2, P3, P18)內(nèi)的數(shù)據(jù)對(duì)象的位置或頁(yè)碼。對(duì)象標(biāo)識(shí)符(OI11OI2, OI31OI18)和頁(yè)碼(P1, P2, P3, P18)包括用于訪問(wèn)快照A中的數(shù)據(jù)對(duì)象的信息。例如,在快照A中,對(duì)象標(biāo)識(shí)符OI1對(duì)應(yīng)于快照A內(nèi)的數(shù)據(jù)組,而頁(yè)碼P1指向快照A內(nèi)的數(shù)據(jù)組OI1的位置。以類(lèi)似的方式,對(duì)象標(biāo)識(shí)符OI2對(duì)應(yīng)于快照A內(nèi)的數(shù)據(jù)組,而頁(yè)碼P2指向快照A內(nèi)的數(shù)據(jù)組OI2的位置。此外,對(duì)象標(biāo)識(shí)符OI3對(duì)應(yīng)于快照A內(nèi)的數(shù)據(jù)組,而頁(yè)碼P3指向快照A內(nèi)的數(shù)據(jù)組OI3的位置。并且,對(duì)象標(biāo)識(shí)符OI18對(duì)應(yīng)于快照A內(nèi)的數(shù)據(jù)組,而頁(yè)碼P18指向快照A內(nèi)的數(shù)據(jù)組OI18的位置。在典型的實(shí)施方式中,快照A表示數(shù)據(jù)組的原始復(fù)制品。
[0031]在典型的實(shí)施方式中,索引結(jié)構(gòu)306屬于快照B。如以上所討論的,快照B僅顯示了自初始快照A以后改變的數(shù)據(jù)組或新的數(shù)據(jù)組。在示例性實(shí)施方式中,索引結(jié)構(gòu)306以表格形式實(shí)施,該表格形式包括例如第一列308和第二列310。如以上所討論的,快照B的索引結(jié)構(gòu)306類(lèi)似于快照A的索引結(jié)構(gòu)302。如快照B所示的索引結(jié)構(gòu)306標(biāo)識(shí)了自初始快照A以后數(shù)據(jù)組的修改。例如,在快照A中,對(duì)象標(biāo)識(shí)符OI1標(biāo)識(shí)了位置P1處的數(shù)據(jù)組??煺誃包含快照A的數(shù)據(jù)組OI1的更新的復(fù)制品。更新的數(shù)據(jù)組現(xiàn)在如對(duì)象標(biāo)識(shí)符OI19所示。此外,在快照A中,對(duì)象標(biāo)識(shí)符OI18標(biāo)識(shí)了位置P18處的數(shù)據(jù)組??煺誃包含快照A的數(shù)據(jù)組OI18的更新的復(fù)制品。更新的數(shù)據(jù)組現(xiàn)在如對(duì)象標(biāo)識(shí)符OI25所示。此外,快照B包含最初未在快照A中表示的新的數(shù)據(jù)組。新的數(shù)據(jù)組如位于快照B內(nèi)的位置P6處的對(duì)象標(biāo)識(shí)符OI12所示。
[0032]為了實(shí)施匯總操作,備份系統(tǒng)100讀取快照A-B中的索引數(shù)據(jù),其中索引數(shù)據(jù)標(biāo)識(shí)在快照A-B中改變的數(shù)據(jù)組。對(duì)于每個(gè)索引項(xiàng),匯總操作標(biāo)識(shí)了包含修改的數(shù)據(jù)組的最近復(fù)制品的快照。在圖3所示的示例中,快照B示出了自初始快照A以后改變的數(shù)據(jù)組。備份系統(tǒng)100相應(yīng)地更新索引數(shù)據(jù)并創(chuàng)建新的索引數(shù)據(jù),該新的索引數(shù)據(jù)構(gòu)成了較低分辨率融合的快照并將數(shù)據(jù)組的最近復(fù)制品寫(xiě)入新的快照。新的快照在圖3中示為快照C。如以上所討論的,快照C的索引結(jié)構(gòu)312類(lèi)似于快照A-B的索引結(jié)構(gòu)302、306。如快照C所示的索引結(jié)構(gòu)312,標(biāo)識(shí)了合成快照,在該合成快照中,索引項(xiàng)對(duì)應(yīng)于更新的對(duì)象標(biāo)識(shí)符及其對(duì)應(yīng)的位置。
[0033]在圖3的快照C中,對(duì)象標(biāo)識(shí)符OI19對(duì)應(yīng)于快照C內(nèi)的數(shù)據(jù)組,而頁(yè)碼P1指向快照C內(nèi)的數(shù)據(jù)組OI19的位置。以類(lèi)似的方式,對(duì)象標(biāo)識(shí)符OI2對(duì)應(yīng)于快照C內(nèi)的數(shù)據(jù)組,而頁(yè)碼P2指向快照C內(nèi)的數(shù)據(jù)組OI2的位置。此外,對(duì)象標(biāo)識(shí)符OI3對(duì)應(yīng)于快照C內(nèi)的數(shù)據(jù)組,而頁(yè)碼P3指向快照C內(nèi)的數(shù)據(jù)組OI3的位置。對(duì)象標(biāo)識(shí)符OI12對(duì)應(yīng)于快照C內(nèi)的數(shù)據(jù)組,而頁(yè)碼P6指向快照C內(nèi)的數(shù)據(jù)組OI12的位置。對(duì)象標(biāo)識(shí)符OI25對(duì)應(yīng)于快照C內(nèi)的數(shù)據(jù)組,而頁(yè)碼P18指向快照C內(nèi)的數(shù)據(jù)組OI25的位置。在典型的實(shí)施方式中,匯總操作繼續(xù)進(jìn)行直至連續(xù)快照A-B的集合中所有快照索引項(xiàng)入口均用完。索引結(jié)構(gòu)312表示較低分辨率融合的快照。在典型的實(shí)施方式中,已經(jīng)由較新版本取代的頁(yè)的對(duì)象標(biāo)識(shí)符被刪除。例如,從以上關(guān)于快照A-C定義的匯總操作中,來(lái)自指向位置P1和P18的快照A的對(duì)象標(biāo)識(shí)符OI1和OI18被刪除。
[0034]在典型的實(shí)施方式中,由快照C的對(duì)象標(biāo)識(shí)符標(biāo)識(shí)的數(shù)據(jù)對(duì)象被進(jìn)一步分派唯一的對(duì)象存儲(chǔ)標(biāo)識(shí)符0b19,Ob2, Ob3, Ob12, Ob250唯一的對(duì)象存儲(chǔ)標(biāo)識(shí)符被存儲(chǔ)在例如存儲(chǔ)設(shè)備112(如圖1所示)中。在典型的實(shí)施方式中,可以為面向?qū)ο蟮臄?shù)據(jù)庫(kù)的存儲(chǔ)設(shè)備112諸如對(duì)象存儲(chǔ)數(shù)據(jù)庫(kù)。唯一對(duì)象存儲(chǔ)標(biāo)識(shí)符Ob19, Ob2, Ob3, Ob12, Ob25由參考數(shù)字320示出。
[0035]利用示例性備份系統(tǒng)100的示例性匯總操作不需要對(duì)數(shù)據(jù)進(jìn)行讀取或?qū)懭雭?lái)實(shí)現(xiàn)匯總操作。示例性匯總操作通過(guò)從隨后快照對(duì)索引數(shù)據(jù)進(jìn)行比較來(lái)實(shí)現(xiàn)。這種示例性技術(shù)大大減少了 IO操作的數(shù)量而導(dǎo)致少的數(shù)據(jù)檢索時(shí)間。文件系統(tǒng)保持非常大量的元數(shù)據(jù)以追蹤每個(gè)文件的內(nèi)容。因此,文件系統(tǒng)不適于存儲(chǔ)小片段的數(shù)據(jù)。與文件系統(tǒng)相反,在對(duì)象存儲(chǔ)中,提取的基本單位是表示固定量數(shù)據(jù)的對(duì)象。根據(jù)示例性實(shí)施方式,對(duì)象存儲(chǔ)提供了創(chuàng)建、讀取或?qū)懭肴繉?duì)象的方法。通過(guò)比文件系統(tǒng)更多的限制,對(duì)象存儲(chǔ)需要非常少的元數(shù)據(jù)來(lái)表示對(duì)象并且因而高效地用于存儲(chǔ)小數(shù)據(jù)。通過(guò)消除對(duì)讀取磁盤(pán)頁(yè)和將其寫(xiě)入新的快照文件的需要,示例性實(shí)施方式利用對(duì)象存儲(chǔ)來(lái)創(chuàng)建用于匯總操作的有效機(jī)制。
[0036]圖4是根據(jù)示例性實(shí)施方式示出數(shù)據(jù)匯總的流程圖。為了說(shuō)明的目的,過(guò)程400將結(jié)合圖1-3進(jìn)行說(shuō)明。過(guò)程400開(kāi)始于步驟402。在步驟404,對(duì)應(yīng)于初始快照的索引數(shù)據(jù)被訪問(wèn)。例如,如圖3所示的與快照A相關(guān)聯(lián)的索引數(shù)據(jù)可以例如是初始快照的索引數(shù)據(jù)。在步驟406,備份管理器105判斷是否存在隨后快照。如果在步驟406判斷存在隨后快照,則過(guò)程400繼續(xù)進(jìn)行至步驟408。在步驟408,對(duì)應(yīng)于隨后快照的索引數(shù)據(jù)被訪問(wèn)。例如,如圖3所示的與快照B相關(guān)聯(lián)的索引數(shù)據(jù)可以例如是隨后快照的索引數(shù)據(jù)。
[0037]在步驟410,備份處理器105判斷隨后快照(快照B)中的索引數(shù)據(jù)是否自初始快照(快照A)以后發(fā)生改變。如果在步驟410判斷索引數(shù)據(jù)發(fā)生改變,則過(guò)程400繼續(xù)進(jìn)行至步驟412。在步驟412,備份系統(tǒng)100相應(yīng)地更新索引數(shù)據(jù)并創(chuàng)建新的索引數(shù)據(jù),該新的索引數(shù)據(jù)構(gòu)成較低分辨率融合快照。備份系統(tǒng)100在步驟412將數(shù)據(jù)組的最近復(fù)制品寫(xiě)入新的快照(快照C)。新的快照如圖3所示為快照C??煺誄標(biāo)識(shí)合成快照,在合成快照中,索引項(xiàng)對(duì)應(yīng)于更新的對(duì)象標(biāo)識(shí)符及其對(duì)應(yīng)的位置。在典型的實(shí)施方式中,已經(jīng)由較新版本取代的頁(yè)的對(duì)象標(biāo)識(shí)符被刪除。例如,從關(guān)于快照A-C的圖3的匯總操作中,來(lái)自指向位置P1和P18的快照A的對(duì)象標(biāo)識(shí)符OI1和OI18被刪除。從步驟412,過(guò)程400繼續(xù)進(jìn)行至步驟406。在步驟406,備份管理器105判斷是否存在隨后快照。
[0038]然而,如果在步驟406判斷不存在隨后快照,則過(guò)程400繼續(xù)進(jìn)行至步驟414。在步驟414,由快照C的對(duì)象標(biāo)識(shí)符標(biāo)識(shí)的數(shù)據(jù)對(duì)象被進(jìn)一步由備份系統(tǒng)100分派唯一對(duì)象存儲(chǔ)標(biāo)識(shí)符。但是,如果在步驟410判斷在隨后快照中的索引數(shù)據(jù)自初始快照以后未發(fā)生改變,則過(guò)程400繼續(xù)進(jìn)行至步驟414。在快照C的對(duì)象標(biāo)識(shí)符被進(jìn)一步分派唯一對(duì)象存儲(chǔ)標(biāo)識(shí)符之后,過(guò)程400在步驟416結(jié)束。[0039]處于公開(kāi)的目的,信息處理系統(tǒng)可以包括任何機(jī)構(gòu)或可進(jìn)行以下操作的機(jī)構(gòu)的集合:計(jì)算、判斷、分類(lèi)、處理、傳送、接收、檢索、發(fā)起、轉(zhuǎn)換、存儲(chǔ)、顯示、通信、表明、檢測(cè)、記錄、再生、辦理,或利用任何形式的信息、智能或用于商業(yè)、科學(xué)、控制或其他目的的數(shù)據(jù)。例如,信息處理系統(tǒng)可以為個(gè)人計(jì)算機(jī)(如,臺(tái)式機(jī)或筆記本電腦)、平板電腦、移動(dòng)設(shè)備(如,個(gè)人數(shù)字助理(PDA)或智能電話)、服務(wù)器(如,刀片式服務(wù)器或機(jī)架式服務(wù)器)、網(wǎng)絡(luò)存儲(chǔ)設(shè)備,或任何其他適當(dāng)?shù)脑O(shè)備,并且可以在大小、形狀、性能、功能和價(jià)格上進(jìn)行變化。信息處理系統(tǒng)可以包括隨機(jī)存取存儲(chǔ)器(RAM)、諸如中央處理單元(CPU)或硬件或軟件控制邏輯的一個(gè)或多個(gè)處理資源、ROM、和/或其他類(lèi)型的非易失性存儲(chǔ)器。信息處理系統(tǒng)的附加組件可以包括一個(gè)或多個(gè)磁盤(pán)驅(qū)動(dòng)、用于與外部設(shè)備通信的一個(gè)或多個(gè)網(wǎng)絡(luò)端口以及各種輸入輸出(I/O)設(shè)備,諸如鍵盤(pán)、鼠標(biāo)、觸摸屏和/或視頻顯示。信息處理系統(tǒng)還可以包括可在各種硬件組件質(zhì)檢傳送通信的一個(gè)或多個(gè)總線。
[0040]因而應(yīng)當(dāng)相信本發(fā)明實(shí)施方式的操作和構(gòu)成將從前面的說(shuō)明而顯而易見(jiàn)。而所顯示或描述的方法和系統(tǒng)已經(jīng)表征為在不背離本發(fā)明的思想和范圍的情況下可以進(jìn)行各種改變和修改是顯然的。
【權(quán)利要求】
1.一種管理備份數(shù)據(jù)的方法,該方法包括: 經(jīng)由備份管理器存取初始快照的索引數(shù)據(jù); 經(jīng)由所述備份管理器存取隨后快照的索引數(shù)據(jù); 經(jīng)由所述備份管理器判斷所述隨后快照的索引數(shù)據(jù)是否與所述初始快照的索引數(shù)據(jù)不同; 響應(yīng)于判斷所述隨后快照的索引數(shù)據(jù)與所述初始快照的索引數(shù)據(jù)不同,創(chuàng)建更新的索引數(shù)據(jù);以及 采用所述更新的索引數(shù)據(jù)來(lái)創(chuàng)建更新的快照。
2.根據(jù)權(quán)利要求1所述的方法,其中所述初始快照包括在第一預(yù)定時(shí)間得到的數(shù)據(jù)組的第一復(fù)制品。
3.根據(jù)權(quán)利要求2所述的方法,其中所述隨后快照包括在第二預(yù)定時(shí)間得到的所述數(shù)據(jù)組的第二復(fù)制品。
4.根據(jù)權(quán)利要求3所述的方法,其中所述第二預(yù)定時(shí)間在所述第一預(yù)定時(shí)間之后出現(xiàn)。
5.根據(jù)權(quán)利要求3所述的方法,其中所述第二復(fù)制品示出了自第一復(fù)制品以后發(fā)生改變的數(shù)據(jù)組。
6.根據(jù)權(quán)利要求1所述的方法,其中所述更新的快照是所述初始快照和所述隨后快照的合成。
7.根據(jù)權(quán)利要求1所述的方法,其中所述更新的索引數(shù)據(jù)對(duì)應(yīng)于所述更新的快照內(nèi)更新的數(shù)據(jù)組。
8.根據(jù)權(quán)利要求1所述的方法,其中所述索引數(shù)據(jù)包括對(duì)象標(biāo)識(shí)符和位置標(biāo)識(shí)符。
9.根據(jù)權(quán)利要求8所述的方法,其中所述對(duì)象標(biāo)識(shí)符對(duì)應(yīng)于所述初始快照、所述隨后快照和所述更新的快照中的至少一者內(nèi)的數(shù)據(jù)組。
10.根據(jù)權(quán)利要求8所述的方法,其中所述位置標(biāo)識(shí)符指向所述初始快照、所述隨后快照和所述更新的快照中的至少一者內(nèi)的數(shù)據(jù)組。
11.根據(jù)權(quán)利要求1所述的方法,其中對(duì)象標(biāo)識(shí)符被進(jìn)一步分派唯一對(duì)象存儲(chǔ)標(biāo)識(shí)符。
12.根據(jù)權(quán)利要求1所述的方法,其中所述索引數(shù)據(jù)包括用于存取所述初始快照、所述隨后快照和所述更新的快照中的至少一者內(nèi)的數(shù)據(jù)組的信息。
13.—種信息處理系統(tǒng),包括: 備份管理器,可互操作地耦合至客戶端,并適于提供以預(yù)定間隔進(jìn)行初始快照和隨后快照并創(chuàng)建初始索引數(shù)據(jù)和隨后索引數(shù)據(jù)的指示;以及 其中所述備份管理器存取所述初始索引數(shù)據(jù)和所述隨后索引數(shù)據(jù),并響應(yīng)于判斷所述隨后索引數(shù)據(jù)與所述初始索引數(shù)據(jù)不同來(lái)存取更新的快照和更新的索引數(shù)據(jù)。
14.根據(jù)權(quán)利要求13所述的系統(tǒng),其中所述備份管理器包括索引服務(wù)模塊和索引數(shù)據(jù)庫(kù)。
15.根據(jù)權(quán)利要求13所述的系統(tǒng),其中所述備份管理器被實(shí)施為計(jì)算機(jī)代碼、硬件設(shè)備和軟件/硬件組合中的至少一者。
16.根據(jù)權(quán)利要求13所述的系統(tǒng),其中: 所述客戶端包括數(shù)據(jù)代理;以及所述數(shù)據(jù)代理從信息存儲(chǔ)中檢索數(shù)據(jù)。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其中所述數(shù)據(jù)代理被實(shí)施為計(jì)算機(jī)代碼、硬件設(shè)備和軟件/硬件組合中的至少一者。
18.根據(jù)權(quán)利要求13所述的系統(tǒng),進(jìn)一步包括面向?qū)ο髷?shù)據(jù)庫(kù)。
19.根據(jù)權(quán)利要求13所述的系統(tǒng),其中所述更新的快照為所述初始快照和所述隨后快照的合成。
20.一種用于管理備份數(shù)據(jù)的產(chǎn)品,所述一種產(chǎn)品包括: 至少一個(gè)計(jì)算機(jī)可讀介質(zhì); 處理器指令,包含在所述 至少一個(gè)計(jì)算機(jī)可讀介質(zhì)上,所述處理器指令被配置為通過(guò)至少一個(gè)處理器可讀所述至少一個(gè)計(jì)算機(jī)可讀介質(zhì)并因而使所述至少一個(gè)處理器操作以執(zhí)行以下步驟: 經(jīng)由備份管理器存取初始快照的索引數(shù)據(jù); 經(jīng)由所述備份管理器存取隨后快照的索引數(shù)據(jù); 經(jīng)由所述備份管理器判斷所述隨后快照的索引數(shù)據(jù)是否與所述初始快照的索引數(shù)據(jù)不同; 響應(yīng)于判斷所述隨后快照的索引數(shù)據(jù)與所述初始快照的索引數(shù)據(jù)不同,創(chuàng)建更新的索引數(shù)據(jù);以及 采用所述更新的索引數(shù)據(jù)來(lái)創(chuàng)建更新的快照。
【文檔編號(hào)】G06F7/00GK104040481SQ201280056692
【公開(kāi)日】2014年9月10日 申請(qǐng)日期:2012年11月16日 優(yōu)先權(quán)日:2011年11月18日
【發(fā)明者】S·瓦阿達(dá)阿簡(jiǎn) 申請(qǐng)人:戴爾軟件股份有限公司