專利名稱:數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)。
背景技術(shù):
目前,運(yùn)營(yíng)商大多以數(shù)據(jù)倉(cāng)庫(kù)為核心,將企業(yè)內(nèi)部的各個(gè)生產(chǎn)平臺(tái)數(shù)據(jù)集中到數(shù) 據(jù)倉(cāng)庫(kù)系統(tǒng)中。通過(guò)統(tǒng)計(jì)分析、數(shù)據(jù)挖掘等手段,為市場(chǎng)經(jīng)營(yíng)服務(wù)、為領(lǐng)導(dǎo)決策提供分析支 撐的系統(tǒng)。由此可見(jiàn),數(shù)據(jù)倉(cāng)庫(kù)的性能、穩(wěn)定性、安全性和高效性,極大程度上決定著經(jīng)營(yíng)分 析系統(tǒng)的整體運(yùn)行狀況。此外,數(shù)據(jù)倉(cāng)庫(kù)作為一個(gè)企業(yè)的核心數(shù)據(jù)平臺(tái),需要保持大量的歷 史數(shù)據(jù)。隨著時(shí)間的推移,數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)量會(huì)不斷的增長(zhǎng),對(duì)硬件空間和硬件處理能力的 要求也不斷的增加。無(wú)論從發(fā)展的角度、成本的角度考慮,還是從最佳實(shí)踐的角度來(lái)考慮, 規(guī)劃一個(gè)能夠滿足3-5年的初始容量,然后配備一個(gè)自由擴(kuò)展、隨需應(yīng)變的數(shù)據(jù)倉(cāng)庫(kù)平臺(tái) 都是最合理的解決方案。經(jīng)營(yíng)分析系統(tǒng)存放的基礎(chǔ)數(shù)據(jù)大多為客戶資料、用戶資料、話單、業(yè)務(wù)受理等 用戶相關(guān)數(shù)據(jù),以及客服平臺(tái)、網(wǎng)管平臺(tái)、彩鈴平臺(tái)及數(shù)據(jù)業(yè)務(wù)管理平臺(tái)(Data Service Management Platform,簡(jiǎn)稱DSMP)等數(shù)據(jù),在數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)數(shù)據(jù)之上建立多個(gè)數(shù)據(jù)集市應(yīng) 用,即基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)和多個(gè)應(yīng)用數(shù)據(jù)集市是在同一個(gè)數(shù)據(jù)倉(cāng)庫(kù)中,而地市數(shù)據(jù)集市數(shù)據(jù)庫(kù) 是物理獨(dú)立的數(shù)據(jù)庫(kù)。現(xiàn)有的經(jīng)應(yīng)分析系統(tǒng)技術(shù)存在如下不足(1)基礎(chǔ)數(shù)據(jù)和應(yīng)用數(shù)據(jù)的存放及計(jì)算均共享同一硬件平臺(tái),資源爭(zhēng)搶嚴(yán)重,導(dǎo)致 新增應(yīng)用和原應(yīng)用計(jì)算時(shí)占用資源重合程度不確定,造成原有應(yīng)用響應(yīng)時(shí)間的不確定性, 系統(tǒng)運(yùn)行不穩(wěn)定、工作效率低。(2)如果將數(shù)據(jù)倉(cāng)庫(kù)按不同的應(yīng)用拆分為多個(gè)物理獨(dú)立的話,將造成基礎(chǔ)數(shù)據(jù)的 大量冗余,導(dǎo)致增加存儲(chǔ)成本。
實(shí)用新型內(nèi)容本發(fā)明的第一目的是提出一種成本低、效率高的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)。為實(shí)現(xiàn)上述第一目的,本發(fā)明提供了一種數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),包括基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù);多 個(gè)與該基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)處于同一物理數(shù)據(jù)庫(kù)的應(yīng)用數(shù)據(jù)集市。優(yōu)選地,基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)及多個(gè)應(yīng)用數(shù)據(jù)集市分別位于物理數(shù)據(jù)庫(kù)中的分區(qū)中。本發(fā)明各個(gè)實(shí)施例中,通過(guò)將基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)和多個(gè)應(yīng)用數(shù)據(jù)集市集成到一個(gè)物理 數(shù)據(jù)倉(cāng)庫(kù),使得應(yīng)用數(shù)據(jù)集市數(shù)據(jù)的獲取和加工處理在同一數(shù)據(jù)庫(kù)內(nèi)可方便實(shí)現(xiàn),減少數(shù) 據(jù)存儲(chǔ)的冗余性、節(jié)約存儲(chǔ)、降低成本;同時(shí),在同一物理數(shù)據(jù)庫(kù)中可實(shí)現(xiàn)數(shù)據(jù)的互操作,避 免了不在同一個(gè)數(shù)據(jù)庫(kù)中因數(shù)據(jù)操作的復(fù)雜性而帶來(lái)的應(yīng)用開(kāi)發(fā)的復(fù)雜性,有效降低應(yīng)用 開(kāi)發(fā)成本、并縮短周期、提高開(kāi)發(fā)效率;此外,在同一個(gè)數(shù)據(jù)庫(kù)中操作可以充分保證性能,以 及便于采用相同的數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)管理體系進(jìn)行統(tǒng)一管理以提高整體數(shù)據(jù)質(zhì)量。
附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說(shuō)明書(shū)的一部分,與本發(fā)明的實(shí) 施例一并用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中圖1為本發(fā)明的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的實(shí)施例一示意圖;圖2為本發(fā)明的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的實(shí)施例二結(jié)構(gòu)圖;圖3為本發(fā)明的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的實(shí)施例三結(jié)構(gòu)圖;圖4為本發(fā)明的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的實(shí)施例四結(jié)構(gòu)示意圖;圖5為本發(fā)明的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的實(shí)施例五結(jié)構(gòu)示意圖。附圖標(biāo)記說(shuō)明12-基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù) 14-應(yīng)用數(shù)據(jù)集市 P550、P570、P595-服務(wù)器22-獲取層24-數(shù)據(jù)層26-應(yīng)用層28-訪問(wèn)層DS4800、DS8300-存儲(chǔ)系統(tǒng)磁盤陣列
具體實(shí)施方式
系統(tǒng)實(shí)施例圖1為本發(fā)明的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的實(shí)施例一示意圖。如圖1所示,本實(shí)施例中數(shù)據(jù) 倉(cāng)庫(kù)系統(tǒng)包括基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)12 ;多個(gè)與該基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)處于同一物理數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用數(shù) 據(jù)集市(以下也稱為應(yīng)用數(shù)據(jù)集市數(shù)據(jù)庫(kù)),如應(yīng)用數(shù)據(jù)集市14。具體操作時(shí),該基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)12可以包括管理服務(wù)器(如2臺(tái)P570服務(wù)器)、數(shù) 據(jù)倉(cāng)庫(kù)服務(wù)器(如2臺(tái)P595服務(wù)器)。每一應(yīng)用數(shù)據(jù)集市可以包括數(shù)據(jù)集市服務(wù)器(如2 臺(tái)P570服務(wù)器以及1臺(tái)P550服務(wù)器)。該基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)12還可以包括交換機(jī)(如M48 交換機(jī))、磁帶庫(kù)以及存儲(chǔ)系統(tǒng)磁盤陣列(如DS4800、DS8300)等。應(yīng)用數(shù)據(jù)集市14還可 以包括存儲(chǔ)系統(tǒng)磁盤陣列(如EMC CX3-80)等。本領(lǐng)域技術(shù)人員可以理解,本發(fā)明數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)主要在于將基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)12與 多個(gè)應(yīng)用數(shù)據(jù)集市形成一個(gè)物理數(shù)據(jù)庫(kù),數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)具體包括的內(nèi)容不局限于上述管理 服務(wù)器、數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器以及數(shù)據(jù)集市服務(wù)器,當(dāng)然也不局限于上述各種服務(wù)器的數(shù)量。上述基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)12與應(yīng)用數(shù)據(jù)集市14共同構(gòu)成一個(gè)數(shù)據(jù)倉(cāng)庫(kù)集群環(huán)境,對(duì)外 是一個(gè)數(shù)據(jù)倉(cāng)庫(kù)(簡(jiǎn)稱DB2)物理數(shù)據(jù)庫(kù),通過(guò)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)提供的數(shù)據(jù)訪問(wèn)權(quán)限控制機(jī)制, 充分保證數(shù)據(jù)安全。上述管理服務(wù)器、數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器以及數(shù)據(jù)集市服務(wù)器可以通過(guò)非共享 體系架構(gòu)(Share Nothing)的多分區(qū)數(shù)據(jù)庫(kù)技術(shù)實(shí)現(xiàn)。多分區(qū)數(shù)據(jù)庫(kù)技術(shù)的特征如下a. 一個(gè)物理數(shù)據(jù)庫(kù)被分成多個(gè)分區(qū),每個(gè)分區(qū)可以看成是一個(gè)邏輯的數(shù)據(jù)庫(kù)分 區(qū);b.每個(gè)數(shù)據(jù)庫(kù)分區(qū)運(yùn)行在各自的節(jié)點(diǎn)上,擁有獨(dú)立的資源,如中央處理單元 (Central Processing Unit,簡(jiǎn)稱CPU),內(nèi)存,磁盤,引擎,核心進(jìn)程,鎖機(jī)制等;c.其中一個(gè)數(shù)據(jù)庫(kù)分區(qū)(被稱為“協(xié)調(diào)節(jié)點(diǎn)”)負(fù)責(zé)協(xié)調(diào)所有邏輯數(shù)據(jù)庫(kù)分區(qū)之 間的通信工作;d.所有數(shù)據(jù)庫(kù)分區(qū)對(duì)協(xié)調(diào)節(jié)點(diǎn)傳遞的應(yīng)用進(jìn)行并發(fā)處理,然后通過(guò)快速通信機(jī)制 將處理結(jié)果返回。有上述描述可知,數(shù)據(jù)庫(kù)分區(qū)組是一個(gè)或多個(gè)邏輯數(shù)據(jù)庫(kù)分區(qū)的集合,一個(gè)數(shù)據(jù)庫(kù)分區(qū)可以屬于多個(gè)數(shù)據(jù)庫(kù)分區(qū)組,每個(gè)數(shù)據(jù)庫(kù)分區(qū)組可以跨一個(gè)或多個(gè)數(shù)據(jù)庫(kù)分區(qū)。通 常情況下,數(shù)據(jù)庫(kù)分區(qū)組的劃分依據(jù)是數(shù)據(jù)庫(kù)分區(qū)的不同功能,一個(gè)多分區(qū)數(shù)據(jù)庫(kù)可以擁 有多個(gè)數(shù)據(jù)庫(kù)分區(qū)組。如,管理服務(wù)器可以位于DB2分區(qū)0,主要用于客戶端連接以及管理 DB2分布式計(jì)算環(huán)境中的工作負(fù)荷協(xié)調(diào);數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器可以對(duì)應(yīng)DB2分區(qū)1到64,主要用 于構(gòu)成數(shù)據(jù)倉(cāng)庫(kù)分區(qū)組;數(shù)據(jù)集市服務(wù)器可以對(duì)應(yīng)DB2分區(qū)65到72,主要用于構(gòu)成數(shù)據(jù)集 市分區(qū)組1。具體操作時(shí),數(shù)據(jù)倉(cāng)庫(kù)分區(qū)組中服務(wù)器可擴(kuò)展,以滿足更多倉(cāng)庫(kù)數(shù)據(jù)存儲(chǔ)和查詢 訪問(wèn)需求;同樣,數(shù)據(jù)集市分區(qū)組服務(wù)器也可擴(kuò)展,滿足數(shù)據(jù)集市更多數(shù)據(jù)存儲(chǔ)和查詢?cè)L問(wèn) 需求,如,若新增數(shù)據(jù)集市服務(wù)器DM server n (對(duì)應(yīng)DB2分區(qū)73到n)構(gòu)成數(shù)據(jù)集市分區(qū) 組n。當(dāng)增加新的數(shù)據(jù)集市應(yīng)用的時(shí)候,首先將新擴(kuò)容的服務(wù)器加入DB2集群,然后在其上 添加新的數(shù)據(jù)集市分區(qū)組,最后將新的數(shù)據(jù)集市可構(gòu)建在該分區(qū)組之上。在DB2數(shù)據(jù)庫(kù)環(huán) 境中,數(shù)據(jù)庫(kù)表空間必須創(chuàng)建在一個(gè)指定的數(shù)據(jù)庫(kù)分區(qū)組上,而且每個(gè)表空間只能屬于一 個(gè)數(shù)據(jù)庫(kù)分區(qū)組。數(shù)據(jù)庫(kù)分區(qū)組可以動(dòng)態(tài)的調(diào)整所占用的邏輯數(shù)據(jù)庫(kù)分區(qū)的數(shù)量,從而調(diào) 整每個(gè)功能模塊所占用的硬件資源。本實(shí)施例中,通過(guò)將基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)12和多個(gè)應(yīng)用數(shù)據(jù)集市集成到一個(gè)物理數(shù)據(jù) 倉(cāng)庫(kù),減少數(shù)據(jù)存儲(chǔ)的冗余性、節(jié)約存儲(chǔ)、降低成本;同時(shí)避免了不在同一個(gè)數(shù)據(jù)庫(kù)中因數(shù) 據(jù)操作的復(fù)雜性而帶來(lái)的應(yīng)用開(kāi)發(fā)的復(fù)雜性,有效降低應(yīng)用開(kāi)發(fā)成本、并縮短周期、提高 開(kāi)發(fā)效率;此外,在同一個(gè)數(shù)據(jù)庫(kù)中操作可以充分保證性能,以及提高整體數(shù)據(jù)質(zhì)量;優(yōu)選 地,基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)和應(yīng)用數(shù)據(jù)集市數(shù)據(jù)庫(kù)采用各分區(qū)組實(shí)現(xiàn),每個(gè)分區(qū)組使用自己獨(dú)享的 硬件服務(wù)器和存儲(chǔ),相互之間沒(méi)有資源使用的沖突,可以充分保證各分區(qū)組的性能相互不 受影響,避免了某個(gè)分區(qū)組由于應(yīng)用程序不優(yōu)化造成的數(shù)據(jù)倉(cāng)庫(kù)和所有數(shù)據(jù)集市全面性能 下降問(wèn)題的出現(xiàn),而且在存儲(chǔ)容量或處理能力不能滿足需求,均可在分區(qū)組中增加硬件處 理資源進(jìn)行擴(kuò)容,以及在某分區(qū)組資源不足的情況下,可通過(guò)劃撥分區(qū)的方式,實(shí)現(xiàn)性能增 加。圖2為本發(fā)明的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的實(shí)施例二結(jié)構(gòu)圖。圖3為本發(fā)明的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng) 的實(shí)施例三結(jié)構(gòu)圖。圖2及圖3分別從不同的方面對(duì)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)進(jìn)行闡述,以下結(jié)合圖 2及圖3進(jìn)行解釋說(shuō)明。如圖2所示,本實(shí)施例包括獲取層22,用于從各數(shù)據(jù)源系統(tǒng)中抽取相關(guān)基礎(chǔ)數(shù)據(jù),進(jìn)行清洗、轉(zhuǎn)換、整理 并加載到數(shù)據(jù)倉(cāng)庫(kù);具體地,可以用于獲取無(wú)線應(yīng)用通訊協(xié)議(WirelessApplication Protocol,簡(jiǎn)稱WAP),網(wǎng)關(guān)數(shù)據(jù)、網(wǎng)管系統(tǒng)數(shù)據(jù)、DSMP平臺(tái)數(shù)據(jù)、電信業(yè)務(wù)運(yùn)營(yíng)支持系統(tǒng) (Business and Operation support system,簡(jiǎn)稱BOSS)數(shù)據(jù)、客服系統(tǒng)數(shù)據(jù)、彩鈴平臺(tái)數(shù) 據(jù)、信令數(shù)據(jù)等;其中WAP網(wǎng)關(guān)數(shù)據(jù)以及信令數(shù)據(jù)分別通過(guò)WAP網(wǎng)關(guān)以及網(wǎng)管獲得;相應(yīng) 地,數(shù)據(jù)源可以包括網(wǎng)管系統(tǒng)、DSMP平臺(tái)、BOSS系統(tǒng)、彩鈴平臺(tái)、中央基地平臺(tái)、新業(yè)務(wù)體驗(yàn) 營(yíng)銷平臺(tái)等;數(shù)據(jù)層24,用于實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)中基礎(chǔ)數(shù)據(jù)、匯總數(shù)據(jù)以及深加工后的數(shù)據(jù)、信息的 集中管理,并用于根據(jù)業(yè)務(wù)需求建立專業(yè)數(shù)據(jù)集市;應(yīng)用層26包括功能子層、應(yīng)用子層和信息適配子層,其中,功能子層將經(jīng)營(yíng)分析 系統(tǒng)按功能進(jìn)行劃分;應(yīng)用子層通過(guò)調(diào)用和編排功能子層提供的功能集中解決業(yè)務(wù)問(wèn)題; 信息適配子層根據(jù)不同使用角色需要,將應(yīng)用子層中的各種應(yīng)用進(jìn)行整合,形成整體解決方案通過(guò)訪問(wèn)層提供給相應(yīng)的角色;訪問(wèn)層28用于提供訪問(wèn)經(jīng)營(yíng)分析系統(tǒng)的窗口和平臺(tái)。如圖3所示,在上述圖2的架構(gòu)下,數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)能夠?qū)⒁粋€(gè)超大規(guī)模的數(shù)據(jù)訪問(wèn) 拆分為若干個(gè)小的處理單元并行處理,最大限度的發(fā)揮硬件資源的作用,提高數(shù)據(jù)庫(kù)處理 的響應(yīng)時(shí)間,而整個(gè)多分區(qū)數(shù)據(jù)庫(kù)系統(tǒng)對(duì)于用戶來(lái)說(shuō)又是透明的,從用戶和應(yīng)用的角度來(lái) 看是一個(gè)單一的數(shù)據(jù)庫(kù)系統(tǒng)。本實(shí)施例中,通過(guò)將基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)和多個(gè)應(yīng)用數(shù)據(jù)集市集成到一個(gè)物理數(shù)據(jù)倉(cāng) 庫(kù),減少數(shù)據(jù)存儲(chǔ)的冗余性、節(jié)約存儲(chǔ)、降低成本、有效降低應(yīng)用開(kāi)發(fā)成本、并縮短周期、提 高開(kāi)發(fā)效率以及提高整體數(shù)據(jù)質(zhì)量;優(yōu)選地,基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)和應(yīng)用數(shù)據(jù)集市數(shù)據(jù)庫(kù)采用各 分區(qū)組實(shí)現(xiàn),避免了某個(gè)分區(qū)組由于應(yīng)用程序不優(yōu)化造成的數(shù)據(jù)倉(cāng)庫(kù)和所有數(shù)據(jù)集市全面 性能下降問(wèn)題的出現(xiàn),而且可通過(guò)劃撥分區(qū)的方式,實(shí)現(xiàn)性能增加。圖4為本發(fā)明的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的實(shí)施例四結(jié)構(gòu)示意圖。本實(shí)施例主要利用數(shù)據(jù)倉(cāng) 庫(kù)的平衡配置單元(Balanced Configuration Unit,簡(jiǎn)稱BCU)實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的優(yōu)選實(shí) 施方式。BCU是一個(gè)以多分區(qū)數(shù)據(jù)庫(kù)技術(shù)作為基礎(chǔ),基于數(shù)據(jù)庫(kù)、服務(wù)器、存儲(chǔ)的平臺(tái)保障單 元。其中,BCU的架構(gòu)如圖4所示每個(gè)BCU是一個(gè)物理節(jié)點(diǎn),該節(jié)點(diǎn)既可以是一個(gè)單獨(dú)的P server,也可以是一個(gè)Lpar,既支持UNIX平臺(tái),又支持LINUX平臺(tái);每個(gè)B⑶內(nèi)可以配置若 干個(gè)邏輯數(shù)據(jù)庫(kù)分區(qū),每個(gè)數(shù)據(jù)庫(kù)分區(qū)叫做一個(gè)分支處理單元(Branch Processing Unit, 簡(jiǎn)稱BPU);數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通過(guò)特定的HASH算法均勻的分布到每個(gè)BPU上,數(shù)據(jù)倉(cāng)庫(kù)針 對(duì)每個(gè)查詢都會(huì)調(diào)度所有的BPU進(jìn)行并行計(jì)算,以最快的速度返回結(jié)果。需要說(shuō)明的是,每個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的BCU數(shù)量不是固定的,可以根據(jù)用戶的數(shù)據(jù) 量、處理復(fù)雜度來(lái)定制的,既可以是一個(gè)BCU構(gòu)成一個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),又可以是多個(gè)BCU共 同構(gòu)成一個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),即數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)由至少一個(gè)平衡配置單元構(gòu)成;為了兼顧平衡 原則,要求構(gòu)成數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的每個(gè)BCU的配置(包括CPU,內(nèi)存,磁盤,光纖卡、網(wǎng)卡等) 必須是一致的;通常CPU和BPU的比率是1 1,如果CPU負(fù)載過(guò)大,可以考慮增大比率,如 2 1?;贐CU的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)具有很強(qiáng)的可擴(kuò)展性,主要體現(xiàn)在系統(tǒng)容量的增減和系 統(tǒng)資源的配置調(diào)方面,具體解釋如下1)支持垂直擴(kuò)容,即可以在現(xiàn)有B⑶數(shù)量不變的情況下,增加每個(gè)B⑶的CPU、內(nèi) 存和存儲(chǔ)的數(shù)量,滿足空間不足時(shí)的擴(kuò)容需求;原因在于BCU沒(méi)有將CPU和BPU進(jìn)行物理 的綁定,因此只要擁有空閑的CPU,數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)就會(huì)自動(dòng)發(fā)現(xiàn)并使用;這種擴(kuò)容可以在不 影響現(xiàn)有數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)架構(gòu)的基礎(chǔ)上對(duì)數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)進(jìn)行存儲(chǔ)容量的增加;2)支持水平擴(kuò)容,即每個(gè)B⑶都是可復(fù)制的最小配置單元,在整個(gè)基于B⑶的數(shù)據(jù) 倉(cāng)庫(kù)平臺(tái)中,可以根據(jù)需要在線、動(dòng)態(tài)的增加和減少BCU的數(shù)量,而不會(huì)因?yàn)槲锢砑軜?gòu)的調(diào) 整而對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行大的調(diào)整;數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的多分區(qū)數(shù)據(jù)庫(kù)最多可以支持999個(gè)邏輯數(shù) 據(jù)庫(kù)分區(qū),每個(gè)分區(qū)的處理能力至少可達(dá)1T,整體的處理能力能夠在PB級(jí)別,在垂直擴(kuò)容 無(wú)法滿足需求的情況下,可以靈活的增加BCU并進(jìn)行聯(lián)機(jī)合并,能有效地滿足業(yè)務(wù)增長(zhǎng)帶 來(lái)的數(shù)據(jù)量增長(zhǎng)的需求。此外,由于每個(gè)B⑶被要求在硬件配置和操作系統(tǒng)上都要保持高度的一致,無(wú)論 在短期內(nèi)的系統(tǒng)軟硬件維護(hù),還是在將來(lái)水平擴(kuò)容后的軟硬件維護(hù),對(duì)技術(shù)要求都沒(méi)有增加新的元素。同時(shí),也避免了將來(lái)的升級(jí)和擴(kuò)容帶來(lái)的系統(tǒng)兼容性問(wèn)題,因此既大大降低了 系統(tǒng)維護(hù)的成本和時(shí)間,又降低了系統(tǒng)的運(yùn)維風(fēng)險(xiǎn)。本實(shí)施例通過(guò)將基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)和多個(gè)應(yīng)用數(shù)據(jù)集市集成到一個(gè)物理數(shù)據(jù)倉(cāng)庫(kù),減 少數(shù)據(jù)存儲(chǔ)的冗余性、節(jié)約存儲(chǔ)、降低成本、有效降低應(yīng)用開(kāi)發(fā)成本、并縮短周期、提高開(kāi)發(fā) 效率以及提高整體數(shù)據(jù)質(zhì)量;優(yōu)選地,通過(guò)BCU構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),進(jìn)一步提高了性能以及 可擴(kuò)展性,而且提高了規(guī)劃、部署和實(shí)施的靈活性。圖5為本發(fā)明的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的實(shí)施例五結(jié)構(gòu)示意圖。如圖5所示數(shù)據(jù)倉(cāng)庫(kù)系 統(tǒng)包括一個(gè)具有91個(gè)邏輯數(shù)據(jù)庫(kù)分區(qū)的多分區(qū)數(shù)據(jù)庫(kù),其中,前65個(gè)邏輯數(shù)據(jù)庫(kù)分區(qū)被定 義成一個(gè)數(shù)據(jù)庫(kù)分區(qū)組(稱為DW分區(qū)組),用于實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)的功能。具體操作時(shí),所 有的基礎(chǔ)數(shù)據(jù)表都創(chuàng)建在這65個(gè)數(shù)據(jù)庫(kù)分區(qū)之上;第66個(gè)至第69個(gè)數(shù)據(jù)庫(kù)分區(qū)被定義成 應(yīng)用1的分區(qū)組,用來(lái)存放應(yīng)用1的數(shù)據(jù),以此類推,將其他的數(shù)據(jù)庫(kù)分區(qū)按照功能劃分多 個(gè)數(shù)據(jù)庫(kù)分區(qū)組。本實(shí)施例中,基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集市應(yīng)用位于同一個(gè)物理數(shù)據(jù)庫(kù)之中,數(shù)據(jù)表 之間的數(shù)據(jù)移動(dòng)簡(jiǎn)單靈活,縮短開(kāi)發(fā)周期,減少開(kāi)發(fā)成本,還通過(guò)簡(jiǎn)化數(shù)據(jù)模型降低了存儲(chǔ) 的成本;同時(shí),由于分區(qū)組的不同而物理上將各個(gè)分區(qū)的資源隔離,避免了分區(qū)之間資源爭(zhēng) 用的問(wèn)題,以及由于數(shù)據(jù)倉(cāng)庫(kù)分區(qū)組所擁有的數(shù)據(jù)分區(qū)可以動(dòng)態(tài)的調(diào)整,可以在各個(gè)部分 資源不平衡的情況下可以實(shí)現(xiàn)性能劃撥,對(duì)數(shù)據(jù)庫(kù)分區(qū)組內(nèi)的分區(qū)進(jìn)行有針對(duì)性的增加或 者減少,最大程度的發(fā)揮硬件的資源優(yōu)勢(shì),降低重復(fù)投資的需求;此外,兩部分的數(shù)據(jù)表可 以直接進(jìn)行數(shù)據(jù)庫(kù)操作,一類數(shù)據(jù)只需要在數(shù)據(jù)平臺(tái)中存在一份即可,從而有效的減少了 數(shù)據(jù)的冗余,降低存儲(chǔ)成本。最后應(yīng)說(shuō)明的是以上僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,盡管 參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),其依然可以對(duì) 前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換。凡在 本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù) 范圍之內(nèi)。
權(quán)利要求一種數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),其特征在于,包括基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù);多個(gè)與所述基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)處于同一物理數(shù)據(jù)庫(kù)的應(yīng)用數(shù)據(jù)集市。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),其特征在于,所述基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)及所述多個(gè) 應(yīng)用數(shù)據(jù)集市分別位于所述物理數(shù)據(jù)庫(kù)中的分區(qū)中。
3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),其特征在于,所述物理數(shù)據(jù)庫(kù)的所有分區(qū)中 的軟硬配置均一致。
4.根據(jù)上述權(quán)利要求1至3中任一項(xiàng)的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),其特征在于,所述基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù) 包括管理服務(wù)器,用于連接客戶端以及管理分布式計(jì)算環(huán)境中的工作負(fù)荷協(xié)調(diào);數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器,用于構(gòu)成所述數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的分區(qū)。
5.根據(jù)上述權(quán)利要求1至3中任一項(xiàng)所述的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),其特征在于,所述應(yīng)用數(shù)據(jù) 集市包括數(shù)據(jù)集市服務(wù)器,用于構(gòu)成所述應(yīng)用數(shù)據(jù)集市的分區(qū)。
6.根據(jù)權(quán)利要求2或3所述的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),其特征在于,由至少一個(gè)平衡配置單元 構(gòu)成。
7.根據(jù)權(quán)利要求6所述的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),其特征在于,每一平衡配置單元均包括至少 一個(gè)分支處理單元,每一平衡配置單元中的分支處理單元及CPU的數(shù)量比為1 1或者 1 2。
專利摘要本實(shí)用新型提供了一種數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),包括基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù);多個(gè)與該基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)處于同一物理數(shù)據(jù)庫(kù)的應(yīng)用數(shù)據(jù)集市。本實(shí)用新型通過(guò)將基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)和多個(gè)應(yīng)用數(shù)據(jù)集市集成到一個(gè)物理數(shù)據(jù)倉(cāng)庫(kù),使得應(yīng)用數(shù)據(jù)集市數(shù)據(jù)的獲取和加工處理在同一數(shù)據(jù)庫(kù)內(nèi)可方便實(shí)現(xiàn),減少數(shù)據(jù)存儲(chǔ)的冗余性、節(jié)約存儲(chǔ)、降低成本;同時(shí),在同一物理數(shù)據(jù)庫(kù)中可實(shí)現(xiàn)數(shù)據(jù)的互操作,避免了不在同一個(gè)數(shù)據(jù)庫(kù)中因數(shù)據(jù)操作的復(fù)雜性而帶來(lái)的應(yīng)用開(kāi)發(fā)的復(fù)雜性,有效降低應(yīng)用開(kāi)發(fā)成本、并縮短周期、提高開(kāi)發(fā)效率;此外,在同一個(gè)數(shù)據(jù)庫(kù)中操作可以充分保證性能,以及便于采用相同的數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)管理體系進(jìn)行統(tǒng)一管理以提高整體數(shù)據(jù)質(zhì)量。
文檔編號(hào)G06F17/30GK201600693SQ20092027109
公開(kāi)日2010年10月6日 申請(qǐng)日期2009年11月26日 優(yōu)先權(quán)日2009年11月26日
發(fā)明者任智廣, 易劍光, 王海通, 霍紹博 申請(qǐng)人:中國(guó)移動(dòng)通信集團(tuán)河北有限公司