本發(fā)明涉及一種云計(jì)算技術(shù),特別是涉及一種電信級(jí)別的云計(jì)算系統(tǒng)的資源分配方法。
背景技術(shù):
云計(jì)算因?yàn)楦邚椥院湍茉从行远辉絹?lái)越多的企業(yè)和服務(wù)提供商接受。具有自己的基礎(chǔ)設(shè)施的大型云計(jì)算服務(wù)提供商(比如amazon和google)和跨國(guó)企業(yè)的數(shù)目也在不斷上升。傳統(tǒng)的電信運(yùn)營(yíng)商(比如at&t和聯(lián)通)也開始轉(zhuǎn)型向終端用戶提供云服務(wù)。集中性的架構(gòu)可以提供小規(guī)模的云服務(wù),但大規(guī)??绲赜蚪M網(wǎng)則優(yōu)選分布式云計(jì)算。分布式云計(jì)算有多個(gè)跨地域的數(shù)據(jù)中心,數(shù)據(jù)中心之間用高速因特網(wǎng)連接。一個(gè)地區(qū)的數(shù)據(jù)中心除了為本地分支結(jié)構(gòu)服務(wù)外,還要接受其它地域的分支機(jī)構(gòu)的查詢和服務(wù)請(qǐng)求,甚至包括出于魯棒性或其它考慮而要求的跨地域的服務(wù)和虛擬機(jī)部署。云系統(tǒng)的架構(gòu)必須同時(shí)支持集中式和分布式的云集計(jì)算模式并能提供統(tǒng)一的部署機(jī)制。
另一方面,越來(lái)越多的云計(jì)算代理商(cloudservicebroker,csb)整合其它云計(jì)算服務(wù)提供商(cloudserviceprovider,csp)的基礎(chǔ)設(shè)施,從而對(duì)外提供全面統(tǒng)一的云服務(wù)。不同的云計(jì)算服務(wù)提供商一般是跨地域分布的,所以云計(jì)算架構(gòu)需要便于csb按照終端用戶的位置,服務(wù)質(zhì)量需求(qos)和價(jià)格進(jìn)行服務(wù)提供組織的選擇,并進(jìn)而進(jìn)行數(shù)據(jù)中心的選擇。
能夠提供所需服務(wù)并且靠近終端用戶的數(shù)據(jù)中心會(huì)被優(yōu)選以減少服務(wù)時(shí)延和長(zhǎng)途傳輸線路占用。一個(gè)地域的數(shù)據(jù)中心可能包括不同的功能服務(wù)器,比如有些是cpu密集型的的服務(wù)器,有些是存儲(chǔ)密集型的服務(wù)器等。這樣就組成了不同的服務(wù)器功能簇(serverfunctionalitycluster,sfc)。不同的服務(wù)需求需要被路由到合適的資源池以便實(shí)現(xiàn)最大的統(tǒng)計(jì)復(fù)用率和方便的維護(hù)。一般的,應(yīng)該在滿足所需服務(wù)的sla(serviceoflevel)的情況下,一個(gè)服務(wù)器部署盡可能多的服務(wù)以實(shí)現(xiàn)最大贏利。不同的流量工程的方法可以被用來(lái)實(shí)現(xiàn)這個(gè)目的。比如不同的數(shù)據(jù)中心的服務(wù)質(zhì)量需求qos能力需要被考慮,在虛擬機(jī)部署甚至是實(shí)時(shí)遷移時(shí)應(yīng)該采用合適的的資源分配策略。
提供高質(zhì)量的服務(wù)是csp成功的關(guān)鍵因素。為此,scope聯(lián)盟在2011年建議了電信級(jí)別的云計(jì)算,但是并沒(méi)有給出具體的系統(tǒng)結(jié)構(gòu)。聯(lián)盟認(rèn)為,不僅僅是sla協(xié)商,還包括安全,位置信息,互聯(lián)互通都要被考慮。
正如學(xué)者愛爾蘭都柏林大學(xué)的學(xué)者murphy指出的,如果云計(jì)算想要運(yùn)行良好,性能工程的方法,包括規(guī)劃設(shè)計(jì)、實(shí)時(shí)監(jiān)控、擴(kuò)容、升級(jí)都需要詳細(xì)進(jìn)行,而這一切的基礎(chǔ)是架構(gòu)!因此應(yīng)該有一個(gè)新的統(tǒng)一系統(tǒng)結(jié)構(gòu),不僅僅能夠滿足有著分布式基礎(chǔ)設(shè)施的大規(guī)模的csp,而且還能夠滿足集成其它c(diǎn)sp的csb的需求。它也應(yīng)該能夠支持多種流量工程方法的應(yīng)用以便提供滿意的服務(wù)質(zhì)量,甚至是提供電信級(jí)別的服務(wù)。同時(shí),它應(yīng)該具有位置機(jī)制,實(shí)現(xiàn)最大程度的資源利用,跨地域服務(wù)部署,并便于運(yùn)營(yíng),管理和維護(hù)(oam)。更重要的,系統(tǒng)能夠支持不同的云之間的互聯(lián)互通。
技術(shù)實(shí)現(xiàn)要素:
為了解決云計(jì)算系統(tǒng)如何與客戶端協(xié)商資源分配的技術(shù)問(wèn)題,本發(fā)明提出了一種電信級(jí)別的云計(jì)算系統(tǒng)的資源分配方法、采用所述資源分配方法的裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),還包括一種電信級(jí)別的云計(jì)算系統(tǒng)的本地資源調(diào)度方法、采用本地資源調(diào)度方法的裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
所述電信級(jí)別的云計(jì)算系統(tǒng)的資源分配方法,包括第一物理服務(wù)器管理至少一個(gè)第二物理服務(wù)器,所述第一物理服務(wù)器包括元調(diào)度器,所述第二物理服務(wù)器包括本地調(diào)度器;所述資源分配方法包括以下步驟:
s1:所述第一物理服務(wù)器接收到帶有需求參數(shù)的服務(wù)請(qǐng)求;
s2:所述第一物理服務(wù)器將步驟s1中所述需求參數(shù)進(jìn)行分析,判斷能否接受所述服務(wù)請(qǐng)求;若能,則進(jìn)入步驟s3,若不能,則拒絕步驟s1中所述服務(wù)請(qǐng)求;
s3:所述第一元調(diào)度器接受步驟s3中的所述服務(wù)請(qǐng)求并與本地調(diào)度器協(xié)商預(yù)留資源;若能滿足所述服務(wù)請(qǐng)求,則進(jìn)入步驟s4,若不能滿足所述服務(wù)請(qǐng)求,則由所述元調(diào)度器向客戶端發(fā)送降低服務(wù)等級(jí)的參數(shù),重復(fù)步驟s1到s3進(jìn)行下一輪協(xié)商;
s4:所述第一物理服務(wù)器根據(jù)步驟s3所預(yù)留的資源,完成資源分配。
優(yōu)選地,在步驟s3中,若協(xié)商不成功,還包括所述第一元調(diào)度器調(diào)度其他行政區(qū)域的第二元調(diào)度器執(zhí)行所述服務(wù)請(qǐng)求。
優(yōu)選地,在步驟s1中,包括所述第一物理服務(wù)器判斷所述服務(wù)請(qǐng)求是否具備權(quán)限;若具備權(quán)限,則進(jìn)行步驟s2,若不具備權(quán)限,則拒絕所述服務(wù)請(qǐng)求。
優(yōu)選地,在步驟s2中,包括所述第一物理服務(wù)器將所述需求參數(shù)適配成所述云計(jì)算系統(tǒng)可識(shí)別的格式。
優(yōu)選地,在步驟s1之前,還包括所述第一物理服務(wù)器判斷用戶是否進(jìn)行了注冊(cè)。
優(yōu)選地,在步驟s3中,包括所述第一物理服務(wù)器解析或適配云間機(jī)制與云間協(xié)議。
本發(fā)明所提出的采用所述資源分配方法的裝置,包括:處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器運(yùn)行所述存儲(chǔ)器中的計(jì)算機(jī)程序使所述裝置執(zhí)行上述資源分配方法。
另外,本發(fā)明所提出的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述資源分配方法的步驟。
本發(fā)明所提出的電信級(jí)別的云計(jì)算系統(tǒng)的本地資源調(diào)度方法,包括至少一個(gè)第二物理服務(wù)器被第一物理服務(wù)器管理,所述第一物理服務(wù)器包括元調(diào)度器,所述第二物理服務(wù)器包括本地調(diào)度器;所述本地資源調(diào)度方法包括以下步驟:
t1、本地調(diào)度器接受來(lái)自第一元調(diào)度器的協(xié)商;所述第一元調(diào)度器攜帶有服務(wù)請(qǐng)求;
t2、所述第二物理服務(wù)器根據(jù)所述服務(wù)請(qǐng)求預(yù)留資源。
優(yōu)選地,還包括所述第二物理服務(wù)器對(duì)已經(jīng)完成的所述服務(wù)請(qǐng)求進(jìn)行服務(wù)性能的測(cè)量。
優(yōu)選地,還包括所述第二物理服務(wù)器報(bào)告并更新所述云計(jì)算系統(tǒng)的資源狀態(tài)。
優(yōu)選地,還包括所述第二物理服務(wù)器將所述云計(jì)算系統(tǒng)進(jìn)行優(yōu)化和/或執(zhí)行周期性審計(jì)。
同時(shí),本發(fā)明提出的采用本地資源調(diào)度方法的裝置,包括:處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器運(yùn)行所述存儲(chǔ)器中的計(jì)算機(jī)程序使所述裝置執(zhí)行上述任一所述的本地資源調(diào)度方法。
此外,本發(fā)明提出的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一所述本地資源調(diào)度方法的步驟。
本發(fā)明與現(xiàn)有技術(shù)對(duì)比的有益效果包括:所述云計(jì)算系統(tǒng)接受帶有需求參數(shù)的服務(wù)請(qǐng)求,根據(jù)需求參數(shù)分析能否接受服務(wù)請(qǐng)求,第一元調(diào)度器接受所述服務(wù)請(qǐng)求并與本地調(diào)度器協(xié)商預(yù)留資源,若能滿足服務(wù)請(qǐng)求則完成資源分配,若不能滿足需求則可向客戶端發(fā)送降低服務(wù)質(zhì)量等級(jí)的參數(shù)與客戶端協(xié)商,直到完成資源分配,實(shí)現(xiàn)了云計(jì)算系統(tǒng)與客戶端的協(xié)商。
附圖說(shuō)明
圖1是本發(fā)明具體實(shí)施方式中umatgc2架構(gòu)示意圖。
圖2是本發(fā)明具體實(shí)施方式中元調(diào)度的雙平面組網(wǎng)示意圖。
圖3是本發(fā)明具體實(shí)施方式中umatgc2在csp和csb中的應(yīng)用示意圖。
圖4是本發(fā)明具體實(shí)施方式中設(shè)備的分布示意圖。
圖5是本發(fā)明具體實(shí)施方式中本地化互通組網(wǎng)的結(jié)構(gòu)示意圖。
圖6是本發(fā)明具體實(shí)施方式中互通流程示意圖。
圖7是本發(fā)明具體實(shí)施方式中對(duì)云計(jì)算系統(tǒng)維護(hù)操作示意圖。
圖8是本發(fā)明具體實(shí)施方式中云計(jì)算系統(tǒng)資源分配方法的流程圖。
圖9是本發(fā)明具體實(shí)施方式中采用云計(jì)算系統(tǒng)的基本結(jié)構(gòu)圖。
具體實(shí)施方式
下面對(duì)照附圖并結(jié)合優(yōu)選的實(shí)施方式對(duì)本發(fā)明作進(jìn)一步說(shuō)明。
本發(fā)明提出了一個(gè)統(tǒng)一的基于元調(diào)度的電信級(jí)別云計(jì)算架構(gòu)umatgc2(unifiedmetaschedulerarchitecturefortelecomgradecloudcomputing)。
如圖1所示,umatgc2包括安全模塊(sc)、sla模塊、資源管理模塊(rmc)、運(yùn)行管理及維護(hù)/計(jì)費(fèi)模塊(oambc)、互通模塊(ic)。
安全模塊(sc)主要負(fù)責(zé)注冊(cè)、鑒權(quán)和授權(quán)。同時(shí)還可以實(shí)現(xiàn)其余的系統(tǒng)安全管理功能,比如周期性審計(jì)以及應(yīng)急機(jī)制。
sla模塊用于處理所有與流量工程(trafficengineering)相關(guān)的事務(wù)。在收到用戶的服務(wù)質(zhì)量相關(guān)參數(shù)后,會(huì)將這些參數(shù)提交到資源管理模塊(rmc)。如果rmc確認(rèn)sla能夠得到保證,服務(wù)將會(huì)繼續(xù)。sla模塊在服務(wù)的生命周期內(nèi),將會(huì)持續(xù)執(zhí)行一些服務(wù)質(zhì)量保證措施,包括擁塞控制(congestioncontrol)、接入控制(accesscontrol)等。
資源的最終配置一定要經(jīng)過(guò)資源管理模塊(rmc),rmc是一個(gè)核心模塊。通過(guò)主動(dòng)審計(jì)以及被動(dòng)接收資源使用報(bào)告,rmc維護(hù)了各區(qū)域資源的最新狀態(tài),同時(shí)它也保存了各區(qū)域的組網(wǎng)以及服務(wù)信息(比如資源位置、類型等)。rmc能驗(yàn)證某一區(qū)域的數(shù)據(jù)中心是否符合業(yè)務(wù)的sla要求,以及是否需要將服務(wù)路由到其它區(qū)域。然后在目標(biāo)區(qū)域,它會(huì)依據(jù)一些原則(比如負(fù)載均衡、計(jì)算與數(shù)據(jù)最近等)實(shí)現(xiàn)機(jī)框、服務(wù)器的選擇并執(zhí)行虛擬機(jī)(vm)操作(比如創(chuàng)建、激活和遷移等)。
周期性的優(yōu)化由資源管理模塊中的優(yōu)化器(optimizer)自動(dòng)執(zhí)行,或者由運(yùn)行管理及維護(hù)/計(jì)費(fèi)模塊(oambc)模塊命令執(zhí)行。一些運(yùn)行管理維護(hù)行為,比如升級(jí)和測(cè)試也可由rmc執(zhí)行。rmc中的ms除了執(zhí)行本地的資源管理功能外,它的另外一個(gè)重要功能是與其它區(qū)域或者其它云網(wǎng)絡(luò)的ms進(jìn)行通信。
如圖1所示,上述云計(jì)算架構(gòu)的工作流程包括:
用戶首先進(jìn)行注冊(cè),然后發(fā)送帶有以一定格式編碼的sla需求參數(shù)(比如開始時(shí)間、執(zhí)行時(shí)間、vm位置和違約懲罰信息等)的服務(wù)請(qǐng)求(附圖1中的步驟1)。如果用戶已經(jīng)注冊(cè),則將對(duì)用戶進(jìn)行鑒權(quán)并授權(quán)其使用配置到的資源(步驟2)。
slam模塊的接入控制單元(admissioncontrolcomponent)緩存有從rmc取到的云系統(tǒng)的工作負(fù)載情況,它將依據(jù)負(fù)載或者其所使用的其它強(qiáng)制性措施決定是接受用戶請(qǐng)求的第一條消息還是直接拒絕。如果系統(tǒng)過(guò)載,則會(huì)直接拒絕此消息(步驟3),否則將開始sla協(xié)商(步驟4)。
在收到帶有一定服務(wù)質(zhì)量信息的請(qǐng)求,比如云經(jīng)紀(jì)人選擇云網(wǎng)絡(luò)的tb-wsla(templatebasiconwsla)消息,或者一個(gè)終端用戶的直接請(qǐng)求,sla協(xié)商模塊將會(huì)對(duì)這些服務(wù)質(zhì)量信息進(jìn)行分析。它將調(diào)用sla參數(shù)解析模塊,并將其適配成內(nèi)部可識(shí)別的格式,以便同rmc進(jìn)行交互(步驟5)。
與其余流程工程信息,比如能耗有效一起(步驟6),所有的參數(shù)將會(huì)被傳送到ms(元調(diào)度器)(步驟7)。對(duì)于一個(gè)已經(jīng)開始執(zhí)行的服務(wù),將會(huì)測(cè)量服務(wù)性能,比如時(shí)延與抖動(dòng),相應(yīng)的流量工程相關(guān)措施將會(huì)由流量工程方法模塊執(zhí)行。
ms將用這些參數(shù)和本地調(diào)度器(localscheduler,ls)協(xié)商本地資源是否滿足服務(wù)需求。如果滿足,將會(huì)預(yù)留資源(步驟8)。
如果當(dāng)前資源能夠滿足要求(步驟9),將返回正面確認(rèn)(positiveacknowledge)。并且ls將會(huì)分配資源并執(zhí)行服務(wù)(步驟10),同時(shí)報(bào)告并更新資源狀態(tài)(步驟11)。如果資源不能滿足要求,將會(huì)向用戶返回一個(gè)帶有降低服務(wù)等級(jí)參數(shù)的響應(yīng)給用戶,并開始下一輪的sla協(xié)商(步驟8),直到sla參數(shù)得以確認(rèn)或者確定本區(qū)域的所有資源都不能滿足要求。后一種情況下,本地ms將會(huì)查詢其它區(qū)域ms以確認(rèn)其它ms執(zhí)行服務(wù)的可能性。
如果ms和其它云網(wǎng)絡(luò)互通(比如遷移vm),將會(huì)調(diào)用協(xié)議互通模塊(步驟12)。
需要執(zhí)行常規(guī)審計(jì)以保證資源狀態(tài)的一致性以防止資源吊死(deadlock)(步驟13,步驟14)。
優(yōu)化機(jī)制可以用來(lái)獲得更好的資源利用(步驟15)。
oambc將用于系統(tǒng)管理。oambc可以發(fā)送工程命令用于跟蹤服務(wù)、優(yōu)化資源、升級(jí)或者擴(kuò)容。它也可以用于組網(wǎng)信息、資源利用率、負(fù)載報(bào)告、告警或者安全報(bào)告的顯示和人機(jī)交互。oambc用于系統(tǒng)對(duì)外計(jì)費(fèi)(步驟16)。
umatgc2還可以組網(wǎng)支持csb和csp的場(chǎng)景,具體如下:
網(wǎng)絡(luò)扁平化是當(dāng)今趨勢(shì)。所以并不建議太多分層的網(wǎng)絡(luò),除非有很大的流量需要被匯聚并前傳到某些特定的目標(biāo),比如國(guó)際通信,這樣需要引入更高級(jí)別的ms。對(duì)于小型網(wǎng)絡(luò),只需要一個(gè)ms,后續(xù)擴(kuò)容只需要簡(jiǎn)單增加一個(gè)ms即可。對(duì)于大型網(wǎng)絡(luò),建議采用兩個(gè)專有ms負(fù)責(zé)本地所有l(wèi)s。這一對(duì)ms工作在主從狀態(tài)。所有的主用ms2(元調(diào)度器2)全互聯(lián),同時(shí)所有的備用ms1(元調(diào)度器1)也全互聯(lián)。形成圖2所示的雙平面組網(wǎng)。每一個(gè)ls連接兩個(gè)ms,并且所有的ms全互聯(lián)。
umatgc2還可以進(jìn)行業(yè)務(wù)分發(fā),對(duì)于整合其它c(diǎn)sp的服務(wù)的csb來(lái)說(shuō),它將依據(jù)最低價(jià)格最好服務(wù)的原則選擇并部署服務(wù)。所以csb會(huì)通過(guò)所連接的主用ms,攜帶sla參數(shù),以及收益和違約處罰信息,查詢所有的簽約csp,同時(shí)依據(jù)正常查詢時(shí)段啟動(dòng)一個(gè)查詢定時(shí)器。在時(shí)段內(nèi)返回的響應(yīng)將會(huì)被對(duì)比,并從中選擇一個(gè)最合適的云來(lái)完成服務(wù)。
對(duì)于有自己的基礎(chǔ)設(shè)施的csp來(lái)說(shuō),用戶服務(wù)優(yōu)先在本地完成,所需資源也由本地ms分配。除非本地資源不能滿足需求或者用戶有特定要求,比如vm部署在至少兩個(gè)以上地域以防止某數(shù)據(jù)中心宕機(jī)。
如果服務(wù)涉及到兩個(gè)不同的云網(wǎng)絡(luò),比如vm在云間的遷移,則要用到互通模塊(ic)。ic實(shí)現(xiàn)了云間協(xié)議,比如sla協(xié)商協(xié)議和vm鏡像傳輸協(xié)議,解析及適配模塊和其它功能模塊在一起。比如,sla參數(shù)互通模塊是在云間互通時(shí)由sla模塊調(diào)用的。協(xié)議互通模塊是實(shí)現(xiàn)云間協(xié)議互通時(shí)由ms調(diào)用的。
圖3展示了兩種情況下的流程,有兩個(gè)csp,每一個(gè)都有自己的基礎(chǔ)設(shè)施。csp1的云是集中式的只有cpu/mem資源,但是比csp2的便宜。當(dāng)前部署了一個(gè)ms,用于和代理服務(wù)器(brokeragent)進(jìn)行通信并支持后續(xù)擴(kuò)容。csp2的云跨兩個(gè)區(qū)域,不同區(qū)域的云資源是異構(gòu)的。一個(gè)區(qū)域部署多個(gè)ls用來(lái)管理本區(qū)域大規(guī)模的服務(wù)器功能簇sfc。相應(yīng)的關(guān)系總結(jié)在表1。兩個(gè)ms用來(lái)管理ls,并保證冗余和防止宕機(jī)。一個(gè)csb租借了csp1的云和csp2在兩個(gè)區(qū)域的部分?jǐn)?shù)據(jù)中心,并通過(guò)代理服務(wù)器接入業(yè)務(wù)。
表1
同時(shí)csp2也對(duì)外發(fā)布自己的品牌和服務(wù),它的接入服務(wù)器是csp2agent。brokeragent位于區(qū)域1,所以它只和區(qū)域1的所租借的csp的ms連接。csp2agent只和區(qū)域2的最近ms連接。也許對(duì)于同一個(gè)csp來(lái)說(shuō),有多于一個(gè)的業(yè)務(wù)接入點(diǎn),它只需要就近接入最近的ms。
圖3中雙向粗雙箭頭線顯示了csb情景的業(yè)務(wù)流程:
1、一個(gè)用戶發(fā)送了存儲(chǔ)服務(wù)情況,請(qǐng)求中帶有sla參數(shù)并要求vm至少部署在兩個(gè)區(qū)域以防止宕機(jī)(step1)。
2、brokeragent(代理服務(wù)器)查詢兩個(gè)分別歸屬于兩個(gè)csp的ms,看誰(shuí)可以以最低的價(jià)格完成服務(wù)。csp1(代理商1)拒絕了請(qǐng)求,因?yàn)樗挥衏pu類型的資源(step2)。
3、csp2(代理商2)的ms用一些算法,比如最小直徑算法來(lái)選擇最合適的數(shù)據(jù)中心,并同時(shí)考慮了位置需求。被選擇的數(shù)據(jù)中心應(yīng)該被記錄下來(lái)以備后用。請(qǐng)求消息被前傳到不同區(qū)域的調(diào)度器(區(qū)域1是ls2,區(qū)域2是ms1然后ls3)預(yù)留資源。ls接收到請(qǐng)求并進(jìn)一步依據(jù)某種算法,比如最短樹算法,找到機(jī)框和服務(wù)器,來(lái)部署vm。然后再依據(jù)一些算法,比如ff算法將vm進(jìn)行劃分,并決定哪些vm應(yīng)該部署在那個(gè)服務(wù)器上。預(yù)留的句柄將會(huì)成功返回,相應(yīng)的資源狀態(tài)也會(huì)被更新(step3)。
4、csp2返回確認(rèn)到brokeragent,并攜帶價(jià)格信息和協(xié)商好的sla參數(shù)(step2)。
5、brokeragent選csp2為服務(wù)提供者并要求csp2按照簽約參數(shù)完成服務(wù)(step4)。
6、根據(jù)已經(jīng)記錄的數(shù)據(jù)中心和預(yù)留的句柄,ms要求ls分配預(yù)留資源,更新資源狀態(tài),完成服務(wù)(step5)。
雙向虛線雙箭頭線展示了csp情景的業(yè)務(wù)流程,包括:
1、一個(gè)用戶發(fā)送虛擬cpu服務(wù)請(qǐng)求(step1)。
2、請(qǐng)求被分發(fā)到連接的最近的ms2(step2)。
3、依據(jù)分發(fā)策略和資源狀態(tài),sla參數(shù)被slac分析后,ms選擇ls來(lái)服務(wù)用戶并把需求路由到主用ls1來(lái)完成服務(wù)(step3)。
一般來(lái)說(shuō),一個(gè)對(duì)外提供大規(guī)模的云服務(wù)的csp會(huì)選擇多個(gè)設(shè)備提供商的產(chǎn)品以保證購(gòu)買中的主動(dòng)權(quán)和價(jià)格優(yōu)勢(shì)。另一方面,多個(gè)csp會(huì)提供相同的云服務(wù)。所以不同的設(shè)備或者不同的csp之間的云服務(wù)互通是不可避免的?;ネǖ那疤崾窃崎g協(xié)議(intercloudprotocol)和云間機(jī)制(intercloudroot)。云間協(xié)議是對(duì)于互通的雙方的協(xié)議和格式的統(tǒng)稱。云間機(jī)制是為互通鑒定基礎(chǔ)的共同的機(jī)制,比如ip尋址,dns,交換和路由協(xié)議??赡艿脑崎g協(xié)議和云間機(jī)制已經(jīng)有了一些探討。但這還不足以實(shí)現(xiàn)互通,它需要架構(gòu)和網(wǎng)絡(luò)首先支持互通。
umatgc2能夠輕松組網(wǎng),通過(guò)ms的通信功能來(lái)支持互通,云間協(xié)議和云間機(jī)制可以在ic模塊進(jìn)行解析和適配。
對(duì)于有自己的基礎(chǔ)設(shè)施,而且設(shè)備來(lái)自多個(gè)設(shè)備提供商的運(yùn)營(yíng)商。我們建議在一個(gè)行政區(qū)域只采用一個(gè)設(shè)備提供商的設(shè)備。如圖4所示,地理位置1和地理位置2在行政區(qū)域的西部相鄰,采用相同的基礎(chǔ)設(shè)施。地理位置3和地理位置4在東部相鄰,采用另一廠家的設(shè)備。一般來(lái)說(shuō),區(qū)域內(nèi)的業(yè)務(wù)量比區(qū)域間的通信量大,互通也是這樣。相同的基礎(chǔ)設(shè)施采用了相同的實(shí)現(xiàn)方式和協(xié)議,這樣會(huì)減小互通開銷,從而減少業(yè)務(wù)時(shí)延和資源占用。
對(duì)于兩個(gè)互通的csp,建議采用圖5所示的組網(wǎng),互通本地化,而且在一個(gè)區(qū)域只為雙方設(shè)置一個(gè)互通點(diǎn)。
為實(shí)現(xiàn)冗余備份,通常設(shè)置一對(duì)設(shè)備。因?yàn)楸镜貥I(yè)務(wù)量遠(yuǎn)大于長(zhǎng)途業(yè)務(wù)量,如果大部分互通在本地網(wǎng)絡(luò)中完成,將會(huì)減少對(duì)昂貴的長(zhǎng)途線路的占用,業(yè)務(wù)反應(yīng)時(shí)間也會(huì)大大減少。
圖6展示了cspa和cspb之間進(jìn)行vm遷移時(shí)的互通情況,互通的工作流以及各個(gè)模塊之間的交互。ms負(fù)責(zé)兩個(gè)服務(wù)提供者之間的通信和互通。本處將云間協(xié)議和模塊交互結(jié)合起來(lái)以解釋umatgc2提供的互通功能的實(shí)現(xiàn)。
oambc-a(a表示與csp-a相關(guān)的模塊,b表示與csp-b相關(guān)的模塊)按照客戶要求命令ms-a將vm遷移到csp-b。
事務(wù)1(transaction1)為信賴階段相關(guān)流程,包括:收到遷移請(qǐng)求后,ms-a(相當(dāng)于第一元調(diào)度器)讓sc驗(yàn)證csp-b是否可信賴。sc產(chǎn)生必要的安全參數(shù),比如公鑰等,請(qǐng)求ic將它們適配成標(biāo)準(zhǔn)的x.509請(qǐng)求消息,然后x.509消息被發(fā)送至ms-b(相當(dāng)于第二元調(diào)度器)。ms-b將消息前傳到sc-b,安全參數(shù)被解析出來(lái)后,驗(yàn)證csp-b的資質(zhì)。正向確認(rèn)的x.509響應(yīng)消息被返回至ms-a,確認(rèn)信息被ic-a解析后返回到sc-a。
注意在每一個(gè)事務(wù)中ic都會(huì)被調(diào)用以便將內(nèi)部參數(shù)適配成標(biāo)準(zhǔn)的云間協(xié)議,或?qū)⒃崎g協(xié)議解析成內(nèi)部參數(shù)。后續(xù)事務(wù)中的消息交互過(guò)程和前面所說(shuō)的情況是類似的,所以為簡(jiǎn)便起見,后續(xù)ic將被省略。
還包括在事務(wù)2(transaction2)中sc-a發(fā)起一個(gè)鑒權(quán)流程,安全信息被用ipa(identity、policy、audit)消息通過(guò)ms-a發(fā)送到ms-b。在ms-b收到sc-b的ipa響應(yīng)消息后,響應(yīng)消息被返回到ms-a,并最終返回sc-a。
在事務(wù)3(transaction3)中,成功的進(jìn)行安全檢查和安全機(jī)制驗(yàn)證后,ms-a從負(fù)責(zé)vm的ls取得vm的景象信息,包括cpu、ram以及啟動(dòng)vm的hypervisor(管理程序)要求,然后把這些信息傳給sla-a。附加一些sla特定信息,比如位置信息等,請(qǐng)求被編碼成ovf(openvirtualizationformat)打開虛擬化格式消息,ms-a將消息發(fā)送到ms-b。按照消息里的要求,依據(jù)于某種算法,ms-b返回響應(yīng)。
事務(wù)4(transaction4)是傳輸流程。整個(gè)鏡像信息被通過(guò)amqp高級(jí)消息隊(duì)列協(xié)議(advancedmessagequeuingprotocl)可靠的傳遞到ls-b以便物理機(jī)中的hypervisor管理程序啟動(dòng)vm。在vm成功運(yùn)行后,相關(guān)的資源狀態(tài)進(jìn)行更新。ms-b通知ms-a遷移完成,ms-a要求ls-a刪除已經(jīng)被遷移的vm。原來(lái)占用的資源被釋放,資源狀態(tài)被刷新。
如圖7所示,在云的生命周期中,有多個(gè)維護(hù)環(huán)節(jié),比如規(guī)劃,擴(kuò)容,升級(jí),業(yè)務(wù)部署測(cè)試,以及業(yè)務(wù)部署后評(píng)估優(yōu)化。所有這些動(dòng)作以一種連續(xù)迭代,周而復(fù)始的形式不斷進(jìn)行。umatgc2能夠支持維護(hù)動(dòng)作的自動(dòng)實(shí)現(xiàn)。
一個(gè)新的剛部署的云應(yīng)該經(jīng)過(guò)充分測(cè)試以保證業(yè)務(wù)提供能力。sla和性能測(cè)量由sla測(cè)量模塊進(jìn)行。資源利用情況被資源管理模塊的資源狀態(tài)單元收集。在發(fā)布后,服務(wù)用戶數(shù)和業(yè)務(wù)負(fù)載都會(huì)增加。某些資源會(huì)變得緊缺從而會(huì)被劇烈競(jìng)爭(zhēng)。qos會(huì)因?yàn)橘Y源缺乏而下降,甚至可靠性也會(huì)被危及。所以一些告警信息會(huì)被報(bào)告給oambc以提醒運(yùn)營(yíng)者。同時(shí)這些信息會(huì)被發(fā)送到資源管理模塊的評(píng)估單元(相當(dāng)于評(píng)估器)對(duì)網(wǎng)絡(luò)和資源進(jìn)行評(píng)估。評(píng)估結(jié)果被發(fā)送到oambc和資源管理模塊的優(yōu)化器。相關(guān)的優(yōu)化建議也會(huì)被提出,例如,資源擴(kuò)容,vm遷移。相應(yīng)的規(guī)劃和設(shè)計(jì)也需要進(jìn)行。當(dāng)然所有的機(jī)制都應(yīng)該在oambc上展示,并在得到運(yùn)維人員(如果有)確認(rèn)后,由ms和ls在對(duì)應(yīng)的管理區(qū)域?qū)嵤?/p>
除以上所提到的自動(dòng)機(jī)制外,還可以通過(guò)oambc設(shè)置到不同的模塊。比如,如果運(yùn)營(yíng)商希望以更低的價(jià)格提供服務(wù),他可以要求審計(jì)模塊周期性的進(jìn)行審計(jì)。在業(yè)務(wù)空閑期,利用率低下的服務(wù)器將會(huì)被發(fā)現(xiàn),這些服務(wù)器上的vm可以被遷移或者按照一定的算法進(jìn)行整合。然后空閑的服務(wù)器就可以關(guān)閉以節(jié)省能源。在業(yè)務(wù)高峰期來(lái)臨之前,原來(lái)的部署可以恢復(fù)。或者vm的部署可以按月進(jìn)行檢查以便可以按照一些更有效的離線算法比如ffd進(jìn)行優(yōu)化。
oambc也可以命令服務(wù)器逐個(gè)進(jìn)行升級(jí)。首先oambc會(huì)將服務(wù)器上的所有vm遷移走,然后升級(jí),在測(cè)試成功后,再將vm遷回。
如果維護(hù)階段引起互通,比如從一個(gè)csp遷移vm到另一個(gè),ic會(huì)參與完成整個(gè)遷移。
本架構(gòu)能夠:1)實(shí)現(xiàn)對(duì)集中式組網(wǎng)和分布式組網(wǎng)的統(tǒng)一部署;2)滿足csp和csb不同組網(wǎng)需求的一致性;3)實(shí)現(xiàn)分布式云計(jì)算的通信、qos保證、互通、維護(hù)和流量工程方法部署機(jī)制的電信級(jí)別設(shè)計(jì);4)實(shí)現(xiàn)對(duì)不同資源的統(tǒng)一管理。架構(gòu)主要側(cè)重于實(shí)現(xiàn)功能模塊化和設(shè)計(jì)可擴(kuò)展框架,同時(shí)進(jìn)行詳細(xì)的分析以驗(yàn)證其功能的可行性等。
基于上述umatgc2(相當(dāng)于云計(jì)算系統(tǒng))及其工作流程,本發(fā)明提出了一種資源分配方法,如圖9所示,第一物理服務(wù)器管理至少一個(gè)第二物理服務(wù)器,所述第一物理服務(wù)器包括元調(diào)度器,所述第二物理服務(wù)器包括本地調(diào)度器;如圖8所示,所述資源分配方法包括以下步驟:
201:第一物理服務(wù)器先判斷用戶是否進(jìn)行了注冊(cè),若用戶進(jìn)行了注冊(cè),則進(jìn)行步驟202,若用戶沒(méi)有注冊(cè),則拒絕用戶的服務(wù)請(qǐng)求。
202:第一物理服務(wù)器判斷所述服務(wù)請(qǐng)求是否具備權(quán)限;若不具備權(quán)限,則拒絕所述服務(wù)請(qǐng)求;若具備權(quán)限,第一物理服務(wù)器則會(huì)接收到有需求參數(shù)的服務(wù)請(qǐng)求;所述需求參數(shù)包括開始時(shí)間、執(zhí)行時(shí)間、vm位置和違約懲罰信息等;
203:所述第一物理服務(wù)器將所述需求參數(shù)進(jìn)行分析,判斷能否滿足所述服務(wù)請(qǐng)求;若所述云計(jì)算系統(tǒng)已經(jīng)超載,則不能滿足所述服務(wù)請(qǐng)求,則拒絕所述服務(wù)請(qǐng)求;若能,則進(jìn)入步驟204;
204:所述第一物理服務(wù)器可用來(lái)解析或適配云間機(jī)制與云間協(xié)議;所述第一物理服務(wù)器將所述需求參數(shù)適配成所述云計(jì)算系統(tǒng)可識(shí)別的格式。
205:所述第一物理服務(wù)器中的第一元調(diào)度器根據(jù)可識(shí)別的所述需求參數(shù)并與第二物理服務(wù)器中的本地調(diào)度器協(xié)商預(yù)留資源;若能滿足所述服務(wù)請(qǐng)求,會(huì)預(yù)留相應(yīng)的資源,進(jìn)入到步驟206,若不能滿足所述服務(wù)請(qǐng)求,所述第一物理服務(wù)器則向客戶端發(fā)送降低服務(wù)等級(jí)的參數(shù),與用戶進(jìn)行下一輪協(xié)商,協(xié)商方式相同,是通過(guò)重復(fù)步驟202到204;無(wú)論是協(xié)商不能滿足所述服務(wù)請(qǐng)求還是一開始不能滿足所述服務(wù)請(qǐng)求,所述第一元調(diào)度器都會(huì)調(diào)度其他行政區(qū)域的其他元調(diào)度器(相當(dāng)于第二元調(diào)度)執(zhí)行所述服務(wù)請(qǐng)求;
206:所述第一物理服務(wù)器根據(jù)步驟205所預(yù)留的資源,完成資源分配。
第一元調(diào)度器調(diào)度其他行政區(qū)域的第二元調(diào)度器執(zhí)行所述服務(wù)請(qǐng)求還包括:所述第一元調(diào)度器發(fā)起一個(gè)鑒權(quán)流程,該流程首先是將安全消息發(fā)送到所述第二元調(diào)度器,之后第二元調(diào)度器會(huì)有響應(yīng)消息,響應(yīng)消息被返回至第一元調(diào)度器。
本發(fā)明所提出的采用所述資源分配方法的裝置,包括:處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器運(yùn)行所述存儲(chǔ)器中的計(jì)算機(jī)程序使所述裝置執(zhí)行上述資源分配方法。
另外,本發(fā)明所提出的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述資源分配方法的步驟。
基于上述umatgc2(相當(dāng)于云計(jì)算系統(tǒng))及其工作流程,本發(fā)明還提出了一種本地資源調(diào)度方法,包括:
t1、本地調(diào)度器接受來(lái)自第一元調(diào)度器的協(xié)商;所述第一元調(diào)度器攜帶有服務(wù)請(qǐng)求;
t2、所述第二物理服務(wù)器根據(jù)所述服務(wù)請(qǐng)求預(yù)留資源。
完成本地資源的調(diào)度之后,還可以包括所述第二物理服務(wù)器對(duì)已經(jīng)完成的所述服務(wù)請(qǐng)求進(jìn)行服務(wù)性能的測(cè)量。
另外,完成本地資源的調(diào)度之后,還可以包括所述第二物理服務(wù)器報(bào)告并更新所述云計(jì)算系統(tǒng)的資源狀態(tài)。
云計(jì)算系統(tǒng)需要維護(hù),所述第二物理服務(wù)器將所述云計(jì)算系統(tǒng)進(jìn)行優(yōu)化并執(zhí)行周期性審計(jì)。
同時(shí),本發(fā)明提出的采用本地資源調(diào)度方法的裝置,包括:處理器和存儲(chǔ)器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器運(yùn)行所述存儲(chǔ)器中的計(jì)算機(jī)程序使所述裝置執(zhí)行上述任一所述的本地資源調(diào)度方法。
此外,本發(fā)明提出的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任一所述本地資源調(diào)度方法的步驟。
業(yè)務(wù)接入點(diǎn)只和本地元調(diào)度器進(jìn)行連接,實(shí)現(xiàn)業(yè)務(wù)需求就近接入的技術(shù)方式。實(shí)現(xiàn)本地資源優(yōu)先調(diào)用,兼顧滿足異地業(yè)務(wù)接入。由元調(diào)度器提供的大規(guī)模分布式組網(wǎng)的的技術(shù)方式,包括元調(diào)度器的主備或者負(fù)荷分擔(dān)的組網(wǎng)方式,所有的需求參數(shù)協(xié)商采用間隔時(shí)間并發(fā)選擇的業(yè)務(wù)分發(fā)方式。由元調(diào)度器通過(guò)協(xié)議實(shí)現(xiàn)云計(jì)算服務(wù)提供商(csp)的互聯(lián)互通功能,不同csp互聯(lián)互通時(shí)的互通本地化組網(wǎng)的技術(shù)方式。元調(diào)度器負(fù)責(zé)csp之間的通信,并和本架構(gòu)內(nèi)的本地調(diào)度器協(xié)作,并進(jìn)行協(xié)議適配和解析,從而實(shí)現(xiàn)csp之間的互聯(lián)互通。為了互通最小化倡導(dǎo)互通本地化和相鄰地域使用同型號(hào)設(shè)備的組網(wǎng)方式。
本發(fā)明中還可以利用元調(diào)度器的調(diào)度功能,實(shí)現(xiàn)分布式云計(jì)算的通信和互通功能,并能提供服務(wù)質(zhì)量保證、和一般的維護(hù),支持流量工程方法部署機(jī)制,從而實(shí)現(xiàn)電信級(jí)別的云計(jì)算系統(tǒng)的資源分配。
需要說(shuō)明的是,術(shù)語(yǔ)“第一”、“第二”、“第三”、“第四”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括一個(gè)或者更多個(gè)該特征。
需要說(shuō)明的是,在本地域內(nèi)設(shè)置有元調(diào)度器和本地調(diào)度器的二級(jí)結(jié)構(gòu)組網(wǎng),并實(shí)現(xiàn)對(duì)異構(gòu)資源管理的技術(shù)方式。根據(jù)功能簇的功能和規(guī)模大小設(shè)置多個(gè)本地調(diào)度器,并匯總于本區(qū)域的元調(diào)度器,從而實(shí)現(xiàn)大規(guī)模異構(gòu)資源的管理。
在兩個(gè)云計(jì)算服務(wù)商之間進(jìn)行虛擬機(jī)(vm)的遷移的互通過(guò)程包括,第一元調(diào)度器收到遷移請(qǐng)求后,產(chǎn)生安全參數(shù),例如公鑰等,配置成標(biāo)準(zhǔn)的x.509請(qǐng)求消息,發(fā)送至第二元調(diào)度器,之后反饋至第一物理服務(wù)器并進(jìn)行解析。每一個(gè)互通過(guò)程中都會(huì)將內(nèi)部參數(shù)適配成標(biāo)準(zhǔn)的云間協(xié)議,或?qū)⒃崎g協(xié)議解析成內(nèi)部參數(shù)。
采用上述裝置執(zhí)行虛擬機(jī)(vm)的遷移,包括:
在第一物理服務(wù)器發(fā)起一個(gè)鑒權(quán)流程,安全信息發(fā)送到第二物理服務(wù)器,之后第二物理服務(wù)器響應(yīng)消息后,響應(yīng)消息被返回至第一物理服務(wù)器。
成功的進(jìn)行安全檢查和安全機(jī)制驗(yàn)證后,第一物理服務(wù)器取得vm的景象信息,包括中央處理器(cpu)、隨機(jī)存取存儲(chǔ)器(ram)以及啟動(dòng)vm的管理程序的要求,然后把這些信息傳給第二物理服務(wù)器。附加一些特定信息,比如位置信息等,請(qǐng)求被編碼成打開虛擬化格式消息ovf(openvirtualizationformat)。按照消息里的要求,依據(jù)算法,第二物理服務(wù)器返回響應(yīng)。
傳輸流程包括整個(gè)鏡像信息被通過(guò)高級(jí)消息隊(duì)列協(xié)議amqp(advancedmessagequeuingprotocl)可靠的傳遞到第二云計(jì)算器以便物理機(jī)中的管理程序啟動(dòng)vm。在vm成功運(yùn)行后,相關(guān)的資源狀態(tài)進(jìn)行更新。第二物理服務(wù)器通知第一物理服務(wù)器遷移完成,第一物理服務(wù)器刪除已經(jīng)被遷移的vm。原來(lái)占用的資源被釋放,資源狀態(tài)被刷新。
需要說(shuō)明的是,元調(diào)度器完成相關(guān)的調(diào)度工作。
以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對(duì)本發(fā)明所作的進(jìn)一步詳細(xì)說(shuō)明,不能認(rèn)定本發(fā)明的具體實(shí)施只局限于這些說(shuō)明。對(duì)于本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干等同替代或明顯變型,而且性能或用途相同,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。