一種獲取云中心和數(shù)據(jù)中心信息系統(tǒng)的發(fā)掘遷移方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種獲取云中心和數(shù)據(jù)中心信息發(fā)掘迀移的系統(tǒng)方法及子方法,屬于 云計(jì)算,知識(shí)挖掘領(lǐng)域。
【背景技術(shù)】
[0002] 云計(jì)算在基于面向服務(wù)計(jì)算領(lǐng)域已經(jīng)取得了極大的成功,并在計(jì)算基礎(chǔ)設(shè)施方面 有著革命性的發(fā)展。當(dāng)前的云計(jì)算特性,對(duì)各種企業(yè)用戶都有著強(qiáng)烈的吸引力。但同時(shí)企 業(yè)的舊IT基礎(chǔ)設(shè)施并不具備直接吸收云計(jì)算的能力。理論上,打包并迀移數(shù)據(jù)和應(yīng)用到云 計(jì)算環(huán)境看起來(lái)很直接,企業(yè)可以很容易的利用云的計(jì)算能力為自己服務(wù),應(yīng)為無(wú)非就是 把數(shù)據(jù),商業(yè)應(yīng)用,及代碼迀移到一個(gè)新的環(huán)境。但是,實(shí)際上迀移數(shù)據(jù),應(yīng)用和系統(tǒng)所涉及 的方面,要考慮的因素,和處理的問(wèn)題錯(cuò)綜復(fù)雜。其中,對(duì)于企業(yè)的關(guān)鍵商業(yè)應(yīng)用來(lái)說(shuō),如何 合理的打包迀移這些數(shù)據(jù)應(yīng)用,同時(shí)維護(hù)企業(yè)客戶的良好運(yùn)行,且不影響企業(yè)的其他業(yè)務(wù) 的正常運(yùn)帷操作,是一個(gè)嚴(yán)肅重要的研宄課題。這需要大量的人力資源來(lái)管理可能涉及的 敏感數(shù)據(jù),應(yīng)用等等。而當(dāng)前已有的數(shù)據(jù)系統(tǒng)迀移方案要耗費(fèi)大量人力物力和時(shí)間來(lái)完成。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明提供了本發(fā)明涉及一種獲取云中心和數(shù)據(jù)中心信息系統(tǒng)的發(fā)掘迀移方法, 屬于云計(jì)算,知識(shí)挖掘領(lǐng)域,解決了現(xiàn)有系統(tǒng)迀移體系不完善,手工作業(yè)比重大,花費(fèi)高,耗 時(shí)長(zhǎng)的問(wèn)題。
[0004] 本發(fā)明技術(shù)方案如下:
[0005] -種獲取云中心和數(shù)據(jù)中心信息系統(tǒng)的發(fā)掘迀移方法,包括以下步驟,
[0006] S1,選取待發(fā)掘迀移的云中心和數(shù)據(jù)中心信息系統(tǒng)Si;
[0007] S2,觸發(fā)系統(tǒng)Si迀移,通過(guò)模式識(shí)別尋找依賴系統(tǒng)S 所有相關(guān)系統(tǒng),獲取依賴于 系統(tǒng)Si的系統(tǒng)清單S \S2,…,Sn;
[0008] S3,信息收集:收集主機(jī)系統(tǒng)的系統(tǒng)日志、應(yīng)用程序日志和網(wǎng)絡(luò)活動(dòng)日志;將收集 到的日志匯總;
[0009] S4,將當(dāng)前系統(tǒng)清單S1,S2,…,Sn*已完成信息收集的系統(tǒng)信息(如,主機(jī)系統(tǒng)間 的依賴關(guān)系,關(guān)鍵應(yīng)用程序在主機(jī)間的相互依賴關(guān)系,系統(tǒng)負(fù)荷等)與系統(tǒng)清單S 1,S2,… ,Sn建立映射,并歸檔;
[0010] S5,針對(duì)系統(tǒng)清單中的系統(tǒng)S' S%計(jì)算系統(tǒng)SW的迀移風(fēng)險(xiǎn)函數(shù)值R,其中 l〈j〈q〈n ;
[0011] S6,基于迀移風(fēng)險(xiǎn)函數(shù)值R值來(lái)創(chuàng)建迀移系統(tǒng)清單S1,S2,…,Sn的優(yōu)先隊(duì)列,并基 于所述優(yōu)先隊(duì)列順序?qū)ο到y(tǒng)清單S 1,S2,…,Sn中的系統(tǒng)啟動(dòng)迀移。
[0012] 本發(fā)明所米用基于 SVM(space vector machine)技術(shù)的 Active Learning 的算 法來(lái)模式識(shí)別系統(tǒng)迀移中可識(shí)別模式.所述通過(guò)模式識(shí)別基于概率SVM的主動(dòng)學(xué)習(xí) (SVM active Ierning)算法獲得在模式數(shù)據(jù)庫(kù)中已有的可識(shí)別模式;
[0013] 所述基于概率SVM的主動(dòng)學(xué)習(xí)算法具體包括以下步驟:
[0014] (1)數(shù)據(jù)輸入:將系統(tǒng)清單S\S2,…,Sn中已標(biāo)示系統(tǒng)定義集合為D 1, ^為訓(xùn)練數(shù) 據(jù)集合,還未標(biāo)示的集合為Du,計(jì)算步驟數(shù)T和在每一次迭代中采樣數(shù)t ;
[0015] (2)獲取分類下的所有子分類,具體包括以下步驟:
[0016] (2-a)當(dāng)t < = T時(shí),基于訓(xùn)練數(shù)據(jù)集合D1,訓(xùn)練獲得多重標(biāo)示SVM分類器;
[0017] (2-b)對(duì)于每一個(gè)在集合Du中的X,X e D u;
[0018] (2-c)利用損失抑制(loss reduction)方法預(yù)測(cè)標(biāo)示向量集合Y ;
【主權(quán)項(xiàng)】
1. 一種獲取云中心和數(shù)據(jù)中心信息系統(tǒng)的發(fā)掘迀移方法,其特征在于:包括以下步 驟, S1,選取待發(fā)掘迀移的云中心和數(shù)據(jù)中心信息系統(tǒng)Si; 52, 觸發(fā)系統(tǒng)Si迀移,通過(guò)模式識(shí)別尋找依賴系統(tǒng)S 所有相關(guān)系統(tǒng),獲取依賴于系統(tǒng) Si的系統(tǒng)清單S1JV^Sn; 53, 信息收集:收集主機(jī)系統(tǒng)的系統(tǒng)日志、應(yīng)用程序日志和網(wǎng)絡(luò)活動(dòng)日志;將收集到的 日志匯總; 54, 將當(dāng)前系統(tǒng)清單S1,S2,…,Sn中已完成信息收集的系統(tǒng)信息與系統(tǒng)清單S \ S2,…,Sn 建立映射,并歸檔; 55, 針對(duì)系統(tǒng)清單中的系統(tǒng)Sq,計(jì)算系統(tǒng)Sq的迀移風(fēng)險(xiǎn)函數(shù)值R,其中l(wèi)〈j〈q〈n ; 56, 基于迀移風(fēng)險(xiǎn)函數(shù)值R值來(lái)創(chuàng)建迀移系統(tǒng)清單S1,S2,…,Sn的優(yōu)先隊(duì)列,并基于所 述優(yōu)先隊(duì)列順序?qū)ο到y(tǒng)清單S 1,S2,…,Sn中的系統(tǒng)啟動(dòng)迀移。
2. 根據(jù)權(quán)利要求1所述的一種獲取云中心和數(shù)據(jù)中心信息系統(tǒng)的發(fā)掘迀移方法,其特 征在于: 所述通過(guò)模式識(shí)別基于概率SVM的主動(dòng)學(xué)習(xí)算法獲得在模式數(shù)據(jù)庫(kù)中已有的可識(shí)別 模式; 所述基于概率SVM的主動(dòng)學(xué)習(xí)算法具體包括以下步驟: (1) 數(shù)據(jù)輸入:將系統(tǒng)清單S1,S2,…,Sn中已標(biāo)示系統(tǒng)定義集合為D p D1為訓(xùn)練數(shù)據(jù)集 合,還未標(biāo)示的集合為Du,計(jì)算步驟數(shù)T和在每一次迭代中采樣數(shù)t ; (2) 獲取分類下的所有子分類,具體包括以下步驟: (2-a)當(dāng)t < = T時(shí),基于訓(xùn)練數(shù)據(jù)集合D1,訓(xùn)練獲得多重標(biāo)示SVM分類器; (2-b)對(duì)于每一個(gè)在集合Du中的X,X e D u; (2-c)利用損失抑制方法預(yù)測(cè)標(biāo)示向量集合Y ;
其中,fi (X)是與類i相關(guān)的分類器函數(shù),分類器函數(shù)總共包括k個(gè)類;y為標(biāo)示向量集 合Y的元素向量,為二維向量,且收斂于[一 1,1],DS為損失抑制方法計(jì)算時(shí)從Du*的取樣 集合;公式(1)表示為滿,
(2-d)基于標(biāo)示向量集合Y,計(jì)算期望的降損score (X):
(2-e),對(duì)于所有在集合Du*存在的X,對(duì)score (X)降序排序; (2-f),從A中選取最大的scoreOc),作為樣本集合S,同時(shí)更新訓(xùn)練數(shù)據(jù)集合 D/-z)/+D:,可識(shí)別模式基于新的Di更新。
3. 根據(jù)權(quán)利要求1所述的一種獲取云中心和數(shù)據(jù)中心信息系統(tǒng)的發(fā)掘迀移方法,其特 征在于:所述迀移風(fēng)險(xiǎn)函數(shù)值R計(jì)算公式為: R(0, δ) = e*L(9, δ (X)) =/ L(0, δ (X))dP0(X) 其中,參數(shù)Θ為原始狀態(tài)的固定值,δ為目的前移狀態(tài);X是從全部收集的系統(tǒng)數(shù)據(jù) 中隨機(jī)抽取的向量空間集合;R(9, δ)為系統(tǒng)狀態(tài)由原始狀態(tài)Θ前移到δ狀態(tài)的迀移風(fēng) 險(xiǎn)值,期望E由在全部數(shù)據(jù)集中出現(xiàn)的X計(jì)算;dP0 (X)為全部數(shù)據(jù)X的微分概率測(cè)量值; L ( θ,δ (X))為全部數(shù)據(jù)X的損失,經(jīng)過(guò)在X的積分獲得R ; 其中E的計(jì)算公式為:
其中P0 (X)為全部數(shù)據(jù)X的概率測(cè)量值。
【專利摘要】本發(fā)明公開(kāi)了一種獲取云中心和數(shù)據(jù)中心信息系統(tǒng)的發(fā)掘遷移方法,包括以下步驟,S1,選取待發(fā)掘遷移的云中心和數(shù)據(jù)中心信息系統(tǒng)Si;S2,獲取依賴于系統(tǒng)Si的系統(tǒng)清單S1,S2,…,Sn;S3,信息收集;S4,將當(dāng)前系統(tǒng)清單中已完成信息收集的系統(tǒng)信息與系統(tǒng)清單建立映射,并歸檔;S5,針對(duì)系統(tǒng)清單中的系統(tǒng)Sj、Sq,計(jì)算系統(tǒng)Sj、Sq的遷移風(fēng)險(xiǎn)函數(shù)值R;S6,基于遷移風(fēng)險(xiǎn)函數(shù)值R值來(lái)創(chuàng)建遷移系統(tǒng)清單的優(yōu)先隊(duì)列。本發(fā)明通過(guò)知識(shí)挖掘,在實(shí)際遷移系統(tǒng)時(shí),將系統(tǒng)所涉及的子系統(tǒng)按照優(yōu)先級(jí)排序,解決錯(cuò)綜復(fù)雜的子系統(tǒng)前移問(wèn)題,解決了現(xiàn)有系統(tǒng)遷移體系不完善,手工作業(yè)比重大,花費(fèi)高,耗時(shí)長(zhǎng)的問(wèn)題。
【IPC分類】G06F9-48
【公開(kāi)號(hào)】CN104834560
【申請(qǐng)?zhí)枴緾N201510173929
【發(fā)明人】白琨, 王飛, 陳文
【申請(qǐng)人】浙江奇道網(wǎng)絡(luò)科技有限公司
【公開(kāi)日】2015年8月12日
【申請(qǐng)日】2015年4月14日