一種保護云計算大數(shù)據(jù)隱私的方法
【技術領域】
[0001] 本發(fā)明屬于云計算領域,涉及云計算數(shù)據(jù)處理、加密、存儲及其隱私保護等內(nèi)容和 方法,可用于云計算中數(shù)據(jù)的安全存儲和隱私保護。
【背景技術】
[0002] 關于云數(shù)據(jù)尤其是云大數(shù)據(jù)在云上的安全和隱私保護一直是近年來云計算領域 的前沿研究熱點。云計算中的數(shù)據(jù)隱私安全,尤其是大數(shù)據(jù)隱私的安全問題是云租戶需要 重點考慮的問題,一些潛在的云計算租戶,如科研機構、政府機構以及商業(yè)機構(尤其象銀 行、醫(yī)療機構這樣持有敏感大數(shù)據(jù)的商業(yè)機構)對于選擇云計算服務應保持足夠的警惕。一 旦商業(yè)用戶大規(guī)模使用私人機構提供的云計算服務,無論其技術優(yōu)勢有多強,都不可避免 地讓這些私人機構以"數(shù)據(jù)(信息)安全"的重要性挾制整個社會。對于信息社會而言,"數(shù)據(jù) 信息及其安全"是至關重要的。另一方面,云計算中的大數(shù)據(jù)對于數(shù)據(jù)所有者以外的其他云 計算租戶是應該是保密的,但是對于提供云計算的商業(yè)機構而言確實毫無秘密可言。所有 這些潛在的危險,是商業(yè)機構和政府機構選擇云計算服務、特別是國外機構提供的云計算 服務時,不得不考慮的一個重要的前提。
[0003] 專利[CN104255011A]公開了一種用于安全數(shù)據(jù)存儲服務的方法和實施方式。該方 法雖然提高了數(shù)據(jù)訪問的安全性并且改善了在云計算環(huán)境中的用戶體驗,但沒有解決云數(shù) 據(jù)尤其是云大數(shù)據(jù)的在云上的安全和隱私保護問題。論文[W a n g C,W a n g Q,R e n K, etal.Privacy-preservingpublicauditingfordatastoragesecurityincloudcomputing [C]//INF0C0M,2014ProceedingsIEEE·IEEE,2014:第l-9頁]提出通過公共審計的方式來保 護云數(shù)據(jù)的隱私安全方案,該方案通過外部第三方對數(shù)據(jù)在傳輸、訪問和存儲過程進行審 計的方式保護云數(shù)據(jù)的存儲隱私,具有較好的公正性,但由于加入了第三方審計機構且審 計規(guī)則的制訂、實施、修訂都會降低系統(tǒng)的性能。至目前為止,如何尋找一種高效、安全的保 護云運算大數(shù)據(jù)安全和隱私的方法,仍然是一個熱點和難點問題。
【發(fā)明內(nèi)容】
[0004] 為解決現(xiàn)有技術的不足。提出一種保護云計算大數(shù)據(jù)隱私的方法,以提高云租戶 的大數(shù)據(jù)在云上的安全和隱私保護。
[0005] 為實現(xiàn)上述目的,本發(fā)明采用以下技術方案: 一種保護云計算大數(shù)據(jù)隱私的方法,包括以下具體步驟: 第一步,將云租戶大數(shù)據(jù)按照邏輯序號分塊,借鑒因特網(wǎng)中TCP/IP通信協(xié)議中的數(shù)據(jù) 包思路,每個邏輯分塊包含大數(shù)據(jù)擁有者和云存儲服務提供者的相關標識、身份、地址信息 以及序列號、唯一性標志、隱私關鍵數(shù)據(jù)塊標志和共孚標志等?目息。
[0006] 第二步,在云租戶大數(shù)據(jù)進行邏輯分塊的基礎上,對部分關鍵隱私數(shù)據(jù)塊進行加 密。同時,根據(jù)實際需要,對邏輯數(shù)據(jù)塊進行備份操作。具體的過程是: S21:對云租戶大數(shù)據(jù)邏輯分塊設置關鍵字識別,對云租戶大數(shù)據(jù)隱私具有關鍵影響的 邏輯塊進行加密處理。
[0007] S22:根據(jù)租戶實際需要,考慮對云租戶大數(shù)據(jù)邏輯分塊進行冗余備份處理,考慮 到數(shù)據(jù)備份的優(yōu)化問題,在數(shù)據(jù)的容災能力和數(shù)據(jù)的優(yōu)化冗余備份兩方面進行權衡,選擇 合適的備份份數(shù)。
[0008] S23:對關鍵隱私數(shù)據(jù)塊加密并選擇合適的數(shù)據(jù)塊備份份數(shù)后,將這些處理后的數(shù) 據(jù)塊提交到云存儲索引中心。
[0009] S24:云存儲索引中心對S23中的數(shù)據(jù)塊進行部署,隨機分布式存儲在不同的云存 儲服務提供中心。
[0010]第三步,對第二步數(shù)據(jù)存儲后形成的路徑映射進行加密。具體過程表示為:設云租 戶私密數(shù)據(jù)&最后形成m個邏輯數(shù)據(jù)塊隨機存儲在s個云存儲服務提供者中。根據(jù) 各邏輯數(shù)據(jù)塊在s個云存儲服務提供者中的的存儲路徑,可以得到云租戶數(shù)據(jù)在云存儲服 務平臺中的存儲路徑映射為
:_表不序號為i的存儲服務提供者中擁有j個存儲介質(zhì)。
[0011] 第四步,數(shù)據(jù)擁有者對第三步中的云數(shù)據(jù)存儲路徑映射進行加密。
[0012] 第一步中的對數(shù)據(jù)進行邏輯分塊,可以按文件的擴展名進行分塊,也可以對數(shù)據(jù) 進行統(tǒng)一大小的分塊。
[0013] 相比現(xiàn)有技術,本發(fā)明具有以下優(yōu)點: 1. 更加適合云大數(shù)據(jù)的隱私保護,數(shù)據(jù)分塊處理可以極大提高處理效率; 2. 提高數(shù)據(jù)安全處理的有效性,避免由于針對大數(shù)據(jù)加、解密產(chǎn)生的低效甚至不可用 的問題; 3. 隱私數(shù)據(jù)的分塊與分布式存儲解決了不法服務商由于擁有完整數(shù)據(jù)而要挾租戶的 問題; 4. 分塊存儲和數(shù)據(jù)備份提高了大數(shù)據(jù)在云計算中的可用性、安全性和健壯性。
【附圖說明】
[0014] 圖1為本發(fā)明將云租戶大數(shù)據(jù)劃分為邏輯塊并將關鍵隱私塊進行加密示意圖。
[0015] 圖2為本發(fā)明中備份后的邏輯數(shù)據(jù)塊在不同云存儲服務提供者中存儲示意圖。
[0016] 圖3為用本發(fā)明所受"海盜藏寶"啟發(fā)的云租戶數(shù)據(jù)存儲路徑映射圖。
[0017]圖4為云租戶醫(yī)療大數(shù)據(jù)存儲路徑圖。
[0018] 圖中標記:1-6為大數(shù)據(jù)的邏輯分塊。
【具體實施方式】
[0019] 實施例一 本發(fā)明是一種保護云計算大數(shù)據(jù)隱私的方法,其具體實施方案將結合包含病人隱私信 息的某一醫(yī)療大數(shù)據(jù)
進行具體描述,包括以下具體步驟: 第一步,借鑒因特網(wǎng)中TCP/IP通信協(xié)議中的數(shù)據(jù)包劃分思想,將云租戶大數(shù)據(jù)進行邏 輯分塊,每個邏輯分塊包含大數(shù)據(jù)租戶擁有者和云存儲服務提供者的相關標識、身份或者 地址彳目息以及序列號、唯一性標志、隱私關鍵數(shù)據(jù)塊標志和共孚標志等。
[0020] 本例中,
蓋由不同數(shù)據(jù)類型構成的組合大數(shù)據(jù),則將選擇從 數(shù)據(jù)的類型進行數(shù)據(jù)分塊,即根據(jù)數(shù)據(jù)文件的擴展名,如pdf, rar, doc, jpg, torrent, avi等進行邏輯數(shù)據(jù)塊的劃分,對于劃分后的數(shù)據(jù)塊,將對每個數(shù)據(jù)塊進行標識,根據(jù)實際 需要使每個數(shù)據(jù)塊附加包含一些必要的標識信息,如序號身份識別號ID、邏輯順序號 Sep磁、隱私關鍵標識mg、、加密標識等。
[0021] 按照上述分塊方式。設醫(yī)療大數(shù)據(jù)