一種使用代理云進(jìn)行數(shù)據(jù)拷貝留痕的方法
【專利摘要】本發(fā)明公開了一種使用代理云進(jìn)行數(shù)據(jù)拷貝留痕的方法。本發(fā)明在文件上傳時,用戶在本地將待上傳文件分為多個數(shù)據(jù)塊,并將各數(shù)據(jù)塊標(biāo)識發(fā)送給代理云,代理云為各其分配云存儲位置后,用戶端進(jìn)行文件上傳,上傳完畢后將數(shù)據(jù)塊的連接順序通過安全通道發(fā)送給代理云,代理云在本地保存文件上傳日志、包含文件上傳者和數(shù)據(jù)塊連接順序的數(shù)據(jù)元;當(dāng)有拷貝請求時,將所請求文件的數(shù)據(jù)元拷貝到對應(yīng)用戶數(shù)據(jù)區(qū),并在本地保存文件拷貝日志;當(dāng)有文件下載請求時,代理云在其用戶數(shù)據(jù)區(qū)查找到對應(yīng)的數(shù)據(jù)元并發(fā)送給請求端,請求端基于其進(jìn)行下載后將各數(shù)據(jù)塊拼接為完整文件,同時代理云在本地保存文件下載日志。本發(fā)明能實(shí)現(xiàn)拷貝留痕,進(jìn)行大數(shù)據(jù)行為追蹤。
【專利說明】
一種使用代理云進(jìn)行數(shù)據(jù)拷貝留痕的方法
技術(shù)領(lǐng)域
[0001]本發(fā)明屬于移動互聯(lián)網(wǎng)領(lǐng)域,特別涉及一種將數(shù)據(jù)通過代理云進(jìn)行傳輸和拷貝,通過該方法可以實(shí)現(xiàn)拷貝留痕,進(jìn)行大數(shù)據(jù)行為追蹤。
【背景技術(shù)】
[0002]數(shù)據(jù)上傳和下載是信息時代數(shù)據(jù)流通的主要方式,隨著互聯(lián)網(wǎng)的興起,數(shù)據(jù)的急劇增加,云存儲逐漸成為數(shù)據(jù)存儲的主流,人們對于數(shù)據(jù)拷貝的安全性、可靠性以及可擴(kuò)展性等方面提出了越來越高的要求,傳統(tǒng)拷貝技術(shù)的弊端逐漸顯現(xiàn),而新技術(shù)的發(fā)展應(yīng)用總是需要時間的考驗(yàn)。隨著技術(shù)的發(fā)展,出現(xiàn)了各種各樣的拷貝技術(shù)。廣泛使用的阿里云、百度云等云,通過為用戶分配云空間,可以根據(jù)用戶需求進(jìn)行定制,雖然在一定程度上滿足了用戶對于存儲空間和成本的需求,但是其數(shù)據(jù)的安全性和保密性都存在很大的風(fēng)險,一旦數(shù)據(jù)被竊取,很難對數(shù)據(jù)所有者進(jìn)行判斷,只能通過知識產(chǎn)權(quán)局等部門對所有者進(jìn)行判斷,維權(quán)困難。廣為人知的SSH(安全外殼協(xié)議)技術(shù),雖然能實(shí)現(xiàn)數(shù)據(jù)拷貝的便利性,但是沒有將元數(shù)據(jù)同數(shù)據(jù)分離,這樣進(jìn)行的數(shù)據(jù)拷貝速度慢,當(dāng)存在大量數(shù)據(jù)拷貝時候會花費(fèi)大量處理時間。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的發(fā)明目的在于:針對上述存在的問題,提供一種方便安全、簡單快捷的利用代理云實(shí)現(xiàn)拷貝留痕,進(jìn)行大數(shù)據(jù)行為追蹤的方法。
[0004]本發(fā)明的使用代理云進(jìn)行數(shù)據(jù)拷貝留痕的方法,包括下列步驟:
[0005]文件上傳:
[0006]步驟al:代理云收到文件上傳請求時,對文件上傳者進(jìn)行身份認(rèn)證,若通過,則進(jìn)入步驟1-2;否則,拒絕;
[0007]步驟a2:文件上傳者通過本地客戶端將待上傳文件碎片化,得到多個數(shù)據(jù)塊,并將各數(shù)據(jù)塊的分塊標(biāo)識發(fā)送給代理云;
[0008]步驟a3:代理云為每個數(shù)據(jù)塊分配云存儲位置并發(fā)送給文件上傳者;
[0009]步驟a4:文件上傳者基于所接收的云存儲位置對各數(shù)據(jù)塊進(jìn)行上傳,上傳完成后,將各數(shù)據(jù)塊的連接順序通過安全信道傳輸?shù)酱碓疲?br>[0010]步驟a5:代理云在本地為待上傳文件設(shè)置文件日志區(qū),并將上傳日志存入待上傳文件的文件日志區(qū),所述文件上傳日志包括:各數(shù)據(jù)塊的開始上傳時間、上傳結(jié)束時間以及文件上傳者;同時將文件上傳者、數(shù)據(jù)塊的連接順序和云存儲位置記錄到待上傳文件的元數(shù)據(jù)中,所述元數(shù)據(jù)保存在代理云上;
[0011]文件拷貝:
[0012]步驟bl:代理云收到文件拷貝請求時,對拷貝請求者進(jìn)行身份認(rèn)證,若通過,則執(zhí)行步驟b2;否則,拒絕;
[0013]步驟b2:代理云收將請求文件的元數(shù)據(jù)拷貝到拷貝請求者在代理云上的用戶數(shù)據(jù)區(qū),并將文件拷貝日志存入請求文件的文件日志區(qū),所述文件拷貝日志包括:拷貝請求者、請求文件、請求文件的文件上傳者;
[0014]文件下載:
[0015]步驟cl:代理云收到文件下載請求時,對下載請求者進(jìn)行身份認(rèn)證,若通過,則執(zhí)行步驟b2;否則,拒絕;
[0016]步驟c2:代理云在下載請求者的用戶數(shù)據(jù)區(qū)查找請求文件的元數(shù)據(jù),若不存在,則下載失敗;否則將所查找的元數(shù)據(jù)發(fā)送給下載請求者;
[0017]步驟c3:下載請求者通過本地客戶端對所接收的元數(shù)據(jù)進(jìn)行解析,獲取請求文件的各數(shù)據(jù)塊的云存儲位置并下載;同時代理云將問卷下載日志存入請求文件的文件日志區(qū),所述下文件日志區(qū)包括:下載請求者、請求文件、請求文件的文件上傳者、各數(shù)據(jù)塊的開始下載時間和下載結(jié)束時間;
[0018]步驟c4:并基于元數(shù)據(jù)中的數(shù)據(jù)塊的連接順序?qū)ο螺d的數(shù)據(jù)塊進(jìn)行拼接,得到完整的請求文件。
[0019]由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
[0020](I)現(xiàn)有的云存儲技術(shù)雖然有設(shè)備獨(dú)立、成本低、量身定制等優(yōu)點(diǎn),然而,企業(yè)和個人將大量的數(shù)據(jù)轉(zhuǎn)移到云存儲,在很大程度上存在著數(shù)據(jù)丟失、竊取和數(shù)據(jù)版權(quán)等問題;而在本發(fā)明中,在使用代理云進(jìn)行數(shù)據(jù)傳輸、拷貝、以及下載時,數(shù)據(jù)在用戶和云之間傳輸?shù)倪^程中,會在中間的代理云上留下數(shù)據(jù)流動痕跡,從而當(dāng)數(shù)據(jù)被竊取之后可以通過數(shù)據(jù)流動痕跡追蹤到數(shù)據(jù)竊取者,確保數(shù)據(jù)安全不被非法使用。
[0021](2)本發(fā)明在通過代理云進(jìn)行數(shù)據(jù)拷貝留痕技術(shù)中,代理云提供一種取證的角色。當(dāng)出現(xiàn)版權(quán)糾紛時,可以通過數(shù)據(jù)流動痕跡(代理云保存的各文件的日志文件所記錄的相關(guān)信息)追蹤到數(shù)據(jù)的源,判斷出數(shù)據(jù)所有者,從而有效解決數(shù)據(jù)版權(quán)糾紛問題。
[0022](3)本發(fā)明通過代理云進(jìn)行數(shù)據(jù)拷貝留痕,在代理云上留下的大量數(shù)據(jù)流通訪問痕跡,能幫助數(shù)據(jù)管理人員實(shí)現(xiàn)用戶行為跟蹤,從而對這些數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,更好的服務(wù)大眾。
[0023](4)傳統(tǒng)拷貝技術(shù)只能實(shí)現(xiàn)單云拷貝,拷貝的是整個數(shù)據(jù),速度慢;而本發(fā)明通過代理云進(jìn)行拷貝只需要拷貝元數(shù)據(jù),可擴(kuò)展性高,且在進(jìn)行數(shù)據(jù)下載和上傳時通過多個云實(shí)現(xiàn),速度更快。
【附圖說明】
[0024]圖1是本發(fā)明的過程示意圖;
[0025]圖2是文件D的上傳流程圖;
[0026]圖3是用戶拷貝文件D的流程圖;
[0027]圖4是用戶下載文件D的流程圖。
【具體實(shí)施方式】
[0028]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合實(shí)施方式和附圖,對本發(fā)明作進(jìn)一步地詳細(xì)描述。
[0029]參見圖1,云用戶(文件所有者OWNER、對文件進(jìn)行拷貝和下載的使用者USER)通過代理云(AgentCloud)可以實(shí)現(xiàn)文件上傳、下載等,所上傳的文件的各數(shù)據(jù)塊(D1, D2,‘"Dm)分別存儲在 AgentCloud 所分配的不同數(shù)據(jù)云(Cloudi,Cloud2,......,CloudnOlc3AgentCloud
用于處理云用戶的文件上傳請求、文件拷貝請求以及文件下載請求等,為每個上傳文件設(shè)置一個文件日志區(qū),用于保存上傳文件的文件日志(記錄對文件的相關(guān)操作信息:文件上傳日志、文件拷貝日志、文件下載日志等),以及為每個云用戶設(shè)置一個用戶數(shù)據(jù)區(qū),用于記錄云用戶對數(shù)據(jù)的操作信息。
[0030](I )0WNER將文件D上傳到云的過程參見圖2:
[0031]①OWNER通過本地客戶端向AgentCloud發(fā)出上傳文件請求,若OWNER已進(jìn)行用戶登錄,貝IjAgentCloud直接接受上傳文件請求;否則發(fā)起對OWNER的身份認(rèn)證過程(例如通過單點(diǎn)登錄進(jìn)行身份認(rèn)證),若認(rèn)證通過,則接受(執(zhí)行后續(xù)步驟);否則,拒絕上傳請求;
[0032]②OWNER通過本地客戶端將文件D碎片化,將文件D分成多個(D1, D2,......,Dm)數(shù)據(jù)塊,同時將文件分塊信息(文件D的分塊個數(shù)、各數(shù)據(jù)塊標(biāo)識)發(fā)送給AgentCloud ;
[0033]③AgentCloud為文件D的各數(shù)據(jù)塊分配云存儲位置并返回給OWNER所在客戶端;同時AgentCloud在本地為文件D創(chuàng)建一個文件日志區(qū),用于存放文件D的相關(guān)日志,本實(shí)施方式中,AgentCloud在本地創(chuàng)建一個日志文件夾H,用于存放文件D的相關(guān)日志。
[0034]④OWNER通過本地客戶端將數(shù)據(jù)塊D1,D2,......,Dm按照分配的云存儲位置上傳到各個云,上傳成功后,通過安全信道將文件D各數(shù)據(jù)塊的連接順序傳輸?shù)紸gentCloud。
[0035]⑤AgentCloud在日志文件夾H寫入一個文件上傳日志,該文件上傳日志記錄的信息包括:文件D的上傳者OWNER、文件D各數(shù)據(jù)塊的開始上傳時間和上傳結(jié)束時間。同時將文件上傳者、文件標(biāo)識、文件數(shù)據(jù)塊的云存儲位置、各數(shù)據(jù)塊的連接順序等保存到文件D的元數(shù)據(jù)K中,其中元數(shù)據(jù)K保存在AgentCloud本地。
[0036]⑥文件D上傳成功。
[0037](2)其他云用戶USER通過代理云進(jìn)行數(shù)據(jù)拷貝過程,參見圖3:
[0038]①USER通過本地客戶端向AgentCloud發(fā)出拷貝文件D的請求,若當(dāng)前USER已進(jìn)行用戶登錄,則AgentCloud直接接受拷貝文件請求;否則發(fā)起對USER的身份認(rèn)證過程,若認(rèn)證通過,則接受;否則AgentCloud返回拒絕服務(wù)信息給USER,拒絕該用戶對數(shù)據(jù)進(jìn)行拷貝;
[0039]②當(dāng)USER通過身份認(rèn)證之后,AgentCloud會將文件D的元數(shù)據(jù)K拷貝到USER的用戶數(shù)據(jù)區(qū),同時,AgentCloud在日志文件夾H中寫入一個文件拷貝日志,該文件拷貝日志記錄的信息包括:拷貝請求者(USER)、請求文件(D)、文件D的OWNER;
[0040]③文件拷貝完成。
[0041](3)其他云用戶USER通過代理云進(jìn)行數(shù)據(jù)下載的過程,參見圖4:
[0042]①USER通過本地客戶端向AgentCloud發(fā)出請求下載文件D的請求,若當(dāng)前USER已進(jìn)行用戶登錄,則AgentCloud直接接受下載文件請求;否則發(fā)起對USER的身份認(rèn)證過程,若認(rèn)證通過,則接受;否則拒絕;
[0043]②AgentCloud從當(dāng)前USER的用戶數(shù)據(jù)區(qū)查找與文件D對應(yīng)的元數(shù)據(jù)K,如果元數(shù)據(jù)K不存在,則向當(dāng)前USER返回下載失敗;否則,取出元數(shù)據(jù)K并發(fā)送給當(dāng)前USER;
[0044]③USER通過本地客戶端對元數(shù)據(jù)K進(jìn)行解析,獲取各數(shù)據(jù)塊的云存儲位置并各將數(shù)據(jù)塊(D1, D2,......,Dm)從各個云上下載到USER本地。同時AgentCloud在日志文件夾H中寫入一個文件下載日志,該文件下載日志記錄的信息包括:下載人(USER)、下載文件D、文件D的上傳者OWNER、文件D各數(shù)據(jù)塊的開始下載時間和下載結(jié)束時間等;
[0045]④USER的本地客戶端將下載的各數(shù)據(jù)塊基于元數(shù)據(jù)K中的各數(shù)據(jù)塊的連接順序進(jìn)行拼接,得到完整的文件D。
【主權(quán)項(xiàng)】
1.一種使用代理云進(jìn)行數(shù)據(jù)拷貝留痕的方法,其特征在于,包括下列步驟: 文件上傳: 步驟al:代理云收到文件上傳請求時,對文件上傳者進(jìn)行身份認(rèn)證,若通過,則進(jìn)入步驟1-2;否則,拒絕; 步驟a2:文件上傳者通過本地客戶端將待上傳文件碎片化,得到多個數(shù)據(jù)塊,并將各數(shù)據(jù)塊的分塊標(biāo)識發(fā)送給代理云; 步驟a3:代理云為每個數(shù)據(jù)塊分配云存儲位置并發(fā)送給文件上傳者; 步驟a4:文件上傳者基于所接收的云存儲位置對各數(shù)據(jù)塊進(jìn)行上傳,上傳完成后,將各數(shù)據(jù)塊的連接順序通過安全信道傳輸?shù)酱碓疲?步驟a5:代理云在本地為待上傳文件設(shè)置文件日志區(qū),并將上傳日志存入待上傳文件的文件日志區(qū),所述文件上傳日志包括:各數(shù)據(jù)塊的開始上傳時間、上傳結(jié)束時間以及文件上傳者;同時將文件上傳者、數(shù)據(jù)塊的連接順序和云存儲位置記錄到待上傳文件的元數(shù)據(jù)中,所述元數(shù)據(jù)保存在代理云上; 文件拷貝: 步驟bl:代理云收到文件拷貝請求時,對拷貝請求者進(jìn)行身份認(rèn)證,若通過,則執(zhí)行步驟b2;否則,拒絕; 步驟b2:代理云收將請求文件的元數(shù)據(jù)拷貝到拷貝請求者在代理云上的用戶數(shù)據(jù)區(qū),并將文件拷貝日志存入請求文件的文件日志區(qū),所述文件拷貝日志包括:拷貝請求者、請求文件、請求文件的文件上傳者; 文件下載: 步驟cI:代理云收到文件下載請求時,對下載請求者進(jìn)行身份認(rèn)證,若通過,則執(zhí)行步驟b2;否則,拒絕; 步驟c2:代理云在下載請求者的用戶數(shù)據(jù)區(qū)查找請求文件的元數(shù)據(jù),若不存在,則下載失敗;否則將所查找的元數(shù)據(jù)發(fā)送給下載請求者; 步驟c3:下載請求者通過本地客戶端對所接收的元數(shù)據(jù)進(jìn)行解析,獲取請求文件的各數(shù)據(jù)塊的云存儲位置并下載;同時代理云將問卷下載日志存入請求文件的文件日志區(qū),所述下文件日志區(qū)包括:下載請求者、請求文件、請求文件的文件上傳者、各數(shù)據(jù)塊的開始下載時間和下載結(jié)束時間; 步驟c4:并基于元數(shù)據(jù)中的數(shù)據(jù)塊的連接順序?qū)ο螺d的數(shù)據(jù)塊進(jìn)行拼接,得到完整的請求文件。
【文檔編號】G06F17/30GK105893511SQ201610192868
【公開日】2016年8月24日
【申請日】2016年3月30日
【發(fā)明人】佘堃, 呂赫, 楊瑞瑞, 馬曉菲, 唐前昭, 王偉東
【申請人】電子科技大學(xué)