本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)脫敏方法及裝置。
背景技術(shù):
政府、企事業(yè)單位在業(yè)務(wù)生產(chǎn)過程中累計(jì)了大量數(shù)據(jù),但是不同單位、部門之間數(shù)據(jù)是孤立的,不利于數(shù)據(jù)的有效利用。為此,提出了建設(shè)共享開放平臺(tái)的政策,各個(gè)單位、部位將數(shù)據(jù)共享到該共享開放平臺(tái),各單位、部門及社會(huì)公民可以對(duì)該共享開放平臺(tái)上的數(shù)據(jù)進(jìn)行訪問,從而實(shí)現(xiàn)了數(shù)據(jù)的有效利用。
但是,政府、企事業(yè)單元所累積的數(shù)據(jù)中包括大量的敏感數(shù)據(jù),比如政府的數(shù)據(jù)包括身份證、年齡、婚姻等信息,企事業(yè)單位的數(shù)據(jù)包括賬號(hào)、客戶姓名、交易記錄等信息。這些敏感數(shù)據(jù)一旦發(fā)生泄漏,將會(huì)給政府、企事業(yè)單元及廣大群眾帶來(lái)巨大的損失。因此,在對(duì)數(shù)據(jù)進(jìn)行共享之前,必須對(duì)數(shù)據(jù)中包括的敏感數(shù)據(jù)進(jìn)行脫敏處理,即對(duì)敏感數(shù)據(jù)進(jìn)行變形,實(shí)現(xiàn)敏感數(shù)據(jù)的可靠保護(hù)。
目前,在對(duì)數(shù)據(jù)進(jìn)行脫敏處理時(shí),通過固定的脫敏規(guī)則對(duì)待脫敏數(shù)據(jù)進(jìn)行脫敏處理。
針對(duì)目前對(duì)數(shù)據(jù)進(jìn)行脫敏處理的方法,對(duì)各種待脫敏數(shù)據(jù)均通過固定的脫敏規(guī)則進(jìn)行脫敏處理,當(dāng)該固定的脫敏規(guī)則被破解后,不法人員會(huì)將脫敏數(shù)據(jù)還原為待脫敏數(shù)據(jù),造成大量的敏感數(shù)據(jù)泄露,因此通過現(xiàn)有數(shù)據(jù)脫敏方法所形成的脫敏數(shù)據(jù)的安全性較低。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供了一種數(shù)據(jù)脫敏方法及裝置,能夠提高脫敏數(shù)據(jù)的安全性。
第一方面,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)脫敏方法,包括:
獲取待脫敏數(shù)據(jù);
從所述待脫敏數(shù)據(jù)中識(shí)別待脫敏的至少一個(gè)脫敏字段;
針對(duì)每一個(gè)所述脫敏字段,根據(jù)所述待脫敏數(shù)據(jù)的種類及所述脫敏字段,確定相對(duì)應(yīng)的脫敏規(guī)則;
根據(jù)每一個(gè)所述脫敏規(guī)則,分別對(duì)所述待脫敏數(shù)據(jù)中相對(duì)應(yīng)的所述脫敏字段進(jìn)行脫敏處理,以將所述待脫敏數(shù)據(jù)轉(zhuǎn)換為脫敏數(shù)據(jù)。
優(yōu)選地,
所述獲取待脫敏數(shù)據(jù),包括:實(shí)時(shí)從外部的數(shù)據(jù)源獲取所述待脫敏數(shù)據(jù)。
優(yōu)選地,
所述獲取待脫敏數(shù)據(jù),包括:根據(jù)外部的觸發(fā),從所述數(shù)據(jù)源獲取所述待脫敏數(shù)據(jù)。
優(yōu)選地,
所述根據(jù)所述待脫敏數(shù)據(jù)的種類及所述脫敏字段,確定相對(duì)應(yīng)的脫敏規(guī)則,包括:
根據(jù)預(yù)先創(chuàng)建的脫敏規(guī)則與數(shù)據(jù)種類和字段之間的映射關(guān)系,確定與所述待脫敏數(shù)據(jù)的種類及所述脫敏字段相對(duì)應(yīng)的脫敏規(guī)則;
其中,所述待脫敏數(shù)據(jù)的種類通過數(shù)據(jù)安全級(jí)別、數(shù)據(jù)來(lái)源、數(shù)據(jù)類型中的任意一個(gè)或多個(gè)參數(shù)進(jìn)行劃分;所述安全級(jí)別包括絕密、高保密、保密和可公開中的至少兩個(gè);所述數(shù)據(jù)類型包括數(shù)字型數(shù)據(jù)、字母型數(shù)據(jù)、文字型數(shù)據(jù)和混合型數(shù)據(jù)。
優(yōu)選地,該方法進(jìn)一步包括:
根據(jù)外部輸入的更新指令,對(duì)所述脫敏規(guī)則與數(shù)據(jù)種類和字段之間的映射關(guān)系進(jìn)行更新,其中,所述更新包括對(duì)所述映射關(guān)系進(jìn)行增加、修改及刪除中的任意一個(gè)或多個(gè)。
優(yōu)選地,
所述根據(jù)每一個(gè)所述脫敏規(guī)則,分別對(duì)所述待脫敏數(shù)據(jù)中相對(duì)應(yīng)的所述脫敏字段進(jìn)行脫敏處理,包括:
針對(duì)每一個(gè)所述脫敏字段,根據(jù)與該脫敏字段相對(duì)應(yīng)的脫敏規(guī)則,調(diào)用相應(yīng)的脫敏算法對(duì)所述待脫敏數(shù)據(jù)中該脫敏字段下的數(shù)據(jù)進(jìn)行運(yùn)算,獲得脫敏字段數(shù)據(jù),并通過所述脫敏字段數(shù)據(jù)對(duì)所述待脫敏數(shù)據(jù)中該脫敏字段下的數(shù)據(jù)進(jìn)行替換。
優(yōu)選地,
所述脫敏規(guī)則包括:數(shù)據(jù)替換、數(shù)據(jù)無(wú)效化、數(shù)據(jù)隨機(jī)化及數(shù)據(jù)重排中的任意一個(gè)或多個(gè);
其中,所述數(shù)據(jù)替換為通過虛構(gòu)數(shù)據(jù)對(duì)原數(shù)據(jù)進(jìn)行替換,所述數(shù)據(jù)無(wú)效化為通過截?cái)?、加密、隱藏、模糊中的至少一個(gè)對(duì)原數(shù)據(jù)進(jìn)行脫敏,所述數(shù)據(jù)隨機(jī)化為通過隨機(jī)數(shù)據(jù)對(duì)原數(shù)據(jù)進(jìn)行替換,所述數(shù)據(jù)重排為對(duì)原數(shù)據(jù)中至少兩個(gè)字符的順序進(jìn)行重新排列。
優(yōu)選地,
所述脫敏算法包括:可逆脫敏算法和不可逆脫敏算法;
其中,經(jīng)所述可逆脫敏算法運(yùn)算獲得的脫敏字段數(shù)據(jù)可以還原為運(yùn)算之前的數(shù)據(jù),經(jīng)所述不可逆脫敏算法運(yùn)算獲得的脫敏字段數(shù)據(jù)無(wú)法還原為運(yùn)算之間的數(shù)據(jù)。
優(yōu)選地,
所述脫敏算法包括:散列算法hashing、偏移算法shift、替換算法hiding、列舉算法enumeration、截?cái)嗨惴╰runcation及掩碼算法mask中的任意一個(gè)或多個(gè)。
第二方面,本發(fā)明實(shí)施例還提供了一種數(shù)據(jù)脫敏裝置,包括:獲取單元、識(shí)別單元、映射單元及處理單元;
所述獲取單元,用于獲取待脫敏數(shù)據(jù);
所述識(shí)別單元,用于從所述獲取單元獲取到的所述待脫敏數(shù)據(jù)中識(shí)別待脫敏的至少一個(gè)脫敏字段;
所述映射單元,用于針對(duì)所述識(shí)別單元識(shí)別出的每一個(gè)所述脫敏字段,根據(jù)所述待脫敏數(shù)據(jù)的種類及所述脫敏字段,確定相對(duì)應(yīng)的脫敏規(guī)則;
所述處理單元,用于根據(jù)所述映射單元確定出的每一個(gè)所述脫敏規(guī)則,分別對(duì)所述待脫敏數(shù)據(jù)中相對(duì)應(yīng)的所述脫敏字段進(jìn)行脫敏處理,以將所述待脫敏數(shù)據(jù)轉(zhuǎn)換為脫敏數(shù)據(jù)。
優(yōu)選地,
所述獲取單元,用于實(shí)時(shí)從外部的數(shù)據(jù)源獲取所述待脫敏數(shù)據(jù)。
優(yōu)選地,
所述獲取單元,用于根據(jù)外部的觸發(fā),從所述數(shù)據(jù)源獲取所述待脫敏數(shù)據(jù)。
優(yōu)選地,
所述映射單元,用于根據(jù)預(yù)先創(chuàng)建的脫敏規(guī)則與數(shù)據(jù)種類和字段之間的映射關(guān)系,確定與所述待脫敏數(shù)據(jù)的種類和所述脫敏字段相對(duì)應(yīng)的脫敏規(guī)則;其中,所述待脫敏數(shù)據(jù)的種類通過數(shù)據(jù)安全級(jí)別、數(shù)據(jù)來(lái)源、數(shù)據(jù)類型中的任意一個(gè)或多個(gè)參數(shù)進(jìn)行劃分;所述安全級(jí)別包括絕密、高保密、保密和可公開中的至少兩個(gè);所述數(shù)據(jù)類型包括數(shù)字型數(shù)據(jù)、字母型數(shù)據(jù)、文字型數(shù)據(jù)和混合型數(shù)據(jù)。
優(yōu)選地,
所述處理單元,用于針對(duì)每一個(gè)所述脫敏字段,根據(jù)與該脫敏字段相對(duì)應(yīng)的脫敏規(guī)則,調(diào)用相應(yīng)的脫敏算法對(duì)所述待脫敏數(shù)據(jù)中該脫敏字段下的數(shù)據(jù)進(jìn)行運(yùn)算,獲得脫敏字段數(shù)據(jù),并通過所述脫敏字段數(shù)據(jù)對(duì)所述待脫敏數(shù)據(jù)中該脫敏字段下的數(shù)據(jù)進(jìn)行替換。
本發(fā)明實(shí)施例提供的數(shù)據(jù)脫敏存儲(chǔ)及裝置,在獲取到待脫敏數(shù)據(jù)后,從待脫敏數(shù)據(jù)中識(shí)別待脫敏的至少一個(gè)脫敏字段,根據(jù)待脫敏數(shù)據(jù)的種類和脫敏字段確定對(duì)應(yīng)于每一個(gè)脫敏字段的脫敏規(guī)則,進(jìn)而通過各個(gè)脫敏規(guī)則分別對(duì)相對(duì)應(yīng)的脫敏字段進(jìn)行脫敏處理,對(duì)待脫敏數(shù)據(jù)中各個(gè)脫敏字段進(jìn)行脫敏后獲得脫敏數(shù)據(jù)。由此可見,脫敏規(guī)則根據(jù)待脫敏數(shù)據(jù)的種類和脫敏字段確定,不同種類的待脫敏數(shù)據(jù)和不同的脫敏字段通過不同的脫敏規(guī)則進(jìn)行脫敏處理,當(dāng)一種脫敏規(guī)則被破解后,只會(huì)導(dǎo)致脫敏數(shù)據(jù)中部分字段下的敏感數(shù)據(jù)泄露,不會(huì)使脫敏數(shù)據(jù)中全部的敏感數(shù)據(jù)泄露,因此能夠提高脫敏數(shù)據(jù)的安全性。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明一個(gè)實(shí)施例提供的一種數(shù)據(jù)脫敏方法的流程圖;
圖2是本發(fā)明另一個(gè)實(shí)施例提供的一種數(shù)據(jù)脫敏方法的流程圖;
圖3是本發(fā)明一個(gè)實(shí)施例提供的一種數(shù)據(jù)脫敏裝置所在設(shè)備的示意圖;
圖4是本發(fā)明一個(gè)實(shí)施例提供的一種數(shù)據(jù)脫敏裝置的示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例,基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
如圖1所示,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)脫敏方法,該方法可以包括以下步驟:
步驟101:獲取待脫敏數(shù)據(jù);
步驟102:從所述待脫敏數(shù)據(jù)中識(shí)別待脫敏的至少一個(gè)脫敏字段;
步驟103:針對(duì)每一個(gè)所述脫敏字段,根據(jù)所述待脫敏數(shù)據(jù)的種類及所述脫敏字段,確定相對(duì)應(yīng)的脫敏規(guī)則;
步驟104:根據(jù)每一個(gè)所述脫敏規(guī)則,分別對(duì)所述待脫敏數(shù)據(jù)中相對(duì)應(yīng)的所述脫敏字段進(jìn)行脫敏處理,以將所述待脫敏數(shù)據(jù)轉(zhuǎn)換為脫敏數(shù)據(jù)。
本發(fā)明實(shí)施例提供了一種數(shù)據(jù)脫敏方法,在獲取到待脫敏數(shù)據(jù)后,從待脫敏數(shù)據(jù)中識(shí)別待脫敏的至少一個(gè)脫敏字段,根據(jù)待脫敏數(shù)據(jù)的種類和脫敏字段確定對(duì)應(yīng)于每一個(gè)脫敏字段的脫敏規(guī)則,進(jìn)而通過各個(gè)脫敏規(guī)則分別對(duì)相對(duì)應(yīng)的脫敏字段進(jìn)行脫敏處理,對(duì)待脫敏數(shù)據(jù)中各個(gè)脫敏字段進(jìn)行脫敏后獲得脫敏數(shù)據(jù)。由此可見,脫敏規(guī)則根據(jù)待脫敏數(shù)據(jù)的種類和脫敏字段確定,不同種類的待脫敏數(shù)據(jù)和不同的脫敏字段通過不同的脫敏規(guī)則進(jìn)行脫敏處理,當(dāng)一種脫敏規(guī)則被破解后,只會(huì)導(dǎo)致脫敏數(shù)據(jù)中部分字段下的敏感數(shù)據(jù)泄露,不會(huì)使脫敏數(shù)據(jù)中全部的敏感數(shù)據(jù)泄露,因此能夠提高脫敏數(shù)據(jù)的安全性。
在本發(fā)明一個(gè)實(shí)施例中,步驟101中獲取待脫敏數(shù)據(jù)的過程具有兩種不同的形式,兩種形式分別為:
形式一:實(shí)時(shí)從外部的數(shù)據(jù)源獲取待脫敏數(shù)據(jù);
形式二:根據(jù)外部的觸發(fā),從外部的數(shù)據(jù)源獲取待脫敏數(shù)據(jù)。
上述形式一表述的待脫敏數(shù)據(jù)獲取方法對(duì)應(yīng)動(dòng)態(tài)數(shù)據(jù)脫敏方法,即實(shí)時(shí)從數(shù)據(jù)源獲取待脫敏數(shù)據(jù),對(duì)獲取到的待脫敏數(shù)據(jù)進(jìn)行實(shí)時(shí)脫敏。這樣,當(dāng)數(shù)據(jù)源新增待脫敏數(shù)據(jù)后,新增的待脫敏數(shù)據(jù)被即時(shí)獲取進(jìn)行脫敏處理,提升了數(shù)據(jù)的安全性。
上述形式二表述的待脫敏數(shù)據(jù)獲取方法對(duì)應(yīng)靜態(tài)數(shù)據(jù)脫敏方法,即只有在接收到外部的觸發(fā)后,才從數(shù)據(jù)源獲取待脫敏數(shù)據(jù),并對(duì)獲取到的待脫敏數(shù)據(jù)進(jìn)行脫敏處理。這樣,用戶可以根據(jù)實(shí)際需求發(fā)出觸發(fā)指令,以觸發(fā)從數(shù)據(jù)源獲取待脫敏數(shù)據(jù)進(jìn)行脫敏處理。形式二表述的待脫敏數(shù)據(jù)獲取方法主要應(yīng)用于增加脫敏字段后,通過補(bǔ)充脫敏內(nèi)容來(lái)保證數(shù)據(jù)的安全性。比如,原定義字段1和字段2為脫敏字段,現(xiàn)將字段3也定義脫敏字段,此時(shí)發(fā)出觸發(fā)指令,從數(shù)據(jù)源獲取待脫敏數(shù)據(jù)進(jìn)行重新脫敏處理,脫敏處理后字段1、字段2和字段3的數(shù)據(jù)均被脫敏,相對(duì)于原本只有字段1和字段2的數(shù)據(jù)被脫敏進(jìn)一步提高了脫敏數(shù)據(jù)的安全性。
形式一和形式二提供的兩種待脫敏數(shù)據(jù)獲取方法,應(yīng)用于不同的場(chǎng)景,用戶可以根據(jù)實(shí)際需求選擇任意一種或兩種的結(jié)合進(jìn)行待脫敏數(shù)據(jù)獲取,滿足不同用戶的需求,提高了該數(shù)據(jù)脫敏方法的適用性。
在本發(fā)明一個(gè)實(shí)施例中,步驟103中根據(jù)待脫敏數(shù)據(jù)的種類和脫敏字段確定脫敏規(guī)則時(shí),預(yù)先創(chuàng)建有脫敏規(guī)則與數(shù)據(jù)種類和字段之間的映射關(guān)系,針對(duì)每一個(gè)脫敏字段,根據(jù)待脫敏數(shù)據(jù)的種類以及該脫敏字段從上述映射關(guān)系中確定出相對(duì)應(yīng)的脫敏規(guī)則。
具體地,待脫敏數(shù)據(jù)的種類可以通過數(shù)據(jù)安全級(jí)別、數(shù)據(jù)來(lái)源、數(shù)據(jù)類型中的任意一個(gè)或多個(gè)參數(shù)進(jìn)行劃分,其中,安全級(jí)別包括絕密、高保密、保密和可公開,數(shù)據(jù)類型包括數(shù)字型數(shù)據(jù)、字母型數(shù)據(jù)、文字型數(shù)據(jù)和混合型數(shù)據(jù)。
按照數(shù)據(jù)安全級(jí)別,待脫敏數(shù)據(jù)包括4個(gè)級(jí)別,分別為絕密、高保密、保密和可公開;按照數(shù)據(jù)類型,待脫敏數(shù)據(jù)包括4個(gè)類型,分別為數(shù)字型數(shù)據(jù)、字母型數(shù)據(jù)、文字型數(shù)據(jù)和混合型數(shù)據(jù)。通過安全級(jí)別、數(shù)據(jù)來(lái)源、數(shù)據(jù)類型等多個(gè)維度對(duì)待脫敏數(shù)據(jù)進(jìn)行梳理,將待脫敏數(shù)據(jù)劃分為多個(gè)種類。待脫敏數(shù)據(jù)的種類結(jié)合不同的脫敏字段,會(huì)確定多個(gè)脫敏規(guī)則對(duì)待脫敏數(shù)據(jù)進(jìn)行脫敏處理,增加了脫敏處理的復(fù)雜程度,升高脫敏數(shù)據(jù)被還原的難度,從而進(jìn)一步提高了脫敏數(shù)據(jù)的安全性。
在本發(fā)明一個(gè)實(shí)施例中,在接收到外部輸入的更新指令后,可以對(duì)上述脫敏規(guī)則與數(shù)據(jù)種類和字段之間的映射關(guān)系進(jìn)行更新,對(duì)映射關(guān)系的更新包括增加新的映射關(guān)系、修改原有的映射關(guān)系和刪除原有的映射關(guān)系。
通過發(fā)送更新指令,用戶可以對(duì)原有的脫敏規(guī)則與數(shù)據(jù)種類和字段之間的映射關(guān)系進(jìn)行更新,一方面,用戶可以根據(jù)實(shí)際需求,自定義對(duì)待脫敏數(shù)據(jù)進(jìn)行透明的規(guī)則,提高了該數(shù)據(jù)脫敏方法的適用性;另一方面,用戶可以定期或不定期地對(duì)脫敏規(guī)則與數(shù)據(jù)種類和字段之間的映射關(guān)系進(jìn)行更新,通過更新映射關(guān)系來(lái)改變對(duì)待脫敏數(shù)據(jù)進(jìn)行脫敏處理的規(guī)則,提升脫敏數(shù)據(jù)被還原的難度,進(jìn)一步提高了脫敏數(shù)據(jù)的安全性。
在本發(fā)明一個(gè)實(shí)施例中,步驟104中對(duì)待脫敏數(shù)據(jù)進(jìn)行脫敏處理時(shí),針對(duì)待脫敏數(shù)據(jù)中包括的每一個(gè)脫敏字段,根據(jù)步驟103中確定出的與該脫敏字段相對(duì)應(yīng)的脫敏規(guī)則,調(diào)用相對(duì)應(yīng)的脫敏算法對(duì)待脫敏數(shù)據(jù)中該脫敏字段下的數(shù)據(jù)進(jìn)行運(yùn)算,獲得運(yùn)算結(jié)果脫敏字段數(shù)據(jù),并通過脫敏字段數(shù)據(jù)對(duì)待脫敏數(shù)據(jù)中該脫敏字段下的數(shù)據(jù)進(jìn)行替換。采用上述方法對(duì)待脫敏數(shù)據(jù)中各個(gè)脫敏字段下的數(shù)據(jù)進(jìn)行替換后,完成對(duì)待脫敏數(shù)據(jù)的脫敏處理,將待脫敏數(shù)據(jù)轉(zhuǎn)換為脫敏數(shù)據(jù)。
每一種脫敏規(guī)則均具有相對(duì)應(yīng)的脫敏算法,通過調(diào)用脫敏算法對(duì)相應(yīng)脫敏字段下的數(shù)據(jù)進(jìn)行運(yùn)算,將脫敏字段下的敏感數(shù)據(jù)轉(zhuǎn)換為脫敏的脫敏字段數(shù)據(jù)后,通過轉(zhuǎn)換而成的脫敏字段數(shù)據(jù)脫敏字段下原有的敏感數(shù)據(jù)進(jìn)行替換,實(shí)現(xiàn)對(duì)待脫敏數(shù)據(jù)中的敏感數(shù)據(jù)進(jìn)行脫敏。
在本發(fā)明一個(gè)實(shí)施例中,脫敏規(guī)則包括數(shù)據(jù)替換、數(shù)據(jù)無(wú)效化、數(shù)據(jù)隨機(jī)化和數(shù)據(jù)重排中的任意一個(gè)或多個(gè)。下面對(duì)數(shù)據(jù)替換、數(shù)據(jù)無(wú)效化、數(shù)據(jù)隨機(jī)化和數(shù)據(jù)重排分別進(jìn)行舉例說明:
數(shù)據(jù)替換為通過虛構(gòu)數(shù)據(jù)對(duì)原數(shù)據(jù)進(jìn)行替換。比如,待脫敏數(shù)據(jù)中包括手機(jī)號(hào)碼,通過數(shù)據(jù)替換將待脫敏數(shù)據(jù)中包括的手機(jī)號(hào)碼同一替換為99999999999。
數(shù)據(jù)無(wú)效化為通過截?cái)?、加密、隱藏、模糊等方式對(duì)原數(shù)據(jù)進(jìn)行脫敏,使其不再具有利用價(jià)值。比如,待脫敏數(shù)據(jù)中包括12位的固定電話號(hào)碼,通過數(shù)據(jù)無(wú)效化將待脫敏數(shù)據(jù)中包括的固定電話號(hào)碼截?cái)酁?位;或者,對(duì)固定電話號(hào)碼進(jìn)行加密,使用*******代替原有的12位固定電話號(hào)碼;再或者,對(duì)固定電話號(hào)碼中的部分?jǐn)?shù)字進(jìn)行隱藏,使用“-”對(duì)12位固定電話號(hào)碼中間的8位數(shù)字進(jìn)行代替。
數(shù)據(jù)隨機(jī)化為通過隨機(jī)數(shù)據(jù)對(duì)原數(shù)據(jù)進(jìn)行替換。比如,待脫敏數(shù)據(jù)中包括身份證號(hào)碼,通過數(shù)據(jù)隨機(jī)化后,將待脫敏數(shù)據(jù)中包括的18位身份證號(hào)碼轉(zhuǎn)換為18個(gè)隨機(jī)字符,18個(gè)隨機(jī)字符包括數(shù)字和字母,例如對(duì)身份證號(hào)碼進(jìn)行數(shù)據(jù)隨機(jī)化后形成45242398011ad213da。
數(shù)據(jù)重排為對(duì)元數(shù)據(jù)中至少兩個(gè)字符的順序進(jìn)行重新排列。比如,待脫敏數(shù)據(jù)中包括手機(jī)號(hào)碼12345678901,通過數(shù)據(jù)重排后,將手機(jī)號(hào)碼12345678901轉(zhuǎn)換為75698142301。
脫敏規(guī)則包括數(shù)據(jù)替換、數(shù)據(jù)無(wú)效化、數(shù)據(jù)隨機(jī)化及數(shù)據(jù)重排等中數(shù)據(jù)處理形式,以對(duì)不同種類的待脫敏數(shù)據(jù)和脫敏字段進(jìn)行脫敏處理。一方面,不同的待脫敏數(shù)據(jù)通過不同的脫敏規(guī)則進(jìn)行脫敏,當(dāng)一種脫敏規(guī)則被破解后,只有通過該脫敏規(guī)則進(jìn)行脫敏的敏感數(shù)據(jù)可能會(huì)泄露,通過其他脫敏規(guī)則進(jìn)行脫敏的敏感數(shù)據(jù)不會(huì)發(fā)生泄露,從而提高了脫敏數(shù)據(jù)的安全性。另一方面,提供多種脫敏規(guī)則供用戶進(jìn)行選擇,用戶可以根據(jù)實(shí)際需求選擇合適的脫敏規(guī)則對(duì)待脫敏數(shù)據(jù)進(jìn)行脫敏,滿足了不同用戶的個(gè)性化需求,提高了該數(shù)據(jù)脫敏方法的適用性。
在本發(fā)明一個(gè)實(shí)施例中,在對(duì)待脫敏數(shù)據(jù)進(jìn)行脫敏處理時(shí),根據(jù)脫敏規(guī)則調(diào)用相對(duì)應(yīng)的脫敏算法對(duì)脫敏字段下的數(shù)據(jù)進(jìn)行運(yùn)算,而脫敏算法包括兩種,分別為可逆脫敏算法和不可逆脫敏算法。
經(jīng)可逆脫敏算法運(yùn)算獲得的脫敏字段數(shù)據(jù),能夠通過相對(duì)應(yīng)的算法還原為運(yùn)算之前的數(shù)據(jù)。比如,采用排列組合算法(permutation)將數(shù)據(jù)映射成為相對(duì)應(yīng)的唯一的映射值后,當(dāng)需要恢復(fù)時(shí),可以根據(jù)映射值找回原始數(shù)據(jù)。
經(jīng)不可逆脫敏算法獲得的脫敏字段數(shù)據(jù),無(wú)法還原為運(yùn)算之前的數(shù)據(jù)。比如,采用截?cái)嗨惴?truncation)將數(shù)據(jù)尾部截?cái)嗪?,只保留前半部分,這樣,由于數(shù)據(jù)后半部分已經(jīng)缺失,無(wú)法還原為運(yùn)算之前的數(shù)據(jù)。
脫敏算法包括可逆脫敏算法和不可逆脫敏算法,經(jīng)可逆脫敏算法可以將敏感數(shù)據(jù)轉(zhuǎn)換為可還原的脫敏數(shù)據(jù),在需要時(shí)可還原出原始的敏感數(shù)據(jù),經(jīng)不可逆脫敏算法可以將敏感數(shù)據(jù)轉(zhuǎn)換為不可還原的脫敏數(shù)據(jù),保證了敏感數(shù)據(jù)的安全性。提供兩種形式的脫敏算法,用戶可以根據(jù)待脫敏數(shù)據(jù)的用途、安全級(jí)別選擇相應(yīng)形式的脫敏算法對(duì)待脫敏數(shù)據(jù)進(jìn)行脫敏處理,以滿足不同用戶的需求,進(jìn)一步提高了該數(shù)據(jù)脫敏方法的適用性。
在本發(fā)明一個(gè)實(shí)施例中,脫敏算法包括散列算法(hashing)、偏移算法(shift)、替換算法(hiding)、列舉算法(enumeration)、截?cái)嗨惴?truncation)及掩碼算法(mask)中的任意一個(gè)或多個(gè)。其中,
hashing能夠?qū)⒃瓟?shù)據(jù)映射成為hash值,常用作不定長(zhǎng)數(shù)據(jù)映射為定長(zhǎng)數(shù)據(jù)。例如,將zhangfei轉(zhuǎn)換為4463933453,將guanyu轉(zhuǎn)化為4363833453。
shift能夠?yàn)閿?shù)值數(shù)據(jù)增加偏移量,隱藏原有數(shù)據(jù)特征部分。例如,將898轉(zhuǎn)換為2898,將989轉(zhuǎn)換為2989。
hiding能夠?qū)?shù)據(jù)替換成一個(gè)常量,通常用作將敏感字段無(wú)效化。例如,將手機(jī)號(hào)碼轉(zhuǎn)換0。
enumeration能夠通過計(jì)算將原數(shù)據(jù)轉(zhuǎn)換為新數(shù)據(jù)。例如,將原數(shù)據(jù)100轉(zhuǎn)換為5000,將原數(shù)據(jù)200轉(zhuǎn)換為10000。
truncation能夠?qū)?shù)據(jù)尾部截?cái)啵槐A羟鞍氩糠?。例如,?01-12345轉(zhuǎn)換為010。
mask能夠保證數(shù)據(jù)長(zhǎng)度不變,但只保留部分信息。例如,將123321123轉(zhuǎn)換為123---123,將666777888轉(zhuǎn)換為666---888。
提供多種脫敏算法供用戶進(jìn)行選擇,對(duì)相同或不同的待脫敏數(shù)據(jù)進(jìn)行脫敏處理,增加了對(duì)數(shù)據(jù)進(jìn)行脫敏處理的復(fù)雜性,從而提高了脫敏數(shù)據(jù)被破解的難度,進(jìn)一步提升了脫敏數(shù)據(jù)的安全性。
下面以對(duì)政府業(yè)務(wù)生產(chǎn)過程中產(chǎn)生的數(shù)據(jù)進(jìn)行脫敏處理為例,對(duì)本發(fā)明實(shí)施例提供的數(shù)據(jù)脫敏方法作進(jìn)一步詳細(xì)說明,如圖2所示,該方法可以包括以下步驟:
步驟201:從數(shù)據(jù)源獲取待脫敏數(shù)據(jù)。
在本發(fā)明一個(gè)實(shí)施例中,在對(duì)數(shù)據(jù)進(jìn)行脫敏處理之前,首先要從數(shù)據(jù)源獲取待脫敏數(shù)據(jù)。在獲取待脫敏數(shù)據(jù)時(shí),可以通過實(shí)時(shí)獲取的方式從數(shù)據(jù)源獲取待脫敏數(shù)據(jù),也可以在接收到觸發(fā)指令后從數(shù)據(jù)源獲取待脫敏數(shù)據(jù)。
例如,以實(shí)時(shí)獲取的方式,從政府的服務(wù)器上獲取待脫敏數(shù)據(jù)a。
步驟202:從待脫敏數(shù)據(jù)中識(shí)別待脫敏的脫敏字段。
在本發(fā)明一個(gè)實(shí)施例中,獲取到待脫敏數(shù)據(jù)后,根據(jù)預(yù)先定義的需要進(jìn)行脫敏的字段名,對(duì)待脫敏數(shù)據(jù)進(jìn)行語(yǔ)義化分析,從中識(shí)別出需要進(jìn)行脫敏處理的至少一個(gè)脫敏字段。
例如,預(yù)先定義身份證號(hào)碼、姓名、年齡、手機(jī)號(hào)碼為需要進(jìn)行脫敏的字段,從政府服務(wù)器獲取到待脫敏數(shù)據(jù)a后,識(shí)別出待脫敏數(shù)據(jù)a中包括字段身份證號(hào)碼和手機(jī)號(hào)碼,將身份證號(hào)碼和手機(jī)號(hào)碼對(duì)應(yīng)的字段確定為脫敏字段。
步驟203:確定待脫敏數(shù)據(jù)的種類。
在本發(fā)明一個(gè)實(shí)施例中,在從待脫敏數(shù)據(jù)中識(shí)別出脫敏字段后,根據(jù)數(shù)據(jù)安全級(jí)別、數(shù)據(jù)來(lái)源、數(shù)據(jù)類型等參數(shù)來(lái)確定待脫敏數(shù)據(jù)的種類。
例如,確定待脫敏數(shù)據(jù)a的數(shù)據(jù)安全級(jí)別為保密,數(shù)據(jù)來(lái)源為政府,數(shù)據(jù)類型為數(shù)字型數(shù)據(jù)。
步驟204:根據(jù)待脫敏數(shù)據(jù)的種類和脫敏字段,確定每一個(gè)脫敏字段對(duì)應(yīng)的脫敏規(guī)則。
在本發(fā)明一個(gè)實(shí)施例中,在確定待脫敏數(shù)據(jù)的種類,并從待脫敏數(shù)據(jù)中識(shí)別出需要進(jìn)行脫敏的脫敏字段后,根據(jù)預(yù)先定義的脫敏規(guī)則與數(shù)據(jù)種類和字段的映射關(guān)系,分別確定出每一個(gè)脫敏字段對(duì)應(yīng)的脫敏規(guī)則。
例如,根據(jù)預(yù)先定義的脫敏規(guī)則與數(shù)據(jù)種類和字段的映射關(guān)系,確定數(shù)據(jù)安全級(jí)別為保密、數(shù)據(jù)來(lái)源為政府、數(shù)據(jù)類型為數(shù)字型數(shù)據(jù)的待脫敏數(shù)據(jù)a中,身份證號(hào)碼所在的脫敏字段對(duì)應(yīng)的脫敏規(guī)則為脫敏規(guī)則1,手機(jī)號(hào)碼所在的脫敏字段對(duì)應(yīng)的脫敏規(guī)則為脫敏規(guī)則2。
步驟205:根據(jù)脫敏規(guī)則分別對(duì)各個(gè)脫敏字段進(jìn)行脫敏處理,獲得脫敏數(shù)據(jù)。
在本發(fā)明一個(gè)實(shí)施例中,在確定出每一個(gè)脫敏字段對(duì)應(yīng)的脫敏規(guī)則后,針對(duì)于待脫敏數(shù)據(jù)中的每一個(gè)脫敏字段,根據(jù)相對(duì)應(yīng)的脫敏規(guī)則,調(diào)用相對(duì)應(yīng)的脫敏算法對(duì)該脫敏字段下的數(shù)據(jù)進(jìn)行運(yùn)算,獲得相應(yīng)的脫敏字段數(shù)據(jù),通過獲得的脫敏字段數(shù)據(jù)對(duì)待脫敏數(shù)據(jù)中該脫敏字段下原有數(shù)據(jù)進(jìn)行替換。對(duì)待脫敏數(shù)據(jù)中各個(gè)脫敏字段下的數(shù)據(jù)進(jìn)行替換后,完成對(duì)待脫敏數(shù)據(jù)的脫敏處理,形成脫敏數(shù)據(jù)。
例如,根據(jù)脫敏規(guī)則1,替換算法(hiding),將身份證號(hào)碼字段下所有身份證號(hào)碼均轉(zhuǎn)換為0。根據(jù)脫敏規(guī)則2,調(diào)用掩碼算法(mask),將手機(jī)號(hào)碼字段下每一個(gè)手機(jī)號(hào)碼第4位至第7位進(jìn)行隱藏。
步驟206:將形成的脫敏數(shù)據(jù)輸出。
在本發(fā)明一個(gè)實(shí)施例中,在將待脫敏數(shù)據(jù)轉(zhuǎn)換為脫敏數(shù)據(jù)后,將脫敏數(shù)據(jù)輸出。
例如,對(duì)待脫敏數(shù)據(jù)a進(jìn)行脫敏處理形成脫敏數(shù)據(jù)后,將所形成的脫敏數(shù)據(jù)傳輸?shù)秸蚕黹_放平臺(tái)上進(jìn)行共享。
如圖3、圖4所示,本發(fā)明實(shí)施例提供了一種數(shù)據(jù)脫敏裝置。裝置實(shí)施例可以通過軟件實(shí)現(xiàn),也可以通過硬件或者軟硬件結(jié)合的方式實(shí)現(xiàn)。從硬件層面而言,如圖3所示,為本發(fā)明實(shí)施例提供的數(shù)據(jù)脫敏裝置所在設(shè)備的一種硬件結(jié)構(gòu)圖,除了圖3所示的處理器、內(nèi)存、網(wǎng)絡(luò)接口、以及非易失性存儲(chǔ)器之外,實(shí)施例中裝置所在的設(shè)備通常還可以包括其他硬件,如負(fù)責(zé)處理報(bào)文的轉(zhuǎn)發(fā)芯片等等。以軟件實(shí)現(xiàn)為例,如圖4所示,作為一個(gè)邏輯意義上的裝置,是通過其所在設(shè)備的cpu將非易失性存儲(chǔ)器中對(duì)應(yīng)的計(jì)算機(jī)程序指令讀取到內(nèi)存中運(yùn)行形成的。本實(shí)施例提供的數(shù)據(jù)脫敏裝置,包括:獲取單元401、識(shí)別單元402、映射單元403及處理單元404;
所述獲取單元401,用于獲取待脫敏數(shù)據(jù);
所述識(shí)別單元402,用于從所述獲取單元401獲取到的所述待脫敏數(shù)據(jù)中識(shí)別待脫敏的至少一個(gè)脫敏字段;
所述映射單元403,用于針對(duì)所述識(shí)別單元402識(shí)別出的每一個(gè)所述脫敏字段,根據(jù)所述待脫敏數(shù)據(jù)的種類及所述脫敏字段,確定相對(duì)應(yīng)的脫敏規(guī)則;
所述處理單元404,用于根據(jù)所述映射單元403確定出的每一個(gè)所述脫敏規(guī)則,分別對(duì)所述待脫敏數(shù)據(jù)中相對(duì)應(yīng)的所述脫敏字段進(jìn)行脫敏處理,以將所述待脫敏數(shù)據(jù)轉(zhuǎn)換為脫敏數(shù)據(jù)。
在本發(fā)明一個(gè)實(shí)施例中,所述獲取單元401用于實(shí)時(shí)從外部的數(shù)據(jù)源獲取所述待脫敏數(shù)據(jù)。
在本發(fā)明一個(gè)實(shí)施例中,所述獲取單元401用于根據(jù)外部的觸發(fā),從所述數(shù)據(jù)源獲取所述待脫敏數(shù)據(jù)。
在本發(fā)明一個(gè)實(shí)施例中,所述映射單元403用于根據(jù)預(yù)先創(chuàng)建的脫敏規(guī)則與數(shù)據(jù)種類和字段之間的映射關(guān)系,確定與所述待脫敏數(shù)據(jù)的種類和所述脫敏字段相對(duì)應(yīng)的脫敏規(guī)則;其中,所述待脫敏數(shù)據(jù)的種類通過數(shù)據(jù)安全級(jí)別、數(shù)據(jù)來(lái)源、數(shù)據(jù)類型中的任意一個(gè)或多個(gè)參數(shù)進(jìn)行劃分;所述安全級(jí)別包括絕密、高保密、保密和可公開中的至少兩個(gè);所述數(shù)據(jù)類型包括數(shù)字型數(shù)據(jù)、字母型數(shù)據(jù)、文字型數(shù)據(jù)和混合型數(shù)據(jù)。
在本發(fā)明一個(gè)實(shí)施例中,所述處理單元404用于針對(duì)每一個(gè)所述脫敏字段,根據(jù)與該脫敏字段相對(duì)應(yīng)的脫敏規(guī)則,調(diào)用相應(yīng)的脫敏算法對(duì)所述待脫敏數(shù)據(jù)中該脫敏字段下的數(shù)據(jù)進(jìn)行運(yùn)算,獲得脫敏字段數(shù)據(jù),并通過所述脫敏字段數(shù)據(jù)對(duì)所述待脫敏數(shù)據(jù)中該脫敏字段下的數(shù)據(jù)進(jìn)行替換。
需要說明的是,上述裝置內(nèi)的各單元之間的信息交互、執(zhí)行過程等內(nèi)容,由于與本發(fā)明方法實(shí)施例基于同一構(gòu)思,具體內(nèi)容可參見本發(fā)明方法實(shí)施例中的敘述,此處不再贅述。
本發(fā)明實(shí)施例還提供了一種一種可讀介質(zhì),包括執(zhí)行指令,當(dāng)存儲(chǔ)控制器的處理器執(zhí)行所述執(zhí)行指令時(shí),所述存儲(chǔ)控制器執(zhí)行上述各個(gè)實(shí)施例提供的數(shù)據(jù)脫敏方法。
本發(fā)明實(shí)施例還提供了一種存儲(chǔ)控制器,包括:處理器、存儲(chǔ)器和總線;
所述存儲(chǔ)器用于存儲(chǔ)執(zhí)行指令,所述處理器與所述存儲(chǔ)器通過所述總線連接,當(dāng)所述存儲(chǔ)控制器運(yùn)行時(shí),所述處理器執(zhí)行所述存儲(chǔ)器存儲(chǔ)的所述執(zhí)行指令,以使所述存儲(chǔ)控制器執(zhí)行上述各個(gè)實(shí)施例提供的數(shù)據(jù)脫敏方法。
本發(fā)明各個(gè)實(shí)施例提供的數(shù)據(jù)脫敏方法及裝置,至少具有如下有益效果:
1、在本發(fā)明實(shí)施例提供的數(shù)據(jù)脫敏方法及裝置中,在獲取到待脫敏數(shù)據(jù)后,從待脫敏數(shù)據(jù)中識(shí)別待脫敏的至少一個(gè)脫敏字段,根據(jù)待脫敏數(shù)據(jù)的種類和脫敏字段確定對(duì)應(yīng)于每一個(gè)脫敏字段的脫敏規(guī)則,進(jìn)而通過各個(gè)脫敏規(guī)則分別對(duì)相對(duì)應(yīng)的脫敏字段進(jìn)行脫敏處理,對(duì)待脫敏數(shù)據(jù)中各個(gè)脫敏字段進(jìn)行脫敏后獲得脫敏數(shù)據(jù)。由此可見,脫敏規(guī)則根據(jù)待脫敏數(shù)據(jù)的種類和脫敏字段確定,不同種類的待脫敏數(shù)據(jù)和不同的脫敏字段通過不同的脫敏規(guī)則進(jìn)行脫敏處理,當(dāng)一種脫敏規(guī)則被破解后,只會(huì)導(dǎo)致脫敏數(shù)據(jù)中部分字段下的敏感數(shù)據(jù)泄露,不會(huì)使脫敏數(shù)據(jù)中全部的敏感數(shù)據(jù)泄露,因此能夠提高脫敏數(shù)據(jù)的安全性。
2、在本發(fā)明實(shí)施例提供的數(shù)據(jù)脫敏方法及裝置中,在獲取待脫敏數(shù)據(jù)時(shí),可以通過實(shí)時(shí)獲取的方式從數(shù)據(jù)源獲取待脫敏數(shù)據(jù),也可以在接收到觸發(fā)指令后從數(shù)據(jù)源獲取待脫敏數(shù)據(jù)。兩種待脫敏數(shù)據(jù)獲取的方式應(yīng)用于不同的場(chǎng)景,用戶可以根據(jù)實(shí)際需求選擇任意一種或兩種的結(jié)合進(jìn)行待脫敏數(shù)據(jù)獲取,滿足不同用戶的需求,提高了該數(shù)據(jù)脫敏方法及裝置的適用性。
3、在本發(fā)明實(shí)施例提供的數(shù)據(jù)脫敏方法及裝置中,將待脫敏數(shù)據(jù)劃分為4個(gè)不同的安全級(jí)別,根據(jù)安全級(jí)別不同對(duì)待脫敏數(shù)據(jù)采用不同的脫敏規(guī)則進(jìn)行脫敏處理,在保證脫敏數(shù)據(jù)安全性的前提下,實(shí)現(xiàn)了數(shù)據(jù)的有效利用。
4、在本發(fā)明實(shí)施例提供的數(shù)據(jù)脫敏方法及裝置中,根據(jù)脫敏規(guī)則調(diào)用相應(yīng)的脫敏算法對(duì)敏感數(shù)據(jù)進(jìn)行運(yùn)算,以達(dá)到對(duì)敏感數(shù)據(jù)進(jìn)行脫敏的目的。所提供的脫敏算法包括可逆脫敏算法和不可逆脫敏算法,經(jīng)可逆脫敏算法可以將敏感數(shù)據(jù)轉(zhuǎn)換為可還原的脫敏數(shù)據(jù),經(jīng)不可逆脫敏算法可以將敏感數(shù)據(jù)轉(zhuǎn)換為不可還原的脫敏數(shù)據(jù),兩種脫敏算法具有各自的應(yīng)用場(chǎng)景和特性,用戶可以根據(jù)待脫敏數(shù)據(jù)的用途、安全級(jí)別選擇相應(yīng)形式的脫敏算法對(duì)待脫敏數(shù)據(jù)進(jìn)行脫敏處理,以滿足不同用戶的需求,提高了該數(shù)據(jù)脫敏方法及裝置的適用性。
5、在本發(fā)明實(shí)施例提供的數(shù)據(jù)脫敏方法及裝置中,提供了多種脫敏規(guī)則和脫敏算法供用戶使用,用戶可以根據(jù)實(shí)際需求選擇合適的脫敏規(guī)則和脫敏算法對(duì)待脫敏數(shù)據(jù)進(jìn)行脫敏處理,增加了對(duì)數(shù)據(jù)進(jìn)行脫敏處理的復(fù)雜性,從而提高了脫敏數(shù)據(jù)被破解的難度,進(jìn)一步提升了脫敏數(shù)據(jù)的安全性。
需要說明的是,在本文中,諸如第一和第二之類的關(guān)系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同因素。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)在計(jì)算機(jī)可讀取的存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)中。
最后需要說明的是:以上所述僅為本發(fā)明的較佳實(shí)施例,僅用于說明本發(fā)明的技術(shù)方案,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所做的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。