一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法

文檔序號：9327243閱讀：348來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及差分隱私發(fā)布技術(shù)領(lǐng)域，特別是涉及一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法。
【背景技術(shù)】
[0002] 由于信息化技術(shù)的快速發(fā)展，用戶的隱私信息泄露的問題逐漸凸顯，隱私保護技術(shù)也引起人們的關(guān)注。差分隱私是一種強隱私保護模型，該模型假定攻擊者具有除某一條記錄以外的其他所有記錄信息，即使在這一最大化背景知識下，差分隱私仍然能保證這條記錄的隱私信息不被泄露。
[0003] 目前關(guān)于數(shù)據(jù)流的差分隱私發(fā)布技術(shù)主要針對的是{〇, 1}所組成的二進制流，這些方法不足以應(yīng)用于真實的應(yīng)用程序中，真實的應(yīng)用程序是基于窗口的，并且數(shù)據(jù)流也不會僅僅局限于二進制流，而應(yīng)是任意數(shù)值型數(shù)據(jù)流。由于每個窗口中的隱私預(yù)算是固定的，若考慮給每個子窗口分配相同的隱私預(yù)算，當(dāng)窗口的大小增大時，每個子窗口分配的隱私預(yù)算會減小，使得添加的噪聲增大，導(dǎo)致數(shù)據(jù)的可用性降低。面向更一般的數(shù)據(jù)流，如何在保證每個窗口中的隱私總預(yù)算不超過ε時，合理的分配隱私預(yù)算，并且能有效的快速發(fā)布直方圖統(tǒng)計信息，同時保證數(shù)據(jù)具有一定的可用性，成為一項急需解決的任務(wù)。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明所要解決的技術(shù)問題是提供一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法，以達(dá)到每個窗口中隱私總預(yù)算不超過ε時，發(fā)布數(shù)據(jù)的可用性較好。
[0005] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是：提供一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法，包括以下步驟：
[0006] (1)對于每一個時刻i，數(shù)據(jù)流接收的數(shù)據(jù)集為D1，對數(shù)據(jù)集D1中屬性A出現(xiàn)的不同元素值進行統(tǒng)計，并按照元素值的大小升序排列，對頻數(shù)進行歸一化處理為P ;
[0007] (2)記最后一次發(fā)布的含噪局部最優(yōu)直方圖所對應(yīng)的真實數(shù)據(jù)的分布?xì)w一化后為 Q，計算 P 與 Q 的 EMD (Earth Mover' s Distance)相似度 τ ;
[0008] (3)若τ > σ，則給數(shù)據(jù)集D1分配隱私預(yù)算
給數(shù)據(jù)集〇1添加相應(yīng)的拉普拉斯噪聲得到數(shù)據(jù)集O1，其中，σ為設(shè)定的閾值，ε為隱私總預(yù)算，w為滑動窗口大小，ε ]為第j個子窗口已分配的預(yù)算大小；
[0009] (4)對數(shù)據(jù)集O1利用分組與合并策略，進行局部最優(yōu)直方圖發(fā)布。
[0010] 所述步驟⑶中若τ彡〇時，則不發(fā)布數(shù)據(jù)集D1，即數(shù)據(jù)集O 1= null。
[0011] 所述步驟⑶中數(shù)據(jù)集O1= Djs Lap(Ai) >m，其中，
普拉斯噪聲、m的大小為數(shù)據(jù)集D1中屬性A出現(xiàn)的不同元素值的個數(shù)。
[0012] 所述步驟⑶中若在一個窗口內(nèi)，數(shù)據(jù)集連續(xù)突變，為了減緩入馮增速度，需減緩ε i的分配，則給數(shù)據(jù)集D i分配隱私預(yù)算
[0013] 所述步驟（4)中局部最優(yōu)直方圖發(fā)布包括以下子步驟：
[0014] (41)假設(shè)每個分組為包含固定長度L個不同的含噪統(tǒng)計結(jié)果值，則將數(shù)據(jù)集仏分成[m/L]個不相交的組；
[0015] (42)對每個分組進行最優(yōu)直方圖算法，計算出每個分組所對應(yīng)的最優(yōu)直方圖劃分結(jié)果；
[0016] (43)對所有分組的最優(yōu)直方圖結(jié)果進行合并，得到局部最優(yōu)直方圖發(fā)布。
[0017] 有益效果
[0018] 由于采用了上述的技術(shù)方案，本發(fā)明與現(xiàn)有技術(shù)相比，具有以下的優(yōu)點和積極效果：本發(fā)明基于滑動窗口模型下，利用相鄰兩個時間戳的數(shù)據(jù)集分布的相似性，來動態(tài)合理分配隱私預(yù)算，使得每一個窗口的總預(yù)算不超過ε，并利用分組與合并策略，快速計算出局部最優(yōu)直方圖，從而達(dá)到高效的動態(tài)流式差分隱私發(fā)布策略。
【具體實施方式】
[0019] 下面結(jié)合具體實施例，進一步闡述本發(fā)明。應(yīng)理解，這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。此外應(yīng)理解，在閱讀了本發(fā)明講授的內(nèi)容之后，本領(lǐng)域技術(shù)人員可以對本發(fā)明作各種改動或修改，這些等價形式同樣落于本申請所附權(quán)利要求書所限定的范圍。
[0020] 本發(fā)明的實施方式涉及一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法，包括以下步驟：
[0021] 步驟1、對于每一個時刻i，數(shù)據(jù)流接收的數(shù)據(jù)集為D1，對數(shù)據(jù)集D1中屬性A出現(xiàn) 的不同元素值進行統(tǒng)計，并按照元素值的大小升序排列，SDi= {{x pl, fpl}，{xp2, fp2}，. . . {xpm ，ffj}，其中1"為元素值的大小，且x Pi< x p2< x P；5< . . < x Pm，為數(shù)據(jù)集D i中出現(xiàn)x w 的頻數(shù)。對fw進行歸一化處理，即4
(1彡j彡m)，則P = {{xpl, wpl}，{xp2, w p2^，· · · (Xpm，Wpinl } ο
[0022] 步驟2、記最后一次發(fā)布的含噪局部最優(yōu)直方圖所對應(yīng)的真實數(shù)據(jù)的分布?xì)w一化后為Q，計算P與Q的EMD相似度。P、Q間EMD相似度的計算公式為：
(1彡i彡m，1彡j彡η)，&為Q中的元素值的大小，由于P、Q均為歸一化后的數(shù)據(jù)集，故可以采用最鄰近距離填補法來計算P、Q間EMD相似度τ。
[0023] 步驟3、令閾值為σ ;若τ > 〇，則給D1分配隱私預(yù)算
，并給數(shù)據(jù)集D1 添加相應(yīng)的拉普拉斯噪聲得到數(shù)據(jù)集O1，其中·
SLap(Ai) >'其中，ε為隱私總預(yù)算，w為滑動窗口大小，ε ,為第j個子窗口已分配的預(yù)算大小，< LapO >為拉普拉斯噪聲，m的大小為數(shù)據(jù)集D1中屬性A出現(xiàn)的不同元素值的個數(shù)。若在一個窗口內(nèi)，數(shù)據(jù)集連續(xù)突變，導(dǎo)致A 1W 2的指數(shù)遞增，使得第i時刻添加的噪聲較大。為了減緩11遞增速度，需減緩ε i的分配，故可以采用
時，貝1J不發(fā)布Di,即拉普拉斯噪聲Oi= null。
[0024] 步驟4、對數(shù)據(jù)集O1利用分組與合并策略，進行局部最優(yōu)直方圖發(fā)布。
[0025] 直方圖是一種描述數(shù)據(jù)統(tǒng)計信息的有效方式，主要是將數(shù)據(jù)集劃分成不相交的桶。若數(shù)據(jù)流的數(shù)據(jù)范圍跨度較大，對數(shù)據(jù)集(^直接進行全局最優(yōu)直方圖發(fā)布，算法執(zhí)行效率較低，難以滿足數(shù)據(jù)流的快速響應(yīng)要求。由于數(shù)據(jù)集D 1中數(shù)據(jù)統(tǒng)計是按照key值進行排序的，而桶的合并主要發(fā)生在相鄰的桶間，故可以直接對整個數(shù)據(jù)集O1進行分組。
[0026] 局部最優(yōu)直方圖發(fā)布策略：
[0027] 1)假設(shè)每個分組為包含固定長度L個不同的含噪統(tǒng)計結(jié)果值，則將數(shù)據(jù)集O1分成 m/L個不相交的組。
[0028] 2)對每個分組進行最優(yōu)直方圖算法，計算出每個分組所對應(yīng)的最優(yōu)直方圖劃分結(jié) 果。
[0029] 3)對所有分組的最優(yōu)直方圖結(jié)果進行合并，得到局部最優(yōu)直方圖發(fā)布f= {(I1, Γι，C1)，…，（lk，rk，ck)}，其中(^為0 i中落在（?，）區(qū)間的平均值，其中，1 ,和r ,分別表示每個桶的左右邊界所對應(yīng)的下標(biāo)。
【主權(quán)項】
1. 一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法，其特征在于，包括以下步驟： (1) 對于每一個時刻i，數(shù)據(jù)流接收的數(shù)據(jù)集為D1，對數(shù)據(jù)集D1中屬性A出現(xiàn)的不同元素值進行統(tǒng)計，并按照元素值的大小升序排列，對頻數(shù)進行歸一化處理為P; (2) 記最后一次發(fā)布的含噪局部最優(yōu)直方圖所對應(yīng)的真實數(shù)據(jù)的分布?xì)w一化后為Q，計算P與Q的EMD相似度T;〇1添加相應(yīng)的拉普拉斯噪聲得到數(shù)據(jù)集O1，其中，〇為設(shè)定的閾值，e為隱私總預(yù)算，w為滑動窗口大小，￡為第j個子窗口已分配的預(yù)算大小； (4)對數(shù)據(jù)集O1利用分組與合并策略，進行局部最優(yōu)直方圖發(fā)布。2. 根據(jù)權(quán)利要求1所述的基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法，其特征在于，所述步驟（3)中若T彡。時，則不發(fā)布數(shù)據(jù)集D1，即數(shù)據(jù)集O1=null。3. 根據(jù)權(quán)利要求1所述的基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法，其特征在于，聲、m的大小為數(shù)據(jù)集D1中屬性A出現(xiàn)的不同元素值的個數(shù)。4. 根據(jù)權(quán)利要求1所述的基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法，其特征在于，5. 根據(jù)權(quán)利要求1所述的基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法，其特征在于，所述步驟（4)中局部最優(yōu)直方圖發(fā)布包括以下子步驟： (41) 假設(shè)每個分組為包含固定長度L個不同的含噪統(tǒng)計結(jié)果值，則將數(shù)據(jù)集O1分成「》/￡1個不相交的組； (42) 對每個分組進行最優(yōu)直方圖算法，計算出每個分組所對應(yīng)的最優(yōu)直方圖劃分結(jié) 果； (43) 對所有分組的最優(yōu)直方圖結(jié)果進行合并，得到局部最優(yōu)直方圖發(fā)布。
【專利摘要】本發(fā)明涉及一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法，包括以下步驟：對于每一個時刻i，數(shù)據(jù)流接收的數(shù)據(jù)集為Di，對數(shù)據(jù)集Di中屬性A出現(xiàn)的不同元素值進行統(tǒng)計，并按照元素值的大小升序排列，對頻數(shù)進行歸一化處理為P；記最后一次發(fā)布的含噪局部最優(yōu)直方圖所對應(yīng)的真實數(shù)據(jù)的分布?xì)w一化后為Q，計算P與Q的EMD相似度τ；若τ＞σ，則給數(shù)據(jù)集Di分配隱私預(yù)算，其中，，并給數(shù)據(jù)集Di添加相應(yīng)的拉普拉斯噪聲得到數(shù)據(jù)集Oi；對數(shù)據(jù)集Oi利用分組與合并策略，進行局部最優(yōu)直方圖發(fā)布。本發(fā)明在保證每個窗口中隱私總預(yù)算不超過ε時，發(fā)布數(shù)據(jù)的可用性較好。
【IPC分類】G06F21/60
【公開號】CN105046160
【申請?zhí)枴緾N201510430312
【發(fā)明人】夏小玲, 劉慧藝, 石秀金, 王紹宇, 于守健
【申請人】東華大學(xué)
【公開日】2015年11月11日
【申請日】2015年7月21日

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：夏小玲;劉慧藝;石秀金;王紹宇;于守健;
技術(shù)所有人：東華大學(xué);
我是此專利的發(fā)明人

上一篇：基于dna動態(tài)編碼的彩色圖像加密方法
上一篇：基于修改標(biāo)識符的oox文本文檔隱私信息檢測方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

面向數(shù)據(jù)流的設(shè)計方法相關(guān)技術(shù)

面向數(shù)據(jù)流的分析方法相關(guān)技術(shù)

面向數(shù)據(jù)流相關(guān)技術(shù)

隱私保護數(shù)據(jù)發(fā)布相關(guān)技術(shù)

數(shù)據(jù)流圖相關(guān)技術(shù)

數(shù)據(jù)流相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法