国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法

      文檔序號:9327243閱讀:348來源:國知局
      一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及差分隱私發(fā)布技術(shù)領(lǐng)域,特別是涉及一種基于直方圖的面向數(shù)據(jù)流差 分隱私發(fā)布方法。
      【背景技術(shù)】
      [0002] 由于信息化技術(shù)的快速發(fā)展,用戶的隱私信息泄露的問題逐漸凸顯,隱私保護技 術(shù)也引起人們的關(guān)注。差分隱私是一種強隱私保護模型,該模型假定攻擊者具有除某一條 記錄以外的其他所有記錄信息,即使在這一最大化背景知識下,差分隱私仍然能保證這條 記錄的隱私信息不被泄露。
      [0003] 目前關(guān)于數(shù)據(jù)流的差分隱私發(fā)布技術(shù)主要針對的是{〇, 1}所組成的二進制流,這 些方法不足以應(yīng)用于真實的應(yīng)用程序中,真實的應(yīng)用程序是基于窗口的,并且數(shù)據(jù)流也不 會僅僅局限于二進制流,而應(yīng)是任意數(shù)值型數(shù)據(jù)流。由于每個窗口中的隱私預(yù)算是固定的, 若考慮給每個子窗口分配相同的隱私預(yù)算,當(dāng)窗口的大小增大時,每個子窗口分配的隱私 預(yù)算會減小,使得添加的噪聲增大,導(dǎo)致數(shù)據(jù)的可用性降低。面向更一般的數(shù)據(jù)流,如何在 保證每個窗口中的隱私總預(yù)算不超過ε時,合理的分配隱私預(yù)算,并且能有效的快速發(fā)布 直方圖統(tǒng)計信息,同時保證數(shù)據(jù)具有一定的可用性,成為一項急需解決的任務(wù)。

      【發(fā)明內(nèi)容】

      [0004] 本發(fā)明所要解決的技術(shù)問題是提供一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布 方法,以達(dá)到每個窗口中隱私總預(yù)算不超過ε時,發(fā)布數(shù)據(jù)的可用性較好。
      [0005] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:提供一種基于直方圖的面向數(shù)據(jù)流 差分隱私發(fā)布方法,包括以下步驟:
      [0006] (1)對于每一個時刻i,數(shù)據(jù)流接收的數(shù)據(jù)集為D1,對數(shù)據(jù)集D1中屬性A出現(xiàn)的不 同元素值進行統(tǒng)計,并按照元素值的大小升序排列,對頻數(shù)進行歸一化處理為P ;
      [0007] (2)記最后一次發(fā)布的含噪局部最優(yōu)直方圖所對應(yīng)的真實數(shù)據(jù)的分布?xì)w一化后為 Q,計算 P 與 Q 的 EMD (Earth Mover' s Distance)相似度 τ ;
      [0008] (3)若τ > σ,則給數(shù)據(jù)集D1分配隱私預(yù)算
      給數(shù)據(jù)集〇1添加相應(yīng)的拉普拉斯噪聲得到數(shù)據(jù)集O1,其中,σ為設(shè)定的閾值,ε為隱私總 預(yù)算,w為滑動窗口大小,ε ]為第j個子窗口已分配的預(yù)算大小;
      [0009] (4)對數(shù)據(jù)集O1利用分組與合并策略,進行局部最優(yōu)直方圖發(fā)布。
      [0010] 所述步驟⑶中若τ彡〇時,則不發(fā)布數(shù)據(jù)集D1,即數(shù)據(jù)集O 1= null。
      [0011] 所述步驟⑶中數(shù)據(jù)集O1= Djs Lap(Ai) >m,其中,
      普拉斯噪聲、m的大小為數(shù)據(jù)集D1中屬性A出現(xiàn)的不同元素值的個數(shù)。
      [0012] 所述步驟⑶中若在一個窗口內(nèi),數(shù)據(jù)集連續(xù)突變,為了減緩入馮增速度,需減 緩ε i的分配,則給數(shù)據(jù)集D i分配隱私預(yù)算
      [0013] 所述步驟(4)中局部最優(yōu)直方圖發(fā)布包括以下子步驟:
      [0014] (41)假設(shè)每個分組為包含固定長度L個不同的含噪統(tǒng)計結(jié)果值,則將數(shù)據(jù)集仏分 成[m/L]個不相交的組;
      [0015] (42)對每個分組進行最優(yōu)直方圖算法,計算出每個分組所對應(yīng)的最優(yōu)直方圖劃分 結(jié)果;
      [0016] (43)對所有分組的最優(yōu)直方圖結(jié)果進行合并,得到局部最優(yōu)直方圖發(fā)布。
      [0017] 有益效果
      [0018] 由于采用了上述的技術(shù)方案,本發(fā)明與現(xiàn)有技術(shù)相比,具有以下的優(yōu)點和積極效 果:本發(fā)明基于滑動窗口模型下,利用相鄰兩個時間戳的數(shù)據(jù)集分布的相似性,來動態(tài)合理 分配隱私預(yù)算,使得每一個窗口的總預(yù)算不超過ε,并利用分組與合并策略,快速計算出局 部最優(yōu)直方圖,從而達(dá)到高效的動態(tài)流式差分隱私發(fā)布策略。
      【具體實施方式】
      [0019] 下面結(jié)合具體實施例,進一步闡述本發(fā)明。應(yīng)理解,這些實施例僅用于說明本發(fā)明 而不用于限制本發(fā)明的范圍。此外應(yīng)理解,在閱讀了本發(fā)明講授的內(nèi)容之后,本領(lǐng)域技術(shù)人 員可以對本發(fā)明作各種改動或修改,這些等價形式同樣落于本申請所附權(quán)利要求書所限定 的范圍。
      [0020] 本發(fā)明的實施方式涉及一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法,包括以 下步驟:
      [0021] 步驟1、對于每一個時刻i,數(shù)據(jù)流接收的數(shù)據(jù)集為D1,對數(shù)據(jù)集D1中屬性A出現(xiàn) 的不同元素值進行統(tǒng)計,并按照元素值的大小升序排列,SDi= {{x pl, fpl},{xp2, fp2},. . . {xpm ,ffj},其中1"為元素值的大小,且x Pi< x p2< x P;5< . . < x Pm,為數(shù)據(jù)集D i中出現(xiàn)x w 的頻數(shù)。對fw進行歸一化處理,即4
      (1彡j彡m),則P = {{xpl, wpl},{xp2, w p2^,· · · (Xpm,Wpinl } ο
      [0022] 步驟2、記最后一次發(fā)布的含噪局部最優(yōu)直方圖所對應(yīng)的真實數(shù)據(jù)的分 布?xì)w一化后為Q,計算P與Q的EMD相似度。P、Q間EMD相似度的計算公式為:
      (1彡i彡m,1彡j彡η),&為Q中的元素值的大小,由于P、Q均為歸一化后的數(shù)據(jù)集,故 可以采用最鄰近距離填補法來計算P、Q間EMD相似度τ。
      [0023] 步驟3、令閾值為σ ;若τ > 〇,則給D1分配隱私預(yù)算
      ,并給數(shù)據(jù)集D1 添加相應(yīng)的拉普拉斯噪聲得到數(shù)據(jù)集O1,其中·
      SLap(Ai) >'其中,ε為隱私總預(yù)算,w為滑動窗口大小,ε ,為第j個子窗口已分配 的預(yù)算大小,< LapO >為拉普拉斯噪聲,m的大小為數(shù)據(jù)集D1中屬性A出現(xiàn)的不同元素值 的個數(shù)。若在一個窗口內(nèi),數(shù)據(jù)集連續(xù)突變,導(dǎo)致A 1W 2的指數(shù)遞增,使得第i時刻添加 的噪聲較大。為了減緩11遞增速度,需減緩ε i的分配,故可以采用
      時,貝1J不發(fā)布Di,即拉普拉斯噪聲Oi= null。
      [0024] 步驟4、對數(shù)據(jù)集O1利用分組與合并策略,進行局部最優(yōu)直方圖發(fā)布。
      [0025] 直方圖是一種描述數(shù)據(jù)統(tǒng)計信息的有效方式,主要是將數(shù)據(jù)集劃分成不相交的 桶。若數(shù)據(jù)流的數(shù)據(jù)范圍跨度較大,對數(shù)據(jù)集(^直接進行全局最優(yōu)直方圖發(fā)布,算法執(zhí)行 效率較低,難以滿足數(shù)據(jù)流的快速響應(yīng)要求。由于數(shù)據(jù)集D 1中數(shù)據(jù)統(tǒng)計是按照key值進行 排序的,而桶的合并主要發(fā)生在相鄰的桶間,故可以直接對整個數(shù)據(jù)集O1進行分組。
      [0026] 局部最優(yōu)直方圖發(fā)布策略:
      [0027] 1)假設(shè)每個分組為包含固定長度L個不同的含噪統(tǒng)計結(jié)果值,則將數(shù)據(jù)集O1分成 m/L個不相交的組。
      [0028] 2)對每個分組進行最優(yōu)直方圖算法,計算出每個分組所對應(yīng)的最優(yōu)直方圖劃分結(jié) 果。
      [0029] 3)對所有分組的最優(yōu)直方圖結(jié)果進行合并,得到局部最優(yōu)直方圖發(fā)布f= {(I1, Γι,C1),…,(lk,rk,ck)},其中(^為0 i中落在(?,)區(qū)間的平均值,其中,1 ,和r ,分 別表示每個桶的左右邊界所對應(yīng)的下標(biāo)。
      【主權(quán)項】
      1. 一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法,其特征在于,包括以下步驟: (1) 對于每一個時刻i,數(shù)據(jù)流接收的數(shù)據(jù)集為D1,對數(shù)據(jù)集D1中屬性A出現(xiàn)的不同元 素值進行統(tǒng)計,并按照元素值的大小升序排列,對頻數(shù)進行歸一化處理為P; (2) 記最后一次發(fā)布的含噪局部最優(yōu)直方圖所對應(yīng)的真實數(shù)據(jù)的分布?xì)w一化后為Q, 計算P與Q的EMD相似度T;〇1添加相應(yīng)的拉普拉斯噪聲得到數(shù)據(jù)集O1,其中,〇為設(shè)定的閾值,e為隱私總預(yù)算,w為 滑動窗口大小,£ 為第j個子窗口已分配的預(yù)算大小; (4)對數(shù)據(jù)集O1利用分組與合并策略,進行局部最優(yōu)直方圖發(fā)布。2. 根據(jù)權(quán)利要求1所述的基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法,其特征在于, 所述步驟(3)中若T彡。時,則不發(fā)布數(shù)據(jù)集D1,即數(shù)據(jù)集O1=null。3. 根據(jù)權(quán)利要求1所述的基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法,其特征在于,聲、m的大小為數(shù)據(jù)集D1中屬性A出現(xiàn)的不同元素值的個數(shù)。4. 根據(jù)權(quán)利要求1所述的基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法,其特征在于,5. 根據(jù)權(quán)利要求1所述的基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法,其特征在于, 所述步驟(4)中局部最優(yōu)直方圖發(fā)布包括以下子步驟: (41) 假設(shè)每個分組為包含固定長度L個不同的含噪統(tǒng)計結(jié)果值,則將數(shù)據(jù)集O1分成 「》/£1個不相交的組; (42) 對每個分組進行最優(yōu)直方圖算法,計算出每個分組所對應(yīng)的最優(yōu)直方圖劃分結(jié) 果; (43) 對所有分組的最優(yōu)直方圖結(jié)果進行合并,得到局部最優(yōu)直方圖發(fā)布。
      【專利摘要】本發(fā)明涉及一種基于直方圖的面向數(shù)據(jù)流差分隱私發(fā)布方法,包括以下步驟:對于每一個時刻i,數(shù)據(jù)流接收的數(shù)據(jù)集為Di,對數(shù)據(jù)集Di中屬性A出現(xiàn)的不同元素值進行統(tǒng)計,并按照元素值的大小升序排列,對頻數(shù)進行歸一化處理為P;記最后一次發(fā)布的含噪局部最優(yōu)直方圖所對應(yīng)的真實數(shù)據(jù)的分布?xì)w一化后為Q,計算P與Q的EMD相似度τ;若τ>σ,則給數(shù)據(jù)集Di分配隱私預(yù)算,其中,,并給數(shù)據(jù)集Di添加相應(yīng)的拉普拉斯噪聲得到數(shù)據(jù)集Oi;對數(shù)據(jù)集Oi利用分組與合并策略,進行局部最優(yōu)直方圖發(fā)布。本發(fā)明在保證每個窗口中隱私總預(yù)算不超過ε時,發(fā)布數(shù)據(jù)的可用性較好。
      【IPC分類】G06F21/60
      【公開號】CN105046160
      【申請?zhí)枴緾N201510430312
      【發(fā)明人】夏小玲, 劉慧藝, 石秀金, 王紹宇, 于守健
      【申請人】東華大學(xué)
      【公開日】2015年11月11日
      【申請日】2015年7月21日
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1