本發(fā)明涉及隱私保護,具體為基于增加數(shù)據(jù)噪音保護隱私的方法和系統(tǒng)。
背景技術(shù):
1、隨著互聯(lián)網(wǎng)的普及和技術(shù)的發(fā)展,數(shù)據(jù)的收集和處理已經(jīng)成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠?,然而,這也帶來了許多安全和隱私問題,黑客可以通過各種手段來獲取、竊取或破壞敏感數(shù)據(jù),這使得保護個人隱私和安全變得至關(guān)重要。
2、其中,隨著技術(shù)的進(jìn)步,越來越多的投資者選擇在網(wǎng)上進(jìn)行證券交易,然而,這也帶來了許多安全問題和隱私泄露的風(fēng)險,如黑客可能會通過各種手段(如釣魚郵件、惡意軟件等)入侵投資者的電子設(shè)備并竊取他們的個人信息和敏感數(shù)據(jù),公司員工或管理層可能會利用獲得的個人信息進(jìn)行非法活動,敵對的公司可能會試圖竊取其他公司的商業(yè)機密或個人信息以獲得競爭優(yōu)勢,投資者自己的行為可能會泄露個人信息,如在社交媒體上發(fā)布個人信息或在公共場合討論投資決策,因此,保護隱私安全的重要性極為重要。
3、公開號為cn113282955b的中國專利公開了一種隱私政策中隱私信息提取方法及系統(tǒng),基于自然語言處理,首先將原始的隱私政策處理成文本,繼而對隱私文本進(jìn)行分段分句,并且使用預(yù)訓(xùn)練得到的自然語言處理模型對句子進(jìn)行詞性標(biāo)注與命名實體識別得到數(shù)據(jù)對象,最后利用同義詞詞典與模糊匹配得到歸一化的數(shù)據(jù)對象,再將數(shù)據(jù)對象映射到對應(yīng)的隱私信息分類中,得到隱私政策收集的隱私信息的類別,以便于用戶、應(yīng)用市場平臺或監(jiān)管機構(gòu)了解應(yīng)用的隱私政策的隱私信息收集情況,幫助他們進(jìn)行下一步的決策。同時提供了一種相應(yīng)的終端及介質(zhì);通過利用自然語言處理技術(shù)對隱私政策中的隱私信息進(jìn)行提取,不需人工進(jìn)行標(biāo)注,能夠?qū)崿F(xiàn)更加高效、快速、靈活的隱私分析,滿足相關(guān)行業(yè)的需求;但是,該專利存在以下缺陷:
4、現(xiàn)有的不能基于增加數(shù)據(jù)噪音來保護隱私,使得用戶隱私易泄露,導(dǎo)致用戶隱私保護效果差,安全性低下。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供基于增加數(shù)據(jù)噪音保護隱私的方法和系統(tǒng),可基于增加數(shù)據(jù)噪音來保護隱私,避免用戶隱私泄露,可提升用戶隱私保護效果及安全性,解決了上述背景技術(shù)中提出的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、基于增加數(shù)據(jù)噪音保護隱私的方法,包括如下步驟:
4、s1:實時采集用戶身份數(shù)據(jù)、用戶行為數(shù)據(jù)及用戶偏好數(shù)據(jù),確定出用戶隱私實時數(shù)據(jù);
5、s2:對用戶隱私實時數(shù)據(jù)進(jìn)行無線傳輸,使用戶隱私實時數(shù)據(jù)進(jìn)行加噪保護;
6、s3:對用戶隱私實時數(shù)據(jù)進(jìn)行處理、加噪保護及存儲管控,使用戶隱私保護聚合數(shù)據(jù)安全。
7、根據(jù)本發(fā)明的另一個方面,提供了基于增加數(shù)據(jù)噪音保護隱私的系統(tǒng),用于實現(xiàn)如上述的基于增加數(shù)據(jù)噪音保護隱私的方法,包括:
8、數(shù)據(jù)采集模塊,用于對用戶身份數(shù)據(jù)、用戶行為數(shù)據(jù)及用戶偏好數(shù)據(jù)進(jìn)行實時采集,確定出用戶隱私實時數(shù)據(jù);
9、數(shù)據(jù)傳輸模塊,用于對用戶隱私實時數(shù)據(jù)進(jìn)行無線傳輸,便于后續(xù)對用戶隱私實時數(shù)據(jù)進(jìn)行加噪保護;
10、加噪保護平臺,用于對用戶隱私實時數(shù)據(jù)進(jìn)行處理、加噪保護及存儲管控,使用戶隱私保護聚合數(shù)據(jù)安全。
11、優(yōu)選的,所述數(shù)據(jù)采集模塊包括:
12、身份采集單元,用于對用戶的姓名、性別、年齡、身高、體重、地址、電話、郵箱、學(xué)歷、婚姻狀況及職業(yè)進(jìn)行實時采集,確定出用戶身份數(shù)據(jù);
13、行為采集單元,用于對用戶的互聯(lián)網(wǎng)瀏覽行為、購買行為及互動行為進(jìn)行實時采集,確定出用戶行為數(shù)據(jù);
14、偏好采集單元,用于對用戶的習(xí)慣需求及偏愛喜好進(jìn)行實時采集,確定出用戶偏好數(shù)據(jù);
15、其中,基于用戶身份數(shù)據(jù)、用戶行為數(shù)據(jù)及用戶偏好數(shù)據(jù),確定出用戶隱私實時數(shù)據(jù)。
16、優(yōu)選的,所述數(shù)據(jù)傳輸模塊包括:
17、數(shù)據(jù)發(fā)射單元,用于發(fā)射用戶隱私實時數(shù)據(jù);
18、數(shù)據(jù)接收單元,用于接收用戶隱私實時數(shù)據(jù);
19、基于增加數(shù)據(jù)噪音保護隱私的需求,建立數(shù)據(jù)發(fā)射單元與數(shù)據(jù)接收單元之間的數(shù)據(jù)傳輸鏈路;
20、其中,數(shù)據(jù)發(fā)射單元向數(shù)據(jù)接收單元傳輸請求建立數(shù)據(jù)傳輸鏈路的指令;
21、數(shù)據(jù)接收單元接收到數(shù)據(jù)發(fā)射單元傳輸?shù)恼埱蠼?shù)據(jù)傳輸鏈路的指令,數(shù)據(jù)接收單元檢查自身是否存在空閑的數(shù)據(jù)傳輸端口;
22、當(dāng)數(shù)據(jù)接收單元存在空閑的數(shù)據(jù)傳輸端口時,數(shù)據(jù)接收單元向數(shù)據(jù)發(fā)射單元傳輸同意建立數(shù)據(jù)傳輸鏈路的指令;
23、數(shù)據(jù)發(fā)射單元接收到數(shù)據(jù)接收單元傳輸?shù)耐饨?shù)據(jù)傳輸鏈路的指令,數(shù)據(jù)發(fā)射單元與數(shù)據(jù)接收單元建立數(shù)據(jù)傳輸鏈路;
24、其中,數(shù)據(jù)發(fā)射單元將用戶隱私實時數(shù)據(jù)發(fā)射給數(shù)據(jù)接收單元;
25、數(shù)據(jù)接收單元接收到用戶隱私實時數(shù)據(jù)后,數(shù)據(jù)接收單元將用戶隱私實時數(shù)據(jù)傳輸給加噪保護平臺。
26、優(yōu)選的,所述數(shù)據(jù)傳輸模塊,還包括:
27、數(shù)據(jù)發(fā)送時刻實時監(jiān)測模塊,用于實時監(jiān)測數(shù)據(jù)發(fā)射單元的每個數(shù)據(jù)的數(shù)據(jù)發(fā)送時刻;
28、數(shù)據(jù)接收時刻實時監(jiān)測模塊,用于實時監(jiān)測數(shù)據(jù)接收單元的每個數(shù)據(jù)的數(shù)據(jù)接收時刻;
29、數(shù)據(jù)傳輸時長獲取模塊,用于利用所述數(shù)據(jù)發(fā)送時刻和數(shù)據(jù)接收時刻獲取每個數(shù)據(jù)的數(shù)據(jù)傳輸時長;
30、數(shù)據(jù)傳輸參數(shù)獲取模塊,用于利用所述每個數(shù)據(jù)的數(shù)據(jù)傳輸時長獲取數(shù)據(jù)傳輸參數(shù),其中,所述數(shù)據(jù)傳輸參數(shù)通過如下公式獲?。?/p>
31、
32、其中,k表示數(shù)據(jù)傳輸參數(shù);n表示數(shù)據(jù)傳輸次數(shù);ti表示第i次數(shù)據(jù)傳輸對應(yīng)的實際數(shù)據(jù)傳輸時長;tci表示第i次數(shù)據(jù)傳輸對應(yīng)的理論數(shù)據(jù)傳輸時長;ci表示第i次數(shù)據(jù)傳輸對應(yīng)的數(shù)據(jù)傳輸量;cyi表示第i次數(shù)據(jù)傳輸對應(yīng)的數(shù)據(jù)傳輸線程的通信剩余容量;
33、運行參數(shù)提取模塊,用于當(dāng)所述數(shù)據(jù)傳輸參數(shù)未超過預(yù)設(shè)的數(shù)據(jù)參數(shù)閾值時,則提取所述數(shù)據(jù)發(fā)射單元與所述數(shù)據(jù)接收單元之間的通信線程的運行參數(shù),其中,所述運行參數(shù)包括數(shù)據(jù)傳輸速率和數(shù)據(jù)傳輸剩余容量;
34、數(shù)據(jù)傳輸線程啟動判定模塊,用于根據(jù)所述數(shù)據(jù)發(fā)射單元與所述數(shù)據(jù)接收單元之間的通信線程的運行參數(shù)判斷是否啟動新的數(shù)據(jù)傳輸線程。
35、優(yōu)選的,數(shù)據(jù)傳輸線程啟動判定模塊,包括:
36、第一傳輸參數(shù)因子獲取模塊,用于利用所述數(shù)據(jù)傳輸速率獲取第一傳輸參數(shù)因子,其中,所述第一傳輸參數(shù)因子通過如下公式獲?。?/p>
37、
38、其中,d01表示第一傳輸參數(shù)因子;n表示數(shù)據(jù)傳輸次數(shù);vi表示第i次數(shù)據(jù)傳輸對應(yīng)的數(shù)據(jù)傳輸速率;ve表示數(shù)據(jù)傳輸線程正常運行狀態(tài)下所允許的最大數(shù)據(jù)傳輸速率;ci表示第i次數(shù)據(jù)傳輸對應(yīng)的數(shù)據(jù)傳輸量;cyi表示第i次數(shù)據(jù)傳輸對應(yīng)的數(shù)據(jù)傳輸線程的通信剩余容量;
39、第二傳輸參數(shù)因子獲取模塊,用于利用所述數(shù)據(jù)傳輸剩余容量獲取第二傳輸參數(shù)因子,其中,所述第二傳輸參數(shù)因子通過如下公式獲?。?/p>
40、
41、其中,d02表示第二傳輸參數(shù)因子;n表示數(shù)據(jù)傳輸次數(shù);ci表示第i次數(shù)據(jù)傳輸對應(yīng)的數(shù)據(jù)傳輸量;cyi表示第i次數(shù)據(jù)傳輸對應(yīng)的數(shù)據(jù)傳輸線程的通信剩余容量;k表示調(diào)節(jié)系數(shù),并且,所述調(diào)節(jié)系數(shù)通過如下公式獲?。?/p>
42、
43、其中,n表示數(shù)據(jù)傳輸次數(shù);ci表示第i次數(shù)據(jù)傳輸對應(yīng)的數(shù)據(jù)傳輸量;cyi表示第i次數(shù)據(jù)傳輸對應(yīng)的數(shù)據(jù)傳輸線程的通信剩余容量;vi表示第i次數(shù)據(jù)傳輸對應(yīng)的數(shù)據(jù)傳輸速率;ve表示數(shù)據(jù)傳輸線程正常運行狀態(tài)下所允許的最大數(shù)據(jù)傳輸速率;
44、比較模塊,用于將所述第一傳輸參數(shù)因子和第二傳輸參數(shù)因子分別與預(yù)設(shè)的第一評價因子閾值和第二評價因子閾值進(jìn)行比較,獲得比較結(jié)果;
45、第一數(shù)據(jù)傳輸線程啟動判定模塊,用于當(dāng)所述比較結(jié)果表明第一傳輸參數(shù)因子和第二傳輸參數(shù)因子中任一一個參數(shù)因子超過其對應(yīng)的評價因子閾值時,則判定需要啟動新的數(shù)據(jù)傳輸線程;
46、傳輸評價參數(shù)獲取模塊,用于當(dāng)所述比較結(jié)果表明第一傳輸參數(shù)因子和第二傳輸參數(shù)因子均低于其對應(yīng)的評價因子閾值時,則利用所述第一傳輸參數(shù)因子和第二傳輸參數(shù)因子獲取傳輸評價參數(shù),其中,所述傳輸評價參數(shù)通過如下公式獲?。?/p>
47、
48、其中,d表示傳輸評價參數(shù);d01表示第一傳輸參數(shù)因子;d02表示第二傳輸參數(shù)因子;
49、第二數(shù)據(jù)傳輸線程啟動判定模塊,用于當(dāng)所述傳輸評價參數(shù)超過預(yù)設(shè)的參數(shù)閾值時,則判定需要啟動新的數(shù)據(jù)傳輸線程;當(dāng)所述傳輸評價參數(shù)未超過預(yù)設(shè)的參數(shù)閾值時,則判定不需要啟動新的數(shù)據(jù)傳輸線程。
50、優(yōu)選的,所述加噪保護平臺包括:
51、數(shù)據(jù)處理模塊,用于對用戶隱私實時數(shù)據(jù)進(jìn)行檢索、排序及特征提取,確定出用戶隱私特征數(shù)據(jù);
52、加噪保護模塊,用于對用戶隱私特征數(shù)據(jù)進(jìn)行拆分及增加數(shù)據(jù)噪音,確定出多個不能被直接識別的用戶隱私特征子集;
53、存儲管控模塊,用于對噪音增加后的多個用戶隱私特征子集進(jìn)行安全聚合、加密存儲及數(shù)據(jù)監(jiān)控,使用戶隱私保護聚合數(shù)據(jù)安全。
54、優(yōu)選的,所述數(shù)據(jù)處理模塊包括:
55、數(shù)據(jù)檢索單元,用于對用戶隱私實時數(shù)據(jù)進(jìn)行檢索;
56、獲取用戶隱私實時數(shù)據(jù);
57、基于順序檢索方法,對用戶隱私實時數(shù)據(jù)進(jìn)行檢索;
58、檢查用戶隱私實時數(shù)據(jù)的一致性;
59、根據(jù)用戶隱私實時數(shù)據(jù)中每個變量的合理取值范圍和相互關(guān)系,檢查用戶隱私實時數(shù)據(jù)是否合乎要求;
60、去除用戶隱私實時數(shù)據(jù)中含有的超出正常范圍、邏輯上不合理或相互矛盾的不一致數(shù)據(jù);
61、對用戶隱私實時數(shù)據(jù)進(jìn)行無效值及缺失值處理;
62、去除用戶隱私實時數(shù)據(jù)中含有的對增加數(shù)據(jù)噪音保護隱私無價值的無效數(shù)據(jù)及缺失數(shù)據(jù);
63、確定出對增加數(shù)據(jù)噪音保護隱私有價值的用戶隱私實時數(shù)據(jù);
64、數(shù)據(jù)排序單元,用于對檢索后的用戶隱私實時數(shù)據(jù)進(jìn)行排序;
65、獲取檢索后對增加數(shù)據(jù)噪音保護隱私有價值的用戶隱私實時數(shù)據(jù);
66、基于內(nèi)部排序方法,對檢索后對增加數(shù)據(jù)噪音保護隱私有價值的用戶隱私實時數(shù)據(jù)進(jìn)行排序;
67、確定出具有排列次序的用戶隱私實時數(shù)據(jù);
68、特征提取單元,用于對排序后的用戶隱私實時數(shù)據(jù)進(jìn)行特征提??;
69、獲取排序后具有排列次序的用戶隱私實時數(shù)據(jù);
70、對排序后具有排列次序的用戶隱私實時數(shù)據(jù)進(jìn)行特征提??;
71、確定出用戶隱私特征數(shù)據(jù)。
72、優(yōu)選的,所述加噪保護模塊包括:
73、數(shù)據(jù)拆分單元,用于對用戶隱私特征數(shù)據(jù)進(jìn)行拆分;
74、獲取用戶隱私特征數(shù)據(jù);
75、對用戶隱私特征數(shù)據(jù)進(jìn)行深入挖掘及相關(guān)分析;
76、確定用戶隱私特征數(shù)據(jù)類型;
77、基于用戶隱私特征數(shù)據(jù)類型,對用戶隱私特征數(shù)據(jù)進(jìn)行拆分;
78、確定出多個用戶隱私特征子集;
79、噪音增加單元,用于在拆分后的用戶隱私特征數(shù)據(jù)中增加數(shù)據(jù)噪音;
80、獲取拆分后的多個用戶隱私特征子集;
81、采用隨機數(shù)生成器生成數(shù)據(jù)噪音;
82、將生成的數(shù)據(jù)噪音增加至多個用戶隱私特征子集中;
83、確定出多個不能被直接識別的用戶隱私特征子集。
84、優(yōu)選的,所述存儲管控模塊包括:
85、安全聚合單元,用于對噪音增加后的多個用戶隱私特征子集進(jìn)行聚合;
86、獲取多個不能被直接識別的用戶隱私特征子集;
87、對多個不能被直接識別的用戶隱私特征子集進(jìn)行安全聚合;
88、使多個不能被直接識別的用戶隱私特征子集進(jìn)行重新組合;
89、確定出基于增加數(shù)據(jù)噪音的用戶隱私保護聚合數(shù)據(jù);
90、加密存儲單元,用于對用戶隱私保護聚合數(shù)據(jù)進(jìn)行加密存儲;
91、獲取基于增加數(shù)據(jù)噪音的用戶隱私保護聚合數(shù)據(jù);
92、對用戶隱私保護聚合數(shù)據(jù)進(jìn)行加密處理;
93、確定出加密后的用戶隱私保護聚合數(shù)據(jù);
94、且對加密后的用戶隱私保護聚合數(shù)據(jù)進(jìn)行安全存儲;
95、數(shù)據(jù)監(jiān)控單元,用于對安全存儲的用戶隱私保護聚合數(shù)據(jù)進(jìn)行監(jiān)控;
96、對安全存儲的用戶隱私保護聚合數(shù)據(jù)進(jìn)行實時監(jiān)測;
97、確定出用戶隱私保護聚合數(shù)據(jù)監(jiān)測結(jié)果;
98、對用戶隱私保護聚合數(shù)據(jù)監(jiān)測結(jié)果進(jìn)行深入挖掘及相關(guān)分析;
99、確定出用戶隱私保護聚合數(shù)據(jù)智能化管控方案;
100、基于用戶隱私保護聚合數(shù)據(jù)智能化管控方案對用戶隱私保護聚合數(shù)據(jù)進(jìn)行智能化管控。
101、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
102、本發(fā)明通過實時采集用戶身份數(shù)據(jù)、用戶行為數(shù)據(jù)及用戶偏好數(shù)據(jù),確定用戶隱私實時數(shù)據(jù),通過對用戶隱私實時數(shù)據(jù)進(jìn)行無線傳輸,可便于對用戶隱私實時數(shù)據(jù)進(jìn)行處理,確定用戶隱私特征數(shù)據(jù),通過對用戶隱私特征數(shù)據(jù)進(jìn)行拆分及增加數(shù)據(jù)噪音,可確定多個不能被直接識別的用戶隱私特征子集,通過對噪音增加后的多個用戶隱私特征子集進(jìn)行安全聚合,可確定基于增加數(shù)據(jù)噪音的用戶隱私保護聚合數(shù)據(jù),通過對用戶隱私保護聚合數(shù)據(jù)加密存儲及數(shù)據(jù)監(jiān)控,可使用戶隱私保護聚合數(shù)據(jù)安全,可基于增加數(shù)據(jù)噪音來保護隱私,避免用戶隱私泄露,可提升用戶隱私保護效果及安全性。