相關(guān)申請(qǐng)的交叉引用
本申請(qǐng)要求2014年11月26日提交的題為“systemsandmethodsfordataprivacyfirewall(用于數(shù)據(jù)隱私防火墻的系統(tǒng)和方法)”的美國臨時(shí)專利申請(qǐng)序列號(hào)62/084,656的權(quán)益,所述美國臨時(shí)專利申請(qǐng)的全部公開內(nèi)容通過引用結(jié)合在此。
背景技術(shù):
本說明書總體上涉及提供隱私防火墻以保護(hù)私有和敏感數(shù)據(jù),并且更具體地,涉及用于提供對(duì)從私有和敏感數(shù)據(jù)獲得的非私有信息的訪問的系統(tǒng)和方法。
技術(shù)背景
目前,可以通過將與數(shù)據(jù)有關(guān)的用戶活動(dòng)匿名化并暴露所述已匿名化數(shù)據(jù)以便瀏覽和使用來提供對(duì)私有和/或敏感數(shù)據(jù)的訪問。然而,此類方法可能無法有效地保護(hù)隱私,因?yàn)樗鰯?shù)據(jù)可以被操縱以從中提取私有信息。此類方法還可能由于數(shù)據(jù)被匿名化到不再有用的程度而失敗。
相應(yīng)地,存在對(duì)以下系統(tǒng)和方法的需要,所述系統(tǒng)和方法不對(duì)私有數(shù)據(jù)匿名化,而是從中發(fā)現(xiàn)并提取非私有元素,其方式為使得不破壞所述數(shù)據(jù)的隱私,但私有數(shù)據(jù)中所包含的數(shù)據(jù)是有用的。
技術(shù)實(shí)現(xiàn)要素:
在一個(gè)實(shí)施例中,一種用于實(shí)現(xiàn)隱私防火墻從而確定并提供來自私有電子數(shù)據(jù)的非私有信息的系統(tǒng)包括具有私有電子數(shù)據(jù)語料庫的數(shù)據(jù)儲(chǔ)存庫、處理設(shè)備、以及非瞬態(tài)處理器可讀存儲(chǔ)介質(zhì)。所述非瞬態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)包括一條或多條編程指令,所述一條或多條編程指令當(dāng)被執(zhí)行時(shí)使得所述處理設(shè)備:分析所述電子數(shù)據(jù)語料庫從而識(shí)別所述數(shù)據(jù)的具有非私有信息的第一一個(gè)或多個(gè)部分以及所述數(shù)據(jù)的具有私有信息的第二一個(gè)或多個(gè)部分,將所述數(shù)據(jù)的所述第一一個(gè)或多個(gè)部分標(biāo)記為被允許在所述隱私防火墻外部使用,判定所述數(shù)據(jù)的所述第二一個(gè)或多個(gè)部分是否包括非私有元素,并且如果所述數(shù)據(jù)的所述第二一個(gè)或多個(gè)部分包括非私有元素,則提取所述非私有元素并將所述非私有元素標(biāo)記為被允許在所述隱私防火墻外部使用的信息。
在另一實(shí)施例中,一種用于實(shí)現(xiàn)隱私防火墻從而確定并提供來自私有電子數(shù)據(jù)的非私有信息的方法包括:由處理設(shè)備分析包含在儲(chǔ)存庫中的私有電子數(shù)據(jù)語料庫從而識(shí)別所述數(shù)據(jù)的包括非私有信息的第一一個(gè)或多個(gè)部分以及所述數(shù)據(jù)的包括私有信息的第二一個(gè)或多個(gè)部分;由所述處理設(shè)備將所述數(shù)據(jù)的所述第一一個(gè)或多個(gè)部分標(biāo)記為被允許在所述隱私防火墻外部使用;由所述處理設(shè)備判定所述數(shù)據(jù)的所述第二一個(gè)或多個(gè)部分是否包括非私有元素;以及如果所述數(shù)據(jù)的所述第二一個(gè)或多個(gè)部分包括非私有元素,則由所述處理設(shè)備提取所述非私有元素并且由所述處理設(shè)備將所述非私有元素標(biāo)記為被允許在所述隱私防火墻外部使用的信息。
在又另一實(shí)施例中,一種用于通過隱私防火墻提供來自私有電子數(shù)據(jù)的非私有信息的系統(tǒng)包括:所述隱私防火墻后面的數(shù)據(jù)儲(chǔ)存庫、處理設(shè)備、以及非瞬態(tài)處理器可讀存儲(chǔ)介質(zhì)。所述數(shù)據(jù)儲(chǔ)存庫包括:已經(jīng)被標(biāo)記為非私有信息的私有電子數(shù)據(jù)語料庫、將不分發(fā)的私有信息、有待分發(fā)的私有信息的非私有元素、或已去私有化的私有信息。所述非瞬態(tài)處理器可讀存儲(chǔ)介質(zhì)包括一條或多條編程指令,所述一條或多條編程指令當(dāng)被執(zhí)行時(shí)使得所述處理設(shè)備:從所述隱私防火墻外部的用戶接收搜索字符串;在所述數(shù)據(jù)儲(chǔ)存庫中搜索所述電子數(shù)據(jù)的與所述搜索字符串相對(duì)應(yīng)的一個(gè)或多個(gè)部分;并且如果所述電子數(shù)據(jù)的所述一個(gè)或多個(gè)部分包含所述非私有信息、所述有待分發(fā)的私有信息的所述非私有元素、或所述已去私有化的私有信息,則提供對(duì)所述搜索字符串的響應(yīng)。所述搜索字符串包括問題,并且所述響應(yīng)包含:包含所述非私有信息、所述有待分發(fā)的私有信息的所述非私有元素、或所述已去私有化的私有信息的所述電子數(shù)據(jù)的所述一個(gè)或多個(gè)部分中所包含的信息。
鑒于以下具體描述結(jié)合附圖將更完整地理解由在此描述的實(shí)施例提供的這些和附加特征。
附圖說明
附圖中闡明的實(shí)施例在本質(zhì)上是說明性的且示例性的并且并不旨在限制由權(quán)利要求書限定的主題。當(dāng)結(jié)合以下附圖閱讀時(shí),能夠理解說明性實(shí)施例的以下詳細(xì)描述,其中,相同的結(jié)構(gòu)用相同的參考標(biāo)號(hào)指示,并且在附圖中:
圖1根據(jù)本文所示出和所描述的一個(gè)或多個(gè)實(shí)施例描繪了針對(duì)用于提供對(duì)隱私防火墻后面數(shù)據(jù)的訪問的系統(tǒng)的說明性計(jì)算網(wǎng)絡(luò)的示意性描繪;
圖2描繪了來自圖1的服務(wù)器計(jì)算設(shè)備的示意性描繪,進(jìn)一步展示了根據(jù)本文所示出和所描述的一個(gè)或多個(gè)實(shí)施例可以用于提供數(shù)據(jù)的硬件和軟件;
圖3根據(jù)在此示出和描述的一個(gè)或多個(gè)實(shí)施例描繪了來自圖1的隱私防火墻的各個(gè)層的示意性描繪;
圖4根據(jù)在此示出和描述的一個(gè)或多個(gè)實(shí)施例描繪了描繪了響應(yīng)于請(qǐng)求而提供數(shù)據(jù)的示意性方法的流程圖;
圖5根據(jù)在此示出和描述的一個(gè)或多個(gè)實(shí)施例描繪了圖形用戶界面的示意性搜索輸入屏幕的示意性描繪;
圖6根據(jù)在此示出和描述的一個(gè)或多個(gè)實(shí)施例描繪了包含自動(dòng)完成選項(xiàng)的圖形用戶界面的示意性搜索輸入屏幕的示意性描繪;
圖7根據(jù)在此示出和描述的一個(gè)或多個(gè)實(shí)施例描繪了描繪了對(duì)數(shù)據(jù)進(jìn)行分析和分類的示意性方法的流程圖;且
圖8根據(jù)在此示出和描述的一個(gè)或多個(gè)實(shí)施例描繪了描繪了判定私有數(shù)據(jù)是否包含非私有信息的示意性方法的流程圖。
具體實(shí)施方式
總體上參考附圖,在此所述的實(shí)施例是針對(duì)用于實(shí)現(xiàn)隱私防火墻從而限制對(duì)位于所述隱私防火墻邊界內(nèi)部的服務(wù)器上所存儲(chǔ)的私有數(shù)據(jù)語料庫的訪問的系統(tǒng)和方法。在具體實(shí)施例中,在此所述的系統(tǒng)和方法總體上可以被實(shí)現(xiàn)以保證私有數(shù)據(jù)保持安全,同時(shí)仍然響應(yīng)于一個(gè)或多個(gè)用戶所提交的問題提供信息性答案,其中,所述答案是從所述私有數(shù)據(jù)獲得的。一般可以假定隱私防火墻后面的所有數(shù)據(jù)都是私有數(shù)據(jù)。然而,所述數(shù)據(jù)的某些部分實(shí)際上可能包含非私有信息。另外,所述數(shù)據(jù)的包含私有信息的剩余部分還可能包含非私有元素。所述非私有信息和來自所述私有信息的所述非私有元素可以被標(biāo)記為可用于在維持?jǐn)?shù)據(jù)的隱私的同時(shí)回答用戶所提交的問題。
在此所披露的方法和系統(tǒng)可以用于例如:其中關(guān)于數(shù)據(jù)的使用是否將“跨用戶”(即,實(shí)體的私有數(shù)據(jù)是否將被所述實(shí)體之外的任何人看見或推出)可能存在不確定性的實(shí)例,或其中期望提供不需要高度受控制的訪問的數(shù)據(jù)儲(chǔ)存庫的情況??梢詰?yīng)用隱私防火墻的實(shí)例的非限制性示例包括:從人a推出的將只會(huì)影響人a并且數(shù)據(jù)儲(chǔ)存庫訪問嚴(yán)格受控制的數(shù)據(jù),從人a推出的可以影響人b或者數(shù)據(jù)儲(chǔ)存庫訪問不受嚴(yán)格控制的數(shù)據(jù),可以被映射(比如通過用戶id或互聯(lián)網(wǎng)協(xié)議(ip)地址)至執(zhí)行具體動(dòng)作的用戶的數(shù)據(jù),必須遵守搜索字符串保留策略的數(shù)據(jù)(例如,必須在具體時(shí)間段內(nèi)被移除或去私有化的數(shù)據(jù)),必須遵守隱私標(biāo)準(zhǔn)的數(shù)據(jù),以及被稍微去私有化的數(shù)據(jù)(即,用戶id或ip地址已經(jīng)被移除)。
如在此所使用的,術(shù)語“非私有信息”指包含下述信息的數(shù)據(jù),個(gè)人或?qū)嶓w將將不會(huì)對(duì)所述信息有任何隱私期望。所述非私有信息可以存儲(chǔ)在儲(chǔ)存庫中,其中,儲(chǔ)存庫中所存儲(chǔ)的所有數(shù)據(jù)最初被假定是私有的。這樣,可以確定所述數(shù)據(jù)包含非私有信息。如在此所使用的非私有信息的示意性示例是跨廣泛不同的源非常常用的數(shù)據(jù)。非私有信息的另一示意性示例是不明確地與具體個(gè)人或?qū)嶓w相關(guān)的數(shù)據(jù)。而非私有信息的又另一示意性示例是涉及來自搜索字符串的搜索縮小構(gòu)造的數(shù)據(jù),比如人口統(tǒng)計(jì)、數(shù)據(jù)源、歷史間隔、地理范圍等。非私有信息的又另一示意性示例是涉及非私有網(wǎng)絡(luò)瀏覽活動(dòng)的數(shù)據(jù),比如互聯(lián)網(wǎng)上的任何人輕易可訪問的公開信息、包含數(shù)據(jù)的公開可獲得的電子文件夾等。在一些實(shí)施例中,非私有信息還可以被稱為非敏感數(shù)據(jù)。在一些實(shí)施例中,對(duì)某數(shù)據(jù)是否被視為非私有的判定可以通過應(yīng)用一條或多條規(guī)則完成。
如在此所使用的,術(shù)語“私有數(shù)據(jù)”指包含下述信息的數(shù)據(jù),個(gè)人或?qū)嶓w將將對(duì)所述信息有隱私期望。私有數(shù)據(jù)的示意性示例可以包括但不限于:涉及具體個(gè)人或?qū)嶓w的私人信息的數(shù)據(jù),可以被映射至具體個(gè)人或?qū)嶓w的數(shù)據(jù)(比如包含具體用戶id、ip地址等的數(shù)據(jù)),服從保留策略的數(shù)據(jù),由于具體隱私標(biāo)準(zhǔn)、法規(guī)要求等而被視為私有的數(shù)據(jù)(比如被健康保險(xiǎn)攜帶和責(zé)任法案(hipaa)等視為私有的數(shù)據(jù)),僅可以從具體個(gè)人、實(shí)體、或特定個(gè)人和/或?qū)嶓w分組推出的數(shù)據(jù),可以被聲稱為專有的復(fù)雜數(shù)據(jù),包含大眾普遍未知信息的數(shù)據(jù),以及將允許某人重構(gòu)其中所包含的信息以得到進(jìn)一步智能性(其可能危害具體個(gè)人的或?qū)嶓w的隱私)的數(shù)據(jù)。在一些實(shí)施例中,對(duì)某數(shù)據(jù)是否被視為私有的判定可以通過應(yīng)用一條或多條規(guī)則完成。在一些實(shí)施例中,隱私防火墻后面的儲(chǔ)存庫中所存儲(chǔ)的所有數(shù)據(jù)最初可以被假定為私有數(shù)據(jù),直到它被分析以判定是否包括非私有信息。
即使在此所述的儲(chǔ)存庫中的數(shù)據(jù)最初可以被視為私有的,所述數(shù)據(jù)或從所述私有數(shù)據(jù)推出的附加數(shù)據(jù)的某些部分在此可以被分類為私有數(shù)據(jù)的“非私有元素”。非私有元素的示意性示例可以包括但不限于:已經(jīng)被去私有化的數(shù)據(jù)(比如已經(jīng)讓私人信息被從中移除的數(shù)據(jù)),從具體數(shù)量的唯一位置出現(xiàn)的完全相同的數(shù)據(jù)(比如從具體數(shù)量的唯一ip地址進(jìn)行的搜索),從具體數(shù)量的唯一個(gè)人和/或?qū)嶓w出現(xiàn)的完全相同的數(shù)據(jù),私有儲(chǔ)存庫中所存儲(chǔ)的非私有信息,以及從私有數(shù)據(jù)獲得的非標(biāo)識(shí)性元數(shù)據(jù)。所述非標(biāo)識(shí)性元數(shù)據(jù)可以包括但不限于:生成了所述私有數(shù)據(jù)的個(gè)人或?qū)嶓w的地理區(qū)域(比如,州、省、地區(qū)、或地域,但沒有比這更具體),指示生成數(shù)據(jù)的日期和小時(shí)(而不是分或秒)的時(shí)間戳,與所述私有數(shù)據(jù)相關(guān)的某些搜索詞和連接器,與所述私有數(shù)據(jù)相關(guān)的市場細(xì)分,用來搜索的產(chǎn)品(比如具體網(wǎng)絡(luò)瀏覽器、搜索引擎等),以及搜索引起的來自搜索結(jié)果的命中次數(shù)。如果被公開的數(shù)據(jù)過于具體,用于標(biāo)識(shí)存留在私有儲(chǔ)存庫中的非私有信息的規(guī)則可能不完全保護(hù)用戶隱私。例如,如果常見的搜索字符串被在內(nèi)部公布,但它還包括完成了搜索的用戶的源ip地址,用戶的隱私可能被損害。
關(guān)于用戶數(shù)據(jù),可以存在隱私頻譜。例如,在一個(gè)極端,包括進(jìn)行搜索的個(gè)人名字的完整搜索字符串可以被視為私有和/或敏感數(shù)據(jù)。在另一極端,僅是由于搜索時(shí)用戶在某處使用了字母“e”不意味著另一個(gè)人永遠(yuǎn)不能允許字母“e”出現(xiàn)在所使用和公布的任何事物中。在這兩個(gè)極端之前,可以存在中間立場,在所述中間立場,數(shù)據(jù)不再具有任何類型的隱私暗示。例如,如果10000個(gè)不同用戶輸入了搜索詞“roev.wade”并且然后繼續(xù)瀏覽美國最高法院案例引用410u.s.113,如果提供了當(dāng)用戶開始輸入“roev.”時(shí)直接提出跳轉(zhuǎn)至410u.s.113的用戶界面(ui)特征則很可能不存在對(duì)隱私的侵犯,即使要做到這一點(diǎn)的智能性可能與特定用戶的過去動(dòng)作相關(guān)。
現(xiàn)在參照附圖,圖1根據(jù)在此所示和描繪的實(shí)施例描繪了示意性計(jì)算網(wǎng)絡(luò),所述示意性計(jì)算網(wǎng)絡(luò)描繪了用于提供隱私防火墻的系統(tǒng)的部件,所述系統(tǒng)確定隱私數(shù)據(jù)儲(chǔ)存庫中的非隱私信息,基于所述非隱私信息提供對(duì)問題的響應(yīng),和/或基于所述非隱私信息自動(dòng)完成搜索請(qǐng)求。如圖1所展示的,計(jì)算機(jī)網(wǎng)絡(luò)10可以包括廣域網(wǎng)(wan)(如,互聯(lián)網(wǎng))、局域網(wǎng)(lan)、移動(dòng)通信網(wǎng)絡(luò)、公共服務(wù)電話網(wǎng)絡(luò)(pstn)、個(gè)人局域網(wǎng)(pan)、城域網(wǎng)(man)、虛擬專用網(wǎng)絡(luò)(vpn)和/或其他網(wǎng)絡(luò)。計(jì)算機(jī)網(wǎng)絡(luò)10通??梢员慌渲贸捎糜陔娺B接一個(gè)或多個(gè)計(jì)算設(shè)備和/或其部件。說明性計(jì)算設(shè)備可以包括但不局限于用戶計(jì)算設(shè)備12a、服務(wù)器計(jì)算設(shè)備12b以及管理員計(jì)算設(shè)備12c。
用戶計(jì)算設(shè)備12a通常可以用作用戶與連接至計(jì)算機(jī)網(wǎng)絡(luò)10的其他部件之間的接口。因此,用戶計(jì)算設(shè)備12a可以用于執(zhí)行一個(gè)或多個(gè)面向用戶的功能,如,接收來自用戶的一個(gè)或多個(gè)輸入或者將信息提供給用戶,如本文中更詳細(xì)描述的。另外,包括在圖1中的是管理員計(jì)算設(shè)備12c。在服務(wù)器計(jì)算設(shè)備12b需要監(jiān)督、更新或校正的情況下,管理員計(jì)算設(shè)備12c可以被配置成用于提供所期望的監(jiān)督、更新、和/或校正。管理員計(jì)算設(shè)備12c還可以用于將附加數(shù)據(jù)輸入到存儲(chǔ)在服務(wù)器計(jì)算機(jī)設(shè)備12b上的語料庫中。
服務(wù)器計(jì)算設(shè)備12b可以從一個(gè)或多個(gè)源接收數(shù)據(jù),存儲(chǔ)所述數(shù)據(jù),并將來自所述數(shù)據(jù)的某些部分的信息以對(duì)問題的答案或自動(dòng)完成建議的形式提供給用戶計(jì)算設(shè)備12a(當(dāng)對(duì)這種信息的訪問被授權(quán)并且所述信息被標(biāo)記為被允許分發(fā)時(shí))。對(duì)所述信息是否被允許分發(fā)的判定一般可以由隱私防火墻14完成,所述隱私防火墻位于所述服務(wù)器計(jì)算設(shè)備12b與所述計(jì)算機(jī)網(wǎng)絡(luò)10之間。因而,所述隱私防火墻14(還可以被稱為隱私罩)可以允許或拒絕對(duì)來自所述服務(wù)器計(jì)算設(shè)備12b處存儲(chǔ)的數(shù)據(jù)的某信息的訪問,如在此更詳細(xì)描述的。
應(yīng)當(dāng)理解的是,雖然用戶計(jì)算設(shè)備12a和管理員計(jì)算設(shè)備12c被描繪為個(gè)人計(jì)算機(jī)并且服務(wù)器計(jì)算設(shè)備12b被描繪為服務(wù)器,但是這些是非限制性示例。更確切地,在一些實(shí)施例中,任何類型的計(jì)算設(shè)備(例如,移動(dòng)計(jì)算設(shè)備、個(gè)人計(jì)算機(jī)、服務(wù)器等)可以用于這些部件中的任何部件。另外,雖然這些計(jì)算設(shè)備中的每個(gè)計(jì)算設(shè)備在圖1中被展示為單件硬件,但是這也僅是示例。更確切地,用戶計(jì)算設(shè)備12a、服務(wù)器計(jì)算設(shè)備12b和管理員計(jì)算設(shè)備12c中的每一個(gè)可以表示多個(gè)計(jì)算機(jī)、服務(wù)器、數(shù)據(jù)庫、部件和/或類似物。
圖2描繪了來自圖1的服務(wù)器計(jì)算設(shè)備12b,進(jìn)一步展示了一種用于確定非私有信息、搜索文檔語料庫、生成對(duì)用戶所提出問題的響應(yīng)、和/或生成自動(dòng)完成建議的系統(tǒng)。另外,根據(jù)在此所示和描述的實(shí)施例,服務(wù)器計(jì)算設(shè)備12b可以包括非瞬態(tài)計(jì)算機(jī)可讀介質(zhì),以用于搜索文檔語料庫或生成被具體化為硬件、軟件、和/或固件的搜索查詢。雖然在一些實(shí)施例中,服務(wù)器計(jì)算設(shè)備12b可以被配置為具有必要硬件、軟件、和/或固件的通用計(jì)算機(jī),但是在一些實(shí)施例中,所述服務(wù)器計(jì)算設(shè)備12b還可以被配置為用于執(zhí)行本文所描述的功能而專門設(shè)計(jì)的專用計(jì)算機(jī)。
還如圖2所展示的,服務(wù)器計(jì)算設(shè)備12b可以包括處理器30、輸入/輸出硬件32、網(wǎng)絡(luò)接口硬件34、數(shù)據(jù)存儲(chǔ)部件36(其可以存儲(chǔ)非私有信息38a、私有數(shù)據(jù)38b的非私有元素、以及其他數(shù)據(jù)38c)、以及非瞬態(tài)存儲(chǔ)器部件40。存儲(chǔ)器部件40可以被配置為易失性和/或非易失性計(jì)算機(jī)可讀介質(zhì),并且如此,可以包括隨機(jī)存取存儲(chǔ)器(包括sram、dram、和/或其他類型的隨機(jī)存取存儲(chǔ)器)、閃存、寄存器、cd盤(cd)、數(shù)字通用盤(dvd)、和/或其他類型的存儲(chǔ)部件。另外,存儲(chǔ)器部件40可以被配置成用于存儲(chǔ)操作邏輯42和搜索邏輯44(作為示例,所述邏輯中的每個(gè)邏輯可以被具體化為計(jì)算機(jī)程序、固件、或硬件)。本地接口46也包括在圖2中并且可以被實(shí)現(xiàn)為總線或其他接口以便促進(jìn)在服務(wù)器計(jì)算設(shè)備12b的部件之中的通信。
處理器30可以包括被配置成用于接收和執(zhí)行指令(如,來自數(shù)據(jù)存儲(chǔ)部件36和/或存儲(chǔ)器部件40)的任何處理部件。輸入/輸出硬件32可以包括監(jiān)視器、鍵盤、鼠標(biāo)、打印機(jī)、相機(jī)、麥克風(fēng)、揚(yáng)聲器、觸摸屏、和/或用于接收、發(fā)送和/或呈現(xiàn)數(shù)據(jù)的其他設(shè)備。網(wǎng)絡(luò)接口硬件34可以包括任何有線或無線聯(lián)網(wǎng)硬件,如,調(diào)制解調(diào)器、lan端口、無線保真(wi-fi)卡、wimax卡、移動(dòng)通信硬件、和/或用于與其他網(wǎng)絡(luò)和/或設(shè)備進(jìn)行通信的其他硬件。
應(yīng)當(dāng)理解的是,數(shù)據(jù)存儲(chǔ)部件36可以在服務(wù)器計(jì)算設(shè)備12b本地和/或遠(yuǎn)離服務(wù)器計(jì)算設(shè)備而駐留并且可以被配置成用于存儲(chǔ)一條或多條數(shù)據(jù)并且選擇性地提供對(duì)所述一條或多條數(shù)據(jù)的訪問。如圖2中所展示的,數(shù)據(jù)存儲(chǔ)部件36可以存儲(chǔ)非私有信息38a、私有數(shù)據(jù)38b的非私有元素、以及其他數(shù)據(jù)38c,如在此更詳細(xì)描述的。
包括在存儲(chǔ)器部件40中的是操作邏輯42和搜索邏輯44。操作邏輯42可以包括操作系統(tǒng)和/或用于管理服務(wù)器計(jì)算設(shè)備12b的部件的其他軟件。搜索邏輯44可以被配置成用于從圖形用戶界面內(nèi)的用戶輸入生成搜索查詢,如下面詳細(xì)描述的。
應(yīng)當(dāng)理解的是,圖2中所展示的部件僅是說明性的并且不旨在限制本公開的范圍。更具體地,雖然圖2中的部件被展示為駐留在服務(wù)器計(jì)算設(shè)備12b內(nèi),但是這是非限制性示例。在一些實(shí)施例中,所述部件中的一個(gè)或多個(gè)部件可以駐留在服務(wù)器計(jì)算設(shè)備12b外部。類似地,雖然圖2涉及服務(wù)器計(jì)算設(shè)備12b,但是其他部件(諸如用戶計(jì)算設(shè)備12a和管理員計(jì)算設(shè)備12c)可以包括相似的硬件、軟件和/或固件。
圖3描繪了來自圖1的隱私防火墻14的各個(gè)層。圖3中所描繪的這些層僅是示意性的。因而,可以在不偏離本公開的范圍的情況下,使用更少或額外的層。另外,某些層可以倒塌或進(jìn)一步被分層為額外的層。每一層可以表示服務(wù)器計(jì)算設(shè)備12b(圖1)中所包含的被提供給外部請(qǐng)求者(比如像用戶計(jì)算設(shè)備12a的用戶(圖1))的數(shù)據(jù)的訪問量。所述訪問一般可以是對(duì)用戶所提出的問題的答案的形式或作為自動(dòng)完成建議,而非對(duì)數(shù)據(jù)的直接訪問。示意性層可以包括例如分布式源層20、聚合層22、隱私執(zhí)行層24、以及任務(wù)特定的數(shù)據(jù)提供者層26。在一些實(shí)施例中,所述分布式源層20、所述聚合層22、所述隱私執(zhí)行層24可以是高度限制性數(shù)據(jù)層,在這些層中,在不對(duì)數(shù)據(jù)進(jìn)行調(diào)整的情況下此類層所分類的數(shù)據(jù)幾乎不或不允許被訪問,如在此更詳細(xì)描述的。在一些實(shí)施例中,任務(wù)特定的數(shù)據(jù)提供者層26可以是低限制性數(shù)據(jù)層,在此層中,允許訪問被所述層分類的更多或全部數(shù)據(jù)。
分布式源層20可以對(duì)通常在例如消費(fèi)者會(huì)話活動(dòng)源中找到的數(shù)據(jù)進(jìn)行分類。此類消費(fèi)者會(huì)話活動(dòng)源可以表示多個(gè)不同平臺(tái)和/或應(yīng)用上存在的多個(gè)源,從所述多個(gè)不同平臺(tái)和/或應(yīng)用接收并存儲(chǔ)數(shù)據(jù)。作為非限制性示例,一個(gè)源可以是具體程序或應(yīng)用的搜索框。來自不同源的數(shù)據(jù)可以被存儲(chǔ)在不同數(shù)據(jù)儲(chǔ)存庫中。某些數(shù)據(jù)儲(chǔ)存庫可以比其他數(shù)據(jù)儲(chǔ)存庫具有更多數(shù)據(jù)限制。這樣,不能跨所述不同儲(chǔ)存庫對(duì)所述數(shù)據(jù)進(jìn)行規(guī)范化。
聚合層22可以對(duì)通常在例如規(guī)范化的數(shù)據(jù)儲(chǔ)存庫中找到的數(shù)據(jù)進(jìn)行分類。即,所述數(shù)據(jù)可以是從各數(shù)據(jù)儲(chǔ)存庫獲得的,各自具有對(duì)應(yīng)的本來格式,并被一個(gè)或多個(gè)規(guī)范化工具(“規(guī)范器”)規(guī)范化成單一一致的格式。在一些實(shí)施例中,當(dāng)數(shù)據(jù)被規(guī)范化時(shí),可以盡可能實(shí)用地對(duì)其進(jìn)行規(guī)范化,從而使得數(shù)據(jù)中所包含的敏感信息是量被最小化。然而,在一些實(shí)施例中,所述儲(chǔ)存庫可以包含對(duì)某些模塊足夠的常見且一致屬性集合,并且在提出具體查詢(即,涉及所述數(shù)據(jù)的查詢)之前完全匿名化是不可能的。因而,盡管匿名化,所述儲(chǔ)存庫中所包含的數(shù)據(jù)仍然可能是高度敏感的。相應(yīng)地,對(duì)這種數(shù)據(jù)的訪問會(huì)高度受限。
隱私執(zhí)行層24可以對(duì)已經(jīng)經(jīng)過任務(wù)特定的報(bào)告器和殺毒器模塊的數(shù)據(jù)進(jìn)行分類。如果以某種方式提出了查詢,這種數(shù)據(jù)可以是例如包含敏感信息的經(jīng)規(guī)范化數(shù)據(jù)。例如,通過以多種不同方式問多個(gè)問題并使用布爾代數(shù)運(yùn)算理出比旨在揭露的更多數(shù)據(jù),可以將隱私罩沖破。因而,可以期望嚴(yán)格地限制為了獲得一定信息而可以提的問題類型,并且還保證被揭露的各種各樣問題不能將其答案組合以泄露信息。因此,向隱私防火墻14提出的每次查詢可以具有被創(chuàng)造用來傳遞結(jié)果的特定模塊。每個(gè)特定模塊可以在高度受限的環(huán)境中被審查和建立,從而使得所述模塊充當(dāng)用于將敏感數(shù)據(jù)轉(zhuǎn)化成非敏感數(shù)據(jù)的橋梁。
所述任務(wù)特定的數(shù)據(jù)提供者層26一般可以包括信息的任務(wù)特定的公共儲(chǔ)存庫,所述信息通常是非私有的被去敏感化的私有數(shù)據(jù)、或私有數(shù)據(jù)的非私有元素。這種數(shù)據(jù)可以用來回答查詢。
現(xiàn)在參照?qǐng)D4,提供了流程圖,所述流程圖展示了根據(jù)一個(gè)或多個(gè)實(shí)施例的實(shí)現(xiàn)隱私防火墻的方法。如在此更詳細(xì)描述的,實(shí)施例可以使用戶能夠請(qǐng)求信息并瀏覽非私有信息和/或隱私信息的非私有元素。在框180,所述系統(tǒng)可以生成圖形用戶界面,用于在用戶計(jì)算設(shè)備12a的顯示設(shè)備上顯示。所述圖形用戶界面被配置成使得用戶可以在框182發(fā)送搜索字符串。參照?qǐng)D5,所述圖形用戶界面可以包括被配置成用于從用戶接收搜索字符串的搜索字符串輸入屏幕100。應(yīng)該理解的是,實(shí)施例并不限于貫穿附圖中所展示的圖形用戶界面的配置,并且其他圖形用戶界面配置是可能的。在一個(gè)實(shí)施例中,網(wǎng)絡(luò)10是互聯(lián)網(wǎng)(internet),并且在此所述的圖形用戶界面被通過瀏覽器呈現(xiàn)給所述用戶。
所述搜索字符串輸入屏幕100包括搜索字符串字段103,用戶可以將組成期望搜索字符串的一個(gè)或多個(gè)詞語輸入所述搜索字符串字段(例如,通過使用鍵盤)。在一個(gè)實(shí)施例中,所述搜索字符串可以是自然語言搜索字符串。例如,用戶可以問比如像“最高法院關(guān)于墮胎的標(biāo)志性案例是什么?”的問題。在另一示例中,比如圖5中所展示的實(shí)施例,搜索字符串“roev.wade”被輸入搜索字段103,因?yàn)榫唧w用戶可能對(duì)搜索與來自1973年的美國最高法院判決有關(guān)的信息。如圖6中所示,在一些實(shí)施例中,用戶可能僅需要在搜索字符串字段103輸入一個(gè)或多個(gè)字母,并且所述系統(tǒng)可以基于從服務(wù)器計(jì)算設(shè)備12b內(nèi)所包含的私有數(shù)據(jù)儲(chǔ)存庫獲得的數(shù)據(jù)生成建議的自動(dòng)完成選項(xiàng)。例如,如果用戶正在搜索案例法數(shù)據(jù)庫,當(dāng)用戶輸入字母“ro”時(shí),包含字母“ro”的某些自動(dòng)完成選項(xiàng)可以被呈現(xiàn)給用戶,比如像roev.wade、inreross等,如下面所示搜索字符串字段104中用戶的輸入。可以例如由于指示許多用戶已經(jīng)搜索了那些具體案件(可以可選地按照受歡迎程度排序)的數(shù)據(jù)而生成自動(dòng)完成建議。因而,在用戶完成輸入搜索字符串之前,系統(tǒng)可以試圖基于服務(wù)器計(jì)算設(shè)備12b中所包含的私有數(shù)據(jù)猜想用戶可能想要搜索什么。然而,所獲得的用于提供自動(dòng)完成建議的信息一般可以是非私有信息和/或私有數(shù)據(jù)的非私有元素,從而使得可能破壞他人隱私的詞語不包括在自動(dòng)完成選項(xiàng)中。
如圖5和圖6中所示,搜索字符串輸入屏幕100還可以包括其他輸入特征,比如選項(xiàng)按鈕106、章節(jié)過濾輸入102、和搜索發(fā)起圖標(biāo)105。應(yīng)該理解的是,可以使用更多或更少的輸入特征。在圖5和圖6中所展示的示例中,選項(xiàng)按鈕106允許用戶同樣搜索并非用用戶正搜索的語料庫的本機(jī)語言的電子數(shù)據(jù)的機(jī)器翻譯。還可以提供其他選項(xiàng)。章節(jié)過濾輸入102可以使用戶能夠只搜索數(shù)據(jù)的具體章節(jié)或章節(jié)組合。例如,在案例法背景下,用戶可以使用章節(jié)過濾輸入102來只搜索案例綜述章節(jié)、關(guān)鍵詞章節(jié)、司法意見章節(jié)、事實(shí)章節(jié)等。
用戶可以通過電擊或另外選擇搜索發(fā)起圖標(biāo)105來基于被輸入搜索字符串字段103的搜索字符串來發(fā)起搜索。搜索字符串中的單個(gè)詞語被用作查詢詞語來在框184分析搜索字符串。分析搜索字符串總體上可以包括確定用戶在搜索什么,這可以通過任何現(xiàn)在已知或以后開發(fā)的方法完成。在一些實(shí)施例中,在框186中可以基于用戶的提交的搜索字符串確定合適的搜索查詢。即,用戶所提交的搜索字符串可以被接收并解釋,并且可以基于有待訪問的數(shù)據(jù)包含所述數(shù)據(jù)的系統(tǒng)的類型等生成合適的搜索查詢。所述合適的搜索查詢可以使用任何數(shù)量的查詢生成技術(shù)生成。例如,可以基于對(duì)用戶所提交的搜索字符串的分析生成布爾加權(quán)搜索查詢。
在框188中,可以對(duì)防火墻14后面的儲(chǔ)存庫中(比如服務(wù)器計(jì)算設(shè)備12b中)所包含的數(shù)據(jù)進(jìn)行搜索。如果發(fā)現(xiàn)了與搜索查詢有關(guān)的數(shù)據(jù),可以對(duì)所述數(shù)據(jù)進(jìn)行分析從而在步驟190中判定所述數(shù)據(jù)是私有還是非私有。在一些實(shí)施例中,可以進(jìn)一步分析所述私有數(shù)據(jù)從而在步驟192中判定它是否包含非私有元素。另外,可以對(duì)所述私有數(shù)據(jù)進(jìn)行分析從而在步驟194中判定某些元素是否可以被調(diào)整以使這些元素成為非私有元素。如果所述數(shù)據(jù)可以被調(diào)整,這種調(diào)整可以在步驟196中完成從而獲得經(jīng)調(diào)整的數(shù)據(jù)(還可以被稱為已去私有化的數(shù)據(jù))。例如,可以對(duì)所述數(shù)據(jù)進(jìn)行調(diào)整從而調(diào)整時(shí)間戳和日期戳的粒度(granularity),調(diào)整地理位置的粒度等。在一些實(shí)施例中,可以在具體粒度閾值以上調(diào)整所述粒度。地理粒度閾值可以例如在州或省與城市之間(例如,閾值“以上”可以是州、省、國家、地區(qū)等粒度,并且閾值“以下”可以是附加細(xì)節(jié)比如城市、街道地址等)。時(shí)間粒度閾值可以在例如時(shí)間與分之間(例如,以小時(shí)、天、星期、月、和年顯示的時(shí)間可以在閾值“以上”,而以分鐘和秒顯示的時(shí)間可以在閾值“以下”)。在一些實(shí)施例中,可以針對(duì)每次搜索查詢完成步驟190、192、194、和196。在其他實(shí)施例中,一旦在儲(chǔ)存庫中獲得了數(shù)據(jù)就可以完成步驟190、192、194、和196,從而允許快速地完成步驟188中的搜索。
搜索查詢的查詢詞語用來搜索數(shù)據(jù)語料庫,從而在步驟198中提供對(duì)搜索字符串的響應(yīng)。所述響應(yīng)總體上是從非私有信息和/或私有數(shù)據(jù)的非私有元素(包括私有數(shù)據(jù)的經(jīng)調(diào)整部分(如果存在的話))推出的。所述響應(yīng)可以是對(duì)用戶所提問題進(jìn)行響應(yīng)的自然語言答案、到具體參考的一個(gè)或多個(gè)鏈接、供顯示的已返回電子文檔集合等。
再次參照?qǐng)D1,在各實(shí)施例中,服務(wù)器計(jì)算設(shè)備12b可以繼續(xù)收集新數(shù)據(jù)(當(dāng)生成新數(shù)據(jù)和/或使得新數(shù)據(jù)可用時(shí))??梢詫?duì)所述新數(shù)據(jù)進(jìn)行分析,從而使得可以關(guān)于所述數(shù)據(jù)是否包含私有或敏感數(shù)據(jù)進(jìn)行判定,從而使得不允許私有或敏感信息越過防火墻14,如在此所述的。因而,圖7中描繪了用于對(duì)所述數(shù)據(jù)進(jìn)行分析和分類的過程。
如圖7中所示,并且還參照?qǐng)D1,在步驟202中可以從儲(chǔ)存庫獲得所述數(shù)據(jù)。例如,在一些實(shí)施例中,所述數(shù)據(jù)可以被從遠(yuǎn)端儲(chǔ)存庫拷貝或移動(dòng)至防火墻14后面的服務(wù)器計(jì)算設(shè)備12b。在其他實(shí)施例中,所述儲(chǔ)存庫可以位于服務(wù)器計(jì)算設(shè)備12b內(nèi)(例如,數(shù)據(jù)存儲(chǔ)設(shè)備36中(圖2))或另外防火墻14后面,從而使得拷貝或轉(zhuǎn)移是不必要的。
如在此所述的,所述數(shù)據(jù)可以最初被假定為私有數(shù)據(jù)。在步驟204中,可以對(duì)所述數(shù)據(jù)進(jìn)行分析從而在步驟206中判定所述數(shù)據(jù)是否包含非私有信息。如果所述數(shù)據(jù)不不含任何可能私有的部分,所述數(shù)據(jù)可以被標(biāo)識(shí)為非私有信息并且可以在步驟208中被標(biāo)識(shí)為允許在隱私防火墻14外部私用。例如,如果所述數(shù)據(jù)單單包含公開可獲得的信息比如未密封的法庭記錄、公開可獲得的真實(shí)財(cái)產(chǎn)記錄等,所述數(shù)據(jù)可以在步驟206中被確定為不包含私有數(shù)據(jù)并且在步驟208中被標(biāo)記為允許在隱私防火墻14外部使用。
另一方面,如果所述數(shù)據(jù)的任何一部分包含敏感、私有、或可以被看做敏感或私有的信息,所述數(shù)據(jù)可以繼續(xù)被標(biāo)識(shí)為私有數(shù)據(jù)。例如,如果所述數(shù)據(jù)包含法庭記錄,但所述法庭記錄包含隱私信息比如個(gè)人的家庭地址,所述數(shù)據(jù)可以被標(biāo)識(shí)為私有信息。
如圖8中所示,對(duì)所述數(shù)據(jù)是否包含非私有信息的判定可以包括多個(gè)判定步驟。此類步驟僅僅是示意性的,并且應(yīng)該理解的是,在不背離本公開范圍的情況下可以完成替代、附加、或更少步驟。進(jìn)一步,應(yīng)該理解的是,實(shí)施例并不限于如圖8中所示的這個(gè)步驟順序。如步驟206a中所示,一個(gè)示意性步驟,可以關(guān)于所述數(shù)據(jù)是否是從位于已排除列表上的源收集的進(jìn)行判定。示意性已排除列表可以包括例如包含由以下各項(xiàng)指定為私有的信息的列表:hipaa、衛(wèi)生保健互操作性測試和一致性協(xié)調(diào)(hitch)工程、駕駛員隱私保護(hù)法案(dppa)、格雷姆-里奇-比利雷法案(glba)(還被稱為1999年金融服務(wù)現(xiàn)代化法案)、支付卡行業(yè)數(shù)據(jù)安全標(biāo)準(zhǔn)(pcidss)等。如果所述數(shù)據(jù)是從已排除列表上的源收集的,可以在步驟209中將所述數(shù)據(jù)標(biāo)識(shí)為私有。如果所述數(shù)據(jù)不是從已排除列表上的源收集的,可以完成附加確定步驟,或者所述數(shù)據(jù)可以在步驟207中被標(biāo)識(shí)為包含非私有信息并且在步驟208中被標(biāo)記為允許在隱私防火墻外部使用。
在示意性步驟206b中,可以關(guān)于是否在其他位置出現(xiàn)了完全相同的數(shù)據(jù)進(jìn)行判定。例如,如果關(guān)于在搜索引擎界面輸入的具體搜索字符串收集了數(shù)據(jù),步驟206b中的確定可以看看是否從另一位置輸入了相同的搜索字符串。可以通過回顧元數(shù)據(jù)等來確定位置。例如,關(guān)于具體搜索查詢的元數(shù)據(jù)可以包括用來在搜索引擎界面輸入搜索字符串的設(shè)備的ip地址。如果不同的ip地址輸入了完全相同的搜索查詢,并且此類ip地址組成不同位置(即,并非源自同一物理位置的ip地址),可以確定所述數(shù)據(jù)已經(jīng)在其他位置出現(xiàn)。如果所述數(shù)據(jù)未出現(xiàn)在其他位置,可以在步驟209中將所述數(shù)據(jù)標(biāo)識(shí)為私有。如果所述數(shù)據(jù)出現(xiàn)在了其他位置,可以完成附加確定步驟,或者所述數(shù)據(jù)可以在步驟207中被標(biāo)識(shí)為包含非私有信息并且在步驟208中被標(biāo)記為允許在隱私防火墻外部使用。
在示意性步驟206c中,可以關(guān)于是否從至少20個(gè)不同的源獲得了所述數(shù)據(jù)進(jìn)行判定。例如,如果所述數(shù)據(jù)包含指示數(shù)據(jù)的源(例如,ip地址等)的元數(shù)據(jù),所述確定可以包括回顧所述元數(shù)據(jù)以保證所述數(shù)據(jù)是從20個(gè)不同源獲得的。應(yīng)該理解的是,在此所使用的源數(shù)量(20)僅僅是示意性的,并且可以限定任何源數(shù)量,尤其是保證所述數(shù)據(jù)并非私有的源的數(shù)量。例如,源個(gè)數(shù)可以基于數(shù)據(jù)的類型、關(guān)于所述數(shù)據(jù)的某些規(guī)則或策略等而不同。如果所述數(shù)據(jù)未從至少20個(gè)不同源出現(xiàn),可以在步驟209中將所述數(shù)據(jù)標(biāo)識(shí)為私有。如果所述數(shù)據(jù)從至少20個(gè)不同源出現(xiàn),可以完成附加確定步驟,或者所述數(shù)據(jù)可以在步驟207中被標(biāo)識(shí)為包含非私有信息并且在步驟208中被標(biāo)記為允許在隱私防火墻外部使用。
在示意性步驟206d中,可以關(guān)于所述數(shù)據(jù)是否包含已經(jīng)是公共知識(shí)的信息進(jìn)行判定。例如,如果所述數(shù)據(jù)包含將一般地為私有的信息比如個(gè)人的家庭地址,但這個(gè)人已經(jīng)公開地廣播了他的家庭地址從而為他在他的家以外經(jīng)營的業(yè)務(wù)做廣告,這種信息可以被視為已經(jīng)是公共知識(shí)。如果所述數(shù)據(jù)包含還不是公共知識(shí)的信息,可以在步驟209中將所述數(shù)據(jù)標(biāo)識(shí)為私有。如果所述數(shù)據(jù)包含已經(jīng)是公共知識(shí)的信息,可以完成附加確定步驟,或者所述數(shù)據(jù)可以在步驟207中被標(biāo)識(shí)為包含非私有信息并且在步驟208中被標(biāo)記為允許在隱私防火墻外部使用。
在示意性步驟206e中,可以關(guān)于所述數(shù)據(jù)是否足夠復(fù)雜以被聲稱為專有的進(jìn)行判定。數(shù)據(jù)的復(fù)雜度可以基于數(shù)據(jù)的本質(zhì)、數(shù)據(jù)源的本質(zhì)、收集數(shù)據(jù)的背景、以及與數(shù)據(jù)的提供者達(dá)成的任何協(xié)議(例如,詞語使用協(xié)議)逐個(gè)案例地進(jìn)行。例如,如果實(shí)體開發(fā)了可以被聲稱為專有(比如像商業(yè)秘密)的復(fù)雜算法并且所述算法出現(xiàn)在數(shù)據(jù)中,至少所述數(shù)據(jù)的包含所述算法的那部分可以被視為私有的。在另一示例中,如果實(shí)體輸入了被非常狹義地理解的和/或唯一的搜索字符串,所述搜索字符串可以被視為復(fù)雜的。相應(yīng)地,如果所述數(shù)據(jù)被確定為足夠復(fù)雜以被聲稱為專有的,所述數(shù)據(jù)可以在步驟209中被標(biāo)識(shí)為私有數(shù)據(jù)。如果所述數(shù)據(jù)不足夠復(fù)雜以被聲稱為專有的,可以完成附加確定步驟,或者所述數(shù)據(jù)可以在步驟207中被標(biāo)識(shí)為包含非私有信息并且在步驟208中被標(biāo)記為允許在隱私防火墻外部使用。
在示意性步驟206f中,可以關(guān)于所述數(shù)據(jù)是否包含精確的時(shí)間戳進(jìn)行判定。例如,如果所述數(shù)據(jù)涉及具有精確時(shí)間戳的搜索字符串(所述時(shí)間戳可以允許我們對(duì)進(jìn)行了所述搜索的個(gè)人或?qū)嶓w進(jìn)行標(biāo)識(shí)),所述數(shù)據(jù)可以是私有的。除非所述數(shù)據(jù)被適當(dāng)?shù)卣{(diào)整以如在此所述的調(diào)整時(shí)間戳的粒度(例如,不比搜索字符串被輸入的時(shí)間更具體),所述數(shù)據(jù)在步驟209中可以被標(biāo)識(shí)為私有。如果所述數(shù)據(jù)不包含精確時(shí)間戳,或如果它已經(jīng)被適當(dāng)?shù)卣{(diào)整,可以完成附加確定步驟,或者所述數(shù)據(jù)可以在步驟207中被標(biāo)識(shí)為包含非私有信息并且在步驟208中被標(biāo)記為允許在隱私防火墻外部使用。
在示意性步驟206g中,可以關(guān)于所述數(shù)據(jù)是否包含可識(shí)別序列進(jìn)行判定??勺R(shí)別序列一般可以是數(shù)據(jù)串序列,所述數(shù)據(jù)串當(dāng)被一起觀察時(shí)包含應(yīng)該私有的信息,即使孤立的所述數(shù)據(jù)串將不被視為私有。例如,如果所述數(shù)據(jù)包含可以允許我們確定與所述數(shù)據(jù)相關(guān)聯(lián)的個(gè)人實(shí)體或數(shù)據(jù)的序列,這種數(shù)據(jù)可以在步驟209中被標(biāo)識(shí)為私有數(shù)據(jù)。在另一示例中,如果實(shí)體使用詞語“用于基于制造的集體訴訟的有利法庭”、“制作刮板小部件的公司”、“康涅狄格(connecticut)州內(nèi)的公司”、以及“被準(zhǔn)入康涅狄格的急診室進(jìn)行切割的個(gè)人”進(jìn)行4次后續(xù)搜索,可以推出所述實(shí)體是考慮對(duì)康涅狄格的刮板小部件制造商提交集體訴訟的律師或法律事務(wù)所,這可以組成私有信息,即使所述搜索字符串單獨(dú)地不會(huì)泄露這種信息并且可以不是私有。如果所述數(shù)據(jù)不包含任何可以用來標(biāo)識(shí)與所述數(shù)據(jù)相關(guān)聯(lián)的個(gè)人或?qū)嶓w的序列,可以完成附加確定步驟,或者所述數(shù)據(jù)可以在步驟207中被標(biāo)識(shí)為包含非私有信息并且在步驟208中被標(biāo)記為允許在隱私防火墻外部使用。
再次參照?qǐng)D7,在步驟210中,可以關(guān)于所述私有數(shù)據(jù)是否包含非私有元素進(jìn)行判定。即,如果所述私有數(shù)據(jù)具有某些當(dāng)孤立時(shí)將組成非私有信息的部分,這種私有數(shù)據(jù)可以被標(biāo)識(shí)為包含私有部分并且在步驟214中可以從中提取所述非私有元素。如本文之前所述的,可以提取非私有元素,其方式為使得不能從非私有元素搜集私有信息。例如,如果非私有元素是可以從私有數(shù)據(jù)提取的元數(shù)據(jù),這種元數(shù)據(jù)必須在范圍上被限制(例如,用戶的地理位置不能比用戶所在的州、地域、省等有任何更具體)。所述非私有元素在被提取時(shí)可以在步驟216中被標(biāo)記為被允許在隱私防火墻14外部使用。如果所述數(shù)據(jù)不包含非私有元素,所述數(shù)據(jù)可以在步驟212中被標(biāo)記為被拒絕的數(shù)據(jù),不通過隱私防火墻14提供對(duì)所述被拒絕的數(shù)據(jù)的訪問。
應(yīng)該理解的是,在此所述的實(shí)施例提供了用于提供隱私防火墻的系統(tǒng)和方法,所述隱私防火墻允許對(duì)私有數(shù)據(jù)的訪問而不破壞(生成所述數(shù)據(jù)的)個(gè)人或?qū)嶓w的隱私。此處的系統(tǒng)和方法的本質(zhì)允許用戶提問題或輸入搜索字符串,所述問題或搜索字符串可能需要私有數(shù)據(jù)訪問以獲得答案。所述用戶然后可以接收對(duì)所述問題的響應(yīng)或可以被提供自動(dòng)完成建議,而從不獲得對(duì)私有數(shù)據(jù)儲(chǔ)存庫的訪問。
雖然在此已經(jīng)展示和描述了特定實(shí)施例,但應(yīng)當(dāng)理解的是,在不脫離所要求保護(hù)的主題的精神和范圍的情況下,可作出各種其他變化和修改。此外,盡管在此已經(jīng)描述了所要求保護(hù)的主題的各方面,但這些方面無需以組合使用。因此,本發(fā)明旨在所附權(quán)利要求書涵蓋所有此類落入所要求保護(hù)的主題的范圍內(nèi)的變化和修改。