用于對(duì)用戶興趣簡檔的隱私保護(hù)聚集的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本主題涉及個(gè)性化服務(wù)和數(shù)據(jù)分析,并且特別地但是不排他地,涉及在將用戶興 趣簡檔聚集用于個(gè)性化服務(wù)和數(shù)據(jù)分析時(shí)對(duì)終端用戶的隱私保護(hù)。
【背景技術(shù)】
[0002] 由于巨大量的內(nèi)容通過萬維網(wǎng)是可用的,接入由服務(wù)提供者提供的內(nèi)容的終端用 戶經(jīng)常由服務(wù)提供商、搜索引擎、web發(fā)布商、以及廣告商提供個(gè)性化的協(xié)助和數(shù)據(jù)分析,以 便容易地接入相關(guān)內(nèi)容。常規(guī)地,使用各種技術(shù)(諸如基于內(nèi)容的推薦、協(xié)同推薦、以及數(shù) 據(jù)分析)向終端用戶提供個(gè)性化的服務(wù)。在基于內(nèi)容的推薦中,向終端用戶推薦如下的內(nèi) 容、服務(wù)或產(chǎn)品,這些內(nèi)容、服務(wù)或產(chǎn)品類似于終端用戶在過去使用或喜歡的內(nèi)容、服務(wù)或 產(chǎn)品或者匹配于終端用戶的興趣或選擇。在協(xié)同推薦中,向終端用戶推薦如下的內(nèi)容、服務(wù) 或產(chǎn)品,這些內(nèi)容、服務(wù)或產(chǎn)品類似于由具有類似或相同興趣或選擇的其他終端用戶所使 用或喜歡的內(nèi)容、服務(wù)或產(chǎn)品。
[0003] 在基于內(nèi)容的推薦的一個(gè)示例中,電影評(píng)論網(wǎng)站可以監(jiān)測(cè)到終端用戶定期地觀看 某個(gè)種類的電影,例如動(dòng)畫電影。相應(yīng)地,每次動(dòng)畫電影可用于觀看時(shí),可以向該終端用戶 提供推薦,諸如通知或警報(bào),例如以通過進(jìn)行相關(guān)支付來下載該電影。類似地,在協(xié)同推薦 (也稱為協(xié)同過濾)中,服務(wù)提供商可以向終端用戶提供有目標(biāo)的廣告,其中這些廣告屬于 由其他終端用戶所偏好的產(chǎn)品或服務(wù),這些其他終端用戶具有與該終端用戶類似和興趣和 偏好。例如,如果電視節(jié)目或者電影已經(jīng)由其興趣與終端用戶的興趣相匹配的其他終端用 戶所觀看,則互聯(lián)網(wǎng)協(xié)議電視(IPTV)服務(wù)提供商可以向該終端用戶推薦這些電視節(jié)目或 者電影。
[0004] 進(jìn)一步地,用戶需要將他們的人員數(shù)據(jù)提供給服務(wù)提供商用于執(zhí)行數(shù)據(jù)分析應(yīng) 用,例如,以用于數(shù)據(jù)挖掘的目的。在用于數(shù)據(jù)分析以及由服務(wù)提供商向終端用戶供應(yīng)相關(guān) 內(nèi)容的所有這些技術(shù)中,現(xiàn)今的用戶日益地關(guān)心他們的個(gè)人的并且可能是敏感的信息。這 主要是因?yàn)椋瑸榱藦膫€(gè)性化服務(wù)中受益并且促進(jìn)數(shù)據(jù)分析,終端用戶不得不透露敏感信息, 但是同時(shí),他們關(guān)心對(duì)信息的隱私保護(hù)。例如,社交聯(lián)網(wǎng)站點(diǎn)的終端用戶可能不反對(duì)使用他 接入社交聯(lián)網(wǎng)站點(diǎn)的信息來向其他終端用戶并且向他自己進(jìn)行與像這樣的社交聯(lián)網(wǎng)站點(diǎn) 上的更新有關(guān)的匿名推薦,但是該終端用戶可能不想要其他實(shí)體(諸如其他終端用戶、月艮 務(wù)提供商、攻擊者和惡意方)知道該終端用戶訪問或評(píng)價(jià)的特定URL。
【發(fā)明內(nèi)容】
[0005] 本概述被提供以介紹與在將終端用戶聚集用于提供個(gè)性化服務(wù)并且執(zhí)行數(shù)據(jù)分 析應(yīng)用時(shí)的隱私保護(hù)有關(guān)的概念。本概述不意圖為識(shí)別被權(quán)利要求的主題的至關(guān)重要的特 征,也不意圖用于使用在確定或限制被權(quán)利要求的主題的范圍中。
[0006] 在一種實(shí)施方式中,描述了一種用于對(duì)用戶興趣簡檔的隱私保護(hù)聚集的方法。該 方法包括:基于終端用戶的興趣簡檔來生成至少一個(gè)興趣簡檔分段。該方法進(jìn)一步包括: 基于與耦合至該終端用戶的用戶設(shè)備的語義元數(shù)據(jù)數(shù)據(jù)庫的交互,來獲得與該至少一個(gè)興 趣簡檔分段相對(duì)應(yīng)的語義術(shù)語,其中從該語義元數(shù)據(jù)數(shù)據(jù)庫中提供的一個(gè)或多個(gè)語義術(shù)語 之中獲得這些語義術(shù)語。該至少一個(gè)興趣簡檔分段中的每個(gè)興趣簡檔分段隨后被變換為至 少一個(gè)語義表示。該方法進(jìn)一步包括:基于該至少一個(gè)語義表示,將集群標(biāo)識(shí)符指配給該至 少一個(gè)興趣簡檔分段,其中使用局部敏感散列(LSH)技術(shù)來生成這些集群標(biāo)識(shí)符。
[0007] 在另一實(shí)施方式中,描述了一種用于對(duì)用戶興趣簡檔的隱私保護(hù)聚集的用戶設(shè) 備。在所述實(shí)施方式中,該用戶設(shè)備包括處理器和耦合至該處理器的存儲(chǔ)器。該存儲(chǔ)器包 括:簡檔變換模塊,被配置為基于與耦合至該用戶設(shè)備的語義元數(shù)據(jù)數(shù)據(jù)庫的交互,來獲得 與至少一個(gè)興趣簡檔分段相對(duì)應(yīng)的語義術(shù)語。在一個(gè)實(shí)施例中,從該語義元數(shù)據(jù)數(shù)據(jù)庫中 提供的一個(gè)或多個(gè)語義術(shù)語之中獲得這些語義術(shù)語。該簡檔變換模塊進(jìn)一步被配置為,將 該至少一個(gè)興趣簡檔分段中的每個(gè)興趣簡檔分段變換為至少一個(gè)語義表示。該存儲(chǔ)器進(jìn)一 步包括:集群標(biāo)識(shí)符模塊,被配置為基于該至少一個(gè)語義表示,使用局部敏感散列(LSH)技 術(shù)來生成集群標(biāo)識(shí)符,并且基于該至少一個(gè)語義表示,將該集群標(biāo)識(shí)符指配給至少一個(gè)興 趣簡檔分段。
[0008] 在另一實(shí)施方式中,描述了一種計(jì)算機(jī)可讀介質(zhì),在其上已經(jīng)具體化了用于執(zhí)行 一種方法的計(jì)算機(jī)可讀程序代碼。該方法可以包括:基于終端用戶的興趣簡檔來生成至少 一個(gè)興趣簡檔分段。該方法進(jìn)一步包括:基于與耦合至該終端用戶的用戶設(shè)備的語義元數(shù) 據(jù)數(shù)據(jù)庫的交互,來獲得與該至少一個(gè)興趣簡檔分段相對(duì)應(yīng)的語義術(shù)語,其中從該語義元 數(shù)據(jù)數(shù)據(jù)庫中提供的一個(gè)或多個(gè)語義術(shù)語之中獲得這些語義術(shù)語。該至少一個(gè)興趣簡檔分 段中的每個(gè)興趣簡檔分段隨后被變換為至少一個(gè)語義表示。該方法進(jìn)一步包括:基于該至 少一個(gè)語義表示,將集群標(biāo)識(shí)符指配給該至少一個(gè)興趣簡檔分段,其中使用局部敏感散列 (LSH)技術(shù)來生成這些集群標(biāo)識(shí)符。
【附圖說明】
[0009] 參考附圖來描述詳細(xì)的描述。在這些附圖中,參考標(biāo)號(hào)的最左邊的(多個(gè))數(shù)字 識(shí)別該參考標(biāo)號(hào)首次出現(xiàn)在其中的附圖。貫穿這些附圖,使用相同的標(biāo)號(hào)來參考相似的特 征和組件?,F(xiàn)在通過僅是示例的方式并且參考附圖來描述根據(jù)本主題的實(shí)施例的系統(tǒng)和/ 或方法的一些實(shí)施例,在附圖中:
[0010] 圖1圖示了根據(jù)本主題的一個(gè)實(shí)施例的用于個(gè)人信息的隱私保護(hù)的對(duì)用戶簡檔 的隱私保護(hù)聚集的示例性網(wǎng)絡(luò)環(huán)境實(shí)施方式;
[0011] 圖2圖示了根據(jù)本主題的一個(gè)實(shí)施例的實(shí)施用于個(gè)人信息的隱私保護(hù)的對(duì)用戶 簡檔的隱私保護(hù)聚集的用戶設(shè)備的組件;
[0012] 圖3(a)、3(b)和3(c)圖示了根據(jù)本主題的一個(gè)實(shí)施例的實(shí)施對(duì)用戶簡檔的隱私 保護(hù)聚集的各種應(yīng)用的示例性網(wǎng)絡(luò)環(huán)境實(shí)施方式;以及
[0013] 圖4圖示了根據(jù)本主題的一個(gè)實(shí)施例的用以向終端用戶提供隱私保護(hù)的對(duì)用戶 簡檔的隱私保護(hù)聚集的方法。
[0014] 在本文檔中,本文使用詞語"示例性"來意指"用作一個(gè)示例、實(shí)例、或例證"。在本 文中被描述為"示例性"的本主題的任何實(shí)施例或?qū)嵤┓绞讲槐厝槐唤忉尀橄鄬?duì)其他實(shí)施 例被偏好或者有優(yōu)勢(shì)。
[0015] 本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)意識(shí)到,本文中的任何框圖表示體現(xiàn)了本主題的原理的說 明性系統(tǒng)的概念性視圖。類似地,將意識(shí)到,任何流程圖表、流程圖、狀態(tài)轉(zhuǎn)換圖、偽代碼等 表示各種過程,這些過程可以實(shí)質(zhì)上被表示在計(jì)算機(jī)可讀介質(zhì)中并且如此由計(jì)算機(jī)或處理 器來執(zhí)行,而不論是否明確示出了這樣的計(jì)算機(jī)或處理器。
【具體實(shí)施方式】
[0016] 描述了用于向終端用戶的個(gè)人信息提供隱私性的系統(tǒng)和方法。這些系統(tǒng)和方法能 夠被實(shí)施在各種用戶設(shè)備中,這些用戶設(shè)備由終端用戶用來利用服務(wù)或者查看由服務(wù)提供 商提供的內(nèi)容。進(jìn)一步地,這些用戶設(shè)備可以通過各種網(wǎng)絡(luò)來與分布式服務(wù)器和其他用戶 設(shè)備進(jìn)行通信。能夠?qū)嵤┧枋龅模ǘ喾N)方法的用戶設(shè)備和分布式服務(wù)器包括,但不限 于:計(jì)算設(shè)備(諸如膝上型計(jì)算機(jī)、臺(tái)式計(jì)算機(jī)、筆記本計(jì)算機(jī))、移動(dòng)電話、個(gè)人數(shù)字助理、 工作站、大型計(jì)算機(jī)、機(jī)頂盒、媒體播放器、中央目錄服務(wù)器、數(shù)據(jù)庫服務(wù)器、文件服務(wù)器、打 印服務(wù)器、web服務(wù)器、應(yīng)用服務(wù)器,等等。盡管本文中的描述參考了提供推薦服務(wù)并執(zhí)行 數(shù)據(jù)分析應(yīng)用的個(gè)人計(jì)算機(jī)和分布式服務(wù)器,但是如將由本領(lǐng)域的技術(shù)人員理解的,這些 方法和系統(tǒng)可以被實(shí)施在向終端用戶提供連接性以用于保護(hù)他們的隱私的其他服務(wù)器和 計(jì)算機(jī)系統(tǒng)中。
[0017]盡管推薦服務(wù)和個(gè)性化內(nèi)容由服務(wù)提供商通過各種網(wǎng)絡(luò)提供給不同的終端用戶, 但是本文所描述的方法和系統(tǒng)是接入獨(dú)立的,并且支持多種接入類型,包括:全球移動(dòng)系統(tǒng) (GSM)、寬帶碼分多址(W-CDM)、碼分多址(CDM)、無線局域網(wǎng)(WLAN)、有線線路、局域網(wǎng) (LAN)、以及提供連接性的其他網(wǎng)絡(luò)。
[0018] 常規(guī)地,許多服務(wù)提供商嘗試基于終端用戶的個(gè)人細(xì)節(jié)、偏好、以及選擇,來個(gè)性 化向終端用戶提供的服務(wù),諸如提供內(nèi)容的服務(wù),內(nèi)容諸如視頻、音頻、新聞、廣告等。為了 這個(gè)目的,服務(wù)提供商使用各種技術(shù),基于如個(gè)人信息(諸如終端用戶的年齡、性別、以及 位置)的因素,基于終端用戶的過去行為或者已經(jīng)被識(shí)別為具有與該終端用戶的興趣相類 似的興趣的其他終端用戶的過去偏好,來推薦服務(wù)、內(nèi)容、或產(chǎn)品并且執(zhí)行數(shù)據(jù)分析應(yīng)用。
[0019] 例如,如果終端用戶(比如用戶A)購買了由特定作者寫的書,則服務(wù)提供商可以 建議用戶A購買由相同作者寫的其他書或者與相同或相關(guān)主題有關(guān)的其他書,等等。在類 似的但是另一種常規(guī)方法中,服務(wù)提供商可以向終端用戶A推薦由具有與終端用戶A的興 趣簡檔相類似的興趣簡檔的其他終端用戶已經(jīng)偏好的那些內(nèi)容或產(chǎn)品。為了提供個(gè)性化服 務(wù)的目的并且為了數(shù)據(jù)分析,各種常規(guī)已知的方法被用來將具有類似興趣的終端用戶聚集 為一個(gè)或多個(gè)興趣組。
[0020] 由服務(wù)提供商實(shí)施的聚集的常規(guī)方法要求收集與終端用戶的個(gè)人偏好、選擇等有 關(guān)的信息。常規(guī)地,服務(wù)提供商通過各種手段,諸如通過分析日志文件、應(yīng)用歷史文件、或者 保存在終端用戶的客戶端設(shè)備上的或者由用戶在向服務(wù)提供商注冊(cè)時(shí)提供的其他的個(gè)人 可識(shí)別信息,來監(jiān)測(cè)并收集屬于終端用戶的信息。在另一種常規(guī)技術(shù)中,服務(wù)提供商可以保 存一個(gè)文本文件,諸如超文本傳送協(xié)議(http)cookie,來收集屬于終端用戶的信息。例如, web門戶可以保存包括終端用戶的web瀏覽器的httpcookie的用戶偏好數(shù)據(jù)來存儲(chǔ)該終 端用戶的偏好,諸如字體大小、顯示小部件的布置等。進(jìn)一步地,用戶偏好數(shù)據(jù)還可以存儲(chǔ) 終端用戶的瀏覽細(xì)節(jié),并且將這些細(xì)節(jié)發(fā)送給web門戶。
[0021] 因此,在基于終端用戶的個(gè)人選擇來向終端用戶提供推薦服務(wù)、個(gè)性化內(nèi)容、服務(wù) 或產(chǎn)品的嘗試中,服務(wù)提供商經(jīng)常監(jiān)測(cè)并收集屬于終端用戶的行為的信息。在某些情形中, 基于由服務(wù)提供商收集的信息來識(shí)別終端用戶成為可能。這可能會(huì)導(dǎo)致?lián)p害終端用戶的個(gè) 人或機(jī)密信息,并且使終端用戶暴露于潛在的隱私違反或者使他成為廣告商或垃圾郵件發(fā) 送者等的目標(biāo)。進(jìn)一步地,在極端的情況中,終端用戶可能成為各種犯罪的受害者,諸如身 份盜竊和信用卡詐騙。
[00