專利名稱:基于位置歷史確定用戶相似性的制作方法
基于位置歷史確定用戶相似性諸如全球定位系統(tǒng)(GPS)和全球移動(dòng)通信系統(tǒng)(GSM)網(wǎng)絡(luò)等位置獲取技術(shù)的日漸流行導(dǎo)致許多個(gè)體的大量時(shí)空數(shù)據(jù)集的集合。此數(shù)據(jù)集提供了發(fā)現(xiàn)用戶移動(dòng)行為的有價(jià)值的知識(shí)的機(jī)會(huì),所述知識(shí)包括基本信息,例如特定路徑的距離、持續(xù)時(shí)間和速度等。該知識(shí)可被用于找出用戶之間的相似性,因?yàn)橛蓄愃莆恢脷v史的人可能共享類似的興趣和偏好。 因此,用戶共享的位置歷史越多,這些用戶可能越相關(guān)聯(lián)。MM此處所述為用于基于位置歷史確定用戶相似性的各種技術(shù)的實(shí)現(xiàn)。在一個(gè)實(shí)現(xiàn)中,計(jì)算機(jī)應(yīng)用程序可從計(jì)算網(wǎng)絡(luò)中的兩個(gè)或多個(gè)用戶處接收全球定位系統(tǒng)(GPQ日志。 該計(jì)算機(jī)應(yīng)用程序可將每個(gè)GPS日志中所列的緯度和經(jīng)度坐標(biāo)對(duì)映射為地圖上的一個(gè)節(jié)點(diǎn)。在將坐標(biāo)對(duì)映射到地圖上時(shí),計(jì)算機(jī)應(yīng)用程序可添加從一個(gè)節(jié)點(diǎn)到另一個(gè)的箭頭以指示各個(gè)坐標(biāo)對(duì)被各用戶訪問的順序。所得到的地圖可指示該用戶的GPS軌跡或第一位置歷史。計(jì)算機(jī)應(yīng)用程序然后可定位可能在第一位置歷史上的一個(gè)或多個(gè)停留點(diǎn)。在一個(gè)實(shí)現(xiàn)中,停留點(diǎn)可作為在一組節(jié)點(diǎn)的中心的帶緯度和經(jīng)度坐標(biāo)的虛擬位置,所述一組節(jié)點(diǎn)可均為在彼此的近距離內(nèi)。所述計(jì)算機(jī)應(yīng)用程序然后可將兩個(gè)或多個(gè)停留點(diǎn)分組在一起以創(chuàng)建群集。群集可被定義為圍繞多個(gè)密集地位于彼此附近的停留點(diǎn)的地理區(qū)域。在一個(gè)實(shí)現(xiàn)中,每個(gè)群集可包括兩個(gè)或多個(gè)子群集。每個(gè)子群集可包括兩個(gè)或多個(gè)在所述群集內(nèi)的停留點(diǎn),但是子群集內(nèi)的停留點(diǎn)可能比群集內(nèi)的停留點(diǎn)彼此更為接近。在為網(wǎng)絡(luò)中的所有用戶確定了群集和子群集后,計(jì)算機(jī)應(yīng)用程序可創(chuàng)建等級(jí)框架以表示所有的群集和子群集。該等級(jí)框架可在一個(gè)層的等級(jí)中列出所有群集和子群集,從而使得等級(jí)中每個(gè)更高層可描述更大的地理區(qū)域。每個(gè)子群集可表示框架中的一層,該層位于其相對(duì)的群集所處的層之下。由所述等級(jí)框架,計(jì)算機(jī)應(yīng)用程序可作為每個(gè)用戶創(chuàng)建等級(jí)圖。所述等級(jí)圖可包括等級(jí)圖的每層的一個(gè)或多個(gè)圖,其可指示用戶可能在其中途經(jīng)過的群集或子群集。使用兩個(gè)用戶的等級(jí)圖,計(jì)算機(jī)應(yīng)用程序可通過評(píng)估兩個(gè)用戶均途經(jīng)過的位置以確定這兩個(gè)用戶之間的相似性。在確定兩個(gè)用戶之間的相似性時(shí),計(jì)算機(jī)應(yīng)用程序可以某些項(xiàng)為因子,例如,被用戶所訪問的位置的熱門性、兩個(gè)用戶行進(jìn)至多個(gè)位置的類似順序、 以及每個(gè)用戶行進(jìn)至多個(gè)位置所用時(shí)間。提供以上引用的概述章節(jié)以便以簡(jiǎn)化形式介紹將在以下詳細(xì)描述章節(jié)中進(jìn)一步描述的一些概念。本發(fā)明內(nèi)容并不旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨在用于限制所要求保護(hù)的主題的范圍。此外,所要求保護(hù)的主題不限于解決在本發(fā)明的任一部分中提及的任何或所有缺點(diǎn)的實(shí)現(xiàn)。附圖簡(jiǎn)述
圖1示出其中可結(jié)合和實(shí)踐此處所描述的各種技術(shù)的計(jì)算系統(tǒng)的示意圖。圖2示出根據(jù)此處所描述的各種技術(shù)的一個(gè)或多個(gè)實(shí)現(xiàn)的用于創(chuàng)建等級(jí)圖以模
6擬一個(gè)或多個(gè)用戶的位置歷史的方法的流程圖。圖3示出了表示根據(jù)此處所描述的各種技術(shù)的一個(gè)或多個(gè)實(shí)現(xiàn)的用于創(chuàng)建等級(jí)圖的過程的示意圖。圖4示出根據(jù)此處所描述的各種技術(shù)的一個(gè)或多個(gè)實(shí)現(xiàn)的用于基于位置歷史確定兩個(gè)用戶之間的用戶相似性的方法的流程圖。詳細(xì)描述通常,此處所描述的一個(gè)或多個(gè)實(shí)現(xiàn)涉及基于位置歷史確定用戶相似性。將在以下段落中結(jié)合附圖1-4更為詳細(xì)地描述用于基于位置歷史確定用戶相似性的各種技術(shù)的一個(gè)或多個(gè)實(shí)現(xiàn)。此處所描述的各種技術(shù)的實(shí)現(xiàn)可以用眾多通用或?qū)S糜?jì)算系統(tǒng)環(huán)境或配置來操作。適用于此處所描述的各種技術(shù)的公知的計(jì)算系統(tǒng)、環(huán)境和/或配置的示例包括,但不限于,個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持式或膝上型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、機(jī)頂盒、可編程消費(fèi)電子產(chǎn)品、網(wǎng)絡(luò)PC、小型機(jī)、大型計(jì)算機(jī)、包括上述系統(tǒng)或設(shè)備中的任一個(gè)的分布式計(jì)算環(huán)境等。此處所描述的各種技術(shù)可以在諸如程序模塊等由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中實(shí)現(xiàn)。一般而言,程序模塊包括執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等。此處所描述的各種技術(shù)還可在其中任務(wù)由通過例如硬連線鏈路、無線鏈路或其組合等通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備執(zhí)行的分布式計(jì)算環(huán)境中實(shí)現(xiàn)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)器存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。圖1示出其中可結(jié)合和實(shí)踐此處所描述的各種技術(shù)的計(jì)算系統(tǒng)100的示意圖。雖然計(jì)算系統(tǒng)100可以是如上所述的常規(guī)臺(tái)式或服務(wù)器計(jì)算機(jī),但可以使用其它計(jì)算機(jī)系統(tǒng)配置。計(jì)算系統(tǒng)100可包括中央處理單元(CPU) 21、系統(tǒng)存儲(chǔ)器22和將包括系統(tǒng)存儲(chǔ)器 22在內(nèi)的各種系統(tǒng)組件耦合到CPU 21的系統(tǒng)總線23。雖然圖1中只示出了一個(gè)CPU,但應(yīng)當(dāng)理解,在一些實(shí)現(xiàn)中計(jì)算系統(tǒng)100可包括超過一個(gè)CPU。系統(tǒng)總線23可以是幾種類型的總線結(jié)構(gòu)中的任何一種,包括存儲(chǔ)器總線或存儲(chǔ)控制器、外圍總線、以及使用各種總線體系結(jié)構(gòu)中的任一種的局部總線。作為示例,而非限制,這樣的體系結(jié)構(gòu)包括工業(yè)標(biāo)準(zhǔn)體系結(jié)構(gòu)(ISA)總線、微通道體系結(jié)構(gòu)(MCA)總線、增強(qiáng)型ISA(EISA)總線、視頻電子技術(shù)標(biāo)準(zhǔn)協(xié)會(huì)(VESA)局部總線和外圍部件互連(PCI)總線(也稱為小背板(Mezzanine)總線)。系統(tǒng)存儲(chǔ)器22可包括只讀存儲(chǔ)器(ROM) 24和隨機(jī)訪問存儲(chǔ)器(RAM) 25。基本輸入/輸出系統(tǒng) ("BIOS") 26可以被存儲(chǔ)在ROMM中,它包含有助于例如在啟動(dòng)期間在計(jì)算機(jī)系統(tǒng)100內(nèi)的各個(gè)元件之間傳送信息的基本例程。計(jì)算系統(tǒng)100還可包括用于對(duì)硬盤進(jìn)行讀寫的硬盤驅(qū)動(dòng)器27、用于對(duì)可移動(dòng)磁盤 29進(jìn)行讀寫的磁盤驅(qū)動(dòng)器28、以及用于對(duì)諸如CD-ROM或其它光介質(zhì)等可移動(dòng)光盤31進(jìn)行讀寫的光盤驅(qū)動(dòng)器30。硬盤驅(qū)動(dòng)器27、磁盤驅(qū)動(dòng)器觀以及光盤驅(qū)動(dòng)器30可分別通過硬盤驅(qū)動(dòng)器接口 32、磁盤驅(qū)動(dòng)器接口 33和光盤驅(qū)動(dòng)器接口 34連接至系統(tǒng)總線23。驅(qū)動(dòng)器及其關(guān)聯(lián)的計(jì)算機(jī)可讀介質(zhì)可以向計(jì)算系統(tǒng)100提供對(duì)計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊和其它數(shù)據(jù)的非易失性存儲(chǔ)。
雖然此處將計(jì)算系統(tǒng)100描述為具有硬盤、可移動(dòng)磁盤四和可移動(dòng)光盤31,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,計(jì)算系統(tǒng)100還可以包括可由計(jì)算機(jī)訪問的其它類型的計(jì)算機(jī)可讀介質(zhì)。例如,這種計(jì)算機(jī)可讀介質(zhì)可包括計(jì)算機(jī)存儲(chǔ)介質(zhì)和通信介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)可包括以用于存儲(chǔ)諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)等信息的任何方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性、以及可移動(dòng)和不可移動(dòng)介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)還可包括,RAM、ROM、可擦可編程只讀存儲(chǔ)器(EPROM)、電可擦可編程只讀存儲(chǔ)器(EEPROM)、閃存或其它固態(tài)存儲(chǔ)器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其它光盤存儲(chǔ)、磁帶盒、磁帶、磁盤存儲(chǔ)或其它磁性存儲(chǔ)設(shè)備、或能用于存儲(chǔ)所需信息且可以由計(jì)算系統(tǒng)100訪問的任何其它介質(zhì)。通信介質(zhì)能以諸如載波或其它傳輸機(jī)制等已調(diào)制數(shù)據(jù)信號(hào)來體現(xiàn)計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù),并且包括任何信息傳遞介質(zhì)。術(shù)語“已調(diào)制數(shù)據(jù)信號(hào)”可指的是以在信號(hào)中編碼信息的方式設(shè)定或更改其一個(gè)或多個(gè)特征的信號(hào)。作為示例而非限制, 通信介質(zhì)包括有線介質(zhì),諸如有線網(wǎng)絡(luò)或直接線連接,以及無線介質(zhì),諸如聲學(xué)、射頻、紅外線和其他無線介質(zhì)。上述的任意組合也可以包含在計(jì)算機(jī)可讀介質(zhì)的范圍內(nèi)。多個(gè)程序模塊能存儲(chǔ)在硬盤27、磁盤四、光盤31、ROM 24或RAM 25上,包括操作系統(tǒng)35、一個(gè)或多個(gè)應(yīng)用程序36、位置相似性應(yīng)用程序60、程序數(shù)據(jù)38和數(shù)據(jù)庫系統(tǒng)55。 操作系統(tǒng)35可以是能控制聯(lián)網(wǎng)的個(gè)人或服務(wù)器計(jì)算機(jī)的操作的任何合適的操作系統(tǒng),如 Windows XP、Mac 0S X、Unix變型(例如Linux 和BSD )等。位置相似性應(yīng)用程序 60可作為能使用戶基于兩個(gè)或多個(gè)用戶的位置歷史以確定他們的相似性的應(yīng)用程序。位置相似性應(yīng)用程序60將參考圖2-4在以下段落中更詳細(xì)地描述。用戶可通過諸如鍵盤40和定點(diǎn)設(shè)備42等輸入設(shè)備向計(jì)算系統(tǒng)100中輸入命令和信息。其它輸入設(shè)備可以包括話筒、操縱桿、游戲手柄、圓盤式衛(wèi)星天線、掃描儀等等。這些和其它輸入設(shè)備可通過耦合到系統(tǒng)總線23的串行端口接口 46連接到CPU 21,但是可以通過諸如并行端口、游戲端口或通用串行總線(USB)等其它接口連接。全球定位系統(tǒng)(GPS) 設(shè)備61可通過串行端口接口 46連接到計(jì)算系統(tǒng)100。GPS設(shè)備61可包括關(guān)于用戶已經(jīng)途經(jīng)的位置的位置數(shù)據(jù)。位置數(shù)據(jù)可上傳至計(jì)算系統(tǒng)100,經(jīng)由串行端口接口和系統(tǒng)總線23 而至系統(tǒng)存儲(chǔ)器22或硬盤驅(qū)動(dòng)器27以供存儲(chǔ)。監(jiān)視器47或其它類型的顯示設(shè)備也可經(jīng)由接口,諸如視頻適配器48,連接至系統(tǒng)總線23。除監(jiān)視器47之外,計(jì)算系統(tǒng)100還可包括其它外圍輸出設(shè)備,如揚(yáng)聲器和打印機(jī)。此外,計(jì)算系統(tǒng)100可以使用到一個(gè)或多個(gè)遠(yuǎn)程計(jì)算機(jī)的邏輯連接在聯(lián)網(wǎng)環(huán)境中工作。邏輯連接可以是辦公室、企業(yè)范圍計(jì)算機(jī)網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)和因特網(wǎng)中常見的任何連接, 如局域網(wǎng)(LAN)51和廣域網(wǎng)(WAN)52。當(dāng)在LAN聯(lián)網(wǎng)環(huán)境中使用時(shí),計(jì)算系統(tǒng)100可通過網(wǎng)絡(luò)接口或適配器53連接到局域網(wǎng)51。當(dāng)在WAN聯(lián)網(wǎng)環(huán)境中使用時(shí),計(jì)算系統(tǒng)100可包括調(diào)制解調(diào)器M、無線路由器或用于通過諸如因特網(wǎng)等廣域網(wǎng)52來建立通信的其它裝置?;?yàn)閮?nèi)置或?yàn)橥庵玫恼{(diào)制解調(diào)器M可經(jīng)由串行端口接口 46連接到系統(tǒng)總線23。在聯(lián)網(wǎng)環(huán)境中,就計(jì)算系統(tǒng)100所描繪的程序模塊或各其部分可被儲(chǔ)存在遠(yuǎn)程存儲(chǔ)器存儲(chǔ)設(shè)備中。能夠理解,所示的網(wǎng)絡(luò)連接是示例性的,并且可以使用在計(jì)算機(jī)之間建立通信鏈路的其他手段。應(yīng)該理解,此處描述的各種技術(shù)可以結(jié)合硬件、軟件或兩者的組合來實(shí)現(xiàn)。因此, 各種技術(shù)或其某些方面或部分,可以采用包含在諸如軟盤、⑶-ROM、硬盤驅(qū)動(dòng)器或任何其它
8機(jī)器可讀存儲(chǔ)介質(zhì)等有形介質(zhì)中的程序代碼(即,指令)的形式,其中,當(dāng)程序代碼被加載至諸如計(jì)算機(jī)等機(jī)器并由其運(yùn)行時(shí),該機(jī)器成為用于實(shí)現(xiàn)該各種技術(shù)的裝置。在程序代碼在可編程計(jì)算機(jī)上執(zhí)行的情況下,計(jì)算設(shè)備可包括處理器、該處理器可讀的存儲(chǔ)介質(zhì)(包括易失性和非易失性的存儲(chǔ)器和/或存儲(chǔ)元件)、至少一個(gè)輸入設(shè)備、以及至少一個(gè)輸出設(shè)備。可以實(shí)現(xiàn)或利用此處所描述的各種技術(shù)的一個(gè)或多個(gè)程序可以使用應(yīng)用程序編程接口 (API)、可重用控件等。這樣的程序可以用高級(jí)過程語言或面向?qū)ο缶幊陶Z言來實(shí)現(xiàn),以與計(jì)算機(jī)系統(tǒng)通信。然而,如果需要,程序可以用匯編語言或機(jī)器語言來實(shí)現(xiàn)。在任一情況下, 語言都可以是編譯的或解釋的語言,并與硬件實(shí)現(xiàn)相結(jié)合。圖2示出根據(jù)此處所描述的各種技術(shù)的一個(gè)或多個(gè)實(shí)現(xiàn)的用于創(chuàng)建等級(jí)圖以模擬一個(gè)或多個(gè)用戶的位置歷史的方法的流程圖。以下方法200的描述是根據(jù)此處所描述的各種技術(shù)的一個(gè)或多個(gè)實(shí)現(xiàn)參考圖1的計(jì)算系統(tǒng)100來作出的。此外,應(yīng)當(dāng)理解,盡管操作流程圖指示了操作執(zhí)行的特定次序,但在某些實(shí)現(xiàn)中,這些操作的特定部分可按照不同的次序執(zhí)行。在一個(gè)實(shí)現(xiàn)中,用于創(chuàng)建等級(jí)圖以模擬一個(gè)或多個(gè)用戶的位置歷史的過程可由位置相似性應(yīng)用程序60來執(zhí)行。在步驟210,位置相似性應(yīng)用程序60可從計(jì)算網(wǎng)絡(luò)中的一個(gè)或多個(gè)用戶處接收一個(gè)或多個(gè)GPS日志,所述GPS日志可存儲(chǔ)于GPS設(shè)備61、系統(tǒng)存儲(chǔ)器22、硬盤驅(qū)動(dòng)器27、或相似性存儲(chǔ)器存儲(chǔ)設(shè)備。GPS日志可包括GPS位置信息,例如每個(gè)被用戶所訪問的位置的一對(duì)緯度和經(jīng)度坐標(biāo),以及指示每個(gè)坐標(biāo)對(duì)何時(shí)被訪問的對(duì)應(yīng)時(shí)間戳。在步驟220,位置相似性應(yīng)用程序60由從兩個(gè)或多個(gè)用戶的GPS日志編制 (formulate)出GPS路徑或第一位置歷史。第一位置歷史可描述用戶已經(jīng)途經(jīng)的路徑,并包括根據(jù)時(shí)間戳而按時(shí)間先后排列的緯度和經(jīng)度坐標(biāo)對(duì)的列表的顯示。在一個(gè)實(shí)現(xiàn)中,位置相似性應(yīng)用程序60可從用戶的GPS日志中提取每個(gè)緯度和經(jīng)度坐標(biāo)對(duì)(GPS坐標(biāo))以及這些坐標(biāo)對(duì)的時(shí)間戳。位置相似性應(yīng)用程序60然后可將每個(gè)緯度和經(jīng)度坐標(biāo)對(duì)表示為圖或地圖上的一個(gè)節(jié)點(diǎn)。位置相似性應(yīng)用程序60可以箭頭連接圖上的每個(gè)節(jié)點(diǎn),從而箭頭方向?yàn)閺囊粋€(gè)節(jié)點(diǎn)到用戶所訪問的下一節(jié)點(diǎn)。節(jié)點(diǎn)也可包括對(duì)應(yīng)于坐標(biāo)的時(shí)間戳。在步驟230,位置相似性應(yīng)用程序60可確定一個(gè)或多個(gè)GPS日志的停留點(diǎn)。停留點(diǎn)可表示在用戶可能停留了超過特定時(shí)間間隔的地理區(qū)域的中心的虛擬位置。停留點(diǎn)的確定可依賴于距離閾值(Diwt)和時(shí)間閾值(Tiwt)。在一個(gè)實(shí)現(xiàn)中,停留點(diǎn)可被認(rèn)為是由一組節(jié)點(diǎn)所表征的虛擬位置,其中每個(gè)節(jié)點(diǎn)之間的距離可小于距離閾值,而所述組中第一節(jié)點(diǎn)和最后節(jié)點(diǎn)的時(shí)間間隔可大于時(shí)間閾值。在一個(gè)實(shí)現(xiàn)中,停留點(diǎn)可通過找出所述節(jié)點(diǎn)組的緯度坐標(biāo)的平均值以及所述節(jié)點(diǎn)組的經(jīng)度坐標(biāo)的平均值來生成。停留點(diǎn)可被視為具有和所述節(jié)點(diǎn)組的緯度坐標(biāo)平均值和經(jīng)度坐標(biāo)平均值相同的緯度坐標(biāo)和經(jīng)度坐標(biāo)。在一個(gè)實(shí)現(xiàn)中,每個(gè)停留點(diǎn)(Si)可被一組包括緯度坐標(biāo)、經(jīng)度坐標(biāo)、到達(dá)時(shí)間、以及離開時(shí)間的數(shù)據(jù)所描述,或者S=[緯度坐標(biāo)(Lat),經(jīng)度坐標(biāo)(Lngt),到達(dá)時(shí)間(arv), 離開時(shí)間(d印)],其中停留點(diǎn)緯度(Lat)= Σ =πι Pi-Lat/\P\停留點(diǎn)諱度(Lngt)= Σ =πι Pi-^ngt/\Ρ\
停留點(diǎn)到達(dá)時(shí)間(arv) = pm. T停留點(diǎn)離開時(shí)間(cbp) = pn. T此處,P可表示GPS點(diǎn)的集合P= {pl,p2,…,pn},且每個(gè)GPS點(diǎn)pi e P可包括一個(gè)緯度(pi. Lat)、一個(gè)經(jīng)度(pi. Lngt)、和一個(gè)時(shí)間戳(pi. Τ)。停留點(diǎn)到達(dá)和離開時(shí)間可表示用戶到達(dá)和離開該停留點(diǎn)的時(shí)間。典型地,當(dāng)個(gè)人保持靜止的時(shí)間超過時(shí)間閾值時(shí)(例如,當(dāng)個(gè)人進(jìn)入了建筑物并丟失衛(wèi)星信號(hào)一段時(shí)間直至返回戶外),或當(dāng)用戶在特定的地理空間范圍內(nèi)徘徊的時(shí)間周期超過了時(shí)間閾值時(shí)(例如,當(dāng)個(gè)人在戶外旅行并被周圍環(huán)境所吸引時(shí)),可獲得停留點(diǎn)。在步驟Μ0,位置相似性應(yīng)用程序60可用在步驟230所獲得的停留點(diǎn)以編制第二位置歷史。第二位置歷史可包括用戶可能訪問超過一時(shí)間間隔的停留點(diǎn)的記錄。在一個(gè)實(shí)現(xiàn)中,第二位置歷史可包括可在步驟230所確定的停留點(diǎn)的序列。該第二位置歷史可描述位置以及用戶訪問一個(gè)或多個(gè)位置的順序。第二位置歷史(LocH)可被定義為
Ati At 2 Atn^1LocH = (S1 — S2 —,…,——^ Sn) 其中 Si G S,并且 Δ = si+1. BrvT-Si. IevT
f其中Si可表示特定的停留點(diǎn),而Ati可表示用戶從一個(gè)停留點(diǎn)到下一個(gè)停留點(diǎn)所用的時(shí)間量。在步驟250,位置相似性應(yīng)用程序60可作為在步驟230所確定的所有停留點(diǎn)確定一個(gè)或多個(gè)群集。每個(gè)群集可包括一個(gè)或多個(gè)可密集地填充在一個(gè)地理區(qū)域內(nèi)的停留點(diǎn)。 在一個(gè)實(shí)現(xiàn)中,位置相似性應(yīng)用程序60可收集存儲(chǔ)在存儲(chǔ)器中的每個(gè)GPS日志的所有停留點(diǎn),并將該停留點(diǎn)的集合提供給基于密度的群集算法以基于數(shù)據(jù)集中的停留點(diǎn)的地理空間區(qū)域來創(chuàng)建一個(gè)或多個(gè)等級(jí)群集。在一個(gè)實(shí)現(xiàn)中,第一群集可包括圍繞一大集合區(qū)域的最大數(shù)量的停留點(diǎn)。第一群集可作為等級(jí)群集的最高層的部分。所述基于密度的群集算法可進(jìn)一步在第一群集中定位一個(gè)或多個(gè)子群集。每個(gè)子群集可包括可作為第一群集的部分的一個(gè)或多個(gè)停留點(diǎn);然而,可作為子群集的部分的停留點(diǎn)可包括比在第一群集中的停留點(diǎn)更為密集地填充的停留點(diǎn)。所述基于密度的群集算法可依靠一個(gè)或多個(gè)停留點(diǎn)的接近度來在群集中定位附加的子群集。每個(gè)子群集可表示其群集在等級(jí)群集中所在層的下方一層。在一個(gè)實(shí)現(xiàn)中,每個(gè)子群集可表示比其可作為其中部分的群集更小的地理區(qū)域。在步驟沈0,位置相似性應(yīng)用程序60可基于在步驟250所確定的群集和子群集編制等級(jí)框架。該等級(jí)框架F可被定義為在一個(gè)或多個(gè)層L上的群集C(以及子群集)的集合,從而F= (C,L),其中L= {11;12,…,IJ,其中Cij表示在層Ii e L上的停留點(diǎn)S的第 j個(gè)群集,而Ci是層Ii上的群集的集合。在一個(gè)實(shí)現(xiàn)中,來自各個(gè)用戶或GPS日志的停留點(diǎn)可被分配給一個(gè)或多個(gè)層L上的一個(gè)或多個(gè)群集C。例如,停留點(diǎn)的第一群集可包括其內(nèi)部的一個(gè)或多個(gè)子群集。此處,第一群集可被視為等級(jí)框架的頂(高)層,而第一群集內(nèi)的各子群集可被視為在所共享的等級(jí)框架的同一層上,該層可作為等級(jí)框架的第一群集層下方的一層。從等級(jí)框架的頂部到底部,群集的集合范圍減小,而集合區(qū)域的粒度可從粗略增加為細(xì)致。該框架的等級(jí)特征可用于以不同相似性等級(jí)來區(qū)分人。因此,共享等級(jí)框架的較低層上的類似第二位置歷史的用戶要比共享較高層上的第二位置歷史的用戶更為相關(guān)聯(lián)。共享等級(jí)框架的示例被示于圖3。
10
在步驟270,位置相似性應(yīng)用程序60可基于每個(gè)用戶的等級(jí)框架(F)和第二位置歷史(LocH)以構(gòu)建個(gè)人等級(jí)圖(HG)。該個(gè)人等級(jí)圖HG可包括描述根據(jù)用戶的第二位置歷史該用戶已經(jīng)途經(jīng)的群集或子群集的一個(gè)或多個(gè)圖。在一個(gè)實(shí)現(xiàn)中,位置相似性應(yīng)用程序 60可用等級(jí)框架的每個(gè)層交叉引用用戶的第二位置歷史。位置相似性應(yīng)用程序60可將第二位置歷史中的用戶停留點(diǎn)映射至其在等級(jí)框架中的各層中的各自群集或子群集。群集或子群集然后可包括用戶的停留點(diǎn),而一個(gè)邊可連接兩個(gè)群集或子群集以表示用戶可訪問各個(gè)群集或子區(qū)級(jí)(地理區(qū)域)的順序。個(gè)人等級(jí)圖可包括一個(gè)或多個(gè)圖,從而每個(gè)圖對(duì)應(yīng)等級(jí)框架的一個(gè)層。給定用戶的第二位置歷史和等級(jí)框架,該用戶的等級(jí)圖可被編制為一組圖,其描述HG= (Gi = (Ci5Ei)5K i ^ |L|},其中每個(gè)層Ii e LiGi e HG,而一組頂點(diǎn)或群集Ci以及邊Ei可連接Cij e Ci。圖3示出了表示根據(jù)此處所描述的各種技術(shù)的一個(gè)或多個(gè)實(shí)現(xiàn)的用于創(chuàng)建等級(jí)圖的過程300的示意圖。以下過程300的描述是根據(jù)此處所描述的各種技術(shù)的一個(gè)或多個(gè)實(shí)現(xiàn)參考圖1的計(jì)算系統(tǒng)100以及圖2的方法200來作出的。應(yīng)當(dāng)理解,盡管過程300指示了操作執(zhí)行的特定次序,但在某些實(shí)現(xiàn)中這些操作的特定部分可按照不同的次序執(zhí)行。另外,過程300可對(duì)應(yīng)圖2中所例示的某些步驟。在某些實(shí)現(xiàn)中,過程300可包括來自兩個(gè)或更多個(gè)用戶的兩個(gè)或更多個(gè)GPS日志 GL、一個(gè)或多個(gè)群集cu、一個(gè)或多個(gè)停留點(diǎn)S、一個(gè)等級(jí)框架F、一個(gè)或多個(gè)等級(jí)圖HG、一個(gè)或多個(gè)第二位置歷史、以及一個(gè)或多個(gè)層1。圖3示出根據(jù)圖2中所描述的方法200為兩個(gè)用戶所創(chuàng)建的等級(jí)框架和兩個(gè)用戶等級(jí)圖HG。參考步驟210,GPS日志GL可包括一個(gè)或多個(gè)用戶的一個(gè)或多個(gè)GPS日志GL。在一個(gè)實(shí)現(xiàn)中,GPS日志GL可從GPS設(shè)備61處下載,并存儲(chǔ)在可被計(jì)算系統(tǒng)100所訪問的存儲(chǔ)器存儲(chǔ)設(shè)備中。參考步驟230,位置相似性應(yīng)用程序60可由GPS日志GL在一圖上創(chuàng)建一個(gè)或多個(gè)節(jié)點(diǎn)以表示停留點(diǎn)S。如圖3中所示,停留點(diǎn)S可由節(jié)點(diǎn)來表示。在一個(gè)實(shí)現(xiàn)中,位置相似性應(yīng)用程序60可為每個(gè)用戶的GPS日志GL確定停留點(diǎn)S。參考步驟250,位置相似性應(yīng)用程序60可用一基于密度的群集算法來確定一個(gè)或多個(gè)群集cu。位置相似性應(yīng)用程序60可通過將一個(gè)或多個(gè)停留點(diǎn)包括在一個(gè)圓內(nèi)來在圖上指示群集cu。群集中的第j個(gè)變量可被編號(hào)以區(qū)分在共享等級(jí)框架F的特定層Ii上的各個(gè)不同群集,且第i個(gè)變量可對(duì)應(yīng)于其中可放置群集的層1”在群集中,位置相似性應(yīng)用程序60可找出一個(gè)或多個(gè)子群集c(i+1…其可包括比原群集中的停留點(diǎn)S的彼此距離更接近的一組停留點(diǎn)S。在群集中的每個(gè)子群集c(i+1”可指示在共享等級(jí)框架F 或等級(jí)圖HG中的一個(gè)新級(jí)別或?qū)覫i。每個(gè)子群集Ci(J+1),如果其自身內(nèi)部包括兩個(gè)或多個(gè)子群集c(i+2)j,則其也可被視為群集c(i+1)j。例如,在過程300中,群集C1可表示群集Cij的最大的地理區(qū)域(層Ii = 1),因?yàn)槠浒藖碜悦總€(gè)GPS日志GL的所有停留點(diǎn)S。子群集C2可表示群集C1的子群集(層Ii =幻。子群集C3然后可表示子群集C2的子群集(層 Ii =幻。群集的每個(gè)層可表示共享等級(jí)框架F中的一級(jí)或一層,或可表示可作為等級(jí)圖HG的部分的獨(dú)立圖。層Ii可對(duì)應(yīng)于停留點(diǎn)S的接近度,從而層I(C1)可對(duì)應(yīng)較大的地理區(qū)域,而較低層(2+級(jí))可對(duì)應(yīng)逐漸更小的地理區(qū)域。參考步驟沈0,位置相似性應(yīng)用程序60可通過根據(jù)群集Cij可對(duì)應(yīng)的層來表示群集Cu,從而編制共享等級(jí)框架F。例如,群集從Cltl可對(duì)應(yīng)群集C1、群集C2tl和群集C21可對(duì)應(yīng)群集c2,而群集c3(1、c31、c32、C33及C34可對(duì)應(yīng)上述的群集c3??稍诘燃?jí)框架F的最低層Ii 上的各個(gè)群集中表示停留點(diǎn)S。參考步驟270,位置相似性應(yīng)用程序60可為特定用戶編制等級(jí)圖HG。在一個(gè)實(shí)現(xiàn)中,位置相似性應(yīng)用程序60可根據(jù)用戶的GPS日志GL從等級(jí)框架F中提取用戶的群集Cij 和停留點(diǎn)S。在等級(jí)框架F的不同層Ii上的每個(gè)群集可對(duì)應(yīng)不同的圖&。在一個(gè)實(shí)現(xiàn)中,位置相似性應(yīng)用程序60可由特定用戶的GPS日志GL來確定第二位置歷史LocH。例如,可通過將用戶1的GPS日志GL1的停留點(diǎn)S組織為時(shí)間順序并用指向箭頭連接每個(gè)停留點(diǎn)來確定用戶1的第二位置歷史LocHlt5然后可通過用將第二位置歷史LocH1和等級(jí)框架F中的群集其包括第二位置歷史LocH1的停留點(diǎn))相映射來確定等級(jí)圖HG115第二位置歷史LocH1的停留點(diǎn)S部分可按照在等級(jí)框架F中列出的群集Cij來分組。等級(jí)框架F的每個(gè)層Ii可對(duì)應(yīng)等級(jí)圖HG的一個(gè)圖G”圖4示出根據(jù)此處所描述的各種技術(shù)的一個(gè)或多個(gè)實(shí)現(xiàn)的用于基于位置歷史確定兩個(gè)用戶之間的用戶相似性的方法400的流程圖。以下方法400的描述是根據(jù)此處所描述的各種技術(shù)的一個(gè)或多個(gè)實(shí)現(xiàn)參考圖1的計(jì)算系統(tǒng)100以及圖3的過程300來作出的。 此外,應(yīng)當(dāng)理解,盡管操作流程圖指示了操作執(zhí)行的特定次序,但在某些實(shí)現(xiàn)中,這些操作的特定部分可按照不同的次序執(zhí)行。在一個(gè)實(shí)現(xiàn)中,可由位置相似性應(yīng)用程序60來執(zhí)行用于基于位置歷史而確定用戶相似性的方法。在步驟410,位置相似性應(yīng)用程序60可從兩個(gè)用戶(由相似性應(yīng)用程序60來為其確定相似性)的等級(jí)圖HG中的各圖中提取一系列群集或子群集。在一個(gè)實(shí)現(xiàn)中,每個(gè)用戶的等級(jí)圖HG可提供用戶的第二位置歷史LocH的有效表示,其可暗示基于不同范圍的地理空間的一系列用戶移動(dòng)行為。給定如圖3中所示的兩個(gè)用戶^和心的HGjP HG2,位置相似性應(yīng)用程序60可首先定位在每個(gè)層Ii e L上被兩個(gè)用戶共享的的一個(gè)或多個(gè)相同圖頂點(diǎn)片‘2,其中
權(quán)利要求
1.一種用于確定網(wǎng)絡(luò)中第一用戶和第二用戶之間的相似性的方法包括 從所述網(wǎng)絡(luò)中各用戶處接收一個(gè)或多個(gè)全球定位系統(tǒng)(GPQ日志;構(gòu)建針對(duì)第一用戶的GPS日志的第一等級(jí)圖和針對(duì)第二用戶的GPS日志的第二等級(jí)圖;以及基于所述第一等級(jí)圖和第二等級(jí)圖計(jì)算第一和第二用戶之間的相似性得分。
2.如權(quán)利要求1所述的方法,其特征在于,構(gòu)建第一等級(jí)圖和第二等級(jí)圖包括 將GPS日志的信息合并入等級(jí)框架中;基于所述等級(jí)框架創(chuàng)建針對(duì)第一用戶的GPS日志的第一等級(jí)圖;以及基于所述等級(jí)框架創(chuàng)建針對(duì)第二用戶的GPS日志的第二等級(jí)圖。
3.如權(quán)利要求2所述的方法,其特征在于,合并GPS日志的信息包括基于每個(gè)用戶的GPS日志編制第一位置歷史,其描述每個(gè)用戶以時(shí)間順序所途經(jīng)的一個(gè)或多個(gè)位置;確定沿每個(gè)第一位置歷史的一個(gè)或多個(gè)停留點(diǎn); 將所述停留點(diǎn)分組成一個(gè)或多個(gè)群集; 將所述群集中的停留點(diǎn)分組為一個(gè)或多個(gè)子群集;以及將所述群集映射至所述等級(jí)框架的一個(gè)或多個(gè)較高層;以及將所述子群集映射至所述等級(jí)框架的一個(gè)或多個(gè)較低層。
4.如權(quán)利要求3所述的方法,其特征在于,確定停留點(diǎn)包括標(biāo)識(shí)所述一個(gè)或多個(gè)位置的位于預(yù)定距離閾值內(nèi)的部分,其中所述部分中的第一位置和最后位置之間的時(shí)間間隔超過了預(yù)定時(shí)間閾值; 為每個(gè)標(biāo)識(shí)的位置提取緯度坐標(biāo)和經(jīng)度坐標(biāo); 計(jì)算所述位置的所述部分的緯度坐標(biāo)和經(jīng)度坐標(biāo)的平均值;以及在所述緯度坐標(biāo)和經(jīng)度坐標(biāo)的平均值處創(chuàng)建停留點(diǎn)。
5.如權(quán)利要求3所述的方法,其特征在于,使用基于密度的群集算法將所述停留點(diǎn)分組為群集和子群集。
6.如權(quán)利要求3所述的方法,其特征在于,創(chuàng)建第一等級(jí)圖包括基于第一用戶的GPS日志編制以時(shí)間先后順序描述第一用戶所途經(jīng)的停留點(diǎn)的第二位置歷史;將第二位置歷史的停留點(diǎn)映射至所述等級(jí)框架的各層中的群集或子群集;以及為所述等級(jí)框架的各層創(chuàng)建一圖,該圖描述第一用戶所途經(jīng)的群集或子群集。
7.如權(quán)利要求3所述的方法,其特征在于,創(chuàng)建第二等級(jí)圖包括基于第二用戶的GPS日志編制以時(shí)間先后順序描述第二用戶所途經(jīng)的停留點(diǎn)的第三位置歷史;將第三位置歷史的停留點(diǎn)映射至所述等級(jí)框架的各層中的群集或子群集;以及為所述等級(jí)框架的各層創(chuàng)建一圖,該圖描述被第二用戶所途經(jīng)的群集或子群集。
8.如權(quán)利要求3所述的方法,其特征在于,計(jì)算第一和第二用戶之間的相似性等分包括從第一等級(jí)圖和第二等級(jí)圖中的一個(gè)或多個(gè)圖中提取第一用戶和第二用戶所途經(jīng)的群集或子群集的序列,其中第一等級(jí)圖中的各圖描述第一用戶所途經(jīng)的群集或子群集,而第二等級(jí)圖中的各圖描述第二用戶所途經(jīng)的群集或子群集; 將各序列分割成一個(gè)或多個(gè)子序列;標(biāo)識(shí)第一用戶和第二用戶所途經(jīng)的、具有最大數(shù)量的共同群集或子群集的子序列; 使用逆文檔頻率方法量化所述子序列中的各群集或子群集的熱門度,其中所述共同群集或子群集的逆文檔頻率被定義為⑴ =ZDag,其中Hij定義所述網(wǎng)絡(luò)中訪問了所述共同群集或子群集的用戶的總數(shù)量,U定義網(wǎng)絡(luò)中的用戶總數(shù)量;確定每個(gè)共同群集或子群集的相似性得分sV其中相似性得分ss,等于腳g X mini^p,mq),且其中min (叫,y代表第一和第二用戶連續(xù)訪問所述共同群集或子群集的一次或多次; 添加每個(gè)共同群集或子群集的相似性得分;以及歸一化總和。
9.如權(quán)利要求8所述的方法,其特征在于,所述最大數(shù)量的共同群集或子群集是相同時(shí)間先后順序的。
10.如權(quán)利要求8所述的方法,其特征在于,在所述最大數(shù)量的共同群集或子群集中, 每個(gè)群集或子群集之間的行進(jìn)時(shí)間是基本相似的。
11.如權(quán)利要求8所述的方法,其特征在于,分割各序列包括確定所述序列中兩個(gè)連續(xù)的群集或子群集之間的時(shí)間量是否超過一時(shí)間值;以及當(dāng)所述兩個(gè)連續(xù)的群集或子群集超過所述時(shí)間值時(shí),將所述序列分割成子序列。
12.如權(quán)利要求8所述的方法,其特征在于,計(jì)算第一和第二用戶之間的相似性等分還包括基于所述最大數(shù)量的共同群集或子群集,為每個(gè)共同群集或子群集的相似性得分分配權(quán)重。
13.如權(quán)利要求8所述的方法,其特征在于,計(jì)算第一和第二用戶之間的相似性等分還包括基于所述等級(jí)框架中所述最大數(shù)量的共同群集或子群集所處的一層,為每個(gè)共同群集或子群集的相似性得分分配權(quán)重。
14.一種計(jì)算機(jī)系統(tǒng),包括 處理器;以及存儲(chǔ)器,其包括可由所述處理器執(zhí)行以用于以下動(dòng)作的程序指令 從網(wǎng)絡(luò)中兩個(gè)或更多個(gè)用戶處接收一個(gè)或多個(gè)全球定位系統(tǒng)(GPQ日志; 將GPS日志的信息合并入等級(jí)框架中;基于所述等級(jí)框架創(chuàng)建針對(duì)第一用戶的GPS日志的第一等級(jí)圖;以及基于所述等級(jí)框架創(chuàng)建針對(duì)第二用戶的GPS日志的第二等級(jí)圖;以及基于所述第一等級(jí)圖和第二等級(jí)圖計(jì)算第一和第二用戶之間的相似性得分。
15.如權(quán)利要求14所述的計(jì)算機(jī)系統(tǒng),其特征在于,所述可由所述處理器執(zhí)行以將GPS 日志的信息合并入等級(jí)框架中的程序指令包括可由所述處理器執(zhí)行以進(jìn)行以下動(dòng)作的程序指令基于每個(gè)用戶的GPS日志編制第一位置歷史,其描述各用戶以時(shí)間順序所途經(jīng)的一個(gè)或多個(gè)位置;確定沿每個(gè)第一位置歷史的一個(gè)或多個(gè)停留點(diǎn); 將所述停留點(diǎn)分組成一個(gè)或多個(gè)群集; 將所述群集中的停留點(diǎn)分組為一個(gè)或多個(gè)子群集;以及將所述群集映射至所述等級(jí)框架的一個(gè)或多個(gè)較高層;以及將所述子群集映射至所述等級(jí)框架的一個(gè)或多個(gè)較低層。
16.如權(quán)利要求15所述的計(jì)算機(jī)系統(tǒng),其特征在于,所述可由所述處理器執(zhí)行以確定停留點(diǎn)的程序指令包括可由所述處理器執(zhí)行以進(jìn)行以下動(dòng)作的程序指令標(biāo)識(shí)所述一個(gè)或多個(gè)位置的位于預(yù)定距離閾值內(nèi)的部分,其中所述部分中的第一位置和最后位置之間的時(shí)間間隔超過預(yù)定時(shí)間閾值; 為每個(gè)標(biāo)識(shí)的位置提取緯度坐標(biāo)和經(jīng)度坐標(biāo); 計(jì)算位置的所述部分的緯度坐標(biāo)和經(jīng)度坐標(biāo)的平均值;以及在所述緯度坐標(biāo)和經(jīng)度坐標(biāo)的平均值處創(chuàng)建停留點(diǎn)。
17.如權(quán)利要求15所述的計(jì)算機(jī)系統(tǒng),其特征在于,使用基于密度的群集算法將所述停留點(diǎn)分組為群集和子群集。
18.一種其上存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì),所述指令在由計(jì)算機(jī)執(zhí)行時(shí)使得所述計(jì)算機(jī)從網(wǎng)絡(luò)中兩個(gè)或更多個(gè)用戶處接收一個(gè)或多個(gè)全球定位系統(tǒng)(GPQ日志; 基于各用戶的GPS日志編制以時(shí)間先后順序描述各用戶所途經(jīng)的一個(gè)或多個(gè)位置的第一位置歷史;確定沿每個(gè)第一位置歷史的一個(gè)或多個(gè)停留點(diǎn);將所述停留點(diǎn)分組成一個(gè)或多個(gè)群集;將所述群集中的停留點(diǎn)分組為一個(gè)或多個(gè)子群集;以及將所述群集映射至一等級(jí)框架的一個(gè)或多個(gè)較高層;將所述子群集映射至所述等級(jí)框架的一個(gè)或多個(gè)較低層;基于所述等級(jí)框架創(chuàng)建針對(duì)第一用戶的GPS日志的第一等級(jí)圖;基于所述等級(jí)框架創(chuàng)建針對(duì)第二用戶的GPS日志的第二等級(jí)圖;以及基于所述第一等級(jí)圖和第二等級(jí)圖計(jì)算第一和第二用戶之間的相似性得分。
19.如權(quán)利要求18所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,所述用于計(jì)算第一用戶和第二用戶之間的相似性得分的計(jì)算機(jī)可執(zhí)行指令被配置為從第一等級(jí)圖和第二等級(jí)圖中的一個(gè)或多個(gè)圖中提取第一用戶和第二用戶所途經(jīng)的群集或子群集的序列,其中第一等級(jí)圖中的各圖描述第一用戶所途經(jīng)的群集或子群集,而第二等級(jí)圖中的各圖描述第二用戶所途經(jīng)的群集或子群集; 將各序列分割成一個(gè)或多個(gè)子序列;標(biāo)識(shí)第一用戶和第二用戶所途經(jīng)的、具有最大數(shù)量的共同群集或子群集的子序列; 使用逆文檔頻率方法量化所述子序列中的各群集或子群集的熱門度,其中所述共同群集或子群集的逆文檔頻率被定義為⑴ =,Mg,其中定義所述網(wǎng)絡(luò)中訪問了所述共同群集或子群集的用戶的總數(shù)量,U定義網(wǎng)絡(luò)中的用戶總數(shù)量;為了每個(gè)共同群集或子群集確定相似性得分ssa,其中相似性得分等于IBFijxmin(mp,mq),且其中min(nip,mq)代表第一和第二用戶連續(xù)訪問所述共同群集或子群集的一次或多次;添加每個(gè)共同群集或子群集的相似性得分;以及歸一化總和。
20.如權(quán)利要求18所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,使用基于密度的群集算法將所述停留點(diǎn)分組到所述群集或子群集中。
全文摘要
用于確定網(wǎng)絡(luò)中第一用戶和第二用戶之間相似性的方法,包括從網(wǎng)絡(luò)中各用戶接收一個(gè)或多個(gè)全球定位系統(tǒng)(GPS)日志,構(gòu)建針對(duì)第一用戶的GPS日志的第一等級(jí)圖和針對(duì)第二用戶的GPS日志的第二等級(jí)圖,并基于第一等級(jí)圖和第二等級(jí)圖計(jì)算第一用戶和第二用戶之間的相似性得分。
文檔編號(hào)G06F9/44GK102203729SQ200980143794
公開日2011年9月28日 申請(qǐng)日期2009年11月3日 優(yōu)先權(quán)日2008年11月3日
發(fā)明者W-Y·馬, X·謝, Y·鄭 申請(qǐng)人:微軟公司