專利名稱:從搜索查詢中檢測用戶的位置、地方意圖和旅游意圖的制作方法
第1/12頁
從搜索査詢中檢測用戶的位置、地方意圖和旅游意圖
扭旦冃牙、
因特網(wǎng)實(shí)現(xiàn)了廣泛的使用以使得許多人用其來調(diào)查產(chǎn)品和服務(wù)并購買那些產(chǎn)品和服務(wù)。這樣的使用太普遍了以使得許多企業(yè)通過因特網(wǎng)來進(jìn)行實(shí)體貿(mào)易。因特網(wǎng)的經(jīng)濟(jì)用途催生了用于嘗試貨幣化因特網(wǎng)流量和在線關(guān)注度的無數(shù)新機(jī)制。 一種已明顯地證明其生存能力的這樣的機(jī)制是在線廣告。
當(dāng)今,在線廣告是許多企業(yè),尤其是大型企業(yè)所參與的習(xí)慣做法。在線廣告成功的一個原因是以對于常規(guī)廣告難以想象的方式為各個用戶定制特定廣告的能力。然而,計(jì)算行業(yè)無止境地力求繼續(xù)改進(jìn)為個人定制廣告的方式。
類似地,在線搜索或許是因特網(wǎng)的最常見用途之一。然而,在當(dāng)前開發(fā)階段,用戶對特定搜索查詢的結(jié)果質(zhì)量有多好以及其他搜索查詢的結(jié)果質(zhì)量能有多差兩者都同等地驚訝。具體而言,關(guān)于特定地理位置的搜索查詢有時能返回針對該位置定制的結(jié)果,但有時不能。從用戶搜索請求中辨別地理位置信息并將該地理位置信息用于諸如廣告等領(lǐng)域中的開發(fā)仍然處于其初級階段。
針對該問題的適當(dāng)?shù)慕鉀Q方案至今還不被本領(lǐng)域的技術(shù)人員所知。
概述
本發(fā)明一般涉及從搜索查詢中檢測位置相關(guān)信息。在一個實(shí)施例中,分析用戶的搜索査詢歷史以確定該用戶的家庭位置。分析后續(xù)搜索查詢以辨別該搜
索查詢是否包含地方意圖(local intent),這意味著該搜索查詢請求具有地理相關(guān)區(qū)域的信息。在搜索查詢具有地方意圖的情況下,將對應(yīng)于該搜索查詢的地理相關(guān)區(qū)域與用戶的家庭位置進(jìn)行比較以確定該搜索查詢是否暗示旅游意圖。
附圖簡述
當(dāng)結(jié)合此處簡述的附圖參考以下詳細(xì)描述時,可以更容易領(lǐng)會并更好地理解本發(fā)明的許多附加優(yōu)點(diǎn)。
圖1是其中可實(shí)現(xiàn)本發(fā)明的各實(shí)施例的計(jì)算環(huán)境的圖示。 圖2是根據(jù)一個實(shí)施例的包括可在結(jié)合圖1介紹的計(jì)算環(huán)境中實(shí)現(xiàn)的功能 組件的執(zhí)行環(huán)境的圖示。圖3是可用于實(shí)現(xiàn)本發(fā)明的一個或多個實(shí)施例的示例性計(jì)算設(shè)備的功能框圖。圖4是概括地示出用于從用戶的搜索查詢中檢測旅游意圖的過程的操作 流程圖。圖5是概括地示出用于從用戶的搜索歷史中標(biāo)識用戶的家庭位置的過程的操作流程圖。圖6是概括地示出用于從搜索查詢中檢測地方意圖的過程的操作流程圖?,F(xiàn)在將參考這些附圖來詳細(xì)描述本發(fā)明的各實(shí)施例,全部附圖中相同的標(biāo) 號指代相同的元素。附圖詳述以下將參考形成本發(fā)明一部分并示出用于實(shí)踐各實(shí)施例的特定示例性實(shí) 現(xiàn)的附圖來更詳盡地描述各個實(shí)施例。然而,其它實(shí)施例可以用許多不同的形式實(shí)現(xiàn)并且不應(yīng)被解釋為限于此處所闡述的各實(shí)施例;相反,提供這些實(shí)施例 以使得本發(fā)明將滿足形式上的法定要求。各實(shí)施例可被實(shí)踐為方法、系統(tǒng)或設(shè) 備。因此,各實(shí)施例可采用硬件實(shí)現(xiàn)形式、完全軟件實(shí)現(xiàn)形式或者組合軟件和 硬件方面的實(shí)現(xiàn)形式。因此,以下詳細(xì)描述并非是局限性的。各實(shí)施例的邏輯操作被實(shí)現(xiàn)為(l)在計(jì)算系統(tǒng)上運(yùn)行的計(jì)算機(jī)實(shí)現(xiàn)的步驟 的序列,和/或(2)計(jì)算系統(tǒng)內(nèi)部的互連的機(jī)器模塊。實(shí)現(xiàn)是取決于諸如計(jì)算系 統(tǒng)的性能要求等實(shí)現(xiàn)實(shí)施例的各個考慮事項(xiàng)的選擇。因此,組成在此描述的這 些實(shí)施例的邏輯操作另外還可被稱為操作、步驟或模塊。說明性系統(tǒng)將首先參考實(shí)現(xiàn)本法明的某些實(shí)施例的樣本系統(tǒng)來描述各原理和概念。該 樣本系統(tǒng)可使用根據(jù)本發(fā)明的教導(dǎo)來編程的常用或?qū)S糜?jì)算設(shè)備來實(shí)現(xiàn)。圖1是其中可實(shí)現(xiàn)本發(fā)明的各實(shí)施例的計(jì)算環(huán)境101的圖示。計(jì)算環(huán)境100可使用諸如圖3所示且以下描述的計(jì)算設(shè)備等根據(jù)本發(fā)明的教導(dǎo)來配置的任何常規(guī)計(jì)算設(shè)備來實(shí)現(xiàn)??煞植荚趫D1所示的計(jì)算設(shè)備中的一個或多個上的 特定功能將結(jié)合圖2-5詳細(xì)描述。然而,作為概覽,由一個實(shí)施例執(zhí)行的一般 操作將在此結(jié)合圖1來描述。計(jì)算環(huán)境100至少包括通過網(wǎng)絡(luò)102連接的搜索引擎110和家庭計(jì)算機(jī) 105。網(wǎng)絡(luò)102可以是用于互連兩個或多個不同計(jì)算設(shè)備的任何電組件和支持 軟件。網(wǎng)絡(luò)102的示例包括局域網(wǎng)、廣域網(wǎng)、城域網(wǎng)、因特網(wǎng)等。在該實(shí)現(xiàn)中,家庭計(jì)算機(jī)105表示諸如圖3所示的計(jì)算設(shè)備等實(shí)體(用戶 103)相對頻繁地用于進(jìn)行調(diào)查或信息搜索的計(jì)算設(shè)備。盡管被示為人類,但 應(yīng)注意,用戶103可以是能夠執(zhí)行計(jì)算機(jī)搜索或信息檢索的任何形式的實(shí)體或 代理。搜索引擎110是諸如圖3所示的計(jì)算設(shè)備等提供信息搜索服務(wù)的計(jì)算設(shè) 備。在一個示例中,搜索引擎110使得諸如家庭計(jì)算機(jī)105等其他計(jì)算設(shè)備能 夠搜索各種數(shù)據(jù)源來尋找關(guān)于一話題的信息。通常,家庭計(jì)算機(jī)105向搜索引 擎110提出搜索查詢,并且搜索引擎110返回關(guān)于該搜索査詢的搜索結(jié)果。搜 索結(jié)果通常鏈接到諸如網(wǎng)頁等通常但不一定駐留在另一計(jì)算設(shè)備(數(shù)據(jù)服務(wù)器 112)上的數(shù)據(jù)源。計(jì)算環(huán)境101中還可包括廣告服務(wù)器115。廣告服務(wù)器115可結(jié)合搜索引 擎110來操作以結(jié)合用戶的搜索請求的搜索結(jié)果來提供廣告或其他促銷資料。 通常,所提供的廣告能夠針對用戶103的興趣來稍微定制,因?yàn)樗阉饕鍵IO 存儲關(guān)于用戶的搜索的歷史信息。在一個簡單示例中,如果用戶103經(jīng)常執(zhí)行 針對關(guān)于大馬力中型車的信息的搜索,則搜索引擎IIO可被配置成從廣告服務(wù) 器115中檢索關(guān)于性能汽車的廣告。另外,且根據(jù)該實(shí)施例,搜索引擎110被配置成為由用戶103使用家庭計(jì) 算機(jī)105來執(zhí)行的搜索標(biāo)識主要查詢位置。如在該討論中所使用的,"主要查 詢位置"指的是特定搜索查詢所涉及或關(guān)于的地理區(qū)域或位置。例如,如果用 戶103執(zhí)行對"西雅圖餐廳"的搜索,則搜索引擎110可確定該搜索涉及城市 西雅圖。因此,該搜索的主要查詢位置將會是西雅圖。未必所有搜索查詢都具 有主要查詢位置,但大多數(shù)都具有。搜索引擎110還被配置成標(biāo)識家庭計(jì)算機(jī)105的"家庭位置"。出于該討論的目的,"家庭位置"指的是被標(biāo)識為用戶103居住或居留、工作或以其他 方式花費(fèi)大量時間的地理位置。家庭位置基于對由用戶103或許使用家庭計(jì)算機(jī)105來執(zhí)行的搜索的歷史的分析來標(biāo)識。該分析包括為用戶的搜索歷史中的大量搜索標(biāo)識主要査詢位置,以及標(biāo)識出現(xiàn)的頻率或相關(guān)度比其他位置更高的 一個位置。那個位置被認(rèn)為是用戶的家庭位置。應(yīng)當(dāng)注意,"家庭位置"可取決于搜索歷史是如何積累和分類的而或者與家庭計(jì)算機(jī)105相關(guān)聯(lián)或者與實(shí)際用戶103相關(guān)聯(lián)。例如,如果搜索引擎需要 登錄以使得能夠個人地標(biāo)識用戶103,則該搜索引擎和家庭位置可被直接分配 給該用戶103而不管該用戶103使用哪一個計(jì)算機(jī)?;蛘?,搜索引擎110能夠 收集諸如使用cookie或網(wǎng)際協(xié)議(IP)地址等關(guān)于執(zhí)行搜索的每一個計(jì)算機(jī)的 其他信息。以此方式,搜索引擎110可將搜索歷史和家庭位置與可具有多個用 戶的家庭計(jì)算機(jī)105相關(guān)聯(lián)。然而,僅僅為了討論簡明起見,家庭位置將被描 述為與用戶103相關(guān)聯(lián),但該討論在家庭位置實(shí)際上改為與計(jì)算機(jī)相關(guān)聯(lián)的情 況下具有同等的適用性。搜索引擎110還被配置成基于由用戶103執(zhí)行的搜索來確定用戶103的旅 游意圖。如上所述,搜索引擎110被配置成從由用戶103執(zhí)行的每一個搜索中 標(biāo)識主要查詢位置。搜索引擎110還被配置成標(biāo)識用戶的家庭位置。由此,一 旦標(biāo)識用戶的家庭位置,就可將用戶103的具有主要查詢位置的每一個后續(xù)搜 索請求與用戶的家庭位置進(jìn)行比較。在搜索具有"地方意圖"的情況下,這意 味著該搜索涉及特定地理區(qū)域以及不同于用戶的家庭位置的主要査詢位置,可 假設(shè)用戶到該搜索的主要查詢位置旅游的意圖("旅游意圖")。盡管該假設(shè)可能并且很有可能將在某些情況下證明是錯的,但它仍舊以多 種方式提供幫助。例如,如果用戶103正在執(zhí)行對舊金山餐廳的搜索,則僅該 信息將不足以假設(shè)該用戶103打算到舊金山旅游,除非相信該用戶103住在班 布里奇島(Bainbridge Island)。因此,該實(shí)施例所取得進(jìn)步允許搜索引擎110 更好地從廣告服務(wù)器115中標(biāo)識將結(jié)合搜索結(jié)果呈現(xiàn)給用戶103的適當(dāng)?shù)膹V 告。換言之,如果用戶103正在搜索舊金山的餐廳,則在用戶103住在舊金山 的情況下,顯示旅游相關(guān)服務(wù)的廣告將會是沒有意義的,但在用戶103不住在 舊金山的情況下,這可能是非常適當(dāng)?shù)摹,F(xiàn)在轉(zhuǎn)向圖2, 一框圖示出了實(shí)現(xiàn)一個實(shí)施例的特定組件上的功能分布。圖2所示的是通過網(wǎng)絡(luò)220來進(jìn)行通信的服務(wù)器202和客戶機(jī)240??蛻魴C(jī)240 表示用戶控制下的一個或多個計(jì)算設(shè)備。客戶機(jī)240可供用戶通過經(jīng)由網(wǎng)絡(luò) 202向服務(wù)器202發(fā)出搜索請求來執(zhí)行搜索??蛻魴C(jī)240至少包括瀏覽組件242, 其可以是允許客戶機(jī)240連接到服務(wù)器202并與該服務(wù)器202上的組件交互的 任何軟件或計(jì)算功能。瀏覽組件242可支持用于幫助唯一地標(biāo)識客戶機(jī)240的 功能,諸如因特網(wǎng)cookie或用于提供用戶/計(jì)算機(jī)標(biāo)識信息的其他專用功能。僅僅為了討論簡明起見,服務(wù)器202被示為單個組件。應(yīng)當(dāng)理解,圖2 所示的單個服務(wù)器202中的功能組件可容易地分布在兩個或更多物理計(jì)算設(shè)備 上。而且,圖2所示的每一個單一組件中所描述的功能都可被容易地實(shí)現(xiàn)為兩 個或多個實(shí)際軟件模塊、應(yīng)用程序或組件。類似地,圖2所示的兩個或多個單 一組件中所描述的功能可被組合成單個實(shí)際軟件模塊或應(yīng)用程序??捎煞?wù)器202訪問的各個不同數(shù)據(jù)源在圖2中被表示為單個數(shù)據(jù)存儲 (一般數(shù)據(jù)源211)。 一般數(shù)據(jù)源211組件例示了可通過網(wǎng)絡(luò)220來訪問的各 種各樣的信息源,諸如報(bào)紙網(wǎng)站、因特網(wǎng)博客、商用網(wǎng)站、個人信息站點(diǎn)、大 學(xué)和其他學(xué)校、維基百科等。 一般而言, 一般數(shù)據(jù)源211可以是可使用常規(guī)搜 索弓I擎技術(shù)來搜索的任何數(shù)據(jù)源。服務(wù)器202包括用戶數(shù)據(jù)213,其表示所存儲的關(guān)于服務(wù)器202的各個用 戶的信息。如上所述,術(shù)語"用戶"不一定指人類,而是指服務(wù)器202出于分 析的目的而將其作為集體單元來對待的任何唯一實(shí)體(人類或其他實(shí)體)。用 戶數(shù)據(jù)213可包括各種形式的信息,諸如姓名或用戶ID、登錄憑證以及關(guān)于 包括客戶機(jī)240的用戶在內(nèi)的每一個特定用戶的其他信息。可與每一個用戶相 關(guān)聯(lián)地存儲在用戶數(shù)據(jù)213中的一個特定信息項(xiàng)是對應(yīng)用戶的家庭位置。如以 上所討論的,該家庭位置表示被確定為很有可能是用戶的家庭地理位置(例如, 家庭城巿、州和國家)或其他主要感興趣的地理區(qū)域(例如,公司總部,如果 該用戶是企業(yè)實(shí)體的話)的地理區(qū)域。搜索歷史212表示關(guān)于由各個用戶提交給服務(wù)器202的先前搜索的信息集 合。搜索歷史212與各個用戶相關(guān)聯(lián)地組織,并且可包括將特定搜索歷史與用 戶數(shù)據(jù)213中的特定用戶相對應(yīng)的信息。對于用戶的搜索歷史中的許多搜索,可包括標(biāo)識被確定為與該搜索相關(guān)的地理區(qū)域的主要查詢位置。用于確定該主 要查詢位置的機(jī)制是以下描述的位置確定組件218。然而,未必所有搜索都具有主要查詢位置。每一個搜索都可具有諸如布爾標(biāo)志等用于指示該搜索是否涉 及主要查詢位置的相關(guān)聯(lián)的屬性。服務(wù)器202中可包括促銷數(shù)據(jù)存儲214,其包含各種形式的促銷信息,諸 如廣告、通訊或其他信息。促銷信息中的某一些還可具有感興趣的地理區(qū)域, 這意味著某些促銷資料可能只在諸如城市或甚至街坊等相對較小的地理區(qū)域 內(nèi)是重要的。例如,本地匹薩店的廣告在該匹薩店所存在的城市之外可能就沒 有意義。位置確定組件218被結(jié)合在服務(wù)器202中并且可用于為特定搜索請求標(biāo)識 主要查詢位置。如以上所討論的,主要查詢位置是搜索請求所涉及的地理區(qū)域(例如,城市、州或甚至國家)。用于為搜索請求標(biāo)識主要查詢位置的技術(shù)在 本領(lǐng)域是已知的,并且位置確定組件218可采用任何適當(dāng)?shù)募夹g(shù)。 一種好的技 術(shù)在2006年4月20日公開的題為"System and Method for Automatic Generation of Search Results Based on Local Intention (用于基于地方意圖來自動生成搜索 結(jié)果的系統(tǒng)和方法)"的美國專利公開號20060085392中詳細(xì)描述,但其他技 術(shù)可同樣適用。簡而言之,這些技術(shù)分析搜索請求本身以及最相關(guān)的搜索結(jié)果 中的單詞或短語兩者中的單詞以辨別主要查詢位置。位置確定組件218評估關(guān) 于主要查詢位置的新搜索請求并可將這些位置與這些搜索請求或搜索結(jié)果相 關(guān)聯(lián)地存儲在諸如搜索歷史212中。位置確定組件218還被配置成從搜索查詢中標(biāo)識"地方意圖"。如上所述, 術(shù)語"地方意圖"指的是搜索査詢涉及具有某種程度的地點(diǎn)或地理意義的信息 的暗示。換言之,對"阿爾伯特愛因斯坦傳記"的搜索很可能并非由獲悉特定 地理位置的任何期望來驅(qū)動。然而,"阿爾伯特愛因斯坦出生地"可能由這一 期望來驅(qū)動。因此,即使不存在由搜索查詢標(biāo)識的地理位置,結(jié)果也很有可能 聚焦于特定地理區(qū)域。另外,諸如"星巴克"、"景觀設(shè)計(jì)服務(wù)"和"管道工 程承包商"等搜索項(xiàng)可能不暗示特定地理區(qū)域。然而,用戶可能需要關(guān)于諸如 在用戶的家附近等在特定位置的這些事項(xiàng)的信息。這些搜索項(xiàng)被認(rèn)為是具有"地方意圖"。位置分析組件219可用于分析用戶的搜索歷史以標(biāo)識家庭位置。位置分析組件219可釆用許多不同的技術(shù),包括統(tǒng)計(jì)分析、基于經(jīng)驗(yàn)數(shù)據(jù)的評估等。一 種可由位置分析組件219采用的用于標(biāo)識家庭位置的特定技術(shù)在圖5中示出并 在以下描述。 一般而言,位置分析組件219按典型的計(jì)算機(jī)用戶執(zhí)行比任何其 他個別位置更多的具有關(guān)于該用戶的實(shí)際家庭地理位置的主要查詢位置的搜 索的原理來操作。搜索引擎組件217被配置成執(zhí)行常規(guī)搜索引擎操作,以及方便從用戶的搜 索習(xí)慣中檢測旅游意圖。更具體而言,搜索引擎組件217與客戶機(jī)240交互以 接收搜索請求并搜索一般數(shù)據(jù)源211以獲取搜索結(jié)果。搜索引擎組件217將搜 索請求存儲在搜索歷史212中,并且可請求位置確定組件218分析每一次搜索 以標(biāo)識地方意圖和/或主要查詢位置。當(dāng)已經(jīng)為用戶搜集了足夠的搜索歷史時, 搜索引擎組件2I7請求位置分析組件219分析搜索歷史212以標(biāo)識用戶的家庭 位置。搜索引擎組件217調(diào)用位置確定組件218來為每一個后續(xù)搜索請求標(biāo)識 地方意圖和/或主要查詢位置。對于具有地方意圖的每一次搜索,搜索引擎組件 217將其主要查詢位置(如果有的話)與用戶的家庭位置進(jìn)行比較。在搜索請 求的主要查詢位置與用戶的家庭位置不同的情況下,搜索引擎組件217可得出 該用戶具有旅游意圖的結(jié)論。在這些情況下,搜索引擎組件217可使用該信息 來幫助影響在該搜索會話期間向用戶呈現(xiàn)哪些促銷214。雖然在此處大致描述,但關(guān)于在這一情形期間執(zhí)行的特定操作的附加細(xì)節(jié) 將在以下結(jié)合可用于實(shí)現(xiàn)各實(shí)施例的各說明性過程來提供。然而,將首先描述 可用于實(shí)現(xiàn)這些實(shí)施例的樣本計(jì)算設(shè)備。圖3是可用于實(shí)現(xiàn)本發(fā)明的一個或多個實(shí)施例的示例性計(jì)算設(shè)備300的功 能框圖。計(jì)算設(shè)備300在一個基本配置中至少包括處理器302和存儲器304。 取決于計(jì)算設(shè)備的確切配置和類型,存儲器304可以是易失性的(如RAM)、 非易失性的(如ROM、閃存等)或是兩者的某種組合。該基本配置在圖3中 由虛線306來例示。另外,設(shè)備300還可具有其他的特征和功能。例如,設(shè)備300還可包含附 加存儲(可移動和/或不可移動),包括但不限于磁盤、光盤或磁帶。這樣的附 加存儲在圖3中由可移動存儲308和不可移動存儲310示出。計(jì)算機(jī)存儲介質(zhì)包括以用于存儲諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)等信息 的任何方法或技術(shù)來實(shí)現(xiàn)的易失性和非易失性、可移動和不可移動介質(zhì)。存儲器304、可移動存儲308和不可移動存儲310都是計(jì)算機(jī)存儲介質(zhì)的示例。計(jì) 算機(jī)存儲介質(zhì)包括但不限于,RAM、 ROM、 EEPROM、閃存或其它存儲器技 術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其它光存儲、磁帶盒、磁帶、磁盤存 儲或其它磁存儲設(shè)備、或者可用于存儲所需信息并且可由設(shè)備300訪問的任何 其它介質(zhì)。任何這樣的計(jì)算機(jī)存儲介質(zhì)都可以是設(shè)備300的一部分。計(jì)算設(shè)備300包括允許計(jì)算設(shè)備300與一個或多個計(jì)算機(jī)和/或應(yīng)用程序 313通信的一個或多個通信連接314。設(shè)備300還可具有輸入設(shè)備312,諸如鍵 盤、鼠標(biāo)、數(shù)字化儀或其他觸摸輸入設(shè)備、語音輸入設(shè)備等。還可包括輸出設(shè) 備311,諸如監(jiān)視器、揚(yáng)聲器、打印機(jī)、PDA、移動電話以及其它類型的數(shù)字 顯示設(shè)備等。這些設(shè)備在本領(lǐng)域中公知且無需在此處詳細(xì)討論。說明性過程各原理和概念現(xiàn)在將參考某些實(shí)施例中的可由諸如圖3所示的計(jì)算設(shè)備 等計(jì)算設(shè)備來實(shí)現(xiàn)的各樣本過程來描述。這些過程可使用軟件或固件中的計(jì)算機(jī)可執(zhí)行指令實(shí)現(xiàn),但也可按照其他方式實(shí)現(xiàn),諸如采用可編程邏輯、電子電 路等。在某些替換實(shí)施例中,某些操作甚至可采用有限的人工干預(yù)來執(zhí)行。而 且,這些過程不被解釋為排他實(shí)施例,而僅被說明性提供。圖4是概括地示出用于從用戶的搜索查詢中檢測旅游意圖的過程的操作 流程圖。該過程可使用諸如上述和圖l-3所示的各種計(jì)算設(shè)備來在各種計(jì)算環(huán) 境中實(shí)現(xiàn)。該過程開始于框401,在那里確定用戶的家庭位置。可在該步驟處執(zhí)行的 操作結(jié)合圖5詳細(xì)描述。簡而言之,評估用戶的搜索歷史以標(biāo)識該用戶最感興 趣的相關(guān)地理區(qū)域(該用戶的"家庭位置")。在框403,評估后續(xù)搜索查詢以檢測地方意圖。該地方意圖可以是指示搜 索查詢是否可能涉及特定地理區(qū)域的分?jǐn)?shù)或布爾值。可在該步驟處執(zhí)行的操作 結(jié)合圖6詳細(xì)描述。在框404,調(diào)查后續(xù)搜索査詢的主要査詢位置。如上所述,該主要查詢位 置可以是由特定搜索查詢暗示或援引的地理區(qū)域。例如,搜索查詢"曼哈頓酒店"暗示地理區(qū)域紐約市。另外,搜索項(xiàng)"白宮"和"林肯紀(jì)念碑"暗示華盛 頓特區(qū),即使這些搜索項(xiàng)中未標(biāo)識特定位置。在框405,針對已確定其地方意圖和主要査詢位置的特定搜索查詢檢測用戶的旅游意圖。旅游意圖可通過將具有地方意圖的搜索査詢的主要查詢位置與 用戶的家庭位置進(jìn)行比較來標(biāo)識。在這兩者不同的情況下,可推斷出旅游意圖。 標(biāo)識用戶的旅游意圖提供了可用于定制可呈現(xiàn)給用戶的促銷或廣告的附加信息。圖5是概括地示出用于從用戶的搜索歷史中標(biāo)識用戶的標(biāo)識位置的過程 的操作流程圖。在框501,收集用戶的搜索活動并將其存儲為搜索歷史。搜索 歷史可橫跨若干搜索會話,在每一會話期間執(zhí)行很少或非常多的搜索。搜索歷 史至少包括搜索查詢中的搜索項(xiàng),并且可包括搜索結(jié)果。在框503,為盡可能合理地多的搜索歷史中的搜索査詢標(biāo)識主要査詢位 置。該主要查詢位置如上所述地標(biāo)識,并且結(jié)合其對應(yīng)的搜索查詢來存儲。在框505,根據(jù)該實(shí)現(xiàn),用在框503處標(biāo)識的主要査詢位置來構(gòu)造位置樹。 該位置樹包含處于不同地理層(國家、省和城市)的位置節(jié)點(diǎn)。每一個節(jié)點(diǎn)都 具有2個屬性頻率和熵。在該實(shí)現(xiàn)中,該位置樹的根是"地球",下一層 是"國家",第三層是"州/省",而第四層是"城市/鎮(zhèn)"。該樹最初僅包含根節(jié)點(diǎn)。將在框503處檢測到的每一個位置按以下方式添 加到該位置樹 將根節(jié)點(diǎn)的頻率遞增1。 如果位置的國家已經(jīng)在樹中,則將該國家節(jié)點(diǎn)的頻率遞增1;否則追 加頻率=1的國家節(jié)點(diǎn)。 如果位置的州/省已經(jīng)在樹中,則將該州/省節(jié)點(diǎn)的頻率遞增1;否則 追加頻率=1的州/省節(jié)點(diǎn)。 如果位置的城市已經(jīng)在樹中,則將該城市節(jié)點(diǎn)的頻率遞增1;否則追 加頻率=1的城市節(jié)點(diǎn)。使用以下示例公式來為位置樹中的每一個節(jié)點(diǎn)計(jì)算熵熵節(jié)點(diǎn)1>上.戶1 一其中節(jié)點(diǎn)具有"n"個不同子節(jié)點(diǎn),這些子節(jié)點(diǎn)具有以下頻率fl, G, fn。 在框507,在構(gòu)建位置樹后,從該位置樹中確定家庭位置。此處呈現(xiàn)用于 確定家庭位置的許多技術(shù)中的一種特定技術(shù)。如果根節(jié)點(diǎn)的頻率小于某一頻率 閾值,則返回"未檢測到位置"。如果根節(jié)點(diǎn)的熵大于或等于某一熵閾值,則 返回"未檢測到位置"。否則,挑選具有最大頻率的國家節(jié)點(diǎn)。如果該國家節(jié)點(diǎn)的頻率小于某一頻率閾值,則返回"未檢測到位置"。否則,將該國家名稱設(shè)為所檢測到的用戶的國家。如果計(jì)算出的國家節(jié)點(diǎn)的熵大于或等于某一熵閾值,則返回所檢測到的國家作為用戶的位置。否則,挑選具有最大頻率的州/省子節(jié)點(diǎn)。如果該州/省節(jié)點(diǎn)的頻率小于某一頻率閾值,則返回所檢測到的國家作為用戶的位置。否則,將該州/省名稱設(shè)為所檢測到的用戶的州/省。如果計(jì)算出的州/省節(jié)點(diǎn)的熵大于或等于某一熵閾值,則返回所檢測到的州/省加上所檢測到的國家作為用戶的位置。否則,挑選具有最大頻率的城市/鎮(zhèn)子節(jié)點(diǎn)。如果該城市/鎮(zhèn)節(jié)點(diǎn)的頻率小于某一頻率閾值,則返回所檢測到的州/省加 上所檢測到的國家作為用戶的位置。否則將該城市/鎮(zhèn)、先前檢測到的州/省以 及所檢測到的國家設(shè)為用戶的家庭位置。圖6是概括地示出用于檢測搜索查詢的地方意圖的過程的操作流程圖。在 該特定實(shí)現(xiàn)中,檢測地方意圖分兩個階段進(jìn)行。執(zhí)行離線"訓(xùn)練階段"以構(gòu)造 地方意圖分類器,該分類器是可用于評估在線搜索查詢是否證實(shí)地方意圖的工 具。出于清楚的目的,在離線階段期間執(zhí)行的操作在圖6中的虛線框650內(nèi)示 出。在框601,收集用戶的在線搜索會話以供離線評估。該操作可由諸如搜索 引擎等通過網(wǎng)絡(luò)來提供信息搜索服務(wù)的計(jì)算設(shè)備來執(zhí)行。搜索引擎例行地在使 用搜索引擎服務(wù)執(zhí)行搜索的各個用戶之間進(jìn)行區(qū)分,并且經(jīng)常維護(hù)關(guān)于這些用 戶中的每一個或用戶組的搜索歷史信息。在這一實(shí)現(xiàn)中,搜索引擎可收集關(guān)于由用戶執(zhí)行的每一次搜索的信息,并且可以按會話來聚集各個搜索,其中術(shù)語 "會話"指的是其中用戶對于搜索引擎持續(xù)活動的間隔。應(yīng)提交任何活動(例 如,搜索查詢、搜索結(jié)果、點(diǎn)擊等),這可能是在某一闊值內(nèi)???03開始迭代循環(huán),其中評估在步驟601處存儲的每一個會話中的搜索 查詢以確定這些搜索查詢是否暗示地方意圖(框605)。在該特定實(shí)現(xiàn)中,該 操作可以按自動化的方式執(zhí)行,但也可由人類來執(zhí)行。該評估包括檢查每一個 搜索査詢以及或許搜索査詢中的搜索項(xiàng)以確定是否涉及地方意圖。例如,諸如 "馬來西亞加香烤肉屋菜單"等搜索查詢可以是用戶打算拜訪該餐廳或附近的 某個地方的強(qiáng)烈指示。在這種情況下,可將地方意圖歸結(jié)到該搜索查詢。相反, 諸如"華盛頓大學(xué)計(jì)算機(jī)科學(xué)系發(fā)表的研究論文"等搜索查詢暗示用戶正在搜 索供在線下載的信息而不是要拜訪華盛頓大學(xué),該搜索查詢將不證實(shí)地方意 圖。某些査詢就地方意圖可能具有歧義。例如,"西雅圖水手游戲"可能由對 去到游戲感興趣的用戶和只想知道分?jǐn)?shù)的用戶兩者來搜索。在這種情況下,可 使用用戶的家庭位置(如果知道的話)或其他用戶活動來消除意圖的歧義。例 如,如果用戶搜索過"水手票"并且確定該用戶的家庭位置在西雅圖附近,則 可取得更確信的地方意圖。該過程在所有在線會話上迭代(框607)。在框605,將對于一會話的每一次搜索査詢或者標(biāo)記為對應(yīng)于暗示地方意 圖的"真",或者標(biāo)記為對應(yīng)于未暗示地方意圖的"假"。為所評估的每一個 會話構(gòu)造搜索查詢及其相關(guān)聯(lián)的標(biāo)簽的列表(框609)。在框611 ,對在框609處構(gòu)造的搜索査詢和標(biāo)簽的列表應(yīng)用特征提取和選 擇方法。執(zhí)行該方法以標(biāo)識暗示地方意圖的每一搜索查詢或搜索結(jié)果中的特 征。例如,該方法可從每一查詢的搜索結(jié)果中提取實(shí)體名稱、項(xiàng)或其他內(nèi)容。 將所選特征和標(biāo)簽輸入到諸如支持向量機(jī)(SVM)或邏輯回歸(LR)程序等 訓(xùn)練程序中(框613)。該訓(xùn)練程序在統(tǒng)計(jì)上分析各個標(biāo)簽、搜索查詢、項(xiàng)和 其他輸入以對這些輸入中的每一個的"地方意圖"進(jìn)行分類和量化。來自該訓(xùn) 練程序的輸出變成"地方意圖分類器",其是用于即時評估新搜索查詢以檢測 地方意圖的程序。在框615,執(zhí)行地方意圖檢測的在線部分。地方意圖確定的在線部分在用戶連接到搜索引擎并執(zhí)行搜索時發(fā)生。這些操作可以與收集用戶的更多在線會 話和信息(例如,框601、框501)并行地執(zhí)行。應(yīng)當(dāng)理解,該在線地方意圖 檢測用附加訓(xùn)練和數(shù)據(jù)收集來改進(jìn)。簡而言之,在在線會話期間,搜索引擎將 每一新的搜索查詢提供給地方意圖分類器以確定是否存在或暗示地方意圖。如 果是,則設(shè)置指示該搜索查詢暗示地方意圖的標(biāo)簽。還可將用戶的家庭位置(如 果知道的話)與地方意圖分類器一起使用。在評估了搜索查詢以檢測地方意圖的情況下,操作可返回至圖4所示且以上描述的過程。盡管用對結(jié)構(gòu)特征和/或方法動作專用的語言描述了本主題,但可以理解, 所附權(quán)利要求書中定義的主題不必限于上述具體特征或動作。相反,上述具體 特征和動作是作為實(shí)現(xiàn)權(quán)利要求的示例形式公開的。
權(quán)利要求
1.一種用于檢測用戶的旅游意圖的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括從與用戶相關(guān)聯(lián)的搜索歷史中檢測所述用戶的家庭位置,所述搜索歷史中的至少多個單獨(dú)的搜索請求各自具有相關(guān)聯(lián)的主要查詢位置;從由所述用戶發(fā)出的后續(xù)搜索請求中檢測地方意圖,所述地方意圖包括與所述搜索請求相關(guān)聯(lián)的搜索主要查詢位置,所述搜索主要查詢位置包括與所述搜索請求相關(guān)的地理區(qū)域;以及將所述搜索主要查詢位置與所述家庭位置進(jìn)行比較以標(biāo)識到所述搜索主要查詢位置旅游的意圖。
2. 如權(quán)利要求1所述的方法,其特征在于,所述家庭位置包括對于所述搜索歷史的主導(dǎo)主要査詢位置。
3. 如權(quán)利要求1所述的方法,其特征在于,標(biāo)識所述家庭位置包括創(chuàng)建位 置樹,所述位置樹的每一個節(jié)點(diǎn)都包括所述搜索歷史中的搜索查詢。
4. 如權(quán)利要求3所述的方法,其特征在于,標(biāo)識所述家庭位置還包括計(jì)算 每一個搜索査詢的頻率和每一個搜索查詢的熵。
5. 如權(quán)利要求1所述的方法,其特征在于,所述家庭位置包括國家分量、 州/省分量和城市/鎮(zhèn)分量。
6. 如權(quán)利要求1所述的方法,其特征在于,檢測所述地方意圖還包括評估 所述后續(xù)搜索查詢以標(biāo)識所述搜索查詢中指示與所述后續(xù)査詢相關(guān)的地理區(qū) 域的項(xiàng)。
7. 如權(quán)利要求6所述的方法,其特征在于,檢測所述地方意圖還包括用于 評估所述搜索查詢中的項(xiàng)的人工干預(yù)。
8. 如權(quán)利要求1所述的方法,其特征在于,還包括基于所述旅游意圖來選 擇供呈現(xiàn)給所述用戶的廣告。
9. 如權(quán)利要求1所述的方法,其特征在于,標(biāo)識所述旅游意圖包括檢測與所述后續(xù)搜索查詢相關(guān)聯(lián)的地方意圖是不同于所述家庭位置的地理區(qū)域。
10. —種用計(jì)算機(jī)可執(zhí)行指令來編碼的計(jì)算機(jī)可讀介質(zhì),所述指令用于檢測用戶的旅游意圖,所述指令包括累積所述用戶的搜索歷史,所述搜索歷史包括多個搜索查詢;評估所述搜索歷史以標(biāo)識所述用戶的家庭位置,所述家庭位置對應(yīng)于所述搜索歷史中的至少一個搜索查詢的普遍的主要査詢位置; 從所述用戶接收后續(xù)搜索請求; 從所述后續(xù)搜索請求中檢測地方意圖;檢測所述后續(xù)搜索請求的搜索位置,所述搜索位置是與所述后續(xù)搜索請求 相關(guān)的地理區(qū)域;以及將所述所述位置與所述家庭位置進(jìn)行比較以標(biāo)識到所述主要查詢位置旅 游的意圖,所述旅游意圖包括所述家庭位置不同于所述搜索位置的指示。
11. 如權(quán)利要求10所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,標(biāo)識所述家 庭位置包括創(chuàng)建位置樹,所述位置樹的每一個節(jié)點(diǎn)都包括所述搜索歷史中的搜索查詢。
12. 如權(quán)利要求11所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,標(biāo)識所述家 庭位置還包括計(jì)算每一個搜索查詢的頻率和每一個搜索査詢的熵。
13. 如權(quán)利要求12所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,所述家庭位 置包括國家分量、州/省分量和城市/鎮(zhèn)分量。
14. 如權(quán)利要求10所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,檢測所述地方意圖還包括評估所述后續(xù)搜索查詢以標(biāo)識所述搜索査詢中指示與所述后續(xù) 查詢相關(guān)的地理區(qū)域的項(xiàng)。
15. 如權(quán)利要求10所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,檢測所述地 方意圖還包括用于評估所述搜索查詢中的項(xiàng)的人工干預(yù)。
16. 如權(quán)利要求10所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,還包括基于所述旅游意圖來選擇供呈現(xiàn)給所述用戶的廣告。
17. —種用計(jì)算機(jī)可執(zhí)行組件來編碼的計(jì)算機(jī)可讀介質(zhì),所述組件用于標(biāo)識用戶的旅游意圖,所述組件包括搜索引擎組件,其被配置成收集所述用戶的搜索歷史,所述搜索歷史包 括多個搜索査詢,所述搜索查詢中的至少一個具有第一主要查詢位置,所述搜 索引擎組件還被配置成返回與所述搜索查詢相關(guān)的搜索結(jié)果;位置檢測組件,其被配置成評估所述搜索查詢中的每一個以標(biāo)識包括所 述第一主要查詢位置的任何對應(yīng)的主要查詢位置,所述位置檢測組件還被配置 成評估后續(xù)搜索查詢以標(biāo)識第二主要查詢位置;以及位置分析組件,其被配置成評估所述搜索歷史中的多個搜索查詢,包括 由所述位置檢測組件標(biāo)識的任何主要査詢位置,以便標(biāo)識所述用戶的家庭位 置,所述家庭位置在所述第一主要查詢位置表示對于所述搜索歷史的最普遍的 主要查詢位置的情況下對應(yīng)于所述第一主要查詢位置。
18. 如權(quán)利要求17所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,所述搜索引 擎組件還被配置成將所述家庭位置與所述第二主要查詢位置進(jìn)行比較以確定 所述第二主要查詢位置是否不同于所述家庭位置,并且如果是,則指示旅游意圖。
19. 如權(quán)利要求18所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,所述搜索引擎組件還被配置成基于所述旅游意圖的指示來選擇供呈現(xiàn)給所述用戶的廣告。
20.如權(quán)利要求17所述的計(jì)算機(jī)可讀介質(zhì),其特征在于,所述位置檢測組件還被配置成執(zhí)行訓(xùn)練操作,其中所述位置檢測組件涉及用于標(biāo)識主要查 詢位置的人工干預(yù)。
全文摘要
分析用戶的搜索查詢歷史以確定該用戶的家庭位置。分析后續(xù)搜索查詢以辨別該搜索查詢是否包含地方意圖,這意味著該搜索查詢請求具有地理相關(guān)區(qū)域的信息。在搜索查詢具有地方意圖的情況下,將對應(yīng)于該搜索查詢的地理相關(guān)區(qū)域與用戶的家庭位置進(jìn)行比較以確定該搜索查詢是否暗示旅游意圖。
文檔編號G06F17/30GK101627384SQ200880007612
公開日2010年1月13日 申請日期2008年2月20日 優(yōu)先權(quán)日2007年3月8日
發(fā)明者H·戴, Y·李 申請人:微軟公司