使用本地語義評分的位置感知的制作方法
【專利說明】
【背景技術(shù)】
[0001]搜索引擎繼續(xù)獲得用于基于相對位置來識別對相關(guān)的搜索查詢的響應(yīng)的改善能力?;谖恢玫奶卣骺梢栽试S搜索引擎濾出與由用戶指定的位置(諸如用戶的當(dāng)前位置)無關(guān)的實(shí)體和/或其它結(jié)果?;诖祟愄卣?,一旦指定了位置,用戶可以確定附近服務(wù)是否是感興趣的,諸如是否存在附近飯店、零售店或感興趣的其它實(shí)體。雖然此類基于位置的搜索是有益的,但仍要求用戶指定初始位置以便開始搜索。因此,不熟悉特定地理區(qū)域的用戶具有使用搜索引擎來找到感興趣特征(諸如餐飲或娛樂)的有限能力。例如,用戶不能基于高級偏好或語義興趣來瀏覽區(qū)域或發(fā)現(xiàn)感興趣實(shí)體。
【發(fā)明內(nèi)容】
[0002]在各種方面,提供了用于確定描述關(guān)于地理區(qū)域的一個或多個特征的連續(xù)評分模型的系統(tǒng)和方法。該評分模型可以適合于結(jié)合來自點(diǎn)源以及區(qū)域(area)信息兩者的信息?;谠撛u分模型,用戶可以獲得用于任何期望位置處的一個或多個特征或期望地理區(qū)域的特征值。由于用連續(xù)函數(shù)來表示特征,所以還可以執(zhí)行用于任意地理區(qū)域的特征值的比較和/或?qū)⑿纬奢o助值的特征的組合。
[0003]提供本
【發(fā)明內(nèi)容】
是為了以簡化形式介紹下面在詳細(xì)描述中進(jìn)一步描述的概念的選擇。本
【發(fā)明內(nèi)容】
并不意圖識別要求保護(hù)的主題的關(guān)鍵特征或本質(zhì)特征,其也不意圖孤立地用作確定要求保護(hù)的主題的范圍的輔助。
【附圖說明】
[0004]下面參考附圖來描述本發(fā)明,在所述附圖中:
圖1一3示意性地示出了搜索環(huán)境中的特征分?jǐn)?shù)的顯示的示例。
[0005]圖4示意性地示出了用于顯示特征分?jǐn)?shù)信息的另一方法的示例。
[0006]圖5示意性地示出了用于顯示特征分?jǐn)?shù)信息的另一方法的示例。
[0007]圖6示意性地示出了適合于執(zhí)行本發(fā)明的某些實(shí)施例的網(wǎng)絡(luò)環(huán)境。
[0008]圖7是適合于在實(shí)現(xiàn)本發(fā)明的某些實(shí)施例時使用的示例性計算環(huán)境的框圖。
[0009]圖8 —10示出了根據(jù)本發(fā)明的某些實(shí)施例的方法的示例。
【具體實(shí)施方式】
[0010]概沭
在各種方面,提供了用于確定描述關(guān)于地理區(qū)域的一個或多個語義特征的平滑、連續(xù)函數(shù)的系統(tǒng)和方法。該平滑、連續(xù)函數(shù)可以適合于結(jié)合來自單個位置處的個別實(shí)體的信息以及一般地與某個類型的地理區(qū)域有關(guān)的信息?;谠摰讓雍瘮?shù),用戶可以獲得用于任何期望位置處的一個或多個特征或期望地理區(qū)域的特征值。由于用連續(xù)函數(shù)來表示語義特征,所以還可以執(zhí)行用于任意地理區(qū)域的特征值的比較。這允許識別例如具有最高餐飲或飯店分?jǐn)?shù)的城市內(nèi)的區(qū)域或具有餐飲、娛樂以及可及性分?jǐn)?shù)的期望組合的區(qū)域。用戶還可以選擇在期望的抽象水平調(diào)查地理區(qū)域的特征。
[0011]構(gòu)造用于特征的評分模型
作為提供特征信息時的第一步驟,可以識別與感興趣特征有關(guān)的各種類型的數(shù)據(jù)。然后可以使用所識別數(shù)據(jù)來擬合用于開發(fā)數(shù)據(jù)模型的基礎(chǔ)函數(shù),該數(shù)據(jù)模型在至少感興趣地區(qū)內(nèi)是連續(xù)的。
[0012]“特征”被定義為可以數(shù)值地表示為語義分?jǐn)?shù)或特征分?jǐn)?shù)的任何方便類型的信息。用于特征的特征分?jǐn)?shù)是基于被識別為與特征有關(guān)的底層數(shù)據(jù)而確定的。例如,一個類型的特征可以是“餐飲”特征,其中,餐飲分?jǐn)?shù)表示關(guān)于與特征分?jǐn)?shù)位置有關(guān)的飯店的數(shù)目、品質(zhì)和/或其它信息??梢詫⒈蛔R別為與特征分?jǐn)?shù)位置有關(guān)的單獨(dú)飯店中的每一個表示為有助于用于確定餐飲分?jǐn)?shù)的函數(shù)的數(shù)據(jù)點(diǎn)?;趯?yīng)于單獨(dú)數(shù)據(jù)點(diǎn)值的數(shù)據(jù)的其它特征可以包括實(shí)況音樂特征、酒吧或客棧特征、購物特征、綠地特征或者其中可以基于被識別為與特征有關(guān)的單獨(dú)實(shí)體或其它數(shù)據(jù)點(diǎn)來發(fā)展分?jǐn)?shù)的任何其它類型的特征??蛇x地,可以將單獨(dú)數(shù)據(jù)點(diǎn)稱為“無維度”數(shù)據(jù),因為單獨(dú)數(shù)據(jù)點(diǎn)當(dāng)在合理比例的地圖上顯示時不具有任何有意義的空間范圍。替代地,數(shù)據(jù)點(diǎn)通常與單個位置、諸如單個街道地址相關(guān)聯(lián)。
[0013]其它類型的特征可以基于用于一個定義的地理區(qū)域的數(shù)據(jù)。某些類型的特征可以對應(yīng)于基于到河流的距離或到主干道(諸如主要道路或公路)的距離的特征。此類特征一般地可以被描述為具有用于對應(yīng)于河流或道路/公路的地理區(qū)域的基于線的數(shù)據(jù)。可選地,此類特征可以稱為具有I維數(shù)據(jù),具有對應(yīng)于特征的地理空間路徑的“長度”維度。其它特征可以對應(yīng)于基于區(qū)域的值,諸如犯罪統(tǒng)計(針對“安全”特征)、人口密度、一個或多個附近街道上的汽車數(shù)目和/或平均速度(針對“交通”特征)或者基于與位置相關(guān)聯(lián)的一個或多個公立學(xué)校的“學(xué)校品質(zhì)”特征。此類特征可以可選地被稱為具有二維數(shù)據(jù)。
[0014]可以基于評分模型將可以表示為數(shù)值值的任何類型的特征表示為特征。某些潛在特征可以包括但不限于娛樂特征,諸如用于餐飲、酒、客棧、(現(xiàn)場)音樂、劇場、電影、競技、步行、雪上運(yùn)動、海景、旅游勝地或期望的任何其它類型的娛樂特征。如上述列表所指示的,許多娛樂特征表示對應(yīng)于點(diǎn)位置的特征,但某些特征(諸如海景)可表示基于線的數(shù)據(jù)。特征的其它示例可以是生活方式特征,諸如用于人口密度、交通、可及性(諸如與主干道的距離)、行人友好或步行適合性、自行車友好、學(xué)校品質(zhì)、犯罪、家庭友好或購物的特征。特征的其它示例可以包括社交媒體特征,諸如位置處的由社交媒體用戶的簽到的相對數(shù)目或針對位置的“喜歡”的數(shù)目。
[0015]“基本網(wǎng)格區(qū)域”指代供在確定連續(xù)函數(shù)以表示與特征相關(guān)聯(lián)的數(shù)據(jù)時所使用的單個網(wǎng)格區(qū)域。在確定用以表示與特征相關(guān)聯(lián)的數(shù)據(jù)的函數(shù)之前,至少對應(yīng)于相關(guān)感興趣區(qū)域的地區(qū)被劃分成包含多個基本網(wǎng)格區(qū)域的網(wǎng)格。優(yōu)選地,使用規(guī)則棋盤形布置來形成基本網(wǎng)格區(qū)域,諸如將區(qū)劃分成正方形、矩形或其它平行六邊形。單獨(dú)基本網(wǎng)格的尺寸可以是任何方便尺寸。一個選項是選擇大致上具有市中心區(qū)中的城市街區(qū)的尺寸的正方形基本網(wǎng)格。作為替換,基本網(wǎng)格的尺寸可以變化,諸如通過在市中心區(qū)使用較小基本網(wǎng)格區(qū)域和在農(nóng)村地區(qū)使用較大基本網(wǎng)格區(qū)域。優(yōu)選但不要求將相同的基本網(wǎng)格區(qū)域用于多個特征,諸如對所有特征使用相同的基本網(wǎng)格區(qū)域。這可以促進(jìn)將來自不同特征的特征分?jǐn)?shù)組合。
[0016]“基本函數(shù)”被定義為用來表示與基本網(wǎng)格區(qū)域中的特征相關(guān)聯(lián)的數(shù)據(jù)的至少一部分的函數(shù)。高斯函數(shù)表示用于表示基本網(wǎng)格區(qū)域內(nèi)的特征數(shù)據(jù)的方便選擇,但其它函數(shù)形式可以是適當(dāng)?shù)?。針對給定特征,可以使用一個或多個基本函數(shù)來表示基本網(wǎng)格區(qū)域內(nèi)的數(shù)據(jù)。例如,針對基于點(diǎn)或位置的數(shù)據(jù),可以使用單個(高斯)基本函數(shù)來擬合數(shù)據(jù)或在網(wǎng)格區(qū)域內(nèi)相等地間隔開的多個高斯曲線,或者高斯曲線可以與每個數(shù)據(jù)點(diǎn)相關(guān)聯(lián)。還可以使用其它替換方案,只要所述一個或多個基本函數(shù)可以用來表示基本網(wǎng)格區(qū)域內(nèi)的數(shù)據(jù)即可??梢灶愃频厥褂靡粋€或多個高斯函數(shù)來表示基本網(wǎng)格區(qū)域內(nèi)的基于線或基于區(qū)域的數(shù)據(jù)。然后可以使用分配給基于點(diǎn)、線和/或區(qū)域的特征數(shù)據(jù)的數(shù)據(jù)值來擬合一個或多個基本函數(shù)。
[0017]然后可以使用來自多個網(wǎng)格區(qū)域的基本函數(shù)來確定用于特征的評分模型。(替換地,如果特征數(shù)據(jù)具有適當(dāng)形式,則可以將評分模型直接地擬合到特征數(shù)據(jù)的至少一部分。)可以用各種方式來選擇被用于確定用于特征的評分模型的所述多個網(wǎng)格區(qū)域。在某些方面,具有基本函數(shù)的基本網(wǎng)格區(qū)域可以可用于諸如美國之類的大的地區(qū)。在此類方面,可以使用所有的可用網(wǎng)格區(qū)域來計算評分模型。作為替換,可以選擇在截止距離內(nèi)和/或滿足某個其它相關(guān)準(zhǔn)則的網(wǎng)格區(qū)域以便計算評分模型。優(yōu)選地,所選的多個網(wǎng)格區(qū)域允許計算感興趣地區(qū)(諸如由用戶識別的地區(qū))內(nèi)的連續(xù)評分模型。在替換實(shí)施例中,可以將大型地區(qū)(諸如美國)預(yù)先劃分成不同的多個網(wǎng)格區(qū)域,針對所述不同的多個網(wǎng)格區(qū)域中的每一個預(yù)先和/或周期性地計算評分模型。
[0018]可以將多種函數(shù)形式用于評分函數(shù)。用于計算評分模型的一個方法是初始嘗試針對每個不同的特征擬合不同函數(shù)形式的函數(shù)。適當(dāng)函數(shù)形式的示例包括高斯函數(shù)、指數(shù)函數(shù)以及三次函數(shù)。針對每個類型的函數(shù)形式,可以向每個基本網(wǎng)格區(qū)域分配函數(shù)。然后可以諸如用加權(quán)最小二乘回歸法將函數(shù)擬合到網(wǎng)格區(qū)域內(nèi)的基本函數(shù)。然后將在此初始嘗試期間提供最佳(或者期望的)擬合的函數(shù)形式選作用于針對該特征的評分模型的函數(shù)形式。
[0019]應(yīng)注意的是雖然向每個基本網(wǎng)格區(qū)域分配單獨(dú)函數(shù)以便構(gòu)建評分模型,但分配給基本網(wǎng)格區(qū)域的函數(shù)的值在用于基本網(wǎng)格區(qū)域的邊界處通常將不是零。替代地,來自(至少)相鄰網(wǎng)格區(qū)域的函數(shù)可以在網(wǎng)格區(qū)域內(nèi)具有有意義的非零值。因此,在網(wǎng)格區(qū)域之間的邊界處,評分模型可以仍是連續(xù)的,因為所有位置處的評分模型表示多個連續(xù)函數(shù)范圍內(nèi)的和。
[0020]在用以選擇用于評分模型的函數(shù)形式的初始擬合之后,可以將網(wǎng)格區(qū)域內(nèi)的底層數(shù)據(jù)和/或基本集函數(shù)正則化以去除遺漏或虛假數(shù)據(jù)的影響和/或使其最小化