国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      使用自然語言文檔中的地理信息的基于位置的系統(tǒng)的制作方法

      文檔序號:6586625閱讀:1007來源:國知局
      專利名稱:使用自然語言文檔中的地理信息的基于位置的系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及用于向基于位置的系統(tǒng)提供數(shù)據(jù)的裝置和方法。
      背景技術(shù)
      典型的基于位置的系統(tǒng)可以接收位置數(shù)據(jù),并且使用該數(shù)據(jù)來在電子地圖上建立 顯示,或者在汽車中提供路線引導(dǎo)信息。當(dāng)今,可以獲得這樣的系統(tǒng),其能夠連接到互聯(lián)網(wǎng)、 訪問諸如網(wǎng)絡(luò)服務(wù)這樣的數(shù)量有限的互聯(lián)網(wǎng)數(shù)據(jù)源,并且使用它們來提供不同的基于位置 的服務(wù)。這些系統(tǒng)依賴于向設(shè)備傳送以公知的格式存在的位置數(shù)據(jù)。通常,這種位置數(shù)據(jù)必 須遵從標(biāo)準(zhǔn)化的結(jié)構(gòu),以便設(shè)備能夠識別并使用它。例如,存在可用的標(biāo)準(zhǔn)化的XML格式, 其使得可以對位置信息進(jìn)行編碼。多種互聯(lián)網(wǎng)服務(wù)提供這些格式的信息。支持這些特定格 式的每種設(shè)備能夠使用這些互聯(lián)網(wǎng)服務(wù)提供的位置信息。 基于這種方式的系統(tǒng)從提供非常特定格式的信息的源中提取地理信息。這樣的系 統(tǒng)僅僅可以處理有限的一組數(shù)據(jù)提供者,并且考慮到它們不能處理處于一系列的不同且在 發(fā)生變化的格式下的位置數(shù)據(jù),因此這樣的系統(tǒng)是不靈活的。如果格式發(fā)生改變或者系統(tǒng) 要支持新的格式,則該系統(tǒng)需要被適當(dāng)?shù)財(cái)U(kuò)展。這可能要花費(fèi)很大努力,并且對于本領(lǐng)域的 設(shè)備來說,通常這根本是不可能的。 近來的技術(shù)通過處理使得系統(tǒng)能夠支持大量不同的結(jié)構(gòu)化的數(shù)據(jù)格式。這種技術(shù) 綜合了如何從結(jié)構(gòu)化數(shù)據(jù)提取位置信息和如何集成基于位置的服務(wù)所需的處理的方式。這 種技術(shù)的優(yōu)點(diǎn)之一在于,其使得本領(lǐng)域的系統(tǒng)能夠訪問新的數(shù)據(jù)源,并且其可以應(yīng)對數(shù)據(jù) 格式的結(jié)構(gòu)改變。雖然該技術(shù)在處理結(jié)構(gòu)化數(shù)據(jù)格式方面引入了靈活性,但是它處理不了 以非結(jié)構(gòu)化形式存在的地址位置信息,諸如具有系統(tǒng)未知的內(nèi)容和結(jié)構(gòu)的文本文檔或者互 聯(lián)網(wǎng)網(wǎng)頁中的地址位置信息。 當(dāng)今有一些方式能夠識別非結(jié)構(gòu)化文本資源中有限的一組地理信息類型。但是, 這些系統(tǒng)不適合于基于位置的服務(wù),因?yàn)樗鼈冎械拇蠖鄶?shù)僅僅識別洲、國家、州和(主要) 城市級的地理分辨率的位置。還沒有系統(tǒng)允許同時(shí)識別諸如國家、州等的粗粒度地理信息, 和街道與地址級的細(xì)粒度位置信息。對文檔中包含的所有地理信息的訪問,無論其地理分 辨率如何,對于根據(jù)由被分析的資源提供的信息進(jìn)行的導(dǎo)航和其他基于位置的服務(wù)來說都 是極重要的。 非結(jié)構(gòu)化的內(nèi)容在互聯(lián)網(wǎng)上到處都可以找到,但是在現(xiàn)有技術(shù)中,還不能被基于 位置的服務(wù)和設(shè)備自主地訪問。因?yàn)檫@個(gè)原因,在現(xiàn)有技術(shù)中,無法實(shí)現(xiàn)諸如制定旅行計(jì)劃
      4這樣的一系列應(yīng)用,因其依賴于對具有豐富但未結(jié)構(gòu)化的地理內(nèi)容的信息源的訪問。
      總之,互聯(lián)網(wǎng)和其他電子源可以提供大量數(shù)據(jù),這些數(shù)據(jù)包括非結(jié)構(gòu)化格式的、與地點(diǎn)的名稱和它們的地址有關(guān)的位置信息。本領(lǐng)域中既未公開又未啟示有一種可以利用這種非結(jié)構(gòu)化地理數(shù)據(jù)的基于位置的系統(tǒng),諸如汽車中的導(dǎo)航系統(tǒng)、便攜式導(dǎo)航系統(tǒng),或蜂窩電話。

      發(fā)明內(nèi)容
      本發(fā)明向?qū)Ш较到y(tǒng)提供了以下功能訪問可以在諸如網(wǎng)頁這樣的非結(jié)構(gòu)化文本文檔中找到的諸如地址和興趣點(diǎn)這樣的許多種地理信息。本發(fā)明的功能解除了用戶的手動提取和數(shù)據(jù)輸入的負(fù)擔(dān)。本發(fā)明的設(shè)備可以自主地訪問來自于之前僅可以被人讀取的源的位
      置信息。 本發(fā)明可以提供基于位置的設(shè)備,其具有互聯(lián)網(wǎng)連接,能夠訪問可以在非結(jié)構(gòu)化或者半結(jié)構(gòu)化文本資源中找到的諸如地址和興趣點(diǎn)這樣的許多種地理信息。本發(fā)明使得能夠從自然語言構(gòu)成的任何文檔中識別并提取位置信息。這包括純粹由文本構(gòu)成的文檔,以及像網(wǎng)頁或者電子郵件這樣的半格式化文檔。本發(fā)明能夠提取這些文檔中的所有地理信息,并且使用該信息來提供基于位置的服務(wù),例如通過導(dǎo)航系統(tǒng)和移動電話來提供路線引導(dǎo)。 本發(fā)明使得之前不可使用的非結(jié)構(gòu)化數(shù)據(jù)可被基于位置的系統(tǒng)訪問。本發(fā)明使得能夠處理非結(jié)構(gòu)化的自然語言,以便從中提取位置信息,并且使用所找到的位置向用戶提供基于位置的服務(wù)。因?yàn)閺臋C(jī)器的角度看,互聯(lián)網(wǎng)上現(xiàn)在可用的大多數(shù)內(nèi)容(人可讀的網(wǎng)頁等)是非結(jié)構(gòu)化的,因此這種方式向基于位置的系統(tǒng)開放了廣泛的另外的內(nèi)容。
      在一個(gè)實(shí)施例中,本發(fā)明包括一種用于操作基于位置的系統(tǒng)的方法,所述方法包括識別非結(jié)構(gòu)化電子文本中的地理信息。提取所識別的地理信息,其中包括街道信息、地址信息和/或興趣點(diǎn)的名稱等。確定所識別的地理信息可以指代的多個(gè)候選地理位置。選擇所述多個(gè)候選地理位置之一。在基于位置的服務(wù)中使用所選擇的地理位置的字母數(shù)字表示。本發(fā)明的系統(tǒng)執(zhí)行前述步驟中的每一個(gè)。 在另一實(shí)施例中,本發(fā)明包括一種用于操作基于位置的系統(tǒng)的方法,所述方法包括手動選擇互聯(lián)網(wǎng)網(wǎng)頁。識別所述網(wǎng)頁中的地理信息。所述地理信息包括地址信息和/或?qū)εd趣點(diǎn)的參考信息。從所述網(wǎng)頁中提取所識別的地理信息。在導(dǎo)航服務(wù)和/或地圖服務(wù)中使用所提取的地理信息。通過本發(fā)明的系統(tǒng)來自動執(zhí)行所述識別、提取和使用步驟。
      在又一實(shí)施例中,本發(fā)明包括一種用于操作基于位置的系統(tǒng)的方法,所述方法包括識別非結(jié)構(gòu)化電子文本中的多個(gè)部分的地理信息。從所述文本中提取所識別的多個(gè)部分的地理信息。確定所識別的多個(gè)部分的地理信息其中之一可以指代的多個(gè)候選地理位置。選擇所述多個(gè)候選地理位置之一。所述選擇步驟取決于所識別的多個(gè)部分的地理信息中的其他部分。查明所選擇的地理位置的地理坐標(biāo)。在基于位置的服務(wù)中使用所選擇的地理位置的地理坐標(biāo)。 本發(fā)明的優(yōu)點(diǎn)在于,其解決了互聯(lián)網(wǎng)和其他源上找到的非結(jié)構(gòu)化內(nèi)容與基于位置的服務(wù)所提供的功能之間的鴻溝。 另一個(gè)優(yōu)點(diǎn)在于,本發(fā)明使基于位置的系統(tǒng)能夠使用許多非結(jié)構(gòu)化地理信息源。


      通過參照下面結(jié)合附圖對本發(fā)明的實(shí)施例進(jìn)行的描述,本發(fā)明的上述及其他特征 和目的,以及獲得它們的方式將變得更加顯而易見,并且將更好地理解本發(fā)明本身,在附圖 中 圖la是根據(jù)本發(fā)明的一個(gè)實(shí)施例、從網(wǎng)站wikitravel. org獲得的與旅行和旅行 者相關(guān)的地理解析文本的樣本; 圖lb是根據(jù)本發(fā)明的一個(gè)實(shí)施例、對從圖la的文本中獲得的地理編碼位置參考 信息進(jìn)行的地圖可視化; 圖2是本發(fā)明的基于位置的裝置的一個(gè)實(shí)施例的框圖;以及 圖3是本發(fā)明的用于操作基于位置的系統(tǒng)的方法的一個(gè)實(shí)施例的流程圖。 對應(yīng)的標(biāo)號指示全部數(shù)個(gè)視圖中對應(yīng)的部分。雖然附圖表示本發(fā)明的實(shí)施例,但
      是附圖并不必然按照比例繪制,并且可以放大某些特征以便更好地說明和解釋本發(fā)明。雖
      然本文中闡述的示例以數(shù)種形式說明了本發(fā)明的實(shí)施例,但是下面公開的實(shí)施例并不意圖
      是窮舉性的,或者被解釋為將本發(fā)明的范圍限制在所公開的精確形式。
      具體實(shí)施例方式
      后文所公開的實(shí)施例并不意圖是窮舉性的,或者將本發(fā)明限制在在以下說明中公 開的精確形式。相反,選擇和描述這些實(shí)施例是為了使本領(lǐng)域內(nèi)技術(shù)人員可以使用其教導(dǎo)。
      本發(fā)明可以使用的地理信息源包括在線旅行指南、旅行報(bào)告、黃頁以及示出(聯(lián) 系)地址的企業(yè)和個(gè)人主頁等。另外,本發(fā)明使得可以處理電子郵件和個(gè)人消息中包含的 地理信息。圖la用粗字體示出具有有價(jià)值的地理信息的旅行指南的提取。圖la是來自 互聯(lián)網(wǎng)網(wǎng)站wikitravel.org的與旅行和旅行者相關(guān)的地理解析(geo-parsed)文本的樣 本。出于在本文中進(jìn)行說明的目的,用粗字體示出被本發(fā)明識別為位置參考的參考信息 (reference)。但是,應(yīng)當(dāng)理解,網(wǎng)頁并不一定要用粗體或者任何其他特殊字體來提供這些 參考信息。盡管該地理信息是在非結(jié)構(gòu)化的自然語言文本中,但是該地理信息也可以被本 發(fā)明識別。 本發(fā)明的設(shè)備提取地理信息,并且提供基于位置的服務(wù)??梢砸栽S多方式來使用 圖la的文本的地理內(nèi)容。例如,該設(shè)備可以將這些位置呈現(xiàn)在地圖上,在地圖上可以用這 些位置進(jìn)行路線引導(dǎo)。在圖lb中示出了這種示例性的使用情況,其示出了在地圖中對來自 圖la的文本的地理編碼(geo-coded)位置參考信息進(jìn)行的可視化。該特定可視化的地理 區(qū)域是舊金山市。 本發(fā)明的設(shè)備能夠提取任何地理分辨率的地理信息。所述地理信息可以包括標(biāo)示 特定地點(diǎn)位置的地理坐標(biāo),以及任意大小的地理區(qū)域和地理政治實(shí)體(例如,國家、州、縣、 省等)。所述地理信息還可以包括諸如山、丘陵、湖泊、河流等的地理特征,和諸如城市、城 鎮(zhèn)、村莊、居民區(qū)和轄區(qū)這樣的居住地。本發(fā)明的設(shè)備能夠找到興趣點(diǎn),諸如景點(diǎn)、機(jī)場、火 車站和在文化與歷史上重要的地理實(shí)體。此外,該設(shè)備能夠識別許多種交通基礎(chǔ)設(shè)施,諸如 公路、高速公路、州際公路、道路、街道,以及騎行和步行徑和路徑。另外,本發(fā)明涵蓋的可識 別實(shí)體組可以包括街道地址與完整地址、郵政編碼以及電話號碼。電話號碼間接地標(biāo)示地理區(qū)域或者特定地點(diǎn)位置(例如,旅館或者飯店)。 為了檢測地理信息,本發(fā)明的系統(tǒng)可以執(zhí)行位置識別工作流中的數(shù)個(gè)處理步驟。首先,為了分離出可能的地理位置,可以將各種語言學(xué)方法應(yīng)用于非結(jié)構(gòu)化文本。然后,所提取的位置信息可以在地理上被消除歧義,并且以標(biāo)準(zhǔn)化數(shù)據(jù)格式被存儲。本發(fā)明的處理可以使設(shè)備能夠被配備各種不同的基于位置的服務(wù),本發(fā)明使這些基于位置的服務(wù)能夠利用經(jīng)分析的地理數(shù)據(jù)。圖2說明了與本發(fā)明的基于位置的裝置10的一個(gè)實(shí)施例相關(guān)聯(lián)的系統(tǒng)工作流。 第一處理步驟可以是獲取數(shù)據(jù),所述數(shù)據(jù)需要被分析以獲得位置信息。出于此目的,本發(fā)明的基于位置的設(shè)備12能夠訪問一系列的處于不同格式和不同位置的非結(jié)構(gòu)化和半非結(jié)構(gòu)化文檔。例如,本發(fā)明的設(shè)備可以訪問可以被存儲在該設(shè)備自身上的文本文檔14,諸如純文本TXT文件、AdobePDF、Microsoft Word文檔等。該設(shè)備還可以使用語音識別技術(shù)(例如,語音文本轉(zhuǎn)換),以允許用戶通過向系統(tǒng)講話來輸入內(nèi)容。使用標(biāo)準(zhǔn)的無線或者有線數(shù)據(jù)連接,該設(shè)備還可以訪問在其外部存儲的信息16,諸如網(wǎng)頁、電子郵件、文本消息等。即,設(shè)備12可以具有網(wǎng)絡(luò)瀏覽、收發(fā)電子郵件和傳送文本消息的能力。
      除了訪問可以存儲在網(wǎng)絡(luò)服務(wù)器上的基于網(wǎng)絡(luò)的電子文檔之外,設(shè)備12還能夠訪問諸如智能電話、膝上型計(jì)算機(jī)等的其他設(shè)備上的文檔16。標(biāo)準(zhǔn)的通信和連接技術(shù)可以用來使得本發(fā)明的設(shè)備能夠訪問智能電話、膝上型計(jì)算機(jī)等上的此類文檔。
      在非結(jié)構(gòu)化的自然語言文檔對于本發(fā)明的設(shè)備為完全可用之后,可以在地理解析模塊18中開始對文檔進(jìn)行地理解析的語言分析階段。在此階段期間,可以將文本分解成語句和單詞。基于語義和語法分析的語言解析可以應(yīng)用于文檔和語句結(jié)構(gòu)。因此,可以確定文檔的每個(gè)元素的詞語類型,諸如動詞、名詞、代詞、命名實(shí)體(named entity)等。
      基于這種分解成結(jié)構(gòu)元素的處理,可以從文本中提取可能的位置對象(locationreferent)20。這可以通過考慮詞語類型和它們的文本順序來實(shí)現(xiàn)?;诟怕?,例如,動詞幾乎不可能是位置對象,而前面是介詞的命名實(shí)體(即,與具體語言的語法沒有直接關(guān)系的名詞/詞語/名稱)更可能是可能的位置對象。 本發(fā)明可以應(yīng)用的另 一 種方法使用指示位置的關(guān)鍵字,諸如"RedRockCanyon,,(紅石峽谷)中的"Canyon,,、"Chestnut Street,,(栗樹街)中的"Street,,、"Mt. Whitney"(惠特尼山)中的"Mt."等。在一個(gè)實(shí)施例中,本發(fā)明還考慮了以下情況諸如完整地址這樣的更復(fù)雜的位置對象包括諸如街道號碼、街道名稱、郵政編碼、城市名等多個(gè)部分。電話號碼和郵政編碼也標(biāo)示位置,并且也可以在地理解析處理中被識別。
      為了獲得可行的地理解析結(jié)果,本發(fā)明可以采用通常用于信息提取任務(wù)的不同方式。 一些這樣的方式在文獻(xiàn)Eikvil L. (1999) , InformationExtraction from World WideWeb_A survey, Technical Report 945, NorwegianComputing Center中有描述,特此通過引用將該文獻(xiàn)并入本文。 本發(fā)明也可以采用信息提取技術(shù),諸如來自知識工程領(lǐng)域的語言規(guī)則集。 一些這樣的語言規(guī)則集在文獻(xiàn)Cunningham, H. , Wilks, Y. , and Gaizauskas, R. (1996), GATE-AGeneral Architecture for Text Engineering中有描述,特此通過弓l用將該文獻(xiàn)并入本文。這種方式采用由有經(jīng)驗(yàn)的語言學(xué)家手動編制的語言規(guī)則集。這些規(guī)則可以被調(diào)整來應(yīng)用在本發(fā)明中,以使得能夠提取位置對象。
      7
      本發(fā)明還可以采用可以被監(jiān)督或者不被監(jiān)督的自動訓(xùn)練。自動訓(xùn)練的一些技 術(shù)在文獻(xiàn)Nadeau, D. , Turney, P. , and Matwin, S. (2006) , Unsupervisednamed-entity recognition -Generating gazetteers and resolving ambiguity, inAdvances in Artificial Intelligence, pages 266-277, Springer Berlin中有描述,特此通過弓l用將 該文獻(xiàn)并入本文。基于一定數(shù)量的適當(dāng)訓(xùn)練數(shù)據(jù),可以訓(xùn)練出一模型,該模型進(jìn)一步用于從 先前未見的文本中提取位置對象。 本發(fā)明還可以采用在之前兩個(gè)段落中描述的語言規(guī)則集和自動訓(xùn)練的混合或 者組合。 一些這樣的混合方式在文獻(xiàn)Mikheev, A. , Grover, C. , andMoens, M. (1998), Description of the LTG system used for MUC-7中有描述,特此通過引用將該文獻(xiàn)并入 本文??梢允褂谜Z言規(guī)則來收集數(shù)據(jù)集,然后可以在該數(shù)據(jù)集上對系統(tǒng)進(jìn)行訓(xùn)練。這種方 式可以統(tǒng)一基于機(jī)器學(xué)習(xí)的系統(tǒng)的靈活性與欠靈活的知識工程方式的高識別率兩種優(yōu)點(diǎn)。
      語言解析可以使得能夠識別任何地理分辨率和任何形式的位置對象??梢酝暾?(例如,"100 Main Street"(主街100號),"San Franciscolnternational Airport"(舊 金山國際機(jī)場))或者以縮寫形式(例如,"100Main","San Francisco International"或 者"SF0")寫出地理對象。還可以考慮位置同義詞,諸如"The Big A卯le"(紐約市)或者 "The Windy City"(芝加哥)。 可以對所提取的地理信息進(jìn)行地理編碼。本發(fā)明可以從文本資源中提取位置 對象,并且進(jìn)一步消除這些位置對象在地理上的歧義。該處理步驟可以被稱為位置對象 的"地理編碼"或者"確立地理空間背景(geospatialgrounding)",并且可以使得向?qū)ο?分配準(zhǔn)確的地理坐標(biāo)。 一些現(xiàn)有的地理編碼方法和啟發(fā)式方法(heuristics)的概述在 文獻(xiàn)Leidner, J丄(2007), Toponym Resolution in Text, PhD thesis, University of Edinburgh中有描述,特此通過引用將該文獻(xiàn)并入本文。 本發(fā)明的地理編碼步驟可以基于從先前的地理解析階段所提取的位置對象。響應(yīng) 于位置名稱可能有歧義的事實(shí),本發(fā)明的系統(tǒng)可以首先確定每個(gè)對象的一組可能的候選。 對于像"New York City"或者"3157 Fillmore St, San Francisco, CA"這樣的對象可能 僅有一個(gè)候選,但是對于諸如"Georgia"(喬治亞)、"Springfield"(斯普林菲爾德)或者 "100 Main Street"這樣的對象可能有數(shù)個(gè)位置候選?;诓煌膯l(fā)式方法,本發(fā)明可 以對各個(gè)位置候選進(jìn)行加權(quán)。這些啟發(fā)式方法中的一些可以根據(jù)這些候選和地理中心之間 的地理距離而分配權(quán)重。可以通過考慮文檔中所提及的所有位置來確定該中心。其他啟發(fā) 式方法依賴于文本上下文和到無歧義的對象的地理距離,并且依賴于各個(gè)位置候選之間的 地理關(guān)系。在選擇多個(gè)候選地理位置之一的操作中也可以考慮這些候選地理位置的地理中 心。 在上述的啟發(fā)式處理期間,本發(fā)明的系統(tǒng)可以分辨像"Downtown"(商業(yè)區(qū))或者 "Chinatown"(唐人街)這樣的位置對象,并且將它們分配給文本中的某處提及的特定城 市。該系統(tǒng)還可以使諸如"466 University Ave"(大學(xué)街466號)這樣的部分地址變完 整。使用該技術(shù)使得可以使地址變完整,即使當(dāng)該地址的各部分散布在文檔中的數(shù)個(gè)段落 中時(shí)也是如此。 在地理信息已經(jīng)被提取并提煉之后,可以將其移交給基于位置的服務(wù)。系統(tǒng) 的最終輸出可以是一組已確立地理背景的位置對象,其包括完全合格的地址和/或一組地理坐標(biāo)。這些位置可以被轉(zhuǎn)換為本發(fā)明的設(shè)備提供的基于位置的服務(wù)所能理解的結(jié)構(gòu)化格式(包括地理坐標(biāo))??梢员凰鱿到y(tǒng)識別的地理編碼位置對象的示例包括"Coit Tower" — Coit Tower, SanFrancisco, USA(37. 802650, -122.405720);"466 University Ave,, — 466University Avenue, Palo Alto, CA 94301,USA(37. 44773, _122. 159735);以及"LAX,,一 Los Angeles International Airport, LosAngeles, USA(33. 944080,-118. 408260)。 所產(chǎn)生的位置對象20可以被移交給本發(fā)明的基于位置的服務(wù)22。例如,本發(fā)明的設(shè)備可以在地圖可視化模塊24中顯示所產(chǎn)生的位置對象。可替代地,本發(fā)明的設(shè)備的導(dǎo)航模塊26可以計(jì)算前往所產(chǎn)生的位置對象的路線。 基于位置的服務(wù)22可以包括其他服務(wù)30,諸如基于位置的游戲、地理營銷服務(wù)和移動約會服務(wù)。更一般而言,其他服務(wù)30可以包括依賴于用戶的位置或者用戶感興趣的位置的任何電子服務(wù)。 可以在本發(fā)明的設(shè)備內(nèi)部或者外部執(zhí)行包括地理解析和地理編碼的所有上述處理步驟,以適應(yīng)不同的設(shè)備限制。如果在設(shè)備外部執(zhí)行,則可以在設(shè)備和服務(wù)器之間建立無線或者有線數(shù)據(jù)連接。該設(shè)備可以向服務(wù)器發(fā)送要處理的地理信息資源,并且在處理結(jié)束之后,可以從該服務(wù)器接收一組已確立地理空間背景的位置對象。 現(xiàn)在將描述本發(fā)明的多個(gè)不同的應(yīng)用或者使用情況。在第一種使用情況下,本發(fā)明用于制定旅行計(jì)劃。例如,假定個(gè)人A在他的計(jì)算機(jī)上計(jì)劃到舊金山的旅程。還假定個(gè)人A從未去過舊金山,因此他試圖從互聯(lián)網(wǎng)獲得關(guān)于該城市的更多信息。在瀏覽了一段時(shí)間后,他找到兩個(gè)信息源,這兩個(gè)信息源提供了關(guān)于要看什么、要做什么、在哪里吃飯和住宿等有價(jià)值的信息。他發(fā)現(xiàn)的有用的兩個(gè)信息源是網(wǎng)站wikitravel. org/en/San—Francisco和該城市的官方游客網(wǎng)站onlyinsanfrancisco. com,這兩個(gè)信息源均與個(gè)人A的興趣點(diǎn)(舊金山)有關(guān)。 個(gè)人A現(xiàn)在根據(jù)現(xiàn)有技術(shù)通常所做的是打印出這些網(wǎng)頁,因?yàn)檫@些網(wǎng)頁的內(nèi)容不能被他的導(dǎo)航系統(tǒng)自主地訪問。然后,他必須向?qū)Ш皆O(shè)備手動輸入他想要拜訪的每個(gè)位置。
      但是,使用本發(fā)明,個(gè)人A所要做的僅僅是告訴設(shè)備他在使用其家庭計(jì)算機(jī)時(shí)找到的網(wǎng)頁的互聯(lián)網(wǎng)地址。這可以通過以下方式中的任意一種來執(zhí)行通過將網(wǎng)頁地址鍵入或復(fù)制到設(shè)備中來手動選擇網(wǎng)頁;或者在另一實(shí)施例中,家庭計(jì)算機(jī)直接將網(wǎng)頁地址傳輸給設(shè)備。接著,該設(shè)備(其可以是導(dǎo)航設(shè)備、移動電話等形式)自主地訪問網(wǎng)頁的內(nèi)容、處理它們,并且使一個(gè)包含所有提及位置的列表對用戶可用。現(xiàn)在,用戶A能夠通過從所識別的位置的列表中選擇目的地而在設(shè)備上直接計(jì)劃旅程。使用本發(fā)明,不像使用現(xiàn)有技術(shù)那樣需要用戶A手動輸入期望的位置。用戶A能夠?qū)Ш降皆谠粗刑峒暗奶囟ㄅd趣點(diǎn),諸如飯店或者旅館,或者他可以計(jì)劃從一個(gè)興趣點(diǎn)到另一個(gè)興趣點(diǎn)的旅程。用戶A可以在不用手動輸入位置信息的情況下計(jì)劃整個(gè)觀光旅行。 在另一使用情況下,用戶A在本發(fā)明的設(shè)備自身上使用其內(nèi)置的網(wǎng)絡(luò)瀏覽器來計(jì)劃旅程。在他找到感興趣的網(wǎng)頁后,他使用該網(wǎng)絡(luò)瀏覽器的一個(gè)功能,該功能用來將網(wǎng)頁地址自動傳送到該設(shè)備的提取位置信息的部件。該附加功能消除了用戶必須手動重新輸入網(wǎng)頁地址的負(fù)擔(dān)。 在涉及制定旅行計(jì)劃的另一使用情況下,本發(fā)明被應(yīng)用到個(gè)人旅行報(bào)告和旅途。假定旅行者B對關(guān)于一段旅途的個(gè)人旅行報(bào)告感興趣(其中,可以在網(wǎng)頁travelpod. com/travel_blog_entries/twittg/rtw/1127319060/tpod. html中找到該個(gè)人旅行報(bào)告的示例),并且假定旅行者B想要跟隨作者的足跡。本發(fā)明的設(shè)備可以分析個(gè)人旅行報(bào)告,并且提取所有有價(jià)值的地理信息?;谖谋境霈F(xiàn)的順序,旅行者B可以在他的旅程中跟隨作者的足跡,并且參觀相同的地點(diǎn)。 在又一使用情況下,本發(fā)明用于個(gè)人位置推薦或者通知。假定用戶C的朋友最近遷居到了新的地點(diǎn)。該朋友向用戶C發(fā)送電子郵件,邀請用戶C參加他的暖房派對。用戶C的本發(fā)明的導(dǎo)航系統(tǒng)從電子郵件中提取所提及的地址,并且引導(dǎo)C前往他的朋友的新住處。 幾天后,用戶C從朋友那收到邀請他前往在Middlefield Rd和UniversityAve十字路口處新開的飯館。用戶C的本發(fā)明的導(dǎo)航設(shè)備處理這封電子郵件,并且基于PaloAlto, CA (帕羅奧多,加州)是這些街道交叉的僅有城市這一事實(shí),將用戶C弓I導(dǎo)到該市的所述十字路口處的飯館。在多個(gè)城市都有十字路口 (諸如Chest皿t Street和Main Street)的情況下,本發(fā)明的導(dǎo)航設(shè)備可以選擇最接近用戶C的當(dāng)前位置的位置。用于處理有歧義的位置的附加策略可以使用文本中包含的進(jìn)一步的地理信息來確定文中可能指代哪個(gè)位置候選。 在本發(fā)明的再一使用情況下,一位朋友發(fā)送電子郵件消息來請求從"LAX"接他。本
      發(fā)明的導(dǎo)航設(shè)備將LAX識別為Los Angeles InternationalAirport的通用縮寫?;谠?br> 信息和用戶的當(dāng)前位置,導(dǎo)航設(shè)備計(jì)算路線和估計(jì)到達(dá)該機(jī)場的時(shí)間。 在又一使用情況下,騎行者或者步行者可以使用本發(fā)明。假定用戶D喜歡騎車和
      步行。因此,用戶D經(jīng)常使用諸如trail link, com或者trails, com這樣的網(wǎng)站來尋找新的
      和感興趣的路徑。本發(fā)明的導(dǎo)航設(shè)備能夠從網(wǎng)頁中提取出路徑或者步行徑,并且將它們用
      于路線引導(dǎo)的目的。 在再一使用情況下,網(wǎng)絡(luò)瀏覽器具有豐富的位置標(biāo)簽。假定用戶E使用在本發(fā)明的設(shè)備上運(yùn)行的網(wǎng)絡(luò)瀏覽器來瀏覽旅行相關(guān)的網(wǎng)站。在向用戶E顯示內(nèi)容的同時(shí),該設(shè)備還識別文本中所提及的位置。該設(shè)備的網(wǎng)絡(luò)瀏覽器以其可以利用所識別的位置的方式被擴(kuò)展。例如,該設(shè)備的網(wǎng)絡(luò)瀏覽器可以對所顯示的網(wǎng)頁中的這些位置進(jìn)行高亮,并且使用戶E能夠選擇所高亮的位置之一。在用戶E進(jìn)行選擇后,該瀏覽器可以使用戶E能夠從針對該位置的一系列基于位置的服務(wù)中進(jìn)行選擇,諸如在地圖上顯示該位置或者計(jì)算前往該位置的路線。 本發(fā)明提供的另一基于位置的服務(wù)使用戶能夠獲得更多關(guān)于特定位置的信息。例如,可以是關(guān)于飯店或者旅館的信息。基于所提供的企業(yè)名、街道地址或者電話號碼,本發(fā)明的系統(tǒng)可以查找額外的信息,諸如用戶/客人的評論、維基百科(Wikipeida)上的描述、官方主頁等。該信息可以顯示在在瀏覽器中,或者該信息可以以更適合于基于位置的設(shè)備的方式被處理并顯示。 如上所述,本發(fā)明可以提供移動或者非移動的系統(tǒng),其可以使用在非結(jié)構(gòu)化電子文檔中提供的大量地理信息。在此類文檔中嵌入的信息不能由現(xiàn)有技術(shù)的系統(tǒng)以自動的方式進(jìn)行處理。而本發(fā)明自主地提取位置信息,并且針對找到的位置提供一系列基于位置的服務(wù)。
      本發(fā)明的另一新穎方面在于,用戶不需要向他們的設(shè)備手動輸入互聯(lián)網(wǎng)上或者其 他電子文檔中已有的信息。而是從這些文檔中自動提取該信息,并且將該信息發(fā)送到本發(fā) 明的設(shè)備。 本發(fā)明的又一新穎方面在于,不需要適應(yīng)數(shù)據(jù)格式和數(shù)據(jù)源的改變。這是因?yàn)樗?br> 述系統(tǒng)獨(dú)立于結(jié)構(gòu)化的位置信息,并且數(shù)據(jù)源的改變不會對處理有不利影響。 再一新穎方面在于,本發(fā)明的系統(tǒng)能夠識別從洲級到地址級(包括街道名和房屋
      號)的任何地理分辨率的位置對象,并為這些位置對象確立地理空間背景?,F(xiàn)有技術(shù)的系
      統(tǒng)不能識別特定地理分辨率以下的位置對象和為這些位置對象確立地理空間背景。 又一新穎方面在于,本發(fā)明提供了對電子文本文檔中所提及的所有地理位置進(jìn)行
      高亮的諸如網(wǎng)絡(luò)瀏覽器這樣的內(nèi)容查看器。該內(nèi)容查看器在用戶選擇了這些位置之一后進(jìn)
      一步提供基于位置的服務(wù)。 文檔可以駐留在設(shè)備12內(nèi)部或者外部。如果文檔駐留在外部,則可以使用瀏覽器 28或者使用其他手段來訪問它們,以將該文檔傳送到設(shè)備內(nèi)。 步驟302識別地址、部分地址、興趣點(diǎn)的名稱等。所有這些描述是對地理位置的 直接參考信息。但是,地理解析模塊18還能夠識別對位置的間接參考信息,諸如稱作"the bridge"(橋)或者"spans the Golden Gate"(跨越金門海峽)。如果文本上下文使其清 楚,則地理解析模塊18將這些間接參考信息設(shè)置為與"Golden Gate Bridge"(金門大橋) 相關(guān)。 在圖3中說明了本發(fā)明的用于操作基于位置的系統(tǒng)的方法300的一個(gè)實(shí)施例。在 第一步驟302中,識別非結(jié)構(gòu)化電子文本中多個(gè)部分的地理信息。該地理信息包括街道信 息、地址信息和/或?qū)εd趣點(diǎn)的參考信息。例如,如圖la中所示,網(wǎng)頁的非結(jié)構(gòu)化電子文 本包括用粗字體指示的各個(gè)部分的地理信息?;谖恢玫脑O(shè)備12可以使用地理解析模塊 18(圖2)來識別這些部分的地理信息。所述地理信息包括形式為"899 Pine Street"(松 樹街899號)、"Washington Square"(華盛頓廣場)和"Union Square"(協(xié)和廣場)的街 道信息和地址信息。所述地理信息包括對興趣點(diǎn)的參考信息,諸如"Telegr即h Hill"(電 矛艮山)、"Golden Gate Bridge',禾口 "Chinatown',。 接著,在步驟304中,從文本中提取所識別的多個(gè)部分的地理信息。即,地理解析 模塊18從先前處理的文檔中提取上述地理信息。 在下一步驟306中,確定所識別的多個(gè)部分的地理信息其中之一可以指代的多個(gè) 候選地理位置。某些所識別部分的地理信息指代的特定地理位置(諸如"San Francisco"、 "United States,,禾口 "899 Pine Street, San Francisco, California 94108,,)可會g是清 楚的。但是,其他的所識別部分的地理信息在它們指代的特定地理位置方面可能是有歧義 的。因此,通過地理編碼模塊20來編輯出這種有歧義的地理信息的可能解釋的列表。例如, "WashingtonSquare"、"Chinatown"和"Union Square"可能都是有歧義的,因?yàn)?,孤立地?慮這些部分的地理信息中的每一個(gè)時(shí),有可能無法確定這些部分的地理信息指代哪些特定 地理位置。這種歧義性可能是因?yàn)橐韵率聦?shí)可能在世界上的多個(gè)城市中找到"Washington Square"、"Chinatown"禾卩"UnionSquare"中的每一個(gè)。因此,設(shè)備12可以與互聯(lián)網(wǎng)進(jìn)行交 互,以編輯出具有"Washington Square"的城市的第一列表;具有"Chinatown"的城市的 第二列表;以及具有"Union Square"的城市的第三列表。另外,設(shè)備12可以在編輯候選地理位置的列表時(shí)考慮在同一電子文檔中討論的城市、縣和國家。其他有歧義的地理信息可能在縣級(即,Marin County (馬林縣))、城市級(即,"Springfield")或者州級(即,"Georgia,,)。 在步驟308中,選擇多個(gè)候選地理位置中的一個(gè)。這意味著地理編碼模塊20通過從有歧義的候選的列表中選擇一個(gè)候選來消除歧義。該選擇取決于所識別的多個(gè)部分的地理信息中的其他部分。例如,"WashingtonSquare"的候選位置的列表可能包括世界上具有"Washington Square"的數(shù)百個(gè)城市。為了在該列表上選擇這些候選位置中的一個(gè),可以考慮該列表上的其他所識別部分的地理信息。即,地理編碼模塊20可以考慮以下情況"San Franci sco "在該電子文檔中的其他所識別部分的地理信息中被包括了四次。地理編碼模塊20可以進(jìn)一步考慮以下情況San Francisco在候選位置的列表上,或者可以無歧義地作為該電子文檔中的其他所識別部分的地理信息(諸如"North Beach"(北沙灘)和"Golden Gate Bridge")的唯一候選位置。此外,地理編碼模塊20可以進(jìn)一步考慮以下情況San Francisco鄰近或者接近"Marin County"的一個(gè)候選位置,該候選位置位于跨金門海峽水體與舊金山相對的另一端。因此,地理編碼模塊20可以將舊金山的華盛頓廣場選擇為該電子文檔中的"Washington Square"所指代的位置。 接著,在步驟310中,查明形式為所選擇的地理位置的地理坐標(biāo)的字母數(shù)字表示。例如,通過使用某個(gè)在線地圖網(wǎng)站或者設(shè)備12中存儲的數(shù)據(jù)庫,可以查明舊金山的華盛頓廣場的地理坐標(biāo)。可以用經(jīng)度和緯度或者用某種其他坐標(biāo)系統(tǒng)來表示地理坐標(biāo)。還可以查明唯一地標(biāo)識所選擇的地理位置的位置的某種其他類型的字母數(shù)字表示。所選擇的候選的坐標(biāo)和完整地址被設(shè)置為與文檔中的文本描述相關(guān)。這種相關(guān)對于一些使用情況(諸如在瀏覽器中對文本進(jìn)行高亮)來說是必要的。 在最后的步驟312中,在基于位置的服務(wù)中使用所選擇的地理位置的地理坐標(biāo)。例如,可以在基于位置的地圖服務(wù)中使用金門大橋的地理坐標(biāo),來可視地指示該大橋的位置,如圖lb中所示。 雖然已經(jīng)將本發(fā)明描述為具有示例性設(shè)計(jì),但是可以在本公開的精神和范圍內(nèi)進(jìn)一步修改本發(fā)明。因此,本申請意圖使用其一般性原理來涵蓋本發(fā)明的任何變型、使用或者改編。此外,本申請意圖涵蓋落入本發(fā)明所屬領(lǐng)域中的已知或者慣用實(shí)踐范圍內(nèi)的針對本公開的此類偏離。
      權(quán)利要求
      一種用于操作基于位置的系統(tǒng)的方法,其中,所述基于位置的系統(tǒng)執(zhí)行以下步驟識別非結(jié)構(gòu)化電子文本中的地理信息,所述地理信息包括街道信息、地址信息和位置名稱中的至少一個(gè);提取所識別的地理信息;以及確定所識別的地理信息能夠指代的多個(gè)候選地理位置。
      2. 根據(jù)權(quán)利要求1所述的方法,還包括以下步驟 通過使用所述系統(tǒng),自動選擇所述多個(gè)候選地理位置之一 ;以及 在基于位置的服務(wù)中使用所選擇的地理位置的字母數(shù)字表示。
      3. 根據(jù)權(quán)利要求2所述的方法,其中,所述選擇步驟取決于所述基于位置的系統(tǒng)的當(dāng) 前位置。
      4. 根據(jù)權(quán)利要求2所述的方法,其中,所述字母數(shù)字表示包括一組坐標(biāo)。
      5. 根據(jù)權(quán)利要求2所述的方法,其中,所述確定步驟包括確定所識別的地理信息可能 指代的多個(gè)候選地理位置。
      6. 根據(jù)權(quán)利要求2所述的方法,其中,所述選擇步驟取決于所述多個(gè)候選地理位置的 地理中心。
      7. 根據(jù)權(quán)利要求2所述的方法,其中,所述字母數(shù)字表示包括所選擇的候選地理位置 的名稱。
      8. 根據(jù)權(quán)利要求2所述的方法,其中,所述基于位置的服務(wù)是導(dǎo)航服務(wù)和地圖服務(wù)其中之一。
      9. 根據(jù)權(quán)利要求1所述的方法,其中,所述地理信息包括在所述文本中描述的全部多 個(gè)位置。
      10. —種用于操作基于位置的系統(tǒng)的方法,包括以下步驟 手動選擇互聯(lián)網(wǎng)網(wǎng)頁;識別所述網(wǎng)頁中的地理信息,所述地理信息包括地址信息和對興趣點(diǎn)的參考信息中的 至少一個(gè);從所述網(wǎng)頁中提取所識別的地理信息;以及在導(dǎo)航服務(wù)和地圖服務(wù)中的至少一個(gè)中使用所提取的地理信息,其中,通過所述基于 位置的系統(tǒng)來自動執(zhí)行所述識別、提取和使用步驟。
      11. 根據(jù)權(quán)利要求10所述的方法,其中,所述手動選擇步驟包括 用戶找到與興趣點(diǎn)有關(guān)的網(wǎng)頁;以及將所述網(wǎng)頁的互聯(lián)網(wǎng)地址復(fù)制到所述基于位置的系統(tǒng)中。
      12. 根據(jù)權(quán)利要求IO所述的方法,還包括以下步驟 確定所識別的地理信息能夠指代的多個(gè)候選地理位置;以及選擇所述多個(gè)候選地理位置之一,所述使用步驟包括在導(dǎo)航服務(wù)和地圖服務(wù)中的所 述至少一個(gè)中使用所選擇的地理位置的字母數(shù)字表示。
      13. 根據(jù)權(quán)利要求12所述的方法,其中,所述選擇步驟取決于所述基于位置的系統(tǒng)的 當(dāng)前位置。
      14. 根據(jù)權(quán)利要求12所述的方法,其中,所述字母數(shù)字表示包括一組坐標(biāo)。
      15. 根據(jù)權(quán)利要求12所述的方法,其中,所述選擇步驟取決于所述多個(gè)候選地理位置的地理中心。
      16. 根據(jù)權(quán)利要求12所述的方法,其中,所述字母數(shù)字表示包括所選擇的候選地理位 置的名稱。
      17. 根據(jù)權(quán)利要求IO所述的方法,其中,所述網(wǎng)頁包含多個(gè)位置,所述多個(gè)位置中的每 一個(gè)都被識別并提取。
      18. —種用于操作基于位置的系統(tǒng)的方法,其中,所述基于位置的系統(tǒng)執(zhí)行以下步驟 識別非結(jié)構(gòu)化電子文本中的多個(gè)部分的地理信息; 從所述文本中提取所識別的多個(gè)部分的地理信息;以及確定所識別的多個(gè)部分的地理信息其中之一能夠指代的多個(gè)候選地理位置。
      19. 根據(jù)權(quán)利要求18所述的方法,還包括以下步驟選擇所述多個(gè)候選地理位置之一,所述選擇步驟取決于所識別的多個(gè)部分的地理信息 中的其他部分;查明所選擇的地理位置的地理坐標(biāo);以及 在基于位置的服務(wù)中使用所選擇的地理位置的地理坐標(biāo)。
      20. 根據(jù)權(quán)利要求19所述的方法,其中,所述非結(jié)構(gòu)化電子文本是在所述基于位置的 系統(tǒng)中存儲的電子文檔內(nèi)。
      21. 根據(jù)權(quán)利要求20所述的方法,其中,所述基于位置的系統(tǒng)具有收發(fā)電子郵件的能 力,所述電子文檔包括電子郵件。
      22. 根據(jù)權(quán)利要求19所述的方法,其中,所述基于位置的服務(wù)是導(dǎo)航服務(wù)和地圖服務(wù)其中之一。
      23. 根據(jù)權(quán)利要求19所述的方法,其中,所述選擇步驟取決于所述基于位置的系統(tǒng)的 當(dāng)前位置。
      24. 根據(jù)權(quán)利要求19所述的方法,其中,所述選擇步驟取決于所述多個(gè)候選地理位置 的地理中心。
      25. 根據(jù)權(quán)利要求18所述的方法,其中,所述文本包括多個(gè)位置,所述多個(gè)位置中的每 一個(gè)都被識別并提取。
      全文摘要
      一種用于操作基于位置的系統(tǒng)的方法,包括識別非結(jié)構(gòu)化電子文本中的地理信息。提取所識別的地理信息,其包括街道信息、地址信息或位置名稱。確定所識別的地理信息能夠指代的多個(gè)候選地理位置。選擇所述多個(gè)候選地理位置之一。在基于位置的服務(wù)中使用所選擇的地理位置的字母數(shù)字表示。本發(fā)明的系統(tǒng)執(zhí)行前述步驟中的每一個(gè)。所述系統(tǒng)支持提取所述非結(jié)構(gòu)化文本中提及的所有位置,并應(yīng)用上述步驟。
      文檔編號G06F17/30GK101782923SQ20091026372
      公開日2010年7月21日 申請日期2009年12月30日 優(yōu)先權(quán)日2009年1月15日
      發(fā)明者G·菲希特納, J·法恩格爾 申請人:羅伯特·博世有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1