專(zhuān)利名稱(chēng)::基于互聯(lián)網(wǎng)分詞思想的車(chē)載導(dǎo)航poi搜索引擎的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及車(chē)載導(dǎo)航的POI(PointofInterest,興趣點(diǎn))查詢(xún)系統(tǒng),該系統(tǒng)是基于互聯(lián)網(wǎng)搜索引擎的分詞思想。
背景技術(shù):
:自1994年基于網(wǎng)絡(luò)的搜索出現(xiàn)以來(lái),互聯(lián)網(wǎng)搜索引擎便得到了極大的發(fā)展,現(xiàn)在互聯(lián)網(wǎng)搜索引擎已經(jīng)成為互聯(lián)網(wǎng)上非常重要的網(wǎng)絡(luò)導(dǎo)航服務(wù)工具?;ヂ?lián)網(wǎng)搜索引擎搜集互聯(lián)網(wǎng)中的資源和信息,發(fā)現(xiàn)新的網(wǎng)站和網(wǎng)頁(yè),經(jīng)過(guò)抓取和分析,存儲(chǔ)相應(yīng)的信息副本。在此基礎(chǔ)上,進(jìn)一步對(duì)信息進(jìn)行理解、提取、組織和處理,并為用戶(hù)提供檢索服務(wù),從而起到信息導(dǎo)航的目的。互聯(lián)網(wǎng)搜索引擎能提供文字和拼音查詢(xún),查詢(xún)輸入時(shí)的聯(lián)想提示,根據(jù)查詢(xún)輸入預(yù)覽查詢(xún)結(jié)果數(shù)量,錯(cuò)誤輸入糾正提示等功能。車(chē)載導(dǎo)航中POI搜索與互聯(lián)網(wǎng)搜索引擎有著許多相似之處,POI信息也需要進(jìn)行理解、提取、組織和處理,并為用戶(hù)提供快捷的檢索服務(wù)。因此我們完全能將互聯(lián)網(wǎng)搜索引擎的概念運(yùn)用在車(chē)載導(dǎo)航中的POI搜索中,這也就是我們所說(shuō)的POI搜索引擎。而目前的車(chē)載導(dǎo)航的POI查詢(xún)功能較為單一,不能滿(mǎn)足用戶(hù)需求。
發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種基于互聯(lián)網(wǎng)分詞思想的車(chē)載導(dǎo)航POI搜索引擎,本發(fā)明能提供文字和拼音查詢(xún),并提供查詢(xún)輸入時(shí)的聯(lián)想提示,查詢(xún)結(jié)果數(shù)量預(yù)覽,錯(cuò)誤輸入自動(dòng)糾正,多次輸入組合查詢(xún)的功能。本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是基于互聯(lián)網(wǎng)分詞思想的車(chē)載導(dǎo)航POI搜索引擎包括以下步驟1)對(duì)POI原數(shù)據(jù)中的POI名稱(chēng)做分詞處理;2)根據(jù)分詞結(jié)果生成POI搜索引擎信息索引;3)根據(jù)POI搜索引擎信息索引進(jìn)行POI名稱(chēng)查詢(xún)。本發(fā)明的有益效果是通過(guò)不同類(lèi)型的輸入,包括中文、英文、數(shù)字,POI搜索引擎均能在較短時(shí)間內(nèi)完成聯(lián)想結(jié)果和查詢(xún)結(jié)果的顯示;用戶(hù)通過(guò)聯(lián)想結(jié)果能提前預(yù)知查詢(xún)結(jié)果的情況,輸入是否有查詢(xún)結(jié)果、查詢(xún)結(jié)果數(shù)量是多少、是否需要繼續(xù)輸入才能查詢(xún)到自己所需的結(jié)果,使用戶(hù)減少了不必要的查詢(xún)輸入;如果用戶(hù)輸入POI名稱(chēng)的簡(jiǎn)稱(chēng),POI搜索引擎也能準(zhǔn)確的查詢(xún)到結(jié)果;如果用戶(hù)查詢(xún)輸入錯(cuò)誤,POI搜索引擎會(huì)根據(jù)諧音自動(dòng)提示正確的信息;如果用戶(hù)輸入多個(gè)查詢(xún)信息,POI搜索引擎會(huì)根據(jù)查詢(xún)信息組合查詢(xún),使查詢(xún)結(jié)果更精確。圖1是POI名稱(chēng)數(shù)據(jù)分詞流程示意圖。圖2是生成POI搜索引擎信息索引流程示意圖。圖3是POI搜索引擎信息索引組成圖。圖4是P0I搜索引擎查詢(xún)基本流程示意圖。6圖5是關(guān)鍵詞分詞處理流程圖。具體實(shí)施例方式基于互聯(lián)網(wǎng)分詞思想的車(chē)載導(dǎo)航POI搜索引擎(以下簡(jiǎn)稱(chēng)POI搜索引擎)是借鑒了互聯(lián)網(wǎng)搜索引擎和中英文分詞技術(shù)實(shí)現(xiàn)而成的。雖然POI搜索引擎借鑒了互聯(lián)網(wǎng)搜索引擎和中英文分詞技術(shù),但還是有許多不同的地方。首先POI的原數(shù)據(jù)均來(lái)至于數(shù)據(jù)廠(chǎng)商,所以無(wú)法具有實(shí)時(shí)抓取和分析的能力,數(shù)據(jù)是一次性生成并非動(dòng)態(tài)更新;其次是POI搜索引擎運(yùn)行在嵌入式設(shè)備上,而互聯(lián)網(wǎng)搜索引擎則是運(yùn)行在大型服務(wù)器上,因此在機(jī)器性能上POI搜索引擎遠(yuǎn)不如互聯(lián)網(wǎng)搜索引擎;另外POI搜索引擎數(shù)據(jù)源是存放在導(dǎo)航儀上的數(shù)據(jù)文件,而不是像互聯(lián)網(wǎng)搜索引擎使用大型數(shù)據(jù)庫(kù)??偟膩?lái)說(shuō)POI搜索引擎是用于嵌入式設(shè)備,有較多的限制條件,但由于數(shù)據(jù)量并不像互聯(lián)網(wǎng)搜索引擎那么龐大,所以POI搜索引擎無(wú)論是搜索效率還是用戶(hù)體驗(yàn)都不會(huì)與互聯(lián)網(wǎng)搜索引擎有較大差距。本發(fā)明是一種車(chē)載導(dǎo)航的POI查詢(xún)系統(tǒng),它是基于互聯(lián)網(wǎng)搜索引擎的分詞思想,在嵌入式設(shè)備上實(shí)現(xiàn)的車(chē)載導(dǎo)航POI搜索引擎。POI搜索引擎使用POI搜索引擎信息索引,提供輸入聯(lián)想、查詢(xún)結(jié)果預(yù)覽、錯(cuò)誤輸入糾正、多次輸入組合查詢(xún)功能。通過(guò)不同類(lèi)型的輸入,包括中文、英文、數(shù)字,POI搜索引擎均能在較短時(shí)間內(nèi)完成聯(lián)想結(jié)果和查詢(xún)結(jié)果的顯示;用戶(hù)通過(guò)聯(lián)想結(jié)果能提前預(yù)知查詢(xún)結(jié)果的情況,輸入是否有查詢(xún)結(jié)果、查詢(xún)結(jié)果數(shù)量是多少、是否需要繼續(xù)輸入才能查詢(xún)到自己所需的結(jié)果,使用戶(hù)減少了不必要的查詢(xún)輸入;如果用戶(hù)輸入POI名稱(chēng)的簡(jiǎn)稱(chēng),POI搜索引擎也能準(zhǔn)確的查詢(xún)到結(jié)果;如果用戶(hù)查詢(xún)輸入錯(cuò)誤,POI搜索引擎會(huì)根據(jù)諧音自動(dòng)提示正確的信息;如果用戶(hù)輸入多個(gè)查詢(xún)信息,P0I搜索引擎會(huì)根據(jù)查詢(xún)信息組合查詢(xún),使查詢(xún)結(jié)果更精確。下面結(jié)合附圖詳述本發(fā)明。在圖1中,首先步驟SIOI從POI原數(shù)據(jù)中提取出POI的名稱(chēng),然后步驟S102將提取出來(lái)的POI名稱(chēng)保存為文本文件,便于后續(xù)生成POI搜索引擎信息索引時(shí)使用。步驟S103將P01名稱(chēng)做分詞處理,根據(jù)算法將POI名稱(chēng)的中文分割為小于等于4字的詞;數(shù)字和英文單詞各自分割為一個(gè)整體;并去除POI名稱(chēng)中的符號(hào)。最后步驟S104將POI名稱(chēng)分詞處理后生成的4字以?xún)?nèi)的中文關(guān)鍵詞、數(shù)字關(guān)鍵詞和英文關(guān)鍵詞保存為分詞結(jié)果。在圖2中,根據(jù)圖1中步驟S104的分詞結(jié)果,步驟S201將分詞結(jié)果中的關(guān)鍵詞生成首字母,其中中文關(guān)鍵詞的首字母為拼音首字母;數(shù)字關(guān)鍵詞的首字母為其本身;英文關(guān)鍵詞的首字母為其小寫(xiě)字母。所以關(guān)鍵詞首字母的字符范圍為0-9和a-z,共36種字符。步驟S202為分詞結(jié)果建立字符0-9和a-z的首字母倒排索引。步驟S203為POI名稱(chēng)建立分詞結(jié)果的關(guān)鍵詞倒排索引,根據(jù)分詞結(jié)果的關(guān)鍵詞在POI名稱(chēng)中查找含有關(guān)鍵詞的POI記錄。步驟S204將分詞結(jié)果關(guān)鍵詞查找的POI記錄在數(shù)據(jù)中的地址和記錄數(shù)量保存到該關(guān)鍵詞的倒排索引中,最后生成POI搜索引擎信息索引。在圖3中,顯示了P0I搜索引擎信息索引有6個(gè)組成部分,分別為管理部數(shù)據(jù)塊、首字母管理數(shù)據(jù)塊、首字母索引數(shù)據(jù)塊、關(guān)鍵詞數(shù)據(jù)塊、匹配結(jié)果索引數(shù)據(jù)塊和實(shí)體數(shù)據(jù)塊。各個(gè)組成部分的結(jié)構(gòu)如下1)管理部數(shù)據(jù)塊管理整個(gè)數(shù)據(jù)結(jié)構(gòu),記錄各數(shù)據(jù)塊的首地址,方便讀取各個(gè)數(shù)據(jù)塊的數(shù)據(jù),其結(jié)構(gòu)見(jiàn)表1(以下表格中數(shù)據(jù)長(zhǎng)度單位統(tǒng)一為字節(jié),DWORD為雙字,WORD為單字,BYTE為字節(jié),BYTE[]為字節(jié)數(shù)組)。表l管理部數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage8</column></row><table>2)首字母管理數(shù)據(jù)塊管理首字母數(shù)據(jù)信息,包括英文關(guān)鍵詞的小寫(xiě)字母組合和數(shù)字關(guān)鍵詞本身,方便根據(jù)一個(gè)字母或數(shù)字快速索引到關(guān)鍵詞,減少資源載入量,其結(jié)構(gòu)見(jiàn)表2。表2首字母管理數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage8</column></row><table>3)首字母索引數(shù)據(jù)塊索引關(guān)鍵詞,能通過(guò)首字母快速查找相應(yīng)關(guān)鍵詞,減少資源載入量,其結(jié)構(gòu)見(jiàn)表3。表3首字母索引數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage8</column></row><table>4)關(guān)鍵詞數(shù)據(jù)塊保存關(guān)鍵詞,并作為POI查詢(xún)輸入分詞的字典和輸入聯(lián)想的結(jié)果,其結(jié)構(gòu)見(jiàn)表4。表4關(guān)鍵詞數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage9</column></row><table>5)POI匹配結(jié)果索引數(shù)據(jù)塊索引POI結(jié)果,能通過(guò)該索引快速的查找到關(guān)鍵詞能匹配到POI結(jié)果的數(shù)量和偏移地址,其結(jié)構(gòu)見(jiàn)表5。表5POI匹配結(jié)果索引數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage9</column></row><table>6)POI實(shí)體數(shù)據(jù)塊(此處僅以POI名稱(chēng)作為其實(shí)體數(shù)據(jù))保存POI真正的實(shí)體數(shù)據(jù),其結(jié)構(gòu)見(jiàn)表6。表6POI實(shí)體數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage9</column></row><table>當(dāng)POI搜索引擎信息索引生成成功后,POI搜索引擎就可以根據(jù)POI搜索引擎信息索引為用戶(hù)提供POI查詢(xún)功能。首先用戶(hù)必須輸入要查詢(xún)POI名稱(chēng)的相關(guān)信息,當(dāng)用戶(hù)查詢(xún)輸入停止時(shí),POI查詢(xún)就開(kāi)始了。用戶(hù)的查詢(xún)輸入通常為一個(gè)詞或一個(gè)字,包括漢字、字母和數(shù)字,在這里統(tǒng)稱(chēng)為查詢(xún)關(guān)鍵詞。用戶(hù)輸入完關(guān)鍵詞后,由POI搜索引擎從搜索引擎信息索引中找到關(guān)鍵詞的聯(lián)想結(jié)果和該聯(lián)想結(jié)果能匹配POI結(jié)果的記錄條數(shù)。用戶(hù)選擇關(guān)鍵詞的聯(lián)想結(jié)果,POI搜索引擎將該聯(lián)想結(jié)果能匹配到的POI結(jié)果的記錄顯示出來(lái)。這個(gè)過(guò)程就是POI搜索查詢(xún)的基本流程,包括用戶(hù)查詢(xún)請(qǐng)求輸入、關(guān)鍵詞轉(zhuǎn)換處理、關(guān)鍵詞分詞處理、關(guān)鍵詞索引匹配、關(guān)鍵詞聯(lián)想結(jié)果顯示和查詢(xún)結(jié)果顯示。整個(gè)處理流程如圖4,處理步驟依次如下S301)用戶(hù)查詢(xún)請(qǐng)求輸入用戶(hù)通過(guò)導(dǎo)航系統(tǒng)提供的鍵盤(pán)按鈕或手寫(xiě)功能輸入要查詢(xún)的短語(yǔ)或文字,允許輸入的字符類(lèi)型有漢字、字母和數(shù)字,字母不分大小寫(xiě)。當(dāng)用戶(hù)首次輸入或者是清除上次輸入后再輸入的情況下,用戶(hù)的輸入為一個(gè)文字。S302)關(guān)鍵詞轉(zhuǎn)換處理將用戶(hù)輸入的關(guān)鍵詞轉(zhuǎn)換為相應(yīng)的首字母。當(dāng)關(guān)鍵詞為中文時(shí),轉(zhuǎn)換成拼音首字母;當(dāng)關(guān)鍵詞為英文時(shí),轉(zhuǎn)換成小寫(xiě)字母組合;當(dāng)關(guān)鍵詞為數(shù)字時(shí),為其本身。S303)關(guān)鍵詞分詞處理當(dāng)用戶(hù)輸入文字的個(gè)數(shù)超過(guò)4(關(guān)鍵詞最大長(zhǎng)度)時(shí),就需要對(duì)用戶(hù)輸入進(jìn)行分詞處理。整個(gè)處理流程見(jiàn)圖5所示,具體流程如下A)將用戶(hù)輸入字符串保存為目標(biāo)字符串Sl,初始化保存分詞結(jié)果的字符串序列容器Vector〈string〉VetStr,并設(shè)置最大分詞長(zhǎng)度MaxLen為4。B)如果Sl的長(zhǎng)度超過(guò)MaxLen,轉(zhuǎn)到步驟C。否則將Sl保存到分詞結(jié)果VetStr,并轉(zhuǎn)到步驟J。C)如果Sl為空,轉(zhuǎn)到步驟J,否則轉(zhuǎn)到步驟D。D)從Sl左邊開(kāi)始,取出候選字符串W,并且W的長(zhǎng)度不大于MaxLen。如果W的長(zhǎng)度大于1,轉(zhuǎn)到步驟E,否則轉(zhuǎn)到步驟I。E)取W的首字母字符串L,根據(jù)字母L[O](即字符串L中的第一個(gè)字母)在首字母管理數(shù)據(jù)塊查找該字母所有首字母組合。查看首字母組合,看字符串L是否在其中。如果在其中轉(zhuǎn)到步驟F,否則轉(zhuǎn)到步驟H。F)在首字母索引數(shù)據(jù)塊中獲取字符串L的索引信息,根據(jù)索引信息在關(guān)鍵詞數(shù)據(jù)塊中獲取其相應(yīng)關(guān)鍵詞,并保存為分詞詞庫(kù)。G)查看分詞詞庫(kù),看W是否在詞庫(kù)中。如果不在其中轉(zhuǎn)到步驟H,否則轉(zhuǎn)到步驟I。H)將W最右邊一個(gè)字去掉,判斷W是否為單字。如果是單字,轉(zhuǎn)到步驟I,否則轉(zhuǎn)到步驟G。I)將W保存到分詞結(jié)果VetStr中,并從S1中去掉候選字符串W然后保存為新的S1,最后轉(zhuǎn)到步驟C。J)返回分詞結(jié)果VetStr。比如用戶(hù)輸入"中華人民共和國(guó)",輸入文字個(gè)數(shù)大于4,將進(jìn)行分詞處理。首先取出最左邊的4個(gè)字"中華人民"和對(duì)應(yīng)的首字母"zhrm"。然后在首字母管理數(shù)據(jù)塊中查找字母"z"所有的首字母組合,包括"zc"、"zhd"、"zhrm"、"zjt"等字符串。在這些首字母組合中查找字符串"zhrm",由于"zhrm"存在其中,所以在首字母索引數(shù)據(jù)塊中取出該字符串的索引信息。再然后根據(jù)索引信息取得該字符串匹配的所有關(guān)鍵詞,包括"中華人民"等關(guān)鍵詞,并保存為分詞詞庫(kù)。最后在分詞詞庫(kù)中查找用戶(hù)輸入的"中華人民"是否在其中,由于該詞存在所以將其分割,并保存到分詞結(jié)果中。根據(jù)相同的處理方式,用戶(hù)輸入的字符串"共和國(guó)"也保存到了分詞結(jié)果中。S304)關(guān)鍵詞索引匹配根據(jù)分詞結(jié)果中的字符串SfSn,查找相應(yīng)的索引信息。其中查找完全匹配S"S2…Sn—J勺字符串索引信息,保存為集合Ap4…An—lt)查找所有部分匹配Sn的索引信息,保存為m個(gè)集合A^A^,…A,。如果關(guān)鍵詞從第1個(gè)字符到第L個(gè)字符(L為Sn的長(zhǎng)度)依次與Sn中的字符相等,稱(chēng)為部分匹配。如果關(guān)鍵詞與Sn完全相等,稱(chēng)為完全匹配。n和m均為自然數(shù)。S305)關(guān)鍵詞聯(lián)想結(jié)果顯示顯示用戶(hù)輸入的所能聯(lián)想出的關(guān)鍵詞以及這些關(guān)鍵詞能查詢(xún)到POI結(jié)果數(shù)量。用戶(hù)輸入經(jīng)過(guò)分詞處理后,生成了SnSfSn字符串,S15S2Sn—工均為完整的短語(yǔ),而Sn則是不具備完整意義的字或詞,所以用戶(hù)輸入的聯(lián)想,實(shí)際就是Sn的聯(lián)想結(jié)果。與Sn部分匹配的關(guān)鍵詞就是Sn的聯(lián)想結(jié)果,其匹配的POI結(jié)果集合&=Ana2n...nani—丄nani(ni《m),聯(lián)想結(jié)果能查詢(xún)到的poi結(jié)果數(shù)量就是集合&的個(gè)數(shù)。當(dāng)用戶(hù)輸入錯(cuò)誤時(shí),POI搜索引擎會(huì)根據(jù)輸入字符串的諧音查找相應(yīng)的聯(lián)想結(jié)果。當(dāng)用戶(hù)多次輸入,poi搜索引擎會(huì)對(duì)每單個(gè)輸入的聯(lián)想結(jié)果求交集,得到組合查詢(xún)的聯(lián)想結(jié)果。S306)查詢(xún)結(jié)果顯示根據(jù)用戶(hù)選擇的聯(lián)想結(jié)果,通過(guò)該聯(lián)想結(jié)果能匹配的POI結(jié)果集合Ri,在POI實(shí)體數(shù)據(jù)塊中取得相應(yīng)的POI結(jié)果信息。上述步驟中,POI搜索引擎信息索引為S303提供首字母管理數(shù)據(jù)塊、首字母索引數(shù)據(jù)塊和關(guān)鍵詞數(shù)據(jù)塊,為S304提供匹配結(jié)果索引數(shù)據(jù)塊,為S306提供實(shí)體數(shù)據(jù)塊。權(quán)利要求基于互聯(lián)網(wǎng)分詞思想的車(chē)載導(dǎo)航POI搜索引擎,其特征在于包括以下步驟1)對(duì)POI原數(shù)據(jù)中的POI名稱(chēng)做分詞處理;2)根據(jù)分詞結(jié)果生成POI搜索引擎信息索引;3)根據(jù)POI搜索引擎信息索引進(jìn)行POI名稱(chēng)查詢(xún)。2.根據(jù)權(quán)利要求1所述的方法,其特征在于步驟1)具體包括5101)從POI原數(shù)據(jù)中提取出POI的名稱(chēng);5102)將提取出來(lái)的POI名稱(chēng)保存為文本文件;5103)將POI名稱(chēng)做分詞處理根據(jù)算法將文本文件中POI名稱(chēng)的中文分割為小于等于最大分詞長(zhǎng)度的中文關(guān)鍵詞;數(shù)字和英文單詞則各自分割為一個(gè)整體,分別生成數(shù)字關(guān)鍵詞和英文關(guān)鍵詞;并去除POI名稱(chēng)中的符號(hào);5104)將POI名稱(chēng)分詞處理后生成的小于等于最大分詞長(zhǎng)度的中文關(guān)鍵詞、數(shù)字關(guān)鍵詞和英文關(guān)鍵詞保存為分詞結(jié)果。3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于步驟2)具體包括5201)將分詞結(jié)果中的關(guān)鍵詞生成首字母,其中中文關(guān)鍵詞的首字母為拼音首字母;數(shù)字關(guān)鍵詞的首字母為其本身;英文關(guān)鍵詞的首字母為其小寫(xiě)字母;5202)為分詞結(jié)果建立字符09和az的首字母倒排索引;5203)根據(jù)分詞結(jié)果的關(guān)鍵詞在POI名稱(chēng)中查找含有關(guān)鍵詞的POI記錄;5204)將分詞結(jié)果關(guān)鍵詞查找的POI記錄在數(shù)據(jù)中的地址和記錄數(shù)量保存到該關(guān)鍵詞的倒排索引中,最后生成POI搜索引擎信息索引。4.根據(jù)權(quán)利要求3所述的方法,其特征在于POI搜索引擎信息索引包括管理部數(shù)據(jù)塊、首字母管理數(shù)據(jù)塊、首字母索引數(shù)據(jù)塊、關(guān)鍵詞數(shù)據(jù)塊、匹配結(jié)果索引數(shù)據(jù)塊和實(shí)體數(shù)據(jù)塊。5.根據(jù)權(quán)利要求4所述的方法,其特征在于POI搜索引擎信息索引的各數(shù)據(jù)塊具體結(jié)構(gòu)為1)管理部數(shù)據(jù)塊結(jié)構(gòu)見(jiàn)表1:表1管理部數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage2</column></row><table>2)首字母管理數(shù)據(jù)塊的結(jié)構(gòu)見(jiàn)表2:表2首字母管理數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage3</column></row><table>3)首字母索引數(shù)據(jù)塊的結(jié)構(gòu)見(jiàn)表3:表3首字母索引數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage3</column></row><table>4)關(guān)鍵詞數(shù)據(jù)塊的結(jié)構(gòu)見(jiàn)表4:表4關(guān)鍵詞數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage3</column></row><table>5)P0I匹配結(jié)果索引數(shù)據(jù)塊的結(jié)構(gòu)見(jiàn)表5:表5P0I匹配結(jié)果索引數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage3</column></row><table>6)POI實(shí)體數(shù)據(jù)塊的結(jié)構(gòu)見(jiàn)表6:表6P0I實(shí)體數(shù)據(jù)塊結(jié)構(gòu)<table>tableseeoriginaldocumentpage4</column></row><table>6.根據(jù)權(quán)利要求4所述的方法,其特征在于步驟3)依次包括用戶(hù)查詢(xún)請(qǐng)求輸入、關(guān)鍵詞轉(zhuǎn)換處理、關(guān)鍵詞分詞處理、關(guān)鍵詞索引匹配、關(guān)鍵詞聯(lián)想結(jié)果顯示和查詢(xún)結(jié)果顯示的步驟。7.根據(jù)權(quán)利要求6所述的方法,其特征在于步驟3)具體包括以下步驟5301)用戶(hù)查詢(xún)請(qǐng)求輸入用戶(hù)通過(guò)導(dǎo)航系統(tǒng)提供的鍵盤(pán)按鈕或手寫(xiě)功能輸入要查詢(xún)的短語(yǔ)或文字,允許輸入的字符類(lèi)型有漢字、字母和數(shù)字,字母不分大小寫(xiě),當(dāng)用戶(hù)首次輸入或者是清除上次輸入后再輸入的情況下,用戶(hù)的輸入為一個(gè)文字;5302)關(guān)鍵詞轉(zhuǎn)換處理將用戶(hù)輸入的關(guān)鍵詞轉(zhuǎn)換為相應(yīng)的首字母,當(dāng)關(guān)鍵詞為中文時(shí),轉(zhuǎn)換成拼音首字母;當(dāng)關(guān)鍵詞為英文時(shí),轉(zhuǎn)換成小寫(xiě)字母組合;當(dāng)關(guān)鍵詞為數(shù)字時(shí),為其本身;5303)關(guān)鍵詞分詞處理當(dāng)用戶(hù)輸入文字的個(gè)數(shù)超過(guò)最大分詞長(zhǎng)度時(shí),對(duì)用戶(hù)輸入進(jìn)行分詞處理,將其分詞為字符串S"S2Sn;否則用戶(hù)輸入只包含一個(gè)字符串S工;5304)關(guān)鍵詞索引匹配根據(jù)分詞結(jié)果中的字符串S"SfSn,通過(guò)首字母查找相應(yīng)的索引信息;其中查找完全匹配S15S2Sn—工的字符串索引信息,分別保存為集合A"A2An—工;查找所有部分匹配Sn的索引信息,保存為集合Anl,A^,…A,;5305)關(guān)鍵詞聯(lián)想結(jié)果顯示顯示用戶(hù)輸入的所能聯(lián)想出的關(guān)鍵詞以及這些關(guān)鍵詞能查詢(xún)到POI結(jié)果數(shù)量;用戶(hù)輸入的聯(lián)想是Sn的聯(lián)想結(jié)果,其匹配的POI結(jié)果集合&=AinA2n…nAni—:nAni,且ni《m,聯(lián)想結(jié)果能查詢(xún)到的POI結(jié)果數(shù)量就是集合&的個(gè)數(shù);當(dāng)用戶(hù)輸入錯(cuò)誤時(shí),POI搜索引擎根據(jù)輸入字符串的諧音查找相應(yīng)的聯(lián)想結(jié)果;當(dāng)用戶(hù)多次輸入,POI搜索引擎對(duì)每單個(gè)輸入的聯(lián)想結(jié)果求交集,得到組合查詢(xún)的聯(lián)想結(jié)果;5306)查詢(xún)結(jié)果顯示根據(jù)用戶(hù)選擇的聯(lián)想結(jié)果匹配到的POI結(jié)果集合Ri,在POI實(shí)體數(shù)據(jù)塊中取得相應(yīng)的POI結(jié)果信息。8.根據(jù)權(quán)利要求4所述的方法,其特征在于步驟S103)具體包括A)將用戶(hù)輸入字符串保存為目標(biāo)字符串Sl,初始化保存分詞結(jié)果的字符串序列容器Vector〈string〉VetStr,并設(shè)置最大分詞長(zhǎng)度MaxLen;B)如果S1的長(zhǎng)度超過(guò)MaxLen,轉(zhuǎn)到步驟C;否則將Sl保存到分詞結(jié)果VetStr,然后轉(zhuǎn)到步驟J;C)如果Sl為空,轉(zhuǎn)到步驟J,否則轉(zhuǎn)到步驟D;D)從S1左邊開(kāi)始,取出候選字符串W,W的長(zhǎng)度不大于MaxLen;如果W的長(zhǎng)度大于1,轉(zhuǎn)到步驟E,否則轉(zhuǎn)到步驟I;E)取W的首字母字符串L,根據(jù)字母L[O]在首字母管理數(shù)據(jù)塊查找該字母所有首字母組合;查看首字母組合,看字符串L是否在其中,如果在其中轉(zhuǎn)到步驟F,否則轉(zhuǎn)到步驟H;F)在首字母索引數(shù)據(jù)塊中獲取字符串L的索引信息,根據(jù)索引信息在關(guān)鍵詞數(shù)據(jù)塊中獲取其相應(yīng)關(guān)鍵詞,并保存為分詞詞庫(kù);G)查看分詞詞庫(kù),查看W是否在詞庫(kù)中;如果不在其中轉(zhuǎn)到步驟H,在其中則轉(zhuǎn)到步驟I;H)將W最右邊一個(gè)字去掉,判斷W是否為單字;如果是單字,轉(zhuǎn)到步驟I,否則轉(zhuǎn)到步驟G;I)將W保存到分詞結(jié)果VetStr中,從SI中去掉候選字符串W后保存為新的Sl,最后轉(zhuǎn)到步驟C;J)返回分詞結(jié)果VetStr。9.根據(jù)權(quán)利要求2所述的方法,其特征在于最大分詞長(zhǎng)度為4個(gè)字。全文摘要本發(fā)明提供了一種基于互聯(lián)網(wǎng)分詞思想的車(chē)載導(dǎo)航POI搜索引擎,其包括以下步驟1)對(duì)POI原數(shù)據(jù)中的POI名稱(chēng)做分詞處理;2)根據(jù)分詞結(jié)果生成POI搜索引擎信息索引;3)根據(jù)POI搜索引擎信息索引進(jìn)行POI名稱(chēng)查詢(xún)。本發(fā)明能提供文字和拼音查詢(xún),并提供查詢(xún)輸入時(shí)的聯(lián)想提示,查詢(xún)結(jié)果數(shù)量預(yù)覽,錯(cuò)誤輸入自動(dòng)糾正,多次輸入組合查詢(xún)的功能。文檔編號(hào)G01C21/34GK101794307SQ20101011724公開(kāi)日2010年8月4日申請(qǐng)日期2010年3月2日優(yōu)先權(quán)日2010年3月2日發(fā)明者黨魁,朱敦堯申請(qǐng)人:光庭導(dǎo)航數(shù)據(jù)(武漢)有限公司