專利名稱:興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息處理技術(shù)領(lǐng)域,尤其涉及一種興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法及裝置。
背景技術(shù):
目前,在地理信息系統(tǒng)(Geographic Information System,GIS)中,興趣點(diǎn)(Point Of Interest,POI)數(shù)據(jù)的采集方式主要有實(shí)地采集,互聯(lián)網(wǎng)采集等。由于采集POI數(shù)據(jù)時, 采集人員并不會考慮該P(yáng)OI數(shù)據(jù)是否已被采集過,因此,造成不同批次采集的POI數(shù)據(jù)之間 存在很多重復(fù)的POI數(shù)據(jù)。在對現(xiàn)有技術(shù)的研究和實(shí)踐過程中,發(fā)明人發(fā)現(xiàn)由于重復(fù)POI數(shù)據(jù)的存在,使POI 數(shù)據(jù)的應(yīng)用出現(xiàn)了一些問題。比如,在某網(wǎng)站提供的電子地圖服務(wù)中以“東來順”為關(guān)鍵詞 查找與之相關(guān)的POI數(shù)據(jù),該網(wǎng)站電子地圖顯示的POI數(shù)據(jù)查詢結(jié)果中,西單有兩個距離很 近的“東來順西單店”和“東來順飯莊”,雖然這兩個POI數(shù)據(jù)的名稱不完全相同,但它們的 地址都是“西單靈鏡胡同23號”,這兩個POI數(shù)據(jù)屬于重復(fù)數(shù)據(jù),這樣的查詢結(jié)果很容易使 用戶產(chǎn)生誤解。因此,發(fā)明人認(rèn)為目前亟需提供一種能夠?qū)⑾嗤琍OI數(shù)據(jù)關(guān)聯(lián)在一起的技 術(shù),以便有效地解決POI數(shù)據(jù)重復(fù)的問題,使POI數(shù)據(jù)的應(yīng)用更為完美。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例要解決的技術(shù)問題是提供一種能夠?qū)⑾嗤d趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)在一起 的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法及裝置。為解決上述技術(shù)問題,本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的本發(fā)明實(shí)施例提供了一種興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,所述方法包括讀取兩個批次的興趣點(diǎn)數(shù)據(jù);對所述興趣點(diǎn)數(shù)據(jù)進(jìn)行分組,得到兩個批次興趣點(diǎn)數(shù)據(jù)各自的分組集合及分組標(biāo) 識列表;通過兩個分組標(biāo)識列表,從兩個分組集合中各讀取一個分組;以一個分組興趣點(diǎn)數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表;用另一個分組興趣點(diǎn)數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組相同 的興趣點(diǎn)數(shù)據(jù)。本發(fā)明實(shí)施例還提供了一種興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,所述裝置包括數(shù)據(jù)讀取單元,用于讀取兩個批次的興趣點(diǎn)數(shù)據(jù);分組單元,用于對所述興趣點(diǎn)數(shù)據(jù)進(jìn)行分組,得到兩個批次興趣點(diǎn)數(shù)據(jù)各自的分 組集合及分組標(biāo)識列表;分組讀取單元,用于通過兩個分組標(biāo)識列表,從兩個分組集合中各讀取一個分 組;哈希表創(chuàng)建單元,用于以一個分組興趣點(diǎn)數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表;第一關(guān)聯(lián)單元,用于用另一個分組興趣點(diǎn)數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組相同的興趣點(diǎn)數(shù)據(jù)。上述技術(shù)方案具有如下有益效果本發(fā)明實(shí)施例提供的 興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,以一個分組POI數(shù)據(jù)的屬性為關(guān)鍵字 建立哈希表,通過用另一個分組POI數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分 組相同的POI數(shù)據(jù),有效地解決了 POI數(shù)據(jù)重復(fù)的問題。
圖1為本發(fā)明實(shí)施例提供的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法流程圖;圖2為本發(fā)明實(shí)施例提供的興趣點(diǎn)數(shù)據(jù)分組方法流程圖;圖3為本發(fā)明實(shí)施例提供的分組讀取方法流程圖;圖4為本發(fā)明實(shí)施例提供的以名稱為關(guān)鍵字進(jìn)行POI數(shù)據(jù)關(guān)聯(lián)的方法流程圖;圖5為本發(fā)明實(shí)施例提供的以品牌代碼為關(guān)鍵字進(jìn)行POI數(shù)據(jù)關(guān)聯(lián)的方法流程 圖;圖6為本發(fā)明實(shí)施例提供的以簡稱代碼為關(guān)鍵字進(jìn)行POI數(shù)據(jù)關(guān)聯(lián)的方法流程 圖;圖7為本發(fā)明實(shí)施例提供的以主體名稱為關(guān)鍵字進(jìn)行POI數(shù)據(jù)關(guān)聯(lián)的方法流程 圖;圖8為本發(fā)明實(shí)施例提供的通過名稱相似度進(jìn)行POI關(guān)聯(lián)的方法流程圖;圖9為本發(fā)明實(shí)施例提供的通過距離進(jìn)行POI數(shù)據(jù)關(guān)聯(lián)的方法流程圖;圖10為本發(fā)明實(shí)施例提供的POI數(shù)據(jù)關(guān)聯(lián)裝置組成示意圖。
具體實(shí)施例方式為使本發(fā)明實(shí)施例的目的、技術(shù)方案、及優(yōu)點(diǎn)更加清楚明白,以下參照附圖對本發(fā) 明實(shí)施例提供的技術(shù)方案進(jìn)行詳細(xì)說明。請參見圖1,為本發(fā)明實(shí)施例提供的POI數(shù)據(jù)關(guān)聯(lián)方法,該方法包括如下步驟步驟101 讀取兩個批次的POI數(shù)據(jù);在本發(fā)明實(shí)施例中,可以通過文件適配模塊讀取兩個批次的POI數(shù)據(jù)。采用文件適配模塊讀取POI數(shù)據(jù)好處在于文件適配模塊可以讀取不同格式的數(shù) 據(jù)文件(比如,CSV, XLS, DBF, DAT等),即不論P(yáng)OI數(shù)據(jù)存儲在哪種格式的數(shù)據(jù)文 件中,文件適配模塊都可以讀取,具體地當(dāng)POI數(shù)據(jù)存儲在DBF、MDB等文件數(shù)據(jù)庫時,文件適配模塊逐條從文件數(shù)據(jù)庫中 讀取POI數(shù)據(jù),并按數(shù)據(jù)庫字段,讀取POI屬性;當(dāng)POI數(shù)據(jù)存儲在CSV、TXT等文本文件時,文件適配模塊按行或者按POI分割標(biāo) 記讀取POI數(shù)據(jù),按POI屬性分割標(biāo)記讀取POI屬性;當(dāng)POI數(shù)據(jù)存儲在DAT等二進(jìn)制文件中時,文件適配模塊按POI分隔符或者長度 讀取POI數(shù)據(jù),按POI屬性分隔符或者長度讀取POI屬性;當(dāng)POI數(shù)據(jù)存儲在XLS、XLSX等EXCEL文件時,按行讀取POI數(shù)據(jù),按EXCEL列讀 取POI屬性;當(dāng)POI數(shù)據(jù)存儲在XML等標(biāo)記文件時,按POI標(biāo)記讀取POI數(shù)據(jù),按POI屬性標(biāo)簽讀取POI屬性。
步驟102 對步驟101讀取的POI數(shù)據(jù)進(jìn)行分組,得到兩個批次POI數(shù)據(jù)各自的分 組集合及分組標(biāo)識列表;比如,讀取A批次和B批次的POI數(shù)據(jù)后,對A批次的POI數(shù)據(jù)和B批次的POI數(shù) 據(jù)分別進(jìn)行分組,得到A批次POI數(shù)據(jù)的分組集合及其分組標(biāo)識列表和B批次POI數(shù)據(jù)的 分組集合及其分組標(biāo)識列表。步驟103 通過兩個分組標(biāo)識列表,從兩個的分組集合中各讀取一個分組;步驟104 以一個分組中POI數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表;步驟105 用另一個分組中POI數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個 分組中相同的POI數(shù)據(jù);步驟106 判斷兩個分組集合中是否有分組未讀取,如果是,則返回步驟103,如果 否,則結(jié)束該流程。。以上為本發(fā)明實(shí)施例提供的POI數(shù)據(jù)關(guān)聯(lián)方法,上述方法適用于關(guān)聯(lián)POI數(shù)據(jù)結(jié) 構(gòu)相同的兩個批次的POI數(shù)據(jù)。如果兩個批次的POI數(shù)據(jù)的結(jié)構(gòu)存在差異,則需要預(yù)先將 兩個批次的POI數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)相同的POI數(shù)據(jù),或者,在讀取兩個批次的POI數(shù)據(jù)的同時 將兩個批次的POI數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)相同的POI數(shù)據(jù)。其中,將兩個批次的POI數(shù)據(jù)轉(zhuǎn)換為 結(jié)構(gòu)相同的POI數(shù)據(jù)具體為按照用戶選擇的版本名稱,在預(yù)置的版本庫中查找該版本名 稱對應(yīng)的POI屬性說明,按POI屬性說明,將兩個批次的POI數(shù)據(jù)的屬性值分別賦給各自的 內(nèi)部POI數(shù)據(jù),得到兩個批次結(jié)構(gòu)相同的POI數(shù)據(jù)。以下結(jié)合附圖對上述實(shí)施例采用的每一個技術(shù)手段的具體實(shí)現(xiàn)方式進(jìn)行詳細(xì)介紹。首先,以一個批次的POI數(shù)據(jù)為例介紹本發(fā)明實(shí)施例提供的POI數(shù)據(jù)分組方法 (假設(shè)批次為A),請參見圖2,該方法包括步驟1021 從A批次的POI數(shù)據(jù)中讀取一條POI數(shù)據(jù);步驟1022 從步驟1021讀取的POI數(shù)據(jù)中提取類型代碼,查詢類型代碼對應(yīng)的分 組標(biāo)識;在實(shí)際應(yīng)用中,類型代碼和分組標(biāo)識的對應(yīng)關(guān)系保存在類型庫中,并且,多個相近 的類型代碼在類型庫中對應(yīng)著同一個分組標(biāo)識,由于類型代碼相近POI數(shù)據(jù)的類型相似, 因此,這樣做可以在分組過程中將類型相似的POI數(shù)據(jù)分入同一個分組,減少分組的數(shù)量, 提高數(shù)據(jù)關(guān)聯(lián)速度。步驟1023 將POI數(shù)據(jù)分入分組標(biāo)識在A批次分組集合中對應(yīng)的分組;步驟1024 判斷分組標(biāo)識是否記錄在A批次的分組標(biāo)識列表中,如果是,則丟棄該 分組標(biāo)識,進(jìn)入步驟1026,如果否,則進(jìn)入步驟1025 ;步驟1025 將分組標(biāo)識記錄在A批次POI數(shù)據(jù)的分組標(biāo)識列表中;步驟1026 判斷A批次POI數(shù)據(jù)是否完成分組,如果沒完成,則返回步驟1021,如 果完成,則結(jié)束A批次POI數(shù)據(jù)的分組。以上以A批次POI數(shù)據(jù)的分組過程為例介紹了本發(fā)明實(shí)施例提供的POI數(shù)據(jù)分組 方法,在本發(fā)明實(shí)施例中,對任意批次的POI數(shù)據(jù)都可以采用上述方法進(jìn)行分組,并且,對 于兩個批次的POI數(shù)據(jù),優(yōu)選,一個批次一個批次地采用上述方法進(jìn)行分組;次優(yōu)選,兩個批次同時采用上述方法進(jìn)行分組。其次,結(jié)合附圖介紹本發(fā)明 實(shí)施例提供的從分組集合中讀取分組的方法。請參見圖3,為本發(fā)明實(shí)施例提供的分組讀取方法流程圖,該方法包括步驟1031 在兩個分組標(biāo)識列表中,查找相同的分組標(biāo)識,當(dāng)查找到一個相同的 分組標(biāo)識后,就進(jìn)入步驟1032 ;步驟1032 從兩個分組集合中,讀取步驟1031查找到的分組標(biāo)識對應(yīng)的分組;步驟1032從兩個分組集合中讀取出的兩個分組的分組標(biāo)識相同,根據(jù)前文記載 可知,這兩個分組中的POI數(shù)據(jù)類型相似。另外,為了提高關(guān)聯(lián)速度,使后續(xù)的關(guān)聯(lián)過程更容易進(jìn)行,可以進(jìn)一步將步驟1032 讀取的兩個分組中的POI數(shù)據(jù)存入各自的待關(guān)聯(lián)數(shù)據(jù)列表中,亦可不存入待關(guān)聯(lián)數(shù)據(jù)列 表,并不影響本發(fā)明實(shí)施例的實(shí)現(xiàn)。最后,結(jié)合附圖對本發(fā)明實(shí)施例提供通過POI屬性關(guān)聯(lián)相同POI數(shù)據(jù)的方法。請參見圖4,為以名稱為關(guān)鍵字進(jìn)行POI數(shù)據(jù)關(guān)聯(lián)的方法流程圖,該方法包括步驟401 將一個待關(guān)聯(lián)數(shù)據(jù)列表(一個分組)中,名稱相同的POI數(shù)據(jù)存入哈希 表中所述名稱為關(guān)鍵字的位置;在實(shí)際應(yīng)用中,可以選擇POI數(shù)據(jù)多的一個關(guān)聯(lián)數(shù)據(jù)列表創(chuàng)建哈希表。步驟402:從另一個待關(guān)聯(lián)數(shù)據(jù)列表(另一個分組)中,讀取一個POI數(shù)據(jù)的名 稱;步驟403 用步驟402讀取的名稱與哈希表的關(guān)鍵字進(jìn)行匹配,如果沒有匹配到, 則進(jìn)入步驟405,如果匹配到,則所述匹配的關(guān)鍵字在哈希表中對應(yīng)的POI數(shù)據(jù)與步驟402 讀取的POI為相同的數(shù)據(jù),進(jìn)入步驟404 ;步驟404 將相同的POI數(shù)據(jù)移入關(guān)聯(lián)結(jié)果隊列;步驟405 判斷另一個待關(guān)聯(lián)數(shù)據(jù)列表中是否有POI數(shù)據(jù)的名稱未讀取,如果有, 則返回步驟402,如果沒有,則結(jié)束該流程。請參見圖5,為本發(fā)明實(shí)施例提供的以品牌代碼為關(guān)鍵字進(jìn)行POI數(shù)據(jù)關(guān)聯(lián)的方 法流程圖,該方法包括步驟501 識別兩個待關(guān)聯(lián)數(shù)據(jù)列表中POI數(shù)據(jù)的名稱是否包含品牌名稱,如果包 含,則將品牌名稱對應(yīng)的品牌代碼添加到POI數(shù)據(jù)的屬性中;在實(shí)際應(yīng)用中,可以采用如下方法識別POI數(shù)據(jù)的名稱是否包含品牌名稱判斷POI數(shù)據(jù)的名稱是否包含預(yù)置品牌庫中的品牌名稱,如果包含,則從品牌庫 中獲取品牌名稱對應(yīng)的品牌代碼,并將該品牌代碼添加到POI數(shù)據(jù)的屬性中,如果名稱中 不包含品牌,則認(rèn)為品牌識別失敗,轉(zhuǎn)入識別另一個POI數(shù)據(jù)的名稱,直到識別完所有POI 數(shù)據(jù)。步驟502 將一個待關(guān)聯(lián)數(shù)據(jù)列表中品牌代碼相同的POI數(shù)據(jù)存入哈希表中該品 牌代碼為關(guān)鍵字的位置;在實(shí)際應(yīng)用中,可以選擇品牌識別成功數(shù)多的一個待關(guān)聯(lián)數(shù)據(jù)列表創(chuàng)建哈希表。步驟503 從另一個待關(guān)聯(lián)數(shù)據(jù)列表中,讀取一個POI數(shù)據(jù)的品牌代碼;步驟504 用步驟503讀取的品牌代碼與哈希表的關(guān)鍵字進(jìn)行匹配,如果沒有匹配 至|J,則進(jìn)入步驟506,如果匹配到,則所述匹配的關(guān)鍵字在哈希表中對應(yīng)的POI數(shù)據(jù)與步驟503讀取的POI為相同數(shù)據(jù),進(jìn)入步驟505 ; 步驟505 將相同的POI數(shù)據(jù)移入關(guān)聯(lián)結(jié)果隊列;步驟506 判斷另一個待關(guān)聯(lián)數(shù)據(jù)列表中是否有POI數(shù)據(jù)的品牌代碼未讀取,如果 有,則返回步驟503,如果沒有,則結(jié)束該流程。請參見圖6,為本發(fā)明實(shí)施例提供的以簡稱代碼為關(guān)鍵字進(jìn)行POI數(shù)據(jù)關(guān)聯(lián)的方 法流程圖,該方法包括步驟601 識別兩個待關(guān)聯(lián)數(shù)據(jù)列表中POI數(shù)據(jù)的名稱是否有簡稱,如果有,則將 所述簡稱對應(yīng)的簡稱代碼添加到所述POI數(shù)據(jù)屬性中;在實(shí)際應(yīng)用中,可以采用如下方法識別POI數(shù)據(jù)的簡稱判斷POI數(shù)據(jù)的名稱在預(yù)置的簡稱庫中是否有對應(yīng)的簡稱,如果有,則從簡稱庫 中獲取該簡稱的簡稱代碼,將該簡稱代碼添加到POI數(shù)據(jù)的屬性中,如果沒有,則認(rèn)為簡稱 識別失敗,轉(zhuǎn)入識別下一個POI數(shù)據(jù)的簡稱,直到識別完所有POI數(shù)據(jù)的簡稱。步驟602 識別兩個待關(guān)聯(lián)數(shù)據(jù)列表中POI數(shù)據(jù)的名稱是否以預(yù)置的后綴庫中的 詞為后綴,如果是,則將所述后綴對應(yīng)的后綴代碼添加到所述POI數(shù)據(jù)的屬性中;在本發(fā)明實(shí)施例中,后綴是指包含名稱末尾字符的詞。步驟603 將一個待關(guān)聯(lián)數(shù)據(jù)列表中簡稱代碼相同的POI數(shù)據(jù)存入哈希表中簡稱 代碼為關(guān)鍵字的位置;在實(shí)際應(yīng)用中,可以選簡稱代碼多的一個待關(guān)聯(lián)數(shù)據(jù)列表創(chuàng)建哈希表。步驟604 從另一個待關(guān)聯(lián)數(shù)據(jù)列表中,讀取一個POI數(shù)據(jù)的簡稱代碼;步驟605 用步驟604讀取出的簡稱代碼與哈希表中的關(guān)鍵字進(jìn)行匹配,如果沒有 匹配到,則進(jìn)入步驟608,如果匹配到,則進(jìn)入步驟606 ;步驟606 從匹配的關(guān)鍵字在哈希表中對應(yīng)的POI數(shù)據(jù)中,選擇與步驟604讀取的 POI數(shù)據(jù)的后綴代碼一致的POI數(shù)據(jù),該P(yáng)OI數(shù)據(jù)與步驟604讀取的POI數(shù)據(jù)為相同的數(shù) 據(jù);步驟607 將相同的POI數(shù)據(jù)移入關(guān)聯(lián)結(jié)果隊列;步驟608 判斷另一個待關(guān)聯(lián)數(shù)據(jù)列表中是否有POI數(shù)據(jù)的簡稱代碼未讀取,如果 有,則返回步驟604,如果沒有,則進(jìn)入步驟609 ;步驟609 判斷兩個待關(guān)聯(lián)列表中是否都有POI數(shù)據(jù)剩余,如果有,則進(jìn)入步驟 610,如果沒有,則結(jié)束該關(guān)聯(lián)流程;步驟610 用另一個待關(guān)聯(lián)數(shù)據(jù)列表中剩余POI數(shù)據(jù)的簡稱代碼與哈希表的關(guān)鍵 字進(jìn)行匹配,得到相同的POI數(shù)據(jù)。請參見圖7,為本發(fā)明實(shí)施例提供的以主體名稱為關(guān)鍵字進(jìn)行POI數(shù)據(jù)關(guān)聯(lián)的方 法流程圖,該方法包括步驟701 識別兩個待關(guān)聯(lián)數(shù)據(jù)列表中POI數(shù)據(jù)的主體名稱;在實(shí)際應(yīng)用中,可以采用如下方法識別POI數(shù)據(jù)的主體名稱先判斷POI數(shù)據(jù)的名稱是否以括號為結(jié)尾,如果是,則刪除名稱中的括號及括號 內(nèi)的字符,再判斷名稱是否以預(yù)置的行政區(qū)劃庫中的行政區(qū)劃為前綴,如果是,則判斷該行 政區(qū)劃相鄰的詞是否為預(yù)置的后綴庫中的詞,如果否,則刪除名稱中的行政區(qū)劃,判斷名稱 是否以后綴庫中的詞為后綴,如果是,則判斷與后綴相鄰的詞是否為行政區(qū)劃庫中的詞,如果否,則刪除名稱的后綴,得到名稱的主體名稱。步驟702 將一個待關(guān)聯(lián)數(shù)據(jù)列表中主體名稱相同的POI數(shù)據(jù)存入哈希表中所述 主體名稱為關(guān)鍵字的位置;在實(shí)際應(yīng)用中,可以選擇主體名稱 多的一個待關(guān)聯(lián)數(shù)據(jù)列表創(chuàng)建哈希表。步驟703 從另一個待關(guān)聯(lián)數(shù)據(jù)列表中,讀取一個POI數(shù)據(jù)的主體名稱;步驟704 用步驟703讀取的主體名稱與哈希表的關(guān)鍵字進(jìn)行匹配,如果主體名稱 匹配,則匹配的關(guān)鍵字的哈希表中對應(yīng)的POI數(shù)據(jù)與步驟703讀取的POI數(shù)據(jù)為相同的數(shù) 據(jù),進(jìn)入步驟705,否則,進(jìn)入步驟706 ;步驟705 將相同的POI數(shù)據(jù)移入關(guān)聯(lián)結(jié)果隊列;步驟706 判斷另一個待關(guān)聯(lián)數(shù)據(jù)列表中是否有POI數(shù)據(jù)的主體名稱未讀取,如果 有,則返回步驟703,如果沒有,則結(jié)束該流程。請參見圖8,為本發(fā)明實(shí)施例提供的通過主體名稱相似度對POI數(shù)據(jù)進(jìn)行關(guān)聯(lián)的 方法流程圖,如果分組經(jīng)過圖4至圖7的方法關(guān)聯(lián)后還有分組剩余,則需要進(jìn)一步通過主體 名稱相似度對剩余分組進(jìn)行關(guān)聯(lián),該方法包括步驟801 遍歷兩個分組集合剩余分組中的POI數(shù)據(jù);步驟802 計算不同批次兩個POI數(shù)據(jù)主體名稱的相似度;在實(shí)際應(yīng)用中,計算兩個POI數(shù)據(jù)的主體名稱相似度,具體包括計算兩個POI數(shù)據(jù)主體名稱的最大公共子字符串的數(shù)值;用最大公共子字符串的數(shù)值除以所述兩個POI數(shù)據(jù)主體名稱長度值大的一個長 度值,得到主體名稱相似度;步驟803 判斷步驟802計算的主體名稱相似度是否超過預(yù)設(shè)的值(比如0. 8), 如果是,則所述兩個POI數(shù)據(jù)為相同的POI數(shù)據(jù),進(jìn)入步驟804,如果否,則轉(zhuǎn)入步驟801計 算下一對POI數(shù)據(jù)的主體名稱相似度;步驟804 將這兩個POI數(shù)據(jù)移入關(guān)聯(lián)結(jié)果隊列。以上為本發(fā)明實(shí)施例提供的POI數(shù)據(jù)關(guān)聯(lián)方法及其所采用技術(shù)手段的具體實(shí)現(xiàn) 方式。采用前文所述方法,匹配的關(guān)鍵字在哈希表中可能對應(yīng)了多個POI數(shù)據(jù),因此,為了 進(jìn)一步提高POI數(shù)據(jù)的關(guān)聯(lián)精度,本發(fā)明實(shí)施例還提供了 一種POI數(shù)據(jù)的關(guān)聯(lián)方法,該方法 與前文所示方法的區(qū)別僅在于在兩個分組標(biāo)識列表中,查找相同的分組標(biāo)識之后,進(jìn)一步包括查找所述分組標(biāo)識對應(yīng)的關(guān)聯(lián)距離S,若關(guān)聯(lián)距離S小于零,則按照前文所述方法 進(jìn)行POI數(shù)據(jù)關(guān)聯(lián),若所述關(guān)聯(lián)距離S大于零,則用另一個分組POI數(shù)據(jù)的屬性與哈希表的 關(guān)鍵字進(jìn)行匹配之后,進(jìn)一步包括判斷匹配的關(guān)鍵字在哈希表中對應(yīng)的POI數(shù)據(jù)是否為多個,如果是,則計算所述 哈希表中的POI數(shù)據(jù)到所述另一分組POI數(shù)據(jù)的距離,得到哈希表中距離所述另一分組POI 數(shù)據(jù)距離最短的POI數(shù)據(jù),該P(yáng)OI數(shù)據(jù)與另一分組POI數(shù)據(jù)為相同的數(shù)據(jù),將該P(yáng)OI數(shù)據(jù)與 另一分組中相應(yīng)的POI數(shù)據(jù)移入關(guān)聯(lián)結(jié)果隊列。請參見圖9,為本發(fā)明實(shí)施例提供的通過距離關(guān)聯(lián)POI數(shù)據(jù)的方法流程圖,假設(shè)用 分組b中的POI數(shù)據(jù)1的屬性,與根據(jù)分組a的屬性創(chuàng)建的哈希表的關(guān)鍵字進(jìn)行匹配,匹配 的關(guān)鍵字在哈希表中對應(yīng)了多個POI數(shù)據(jù)(至少兩個),則該方法包括
步驟901 根據(jù)POI數(shù)據(jù)1和哈希表中多個POI數(shù)據(jù)的經(jīng)緯度坐標(biāo),計算POI數(shù)據(jù) 1到多個POI數(shù)據(jù)的距離L ;步驟902 從步驟901計算的距離中任取一個距離Li與關(guān)聯(lián)距離S進(jìn)行比較,若前 者小于后者,則進(jìn)入步驟903,如果前者大于后者,則進(jìn)入步驟904 ;步驟903 將關(guān)聯(lián)距離S的取值替換為 距離Li的值;步驟904 判斷是否還有距離未讀取,如果是,則返回步驟902,如果否,則進(jìn)入步 驟 905 ;步驟905 將距離Li對應(yīng)的POI數(shù)據(jù)和POI數(shù)據(jù)1移入關(guān)聯(lián)結(jié)果隊列。以下以POI數(shù)據(jù)a關(guān)聯(lián)了 POI數(shù)據(jù)b,c及d為例,對圖9所示方法進(jìn)行詳細(xì)介紹。第一步、根據(jù)POI數(shù)據(jù)a,b,c及d的經(jīng)緯度坐標(biāo),計算得到POI數(shù)據(jù)a到POI數(shù)據(jù) 13,(3及(1的距離1^1,1^2及1^3 ;第二步、判斷Ll是否小于關(guān)聯(lián)距離S,如果大于,則進(jìn)入第三步,如果小于,則進(jìn)入 第四步;第三步、判斷L2是否小于關(guān)聯(lián)距離S,如果小于,則進(jìn)入第五步,如果大于,則進(jìn)入 第六步;第四步、判斷L2是否小于Li,如果小于,則進(jìn)入第五步,如果大于,則進(jìn)入第七步;第五步、判斷L3是否小于L2,如果小于,則進(jìn)入第十步,如果大于,則進(jìn)入第九步;第六步、判斷L3是否小于關(guān)聯(lián)距離S,如果小于,則進(jìn)入第十步,如果大于,則結(jié)束 該流程;第七步、判斷L3是否小于Li,如果小于,則進(jìn)入第十步如果大于,則進(jìn)入第八步;第八步、將POI數(shù)據(jù)a和b移入關(guān)聯(lián)結(jié)果隊列;第九步、將POI數(shù)據(jù)a和c移入關(guān)聯(lián)結(jié)果隊列;第十步、將POI數(shù)據(jù)a和d移入關(guān)聯(lián)結(jié)果隊列。以上結(jié)合附圖對本發(fā)明實(shí)施例提供的POI數(shù)據(jù)關(guān)聯(lián)方法進(jìn)行了詳細(xì)介紹,在實(shí)際 應(yīng)用中可以選擇上述任意一種方法或者方法的組合對POI數(shù)據(jù)進(jìn)行關(guān)聯(lián)。以下對上述多個 方法的一種組合使用方式進(jìn)行詳細(xì)介紹。在讀取兩個分組的POI數(shù)據(jù)之后,若該分組的分組標(biāo)識對應(yīng)的關(guān)聯(lián)距離S大于零, 則第一步、按照圖4所示方法對兩個分組的POI數(shù)據(jù)進(jìn)行關(guān)聯(lián),若匹配的名稱在哈希 表中對應(yīng)的POI數(shù)據(jù)為多個,則再按照圖9所示方法進(jìn)行POI數(shù)據(jù)關(guān)聯(lián),得到相同的POI數(shù) 據(jù);若兩個分組的POI數(shù)據(jù)在經(jīng)過第一步處理后都有POI數(shù)據(jù)剩余,則進(jìn)入第二步;第二步、按照圖5所示方法對兩個分組中剩余的POI數(shù)據(jù)進(jìn)行關(guān)聯(lián),若匹配的品牌 代碼在哈希表中對應(yīng)的POI數(shù)據(jù)為多個,則再按照圖9所示方法進(jìn)行POI數(shù)據(jù)關(guān)聯(lián),得到相 同的POI數(shù)據(jù);若兩個分組的POI數(shù)據(jù)在經(jīng)過第二步處理后都有POI數(shù)據(jù)剩余,則進(jìn)入第三步;第三步、按照圖6所示方法對兩個分組中剩余的POI數(shù)據(jù)進(jìn)行關(guān)聯(lián),若哈希表中簡 稱代碼匹配且后綴代碼一致的POI數(shù)據(jù)為多個,按照圖9所示方法進(jìn)行POI數(shù)據(jù)關(guān)聯(lián),得到 相同的POI數(shù)據(jù),若哈希表中簡稱代碼一致的POI數(shù)據(jù)也為多個,則再按照圖9所示方法進(jìn)行POI數(shù)據(jù)關(guān)聯(lián);若兩個分組的POI數(shù)據(jù)在經(jīng)過第三步處理后都有POI數(shù)據(jù)剩余,則進(jìn)入第四步;第四步、按照圖7所示方法對兩個分組中剩余的POI數(shù)據(jù)進(jìn)行關(guān)聯(lián),在得到匹配的 關(guān)鍵字在哈希表中對應(yīng)的POI數(shù)據(jù)后,若哈希表中的POI數(shù)據(jù)為多個,則再按照圖9所示方 法進(jìn)行POI數(shù)據(jù)關(guān)聯(lián),得到相同的POI數(shù)據(jù);循環(huán)第一步到第四步,關(guān)聯(lián)兩個分組集合中所有的分組后,若兩個分組集合中還 有分組的POI數(shù)據(jù)未關(guān)聯(lián)到相同的POI數(shù)據(jù),則進(jìn)入第五步;第五步、按照圖8所示方法對剩余分組的POI數(shù)據(jù)進(jìn)行關(guān)聯(lián),得到相同的POI數(shù)
據(jù)。 采用上述組合方式進(jìn)行POI數(shù)據(jù)關(guān)聯(lián),由于每一步都是對前一步關(guān)聯(lián)剩余的POI 數(shù)據(jù)進(jìn)行關(guān)聯(lián),不會受到已關(guān)聯(lián)POI數(shù)據(jù)的影響,明顯提高了關(guān)聯(lián)效率,并且,通過哈希表 顯著提高了關(guān)聯(lián)檢索的速度。以上介紹了本發(fā)明實(shí)施例提供的POI數(shù)據(jù)關(guān)聯(lián)方法,以下結(jié)合附圖對本發(fā)明實(shí)施 例提供的POI數(shù)據(jù)關(guān)聯(lián)裝置進(jìn)行詳細(xì)介紹。請參見圖10,為本發(fā)明實(shí)施例提供的一種POI數(shù)據(jù)關(guān)聯(lián)裝置,該裝置包括數(shù)據(jù)讀取單元110,用于讀取兩個批次的POI數(shù)據(jù);分組單元111,用于對所述POI數(shù)據(jù)進(jìn)行分組,得到兩個批次POI數(shù)據(jù)各自的分組 集合及分組標(biāo)識列表;分組讀取單元112,用于通過兩個分組標(biāo)識列表,從兩個分組集合中各讀取一個分 組;哈希表創(chuàng)建單元113,用于以一個分組POI數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表;第一關(guān)聯(lián)單元114,用于用另一個分組POI數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹 配,得到兩個分組相同的POI數(shù)據(jù)。在實(shí)際應(yīng)用中,分組單元111具體包括分組標(biāo)識查詢單元,用于從POI數(shù)據(jù)中提取類型代碼,查詢所述類型代碼對應(yīng)的 分組標(biāo)識;數(shù)據(jù)分組單元,用于將所述POI數(shù)據(jù)分入其所屬批次分組集合中所述分組標(biāo)識對 應(yīng)的分組;列表維護(hù)單元,用于判斷所述POI數(shù)據(jù)所屬批次的分組標(biāo)識列表中是否記錄了所 述分組標(biāo)識,如果否,則將所述分組標(biāo)識記錄在所述分組標(biāo)識列表中。在實(shí)際應(yīng)用中,分組讀取單元112具體包括相同標(biāo)識查找單元,用于在兩個分組標(biāo)識列表中,查找相同的分組標(biāo)識;分組讀取子單元,用于從兩個分組集合中讀取所述分組標(biāo)識對應(yīng)的分組。為了提高關(guān)聯(lián)的精確度,上述POI數(shù)據(jù)關(guān)聯(lián)裝置可以進(jìn)一步包括關(guān)聯(lián)距離查找 單元,第二關(guān)聯(lián)單元;關(guān)聯(lián)距離查找單元,查找所述相同標(biāo)識查找單元查找到的分組標(biāo)識對應(yīng)的關(guān)聯(lián)距 離,若所述關(guān)聯(lián)距離大于零,則所述第一關(guān)聯(lián)單元得到相同的POI數(shù)據(jù)之后觸發(fā)第二關(guān)聯(lián) 單元;第二關(guān)聯(lián)單元,用于判斷匹配的關(guān)鍵字在哈希表中對應(yīng)的POI數(shù)據(jù)是否為多個,如果是,則計算所述哈希表中的POI數(shù)據(jù)到所述另一分組POI數(shù)據(jù)的距離,選擇距離哈希表 中距離所述另一分組POI數(shù)據(jù)最短的POI數(shù)據(jù),所述POI數(shù)據(jù)與另一分組POI數(shù)據(jù)為相同 的數(shù)據(jù)。對于上述任一種POI數(shù)據(jù)關(guān)聯(lián)裝 置,哈希表創(chuàng)建單元113和第一關(guān)聯(lián)單元114有 如下幾種不同的實(shí)現(xiàn)方式第一種,若所述屬性為名稱,則哈希表創(chuàng)建單元為名稱哈希表創(chuàng)建單元,第一關(guān)聯(lián) 單元為名稱一致關(guān)聯(lián)單元名稱哈希表創(chuàng)建單元,用于將一個分組中名稱相同的POI數(shù)據(jù)存入哈希表中所述 名稱為關(guān)鍵字的位置;名稱一致關(guān)聯(lián)單元,用于用另一個分組POI數(shù)據(jù)的名稱與哈希表的關(guān)鍵字進(jìn)行匹 配,得到兩個分組相同的POI數(shù)據(jù)。第二種,若所述屬性為品牌代碼,哈希表創(chuàng)建單元113具體包括品牌識別單元,用于識別兩個分組POI數(shù)據(jù)的名稱是否包含品牌名稱,如果包含, 則將所述品牌名稱對應(yīng)的品牌代碼添加到所述POI數(shù)據(jù)的屬性中;哈希表創(chuàng)建單元,用于將一個分組中品牌代碼相同的POI數(shù)據(jù)的存入哈希表中所 述品牌代碼為關(guān)鍵字的位置;第一關(guān)聯(lián)單元114為品牌一致關(guān)聯(lián)單元所述品牌一致關(guān)聯(lián)單元,用于用另一個分組POI數(shù)據(jù)的品牌代碼與哈希表的關(guān)鍵 字進(jìn)行匹配,得到兩個分組相同的POI數(shù)據(jù)。第三種、所述屬性為簡稱代碼,哈希表創(chuàng)建單元113具體包括簡稱識別單元,用于識別兩個分組POI數(shù)據(jù)的名稱是否有簡稱,如果有,則將所述 簡稱對應(yīng)的簡稱代碼添加到所述POI數(shù)據(jù)的屬性中;后綴識別單元,用于識別所述兩個分組POI數(shù)據(jù)的名稱中是否以預(yù)置的后綴庫中 的詞為后綴,如果是,則將所述后綴對應(yīng)的后綴代碼添加到所述POI數(shù)據(jù)的屬性中;哈希表創(chuàng)建單元,用于將一個分組中簡稱代碼相同的POI數(shù)據(jù)存入哈希表中所述 簡稱代碼為關(guān)鍵字的位置;第一關(guān)聯(lián)單元114具體包括簡稱代碼關(guān)聯(lián)單元,用于用另一個分組POI數(shù)據(jù)的簡稱代碼與哈希表的關(guān)鍵字進(jìn) 行匹配;相同POI第一關(guān)聯(lián)單元,用于從匹配的關(guān)鍵字在哈希表中對應(yīng)的POI數(shù)據(jù)中,得到 與另一個分組POI數(shù)據(jù)后綴代碼相同的POI數(shù)據(jù),所述POI數(shù)據(jù)與另一個分組POI數(shù)據(jù)為 相同的數(shù)據(jù);若經(jīng)過相同第一關(guān)聯(lián)單元處理后分組中還有POI數(shù)據(jù)剩余,則上述第一關(guān)聯(lián)單元 進(jìn)一步包括相同POI第二關(guān)聯(lián)單元;相同POI第二關(guān)聯(lián)單元,用于用另一個分組剩余POI數(shù)據(jù)的簡稱代碼與哈希表中 的關(guān)鍵字進(jìn)行匹配,得到兩個分組中相同的POI數(shù)據(jù)。第四種、若所述屬性為主體名稱,哈希表創(chuàng)建單元113具體包括主體名稱識別單元,用于識別兩個分組POI數(shù)據(jù)的主體名稱;主體名稱哈希表創(chuàng)建單元,用于將一個分組中主體名稱相同的POI數(shù)據(jù)存入哈希表中所述主體名稱為關(guān)鍵字的位置; 所述第一關(guān)聯(lián)單元114為主體名稱一致關(guān)聯(lián)單元所述主體名稱一致關(guān)聯(lián)單元,用于用另一個分組POI數(shù)據(jù)的主體名稱與哈希表中 的關(guān)鍵字進(jìn)行匹配,得到兩個分組中相同的POI數(shù)據(jù)。經(jīng)過上述任一種裝置的處理后,若兩個分組集合中還有分組剩余,則上述裝置進(jìn) 一步包括第三關(guān)聯(lián)單元,用于遍歷兩個分組集合剩余分組中的POI數(shù)據(jù),計算不同批次兩 個POI數(shù)據(jù)主體名稱的相似度,若相似度超過預(yù)置值,則所述兩個POI數(shù)據(jù)為相同的POI數(shù)據(jù)。在實(shí)際應(yīng)用中可以選擇上述任意一種裝置或者裝置的組合對POI數(shù)據(jù)進(jìn)行關(guān)聯(lián), 組合方式請參照前文方法部分的描述,此處不再贅述。以上對本發(fā)明所提供的一種興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法及裝置進(jìn)行了詳細(xì)介紹,對于本 領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明實(shí)施例的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會有改 變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
一種興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,所述方法包括讀取兩個批次的興趣點(diǎn)數(shù)據(jù);對所述興趣點(diǎn)數(shù)據(jù)進(jìn)行分組,得到兩個批次興趣點(diǎn)數(shù)據(jù)各自的分組集合及分組標(biāo)識列表;通過兩個分組標(biāo)識列表,從兩個分組集合中各讀取一個分組;以一個分組興趣點(diǎn)數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表;用另一個分組興趣點(diǎn)數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組相同的興趣點(diǎn)數(shù)據(jù)。
2.如權(quán)利要求1所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,對興趣點(diǎn)數(shù)據(jù)進(jìn)行分組,得 到兩個批次興趣點(diǎn)數(shù)據(jù)各自的分組集合及分組標(biāo)識列表具體包括從興趣點(diǎn)數(shù)據(jù)中提取類型代碼,查詢所述類型代碼對應(yīng)的分組標(biāo)識; 將所述興趣點(diǎn)數(shù)據(jù)分入其所屬批次分組集合中所述分組標(biāo)識對應(yīng)的分組; 判斷所述興趣點(diǎn)數(shù)據(jù)所屬批次的分組標(biāo)識列表中是否記錄了所述分組標(biāo)識,如果否, 則將所述分組標(biāo)識記錄在所述分組標(biāo)識列表中。
3.如權(quán)利要求2所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,通過兩個分組標(biāo)識列表,從 兩個分組集合中各讀取一個分組具體包括在兩個分組標(biāo)識列表中,查找相同的分組標(biāo)識; 從兩個分組集合中讀取所述分組標(biāo)識對應(yīng)的分組。
4.如權(quán)利要求3所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,所述屬性為名稱,以一個分 組中興趣點(diǎn)數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表具體包括將一個分組中名稱相同的興趣點(diǎn)數(shù)據(jù)存入哈希表中所述名稱為關(guān)鍵字的位置; 用另一個分組興趣點(diǎn)數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組相同的興 趣點(diǎn)數(shù)據(jù)具體包括用另一個分組興趣點(diǎn)數(shù)據(jù)的名稱與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組相同的興 趣點(diǎn)數(shù)據(jù)。
5.如權(quán)利要求3所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,所述屬性為品牌代碼,以一 個分組中興趣點(diǎn)數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表具體包括識別兩個分組興趣點(diǎn)數(shù)據(jù)的名稱是否包含品牌名稱,如果包含,則將所述品牌名稱對 應(yīng)的品牌代碼添加到所述興趣點(diǎn)數(shù)據(jù)的屬性中;將一個分組中品牌代碼相同的興趣點(diǎn)數(shù)據(jù)的存入哈希表中所述品牌代碼為關(guān)鍵字的 位置;用另一個分組中興趣點(diǎn)數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組相同的 興趣點(diǎn)數(shù)據(jù)具體包括用另一個分組興趣點(diǎn)數(shù)據(jù)的品牌代碼與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組相同 的興趣點(diǎn)數(shù)據(jù)。
6.如權(quán)利要求3所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,所述屬性為簡稱代碼,以一 個分組中興趣點(diǎn)數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表具體包括識別兩個分組興趣點(diǎn)數(shù)據(jù)的名稱是否有簡稱,如果有,則將所述簡稱對應(yīng)的簡稱代碼 添加到所述興趣點(diǎn)數(shù)據(jù)的屬性中;識別所述兩個分組興趣點(diǎn)數(shù)據(jù)的名稱是否以預(yù)置的后綴庫中的詞為后綴,如果是,則 將所述后綴對應(yīng)的后綴代碼添加到所述興趣點(diǎn)數(shù)據(jù)的屬性中;將一個分組中簡稱代碼相同的興趣點(diǎn)數(shù)據(jù)存入哈希表中所述簡稱代碼為關(guān)鍵字的位置;用另一個分組興趣點(diǎn)數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組相同的興 趣點(diǎn)數(shù)據(jù)具體包括用另一個分組興趣點(diǎn)數(shù)據(jù)的簡稱代碼與哈希表的關(guān)鍵字進(jìn)行匹配; 從匹配的關(guān)鍵字在哈希表中對應(yīng)的興趣點(diǎn)數(shù)據(jù)中,得到與另一個分組興趣點(diǎn)數(shù)據(jù)后綴 代碼相同的興趣點(diǎn)數(shù)據(jù),所述興趣點(diǎn)數(shù)據(jù)與另一個分組興趣點(diǎn)數(shù)據(jù)為相同的數(shù)據(jù)。
7.如權(quán)利要求6所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,若所述另一個分組有興趣 點(diǎn)數(shù)據(jù)未關(guān)聯(lián)到相同的興趣點(diǎn)數(shù)據(jù),則得到與另一個分組興趣點(diǎn)數(shù)據(jù)后綴代碼相同的興趣 點(diǎn)數(shù)據(jù)之后,所述方法進(jìn)一步包括用另一個分組剩余興趣點(diǎn)數(shù)據(jù)的簡稱代碼與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組 中相同的興趣點(diǎn)數(shù)據(jù)。
8.如權(quán)利要求3所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,所述屬性為主體名稱,以一 個分組中興趣點(diǎn)數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表具體包括識別兩個分組興趣點(diǎn)數(shù)據(jù)的主體名稱;將一個分組中主體名稱相同的興趣點(diǎn)數(shù)據(jù)存入哈希表中所述主體名稱為關(guān)鍵字的位置;用另一個分組中興趣點(diǎn)數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組相同的 興趣點(diǎn)數(shù)據(jù)具體包括用另一個分組興趣點(diǎn)數(shù)據(jù)的主體名稱與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組中相 同的興趣點(diǎn)數(shù)據(jù)。
9.如權(quán)利要求8所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,若兩個分組集合有分組的 興趣點(diǎn)數(shù)據(jù)未關(guān)聯(lián)到相同興趣點(diǎn)數(shù)據(jù),則所述方法進(jìn)一步包括遍歷兩個分組集合剩余分組中的興趣點(diǎn)數(shù)據(jù);計算不同批次兩個興趣點(diǎn)數(shù)據(jù)主體名稱的相似度,若相似度超過預(yù)置值,則所述兩個 興趣點(diǎn)數(shù)據(jù)為相同的興趣點(diǎn)數(shù)據(jù)。
10.如權(quán)利要求9所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,所述計算不同批次兩個興 趣點(diǎn)數(shù)據(jù)主體名稱的相似度具體包括計算不同批次兩個興趣點(diǎn)數(shù)據(jù)主體名稱的最大公共字符串;用最大公共子字符串除以所述兩個興趣點(diǎn)數(shù)據(jù)主體名稱長度值中最大的長度值,得到 所述兩個興趣點(diǎn)數(shù)據(jù)主體名稱的相似度。
11.如權(quán)利要求3至10中任一項權(quán)利要求所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法,其特征在于,在 兩個分組標(biāo)識列表中,查找相同的分組標(biāo)識之后,所述方法進(jìn)一步包括查找所述分組標(biāo)識對應(yīng)的關(guān)聯(lián)距離,若所述關(guān)聯(lián)距離大于零,則用另一個分組興趣點(diǎn) 數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配之后,所述方法進(jìn)一步包括判斷匹配的關(guān)鍵字在哈希表中對應(yīng)的興趣點(diǎn)數(shù)據(jù)是否為多個,如果是,則計算所述哈 希表中的興趣點(diǎn)數(shù)據(jù)到所述另一分組興趣點(diǎn)數(shù)據(jù)的距離,得到哈希表中距離所述另一分組興趣點(diǎn)數(shù)據(jù)距離最短的興趣點(diǎn)數(shù)據(jù),該興趣點(diǎn)數(shù)據(jù)與另一分組興趣點(diǎn)數(shù)據(jù)為相同的數(shù)據(jù)。
12.一種興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,其特征在于,所述裝置包括數(shù)據(jù)讀取單元,用于讀取兩個批次的興趣點(diǎn)數(shù)據(jù);分組單元,用于對所述興趣點(diǎn)數(shù)據(jù)進(jìn)行分組,得到兩個批次興趣點(diǎn)數(shù)據(jù)各自的分組集 合及分組標(biāo)識列表;分組讀取單元,用于通過兩個分組標(biāo)識列表,從兩個分組集合中各讀取一個分組;哈希表創(chuàng)建單元,用于以一個分組興趣點(diǎn)數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表;第一關(guān)聯(lián)單元,用于用另一個分組興趣點(diǎn)數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得 到兩個分組相同的興趣點(diǎn)數(shù)據(jù)。
13.如權(quán)利要求12所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,其特征在于,所述分組單元具體包括分組標(biāo)識查詢單元,用于從興趣點(diǎn)數(shù)據(jù)中提取類型代碼,查詢所述類型代碼對應(yīng)的分組標(biāo)識;數(shù)據(jù)分組單元,用于將所述興趣點(diǎn)數(shù)據(jù)分入其所屬批次分組集合中所述分組標(biāo)識對應(yīng) 的分組;列表維護(hù)單元,用于判斷所述興趣點(diǎn)數(shù)據(jù)所屬批次的分組標(biāo)識列表中是否記錄了所述 分組標(biāo)識,如果否,則將所述分組標(biāo)識記錄在所述分組標(biāo)識列表中。
14.如權(quán)利要求13所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,其特征在于,分組讀取單元具體包括相同標(biāo)識查找單元,用于在兩個分組標(biāo)識列表中,查找相同的分組標(biāo)識;分組讀取子單元,用于從兩個分組集合中讀取所述分組標(biāo)識對應(yīng)的分組。
15.如權(quán)利要求14所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,其特征,所述裝置進(jìn)一步包括關(guān)聯(lián)距 離查找單元,第二關(guān)聯(lián)單元;所述關(guān)聯(lián)距離查找單元,查找所述相同標(biāo)識查找單元查找到的分組標(biāo)識對應(yīng)的關(guān)聯(lián)距 離,若所述關(guān)聯(lián)距離大于零,則所述第一關(guān)聯(lián)單元在得到相同的興趣點(diǎn)數(shù)據(jù)之后觸發(fā)所述 第二關(guān)聯(lián)單元;所述第二關(guān)聯(lián)單元,用于判斷匹配的關(guān)鍵字在哈希表中對應(yīng)的興趣點(diǎn)數(shù)據(jù)是否為多 個,如果是,則計算所述哈希表中的興趣點(diǎn)數(shù)據(jù)到所述另一分組興趣點(diǎn)數(shù)據(jù)的距離,選擇距 離哈希表中距離所述另一分組興趣點(diǎn)數(shù)據(jù)最短的興趣點(diǎn)數(shù)據(jù),所述興趣點(diǎn)數(shù)據(jù)與另一分組 興趣點(diǎn)數(shù)據(jù)為相同的數(shù)據(jù)。
16.如權(quán)利要求12至15任一項權(quán)利要求所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,其特征在于,所 述屬性為名稱,所述哈希表創(chuàng)建單元為名稱哈希表創(chuàng)建單元,所述第一關(guān)聯(lián)單元為名稱一 致關(guān)聯(lián)單元所述名稱哈希表創(chuàng)建單元,用于將一個分組中名稱相同的興趣點(diǎn)數(shù)據(jù)存入哈希表中所 述名稱為關(guān)鍵字的位置;所述名稱一致關(guān)聯(lián)單元,用于用另一個分組興趣點(diǎn)數(shù)據(jù)的名稱與哈希表的關(guān)鍵字進(jìn)行 匹配,得到兩個分組相同的興趣點(diǎn)數(shù)據(jù)。
17.如權(quán)利要求12至15任一項權(quán)利要求所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,其特征在于,所 述屬性為品牌代碼,哈希表創(chuàng)建單元具體包括品牌識別單元,用于識別兩個分組興趣點(diǎn)數(shù)據(jù)的名稱是否包含品牌名稱,如果包含,則 將所述品牌名稱對應(yīng)的品牌代碼添加到所述興趣點(diǎn)數(shù)據(jù)的屬性中;哈希表創(chuàng)建單元,用于將一個分組中品牌代碼相同的興趣點(diǎn)數(shù)據(jù)的存入哈希表中所述 品牌代碼為關(guān)鍵字的位置;所述第一關(guān)聯(lián)單元為品牌一致關(guān)聯(lián)單元所述品牌一致關(guān)聯(lián)單元,用于用另一個分組興趣點(diǎn)數(shù)據(jù)的品牌代碼與哈希表的關(guān)鍵字 進(jìn)行匹配,得到兩個分組相同的興趣點(diǎn)數(shù)據(jù)。
18.如權(quán)利要求12至15任一項權(quán)利要求所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,其特征在于,所 述屬性為簡稱代碼,哈希表創(chuàng)建單元具體包括簡稱識別單元,用于識別兩個分組興趣點(diǎn)數(shù)據(jù)的名稱是否有簡稱,如果有,則將所述簡 稱對應(yīng)的簡稱代碼添加到所述興趣點(diǎn)數(shù)據(jù)的屬性中;后綴識別單元,用于識別所述兩個分組興趣點(diǎn)數(shù)據(jù)的名稱中是否以預(yù)置的后綴庫中的 詞為后綴,如果是,則將所述后綴對應(yīng)的后綴代碼添加到所述興趣點(diǎn)數(shù)據(jù)的屬性中;哈希表創(chuàng)建單元,用于將一個分組中簡稱代碼相同的興趣點(diǎn)數(shù)據(jù)存入哈希表中所述簡 稱代碼為關(guān)鍵字的位置;所述第一關(guān)聯(lián)單元具體包括簡稱代碼關(guān)聯(lián)單元,用于用另一個分組興趣點(diǎn)數(shù)據(jù)的簡稱代碼與哈希表的關(guān)鍵字進(jìn)行 匹配;相同興趣點(diǎn)第一關(guān)聯(lián)單元,用于從匹配的關(guān)鍵字在哈希表中對應(yīng)的興趣點(diǎn)數(shù)據(jù)中,得 到與另一個分組興趣點(diǎn)數(shù)據(jù)后綴代碼相同的興趣點(diǎn)數(shù)據(jù),所述興趣點(diǎn)數(shù)據(jù)與另一個分組興 趣點(diǎn)數(shù)據(jù)為相同的數(shù)據(jù)。
19.如權(quán)利要求18所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,其特征在于,若所述另一個分組有興 趣點(diǎn)數(shù)據(jù)未關(guān)聯(lián)到相同的興趣點(diǎn)數(shù)據(jù),則所述第一關(guān)聯(lián)單元進(jìn)一步包括相同興趣點(diǎn)第二 關(guān)聯(lián)單元;所述相同興趣點(diǎn)第二關(guān)聯(lián)單元,用于用另一個分組剩余興趣點(diǎn)數(shù)據(jù)的簡稱代碼與哈希 表中的關(guān)鍵字進(jìn)行匹配,得到兩個分組中相同的興趣點(diǎn)數(shù)據(jù)。
20.如權(quán)利要求12至15任一項權(quán)利要求所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,其特征在于,所 述屬性為主體名稱,哈希表創(chuàng)建單元具體包括主體名稱識別單元,用于識別兩個分組興趣點(diǎn)數(shù)據(jù)的主體名稱;主體名稱哈希表創(chuàng)建單元,用于將一個分組中主體名稱相同的興趣點(diǎn)數(shù)據(jù)存入哈希表 中所述主體名稱為關(guān)鍵字的位置;所述第一關(guān)聯(lián)單元為主體名稱一致關(guān)聯(lián)單元所述主體名稱一致關(guān)聯(lián)單元,用于用另一個分組興趣點(diǎn)數(shù)據(jù)的主體名稱與哈希表中的 關(guān)鍵字進(jìn)行匹配,得到兩個分組中相同的興趣點(diǎn)數(shù)據(jù)。
21.如權(quán)利要求12至15任一項權(quán)利要求所述的興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置,其特征在于,若 兩個分組集合有分組的興趣點(diǎn)數(shù)據(jù)未關(guān)聯(lián)到相同的數(shù)據(jù),則所述裝置進(jìn)一步包括第三關(guān)聯(lián)單元,用于遍歷兩個分組集合剩余分組中的興趣點(diǎn)數(shù)據(jù),計算不同批次兩個 興趣點(diǎn)數(shù)據(jù)主體名稱的相似度,若相似度超過預(yù)置值,則所述兩個興趣點(diǎn)數(shù)據(jù)為相同的興 趣點(diǎn)數(shù)據(jù)。
全文摘要
本發(fā)明實(shí)施例提供了一種興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)方法及裝置。所述方法包括讀取兩個批次的興趣點(diǎn)數(shù)據(jù);對所述興趣點(diǎn)數(shù)據(jù)進(jìn)行分組,得到兩個批次興趣點(diǎn)數(shù)據(jù)各自的分組集合及分組標(biāo)識列表;通過兩個分組標(biāo)識列表,從兩個分組集合中各讀取一個分組;以一個分組興趣點(diǎn)數(shù)據(jù)的屬性為關(guān)鍵字建立哈希表;用另一個分組興趣點(diǎn)數(shù)據(jù)的屬性與哈希表的關(guān)鍵字進(jìn)行匹配,得到兩個分組相同的興趣點(diǎn)數(shù)據(jù)。相應(yīng)地,本發(fā)明實(shí)施例還提供了一種興趣點(diǎn)數(shù)據(jù)關(guān)聯(lián)裝置。采用本發(fā)明實(shí)施例提供的方法或者裝置可以有效地關(guān)聯(lián)出不同批次POI數(shù)據(jù)之間的重復(fù)數(shù)據(jù)。
文檔編號G06F17/30GK101963961SQ20091008954
公開日2011年2月2日 申請日期2009年7月23日 優(yōu)先權(quán)日2009年7月23日
發(fā)明者楊東見, 王濤 申請人:高德軟件有限公司