一種通信地址補全的裝置及方法
【專利摘要】本發(fā)明提供一種通信地址補全的裝置,該裝置包括:地址文本預處理單元,地址切分與標注單元;地址補全單元。地址補全單元包含地址解析器。本發(fā)明還提供一種通信地址補全的方法,該方法包括:對輸入的地址文本進行預處理,包括刪除多余的空格、將數(shù)字或字母的全角字符轉(zhuǎn)換為半角字符;對地址文本進行地址切分形成地址序列,并將地址序列標注上對應(yīng)的地址類別;根據(jù)地址索引文件,獲得最相似的標準地址,進而將地址文本進行補全。本發(fā)明能實現(xiàn)地址補全后精確的標準化結(jié)果,滿足用戶的隨意性輸入,并免去了人工輸入完整通信地址的繁瑣過程,提高用戶體驗。
【專利說明】一種通信地址補全的裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信地址領(lǐng)域,尤其涉及一種通信地址補全的裝置及方法。
【背景技術(shù)】
[0002]隨著電子商務(wù)的突飛猛進和物流行業(yè)的信息化,使得人們在足不出戶的情況下完成購物和郵寄物品,大大節(jié)約了時間和金錢成本。電子商務(wù)和物流行業(yè)都離不開通信地址(又稱為通訊地址,簡稱為地址)和郵編,這些數(shù)據(jù)都需要用戶提供,然而在實際中用戶并不能完全記得完整的通信地址或者只會輸入部分地址簡稱。為了解決這一問題,當前一些電子商務(wù)網(wǎng)站或者物流公司會在地址輸入時提供下拉菜單讓用戶進行選擇,這種固定選擇一般也就是給到地市級地址為止,其他部分還是需要用戶自己手工進行輸入。
[0003]上述這種提示的方法過于繁瑣,且提示結(jié)果不全面,無法滿足用戶輸入的隨意性,所以需要實現(xiàn)一種對用戶輸入地址文本進行補全的辦法,將用戶隨意性輸入的地址補全為標準化的通信地址,方便用戶輸入,并使得輸入結(jié)果精確。
[0004]當前使用的通訊地址使用模式主要有兩種:以道路為中心定位的地址,常見的地址構(gòu)造規(guī)則如下:省級行政區(qū)+地級行政區(qū)+縣級行政區(qū)+道路+門牌號+建筑物名+房間號。如:廣東省深圳市南山區(qū)高新南環(huán)路29號留學生創(chuàng)業(yè)大廈2208室。此種地址描述模式常見于電子地圖中,如百度地圖,谷歌地圖等;以行政區(qū)劃為中心地位的地址,常見的地址構(gòu)造規(guī)則如下:省級行政區(qū)+地級行政區(qū)+縣級行政區(qū)+鄉(xiāng)/鎮(zhèn)/街道+居(村)委會+小區(qū)/自然村。如:廣東省深圳市寶安區(qū)西鄉(xiāng)街道流塘居委會寶民花園。此種地址描述模式常見于政府部門,如民政局等。
【發(fā)明內(nèi)容】
[0005]為此,本發(fā)明為了解決上述缺陷之一。
[0006]因而,本發(fā)明提供一種通信地址補全的裝置及方法,通過對輸入地址文本進行預處理后進行地址切分和標注,并生成Query語句進行地址解析,檢索獲得最相似的標準地址并進行地址補全,從而實現(xiàn)了地址補全后精確的標準化結(jié)果,滿足用戶的隨意性輸入,并免去了人工輸入完整通信地址的繁瑣過程,提高用戶體驗。
[0007]所以,本發(fā)明一個實施例提供一種通信地址補全的裝置,該裝置包括:
地址文本預處理單元,用于:
將輸入的地址文本進行預處理,包括刪除多余的空格、將數(shù)字或字母的全角字符轉(zhuǎn)換為半角字符;
地址切分與標注單元,用于:
將經(jīng)過地址文本預處理單元處理后的地址文本切分成地址序列,并將地址序列標注上對應(yīng)的地址類別;
地址補全單元,用于:
根據(jù)地址索引文件,獲得最相似的標準地址,進而將地址文本進行補全。[0008]在本發(fā)明一個實施例中,所述裝置包括:所述地址切分與標注單元預先建立地址元數(shù)據(jù)庫,獲取地址文本預處理單元處理后的地址文本進行地址切分;
所述地址序列標注上對應(yīng)的地址類別為地名所對應(yīng)的地名等級值。
[0009]優(yōu)選地,所述裝置還包括:將切分好的地址序列標注上其所有可能的地址等級。
[0010]優(yōu)選地,所述地址補全單元包括一個地址解析器。
[0011]在本發(fā)明一個實施例中,所述地址補全單元包括:所述地址補全單元將標注好的地址文本生成Query語句;
所述地址解析器獲得Query語句并進行解析,根據(jù)地址索引文件檢索獲得最相似的標準地址。
[0012]優(yōu)選地,所述地址補全單元還包括:所述地址補全單元生成Query語句以半角引號把地址序列中的地址元數(shù)據(jù)括起來。
[0013]本發(fā)明另一個實施例提供一種通信地址補全的方法,該方法包括以下步驟:
對輸入的地址文本進行預處理,包括刪除多余的空格、將數(shù)字或字母的全角字符轉(zhuǎn)換
為半角字符;
對地址文本進行地址切分形成地址序列,并將地址序列標注上對應(yīng)的地址類別;
根據(jù)地址索引文件,獲得最相似的標準地址,進而將地址文本進行補全。
[0014]在本發(fā)明一個實施例中,地址補全包括地址解析;所述地址補全將所述標注地址生成Query語句;所述地址解析獲得Query語句并進行解析,然后根據(jù)地址索引文件檢索獲得最相似的標準地址。本發(fā)明通過對輸入地址文本進行預處理后進行地址切分和標注,并生成Query語句進行地址解析,檢索獲得最相似的標準地址并進行地址補全,從而實現(xiàn)了地址補全后精確的標準化結(jié)果,滿足用戶的隨意性輸入,并免去了人工輸入完整通信地址的繁瑣過程,提高用戶體驗。
【專利附圖】
【附圖說明】
[0015]圖1是本發(fā)明實施例實現(xiàn)的一種通信地址補全的裝置的示意圖。
[0016]圖2是本發(fā)明實施例實現(xiàn)的一種通信地址補全的方法程示意圖。
【具體實施方式】
[0017]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步的詳細說明。應(yīng)當理解,此處所描述的具體實施例僅僅用于解釋本發(fā)明,并不用于限定本發(fā)明。
[0018]本發(fā)明提供一種通信地址補全的裝置及方法,通過對輸入地址文本進行預處理后進行地址切分和標注,并生成Query語句進行地址解析,檢索獲得最相似的標準地址并進行地址補全,從而實現(xiàn)了地址補全后精確的標準化結(jié)果,滿足用戶的隨意性輸入,并免去了人工輸入完整通信地址的繁瑣過程,提高用戶體驗。
[0019]如圖1是本發(fā)明實施例實現(xiàn)的一種通信地址補全的裝置的示意圖,該裝置包括地址文本預處理單元10,地址切分與標注單元20,地址解析器30和地址補全單元40。
[0020]在本發(fā)明一個實施中,地址文本預處理單元10獲得輸入的地址文本,并對所獲取的地址文本進行預處理,預處理包括刪除多余的空格和將數(shù)字或字母轉(zhuǎn)換成半角字符。[0021]在本發(fā)明一個實施中,地址切分與標注單元20獲得地址文本預處理單元10中處理后的地址文本。地址切分與標注單元20預先建立地址元數(shù)據(jù)庫,地址切分與標注單元20根據(jù)地址元數(shù)據(jù)將上述地址文本進行切分,切分結(jié)果為地址元數(shù)據(jù)對應(yīng)的地址序列。
[0022]在本發(fā)明一個實施中,地址切分與標注單元20采用以下地名類別定義,如下表I所示:
【權(quán)利要求】
1.一種通信地址補全的裝置,其特征在于,該裝置包括: 地址文本預處理單元,用于: 將輸入的地址文本進行預處理,包括刪除多余的空格、將數(shù)字或字母的全角字符轉(zhuǎn)換為半角字符; 地址切分與標注單元,用于: 將經(jīng)過地址文本預處理單元處理后的地址文本切分成地址序列,并將地址序列標注上對應(yīng)的地址類別; 地址補全單元,用于: 根據(jù)地址索引文件,獲得最相似的標準地址,進而將地址文本進行補全。
2.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述裝置包括: 所述地址切分與標注單元預先建立地址元數(shù)據(jù)庫,獲取地址文本預處理單元處理后的地址文本進行地址切分; 所述地址序列標注上對應(yīng)的地址類別為地名所對應(yīng)的地名等級值。
3.根據(jù)權(quán)利要求1或2所述的裝置,其特征在于,所述裝置還包括: 將切分好的地址序列標注上其所有可能的地址等級。
4.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述地址補全單元包括一個地址解析器。
5.根據(jù)權(quán)利要求1或4所述的裝置,其特征在于,所述地址補全單元包括: 所述地址補全單元將標注好的地址文本生成Query語句; 所述地址解析器獲得Query語句并進行解析,根據(jù)地址索引文件檢索獲得最相似的標準地址。
6.根據(jù)權(quán)利要求4或5所述的裝置,其特征在于,所述地址補全單元還包括: 所述地址補全單元生成Query語句以半角引號把地址序列中的地址元數(shù)據(jù)括起來。
7.一種通信地址補全的方法,其特征在于,該方法包括以下步驟: 對輸入的地址文本進行預處理,包括刪除多余的空格、將數(shù)字或字母的全角字符轉(zhuǎn)換為半角字符; 對地址文本進行地址切分形成地址序列,并將地址序列標注上對應(yīng)的地址類別; 根據(jù)地址索引文件,獲得最相似的標準地址,進而將地址文本進行補全。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述地址補全包括地址解析; 所述地址補全將所述標注地址生成Query語句; 所述地址解析獲得Query語句并進行解析,然后根據(jù)地址索引文件檢索獲得最相似的標準地址。
【文檔編號】G06F17/30GK103473289SQ201310386689
【公開日】2013年12月25日 申請日期:2013年8月30日 優(yōu)先權(quán)日:2013年8月30日
【發(fā)明者】王國印, 賈西貝 申請人:深圳市華傲數(shù)據(jù)技術(shù)有限公司