護的范圍。
[0051] -個小區(qū)可W是一個居民小區(qū),例如天和苑A期、天和苑B期、天和苑C期、天和苑D 期,分別為4個小區(qū),并且每個小區(qū)中包含多個樓宇;一個小區(qū)也可W是一個學(xué)校的某個校 區(qū),例如上海交通大學(xué)A校區(qū)、上海交通大學(xué)B校區(qū)、上海交通大學(xué)C校區(qū)、上海交通大學(xué)D校 區(qū)、上海交通大學(xué)E校區(qū),分別為5個校區(qū),每個校區(qū)為一個小區(qū),并且每個校區(qū)包含多個樓 宇。
[0052] 本發(fā)明實施例中將W小區(qū)為某個學(xué)校的校區(qū)為例進行說明,對此后續(xù)不再寶述。
[0053] 下面結(jié)合說明書附圖對本發(fā)明實施例作進一步詳細(xì)描述,如圖1所示,本發(fā)明實施 例提供的訂單地址匹配方法,包括:
[0化4] 步驟101、確定訂單地址對應(yīng)的小區(qū);
[0055] 步驟102、根據(jù)所述訂單地址,生成所述訂單地址對應(yīng)的字段集合;
[0056] 步驟103、針對所述小區(qū)中的一個樓宇,從所述樓宇對應(yīng)的字段集合中確定與所述 訂單對應(yīng)的字段集合匹配的字段;w及根據(jù)匹配的字段的字段分值,確定所述樓宇的匹配 分值;
[0057]步驟104、將所述小區(qū)中匹配分值最高的樓宇,確定為所述訂單地址對應(yīng)的樓宇。 [005引具體地,在上述步驟101中,首先確定訂單地址對應(yīng)的小區(qū)。一般用戶通過移動終 端,如平板電腦,手機等下單時,會手動輸入一個配送地址,或者使用預(yù)先保存的配送地址, 該配送地址即為訂單地址,并且一般用戶在下單時,是在某個小區(qū)內(nèi)或者是在某個小區(qū)附 近,因而可W基于用戶的下單時的訂單地址,確定該訂單地址對應(yīng)的小區(qū)。具體地,根據(jù)訂 單地址,確定訂單地址對應(yīng)的小區(qū)的方式有很多種,例如可W是預(yù)先存儲一個小區(qū)與一些 地址的對應(yīng)的關(guān)系,比如將小區(qū)的地址W及附近路段名稱作為該小區(qū)對應(yīng)的地址信息,當(dāng) 一個訂單地址中出現(xiàn)一個小區(qū)對應(yīng)的地址信息中的一個或者多個時,可W確定該訂單地址 對應(yīng)該小區(qū),對于確定訂單地址對應(yīng)的小區(qū)的具體方式不做限定,對此不再寶述。
[0059] 上述步驟102中,根據(jù)訂單地址,生成訂單地址對應(yīng)的字段集合。具體地,根據(jù)訂單 地址生成訂單地址對應(yīng)的字段集合的方式有很多,例如可W使用正向最大匹配法,逆向最 大匹配法,最少切分法,雙向最大匹配法等方法中的一種,對訂單地址進行中文分詞,然后 對分詞后得到的字段進行去重處理,得到字段集合,例如,訂單地址為""上海交通大學(xué)巧行 校區(qū)西六十棟",則可W生成該訂單地址的對應(yīng)字段集合為{上海交通大學(xué),巧行,校區(qū),西, 六十,棟}。
[0060] 下面給出一種本發(fā)明實施例使用的生成訂單地址對應(yīng)的字段集合的方式。
[0061 ]可選地,所述根據(jù)所述訂單地址,生成所述訂單地址對應(yīng)的字段集合,包括:
[0062] 將所述訂單地址中的中文數(shù)字轉(zhuǎn)換為阿拉伯?dāng)?shù)字;
[0063] 對轉(zhuǎn)換后的訂單地址進行分詞,生成所述訂單地址對應(yīng)的字段集合。
[0064] 上述方法中,首先將訂單地址中的中文數(shù)字轉(zhuǎn)換為阿拉伯?dāng)?shù)字,然后對轉(zhuǎn)換后的 訂單地址進行分詞,得到訂單地址對應(yīng)的字段集合。例如,訂單地址為""上海交通大學(xué)巧行 校區(qū)西六十棟",則首先將訂單地址轉(zhuǎn)換為"上海交通大學(xué)巧行校區(qū)西60棟",然后進行分 詞,得到最終的字段集合為{上海交通大學(xué),巧行,校區(qū),西,60,棟},其中對于分詞的方式不 做限定,例如可W是正向最大匹配法,逆向最大匹配法,最少切分法,雙向最大匹配法等,優(yōu) 選地,使用逆向最大匹配法對轉(zhuǎn)換后的訂單地址進行分詞處理。
[0065] 該方法,之所W將訂單地址中的中文數(shù)字轉(zhuǎn)換為阿拉伯?dāng)?shù)字,是為了后續(xù)對訂單 地址與樓宇做匹配時,可W更加準(zhǔn)確和方便地匹配出訂單地址對應(yīng)的樓宇,因為樓宇一般 使用數(shù)字進行編號,因而數(shù)字的識別度比較高,因此該方法可W更加便于對訂單地址跟樓 宇進行匹配處理。
[0066] 上述步驟103中,針對訂單地址對應(yīng)的小區(qū)中的每一個樓宇,都需要確定該樓宇與 訂單地址的匹配分值,其中確定的方式為:從樓宇對應(yīng)的字段集合中確定與訂單對應(yīng)的字 段集合匹配的字段,然后根據(jù)匹配的字段的字段分值,確定樓宇的匹配分值。
[0067] 其中,一個小區(qū)中包含很多樓宇,一個小區(qū)對應(yīng)的樓宇記錄信息都預(yù)先做了存儲, 例如,W上海交通大學(xué)巧行校區(qū)為例進行說明,假設(shè)巧行校區(qū)一共包含5棟樓宇,則預(yù)先存 儲了該5棟樓宇的樓宇記錄信息,如表1所示。
[006引
[0069] 表1上海交通大學(xué)巧行校區(qū)樓宇記錄信息表
[0070] 需要說明的是,上面只是作為舉例,W上海交通大學(xué)巧行校區(qū)有5個樓宇進行說 明,實際應(yīng)用中,W實際情況為準(zhǔn),對于樓宇的數(shù)量,本發(fā)明不做限定。
[0071] 上述針對上海交通大學(xué)巧行校區(qū)的樓宇記錄信息表,是在步驟103之前預(yù)先存儲 的,下面對于如何得到一個小區(qū)(如一個學(xué)校的某個校區(qū))的樓宇記錄信息表進行說明,還 是W上海交通大學(xué)巧行校區(qū)為例。
[0072] 步驟1、收集小區(qū)中的樓宇地址信息。
[0073] 需要通過人工方式或者瀏覽學(xué)校地圖的方式,收集上海交通大學(xué)巧行校區(qū)的每個 樓宇的樓宇地址,并且W固定的格式生成樓宇地址信息,例如經(jīng)過收集的樓宇地址信息如 表2所不。
[0074]
[0075] ~表2收集到的上海交通大學(xué)巧行校區(qū)樓宇地址信息 '
[0076] 步驟2、根據(jù)樓宇地址信息,生成與樓宇地址對應(yīng)的字段集合。
[0077] 該步驟與步驟102中根據(jù)訂單地址,生成訂單地址對應(yīng)的字段集合的方式相同,在 此不寶述,同時為了便于區(qū)分不同的樓宇記錄信息,還可W為每一條樓宇記錄信息分配一 個樓宇標(biāo)識,用于唯一標(biāo)識該樓宇的樓宇記錄信息,因此根據(jù)表2中收集到的上海交通大學(xué) 巧行校區(qū)樓宇地址數(shù)據(jù)信息,經(jīng)過處理,可W得到表1所示的上海交通大學(xué)巧行校區(qū)樓宇記 錄倍息表。
[0078] 此外,由于步驟103中在確定樓宇的匹配分值時,需要用到字段集合中的字段的字 段分值,因此在得到表1所示的上海交通大學(xué)巧行校區(qū)樓宇記錄信息表之后,還需要繼續(xù)確 定每個字段的字段分值,可通過步驟3完成。
[0079] 步驟3、確定校區(qū)中所有的字段的字段分值。
[0080] 可選地,根據(jù)下列方式確定字段與字段分值之間的對應(yīng)關(guān)系:
[0081] 將一個小區(qū)中所有樓宇對應(yīng)的字段集合進行合并去重處理,生成樓宇字段總集 合;
[0082] 針對所述樓宇字段總集合中的一個字段,若該字段為數(shù)字或字母,則將該字段對 應(yīng)的字段分值設(shè)置為預(yù)先設(shè)定的值;否則,根據(jù)該字段的長度與該字段在所有樓宇對應(yīng)的 字段集合中出現(xiàn)的頻率,確定該字段對應(yīng)的字段分值。
[0083] 上述方法中,首先將一個小區(qū)中所有樓宇對應(yīng)的字段集合進行合并去重處理,生 成樓宇字段總集合,例如對表1中的5個樓宇的所有字段集合,可生成樓宇字段總集合為{:西 區(qū),東區(qū),58,X,宿舍,60,62,65,67}。
[0084] 然后針對樓宇字段總集合中的字段,如果該字段為數(shù)字或者字母,則將該字段對 應(yīng)的字段分值設(shè)定為預(yù)先設(shè)定的值,例如可W將數(shù)字的字段分值設(shè)置為150,200等,將字母 的分值設(shè)置為100,80等,因為針對一個小區(qū)的樓宇,數(shù)字的識別度較高,一般一個數(shù)字就是 用于表示該棟樓宇的樓號,因此可W將數(shù)字的字段分值設(shè)置較高,基于相同的原因,單獨的 一個字母的字段分值也可W設(shè)置較高,在實際應(yīng)用中,可W將數(shù)字的字段分值設(shè)置略高于 字母。
[0085] 如果該字段不為數(shù)字,也不為字母,例如字段為"西區(qū)"、