酒店自動(dòng)匹配方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)、OTA網(wǎng)站(在線旅游網(wǎng)站)、比價(jià)平臺(tái)等技術(shù)領(lǐng)域,特別是涉及一種酒店自動(dòng)匹配方法。
【背景技術(shù)】
[0002]酒店自動(dòng)匹配是指將來(lái)自不同平臺(tái)和渠道的酒店,根據(jù)多維度的酒店屬性進(jìn)行智能分析和計(jì)算,確定酒店的匹配關(guān)系,它為酒店的平臺(tái)化銷售及比價(jià)提供信息聚合和銷售基礎(chǔ)。
[0003]酒店自動(dòng)匹配計(jì)算原理根據(jù)酒店的城市屬性進(jìn)行分組,對(duì)同一城市下的酒店名稱、電話、傳真、地址等維度信息進(jìn)行綜合分析,按照一定的相似度算法及權(quán)重配置,對(duì)不同來(lái)源的酒店自動(dòng)計(jì)算匹配關(guān)系。
[0004]普通的自動(dòng)匹配的方式,有以下不足:
[0005]很多酒店名字改過(guò)或命名習(xí)慣不同,造成匹配錯(cuò)誤;
[0006]酒店地址表述方式多樣,造成匹配錯(cuò)誤;
[0007]城市區(qū)域劃分不同,造成匹配錯(cuò)誤;
[0008]很多酒店信息不全或錯(cuò)誤(電話、傳真等),造成匹配錯(cuò)誤;
[0009]這就造成了人工維護(hù)成本高,房型匹配沒(méi)法繼續(xù)及平臺(tái)產(chǎn)品的豐富度都有較大的影響。
【發(fā)明內(nèi)容】
[0010]本發(fā)明要解決的技術(shù)問(wèn)題是為了克服現(xiàn)有技術(shù)中酒店匹配時(shí)由于各種原因會(huì)造成匹配錯(cuò)誤的缺陷,提供一種酒店自動(dòng)匹配方法。
[0011]本發(fā)明是通過(guò)下述技術(shù)方案來(lái)解決上述技術(shù)問(wèn)題的:
[0012]本發(fā)明提供了一種酒店自動(dòng)匹配方法,其特點(diǎn)在于,用于對(duì)一目標(biāo)供應(yīng)商的目標(biāo)酒店進(jìn)行自動(dòng)匹配,所述目標(biāo)酒店的匹配字段包括預(yù)訂狀態(tài)、所處城市、名稱、電話、傳真及地址;所述酒店自動(dòng)匹配方法包括如下步驟:
[0013]獲取其他供應(yīng)商的待匹配酒店的信息數(shù)據(jù),并從所述信息數(shù)據(jù)中獲取所述待匹配酒店的預(yù)訂狀態(tài)及所處城市;
[0014]判斷所述目標(biāo)酒店與所述待匹配酒店的預(yù)訂狀態(tài)是否均為可預(yù)訂且所處城市是否相同,并在判斷均為是時(shí)計(jì)算所述目標(biāo)酒店的名稱與所述待匹配酒店的名稱的相似度X;
[0015]若乂 = 1,則執(zhí)行第一匹配操作,所述第一匹配操作為:
[0016]判斷是否只存在一個(gè)相似度為I的待匹配酒店,若是,則所述目標(biāo)酒店與所述待匹配酒店自動(dòng)匹配,若否,則執(zhí)行第二匹配操作;
[0017]X〈l,其中0.5〈N〈1,則執(zhí)行第二匹配操作,所述第二匹配操作為:
[0018]判斷所述待匹配酒店的信息數(shù)據(jù)中是否存在與所述目標(biāo)酒店相匹配的電話、傳真或地址,若存在,則所述目標(biāo)酒店與所述待匹配酒店自動(dòng)匹配,若不存在,則所述目標(biāo)酒店與所述待匹配酒店疑似匹配;
[0019]若0.5 < X〈N,則執(zhí)行第三匹配操作,所述第三匹配操作為:
[0020]判斷所述待匹配酒店的信息數(shù)據(jù)中是否存在與所述目標(biāo)酒店相匹配的電話或傳真且同時(shí)存在與所述目標(biāo)酒店相匹配的地址,若是,則所述目標(biāo)酒店與所述待匹配酒店自動(dòng)匹配,若否,則判斷所述待匹配酒店的信息數(shù)據(jù)中是否存在與所述目標(biāo)酒店相匹配的電話、傳真或地址,若存在,則所述目標(biāo)酒店與所述待匹配酒店疑似匹配,若不存在,則所述目標(biāo)酒店與所述待匹配酒店不匹配;
[0021]若X〈0.5,則所述目標(biāo)酒店與所述待匹配酒店不匹配。
[0022]較佳地,所述目標(biāo)酒店的匹配字段還包括經(jīng)瑋度,在所述酒店自動(dòng)匹配方法中還通過(guò)經(jīng)瑋度判斷所述目標(biāo)酒店與所述待匹配酒店的地址是否匹配。
[0023]較佳地,當(dāng)滿足N ( X〈1的待匹配酒店有多個(gè)且所述第二匹配操作中對(duì)多個(gè)待匹配酒店判斷均為不存在時(shí),若利用待匹配酒店計(jì)算出的所述相似度不同,則選擇相似度最高的一個(gè)待匹配酒店作為疑似匹配,若所述相似度相同,則選擇在一時(shí)間段內(nèi)有價(jià)格數(shù)據(jù)且基礎(chǔ)房型最多的一個(gè)待匹配酒店作為疑似匹配。
[0024]較佳地,在所述第二匹配操作中按照電話、傳真、地址的順序依次進(jìn)行判斷。
[0025]較佳地,在判斷所述目標(biāo)酒店與所述待匹配酒店的地址是否匹配時(shí),若地址包括門牌號(hào),則判斷門牌號(hào)是否相同,并在相同時(shí)視為地址匹配,若地址不包括門牌號(hào),則判斷地址是否存在包含關(guān)系,并在存在包含關(guān)系時(shí)視為地址匹配。
[0026]較佳地,當(dāng)滿足0.5 ( X<N的待匹配酒店有多個(gè)時(shí),選擇相似度最高的5個(gè)執(zhí)行所述第三匹配操作。
[0027]較佳地,N的取值范圍為0.8-0.9。
[0028]本發(fā)明的積極進(jìn)步效果在于:本發(fā)明能夠?qū)崿F(xiàn)多平臺(tái)酒店智能、準(zhǔn)確、自動(dòng)地計(jì)算及記錄匹配關(guān)系,能夠提升匹配率并保證匹配的準(zhǔn)確率,并且無(wú)需人工參與,降低了匹配成本,為酒店房型匹配提供了數(shù)據(jù)準(zhǔn)備,增加了平臺(tái)數(shù)據(jù)的豐富度。
【附圖說(shuō)明】
[0029]圖1為本發(fā)明的實(shí)施例的酒店自動(dòng)匹配方法的流程圖。
【具體實(shí)施方式】
[0030]下面通過(guò)實(shí)施例的方式進(jìn)一步說(shuō)明本發(fā)明,但并不因此將本發(fā)明限制在所述的實(shí)施例范圍之中。
[0031]本發(fā)明提供了一種酒店自動(dòng)匹配方法,用于對(duì)目標(biāo)供應(yīng)商的目標(biāo)酒店進(jìn)行自動(dòng)匹配,以分析其他供應(yīng)商是否存在與之完全匹配的酒店,其中,所述目標(biāo)酒店的匹配字段按照先后順序依次包括:預(yù)訂狀態(tài)、所處城市、名稱、電話、傳真、地址、酒店類型及經(jīng)瑋度。如圖1所示,本發(fā)明的酒店自動(dòng)匹配方法包括以下步驟:
[0032]獲取其他供應(yīng)商的待匹配酒店的信息數(shù)據(jù),并從所述信息數(shù)據(jù)中獲取所述待匹配酒店的預(yù)訂狀態(tài)及所處城市;
[0033]按照酒店所處城市數(shù)據(jù)清洗及匹配規(guī)則(具體參加下文)對(duì)所述目標(biāo)酒店及所述待匹配酒店的所處城市數(shù)據(jù)進(jìn)行清洗和匹配,判斷所述目標(biāo)酒店與所述待匹配酒店的預(yù)訂狀態(tài)是否均為可預(yù)訂且所處城市是否相同,并在判斷均為是時(shí)按照酒店名稱匹配規(guī)則(具體參見(jiàn)下文)計(jì)算所述目標(biāo)酒店的名稱與所述待匹配酒店的名稱的相似度X ;
[0034]從而在本發(fā)明中,實(shí)現(xiàn)了僅對(duì)預(yù)訂狀態(tài)為可預(yù)訂的酒店進(jìn)行匹配,限定了匹配范圍,提供了匹配效率和準(zhǔn)確率;在對(duì)所述目標(biāo)酒店與所述待匹配酒店進(jìn)行城市匹配時(shí),會(huì)根據(jù)城市mapping (地圖)表中,選擇對(duì)應(yīng)城市酒店進(jìn)行匹配,若匹配不成功,則選擇對(duì)應(yīng)城市所屬的一級(jí)城市下所有酒店進(jìn)行匹配。
[0035]酒店名稱的相似度則根據(jù)所述目標(biāo)酒店與所述待匹配酒店的名稱,通過(guò)字符串來(lái)計(jì)算相似度,本發(fā)明中根據(jù)相似度的不同計(jì)算結(jié)果會(huì)執(zhí)行不同的匹配操作,具體如下:
[0036]若X = 1,則說(shuō)明所述目標(biāo)酒店與所述待匹配酒店的名稱完全一致,此時(shí)滿足城市+名稱均匹配的條件,則此時(shí)會(huì)執(zhí)行第一匹配操作,所述第一匹配操作為:判斷是否只存在一個(gè)相似度為I的待匹配酒店,若是,則所述目標(biāo)酒店與所述待匹配酒店自動(dòng)匹配,若否,則執(zhí)行第二匹配操作;
[0037]通過(guò)所述第一匹配操作,當(dāng)只有一個(gè)待匹配酒店滿足相似度為I條件時(shí),則確定只存在唯一一個(gè)待匹配酒店,那么這唯一的一個(gè)待匹配酒店即為與所述目標(biāo)酒店自動(dòng)匹配的酒店;當(dāng)有多個(gè)待匹配酒店滿足相似度為I的條件時(shí),此時(shí)就需要對(duì)所述多個(gè)待匹配酒店作進(jìn)一步匹配操作,以從中找出與所述目標(biāo)酒店最匹配的那一個(gè)。
[0038]若0.8 < X〈l,則同樣會(huì)執(zhí)行第二匹配操作,所述第二匹配操作為:
[0039]判斷所述待匹配酒店的信息數(shù)據(jù)中是否存在與所述目標(biāo)酒店相匹配的電話、傳真、地址或經(jīng)瑋度,若存在,則所述目標(biāo)酒店與所述待匹配酒店自動(dòng)匹配,若不存在,則所述目標(biāo)酒店與所述待匹配酒店疑似匹配;
[0040]在所述第二匹配操作中,由于相似度的原因,導(dǎo)致需要再引入一個(gè)匹配字段來(lái)對(duì)所述目標(biāo)酒店與所述待匹配酒店進(jìn)行更進(jìn)一步的匹配,在本實(shí)施例中,引入的匹配字段為電話、傳真、地址及經(jīng)瑋度,并且只要其中有一個(gè)匹配字段滿足匹配條件時(shí),就可以確定所述目標(biāo)酒店與所述待匹配酒店自動(dòng)匹配。在本發(fā)明中,對(duì)引入的匹配字段按照特定的順序進(jìn)行,即電話-傳真-地址-經(jīng)瑋度,具體地:
[0041]電話匹配的操作包括:
[0042]按照酒店電話數(shù)據(jù)清洗及匹配規(guī)則(具體參見(jiàn)下文)對(duì)電話號(hào)碼進(jìn)行清洗;
[0043]判斷電話類型是否相同;
[0044]對(duì)相同類型的電話號(hào)碼進(jìn)行匹配;
[0045]若類型為座機(jī),且與對(duì)方不能匹配時(shí),用此號(hào)碼匹配對(duì)方的傳真號(hào)碼;
[0046]若所述目標(biāo)酒店與所述待匹配酒店的電話號(hào)碼相同或存在包含關(guān)系時(shí),則確