本發(fā)明涉及計算機(jī)通信技術(shù)領(lǐng)域,尤其涉及一種基于景點(diǎn)成分識別的檢索結(jié)果排序方法、裝置、用戶終端。
背景技術(shù):
現(xiàn)有旅游類檢索大多是基于文本關(guān)鍵詞匹配來實現(xiàn)用戶對旅游信息的獲取。在具體文本相關(guān)性排序上,基本是對旅游信息文檔的標(biāo)題和正文內(nèi)容給予不同的權(quán)重,繼而根據(jù)用戶查詢詞在標(biāo)題和正文上的匹配情況以及查詢詞的逆文本頻率指數(shù)(Inverse Document Frequency,IDF)權(quán)重進(jìn)行加權(quán)打分,進(jìn)而按此分?jǐn)?shù)對檢索結(jié)果進(jìn)行排序。
但對于用戶查詢串中的詞,現(xiàn)有技術(shù)只能根據(jù)IDF值來區(qū)分重要度,但并不理解其所代表的成分,尤其是該類查詢串中的景點(diǎn)成分,其IDF值不一定高,但卻是查詢串中最關(guān)鍵的部分,因此,現(xiàn)有技術(shù)無法準(zhǔn)確地給出用戶期望的檢索結(jié)果排序,用戶體驗差。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明提供一種基于景點(diǎn)成分識別的檢索結(jié)果排序方法、裝置、用戶終端,能準(zhǔn)確地給出用戶期望的檢索結(jié)果排序,用戶體驗好。
本發(fā)明提供一種基于景點(diǎn)成分識別的檢索結(jié)果排序方法,其包括獲取查詢串;對獲取的所述查詢串進(jìn)行切詞處理;識別進(jìn)行切詞處理后的查詢串中的景點(diǎn)成分;以及進(jìn)行檢索召回,并對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行打分排序處理。
本發(fā)明還提供一種基于景點(diǎn)成分識別的檢索結(jié)果排序裝置,所述基于景點(diǎn)成分識別的檢索結(jié)果排序裝置包括查詢串獲取模塊、切詞模塊、景點(diǎn)成分識別模塊、檢索結(jié)果獲取及處理模塊。所述查詢串獲取模塊用于獲取查詢串;所述切詞模塊用于對獲取的所述查詢串進(jìn)行切詞處理;所述景點(diǎn)成分識別模塊用于識別進(jìn)行切詞處理后的查詢串中的景點(diǎn)成分;所述檢索 結(jié)果獲取及處理模塊用于進(jìn)行檢索召回,并對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行打分排序處理。
本發(fā)明還提供一種用戶終端,用戶終端包括基于景點(diǎn)成分識別的檢索結(jié)果排序裝置,所述基于景點(diǎn)成分識別的檢索結(jié)果排序裝置包括查詢串獲取模塊、切詞模塊、景點(diǎn)成分識別模塊、檢索結(jié)果獲取及處理模塊。所述查詢串獲取模塊用于獲取查詢串;所述切詞模塊用于對獲取的所述查詢串進(jìn)行切詞處理;所述景點(diǎn)成分識別模塊用于識別進(jìn)行切詞處理后的查詢串中的景點(diǎn)成分;所述檢索結(jié)果獲取及處理模塊用于進(jìn)行檢索召回,并對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行打分排序處理。
本發(fā)明提供的基于景點(diǎn)成分識別的檢索結(jié)果排序方法、裝置、用戶終端能通過對景點(diǎn)成分的識別準(zhǔn)確地給出用戶期望的檢索結(jié)果排序,用戶體驗好。
為讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實施例,并配合所附圖式,作詳細(xì)說明如下。
附圖說明
圖1示出一種用戶終端的結(jié)構(gòu)圖。
圖2為本發(fā)明第一實施例提供的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置的結(jié)構(gòu)圖。
圖3為圖2的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置的存儲環(huán)境示意圖。
圖4為本發(fā)明第二實施例提供的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置的結(jié)構(gòu)圖。
圖5為本發(fā)明第三實施例提供的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置的結(jié)構(gòu)圖。
圖6為本發(fā)明第四實施例提供的用戶終端的結(jié)構(gòu)圖。
圖7為本發(fā)明第五實施例提供的基于景點(diǎn)成分識別的檢索結(jié)果排序方 法的流程圖。
圖8為本發(fā)明第六實施例提供的基于景點(diǎn)成分識別的檢索結(jié)果排序方法的流程圖。
具體實施方式
為更進(jìn)一步闡述本發(fā)明為實現(xiàn)預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實施例,對依據(jù)本發(fā)明的具體實施方式、結(jié)構(gòu)、特征及其功效,詳細(xì)說明如后。
圖1示出了一種用戶終端的結(jié)構(gòu)框圖。如圖1所示,用戶終端包括存儲器102、存儲控制器104,一個或多個(圖中僅示出一個)處理器106、外設(shè)接口108、射頻模塊110、定位模塊112、攝像模塊114、音頻模塊116、觸控屏幕118以及按鍵模塊120。這些組件通過一條或多條通訊總線/信號線相互通訊。
可以理解,圖1所示的結(jié)構(gòu)僅為示意,用戶終端還可包括比圖1中所示更多或者更少的組件,或者具有與圖1所示不同的配置。圖1中所示的各組件可以采用硬件、軟件或其組合實現(xiàn)。
存儲器102可用于存儲軟件程序以及模塊,如本發(fā)明實施例中的在用戶終端內(nèi)進(jìn)行基于景點(diǎn)成分識別的檢索結(jié)果排序方法對應(yīng)的程序指令/模塊,處理器102通過運(yùn)行存儲在存儲器104內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實現(xiàn)上述的在用戶終端內(nèi)進(jìn)行基于景點(diǎn)成分識別的檢索結(jié)果排序方法。
存儲器102可包括高速隨機(jī)存儲器,還可包括非易失性存儲器,如一個或者多個磁性存儲裝置、閃存、或者其他非易失性固態(tài)存儲器。在一些實例中,存儲器102可進(jìn)一步包括相對于處理器106遠(yuǎn)程設(shè)置的存儲器,這些遠(yuǎn)程存儲器可以通過網(wǎng)絡(luò)連接至用戶終端。上述網(wǎng)絡(luò)的實例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動通信網(wǎng)及其組合。處理器106以及其他可能的組件對存儲器102的訪問可在存儲控制器104的控制下進(jìn)行。
外設(shè)接口108將各種輸入/輸出裝置耦合至CPU以及存儲器102。處理器106運(yùn)行存儲器102內(nèi)的各種軟件、指令以執(zhí)行用戶終端的各種功能以及進(jìn)行數(shù)據(jù)處理。
在一些實施例中,外設(shè)接口108,處理器106以及存儲控制器104可以在單個芯片中實現(xiàn)。在其他一些實例中,他們可以分別由獨(dú)立的芯片實現(xiàn)。
射頻模塊110用于接收以及發(fā)送電磁波,實現(xiàn)電磁波與電信號的相互轉(zhuǎn)換,從而與通訊網(wǎng)絡(luò)或者其他設(shè)備進(jìn)行通訊。射頻模塊110可包括各種現(xiàn)有的用于執(zhí)行這些功能的電路元件,例如,天線、射頻收發(fā)器、數(shù)字信號處理器、加密/解密芯片、用戶身份模塊(SIM)卡、存儲器等等。射頻模塊110可與各種網(wǎng)絡(luò)如互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、無線網(wǎng)絡(luò)進(jìn)行通訊或者通過無線網(wǎng)絡(luò)與其他設(shè)備進(jìn)行通訊。上述的無線網(wǎng)絡(luò)可包括蜂窩式電話網(wǎng)、無線局域網(wǎng)或者城域網(wǎng)。上述的無線網(wǎng)絡(luò)可以使用各種通信標(biāo)準(zhǔn)、協(xié)議及技術(shù),包括但并不限于全球移動通信系統(tǒng)(Global System for Mobile Communication,GSM)、增強(qiáng)型移動通信技術(shù)(Enhanced Data GSM Environment,EDGE),寬帶碼分多址技術(shù)(wideband code division multiple access,W-CDMA),碼分多址技術(shù)(Code division access,CDMA)、時分多址技術(shù)(time division multiple access,TDMA),藍(lán)牙,無線保真技術(shù)(Wireless,Fidelity,WiFi)(如美國電氣和電子工程師協(xié)會標(biāo)準(zhǔn)IEEE 802.11a,IEEE802.11b,IEEE802.11g和/或IEEE 802.11n)、網(wǎng)絡(luò)電話(Voice over internet protocal,VoIP)、全球微波互聯(lián)接入(Worldwide Interoperability for Microwave Access,Wi-Max)、其他用于郵件、即時通訊及短消息的協(xié)議,以及任何其他合適的通訊協(xié)議,甚至可包括那些當(dāng)前仍未被開發(fā)出來的協(xié)議。
定位模塊112用于獲取用戶終端的當(dāng)前位置。定位模塊112的實例包括但不限于全球衛(wèi)星定位系統(tǒng)(GPS)、基于無線局域網(wǎng)或者移動通信網(wǎng)的定位技術(shù)。
攝像模塊114用于拍攝照片或者視頻。拍攝的照片或者視頻可以存儲 至存儲器102內(nèi),并可通過射頻模塊110發(fā)送。
音頻模塊116向用戶提供音頻接口,其可包括一個或多個麥克風(fēng)、一個或者多個揚(yáng)聲器以及音頻電路。音頻電路從外設(shè)接口108處接收聲音數(shù)據(jù),將聲音數(shù)據(jù)轉(zhuǎn)換為電信息,將電信息傳輸至揚(yáng)聲器。揚(yáng)聲器將電信息轉(zhuǎn)換為人耳能聽到的聲波。音頻電路還從麥克風(fēng)處接收電信息,將電信號轉(zhuǎn)換為聲音數(shù)據(jù),并將聲音數(shù)據(jù)傳輸至外設(shè)接口108中以進(jìn)行進(jìn)一步的處理。音頻數(shù)據(jù)可以從存儲器102處或者通過射頻模塊110獲取。此外,音頻數(shù)據(jù)也可以存儲至存儲器102中或者通過射頻模塊110進(jìn)行發(fā)送。在一些實例中,音頻模塊116還可包括一個耳機(jī)播孔,用于向耳機(jī)或者其他設(shè)備提供音頻接口。
觸控屏幕118在用戶終端與用戶之間同時提供一個輸出及輸入界面。具體地,觸控屏幕118向用戶顯示視頻輸出,這些視頻輸出的內(nèi)容可包括文字、圖形、視頻、及其任意組合。一些輸出結(jié)果是對應(yīng)于一些用戶界面對象。觸控屏幕118還接收用戶的輸入,例如用戶的點(diǎn)擊、滑動等手勢操作,以便用戶界面對象對這些用戶的輸入做出響應(yīng)。檢測用戶輸入的技術(shù)可以是基于電阻式、電容式或者其他任意可能的觸控檢測技術(shù)。觸控屏幕118顯示單元的具體實例包括但并不限于液晶顯示器或發(fā)光聚合物顯示器。
按鍵模塊120同樣提供用戶向用戶終端進(jìn)行輸入的接口,用戶可以通過按下不同的按鍵以使用戶終端執(zhí)行不同的功能。
第一實施例
圖2為本發(fā)明第一實施例提供的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置的結(jié)構(gòu)圖。如圖2所示,基于景點(diǎn)成分識別的檢索結(jié)果排序裝置20包括查詢串獲取模塊201、切詞模塊202、景點(diǎn)成分識別模塊203、檢索結(jié)果獲取及處理模塊204。
其中,查詢串獲取模塊201用于獲取查詢串。
具體地,可以但不限于根據(jù)用戶利用按鍵或觸控屏幕輸入的字符獲取查詢串,也可以通過其它方式獲取查詢串例如語音輸入等等。
其中,切詞模塊202用于對獲取的所述查詢串進(jìn)行切詞處理。
具體地,切詞處理是指將查詢串例如一個漢字序列或多個漢子序列切分成一個一個單獨(dú)的詞。例如將查詢串“杭州西湖”切分成“杭州/西湖”兩個詞,將查詢串“國慶去旅游,一路經(jīng)過昆明,麗江”切分成“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”,將查詢串“從北京到深圳玩”切分成“從/北京/到/深圳/玩”等等。
其中,景點(diǎn)成分識別模塊203用于識別進(jìn)行切詞處理后的查詢串中的景點(diǎn)成分。
例如,將“杭州/西湖”中的“杭州”和“西湖”識別為景點(diǎn)成分;將“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”中的“昆明”和“麗江”識別為景點(diǎn)成分;將“從/北京/到/深圳/玩”中的“北京”和“深圳”識別為景點(diǎn)成分。
其中,檢索結(jié)果獲取及處理模塊204用于進(jìn)行檢索召回,并對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行打分排序處理。
具體地,可以但不限于對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行加權(quán)打分處理,以使得包含景點(diǎn)成分的檢索結(jié)果排在前面。
以上各個模塊可以是由軟件代碼實現(xiàn),此時,上述的各模塊可存儲于存儲器102內(nèi),如圖3所示。以上各模塊同樣可以由硬件例如集成電路芯片實現(xiàn)。
基于景點(diǎn)成分識別的檢索結(jié)果排序裝置20,將查詢串進(jìn)行切詞處理后進(jìn)行景點(diǎn)成分的識別,能準(zhǔn)確地給出用戶期望的檢索結(jié)果排序,用戶體驗好。
第二實施例
圖4為本發(fā)明第二實施例提供的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置的結(jié)構(gòu)圖。如圖4所示,基于景點(diǎn)成分識別的檢索結(jié)果排序裝置40包括查詢串獲取模塊401、切詞模塊402、景點(diǎn)及區(qū)劃關(guān)聯(lián)表獲取模塊403、景點(diǎn)成分識別模塊404、景點(diǎn)成分分析模塊405、檢索結(jié)果獲取及處理模塊406。
其中,查詢串獲取模塊401用于獲取查詢串。
具體地,可以但不限于根據(jù)用戶利用按鍵或觸控屏幕輸入的字符獲取查詢串,也可以通過其它方式獲取查詢串例如語音輸入等等。
其中,切詞模塊402用于對獲取的所述查詢串進(jìn)行切詞處理。
具體地,切詞處理是指將查詢串例如一個漢字序列或多個漢子序列切分成一個一個單獨(dú)的詞。例如將查詢串“杭州西湖”切分成“杭州/西湖”兩個詞,將查詢串“國慶去旅游,一路經(jīng)過昆明,麗江”切分成“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”,將查詢串“從北京到深圳玩”切分成“從/北京/到/深圳/玩”等等。
其中,景點(diǎn)及區(qū)劃關(guān)聯(lián)表獲取模塊403用于獲取并存儲景點(diǎn)及區(qū)劃關(guān)聯(lián)表。
具體地,可以獲取各個網(wǎng)站編輯整理的景點(diǎn)/景區(qū)及其關(guān)系圖片,并進(jìn)行校驗后獲取景點(diǎn)及區(qū)劃關(guān)聯(lián)表。
其中,景點(diǎn)成分識別模塊404用于識別進(jìn)行切詞處理后的查詢串中的景點(diǎn)成分。
例如,將“杭州/西湖”中的“杭州”和“西湖”識別為景點(diǎn)成分;將“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”中的“昆明”和“麗江”識別為景點(diǎn)成分;將“從/北京/到/深圳/玩”中的“北京”和“深圳”識別為景點(diǎn)成分。
其中,景點(diǎn)成分分析模塊405用于分析進(jìn)行切詞處理后的查詢串中的景點(diǎn)成分之間的關(guān)系。
具體地,可以但不限于根據(jù)進(jìn)行切詞處理后的查詢串及景點(diǎn)及區(qū)劃關(guān) 聯(lián)表分析景點(diǎn)成分之間的關(guān)系例如隸屬關(guān)系、并列關(guān)系、始發(fā)終到關(guān)系等等。
例如“杭州/西湖”中“西湖”隸屬于“杭州”,屬于隸屬關(guān)系;“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”中“昆明”和“麗江”是并聯(lián)關(guān)系;“從/北京/到/深圳/玩”中“北京”和“深圳”是始發(fā)終到關(guān)系。
其中,檢索結(jié)果獲取及處理模塊406用于進(jìn)行檢索召回,并對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行打分排序處理。
具體地,可以但不限于根據(jù)景點(diǎn)成分之間的關(guān)系使用對應(yīng)的打分排序策略。
本發(fā)明的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置40,將查詢串進(jìn)行切詞處理后進(jìn)行景點(diǎn)成分的識別后對景點(diǎn)成分之間的關(guān)系進(jìn)行分析,且根據(jù)景點(diǎn)成分之間的關(guān)系使用對應(yīng)的打分排序策略,能更進(jìn)一步準(zhǔn)確地給出用戶期望的檢索結(jié)果排序,用戶體驗好。
第三實施例
圖5為本發(fā)明第三實施例提供的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置的結(jié)構(gòu)圖。如圖5所示,基于景點(diǎn)成分識別的檢索結(jié)果排序裝置50包括查詢串獲取模塊501、切詞模塊502、景點(diǎn)及區(qū)劃關(guān)聯(lián)表獲取模塊503、景點(diǎn)成分識別模塊504、景點(diǎn)成分分析模塊505、檢索結(jié)果獲取及處理模塊506。
其中,檢索結(jié)果獲取及處理模塊506包括第一處理單元516、第二處理單元526、第三處理單元536。
第一處理單元516用于在景點(diǎn)成分之間屬于隸屬關(guān)系時,對包含隸屬上位的景點(diǎn)成分的檢索結(jié)果進(jìn)行過濾處理,對包含隸屬下位的景點(diǎn)成分的檢索結(jié)果進(jìn)行加權(quán)打分處理。
具體地,例如“杭州/西湖”中“西湖”隸屬于“杭州”,因此,對包含隸屬上位的“西湖”的檢索結(jié)果進(jìn)行過濾處理,對包含隸屬下位的“杭州” 的檢索結(jié)果進(jìn)行加權(quán)打分處理。當(dāng)然,也可以將包含隸屬上位的“西湖”的檢索結(jié)果排在檢索結(jié)果的后面等等。
第二處理單元526用于在景點(diǎn)成分之間屬于并列關(guān)系時,對包含景點(diǎn)成分的檢索結(jié)果均進(jìn)行加權(quán)打分處理。
具體地,例如“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”中“昆明”和“麗江”是并聯(lián)關(guān)系,對包含“昆明”和“麗江”的檢索結(jié)果均進(jìn)行加權(quán)處理。
第三處理單元536用于在景點(diǎn)成分之間屬于始發(fā)終到關(guān)系時,對包含始發(fā)地景點(diǎn)成分的檢索結(jié)果進(jìn)行過濾處理,對包括終到地景點(diǎn)成分的檢索結(jié)果進(jìn)行加權(quán)打分處理。
具體地,例如“從/北京/到/深圳/玩”中“北京”和“深圳”是始發(fā)終到關(guān)系,對包含始發(fā)地“北京”的檢索結(jié)果進(jìn)行過濾處理,對包括終到地“深圳”的檢索結(jié)果進(jìn)行加權(quán)打分處理。
優(yōu)選地,檢索結(jié)果獲取及處理模塊506還包括第四處理單元546。
第四處理單元546用于根據(jù)閱讀量、轉(zhuǎn)發(fā)數(shù)、發(fā)布時間因子中的一個或多個因子的組合對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行打分排序處理。
本實施例基于景點(diǎn)成分識別的檢索結(jié)果排序裝置50的查詢串獲取模塊501、切詞模塊502、景點(diǎn)及區(qū)劃關(guān)聯(lián)表獲取模塊503、景點(diǎn)成分識別模塊504、景點(diǎn)成分分析模塊505實現(xiàn)各自功能的具體過程,請參見圖1至圖4所示實施例中描述的具體內(nèi)容,在此不再贅述。
本發(fā)明的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置50,將查詢串進(jìn)行切詞處理后進(jìn)行景點(diǎn)成分的識別后對景點(diǎn)成分之間的關(guān)系進(jìn)行分析,且根據(jù)景點(diǎn)成分之間的關(guān)系使用對應(yīng)的打分排序策略,能更進(jìn)一步準(zhǔn)確地給出用戶期望的檢索結(jié)果排序,用戶體驗好。
第四實施例
圖6為本發(fā)明第四實施例提供的用戶終端的結(jié)構(gòu)圖。如圖6所示,用戶終端包括如圖2所示的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置。
本實施例基于景點(diǎn)成分識別的檢索結(jié)果排序裝置中各個模塊實現(xiàn)各自功能的具體過程,請參見圖2所示實施例中描述的具體內(nèi)容,在此不再贅述。
用戶終端將查詢串進(jìn)行切詞處理后進(jìn)行景點(diǎn)成分的識別,能準(zhǔn)確地給出用戶期望的檢索結(jié)果排序,用戶體驗好。
第五實施例
圖7為本發(fā)明第五實施例提供的基于景點(diǎn)成分識別的檢索結(jié)果排序方法的流程圖。如圖7所示的基于景點(diǎn)成分識別的檢索結(jié)果排序方法應(yīng)用于如圖2所示的基于景點(diǎn)成分識別的檢索結(jié)果排序裝置20,基于景點(diǎn)成分識別的檢索結(jié)果排序方法包括如下步驟:
步驟S71:獲取查詢串。
具體地,可以但不限于根據(jù)用戶利用按鍵或觸控屏幕輸入的字符獲取查詢串,也可以通過其它方式獲取查詢串例如語音輸入等等。
步驟S72:對獲取的所述查詢串進(jìn)行切詞處理。
具體地,切詞處理是指將查詢串例如一個漢字序列或多個漢子序列切分成一個一個單獨(dú)的詞。例如將查詢串“杭州西湖”切分成“杭州/西湖”兩個詞,將查詢串“國慶去旅游,一路經(jīng)過昆明,麗江”切分成“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”,將查詢串“從北京到深圳玩”切分成“從/北京/到/深圳/玩”等等。
步驟S73:識別進(jìn)行切詞處理后的查詢串中的景點(diǎn)成分。
例如,將“杭州/西湖”中的“杭州”和“西湖”識別為景點(diǎn)成分;將“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”中的“昆明”和“麗江”識別為景點(diǎn)成分;將“從/北京/到/深圳/玩”中的“北京”和“深圳”識別為景點(diǎn) 成分。
步驟S74:進(jìn)行檢索召回,并對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行打分排序處理。
具體地,可以但不限于對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行加權(quán)打分處理,以使得包含景點(diǎn)成分的檢索結(jié)果排在前面。
基于景點(diǎn)成分識別的檢索結(jié)果排序方法,將查詢串進(jìn)行切詞處理后進(jìn)行景點(diǎn)成分的識別,能準(zhǔn)確地給出用戶期望的檢索結(jié)果排序,用戶體驗好。
第六實施例
圖8為本發(fā)明第六實施例提供的基于景點(diǎn)成分識別的檢索結(jié)果排序方法的流程圖。如圖8所示,基于景點(diǎn)成分識別的檢索結(jié)果排序方法包括如下步驟:
步驟S81:獲取查詢串;
步驟S82:對獲取的所述查詢串進(jìn)行切詞處理;
步驟S83:獲取并存儲景點(diǎn)及區(qū)劃關(guān)聯(lián)表;
具體地,可以獲取各個網(wǎng)站編輯整理的景點(diǎn)/景區(qū)及其關(guān)系圖片,并進(jìn)行校驗后獲取景點(diǎn)及區(qū)劃關(guān)聯(lián)表。
其中,獲取并并存儲景點(diǎn)及區(qū)劃關(guān)聯(lián)表也可以在步驟S81之前。
步驟S84:識別進(jìn)行切詞處理后的查詢串中的景點(diǎn)成分;
例如,將“杭州/西湖”中的“杭州”和“西湖”識別為景點(diǎn)成分;將“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”中的“昆明”和“麗江”識別為景點(diǎn)成分;將“從/北京/到/深圳/玩”中的“北京”和“深圳”識別為景點(diǎn)成分。
步驟S85:分析進(jìn)行切詞處理后的查詢串中的景點(diǎn)成分之間的關(guān)系;
具體地,可以但不限于根據(jù)進(jìn)行切詞處理后的查詢串及景點(diǎn)及區(qū)劃關(guān)聯(lián)表分析景點(diǎn)成分之間的關(guān)系例如隸屬關(guān)系、并列關(guān)系、始發(fā)終到關(guān)系等 等。
例如“杭州/西湖”中“西湖”隸屬于“杭州”,屬于隸屬關(guān)系;“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”中“昆明”和“麗江”是并聯(lián)關(guān)系;“從/北京/到/深圳/玩”中“北京”和“深圳”是始發(fā)終到關(guān)系。
步驟S86:進(jìn)行檢索召回,并對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行打分排序處理。
優(yōu)選地,步驟S86包括若景點(diǎn)成分之間屬于隸屬關(guān)系,則對包含隸屬上位的景點(diǎn)成分的檢索結(jié)果進(jìn)行過濾處理,對包含隸屬下位的景點(diǎn)成分的檢索結(jié)果進(jìn)行加權(quán)打分處理。
具體地,例如“杭州/西湖”中“西湖”隸屬于“杭州”,因此,對包含隸屬上位的“西湖”的檢索結(jié)果進(jìn)行過濾處理,對包含隸屬下位的“杭州”的檢索結(jié)果進(jìn)行加權(quán)打分處理。當(dāng)然,也可以將包含隸屬上位的“西湖”的檢索結(jié)果排在檢索結(jié)果的后面等等。
優(yōu)選地,步驟S86包括若景點(diǎn)成分之間屬于并列關(guān)系,則對包含景點(diǎn)成分的檢索結(jié)果均進(jìn)行加權(quán)打分處理。
具體地,例如“國慶/去/旅游/,一路/經(jīng)過/昆明/,麗江”中“昆明”和“麗江”是并聯(lián)關(guān)系,對包含“昆明”和“麗江”的檢索結(jié)果均進(jìn)行加權(quán)處理。
優(yōu)選地,步驟S86包括若景點(diǎn)成分之間屬于始發(fā)終到關(guān)系,則對包含始發(fā)地景點(diǎn)成分的檢索結(jié)果進(jìn)行過濾處理,對包括終到地景點(diǎn)成分的檢索結(jié)果進(jìn)行加權(quán)打分處理。
具體地,例如“從/北京/到/深圳/玩”中“北京”和“深圳”是始發(fā)終到關(guān)系,對包含始發(fā)地“北京”的檢索結(jié)果進(jìn)行過濾處理,對包括終到地“深圳”的檢索結(jié)果進(jìn)行加權(quán)打分處理。
優(yōu)選地,步驟S86還包括根據(jù)閱讀量、轉(zhuǎn)發(fā)數(shù)、發(fā)布時間因子中的一個或多個因子的組合對包含景點(diǎn)成分的檢索結(jié)果進(jìn)行打分排序處理。
本發(fā)明的基于景點(diǎn)成分識別的檢索結(jié)果排序方法,將查詢串進(jìn)行切詞處理后進(jìn)行景點(diǎn)成分的識別后對景點(diǎn)成分之間的關(guān)系進(jìn)行分析,且根據(jù)景點(diǎn)成分之間的關(guān)系使用對應(yīng)的打分排序策略,能更進(jìn)一步準(zhǔn)確地給出用戶期望的檢索結(jié)果排序,用戶體驗好。
需要說明的是,本說明書中的各個實施例均采用遞進(jìn)的方式描述,每個實施例重點(diǎn)說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括要素的過程、方法、物品或者裝置中還存在另外的相同要素。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機(jī)可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
以上,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容做出些許更動或修飾為等同變化的等效實施例,但凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。