專利名稱:搜索結(jié)果排序方法及設(shè)備、搜索方法及設(shè)備的制作方法
技術(shù)領(lǐng)域:
本申請涉及數(shù)據(jù)搜索技術(shù)領(lǐng)域,尤其涉及一種搜索結(jié)果排序方法及設(shè)備、搜索方法及設(shè)備。
背景技術(shù):
在互聯(lián)網(wǎng)搜索技術(shù)領(lǐng)域中,基于搜索關(guān)鍵詞的搜索是指由搜索引擎服務(wù)器根據(jù)用戶輸入的搜索關(guān)鍵詞(也稱查詢關(guān)鍵詞,即query),從基于海量數(shù)據(jù)而建立的索引中搜索與搜索關(guān)鍵詞相匹配的索引,并將該索引所對應(yīng)的搜索結(jié)果(即搜索到的數(shù)據(jù))呈現(xiàn)給用戶。在呈現(xiàn)搜索結(jié)果時,可以按照搜索結(jié)果與搜索關(guān)鍵詞的相關(guān)性先對搜索結(jié)果進行排序后再呈現(xiàn)。一般地,在呈現(xiàn)搜索結(jié)果的網(wǎng)頁頁面上對搜索結(jié)果進行排序的原則是:搜索結(jié)果與搜索關(guān)鍵詞之間由大至小的相關(guān)性對應(yīng)于由上至下(或由前至后)的搜索結(jié)果排列順序。由于衡量搜索結(jié)果與搜索關(guān)鍵詞之間相關(guān)性大小的相關(guān)性值反映了搜索結(jié)果與用戶搜索意圖之間的相關(guān)程度,因此,采用上述排序原則的好處在于,能夠?qū)Ⅲw現(xiàn)用戶搜索意圖的搜索結(jié)果呈現(xiàn)在頁面比較靠上(或靠前)的位置,使得這些搜索結(jié)果更容易受到用戶關(guān)注,從而可以提高用戶的搜索體驗。為了實現(xiàn)按照搜索結(jié)果與搜索關(guān)鍵詞的相關(guān)性對搜索結(jié)果進行排序,現(xiàn)有技術(shù)提供了一些排序模型,其中比較成熟的模型之一是“基于每千次展現(xiàn)搜索結(jié)果可以獲得的廣告收入(ECPM,Effective Cost Per Mille)的排序模型”,簡稱ECPM模型。ECPM模型的基本思想在于,分別計算各個搜索結(jié)果的排序分數(shù)值,并根據(jù)計算得到的排序分數(shù)值確定搜索結(jié)果的排列順序。具體地,該模型中所采用的計算排序分數(shù)值的公式如下式[I]所示:
權(quán)利要求
1.一種搜索結(jié)果排序方法,其特征在于,包括: 確定與搜索關(guān)鍵詞相關(guān)的關(guān)鍵詞單元;并 針對根據(jù)所述搜索關(guān)鍵詞搜索得到的每個搜索結(jié)果,執(zhí)行從預(yù)先存儲的關(guān)鍵詞單元、搜索結(jié)果和用于衡量搜索結(jié)果與關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值的對應(yīng)關(guān)系中,分別確定與根據(jù)所述搜索關(guān)鍵詞搜索得到的搜索結(jié)果、確定的關(guān)鍵詞單元同時對應(yīng)的所有第一相關(guān)性值,并分別確定用于衡量所述搜索關(guān)鍵詞與所述確定的各個關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值;以及 根據(jù)第一相關(guān)性值和第二相關(guān)性值,分別確定根據(jù)所述搜索關(guān)鍵詞搜索得到的每個搜索結(jié)果的排序分數(shù)值;以及 根據(jù)所述每個搜索結(jié)果的排序分數(shù)值,確定用于指示根據(jù)所述搜索關(guān)鍵詞搜索得到的搜索結(jié)果的排列順序的排序信息。
2.按權(quán)利要求1所述的方法,其特征在于,根據(jù)第一相關(guān)性值和第二相關(guān)性值,分別確定根據(jù)所述搜索關(guān)鍵詞搜索得到的每個搜索結(jié)果的排序分數(shù)值,具體包括: 針對根據(jù)所述搜索關(guān)鍵詞搜索得到的每個搜索結(jié)果,分別執(zhí)行下述步驟: 針對確定的每個關(guān)鍵詞單元,確定在以該關(guān)鍵詞單元作為搜索關(guān)鍵詞時每次展現(xiàn)該搜索結(jié)果所能獲得的最高廣告收入數(shù)據(jù)值;并 針對確定的每個關(guān)鍵詞單元,根據(jù)用于衡量該搜索結(jié)果與該關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值、用于衡量所述搜索關(guān)鍵詞與該關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值以及相應(yīng)的所述最高廣告收入數(shù)據(jù)值,確定該搜索結(jié)果的排序分數(shù)值;以及 從確定的分別針對不同關(guān)鍵詞單 元的排序分數(shù)值中,選取最大的排序分數(shù)值作為該搜索結(jié)果的排序分數(shù)值。
3.按權(quán)利要求2所述的方法,其特征在于,針對確定的每個關(guān)鍵詞單元,根據(jù)用于衡量該搜索結(jié)果與該關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值、用于衡量所述搜索關(guān)鍵詞與該關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值以及相應(yīng)的所述最高廣告收入數(shù)據(jù)值,確定該搜索結(jié)果的排序分數(shù)值,具體包括: 針對確定的每個關(guān)鍵詞單元,確定衡量該搜索結(jié)果所屬信息類別與該關(guān)鍵詞單元所屬信息類別相關(guān)性大小的類目屬性得分數(shù)據(jù)值;以及 針對確定的每個關(guān)鍵詞單元,根據(jù)用于衡量該搜索結(jié)果與該關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值、用于衡量所述搜索關(guān)鍵詞與該關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值、相應(yīng)的所述最高廣告收入數(shù)據(jù)值以及所述類目屬性得分數(shù)據(jù)值,確定該搜索結(jié)果的排序分數(shù)值。
4.按權(quán)利要求2所述的方法,其特征在于,針對確定的每個關(guān)鍵詞單元,根據(jù)用于衡量該搜索結(jié)果與該關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值、用于衡量所述搜索關(guān)鍵詞與該關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值以及相應(yīng)的所述最高廣告收入數(shù)據(jù)值,確定該搜索結(jié)果的排序分數(shù)值,具體包括: 針對確定的每個關(guān)鍵詞單元,確定該搜索結(jié)果在以該關(guān)鍵詞單元作為搜索關(guān)鍵詞時的被點擊率;并 針對確定的每個關(guān)鍵詞單元,根據(jù)用于衡量該搜索結(jié)果與該關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值、用于衡量所述搜索關(guān)鍵詞與該關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值、相應(yīng)的所述最高廣告收入數(shù)據(jù)值以及所述被點擊率,確定該搜索結(jié)果的排序分數(shù)值。
5.按權(quán)利要求4所述的方法,其特征在于,針對確定的每個關(guān)鍵詞單元,根據(jù)用于衡量該搜索結(jié)果與該關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值、用于衡量所述搜索關(guān)鍵詞與該關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值、相應(yīng)的所述最高廣告收入數(shù)據(jù)值以及所述被點擊率,確定該搜索結(jié)果的排序分數(shù)值,具體包括: 針對確定的每個關(guān)鍵詞單元,確定衡量該搜索結(jié)果所屬信息類別與該關(guān)鍵詞單元所屬信息類別相關(guān)性大小的類目屬性得分數(shù)據(jù)值;以及 針對確定的每個關(guān)鍵詞單元,根據(jù)用于衡量該搜索結(jié)果與該關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值、用于衡量所述搜索關(guān)鍵詞與該關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值、相應(yīng)的所述最高廣告收入數(shù)據(jù)值、相應(yīng)的所述被點擊率以及類目屬性得分數(shù)據(jù)值,確定該搜索結(jié)果的排序分數(shù)值。
6.一種搜索方法,其特征在于,包括: 接收攜帶有搜索關(guān)鍵詞的搜索請求;以及 根據(jù)所述搜索關(guān)鍵詞搜索相應(yīng)的搜索結(jié)果,并確定用于指示搜索得到的搜索結(jié)果的排序順序的排序信息; 將搜索得到的搜索結(jié)果和所述排序信息發(fā)送給所述搜索請求對應(yīng)的發(fā)送方設(shè)備,指示發(fā)送方設(shè)備根據(jù)所述排序信息對搜索得到的搜索結(jié)果進行排序; 其中,確定所述排序信息具體包括:權(quán)利要求1 5任一所述的搜索結(jié)果排序方法。
7.一種搜索結(jié)果排序設(shè)備,其特征在于,包括: 關(guān)鍵詞單元確定單元,用于確定與搜索關(guān)鍵詞相關(guān)的關(guān)鍵詞單元; 第一相關(guān)性值確定單元,用于針對根據(jù)所述搜索關(guān)鍵詞搜索得到的每個搜索結(jié)果,執(zhí)行從預(yù)先存儲的關(guān)鍵詞單元、搜索結(jié)果和用于衡量搜索結(jié)果與關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值的對應(yīng)關(guān)系中,分別確定與根據(jù)所述搜索關(guān)鍵詞搜索得到的搜索結(jié)果、關(guān)鍵詞單元確定單元確定的關(guān)鍵詞單元同時對應(yīng)的所有第一相關(guān)性值; 第二相關(guān)性值確定單元,用于分別確定用于衡量所述搜索關(guān)鍵詞與關(guān)鍵詞單元確定單元確定的各個關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值; 排序分數(shù)值確定單元,用于根據(jù)第一相關(guān)性值確定單元確定的第一相關(guān)性值和第二相關(guān)性值確定單元確定的第二相關(guān)性值,分別確定根據(jù)所述搜索關(guān)鍵詞搜索得到的每個搜索結(jié)果的排序分數(shù)值; 排序單元,用于根據(jù)排序分數(shù)值確定單元確定的每個搜索結(jié)果的排序分數(shù)值,確定用于指示根據(jù)所述搜索關(guān)鍵詞搜索得到的搜索結(jié)果的排列順序的排序信息。
8.按權(quán)利要求7所述的設(shè)備,其特征在于,所述排序分數(shù)值確定單元具體包括: 最高廣告收入數(shù)據(jù)值確定子單元,用于針對根據(jù)所述搜索關(guān)鍵詞搜索得到的每個搜索結(jié)果和確定的每個關(guān)鍵詞單元,確定在以該關(guān)鍵詞單元作為搜索關(guān)鍵詞時每次展現(xiàn)該搜索結(jié)果所能獲得的最高廣告收入數(shù)據(jù)值; 排序分數(shù)值確定子單元,用于針對根據(jù)所述搜索關(guān)鍵詞搜索得到的每個搜索結(jié)果和確定的每個關(guān)鍵詞單元,根據(jù)用于衡量該搜索結(jié)果與該關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值、用于衡量所述搜索關(guān)鍵詞與該關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值以及最高廣告收入數(shù)據(jù)值確定子單元確定的相應(yīng)的最高廣告收入數(shù)據(jù)值,確定該搜索結(jié)果的排序分數(shù)值;排序分數(shù)值選取子單元,用于從排序分數(shù)值確定子單元確定的分別針對不同關(guān)鍵詞單元的排序分數(shù)值中,選取最大的排序分數(shù)值作為該搜索結(jié)果的排序分數(shù)值。
9.權(quán)利要求8所述的設(shè)備,其特征在于,所述排序分數(shù)值確定子單元具體包括: 類目屬性得分數(shù)據(jù)值確定模塊,用于針對根據(jù)所述搜索關(guān)鍵詞搜索得到的每個搜索結(jié)果和確定的每個關(guān)鍵詞單元,確定衡量該搜索結(jié)果所屬信息類別與該關(guān)鍵詞單元所屬信息類別相關(guān)性大小的類目屬性得分數(shù)據(jù)值; 排序分數(shù)值確定模塊,用于針對根據(jù)所述搜索關(guān)鍵詞搜索得到的每個搜索結(jié)果和確定的每個關(guān)鍵詞單元,根據(jù)用于衡量該搜索結(jié)果與該關(guān)鍵詞單元相關(guān)性大小的第一相關(guān)性值、用于衡量所述搜索關(guān)鍵詞與該關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值、相應(yīng)的最高廣告收入數(shù)據(jù)值、類目屬性得分數(shù)據(jù)值確定模塊確定的相應(yīng)的類目屬性得分數(shù)據(jù)值,確定該搜索結(jié)果的排序分數(shù)值。
10.種搜索設(shè)備,其特征在于,包括: 搜索請求接收單元,用于接收攜帶有搜索關(guān)鍵詞的搜索請求; 搜索單元,用于根據(jù)搜索請求接收單元接收的搜索請求中攜帶的搜索關(guān)鍵詞,搜索相應(yīng)的搜索結(jié)果; 排序信息確定單元,用于確定用于指示搜索單元搜索得到的搜索結(jié)果的排序順序的排序信息; 發(fā)送單元,用于將搜索單元搜索得到的搜索結(jié)果和排序信息確定單元確定的排序信息發(fā)送給所述搜索請求對應(yīng)的發(fā)送方設(shè)備,指示發(fā)送方設(shè)備根據(jù)所述排序信息對搜索得到的搜索結(jié)果進行排序; 其中,所述排序信息確定單元具體包括:權(quán)利要求7 9任一所述的搜索結(jié)果排序設(shè)備。
全文摘要
本申請公開了一種搜索結(jié)果排序方法及設(shè)備、搜索方法及設(shè)備,以解決對根據(jù)長尾搜索關(guān)鍵詞搜索得到的搜索結(jié)果進行排序時可能導(dǎo)致排序不準確的問題。方法包括確定與搜索關(guān)鍵詞相關(guān)的關(guān)鍵詞單元;針對根據(jù)搜索關(guān)鍵詞搜索到的每個搜索結(jié)果,執(zhí)行從預(yù)先存儲的對應(yīng)關(guān)系中,分別確定與根據(jù)搜索關(guān)鍵詞搜索得到的搜索結(jié)果、確定的關(guān)鍵詞單元同時對應(yīng)的所有第一相關(guān)性值,并分別確定用于衡量搜索關(guān)鍵詞與確定的各個關(guān)鍵詞單元相關(guān)性大小的第二相關(guān)性值;根據(jù)第一相關(guān)性值和第二相關(guān)性值,確定搜索結(jié)果的排序分數(shù)值;根據(jù)每個搜索結(jié)果的排序分數(shù)值,確定用于指示根據(jù)所述搜索關(guān)鍵詞搜索得到的搜索結(jié)果的排列順序的排序信息。
文檔編號G06F17/30GK103092856SQ201110338609
公開日2013年5月8日 申請日期2011年10月31日 優(yōu)先權(quán)日2011年10月31日
發(fā)明者周恒民 申請人:阿里巴巴集團控股有限公司