一種基于查詢?cè)~的檢索方法及裝置制造方法
【專利摘要】本申請(qǐng)?zhí)峁┝艘环N基于查詢?cè)~的檢索方法及裝置,其中所述方法包括接收提交的查詢?cè)~;判斷所述查詢?cè)~是否存在于第一特征數(shù)據(jù)庫(kù)中,其中所述第一特征數(shù)據(jù)庫(kù)包括具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系;若是,則按照所述具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系獲取與所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)并返回。本申請(qǐng)可以提高檢索效率。
【專利說(shuō)明】-種基于查詢?cè)~的檢索方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及信息搜索的【技術(shù)領(lǐng)域】,特別是涉及一種基于查詢?cè)~的檢索方法,以及, 一種基于查詢?cè)~的檢索裝置。
【背景技術(shù)】
[0002] 隨著網(wǎng)絡(luò)技術(shù)的發(fā)展和普及,能幫助用戶在海量的網(wǎng)絡(luò)資源中搜索其所需信息的 搜索引擎技術(shù)也得到了大力發(fā)展和普及,目前,搜索引擎已成為每個(gè)網(wǎng)民不可缺少的上網(wǎng) 工具之一。
[0003] -般而言,搜索引擎是基于用戶提交的查詢關(guān)鍵詞進(jìn)行檢索,用戶在搜索頁(yè)面輸 入檢索關(guān)鍵詞(query),搜索引擎會(huì)采用該query在線上進(jìn)行檢索,判斷是否有匹配的信 息。然而,這樣檢索過(guò)程會(huì)導(dǎo)致處理的時(shí)間過(guò)長(zhǎng),因此,如何提高搜索引擎的搜索效率,成為 本領(lǐng)域技術(shù)人員迫切需要解決的問(wèn)題。
【發(fā)明內(nèi)容】
[0004] 本申請(qǐng)所要解決的技術(shù)問(wèn)題是提供一種基于查詢?cè)~的檢索方法,用以提高檢索效 率。
[0005] 相應(yīng)的,本申請(qǐng)還提供了一種基于查詢?cè)~的檢索裝置,用以保證上述方法在實(shí)際 中的應(yīng)用。
[0006] 為了解決上述問(wèn)題,本申請(qǐng)公開了一種基于查詢?cè)~的檢索方法,包括:
[0007] 接收提交的查詢?cè)~;
[0008] 判斷所述查詢?cè)~是否存在于第一特征數(shù)據(jù)庫(kù)中,其中所述第一特征數(shù)據(jù)庫(kù)包括具 有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系;
[0009] 若是,則按照所述具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系獲取與 所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)并返回。
[0010] 優(yōu)選地,所述方法還包括:
[0011] 若所述查詢?cè)~不存在于所述第一特征數(shù)據(jù)庫(kù)中,從第二特征數(shù)據(jù)庫(kù)中查找所述查 詢?cè)~,并返回與所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù),其中,所述第二特征數(shù)據(jù)庫(kù)包括具有非指 定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系;
[0012] 其中,所述第二特征數(shù)據(jù)庫(kù)通過(guò)如下方式生成:
[0013] 獲取預(yù)設(shè)時(shí)間段內(nèi)的一個(gè)或多個(gè)查詢?cè)~;
[0014] 獲取目標(biāo)網(wǎng)頁(yè)數(shù)據(jù);
[0015] 分別計(jì)算所述一個(gè)或多個(gè)關(guān)鍵詞與目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的相關(guān)性;
[0016] 依據(jù)所述相關(guān)性建立關(guān)鍵詞和產(chǎn)品數(shù)據(jù)的對(duì)應(yīng)關(guān)系;
[0017] 從所述關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系中去除所述具有指定特征的關(guān)鍵詞和 目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,將剩下的關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系作為具有非指定特 征的關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系保存為第二特征數(shù)據(jù)庫(kù)。
[0018] 優(yōu)選地,所述方法還包括:
[0019] 若所述第二特征數(shù)據(jù)庫(kù)中存在與所述查詢?cè)~相同的具有非指定特征的關(guān)鍵詞,在 所述返回的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)被點(diǎn)擊時(shí),獲取與所述目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)對(duì)應(yīng)的具有指定特征的關(guān)鍵 詞,建立所述具有非指定特征的關(guān)鍵詞與具有指定特征的關(guān)鍵詞的關(guān)聯(lián)關(guān)系。
[0020] 優(yōu)選地,所述方法還包括:
[0021] 若所述第二特征數(shù)據(jù)庫(kù)中存在與所述查詢?cè)~相同的具有非指定特征的關(guān)鍵詞,將 所述查詢?cè)~作為候選的具有指定特征的關(guān)鍵詞。
[0022] 優(yōu)選地,所述查詢?cè)~包括提交的查詢?cè)~以及依據(jù)所述提交的查詢?cè)~生成的擴(kuò)展查 詢?cè)~。
[0023] 本申請(qǐng)還公開了一種基于查詢?cè)~的檢索裝置,包括:
[0024] 查詢?cè)~接收模塊,用于接收提交的查詢?cè)~;
[0025] 判斷模塊,用于判斷所述查詢?cè)~是否存在于第一特征數(shù)據(jù)庫(kù)中,其中所述第一特 征數(shù)據(jù)庫(kù)包括具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系;若是,則執(zhí)行返回 模塊;
[0026] 返回模塊,用于按照所述具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系 獲取與所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)并返回。
[0027] 優(yōu)選地,所述裝置還包括:
[0028] 查找模塊,用于在所述查詢?cè)~不存在于所述第一特征數(shù)據(jù)庫(kù)中時(shí),從第二特征數(shù) 據(jù)庫(kù)中查找所述查詢?cè)~,并返回與所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù),其中,所述第二特征數(shù) 據(jù)庫(kù)包括具有非指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系;
[0029] 其中,所述第二特征數(shù)據(jù)庫(kù)通過(guò)如下方式生成:
[0030] 獲取預(yù)設(shè)時(shí)間段內(nèi)的一個(gè)或多個(gè)查詢?cè)~;
[0031] 獲取目標(biāo)網(wǎng)頁(yè)數(shù)據(jù);
[0032] 分別計(jì)算所述一個(gè)或多個(gè)關(guān)鍵詞與目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的相關(guān)性;
[0033] 依據(jù)所述相關(guān)性建立關(guān)鍵詞和產(chǎn)品數(shù)據(jù)的對(duì)應(yīng)關(guān)系;
[0034] 從所述關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系中去除所述具有指定特征的關(guān)鍵詞和 目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,將剩下的關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系作為具有非指定特 征的關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系保存為第二特征數(shù)據(jù)庫(kù)。
[0035] 優(yōu)選地,所述裝置還包括:
[0036] 關(guān)聯(lián)關(guān)系建立模塊,用于若所述第二特征數(shù)據(jù)庫(kù)中存在與所述查詢?cè)~相同的具有 非指定特征的關(guān)鍵詞,在所述返回的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)被點(diǎn)擊時(shí),獲取與所述目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)對(duì) 應(yīng)的具有指定特征的關(guān)鍵詞,建立所述具有非指定特征的關(guān)鍵詞與具有指定特征的關(guān)鍵詞 的關(guān)聯(lián)關(guān)系。
[0037] 優(yōu)選地,所述裝置還包括:
[0038] 候選關(guān)鍵詞指定模塊,用于在所述第二特征數(shù)據(jù)庫(kù)中存在與所述查詢?cè)~相同的具 有非指定特征的關(guān)鍵詞時(shí),將所述查詢?cè)~作為候選的具有指定特征的關(guān)鍵詞。
[0039] 優(yōu)選地,所述查詢?cè)~包括提交的查詢?cè)~以及依據(jù)所述提交的查詢?cè)~生成的擴(kuò)展查 詢?cè)~。
[0040] 與現(xiàn)有技術(shù)相比,本申請(qǐng)具有以下優(yōu)點(diǎn):
[0041] 第一,本申請(qǐng)通過(guò)搜集一段時(shí)間內(nèi)的具有指定特征的關(guān)鍵詞,線下計(jì)算所述具有 指定特征的關(guān)鍵詞與對(duì)應(yīng)的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系,并存儲(chǔ)于第一特征數(shù)據(jù)庫(kù)中。這樣 當(dāng)接收到用戶提交的查詢?cè)~時(shí),只需要在所述第一特征數(shù)據(jù)庫(kù)中查找所述查詢?cè)~,若查找 成功則返回匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù),從而提高基于查詢?cè)~的檢索效率。
[0042] 第二,本申請(qǐng)同時(shí)在線下預(yù)置第二特征數(shù)據(jù)庫(kù),存儲(chǔ)有收集來(lái)的具有非指定特征 的關(guān)鍵詞與對(duì)應(yīng)的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù),當(dāng)所述用戶提交的查詢?cè)~不能在所述第一特征數(shù)據(jù)庫(kù)中 找到時(shí),在所述第二特征數(shù)據(jù)庫(kù)中查找所述查詢?cè)~,這樣在提高檢索效率的同時(shí),也提高了 檢索的準(zhǔn)確率。
[0043] 第三,本申請(qǐng)可以將命中所述第二特征數(shù)據(jù)庫(kù)的查詢?cè)~作為候選的具有指定特征 的關(guān)鍵詞并推薦給用戶,從而提高第一特征數(shù)據(jù)庫(kù)中目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的覆蓋率,進(jìn)一步提高 檢索的效率。
【專利附圖】
【附圖說(shuō)明】
[0044] 圖1是本申請(qǐng)一種基于查詢?cè)~的檢索方法實(shí)施例1的步驟流程圖;
[0045] 圖2是本申請(qǐng)一種基于查詢?cè)~的檢索方法實(shí)施例2的步驟流程圖;
[0046] 圖3是本申請(qǐng)一種基于查詢?cè)~的檢索方法實(shí)施例2中第二特征數(shù)據(jù)庫(kù)生成步驟流 程圖;
[0047] 圖4是本申請(qǐng)一種基于查詢?cè)~的檢索方法實(shí)施例3的步驟流程圖;
[0048] 圖5是本申請(qǐng)一種基于查詢?cè)~的檢索方法實(shí)施例4的步驟流程圖;
[0049] 圖6是本申請(qǐng)一種基于查詢?cè)~的檢索裝置實(shí)施例的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0050] 為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說(shuō)明。
[0051] 本申請(qǐng)實(shí)施例的核心構(gòu)思之一在于,通過(guò)獲取一段時(shí)間內(nèi)的關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù) 據(jù),并對(duì)其進(jìn)行相關(guān)性計(jì)算得到優(yōu)質(zhì)綁定關(guān)系集合,從所述優(yōu)質(zhì)綁定關(guān)系集合中過(guò)濾掉具 有指定特征的關(guān)鍵詞與目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)系對(duì),獲得的是具有非指定特征的關(guān)鍵詞與目標(biāo) 網(wǎng)頁(yè)數(shù)據(jù)的虛綁定集合,當(dāng)用戶提交的查詢?cè)~命中所述虛綁定集合時(shí),給出符合用戶查詢 意圖的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)。
[0052] 參照?qǐng)D1,示出了一種基于查詢?cè)~的檢索方法實(shí)施例1的步驟流程圖,具體可以包 括以下步驟:
[0053] 步驟101,接收提交的查詢?cè)~;
[0054] 步驟102,判斷所述查詢?cè)~是否存在于第一特征數(shù)據(jù)庫(kù)中,其中所述第一特征數(shù)據(jù) 庫(kù)包括具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系;
[0055] 步驟103,若是,則按照所述具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān) 系獲取與所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)并返回。
[0056] 在本申請(qǐng)實(shí)施例中,通過(guò)搜集一段時(shí)間內(nèi)的查詢?cè)~,線下計(jì)算所述查詢?cè)~與對(duì)應(yīng) 的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系,并存儲(chǔ)于第一特征數(shù)據(jù)庫(kù)中。這樣當(dāng)接收到用戶提交的查詢 詞時(shí),只需要在所述第一特征數(shù)據(jù)庫(kù)中查找所述查詢?cè)~,若查找成功則返回匹配的目標(biāo)網(wǎng) 頁(yè)數(shù)據(jù),從而避免現(xiàn)有技術(shù)中線上查詢效率低的問(wèn)題。
[0057] 參照?qǐng)D2,示出了一種基于查詢?cè)~的檢索方法實(shí)施例2的步驟流程圖,具體可以包 括以下步驟:
[0058] 步驟201,預(yù)置第一特征數(shù)據(jù)庫(kù),所述第一特征數(shù)據(jù)庫(kù)包括具有指定特征的關(guān)鍵詞 與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系;
[0059] 其中,所述指定特征的關(guān)鍵詞為與目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)之間具有某種對(duì)應(yīng)關(guān)系的的關(guān)鍵 詞,例如,可以是在歷史查詢記錄中,統(tǒng)計(jì)利用某一關(guān)鍵詞進(jìn)行查詢,獲得的搜索結(jié)果中用 戶點(diǎn)擊頻率最高的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù),然后將該關(guān)鍵詞作為指定的特征關(guān)鍵詞,并建立該指定 的特征關(guān)鍵詞與用戶點(diǎn)擊頻率最高的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系?;蛘呖梢允菫榱颂岣?搜索效率而人為設(shè)定某一關(guān)鍵詞與某一目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)具有特定對(duì)應(yīng)關(guān)系,則將該關(guān)鍵詞作 為指定特征的關(guān)鍵詞。
[0060] 步驟202,接收提交的查詢?cè)~;
[0061] 在實(shí)際應(yīng)用中,所述查詢?cè)~可以是單獨(dú)的詞條,也可以是其他粒度的語(yǔ)義單元,t匕 如使用主題模型中的topic作為基本的語(yǔ)義單元。
[0062] 在具體實(shí)現(xiàn)中,所述查詢?cè)~可以包括提交的查詢?cè)~以及依據(jù)所述提交的查詢?cè)~生 成的擴(kuò)展查詢?cè)~。在本申請(qǐng)實(shí)施例的一種優(yōu)選實(shí)施例中,所述擴(kuò)展關(guān)鍵詞,可以采用如下步 驟獲?。?br>
[0063] 1),將在預(yù)設(shè)時(shí)間段內(nèi)采集的一個(gè)或多個(gè)關(guān)鍵詞改寫成其他形式,生成擴(kuò)展詞;
[0064] 在實(shí)際中,可以采用各種改寫方式對(duì)查詢?cè)~進(jìn)行改寫,查詢?cè)~改寫可以包括去除 冗余詞、同義詞替換、去除次要屬性等等,比如用戶提交的查詢?cè)~為"I want to buy black tea",去除冗余詞后變成"black tea";又如,"laptop display"同義詞替換后變成"laptop screen";或者,"8g red mp3"去除次要信息后變?yōu)?red mp3"或者"8g mp3"。
[0065] 2),將命中的擴(kuò)展詞編成字典;
[0066] 實(shí)際上,可以采用鍵值對(duì)(key-value)的形式存儲(chǔ)所述擴(kuò)展詞與查詢?cè)~的關(guān)系。
[0067] 為了使本領(lǐng)域技術(shù)人員能更好地理解本申請(qǐng)實(shí)施例,以下通過(guò)一個(gè)具體實(shí)例說(shuō)明 所述生成提交的查詢?cè)~對(duì)應(yīng)的擴(kuò)展關(guān)鍵詞的過(guò)程:
[0068] 線下流程:日志中記錄的一條用戶查詢"2013fashion usb sd card",可以將其改 寫為"usb sd card"、"sd card"、"sd memory card"的等價(jià)形式,并將原詞與這三個(gè)詞的對(duì) 應(yīng)關(guān)系與入到字典中。
[0069] 線上流程:有用戶輸入"2013fashion usb sd card",在沒有找到直接匹配的廣 告的情況下,擴(kuò)展匹配引擎查找改寫詞字典,發(fā)現(xiàn)用戶輸入的原詞有"usb sd Card"、"sd card"、"sd memory card"三個(gè)同義詞形式,于是廣告引擎使用這三個(gè)詞來(lái)在廣告數(shù)據(jù)庫(kù)中 查找,再返回命中的廣告產(chǎn)品。
[0070] 步驟203,判斷所述查詢?cè)~是否存在于所述第一特征數(shù)據(jù)庫(kù)中;若是,則執(zhí)行步驟 204 ;若否,則執(zhí)行步驟205 ;
[0071] 其中,判斷所述查詢?cè)~是否存在于所述第一特征數(shù)據(jù)庫(kù)中的方法包括:判斷所述 查詢?cè)~與第一特征數(shù)據(jù)庫(kù)中的指定特征關(guān)鍵詞是否匹配,若匹配,則認(rèn)為所說(shuō)查詢?cè)~存在 于所述第一特征數(shù)據(jù)庫(kù)中。
[0072] 步驟204,按照所述具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系獲取 與所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)并返回;
[0073] 步驟205,預(yù)置第二特征數(shù)據(jù)庫(kù),所述第二特征數(shù)據(jù)庫(kù)包括具有非指定特征的關(guān)鍵 詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系,從所述第二特征數(shù)據(jù)庫(kù)中查找所述查詢?cè)~,并返回與 所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù);
[0074] 參考圖3所示的第二特征數(shù)據(jù)庫(kù)生成步驟流程圖,在本申請(qǐng)實(shí)施例的一種優(yōu)選實(shí) 施例中,所述第二特征數(shù)據(jù)庫(kù)生成的步驟可以包括:
[0075] 步驟S1,獲取預(yù)設(shè)時(shí)間段內(nèi)的一個(gè)或多個(gè)關(guān)鍵詞;
[0076] 應(yīng)用于本申請(qǐng)實(shí)施例,可以從日志系統(tǒng)中采集預(yù)設(shè)時(shí)間段內(nèi)的一個(gè)或多個(gè)關(guān)鍵 詞,生成關(guān)鍵詞集合。
[0077] 步驟S2,獲得目標(biāo)網(wǎng)頁(yè)數(shù)據(jù);
[0078] 步驟S3,分別計(jì)算所述一個(gè)或多個(gè)關(guān)鍵詞與目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的相關(guān)性;
[0079] 具體而言,相關(guān)性是指一個(gè)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)能滿足一個(gè)關(guān)鍵詞所代表的用戶查詢意 圖的程度;或者兩個(gè)不同的關(guān)鍵詞所代表的用戶查詢意圖的相似程度。其中,用戶查詢意 圖可以包括用戶對(duì)于目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的種類,功用,形狀顏色等外觀品質(zhì),以及容量質(zhì)地等內(nèi) 在品質(zhì)的要求。比如用戶輸入的查詢?cè)~為"red case for iphone",其中case表明產(chǎn)品種 類,red表示外觀,for iphone表示功用,查詢?cè)~的每一個(gè)部分都表示了一種明確的用戶查 詢意圖。
[0080] 在本申請(qǐng)實(shí)施例中,設(shè)置有相關(guān)性計(jì)算模塊計(jì)算關(guān)鍵詞集合與目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的相 關(guān)性,并設(shè)置有質(zhì)量模塊保證關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)之間的相關(guān)性達(dá)到可用的標(biāo)準(zhǔn)。作為 本實(shí)施例的一種優(yōu)選示例,所述關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的相關(guān)性Si可以采用如下方式計(jì) 算:
[0081]
【權(quán)利要求】
1. 一種基于查詢?cè)~的檢索方法,其特征在于,包括: 接收提交的查詢?cè)~; 判斷所述查詢?cè)~是否存在于第一特征數(shù)據(jù)庫(kù)中,其中所述第一特征數(shù)據(jù)庫(kù)包括具有指 定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系; 若是,則按照所述具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系獲取與所述 查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)并返回。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 若所述查詢?cè)~不存在于所述第一特征數(shù)據(jù)庫(kù)中,從第二特征數(shù)據(jù)庫(kù)中查找所述查詢 詞,并返回與所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù),其中,所述第二特征數(shù)據(jù)庫(kù)包括具有非指定 特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系; 其中,所述第二特征數(shù)據(jù)庫(kù)通過(guò)如下方式生成: 獲取預(yù)設(shè)時(shí)間段內(nèi)的一個(gè)或多個(gè)查詢?cè)~; 獲取目標(biāo)網(wǎng)頁(yè)數(shù)據(jù); 分別計(jì)算所述一個(gè)或多個(gè)關(guān)鍵詞與目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的相關(guān)性; 依據(jù)所述相關(guān)性建立關(guān)鍵詞和產(chǎn)品數(shù)據(jù)的對(duì)應(yīng)關(guān)系; 從所述關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系中去除所述具有指定特征的關(guān)鍵詞和目標(biāo) 網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,將剩下的關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系作為具有非指定特征的 關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系保存為第二特征數(shù)據(jù)庫(kù)。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括: 若所述第二特征數(shù)據(jù)庫(kù)中存在與所述查詢?cè)~相同的具有非指定特征的關(guān)鍵詞,在所述 返回的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)被點(diǎn)擊時(shí),獲取與所述目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)對(duì)應(yīng)的具有指定特征的關(guān)鍵詞, 建立所述具有非指定特征的關(guān)鍵詞與具有指定特征的關(guān)鍵詞的關(guān)聯(lián)關(guān)系。
4. 根據(jù)權(quán)利要求2所述的方法,其特征在于,還包括: 若所述第二特征數(shù)據(jù)庫(kù)中存在與所述查詢?cè)~相同的具有非指定特征的關(guān)鍵詞,將所述 查詢?cè)~作為候選的具有指定特征的關(guān)鍵詞。
5. 根據(jù)權(quán)利要求1-4任一權(quán)利要求所述的方法,其特征在于,所述查詢?cè)~包括提交的 查詢?cè)~以及依據(jù)所述提交的查詢?cè)~生成的擴(kuò)展查詢?cè)~。
6. -種基于查詢?cè)~的檢索裝置,其特征在于,包括: 查詢?cè)~接收模塊,用于接收提交的查詢?cè)~; 判斷模塊,用于判斷所述查詢?cè)~是否存在于第一特征數(shù)據(jù)庫(kù)中,其中所述第一特征數(shù) 據(jù)庫(kù)包括具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系;若是,則執(zhí)行返回模 塊; 返回模塊,用于按照所述具有指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系獲取 與所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)并返回。
7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 查找模塊,用于在所述查詢?cè)~不存在于所述第一特征數(shù)據(jù)庫(kù)中時(shí),從第二特征數(shù)據(jù)庫(kù) 中查找所述查詢?cè)~,并返回與所述查詢?cè)~匹配的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù),其中,所述第二特征數(shù)據(jù)庫(kù) 包括具有非指定特征的關(guān)鍵詞與對(duì)應(yīng)目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的關(guān)聯(lián)關(guān)系; 其中,所述第二特征數(shù)據(jù)庫(kù)通過(guò)如下方式生成: 獲取預(yù)設(shè)時(shí)間段內(nèi)的一個(gè)或多個(gè)查詢?cè)~; 獲取目標(biāo)網(wǎng)頁(yè)數(shù)據(jù); 分別計(jì)算所述一個(gè)或多個(gè)關(guān)鍵詞與目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的相關(guān)性; 依據(jù)所述相關(guān)性建立關(guān)鍵詞和產(chǎn)品數(shù)據(jù)的對(duì)應(yīng)關(guān)系; 從所述關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系中去除所述具有指定特征的關(guān)鍵詞和目標(biāo) 網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系,將剩下的關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系作為具有非指定特征的 關(guān)鍵詞和目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)的對(duì)應(yīng)關(guān)系保存為第二特征數(shù)據(jù)庫(kù)。
8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 關(guān)聯(lián)關(guān)系建立模塊,用于若所述第二特征數(shù)據(jù)庫(kù)中存在與所述查詢?cè)~相同的具有非指 定特征的關(guān)鍵詞,在所述返回的目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)被點(diǎn)擊時(shí),獲取與所述目標(biāo)網(wǎng)頁(yè)數(shù)據(jù)對(duì)應(yīng)的 具有指定特征的關(guān)鍵詞,建立所述具有非指定特征的關(guān)鍵詞與具有指定特征的關(guān)鍵詞的關(guān) 聯(lián)關(guān)系。
9. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,還包括: 候選關(guān)鍵詞指定模塊,用于在所述第二特征數(shù)據(jù)庫(kù)中存在與所述查詢?cè)~相同的具有非 指定特征的關(guān)鍵詞時(shí),將所述查詢?cè)~作為候選的具有指定特征的關(guān)鍵詞。
10. 根據(jù)權(quán)利要求6-9任一權(quán)利要求所述的裝置,其特征在于,所述查詢?cè)~包括提交的 查詢?cè)~以及依據(jù)所述提交的查詢?cè)~生成的擴(kuò)展查詢?cè)~。
【文檔編號(hào)】G06F17/30GK104142945SQ201310167400
【公開日】2014年11月12日 申請(qǐng)日期:2013年5月8日 優(yōu)先權(quán)日:2013年5月8日
【發(fā)明者】謝可, 蘇上海, 黃鵬 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司