一種搜索的方法和裝置的制造方法
【技術領域】
[0001 ] 本發(fā)明涉及搜索的技術領域,特別是涉及一種搜索的方法和一種搜索的裝置。
【背景技術】
[0002] 隨著網(wǎng)絡的迅速發(fā)展,網(wǎng)絡信息急劇增加。用戶為了在海量的網(wǎng)絡信息中尋找所 需的網(wǎng)絡信息,通常使用搜索引擎進行搜索。
[0003] 搜索引擎指自動從因特網(wǎng)搜集信息,經(jīng)過一定整理以后,提供給用戶進行查詢的 系統(tǒng)。網(wǎng)絡信息浩瀚萬千,而且毫無秩序,所有的網(wǎng)絡信息像汪洋上的一個個小島,網(wǎng)頁鏈 接是這些小島之間縱橫交錯的橋梁,而搜索引擎,則為用戶繪制一幅一目了然的信息地圖, 供用戶隨時查閱。
[0004] 但是,網(wǎng)絡信息增長的速度和人們獲取所需信息能力之間的矛盾越來越突出,過 量的網(wǎng)絡信息使得用戶在搜索網(wǎng)絡信息的時候要進行繁瑣的人工過濾,耗費大量時間和精 力,網(wǎng)絡信息的搜索效率很低。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實施例所要解決的技術問題是提供一種搜索的方法,用以提高網(wǎng)絡信息的 搜索效率。
[0006] 相應的,本發(fā)明實施例還提供了一種搜索的裝置,用以保證上述方法的實現(xiàn)及應 用。
[0007] 為了解決上述問題,本發(fā)明實施例公開了一種搜索的方法,包括:
[0008] 當接收到第一用戶提交的原始查詢詞串時,以所述原始查詢詞串進行搜索,獲得 匹配的網(wǎng)絡信息;
[0009] 根據(jù)所述網(wǎng)絡信息判斷所述原始查詢詞串是否為多查詢意圖的查詢詞串;若是, 則按照每個查詢意圖將所述原始查詢詞串分別改寫為多個具有所述查詢意圖的第一查詢 詞串;
[0010] 分別按照所述第一查詢詞串查找與所述第一查詢詞串具有相同或相似查詢意圖 的第二用戶;其中,所述第二用戶具有社區(qū)信息;
[0011] 將所述網(wǎng)絡信息和所述第二用戶對應的社區(qū)信息合成搜索結果。
[0012] 優(yōu)選地,所述判斷所述原始查詢詞串是否為多查詢意圖的查詢詞串的步驟包括:
[0013] 獲取所述原始查詢詞串匹配的第一特征網(wǎng)絡信息;所述第一特征網(wǎng)絡信息包括排 序最高的前N條網(wǎng)絡信息和/或歷史點擊次數(shù)最多的前M條網(wǎng)絡信息;
[0014] 獲取其他查詢詞串匹配的第二特征網(wǎng)絡信息;所述第二特征網(wǎng)絡信息包括排序最 高的前A條網(wǎng)絡信息和/或歷史點擊次數(shù)最多的前B條網(wǎng)絡信息;
[0015] 判斷所述第一特征網(wǎng)絡信息中是否包括至少兩個第二特征網(wǎng)絡信息;若是,則判 定所述原始查詢詞串為多查詢意圖的查詢詞串;其中,Μ、N、A、B均為正整數(shù)。
[0016] 優(yōu)選地,所述判斷所述原始查詢詞串是否為多查詢意圖的查詢詞串的步驟包括:
[0017] 在既定的知識庫中查找所述原始查詢詞串對應的實體類別;
[0018] 當所述實體類別超過兩個時,判定所述原始查詢詞串為多查詢意圖的查詢詞串。
[0019] 優(yōu)選地,所述判斷所述原始查詢詞串是否為多查詢意圖的查詢詞串的步驟包括:
[0020] 在既定的知識庫中查找所述原始查詢詞串關聯(lián)的特征詞;
[0021] 判斷在全網(wǎng)的網(wǎng)頁中,所述特征詞的數(shù)量是否超過預設數(shù)量閾值;若是,則采用知 識庫的實體類別對所述特征詞進行分類;
[0022] 當獲得至少兩個分類時,判定所述原始查詢詞串為多查詢意圖的查詢詞串。
[0023] 優(yōu)選地,所述查找與所述第一查詢詞串具有相同或相似查詢意圖的第二用戶的步 驟包括:
[0024] 分別獲取所述第一用戶的每個第一查詢詞串對應的第一查詢意圖信息以及所述 第二用戶的第二查詢意圖信息;
[0025] 分別計算所述第一查詢意圖信息與所述第二查詢意圖信息的相似度;
[0026] 當所述相似度大于預設的相似度閾值時,判斷所述第一查詢詞串與所述第二用戶 具有相同或相似的查詢意圖。
[0027] 優(yōu)選地,所述第一查詢意圖信息包括第一特征向量,所述第一特征向量根據(jù)所述 第一查詢詞串進行確定;
[0028] 所述第二查詢意圖信息包括第二特征向量,所述第二特征向量根據(jù)所述第二查詢 詞串進彳丁確定;
[0029] 其中,所述第二查詢詞串為所述第二用戶在先提交的查詢詞串。
[0030] 優(yōu)選地,所述第一特征向量包括以下至少一種:
[0031] 第一查詢詞串、與第一查詢詞串的分詞關聯(lián)的特征向量、與第一查詢詞串匹配的 網(wǎng)絡信息關聯(lián)的特征向量;
[0032] 所述第二特征向量包括以下至少一種:
[0033] 第二查詢詞串、與第二查詢詞串的分詞關聯(lián)的特征向量、與第二查詢詞串匹配的 網(wǎng)絡信息關聯(lián)的特征向量。
[0034] 優(yōu)選地,所述將所述網(wǎng)絡信息和所述第二用戶對應的社區(qū)信息合成搜索結果的步 驟包括:
[0035] 計算每個查詢意圖下所述第一用戶與所述第二用戶的關聯(lián)密切度;
[0036] 按照所述關聯(lián)密切度對所述第二用戶對應的社區(qū)信息進行排序;
[0037] 將所述網(wǎng)絡信息和排序后的第二用戶對應的社區(qū)信息合成搜索結果。
[0038] 優(yōu)選地,所述計算每個查詢意圖下所述第一用戶與所述第二用戶的關聯(lián)密切度的 步驟包括:
[0039] 對每個查詢意圖下所述第一查詢意圖信息與所述第二查詢意圖信息的相似度,和 /或,所述第一用戶與所述第二用戶之間的關聯(lián)信息,和/或,所述第二用戶對所述第二查 詢意圖的歷史操作信息錄配置對應的權重;
[0040] 對配置權重之后的所述第一查詢意圖信息與所述第二查詢意圖信息的相似度,和 /或,所述第一用戶與所述第二用戶之間的關聯(lián)信息,和/或,所述第二用戶對所述第二查 詢意圖的歷史操作信息進行求和計算,獲得每個查詢意圖下所述第一用戶與所述第二用戶 的關聯(lián)密切度。
[0041] 優(yōu)選地,所述第一用戶與所述第二用戶之間的關聯(lián)信息包括以下至少一種:
[0042] 預設時間段內(nèi)的平均聯(lián)系次數(shù)、預設時間段內(nèi)的平均聯(lián)系時長、共同好友的數(shù)量、 居住位置;
[0043] 所述第二用戶對所述第二查詢意圖的歷史操作信息包括以下至少一種:
[0044] 所述第二查詢意圖對應的搜索次數(shù)、所述第二查詢意圖對應的網(wǎng)絡信息的瀏覽時 長、所述第二查詢意圖對應的搜索持續(xù)天數(shù)。
[0045] 優(yōu)選地,所述第一用戶與所述第二用戶之間具有社區(qū)好友關系。
[0046] 本發(fā)明實施例還公開了一種搜索的裝置,包括:
[0047] 網(wǎng)絡信息搜索模塊,用于在接收到第一用戶提交的原始查詢詞串時,以所述原始 查詢詞串進行搜索,獲得匹配的網(wǎng)絡信息;
[0048] 多查詢意圖判斷模塊,用于根據(jù)所述網(wǎng)絡信息判斷所述原始查詢詞串是否為多查 詢意圖的查詢詞串;若是,則調(diào)用查詢詞串改寫模塊;
[0049] 查詢詞串改寫模塊,用于按照每個查詢意圖將所述原始查詢詞串分別改寫為多個 具有所述查詢意圖的第一查詢詞串;
[0050] 用戶查找模塊,用于分別按照所述第一查詢詞串查找與所述第一查詢詞串具有相 同或相似查詢意圖的第二用戶;其中,所述第二用戶具有社區(qū)信息;
[0051] 搜索結果合成模塊,用于將所述網(wǎng)絡信息和所述第二用戶對應的社區(qū)信息合成搜 索結果。
[0052] 優(yōu)選地,所述多查詢意圖判斷模塊包括:
[0053] 第一特征網(wǎng)絡信息獲取子模塊,用于獲取所述原始查詢詞串匹配的第一特征網(wǎng)絡 信息;所述第一特征網(wǎng)絡信息包括排序最高的前N條網(wǎng)絡信息和/或歷史點擊次數(shù)最多的 前M條網(wǎng)絡信息;
[0054] 第二特征網(wǎng)絡信息獲取子模塊,用于獲取其他查詢詞串匹配的第二特征網(wǎng)絡信 息;所述第二特征網(wǎng)絡信息包括排序最高的前A條網(wǎng)絡信息和/或歷史點擊次數(shù)最多的前 B條網(wǎng)絡/[目息;
[0055] 特征網(wǎng)絡信息判斷子模塊,用于判斷所述第一特征網(wǎng)絡信息中是否包括至少兩個 第二特征網(wǎng)絡信息;若是,則調(diào)用第一判定子模塊;
[0056] 第一判定子模塊,用于判定所述原始查詢詞串為多查詢意圖的查詢詞串;其中,M、 N、A、B均為正整數(shù)。
[0057] 優(yōu)選地,所述多查詢意圖判斷模塊包括:
[0058] 實體類別查找子模塊,用于在既定的知識庫中查找所述原始查詢詞串對應的實體 類別;
[0059] 第二判定子模塊,用于在所述實體類別超過兩個時,判定所述原始查詢詞串為多 查詢意圖的查詢詞串。
[0060] 優(yōu)選地,所述多查詢意圖判斷模塊包括:
[0061] 特征詞查找子模塊,用于在既定的知識庫中查找所述原始查詢詞串關聯(lián)的特征 詞;
[0062] 數(shù)量判斷子模塊,用于判斷在全網(wǎng)的網(wǎng)頁中,所述特征詞的數(shù)量是否超過預設數(shù) 量閾值;若是,則調(diào)用分類子模塊;
[0063] 分類子模塊,用于采用知識庫的實體類別對所述特征詞進行分類;
[0064] 第三判定子模塊,用于在獲得至少兩個分類時,判定所述原始查詢詞串為多查詢 意圖的查詢詞串。
[0065] 優(yōu)選地,所述用戶查找模塊包括:
[0066] 查詢意圖信息獲取子模塊,用于分別獲取所述第一用戶的每個第一查詢詞串對應 的第一查詢意圖信息以及所述第二用戶的第二查詢意圖信息;
[0067] 查詢意圖信息相似度計算子模塊,用于分別計算所述第一查詢意圖信息與所述第 二查詢意圖信息的相似度;
[0068] 判斷子模塊,用于在所述相似度大于預設的相似度閾值時,判斷所述第一查詢詞 串與所述第二用戶具有相同或相似的查詢意圖。
[0069] 與現(xiàn)有技術相比,本發(fā)明實施例包括以下優(yōu)點:
[0070] 本發(fā)明實施例中以第一用戶提交的原始查詢詞串進行搜索,獲得匹配的網(wǎng)絡信 息,在判斷原始查詢詞串為多查詢意圖的查詢詞串時,將原始查詢詞串改寫為多個具有該 查詢意圖的第一查詢詞串,以及查找與第一用戶具有相同或相似查詢意圖的第二用戶,并 將網(wǎng)絡信息和第二用戶的社區(qū)信息合成搜索結果,使得在第一用戶需求不明確時,按照各 種分類需求,通過分析搜索日志就主題類別來篩選用戶的社區(qū)好友,分別得到與每個主題 類別最為相關的各第二用戶,從而將第一用戶的搜索需求進行細分,使用戶在搜索需求不 明確的情況下也可推薦出與當前用戶需求相似的聯(lián)系人,避免了第一用戶重復對海量的網(wǎng) 絡信息進行繁瑣的人工過濾,減少了第一用戶時間和精力的耗費,也減少了用戶設備和網(wǎng) 站的系統(tǒng)資源消耗,也減少了網(wǎng)絡帶寬的占用,大大提高了信息獲取的效率、質(zhì)量和容量。
【附圖說明】
[0071] 圖1是本發(fā)明的一種搜索的方法實施例的步驟流程圖;
[0072] 圖2是本發(fā)明的一種社區(qū)信息的展示示例圖;
[0073] 圖3是本發(fā)明的一種搜索的裝置實施例的結構框圖。
【具體實施方式】
[0074] 為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結合附圖和具體實 施方式對本發(fā)明作進一步詳細的說明。
[0075] 參照圖1,示出了本發(fā)明的一種搜索的方法實施例的步驟流程圖,具體可以包括如 下步驟:
[0076] 步驟101,當接收到第一用戶提交的原始查詢詞串時,以所述原始查詢詞串進行搜 索,獲得匹配的網(wǎng)絡信息;
[0077] 應用本發(fā)明實施例,第一用戶可以在第一客戶端登錄,則第一用戶可以通過第一 客戶端提交原始查詢詞串,請求搜索與該原始查詢詞串匹配的網(wǎng)絡信息。
[0078] 本發(fā)明實施例中,當接收到第一用戶提交的原始查詢詞串時,則可以根據(jù)該原始 查詢詞串在索引庫中快速檢出網(wǎng)絡信息,進行網(wǎng)絡信息與查詢的相關度評價,對將要輸出 的結果進行排序。
[0079] 以搜索引擎為例進行說明,搜索引擎的搜索流程分為二個部分,一是前端用戶請 求過程,二是后端制作數(shù)據(jù)過程。
[0080] 一、前端用戶請求過程:
[0081] 1.接收請求:接收用戶在搜索