一種智能語義檢索系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及通信技術(shù)領(lǐng)域,特別涉及一種智能語義檢索系統(tǒng)和方法。
【背景技術(shù)】
[0002] 現(xiàn)有技術(shù)的電子商務(wù)領(lǐng)域中,電子商務(wù)網(wǎng)站提供給用戶的商品檢索的方式多為關(guān) 鍵詞檢索,其類似于百度或GOOGLE等檢索引擎的檢索模式。這種基于關(guān)鍵詞的檢索模式雖 然能最大限度滿足對(duì)檢索結(jié)果的召回率,但是準(zhǔn)確率卻不高。用戶在使用這種檢索模式進(jìn) 行檢索時(shí),為了找到想要查詢的商品,不得不一次次更換關(guān)鍵詞,或者是采用人工從瀏覽的 方式從大量的檢索結(jié)果中查找想要的商品。因此,這種檢索方式增加了用戶操作的復(fù)雜度, 降低了用戶的檢索體驗(yàn)。盡管大多數(shù)電商網(wǎng)站和購(gòu)物平臺(tái)對(duì)提供的檢索引擎都會(huì)提供排序 的優(yōu)化,但是由于用戶輸入的多樣性,很難解析出用戶真正的語義意圖,識(shí)別出用戶檢索商 品的關(guān)鍵彳目息。
[0003] 目前商品檢索類方法基本采取基于關(guān)鍵詞的檢索方式,某些面向商品的語義檢索 引擎也只是針對(duì)輸入端作了部分優(yōu)化,通過將自然語言輸入采取分詞等方式,及相應(yīng)信息 抽取技術(shù),抽取出相應(yīng)關(guān)鍵詞,然后利用語法分析引擎對(duì)分詞結(jié)果進(jìn)行理解和過濾,最后將 獲得的商品相關(guān)的關(guān)鍵詞提交檢索查詢器,最終返回查詢結(jié)果。但是這類商品語義檢索的 解決方案,僅限于對(duì)輸入語句進(jìn)行淺層的語義分析,通常只是利用了分詞結(jié)果,及去除無關(guān) 聯(lián)的停用詞來抽取相關(guān)商品的關(guān)鍵信息或者基于統(tǒng)計(jì)處理某些高頻詞核心詞的抽取。但這 種方式并沒有結(jié)合句子本事的語義表征及某些概念的背景信息分析輸入語句,因此對(duì)于某 些語音輸入的過長(zhǎng)語句或者說某些輸入的帶有歧義的語句不能進(jìn)行很好的處理。例如,用 戶輸入自然語言:"我要買個(gè)抱枕作為生日禮物送給爸爸",傳統(tǒng)方式很難準(zhǔn)確把握這句話 的意圖。再例如,用戶輸入自然語言"4G的ASUS平板電腦",現(xiàn)有的檢索工具不能很好的 把握商品屬性值一4G是網(wǎng)絡(luò)制式、硬盤大小、內(nèi)存大小中哪個(gè)商品屬性的屬性值。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明所要解決的技術(shù)問題是提供一種更加智能化的理解用戶輸入的檢索語句, 檢索結(jié)果具有更高準(zhǔn)確率的智能語義檢索系統(tǒng)和方法。
[0005] 本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種智能語義檢索系統(tǒng),包括知識(shí)庫(kù)、 知識(shí)管理模塊、規(guī)則生成模塊、信息抽取模塊、驗(yàn)證模塊、意圖生成模塊和對(duì)話模塊;
[0006] 所述知識(shí)庫(kù),用于存儲(chǔ)知識(shí)圖譜,所述知識(shí)圖譜包括商品的屬性及其屬性值以及 商品屬性值之間的映射關(guān)系;
[0007] 所述知識(shí)管理模塊,用于加載知識(shí)圖譜,并通過增、改、刪、查的方式對(duì)所述知識(shí)圖 譜進(jìn)行管理;
[0008] 所述規(guī)則生成模塊,用于根據(jù)知識(shí)圖譜中商品屬性值或商品屬性值和商品屬性值 之間的映射關(guān)系生成抽取規(guī)則;
[0009] 所述信息抽取模塊,用于獲取用戶輸入的自然語言,將抽取規(guī)則與用戶輸入的自 然語言進(jìn)行匹配,生成結(jié)構(gòu)化知識(shí);
[0010] 所述驗(yàn)證模塊,用于調(diào)取知識(shí)圖譜,將知識(shí)圖譜與結(jié)構(gòu)化知識(shí)進(jìn)行比對(duì),根據(jù)比對(duì) 結(jié)果生成驗(yàn)證結(jié)果;
[0011] 所述意圖生成模塊,用于檢測(cè)驗(yàn)證結(jié)果中的商品屬性的取值是否有歧義,如果是, 則將驗(yàn)證結(jié)果發(fā)送至對(duì)話模塊,如果否,則根據(jù)驗(yàn)證結(jié)果生成商品列表,作為最終檢索結(jié)果 并輸出;
[0012] 所述對(duì)話模塊,用于根據(jù)有歧義的驗(yàn)證結(jié)果生成提示語句,并輸出提示語句,提示 語句用于提示用戶重新輸入自然語言。
[0013] 本發(fā)明的有益效果是:一方面,本發(fā)明的語義檢索系統(tǒng)能夠更加智能化的理解用 戶輸入的檢索語句,檢索結(jié)果具有更高準(zhǔn)確率。另一方面,當(dāng)系統(tǒng)對(duì)用于輸入的檢索詞理解 有歧義時(shí),系統(tǒng)根據(jù)用戶個(gè)人歷史數(shù)據(jù)矯正檢索結(jié)果,對(duì)于自我矯正后仍有歧義的檢索結(jié) 果,系統(tǒng)根據(jù)有歧義的檢索結(jié)果生成提示語句,提示用戶重新輸入檢索詞,這樣避免了用戶 在不知自己檢索詞哪里出問題的情況下一次次輸入不合適的檢索詞,提高了檢索效率。
[0014] 在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進(jìn)。
[0015] 進(jìn)一步,一種智能語義檢索系統(tǒng),還包括個(gè)性化歷史記錄庫(kù),所述個(gè)性化歷史記錄 庫(kù),用于存儲(chǔ)個(gè)性化歷史記錄,所述個(gè)性化歷史記錄為個(gè)體用戶進(jìn)行智能語義檢索時(shí),輸入 的自然語言與生成的最終檢索結(jié)果的映射關(guān)系的記錄;
[0016] 所述驗(yàn)證模塊,還調(diào)取個(gè)性化歷史記錄,將個(gè)性化歷史記錄與結(jié)構(gòu)化知識(shí)進(jìn)行比 對(duì),根據(jù)比對(duì)結(jié)果生成驗(yàn)證結(jié)果。
[0017] 進(jìn)一步,一種智能語義檢索系統(tǒng),所述知識(shí)圖譜以O(shè)WL配置文件的形式存儲(chǔ),包括 基礎(chǔ)配置表和規(guī)則配置表,所述基礎(chǔ)配置表存儲(chǔ)根據(jù)電子商務(wù)網(wǎng)站的約束規(guī)則生成的商品 的屬性及其對(duì)應(yīng)的屬性值,所述規(guī)則配置表存儲(chǔ)商品屬性值之間的映射關(guān)系。
[0018] 進(jìn)一步,一種智能語義檢索系統(tǒng),所述驗(yàn)證模塊包括第一消歧單元和第二消歧單 元;
[0019] 所述第一消歧單元,用于調(diào)取知識(shí)圖譜,將知識(shí)圖譜與結(jié)構(gòu)化知識(shí)進(jìn)行第一次比 對(duì),如果比對(duì)結(jié)果為一致,則將第一次比對(duì)后的結(jié)構(gòu)化知識(shí)發(fā)送給第二消歧單元;如果比對(duì) 結(jié)果為不一致,則將所述結(jié)構(gòu)化知識(shí)進(jìn)行第一次消歧處理,并將第一次消歧處理后的結(jié)果 作為驗(yàn)證結(jié)果并輸出;
[0020] 所述第二消歧單元,用于調(diào)取個(gè)性化歷史記錄,將所述個(gè)性化歷史記錄與第一次 比對(duì)的結(jié)構(gòu)化知識(shí)進(jìn)行第二次比對(duì);如果第二次比對(duì)結(jié)果為一致,則將第二次比對(duì)后的結(jié) 構(gòu)化知識(shí)作為驗(yàn)證結(jié)果并輸出;如果第二次比對(duì)結(jié)果不一致,則將其進(jìn)行第二次消歧處理 后作為驗(yàn)證結(jié)果并輸出。
[0021] 進(jìn)一步,一種智能語義檢索系統(tǒng),所述意圖生成模塊包括交叉檢測(cè)單元和映射檢 測(cè)單元;
[0022] 所述交叉檢測(cè)處理單元,用于根據(jù)用戶輸入的自然語言中文字的字符定位判斷驗(yàn) 證結(jié)果是否有交叉,如果判定驗(yàn)證結(jié)果有交叉,根據(jù)用戶輸入的自然語言對(duì)有交叉的驗(yàn)證 結(jié)果進(jìn)行修正,將修正后的結(jié)果生成商品列表,作為最終檢索結(jié)果并輸出,如果判定驗(yàn)證結(jié) 果無交叉,則將所述驗(yàn)證結(jié)果發(fā)送至映射檢測(cè)單元;
[0023] 所述映射檢測(cè)單元,用于檢測(cè)驗(yàn)證結(jié)果中的商品屬性的取值是否映射正確,如果 是,則根據(jù)驗(yàn)證結(jié)果生成商品列表,作為最終檢索結(jié)果并輸出;如果否,則將驗(yàn)證結(jié)果發(fā)送 至對(duì)話模塊。
[0024]-種智能語義檢索方法,包括以下步驟:
[0025] 步驟1 :從知識(shí)庫(kù)中加載知識(shí)圖譜,所述知識(shí)圖譜包括商品的屬性及其屬性值以 及商品屬性值之間的映射關(guān)系;
[0026] 步驟2 :從加載完成的知識(shí)圖譜中提取商品屬性值,根據(jù)商品屬性值或商品屬性 值和商品屬性值之間的映射關(guān)系生成抽取規(guī)則;
[0027] 步驟3 :獲取用戶輸入的自然語言,將抽取規(guī)則與用戶輸入的自然語言進(jìn)行匹配, 生成結(jié)構(gòu)化知識(shí);
[0028] 步驟4:調(diào)取知識(shí)圖譜,將知識(shí)圖譜與結(jié)構(gòu)化知識(shí)進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果生成驗(yàn) 證結(jié)果;
[0029] 步驟5 :檢測(cè)驗(yàn)證結(jié)果中的商品屬性的取值是否有歧義,如果是,則執(zhí)行步驟6;如 果否,則根據(jù)驗(yàn)證結(jié)果生成商品列表,作為最終檢索結(jié)果并輸出,結(jié)束檢索流程;
[0030] 步驟6 :根據(jù)有歧義的驗(yàn)證結(jié)果生成提示語句,并輸出提示語句;
[0031] 步驟7:再次獲取用戶重新輸入的自然語言,并執(zhí)行步驟3。
[0032] 進(jìn)一步,一種智能語義檢索方法,步驟3還包括調(diào)取個(gè)性化歷史記錄,將個(gè)性化歷 史記錄與結(jié)構(gòu)化知識(shí)進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果生成驗(yàn)證結(jié)果;所述個(gè)性化歷史記錄為個(gè)體 用戶進(jìn)行智能語義檢索時(shí),輸入的自然語言與生成的最終檢索結(jié)果的映射關(guān)系的記錄。
[0033] 進(jìn)一步,一種智能語義檢索方法,所述步驟1還包括:在知識(shí)庫(kù)中預(yù)先存儲(chǔ)知識(shí)圖 譜;所述知識(shí)圖譜以O(shè)WL配置文件的形式存儲(chǔ),包括基礎(chǔ)配置表和規(guī)則配置表,所述基礎(chǔ)配 置表存儲(chǔ)根據(jù)電子商務(wù)網(wǎng)站的約束規(guī)則生成的商品的屬性及其對(duì)應(yīng)的屬性值,所述規(guī)則配 置表存儲(chǔ)商品屬性值之間的映射關(guān)系。
[0034] 進(jìn)一步,一種智能語義檢索方法,所述步驟4具體為:
[0035] 步驟41:調(diào)取知識(shí)圖譜,將知識(shí)圖譜與結(jié)構(gòu)化知識(shí)進(jìn)行第一次比對(duì),如果比對(duì)結(jié) 果為一致,則執(zhí)行步驟42;如果比對(duì)結(jié)果為不一致,則將所述結(jié)構(gòu)化知識(shí)進(jìn)行第一次消歧 處理,并將第一次消歧處理后的結(jié)果作為驗(yàn)證結(jié)果并輸出,執(zhí)行步驟5;
[0036] 步驟42:調(diào)取個(gè)性化歷史記錄,將所述個(gè)性化歷史記錄與第一次比對(duì)后的結(jié)構(gòu)化 知識(shí)進(jìn)行第二次比對(duì),如果第二次比對(duì)結(jié)果為一致,則將第二次比對(duì)后的結(jié)構(gòu)化知識(shí)作為 驗(yàn)證結(jié)果并輸出,執(zhí)行步驟5;如果第二次比對(duì)結(jié)果不一致,則將其進(jìn)行第二次消歧處理后 作為驗(yàn)證結(jié)果并輸出,執(zhí)彳丁步驟5。
[0037] 進(jìn)一步,一種智能語義檢索方法,所述步驟5具體為:
[0038] 步驟51 :根據(jù)用戶輸入的自然語言中文字的字符定位判斷驗(yàn)證結(jié)果是否有交叉, 如果判定驗(yàn)證結(jié)果有交叉,根據(jù)用戶輸入的自然語言對(duì)有交叉的驗(yàn)證結(jié)果進(jìn)行修正,將修 正后的結(jié)果生成商品列表,作為最終檢