国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      智能問答的方法、裝置及系統(tǒng)的制作方法

      文檔序號:10624812閱讀:326來源:國知局
      智能問答的方法、裝置及系統(tǒng)的制作方法
      【專利摘要】本申請實施例提供了一種智能問答的方法、裝置及系統(tǒng),其中所述方法包括:接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分詞處理,得到一個或多個第一分詞;基于所述一個或多個第一分詞,獲取與所述提問關(guān)鍵詞匹配的候選建議詞的集合,所述候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一分詞的詞;計算所述一個或多個第一分詞的權(quán)重;依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān)鍵詞與各候選建議詞的相似度;將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息返回所述客戶端。本申請實施例可以提升智能問答過程中的結(jié)果推薦準(zhǔn)確率。
      【專利說明】
      智能問答的方法、裝置及系統(tǒng)
      技術(shù)領(lǐng)域
      [0001] 本申請涉及信息推薦技術(shù)領(lǐng)域,特別是涉及一種智能問答的方法,W及,一種智能 問答的裝置,W及,一種智能問答系統(tǒng)。
      【背景技術(shù)】
      [0002] 隨著互聯(lián)網(wǎng)服務(wù)的日益發(fā)展,越來越多的互聯(lián)網(wǎng)企業(yè)需要提供在線客戶服務(wù)(簡 稱在線客服)來解決客戶的問題。很顯然,通過人工客服的方式不能應(yīng)對海量的用戶問答 請求,送就需要一種智能問答系統(tǒng)來通過自動回復(fù)的方式來解決用戶的訴求。智能問答系 統(tǒng)一種為了解決用戶的問答需求的系統(tǒng),其系統(tǒng)底層是一個排序系統(tǒng),通過理解用戶的提 問來為用戶推薦比較合適的問題答案。
      [0003] 現(xiàn)有的智能問答系統(tǒng)的基本流程為:
      [0004] 1.通過用戶的問答如ery (關(guān)鍵詞)來檢索知識庫;
      [0005] 2.計算問答如e巧與知識庫中知識點title的相似度;
      [0006] 3.將相似度值最大的結(jié)果返回給用戶。
      [0007] 其中在計算相似度時,涉及到對問答如ery進(jìn)行分詞得到分詞Term, W及每個分 詞Term的權(quán)重的問題。對于分詞Term的權(quán)重,現(xiàn)有的方法有:
      [0008] 方法一,不特殊設(shè)置權(quán)重,每個分詞Term的權(quán)重相同;
      [0009] 方法二,通過規(guī)則的方法,為不同類型的分詞Term設(shè)置不同的權(quán)重。
      [0010] 然而,目前的兩種分詞權(quán)重設(shè)置方式存在如下缺陷:
      [0011] (1)方法一不能把不同分詞Term有效區(qū)分開,使相似度計算結(jié)果區(qū)分度不夠高, 實際應(yīng)用效果不理想;
      [0012] (2)方法二中的人工設(shè)置權(quán)重的方法不方便進(jìn)行系統(tǒng)調(diào)優(yōu),需要經(jīng)過多輪迭代才 能找到合適的權(quán)重設(shè)置規(guī)則,構(gòu)建成本高;
      [0013] (3)方法二中,給不同類型Term設(shè)置不同權(quán)重,送種權(quán)重設(shè)置需要人工的先驗知 識,不能隨著系統(tǒng)的演進(jìn)進(jìn)行調(diào)整,維護(hù)成本高。
      [0014] W上Η種缺陷都有可能影響相似度的計算結(jié)果,進(jìn)而影響到智能問答系統(tǒng)最終的 推薦效果。
      [0015] 因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是:提供一種智能問 答機制,W提升智能問答過程中的結(jié)果推薦準(zhǔn)確率。

      【發(fā)明內(nèi)容】

      [0016] 本申請實施例所要解決的技術(shù)問題是提供一種智能問答的方法,W提升智能問答 過程中的結(jié)果推薦準(zhǔn)確率。
      [0017] 相應(yīng)的,本申請實施例還提供了一種智能問答的裝置及一種智能問答系統(tǒng),用W 保證上述方法的實現(xiàn)及應(yīng)用。
      [001引為了解決上述問題,本申請公開了一種智能問答的方法,所述方法包括:
      [0019] 接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分詞處理,得到一個或多 個第一分詞;
      [0020] 基于所述一個或多個第一分詞,獲取與所述提問關(guān)鍵詞匹配的候選建議詞的集 合,所述候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一分詞的詞;
      [0021] 計算所述一個或多個第一分詞的權(quán)重;
      [0022] 依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān)鍵詞與各候選建議詞的相 似度;
      [0023] 將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息返回所述客戶端。
      [0024] 優(yōu)選地,所述依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān)鍵詞與各候 選建議詞的相似度的步驟包括:
      [00巧]對所述候選建議詞的集合中的候選建議詞進(jìn)行分詞處理,得到對應(yīng)的一個或多個 第二分詞;
      [0026] 計算所述一個或多個第二分詞的權(quán)重;
      [0027] 將所述一個或多個第一分詞的權(quán)重,組織成所述提問關(guān)鍵詞的向量信息;
      [0028] 將每個候選建議詞對應(yīng)的一個或多個第二分詞的權(quán)重,組織成對應(yīng)的候選建議詞 的向量信息;
      [0029] 采用所述提問關(guān)鍵詞的向量信息與各候選建議詞的向量信息,計算所述提問關(guān)鍵 詞與各候選建議詞的相似度。
      [0030] 優(yōu)選地,所述計算所述一個或多個第一分詞的權(quán)重的步驟包括:
      [0031] 分別提取所述第一分詞的多個特征信息;
      [0032] 獲取所述多個特征信息的權(quán)重;
      [0033] 匯總所述多個特征信息的權(quán)重,得到所述第一分詞的權(quán)重。
      [0034] 優(yōu)選地,所述獲取所述多個特征信息的權(quán)重的步驟為:
      [0035] 加載預(yù)先生成的權(quán)重計算模型,所述權(quán)重計算模型包括多個特征信息及對應(yīng)的權(quán) 重的映射關(guān)系;
      [0036] 在所述權(quán)重計算模型中查詢所述特征信息的權(quán)重。
      [0037] 優(yōu)選地,所述權(quán)重計算模型按照如下方式生成:
      [0038] 查詢?nèi)罩居涗?,獲取在先提問關(guān)鍵詞及對應(yīng)的建議詞,其中,所述建議詞為預(yù)設(shè)數(shù) 據(jù)庫中包含所述在先提問關(guān)鍵詞的一個或多個分詞的詞;
      [0039] 依據(jù)所述在先提問關(guān)鍵詞及對應(yīng)的建議詞,構(gòu)建所述在先提問關(guān)鍵詞與所述建議 詞的組合;
      [0040] 基于所述在先提問關(guān)鍵詞與所述建議詞的組合,映射出分詞組合,所述分詞組合 為對所述在先提問關(guān)鍵詞進(jìn)行分詞處理及對所述建議詞進(jìn)行分詞處理后,得到的分詞的組 合;
      [0041] 針對所說分詞組合中的每個分詞,分別提取預(yù)置的多個特征信息,形成特征信息 組合;
      [0042] 對所述特征信息組合進(jìn)行模型訓(xùn)練,得到權(quán)重計算模型。
      [0043] 優(yōu)選地,所述基于所述在先提問關(guān)鍵詞與所述建議詞的組合,映射出分詞組合的 步驟包括:
      [0044] 基于所述在先提問關(guān)鍵詞與所述建議詞的組合,分別對所述在先提問關(guān)鍵詞及所 述建議詞進(jìn)行分詞處理,得到分詞列表;
      [0045] 基于所述分詞列表,獲得相同分詞列表及不同分詞列表,并定義相同分詞與不同 分詞列表的關(guān)系為;相同分詞列表〉不同分詞列表;
      [0046] 結(jié)合所述相同分詞列表與所述不同分詞列表的關(guān)系,構(gòu)建分詞組合。
      [0047] 優(yōu)選地,所述對所述特征信息組合進(jìn)行模型訓(xùn)練,得到權(quán)重計算模型的步驟包 括:
      [0048] 將所述特征信息組合轉(zhuǎn)換為特定樣本格式的特征信息組合;
      [0049] 通過排序向量空間模型算法RankSVM對所述特定樣本格式的特征信息組合進(jìn)行 建模,獲得權(quán)重計算模型。
      [0050] 優(yōu)選地,所述特征信息至少包括如下信息:詞頻TF、逆文檔頻率IDF、TF*IDF、 BM25、分詞長度LEN、類目信息、詞性信息。
      [0051] 優(yōu)選地,在所述對所述特征信息組合進(jìn)行模型訓(xùn)練,得到權(quán)重計算模型的步驟之 后,還包括:
      [0052] 依據(jù)所述日志記錄更新所述權(quán)重計算模型。
      [0053] 優(yōu)選地,所述將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息返回所 述客戶端的步驟包括:
      [0054] 將所述相似度排序在前的N個候選建議詞及對應(yīng)的答案信息返回所述客戶端,其 中N為正整數(shù);
      [00財 或者,
      [0056] 將所述相似度大于預(yù)設(shè)闊值的候選建議詞及對應(yīng)的答案信息返回所述客戶端。
      [0057] 本申請還公開了一種智能問答的裝置,所述裝置包括:
      [0058] 第一分詞模塊,用于接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分詞 處理,得到一個或多個第一分詞;
      [0059] 候選建議詞獲取模塊,用于基于所述一個或多個第一分詞,獲取與所述提問關(guān)鍵 詞匹配的候選建議詞的集合,所述候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一分 詞的詞;
      [0060] 第一權(quán)重計算模塊,用于計算所述一個或多個第一分詞的權(quán)重;
      [0061] 相似度計算模塊,用于依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān)鍵 詞與各候選建議詞的相似度;
      [0062] 信息返回模塊,用于將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息 返回所述客戶端。
      [0063] 優(yōu)選地,所述相似度計算模塊包括:
      [0064] 第二分詞子模塊,用于對所述候選建議詞的集合中的候選建議詞進(jìn)行分詞處理, 得到對應(yīng)的一個或多個第二分詞;
      [0065] 第二權(quán)重計算子模塊,用于計算所述一個或多個第二分詞的權(quán)重;
      [0066] 第一向量組織子模塊,用于將所述一個或多個第一分詞的權(quán)重,組織成所述提問 關(guān)鍵詞的向量信息;
      [0067] 第二向量組織子模塊,用于將每個候選建議詞對應(yīng)的一個或多個第二分詞的權(quán) 重,組織成對應(yīng)的候選建議詞的向量信息;
      [0068] 計算子模塊,用于采用所述提問關(guān)鍵詞的向量信息與各候選建議詞的向量信息, 計算所述提問關(guān)鍵詞與各候選建議詞的相似度。
      [0069] 優(yōu)選地,所述第一權(quán)重計算模塊包括:
      [0070] 特征提取子模塊,用于分別提取所述第一分詞的多個特征信息;
      [0071] 特征權(quán)重獲取子模塊,用于獲取所述多個特征信息的權(quán)重;
      [0072] 匯總子模塊,用于匯總所述多個特征信息的權(quán)重,得到所述第一分詞的權(quán)重。
      [0073] 優(yōu)選地,所述特征權(quán)重獲取子模塊還用于:
      [0074] 加載預(yù)先生成的權(quán)重計算模型,所述權(quán)重計算模型包括多個特征信息及對應(yīng)的權(quán) 重的映射關(guān)系;
      [00巧]在所述權(quán)重計算模型中查詢所述特征信息的權(quán)重。
      [0076] 優(yōu)選地,所述裝置還包括:
      [0077] 信息提取模塊,用于查詢?nèi)罩居涗?,獲取在先提問關(guān)鍵詞及對應(yīng)的建議詞,其中, 所述建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述在先提問關(guān)鍵詞的一個或多個分詞的詞;
      [0078] 第一組合構(gòu)建模塊,用于依據(jù)所述在先提問關(guān)鍵詞及對應(yīng)的建議詞,構(gòu)建所述在 先提問關(guān)鍵詞與所述建議詞的組合;
      [0079] 第二組合構(gòu)建模塊,用于基于所述在先提問關(guān)鍵詞與所述建議詞的組合,映射出 分詞組合,所述分詞組合為對所述在先提問關(guān)鍵詞進(jìn)行分詞處理及對所述建議詞進(jìn)行分詞 處理后,得到的分詞的組合;
      [0080] 第Η組合構(gòu)建模塊,用于針對所說分詞組合中的每個分詞,分別提取預(yù)置的多個 特征信息,形成特征信息組合;
      [0081] 模型訓(xùn)練模塊,用于對所述特征信息組合進(jìn)行模型訓(xùn)練,得到權(quán)重計算模型。
      [0082] 優(yōu)選地,所述第二組合構(gòu)建模塊包括:
      [0083] 分詞列表獲取子模塊,用于基于所述在先提問關(guān)鍵詞與所述建議詞的組合,分別 對所述在先提問關(guān)鍵詞及所述建議詞進(jìn)行分詞處理,得到分詞列表;
      [0084] 關(guān)系定義子模塊,用于基于所述分詞列表,獲得相同分詞列表及不同分詞列表,并 定義相同分詞與不同分詞列表的關(guān)系為;相同分詞列表〉不同分詞列表;
      [0085] 構(gòu)建子模塊,用于結(jié)合所述相同分詞列表與所述不同分詞列表的關(guān)系,構(gòu)建分詞 組合。
      [0086] 優(yōu)選地,所述模型訓(xùn)練模塊包括:
      [0087] 格式轉(zhuǎn)換子模塊,用于將所述特征信息組合轉(zhuǎn)換為特定樣本格式的特征信息組 合;
      [0088] 訓(xùn)練子模塊,用于通過排序向量空間模型算法RankSVM對所述特定樣本格式的特 征信息組合進(jìn)行建模,獲得權(quán)重計算模型。
      [008引優(yōu)選地,所述特征信息至少包括如下信息:詞頻TF、逆文檔頻率IDF、TF*IDF、 BM25、分詞長度LEN、類目信息、詞性信息。
      [0090] 優(yōu)選地,所述裝置還包括:
      [0091] 更新模塊,用于依據(jù)所述日志記錄更新所述權(quán)重計算模型。
      [0092] 優(yōu)選地,所述信息返回模塊包括:
      [0093] 第一返回子模塊,用于將所述相似度排序在前的N個候選建議詞及對應(yīng)的答案信 息返回所述客戶端,其中N為正整數(shù);
      [0094] 或者,
      [0095] 第二返回子模塊,用于將所述相似度大于預(yù)設(shè)闊值的候選建議詞及對應(yīng)的答案信 息返回所述客戶端。
      [0096] 本申請實施例還公開了一種智能問答系統(tǒng),所述系統(tǒng)包括客戶端和服務(wù)器,其中,
      [0097] 所述客戶端包括:
      [0098] 信息發(fā)送模塊,用于向所述服務(wù)器發(fā)送提問關(guān)鍵詞;
      [0099] 信息展現(xiàn)模塊,用于接收所述服務(wù)器返回的候選建議詞及對應(yīng)的答案信息,并展 現(xiàn)所述候選建議詞及對應(yīng)的答案信息;
      [0100] 所述服務(wù)器包括:
      [0101] 第一分詞模塊,用于接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分詞 處理,得到一個或多個第一分詞;
      [0102] 候選建議詞獲取模塊,用于基于所述一個或多個第一分詞,獲取與所述提問關(guān)鍵 詞匹配的候選建議詞的集合,所述候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一分 詞的詞;
      [0103] 第一權(quán)重計算模塊,用于計算所述一個或多個第一分詞的權(quán)重;
      [0104] 相似度計算模塊,用于依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān)鍵 詞與各候選建議詞的相似度;
      [0105] 信息返回模塊,用于將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息 返回所述客戶端。
      [0106] 與【背景技術(shù)】相比,本申請實施例包括W下優(yōu)點:
      [0107] 在本申請實施例中,當(dāng)接收到提問關(guān)鍵詞W后,可W對該提問關(guān)鍵詞進(jìn)行分詞,得 到一個或多個第一分詞,進(jìn)而獲取與提問關(guān)鍵詞匹配的候選建議詞的集合,并計算每個第 一分詞的權(quán)重,然后依據(jù)該一個或多個第一分詞的權(quán)重,計算提問關(guān)鍵詞與各候選建議詞 的相似度,展現(xiàn)相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息。本申請實施例針對 不同的第一分詞,分別計算其權(quán)重,能有效的將不同的第一分詞區(qū)分開,進(jìn)而提高相似度計 算結(jié)果的區(qū)分度,提高了建議詞推薦的準(zhǔn)確率。
      [010引另外,本申請實施例通過查詢?nèi)罩居涗浿杏脩粜袨榈挠涗?,獲取在先提問關(guān)鍵詞 與對應(yīng)的建議詞,基于在先提問關(guān)鍵詞與對應(yīng)的建議詞構(gòu)建在先提問關(guān)鍵詞與建議詞的組 合,并通過分詞處理得到分詞組合,W及,對分詞組合進(jìn)行特征信息提取,得到特征信息組 合,W特征信息組合作為訓(xùn)練樣本進(jìn)行模型訓(xùn)練,避免了人工構(gòu)建采集樣本并人工根據(jù)樣 本進(jìn)行模型訓(xùn)練的麻煩,減少了人工參與的成本,自動化樣本采集的過程及模型訓(xùn)練過程 還提升了模型訓(xùn)練效率和準(zhǔn)確率。
      [0109] 進(jìn)一步的,本申請實施例可W通過預(yù)先建立的權(quán)重計算模型獲得第一分詞的權(quán) 重,權(quán)重計算模型因日志記錄的更新而更新,無需人工的先驗知識,方便系統(tǒng)調(diào)優(yōu)的同時, 節(jié)省了人工成本及構(gòu)建維護(hù)成本。
      【附圖說明】
      [0110] 圖1是本申請的一種智能問答的方法實施例一的步驟流程圖;
      [0111] 圖2是本申請的一種權(quán)重計算模型建立方法實施例的步驟流程圖;
      [0112] 圖3是本申請的一種智能問答的方法實施例二的步驟流程圖;
      [0113] 圖4是本申請的一種智能問答的裝置實施例的結(jié)構(gòu)框圖;
      [0114] 圖5是本申請的一種智能問答系統(tǒng)實施例的結(jié)構(gòu)框圖。
      【具體實施方式】
      [0115] 為使本申請的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實 施方式對本申請作進(jìn)一步詳細(xì)的說明。
      [0116] 本申請實施例可W應(yīng)用于在線智能問答的場景,例如,應(yīng)用于智能問答系統(tǒng) (如estion Answering System, QA)中。智能問答系統(tǒng)W-問一答形式,精確的定位用戶所 需要的提問知識,通過與用戶進(jìn)行交互,為用戶提供個性化的信息服務(wù),節(jié)約人力資源,提 高信息處理的自動性,提高信息處理效率。
      [0117] 參照圖1,示出了本申請的一種智能問答的方法實施例一的步驟流程圖,具體可W 包括如下步驟:
      [0118] 步驟101,接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分詞處理,得到 一個或多個第一分詞;
      [0119] 步驟102,基于所述一個或多個第一分詞,獲取與所述提問關(guān)鍵詞匹配的候選建議 詞的集合,所述候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一分詞的詞;
      [0120] 步驟103,計算所述一個或多個第一分詞的權(quán)重;
      [0121] 步驟104,依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān)鍵詞與各候選建 議詞的相似度;
      [0122] 步驟105,將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息返回所述 客戶端。
      [0123] 在本申請實施例中,當(dāng)接收到客戶端發(fā)送的提問關(guān)鍵詞W后,可W對該提問關(guān)鍵 詞進(jìn)行分詞,得到一個或多個第一分詞,進(jìn)而基于該一個或多個第一分詞獲取與提問關(guān)鍵 詞匹配的候選建議詞的集合,其中,候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一 分詞的詞。計算每個第一分詞的權(quán)重,然后依據(jù)該一個或多個第一分詞的權(quán)重,計算提問關(guān) 鍵詞與各候選建議詞的相似度,并將相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息 返回客戶端,W在客戶端中進(jìn)行展現(xiàn)。本申請實施例針對不同的第一分詞,分別計算其權(quán) 重,能有效的將不同的第一分詞區(qū)分開,進(jìn)而提高相似度計算結(jié)果的區(qū)分度,提高了建議詞 推薦的準(zhǔn)確率。
      [0124] W下先對本申請的權(quán)重計算模型建立過程進(jìn)行說明。參照圖2,示出了本申請的一 種權(quán)重計算模型建立方法實施例的步驟流程圖,具體可W包括如下步驟:
      [01巧]步驟201,查詢?nèi)罩居涗?,獲取在先提問關(guān)鍵詞及對應(yīng)的建議詞;
      [0126] 在具體實現(xiàn)中,日志記錄可W是本申請的服務(wù)器中存儲的訪問日志記錄和/或點 擊日志記錄,該訪問日志記錄是記錄用戶在服務(wù)器中的預(yù)設(shè)時間段內(nèi)的訪問行為的歷史數(shù) 據(jù),該點擊日志記錄是記錄用戶在服務(wù)器中預(yù)設(shè)時間段內(nèi)的點擊行為的歷史數(shù)據(jù)。
      [0127] 可W通過查詢?nèi)罩居涗泚慝@得服務(wù)器中所有的在先提問關(guān)鍵詞如ery及對應(yīng)的 建議詞。其中,日志記錄除了包含在先提問關(guān)鍵詞及對應(yīng)的建議詞w外,還可w包括提問時 間、提問用戶標(biāo)識等信息。
      [012引所述建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述在先提問關(guān)鍵詞的一個或多個分詞的詞。具 體來說,建議詞是服務(wù)器根據(jù)在先提問關(guān)鍵詞匹配出的與在先提問關(guān)鍵詞對應(yīng)的推薦詞或 關(guān)聯(lián)詞,可W是包含在先提問關(guān)鍵詞的部分或全部分詞的詞,該建議詞是預(yù)先存儲在預(yù)設(shè) 數(shù)據(jù)庫中的,具有關(guān)聯(lián)的答案信息。
      [0129] 例如,在先提問關(guān)鍵詞是"余額寶提現(xiàn)",則建議詞可W是"余額寶提現(xiàn)失敗"、"余 額寶如何提現(xiàn)"、"余額寶定期提現(xiàn)如何設(shè)置"等等。
      [0130] 步驟202,依據(jù)所述在先提問關(guān)鍵詞及對應(yīng)的建議詞,構(gòu)建所述在先提問關(guān)鍵詞與 所述建議詞的組合;
      [0131] 在本申請實施例中,可W依據(jù)用戶對建議詞的點擊行為來構(gòu)建在先提問關(guān)鍵詞與 對應(yīng)的建議詞的組合。具體來說,建議詞可W具有關(guān)聯(lián)的入口信息,點擊該入口信息可W引 導(dǎo)用戶進(jìn)入答案信息的頁面,在獲得建議詞W后,可W將該入口信息W及建議詞的組合W 列表的形式展現(xiàn)給用戶,用戶對某個入口信息的點擊便產(chǎn)生了點擊行為。
      [0132] 在獲得在先提問關(guān)鍵詞W及對應(yīng)的多個建議詞W后,統(tǒng)計出對于一個在先提問關(guān) 鍵詞,它對應(yīng)的建議詞是否被點擊,若被點擊,則構(gòu)建在先提問關(guān)鍵詞與建議詞的組合,送 種組合簡稱如ery的pair對。
      [0133] 例如,對于在先提問關(guān)鍵詞如ery A,它對應(yīng)的建議詞可W包括A、B、C Η個,如果 建議詞A被點擊,建議詞Β及建議詞C未被點擊,則得到的在先提問關(guān)鍵詞與對應(yīng)的建議詞 的組合(如ery的pair對)可W為;在先提問關(guān)鍵詞如ery A〉建議詞A〉建議詞B&&建議 詞C。
      [0134] 步驟203,基于所述在先提問關(guān)鍵詞與所述建議詞的組合,映射出分詞組合;
      [0135] 其中,所述分詞組合為對上述的如ery的pair對中的在先提問關(guān)鍵詞進(jìn)行分詞處 理及對各個建議詞進(jìn)行分詞處理后,得到的分詞的組合。具體而言,在本申請實施例的一種 優(yōu)選實施方式中,步驟203可W包括如下過程:
      [0136] (1)基于在先提問關(guān)鍵詞與建議詞的組合,分別對在先提問關(guān)鍵詞及建議詞進(jìn)行 分詞處理,得到分詞列表;
      [0137] 例如,針對上例的pair對;在先提問關(guān)鍵詞如ery A〉建議詞A〉建議詞B&&建議 詞C,若如ery A為"余額寶提現(xiàn)",建議詞A為"余額寶提現(xiàn)失敗",建議詞B為"余額寶如 何提現(xiàn)",建議詞C為"余額寶定期提現(xiàn)如何設(shè)置",其分詞處理后得到的分詞列表(term列 表)如下表1所不:
      [013 引
      [0139] 表 1
      [0140] 下面介紹幾種分詞方法:
      [0141] 1、基于字符串匹配的分詞方法;是指按照一定的策略將待分析的漢字串與一個預(yù) 置的機器詞典中的詞條進(jìn)行匹配,若在詞典中找到某個字符串,則匹配成功(識別出一個 詞)。實際使用的分詞系統(tǒng),都是把機械分詞作為一種初分手段,還需通過利用各種其它的 語言信息來進(jìn)一步提高切分的準(zhǔn)確率。
      [0142] 2、基于特征掃描或標(biāo)志切分的分詞方法;是指優(yōu)先在待分析字符串中識別和切分 出一些帶有明顯特征的詞,W送些詞作為斷點,可將原字符串分為較小的串再來進(jìn)機械分 詞,從而減少匹配的錯誤率;或者將分詞和詞類標(biāo)注結(jié)合起來,利用豐富的詞類信息對分詞 決策提供幫助,并且在標(biāo)注過程中又反過來對分詞結(jié)果進(jìn)行檢驗、調(diào)整,從而提高切分的準(zhǔn) 確率。
      [0143] 3、基于理解的分詞方法;是指通過讓計算機模擬人對句子的理解,達(dá)到識別詞的 效果。其基本思想就是在分詞的同時進(jìn)行句法、語義分析,利用句法信息和語義信息來處理 歧義現(xiàn)象。它通常包括Η個部分:分詞子系統(tǒng)、句法語義子系統(tǒng)、總控部分。在總控部分的 協(xié)調(diào)下,分詞子系統(tǒng)可W獲得有關(guān)詞、句子等的句法和語義信息來對分詞歧義進(jìn)行判斷,即 它模擬了人對句子的理解過程。送種分詞方法需要使用大量的語言知識和信息。
      [0144] 4、基于統(tǒng)計的分詞方法;是指中文信息中由于字與字相鄰共現(xiàn)的頻率或概率能夠 較好的反映成詞的可信度,所W可W對語料中相鄰共現(xiàn)的各個字的組合的頻度進(jìn)行統(tǒng)計, 計算它們的互現(xiàn)信息,W及計算兩個漢字X、Υ的相鄰共現(xiàn)概率。互現(xiàn)信息可W體現(xiàn)漢字之 間結(jié)合關(guān)系的緊密程度。當(dāng)緊密程度高于某一個闊值時,便可認(rèn)為此字組可能構(gòu)成了一個 詞。送種方法只需對語料中的字組頻度進(jìn)行統(tǒng)計,不需要切分詞典。
      [0145] 似基于分詞列表,獲得相同分詞列表及不同分詞列表,并定義相同分詞與不同分 詞列表的關(guān)系為:相同分詞列表〉不同分詞列表;
      [0146] 具體來說,相同分詞是指在先提問關(guān)鍵詞與各建議詞的相同詞單元,不同分詞是 指在先提問關(guān)鍵詞與各建議詞的不同詞單元。例如上述表1中,如ery A與建議詞A的相 同分詞為"余額寶"、"提現(xiàn)",不同分詞為"失敗";如ery A與建議詞B的相同分詞為"余額 寶"、"提現(xiàn)",不同分詞為"如何";如ery A與建議詞C的相同分詞為"余額寶"、"提現(xiàn)",不同 分詞為"定期"、"如何"、"設(shè)置"。
      [0147] 本申請實施例對于相同分詞列表可W定義為same_te;rms (如eryA,如eryB), 表示如eryA與如eryB中相同Term的集合;對于不同分詞列表可W定義為diff_ terms (如eryA,如eryB),表不如eryA與如eryB中不同Term的集合。例如,針對上例,same_ terms (如eryA,建議詞A) = {余額寶、提現(xiàn)},diff_te;rms (如eryA,建議詞A) = {失敗}; same_te;rms (如eryA,建議詞 B) = {余額寶、提現(xiàn)},diff_te;rms (如eryA,建議詞 B) = {如 何} ;same_te;rms (如eryA,建議詞 C) = {余額寶、提現(xiàn)},diff_te;rms (如eryA,建議詞 C)= {定期、如何、設(shè)置}。
      [014引 (3)結(jié)合相同分詞列表與不同分詞列表的關(guān)系,構(gòu)建分詞組合。
      [0149]結(jié)合 same_te;rms (如eryA,如eryB)〉diff_te;rms (如eryA,如eryB),構(gòu)建分詞組合 termXHermYHermZI;其中,Χ、Υ、Ζ表示分詞)。例如,針對上例,得到的分詞組合可W包括: [0150] A ;余額寶〉失敗〉如何
      [OW] B;提現(xiàn)〉失敗〉如何
      [0152] C;余額寶〉失敗〉定期
      [0153] D;提現(xiàn)〉失敗〉定期
      [0154] E;余額寶〉失敗〉設(shè)置
      [0155] F;提現(xiàn)〉失敗〉設(shè)置
      [0156] 上述分詞組合A-F可W組成分詞組合的集合,即term pair對集合。
      [0157] 步驟204,針對所說分詞組合中的每個分詞,分別提取預(yù)置的多個特征信息,形成 特征信息組合;
      [0158] 獲得分詞組合后,可W基于每個分詞提取出一些特定維度的歷史特征信息,該特 征信息可W表現(xiàn)為特征分值。作為一種示例,該特征信息至少可W包括如下信息:詞頻TF、 逆文檔頻率IDF、TF*IDF、BM25、分詞長度LEN、類目信息、詞性信息。
      [0159] 對每個特征信息說明如下:
      [0160] TF(te;rm化equency,詞頻):每個分詞term在建議詞中出現(xiàn)的次數(shù);
      [016。 IDF(Inverse Document Rrequen巧,逆向文件頻率):log(有多少個建議詞中出現(xiàn) 過該分詞term);
      [0162] TFIDF:TF*IDF ;
      [0163] BM25 ;常用的BM25算法得出;
      [0164] LEN:分詞term的長度;
      [0165] 類目信息:即類目賭,是衡量分詞term的類目分布情況(預(yù)設(shè)數(shù)據(jù)庫中有類目信 息),其中,賭的定義;S(te;rm) =-sum(p 1〇甜),其中P是term屬于某個類目的概率,例如, 在電商行業(yè)中,類目信息可W為服裝類、食品類、電子類等。
      [0166] 詞性信息;分詞term的詞性(產(chǎn)品詞、修飾詞、停頓詞等),其中,可W通過通用的 分詞工具來獲得分詞term的詞性;
      [0167] 應(yīng)用于本申請實施例,可W將分詞組合中的每個分詞,用對應(yīng)的特征信息的 集合表示,得到特征信息組合。也就是說,對于分詞組合termAHermB,可W表示為 feature1_A, feature2_A, ..., featureN_A>featurel_B> feature2_B. · · · . featureN_B ;其 中,featurel_A, fea1:ure2_A, . . . , fea1:ureN_A 是 Term 詞 A 對應(yīng)的特征列表,featurel_ B, feature2_B, . . . , fea1:ureN_B 是 Term 詞 B 對應(yīng)的特征列表。
      [016引例如,對于上述分詞組合中的"余額寶〉失敗",若"余額寶"的特征信息列表為(tf =1,i壯=0. 25, TFIDF = 1. 5, BM25 = 3. 2, LEN = 3),"失敗"的特征信息列表為(tf = 3, i壯=0. 3,TFIDF = 2,BM25 = 1. 5,LEN = 2),則。余額寶〉失敗"表示為(1,0. 25, 1. 5, 3. 2, 3)〉(3, 0.3, 2, 1.5,2)。
      [0169] 步驟205,對所述特征信息組合進(jìn)行模型訓(xùn)練,得到權(quán)重計算模型。
      [0170] 對于分詞組合每個分詞都用對應(yīng)的特征信息集合表示,得到特征信息組合W后, 可W將該特征信息組合作為訓(xùn)練樣本集合進(jìn)行模型訓(xùn)練,得到權(quán)重計算模型。在具體實現(xiàn) 中,可W采用排序向量空間模型算法RankSVM來進(jìn)行模型訓(xùn)練。
      [017。 RankSVM是一種pair-wise的Rank學(xué)習(xí)算法,它可W對一組term詞的排序樣本進(jìn) 行學(xué)習(xí),獲得到排序模型(MocM)。因為RankSVM是基于SVM進(jìn)行開發(fā)的,它支持各種不同 的核函數(shù)進(jìn)行分類,包括高斯核、多項式核、線性核等。其中,高斯核和多項式核可W將低維 問題轉(zhuǎn)化為高維問題,從而提高模型的準(zhǔn)確率,但是送兩種核的模型訓(xùn)練速度較慢,同時在 線上預(yù)測復(fù)雜度比較高;而線性核雖然泛化能力較弱,但是它訓(xùn)練速度較快,因此,本申請 實施例的模型訓(xùn)練優(yōu)選地使用線性核進(jìn)行。
      [0172] 在本申請實施例的一種優(yōu)選實施例中,步驟205可W包括如下子步驟:
      [0173] 子步驟S10,將所述特征信息組合轉(zhuǎn)換為特定樣本格式的特征信息組合;
      [0174] 在實際中,特定樣本格式可W為RankSVM所需的樣本格式。RankSVM所需的樣本格 式的特征信息組合可 W為;(1, featurel_A, fea1:ure2_A, . . . , fea1:ureN_A)、(0, fea1:urel_ B,feature2_B, . . . , featureN_B),
      [0Π 5] 其中,1,0表示該樣本的序關(guān)系,1代表的樣本優(yōu)于0代表的樣本。
      [0176] 子步驟S20,通過RankSVM對所述特定樣本格式的特征信息組合進(jìn)行建模,獲得權(quán) 重計算模型。
      [0177] 在具體實現(xiàn)中,通過RankSVM對特定樣本格式的特征信息組合進(jìn)行建模,得到的 權(quán)重計算模型為一組權(quán)重列表,送組權(quán)重列表是特征信息的權(quán)重組成的列表,特征信息的 權(quán)重表征每個特征信息在分類時的有效性,例如,得到的權(quán)重計算模型為{Wei曲t(tf)= 0.02,胖61曲1(1壯)=0.21,¥61曲1燈尸10巧=0.7,¥61曲1度125)=0.1,胖61曲1(1^腳= 0.引。
      [0178] 在實際中,可W設(shè)置一測試樣本對權(quán)重計算模型進(jìn)行準(zhǔn)確率檢驗,并不斷迭代,使 得權(quán)重計算模型的準(zhǔn)確率達(dá)到最優(yōu)。
      [0179] 另外,由于日志記錄是隨著用戶行為的變化而變化的,因此可W依據(jù)日志記錄更 新權(quán)重計算模型,使得權(quán)重計算模型隨著智能問答系統(tǒng)的演進(jìn)而調(diào)整,W降低對權(quán)重計算 模型的維護(hù)成本。
      [0180] 在本申請實施例中,通過查詢?nèi)罩居涗浿杏脩粜袨榈挠涗?,獲取在先提問關(guān)鍵詞 與對應(yīng)的建議詞,基于在先提問關(guān)鍵詞與對應(yīng)的建議詞構(gòu)建在先提問關(guān)鍵詞與建議詞的組 合,并通過分詞處理得到分詞組合,W及,對分詞組合進(jìn)行特征信息提取,得到特征信息組 合,W特征信息組合作為訓(xùn)練樣本進(jìn)行模型訓(xùn)練,避免了人工構(gòu)建采集樣本并人工根據(jù)樣 本進(jìn)行模型訓(xùn)練的麻煩,減少了人工參與的成本,自動化樣本采集的過程及模型訓(xùn)練過程 還提升了模型訓(xùn)練效率和準(zhǔn)確率。
      [0181] 參照圖3,示出了本申請的一種智能問答的方法實施例二的步驟流程圖,具體可W 包括如下步驟:
      [0182] 步驟301,接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分詞處理,得到 一個或多個第一分詞;
      [0183] 提問關(guān)鍵詞可W是用戶在客戶端提供的交互頁面中輸入的提問信息,客戶端接收 到用戶輸入的提問關(guān)鍵詞W后,依據(jù)提問關(guān)鍵詞生成提問請求,并將提問請求發(fā)送至服務(wù) 器。
      [0184] 服務(wù)器接收到提問關(guān)鍵詞W后,對提問關(guān)鍵詞進(jìn)行分詞處理,得到一個或多個第 一分詞。其中,此處對于提問關(guān)鍵詞的分詞處理的方式及下述對于候選建議詞的分詞方式, 均可W參照圖2實施例中的分詞處理方式,在此不再賞述了。
      [0185] 需要說明的是,服務(wù)器對提問關(guān)鍵詞執(zhí)行分詞處理W外,還可W進(jìn)行其他的預(yù)處 理,例如,去停止詞處理、錯誤矯正處理等。
      [0186] 步驟302,基于所述一個或多個第一分詞,獲取與所述提問關(guān)鍵詞匹配的候選建議 詞的集合;
      [0187] 服務(wù)器獲得一個或多個第一分詞W后,可W基于該一個或多個第一分詞,獲取與 提問關(guān)鍵詞匹配的候選建議詞的集合,候選建議詞可W為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多 個第一分詞的詞。具體來說,服務(wù)器側(cè)的預(yù)設(shè)數(shù)據(jù)庫中對于每個詞單元(即每個分詞term) 都存儲有對應(yīng)的候選建議詞(即每個term可W召回多個候選建議詞),則提問關(guān)鍵詞的所 有第一分詞對應(yīng)的候選建議詞組成該提問關(guān)鍵詞對應(yīng)的候選建議詞的集合,也就是說,候 選建議詞是包含部分或全部第一分詞的詞。
      [018引需要說明的是,對于獲取的所有候選建議詞,可能存在重復(fù)的詞,則本申請實施例 還可W對候選建議詞進(jìn)行去重處理。
      [0189] 例如,若提問關(guān)鍵詞為"余額寶提現(xiàn)",則第一分詞包括"余額寶"、"提現(xiàn)",在預(yù)設(shè) 數(shù)據(jù)庫查詢"余額寶"時獲得匹配的候選建議詞為"余額寶提現(xiàn)失敗"、"余額寶如何提現(xiàn)"、 "余額寶定期提現(xiàn)如何設(shè)置"、"余額寶是什么"等等,在預(yù)設(shè)數(shù)據(jù)庫查詢"提現(xiàn)"時獲得匹配 的候選建議詞為"余額寶提現(xiàn)失敗"、"余額寶如何提現(xiàn)"、"余額寶定期提現(xiàn)如何設(shè)置"、"怎 么提現(xiàn)"等等,則提問關(guān)鍵詞"余額寶提現(xiàn)"對應(yīng)的候選建議詞的集合為:"余額寶提現(xiàn)失 敗"、"余額寶如何提現(xiàn)"、"余額寶定期提現(xiàn)如何設(shè)置"、"余額寶是什么"、"怎么提現(xiàn)"(已經(jīng) 去掉重復(fù)的"余額寶提現(xiàn)失敗"、"余額寶如何提現(xiàn)"、"余額寶定期提現(xiàn)如何設(shè)置")。
      [0190] 步驟303,計算所述一個或多個第一分詞的權(quán)重;
      [0191] 獲得提問關(guān)鍵詞的一個或多個第一分詞W后,可W針對每個第一分詞,計算該第 一分詞的權(quán)重。在本申請的一種優(yōu)選實施例中,步驟303可W包括如下子步驟:
      [0192] 子步驟S11,分別提取所述第一分詞的多個特征信息;
      [0193] 在實際中,得到第一分詞后,可W獲取第一分詞的多個特征信息,該特征信息至少 包括如下信息的一種或多種:詞頻TF、逆文檔頻率IDF、TF*IDF、BM25、分詞長度LEN、類目信 息、詞性信息。其中,上述特征信息可W采用通用的方式獲取,本申請實施例對其獲取方式 無需加 W限制。
      [0194] 子步驟S12,獲取所述多個特征信息的權(quán)重;
      [0195] 獲取第一分詞的特征信息W后,可W進(jìn)一步獲取該特征信息的權(quán)重。在本申請的 一種優(yōu)選實施例中,子步驟S12進(jìn)一步可W包括如下子步驟:
      [0196] 子步驟S121,加載預(yù)先生成的權(quán)重計算模型;
      [0197] 應(yīng)用于本申請實施例,權(quán)重計算模型是在線下訓(xùn)練得到的模型,當(dāng)服務(wù)器接收到 提問關(guān)鍵詞后,加載該權(quán)重計算模型。
      [0198] 權(quán)重計算模型可W為一組特征信息的權(quán)重列表文件,保存了多個特征信息與對應(yīng) 的權(quán)重的映射關(guān)系。
      [0199] 子步驟S122,基于所述特征權(quán)重列表,查詢所述特征信息的權(quán)重。
      [0200] 加載權(quán)重計算模型后,可W在該權(quán)重計算模型中查詢該第一分詞對應(yīng)的特征信 息,W獲得每個特征信息的權(quán)重。
      [0201] 子步驟S13,匯總所述多個特征信息的權(quán)重,得到所述第一分詞的權(quán)重。
      [0202] 在具體實現(xiàn)中,第一分詞的權(quán)重是其所有特征信息的權(quán)重的總和。第一分詞的權(quán) 重可W采用如下公式計算:
      [0203]
      [0204] 其中,score是第一分詞的權(quán)重,fe£Tture_i是特征信息i,wei曲t_i是特征信息 fea1:ure_i 的權(quán)重。
      [020引例如,若第一分詞為。余額寶",其特征信息列表為(tf = 1,i壯=0. 25, TFIDF = 1. 5, BM25 = 3. 2, LEN = 3),則該第一分詞的權(quán)重是 1+0. 25+1. 5+3. 2+3 = 8. 95。
      [0206] 步驟304,分別對所述候選建議詞進(jìn)行分詞處理,得到對應(yīng)的一個或多個第二分 詞,并計算所述一個或多個第二分詞的權(quán)重;
      [0207] 在實際中,獲得多個候選建議詞后,可W對多個候選建議詞進(jìn)行分詞處理,得到各 個候選建議詞對應(yīng)的一個或多個第二分詞。
      [020引此處第二分詞的權(quán)重計算方法與上述第一分詞的權(quán)重計算方法相似,可W參照上 述第一分詞的權(quán)重計算過程,本申請實施例在此不再賞述了。
      [0209] 步驟305,將所述一個或多個第一分詞的權(quán)重,組織成所述提問關(guān)鍵詞的向量信 息,W及,將每個候選建議詞對應(yīng)的一個或多個第二分詞的權(quán)重,組織成對應(yīng)的候選建議詞 的向量信息;
      [0210] 獲得提問關(guān)鍵詞的一個或多個第一分詞的權(quán)重W后,可W根據(jù)第一分詞的權(quán)重, 組織提問關(guān)鍵詞的向量信息,例如,若提問關(guān)鍵詞是"支付寶提現(xiàn)",對其分詞處理后得到的 第一分詞分別是"支付寶"、"提現(xiàn)"。如果"支付寶"的權(quán)重是5. 5,"提現(xiàn)"的權(quán)重是5. 7,則 得到的提問關(guān)鍵詞的向量信息是巧.5,5. 7}。
      [0211] 候選建議詞的向量信息的組織方法可W參照上述提問關(guān)鍵詞的向量信息的組織 方法,在此不再賞述了。
      [0212] 步驟306,采用所述提問關(guān)鍵詞的向量信息與各候選建議詞的向量信息,計算所述 提問關(guān)鍵詞與各候選建議詞的相似度;
      [0213] 在具體實現(xiàn)中,相似度(即相關(guān)性得分)的計算方法可W采用余弦定理計算兩個 向量間的夾角的余弦值。具體計算過程如下:
      [0214] 假設(shè)提問關(guān)鍵詞a的向量為[xa,ya,za],候選建議詞的向量為[xb,yb,zb],則相 似度計算如下:
      [021 引
      [0216] 步驟307,將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息返回所述 客戶端。
      [0217] 應(yīng)用于本申請實施例,在計算了提問關(guān)鍵詞與各個候選建議詞的相似度W后,可 W將相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息返回客戶端,W在客戶端中進(jìn)行 展現(xiàn)。
      [021引在一種實施方式中,符合預(yù)設(shè)規(guī)則的候選建議詞可W為相似度排序在前的N個候 選建議詞。具體來說,在計算了提問關(guān)鍵詞與各個候選建議詞的相似度W后,可W按照相似 度由大到小的順序?qū)蜻x建議詞進(jìn)行排序,并獲取各候選建議詞對應(yīng)的答案信息,然后將 相似度排序在前N個的候選建議詞及對應(yīng)的答案信息發(fā)送至客戶端,W在客戶端中進(jìn)行展 現(xiàn)。例如,N為1時,則獲取相似度最大的候選建議詞及對應(yīng)的答案信息發(fā)送至客戶端,作 為基于提問關(guān)鍵詞的回答信息。
      [0219] 在另一種實施方式中,符合預(yù)設(shè)規(guī)則的候選建議詞可W為相似度大于預(yù)設(shè)闊值的 候選建議詞,具體來說,在計算了提問關(guān)鍵詞與各個候選建議詞的相似度W后,將相似度大 于預(yù)設(shè)闊值的候選建議詞及對應(yīng)的答案信息發(fā)送至客戶端,W通過客戶端展現(xiàn)給用戶。
      [0220] 在具體實現(xiàn)中,候選建議詞對應(yīng)的答案信息在客戶端中可入口信息扣化)的 形式進(jìn)行展現(xiàn),當(dāng)用戶點擊該入口信息時,可W進(jìn)入對應(yīng)的頁面。例如,在對話框中,返回多 個候選建議詞鏈接(title+詳情鏈接),當(dāng)用戶覺得某個候選建議詞title比較相關(guān)時,可 W觸發(fā)該鏈接,進(jìn)入對應(yīng)的頁面。
      [0221] 當(dāng)然,答案信息也通過客戶端直接展現(xiàn)在當(dāng)前用戶交互界面中,本申請實施例對 此無需加 W限制。
      [0222] 在本申請實施例中,可W通過預(yù)先建立的權(quán)重計算模型獲得第一分詞的權(quán)重,權(quán) 重計算模型因日志記錄的更新而更新,無需人工的先驗知識,方便系統(tǒng)調(diào)優(yōu)的同時,節(jié)省了 人工成本及構(gòu)建維護(hù)成本。
      [0223] 需要說明的是,對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組 合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請實施例并不受所描述的動作順序的限制,因為依 據(jù)本申請實施例,某些步驟可W采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該 知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作并不一定是本申請實施 例所必須的。
      [0224] 參照圖4,示出了本申請一種智能問答的裝置實施例的結(jié)構(gòu)框圖,具體可W包括如 下模塊:
      [0225] 第一分詞模塊401,用于接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分 詞處理,得到一個或多個第一分詞;
      [0226] 候選建議詞獲取模塊402,用于基于所述一個或多個第一分詞,獲取與所述提問關(guān) 鍵詞匹配的候選建議詞的集合,所述候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一 分詞的詞;
      [0227] 第一權(quán)重計算模塊403,用于計算所述一個或多個第一分詞的權(quán)重;
      [022引相似度計算模塊404,用于依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān) 鍵詞與各候選建議詞的相似度;
      [0229] 信息返回模塊405,用于將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案 信息返回所述客戶端。
      [0230] 在本申請實施例的一種優(yōu)選實施例中,所述相似度計算模塊404可W包括:
      [0231] 第二分詞子模塊,用于對所述候選建議詞的集合中的候選建議詞進(jìn)行分詞處理, 得到對應(yīng)的一個或多個第二分詞;
      [0232] 第二權(quán)重計算子模塊,用于計算所述一個或多個第二分詞的權(quán)重;
      [0233] 第一向量組織子模塊,用于將所述一個或多個第一分詞的權(quán)重,組織成所述提問 關(guān)鍵詞的向量信息;
      [0234] 第二向量組織子模塊,用于將每個候選建議詞對應(yīng)的一個或多個第二分詞的權(quán) 重,組織成對應(yīng)的候選建議詞的向量信息;
      [0235] 計算子模塊,用于采用所述提問關(guān)鍵詞的向量信息與各候選建議詞的向量信息, 計算所述提問關(guān)鍵詞與各候選建議詞的相似度。
      [0236] 在本申請實施例的一種優(yōu)選實施例中,所述第一權(quán)重計算模塊403可W包括:
      [0237] 特征提取子模塊,用于分別提取所述第一分詞的多個特征信息;
      [023引特征權(quán)重獲取子模塊,用于獲取所述多個特征信息的權(quán)重;
      [0239] 匯總子模塊,用于匯總所述多個特征信息的權(quán)重,得到所述第一分詞的權(quán)重。
      [0240] 在本申請實施例的一種優(yōu)選實施例中,所述特征權(quán)重獲取子模塊還可W用于:
      [0241] 加載預(yù)先生成的權(quán)重計算模型,所述權(quán)重計算模型包括多個特征信息及對應(yīng)的權(quán) 重的映射關(guān)系;
      [0242] 在所述權(quán)重計算模型中查詢所述特征信息的權(quán)重。
      [0243] 在本申請實施例的一種優(yōu)選實施例中,所述裝置還可W包括:
      [0244] 信息提取模塊,用于查詢?nèi)罩居涗?,獲取在先提問關(guān)鍵詞及對應(yīng)的建議詞,其中, 所述建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述在先提問關(guān)鍵詞的一個或多個分詞的詞;
      [0245] 第一組合構(gòu)建模塊,用于依據(jù)所述在先提問關(guān)鍵詞及對應(yīng)的建議詞,構(gòu)建所述在 先提問關(guān)鍵詞與所述建議詞的組合;
      [0246] 第二組合構(gòu)建模塊,用于基于所述在先提問關(guān)鍵詞與所述建議詞的組合,映射出 分詞組合,所述分詞組合為對所述在先提問關(guān)鍵詞進(jìn)行分詞處理及對所述建議詞進(jìn)行分詞 處理后,得到的分詞的組合;
      [0247] 第Η組合構(gòu)建模塊,用于針對所說分詞組合中的每個分詞,分別提取預(yù)置的多個 特征信息,形成特征信息組合;
      [024引模型訓(xùn)練模塊,用于對所述特征信息組合進(jìn)行模型訓(xùn)練,得到權(quán)重計算模型。
      [0249] 在本申請實施例的一種優(yōu)選實施例中,所述第二組合構(gòu)建模塊包括:
      [0250] 分詞列表獲取子模塊,用于基于所述在先提問關(guān)鍵詞與所述建議詞的組合,分別 對所述在先提問關(guān)鍵詞及所述建議詞進(jìn)行分詞處理,得到分詞列表;
      [0251] 關(guān)系定義子模塊,用于基于所述分詞列表,獲得相同分詞列表及不同分詞列表,并 定義相同分詞與不同分詞列表的關(guān)系為;相同分詞列表〉不同分詞列表;
      [0252] 構(gòu)建子模塊,用于結(jié)合所述相同分詞列表與所述不同分詞列表的關(guān)系,構(gòu)建分詞 組合。
      [0巧3] 在本申請實施例的一種優(yōu)選實施例中,所述模型訓(xùn)練模塊包括:
      [0254] 格式轉(zhuǎn)換子模塊,用于將所述特征信息組合轉(zhuǎn)換為特定樣本格式的特征信息組 合;
      [0巧5]訓(xùn)練子模塊,用于通過排序向量空間模型算法RankSVM對所述特定樣本格式的特 征信息組合進(jìn)行建模,獲得權(quán)重計算模型。
      [0256] 在本申請實施例的一種優(yōu)選實施例中,所述特征信息至少包括如下信息:詞頻 TF、逆文檔頻率IDF、TF*IDF、BM25、分詞長度LEN、類目信息、詞性信息。
      [0巧7] 在本申請實施例的一種優(yōu)選實施例中,所述裝置還包括:
      [025引更新模塊,用于依據(jù)所述日志記錄更新所述權(quán)重計算模型。
      [ο巧9] 在本申請實施例的一種優(yōu)選實施例中,所述信息返回模塊405可w包括:
      [0260] 第一返回子模塊,用于將所述相似度排序在前的N個候選建議詞及對應(yīng)的答案信 息返回所述客戶端,其中N為正整數(shù);
      [0261] 或者,
      [0262] 第二返回子模塊,用于將所述相似度大于預(yù)設(shè)闊值的候選建議詞及對應(yīng)的答案信 息返回所述客戶端。
      [0263] 對于圖4所述的裝置實施例而言,由于其與上述方法實施例基本相似,所W描述 的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。
      [0264] 參照圖5,示出了本申請一種智能問答系統(tǒng)實施例的結(jié)構(gòu)框圖,所述系統(tǒng)包括客戶 端50和服務(wù)器60,其中,
      [0265] 所述客戶端50可W包括如下模塊:
      [0266] 信息發(fā)送模塊501,用于向所述服務(wù)器發(fā)送提問關(guān)鍵詞;
      [0267] 信息展現(xiàn)模塊502,用于接收所述服務(wù)器返回的候選建議詞及對應(yīng)的答案信息,并 展現(xiàn)所述候選建議詞及對應(yīng)的答案信息;
      [026引所述服務(wù)器60可W包括如下模塊:
      [0269] 第一分詞模塊601,用于接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分 詞處理,得到一個或多個第一分詞;
      [0270] 候選建議詞獲取模塊602,用于基于所述一個或多個第一分詞,獲取與所述提問關(guān) 鍵詞匹配的候選建議詞的集合,所述候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一 分詞的詞;
      [0271] 第一權(quán)重計算模塊603,用于計算所述一個或多個第一分詞的權(quán)重;
      [0272] 相似度計算模塊604,用于依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān) 鍵詞與各候選建議詞的相似度;
      [0273] 信息返回模塊605,用于將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案 信息返回所述客戶端。
      [0274] 在本申請實施例的一種優(yōu)選實施例中,所述相似度計算模塊604可W包括:
      [0275] 第二分詞子模塊,用于對所述候選建議詞的集合中的候選建議詞進(jìn)行分詞處理, 得到對應(yīng)的一個或多個第二分詞;
      [0276] 第二權(quán)重計算子模塊,用于計算所述一個或多個第二分詞的權(quán)重;
      [0277] 第一向量組織子模塊,用于將所述一個或多個第一分詞的權(quán)重,組織成所述提問 關(guān)鍵詞的向量信息;
      [027引第二向量組織子模塊,用于將每個候選建議詞對應(yīng)的一個或多個第二分詞的權(quán) 重,組織成對應(yīng)的候選建議詞的向量信息;
      [0279] 計算子模塊,用于采用所述提問關(guān)鍵詞的向量信息與各候選建議詞的向量信息, 計算所述提問關(guān)鍵詞與各候選建議詞的相似度。
      [0280] 在本申請實施例的一種優(yōu)選實施例中,所述第一權(quán)重計算模塊603可W包括:
      [0281] 特征提取子模塊,用于分別提取所述第一分詞的多個特征信息;
      [0282] 特征權(quán)重獲取子模塊,用于獲取所述多個特征信息的權(quán)重;
      [0283] 匯總子模塊,用于匯總所述多個特征信息的權(quán)重,得到所述第一分詞的權(quán)重。
      [0284] 在本申請實施例的一種優(yōu)選實施例中,所述特征權(quán)重獲取子模塊還可W用于:
      [0285] 加載預(yù)先生成的權(quán)重計算模型,所述權(quán)重計算模型包括多個特征信息及對應(yīng)的權(quán) 重的映射關(guān)系;
      [0286] 在所述權(quán)重計算模型中查詢所述特征信息的權(quán)重。
      [0287] 在本申請實施例的一種優(yōu)選實施例中,所述裝置還可W包括:
      [028引信息提取模塊,用于查詢?nèi)罩居涗?,獲取在先提問關(guān)鍵詞及對應(yīng)的建議詞,其中, 所述建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述在先提問關(guān)鍵詞的一個或多個分詞的詞;
      [0289] 第一組合構(gòu)建模塊,用于依據(jù)所述在先提問關(guān)鍵詞及對應(yīng)的建議詞,構(gòu)建所述在 先提問關(guān)鍵詞與所述建議詞的組合;
      [0290] 第二組合構(gòu)建模塊,用于基于所述在先提問關(guān)鍵詞與所述建議詞的組合,映射出 分詞組合,所述分詞組合為對所述在先提問關(guān)鍵詞進(jìn)行分詞處理及對所述建議詞進(jìn)行分詞 處理后,得到的分詞的組合;
      [0291] 第Η組合構(gòu)建模塊,用于針對所說分詞組合中的每個分詞,分別提取預(yù)置的多個 特征信息,形成特征信息組合;
      [0292] 模型訓(xùn)練模塊,用于對所述特征信息組合進(jìn)行模型訓(xùn)練,得到權(quán)重計算模型。
      [0293] 在本申請實施例的一種優(yōu)選實施例中,所述第二組合構(gòu)建模塊包括:
      [0294] 分詞列表獲取子模塊,用于基于所述在先提問關(guān)鍵詞與所述建議詞的組合,分別 對所述在先提問關(guān)鍵詞及所述建議詞進(jìn)行分詞處理,得到分詞列表;
      [0295] 關(guān)系定義子模塊,用于基于所述分詞列表,獲得相同分詞列表及不同分詞列表,并 定義相同分詞與不同分詞列表的關(guān)系為;相同分詞列表〉不同分詞列表;
      [0296] 構(gòu)建子模塊,用于結(jié)合所述相同分詞列表與所述不同分詞列表的關(guān)系,構(gòu)建分詞 組合。
      [0297] 在本申請實施例的一種優(yōu)選實施例中,所述模型訓(xùn)練模塊包括:
      [029引格式轉(zhuǎn)換子模塊,用于將所述特征信息組合轉(zhuǎn)換為特定樣本格式的特征信息組 合;
      [0299] 訓(xùn)練子模塊,用于通過排序向量空間模型算法RankSVM對所述特定樣本格式的特 征信息組合進(jìn)行建模,獲得權(quán)重計算模型。
      [0300] 在本申請實施例的一種優(yōu)選實施例中,所述特征信息至少包括如下信息:詞頻 TF、逆文檔頻率IDF、TF*IDF、BM25、分詞長度LEN、類目信息、詞性信息。
      [0301] 在本申請實施例的一種優(yōu)選實施例中,所述裝置還包括:
      [0302] 更新模塊,用于依據(jù)所述日志記錄更新所述權(quán)重計算模型。
      [0303] 在本申請實施例的一種優(yōu)選實施例中,所述信息返回模塊605可W包括:
      [0304] 第一返回子模塊,用于將所述相似度排序在前的N個候選建議詞及對應(yīng)的答案信 息返回所述客戶端,其中N為正整數(shù);
      [030引或者,
      [0306] 第二返回子模塊,用于將所述相似度大于預(yù)設(shè)闊值的候選建議詞及對應(yīng)的答案信 息返回所述客戶端。
      [0307] 對于圖5所述的系統(tǒng)實施例而言,由于其與上述方法實施例基本相似,所W描述 的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。
      [030引本說明書中的各個實施例均采用遞進(jìn)的方式描述,每個實施例重點說明的都是與 其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
      [0309] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請實施例的實施例可提供為方法、裝置、或計算 機程序產(chǎn)品。因此,本申請實施例可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和 硬件方面的實施例的形式。而且,本申請實施例可采用在一個或多個其中包含有計算機可 用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上 實施的計算機程序產(chǎn)品的形式。
      [0310] 在一個典型的配置中,所述計算機設(shè)備包括一個或多個處理器(CPU)、輸入/輸出 接口、網(wǎng)絡(luò)接口和內(nèi)存。內(nèi)存可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲 器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內(nèi)存是 計算機可讀介質(zhì)的示例。計算機可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體 可W由任何方法或技術(shù)來實現(xiàn)信息存儲。信息可W是計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模 塊或其他數(shù)據(jù)。計算機的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機存取 存儲器(SRAM)、動態(tài)隨機存取存儲器值RAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲 器(ROM)、電可擦除可編程只讀存儲器巧EPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只 讀存儲器(CD-ROM)、數(shù)字多功能光盤值VD)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁磁盤存儲 或其他磁性存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可W被計算設(shè)備訪問的信息。按 照本文中的界定,計算機可讀介質(zhì)不包括非持續(xù)性的電腦可讀媒體(transitory media), 如調(diào)制的數(shù)據(jù)信號和載波。
      [0311] 本申請實施例是參照根據(jù)本申請實施例的方法、終端設(shè)備(系統(tǒng))、和計算機程序 產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框 圖中的每一流程和/或方框、W及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商?供送些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理 終端設(shè)備的處理器W產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理終端設(shè)備的處 理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多 個方框中指定的功能的裝置。
      [0312] 送些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理終端設(shè)備 W特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包 括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方 框或多個方框中指定的功能。
      [0313] 送些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理終端設(shè)備上,使得 在計算機或其他可編程終端設(shè)備上執(zhí)行一系列操作步驟W產(chǎn)生計算機實現(xiàn)的處理,從而在 計算機或其他可編程終端設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程 和/或方框圖一個方框或多個方框中指定的功能的步驟。
      [0314] 盡管已描述了本申請實施例的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基 本創(chuàng)造性概念,則可對送些實施例做出另外的變更和修改。所W,所附權(quán)利要求意欲解釋為 包括優(yōu)選實施例W及落入本申請實施例范圍的所有變更和修改。
      [0315] 最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將 一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示送些實體或操作 之間存在任何送種實際的關(guān)系或者順序。而且,術(shù)語"包括"、"包含"或者其任何其他變體意 在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設(shè)備不僅包 括郝些要素,而且還包括沒有明確列出的其他要素,或者是還包括為送種過程、方法、物品 或者終端設(shè)備所固有的要素。在沒有更多限制的情況下,由語句"包括一個……"限定的要 素,并不排除在包括所述要素的過程、方法、物品或者終端設(shè)備中還存在另外的相同要素。
      [0316] W上對本申請所提供的一種智能問答的方法、裝置及系統(tǒng)進(jìn)行了詳細(xì)介紹,本文 中應(yīng)用了具體個例對本申請的原理及實施方式進(jìn)行了闡述,W上實施例的說明只是用于幫 助理解本申請的方法及其核必思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本申請的思 想,在【具體實施方式】及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對 本申請的限制。
      【主權(quán)項】
      1. 一種智能問答的方法,其特征在于,所述方法包括: 接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分詞處理,得到一個或多個第 一分詞; 基于所述一個或多個第一分詞,獲取與所述提問關(guān)鍵詞匹配的候選建議詞的集合,所 述候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一分詞的詞; 計算所述一個或多個第一分詞的權(quán)重; 依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān)鍵詞與各候選建議詞的相似 度; 將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息返回所述客戶端。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述一個或多個第一分詞的權(quán) 重,計算所述提問關(guān)鍵詞與各候選建議詞的相似度的步驟包括: 對所述候選建議詞的集合中的候選建議詞進(jìn)行分詞處理,得到對應(yīng)的一個或多個第二 分詞; 計算所述一個或多個第二分詞的權(quán)重; 將所述一個或多個第一分詞的權(quán)重,組織成所述提問關(guān)鍵詞的向量信息; 將每個候選建議詞對應(yīng)的一個或多個第二分詞的權(quán)重,組織成對應(yīng)的候選建議詞的向 量信息; 采用所述提問關(guān)鍵詞的向量信息與各候選建議詞的向量信息,計算所述提問關(guān)鍵詞與 各候選建議詞的相似度。3. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述計算所述一個或多個第一分詞的 權(quán)重的步驟包括: 分別提取所述第一分詞的多個特征信息; 獲取所述多個特征信息的權(quán)重; 匯總所述多個特征信息的權(quán)重,得到所述第一分詞的權(quán)重。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述獲取所述多個特征信息的權(quán)重的步 驟為: 加載預(yù)先生成的權(quán)重計算模型,所述權(quán)重計算模型包括多個特征信息及對應(yīng)的權(quán)重的 映射關(guān)系; 在所述權(quán)重計算模型中查詢所述特征信息的權(quán)重。5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述權(quán)重計算模型按照如下方式生成: 查詢?nèi)罩居涗?,獲取在先提問關(guān)鍵詞及對應(yīng)的建議詞,其中,所述建議詞為預(yù)設(shè)數(shù)據(jù)庫 中包含所述在先提問關(guān)鍵詞的一個或多個分詞的詞; 依據(jù)所述在先提問關(guān)鍵詞及對應(yīng)的建議詞,構(gòu)建所述在先提問關(guān)鍵詞與所述建議詞的 組合; 基于所述在先提問關(guān)鍵詞與所述建議詞的組合,映射出分詞組合,所述分詞組合為對 所述在先提問關(guān)鍵詞進(jìn)行分詞處理及對所述建議詞進(jìn)行分詞處理后,得到的分詞的組合; 針對所說分詞組合中的每個分詞,分別提取預(yù)置的多個特征信息,形成特征信息組 合; 對所述特征信息組合進(jìn)行模型訓(xùn)練,得到權(quán)重計算模型。6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于所述在先提問關(guān)鍵詞與所述建 議詞的組合,映射出分詞組合的步驟包括: 基于所述在先提問關(guān)鍵詞與所述建議詞的組合,分別對所述在先提問關(guān)鍵詞及所述建 議詞進(jìn)行分詞處理,得到分詞列表; 基于所述分詞列表,獲得相同分詞列表及不同分詞列表,并定義相同分詞與不同分詞 列表的關(guān)系為:相同分詞列表〉不同分詞列表; 結(jié)合所述相同分詞列表與所述不同分詞列表的關(guān)系,構(gòu)建分詞組合。7. 根據(jù)權(quán)利要求5或6所述的方法,其特征在于,所述對所述特征信息組合進(jìn)行模型訓(xùn) 練,得到權(quán)重計算模型的步驟包括: 將所述特征信息組合轉(zhuǎn)換為特定樣本格式的特征信息組合; 通過排序向量空間模型算法RankSVM對所述特定樣本格式的特征信息組合進(jìn)行建模, 獲得權(quán)重計算模型。8. 根據(jù)權(quán)利要求5或6所述的方法,其特征在于,所述特征信息至少包括如下信息:詞 頻TF、逆文檔頻率IDF、TF*IDF、BM25、分詞長度LEN、類目信息、詞性信息。9. 根據(jù)權(quán)利要求4或5或6所述的方法,其特征在于,在所述對所述特征信息組合進(jìn)行 模型訓(xùn)練,得到權(quán)重計算模型的步驟之后,還包括: 依據(jù)所述日志記錄更新所述權(quán)重計算模型。10. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述相似度符合預(yù)設(shè)規(guī)則的候選 建議詞及對應(yīng)的答案信息返回所述客戶端的步驟包括: 將所述相似度排序在前的N個候選建議詞及對應(yīng)的答案信息返回所述客戶端,其中N 為正整數(shù); 或者, 將所述相似度大于預(yù)設(shè)閾值的候選建議詞及對應(yīng)的答案信息返回所述客戶端。11. 一種智能問答的裝置,其特征在于,所述裝置包括: 第一分詞模塊,用于接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分詞處理, 得到一個或多個第一分詞; 候選建議詞獲取模塊,用于基于所述一個或多個第一分詞,獲取與所述提問關(guān)鍵詞匹 配的候選建議詞的集合,所述候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一分詞的 詞; 第一權(quán)重計算模塊,用于計算所述一個或多個第一分詞的權(quán)重; 相似度計算模塊,用于依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān)鍵詞與 各候選建議詞的相似度; 信息返回模塊,用于將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息返回 所述客戶端。12. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述相似度計算模塊包括: 第二分詞子模塊,用于對所述候選建議詞的集合中的候選建議詞進(jìn)行分詞處理,得到 對應(yīng)的一個或多個第二分詞; 第二權(quán)重計算子模塊,用于計算所述一個或多個第二分詞的權(quán)重; 第一向量組織子模塊,用于將所述一個或多個第一分詞的權(quán)重,組織成所述提問關(guān)鍵 詞的向量信息; 第二向量組織子模塊,用于將每個候選建議詞對應(yīng)的一個或多個第二分詞的權(quán)重,組 織成對應(yīng)的候選建議詞的向量信息; 計算子模塊,用于采用所述提問關(guān)鍵詞的向量信息與各候選建議詞的向量信息,計算 所述提問關(guān)鍵詞與各候選建議詞的相似度。13. 根據(jù)權(quán)利要求11或12所述的裝置,其特征在于,所述第一權(quán)重計算模塊包括: 特征提取子模塊,用于分別提取所述第一分詞的多個特征信息; 特征權(quán)重獲取子模塊,用于獲取所述多個特征信息的權(quán)重; 匯總子模塊,用于匯總所述多個特征信息的權(quán)重,得到所述第一分詞的權(quán)重。14. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述特征權(quán)重獲取子模塊還用于: 加載預(yù)先生成的權(quán)重計算模型,所述權(quán)重計算模型包括多個特征信息及對應(yīng)的權(quán)重的 映射關(guān)系; 在所述權(quán)重計算模型中查詢所述特征信息的權(quán)重。15. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述裝置還包括: 信息提取模塊,用于查詢?nèi)罩居涗?,獲取在先提問關(guān)鍵詞及對應(yīng)的建議詞,其中,所述 建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述在先提問關(guān)鍵詞的一個或多個分詞的詞; 第一組合構(gòu)建模塊,用于依據(jù)所述在先提問關(guān)鍵詞及對應(yīng)的建議詞,構(gòu)建所述在先提 問關(guān)鍵詞與所述建議詞的組合; 第二組合構(gòu)建模塊,用于基于所述在先提問關(guān)鍵詞與所述建議詞的組合,映射出分詞 組合,所述分詞組合為對所述在先提問關(guān)鍵詞進(jìn)行分詞處理及對所述建議詞進(jìn)行分詞處理 后,得到的分詞的組合; 第三組合構(gòu)建模塊,用于針對所說分詞組合中的每個分詞,分別提取預(yù)置的多個特征 信息,形成特征信息組合; 模型訓(xùn)練模塊,用于對所述特征信息組合進(jìn)行模型訓(xùn)練,得到權(quán)重計算模型。16. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述第二組合構(gòu)建模塊包括: 分詞列表獲取子模塊,用于基于所述在先提問關(guān)鍵詞與所述建議詞的組合,分別對所 述在先提問關(guān)鍵詞及所述建議詞進(jìn)行分詞處理,得到分詞列表; 關(guān)系定義子模塊,用于基于所述分詞列表,獲得相同分詞列表及不同分詞列表,并定義 相同分詞與不同分詞列表的關(guān)系為:相同分詞列表〉不同分詞列表; 構(gòu)建子模塊,用于結(jié)合所述相同分詞列表與所述不同分詞列表的關(guān)系,構(gòu)建分詞組合。17. 根據(jù)權(quán)利要求15或16所述的裝置,其特征在于,所述模型訓(xùn)練模塊包括: 格式轉(zhuǎn)換子模塊,用于將所述特征信息組合轉(zhuǎn)換為特定樣本格式的特征信息組合; 訓(xùn)練子模塊,用于通過排序向量空間模型算法RankSVM對所述特定樣本格式的特征信 息組合進(jìn)行建模,獲得權(quán)重計算模型。18. 根據(jù)權(quán)利要求15或16所述的裝置,其特征在于,所述特征信息至少包括如下信息: 詞頻TF、逆文檔頻率IDF、TF*IDF、BM25、分詞長度LEN、類目信息、詞性信息。19. 根據(jù)權(quán)利要求14或15或16所述的裝置,其特征在于,所述裝置還包括: 更新模塊,用于依據(jù)所述日志記錄更新所述權(quán)重計算模型。20. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述信息返回模塊包括: 第一返回子模塊,用于將所述相似度排序在前的N個候選建議詞及對應(yīng)的答案信息返 回所述客戶端,其中N為正整數(shù); 或者, 第二返回子模塊,用于將所述相似度大于預(yù)設(shè)閾值的候選建議詞及對應(yīng)的答案信息返 回所述客戶端。21.-種智能問答系統(tǒng),其特征在于,所述系統(tǒng)包括客戶端和服務(wù)器,其中, 所述客戶端包括: 信息發(fā)送模塊,用于向所述服務(wù)器發(fā)送提問關(guān)鍵詞; 信息展現(xiàn)模塊,用于接收所述服務(wù)器返回的候選建議詞及對應(yīng)的答案信息,并展現(xiàn)所 述候選建議詞及對應(yīng)的答案信息; 所述服務(wù)器包括: 第一分詞模塊,用于接收客戶端發(fā)送的提問關(guān)鍵詞,將所述提問關(guān)鍵詞進(jìn)行分詞處理, 得到一個或多個第一分詞; 候選建議詞獲取模塊,用于基于所述一個或多個第一分詞,獲取與所述提問關(guān)鍵詞匹 配的候選建議詞的集合,所述候選建議詞為預(yù)設(shè)數(shù)據(jù)庫中包含所述一個或多個第一分詞的 詞; 第一權(quán)重計算模塊,用于計算所述一個或多個第一分詞的權(quán)重; 相似度計算模塊,用于依據(jù)所述一個或多個第一分詞的權(quán)重,計算所述提問關(guān)鍵詞與 各候選建議詞的相似度; 信息返回模塊,用于將所述相似度符合預(yù)設(shè)規(guī)則的候選建議詞及對應(yīng)的答案信息返回 所述客戶端。
      【文檔編號】G06F17/27GK105989040SQ201510057282
      【公開日】2016年10月5日
      【申請日】2015年2月3日
      【發(fā)明人】王 義
      【申請人】阿里巴巴集團(tuán)控股有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1