生成模式和問題信息生成對(duì)應(yīng)的問答結(jié)果。其中,問題類型可包括實(shí)體類型、觀點(diǎn)類型和片段類型。
[0036]更具體地,當(dāng)問題類型為實(shí)體類型時(shí),可根據(jù)問題信息生成實(shí)體類問題信息,并基于搜索引擎抓取的摘要和歷史展現(xiàn)日志對(duì)實(shí)體類問題信息進(jìn)行擴(kuò)展以生成同族實(shí)體問題信息簇。其中,同族實(shí)體問題信息簇分別對(duì)應(yīng)候選答案。然后從同族實(shí)體問題信息簇分別對(duì)應(yīng)候選答案中抽取候選實(shí)體,再計(jì)算候選實(shí)體的置信度,以及將置信度大于預(yù)設(shè)置信度閾值的候選實(shí)體作為問答結(jié)果進(jìn)行反饋。舉例來說,問題信息為“劉德華老婆是誰? ”,候選答案為“其實(shí)早在九二年時(shí)就有報(bào)道,劉德華和朱麗倩已經(jīng)在加拿大秘密注冊(cè)結(jié)婚…”,其中,候選實(shí)體為“劉德華”、“朱麗倩”、“加拿大”。然后基于實(shí)體知識(shí)庫和問答語義匹配模型計(jì)算各候選實(shí)體的置信度,可計(jì)算出候選實(shí)體“朱麗倩”的置信度大于預(yù)設(shè)置信度閾值,則可確定“朱麗倩”為問答結(jié)果。另外,還可將候選答案中首次出現(xiàn)“朱麗倩”的分句作為答案摘要。
[0037]當(dāng)問題類型為觀點(diǎn)類型時(shí),可獲取問題信息對(duì)應(yīng)的候選答案,并對(duì)候選答案進(jìn)行切分以生成多個(gè)候選答案短句,然后對(duì)多個(gè)候選答案短句進(jìn)行聚合以生成觀點(diǎn)聚合簇。具體地,可根據(jù)短句中詞匯的IDF(反文檔頻率)得分提取候選答案短句中的關(guān)鍵詞,并對(duì)包含否定詞的關(guān)鍵詞進(jìn)行泛化并生成否定標(biāo)簽,然后基于否定標(biāo)簽將關(guān)鍵詞用向量進(jìn)行表示,計(jì)算每兩個(gè)關(guān)鍵詞之間的向量夾角和/或語義相似度,然后對(duì)向量夾角小于預(yù)設(shè)角度或語義相似度大于預(yù)設(shè)閾值的候選答案進(jìn)行聚合以生成觀點(diǎn)聚合簇。
[0038]在此之后,可判斷觀點(diǎn)聚合簇的觀點(diǎn)類型。其中,觀點(diǎn)可包括是非類、評(píng)價(jià)類、建議類等。具體地,可通過預(yù)先設(shè)定的規(guī)則或者基于統(tǒng)計(jì)模型確定觀點(diǎn)聚合簇的觀點(diǎn)類型。然后根據(jù)觀點(diǎn)類型從對(duì)應(yīng)的觀點(diǎn)聚合簇中選擇出答案觀點(diǎn)。其中,選擇答案觀點(diǎn)的規(guī)則可包括但不僅限于選取信息覆蓋最全面的答案觀點(diǎn)、選取IDF*log(IDF)值最低的答案觀點(diǎn)和選取在候選答案對(duì)應(yīng)的文章中出現(xiàn)次數(shù)最多的答案觀點(diǎn)。其中,IDF為反文檔頻率。在此之后,可生成答案觀點(diǎn)對(duì)應(yīng)的摘要,然后可對(duì)答案觀點(diǎn)進(jìn)行評(píng)分,并將評(píng)分大于預(yù)設(shè)評(píng)分閾值的答案觀點(diǎn)作為問答結(jié)果進(jìn)行反饋。舉例來說,問題信息為“懷孕注意事項(xiàng)”,其中一個(gè)候選答案為“懷孕時(shí)應(yīng)謹(jǐn)守醫(yī)、多、戰(zhàn)原則,亦即定期看醫(yī)師,多臥床休息,戰(zhàn)勝自己的不良習(xí)慣?!保蓪⒃摵蜻x答案切分為“懷孕時(shí)應(yīng)謹(jǐn)守醫(yī)、多、戰(zhàn)原則”、“亦即定期看醫(yī)師”、“多臥床休息”、“戰(zhàn)勝自己的不良習(xí)慣”四個(gè)候選答案短句。然后可將候選答案短句中重復(fù)的內(nèi)容或者近似的內(nèi)容進(jìn)行聚合生成觀點(diǎn)聚合簇,并選出答案觀點(diǎn)。之后,可根據(jù)信息豐富度、論據(jù)充分度、信息冗余度等對(duì)答案觀點(diǎn)進(jìn)行評(píng)分,并將評(píng)分大于預(yù)設(shè)評(píng)分閾值的答案觀點(diǎn)作為問答結(jié)果進(jìn)行反饋。此外,在選出答案觀點(diǎn)后,可獲取其在來源文章中所在的句子,然后按照預(yù)定長度截取句子,從而生成該答案觀點(diǎn)對(duì)應(yīng)的摘要。之后可根據(jù)內(nèi)容豐富度、答案權(quán)威性對(duì)摘要進(jìn)行排序。
[0039]當(dāng)問題類型為片段類型時(shí),可獲取問題信息對(duì)應(yīng)的候選答案,并對(duì)候選答案進(jìn)行切分以生成多個(gè)候選答案短句,然后對(duì)多個(gè)候選答案短句進(jìn)行重要度打分以生成候選答案短句對(duì)應(yīng)的短句重要度特征,并根據(jù)短句重要度特征生成答案摘要,然后可根據(jù)答案摘要的短句重要度特征、答案權(quán)威性、問題信息的相關(guān)性和答案的豐富度對(duì)答案質(zhì)量進(jìn)行打分。其中,短句重要度特征可包括聚合特征、相關(guān)度特征、類型特征和問題答案匹配度特征。其中,聚合特征用于衡量短句的重復(fù)度,例如:詞向量質(zhì)心特征、NGram(計(jì)算出現(xiàn)概率)特征、Lexrank(多文本自動(dòng)摘要)特征等。類型特征為問題的類型特征,如WHAT (什么)類型、WHY(為什么)類型、HOW(如何)類型等。答案權(quán)威性為答案來源的網(wǎng)站的權(quán)威度。在此之后,可獲取用戶的行為數(shù)據(jù),然后根據(jù)用戶的行為數(shù)據(jù)和打分結(jié)果對(duì)候選答案進(jìn)行排序,最終將排序結(jié)果作為問答結(jié)果進(jìn)行反饋。其中,用戶的行為數(shù)據(jù)是可包括用戶對(duì)問答結(jié)果的點(diǎn)擊行為、在問答結(jié)果上停留的時(shí)間、通過當(dāng)前的問答結(jié)果跳轉(zhuǎn)至其他問答結(jié)果等用戶的歷史行為信息。
[0040]當(dāng)用戶需求信息為信息搜索需求時(shí),信息搜索服務(wù)模塊可接收問題信息,并根據(jù)問題信息進(jìn)行搜索以生成多個(gè)候選網(wǎng)頁,然后對(duì)候選網(wǎng)頁進(jìn)行篇章分析以生成對(duì)應(yīng)的候選篇章。具體地,可對(duì)候選網(wǎng)頁進(jìn)行篇章內(nèi)容抽取、篇章主題分割和篇章關(guān)系分析生成對(duì)應(yīng)的候選篇章。其中,篇章內(nèi)容抽取主要為識(shí)別候選網(wǎng)頁的正文部分,刪除與用戶需求信息無關(guān)的內(nèi)容。篇章主題分割為對(duì)篇章的主題結(jié)構(gòu)進(jìn)行分析,可將篇章劃分為多個(gè)子主題。篇章關(guān)系分析為分析篇章中多個(gè)子主題之間的關(guān)系,例如并列關(guān)系等。在生成候選篇章之后,可對(duì)候選篇章中的句子進(jìn)行打分排序。其中,打分排序主要基于句子在候選篇章中的重要度以及句子與用戶需求信息之間的相關(guān)度。在此之后,可獲取用戶的需求場(chǎng)景信息,并根據(jù)需求場(chǎng)景信息和打分排序結(jié)果生成摘要,最終將摘要作為問答結(jié)果進(jìn)行反饋。其中場(chǎng)景信息可包括移動(dòng)終端場(chǎng)景、電腦場(chǎng)景。當(dāng)場(chǎng)景信息為移動(dòng)終端場(chǎng)景時(shí),則可對(duì)句子進(jìn)行壓縮簡寫,使生成的摘要盡量簡明扼要;當(dāng)場(chǎng)景信息為電腦場(chǎng)景時(shí),可對(duì)句子進(jìn)行拼接融合,使得生成的摘要詳細(xì)清楚。當(dāng)然,生成候選篇章時(shí),由于候選篇章中的內(nèi)容均與用戶需求信息具有相關(guān)性,則可能會(huì)有重復(fù)或互補(bǔ)的內(nèi)容,則需要對(duì)多個(gè)候選篇章的信息進(jìn)行聚合。
[0041]S4、接收至少一個(gè)問答服務(wù)模塊返回的問答結(jié)果,并對(duì)問答結(jié)果進(jìn)行決策以確定最終的問答結(jié)果。
[0042]具體地,如圖2所示,可包括以下步驟:
[0043]S41、接收至少一個(gè)問答服務(wù)模塊返回的問答結(jié)果。
[0044]S42、根據(jù)問題信息生成需求分析特征。
[0045]S43、獲取各個(gè)問答服務(wù)模塊返回的問答結(jié)果的置信度特征、用戶的對(duì)話交互信息的上下文特征以及用戶的個(gè)性化模型特征。
[0046]S44、根據(jù)需求分析特征、問答結(jié)果的置信度特征、用戶的對(duì)話交互信息的上下文特征以及用戶的個(gè)性化模型特征對(duì)問答結(jié)果進(jìn)行決策以確定最終的問答結(jié)果。
[0047]具體地,對(duì)問答結(jié)果進(jìn)行決策以確定最終的問答結(jié)果主要基于以下幾個(gè)特征:1、需求分析特征,通過對(duì)用戶的問題信息進(jìn)行需求分析,可選擇更符合用戶需求的問答服務(wù)模塊提供的問答結(jié)果。2、問答結(jié)果置信度特征,每個(gè)問答服務(wù)模塊提供的問答結(jié)果均具有置信度,可選擇置信度高的問答結(jié)果。3、用戶的對(duì)話交互信息的上下文特征,可選擇更符合上下文信息的問答結(jié)果。4、用戶的個(gè)性化模型特征,可選擇更符合用戶個(gè)性化需求的問答結(jié)果。其中,需求分析特征、問答結(jié)果的置信度特征、用戶的對(duì)話交互信息的上下文特征以及用戶的個(gè)性化模型特征分別對(duì)應(yīng)有各自的決策權(quán)重?;谝陨咸卣鲗?duì)問答結(jié)果進(jìn)行決策,從而確定最終的問答結(jié)果。在確定最終的問答結(jié)果后,可反饋給用戶,從而滿足用戶的需求。其中,問答結(jié)果可通過語音播報(bào)的方式,亦可以通過屏幕顯示的方式反饋給用戶。采用語音播報(bào)的方式使得人機(jī)交互的過程更加簡便、自然。
[0048]另外,還可根據(jù)用戶的日志基于增強(qiáng)學(xué)習(xí)模型對(duì)需求分析特征、問答結(jié)果的置信度特征、用戶的對(duì)話交互信息的上下文特征以及用戶的個(gè)性化模型特征的決策權(quán)重進(jìn)行訓(xùn)練,從而為用戶提供更符合用戶需求的問答結(jié)果。
[0049]另外,如圖3所示,在步驟SI之后,還可包括以下步驟:
[0050]S5、獲取與用戶的對(duì)話交互信息。[0051 ] S6、根據(jù)對(duì)話交互信息的對(duì)話上文對(duì)問題信息進(jìn)行補(bǔ)全。
[0052]具體地,在多輪交互過程中,用戶通常會(huì)基于對(duì)話上文省略問題信息中的一部分內(nèi)容,因此需要對(duì)問題信息進(jìn)行補(bǔ)全,從而澄清用戶的需求。例如:對(duì)話上文為“北京有什么小吃? ”,而問題信息為“那特產(chǎn)呢? ”,則需要對(duì)用戶輸入的問題信息進(jìn)行補(bǔ)全,生成新的問題信息“北京有什么特產(chǎn)? ”。
[0053]本發(fā)明實(shí)施例的基于人工智能的深度問答服務(wù)提供方法,通過獲取用戶輸入的問題信息,并根據(jù)問題信息獲取用戶的用戶需求信息,以及根據(jù)用戶需求信息將問題信息分發(fā)至對(duì)應(yīng)的至少一個(gè)問答服務(wù)模塊,并接收至少一個(gè)問答服務(wù)模塊返回的問答結(jié)果,最終對(duì)問答結(jié)果進(jìn)行決策以確定最終的問答結(jié)果,能夠針對(duì)用戶的深度問題為用戶提供更加準(zhǔn)確的問答結(jié)果,提升用戶使用滿意度。
[0054]為實(shí)現(xiàn)上述目的,本發(fā)明還提出一種基于人工智能的深度問答服務(wù)提供裝置。
[0055]圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的基于人工智能的深度問答服務(wù)提供裝置的結(jié)構(gòu)示意圖一。
[0056]如圖4所示,該基于人工智能的深度問答服務(wù)提供裝置可包括:輸入接收模塊1000、分發(fā)模塊2000、問答服務(wù)模塊3000和決策模塊4000。
[0057]輸入接收模塊1000用于獲取用戶輸入的問題信息。
[0058]其中,問題信息可以是文字信息,也可以是語音信息。例如,用戶輸入的問題信息“北京有什么小吃? ”。
[0059]分發(fā)模塊2000用于根據(jù)問題信息獲取用戶的用戶需求信息,并根據(jù)用戶需求信息將問題信息分發(fā)至對(duì)