国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于人工智能的深度問(wèn)答服務(wù)提供方法和裝置的制造方法_3

      文檔序號(hào):8935052閱讀:來(lái)源:國(guó)知局
      應(yīng)的至少一個(gè)問(wèn)答服務(wù)模塊3000。其中,如圖5所示,問(wèn)答服務(wù)模塊3000可包括阿拉丁服務(wù)模塊3100、垂類服務(wù)模塊3200、深度問(wèn)答服務(wù)模塊3300和信息搜索服務(wù)模塊3400。
      [0060]具體地,分發(fā)模塊2000可對(duì)問(wèn)題信息進(jìn)行需求分析,從而獲取用戶的用戶需求信息。舉例來(lái)說(shuō),當(dāng)用戶需求信息為阿拉丁需求時(shí),可將問(wèn)題信息分發(fā)至阿拉丁服務(wù)模塊;當(dāng)用戶需求信息為垂類需求時(shí),可將問(wèn)題信息分發(fā)至垂類服務(wù)模塊;當(dāng)用戶需求信息為深度問(wèn)答需求時(shí),可將問(wèn)題信息分發(fā)至深度問(wèn)答服務(wù)模塊;當(dāng)用戶需求信息為信息搜索需求時(shí),可將問(wèn)題分發(fā)至信息搜索服務(wù)模塊。
      [0061]多個(gè)問(wèn)答服務(wù)模塊3000用于根據(jù)接收到的問(wèn)題信息生成問(wèn)答結(jié)果并返回至決策模塊4000。
      [0062]其中,阿拉丁服務(wù)是能夠?yàn)橛脩粜枨筇峁┚珳?zhǔn)滿足的一類服務(wù)的統(tǒng)稱,例如美元兌換人民幣、2015年春節(jié)放假等。舉例來(lái)說(shuō),用戶的問(wèn)題信息為“劉德華的老婆是誰(shuí)? ”,則阿拉丁服務(wù)模塊3100可對(duì)該問(wèn)題信息進(jìn)行分析,可分析出需求類型為“人物”,查詢主體為“劉德華”,查詢屬性為“老婆”,并可將查詢屬性進(jìn)行歸一,將查詢屬性歸一為“妻子”。然后搜索并獲得結(jié)果字段為“朱麗倩”,再基于自然語(yǔ)言生成技術(shù)(Natural LanguageGenerat1n)生成問(wèn)答結(jié)果“劉德華的老婆是朱麗倩”。再例如:用戶的問(wèn)題信息為“北京明天熱嗎?”,通過(guò)搜索并獲得結(jié)果字段為“35攝氏度”,可基于常識(shí)知識(shí)庫(kù)和預(yù)設(shè)的規(guī)則,生成問(wèn)答結(jié)果“明天天氣很熱,最高溫度為35攝氏度,建議注意防暑降溫?!逼渲?,常識(shí)知識(shí)庫(kù)可包括常識(shí)類知識(shí),如溫度高于30攝氏度屬于天氣熱。
      [0063]垂類服務(wù)是針對(duì)垂類需求進(jìn)行多輪交互的服務(wù),例如“訂機(jī)票”等。垂類服務(wù)模塊3200主要通過(guò)對(duì)話控制技術(shù)(Dialogue Management)和對(duì)話策略技術(shù)(DialoguePolicy),對(duì)用戶的需求進(jìn)行澄清,從而向用戶提供滿足用戶需求的問(wèn)答結(jié)果。舉例來(lái)說(shuō),用戶的問(wèn)題信息為“北京到上海的機(jī)票”,則可對(duì)該問(wèn)題信息進(jìn)行分析,然后向用戶反問(wèn)“您的出發(fā)日期是哪天? ”,用戶回答“明天”,然后繼續(xù)反問(wèn)“您對(duì)航空公司是否有要求? ”等,逐步澄清用戶的需求,并最終返回滿足用戶需求的問(wèn)答結(jié)果。
      [0064]深度問(wèn)答服務(wù)為針對(duì)用戶輸入的問(wèn)題信息,基于深入的語(yǔ)義分析和知識(shí)挖掘技術(shù),從而為用戶提供精準(zhǔn)的問(wèn)答結(jié)果的服務(wù)。當(dāng)用戶需求信息為深度問(wèn)答需求時(shí),深度問(wèn)答服務(wù)模塊3300可接收問(wèn)題信息,并根據(jù)問(wèn)題信息獲取對(duì)應(yīng)的問(wèn)題類型,然后根據(jù)問(wèn)題類型選擇對(duì)應(yīng)的問(wèn)答模式,以及根據(jù)選擇的答案生成模式和問(wèn)題信息生成對(duì)應(yīng)的問(wèn)答結(jié)果。其中,問(wèn)題類型可包括實(shí)體類型、觀點(diǎn)類型和片段類型。
      [0065]其中,如圖6所示,深度問(wèn)答服務(wù)模塊3300具體包括第一接收子模塊3310、問(wèn)題類型獲取子模塊3320和第一問(wèn)答結(jié)果生成子模塊3330。
      [0066]第一接收子模塊3310用于接收問(wèn)題信息。
      [0067]問(wèn)題類型獲取子模塊3320用于根據(jù)問(wèn)題信息獲取對(duì)應(yīng)的問(wèn)題類型。
      [0068]第一問(wèn)答結(jié)果生成子模塊3330用于根據(jù)問(wèn)題類型選擇對(duì)應(yīng)的問(wèn)答模式,并根據(jù)選擇的答案生成模式和問(wèn)題信息生成對(duì)應(yīng)的問(wèn)答結(jié)果。
      [0069]當(dāng)問(wèn)題類型為實(shí)體類型時(shí),可根據(jù)問(wèn)題信息生成實(shí)體類問(wèn)題信息,并基于搜索引擎抓取的摘要和歷史展現(xiàn)日志對(duì)實(shí)體類問(wèn)題信息進(jìn)行擴(kuò)展以生成同族實(shí)體問(wèn)題信息簇。其中,同族實(shí)體問(wèn)題信息簇分別對(duì)應(yīng)候選答案。然后從同族實(shí)體問(wèn)題信息簇分別對(duì)應(yīng)候選答案中抽取候選實(shí)體,再計(jì)算候選實(shí)體的置信度,以及將置信度大于預(yù)設(shè)置信度閾值的候選實(shí)體作為問(wèn)答結(jié)果進(jìn)行反饋。舉例來(lái)說(shuō),問(wèn)題信息為“劉德華老婆是誰(shuí)? ”,候選答案為“其實(shí)早在九二年時(shí)就有報(bào)道,劉德華和朱麗倩已經(jīng)在加拿大秘密注冊(cè)結(jié)婚…”,其中,候選實(shí)體為“劉德華”、“朱麗倩”、“加拿大”。然后基于實(shí)體知識(shí)庫(kù)和問(wèn)答語(yǔ)義匹配模型計(jì)算各候選實(shí)體的置信度,可計(jì)算出候選實(shí)體“朱麗倩”的置信度大于預(yù)設(shè)置信度閾值,則可確定“朱麗倩”為問(wèn)答結(jié)果。另外,還可將候選答案中首次出現(xiàn)“朱麗倩”的分句作為答案摘要。
      [0070]當(dāng)問(wèn)題類型為觀點(diǎn)類型時(shí),可獲取問(wèn)題信息對(duì)應(yīng)的候選答案,并對(duì)候選答案進(jìn)行切分以生成多個(gè)候選答案短句,然后對(duì)多個(gè)候選答案短句進(jìn)行聚合以生成觀點(diǎn)聚合簇。具體地,可根據(jù)短句中詞匯的IDF(反文檔頻率)得分提取多個(gè)候選答案短句中的關(guān)鍵詞,并對(duì)包含否定詞的關(guān)鍵詞進(jìn)行泛化并生成否定標(biāo)簽,然后基于否定標(biāo)簽將關(guān)鍵詞用向量進(jìn)行表示,計(jì)算每?jī)蓚€(gè)關(guān)鍵詞之間的向量夾角和/或語(yǔ)義相似度,然后對(duì)向量夾角小于預(yù)設(shè)角度或語(yǔ)義相似度大于預(yù)設(shè)閾值的候選答案進(jìn)行聚合以生成觀點(diǎn)聚合簇。
      [0071]在此之后,可判斷觀點(diǎn)聚合簇的觀點(diǎn)類型。其中,觀點(diǎn)可包括是非類、評(píng)價(jià)類、建議類等。具體地,可通過(guò)預(yù)先設(shè)定的規(guī)則或者基于統(tǒng)計(jì)模型確定觀點(diǎn)聚合簇的觀點(diǎn)類型。然后根據(jù)觀點(diǎn)類型從對(duì)應(yīng)的觀點(diǎn)聚合簇中選擇出答案觀點(diǎn)。其中,選擇答案觀點(diǎn)的規(guī)則可包括但不僅限于選取信息覆蓋最全面的答案觀點(diǎn)、選取IDF*log(IDF)值最低的答案觀點(diǎn)和選取在候選答案對(duì)應(yīng)的文章中出現(xiàn)次數(shù)最多的答案觀點(diǎn)。其中,IDF為反文檔頻率。在此之后,可生成答案觀點(diǎn)對(duì)應(yīng)的摘要,然后可對(duì)答案觀點(diǎn)進(jìn)行評(píng)分,并將評(píng)分大于預(yù)設(shè)評(píng)分閾值的答案觀點(diǎn)作為問(wèn)答結(jié)果進(jìn)行反饋。舉例來(lái)說(shuō),問(wèn)題信息為“懷孕注意事項(xiàng)”,其中一個(gè)候選答案為“懷孕時(shí)應(yīng)謹(jǐn)守醫(yī)、多、戰(zhàn)原則,亦即定期看醫(yī)師,多臥床休息,戰(zhàn)勝自己的不良習(xí)慣?!保蓪⒃摵蜻x答案切分為“懷孕時(shí)應(yīng)謹(jǐn)守醫(yī)、多、戰(zhàn)原則”、“亦即定期看醫(yī)師”、“多臥床休息”、“戰(zhàn)勝自己的不良習(xí)慣”四個(gè)候選答案短句。然后可將候選答案短句中重復(fù)的內(nèi)容或者近似的內(nèi)容進(jìn)行聚合生成觀點(diǎn)聚合簇,并選出答案觀點(diǎn)。之后,可根據(jù)信息豐富度、論據(jù)充分度、信息冗余度等對(duì)答案觀點(diǎn)進(jìn)行評(píng)分,并將評(píng)分大于預(yù)設(shè)評(píng)分閾值的答案觀點(diǎn)作為問(wèn)答結(jié)果進(jìn)行反饋。此外,在選出答案觀點(diǎn)后,可獲取其在來(lái)源文章中所在的句子,然后按照預(yù)定長(zhǎng)度截取句子,從而生成該答案觀點(diǎn)對(duì)應(yīng)的摘要。之后可根據(jù)內(nèi)容豐富度、答案權(quán)威性對(duì)摘要進(jìn)行排序。
      [0072]當(dāng)問(wèn)題類型為片段類型時(shí),可獲取問(wèn)題信息對(duì)應(yīng)的候選答案,并對(duì)候選答案進(jìn)行切分以生成多個(gè)候選答案短句,然后對(duì)多個(gè)候選答案短句進(jìn)行重要度打分以生成候選答案短句對(duì)應(yīng)的短句重要度特征,并根據(jù)短句重要度特征生成答案摘要,然后可根據(jù)答案摘要的短句重要度特征、答案權(quán)威性、問(wèn)題信息的相關(guān)性和答案的豐富度對(duì)答案質(zhì)量進(jìn)行打分。其中,短句重要度特征可包括聚合特征、相關(guān)度特征、類型特征和問(wèn)題答案匹配度特征。其中,聚合特征用于衡量短句的重復(fù)度,例如:詞向量質(zhì)心特征、NGram(計(jì)算出現(xiàn)概率)特征、Lexrank(多文本自動(dòng)摘要)特征等。類型特征為問(wèn)題的類型特征,如WHAT (什么)類型、WHY(為什么)類型、HOW(如何)類型等。答案權(quán)威性為答案來(lái)源的網(wǎng)站的權(quán)威度。在此之后,可獲取用戶的行為數(shù)據(jù),然后根據(jù)用戶的行為數(shù)據(jù)和打分結(jié)果對(duì)候選答案進(jìn)行排序,最終將排序結(jié)果作為問(wèn)答結(jié)果進(jìn)行反饋。其中,用戶的行為數(shù)據(jù)是可包括用戶對(duì)問(wèn)答結(jié)果的點(diǎn)擊行為、在問(wèn)答結(jié)果上停留的時(shí)間、通過(guò)當(dāng)前的問(wèn)答結(jié)果跳轉(zhuǎn)至其他問(wèn)答結(jié)果等用戶的歷史行為信息。
      [0073]如圖7所示,信息搜索服務(wù)模塊3400具體包括第二接收子模塊3410、搜索子模塊3420和第二問(wèn)答結(jié)果生成子模塊3430。其中,第二問(wèn)答結(jié)果生成子模塊3430具體包括篇章生成單元3431、排序單元3432、摘要生成單元3433和聚合單元3434。
      [0074]第二接收子模塊3410用于接收問(wèn)題信息。
      [0075]搜索子模塊3420用于根據(jù)問(wèn)題信息進(jìn)行搜索以生成多個(gè)候選網(wǎng)頁(yè)。
      [0076]第二問(wèn)答結(jié)果生成子模塊3430用于對(duì)候選網(wǎng)頁(yè)進(jìn)行篇章分析以生成對(duì)應(yīng)的摘要,并將摘要作為問(wèn)答結(jié)果進(jìn)行反饋。
      [0077]具體地,篇章生成單元3431可對(duì)候選網(wǎng)頁(yè)進(jìn)行篇章內(nèi)容抽取、篇章主題分割和篇章關(guān)系分析生成對(duì)應(yīng)的候選篇章。其中,篇章內(nèi)容抽取主要為識(shí)別候選網(wǎng)頁(yè)的正文部分,刪除與用戶需求信息無(wú)關(guān)的內(nèi)容。篇章主題分割為對(duì)篇章的主題結(jié)構(gòu)進(jìn)行分析,可將篇章劃分為多個(gè)子主題。篇章關(guān)系分析為分析篇章中多個(gè)子主題之間的關(guān)系,例如并列關(guān)系等。在生成候選篇章之后,排序單元3432可對(duì)候選篇章中的句子進(jìn)行打分排序。其中,打分排序主要基于句子在候選篇章中的重要度以及句子與用戶需求信息之間的相關(guān)度。在此之后,摘要生成單元3433可獲取用戶的需求場(chǎng)景信息,并根據(jù)需求場(chǎng)景信息和打分排序結(jié)果生成摘要,最終將摘要作為問(wèn)答結(jié)果進(jìn)行反饋。其中場(chǎng)景信息可包括移動(dòng)終端場(chǎng)景、電腦場(chǎng)景。當(dāng)場(chǎng)景信息為移動(dòng)終端場(chǎng)景時(shí),則可對(duì)句子進(jìn)行壓縮簡(jiǎn)寫,使生成的摘要盡量簡(jiǎn)明扼要;當(dāng)場(chǎng)景信息為電腦場(chǎng)景時(shí),可對(duì)句子進(jìn)行拼接融合,使得生成的摘要詳細(xì)清楚。當(dāng)然,生成候選篇章時(shí),由于候選篇章中的內(nèi)容均與用戶需求信息具有相關(guān)性,則可能會(huì)有重復(fù)或互補(bǔ)的內(nèi)容,則需要聚合單元3434對(duì)多個(gè)候選篇章的信息進(jìn)行聚合。
      當(dāng)前第3頁(yè)1 2 3 4 5 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1