国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      非事實(shí)類提問應(yīng)答系統(tǒng)以及方法

      文檔序號(hào):9635171閱讀:861來源:國(guó)知局
      非事實(shí)類提問應(yīng)答系統(tǒng)以及方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及利用了計(jì)算機(jī)以及網(wǎng)絡(luò)的提問應(yīng)答系統(tǒng),特別涉及針對(duì)詢問某件事情 的理由等的所謂的為什么型提問等被稱作非事實(shí)(non-factoid)類提問的提問的應(yīng)答系 統(tǒng)。
      【背景技術(shù)】
      [0002] 關(guān)于針對(duì)某些事實(shí)的提問應(yīng)答(QA)的研究最近取得大的進(jìn)步。當(dāng)前,IBM公司的 Watson、Apple公司的Siri等提問應(yīng)答系統(tǒng)的改善特別突出,一部分已經(jīng)開始商用利用。另 外,這些以外的企業(yè)也在推進(jìn)同樣的開發(fā)。對(duì)于與事實(shí)相關(guān)的提問據(jù)說其精度為85%程度。
      [0003] 另一方面,在不是與事實(shí)相關(guān)的提問,而是從大量的文檔提取針對(duì)像「為什么會(huì)得 癌癥?」那樣詢問發(fā)生某些事態(tài)的理由的提問的回答即為什么型提問應(yīng)答的情況下,則被 認(rèn)識(shí)為是非常困難的任務(wù)。上述的IBM公司以及Apple公司的產(chǎn)品也未應(yīng)對(duì)為什么型提問。
      [0004] 關(guān)于該問題,例如后述的非專利文獻(xiàn)1公開了如下技法:在所謂的信息檢索的技 法中,特別在信息檢索的查詢中加進(jìn)「理由」這樣的單詞,來從大量的文檔中檢索包含針對(duì) 給出的為什么型提問的回答的一段。非專利文獻(xiàn)2公開了如下技術(shù):將人工制作的表征原 因和結(jié)果的單詞對(duì)的數(shù)據(jù)庫(kù)、或表征理由的句法型式的數(shù)據(jù)庫(kù)中出現(xiàn)的單詞對(duì)以及型式用 作屬性,通過有指導(dǎo)學(xué)習(xí)來確定回答。
      [0005] 另一方面,和這些不同,在非專利文獻(xiàn)3中公開了如下技術(shù):將文本的結(jié)構(gòu)性特 征、即局部句法樹、單詞的意義上的歸類、評(píng)價(jià)表現(xiàn)等的意義上的特征用作屬性,通過有指 導(dǎo)學(xué)習(xí)來確定回答。
      [0006] 現(xiàn)有技術(shù)文獻(xiàn)
      [0007] 非專利文獻(xiàn)
      [0008] 非專利文獻(xiàn) 1:MasakiMurata,SachiyoTsukawaki,ToshiyukiKanamaru, QingMa,andHitoshiIsahara.Asystemforansweringnon-factoidJapanesequestions byusingpassageretrievalweightedbasedontypeofanswer.InProceedingsof NTCIR-6,2007.
      [0009] 非專利文獻(xiàn) 2:RyuichiroHigashinakaandHidekiIsozaki.Corpus-based questionansweringforwhy-questions.InProceedingsofIJCNLP,pages418_425., 2008.
      [0010] 非專利文獻(xiàn)3 :Jong_HoonOh,KentaroTorisawa,ChikaraHashimoto,Takuya Kawada,StijnDeSaeger?Jun^ichiKazamaandYiouWang.WhyQuestionAnswering usingSentimentAnalysisandWordClasses,InProceedingsofEMNLP-CoNLL2012, pp. 368-378.
      [0011] 發(fā)明的概要
      [0012] 發(fā)明要解決的課題
      [0013] 上述任意的現(xiàn)有技術(shù)雖然都有用,但在使任務(wù)的性質(zhì)充分反映在所利用的屬性以 及其他信息中的意義上,認(rèn)為依然有改善的余地。特別在使該任務(wù)的性質(zhì)得到反映的手法 中,更有效率地利用因果關(guān)系的重要的。因果關(guān)系是重要的這樣的問題在本技術(shù)領(lǐng)域得到 廣泛的認(rèn)識(shí),但在現(xiàn)有技術(shù)中,有作為因果關(guān)系僅關(guān)注名詞短語間的因果關(guān)系這樣的問題。 并且由于認(rèn)為名詞短語間的因果關(guān)系原則上出現(xiàn)在1句中,因此僅利用在同一句內(nèi)的名詞 短語間的因果關(guān)系。
      [0014] 然而,實(shí)際上因果關(guān)系并非僅有名詞短語間的因果關(guān)系。有時(shí)在名詞短語間以及 名詞短語與動(dòng)詞短語間都存在因果關(guān)系。進(jìn)而,有跨2句出現(xiàn)因果關(guān)系的情況,這一點(diǎn)在過 去一直置之不理??偠灾霈F(xiàn)在文檔數(shù)據(jù)內(nèi)的因果關(guān)系的形式是多樣的,在為什么型提 問應(yīng)答系統(tǒng)中,需要在認(rèn)識(shí)這樣的多樣的形式的因果關(guān)系的基礎(chǔ)上再將其信息用在回答提 取中。然而,過去對(duì)這樣的多樣性一直沒有關(guān)注。
      [0015] 進(jìn)而,在要基于這樣的多樣的形式的因果關(guān)系來得到提問的回答的情況下,有如 何處置與如此的因果關(guān)系相關(guān)的信息尚不明確這樣的問題。

      【發(fā)明內(nèi)容】

      [0016] 為此本發(fā)明的目的在于,提供能通過合適地處置出現(xiàn)在文檔內(nèi)的因果關(guān)系的多樣 的表現(xiàn),來對(duì)非事實(shí)類提問給出合適的回答的非事實(shí)類提問應(yīng)答系統(tǒng)。
      [0017] 用于解決課題的手段
      [0018] 本發(fā)明的第1局面所涉及的非事實(shí)類的提問應(yīng)答系統(tǒng)是接受非事實(shí)類的提問的 輸入、生成針對(duì)該提問的回答的系統(tǒng),與存儲(chǔ)計(jì)算機(jī)可讀的多個(gè)文檔的文檔存儲(chǔ)單元連接 而使用。該系統(tǒng)包括:候補(bǔ)檢索單元,其響應(yīng)于接受到提問的輸入,從文檔存儲(chǔ)單元取出 針對(duì)該提問的回答候補(bǔ);屬性生成單元,其響應(yīng)于由候補(bǔ)檢索單元檢索到回答候補(bǔ),對(duì)提 問、和由候補(bǔ)檢索單元檢索到的各個(gè)回答候補(bǔ)的組合生成給定的屬性的集合;和回答選擇 單元,其在被給予由屬性生成單元生成的屬性的集合時(shí),對(duì)成為生成該屬性的集合的基礎(chǔ) 的提問和回答候補(bǔ)算出表示該回答候補(bǔ)是針對(duì)該提問的正確的回答的程度的評(píng)分,將評(píng)分 最高的回答候補(bǔ)作為針對(duì)提問的回答輸出。屬性生成單元包括:第1屬性算出單元,其對(duì) 提問以及各回答候補(bǔ)算出根據(jù)各自的詞素信息(morphemeinformation)以及語法信息 (syntacticinformation)求取的第1屬性的組;和第2屬性算出單元,其選擇各回答候補(bǔ) 中的因果關(guān)系表現(xiàn)中作為給出針對(duì)提問的回答相應(yīng)的因果關(guān)系表現(xiàn),算出從該因果關(guān)系表 現(xiàn)得到的第2屬性的組。屬性的集合包含第1屬性的組和第2屬性的組。
      [0019] 根據(jù)該非事實(shí)類的提問應(yīng)答系統(tǒng),能將回答候補(bǔ)中的因果關(guān)系表現(xiàn)作為給出針對(duì) 提問的回答的因果關(guān)系表現(xiàn)是否相應(yīng)用作第2組的屬性。通過在選擇回答候補(bǔ)的基礎(chǔ)上對(duì) 該因果關(guān)系表現(xiàn)進(jìn)行考慮,能使提問的表現(xiàn)和因果關(guān)系的表現(xiàn)的含意關(guān)系反映在回答的選 擇中。其結(jié)果,能提供通過合適地處置出現(xiàn)在文檔內(nèi)中的因果關(guān)系的多樣的表現(xiàn)來對(duì)非事 實(shí)類提問給出合適的回答的非事實(shí)類提問應(yīng)答系統(tǒng)。
      [0020] 優(yōu)選地,候補(bǔ)檢索單元包括:分類單元,其響應(yīng)于接受到提問的輸入,將該提問分 類為給定的多個(gè)類型的任意者;句分割單元,其響應(yīng)于接受到提問的輸入,將存儲(chǔ)于文檔存 儲(chǔ)單元的各文檔分割為由連續(xù)的1個(gè)或多個(gè)句構(gòu)成的句的組,并輸出;和對(duì)由句分割單元 輸出的各句的組根據(jù)遵循分類單元的分類結(jié)果確定的基準(zhǔn)來算出評(píng)分、將該評(píng)分上位的句 的組作為回答候補(bǔ)而輸出的單元。
      [0021] 更優(yōu)選地,第2屬性算出單元包括:線索表現(xiàn)確定單元,其在各回答候補(bǔ)中確定成 為用于因果關(guān)系表現(xiàn)的確定的線索的表現(xiàn);因果關(guān)系表現(xiàn)確定單元,其確定通過在各回答 候補(bǔ)中線索表現(xiàn)確定單元所確定的線索表現(xiàn)連接起來的由因果關(guān)系的原因部分和結(jié)果部 分給出的因果關(guān)系表現(xiàn);一致判定單元,其判定包含于確定的因果關(guān)系表現(xiàn)的結(jié)果部分中 的名詞和修飾該名詞的謂語的極性的組合、以及包含于提問中的名詞的意義和修飾該名詞 的謂語的極性的組合是否一致;相應(yīng)性判定單元,其使用一致判定單元的判定結(jié)果、和各回 答候補(bǔ)與提問間的單詞匹配以及修飾被修飾樹的子樹匹配來判定在各回答候補(bǔ)中由因果 關(guān)系表現(xiàn)確定單元確定的因果關(guān)系表現(xiàn)作為針對(duì)提問的回答是否相應(yīng);和將表示相應(yīng)性判 定單元的判定結(jié)果的信息作為第2屬性的組的屬性輸出的單元。
      [0022] 也可以讓第2屬性算出單元還包括:將由因果關(guān)系表現(xiàn)確定單元確定的因果關(guān) 系表現(xiàn)的單詞的n-gram、該因果關(guān)系表現(xiàn)中的修飾被修飾樹的子樹的n-gram、或者包含于 該因果關(guān)系表現(xiàn)中的謂語的極性、或它們的任意的組合作為第2屬性的組的屬性輸出的單 JL·〇
      [0023] 也可以讓第2屬性算出單元還包括:將由因果關(guān)系表現(xiàn)確定單元確定的因果關(guān)系 表現(xiàn)當(dāng)中的結(jié)果部分和提問共有的單詞、修飾被修飾樹的子樹、活性的謂語的數(shù)量、或者非 活性的謂語的數(shù)量、或它們的任意的組合作為第2屬性的組的屬性輸出的單元。
      [0024] 本發(fā)明的第2方面所涉及的計(jì)算機(jī)程序使計(jì)算機(jī)作為上述任意的非事實(shí)類的提 問應(yīng)答系統(tǒng)的全部單元發(fā)揮功能。
      [0025] 本發(fā)明的另一方面所涉及的非事實(shí)類的提問應(yīng)答方法接受非事實(shí)類的提問的輸 入,生成針對(duì)該提問的回答。該方法使用存儲(chǔ)計(jì)算機(jī)可讀的多個(gè)文檔的文檔存儲(chǔ)單元執(zhí)行。 該方法包括:候補(bǔ)檢索步驟,響應(yīng)于接受到提問的輸入,從文檔存儲(chǔ)單元取出針對(duì)該提問的 回答候補(bǔ);屬性生成步驟,響應(yīng)于在候補(bǔ)檢索步驟檢索到回答候補(bǔ),對(duì)提問、和在候補(bǔ)檢索 步驟檢索到的各個(gè)回答候補(bǔ)的組合生成給定的屬性的集合;和回答選擇步驟,響應(yīng)于被給 予在屬性生成步驟生成的屬性的集合,對(duì)成為生成該屬性的集合的基礎(chǔ)的提問和回答候補(bǔ) 算出表示該回答候補(bǔ)是針對(duì)該提問的正確的回答的程度的評(píng)分,將評(píng)分最高的回答候補(bǔ)作 為針對(duì)提問的回答輸出。屬性生成步驟包括:第1屬性算出步驟,對(duì)提問以及各回答候補(bǔ)算 出根據(jù)各自的詞素信息以及語法信息求取的第1屬性的組;和第2屬性算出步驟,選擇各回 答候補(bǔ)中的因果關(guān)系表現(xiàn)中作為給出針對(duì)提問的回答相應(yīng)的因果關(guān)系表現(xiàn),算出從該因果 關(guān)系表現(xiàn)得到的第2屬性的組。屬性的集合包含第1屬性的組和第2屬性的組。
      【附圖說明】
      [0026] 圖1是本發(fā)明的1個(gè)實(shí)施方式所涉及的非事實(shí)類提問應(yīng)答系統(tǒng)的概略框圖。
      [0027] 圖2是用于說明從修飾被修飾樹中的子樹得到的n-gram的圖。
      [0028] 圖3是用于說明因果關(guān)系的形式的圖。
      [0029] 圖4是用于說明針對(duì)提問的回答的相應(yīng)性的圖。
      [0030] 圖5是用于說明在圖1所示的系統(tǒng)中選擇回答候補(bǔ)的方法的示意圖。
      [0031] 圖6是表不回答候補(bǔ)的列表例的圖。
      [0032] 圖7是表示從回答候補(bǔ)中確定表示因果關(guān)系的線索的單詞的方法的圖。
      [0033] 圖8是說明謂語的活性/非活性的圖。
      [0034] 圖9是表示圖1所示的系統(tǒng)當(dāng)中因果關(guān)系認(rèn)識(shí)部的構(gòu)成的框圖。
      [0035] 圖10是表示圖1所示的因果關(guān)系相應(yīng)性判定部的構(gòu)成的框圖。
      [0036] 圖11是表示圖1所示的回答候補(bǔ)排序部的構(gòu)成的框圖。
      [0037] 圖12是表示本發(fā)明的1個(gè)實(shí)施方式所使用的屬性當(dāng)中、和現(xiàn)有技術(shù)所使用的屬性 相同的屬性的圖。
      [0038] 圖13是用于說明本發(fā)明的實(shí)施方式帶來的效果的圖表。
      [0039] 圖14是表示用于實(shí)現(xiàn)本發(fā)明的1個(gè)實(shí)施方式所涉及的提問應(yīng)答系統(tǒng)的計(jì)算機(jī)的 外觀的示意圖。
      [0040] 圖
      當(dāng)前第1頁(yè)1 2 3 4 5 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1