智能問答系統(tǒng)的信息處理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及人機交互技術(shù)領(lǐng)域,尤其涉及智能問答系統(tǒng)的信息處理方法及裝置。
【背景技術(shù)】
[0002]人機交互是研究系統(tǒng)與用戶之間的交互關(guān)系的科學。系統(tǒng)可以是各種各樣的機器,也可以是計算機化的系統(tǒng)和軟件。例如,通過人機交互可以實現(xiàn)各種人工智能系統(tǒng),例如,智能客服系統(tǒng)、語音控制系統(tǒng)等等。人工智能語義識別是人機交互的基礎(chǔ),其能夠?qū)θ祟愓Z言進行識別,以轉(zhuǎn)換成機器能夠理解的語言。
[0003]智能問答系統(tǒng)是人機交互的一種典型應(yīng)用,其中當用戶提出問題后,智能問答系統(tǒng)給出該問題的答案。為此,智能問答系統(tǒng)中有一套知識庫,里面有大量的問題和與每個問題相對應(yīng)的答案。智能問答系統(tǒng)首先需要識別用戶所提出的問題,即從知識庫中找到與該用戶問題所對應(yīng)的問題,然后找出與該問題相匹配的答案。
[0004]如何提高智能問答系統(tǒng)的答復(fù)正確率是一項重要挑戰(zhàn)。
【發(fā)明內(nèi)容】
[0005]以下給出一個或多個方面的簡要概述以提供對這些方面的基本理解。此概述不是所有構(gòu)想到的方面的詳盡綜覽,并且既非旨在指認出所有方面的關(guān)鍵性或決定性要素亦非試圖界定任何或所有方面的范圍。其唯一的目的是要以簡化形式給出一個或多個方面的一些概念以為稍后給出的更加詳細的描述之序。
[0006]根據(jù)本發(fā)明的一方面,提供了一種智能問答系統(tǒng)的信息處理方法,該智能問答系統(tǒng)包括問答數(shù)據(jù)庫,該問答數(shù)據(jù)庫包括標準問集合,每個標準問具有對應(yīng)的一個答案,該信息處理方法包括:
[0007]基于所述問答數(shù)據(jù)庫中的所述標準問集合對用戶問題執(zhí)行語義相似度計算以匹配所對應(yīng)的標準問;
[0008]響應(yīng)于標準問匹配失敗,基于從所述答案中提取的擴展問對所述用戶問題執(zhí)行語義相似度計算以匹配所對應(yīng)的擴展問;以及
[0009]響應(yīng)于擴展問匹配成功,則將與所匹配的擴展問對應(yīng)的答案輸出作為所述用戶問題的答案。
[0010]在一實例中,一個所述答案拆分為一個或多個擴展問。
[0011]在一實例中,若所述標準問集合中與所述用戶問題的語義相似度最高的標準問與所述用戶問題的語義相似度大于第一預(yù)設(shè)閾值,則所述語義相似度最高的標準問為與所述用戶問題所匹配的對應(yīng)標準問,標準問匹配成功;若所述標準問集合中與所述用戶問題的語義相似度最高的標準問與所述用戶問題的語義相似度小于所述第一預(yù)設(shè)閾值,則標準問匹配失敗。
[0012]在一實例中,該信息處理方法還包括:
[0013]響應(yīng)于標準問匹配成功,則將所匹配的標準問對應(yīng)的答案輸出作為所述用戶問題的答案。
[0014]在一實例中,若與所述用戶問題的語義相似度最高的擴展問與所述用戶問題的語義相似度大于第二預(yù)設(shè)閾值,則所述語義相似度最高的擴展問為與所述用戶問題所匹配的對應(yīng)擴展問,擴展問匹配成功;若與所述用戶問題的語義相似度最高的擴展問與所述用戶問題的語義相似度小于所述第二預(yù)設(shè)閾值,則擴展問匹配失敗。
[0015]根據(jù)本發(fā)明的另一方面,提供了一種智能問答系統(tǒng)的信息處理裝置,該智能問答系統(tǒng)包括問答數(shù)據(jù)庫,該問答數(shù)據(jù)庫包括標準問集合,每個標準問具有對應(yīng)的一個答案,該信息處理裝置包括:
[0016]語義相似度計算模塊,用于基于所述問答數(shù)據(jù)庫中的所述標準問集合對用戶問題執(zhí)行語義相似度計算以匹配所對應(yīng)的標準問,
[0017]擴展問提供模塊,用于從所述答案中提取擴展問;
[0018]所述語義相似度計算模塊進一步響應(yīng)于標準問匹配失敗,基于所述擴展問對所述用戶問題執(zhí)行語義相似度計算以匹配所對應(yīng)的擴展問;以及
[0019]答案輸出模塊,用于響應(yīng)于擴展問匹配成功,則將與所匹配的擴展問對應(yīng)的答案輸出作為所述用戶問題的答案。
[0020]在一實例中,所述擴展問提供模塊將一個所述答案拆分為一個或多個擴展問。
[0021]在一實例中,若所述標準問集合中與所述用戶問題的語義相似度最高的標準問與所述用戶問題的語義相似度大于第一預(yù)設(shè)閾值,則所述語義相似度最高的標準問為與所述用戶問題所匹配的對應(yīng)標準問,標準問匹配成功;若所述標準問集合中與所述用戶問題的語義相似度最高的標準問與所述用戶問題的語義相似度小于所述第一預(yù)設(shè)閾值,則標準問匹配失敗。
[0022]在一實例中,所述答案輸出模塊還響應(yīng)于標準問匹配成功,則將所匹配的標準問對應(yīng)的答案輸出作為所述用戶問題的答案。
[0023]在一實例中,若與所述用戶問題的語義相似度最高的擴展問與所述用戶問題的語義相似度大于第二預(yù)設(shè)閾值,則所述語義相似度最高的擴展問為與所述用戶問題所匹配的對應(yīng)擴展問,擴展問匹配成功;若與所述用戶問題的語義相似度最高的擴展問與所述用戶問題的語義相似度小于所述第二預(yù)設(shè)閾值,則擴展問匹配失敗。
[0024]通過利用從標準問答案中提取出的擴展問來執(zhí)行與用戶問題的語義相似度計算,進一步提高了智能問答系統(tǒng)的回答用戶問題的準確率,減少了后續(xù)的人工維護成本。
【附圖說明】
[0025]在結(jié)合以下附圖閱讀本公開的實施例的詳細描述之后,能夠更好地理解本發(fā)明的上述特征和優(yōu)點。在附圖中,各組件不一定是按比例繪制,并且具有類似的相關(guān)特性或特征的組件可能具有相同或相近的附圖標記。
[0026]圖1是示出了根據(jù)本發(fā)明的一方面的智能問答系統(tǒng)的信息處理方法的流程圖;以及
[0027]圖2是示出了根據(jù)本發(fā)明的一方面的智能問答系統(tǒng)的信息處理裝置的框圖。
【具體實施方式】
[0028]以下結(jié)合附圖和具體實施例對本發(fā)明作詳細描述。注意,以下結(jié)合附圖和具體實施例描述的諸方面僅是示例性的,而不應(yīng)被理解為對本發(fā)明的保護范圍進行任何限制。
[0029]知識庫中的基本知識點最原始和最簡單的形式就是平時常用的FAQ,一般的形式是“問-答”對。在本發(fā)明中,“標準問”是用來表示某個知識點的文字,主要目標是表達清晰,便于維護。例如,“彩鈴的資費”就是表達清晰的標準問描述。這里的“問”不應(yīng)被狹義地理解為“詢問”,而應(yīng)廣義地來理解一“輸入”,該“輸入”具有對應(yīng)的“輸出”。例如,對于用于控制系統(tǒng)的語義識別而言,用戶的一個指令,例如“打開收音機”也應(yīng)可以被理解為是一個“問”,此時對應(yīng)的“答”可以是用于執(zhí)行相應(yīng)控制的控制程序的調(diào)用。
[0030]用戶在向機器輸入時,最理想的情況是使用標準問,則機器的智能語義識別系統(tǒng)馬上能夠理解用戶的意思。但是,往往用戶使用的問題與標準問有一定差異。因此,實踐中,會對用戶問題與標準問執(zhí)行語義相似度計算,只要語義相似度達到一定程度,則認為用戶所問的問題即對應(yīng)該標準問,從而提供與該標準問對應(yīng)的答案。因此,為了提高系統(tǒng)的問答能力,需要不斷地增大數(shù)據(jù)庫中標準問的量或者形式(例如,標準問的相似問)。
[0031]根據(jù)本發(fā)明的一方面,在數(shù)據(jù)庫中標準問的量一定的情況下,通過利用這些標準問的答案來提高問答系統(tǒng)的問答能力。
[0032]圖1是示出了根據(jù)本發(fā)明的一方面的智能問答系統(tǒng)的信息處理方法100的流程圖。該智能問答系統(tǒng)包括問答數(shù)據(jù)庫,該問答數(shù)據(jù)庫包括標準問集合。標準問集合中的每個標準問都具有對應(yīng)的答案。
[0033]以手機業(yè)務(wù)咨詢相關(guān)的智能問答系統(tǒng)為例,標準問集合包括若干關(guān)于手機業(yè)務(wù)的標準問。例如:
[0034]標準問:彩鈴的資費標準;
[0035]標準答案:尊敬的用戶,您好,彩鈴業(yè)務(wù)5元/月。提示:月初扣款。
[0036]在步驟102,基于問答數(shù)據(jù)庫中的該標準問集合對用戶問題執(zhí)行語義相似度計算以匹配所對應(yīng)的標準問。
[0037]S卩,收到用戶提出的用戶問題之后,首先判斷該用戶問題對應(yīng)于標準問集合中的哪個問題。在一實例中,可以計算該用戶問題與標準問集合中所有標準問的語義相似度。例如,可采用文本聚類分析、LDA分析或序列分析中的任一者或任意組合來執(zhí)行該語義相似度計算。
[0038]然后,找出與該用戶問題具有最高語義相似度的標準問,若該最高的語義相似度高于第一預(yù)設(shè)閾值,例如0.9,則認為找到了與該用戶問題相匹配的對應(yīng)標準問。反之,若小于該第一閾值,則視為匹配失敗,未找到與該