專利名稱:基于自然語言的人機對話系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基于自然語言的人機對話系統(tǒng),尤其是一種實現(xiàn)機器對自然語言的理 解,可用于實現(xiàn)人與汽車、人與機器人、人與手機以及人與計算機的對話和交談。
背景技術(shù):
當今社會已進入到了一個科技日新月異的時代。其中,一個最明顯的標志是高科 技產(chǎn)品大量涌入消費市場。它們?yōu)槿藗兊墓ぷ?,生活,交流,學習和交通帶來了很大的便利 和享受。另一方面,高科技產(chǎn)品的普及也為高科技產(chǎn)品自身的提升帶來很大的挑戰(zhàn)。其中, 一大瓶頸是基于自然語言的人機對話。要實現(xiàn)基于自然語言的人機對話,有兩大問題需要解決。一是把語音信號轉(zhuǎn)換成 文字符號;二是把文字符號轉(zhuǎn)換成物理意義(即本發(fā)明所述的“知識”)。目前,第一個問題 已得到較好解決,它就是人們通常所說的語音識別技術(shù)。但是,當今的語音識別技術(shù)沒有解 決語言文字理解這個問題。比如,現(xiàn)有的人機對話系統(tǒng)和信息搜索產(chǎn)品都使用查表算法。從 根本上說,它們都沒有解決機器對自然語言文字的理解。這一缺陷導致很多高科技產(chǎn)品,無 法實現(xiàn)一些非常有用的功能?,F(xiàn)列舉如下例子大家知道,汽車是大家喜愛的大眾消費品。但是,汽車的功能主要局限在交通(即 代步工具)和娛樂兩個方面。由于汽車自身不會使用自然語言和人交流,汽車作為移動信 息平臺的功能受到很大制約。其次,電腦也是非常普及的消費品,但是,電腦的消費群體要有一定的專業(yè)知識才 能自如地使用電腦。由于人們還無法以對話的形式和電腦交流,這一局限使得電腦難在非 專業(yè)人士中普及。例如,為了使用電腦開發(fā)運用軟件,人們必需學會機器語言。這是因為世 界上沒有一臺電腦能懂得人們?nèi)粘S玫淖匀徽Z言(比如說中文或英文)。也就是說,人們 還無法通過自然語言去告訴電腦要去做什么,或回答人們的提問。如今,手提數(shù)字電話的普及率非常高。手提電話把人們交流的時空大大地縮小了。 但是,人們使用手提電話交流的前題是,雙方要說同一種自然語言。這是因為,目前的手提 電話不具備實時同步翻譯自然語言的有效技術(shù)。這一技術(shù)瓶頸,限制了不同語種群體之間 進行跨越時空的實時會話。展望未來,在日本等國家的推動下,家用機器人將成為普及率很高的消費品之一。 為了實現(xiàn)這個商業(yè)目標,目前急待要解決的一大技術(shù)難題是,基于自然語言的人機對話。至 今,人們還沒有找到解決這個難題的鎖匙。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種可以用于實現(xiàn)人與汽車、人與機器人、人與手機以及人 與計算機的對話和交談,基于自然語言的人機對話系統(tǒng)。本發(fā)明的目的是通過采用以下技術(shù)方案來實現(xiàn)的基于自然語言的人機對話系統(tǒng),包括依次連接的輸入裝置、中央處理器單元和輸出裝置,所述人機對話系統(tǒng)輸入裝置包括語音感應(yīng)器;中央處理器單元內(nèi)設(shè)有專用軟件,其包括語音識別模塊、意義知識庫、自然語言文 字學習和理解模塊、故事情節(jié)重構(gòu)模塊以及故事描述和提問模塊;輸出裝置包括顯示器、揚聲器或打印設(shè)備;所述語音感應(yīng)器可以將感應(yīng)信號輸入到中央處理器單元處理,中央處理器單元通 過其設(shè)有的專用軟件處理后,將信號輸出到輸出裝置,并由輸出裝置將信號以視頻、音頻或 打印方式輸出。作為本發(fā)明的優(yōu)選技術(shù)方案,所述意義知識庫把外部世界分成物理世界和概念世 界,其中,概念世界是對物理世界的一種描述或投影,這種描述或投影是通過任何一種自然 語言來實現(xiàn)的,在此定義的基礎(chǔ)上,本發(fā)明中的意義知識庫的設(shè)計包含物理知識和概念知 識兩大類;根據(jù)這個設(shè)計方案,知識庫中的每個自然實物都由一對物理實體和單字實體構(gòu) 成;物理實體的意義指物理特征和物理約束;單字實體的意義指單字特征和單字約束;它 們可以用計算機編程語言的類(即Class)來實現(xiàn)。作為本發(fā)明的優(yōu)選技術(shù)方案,所述每個實體的知識由基礎(chǔ)知識構(gòu)成,基礎(chǔ)知識的 有機結(jié)合構(gòu)成綜合知識;按照所述每個物理實體的設(shè)計包含該物理實體的物理特征和它的 物理約束,它們定義了一個物理實體的基礎(chǔ)知識;所述物理特征包括尺寸、形狀、體狀、質(zhì) 量、硬度、傳導性等等;它們可用適當?shù)臄?shù)據(jù)結(jié)構(gòu)來實現(xiàn);物理約束包括運動約束、動力約 束、電力約束、化學約束、熱力約束等等;它們可用適當?shù)姆匠毯秃瘮?shù)來實現(xiàn);按照本發(fā)明所述,物理世界的綜合知識由以下設(shè)計的關(guān)系矩陣構(gòu)成(a)實體關(guān)系矩陣,它是一個三維矩陣,比如,T(0i,0j,fk)描述一對實體Oi和實體 Oj在特征關(guān)系fk下的邏輯值或一般函數(shù),按照本發(fā)明的描述,特征關(guān)系fk包括前后關(guān)系, 左右關(guān)系,上下關(guān)系,內(nèi)外關(guān)系,遠近關(guān)系,大小關(guān)系,主次關(guān)系,輕重關(guān)系,冷熱關(guān)系,色彩 關(guān)系,明暗關(guān)系等等;(b)行為關(guān)系矩陣,它是一個三維矩陣,比如,A(0i,0j,ck)描述一對實體Oi和實體 Oj在約束關(guān)系Ck下的邏輯值或時間函數(shù),它描述一對實體Oi和實體h的一種互動作用或 基本行為;按照本發(fā)明的描述,約束關(guān)系Ck包括運動約束,動力約束,電力約束,化學約束, 熱力約束等等;按照本發(fā)明的描述,一對實體Oi和實體h對應(yīng)于每個約束關(guān)系Ck的互動作 用組合A(0i,Oj., ck),就代表該對實體可能產(chǎn)生的所有基本行為;(c)事件關(guān)系矩陣,按照本發(fā)明的描述,一個事件概括一組相關(guān)的基本行為(即綜 合行為),它可用一個三維矩陣來實現(xiàn),比如,B(ai; aj; rk)描述一對基本行為 和基本行 為…在原因關(guān)系rk下的邏輯約束;按照本發(fā)明的描述,原因關(guān)系rk包括習慣取向,價值取 向,期望取向,常識取向,信仰取向等等;按照本發(fā)明的描述,邏輯約束B(ai,aj; rk)的選項 包括如果_則,如果_則不,如果_可能,同時發(fā)生;按照本發(fā)明的描述,基于每個基本行 為%和對應(yīng)于所有原因關(guān)系rk的組合B(ai,aj; rk),就代表一種與基本行為 有關(guān)的事件 (即綜合行為);(d)情節(jié)關(guān)系矩陣,按照本發(fā)明的描述,一個情節(jié)由一組相關(guān)的綜合行為組成,它 也可以用一個三維矩陣來描述;比方說,E(bi; bj; rk)表示綜合行為h和綜合行為bj在原 因關(guān)系rk下的邏輯約束;按照本發(fā)明的描述,原因關(guān)系rk包括習慣取向,價值取向,期望取 向,常識取向,信仰取向;按照本發(fā)明的描述,邏輯約束EOvIvrk)的選項包括如果-貝U,如果_則不,如果_可能,同時發(fā)生;按照本發(fā)明的描述,基于每個綜合行為h和對應(yīng)于所 有原因關(guān)系rk的組合E(bi; bj, rk)就代表一種與綜合行為h有關(guān)的情節(jié);(e)故事關(guān)系矩陣,按照本發(fā)明的描述,一個故事由一組相關(guān)的情節(jié)組成,同樣地, 它可以用一個三維矩陣來描述,比方說,S(ei; ej; rk)表示情節(jié)力和情節(jié)e」在原因關(guān)系rk 下的邏輯約束;按照本發(fā)明的描述,原因關(guān)系rk包括習慣取向,價值取向,期望取向,常識取 向,信仰取向;按照本發(fā)明的描述,邏輯約束S(ei; ej; rk)的選項包括如果-則,如果-則 不,如果_可能,同時發(fā)生;按照本發(fā)明的描述,基于每個情節(jié)ei和對應(yīng)于所有原因關(guān)系rk 的組合S(ei; ej; rk)就代表一種與情節(jié)&有關(guān)的故事。作為本發(fā)明的優(yōu)選技術(shù)方案,所述每個單字可以是簡單單字或復合單字(單詞); 每個單字實體的設(shè)計,包含了該單字實體的特征和它的約束;它們定義了關(guān)于一個單字實 體的基礎(chǔ)知識;按照本發(fā)明的描述,單字特征包括任何一種自然語言中一個單字的屬性; 比方說,名詞,動詞,形容詞,介詞;它們可用適當?shù)臄?shù)據(jù)結(jié)構(gòu)來實現(xiàn);單字約束包括任何一 種自然語言的語法;比方說,名詞前可以加形容詞,名詞后可以帶動詞;單字特征和單字約 束可用適當?shù)谋砀駚韺崿F(xiàn);按照本發(fā)明的描述,概念世界的綜合知識由以下設(shè)計的關(guān)系矩陣構(gòu)成(a)單字關(guān)系矩陣,在任何一種自然語言中,單字之間的有機結(jié)合構(gòu)成了詞組;這 種有機結(jié)合的約束來自物理世界和概念世界;這種約束關(guān)系可以用單詞關(guān)系矩陣來表示; 它是一個三維矩陣,比如,QOv Wj, wck)表示單字Wi和單字Wj在約束WCk下構(gòu)成的關(guān)系,該 關(guān)系定義一個詞組;按照本發(fā)明的描述,單字間的約束WCk包括形容詞-名詞,名詞-動 詞,介詞-名詞,動名詞-名詞;按照本發(fā)明的描述,基于單字Wi和對應(yīng)于所有約束關(guān)系WCk 的組合Q(Wi,Wj, WCk)就代表所有與單字Wi有關(guān)的詞組;按照本發(fā)明的描述,概念世界中的 每個單字,對應(yīng)于物理世界中的實物特征或約來;概念世界中的詞組,對應(yīng)于物理世界中的 基本行為;(b)詞組關(guān)系矩陣,按照本發(fā)明的描述,詞組的屬性決定了詞組間的前后排列順序 關(guān)系,這種排列關(guān)系可用三維矩陣來實現(xiàn),比如說,M(qi,qj; qck)表示詞組qi和詞組%在約 束qck的排列順序;按照本發(fā)明的描述,約束qck包括左右順排列和左右逆排列;按照本發(fā) 明的描述,以詞組Qi為中心,所有左側(cè)的左右逆排列和所有右側(cè)的左右順排列的任何一個 組合定義了一個與詞組Qi有關(guān)的句子;按照本發(fā)明的描述,概念世界中的每個句子,對應(yīng)于 物理世界中的一種行為;(c)句子關(guān)系矩陣,按照本發(fā)明的描述,句子之間可以有序地排列;這種排列順序 背后也存在一種約束;這種句子之間的約束關(guān)系可以用三維矩陣來實現(xiàn);比如,NOv mj; mck)表示句子Hli和句子Hlj在約束HlCk下的排列關(guān)系;按照本發(fā)明的描述,約束HlCk包括前 因_后果,假設(shè)_結(jié)果,列舉,切換,互補;按照本發(fā)明的描述,任選一個關(guān)健單字為輸入,首 先找出所有與它相關(guān)的詞組;然后,針對每一個詞組找出所有與它相關(guān)的句子;最后,在所 有約束mck下,這些句子的所有排列組合就定義了與該關(guān)健單字有關(guān)的段落;按照本發(fā)明的 描述,概念世界中的每個段落,對應(yīng)于物理世界中的一種事件;(d)段落關(guān)系矩陣,按照本發(fā)明的描述,段落之間也存在著有序的排列關(guān)系,它也 可以用三維矩陣來實現(xiàn),比如,Yfci,nj,yck)就表示段落Iii和段落η」在約束yck下的排列關(guān) 系,按照本發(fā)明的描述,約束yck包括邏輯與,邏輯和,邏輯否,時間先后,數(shù)量列舉,空間列
9舉,互補;按照本發(fā)明的描述,基于段落Iii和對應(yīng)于所有約束關(guān)系yck的組合Υ(η” nj; yck) 就代表所有與段落Iii有關(guān)的章節(jié);按照本發(fā)明的描述,概念世界中的每個章節(jié),對應(yīng)于物理 世界中的一種情節(jié);(e)章節(jié)關(guān)系矩陣,按照本發(fā)明的描述,章節(jié)之間也存在著有序的排列關(guān)系,它也 可以用三維矩陣來實現(xiàn),比如,Z (yi,yj, zck)就表示章節(jié)yi和章節(jié)yj在約束Zck下的排列關(guān) 系,按照本發(fā)明的描述,約束ZCk包括邏輯與,邏輯和,邏輯否,時間先后,數(shù)量列舉,空間列 舉,互補;按照本發(fā)明的描述,基于章節(jié)Yi和對應(yīng)于所有約束關(guān)系ZCk的組合Z(yi; yj; ZCk) 就代表所有與章節(jié)Yi有關(guān)的文章;按照本發(fā)明的描述,概念世界中的每個文章,對應(yīng)于物理 世界中的一個故事。作為本發(fā)明的優(yōu)選技術(shù)方案,所述自然語言文字學習和理解模塊包含對自然語言 文字的認知和識別兩個相輔相成的部分;按照本發(fā)明的描述,它的認知部分主要基于學習, 它對自然語言文字的學習既包含對文字的概念知識的學習,同時也包含對文字所指的物理 知識的學習;按照本發(fā)明的描述,自然語言文字學習和理解中的識別部分主要由句子分割、 合成句子和識別句子三功能塊組成;識別部分的輸出是與意義知識庫相容的有物理意義的 句子。作為本發(fā)明的優(yōu)選技術(shù)方案,所述對自然語言文字的識別主要基于合成與匹配的 原理;該原理的具體實現(xiàn)由下列功能模塊的組合來完成(a)單字分割,本模塊的輸入來自語言識別模塊,在輸入字符中,它找出空格間的 字符串,對某些自然語言,比如中文,一個字符就對應(yīng)一個單字;然后,它將每個字符串和意 義知識庫中的單字匹配,匹配成功,就輸出一個分割好的單字到下一模塊,否則,它進行學 習一個新的單字;(b)識別已知單字,根據(jù)輸入的每一個單字,它找出意義知識庫中的匹配的單字; 然后,它提取該單字所指的所有物理意義和所有概念意義;(c)句子分割,根據(jù)一串輸入單字,它確定一個句子的開頭和結(jié)尾,并將一串輸入 單字分割成一組句子;在簡單會話的情形下,一串輸入單字中只含一個完整的句子;(d)合成詞組,它的輸入是對應(yīng)于一個句子的一串單字;它根據(jù)單字的約束,形成 所有可能的詞組組合;(e)合成句子,它的輸入來自合成詞組,它根據(jù)詞組的約束,形成所有可能的句子; 然后,它把不符合物理意義的句子刪除掉,剩下的是一組完整的和有物理意義的句子;(f)識別句子,它的輸入來自合成句子和句子分割,它把聽到的句子和合成的句子 匹配,最佳匹配結(jié)果就是識別了的句子。作為本發(fā)明的優(yōu)選技術(shù)方案,所述對自然語言文字的認知,既包含學習概念知識, 也包括學習物理知識;它的作用是通過對話的形式獲取一個新單字(詞)的概念知識以及 該單字(詞)所指的物理知識;為不失一般性,對自然語言文字的認知,也可以通過按一定 方式設(shè)計的圖形界面獲?。话凑毡景l(fā)明的描述,學習概念知識通過對話的形式,由以下功能的組合來實現(xiàn)(a)概念知識提問合成,它首先提問,一個新單字泛指單字(詞)或符號?;針對 單字(詞),它根據(jù)一種自然語言的特性,預編好一系列提問;例如,是名詞嗎?是動詞嗎? 能給出一個常用案例嗎?;根據(jù)學習到的特征,它自動地確定一個新單字的約束,比如,名
10詞前可以加冠詞,名詞后可以帶動詞;按照本發(fā)明的描述,任何一個單詞有前置詞約束和后 置詞約束;(b)提問和語音合成,它的輸入來自概念知識提問合成,它通過商用語音合成器把 提問的文字符號轉(zhuǎn)成音頻信號;(c)語音識別模塊,交流對象聽到提問后,做出相應(yīng)的回答;按照本發(fā)明的描述, 交流對象的回答包括新單詞的特征,新單詞的常用案例;然后,該模塊對交流對象的音頻 信號進行識別,得到的輸出是理解了的回答;(d)概念知識回答識別,它的輸入來自語音識別,它從理解了的回答中,提取出 關(guān)于一個新單字的特征,以及常用的使用案例;并把這些概念知識存貯到適當?shù)臄?shù)據(jù)結(jié)構(gòu) 中;按照本發(fā)明的描述,學習物理知識通過對話的形式,由以下功能的組合來實現(xiàn)(e)物理知識提問合成,它首先提問,一個新單字泛指實體或符號?,然后,針對實 體,它預編好一系列與特征和約束有關(guān)的提問,例如體積?重量?物態(tài)?材料?顏色?用 途?導電性?導熱性?防水性?強度?硬度?氣味?;(f)提問和語音合成,它的輸入來自物理知識提問合成,它通過商用語音器合成, 把提問的文字符號轉(zhuǎn)成音頻信號;(g)語音識別模塊,交流對象聽到提問后,做出相應(yīng)的回答,按照本發(fā)明的描述,交 流對象的回答包括新單詞所指實體的特征,新單詞所指實體的約束;然后,該模塊對交流 對象的音頻信號進行識別,得到的輸出是理解了的回答;(h)物理知識回答識別,它的輸入來自語音識別,它從理解了的回答中,提取出關(guān) 于一個新單字所指實體的特征和約束;并把這些物理知識,存貯到適當?shù)臄?shù)據(jù)結(jié)構(gòu)中。作為本發(fā)明的優(yōu)選技術(shù)方案,所述故事情節(jié)重構(gòu)模塊首先讀取,自然語言文字學 習和理解模塊中的識別句子輸出;然后,它根據(jù)識別句子的物理知識,提取有關(guān)地點、時間、 人物、物件和原因的故事要素,其中,(a)地點重構(gòu)是把輸入文字(即聽到的語言文字)中的地點要素記錄下來,并以適 當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯;(b)時間重構(gòu)(40)是把輸入文字(即聽到的語言文字)中的時間點和時間段記錄 下來,并以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯;(c)人物重構(gòu)是把輸入文字(即聽到的語言文字)中的人物記錄下來,并以適當?shù)?數(shù)據(jù)結(jié)構(gòu)存貯;(d)物件重構(gòu)是把輸入文字(即聽到的語言文字)中的物體,物件和東西記錄下 來,并以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯;(e)原因重構(gòu)是把輸入文字(即聽到的語言文字)中的前因后果關(guān)系(例如動 作約束,行為約束,事件約束,和情節(jié)約束)記錄下來,并以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯;根據(jù)上述故事要素,故事情節(jié)重構(gòu)模塊通過三維場景合成和動畫圖像合成,把這 些故事要素制成各個時間點的場景和圖片;這些圖片在時間段的合成,則形成動畫;最后, 它用商用軟件工具,把動畫轉(zhuǎn)化成視頻信號輸出。作為本發(fā)明的優(yōu)選技術(shù)方案,所述故事描述和提問模塊的輸入來自兩個渠道,一 是故事情節(jié)重構(gòu)模塊中的故事要素,根據(jù)這些故事要素,本模塊重述聽懂的故事,或?qū)Σ幻靼字幪釂?;二是機器自身產(chǎn)生的故事要素,比方說,機器視覺系統(tǒng)所看到的場景和其中的 故事要素;在這種情況下,本模塊自述故事,或?qū)Σ幻靼字幪釂枺话凑毡景l(fā)明的描述,本 模塊首先以適當?shù)姆绞?,把故事要素轉(zhuǎn)換成概念世界中的相對應(yīng)單字和詞組;其中,(a)地點描述是把故事要素中的地點要素以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯,然后,在意義知 識庫中,將每個地點要素的相對應(yīng)單字和詞組取出,比如,地上,天上,桌上,左邊,右邊,前 方,后方;(b)時間描述是把故事要素中的時間點和時間段以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存C,然后,在 意義知識庫中,將每個時間要素的相對應(yīng)單字和詞組取出,比如,某時,某日,某月,某年;(c)人物描述是把故事要素中的人物以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯,然后,在意義知識 庫中,將每個人物要素的相對應(yīng)單字和詞組取出,比如,某人,某飛禽,某走畜,某昆蟲,某爬 蟲;(d)物件描述是把故事要素中的物件以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯,然后,在意義知識庫 中,將每個物件要素的相對應(yīng)單字和詞組取出,比如,桌子,椅子,杯子,汽車,水果,衣物,門 窗,燈具,文具,書本,電器,工具;(e)原因描述是把故事要素中的前因后果以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯,然后,在意義知 識庫中,將每個原因要素的相對應(yīng)單字和詞組取出,比如,因為-所以,先-后,引發(fā),導致;根據(jù)上述故事要素,故事描述和提問模塊以適當?shù)姆绞?,把故事要素轉(zhuǎn)換成概念 世界中的句子,比如,在同一時間點上,把人物和物件的空間關(guān)系用句子和段落表述出來, 或根據(jù)人物和物件的空間關(guān)系進行提問;其次,在不同時間點上,把人物和物件的相互作用 和行為用句子和段落表述出來,或根據(jù)人物和物件的相互作用和行為進行提問;最后,本模 塊通過商用語音合成器,把文字轉(zhuǎn)換成音頻信號輸出,或通過顯示和打印的方式輸出文字。本發(fā)明的有益效果是相對于現(xiàn)有技術(shù),本發(fā)明設(shè)計出一套完整的智能技術(shù)和方 案,它既提供了如何讓機器理解自然語言的方法,同時,本發(fā)明還提供了如何讓機器表述知 識和存貯知識的設(shè)計藍圖,基于本發(fā)明開發(fā)的產(chǎn)品,可以實現(xiàn)人與汽車、人與機器人、人與 手機、以及人與計算機的對話和交談。
下面結(jié)合附圖與具體實施例對本發(fā)明作進一步說明圖1 本發(fā)明的總設(shè)計方框圖;圖2 本發(fā)明意義知識 的設(shè)計方框圖;圖3 本發(fā)明自然語言文字學習和理解的功能流程圖;圖4 本發(fā)明學習未知單詞的功能流程圖;圖5 本發(fā)明故事情節(jié)重構(gòu)的設(shè)計方框圖;圖6 本發(fā)明故事描述和提問的設(shè)計方框圖。
具體實施例方式基于自然語言的人機對話系統(tǒng),本發(fā)明設(shè)計出一套完整智能技術(shù)和方案。它既提 供了如何讓機器理解自然語言的方法,同時,本發(fā)明還提供了如何讓機器表述知識和存貯 知識的設(shè)計藍圖。本發(fā)明可用于實現(xiàn)人與汽車、人與計算機、人與手機、和人與機器人的對話和交談。本發(fā)明的智能人機對話系統(tǒng)由以下模塊構(gòu)成參照圖1,本發(fā)明基于特別設(shè)計的知識庫(4),以及特別設(shè)計的自然語言的學習和 理解模塊(5),提出一套完整的基于自然語言的人機對話智能技術(shù)和方案。本發(fā)明由以下幾 部分組成語音感應(yīng)器(1),語音識別模塊(3),意義知識庫(4),自然語言文字學習和理解 模塊(5),故事情節(jié)重構(gòu)模塊(6)和故事描述和提問模塊(7)。具體實施細節(jié)如下所述1.語音感應(yīng)器(1)。它的作用是把來自交流對象(2)的音頻信號轉(zhuǎn)換成電子信號。 它可以選用常規(guī)的麥克風,或特制的音頻信號采集器件。按照本發(fā)明的描述,交流對象包括 自然人,具有會話能力的汽車,具有會話能力的計算機,具有會話能力的機器人,等等。2.語音識別模塊(3)。它的作用是把音頻電子信號轉(zhuǎn)換成某一自然語言的文字符 號。它可以選用商用產(chǎn)品,或自行開發(fā)的語言識別系統(tǒng)來完成這個功能。3.意義知識庫模塊(4)。按照本發(fā)明的描述,外部世界可分成物理世界和概念世 界。其中,概念世界是對物理世界的一種描述,或投影。這種描述或投影是通過任何一種自 然語言來實現(xiàn)的。在此定義的基礎(chǔ)上,本模塊把每個自然實物(8)的知識分成兩部分一是 物理世界中的物理知識,二是概念世界中的概念知識。按照本發(fā)明的描述,它把每種知識劃 分為,基礎(chǔ)知識和綜合知識。其中,基礎(chǔ)知識由特征和約束的組合來定義。綜合知識則由不 同等級的關(guān)系矩陣組成。在此基礎(chǔ)上,本模塊以特定的數(shù)據(jù)結(jié)構(gòu),來實現(xiàn)知識在物理世界和 概念世界之間的有機結(jié)合。4.自然語言文字學習和理解模塊(5)。按照本發(fā)明的描述,它包含對自然語言文 字的認知和識別兩個相輔相成的部分。按照本發(fā)明的描述,它的認知部分主要基于學習。按 照本發(fā)明的描述,自然語言文字的學習既包含對文字的概念知識的學習,同時也包含對文 字所指的物理知識的學習。按照本發(fā)明的描述,本模塊的識別部分主要基于句子分割(28)、 合成句子(30)和識別句子(31)三功能塊組成。識別部分的輸出是與意義知識庫(4)相容 的有物理意義的句子。5.故事情節(jié)重構(gòu)模塊(6)。按照本發(fā)明的描述,它首先讀取,自然語言文字學習 和理解模塊(5)中的識別句子(31)輸出。然后,它根據(jù)識別句子的物理知識,提取有關(guān)地 點、時間、人物、事物和原因的故事要素。最后,它通過三維場景合成(44)和動畫圖像合成 (45),把這些故事要素制成視頻信號輸出。按照本發(fā)明的描述,這些故事要素同時輸出到下 一模塊,即故事描述和提問模塊(7)。6.故事描述和提問模塊(7)。按照本發(fā)明的描述,它的輸入是來自上一模塊的故 事要素。首先,它以適當?shù)姆绞?,把故事要素轉(zhuǎn)換成概念世界中的相對應(yīng)單字和詞組。然后, 它再以適當?shù)姆绞剑压适乱剞D(zhuǎn)換成概念世界中的句子。根據(jù)需要,這些句子可以是描述 或提問。最后,它通過商用語音合成器,把文字轉(zhuǎn)換成音頻信號輸出,或通過顯示和打印的 方式輸出文字。參照圖1,本發(fā)明中涉及的語音感應(yīng)器(1)可以選用一般商用的麥克風,或特制的 音頻信號采集器件來實現(xiàn)。參照圖1,本發(fā)明中涉及的交流對象(2)通常指有會話能力的自然人。為不失一般 性,交流對象(2)也可以包括具有會話能力的計算機,具有會話能力的機器人,等等。參照圖1,本發(fā)明中涉及的語音識別模塊(3)可以選用市場上的語音識別產(chǎn)品來
13實現(xiàn)。參照圖1和圖2,本發(fā)明把外部世界分成物理世界和概念世界。其中,概念世界是 對物理世界的一種描述或投影。這種描述或投影是通過任何一種自然語言來實現(xiàn)的。在此 定義的基礎(chǔ)上,本發(fā)明中的意義知識庫(4)的設(shè)計包含,物理知識和概念知識兩大類。根據(jù) 這個設(shè)計方案,意義知識庫(4)中的每個自然實物(8)都由一對物理實體(9)和單字實體 (10)構(gòu)成。物理實體(9)的意義指,物理特征(11)和物理約束(12)。單字實體(10)的意 義指,單字特征(14)和單字約束(13)。它們可以用計算機編程語言的類(即Class)來實 現(xiàn)。參照圖2,按照本發(fā)明的描述,每個實體的知識由基礎(chǔ)知識構(gòu)成。然而,基礎(chǔ)知識的 有機結(jié)合,則構(gòu)成綜合知識。按照本發(fā)明的描述,每個物理實體(9)的設(shè)計包含該物理實體 的物理特征(11)和它的物理約束(12)。它們定義了一個物理實體(9)的基礎(chǔ)知識。按照 本發(fā)明的描述,物理特征(11)包括尺寸,形狀,體狀,質(zhì)量,硬度,傳導性,等等。它們可用適 當?shù)臄?shù)據(jù)結(jié)構(gòu)來實現(xiàn)。物理約束(12)包括運動約束,動力約束,電力約束,化學約束,熱力 約束,等等。它們可用適當?shù)姆匠毯秃瘮?shù)來實現(xiàn)。按照本發(fā)明的描述,物理世界的綜合知識由以下設(shè)計的關(guān)系矩陣構(gòu)成1.實體關(guān)系矩陣(15)。它是一個三維矩陣。比如,T(oi; Oj, fk)描述一對實體Oi 和實體%在特征關(guān)系fk下的邏輯值或一般函數(shù)。按照本發(fā)明的描述,特征關(guān)系fk包括前后 關(guān)系,左右關(guān)系,上下關(guān)系,內(nèi)外關(guān)系,遠近關(guān)系,大小關(guān)系,主次關(guān)系,輕重關(guān)系,冷熱關(guān)系, 色彩關(guān)系,明暗關(guān)系,等等。2.行為關(guān)系矩陣(16)。它是一個三維矩陣。比如,Hoi, Oj, ck)描述一對實體Oi 和實體h在約束關(guān)系Ck下的邏輯值或時間函數(shù)。它描述一對實體Oi和實體h的一種互動 作用,或基本行為。按照本發(fā)明的描述,約束關(guān)系Ck包括運動約束,動力約束,電力約束,化 學約束,熱力約束,等等。按照本發(fā)明的描述,一對實體Oi和實體h對應(yīng)于每個約束關(guān)系Ck 的互動作用組合A(0i,Oj., ck),就代表該對實體可能產(chǎn)生的所有基本行為。3.事件關(guān)系矩陣(17)。按照本發(fā)明的描述,一個事件概括一組相關(guān)的基本行為 (即綜合行為)。它可用一個三維矩陣來實現(xiàn)。比如,B(ai,aj,rk)描述一對基本行為 和 基本行為…在原因關(guān)系rk下的邏輯約束。按照本發(fā)明的描述,原因關(guān)系rk包括習慣取向, 價值取向,期望取向,常識取向,信仰取向,等等。按照本發(fā)明的描述,邏輯約束B (a,,Bj,rk) 的選項包括如果_則,如果_則不,如果_可能,同時發(fā)生,等等。按照本發(fā)明的描述,基于 每個基本行為%和對應(yīng)于所有原因關(guān)系rk的組合B(ai; aj; rk),就代表一種與基本行為% 有關(guān)的事件(即綜合行為)。4.情節(jié)關(guān)系矩陣(18)。按照本發(fā)明的描述,一個情節(jié)由一組相關(guān)的綜合行為組 成。它也可以用一個三維矩陣來描述。比方說,E(bi; bj; rk)表示綜合行為h和綜合行為 bj在原因關(guān)系rk下的邏輯約束。按照本發(fā)明的描述,原因關(guān)系rk包括習慣取向,價值取向, 期望取向,常識取向,信仰取向,等等。按照本發(fā)明的描述,邏輯約束E(bi; Ivrk)的選項包 括如果_則,如果_則不,如果_可能,同時發(fā)生,等等。按照本發(fā)明的描述,基于每個綜合 行為h和對應(yīng)于所有原因關(guān)系rk的組合E(bi; bj; rk)就代表一種與綜合行為h有關(guān)的情 節(jié)。5.故事關(guān)系矩陣(19)。按照本發(fā)明的描述,一個故事由一組相關(guān)的情節(jié)組成。同樣地,它可以用一個三維矩陣來描述。比方說,S(ei,ej,rk)表示情節(jié)力和情節(jié)e」在原因關(guān) 系rk下的邏輯約束。按照本發(fā)明的描述,原因關(guān)系rk包括習慣取向,價值取向,期望取向,常 識取向,信仰取向,等等。按照本發(fā)明的描述,邏輯約束S(ei,h,rk)的選項包括如果-則, 如果_則不,如果_可能,同時發(fā)生,等等。按照本發(fā)明的描述,基于每個情節(jié)ei和對應(yīng)于 所有原因關(guān)系rk的組合S(ei; ej; rk)就代表一種與情節(jié)力有關(guān)的故事。參照圖2,按照本發(fā)明的描述,每個單字可以是簡單單字,或復合單字(單詞)。每 個單字實體(10)的設(shè)計,包含了該單字實體的特征(14)和它的約束(13)。它們定義了關(guān) 于一個單字實體(10)的基礎(chǔ)知識。按照本發(fā)明的描述,單字特征(14)包括任何一種自然 語言中一個單字的屬性。比方說,名詞,動詞,形容詞,介詞,等等。它們可用適當?shù)臄?shù)據(jù)結(jié) 構(gòu)來實現(xiàn)。單字約束(13)包括任何一種自然語言的語法。比方說,名詞前可以加形容詞, 名詞后可以帶動詞,等等。單字特征(14)和單字約束(13)可用適當?shù)谋砀駚韺崿F(xiàn)。按照本發(fā)明的描述,概念世界的綜合知識由以下設(shè)計的關(guān)系矩陣構(gòu)成1.單字關(guān)系矩陣(20)。在任何一種自然語言中,單字之間的有機結(jié)合構(gòu)成了詞 組。這種有機結(jié)合的約束來自物理世界和概念世界。這種約束關(guān)系可以用單詞關(guān)系矩陣 (20)來表示。它是一個三維矩陣。比如,Q(WyWpWck)表示單字Wi和單字%在約束Wck下 構(gòu)成的關(guān)系。該關(guān)系定義一個詞組。按照本發(fā)明的描述,單字間的約束WCk包括形容詞-名 詞,名詞-動詞,介詞-名詞,動名詞-名詞,等等。按照本發(fā)明的描述,基于單字Wi,和對應(yīng) 于所有約束關(guān)系Wck的組合Q(Wi,%,wck)就代表所有與單字Wi有關(guān)的詞組。按照本發(fā)明的 描述,概念世界中的每個單字,對應(yīng)于物理世界中的實物特征或約來。概念世界中的詞組, 對應(yīng)于物理世界中的基本行為。2.詞組關(guān)系矩陣(21)。按照本發(fā)明的描述,詞組的屬性決定了詞組間的前后排列 順序關(guān)系。這種排列關(guān)系可用三維矩陣來實現(xiàn)。比如說,M(qi, ,qCk)表示詞組 和詞組 Qj在約束qck的排列順序。按照本發(fā)明的描述,約束qck包括左右順排列和左右逆排列。 按照本發(fā)明的描述,以詞組Qi為中心,所有左側(cè)的左右逆排列和所有右側(cè)的左右順排列的 任何一個組合定義了一個與詞組Qi有關(guān)的句子。按照本發(fā)明的描述,概念世界中的每個句 子,對應(yīng)于物理世界中的一種行為。3.句子關(guān)系矩陣(22)。按照本發(fā)明的描述,句子之間可以有序地排列。這種排列 順序背后也存在一種約束。這種句子之間的約束關(guān)系可以用三維矩陣來實現(xiàn)。比如,NOv HljjlIlCk)表示句子叫和句子Hlj在約束HlCk下的排列關(guān)系。按照本發(fā)明的描述,約束HlCk包括 前因_后果,假設(shè)_結(jié)果,列舉,切換,互補,等等。按照本發(fā)明的描述,任選一個關(guān)健單字為 輸入,首先找出所有與它相關(guān)的詞組。然后,針對每一個詞組找出所有與它相關(guān)的句子。最 后,在所有約束HlCk下,這些句子的所有排列組合就定義了,與該關(guān)健單字有關(guān)的段落。按 照本發(fā)明的描述,概念世界中的每個段落,對應(yīng)于物理世界中的一種事件。4.段落關(guān)系矩陣(23)。按照本發(fā)明的描述,段落之間也存在著有序的排列關(guān)系。 它也可以用三維矩陣來實現(xiàn)。比如,Yfci, nj; yck)就表示段落Iii和段落η」在約束yck下的 排列關(guān)系。按照本發(fā)明的描述,約束yck包括邏輯與,邏輯和,邏輯否,時間先后,數(shù)量列舉, 空間列舉,互補,等等。按照本發(fā)明的描述,基于段落Hi,和對應(yīng)于所有約束關(guān)系yck的組合 Y(I^rvyck)就代表所有與段落Iii有關(guān)的章節(jié)。按照本發(fā)明的描述,概念世界中的每個章 節(jié),對應(yīng)于物理世界中的一種情節(jié)。
5.章節(jié)關(guān)系矩陣(24)。按照本發(fā)明的描述,章節(jié)之間也存在著有序的排列關(guān)系。 它也可以用三維矩陣來實現(xiàn)。比如,Z(yi; yj; zck)就表示章節(jié)yi和章節(jié)yj在約束Zck下的 排列關(guān)系。按照本發(fā)明的描述,約束ZCk包括邏輯與,邏輯和,邏輯否,時間先后,數(shù)量列舉, 空間列舉,互補,等等。按照本發(fā)明的描述,基于章節(jié)Yi和對應(yīng)于所有約束關(guān)系ZCk的組合, Ziy1, Yj, zck)就代表所有與章節(jié)yi有關(guān)的文章。按照本發(fā)明的描述,概念世界中的每個文 章,對應(yīng)于物理世界中的一個故事。參照圖1、圖3和圖4,本發(fā)明中的自然語言文字學習和理解模塊(5)包含對自然 語言文字的認知和識別兩個相輔相成的部分。按照本發(fā)明的描述,它的認知部分主要基于 學習。它對自然語言文字的學習既包含對文字的概念知識的學習,同時也包含對文字所指 的物理知識的學習。按照本發(fā)明的描述,自然語言文字學習和理解模塊(5)中的識別部分 主要由句子分割(28)、合成句子(30)和識別句子(31)三功能塊組成。識別部分的輸出是 與意義知識庫(4)相容的有物理意義的句子。參照圖3,本發(fā)明中的對自然語言文字的識別主要基于合成與匹配的原理。該原理 的具體實現(xiàn)由下列功能模塊的組合來完成1.單字分割(25)。本模塊的輸入來自語言識別模塊(3)。在輸入字符中,它找出 空格間的字符串。對某些自然語言,比如中文,一個字符就對應(yīng)一個單字。然后,它將每個 字符串和意義知識庫中的單字匹配。匹配成功,就輸出一個分割好的單字到下一模塊(26)。 否則,它進行學習一個新的單字(27)。2.識別已知單字(26)。根據(jù)輸入的每一個單字,它找出意義知識庫中的匹配的單 字。然后,它提取該單字所指的所有物理意義,和所有概念意義。3.句子分割(28)。根據(jù)一串輸入單字,它確定一個句子的開頭和結(jié)尾。并將一串 輸入單字,分割成一組句子。在簡單會話的情形下,一串輸入單字中只含一個完整的句子。4.合成詞組(29)。它的輸入是對應(yīng)于一個句子的一串單字。它根據(jù)單字的約束, 形成所有可能的詞組組合。5.合成句子(30)。它的輸入來自合成詞組(29)。它根據(jù)詞組的約束,形成所有可 能的句子。然后,它把不符合物理意義的句子刪除掉。剩下的是一組完整的,和有物理意義 的句子。6.識別句子(31)。它的輸入來自合成句子(30)和句子分割(28)。它把聽到的句 子(來自句子分割(28))和合成的句子(來自合成句子(30))匹配。最佳匹配結(jié)果,就是 識別了的句子。參照圖4,本發(fā)明中的對自然語言文字的認知,既包含學習概念知識(32),也包括 學習物理知識(36)。它的作用是通過對話的形式獲取一個新單字(詞)的概念知識以及該 單字(詞)所指的物理知識。為不失一般性,對自然語言文字的認知,也可以通過按一定方 式設(shè)計的圖形界面獲取。按照本發(fā)明的描述,通過對話的形式學習概念知識(32)由以下功 能的組合來實現(xiàn)1.概念知識提問合成(33)。它首先提問,一個新單字泛指單字(詞)或符號?。 針對單字(詞),它根據(jù)一種自然語言的特性,預編好一系列提問。例如,是名詞嗎?是動詞 嗎?能給出一個常用案例嗎?等等。根據(jù)學習到的特征,它自動地確定一個新單字的約束。 比如,名詞前可以加冠詞,名詞后可以帶動詞,等等。按照本發(fā)明的描述,任何一個單詞有前
16置詞約束和后置詞約束。2.提問和語音合成(35)。它的輸入來自概念知識提問合成(33)。它通過商用語 音合成把提問的文字符號轉(zhuǎn)成音頻信號。3.語音識別模塊(3)。交流對象(2)聽到提問后,做出相應(yīng)的回答。按照本發(fā)明 的描述,交流對象(2)的回答包括新單詞的特征,新單詞的常用案例,等等。然后,該模塊 對交流對象(2)的音頻信號進行識別。得到的輸出是理解了的回答。4.概念知識回答識別(34)。它的輸入來自語音識別模塊(3)。它從理解了的回答 中,提取出關(guān)于一個新單字的特征,以及常用的使用案例,等等。并把這些概念知識,存貯到 適當?shù)臄?shù)據(jù)結(jié)構(gòu)中。按照本發(fā)明的描述,通過對話的形式學習物理知識(36)由以下功能的組合來實 現(xiàn)1.物理知識提問合成(37)。它首先提問,一個新單字泛指實體或符號?。然后, 針對實體,它預編好一系列與特征和約束有關(guān)的提問。例如體積?重量?物態(tài)?材料?顏 色?用途?導電性?導熱性?防水性?強度?硬度?氣味?,等等。2.提問和語音合成(35)。它的輸入來自物理知識提問合成(37)。它通過商用語 音合成,把提問的文字符號轉(zhuǎn)成音頻信號。3.語音識別模塊(3)。交流對象(2)聽到提問后,做出相應(yīng)的回答。按照本發(fā)明 的描述,交流對象(2)的回答包括新單詞所指實體的特征,新單詞所指實體的約束,等等。 然后,該模塊對交流對象(2)的音頻信號進行識別。得到的輸出是理解了的回答。4.物理知識回答識別(38)。它的輸入來自語音識別模塊(3)。它從理解了的回答 中,提取出關(guān)于一個新單字所指實體的特征和約束,等等。并把這些物理知識,存貯到適當 的數(shù)據(jù)結(jié)構(gòu)中。參照圖3和圖5,本發(fā)明中的故事情節(jié)重構(gòu)模塊(6)首先讀取,自然語言文字學習 和理解模塊(5)中的識別句子(31)輸出。然后,它根據(jù)識別句子的物理知識,提取有關(guān)地 點、時間、人物、物件和原因的故事要素。其中,1.地點重構(gòu)(39)是把輸入文字(即聽到的語言文字)中的地點要素記錄下來,并 以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯。2.時間重構(gòu)(40)是把輸入文字(即聽到的語言文字)中的時間點和時間段記錄 下來,并以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯。3.人物重構(gòu)(41)是把輸入文字(即聽到的語言文字)中的人物記錄下來,并以適 當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯。4.物件重構(gòu)(42)是把輸入文字(即聽到的語言文字)中的物體,物件和東西記錄 下來,并以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯。5.原因重構(gòu)(43)是把輸入文字(即聽到的語言文字)中的前因后果關(guān)系(例如 動作約束,行為約束,事件約束,和情節(jié)約束)記錄下來,并以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯。根據(jù)上述故事要素,故事情節(jié)重構(gòu)模塊(6)通過三維場景合成(44)和動畫圖像合 成(45),把這些故事要素制成各個時間點的場景和圖片。這些圖片在時間段的合成,則形成 動畫。最后,它用商用軟件工具,把動畫轉(zhuǎn)化成視頻信號輸出。參照圖3,本發(fā)明中的故事描述和提問模塊(7)的輸入來自兩個渠道。一是故事情
17節(jié)重構(gòu)模塊(6)中的故事要素。根據(jù)這些故事要素,本模塊重述聽懂的故事,或?qū)Σ幻靼字?處提問。二是機器自身產(chǎn)生的故事要素。比方說,機器視覺系統(tǒng)所著到的場景和其中的故 事要素。在這種情況下,本模塊自述故事,或?qū)Σ幻靼字幪釂?。按照本發(fā)明的描述,本模 塊首先以適當?shù)姆绞?,把故事要素,轉(zhuǎn)換成概念世界中的相對應(yīng)單字和詞組。其中1.地點描述(46)是把故事要素中的地點要素以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯。然后,在 意義知識庫中,將每個地點要素的相對應(yīng)單字和詞組取出。比如,地上,天上,桌上,左邊,右 邊,前方,后方,等等。2.時間描述(47)是把故事要素中的時間點和時間段以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯。然 后,在意義知識庫中,將每個時間要素的相對應(yīng)單字和詞組取出。比如,某時,某日,某月,某
干'寸寸°3.人物描述(48)是把故事要素中的人物以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯。然后,在意義知 識庫中,將每個人物要素的相對應(yīng)單字和詞組取出。比如,某人,某飛禽,某走畜,某昆蟲,某 爬蟲,等等。4.物件描述(49)是把故事要素中的物件以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯。然后,在意義知 識庫中,將每個物件要素的相對應(yīng)單字和詞組取出。比如,桌子,椅子,杯子,汽車,水果,衣 物,門窗,燈具,文具,書本,電器,工具,等等。5.原因描述(50)是把故事要素中的前因后果以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯。然后,在意 義知識庫中,將每個原因要素的相對應(yīng)單字和詞組取出。比如,因為-所以,先-后,引發(fā),
導致,等等。根據(jù)上述故事要素,故事描述和提問模塊(7)以適當?shù)姆绞?,把故事要素轉(zhuǎn)換成 概念世界中的句子。比如,在同一時間點上,把人物和物件的空間關(guān)系用句子和段落表述出 來,或根據(jù)人物和物件的空間關(guān)系進行提問。其次,在不同時間點上,把人物和物件的相互 作用和行為用句子和段落表述出來,或根據(jù)人物和物件的相互作用和行為進行提問。最后, 本模塊通過商用語音合成器,把文字轉(zhuǎn)換成音頻信號輸出,或通過顯示器顯示視頻信號,以 及通過打印機以打印的方式輸出文字。
權(quán)利要求
一種基于自然語言的人機對話系統(tǒng),包括依次連接的輸入裝置、中央處理器單元和輸出裝置,其特征是所述人機對話系統(tǒng)輸入裝置包括語音感應(yīng)器(1);中央處理器單元內(nèi)設(shè)有專用軟件,其包括語音識別模塊(3)、意義知識庫(4)、自然語言文字學習和理解模塊(5)、故事情節(jié)重構(gòu)模塊(6)以及故事描述和提問模塊(7);輸出裝置包括顯示器、揚聲器或打印設(shè)備;所述語音感應(yīng)器(1)可以將感應(yīng)信號輸入到中央處理器單元處理,中央處理器單元通過其設(shè)有的專用軟件處理后,將信號輸出到輸出裝置,并由輸出裝置將信號以視頻、音頻或打印方式輸出。
2.根據(jù)權(quán)利要求1所述的基于自然語言的人機對話系統(tǒng),其特征是所述意義知識庫 (4)把外部世界分成物理世界和概念世界,其中,概念世界是對物理世界的一種描述或投 影,這種描述或投影是通過任何一種自然語言來實現(xiàn)的,在此定義的基礎(chǔ)上,本發(fā)明中的意 義知識庫(4)的設(shè)計包含物理知識和概念知識兩大類;根據(jù)這個設(shè)計方案,知識庫(4)中的 每個自然實物(8)都由一對物理實體(9)和單字實體(10)構(gòu)成;物理實體(9)的意義指物 理特征(11)和物理約束(12);單字實體(10)的意義指單字特征(14)和單字約束(13);它 們可以用計算機編程語言的類(即Class)來實現(xiàn)。
3.根據(jù)權(quán)利要求2所述的基于自然語言的人機對話系統(tǒng),其特征是所述每個實體的 知識由基礎(chǔ)知識構(gòu)成,基礎(chǔ)知識的有機結(jié)合構(gòu)成綜合知識;按照所述每個物理實體(9)的 設(shè)計包含該物理實體的物理特征(11)和它的物理約束(12),它們定義了一個物理實體(9) 的基礎(chǔ)知識;所述物理特征(11)包括尺寸、形狀、體狀、質(zhì)量、硬度、傳導性等等;它們可用 適當?shù)臄?shù)據(jù)結(jié)構(gòu)來實現(xiàn);物理約束(12)包括運動約束、動力約束、電力約束、化學約束、熱 力約束等等;它們可用適當?shù)姆匠毯秃瘮?shù)來實現(xiàn);按照本發(fā)明的描述,物理世界的綜合知識由以下設(shè)計的關(guān)系矩陣構(gòu)成(a)實體關(guān)系矩陣(15),它是一個三維矩陣,比如,儀(^,0」,4)描述一對實體0i和實體 0j在特征關(guān)系fk下的邏輯值或一般函數(shù),按照本發(fā)明的描述,特征關(guān)系fk包括前后關(guān)系,左 右關(guān)系,上下關(guān)系,內(nèi)外關(guān)系,遠近關(guān)系,大小關(guān)系,主次關(guān)系,輕重關(guān)系,冷熱關(guān)系,色彩關(guān) 系,明暗關(guān)系等等;(b)行為關(guān)系矩陣(16),它是一個三維矩陣,比如,A(0i,0j,ck)描述一對實體0i和實體 0j在約束關(guān)系ck下的邏輯值或時間函數(shù),它描述一對實體0i和實體的一種互動作用或 基本行為;按照本發(fā)明的描述,約束關(guān)系ck包括運動約束,動力約束,電力約束,化學約束, 熱力約束等等;按照本發(fā)明的描述,一對實體0i和實體對應(yīng)于每個約束關(guān)系ck的互動作 用組合A(0i,0j, ck),就代表該對實體可能產(chǎn)生的所有基本行為;(c)事件關(guān)系矩陣(17),按照本發(fā)明的描述,一個事件概括一組相關(guān)的基本行為(即綜 合行為),它可用一個三維矩陣來實現(xiàn),比如,B(ai,aj, rk)描述一對基本行為 和基本行 為…在原因關(guān)系rk下的邏輯約束;按照本發(fā)明的描述,原因關(guān)系rk包括習慣取向,價值取 向,期望取向,常識取向,信仰取向等等;按照本發(fā)明的描述,邏輯約束B(a” aj, rk)的選項 包括如果_則,如果_則不,如果_可能,同時發(fā)生;按照本發(fā)明的描述,基于每個基本行 為%和對應(yīng)于所有原因關(guān)系rk的組合B(ai,aj, rk),就代表一種與基本行為 有關(guān)的事件 (即綜合行為);(d)情節(jié)關(guān)系矩陣(18),按照本發(fā)明的描述,一個情節(jié)由一組相關(guān)的綜合行為組成,它也可以用一個三維矩陣來描述;比方說,E(b” bj, rk)表示綜合行為h和綜合行為bj在原 因關(guān)系rk下的邏輯約束;按照本發(fā)明的描述,原因關(guān)系rk包括習慣取向,價值取向,期望取 向,常識取向,信仰取向;按照本發(fā)明的描述,邏輯約束EOvl^rk)的選項包括如果-貝1J, 如果_則不,如果_可能,同時發(fā)生;按照本發(fā)明的描述,基于每個綜合行為h和對應(yīng)于所 有原因關(guān)系rk的組合E(b” bj, rk)就代表一種與綜合行為h有關(guān)的情節(jié);(e)故事關(guān)系矩陣(19),按照本發(fā)明的描述,一個故事由一組相關(guān)的情節(jié)組成,同樣 地,它可以用一個三維矩陣來描述,比方說,S(ei,ej, rk)表示情節(jié)ei和情節(jié)ej在原因關(guān)系 rk下的邏輯約束;按照本發(fā)明的描述,原因關(guān)系rk包括習慣取向,價值取向,期望取向,常識 取向,信仰取向;按照本發(fā)明的描述,邏輯約束S(ei,h,rk)的選項包括如果-則,如果-則 不,如果_可能,同時發(fā)生;按照本發(fā)明的描述,基于每個情節(jié)ei和對應(yīng)于所有原因關(guān)系rk 的組合S(ei,ej, rk)就代表一種與情節(jié)ei有關(guān)的故事。
4.根據(jù)權(quán)利要求2所述的基于自然語言的人機對話系統(tǒng),其特征是所述每個單字可 以是簡單單字或復合單字(單詞);每個單字實體(10)的設(shè)計,包含了該單字實體的特征 (14)和它的約束(13);它們定義了關(guān)于一個單字實體(10)的基礎(chǔ)知識;按照本發(fā)明的描 述,單字特征(14)包括任何一種自然語言中一個單字的屬性;比方說,名詞,動詞,形容詞, 介詞;它們可用適當?shù)臄?shù)據(jù)結(jié)構(gòu)來實現(xiàn);單字約束(13)包括任何一種自然語言的語法;比 方說,名詞前可以加形容詞,名詞后可以帶動詞;單字特征(14)和單字約束(13)可用適當 的表格來實現(xiàn);按照本發(fā)明的描述,概念世界的綜合知識由以下設(shè)計的關(guān)系矩陣構(gòu)成(a)單字關(guān)系矩陣(20),在任何一種自然語言中,單字之間的有機結(jié)合構(gòu)成了詞組;這 種有機結(jié)合的約束來自物理世界和概念世界;這種約束關(guān)系可以用單詞關(guān)系矩陣(20)來 表示;它是一個三維矩陣,比如,Q(Wi,Wj, wck)表示單字和單字%在約束wck下構(gòu)成的 關(guān)系,該關(guān)系定義一個詞組;按照本發(fā)明的描述,單字間的約束wck包括形容詞-名詞,名 詞_動詞,介詞_名詞,動名詞_名詞;按照本發(fā)明的描述,基于單字和對應(yīng)于所有約束 關(guān)系wck的組合Q(Wi,Wj, wck)就代表所有與單字有關(guān)的詞組;按照本發(fā)明的描述,概念 世界中的每個單字,對應(yīng)于物理世界中的實物特征或約來;概念世界中的詞組,對應(yīng)于物理 世界中的基本行為;(b)詞組關(guān)系矩陣(21),按照本發(fā)明的描述,詞組的屬性決定了詞組間的前后排列順 序關(guān)系,這種排列關(guān)系可用三維矩陣來實現(xiàn),比如說,M(qi,Qj, qck)表示詞組qi和詞組屮在 約束qck的排列順序;按照本發(fā)明的描述,約束qck包括左右順排列和左右逆排列;按照本 發(fā)明的描述,以詞組1為中心,所有左側(cè)的左右逆排列和所有右側(cè)的左右順排列的任何一 個組合定義了一個與詞組1有關(guān)的句子;按照本發(fā)明的描述,概念世界中的每個句子,對應(yīng) 于物理世界中的一種行為;(c)句子關(guān)系矩陣(22),按照本發(fā)明的描述,句子之間可以有序地排列;這種排列順 序背后也存在一種約束;這種句子之間的約束關(guān)系可以用三維矩陣來實現(xiàn);比如,NOv mj, mck)表示句子叫和句子m」在約束mck下的排列關(guān)系;按照本發(fā)明的描述,約束mck包括前 因_后果,假設(shè)_結(jié)果,列舉,切換,互補;按照本發(fā)明的描述,任選一個關(guān)健單字為輸入,首 先找出所有與它相關(guān)的詞組;然后,針對每一個詞組找出所有與它相關(guān)的句子;最后,在所 有約束mck下,這些句子的所有排列組合就定義了與該關(guān)健單字有關(guān)的段落;按照本發(fā)明的描述,概念世界中的每個段落,對應(yīng)于物理世界中的一種事件;(d)段落關(guān)系矩陣(23),按照本發(fā)明的描述,段落之間也存在著有序的排列關(guān)系,它也 可以用三維矩陣來實現(xiàn),比如,Y(ni,nj,yck)就表示段落叫和段落nj在約束yck下的排列關(guān) 系,按照本發(fā)明的描述,約束yck包括邏輯與,邏輯和,邏輯否,時間先后,數(shù)量列舉,空間列 舉,互補;按照本發(fā)明的描述,基于段落叫和對應(yīng)于所有約束關(guān)系yck的組合Y(ni,nj, yck) 就代表所有與段落1^有關(guān)的章節(jié);按照本發(fā)明的描述,概念世界中的每個章節(jié),對應(yīng)于物理 世界中的一種情節(jié);(e)章節(jié)關(guān)系矩陣(24),按照本發(fā)明的描述,章節(jié)之間也存在著有序的排列關(guān)系,它也 可以用三維矩陣來實現(xiàn),比如,Z (yi,yj, zck)就表示章節(jié)yi和章節(jié)在約束zck下的排列關(guān) 系,按照本發(fā)明的描述,約束zck包括邏輯與,邏輯和,邏輯否,時間先后,數(shù)量列舉,空間列 舉,互補;按照本發(fā)明的描述,基于章節(jié)和對應(yīng)于所有約束關(guān)系zck的組合Z(yi,Yj, zck) 就代表所有與章節(jié)yi有關(guān)的文章;按照本發(fā)明的描述,概念世界中的每個文章,對應(yīng)于物理 世界中的一個故事。
5.根據(jù)權(quán)利要求1所述的基于自然語言的人機對話系統(tǒng),其特征是所述自然語言文 字學習和理解模塊(5)包含對自然語言文字的認知和識別兩個相輔相成的部分;按照本發(fā) 明的描述,它的認知部分主要基于學習,它對自然語言文字的學習既包含對文字的概念知 識的學習,同時也包含對文字所指的物理知識的學習;按照本發(fā)明的描述,自然語言文字學 習和理解模塊(5)中的識別部分主要由句子分割(28)、合成句子(30)和識別句子(31)三 功能塊組成;識別部分的輸出是與意義知識庫(4)相容的有物理意義的句子。
6.根據(jù)權(quán)利要求5所述的基于自然語言的人機對話系統(tǒng),其特征是所述對自然語言 文字的識別主要基于合成與匹配的原理;該原理的具體實現(xiàn)由下列功能模塊的組合來完 成(a)單字分割(25),本模塊的輸入來自語言識別模塊(3),在輸入字符中,它找出空格 間的字符串,對某些自然語言,比如中文,一個字符就對應(yīng)一個單字;然后,它將每個字符串 和意義知識庫中的單字匹配,匹配成功,就輸出一個分割好的單字到下一模塊(26),否則, 它進行學習一個新的單字(27);(b)識別已知單字(26),根據(jù)輸入的每一個單字,它找出意義知識庫中的匹配的單字; 然后,它提取該單字所指的所有物理意義和所有概念意義;(c)句子分割(28),根據(jù)一串輸入單字,它確定一個句子的開頭和結(jié)尾,并將一串輸入 單字分割成一組句子;在簡單會話的情形下,一串輸入單字中只含一個完整的句子;(d)合成詞組(29),它的輸入是對應(yīng)于一個句子的一串單字;它根據(jù)單字的約束,形成 所有可能的詞組組合;(e)合成句子(30),它的輸入來自合成詞組(29),它根據(jù)詞組的約束,形成所有可能 的句子;然后,它把不符合物理意義的句子刪除掉,剩下的是一組完整的和有物理意義的句 子;(f)識別句子(31),它的輸入來自合成句子(30)和句子分割(28),它把聽到的句子 (來自句子分割(28))和合成的句子(來自合成句子(30))匹配,最佳匹配結(jié)果就是識別了 的句子。
7.根據(jù)權(quán)利要求5所述的基于自然語言的人機對話系統(tǒng),其特征是所述對自然語言文字的認知,既包含學習概念知識(32),也包括學習物理知識(36);它的作用是通過對話 的形式獲取一個新單字(詞)的概念知識以及該單字(詞)所指的物理知識;為不失一般 性,對自然語言文字的認知,也可以通過按一定方式設(shè)計的圖形界面獲??;按照本發(fā)明的描述,學習概念知識(32)通過對話的形式,由以下功能的組合來實現(xiàn)(a)概念知識提問合成(33),它首先提問,一個新單字泛指單字(詞)或符號?;針對 單字(詞),它根據(jù)一種自然語言的特性,預編好一系列提問;例如,是名詞嗎?是動詞嗎? 能給出一個常用案例嗎?;根據(jù)學習到的特征,它自動地確定一個新單字的約束,比如,名 詞前可以加冠詞,名詞后可以帶動詞;按照本發(fā)明的描述,任何一個單詞有前置詞約束和后 置詞約束;(b)提問和語音合成(35),它的輸入來自概念知識提問合成(33),它通過商用語音合 成器把提問的文字符號轉(zhuǎn)成音頻信號;(c)語音識別模塊(3),交流對象(2)聽到提問后,做出相應(yīng)的回答;按照本發(fā)明的描 述,交流對象(2)的回答包括新單詞的特征,新單詞的常用案例;然后,該模塊對交流對象 (2)的音頻信號進行識別,得到的輸出是理解了的回答;(d)概念知識回答識別(34),它的輸入來自語音識別模塊(3),它從理解了的回答中, 提取出關(guān)于一個新單字的特征,以及常用的使用案例;并把這些概念知識存貯到適當?shù)臄?shù) 據(jù)結(jié)構(gòu)中;按照本發(fā)明的描述,學習物理知識(36)通過對話的形式,由以下功能的組合來實現(xiàn)(e)物理知識提問合成(37),它首先提問,一個新單字泛指實體或符號?,然后,針對 實體,它預編好一系列與特征和約束有關(guān)的提問,例如體積?重量?物態(tài)?材料?顏色? 用途?導電性?導熱性?防水性?強度?硬度?氣味?;(f)提問和語音合成(35),它的輸入來自物理知識提問合成(37),它通過商用語音器 合成,把提問的文字符號轉(zhuǎn)成音頻信號;(g)語音識別模塊(3),交流對象(2)聽到提問后,做出相應(yīng)的回答,按照本發(fā)明的描 述,交流對象(2)的回答包括新單詞所指實體的特征,新單詞所指實體的約束;然后,該模 塊對交流對象(2)的音頻信號進行識別,得到的輸出是理解了的回答;(h)物理知識回答識別(38),它的輸入來自語音識別(3),它從理解了的回答中,提取 出關(guān)于一個新單字所指實體的特征和約束;并把這些物理知識,存貯到適當?shù)臄?shù)據(jù)結(jié)構(gòu)中。
8.根據(jù)權(quán)利要求1所述的基于自然語言的人機對話系統(tǒng),其特征是所述故事情節(jié)重 構(gòu)模塊(6)首先讀取,自然語言文字學習和理解模塊(5)中的識別句子(31)輸出;然后,它 根據(jù)識別句子的物理知識,提取有關(guān)地點、時間、人物、物件和原因的故事要素,其中,(a)地點重構(gòu)(39)是把輸入文字(即聽到的語言文字)中的地點要素記錄下來,并以 適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯;(b)時間重構(gòu)(40)是把輸入文字(即聽到的語言文字)中的時間點和時間段記錄下 來,并以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯;(c)人物重構(gòu)(41)是把輸入文字(即聽到的語言文字)中的人物記錄下來,并以適當 的數(shù)據(jù)結(jié)構(gòu)存貯;(d)物件重構(gòu)(42)是把輸入文字(即聽到的語言文字)中的物體,物件和東西記錄下 來,并以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯;(e)原因重構(gòu)(43)是把輸入文字(即聽到的語言文字)中的前因后果關(guān)系(例如動 作約束,行為約束,事件約束,和情節(jié)約束)記錄下來,并以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯;根據(jù)上述故事要素,故事情節(jié)重構(gòu)模塊(6)通過三維場景合成(44)和動畫圖像合成 (45),把這些故事要素制成各個時間點的場景和圖片;這些圖片在時間段的合成,則形成動 畫;最后,它用商用軟件工具,把動畫轉(zhuǎn)化成視頻信號輸出。
9.根據(jù)權(quán)利要求1所述的基于自然語言的人機對話系統(tǒng),其特征是所述故事描述和 提問模塊(7)的輸入來自兩個渠道,一是故事情節(jié)重構(gòu)模塊(6)中的故事要素,根據(jù)這些故 事要素,本模塊重述聽懂的故事,或?qū)Σ幻靼字幪釂?;二是機器自身產(chǎn)生的故事要素,比 方說,機器視覺系統(tǒng)所看到的場景和其中的故事要素;在這種情況下,本模塊自述故事,或 對不明白之處提問;按照本發(fā)明的描述,本模塊首先以適當?shù)姆绞剑压适乱剞D(zhuǎn)換成概念 世界中的相對應(yīng)單字和詞組;其中,(a)地點描述(46)是把故事要素中的地點要素以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯,然后,在意義 知識庫中,將每個地點要素的相對應(yīng)單字和詞組取出,比如,地上,天上,桌上,左邊,右邊, 前方,后方;(b)時間描述(47)是把故事要素中的時間點和時間段以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯,然后, 在意義知識庫中,將每個時間要素的相對應(yīng)單字和詞組取出,比如,某時,某日,某月,某 年;(c)人物描述(48)是把故事要素中的人物以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯,然后,在意義知識 庫中,將每個人物要素的相對應(yīng)單字和詞組取出,比如,某人,某飛禽,某走畜,某昆蟲,某爬 蟲;(d)物件描述(49)是把故事要素中的物件以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯,然后,在意義知識 庫中,將每個物件要素的相對應(yīng)單字和詞組取出,比如,桌子,椅子,杯子,汽車,水果,衣物, 門窗,燈具,文具,書本,電器,工具;(e)原因描述(50)是把故事要素中的前因后果以適當?shù)臄?shù)據(jù)結(jié)構(gòu)存貯,然后,在意義 知識庫中,將每個原因要素的相對應(yīng)單字和詞組取出,比如,因為-所以,先-后,引發(fā),導 致;根據(jù)上述故事要素,故事描述和提問模塊(7)以適當?shù)姆绞?,把故事要素轉(zhuǎn)換成概念 世界中的句子,比如,在同一時間點上,把人物和物件的空間關(guān)系用句子和段落表述出來, 或根據(jù)人物和物件的空間關(guān)系進行提問;其次,在不同時間點上,把人物和物件的相互作用 和行為用句子和段落表述出來,或根據(jù)人物和物件的相互作用和行為進行提問;最后,本模 塊通過商用語音合成器,把文字轉(zhuǎn)換成音頻信號輸出,或通過顯示和打印的方式輸出文字。
全文摘要
本發(fā)明公開了基于自然語言的人機對話系統(tǒng),包括基于特別設(shè)計的意義知識庫(4),以及特別設(shè)計的自然語言文字學習和理解模塊(5),提出一套完整的基于自然語言的人機對話智能技術(shù)和方案。本發(fā)明由以下幾部分組成語音感應(yīng)器(1)、語音識別模塊(3)、意義知識庫(4)、自然語言文字學習和理解模塊(5)、故事情節(jié)重構(gòu)模塊(6)以及故事描述和提問模塊(7);它既提供了如何讓機器理解自然語言的方法,又提供了如何讓機器表述知識和存貯知識的設(shè)計藍圖;基于本發(fā)明開發(fā)設(shè)計的產(chǎn)品,可以實現(xiàn)人與汽車、人與機器人、人與手機以及人與計算機的對話和交談。
文檔編號G06F17/28GK101923539SQ200910040170
公開日2010年12月22日 申請日期2009年6月11日 優(yōu)先權(quán)日2009年6月11日
發(fā)明者謝明 申請人:珠海市智汽電子科技有限公司