例如為仿人機(jī)器人的機(jī)器與人類對(duì)話者之間的對(duì)話方法,實(shí)施這種方法的電腦程序產(chǎn)品 ...的制作方法
【專利摘要】本發(fā)明涉及機(jī)器(OE)、優(yōu)選地仿人機(jī)器人(RI)與至少一個(gè)人類對(duì)話者(INT)之間的對(duì)話方法,所述對(duì)話方法包括由電腦實(shí)施的以下步驟:a)識(shí)別所述人類對(duì)話者;b)從數(shù)據(jù)庫(kù)(BDD)中提取包括多個(gè)對(duì)話變量的對(duì)話者資料(INT_PR),至少一個(gè)值被分配給至少其中一個(gè)所述對(duì)話變量;c)接收和分析來(lái)自所述對(duì)話者的至少一句句子;以及d)至少根據(jù)在步驟c)中接收和編譯的所述句子以及所述對(duì)話者資料的一個(gè)對(duì)話變量來(lái)提出和發(fā)送至少一句答句。
【專利說(shuō)明】
例如為仿人機(jī)器人的機(jī)器與人類對(duì)話者之間的對(duì)話方法,實(shí)施這種方法的電腦程序產(chǎn)品和仿人機(jī)器人
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及機(jī)器和人類之間的對(duì)話方法。所述機(jī)器可為所有數(shù)據(jù)處理裝置,例如電腦、“智能電話”處理器或機(jī)器人,尤其是包括至少一個(gè)被裝載的處理器的仿人機(jī)器人,并且可口頭執(zhí)行所述對(duì)話。本發(fā)明還涉及用于實(shí)施所述方法的電腦程序產(chǎn)品和機(jī)器人,優(yōu)選地仿人機(jī)器人。
【背景技術(shù)】
[0002]“仿人機(jī)器人”可被定義為具有一些人類外觀屬性和人類功能(例如軀體、頭部、手臂、腿、利用辨認(rèn)和語(yǔ)音合成方式與人類口頭通信的能力等)的機(jī)器人。該類型的機(jī)器人用于減小人與機(jī)器之間的認(rèn)知距離。仿人機(jī)器人的最重要的特征之一在于其支持與人類對(duì)話者盡可能自然地對(duì)話的能力。該能力對(duì)于“機(jī)器人伴侶”的開(kāi)發(fā)是重要的,所述“機(jī)器人伴侶”用于幫助老年人、病人或僅簡(jiǎn)單的日常生活需要,并向這些人提供人類助理的可接受替代品O
[0003]現(xiàn)有技術(shù)中已知的仿人機(jī)器人的對(duì)話方法不令人滿意,這是因?yàn)檫@些對(duì)話方法在任何情況下均不自然地重復(fù)刻板的對(duì)話。
[0004]在雜志《Dialogswith Robots: AAAI Fall Sympos ium( FS-10-05 )》中的Rosenthal和M.Veloso的文章《Mixed-1nitiative Long-Term Interact1ns with anAll-Day-Compan1n Robot》第97-102頁(yè)中描述了在例如在大學(xué)的機(jī)器人部門的參觀中能夠引導(dǎo)人類的機(jī)器人。機(jī)器人被編程為避免在對(duì)話中重復(fù);但兩位不同的人類對(duì)話者會(huì)進(jìn)行基本相同的對(duì)話。
[0005]文件US 7,539,656描述了一種方法,通過(guò)該方法,機(jī)器與人類對(duì)話者對(duì)話以獲得其提供服務(wù)需要的信息(例如要求早餐服務(wù))。這種對(duì)話是極其刻板的而且不會(huì)重復(fù)談話。因此該方法不適合實(shí)施高性能的“機(jī)器人伴侶”。
[0006]文件US 7,987,091描述了一種方法,通過(guò)該方法,機(jī)器與一位或多位對(duì)話者進(jìn)行“個(gè)性化”和“漸進(jìn)式”的對(duì)話。對(duì)話被個(gè)性化,這是因?yàn)闄C(jī)器根據(jù)被存儲(chǔ)在存儲(chǔ)器中的不同對(duì)話者信息來(lái)操縱對(duì)話。對(duì)話是漸進(jìn)式的,這是因?yàn)闄C(jī)器在對(duì)話中獲得了新信息。然而,對(duì)話不太自然,這是因?yàn)楂@取和使用信息的階段被明顯分隔。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的目的在于克服前面描述的現(xiàn)有技術(shù)的缺點(diǎn),提供一種與機(jī)器(尤其是機(jī)器人)對(duì)話的方法,更接近與其它人類的自然對(duì)話。更確切地,本發(fā)明旨在建立適合于對(duì)話者的(非刻板的)漸進(jìn)式和自然的對(duì)話,這能夠在人類對(duì)話者和機(jī)器人之間建立真正的情感聯(lián)系。漸進(jìn)式涉及與相同對(duì)話者在隔有相同時(shí)間間隔的兩次連續(xù)對(duì)話之間的相同對(duì)話(或“對(duì)話段”)的內(nèi)容。
[0008]為達(dá)到所述目的,本發(fā)明提供了一種機(jī)器與至少一個(gè)人類對(duì)話者之間的對(duì)話方法,所述對(duì)話方法包括由所述機(jī)器實(shí)施的以下步驟:
[0009]a)識(shí)別所述人類對(duì)話者;
[0010]b)從數(shù)據(jù)庫(kù)中提取包括多個(gè)對(duì)話變量的對(duì)話者資料,至少一個(gè)值被分配給至少其中一個(gè)所述對(duì)話變量;
[0011]c)接收來(lái)自所述對(duì)話者的至少一句句子,分析來(lái)自所述對(duì)話者的所述句子中的每句以從中提取要分配給所述對(duì)話者資料的至少一個(gè)對(duì)話變量的至少一個(gè)值,并且將所述值或每個(gè)所述值記錄在所述對(duì)話者資料中;以及
[0012]d)至少根據(jù)在步驟c)中接收和編譯的所述句子以及所述對(duì)話者資料的一個(gè)所述對(duì)話變量來(lái)提出和發(fā)送至少一句答句。
[0013]用于提出答句的對(duì)話者識(shí)別和對(duì)話者資料的使用能夠使對(duì)話個(gè)性化。詞語(yǔ)“答句”應(yīng)被廣義地解釋為涵蓋響應(yīng)激勵(lì)而發(fā)送的所有句子,而非狹義地表示“回答問(wèn)題”。
[0014]回答分析能夠使機(jī)器在對(duì)話期間、或在連續(xù)對(duì)話中豐富對(duì)話者資料。可使該機(jī)器學(xué)習(xí)越來(lái)越好地理解對(duì)話者,并用該機(jī)器的認(rèn)知來(lái)完善對(duì)話。
[0015]另外,對(duì)話不是刻板的,這是因?yàn)闄C(jī)器的回答同時(shí)取決于對(duì)話者資料以及該對(duì)話者剛說(shuō)出的至少一句句子。與前述文件US 7,987,091的方法中發(fā)生的過(guò)程相反,在(信息)“獲取對(duì)話”和(信息)“使用對(duì)話”之間沒(méi)有分隔。根據(jù)本發(fā)明,在相同的對(duì)話期間,機(jī)器使用其已存儲(chǔ)的對(duì)話者信息并獲取新信息,所述新信息可被立即或之后使用。
[0016]對(duì)于來(lái)自所述對(duì)話者的所述句子或至少一句句子的分析和所述答句或至少一句答句的提出可借助于由相應(yīng)的句法樹(shù)表示的多個(gè)句型來(lái)執(zhí)行。
[0017]有利地,所述句型中的至少一些包括指示所述對(duì)話者資料的對(duì)話變量的至少一個(gè)指示符。在提出回答時(shí),機(jī)器用被存儲(chǔ)在對(duì)話者資料中的對(duì)話變量值來(lái)代替指示符。相反,在分析接收到的句子時(shí),機(jī)器編譯所述句子的被確定的詞(占據(jù)在句型中由指示符指出的位置)作為待存儲(chǔ)在對(duì)話者資料中的值以及對(duì)應(yīng)的對(duì)話變量值。
[0018]有利地,所述句型中的至少一些可包括指示句子中的至少一組可互換詞語(yǔ)、Sr概念”的指示符。
[0019]所述步驟d)可借助于與來(lái)自所述對(duì)話者的至少一個(gè)句型以及與至少一個(gè)答句句型相關(guān)聯(lián)的多個(gè)規(guī)則來(lái)實(shí)施。這些規(guī)則本身可由“樹(shù)”型結(jié)構(gòu)表示。
[0020]在該情況下,在所述步驟d)中,至少一個(gè)所述規(guī)則可與來(lái)自所述對(duì)話者的相同句型相關(guān)聯(lián),多個(gè)句型可用作答句;另外,可在所述答句句型中排除包括指示對(duì)話變量的指示符的答句句型,在所述對(duì)話者資料中沒(méi)有值被分配給所述對(duì)話變量。而且,機(jī)器可根據(jù)其知道(或不知道)來(lái)選擇對(duì)其對(duì)話者的回答。
[0021]有利地,可由識(shí)別談話主題的標(biāo)簽(“tag”)來(lái)標(biāo)記至少一個(gè)所述規(guī)則,在所述步驟
d)中,由識(shí)別經(jīng)確定的談話主題的至少一個(gè)標(biāo)簽來(lái)標(biāo)記的一個(gè)或多個(gè)規(guī)則可根據(jù)至少一個(gè)對(duì)話參數(shù)(一個(gè)或多個(gè)對(duì)話變量、背景參數(shù)、對(duì)話歷史等的值(或未提供))被激活或失效。這是實(shí)施對(duì)話漸進(jìn)的技術(shù)方式。
[0022]所述對(duì)話者資料還可包括對(duì)話歷史,并且在所述步驟d)中,所述答句或至少一句所述答句還可根據(jù)所述對(duì)話歷史來(lái)提出。這確保了對(duì)話漸進(jìn)并且避免了重復(fù)。
[0023]在所述步驟d)中,所述答句或至少一句所述答句還可根據(jù)由所述機(jī)器獲得或確定的至少一個(gè)背景參數(shù)來(lái)提出。該參數(shù)尤其可為由時(shí)鐘確定的時(shí)間:而且,例如接近中午,談話可涉及午餐。該參數(shù)還可為由日歷確定的日期、由傳感器獲得的環(huán)境溫度或亮度等。
[0024]在所述步驟a)中,可借助于圖像獲取裝置(例如攝像機(jī))通過(guò)面部辨認(rèn)或讀取呈現(xiàn)在所述攝像機(jī)上的圖形碼來(lái)識(shí)別所述人類對(duì)話者。其它識(shí)別方式(生物統(tǒng)計(jì)、通過(guò)鍵盤輸入編碼、語(yǔ)音識(shí)別……)也是可能的;
[0025]在所述步驟b)中,所述機(jī)器可借助于通信網(wǎng)絡(luò)來(lái)訪問(wèn)遠(yuǎn)程服務(wù)器,并且下載存儲(chǔ)在所述遠(yuǎn)程服務(wù)器中的所述數(shù)據(jù)庫(kù)的所述對(duì)話者資料。已借助于所述通信網(wǎng)絡(luò)訪問(wèn)所述遠(yuǎn)程服務(wù)器的所述機(jī)器可在所述數(shù)據(jù)庫(kù)中加載通過(guò)記錄被分配給至少一個(gè)對(duì)話變量的至少一個(gè)值而更新的對(duì)話者資料,所述至少一個(gè)對(duì)話變量在所述步驟c)中從來(lái)自所述對(duì)話者的至少一句句子中提取。在變型中,數(shù)據(jù)庫(kù)被本地存儲(chǔ)。
[0026]優(yōu)選地,所述機(jī)器包括被裝載在仿人機(jī)器人中的處理器。而其它實(shí)施方式是可能的;例如所述機(jī)器可為辦公桌電腦、“智能手機(jī)”、車載電腦等。
[0027]本發(fā)明的另一目的在于提供一種電腦程序產(chǎn)品(即存儲(chǔ)在材料存儲(chǔ)載體(例如永久或易失半導(dǎo)體存儲(chǔ)器、或CD-ROM型存儲(chǔ)盤或硬盤)中的可執(zhí)行的電腦程序),所述電腦程序產(chǎn)品用于實(shí)施這種方法。
[0028]本發(fā)明的又一目的在于提供一種包括經(jīng)編程的被裝載的處理器的仿人機(jī)器人,所述仿人機(jī)器人用于實(shí)施這種方法。有利地,所述仿人機(jī)器人還可包括:
[0029]-與所述被裝載的處理器配合的圖像獲取裝置(例如攝像機(jī)),所述圖像獲取裝置用于識(shí)別人類對(duì)話者;
[0030]-與所述被裝載的處理器配合的聲音獲取裝置(例如麥克風(fēng)或麥克風(fēng)網(wǎng)絡(luò)),所述聲音獲取裝置用于接收由所述人類對(duì)話者說(shuō)出的至少一句句子;以及
[0031]-與所述被裝載的處理器配合的聲音發(fā)送裝置(例如揚(yáng)聲器),所述聲音發(fā)送裝置用于發(fā)送所述答句。
【附圖說(shuō)明】
[0032]通過(guò)閱讀以下詳細(xì)說(shuō)明和作為示例給出的附圖,本發(fā)明的其它特征、細(xì)節(jié)和優(yōu)點(diǎn)將更加清楚,在附圖中:
[0033]-圖1示出了根據(jù)本發(fā)明的實(shí)施方式的與人類對(duì)話者對(duì)話并且與遠(yuǎn)程服務(wù)器通信的仿人機(jī)器人;
[0034]-圖2示出了根據(jù)本發(fā)明的實(shí)施方式的方法的流程圖;以及
[0035 ]-圖3A、3B、3C和30示出了用于實(shí)施根據(jù)本發(fā)明的方法的樹(shù)型結(jié)構(gòu)。
【具體實(shí)施方式】
[0036]圖1示出了與人類對(duì)話者INT對(duì)話的仿人機(jī)器人RT。除了復(fù)制人形的鉸接式軀體,所述機(jī)器人還包括:
[0037]-例如位于機(jī)器人頭部中的被裝載的處理器或電腦0E,用于實(shí)施本發(fā)明的對(duì)話方法;所述處理器可為專用于該任務(wù)或還能完成其它任務(wù)并且受限于控制機(jī)器人本身的處理器;
[0038]-位于機(jī)器人頭部上、例如在其嘴中以及/或者在其前額上的一個(gè)或多個(gè)圖像獲取裝置(攝像機(jī))DAI,以用于獲取對(duì)話者INT的圖像;
[0039]-例如位于機(jī)器人頭部側(cè)面上的聲音發(fā)送裝置(揚(yáng)聲器)DES,以能夠使機(jī)器人“說(shuō)話”;以及
[0040]-例如位于機(jī)器人頭部上表面上的一個(gè)或多個(gè)聲音獲取裝置(麥克風(fēng))DAS,以能夠使機(jī)器人聽(tīng)到聲音。
[0041]圖像獲取裝置和聲音獲取裝置向處理器OE提供輸入數(shù)據(jù),尤其是:
[0042]-由裝置DAI獲取的至少一個(gè)圖像,以能夠識(shí)別對(duì)話者;所述至少一個(gè)圖像可為所述對(duì)話者的面部圖像、或由該圖像示出的圖形碼,以便于識(shí)別(例如由專用于“智能電話”上的應(yīng)用程序得到的QR碼);
[0043]-可表示由對(duì)話者發(fā)送的需被識(shí)別和分析的句子的聲音。
[0044]處理器OE存儲(chǔ)在存儲(chǔ)器中并且執(zhí)行圖像識(shí)別軟件和聲音識(shí)別軟件(本身已知),以處理這些輸入數(shù)據(jù)。在變型中,如下面將解釋的,這些軟件或其中一些可被存儲(chǔ)在外部數(shù)據(jù)庫(kù)中。
[0045]由處理器OE來(lái)操控聲音發(fā)送裝置DES。
[0046]機(jī)器人RT借助于網(wǎng)絡(luò)RC(例如經(jīng)由WiFi訪問(wèn)互聯(lián)網(wǎng))與存儲(chǔ)“對(duì)話者資料”數(shù)據(jù)庫(kù)的遠(yuǎn)程服務(wù)器SVD通信。
[0047]機(jī)器人向服務(wù)器SVD傳送對(duì)話者INT的識(shí)別數(shù)據(jù)INT_ID,所述識(shí)別數(shù)據(jù)通過(guò)對(duì)經(jīng)由裝置DAI得到的圖像應(yīng)用圖像識(shí)別(面部識(shí)別或圖形碼)算法而得到。在一些情況下,該數(shù)據(jù)可直接為圖像,在該情況下由遠(yuǎn)程服務(wù)器來(lái)實(shí)施識(shí)別步驟。例如,在特定實(shí)施方式中,用戶借助于“智能電話”在服務(wù)器SVD上進(jìn)行注冊(cè);服務(wù)器本身向所述智能電話發(fā)送QR碼;用戶將該碼顯示在智能電話屏幕上并且通過(guò)將該碼呈現(xiàn)在其中一個(gè)攝像機(jī)之前來(lái)向機(jī)器人展示;機(jī)器人再將QR碼的圖像傳送給服務(wù)器,所述服務(wù)器使所述圖像與用戶相關(guān)聯(lián)(該用戶為此成為識(shí)別到的對(duì)話者)。在其它實(shí)施方式中,根據(jù)對(duì)話者的面部圖像通過(guò)識(shí)別其語(yǔ)音或僅根據(jù)對(duì)話開(kāi)始時(shí)說(shuō)出的自我介紹句(例如“您好,我是Jean” )來(lái)進(jìn)行識(shí)別。
[0048]在接收到的識(shí)別數(shù)據(jù)庫(kù)中,服務(wù)器SVD從BDD數(shù)據(jù)庫(kù)中得到對(duì)話者資料INT_PR并且經(jīng)由網(wǎng)絡(luò)RC傳送給機(jī)器人RT。對(duì)話者資料為包括變量列表的文件,取決于用戶的一個(gè)(或多個(gè))值與所述變量相關(guān)聯(lián)。對(duì)話者“Jean Dupont”的資料提取信息例如可為以下個(gè)性化數(shù)據(jù):
[0049]對(duì)話者識(shí)別碼:00011
[0050]名字:Jean
[0051]年齡:35
[0052]職業(yè):工程師
[0053]興趣愛(ài)好:游泳;跑步;騎自行車
[0054]寵物:
[0055]母語(yǔ):法語(yǔ)
[0056]其它語(yǔ)言:
[0057]所述提取信息包括8個(gè)變量:對(duì)話者識(shí)別碼、“名字”、“姓”、“年齡”、“職業(yè)”、“興趣愛(ài)好”、“寵物”、“母語(yǔ)”和“其它語(yǔ)言”。前四個(gè)變量采用實(shí)際分配的唯一值。變量“興趣愛(ài)好”可同時(shí)采用多個(gè)值;在本例中為分配的“游泳”、“跑步”和“騎自行車”。變量“寵物”可采用多個(gè)值,但這里沒(méi)有提供。后兩個(gè)變量“母語(yǔ)”(唯一值:“法語(yǔ)”)和“其它語(yǔ)言”(可能有多個(gè)值,此處未提供)是特別重要的。事實(shí)上,在該方法的多語(yǔ)言版本中,處理器可使用這些變量的值以確定向?qū)υ捳咧v哪種語(yǔ)言(在機(jī)器人先說(shuō)話時(shí))或選擇哪個(gè)語(yǔ)言參數(shù)來(lái)用于識(shí)別和分析所聽(tīng)到的句子。
[0058]如下面將詳細(xì)描述的,機(jī)器人處理器OE使用分配給變量的值(或未被提供)來(lái)生成與對(duì)話者INT的對(duì)話。由此變量為所述“對(duì)話變量”。
[0059]如下面將詳細(xì)描述的,處理器OE還可被設(shè)置成根據(jù)對(duì)話來(lái)改變對(duì)話者資料的內(nèi)容。例如,該處理器可獲知Jean Dupont還講英語(yǔ),并且將“英語(yǔ)”值分配給該對(duì)話者的資料中的“其它語(yǔ)言”變量。該學(xué)習(xí)通過(guò)分析由對(duì)話者說(shuō)出的句子(通過(guò)在機(jī)器人發(fā)送非疑問(wèn)句之后或自發(fā)地回答機(jī)器人的問(wèn)題)來(lái)進(jìn)行。在這種更新之后(之后立即、或?qū)υ捊Y(jié)束時(shí)、或在有規(guī)律的間隔中……),該處理器向服務(wù)器SVD發(fā)送被記錄在數(shù)據(jù)庫(kù)BDD中的經(jīng)改變版本的對(duì)話者資料。在變型中,數(shù)據(jù)庫(kù)BDD可被本地存儲(chǔ),在該情況下與網(wǎng)絡(luò)RC的連接不是必須的。
[0060]下面描述機(jī)器人使用包括在對(duì)話者資料中的信息并且豐富該資料的對(duì)話示例。對(duì)話者為“Jean”識(shí)別碼(00011),上面已描述在對(duì)話開(kāi)始時(shí)的資料。由機(jī)器人和人類對(duì)話者說(shuō)出的句子為斜體的;對(duì)應(yīng)于(使用或獲取的)對(duì)話變量或?qū)?yīng)于已進(jìn)行的對(duì)話的歷史數(shù)據(jù)(也被記錄在對(duì)話者資料中)的詞被加下劃線。
[0061]機(jī)器人在其攝像機(jī)(或其中一個(gè)攝像機(jī))的視覺(jué)范圍內(nèi)檢測(cè)到人的進(jìn)入并且將該人的面部識(shí)別為對(duì)話者“00011”的面部。該機(jī)器人在存儲(chǔ)器中加載對(duì)應(yīng)的對(duì)話者資料并且使用“姓”信息以使部分預(yù)寫(xiě)的問(wèn)候語(yǔ)個(gè)性化。該機(jī)器人還使用與對(duì)話歷史相關(guān)的信息:前一天與相同對(duì)話者已發(fā)生的另一對(duì)話。
[0062].機(jī)器人:你好Jean!謝謝回來(lái)看我,我很高興!昨天以來(lái)怎么樣?
[0063]對(duì)話者回答問(wèn)題:
[0064]?人類:我很好,你好嗎?
[0065]對(duì)話者提出的問(wèn)題(“你好嗎?”)觸發(fā)回答,該回答在本例中是刻板的:
[0066]?機(jī)器人:我很好,謝謝!
[0067]為了繼續(xù)對(duì)話,機(jī)器人利用背景數(shù)據(jù):日期(本例中為歐洲日5月9日(該信息被存儲(chǔ)在機(jī)器人的存儲(chǔ)器中)):
[0068].機(jī)器人:告訴我,你知道今天是歐洲日嗎?我覺(jué)得這是了不起的,這些具有不同語(yǔ)言和文化的國(guó)家組成聯(lián)合體。而且,我講多個(gè)歐洲語(yǔ)言!你呢,Jean,除了法語(yǔ),你還講其它語(yǔ)言嗎?
[0069]下面會(huì)解釋背景數(shù)據(jù)的使用。
[0070]為了上述句子(如下面將詳細(xì)解釋的,該句子的一般結(jié)構(gòu)或“句型”被預(yù)寫(xiě))個(gè)性化,機(jī)器人使用對(duì)話者資料的三個(gè)信息:對(duì)話者的姓(“Jean” )、變量(“母語(yǔ)”)的值(“法語(yǔ)”)和未提供的變量“其它語(yǔ)言”。對(duì)語(yǔ)者的回答使機(jī)器人可通過(guò)將值“英語(yǔ)”分配對(duì)該變量來(lái)豐富該對(duì)話者的資料:
[0071].人:是的,我英語(yǔ)說(shuō)得很流利。
[0072]機(jī)器人的回復(fù)使用該新存儲(chǔ)的值、預(yù)先已被分配給變量“職業(yè)”的值(“工程師”)和(存儲(chǔ)在其存儲(chǔ)器中的)使變量“其它語(yǔ)言”的一些值與變量“職業(yè)”的一些值相關(guān)聯(lián)的“規(guī)則”:
[0073].機(jī)器人:哦,這很好,英語(yǔ)對(duì)于工程師職業(yè)確實(shí)很有用。
[0074]機(jī)器人還可向?qū)υ捳咛嶙h用剛被記錄在資料中的語(yǔ)言繼續(xù)談話:
[0075].機(jī)器人:您想要講一點(diǎn)英語(yǔ)嗎?
[0076]?人:好,這能讓我操練。
[0077]?機(jī)器人:太棒了,我們開(kāi)始吧!
[0078]對(duì)話者肯定的回答觸發(fā)了英語(yǔ)對(duì)話(建議對(duì)機(jī)器人編程以用該語(yǔ)言對(duì)話)。
[0079]在對(duì)話結(jié)束時(shí),對(duì)話者資料被改變,這是由于值“英語(yǔ)”被分配給了其變量“其它語(yǔ)士”
曰:
[0080]對(duì)話者識(shí)別碼:00011
[0081]名字:Jean
[0082]年齡:35
[0083]職業(yè):工程師
[0084]興趣愛(ài)好:游泳;跑步;騎自行車
[0085]寵物:
[0086]母語(yǔ):法語(yǔ)
[0087]其它語(yǔ)言:英語(yǔ)
[0088]圖2的流程圖更詳細(xì)地示出根據(jù)本發(fā)明的實(shí)施方式的方法的實(shí)施。
[0089]人類對(duì)話者的識(shí)別步驟a)包括兩個(gè)子步驟:
[0090]-獲取圖像的子步驟al,如上面所解釋的,該圖像可為對(duì)話者的面部圖像或識(shí)別圖形碼;
[0091 ]-通過(guò)識(shí)別所述圖像來(lái)辨識(shí)對(duì)話者的子步驟a2;如上面所解釋的,該步驟可被本地執(zhí)行或由遠(yuǎn)程服務(wù)器執(zhí)行。
[0092]其它識(shí)別方式也是可能的。
[0093]步驟b)包括從本地存儲(chǔ)中或在存儲(chǔ)在遠(yuǎn)程服務(wù)器上的數(shù)據(jù)庫(kù)中提取對(duì)應(yīng)于在步驟a)中識(shí)別的對(duì)話者的對(duì)話者資料INT_PR。
[0094]可選地,在步驟b)之后,機(jī)器人例如可通過(guò)問(wèn)候?qū)υ捳卟⑶彝ㄟ^(guò)稱呼其姓(如果該變量被記錄在對(duì)話者資料中時(shí),通常是這種情況)來(lái)開(kāi)始對(duì)話。該步驟未被示出以避免附圖過(guò)于復(fù)雜。
[0095 ] 步驟c)包括四個(gè)子步驟:
[0096]-借助于一個(gè)或多個(gè)麥克風(fēng)DAS來(lái)接收來(lái)自所述對(duì)話者的聲音的子步驟Cl;
[0097]-通過(guò)使用已知算法在子步驟Cl中接收到的聲音上進(jìn)行聲音識(shí)別以從中提取句子的子步驟c2;
[0098]-分析句子的子步驟c3;將利用圖3A-3D更詳細(xì)地描述該子步驟;
[0099]-如果在子步驟c3中執(zhí)行的分析導(dǎo)致識(shí)別到要分配給資料變量的新值,步驟c還包括更新所述資料的子步驟c4。
[0100]在更簡(jiǎn)單的實(shí)施方式中,借助于鍵盤和屏幕寫(xiě)入對(duì)話,通過(guò)簡(jiǎn)單的文本獲取來(lái)代替子步驟cl和c2。
[0101]回答步驟d)包括三個(gè)子步驟:
[0102]-可選的提取以下背景數(shù)據(jù)的子步驟dl:日期、時(shí)間、氣象數(shù)據(jù)、其它人的存在……;
[0103]-提出答句的子步驟d2;將利用圖3A-3D更詳細(xì)地描述該子步驟;以及
[0104]-發(fā)送在子步驟d2中制定的答句的子步驟d3;通過(guò)使用已知的語(yǔ)音合成算法和一個(gè)或多個(gè)揚(yáng)聲器DES來(lái)實(shí)施該子步驟。
[0105]因此可從子步驟Cl起重復(fù)該方法,機(jī)器人被設(shè)置成等待對(duì)話者的新句子。
[0106]該算法可在最長(zhǎng)等待時(shí)間過(guò)去之后被終止。另外,在子步驟c3中執(zhí)行的句子分析可向機(jī)器人指示對(duì)話者希望結(jié)束對(duì)話(例如,這種希望可從檢測(cè)到句子“我得走了” ; “再見(jiàn)”;“下次見(jiàn)”等等而被推斷出)。而且,在對(duì)話者從攝像機(jī)DAI的視覺(jué)范圍中消失的情況下(子步驟Dl),機(jī)器人可決定結(jié)束對(duì)話。這些變型未被示出以避免附圖過(guò)于復(fù)雜。
[0107]由機(jī)器人處理器進(jìn)行的句子分析(子步驟c3)和提出(子步驟d2)使用“句型”或“句式”(英語(yǔ)為“patterns” )。由詞、變量指示符、“概念”和“標(biāo)簽”、以及與一個(gè)或多個(gè)邏輯運(yùn)算符相關(guān)聯(lián)的動(dòng)作指示符來(lái)構(gòu)成句型??捎梅Q為“句法樹(shù)”的樹(shù)型結(jié)構(gòu)來(lái)表示句型。
[0108]圖3A示出了對(duì)應(yīng)于在實(shí)施該方法的子步驟c3時(shí)所使用的句型MDP的句法樹(shù)第一示例ASl,以用于分析人類對(duì)話者說(shuō)出的句子。通過(guò)為此目的而開(kāi)發(fā)的腳本語(yǔ)言來(lái)描述該句型:
[0109]“我的姓是_?列表-名字”
[0110]包括三個(gè)詞(“我的”、“姓”、“是”)和概念(“?列表-名字”)。波形號(hào)“?”表示概念,符號(hào)《_》指示需被存儲(chǔ)的概念。
[0111]詞和概念(附圖標(biāo)記CPT)形成句法樹(shù)AS的樹(shù)葉,由形成樹(shù)根的邏輯運(yùn)算符“與”來(lái)連接。
[0112]由句子中語(yǔ)義上接近并且可互換的多個(gè)詞構(gòu)成概念(此處為名字列表)。由其中樹(shù)葉為可互換的詞(“Jean”、“Pierre”、“Paul”、“Jacques”……)并且樹(shù)根為邏輯運(yùn)算符“或”的樹(shù)(圖3B)來(lái)表示概念“列表-名字”。如果例如對(duì)話者說(shuō)“我的姓為Jean”,機(jī)器人處理器驗(yàn)證該句子是否對(duì)應(yīng)于句式并且將值“Jean”存儲(chǔ)在機(jī)器人存儲(chǔ)器的臨時(shí)變量中(命令#存儲(chǔ)#在句式中對(duì)應(yīng)于符號(hào)符號(hào)“井號(hào)”(#)表示不是需被說(shuō)出的姓)。
[0113]圖3C示出了對(duì)應(yīng)于在實(shí)施子步驟c4(更新對(duì)話者資料)和d2(提出答句)時(shí)所使用的句型MDP的句法樹(shù)另一示例。該句型寫(xiě)為:
[0114]“這是一個(gè)好聽(tīng)的姓$1!$INT/名字= $1”
[0115]將其理解為包括四個(gè)詞(“這是”、“一個(gè)”、“好聽(tīng)的”、“姓”)、語(yǔ)調(diào)標(biāo)志(“!”)和臨時(shí)變量指示符,在該臨時(shí)變量中存儲(chǔ)有對(duì)話者名字(“$1”(符號(hào)“Γ表示變量))。該句型還包括將包括在臨時(shí)變量$ I中的值賦予對(duì)話變量VD “$ INT/名字”的賦值運(yùn)算。同樣由樹(shù)(圖3B的下部)表示賦值運(yùn)算,該樹(shù)借助于等于運(yùn)算符“=”使變量“INT/名字”與指示符“$1”相關(guān)聯(lián)。
[0116]規(guī)則能夠使處理器將輸入(由對(duì)話者說(shuō)出的句子)與輸出(由機(jī)器人發(fā)送的答句)相關(guān)聯(lián)。圖3D示出的樹(shù)R表示這種規(guī)則。極簡(jiǎn)單的規(guī)則使由樹(shù)ASl(輸入)表示的句型與由樹(shù)AS2(輸出)表示的句型相關(guān)聯(lián)。而且,通過(guò)應(yīng)用該規(guī)則,當(dāng)對(duì)話者說(shuō)“我的姓是Jean”時(shí),機(jī)器人回答“這是一個(gè)好聽(tīng)的姓,Jean!”(可用概念“列表-名字”中列出的所有其它名字來(lái)代替“Jean”)。另外,如前面所解釋的,處理器通過(guò)記錄名字為“Jean”的信息來(lái)更新對(duì)話者資料,并且可在之后的對(duì)話中使用該信息。
[0117]所述規(guī)則可更加復(fù)雜。例如,可根據(jù)分配給一些變量的值以及/或者根據(jù)背景數(shù)據(jù)(例如在前面示出的對(duì)話示例中的日期)在多個(gè)選項(xiàng)中選擇輸出。而且,可在輸入端設(shè)置與一個(gè)或多個(gè)相同的輸出相關(guān)聯(lián)的多個(gè)可選句型。
[0118]規(guī)則樹(shù)R還包括標(biāo)簽(英語(yǔ)為“tag”)TG: “#自我介紹#”。在這種情況下,該標(biāo)簽?zāi)軌蚴乖撘?guī)則與“談話主題”(英語(yǔ)為“topic”)連結(jié),所述“談話主題”重組語(yǔ)義上接近的規(guī)則(此處談話主題由對(duì)話者的自我介紹構(gòu)成)。根據(jù)一些變量的值、存儲(chǔ)在對(duì)話者資料中的對(duì)話歷史和/或背景數(shù)據(jù),由一些標(biāo)簽標(biāo)記的規(guī)則可被激活或失效。而且,例如,由標(biāo)簽“圣誕節(jié)”標(biāo)記的規(guī)則僅在12月I日與I月15日(背景數(shù)據(jù))之間被激活;如果資料指示對(duì)話者沒(méi)有寵物,由標(biāo)簽“寵物”標(biāo)記的規(guī)則失效;當(dāng)一定數(shù)量的規(guī)則具有已被應(yīng)用的標(biāo)簽時(shí),可認(rèn)為主題已被充分處理并且這些規(guī)則可在一定時(shí)間內(nèi)失效。
[0119]前述對(duì)話歷史包括帶有日期的先前對(duì)話列表、由機(jī)器人說(shuō)出的回答和問(wèn)題列表(使已提出的問(wèn)題失效以避免重復(fù))、帶有(激活/失效)狀態(tài)的標(biāo)簽列表、和已被處理的主題列表(任選地帶有每個(gè)主題的深入程度的估計(jì))。該歷史以關(guān)鍵字和值的列表形式呈現(xiàn)。
[0120]所有這些特征促進(jìn)了對(duì)話的個(gè)性化和漸進(jìn)性。
【主權(quán)項(xiàng)】
1.一種機(jī)器(RT)與至少一個(gè)人類對(duì)話者(INT)之間的對(duì)話方法,所述對(duì)話方法包括由所述機(jī)器實(shí)施的以下步驟: a)識(shí)別所述人類對(duì)話者; b)從數(shù)據(jù)庫(kù)(BDD)中提取包括多個(gè)對(duì)話變量(VD)的對(duì)話者資料(INT_PR),至少一個(gè)值被分配給至少其中一個(gè)所述對(duì)話變量; c)接收來(lái)自所述對(duì)話者的至少一句句子,分析來(lái)自所述對(duì)話者的所述句子中的每句以從中提取要分配給所述對(duì)話者資料的至少一個(gè)對(duì)話變量的至少一個(gè)值,并且將所述值中的每個(gè)記錄在所述對(duì)話者資料中;以及 d)至少根據(jù)在步驟c)中接收和編譯的所述句子以及所述對(duì)話者資料的一個(gè)所述對(duì)話變量來(lái)提出和發(fā)送至少一句答句; 其特征在于,在步驟c)中接收和分析的所述句子或至少一句所述句子為由所述對(duì)話者自行說(shuō)出的句子或在由所述機(jī)器發(fā)送的非疑問(wèn)句之后的句子。2.根據(jù)權(quán)利要求1所述的對(duì)話方法,其中,對(duì)于來(lái)自所述對(duì)話者的所述句子或至少一句句子的分析和所述答句或至少一句答句的提出借助于由相應(yīng)的句法樹(shù)(ASl,AS2)表示的多個(gè)句型(MDP)來(lái)執(zhí)行。3.根據(jù)權(quán)利要求2所述的對(duì)話方法,其中,所述句型中的至少一些包括指示所述對(duì)話者資料的對(duì)話變量的至少一個(gè)指示符。4.根據(jù)權(quán)利要求2或3所述的對(duì)話方法,其中,所述句型中的至少一些包括指示句子中的至少一組可互換詞語(yǔ)、即概念(CPT)的指示符。5.根據(jù)權(quán)利要求2至4中任一項(xiàng)所述的對(duì)話方法,其中,所述步驟d)借助于與來(lái)自所述對(duì)話者的至少一個(gè)句型以及與至少一個(gè)答句句型相關(guān)聯(lián)的多個(gè)規(guī)則(R)來(lái)實(shí)施。6.根據(jù)權(quán)利要求5所述的對(duì)話方法,其中,在所述步驟d)中,至少一個(gè)所述規(guī)則與來(lái)自所述對(duì)話者的相同句型相關(guān)聯(lián),多個(gè)句型可用作答句;并且,在所述答句句型中排除包括指示對(duì)話變量的指示符的答句句型,在所述對(duì)話者資料中沒(méi)有值被分配給所述對(duì)話變量。7.根據(jù)權(quán)利要求5或6所述的對(duì)話方法,其中, -由識(shí)別談話主題的標(biāo)簽(TG)來(lái)標(biāo)記至少一個(gè)所述規(guī)則; -在所述步驟d)中,由識(shí)別經(jīng)確定的談話主題的至少一個(gè)標(biāo)簽來(lái)標(biāo)記的一個(gè)或多個(gè)規(guī)則根據(jù)至少一個(gè)對(duì)話參數(shù)被激活或失效。8.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的對(duì)話方法,其中,所述對(duì)話者資料還包括對(duì)話歷史,并且在所述步驟d)中,所述答句或至少一句所述答句還根據(jù)所述對(duì)話歷史來(lái)提出。9.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的對(duì)話方法,其中,在所述步驟d)中,所述答句或至少一句所述答句還根據(jù)由所述機(jī)器獲得或確定的至少一個(gè)背景參數(shù)來(lái)提出。10.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的對(duì)話方法,其中,在所述步驟a)中,借助于圖像獲取裝置(DAI)通過(guò)面部辨認(rèn)或讀取呈現(xiàn)在所述圖像獲取裝置上的圖形碼來(lái)識(shí)別所述人類對(duì)話者。11.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的對(duì)話方法,其中,在所述步驟b)中,所述機(jī)器借助于通信網(wǎng)絡(luò)(Re)來(lái)訪問(wèn)遠(yuǎn)程服務(wù)器(SVD),并且下載存儲(chǔ)在所述遠(yuǎn)程服務(wù)器中的所述數(shù)據(jù)庫(kù)的所述對(duì)話者資料。12.根據(jù)權(quán)利要求11所述的對(duì)話方法,其中,已借助于所述通信網(wǎng)絡(luò)訪問(wèn)所述遠(yuǎn)程服務(wù)器的所述機(jī)器在所述數(shù)據(jù)庫(kù)中加載通過(guò)記錄被分配給至少一個(gè)對(duì)話變量的至少一個(gè)值而更新的對(duì)話者資料,所述至少一個(gè)對(duì)話變量在所述步驟C)中從來(lái)自所述對(duì)話者的至少一句句子中提取。13.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的對(duì)話方法,其中,所述機(jī)器包括被裝載在仿人機(jī)器人(RT)中的處理器(0E)。14.一種電腦程序產(chǎn)品,其用于當(dāng)所述程序在處理器上被執(zhí)行時(shí)實(shí)施根據(jù)前述權(quán)利要求中任一項(xiàng)所述的對(duì)話方法。15.—種包括經(jīng)編程的被裝載的處理器(OE)的仿人機(jī)器人(RT),所述仿人機(jī)器人用于實(shí)施根據(jù)權(quán)利要求13所述的對(duì)話方法。16.根據(jù)權(quán)利要求15所述的仿人機(jī)器人,所述仿人機(jī)器人還包括: -與所述被裝載的處理器配合的圖像獲取裝置,所述圖像獲取裝置用于識(shí)別人類對(duì)話者; -與所述被裝載的處理器配合的聲音獲取裝置,所述聲音獲取裝置用于接收由所述人類對(duì)話者說(shuō)出的至少一句句子;以及 -與所述被裝載的處理器配合的聲音發(fā)送裝置,所述聲音發(fā)送裝置用于發(fā)送所述答句。
【文檔編號(hào)】G06N3/00GK105940446SQ201480054850
【公開(kāi)日】2016年9月14日
【申請(qǐng)日】2014年9月29日
【發(fā)明人】M·帕特里, D·烏桑, J·蒙索
【申請(qǐng)人】奧爾德巴倫機(jī)器人公司