專利名稱:任務(wù)建模的多級(jí)置信度度量及其關(guān)于面向任務(wù)的、多模態(tài)的對(duì)話管理的應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)話管理系統(tǒng)。更具體地,本發(fā)明提供一種方法與系統(tǒng),其用于使用面向任務(wù)的、多模態(tài)(multi-modal)的對(duì)話管理系統(tǒng),便利任務(wù)完成。
背景技術(shù):
最近幾十年見證了軟件應(yīng)用的復(fù)雜性的增長(zhǎng)。它的發(fā)生主要是為了向用戶提供更多的自動(dòng)化與更好的功能。處理器速度、硬件架構(gòu)與網(wǎng)絡(luò)連通性中的改進(jìn)也便利了這一過程。隨著應(yīng)用的復(fù)雜性增加,用戶與應(yīng)用之間的接口問題也變得復(fù)雜。
用戶接口擔(dān)當(dāng)用戶與各軟件應(yīng)用之間的接口。對(duì)于到用戶的輸入/輸出,用戶接口典型地使用多模態(tài)。多模態(tài)用戶接口系統(tǒng)是這樣的用戶接口系統(tǒng),其使用各通信通道,例如鍵盤與語音識(shí)別/合成系統(tǒng),來在用戶與應(yīng)用之間交換信息。多模態(tài)用戶接口的使用給予用戶/應(yīng)用根據(jù)要交換的信息的類型,在各模式之間進(jìn)行選擇的靈活性。
在任務(wù)的成功完成中,用戶接口扮演了重要角色。用戶接口包括對(duì)話管理器,其采用面向任務(wù)的對(duì)話管理器來完成任務(wù)。對(duì)話管理器是面向任務(wù)的,這是因?yàn)槠浒ㄏ聦討?yīng)用任務(wù)的任務(wù)模型。任務(wù)的任務(wù)模型包括多個(gè)方案(recipe),該方案為完成任務(wù)的方法。例如,任務(wù)可以是從數(shù)據(jù)庫(kù)取回歌曲文件。完成該任務(wù)可以有多個(gè)方案??墒褂脴?biāo)題、藝術(shù)家、流派、發(fā)行數(shù)據(jù)與文件格式的各組合來搜索數(shù)據(jù)庫(kù);而每一組合將組成一不同的方案。
為成功地完成任務(wù),對(duì)話管理器必須決定(1)需要如何完成任務(wù);(2)為進(jìn)行任務(wù)而執(zhí)行的下一行動(dòng);(3)要與用戶交換的信息;和(4)要用于用戶與應(yīng)用之間的信息交換的模態(tài)。所有上面的決定將在運(yùn)行時(shí),根據(jù)用戶的偏好與其它因素,來作出。
對(duì)于任務(wù)的成功完成,用戶接口系統(tǒng)面臨的主要問題之一是處理模態(tài)與任務(wù)所需的其它相關(guān)資源的精確度與可獲得性中的變化。精確度問題是指接口系統(tǒng)不能精確地接收用戶輸入的情況。甚至在精確地接收到輸入時(shí),接口系統(tǒng)可能不能解釋輸入,導(dǎo)致解釋問題。例如,在語音識(shí)別系統(tǒng)中,系統(tǒng)可能不能正確地將接收的語音翻譯成文本格式。精確度問題的其它實(shí)例是用戶使用鍵盤或小鍵盤輸入的誤打字。相反地,用戶可能不能解釋合成語音形式的輸出。解釋問題也可能產(chǎn)生自因?yàn)榈蛯?duì)比度(由于強(qiáng)的外部光亮)與小的/復(fù)雜的字體而造成的不清晰的文本或圖形輸出中。
任務(wù)所需的其它相關(guān)資源是指諸如網(wǎng)絡(luò)連接以及與任務(wù)域相關(guān)的物理對(duì)象等資源。要求網(wǎng)絡(luò)連接的任務(wù)的一個(gè)示例是要求自遠(yuǎn)程服務(wù)器訪問某些信息的任務(wù)。為了完成任務(wù)而要求物理對(duì)象的任務(wù)的一個(gè)示例是運(yùn)輸領(lǐng)域中的要求卡車作為資源的任務(wù)。
用戶接口系統(tǒng)面臨的另一相關(guān)問題是選擇一方案,以最大化成功完成任務(wù)的概率。典型地,在運(yùn)行時(shí)期間,用戶接口系統(tǒng)必須基于用戶的響應(yīng)選擇適宜的方案以完成任務(wù)。然而,現(xiàn)有用戶接口系統(tǒng)不具有任何決定使用哪一方案,以便最大化成功完成任務(wù)的概率的技術(shù)。
根據(jù)現(xiàn)有技術(shù),存在對(duì)于用于自動(dòng)地選擇適宜的方案,以最大化成功完成任務(wù)的概率的方法與系統(tǒng)的需要。另外,存在對(duì)于提供對(duì)話管理器的魯棒性,以處理模態(tài)與其它相關(guān)資源的精確度與可獲得性中的變化的需要。
發(fā)明內(nèi)容
本發(fā)明針對(duì)一種方法與系統(tǒng),其用于使用面向任務(wù)的、多模態(tài)的對(duì)話管理,最大化完成任務(wù)的概率。
系統(tǒng)包括模態(tài)資源監(jiān)視器(MRM)、對(duì)話管理器、置信度度量提取器(CME)與任務(wù)建模器。MRM監(jiān)視所有模態(tài)的可獲得性與性能。任務(wù)建模器存儲(chǔ)可由系統(tǒng)執(zhí)行的每一任務(wù)的任務(wù)模型。CME使用任務(wù)建模器提供的任務(wù)模型和MRM提供的模態(tài)置信度度量,向?qū)υ捁芾砥魈峁┲眯哦榷攘?。?duì)話管理器控制與用戶的對(duì)話交互。
任務(wù)模型典型地分解為多級(jí)抽象。任務(wù)的任務(wù)模型包括用于完成任務(wù)的至少一個(gè)方案以及相關(guān)聯(lián)的動(dòng)作、參數(shù)與模態(tài)。
在接收對(duì)任務(wù)的請(qǐng)求后,CME在運(yùn)行時(shí)為與任務(wù)相關(guān)聯(lián)的每一方案、動(dòng)作與參數(shù)計(jì)算置信度度量。置信度度量對(duì)應(yīng)于可成功完成有關(guān)任務(wù)模型組件的概率分值。任務(wù)模型中較高級(jí)別處的置信度度量基于較低級(jí)別的置信度度量與當(dāng)前級(jí)別可獲得的其它知識(shí)源進(jìn)行計(jì)算。
選擇具有最高置信度度量的適宜的方案,以最大化完成任務(wù)的概率。類似地,還為適宜的方案選擇適宜的動(dòng)作與適宜的參數(shù)。適宜的動(dòng)作在其后執(zhí)行。
在接收對(duì)適宜的動(dòng)作的用戶響應(yīng)時(shí),基于由模態(tài)報(bào)告的實(shí)際的置信度度量,更新適宜的方案、適宜的動(dòng)作與適宜的參數(shù)的置信度度量。方法再次跳回到選擇適宜的方案、適宜的動(dòng)作與適宜的參數(shù)的步驟。重復(fù)這些步驟,直到成功完成任務(wù)。這樣,本發(fā)明提供在執(zhí)行每一動(dòng)作后,對(duì)適宜的方案與適宜的動(dòng)作的動(dòng)態(tài)選擇。
遵照本發(fā)明的系統(tǒng)可以可選地具有后評(píng)估機(jī)制(PEM)。PEM監(jiān)視對(duì)執(zhí)行的各動(dòng)作的用戶響應(yīng),并修改用于計(jì)算置信度度量的公式。這有助于遵照用戶偏好,持續(xù)地改進(jìn)系統(tǒng)。
下面將結(jié)合所附繪圖,描述本發(fā)明的優(yōu)選實(shí)施例,所述繪圖被提供以闡釋而非限制本發(fā)明,其中相似的稱號(hào)表示相似的組件,并且其中圖1是闡釋示例性系統(tǒng)的框圖,該系統(tǒng)實(shí)現(xiàn)一種用于多模態(tài)的、面向任務(wù)的對(duì)話管理的方法,其遵照本發(fā)明;圖2是闡釋示例性任務(wù)模型的樹形結(jié)構(gòu);圖3是闡釋一種多模態(tài)的、面向任務(wù)的對(duì)話管理的方法的流程圖,其遵照本發(fā)明的優(yōu)選實(shí)施例;圖4是闡釋一種用于提供置信度度量的方法的流程圖;圖5是闡釋對(duì)話控制方法的流程圖;圖6是顯示用于查找音頻文件的任務(wù)的任務(wù)模型的表格;和圖7是顯示為用于查找音頻文件的任務(wù)模型的方案_1計(jì)算置信度度量的表格。
具體實(shí)施例方式
本發(fā)明提供一種方法與系統(tǒng),其用于面向任務(wù)的、多模態(tài)的對(duì)話管理,以最大化成功完成任務(wù)的概率。
圖1是示例性系統(tǒng)的框圖,該系統(tǒng)實(shí)現(xiàn)一種用于對(duì)話管理的方法,其遵照本發(fā)明的優(yōu)選實(shí)施例?;谟?jì)算機(jī)的系統(tǒng)102連接到至少一個(gè)模態(tài)104,以與用戶交互。基于計(jì)算機(jī)的系統(tǒng)102包括模態(tài)資源監(jiān)視器(MRM)106、任務(wù)建模器108、置信度度量提取器(CME)110與對(duì)話管理器112。MRM106監(jiān)視各模態(tài)104并向CME110提供信息。任務(wù)建模器108存儲(chǔ)與各任務(wù)相關(guān)聯(lián)的任務(wù)模型的倉(cāng)庫(kù),并向?qū)υ捁芾砥?12與CME110提供任務(wù)模型。CME110向?qū)υ捁芾砥?12提供各抽象級(jí)別上的任務(wù)模型的置信度度量。CME110可以可選地具有后評(píng)估模塊(PEM)114,以遵照用戶響應(yīng)修改置信度度量公式。對(duì)話管理器112具有一種對(duì)話控制方法,其為對(duì)話管理使用置信度度量與任務(wù)模型。下面詳細(xì)地解釋系統(tǒng)的每一組件。
使用至少一個(gè)模態(tài)104來接收輸入并向用戶提供輸出??墒褂玫牟煌斎肽B(tài)的示例是鍵盤、語音識(shí)別系統(tǒng)、鼠標(biāo)、游戲棒與觸摸屏。類似地,各輸出模態(tài)的示例是顯示器、觸摸屏、語音合成系統(tǒng)與虛擬現(xiàn)實(shí)系統(tǒng)。對(duì)于任何本領(lǐng)域技術(shù)人員而言將顯而易見的是,本發(fā)明中公開的方法可與任何模態(tài)一起工作。
基于計(jì)算機(jī)的系統(tǒng)102可以是包括,但不限于,電腦、筆記本電腦、平板電腦、掌上電腦、智能手機(jī)、個(gè)人數(shù)字助理(PDA)與各嵌入式系統(tǒng)等基于計(jì)算機(jī)的系統(tǒng)中的任何一個(gè)。
任務(wù)建模器108包括用于下層應(yīng)用可完成的所有任務(wù)的模型。任務(wù)的任務(wù)模型包括用于完成任務(wù)的多個(gè)方案。每一任務(wù)與任務(wù)模型中的至少一個(gè)方案相關(guān)聯(lián)。任務(wù)模型由任務(wù)建模器108向?qū)υ捁芾砥?12與CME110提供。這些任務(wù)模型由下層應(yīng)用提供。這些任務(wù)模型可以由應(yīng)用按照由對(duì)話管理器接受或決定的任一安排(scheme)提供。例如,應(yīng)用開發(fā)者可以在描述符文件中定義應(yīng)用的任務(wù)模型,該文件使用可擴(kuò)展標(biāo)注語言(XML),遵循由對(duì)話管理器(在文檔類型定義中)定義的安排。對(duì)話管理器可讀取描述符文件并裝載應(yīng)用任務(wù)模型描述符,解析XML文件并生成任務(wù)模型的內(nèi)部表示以供其使用。
作為可供選擇的另一種替代方案,對(duì)話管理器可提供軟件庫(kù),其包括獨(dú)立于域的任務(wù)建模類。應(yīng)用開發(fā)者可通過使用由對(duì)話管理器提供的軟件庫(kù),來實(shí)現(xiàn)任務(wù)模型的代碼。其后,將這樣生成的代碼編譯為應(yīng)用程序,以供對(duì)話管理器使用。
方案是完成任務(wù)的特定方法。每一方案與一套動(dòng)作與一套約束相關(guān)聯(lián)。動(dòng)作是給定方案中要完成的步驟。每一方案包括一或多個(gè)動(dòng)作。約束指定時(shí)間排序以及與方案相關(guān)聯(lián)的各動(dòng)作之間的其它綁定,如果有的話。每一動(dòng)作又與一套參數(shù)相關(guān)聯(lián),這些參數(shù)必須由用戶在模態(tài)輸入/輸出104完成,以執(zhí)行動(dòng)作。每一參數(shù)與一套模態(tài)相關(guān)聯(lián),其可用于將參數(shù)輸入/輸出到用戶。
圖2中闡釋了示例性的任務(wù)的任務(wù)模型。任務(wù)-A202與方案-A204和方案-B206相關(guān)聯(lián)。方案-A204又與動(dòng)作-A208、動(dòng)作-B210、任務(wù)-B212和約束-A214相關(guān)聯(lián)。約束-A214包括動(dòng)作-A208、動(dòng)作-B210和任務(wù)-B212之間的時(shí)間關(guān)系。任務(wù)-B212與方案-A204相關(guān)聯(lián)的事實(shí)顯示了任務(wù)模型的遞歸屬性。換言之,方案的動(dòng)作自身可包括任務(wù),該任務(wù)具有其自己的任務(wù)模型。動(dòng)作-A208與完成動(dòng)作-A208所需的參數(shù)-A216和參數(shù)-B218相關(guān)聯(lián)。參數(shù)-A216與模態(tài)-A220和模態(tài)-B222相關(guān)聯(lián)。
下面將解釋用于尋找包含歌曲在內(nèi)的音頻文件的任務(wù)的示例任務(wù)模型。該任務(wù)可使用各方案。一方案可包括指定歌曲名稱,指定藝術(shù)家名稱以及搜索數(shù)據(jù)庫(kù)的動(dòng)作。指定歌曲名稱的動(dòng)作與字符串參數(shù)Song_Name相關(guān)聯(lián)。類似地,指定藝術(shù)家名稱的動(dòng)作與字符串參數(shù)Artist_Name相關(guān)聯(lián)。該方案還與這樣的約束相關(guān)聯(lián),即搜尋數(shù)據(jù)庫(kù)的動(dòng)作將在其它兩動(dòng)作之后完成。
MRM106提供關(guān)于可獲得的輸入/輸出模態(tài)的信息。特別地,MRM106檢測(cè)模態(tài)的可獲得性,并獲取每一可獲得的模態(tài)的精確度。模態(tài)的精確度是模態(tài)正確地解釋并與用戶共享信息的能力。MRM106包括一套用于所有模態(tài)的資源監(jiān)視器。用于每一模態(tài)的資源監(jiān)視器監(jiān)視模態(tài)的各參數(shù),例如可獲得性、精確度等等。例如,如果語音識(shí)別系統(tǒng)連接到基于計(jì)算機(jī)的系統(tǒng)102,則在MRM106中將包括用于該語音識(shí)別系統(tǒng)的相應(yīng)的資源監(jiān)視器。對(duì)于本領(lǐng)域技術(shù)人員而言顯而易見的是,可使用本領(lǐng)域中可獲得的任何標(biāo)準(zhǔn)的資源監(jiān)視器來形成MRM106。例如,移動(dòng)設(shè)備的模態(tài)的可獲得性可以由W3C的CC/PP(組合能力/偏好設(shè)定檔)標(biāo)準(zhǔn)提供。與此相關(guān)的更多信息可在互聯(lián)URL站點(diǎn)找到http://www.w3.org/Mobile/CCPP。模態(tài)的精確度信息典型地由單個(gè)模態(tài)專用的API提供。例如,Java社區(qū)過程已交付稱為JavaSpeech API(JSAPI)的規(guī)范,以監(jiān)視話音資源。
將各模態(tài)的精確度傳遞給CME110,以提供和修改置信度度量。CME110在任務(wù)模型的各抽象級(jí)別提供置信度度量。置信度度量表示成功完成任務(wù)模型級(jí)別組件的概率分值。CME110使用來自任務(wù)建模器108的任務(wù)模型與來自MRM106的模態(tài)信息來計(jì)算置信度度量。CME110也存儲(chǔ)置信度度量,以供以后使用。CME110可以可選地包括后評(píng)估模塊(PEM)114,以遵照用戶偏好修改用于計(jì)算置信度度量的公式。在后面的描述中參照?qǐng)D4進(jìn)一步解釋用于提供置信度度量的方法。
對(duì)話管理器112從CME110接收置信度度量。對(duì)話管理器112中的對(duì)話控制方法使用這些置信度度量來最大化完成任務(wù)的概率。對(duì)話管理器112還生成系統(tǒng)命令,以執(zhí)行任務(wù)。對(duì)話管理器112使用置信度度量和自任務(wù)建模器108接收的任務(wù)模型來確定適宜的動(dòng)作。該任務(wù)模型也由對(duì)話管理器112用于執(zhí)行任務(wù)。在后面的描述中參照?qǐng)D5進(jìn)一步解釋對(duì)話控制方法。
參照?qǐng)D3,闡釋了一種多模態(tài)的、面向任務(wù)的對(duì)話管理的方法的流程圖,其遵照本發(fā)明的優(yōu)選實(shí)施例。在步驟302,用戶或應(yīng)用進(jìn)行對(duì)任務(wù)的請(qǐng)求。對(duì)任務(wù)的請(qǐng)求由對(duì)話管理器112接收。用戶可使用任何可獲得的輸入模態(tài)104來請(qǐng)求任務(wù)。應(yīng)用可通過時(shí)間監(jiān)聽器機(jī)制在對(duì)話管理器中請(qǐng)求任務(wù)。在此情形中,將對(duì)話管理器作為對(duì)任務(wù)事件的監(jiān)聽器注冊(cè)到應(yīng)用。無論何時(shí)應(yīng)用想要在對(duì)話中請(qǐng)求任務(wù),其生成請(qǐng)求任務(wù)事件。
在接收對(duì)任務(wù)的請(qǐng)求時(shí),在步驟304,由CME110提供置信度度量。在此步驟,提供與任務(wù)相關(guān)聯(lián)的方案、動(dòng)作和參數(shù)的置信度度量。
在步驟304提供置信度度量之后,在步驟306,使用提供的置信度度量來確定要執(zhí)行的適宜的動(dòng)作。適宜的動(dòng)作由對(duì)話管理器112使用對(duì)話控制方法確定,以便利任務(wù)的完成。
在確定適宜的動(dòng)作后,在步驟308,由對(duì)話管理器112使用適宜的參數(shù)執(zhí)行動(dòng)作。對(duì)話管理器112生成系統(tǒng)命令,以執(zhí)行適宜的動(dòng)作。
對(duì)話管理器112其后等待并接收對(duì)于適宜的動(dòng)作的用戶響應(yīng)310。在步驟312,基于用戶響應(yīng),更新置信度度量。
在步驟314,檢查任務(wù)狀態(tài)。如果任務(wù)完成,則方法結(jié)束。如果任務(wù)未完成,則確定下一適宜的動(dòng)作,以便利任務(wù)的完成,并且重復(fù)后繼步驟。下面,詳盡地描述上面描述的步驟。
圖4是計(jì)算置信度度量中包括的步驟的流程圖,其遵照本發(fā)明的優(yōu)選實(shí)施例。該方法內(nèi)嵌于CME110中。在步驟402,為每一參數(shù)計(jì)算參數(shù)級(jí)置信度度量(PLCM)。計(jì)算該任務(wù)的任務(wù)模型中出現(xiàn)的所有參數(shù)的置信度度量??梢砸愿鞣N方法計(jì)算PLCM。下面描述兩種示例性的方法。
如果直到計(jì)算時(shí),參數(shù)仍未由用戶提供,使用兩個(gè)因子計(jì)算PLCM(1)可用來獲取該參數(shù)的模態(tài)的估計(jì)的精確度,和(2)相應(yīng)的估計(jì)的為該參數(shù)使用一模態(tài)的概率。該依賴關(guān)系(dependency)可表示為PLCM=f({m(p),w(m,p)∶m,p})其中,p是參數(shù);m(p)是用于參數(shù)p的輸入/輸出的模態(tài)的估計(jì)的精確度;和
w(m,p)是使用用于參數(shù)p的輸入/輸出的模態(tài)m的估計(jì)的概率。
模態(tài)的估計(jì)的精確度m(p)可以從基于用戶偏好的存儲(chǔ)值獲取。在另一方法中,可以由用戶或模態(tài)初始地定義這些精確度。在不可獲得精確度的情形中,可使用m(p)的缺省值。
使用模態(tài)的概率w(m,p)可以從基于用戶偏好的存儲(chǔ)值獲取。在不可獲得這些概率的情形中,系統(tǒng)向所有可獲得的用于該參數(shù)的模態(tài)分配相等的概率。這些概率可以是應(yīng)用專用的,并且可以由下層應(yīng)用提供??梢曰谑褂玫膶?shí)際模態(tài)動(dòng)態(tài)地修改概率,以便使系統(tǒng)適應(yīng)用戶偏好。
如果在計(jì)算PLCM之前,該參數(shù)已經(jīng)由用戶提供,則直接使用自MRM106獲取的置信度度量來計(jì)算PLCM。
PLCM=CM(m,p)其中,CM(m,p)是用于參數(shù)p的輸入/輸出的模態(tài)m的置信度度量,如模態(tài)m所提供的那樣。
對(duì)于本領(lǐng)域技術(shù)人員而言將顯而易見的是,可采用任何用于為輸入/輸出模態(tài)提供置信度度量的方法。一種這樣的系統(tǒng)由Ruben SanSegundo等在題為“Confidence Measures for Dialogue Management in theCu Communication System”、出版于Proceedings ICSLP 2000,Vol.2,page no.1237-1240的出版物中公開。一些其它的系統(tǒng)在No.5710864、題為“Systems,methods and articles of manufacture forimproving recognition confidence in hypothesized keywords”的美國(guó)專利與No.5710866、題為“A system and method for speech recognitionusing dynamically adjusted confidence measure”的美國(guó)專利中公開。上面的引用作為描述置信度度量的速記(short hand)方法包括在此說明書中。
在步驟404,計(jì)算與任務(wù)模型中的所有方案相關(guān)聯(lián)的動(dòng)作集之中的每一動(dòng)作的動(dòng)作級(jí)置信度度量(ALCM)。動(dòng)作的ALCM表示動(dòng)作被適當(dāng)?shù)刂付ê蛨?zhí)行的概率。使用與動(dòng)作相關(guān)聯(lián)的參數(shù)集之中的每一參數(shù)的PLCM來計(jì)算它。ALCM也依賴于某些應(yīng)用專用的標(biāo)準(zhǔn)。例如,考慮要求網(wǎng)絡(luò)連接以供其成功完成的動(dòng)作。這時(shí),該動(dòng)作的應(yīng)用專用的標(biāo)準(zhǔn)是網(wǎng)絡(luò)連接的可靠性。應(yīng)用專用的標(biāo)準(zhǔn)與其它類似的因素由動(dòng)作被成功執(zhí)行的一般概率表示。上面提到的ALCM的依賴關(guān)系可如下表示ALCM=g(PLCM(p),p(S))其中,PLCM(p)是與動(dòng)作相關(guān)聯(lián)的參數(shù)集之中的參數(shù)p的參數(shù)級(jí)置信度度量;和p(S)是動(dòng)作被成功執(zhí)行的一般概率。
在步驟406,計(jì)算與任務(wù)相關(guān)聯(lián)的方案集之中的所有方案的方案級(jí)置信度度量(RLCM)。方案的PLCM是通過使用該方案成功完成任務(wù)的概率。使用約束以及與方案相關(guān)聯(lián)的動(dòng)作集之中的動(dòng)作的ALCM來計(jì)算它。上面提到的依賴關(guān)系可表示為RLCM=h(ALCM(a),C)其中,ALCM(a)是與方案相關(guān)聯(lián)的動(dòng)作集之中的動(dòng)作a的動(dòng)作級(jí)置信度度量;和C是與方案相關(guān)聯(lián)的約束集。
下面描述在RLCM計(jì)算中包括約束的一示例性方法??紤]具有動(dòng)作ai的方案,其中i可從0變化到m。方案與一套約束相關(guān)聯(lián),這些約束定義方案的動(dòng)作的時(shí)間順序??蓪?dòng)作ai與aj之間的時(shí)間約束定義為參數(shù)Cij,其中Cij=1,如果在方案中aj可在ai之后執(zhí)行;和=0,如果在方案中aj不可在ai之后執(zhí)行。
類似地,也可定義Cji。
其后,計(jì)算遵照約束的所有可能的動(dòng)作序列的置信度度量。其后,將方案的RLCM定義為所有可能的動(dòng)作序列的置信度度量的最大值。任何不滿足時(shí)間約束的動(dòng)作序列將具有置信度度量0。RLCM函數(shù)h的該定義可表示為h=max{hp(ALCM(ai),Cij,ALCM(aj),Cjk,...ALCM(am))}其中,hp是特定動(dòng)作序列的置信度度量。
對(duì)于本領(lǐng)域技術(shù)人員而言將顯而易見的是,可采用各種其它公式來在方案計(jì)算中包括約束。而且,可以注意,上面闡釋的用于置信度度量計(jì)算的所有方法與公式均為示例性的。因此,對(duì)于本領(lǐng)域技術(shù)人員而言將顯而易見的是,本發(fā)明可以與其它公式一起工作。
圖5是確定適宜的動(dòng)作的流程圖,其遵照本發(fā)明的優(yōu)選實(shí)施例。在步驟502,從與任務(wù)相關(guān)聯(lián)的方案集之中選擇適宜的方案。適宜的方案是與任務(wù)相關(guān)聯(lián)的方案集之中具有最高置信度度量的方案。對(duì)于適宜的方案的這種選擇的一個(gè)例外是這樣的情況,其中用戶已經(jīng)為任務(wù)預(yù)先選擇特定方案。那么,由用戶選擇的方案為適宜的方案。
在步驟502選擇適宜的方案之后,在步驟504,選擇適宜的動(dòng)作。適宜的動(dòng)作是與適宜的方案相關(guān)聯(lián)的動(dòng)作集之中具有最高置信度度量的動(dòng)作。對(duì)于適宜的動(dòng)作的選擇最大化在下一對(duì)話輪次中成功完成任務(wù)的概率,從而推動(dòng)任務(wù)。
在步驟506,從與適宜的動(dòng)作相關(guān)聯(lián)的參數(shù)集之中選擇適宜的參數(shù)。適宜的參數(shù)是與適宜的動(dòng)作相關(guān)聯(lián)的參數(shù)集之中具有最高置信度度量的參數(shù)。
在步驟508,為所選參數(shù)選擇適宜的模態(tài)。適宜的模態(tài)是與適宜的參數(shù)相關(guān)聯(lián)的模態(tài)集之中具有最高置信度度量的模態(tài)。
重復(fù)步驟506與508,直到在步驟510,與適宜的動(dòng)作相關(guān)聯(lián)的參數(shù)集之中的所有參數(shù)均被選擇。
回到圖3,在步驟312,以如下方式進(jìn)行置信度度量的更新。首先,修改與適宜的動(dòng)作相關(guān)聯(lián)的參數(shù)集中的每一參數(shù)相關(guān)聯(lián)的PLCM。下面描述PLCM的修改。遵照用戶響應(yīng),使用反饋因子修改用于該參數(shù)的模態(tài)的估計(jì)的精確度。遵照用戶反饋,加上或者減去反饋因子。反饋因子是調(diào)整因子,以依照用戶偏好,在各級(jí)別反映置信度度量。其后,使用模態(tài)的修改的精確度重新計(jì)算PLCM。模態(tài)精確度中的變化改變了PLCM,這是因?yàn)镻LCM是遵照如參照?qǐng)D4的描述詳述的公式進(jìn)行計(jì)算的。
其后,使用如參照?qǐng)D4的描述詳述的公式,使用與適宜的動(dòng)作相關(guān)聯(lián)的參數(shù)集中的每一參數(shù)的修改的PLCM來修改適宜的動(dòng)作的ALCM。在下一步驟,使用如參照?qǐng)D4的描述詳述的公式,使用與適宜的方案相關(guān)聯(lián)的動(dòng)作集中的每一動(dòng)作的修改的ALCM來修改適宜的方案的RLCM。
在本發(fā)明的另一可供選擇的實(shí)施例中,可以僅計(jì)算單級(jí)置信度度量,而非多級(jí)置信度度量。在此情形中,可以僅直接計(jì)算RLCM,而非多級(jí)方式。
在另一可供選擇的實(shí)施例中,PEM評(píng)估用戶響應(yīng),以評(píng)定其對(duì)于成功完成任務(wù)的相關(guān)度。這通過評(píng)定動(dòng)作在用戶上是否具有預(yù)期的效果,并確定對(duì)話是否可運(yùn)行到下一輪次來進(jìn)行。如果對(duì)話正原路返回,則系統(tǒng)調(diào)節(jié)置信度度量公式,以減小上一方案、動(dòng)作與相關(guān)聯(lián)的參數(shù)的權(quán)重。這有助于改進(jìn)今后對(duì)方案、動(dòng)作與參數(shù)的選擇,以最大化完成任務(wù)的概率。
例如,考慮針對(duì)完成信息性任務(wù)的動(dòng)作。遵照本發(fā)明的一個(gè)實(shí)施例的系統(tǒng)決定顯示圖像,而非使用文本合成,以輸出文本。如果用戶對(duì)輸出滿意,在下一步驟,用戶將要求執(zhí)行文本上的信息。假設(shè),用戶響應(yīng)以“我不能讀清細(xì)節(jié)”,因?yàn)閳D像在可獲得的設(shè)備上太小,難以查看。這樣,接口系統(tǒng)今后對(duì)于類似的任務(wù)將不使用圖像輸出。
下面描述遵照用戶響應(yīng)修改用于置信度度量計(jì)算的公式的一示例性方法。
在一種方法中,可通過依賴于用戶響應(yīng)的反饋因子來修改用于PLCM的公式。如果用戶響應(yīng)是正面的,則以反饋因子增加用于PLCM的公式。如果,相反地,用戶響應(yīng)是負(fù)面的,以反饋因子減少用于PLCM的公式。修改的公式可表示為PLCM=f({m(p),w(m,p)∶m,p})+EP其中,EP是基于用戶響應(yīng)增加/減少的反饋因子。
在另一方法中,可通過取決于用戶響應(yīng)的反饋因子來修改用于ALCM的公式。如果用戶響應(yīng)是正面的,則以反饋因子增加用于ALCM的公式。如果,相反地,用戶響應(yīng)是負(fù)面的,以反饋因子減少用于ALCM的公式。修改的公式可表示為ALCM=g(PLCM(p),p(S))+EA其中,EA是基于用戶響應(yīng)增加/減少的反饋因子。
在一不同的方法中,通過依賴于用戶響應(yīng)的反饋因子來修改用于RLCM的公式。修改的公式可表示為RLCM=h(ALCM(a),C)+ER其中,ER是基于用戶響應(yīng)增加/減少的反饋因子。
在一可供選擇的實(shí)施例中,可實(shí)行機(jī)器學(xué)習(xí)機(jī)制,以遵照用戶的偏好、當(dāng)前應(yīng)用專用的偏好以及環(huán)境特定的議題(issue),動(dòng)態(tài)地修改PLCM、ALCM與RLCM公式。在此情形中,反饋因子EP、EA與ER取決于用戶偏好、應(yīng)用專用的偏好以及環(huán)境特定的議題。在殘障人士的情形中,用戶偏好可能是重要的。例如,聽覺障礙人士可選擇圖形或文本輸出勝于語音輸出。環(huán)境特定的議題是指任務(wù)的方案的選擇上的執(zhí)行的時(shí)間與空間的效果。例如,在戶外位置中,對(duì)于輸出而言,語音合成系統(tǒng)可能不是一個(gè)好的選擇。因此,對(duì)于展現(xiàn)輸出,可給予視頻顯示器勝過語音合成系統(tǒng)的偏好。環(huán)境特定的議題的另一示例是遵照位置(例如劇院、會(huì)議、家中等等)改變用戶的偏好。
盡管本發(fā)明在語音識(shí)別/合成模態(tài)的幫助下公開,對(duì)于本領(lǐng)域技術(shù)人員而言將顯而易見的是,可將本發(fā)明擴(kuò)展到任何模態(tài),而不偏離本發(fā)明的實(shí)質(zhì)。
對(duì)于單個(gè)應(yīng)用或者對(duì)于多個(gè)應(yīng)用,可實(shí)現(xiàn)遵照本發(fā)明的單個(gè)CME。然而,應(yīng)用必須以由本發(fā)明定義的形式向CME提供任務(wù)模型。CME其后可操作在合并的任務(wù)模型上。例如,遵照本發(fā)明的CME可駐留在智能手機(jī)上,其任務(wù)模型用于典型的電話操作,例如撥號(hào)與電話簿。也可將電話連接到網(wǎng)絡(luò),該網(wǎng)絡(luò)提供額外的應(yīng)用,例如媒體信息搜索。智能手機(jī)其后變?yōu)樘峁┑湫偷碾娫挷僮髋c媒體信息搜索的終端。這樣,CME可與用戶交互,以訪問本地或聯(lián)網(wǎng)應(yīng)用。在一些情形中,還可能有額外的應(yīng)用通過提供完成任務(wù)的新方案來擴(kuò)展已有應(yīng)用。
現(xiàn)已描述所述方法與系統(tǒng),下面展現(xiàn)一示例,其闡釋本發(fā)明的使用。這里闡釋這樣的任務(wù)域,其中用戶與系統(tǒng)交互,以在其CD收藏中查找音頻文件。系統(tǒng)連接到語音與圖形/文本模態(tài),以接收輸入并提供輸出。任務(wù)模型顯示在圖6中。它包括兩方案Recipe_1與Recipe_2(方案_1和方案_2)。每一方案包括若干動(dòng)作,為完成方案(從而完成任務(wù))需要完成這些動(dòng)作。例如,Recipe_1與動(dòng)作specify_song_name、specify_artist_name與search_database相關(guān)聯(lián)。Recipe_1還與給定動(dòng)作的時(shí)間排序的約束相關(guān)聯(lián)。每一動(dòng)作又與若干參數(shù)相關(guān)聯(lián),需要指定這些參數(shù)。例如,動(dòng)作specify_song_name與參數(shù)Song_Name1相關(guān)聯(lián)。
一旦用戶請(qǐng)求了搜索音頻文件的任務(wù),CME110會(huì)為兩種方案計(jì)算置信度度量。置信度度量是按照下述方法計(jì)算的。
圖7闡示用于Recipe_1的多級(jí)別置信度度量。從所存儲(chǔ)的值獲取用于每一參數(shù)的各模態(tài)的精確度。也可從這些模態(tài)自身獲取這些精確度。例如,對(duì)于語音識(shí)別系統(tǒng)與鍵盤而言,用于參數(shù)Song_Name1的模態(tài)精確度分別是0.8與0.9。為計(jì)算每一參數(shù)的PLCM,使用這些精確度以及為該參數(shù)使用每一模態(tài)的概率。在本示例中,對(duì)于每一參數(shù),可獲得兩模態(tài)。因此,對(duì)每一模態(tài)賦予概率0.5。用來計(jì)算PLCM的函數(shù)是PLCM=∑{p(m)x w(m,p)}因此,計(jì)算PLCM為0.5*0.8+0.5*0.9=0.85。
動(dòng)作的ALCM被定義為與動(dòng)作相關(guān)聯(lián)的參數(shù)的PLCM的乘積。使用該公式計(jì)算所有ALCM。類似地,方案的RLCM被定義為與菜單相關(guān)聯(lián)的動(dòng)作的ALCM的乘積。用來計(jì)算置信度度量的所有函數(shù)均為示例性的,為了簡(jiǎn)化公式而選擇。
類似地,計(jì)算Recipe_2的置信度度量。其后,基于這些置信度度量,選擇適宜的方案。出于示例性的目的,考慮Recipe_2的RLCM為0.6。因此,選擇具有RLCM為0.68的Recipe_1而非Recipe_2作為適宜的方案??紤]約束與ALCM,選擇動(dòng)作specify_song_name作為要執(zhí)行的適宜的動(dòng)作。由于該動(dòng)作僅有一參數(shù),選擇其作為適宜的參數(shù)。出于示例性的目的,如果用戶選擇為該參數(shù)使用語音模式,應(yīng)用用戶交互將如下Recipe_1動(dòng)作請(qǐng)指定歌曲名稱用戶響應(yīng)_1“Love Song”出于示例性的目的,假定由模態(tài)提供的該交互的置信度度量為0.5。使用用于語音模態(tài)的修訂的(新的)置信度度量值,即上面描述的公式PLCM=CM(m,p)的修訂的置信度度量值,修改參數(shù)Song_Name1的PLCM和動(dòng)作specify_song_name的ALCM。還使用修改的ALCM修改Recipe_1的RLCM。Recipe_1的修改的RLCM是0.165。因此,系統(tǒng)選擇具有RLCM為0.6的Recipe_2作為適宜的方案,以最大化完成任務(wù)的概率。遵照本發(fā)明的這一動(dòng)態(tài)的方案選擇有助于最大化成功完成任務(wù)的概率。選擇具有最高ALCM并滿足所有約束的動(dòng)作作為適宜的動(dòng)作。出于示例性的目的,假定動(dòng)作specify_year_of_release是適宜的動(dòng)作。下面是應(yīng)用用戶交互Recipe_2動(dòng)作哪一年發(fā)行?用戶響應(yīng)_2(User response_2)“2002”再次重復(fù)更新置信度度量的完整流程。出于示例性的目的,假定Recipe_2仍具有比Recipe_1更高的RLCM。進(jìn)一步的交互將會(huì)像下面這樣Recipe_2動(dòng)作為幫助我查找文件,敲入歌詞的幾個(gè)詞,如果你行的話。
用戶響應(yīng)_3“the real world”其后,完成搜索數(shù)據(jù)庫(kù)的動(dòng)作,并將結(jié)果返回給用戶。
可在用于各種高端聯(lián)網(wǎng)設(shè)備的對(duì)話管理器中采用本發(fā)明,該設(shè)備向連接的設(shè)備提供眾多應(yīng)用與服務(wù)。連接的設(shè)備可以是各種移動(dòng)設(shè)備,例如智能手機(jī)、筆記本電腦與個(gè)人數(shù)字助理(PDA)。
例如,向經(jīng)由網(wǎng)絡(luò)連接的各種設(shè)備提供媒體內(nèi)容與搜索工具的數(shù)據(jù)庫(kù)可以使用本發(fā)明。一般地,瀏覽和搜索的信息可以是任何媒體信息,例如圖像、聲音與視頻片斷。用戶可以通過使用移動(dòng)設(shè)備(例如智能手機(jī))經(jīng)由網(wǎng)絡(luò)(例如GPRS或3G)與服務(wù)器交互來搜索媒體信息。典型地,使用與媒體信息相關(guān)聯(lián)的描述符來執(zhí)行這些數(shù)據(jù)搜索。例如,可以用其大小、日期、人員、地點(diǎn)等描述來標(biāo)注照片圖像。這些情形中的交互牽涉用戶與系統(tǒng)之間的多個(gè)對(duì)話輪次,其中用戶基于對(duì)話的當(dāng)前狀態(tài)與搜索結(jié)果,提供或修改其搜索標(biāo)準(zhǔn)。這里使用本發(fā)明來管理交互,其通過基于該特定智能手機(jī)的模態(tài)能力,動(dòng)態(tài)地查找并施行適宜的方案。
另一示例是電影查找器應(yīng)用程序,其中用戶可使用無線設(shè)備(例如移動(dòng)手持設(shè)備)搜索要看的電影,并在線訂票。在此情形中,依據(jù)用戶偏好與設(shè)備的模態(tài)可獲得性,用戶可瀏覽并使用各種標(biāo)準(zhǔn),例如通過位置(電影院、市郊)、通過流派或通過放映時(shí)間,搜索電影。依據(jù)設(shè)備的輸出能力與環(huán)境,應(yīng)用程序?qū)⒁圆煌绞奖憩F(xiàn)其信息。例如,可以在具有充足的圖形解析度的彩色手持設(shè)備上顯示電影院的就座計(jì)劃,而僅在單色設(shè)備上顯示簡(jiǎn)單形式。對(duì)話交互也受到發(fā)生對(duì)話的環(huán)境的影響,例如用戶的位置、當(dāng)天的時(shí)間(time of day)。
本發(fā)明可施行于任何基于計(jì)算機(jī)的系統(tǒng)。計(jì)算機(jī)系統(tǒng)的典型示例包括通用計(jì)算機(jī)、編程的微處理器、微控制器、集成外設(shè)的電路組件、以及能夠?qū)崿F(xiàn)組成本發(fā)明的方法的步驟的其它設(shè)備或設(shè)備的排列。
盡管已闡釋和描述本發(fā)明的優(yōu)選實(shí)施例,對(duì)于本領(lǐng)域技術(shù)人員而言將明顯的是,本發(fā)明并不僅限于這些實(shí)施例。對(duì)于本領(lǐng)域技術(shù)人員而言,各種修改、變動(dòng)、變形、替換與等價(jià)物將是顯而易見的,而不偏離如權(quán)利要求書所述的本發(fā)明的實(shí)質(zhì)與范圍。
權(quán)利要求
1.一種由基于計(jì)算機(jī)的系統(tǒng)便利完成任務(wù)的方法,所述任務(wù)由基于計(jì)算機(jī)的系統(tǒng)上的用戶或應(yīng)用來請(qǐng)求,所述任務(wù)與一組方案相關(guān)聯(lián),每一方案與一組動(dòng)作和一組約束相關(guān)聯(lián),所述方案為完成所述任務(wù)定義動(dòng)作執(zhí)行的方式,每一所述動(dòng)作與一組參數(shù)相關(guān)聯(lián),每一所述參數(shù)與一組模態(tài)相關(guān)聯(lián),所述模態(tài)為所述用戶與所述基于計(jì)算機(jī)的系統(tǒng)之間的通信通道,所述方法包括為與所述任務(wù)相關(guān)聯(lián)的所述方案、所述動(dòng)作與所述參數(shù)提供置信度度量;使用所提供的置信度度量,確定要執(zhí)行的適宜的動(dòng)作,確定所述的適宜的動(dòng)作以便利完成所述任務(wù);執(zhí)行所述的適宜的動(dòng)作;接收對(duì)所述的執(zhí)行的適宜的動(dòng)作的用戶響應(yīng);遵照所述用戶響應(yīng)更新所述置信度度量;和重復(fù)所述的確定到更新步驟,直到完成所述任務(wù)。
2.如權(quán)利要求1所述的方法,其中為所述方案、所述動(dòng)作與所述參數(shù)提供置信度度量包括為每一參數(shù)計(jì)算置信度度量;為每一動(dòng)作計(jì)算置信度度量,其使用與所述動(dòng)作相關(guān)聯(lián)的那組參數(shù)的置信度度量;和為每一方案計(jì)算置信度度量,其使用與所述方案相關(guān)聯(lián)的那組動(dòng)作的置信度度量。
3.如權(quán)利要求2所述的方法,其中為每一參數(shù)計(jì)算置信度度量包括估計(jì)與所述參數(shù)相關(guān)聯(lián)的那組模態(tài)的精確度;估計(jì)與所述參數(shù)相關(guān)聯(lián)的那組模態(tài)的使用的概率;和使用所述的估計(jì)的精確度與所述的估計(jì)的概率,為所述參數(shù)計(jì)算所述置信度度量。
4.如權(quán)利要求2所述的方法,其中,使用與所述動(dòng)作相關(guān)聯(lián)的那組參數(shù)的置信度度量和成功執(zhí)行所述動(dòng)作的概率,為每一動(dòng)作計(jì)算置信度度量。
5.如權(quán)利要求2所述的方法,其中,使用與所述方案相關(guān)聯(lián)的那組動(dòng)作的置信度度量和與所述方案相關(guān)聯(lián)的那組約束,為每一方案計(jì)算置信度度量。
6.如權(quán)利要求1所述的方法,其中,使用用戶偏好、應(yīng)用專用偏好與環(huán)境特定議題中的一個(gè)或多個(gè),計(jì)算所述置信度度量。
7.如權(quán)利要求1所述的方法,其中,確定所述的適宜的動(dòng)作包括選擇適宜的方案,所述的適宜的方案為具有最高置信度度量的方案,從與所述任務(wù)相關(guān)聯(lián)的那組方案中選擇所述的適宜的方案;選擇所述的適宜的動(dòng)作,所述的適宜的動(dòng)作為具有最高置信度度量的動(dòng)作,從與所述的適宜的方案相關(guān)聯(lián)的那組動(dòng)作中選擇所述的適宜的動(dòng)作;選擇適宜的參數(shù),所述的適宜的參數(shù)為具有最高置信度度量的參數(shù),從與所述的適宜的動(dòng)作相關(guān)聯(lián)的那組參數(shù)中選擇所述的適宜的參數(shù);選擇適宜的模態(tài),所述的適宜的模態(tài)為具有最高置信度度量的模態(tài),從與所述的適宜的參數(shù)相關(guān)聯(lián)的那組模態(tài)中選擇所述的適宜的模態(tài);和重復(fù)所述的選擇適宜的參數(shù)到選擇適宜的模態(tài)的子步驟,直到選擇了與所述的適宜的動(dòng)作相關(guān)聯(lián)的那組參數(shù)中的所有參數(shù)。
8.如權(quán)利要求1所述的方法,其中,更新所述置信度度量包括基于所觀察到的用戶響應(yīng),修改與所述的適宜的動(dòng)作相關(guān)聯(lián)的那組參數(shù)的置信度度量;使用與所述的適宜的動(dòng)作相關(guān)聯(lián)的那組參數(shù)的所述的修改的置信度度量,修改所述的適宜的動(dòng)作的置信度度量;和使用所述的適宜的動(dòng)作的修改的置信度度量,修改與所述的適宜的動(dòng)作相關(guān)聯(lián)的所述方案的置信度度量。
9.如權(quán)利要求1所述的方法,其進(jìn)一步包括存儲(chǔ)所更新的置信度度量,以供今后使用。
10.如權(quán)利要求1所述的方法,其進(jìn)一步包括評(píng)估對(duì)所執(zhí)行的動(dòng)作的用戶響應(yīng);和基于所述評(píng)估,修改用于所述置信度度量計(jì)算的公式表示,所述公式表示為用于所述置信度度量的計(jì)算的公式。
11.如權(quán)利要求10所述的方法,其中,修改用于所述置信度度量計(jì)算的公式表示是通過使用機(jī)器學(xué)習(xí)機(jī)制來進(jìn)行的。
12.一種用于計(jì)算機(jī)的計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可用的媒體,其中內(nèi)嵌有用于便利完成任務(wù)的計(jì)算機(jī)可讀的程序代碼,所述任務(wù)由所述的基于計(jì)算機(jī)的系統(tǒng)上的用戶或應(yīng)用來請(qǐng)求,所述任務(wù)與一組方案相關(guān)聯(lián),每一所述方案與一組動(dòng)作和一組約束相關(guān)聯(lián),所述方案為完成所述任務(wù)定義動(dòng)作執(zhí)行的方式,每一所述動(dòng)作與一組參數(shù)相關(guān)聯(lián),每一所述參數(shù)與一組模態(tài)相關(guān)聯(lián),所述模態(tài)為所述用戶與所述基于計(jì)算機(jī)的系統(tǒng)之間的通信通道,所述方法包括為與所述任務(wù)相關(guān)聯(lián)的所述方案、動(dòng)作與參數(shù)提供置信度度量;使用所提供的置信度度量,確定要執(zhí)行的適宜的動(dòng)作,確定所述的適宜的動(dòng)作以便利完成所述任務(wù);執(zhí)行所述的適宜的動(dòng)作;接收對(duì)所執(zhí)行的適宜的動(dòng)作的用戶響應(yīng);遵照所述用戶響應(yīng)更新所述置信度度量;和重復(fù)所述的確定到更新步驟的步驟,直到完成所述任務(wù)。
13.如權(quán)利要求12所述的計(jì)算機(jī)程序產(chǎn)品,其中,進(jìn)行所述的為所述方案、所述動(dòng)作與所述參數(shù)提供所述置信度度量的步驟的所述計(jì)算機(jī)程序代碼包括進(jìn)行以下子步驟的計(jì)算機(jī)程序代碼為每一參數(shù)計(jì)算置信度度量;為每一動(dòng)作計(jì)算置信度度量,其使用與所述動(dòng)作相關(guān)聯(lián)的那組參數(shù)的置信度度量;和為每一方案計(jì)算置信度度量,其使用與所述方案相關(guān)聯(lián)的那組動(dòng)作的置信度度量。
14.如權(quán)利要求12所述的計(jì)算機(jī)程序產(chǎn)品,其中,進(jìn)行所述的確定所述的適宜的動(dòng)作的步驟的所述計(jì)算機(jī)程序代碼包括進(jìn)行以下子步驟的計(jì)算機(jī)程序代碼選擇適宜的方案,所述的適宜的方案為具有最高置信度度量的方案,從與所述任務(wù)相關(guān)聯(lián)的那組方案中選擇所述的適宜的方案;選擇所述的適宜的動(dòng)作,所述的適宜的動(dòng)作為具有最高置信度度量的動(dòng)作,從與所述的適宜的方案相關(guān)聯(lián)的那組動(dòng)作中選擇所述的適宜的動(dòng)作;選擇適宜的參數(shù),所述的適宜的參數(shù)為具有最高置信度度量的參數(shù),從與所述的適宜的動(dòng)作相關(guān)聯(lián)的那組參數(shù)中選擇所述的適宜的參數(shù);選擇適宜的模態(tài),所述的適宜的模態(tài)為具有最高置信度度量的模態(tài),從與所述的適宜的參數(shù)相關(guān)聯(lián)的那組模態(tài)中選擇所述的適宜的模態(tài);和重復(fù)所述的選擇適宜的參數(shù)到選擇適宜的模態(tài)的子步驟,直到選擇了與所述的適宜的動(dòng)作相關(guān)聯(lián)的那組參數(shù)中的所有參數(shù)。
15.如權(quán)利要求12所述的計(jì)算機(jī)程序產(chǎn)品,其中,進(jìn)行更新所述置信度度量的步驟的所述計(jì)算機(jī)程序代碼包括進(jìn)行以下子步驟的計(jì)算機(jī)程序代碼基于所觀察到的用戶響應(yīng),修改與所述的適宜的動(dòng)作相關(guān)聯(lián)的那組參數(shù)的置信度度量;使用與所述的適宜的動(dòng)作相關(guān)聯(lián)的那組參數(shù)的修改的置信度度量,修改所述的適宜的動(dòng)作的置信度度量;和使用所述的適宜的動(dòng)作的修改的置信度度量,修改與所述的適宜的動(dòng)作相關(guān)聯(lián)的所述方案的置信度度量。
16.一種適宜于便利完成任務(wù)的系統(tǒng),所述任務(wù)與一組方案相關(guān)聯(lián),每一所述方案與一組動(dòng)作和一組約束相關(guān)聯(lián),每一所述動(dòng)作與一組參數(shù)相關(guān)聯(lián),每一所述參數(shù)與一組模態(tài)相關(guān)聯(lián),所述系統(tǒng)連接到至少一個(gè)模態(tài)以與用戶交互,所述系統(tǒng)包括模態(tài)資源監(jiān)視器,其用于監(jiān)視各種模態(tài);任務(wù)建模器,其包括用于所有任務(wù)的模型,用于任務(wù)的模型包括所述方案、所述動(dòng)作、所述參數(shù)、所述模態(tài)與所述關(guān)聯(lián);置信度度量提取器,其連接到所述模態(tài)資源監(jiān)視器與所述任務(wù)建模器,所述置信度度量提取器為所有方案提供置信度度量;和對(duì)話管理器,其連接到所述置信度度量提取器與所述任務(wù)建模器,所述對(duì)話管理器使用所述置信度度量選擇適宜的動(dòng)作,以便利完成所述任務(wù),所述的適宜的動(dòng)作為具有最高置信度度量的動(dòng)作。
17.如權(quán)利要求16所述的系統(tǒng),其中,所述模態(tài)包括鍵盤、語音識(shí)別系統(tǒng)、鼠標(biāo)、游戲棒、顯示器與觸摸屏中的一個(gè)或多個(gè)。
18.如權(quán)利要求16所述的系統(tǒng),其中,所述置信度度量提取器包括后評(píng)估模塊,其用于基于用戶響應(yīng),修改和存儲(chǔ)用于所述置信度度量計(jì)算的公式表示。
19.如權(quán)利要求18所述的系統(tǒng),其中,所述后評(píng)估模塊采用機(jī)器學(xué)習(xí)機(jī)制,其使用用戶偏好、應(yīng)用專用偏好與環(huán)境特定議題中的一個(gè)或多個(gè),修改用于所述置信度度量計(jì)算的所述公式表示。
20.一種由基于計(jì)算機(jī)的系統(tǒng)便利完成任務(wù)的方法,所述任務(wù)由所述的基于計(jì)算機(jī)的系統(tǒng)上的用戶或應(yīng)用來請(qǐng)求,所述任務(wù)與一組方案相關(guān)聯(lián),每一所述方案與一組動(dòng)作和一組約束相關(guān)聯(lián),所述方案為完成所述任務(wù)定義動(dòng)作執(zhí)行的方式,每一所述動(dòng)作與一組參數(shù)相關(guān)聯(lián),每一所述參數(shù)與一組模態(tài)相關(guān)聯(lián),所述模態(tài)為所述用戶與所述基于計(jì)算機(jī)的系統(tǒng)之間的通信通道,所述方法包括a.為與所述任務(wù)相關(guān)聯(lián)的所述方案、動(dòng)作與參數(shù)提供置信度度量;b.選擇適宜的方案,所述的適宜的方案為具有最高置信度度量的方案,從與所述任務(wù)相關(guān)聯(lián)的那組方案中選擇所述的適宜的方案;c.選擇所述的適宜的動(dòng)作,所述的適宜的動(dòng)作為具有最高置信度度量的動(dòng)作,從與所述的適宜的方案相關(guān)聯(lián)的那組動(dòng)作中選擇所述的適宜的動(dòng)作;d.選擇適宜的參數(shù),所述的適宜的參數(shù)為具有最高置信度度量的參數(shù),從與所述的適宜的動(dòng)作相關(guān)聯(lián)的那組參數(shù)中選擇所述的適宜的參數(shù);e.選擇適宜的模態(tài),所述的適宜的模態(tài)為具有最高置信度度量的模態(tài),從與所述的適宜的參數(shù)相關(guān)聯(lián)的那組模態(tài)中選擇所述的適宜的模態(tài);和f.重復(fù)所述的子步驟d~e,直到選擇了與所述的適宜的動(dòng)作相關(guān)聯(lián)的那組參數(shù)中的所有參數(shù);g.執(zhí)行所述的適宜的動(dòng)作;h.接收對(duì)所執(zhí)行的適宜的動(dòng)作的用戶響應(yīng);i.遵照所述用戶響應(yīng)更新所述置信度度量;和j.重復(fù)所述的步驟b~i,直到完成所述任務(wù)。
全文摘要
本發(fā)明公開一種方法與系統(tǒng)(102),其用于在基于計(jì)算機(jī)的系統(tǒng)上實(shí)現(xiàn)的多模態(tài)的、面向任務(wù)的對(duì)話管理。系統(tǒng)(102)最大化請(qǐng)求任務(wù)(302)之后成功完成任務(wù)的概率。每一任務(wù)與一任務(wù)模型相關(guān)聯(lián),該模型包括方案、動(dòng)作、參數(shù)與模態(tài)。對(duì)于每一任務(wù),在各級(jí)別計(jì)算置信度度量。置信度度量表示依照用戶偏好,動(dòng)作成功的概率。使用提供的置信度度量(304),在運(yùn)行時(shí)選擇最適宜的方案、動(dòng)作、參數(shù)與模態(tài),以最大化完成任務(wù)的概率。在每一動(dòng)作之后,依照用戶偏好,修改置信度度量(312),并相應(yīng)地選擇下一適宜的動(dòng)作??蛇x地,提供后評(píng)估模塊(PEM),以監(jiān)視用戶響應(yīng),并修改用于置信度度量計(jì)算的公式。
文檔編號(hào)G06FGK1938681SQ200480000778
公開日2007年3月28日 申請(qǐng)日期2004年7月1日 優(yōu)先權(quán)日2003年7月3日
發(fā)明者恒舜·雷蒙德·李, 龍尼·塔伊布 申請(qǐng)人:摩托羅拉公司