專利名稱::可會話的類生物裝置及其會話方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種類生物裝置,更具體地,涉及一種可會話的類生物裝置及其會話方法。
背景技術(shù):
:目前,市場上的類生物裝置如電子玩具、電子寵物及機(jī)器人的品種琳瑯滿目,且很多類生物裝置具有會話功能,即類生物裝置可以根據(jù)用于產(chǎn)生的會話進(jìn)行回應(yīng),然而這些類生物裝置只能根據(jù)用戶的一語音做出一固定的回答,實現(xiàn)方法都是生產(chǎn)商(制造商)事先將語音命令、語音輸出及其它們的對應(yīng)關(guān)系存入類生物裝置中。在這種傳統(tǒng)類生物裝置中,用戶語音輸入與類生物裝置語音輸出之間的關(guān)系是固定的,當(dāng)用戶輸入一語音時,該類生物裝置只能輸出一特定語音。這樣總做出單一的回答而容易使用戶感到膩味。用戶無法感受到當(dāng)其輸入一語音時產(chǎn)生多個變化語音輸出的新鮮感,體驗不到類生物裝置真實性的樂趣。
發(fā)明內(nèi)容本發(fā)明的目的在于,提供一種可會話的類生物裝置及其會話生成方法,該類生物裝置可根據(jù)不同用戶相同或相似的語音輸入,產(chǎn)生不同的語音輸出。所述一種可會話的類生物裝置,該類生物裝置包括一麥克風(fēng)、一模數(shù)轉(zhuǎn)換器、一數(shù)模轉(zhuǎn)換器、一揚(yáng)聲器及一存儲單元,該麥克風(fēng)用于采集會話語音的模擬信號,該模擬信號經(jīng)所述模數(shù)轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號,該存儲單元存儲有多個回應(yīng)語音的音頻數(shù)據(jù)及一語音輸出表,該語音輸出表定義了多個會話語音、每一會話語音對應(yīng)的至少一個回應(yīng)語音、及每一回應(yīng)語音對應(yīng)的最后回應(yīng)時間及加^又值,其中,每一回應(yīng)語音對應(yīng)的加權(quán)值由一會話語音對應(yīng)的各回應(yīng)語音的最后回應(yīng)時間確定;該類生物裝置還包括一會話語音識別模塊,用于識別所述會話語音;一回應(yīng)語音確定才莫塊,用于通過一隨機(jī)函數(shù)選取所述會話語音其中一回應(yīng)語音,該隨機(jī)函數(shù)以該會話語音的各回應(yīng)語音的加權(quán)值為變量;一回應(yīng)語音輸出才莫塊,用于輸出該回應(yīng)語音確定才莫塊確定的回應(yīng)語音的音頻數(shù)據(jù),所述回應(yīng)語音的音頻數(shù)據(jù)傳輸至該數(shù)模轉(zhuǎn)換器轉(zhuǎn)換為模擬信號后由該揚(yáng)聲器輸出;一回應(yīng)時間更新模塊,用于記錄所輸出回應(yīng)語音對應(yīng)的最后回應(yīng)時間于該語音輸出表中;及一加權(quán)值更新模塊,用于根據(jù)更新后的最后回應(yīng)時間調(diào)用加權(quán)值函數(shù)重新計算并更新輸出回應(yīng)語音對應(yīng)會話語音的各回應(yīng)語音的加權(quán)值。所述一種應(yīng)用于類生物裝置的會話生成方法,該類生物裝置存儲有多個回應(yīng)語音的音頻數(shù)據(jù)及一語音輸出表,該語音輸出表定義了多個會話語音、每一會話語音對應(yīng)的至少一個回應(yīng)語音、及每一回應(yīng)語音對應(yīng)的最后回應(yīng)時間及加權(quán)值,其中,每一回應(yīng)語音對應(yīng)的加權(quán)值由一會話語音對應(yīng)的各回應(yīng)語音的最后回應(yīng)時間確定,該方法包括步驟(a)接收用戶的會話語音;(b)識別該會話語音;(c)通過一隨才幾函數(shù)確定該會話語音對應(yīng)的一回應(yīng)語音,該隨才幾函數(shù)以該會話語音的各回應(yīng)語音的加一又Y直為變量;(d)輸出該會話語音對應(yīng)的回應(yīng)語音;(e)記錄此刻該輸出回應(yīng)語音的最后回應(yīng)時間;及(f)根據(jù)加權(quán)值函數(shù)更新該會話語音的各回應(yīng)語音的力口4又<直。本發(fā)明之可會話的類生物裝置及其會話方法,通過對用戶輸入的會話語音設(shè)置多個回應(yīng)語音,并根據(jù)每個回應(yīng)語音的加權(quán)值確定輸出的回應(yīng)語音,如此,該類生物裝置可根據(jù)不同用戶相同或相似的語音做出多種不同的回答。圖l是本發(fā)明一實施方式可會話的類生物裝置的硬件架構(gòu)圖;及圖2是本發(fā)明一實施方式類生物裝置的會話方法的流程圖。具體實施例方式如圖1所示,為本發(fā)明一實施方式可會話的類生物裝置1的硬件架構(gòu)圖。該類生物裝置1包括一麥克風(fēng)10、一模數(shù)轉(zhuǎn)換器20、一處理單元30、一存儲單元40、一會話控制單元50、一數(shù)模轉(zhuǎn)換器60及一揚(yáng)聲器70。該會話控制單元50,用于控制該類生物裝置1處于一會話狀態(tài)或非會話狀態(tài)。當(dāng)該類生物裝置1處于會話狀態(tài)時,處理單元30控制該麥克風(fēng)10采集來自用戶產(chǎn)生的會話語音的模擬信號,所采集到的會話語音的模擬信號經(jīng)模數(shù)轉(zhuǎn)換器20轉(zhuǎn)換成數(shù)字信號后被傳輸至處理單元30,所述處理單元30識別該會話語音并對該會話語音進(jìn)行回應(yīng)。而當(dāng)該類生物裝置1處于非會話狀態(tài)時,處理單元30控制該麥克風(fēng)10不采集用戶產(chǎn)生的會話語音或類生物裝置1對用戶的會話語音不產(chǎn)生回應(yīng)。但在本發(fā)明另一實施方式中,該類生物裝置1也可隨時接收及識別用戶的會話語音,并對其做出回應(yīng)。為了方便描述,以下將該類生物裝置1根據(jù)所接收到會話語音回應(yīng)產(chǎn)生的語音稱為回應(yīng)語音。該類生物裝置1回應(yīng)所接收到的會話語音時,可由該處理單元30將回應(yīng)語音的音頻數(shù)據(jù)傳輸至數(shù)模轉(zhuǎn)換器60轉(zhuǎn)換為模擬信號后由該揚(yáng)聲器70輸出。該存儲單元40存儲有多個回應(yīng)語音的音頻數(shù)據(jù)及一語音輸出表401。如表1所示,該語音輸出表401定義了該類生物裝置1可識別的多個會話語音、每一條會話語音可能進(jìn)行回復(fù)的至少一條回應(yīng)語音,該語音輸出表401還記錄了每一條回應(yīng)語音的最后回應(yīng)時間和加權(quán)值。該語音輸出表401包括一會話語音欄、一回應(yīng)語音欄、一最后回應(yīng)時間欄及一加權(quán)值欄。該會話語音欄記錄了多個會話語音如A、B和一不確定的會話語音,該不確定的會話語音在表1中為空,該不確定的會話語音代表除表1中所定義的會話語音以外的會話語音,即該類生物裝置1不能識別或沒有特別定義其回應(yīng)語音的會話語音。每一會話語音對應(yīng)的回應(yīng)語音欄記錄了該會話語音對應(yīng)的多個回應(yīng)語音,如會話語音A對應(yīng)的回應(yīng)語音為Al、A2、A3等,該不確定的會話語音對應(yīng)的回應(yīng)語音為XI、X2、X3等。一會話語音對應(yīng)的最后回應(yīng)時間欄記錄了每個回應(yīng)語音最后一次被輸出的時間,如會話語音A的回應(yīng)語音Al、A2、A3對應(yīng)的最后回應(yīng)時間分別為tA1、tA2、tA3,該最后回應(yīng)時間才各式可為年月日時分,例如,最后回應(yīng)時間為2007年5月10日15時20分,當(dāng)某一回應(yīng)語音4皮選定輸出時,則可將該回應(yīng)語音對應(yīng)的最后時間欄中的時間更新為該回應(yīng)語音被輸出的時間。加權(quán)值欄記錄了每個回應(yīng)語音的加權(quán)值,每個加權(quán)值由一加權(quán)值函數(shù)才艮據(jù)該會話語音的各回應(yīng)語音的最后回應(yīng)時間為變量確定,例如,回應(yīng)語音Al的加權(quán)值為VA1=f(tA1,tA2,tA3...)。當(dāng)一回應(yīng)語音的最后回應(yīng)時間改變時,該回應(yīng)i吾音的加4又值也隨之改變?;貞?yīng)語音的最后回應(yīng)時間越晚,即越接近當(dāng)前的時間,其加權(quán)值就越小,輸出該回應(yīng)語音的可能性就越??;回應(yīng)語音的最后回應(yīng)時間越早,即距離當(dāng)前的時間越久,其加4又值就越大,該回應(yīng)語音一皮選擇回應(yīng)的可能性就越大。表1<table>tableseeoriginaldocumentpage7</column></row><table>該處理單元30包括一會話語音識別才莫塊301、一回應(yīng)語音確定才莫塊302、一回應(yīng)語音輸出才莫塊303、一回應(yīng)時間更新沖莫塊304及一加一又值更新模塊305。該會話語音識別模塊301用于識別經(jīng)模數(shù)轉(zhuǎn)換器20轉(zhuǎn)換后會話語音的數(shù)字信號。該回應(yīng)語音確定模塊302根據(jù)該語音輸出表401獲取識別得到的會話語音對應(yīng)的回應(yīng)語音,并根據(jù)一隨機(jī)函數(shù)選定這些回應(yīng)語音中的一回應(yīng)語音,該凈皮選定的回應(yīng)語音即用于回應(yīng)所接收到的會話語音。例如,會話語音識別模塊301識別得到用戶所產(chǎn)生的會話語音為A,則回應(yīng)語音確定模塊302根據(jù)該語音輸出表401的定義確定會話語音A的回應(yīng)語音包括有Al、A2、A3......,所述回應(yīng)語音確定才莫塊302通過一隨才幾函數(shù)/人Al、A2、A3......中選定一回應(yīng)語音如A2,則A2即用于回應(yīng)A。在本實施方式中該隨機(jī)函數(shù)是為根據(jù)會話語音對應(yīng)的每一回應(yīng)語音的加4又值來確定回應(yīng)語音,例如,會話語音A對應(yīng)的回應(yīng)語音QA=F(VA1,VA2,VA3…),VA1、VA2、VA3…分別為會話語音A對應(yīng)的各回應(yīng)語音的加權(quán)值。在確定輸出的回應(yīng)語音后,該回應(yīng)語音輸出模塊303從存儲單元40中獲取該回應(yīng)語音的音頻數(shù)據(jù),并解碼輸出該回應(yīng)語音的音頻數(shù)據(jù),該回應(yīng)語音的音頻數(shù)據(jù)經(jīng)數(shù)模轉(zhuǎn)換器60轉(zhuǎn)換為模擬信號后通過該揚(yáng)聲器70輸出。該回應(yīng)時間更新沖莫塊304用于在該回應(yīng)語音輸出才莫塊303llT出一確定回應(yīng)語音后,記錄此刻該回應(yīng)語音對應(yīng)的最后回應(yīng)時間于語音輸出表401中,更新該回應(yīng)語音的最后回應(yīng)時間。該加權(quán)值更新模塊305獲取更新的最后回應(yīng)時間,根據(jù)加權(quán)值函數(shù)計算公式重新計算各回應(yīng)語音對應(yīng)的加權(quán)值,并更新語音輸出表401中加權(quán)值欄各回應(yīng)語音對應(yīng)的加權(quán)值。圖2是本發(fā)明一實施方式類生物裝置1的會話方法的流程圖。麥克風(fēng)10接收到用戶會話語音的模擬語音信號,并經(jīng)模數(shù)轉(zhuǎn)換器20轉(zhuǎn)換成數(shù)字語音信號后傳輸至處理單元30處理(步驟SllO);會話語音識別模塊301對該會話語音的數(shù)字語音信號進(jìn)行識別(步驟S120);該回應(yīng)語音確定模塊302根據(jù)該語音輸出表401獲取該會話語音對應(yīng)的回應(yīng)語音,并通過一隨機(jī)函數(shù)以每一回應(yīng)語音的加權(quán)值為變量確定其中一回應(yīng)語音(步驟S130);該回應(yīng)語音輸出才莫塊303從存儲單元40中獲取該回應(yīng)語音的音頻數(shù)據(jù),并解碼輸出該音頻數(shù)據(jù),該回應(yīng)語音的音頻數(shù)據(jù)經(jīng)數(shù)模轉(zhuǎn)換器60轉(zhuǎn)換為模擬信號后通過該揚(yáng)聲器70輸出(步驟S140);該回應(yīng)i吾音更新4莫塊304i己錄;Hl刻該回應(yīng)i吾音對應(yīng)的最后回應(yīng)時間于i吾音輸出表401中(步驟S150);加權(quán)值更新模塊305根據(jù)一由以該會話語音對應(yīng)的各回應(yīng)語音的最后回應(yīng)時間為變量的加權(quán)值函數(shù)來更新語音輸出表401中各回應(yīng)語音對應(yīng)的加權(quán)值(步驟S160),如此本次會話流程結(jié)束。權(quán)利要求1.一種可會話的類生物裝置,該類生物裝置包括一麥克風(fēng)、一模數(shù)轉(zhuǎn)換器、一數(shù)模轉(zhuǎn)換器、一揚(yáng)聲器及一存儲單元,該麥克風(fēng)用于采集會話語音的模擬信號,該模擬信號經(jīng)所述模數(shù)轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字信號,其特征在于該存儲單元存儲有多個回應(yīng)語音的音頻數(shù)據(jù)及一語音輸出表,該語音輸出表定義了多個會話語音、每一會話語音對應(yīng)的至少一個回應(yīng)語音、及每一回應(yīng)語音對應(yīng)的最后回應(yīng)時間及加權(quán)值,其中,每一回應(yīng)語音對應(yīng)的加權(quán)值由一會話語音對應(yīng)的各回應(yīng)語音的最后回應(yīng)時間確定;該類生物裝置還包括一會話語音識別模塊,用于識別所述會話語音;一回應(yīng)語音確定模塊,用于通過一隨機(jī)函數(shù)選取所述會話語音其中一回應(yīng)語音,該隨機(jī)函數(shù)以該會話語音的各回應(yīng)語音的加權(quán)值為變量;一回應(yīng)語音輸出模塊,用于輸出該回應(yīng)語音確定模塊確定的回應(yīng)語音的音頻數(shù)據(jù),所述回應(yīng)語音的音頻數(shù)據(jù)傳輸至該數(shù)模轉(zhuǎn)換器轉(zhuǎn)換為模擬信號后由該揚(yáng)聲器輸出;一回應(yīng)時間更新模塊,用于記錄所輸出回應(yīng)語音對應(yīng)的最后回應(yīng)時間于該語音輸出表中;及一加權(quán)值更新模塊,用于根據(jù)更新后的最后回應(yīng)時間調(diào)用加權(quán)值函數(shù)重新計算并更新輸出回應(yīng)語音對應(yīng)會話語音的各回應(yīng)語音的加權(quán)值。2.如權(quán)利要求1所述可會話的類生物裝置,其特征在于,所述語音輸出表還定義有不確定的會話語音對應(yīng)的多個回應(yīng)語音。3.如權(quán)利要求1所述可會話的類生物裝置,其特征在于,該類生物裝置還包括一會話控制單元,用于控制所述麥克風(fēng)采集用戶的會話語音,當(dāng)該會話控制單元處于非工作狀態(tài)時,所述麥克風(fēng)不采集用戶的會話語音o4.一種類生物裝置的會話方法,該類生物裝置存儲有多個回應(yīng)語音的音頻數(shù)據(jù)及一語音輸出表,該語音輸出表定義了多個會話語音、每一會話i吾音對應(yīng)的至少一個回應(yīng)i吾音、及每一回應(yīng)i吾音對應(yīng)的最后回應(yīng)時間及加權(quán)值,其中,每一回應(yīng)語音對應(yīng)的加權(quán)值由一會話語音對應(yīng)的各回應(yīng)語音的最后回應(yīng)時間確定,其特征在于,該方法包括步驟接收用戶的會話語音;識別該會話語音;通過一隨片幾函數(shù)確定該會話語音對應(yīng)的一回應(yīng)i吾音,該隨才幾函數(shù)以該會話語音的各回應(yīng)語音的加權(quán)值為變量;輸出該會話語音對應(yīng)的回應(yīng)語音;記錄此刻該輸出回應(yīng)語音的最后回應(yīng)時間;及根據(jù)加權(quán)值函數(shù)更新該會話語音的各回應(yīng)語音的加權(quán)值。5.如權(quán)利要求4所述類生物裝置的會話方法,其特征在于,所述語音輸出表還定義有不確定的會話語音對應(yīng)的多個回應(yīng)語音。全文摘要本發(fā)明為一種可會話的類生物裝置,屬于電子寵物、電子玩具和機(jī)器人等領(lǐng)域。本發(fā)明還提供了一種類生物裝置的會話方法。通過該會話方法,該類生物裝置在接收到一用戶的會話語音時,識別該會話語音,根據(jù)一以該會話語音對應(yīng)的各回應(yīng)語音的加權(quán)值為變量的隨機(jī)函數(shù)輸出一回應(yīng)語音,其中,各回應(yīng)語音的加權(quán)值由一以各回應(yīng)語音的最后回應(yīng)時間為變量的函數(shù)確定。所以該類生物裝置可以輸出不同且不固定隨時變化的回應(yīng)語音,給用戶帶來真實性的樂趣。文檔編號G06N3/00GK101393738SQ200710077338公開日2009年3月25日申請日期2007年9月21日優(yōu)先權(quán)日2007年9月21日發(fā)明者洪國寶,王傳宏,蔣祖力,謝冠宏申請人:鵬智科技(深圳)有限公司;錦天科技股份有限公司