專利名稱:一種基于語音電話實現(xiàn)自動口語訓(xùn)練的方法與裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于自動口語訓(xùn)練的方法與裝置,具體地說是一種基于語音電 話實現(xiàn)自動口語訓(xùn)練的方法與裝置。
背景技術(shù):
語音識別技術(shù)已經(jīng)在語音電話領(lǐng)域有許多應(yīng)用,主要集中在對話情景
固定并且說話內(nèi)容簡單的內(nèi)線電話智能語音交換機(jī)上。IBM的Phon印ass系 統(tǒng)將語音電話和語音識別技術(shù)應(yīng)用于英語口語測試,測試形式主要是朗讀 詞匯和句子,以及口頭做多項選擇題。使用廣泛的各種電話自動查詢系統(tǒng) 都采用話機(jī)按鍵交互方式,而不采用口語交互方式。
隨著語音識別系統(tǒng)的識別準(zhǔn)確率和識別速度的提高以及在特定環(huán)境下 對硬件條件的要求越來越低,將基于微小芯片的語音識別技術(shù)嵌入消費類 電子產(chǎn)品中越來越成為現(xiàn)實。隨著消費類電子產(chǎn)品性能變得越來越混雜功 能越來越強(qiáng)勁,語音識別科技使消費者可以更方便、更直觀地使用這些產(chǎn) 品。并且,在使用這些產(chǎn)品的時候不會伴隨著一系列的按鍵和提示音,而 是實現(xiàn)消費者和產(chǎn)品間的直接對話。
這些語音識別技術(shù)在語音電話領(lǐng)域的應(yīng)用,由于缺乏口語交互式學(xué)習(xí), 還不能滿足人們在口語訓(xùn)練屮的要求。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)中的不足,本發(fā)明的目的在于提供一種基于語音電 話實現(xiàn)自動口語訓(xùn)練的方法與裝置,滿足人們利用語音電話進(jìn)行交互式口 語訓(xùn)練的需求。為完成上述發(fā)明目的,本發(fā)明提供一種基于語音電話實現(xiàn)自動口語訓(xùn) 練的方法,該方法包括以下步驟
1) 電話用戶撥進(jìn)電話,激活電話接收模塊;
2) 對話控制模塊打開對話腳本,進(jìn)入對話起始狀態(tài);
3) 確定當(dāng)前所處的對話階段,提取對應(yīng)階段所需的預(yù)期應(yīng)答內(nèi)容;
4) 編譯當(dāng)前對話階段預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則,為識別電話用戶 的語音做好準(zhǔn)備;
5) 啟動語音識別模塊,同時啟動機(jī)器說話錄音播放模塊,播放提取的 機(jī)器說話錄音;
6) 語音識別模塊激活進(jìn)行語音識別并傳遞語音識別的結(jié)果到語言處理 模塊。語言處理模塊把語音識別的結(jié)果與取得的預(yù)期應(yīng)答內(nèi)容進(jìn)行比對。
為完成上述發(fā)明目的,本發(fā)明還提供一種基于語音電話實現(xiàn)自動口語 訓(xùn)練的裝置,包括電腦、電話接收模塊、對話控制模塊、語音識別模塊和 對話知識庫,其特征在于,
所述電話接收模塊,用于接收電話用戶的電話,并將接通信號發(fā)送到 對話控制模塊。
.所述對話控制模塊,接收來自電話接收模塊信號,從對話知識庫檢索 合適的對話知識,調(diào)用語言識別模塊監(jiān)聽電話用戶的話語,調(diào)用語言處理 模塊對識別的語言進(jìn)行判斷,給出該輪對話的反饋。
所述語音識別模塊,用于監(jiān)聽電話用戶的話語,并把語音識別的結(jié)果 傳送給語言處理模塊。
所述語言處理模塊,接收語音識別的結(jié)果并將其與對話知識庫檢索到 的對話知識進(jìn)行比較,給出比較結(jié)果。
所述對話知識庫,存儲對話知識及所有需要保留的信息。本發(fā)明具有明顯的優(yōu)點和積極效果。首先采用專家系統(tǒng)技術(shù)和簡化的 對話腳本控制技術(shù)組織人機(jī)對話預(yù)計所需的話語知識,可以方便地編寫基 于文字和真人錄音的對話腳本并控制其運行流程。其次利用自行研發(fā)的詞 句模糊比對技術(shù)比對預(yù)期的對話人所說內(nèi)容和實際識別的內(nèi)容,比對結(jié)果 達(dá)到設(shè)定的閾值則根據(jù)預(yù)定的積極反饋方案反饋,否則根據(jù)預(yù)定的消極反 饋方案反饋。
圖l為本發(fā)明系統(tǒng)構(gòu)成圖2為根據(jù)本發(fā)明的基于語音電話實現(xiàn)自動口語訓(xùn)練方法的流程圖3為根據(jù)本發(fā)明的適當(dāng)擴(kuò)大語音識別語法規(guī)模方法框圖4為根據(jù)本發(fā)明的語言處理模塊工作流程圖5為根據(jù)本發(fā)明的對話腳本表達(dá)方式和腳本控制方法流程圖6為根據(jù)本發(fā)明的對話腳本編寫格式。
具體實施例方式
下面結(jié)合說明書附圖來說明本發(fā)明的具體實施方式
。
圖1是本發(fā)明的系統(tǒng)構(gòu)成圖,參見圖1,根據(jù)本發(fā)明的基于語音電話實
現(xiàn)自動口語訓(xùn)練裝置包括以下模塊
電腦,用于安裝本發(fā)明裝置的各種模塊,控制各模塊的工作。 電話接收模塊,該模塊用于接收電話用戶的電話,并將接通信號發(fā)送
到對話控制模塊。
對話控制模塊,接收來自電話接收模塊信號,從對話知識庫檢索合適 的對話知識,調(diào)用語言識別模塊監(jiān)聽電話用戶的話語,調(diào)用語言處理模塊 對識別的語言進(jìn)行判斷,給出該輪對話的反饋。
語音識別模塊,用于監(jiān)聽電話用戶的話語,并把語音識別的結(jié)果傳送給語言處理模塊。
語言處理模塊,接收語音識別的結(jié)果并將其與對話知識庫檢索到的對 話知識進(jìn)行比較,給出比較結(jié)果。
對話知識庫,存儲對話知識及所有需要保留的信息。
圖2為根據(jù)本發(fā)明的基于語音電話實現(xiàn)自動口語訓(xùn)練方法的流程圖。 下文將參考圖2,對本發(fā)明自動口語訓(xùn)練方法進(jìn)行詳細(xì)描述。
首先,在步驟210,電話用戶撥進(jìn)電話,激活電話接收模塊;
在步驟220,對話控制模塊打開對話腳本,進(jìn)入對話起始狀態(tài);
在步驟230,確定當(dāng)前所處的對話階段,提取對應(yīng)階段所需的各種預(yù)期 應(yīng)答內(nèi)容,包括機(jī)器說話錄音,預(yù)期電話用戶應(yīng)答內(nèi)容,預(yù)期應(yīng)答內(nèi)容的 語音識別規(guī)則,實際應(yīng)答正確時機(jī)器的反饋和不正確時的機(jī)器反饋;
在步驟240,編譯當(dāng)前對話階段預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則,為識別 電話用戶的語音做好準(zhǔn)備;
在步驟250,啟動語音識別模塊,同時啟動機(jī)器說話錄音播放模塊,播 放步驟3提取的機(jī)器說話錄音;
在歩驟260,語音識別模塊激活語言處理模塊并把語音識別的結(jié)果傳遞 過去。語言處理模塊把語音識別的結(jié)果與步驟230取得的預(yù)期應(yīng)答內(nèi)容進(jìn) 行比對,如果比對結(jié)果達(dá)到設(shè)定的閾值,啟動機(jī)器說話錄音播放模塊,播 放步驟230取得的正確機(jī)器反饋錄音,否則播放步驟230取得的錯誤機(jī)器 反饋錄音。把控制交還給腳本控制模塊,更新對話階段,進(jìn)入步驟230開 始的新的一輪對話。
圖3為根據(jù)本發(fā)明的適當(dāng)擴(kuò)大語音識別語法規(guī)模方法框圖。310表示預(yù) 計用戶應(yīng)答內(nèi)容實際需要的語音識別規(guī)則。320為系統(tǒng)編譯的略為擴(kuò)大的語 音識別規(guī)則。330是編譯的語音規(guī)則,為310與320之和。通過增加一些冗余提高語音識別區(qū)分度,用戶錯誤輸入能夠識別出來,從而提高準(zhǔn)確率。
圖4為根據(jù)本發(fā)明的語言處理模塊工作流程圖。下面將參考圖4,對本 發(fā)明的語言處理模塊工作流程進(jìn)行詳細(xì)描述。
首先,在步驟410,語音識別模塊獲得電話用戶話語; 在步驟420,獲取預(yù)計用戶答案; 在步驟430,分析是否存在各種不符點;
在步驟450,是計算比對分值的算法,這是一種根據(jù)句長和錯誤數(shù)比率
的相對值。
圖5為根據(jù)本發(fā)明的對話腳本表達(dá)方式和腳本控制方法流程圖。下面 將參考圖5,對本發(fā)明的對話腳本表達(dá)方式和腳本控制方法進(jìn)行詳細(xì)描述。
首先,在步驟500,根據(jù)當(dāng)前的進(jìn)入標(biāo)志X從腳本庫510中選擇當(dāng)前輪 對話的腳本信息進(jìn)行對話處理;
在步驟520,根據(jù)本發(fā)明的基于語音電話實現(xiàn)自動口語訓(xùn)練方法的流程 對該輪對話進(jìn)行處理;
在步驟530,用當(dāng)前輪對話腳本的轉(zhuǎn)出標(biāo)志更新下一輪對話的轉(zhuǎn)入標(biāo) 志,然后循環(huán)執(zhí)行步驟500,進(jìn)行新一輪對話處理。
圖6為本發(fā)明的對話腳本編寫格式,710是各輪對話的進(jìn)入標(biāo)志。720 是各輪對話的轉(zhuǎn)出標(biāo)志。
以上所述僅為本發(fā)明的優(yōu)選實施例而己,并不用于限制本發(fā)明,對于 本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精 神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明 的權(quán)利要求范圍之內(nèi)。
權(quán)利要求
1、一種基于語音電話實現(xiàn)自動口語訓(xùn)練的方法,該方法包括以下步驟1)電話用戶撥進(jìn)電話,激活電話接收模塊;2)對話控制模塊打開對話腳本,進(jìn)入對話起始狀態(tài);3)確定當(dāng)前所處的對話階段,提取對應(yīng)階段所需的預(yù)期應(yīng)答內(nèi)容;4)編譯當(dāng)前對話階段預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則,為識別電話用戶的語音做好準(zhǔn)備;5)啟動語音識別模塊,同時啟動機(jī)器說話錄音播放模塊,播放提取的機(jī)器說話錄音;6)語音識別模塊激活進(jìn)行語音識別并傳遞語音識別的結(jié)果到語言處理模塊。語言處理模塊把語音識別的結(jié)果與取得的預(yù)期應(yīng)答內(nèi)容進(jìn)行比對。
2、 根據(jù)權(quán)利要求l所述的基于語音電話實現(xiàn)自動口語訓(xùn)練的方法,其 中,所述步驟1中的對話腳本的控制采用數(shù)據(jù)庫紀(jì)錄代表腳本各個階段的 內(nèi)容,每條紀(jì)錄設(shè)置進(jìn)入和轉(zhuǎn)出標(biāo)志值,控制程序只需查找進(jìn)入標(biāo)志值與 當(dāng)前紀(jì)錄的轉(zhuǎn)出標(biāo)志值匹配的任意多條紀(jì)錄,就算找到了對話的下一輪腳 本。
3、 根據(jù)權(quán)利要求l所述的基于語音電話實現(xiàn)自動口語訓(xùn)練的方法,其 中,所述步驟3中的提取對應(yīng)階段所需的預(yù)期應(yīng)答內(nèi)容包括機(jī)器說話錄 音,預(yù)期電話用戶應(yīng)答內(nèi)容,預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則,實際應(yīng)答正 確時機(jī)器的反饋和不正確時的機(jī)器反饋。
4、 一種基于語音電話實現(xiàn)自動口語訓(xùn)練裝置包括電腦、電話接收模塊、 對話控制模塊、語音識別模塊和對話知識庫,其特征在于,所述電話接收模塊,用于接收電話用戶的電話,并將接通信號發(fā)送到 對話控制模塊。所述對話控制模塊,接收來自電話接收模塊信號,從對話知識庫檢索合適的對話知識,調(diào)用語音識別模塊監(jiān)聽電話用戶的話語,調(diào)用語言處理 模塊對識別的語言進(jìn)行判斷,給出該輪對話的反饋。所述語音識別模塊,用于監(jiān)聽電話用戶的話語,并把語音識別的結(jié)果 傳送給語言處理模塊。所述語言處理模塊,接收語音識別的結(jié)果并將其與對話知識庫檢索到 的對話知識進(jìn)行比較,給出比較結(jié)果。所述對話知識庫,存儲對話知識及所有需要保留的信息。
5、 根據(jù)權(quán)利要求4所述的基于語音電話實現(xiàn)自動口語訓(xùn)練裝置,其中,所述語音識別模塊為了提高語音識別準(zhǔn)確率,通過增加一些冗余提高語音 識別區(qū)分度,用戶錯誤輸入能夠識別出來,從而提高準(zhǔn)確率。
6、 根據(jù)權(quán)利要求4所述的基于語音電話實現(xiàn)自動口語訓(xùn)練裝置,其中,所述語言處理模塊是將語音識別的結(jié)果與取得的預(yù)期應(yīng)答內(nèi)容進(jìn)行比對。
全文摘要
一種基于語音電話實現(xiàn)自動口語訓(xùn)練的裝置,包括電腦、電話接收模塊、對話控制模塊、語音識別模塊、語言處理模塊和對話知識庫。一種基于語音電話實現(xiàn)自動口語訓(xùn)練的方法,包括以下步驟電話用戶撥進(jìn)電話,激活電話接收模塊;對話控制模塊打開對話腳本,進(jìn)入對話起始狀態(tài);確定當(dāng)前所處的對話階段,提取對應(yīng)階段所需的預(yù)期應(yīng)答內(nèi)容;編譯當(dāng)前對話階段預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則,為識別電話用戶的語音做好準(zhǔn)備;啟動語音識別模塊,同時啟動機(jī)器說話錄音播放模塊,播放提取的機(jī)器說話錄音;語音識別模塊激活進(jìn)行語音識別并傳遞語音識別的結(jié)果到語言處理模塊。語言處理模塊把語音識別的結(jié)果與取得的預(yù)期應(yīng)答內(nèi)容進(jìn)行比對。
文檔編號G10L15/00GK101304457SQ200710097430
公開日2008年11月12日 申請日期2007年5月10日 優(yōu)先權(quán)日2007年5月10日
發(fā)明者許羅邁 申請人:許羅邁