一種基于語音電話實現(xiàn)自動口語訓(xùn)練的方法與裝置的制作方法

文檔序號：2837238閱讀：242來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種基于語音電話實現(xiàn)自動口語訓(xùn)練的方法與裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明屬于自動口語訓(xùn)練的方法與裝置，具體地說是一種基于語音電話實現(xiàn)自動口語訓(xùn)練的方法與裝置。
背景技術(shù)：
語音識別技術(shù)已經(jīng)在語音電話領(lǐng)域有許多應(yīng)用，主要集中在對話情景
固定并且說話內(nèi)容簡單的內(nèi)線電話智能語音交換機(jī)上。IBM的Phon印ass系統(tǒng)將語音電話和語音識別技術(shù)應(yīng)用于英語口語測試，測試形式主要是朗讀詞匯和句子，以及口頭做多項選擇題。使用廣泛的各種電話自動查詢系統(tǒng) 都采用話機(jī)按鍵交互方式，而不采用口語交互方式。
隨著語音識別系統(tǒng)的識別準(zhǔn)確率和識別速度的提高以及在特定環(huán)境下對硬件條件的要求越來越低，將基于微小芯片的語音識別技術(shù)嵌入消費類電子產(chǎn)品中越來越成為現(xiàn)實。隨著消費類電子產(chǎn)品性能變得越來越混雜功能越來越強(qiáng)勁，語音識別科技使消費者可以更方便、更直觀地使用這些產(chǎn) 品。并且，在使用這些產(chǎn)品的時候不會伴隨著一系列的按鍵和提示音，而是實現(xiàn)消費者和產(chǎn)品間的直接對話。
這些語音識別技術(shù)在語音電話領(lǐng)域的應(yīng)用，由于缺乏口語交互式學(xué)習(xí)，還不能滿足人們在口語訓(xùn)練屮的要求。

發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)中的不足，本發(fā)明的目的在于提供一種基于語音電話實現(xiàn)自動口語訓(xùn)練的方法與裝置，滿足人們利用語音電話進(jìn)行交互式口語訓(xùn)練的需求。為完成上述發(fā)明目的，本發(fā)明提供一種基于語音電話實現(xiàn)自動口語訓(xùn) 練的方法，該方法包括以下步驟
1) 電話用戶撥進(jìn)電話，激活電話接收模塊；
2) 對話控制模塊打開對話腳本，進(jìn)入對話起始狀態(tài)；
3) 確定當(dāng)前所處的對話階段，提取對應(yīng)階段所需的預(yù)期應(yīng)答內(nèi)容；
4) 編譯當(dāng)前對話階段預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則，為識別電話用戶的語音做好準(zhǔn)備；
5) 啟動語音識別模塊，同時啟動機(jī)器說話錄音播放模塊，播放提取的機(jī)器說話錄音；
6) 語音識別模塊激活進(jìn)行語音識別并傳遞語音識別的結(jié)果到語言處理模塊。語言處理模塊把語音識別的結(jié)果與取得的預(yù)期應(yīng)答內(nèi)容進(jìn)行比對。
為完成上述發(fā)明目的，本發(fā)明還提供一種基于語音電話實現(xiàn)自動口語訓(xùn)練的裝置，包括電腦、電話接收模塊、對話控制模塊、語音識別模塊和對話知識庫，其特征在于，
所述電話接收模塊，用于接收電話用戶的電話，并將接通信號發(fā)送到對話控制模塊。
.所述對話控制模塊，接收來自電話接收模塊信號，從對話知識庫檢索合適的對話知識，調(diào)用語言識別模塊監(jiān)聽電話用戶的話語，調(diào)用語言處理模塊對識別的語言進(jìn)行判斷，給出該輪對話的反饋。
所述語音識別模塊，用于監(jiān)聽電話用戶的話語，并把語音識別的結(jié)果傳送給語言處理模塊。
所述語言處理模塊，接收語音識別的結(jié)果并將其與對話知識庫檢索到的對話知識進(jìn)行比較，給出比較結(jié)果。
所述對話知識庫，存儲對話知識及所有需要保留的信息。本發(fā)明具有明顯的優(yōu)點和積極效果。首先采用專家系統(tǒng)技術(shù)和簡化的對話腳本控制技術(shù)組織人機(jī)對話預(yù)計所需的話語知識，可以方便地編寫基于文字和真人錄音的對話腳本并控制其運行流程。其次利用自行研發(fā)的詞句模糊比對技術(shù)比對預(yù)期的對話人所說內(nèi)容和實際識別的內(nèi)容，比對結(jié)果達(dá)到設(shè)定的閾值則根據(jù)預(yù)定的積極反饋方案反饋，否則根據(jù)預(yù)定的消極反饋方案反饋。

圖l為本發(fā)明系統(tǒng)構(gòu)成圖2為根據(jù)本發(fā)明的基于語音電話實現(xiàn)自動口語訓(xùn)練方法的流程圖3為根據(jù)本發(fā)明的適當(dāng)擴(kuò)大語音識別語法規(guī)模方法框圖4為根據(jù)本發(fā)明的語言處理模塊工作流程圖5為根據(jù)本發(fā)明的對話腳本表達(dá)方式和腳本控制方法流程圖6為根據(jù)本發(fā)明的對話腳本編寫格式。
具體實施例方式
下面結(jié)合說明書附圖來說明本發(fā)明的具體實施方式
。
圖1是本發(fā)明的系統(tǒng)構(gòu)成圖，參見圖1，根據(jù)本發(fā)明的基于語音電話實
現(xiàn)自動口語訓(xùn)練裝置包括以下模塊
電腦，用于安裝本發(fā)明裝置的各種模塊，控制各模塊的工作。電話接收模塊，該模塊用于接收電話用戶的電話，并將接通信號發(fā)送
到對話控制模塊。
對話控制模塊，接收來自電話接收模塊信號，從對話知識庫檢索合適的對話知識，調(diào)用語言識別模塊監(jiān)聽電話用戶的話語，調(diào)用語言處理模塊對識別的語言進(jìn)行判斷，給出該輪對話的反饋。
語音識別模塊，用于監(jiān)聽電話用戶的話語，并把語音識別的結(jié)果傳送給語言處理模塊。
語言處理模塊，接收語音識別的結(jié)果并將其與對話知識庫檢索到的對話知識進(jìn)行比較，給出比較結(jié)果。
對話知識庫，存儲對話知識及所有需要保留的信息。
圖2為根據(jù)本發(fā)明的基于語音電話實現(xiàn)自動口語訓(xùn)練方法的流程圖。下文將參考圖2，對本發(fā)明自動口語訓(xùn)練方法進(jìn)行詳細(xì)描述。
首先，在步驟210，電話用戶撥進(jìn)電話，激活電話接收模塊；
在步驟220，對話控制模塊打開對話腳本，進(jìn)入對話起始狀態(tài)；
在步驟230，確定當(dāng)前所處的對話階段，提取對應(yīng)階段所需的各種預(yù)期應(yīng)答內(nèi)容，包括機(jī)器說話錄音，預(yù)期電話用戶應(yīng)答內(nèi)容，預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則，實際應(yīng)答正確時機(jī)器的反饋和不正確時的機(jī)器反饋；
在步驟240，編譯當(dāng)前對話階段預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則，為識別電話用戶的語音做好準(zhǔn)備；
在步驟250，啟動語音識別模塊，同時啟動機(jī)器說話錄音播放模塊，播放步驟3提取的機(jī)器說話錄音；
在歩驟260，語音識別模塊激活語言處理模塊并把語音識別的結(jié)果傳遞過去。語言處理模塊把語音識別的結(jié)果與步驟230取得的預(yù)期應(yīng)答內(nèi)容進(jìn) 行比對，如果比對結(jié)果達(dá)到設(shè)定的閾值，啟動機(jī)器說話錄音播放模塊，播放步驟230取得的正確機(jī)器反饋錄音，否則播放步驟230取得的錯誤機(jī)器反饋錄音。把控制交還給腳本控制模塊，更新對話階段，進(jìn)入步驟230開始的新的一輪對話。
圖3為根據(jù)本發(fā)明的適當(dāng)擴(kuò)大語音識別語法規(guī)模方法框圖。310表示預(yù) 計用戶應(yīng)答內(nèi)容實際需要的語音識別規(guī)則。320為系統(tǒng)編譯的略為擴(kuò)大的語音識別規(guī)則。330是編譯的語音規(guī)則，為310與320之和。通過增加一些冗余提高語音識別區(qū)分度，用戶錯誤輸入能夠識別出來，從而提高準(zhǔn)確率。
圖4為根據(jù)本發(fā)明的語言處理模塊工作流程圖。下面將參考圖4，對本發(fā)明的語言處理模塊工作流程進(jìn)行詳細(xì)描述。
首先，在步驟410，語音識別模塊獲得電話用戶話語；在步驟420，獲取預(yù)計用戶答案；在步驟430，分析是否存在各種不符點；
在步驟450，是計算比對分值的算法，這是一種根據(jù)句長和錯誤數(shù)比率
的相對值。
圖5為根據(jù)本發(fā)明的對話腳本表達(dá)方式和腳本控制方法流程圖。下面將參考圖5，對本發(fā)明的對話腳本表達(dá)方式和腳本控制方法進(jìn)行詳細(xì)描述。
首先，在步驟500，根據(jù)當(dāng)前的進(jìn)入標(biāo)志X從腳本庫510中選擇當(dāng)前輪對話的腳本信息進(jìn)行對話處理；
在步驟520，根據(jù)本發(fā)明的基于語音電話實現(xiàn)自動口語訓(xùn)練方法的流程對該輪對話進(jìn)行處理；
在步驟530，用當(dāng)前輪對話腳本的轉(zhuǎn)出標(biāo)志更新下一輪對話的轉(zhuǎn)入標(biāo) 志，然后循環(huán)執(zhí)行步驟500，進(jìn)行新一輪對話處理。
圖6為本發(fā)明的對話腳本編寫格式，710是各輪對話的進(jìn)入標(biāo)志。720 是各輪對話的轉(zhuǎn)出標(biāo)志。
以上所述僅為本發(fā)明的優(yōu)選實施例而己，并不用于限制本發(fā)明，對于本領(lǐng)域的技術(shù)人員來說，本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的權(quán)利要求范圍之內(nèi)。
權(quán)利要求
1、一種基于語音電話實現(xiàn)自動口語訓(xùn)練的方法，該方法包括以下步驟1)電話用戶撥進(jìn)電話，激活電話接收模塊；2)對話控制模塊打開對話腳本，進(jìn)入對話起始狀態(tài)；3)確定當(dāng)前所處的對話階段，提取對應(yīng)階段所需的預(yù)期應(yīng)答內(nèi)容；4)編譯當(dāng)前對話階段預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則，為識別電話用戶的語音做好準(zhǔn)備；5)啟動語音識別模塊，同時啟動機(jī)器說話錄音播放模塊，播放提取的機(jī)器說話錄音；6)語音識別模塊激活進(jìn)行語音識別并傳遞語音識別的結(jié)果到語言處理模塊。語言處理模塊把語音識別的結(jié)果與取得的預(yù)期應(yīng)答內(nèi)容進(jìn)行比對。
2、根據(jù)權(quán)利要求l所述的基于語音電話實現(xiàn)自動口語訓(xùn)練的方法，其中，所述步驟1中的對話腳本的控制采用數(shù)據(jù)庫紀(jì)錄代表腳本各個階段的內(nèi)容，每條紀(jì)錄設(shè)置進(jìn)入和轉(zhuǎn)出標(biāo)志值，控制程序只需查找進(jìn)入標(biāo)志值與當(dāng)前紀(jì)錄的轉(zhuǎn)出標(biāo)志值匹配的任意多條紀(jì)錄，就算找到了對話的下一輪腳本。
3、根據(jù)權(quán)利要求l所述的基于語音電話實現(xiàn)自動口語訓(xùn)練的方法，其中，所述步驟3中的提取對應(yīng)階段所需的預(yù)期應(yīng)答內(nèi)容包括機(jī)器說話錄音，預(yù)期電話用戶應(yīng)答內(nèi)容，預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則，實際應(yīng)答正確時機(jī)器的反饋和不正確時的機(jī)器反饋。
4、一種基于語音電話實現(xiàn)自動口語訓(xùn)練裝置包括電腦、電話接收模塊、對話控制模塊、語音識別模塊和對話知識庫，其特征在于，所述電話接收模塊，用于接收電話用戶的電話，并將接通信號發(fā)送到對話控制模塊。所述對話控制模塊，接收來自電話接收模塊信號，從對話知識庫檢索合適的對話知識，調(diào)用語音識別模塊監(jiān)聽電話用戶的話語，調(diào)用語言處理模塊對識別的語言進(jìn)行判斷，給出該輪對話的反饋。所述語音識別模塊，用于監(jiān)聽電話用戶的話語，并把語音識別的結(jié)果傳送給語言處理模塊。所述語言處理模塊，接收語音識別的結(jié)果并將其與對話知識庫檢索到的對話知識進(jìn)行比較，給出比較結(jié)果。所述對話知識庫，存儲對話知識及所有需要保留的信息。
5、根據(jù)權(quán)利要求4所述的基于語音電話實現(xiàn)自動口語訓(xùn)練裝置，其中,所述語音識別模塊為了提高語音識別準(zhǔn)確率，通過增加一些冗余提高語音識別區(qū)分度，用戶錯誤輸入能夠識別出來，從而提高準(zhǔn)確率。
6、根據(jù)權(quán)利要求4所述的基于語音電話實現(xiàn)自動口語訓(xùn)練裝置，其中，所述語言處理模塊是將語音識別的結(jié)果與取得的預(yù)期應(yīng)答內(nèi)容進(jìn)行比對。
全文摘要
一種基于語音電話實現(xiàn)自動口語訓(xùn)練的裝置，包括電腦、電話接收模塊、對話控制模塊、語音識別模塊、語言處理模塊和對話知識庫。一種基于語音電話實現(xiàn)自動口語訓(xùn)練的方法，包括以下步驟電話用戶撥進(jìn)電話，激活電話接收模塊；對話控制模塊打開對話腳本，進(jìn)入對話起始狀態(tài)；確定當(dāng)前所處的對話階段，提取對應(yīng)階段所需的預(yù)期應(yīng)答內(nèi)容；編譯當(dāng)前對話階段預(yù)期應(yīng)答內(nèi)容的語音識別規(guī)則，為識別電話用戶的語音做好準(zhǔn)備；啟動語音識別模塊，同時啟動機(jī)器說話錄音播放模塊，播放提取的機(jī)器說話錄音；語音識別模塊激活進(jìn)行語音識別并傳遞語音識別的結(jié)果到語言處理模塊。語言處理模塊把語音識別的結(jié)果與取得的預(yù)期應(yīng)答內(nèi)容進(jìn)行比對。
文檔編號G10L15/00GK101304457SQ200710097430
公開日2008年11月12日申請日期2007年5月10日優(yōu)先權(quán)日2007年5月10日
發(fā)明者許羅邁申請人:許羅邁

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：許羅邁
技術(shù)所有人：許羅邁
我是此專利的發(fā)明人

上一篇：安多藏語語音音節(jié)切分的方法
上一篇：噪聲除去裝置、方法以及程序的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

口語100訓(xùn)練平臺相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于語音電話實現(xiàn)自動口語訓(xùn)練的方法與裝置的制作方法