專利名稱:一種視聽播放裝置及其播放方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種視聽播放裝置,更具體地涉及一種能夠識(shí)別語(yǔ)音指令的視聽播放裝置和方法。
背景技術(shù):
現(xiàn)行的電子娛樂(lè)產(chǎn)品發(fā)展趨勢(shì)是小型化、便利化,因而其操作的按鍵受產(chǎn)品的體積限制,按鍵數(shù)量越來(lái)越少,增加了對(duì)產(chǎn)品操作的不便,特別是在MP3播放器中不能任意直接選擇相關(guān)的曲目,需要順次翻動(dòng),操作多有不便。
語(yǔ)音識(shí)別技術(shù)是一項(xiàng)由來(lái)已久的公知技術(shù),按用戶范圍可分為非特定人識(shí)別和特定人識(shí)別。非特定人識(shí)別采用隱藏馬爾可夫模型HMM(HiddenMarkov Model)來(lái)建模,基本原理是系統(tǒng)首先對(duì)大量的真實(shí)世界中的人的語(yǔ)音進(jìn)行分析,并建立模型。在識(shí)別時(shí),系統(tǒng)同樣先對(duì)輸入的語(yǔ)音進(jìn)行分析,提取特征,然后通過(guò)一定的算法并使用已建立的模型,從而識(shí)別出用戶所說(shuō)的話。特定人系統(tǒng)僅僅為同一個(gè)人服務(wù),使用之前用戶必須對(duì)詞匯表進(jìn)行語(yǔ)音訓(xùn)練。這種系統(tǒng)通常基于動(dòng)態(tài)時(shí)間偏差DTW(Dynamic Time Wrap)技術(shù),能夠達(dá)到較高識(shí)別率,但應(yīng)用范圍較窄。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是利用語(yǔ)音指令替代現(xiàn)有的按鍵指令,提出一種能夠識(shí)別語(yǔ)音指令的視聽播放裝置。
本發(fā)明要解決的另一個(gè)技術(shù)問(wèn)題是提供一種通過(guò)語(yǔ)音指令的播放視聽裝置的方法。
本發(fā)明的技術(shù)方案是提供一種能夠識(shí)別語(yǔ)音指令的視聽播放裝置,包括視聽數(shù)據(jù)處理單元、視聽數(shù)據(jù)存儲(chǔ)單元、操作輸入單元、數(shù)模變換器及視聽數(shù)據(jù)輸出單元,所述的視聽播放裝置還包括語(yǔ)音輸入單元,將話音指令變換為模擬信號(hào),并傳送到模數(shù)變換器;
模數(shù)變換器,該模數(shù)變換器連接語(yǔ)音輸入單元,轉(zhuǎn)換語(yǔ)音輸入單元的模擬信號(hào)為數(shù)字信號(hào);語(yǔ)音識(shí)別處理單元,該語(yǔ)音識(shí)別微處理單元連接模數(shù)變換器,根據(jù)從模數(shù)變換器接收到的數(shù)字信號(hào)與預(yù)存儲(chǔ)的語(yǔ)音模型數(shù)據(jù)對(duì)比產(chǎn)生操作指令,并傳送所述視聽數(shù)據(jù)處理單元;存儲(chǔ)器單元,該存儲(chǔ)器單元與語(yǔ)音識(shí)別處理單元連接,用于存儲(chǔ)設(shè)定的程序和語(yǔ)音數(shù)據(jù)。
本發(fā)明提供的一種能夠識(shí)別語(yǔ)音指令的視聽播放方法包括步驟產(chǎn)生控制視聽播放裝置工作狀態(tài)的第一指令;輸入語(yǔ)音指令,并轉(zhuǎn)換語(yǔ)音指令為語(yǔ)音模擬信號(hào);轉(zhuǎn)換語(yǔ)音模擬信號(hào)為語(yǔ)音數(shù)字信號(hào),并傳送語(yǔ)音識(shí)別處理單元;對(duì)比語(yǔ)音數(shù)字信號(hào)與預(yù)存儲(chǔ)的語(yǔ)音模型數(shù)據(jù),產(chǎn)生相應(yīng)操作指令,傳送視聽數(shù)據(jù)處理單元;及執(zhí)行語(yǔ)音操作指令,進(jìn)行數(shù)據(jù)處理。
相比現(xiàn)有的視聽播放裝置,本發(fā)明的視聽播放裝置利用語(yǔ)音操作替代按鍵操作,節(jié)省了操作面板的空間,有利于電子娛樂(lè)產(chǎn)品向小型化發(fā)展,同時(shí),通過(guò)語(yǔ)音輸入操作指令相比按鍵的方式輸入操作更加便利。
圖1是本發(fā)明的視聽播放裝置的第一實(shí)施例的結(jié)構(gòu)示意圖;圖2是本發(fā)明的視聽播放裝置的第一實(shí)施例的語(yǔ)音識(shí)別判斷流程圖;圖3是本發(fā)明的視聽播放裝置的第二實(shí)施例的結(jié)構(gòu)示意圖;圖4是本發(fā)明的視聽播放裝置的第二實(shí)施例的語(yǔ)音識(shí)別判斷流程圖。
具體實(shí)施例方式
圖1是本發(fā)明的視聽播放裝置的第一實(shí)施例的結(jié)構(gòu)示意圖。如圖1所示,本發(fā)明的一種能夠識(shí)別語(yǔ)音指令的視聽播放裝置件100是通過(guò)如下的技術(shù)方案實(shí)現(xiàn)的,所述的裝置100包括操作輸入單元10,該操作輸入單元件10與視聽數(shù)據(jù)處理單元20連接,用于產(chǎn)生控制視聽播放裝置100工作的第一指令,該第一指令包括打開視聽播放裝置的電源,及開啟語(yǔ)音輸入狀態(tài);語(yǔ)音輸入單元30,該語(yǔ)音輸入單元30通常為麥克風(fēng),用于將話音指令變換為模擬的電信號(hào),該語(yǔ)音輸入單元30連接模數(shù)變換器(ADC)40,并傳送所產(chǎn)生的模擬的電信號(hào)到模數(shù)變換器40進(jìn)行處理;模數(shù)變換器40,該模數(shù)變換器40的輸出接口連接語(yǔ)音識(shí)別處理單元50,用于將來(lái)自語(yǔ)音輸入單元30的模擬電信號(hào)變換為數(shù)字信號(hào),并傳送到語(yǔ)音識(shí)別微處理單元(MCU)50,所述模數(shù)變換器可單獨(dú)存在或與語(yǔ)音輸入單元集成為一體;存儲(chǔ)器單元70,該單元與語(yǔ)音識(shí)別處理單元50,用于存儲(chǔ)預(yù)先設(shè)定的程序和語(yǔ)音數(shù)據(jù);語(yǔ)音識(shí)別微處理單元50,該語(yǔ)音識(shí)別微處理單元與視聽數(shù)據(jù)處理單元20、模數(shù)變換器40、數(shù)模變換器80以及存儲(chǔ)器單元70連接,用于根據(jù)從模數(shù)變換器40接收到的數(shù)字信息與存儲(chǔ)器單元70存儲(chǔ)的信息對(duì)比產(chǎn)生第二操作指令,控制視聽數(shù)據(jù)處理單元20;視聽數(shù)據(jù)處理單元20,該部分連接操作輸入單元10按鍵、語(yǔ)音識(shí)別微處理單元50、數(shù)模變換器80以及語(yǔ)音數(shù)據(jù)存儲(chǔ)單元60,用于根據(jù)操作輸入單元10產(chǎn)生的所述的第一指令和語(yǔ)音識(shí)別微處理單元50所產(chǎn)生的第二指令,從語(yǔ)音數(shù)據(jù)存儲(chǔ)單元60讀取相關(guān)的視聽數(shù)據(jù),送到數(shù)模變換器80經(jīng)視聽數(shù)據(jù)輸出單元90播放;視聽數(shù)據(jù)存儲(chǔ)單元60,該視聽數(shù)據(jù)存儲(chǔ)單元60存儲(chǔ)視聽播放數(shù)據(jù),如音頻數(shù)據(jù)MP3,視頻數(shù)據(jù)等。
數(shù)模變換器(DAC)80,該數(shù)模變換器80連接視聽數(shù)據(jù)處理單元20以及語(yǔ)音識(shí)別微處理單元50,用于將視聽數(shù)據(jù)處理單元20以及語(yǔ)音識(shí)別微處理單元50輸入的數(shù)字信號(hào)變換為模擬信號(hào);視聽數(shù)據(jù)輸出單元90,該視聽數(shù)據(jù)輸出單元90與數(shù)模變換器80連接,用于將來(lái)自數(shù)模變換器80的模擬信號(hào)變換為聲音信號(hào)輸出,視聽數(shù)據(jù)輸出單元90通常為揚(yáng)聲器或顯示器。
該第一實(shí)施例是基于非特定人的語(yǔ)音識(shí)別視聽播放裝置,一般采用隱馬爾可夫模型HMM(Hidden Markov Model)來(lái)建模。根據(jù)對(duì)大量的真實(shí)世界中的人的語(yǔ)音進(jìn)行分析,并建立模型。同時(shí),將這些模型存儲(chǔ)在存儲(chǔ)器單元70內(nèi)。在識(shí)別時(shí),裝置同樣先對(duì)輸入的語(yǔ)音進(jìn)行分析,提取特征,然后通過(guò)一定的算法并使用已建立的模型,從而識(shí)別出用戶所說(shuō)的話。
所述的存儲(chǔ)器單元70是第一只讀存儲(chǔ)器ROM1,用于存儲(chǔ)控制程序和提示音數(shù)據(jù);第二只讀存儲(chǔ)器ROM2,用于存儲(chǔ)語(yǔ)音模型和聲學(xué)模型數(shù)據(jù);隨機(jī)存取存儲(chǔ)器RAM,用于在語(yǔ)音識(shí)別微處理單元運(yùn)行時(shí),在隨機(jī)存取存儲(chǔ)器RAM中加載常用的數(shù)據(jù)和程序,以便提高語(yǔ)音識(shí)別微處理單元的運(yùn)行速度。
圖2是本發(fā)明的視聽播放裝置100的第一實(shí)施例的語(yǔ)音識(shí)別判斷流程圖。如圖2所示,首先從步驟S201開始,對(duì)輸入的語(yǔ)音進(jìn)行判斷,判斷是否有效的語(yǔ)音信號(hào),如果判斷結(jié)果是否定的,是噪音信號(hào),執(zhí)行步驟S202,在一設(shè)定的周期內(nèi)繼續(xù)等待語(yǔ)音信號(hào),如果設(shè)定的周期內(nèi)沒有接收到有效的信號(hào),進(jìn)入步驟S206,操作結(jié)束,在步驟S201,如果判斷是肯定的,即語(yǔ)音識(shí)別微處理單元50接收到有效的語(yǔ)音信號(hào),則進(jìn)行語(yǔ)音識(shí)別,進(jìn)入步驟S203判斷是否可以產(chǎn)生操作指令,如果在步驟S203判斷的結(jié)果是否定的,結(jié)果無(wú)法產(chǎn)生操作指令,則進(jìn)入步驟S204進(jìn)行語(yǔ)音提示,繼續(xù)進(jìn)行語(yǔ)音輸入;如果在步驟S203判斷的結(jié)果是肯定的,即是正確識(shí)別,并產(chǎn)生操作指令,則步驟進(jìn)入S205執(zhí)行操作指令,視聽數(shù)據(jù)處理單元20執(zhí)行相應(yīng)的語(yǔ)音指令,步驟進(jìn)入S206結(jié)束。
圖3是本發(fā)明的視聽播放裝置的第二實(shí)施例的構(gòu)成示意圖。如圖3所示,該視聽播放裝置與圖1的構(gòu)成基本相同。該視聽播放裝置是基于動(dòng)態(tài)規(guī)劃(DP)原理,和非特定人的語(yǔ)音識(shí)別視聽播放裝置的根本不同之處在于特定人語(yǔ)音識(shí)別在于使用前先進(jìn)行語(yǔ)音訓(xùn)練,建立模式庫(kù)。語(yǔ)音信號(hào)從語(yǔ)音輸入單元30中輸入,在ADC40(模數(shù)變換器)中轉(zhuǎn)換成為數(shù)字信號(hào),輸入語(yǔ)音識(shí)別處理單元50。語(yǔ)音識(shí)別處理單元50從原始語(yǔ)音樣本中去除冗余信息,保留關(guān)鍵數(shù)據(jù),再對(duì)數(shù)據(jù)加以聚類,形成模式庫(kù),存儲(chǔ)在閃存存儲(chǔ)器FLASH中。對(duì)于特定的訓(xùn)練須要進(jìn)行多次語(yǔ)音重復(fù)以獲得最具特征的信息。對(duì)特定人的語(yǔ)音建立模式庫(kù)后,使用和非特定人視聽播放裝置相似,不同之處在于輸入的語(yǔ)音特征序列將和FLASH模式庫(kù)中的數(shù)據(jù)進(jìn)行比較,得到最佳的識(shí)別結(jié)果。因此,所述存儲(chǔ)器單元70及其存儲(chǔ)的信息與第一實(shí)施例不同,所述的存儲(chǔ)器裝置包括一種只讀存儲(chǔ)器ROM,用于存儲(chǔ)控制程序和提示音數(shù)據(jù);一種閃存存儲(chǔ)器FLASH,用于存儲(chǔ)模式庫(kù)數(shù)據(jù);隨機(jī)存取存儲(chǔ)器RAM,用于在語(yǔ)音識(shí)別微處理單元運(yùn)行時(shí),在隨機(jī)存取存儲(chǔ)器RAM中加載常用的數(shù)據(jù)和程序,以便提高語(yǔ)音識(shí)別微處理單元的運(yùn)行速度。
圖4是本發(fā)明的視聽播放裝置的第二實(shí)施例的語(yǔ)音識(shí)別判斷流程圖。如圖4所示,首先從步驟S401開始,在步驟S402判斷是否選擇學(xué)習(xí)鍵,如果選中學(xué)習(xí)鍵,則進(jìn)入步驟S403訓(xùn)練語(yǔ)言命令,建立訓(xùn)練系統(tǒng),存儲(chǔ)模式庫(kù);如果在步驟S402判斷是否定的,則進(jìn)入步驟S404判斷是否是語(yǔ)音識(shí)別鍵,如果判斷是否定的,則進(jìn)入步驟S405其它按鍵,直接進(jìn)入步驟S410執(zhí)行相關(guān)操作指令。在步驟S404,如果判斷是肯定的,則進(jìn)入步驟S406,對(duì)輸入的語(yǔ)音進(jìn)行判斷,判斷是否是有效的語(yǔ)音信號(hào),如果判斷結(jié)果是否定的,是噪音信號(hào),執(zhí)行步驟S407,并在設(shè)定的周期內(nèi)繼續(xù)等待語(yǔ)音信號(hào),如果設(shè)定的周期內(nèi)沒有接收到有效的語(yǔ)音信號(hào),進(jìn)入步驟S411,操作結(jié)束,在步驟S406,如果判斷是肯定的,即語(yǔ)音識(shí)別微處理單元50接收到有效的語(yǔ)音信號(hào),則進(jìn)行語(yǔ)音識(shí)別,進(jìn)入步驟S408判斷是否可以產(chǎn)生操作指令,如果在步驟S408判斷的結(jié)果是否定的,輸入的語(yǔ)音如果無(wú)法識(shí)別,或者識(shí)別的結(jié)果不是語(yǔ)音操作指令,無(wú)法產(chǎn)生相應(yīng)操作,則進(jìn)入步驟S409進(jìn)行語(yǔ)音提示,繼續(xù)進(jìn)行語(yǔ)音輸入;如果在步驟S408判斷的結(jié)果是肯定的,即能正確識(shí)別,并且產(chǎn)生操作指令,則步驟進(jìn)入S410,執(zhí)行操作指令,步驟進(jìn)入S411結(jié)束。
根據(jù)以上的描述可知,本發(fā)明的一種能夠識(shí)別語(yǔ)音指令的視聽播放方法是通過(guò)如下的技術(shù)方案實(shí)現(xiàn)的,所述的方法包括步驟產(chǎn)生控制視聽播放裝置工作狀態(tài)的第一指令;將語(yǔ)音指令變換為語(yǔ)音指令模擬信號(hào),并將語(yǔ)音指令模擬信號(hào)變換為語(yǔ)音指令數(shù)字信號(hào),然后傳送到語(yǔ)音識(shí)別處理單元;根據(jù)從模數(shù)變換器接收到的話音指令數(shù)字信號(hào)和存儲(chǔ)器裝置存儲(chǔ)的信息,進(jìn)行判斷識(shí)別和產(chǎn)生控制播放內(nèi)容的第二指令,并傳送到視聽播放部分和數(shù)模變換器;根據(jù)操作輸入單元產(chǎn)生的所述的第一指令和語(yǔ)音識(shí)別處理單元的產(chǎn)生的第二指令,產(chǎn)生所要求播放內(nèi)容的信號(hào),并傳送到數(shù)模變換器;用于將數(shù)字信號(hào)變換為模擬信號(hào),將來(lái)自數(shù)模變換器的模擬信號(hào)變換為聲音信號(hào);根據(jù)本發(fā)明的第一實(shí)施例,所述的存儲(chǔ)器裝置存儲(chǔ)的信息包括用于存儲(chǔ)控制程序和提示音數(shù)據(jù);用于存儲(chǔ)語(yǔ)言模型和聲學(xué)模型數(shù)據(jù);用于在語(yǔ)音識(shí)別微處理單元運(yùn)行時(shí),在隨機(jī)存取存儲(chǔ)器RAM中加載常用的數(shù)據(jù)和程序,以便提高語(yǔ)音識(shí)別微處理單元的運(yùn)行速度。
所述的進(jìn)行判斷識(shí)別的步驟進(jìn)一步包括1)、開始,首先對(duì)輸入的語(yǔ)音進(jìn)行判斷,如果是無(wú)效的噪音信號(hào),繼續(xù)等待,如果設(shè)定的周期內(nèi)沒有接收到有效的信號(hào),操作結(jié)束;2)、如果輸入了有效的語(yǔ)音信號(hào),則進(jìn)行語(yǔ)音識(shí)別;如果無(wú)法識(shí)別,不能產(chǎn)生操作指令,則進(jìn)行語(yǔ)音提示,繼續(xù)進(jìn)行語(yǔ)音輸入;如是正確識(shí)別,并產(chǎn)生操作指令,則執(zhí)行操作指令。
根據(jù)本發(fā)明的第二實(shí)施例,所述的存儲(chǔ)器裝置存儲(chǔ)的信息包括用于存儲(chǔ)控制程序和提示音數(shù)據(jù);用于存儲(chǔ)模式庫(kù)數(shù)據(jù);用于在語(yǔ)音識(shí)別微處理單元運(yùn)行時(shí),在隨機(jī)存取存儲(chǔ)器RAM中加載常用的數(shù)據(jù)和程序,以便提高語(yǔ)音識(shí)別微處理單元的運(yùn)行速度。
所述的進(jìn)行判斷識(shí)別的步驟進(jìn)一步包括1)、首先,對(duì)按鍵選擇進(jìn)行判斷,如果選中學(xué)習(xí)鍵,則建立訓(xùn)練系統(tǒng),存儲(chǔ)語(yǔ)音模型庫(kù);2)、如果是識(shí)別鍵,首先對(duì)輸入的語(yǔ)音進(jìn)行判斷,如果是無(wú)效的噪音信號(hào),繼續(xù)等待,如果在設(shè)定的周期內(nèi)沒有接收到有效的語(yǔ)音信號(hào),操作結(jié)束;如果輸入了有效的語(yǔ)音信號(hào),則進(jìn)行語(yǔ)音識(shí)別;如果無(wú)法識(shí)別,不能產(chǎn)生操作指令,則進(jìn)行語(yǔ)音提示,繼續(xù)進(jìn)行語(yǔ)音輸入;如是正確識(shí)別,并產(chǎn)生操作指令,則執(zhí)行操作指令。
3)、如果是其它按鍵,則直接執(zhí)行相應(yīng)命令操作。
綜上所述,本發(fā)明是在現(xiàn)有技術(shù)中的視聽播放器的基礎(chǔ)上進(jìn)行的改進(jìn),有關(guān)現(xiàn)有技術(shù)中的視聽播放器構(gòu)成的部分這里不再重復(fù)贅述,本發(fā)明中的存儲(chǔ)器單元的具體構(gòu)成可以根據(jù)視聽播放裝置功能的需要進(jìn)行不同的安排,也可以改變存儲(chǔ)器單元的數(shù)量,將視聽播放器中的存儲(chǔ)器單元與視聽數(shù)據(jù)存儲(chǔ)單元結(jié)合在一起使用。
以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,對(duì)本發(fā)明所作的若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種視聽播放裝置,包括視聽數(shù)據(jù)處理單元、視聽數(shù)據(jù)存儲(chǔ)單元、操作輸入單元、數(shù)模變換器及視聽數(shù)據(jù)輸出單元,其特征在于,所述的裝置還包括語(yǔ)音輸入單元,將話音指令變換為模擬信號(hào),并傳送到模數(shù)變換器;模數(shù)變換器,該模數(shù)變換器連接語(yǔ)音輸入單元,轉(zhuǎn)換語(yǔ)音輸入單元的模擬信號(hào)為數(shù)字信號(hào);語(yǔ)音識(shí)別處理單元,該語(yǔ)音識(shí)別微處理單元連接模數(shù)變換器,根據(jù)從模數(shù)變換器接收到的數(shù)字信號(hào)與預(yù)存儲(chǔ)的語(yǔ)音模型數(shù)據(jù)對(duì)比產(chǎn)生操作指令,并傳送所述視聽數(shù)據(jù)處理單元;存儲(chǔ)器單元,該存儲(chǔ)器單元與語(yǔ)音識(shí)別處理單元連接,用于存儲(chǔ)設(shè)定的程序和語(yǔ)音數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述的存儲(chǔ)器單元包括第一只讀存儲(chǔ)器ROM1,存儲(chǔ)控制程序和提示音數(shù)據(jù);第二只讀存儲(chǔ)器ROM2,存儲(chǔ)語(yǔ)言模型和聲學(xué)模型數(shù)據(jù);隨機(jī)存取存儲(chǔ)器RAM,在語(yǔ)音識(shí)別微處理單元運(yùn)行時(shí),加載常用的數(shù)據(jù)和程序。
3.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述的存儲(chǔ)器單元包括只讀存儲(chǔ)器ROM,存儲(chǔ)控制程序和提示音數(shù)據(jù);閃存存儲(chǔ)器FLASH,存儲(chǔ)模式庫(kù)數(shù)據(jù);隨機(jī)存取存儲(chǔ)器RAM,在語(yǔ)音識(shí)別微處理單元運(yùn)行時(shí),加載常用的數(shù)據(jù)和程序。
4.一種視聽播放方法,其特征在于,所述的方法包括步驟產(chǎn)生控制視聽播放裝置工作狀態(tài)的第一指令;輸入語(yǔ)音指令,并轉(zhuǎn)換語(yǔ)音指令為語(yǔ)音模擬信號(hào);轉(zhuǎn)換語(yǔ)音模擬信號(hào)為語(yǔ)音數(shù)字信號(hào),并傳送語(yǔ)音識(shí)別處理單元;對(duì)比語(yǔ)音數(shù)字信號(hào)與預(yù)存儲(chǔ)的語(yǔ)音模型數(shù)據(jù),產(chǎn)生相應(yīng)操作指令,傳送視聽數(shù)據(jù)處理單元;及執(zhí)行語(yǔ)音操作指令,進(jìn)行數(shù)據(jù)處理。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述的識(shí)別語(yǔ)音指令的步驟進(jìn)一步包括1)、判斷輸入的語(yǔ)音信號(hào)的有效性,并設(shè)定等待有效信號(hào)的周期;2)、對(duì)輸入的有效語(yǔ)音信號(hào),如果不能產(chǎn)生操作指令,則給出語(yǔ)音提示。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述的視聽播放裝置的包括存儲(chǔ)單元,所述存儲(chǔ)器單元存儲(chǔ)的信息包括控制程序和提示音數(shù)據(jù);語(yǔ)言模型和聲學(xué)模型數(shù)據(jù);語(yǔ)音識(shí)別處理單元運(yùn)行時(shí)常用加載數(shù)據(jù)和程序。
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述的識(shí)別語(yǔ)音指令的視聽播放方法包括針對(duì)特定人的語(yǔ)音訓(xùn)練,通過(guò)訓(xùn)練語(yǔ)言命令,建立特定人的語(yǔ)音模型庫(kù)。
8.根據(jù)權(quán)利要求4或7所述的方法,其特征在于,所述的視聽播放裝置進(jìn)一步包括存儲(chǔ)特定人語(yǔ)音模型庫(kù)的閃存存儲(chǔ)器FLASH。
全文摘要
本發(fā)明公開了一種視聽播放裝置及其播放方法,所述的裝置包括操作輸入單元、語(yǔ)音輸入單元、模數(shù)變換器、存儲(chǔ)器單元、語(yǔ)音識(shí)別處理單元、視聽數(shù)據(jù)處理單元、視聽數(shù)據(jù)存儲(chǔ)單元、數(shù)模變換器以及視聽數(shù)據(jù)輸出單元,通過(guò)轉(zhuǎn)換輸入的語(yǔ)音指令成相應(yīng)的操作指令,控制視聽播放裝置。本發(fā)明的識(shí)別語(yǔ)音指令的視聽播放裝置能夠通過(guò)語(yǔ)音識(shí)別處理單元使用語(yǔ)音實(shí)現(xiàn)對(duì)視聽播放裝置的操作。通過(guò)語(yǔ)音指令替代原來(lái)的按鍵指令。用戶只須對(duì)此裝置發(fā)出語(yǔ)音指令,設(shè)備即能聽明白用戶的意思,并執(zhí)行相應(yīng)的操作,這樣能夠使視聽播放裝置更加小型化,便于攜帶。
文檔編號(hào)G10L15/08GK1707612SQ20041002759
公開日2005年12月14日 申請(qǐng)日期2004年6月8日 優(yōu)先權(quán)日2004年6月8日
發(fā)明者黃光明, 向鋒, 成曉華 申請(qǐng)人:深圳市朗科科技有限公司