專利名稱:語音控制電子報時鐘的制作方法
技術(shù)領(lǐng)域:
本實用新型涉及一種電子產(chǎn)品,更具體地說,涉及一種響應語音信號報時的電子時鐘單元。
背景技術(shù):
語音處理技術(shù)得到了迅速發(fā)展,產(chǎn)生于二十世紀六七十年代,卻從二十世紀八十年代中期開始得到極大發(fā)展并成為語音處理研究熱點的隱馬爾科夫模型HMM(Hidden Markov Models),逐漸成為現(xiàn)代語音處理領(lǐng)域的重要理論基礎(chǔ)之一。
單片機把計算機的主要組成單元微處理器(CPU)、程序存儲器(ROM)和數(shù)據(jù)存儲器(RAM)、輸入/輸出端口(I/O)及時鐘、計數(shù)器和中斷系統(tǒng)等集成在一塊芯片上,這樣的一塊集成電路具有一臺計算機的屬性。隨著單片機技術(shù)的發(fā)展出現(xiàn)了十六位微處理器單片機,片內(nèi)的程序存儲器和數(shù)據(jù)存儲器容量進一步擴大,實時處理能力更加增強,體現(xiàn)了現(xiàn)代控制技術(shù)的鮮明特征,臺灣凌陽公司推出的十六位單片機SPCE061A帶有高尋址能力的ROM和RAM、多功能的I/O口,指令系統(tǒng)提供具有較高速度的16位×16位乘法運算指令和內(nèi)積運算指令,為其應用增添了DSP功能,使得它在復雜的數(shù)字信號處理和語音處理方面非常便利。
程序控制技術(shù)是計算機為了解決某些具體、實際的問題而開發(fā)和研制的各種程序。匯編語言是計算機系統(tǒng)提供的最快、最有效的語言,也是能對硬件直接編程的語言。高級語言代碼清晰,易維護,模塊化較好,近年來在單片機的程序設(shè)計上增加了對高級語言的支持,C語言簡單靈活,可移植性好,許多微處理器加入了對C語言的支持,凌陽微處理器SPCE061A可以使用C語言編程。結(jié)構(gòu)復雜并對運行速度要求比較高的工程,通常用C和匯編語言混合編程來將兩者的優(yōu)缺點互補。
目前,時鐘利用聲音實現(xiàn)報時多采用定時的方式,或者采用按鍵方式實現(xiàn)。而直接通過人的提問,時鐘回答提問自動報時的產(chǎn)品市場上還沒有出現(xiàn)。
發(fā)明內(nèi)容
本實用新型針對上述問題,提供了一種能夠進行語音訓練、識別人的語音、按照不同的語音命令播報日期或時間的語音控制電子報時鐘,解決了目前時鐘報時多為定時觸發(fā)、按鍵觸發(fā),少有語音控制報時方式的問題。
為了解決上述問題,本實用新型構(gòu)造了一種語音控制電子報時鐘,包括單片機系統(tǒng),以及分別與所述單片機系統(tǒng)連接的語音輸出模塊、鍵盤模塊、電源模塊;單片機系統(tǒng)通過語音通道連接語音輸入模塊;單片機系統(tǒng)采用芯片型號SPCE061A的微處理器。
本實用新型的語音控制電子報時鐘其進一步改進還在于,單片機系統(tǒng)還連接有外存儲器模塊;外存儲器模塊為型號SPR1024A的閃存。
本實用新型的語音控制電子報時鐘其進一步改進還在于,單片機系統(tǒng)設(shè)置有程序下載端口。
通過上述技術(shù)方案,本實用新型的語音控制電子報時鐘主要有如下特點(1)一改通常人們用視力看時間和日期的方式,由聲音和聽力獲取,新穎活潑;(2)應用集成電路,體積小,功能強,質(zhì)量穩(wěn)定;(3)程序控制走時,計時精確,誤差?。?4)操作按鍵少,根據(jù)語音提示調(diào)時和語音訓練,使用者操作起來很方便;(5)語音識別正確率高,能識別訓練特定人或者非特定人的語音;(6)電池供電,功耗小。
從而帶來本發(fā)明的有益效果是生產(chǎn)制作成語音控制電子報時鐘產(chǎn)品,用語音方式提供日期和時間信息,方便人們的工作和生活;應用于玩具生產(chǎn)行業(yè),生產(chǎn)可以通過語音辨識播放當前日期和時間的智能化玩具,增加產(chǎn)品附加值;能應用于某些特殊的生產(chǎn)行業(yè),如比較黑暗的工作環(huán)境、攝影暗室等場所;集成到特定功能的產(chǎn)品可以方便殘疾人使用。
圖1是微處理器芯片SPCE061A的內(nèi)部結(jié)構(gòu)圖;圖2是微處理器芯片SPCE061A內(nèi)存映射表;圖3是外存儲器模塊存儲芯片SPR1024A的引腳圖;圖4是本實用新型語音控制電子報時鐘的原理結(jié)構(gòu)圖;圖5是語音命令模型庫訓練流程圖;圖6是微處理器芯片SPCE061A對語音處理流程圖;圖7是非特定語音命令識別流程圖;
圖8是本實用新型語音控制電子報時鐘的主程序流程圖;圖9是本實用新型語音控制電子報時鐘的主要技術(shù)參數(shù)表;圖10是本實用新型語音控制電子報時鐘按鍵調(diào)整日期時間表;圖11是本實用新型語音控制電子報時鐘語音命令訓練內(nèi)容表;圖12、13和14構(gòu)成本實用新型語音控制電子報時鐘的電路示意圖。
其中,1功能選擇按鍵; 2增加按鍵; 3減小按鍵; 4復位按鈕;5電池盒; 6程序下載接口; 7喇叭具體實施方式
以下結(jié)合附圖和具體實施方式
對本實用新型進一步說明。
本實用新型的語音控制電子報時鐘包括單片機系統(tǒng),以及分別與所述單片機系統(tǒng)連接的語音輸出模塊、鍵盤模塊、電源模塊;單片機系統(tǒng)通過語音通道連接語音輸入模塊。其中,單片機系統(tǒng)采用臺灣凌陽公司生產(chǎn)的微處理器SPCE061A芯片,芯片上集成64K字節(jié)的FLASH(閃存)和4K字節(jié)的SRAM(靜態(tài)存儲器)。此外單片機系統(tǒng)還連接有外存儲器模塊;外存儲器模塊為型號SPR1024A的閃存,外部擴展的SPR1024A存儲器其內(nèi)部有128K×8bits FLASH。
如圖4所示,本實用新型的語音控制電子報時鐘,其鍵盤模塊至少設(shè)置4個功能鍵,分別為功能選擇按鍵1、增加按鍵2、減小按鍵3和復位按鈕4,前三個按鍵進行日期時間參數(shù)的調(diào)整和語音訓練的提示。而電源模塊包括置于電池盒5中留有電源端口的電池。此外,作為單片機系統(tǒng)的微處理器SPCE061A設(shè)置有程序下載接口,通過程序下載端口將程序下載到FLASH存儲器中。而上述的語音輸出模塊通常連接單片機系統(tǒng)DAC通道的喇叭7,該喇叭7用來播放語音信息。
本語音控制電子報時鐘是具有時間日期調(diào)整、語音命令訓練和辨識、2Hz時基計時計算當前時間和日期、語音播報時間和日期等功能。
結(jié)合本語音控制電子報時鐘硬件電路圖12進一步說明。硬件電路主要包括SPCE061A最小系統(tǒng)(如圖12所示芯片U1)、鍵盤模塊、麥克風通道(MIC_IN,圖12中的MICROPHONE)、與單片機系統(tǒng)10位模/數(shù)轉(zhuǎn)換器ADC連接的語音輸入模塊、外存儲器模塊(圖12中的芯片SPR1024A)和連接單片機系統(tǒng)數(shù)/模轉(zhuǎn)換器DAC的語音輸出模塊(圖12中的SPEAKER單元),以及電源模塊(圖12中的POWER單元)。
硬件系統(tǒng)具體說明一、凌陽十六位微處理器的內(nèi)部結(jié)構(gòu)如圖1所示。其主要工作性能包括(1)16位μ′nSPTM微處理器;(2)工作電壓(CPU)VDD2.6~3.6V,(I/O)VDDH2.4~5.5V;(3)CPU時鐘0.32MHz~49.152MHz;(4)內(nèi)置2K字SRAM;(5)內(nèi)置32K字FLASH;(6)可編程音頻處理;(7)系統(tǒng)處于備用狀態(tài)下(時鐘處于停止狀態(tài)),耗電僅為2μA/3.6V;(8)2個16位可編程定時器/計數(shù)器(可自動預置初始計數(shù)值)(9)2個10位DAC(數(shù)/模轉(zhuǎn)換)輸出通道;(10)32位通用可編程輸入/輸出端口;(11)14個中斷源,來自定時器A/B、時基、2個外部時鐘源輸入和鍵喚醒;(12)鎖相環(huán)PLL振蕩器提供系統(tǒng)時鐘信號;(13)7通道10位電壓模-數(shù)轉(zhuǎn)換器(ADC)和1通道聲音模-數(shù)轉(zhuǎn)換器;(14)聲音模-數(shù)轉(zhuǎn)換器輸入通道內(nèi)置麥克風放大器和自動增益控制(AGC)功能;(15)具有串行設(shè)備接口;(16)具有低電壓復位(LVR)功能和低電壓監(jiān)測(LVD)功能;(17)內(nèi)置在線仿真電路ICE(In-Circuit Emulator)接口;(18)具有WatchDog功能。
凌陽微處理器SPCE061A封裝方式為PLCC84,在OSCO、OSCI端接上晶振及諧振電容,在鎖相環(huán)壓控振蕩器的阻容輸入VCP端接上相應的電容電阻后即可工作,其他不用的電源端和地端接上0.1μF的去耦電容提高抗干擾能力。
SPCE061A的片內(nèi)存儲器地址映射如圖2所示。
二、鍵盤模塊;擴展了1×3鍵盤電路,接到IOA的低3位,鍵盤是用戶和語音電子報時鐘信息交互的通道,可以調(diào)整日期時間參數(shù)和進行語音命令訓練。共三個按鍵,分別是調(diào)整參數(shù)的選擇按鍵、增加按鍵和減小按鍵。
三、語音輸入模塊;微處理器SPCE061A有一路通道(MIC_IN)用于語音輸入,模擬信號經(jīng)過自動增益控制器和放大器后進行A/D轉(zhuǎn)換。
在ADC內(nèi),由數(shù)/模轉(zhuǎn)換器DAC0和逐次逼近寄存器SAR組成逐次逼近式模/數(shù)轉(zhuǎn)換器。向數(shù)據(jù)寄存器P_ADC_Ctrl(0×7015)單元第0位(ADE)寫入1用以激活ADC。系統(tǒng)默認設(shè)置為ADE=0,即屏蔽ADC。
ADC采用自動方式工作。硬件ADC的最高速率定為(fosc/32)Hz,如果超過此值,從轉(zhuǎn)換結(jié)果寄存單元讀出數(shù)據(jù)會發(fā)生錯誤。在ADC自動方式被啟用后,會產(chǎn)生一個啟動信號。DAC0的電壓模擬量輸出值與外部的電壓模擬量輸入值進行比較,以盡快找出外部電壓模擬量的數(shù)字量輸出值。逐次逼近式一直延續(xù)到10位中的所有位都被測試之后,A/D轉(zhuǎn)換的結(jié)果保存在SAR內(nèi)。當10位A/D轉(zhuǎn)換完成時,用戶讀取10位A/D轉(zhuǎn)換的數(shù)據(jù)。從MIC_IN輸入的模擬信號則要經(jīng)過緩沖器和放大器,AGC功能將通過MIC_IN通道輸入的模擬信號的放大值控制在一定范圍內(nèi),然后放大信號經(jīng)采樣/保持模塊被送至比較器參與A/D轉(zhuǎn)換值的確定,最后送入數(shù)據(jù)寄存器P_ADC(0×7014)單元。
四、外存儲器模塊;存儲芯片選用SPR1024A,芯片引腳如圖3所示。SPR1024A是有128K×8bits的FLASH閃存,有兩種接口方式BMI(Bus Memory Interface)和SIF(SerialInterface),在設(shè)計中采用SIF方式。SIF方式是串行同步傳送數(shù)據(jù),一條是發(fā)送/接收,一條是時鐘線。RESET是復位信號,低電平有效;SEL為片選信號,高電平有效,在設(shè)計中接高電平。
存儲芯片SPR1024A和微處理器SPCE061A數(shù)據(jù)通訊用串行輸入輸出端口SIO。SIO提供了一個1位的串行接口,用于與其它設(shè)備進行數(shù)據(jù)傳輸。在SPCE061A內(nèi)通過IOB0和IOB1這兩個端口實現(xiàn)與設(shè)備進行串行數(shù)據(jù)交換功能,其中,IOB0用來作為時鐘端口(SCK),IOB1用來作為數(shù)據(jù)端口(SDA),用于串行數(shù)據(jù)的接收和發(fā)送。
五、語音輸出模塊;SPCE061A提供的音頻輸出方式為雙通道DAC方式。在此方式下,DAC1和DAC2轉(zhuǎn)換輸出的模擬量電流信號分別通過AUD1和AUD2引腳輸出,輸出的數(shù)字量分別寫入數(shù)據(jù)寄存器P_DAC1(0×7017)P_DAC2(0×7016)。
本時鐘在音頻處理技術(shù)上實現(xiàn)方法如下一、數(shù)字音頻的采樣和量化將模擬(連續(xù))的聲音波形數(shù)字化(離散化),可方便數(shù)字計算機進行處理的過程,數(shù)字音頻的處理主要包括采樣和量化兩個方面。數(shù)字音頻的質(zhì)量取決于采樣頻率和量化位數(shù)這兩個重要參數(shù)。此外,聲道的數(shù)目、相應的音頻設(shè)備也是影響音頻質(zhì)量的原因。
二、音頻壓縮算法實際應用中,未經(jīng)壓縮編碼的音頻資料量很大,進行傳輸或存儲是不現(xiàn)實的。所以要通過對信號趨勢的預測和冗余信息處理,進行資料的壓縮,這樣就可以用較少的資源建立更多的信息。通過對資料的壓縮,達到高效率存儲和轉(zhuǎn)換資料的結(jié)果,即在保證一定聲音質(zhì)量的條件下,以最小的資料率來表達和傳送聲音信息。
凌陽音頻壓縮算法根據(jù)不同的壓縮比分為以下三種SACM_A2000壓縮比為8∶1,8∶1.25,8∶1.5;SACM_S480壓縮比為80∶3,80∶4.5;SACM_S240壓縮比為80∶1.5。
凌陽壓縮算法中SACM_A2000、SACM_S480和SACM_S240主要是用來播放語音。根據(jù)設(shè)計的具體情況,語音控制電子報時鐘選擇用SACM_S480。
語音處理技術(shù)主要包括語音命令模型庫訓練、語音識別和語音播放。
語音命令模型庫訓練過程如圖5所示。語音輸入是用SPCE061A系統(tǒng)采集語音信號,通過通信模塊將語音信號傳送到PC機上保存,能夠保證訓練用語音特征與識別一致性,從而減少硬件系統(tǒng)不一致帶來的誤差。
預處理包括預加重和端點檢測。端點檢測一般采用時域參數(shù)。根據(jù)現(xiàn)有SPCE061A的性能,采用線性預測倒譜系數(shù)作為特征矢量。模板訓練采用離散的隱馬爾可夫模型,雖然訓練隱馬爾可夫模型需要很長時間,而且計算復雜,但這是在PC機上完成的,與實時語音識別系統(tǒng)沒有關(guān)系。由于連續(xù)的隱馬爾可夫模型占用的存儲器大,且識別準確率高一些,但總體考慮還是離散的隱馬爾可夫模型更適合語音識別系統(tǒng)。由于采用離散的隱馬爾可夫模型,就需要將連續(xù)的特征矢量進行量化,其中包括碼字訓練和聚類分析技術(shù)。
SPCE061A提供了各種音頻編碼的算法及API函數(shù)庫,即SACM_LIB。該庫將A/D、編碼、解碼、存儲及D/A做成相應的模塊,每個模塊都有其應用程序接口API。了解每個模塊所要實現(xiàn)的功能及其參數(shù)的內(nèi)容,然后調(diào)用該API函數(shù)即可實現(xiàn)該功能。
SPCE061A作語音存儲和播放系統(tǒng),其原理框圖如圖6所示。
此外,本實用新型在應用軟件程序上的設(shè)計主要包括語音辨識、日期時間調(diào)整和計量、語音播放的功能方面。如下詳細說明一、語音辨識子程序語音辨識中先辨識觸發(fā)名稱,然后發(fā)出語音命令。語音分普通人語音辨識和特定人語音辨識。普通人語音辨識是根據(jù)不同年齡、不同性別、不同口音的人進行訓練,在識別時不需要訓練就可以識別人的語音。其程序框圖如圖7。
特定人語音識別是語音模板由單人訓練,對訓練人的語音命令識別準確率高,而其他人的語音命令識別的準確率較低或者不識別,在語音控制電子報時鐘中,訓練三條語音命令。
二、日期時間調(diào)整和計量程序按照模塊化設(shè)計,流程圖如圖8所示。
利用2Hz中斷作時鐘源進行計時,每兩次中斷秒加1,并進行年歷計算,年歷范圍為2001-2099年。在進行年歷計算時,有平閏年計算問題。閏年的條件是能被400整除,或者能被4整除,但不能被100整除。
三、語音播放語音控制電子報時鐘采用SACM_S480算法,它有完整的庫函數(shù)供程序調(diào)用。其相關(guān)API函數(shù)如下int SACM_S480_Initial(ing Init_Index)初始化void SACM_S480_ServiceLoop(void) 獲取語音資料,填入譯碼隊列void SACM_S480_Play(int Speech_Index,int Channel,int Ramp_Set) 播放void SACM_S480_Stop(void)停止播放void SACM_S480_Pause(void) 暫停播放void SACM_S480_Resume(void) 暫停后恢復void SACM_S480_Volume(void) 音量的控制
unsigned int SACM_S480_Status(void)獲取模塊的狀態(tài)Call_F_FIQ_Service_SACM_S480 中斷服務(wù)函數(shù)SACM_S480的數(shù)據(jù)率有4.8kps和7.2kps兩種,可在同一模塊的幾種算法中自動選擇一種。中斷服務(wù)子程序中FFIQ_Service_SACM_S480必須放在FIQ_TMA中斷向量上,允許TimerA以所選的數(shù)據(jù)采樣率(計數(shù)溢出)中斷。S480以自動播放方式,在中斷FIQ的FIQ_TMA中斷源中通過void SACM_S480_ServiceLoop()對語音數(shù)據(jù)進行解碼,然后將其送入DAC通道播放。
本實用新型語音控制電子報時鐘主要技術(shù)參數(shù)如表9所示。
本實用新型語音控制電子報時鐘使用方法如下按一次復位按鈕,語音控制電子報時鐘進入工作準備就緒狀態(tài)。
(1)日期時間調(diào)整日期時間調(diào)整見表10。按住功能選擇按鍵3秒鐘,進入日期時間調(diào)整狀態(tài),并伴有要調(diào)整信息的語音提示。語音控制電子報時鐘按照年、月、日、時、和分鐘順序調(diào)整日期和時間,各鍵按下一次即有效,改變相應信息。
(2)語音命令訓練調(diào)整完分鐘后再按一次功能選擇按鍵,語音提示調(diào)整好的日期和時間,并進入語音訓練。語音命令訓練具體內(nèi)容見表3,共訓練三條語音,每條語音訓練兩次,確認后進入下一條命令訓練。
第二條命令確認后,語音控制電子報時鐘用語音提示用戶訓練完畢,可以對用戶訓練的命令進行辨識,根據(jù)語音命令播報時間和日期。
(3)日期時間播報用戶在有效距離內(nèi)用語音發(fā)出命令“Snoopy”,語控電子鐘會響應命令播報“在”,用戶問“幾點”,電子鐘播報當前時間;用戶在有效距離內(nèi)用語音發(fā)出命令“Snoopy”,語控電子鐘會響應命令播報“在”,用戶問“幾號”,電子鐘播報當前日期。
以上所述,僅為本實用新型較佳的具體實施方式
,但本實用新型的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本實用新型披露的技術(shù)范圍內(nèi),根據(jù)本實用新型的技術(shù)方案及其實用新型構(gòu)思加以等同替換或改變,都應涵蓋在本實用新型的保護范圍之內(nèi)。
權(quán)利要求1.一種語音控制電子報時鐘,包括單片機系統(tǒng),以及分別與所述單片機系統(tǒng)連接的語音輸出模塊、鍵盤模塊、電源模塊;其特征在于,所述單片機系統(tǒng)通過語音通道連接語音輸入模塊;所述單片機系統(tǒng)為芯片型號SPCE061A的微處理器。
2.根據(jù)權(quán)利要求1所述語音控制電子報時鐘,其特征在于,所述單片機系統(tǒng)還連接有外存儲器模塊。
3.根據(jù)權(quán)利要求2所述語音控制電子報時鐘,其特征在于,所述外存儲器模塊為型號SPR1024A的閃存。
4.根據(jù)權(quán)利要求1-3任一要求所述語音控制電子報時鐘,所述單片機系統(tǒng)設(shè)置有程序下載端口。
專利摘要本實用新型公開了一種語音控制電子報時鐘,包括單片機系統(tǒng),以及分別與所述單片機系統(tǒng)連接的語音輸出模塊、鍵盤模塊、電源模塊;單片機系統(tǒng)通過語音通道連接語音輸入模塊;單片機系統(tǒng)為芯片型號SPCE061A的微處理器。本語音控制電子報時鐘改變了人們用眼看時間的方式,而是由聲音和聽力獲取時間信息;通過應用集成電路、程序控制走時,具有體積小、功能強、質(zhì)量穩(wěn)定計時精確、使用方便、電池供電,功耗小、新穎活潑、語音識別正確率高的特點。適用于智能化玩具的制造以及可以集成到特定功能的電子產(chǎn)品中。
文檔編號G04G13/00GK2867402SQ20052013689
公開日2007年2月7日 申請日期2005年12月8日 優(yōu)先權(quán)日2005年12月8日
發(fā)明者邵力耕 申請人:大連交通大學