專利名稱:一種無線智能家電語音控制系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及家電控制系統(tǒng)領域,特別是一種無線智能家電語音控制系統(tǒng)。
背景技術:
當前,家用電器的控制主要通過手工操作實現(xiàn),操作比較繁瑣,不利于行動不便的 人使用,在一些需要非手工出操作的場合也無法使用。同時,對家電的常規(guī)控制需要根據(jù)電 器的不同能類型,不同功能模塊進行單獨布線,容易造成安全隱患。單個家用電器作為單 獨的設備來說,其功能已經相當?shù)耐晟疲鳛榧译娬w來說卻缺乏智能的管理與控制,操 作比較繁瑣,難以科學管理。智能家電是將計算機技術、數(shù)字化技術以及信息技術應用于傳 統(tǒng)家電而產生的新一代家用電器。家電的智能化就是為了能夠更好的與家電進行交互,而 語音是最為方便、快捷、自然的人機交流手段,采用最為自然的語音作為人與家電交互的手 段,使家電能像人一樣,具有聽、說和理解的能力。 現(xiàn)有的智能家電控制系統(tǒng)中引入語音控制,增強了系統(tǒng)控制的靈活性。同時也提 出了使用無線通信控制家電的方案。如申請?zhí)枮?00810194811. 4的申請,就是把語音控制 與無線通信結合起來,使對家電的控制更加智能和方便。
但是現(xiàn)有技術存在著如下問題 1、現(xiàn)有技術單純利用無線通信控制家電,由于與現(xiàn)有家電設備不兼容,因此并不 適用于所有家電,需要對現(xiàn)有家電進行改造才能適應無線通信控制。 2、現(xiàn)有技術單純利用紅外線通信,由于紅外通信的范圍比較小,容易受物體阻隔, 導致適用范圍不廣,使用受限。 3、現(xiàn)有技術所采用的語音識別技術,采用事先錄制好的語音庫,對用戶發(fā)音的標 準性有一定的要求,導致在具體應用時語音識別率不高。
發(fā)明內容
本發(fā)明提供了一種無線智能家電語音控制系統(tǒng),以解決現(xiàn)有技術的不足。 本發(fā)明提供一種無線智能家電語音控制系統(tǒng),包括用于對用戶語音進行識別的語
音識別模塊和用于控制家電的通訊控制模塊,通訊控制模塊包括基于紅外線通信技術控制
家電的紅外控制模塊和采用無線通信技術與紅外控制模塊連接通信的無線控制模塊,語音
識別模塊與無線控制模塊直接連接。 作為優(yōu)選方案,語音識別模塊包括 預處理模塊,用于對語音信號進行預加重、加窗分幀和端點檢測; 特征值提取模塊,用于從原始語音信號中抽取能夠反映語音本質的特征參數(shù),形
成特征矢量序列; 識別模塊,用于根據(jù)特征值提取模塊提取的特征參數(shù),識別具體的語音命令;
語音識別模塊的輸入端與預處理模塊連接,預處理模塊,特征提取模塊與識別模 塊順序連接,識別模塊與語音識別模塊的輸出端連接。
作為進一步的優(yōu)選方案,識別模塊包括 參考數(shù)據(jù)庫訓練模塊,用于建立參考數(shù)據(jù)庫,所述數(shù)據(jù)庫是將一個或多個說話者 的多次重復的語音參數(shù)經過訓練得到的數(shù)據(jù)庫; 模式匹配模塊,用于將輸入的待識別的語音特征參數(shù)同訓練得到的參考語音模式 進行逐一比較分析,獲得最佳匹配的參考模式; 特征提取模塊與參考數(shù)據(jù)庫訓練模塊以及模式匹配模塊分別連接,模式匹配模塊 與語音識別模塊的輸出端連接。 作為更進一步的優(yōu)選方案,特征值提取模塊采用線性預測倒譜系數(shù)作為特征參 數(shù)。 作為再進一步的優(yōu)選方案,模式匹配模塊采用的算法為動態(tài)時間規(guī)則、離散隱馬 爾可夫模型、連續(xù)隱馬爾可夫模型或人工神經網算法。 作為另一種優(yōu)選方案,本發(fā)明提供的無線智能家電語音控制系統(tǒng)中,紅外控制模 塊包括 家電識別模塊,用于識別用戶命令需要控制的家電;
主功能模塊,用于向對應的家電發(fā)送相應的功能命令; 當紅外控制模塊收到用戶命令后,先調用家電識別模塊識別需要控制的家電,然 后根據(jù)用戶命令調用主功能模塊中的相應命令。 作為一種優(yōu)選方案,主功能模塊還包括擴展功能模塊,用于進行按鍵學習訓練,記
錄按鍵操作并把操作的功能命令儲存在對應的功能地址中。 與現(xiàn)有技術相比,本發(fā)明有益效果體現(xiàn)在 1、提出了將紅外線通信技術和無線電通信技術結合起來,組成智能家電控制網, 有效地解決了單純利用無線通信與現(xiàn)有家電設備不兼容以及單純利用紅外線通信所受限 制的問題。 2、本發(fā)明提出了采用動態(tài)的方式來建立語音庫,并以用戶的語音信號作為標準模 式,以此來適應不同的人群和提高特定語音命令的識別率。
3、操作簡單,易于使用。 4、擴展性較好,系統(tǒng)控制的節(jié)點個數(shù)可以根據(jù)需要進行變更,控制的設備可擴展 為各種電子設備。 5、提出了在硬件成本較低廉的情況下,利用SCM構筑一個學習型萬能紅外遙控器 的設計思路。
圖1為本發(fā)明的系統(tǒng)基本組成框圖。 圖中所示為使用者控制端的各個模塊的基本組成,包括mic輸入電路、外部存儲
器、供電模塊、2*4鍵盤模塊、聲音輸出模塊、LCD顯示模塊、無線控制模塊。 圖2為本發(fā)明的語音識別原理框圖。圖中所示為語音識別的流程圖,其過程為預
處理,特征處理,模式匹配,輸出識別結果。 圖3為本發(fā)明的無線傳輸模塊的流程圖。 圖中所示為無線信號傳輸?shù)陌l(fā)送接收流程。
4
圖4為本發(fā)明的系統(tǒng)工作流程。圖中所示為系統(tǒng)操作的流程,其過程為喚醒,系統(tǒng) 應答,組內命令識別,進入設備控制的子程序。 圖5為本發(fā)明的按鍵功能圖示。圖中所示為使用者控制端的各個按鍵功能圖示。
圖6為本發(fā)明的紅外通信流程圖。圖中所示為空外通信流程,其過程為獲取家電 ID與命令ID,從對應地址取出代碼格式和控制格式,發(fā)送起始碼,發(fā)送控制信息。圖7為本發(fā)明分組命令語音識別程序程序流程的第(1)部分。圖8為本發(fā)明分組命令語音識別程序程序流程的第(2)部分。圖9為本發(fā)明分類命令語音訓練程序流程。圖10為本發(fā)明語音訓練子程序程序流程的第(1)部分。圖11為本發(fā)明語音訓練子程序程序流程的第(2)部分。圖12為本發(fā)明紅外學習總流程圖。圖13為本發(fā)明紅外接收信息流程14為本發(fā)明紅外信息處理流程圖。圖15為本發(fā)明的HT6221的位定義時序。圖16為本發(fā)明的HT6221的單發(fā)代碼時序。圖17為本發(fā)明的HT6221的連發(fā)代碼時序。圖18為本發(fā)明的PD6121G的位定義時序。圖19為本發(fā)明的PD6121G的單發(fā)代碼時序。圖20為本發(fā)明的PD6121G的連發(fā)代碼時序。圖21為本發(fā)明的TC9012F/9243的位定義時序。圖22為本發(fā)明的TC9012F/9243的單發(fā)代碼時序。圖23為本發(fā)明的TC9012F/9243的連發(fā)代碼時序。圖24為本發(fā)明的使用的HS0038B的內部結構。圖25為本發(fā)明的紅外發(fā)射電路。圖26為本發(fā)明的紅外發(fā)射接收流程圖。圖中(a)所示為紅外接收流程,(b)所示
為紅外接收流程。
圖27為本發(fā)明的PTR8000讀寫時序。圖28為本發(fā)明的PTR8000硬件接口 。圖29為本發(fā)明的PTR8000的發(fā)射時序圖。圖30為本發(fā)明的PTR8000的接收時序圖。
具體實施例方式以下通過具體實施方式
,結合附圖對本發(fā)明作進一步說明。 參見圖l,本實施例采用凌陽單片機SPCE061A實現(xiàn),系統(tǒng)包括語音識別模塊及通 訊控制模塊 語音識別模塊包括麥克風和語音識別程序、放音電路,其中
麥克風主控MCU相連,用于實現(xiàn)對語音數(shù)據(jù)的采集; 語音識別程序通過對使用者的語音識別,實現(xiàn)對使用控制命令的識別并將命令識 別結果輸出;
放音電路的主要作用是對使用這的操作進行聲音信息提示。 通訊控制模塊包括基于紅外線通信技術控制家電的紅外控制模塊、采用無線通信
技術與紅外控制模塊連接通信的無線控制模塊、鍵盤和LCD顯示模塊,其中 紅外控制模塊的主要作用是將經過MCU編碼后的使用者的控制指令發(fā)送到設備
丄山
順; 無線控制模塊的作用是將經過MCU編碼后的使用者的控制指令發(fā)送到中轉控制
MCU,目的是延長控制距離; 本實施例共設計了 8個鍵盤。 —個為TRAIN,用于語音訓練,當按下該鍵后,即進入語音訓練程序;
有3個用于菜單功能控制,分別是ENTER、 UP、 D0WN,當按下ENTER鍵后,會執(zhí)行該 菜單項目上所顯示的功能或跳到該菜單項目的子菜單界面,UP和DOWN則是向上或向下移 動來選擇菜單的項目; 另外4個鍵盤作為擴展按鍵,在系統(tǒng)軟件升級或硬件有更新時,可以適當?shù)脑黾?新的按鍵功能。 這8個鍵分別接到單片機的I0A8到I0A15,系統(tǒng)運行時,先將I0A8到I0A15 口設 置成帶有下拉電阻的輸入口 , I/O初始化后由鍵盤掃描程序發(fā)現(xiàn)按下鍵,再調用去抖動子程 序來確認,然后更改按鍵值來決定程序的運行。 LCD顯示模塊是給使用者提供一個更加友好的提示界面,用于顯示各個設備的工 作狀態(tài)。LCD顯示模塊主要是凌陽的SPLC501模組來構成的。 使用SPLC501模組來做顯示界面,主要是SPLC501有配套的字模生成工具,可以很 方便的文字和圖象顯示。由于SPLC501液晶模組為128*64點陣,以16*16點陣字模顯示的 話,可以滿屏顯示32個文字。對于家電常用功能的提示來說,SPLC501已經可以提供能夠 的文字來提示用戶的操作。 SPLC501有8個數(shù)據(jù)端口 DB0 DB7 ,有5個控制端口分別為EP (時鐘使能端)、R/ W(讀/寫信號端)、A0 (數(shù)據(jù)命令選擇端)、RES (復位端)和CS1 (片選端)。數(shù)據(jù)端口連接 到SPCE061A的10A0 I0A7 口 ,用來接收文字的點陣信息,EP、 R/W、 AO和RES按順序連接到 10B4 I0B7上,接收各種控制信息,而CS1直接接地就可以了。 無線控制模塊采用PTR8000,其主要工作就是充當中繼站的角色,把系統(tǒng)的控制信 息包含在無線的發(fā)射數(shù)據(jù)中在傳送到控制端,控制端剝去無線通信數(shù)據(jù)的格式信息后就是 系統(tǒng)所發(fā)射的控制信息,這時控制端只要通過紅外發(fā)射電路把控制信息發(fā)射出去就可以控 制相應的家電。如圖27所示為PTR8000讀寫時序,圖28為PTR8000的硬件接口,圖29 圖30為PTR8000的發(fā)射時序圖和接收時序圖。 具體實施中,全向式麥克風將語音信號送到MCU, MCU通過語音識別程序對該語音 進行識別,識別的結果通過PTR8000向中轉MCU發(fā)送該指令。中轉MCU接收到該令后進行 信息轉換,把不同的命令代碼通過紅外發(fā)送至相應的子節(jié)點來實現(xiàn)對家電的控制,近而實 現(xiàn)智能聲控家庭設備的要求。其中中轉MCU端主要負責接收命令字符,將從PTR8000接受 到的命令轉換為紅外信號,并轉發(fā)給各個設備。當有語音命令時,使用者端的用戶端MCU將 控制命令通過PTR8000傳遞給中轉MCU,中轉MCU根據(jù)要求將命令發(fā)送給相應的子節(jié)點;子 節(jié)點則根據(jù)接收到的命令來控制相應的電器。語音識別模塊對麥克風所采集到的語音信號進行識別,它包含了前段放大與濾波單元、AGC、 A/D ;語音識別模塊的主要任務是識別用戶 語音命令,并將識別結果反饋到中轉MCU。 具體實施中,全向式麥克風將語音信號送到用戶端MCU,用戶端MCU通過語音識別 程序對該語音進行識別,識別的結果通過PTR8000向中轉MCU發(fā)送該指令。中轉MCU接收 到該令后進行信息轉換,把不同的命令代碼通過紅外發(fā)送至相應的子節(jié)點來實現(xiàn)對家電的 控制,近而實現(xiàn)智能聲控家庭設備的要求。其中中轉MCU端主要負責接收命令字符,將從 PTR8000接受到的命令轉換為紅外信號,并轉發(fā)給各個設備。當有語音命令時,用戶端MCU 將控制命令通過PTR8000傳遞給中轉MCU,中轉MCU根據(jù)要求將命令發(fā)送給相應的子節(jié)點; 子節(jié)點則根據(jù)接收到的命令來控制相應的電器。語音識別模塊對麥克風所采集到的語音信 號進行識別,它包含了前段放大與濾波單元、AGC、 A/D ;語音識別模塊的主要任務是識別用 戶語音命令,并將識別結果反饋到用戶端MCU。 參見圖2,本實施例中的語音識別部分主要由三部分構成,包括預處理、特征值提
取與識別。 (1)預處理 包括預加重、加窗分幀、端點檢測等處理過程,在預處理之前還有語音信號的數(shù)字 化處理過程,其中包括反混疊濾波、模/數(shù)轉換、自動增益等用以去除聲門激勵、口鼻輻射、 高于112采樣率高頻和噪聲信號的影響,實現(xiàn)語音信號的數(shù)字化。
(2)特征提取 經過預處理后的語音信號,要對其進行特征提取,即特征參數(shù)分析.該過程就是 從原始語音信號中抽取能夠反映語音本質的特征參數(shù),形成特征矢量序列。目前語音識別 所用的特征參數(shù)主要有兩種類型線性預測倒譜系數(shù)(LPCC)和美爾頻標倒譜系數(shù)(MFCC). LPCC系數(shù)主要模擬人的發(fā)聲模型,未考慮人耳的聽覺特性。它對元音有較好的描述能力, 而對輔音描述能力差。其優(yōu)點為計算量小,比較徹底地去掉了語音產生過程中的激勵信息, 易于實現(xiàn)。MFCC系數(shù)考慮到了人聽覺特性,并具有很高的魯棒性和抗噪聲能力,但因為提 取MFCC參數(shù)要在頻域處理,計算傅立葉變換將耗費大量寶貴的計算資源。因此,嵌入式語 音識別系統(tǒng)中一般都選用LPCC系數(shù)。語音特征提取是分幀提取的,每幀特征參數(shù)一般構成 一個矢量,因此,語音特征是一個矢量序列。該序列的數(shù)據(jù)率一般可能太高,不便于其后的 進一步處理,為此,有必要采用很有效的數(shù)據(jù)壓縮技術方法對數(shù)據(jù)進行壓縮。矢量量化就是 一種很好的數(shù)據(jù)壓縮技術。(該部分僅僅描述了現(xiàn)有技術的優(yōu)缺點,但沒有提到本發(fā)明實現(xiàn) 特征提取的方法,請發(fā)明人補充)
(3)識別 識別用于根據(jù)特征值提取模塊提取的特征參數(shù),識別具體的語音命令,主要包 括 a)參考模式庫 參考模式庫是將一個或多個說話者的多次重復的語音參數(shù)經過訓練得到的。它是 聲學參數(shù)模板。建立參考模式庫是在系統(tǒng)使用前獲得并存貯起來的.參考模式庫的建立的 過程稱為訓練過程。
b)模式匹配 模式匹配是將輸入的待識別的語音特征參數(shù)同訓練得到的參考語音模式進行逐一比較分析。獲得最佳匹配的參考模式便為識別結果。目前常用的語音識別算法主要有 動態(tài)時間規(guī)則、離散隱馬爾可夫模型、連續(xù)隱馬爾可夫模型、人工神經網。 系統(tǒng)開始識別由語音觸發(fā)而不需要鍵盤的確定,觸發(fā)的語音命令即為系統(tǒng)的名 字。在給系統(tǒng)起名字時應注意避免誤觸發(fā)的問題,名字盡量使用冷僻詞。 一但系統(tǒng)識別出 發(fā)令人呼喊其名字,系統(tǒng)立即被激活,進入工作狀態(tài),系統(tǒng)就會調用SPLC501的顯示函數(shù), 顯示系統(tǒng)激活后的主菜單,菜單上面的條目都是等待調用的命令,發(fā)令人只要照著菜單上 的提示進行命令控制就行了 , LCD會自動顯示和命令一一對應的菜單提示,所以發(fā)令人能夠 很自然按菜單條目進入各組命令,并不需要背下數(shù)十條命令語句,也不必學習復雜的按鍵 操作,只是按照系統(tǒng)的文字界面提示發(fā)出下一個命令,這種利用聲音命令做為控制信號的 方法,可以極大簡化系統(tǒng)的操作。 完成語音識別這個任務的主要函數(shù)的任務是進行語音識別并返回語音識別結果。 使用到的語音庫中相關的API函數(shù)如下 完成分組命令的語音識別軟件實現(xiàn)過程為例介紹它的程序流程如圖7和圖8所 示 這里只介紹了分組命令的程序流程圖,其各組內識別命令的流程幾乎一樣,只是 識別時語音模塊放在RAM中,識別不同組命令時從外擴Flash存貯器中往RAM中寫入各組 命令時的地址有所不同。 參見圖3,無線通信應用讓系統(tǒng)的控制范圍得到很大程度的擴展,對控制整個家居 的所有電器來說是必要的。無線通信的主要工作就是充當中繼站的角色,把系統(tǒng)的控制信 息包含在無線的發(fā)射數(shù)據(jù)中在傳送到控制端,控制端剝去無線通信數(shù)據(jù)的格式信息后就是 系統(tǒng)所發(fā)射的控制信息,這時控制端只要通過紅外發(fā)射電路把控制信息發(fā)射出去就可以控 制相應的家電。 參見圖4與圖5,本發(fā)明主要實現(xiàn)的是語音識別控制、LCD顯示、語音提示、遙控通 信等功能。整個設計的重點是利用凌陽單片機SPCE061A實現(xiàn)一個無線的語音家電控制系 統(tǒng)。軟件程序按照功能模塊進行分文件編寫,且按照結構化程序設計,所有功能都可通過調 用子程序完成。工作過程系統(tǒng)的功能框圖。 為實現(xiàn)利用凌陽所提供的API函數(shù)來識別多個命令,必須對命令進行分組嵌套。 本系統(tǒng)將命令分成家電選擇、主功能和擴展功能3組命令。當識別到系統(tǒng)名字時,就會激 活系統(tǒng),這時系統(tǒng)就會進入家電選擇模式,識別能夠識別到四個命令,只要識別出家電的名 字,則將存在Flash中那個組的語音模型讀出寫入RAM中然后重新進行識別初始化,等待識 別用戶的進一步命令。 語音模型說明如下語音模型就是記過多次訓練后的語音指令樣本,直接存貯在 芯片中的RAM中。具體訓練過程如下采用的是特定人的語音識別,在使用之前要對特定人 進行語音命令的采集,然后對系統(tǒng)進行訓練,獲得特定人語音命令的模板。語音訓練的功能 主要是通過調用API函數(shù)來實現(xiàn),每次對于特定人的識別能同時識別五個命令,總共有三 組,對這三組命令進行語音訓練的程序流程圖如圖9所示
訓練子程序的流程圖如圖10 圖11所示 每一組命令中又有若干條語音必須進行訓練,訓練的過程都相同。需要注意的是, 每次訓練完后要將完成的語音模型存到外擴存貯的不同地址處。系統(tǒng)的訓練由訓練標志和鍵盤確定,當系統(tǒng)第一次使用時,訓練標志為"0",系統(tǒng)默認開機時就自動調用語音訓練模 塊完成訓練任務,如果系統(tǒng)不是第一次使用,即選連標志為"1",當掃描鍵盤的程序確定訓 練鍵按下后,主程序就調用語音訓練模塊完成訓練任務。雖然訓練的命令有數(shù)十條,但由于 訓練時有語音提示,所以大大降低了系統(tǒng)訓練的難度。 在語音訓練當中,每次對于特定人的識別能同時識別五個命令,總共有三組,這三 組都稱為組命令。
具體過程結合圖3詳述如下
1)系統(tǒng)處于模式A,等待用戶命令; 2)系統(tǒng)通過語音識別模塊識別到用戶命令,當識別到系統(tǒng)名字時,則激活系統(tǒng),進 入家電選擇模式,系統(tǒng)處于模式B ; 3)在模式B中,如果識別出用戶命令為"關機",退出家電選擇模式,系統(tǒng)跳轉到模 式A 4)在模式B中,如果識別出用戶命令中的家電名字,則將存在Flash中那個組的語 音模型讀出寫入RAM中,然后重新進行識別初始化,并對家電標識,系統(tǒng)處于模式C ;
5)在模式C中,如果識別出用戶命令為"開啟",則從對應的內存地址中取出開啟 家電的遙控代碼并發(fā)送,系統(tǒng)仍然處于模式C ; 6)在模式C中,如果識別出用戶命令為"關閉",則從對應的內存地址中取出關閉 家電的遙控代碼并發(fā)送,系統(tǒng)仍然處于模式C ; 7)在模式C中,如果識別出用戶命令為"自定義功能",則識別具體的自定義功能,
從對應的內存地址中取出對應的家電自定義功能并發(fā)送,系統(tǒng)仍然處于模式C; 8)在模式C中,如果識別出用戶命令為"返回",則系統(tǒng)跳轉到模式B ; 9)在模式C中,如果識別出用戶命令為"學習",則系統(tǒng)跳轉到模式D ; 10)在模式D中,識別用戶命令并記錄對應的按鍵操作,學習對應的按鍵功能,并
儲存在對應的地址; 如圖5所示,本系統(tǒng)對命令進行分組嵌套。將命令分成家電選擇、主功能和擴展功 能3組命令。當識別到系統(tǒng)名字時,就會激活系統(tǒng),這時系統(tǒng)就會進入家電選擇模式,識別 能夠識別到四個命令,只要識別出家電的名字,則將存在Flash中那個組的語音模型讀出 寫入RAM中,然后重新進行識別初始化,等待識別用戶的進一步命令。這里的"學習其功能 "不是記錄該次操作所使用的按鍵,而是某個控制對象(家電)的相關功能,比如開、關等功 能。 11)在模式D中,識別到用戶命令為"關閉",則系統(tǒng)返回模式C。
參見圖6與圖7,紅外學習是系統(tǒng)實現(xiàn)對家電控制一個重要的前提,所以紅外接收 電路能否正確接收遙控器發(fā)射出來的遙控代碼就是關鍵地方。系統(tǒng)接收學習紅外代碼的 工作過程大致是在學習階段不斷檢測紅外遙控的IN管腳,由于在沒有接收到紅外信息時 其IN管腳是長期置高的,所以當IN管腳開始有電平變化時,就打開4096Hz時基中斷,即 0. 244ms就采樣一次紅外電路的IN管腳的信息。當在采樣過程檢測到有電平變化,就把兩 次變化的時間差(即電平寬度)存儲起來,當多次采樣都沒有發(fā)現(xiàn)IN管腳再有電平變化, 就判斷為紅外信息已經接收完畢。 系統(tǒng)接收學習紅外代碼的工作過程大致是在學習階段不斷檢測紅外遙控的IN管腳,由于在沒有接收到紅外信息時其IN管腳是長期置高的,所以當IN管腳開始有電平變化 時,就打開4096Hz時基中斷,即0. 244ms就采樣一次紅外電路的IN管腳的信息。當在采樣 過程檢測到有電平變化,就把兩次變化的時間差(即電平寬度)存儲起來,當多次采樣都沒 有發(fā)現(xiàn)IN管腳再有電平變化,就判斷為紅外信息已經接收完畢。
圖12 圖14就是系統(tǒng)紅外學習的整個程序流程。 如圖25所示為紅外發(fā)射電路原理圖,紅外遙控編碼信號利用單片機進行串行編 碼輸出。紅外編碼信號和38KHz脈沖信號經與門輸出得到調制信號,然后將已調制信號放 大,驅動紅外發(fā)光二極管。 如圖26所示為本發(fā)明的紅外發(fā)射接收流程圖。由于紅外學習是對學習的代碼進 行了格式化處理,并且把處理后的代碼信息都進行統(tǒng)一的存儲。因為紅外學習過程已經對 信息進行規(guī)范化的管理,所以紅外發(fā)射實現(xiàn)家電某項功能時,只需要根據(jù)家電的標識號和 命令的ID號就能從相應的地址取出數(shù)據(jù),遙控控制家電。 普通的遙控器用32位二進制數(shù)據(jù)就可滿足其控制要求,其信息量不大。目前紅外
遙控器的通信協(xié)議有很多種,遙控器信號的編碼大都由起始碼,客戶碼,數(shù)據(jù)碼組成,其信
息0和信息1 一般是根據(jù)高低電平所占用的時間長度來區(qū)別的。圖15 圖23為本實施例
所用紅外遙控編碼時序HT6221、PD6121G和TC9012F/9243 : (1)HT6221遙控時序 ①位定義(如圖15所示); ②單發(fā)代碼格式(如圖16所示); ③連發(fā)代碼格式(如圖17所示)。 (2)PD6121G遙控時序 ①位定義(如圖18所示); ②單發(fā)代碼格式(如圖19所示); (3)TC9012F/9243遙控時序 ①位定義(如圖21所示);②單發(fā)代碼格式(如圖22所示);③連發(fā)代碼格式(如圖23所示)。
權利要求
一種無線智能家電語音控制系統(tǒng),包括用于對用戶語音進行識別的語音識別模塊和用于控制家電的通訊控制模塊,其特征在于,所述的通訊控制模塊包括基于紅外線通信技術控制家電的紅外控制模塊和采用無線通信技術與紅外控制模塊連接通信的無線控制模塊,語音識別模塊與無線控制模塊直接連接。
2. 根據(jù)權利要求1所述的無線智能家電語音控制系統(tǒng),其特征在于,所述語音識別模塊包括預處理模塊,用于對語音信號進行預加重、加窗分幀和端點檢測;特征值提取模塊,用于從原始語音信號中抽取能夠反映語音本質的特征參數(shù),形成特征矢量序列;識別模塊,用于根據(jù)特征值提取模塊提取的特征參數(shù),識別具體的語音命令;語音識別模塊的輸入端與預處理模塊連接,預處理模塊,特征提取模塊與識別模塊順序連接,識別模塊與語音識別模塊的輸出端連接。
3. 根據(jù)權利要求2所述的無線智能家電語音控制系統(tǒng),其特征在于,所述的識別模塊包括參考數(shù)據(jù)庫訓練模塊,用于建立參考數(shù)據(jù)庫,所述數(shù)據(jù)庫是將一個或多個說話者的多次重復的語音參數(shù)經過訓練得到的數(shù)據(jù)庫;模式匹配模塊,用于將輸入的待識別的語音特征參數(shù)同訓練得到的參考語音模式進行逐一比較分析,獲得最佳匹配的參考模式;特征提取模塊與參考數(shù)據(jù)庫訓練模塊以及模式匹配模塊分別連接,模式匹配模塊與語音識別模塊的輸出端連接。
4. 根據(jù)權利要求2所述的無線智能家電語音控制系統(tǒng),其特征在于,所述特征值提取模塊采用線性預測倒譜系數(shù)作為特征參數(shù)。
5. 根據(jù)權利要求2所述的無線智能家電語音控制系統(tǒng),其特征在于,所述模式匹配模塊采用的算法為動態(tài)時間規(guī)則、離散隱馬爾可夫模型、連續(xù)隱馬爾可夫模型或人工神經網算法。
6. 根據(jù)權利要求1所述的無線智能家電語音控制系統(tǒng),其特征在于,所述紅外控制模塊包括家電識別模塊,用于識別用戶命令需要控制的家電;主功能模塊,用于向對應的家電發(fā)送相應的功能命令;當紅外控制模塊收到用戶命令后,先調用家電識別模塊識別需要控制的家電,然后根據(jù)用戶命令調用主功能模塊中的相應命令。
7. 根據(jù)權利要求6所述的無線智能家電語音控制系統(tǒng),其特征在于,所述主功能模塊還包括擴展功能模塊,用于進行按鍵學習訓練,記錄按鍵操作并把操作的功能命令儲存在對應的功能地址中。
全文摘要
本發(fā)明涉及家電控制系統(tǒng)領域,特別是一種無線智能家電語音控制系統(tǒng)。本發(fā)明提供一種無線智能家電語音控制系統(tǒng),包括用于對用戶語音進行識別的語音識別模塊和用于控制家電的通訊控制模塊,通訊控制模塊包括基于紅外線通信技術控制家電的紅外控制模塊和采用無線通信技術與紅外控制模塊連接通信的無線控制模塊,語音識別模塊與無線控制模塊直接連接。本發(fā)明提出了將紅外線通信技術和無線電通信技術結合起來,組成智能家電控制網,有效地解決了單純利用無線通信與現(xiàn)有家電設備不兼容以及單純利用紅外線通信所受限制的問題。同時,本發(fā)明提出了采用動態(tài)的方式來建立語音庫,以此來適應不同的人群和提高特定語音命令的識別率。
文檔編號G10L15/14GK101794126SQ20091021385
公開日2010年8月4日 申請日期2009年12月15日 優(yōu)先權日2009年12月15日
發(fā)明者曾碧, 李楊, 謝光強 申請人:廣東工業(yè)大學