專利名稱:語(yǔ)譜圖互相關(guān)的駕駛員漢語(yǔ)語(yǔ)音控制系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本實(shí)用新型涉及一種應(yīng)用于機(jī)動(dòng)車輛上的駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置和方法,更具體地說(shuō),本實(shí)用新型涉及一種語(yǔ)譜圖互相關(guān)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)。
背景技術(shù):
隨著汽車在我國(guó)的普及和汽車技術(shù)的不斷進(jìn)步,人們對(duì)于車輛的認(rèn)識(shí)和要求不再局限于簡(jiǎn)單的交通工具,而是更多著眼于其舒適性、安全性和其多種多樣的便捷的智能功能。車內(nèi)語(yǔ)音識(shí)別與控制技術(shù)是智能汽車的重要核心技術(shù)之一,可被應(yīng)用在汽車上實(shí)現(xiàn)智能操作,通過(guò)識(shí)別駕駛者的發(fā)音,由語(yǔ)音命令代替手動(dòng)對(duì)一些汽車車載電子設(shè)備進(jìn)行語(yǔ)音控制,將駕駛員的手部操作盡量降低,減少駕駛員注意力的分散,有利于提高行車的安全性和便捷性。目前已有一些應(yīng)用于車內(nèi)環(huán)境下的語(yǔ)音識(shí)別控制系統(tǒng)可見(jiàn)報(bào)導(dǎo),但分析可查詢的汽車車載語(yǔ)音識(shí)別控制問(wèn)題研究報(bào)道特別是國(guó)內(nèi)可見(jiàn)文獻(xiàn)存在以下問(wèn)題1.所涉及的多為非漢語(yǔ)語(yǔ)音識(shí)別領(lǐng)域新方法、新技術(shù)向汽車環(huán)境的簡(jiǎn)單移植和使用,對(duì)于與英語(yǔ)等語(yǔ)言有著顯著差異的漢語(yǔ)指令特點(diǎn)未給予足夠的重視和應(yīng)用;2.多是非特定人識(shí)別控制系統(tǒng),對(duì)指令發(fā)出人沒(méi)有限制,實(shí)際工作中極易干擾駕駛員駕駛,不利于行車安全。3.成員間語(yǔ)言交流中與語(yǔ)音識(shí)別控制系統(tǒng)指令庫(kù)中指令重合發(fā)生概率較大,易引起系統(tǒng)誤操作。4.語(yǔ)音識(shí)別算法以單音素或單音節(jié)為單位,取10-20ms長(zhǎng)的語(yǔ)音幀,逐幀處理,較大的運(yùn)算量使處理速度的提高變得較為困難,且識(shí)別系統(tǒng)的泛化程度較難控制。5.前人雖有唇語(yǔ)識(shí)別技術(shù)使用,但多是用唇語(yǔ)識(shí)別輔助語(yǔ)音識(shí)別,主要目的在于提高識(shí)別率,且由此引起運(yùn)算量大、運(yùn)算時(shí)間長(zhǎng)等問(wèn)題。
發(fā)明內(nèi)容本實(shí)用新型所要解決的技術(shù)問(wèn)題是克服現(xiàn)有車內(nèi)語(yǔ)音識(shí)別控制方法存在的未本土化、指令發(fā)出者無(wú)限制和指令誤讀誤操的作問(wèn)題,提供了一種語(yǔ)譜圖互相關(guān)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)。為解決上述技術(shù)問(wèn)題,本實(shí)用新型是采用如下技術(shù)方案實(shí)現(xiàn)的所述的語(yǔ)譜圖互相關(guān)的駕駛員漢語(yǔ)語(yǔ)音控制系統(tǒng)由專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置、硅麥克風(fēng)、紅外線CCD攝像頭和汽車車載電子設(shè)備組成。所述的專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置由型號(hào)為TMS320C6410的DSP芯片、型號(hào)為 SAA7111H的視頻AD模塊芯片、型號(hào)為AL422B的同步FIFO芯片、型號(hào)為TLV320AIC23的語(yǔ)音編解碼芯片、型號(hào)為XC9536XLVQ44的CPLD芯片、1號(hào)繼電器及2號(hào)繼電器組成。硅麥克風(fēng)的輸出端與型號(hào)為TLV320AIC23的語(yǔ)音編解碼芯片的DIN引腳電連接,
3型號(hào)為TLV320AIC23的語(yǔ)音編解碼芯片的DOUT引腳與型號(hào)為TMS320C6410的DSP芯片的多通道緩沖串口及I2C總線電連接,紅外線CXD攝像頭的輸出端與型號(hào)為SAA7111H的視頻AD模塊芯片的CVBS引腳電連接,型號(hào)為SAA7111H的視頻AD模塊芯片的VP00-7輸出引腳與型號(hào)為AL422B的同步FIFO芯片的DI0-7輸入引腳電連接,型號(hào)為AL422B的同步 FIFO芯片的D00-7輸出引腳與型號(hào)為TMS320C6410的DSP芯片的FIFO接口電連接,型號(hào)為 XC9536XLVQ44的CPLD芯片和型號(hào)為SAA7111H的視頻AD模塊芯片、型號(hào)為AL422B的同步 FIFO芯片與型號(hào)為TMS320C6410的DSP芯片的通用IO引腳電連接。型號(hào)為TMS320C6410 的DSP芯片的GPO引腳與1號(hào)繼電器的輸入端電連接,型號(hào)為TMS320C6410的DSP芯片的GP0[3]引腳與2號(hào)繼電器的輸入端電連接,1號(hào)繼電器與2號(hào)繼電器的輸出端分別和汽車車載電子設(shè)備電線連接。技術(shù)方案中所述的汽車車載電子設(shè)備包括空調(diào)和后備箱鎖。空調(diào)的接線端與2號(hào)繼電器的輸出端電線連接,后備箱鎖的接線端與1號(hào)繼電器的輸出端電線連接。與現(xiàn)有技術(shù)相比本實(shí)用新型的有益效果是1.本實(shí)用新型提出了一種駕駛員專用的語(yǔ)譜圖互相關(guān)車內(nèi)漢語(yǔ)語(yǔ)音識(shí)別控制方法,并構(gòu)建了車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng),通過(guò)識(shí)別駕駛者的發(fā)音,由語(yǔ)音指令代替駕駛員手部動(dòng)作控制汽車車載電子設(shè)備,降低駕駛員非駕駛性操作,減少其注意力分散,有利于提高行車的安全性和便捷性。2.本實(shí)用新型采用CCD攝像頭采集圖像判斷駕駛員口唇部有無(wú)動(dòng)作,作為專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置的開關(guān),實(shí)現(xiàn)系統(tǒng)的駕駛員專用性,有利于行車安全。保證系統(tǒng)一定識(shí)別率的同時(shí),提高系統(tǒng)的識(shí)別速度。且采用可晝夜工作的紅外線,幫助系統(tǒng)實(shí)現(xiàn)全天候功能。3.本實(shí)用新型根據(jù)漢語(yǔ)語(yǔ)言特點(diǎn),建立車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)的語(yǔ)音指令庫(kù),規(guī)定“打開”和“關(guān)閉”為語(yǔ)音指令關(guān)鍵詞。鑒于同一語(yǔ)音指令內(nèi)容,同一指令發(fā)出者重復(fù)發(fā)出,其語(yǔ)譜圖形狀非常相似;不同指令發(fā)出者發(fā)出,相互語(yǔ)譜圖形狀差異較自身差異顯著。提出語(yǔ)音指令的階段識(shí)別,即第一階段利用語(yǔ)音指令的語(yǔ)譜圖,應(yīng)用圖像互相關(guān)方法對(duì)照關(guān)鍵詞語(yǔ)譜圖模板,監(jiān)測(cè)車內(nèi)有無(wú)語(yǔ)音指令關(guān)鍵詞發(fā)出;第二階段利用語(yǔ)音指令的語(yǔ)譜圖,利用圖像互相關(guān)方法識(shí)別指令中的執(zhí)行器,提高識(shí)別速度和效率的同時(shí),有利于識(shí)別率的提升。4.本實(shí)用新型設(shè)計(jì)并使用了基于語(yǔ)譜圖互相關(guān)技術(shù)的語(yǔ)音識(shí)別算法,無(wú)需端點(diǎn)檢測(cè)環(huán)節(jié),且以指令語(yǔ)句為單位對(duì)語(yǔ)譜圖進(jìn)行詞匯分析,處理速度快。5.本實(shí)用新型綜合了聲學(xué)、信號(hào)處理、自適應(yīng)控制和車輛工程等多個(gè)領(lǐng)域的學(xué)科知識(shí),是上述各學(xué)科領(lǐng)域知識(shí)的交叉應(yīng)用。對(duì)車內(nèi)噪聲對(duì)語(yǔ)音識(shí)別的影響問(wèn)題予以了充分考慮,能夠在車輛行駛工況變化時(shí)自適應(yīng)調(diào)整對(duì)噪聲的抑制程度。整個(gè)噪聲抑制過(guò)程是自適應(yīng)完成的,無(wú)需手動(dòng)的外加干預(yù)。6.本實(shí)用新型以駕駛員本人特定發(fā)音詞匯的語(yǔ)譜圖為語(yǔ)音識(shí)別模板,屬于特定人特定詞匯語(yǔ)音識(shí)別,所以,系統(tǒng)兼具語(yǔ)音鎖功能。
以下結(jié)合附圖對(duì)本實(shí)用新型作進(jìn)一步的說(shuō)明[0022]
圖1為表述本實(shí)用新型所述的語(yǔ)譜圖互相關(guān)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)的結(jié)構(gòu)原理示意框圖;圖2是采用本實(shí)用新型所述的語(yǔ)譜圖互相關(guān)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)布置在某車型上的一個(gè)實(shí)施實(shí)例的結(jié)構(gòu)原理示意框圖;圖3是采用本實(shí)用新型所述的語(yǔ)譜圖互相關(guān)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)控制車載電子設(shè)備方法的流程框圖;圖4是采用本實(shí)用新型所述的駕駛員唇語(yǔ)開關(guān)單元的檢測(cè)方法的流程框圖;圖中1.專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置,la.專用漢語(yǔ)語(yǔ)音識(shí)別控制單元,lb.駕駛員唇語(yǔ)開關(guān)單元,2.硅麥克風(fēng),3.紅外線C⑶攝像頭,4.汽車車載電子設(shè)備,4a.空調(diào), 4b.后備箱鎖,11. DSP芯片,12.視頻AD模塊芯片,13.同步FIFO芯片,14.語(yǔ)音編解碼芯片,15. CPLD芯片,16. 1號(hào)繼電器,17. 2號(hào)繼電器。
具體實(shí)施方式
以下結(jié)合附圖對(duì)本實(shí)用新型作詳細(xì)的描述本實(shí)用新型的宗旨是克服現(xiàn)有車內(nèi)語(yǔ)音識(shí)別控制方法存在的未本土化、指令發(fā)出者無(wú)限制和指令誤讀誤操作問(wèn)題,提供一種基于語(yǔ)譜圖互相關(guān)技術(shù)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)。同時(shí)提供了采用這種系統(tǒng)控制汽車車載電子設(shè)備的方法。一 .語(yǔ)譜圖互相關(guān)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)的結(jié)構(gòu)組成參閱
圖1至圖3,本實(shí)用新型所述的語(yǔ)譜圖互相關(guān)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)是由硬件和計(jì)算機(jī)程序的功能模塊構(gòu)架兩大部分所組成。硬件部分是由專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置1、硅麥克風(fēng)(音頻采集設(shè)備)2、紅外線CCD攝像頭(視頻采集設(shè)備)3 和汽車車載電子設(shè)備4組成。硅麥克風(fēng)2、紅外線CCD攝像頭3與汽車車載電子設(shè)備4分別和專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置1電連接。所述的專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置1主要由德州儀器公司生產(chǎn)的型號(hào)為 TMS320C6410的DSP芯片11、飛利浦公司生產(chǎn)的型號(hào)為SAA7111H的視頻AD模塊芯片12、 Averlogic公司生產(chǎn)的型號(hào)為AL422B的同步FIFO芯片13、德州儀器公司生產(chǎn)的型號(hào)為 TLV320AIC23的語(yǔ)音編解碼芯片14、XILINX公司生產(chǎn)的型號(hào)為XC9536XLVQ44的CPLD芯片 15、1號(hào)繼電器16及2號(hào)繼電器17組成。所述的型號(hào)為TLV320AIC23的語(yǔ)音編解碼芯片14包括有耳機(jī)輸出放大器、模 /數(shù)轉(zhuǎn)換(ADC)和數(shù)/模轉(zhuǎn)換(DAC)部件;駕駛員面前的硅麥克風(fēng)2的輸出端與型號(hào)為 TLV320AIC23的語(yǔ)音編解碼芯片14的DIN引腳電連接;型號(hào)為TLV320AIC23的語(yǔ)音編解碼芯片14的DOUT引腳與型號(hào)為TMS320C6410的DSP芯片11的多通道緩沖串口及I2C總線電連接;所述的駕駛員面前的紅外線CCD攝像頭3的輸出端與型號(hào)為SAA7111H的視頻AD 模塊芯片12的CVBS引腳電連接,傳送CVBS信號(hào);型號(hào)為SAA7111H的視頻AD模塊芯片12 的VP00-7輸出引腳與型號(hào)為AL422B的同步FIFO芯片13的DI0-7輸入引腳電連接;型號(hào)為AL422B的同步FIFO芯片13的D00-7輸出引腳與型號(hào)為TMS 320C6410的DSP芯片11 內(nèi)的FIFO接口電連接;所述的型號(hào)為XC9536XLVQ44的CPLD芯片15和型號(hào)為SAA7111H的視頻AD模塊芯片12、型號(hào)為AL422B的同步FIFO芯片13與型號(hào)為TMS320C6410的DSP芯片11通過(guò)通用I 0引腳電連接;型號(hào)為TMS320C6410的DSP芯片11的GPO與GPO [3]引腳分別和1號(hào)繼電器16與2號(hào)繼電器17的輸入端電連接,1號(hào)繼電器16與2號(hào)繼電器 17的輸出端分別和汽車車載電子設(shè)備4中的后備箱鎖4b與空調(diào)如電連接。計(jì)算機(jī)程序部分可以描述為由一組實(shí)現(xiàn)計(jì)算機(jī)程序所記載的技術(shù)方案的功能模塊所組成的功能模塊構(gòu)架。更具體地說(shuō),本實(shí)用新型所涉及的計(jì)算機(jī)程序的功能模塊構(gòu)架由專用漢語(yǔ)語(yǔ)音識(shí)別控制單元Ia和駕駛員唇語(yǔ)開關(guān)單元Ib組成。參閱圖2,所述的專用漢語(yǔ)語(yǔ)音識(shí)別控制單元Ia包括存儲(chǔ)前一時(shí)間段的車內(nèi)聲音信號(hào)的音頻緩存區(qū)、減少噪聲影響的背景噪聲抑制模塊、生成語(yǔ)譜圖的短時(shí)傅里葉模塊、判別有無(wú)“打開”或“關(guān)閉”語(yǔ)音指令關(guān)鍵詞發(fā)出的關(guān)鍵詞判別模塊、判別指令控制對(duì)象的汽車車載電子設(shè)備判別模塊。所述的音頻緩存區(qū)、背景噪聲抑制模塊、短時(shí)傅里葉模塊、關(guān)鍵詞判別模塊與汽車車載電子設(shè)備判別模塊設(shè)置在型號(hào)為TMS320C6410的DSP芯片11上,采用片上數(shù)據(jù)線連接,綜合作用實(shí)現(xiàn)關(guān)鍵詞和指令控制對(duì)象的識(shí)別和確定。所述的駕駛員唇語(yǔ)開關(guān)單元Ib包括實(shí)現(xiàn)視頻AD轉(zhuǎn)換的視頻編解碼模塊、緩沖一幀視頻數(shù)據(jù)的FIFO模塊、描述唇部?jī)?nèi)外輪廓的唇動(dòng)檢測(cè)與跟蹤模塊、確定有無(wú)唇部動(dòng)作的唇動(dòng)定位模塊。視頻編解碼模塊設(shè)置在型號(hào)為SAA7111H的視頻AD模塊芯片12上,F(xiàn)IFO模塊裝置在型號(hào)為AL422B的同步FIFO芯片13上,唇動(dòng)檢測(cè)與跟蹤模塊和唇動(dòng)定位模塊均裝置在型號(hào)為TMS320C6410的DSP芯片11上。視頻編解碼模塊通過(guò)所在的型號(hào)為SAA7111H的視頻AD模塊芯片12的VP00-7輸出引腳與FIFO模塊所在的型號(hào)為AL422B的同步FIFO芯片 13的DI0-7輸入引腳電連接;FIFO模塊通過(guò)所在的型號(hào)為AL422B的同步FIFO芯片13的輸出引腳和唇動(dòng)檢測(cè)與跟蹤模塊及唇動(dòng)定位模塊所在的型號(hào)為TMS320C6410的DSP芯片11 內(nèi)的FIFO接口電連接,唇動(dòng)檢測(cè)與跟蹤模塊和唇動(dòng)定位模塊間采用片上數(shù)據(jù)線連接。語(yǔ)譜圖互相關(guān)的駕駛員漢語(yǔ)語(yǔ)音控制系統(tǒng)設(shè)計(jì)為兩個(gè)識(shí)別階段并使用了基于圖像互相關(guān)技術(shù)的語(yǔ)音識(shí)別算法,即采用了如上所述的計(jì)算機(jī)程序部分。二 .采用本實(shí)用新型所述的語(yǔ)譜圖互相關(guān)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)實(shí)現(xiàn)語(yǔ)音控制汽車車載電子設(shè)備的方法包括如下步驟(參閱
圖1至圖4)1.在汽車上合理布置語(yǔ)譜圖互相關(guān)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng),尤其是合理布置專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置1、硅麥克風(fēng)2、紅外線CXD攝像頭3和汽車車載電子設(shè)備4。專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置1安裝在車內(nèi)儀表板上,紅外線CCD攝像頭3和硅麥克風(fēng)2安裝在儀表板正對(duì)駕駛員無(wú)其它設(shè)備處。2.建立語(yǔ)譜圖互相關(guān)的車內(nèi)駕駛員專用漢語(yǔ)語(yǔ)音識(shí)別控制系統(tǒng)的語(yǔ)音指令庫(kù),規(guī)定“打開”和“關(guān)閉”為語(yǔ)音指令關(guān)鍵詞,“空調(diào)”和“后備箱”等為具體的汽車車載電子設(shè)備 4(即指令控制對(duì)象)的名稱。3.以駕駛員面前的硅麥克風(fēng)2采集若干幀車內(nèi)聲音信號(hào),送入專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置1中開辟的音頻緩存區(qū)。4.以駕駛員面前晝夜工作的紅外線CXD攝像頭3采集駕駛員唇部圖像送入駕駛員唇語(yǔ)開關(guān)單元lb,經(jīng)視頻編解碼、FIFO緩沖、唇動(dòng)檢測(cè)與跟蹤及唇動(dòng)定位等環(huán)節(jié),確定駕駛員口唇部是否有動(dòng)作。5.確定駕駛員口唇部有動(dòng)作時(shí),發(fā)出信號(hào)激活專用漢語(yǔ)語(yǔ)音識(shí)別控制單元la。提取音頻緩存區(qū)中存儲(chǔ)的前一時(shí)間段的車內(nèi)聲音信號(hào),送入背景噪聲抑制模塊。[0044]6.對(duì)提取的車內(nèi)聲音信號(hào),以數(shù)字帶通濾波器和譜相減法為核心,抑制背景噪聲的同時(shí)增強(qiáng)語(yǔ)音。7.對(duì)經(jīng)過(guò)背景噪聲抑制處理后的聲信號(hào),進(jìn)行短時(shí)傅里葉分析。得到語(yǔ)譜圖后,送入關(guān)鍵詞判別環(huán)節(jié),進(jìn)行第一階段語(yǔ)音識(shí)別,用駕駛員語(yǔ)音“打開”、“關(guān)閉”語(yǔ)譜圖模板作為動(dòng)詞識(shí)別模板,利用圖像互相關(guān)方法對(duì)照動(dòng)詞關(guān)鍵詞語(yǔ)譜圖模板,快速監(jiān)測(cè)車內(nèi)有無(wú)預(yù)設(shè)規(guī)定的“打開”或“關(guān)閉”語(yǔ)音指令關(guān)鍵詞發(fā)出,決定控制開關(guān)(打開/關(guān)閉)狀態(tài)。8.若有關(guān)鍵詞檢出則將聲音信號(hào)作為疑似語(yǔ)音指令,送入汽車車載電子設(shè)備4判別環(huán)節(jié),進(jìn)行第二階段語(yǔ)音識(shí)別,用駕駛員語(yǔ)音“導(dǎo)航”、“后備箱鎖4b”、“前左側(cè)窗”、“收音
機(jī)”、“空調(diào)如”、------等語(yǔ)譜圖模板作為名詞識(shí)別模板,利用圖像互相關(guān)方法對(duì)照汽車車
載電子設(shè)備4名稱語(yǔ)譜圖模板,快速監(jiān)測(cè)疑似指令中有無(wú)指令庫(kù)中規(guī)定的汽車車載電子設(shè)備4名稱及發(fā)出汽車車載電子設(shè)備4名稱內(nèi)容的確定,識(shí)別指令中需要控制的目標(biāo)汽車車載電子設(shè)備4,鑒別指令控制對(duì)象(導(dǎo)航/后備箱鎖4b/前左側(cè)窗/收音機(jī)/空調(diào)4a、一-) 以決定控制指向。以“打開”、“導(dǎo)航”為例,說(shuō)明語(yǔ)譜圖互相關(guān)的算法。設(shè)疑似語(yǔ)音語(yǔ)譜圖為MXN灰度圖像矩陣A,矩陣的行對(duì)應(yīng)語(yǔ)譜圖中的頻率軸,矩陣的列對(duì)應(yīng)語(yǔ)譜圖中的時(shí)間軸,第i行、 第j列元素值就是時(shí)刻j時(shí)第i個(gè)頻率成分的幅頻強(qiáng)度。1)語(yǔ)譜圖預(yù)處理將語(yǔ)譜圖零均值化,即將圖像矩陣各元素值與圖像灰度均值做差;2)設(shè)駕駛員“打開”語(yǔ)音語(yǔ)譜圖為MXN1灰度圖像矩陣A1,且已經(jīng)零均值化,其中 N1 < N。做A與A1的二維圓周互相關(guān)
1 MnIR{m,n)=——])Αγ{{ι + τη, j+ n))MN( 1 )
M 刊 1 i=\ 7=1其中,!11 = 0,1,2,八^,11 = 0,1,2,八州。若疑似語(yǔ)音中含有駕駛員的“打開”指令語(yǔ)音,那么,R(m,n) —定含有至少一個(gè)足夠大的極值。設(shè)定一個(gè)閾值Rtl,當(dāng)ROvntl) ^R0 時(shí),即可認(rèn)定疑似語(yǔ)音中含有駕駛員的“打開”命令。實(shí)際上m和η的取值范圍不一定很大,當(dāng)滿足ROv η0)彡Rtl時(shí),即可停止互相關(guān)運(yùn)算。3)由2)的結(jié)論,若已經(jīng)確定疑似語(yǔ)音為駕駛員控制指令,按公式(1)中算法,將駕
駛員的“導(dǎo)航”、“后備箱鎖4b”、“前左側(cè)窗”、“收音機(jī)”、“空調(diào)如”、------等等語(yǔ)譜圖模板
(已零均值化)分別與疑似語(yǔ)音語(yǔ)譜圖做二維圓周互相關(guān),確定控制對(duì)象。上述算法中,語(yǔ)音采樣率取IOkHz (系統(tǒng)加前置抗混濾波器),語(yǔ)譜圖取帶寬為 20Hz的窄帶傅里葉語(yǔ)譜圖(512點(diǎn)FFT),時(shí)間分析窗口 51ms,時(shí)間窗口總長(zhǎng)度由端點(diǎn)檢測(cè)結(jié)果確定。本實(shí)用新型所述的圖像處理手段不僅限于互相關(guān)分析,還可以采用諸如紋理分析、邊緣檢測(cè)、形狀分析、小波語(yǔ)譜圖、Mel語(yǔ)譜圖等其他圖像處理技術(shù)。且非單人使用時(shí)可采用多組模塊邏輯或結(jié)構(gòu)進(jìn)一步擴(kuò)展到特定人組。9.確定疑似語(yǔ)音指令中含有語(yǔ)音指令庫(kù)中存儲(chǔ)的汽車車載電子設(shè)備4名稱后,由專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置1按照指令中的動(dòng)詞通過(guò)控制繼電器16與繼電器17開合,以實(shí)現(xiàn)對(duì)汽車車載電子設(shè)備4中的空調(diào)如或/和后備箱鎖4b等目標(biāo)汽車車載電子設(shè)備4的操作。
權(quán)利要求1.一種語(yǔ)譜圖互相關(guān)的駕駛員漢語(yǔ)語(yǔ)音控制系統(tǒng),其特征在于,所述的語(yǔ)譜圖互相關(guān)的駕駛員漢語(yǔ)語(yǔ)音控制系統(tǒng)由專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置(1)、硅麥克風(fēng)O)、紅外線CCD 攝像頭( 和汽車車載電子設(shè)備(4)組成;所述的專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置(1)由型號(hào)為TMS320C6410的DSP芯片(11)、型號(hào)為SAA7111H的視頻AD模塊芯片(12)、型號(hào)為AL422B的同步FIFO芯片(13)、型號(hào)為 TLV320AIC23的語(yǔ)音編解碼芯片(14)、型號(hào)為XC9536XLVQ44的CPLD芯片(15)、1號(hào)繼電器 (16)及2號(hào)繼電器(17)組成;硅麥克風(fēng)(2)的輸出端與型號(hào)為TLV320AIC23的語(yǔ)音編解碼芯片(14)的DIN引腳電連接,型號(hào)為TLV320AIC23的語(yǔ)音編解碼芯片(14)的DOUT引腳與型號(hào)為TMS320C6410的DSP 芯片(U)的多通道緩沖串口及1 總線電連接,紅外線CCD攝像頭⑶的輸出端與型號(hào)為 SAA711IH的視頻AD模塊芯片(12)的CVBS引腳電連接,型號(hào)為SAA711IH的視頻AD模塊芯片(12)的VP00-7輸出引腳與型號(hào)為AL422B的同步FIFO芯片(13)的DI0-7輸入引腳電連接,型號(hào)為AL422B的同步FIFO芯片(13)的D00-7輸出引腳與型號(hào)為TMS320C6410的DSP 芯片(11)的FIFO接口電連接,型號(hào)為)(C9536XLVQ44的CPLD芯片(15)和型號(hào)為SAA7111H 的視頻AD模塊芯片(12)、型號(hào)為AL422B的同步FIFO芯片(13)與型號(hào)為TMS320C6410的 DSP芯片(11)的通用IO引腳電連接,型號(hào)為TMS320C6410的DSP芯片(11)的GP0[0]引腳與1號(hào)繼電器(16)的輸入端電連接,型號(hào)為TMS 320C6410的DSP芯片(11)的GP0[3]引腳與2號(hào)繼電器(17)的輸入端電連接,1號(hào)繼電器(16)與2號(hào)繼電器(17)的輸出端分別和汽車車載電子設(shè)備電線連接。
2.按照權(quán)利要求1所述的語(yǔ)譜圖互相關(guān)的駕駛員漢語(yǔ)語(yǔ)音控制系統(tǒng),其特征在于,所述的汽車車載電子設(shè)備(4)包括空調(diào)Ga)和后備箱鎖(4b),空調(diào)Ga)的接線端與2號(hào)繼電器(17)的輸出端電線連接,后備箱鎖Gb)的接線端與1號(hào)繼電器(16)的輸出端電線連接。
專利摘要本實(shí)用新型公開了語(yǔ)譜圖互相關(guān)的駕駛員漢語(yǔ)語(yǔ)音控制系統(tǒng),包括專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置(1)、硅麥克風(fēng)(2)、紅外線CCD攝像頭(3)和汽車車載電子設(shè)備(4)。專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置(1)和硅麥克風(fēng)(2)、紅外線CCD攝像頭(3)與汽車車載電子設(shè)備(4)電連接。專用漢語(yǔ)語(yǔ)音識(shí)別控制裝置(1)包括DSP芯片(11)、視頻AD模塊芯片(12)、同步FIFO芯片(13)、語(yǔ)音編解碼芯片(14)、CPLD芯片(15)、1號(hào)繼電器(16)及2號(hào)繼電器(17)。汽車車載電子設(shè)備(4)包括空調(diào)(4a)和后備箱鎖(4b),空調(diào)(4a)與后備箱鎖(4b)一端和2號(hào)繼電器(17)與1號(hào)繼電器(16)輸出端電線連接。
文檔編號(hào)B60W50/08GK202067537SQ20112016919
公開日2011年12月7日 申請(qǐng)日期2011年5月25日 優(yōu)先權(quán)日2011年5月25日
發(fā)明者伏娟, 曹曉琳, 王雙維, 王杰, 王登峰 申請(qǐng)人:吉林大學(xué)