一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法

文檔序號：7995398閱讀：298來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法
技術(shù)領(lǐng)域：
本發(fā)明涉及語音增強(qiáng)的技術(shù)領(lǐng)域，具體就是，本發(fā)明涉及的是面向從二元麥克風(fēng)小尺度陣列到多元麥克風(fēng)大尺度陣列的目標(biāo)語音增強(qiáng)算法。
背景技術(shù)：
當(dāng)前從移動通訊、電話會議、筆記本語音交流、汽車通話到電視互動等應(yīng)用無一例外的面臨著各種類型噪音如混響、回聲和其他環(huán)境噪音的干擾，這給通訊雙方造成了不便，因而噪音抑制問題自然而然的被提出并被廣泛研究。目前噪音抑制或者說是語音增強(qiáng)技術(shù)主要有兩個方向，一個是面向單麥克風(fēng)的單道語音增強(qiáng)技術(shù)，其優(yōu)勢是成本低，但處理后的目標(biāo)語音損傷較大，同時對非平穩(wěn)噪音抑制能力有限；另外一個方向是麥克風(fēng)陣列語音增強(qiáng)技術(shù)，相對單道麥克風(fēng)語音增強(qiáng)技術(shù)，其處理后目標(biāo)語音損傷小，且能夠抑制非平穩(wěn)噪音，因而近年來被廣泛關(guān)注和研究。
麥克風(fēng)陣列語音增強(qiáng)算法一般采用波束形成噪音抑制方法，其思想是期望在陣列中心到目標(biāo)語音間形成一個波束，而波束外的信號被抑制掉，然后對波束內(nèi)滲入的噪音采用單道噪音抑制算法進(jìn)行處理，得到最終的目標(biāo)語音輸出。麥克風(fēng)陣列波束形成算法根據(jù)估計和跟蹤噪音過程的不同可分為固定波束形成算法和自適應(yīng)波束形成算法，固定波束形成算法包括延遲求和波束形成技術(shù)和超指向性波束形成技術(shù)等；自適應(yīng)波束形成算法包括最小均方自適應(yīng)濾波器、遞歸最小二乘自適應(yīng)濾波器以及基于它們的改進(jìn)算法。固定波束形成算法的缺陷是抑制效果有限或條件要求較高，如延遲求和波束形成器需要大量的陣元條件，或敏感，如超指向性波束形成技術(shù)對不相關(guān)噪音以及麥克風(fēng)陣列特性(增益、位置、相位)誤差敏感；而自適應(yīng)波束形成器面臨最大的問題是收斂性問題，收斂性與噪音復(fù)雜度以及噪音與目標(biāo)語音的相關(guān)性有關(guān)，另外還需要語音活動檢測技術(shù)支持。一般實(shí)際應(yīng)用和研究時，往往采用固定波束形成器結(jié)合自適應(yīng)波束形成器的方法，如廣義旁瓣抵消器 (Generalized Sidelobe Canceller, GSC)結(jié)構(gòu)和差分麥克風(fēng)陣列結(jié)構(gòu)。但差分麥克風(fēng)陣列面向的是微陣列語音增強(qiáng)技術(shù)，且要求目標(biāo)語音為端射方向，否則目標(biāo)語音會有變形。
而對于已有公開的麥克風(fēng)陣列噪音抑制技術(shù)，普遍存在算法復(fù)雜度高，計算量大或僅對某一陣列環(huán)境的語音增強(qiáng)應(yīng)用等特點(diǎn)，造成普適性不夠。如2009年1月21日公開的專利CN101351058，是面向的圓形麥克風(fēng)陣列，僅能對特定應(yīng)用有效，另外它期望通過獲得某個弧度范圍的入射方向推算其他弧度訪問的入射方向，由于入射方向估計難度較大，誤差不可避免，這樣推算其他弧度內(nèi)的入射角誤差可能會更大，這些都會對最終語音增強(qiáng)造成不利影響；而2009年2月18日公開的專利CN101369427，利用GSC結(jié)構(gòu)，采用功率譜密度估計代替時域或頻域信號，進(jìn)行自適應(yīng)估計，獲得估計噪聲功率譜，進(jìn)而通過相減獲得波束形成信號功率譜密度，然后進(jìn)行后置濾波，該算法波束形成算法中由于需要計算功率譜密度，當(dāng)陣元數(shù)較多時，計算量相對其他方法，計算量較大，另外波束形成中通過減去噪音功率譜密度，與單道譜減法缺點(diǎn)一樣，容易引起樂噪。發(fā)明內(nèi)容
當(dāng)前麥克風(fēng)陣列波束形成算法中采用的自適應(yīng)濾波器對與目標(biāo)聲源不相關(guān)的噪音有很好的抑制效果，但對與目標(biāo)語音相關(guān)性的噪音則效果較差，對這些殘留的相關(guān)噪音抑制一般采用單道后置濾波器進(jìn)行處理，例如譜減法、維納濾波器等，這些方法一般都需要利用語音活動檢測的方法，用非語音段的噪音代替或估計語音段方法，因而會造成目標(biāo)聲源變形或形成樂噪。為了克服這些缺點(diǎn)，本發(fā)明提出一種與已有的陣列語音增強(qiáng)技術(shù)相比，噪音抑制效果更好、處理后的語音質(zhì)量更高、且算法穩(wěn)定并適合各種尺度和類型的麥克風(fēng)陣列的語音增強(qiáng)方法。
一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法，包括以下步驟
步驟1，構(gòu)建麥克風(fēng)陣列、以接收外界模擬信號，由二到多個以上全指向性麥克風(fēng)組成線性、圓形或球形陣列；將接收到的模擬信號轉(zhuǎn)換為待處理的數(shù)字信號；
步驟2，分析所述的數(shù)字信號，獲取目標(biāo)語音相對陣列中每個陣元的相對時延；根據(jù)時延，以陣列中某個陣元接收的語音信號作為參考，對其他陣元接收到的數(shù)字信號進(jìn)行時延補(bǔ)償，獲得補(bǔ)償后的信號；利用子帶分解分別將每個陣元的時延補(bǔ)償信號分解成若干個子帶信號，然后分別對每個子帶信號進(jìn)行固定波束形成，以獲得每個頻帶范圍內(nèi)目標(biāo)聲源方向的初步增益；
步驟3，利用阻塞矩陣分別獲得每個子帶內(nèi)的噪音參考信號；
步驟4，利用變步長歸一化LMS算法對步驟4的每個子帶進(jìn)行自適應(yīng)濾波處理，處理結(jié)束后進(jìn)行子帶合并處理，獲得輸出信號e。
步驟5，利用陣列中兩個陣元補(bǔ)償后的信號進(jìn)行改進(jìn)的遞推噪音互功率譜密度估計(Iterative noise Cross Power Spectral Density，ICPSD)算法，獲得去除相關(guān)噪音的濾波器H，結(jié)合步驟4獲得的增強(qiáng)信號e，進(jìn)而獲得最終的目標(biāo)語音輸出y。
進(jìn)一步，步驟1中的陣列可以從間距為Icm左右的致密型陣列到陣元間距大于km 的大尺度常規(guī)陣列，每個陣元接收到的模擬信號使用音頻采集卡對陣列接收到的模擬信號進(jìn)行A/D轉(zhuǎn)換，形成待處理的數(shù)字信號。
步驟2包括以下子步驟
2. 1，分別獲取目標(biāo)聲源到達(dá)基準(zhǔn)麥克風(fēng)和其他麥克風(fēng)的相對時延，如第i個麥克風(fēng)接受的信號相對基準(zhǔn)麥克風(fēng)1的信號時延，其時延值通過公式1來估計1 T
Rv = -~ Xbl(I)Xbi(t-τ) ......公式 ι1 ‘ T-Tjr
其中Τ為麥克風(fēng)陣列采集語音信號的實(shí)際時間，Xb1 (t)，Xbi (t)分別對應(yīng)的是t 時刻第一麥克風(fēng)(基準(zhǔn)麥克風(fēng))，第i麥克風(fēng)所對應(yīng)的數(shù)字信號，Wv,表示Xb1Uhxbi(t)的互相關(guān)函數(shù)，其最大值對應(yīng)的τ就是兩個麥克風(fēng)相對時延值；
？^，分別對辦⑴，…，叉比⑴進(jìn)行時延校正，獲得Xb2 (t)的校正后信號&(t)，依次類推，xbn(t)的校正后信號；為了統(tǒng)一書寫格式，把基準(zhǔn)麥克風(fēng)信號xbi(t)代替；
2. 3，利用子帶分解方法分別把上述時延補(bǔ)償后的信號分解成k個子帶例如 X1 (t)分解成 X-IsuHa)，x-lsub-2(t)，……，x-lsub-k(t) ；x2(t)到依次類推。
2. 4，對每個子帶分別進(jìn)行固定波束形成，如第i個子帶的固定波束形成獲得的信號yU由公式2計算
權(quán)利要求
1.一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法，包括以下步驟步驟1，構(gòu)建麥克風(fēng)陣列、以接收外界模擬信號，由二到多個以上全指向性麥克風(fēng)組成線性、圓形或球形陣列；將接收到的模擬信號轉(zhuǎn)換為待處理的數(shù)字信號；步驟2，分析所述的數(shù)字信號，獲取目標(biāo)語音相對陣列中每個陣元的相對時延；根據(jù)時延，以陣列中某個陣元接收的語音信號作為參考，對其他陣元接收到的數(shù)字信號進(jìn)行時延補(bǔ)償，獲得補(bǔ)償后的信號；利用子帶分解分別將每個陣元的時延補(bǔ)償信號分解成若干個子帶信號，然后分別對每個子帶信號進(jìn)行固定波束形成，以獲得每個頻帶范圍內(nèi)目標(biāo)聲源方向的初步增益；步驟3，利用阻塞矩陣分別獲得每個子帶內(nèi)的噪音參考信號；步驟4，利用變步長歸一化LMS算法對步驟4的每個子帶進(jìn)行自適應(yīng)濾波處理，處理結(jié)束后進(jìn)行子帶合并處理，獲得輸出信號e。步驟5，利用陣列中兩個陣元補(bǔ)償后的信號進(jìn)行改進(jìn)的遞推噪音互功率譜密度估計 (Iterative noise Cross Power Spectral Density, ICPSD)算法，獲得去除相關(guān)噪音的濾波器H，結(jié)合步驟4獲得的增強(qiáng)信號e，進(jìn)而獲得最終的目標(biāo)語音輸出y。
2.根據(jù)權(quán)利要求1所述的一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法，其特征在于步驟1中的陣列可以從間距為Icm左右的致密型陣列到陣元間距大于4cm的大尺度常規(guī)陣列，每個陣元接收到的模擬信號使用音頻采集卡對陣列接收到的模擬信號進(jìn)行A/D轉(zhuǎn)換，形成待處理的數(shù)字信號。
3.根據(jù)權(quán)利要求2所述的一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法，其特征在于步驟2包括以下子步驟2.1，分別獲取目標(biāo)聲源到達(dá)基準(zhǔn)麥克風(fēng)和其他麥克風(fēng)的相對時延，如第i個麥克風(fēng)接受的信號相對基準(zhǔn)麥克風(fēng)1的信號時延，其時延值通過公式1來估計
4.根據(jù)權(quán)利要求3所述的一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法，其特征在于步驟3中，通過公式3獲取每個子帶中η個元素的參考噪音向量Nsulri，Nsub_2……，Nsub_k，其中第i個子帶的參考噪音向量為X-IisuH (t)]T……公式 3公式3中B為阻塞矩陣(Blocking Matrix, BM)，它由公式4確定 -1,-1,...,-1-\η-\···-\^=……公式4-1,-1,—, -1 公式4中的η表示陣列中的陣元數(shù)，η >= 2。
5.根據(jù)權(quán)利要求4所述的一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法，其特征在于步驟4中，通過歸一化最小均方(NormalizedLeast Mean Squares,NLMS)自適應(yīng)濾波器算法實(shí)現(xiàn)與目標(biāo)語音不相關(guān)的噪音抑制，包含以下步驟4. 1、假定NLMS濾波器長度為M,則子帶i第m個參考噪音序列Vsulrf (m)和權(quán)系數(shù)向量 Wsub^i (m)可分別表示為Vsub^i (m) = [Ν-— (m)，Ν-— (m_l)，...，Nsub^i (m-M+1) ]τ......公式 5Wsub_i (m) = [w0 (m), W1 (m),…，wn (m) ]τ......公式 6公式6中的W。(m), W1 (m), -,wn(m)的初始值均為O。 4. 2、估計的噪音信號Clsulrf為4. 3、NLMS輸出信號即誤差信號為期望信號減去估計的噪音信號eSUb-i (m) = ybsub_i (m) -d—— (m)......公式 84. 4、下一個權(quán)系數(shù)向量由下式計算Kub-r 如 + O = Kub-r ㈣ +㈣ /Pi,㈣。—,(爪))……公式 9其中μ為步長因子，初始階段讓其從一個較大的值逐步變化到一個穩(wěn)定的較小值，用以加速濾波器初始階段的收斂性；VTV為歸一化系數(shù)，用以提高LMS算法的收斂性。4.5、最后將獲得的k個子帶輸出信號進(jìn)行子帶合并，得到輸出信號e。6.根據(jù)權(quán)利要求5所述的一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法，其特征在于步驟5中包括以下子步驟5.1、對步驟2中得到的信號Xl (t)，xn(t)分別進(jìn)行短時傅里葉變換并進(jìn)行分幀和加窗操作得到)(1江，1)411江，1)，其中€表示頻率因子，1代表第幾幀。用^3vJP &# 分別表示為第1和第η兩個陣元接收信號的互功率譜密度(Cross Power Spectral Density, CPSD) 以及兩個陣元接收信號的估計噪音的CPSD ； ^P^jn Aa分別為這兩個陣元信號的功率譜密度(Power Spectral Density, PSD)。則濾波器H(f，1)可由公式10計算dSUb-, ο)=Kb-, (mWsub-, ο)=Σ wJ (m>sub-, ο - ！)……公式 7H(fJ)- l2L*JMJL·……μ“.C驅(qū)……ΛΑ公式105. 2、公式10中的R(f，1)由公式11定義R(ZJ)+(I-Ad)AC/,/)…公式 n5. 3、公式11中的I p(f，1)由公式12定義
全文摘要
一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法，包括構(gòu)建麥克風(fēng)陣列、以接收外界信號；分析信號，獲取目標(biāo)聲源相對麥克風(fēng)陣列中不同陣元信號相對基準(zhǔn)陣元信號的時延；根據(jù)時延，分別對與兩個麥克風(fēng)所對應(yīng)的數(shù)字信號進(jìn)行時延補(bǔ)償，獲得補(bǔ)償后的信號；對補(bǔ)償后的陣列信號分別進(jìn)行子帶分解，然后再每個子帶上進(jìn)行固定波束形成；同時分別在每個子帶上使用阻塞矩陣獲取每個子帶上的噪音參考信號；然后在每個子帶上分別通過自適應(yīng)濾波處理算法，將相應(yīng)子帶上固定波速形成器中的與目標(biāo)語音無關(guān)的噪音去除并進(jìn)行子帶合并，從而形成初步增益信號；同時利用前面補(bǔ)償后的任意兩個陣元信號，通過遞推互功率譜密度獲得抑制與目標(biāo)語音相關(guān)噪音信號的濾波器，進(jìn)而結(jié)合初步增益信號得到最終的目標(biāo)語音信號。
文檔編號H04R3/04GK102509552SQ20111032474
公開日2012年6月20日申請日期2011年10月21日優(yōu)先權(quán)日2011年10月21日
發(fā)明者楊立春, 錢沄濤申請人:浙江大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：錢沄濤;楊立春
技術(shù)所有人：浙江大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

麥克風(fēng)陣列語音增強(qiáng)相關(guān)技術(shù)

qq語音麥克風(fēng)自動增強(qiáng)相關(guān)技術(shù)

qq語音麥克風(fēng)增強(qiáng)相關(guān)技術(shù)

麥克風(fēng)陣列相關(guān)技術(shù)

麥克風(fēng)陣列聲源定位相關(guān)技術(shù)

麥克風(fēng)陣列解決方案相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于聯(lián)合抑制的麥克風(fēng)陣列語音增強(qiáng)方法