專利名稱:基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置及語(yǔ)音增強(qiáng)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置及語(yǔ)音增強(qiáng)方法。
背景技術(shù):
隨著無(wú)線通訊的發(fā)展,全球移動(dòng)電話用戶越來(lái)越多,用戶對(duì)移動(dòng)電話的要求已不 僅滿足于通話,而且要能夠提供高質(zhì)量的通話效果,尤其是目前移動(dòng)多媒體技術(shù)的發(fā)展,移 動(dòng)電話的通話質(zhì)量更顯重要。由于大量環(huán)境噪聲的存在,手機(jī)等通訊設(shè)備的麥克風(fēng)采集到的語(yǔ)音信號(hào)普遍信噪 比不夠高,特別是在街道汽車等高噪聲環(huán)境中,需要提高音量才能使對(duì)方聽(tīng)清。所以需要通 過(guò)語(yǔ)音增強(qiáng)的方法來(lái)提升輸入語(yǔ)音的信噪比,改善通訊質(zhì)量。然而傳統(tǒng)的單通道語(yǔ)音增強(qiáng)方法降噪效果有限,并且會(huì)對(duì)語(yǔ)音造成較大失真。
發(fā)明內(nèi)容
本發(fā)明需解決的技術(shù)問(wèn)題是提供一種去噪效果好的基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置 及語(yǔ)音增強(qiáng)方法。根據(jù)上述需解決的技術(shù)問(wèn)題,本發(fā)明提供了一種基于雙麥克風(fēng)的語(yǔ)音增強(qiáng)裝置, 該裝置包括數(shù)字麥克風(fēng)陣列模塊,用于接收時(shí)域帶噪語(yǔ)音數(shù)字信號(hào)并將接收的時(shí)域帶噪語(yǔ)音 數(shù)字信號(hào)輸出,其包括第一數(shù)字麥克風(fēng)和第二數(shù)字麥克風(fēng);第一脈沖密度調(diào)制解碼器模塊,用于對(duì)時(shí)域帶噪語(yǔ)音數(shù)字信號(hào)進(jìn)行分幀、降采樣 及濾波,形成初步降采樣率數(shù)字信號(hào),其包括濾波器;指向性形成模塊,用于將初步降采樣率數(shù)字信號(hào)進(jìn)行指向性形成,形成初步降噪 的指向性輸出信號(hào);第二脈沖密度調(diào)制解碼器模塊,用于對(duì)初步降噪的指向性輸出信號(hào)進(jìn)行分幀、降 采樣、濾波和加重,形成第二降采樣率數(shù)字信號(hào);語(yǔ)音增強(qiáng)處理模塊,用于對(duì)第二降采樣率數(shù)字信號(hào)進(jìn)行語(yǔ)音增強(qiáng)處理,形成去除 背景噪聲的語(yǔ)音信號(hào);輸出模塊,用于輸出去除背景噪聲的語(yǔ)音信號(hào)。優(yōu)選的,所述第一脈沖密度調(diào)制解碼器模塊包括N級(jí)梳狀濾波器。優(yōu)選的,所述第二脈沖密度調(diào)制解碼器模塊包括第一半帶濾波器、第二半帶濾波 器、低通濾波器和高通濾波器?;陔p麥克風(fēng)語(yǔ)音增強(qiáng)裝置的語(yǔ)音增強(qiáng)方法包括如下步驟步驟SOOl 利用第一數(shù)字麥克風(fēng)接收第一時(shí)域帶噪語(yǔ)音數(shù)字信號(hào);利用第二數(shù)字 麥克風(fēng)接收第二時(shí)域帶噪語(yǔ)音數(shù)字信號(hào),并將所述接收到的第一、第二時(shí)域帶噪語(yǔ)音數(shù)字 信號(hào)傳送給脈沖密度調(diào)制解碼器模塊;步驟S002 利用脈沖密度調(diào)制解碼器模塊將第一、第二時(shí)域帶噪語(yǔ)音數(shù)字信號(hào)分幀,并利用N級(jí)梳狀濾波器進(jìn)行降采樣及濾波,得到第一、第二初步降采樣率數(shù)字信號(hào)并輸 出;N級(jí)梳狀濾波器的傳遞函數(shù)形式如下
權(quán)利要求
1.一種基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置,其特征在于該裝置包括數(shù)字麥克風(fēng)陣列模塊,用于接收時(shí)域帶噪語(yǔ)音數(shù)字信號(hào)并將接收的時(shí)域帶噪語(yǔ)音數(shù)字 信號(hào)輸出,其包括第一數(shù)字麥克風(fēng)和第二數(shù)字麥克風(fēng);第一脈沖密度調(diào)制解碼器模塊,用于對(duì)時(shí)域帶噪語(yǔ)音數(shù)字信號(hào)進(jìn)行分幀、降采樣及濾 波,形成初步降采樣率數(shù)字信號(hào),其包括濾波器;指向性形成模塊,用于將初步降采樣率數(shù)字信號(hào)進(jìn)行指向性形成,形成初步降噪的指 向性輸出信號(hào);第二脈沖密度調(diào)制解碼器模塊,用于對(duì)初步降噪的指向性輸出信號(hào)進(jìn)行分幀、降采樣、 濾波和加重,形成第二降采樣率數(shù)字信號(hào);語(yǔ)音增強(qiáng)處理模塊,用于對(duì)第二降采樣率數(shù)字信號(hào)進(jìn)行語(yǔ)音增強(qiáng)處理,形成去除背景 噪聲的語(yǔ)音信號(hào);輸出模塊,用于輸出去除背景噪聲的語(yǔ)音信號(hào)。
2.根據(jù)權(quán)利要求1所述的基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置,其特征在于,所述第一脈沖密 度調(diào)制解碼器模塊包括N級(jí)梳狀濾波器。
3.根據(jù)權(quán)利要求2所述的基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置,其特征在于,所述第二脈沖密 度調(diào)制解碼器模塊包括第一半帶濾波器、第二半帶濾波器、低通濾波器和高通濾波器。
4.根據(jù)權(quán)利要求3所述的基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置的語(yǔ)音增強(qiáng)方法,其特征在于, 該語(yǔ)音增強(qiáng)方法包括如下步驟步驟SOOl 利用第一數(shù)字麥克風(fēng)接收第一時(shí)域帶噪語(yǔ)音數(shù)字信號(hào);利用第二數(shù)字麥克 風(fēng)接收第二時(shí)域帶噪語(yǔ)音數(shù)字信號(hào),并將所述接收到的第一、第二時(shí)域帶噪語(yǔ)音數(shù)字信號(hào)傳送給脈沖密度調(diào)制解碼器模塊; 步驟S002 利用脈沖密度調(diào)制解碼器模塊將第一、第二時(shí)域帶噪語(yǔ)音數(shù)字信號(hào)分幀, 并利用N級(jí)梳狀濾波器進(jìn)行降采樣及濾波,得到第一、第二初步降采樣率數(shù)字信號(hào)并輸出; N級(jí)梳狀濾波器的傳遞函數(shù)形式如下r 1=0N為級(jí)聯(lián)階數(shù),r為抽取比例
5.根據(jù)權(quán)利要求4所述的基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置的語(yǔ)音增強(qiáng)方法,其特征在于, 步驟S004中對(duì)所述初步降噪的信號(hào)進(jìn)行分幀后的信號(hào)為y(m),m表示幀數(shù)降采樣及濾波分為三步第一步利用第一半帶濾波器,并按2 1抽??;第二步利用第二半帶濾波器,并按2 1抽??;第三步利用低通濾波器,并按3 1抽??;第一半帶濾波器為14階有限沖激響應(yīng)濾波器
6.根據(jù)權(quán)利要求5所述的基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置的語(yǔ)音增強(qiáng)方法,其特征在于, 步驟S005中包括如下步驟步驟AOOl 將第二降采樣率數(shù)字信號(hào)經(jīng)短時(shí)傅里葉變換成頻域信號(hào),并對(duì)將頻域信號(hào) 劃分為若干頻帶,計(jì)算各個(gè)頻帶的能量并進(jìn)行平滑; 短時(shí)傅里葉變換如下
7.根據(jù)權(quán)利要求6所述的基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置的語(yǔ)音增強(qiáng)方法,其特征在于, 步驟Α003中采用計(jì)權(quán)噪聲估計(jì)法對(duì)先驗(yàn)信噪比估計(jì)值進(jìn)行修正,具體為先驗(yàn)信噪比估計(jì)值S^Hk),乘以計(jì)權(quán)因子去q0,得到修正后的先驗(yàn)信噪比估計(jì) 值 S^mvnaXm-I為 SNRpnor(m,k)<Yl -(S'NRpnor(m,k)-γ2) Yl <SNRpnor(m,k)<0z計(jì)權(quán)因子計(jì)算如下 1
8.根據(jù)權(quán)利要求7所述的基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置的語(yǔ)音增強(qiáng)方法,其特征在于, 步驟A004中還包括采用門限判決對(duì)所述衰減增益進(jìn)行調(diào)整; 首先設(shè)定一閥值、調(diào)整值qmod和門限值qfloor ;其次以當(dāng)前幀修正后的先驗(yàn)信噪比估計(jì)值SMf如-i,幻為判斷,小于某一閾值的 增益系數(shù)均乘以調(diào)整值qmod,從而進(jìn)一步抑制噪聲;接著將所有小于某閥值的增益系數(shù)調(diào)整到門限值qfloor,這樣做可以避免一定的語(yǔ)音 失真;方法如下
全文摘要
本發(fā)明涉及一種基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置,其包括數(shù)字麥克風(fēng)陣列模塊,用于接收時(shí)域帶噪語(yǔ)音數(shù)字信號(hào);第一脈沖密度調(diào)制解碼器模塊,用于對(duì)時(shí)域帶噪語(yǔ)音數(shù)字信號(hào)進(jìn)行分幀、降采樣及濾波,形成初步降采樣率數(shù)字信號(hào);指向性形成模塊,用于將初步降采樣率數(shù)字信號(hào)進(jìn)行指向性形成,形成初步降噪的指向性輸出信號(hào);第二脈沖密度調(diào)制解碼器模塊,用于對(duì)初步降噪的指向性輸出信號(hào)進(jìn)行分幀、降采樣、濾波和加重,形成第二降采樣率數(shù)字信號(hào);語(yǔ)音增強(qiáng)處理模塊,用于對(duì)第二降采樣率數(shù)字信號(hào)進(jìn)行語(yǔ)音增強(qiáng)處理;輸出模塊,用于輸出去除背景噪聲的語(yǔ)音信號(hào)。本發(fā)明另提供一種基于雙麥克風(fēng)語(yǔ)音增強(qiáng)裝置的語(yǔ)音增強(qiáng)方法。該裝置及方法去噪效果好。
文檔編號(hào)G10L21/02GK102074245SQ20111000102
公開(kāi)日2011年5月25日 申請(qǐng)日期2011年1月5日 優(yōu)先權(quán)日2011年1月5日
發(fā)明者葉利劍 申請(qǐng)人:瑞聲光電科技(常州)有限公司, 瑞聲聲學(xué)科技(深圳)有限公司, 瑞聲聲學(xué)科技研發(fā)(南京)有限公司