基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及音頻處理技術(shù),特別是涉及一種基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法的 技術(shù)。
【背景技術(shù)】
[0002] 在手機(jī)、助聽(tīng)器、免提電話等語(yǔ)音通訊終端設(shè)備中,瞬態(tài)噪聲如鍵盤聲、鼠標(biāo)聲以 及敲擊聲等會(huì)嚴(yán)重影響語(yǔ)音質(zhì)量和音頻品質(zhì),因此必須進(jìn)行相應(yīng)的檢測(cè)和抑制。瞬態(tài)噪聲 是一種加性噪聲,屬于強(qiáng)非平穩(wěn)態(tài)噪聲,典型的瞬態(tài)噪聲是一段突發(fā)脈沖式的信號(hào),并伴隨 持續(xù)時(shí)間10-50ms的衰減振蕩過(guò)程,由于其頻帶較寬,與語(yǔ)音信號(hào)在時(shí)頻域有較多重疊,且 具有非連續(xù)性的特點(diǎn),因此傳統(tǒng)的單通道和多通道語(yǔ)音增強(qiáng)方法都不能很好地抑制瞬態(tài)噪 聲,還可能引入失真。
[0003] 近年來(lái),國(guó)內(nèi)外研究者提出了一些用于瞬態(tài)噪聲抑制的方法,Talmon等提出了一 類瞬態(tài)噪聲抑制方法,通過(guò)采用非局部(Non-local, NL)擴(kuò)散濾波器和最優(yōu)改進(jìn)對(duì)數(shù)譜幅 度估計(jì)算法(Optimally-Modified-Log Spectral-Amplitude,OM-LSA)。Zheng 等在時(shí)域、 頻率域和小波域等提出了一些基于變化域的瞬態(tài)噪聲檢測(cè)及抑制方法。這些方法主要通過(guò) 學(xué)習(xí)瞬態(tài)噪聲的特性,以實(shí)現(xiàn)瞬態(tài)噪聲的檢測(cè),最終實(shí)現(xiàn)瞬態(tài)噪聲的抑制。但是此類方法存 在時(shí)延和噪聲殘留,并且只適用于部分類型的瞬態(tài)噪聲,因此在實(shí)時(shí)語(yǔ)音通信系統(tǒng)應(yīng)用中 不具普遍適用性,而且由于人耳的聽(tīng)覺(jué)特性,對(duì)殘留的瞬態(tài)噪聲異常敏感,現(xiàn)有的方法都無(wú) 法完全地消除瞬態(tài)噪聲。
【發(fā)明內(nèi)容】
[0004] 針對(duì)上述現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種能有效 地抑制瞬態(tài)噪聲,在語(yǔ)音信號(hào)和瞬態(tài)噪聲同時(shí)存在時(shí)能完全地消除瞬態(tài)噪聲的基于語(yǔ)音重 建的瞬態(tài)噪聲抑制方法。
[0005] 為了解決上述技術(shù)問(wèn)題,本發(fā)明所提供的一種基于語(yǔ)音重建的瞬態(tài)噪聲抑制方 法,其特征在于,具體步驟如下:
[0006] 1)利用傳聲器拾取聲信號(hào),并對(duì)傳聲器所拾取的聲信號(hào)進(jìn)行預(yù)處理,忽略其中的 平穩(wěn)態(tài)噪聲殘留d s (η),得到預(yù)處理后的聲信號(hào)為:
[0007] X (n) =s (n) +dt (η);
[0008] 其中,χ(η)為預(yù)處理后的聲信號(hào),s(n)為預(yù)處理后的聲信號(hào)中的目標(biāo)語(yǔ)音成分, dt(η)為預(yù)處理后的聲信號(hào)中的瞬態(tài)噪聲成分;
[0009] 2)對(duì)χ(η)進(jìn)行分幀、預(yù)白化處理,基于預(yù)白化后濁音和瞬態(tài)噪聲的波形分布特性 差異,對(duì)X (η)逐幀檢測(cè)是否含有瞬態(tài)噪聲;
[0010] 3)對(duì)χ(η)進(jìn)行重建,瞬態(tài)噪聲與語(yǔ)音信號(hào)同時(shí)存在時(shí),將χ(η)中包含有瞬態(tài)噪聲 的幀丟棄,或?qū)(η)中包含有瞬態(tài)噪聲的幀及其后的2-3幀一并舍棄,再利用去除幀的前 后相鄰的未受干擾幀進(jìn)行波形重建,替換掉原有的信號(hào)。
[0011] 進(jìn)一步的,所述步驟2)中,對(duì)x(n)逐幀檢測(cè)是否含有瞬態(tài)噪聲的步驟如下:
[0012] 2. 1)對(duì)X (η)進(jìn)行分巾貞、預(yù)白化處理,得到X (η)的白化信號(hào),將X (η)的白化信號(hào)中 的各幀信號(hào)記為:
【主權(quán)項(xiàng)】
1. 一種基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法,其特征在于,具體步驟如下: 1) 利用傳聲器拾取聲信號(hào),并對(duì)傳聲器所拾取的聲信號(hào)進(jìn)行預(yù)處理,忽略其中的平穩(wěn) 態(tài)噪聲殘留屯(n),得到預(yù)處理后的聲信號(hào)為: X (n) = S (n) +屯(n); 其中,x(n)為預(yù)處理后的聲信號(hào),s(n)為預(yù)處理后的聲信號(hào)中的目標(biāo)語(yǔ)音成分,dt(n) 為預(yù)處理后的聲信號(hào)中的瞬態(tài)噪聲成分; 2) 對(duì)x(n)進(jìn)行分峽、預(yù)白化處理,基于預(yù)白化后濁音和瞬態(tài)噪聲的波形分布特性差 異,對(duì)x(n)逐峽檢測(cè)是否含有瞬態(tài)噪聲; 3) 對(duì)X(n)進(jìn)行重建,瞬態(tài)噪聲與語(yǔ)音信號(hào)同時(shí)存在時(shí),將X(n)中包含有瞬態(tài)噪聲的峽 丟棄,或?qū)(n)中包含有瞬態(tài)噪聲的峽及其后的2-3峽一并舍棄,再利用去除峽的前后相 鄰的未受干擾峽進(jìn)行波形重建,替換掉原有的信號(hào)。
2. 根據(jù)權(quán)利要求1所述的基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法,其特征在于,所述步驟 2)中,對(duì)x(n)逐峽檢測(cè)是否含有瞬態(tài)噪聲的步驟如下: 2. 1)對(duì)x(n)進(jìn)行分峽、預(yù)白化處理,得到x(n)的白化信號(hào),將x(n)的白化信號(hào)中的各 峽信號(hào)記為:
其中,種/(,/)為x(n)的白化信號(hào)中的第1峽信號(hào)的第k個(gè)樣本點(diǎn),X也1)為原始信號(hào) 進(jìn)行分峽處理后的第1峽信號(hào)的第k個(gè)樣本點(diǎn),P為線性預(yù)測(cè)的階數(shù),為第1峽信號(hào)的 線性預(yù)測(cè)系數(shù),X化-P,1)為原始信號(hào)進(jìn)行分峽處理后的第1峽信號(hào)的第k-p個(gè)樣本點(diǎn); 2.2) 加入窗函數(shù)計(jì)算x(n)的白化信號(hào)各峽的重也,具體計(jì)算公式為:
其中,CQ)為x(n)的白化信號(hào)第1峽的重也,W化)為漢寧窗,N為x(n)的白化信號(hào)中 每峽的采樣點(diǎn)數(shù)量; 2.3) WC(1)為中也,計(jì)算包含E%能量所需的時(shí)間長(zhǎng)度BQ),具體計(jì)算公式為:
其中,niijn是指取能使
成立的V的最小取值,E%=90% ;
2. 4)根據(jù)B (1)值判斷信號(hào)中是否存在瞬態(tài)噪聲,如果B (1) < thr,則判定信號(hào)中存在 瞬態(tài)噪聲,thr為預(yù)先設(shè)定的瞬態(tài)噪聲判斷口限。
3. 根據(jù)權(quán)利要求2所述的基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法,其特征在于,所述步驟 2.。中,N = 512。
4. 根據(jù)權(quán)利要求2所述的基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法,其特征在于,所述步驟 2. 4)中,t虹=150。
5. 根據(jù)權(quán)利要求1所述的基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法,其特征在于,所述步驟 3)中,對(duì)x(n)進(jìn)行重建的步驟如下: 3. 1)利用基音周期檢測(cè)方法對(duì)丟棄峽之前的封包進(jìn)行基音周期檢測(cè),得到的前向基音 周期Pf,對(duì)丟棄峽之后的封包進(jìn)行基音周期檢測(cè),得到后向基音周期Pb,并確定丟棄峽前一 封包的周期波形及后一封包的周期波形; 對(duì)于x(n)中的丟棄峽,對(duì)該些丟棄峽之前的封包與之后的封包進(jìn)行基音檢測(cè),并判 斷是否為濁音,如果前后峽都是濁音,則轉(zhuǎn)至步驟3. 2),反之則轉(zhuǎn)至步驟3. 3); 3. 2)在丟棄峽的前、后封包均為濁音的情況下,先對(duì)前、后封包的周期波形進(jìn)行相位同 步,再根據(jù)丟棄峽長(zhǎng)度確定該丟棄峽所需的重建周期波形個(gè)數(shù)及各重建周期波形長(zhǎng)度,然 后進(jìn)行周期波形內(nèi)差重建語(yǔ)音,具體重建方