基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法

文檔序號(hào)：8283475閱讀：506來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及音頻處理技術(shù)，特別是涉及一種基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法的技術(shù)。
【背景技術(shù)】
[0002] 在手機(jī)、助聽(tīng)器、免提電話等語(yǔ)音通訊終端設(shè)備中，瞬態(tài)噪聲如鍵盤聲、鼠標(biāo)聲以及敲擊聲等會(huì)嚴(yán)重影響語(yǔ)音質(zhì)量和音頻品質(zhì)，因此必須進(jìn)行相應(yīng)的檢測(cè)和抑制。瞬態(tài)噪聲是一種加性噪聲，屬于強(qiáng)非平穩(wěn)態(tài)噪聲，典型的瞬態(tài)噪聲是一段突發(fā)脈沖式的信號(hào)，并伴隨持續(xù)時(shí)間10-50ms的衰減振蕩過(guò)程，由于其頻帶較寬，與語(yǔ)音信號(hào)在時(shí)頻域有較多重疊，且具有非連續(xù)性的特點(diǎn)，因此傳統(tǒng)的單通道和多通道語(yǔ)音增強(qiáng)方法都不能很好地抑制瞬態(tài)噪聲，還可能引入失真。
[0003] 近年來(lái)，國(guó)內(nèi)外研究者提出了一些用于瞬態(tài)噪聲抑制的方法，Talmon等提出了一類瞬態(tài)噪聲抑制方法，通過(guò)采用非局部（Non-local, NL)擴(kuò)散濾波器和最優(yōu)改進(jìn)對(duì)數(shù)譜幅度估計(jì)算法（Optimally-Modified-Log Spectral-Amplitude，OM-LSA)。Zheng 等在時(shí)域、頻率域和小波域等提出了一些基于變化域的瞬態(tài)噪聲檢測(cè)及抑制方法。這些方法主要通過(guò) 學(xué)習(xí)瞬態(tài)噪聲的特性，以實(shí)現(xiàn)瞬態(tài)噪聲的檢測(cè)，最終實(shí)現(xiàn)瞬態(tài)噪聲的抑制。但是此類方法存在時(shí)延和噪聲殘留，并且只適用于部分類型的瞬態(tài)噪聲，因此在實(shí)時(shí)語(yǔ)音通信系統(tǒng)應(yīng)用中不具普遍適用性，而且由于人耳的聽(tīng)覺(jué)特性，對(duì)殘留的瞬態(tài)噪聲異常敏感，現(xiàn)有的方法都無(wú) 法完全地消除瞬態(tài)噪聲。

【發(fā)明內(nèi)容】

[0004] 針對(duì)上述現(xiàn)有技術(shù)中存在的缺陷，本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種能有效地抑制瞬態(tài)噪聲，在語(yǔ)音信號(hào)和瞬態(tài)噪聲同時(shí)存在時(shí)能完全地消除瞬態(tài)噪聲的基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法。
[0005] 為了解決上述技術(shù)問(wèn)題，本發(fā)明所提供的一種基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法，其特征在于，具體步驟如下：
[0006] 1)利用傳聲器拾取聲信號(hào)，并對(duì)傳聲器所拾取的聲信號(hào)進(jìn)行預(yù)處理，忽略其中的平穩(wěn)態(tài)噪聲殘留d s (η)，得到預(yù)處理后的聲信號(hào)為：
[0007] X (n) =s (n) +dt (η)；
[0008] 其中，χ(η)為預(yù)處理后的聲信號(hào)，s(n)為預(yù)處理后的聲信號(hào)中的目標(biāo)語(yǔ)音成分， dt(η)為預(yù)處理后的聲信號(hào)中的瞬態(tài)噪聲成分；
[0009] 2)對(duì)χ(η)進(jìn)行分幀、預(yù)白化處理，基于預(yù)白化后濁音和瞬態(tài)噪聲的波形分布特性差異，對(duì)X (η)逐幀檢測(cè)是否含有瞬態(tài)噪聲；
[0010] 3)對(duì)χ(η)進(jìn)行重建，瞬態(tài)噪聲與語(yǔ)音信號(hào)同時(shí)存在時(shí)，將χ(η)中包含有瞬態(tài)噪聲的幀丟棄，或?qū)(η)中包含有瞬態(tài)噪聲的幀及其后的2-3幀一并舍棄，再利用去除幀的前后相鄰的未受干擾幀進(jìn)行波形重建，替換掉原有的信號(hào)。
[0011] 進(jìn)一步的，所述步驟2)中，對(duì)x(n)逐幀檢測(cè)是否含有瞬態(tài)噪聲的步驟如下：
[0012] 2. 1)對(duì)X (η)進(jìn)行分巾貞、預(yù)白化處理，得到X (η)的白化信號(hào)，將X (η)的白化信號(hào)中的各幀信號(hào)記為：
【主權(quán)項(xiàng)】
1. 一種基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法，其特征在于，具體步驟如下： 1) 利用傳聲器拾取聲信號(hào)，并對(duì)傳聲器所拾取的聲信號(hào)進(jìn)行預(yù)處理，忽略其中的平穩(wěn) 態(tài)噪聲殘留屯(n)，得到預(yù)處理后的聲信號(hào)為： X (n) = S (n) +屯(n); 其中，x(n)為預(yù)處理后的聲信號(hào)，s(n)為預(yù)處理后的聲信號(hào)中的目標(biāo)語(yǔ)音成分，dt(n) 為預(yù)處理后的聲信號(hào)中的瞬態(tài)噪聲成分； 2) 對(duì)x(n)進(jìn)行分峽、預(yù)白化處理，基于預(yù)白化后濁音和瞬態(tài)噪聲的波形分布特性差異，對(duì)x(n)逐峽檢測(cè)是否含有瞬態(tài)噪聲； 3) 對(duì)X(n)進(jìn)行重建，瞬態(tài)噪聲與語(yǔ)音信號(hào)同時(shí)存在時(shí)，將X(n)中包含有瞬態(tài)噪聲的峽丟棄，或?qū)(n)中包含有瞬態(tài)噪聲的峽及其后的2-3峽一并舍棄，再利用去除峽的前后相鄰的未受干擾峽進(jìn)行波形重建，替換掉原有的信號(hào)。
2. 根據(jù)權(quán)利要求1所述的基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法，其特征在于，所述步驟 2)中，對(duì)x(n)逐峽檢測(cè)是否含有瞬態(tài)噪聲的步驟如下： 2. 1)對(duì)x(n)進(jìn)行分峽、預(yù)白化處理，得到x(n)的白化信號(hào)，將x(n)的白化信號(hào)中的各峽信號(hào)記為：
其中，種/(，/)為x(n)的白化信號(hào)中的第1峽信號(hào)的第k個(gè)樣本點(diǎn)，X也1)為原始信號(hào) 進(jìn)行分峽處理后的第1峽信號(hào)的第k個(gè)樣本點(diǎn)，P為線性預(yù)測(cè)的階數(shù)，為第1峽信號(hào)的線性預(yù)測(cè)系數(shù)，X化-P，1)為原始信號(hào)進(jìn)行分峽處理后的第1峽信號(hào)的第k-p個(gè)樣本點(diǎn)； 2.2) 加入窗函數(shù)計(jì)算x(n)的白化信號(hào)各峽的重也，具體計(jì)算公式為：
其中，CQ)為x(n)的白化信號(hào)第1峽的重也，W化）為漢寧窗，N為x(n)的白化信號(hào)中每峽的采樣點(diǎn)數(shù)量； 2.3) WC(1)為中也，計(jì)算包含E%能量所需的時(shí)間長(zhǎng)度BQ)，具體計(jì)算公式為：
其中，niijn是指取能使
成立的V的最小取值，E%=90% ;

2. 4)根據(jù)B (1)值判斷信號(hào)中是否存在瞬態(tài)噪聲，如果B (1) < thr，則判定信號(hào)中存在瞬態(tài)噪聲，thr為預(yù)先設(shè)定的瞬態(tài)噪聲判斷口限。
3. 根據(jù)權(quán)利要求2所述的基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法，其特征在于，所述步驟 2.。中，N = 512。
4. 根據(jù)權(quán)利要求2所述的基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法，其特征在于，所述步驟 2. 4)中，t虹=150。
5. 根據(jù)權(quán)利要求1所述的基于語(yǔ)音重建的瞬態(tài)噪聲抑制方法，其特征在于，所述步驟 3)中，對(duì)x(n)進(jìn)行重建的步驟如下： 3. 1)利用基音周期檢測(cè)方法對(duì)丟棄峽之前的封包進(jìn)行基音周期檢測(cè)，得到的前向基音周期Pf，對(duì)丟棄峽之后的封包進(jìn)行基音周期檢測(cè)，得到后向基音周期Pb，并確定丟棄峽前一封包的周期波形及后一封包的周期波形；對(duì)于x(n)中的丟棄峽，對(duì)該些丟棄峽之前的封包與之后的封包進(jìn)行基音檢測(cè)，并判斷是否為濁音，如果前后峽都是濁音，則轉(zhuǎn)至步驟3. 2)，反之則轉(zhuǎn)至步驟3. 3); 3. 2)在丟棄峽的前、后封包均為濁音的情況下，先對(duì)前、后封包的周期波形進(jìn)行相位同步，再根據(jù)丟棄峽長(zhǎng)度確定該丟棄峽所需的重建周期波形個(gè)數(shù)及各重建周期波形長(zhǎng)度，然后進(jìn)行周期波形內(nèi)差重建語(yǔ)音，具體重建方

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2