基于頻譜分析的超低時延音頻處理方法與系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及音頻信號處理領(lǐng)域,涉及基于頻譜分析的超低時延音頻處理方法及系統(tǒng)。該方法包括步驟1對輸入的時域音頻信號進行分幀和短時頻域變換;步驟2對短時頻域變換后的音頻信號經(jīng)頻域功能函數(shù)進行分析處理,得出各個時頻單元的增益;步驟3對所述各個時頻單元的增益進行優(yōu)化;步驟4將優(yōu)化后的增益作為合成線性相位的FIR濾波器的頻響特征,通過頻率抽樣設(shè)計法計算得到FIR濾波器系數(shù);步驟5,將FIR濾波器系數(shù)作用到FIR濾波器中,通過將步驟1的時域音頻信號直接進行FIR濾波器濾波得到期望輸出的音頻信號。該系統(tǒng)包括短時頻域變換模塊,信號處理模塊,平滑濾波模塊,濾波器系數(shù)計算模塊和濾波器應(yīng)用模塊,本發(fā)明能降低實時信號處理的群時延。
【專利說明】
基于頻譜分析的超低時延音頻處理方法與系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及音頻信號處理領(lǐng)域,尤其針對數(shù)字助聽器的實時聲音信號處理功能, 提供超低時延的頻譜分析方法及處理系統(tǒng)。
【背景技術(shù)】
[0002] 目前在語音/音頻信號處理領(lǐng)域,基于頻譜分析的信號處理是極為常見做法。例 如,均衡器,降噪,頻譜搬移,反饋信號消除等最長見技術(shù)均是在頻譜分析的基礎(chǔ)上完成的。 為了精確的分析頻域信號特性,我們需要較高的頻譜分辨率,但是越高的頻譜分辨率會帶 來更高的信號群延時。
[0003] 群延時在電話,手機,耳機,助聽器和人工電子耳蝸等音頻設(shè)備中至關(guān)重要,引入 額外的信號通路延時可能對這些設(shè)備的性能和可用性造成重大的影響。在數(shù)字助聽器中, 佩戴者自己說話的聲信號會通過氣導(dǎo)、骨導(dǎo)及助聽器放大傳輸?shù)脚宕髡叩亩せ蝈N骨。其 中,通過助聽器的聲信號會延遲數(shù)毫秒。當聲通道信號與放大信號疊加時,因不同頻率的相 位變化率不同,會造成某些頻段聲音的抵消,某些頻段聲音的放大。這個叫做梳狀濾波效 應(yīng)。梳狀濾波效應(yīng)會變化助聽器本身的原始頻響,而這個影響會隨著延時增大變得更加明 顯 [7]。另一方面,系統(tǒng)延時本身也會影響助聽器的聽感一一若延時5ms,用戶便可以感知到 聲延時[1];若延時1 〇ms,用戶會對自己發(fā)出的聲音產(chǎn)生聽感上的混淆;15ms以上的延時會降 低語音辨析度[2]。因此,系統(tǒng)延時越小越好,而在助聽器中系統(tǒng)延時最大不可超過l〇ms,不 然會對患者使用帶來反面影響。
[0004] 在音頻處理中,一般我們會通過快速傅里葉變換(FFT)頻域分析法實現(xiàn)多頻帶處 理。根據(jù)FFT得出的頻譜信號,進行一系列的頻域信號處理,得出處理后的頻譜數(shù)據(jù)。再使 用快速傅里葉逆變換(IFFT)重疊相加合成還原相應(yīng)時域輸出信號,如圖1所示。
[0005] 此時,系統(tǒng)群延時包括A/D轉(zhuǎn)換延時,信號處理延時,以及算法處理帶來的延時,表 示為:
[0006] Dgr〇up = Dad+Dp+Dwin (1)
[0007] 其中Dad是A/D轉(zhuǎn)換器把采集到的數(shù)據(jù)存入FIFO緩存所產(chǎn)生的延時,DP是處理一幀 信號所產(chǎn)生的延時,D win是因系統(tǒng)窗結(jié)構(gòu)引起的延時,屬于算法延時。不同的系統(tǒng)根據(jù)需求 會引用不同窗函數(shù),甚至選擇不同的系統(tǒng)結(jié)構(gòu)。窗不僅可以處理幀與幀之間信號處理上的 不連續(xù)性,同時也可以提高頻譜分析特性 [2]。
[0008]在實時信號處理系統(tǒng)中,信號采樣時間與信號處理時間均等于一幀信號長度,即:
[0009] DP = R/fs(2)
[0010] ---------------------------------------------
[0011] DAD = R/fs (3)
[0012]式⑵,⑶中R是一幀信號的長度,fS是采樣率。
[0013] 這樣,式(1)可被簡化成:
[0014] Dgr〇up = 2R/fs+Dwin (4)
[0015] WOLA(Weighted Overlap Add)【11】是助聽器領(lǐng)域使用最廣使用的時頻分析方法, 其系統(tǒng)框圖如圖2所示。時域輸入信號為x(n,r),時域輸出信號為y(n,r)。其中n代表輸入 幀,r代表幀內(nèi)采樣點。時域輸入信號x(n,r)經(jīng)過W0LA分析模塊運算得出頻域信號X(n,k),k 是頻域子帶序號。處理模塊通過頻域輸入信號X(n,k)計算期望增益G(n,k)。處理模塊包括 助聽器系統(tǒng)包含的所有頻域處理算法,如WDRC,降噪,反饋抑制等。G(n,k)為所有算法輸出 增益整合后的值。頻域輸入信號X(n,k)應(yīng)用期望增益G(n,k)后得出頻域輸出信號Y(n,k),Y (n,k)通過W0LA合成模塊轉(zhuǎn)換為時域輸出信號y (n,r)。
[0016] W0LA分析(WOLA-Analysis)的處理過程如圖3所示,輸入序列x(n,r),存到長度為 La的輸入緩沖,與長度為La的分析窗Wa加權(quán)處理;將加權(quán)后的序列分成若干組,每組長度為 N,然后將各組序列累加,再進行循環(huán)位移;最后通過快速傅里葉變換得到頻域輸入信號X (n,k)〇
[0017] W0LA綜合是W0LA分析的逆過程,如圖4所示。其中,Ws是長度為Ls的合成窗;由圖3 和圖4可知,分析窗和合成窗的長度分別為La和Ls,因此W0LA系統(tǒng)的窗延時為
[0018] Dwin=((La+Ls)/2-R)/fs (5)
[0019] 從而可以得出W0LA群延時
(6)
[0021]目前助聽器行業(yè)普遍采用16kHz采樣,32個子帶(K = 32,N = 64)的信號處理系統(tǒng)。 因 TOLA窗長度限制,參照優(yōu)選窗配置表【12】,選一對32子帶的窗選項,即:La= 128,Ls = 64,N =64,R= 16,代入到式(6),可計算對應(yīng)群延時
[0022]然而,助聽器若想采用更高的頻率分辨率,比如,采用N=128,那對應(yīng)的系統(tǒng)群延 時會達到約14ms。這已經(jīng)超過了助聽器延時不能超過10ms的經(jīng)驗限制。
[0023] 根據(jù) 1961 年Eberhard Zwicker發(fā)布的聲學臨界帶寬模型(Bark scale critical band)[13],人耳蝸低頻段臨界帶寬范圍在80Hz至160Hz之間。換句話說,一個16KHz采樣率的 助聽器系統(tǒng),若要達到人耳聽覺系統(tǒng)的頻率分辨率,那至少需要100個線性頻帶(N=200)。
[0024] 總而言之,系統(tǒng)群延時影響了助聽器等實時音頻系統(tǒng)的實時性與準確性,也限制 了頻率分辨率的提高,而如何能夠提供一種降低實時音頻系統(tǒng)群延時的方法成為了本領(lǐng)域 技術(shù)人員迫切解決的問題。
【發(fā)明內(nèi)容】
[0025] 解決上述技術(shù)問題,本發(fā)明提出了一種基于頻譜分析的超低時延音頻處理方法及 系統(tǒng),可以大幅度降低實時信號處理的群時延。
[0026] 為了達到上述目的,本發(fā)明所采用的技術(shù)方案是,一種基于頻譜分析的超低時延 音頻處理方法,如圖5所示,包括以下步驟:
[0027] 步驟1,對輸入的時域音頻信號進行分幀和短時頻域變換;
[0028] 步驟2,對短時頻域變換后的音頻信號,經(jīng)頻域功能函數(shù)進行分析處理,得出各個 時頻單元的增益;
[0029] 步驟3,對所述各個時頻單元的增益進行優(yōu)化,以降低音質(zhì)失真;
[0030] 步驟4,將優(yōu)化后的增益作為合成線性相位的FIR濾波器的頻響特征,通過頻率抽 樣設(shè)計法計算得到FIR濾波器系數(shù);
[0031] 步驟5,將FIR濾波器系數(shù)作用到FIR濾波器中,通過將步驟1的時域音頻信號直接 進行FIR濾波器濾波得到期望輸出的音頻信號。
[0032] 進一步的,所述步驟1中的短時頻域變換為加權(quán)重疊相加分析(Weighted Overlap Add Analysis,W0LA-a)〇
[0033]進一步的,所述步驟2中的分析處理是根據(jù)具體算法功能的需求計算相應(yīng)的增益, 具體算法功能包含寬動態(tài)范圍壓縮算法,頻譜降噪算法等任意頻域聲音信號處理算法。 [0034]進一步的,所述步驟3中的優(yōu)化包括,采用加重移動平均模型(Weighted MovingAverage Method)【4】,如式(7)所不:
(7)
[0036] 其中k為子帶序號;M為平滑的長度,在這里選為奇數(shù);a為平滑向量。
[0037] 進一步的,所述步驟4中的合成線性相位的FIR濾波器,具體包括:
[0038]使用頻率抽樣設(shè)計法設(shè)計FIR濾波器,把步驟3所得的增益值當作理想的頻率響 應(yīng),同時確保線性相位,如式(8)~(9)所示:
[0039]當N為偶數(shù)時,
[0041 ] 當N為奇數(shù)時,
[0043] 式中N為WOLA-a處理時FFT的點數(shù);
[0044] 將上述的濾波器的頻率響應(yīng)H(k)進行傅里葉逆變換(IFFT)得濾波器的系數(shù)h(n), 濾波器的長度為n = N。
[0045] 更進一步的,因本發(fā)明的輸入信號是直接通過FIR濾波器濾波得出期望的輸出信 號,并沒有通過窗函的分析或合成,這樣本發(fā)明的群延時公式變化為:
[0046] D?P = Dad +Dp+ Dmer (10)
[0047] 其中,DFilter是FIR濾波過程所產(chǎn)生的延時,其延時時長為:
[0049]其中,n為濾波器介數(shù)。 (11) (12)
[0050]因 n = N,可以得出本發(fā)明的群延時公式:
[0052] 本發(fā)明通過使用自適應(yīng)FIR濾波器實現(xiàn)信號處理。通過式(6)減去式(12)可得出本 發(fā)明相對傳統(tǒng)W0LA信號處理系統(tǒng)的延時差異公式,如式(13)。
(13)
[0054]在W0LA濾波器組的參數(shù)設(shè)置當中,分析窗,合成窗和FFT的點數(shù)必須滿足La多Ls多 N彡2R;同時,La,Ls,N,R之間要滿足倍數(shù)關(guān)系[11]。另外,在OnsemiConductor公司提供的最 優(yōu)化的W0LA配置 [12]中,分析窗至少為幀長的4倍,即La》4R;合成窗至少為幀長的2倍,即Ls 彡2R。上述條件通過式(13)可得出:
(14)
[0056]因此,我們可以得出結(jié)論:本發(fā)明一種基于頻譜分析的超低時延音頻處理方法相 對W0LA系統(tǒng)至少減少了1幀長度的群延時。
[0057]相應(yīng)的,本發(fā)明還公開了一種基于頻譜分析的超低時延音頻處理系統(tǒng),包括:
[0058] 短時頻域變換模塊,用于將輸入的時域音頻信號進行分幀并變換到頻域;
[0059] 信號處理模塊,用于對所述的短時頻域變換后的音頻信號,計算系統(tǒng)所需的增益;
[0060] 平滑濾波模塊,用于對所述的各個時頻單元的增益進行平滑,以降低音質(zhì)失真;
[0061] 濾波器系數(shù)計算模塊,用于對所述的平滑后的增益使用頻率抽樣設(shè)計法,計算濾 波器的系數(shù);
[0062] 濾波器應(yīng)用模塊,用于將輸入的時域音頻信號通過所述的合成濾波器得到最終的 時域音頻信號輸出。
[0063] 本發(fā)明通過采用上述技術(shù)方案,與現(xiàn)有技術(shù)相比,具有如下優(yōu)點:本發(fā)明提出的基 于頻譜分析的超低時延音頻處理方法有效降低了算法延時,從而大幅度降低實時信號處理 的群時延,并沒有產(chǎn)生信號失真或諧波過大等不良效應(yīng)。
[0064]本發(fā)明提出的基于頻譜分析的超低時延音頻處理系統(tǒng),同樣降低了理論系統(tǒng)延 時,提尚了廣品的性能。
【附圖說明】
[0065]圖1信號頻域處理系統(tǒng)框圖。
[0066]圖2 W0LA濾波器組處理系統(tǒng)框圖。
[0067]圖3 W0LA濾波器組處理系統(tǒng)流程圖。
[0068] 圖4 W0LA分析處理系統(tǒng)框圖。
[0069]圖5 W0LA合成處理系統(tǒng)框圖。
[0070]圖6是本發(fā)明實施例的WDRC處理系統(tǒng)框圖。
[0071]圖7是本發(fā)明實施例的WDRC輸入輸出曲線圖。
[0072]圖8為算法延時對比圖。
[0073]圖9為原始輸入時幅圖。
[0074]圖10為WOLA合成方式輸出時幅圖。
[0075]圖11為FIR濾波方式輸出時幅圖。
[0076]圖12為原始輸入時頻圖。
[0077]圖13為W0LA合成方式輸出時頻圖。
[0078]圖14為FIR濾波方式輸出時頻圖。
【具體實施方式】
[0079]現(xiàn)結(jié)合附圖和【具體實施方式】對本發(fā)明進一步說明。
[0080]作為一個具體的實施例,本發(fā)明采用基于超低時延FIR合成濾波器的寬動態(tài)范圍 壓縮(WDRC)方法,如圖6所示,主要包括如下步驟:
[0081 ]步驟1,輸入緩沖更新與短時頻域變換:即對輸入的時域音頻信號進行分幀和短時 頻域變換;
[0082] 步驟2,頻域信號處理:對短時頻域變換后的音頻信號,經(jīng)頻域功能函數(shù)進行分析 處理,得出各個時頻單元的增益;具體包含通道劃分及通道能量估計、平滑處理、通道壓縮 增益計算、子帶增益計算;
[0083] 步驟3,增益平滑:對所述各個時頻單元的增益進行優(yōu)化,以降低音質(zhì)失真;
[0084] 步驟4,濾波器系數(shù)計算:將優(yōu)化后的增益作為合成線性相位的FIR濾波器的頻響 特征,通過頻率抽樣設(shè)計法計算得到FIR濾波器系數(shù);
[0085] 步驟5,F(xiàn)IR濾波器濾波:將FIR濾波器系數(shù)作用到FIR濾波器中,通過將步驟1的時 域音頻信號直接進行FIR濾波器濾波得到期望輸出的音頻信號。
[0086] 緩沖區(qū)的輸入信號經(jīng)過短時頻域變換分成若干個子帶(或說成頻帶)。將幾個子帶 進行組合分成數(shù)個獨立的頻率區(qū)域,這些頻率區(qū)域叫做通道。通道劃分及通道能量估計要 根據(jù)人耳對頻率的感知特性進行能量與聲壓級的計算 [9:^WDRC的目的是根據(jù)每個通道的輸 入聲壓級,把輸出聲壓級壓縮至目標增益。目標增益是目標公式根據(jù)患者聽損,及患者的其 他信息(聽損類型,性別,年齡,耳腔結(jié)構(gòu)等)計算得出的 [7]。通常,PC端的驗配軟件會通過目 標曲線預(yù)先計算出WDRC所需的閾值,壓縮比等信息,存入助聽器芯片中方便調(diào)用。增益還原 步驟是將通道增益還原成子帶的增益。增益平滑步驟通過對各子帶的壓縮增益進行平滑, 以降低由于子帶間的壓縮增益偏差過大引起的吉布斯失真現(xiàn)象 [8]。濾波器系數(shù)計算步驟通 過平滑后的增益做為頻率響應(yīng),使用頻率抽樣設(shè)計法計算FIR濾波器系數(shù)。FIR濾波器濾波 是將濾波器系數(shù)作用在FIR濾波器上,實時更新,再將輸入信號通過濾波器濾波,得到聲音 壓縮效果。
[0087]在本發(fā)明優(yōu)選實施例中,采樣率為16kHz,采樣精度為16bit,信號以幀為單位進行 處理,幀長是2ms,即每幀的采樣點數(shù)R=32。時頻變換方法采用加權(quán)重疊相加分析(W0LA-&),其中,1^ = 256,1^ = 128 4=128,選擇偶型變換。對應(yīng)的時頻變換后的頻域子帶數(shù)1(= 64。將第n幀信號x(n,r)通過時頻變換后得到第n幀的頻域信號X(n,k)。其中kG[0,K-l],表 示子帶數(shù)。
[0088] 進一步的,因 X(n,k) =a(n,k)+b(n,k) X i,X(n,k)可分為實部和虛部,分別為a (n,k)、b(n,k)〇
[0089]圖6中示出的基于超低時延FIR合成濾波器的寬動態(tài)范圍壓縮(WDRC)實現(xiàn)方法實 施例包括:
[0090]以下將上述步驟1至步驟5進一步展開,步驟1展開為步驟S1和步驟S2,步驟2展開 為步驟S3至S5,步驟3展開為步驟S6,步驟4展開為步驟S7和步驟S8,步驟5展開為步驟S9。 [0091 ]步驟S1,圖6中的短時頻域變換模塊采用加權(quán)重疊相加分析(WOLA-a),對經(jīng)麥克風 采集、模數(shù)變換后的時域信號x(n,r)進行時頻變化得到頻域信號X(n,k);
[0092]步驟S2,圖6中的通道能量計算模塊與子帶增益計算模塊采用人耳模型ERB (equivalent rectangular bandwidth)頻標[5],進行通道分割與子帶還原。其通道分割點 的設(shè)定分別為:187.5Hz、562.5Hz、1062.5Hz、2062.5Hz、3737.5Hz、8000Hz。這樣我們就可以 將0~187.5Hz頻段所包含的子帶都劃到通道1里來,將187.5~562.5Hz頻段所包含的子帶 都劃到通道2里來,對于其他通道數(shù)的情況,依次類推。其次,通過均方根公式計算通道能量 Prms,并轉(zhuǎn)換為聲壓級(Sound Pressure Level,SPL,單位為dB SPL)。因不同的麥克風有不 同的輸入靈敏度,因此,此時得出的聲壓級Prms需要與麥克風靈敏度Senmi。結(jié)合才是助聽器 接收到的實際的聲信號聲壓級。其具體步驟如下:假設(shè)通道M內(nèi)有K個子帶,而通道1~m-1共 有M個子帶,則通道m(xù)的能量均方根P RMS(m)為:
[0094] 聲壓級的定義為將待測聲壓有效值p(e)與參考聲壓p(ref)的比值取常用對數(shù), 再乘以20,即:
1,其中參考聲壓P(ref)-般取空氣參考聲壓,為2X 1〇_5帕。所以,通道m(xù)的聲壓級SPL(m):
[0095] SPL(m) =201ogio(PRMs(m) )+Senmic+94 (16)
[0096]其中,Senmi。為麥克風靈敏度,94為轉(zhuǎn)換到dB域上的參考聲壓。
[0097]步驟S3,頻域信號處理部分中的平滑處理采用壓縮釋放公式進行,如式(17)所示, 得出平滑后的輸入聲壓級YspiXm): if SPL (/?, m) > Ysr, m) YSPl [njn) = (\ - a) y. YSPL (? -1, m) + a x SPL(n, m)
[0098] q]:s& (17) Ysri [n,m ) = {X - {3) y. Ysr/ (n-1,m) + ^ x SPL (n, m) end
[0099] 其中a為跟蹤時間(Attack Time)系數(shù),0為釋放時間(Release Time)系數(shù)。其取值 方法為
,其中R為一幀的采樣點數(shù),fS為采樣率,T為時間常數(shù)。在本次優(yōu) 選實例中跟蹤時間常數(shù)為12ms;當通道的中心頻率小于500Hz時釋放時間常數(shù)為125ms,大 于500時為70ms。
[0100]步驟S4,通道壓縮增益計算模塊根據(jù)YSPL(n,m)和設(shè)置好的輸入/輸出函數(shù)關(guān)系曲 線計算壓縮增益。輸入/輸出函數(shù)關(guān)系曲線如圖7所示,
[0101]壓縮比定義為
[0103] 通道壓縮增益可以通過壓縮比,輸入拐點得出。因聲壓級處于對數(shù)域,所以該通道 的經(jīng)過動態(tài)范圍壓縮處理后的增益的計算要用如下公式計算:
[0105] 其中LTh為WDRC輸入拐點,m為通道數(shù)。在本發(fā)明的優(yōu)選實例中,壓縮比設(shè)定為CR = 3:1;輸入拐點設(shè)定為LTh = 45dB SPL。
[0106] 步驟S5,子帶增益計算模塊對所述的各個通道的增益還原成各個時頻單元的增 益,也就是使通道內(nèi)的子帶增益等于該通道的增益。
[0107] 步驟S6,圖6中增益平滑模塊將步驟5所述的各個時頻單元的增益通過式(7)提到 的加重移動平均方法進行平滑,以進一步降低音質(zhì)失真。在優(yōu)選實例中使用5點平滑,即M = 5,對應(yīng)的平滑向量a如式(20)所示。
[0108] a= [0.07,0.25,0.36,0.25,0.07] (20)
[0109] 步驟S7,所述的合成線性相位的FIR濾波器,使用頻率抽樣設(shè)計法設(shè)計FIR濾波器, 把步驟6所得的增益值當作理想的頻率響應(yīng)進行計算。其中,增益值均為實數(shù)。為了保證信 號連續(xù)性,濾波器要確保線性相位,具體公式如式(21):
[0111] 步驟S8,將H(k)進行IFFT得到濾波器系數(shù)h(n)。上述的步驟7與步驟8屬于圖6中的 濾波器系數(shù)計算模塊。
[0112] 步驟S9,對用圖6中FIR濾波器模塊,將步驟8所述的濾波器系數(shù)h(n)應(yīng)用到FIR濾 波器中,對輸入的時域信號進行濾波,得到期望的輸出信號。
[0113] 為了表述本發(fā)明提出的基于頻譜分析的超低時延音頻處理系統(tǒng)有更小的群延時, 通過式(11)計算本發(fā)明的FIR濾波延時:
(22)
[0115] 通過式(5)計算利用W0LA合成方式的窗延時:
[0116] Dwin=((256+128)/2-32)/fs = 160/fs (23)
[0117] 圖8為通過仿真輸入單位沖擊信號測試系統(tǒng)延時的結(jié)果。仿真過程沒有加入A/D采 樣與系統(tǒng)處理時間,因此,圖形上只包含算法部分帶來的延時(即窗延時或濾波器延時)。圖 8(上)為輸入單位沖擊信號,其沖擊點在第100個采樣點。圖8(中)為通過W0LA合成得出的輸 出信號,其沖擊點在第260點。圖8(下)為本發(fā)明一一通過FIR濾波得出的輸出信號,其沖擊 點在第163點與164點之間。也就是說,采用W0LA合成方式的系統(tǒng)延時為160個采樣點,采用 時變FIR濾波方式的系統(tǒng)延時為63.5個采樣點,這與式(22),式(23)計算得出的結(jié)果相吻 合。 (24)
[0118]同樣的,可以通過式(6)與式(12)分別計算使用W0LA合成方式的系統(tǒng)群延時 !>=;;,以及使用FIR濾波方式的系統(tǒng)群延時:
(25)
[0122] 由此可見,傳統(tǒng)的W0LA系統(tǒng)若采用64子帶的頻率分辨率,在16KHz采樣率下系統(tǒng)延 時達到了 14ms,顯然是不可接受的。然而,本發(fā)明提出的基于頻譜分析的超低時延音頻處理 方法在同樣采樣率與頻率分辨率下只產(chǎn)生了 8ms的系統(tǒng)延時,在助聽器可接受的延時時長 范圍內(nèi)。
[0123] 再者,通過掃頻信號對WDRC壓縮效果進行測試。測試音頻輸入聲壓級為94dBSPL, 掃頻頻率從〇Hz到8000Hz;通道的壓縮比均設(shè)為3,壓縮拐點設(shè)在45dB。圖9為歸一化的掃頻 輸入信號的時域圖。參考聲壓設(shè)定為94,因此,歸一化后的OdB代表系統(tǒng)中94dB SPL。圖10, 圖11分別為通過W0LA合成得出的時域信號與本發(fā)明提出的通過時變FIR濾波得出的時域輸 出信號。參照圖9,圖10和圖11可知,掃頻頻率經(jīng)過子帶分割點與同道分割點時均產(chǎn)生了對 應(yīng)的能量抖動。圖12,圖13和圖14是對應(yīng)圖9,圖10和圖11的時頻圖。圖13和圖14與圖12比較 可知,兩種方法均在頻域上產(chǎn)生了一定量的諧波,W0LA合成方式產(chǎn)生的諧波比FIR濾波方式 產(chǎn)生的諧波較多一些。
[0124] 總之,本發(fā)明提出的基于頻譜分析的超低時延音頻處理方法有效降低了算法延時 60.31%,降低了理論系統(tǒng)延時42.86%,并沒有產(chǎn)生信號失真或諧波過大等不良效應(yīng)。
[0125] 相應(yīng)的,本實施例還公開了一種基于頻譜分析的超低時延音頻處理系統(tǒng),包括:
[0126] 短時頻域變換模塊,用于將輸入的時域音頻信號進行分幀并變換到頻域;
[0127] 信號處理模塊,用于對所述的短時頻域變換后的音頻信號,計算系統(tǒng)所需的增益;
[0128] 平滑濾波模塊,用于對所述的各個時頻單元的增益進行平滑,以降低音質(zhì)失真;
[0129] 濾波器系數(shù)計算模塊,用于對所述的平滑后的增益使用頻率抽樣設(shè)計法,計算濾 波器的系數(shù);
[0130] 濾波器應(yīng)用模塊,用于將輸入的時域音頻信號通過所述的合成濾波器得到最終的 時域音頻信號輸出。
[0131] 盡管結(jié)合優(yōu)選實施方案具體展示和介紹了本發(fā)明,但所屬領(lǐng)域的技術(shù)人員應(yīng)該 明白,在不脫離所附權(quán)利要求書所限定的本發(fā)明的精神和范圍內(nèi),在形式上和細節(jié)上可以 對本發(fā)明做出各種變化,均為本發(fā)明的保護范圍。
[0132] 參考文獻:
[0133] [l]Moir J.(1976)0n differential time delay.J Audio Eng Soc,24(9):752〇
[0134] [2]Stone MA,Moore BCJ.(2003)Tolerable hearing aid delays.Ill.Effects on speech production and perception of across-frequency variation in delay.Ear&Hear,24(2):175-83〇
[0135] [3]0ppenheim,Alan V.;Schafer,Ronald ff.(1975).Digital signal processing.Englewood Cliffs,N.J.:Prentice-Hall.ISBN 0-13-214635-5〇
[0136] [4]''Weighted Moving Averages:The Basics"? Investopedia〇
[0137] [ 5 ] Smi th,Ju 1 ius 0 ?; Abe 1,Jonathan S ?( 1 OMay 2007 )? "Equi valent Rectangular Bandwidth".Bark and ERB Bilinear Transforms.Center for Computer Research in Music and Acoustics(CCRMA),Stanford University,USA.Retrieved 20January 2013〇
[0138] [7]Harvey Dillon,(2012)?"Hearing Aids".Thieme Medical Publishers Inc; 2.ISBN:1604068108。
[0139] [8]Hewitt,Edwin;Hewitt,Robert E.(1979).^The Gibbs-ffi1braham phenomenon:An episode in Fourier analysis".Archive for History of Exact Sciences 21(2):129-160.doi:10.1007/BF00330404.Retrieved 16September 2011.Available on-line at:National Chiao Tung University:Open Course Ware: Hewitt&Hewitt,1979。
[0140] [9]James M.Kates.Digital Hearing Aids[B]?San Diego,CA 92123:Plural Publishing INC.2008,263-290。
[0141] [10]Zwicker,E.(1961) /Subdivision of the audible frequency range into critical bands,"The Journal ofthe Acoustical Society of America,Volume 33, Issue 2,pp.248_248(1961)〇
[0142] [ll]Brennan,Robert,Schneider,Todd,"A Flexible Filterbank Structure for Extensive Signal Manipulations in Digital Hearing Aids"?Circuits and Systems,1998.ISCAS'98。
[0143] [12]^Reference Manua1:HEAR Configurable Accelerator^,0N Semiconductor,(November 2009)〇
[0144] [13]Julius 0?Smith III and Jonathan S?Abel?"The Bark Frequency Scale",CCRMA.Stanford.edu。
【主權(quán)項】
1. 一種基于頻譜分析的超低時延音頻處理方法,其特征在于:包括以下步驟: 步驟1,對輸入的時域音頻信號進行分幀和短時頻域變換; 步驟2,對短時頻域變換后的音頻信號,經(jīng)頻域功能函數(shù)進行分析處理,得出各個時頻 單元的增益; 步驟3,對所述各個時頻單元的增益進行優(yōu)化,以降低音質(zhì)失真; 步驟4,將優(yōu)化后的增益作為合成線性相位的FIR濾波器的頻響特征,通過頻率抽樣設(shè) 計法計算得到FIR濾波器系數(shù); 步驟5,將FIR濾波器系數(shù)作用到FIR濾波器中,通過將步驟1的時域音頻信號直接進行 FIR濾波器濾波得到期望輸出的音頻信號。2. 根據(jù)權(quán)利要求1所述的一種基于頻譜分析的超低時延音頻處理方法,其特征在于:所 述步驟1中的短時頻域變換為加權(quán)重疊相加分析。3. 根據(jù)權(quán)利要求1所述的一種基于頻譜分析的超低時延音頻處理方法,其特征在于:所 述步驟2中的分析處理是根據(jù)具體算法功能的需求計算相應(yīng)的增益。4. 根據(jù)權(quán)利要求1所述的一種基于頻譜分析的超低時延音頻處理方法,其特征在于:所 述步驟3中的優(yōu)化包括采用加重移動平均模型,如式(7)所示:其中k為子帶序號;M為平滑的長度,在這里選為奇數(shù);a為平滑向量。5. 根據(jù)權(quán)利要求1所述的一種基于頻譜分析的超低時延音頻處理方法,其特征在于:所 述步驟4中的合成線性相位的FIR濾波器,具體包括: 使用頻率抽樣設(shè)計法設(shè)計FIR濾波器,把步驟3所得的增益值當作理想的頻率響應(yīng),同 時確保線性相位,如式(8)~(9)所示:式中N為WOLA-a處理時FFT的點數(shù); 將上述的濾波器的頻率響應(yīng)H(k)進行傅里葉逆變換(IFFT)得濾波器的系數(shù)h(n),濾波 器的長度為n = N。6. 根據(jù)權(quán)利要求5所述的一種基于頻譜分析的超低時延音頻處理方法,其特征在于:輸 入信號是直接通過FIR濾波器濾波得出期望的輸出信號,并沒有通過窗函的分析或合成,群 延時公式為:其中,DFiiter是FIR濾波過程所產(chǎn)生的延時,其延時時長為:其中,η為濾波器介數(shù)。 因 η = Ν,可以得出本發(fā)明的群延時公式:7. -種基于頻譜分析的超低時延音頻處理系統(tǒng),其特征在于:包括: 短時頻域變換模塊,用于將輸入的時域音頻信號進行分幀并變換到頻域; 信號處理模塊,用于對所述的短時頻域變換后的音頻信號,計算系統(tǒng)所需的增益; 平滑濾波模塊,用于對所述的各個時頻單元的增益進行平滑,以降低音質(zhì)失真; 濾波器系數(shù)計算模塊,用于對所述的平滑后的增益使用頻率抽樣設(shè)計法,計算濾波器 的系數(shù); 濾波器應(yīng)用模塊,用于將輸入的時域音頻信號通過所述的合成濾波器得到最終的時域 音頻信號輸出。
【文檔編號】G10L21/0232GK105931649SQ201610194961
【公開日】2016年9月7日
【申請日】2016年3月31日
【發(fā)明人】梁維謙, 馬桂林, 薛行棟, 樸志剛
【申請人】歐仕達聽力科技(廈門)有限公司