專利名稱:音頻編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻編碼。
WO97/28527公開了通過下述方式來提高語音參數(shù)測定背景噪聲PSD估計量,測定噪聲語音參數(shù),測定來自語音參數(shù)的噪聲語音PSD估計量,扣除噪聲語音PSD估計量中背景噪聲PSD估計量,以及對來自增強(qiáng)的語音PSD估計量的增強(qiáng)語音參數(shù)進(jìn)行估計。該增強(qiáng)參數(shù)可以用于過濾噪聲語音,以便抑制噪聲或直接用作語音編碼中的語音參數(shù)。參數(shù)和PSD估計通過自動回歸模型而獲得。應(yīng)注意到在該文獻(xiàn)中,這種估計量不是統(tǒng)計一致的估計量,但是在語音信號處理中這并不是一個嚴(yán)重問題。
本發(fā)明的目的是提供有益的音頻編碼。為實(shí)現(xiàn)此目的,正如獨(dú)立所限定的是,本發(fā)明提供對音頻信號進(jìn)行編碼/解碼的方法、音頻編碼器、音頻播放器、音頻系統(tǒng)、編碼的音頻信號和存儲媒質(zhì)。在從屬權(quán)利要求中對有益的根據(jù)本發(fā)明的第一方面,參數(shù)ARMA模型用于模型化音頻信號中的噪聲成分,所述噪聲成分是通過從音頻信號中減去基本波形而獲得的。通常,音頻信號可以包括音頻,例如音樂,而且也包括語音。根據(jù)本發(fā)明,噪聲成分的ARMA模型有另外的優(yōu)點(diǎn)在可相比擬的精確度下,對于噪聲成分的精確模型來說,其需要的參數(shù)比全AR或MA模型的情形要少。特別是,較少的參數(shù)意味著更好的抑制。
本發(fā)明使用適合于實(shí)時實(shí)施的ARMA估算模型。本發(fā)明認(rèn)識到在傳遞功率譜估算信息方面,AR或MA模型并不總是足夠精確或節(jié)儉的。在對數(shù)標(biāo)度上,利用線性預(yù)報編碼(LPC)方法(全極點(diǎn)模型(all-pole modeling)),通常能很好地模型化函數(shù)的波峰,但是波谷卻估算不足。相反的情況發(fā)生在全零點(diǎn)模型(all-zero model)上。在音頻和語音編碼中,對數(shù)標(biāo)度比線性標(biāo)度更合適。因此,在對數(shù)標(biāo)度上對于功率譜的好擬合是優(yōu)選的。根據(jù)本發(fā)明的模型給出了復(fù)雜度和精確度之間更好的折衷方案。該模型中的誤差能夠在對數(shù)標(biāo)度上進(jìn)行計算。
在本發(fā)明的第一實(shí)施例中,將模型化的波譜分解成第一部分和第二部分,其中第一部分通過第一模型而模型化,以便獲得自動回歸參數(shù),第二部分通過第二模型而模型化,以便獲得運(yùn)動平均(moving-average)參數(shù)。這些分支過程的結(jié)合便提供了精確的ARMA模型。分解優(yōu)選在迭代過程中執(zhí)行。在根據(jù)本發(fā)明的方法中,可能忽略非線性最優(yōu)化問題。
在本發(fā)明的優(yōu)選實(shí)施例中,第二模型操作包括對目標(biāo)波譜第二部分的倒數(shù)使用第一模型操作的步驟。在該實(shí)施例中,僅需要確定一個模型操作,其中自動回歸參數(shù)通過波譜的第一部分模型化而獲得,運(yùn)動平均參數(shù)按照相同的方式,即第一模型操作,通過波譜的第二部分的倒數(shù)模型化而獲得。盡管是次優(yōu)選,但是使用第二模型操作以及對于波譜的一部分的倒數(shù)使用相同的第二模型操作以獲得自動回歸參數(shù)也是可能的,第二模型操作在第二部分產(chǎn)生運(yùn)動平均參數(shù)。
Introduction to Spectral analysis(波譜分析介紹)第101-108頁(P.Stoica和R.L.Moses,Prentice Hall,New Jersey,1997)公開了用于模型化合理波譜的參數(shù)方法。通常,通過使用全零點(diǎn)過濾器過濾白噪聲而獲得運(yùn)動平均(MA)信號。由于該全零點(diǎn)結(jié)構(gòu),除非選擇的MA的階“足夠大”,否則使用MA公式來模型化帶有尖峰的波譜是不可能的。這勢必與自動回歸(AR)的能力、或者全極點(diǎn)(all-pole)以及通過其階相當(dāng)小的模型來模型化窄波段譜的公式相反。MA模型對具有寬峰和窄啞點(diǎn)(sharp null)特征的這些波譜提供了很好的近似。波譜的應(yīng)用沒有窄波段譜頻繁,因此,把MA信號模型用于波譜估計時,在某種程度上工程有益效果是有限的。該有限的有益效果的另一個原因在于,MA參數(shù)估算問題基本上是非線性的問題,該問題比AR參數(shù)估算問題更加難以解決。在任何情形下,在MA和ARMA的估算問題上的各種困難是相當(dāng)類似的。
既帶有尖峰又帶有深零位(deep null)的波譜不能夠通過合理的小階AR或MA公式而模型化。只有在更普遍的ARMA模型(也稱為極點(diǎn)-零點(diǎn)(pole-zero)模型)下才是可用的。然而ARMA波譜估算最初巨大的前景逐漸減小到某種程度,因?yàn)閷τ贏RMA參數(shù)估算,無論是從在理論上還是從在實(shí)踐觀點(diǎn)上來說,都還沒有建立很好的算法?!袄碚撟顑?yōu)化ARMA估計量(estimator)”建立在迭代過程的基礎(chǔ)上,但不能保證該迭代過程的整體收斂?!皩?shí)際ARMA估計量”是容易計算的并且通常是可靠的,但是在某些情況下它們的統(tǒng)計精確度可能很低?,F(xiàn)有技術(shù)公開了兩級(two stage)模型,在該模型中,首先執(zhí)行AR估算,然后執(zhí)行MA估算。兩種方式都能給出非精確的估計值或者都需要龐大的計算工作量。在這些情況下,ARMA模型描述的極點(diǎn)和零點(diǎn)在單位圓附近的位置緊密地靠近在一起。這些ARMA模型具有幾乎重合的極點(diǎn)和零點(diǎn)模,并且與窄波段信號對應(yīng)。在兩種方法中,對零點(diǎn)(zero)的估算轉(zhuǎn)移到非線性最優(yōu)化問題上來。
在根據(jù)Stoica和Moses的現(xiàn)有技術(shù)方法中,計算負(fù)擔(dān)存在于矩陣求逆。另外,除了對靠近單位圓的零點(diǎn)階需高一點(diǎn)外,AR模型的階應(yīng)該設(shè)置為哪一個值還不清楚。因此計算的復(fù)雜度很難把握。在根據(jù)本發(fā)明的方法中,計算負(fù)擔(dān)存在于分解過程的迭代性質(zhì)和向頻域的轉(zhuǎn)換(Stoica和Moses基本上在時域進(jìn)行計算)。在零點(diǎn)接近單位圓的情況下,本發(fā)明提供了更好的結(jié)果。而且,向頻域的轉(zhuǎn)換打開了變化的可能性。一個例子是基于現(xiàn)有或測量數(shù)據(jù)產(chǎn)生分裂的頻率。另一優(yōu)點(diǎn)是下面將要解釋的彎曲(warped)頻率數(shù)據(jù)的應(yīng)用。為了保證實(shí)時ARMA模型,應(yīng)采用向頻率的快速轉(zhuǎn)化,例如,本領(lǐng)域公知的Welch的平均頻率圖方法。
自動回歸和運(yùn)動平均參數(shù)能夠以不同的方式表達(dá),例如多項(xiàng)式,多項(xiàng)式(與增益系數(shù)一起)的零點(diǎn),反射系數(shù)或?qū)?shù)(log)(面積)比值。在音頻編碼應(yīng)用中,優(yōu)選以對數(shù)(面積)比值的方式進(jìn)行自動回歸和運(yùn)動平均參數(shù)的表達(dá)。在根據(jù)本發(fā)明的ARMA模型中結(jié)合測定的自動回歸和運(yùn)動平均參數(shù)以獲得透射的過濾參數(shù)。
US5943429A公開了基于數(shù)字通訊系統(tǒng)幀內(nèi)的波譜減法噪聲抑制方法。該方法通過波譜減法函數(shù)執(zhí)行,該減法函數(shù)建立在非語音幀的背景噪聲功率譜密度估算和語音結(jié)構(gòu)功率譜密度估算的基礎(chǔ)上。通過參數(shù)模型近似每一語音幀,該參數(shù)模型減少了自由度的位數(shù)。從近似參數(shù)模型估算每一語音幀的功率譜密度的估計值。同樣在該情形下,參數(shù)模型為AR模型。
US4188667A公開了ARMA過濾器和獲得該過濾器參數(shù)的方法。該方法的第一步涉及執(zhí)行隨機(jī)選擇頻譜振幅的離散逆傅立葉變換,以獲得穩(wěn)定的純運(yùn)動平均模型系數(shù)的舍位結(jié)果,即非遞推過濾器模型參數(shù)。系數(shù)的舍位結(jié)果具有N+1項(xiàng)(term),接著該結(jié)果由隨機(jī)結(jié)果用于卷積(convolve)運(yùn)算以獲得與隨機(jī)結(jié)果相關(guān)的輸出。接著以最小化整數(shù)誤差函數(shù)規(guī)范的方式來執(zhí)行時域、收斂參數(shù)標(biāo)識,從而獲得模型接近最小階的自動回歸和運(yùn)動平均參數(shù),該模型具有所需的振幅和相位-頻率響應(yīng)。這些參數(shù)在離線時確定。該實(shí)施例的目的是提供最小的或接近最小的穩(wěn)定ARMA過濾器。該參數(shù)以成批過濾器程序方式確定。
通常,對功率譜密度函數(shù)估算不同于特征化線性系統(tǒng),特別是這樣的特征可以得到和使用輸入和輸出信號,而在估算功率譜密度函數(shù)時,僅功率譜密度函數(shù)是可得到的(不是相關(guān)的輸入函數(shù))。
本發(fā)明的前述和其它方面將從下述的實(shí)施例及實(shí)施例的解釋而變得清清楚楚在附圖中
圖1表示包括根據(jù)本發(fā)明的音頻編碼器示意性的實(shí)施例;圖2表示包括根據(jù)本發(fā)明的音頻播放器示意性的實(shí)施例;圖3表示根據(jù)本發(fā)明的音頻系統(tǒng)的示意性實(shí)施例;以及圖4表示示例性的映射函數(shù)m。
這些附圖僅表示出理解發(fā)明所需的那些元件。
本發(fā)明優(yōu)選地應(yīng)用在音頻和語音編碼方案中,在該方案中利用了合成噪聲的產(chǎn)生,一般地,在逐幀(frame to frame)的基礎(chǔ)上對音頻信號進(jìn)行編碼。估算幀中的噪聲功率譜密度函數(shù)(或者其可能的非均勻采樣版本),找出來自某等級過濾器的一類振幅平方響應(yīng)最接近的函數(shù)。在本發(fā)明的一個實(shí)施例中,使用迭代程序來估算ARMA模型,以便AR或MA模型符合功率譜函數(shù),所述ARMA模型以現(xiàn)存的低復(fù)雜度技術(shù)為基礎(chǔ)。
圖1表示根據(jù)本發(fā)明示例性的音頻編碼器2。從音頻源(例如麥克風(fēng)、存儲介質(zhì)、網(wǎng)絡(luò)等)獲得音頻信號A。把音頻信號A輸入到音頻編碼器2。在音頻編碼器2內(nèi)在逐幀的基礎(chǔ)上參數(shù)模型化音頻信號A。編碼單元20包括分析單元(AU)200和合成單元(SU)201。AU 200分析音頻信號并確定音頻信號A內(nèi)的基本波形。此外,AU 200產(chǎn)生波形參數(shù)或系數(shù)CI來表達(dá)基本波形。波形參數(shù)Ci提供給SU 201以獲得重構(gòu)音頻信號,該信號包括合成的基本波形。該重構(gòu)的音頻信號提供到減法器21,以從原始的音頻信號A減去該重構(gòu)的音頻信號。其余的信號S看作音頻信號A的噪聲成分。在優(yōu)選實(shí)施例中,編碼單元20包括兩級執(zhí)行瞬時模型化的一級,以及當(dāng)減去模型化的瞬時分量后對音頻信號執(zhí)行正弦模型化的另一級。
根據(jù)本發(fā)明的一方面,在音頻信號A內(nèi)的噪聲成分S的功率譜密度函數(shù)被ARMA模型化,從而產(chǎn)生自動回歸參數(shù)pi和運(yùn)動平均參數(shù)qi。根據(jù)本發(fā)明,在噪聲分析器(NA)22內(nèi)模型化噪聲成分S的波譜,從而獲得過濾器參數(shù)(pi,qi)。通過確定NA 22內(nèi)過濾器的過濾器參數(shù)而執(zhí)行參數(shù)(pi,qi)的估計值,NA 22具有轉(zhuǎn)移函數(shù)H-1,在過濾后其生成函數(shù)S,即H-1(S),波譜過濾得盡可能扁平,即“白噪聲化頻譜”。在解碼器內(nèi),通過利用具有轉(zhuǎn)移函數(shù)H的過濾器過濾白噪聲,從而能夠生成重構(gòu)噪聲成分,其和噪聲成分S具有近似相同的特性,該過濾器與編碼器內(nèi)使用的過濾器相反。該相反過濾器的過濾操作通過ARMA參數(shù)pi和qi確定。過濾器參數(shù)(pi,qi)同波形參數(shù)Ci一起都包括在放大器23中編碼的音頻信號A′內(nèi)。把音頻流A′從音頻編碼器通過通訊頻道3提供到音頻播放器,所述通訊頻道3可以是無線連接、數(shù)據(jù)總線或存儲介質(zhì)等。
參見圖2的實(shí)施例,其包括根據(jù)本發(fā)明的音頻播放器4。音頻信號A′從通訊頻道3獲得并在多路解碼器40內(nèi)進(jìn)行多路解碼,以便獲得包括在編碼的音頻信號A′內(nèi)的參數(shù)(pi,qi)和Ci。參數(shù)(pi,qi)提供給噪聲合成器(NS)41。該NS 41主要是帶有轉(zhuǎn)移函數(shù)H的過濾器。白噪聲信號y輸入到NS 4。通過ARMA參數(shù)(pi,qi)確定NS 41的過濾操作。通過NS 41過濾白噪聲y,噪聲成分S′就產(chǎn)生了,NS41與編碼器2內(nèi)使用的過濾器(NA)22相反,噪聲成分S′與原始音頻信號A內(nèi)的噪聲成分S具有相同的隨機(jī)特性。噪聲成分S′加入到加法器43中的其它重構(gòu)成分而獲得重構(gòu)的音頻信號(A″),例如所述重構(gòu)成分從合成單元(SU)獲得。SU 42類似于SU 201。重構(gòu)音頻信號A″提供到輸出設(shè)備5,其可以是揚(yáng)聲器等。
圖3表示根據(jù)本發(fā)明的音頻系統(tǒng),其包括如圖1所示的音頻編碼器2和如圖2所示的音頻播放器4。這種系統(tǒng)提供了播放和記錄設(shè)備。通訊頻道3可以為音頻系統(tǒng)的一部分,但是通常位于音頻系統(tǒng)的外部。在通訊頻道3為存儲介質(zhì)的情況下,可以把存儲介質(zhì)固定在系統(tǒng)內(nèi),存儲介質(zhì)為可拆卸的圓盤、存儲棒、條等。
下面,將進(jìn)一步描述S波譜的模型化。假定S是離散時間真值函數(shù)的功率譜密度函數(shù)。另外,S是在區(qū)間I=(-π,π)上確定的真值函數(shù)。假設(shè)S是對稱的,其中min(S)>0,max(S)<∝。為了方便起見,假設(shè)S的對數(shù)平均值等于0,即公式12π∫IlnS(θ)dθ=0]]>
對于對數(shù)標(biāo)度上的平均值不等于0的情況,延伸是直線向前的,但是能夠以各種方式處理該延伸。注意S通過合適的內(nèi)插法和歸一化從實(shí)際測量的功率譜密度函數(shù)的試樣派生而來。
根據(jù)H=B/A,其中 ,讓H成為一個合理的轉(zhuǎn)移函數(shù)。這里,pi和qi分別是轉(zhuǎn)移函數(shù)H的極點(diǎn)和零點(diǎn)。注意|H|2的對數(shù)平均值也等于0。
目標(biāo)函數(shù)通過H模的平方近似得出,即S≈|H|2。
校正近似值的測量通過下式引入公式J=12π∫I12(lnS-ln|H|2)2dθ-----(2)]]>判別式(2)能夠改寫成公式J=12π∫Iln(S/|H|2)+12(ln(S/|H|2))2dθ-----(3)]]>考慮到以下事實(shí)S和|H|2的對數(shù)平均值都為0,如果進(jìn)一步,對每一個θ值,有S(θ)/|H(ejv|2≈1,判別式(2)通過J′-1來近似,其中公式J′=12π∫IS|H|2dθ-----(4)]]>這意味著在優(yōu)化解法的領(lǐng)域內(nèi)判別式(2)和(4)實(shí)際上是相等的。
眾所周知,在H=1/A(即B=1)的情況下,(4)與前向線性預(yù)測(FLP)相關(guān),F(xiàn)LP為LPC方法的一個例子。因此,多項(xiàng)式A通過計算(或至少近似)自動相關(guān)性函數(shù)以及解Wiener-Hopf方程式而被找到,該自動相關(guān)性函數(shù)與S相關(guān)。該程序的定量結(jié)果也是公知的。上述概略的程序?qū)⒔o出S波峰很好的近似(當(dāng)在對數(shù)標(biāo)度上測量或目測時),但是對S波谷通常卻僅提供很差的擬合??傊?,用于估算全極點(diǎn)模型的標(biāo)準(zhǔn)程序是可從功率譜密度函數(shù)得出的,該函數(shù)通過(2)提供了優(yōu)化解法的一種近似并且對模型化S波峰來說基本上是很好的。
應(yīng)該注意到,lnS的波峰和波谷基本上具有相同的特性,除了信號反向外波峰為正偏移,而波谷為負(fù)偏移。因此,取□=1/S,則能夠通過上述概略的用于全極點(diǎn)模型的程序估算全零點(diǎn)模型。從該程序的結(jié)果,預(yù)料能夠得到S波谷好的擬合,但是對S波峰的擬合卻僅僅很差或至多一般。
本發(fā)明的目的是為S的波峰和波谷提供良好的表達(dá)式。在本發(fā)明的實(shí)施例中,提供了ARMA模型,在該模型中全極點(diǎn)和全零點(diǎn)模型以下列方式結(jié)合。S被分成兩部分,即S=SA/SB。從SA估算全極點(diǎn)模型以產(chǎn)生多項(xiàng)式A,從SB估算全零點(diǎn)模型以產(chǎn)生多項(xiàng)式B。結(jié)合式|H|2=|B|2/|A|2被認(rèn)為是S的一個近似。
根據(jù)本發(fā)明的優(yōu)選方面,在迭代過程中執(zhí)行S的分解。迭代步驟稱為1。在迭代的每一步驟,產(chǎn)生新的分解SA,1和SB,1,并且計算相應(yīng)的估計值A(chǔ)1和B1。以SA和SB中給定S的分支開始,然后SB的不能夠被精確模型化的部分被歸于SA,反之亦然。在迭代方案的步驟1-1,H1-1=B1-1/A1-1。此后,考慮部分函數(shù)SA,1=S/|B1-1|2和SB,1=1/S|A1-1|2。通過該方式,通過提供給SB,排除S中那些能夠被全極點(diǎn)模型精確模型化的部分。類似的,從SA中排除S的那些能夠被全零過濾器模型化的部分。從SA,1和SB,1估計函數(shù)A1和B1。通過這種方式,交換前面的迭代中不能夠被合理模型化的部分。
下一步,優(yōu)選的是,考慮下面四個可能的組合G0=B1-1/A1-1G1=B1-1/A1G2=B1/A1-1G3=B1/A1對這4個候選的過濾器的S最佳的擬合被定義成誤差最小的擬合,相關(guān)的過濾器是步驟1的最終結(jié)果。優(yōu)選地,以對數(shù)判別式為基礎(chǔ)把H1(以及因此得到的A1和B1)選擇為候選Gi最好的,其中i=0,1,2,3,所述對數(shù)判別式依據(jù)公式H1=argminG112π∫I(lnS-ln|Gi|2)2dθ-----(5)]]>從此,步驟已經(jīng)進(jìn)行到1+1步,取SA,1+1=S/|B1|2和SB,1+1=1/S|A1|2。
可以使用任何普通的終止步驟,例如迭代的最大位數(shù),當(dāng)前估算的足夠精度或者從一步到另一步時不足的進(jìn)度(progress)。
可替代地,稍微不同的步驟執(zhí)行AR或MA模型化。如果先前步驟回到計算量B1-1的精確估計值,則SA,1=S/|B1-1|2
并計算A1。把B1看作B1-1。
如果先前步驟回到計算量A1-1的精確估計值,則SB,1=1/S|A1-1|2并計算B1。把A1看作A1-1。
從A1和B1,建成H1并計算誤差(例如在對數(shù)標(biāo)度上的均方差)。
初始化迭代方案的替代方案很多。下述提汲多個可能性,但并不是作為限制。
首先,通過取SA,0=S,SB,0=1以及SA,0=1,1/SB,0=S提供初始化的簡單方式。下一步,計算A0和B0,從這兩個初始的估計值,選擇最好的擬合(根據(jù)某些規(guī)則)。通過該方式,第一次猜測或?yàn)槿珮O點(diǎn)模型或?yàn)槿泓c(diǎn)模型。
第二步,根據(jù) ,S可以被分成相等的兩部分。
第三步,因?yàn)镾A應(yīng)包括波峰,SB應(yīng)包括波谷,所以合適的分解是把平均對數(shù)級之上(例如0以上)的任何事歸于SA,0以及把低于該級的任何事情歸于SB,0。可以在整體對數(shù)平均值下進(jìn)行該分解,但是也可以在某些局部對數(shù)平均值下進(jìn)行。
第四步,考慮進(jìn)一步的分解過程在以對數(shù)標(biāo)度為基礎(chǔ)的功率譜函數(shù)內(nèi),靠近單位圓的極點(diǎn)和零點(diǎn)分別產(chǎn)生了顯著了波峰和波谷。對數(shù)據(jù)S的分解依據(jù)以下意圖,全極點(diǎn)和全零點(diǎn)模型更適合于處理logS內(nèi)的波峰和波谷。定義P=logSPA=logSAPB=logSB考慮到映射函數(shù)m,其中m →[-1,1]??紤]到對數(shù)標(biāo)度上極點(diǎn)和零點(diǎn)特征的對稱,映射函數(shù)將通常為非遞減的點(diǎn)對稱S形曲線函數(shù)。然而,也能夠使用非對稱函數(shù),其具有對極點(diǎn)或零點(diǎn)模型給出了更多加權(quán)的影響。圖4示出了示例性的映射函數(shù)。
考慮下面的初始分解公式PA=1+m(P)2P]]>公式PB=-1-m(P)2P]]>
通過該方式,P的正偏移(波峰)被顯著地歸于PA,從而,通過全極點(diǎn)過濾器而模型化。P的負(fù)偏移(波谷)被主要地歸于PB,因此,通過全零點(diǎn)過濾器而模型化。從PA和PB,建構(gòu)SA和SB,并且計算下一個A0和B0。
m有兩種約束情形(這類似于上面討論的第二和第三初始化)m=0,則SA,0=1/SB,0=S]]>m為正負(fù)號函數(shù)(公式) 在這種情況下公式 公式 建議的波譜模型非常適合于波峰和波谷的模型化,因?yàn)?,基本上這些構(gòu)成了由極點(diǎn)和零點(diǎn)提供的自由度產(chǎn)生的圖形。因此,該程序?qū)σ绯鲋?outlier)很靈敏這些值將以近似出現(xiàn),而不是平滑。因此,輸入數(shù)據(jù)S必須是精確的估計值(在標(biāo)準(zhǔn)偏差和平均值每頻率樣品的小比率的意義上來說)或者S必須是預(yù)處理的(例如平滑的),以便抑制對不想要溢出值的模型化。如果在模型中的自由度數(shù)目相對于作為功率譜密度函數(shù)基礎(chǔ)的數(shù)據(jù)點(diǎn)數(shù)目很大的話,則尤其要保持該觀察值。
對實(shí)際最優(yōu)化步驟A和B及選擇規(guī)范沒有認(rèn)識的話是不能建立收斂的。不能夠保證在迭代過程的每一步都能減小誤差。
在多種情況下,對數(shù)定標(biāo)的頻率軸上功率譜密度函數(shù)需要有好的近似。例如,對視覺上以Bode曲線形式存在的波譜上合適結(jié)果進(jìn)行估算是一種慣例。類似的是,對于音頻和語音應(yīng)用來說,優(yōu)選的等級將是Bark或者Equivalent Rectangular Bandwidth(等效矩形帶寬)(ERB)等級,其大致為對數(shù)標(biāo)度。根據(jù)本發(fā)明的方法適合于頻率彎曲模型。無論如何,能夠在任何振蕩柵(frequency grid)上計算波譜密度的大小。在頻率彎曲接近于第一階全通區(qū)的頻率彎曲的條件下以及保持ARMA模型等級的同時,這能夠被重新彎曲。
應(yīng)該注意到,上述實(shí)施例不是對本發(fā)明的限制,本領(lǐng)域普通技術(shù)人員能夠設(shè)計出多種替代實(shí)施例而且不超出所附權(quán)利要求的范圍。在這些權(quán)利要求中,括號內(nèi)的任何參考標(biāo)記不應(yīng)構(gòu)成對發(fā)明的限制。單詞“包括”并不排除列于權(quán)利要求之外的其它元件或步驟的出現(xiàn)。本發(fā)明能夠通過硬件的方式以及合適的程控計算機(jī)而完成,所述硬件包括幾個明顯的元件。在裝置權(quán)利要求中列舉了幾個設(shè)備,這些設(shè)備中的其中幾個能夠通過一個設(shè)備或硬件的相同部件體現(xiàn)。純粹的事實(shí)是,某些手段在相互不同的從屬權(quán)利要求中被引用,該事實(shí)并不表明這些手段的結(jié)合不能被用來產(chǎn)生益處。
總之,提供了對音頻信號的編碼,其中測定音頻信號中的基本波形,噪聲成分通過音頻信號減去基本波形而得到,噪聲成分的波譜通過確定自動回歸和運(yùn)動平均參數(shù)而模擬,以及自動回歸和運(yùn)動平均參數(shù)與代表基本波形的波形參數(shù)一起被包括在編碼的音頻信號中。
權(quán)利要求
1.一種對音頻信號(A)進(jìn)行編碼(2)的方法,其包括以下步驟測定(200)音頻信號(A)內(nèi)的基本波形;通過音頻信號(A)減去(21)基本波形而獲得(21)噪聲成分(S);通過確定自動回歸和運(yùn)動平均參數(shù)(pi,qi)而模型化(22)噪聲成分(S)的波譜;以及把自動回歸和運(yùn)動平均參數(shù)(pi,qi)以及代表基本波形的波形參數(shù)(Ci)包括(23)在編碼的音頻信號(A′)內(nèi)。
2.一種對音頻信號(A′)進(jìn)行解碼(4)的方法,其包括以下步驟接收(40)編碼的音頻信號(A′),所述編碼的音頻信號(A′)包括代表基本波形的波形參數(shù)(Ci)以及代表剩余噪聲成分的自動回歸和運(yùn)動平均參數(shù)(pi,qi);過濾(41)白噪聲信號(y)以獲得重構(gòu)噪聲成分(S′),所述過濾是通過自動回歸pi和運(yùn)動平均參數(shù)qi確定的;合成(42)基于波形參數(shù)(Ci)的基本波形成分;以及把重構(gòu)噪聲成分(S′)加入到合成的基本波形,以便獲得解碼的音頻信號(A″)。
3.一種音頻編碼器(2),其包括裝置(200),用于確定音頻信號(A)內(nèi)的基本波形;裝置(21),通過音頻信號(A)減去(21)基本波形,用于從音頻信號(A)內(nèi)獲得噪聲成分(S);裝置(22),通過確定自動回歸和運(yùn)動平均參數(shù)(pi,qi),用于模型化噪聲成分(S)的波譜;以及裝置(23),用于把自動回歸和運(yùn)動平均參數(shù)(pi,qi)以及代表基本波形的波形參數(shù)(Ci)包括在編碼的音頻信號(A′)內(nèi)。
4.一種音頻播放器(4),其包括裝置(40),用于接收(40)編碼音頻信號(A′),該編碼的音頻信號(A′)包括代表基本波形的波形參數(shù)(Ci)以及代表剩余噪聲成分的自動回歸和運(yùn)動平均參數(shù)(pi,qi);裝置(41),用于過濾白噪聲信號(y)以獲得重構(gòu)噪聲成分(S′),所述過濾是通過自動回歸pi和運(yùn)動平均參數(shù)qi確定的;裝置(42),用于合成基于波形參數(shù)(Ci)的基本波形成分;以及裝置(43),用于把重構(gòu)噪聲成分(S′)加入到合成的基本波形,以便獲得解碼的音頻信號(A″)。
5.一種音頻系統(tǒng),其包括如權(quán)利要求3所述的音頻編碼器(2)和如權(quán)利要求4所述的音頻播放器(4)。
6.一種編碼的音頻信號(A′),其包括代表基本波形的波形參數(shù)(Ci);代表剩余噪聲成分(S)的自動回歸和運(yùn)動平均參數(shù)(pi,qi)。
7.一種存儲介質(zhì),在該介質(zhì)上存儲有權(quán)利要求6所述的編碼的音頻信號(A′)。
全文摘要
提供了對音頻信號(A)的編碼(2),其中確定(200)在音頻信號(A)內(nèi)的基本波形,通過音頻信號(A)減去(21)基本波形而獲得(21)噪聲成分(S);通過確定自動回歸和運(yùn)動平均參數(shù)(p
文檔編號G10L19/012GK1377500SQ00810431
公開日2002年10月30日 申請日期2000年5月17日 優(yōu)先權(quán)日2000年5月17日
發(fā)明者A·C·登布林克, A·W·J·奧門 申請人:皇家菲利浦電子有限公司