專利名稱:用于檢測譜的量化的方法
技術領域:
本發(fā)明涉及一種音頻編碼和再次編碼的方法。
背景技術:
按照符合心理聲學原理的壓縮方式來傳送音頻數(shù)據(jù),并由接收機對該音頻數(shù)據(jù)進行解碼。對這些符合心理聲學原理的解碼后的數(shù)據(jù)重新壓縮將造成質量的損失。如果可以檢測并重用原始壓縮的參數(shù),則可以忽略這樣的損失,例如,見EP-A-0746913。
用于檢測這些針對使用譜的編解碼器的這些參數(shù)的方法是利用不同參數(shù)的譜測試類計算。如果分析的參數(shù)(變換起始、窗類型、譜長度)與編解碼器參數(shù)匹配,則所述的譜具有量化的外觀。由于編解碼器和分析計算的計算不精確性或不同的計算精度,量化后的譜看起來具有些微的噪聲,即,相同量化等級的幅度將不具有相同的大小。
難度在于譜是否具有“量化特性”,從而可以針對其對譜量化的影響,分析譜的不同參數(shù)。
由于壓縮伴隨著特定譜線的消失(參考在Herre,Jürgen;Michael SchugAnalysis of Decompressed Audio-The″InverseDecoder″,第109次AES會議,Los Angeles,2000年),對這些譜線進行計算,所述譜線小于閾值。
發(fā)明內容
本發(fā)明包括已經(jīng)根據(jù)心理聲學原理壓縮的音頻數(shù)據(jù)的量化譜的獲取。該譜可以借助于分類后的(和取對數(shù)后的)幅度大小的差別來識別。
本發(fā)明的所要解決的問題是找到針對譜的量化度的靈敏指示符的基礎。量化譜的結果示出了在相同量化等級的幅度處的幾個較小值、以及在其中幅度已經(jīng)達到較高的量化等級的位置處的明顯峰值,而未量化的譜典型地類似于噪聲。
該問題由權利要求1中所公開的方法來解決。
原則上,本發(fā)明的方法適合于串聯(lián)編解碼器(tandem codecs)(解碼-編碼)。本發(fā)明還用在利用未知編解碼器進行的逆向工程的過程中。
在各個從屬權利要求中公開了本發(fā)明的優(yōu)選的附加實施例。
參考附圖來描述本發(fā)明的典型實施例,在附圖中,圖1示出了解碼后的音頻信號的量化譜;圖2示出了未量化譜的幅度;圖3示出了分類后的圖1)中的幅度;圖4示出了分類后的圖2)中的幅度;圖5示出了從圖3)中的差分后的分類譜;圖6示出了從圖4)中的差分后的分類譜;圖7示出了檢測器的簡單方框圖。
具體實施例方式
圖1示出了解碼后的信號的量化譜的幅度。分析的參數(shù)(變換起始、窗類型、譜長度)與編解碼器的參數(shù)匹配,因此,所述譜具有量化的外觀。
與圖1相比,圖2示出了未量化的譜的幅度。因此,這些參數(shù)不與編解碼器的參數(shù)匹配。
圖3示出了從圖1中的分類幅度,而圖4示出了從圖2中的未量化譜的分類幅度。
圖5示出了從圖3中的差分后的分類譜;而圖6示出了從圖4中的未量化譜的差分后的分類譜。
圖5和6的比較將清楚地示出量化譜(圖5)和非量化譜(圖6)之間的差別。
下一個步驟是計算這些譜中的標量,這些標量將用作針對量化的指示符。
本發(fā)明將結合逆向編碼器一起使用。通常,必須針對另一傳輸對編碼和解碼后的音頻信號進行第二次編碼。如果在第二編碼器中的編碼器參數(shù)與第一編碼器中的編碼器參數(shù)相同,則可以使編解碼器的人為因素最小。逆向編碼器設法獲取這些參數(shù)。在這種情況下,如果譜看起來受到量化,則必須對其進行確定,這可以借助于本發(fā)明來實現(xiàn)。
逆向編碼器的另一用途,因此也是本發(fā)明的另一用途在于再設計編解碼器,以認證在知識產(chǎn)權領域的侵權。
圖7示出了本發(fā)明的簡單方框圖。本發(fā)明的目的將時域抽樣轉換到頻域,然后對頻域中的幅度進行分類,之后,可選地對這些分類后的幅度取對數(shù),并且最后評估分類后的譜值,例如,差分和檢測第一峰值。
權利要求
1.一種檢測譜的量化的方法,其特征在于指示符基于分類后的譜的絕對值,其中包括以下步驟將解碼后的信號的時間抽樣轉換為頻域(1);對頻域中的幅度進行分類(2);作為選擇,對分類后的幅度取對數(shù)(3);評估分類后的譜(4)。
2.根據(jù)權利要求1所述的方法,其特征在于對譜值取對數(shù)。
3.根據(jù)權利要求1或2所述的方法,其特征在于對分類的譜值的幅度進行差分。
4.根據(jù)權利要求1到3之一所述的方法,其特征在于由窗對所述值進行加權。
5.根據(jù)權利要求3或4所述的方法,其特征在于指示符是第一峰值的位置和/或高度的函數(shù)。
6.根據(jù)權利要求3或4所述的方法,其特征在于指示符是倍增的分類后的譜和移位一條線的分類后的譜的和。
7.一種檢測譜量化的設備,其特征在于指示符基于分類后的譜絕對值,包括用于通過例如MDCT或FFT將時域抽樣轉換到頻域的裝置(1);用于對頻域中的幅度進行分類的裝置(2);用于對分類后的幅度取對數(shù)的可選的裝置(3);用于評估分類后的譜值,例如,差分和檢測第一峰值的裝置(4)。
全文摘要
本發(fā)明包括已經(jīng)根據(jù)心理聲學原理壓縮的音頻數(shù)據(jù)的量化譜的獲取。該譜可以借助于分類后(取對數(shù)后)的幅度大小的差別來識別。本發(fā)明的所要解決的問題是找到針對譜的量化度的靈敏指示符的基礎。該計算的結果針對量化譜示出了在相同量化等級的幅度處的幾個較小值、以及在其中幅度已經(jīng)達到較高的量化等級的位置處的明顯峰值,而未量化的譜典型地類似于噪聲。
文檔編號G10L19/02GK1599983SQ02824110
公開日2005年3月23日 申請日期2002年11月23日 優(yōu)先權日2001年12月6日
發(fā)明者彼得·耶奧格·鮑姆 申請人:湯姆森許可貿(mào)易公司