專利名稱:數(shù)字音頻水印插入/檢測裝置及其方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于數(shù)字音頻水印的發(fā)明,更詳細地說,就是關(guān)于高音質(zhì)音頻編碼過程中,向比特列內(nèi)插入并檢測水印信息的裝置及其方法的發(fā)明。
背景技術(shù):
所謂水印技術(shù)(watermarking)指的是將水印秘密信息隱藏于視頻、圖像、音頻、文本等媒休內(nèi)部。上面所說的隱藏的水印信息只有對此知道的人才能夠提取,而插入水印的媒體對于普通人來說與一般的媒體沒有什么區(qū)別。
特別是,數(shù)字媒體與模擬媒體相比較的話,訪問、傳達、編輯和保管都要容易一些。通過電波或通信網(wǎng)分配的過程中,不會發(fā)生數(shù)據(jù)的熱化現(xiàn)象,但是隨之產(chǎn)生的知識產(chǎn)權(quán)的問題,數(shù)字水印技術(shù)正是為保護知識產(chǎn)權(quán)而引起各方的注意。
這種數(shù)字水印除了插入所有人區(qū)分信息來保護著作權(quán)以外,另外通過插入信息可以防止復(fù)制、確認流通過程、用于節(jié)目監(jiān)控等,或者插入音頻、視頻等類似的實時媒體,可以傳送再生時間控制信息、同步(Lip-sync)、內(nèi)容信息等信息。
根據(jù)這種多樣使用目的,上面所說的數(shù)字水印其特性雖然有所不同,但基本上具有非知覺性和強認性。
上面所說的非知覺性是指插入水印前與插入原媒體后的媒體通過人來聽或者看是沒有區(qū)別的。這也是水印技術(shù)最基本的要求事項。
上面所說的強認性是指插入水印的媒體在流通和傳送過程中,雖然可以進行必要的濾波、壓縮、雜音添加、熱化等變形,但是應(yīng)該保存插入的水印。
特別是,用于知識產(chǎn)權(quán)保護和復(fù)制的水印情況時,對于要除去水印這種故意的攻擊應(yīng)加以應(yīng)對,另外,防止偽造的水印情況時,應(yīng)插入輕易可消除變形、操作的水印。
另一方面,將再生時間控制、同步信息等附加信息隱藏在媒體的水印時,對于有意攻擊或變形的強認性要求事項相對較低。
這種數(shù)字水印的普通方法與圖1所示相同。
與圖1所示相同,利用水印插入裝置1,向要插入水印的數(shù)字媒體(音頻、視頻、圖像、文本等)隱藏水印數(shù)據(jù);此時,根據(jù)水印算法可使用附加用于安全的秘密或公開鍵。
其后,這種插入水印的媒體可通過水印提取裝置2提取插入的水印。此時,根據(jù)水印算法可需要原本媒體,利用插入時所使用的秘密鍵可進行譯碼。
在上面所說的水印提取過程中,將不需要原件的系統(tǒng)稱為隱蔽水印(blind watermarking)。
在這種插入水印的方法中,對于音頻信號的水印方法主要有LSB(Least Significant Bit,最低有效位)符號化方法,回波插入方法(Echo Hiding Method),以及展開頻譜通信(Spread SpectrumCommunication)。上面所說的LSB編碼方法是變形量子化的音頻取樣的最下位比特,插入要求的信息,對于音頻信號來說,最下位比特的變形對音質(zhì)基本上不會產(chǎn)生影響,而且插入和檢測都比較簡單,音質(zhì)變形小,但是損失壓縮或濾波相似的信號處理還比較弱。
另外,上面所說的回波插入方法(Echo Hiding Method)通過向音頻信號插入人們幾乎聽不到大小的回波的方法,根據(jù)插入經(jīng)過一定時間間隔細分的音頻信號的二進制水印信息,插入具有其它時間遲延的回波進行編碼,在譯碼過程中,通過檢測在各自細分的區(qū)間中的回波時間遲延,將二進制信息進行譯碼。在這種情況下附加的信號沒有雜音,因為是具有原信號的音頻信號本身,所以即使聽到插入的信號也不會感到有變形,反而會覺得音質(zhì)變好,這種方法雖然適合于高音質(zhì)音頻水印技術(shù),但因為通過Ceptstrum運算進行檢測,所以譯碼過程的運算量十分大,錯過在時間區(qū)域中分解區(qū)間的同步的情況下,就不能進行譯碼。
展開頻譜通信(Spread Spectrum Communication)在圖像水印中廣泛使用,在音頻水印技術(shù)中也最為廣泛研究的有代表性地水印技術(shù)方法。在將音頻信號轉(zhuǎn)換為頻率之后,二進制數(shù)水印信息通過PN(pseudonoise,偽噪聲)順序進行頻段擴展,摻加到頻率轉(zhuǎn)換的音頻信號。這種插入水印的方法利用PN順序高的自相關(guān)作用(autocorrelation)特性,依據(jù)相關(guān)器(correlator)可進行檢測,對于干涉性強、密碼性強的反面來說,為提高強認性而插入高能量,音質(zhì)將變差,插入和檢測過程的運算量將十分大,對于壓縮編碼來說不能完整地進行。
綜合上述以往的音頻水印技術(shù)來看,通過在壓縮編碼前向原信號插入水印信息的一般方法具有實現(xiàn)起來比較復(fù)雜并且相應(yīng)地需要大運算量的弱點和在壓縮過程中容易出現(xiàn)變形的問題。
發(fā)明內(nèi)容
本發(fā)明為解決上面所存在的問題而進行了相關(guān)的研究,本發(fā)明的水印裝置及其方法目的是在數(shù)字音頻壓縮編碼的過程中,在比特列內(nèi)插入水印數(shù)據(jù),防止原信號和插入的水印的歪曲,而且也比較容易插入水印數(shù)據(jù)。
為實現(xiàn)上述目的,依據(jù)本發(fā)明的數(shù)字音頻水印插入方法可分為如下階段通過數(shù)字音頻信號編碼階段,為將水印信號插入數(shù)字音頻信號(PCM),將數(shù)字音頻信號(PCM)轉(zhuǎn)變?yōu)槎鄠€子波段樣本的階段;提取出轉(zhuǎn)換的子波段樣本大小的比例因子的階段;利用數(shù)字音頻信號編碼規(guī)格的比例因子表,將提取的比例因子轉(zhuǎn)換為比例因子索引(scalefactor index)的階段;以及在上面的轉(zhuǎn)換過程中,變更比例因子索引,插入水印信號的階段。
其特征在于,上面所說的水印插入階段包括如下階段向每一比特水印分配一個比例因子索引,根據(jù)水印一比特的0或者1信號,將比例因子索引變更為奇數(shù)或偶數(shù)。
其特征在于,上面所說的比例因子索引為0的情況時,不插入水印。
其特征在于,為區(qū)分插入的水印和其它的信號,使用秘密或公開鍵或者插入預(yù)定的同步信號。
利用數(shù)字音頻編碼階段,向數(shù)字音頻信號插入水印信號的方法包括如下階段為除去數(shù)字音頻信號統(tǒng)計上的重復(fù)性,將其轉(zhuǎn)換為多個子波段樣本的階段;提取出轉(zhuǎn)換的子波段樣本大小的比例因子的階段;接收數(shù)字音頻信號將其轉(zhuǎn)換至頻率區(qū)域的階段;在轉(zhuǎn)換的頻率區(qū)域中參照提取的比例因子,得出人們耳朵聽不到的雜音水平屏蔽臨界數(shù)值,并以此為基礎(chǔ),計算各子波段不同樣本的SMR數(shù)值的階段;以計算出的SMR數(shù)值為基礎(chǔ),按各子波段樣本的不同分配比特的階段;接收提取出的比例因子,利用數(shù)字音頻信號編碼規(guī)格的比例因子表,將其轉(zhuǎn)變?yōu)楸壤蜃铀饕碾A段;在上面的轉(zhuǎn)換階段中變更比例因子索引,插入水印信號的階段;利用按不同子波段樣本分配的比特和比例因子索引,按多個子波段樣本不同進行量子化的階段;以及將量子化的信號按比特列生成的階段。
上面所說的子波段樣本比特分配階段中,對沒有分配比特的子波段插入水印的方法包括如下階段根據(jù)已設(shè)定的數(shù)字音頻信號每幀傳送的最小水印比特數(shù),對于沒有分配比特的子波段樣本,強制地分配比特的階段;對與分配比特的子波段樣本相應(yīng)的比例因子索引進行變形并插入水印的階段;強制分配的子波段樣本全部定義為0的階段。
對于數(shù)字音頻信號壓縮傳送的比特列中檢測水印信號的方法,其特點在于,其包括如下階段在比特列中提取出比例因子索引信息的階段;以及判別提取出的比例因子索引的奇偶數(shù),提取出0和1的二進制水印信息的階段。
利用數(shù)字音頻編碼器,向數(shù)字音頻信號(PCM)中插入水印信號的裝置,其特征在于,其構(gòu)成包括將數(shù)字音頻信號轉(zhuǎn)換為多個子波段樣本的子波段濾波器組;提取出轉(zhuǎn)換的子波段樣本大小的比例因子索引的比例因子提取裝置;以及水印插入和比例因子編碼裝置,該水印插入和比例因子編碼裝置利用數(shù)字音頻編碼規(guī)格的比例因子表將提取出的比例因子轉(zhuǎn)換為比例因子索引,變更轉(zhuǎn)換的比例因子索引,插入水印信號。
其特征在于,上面所說的水印插入和比例因子編碼裝置向水印每比特分配一個比例因子索引,根據(jù)水印一比特的0或者1信號,將比例因子索引變更為偶數(shù)或者偶數(shù)。
對于壓縮傳送數(shù)字音頻信號的比特列中檢測水印信號的裝置來說,其組成包括在比特列中提取出比例因子索引信息的比特列提取裝置;以及判斷提取的比例因子索引的奇偶數(shù),提取出0或1的二進制水印信息的水印提取裝置。
與以上的說明相同,依據(jù)本發(fā)明的數(shù)字音頻水印裝置及其方法具有如下的效果。
首先,在高音質(zhì)編碼過程中,變更向比特列傳送的比例因子索引,插入水印,在音頻壓縮編碼和譯碼過程中就不會發(fā)生附加的雜音或變形,同時可有效地插入水印。
其次,依據(jù)本發(fā)明的方法插入水印的話,生成與以往譯碼器具有互換性的比特列,向約定的譯碼器傳送與音頻信號不同的其它信息。即,維持與以往譯碼器互換性的同時,確保另外的信息傳送頻道。
再次,依據(jù)本發(fā)明的水印提取方法如果只向特定人公開的話,相應(yīng)的水印可以用為秘密通信。
最后,依據(jù)本發(fā)明的音頻編碼音頻水印方法中,插入和提取過程十分簡單,可追加若干的運算量。
圖1是一般的數(shù)字音頻水印方法的示意圖;圖2是依據(jù)本發(fā)明的數(shù)字音頻水印的整個系統(tǒng)的說明示意圖;圖3是包括依據(jù)本發(fā)明的音頻水印插入裝置在內(nèi)的MPEG音頻編碼器內(nèi)部構(gòu)成框圖。
圖4是向依據(jù)本發(fā)明的比例因子索引中插入水印的MPEG音頻比特列的構(gòu)造示意圖;圖5是包括依據(jù)本發(fā)明的水印檢測裝置在內(nèi)的MPEG音頻譯碼器的說明框圖。
*附圖主要部分符號說明*10高音質(zhì)音頻編碼器11子波段濾波器組(sub bandfilter bank)12比例因子(scale factor)提取裝置 13FFT裝置14SMR計算裝置 15比特分配裝置16水印插入和比例因子編碼裝置17量子化裝置18比特列生成裝置20高音質(zhì)音頻譯碼器21比特列提取裝置22逆量子化裝置23水印提取和比例因子譯碼裝置24合成子波段濾波組
具體實施例方式
以下,參照附圖,對依據(jù)本發(fā)明的優(yōu)選實施例構(gòu)成及操作進行詳細的說明。
本發(fā)明與前面所說的相同,在高音質(zhì)音頻編碼過程中,向比特列內(nèi)插入水印,可檢測沒有原本插入的水印,從而實現(xiàn)隱蔽水印(blindwatermarking)。
為此,以高音質(zhì)音頻編碼方法中的MPEG第2階層音頻編碼方法為基準構(gòu)筑實施例。
圖2是依據(jù)本發(fā)明的數(shù)字音頻水印技術(shù)的整體系統(tǒng)說明示意圖。
與圖2所示相同,依據(jù)本發(fā)明的數(shù)字音頻水印系統(tǒng)與高音質(zhì)音頻編碼器10和譯碼器20結(jié)合,形成水印的插入與提取。
即,在實現(xiàn)音頻編碼和水印插入的高音質(zhì)音頻編碼器10中,要進行壓縮編碼的高音質(zhì)音頻信號和水印編碼同時進行,這種水印插入的過程通過在普通高音質(zhì)編碼器內(nèi)部變更一部分而實現(xiàn)。請參照圖3所示。
另外,在上面所說的高音質(zhì)音頻譯碼器20中,在譯碼壓縮的比特列,并生成輸出音頻信號的普通高音質(zhì)譯碼器內(nèi)部,變更一部分,提取出插入的水印信息。
此時,在沒有這種水印提取裝置的譯碼器中,譯碼音頻比特列,只能得到?jīng)]有水印信號的輸出音頻信號。此過程參照圖5。
與此相同,依據(jù)具有本構(gòu)成的本發(fā)明,參照附有水印系統(tǒng)的圖進行如下說明。
與以上所述相同,圖3是包括依據(jù)本發(fā)明音頻水印插入裝置的高音質(zhì)音頻編碼器內(nèi)部構(gòu)成示意圖,特別是通過高音質(zhì)音頻編碼器舉例說明MPEG音頻編碼器。
首先,上面所說的MPEG音頻編碼器與其它高音質(zhì)音頻編碼技術(shù)相同,為除去音頻信號重復(fù)性,利用以人耳朵聽覺特性為基礎(chǔ)的心理音向模塊,為除去信號統(tǒng)計上的重復(fù)性而與普通數(shù)字壓縮方式相結(jié)合。
與這種MPEG音頻編碼器結(jié)合的本發(fā)明音頻水印插入裝置,與圖3所示相同,其構(gòu)成包括如下裝置為除去音頻信號的重復(fù)性,轉(zhuǎn)換為32個了頻段樣本的子波段濾波器組(Sub band filter bank)11;提取出子波段樣本大小的比例因子的比例因子提取裝置12;接收音頻信號轉(zhuǎn)換為頻率區(qū)域的FFT(Fast Fourier Transform,快速傅立葉變換)裝置13;SMR計算裝置14,它是在轉(zhuǎn)換的頻率區(qū)域中,參照上面提取出的比例因子,得出人耳幾乎聽不到雜音水平的屏蔽臨界數(shù)值(masking threshold),并以此為基礎(chǔ),計算各個子波段的SMR(Signal-to-Mask Ratio)數(shù)值;以上面所說的SMR數(shù)值為根據(jù),向各子波段分配比特的比特分配裝置15;水印插入和比例因子編碼裝置16,它是接收上面提取的比例因子數(shù)值并進行編碼,變更這種編碼過程,插入二進制的水印信息;量子化裝置17,將各子波段分配的比特,以及利用編碼的比例因子數(shù)值按32個子波段進行量子化;將量子化信號與附加信息一同生成比特列的比特列生成裝置18。
與MPEG音頻編碼器結(jié)合的水印插入裝置的操作過程與如下所述相同。
首先,為除去音頻信號(PCM)信號的統(tǒng)計重復(fù)性,將上面所說的音頻信號,通過由32個加重重疊計算方式的子波段濾波器構(gòu)成的子波段濾波器組11轉(zhuǎn)換為子波段樣本。
與此同時,上面所說的FFT13裝置和SMR計算裝置14以心理音響模塊為基礎(chǔ),為除去人聽覺特性產(chǎn)生的知覺重復(fù)性,得出人耳聽不到雜音水平的屏蔽臨界數(shù)值,并以此為基礎(chǔ),按各個子波段計算SMR數(shù)值。
以計算的SMR數(shù)值為依據(jù),為屏蔽量子化雜音信號在比特分配裝置15中向各子波段分配比特。(參考文獻ISO/IEC JTC/SC29/WG11NO.71″Coding of Moving Pictures and Associated Audio forDigital Storage Media at up to about 1.5Mbit/s-CD 11172-3(Part3.MPEGAudio)″,1992)另一方面,比例因子提取裝置12接收輸入的32個子波段樣本,提取比例因子。
上面所說的比例因子各有三個子波段,即,在一個子波段內(nèi)將36個樣本分為12個區(qū)組(granule)之后,將區(qū)組數(shù)值中最大值作為比例因子后補數(shù)值。
但是,實際比特列的傳送不是上面所說的比例因子數(shù)值本身,而是由6比特形成的比例因子索引的傳送。
即,在具有63個個體的比例表(參照上面參考文獻表B.1照)中,查找與實際的比例因子最類似的數(shù)值(比實際比例因子更大數(shù)值中最類似的數(shù)值),并傳送相應(yīng)的索引。
另一方面,依據(jù)本發(fā)明實施事例的MPEG第2階層編碼中,為減少比例因子索引的傳送數(shù)量,根據(jù)比例因子選擇信息以1-3個比例因子互不相同的模式進行傳送。
即,判斷子波段內(nèi)計算的3個比例因子索引的類似性,在互相類似的情況時,可以輸出一個代表數(shù)值,在三個比例因子互不相同的情況時采取分別輸出的方法。
另外,在比特分配裝置15中,參照由各子波段形成的比特分配信息,對于沒有分配比特的子波段,不傳送比例因子選擇信息和比例因子索引。由此,根據(jù)幀傳送的比例因子索引的個數(shù)可以不同。
如果,在特定的幀中傳送的子波段個數(shù)(sblimit)為30個,2頻道模式,向所有子波段分配比特的情況時,傳送的比例因子最大為180個(30*2*3),在這種情況時,每秒約傳送6890個比例因子。
如依據(jù)本發(fā)明的話,水印插入和比例因子編碼裝置16中,在MPEG音頻編碼比特列中,向比例因子索引部分插入水印。
即,向每個傳送的比例因子索引插入一比特的二進制水印,更為詳細地說明如下要插入現(xiàn)在比例水印索引的二進制水印為0的情況時,相應(yīng)的比例因子索引為偶數(shù);而要插入的二進制水印為1的情況時,相應(yīng)的比例因子應(yīng)為偶數(shù)。
舉例說明,現(xiàn)在的比例因子索引S1為35,在這里應(yīng)插入的二進制水印如果為0的話,將轉(zhuǎn)換為si=34,當應(yīng)插入的二進制水印為1時無需變更,保持原有的si=35。
在上面的例子中插入的二進制為0的情況時,一定應(yīng)變更為不是si=36的si=34,這是因為,MPEG比例因子表(上面參考文獻的表B1)中索引越低比例因子就越大。
此時,現(xiàn)在的原比例因子索引為0的情況時,二進制無法表示為1,所以無法插入水印。
下面所示的表1是依據(jù)本發(fā)明水印技術(shù)方法向12個比例因子索引插入12比特水印(例如,′011010101100′)并進行變形的例子。
表1
與表1所示相同,插入的二進制水印為0的情況時,因為相應(yīng)的比例因子索引表現(xiàn)為偶數(shù),所以比例因子索引si=35變形為si=34。另外,插入的二進制水印為1的情況時,因為相應(yīng)的比例因子水印表示為偶數(shù),所以比例因子索引si=32變更為si=31。
通過與此相同的方法,插入水印并變形的比例因子索引,和利用比特分配裝置15中分配的比特在量子化裝置17中的32個子波段樣本進行量子化。
上面量子化的信號,分配的比特信息和變形的比例因子索引在比特列生成裝置18中接收的話,轉(zhuǎn)換為比特列,生成壓縮的比特列。這種方法生成的比特列與以往音頻的比特列沒有區(qū)別。
上面生成的比特列的一個例子與圖4所示相同。
即,圖4是比例因子索引中插入水印的MPEG音頻比特列構(gòu)造示意圖,與圖4相同,其構(gòu)成包括如下部分分為32比特,包括標本化頻率、比特率、階層等信息的數(shù)據(jù)包頭(header)部分;用于16比特錯誤訂正的CRC編碼,每個子波段在2比特中表示4比特的比特信息的比特分配(Bit Allocation)部分;表示比例因子相關(guān)的選擇信息的2比特的SCFSI(SCaleFactor Select Information,比例因子選擇信息);存儲6比特水印技術(shù)且變形的比例因子索引的水印比例因子部分(Watermarked Scale Factor,水印比例因子);存儲量子化的樣本數(shù)值的樣本部分;存儲附加信息的附加數(shù)據(jù)(Ancillary Data)部分。
與通過這種過程形成的MPEG音頻編碼器結(jié)合的水印插入方法,在MPEG音頻編碼過程中利用水印插入變形的比例因子索引分割子波段樣本進行量子化,因為傳送變形的比例因子索引,水印插入所以不會發(fā)生附加雜音或變形。
但是,與此相同的水印插入,即,利用比例因子變形的水印插入方法中應(yīng)注意的是,依據(jù)比例因子選擇信息決定傳送方式,比特分配完成,應(yīng)在要傳送的比例因子索引決定以后進行。
即,與上面所說的相同,每三個子波段決定后的第一個比例因子索引之后依據(jù)比例因子選擇信息可變形或不傳送,與此相同,對于比特分配沒有進行的子波段因為沒有進行傳送,所以參照這些信息應(yīng)插入水印。
另一方面,與MPEG音頻編碼器結(jié)合實施的插入的二進制水印檢測過程與圖5所示相同。
圖5是包括依據(jù)本發(fā)明水印提取裝置在內(nèi)的MPEG音頻編碼器的說明框圖。
與圖5所示相同,包括水印提取裝置的MPEG音頻編碼器,其構(gòu)成包括如下裝置從傳送的比特列中提取出必要的信息的比特列提取裝置21;以上面提取的信息為基礎(chǔ)對比例因子進行譯碼,并提取出水印的水印提取和比例因子譯碼裝置23;利用譯碼的比例因子和比特分配信息,將子波段樣本進行逆量子化的逆量子化裝置22;將逆量子化的子波段樣本轉(zhuǎn)換為32個的時間區(qū)域樣本,通過合成輸出最終的音頻信號的合成子波段濾波器組24。
即,包括水印提取裝置的MPEG音頻編碼過程與編碼過程正好相反,首先從壓縮傳送的比特列中以頭信息為中心在比特列提取裝置中提取比特分配信息、比例因子選擇信息、比例因子索引以及量子化子波段樣本等的必要信息。
以上面提取出的信息為基礎(chǔ)對比例因子進行編碼,此時,在編碼過程中為檢測插入的二進制水印,將上面提取的比例因子索引有順序地排列判別奇偶數(shù),提取0和1的二進制水印信息。將此整理至表2。
表2
上面的表2是指從譯碼端傳送的12個比例因子索引中提取出水印的過程。
與表2所示相同,在表1中利用比例因子索引數(shù)值插入物水印,判斷比例因子索引的奇偶數(shù),提取出在編碼過程中插入的二進制水印′011010101100′。
通過與此相同的過程,在水印提取和比例因子譯碼器23中提取水印。
另一方面,在水印提取和比例因子譯碼器23中通過比例因子索引數(shù)值,編碼比例因子,利用編碼比例因子之前提取的比特分配信息,在逆量子化裝置22中逆量子化子波段樣本。
上面所說的逆量子化子波段樣本通過合成子波段濾波組24,轉(zhuǎn)換為32個時間區(qū)域樣本,并進行合成,從而得到最終譯碼的音頻信號。
此時,沒有插入水印的普通音頻比特列的比例因子索引進入水印提取和比例因子譯碼裝置23時,因為可以判斷比例因子索引的奇偶數(shù),所以可以檢測出二進制數(shù)值。
因為這種二進制數(shù)值是沒有意義的信息,所以為區(qū)別這種沒有意義的信息并判別有意義的水印信息,需要使用秘密或公開鍵,或者使用在水印比特列插入時置入已約定的同步信號的方法。
另外,與上述相同,依據(jù)水印插入的比例因子索引的變更在音頻壓縮譯碼和編碼過程中不會引發(fā)附加的雜音或是變形。
在壓縮編碼過程的特性上,實際子波段樣本的正規(guī)化是參照最終將傳送的比例因子索引形成的,這是因為在譯碼端中依據(jù)相同的比例因子數(shù)值復(fù)原子波段樣本。
如依本發(fā)明,利用比例因子的比特列水印技術(shù),不固定每個幀傳送的比例因子的個數(shù),所以無法正確預(yù)測可傳送的水印信息量。
特別是,與靜音區(qū)間相應(yīng)的音頻幀進行編碼的情況時,因為不存在比特分配的子波段,所以在這種幀中無法進行水印傳送。
由此,通過這種解決方法,事先設(shè)定每幀傳送的最小水印比特數(shù),在MPEG音頻編碼過程中,欲只傳送比其數(shù)量更小的比例因子情況時,對于沒有分配比特的任意子波段強制地分配比特,使其傳送相應(yīng)波段的比例因子索引。
此時,為傳送水印,對于強制分配比特的子波段,將子波段樣本全部定義為0進行傳送。
如果這樣,在譯碼過程中,與不傳送相應(yīng)的子波段的情況相同,因為表示為0的結(jié)果,所以不會對音質(zhì)產(chǎn)生影響,可追加插入要求比特的水印。
只是,在這種情況,使用比MPEG音頻編碼要求的比特數(shù)量更多的比特,進行編碼,但在使用固定的比特率的音頻編碼方式中,特定幀在編碼過程中使用,余下的比特應(yīng)為0,所以浪費了比特。
另一方面,與維持固定在個別幀的水印比特率相比,將多個幀捆綁形成更大的單位以與水印比特率相符的方法,可以阻止局部幀水印傳送數(shù)量的不足現(xiàn)象。
再一方面,在本發(fā)明的實施事例中,雖然說明適用于高音質(zhì)音頻編碼方法中MPEG第2階層音頻編碼方法,但也可適用參照比例因子索引表的其它高音質(zhì)編碼方法。
通過上述的說明內(nèi)容,相關(guān)工作人員完全可以在不偏離本項發(fā)明技術(shù)思想的范圍內(nèi),進行多樣的變更以及修改。因此,本項發(fā)明的技術(shù)性范圍并不能局限于明細書上的詳細說明內(nèi)容,必須要根據(jù)權(quán)利要求書的范圍來確定其技術(shù)性范圍。
權(quán)利要求
1.數(shù)字音頻水印插入方法,通過數(shù)字音頻信號符號化階段,將水印信號插入數(shù)字音頻信號(PCM),其特征在于,其包括如下階段將上述數(shù)字音頻信號(PCM)轉(zhuǎn)變?yōu)槎鄠€子波段樣本的階段;提取出轉(zhuǎn)換的子波段樣本大小的比例因子的階段;利用數(shù)字音頻信號編碼規(guī)格的比例因子表,將提取的比例因子轉(zhuǎn)換為比例因子索引的階段;以及在上述轉(zhuǎn)換過程中,變更比例因子索引,插入水印信號的階段。
2.如權(quán)利要求項1所述的數(shù)字音頻水印插入方法,其特征在于,上述水印插入階段包括如下階段向每一比特水印分配一個比例因子索引,根據(jù)上述水印一比特的0或者1信號,將比例因子索引變更為奇數(shù)或偶數(shù)。
3.如權(quán)利要求項1所述的數(shù)字音頻水印插入方法,其特征在于,上述比例因子索引為0的情況時,不插入水印。
4.如權(quán)利要求項1所述的數(shù)字音頻水印插入方法,其特征在于,為區(qū)分插入的水印和其它的信號,使用秘密或公開鍵或者插入預(yù)定的同步信號。
5.數(shù)字音頻水印插入方法,通過數(shù)字音頻編碼階段,向數(shù)字音頻信號插入水印信號,其特征在于,其包括如下階段為除去數(shù)字音頻信號統(tǒng)計上的重復(fù)性,將其轉(zhuǎn)換為多個子波段樣本的階段;提取出轉(zhuǎn)換的子波段樣本大小的比例因子的階段;接收數(shù)字音頻信號將其轉(zhuǎn)換至頻率區(qū)域的階段;在轉(zhuǎn)換的頻率區(qū)域中參照提取的比例因子,得出人們耳朵聽不到的雜音水平的屏蔽臨界數(shù)值,并以此為基礎(chǔ),計算各子波段不同樣本的SMR數(shù)值的階段;以計算出的SMR數(shù)值為基礎(chǔ),按各子波段樣本的不同分配比特的階段;接收提取出的比例因子,利用數(shù)字音頻信號編碼規(guī)格的比例因子表,將其轉(zhuǎn)變?yōu)楸壤蜃铀饕碾A段;在上面的轉(zhuǎn)換階段中,變更上述比例因子索引,插入水印信號的階段;利用按不同子波段樣本分配的比特和比例因子索引,按多個子波段樣本不同進行量子化的階段;以及將上述量子化的信號按比特列生成的階段。
6.如權(quán)利要求項5所述的數(shù)字音頻水印插入方法,其特征在于,上述水印插入階段向每個水印比特分配比例因子索引,根據(jù)水印一比特0或者1將比例因子索引變更為奇數(shù)或偶數(shù)。
7.如權(quán)利要求項5所述的數(shù)字音頻水印插入方法,其特征在于,上述子波段樣本比特分配階段中,對沒有分配比特的子波段插入水印的方法包括如下階段根據(jù)已設(shè)定的數(shù)字音頻信號每幀傳送的最小水印比特數(shù),對于沒有分配比特的子波段樣本,強制地分配比特的階段;對與分配比特的子波段樣本相應(yīng)的比例因子索引進行變形并插入水印的階段;以及強制分配的子波段樣本全部定義為0的階段。
8.數(shù)字音頻水印檢測方法,從數(shù)字音頻信號壓縮傳送的比特列中檢測水印信號,其特征在于,其包括如下階段在比特列中提取出比例因子索引信息的階段;以及判別提取出的比例因子索引的奇偶數(shù),提取出0和1的二進制水印信息的階段。
9.數(shù)字音頻水印插入裝置,通過數(shù)字音頻編碼器,向數(shù)字音頻信號中插入水印信號,其特征在于,其構(gòu)成包括將數(shù)字音頻信號轉(zhuǎn)換為多個子波段樣本的子波段濾波器組;提取出轉(zhuǎn)換的子波段樣本大小的比例因子索引的比例因子提取裝置;以及水印插入和比例因子編碼裝置,該水印插入和比例因子編碼裝置利用數(shù)字音頻編碼規(guī)格的比例因子表將提取出的比例因子轉(zhuǎn)換為比例因子索引,變更轉(zhuǎn)換的比例因子索引,插入水印信號。
10.如權(quán)利要求項9所述的數(shù)字音頻水印插入裝置,其特征在于,上述水印插入和比例因子編碼裝置向水印每比特分配一個比例因子索引,根據(jù)水印一比特的0或者1信號,將比例因子索引變更為偶數(shù)或者偶數(shù)。
11.數(shù)字音頻水印檢測裝置,從壓縮傳送數(shù)字音頻信號的比特列中檢測水印信號,其特征在于,其構(gòu)成包括在比特列中提取出比例因子索引信息的比特列提取裝置;以及判斷提取的比例因子索引的奇偶數(shù),提取出0或1的二進制水印信息的水印提取裝置。
全文摘要
本發(fā)明是關(guān)于數(shù)字音頻水印的發(fā)明,特別是數(shù)字音頻編碼過程中在比特列內(nèi)插入、檢測水印信息的裝置及其方法的發(fā)明。依據(jù)本發(fā)明,數(shù)字音頻信號的譯碼過程中變更向各個比特列傳送的比例因子索引,插入水印,這樣在音頻壓縮編碼和譯碼的過程中不會引起附加的雜音和變形,可以有效地插入和檢測上面所說的水印。
文檔編號H04N7/26GK1774067SQ200410068090
公開日2006年5月17日 申請日期2004年11月12日 優(yōu)先權(quán)日2004年11月12日
發(fā)明者吳炫吾 申請人:上海樂金廣電電子有限公司