用于音頻編碼/解碼/轉碼的頻率域中水印插入的制作方法
【技術領域】
[0001]本公開內(nèi)容一般而言涉及音頻處理,并且更具體而言涉及音頻處理期間的水印插入。
【背景技術】
[0002]水印作為一種類型的數(shù)字標記,常常被嵌到音頻數(shù)據(jù)中,以為了版權保護目的來識別音頻數(shù)據(jù)的所有者或來源,或者以傳送其它非音頻信息。通常,水印在編碼之前或編碼之后被添加到音頻數(shù)據(jù)中。但是,這種方法使水印相當容易被檢測和修改,并且因此容易被未授權的實體篡改或去除。
【發(fā)明內(nèi)容】
[0003]本公開內(nèi)容的實施例涉及用于水印插入的方法和設備。在一些實施例中,闡述了用于水印插入的方法。該方法包括:在音頻處理設備處,基于輸入音頻數(shù)據(jù)生成頻率系數(shù)流;將數(shù)字水印嵌到所述頻率系數(shù)流中,以生成經(jīng)修改的頻率系數(shù)流;以及處理經(jīng)修改的頻率系數(shù)流,以生成輸出音頻數(shù)據(jù)。
[0004]在其它實施例中,闡述了一種音頻處理設備。該音頻處理設備包括:初始處理模塊,用來基于輸入音頻數(shù)據(jù)生成頻率系數(shù)流;加水印模塊,用來將數(shù)字水印嵌到所述頻率系數(shù)流中,以生成經(jīng)修改的頻率系數(shù)流;以及最終處理模塊,用來處理經(jīng)修改的頻率系數(shù)流,以生成輸出音頻數(shù)據(jù)。
[0005]在又一些其它實施例中,闡述了一種非暫時性計算機可讀存儲介質(zhì)。該非暫時性計算機可讀存儲介質(zhì)存儲指令集合,該指令集合操縱至少一個處理器執(zhí)行本公開內(nèi)容中所描述的方法。
【附圖說明】
[0006]通過參考附圖,本公開內(nèi)容可以得到更好的理解,并且其眾多特征和優(yōu)點將對本領域技術人員變得明晰。
[0007]圖1是根據(jù)本公開內(nèi)容的至少一個實施例的說明在頻率域中實現(xiàn)加水印的音頻處理設備的框圖。
[0008]圖2是根據(jù)本公開內(nèi)容的至少一個實施例的說明在音頻編碼處理期間用于加水印的音頻處理設備的操作的流程圖。
[0009]圖3是根據(jù)本公開內(nèi)容的至少一個實施例的說明在音頻解碼處理期間用于加水印的音頻處理設備的操作的流程圖。
[0010]圖4是根據(jù)本公開內(nèi)容的至少一個實施例的說明使用線性相加操作的示例加水印處理的流程圖,其中該線性相加操作使用來自時間到頻率變換處理的頻率系數(shù)。
【具體實施方式】
[0011]圖1-4說明了用于在音頻數(shù)據(jù)作為時間到頻率域變換處理的結果而被表示為頻率域中的頻率系數(shù)時給音頻數(shù)據(jù)加水印的示例技術。在至少一個實施例中,初始處理模塊從輸入音頻數(shù)據(jù)生成頻率系數(shù)集合。通過基于水印數(shù)據(jù)修改每個集合的至少一些頻率系數(shù)以生成經(jīng)修改的頻率系數(shù)集合,水印數(shù)據(jù)被嵌到音頻數(shù)據(jù)中。最終處理模塊接著用經(jīng)修改的頻率系數(shù)集合來完成音頻數(shù)據(jù)的處理,以生成具有這樣嵌入的水印數(shù)據(jù)的輸出數(shù)據(jù)。在編碼的上下文中,輸入音頻數(shù)據(jù)是未編碼的音頻數(shù)據(jù)并且初始處理模塊包括頻率域變換模塊,該頻率域變換模塊對未編碼的音頻數(shù)據(jù)執(zhí)行時間到頻率域變換處理,以生成頻率系數(shù)集合。在這種上下文中的最終處理模塊包括使用經(jīng)修改的頻率系數(shù)集合完成音頻數(shù)據(jù)編碼的最終編碼過程,并且因此生成經(jīng)編碼的音頻數(shù)據(jù)作為輸出音頻數(shù)據(jù)。時間到頻率域變換處理可以包括基于離散余弦變換(DCT)的變換處理,諸如改進的DCT (MDCT)處理,或者基于傅立葉的處理,諸如快速傅立葉變換(FFT)處理。在解碼的上下文中,輸入音頻數(shù)據(jù)包括經(jīng)編碼的音頻數(shù)據(jù)并且初始處理模塊可以包括從經(jīng)編碼的多媒體數(shù)據(jù)提取頻率系數(shù)集合的初始解碼模塊,并且最終處理模塊包括使用經(jīng)修改的頻率系數(shù)集合完成音頻解碼處理的最終解碼模塊。在轉碼操作中,用于加水印的濾波器系數(shù)的修改可以在輸入的經(jīng)編碼音頻數(shù)據(jù)的解碼期間或者在要輸出的作為結果的音頻數(shù)據(jù)的編碼期間發(fā)生。
[0012]在一些實施例中,通過基于水印數(shù)據(jù)的對應位來修改頻率系數(shù)集合的至少一個子集,水印數(shù)據(jù)嵌在頻率系數(shù)集合中。這種修改可以包括,例如,如果對應的位值是O則是一個值的線性相加,以及如果對應的位值是I則是一個不同的值的線性相加。集合的每個頻率系數(shù)都可以這樣被修改,或者只有該集合的頻率系數(shù)的一個子集可以被修改。通過以這種方式以逐個集合為基礎地修改頻率系數(shù),水印可以按照以下方式嵌到音頻數(shù)據(jù)中:允許使用例如本領域中已知的平均檢測器或最似然(most-likelihood)檢測器來檢測水印的存在,同時還比常規(guī)的時間域加水印技術對未授權的篡改更有彈性(resilient)。
[0013]圖1以框圖形式說明了根據(jù)本公開內(nèi)容的至少一個實施例的音頻處理設備100。音頻處理設備100可以代表其中音頻的編碼、解碼或轉碼可以被有利使用的任何多種多樣的音頻處理設備。為了說明,音頻處理設備100可以實現(xiàn)為用來與對應視頻內(nèi)容關聯(lián)地編碼、解碼或轉碼音頻數(shù)據(jù)的多媒體處理系統(tǒng)的一部分。另選地,音頻處理設備可以實現(xiàn)為用來生成獨立于任何視頻內(nèi)容的經(jīng)處理的音頻內(nèi)容的獨立系統(tǒng),其中音頻內(nèi)容諸如代表音樂歌曲、有聲讀物等的音頻內(nèi)容。
[0014]在所繪出的例子中,音頻處理設備100包括輸入緩沖區(qū)102、初始處理模塊104、加水印模塊106、最終處理模塊108以及輸出緩沖區(qū)110。初始處理模塊104、加水印模塊106和最終處理模塊108每個都可以完全以硬編碼邏輯(即,硬件)實現(xiàn),實現(xiàn)為存儲在非暫時性計算機可讀存儲介質(zhì)(例如,存儲器114)中的軟件112和訪問并執(zhí)行該軟件的一個或多個處理器116的組合,或者實現(xiàn)為硬編碼邏輯和軟件執(zhí)行的功能的組合。為了說明,在一個實施例中,音頻處理設備100實現(xiàn)為片上系統(tǒng)(SOC),由此模塊104、106和108的部分實現(xiàn)為硬件邏輯,其它部分經(jīng)存儲在SOC處并且被SOC的處理器116執(zhí)行的固件(軟件112的一個實施例)來實現(xiàn)。
[0015]音頻處理設備100的硬件可以使用單個處理器116或多個處理器116實現(xiàn)。這種處理器116可以包括中央處理單元(CPU)、圖形處理單元(GPU)、微控制器、數(shù)字信號處理器、現(xiàn)場可編程門陣列、可編程邏輯設備、狀態(tài)機、邏輯電路系統(tǒng)、模擬電路系統(tǒng)、數(shù)字電路系統(tǒng)、或者基于存儲在存儲器114或其它非暫時性計算機可讀存儲介質(zhì)中的操作指令來操縱信號(模擬的和/或數(shù)字的)的任何設備。存儲器114可以是單個存儲器設備或者多個存儲器設備。這種存儲器設備可以包括硬盤驅動器或者其它盤驅動器、只讀存儲器、隨機存取存儲器、易失性存儲器、非易失性存儲器、靜態(tài)存儲器、動態(tài)存儲器、閃存存儲器、高速緩存存儲器、和/或存儲數(shù)字信息的任何設備。應當指出,當處理模塊經(jīng)狀態(tài)機、模擬電路系統(tǒng)、數(shù)字電路系統(tǒng)和/或邏輯電路系統(tǒng)實現(xiàn)其一個或多個功能時,存儲對應的操作指令的存儲器可以嵌在包括該狀態(tài)機、模擬電路系統(tǒng)、數(shù)字電路系統(tǒng)和/或邏輯電路系統(tǒng)的電路系統(tǒng)中或者在該電路系統(tǒng)外面。
[0016]作為一般性的操作概述,音頻處理設備100從音頻源(例如,現(xiàn)場錄音、來自CD或DVD的脈沖編碼調(diào)制的音頻數(shù)據(jù)等)接收輸入音頻數(shù)據(jù)120,并且在輸入音頻數(shù)據(jù)120被接收到時將其緩沖在輸入緩沖區(qū)102處。接著,初始處理模塊104處理緩沖的輸入音頻數(shù)據(jù)120,以生成代表音頻數(shù)據(jù)120的至少一部分的時間到頻率變換的頻率系數(shù)集合。頻率系數(shù)集合的這種輸出在本文被稱為頻率系數(shù)的流122。接著,通過修改流122的一些或全部集合的一些或全部頻率系數(shù)以生成經(jīng)修改的頻率系數(shù)集合(在本文中被稱為“經(jīng)修改的頻率系數(shù)流126”),加水印模塊106嵌入水印數(shù)據(jù)124。接著,經(jīng)修改的頻率系數(shù)流126被最終處理模塊108用來生成輸出音頻數(shù)據(jù)128,該輸出音頻數(shù)據(jù)128在被傳輸?shù)街虚g或最終目的地之前可以被緩沖在輸出緩沖區(qū)110中。
[0017]在一些實施例中,這種處理在音頻處理設備100作為編碼系統(tǒng)的上下文中被執(zhí)行,使得輸入音頻數(shù)據(jù)120是未編碼的音頻數(shù)據(jù)(例如,表示原始模擬音頻波形的脈沖編碼調(diào)制(PCM)數(shù)據(jù))并且輸出音頻數(shù)據(jù)128是經(jīng)編碼的音頻數(shù)據(jù),諸如根據(jù)一個版本的高級音頻編碼(AAC)標準、一個版本的運動圖片專家組(MPEG)2音頻級別3 (MP3)標準等當中的一個或多個而編碼的音頻數(shù)據(jù)。在這種實現(xiàn)中,初始處理模塊104包括頻率域變換模塊134,該頻率域變換模塊134對輸入音頻數(shù)據(jù)120執(zhí)行時間到頻率域變換,以生成頻率系數(shù)流122。因而,頻率域變換模塊134可以應用例如基于離散余弦變換(DCT)的變換(諸如改進的DCT(MDCT)處理)、基于傅立葉的處理(諸如快