專利名稱:嵌入聲場控制因子的方法以及處理聲場的方法
技術(shù)領域:
本發(fā)明總體構(gòu)思涉及一種控制聲場的方法,更具體地講,涉及一種將聲場因子和聲場信息嵌入聲源中的方法以及一種處理聲源因子和聲場信息的方法。
背景技術(shù):
通常,傳輸用于聲場處理的聲場信息要求用戶直接指定聲場信息。另外,聲場信息通常被插入具有壓縮的聲源的包的頭中。聲場信息也可以從聲源本身提取。
用戶通過具有聲場處理器的音頻設備的輸入來指定聲場信息。這種傳統(tǒng)方法的缺點是,要求用戶根據(jù)聲源的特性指定聲場信息。在克服這個缺點的嘗試中,已經(jīng)公開了一種將關(guān)于介質(zhì)和存儲在其上的音軌的信息與已輸入的聲場信息匹配的方法。
圖1是示出控制聲場的傳統(tǒng)方法的流程圖。圖1中示出的方法在第1998-03133號韓國專利公開中被公開(1998年7月25日出版)。
控制聲場的方法包括操作S21,設置并存儲關(guān)于CD號碼或軌道的聲場信息;操作S22,確定CD是否在播放;操作S23,輸入當前正在播放的CD的號碼和軌道信息;操作S24,確定聲場信息是否已經(jīng)被存儲;操作S25,當關(guān)于給定的CD和軌道的聲場信息已經(jīng)被存儲時,基于關(guān)于給定的CD和軌道的聲場信息來控制聲場;操作S26,當關(guān)于給定的CD和軌道的聲場信息沒有被存儲時,存儲由用戶選擇的聲場信息;和操作S27,基于由用戶選擇的聲場信息來控制聲場。
根據(jù)圖1中示出的控制聲場的適合于CD的傳統(tǒng)方法,基于最初播放CD時所存儲的聲場信息來控制聲場?;蛘撸梢灶A先存儲聲場信息。在這種情況下,當播放給定的CD或軌道時,可以基于存儲的聲場信息來控制聲場。
然而,圖1中示出的控制聲場的方法要求用戶設置聲場信息至少一次。另外,即使聲場特性在軌道的部分中不同,聲場信息也只能被設置為整個軌道聲場特性的平均值。因此,這種方法可以被用于其上記錄有分段聲源(例如,文件、音樂軌道和音樂視頻)的介質(zhì)。然而,這種方法可能不被用于具有諸如肥皂劇或電影的連續(xù)聲源的介質(zhì)。
另外,當聲場信息被插入具有壓縮聲源(例如,MPEG壓縮聲源)的音頻包的頭中時,每當頭被諸如格式變換的變換和/或傳輸破壞時,聲場信息就可能被破壞。另外,當從聲源本身提取聲場信息時,問題是不能保證精度、可能無法實現(xiàn)實時處理,以及對于大多數(shù)類型的介質(zhì)聲場特性顯著地不同。因此,這種方法很難實現(xiàn)。
發(fā)明內(nèi)容
本發(fā)明的總體構(gòu)思提供了一種將表示聲源特性的聲場控制(SFC)因子和表示節(jié)目場景、節(jié)目類型和聲場模式等的聲場信息嵌入未壓縮的聲源中的方法。
本發(fā)明的總體構(gòu)思還提供了一種根據(jù)嵌入SFC因子的方法來處理聲場的方法。
本發(fā)明總體構(gòu)思的另外方面和優(yōu)點將會部分地在如下的描述中被闡述,并且部分地從描述中是顯而易見的,或者可通過本發(fā)明總體構(gòu)思的實施理解。
本發(fā)明總體構(gòu)思的前述和/或其他方面和優(yōu)點通過提供一種嵌入聲場控制(SFC)因子的方法被實現(xiàn),該方法包括將聲場因子和聲場信息編碼以獲得二進制數(shù)據(jù)類型的用于聲源的SFC因子,其中,聲場因子表示聲源的音響特性,聲場信息表示聲源被記錄的環(huán)境;和給進入聲源內(nèi)的SFC因子加水印而不壓縮聲源。
可以使用水印將表示聲場因子和聲場信息的SFC因子嵌入未壓縮的聲源中??梢愿鶕?jù)幀單位而將未壓縮的聲源分段而成為多個幀,并且SFC因子可以被包括在每個幀中。另外,幀分段可以在聲場特性顯著變化的位置開始。
可以使用數(shù)字水印技術(shù)將表示聲源特性的SFC因子嵌入未壓縮的聲源本身。因此,用戶不要求手動地一個接一個設置SFC因子。另外,SFC因子能夠被可靠傳輸而不管由壓縮的聲源的格式變換和傳輸所引起的頭的破壞。
本發(fā)明總體構(gòu)思的前述和/或其他方面和優(yōu)點也可以通過提供一種處理聲場的方法來被實現(xiàn),該方法包括接收具有加水印的SFC因子的聲源;從聲源對加水印的SFC因子解碼;和基于解碼的SFC因子對聲源執(zhí)行聲場處理。
過渡處理,諸如淡入和淡出處理,能夠基于當前幀中的SFC因子和下一個幀中的其他SFC因子被執(zhí)行。因此,這樣能夠執(zhí)行的聲場處理可以具有現(xiàn)場感。
通過下面結(jié)合附圖對實施例進行的描述,本發(fā)明總體構(gòu)思的這些和/或其他方面和優(yōu)點將會變得清楚和更加容易理解,其中圖1是示出控制聲場的傳統(tǒng)方法的流程圖;圖2是示出根據(jù)本發(fā)明總體構(gòu)思的嵌入聲場控制(SFC)因子的設備的方框圖;圖3是示出根據(jù)本發(fā)明總體構(gòu)思的嵌入SFC因子的方法;圖4是示出表示聲源的音響特性的聲場因子的示意圖;圖5是示出圖3的嵌入SFC因子的方法的水印編碼器的操作的示意圖;圖6是示出從被圖5的水印編碼器編碼的聲源提取SFC因子的操作的示意圖;圖7是示出圖6的提取SFC因子的操作的水印解碼操作的示意圖;和圖8是示出根據(jù)本發(fā)明總體構(gòu)思的嵌入SFC因子并處理聲場的方法的流程圖。
具體實施例方式
現(xiàn)在,將詳細描述本發(fā)明總體構(gòu)思的實施例,其示例在附圖中示出,其中,相同的標號始終表示相同的部件。下面通過參考附圖來描述實施例以解釋本發(fā)明總體構(gòu)思。
本發(fā)明的總體構(gòu)思提供一種使用水印來嵌入聲場控制因子(以下,稱作“SFC因子”)的方法,所述聲場控制因子表示未壓縮的聲源的聲場特性。即使SFC因子被嵌入其中,加水印的聲源也能夠保持其聲音性質(zhì)。另外,SFC因子被用于處理聲場,所述SFC因子通過與嵌入方法相應的提取方法被解碼。
圖2是示出根據(jù)本發(fā)明總體構(gòu)思的將SFC因子嵌入聲源中的設備的方框圖。該設備包括水印編碼器202和SFC因子數(shù)據(jù)庫204。水印編碼器202使用相應的SFC因子來執(zhí)行給原始聲源So加水印的操作。SFC因子是指嵌入聲場因子和聲場信息的編碼數(shù)據(jù)。聲場因子(SF因子)表示聲源的音響特性,包括混響時間(RT)、清晰度(C)和早反射模式(PER)。其他音響特性也可以被包括在聲場因子中。另一方面,聲場信息包括節(jié)目場景、節(jié)目類型和聲場模式(SF模式),聲場模式表示聲源被記錄的地點,諸如森林、平原、洞穴等等。
SF因子、SF模式、節(jié)目場景和節(jié)目類型被嵌入聲源So中并被存儲在SFC因子數(shù)據(jù)庫204中??梢灾苯訌穆曉碨o信號提取SF因子。用戶可以在聲源So被記錄的時刻指定SF模式、節(jié)目場景和節(jié)目類型。
圖3示出了根據(jù)本發(fā)明的總體構(gòu)思的嵌入SFC因子的方法。
聲源So被分段而成為多個幀。SFC因子被嵌入聲源So的每個幀中??梢曰诼曉碨o的聲場特性能夠被清晰地辨認出的位置來將所述多個幀分段。例如,可以基于SF模式、節(jié)目場景或節(jié)目類型變化的位置或SF因子能夠被顯著地辨認出的位置來獲得所述多個幀。
聲源So被分段而成為包括fo、f1、f2、...,和fN-1的多個幀。對于所述的多個幀fo、f1、f2、...,和fN-1中的每個,相應的SFC因子SFCF0、SFCF1、SFCF2、...,和SFCFN-1被嵌入聲源So的各個幀。
包含編碼的數(shù)字信息的SFC因子SFCF包括諸如RT-混響時間、C80-清晰度和PER-早反射模式的相應的SF因子和其他聲場信息。
作為使用水印編碼器202采用SFC因子SFCF對聲源So編碼的結(jié)果,得到了包括f’o、f’1、f’2,...、f’N-1的嵌入的結(jié)果。
圖4是示出表示聲源的音響特性的聲場因子的示意圖?;祉憰r間RT表示聲音強度從初始強度降低60dB所經(jīng)歷的時間段。清晰度表示包括第一能量和第二能量的能量比,所述第一能量是從產(chǎn)生聲音的時刻到80ms的能量,所述第二能量是從80ms到聲音強度降低60dB的時刻的能量。早反射模式PER表示聲音被產(chǎn)生后的反射模式。
圖5是示出圖3的嵌入SFC因子的方法的水印編碼器的操作的示意圖。在本發(fā)明的總體構(gòu)思中,可以使用時間展寬回聲方法來將SFC因子加到聲源中。
可以用下面的等式來表示時間展寬回聲方法的核心。
k(n)=δ(n)+α·p(n-Δ)
其中,δ(n)是狄拉克d函數(shù),p(n)是偽噪聲(PN)序列,α是幅值、Δ是時間延遲。時間展寬回聲方法通過使用不同的時間延遲或不同的PN序列p(n)來將不同的信息(二進制數(shù)據(jù))加到聲源。
此外,p(n)用作可以用其提取嵌入的信息的加密密鑰或解密密鑰。因此,可以根據(jù)系統(tǒng)規(guī)格來使用加密密鑰或解密密鑰類型。例如,密鑰的類型可以取決于嵌入的信息的控制訪問。
參考圖5,用下面的等式表示加水印的聲源W(n)。
W(n)=s(n)*k(n)其中,*表示線性卷積。
圖6是示出從被圖5的由水印編碼器編碼的聲源提取SFC因子的操作的示意圖。
當前幀fpresent和下一個幀fnext通過獨立的解碼過程被解碼。因此,當前幀的SFC因子SFCFpresent和下一個幀的SFC因子SFCFnext被解碼。聲場處理器參考解碼的SFC因子。
在聲場處理的操作中,當前幀中的SFC因子被參考來用于處理下一個幀。例如,當當前幀的SF模式是洞穴模式并且下一個幀的SF模式是平原(即,沒有樹木的廣闊區(qū)域)模式時,執(zhí)行淡出(fade-out)處理以防止適合洞穴SF模式的混響聲音影響適合平原SF模式的混響聲音。
圖7是示出圖6的提取SFC因子的操作的水印解碼操作的示意圖。
根據(jù)本發(fā)明的總體構(gòu)思,使用時間展寬回聲(TSE)方法將如圖5中示出的編碼的SFC因子解碼。參考圖7,倒譜分析器702被用來增加加水印的聲源W(n)的清晰度。在圖7的中心,示出了加水印的聲源W(n)的時間-幅值特性 。
用下面的等式來表示從圖7中示出的操作獲得的解碼的聲源d(n)。
d(n)=F-1[log[F[W(n)]]]LPN其中,F(xiàn)[]和F-1[]分別表示傅立葉變換和傅立葉反變換,log[]表示對數(shù)函數(shù),表示互相關(guān)函數(shù),LPN表示PN序列。
通過從d(n)檢查清楚的頂點位置Δ或 來檢測SFC因子。互相關(guān)執(zhí)行偽噪聲函數(shù)和其余倒譜分析的信號之間的解展頻功能。
圖8是示出根據(jù)本發(fā)明總體構(gòu)思的嵌入SFC因子并處理聲場的方法的流程圖。首先,在操作S802,給SFC因子加水印并將其嵌入聲源中。通過參考SFC因子數(shù)據(jù)庫204(見圖2)來設置SFC因子,所述SFC因子是編碼的聲場因子和聲場信息的數(shù)據(jù)。為SFC因子加水印的操作S802在上文參考圖4和圖5被描述。
在操作S804,從加水印的聲源來對SFC因子解碼。上面參考圖6和圖7描述了從加水印的聲源來對SFC因子解碼的操作S804。
在操作S806,確定SFC因子是否被提取。如果SFC因子被提取,那么在操作S808,通過參考SFC因子數(shù)據(jù)庫204(見圖2)來獲得與被嵌入的SFC因子相應的聲場因子和聲場信息。
在操作S810,通過參考在操作S808中獲得的聲場因子和聲場信息來執(zhí)行聲場處理。在操作S810執(zhí)行聲場處理的操作中,通過參考當前幀和下一個幀的SFC因子來控制下一個幀的聲場處理。例如,通過參考當前幀和下一個幀的聲場信息來執(zhí)行淡入(fade-in)和淡出處理和其他過渡處理。因此,這樣執(zhí)行的聲場處理可以具有現(xiàn)場感。
另外,為了方便用戶,在操作S808,由用戶輸入的聲場因子和聲場信息以及從該提取獲得的聲場因子和聲場信息都可以被參考。
在操作S806,如果SFC因子未被提取,那么處理進行到操作S812。在操作S812,通過參考由用戶輸入的聲場因子和聲場信息執(zhí)行聲場處理。
根據(jù)本發(fā)明總體構(gòu)思的嵌入SFC因子的方法,通過使用數(shù)字水印技術(shù)將表示聲源特性的SFC因子嵌入聲源本身。因此,不要求用戶指定聲源的SFC因子中的每個。
另外,根據(jù)本發(fā)明總體構(gòu)思的嵌入SFC因子的方法,SFC因子沒有在具有壓縮的聲源的包的頭中被傳輸。而是,使用數(shù)字水印技術(shù)將SFC因子嵌入未壓縮的聲源中的聲音內(nèi)容之中并在未壓縮的聲源中的聲音內(nèi)容之中傳輸SFC因子。因此,即使頭被壓縮的聲源的格式變換和傳輸破壞,SFC因子也能被可靠傳輸。
另外,根據(jù)本發(fā)明總體構(gòu)思的嵌入SFC因子的方法,未被壓縮的聲源被分段而成為幀。此外,SFC因子被嵌入聲源的每個幀中。因此,SFC因子適合分段的聲源的特性并能夠被實時傳輸。換句話說,由于聲源可以以未壓縮的形式被傳輸,因此,當聲源被聲音處理器接收時,聲源和嵌入到其中的SFC因子可以被實時處理。此外,幀的分段在聲源中聲場控制的特性清楚可辨別的位置被執(zhí)行。因此,SFC因子能夠被更高效地傳輸。
另外,根據(jù)本發(fā)明總體構(gòu)思的處理聲場的方法,能夠基于當前幀和下一個幀中的聲場控制(SFC)因子執(zhí)行諸如淡入和淡出處理的過渡處理。因此,這樣執(zhí)行的聲場處理可以具有現(xiàn)場感。
如上所述,根據(jù)本發(fā)明總體構(gòu)思的嵌入SFC因子的方法,通過使用數(shù)字水印技術(shù),能夠?qū)⒈硎韭曉刺匦缘腟FC因子嵌入聲源本身,而不降低聲音質(zhì)量。另外,在再現(xiàn)聲源的時候,提取并使用SFC因子從而能夠可靠地執(zhí)行聲場處理并保持聲源特性。
盡管已經(jīng)顯示和描述了本發(fā)明總體構(gòu)思的一些實施例,但是本領域的技術(shù)人員應該理解,在不脫離本發(fā)明總體構(gòu)思的原理和精神的情況下,可以對這些實施例進行改變,本發(fā)明總體構(gòu)思的范圍由權(quán)利要求及其等同物來限定。
權(quán)利要求
1.一種嵌入聲場控制因子的方法,該方法包括對聲場因子和聲場信息編碼,以獲得二進制數(shù)據(jù)類型的所述聲源的聲場控制因子,所述聲場因子表示聲源的音響特性,所述聲場信息表示聲源被記錄的環(huán)境;和將所述聲場控制因子加水印進入處于未壓縮狀態(tài)的聲源。
2.如權(quán)利要求1所述的方法,其中,所述將所述聲場控制因子加水印進入處于未壓縮狀態(tài)的聲源的步驟包括執(zhí)行時間展寬回聲編碼。
3.如權(quán)利要求2所述的方法,其中,使用延遲時間和偽噪聲序列中的至少一個來對所述聲場控制因子編碼。
4.如權(quán)利要求1所述的方法,還包括將所述未壓縮的聲源分段而成為多個幀,其中,所述將所述聲場控制因子加水印進入處于未壓縮狀態(tài)的聲源的步驟包括以幀為單位來對所述聲場控制因子編碼。
5.如權(quán)利要求4所述的方法,其中,所述將所述未壓縮的聲源分段而成為多個幀的步驟包括基于所述包含在聲場控制因子中的聲場信息或聲場因子被顯著改變的位置來初始幀分段。
6.如權(quán)利要求1所述的方法,其中,所述聲源是連續(xù)的。
7.如權(quán)利要求1所述的方法,還包括將所述加水印的處于未壓縮狀態(tài)的聲源傳輸?shù)铰曇籼幚砥鳌?br>
8.一種處理聲場的方法,該方法包括接收具有加水印的聲場控制因子的聲源;從所述聲源對所述加水印的聲場控制因子解碼;和基于所述解碼的聲場控制因子來對所述聲源執(zhí)行聲場處理。
9.如權(quán)利要求8所述的方法,其中,所述聲場控制因子每個包括表示所述聲源的音響特性的聲場因子和表示記錄所述聲源的環(huán)境的聲場信息,并且還包括步驟提供基于聲場控制因子數(shù)據(jù)庫而被解碼的所述聲場控制因子,所述聲場控制因子數(shù)據(jù)庫具有聲場控制因子以及相應的聲場因子和聲場信息;和根據(jù)所述解碼的聲場控制因子來表示獲得所述聲源的環(huán)境。
10.如權(quán)利要求9所述的方法,還包括從用戶接收所述聲場因子和所述聲場信息。
11.一種處理聲音的方法,該方法包括對聲音信號編碼并將關(guān)于所述聲音信號的至少一個聲場的聲音信息嵌入處于未壓縮狀態(tài)的所述聲音信號中;和處理聲音信號和所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息。
12.如權(quán)利要求11所述的方法,其中,關(guān)于所述至少一個聲場的聲音信息包括聲場因子、聲場模式、節(jié)目類型和節(jié)目場景中的一個或更多個。
13.如權(quán)利要求12所述的方法,其中,所述聲場因子直接從所述聲音信號被提取,并且所述聲場模式、所述節(jié)目類型和所述節(jié)目場景由用戶在所述聲音信號被記錄的時刻指定。
14.如權(quán)利要求12所述的方法,其中,所述聲場因子包括混響時間、清晰度和早反射模式中的一個或更多個。
15.如權(quán)利要求12所述的方法,其中,所述聲場模式表示所述聲音信號被記錄的位置的特性。
16.如權(quán)利要求11所述的方法,其中,所述聲音信號的編碼并嵌入關(guān)于所述聲音信號的至少一個聲場的聲音信息的步驟包括將所述聲音信號分段而成為多個幀并將相應的聲音信息嵌入所述多個幀中的每個。
17.如權(quán)利要求16所述的方法,其中,所述多個幀根據(jù)聲音信號中關(guān)于所述聲音信號的至少一個聲場的聲音信息改變的位置被分段。
18.如權(quán)利要求11所述的方法,其中,使用水印方法嵌入所述聲音信息,所述水印方法根據(jù)所述聲音信號S(n)和時間展寬回聲方法的核函數(shù)K(n)之間的線性卷積被執(zhí)行。
19.如權(quán)利要求18所述的方法,其中,所述核函數(shù)K(n)由k(n)=δ(n)+α·p(n-Δ)定義,其中,δ(n)表示狄拉克d函數(shù)、α表示幅值、p(n)表示偽噪聲序列、Δ表示時間延遲。
20.如權(quán)利要求19所述的方法,其中,p(n)是解密密鑰和加密密鑰之一,用于從所述聲音信號提取所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息。
21.如權(quán)利要求11所述的方法,其中,所述聲音信號和嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息的處理包括根據(jù)下式來對所述嵌入的關(guān)于聲音信號的至少一個聲場的聲音信息解碼,d(n)=F-1[log[F[W(n)]]]LPN其中,W(n)表示具有所述嵌入的聲音信息的所述聲音信號,F(xiàn)-1[]表示傅立葉反變換,F(xiàn)[]表示傅立葉變換,log[]表示對數(shù)函數(shù),表示互相關(guān)函數(shù),LPN表示偽噪聲序列。
22.如權(quán)利要求11所述的方法,其中,所述的對所述聲音信號的編碼并嵌入關(guān)于所述聲音信號的至少一個聲場的聲音信息的步驟包括將關(guān)于所述至少一個聲場的聲音信息映射到一個或更多個存儲在數(shù)據(jù)庫中的聲場控制因子;和將所述一個或更多個聲場控制因子嵌入所述聲音信號中,所述一個或更多個聲場控制因子與關(guān)于所述聲音信號的至少一個聲場的聲音信息相應。
23.如權(quán)利要求11所述的方法,其中,所述的處理所述聲音信號和所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息的步驟包括通過獨立地對所述聲音信號的多個幀解碼來對所述聲音信號和所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息解碼,所述聲音信號的多個幀包括嵌入其中的相應的聲音信息。
24.如權(quán)利要求23所述的方法,其中,所述的處理所述聲音信號和所述嵌入的關(guān)于聲音信號的至少一個聲場的聲音信息的步驟還包括根據(jù)當前幀的聲場控制因子和先前幀的聲場控制因子來處理與所述聲音信號的當前幀相應的聲音信息。
25.如權(quán)利要求23所述的方法,其中,所述的處理所述聲音信號和所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息的步驟還包括根據(jù)所述嵌入其中的相應的聲音信息,在所述多個幀中的相鄰幀中執(zhí)行過渡處理。
26.如權(quán)利要求25所述的方法,其中,所述過渡處理包括淡入處理和淡出處理中的一個或更多個。
27.如權(quán)利要求24所述的方法,其中,所述過渡處理解決所述相鄰幀之間的聲場的變化。
28.如權(quán)利要求11所述的方法,其中,所述聲音信號中被嵌入的關(guān)于聲音信號的至少一個聲場的聲音信息被數(shù)字地加水印在所述聲音信號中。
29.如權(quán)利要求11所述的方法,其中,所述聲音信號和所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息的處理當所述聲音信號被聲音處理器接收時實時地發(fā)生。
30.一種傳輸關(guān)于聲源的聲音特性的信息的方法,該方法包括當聲源被記錄時,將關(guān)于所述聲源的聲音特性的數(shù)字信息存儲在所述聲源的聲音內(nèi)容之中;和將所述聲源傳輸?shù)铰曇籼幚砥鳌?br>
31.如權(quán)利要求30所述的方法,其中,關(guān)于所述聲音特性的數(shù)字信息被加水印在所述聲源的聲音內(nèi)容中,并且所述聲音內(nèi)容以未壓縮的形式被傳輸。
32.如權(quán)利要求31所述的方法,其中,所述的將關(guān)于所述聲源的聲音特性的數(shù)字信息存儲在所述聲源的聲音內(nèi)容之中的步驟包括根據(jù)聲場中察覺到的變化將所述聲音內(nèi)容分為多個聲音幀,并將關(guān)于各個聲音幀的數(shù)字信息存儲在所述多個聲音幀之中。
33.如權(quán)利要求32所述的方法,還包括接收所述聲源并實時處理所述多個聲音幀和所述存儲的關(guān)于各個聲音幀的數(shù)字信息。
34.一種將聲場控制因子嵌入聲源中的設備,包括聲場控制因子數(shù)據(jù)庫,使聲場因子和聲場信息與二進制數(shù)據(jù)類型的聲源的所述聲場控制因子相互關(guān)聯(lián),所述聲場因子表示所述聲源的音響特性,所述聲場信息表示所述聲源被記錄的環(huán)境;和水印編碼器,將所述聲場控制因子加水印進入處于未壓縮狀態(tài)的聲源。
35.如權(quán)利要求34所述的設備,其中,所述水印編碼器執(zhí)行時間展寬回聲編碼。
36.如權(quán)利要求35所述的設備,其中,使用延遲時間和偽噪聲序列中的至少一個來對所述聲場控制因子編碼。
37.如權(quán)利要求35所述的設備,其中,所述水印編碼器通過將所述未壓縮的聲源分段而成為多個幀并以幀為單位對所述聲場控制因子編碼來將所述聲場控制因子加水印進入聲源。
38.如權(quán)利要求37所述的設備,其中,所述水印編碼器通過基于所述聲場控制因子中包括的聲場信息或聲場因子被顯著改變的位置初始幀分段來將將所述未壓縮的聲源分段而成為多個幀。
39.一種處理聲場的設備,包括解碼器,接收具有加水印的聲場控制因子的聲源并從所述聲源對所述加水印的聲場控制因子解碼;和聲音處理器,基于所述解碼的聲場控制因子來處理所述聲源的聲場。
40.如權(quán)利要求39所述的設備,其中,所述聲場控制因子每個包括表示聲源的音響特性的聲場因子和表示獲得所述聲源的環(huán)境的聲場信息;和所述聲音處理器還提供基于聲場控制因子數(shù)據(jù)庫而被解碼的所述聲場控制因子,所述聲場控制因子數(shù)據(jù)庫具有聲場控制因子和相應的聲場因子和聲場信息,并根據(jù)所述解碼的聲場控制因子來表示獲得所述聲源的環(huán)境。
41.如權(quán)利要求40所述的設備,其中,所述聲音處理器從用戶接收聲場因子與聲場信息。
42.一種處理聲音的設備,包括編碼器,將關(guān)于聲音信號的至少一個聲場的聲音信息嵌入處于未壓縮狀態(tài)的聲音信號中;和聲音處理器,處理所述聲音信號和所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息。
43.如權(quán)利要求42所述的設備,其中,關(guān)于所述至少一個聲場的聲音信息包括聲場因子、聲場模式、節(jié)目類型和節(jié)目場景中的一個或更多。
44.如權(quán)利要求43所述的設備,其中,所述聲場因子從所述聲音信號直接被提取,所述聲場模式、所述節(jié)目類型和所述節(jié)目場景由用戶在所述聲音信號被記錄的時候指定。
45.如權(quán)利要求43所述的設備,其中,所述聲場因子包括混響時間、清晰度和早反射模式中的一個或更多。
46.如權(quán)利要求43所述的設備,其中,所述聲場模式表示所述聲音信號被記錄的地點的特性。
47.如權(quán)利要求42所述的設備,其中,所述編碼器通過將所述聲音信號分段而成為多個幀并將相應的聲音信息嵌入所述多個幀中的每個中來對所述聲音信號編碼并嵌入關(guān)于所述聲音信號的至少一個聲場的聲音信息。
48.如權(quán)利要求47所述的設備,其中,根據(jù)所述聲音信號中關(guān)于所述聲音信號的至少一個聲場的聲音信息變化的位置來將所述多個幀分段。
49.如權(quán)利要求42所述的設備,其中,使用水印方法嵌入所述聲音信號,所述水印方法根據(jù)所述聲音信號S(n)和時間展寬回聲方法的核函數(shù)K(n)之間的線性卷積由編碼器執(zhí)行。
50.如權(quán)利要求49所述的設備,其中,所述核函數(shù)K(n)由k(n)=δ(n)+α·p(n-Δ)定義,其中,δ(n)表示狄拉克d函數(shù)、α表示幅值、p(n)表示偽噪聲序列、Δ表示時間延遲。
51.如權(quán)利要求50所述的設備,其中,p(n)是解密密鑰和加密密鑰之一,用于從所述聲音信號提取所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息。
52.如權(quán)利要求42所述的設備,其中,所述聲音處理器根據(jù)下式來對所述聲音信號和所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息解碼,d(n)=F-1[log[F[W(n)]]]LPN其中,W(n)表示具有所述嵌入的聲音信息的所述聲音信號,F(xiàn)-1[]表示傅立葉反變換,F(xiàn)[]表示傅立葉變換,log[]表示對數(shù)函數(shù),表示互相關(guān)函數(shù),LPN表示偽噪聲序列。
53.如權(quán)利要求42所述的設備,其中,所述編碼器通過將關(guān)于所述至少一個聲場的聲音信息映射到一個或更多個存儲在數(shù)據(jù)庫中的聲場控制因子,并將與關(guān)于所述聲音信號的至少一個聲場的聲音信息相應的所述一個或更多個聲場控制因子嵌入所述聲音信號,來對所述聲音信號編碼并嵌入關(guān)于所述聲音信號的至少一個聲場的聲音信息。
54.如權(quán)利要求42所述的設備,其中,所述聲音處理器通過獨立地對所述聲音信號的多個幀解碼來對所述聲音信號和所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息解碼,所述聲音信號的多個幀包括嵌入其中的相應的聲音信息。
55.如權(quán)利要求54所述的設備,其中,所述聲音處理器根據(jù)當前幀的聲場控制因子和先前幀的聲場控制因子來處理與所述聲音信號的當前幀相應的聲音信息。
56.如權(quán)利要求54所述的設備,其中,所述聲音處理器根據(jù)所述嵌入其中的相應的聲音信息,在所述多個幀中的相鄰幀中執(zhí)行過渡處理。
57.如權(quán)利要求56所述的設備,其中,所述過渡處理包括淡入處理和淡出處理中的一個或更多個。
58.如權(quán)利要求56所述的設備,其中,所述過渡處理解決所述相鄰幀之間的聲場的變化。
59.如權(quán)利要求42所述的設備,其中,關(guān)于所述聲音信號的至少一個聲場的聲音信息被數(shù)字加水印在所述聲音信號中。
60.如權(quán)利要求42所述的設備,其中,當所述聲音信號被所述聲音處理器接收時,所述聲音處理器實時處理所述聲音信號和所述嵌入的關(guān)于所述聲音信號的至少一個聲場的聲音信息。
61.一種傳輸關(guān)于聲源的聲音特性的信息的設備,該設備包括編碼器,當聲源被記錄時,將關(guān)于所述聲源的聲音特性的數(shù)字信息存儲在所述聲源的聲音內(nèi)容之中,并將所述聲源傳輸?shù)铰曇籼幚砥鳌?br>
62.如權(quán)利要求61所述的設備,其中,關(guān)于所述聲音特性的數(shù)字信息被加水印在所述聲源的聲音內(nèi)容中,并且所述聲音內(nèi)容以未壓縮的形式被傳輸。
63.如權(quán)利要求62所述的設備,其中,所述編碼器通過根據(jù)聲場中察覺到的變化將所述聲音內(nèi)容分為多個聲音幀并將關(guān)于各個聲音幀的所述數(shù)字信息存儲在所述多個聲音幀之中來將關(guān)于所述聲源的聲音特性的數(shù)字信息存儲在所述聲源的聲音內(nèi)容之中。
64.如權(quán)利要求63所述的設備,還包括聲音處理器,接收所述聲源并實時處理所述多個聲音幀和所述存儲的關(guān)于各個聲音幀的數(shù)字信息。
全文摘要
本發(fā)明提供了一種將聲場控制因子(SFC因子)嵌入聲源中的方法。該方法包括對聲場因子和聲場信息編碼以獲得二進制數(shù)據(jù)類型的用于聲源的聲場控制因子,聲場因子代表聲源的音響特性,聲場信息表示聲源被記錄的環(huán)境;和給進入聲源之內(nèi)的聲場控制因子加水印而不壓縮聲源。在這種方法中,使用數(shù)字水印技術(shù)將表示聲源特性的SFC因子嵌入聲源本身。因此,用戶不需要手動設置SFC因子。另外,SFC因子能夠被可靠傳輸而不管由格式變換和壓縮的聲源的傳輸所引起的頭的破壞。
文檔編號H04H5/00GK1758333SQ20051009844
公開日2006年4月12日 申請日期2005年9月7日 優(yōu)先權(quán)日2004年9月14日
發(fā)明者高秉燮 申請人:三星電子株式會社