專利名稱:處理音頻信號的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號處理,并且更具體地,涉及用于處理音頻信號的裝置及其方 法。盡管本發(fā)明適用于大范圍的應(yīng)用,但是它特別適合于處理經(jīng)由數(shù)字介質(zhì)、廣播信號等接 收的音頻信號。
背景技術(shù):
通常,在用于通過將包括多個對象的音頻信號下混合成單聲道或立體聲信號來生 成下混合信號的過程中,從該對象中提取參數(shù)(或信息)。這些參數(shù)(或信息)在對下混合 信號解碼中進(jìn)行使用。而且,對象的位置和增益可以通過由用戶進(jìn)行的選擇以及參數(shù)來控 制。
發(fā)明內(nèi)容
技術(shù)問題然而,包括在下混合信號中的對象應(yīng)當(dāng)通過用戶的選擇來控制。在用戶控制對象 的情況下,用戶不便于直接控制所有對象信號。而且,重現(xiàn)包括多個對象的音頻信號的最佳 狀態(tài)可能比專家控制對象的情況更加困難。技術(shù)方案因此,本發(fā)明針對一種用于處理音頻信號的裝置及其方法,該裝置和方法基本上 消除了由于現(xiàn)有技術(shù)的限制和缺點而引起的一個或多個問題。本發(fā)明的目的在于提供一種用于處理音頻信號的裝置及其方法,通過該裝置和方 法可以使用包括預(yù)設(shè)渲染參數(shù)和預(yù)設(shè)元數(shù)據(jù)的預(yù)設(shè)信息來控制對象的電平和位置。本發(fā)明的另一目的在于提供一種用于處理音頻信號的裝置及其方法,通過該裝置 和方法可以使用包括在獨立于下混合信號輸入的比特流中的外部預(yù)設(shè)信息來控制對象的 電平和位置。本發(fā)明的另一目的在于提供一種用于處理音頻信號的裝置及其方法,通過該裝置 和方法可以通過根據(jù)音頻源的特性,使用指示與下混合信號一起輸入的預(yù)設(shè)信息的屬性的 預(yù)設(shè)屬性信息,將在獨立于下混合信號輸入的比特流上承載的外部預(yù)設(shè)信息應(yīng)用于整個下 混合或者下混合信號的數(shù)據(jù)區(qū)域,來控制包括在下混合信號中的對象。本發(fā)明的另一目的在于提供一種用于處理音頻信號的裝置及其方法,通過該裝置 和方法可以基于用戶進(jìn)行的選擇,使用與從在屏幕上顯示的多個外部預(yù)設(shè)元數(shù)據(jù)中選擇的 一個相對應(yīng)外部預(yù)設(shè)渲染參數(shù)來控制對象的電平和位置。本發(fā)明的又一目的在于提供一種用于處理音頻信號的裝置及其方法,通過該裝置 和方法可以以在屏幕上顯示對象的方式來從用戶接收反饋信息,該對象通過使外部預(yù)設(shè)渲 染參數(shù)應(yīng)用于該對象以及選擇的外部預(yù)設(shè)元數(shù)據(jù)來控制。有益效果因此,本發(fā)明提供了如下效果或優(yōu)點。
首先,本發(fā)明單獨地選擇通過數(shù)據(jù)區(qū)域(或幀單元)應(yīng)用預(yù)設(shè)信息,或者選擇將同 一預(yù)設(shè)信息應(yīng)用于整個下混合信號,由此高效地重建音頻信號。第二,本發(fā)明在沒有每個對象的用戶設(shè)定的情況下,使用外部預(yù)設(shè)元數(shù)據(jù)以及預(yù) 先設(shè)定的預(yù)設(shè)信息來選擇多個外部預(yù)設(shè)渲染參數(shù)中的一個,由此便于調(diào)整對象的輸出聲道 的電平。第三,本發(fā)明通過檢查對象來選擇更適當(dāng)?shù)耐獠款A(yù)設(shè)信息,由此調(diào)整對象的輸出 聲道的電平或位置,該對象通過使外部預(yù)設(shè)信息應(yīng)用于該對象以及選擇的預(yù)設(shè)元數(shù)據(jù)來控 制。
附圖被包括進(jìn)來以提供本發(fā)明的進(jìn)一步的理解并且被并入本說明書且構(gòu)成本說 明書的一部分,附示了本發(fā)明的實施例并且連同描述一起用于解釋本發(fā)明的原理。在附圖中圖IA和圖IB是根據(jù)本發(fā)明的一個實施例的根據(jù)預(yù)設(shè)屬性信息通過應(yīng)用預(yù)設(shè)信息 來調(diào)整包括在下混合信號中的對象的概念的示圖;圖2是根據(jù)本發(fā)明的一個實施例的根據(jù)預(yù)設(shè)屬性信息使用外部預(yù)設(shè)信息來調(diào)整 包括在下混合信號中的對象的概念的示圖;圖3是應(yīng)用于包括在下混合信號中的對象的外部預(yù)設(shè)信息的概念的示圖;圖4是根據(jù)本發(fā)明的一個實施例的音頻信號處理裝置的框圖;圖5A和圖5B是根據(jù)本發(fā)明的一個實施例的靜態(tài)預(yù)設(shè)信息接收單元、動態(tài)預(yù)設(shè)信 息接收單元和渲染單元的示意性配置的框圖;圖6是根據(jù)本發(fā)明的一個實施例的外部預(yù)設(shè)信息接收單元和渲染單元的示意性 配置的框圖;圖7是圖5A至圖6的一個中示出的預(yù)設(shè)渲染參數(shù)接收單元的示意性配置的框圖;圖8是根據(jù)本發(fā)明的一個實施例的音頻信號處理裝置的框圖;圖9是外部預(yù)設(shè)信息的比特流結(jié)構(gòu)的示圖;圖10至圖12是根據(jù)本發(fā)明的另一實施例的與本發(fā)明相關(guān)的語法的各種示圖;圖13是根據(jù)本發(fā)明的另一實施例的音頻信號處理裝置的框圖;圖14是根據(jù)本發(fā)明的另一實施例的音頻信號處理裝置的顯示單元的示圖;圖15是根據(jù)本發(fā)明的另一實施例的顯示對其應(yīng)用外部預(yù)設(shè)信息的對象的至少一 個圖示對象的示圖;圖16是根據(jù)本發(fā)明的另一實施例的包括外部預(yù)設(shè)信息接收單元、外部預(yù)設(shè)信息 應(yīng)用確定單元、靜態(tài)預(yù)設(shè)信息接收單元、動態(tài)預(yù)設(shè)信息接收單元和渲染單元的產(chǎn)品的示意 圖;圖17A和圖17B是根據(jù)本發(fā)明的另一實施例的產(chǎn)品的關(guān)系的示意圖,這些產(chǎn)品中 的每一個包括外部預(yù)設(shè)信息接收單元、外部預(yù)設(shè)信息應(yīng)用確定單元、靜態(tài)預(yù)設(shè)信息接收單 元、動態(tài)預(yù)設(shè)信息接收單元和渲染單元;以及圖18是根據(jù)本發(fā)明的又一實施例的包括外部預(yù)設(shè)信息接收單元、外部預(yù)設(shè)信息 應(yīng)用確定單元、靜態(tài)預(yù)設(shè)信息接收單元、動態(tài)預(yù)設(shè)信息接收單元和渲染單元的廣播信號解碼裝置的示意性框圖。最佳模式本發(fā)明的另外的特征和優(yōu)點將在下面的描述中進(jìn)行闡述,并且部分地從描述中而 明顯,或者可以通過實踐本發(fā)明來習(xí)得。本發(fā)明的目的和其他優(yōu)點將通過所撰寫的說明書 及其權(quán)利要求以及附圖中具體指出的結(jié)構(gòu)來實現(xiàn)和獲得。為了實現(xiàn)這些和其他優(yōu)點并且根據(jù)本發(fā)明的目的,如所實施和廣泛描述的,根據(jù) 本發(fā)明的一種用于處理音頻信號的裝置,包括信息接收單元,該信息接收單元接收包括至 少一個對象的下混合信號以及用于渲染包括在下混合信號中的至少一個對象的多個預(yù)設(shè) 信息;外部預(yù)設(shè)信息接收單元,該外部預(yù)設(shè)信息接收單元接收從外部輸入的多個外部預(yù)設(shè) 信息以及指示應(yīng)用了外部預(yù)設(shè)信息的對象數(shù)目的應(yīng)用的對象數(shù)目信息;外部預(yù)設(shè)應(yīng)用確定 單元,該外部預(yù)設(shè)應(yīng)用確定單元基于應(yīng)用的對象數(shù)目信息來確定是否將多個外部預(yù)設(shè)信息 應(yīng)用于下混合信號;外部預(yù)設(shè)信息選擇單元,如果選擇了多個外部預(yù)設(shè)信息,則該外部預(yù)設(shè) 信息選擇單元在多個外部預(yù)設(shè)信息中選擇一個外部預(yù)設(shè)信息;以及渲染單元,該渲染單元 通過將外部預(yù)設(shè)信息應(yīng)用于所有數(shù)據(jù)區(qū)域來控制對象,其中,外部預(yù)設(shè)信息包括用于渲染 下混合信號的外部預(yù)設(shè)渲染參數(shù)和指示外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù)設(shè)元數(shù)據(jù)。優(yōu)選地,外部預(yù)設(shè)應(yīng)用確定單元進(jìn)一步使用指示是否將外部預(yù)設(shè)信息應(yīng)用于下混 合信號的外部元數(shù)據(jù)信息。優(yōu)選地,外部預(yù)設(shè)信息接收單元包括外部預(yù)設(shè)渲染參數(shù)接收單元,該外部預(yù)設(shè)渲 染參數(shù)接收單元接收作為從外部輸入的渲染數(shù)據(jù)的外部預(yù)設(shè)渲染參數(shù);以及外部預(yù)設(shè)元數(shù) 據(jù)接收單元,該外部預(yù)設(shè)元數(shù)據(jù)接收單元接收指示外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù)設(shè)元 數(shù)據(jù)。優(yōu)選地,該裝置進(jìn)一步包括顯示單元,該顯示單元顯示多個外部預(yù)設(shè)元數(shù)據(jù),以在 多個外部預(yù)設(shè)信息中選擇一個外部預(yù)設(shè)信息;以及預(yù)設(shè)信息輸入單元,該預(yù)設(shè)信息輸入單 元被輸入在多個外部預(yù)設(shè)元數(shù)據(jù)中選擇一個外部預(yù)設(shè)元數(shù)據(jù)的選擇信號,其中,預(yù)設(shè)信息 選擇單元基于選擇信號來選擇一個外部預(yù)設(shè)信息。更優(yōu)選地,顯示單元進(jìn)一步顯示基于選擇信號進(jìn)行選擇的外部預(yù)設(shè)元數(shù)據(jù)。更優(yōu)選地,顯示單元包括指示對象的電平或位置的一個或多個圖形元素。在該情況下,對圖形元素進(jìn)行修改以指示對象的電平或位置以及激活。更優(yōu)選地,當(dāng)顯示單元操作地耦合到外部預(yù)設(shè)信息選擇單元時,顯示單元一次顯 示多個外部預(yù)設(shè)元數(shù)據(jù)。優(yōu)選地,該裝置進(jìn)一步包括輸出單元,該輸出單元輸出修改的對象;以及存儲單 元,該存儲單元存儲選擇的外部預(yù)設(shè)信息。為了進(jìn)一步實現(xiàn)這些和其他優(yōu)點并且根據(jù)本發(fā)明的目的,一種處理音頻信號的方 法,包括接收包括至少一個對象的下混合信號、用于渲染包括了下混合信號的至少一個對 象的多個預(yù)設(shè)信息、從外部輸入的多個外部預(yù)設(shè)信息以及指示應(yīng)用了外部預(yù)設(shè)信息的對象 數(shù)目的應(yīng)用的對象數(shù)目信息;基于應(yīng)用的對象數(shù)目信息來確定是否將多個外部預(yù)設(shè)信息應(yīng) 用于下混合信號;如果選擇了多個外部預(yù)設(shè)信息,則在多個外部預(yù)設(shè)信息中選擇一個外部 預(yù)設(shè)信息;以及通過將外部預(yù)設(shè)信息應(yīng)用于所有數(shù)據(jù)區(qū)域來控制對象,其中,外部預(yù)設(shè)信息 包括用于渲染下混合信號的外部預(yù)設(shè)渲染參數(shù)和指示外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù)設(shè)元數(shù)據(jù)。優(yōu)選地,該確定進(jìn)一步使用指示是否將外部預(yù)設(shè)信息應(yīng)用于下混合信號的外部元 數(shù)據(jù)信息。優(yōu)選地,在渲染之后,該方法進(jìn)一步包括顯示對象的受控電平和選擇的外部預(yù)設(shè) 元數(shù)據(jù)。優(yōu)選地,在渲染之后,該方法進(jìn)一步包括存儲選擇的外部預(yù)設(shè)信息。應(yīng)當(dāng)理解,前面的一般描述和后面的詳細(xì)描述是示例性的和解釋性的,并且旨在 提供要求保護(hù)的本發(fā)明的進(jìn)一步的解釋。
具體實施例方式現(xiàn)將詳細(xì)參考本發(fā)明的優(yōu)選實施例,在附圖中圖示了本發(fā)明的示例。首先,本發(fā)明 中的術(shù)語可以被解釋為如下引用。而且,本說明書中沒有公開的術(shù)語可以被解釋為匹配本 發(fā)明的技術(shù)思想的如下意義和概念。因此,本公開的實施例和附圖中實現(xiàn)的配置僅是本發(fā) 明的一個最優(yōu)選的實施例,并且無法表示本發(fā)明的所有技術(shù)思想。因此,應(yīng)當(dāng)理解,在提交 本申請時,可能存在替代它們的各種修改/變化和等同物。在本公開中,‘信息’是通常包括值、參數(shù)、系數(shù)、元素等的術(shù)語,并且可以偶爾不同 地解釋其意義,本發(fā)明不限于此。圖IA和圖IB是根據(jù)本發(fā)明的一個實施例的通過根據(jù)預(yù)設(shè)屬性信息應(yīng)用預(yù)設(shè)信息 來調(diào)整包括在下混合信號中的對象的概念的示圖。本發(fā)明的音頻信號由編碼器編碼成下混 合信號和對象信息。下混合信號或?qū)ο笮畔⑼ㄟ^被承載在單個比特流或者獨立比特流上來 被傳輸?shù)浇獯a器。預(yù)設(shè)信息被包括在對象信息中,并且指示預(yù)先設(shè)定為調(diào)整包括在下混合 信號中的對象的電平、平移等的信息。預(yù)設(shè)信息可以包括各種模式,并且能夠包括用于實際 調(diào)整對象的渲染參數(shù)和指示相應(yīng)模式的特性的元數(shù)據(jù)。這將在稍后參考圖2和圖3來詳細(xì) 解釋。參考圖IA和圖1B,包括在比特流中的對象信息具體地包括配置信息區(qū)域和多個 數(shù)據(jù)區(qū)域(數(shù)據(jù)區(qū)域1、數(shù)據(jù)區(qū)域2、...數(shù)據(jù)區(qū)域η)。配置信息區(qū)域是位于對象信息的比 特流的前面部分的區(qū)域,并且包含共同應(yīng)用于對象信息的所有數(shù)據(jù)區(qū)域的信息。例如,配置 區(qū)域信息可以包含包括樹結(jié)構(gòu)等的配置信息、數(shù)據(jù)區(qū)域長度信息、對象數(shù)目信息等。相反,數(shù)據(jù)區(qū)域是通過基于包含在配置信息區(qū)域中的數(shù)據(jù)區(qū)域長度信息對整個音 頻信號的時域進(jìn)行劃分而生成的單位,并且能夠包括幀。對象信息的數(shù)據(jù)區(qū)域與下混合信 號的數(shù)據(jù)區(qū)域相對應(yīng),并且包含諸如基于相應(yīng)的數(shù)據(jù)區(qū)域的對象的屬性的對象電平信息、 對象增益信息等的對象數(shù)據(jù)信息。在根據(jù)本發(fā)明的一個實施例的音頻信號處理方法中,從比特流的對象信息中讀取 預(yù)設(shè)屬性信息(presetjttributejnformation)。預(yù)設(shè)屬性信息指示預(yù)設(shè)信息被包括在比 特流的哪個區(qū)域中。具體地,預(yù)設(shè)屬性信息指示預(yù)設(shè)信息被包括在對象信息的配置信息區(qū) 域還是對象信息的數(shù)據(jù)區(qū)域中,并且在表1中示出了其詳細(xì)意義。[表 1]
權(quán)利要求
1.一種用于處理音頻信號的裝置,包括信息接收單元,所述信息接收單元接收包括至少一個對象的下混合信號以及用于渲染 所述下混合信號中包括的至少一個對象的多個預(yù)設(shè)信息;外部預(yù)設(shè)信息接收單元,所述外部預(yù)設(shè)信息接收單元接收從外部輸入的多個外部預(yù)設(shè) 信息以及指示被應(yīng)用了所述外部預(yù)設(shè)信息的對象的數(shù)目的應(yīng)用對象數(shù)目信息;外部預(yù)設(shè)應(yīng)用確定單元,所述外部預(yù)設(shè)應(yīng)用確定單元基于所述應(yīng)用對象數(shù)目信息來確 定是否將所述多個外部預(yù)設(shè)信息應(yīng)用于所述下混合信號;外部預(yù)設(shè)信息選擇單元,如果選擇了所述多個外部預(yù)設(shè)信息,則所述外部預(yù)設(shè)信息選 擇單元在所述多個外部預(yù)設(shè)信息中選擇一個外部預(yù)設(shè)信息;以及渲染單元,所述渲染單元通過將所述外部預(yù)設(shè)信息應(yīng)用于所有數(shù)據(jù)區(qū)域來控制所述對象,其中,所述外部預(yù)設(shè)信息包括用于渲染所述下混合信號的外部預(yù)設(shè)渲染參數(shù)和指示所 述外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù)設(shè)元數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的裝置,其中,所述外部預(yù)設(shè)應(yīng)用確定單元進(jìn)一步使用指示是 否將所述外部預(yù)設(shè)信息應(yīng)用于所述下混合信號的外部元數(shù)據(jù)信息。
3.根據(jù)權(quán)利要求1所述的裝置,其中,所述外部預(yù)設(shè)信息接收單元包括外部預(yù)設(shè)渲染 參數(shù)接收單元,所述外部預(yù)設(shè)信息接收單元接收作為從外部輸入的渲染數(shù)據(jù)的外部預(yù)設(shè)渲 染參數(shù);以及外部預(yù)設(shè)元數(shù)據(jù)接收單元,所述外部預(yù)設(shè)元數(shù)據(jù)接收單元接收指示所述外部 預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù)設(shè)元數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的裝置,進(jìn)一步包括顯示單元,所述顯示單元顯示所述多個外部預(yù)設(shè)元數(shù)據(jù)以在所述多個外部預(yù)設(shè)信息中 選擇一個外部預(yù)設(shè)信息;以及預(yù)設(shè)信息輸入單元,所述預(yù)設(shè)信息輸入單元被輸入有在所述多個外部預(yù)設(shè)元數(shù)據(jù)中選 擇一個外部預(yù)設(shè)元數(shù)據(jù)的選擇信號,其中,所述預(yù)設(shè)信息選擇單元基于所述選擇信號來選擇所述一個外部預(yù)設(shè)信息。
5.根據(jù)權(quán)利要求4所述的裝置,其中,所述顯示單元進(jìn)一步顯示基于所述選擇信號的 選擇的外部預(yù)設(shè)元數(shù)據(jù)選擇。
6.根據(jù)權(quán)利要求4所述的裝置,其中,所述顯示單元包括指示所述對象的電平或位置 的一個或多個圖形元素。
7.根據(jù)權(quán)利要求6所述的裝置,其中,對所述圖形元素進(jìn)行修改以指示所述對象的電 平或位置以及激活。
8.根據(jù)權(quán)利要求4所述的裝置,其中,當(dāng)所述顯示單元操作地耦合到所述外部預(yù)設(shè)信 息選擇單元時,所述顯示單元一次顯示所述多個外部預(yù)設(shè)元數(shù)據(jù)。
9.根據(jù)權(quán)利要求1所述的裝置,進(jìn)一步包括 輸出單元,所述輸出單元輸出修改的對象;以及 存儲單元,所述存儲單元存儲所選擇的外部預(yù)設(shè)信息。
10.一種處理音頻信號的方法,包括接收包括至少一個對象的下混合信號、用于渲染所述下混合信號中包括的至少一個對 象的多個預(yù)設(shè)信息、從外部輸入的多個外部預(yù)設(shè)信息以及指示應(yīng)用了所述外部預(yù)設(shè)信息的對象的數(shù)目的應(yīng)用對象數(shù)目信息;基于所述應(yīng)用對象數(shù)目信息來確定是否將所述多個外部預(yù)設(shè)信息應(yīng)用于所述下混合 信號;如果選擇了所述多個外部預(yù)設(shè)信息,則在所述多個外部預(yù)設(shè)信息中選擇一個外部預(yù)設(shè) 信息;以及通過將所述外部預(yù)設(shè)信息應(yīng)用于所有數(shù)據(jù)區(qū)域來控制所述對象, 其中,所述外部預(yù)設(shè)信息包括用于渲染所述下混合信號的外部預(yù)設(shè)渲染參數(shù)和指示所 述外部預(yù)設(shè)渲染參數(shù)的屬性的外部預(yù)設(shè)元數(shù)據(jù)。
11.根據(jù)權(quán)利要求10所述的方法,其中,所述確定進(jìn)一步使用指示是否將所述外部預(yù) 設(shè)信息應(yīng)用于所述下混合信號的外部元數(shù)據(jù)信息。
12.根據(jù)權(quán)利要求10所述的方法,在所述渲染之后,進(jìn)一步包括 顯示所述對象的受控電平和所述選擇的外部預(yù)設(shè)元數(shù)據(jù)。
13.根據(jù)權(quán)利要求10所述的方法,在所述渲染之后,進(jìn)一步包括 存儲所述選擇的外部預(yù)設(shè)信息。
全文摘要
公開了一種用于處理音頻信號的裝置及其方法。該裝置包括信息接收單元,其接收包括多個預(yù)設(shè)信息的下混合信號;外部預(yù)設(shè)信息接收單元,其接收從外部輸入的多個外部預(yù)設(shè)信息;外部預(yù)設(shè)應(yīng)用確定單元,其確定是否將多個外部預(yù)設(shè)信息應(yīng)用于下混合信號;外部預(yù)設(shè)信息選擇單元,如果選擇了多個外部預(yù)設(shè)信息,則其選擇一個外部預(yù)設(shè)信息;以及渲染單元,其通過將外部預(yù)設(shè)信息應(yīng)用于所有數(shù)據(jù)區(qū)域來控制對象。因此,通過以數(shù)據(jù)區(qū)域為單位單獨地選擇并且應(yīng)用外部預(yù)設(shè)信息或者通過選擇同一外部預(yù)設(shè)信息并且將其應(yīng)用到整個下混合信號,可以高效地重建音頻信號。而且,根據(jù)音頻源的特性,通過將通過應(yīng)用外部預(yù)設(shè)渲染參數(shù)而進(jìn)行調(diào)整的對象顯示在屏幕上,可以從用戶接收反饋信息。
文檔編號G10L19/00GK102100009SQ200980127962
公開日2011年6月15日 申請日期2009年7月15日 優(yōu)先權(quán)日2008年7月15日
發(fā)明者吳賢午, 鄭亮源 申請人:Lg電子株式會社