專利名稱:用于處理音頻信號(hào)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于處理音頻信號(hào)的方法和裝置,并且更具體地,涉及一種用于 處理音頻信號(hào)的裝置及其方法。盡管本發(fā)明適合于廣泛范圍的應(yīng)用,但是其尤其適合于處 理作為數(shù)字媒體、廣播信號(hào)等而被接收的音頻信號(hào)。
背景技術(shù):
通常地,在通過(guò)將包括多個(gè)對(duì)象的音頻信號(hào)下混為單聲道或立體聲信號(hào)來(lái)生成下 混信號(hào)的過(guò)程中,從對(duì)象中提取參數(shù)(信息)。這些參數(shù)(信息)用于解碼下混的信號(hào)的處 理。并且,可以通過(guò)用戶的選擇來(lái)對(duì)對(duì)象的搖擺(panning)和增益進(jìn)行控制。
發(fā)明內(nèi)容
技術(shù)問(wèn)題然而,下混符號(hào)中包括的對(duì)象應(yīng)當(dāng)通過(guò)用戶的選擇來(lái)適當(dāng)?shù)乜刂?。?dāng)用戶控制對(duì) 象時(shí),對(duì)于用戶來(lái)說(shuō)直接控制對(duì)象是不方便的。并且,相比于由專家控制而言,根據(jù)環(huán)境來(lái) 恢復(fù)包括多個(gè)對(duì)象的音頻信號(hào)的最優(yōu)狀態(tài)可能是更加困難的。技術(shù)方案因此,本發(fā)明針對(duì)一種基本上避免了由于相關(guān)技術(shù)的限制和缺點(diǎn)造成的一個(gè)或多 個(gè)問(wèn)題的用于處理音頻信號(hào)的裝置及其方法。本發(fā)明的目的是提供一種用于處理音頻信號(hào)的裝置及其方法,通過(guò)所述裝置及其 方法,可以使用包括預(yù)置元數(shù)據(jù)和預(yù)置渲染(rendering)數(shù)據(jù)的預(yù)置信息來(lái)控制音頻信號(hào) 中包括的對(duì)象。本發(fā)明的另一個(gè)目的是提供一種用于處理音頻信號(hào)的裝置及其方法,通過(guò)所述裝 置及其方法,可以以基于音頻信號(hào)的輸出信道信息來(lái)確定預(yù)置渲染數(shù)據(jù),并且然后在預(yù)置 渲染數(shù)據(jù)類型為矩陣的情況下將預(yù)置渲染數(shù)據(jù)應(yīng)用于音頻信號(hào)的方式,調(diào)整輸出信道中的 對(duì)象的電平。本發(fā)明的另一個(gè)目的是提供一種用于處理音頻信號(hào)的裝置及其方法,通過(guò)所述裝 置及其方法,根據(jù)從編碼器傳送的單聲道類型預(yù)置渲染矩陣或增益信息中逐步地生成用于 調(diào)整對(duì)象的預(yù)置渲染矩陣。有利效果因此,本發(fā)明提供了以下效果或優(yōu)點(diǎn)。首先,本發(fā)明選擇了先前設(shè)置的預(yù)置信息中的一個(gè),而不需要對(duì)于對(duì)象的用戶設(shè) 置,由此使得易于調(diào)整輸出信道的電平(level)。第二,本發(fā)明基于表示元數(shù)據(jù)長(zhǎng)度的預(yù)置長(zhǎng)度信息將用于表示預(yù)置信息的預(yù)置元 數(shù)據(jù)表示為文本,由此減少了不必要的編碼。第三,在預(yù)置渲染數(shù)據(jù)的類型為矩陣的情況下,本發(fā)明基于音頻信號(hào)的輸出信道 信息確定了表示預(yù)置渲染數(shù)據(jù)的預(yù)置矩陣,由此更加精確和有效地調(diào)整了對(duì)象的輸出信道
4的電平。第四,本發(fā)明逐步地生成預(yù)置矩陣,由此減少了來(lái)自編碼器的比特率。第五,本發(fā)明使用預(yù)置矩陣,用于僅僅部分地調(diào)整對(duì)象,由此減少了不必要的編 碼。
被包括以便提供對(duì)本發(fā)明的進(jìn)一步理解,并且合并到本說(shuō)明書以及構(gòu)成其一部分 的附圖示出了本發(fā)明的實(shí)施例,并且連同說(shuō)明一起用于說(shuō)明本發(fā)明的原理。在附圖中
圖1是根據(jù)本發(fā)明實(shí)施例的應(yīng)用于音頻信號(hào)中包括的對(duì)象的預(yù)置信息的概念圖
圖2是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置的框圖3是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置中的預(yù)置接收單元的框圖4是根據(jù)本發(fā)明實(shí)施例的處理音頻信號(hào)的方法的流程圖5是根據(jù)本發(fā)明實(shí)施例的語(yǔ)法的圖6是根據(jù)本發(fā)明另一個(gè)實(shí)施例的語(yǔ)法的圖7是根據(jù)本發(fā)明另一個(gè)實(shí)施例的語(yǔ)法的圖8是根據(jù)本發(fā)明另一個(gè)實(shí)施例的預(yù)置渲染數(shù)據(jù)接收單元的框圖9是根據(jù)本發(fā)明又一個(gè)實(shí)施例的語(yǔ)法的圖10是根據(jù)本發(fā)明另一個(gè)實(shí)施例的音頻信號(hào)處理裝置的框圖11是根據(jù)本發(fā)明實(shí)施例的實(shí)現(xiàn)預(yù)置接收單元的產(chǎn)品的示意性框圖12是對(duì)應(yīng)于圖11中示出的產(chǎn)品的終端和服務(wù)器之間的關(guān)系的圖13是根據(jù)本發(fā)明實(shí)施例的實(shí)現(xiàn)預(yù)置接收單元的數(shù)字TV的示意性框圖14是根據(jù)本發(fā)明一個(gè)實(shí)施例的包括預(yù)置接收單元的產(chǎn)品的顯示單元的圖。
具體實(shí)施例方式最佳模式本發(fā)明的另外特征和優(yōu)點(diǎn)將在隨后的描述中闡述,并且部分特征和優(yōu)點(diǎn)將根據(jù)描 述而變得明顯,或者可以通過(guò)實(shí)踐本發(fā)明而學(xué)習(xí)到。本發(fā)明的目的和其它優(yōu)點(diǎn)將通過(guò)所寫 的描述和其權(quán)利要求以及附圖中特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。為了實(shí)現(xiàn)這些和其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,如所具體表達(dá)和寬泛描述的, 一種根據(jù)本發(fā)明的處理音頻信號(hào)的方法包括接收音頻信號(hào)和預(yù)置信息,其中,所述音頻信 號(hào)包括至少一個(gè)對(duì)象;從預(yù)置信息獲得預(yù)置矩陣,其中,預(yù)置矩陣表示對(duì)象對(duì)輸出信道的貢 獻(xiàn)程度;通過(guò)使用預(yù)置矩陣,根據(jù)輸出信道來(lái)調(diào)整對(duì)象的輸出電平;以及用所調(diào)整的輸出 電平輸出包括對(duì)象的音頻信號(hào),其中,基于表示預(yù)置信息存在的預(yù)置存在信息和表示預(yù)置 信息數(shù)量的預(yù)置數(shù)量信息來(lái)獲得預(yù)置信息,其中基于表示預(yù)置信息以矩陣表示的預(yù)置類型 信息來(lái)獲得預(yù)置矩陣。優(yōu)選地,基于表示輸出信道是單聲道、立體聲和多信道中的一個(gè)的輸出信道信息 來(lái)獲得預(yù)置矩陣。優(yōu)選地,以1個(gè)比特來(lái)表示預(yù)置類型信息。
更優(yōu)選地,基于對(duì)象的數(shù)量和輸出信道的數(shù)量來(lái)確定預(yù)置矩陣的維數(shù) (dimension) 0為了進(jìn)一步實(shí)現(xiàn)這些和其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,一種根據(jù)本發(fā)明的用 于處理音頻信號(hào)的裝置包括音頻信號(hào)接收單元,其接收包括至少一個(gè)對(duì)象的音頻信號(hào); 預(yù)置元數(shù)據(jù)接收單元,其從預(yù)置信息中接收預(yù)置元數(shù)據(jù),其中預(yù)置元數(shù)據(jù)接收單元從至少 一個(gè)預(yù)置信息中獲得至少一個(gè)預(yù)置元數(shù)據(jù);預(yù)置渲染數(shù)據(jù)接收單元,其從預(yù)置信息中獲得 預(yù)置矩陣,其中預(yù)置矩陣表示對(duì)象對(duì)于輸出信道的貢獻(xiàn)程度并且其中預(yù)置矩陣對(duì)應(yīng)于預(yù) 置元數(shù)據(jù);顯示單元,其顯示預(yù)置元數(shù)據(jù);輸入單元,其接收用于選擇一個(gè)預(yù)置元數(shù)據(jù)的命 令;對(duì)象調(diào)整單元,其通過(guò)使用對(duì)應(yīng)于所選擇的預(yù)置元數(shù)據(jù)的預(yù)置矩陣,根據(jù)輸出信道來(lái)調(diào) 整對(duì)象的輸出電平;以及輸出單元,其用所調(diào)整的輸出電平輸出包括對(duì)象的音頻信號(hào)。優(yōu)選 地,當(dāng)輸出單元輸出音頻信號(hào)時(shí),顯示單元顯示所選擇的預(yù)置元數(shù)據(jù)。優(yōu)選地,顯示單元還顯示對(duì)象的輸出電平。優(yōu)選地,基于表示輸出信道是單聲道、立體聲和多信道中的一個(gè)的輸出信道信息 來(lái)獲得預(yù)置矩陣。優(yōu)選地,基于表示預(yù)置信息的數(shù)量的預(yù)置數(shù)量信息而獲得預(yù)置信息,并且其中基 于表示預(yù)置信息以矩陣表示的預(yù)置類型信息來(lái)獲得預(yù)置矩陣。優(yōu)選地,預(yù)置信息還包括表示要應(yīng)用到對(duì)象的預(yù)置矩陣是否存在的預(yù)置對(duì)象應(yīng)用信息。優(yōu)選地,顯示單元還基于預(yù)置對(duì)象應(yīng)用信息來(lái)顯示要應(yīng)用到對(duì)象的預(yù)置矩陣是否 存在。更優(yōu)選地,顯示單元以文本顯示預(yù)置元數(shù)據(jù)。應(yīng)當(dāng)理解,前述一般描述和以下詳細(xì)描述都是示例性和說(shuō)明性的,并且旨在提供 對(duì)如所聲明的本發(fā)明的進(jìn)一步說(shuō)明。用于發(fā)明的樽式現(xiàn)在將詳細(xì)參考本發(fā)明的優(yōu)選實(shí)施例,其示例在附圖中示出。首先,本公開(kāi)中的”信息’被一般地解釋為包括值、參數(shù)、系數(shù)、元素等的術(shù)語(yǔ),”對(duì) 象’可以被解釋為構(gòu)成吉他、人聲、鋼琴等的音頻信號(hào)的源信號(hào)。它們的含意將根據(jù)場(chǎng)合而 可以進(jìn)行不同地解釋,并且本發(fā)明不限于此。在對(duì)包括多個(gè)對(duì)象的音頻信號(hào)進(jìn)行解碼時(shí),本發(fā)明提供了一種使用用于調(diào)整對(duì)象 的先前設(shè)置的信息之一來(lái)有效地解碼音頻信號(hào)的方法。圖1是根據(jù)本發(fā)明實(shí)施例的應(yīng)用到音頻信號(hào)中包括的對(duì)象的預(yù)置信息的概念圖。 在本公開(kāi)中,用于調(diào)整對(duì)象的先前設(shè)置的信息被稱為預(yù)置信息。預(yù)置信息可以表示根據(jù)音 頻信號(hào)或收聽(tīng)環(huán)境的特征而可選的各種模式之一。并且,可以存在多項(xiàng)預(yù)置信息。而且,預(yù) 置信息包括用于表示預(yù)置信息的屬性等的元數(shù)據(jù)和應(yīng)用于調(diào)整對(duì)象的渲染數(shù)據(jù)。元數(shù)據(jù)可 以以文本類型來(lái)表示。元數(shù)據(jù)不僅表示預(yù)置信息的屬性(例如音樂(lè)廳模式、卡拉OK模式、新 聞模式等),而且包括用于表示預(yù)置信息的有關(guān)信息,例如,預(yù)置信息的作者、成文日期、具 有預(yù)置信息應(yīng)用到其上的對(duì)象的名稱等。同時(shí),渲染數(shù)據(jù)是基本上應(yīng)用于對(duì)象的數(shù)據(jù)。渲 染數(shù)據(jù)可以具有各種形式中的一種。特定地,渲染數(shù)據(jù)可以以矩陣類型存在。參考圖1,預(yù)置信息1可以是音樂(lè)廳模式,用于提供使得音樂(lè)信號(hào)能夠如在音樂(lè)廳中一樣被收聽(tīng)的錄音棚效果。預(yù)置信息2可以是卡拉OK模式,用于減少音頻信號(hào)中的人聲 對(duì)象的電平。并且,預(yù)置信息η可以是新聞模式,用于增加語(yǔ)音對(duì)象電平。而且,預(yù)置信息2 包括元數(shù)據(jù)2和渲染數(shù)據(jù)2。如果用戶選擇了預(yù)置信息2,元數(shù)據(jù)2的卡拉OK模式將在顯 示單元中實(shí)現(xiàn),并且能夠通過(guò)向?qū)ο髴?yīng)用與元數(shù)據(jù)2相關(guān)的渲染數(shù)據(jù)2來(lái)調(diào)整電平。在該情況下,如果渲染數(shù)據(jù)是矩陣類型的,則可以包括單聲道矩陣、立體聲矩陣、 或者多信道矩陣。單聲道矩陣是在對(duì)象的輸出信道是單聲道時(shí)所應(yīng)用的渲染數(shù)據(jù)。立體聲 矩陣是在對(duì)象的輸出信道是立體聲時(shí)所應(yīng)用的渲染數(shù)據(jù)。并且,多信道矩陣是在對(duì)象的輸 出信道是多信道時(shí)所應(yīng)用的渲染數(shù)據(jù)。一旦確定了對(duì)象的輸出信道,則使用所確定的輸出 信道來(lái)確定矩陣。然后能夠通過(guò)將矩陣應(yīng)用到對(duì)象來(lái)調(diào)整電平。因此,使用預(yù)置信息中包括的元數(shù)據(jù)和渲染數(shù)據(jù),對(duì)對(duì)象進(jìn)行調(diào)整,并且對(duì)所應(yīng)用 的預(yù)置信息的屬性或特征進(jìn)行表示。因此,能夠有效地提供具有特定于用戶的效果的音頻信號(hào)。圖2是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置200的框圖。參考圖2,根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置200可以包括預(yù)置信息生成單 元210、和預(yù)置信息接收單元2210、以及對(duì)象調(diào)整單元230。預(yù)置信息生成單元210生成預(yù)置信息,用于調(diào)整音頻信號(hào)中包括的對(duì)象。預(yù)置信 息生成單元210可以包括元數(shù)據(jù)生成單元212和預(yù)置渲染數(shù)據(jù)生成單元214。元數(shù)據(jù)生成 單元212接收用于表示預(yù)置信息的文本信息的輸入,并且然后能夠生成預(yù)置元數(shù)據(jù)。如前 述描述中所提及,預(yù)置元數(shù)據(jù)可以是用于表示預(yù)置信息的特征或?qū)傩缘男畔ⅰT谠撉闆r下, 元數(shù)據(jù)生成單元212可以進(jìn)一步生成表示預(yù)置元數(shù)據(jù)的特征長(zhǎng)度數(shù)量的預(yù)置長(zhǎng)度信息。在 該情況下,預(yù)置長(zhǎng)度信息可以以字節(jié)來(lái)表示,但是預(yù)置長(zhǎng)度信息不限于該示例。同時(shí),如果關(guān)于用于調(diào)整對(duì)象電平的增益和對(duì)象的淘選的信息被輸入到預(yù)置渲染 數(shù)據(jù)生成單元214,則能夠生成預(yù)置渲染數(shù)據(jù)以應(yīng)用到對(duì)象。在該情況下,可以為每個(gè)對(duì)象 生成預(yù)置渲染數(shù)據(jù),并且可以以各種類型之一來(lái)將其實(shí)現(xiàn)。例如,預(yù)置渲染數(shù)據(jù)可以是以矩 陣類型實(shí)現(xiàn)的預(yù)置矩陣。而且,預(yù)置渲染數(shù)據(jù)生成單元214可以進(jìn)一步生成表示是否以矩 陣表示預(yù)置渲染數(shù)據(jù)的預(yù)置類型信息(preset_type_flag)。而且,預(yù)置渲染數(shù)據(jù)生成單元 214可以進(jìn)一步生成表示對(duì)象可以具有多少輸出信道的輸出信道信息。由元數(shù)據(jù)生成單元212生成的預(yù)置長(zhǎng)度信息和預(yù)置元數(shù)據(jù),以及由預(yù)置渲染數(shù)據(jù) 生成單元214生成的預(yù)置類型信息、輸出信道信息、和預(yù)置渲染數(shù)據(jù)可以通過(guò)包括在一個(gè) 比特流中被傳輸,并且更具體地,通過(guò)包括在包括音頻信號(hào)的比特流的輔助(ancillary) 區(qū)域中被傳輸。同時(shí),預(yù)置信息生成單元210可以進(jìn)一步生成表示預(yù)置長(zhǎng)度信息、預(yù)置元數(shù)據(jù)、預(yù) 置類型信息、輸出信道信息、和預(yù)置渲染數(shù)據(jù)是否包括在比特流中的預(yù)置存在信息。預(yù)置 存在信息可以具有表示與預(yù)置信息存在于哪個(gè)區(qū)域中有關(guān)的信息的容器類型,或者標(biāo)志類 型,但是預(yù)置存在信息的示例不限于此。而且,預(yù)置信息生成單元210能夠生成預(yù)置信息。每項(xiàng)預(yù)置信息包括預(yù)置長(zhǎng)度信 息、預(yù)置元數(shù)據(jù)、預(yù)置類型信息、輸出信道信息、和預(yù)置渲染數(shù)據(jù)。在該情況下,預(yù)置生成單 元210可以進(jìn)一步生成表示預(yù)置信息數(shù)量的預(yù)置數(shù)量信息。預(yù)置信息接收單元220接收預(yù)置信息生成單元210生成和發(fā)送的預(yù)置信息。并且,
7預(yù)置信息接收單元220可以包括元數(shù)據(jù)接收單元222和預(yù)置渲染數(shù)據(jù)接收單元224。元數(shù)據(jù)接收單元222接收并且然后輸出預(yù)置元數(shù)據(jù),并且預(yù)置渲染數(shù)據(jù)接收單元 224接收預(yù)置渲染數(shù)據(jù)(例如,預(yù)置矩陣),其細(xì)節(jié)將參考圖3和圖4來(lái)說(shuō)明。而且,對(duì)象調(diào)整單元230接收包括多個(gè)對(duì)象的音頻信號(hào)和由渲染數(shù)據(jù)接收單元 224生成的預(yù)置渲染數(shù)據(jù)。在該情況下,將預(yù)置渲染數(shù)據(jù)應(yīng)用于對(duì)象,由此可以調(diào)整對(duì)象的 電平或位置。圖3是根據(jù)本發(fā)明實(shí)施例的音頻信號(hào)處理裝置200的預(yù)置接收單元200中包括的 元數(shù)據(jù)接收單元310和預(yù)置渲染數(shù)據(jù)接收單元320的框圖。參考圖3,元數(shù)據(jù)接收單元310包括預(yù)置長(zhǎng)度信息接收單元312和預(yù)置元數(shù)據(jù)接收 單元314。預(yù)置長(zhǎng)度信息接收單元312接收表示用于表示預(yù)置信息的預(yù)置元數(shù)據(jù)的長(zhǎng)度的 預(yù)置長(zhǎng)度信息,并且然后獲得預(yù)置元數(shù)據(jù)的長(zhǎng)度。隨后,預(yù)置元數(shù)據(jù)接收單元314讀取總計(jì) 達(dá)到由預(yù)置長(zhǎng)度信息所表示的長(zhǎng)度的比特流,并且然后接收預(yù)置元數(shù)據(jù)。而且,預(yù)置元數(shù)據(jù) 接收單元314將作為表示預(yù)置信息的類型或?qū)傩缘脑獢?shù)據(jù)的預(yù)置元數(shù)據(jù)轉(zhuǎn)換為文本類型, 并且然后輸出文本類型的所轉(zhuǎn)換的預(yù)置元數(shù)據(jù)。預(yù)置渲染數(shù)據(jù)接收單元320包括預(yù)置類型標(biāo)志接收單元322、輸出信道信息接收 單元324、和預(yù)置矩陣接收單元326。預(yù)置數(shù)據(jù)類型標(biāo)志接收單元322接收表示預(yù)置渲染數(shù) 據(jù)是否具有矩陣類型的預(yù)置類型標(biāo)志(preSent_type_flag)。在該情況下,預(yù)置類型標(biāo)志的 含意在表格1中示出。[表 1]
預(yù)置類型標(biāo)志曰屆、0預(yù)置渲染數(shù)據(jù)的類型不是矩陣1預(yù)置渲染數(shù)據(jù)的類型是矩陣如果預(yù)置類型標(biāo)志表示預(yù)置渲染數(shù)據(jù)的類型是矩陣的情況,輸出信道信息接收單 元324接收表示在其上音頻信號(hào)中包括的對(duì)象將被重放的輸出信道的數(shù)量的輸出信道信 息。輸出信道信息可以包括單聲道信道、立體聲信道、或多信道(5.1信道),但是輸出信道 信息的示例不限于此。預(yù)置矩陣接收單元326基于輸出信道信息接收并且輸出表示對(duì)象對(duì)輸出信道的 貢獻(xiàn)程度,并且對(duì)應(yīng)于預(yù)置元數(shù)據(jù)的預(yù)置矩陣。在該情況下,預(yù)置矩陣可以包括單聲道預(yù)置 矩陣、立體聲預(yù)置矩陣、和多信道預(yù)置矩陣中的一個(gè)?;趯?duì)象的數(shù)量和輸出信道的數(shù)量來(lái) 確定預(yù)置矩陣的維數(shù)。因此,預(yù)置矩陣可以具有(對(duì)象數(shù)量)*(輸出信道數(shù)量)的形式。例 如,如果存在音頻信號(hào)中包括的η個(gè)對(duì)象,并且來(lái)自輸出信道信息接收單元324的輸出信道 對(duì)應(yīng)于5. 1信道(即,六個(gè)信道),則預(yù)置矩陣接收單元326能夠以η*6的形式來(lái)實(shí)現(xiàn)公式 1中示出的預(yù)置多信道矩陣。[公式1]
lOJLfmQjRfmQtCmQ1LfemQ,Ls mO1Rs
mN-I,Lf mN~\,Rf mN~l,C mN-ULfe mN-X1Ls mN-\,Rs在公式1中,矩陣分量ma,b是表示第a個(gè)對(duì)象被包括在第b個(gè)信道中的程度的增 益值。隨后,預(yù)置多信道矩陣可以通過(guò)被應(yīng)用到音頻信道來(lái)調(diào)整對(duì)應(yīng)對(duì)象的電平。因此,本發(fā)明的預(yù)置信息接收單元220通過(guò)使用預(yù)置長(zhǎng)度信息來(lái)讀取必需數(shù)量的 比特流,從而有效地表示預(yù)置元數(shù)據(jù),并且能夠通過(guò)基于輸出信道信息而獲得預(yù)置矩陣來(lái) 有效地調(diào)整音頻信號(hào)中包括的對(duì)象的增益等。圖4是根據(jù)本發(fā)明實(shí)施例的處理音頻信號(hào)的方法的流程圖。參考圖4,接收包括至少一個(gè)對(duì)象的音頻信號(hào)[S410]。并且,接收表示是否存在對(duì) 對(duì)象增益或淘選進(jìn)行調(diào)整的預(yù)置信息的預(yù)置存在信息[S415]。如果預(yù)置信息存在,接收表 示存在多少(η)預(yù)置信息的預(yù)置數(shù)量信息[S420]。預(yù)置數(shù)量信息假設(shè)預(yù)置信息存在,并且 可以表示為“(實(shí)際存在的預(yù)置信息)_1”。隨后,接收表示用于表示預(yù)置信息的元數(shù)據(jù)具有 多少比特(或字節(jié))的預(yù)置長(zhǎng)度信息[S430]。基于預(yù)置長(zhǎng)度信息,接收預(yù)置元數(shù)據(jù)[S435]。 例如,輸出卡拉OK模式、音樂(lè)廳模式、新聞模式等[S437]。在該情況下,預(yù)置元數(shù)據(jù)可以具 有文本類型。如前述描述中所提及,預(yù)置元數(shù)據(jù)可以包括公開(kāi)預(yù)置信息作者、成文日期、由 預(yù)置信息調(diào)整的對(duì)象的名稱等的元數(shù)據(jù)數(shù)據(jù),以及表示預(yù)置信息的錄音棚效果的元數(shù)據(jù), 但是預(yù)置元數(shù)據(jù)的示例不限于此。隨后,接收表示預(yù)置信息中包括的預(yù)置渲染數(shù)據(jù)的類型的預(yù)置類型信息[S440]。 基于預(yù)置類型信息,確定預(yù)置數(shù)據(jù)的類型是矩陣類型[S445]。如果預(yù)置數(shù)據(jù)的類型是矩陣 類型[步驟S445中為”是’],接收表示存在多少對(duì)象的對(duì)象信道的輸出信道信息[S450]。 基于輸出信道信息,接收所編碼預(yù)置矩陣中的對(duì)應(yīng)預(yù)置矩陣[S455]。基于對(duì)象數(shù)量和輸出 信道的數(shù)量來(lái)確定預(yù)置矩陣的維數(shù)。例如,如果對(duì)象的輸出信道是立體聲,所接收的預(yù)置矩 陣將是“(對(duì)象數(shù)量)*2”類型的立體聲預(yù)置矩陣。確定包括上面接收的預(yù)置長(zhǎng)度信息、預(yù)置元數(shù)據(jù)、預(yù)置類型信息、輸出信道信息、 和預(yù)置矩陣的(第i項(xiàng))預(yù)置信息的i是否小于由預(yù)置數(shù)量信息表示的預(yù)置的數(shù)量(η) [S460]。如果i小于預(yù)置數(shù)量信息[步驟S460中為“是”],則例程返回到步驟S430,并且然 后重做接收下一個(gè)[第(i+Ι)]預(yù)置的預(yù)置長(zhǎng)度信息的步驟。如果第i個(gè)預(yù)置等于預(yù)置數(shù)量 信息[步驟S460中為“否”],則通過(guò)將預(yù)置矩陣應(yīng)用到音頻信號(hào)來(lái)調(diào)整對(duì)象電平[S465]。 同時(shí),如果預(yù)置矩陣不存在于矩陣中[步驟S445中為“否”],則接收除了由編碼器建立的 矩陣之外的類型中實(shí)現(xiàn)的預(yù)置數(shù)據(jù)[S457]。然后通過(guò)將所接收的預(yù)置數(shù)據(jù)應(yīng)用到音頻信號(hào) 來(lái)調(diào)整對(duì)象的電平[S468]。隨后,能夠輸出包括所調(diào)整對(duì)象的音頻信號(hào)[S470]。通過(guò)應(yīng)用預(yù)置矩陣調(diào)整對(duì)象的步驟S465可以使用通過(guò)用戶的選擇而確定的預(yù)置 矩陣[圖中未示出]。用戶能夠選擇對(duì)應(yīng)于預(yù)置矩陣的預(yù)置元數(shù)據(jù),所述預(yù)置元數(shù)據(jù)在輸出 元數(shù)據(jù)的步驟S437中輸出。例如,如果用戶從元數(shù)據(jù)中選擇表示為卡拉OK模式的元數(shù)據(jù), 基于輸出信道信息從所接收的預(yù)置矩陣中選擇對(duì)應(yīng)于卡拉OK模式的預(yù)置元數(shù)據(jù)的預(yù)置矩 陣[S455]。隨后,通過(guò)將對(duì)應(yīng)于卡拉OK模式的所選擇預(yù)置矩陣應(yīng)用到音頻信號(hào)來(lái)調(diào)整對(duì)象 的電平。然后輸出包括所調(diào)整對(duì)象的音頻信號(hào)。
圖5是根據(jù)本發(fā)明實(shí)施例的語(yǔ)法的圖。參考圖5,有關(guān)于預(yù)置信息的信息可以存在于比特流的報(bào)頭區(qū)域中。所以,能夠從 比特流的報(bào)頭區(qū)域獲得預(yù)置數(shù)量信息(bsNumPresets)。如果預(yù)置數(shù)量信息存在[if^bsNumPresets)],在獲得預(yù)置數(shù)量信息表示的預(yù)置信 息的數(shù)量[numPresets = bsNumPresets+1] 0例如,如果一項(xiàng)預(yù)置信息存在,預(yù)置數(shù)量信息 可以將“bsNumPresets”設(shè)置為0。在該情況下,預(yù)置信息的實(shí)際數(shù)量被識(shí)別和用作為“(預(yù) 置數(shù)量信息)+1”??梢允紫葟谋忍亓鹘邮疹A(yù)置數(shù)量信息。基于預(yù)置數(shù)量信息,能夠獲得表示每個(gè)預(yù)置信息(第i個(gè)預(yù)置)的預(yù)置渲染數(shù)據(jù) 的類型(bsPresetTypeti])的信息。如果傳送為矩陣類型的預(yù)置渲染數(shù)據(jù)的情況定義為 特定預(yù)置類型(當(dāng)為矩陣類型時(shí)傳送bsPresetTypeti]的情況),表示預(yù)置渲染數(shù)據(jù)類型 的信息可以是表示預(yù)置渲染數(shù)據(jù)是否以矩陣類型生成并且被傳送的前述的預(yù)置類型信息 (preset_type_flag)。在該情況下,預(yù)置類型信息可以表示為一個(gè)比特。如果第i個(gè)預(yù)置信息中包括的預(yù)置渲染數(shù)據(jù)是矩陣類型(bsPresetTypeti]),則 獲得表示輸出信道具有多少信道的輸出信道信息(bsPresetChti])。并且,基于輸出信道信 息獲得用于調(diào)整音頻信號(hào)中包括的對(duì)象電平的預(yù)置矩陣(getRenderingMatrixO)。圖6是根據(jù)本發(fā)明另一個(gè)實(shí)施例的表示音頻信號(hào)處理方法的語(yǔ)法的圖。預(yù)置信息 存在于報(bào)頭區(qū)域中,并且然后可以相同地應(yīng)用于所有的幀??蛇x地,預(yù)置信息可以根據(jù)時(shí)間 而可變化地應(yīng)用(以下稱為“時(shí)間可變的”),以便有效地調(diào)整對(duì)象的電平。如果預(yù)置信息 是時(shí)間可變的,則與預(yù)置信息有關(guān)的信息應(yīng)當(dāng)被包括在每個(gè)幀中。因此,表示預(yù)置信息是否 被每個(gè)幀包括的信息包括在報(bào)頭中,由此可以有效地構(gòu)造比特流。參考圖6,示出了表示預(yù)置信息是否被包括在每個(gè)幀中的語(yǔ)法。該語(yǔ)法類似于前面 圖5中示出的,表示圖5中示出的音頻信號(hào)處理方法的語(yǔ)法。然而,圖6中示出的語(yǔ)法可以包 括表示預(yù)置信息是否存在時(shí)間可變的預(yù)置時(shí)間變化標(biāo)志信息(bsPresetTimeVaryingti]), 即,已獲得輸出信道信息(bsPresetChti])之后的每個(gè)幀。如果預(yù)置時(shí)間變化標(biāo)志信息包 括在比特流的報(bào)頭區(qū)域中,則使用比特流的幀區(qū)域中包括的預(yù)置矩陣和重置元數(shù)據(jù)來(lái)調(diào)整 對(duì)象的電平。如果預(yù)置時(shí)間變化標(biāo)志信息存在于報(bào)頭中,確定是否存在每個(gè)幀的預(yù)置信息 的更新。如果沒(méi)有更新,分離標(biāo)志被設(shè)置為“保持”。如果存在更新,分離標(biāo)志被設(shè)置為“讀 取”。因此,能夠通過(guò)建立分離標(biāo)志來(lái)有效地建立比特流。而且,預(yù)置存在信息(bsPresetExists)表示比特流中是否存在預(yù)置信息。如 果預(yù)置存在信息表示比特流中不存在預(yù)置信息,則可以不執(zhí)行用于獲得預(yù)置數(shù)量信息 (bsNumPresets)、預(yù)置類型信息(bsPresetType [i])、輸出信道信息(bsPresetCh [i])、和 預(yù)置時(shí)間變化標(biāo)志信息(bsPresetTimeVaryingti])的循環(huán)。如果需要,可以從語(yǔ)法中省略 預(yù)設(shè)存在信息。圖7是根據(jù)本發(fā)明又一個(gè)實(shí)施例的表示音頻信號(hào)處理方法的語(yǔ)法的圖。以上解釋 的預(yù)置矩陣是“(對(duì)象數(shù)量)*(輸出信道數(shù)量)”類型的矩陣,并且表示對(duì)象對(duì)輸出信道的 貢獻(xiàn)程度。在該情況下,通過(guò)接收以便僅僅使用與某些對(duì)象相關(guān)的信息,在效率方面可以減 少所傳送的例外(buts)的數(shù)量。因此,本發(fā)明的另一個(gè)實(shí)施例提出了一種用于僅使用預(yù)置 信息調(diào)整特定對(duì)象的音頻信號(hào)處理方法的語(yǔ)法。參考圖7,語(yǔ)法還可以包括表示是否將用于調(diào)整對(duì)象電平的預(yù)置信息應(yīng)用于每個(gè)對(duì)象的預(yù)置對(duì)象應(yīng)用信息(bSPreSetObjeCt[i][j])。使用預(yù)置對(duì)象應(yīng)用信息,能夠宣告預(yù) 置信息是否包括與相應(yīng)對(duì)象有關(guān)的信息。預(yù)置對(duì)象應(yīng)用信息可以存在于比特流的報(bào)頭區(qū)域 中。如果預(yù)置信息是隨時(shí)間變化的,如圖6中所示,預(yù)置對(duì)象應(yīng)用信息可以存在于幀中。其 能夠宣告用于每個(gè)對(duì)象的預(yù)置信息包括與相應(yīng)對(duì)象有關(guān)的信息,如圖7中所示。并且,表示 包括存在或不存在的對(duì)象索引可以包括在比特流中。如果使用對(duì)象索引,則能夠使用退出 (exit)特征來(lái)更方便地構(gòu)造比特流。在使用哈夫曼表格等的無(wú)損編碼中執(zhí)行編碼的情況下,退出特征設(shè)計(jì)了具有比實(shí) 際參數(shù)數(shù)量多1的參數(shù)的表格。在該情況下,另外分配的參數(shù)可以定義為退出參數(shù)。特別 是,如果退出參數(shù)從比特流獲得,則通過(guò)將其定義為接收全部的相應(yīng)信息來(lái)對(duì)其進(jìn)行使用。 例如,如果預(yù)置信息僅包括與總共十個(gè)對(duì)象中的兩個(gè)有關(guān)的信息(與第3個(gè)對(duì)象有關(guān)的信 息,和與第8個(gè)對(duì)象有關(guān)的信息),能夠以依次傳送對(duì)應(yīng)于第3個(gè)和第8個(gè)對(duì)象的哈夫曼索 引和對(duì)應(yīng)于退出參數(shù)的哈夫曼索引的方式來(lái)有效地構(gòu)造比特流。圖8是根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于逐步生成預(yù)置矩陣的預(yù)置渲染數(shù)據(jù)接收 單元的框圖。參考圖8,預(yù)置渲染數(shù)據(jù)接收單元320包括預(yù)置數(shù)據(jù)類型標(biāo)志接收單元322、輸出 信道信息接收單元324、和預(yù)置矩陣確定單元326。剩下的元件具有與圖2/3中示出的預(yù) 置渲染數(shù)據(jù)接收單元224/320相同的結(jié)構(gòu)和效果,并且它們的細(xì)節(jié)在下面的描述中將被省 略。同時(shí),圖8中示出的預(yù)置矩陣確定單元326包括單聲道類型預(yù)置矩陣接收單元 810、立體聲類型預(yù)置矩陣生成單元820、和多信道類型預(yù)置矩陣生成單元830。單聲道類型預(yù)置矩陣接收單元810從預(yù)置生成單元(圖中未示出)接收表示為 “(對(duì)象數(shù)量)”類型的單聲道預(yù)置矩陣。如果從輸出信道信息接收單元324接收的輸出信 道信息是單聲道的,則原樣地輸出單聲道預(yù)置矩陣。所輸出的單聲道預(yù)置矩陣應(yīng)用到音頻 信號(hào),以調(diào)整對(duì)象的電平。同時(shí),如果輸出信道信息是立體聲的,單聲道預(yù)置矩陣被輸入到立體聲類型預(yù)置 矩陣生成單元820。信道擴(kuò)展信息也被輸入到“(對(duì)象數(shù)量)*2),,類型的立體聲預(yù)置矩陣。 如果輸出信道信息表示多信道,則立體聲預(yù)置矩陣和多信道擴(kuò)展信息輸入到多信道類型預(yù) 置矩陣生成單元830,以便生成“(對(duì)象數(shù)量)*6”類型的多信道預(yù)置矩陣。因此,編碼器僅生成單聲道預(yù)置矩陣,并且預(yù)置矩陣確定單元326通過(guò)使用信道 擴(kuò)展信息來(lái)逐步生成預(yù)置矩陣。因此,如果重放結(jié)構(gòu)僅限于立體聲,則能夠節(jié)省所傳輸比特 的數(shù)量。并且,可以不冗余地傳送用于立體聲或多信道的預(yù)置矩陣。根據(jù)本發(fā)明另一個(gè)實(shí)施例的音頻信號(hào)處理方法提出了一種根據(jù)需要來(lái),對(duì)在發(fā)送 預(yù)置信息或發(fā)送標(biāo)準(zhǔn)化預(yù)置矩陣中的增益值進(jìn)行傳送的方法。這可以擴(kuò)展為,一種僅當(dāng)需 要增益來(lái)調(diào)整音頻信號(hào)中包括的對(duì)象時(shí)發(fā)送增益值,或者簡(jiǎn)單地發(fā)送整個(gè)預(yù)置矩陣的方 法。例如,為了傳送公式1中示出的預(yù)置矩陣,應(yīng)當(dāng)首先發(fā)送n*6的增益信息。在該情況下, 可以如公式2來(lái)計(jì)算增益信息。[公式2]
11
G1 - ^ m
nCH
2
U =0在公式2中,“i”表示對(duì)象,“j”表示輸出信道,并且“nCH”表示輸出信道的數(shù)量。 因?yàn)镚i與對(duì)象數(shù)量一樣多地存在,所以對(duì)于預(yù)置信息而言需要η的數(shù)量。如果淘選信息以及增益信息是必需的,則另外地使用標(biāo)準(zhǔn)化的預(yù)置矩陣。在該情 況下,可以如公式3來(lái)定義標(biāo)準(zhǔn)化的預(yù)置矩陣。
norm
W
m
mN-ItLf
m
I
.J
Gi
*、..在以上述方式使用增益信息和標(biāo)準(zhǔn)化預(yù)置矩陣的情況下,應(yīng)當(dāng)傳送n*6的增益々 息。然而,由于標(biāo)準(zhǔn)化特征,存在0<Λ《1這樣的特征,并且WWlog 10的值總是等于或小 于0。因此,在使用信道電平差異信息的表格,以用于量化增益信息的情況下,僅僅使用與現(xiàn) 有技術(shù)表格的一半。與接收以使用未標(biāo)準(zhǔn)化的預(yù)置矩陣,而不分離地傳送增益信息相比,這 可以節(jié)省必需數(shù)據(jù)的大小以及比特率。此外,因?yàn)樵鲆嫘畔⒖梢詢H包括在預(yù)置信息中,所以 能夠以可擴(kuò)展的方式使用預(yù)置信息。圖9是根據(jù)本發(fā)明又另一個(gè)實(shí)施例的語(yǔ)法的圖,其中,增益信息和淘選相關(guān)信息 通過(guò)被分離地包括在預(yù)置信息中而被傳送。增益信息和淘選信息可以包括在報(bào)頭或幀區(qū)域 中。參考圖9,斜體部分表示從比特流接收實(shí)際預(yù)置值??梢允褂酶鞣N無(wú)噪聲的編碼方 案,并且其被表示為在圖9中的函數(shù)。例如,如果上面的信息存在于幀區(qū)域中,則檢查預(yù)置 信息是否存在。如果預(yù)置信息存在,則接收預(yù)置數(shù)量信息。隨后,首先接收增益信息。增益 信息是表示相應(yīng)的對(duì)象將被再現(xiàn)為規(guī)定的增益值的信息。在該情況下,增益信息可以是前 述的G_i,或者是當(dāng)音頻信號(hào)的電平由外部輸入值來(lái)調(diào)整時(shí)生成的任意下混增益(以下縮 寫為ADG)。另外獲得的淘選信息可以具有各種類型之一。淘選信息可以包括前述的標(biāo)準(zhǔn)化預(yù) 置矩陣。并且,淘選信息可以分為立體聲淘選信息和多信道淘選信息。圖10是根據(jù)本發(fā)明另一個(gè)實(shí)施例的音頻信號(hào)處理裝置的框圖。參考圖10,根據(jù)本發(fā)明另一個(gè)實(shí)施例的音頻信號(hào)處理裝置主要包括下混單元 1010、對(duì)象信息生成單元1020、預(yù)置信息生成單元1030、下混信號(hào)處理單元1040、信息處理 單元1050、和多信道解碼單元1060。首先,多個(gè)對(duì)象被輸入到下混單元1010,并且然后生成為單聲道或立體聲下混信 號(hào)。多個(gè)對(duì)象還被輸入到對(duì)象信息生成單元1020,并且然后生成為表示對(duì)象電平的對(duì)象電 平信息、在下混信號(hào)和/或立體聲下混信號(hào)中包括對(duì)象的增益值的情況下表示包括在下混 信道中的對(duì)象的程度(extent)的對(duì)象增益信息、和包括表示對(duì)象之間相關(guān)或不相關(guān)的對(duì)象相關(guān)信息的對(duì)象信息。隨后,下混信號(hào)和對(duì)象信息被輸入到預(yù)置信息生成單元1030,以便被生成為包括 用于調(diào)整對(duì)象電平的預(yù)置渲染數(shù)據(jù)和用于表示預(yù)置信息的預(yù)置元數(shù)據(jù)的預(yù)置信息。用于生 成預(yù)置渲染數(shù)據(jù)和預(yù)置元數(shù)據(jù)的處理如同圖1到9中示出的音頻信號(hào)處理裝置和方法的前 述描述中所說(shuō)明的一樣,其細(xì)節(jié)將在下面的描述中被省略。同時(shí),由對(duì)象信息生成單元1020 生成的對(duì)象信息和由預(yù)置信息生成單元1030生成的預(yù)置信息可以通過(guò)被包括在SAOC比特 流中來(lái)傳送。信息處理單元1050包括對(duì)象信息處理單元1051和預(yù)置信息接收單元1052。并 且,信息處理單元1050接收SAOC比特流。預(yù)置信息接收單元1052從SAOC比特流中接收上述的預(yù)置存在信息、預(yù)置數(shù)量信 息、預(yù)置長(zhǎng)度信息、預(yù)置元數(shù)據(jù)、預(yù)置類型信息、輸出信道信息、和預(yù)置矩陣,并且使用根據(jù) 圖1到9中示出的為音頻信號(hào)處理方法和裝置所說(shuō)明的各種實(shí)施例的方法。并且,預(yù)置信 息接收單元1052輸出預(yù)置元數(shù)據(jù)和預(yù)置矩陣。對(duì)象信息處理單元1051接收預(yù)置元數(shù)據(jù)和 預(yù)置矩陣,并且然后生成用于預(yù)處理下混信號(hào)的下混處理信息,和用于使用SAOC比特流中 包括的對(duì)象信息以及預(yù)置元數(shù)據(jù)和預(yù)置矩陣來(lái)向上混合下混信號(hào)的多信道信息。隨后,因?yàn)橄禄焯幚硇畔⑤斎氲较禄煨盘?hào)處理單元1040,所以能夠執(zhí)行下混信號(hào) 中包括的對(duì)象的淘選。連同從信息處理單元1050輸出的多信道信息,上面預(yù)處理的下混信 號(hào)被輸入到多信道解碼單元1060,并且然后被向上混合以生成多信道音頻信號(hào)。因此,在使用對(duì)象信息將包括多個(gè)對(duì)象的音頻信號(hào)解碼為多信道信號(hào)時(shí),根據(jù)本 發(fā)明的音頻信號(hào)處理裝置使得易于使用預(yù)置信息來(lái)調(diào)整對(duì)象電平。在如此行動(dòng)時(shí),根據(jù)本 發(fā)明的音頻信號(hào)處理裝置使用基于作為應(yīng)用到對(duì)象的預(yù)置矩陣的輸出信道信息而接收的 矩陣類型數(shù)據(jù),有效地執(zhí)行對(duì)象的電平調(diào)整。并且,根據(jù)本發(fā)明的音頻信號(hào)處理裝置能夠通 過(guò)基于從編碼器端傳送的預(yù)置長(zhǎng)度信息而輸出預(yù)置元數(shù)據(jù),從而增強(qiáng)編碼效率。圖11是根據(jù)本發(fā)明實(shí)施例,實(shí)現(xiàn)包括元數(shù)據(jù)接收單元和預(yù)置渲染數(shù)據(jù)接收單元 的預(yù)置信息接收單元的產(chǎn)品的示意性框圖,并且圖12是對(duì)應(yīng)于圖11中示出的產(chǎn)品的終端 和服務(wù)器之間的關(guān)系的圖。參考圖11,有線/無(wú)線通信單元1110通過(guò)有線/無(wú)線通信系統(tǒng)接收比特流。特別 地,有線/無(wú)線通信單元1110可以包括從由有線通信單元1111、紅外通信單元1112、藍(lán)牙 單元1113、和無(wú)線局域網(wǎng)通信單元1114組成的組中選擇的至少一個(gè)。用戶認(rèn)證單元1120接收用戶信息的輸入,并且然后執(zhí)行用戶認(rèn)證。用戶認(rèn)證單元 1120可以包括從由指紋識(shí)別單元1121、虹膜識(shí)別單元1122、面部識(shí)別單元1123、和語(yǔ)音識(shí) 別單元1124組成的組中選擇的至少一個(gè)。在該情況下,用戶認(rèn)證可以以接收指紋信息、虹 膜信息、面部輪廓信息、或語(yǔ)音信息的輸入;將所輸入的信息轉(zhuǎn)換為用戶信息;并且然后確 定用戶信息是否匹配所注冊(cè)的用戶數(shù)據(jù)的方式來(lái)執(zhí)行。輸入單元1130是使得用戶能夠輸入各種類型的命令的輸入設(shè)備。并且,輸入單元 1130可以包括從由鍵區(qū)單元1131、觸摸板單元1132、和遙控單元1133組成的組中選擇的至 少一個(gè),但是輸入單元1130的示例不限于此。同時(shí),如果從將在隨后說(shuō)明的元數(shù)據(jù)接收單 元1141輸出的用于預(yù)置信息的預(yù)置元數(shù)據(jù)經(jīng)由顯示單元1162而在屏幕上顯現(xiàn),用戶能夠 經(jīng)由輸入單元1130選擇預(yù)置元數(shù)據(jù),并且與所選擇預(yù)置元數(shù)據(jù)有關(guān)的信息被輸入到控制單元1150。信號(hào)解碼單元1140包括元數(shù)據(jù)接收單元1141和預(yù)置渲染數(shù)據(jù)接收單元1142。元 數(shù)據(jù)接收單元1141接收預(yù)置長(zhǎng)度信息,并且然后基于所接收的預(yù)置長(zhǎng)度信息來(lái)接收預(yù)置 元數(shù)據(jù)。如果通過(guò)預(yù)置類型信息將預(yù)設(shè)表示為矩陣,則預(yù)置渲染數(shù)據(jù)接收單元1142接收輸 出信道信息,并且然后基于所接收的輸出信道信息來(lái)接收作為預(yù)置渲染數(shù)據(jù)的預(yù)置矩陣。 信號(hào)解碼單元1140通過(guò)使用所接收比特流、預(yù)置元數(shù)據(jù)和預(yù)置矩陣來(lái)解碼音頻信號(hào),從而 生成輸出信號(hào),并且輸出文本類型的預(yù)置元數(shù)據(jù)??刂茊卧?150從輸入設(shè)備接收輸入信號(hào),并且控制信號(hào)解碼單元1140和輸出單 元1160的所有處理。如前述描述中所提及,如果與所選擇元數(shù)據(jù)有關(guān)的信息從輸入單元 1130輸入到控制單元1150,預(yù)置渲染數(shù)據(jù)接收單元1142接收對(duì)應(yīng)于所選擇預(yù)置元數(shù)據(jù)的 預(yù)置矩陣,并且然后使用所接收的預(yù)置矩陣來(lái)解碼音頻信號(hào)。并且,輸出單元1160是用于輸出由信號(hào)解碼單元1140生成的輸出信號(hào)等的元件。 輸出單元1160可以包括揚(yáng)聲器單元1161和顯示單元1162。如果輸出信號(hào)是音頻信號(hào),則 其經(jīng)由揚(yáng)聲器單元1161進(jìn)行輸出。如果輸出信號(hào)是視頻信號(hào),則其經(jīng)由顯示單元1162進(jìn) 行輸出。此外,輸出單元1160經(jīng)由顯示單元1162在屏幕上顯現(xiàn)從控制單元1150輸入的預(yù) 置元數(shù)據(jù)。圖12示出終端之間或者終端和服務(wù)器之間的關(guān)系,其每一個(gè)均對(duì)應(yīng)于圖11中示 出的產(chǎn)品。參考圖12的(A),可以觀察到,可以經(jīng)由有線/無(wú)線通信單元在第一終端1210和 第二終端1220之間執(zhí)行數(shù)據(jù)或比特流的雙向通信。參考圖12的(B),可以觀察到,可以在服務(wù)器1230和第一終端1240之間執(zhí)行有線
/無(wú)線通信。圖13是根據(jù)本發(fā)明一個(gè)實(shí)施例,實(shí)現(xiàn)包括元數(shù)據(jù)接收單元和預(yù)置渲染數(shù)據(jù)接收 單元的預(yù)置信息接收單元的廣播信號(hào)解碼設(shè)備1300的示意性框圖。參考圖13,信號(hào)分離器1320從調(diào)諧器1310接收與TV廣播相關(guān)的多個(gè)數(shù)據(jù)。所 接收的數(shù)據(jù)由信號(hào)分離器1320分離,并且然后由數(shù)據(jù)解碼器1330解碼。同時(shí),多路分離器 1320分離的數(shù)據(jù)可以存儲(chǔ)在諸如HDD的存儲(chǔ)介質(zhì)1350中。信號(hào)分離器1320分離的數(shù)據(jù)被 輸入到包括音頻解碼器1341和視頻解碼器1342的解碼器1340,以便將其解碼為音頻信號(hào) 和視頻信號(hào)。根據(jù)本發(fā)明的一個(gè)實(shí)施例,音頻解碼器1341包括元數(shù)據(jù)接收單元1341A和預(yù) 置渲染數(shù)據(jù)接收單元1341B。元數(shù)據(jù)接收單元1341A接收預(yù)置長(zhǎng)度信息,并且然后基于所 接收的預(yù)置長(zhǎng)度信息來(lái)接收預(yù)置元數(shù)據(jù)。如果預(yù)置信息以矩陣表示,預(yù)置渲染數(shù)據(jù)接收單 元1341B接收輸出信道信息,并且然后基于所接收的輸出信道信息來(lái)接收作為預(yù)置渲染數(shù) 據(jù)的預(yù)置矩陣。音頻解碼器1341通過(guò)使用所接收的比特流、預(yù)置元數(shù)據(jù)、和預(yù)置矩陣來(lái)解 碼音頻信號(hào),從而生成輸出信號(hào),并且輸出文本類型的預(yù)置元數(shù)據(jù)。顯示單元1370顯現(xiàn)從視頻解碼器1342輸出的視頻信號(hào)和從音頻解碼器1341輸 出的預(yù)置元數(shù)據(jù)。顯示單元1370包括揚(yáng)聲器單元(圖中未示出)。并且,其中使用預(yù)置矩 陣調(diào)整從音頻解碼器1341輸出的對(duì)象的電平的音頻信號(hào)經(jīng)由顯示單元1370中包括的揚(yáng)聲 器單元而輸出。此外,解碼器1340解碼的數(shù)據(jù)可以存儲(chǔ)在諸如HDD的存儲(chǔ)介質(zhì)1350中。同時(shí),信號(hào)解碼設(shè)備1300還可以包括能夠控制通過(guò)用戶輸入信息而接收的多個(gè)數(shù)據(jù)的應(yīng)用管理器1360。應(yīng)用管理器1360包括用戶接口管理器1361和服務(wù)管理器1362。用戶接口管理器 1361控制用于從用戶接收信息的輸入的接口。例如,用戶接口管理器1361能夠控制在顯示 單元1370上顯現(xiàn)的文本的字體類型、屏幕亮度、菜單結(jié)構(gòu)等。同時(shí),如果廣播信號(hào)由解碼器 1340和顯示單元1370解碼和輸出,則服務(wù)管理器1362能夠使用用戶輸入的信息來(lái)控制所 接收的廣播信號(hào)。例如,服務(wù)管理器1362能夠提供廣播信道設(shè)置、警報(bào)功能設(shè)置、成人認(rèn)證 功能等。從應(yīng)用管理器1360輸出的數(shù)據(jù)通過(guò)被傳送到顯示單元1370以及解碼器1340而 可使用。圖14是根據(jù)本發(fā)明一個(gè)實(shí)施例的包括預(yù)置信息接收單元的產(chǎn)品的顯示單元的 圖。顯示單元能夠顯現(xiàn)比特流中包括的所有預(yù)置元數(shù)據(jù)。例如,如圖14中所示的卡拉OK 模式、音樂(lè)廳模式、和新聞模式全部顯現(xiàn)在屏幕上。如果用戶選擇預(yù)置元數(shù)據(jù)之一,顯示單元以將對(duì)應(yīng)于卡拉OK模式的預(yù)置矩陣應(yīng) 用到多個(gè)對(duì)象上的方式來(lái)顯現(xiàn)其電平被調(diào)整的對(duì)象。例如,如果用戶選擇卡拉OK模式,可 以顯現(xiàn)將人聲對(duì)象的電平設(shè)置為最小的結(jié)構(gòu)。而且,如果用戶選擇新聞模式,應(yīng)用到音頻信 號(hào)的預(yù)置矩陣將降低除了人聲對(duì)象之外的對(duì)象的電平。參考圖14,如果選擇了新聞模式,顯示單元能夠顯現(xiàn)人聲對(duì)象的電平被升高為比 卡拉OK模式中的更高的電平,同時(shí)剩余對(duì)象的電平被設(shè)置為最小的結(jié)構(gòu)。因此,以在顯示單元上顯現(xiàn)預(yù)置矩陣調(diào)整的對(duì)象電平,以及表示預(yù)置的預(yù)置元數(shù) 據(jù)的方式,用戶能夠通過(guò)適當(dāng)?shù)剡x擇特定的預(yù)置模式來(lái)收聽(tīng)具有特定錄音棚效果的音頻信號(hào)。工業(yè)應(yīng)用性因此,本發(fā)明可應(yīng)用于編碼和解碼音頻信號(hào)。盡管這里參考了本發(fā)明的優(yōu)選實(shí)施例來(lái)描繪和示出了本發(fā)明,對(duì)于本領(lǐng)域技術(shù)人 員來(lái)說(shuō)明顯的是,在不偏離本發(fā)明的精神和范圍的情況下可以在其中進(jìn)行各種修改和變 化。因此,本發(fā)明旨在覆蓋落入所附權(quán)利要求及其等同物的范圍內(nèi)的本發(fā)明的這些修改和變化。
權(quán)利要求
一種用于處理音頻信號(hào)的裝置,包括音頻信號(hào)接收單元,所述音頻信號(hào)接收單元接收包括至少一個(gè)對(duì)象的音頻信號(hào);預(yù)置元數(shù)據(jù)接收單元,所述預(yù)置元數(shù)據(jù)接收單元從預(yù)置信息中接收預(yù)置元數(shù)據(jù),其中,所述預(yù)置元數(shù)據(jù)接收單元從至少一個(gè)所述預(yù)置信息中獲得至少一個(gè)所述預(yù)置元數(shù)據(jù);預(yù)置渲染數(shù)據(jù)接收單元,所述預(yù)置渲染數(shù)據(jù)接收單元從所述預(yù)置信息中獲得預(yù)置矩陣,其中,所述預(yù)置矩陣表示所述對(duì)象對(duì)于輸出信道的貢獻(xiàn)程度,并且其中,所述預(yù)置矩陣對(duì)應(yīng)于所述預(yù)置元數(shù)據(jù);顯示單元,所述顯示單元顯示所述預(yù)置元數(shù)據(jù);輸入單元,所述輸入單元接收用于選擇所述預(yù)置元數(shù)據(jù)中的一個(gè)的命令;對(duì)象調(diào)整單元,所述對(duì)象調(diào)整單元通過(guò)使用對(duì)應(yīng)于所選擇的預(yù)置元數(shù)據(jù)的所述預(yù)置矩陣來(lái)根據(jù)所述輸出信道調(diào)整所述對(duì)象的輸出電平;以及輸出單元,所述輸出單元用所調(diào)整的輸出電平輸出包括所述對(duì)象的音頻信號(hào)。
2.根據(jù)權(quán)利要求1所述的裝置,其中,所述顯示單元當(dāng)所述輸出單元輸出所述音頻信 號(hào)時(shí),顯示所選擇的預(yù)置元數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的裝置,其中,所述顯示單元還顯示所述對(duì)象的所述輸出電平。
4.根據(jù)權(quán)利要求1所述的裝置,其中,基于表示所述輸出信道是單聲道、立體聲、和多 信道中的一個(gè)的輸出信道信息來(lái)獲得所述預(yù)置矩陣。
5.根據(jù)權(quán)利要求1所述的裝置,其中,基于表示所述預(yù)置信息的數(shù)量的預(yù)置數(shù)量信息 獲得所述預(yù)置信息,并且其中,基于表示所述預(yù)置信息以矩陣表示的預(yù)置類型信息來(lái)獲得 所述預(yù)置矩陣。
6.根據(jù)權(quán)利要求1所述的裝置,其中,所述預(yù)置信息還包括表示要應(yīng)用到所述對(duì)象的 所述預(yù)置矩陣是否存在的預(yù)置對(duì)象應(yīng)用信息。
7.根據(jù)權(quán)利要求1所述的裝置,其中,所述顯示單元還基于所述預(yù)置對(duì)象應(yīng)用信息顯 示要應(yīng)用到所述對(duì)象的所述預(yù)置矩陣是否存在。
8.根據(jù)權(quán)利要求7所述的裝置,其中,所述顯示單元以文本顯示所述預(yù)置元數(shù)據(jù)。
9.一種處理音頻信號(hào)的方法,包括 接收包括至少一個(gè)對(duì)象的音頻信號(hào);接收包括預(yù)置元數(shù)據(jù)和預(yù)置矩陣的預(yù)置信息,其中,所述預(yù)置信息是一個(gè)或多個(gè); 顯示所述預(yù)置元數(shù)據(jù); 選擇所述預(yù)置元數(shù)據(jù)中的一個(gè);從所述預(yù)置信息中獲得對(duì)應(yīng)于所述預(yù)置元數(shù)據(jù)的所述預(yù)置矩陣,其中,所述預(yù)置矩陣 表示所述對(duì)象對(duì)輸出信道的貢獻(xiàn)程度;基于對(duì)應(yīng)于所選擇的預(yù)置元數(shù)據(jù)的所述預(yù)置矩陣,根據(jù)輸出信道來(lái)調(diào)整所述對(duì)象的所 述輸出電平;以及利用所調(diào)整的輸出電平來(lái)輸出包括所述對(duì)象的音頻信號(hào)。
10.根據(jù)權(quán)利要求9所述的方法,還包括 顯示所選擇的預(yù)置元數(shù)據(jù)。
11.根據(jù)權(quán)利要求10所述的方法,還包括在顯示所述對(duì)象的所述電平之后,顯示所述對(duì)象的所述輸出電平。
12.根據(jù)權(quán)利要求9所述的方法,其中,基于表示所述輸出信道是單聲道、立體聲、和多 信道中的一個(gè)的輸出信道信息來(lái)獲得所述預(yù)置矩陣。
13.根據(jù)權(quán)利要求9所述的方法,其中,基于表示所述預(yù)置信息的數(shù)量的預(yù)置數(shù)量信息 來(lái)獲得所述預(yù)置信息,并且其中,基于表示所述預(yù)置信息以矩陣表示的預(yù)置類型信息來(lái)獲 得所述預(yù)置矩陣。
14.根據(jù)權(quán)利要求9所述的方法,其中,所述預(yù)置信息還包括表示要應(yīng)用到所述對(duì)象的 所述預(yù)置矩陣是否存在的預(yù)置對(duì)象應(yīng)用信息,其中,所述預(yù)置元數(shù)據(jù)的所述顯示還基于所述預(yù)置對(duì)象應(yīng)用信息來(lái)顯示要應(yīng)用到所述 對(duì)象的所述預(yù)置矩陣是否存在。
全文摘要
本發(fā)明公開(kāi)了一種用于處理音頻信號(hào)的裝置及其方法。本發(fā)明包括音頻信號(hào)接收單元,其接收包括至少一個(gè)對(duì)象的音頻信號(hào);預(yù)置元數(shù)據(jù)接收單元,其從預(yù)置信息接收預(yù)置元數(shù)據(jù);預(yù)置渲染數(shù)據(jù)接收單元,其從所述預(yù)置信息中獲得預(yù)置矩陣;顯示單元,其顯示所述預(yù)置元數(shù)據(jù);輸入單元,其接收用于選擇一個(gè)所述預(yù)置元數(shù)據(jù)的命令;和對(duì)象調(diào)整單元,其通過(guò)使用對(duì)應(yīng)于所選擇的預(yù)置元數(shù)據(jù)的所述預(yù)置矩陣來(lái)根據(jù)所述輸出信道調(diào)整所述對(duì)象的輸出電平。因此,不需要用戶用于每個(gè)對(duì)象的設(shè)置,如果相對(duì)于預(yù)置元數(shù)據(jù)和預(yù)置矩陣選擇要應(yīng)用到音頻信號(hào)的預(yù)置元數(shù)據(jù),可以使用對(duì)應(yīng)于所選擇的預(yù)置元數(shù)據(jù)的預(yù)置渲染數(shù)據(jù)來(lái)容易地調(diào)整音頻信號(hào)中包括的對(duì)象的電平。
文檔編號(hào)H04R3/00GK101926181SQ200980102980
公開(kāi)日2010年12月22日 申請(qǐng)日期2009年1月23日 優(yōu)先權(quán)日2008年1月23日
發(fā)明者吳賢午, 鄭亮源 申請(qǐng)人:Lg電子株式會(huì)社