音頻譯碼系統(tǒng)、多媒體譯碼系統(tǒng)、聲道重配方法

文檔序號：2829708閱讀：300來源：國知局

專利名稱：音頻譯碼系統(tǒng)、多媒體譯碼系統(tǒng)、聲道重配方法
技術領域：
本發(fā)明有關于信號處理，特別是有關于音頻信號譯碼，具體的講是有關于音頻譯碼系統(tǒng)、多媒體譯碼系統(tǒng)、聲道重配方法。
背景技術：
傳統(tǒng)上，使用一組降混方程式(即，降混矩陣downmix matrix)來進行音頻降混(downmixing)的程序。而該降混矩陣，僅能用于將音頻降混的應用。當輸出聲道數超過輸入聲道數時，該聲道重分配的狀況即不屬于音頻降混，因此，無法使用傳統(tǒng)的降混矩陣來進行該聲道重分配的運作。并且，傳統(tǒng)的降混矩陣通常也不適用于單聲道輸出的狀況。再者，傳統(tǒng)的降混矩陣也無法應用于同時降混(simultaneous downmix)輸出頻道的狀況。而且，傳統(tǒng)的降混矩陣也無法應用于“1+1”輸入(雙重單音頻，dual mono)的情況。

發(fā)明內容
本發(fā)明目的之一為提供一種聲頻信號譯碼系統(tǒng)與方法。
為達成上述目的，本發(fā)明提供一種音頻譯碼系統(tǒng)，其包括一接口以及一處理器。該接口用以接收音頻信號。該處理器用以提供一組聲道重配方程式及聲道重配系數，并依據該組聲道重配方程式及該組聲道重配系數處理該音頻信號，以將一特定數目的輸入聲道(In#)轉換成另一特定數目的輸出聲道(Out#)，其中Out6及Out7表示同時降混輸出聲道，且該組聲道重配方程式包括
Out0Out1Out2Out3Out4Out5Out6Out7=agwbc0xk0ij0yvdef0000m00000nq000000pa′g′0b′c′0y′v′d′e′f′0In0In1In2In3In4In5;]]>其中，a，b，c，d，e，f，g，i，j，k，m，n，p，q，v，w，x，y，a’，b’，c’，d’，e’，f’，g’，v’，y’代表該組聲道重配系數。
本發(fā)明也提供一種多媒體譯碼系統(tǒng)，其包括一接口、一處理器、一內存、一視頻譯碼器以及一音頻譯碼器。該接口用以接收一多媒體比特流。該處理器用以將該多媒體比特流解析為視頻數據和音頻數據。該內存耦接至該處理器，用以將該視頻數據儲存于一視頻數據緩沖區(qū)，并將該音頻數據儲存于一音頻數據緩沖區(qū)。該視頻譯碼器耦接至該內存，擷取該視頻數據并將該視頻數據譯碼以產生一數字視頻信號。該音頻譯碼器耦接至該內存，擷取該音頻數據并將該音頻譯碼以產生一數字音頻信號，該音頻譯碼器包含一接口及一譯碼處理器。該音頻譯碼器的接口用以從該音頻數據緩沖區(qū)擷取該音頻信號。該譯碼處理器用以提供一組聲道重配方程式及聲道重配系數，并依據該組聲道重配方程式及該組聲道重配系數處理該音頻信號，以將一特定數目的輸入聲道(In#)轉換成另一特定數目的輸出聲道(Out#)，該組聲道重配方程式包括Out0Out1Out2Out3Out4Out5=agwbc0xk0ij0yvdef0000m00000nq000000pIn0In1In2In3In4In5]]>其中，a，b，c，d，e，f，g，i，j，k，m，n，p，q，v，w，x，y代表該組聲道重配系數。
本發(fā)明也提供一種聲道重配方法。該方法首先接收音頻信號，其包含一特定數目的輸入聲道(In#)。并提供一組聲道重配方程式及聲道重配系數。并依據該組聲道重配方程式及該組聲道重配系數處理該音頻信號，以將該特定數目的輸入聲道(In#)轉換成另一特定數目的輸出聲道(Out#)，該組聲道重配方程式包括Out0Out1Out2Out3Out4Out5=agwbc0xk0ij0yvdef0000m00000nq000000pIn0In1In2In3In4In5]]>其中，a，b，c，d，e，f，g，i，j，k，m，n，p，q，v，w，x，y代表該組聲道重配系數。

圖1表示依據本發(fā)明實施例所繪的多媒體播放系統(tǒng)的示意圖。
圖2表示依據本發(fā)明實施例所繪的多媒體譯碼器的方塊圖。
圖3A～圖3C表示依據本發(fā)明實施例所繪的聲道重配方程式。
圖4顯示依據本發(fā)明實施例所繪的聲道重配方法的流程圖。
主要組件符號說明多媒體播放系統(tǒng)～100；顯示裝置～120；揚聲器～131～138；多媒體譯碼系統(tǒng)～200；微處理器～210；動態(tài)隨機存取內存～220；視頻譯碼器～240；音頻譯碼器～250；解析器～270；
內存總線～260；接口～252；譯碼處理器～254。
具體實施例方式
為了讓本發(fā)明的目的、特征、及優(yōu)點能更明顯易懂，下文特舉較佳實施例，并配合所附圖1至圖4，做詳細的說明。本發(fā)明說明書提供不同的實施例來說明本發(fā)明不同實施方式的技術特征。其中，實施例中的各組件的配置為說明之用，并非用以限制本發(fā)明。且實施例中圖式標號的部分重復，是為了簡化說明，并非意指不同實施例之間的關聯(lián)性。
圖1表示依據本發(fā)明實施例所繪的多媒體播放系統(tǒng)的示意圖。多媒體播放系統(tǒng)100和顯示裝置120及揚聲器131～138連結。多媒體播放系統(tǒng)100包含視頻譯碼器及音頻譯碼器(未顯示于圖1中)。音頻譯碼器提供可程序化的聲道重配方程式和系數，并由可重設組態(tài)的聲道重配來提供更佳的音響品質。多媒體播放系統(tǒng)100可由一盤片機接受盤片，并可以從該盤片上獲取多媒體比特流。多媒體播放系統(tǒng)100將該多媒體比特流轉換為視頻和音頻信號，并將該視頻信號呈現于顯示裝置120，將該音頻信號由揚聲器131-136呈現。
顯示裝置120可以是例如電視機、計算機屏幕、液晶顯示屏或投影系統(tǒng)等。
上述揚聲器可以不同組態(tài)配置。例如，揚聲器131和132可以為一對左右揚聲器，揚聲器135可以為一中央揚聲器、揚聲器133和134可以為一對左右環(huán)場揚聲器、揚聲器136可以為一低頻揚聲器。也可以僅提供單一的中央揚聲器135。左右揚聲器131和132也可單獨使用或和中央揚聲器135連結使用。揚聲器131～133及135可以配置為左、右、環(huán)場、及中央揚聲器。揚聲器131～135可以配置為左、右、左環(huán)場、右環(huán)場、及中央揚聲器。另外，低頻揚聲器136可以和上述任何一種揚聲器配置方式結合使用。揚聲器137和138可以作為同時降混輸出音頻，例如耳機及電視機輸出喇叭。
舉例而言，多媒體播放系統(tǒng)100接收一盤片，其可以為CD-ROM、只讀DVD、可重復抹寫DVD、或DVD-RAM等。多媒體播放系統(tǒng)100可從盤片讀取音頻數據以及多媒體比特流，或可將音頻數據以及多媒體比特流寫入該盤片。
圖2表示依據本發(fā)明實施例的所繪的多媒體譯碼系統(tǒng)200的方塊圖。多媒體譯碼系統(tǒng)200可以實現于圖1所示的多媒體播放系統(tǒng)中。多媒體譯碼系統(tǒng)200用以將多媒體比特流譯碼，以產生數字視頻信號和音頻信號。多媒體譯碼系統(tǒng)200包括微處理器210、動態(tài)隨機存取內存(DRAM)220、視頻譯碼器240、及音頻譯碼器250。微處理器210用以控制多媒體譯碼系統(tǒng)200中各功能單元。動態(tài)隨機存取內存220用于暫時儲存讀取進來的多媒體比特流。多媒體譯碼系統(tǒng)200也可以進一步包含硬件解析器270，用以透過內存總線260擷取該多媒體比特流，并將該多媒體比特流解析為視頻數據和音頻數據。該多媒體比特流可以直接輸入到硬件解析器270。依據本發(fā)明某些實施例，微處理器210也可以用來將該多媒體比特流解析為視頻數據和音頻數據，并將該視頻數據和音頻數據傳送到動態(tài)隨機存取內存220中適當的緩沖區(qū)內。
視頻譯碼器240透過內存總線260，從一視頻緩沖區(qū)擷取該視頻數據，并將該視頻數據譯碼為數字視頻信號。音頻譯碼器250透過內存總線260，從一音頻緩沖區(qū)擷取該音頻數據，并將該音頻數據譯碼為數字音頻信號。而且，音頻譯碼器250可以操作用以執(zhí)行聲道重配程序，其細節(jié)如后述。該數字音頻信號及視頻信號可以轉換為模擬音頻信號及視頻信號，并傳送到揚聲器131～138和顯示裝置120。
依據本發(fā)明實施例，該音頻比特流數據可以依據MPEG-2或/和AC-3標準轉換。根據MPEG-2和AC-3的標準，只定義了音頻編碼方法的一個架構，所以每次音頻編碼的實際操作可以有其特有的最優(yōu)化計算方法。
音頻譯碼器250包含接口252及譯碼處理器254。接口252用以透過內存總線260，從音頻數據緩沖區(qū)接收該音頻信號。譯碼處理器254提供一組聲道重配方程式及聲道重配系數，并依據該聲道重配方程式及該聲道重配系數處理該音頻信號，將一特定數目的輸入聲道In#轉換為一特定數目的輸出聲道Out#。該聲道重配方程式如第3A～3C圖所示，其可以用于1～8個音頻的聲道重配處理之用。其中a，b，c，d，e，f，g，i，j，k，m，n，p，q，v，w，x，y，a’，b’，c’，d’，e’，f’，g’，v’，y′，分別為聲道重配系數。聲道重配系數可以由使用者設定，或依據該多媒體比特流中設定的參數決定，或依據一特定輸出模式對于所欲輸出聲道的界定決定。即，譯碼處理器254依據使用者設定或多媒體比特流來決定該等聲道重配系數。在某些實施例中，微處理器210可以用于決定該聲道重配系數。
參見圖3A，其表示依據本發(fā)明實施例所繪的聲道重配方程式。一組輸入聲道41依據聲道重配方程式(聲道重配矩陣)43處理，以產生輸出一組輸出聲道45。在該輸入聲道41的比特流中，可以包含關于聲道重配的聲道重配系數的設定信息，其可以作為音頻譯碼器250進行聲道重配程序的運算的默認設定值。該聲道重配矩陣可以用于多種不同的揚聲器配置。且該聲道重配系數為可程序化，以平衡控制輸出聲道。
在圖3A中所示的聲道重配方程式，以及在此說明用的實施例，若無特別注明，其輸入聲道In0-In5分別設定為左(L)、中央(C)、右(R)、左環(huán)場(LS)、右環(huán)場(RS)、低頻(LFE)輸入聲道。而且，輸出聲道Out0-Out5分別為左(L)、中央(C)、右(R)、左環(huán)場(LS)、右環(huán)場(RS)、低頻(subwoofer)輸出聲道。
參見圖4，其表示依據本發(fā)明實施例所繪的聲道重配方法的流程圖。步驟S51中，接收音頻信號，其包含特定數目的輸入聲道(In#)。步驟S53中，提供一組聲道重配方程式及聲道重配系數。步驟S55，依據該聲道重配方程式處理該音頻信號，以將該特定數目的輸入聲道(In#)轉換成特定數目的輸出聲道(Out#)。
圖3A～圖3C圖所示的聲道重配方程式可以用于1～8個聲道的聲道重配處理。以下敘述其實施方式。
例如，就一單一的單輸出聲道而言，d，e，f，i，j，k，m，n，p，q，v，x，y設為0。使得該譯碼處理器由下式將該輸入音頻降混為單輸出聲道Out0＝a×In0+g×In1+w×In2+b×In3+c×In4。
就一雙重的單聲道配置(“1+1”輸入，dual mono)而言，符合杜比(Dolby)標準的聲道重配程序可以由如圖3B所示的聲道重配方程式實現。圖3B所示的聲道重配方程式由圖3A所示的聲道重配方程式改變而成。在此，提供兩個單聲道輸入源(ch1及ch2)，并以3揚聲器配置(3/0輸出)呈現，其中In0＝ch1，而In1＝ch2。
當輸入源為兩個單聲道(ch1及ch2)輸出聲道為一立體(stereo)輸出時，聲道重配系數a及v被設定為1，而其它的聲道重配系數則設定為0。因此，輸出左聲道和右聲道以下式決定。
Out0(L’)＝Ch1Out2(R’)＝Ch2其中，當輸入源為兩個單聲道輸出聲道為一單聲道ch1(Ch1 mono)輸出時，聲道重配系數x被設定為1，其它聲道重配系數則設定為0。因此，輸出中央聲道以下式表示Out1(C’)＝Ch1其中，當輸入源為兩個單聲道輸出聲道為一單聲道ch2(Ch2 mono)輸出時，聲道重配系數k被設定為1，其它聲道重配系數則被設定為0。輸出中央聲道以下式表示Out1(C’)＝Ch2當輸入源為兩個單聲道輸出聲道為一混合單聲道(mixed mono)輸出時，聲道重配系數x和k被設定為0.5，而其它聲道重配系數則設定為0。輸出中央聲道以下式表示Out1(C’)＝0.5×Ch1+0.5×Ch2
不等于0的聲道重配系數的數值大小，可依據多媒體比特流中的設定，也可以另外程序化設定。
圖3C顯示依據本發(fā)明實施例所繪的聲道重配方程式，其可以應用于同時降混。輸出聲道Out6和Out7界定同時降混輸出聲道。依據圖3C所顯示的聲道重配方程式，左(In0)、中央(In1)、右(In2)、左環(huán)場(In3)、右環(huán)場(In4)輸入聲道要進行降混處理，以產生2個同時輸出聲道，如下式所示Out6＝a’×In0+g’×In1+b’×In3+c’×In4Out7＝y(tǒng)’×In0+v’×In1+d’×In2+e’×In3+f’×In4上述表達式和普通的降混表達式不同，普通的降混表達式為Out0＝a×In0+g×In1+w×In2+b×In3+c×In4Out2＝y(tǒng)×In0+v×In1+d×In2+e×In3+f×In4.
再者，在圖3A～圖3C中所示的聲道重配方程式也可以用于不是降混的聲道重配處理(即，upmix)。在此，以3/1輸入和3/2輸出聲道配置為例進行說明。依據本發(fā)明實施例，In0為左聲道(L)、In1為中央聲道(C)、In2為右聲道(R)、In3則為單一環(huán)場聲道(S)。在這樣的聲道重配處理中，聲道重配系數a、k、d被設定為1，聲道重配系數m、n則被設定為0.707(1/)，而其它的聲道重配系數則設定為0。如上所述，輸出聲道以下式決定Out0(L’)＝LOut1(C’)＝COut2(R’)＝ROut3(Ls’)＝0.707×SOut4(Rs’)＝0.707×S上述實施例顯示出聲道重配方程式可以依據實際運用彈性調整，而不局限于降混的聲道重配處理。
需注意的是，任何分配到特定輸出聲道的來源聲道，都可以由將其在聲道重配方程式中對應的聲道重配系數設定為0，而將該來源聲道表示為0而實現。由將聲道重配方程式中所有的聲道重配系數設定為0，可以將輸出聲道完全消弭(zeroed out)。
對于Out0-Out5，當輸入聲道配置和輸出聲道配置相同時，聲道重配系數a、k、d、m、p、q被設定為1，而聲道重配系數b、c、e、f、g，、i，、j、n、v、w、x，、y則被設定為0。在此情況下，輸入音頻樣本被直接復制到輸出緩沖區(qū)中。
雖然本發(fā)明已以較佳實施例揭露如上，然其并非用以限定本發(fā)明，任何熟悉此項技藝者，在不脫離本發(fā)明的精神和范圍內，當可做些許更動與潤飾，因此本發(fā)明的保護范圍當以權利要求為準。
權利要求
1.一種音頻譯碼系統(tǒng)，該系統(tǒng)包括一接口，其用以接收音頻信號；一處理器，其用以提供一組聲道重配方程式及聲道重配系數，并依據所述組聲道重配方程式及所述組聲道重配系數處理所述音頻信號，以將一特定數目的輸入聲道轉換成另一特定數目的輸出聲道，其中Out6及Out7表示同時降混輸出聲道，且所述組聲道重配方程式包括Out0Out1Out2Out3Out4Out5Out6Out7=agwbc0xk0ij0yvdef0000m00000nq000000pa′g′0b′c′0y′v′d′e′f′0In0In1In2In3In4In5;]]>其中，a，b，c，d，e，f，g，i，j，k，m，n，p，q，v，w，x，y，a’，b’，c’，d’，e’，f’，g’，v’，y’代表所述組聲道重配系數，以及In0、In1、In2、In3、In4、In5各表示一輸入聲道，而Out0、Out1、Out2、Out3、Out4、Out5各表示一輸出聲道。
2.如權利要求1所述的音頻譯碼系統(tǒng)，其特征在于，所述特定的輸出聲道數目由使用者指定，其對應于一音頻系統(tǒng)的播放能力，其中每一輸出聲道對應于所述組聲道重配方程式的一部分。
3.如權利要求1所述的音頻譯碼系統(tǒng)，其特征在于，所述特定的輸入聲道數目由使用者設定。
4.如權利要求1所述的音頻譯碼系統(tǒng)，其特征在于，所述組聲道重配系數依據一輸入音頻比特流中設定的參數決定。
5.如權利要求1所述的音頻譯碼系統(tǒng)，其特征在于，所述組聲道重配系數由使用者設定。
6.如權利要求1所述的音頻譯碼系統(tǒng)，其特征在于，所述組聲道重配系數為可程序化，以平衡控制輸出聲道。
7.如權利要求1所述的音頻譯碼系統(tǒng)，其特征在于，所述組聲道重配系數為可程序化，以使得一給定數目的輸入聲道可以重配為1～8個輸出聲道。
8.一種多媒體譯碼系統(tǒng)，其包括一接口，其用以接收一多媒體比特流；一處理器，其用以將所述多媒體比特流解析為視頻數據和音頻數據；一內存，其耦接至所述處理器，用以將所述視頻數據儲存于一視頻數據緩沖區(qū)，并將所述音頻數據儲存于一音頻數據緩沖區(qū)；一視頻譯碼器，其耦接至所述內存，擷取所述視頻數據并將所述視頻數據譯碼以產生一數字視頻信號；以及一音頻譯碼器，其耦接至所述內存，擷取所述音頻數據并將所述音頻數據譯碼以產生一數字音頻信號，所述音頻譯碼器包含一接口，其用以從所述音頻數據緩沖區(qū)接收所述音頻信號；以及一譯碼處理器，其用以提供一組聲道重配方程式及聲道重配系數，并依據所述組聲道重配方程式及所述組聲道重配系數處理所述音頻信號，以將一特定數目的輸入聲道(In#)轉換成另一特定數目的輸出聲道(Out#)，所述組聲道重配方程式包括Out0Out1Out2Out3Out4Out5=agwbc0xk0ij0yvdef0000m00000nq000000pIn0In1In2In3In4In5]]>其中，a，b，c，d，e，f，g，i，j，k，m，n，p，q，v，w，x，y代表所述組聲道重配系數，以及In0、In1、In2、In3、In4、In5各表示一輸入聲道，而Out0、Out1、Out2、Out3、Out4、Out5各表示一輸出聲道。
9.如權利要求8所述的多媒體譯碼系統(tǒng)，其特征在于，所述特定的輸出聲道數目為1時，所述組聲道重配系數之中的d，e，f，i，j，k，m，n，p，q，v，x，y設為0，使得所述譯碼處理器由下式將所述輸入音頻降混為單輸出聲道Out0＝a×In0+g×In1+w×In2+b×In3+c×In4。
10.如權利要求8所述的多媒體譯碼系統(tǒng)，其特征在于，所述譯碼處理器依據所述多媒體比特流決定所述組聲道重配系數。
11.如權利要求10所述的多媒體譯碼系統(tǒng)，其特征在于，所述譯碼處理器依據一特定輸出模式對于所欲輸出聲道的界定，決定所述組聲道重配系數。
12.如權利要求8所述的多媒體譯碼系統(tǒng)，其特征在于，所述譯碼處理器依據使用者設定決定所述組聲道重配系數。
13.一種聲道重配方法，其包括接收音頻信號，其包含一特定數目的輸入聲道(In#)；提供一組聲道重配方程式及聲道重配系數；依據所述組聲道重配方程式及所述組聲道重配系數處理所述音頻信號，以將所述特定數目的輸入聲道(In#)轉換成另一特定數目的輸出聲道(Out#)，所述聲道重配方程式包括Out0Out1Out2Out3Out4Out5=agwbc0xk0ij0yvdef0000m00000nq000000pIn0In1In2In3In4In5]]>其中，a，b，c，d，e，f，g，i，j，k，m，n，p，q，v，w，x，y代表所述組聲道重配系數，以及In0、In1、In2、In3、In4、In5各表示一輸入聲道，而Out0、Out1、Out2、Out3、Out4、Out5各表示一輸出聲道。
14.如權利要求13所述的聲道重配方法，其特征在于，輸出聲道數系為1時，所述組聲道重配系數之中的d，e，f，i，j，k，m，n，p，q，v，x，y設為0，使得所述譯碼處理器由下式將所述輸入音頻降混為單輸出聲道Out0＝a×In0+g×In1+w×In2+b×In3+c×In4。
15.如權利要求13所述的聲道重配方法，其特征在于，所述特定的輸出聲道數目由使用者設定，其對應于一音頻系統(tǒng)的播放能力，其中每一輸出聲道對應于所述組聲道重配方程式的一部分。
16.如權利要求13所述的聲道重配方法，其特征在于，所述特定的輸入聲道數目由使用者設定。
17.如權利要求13所述的聲道重配方法，其特征在于，所述組聲道重配系數依據一輸入音頻比特流中設定的參數決定。
18.如權利要求13所述的聲道重配方法，其特征在于，所述組聲道重配系數由使用者設定。
19.如權利要求13所述的聲道重配方法，其特征在于，所述組聲道重配系數為可程序化，以平衡控制輸出聲道。
20.如權利要求13所述的聲道重配方法，其特征在于，所述組聲道重配系數為可程序化，以使得一給定數目的輸入聲道可以重配為1～8個輸出聲道。
全文摘要
本發(fā)明提供一種音頻譯碼系統(tǒng)、多媒體譯碼系統(tǒng)、聲道重配方法，其中所述音頻譯碼系統(tǒng)包括接口及處理器。所述接口用以接收音頻信號。所述處理器提供一組聲道重配方程式及聲道重配系數，并依據該組聲道重配方程式及該組聲道重配系數處理該音頻信號，以將一特定數目的輸入聲道轉換成另一特定數目的輸出聲道，其中Out6及Out7表示同時降混輸出聲道，且該組聲道重配方程式包括如圖3C所示的方程式，其中，a，b，c，d，e，f，g，i，j，k，m，n，p，q，v，w，x，y，a’，b’，c’，d’，e’，f’，g’，v’，y’代表該組聲道重配系數。
文檔編號G10L19/00GK1976236SQ20061014683
公開日2007年6月6日申請日期2006年11月23日優(yōu)先權日2005年11月28日
發(fā)明者魏杏如申請人:聯(lián)發(fā)科技股份有限公司

完整全部詳細技術資料下載