專利名稱:可擴(kuò)展編碼裝置以及可擴(kuò)展編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對(duì)立體聲信號(hào)進(jìn)行編碼的可擴(kuò)展編碼裝置以及可擴(kuò)展編碼方法。
背景技術(shù):
正像通過(guò)便攜式電話進(jìn)行通話那樣,目前移動(dòng)通信系統(tǒng)中的語(yǔ)音通信以單聲道方式進(jìn)行的通信(單聲道通信)為主流。但是,今后,像第四代移動(dòng)通信系統(tǒng)那樣,隨著傳輸速率更高的比特速率高速化的實(shí)現(xiàn),因?yàn)槟軌虼_保用于傳輸多個(gè)聲道的頻寬,所以期待著在語(yǔ)音通信中推廣通過(guò)立體聲方式的通信(立體聲通信)。
比如,將音樂(lè)存儲(chǔ)于裝載了HDD(硬盤)的便攜式音頻播放器,并在該播放器安裝用于立體聲的耳塞式耳機(jī)或頭戴式耳機(jī)等來(lái)欣賞立體聲音樂(lè)的用戶越來(lái)越多,考慮這樣的現(xiàn)狀,可以預(yù)見(jiàn),今后將便攜式電話與音樂(lè)播放器結(jié)合在一起,在使用用于立體聲的耳塞式耳機(jī)或頭戴式耳機(jī)等的配件的同時(shí),進(jìn)行通過(guò)立體聲方式的語(yǔ)音通信的生活方式將廣為普及。另外,在逐漸普及起來(lái)的電視會(huì)議等的環(huán)境中,為了使富有臨場(chǎng)感的對(duì)話成為可能,預(yù)計(jì)也將要進(jìn)行立體聲通信。
另一方面,在移動(dòng)通信系統(tǒng)和有線方式的通信系統(tǒng)等中,為了減輕系統(tǒng)的負(fù)荷,一般通過(guò)事先對(duì)傳輸?shù)恼Z(yǔ)音信號(hào)進(jìn)行編碼而謀求降低傳輸信息的比特速率。因此,最近對(duì)立體聲語(yǔ)音信號(hào)進(jìn)行編碼的技術(shù)頗受矚目。比如存在使用跨聲道預(yù)測(cè)(cross-channel prediction)提高編碼預(yù)測(cè)殘差信號(hào)的編碼效率的編碼技術(shù)(參照非專利文獻(xiàn)1),所述預(yù)測(cè)殘差信號(hào)經(jīng)立體聲語(yǔ)音信號(hào)的CELP編碼的加權(quán)處理。
另外可以預(yù)計(jì),即使立體聲通信得到普及,仍然要進(jìn)行單聲道通信。這是因?yàn)閱温暤劳ㄐ爬玫捅忍厮俾?,所以可以期待降低通信成本,而且只適合單聲道通信的便攜式電話能夠縮小電路規(guī)模而價(jià)格低廉,不需要高品質(zhì)語(yǔ)音通信的用戶可能購(gòu)買只適合單聲道通信的便攜式電話。因此,在一個(gè)通信系統(tǒng)中,同時(shí)存在適合立體聲通信的移動(dòng)電話和適合單聲道通信的便攜式電話,通信系統(tǒng)需要同時(shí)適應(yīng)立體聲通信以及單聲道通信。進(jìn)一步來(lái)講,移動(dòng)通信系統(tǒng)通過(guò)無(wú)線信號(hào)進(jìn)行通信數(shù)據(jù)的交換,因此有時(shí)可能因傳播路徑環(huán)境而丟失一部分通信數(shù)據(jù)。因此,如果有一種便攜式電話具有即使一部分通信數(shù)據(jù)發(fā)生了丟失也能夠從剩余的接收數(shù)據(jù)復(fù)原原來(lái)的通信數(shù)據(jù)的功能,將非常具有使用價(jià)值。
存在由立體聲信號(hào)和單聲道信號(hào)構(gòu)成的可擴(kuò)展編碼技術(shù),其具有以下功能能夠同時(shí)適應(yīng)立體聲通信以及單聲道通信,并且即使通信數(shù)據(jù)的一部分發(fā)生了丟失,也能夠從殘余的接收數(shù)據(jù)恢復(fù)原來(lái)的通信數(shù)據(jù)。作為具有該功能的可擴(kuò)展編碼裝置的例子,比如有非專利文獻(xiàn)2所公開(kāi)的裝置。
Ramprashad,S.A.、“Stereophonic CELP coding usingcross channel prediction”、Proc.IEEE Workshop on Speech Coding、Pages136-138、(17-20 Sept.2000)[非專利文獻(xiàn)2]ISO/IEC 14496-31999(B.14 Scalable AAC with corecoder)發(fā)明內(nèi)容發(fā)明需要解決的問(wèn)題但是,在非專利文獻(xiàn)1所公開(kāi)的技術(shù)中,分別對(duì)兩個(gè)聲道的語(yǔ)音信號(hào)具有自適應(yīng)代碼本和固定代碼本等,對(duì)每個(gè)聲道產(chǎn)生不同的驅(qū)動(dòng)音源信號(hào),并生成合成信號(hào)。也就是說(shuō),對(duì)每個(gè)聲道進(jìn)行語(yǔ)音信號(hào)的CELP編碼,并將得到的每個(gè)聲道的編碼信息輸出到解碼端。因此,存在相當(dāng)于聲道數(shù)目的編碼參數(shù)被生成,編碼速率增大,同時(shí)編碼裝置的電路規(guī)模也變大的問(wèn)題。假設(shè)減少自適應(yīng)代碼本和固定代碼本等的個(gè)數(shù),則雖然編碼速率被降低、電路規(guī)模也被削減,但是會(huì)導(dǎo)致解碼信號(hào)的較大的音質(zhì)惡化。即使是非專利文獻(xiàn)2所公開(kāi)的可擴(kuò)展編碼裝置,也同樣會(huì)發(fā)生這種問(wèn)題。
因此,本發(fā)明的目的在于提供可擴(kuò)展編碼裝置以及可擴(kuò)展編碼方法,能夠防止解碼信號(hào)的音質(zhì)惡化,同時(shí)能夠削減編碼速率和削減電路規(guī)模。
解決該問(wèn)題的方案本發(fā)明的可擴(kuò)展編碼裝置采取的結(jié)構(gòu),包括單聲道信號(hào)生成單元,從第一聲道信號(hào)和第二聲道信號(hào)生成單聲道信號(hào);第一聲道加工單元,對(duì)所述第一聲道信號(hào)進(jìn)行加工而生成與所述單聲道信號(hào)相似的第一聲道加工信號(hào);第二聲道加工單元,對(duì)所述第二聲道信號(hào)進(jìn)行加工而生成與所述單聲道信號(hào)相似的第二聲道加工信號(hào);第一編碼單元,利用共用的音源,對(duì)所述單聲道信號(hào)、所述第一聲道加工信號(hào)以及所述第二聲道加工信號(hào)的全部或部分進(jìn)行編碼;以及第二編碼單元,對(duì)有關(guān)所述第一聲道加工單元和所述第二聲道加工單元的加工的信息進(jìn)行編碼。
這里,所述第一聲道信號(hào)和所述第二聲道信號(hào)是指立體聲信號(hào)的L聲道信號(hào)和R聲道信號(hào),或者是指立體聲信號(hào)的R聲道信號(hào)和L聲道信號(hào)。
發(fā)明的有益效果根據(jù)本發(fā)明,能夠防止解碼信號(hào)的音質(zhì)惡化,同時(shí)能夠削減編碼速率和削減編碼裝置的電路規(guī)模。
圖1是表示實(shí)施方式1的可擴(kuò)展編碼裝置的主要結(jié)構(gòu)的方框圖;圖2是表示在不同位置獲取的來(lái)自同一發(fā)生源的聲音的信號(hào)的波形譜的一例的圖;圖3是表示實(shí)施方式1的可擴(kuò)展編碼裝置的更為詳細(xì)的結(jié)構(gòu)的方框圖;圖4是表示實(shí)施方式1的單聲道信號(hào)生成單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖5是表示實(shí)施方式1的空間信息處理單元內(nèi)部的主要結(jié)構(gòu)的方框圖;圖6是表示實(shí)施方式1的失真最小化單元內(nèi)部的主要結(jié)構(gòu)的方框圖;圖7是表示實(shí)施方式1的音源信號(hào)生成單元內(nèi)部的主要結(jié)構(gòu)的方框圖;圖8是用于說(shuō)明實(shí)施方式1的可擴(kuò)展編碼處理的步驟的流程圖;圖9是表示實(shí)施方式2的可擴(kuò)展編碼裝置的詳細(xì)結(jié)構(gòu)的方框圖;圖10是表示實(shí)施方式2的空間信息賦予單元內(nèi)部的主要結(jié)構(gòu)的方框圖;圖11是表示實(shí)施方式2的失真最小化單元內(nèi)部的主要結(jié)構(gòu)的方框圖;以及圖12是用于說(shuō)明實(shí)施方式2的可擴(kuò)展編碼處理的步驟的流程圖。
具體實(shí)施例方式
以下,參照附圖詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式。另外,這里以對(duì)由L聲道和R聲道的兩個(gè)聲道構(gòu)成的立體聲信號(hào)進(jìn)行編碼的情形為例來(lái)說(shuō)明。
(實(shí)施方式1)圖1是表示本發(fā)明實(shí)施方式1的可擴(kuò)展編碼裝置的主要結(jié)構(gòu)的方框圖。本實(shí)施方式的可擴(kuò)展編碼裝置為在第一層(基本層)進(jìn)行單聲道信號(hào)的編碼;在第二層(擴(kuò)展層)進(jìn)行L聲道信號(hào)和R聲道信號(hào)的編碼;并將由各層得到的編碼參數(shù)傳輸?shù)浇獯a端的可擴(kuò)展編碼裝置。
本實(shí)施方式的可擴(kuò)展編碼裝置包括單聲道信號(hào)生成單元101、單聲道信號(hào)合成單元102、失真最小化單元103、音源信號(hào)生成單元104、L聲道信號(hào)加工單元105-1、L聲道加工信號(hào)合成單元106-1、R聲道信號(hào)加工單元105-2以及R聲道加工信號(hào)合成單元106-2。另外,單聲道信號(hào)生成單元101和單聲道信號(hào)合成單元102被分類為上述的第一層;L聲道信號(hào)加工單元105-1、L聲道加工信號(hào)合成單元106-1、R聲道信號(hào)加工單元105-2以及R聲道加工信號(hào)合成單元106-2被分類為上述的第二層。另外,失真最小化單元103和音源信號(hào)生成單元104為第一層和第二層所共用的結(jié)構(gòu)。
上述的可擴(kuò)展編碼裝置的操作的概況如下。
因?yàn)檩斎胄盘?hào)為L(zhǎng)聲道信號(hào)L1和R聲道信號(hào)R1構(gòu)成的立體聲信號(hào),所以上述的可擴(kuò)展編碼裝置在第一層中,從這些L聲道信號(hào)L1和R聲道信號(hào)R1生成單聲道信號(hào)M1,并對(duì)該單聲道信號(hào)M1進(jìn)行規(guī)定的編碼。
另一方面,在第二層中,上述可擴(kuò)展編碼裝置對(duì)L聲道信號(hào)L1進(jìn)行后述的加工處理,生成與單聲道信號(hào)相似的L聲道加工信號(hào)L2,并對(duì)該L聲道加工信號(hào)L2進(jìn)行規(guī)定的編碼。同樣地,上述可擴(kuò)展編碼裝置在第二層,對(duì)R聲道信號(hào)R1進(jìn)行后述的加工處理,生成與單聲道信號(hào)相似的R聲道加工信號(hào)R2,并對(duì)該R聲道加工信號(hào)R2進(jìn)行規(guī)定的編碼。
這里,上述規(guī)定的編碼是指,對(duì)單聲道信號(hào)、L聲道加工信號(hào)以及R聲道加工信號(hào)進(jìn)行共同的編碼,得到對(duì)這三個(gè)信號(hào)共有的單一的編碼參數(shù)(在單一的音源通過(guò)多個(gè)編碼參數(shù)表現(xiàn)的情況下,為一組的編碼參數(shù)),以謀求降低編碼速率的編碼處理。比如,在生成與輸入信號(hào)近似的音源信號(hào),并通過(guò)求取指定該音源信號(hào)的信息來(lái)進(jìn)行編碼的編碼方法中,將單一的(或者一組)的音源信號(hào)分配給上述的三個(gè)信號(hào)(單聲道信號(hào)、L聲道加工信號(hào)以及R聲道加工信號(hào)),由此進(jìn)行編碼。這是因?yàn)長(zhǎng)聲道信號(hào)和R聲道信號(hào)都為與單聲道信號(hào)相似的信號(hào),所以能夠通過(guò)共同的編碼處理來(lái)對(duì)三個(gè)信號(hào)進(jìn)行編碼。另外,在該結(jié)構(gòu)中,輸入立體聲信號(hào)既可以是語(yǔ)音信號(hào),也可以是音頻信號(hào)。
具體而言,本實(shí)施方式的可擴(kuò)展編碼裝置,生成單聲道信號(hào)M1、L聲道加工信號(hào)L2以及R聲道加工信號(hào)R2的各自的合成信號(hào)(M2、L3以及R3),并通過(guò)與原來(lái)的信號(hào)進(jìn)行比較而求三個(gè)合成信號(hào)的編碼失真。然后,搜索使求出的三個(gè)編碼失真之和最小的音源信號(hào),并將指定該音源信號(hào)的信息作為編碼參數(shù)I1傳輸?shù)浇獯a端,由此謀求降低編碼速率。
另外,雖然這里沒(méi)有圖示,但是在解碼端,為了進(jìn)行L聲道信號(hào)以及R聲道信號(hào)的解碼,需要有關(guān)對(duì)L聲道信號(hào)進(jìn)行的加工處理以及對(duì)R聲道信號(hào)進(jìn)行的加工處理的信息,所以本實(shí)施方式的可擴(kuò)展編碼裝置還對(duì)有關(guān)這些加工處理的信息另行編碼,并傳輸?shù)浇獯a端。
接下來(lái),說(shuō)明上述的對(duì)L聲道信號(hào)或者R聲道信號(hào)進(jìn)行的加工處理。
一般而言,即使是來(lái)自同一發(fā)生源的語(yǔ)音信號(hào)或者音頻信號(hào),根據(jù)麥克風(fēng)的設(shè)置位置,也就是根據(jù)對(duì)該立體聲信號(hào)進(jìn)行拾音(收聽(tīng))的位置,信號(hào)波形也呈現(xiàn)不同的特性。作為一個(gè)簡(jiǎn)單的例子,與來(lái)自發(fā)生源的距離對(duì)應(yīng),立體聲信號(hào)的能量發(fā)生衰減,并且到達(dá)時(shí)間發(fā)生延遲,根據(jù)拾音位置呈現(xiàn)不同的波形譜。這樣,立體聲信號(hào)受到根據(jù)如拾音環(huán)境的空間因素的較大的影響。
圖2是表示在兩個(gè)不同位置對(duì)來(lái)自同一發(fā)生源的聲音進(jìn)行拾音而得到的信號(hào)(第一信號(hào)W1和第二信號(hào)W2)的波形譜的一例的圖。
如該圖所示,可以看出第一信號(hào)和第二信號(hào)分別呈現(xiàn)不同的特性。該呈現(xiàn)不同特性的現(xiàn)象能夠理解為在原來(lái)的信號(hào)的波形上,被加上因拾音位置而異的新的空間特性后,通過(guò)麥克風(fēng)等的拾音設(shè)備,信號(hào)被獲取的結(jié)果。該特性在本說(shuō)明書(shū)中稱為空間信息(Spatial Information)。該空間信息為對(duì)立體聲信號(hào)在聽(tīng)覺(jué)上提供延伸感(broad-sounding)的信息。另外,因?yàn)榈谝恍盘?hào)和第二信號(hào)為在來(lái)自同一發(fā)生源的信號(hào)加上了空間信息的信號(hào),所以具有如下所示的性質(zhì)。比如,在圖2的例子中,當(dāng)將第一信號(hào)W1延遲時(shí)間Δt則成為信號(hào)W1’。接下來(lái),將信號(hào)W1’的振幅按照一定的比例減小而使振幅差ΔA消失,因?yàn)樾盘?hào)W1’為來(lái)自同一發(fā)生源的信號(hào),所以在理想的情況下能夠期待與第二信號(hào)W2相匹配。也就是說(shuō),第一信號(hào)和第二信號(hào)的特性上的不同(波形上的差異),能夠通過(guò)對(duì)包含在語(yǔ)音信號(hào)或者音頻信號(hào)中的空間信息進(jìn)行修改的處理而大致去除,其結(jié)果,能夠使兩者的立體聲信號(hào)的波形相似。另外,在后面進(jìn)一步詳細(xì)敘述有關(guān)空間信息。
因此,本實(shí)施方式通過(guò)對(duì)L聲道信號(hào)L1和R聲道信號(hào)R1予以修改各個(gè)空間信息的加工處理,生成與單聲道信號(hào)M1相似的L聲道加工信號(hào)L2和R聲道加工信號(hào)R2。由此,能夠共有用于編碼處理的音源,或者作為編碼參數(shù)即使不對(duì)三個(gè)信號(hào)生成各自的編碼參數(shù),也能夠通過(guò)生成單一的(或者一組)編碼參數(shù)而得到精度高的編碼信息。
接下來(lái),關(guān)于上述可擴(kuò)展編碼裝置的動(dòng)作,對(duì)每個(gè)功能塊(block)進(jìn)行說(shuō)明。
單聲道信號(hào)生成單元101從輸入的L聲道信號(hào)L1和R聲道信號(hào)R1,生成具有兩種信號(hào)的中間性質(zhì)的單聲道信號(hào)M1,并將其輸出到單聲道信號(hào)合成單元102。
單聲道信號(hào)合成單元102利用單聲道信號(hào)M1和通過(guò)音源信號(hào)生成單元104生成的音源信號(hào)S1,生成單聲道信號(hào)的合成信號(hào)M2。
L聲道信號(hào)加工單元105-1獲取作為L(zhǎng)聲道信號(hào)L1和單聲道信號(hào)M1之間的差的信息的L聲道空間信息,并利用其對(duì)L聲道信號(hào)L1進(jìn)行上述的加工處理,生成與單聲道信號(hào)M1相似的L聲道加工信號(hào)L2。另外,在后面詳細(xì)敘述有關(guān)空間信息。
L聲道加工信號(hào)合成單元106-1利用L聲道加工信號(hào)L2和通過(guò)音源信號(hào)生成單元104生成的音源信號(hào)S1,生成L聲道加工信號(hào)L2的合成信號(hào)L3。
關(guān)于R聲道信號(hào)加工單元105-2和R聲道加工信號(hào)合成單元106-2的動(dòng)作,因?yàn)榕cL聲道信號(hào)加工單元105-1和L聲道加工信號(hào)合成單元106-1的操作基本上相同,所以省略其說(shuō)明。其中,L聲道信號(hào)加工單元105-1和L聲道加工信號(hào)合成單元106-1的處理對(duì)象為L(zhǎng)聲道,而R聲道信號(hào)加工單元105-2和R聲道加工信號(hào)合成單元106-2的處理對(duì)象為R聲道。
失真最小化單元103對(duì)音源信號(hào)生成單元104進(jìn)行控制,使其生成音源信號(hào)S1,所述音源信號(hào)S1為使各個(gè)合成信號(hào)(M2、L3以及R3)的編碼失真之和最小的音源信號(hào)。另外,該音源信號(hào)S1對(duì)單聲道信號(hào)、L聲道信號(hào)以及R聲道信號(hào)是共用的。另外,在求各個(gè)合成信號(hào)的編碼失真時(shí),雖然作為輸入還需要作為原來(lái)的信號(hào)的M1、L2以及R2,但是在本附圖中為了簡(jiǎn)化說(shuō)明而省略了它們。
音源信號(hào)生成單元104在失真最小化單元103的控制下,生成對(duì)單聲道信號(hào)、L聲道信號(hào)以及R聲道信號(hào)共用的音源信號(hào)S1。
接下來(lái),對(duì)上述可擴(kuò)展編碼裝置的更為詳細(xì)的結(jié)構(gòu)如下進(jìn)行說(shuō)明。圖3是表示圖1所示的本實(shí)施方式的可擴(kuò)展編碼裝置的更為詳細(xì)的結(jié)構(gòu)的方框圖。另外,這里以輸入信號(hào)為語(yǔ)音信號(hào),并利用CELP編碼作為編碼方法的可擴(kuò)展編碼裝置為例進(jìn)行說(shuō)明。并且,對(duì)于與圖1所示的相同的構(gòu)成要素和信號(hào)賦予相同的標(biāo)號(hào),并且基本上省略其說(shuō)明。
該可擴(kuò)展編碼裝置將語(yǔ)音信號(hào)分為聲道信息和音源信息,其中,對(duì)于聲道信息,在LPC分析/量化單元(111、114-1以及114-2)通過(guò)求LPC參數(shù)(線性預(yù)測(cè)系數(shù))進(jìn)行編碼;對(duì)于音源信息,通過(guò)求索引I1進(jìn)行編碼,所述索引I1為指定使用預(yù)先存儲(chǔ)著的語(yǔ)音模式中的哪一個(gè)的索引,也就是指定通過(guò)音源信號(hào)生成單元104內(nèi)的自適應(yīng)代碼本和固定代碼本生成什么樣的語(yǔ)音矢量的索引。
另外,在圖3中,LPC分析/量化單元111和LPC合成濾波器112對(duì)應(yīng)圖1所示的單聲道信號(hào)合成單元102;LPC分析/量化單元114-1和LPC合成濾波器115-1對(duì)應(yīng)圖1所示的L聲道加工信號(hào)合成單元106-1;LPC分析/量化單元114-2和LPC合成濾波器115-2對(duì)應(yīng)圖1所示的R聲道加工信號(hào)合成單元106-2;空間信息處理單元113-1對(duì)應(yīng)圖1所示的L聲道信號(hào)加工單元105-1;空間信息處理單元113-2對(duì)應(yīng)圖1所示的R聲道信號(hào)加工單元105-2。另外,空間信息處理單元113-1和113-2各自在其內(nèi)部生成L聲道空間信息和R聲道空間信息。
具體而言,該圖所示的可擴(kuò)展編碼裝置的各個(gè)部分進(jìn)行以下的動(dòng)作。另外,酌情參照附圖進(jìn)行說(shuō)明。
單聲道信號(hào)生成單元101求取輸入的L聲道信號(hào)L1和R聲道信號(hào)R1的平均,并將其作為單聲道信號(hào)M1輸出到單聲道信號(hào)合成單元102。圖4是表示單聲道信號(hào)生成單元101內(nèi)部的主要結(jié)構(gòu)的方框圖。加法器121求L聲道信號(hào)L1和R聲道信號(hào)R1之和,乘法器122將該和信號(hào)的標(biāo)量(scale)減半并輸出。
LPC分析/量化單元111對(duì)單聲道信號(hào)M1進(jìn)行線性預(yù)測(cè)分析,求作為頻譜包絡(luò)信息的LPC參數(shù),將其輸出到失真最小化單元103,進(jìn)一步對(duì)該LPC參數(shù)進(jìn)行量化,并將得到的量化LPC參數(shù)(用于單聲道信號(hào)的LPC量化索引)I11輸出到LPC合成濾波器112和本實(shí)施方式的可擴(kuò)展編碼裝置的外部。
LPC合成濾波器112利用從LPC分析/量化單元111輸出的量化LPC參數(shù)作為濾波器系數(shù),并利用將通過(guò)音源信號(hào)生成單元104內(nèi)的自適應(yīng)代碼本和固定代碼本生成的音源矢量作為驅(qū)動(dòng)音源的濾波函數(shù),也就是利用LPC合成濾波器來(lái)生成合成信號(hào)。該單聲道信號(hào)的合成信號(hào)M2輸出到失真最小化單元103。
空間信息處理單元113-1從L聲道信號(hào)L1和單聲道信號(hào)M1生成用于表示L聲道信號(hào)L1和單聲道信號(hào)M1之間的特性的差的L聲道空間信息。另外,空間信息處理單元113-1利用該L聲道空間信息,對(duì)L聲道信號(hào)L1進(jìn)行上述加工處理,從而生成與單聲道信號(hào)M1相似的L聲道加工信號(hào)L2。
圖5是表示空間信息處理單元113-1內(nèi)部的主要結(jié)構(gòu)的方框圖。
空間信息分析單元131通過(guò)對(duì)L聲道信號(hào)L1和單聲道信號(hào)M1進(jìn)行比較分析,求兩種聲道信號(hào)的空間信息的差,并將得到的分析結(jié)果輸出到空間信息量化單元132。空間信息量化單元132對(duì)通過(guò)空間信息分析單元131得到的兩個(gè)聲道的空間信息的差進(jìn)行量化,并將得到的編碼參數(shù)(用于L聲道信號(hào)的空間信息量化索引)I12輸出到本實(shí)施方式的可擴(kuò)展編碼裝置的外部。而且,空間信息量化單元132對(duì)通過(guò)空間信息分析單元131得到的用于L聲道信號(hào)的空間信息量化索引進(jìn)行逆量化,并將結(jié)果輸出到空間信息去除單元133。空間信息去除單元133從L聲道信號(hào)L1減去從空間信息量化單元132輸出的、經(jīng)逆量化的空間信息量化索引,也就是對(duì)通過(guò)空間信息分析單元131得到的兩個(gè)聲道的空間信息的差進(jìn)行量化并進(jìn)行逆量化的信號(hào),由此將L聲道信號(hào)L1變換為與單聲道信號(hào)M1相似的信號(hào)。去除了這種空間信息的L聲道信號(hào)(L聲道加工信號(hào))L2輸出到LPC分析/量化單元114-1。
LPC分析/量化單元114-1的動(dòng)作除了將L信道加工信號(hào)L2作為輸入之外,與LPC分析/量化單元111相同,還將得到的LPC參數(shù)輸出到失真最小化單元103,并將用于L聲道信號(hào)的LPC量化索引I13輸出到LPC合成濾波器115-1和本實(shí)施方式的可擴(kuò)展編碼裝置的外部。
LPC合成濾波器115-1的動(dòng)作也和LPC合成濾波器112相同,將得到的合成信號(hào)L3輸出到失真最小化單元103。
另外,空間信息處理單元113-2、LPC分析/量化單元114-2以及LPC合成濾波器115-2的動(dòng)作,除了將R信道作為處理對(duì)象之外,與空間信息處理單元113-1、LPC分析/量化單元114-1以及LPC合成濾波器115-1相同,因此省略其說(shuō)明。
圖6是表示失真最小化單元103內(nèi)部的主要結(jié)構(gòu)的方框圖。
加法器141-1從單聲道信號(hào)M1減去該單聲道信號(hào)的合成信號(hào)M2,由此計(jì)算誤差信號(hào)E1,并將該誤差信號(hào)E1輸出到聽(tīng)覺(jué)加權(quán)單元142-1。
聽(tīng)覺(jué)加權(quán)單元142-1使用聽(tīng)覺(jué)加權(quán)濾波器,對(duì)從加法器141-1輸出的編碼失真E1進(jìn)行聽(tīng)覺(jué)加權(quán)處理,并將結(jié)果輸出到加法器143,所述聽(tīng)覺(jué)加權(quán)濾波器將從LPC分析/量化單元111輸出的LPC參數(shù)作為濾波器系數(shù)。
加法器141-2從去除了空間信息的L聲道信號(hào)(L聲道加工信號(hào))L2減去該信號(hào)的合成信號(hào)L3,從而計(jì)算誤差信號(hào)E2,并將其輸出到聽(tīng)覺(jué)加權(quán)單元142-2。
聽(tīng)覺(jué)加權(quán)單元142-2的動(dòng)作與聽(tīng)覺(jué)加權(quán)單元142-1相同。
加法器141-3也與加法器141-2相同地,從去除了空間信息的R聲道信號(hào)(R聲道加工信號(hào))R2減去該信號(hào)的合成信號(hào)R3,從而計(jì)算誤差信號(hào)E3,并將其輸出到聽(tīng)覺(jué)加權(quán)單元142-3。
聽(tīng)覺(jué)加權(quán)單元142-3的動(dòng)作也與聽(tīng)覺(jué)加權(quán)單元142-1相同。
加法器143將從聽(tīng)覺(jué)加權(quán)單元142-1~142-3輸出的、經(jīng)聽(tīng)覺(jué)加權(quán)處理后的誤差信號(hào)E1~E3相加,并將結(jié)果輸出到失真最小值判斷單元144。
失真最小值判斷單元144對(duì)從聽(tīng)覺(jué)加權(quán)單元142-1~142-3輸出的、經(jīng)聽(tīng)覺(jué)加權(quán)處理后的誤差信號(hào)E1~E3的全部加以考慮,對(duì)每個(gè)副幀求取音源信號(hào)生成單元104內(nèi)部的各個(gè)代碼本(自適應(yīng)代碼本、固定代碼本以及增益代碼本)的各個(gè)索引,所述各個(gè)索引使從這3個(gè)誤差信號(hào)求出的編碼失真一并變小。這些代碼本索引I1作為編碼參數(shù)輸出到本實(shí)施方式的可擴(kuò)展編碼裝置的外部。
具體而言,失真最小值判斷單元144將編碼失真通過(guò)誤差信號(hào)的二次方來(lái)表示,求取音源信號(hào)生成單元104內(nèi)部的各個(gè)代碼本的索引,這些索引使通過(guò)從聽(tīng)覺(jué)加權(quán)單元142-1~142-3輸出的誤差信號(hào)求出的編碼失真的總和E12+E22+E32最小。求這些索引的一系列的處理構(gòu)成閉環(huán)(反饋環(huán)),失真最小值判斷單元144利用反饋信號(hào)F1對(duì)音源信號(hào)生成單元104進(jìn)行各個(gè)代碼本的索引的指示,通過(guò)在一個(gè)副幀內(nèi)進(jìn)行各種各樣的變化來(lái)搜索各個(gè)代碼本,并將最后得到的各個(gè)代碼本的索引I1輸出到本實(shí)施方式的可擴(kuò)展編碼裝置的外部。
圖7是表示音源信號(hào)生成單元104內(nèi)部的主要結(jié)構(gòu)的方框圖。
自適應(yīng)代碼本151根據(jù)與從失真最小化單元103指示的索引對(duì)應(yīng)的自適應(yīng)代碼本延遲(lag),生成相當(dāng)于一個(gè)副幀的音源矢量。該音源矢量作為自適應(yīng)代碼本輸出到乘法器152。固定代碼本153預(yù)先存儲(chǔ)著多個(gè)預(yù)定形狀的音源矢量,并將與從失真最小化單元103指示的索引對(duì)應(yīng)的音源矢量作為固定代碼本矢量輸出到乘法器154。增益代碼本155根據(jù)來(lái)自失真最小化單元103的指示,生成用于從自適應(yīng)代碼本151輸出的自適應(yīng)代碼本矢量的增益(自適應(yīng)增益)和用于從固定代碼本153輸出的固定代碼本矢量的增益(固定代碼本增益),并將其分別輸出到乘法器152和154。
乘法器152將從增益代碼本155輸出的自適應(yīng)代碼本增益,乘以從自適應(yīng)代碼本151輸出的自適應(yīng)代碼本矢量,并將該結(jié)果輸出到加法器156。乘法器154將從增益代碼本155輸出的固定代碼本增益,乘以從固定代碼本153輸出的固定代碼本矢量,并將結(jié)果輸出到加法器156。加法器156將從乘法器152輸出的自適應(yīng)代碼本矢量和從乘法器154輸出的固定代碼本矢量相加,并將相加后的音源矢量作為驅(qū)動(dòng)音源信號(hào)S1輸出。
圖8是用于說(shuō)明上述的可擴(kuò)展編碼處理的步驟的流程圖。
單聲道信號(hào)生成單元101將L聲道信號(hào)和R聲道信號(hào)作為輸入信號(hào),利用這些信號(hào)生成單聲道信號(hào)(ST1010)。LPC分析/量化單元111進(jìn)行單聲道信號(hào)的LPC分析和量化(ST1020)??臻g信息處理單元113-1和113-2分別對(duì)L聲道信號(hào)和R聲道信號(hào)進(jìn)行上述的空間信息處理,也就是進(jìn)行空間信息的提取和空間信息的去除處理(ST1030)。LPC分析/量化單元114-1和114-2對(duì)去除了空間信息的L聲道信號(hào)和R聲道信號(hào),與對(duì)單聲道信號(hào)相同地進(jìn)行LPC分析和量化(ST1040)。另外,將從ST1010的單聲道信號(hào)的生成到ST1040的LPC分析/量化為止的處理統(tǒng)稱為處理P1。
失真最小化單元103確定使上述3個(gè)信號(hào)的編碼失真成為最小的各個(gè)代碼本的索引(處理P2)。也就是說(shuō),生成音源信號(hào)(ST1110)、進(jìn)行單聲道信號(hào)的合成/編碼失真的計(jì)算(ST1120)、L聲道信號(hào)和R聲道信號(hào)的合成/編碼失真的計(jì)算(ST1130)、以及進(jìn)行編碼失真的最小值的判斷(ST1140)。該ST1110~ST1140的搜索代碼本索引的處理構(gòu)成閉環(huán),對(duì)所有的索引進(jìn)行搜索,當(dāng)所有的搜索結(jié)束時(shí)該循環(huán)結(jié)束(ST1150)。然后,失真最小化單元103將求出的代碼本索引輸出(ST1160)。
另外,在上述的處理步驟中,處理P1以幀為單位進(jìn)行,處理P2以將幀進(jìn)一步分割的副幀為單元進(jìn)行。
另外,在上述的處理步驟中,雖然以ST1020和ST1030~ST1040通過(guò)該順序進(jìn)行的情況為例進(jìn)行了說(shuō)明,但是也可以使ST1020和ST1030~ST1040同時(shí)進(jìn)行處理(即并行處理)。另外,對(duì)于ST1120和ST1130也是一樣,這些步驟也可以為并行處理。
接下來(lái),利用算式來(lái)詳細(xì)說(shuō)明空間信息處理單元113-1的各個(gè)部分的處理。因?yàn)榭臻g信息處理單元113-2的說(shuō)明與空間信息處理單元113-1相同,所以將它省略。
首先,以作為空間信息使用的兩個(gè)聲道之間的能量比和延遲時(shí)間差的情形為例進(jìn)行說(shuō)明。
空間信息分析單元131計(jì)算兩個(gè)聲道之間的幀單位的能量比。首先,根據(jù)下式(1)和下式(2)而求L聲道信號(hào)和單聲道信號(hào)的一個(gè)幀內(nèi)的能量ELCH和EM。
ELch=Σn=0FL-1xLch(n)2···(1)]]>EM=Σn=0FL-1xM(n)2···(2)]]>其中,n為樣本號(hào)碼,F(xiàn)L為一個(gè)幀的樣本數(shù)(幀長(zhǎng)度)。另外,XLCH(n)和XM(n)分別表示L聲道信號(hào)和單聲道信號(hào)的各自的第n個(gè)樣本的振幅。
繼而,空間信息分析單元131根據(jù)下式(3)求取L聲道信號(hào)和單聲道信號(hào)的能量比的平方根C。
C=ELchEM···(3)]]>另外,空間信息分析單元131如以下這樣,將延遲時(shí)間差作為在兩種聲道信號(hào)之間的互相關(guān)成為最大的值來(lái)求取,所述延遲時(shí)間差為L(zhǎng)聲道信號(hào)相對(duì)于單聲道信號(hào)的、兩種聲道信號(hào)之間的信號(hào)的時(shí)間上的偏差量。具體而言,根據(jù)下式(4)而求單聲道信號(hào)以及L聲道信號(hào)的互相關(guān)函數(shù)Φ。
φ(m)=Σn=0FL-1xLch(n)·xM(n-m)···(4)]]>其中,設(shè)m為取預(yù)先確定的從min_m到max_m的范圍的值,將Φ(m)成為最大時(shí)的m=M作為L(zhǎng)聲道信號(hào)相對(duì)于單聲道信號(hào)的延遲時(shí)間差。
另外,上述的能量比以及延遲時(shí)間差也可以根據(jù)下式(5)而求。在算式(5)中,求使誤差D最小的能量比的平方根C和延遲時(shí)間m,所述誤差D為單聲道信號(hào)和對(duì)該單聲道信號(hào)去除了空間信息的L聲道信號(hào)之間的誤差。
D=Σn=0FL-1{xLch(n)-C·xM(n-m)}2···(5)]]>空間信息量化單元132將上述C和M通過(guò)預(yù)先規(guī)定的比特?cái)?shù)進(jìn)行量化,并將經(jīng)量化的C和M分別設(shè)為CQ和MQ。
空間信息去除單元133從L聲道信號(hào)中根據(jù)下式(6)的變換式而去除空間信息。
xLch′(n)=CQ·xLch(n-MQ)…(6)(其中,n=0,…,F(xiàn)L-1)另外,作為上述的空間信息的具體例有以下的例子。
比如,能夠?qū)蓚€(gè)聲道之間的能量比和延遲時(shí)間差的兩個(gè)參數(shù)作為空間信息來(lái)使用。這些都是易于定量化的參數(shù)。另外,作為變化例還可以使用每個(gè)頻帶的傳播特性,比如相位差和振幅比等。
如上所述,根據(jù)本實(shí)施方式,因?yàn)槭咕幋a對(duì)象的信號(hào)互相相似并使用共有的音源進(jìn)行編碼,所以能夠防止解碼信號(hào)的音質(zhì)惡化,同時(shí)能夠削減編碼速率和削減電路規(guī)模。
另外,因?yàn)樵诟鲗邮褂霉灿械囊粼磥?lái)進(jìn)行編碼,所以無(wú)需在各層設(shè)置自適應(yīng)代碼本、固定代碼本以及增益代碼本的組,并能夠通過(guò)一組的各個(gè)代碼本來(lái)生成音源。也就是說(shuō),能夠削減電路規(guī)模。
另外,在以上的結(jié)構(gòu)中,失真最小化單元103對(duì)單聲道信號(hào)、L聲道信號(hào)以及R聲道信號(hào)的所有的編碼失真進(jìn)行考慮,并進(jìn)行控制以使這些編碼失真的總和成為最小。因此,能夠提高編碼性能,提高解碼信號(hào)的音質(zhì)。
另外,在本實(shí)施方式的圖3之后,雖然作為編碼方式以使用CELP編碼的情況為例進(jìn)行了說(shuō)明,但是不一定使用如CELP編碼那樣利用語(yǔ)音模式的編碼,即使不是利用在代碼本預(yù)先注冊(cè)音源的編碼方法也可以。
另外,本實(shí)施方式中,雖然對(duì)單聲道信號(hào)、L聲道加工信號(hào)以及R聲道加工信號(hào)的3個(gè)信號(hào)的編碼失真的全部加以考慮,說(shuō)明了以其為例的情況,但是因?yàn)閱温暤佬盘?hào)、L聲道加工信號(hào)以及R聲道加工信號(hào)相互相似,所以也可以只對(duì)1個(gè)聲道,比如只對(duì)單聲道信號(hào)求取使其編碼失真最小的編碼參數(shù),并將該編碼參數(shù)傳輸?shù)浇獯a端。即使在該情況下,在解碼端,不僅能夠?qū)温暤佬盘?hào)的編碼參數(shù)進(jìn)行解碼而重現(xiàn)該單聲道信號(hào),而且對(duì)于L聲道和R聲道,也能夠?qū)谋緦?shí)施方式的可擴(kuò)展編碼裝置輸出的L聲道空間信息或者R聲道空間信息的編碼參數(shù)進(jìn)行解碼,并對(duì)解碼單聲道信號(hào)進(jìn)行與上述的加工處理相反的處理,由此能夠在不使品質(zhì)大幅度降低的情況下重現(xiàn)該兩個(gè)聲道的信號(hào)。
進(jìn)一步來(lái)講,在本實(shí)施方式中,雖然以將兩個(gè)聲道之間(比如L聲道信號(hào)和單聲道信號(hào))的能量比以及延遲時(shí)間差的兩個(gè)參數(shù)的兩者作為空間信息的情形為例進(jìn)行了說(shuō)明,但是作為空間信息也可以只使用其中任意一者的參數(shù)。在只使用一個(gè)參數(shù)的情形下,與使用兩個(gè)參數(shù)的情形相比,雖然提高兩個(gè)聲道的相似度的效果有所減少,但是反而具有進(jìn)一步削減編碼比特?cái)?shù)的效果。
比如,作為空間信息只使用兩個(gè)聲道之間的能量比的情況下,L聲道信號(hào)的變換利用CQ,根據(jù)下式(7)來(lái)進(jìn)行,所述CQ為對(duì)通過(guò)上式(3)求出的能量比的平方根C進(jìn)行量化所得到的值。
xLch′(n)=CQ·xLch(n)......(7)(其中,n=0,…,F(xiàn)L-1)因?yàn)槭?7)的能量比的平方根CQ也可稱為振幅比(其中,只限于符號(hào)為正的),所以通過(guò)對(duì)xLCH(n)乘以CQ來(lái)變換xLCH(n)的振幅,也就是說(shuō),因?yàn)槟軌蛐U捎谂c音源之間的距離而造成衰減的振幅,所以相當(dāng)于去除了空間信息中的源于距離的影響。
比如,作為空間信息只使用兩個(gè)聲道之間的延遲時(shí)間差時(shí),副聲道信號(hào)的變換利用MQ,根據(jù)下式(8)來(lái)進(jìn)行,所述MQ為對(duì)使通過(guò)上式(4)求出的Φ(m)為最大的m=M進(jìn)行量化而得到的值。
xLch′(n)=xLch(n-MQ)...(8)(其中,n=0,…,F(xiàn)L-1)因?yàn)槭?8)中的使Φ為最大的MQ為離散地表示時(shí)間的值,所以通過(guò)將xLCH(n)的n置換成n-MQ,相當(dāng)于變換成追溯了時(shí)間M的(時(shí)間M之前的)波形xLCH(n)。也就是說(shuō),因?yàn)槭共ㄐ窝舆t了時(shí)間M,所以相當(dāng)于去除了空間信息中的源于距離的影響。另外,因?yàn)橐粼吹姆较虿煌馕吨嚯x也不同,所以相當(dāng)于對(duì)源于方向的影響加以了考慮。
另外,通過(guò)LPC量化單元,對(duì)去除了空間信息的L聲道信號(hào)和R聲道信號(hào)進(jìn)行量化時(shí),還可以利用對(duì)單聲道信號(hào)量化的量化LPC參數(shù),來(lái)進(jìn)行差分量化和預(yù)測(cè)量化等。因?yàn)槿コ丝臻g信息的L聲道信號(hào)和R聲道信號(hào)被變換成與單聲道信號(hào)相近的信號(hào),所以對(duì)于這些信號(hào)的LPC參數(shù)與單聲道信號(hào)的LPC參數(shù)的相關(guān)較高,因此能夠以更低的比特速率進(jìn)行高效率的量化。
另外,在失真最小化單元103,當(dāng)計(jì)算編碼誤差時(shí),為了減少單聲道信號(hào)或者立體聲信號(hào)的其中一方對(duì)編碼失真所造成的影響,還可以如下式(9)那樣,預(yù)先設(shè)定加權(quán)系數(shù)α、β以及γ。
編碼失真=α×單聲道信號(hào)的編碼失真+β×L聲道信號(hào)的編碼失真+γ×R聲道信號(hào)的編碼失真...(9)這樣,能夠通過(guò)將對(duì)于希望減少編碼失真的影響的信號(hào)(高音質(zhì)并且希望編碼的信號(hào))的加權(quán)系數(shù)設(shè)定得比其他的信號(hào)的加權(quán)系數(shù)大,從而實(shí)現(xiàn)與使用環(huán)境對(duì)應(yīng)的編碼。比如,在進(jìn)行解碼時(shí),當(dāng)對(duì)預(yù)先設(shè)想比單聲道信號(hào)利用立體聲信號(hào)進(jìn)行解碼的情況多的信號(hào)進(jìn)行編碼時(shí),作為加權(quán)系數(shù),對(duì)β和γ設(shè)定比α大的值,此時(shí)對(duì)β和γ使用相同的值。
另外,作為上述的加權(quán)系數(shù)的設(shè)定方法的變化例,還可以只考慮立體聲信號(hào)的編碼失真,而不考慮單聲道信號(hào)的編碼失真。在該情況下,將α設(shè)定成0。將β和γ設(shè)定成相同的值(比如1)。
另外,立體聲信號(hào)中,當(dāng)一方的聲道的信號(hào)(比如L聲道信號(hào))包含有重要的信息的情況下(比如,L聲道信號(hào)為語(yǔ)音,R聲道信號(hào)為背景音樂(lè)),作為加權(quán)系數(shù),將β設(shè)定成比γ大的值。
另外,還可以搜索音源信號(hào)的參數(shù)且LPC參數(shù)也只對(duì)兩種信號(hào)進(jìn)行量化,以只使單聲道信號(hào)和去除了空間信息的L聲道信號(hào)的兩種信號(hào)的編碼失真最小。在該情況下,R聲道信號(hào)能夠根據(jù)下式(10)而求。進(jìn)一步還可以將L聲道信號(hào)和R聲道信號(hào)相反地處理。
R(i)=2×M(i)-L(i)...(10)其中,R(i)為R聲道信號(hào),M(i)為單聲道信號(hào)、L(i)為L(zhǎng)聲道信號(hào)的第i個(gè)樣本的振幅值。
另外,如果單聲道信號(hào)、L聲道加工信號(hào)以及R聲道加工信號(hào)相互相似,則可以共用音源。由此,在本實(shí)施方式,不只是進(jìn)行去除空間信息等的加工處理,利用其它的加工處理能夠得到與上述相同的作用/效果。
(實(shí)施方式2)
實(shí)施方式1中,失真最小化單元103對(duì)單聲道信號(hào)、L聲道信號(hào)以及R聲道信號(hào)的所有的編碼失真加以考慮,進(jìn)行編碼循環(huán)(loop)的控制以使這些編碼失真的總和成為最小。但是,嚴(yán)格來(lái)講,失真最小化單元103比如對(duì)于L聲道,求取并使用去除了空間信息的L聲道信號(hào)和去除了空間信息的L聲道信號(hào)的合成信號(hào)之間的編碼失真,因?yàn)檫@些信號(hào)為去除了空間信息后的信號(hào),所以與其說(shuō)是L聲道信號(hào)不如說(shuō)是具有與單聲道信號(hào)相近的性質(zhì)的信號(hào)。也就是說(shuō),編碼循環(huán)的對(duì)象信號(hào)不是原信號(hào),而是進(jìn)行了規(guī)定的處理后的信號(hào)。
于是,在本實(shí)施方式中,作為失真最小化單元103的編碼循環(huán)的對(duì)象信號(hào),使用原信號(hào)。另一方面,因?yàn)楸景l(fā)明中并不存在對(duì)于原信號(hào)的合成信號(hào),比如對(duì)于L聲道,設(shè)置一種結(jié)構(gòu),在去除了空間信息的L聲道信號(hào)的合成信號(hào)中重新賦予空間信息,求空間信息被復(fù)原后的L聲道合成信號(hào),并從該合成信號(hào)和原信號(hào)(L聲道信號(hào))計(jì)算編碼失真。
圖9是表示本發(fā)明實(shí)施方式2的可擴(kuò)展編碼裝置的詳細(xì)結(jié)構(gòu)的方框圖。并且,該可擴(kuò)展編碼裝置具有與實(shí)施方式1所示的可擴(kuò)展編碼裝置(參照?qǐng)D3)相同的基本結(jié)構(gòu),對(duì)相同的構(gòu)成要素賦予相同的標(biāo)號(hào),并省略其說(shuō)明。
本實(shí)施方式的可擴(kuò)展編碼裝置除了實(shí)施方式1的結(jié)構(gòu)之外,進(jìn)一步具有空間信息賦予單元201-1和201-2,以及LPC分析單元202-1和202-2,另外,對(duì)編碼循環(huán)的控制進(jìn)行管理的失真最小化單元的功能與實(shí)施方式1不同(失真最小化單元203)。
空間信息賦予單元201-1對(duì)從LPC合成濾波器115-1輸出的合成信號(hào)L3賦予由空間信息處理單元113-1去除的空間信息,并將結(jié)果輸出到失真最小化單元203(L3’)。LPC分析單元202-1對(duì)作為原信號(hào)的L聲道信號(hào)L1進(jìn)行線性預(yù)測(cè)分析,并將得到的LPC參數(shù)輸出到失真最小化單元203。對(duì)于失真最小化單元203的動(dòng)作將后述。
另外,空間信息賦予單元201-2和LPC分析單元202-2的動(dòng)作也和上述相同。
圖10是表示空間信息賦予單元201-1內(nèi)部的主要結(jié)構(gòu)的方框圖。另外,空間信息賦予單元201-2的結(jié)構(gòu)也與其相同。
空間信息賦予單元201-1包括空間信息逆量化單元211和空間信息解碼單元212??臻g信息解量化單元211對(duì)輸入的用于L聲道信號(hào)的空間信息量化索引CQ和MQ進(jìn)行解量化,并將相對(duì)于L聲道信號(hào)的單聲道信號(hào)的空間信息量化參數(shù)C’和M’輸出到空間信息解碼單元212??臻g信息解碼單元212對(duì)去除了空間信息的L聲道信號(hào)的合成信號(hào)L3適用空間信息量化參數(shù)C’和M’,由此生成并輸出賦予了空間信息的L聲道合成信號(hào)L3’。
接下來(lái),在下面表示用來(lái)說(shuō)明空間信息賦予單元201-1的處理的算式。另外,因?yàn)檫@些處理只相當(dāng)于空間信息處理單元113-1的處理的反向處理,所以省略詳細(xì)的說(shuō)明。
比如,作為空間信息,在利用能量比和延遲時(shí)間差的情況下,與上式(6)對(duì)應(yīng),成為下式(11)。
xLch′′(n)=1C′·xLch(n+M′)···(11)]]>(其中,n=0,…,F(xiàn)L-1)另外,比如,作為空間信息,在只利用能量比的情況下,與上式(7)對(duì)應(yīng),成為下式(12)。
xLch′′(n)=1C′·xLch(n)···(12)]]>(其中,n=0,…,F(xiàn)L-1)另外,比如,作為空間信息,在只利用延遲時(shí)間差的情況下,與上式(8)對(duì)應(yīng),成為下式(13)。
xLch″(n)=xLch(n+M′)...(13)(其中,n=0,…,F(xiàn)L-1)另外,對(duì)于R聲道信號(hào)也根據(jù)相同的算式說(shuō)明。
圖1 1是表示上述的失真最小化單元203內(nèi)部的主要結(jié)構(gòu)的方框圖。另外,對(duì)于與實(shí)施方式1所示的失真最小化單元103相同的構(gòu)成要素賦予相同的標(biāo)號(hào),并省略其說(shuō)明。
對(duì)失真最小化單元203輸入以下信號(hào)單聲道信號(hào)M1和單聲道信號(hào)的合成信號(hào)M2、L聲道信號(hào)L1和對(duì)其賦予了空間信息的合成信號(hào)L3’、以及R聲道信號(hào)R1和對(duì)其賦予了空間信息的合成信號(hào)R3’。失真最小化單元203計(jì)算各個(gè)信號(hào)之間的編碼失真,在進(jìn)行聽(tīng)覺(jué)加權(quán)后,計(jì)算各個(gè)編碼失真的總和,并確定該編碼失真成為最小的各個(gè)代碼本的索引。
另外,聽(tīng)覺(jué)加權(quán)單元142-2輸入L聲道信號(hào)的LPC參數(shù),聽(tīng)覺(jué)加權(quán)單元142-2將其作為濾波器系數(shù)進(jìn)行聽(tīng)覺(jué)加權(quán)。另外,聽(tīng)覺(jué)加權(quán)單元142-3輸入R聲道信號(hào)的LPC參數(shù),聽(tīng)覺(jué)加權(quán)單元142-2將其作為濾波系數(shù)進(jìn)行聽(tīng)覺(jué)加權(quán)。
圖12是用于說(shuō)明上述的可擴(kuò)展編碼處理的步驟的流程圖。
與實(shí)施方式1所示的圖8的不同之處為具有進(jìn)行L/R聲道信號(hào)的合成和空間信息的賦予的步驟(S2010)來(lái)代替ST1130,以及進(jìn)行L/R聲道信號(hào)的編碼失真的計(jì)算的步驟(ST2020)。
如上所述,根據(jù)本實(shí)施方式,作為編碼循環(huán)的對(duì)象信號(hào),直接使用作為原信號(hào)的L聲道信號(hào)和/或R聲道信號(hào),而不是實(shí)施方式1那樣的進(jìn)行了規(guī)定的處理后的信號(hào)。另外,為了使對(duì)象信號(hào)成為原信號(hào),作為所對(duì)應(yīng)的合成信號(hào),使用將空間信息復(fù)原的LPC合成信號(hào)。因此,可以期待提高編碼精度。
這是因?yàn)?,比如,在?shí)施方式1中,對(duì)L聲道信號(hào)和R聲道信號(hào)進(jìn)行編碼循環(huán)的動(dòng)作,以對(duì)從去除了空間信息后的信號(hào)所合成的信號(hào)的編碼失真進(jìn)行最小化。因此,存在對(duì)于最后輸出的解碼信號(hào)的編碼失真未成為最小的可能。
另外,比如在L聲道信號(hào)的振幅比單聲道信號(hào)的振幅大得多的情況下,按照實(shí)施方式1的方法,在輸入到失真最小化單元的L聲道信號(hào)的誤差信號(hào)中,成為去除了該振幅較大所引起的影響后的信號(hào)。因此,解碼裝置中,在復(fù)原空間信息時(shí),伴隨振幅的放大,不需要的編碼失真也被放大,會(huì)導(dǎo)致重放音質(zhì)的惡化。另一方面,在本實(shí)施方式中,因?yàn)閷谂c通過(guò)解碼裝置得到的解碼信號(hào)相同的信號(hào)的編碼失真作為對(duì)象進(jìn)行最小化,所以不會(huì)發(fā)生這樣的問(wèn)題。
另外,在上述結(jié)構(gòu)中,用于進(jìn)行聽(tīng)覺(jué)加權(quán)的LPC參數(shù),使用從去除空間信息前的L聲道信號(hào)和R聲道信號(hào)求取的LPC參數(shù)。也就是說(shuō),在聽(tīng)覺(jué)加權(quán)中,適用對(duì)于作為原信號(hào)的L聲道信號(hào)和R聲道信號(hào)本身的聽(tīng)覺(jué)加權(quán)。因此,能夠?qū)聲道信號(hào)和R聲道信號(hào)進(jìn)行在聽(tīng)覺(jué)上失真更小的高音質(zhì)的編碼。
以上,說(shuō)明了本發(fā)明的實(shí)施方式。
本發(fā)明的可擴(kuò)展編碼裝置以及可擴(kuò)展編碼方法,不被上述實(shí)施方式所限定,可以加以各種變更來(lái)實(shí)施。
本發(fā)明的可擴(kuò)展編碼裝置,能夠配置于移動(dòng)通信系統(tǒng)的通信終端裝置和基站裝置,并且由此能夠提供具有同樣的作用效果的通信終端裝置和基站裝置。另外,本發(fā)明的可擴(kuò)展編碼裝置以及可擴(kuò)展編碼方法還有可能利用在有線方式的通信系統(tǒng)中。
另外,雖然這里以通過(guò)硬件來(lái)實(shí)現(xiàn)本發(fā)明的情形為例進(jìn)行了說(shuō)明,但是本發(fā)明還可以通過(guò)軟件來(lái)實(shí)現(xiàn)。比如,通過(guò)編程語(yǔ)言,對(duì)本發(fā)明的可擴(kuò)展編碼方法的算法進(jìn)行記述,并在內(nèi)存中保存該程序并通過(guò)信息處理裝置來(lái)實(shí)行,從而能夠?qū)崿F(xiàn)與本發(fā)明的可擴(kuò)展編碼裝置相同的功能。
另外,自適應(yīng)代碼本(adaptive codebook)有時(shí)也被稱為自適應(yīng)音源代碼本。另外,固定代碼本(fixed codebook)有時(shí)也被稱為固定音源代碼本。另外,固定代碼本也有時(shí)被稱為噪音代碼本、概率代碼本(stochastic codebook)、或者隨機(jī)代碼本(random codebook)。
另外,用于說(shuō)明上述的實(shí)施方式的各個(gè)功能模塊,典型地被實(shí)現(xiàn)為由集成電路構(gòu)成的LSI(大規(guī)模集成電路)。這些既可以分別實(shí)行單芯片化,也可以包含其中一部分或者是全部而實(shí)行單芯片化。
另外,每個(gè)功能塊在此雖然稱做LSI,但根據(jù)集成度的不同也可以稱為“IC”、“系統(tǒng)LSI”、“超大LSI”和“極大LSI”等。
另外,集成電路化的技術(shù)不只限于LSI,也可以使用專用電路或通用處理器來(lái)實(shí)現(xiàn)。也可以在LSI制造后利用可編程的FPGA(Field ProgrammableGate Array,現(xiàn)場(chǎng)可編程門陣列),或?qū)SI內(nèi)部的電路單元連接或設(shè)定重新配置的可重配置處理器(Reconfigurable Processor)。
再有,如果隨著半導(dǎo)體技術(shù)的進(jìn)步或者其他技術(shù)的派生,出現(xiàn)了取代LSI集成電路的技術(shù),當(dāng)然也可以利用該技術(shù)來(lái)實(shí)現(xiàn)功能塊的集成化。也有適用生物技術(shù)等的可能性。
本說(shuō)明書(shū)根據(jù)2004年12月28日提交的日本專利申請(qǐng)?zhí)卦?004-381492號(hào)和2005年5月31日提交的日本專利申請(qǐng)?zhí)卦?005-160187號(hào)。其內(nèi)容全部包括在此。
工業(yè)實(shí)用性本發(fā)明的可擴(kuò)展編碼裝置和可擴(kuò)展編碼方法能夠適用于移動(dòng)通信系統(tǒng)中的通信終端裝置、基站裝置等用途。
權(quán)利要求
1.一種可擴(kuò)展編碼裝置,包括單聲道信號(hào)生成單元,從第一聲道信號(hào)和第二聲道信號(hào)生成單聲道信號(hào);第一聲道加工單元,對(duì)所述第一聲道信號(hào)進(jìn)行加工而生成與所述單聲道信號(hào)相似的第一聲道加工信號(hào);第二聲道加工單元,對(duì)所述第二聲道信號(hào)進(jìn)行加工而生成與所述單聲道信號(hào)相似的第二聲道加工信號(hào);第一編碼單元,利用共用的音源,對(duì)所述單聲道信號(hào)、所述第一聲道加工信號(hào)以及所述第二聲道加工信號(hào)的全部或部分進(jìn)行編碼;以及第二編碼單元,對(duì)有關(guān)所述第一聲道加工單元和所述第二聲道加工單元的加工的信息進(jìn)行編碼。
2.如權(quán)利要求1所述的可擴(kuò)展編碼裝置,其中,所述第一聲道加工單元對(duì)包含在所述第一聲道信號(hào)中的空間信息予以修改而生成所述第一聲道加工信號(hào),所述第二聲道加工單元對(duì)包含在所述第二聲道信號(hào)中的空間信息予以修改而生成所述第二聲道加工信號(hào),所述第二編碼單元對(duì)有關(guān)在所述第一聲道加工單元和所述第二聲道加工單元進(jìn)行的所述修改的信息進(jìn)行編碼。
3.如權(quán)利要求2所述的可擴(kuò)展編碼裝置,其中,包含在所述第一聲道信號(hào)中的空間信息為有關(guān)所述第一聲道信號(hào)和所述單聲道信號(hào)的波形上的差異的信息。
4.如權(quán)利要求3所述的可擴(kuò)展編碼裝置,其中,有關(guān)所述波形上的差異的信息為有關(guān)能量和延遲時(shí)間的雙方或者一方的信息。
5.如權(quán)利要求1所述的可擴(kuò)展編碼裝置,其中,所述第一編碼單元包括對(duì)所述單聲道信號(hào)、所述第一聲道加工信號(hào)以及所述第二聲道加工信號(hào)的全部或部分共用的自適應(yīng)代碼本和固定代碼本。
6.如權(quán)利要求1所述的可擴(kuò)展編碼裝置,其中,所述第一編碼單元求使所述單聲道信號(hào)的編碼失真、所述第一聲道加工信號(hào)的編碼失真以及所述第二聲道加工信號(hào)的編碼失真的總和最小的所述共用的音源。
7.如權(quán)利要求1所述的可擴(kuò)展編碼裝置,其中,還包括第一反向處理單元,對(duì)所述第一聲道加工信號(hào)進(jìn)行與所述第一加工單元的加工相反的處理而得到第一聲道信號(hào);以及第二反向處理單元,對(duì)所述第二聲道加工信號(hào)進(jìn)行與所述第二加工單元的加工相反的處理而得到第二聲道信號(hào),所述第一編碼單元求使所述單聲道信號(hào)的編碼失真、通過(guò)所述第一反向處理單元得到的第一聲道信號(hào)的編碼失真以及通過(guò)所述第二反向處理單元得到的第二聲道信號(hào)的編碼失真的總和最小的所述共用的音源。
8.如權(quán)利要求7所述的可擴(kuò)展編碼裝置,其中,還包括單聲道LPC分析單元,對(duì)所述單聲道信號(hào)進(jìn)行LPC分析而得到單聲道LPC參數(shù);第一聲道LPC分析單元,對(duì)所述第一聲道信號(hào)進(jìn)行LPC分析而得到第一聲道LPC參數(shù);第二聲道LPC分析單元,對(duì)所述第二聲道信號(hào)進(jìn)行LPC分析而得到第二聲道LPC參數(shù);單聲道聽(tīng)覺(jué)加權(quán)單元,利用所述單聲道LPC參數(shù),對(duì)所述單聲道信號(hào)的編碼失真進(jìn)行聽(tīng)覺(jué)加權(quán);第一聲道聽(tīng)覺(jué)加權(quán)單元,利用所述第一聲道LPC參數(shù),對(duì)通過(guò)所述第一反向處理單元得到的第一聲道信號(hào)的編碼失真進(jìn)行聽(tīng)覺(jué)加權(quán);以及第二聲道聽(tīng)覺(jué)加權(quán)單元,利用所述第二聲道LPC參數(shù),對(duì)通過(guò)所述第二反向處理單元得到的第二聲道信號(hào)的編碼失真進(jìn)行聽(tīng)覺(jué)加權(quán)。
9.一種包括權(quán)利要求1所述的可擴(kuò)展編碼裝置的通信終端裝置。
10.一種包括權(quán)利要求1所述的可擴(kuò)展編碼裝置的基站裝置。
11.一種可擴(kuò)展編碼方法,包括單聲道信號(hào)生成步驟,從第一聲道信號(hào)和第二聲道信號(hào)生成單聲道信號(hào);第一聲道加工步驟,對(duì)所述第一聲道信號(hào)進(jìn)行加工而生成與所述單聲道信號(hào)相似的第一聲道加工信號(hào);第二聲道加工步驟,對(duì)所述第二聲道信號(hào)進(jìn)行加工而生成與所述單聲道信號(hào)相似的第二聲道加工信號(hào);第一編碼步驟,利用共用的音源,對(duì)所述單聲道信號(hào)、所述第一聲道加工信號(hào)以及所述第二聲道加工信號(hào)的全部或部分進(jìn)行編碼;以及第二編碼步驟,對(duì)有關(guān)所述第一聲道加工步驟和所述第二聲道加工步驟的加工的信息進(jìn)行編碼。
全文摘要
公開(kāi)了可擴(kuò)展編碼裝置,能夠防止解碼信號(hào)的音質(zhì)惡化,同時(shí)能夠削減編碼速率和削減電路規(guī)模。在該裝置中,L聲道信號(hào)加工單元(105-1)利用L聲道空間信息,對(duì)L聲道信號(hào)L1進(jìn)行加工而生成與單聲道信號(hào)M1相似的加工信號(hào)L2。L聲道加工信號(hào)合成單元(106-1)利用加工信號(hào)L2和由音源信號(hào)生成單元(104)生成的音源信號(hào)S1而生成合成信號(hào)L3。R聲道信號(hào)加工單元(105-2)和R聲道加工信號(hào)合成單元(106-2)也進(jìn)行相同的動(dòng)作。失真最小化單元(103)對(duì)音源信號(hào)生成單元(104)進(jìn)行控制,使其生成音源信號(hào)S1,所述音源信號(hào)S1為使合成信號(hào)M2、L3以及R3的編碼失真的和成為最小的共用的音源信號(hào)。
文檔編號(hào)G10L19/14GK101091205SQ200580045238
公開(kāi)日2007年12月19日 申請(qǐng)日期2005年12月26日 優(yōu)先權(quán)日2004年12月28日
發(fā)明者后藤道代, 吉田幸司 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社