專利名稱:編碼裝置和譯碼裝置的制作方法
技術領域:
本發(fā)明涉及安裝在無線通信裝置等上,用于對語音信號、音頻信號等進行編碼的 編碼裝置以及用于對該編碼信號進行譯碼的譯碼裝置。
背景技術:
在移動通信系統(tǒng)中,從有效地使用無線電波等的傳輸路徑容量(信道容量)和記 錄介質的觀點上看,將語音信號、音頻信號等壓縮成低比特率信號的編碼技術是特別重要 的。用于對語音信號進行編碼的語音編碼方案的示例包括由ITU_T(國際電信聯(lián)盟電 信標準化部)標準化的G726、G729等方案。這些方案使用窄帶信號(300Hz 3. 4kHz)為 編碼目標并且能夠以8kbit/s 32kbit/s的比特率進行高品質的編碼。但是,這樣的窄帶 信號是這樣的狹窄以致頻帶最大為3. 4kHz,其品質給聽眾以聲音悶聲悶氣不清楚的印象, 并且導致缺少真實感的問題。另外,還有使用寬帶信號(50Hz 7kHz)為編碼目標的語音編碼方案。這個的典 型示例為ITU-T的G722、G722. 1和3GPP(第三代合作項目)的AMR-WB等。這些方案能夠 以6. 6kbit/s 64kbit/s的比特率執(zhí)行寬帶語音信號的編碼。但是,當要被編碼的信號為 語音時,雖然寬帶信號具有較高的品質,但是當以音頻信號為目標或者要求具有真實感的 較高品質的語音信號時,這仍然是不夠的。另一方面,當信號的最高頻率通常在10 15kHz的量級時,就有可能獲得相當于 FM無線電的真實感,當最高頻率高達20kHz的量級時,就有可能獲得可與CD (緊湊盤)相媲 美的品質。對于這樣的信號,由MPEG(M移動圖像專家組)標準化的層III方案及AAC方案 表示的音頻編碼是恰當?shù)?。但是,這些音頻編碼方案具有寬的信號頻帶要被編碼,其導致被 編碼的信號的比特率增大的問題。傳統(tǒng)的編碼技術的示例包括以低比特率對寬頻帶的信號進行編碼的技術(例如, 參照專利文獻1)。根據(jù)這種技術,將輸入信號分成低頻率域的信號和高頻率域的信號,用低 頻率域的信號的頻譜代替高頻率域的信號的頻譜,并且對其進行編碼,由此降低整個比特率。圖IA 圖ID示出了用低頻率域的頻譜替換高頻率域的頻譜的上述處理的概述。 雖然該處理最初用于結合編碼處理執(zhí)行,但是為了簡化說明,將描述其中在原有信號上執(zhí) 行上述處理的情況作為示例。圖IA示出了頻帶被限制為0彡k < ra上的原有信號的頻譜,圖IB示出了限制為 0彡k < FL上的信號的頻譜(其中,F(xiàn)L < FH),圖IC示出了使用上述技術、用低頻率域(低 頻帶)的頻譜來替換高頻率域(高頻帶)的頻譜而獲得的頻譜,以及圖ID示出了通過依據(jù)有關該替換了的頻譜的頻譜包絡信息、銳化該替換頻譜而獲得的頻譜。在這些圖上,橫軸表示頻率,而縱軸表示頻譜強度。在這種技術中,使用頻帶為0≤k < FL的低頻頻譜(圖1B)表示頻帶為0≤k < FH的原有信號的頻譜(圖1A)。更具體地說,高頻頻譜(0≤k < FH)由低頻頻譜(0≤k<FL)替換。作為該處理的結果,獲得了圖IC所示的頻譜。另外,為了簡化說明,以具有<formula>formula see original document page 5</formula>的關系的情況為例進行說明。根據(jù)有關原有信號的頻譜包絡的信息、調整在圖IC的頻譜的高頻率域中的頻譜的幅值,獲得如圖ID所示的頻譜。這個頻譜是通過估計原有信號而獲得的頻譜。專利文獻1 國際專利申請2001-521648號的國家公開(第15頁,圖1,圖2)。
發(fā)明內容
一般來說,眾所周知,諸如語音信號和音頻信號之類的頻譜具有其中每次在某個頻率的整數(shù)倍[每個預定的音調(Pitch)]上出現(xiàn)頻譜峰值的諧波結構。該諧波結構是保持語音信號、音頻信號等的品質的重要信息,而且如果諧波結構中出現(xiàn)了擾動,則聽眾就會感覺到品質的惡化。圖2A和圖2B是用于說明現(xiàn)有技術的問題的圖示。圖2A是通過分析音頻信號的頻譜而獲得的頻譜。如該圖所示,原有信號具有在頻率軸上具有間隔T的諧波結構。另一方面,圖2B示出了按照上述技術計算原有信號的頻譜的結果而獲得的頻譜。當比較這兩個頻譜時,從圖2B所示的頻譜中看出,在替換源的低頻頻譜Sl和替換目的地的高頻頻譜S2中保持了諧波結構,而在低頻頻譜Sl和高頻頻譜S2之間的連接域(頻譜S3)中的諧波結構被破壞了。當將這個計算的頻譜轉換成時間信號并且收聽該信號時,存在有由于這樣的諧波結構擾動而使聽眾們感覺到品質惡化的問題,這個諧波結構的擾動起因于沒有考慮諧波結構的形狀而執(zhí)行替換的事實。本發(fā)明的目的是在于提供一種能夠以低比特率高品質地對頻譜進行編碼而沒有在該頻譜的諧波結構上產生擾動的編碼裝置及能夠對這種編碼的信號進行譯碼的譯碼裝置。本發(fā)明的編碼裝置采用這樣的結構,其包括獲取部分,其獲取已被分成低頻帶和高頻帶兩個頻帶的頻譜;計算部分,其基于頻譜的諧波結構、計算指示在所獲取的低頻帶頻譜與所獲取的高頻帶頻譜之間的相似度的參數(shù);以及編碼部分,其對所計算的指示相似度的參數(shù)而不是所獲取的高頻帶頻譜進行編碼。本發(fā)明的譯碼裝置采用這樣的結構,其包括頻譜獲取部分,其從已被分成低頻帶和高頻帶兩個頻帶的頻譜中獲取低頻帶的頻譜;參數(shù)獲取部分,其獲取指示低頻帶的頻譜與高頻帶的頻譜之間的相似度的參數(shù);以及譯碼單元,其使用所獲取的低頻帶頻譜以及參數(shù)、對低頻帶及高頻帶的頻譜進行譯碼。本發(fā)明的編碼方法包括獲取步驟,獲取被分成低頻帶與高頻帶兩個頻帶的頻譜;計算步驟,基于頻譜的諧波結構計算指示在所獲取的低頻帶頻譜與所獲取的高頻帶頻譜之間的相似度的參數(shù),以及編碼步驟,對所計算的指示相似度的參數(shù),而不是對所獲取的高頻帶頻譜進行編碼。
本發(fā)明的譯碼方法包括頻譜獲取步驟,從被分成低頻帶與高頻帶兩個頻帶的頻譜中獲取低頻帶的頻譜;參數(shù)獲取步驟,獲取指示在低頻帶頻譜與高頻帶頻譜之間的相似 度的參數(shù);以及譯碼步驟,使用所獲取的低頻帶頻譜及參數(shù)、對低頻帶及高頻帶的頻譜進行 譯碼。根據(jù)本發(fā)明的第一方面,提供了一種對分成低頻帶和高頻帶的語音信號或音頻信號進行編碼的可擴展編碼裝置,包括第一編碼部分,對所述語音信號或所述音頻信號的低 頻帶的信號進行編碼;第二編碼部分,對所述語音信號或所述音頻信號的高頻帶的信號進 行編碼;第一頻譜生成部分,對所述低頻帶的信號執(zhí)行頻率域轉換,以生成低頻帶的第一頻 譜;以及第二頻譜生成部分,對所述語音信號或所述音頻信號執(zhí)行頻率域轉換,以生成具有 低頻帶和高頻帶的第二頻譜,其中,所述第二編碼部分包括生成部分,使用所述第一頻譜, 求所述第二頻譜的高頻帶的估計頻譜;搜索部分,搜索指示與所述第二頻譜的高頻帶最相 似的所述估計頻譜的參數(shù);以及編碼部分,對指示所述相似度最高的所述估計頻譜的參數(shù) 進行編碼,而不是對所述第二頻譜的高頻帶進行編碼。根據(jù)本發(fā)明的第二方面,提供了一種通信終端裝置,包括如上述根據(jù)本發(fā)明的第一方面提供的可擴展編碼裝置。根據(jù)本發(fā)明的第三方面,提供了一種基站裝置,包括如上述根據(jù)本發(fā)明的第一方面提供的可擴展編碼裝置。根據(jù)本發(fā)明的第四方面,提供了一種對分成低頻帶和高頻帶的語音信號或音頻信號進行譯碼的可擴展譯碼裝置,包括頻譜取得部分,從具有低頻帶及高頻帶的頻譜中獲取 低頻帶的頻譜;參數(shù)獲取部分,獲取指示使用所述低頻帶的頻譜生成的、且與對應于所述語 音信號或所述音頻信號的高頻帶的頻譜最相似的估計頻譜的參數(shù);以及譯碼部分,使用所 述低頻帶的頻譜及所述參數(shù),對所述低頻帶的頻譜及所述高頻帶的頻譜進行譯碼。根據(jù)本發(fā)明的第五方面,提供了一種通信終端裝置,包括如上述根據(jù)本發(fā)明的第四方面提供的可擴展譯碼裝置。根據(jù)本發(fā)明的第六方面,提供了一種基站裝置,包括如上述根據(jù)本發(fā)明的第四方面提供的可擴展譯碼裝置。根據(jù)本發(fā)明的第七方面,提供了一種對分成低頻帶和高頻帶的語音信號或音頻信號進行編碼的可擴展編碼方法,包括第一編碼步驟,對所述語音信號或所述音頻信號的低 頻帶的信號進行編碼;第二編碼步驟,對所述語音信號或所述音頻信號的高頻帶的信號進 行編碼;第一頻譜生成步驟,對所述低頻帶的信號執(zhí)行頻率域轉換,以生成低頻帶的第一頻 譜;以及第二頻譜生成步驟,對所述語音信號或所述音頻信號執(zhí)行頻率域轉換,以生成具有 低頻帶和高頻帶的第二頻譜,其中,所述第二編碼步驟包括生成步驟,使用所述第一頻譜, 求所述第二頻譜的高頻帶的估計頻譜;搜索步驟,搜索指示與所述第二頻譜的高頻帶最相 似的所述估計頻譜的參數(shù);以及編碼步驟,對指示所述相似度最高的所述估計頻譜的參數(shù) 進行編碼,而不是對所述第二頻譜的高頻帶進行編碼。根據(jù)本發(fā)明的第八方面,提供了一種對分成低頻帶和高頻帶的語音信號或音頻信號進行譯碼的可擴展譯碼方法,包括頻譜取得步驟,從具有低頻帶及高頻帶的頻譜中獲取 低頻帶的頻譜;參數(shù)獲取步驟,獲取指示使用所述低頻帶的頻譜生成的、且與對應于所述語 音信號或所述音頻信號的高頻帶的頻譜最相似的估計頻譜的參數(shù);以及譯碼步驟,使用所述低頻帶的頻譜及所述參數(shù),對所述低頻帶的頻譜及所述高頻帶的頻譜進行譯碼。本發(fā)明能夠以低比特率高品質地執(zhí)行頻譜的編碼而沒有對該頻譜的諧波結構有任何的破壞。另外,本發(fā)明還能夠在對該編碼的信號進行譯碼時提高音質。
圖IA至ID為說明用低頻率域的頻譜替換高頻率域的頻譜的傳統(tǒng)處理的概要的圖 示;圖2A和2B是用于說明現(xiàn)有技術的問題的圖示;圖3是示出依據(jù)實施方式1的無線發(fā)送裝置的主要結構的框圖;圖4是示出依據(jù)實施方式1的編碼裝置的內部結構的框圖;圖5是示出依據(jù)實施方式1的頻譜編碼部分的內部結構的框圖;圖6是說明依據(jù)實施方式1的濾波部分的濾波處理的概要的圖示;圖7A至7E是說明第2頻譜的估計值的頻譜如何隨著音調(pitch)系數(shù)T的變化 而改變的圖示;圖8A至8E是說明第2頻譜的估計值的頻譜如何隨著音調系數(shù)T的變化而改變的 圖示;圖9是示出依據(jù)實施方式1、由濾波部分、搜索部分、音調系數(shù)設置部分執(zhí)行的處 理的一系列算法的示例的流程圖;圖10是示出依據(jù)實施方式1的無線電接收裝置的主要結構的框圖;圖11是示出依據(jù)實施方式1的譯碼裝置的內部結構的框圖;圖12是示出依據(jù)實施方式1的頻譜譯碼部分的內部結構的框圖;圖13是說明依據(jù)實施方式1、由濾波部分生成的已譯碼頻譜的圖示;圖14A是示出當依據(jù)實施方式1的編碼裝置應用于有線通信系統(tǒng)時、在發(fā)送端的 主要結構的框圖;圖14B是示出當依據(jù)實施方式1的譯碼裝置應用于有線通信系統(tǒng)時、在接收端的 主要結構的框圖;圖15是示出依據(jù)實施方式2的頻譜編碼部分的主要結構的框圖;圖16是說明依據(jù)實施方式2、使用濾波器進行濾波的概述的圖示;圖17是示出依據(jù)實施方式3的頻譜編碼部分的主要結構的框圖;圖18是示出依據(jù)實施方式4的頻譜譯碼部分的主要結構的框圖;以及圖19是示出依據(jù)實施方式5的頻譜譯碼部分的主要結構的框圖。
具體實施例方式本發(fā)明者著眼于如語音信號、音頻信號等(下面統(tǒng)稱為音響信號)的特性,也就是 說,音響信號在頻率軸方向形成諧波結構的特性的事實,發(fā)現(xiàn)了使用全頻帶的頻譜中的一 些頻帶的頻譜執(zhí)行剩余頻帶的頻譜的編碼的可能性,從而實現(xiàn)了本發(fā)明。也就是說,本發(fā)明的實質是,例如,當在對已被分成高頻率域與低頻率域兩個頻帶 的信號頻譜進行編碼時,為高頻率域頻譜確定在高頻率域與低頻率域的頻譜之間的相似 度,并對指示這個相似度的參數(shù)執(zhí)行編碼。
下面將參考附圖對本發(fā)明的實施方式進行詳細說明。(實施方式1)圖3是示出了當依據(jù)本發(fā)明的實施方式1的無線編碼裝置安裝在無線通信系統(tǒng)的發(fā)送端時,無線發(fā)送裝置130的主要結構的框圖。這個無線發(fā)送裝置130包括編碼裝置120、輸入裝置131、A/D轉換裝置132、RF調 制裝置133和天線134。輸入裝置131將人耳朵聽得見的聲波Wll轉換成作為電信號的模擬信號,并向A/D 變換裝置132輸出該信號。A/D變換裝置132將這個模擬信號轉換成數(shù)字信號,并向編碼裝 置120輸出該信號。編碼裝置120對所輸入的數(shù)字信號進行編碼,生成編碼的信號并向RF 調制裝置133輸出該編碼的信號。RF調制裝置133調制該編碼的信號,生成調制的編碼信 號并向天線134輸出該調制的編碼信號。天線134將該調制的編碼信號作為無線電波W12 發(fā)送。圖4是示出上述編碼裝置120的內部結構的框圖。在此,以其中執(zhí)行分層編碼(可 擴展性編碼)的情況為例進行說明。編碼裝置120包括輸入端121、下采樣部分122、第1層編碼部分123、第1層譯碼 部分124、上采樣部分125、延遲部分126、頻譜編碼部分100、多路復用部分127和輸出端 128。具有有效頻帶為0彡k < ra的信號從A/D轉換裝置132輸入到輸入端121。下 采樣部分122向經由輸入端121輸入的信號應用下采樣,生成具有低采樣率的信號并輸出 該信號。第1層編碼部123對這個下采樣的信號進行編碼,并向多路復用部分(多路調制 器)127輸出所獲得的編碼,同時也向第1層譯碼部分124輸出所獲得的編碼。第1層譯碼 部分124基于該編碼生成第1層的譯碼信號。上采樣部125提高第1層編碼部分123的譯 碼信號的采樣速率。另一方面,延遲部分126,向經由輸入端121輸入的信號提供規(guī)定長度的延遲。假 定這個延遲的長短與當信號通過下采樣部分122、第1層編碼部分123、第1層譯碼部分124 及上采樣部分125時產生的時間延遲具有相同的值。頻譜編碼部分100使用從上采樣部 分125輸出的信號作為第一信號以及從延遲部分126輸出的信號作為第二信號進行頻譜編 碼,并且向多路復用部分127輸出生成的編碼。多路復用部分127將從第1層編碼部分123 獲得的編碼與從頻譜編碼部分100獲得的編碼進行多路復用,并且經由輸出端128輸出該 多路復用的參數(shù)作為輸出編碼。將這個輸出的編碼給予RF調制裝置133。圖5是示出上述頻譜編碼部分100的內部結構的框圖。頻譜編碼部分100包括輸入端102、103,頻率域轉換部分104、105,內部狀態(tài)設置 部分106、濾波部分107、搜索部分108、音調系數(shù)設置部分109、濾波器系數(shù)計算部分110、及 輸出端111。第一信號從上采樣部分125輸入到輸入端102。這個第一信號是由第1層譯碼部分124使用由第1層編碼部分123編碼的編碼參數(shù)進行譯碼的信號,并且具有0 < k < FL 的有效頻帶。另外,有效頻帶為0彡k < FH(FL < FH)的第二信號從延遲部分126輸入到 輸入端103。頻率域轉換部分104在從輸入端102輸入的第一信號上執(zhí)行頻率轉換,以計算第一頻譜Sl (k)。另外,頻率域轉換部分105在從輸入端103輸入的第二信號上執(zhí)行頻率轉 換,以計算第二頻譜S2(k)。此處,頻率轉換方法應用離散傅里葉變換(DFT)、離散余弦變換 (DCT)、修改的離散余弦變換(MDCT)等。內部狀態(tài)設置部分106使用有效頻帶為0彡k < FL的第一頻譜Sl (k)設置在濾 波部分107中使用的濾波器的內部狀態(tài)。后面將再次進行說明該設置。音調系數(shù)設置部分109在預定音調系數(shù)T的搜索范圍Tmin到Tmax內一點一點改變該系數(shù)的同時,向濾波部分107逐個輸出該音調系數(shù)T。濾波部分107基于由內部狀態(tài)設置部分106設置的濾波器的內部狀態(tài)以及從音 調系數(shù)設置部分109輸出的音調系數(shù)T、執(zhí)行第二頻譜的濾波,并且計算第二頻譜的估計值 S’2(k)。將在后面描述這個濾波處理的詳細情況。搜索部分108計算相似度,其是指示在從頻率域轉換部分105輸出的第二頻譜 S2(k)和從濾波部分107輸出的第二頻譜的估計值S’ 2(k)之間的類似性的參數(shù)。后面將 詳細描述這個相似度。每次從音調系數(shù)設置部分109給出音調系數(shù)T時執(zhí)行這個相似度的 計算處理,而且將使所計算的相似度變?yōu)樽畲蟮囊粽{系數(shù)T’ (Tmin到Tmax的范圍)給予濾 波器系數(shù)計算部分110。濾波器系數(shù)計算部分110使用從搜索部分108提供的音調系數(shù)T’計算濾波器系 數(shù)β i,并經由輸出端111輸出該濾波器系數(shù)。此時,同時也經由輸出端111輸出音調系數(shù) T,。接下來,將在下面使用數(shù)學表達式詳細地描述頻譜編碼部100的主要部分的具體 操作。圖6說明了濾波部分107的濾波處理的概述。在此,為了方便假定將全頻帶(0彡k < FH)的頻譜稱為“S(k) ”,并且將使用由下 面的等式所表示的濾波器函數(shù)。
尸 O)=---^ _T+j · · ·(等式 1)
i 二-M在這個等式中,ζ表示ζ轉換變量,T表示從音調系數(shù)設置部分109給出的系數(shù),并 且假定M= 1。如該圖所示,作為濾波器的內部狀態(tài),將第一頻譜Sl (k)存儲在S (k)的0彡k < FL 頻帶中。另一方面,將根據(jù)以下的過程而獲得的第二頻譜的估計值S’ 2(k)存儲在S(k)的 FL彡k < ra頻帶中。在整個濾波處理中,在S’ 2 (k)中替換由以下的等式(2)所表示的頻譜。通過將所 有的頻譜β i · S(k-T-i)相加起來而獲得該替換的頻譜,其中通過將以具有比k低T的頻 率的頻譜s(k-T)為中心、僅相隔i的鄰近頻譜s(k-T-i)乘以預定的加權系數(shù)ι而獲得 β i · S(k-T-i)。S'2(k) = ^J「S、k一T-i)..八等式 2)
]
此時,假定提供給這個濾波器的輸入信號為零。即,(等式2)表示(等式1)的零輸入。通過在FL彡k<ra的范圍內以頻率的遞增次序(k = FL)改變k的同時執(zhí)行上述 計算,計算出在FL≤k < ra中的第二頻譜的估計值S,2 (k)。每次從音調系數(shù)設置部分109中給出音調系數(shù)T時,通過每次都將S(k)清零、在 FL ≤ k < FH的范圍內執(zhí)行上述的濾波處理。即,每次音調系數(shù)T改變時就計算S (k),并將 其輸出到搜索部分108。接著,將描述由搜索部分108執(zhí)行的相似度的計算處理以及最優(yōu)音調系數(shù)T的導 出處理。首先,存在有各種相似度的定義。此處,將以其中假定濾波器系數(shù)β —和^為0、 使用由基于最小方差方法的以下等式所定義的相似度的情況為例進行說明。<formula>formula see original document page 10</formula>
在使用了這個相似度的情況下,在計算出最優(yōu)音調系數(shù)T之后確定濾波器系數(shù) 這里,E表示S2(k)與S’2(k)之間的方差。在這個等式中,右邊的第1項變?yōu)榕c音調
系數(shù)T無關的固定值,并因此搜索用于生成使右邊第2項變?yōu)樽畲蟮腟’ 2(k)的音調系數(shù) T。這個等式的右邊第2項被稱為“相似度”。圖7A 圖7E是說明了第二頻譜的估計值S’ 2 (k)的頻譜如何隨著音調系數(shù)T的 變化而改變的圖。圖7A是說明了具有存儲為內部狀態(tài)的諧波結構的第一頻譜的圖。此外,圖7B 圖 7D是說明通過使用三種類型的音調系數(shù)T0、T1、T2執(zhí)行濾波而計算出的第二頻譜的估計值 S’2(k)的頻譜的圖。圖7E示出了要與估計值S’ 2 (k)的頻譜進行比較的第二頻譜S2(k) 的圖。在這個圖所示的示例中,由于圖7C所示的頻譜與圖7E所示的頻譜相似,并且因此 可理解使用Tl計算出的相似度表示最高的值。即,Tl是作為能夠保持諧波結構的音調系 數(shù)T的最優(yōu)值。圖8A 圖8E也是與圖7A 圖7E相似的圖,但是,存儲為內部狀態(tài)的第一頻譜的 相位與圖7A 圖7E的那個不同。然而,在這個圖所示的示例中,借此保持諧波結構的音調 系數(shù)T也是Tl。因此,改變音調系數(shù)T并且查找最大相似度T等同于在試探的基礎上找出該頻譜 的諧波結構的音調(或者其整數(shù)倍)。這個實施方式中的編碼裝置基于這個諧波結構的音 調計算出第二頻譜的估計值S’2(k),因此在第一頻譜與估計頻譜之間的連接部分中的諧波 結構沒有被破壞??紤]到基于由諧波結構的音調T(或者其整數(shù)倍)隔開的第一頻譜、計算 出當k = FL時連接部分的估計值S’ 2 (k),這是很容易理解的。此外,音調系數(shù)T表示頻譜數(shù)據(jù)的頻率間隔的整數(shù)倍(整數(shù)值)。然而,實際諧波 結構的音調經常是非整數(shù)值。因此,通過選擇適當?shù)募訖嘞禂?shù)^^并且對以T為中心的M個 鄰近數(shù)據(jù)應用加權相加,就有可能表示在從T-M到T+M范圍內的非整數(shù)值的諧波結構的音調。圖9是示出了由濾波部分107、搜索部分108、音調系數(shù)設置部分109執(zhí)行的處理中的一系列算法的示例的流程圖。由于已經說明過了這些的處理的概述,所以將省略該流 程的詳細說明。接下來,將說明由濾波器系數(shù)計算部分110進行的濾波器系數(shù)的計算處理。濾波器系數(shù)計算部分110使用從搜索部分108提供的音調系數(shù)T’、確定最小化在以下等式中的平方失真E的濾波器系數(shù)β”
<formula>formula see original document page 11</formula><formula>formula see original document page 11</formula> ···(等式 4)
<formula>formula see original document page 11</formula>濾波器系數(shù)計算部分110事先保持多個= -1,0,1)的組合作為數(shù)據(jù)表,確定最小化上述(等式4)中的平方失真E的^iG=-LOa)的組合,并且輸出其索引。因此,對于已被分成低頻率域(0彡k < FL)和高頻率域(FL彡k < FH)兩個部分 的輸入信號的頻譜,這個實施方式中的編碼裝置使用包括低頻頻譜作為內部狀態(tài)的濾波部 分107估計高頻頻譜的形狀,對指示濾波部分107的濾波器特性的參數(shù)、而不是高頻頻譜進 行編碼,并輸出該參數(shù),因此,有可能以低比特率高品質地執(zhí)行頻譜的編碼。此外,在上述結構中,當濾波部分107使用低頻頻譜估計高頻頻譜的形狀時,音調系數(shù)設置部分109以各種方式改變在用作估計標準的低頻頻譜與高頻頻譜之間的頻率差, 艮口,音調系數(shù)T,并且輸出該頻率差,而且搜索部分108檢測與在低頻頻譜和高頻頻譜之間 的最大相似度相對應的T。因此,可能基于整個頻譜的諧波結構的音調估計高頻頻譜的形 狀,并且能夠在維持整個頻譜的諧波結構的同時執(zhí)行編碼。此外,也不需要基于諧波結構的音調設置低頻頻譜的帶寬。即,不需要使低頻頻譜的帶寬與諧波結構的音調(或者其整數(shù)倍)相匹配,而且能夠任意地設置帶寬。這是因為 上述結構允許在低頻頻譜與高頻頻譜之間的連接部分平滑地連接頻譜,而不用使低頻頻譜 的帶寬與諧波結構的音調相匹配。雖然本實施方式已經說明了在(等式1)中M= 1的情況作為示例,但是M并不限于此而且可以使用0或者0以上的整數(shù)(自然數(shù))。此外,雖然本實施方式已經說明了執(zhí)行分層編碼(可擴展性編碼)的編碼裝置作為示例,但是上述頻譜編碼部分100還可以安裝在基于其他方案執(zhí)行編碼的編碼裝置上。此外,本實施方式已經說明了其中頻譜編碼部分100包括頻率域轉換部分104、 105的情況。這些是當時域信號用作輸入信號時所必需的部件,但是在其中直接將頻譜輸入 到頻譜編碼部分100中的模式中,頻率域轉換部分不是必需的。此外,在本實施方式已經說明了其中使用低頻頻譜,即使用低頻頻譜為編碼的標 準,對高頻頻譜進行編碼的情況,但是設置用作標準的頻譜的方法不限于此。而且還可能使 用高頻頻譜對低頻頻譜執(zhí)行編碼,或者使用中間頻帶的頻譜為編碼的標準、對其他區(qū)域的 頻譜執(zhí)行編碼,雖然從有效利用能量的觀點上看,它們都不是所期望的。圖10是示出接收從無線發(fā)送裝置130發(fā)送的信號的無線接收裝置180的主要結構的框圖。
該無線接收裝置180包括天線181、RF解調制裝置182、譯碼裝置170、D/A轉換裝 置183以及輸出裝置184。天線181接受作為無線電波W12的數(shù)字編碼的音響信號,生成為電信號的數(shù)字接 收的編碼音響信號,并且將其提供給RF解調制裝置182。RF解調制裝置182解調制來自天 線181的接收的編碼音響信號,生成解調制的編碼音響信號并且將其提供給譯碼裝置170。譯碼裝置170接受來自RF解調制裝置182的數(shù)字解調制的編碼音響信號,執(zhí)行譯碼處理,生成數(shù)字的譯碼音響信號,并且將其提供給D/A轉換裝置183。D/A轉換裝置183 轉換來自譯碼裝置170的數(shù)字譯碼的語音信號,生成模擬的譯碼語音信號,并且將其提供 給輸出裝置184。輸出裝置184將為電信號的模擬譯碼語音信號轉換為空氣的振動,并且將 其作為音波W13輸出,以便人的耳朵聽得見。圖11是示出了上述譯碼裝置170的內部結構的框圖。這里將以對被分層編碼的 信號進行譯碼的情況為例進行說明。這個譯碼裝置170包括輸入端171、分離部分172、第1層譯碼部分173、上采樣部 分174、頻譜譯碼部分150以及輸出端176、177。RF解調制裝置182將數(shù)字解調制的編碼音響信號輸入到輸入端171。分離部分 172分離經由輸入端171輸入的解調制的編碼音響信號,生成用于第1層譯碼部分173的 編碼和用于頻譜譯碼部分150的編碼。第1層譯碼部分173使用從分離部分172獲得的編 碼對具有信號帶寬0 < k < FL的譯碼信號進行譯碼,并將這個譯碼信號提供給上采樣部分 174。此外,另一個輸出連接到輸出端176。當由第1層譯碼部分173生成的第1層譯碼信 號需要輸出時,這允許經由這個輸出端176輸出該第1層譯碼信號。上采樣部分174提高從第1層譯碼部分173提供的第1層譯碼信號的采樣頻率。 將由分離部分172分離的編碼和由上采樣部分174生成的上采樣的第1層譯碼信號提供給 頻譜譯碼部分150。頻譜譯碼部分150執(zhí)行稍后描述的頻譜譯碼,生成具有信號頻帶0 < k < FH的譯碼信號,并且經由輸出端177輸出該譯碼信號。頻譜譯碼部分150把從上采樣部 分174提供的上采樣的第1層譯碼信號看作第1信號并且執(zhí)行處理。根據(jù)這個結構,當需要輸出由第1層譯碼部分173生成的第1層譯碼信號時,可以 從輸出端176輸出該第1層譯碼信號。此外,當需要輸出頻譜譯碼部分150的品質更高的 輸出信號時,該輸出信號可以從輸出端177輸出。譯碼裝置170輸出從輸出端176或者輸 出端177中的任一個輸出的信號,并且將該信號提供給D/A轉換裝置183。要輸出哪個信號 取決于應用的設置或者用戶的判斷。圖12是示出了上述頻譜譯碼部分150的內部結構的框圖。這個頻譜譯碼部分150包括輸入端152、153、頻率域轉換部分154、內部狀態(tài)設置 部分155、濾波部分156、時域轉換部分158及輸出端159。經由分離部分172將指示由頻譜編碼部分100獲得的編碼的濾波器系數(shù)輸入到輸 入端152。此外,將具有有效頻帶0彡k < FL的第1信號輸入到輸入端153。這個第1信 號是由第1層譯碼部分173譯碼并且由上采樣部分174采樣的的第1層譯碼信號。頻率域轉換部分154轉換從輸入端153輸入的時域信號的頻率,并且計算出第1 頻譜Sl(k)。作為頻率轉換方法,可以使用離散傅里葉變換(DFT)、離散余弦變換(DCT)Jf 改的離散余弦變換(MDCT)等。
內部狀態(tài)設置部分155使用第1頻譜Sl (k)設置在濾波部分156中使用的濾波器 的內部狀態(tài)。濾波部分156基于由內部狀態(tài)設置部分155設置的濾波器內部狀態(tài)以及從輸入端 152提供的音調系數(shù)T’及濾波系數(shù)β執(zhí)行第1頻譜的濾波,并且計算出第2頻譜的估計值 S’ 2(k)。在這種情況下,濾波部分156使用(等式1)中所描述的濾波器函數(shù)。時域轉換部分158將從濾波部分156獲得的譯碼頻譜S’ (k)轉換成時域信號,并經由輸出端159輸出該譯碼頻譜。在此,將根據(jù)需要執(zhí)行諸如適當?shù)拈_窗和疊加加法等之 類的處理以避免在幀之間出現(xiàn)不連續(xù)。圖13示出了由濾波部分156生成的譯碼頻譜S’(k)。如該圖所示,具有頻帶<FL的譯碼頻譜S’ (k)由第1頻譜Sl (k)構成,具 有頻帶FL彡k < FH的譯碼頻譜S’ (k)由第2頻譜的估計值S’ 2 (k)構成。因此,本實施方式中的譯碼裝置具有與根據(jù)本實施方式的編碼方法相對應的結 構,因此能夠用較少的位數(shù)高效地對編碼的音響信號進行譯碼,并且能夠輸出高品質的音 響信號。雖然在此已經以其中依據(jù)本實施方式的編碼裝置或譯碼裝置應用于無線通信系 統(tǒng)的情況為例進行了說明,但是如下所示,依據(jù)本實施方式的編碼裝置或譯碼裝置同樣可 應用于有線通信系統(tǒng)。圖14A是示出了當依據(jù)本實施方式的譯碼裝置應用于有線通信系統(tǒng)時,發(fā)送端的 主要結構的框圖。向與圖3所示的部件同樣的部件分配相同的參考數(shù)字,并且將省略其說 明。有線發(fā)送裝置140包括編碼裝置120、輸入裝置131和A/D轉換裝置132,而且其 輸出連接到網絡W。A/D轉換裝置132的輸入端連接到輸入裝置131的輸出端。編碼裝置120的輸入 端連接到A/D轉換裝置132的輸出端。編碼裝置120的輸出端連接到網絡W。輸入裝置131將人耳聽得見的音波Wll轉換成作為電信號的模擬信號,并且將其 提供給A/D轉換裝置132。A/D轉換裝置132將該模擬信號轉換成數(shù)字信號,并且將該數(shù)字 信號提供給編碼裝置120。編碼裝置120對所輸入的數(shù)字信號進行編碼,生成編碼并且向網 絡W輸出該編碼。圖14B是示出了當依據(jù)本實施方式的譯碼裝置應用于有線通信系統(tǒng)時,接收端的 主要結構的框圖。另外,向與圖10所示的部件相同的部件分配相同的參考數(shù)字,并且將省 略其說明。有線接收裝置190包括連接到網絡m的接收裝置191、譯碼裝置170、D/A轉換裝 置183及輸出裝置184。接收裝置191的輸入端連接到網絡附。譯碼裝置170的輸入端連接到接收裝置 191的輸出端。D/A轉換裝置183的輸入端連接到譯碼裝置170的輸出端。輸出裝置184 的輸入端連接到D/A轉換裝置183的輸出端。接收裝置191從網絡m接收數(shù)字編碼的音響信號,生成數(shù)字接收的音響信號,并 且將該信號提供給譯碼裝置170。譯碼裝置170從接收裝置191接收所接收的音響信號,在 所接收的音響信號上執(zhí)行譯碼處理,生成數(shù)字的譯碼音響信號,并且將其提供給D/A轉換裝置183。D/A轉換裝置183轉換來自譯碼裝置170的數(shù)字的譯碼語音信號,生成模擬的譯 碼語音信號,并且將其提供給輸出裝置184。輸出裝置184將作為電信號的模擬的譯碼音響 信號轉換成空氣的振動,并且將其作為人的耳朵聽得見的音波W13輸出。因此,根據(jù)上述結構,能夠提供具有與上述無線收發(fā)裝置類似的操作和效果的有 線收發(fā)裝置。(實施方式2)圖15是示出了在依據(jù)本發(fā)明的實施方式2的編碼裝置中的頻譜編碼部分200的 主要結構的框圖。這個頻譜編碼部分200具有與圖5所示的頻譜編碼部分100相似的基本 結構,而且向相同的部件分配相同的參考數(shù)字,并且將省略其說明。本實施方式的特點在于,使在濾波部分中使用的濾波器函數(shù)比實施方式1中的那 個更簡單。對于濾波部分201中使用的濾波器函數(shù),使用了如下面等式所示的簡化的一個。<formula>formula see original document page 14</formula>等式 5)這個等式對應于在(等式1)中假定M = 0、= 1的濾波器函數(shù)。圖16說明了使用了上述濾波器進行濾波的概述。通過順序地復制相隔T的低頻頻譜獲得第2頻譜的估計值S’2(k)。此外,如同在 實施例1的情況那樣,搜索部分108通過搜索最小化(等式3)中的E的音調系數(shù)T來確定 最優(yōu)音調系數(shù)T’。經由輸出端111輸出以這種方式獲得的音調系數(shù)T’。在這個結構中,濾 波器的特性僅僅由音調系數(shù)T所決定。要注意到,本實施方式的濾波器的特征在于,其以類似于自適應碼簿(adaptive codebook)的方式進行操作,其中自適應碼簿是作為低速率語音編碼的代表性技術的 CELP(Code-Excited Linear Prediction,編碼激勵的線性預測)方案的要素之一。接下來,將說明對由上述頻譜編碼部分200編碼的信號進行譯碼的頻譜譯碼部分 (未示出)。這個頻譜譯碼部具有與圖12所示的頻譜譯碼部分150相似的結構,因此省略了其 詳細說明,而且其具有以下的特點。即,當濾波部分156計算第2頻譜的估計值S’ 2 (k)時, 它使用(等式5)中所描述的濾波器函數(shù),而不是(等式1)中所描述的濾波器函數(shù)。僅僅 音調系數(shù)T’從輸入端152提供。S卩,應當使用(等式1)或(等式5)中的哪一個所描述的 濾波器函數(shù),取決于在編碼端使用的濾波器函數(shù)的類型而確定,并且使用與編碼端相同的 濾波器函數(shù)。因此,依據(jù)本實施方式,使在濾波部分中使用的濾波器函數(shù)變得更簡單,其導致消 除了安裝濾波器系數(shù)計算部分的必要。因此能夠用較少的計算量估計第2頻譜(高頻頻 譜),而且還減少了電路規(guī)模。(實施方式3)圖17是示出了依據(jù)本發(fā)明的實施方式3的編碼裝置中的頻譜編碼部分300的主 要結構的框圖。這個頻譜編碼部分300具有與圖5所示的頻譜編碼部分100相似的基本結 構,并且向相同的部件分配了相同的參考數(shù)字且將省略其說明。本實施方式的特點在于,還包含輪廓計算部分301和多路復用部分302,并且在估計了第2頻譜之后、對有關第2頻譜的包絡信息執(zhí)行編碼。搜索部分108將最優(yōu)音調系數(shù)T’輸出到多路復用部分302,并且將使用這個音調 系數(shù)T’生成的第2頻譜的估計值S’ 2 (k)輸出到輪廓計算部分301。輪廓計算部分301基 于從頻率域轉換部分105提供的第2頻譜S2 (k)計算有關第2頻譜S2 (k)的包絡信息。這 里,以其中由用于每個次能帶的頻譜功率表示這個包絡信息、而且頻帶FL彡k < ra被劃分 成J個次能帶的情況為例進行說明。此時,第j個次能帶的頻譜功率用以下的等式表示。<formula>formula see original document page 15</formula>等式 6)在這個等式中,BL(j)表示第j個次能帶的最低頻率,BH(J)表示第j個次能帶的最高頻率。將以這種方式獲得的第2頻譜的次能帶信息看作為有關第2頻譜的頻譜包絡信 肩、ο以類似的方式,根據(jù)下式計算出第2頻譜的估計值S’ 2(k)的次能帶信息B’ (j)。<formula>formula see original document page 15</formula>(等式 7)并且根據(jù)下式計算出每個次能帶的變化量V (j)。<formula>formula see original document page 15</formula>(等式8)接下來,輪廓計算部分301對變化量V(j)進行編碼,獲得編碼后的變化量Vq(j), 并且將其索引輸出到多路復用部分302。多路復用部分302多路復用從搜索部分108獲得 的最優(yōu)音調系數(shù)T’和從輪廓計算部分301輸出的變化量V(j)的索引,并且經由輸出端111 輸出該多路復用結果。因此,因為在估計了高頻頻譜之后近一步對有關高頻頻譜的包絡信息進行了編 碼,所以這個實施方式使得提高高頻頻譜的估計值的精度成為可能。(實施方式4)圖18是示出了依據(jù)本發(fā)明實施方式4的頻譜譯碼部分550的主要結構的框圖。這 個頻譜譯碼部分550具有與圖12所示的頻譜譯碼部分150相似的基本結構,并且因此向相 同的部件分配了相同的參考數(shù)字并且將省略其說明。本實施方式的特點在于,還包含分離部分551、頻譜包絡譯碼部分552及頻譜調整 部分553。因此,這允許實施方式3所示的頻譜編碼部分300等對通過對包絡信息進行編碼 以及對高頻頻譜的估計頻譜進行編碼而產生的編碼執(zhí)行譯碼。分離部分551分離經由輸入端152輸入的編碼,將有關濾波系數(shù)的信息提供給濾 波部分156,并且將有關頻譜包絡的信息提供給頻譜包絡譯碼部分552。頻譜包絡譯碼部分552從由分離部分551給出的頻譜包絡信息中,譯碼出通過對 變化量v(j)進行編碼而獲得的變化量Vq (j)。頻譜調整部553依據(jù)以下的等式將從濾波部分156獲得的譯碼頻譜S’ (k)乘以 從頻譜包絡譯碼部分552獲得的每個次能帶的譯碼的變化量Vq(j),調整在譯碼頻譜S’ (k) 的頻帶FL彡k < ra中的頻譜形狀并且生成調整后的譯碼頻譜S3 (k)。將該調整后的譯碼 頻譜S3(k)輸出到時域轉換部分158,并將它轉換成時域信號。
S3(k) = S' (k) · Vq(j) (BL(j)彡 k彡BH(j),for all j)···(等式 9)因此,根據(jù)本實施方式,有可能對包含包絡信息的編碼進行譯碼。本實施方式已經說明了作為示例的、其中從分離部分511提供的頻譜包絡信息是 通過對如(等式8)所示、每個次能帶的變化量V(j)進行編碼而獲得的值Vq(j)的情況,但 是,頻譜包絡信息并不限于此。(實施方式5)圖19是示出在依據(jù)本發(fā)明實施方式5的譯碼裝置中的頻譜譯碼部分650的主要 結構的框圖。這個頻譜譯碼部分650具有與圖18所示的頻譜譯碼部分550相似的基本結 構,并且因此向相同的部件分配相同的參考數(shù)字并且將省略其說明。本實施方式的特點在于,還包含LPC頻譜計算部分652,以使用利用LPC系數(shù)計算 出的LPC頻譜作為頻譜包絡信息,估計第2頻譜,然后通過將第2頻譜與LPC頻譜相乘以獲 得更準確的第2頻譜的估計值。LPC頻譜計算部分652根據(jù)以下的等式,從經由輸入端651輸入的LPC系數(shù)α (j) 中計算出LPC頻譜erw(k)。
… 1<formula>formula see original document page 16</formula>其中,NP表示LPC系數(shù)的次數(shù)。此外,還有可能使用變量r(0 < r < 1)并且改變 LPC頻譜的特性來計算LPC頻譜env (k)。在這種情況下,LPC頻譜erw(k)由以下的等式所示。<formula>formula see original document page 16</formula>其中,可以將r定義為固定值,其也可以采用逐幀改變的值。將以這種方式計算的 LPC頻譜erw(k)輸出到頻譜調整部分553。頻譜調整部分553依據(jù)以下的等式(12),將從濾波部分156獲得的譯碼頻譜 S’ (k)按照下式乘以從LPC頻譜計算部分652獲得的LPC頻譜erw(k),調整在譯碼頻譜 S’(k)的頻帶FL彡k<ra中的頻譜,并且生成調整后的譯碼頻譜S3(k)。將該調整后的譯 碼頻譜S3 (k)提供給時域轉換部分158,并將其轉換成時域信號。S3(k) = S' (k) · env(k) (FL 彡 k < FH). ·.(等式 12)因此,根據(jù)本實施方式,使用LPC頻譜作為頻譜包絡信息使得獲得更準確的第2頻 譜的估計值成為可能。依據(jù)本發(fā)明的編碼裝置或譯碼裝置可以裝載在移動通信系統(tǒng)中的通信終端裝置 和基站裝置上,并且因此能夠提供具有與上述的那些相似的操作和效果的通信終端裝置及基站裝置。雖然迄今為止已經以本發(fā)明由硬件構成的情況為例進行了說明,但是,本發(fā)明也可以用軟件來實現(xiàn)。本申請基于2003年9月16日提交的日本專利第2003-323658號。該申請的內容通過引起全部在此并入。工業(yè)可應用性依據(jù)本發(fā)明的編碼裝置和譯碼裝置具有以低比特率執(zhí)行編碼的效果,并且也能夠應用于無線通信系統(tǒng)等。
權利要求
一種對分成低頻帶和高頻帶的語音信號或音頻信號進行編碼的可擴展編碼裝置,包括第一編碼部分,對所述語音信號或所述音頻信號的低頻帶的信號進行編碼;第二編碼部分,對所述語音信號或所述音頻信號的高頻帶的信號進行編碼;第一頻譜生成部分,對所述低頻帶的信號執(zhí)行頻率域轉換,以生成低頻帶的第一頻譜;以及第二頻譜生成部分,對所述語音信號或所述音頻信號執(zhí)行頻率域轉換,以生成具有低頻帶和高頻帶的第二頻譜,其中,所述第二編碼部分包括生成部分,使用所述第一頻譜,求所述第二頻譜的高頻帶的估計頻譜;搜索部分,搜索指示與所述第二頻譜的高頻帶最相似的所述估計頻譜的參數(shù);以及編碼部分,對指示所述相似度最高的所述估計頻譜的參數(shù)進行編碼,而不是對所述第二頻譜的高頻帶進行編碼。
2.如權利要求1所述的可擴展編碼裝置,其中,所述參數(shù)指示從所述第二頻帶的頻譜相隔預定的值的所述第一頻帶的頻譜的位置; 所述生成部分通過順序地復制相隔預定的值的所述第一頻帶的頻譜,生成所述估計頻■i並 曰O
3.如權利要求1所述的可擴展編碼裝置,其中,所述搜索部分在事先設定的范圍內逐 次且一點一點地改變所述參數(shù),決定指示使所述相似度最高的所述估計頻譜的參數(shù)。
4.如權利要求1所述的可擴展編碼裝置,其中,所述搜索部分決定使包括所述第二頻 帶的頻譜與所述估計頻譜之間的失真最小的所述參數(shù)。
5.如權利要求1所述的可擴展編碼裝置,其中,所述相似度由互相關值的平方與所述估計頻譜的能量之比表示,所述互相關值為包括 所述第二頻帶的頻譜與所述估計頻譜之間的互相關值; 所述搜索部分決定使所述比最大的參數(shù)。
6.如權利要求1所述的可擴展編碼裝置,其中,所述編碼部分還對所述高頻帶的頻譜 的包絡信息進行編碼。
7.如權利要求1所述的可擴展編碼裝置,其中,所述編碼部分還對有關所述低頻帶的 頻譜與所述高頻帶的頻譜之間的功率比的信息進行編碼。
8.一種通信終端裝置,包括如權利要求1所述的可擴展編碼裝置。
9.一種基站裝置,包括如權利要求1所述的可擴展編碼裝置。
10.一種對分成低頻帶和高頻帶的語音信號或音頻信號進行譯碼的可擴展譯碼裝置, 包括頻譜取得部分,從具有低頻帶及高頻帶的頻譜中獲取低頻帶的頻譜; 參數(shù)獲取部分,獲取指示使用所述低頻帶的頻譜生成的、且與對應于所述語音信號或 所述音頻信號的高頻帶的頻譜最相似的估計頻譜的參數(shù);以及譯碼部分,使用所述低頻帶的頻譜及所述參數(shù),對所述低頻帶的頻譜及所述高頻帶的 頻譜進行譯碼。
11.如權利要求10所述的可擴展譯碼裝置,其中,所述參數(shù)指示從所述高頻帶的頻譜相隔預定的值的所述低頻帶的頻譜的位置; 所述譯碼部分通過順序地復制相隔預定的值的所述低頻帶的頻譜,生成所述高頻帶的頻譜。
12.如權利要求10所述的可擴展譯碼裝置,還包括包絡信息獲取部分,獲取所述高頻 帶的頻譜的包絡信息,其中,所述譯碼部分還使用所述包絡信息執(zhí)行所述譯碼。
13. —種通信終端裝置,包括如權利要求10所述的可擴展譯碼裝置。
14. 一種基站裝置,包括如權利要求10所述的可擴展譯碼裝置。
15. 一種對分成低頻帶和高頻帶的語音信號或音頻信號進行編碼的可擴展編碼方法, 包括第一編碼步驟,對所述語音信號或所述音頻信號的低頻帶的信號進行編碼; 第二編碼步驟,對所述語音信號或所述音頻信號的高頻帶的信號進行編碼; 第一頻譜生成步驟,對所述低頻帶的信號執(zhí)行頻率域轉換,以生成低頻帶的第一頻譜;以及第二頻譜生成步驟,對所述語音信號或所述音頻信號執(zhí)行頻率域轉換,以生成具有低 頻帶和高頻帶的第二頻譜,其中,所述第二編碼步驟包括生成步驟,使用所述第一頻譜,求所述第二頻譜的高頻帶的估計頻譜; 搜索步驟,搜索指示與所述第二頻譜的高頻帶最相似的所述估計頻譜的參數(shù);以及 編碼步驟,對指示所述相似度最高的所述估計頻譜的參數(shù)進行編碼,而不是對所述第 二頻譜的高頻帶進行編碼。
16. 一種對分成低頻帶和高頻帶的語音信號或音頻信號進行譯碼的可擴展譯碼方法, 包括頻譜取得步驟,從具有低頻帶及高頻帶的頻譜中獲取低頻帶的頻譜; 參數(shù)獲取步驟,獲取指示使用所述低頻帶的頻譜生成的、且與對應于所述語音信號或 所述音頻信號的高頻帶的頻譜最相似的估計頻譜的參數(shù);以及譯碼步驟,使用所述低頻帶的頻譜及所述參數(shù),對所述低頻帶的頻譜及所述高頻帶的 頻譜進行譯碼。
全文摘要
能夠以低比特率、高品質地對頻譜進行編碼而不會在頻譜的諧波結構上產生擾動的編碼裝置。在該裝置中,內部狀態(tài)設置部分(106)使用第1頻譜S1(k)設置濾波部分(107)的內部狀態(tài)。音調系數(shù)設置部分(109)一點一點地改變音調系數(shù)T,同時輸出該音調系數(shù)。濾波部分(107)基于音調系數(shù)T計算第2頻譜S2(k)的估計值S’2(k)。搜索部分(108)計算S2(k)與S’2(k)之間的相似度。然后,將根據(jù)計算具有最大相似度的音調系數(shù)T’應用到濾波器系數(shù)計算部分(110)。濾波器系數(shù)計算部分(110)使用該音調系數(shù)T’獲得濾波器系數(shù)βi。
文檔編號G10L11/04GK101800049SQ200910265890
公開日2010年8月11日 申請日期2004年9月15日 優(yōu)先權日2003年9月16日
發(fā)明者押切正浩 申請人:松下電器產業(yè)株式會社