国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語(yǔ)音音響編碼裝置、語(yǔ)音音響解碼裝置、語(yǔ)音音響編碼方法和語(yǔ)音音響解碼方法

      文檔序號(hào):8417609閱讀:601來(lái)源:國(guó)知局
      語(yǔ)音音響編碼裝置、語(yǔ)音音響解碼裝置、語(yǔ)音音響編碼方法和語(yǔ)音音響解碼方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及使用了變換編碼方式的語(yǔ)音音響編碼裝置、語(yǔ)音音響解碼裝置、語(yǔ)音 音響編碼方法及語(yǔ)音音響解碼方法。
      【背景技術(shù)】
      [0002] 作為能夠高效率地編碼0. 05-14kHz頻帶的超寬頻帶(SWB !Super-Wide-Band) 的語(yǔ)音信號(hào)或音樂(lè)信號(hào)的方式,有按ITU-T (International Telecommunication Union Telecommunication Standardization Sector ;國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門(mén))標(biāo)準(zhǔn)化的 非專(zhuān)利文獻(xiàn)1及非專(zhuān)利文獻(xiàn)2中記載的技術(shù)。在這些技術(shù)中,將7kHz為止的頻帶在核心編 碼單元中編碼,將7kHz以上的頻帶(以下,稱(chēng)為"擴(kuò)展頻帶")在擴(kuò)展編碼單元中編碼。
      [0003] 在核心編碼單元中,使用碼激勵(lì)線(xiàn)性預(yù)測(cè)(CELP :Code Excited Linear Prediction)進(jìn)行編碼,在將CELP中不能編碼的剩余信號(hào)用MDCT(Modified Discrete Cosine Transform;改進(jìn)離散余弦變換)變換到頻域后,以稱(chēng)為FPC(Factorial Pulse Coding;階乘脈沖編碼)或AVQ(Algebraic Vector Quantization;代數(shù)矢量量化)的變換 編碼進(jìn)行編碼。在擴(kuò)展編碼單元中,在7kHz以上的擴(kuò)展頻帶中,搜索與7kHz為止的低頻的 頻譜之間相關(guān)較高的頻帶,將相關(guān)最高的頻帶使用在擴(kuò)展頻帶的編碼中利用的方法等進(jìn)行 編碼。再有,在非專(zhuān)利文獻(xiàn)1及非專(zhuān)利文獻(xiàn)2中,在7kHz為止的低頻側(cè)和7kHz以上的高頻 偵牝分別被預(yù)先確定編碼比特?cái)?shù),以分別確定的編碼比特?cái)?shù)編碼低頻側(cè)和高頻側(cè)。
      [0004] 此外,在非專(zhuān)利文獻(xiàn)3中,也公開(kāi)了將SWB編碼的方式已被ITU-T標(biāo)準(zhǔn)化。在非專(zhuān) 利文獻(xiàn)3中記載的編碼裝置中,將輸入信號(hào)通過(guò)MDCT變換到頻域,分割為子帶,對(duì)每個(gè)子帶 進(jìn)行編碼。具體地說(shuō),該編碼裝置首先計(jì)算各子帶能量,并進(jìn)行編碼。接著,為了編碼頻率 精細(xì)結(jié)構(gòu),基于子帶能量,對(duì)各子帶分配用于編碼頻率精細(xì)結(jié)構(gòu)的編碼比特。頻率精細(xì)結(jié)構(gòu) 使用格型矢量量化(Lattice Vector Quantization)來(lái)編碼。與FPC或AVQ同樣,格型矢 量量化也是適合頻譜的編碼的一種變換編碼。在格型矢量量化中,由于編碼比特未被充分 地分配,所以有時(shí)解碼過(guò)的頻譜的能量和子帶能量的誤差較大。這種情況下,通過(guò)進(jìn)行將子 帶能量和解碼頻譜的能量的誤差用噪聲矢量填補(bǔ)的處理,進(jìn)行編碼。
      [0005] 此外,在非專(zhuān)利文獻(xiàn)4中,論述了基于AAC(Advanced Audio Coding ;高級(jí)音頻編 碼)的編碼技術(shù)。在AAC中,基于聽(tīng)覺(jué)模型計(jì)算掩蔽閾值,通過(guò)將掩蔽閾值以下的MDCT系 數(shù)從編碼對(duì)象中除去,高效率地進(jìn)行編碼。
      [0006] 現(xiàn)有技術(shù)文獻(xiàn)
      [0007] 非專(zhuān)利文獻(xiàn)
      [0008] 非專(zhuān)利文獻(xiàn) I : ITU-T Standard G. 718AnnexB,2010 年
      [0009] 非專(zhuān)利文獻(xiàn) 2 : ITU-T Standard G. 729. lAnnexE,2010 年
      [0010] 非專(zhuān)利文獻(xiàn) 3 : ITU-T Standard G. 719, 2008 年
      [0011] 非專(zhuān)利文獻(xiàn)4 :MP3AND AAC explained,AES 17th International Conference on High Quality Audio Coding,1999 年

      【發(fā)明內(nèi)容】

      [0012] 發(fā)明要解決的問(wèn)題
      [0013] 在非專(zhuān)利文獻(xiàn)1及非專(zhuān)利文獻(xiàn)2中,對(duì)核心編碼單元編碼的低頻側(cè)和擴(kuò)展編碼單 元編碼的高頻側(cè)以固定方式分配比特,不能對(duì)低頻和高頻按照信號(hào)的特性適當(dāng)?shù)胤峙渚幋a 比特。因此,存在因輸入信號(hào)的特性而不能發(fā)揮充分的性能的課題。
      [0014] 另一方面,在非專(zhuān)利文獻(xiàn)3中,有按照子帶能量從低頻到高頻自適應(yīng)地分配比特 的機(jī)制,但著眼于高頻越高,相對(duì)頻譜的誤差的靈敏度越低這樣的聽(tīng)覺(jué)特性,存在對(duì)高頻容 易分配需要以上的比特的課題。有關(guān)該課題在以下說(shuō)明。
      [0015] 在編碼過(guò)程中,首先,計(jì)算各子帶中需要的比特量,以使對(duì)每個(gè)子帶計(jì)算出的子帶 能量越大,分配越多的比特。但是,在變換編碼中,在算法的性質(zhì)上,即使將編碼比特分配增 加1比特,編碼能力也不會(huì)提高,有時(shí)如果不分配一定程度匯集的比特?cái)?shù),編碼結(jié)果就不改 變。因此,如果不是以比特單位,而是以這樣匯集的比特?cái)?shù)的單位進(jìn)行比特的分配,則是便 利的。將這樣的編碼上需要的比特?cái)?shù)的單位在這里稱(chēng)為單元。分配的單元(unit)數(shù)越多, 能夠越正確地表現(xiàn)頻譜的形狀及振幅。再有,考慮到聽(tīng)覺(jué)特性,高頻的子帶與低頻的子帶相 比,一般來(lái)說(shuō)其帶寬取得寬,但帶寬越寬,1單元所需要的比特量就越多,所以1單元的比特 數(shù)隨著帶寬而改變。
      [0016] 在本發(fā)明所設(shè)想的變換編碼中,將頻譜用頻率軸上的少數(shù)脈沖串近似,所以在該 脈沖串的振幅信息和位置信息上,消耗以單元單位分配的編碼比特。
      [0017] 而且,在非專(zhuān)利文獻(xiàn)4中,通過(guò)將聽(tīng)覺(jué)特性上不重要的MDCT系數(shù)從編碼對(duì)象中除 去,而進(jìn)行高效率地編碼,要編碼的各個(gè)頻譜的位置信息被正確地表現(xiàn)。因此,子帶的帶寬 越寬,為了表現(xiàn)各個(gè)頻譜的位置,必然消耗越多的比特。
      [0018] 然而,高頻越高,相對(duì)頻譜的位置的聽(tīng)覺(jué)的靈敏度就變得越低,如果能夠表現(xiàn)主要 的頻譜振幅、子帶能量,則難以感覺(jué)聽(tīng)感上的劣化。然而,在非專(zhuān)利文獻(xiàn)3及非專(zhuān)利文獻(xiàn)4 中,在高頻中都消耗很多的比特,才準(zhǔn)確地表現(xiàn)各個(gè)頻譜的位置。即,為了準(zhǔn)確地表現(xiàn)頻譜 位置,存在使用需要以上的編碼比特的課題。
      [0019] 本發(fā)明的目的在于,提供在抑制擴(kuò)展頻帶的音質(zhì)的劣化的同時(shí)降低對(duì)擴(kuò)展頻帶的 頻譜的編碼分配的編碼比特量的語(yǔ)音音響編碼裝置、語(yǔ)音音響解碼裝置、語(yǔ)音音響編碼方 法及語(yǔ)音音響解碼方法。
      [0020] 解決問(wèn)題的方案
      [0021] 本發(fā)明的語(yǔ)音音響編碼裝置采用以下結(jié)構(gòu),包括:時(shí)間頻率變換單元,將時(shí)域的輸 入信號(hào)變換為頻域的頻譜;分割單元,將所述頻譜分割為子帶;頻帶壓縮單元,在擴(kuò)展頻帶 內(nèi)的子帶中,將頻譜從低頻側(cè)或高頻側(cè)起按順序分成各自多個(gè)樣本的組合,選擇各組合之 中振幅的絕對(duì)值大的頻譜,將選擇出的頻譜在頻率軸上靠緊配置而壓縮該子帶的頻帶;以 及變換編碼單元,將比所述擴(kuò)展頻帶低的低頻的子帶的頻譜和頻帶壓縮過(guò)的頻譜通過(guò)變換 編碼進(jìn)行編碼。
      [0022] 本發(fā)明的語(yǔ)音音響解碼裝置采用以下結(jié)構(gòu),包括:變換編碼解碼單元,在擴(kuò)展頻帶 內(nèi)的子帶中,將頻譜從低頻側(cè)或高頻側(cè)起按順序分成各自多個(gè)樣本的組合,選擇各組合之 中振幅的絕對(duì)值大的頻譜,將選擇出的頻譜在頻率軸上靠緊配置,從而將壓縮了該子帶的 頻帶的頻譜和比所述擴(kuò)展頻帶低的低頻的子帶的頻譜,都通過(guò)變換編碼所編碼的編碼數(shù)據(jù) 解碼;頻帶擴(kuò)展單元,將所述壓縮的子帶的帶寬擴(kuò)展到原來(lái)的子帶的帶寬;子帶集中單元, 將比解碼過(guò)的所述擴(kuò)展頻帶低的低頻的子帶的頻譜和擴(kuò)展過(guò)的所述擴(kuò)展頻帶內(nèi)的子帶的 頻譜集中在一個(gè)矢量中;以及頻率時(shí)間變換單元,將集中后的頻域的頻譜變換為時(shí)域的信 號(hào)。
      [0023] 本發(fā)明的語(yǔ)音音響編碼方法,包括以下步驟:時(shí)間頻率變換步驟,將時(shí)域的輸入信 號(hào)變換為頻域的頻譜;分割步驟,將所述頻譜分割為子帶;頻帶壓縮步驟,將擴(kuò)展頻帶內(nèi)的 子帶的頻譜從低頻側(cè)或高頻側(cè)起按順序分成各自多個(gè)樣本的組合,選擇各組合之中振幅的 絕對(duì)值大的頻譜,并將選擇出的頻譜在頻率軸上靠緊配置而壓縮頻帶;以及變換編碼步驟, 將比所述擴(kuò)展頻帶低的低頻的子帶的頻譜和頻帶壓縮過(guò)的頻譜,通過(guò)變換編碼進(jìn)行編碼。
      [0024] 本發(fā)明的語(yǔ)音音響解碼方法,包括:變換編碼解碼步驟,將擴(kuò)展頻帶內(nèi)的子帶的頻 譜從低頻側(cè)或高頻側(cè)起按順序分成各自多個(gè)樣本的組合,選擇各組合之中振幅的絕對(duì)值大 的頻譜,將選擇出的頻譜在頻率軸上靠緊配置,從而將壓縮了頻帶的頻譜和比所述擴(kuò)展頻 帶低的低頻的子帶的頻譜,都通過(guò)變換編碼所編碼的編碼數(shù)據(jù)解碼;頻帶擴(kuò)展步驟,將經(jīng)壓 縮的子帶的帶寬擴(kuò)展到原來(lái)的子帶的帶寬;子帶集中步驟,將比經(jīng)解碼的所述擴(kuò)展頻帶低 的低頻的子帶的頻譜和經(jīng)擴(kuò)展的所述擴(kuò)展頻帶內(nèi)的子帶的頻譜集中在一個(gè)矢量中;以及頻 率時(shí)間變換步驟,將集中后的頻域的頻譜變換為時(shí)域的信號(hào)。
      [0025] 發(fā)明的效果
      [0026] 根據(jù)本發(fā)明,在能夠抑制擴(kuò)展頻帶的音質(zhì)的劣化的同時(shí),并且能夠降低對(duì)擴(kuò)展頻 帶的頻譜的編碼分配的編碼比特量。
      【附圖說(shuō)明】
      [0027] 圖1是表示本發(fā)明的實(shí)施方式1、3、5的語(yǔ)音音響編碼裝置的結(jié)構(gòu)的框圖。
      [0028] 圖2是用于說(shuō)明頻帶壓縮的圖。
      [0029] 圖3是用于說(shuō)明單元數(shù)重新計(jì)算單元的動(dòng)作的圖。
      [0030] 圖4是表示本發(fā)明的實(shí)施方式1、3、5的語(yǔ)音音響解碼裝置的結(jié)構(gòu)的框圖。
      [0031] 圖5是用于說(shuō)明頻帶擴(kuò)展的圖。
      [0032] 圖6是表示本發(fā)明的實(shí)施方式1的語(yǔ)音音響編碼裝置的另一結(jié)構(gòu)的框圖。
      [0033] 圖7是表示本發(fā)明的實(shí)施方式1的語(yǔ)音音響解碼裝置的另一結(jié)構(gòu)的框圖。
      [0034] 圖8是表示本發(fā)明的實(shí)施方式2的語(yǔ)音音響編碼裝置的結(jié)構(gòu)的框圖。
      [0035] 圖9是表示本發(fā)明的實(shí)施方式2的語(yǔ)音音響解碼裝置的結(jié)構(gòu)的框圖。
      [0036] 圖10是表示基于位置校正信息
      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1