国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      可縮放壓縮音頻位流和使用分級(jí)濾波器組和多通道聯(lián)合編碼的編碼/譯碼器的制作方法

      文檔序號(hào):7540050閱讀:451來(lái)源:國(guó)知局

      專利名稱::可縮放壓縮音頻位流和使用分級(jí)濾波器組和多通道聯(lián)合編碼的編碼/譯碼器的制作方法
      技術(shù)領(lǐng)域
      :本發(fā)明涉及音頻信號(hào)的可縮放編碼,并且更明確地說(shuō),涉及用來(lái)對(duì)多通道音頻信號(hào)在有效實(shí)體中進(jìn)行這種數(shù)據(jù)速率縮放的方法,該方法包括分級(jí)濾波(hierarchicalfiltering)、音調(diào)分量的聯(lián)合編碼及在殘余信號(hào)中的時(shí)域分量的聯(lián)合通道編碼。
      背景技術(shù)
      :音頻壓縮算法的主要目的是,使用盡可能少的數(shù)字位創(chuàng)建輸入音頻信號(hào)的聲音可接受表示。這允許輸入音頻信號(hào)的低數(shù)據(jù)速率版本在諸如互聯(lián)網(wǎng)之類的有限帶寬傳輸通道上傳送,并且減小用于存儲(chǔ)將來(lái)播放的輸入音頻信號(hào)必需的存儲(chǔ)量。對(duì)于其中傳輸通道的數(shù)據(jù)容量被固定并且相對(duì)于時(shí)間不變化、或需要存儲(chǔ)的音頻量(以分鐘計(jì)算)事先知道并且不增大的那些應(yīng)用,傳統(tǒng)音頻壓縮方法固定了數(shù)據(jù)速率并因而在壓縮編碼時(shí)固定了音頻質(zhì)量級(jí)。不能實(shí)現(xiàn)數(shù)據(jù)速率的進(jìn)一步減小,如果不用更低數(shù)據(jù)速率記錄原始信號(hào)或解壓縮被壓縮的音頻信號(hào)然后以更低數(shù)據(jù)速率重新壓縮這種解壓縮信號(hào)。對(duì)于變化的通道容量、在固定存儲(chǔ)器上存儲(chǔ)額外的內(nèi)容、或?qū)Σ煌瑧?yīng)用以變化的數(shù)據(jù)速率提供位流這些問題而言,這些方法不是"可縮放的"。一種用來(lái)創(chuàng)建具有可縮放特性的位流并規(guī)避上述限制的技術(shù),把輸入音頻信號(hào)編碼成包括低數(shù)據(jù)速率位流的子集的高數(shù)據(jù)速率位流。這些編碼低數(shù)據(jù)速率位流可從編碼信號(hào)抽取,并且組合以提供輸出位流,該輸出位流的數(shù)據(jù)速率在寬數(shù)據(jù)速率范圍上是可調(diào)節(jié)的。實(shí)現(xiàn)這個(gè)概念的一種手段是首先以最低支持?jǐn)?shù)據(jù)速率編碼數(shù)據(jù)、然后編碼在原始信號(hào)與這種最低數(shù)據(jù)速率位流的譯碼版本之間的誤差。這種編碼誤差被存儲(chǔ),并且也與最低支持?jǐn)?shù)據(jù)速率位流相組合以創(chuàng)建第二低數(shù)據(jù)速率位流。在原始信號(hào)與這種第二低數(shù)據(jù)速率信號(hào)的譯碼版本之間的誤差被編碼、存儲(chǔ)、及添加到第二低數(shù)據(jù)速率位流上以形成第三低數(shù)據(jù)速率位流,以此類推。這個(gè)過(guò)程被重復(fù),直到與如此導(dǎo)出的每一個(gè)誤差信號(hào)的位流相關(guān)的數(shù)據(jù)速率和最低支持?jǐn)?shù)據(jù)速率位流的數(shù)據(jù)速率之和等于待支持的最高數(shù)據(jù)速率位流。最后可縮放高數(shù)據(jù)速率位流包括最低數(shù)據(jù)速率位流和每一個(gè)編碼誤差位流。第二種技術(shù)通常用來(lái)支持相距很廣的最低和最高數(shù)據(jù)速率之間的較少數(shù)量的不同數(shù)據(jù)速率,釆用多于一個(gè)的壓縮算法的使用以創(chuàng)建"分層,,可縮放位流。以這種方式對(duì)編碼位流進(jìn)行縮放操作的設(shè)備,依據(jù)輸出數(shù)據(jù)速率要求,選擇在分層位流中攜帶的多個(gè)位流的哪一個(gè)以用作編碼音頻輸出。為了改進(jìn)編碼效率和提供較寬范圍的縮放數(shù)據(jù)速率,在較低速率位流中攜帶的數(shù)據(jù)可由較高速率位流使用,以形成另外的較高質(zhì)量、較高速率的位流。
      發(fā)明內(nèi)容本發(fā)明提供一種用來(lái)編碼音頻輸入信號(hào)的方法,以形成可被縮放以形成具有任意規(guī)定數(shù)據(jù)速率的縮放位流的主位流、以及用來(lái)譯碼縮放位流以重建音頻信號(hào)。這一般通過(guò)壓縮音頻輸入信號(hào)并排列它們以形成主位流而實(shí)現(xiàn)。主位流包括量化分量,該量化分量基于它們對(duì)于譯碼信號(hào)質(zhì)量的相對(duì)貢獻(xiàn)而排列。輸入信號(hào)通過(guò)把它分離成多個(gè)音調(diào)和殘余分量、以及排列然后量化所述分量而被適當(dāng)?shù)貕嚎s。所述分離使用分級(jí)濾波器組適當(dāng)?shù)剡M(jìn)行。參考相同掩碼功能或不同的心理聲學(xué)標(biāo)準(zhǔn),所述分量被適當(dāng)?shù)嘏帕泻土炕?。所述分量然后可以基于它們的排列被排序以利于有效縮放。主位流通過(guò)消除足夠數(shù)量的低序分量而被縮放,以形成具有小于或近似等于所希望數(shù)據(jù)速率的縮放數(shù)據(jù)速率的縮放位流。縮放位流包括指示分量在頻鐠中的位置的信息。縮放位流使用逆分級(jí)濾波器組通過(guò)排列基于位置信息形成的量化分量、忽略丟失分量及譯碼被排列的分量而被適當(dāng)?shù)刈g碼,以產(chǎn)生輸出位流。在一個(gè)實(shí)施例中,編碼器使用分級(jí)濾波器組把輸入信號(hào)分解成多分辨率時(shí)間/頻率表示。編碼器在不同頻率分辨率下在HFB的每次迭代中抽取音調(diào)分量,從輸入信號(hào)除去那些音調(diào)分量以把殘余信號(hào)傳到HFB的下次迭代,及從最后殘余信號(hào)抽取殘佘分量。音調(diào)分量被分組成至少一個(gè)頻率子域每頻率分辨率,并且根據(jù)它們對(duì)于編碼信號(hào)質(zhì)量的心理聲學(xué)重要性被排序。殘余分量包括時(shí)間-樣本分量(例如網(wǎng)格G)和修改時(shí)間-樣本分量的縮放因子分量(例如網(wǎng)格GO、Gl)。時(shí)間-樣本分量被分組成至少一個(gè)時(shí)間-樣本子域,并且根據(jù)它們對(duì)于編碼信號(hào)質(zhì)量的貢獻(xiàn)被排序。在譯碼器處,逆分級(jí)濾波器組可以用來(lái)抽取在一個(gè)有效濾波器組結(jié)構(gòu)內(nèi)的音調(diào)分量和殘余分量。所有分量被逆量化,并且通過(guò)把縮放因子施加到時(shí)間樣本上重建殘余信號(hào)。頻率樣本被重建,并且添加到重建時(shí)間樣本上以產(chǎn)生輸出音頻信號(hào)。注意,逆分級(jí)濾波器組可以用在譯碼器處,與在編碼過(guò)程期間是否使用分級(jí)濾波器組無(wú)關(guān)。在典型實(shí)施例中,多通道音頻信號(hào)中選擇的音調(diào)分量使用差分編碼被編碼。對(duì)于每個(gè)音調(diào)分量,一個(gè)通道選作初級(jí)通道。初級(jí)通道的通道號(hào)和其振幅和相位被存儲(chǔ)在位流中。位-掩碼被存儲(chǔ),指示其它通道的哪一個(gè)包括所指示的音調(diào)分量,并因此應(yīng)該編碼成次級(jí)通道。然后對(duì)于存在該音調(diào)分量的每個(gè)次級(jí)通道,初級(jí)與次級(jí)振幅和相位之差;故熵-編碼并存儲(chǔ)。在典型實(shí)施例中,組成殘余信號(hào)的時(shí)間-樣本和縮放因子分量使用被擴(kuò)展到多通道音頻的聯(lián)合通道編碼(JCC)而編碼。通道分組過(guò)程首先確定可以聯(lián)合編碼多個(gè)通道的哪一個(gè),并且所有通道都形成組,最后的組可能不完整。本發(fā)明的另外目的、特征及優(yōu)點(diǎn)包括在典型實(shí)施例的如下討論中,該討論應(yīng)該參照附圖閱讀。盡管這些典型實(shí)施例適合音頻數(shù)據(jù),但將理解,以類似方式也可以處理視頻、多媒體及其它類型的數(shù)據(jù)。圖1是方塊圖,表明根據(jù)本發(fā)明使用殘余編碼拓樸的可縮放位流編碼器;圖2a和2b是供分級(jí)濾波器組使用的Shmunk窗口的頻域和時(shí)域表示;圖3是用來(lái)提供輸入信號(hào)的多分辨率時(shí)間/頻率表示的分級(jí)濾波器組的例示,借助于本發(fā)明可從該輸入信號(hào)抽取音調(diào)和殘余分量;圖4是與分級(jí)濾波器組有關(guān)的步驟的流程圖5a至5c表明'重疊-添加,窗口;圖6是分級(jí)濾波器組的頻率響應(yīng)的曲線圖7是供編碼器之用的分級(jí)分析濾波器組的典型實(shí)施;圖8a和8b是3-級(jí)分級(jí)濾波器組的簡(jiǎn)化方塊圖以及單級(jí)的更詳細(xì)方塊圖9是用來(lái)把音調(diào)分量的差分編碼擴(kuò)展到多通道音頻的位掩碼;圖10描繪在本發(fā)明的編碼器的實(shí)施例中使用的殘佘編碼器的詳細(xì)實(shí)施例;圖ll是對(duì)于多通道音頻用于聯(lián)合編碼的方塊圖12示意表示由本發(fā)明的可縮放位流編碼器產(chǎn)生的可縮放數(shù)據(jù)幀;圖13表示在本發(fā)明中使用的譯碼器的一種實(shí)施的詳細(xì)方塊圖14是按照本發(fā)明用來(lái)由時(shí)間-樣本和頻率分量重建時(shí)間-序列數(shù)據(jù)的逆分級(jí)濾波器組的例示;圖15是逆分級(jí)濾波器組的典型實(shí)施的方塊圖16是在譯碼器中使用逆分級(jí)濾波器組組合音調(diào)和殘余分量的方塊圖17a和17b是3-級(jí)逆分級(jí)濾波器組的簡(jiǎn)化方塊圖以及單級(jí)的更詳細(xì)方塊圖18是殘余譯碼器的詳細(xì)方塊圖;圖19是Gl映像表;圖20是基礎(chǔ)功能合成校正系數(shù)表;及圖21和22分別是編碼器和譯碼器的功能方塊圖,表明在音頻編碼器/譯碼器中的分級(jí)濾波器組的多分辨率時(shí)間/頻率表示的應(yīng)用。具體實(shí)施例方式本發(fā)明提供一種方法用來(lái)壓縮和編碼音頻輸入信號(hào)以形成可被縮放以形成具有任意規(guī)定數(shù)據(jù)速率的縮放位流的主位流、以及用來(lái)譯碼縮放位流以重建音頻信號(hào)。分級(jí)濾波器組(HFB)提供輸入信號(hào)的多分辨率時(shí)間/頻率表示,編碼器可從該輸入信號(hào)有效地抽取音調(diào)和殘余分量。對(duì)于多通道音頻,實(shí)現(xiàn)音調(diào)分量的聯(lián)合編碼和在殘余信號(hào)中殘余分量的聯(lián)合通道編碼。分量基于它們對(duì)于譯碼信號(hào)質(zhì)量的相對(duì)貢獻(xiàn)被排序,并且參考掩碼函數(shù)而被量化。主位流通過(guò)消除足夠數(shù)量的低序分量被縮放,以形成具有小于或近似等于所希望數(shù)據(jù)速率的縮放數(shù)據(jù)速率的縮放位流。使用逆分級(jí)濾波器組,通過(guò)基于位置信息排列量化分量、忽略丟失分量及譯碼排序分量而適當(dāng)譯碼縮放位流,以產(chǎn)生輸出位流。在一種可能的應(yīng)用中,主位流被存儲(chǔ),并且為了記錄在另一種介質(zhì)上或?yàn)榱嗽陬l帶受限通道上傳輸而被縮小到希望數(shù)據(jù)速率。在多個(gè)縮放位流被存儲(chǔ)在介質(zhì)上的另一應(yīng)用中,每個(gè)流的數(shù)據(jù)速率被獨(dú)立地和動(dòng)態(tài)地控制,以使所感覺的質(zhì)量最大化,同時(shí)滿足對(duì)所有位流的集總數(shù)據(jù)速率的約束。如這里4吏用的那樣,術(shù)語(yǔ)"域"、"子域"、及"分量"描述在位流中可縮放元素的層級(jí)。例子將包括<table>complextableseeoriginaldocumentpage19</column></row><table>具有殘余編碼拓樸結(jié)構(gòu)的可縮放位流編碼器如圖1中所示,在典型實(shí)施例中,可縮放位流編碼器使用殘余編碼拓樸結(jié)構(gòu)通過(guò)從芯(音調(diào)分量)和/或殘余(時(shí)間-樣本和縮放因子)分量選擇性地消除最低排序分量把位流縮放到任意數(shù)據(jù)速率。編碼器使用分級(jí)濾波器組把輸入信號(hào)有效地分解成多分辨率時(shí)間/頻率表示,從該多分辨率時(shí)間/頻率表示編碼器可有效地抽取音調(diào)和殘余分量。這里描述的用來(lái)提供多分辨率時(shí)間/頻率表示的分級(jí)濾波器組(HFB)可用在希望輸入信號(hào)的這樣一種表示的多種其它應(yīng)用中。分級(jí)濾波器組的一般描述和其供音頻編碼器之用的構(gòu)造、以及由具體音頻編碼器使用的〗務(wù)改HFB在下面描述。輸入信號(hào)100施加到掩碼計(jì)算器101和多階音調(diào)抽取器102上。掩碼計(jì)算器101分析輸入信號(hào)100,并且辨別作為頻率的函數(shù)的掩碼水平,在該掩碼水平之下,輸入信號(hào)101中存在的頻率對(duì)于人耳是聽不到的。多階音調(diào)抽取器102使用例如多重重疊FFT或所表示的基于MDCT的分級(jí)濾波器組(它們滿足對(duì)于音調(diào)已經(jīng)定義的心理聲學(xué)標(biāo)準(zhǔn))辨別在輸入信號(hào)101中存在的頻率,根據(jù)這種標(biāo)準(zhǔn)選擇音調(diào),量化這些選擇音調(diào)的振幅、頻率、相位及位置分量,及把這些音調(diào)放置到音調(diào)清單中。在每次迭代或水平下,從輸入信號(hào)除去選擇音調(diào)以把殘余信號(hào)傳到前面。一旦完成,不滿足音調(diào)標(biāo)準(zhǔn)的所有其它頻率從輸入信號(hào)中抽取,并且從多階音調(diào)抽取器102(具體而言是分級(jí)濾波器組MDCT(256)最后一級(jí))在輸出線111上作為最后殘余信號(hào)在時(shí)域中輸出。多階音調(diào)抽取器102使用例如五階的重疊變換,從最大開始向下工作到最小,以通過(guò)基函數(shù)的使用檢測(cè)音調(diào)。對(duì)于取樣速率是44100Hz的音頻信號(hào),分別使用大小為8192、4096、2048、1024、及512的變換??蛇x擇其它變換尺寸。圖7用圖表示變換如何彼此重疊?;瘮?shù)由如下公式定義其中Ai=振幅=(Rei'Rei+InvInii)-(Rei+1.Rei+1+Imi+1'Imi+1)t-時(shí)間(teN是正整數(shù)值)1=關(guān)于功率為2的變換尺寸(le512、1024、…、8192)f-頻率<formula>complexformulaseeoriginaldocumentpage21</formula>在每個(gè)變換尺寸處檢測(cè)的音調(diào)使用由本發(fā)明的譯碼器使用的相同譯碼過(guò)程被局部譯碼,下文將描述。這些局部譯碼音調(diào)被相位轉(zhuǎn)換,并且通過(guò)時(shí)域求和與原始輸入信號(hào)相組合,以形成傳到HFB的下次迭代或水平的殘余信號(hào)。來(lái)自掩碼計(jì)算器101的掩碼水平和來(lái)自多階音調(diào)抽取器102的音調(diào)清單輸入到音調(diào)選擇器103。音調(diào)選擇器103首先把從多階音調(diào)抽取器102提供給它的音調(diào)清單通過(guò)對(duì)掩碼計(jì)算器101提供的掩碼水平相對(duì)功率而分類。它然后使用迭代過(guò)程,以確定哪些音調(diào)分量將裝入主位流中的編碼數(shù)據(jù)的幀中。幀中可用于音調(diào)分量的空間量取決于縮放之前預(yù)定的編碼主位流的數(shù)據(jù)速率。如果把整個(gè)幀分配給音調(diào)分量,那么不進(jìn)行殘余編碼。一般地,適用數(shù)據(jù)速率的一部分被分配給音調(diào)分量,剩余部分(負(fù)開銷)保留給殘余分量。對(duì)于多通道信號(hào)適當(dāng)?shù)剡x擇通道組,并且在每個(gè)通道組內(nèi)根據(jù)諸如對(duì)于感覺質(zhì)量的貢獻(xiàn)之類的度量辨別初級(jí)/次級(jí)通道。選擇音調(diào)分量?jī)?yōu)選地使用差分編碼被存儲(chǔ)。對(duì)于立體聲音頻,兩位字段指示初級(jí)和次級(jí)通道。對(duì)于初級(jí)和次級(jí)通道,分別存儲(chǔ)振幅/相位和差分振幅/相位。對(duì)于多通道音頻,初級(jí)通道存儲(chǔ)有其振幅和相位,并且對(duì)于包括的次級(jí)通道,對(duì)于具有差分振幅/相位的所有次級(jí)通道存儲(chǔ)有位-掩碼(見圖9)。位-掩碼指示哪些其它通道與初級(jí)通道聯(lián)合編碼,并且對(duì)于初級(jí)通道中的每個(gè)音調(diào)分量,被存儲(chǔ)在位流中。在這種迭代過(guò)程期間,確定不裝入幀中的音調(diào)分量的一些或全部可以轉(zhuǎn)換回時(shí)域中,并且與殘余信號(hào)111相組合。如果,例如數(shù)據(jù)速率足夠高,那么典型地所有未選擇音調(diào)分量被重新組合。然而,如果數(shù)據(jù)速率較低,則較強(qiáng)'未選擇,音調(diào)分量適當(dāng)?shù)嘏懦跉堄嘀?。已?jīng)發(fā)現(xiàn)這會(huì)改進(jìn)較低數(shù)據(jù)速率下的感覺質(zhì)量。由信號(hào)110代表的未選擇音調(diào)分量經(jīng)局部譯碼器104被局部譯碼以把它們轉(zhuǎn)換回到線114上的時(shí)域中,并且在組合器105中與來(lái)自多階音調(diào)抽取器102的殘余信號(hào)111相組合以形成組合殘佘信號(hào)113。注意,在114和111上出現(xiàn)的信號(hào)都是時(shí)域信號(hào),從而這種組合過(guò)程可容易地實(shí)現(xiàn)。組合殘余信號(hào)113由殘余編碼器107進(jìn)一步處理。由殘余編碼器107進(jìn)行的第一動(dòng)作是通過(guò)濾波器組處理組合殘余信號(hào)113,該濾波器組把信號(hào)細(xì)分成臨界取樣時(shí)域頻率子帶。在優(yōu)選實(shí)施例中,當(dāng)分級(jí)濾波器組用來(lái)抽取音調(diào)分量時(shí),這些時(shí)間-樣本分量可直接從分級(jí)濾波器組讀出,由此消除對(duì)專用于殘余信號(hào)處理的第二濾波器組的需要。在這種情況下,如圖21中所示,組合器104處理分級(jí)濾波器組的最后級(jí)(MDCT(256))的輸出,以在計(jì)算IMDCT2106之前把'未選擇,的譯碼的音調(diào)分量114與殘余信號(hào)111相組合,這產(chǎn)生子帶時(shí)間-樣本(也見圖7步驟3906、3908及3910)。然后進(jìn)行進(jìn)一步分解、量化及排列這些子帶到心理相關(guān)順序。殘余分量(時(shí)間-樣本和縮放因子)使用聯(lián)合通道編碼被適當(dāng)?shù)鼐幋a,在該聯(lián)合通道編碼中,時(shí)間-樣本由網(wǎng)格G代表,并且縮放因子由網(wǎng)格G0、Gl代表(見圖11)。殘余信號(hào)的聯(lián)合編碼使用施加到通道組上的部分網(wǎng)格,該部分網(wǎng)格代表在初級(jí)與次級(jí)通道組之間的信號(hào)能量比值。通過(guò)交叉相關(guān)、或其它度量來(lái)選擇諸個(gè)組(動(dòng)態(tài)地或靜態(tài)地)。多于一個(gè)通道可被組合,并且用作初級(jí)通道(例如,L+R初級(jí)、C次級(jí))。在時(shí)間/頻率維度上使用縮放因子網(wǎng)格部分GO、Gl是新穎的,當(dāng)施加到這些多通道組上時(shí),并且多于一個(gè)次級(jí)通道能與給定初級(jí)通道相關(guān)。各個(gè)網(wǎng)格元素和時(shí)間樣本按頻率排序,使較低頻率排列得較高。網(wǎng)格根據(jù)位速率排序。次級(jí)通道信息以比初級(jí)通道信息低的優(yōu)先級(jí)被排列。代碼串發(fā)生器108在線120上從音調(diào)選擇器103以及在線122上從殘余編碼器107取得輸入,并且使用本技術(shù)中熟知的熵編碼把來(lái)自這兩個(gè)輸入的值編碼成位流124。位流格式化器109保證來(lái)自音調(diào)選擇器103和殘余編碼器107的心理聲學(xué)元素在通過(guò)代碼串發(fā)生器108被編碼之后,出現(xiàn)在主位流126中的適當(dāng)位置中。'排列,通過(guò)不同分量的排序隱含地包括在主位流中。22縮放器(scaler)115從編碼器產(chǎn)生的主位流126的每個(gè)幀中消除足夠數(shù)量的最低排序編碼分量,以形成具有小于或近似等于希望數(shù)據(jù)速率的數(shù)據(jù)速率的縮放位流116。分級(jí)濾波器組多階音調(diào)抽取器102優(yōu)選地使用'修改的,分級(jí)濾波器組以提供多分辨率時(shí)間/頻率分辨率,從該多分辨率時(shí)間/頻率分辨率可有效地抽取音調(diào)分量和殘余分量。HFB依次按較低頻率分辨率把輸入信號(hào)分解成變換系數(shù),并且在每次依次迭代下,以連續(xù)地較精細(xì)時(shí)間縮放分辨率分解回成時(shí)域子帶樣本。由分級(jí)濾波器組產(chǎn)生的音調(diào)分量與由多重重疊FFT產(chǎn)生的那些精確相同,但計(jì)算負(fù)擔(dān)小得多。分級(jí)濾波器組通過(guò)并行地、同時(shí)地分析不同時(shí)間/頻率分辨率下的輸入信號(hào),解決模型化人類聽覺系統(tǒng)的不相等時(shí)間/頻率分辨率的問題,實(shí)現(xiàn)幾乎任意時(shí)間/頻率分解。分級(jí)濾波器組利用在已知分解中沒有發(fā)現(xiàn)的在內(nèi)變換中的加窗和重疊-添加步驟。這個(gè)步驟和窗口函數(shù)的新穎設(shè)計(jì)允許在這種結(jié)構(gòu)在任意樹中迭代以實(shí)現(xiàn)所希望的分解,并且能以信號(hào)-自適應(yīng)方式進(jìn)行。如圖21中所示,單通道編碼器2100在每次迭代2101a、…2101e從變換系數(shù)抽取音調(diào)分量,在音調(diào)清單2106中量化和存儲(chǔ)抽取的音調(diào)分量。下面討論用于多通道信號(hào)的音調(diào)和殘余信號(hào)的聯(lián)合編碼。在每次迭代處,時(shí)域輸入信號(hào)(殘余信號(hào))被加窗2107,并且N-點(diǎn)MDCT被應(yīng)用2108以產(chǎn)生變換系數(shù)。音調(diào)從變換系數(shù)抽取2109,被量化2110,及添加到音調(diào)清單上。選擇的音調(diào)分量被局部譯碼2111,并且在進(jìn)行逆變換2113以前從變換系數(shù)減去2112,以產(chǎn)生形成用于HFB的下次迭代的殘余信號(hào)2114的時(shí)域子帶樣本。具有比HFB的最后迭代較更低的頻率分辨率的最后逆變換2115在最后組合殘余113上進(jìn)行,并加窗2116以抽取殘余分量G2117。如上述的那樣,《壬何'未選擇,音調(diào)被局部譯碼104,并且在最后逆變換的計(jì)算之前與殘余信號(hào)1〗1組合105。殘余分量包括在2118和2119中從網(wǎng)格G抽取的時(shí)間-樣本分量(網(wǎng)格G)和縮放-因子分量(網(wǎng)格GO、Gl)。網(wǎng)格G被重新計(jì)算2120,并且網(wǎng)格G和G1被量化2121、2122。下面描述網(wǎng)格G、G1及G0的計(jì)算。在音調(diào)清單上的量化音調(diào)、網(wǎng)格G及縮放因子網(wǎng)格Gl都被編碼,并且放置在主位流中。在每次迭代從輸入信號(hào)的除去選擇音調(diào)和最后逆變換的計(jì)算是音頻編碼器對(duì)HFB所施加的^"改。在音頻編碼中的基本挑戰(zhàn)是建模人類感覺的時(shí)間/頻率分辨率。瞬態(tài)信號(hào),如鼓掌聲,要求在時(shí)域中的高分辨率,而諧波信號(hào),如號(hào)聲,要求在頻域中的高分辨率,以由編碼位流準(zhǔn)確地表示。但熟知的原理是,時(shí)間和頻率分辨率彼此互逆,并且單一變換在兩個(gè)域中不能同時(shí)呈現(xiàn)高精度。有效音頻編碼/譯碼器(codec)的設(shè)計(jì)要求在時(shí)間和頻率分辨率之間平衡這種折衷。對(duì)于這個(gè)問題的已知解決方案是利用窗口切換,使變換尺寸適應(yīng)輸入信號(hào)的瞬態(tài)本質(zhì)(見K.Brandenburg等的"TheISO-MPEG-AudioCodec:AGenericStandardforCodingofHighQualityDigitalAudio",JournalofAudioEngineeringSociety,Vol,42,No.l0,1994年10月)。分析窗口大小的這種自適應(yīng)引入額外的復(fù)雜性,并且要求在輸入信號(hào)中檢測(cè)瞬態(tài)事件。為了管理算法的復(fù)雜性,現(xiàn)有技術(shù)的窗口切換方法典型地把不同窗口大小的數(shù)量限制到兩個(gè)。在這里討論的分級(jí)濾波器組通過(guò)并行地提供多重時(shí)間/頻率分辨率的濾波器組表示/處理輸入信號(hào),避免對(duì)于信號(hào)/聽覺特性的這種粗調(diào)。有多種稱作混合濾波器組的濾波器組,它們把輸入信號(hào)分解成給定時(shí)間/頻率表示。例如,在ISO/IEC11172-3中描述的MPEGLayer3算法,利用在每個(gè)子帶中跟隨有MDCT變換的Pseudo-QuadratureMirroFilterbank(偽正交鏡像濾波器組)。在我們的分級(jí)濾波器組中,我們利用諸如MDCT之類的變換,跟隨有對(duì)于譜線組的逆變換(例如,IMDCT),以進(jìn)行輸入信號(hào)的靈活的時(shí)間/頻率變換。不像混合濾波器組,分級(jí)濾波器組使用來(lái)自兩個(gè)連續(xù)、重疊的外變換以計(jì)算'重疊,內(nèi)變換。借助于分級(jí)濾波器組有可能在第一變換的頂部上聚集多于一個(gè)變換。這借助于現(xiàn)有技術(shù)濾波器組(例如,樹狀濾波器組)也是可能的,但是由于隨水平數(shù)量增大的頻域分離快速退化,這是不實(shí)際的。分級(jí)濾波器組以某種時(shí)域退化為代價(jià)避免這種頻域退化。然而,這種時(shí)域退化可通過(guò)窗口形狀的適當(dāng)選擇而控制。借助于適當(dāng)分析窗口的選擇,也可使內(nèi)變換系數(shù)相對(duì)于等于內(nèi)變換尺寸(不像常規(guī)手段中那樣等于最外變換的大小)的時(shí)間移位而不變。供分級(jí)濾波器組之用的、這里稱作"ShmunkWindow"的適當(dāng)窗口W(x)由如下定義<formula>complexformulaseeoriginaldocumentpage25</formula>其中x是時(shí)域樣本指數(shù)(0<x<=L),并且L是在樣本中窗口的長(zhǎng)度。與普通使用Kaiser-Bessel導(dǎo)出窗口2602相比較的Shmunk窗口的頻率響應(yīng)2603表示在圖2a中??煽吹絻蓚€(gè)窗口在形狀方面相類似,但旁瓣衰減對(duì)于所提出的窗口較大。Shmunk窗口的時(shí)域響應(yīng)2604表示在圖2b。具有提供時(shí)間/頻率分解的一般適用性的分級(jí)濾波器組示出在圖3和4。如以上描述的那樣,為了用在音頻編碼/譯碼器中,HFB必須修改。在圖3中,在每條虛線處的數(shù)量代表在每個(gè)水平下的相等間隔的頻率倉(cāng)(frequencybins)的數(shù)量(盡管不計(jì)算所有這些倉(cāng))。向下箭頭代表得到N/2個(gè)子帶的N-點(diǎn)MDCT變換。向上箭頭代表IMDCT,取N/8個(gè)子帶并且把它們變換成一個(gè)子帶中的N/4個(gè)時(shí)間樣本。每個(gè)方塊代表一個(gè)子帶。每個(gè)矩形代表N/2個(gè)子帶。分級(jí)濾波器組完成如下步驟(a)如圖5a中所示,輸入信號(hào)樣本2702緩存到N樣本27(M的幀中,并且每個(gè)幀乘以N-樣本窗口函數(shù)(圖5b)2706以產(chǎn)生N窗口樣本2708(圖5c)(步驟2900);(b)如圖3中所示,N-點(diǎn)變換(在圖3中由向下箭頭2802代表)施加到加窗樣本2708上,以產(chǎn)生N/2變換系數(shù)2804(步驟"02);(c)可選的環(huán)形(ringing)減小通過(guò)施加一個(gè)或多個(gè)相鄰變換系數(shù)的線性組合,其中通過(guò)應(yīng)用變換系數(shù)2804的一個(gè)或多個(gè)(步驟2904);(d)N/2變換系數(shù)2804劃分成P組Mi系數(shù),從而Mi系數(shù)之和是N/2();<formula>complexformulaseeoriginaldocumentpage26</formula>(e)對(duì)于P組的每一個(gè),(2*Mi)-點(diǎn)逆變換(在圖3中由向上箭頭2806代表)施加到變換系數(shù)上以由每個(gè)組產(chǎn)生(2*Mi)子帶樣本(步驟2906);(d)在每個(gè)子帶中,(2*Mi)子帶樣本乘以(2*Mi)-點(diǎn)窗口函數(shù)2706(步驟2908);(e)在每個(gè)子帶中,Mi個(gè)先前樣本被重疊,并且添加到對(duì)應(yīng)的當(dāng)前值上,以對(duì)于每個(gè)子帶產(chǎn)生Mi新樣本(步驟2910);(f)把N設(shè)置成等于以前的Mi,并且選擇用于P和Mi的新值,及(g)使用用于N的連續(xù)地較小的變換尺寸對(duì)Mi個(gè)新樣本的子帶的一個(gè)或多個(gè)重復(fù)以上步驟(步驟2912),直到實(shí)現(xiàn)希望的時(shí)間/變換分辨率(步驟2914)。注意,步驟可以迭代到所有子帶,僅最低子帶或其任何希望組合。如杲對(duì)于所有子帶迭代步驟,則HFB是均勻的,否則它是不均勻的。圖3的和以上描述的濾波器組實(shí)施的頻率響應(yīng)3300曲線圖表示在圖6中,其中N=128,Mi^6及P-4,并且對(duì)于在每一級(jí)的最低兩個(gè)子帶迭代步驟。對(duì)這種分級(jí)濾波器組的潛在應(yīng)用可超出音頻范圍,到視頻和其它類型的信號(hào)(例如,地震、醫(yī)學(xué)、其它時(shí)間-序列信號(hào))的處理。視頻編碼和壓縮對(duì)于時(shí)間/頻率分解具有類似要求,并且由分級(jí)濾波器組提供的分解的任意本質(zhì)相對(duì)于基于離散余弦變換(DiscreteCosineTransform)和小波分解(Waveletdecomposition)的當(dāng)前4支術(shù)狀態(tài)技術(shù)可以具有顯著優(yōu)點(diǎn)。在分析和處理地震或機(jī)械測(cè)量、生物醫(yī)學(xué)信號(hào)處理、自然或生理信號(hào)、語(yǔ)音、或其它時(shí)間序列信號(hào)的分析和處理時(shí)也可以應(yīng)用濾波器組。頻域信息可從在每次迭代在依次的較低頻率分辨率下產(chǎn)生的變換系數(shù)抽取。同樣時(shí)域信息可從在每次迭代在依次的較精細(xì)時(shí)間縮放下產(chǎn)生的時(shí)域子帶樣本抽取。分級(jí)濾波器組均勻間隔子帶圖7表示分級(jí)濾波器組3900的典型實(shí)施例的方塊圖,其實(shí)施了均勻間隔的子帶濾波器組。對(duì)于均勻級(jí)濾波器組Mi=M=N/(2*P)。輸入信號(hào)到子帶信號(hào)3914的分解在下面描述1.輸入時(shí)間窗口3902在N點(diǎn)、50%重疊幀3904中加窗。2.對(duì)于每個(gè)幀進(jìn)行N點(diǎn)MDCT3卯6。3.把生成的MDCT系數(shù)分組成P組3908,每組M系數(shù)。4.對(duì)于每一組進(jìn)行(2*1\1)點(diǎn)IMDCT3910,以形成(2*]\1)子帶時(shí)間樣本3911。5.生成的時(shí)間樣本3911在(2*1^)點(diǎn)、50%重疊幀中加窗,并且重疊添加(OLA)3912以在每個(gè)子帶中形成M個(gè)時(shí)間樣本3914。在典型實(shí)施例中,N=256、P=32、及M=4。注意,不同的變換尺寸和對(duì)于N、P、及M的不同選擇代表的子帶分組也可用來(lái)實(shí)現(xiàn)希望的時(shí)間/頻率分解。分級(jí)濾波器組非均勻間隔子帶分級(jí)濾波器組3000的另一個(gè)實(shí)施例表示在圖8a和8b中。在這個(gè)實(shí)施例中,一些濾波器組級(jí)是不完整的以產(chǎn)生具有三個(gè)不同頻率范圍的變換,在每個(gè)范圍中使變換系數(shù)代表不同的頻率分辨率。使用一系列級(jí)聯(lián)單-元件濾波器組把時(shí)域信號(hào)分解成這些變換系數(shù)。詳細(xì)濾波器組元件可以被迭代多次,以產(chǎn)生希望的時(shí)間/頻率分解。注意,用于緩沖器大小、變換尺寸及窗口大小的數(shù)值、和用于變換的MDCT/IMDCT的使用僅用于典型實(shí)施例,并且不限制本發(fā)明的范圍。也可以使用其它緩沖器窗口和變換尺寸及其它變換類型。一般地,Mi彼此不同,但滿足Mi之和等于N/2的約束條件。圖8b中所示,單個(gè)濾波器組元件緩沖器3022輸入樣本3020以形成256個(gè)樣本的緩沖器3024,該256個(gè)樣本的緩沖器通過(guò)把樣本乘以256-樣本窗口函數(shù)加窗3026。加窗樣本3028經(jīng)256-點(diǎn)MDCT3030變換以形成128個(gè)變換系數(shù)3032。在這128個(gè)系數(shù)中,96個(gè)最高頻率系數(shù)為了輸出3037被選擇3034,并且被進(jìn)一步處理。32個(gè)最低頻率系數(shù)然后逆變換3042以產(chǎn)生64個(gè)時(shí)域樣本,該時(shí)域樣本然后加窗3044成樣本3046,并且與以前輸出幀重疊-添加3048,以產(chǎn)生32個(gè)輸出樣本3050。在8a中表示的例子中,濾波器組包括一個(gè)濾波器組元件3004,對(duì)于256個(gè)樣本的輸入緩沖器大小迭代一次,該濾波器組元件3004之后有一個(gè)濾波器組元件3010,也對(duì)于256個(gè)樣本輸入緩沖器大小迭代。最后一級(jí)3016代表簡(jiǎn)略的單個(gè)濾波器組元件,并且僅包括緩沖3016、加窗3026、及MDCT3030步驟,以輸出代表0-1378Hz的最低頻率范圍的128個(gè)頻域系數(shù)。因而,假定輸入3002具有44100Hz的樣本速率,表示的濾波器組產(chǎn)生在"Outl,,處代表頻率范圍5513至22040Hz的96個(gè)系數(shù)3008、在"Out2,,處代表頻率范圍1379至5512Hz的96個(gè)系數(shù)3014、及在"Out3"處代表頻率范圍0至1378Hz的128個(gè)系數(shù)3018。應(yīng)該注意,對(duì)于頻率變換/逆變換的MDCT/IMDCT的使用是示范性的,并且其它時(shí)間/頻率變換可用作本發(fā)明的部分。用于變換尺寸的其它數(shù)值是可能的,并且對(duì)于這種手段,通過(guò)選擇性地?cái)U(kuò)展上述層級(jí)中的任何分支,其它分解是可能的。音調(diào)和殘余分量的多通道聯(lián)合編碼在圖1中的音調(diào)選擇器103把來(lái)自掩碼計(jì)算器101的數(shù)據(jù)和來(lái)自多階音調(diào)抽取器102的音調(diào)清單取作輸入。音調(diào)選擇器103首先相對(duì)于來(lái)自掩碼計(jì)算器IOI的掩碼水平通過(guò)相對(duì)功率分類音調(diào)清單,按心理聲學(xué)重要性形成排序。采用的公式由如下給出<formula>complexformulaseeoriginaldocumentpage28</formula>其中Af譜線振幅Mi,,-用于i掩碼子幀中的k譜線的掩碼水平1=按照掩碼子幀的基函數(shù)的長(zhǎng)度對(duì)于子幀進(jìn)行求和,其中語(yǔ)分量具有非零值。音調(diào)選擇器103然后使用迭代過(guò)程,以確定來(lái)自用于幀的分類音調(diào)清單的哪些音調(diào)分量將裝入位流中。在音調(diào)振幅在多于一個(gè)通道中大致相同的立體聲或多通道音頻信號(hào)中,只有全振幅和相位存儲(chǔ)在初級(jí)通道中;初級(jí)通道是具有用于音調(diào)分量的最高振幅的通道。具有類似音調(diào)特性的其它通道存儲(chǔ)與初級(jí)通道的差別。用于每個(gè)變換尺寸的數(shù)據(jù)包容多個(gè)子幀,覆蓋2個(gè)子幀的最小變換尺寸;第二4個(gè)子幀;第三8個(gè)子幀;第四16個(gè)子幀;及第五32個(gè)子幀。對(duì)于1個(gè)幀有16個(gè)子幀。音調(diào)數(shù)據(jù)按其中找到音調(diào)信息的變換尺寸分組。對(duì)于每種變換尺寸,如下的音調(diào)分量數(shù)據(jù)被量化、被熵-編碼及放置在位流中熵-編碼子幀位置、熵-編碼鐠位置、熵-編碼量化振幅、及量化相位。在多通道音頻的情況下,對(duì)于每個(gè)音調(diào)分量,把一個(gè)通道選作初級(jí)通道。哪個(gè)通道應(yīng)該是初級(jí)通道的確定可被固定,或者可以基于信號(hào)特性或感覺標(biāo)準(zhǔn)進(jìn)行。初級(jí)通道的通道號(hào)和其振幅和相位存儲(chǔ)在位流中。如圖9中所示,位-掩碼3602被存儲(chǔ),其指示其它通道的哪些包括所指示的音調(diào)分量,并因此應(yīng)該被編碼為次級(jí)通道。然后對(duì)于存在音調(diào)分量的每個(gè)次級(jí)通道,初級(jí)與次級(jí)振幅和相位之差>^皮熵-編碼和存儲(chǔ)。這個(gè)具體例子假定有7個(gè)通道,并且主通道是通道3。位-掩碼3602指示在次級(jí)通道1、4及5上音調(diào)分量的存在。沒有用于初級(jí)通道的位。多階音調(diào)抽取器102的輸出4211由在一個(gè)或多個(gè)分辨率下的MDCT系數(shù)的幀組成。音調(diào)選擇器103基于音調(diào)分量與譯碼信號(hào)質(zhì)量的相關(guān)性,確定哪些音調(diào)分量可保持以便由代碼串發(fā)生器108插入到位流輸出幀中。確定不裝入幀中的那些音調(diào)分量輸出IIO到局部譯碼器104。局部譯碼器104取出音調(diào)選擇器103的輸出110,并且通過(guò)添加借助于來(lái)自查閱表(圖20)的合成系數(shù)2000縮放的每個(gè)音調(diào)分量合成所有音調(diào)分量,以產(chǎn)生MDCT系數(shù)的幀(見圖16)。這些系數(shù)在組合器105中添加到多階音調(diào)抽取器102的輸出111上,以在分級(jí)濾波器組的最后迭代的MDCT分辨率下產(chǎn)生殘余信號(hào)113。如圖10中所示,每個(gè)通道的殘余信號(hào)113在圖7中表示的加窗和重疊添加3904和IMDCT3910的步驟以前,傳到殘余編碼器107作為分級(jí)濾波器組3900的MDCT系數(shù)3908。IMDCT3910、加窗和重疊添加3912的后續(xù)步驟被進(jìn)行,以在時(shí)域中對(duì)每個(gè)通道產(chǎn)生32個(gè)相等間隔的臨界取樣頻率子帶3914。組成時(shí)間-樣本分量的32個(gè)子帶稱作網(wǎng)格G。注意,編碼器中可使用分級(jí)濾波器組的其它實(shí)施例以實(shí)現(xiàn)除以上述一種之外的不同時(shí)間/頻率分解,并且其它變換可用來(lái)抽取音調(diào)分量。如果分級(jí)濾波器組不用來(lái)抽取音調(diào)分量,則可使用另一種形式的濾波器組以抽取子帶,但有較高計(jì)算負(fù)擔(dān)。對(duì)于立體聲或多通道音頻,在通道選擇塊501中進(jìn)行幾種計(jì)算以確定用來(lái)編碼音調(diào)分量的初級(jí)和次級(jí)通道、以及用來(lái)編碼音調(diào)分量的方法(例如,左-右、或中部-側(cè)部)。如圖11中所示,通道分組過(guò)程3702首先確定多個(gè)通道的哪些可以聯(lián)合編碼,并且所有通道形成組,最后的組可能是不完整的。分組由聽眾的感覺標(biāo)準(zhǔn)和編碼效率確定,并且通道組可以由多于兩個(gè)通道的組合建造(例如,包括L、R、Ls、Rs及C通道的5通道信號(hào)可以分組成(L、R}、{Ls、Rs}、{L+R、C}。然后通道組排序成初級(jí)和次級(jí)通道。在典型多通道實(shí)施例中,基于在幀上通道的相對(duì)功率進(jìn)行初級(jí)通道的選擇。如下公式定義相對(duì)功率<formula>complexformulaseeoriginaldocumentpage30</formula>如在圖11的步驟3704中所示,也確定分組模式。音調(diào)分量可以編碼為左-右、或中部-側(cè)部表示,或者這個(gè)步驟的輸出可以只得到單個(gè)初級(jí)通道,如由虛線表示的那樣。在左-右表示中,對(duì)于子帶具有最高功率的通道當(dāng)作初級(jí),并且如果右通道是最高功率的通道,則在位流3706中設(shè)置用于該子帶的單個(gè)位。如果子帶滿足如下條件則對(duì)于子帶使用中部-側(cè)部編碼Pm>2Ps對(duì)于多通道信號(hào),對(duì)于每個(gè)通道組完成以上操作。對(duì)于立體聲信號(hào),網(wǎng)格計(jì)算502提供立體聲全聲(panning)網(wǎng)格,在該立體聲全聲網(wǎng)格中可粗略地建造立體聲全聲并且施加到殘余信號(hào)上。立體聲網(wǎng)格是被4個(gè)時(shí)間間隔的4個(gè)子帶,在立體聲網(wǎng)格中的每個(gè)子帶覆蓋來(lái)自濾波器組500的輸出的4個(gè)子帶和32個(gè)樣本,從高于3kHz的頻帶開始。其它網(wǎng)格大小、覆蓋的頻率子帶、及時(shí)間劃分可被選擇。在立體聲網(wǎng)格中單元的值是給定通道的功率與初級(jí)通道的功率的比值,用于單元覆蓋的值的范圍。比值然后被量化到與用來(lái)編碼音調(diào)分量的表格相同的表格。對(duì)于多通道信號(hào),對(duì)每個(gè)通道組計(jì)算以上立體聲網(wǎng)格。對(duì)于多通道信號(hào),網(wǎng)格計(jì)算502提供多重縮放因子網(wǎng)格,每個(gè)通道組一個(gè),該多重縮放因子網(wǎng)格按它們?cè)诳臻g域中的心理聲學(xué)重要性的順序插入到位流中。計(jì)算給定通道的功率與4子帶乘32樣本的每個(gè)組的初級(jí)通道的功率的比值。這個(gè)比值然后被量化,并且這個(gè)量化值加上功率比值的算法符號(hào)插入到位流中??s放因子網(wǎng)格計(jì)算503計(jì)算網(wǎng)格G1,其放置在位流中?,F(xiàn)在描述用來(lái)計(jì)算網(wǎng)格G1的方法。首先從G導(dǎo)出GO。GO包含所有32個(gè)子帶但只有G的時(shí)間分辨率的一半。在GO中的單元的內(nèi)容是來(lái)自G的給定子帶的兩個(gè)相鄰值的最大值的量化值。使用相同修改對(duì)數(shù)量化表格進(jìn)行量化(在如下公式中稱作Quantize),如用來(lái)在多階音調(diào)抽取器102中編碼音調(diào)分量那樣。在GO中的每個(gè)單元因而由如下確定G0m,n=(Quantize(Maximun(Gm,2n,Gm,2n+i))ne[xFreql+=CurrentAmplitude*siii(2*Pi*Phase/8);ImliHxFreqI+=CurrentAmplitude*cos(2*Pi*Phase/8);Re[inxFreq+lj+=CurrentAmplitude*sin(2*Pi*Phase/8);Im[iHxFreq+ll+=CurrentAmplitude*cos(2*Pi*Phase/8);其中Amplitude、Freq及Phase與以前定義相同。Group是代表基函數(shù)變換尺寸的數(shù),l用于最小變換并且5用于最大。length是用于Group的子幀,并且由如下給定length=2A(Group-l)。>>是右移算子。CurrentAmplitude和CurrentPhase對(duì)于下一個(gè)子幀被存儲(chǔ)oEnvelope[Gro叩I[iI是用于每個(gè)組的適當(dāng)長(zhǎng)度(length)的三角形包,在任一端處是零值并且在中部中是l值。經(jīng)上述方法在最大三個(gè)變換尺寸中的較低頻率的重新合成,引起輸出音頻中的可聽到失真,因此如下基于經(jīng)驗(yàn)的校正應(yīng)用于在組3、4、及5中比60小的譜線xFreq=Freq(Group-l);CurrentPhase=Phase-2*(2*xFreq+l);f—dlt=Freq-(xFreq《(Group-l));for(i=0;i<length;i=i+l)CurrentPhase+=2*(2*Freq+l)/length;CurrentAmplitude=Amplitude*Envelope[Group〗[i];Re—Amp=CurrentAmplitude*sin(2*Pi*Phase/8》Im—Amp=CurrentAmplitude*cos(2*Pi*Phase/8);aO=Re—Amp*CorrCf[fdlt;a3=ReAmp*CorrCf[fdlt][3;b3=Im—Amp*CorrCf[f—dlt[3;a4=Re—Amp*CorrCf[f—dlt[4;b4=Im—Amp*CorrCf[f一dlt][4;Re[i][abs(xFreq-2)-=a4;Im[il[abs(xFreq-2)I-=b4;Re[i[abs(xFreq-l)+=(a3-a0);Im[i[abs(xFreq-l)+=(b3-b0);Re[i[xFreq+=Re一Amp-a2-a3;Im[ij[xFreqj+=Im一Amp-b2-b3;Re卩〖xFreq+l+=al+a4-Re—Amp;Im[i][xFreq+l+=bl+b4-Im—Amp;Re[ij[xFreq+2j+=aO國(guó)al;Re[il[xFreq+3j+=a2;Imij[xFreq+31+=a2;其中Amplitude、Freq、Phase、Envelope[GroupI[i]、Group及l(fā)ength都如以前定義的那樣。CorrCf由表格2(圖20)給出。abs(val)是返回val的絕對(duì)值的函數(shù)。由于位流不包含關(guān)于編碼音調(diào)分量的數(shù)量的任何信息,所以譯碼器僅讀取用于每個(gè)變換尺寸的音調(diào)數(shù)據(jù),直到它用光用于該大小的數(shù)據(jù)。因而,外部裝置從位流除去的音調(diào)分量對(duì)于譯碼器處置仍包含在位流中的數(shù)據(jù)的能力沒有影響。從位流除去元素僅把音頻質(zhì)量降低所除去數(shù)據(jù)分量的量。音調(diào)塊也可被除去,在這種情況下,譯碼器對(duì)于該變換尺寸不進(jìn)行音調(diào)分量的任何重建工作。逆頻率變換604逆頻率變換604是用來(lái)在編碼器中創(chuàng)建頻域表示的逆變換。當(dāng)前實(shí)施例采用以上描述的逆分級(jí)濾波器組??商鎿Q地,逆FFT是被用來(lái)抽取編碼器的音調(diào)的最小FFT的逆變換,如果在譯碼時(shí)使用重疊FFT。殘余譯碼器602殘余譯碼器602的詳細(xì)方塊圖表示在圖18中。位流分析器600在線610上把Gl個(gè)元素從位流傳遞到網(wǎng)格譯碼器702。網(wǎng)格譯碼器702譯碼Gl以創(chuàng)建GO,其為32個(gè)頻率子帶乘64個(gè)時(shí)間間隔。位流包含量化Gl值和在這些值之間的距離。來(lái)自位流的Gl值使用與用來(lái)去量化音調(diào)分量振幅的相同的去量化表格被去量化。在來(lái)自位流的值之間的線性內(nèi)插得到用于每個(gè)Gl子帶的8個(gè)最后Gl振幅。Gl的子帶0和1被初始化為零,當(dāng)在位流中找到用于這兩個(gè)子帶的子帶信息時(shí),零值被替換。這些振幅然后使用從圖19中的表格1得到的映像權(quán)重1900加權(quán)成重新創(chuàng)建的GO網(wǎng)格。用于GO的一般公式由如下給出<formula>complexformulaseeoriginaldocumentpage43</formula>其中m是子帶號(hào)W是來(lái)自表格l的項(xiàng)n是GO列號(hào)k跨過(guò)11個(gè)Gl子帶去量化器700由位流分析器600求出的時(shí)間樣本在去量化器700中被去量化。去量化器700使用編碼器的逆過(guò)程去量化來(lái)自位流的時(shí)間樣本。來(lái)自子帶零的時(shí)間樣本被去量化到16個(gè)水平,子帶1和2到8個(gè)水平,子帶11至25到三個(gè)水平,及子帶26至31到2個(gè)水平。任何丟失或無(wú)效時(shí)間樣本用具有白噪音頻鐠能量分布的在-1至1的范圍中的偽隨機(jī)系列值替換。這改進(jìn)縮放位流音頻質(zhì)量,因?yàn)檫@樣一系列值具有比用零值替換更接近模擬原始信號(hào)的特性。通道多路分解器701在位流中的次級(jí)通道信息依據(jù)在位流中設(shè)置的標(biāo)志,被存儲(chǔ)作為一些子帶與初級(jí)通道的差別。對(duì)于這些子帶,通道多路分解器701從初級(jí)通道中的值以及位流中的差值恢復(fù)次級(jí)通道中的值。如果次級(jí)通道信息遺失該位流,則通過(guò)把初級(jí)通道信息復(fù)制到次級(jí)通道并使用立體聲網(wǎng)格可從初級(jí)通道粗略地恢復(fù)次級(jí)通道信息,這在以后討論。通道重建706當(dāng)在位流中找不到次級(jí)通道信息(時(shí)間樣本)時(shí),立體聲重建706應(yīng)用于次級(jí)通道。網(wǎng)格譯碼器702重建的立體聲網(wǎng)格被應(yīng)用于通過(guò)復(fù)制初級(jí)通道時(shí)間樣本信息而恢復(fù)的次級(jí)時(shí)間樣本,以保持通道之間的原始立體聲功率比值。多通道重建當(dāng)在位流中不存在用于次級(jí)通道的次級(jí)信息(時(shí)間樣本或網(wǎng)格)時(shí),多通道重建706應(yīng)用于次級(jí)通道。過(guò)程與立體聲重建706類似,不同之處在于,由網(wǎng)格譯碼器702重建的部分網(wǎng)格應(yīng)用于在每個(gè)通道組內(nèi)、通過(guò)復(fù)制初級(jí)通道時(shí)間樣本信息恢復(fù)的次級(jí)通道的時(shí)間樣本,以保持在次級(jí)通道中的適當(dāng)功率水平。部分網(wǎng)格分別應(yīng)用于重建通道組中的每個(gè)次級(jí)通道,接著在縮放步驟703中由包括網(wǎng)格GO的其它縮放因子網(wǎng)格縮放,其中把網(wǎng)格G的時(shí)間樣本乘以用于每個(gè)次級(jí)通道的部分網(wǎng)格的對(duì)應(yīng)元素。部分網(wǎng)格網(wǎng)格GO可以按與本發(fā)明一致的任何順序被施加。盡管已經(jīng)表示和描述了本發(fā)明的幾個(gè)說(shuō)明性實(shí)施例,但對(duì)于本領(lǐng)域的技術(shù)人員將想到多種變更和可選擇實(shí)施例。這樣的變更和可選擇實(shí)施例被預(yù)料到,并且可進(jìn)行而不脫離在附屬權(quán)利要求書中所定義的本發(fā)明的精神和范圍。權(quán)利要求1.一種編碼輸入信號(hào)的方法,包括使用分級(jí)濾波器組(HFB)(2101a、...2101e)把輸入信號(hào)(100)分解成多分辨率時(shí)間/頻率表示;在多重頻率分辨率下從所述時(shí)間/頻率表示抽取音調(diào)分量(2109);從所述時(shí)間/頻率表示抽取殘余分量(2117、2118、2119);基于分量對(duì)于譯碼信號(hào)質(zhì)量的相對(duì)貢獻(xiàn)排序所述分量(103、107、109);量化并編碼所述分量(102、107、108);及消除足夠數(shù)量的最低排序編碼分量(115),以形成具有小于或近似等于希望數(shù)據(jù)速率的數(shù)據(jù)速率的縮放位流(116)。2.根據(jù)權(quán)利要求1所述的方法,其中,通過(guò)在不同頻率分辨率下首先把音調(diào)分量分組成至少一個(gè)頻率子域(903、904、905、906、907)并且在不同的時(shí)間縮放和/或頻率分辨率下把殘余分量分組成至少一個(gè)殘余子域(908、909、910)、基于子域?qū)τ谧g碼信號(hào)質(zhì)量的相對(duì)貢獻(xiàn)排序子域及基于分量對(duì)于譯碼信號(hào)質(zhì)量的相對(duì)貢獻(xiàn)排序每個(gè)子域內(nèi)的分量,來(lái)排序所述分量。3.根據(jù)權(quán)利要求2所述的方法,還包括形成主位流(126),在該主位流中,子域和在每個(gè)子域內(nèi)的分量是基于它們的排序而排列(109),通過(guò)從最低排序子域中的最低排序分量開始并且依次消除分量而消除所述低排序分量,直到實(shí)現(xiàn)所述希望數(shù)據(jù)速率(115)。4.根據(jù)權(quán)利要求1所述的方法,還包括形成主位流(126),其包括排序的量化分量(109),其中通過(guò)消除足夠數(shù)量的低排序分量來(lái)縮放主位流以形成縮放位流(115)。5.根據(jù)權(quán)利要求4所述的方法,其中,在具有所述希望數(shù)據(jù)速率作為約束條件的通道上記錄或傳輸所述縮放位流(116)。6.根據(jù)權(quán)利要求5所述的方法,其中,所述縮放位流(116)是多個(gè)縮放位流之一,并且獨(dú)立地控制每個(gè)各個(gè)位流的數(shù)據(jù)速率,其中約束條件是各個(gè)數(shù)據(jù)速率之和必須不超過(guò)最大總數(shù)據(jù)速率,在所有位流上根據(jù)譯碼信號(hào)質(zhì)量實(shí)時(shí)地動(dòng)態(tài)控制每個(gè)所述數(shù)據(jù)速率。7.根據(jù)權(quán)利要求1所述的方法,其中,從輸入信號(hào)與音調(diào)分量之間的殘余信號(hào)(113)導(dǎo)出殘余分量,從而也從殘余信號(hào)(2114)除去(2112)所述被消除以形成縮放位流的音調(diào)分量。8.根據(jù)權(quán)利要求1所述的方法,其中,殘余分量包括時(shí)間-樣本分量(2117)和縮放因子分量(2118、2119),縮放因子分量(2118、2119)在不同時(shí)間縮放和/或頻率分辨率下修改時(shí)間-樣本分量。9.根據(jù)權(quán)利要求8所述的方法,其中,時(shí)間-樣本分量由網(wǎng)格G代表(21H),并且縮放因子分量包括在多個(gè)時(shí)間縮放和頻率分辨率下的一系列一個(gè)或多個(gè)網(wǎng)格GO、Gl(2118、2119),其通過(guò)在時(shí)間/頻率平面中把網(wǎng)格g除以G0、Gl的網(wǎng)格元素而應(yīng)用于時(shí)間-樣本分量,每個(gè)網(wǎng)格G0、Gl具有不同數(shù)量的時(shí)間或頻率縮放因子。10.根據(jù)權(quán)利要求8所述的方法,其中,通過(guò)把兩維變換應(yīng)用于縮放因子分量并量化變換系數(shù),來(lái)編碼縮放因子(107)。11.根據(jù)權(quán)利要求10所述的方法,其中,所述變換是兩維離散余弦變換。12.根據(jù)權(quán)利要求1所述的方法,其中,HFB在依次迭代中在依次的較低頻率分辨率水平下把輸入信號(hào)分解成變換系數(shù),其中通過(guò)如下操作抽取所述音調(diào)和殘余分量在每次迭代從變換系數(shù)抽取音調(diào)分量(2109),量化(2110)并存儲(chǔ)抽取的音調(diào)分量在音調(diào)清單中(2106);從輸入信號(hào)除去音調(diào)分量(2111、2112),以把殘余信號(hào)(2114)傳到HFB的下次迭代;及把具有相比HFB的最后迭代更低的頻率分辨率的最后逆變換(2115)應(yīng)用于殘余信號(hào)(113),以抽取殘余分量U117)。13.根據(jù)權(quán)利要求12所述的方法,還包括在最后迭代之后從音調(diào)清單除去一些音調(diào)分量(114);和局部譯碼并逆量化(104)除去的量化音調(diào)分量(114),并把它們與最后迭代處的殘余信號(hào)(111)相組合(105)。14.根據(jù)權(quán)利要求13所述的方法,其中,至少一些從清單除去的相對(duì)較強(qiáng)音調(diào)分量不被局部譯碼和重組。15.根據(jù)權(quán)利要求12所述的方法,其中,在每個(gè)頻率分辨率下的音調(diào)分量由如下操作抽取(2109):通過(guò)應(yīng)用感覺模型辨別所希望的音調(diào)分量;選擇感覺最顯著的變換系數(shù);把每個(gè)選擇變換系數(shù)的參數(shù)存儲(chǔ)為音調(diào)分量,所述參數(shù)包括振幅、頻率、相位、以及對(duì)應(yīng)變換系數(shù)在幀中的位置;及量化并編碼(2110)每個(gè)音調(diào)分量的參數(shù)到音調(diào)清單中以用于插入到位流中。16.根據(jù)權(quán)利要求12所述的方法,其中,殘余分量包括表示為網(wǎng)格G(2117)的時(shí)間-樣本分量,殘余分量的抽取還包括建造不同時(shí)間/頻率分辨率的一個(gè)或多個(gè)縮放-因子網(wǎng)格(2118、2119),該縮放-因子網(wǎng)格的元素代表在時(shí)間/頻率區(qū)域中的最大信號(hào)值或信號(hào)能量;把時(shí)間-樣本網(wǎng)格G除以縮放-因子網(wǎng)格的對(duì)應(yīng)元素,以產(chǎn)生縮放時(shí)間樣本網(wǎng)格G(2120);及量化并編碼縮放時(shí)間-樣本網(wǎng)格G(2122)和縮放-因子網(wǎng)糾2121)以便插入到編碼位流中。17.根據(jù)權(quán)利要求1所述的方法,其中,輸入信號(hào)被分解,并且通過(guò)如下操作抽取音調(diào)和殘余分量,(a)把輸入信號(hào)的樣本緩存到N個(gè)樣本的幀中(2900);(b)把每個(gè)幀中的N個(gè)樣本乘以N-樣本窗口函數(shù)(2900);(c)施加N-點(diǎn)變換以產(chǎn)生N/2個(gè)原始變換系數(shù)(2902);(d)從N/2個(gè)原始變換系數(shù)抽取音調(diào)分量(2109),量化(2110)抽取的音調(diào)分量及把其存儲(chǔ)在音調(diào)清單中(2106);(e)通過(guò)逆量化減去音調(diào)分量,并且從原始變換系數(shù)減去生成的音調(diào)變換系數(shù)(2112),以給出N/2個(gè)殘余變換系數(shù);(f)把N/2個(gè)殘余變換系數(shù)劃分成P組Mj個(gè)系數(shù)(2906),從而Mi個(gè)系數(shù)之和是N/2(||乾=w/2;)(g)對(duì)P組的每一個(gè),把(2*Mi)點(diǎn)逆變換施加到殘余變換系數(shù),以從每個(gè)組產(chǎn)生(2*Mi)子帶樣本(2卯6);(h)在每個(gè)子帶,把2*!\^子帶樣本乘以2*1\^點(diǎn)窗口函數(shù)(2908);(i)在每個(gè)子帶,與Mi個(gè)先前樣本重疊并且添加對(duì)應(yīng)值,以對(duì)每個(gè)子帶產(chǎn)生Mi新樣本(2910);(j)使用依次的較小變換尺寸N對(duì)Mi新樣本的一個(gè)或多個(gè)子帶重復(fù)步驟(a)-(i)(2912),直到獲得希望的時(shí)間/變換分辨率(2914);及(k)在最后迭代為每個(gè)子帶輸出把具有較低頻率分辨率N的最后逆變換(2115)施加到Mi個(gè)新樣本,以產(chǎn)生子帶的網(wǎng)格G中的時(shí)間樣本的子帶和每個(gè)子帶中的多重時(shí)間樣本。18.根據(jù)權(quán)利要求1所述的方法,其中,輸入信號(hào)是多通道輸入信號(hào),每個(gè)所述音調(diào)分量通過(guò)形成所述通道的組被聯(lián)合編碼以及對(duì)于每個(gè)所述組,選擇初級(jí)通道和至少一個(gè)次級(jí)通道,該初級(jí)通道和次級(jí)通道通過(guò)位掩碼(3602)辨別,位掩碼的每個(gè)位辨別次級(jí)通道的存在,量化并編碼初級(jí)通道(102、108);及量化并編碼初級(jí)與每個(gè)次級(jí)通道之間的差(102、108)。19.根據(jù)權(quán)利要求18所述的方法,其中,基于指示哪種模式提供譯碼輸出信號(hào)中的希望數(shù)據(jù)速率的最小感覺失真的度量,選擇用于編碼每個(gè)通道組的聯(lián)合通道模式。20.根據(jù)權(quán)利要求1所述的方法,其中,輸入信號(hào)是多通道信號(hào),還包括從每個(gè)通道的輸入信號(hào)減去抽取的音調(diào)分量,以形成殘余信號(hào)(2109a、…2109e);把殘余信號(hào)的通道形成由感覺標(biāo)準(zhǔn)和編碼效率所確定的組(3702)j確定用于每個(gè)所述殘余信號(hào)組的初級(jí)和次級(jí)通道(3704);計(jì)算部分網(wǎng)格(508),以編碼每個(gè)殘余信號(hào)組中配對(duì)的每個(gè)初級(jí)/次級(jí)通道之間的相對(duì)空間信息(502);量化并編碼每個(gè)組中的初級(jí)通道的殘余分量作為相應(yīng)網(wǎng)格G(2210a);量化并編碼所述部分網(wǎng)格以減小所述要求的數(shù)據(jù)速率(2110a);及把編碼的部分網(wǎng)格和每組的網(wǎng)格G插入到縮放位流中(3706)。21.根據(jù)權(quán)利要求20所述的方法,其中,次級(jí)通道由一個(gè)或多個(gè)通道的線性組合而建造(3704)。22.—種編碼音頻輸入信號(hào)的方法,包括把音頻輸入信號(hào)(100)分解成多分辨率時(shí)間/頻率表示(2101a、…2101e);在每個(gè)頻率分辨率下抽取音調(diào)分量(2109);從時(shí)間/頻率表示中除去音調(diào)分量(2111、2112)以形成殘余信號(hào)(113);從殘余信號(hào)抽取殘余分量(2117、2118、2119);把音調(diào)分量分組成至少一個(gè)頻率子域(903、904、905、906、907);把殘余分量分組成至少一個(gè)殘余子域(908、909、910);基于心理聲學(xué)重要性排序子域(103、107、109);基于心理聲學(xué)重要性排序每個(gè)子域內(nèi)的分量(103、107、109);量化并編碼每個(gè)子域內(nèi)的分量(102、107、108);以及從最低排序子域開始消除足夠數(shù)量的低排序分量U15),以形成具有小于或近似等于希望數(shù)據(jù)速率的數(shù)據(jù)速率的縮放位流(116)。23.根據(jù)權(quán)利要求22所述的方法,其中,在不同頻率分辨率下把音調(diào)分量分組成多個(gè)頻率子域(卯3、904、905、906、907),并且所述殘余分量包括在不同頻率和/或時(shí)間分辨率下分組成多個(gè)殘余子域(908、909、910)的網(wǎng)格。24.根據(jù)權(quán)利要求22所述的方法,還包括形成主位流(126),在該主位流中,子域和在每個(gè)子域內(nèi)的分量基于它們的排序而排列,通過(guò)從最低排序子域中的最低排序分量開始并且按順序消除分量而消除所述低排序分量(115),直到實(shí)現(xiàn)所述希望數(shù)據(jù)速率。25.—種用來(lái)編碼輸入音頻信號(hào)和形成可縮放位流的可縮放位流編碼器,包括分級(jí)濾波器組(HFB)(2100),它在依次的較低頻率分辨率下把輸入音頻信號(hào)分解成變換系數(shù)(2108),并且在依次迭代中在依次較精細(xì)時(shí)間縮放下分解回時(shí)域子帶樣本(2114);音調(diào)編碼器(102),(a)在每次迭代處從變換系數(shù)抽取音調(diào)分量(2109),量化(2110)它們及把它們存儲(chǔ)在音調(diào)清單中(210",(b)從輸入音頻信號(hào)除去音調(diào)分量(2111、2112),以把殘余信號(hào)(2114b)傳到HFB的下次迭代,及(c)基于所有抽取音調(diào)分量對(duì)于譯碼信號(hào)質(zhì)量的相對(duì)貢獻(xiàn)而排序它們;殘余編碼器(107),它把具有比HFB(2101e)的最后迭代更低的頻率分辨率的最后逆變換(2115)應(yīng)用于最后殘余信號(hào)(113)以抽取殘余分量(2117、2118、2119),并且基于殘余分量對(duì)于譯碼信號(hào)質(zhì)量的相對(duì)貢獻(xiàn)排序它們;位流格式化器(109),它逐幀地組合音調(diào)和殘余分量,以形成主位流(126);及縮放器(115),它從主位流的每個(gè)幀消除足夠數(shù)量的最低排序編碼分量,以形成具有小于或近似等于希望數(shù)據(jù)速率的數(shù)據(jù)速率的縮放位流(116)。26.根據(jù)權(quán)利要求25所述的編碼器,其中,音調(diào)編碼器在不同頻率分辨率下把音調(diào)分量分組成頻率子域(903、卯4、卯5、卯6、907)并且排序每個(gè)子域的分量,殘余編碼器組在不同的時(shí)間縮放和/或頻率分辨率下把殘余分量分組成殘余子域(908、909、910)并且排序每個(gè)子域的分量,及所述位流格式化器基于子域?qū)τ谧g碼信號(hào)質(zhì)量的相對(duì)貢獻(xiàn)排序子域。27.根據(jù)權(quán)利要求26所述的編碼器,其中,位流格式化器基于子域和在每個(gè)子域內(nèi)的分量的排序而排列它們,所述縮放器(115)通過(guò)從最低排序子域中的最低排序分量開始并按順序消除分量而消除所述低排序分量,直到實(shí)現(xiàn)希望數(shù)據(jù)速率。28.根據(jù)權(quán)利要求25所述的編碼器,其中,輸入音頻信號(hào)是多通道輸入音頻信號(hào),所述音調(diào)編碼器通過(guò)形成所述通道組而聯(lián)合編碼每個(gè)所述音調(diào)分量以及對(duì)于每個(gè)所述組,選擇初級(jí)通道和至少一個(gè)次級(jí)通道,該初級(jí)通道和至少一個(gè)次級(jí)通道通過(guò)位掩碼(3602)被辨別,位掩碼的每個(gè)位辨別次級(jí)通道的存在;量化并編碼初級(jí)通道(102、108);及量化并編碼在初級(jí)與每個(gè)次級(jí)通道之間的差(102、108)。29.根據(jù)權(quán)利要求25所述的編碼器,其中,輸入信號(hào)是多通道音頻信號(hào),所述殘余編碼器,把殘佘信號(hào)的通道形成由感覺標(biāo)準(zhǔn)和編碼效率確定的組(3702);確定每個(gè)所述殘余信號(hào)組的初級(jí)和次級(jí)通道(3704);計(jì)算部分網(wǎng)格(508),以編碼每個(gè)殘余信號(hào)組中配對(duì)的每個(gè)初級(jí)/次級(jí)通道之間的相對(duì)空間信息(502);量化并編碼每個(gè)組中的初級(jí)通道的殘余分量作為相應(yīng)網(wǎng)格G(2210a);量化并編碼所述部分網(wǎng)格以減小所要求的數(shù)據(jù)速率(2110a);及把編碼的部分網(wǎng)格和每組的網(wǎng)格G插入到縮放位流中(3706)。30.根據(jù)權(quán)利要求25所述的編碼器,其中,殘余編碼器在多個(gè)時(shí)間縮放和頻率分辨率下抽取由網(wǎng)格G(2117)代表的時(shí)間-樣本分量和一系列一個(gè)或多個(gè)縮放因子網(wǎng)格GO、Gl(2118、2119),其通過(guò)在時(shí)間/頻率平面中把網(wǎng)格G除以G0、Gl的網(wǎng)格元素而應(yīng)用于時(shí)間-樣本分量(2120),每個(gè)網(wǎng)格GO、Gl具有不同數(shù)量的時(shí)間和/或頻率縮放因子。31.—種由編碼位流重建時(shí)域輸出信號(hào)的方法,包括接收具有給定范圍內(nèi)的預(yù)定數(shù)據(jù)速率的縮放位流(599)作為幀序列,每個(gè)幀包含如下的至少一個(gè)(a)代表輸入信號(hào)的不同頻率分辨率下的頻域內(nèi)容的多個(gè)量化音調(diào)分量(2407)、b)代表從重建音調(diào)分量與輸入信號(hào)之差形成的時(shí)域殘余的量化殘余時(shí)間-樣本分量(2403)、及c)代表殘余信號(hào)的信號(hào)能量的縮放因子網(wǎng)格(2404),該信號(hào)能量至少部分跨過(guò)輸入信號(hào)的頻率范圍;接收對(duì)于每個(gè)幀的關(guān)于量化分量和/或網(wǎng)格在頻率范圍內(nèi)的位置信息(599);把縮放位流的幀解析成分量和網(wǎng)格(600);譯碼任何音調(diào)分量以形成變換系數(shù)(2408);譯碼任何時(shí)間-樣本分量和任何網(wǎng)格(2401-2405);把時(shí)間-樣本分量乘以網(wǎng)格元素以形成時(shí)域樣本(2406);及把逆分級(jí)濾波器組(2400)應(yīng)用于變換系數(shù)(2407)和時(shí)域樣本(4002)以重建時(shí)域輸出信號(hào)(6H)。32.根據(jù)權(quán)利要求31所述的方法,其中時(shí)域樣本通過(guò)如下操作形成把位流解析成縮放因子網(wǎng)格Gl(2404)和時(shí)間樣本分量(2403);譯碼并逆量化網(wǎng)格G1縮放因子網(wǎng)格,以產(chǎn)生GO縮放因子網(wǎng)格(2405);以及譯碼并逆量化時(shí)間樣本分量,把這些時(shí)間樣本值乘以GO縮放因子網(wǎng)格(2406),以產(chǎn)生重建的時(shí)間樣本(4002)。33.根據(jù)權(quán)利要求32所述的方法,其中,信號(hào)是殘余通道已經(jīng)被分組和編碼的多通道信號(hào),每個(gè)所述幀也包含d)代表在通道組內(nèi)的殘余信號(hào)通道的信號(hào)能量比值的部分網(wǎng)格,還包括把位流分析成部分網(wǎng)格(508);譯碼并逆量化(2401)部分網(wǎng)格;及把重建時(shí)間-樣本乘以施加到通道組中的每個(gè)次級(jí)通道上的部分網(wǎng)格(508),以產(chǎn)生重建時(shí)域樣本。34.根據(jù)權(quán)利要求31所述的方法,其中,輸入信號(hào)是多通道,其中音調(diào)分量組包含一個(gè)初級(jí)和一個(gè)或多個(gè)次級(jí)通道,每個(gè)所述幀也包含e)與每組中的初級(jí)通道有關(guān)的位掩碼,在該位掩碼中,每個(gè)位辨別已經(jīng)與初級(jí)通道聯(lián)合編碼的次級(jí)通道的存在,把位流分析成位掩碼(3602);譯碼每個(gè)組中的初級(jí)通道的音調(diào)分量(601);譯碼每個(gè)組中的聯(lián)合編碼音調(diào)分量;對(duì)每個(gè)組,使用位掩碼從初級(jí)通道的音調(diào)分量和聯(lián)合編碼音調(diào)分量的音調(diào)分量重建每個(gè)所述次級(jí)通道的音調(diào)分量(601)。35.根據(jù)權(quán)利要求34所述的方法,其中,通過(guò)譯碼被熵-編碼并為存在音調(diào)分量的每個(gè)次級(jí)通道存儲(chǔ)的振幅及相位之間、初級(jí)和次級(jí)頻率之間的差別信息,來(lái)譯碼次級(jí)通道音調(diào)分量。36.根據(jù)權(quán)利要求31所述的方法,其中,逆分級(jí)濾波器組(2400)重建輸出信號(hào)(614),其通過(guò)把時(shí)域樣本(4002)變換成殘余變換系數(shù)(2411)、把它們與用于低頻率分辨率下的音調(diào)分量集(2407)的變換系數(shù)(2409)相組合(2412)及逆變換(2413)組合的變換系數(shù)以形成部分重建輸出信號(hào)(2415),并且用下一最高頻率分辨率下的另一音調(diào)分量集的變換系數(shù)在該部分重建輸出信號(hào)上重復(fù)所述步驟,直到重建輸出信號(hào)(614)。37.根據(jù)權(quán)利要求36所述的方法,其中,時(shí)域樣本表示為子帶,所述逆分級(jí)濾波器組通過(guò)如下操作重建時(shí)域輸出信號(hào)a)加窗在輸入幀的每個(gè)時(shí)域子帶中的信號(hào),以形成加窗時(shí)域子帶(2410);b)把時(shí)域到頻域變換應(yīng)用于每個(gè)加窗時(shí)域子帶以形成變換系數(shù)(2411);c)級(jí)聯(lián)所生成的變換系數(shù)以形成較大集的殘余變換系數(shù)(2411);d)由音調(diào)分量集合成變換系數(shù)(2409);e)把由音調(diào)和時(shí)域分量重建的變換系數(shù)組合成單個(gè)組合變換系數(shù)集(2412);f)把逆變換應(yīng)用于組合變換系數(shù)(2413),加窗及重疊添加(2414)先前的幀,以重建部分重建時(shí)域信號(hào)(2415);及g)對(duì)于部分重建時(shí)域信號(hào)使用下個(gè)音調(diào)分量集施加依次迭代步驟(a)至(f)(2407),直到重建時(shí)域輸出信號(hào)(614)。38.根據(jù)權(quán)利要求36所述的方法,其中每個(gè)輸入幀在P個(gè)子帶的每一個(gè)中包含Mi個(gè)時(shí)間樣本,所述逆分級(jí)濾波器進(jìn)行如下步驟(a)在每個(gè)子帶i中,緩存Mi個(gè)先前樣本并且把Mi個(gè)先前樣本與當(dāng)前Mi個(gè)樣本級(jí)聯(lián)以產(chǎn)生2*]\1;新樣本(4004);(b)在每個(gè)子帶i中,把2*1^子帶樣本乘以2*]\^點(diǎn)窗口函數(shù)(4006)',(c)把(2*Mi)點(diǎn)變換應(yīng)用于子帶樣本,以產(chǎn)生每個(gè)子帶i的Mi變換系數(shù)(4008);(d)級(jí)聯(lián)每個(gè)子帶i的Mi變換系數(shù)以形成N/2個(gè)系數(shù)的單集(4010)5(e)合成來(lái)自譯碼和逆量化的音調(diào)分量集的音調(diào)變換系數(shù),并且把它們與以前步驟的級(jí)聯(lián)系數(shù)相組合以形成單個(gè)組合級(jí)聯(lián)系數(shù)集(2407、2408、2409、2412)5(f)把N-點(diǎn)逆變換應(yīng)用于組合級(jí)聯(lián)系數(shù)以產(chǎn)生N個(gè)樣本(4012);(g)把每幀的N個(gè)樣本的乘以N-樣本窗口函數(shù)以產(chǎn)生N個(gè)加窗樣本(4014);(h)重疊添加所生成的加窗樣本(4014)以產(chǎn)生在給定子帶水平下的N/2個(gè)新輸出樣本作為部分重建輸出信號(hào)(4016);及(i)使用下個(gè)音調(diào)分量集對(duì)N/2新輸出樣本重復(fù)步驟(a)-(h)(2407),直到已經(jīng)處理所有子帶并重建N個(gè)原始時(shí)間樣本作為輸出信號(hào)(614)。39.—種用來(lái)由編碼位流重建時(shí)域輸出音頻信號(hào)的譯碼器,包括位流分析器(600),用來(lái)把縮放位流的每個(gè)幀解析成其音頻分量,每個(gè)幀包含如下的至少一個(gè)(a)代表在輸入信號(hào)的不同頻率分辨率下的頻域內(nèi)容的多個(gè)量化的音調(diào)分量、b)代表由重建音調(diào)分量與輸入信號(hào)之差形成的時(shí)域殘余的量化殘余時(shí)間-樣本分量、及c)代表殘余信號(hào)的信號(hào)能量的縮放因子網(wǎng)格;殘余譯碼器(602),用來(lái)譯碼任何時(shí)間-樣本分量和任何網(wǎng)格以重建時(shí)間樣本;音調(diào)譯碼器(601),用來(lái)譯碼任何音調(diào)分量以形成變換系數(shù);及逆分級(jí)濾波器組(2400),用于重建輸出信號(hào),其中通過(guò)把時(shí)間樣本變換成殘余變換系數(shù)、把它們與低頻率分辨率下的音調(diào)分量集的變換系數(shù)相組合及逆變換組合的變換系數(shù)以形成部分重建輸出信號(hào),用下一最高頻率分辨率下的另一個(gè)音調(diào)分量集的變換系數(shù)在所述部分重建輸出信號(hào)上重復(fù)所迷步驟,直到重建輸出音頻信號(hào)。40.根據(jù)權(quán)利要求39所述的譯碼器,其中,每個(gè)輸入幀在P個(gè)子帶的每一個(gè)中包含Mi個(gè)時(shí)間樣本,所述逆分級(jí)濾波器進(jìn)行如下步驟(a)在每個(gè)子帶i中,緩存Mi個(gè)先前樣本并且把Mi個(gè)先前樣本與當(dāng)前Mi個(gè)樣本級(jí)聯(lián)以產(chǎn)生2力Mi個(gè)新樣本(4004);(b)在每個(gè)子帶i中,把2AMi個(gè)子帶樣本乘以2*1\^點(diǎn)窗口函數(shù)(4006);(c)把(2*Mi)-點(diǎn)變換應(yīng)用于子帶樣本,以產(chǎn)生每個(gè)子帶i的Mi個(gè)殘余變換系數(shù)(4008);(d)級(jí)聯(lián)用于每個(gè)子帶i的Mi個(gè)殘余變換系數(shù)以形成N/2個(gè)系數(shù)的單集(4010);(e)合成來(lái)自譯碼和逆量化的音調(diào)分量集的音調(diào)變換系數(shù),并且把它們與級(jí)聯(lián)殘余變換系數(shù)相組合以形成單個(gè)組合級(jí)聯(lián)系數(shù)集(2407、2408、2409、2412);(f)把N-點(diǎn)逆變換應(yīng)用于組合級(jí)聯(lián)系數(shù)以產(chǎn)生N個(gè)樣本(4012);(g)把每一幀的N個(gè)樣本乘以N-樣本窗口函數(shù)以產(chǎn)生N個(gè)加窗樣本(4014);(h)重疊添加所生成的加窗樣本(4014)以產(chǎn)生給定子帶水平下的N/2個(gè)新輸出樣本作為部分重建輸出信號(hào)(4016);及(i)使用下個(gè)音調(diào)分量集對(duì)N/2個(gè)新輸出樣本重復(fù)步驟(a)-(h)(2407),直到已經(jīng)處理所有子帶并重建N個(gè)原始時(shí)間樣本作為輸出信號(hào)(614)。41.一種分級(jí)濾波輸入信號(hào)以實(shí)現(xiàn)幾乎任意時(shí)間/頻率分解的方法,包括步驟(a)把輸入信號(hào)的樣本緩存到N個(gè)樣本的幀中(2900);(b)把每個(gè)幀中的N個(gè)樣本乘以N-樣本窗口函數(shù)(2900);(c)施加N-點(diǎn)變換以產(chǎn)生N/2個(gè)變換系數(shù)(2902);(d)把N/2個(gè)殘余變換系數(shù)劃分成P組的Mj個(gè)系數(shù)(2906),從而Mi系數(shù)之和是N/2(^A/,=w/2;)(e)對(duì)于P組的每一個(gè),把(2*Mi)-點(diǎn)逆變換施加到變換系數(shù)上以從每組產(chǎn)生(2*Mi)子帶樣本(2906);(f)在每個(gè)子帶i中,把(2*Mi)子帶樣本乘以(2*Mi)-點(diǎn)窗口函數(shù);(2908)(g)在每個(gè)子帶i中,與Mi個(gè)先前樣本重疊并且添加對(duì)應(yīng)值,以對(duì)于每個(gè)子帶產(chǎn)生Mi個(gè)新樣本(2910);及(h)使用依次更小的變換尺寸N對(duì)Mi個(gè)新樣本的一個(gè)或多個(gè)子帶重復(fù)步驟(a)-(g)(2912),直到獲得所希望的時(shí)間/變換分辨率(2914)。42.根據(jù)權(quán)利要求41所述的方法,其中,變換是MDCT變換。43.根據(jù)權(quán)利要求41所述的方法,其中,對(duì)Mi的所有子帶重復(fù)步驟(a)-(g)。44.根據(jù)權(quán)利要求41所述的方法,其中,只對(duì)Mi的低頻率子帶的限定集重復(fù)步驟(a)-(g)。45.—種分級(jí)重建輸入信號(hào)的時(shí)間樣本的方法,其中每個(gè)輸入幀在P個(gè)子帶的每一個(gè)中包含Mi個(gè)時(shí)間樣本,包括如下步驟(a)在每個(gè)子帶i中,緩存Mi個(gè)先前樣本并且把Mi個(gè)先前樣本與當(dāng)前Mi個(gè)樣本級(jí)聯(lián)以產(chǎn)生2*]\^個(gè)新樣本(4004);(b)在每個(gè)子帶i中,把2先Mi個(gè)子帶樣本乘以2*]\^點(diǎn)窗口函數(shù)(4006);(c)把(2*Mi)-點(diǎn)變換應(yīng)用于加窗子帶樣本,以產(chǎn)生用于子帶i的Mi個(gè)殘余變換系數(shù)(4008);(d)級(jí)聯(lián)用于每個(gè)子帶i的Mi殘余變換系數(shù)以形成N/2個(gè)系數(shù)的單集(4010);(e)把N-點(diǎn)逆變換應(yīng)用于級(jí)聯(lián)系數(shù)以產(chǎn)生N個(gè)樣本的幀(4012);(f)把每一幀的N個(gè)樣本乘以N-樣本窗口函數(shù)以產(chǎn)生N個(gè)加窗樣本(4014);(g)重疊添加所生成的加窗樣本(4014)以產(chǎn)生給定子帶水平下的N/2個(gè)新輸出樣本(4016);及重復(fù)步驟(a)-(h),直到已經(jīng)處理所有子帶并重建N個(gè)原始時(shí)間才羊本。全文摘要一種用來(lái)壓縮音頻輸入信號(hào)以形成主位流的方法,該主位流可被縮放以形成具有任意規(guī)定數(shù)據(jù)速率的縮放位流。分級(jí)濾波器組(2100)把輸入信號(hào)分解成多分辨率時(shí)間/頻率表示,編碼器可從該多分辨率時(shí)間/頻率表示高效地抽取音調(diào)(2106)和殘余分量(2117)。分量被排序,并且然后參照相同掩碼函數(shù)或不同心理聲學(xué)標(biāo)準(zhǔn)被量化。選擇音調(diào)分量使用擴(kuò)展到多通道音頻的差分編碼被適當(dāng)?shù)鼐幋a。使用擴(kuò)展到多通道音頻的聯(lián)合通道編碼(JCC),編碼組成殘余分量的時(shí)間-樣本和縮放因子分量。譯碼器使用逆分級(jí)濾波器組,以從縮放位流中的音調(diào)和殘余分量重建音頻信號(hào)。文檔編號(hào)H03M7/30GK101199121SQ200680021765公開日2008年6月11日申請(qǐng)日期2006年6月16日優(yōu)先權(quán)日2005年6月17日發(fā)明者德米特里·V·施芒克,理查德·J·比登申請(qǐng)人:Dts(英屬維爾京群島)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1