国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于低復(fù)雜度高級(jí)音頻編碼的自適應(yīng)速率控制算法的制作方法

      文檔序號(hào):2837253閱讀:433來源:國(guó)知局
      專利名稱:用于低復(fù)雜度高級(jí)音頻編碼的自適應(yīng)速率控制算法的制作方法
      技術(shù)領(lǐng)域
      一般來說,本發(fā)明涉及用于對(duì)音頻信號(hào)編碼的裝置及過程,更具體來說,涉及適用于特別是包括低功率裝置的、針對(duì)傳送或存儲(chǔ)目的的音頻壓縮領(lǐng)域的AAC-LC編碼器及方法。
      背景技術(shù)
      有效的音頻編碼系統(tǒng)是可最佳地消除音頻流的不相關(guān)和冗余部分的那些系統(tǒng)。第一個(gè)通過經(jīng)由心理聲學(xué)分析減小心理聲學(xué)不相關(guān)來實(shí)現(xiàn)。術(shù)語(yǔ)“感知音頻編碼器”用來表示利用人類聽覺的屬性的那些壓縮方案。從冗余減小中得到進(jìn)一步的減小。
      心理聲學(xué)分析根據(jù)人類聽力和聽覺的心理聲學(xué)模型生成掩蔽門限。心理聲學(xué)建模考慮人類聽力的頻率相關(guān)門限以及稱作掩蔽的心理聲學(xué)現(xiàn)象,由此,接近一個(gè)或多個(gè)較弱頻率分量的強(qiáng)頻率分量?jī)A向于掩蔽較弱的分量,使它們對(duì)人類聽眾是聽不見的。這使得能夠在對(duì)音頻信號(hào)編碼時(shí)省略較弱的頻率分量,由此取得更高程度的壓縮,而沒有不利地影響編碼音頻數(shù)據(jù)流的感知質(zhì)量。掩蔽數(shù)據(jù)包括來自濾波器組的每個(gè)子頻段的信號(hào)掩碼比值。這些信號(hào)掩碼比值表示每個(gè)子頻段中被入耳掩蔽的信號(hào)的量,因而又稱作掩蔽門限。
      圖1說明一種典型感知編碼器的示意功能框圖。感知編碼器1包括用于時(shí)間頻率變換的濾波器組2、心理聲學(xué)模型(PAM)3、量化單元4和熵單元5。濾波器組、PAM和量化單元是典型感知編碼器的主要部分。量化單元采用來自PAM的掩蔽門限來判定如何最佳地利用可用數(shù)量的數(shù)據(jù)位表示輸入音頻數(shù)據(jù)流。
      MPEG4高級(jí)音頻編碼(AAC)是以低至64kbps的比特率實(shí)現(xiàn)透明CD質(zhì)量結(jié)果的目前技術(shù)水平的感知音頻編碼器。例如參見ISO/IEC14496-3,信息技術(shù)-視聽對(duì)象的編碼,第3部分音頻(1999)。圖2說明一種AAC感知編碼器的詳細(xì)功能框圖。AAC感知編碼器10包括AAC增益控制工具模塊11、心理聲學(xué)模型12、窗口長(zhǎng)度判定模塊13、濾波器組模塊14、頻譜處理模塊15、量化和編碼模塊16以及位流格式器模塊17。值得注意,AAC的額外頻譜處理由頻譜處理模塊15在量化之前執(zhí)行。這個(gè)頻譜處理塊用來減少冗余成分,主要由預(yù)測(cè)工具組成。
      AAC采用修改的離散余弦變換(MDCT),在其濾波器組模塊中具有50%交迭。在交迭添加過程之后,由于時(shí)域混疊抵消,預(yù)計(jì)得到原始信號(hào)的正確重構(gòu)。但是,情況不是這樣,因?yàn)樵诹炕^程中產(chǎn)生誤差。感知編碼器的構(gòu)思是隱藏這個(gè)量化誤差,使得我們的聽力不會(huì)注意到它。我們無法聽到的那些頻譜分量也從編碼流中消除。這種不相關(guān)減小利用人耳的掩蔽屬性。掩蔽門限的計(jì)算屬于編碼器的計(jì)算密集任務(wù)。
      如圖3所示,AAC量化模塊16以兩個(gè)嵌套循環(huán)進(jìn)行操作。內(nèi)循環(huán)包括調(diào)節(jié)全局增益32、計(jì)算已使用位33以及確定是否滿足比特率限制34的操作。簡(jiǎn)言之,內(nèi)循環(huán)量化輸入向量,以及增加量化器步長(zhǎng),直到輸出向量可采用可用數(shù)量的位來編碼為止。在完成內(nèi)循環(huán)之后,外循環(huán)檢查各比例因子段35的失真,以及如果超過所允許失真36,則放大比例因子段31并再次調(diào)用內(nèi)循環(huán)。AAC采用不均勻量化器。
      高質(zhì)量感知編碼器具有詳盡的心理聲學(xué)模型(PAM)來計(jì)算掩蔽門限,它是所允許失真的指示。如圖4所示,PAM通過以下步驟計(jì)算掩蔽門限時(shí)域輸入的FFT 41、在1/3巴克域中計(jì)算能量42、采用擴(kuò)展函數(shù)進(jìn)行卷積43、音調(diào)索引計(jì)算44、掩蔽門限調(diào)節(jié)45、安靜地與門限進(jìn)行比較46以及適配比例因子段域47。由于有限的時(shí)間或計(jì)算資源,常常不得不違反這個(gè)門限,因?yàn)閮H僅可用的位不足以滿足掩蔽門限需求。這造成位分配模塊中的額外計(jì)算負(fù)擔(dān),因?yàn)樗谶_(dá)到退出條件之前迭代進(jìn)行設(shè)法適應(yīng)失真和比特率要求的嵌套循環(huán)。
      AAC的另一個(gè)特征是根據(jù)信號(hào)是穩(wěn)定還是瞬變?cè)趦蓚€(gè)不同窗口大小之間轉(zhuǎn)換的能力。這個(gè)特征防止所有感知編碼器易于遇到的前回波偽像。
      要注意,圖2說明具有包括下列各項(xiàng)的標(biāo)準(zhǔn)中定義的3個(gè)類型的MPEG4-AAC的完整圖主要類型(其中所有工具已啟用,要求強(qiáng)大的處理能力);低復(fù)雜度(LC)類型(具有較小的壓縮比,以便節(jié)省處理和RAM使用);以及可縮放抽樣率類型(具有適應(yīng)各種帶寬的能力)。處理能力節(jié)省是我們主要關(guān)心的問題,本發(fā)明僅涉及LC類型。
      還要注意,AAC-LC僅采用暫時(shí)噪聲整形(TNS)子模塊和立體編碼子模塊,而沒有如圖2所示的頻譜處理模塊15中的其余預(yù)測(cè)工具。與塊交換配合工作,TNS還用于通過控制量化噪聲的暫時(shí)形狀來減小前回波偽像。但是,在LC類型中,TNS的階數(shù)受到限制。立體編碼用于通過把左和右系數(shù)編碼為和與差,來控制編碼噪聲的成像。
      AAC標(biāo)準(zhǔn)僅確保有效的AAC流可由所有AAC解碼器正確解碼。編碼器可適應(yīng)適合于不同的可用資源和應(yīng)用區(qū)域的實(shí)現(xiàn)中的變化。AAC-LC是經(jīng)過平鋪以便具有比其它類型更少的計(jì)算負(fù)擔(dān)的類型。但是,整體效率仍然取決于編碼器本身的具體實(shí)現(xiàn)。在Kurniawati等人的“有效MPEG高級(jí)音頻編碼器的新實(shí)現(xiàn)技術(shù)”(IEEE Transactions onConsumer Electronics(2004),Vol.50,第655-665頁(yè))中概述了優(yōu)化AAC-LC編碼器的某些先有嘗試。但是,對(duì)MPEG4-AAC的進(jìn)一步改進(jìn)對(duì)于在以低電源運(yùn)行的低比特率裝置中傳送和存儲(chǔ)具有高質(zhì)量的音頻數(shù)據(jù)仍然是合乎需要的。

      發(fā)明內(nèi)容
      根據(jù)本發(fā)明的一個(gè)方面,提供一種用于對(duì)音頻數(shù)據(jù)編碼的方法,包括接收來自輸入的未壓縮音頻數(shù)據(jù);采用濾波器組生成所述未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜;根據(jù)所述MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限,其中,所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算;根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化,其中,在所述當(dāng)前幀的量化之后,更新用于下一幀的位預(yù)算以便估算所述下一幀的掩蔽門限;以及對(duì)所述量化音頻數(shù)據(jù)編碼。
      根據(jù)本發(fā)明的另一方面,提供一種音頻編碼器,用于壓縮未壓縮音頻數(shù)據(jù),所述音頻編碼器包括心理聲學(xué)模型(PAM),用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限,其中,所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算;以及量化模塊,用于根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化,其中,在所述當(dāng)前幀的量化之后,更新用于下一幀的位預(yù)算以用于估算所述下一幀的掩蔽門限;由此,所述PAM和量化模塊經(jīng)過電子方式配置,使得所述PAM通過考慮所述量化模塊所更新的位狀態(tài)來估算所述掩蔽門限。
      根據(jù)本發(fā)明的又一方面,提供一種電子裝置,包括能夠接收未壓縮音頻數(shù)據(jù)的電子電路;計(jì)算機(jī)可讀媒體,嵌入了音頻編碼器,使得所述未壓縮音頻數(shù)據(jù)可經(jīng)過壓縮以用于傳送和/或存儲(chǔ)目的;以及能夠向所述電子裝置的用戶輸出所述壓縮音頻數(shù)據(jù)的電子電路;其中,所述音頻編碼器包括心理聲學(xué)模型(PAM),用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限,其中,所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算;以及量化模塊,用于根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化,其中,在所述當(dāng)前幀的量化之后,更新用于下一幀的位預(yù)算以用于估算所述下一幀的掩蔽門限;由此,所述PAM和量化模塊經(jīng)過電子方式配置,使得所述PAM通過考慮所述量化模塊所更新的位狀態(tài)來估算所述掩蔽門限。


      現(xiàn)在參照附圖來描述根據(jù)本發(fā)明的優(yōu)選實(shí)施例,附圖中,相似參考標(biāo)號(hào)表示相似元件。
      圖1說明一種典型感知編碼器的示意功能框圖。
      圖2說明MPEG4-AAC感知編碼器的詳細(xì)功能框圖。
      圖3說明集中于PAM和位分配模塊的傳統(tǒng)編碼器結(jié)構(gòu)。
      圖4說明掩蔽門限的傳統(tǒng)估算。
      圖5說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的AAC-LC編碼器的PAM和量化單元的配置。
      圖6說明根據(jù)本發(fā)明的一個(gè)實(shí)施例、用于掩蔽門限估算的圖5的簡(jiǎn)化PAM 50的功能流程圖。
      圖7說明Q值與用于長(zhǎng)窗口中的位數(shù)量之間的相關(guān)。
      圖8說明Q值與用于長(zhǎng)窗口中的位數(shù)量之間的相關(guān)。
      圖9說明Q值與用于短窗口中的位數(shù)量之間的相關(guān)。
      圖10說明梯度和Q調(diào)節(jié)。
      圖11說明本發(fā)明可適用的示范電子裝置。
      具體實(shí)施例方式
      通過參照本發(fā)明的某些實(shí)施例的以下詳細(xì)描述,可更易于理解本發(fā)明。
      在引用出版物的本申請(qǐng)中,這些出版物的公開通過引用完整地結(jié)合到本申請(qǐng)中,以便更全面地描述本發(fā)明涉及的技術(shù)發(fā)展水平。
      本發(fā)明的一個(gè)實(shí)施例提供用于對(duì)音頻數(shù)據(jù)編碼的過程。在這個(gè)實(shí)施例中,該過程包括接收來自輸入的未壓縮音頻數(shù)據(jù);采用濾波器組生成未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜;根據(jù)MDCT頻譜估算用于要編碼的當(dāng)前幀的掩蔽門限,其中,掩蔽門限反映用于當(dāng)前幀的位預(yù)算;根據(jù)掩蔽門限執(zhí)行當(dāng)前幀的量化,其中,在當(dāng)前幀的量化之后,更新用于下一幀的位預(yù)算以便估算下一幀的掩蔽門限;以及對(duì)量化音頻數(shù)據(jù)編碼。
      在該過程的另一個(gè)實(shí)施例中,生成MDCT頻譜的步驟還包括采用下式來生成MDCT頻譜
      Xi,k=2&Sigma;n=0N-1zi,ncos(2&pi;N(n+no)(k+12)),for0&le;k&le;N/2]]>其中,Xi,k是在塊索引i和頻譜索引k的MDCT系數(shù);z是加窗口輸入序列;n是樣本索引;k是頻譜系數(shù)索引;i是塊索引;以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048,以及短窗口為256);其中no計(jì)算為(N/2+1)/2。
      在該過程的另一個(gè)實(shí)施例中,估算掩蔽門限的步驟還包括采用MDCT頻譜在比例因子段域中計(jì)算能量;執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù);計(jì)算音調(diào)索引;執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán));以及安靜地執(zhí)行與門限的比較;由此輸出用于量化的掩蔽門限。
      在該過程的又一個(gè)實(shí)施例中,執(zhí)行量化的步驟還包括采用不均勻量化器按照下式執(zhí)行量化x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中,x_quantized(i)是在比例因子段索引(i)處的量化頻譜值;i是比例因子段索引,x是要量化的段內(nèi)的頻譜值,gl是全局比例因子(速率控制參數(shù)),以及scf(i)是比例因子值(失真控制參數(shù))。
      在該過程的又一個(gè)實(shí)施例中,執(zhí)行量化的步驟還包括僅尋找控制失真的比例因子值,不調(diào)節(jié)全局比例因子值,由此把全局比例因子值作為比例因子的第一值(scf(0))。
      在該過程的又一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括采用下式線性調(diào)節(jié)變量QNewQ=Q1+(R1-desired_R)(Q2-Q1)/(R2-R1)其中,NewQ是調(diào)節(jié)“之后”的變量Q;Q1和Q2分別是前一和二幀的Q值;R1和R2是用于前一和前二幀的位數(shù)量;以及desired_R是已使用位的預(yù)期數(shù)量;其中,值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。在該過程的又一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新已調(diào)節(jié)梯度。在該過程的又一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括限制變量Q的值并根據(jù)各個(gè)幀中的能含量按比例地將其分布于三個(gè)幀。在該過程的又一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括通過采用Q的值以及音調(diào)索引對(duì)掩蔽門限的調(diào)節(jié)加權(quán),以便更好地考慮可用于編碼的位數(shù)量。
      本發(fā)明的另一個(gè)實(shí)施例提供用于壓縮未壓縮音頻數(shù)據(jù)的音頻編碼器。在這個(gè)實(shí)施例中,音頻編碼器包括心理聲學(xué)模型(PAM),用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限,其中,掩蔽門限反映用于當(dāng)前幀的位預(yù)算;以及量化模塊,用于根據(jù)掩蔽門限執(zhí)行當(dāng)前幀的量化,其中,在當(dāng)前幀的量化之后,更新用于下一幀的位預(yù)算以便估算下一幀的掩蔽門限;由此,PAM和量化模塊經(jīng)過電子方式配置,使得PAM通過考慮量化模塊所更新的位狀態(tài)來估算掩蔽門限。在音頻編碼器的另一個(gè)實(shí)施例中,還包括用于接收來自輸入的未壓縮音頻數(shù)據(jù)的部件;以及濾波器組,電連接到接收部件,用于生成未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜;其中,濾波器組電連接到PAM,使得MDCT頻譜被輸出到PAM。在音頻編碼器的另一個(gè)實(shí)施例中,還包括用于對(duì)量化音頻數(shù)據(jù)編碼的編碼模塊。在音頻編碼器的又一個(gè)實(shí)施例中,編碼模塊是熵編碼模塊。
      在音頻編碼器的另一個(gè)實(shí)施例中,濾波器組采用下式生成MDCT頻譜Xi,k=2&Sigma;n=0N-1zi,ncos(2&pi;N(n+no)(k+12)),for0&le;k&le;N/2]]>其中,Xi,k是在塊索引i和頻譜索引k處的MDCT系數(shù);z是加窗口輸入序列;n是樣本索引;k是頻譜系數(shù)索引;i是塊索引;以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048,以及短窗口為256);其中no計(jì)算為(N/2+1)/2。
      在音頻編碼器的另一個(gè)實(shí)施例中,心理聲學(xué)模型(PAM)通過以下操作來估算掩蔽門限采用MDCT頻譜在比例因子段域中計(jì)算能量;執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù);計(jì)算音調(diào)索引;執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán));以及安靜地執(zhí)行與門限的比較;由此輸出掩蔽門限用于量化。
      在音頻編碼器的另一個(gè)實(shí)施例中,執(zhí)行量化的步驟還包括采用不均勻量化器按照下式執(zhí)行量化x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中,x_quantized(i)是在比例因子段索引(i)處的量化頻譜值;i是比例因子段索引,x是要量化的段內(nèi)的頻譜值,gl是全局比例因子(速率控制參數(shù)),以及scf(i)是比例因子值(失真控制參數(shù))。
      在音頻編碼器的一個(gè)實(shí)施例中,執(zhí)行量化的步驟還包括僅尋找控制失真的比例因子值,不調(diào)節(jié)全局比例因子值,由此把全局比例因子值作為比例因子的第一值(scf(0))。
      在音頻編碼器的另一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括采用下式線性調(diào)節(jié)變量QNewQ=Q1+(R1-desired_R)(Q2-Q1)/(R2-R1)其中,NewQ是調(diào)節(jié)“之后”的變量Q;Q1和Q2分別是前一和二幀的Q值;R1和R2是用于前一和前二幀的位數(shù)量;以及desired_R是已使用位的預(yù)期數(shù)量;其中,值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。在音頻編碼器的又一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新已調(diào)節(jié)梯度。在音頻編碼器的又一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括限制變量Q的值并根據(jù)各個(gè)幀中的能含量按比例地將其分布于三個(gè)幀。在編碼器的又一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括通過采用Q的值以及音調(diào)索引對(duì)掩蔽門限的調(diào)節(jié)加權(quán),以便更好地考慮可用于編碼的位數(shù)量。
      本發(fā)明的另一個(gè)實(shí)施例提供一種電子裝置,它包括能夠接收未壓縮音頻數(shù)據(jù)的電子電路;計(jì)算機(jī)可讀媒體,嵌入了音頻編碼器,使得未壓縮音頻數(shù)據(jù)可經(jīng)過壓縮以用于傳送和/或存儲(chǔ)目的;以及能夠把壓縮音頻數(shù)據(jù)輸出給電子裝置的用戶的電子電路;其中,音頻編碼器包括心理聲學(xué)模型(PAM),用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前值的掩蔽門限,其中,掩蔽門限反映用于當(dāng)前幀的位預(yù)算;以及量化模塊,用于根據(jù)掩蔽門限執(zhí)行當(dāng)前幀的量化,其中,在當(dāng)前幀的量化之后,更新用于下一幀的位預(yù)算以便估算下一幀的掩蔽門限;由此,PAM和量化模塊經(jīng)過電子方式配置,使得PAM通過考慮量化模塊所更新的位狀態(tài)來估算掩蔽門限。
      在電子裝置的另一個(gè)實(shí)施例中,音頻編碼器還包括用于接收來自輸入的未壓縮音頻數(shù)據(jù)的部件;以及濾波器組,電連接到接收部件,用于生成未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜;其中,濾波器組電連接到PAM,使得MDCT頻譜被輸出到PAM。在電子裝置的另一個(gè)實(shí)施例中,音頻編碼器還包括用于對(duì)量化音頻數(shù)據(jù)編碼的編碼模塊。在電子裝置的另一個(gè)實(shí)施例中,編碼模塊是熵編碼模塊。
      在電子裝置的另一個(gè)實(shí)施例中,濾波器組采用下式生成MDCT頻譜Xi,k=2&Sigma;n=0N-1zi,ncos(2&pi;N(n+no)(k+12)),for0&le;k&le;N/2]]>其中,Xi,k是在塊索引i和頻譜索引k處的MDCT系數(shù);z是加窗口輸入序列;n是樣本索引;k是頻譜系數(shù)索引;i是塊索引;以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048,以及短窗口為256);其中no計(jì)算為(N/2+1)/2。
      在電子裝置的另一個(gè)實(shí)施例中,心理聲學(xué)模型(PAM)通過以下操作來估算掩蔽門限采用MDCT頻譜在比例因子段域中計(jì)算能量;執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù);計(jì)算音調(diào)索引;執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán));以及安靜地執(zhí)行與門限的比較;由此輸出掩蔽門限用于量化。
      在電子裝置的另一個(gè)實(shí)施例中,執(zhí)行量化的步驟還包括采用不均勻量化器按照下式執(zhí)行量化
      x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中,x_quantized(i)是在比例因子段索引(i)處的量化頻譜值;i是比例因子段索引,x是要量化的段內(nèi)的頻譜值,gl是全局比例因子(速率控制參數(shù)),以及scf(i)是比例因子值(失真控制參數(shù))。
      在電子裝置的一個(gè)實(shí)施例中,執(zhí)行量化的步驟還包括僅尋找控制失真的比例因子值,不調(diào)節(jié)全局比例因子值,由此把全局比例因子值作為比例因子的第一值(scf(0))。
      在電子裝置的另一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括采用下式線性調(diào)節(jié)變量QNewQ=Q1+(R1-desired_R)(Q2-Q1)/(R2-R1)其中,NewQ是調(diào)節(jié)“之后”的變量Q;Q1和Q2分別是前一和二幀的Q值;R1和R2是用于前一和前二幀的位數(shù)量;以及desired_R是已使用位的預(yù)期數(shù)量;其中,值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。在電子裝置的又一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新已調(diào)節(jié)梯度。在電子裝置的又一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括限制變量Q的值并根據(jù)各個(gè)幀中的能含量按比例地將其分布于三個(gè)幀。在電子裝置的又一個(gè)實(shí)施例中,執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括通過采用Q的值以及音調(diào)索引對(duì)掩蔽門限的調(diào)節(jié)加權(quán),以便更好地考慮可用于編碼的位數(shù)量。
      在電子裝置的另一個(gè)實(shí)施例中,電子裝置包括音頻播放器/記錄器、PDA、袖珍組織器、帶音頻記錄功能的照相機(jī)、計(jì)算機(jī)和移動(dòng)電話。
      本發(fā)明提供一種用于通過利用心理聲學(xué)模型(PAM)和量化單元的互配低功率實(shí)現(xiàn)AAC-LC編碼器的音頻編碼器和音頻編碼方法。參照?qǐng)D5,提供根據(jù)本發(fā)明的一個(gè)實(shí)施例的AAC-LC編碼器的PAM和量化單元的配置。如上所述,傳統(tǒng)編碼器計(jì)算掩蔽門限要求,并將它作為輸入饋送給量化模塊;具有掩蔽門限的精確估算的構(gòu)思是計(jì)算密集的,并且使位分配模塊的工作是任務(wù)更繁重的。本發(fā)明旨在揭示反映當(dāng)前幀中的位預(yù)算的掩蔽門限,它允許編碼器跳過速率控制循環(huán)。在本發(fā)明中,位分配模塊在確定下一幀的掩蔽門限中起作用,使得確保所使用的位不超過預(yù)算。當(dāng)信號(hào)特性隨時(shí)間改變時(shí),不斷需要調(diào)整以便讓這個(gè)方案工作。此外,本發(fā)明具有使軟件和硬件實(shí)現(xiàn)為最小的適當(dāng)?shù)暮?jiǎn)單結(jié)構(gòu)。
      現(xiàn)在參照?qǐng)D5,本發(fā)明的量化過程包括下文所述的簡(jiǎn)化PAM模塊52接收MDCT 51的輸出作為輸入以計(jì)算掩蔽門限;位分配過程,包括具有調(diào)節(jié)比例因子和全局增益53、計(jì)算失真54和確定失真是否低于掩蔽門限55的單循環(huán);計(jì)算所使用的位56;調(diào)節(jié)Q調(diào)節(jié)梯度57;以及對(duì)于高質(zhì)量類型,根據(jù)未來幀中的能量分布設(shè)置Q的限制58。與圖3所示的傳統(tǒng)方法的主要差別之一在于位分配模塊,在其中,本發(fā)明僅采用失真控制循環(huán)代替原始的二嵌套循環(huán)。比例因子值經(jīng)過選擇,使得它們滿足掩蔽門限要求。速率控制函數(shù)由按照已使用位的實(shí)際數(shù)量調(diào)節(jié)的變量Q來承擔(dān)。這個(gè)值將用于對(duì)下一幀的掩蔽門限計(jì)算進(jìn)行微調(diào)。
      利用表示可用位的狀態(tài)的變量Q,編碼器嘗試修整掩蔽門限以適合位預(yù)算,使得可省略速率控制循環(huán)。心理聲學(xué)模型輸出掩蔽門限,它已經(jīng)結(jié)合從比特率限制中突出的噪聲。Q的調(diào)節(jié)取決于把Q與已使用位的實(shí)際數(shù)量相關(guān)的梯度。這個(gè)梯度被逐幀調(diào)節(jié),以便反映信號(hào)特性的變化。對(duì)于長(zhǎng)塊和短塊維護(hù)兩個(gè)分開的梯度,并且在塊交換的情況中執(zhí)行重置。
      圖6說明根據(jù)本發(fā)明的一個(gè)實(shí)施例、用于掩蔽門限估算的圖5的簡(jiǎn)化PAM 50的功能流程圖。掩蔽門限估算的操作包括采用MDCT頻譜在比例因子段域中計(jì)算能量61;執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù)62;計(jì)算音調(diào)索引63;執(zhí)行掩蔽門限調(diào)節(jié)(以Q加權(quán))64;以及安靜地執(zhí)行與門限的比較65,對(duì)量化模塊輸出掩蔽門限。
      現(xiàn)在提供根據(jù)本發(fā)明的一個(gè)實(shí)施例的AAC-LC編碼器的操作的更詳細(xì)描述。要注意,本發(fā)明是現(xiàn)有AAC-LC編碼器的改進(jìn),所以許多共同特征不作詳細(xì)論述,以便不影響對(duì)本發(fā)明的理解。本發(fā)明的AAC-LC編碼器的操作包括在濾波器組中生成MDCT頻譜,在PAM中估算掩蔽門限,以及執(zhí)行量化和編碼。重點(diǎn)放在本發(fā)明的AAC-LC編碼器的操作與標(biāo)準(zhǔn)AAC-LC編碼器的操作之間的差別。
      為了生成MDCT頻譜,AAC-LC編碼器的濾波器組模塊中使用的MDCT用公式表示如下Xi,k=2&Sigma;n=0N-1zi,ncos(2&pi;N(n+no)(k+12)),for0&le;k&le;N/2---(1)]]>其中,Xi,k是在塊索引i和頻譜索引k處的MDCT系數(shù);z是加窗口輸入序列;n是樣本索引;k是頻譜系數(shù)索引;i是塊索引;以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048,以及短窗口為256);其中no計(jì)算為(N/2+1)/2。
      為了估算掩蔽門限,結(jié)合圖6描述本發(fā)明的簡(jiǎn)化PAM的詳細(xì)操作。簡(jiǎn)化PAM的特征包括下列各項(xiàng)。首先,為了效率的原因,簡(jiǎn)化PAM采用MDCT頻譜進(jìn)行分析。其次,能量等級(jí)的計(jì)算直接在比例因子段域中執(zhí)行。第三,采用簡(jiǎn)單三角擴(kuò)展函數(shù),其中斜率為每巴克+25dB以及每巴克-10dB。第四,音調(diào)索引采用頻譜平坦性度量來計(jì)算。最后,作為速率控制變量的已加權(quán)Q用來調(diào)節(jié)掩蔽門限。在傳統(tǒng)上,這個(gè)步驟反映信號(hào)音和噪聲的不同掩蔽能力。由于噪聲更好地掩蔽,所以,掩蔽門限在音調(diào)值低時(shí)調(diào)節(jié)成更高,以及在音調(diào)值高時(shí)調(diào)節(jié)成更低。在本發(fā)明中,除了音調(diào)之外,還結(jié)合Q以便對(duì)掩蔽門限進(jìn)行微調(diào)以適合可用位。
      對(duì)于位分配量化,AAC采用不均勻量化器
      x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]---(2)]]>其中,x_quantized(i)是在比例因子段索引(i)處的量化頻譜值;i是比例因子段索引,x是要量化的段內(nèi)的頻譜值,gl是全局比例因子(速率控制參數(shù)),以及scf(i)是比例因子值(失真控制參數(shù))。
      在本發(fā)明中,僅尋找比例因子值以控制失真。全局比例因子值從不調(diào)節(jié),并且作為比例因子的第一值(scf(0))。
      對(duì)于Q和梯度調(diào)節(jié),圖10說明這些調(diào)節(jié)。Q采用下式線性調(diào)節(jié)NewQ=Q1+(R1-desired_R)(Q2-Q1)/(R2-R1) (3)其中,NewQ是調(diào)節(jié)“之后”的變量Q;Q1和Q2分別是前一和二幀的Q值;R1和R2是用于前一和前二幀的位數(shù)量;以及desired_R是已使用位的預(yù)期數(shù)量;其中,值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。
      當(dāng)Q高時(shí),掩蔽門限經(jīng)過調(diào)節(jié),使得它更精確,從而引起所使用位的數(shù)量的增加。另一方面,當(dāng)位預(yù)算低時(shí),Q將減小,使得在下一幀中,掩蔽門限不要求過多數(shù)量的位。
      Q和比特率的相關(guān)取決于信號(hào)的性質(zhì)。圖7、圖8和圖9說明這兩個(gè)變量之間的相關(guān)。Q的不同變化表示用于信號(hào)的不同部分的位的不同變化。因此,把這兩個(gè)變量相關(guān)的梯度必須不斷調(diào)節(jié)。最顯著的實(shí)例是長(zhǎng)塊(圖7和圖8)與短塊(圖9)中梯度之間的差別。本發(fā)明在塊交換事件期間執(zhí)行這個(gè)梯度的硬重置。
      在高質(zhì)量類型中,除比特率之外,本發(fā)明還采用三個(gè)幀上的能量分布來確定Q調(diào)節(jié)。這將確保沒有對(duì)具有較高能含量的幀設(shè)置Q的較低值。通過這種方案,取得更大的靈活性,并且獲得幀上的更優(yōu)化位分布。
      本發(fā)明提供單循環(huán)速率失真控制算法,它基于掩蔽門限的加權(quán)調(diào)節(jié),采用由從與根據(jù)能量把位分布于幀的選項(xiàng)配合使用的實(shí)際位所計(jì)算的變化梯度得到的自適應(yīng)變量Q。
      本發(fā)明的AAC-LC編碼器可在任何適當(dāng)?shù)碾娮友b置中用于音頻信號(hào)處理。如圖11所示,AAC-LC編碼引擎可把未壓縮音頻數(shù)據(jù)變換為AAC格式的音頻數(shù)據(jù)以便進(jìn)行傳送和存儲(chǔ)。例如音頻播放器/記錄器、PDA、袖珍組織器、帶音頻記錄功能的照相機(jī)、計(jì)算機(jī)和移動(dòng)電話之類的電子裝置包括其中可嵌入AAC-LC算法的計(jì)算機(jī)可讀媒體。
      雖然參照具體實(shí)施例描述了本發(fā)明,但是大家會(huì)理解,這些實(shí)施例是說明性的,并且本發(fā)明的范圍不受此限制。對(duì)于本發(fā)明涉及的領(lǐng)域的技術(shù)人員,本發(fā)明的備選實(shí)施例非常明顯。這類備選實(shí)施例被認(rèn)為包含在本發(fā)明的精神和范圍之內(nèi)。因此,本發(fā)明的范圍由所附權(quán)利要求來描述,并由前面的描述支持。
      權(quán)利要求
      1.一種用于對(duì)音頻數(shù)據(jù)編碼的方法,包括接收來自輸入的未壓縮音頻數(shù)據(jù);采用濾波器組生成所述未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜;根據(jù)所述MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限,其中,所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算;根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化,其中,在所述當(dāng)前幀的量化之后,更新用于下一幀的位預(yù)算以便估算所述下一幀的掩蔽門限;以及對(duì)所述量化音頻數(shù)據(jù)編碼。
      2.如權(quán)利要求1所述的方法,其特征在于,生成MDCT頻譜的所述步驟還包括采用下式來生成MDCT頻譜Xi,k=2&Sigma;n=0N-1zi,ncos(2&pi;N(n+no)(k+12)),for0&le;k&le;N/2]]>其中,Xi,k是在塊索引i和頻譜索引k處的MDCT系數(shù);z是加窗口輸入序列;n是樣本索引;k是頻譜系數(shù)索引;i是塊索引;以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048,以及短窗口為256);其中no計(jì)算為(N/2+1)/2。
      3.如權(quán)利要求1所述的方法,其特征在于,估算掩蔽門限的所述步驟還包括采用所述MDCT頻譜在比例因子段域中計(jì)算能量;執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù);計(jì)算音調(diào)索引;執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán));以及安靜地執(zhí)行與門限的比較;由此輸出所述掩蔽門限用于量化。
      4.如權(quán)利要求3所述的方法,其特征在于,執(zhí)行量化的所述步驟還包括采用不均勻量化器按照下式執(zhí)行量化x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中,x_quantized(i)是在比例因子段索引(i)處的量化頻譜值;i是比例因子段索引,x是要量化的段內(nèi)的頻譜值,gl是全局比例因子(速率控制參數(shù)),以及scf(i)是比例因子值(失真控制參數(shù))。
      5.如權(quán)利要求4所述的方法,其特征在于,執(zhí)行量化的所述步驟還包括僅尋找控制失真的比例因子值,不調(diào)節(jié)所述全局比例因子值,由此把所述全局比例因子值作為所述比例因子的第一值(scf(0))。
      6.如權(quán)利要求3所述的方法,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括采用下式線性調(diào)節(jié)變量QNewQ=Q1+(R1-desired_R)(Q2-Q1)/(R2-R1)其中,NewQ是調(diào)節(jié)“之后”的變量Q;Q1和Q2分別是前一和二幀的Q值;R1和R2是用于前一和前二幀的位數(shù)量;以及desired_R是已使用位的預(yù)期數(shù)量;其中,值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。
      7.如權(quán)利要求6所述的方法,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新所述已調(diào)節(jié)梯度。
      8.如權(quán)利要求6所述的方法,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括限制所述變量Q的值并根據(jù)各個(gè)幀中的能含量按比例將其分布于三個(gè)幀。
      9.如權(quán)利要求6所述的方法,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括通過采用所述Q的值以及音調(diào)索引對(duì)所述掩蔽門限的調(diào)節(jié)加權(quán),以便更好地考慮可用于編碼的位數(shù)量。
      10.一種音頻編碼器,用于壓縮未壓縮音頻數(shù)據(jù),所述音頻編碼器包括心理聲學(xué)模型(PAM),用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限,其中,所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算;以及量化模塊,用于根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化,其中,在所述當(dāng)前幀的量化之后,更新用于下一幀的位預(yù)算以用于估算所述下一幀的掩蔽門限;由此,所述PAM和量化模塊經(jīng)過電子方式配置,使得所述PAM通過考慮所述量化模塊所更新的位狀態(tài)來估算所述掩蔽門限。
      11.如權(quán)利要求10所述的音頻編碼器,其特征在于,還包括用于接收來自輸入的未壓縮音頻數(shù)據(jù)的部件;以及濾波器組,電連接到所述接收部件,用于生成所述未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜;其中,所述濾波器組電連接到所述PAM,使得所述MDCT頻譜被輸出到所述PAM。
      12.如權(quán)利要求10所述的音頻編碼器,其特征在于,還包括用于對(duì)所述量化音頻數(shù)據(jù)編碼的編碼模塊。
      13.如權(quán)利要求12所述的音頻編碼器,其特征在于,所述編碼模塊是熵編碼模塊。
      14.如權(quán)利要求11所述的音頻編碼器,其特征在于,所述濾波器組采用下式生成所述MDCT頻譜Xi,k=2&Sigma;n=0N-1zi,ncos(2&pi;N(n+no)(k+12)),for0&le;k&le;N/2]]>其中,Xi,k是在塊索引i和頻譜索引k處的MDCT系數(shù);z是加窗口輸入序列;n是樣本索引;k是頻譜系數(shù)索引;i是塊索引;以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048,以及短窗口為256);其中no計(jì)算為(N/2+1)/2。
      15.如權(quán)利要求10所述的音頻編碼器,其特征在于,所述心理聲學(xué)模型(PAM)通過以下操作來估算所述掩蔽門限采用所述MDCT頻譜在比例因子段域中計(jì)算能量;執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù);計(jì)算音調(diào)索引;執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán));以及安靜地執(zhí)行與門限的比較;由此輸出所述掩蔽門限用于量化。
      16.如權(quán)利要求15所述的音頻編碼器,其特征在于,執(zhí)行量化的所述步驟還包括采用不均勻量化器按照下式執(zhí)行量化x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中,x_quantized(i)是在比例因子段索引(i)處的量化頻譜值;i是比例因子段索引,x是要量化的段內(nèi)的頻譜值,gl是全局比例因子(速率控制參數(shù)),以及scf(i)是比例因子值(失真控制參數(shù))。
      17.如權(quán)利要求16所述的音頻編碼器,其特征在于,執(zhí)行量化的所述步驟還包括僅尋找控制失真的比例因子值,不調(diào)節(jié)所述全局比例因子值,由此把所述全局比例因子值作為所述比例因子的第一值(scf(0))。
      18.如權(quán)利要求15所述的音頻編碼器,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括采用下式線性調(diào)節(jié)變量QNewQ=Q1+(R1-desired_R)(Q2-Q1)/(R2-R1)其中,NewQ是調(diào)節(jié)“之后”的變量Q;Q1和Q2分別是前一和二幀的Q值;R1和R2是用于前一和前二幀的位數(shù)量;以及desired_R是已使用位的預(yù)期數(shù)量;其中,值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。
      19.如權(quán)利要求18所述的音頻編碼器,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新所述已調(diào)節(jié)梯度。
      20.如權(quán)利要求18所述的音頻編碼器,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括限制所述變量Q的值并根據(jù)各個(gè)幀中的能含量按比例地將其分布于三個(gè)幀。
      21.如權(quán)利要求18所述的音頻編碼器,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括通過采用所述Q的值以及音調(diào)索引對(duì)所述掩蔽門限的調(diào)節(jié)加權(quán),以便更好地考慮可用于編碼的位數(shù)量。
      22.一種電子裝置,包括能夠接收未壓縮音頻數(shù)據(jù)的電子電路;計(jì)算機(jī)可讀媒體,嵌入了音頻編碼器,使得所述未壓縮音頻數(shù)據(jù)可經(jīng)過壓縮以用于傳送和/或存儲(chǔ)目的;以及能夠向所述電子裝置的用戶輸出所述壓縮音頻數(shù)據(jù)的電子電路;其中,所述音頻編碼器包括心理聲學(xué)模型(PAM),用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限,其中,所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算;以及量化模塊,用于根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化,其中,在所述當(dāng)前幀的量化之后,更新用于下一幀的位預(yù)算以用于估算所述下一幀的掩蔽門限;由此,所述PAM和量化模塊經(jīng)過電子方式配置,使得所述PAM通過考慮所述量化模塊所更新的位狀態(tài)來估算所述掩蔽門限。
      23.如權(quán)利要求22所述的電子裝置,其特征在于,所述音頻編碼器還包括用于接收來自輸入的未壓縮音頻數(shù)據(jù)的部件;以及濾波器組,電連接到所述接收部件,用于生成所述未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜;其中,所述濾波器組電連接到所述PAM,使得所述MDCT頻譜被輸出到所述PAM。
      24.如權(quán)利要求22所述的電子裝置,其特征在于,所述音頻編碼器還包括用于對(duì)所述量化音頻數(shù)據(jù)編碼的編碼模塊。
      25.如權(quán)利要求24所述的電子裝置,其特征在于,所述編碼模塊是熵編碼模塊。
      26.如權(quán)利要求23所述的電子裝置,其特征在于,所述濾波器組采用下式生成所述MDCT頻譜Xi,k=2&Sigma;n=0N-1zi,ncos(2&pi;N(n+no)(k+12)),for0&le;k&le;N/2]]>其中,Xi,k是在塊索引i和頻譜索引k處的MDCT系數(shù);z是加窗口輸入序列;n是樣本索引;k是頻譜系數(shù)索引;i是塊索引;以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048,以及短窗口為256);其中no計(jì)算為(N/2+1)/2。
      27.如權(quán)利要求22所述的電子裝置,其特征在于,所述心理聲學(xué)模型(PAM)通過以下操作來估算所述掩蔽門限采用所述MDCT頻譜在比例因子段域中計(jì)算能量;執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù);計(jì)算音調(diào)索引;執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán));以及安靜地執(zhí)行與門限的比較;由此輸出所述掩蔽門限用于量化。
      28.如權(quán)利要求27所述的電子裝置,其特征在于,執(zhí)行量化的所述步驟還包括采用不均勻量化器按照下式執(zhí)行量化x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中,x_quantized(i)是在比例因子段索引(i)處的量化頻譜值;i是比例因子段索引,x是要量化的段內(nèi)的頻譜值,gl是全局比例因子(速率控制參數(shù)),以及scf(i)是比例因子值(失真控制參數(shù))。
      29.如權(quán)利要求28所述的電子裝置,其特征在于,執(zhí)行量化的所述步驟還包括僅尋找控制失真的比例因子值,不調(diào)節(jié)所述全局比例因子值,由此把所述全局比例因子值作為所述比例因子的第一值(scf(0))。
      30.如權(quán)利要求27所述的電子裝置,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括采用下式線性調(diào)節(jié)變量QNewQ=Q1+(R1-desired_R)(R2-Q1/)(R2-R1)其中,NewQ是調(diào)節(jié)“之后”的變量Q;Q1和Q2分別是前一和二幀的Q值;R1和R2是用于前一和前二幀的位數(shù)量;以及desired_R是已使用位的預(yù)期數(shù)量;其中,值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。
      31.如權(quán)利要求30所述的電子裝置,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新所述已調(diào)節(jié)梯度。
      32.如權(quán)利要求30所述的電子裝置,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括限制所述變量Q的值并根據(jù)各個(gè)幀中的能含量按比例地將其分布于三個(gè)幀。
      33.如權(quán)利要求30所述的電子裝置,其特征在于,執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括通過采用所述Q的值以及音調(diào)索引對(duì)所述掩蔽門限的調(diào)節(jié)加權(quán),以便更好地考慮可用于編碼的位數(shù)量。
      34.如權(quán)利要求22所述的電子裝置,其特征在于,所述電子裝置包括音頻播放器/記錄器、PDA、袖珍組織器、帶音頻記錄功能的照相機(jī)、計(jì)算機(jī)和移動(dòng)電話。
      全文摘要
      本發(fā)明公開用于對(duì)音頻數(shù)據(jù)編碼的方法、用于對(duì)未壓縮音頻數(shù)據(jù)進(jìn)行壓縮的音頻編碼器以及能夠以低功耗對(duì)音頻數(shù)據(jù)編碼的電子裝置。電子裝置包括音頻播放器/記錄器、PDA、袖珍組織器、帶音頻記錄功能的照相機(jī)、計(jì)算機(jī)和移動(dòng)電話。
      文檔編號(hào)G10L19/035GK101064106SQ20071010297
      公開日2007年10月31日 申請(qǐng)日期2007年4月27日 優(yōu)先權(quán)日2006年4月28日
      發(fā)明者E·庫(kù)尼亞瓦蒂, S·喬治 申請(qǐng)人:意法半導(dǎo)體亞太私人有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1