用于低復(fù)雜度高級(jí)音頻編碼的自適應(yīng)速率控制算法的制作方法

文檔序號(hào)：2837253閱讀：433來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于低復(fù)雜度高級(jí)音頻編碼的自適應(yīng)速率控制算法的制作方法
技術(shù)領(lǐng)域：
一般來說，本發(fā)明涉及用于對(duì)音頻信號(hào)編碼的裝置及過程，更具體來說，涉及適用于特別是包括低功率裝置的、針對(duì)傳送或存儲(chǔ)目的的音頻壓縮領(lǐng)域的AAC-LC編碼器及方法。
背景技術(shù)：
有效的音頻編碼系統(tǒng)是可最佳地消除音頻流的不相關(guān)和冗余部分的那些系統(tǒng)。第一個(gè)通過經(jīng)由心理聲學(xué)分析減小心理聲學(xué)不相關(guān)來實(shí)現(xiàn)。術(shù)語(yǔ)“感知音頻編碼器”用來表示利用人類聽覺的屬性的那些壓縮方案。從冗余減小中得到進(jìn)一步的減小。
心理聲學(xué)分析根據(jù)人類聽力和聽覺的心理聲學(xué)模型生成掩蔽門限。心理聲學(xué)建模考慮人類聽力的頻率相關(guān)門限以及稱作掩蔽的心理聲學(xué)現(xiàn)象，由此，接近一個(gè)或多個(gè)較弱頻率分量的強(qiáng)頻率分量?jī)A向于掩蔽較弱的分量，使它們對(duì)人類聽眾是聽不見的。這使得能夠在對(duì)音頻信號(hào)編碼時(shí)省略較弱的頻率分量，由此取得更高程度的壓縮，而沒有不利地影響編碼音頻數(shù)據(jù)流的感知質(zhì)量。掩蔽數(shù)據(jù)包括來自濾波器組的每個(gè)子頻段的信號(hào)掩碼比值。這些信號(hào)掩碼比值表示每個(gè)子頻段中被入耳掩蔽的信號(hào)的量，因而又稱作掩蔽門限。
圖1說明一種典型感知編碼器的示意功能框圖。感知編碼器1包括用于時(shí)間頻率變換的濾波器組2、心理聲學(xué)模型(PAM)3、量化單元4和熵單元5。濾波器組、PAM和量化單元是典型感知編碼器的主要部分。量化單元采用來自PAM的掩蔽門限來判定如何最佳地利用可用數(shù)量的數(shù)據(jù)位表示輸入音頻數(shù)據(jù)流。
MPEG4高級(jí)音頻編碼(AAC)是以低至64kbps的比特率實(shí)現(xiàn)透明CD質(zhì)量結(jié)果的目前技術(shù)水平的感知音頻編碼器。例如參見ISO/IEC14496-3，信息技術(shù)-視聽對(duì)象的編碼，第3部分音頻(1999)。圖2說明一種AAC感知編碼器的詳細(xì)功能框圖。AAC感知編碼器10包括AAC增益控制工具模塊11、心理聲學(xué)模型12、窗口長(zhǎng)度判定模塊13、濾波器組模塊14、頻譜處理模塊15、量化和編碼模塊16以及位流格式器模塊17。值得注意，AAC的額外頻譜處理由頻譜處理模塊15在量化之前執(zhí)行。這個(gè)頻譜處理塊用來減少冗余成分，主要由預(yù)測(cè)工具組成。
AAC采用修改的離散余弦變換(MDCT)，在其濾波器組模塊中具有50％交迭。在交迭添加過程之后，由于時(shí)域混疊抵消，預(yù)計(jì)得到原始信號(hào)的正確重構(gòu)。但是，情況不是這樣，因?yàn)樵诹炕^程中產(chǎn)生誤差。感知編碼器的構(gòu)思是隱藏這個(gè)量化誤差，使得我們的聽力不會(huì)注意到它。我們無法聽到的那些頻譜分量也從編碼流中消除。這種不相關(guān)減小利用人耳的掩蔽屬性。掩蔽門限的計(jì)算屬于編碼器的計(jì)算密集任務(wù)。
如圖3所示，AAC量化模塊16以兩個(gè)嵌套循環(huán)進(jìn)行操作。內(nèi)循環(huán)包括調(diào)節(jié)全局增益32、計(jì)算已使用位33以及確定是否滿足比特率限制34的操作。簡(jiǎn)言之，內(nèi)循環(huán)量化輸入向量，以及增加量化器步長(zhǎng)，直到輸出向量可采用可用數(shù)量的位來編碼為止。在完成內(nèi)循環(huán)之后，外循環(huán)檢查各比例因子段35的失真，以及如果超過所允許失真36，則放大比例因子段31并再次調(diào)用內(nèi)循環(huán)。AAC采用不均勻量化器。
高質(zhì)量感知編碼器具有詳盡的心理聲學(xué)模型(PAM)來計(jì)算掩蔽門限，它是所允許失真的指示。如圖4所示，PAM通過以下步驟計(jì)算掩蔽門限時(shí)域輸入的FFT 41、在1/3巴克域中計(jì)算能量42、采用擴(kuò)展函數(shù)進(jìn)行卷積43、音調(diào)索引計(jì)算44、掩蔽門限調(diào)節(jié)45、安靜地與門限進(jìn)行比較46以及適配比例因子段域47。由于有限的時(shí)間或計(jì)算資源，常常不得不違反這個(gè)門限，因?yàn)閮H僅可用的位不足以滿足掩蔽門限需求。這造成位分配模塊中的額外計(jì)算負(fù)擔(dān)，因?yàn)樗谶_(dá)到退出條件之前迭代進(jìn)行設(shè)法適應(yīng)失真和比特率要求的嵌套循環(huán)。
AAC的另一個(gè)特征是根據(jù)信號(hào)是穩(wěn)定還是瞬變?cè)趦蓚€(gè)不同窗口大小之間轉(zhuǎn)換的能力。這個(gè)特征防止所有感知編碼器易于遇到的前回波偽像。
要注意，圖2說明具有包括下列各項(xiàng)的標(biāo)準(zhǔn)中定義的3個(gè)類型的MPEG4-AAC的完整圖主要類型(其中所有工具已啟用，要求強(qiáng)大的處理能力)；低復(fù)雜度(LC)類型(具有較小的壓縮比，以便節(jié)省處理和RAM使用)；以及可縮放抽樣率類型(具有適應(yīng)各種帶寬的能力)。處理能力節(jié)省是我們主要關(guān)心的問題，本發(fā)明僅涉及LC類型。
還要注意，AAC-LC僅采用暫時(shí)噪聲整形(TNS)子模塊和立體編碼子模塊，而沒有如圖2所示的頻譜處理模塊15中的其余預(yù)測(cè)工具。與塊交換配合工作，TNS還用于通過控制量化噪聲的暫時(shí)形狀來減小前回波偽像。但是，在LC類型中，TNS的階數(shù)受到限制。立體編碼用于通過把左和右系數(shù)編碼為和與差，來控制編碼噪聲的成像。
AAC標(biāo)準(zhǔn)僅確保有效的AAC流可由所有AAC解碼器正確解碼。編碼器可適應(yīng)適合于不同的可用資源和應(yīng)用區(qū)域的實(shí)現(xiàn)中的變化。AAC-LC是經(jīng)過平鋪以便具有比其它類型更少的計(jì)算負(fù)擔(dān)的類型。但是，整體效率仍然取決于編碼器本身的具體實(shí)現(xiàn)。在Kurniawati等人的“有效MPEG高級(jí)音頻編碼器的新實(shí)現(xiàn)技術(shù)”(IEEE Transactions onConsumer Electronics(2004)，Vol.50，第655-665頁(yè))中概述了優(yōu)化AAC-LC編碼器的某些先有嘗試。但是，對(duì)MPEG4-AAC的進(jìn)一步改進(jìn)對(duì)于在以低電源運(yùn)行的低比特率裝置中傳送和存儲(chǔ)具有高質(zhì)量的音頻數(shù)據(jù)仍然是合乎需要的。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面，提供一種用于對(duì)音頻數(shù)據(jù)編碼的方法，包括接收來自輸入的未壓縮音頻數(shù)據(jù)；采用濾波器組生成所述未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜；根據(jù)所述MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限，其中，所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算；根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化，其中，在所述當(dāng)前幀的量化之后，更新用于下一幀的位預(yù)算以便估算所述下一幀的掩蔽門限；以及對(duì)所述量化音頻數(shù)據(jù)編碼。
根據(jù)本發(fā)明的另一方面，提供一種音頻編碼器，用于壓縮未壓縮音頻數(shù)據(jù)，所述音頻編碼器包括心理聲學(xué)模型(PAM)，用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限，其中，所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算；以及量化模塊，用于根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化，其中，在所述當(dāng)前幀的量化之后，更新用于下一幀的位預(yù)算以用于估算所述下一幀的掩蔽門限；由此，所述PAM和量化模塊經(jīng)過電子方式配置，使得所述PAM通過考慮所述量化模塊所更新的位狀態(tài)來估算所述掩蔽門限。
根據(jù)本發(fā)明的又一方面，提供一種電子裝置，包括能夠接收未壓縮音頻數(shù)據(jù)的電子電路；計(jì)算機(jī)可讀媒體，嵌入了音頻編碼器，使得所述未壓縮音頻數(shù)據(jù)可經(jīng)過壓縮以用于傳送和/或存儲(chǔ)目的；以及能夠向所述電子裝置的用戶輸出所述壓縮音頻數(shù)據(jù)的電子電路；其中，所述音頻編碼器包括心理聲學(xué)模型(PAM)，用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限，其中，所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算；以及量化模塊，用于根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化，其中，在所述當(dāng)前幀的量化之后，更新用于下一幀的位預(yù)算以用于估算所述下一幀的掩蔽門限；由此，所述PAM和量化模塊經(jīng)過電子方式配置，使得所述PAM通過考慮所述量化模塊所更新的位狀態(tài)來估算所述掩蔽門限。

現(xiàn)在參照附圖來描述根據(jù)本發(fā)明的優(yōu)選實(shí)施例，附圖中，相似參考標(biāo)號(hào)表示相似元件。
圖1說明一種典型感知編碼器的示意功能框圖。
圖2說明MPEG4-AAC感知編碼器的詳細(xì)功能框圖。
圖3說明集中于PAM和位分配模塊的傳統(tǒng)編碼器結(jié)構(gòu)。
圖4說明掩蔽門限的傳統(tǒng)估算。
圖5說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的AAC-LC編碼器的PAM和量化單元的配置。
圖6說明根據(jù)本發(fā)明的一個(gè)實(shí)施例、用于掩蔽門限估算的圖5的簡(jiǎn)化PAM 50的功能流程圖。
圖7說明Q值與用于長(zhǎng)窗口中的位數(shù)量之間的相關(guān)。
圖8說明Q值與用于長(zhǎng)窗口中的位數(shù)量之間的相關(guān)。
圖9說明Q值與用于短窗口中的位數(shù)量之間的相關(guān)。
圖10說明梯度和Q調(diào)節(jié)。
圖11說明本發(fā)明可適用的示范電子裝置。
具體實(shí)施例方式
通過參照本發(fā)明的某些實(shí)施例的以下詳細(xì)描述，可更易于理解本發(fā)明。
在引用出版物的本申請(qǐng)中，這些出版物的公開通過引用完整地結(jié)合到本申請(qǐng)中，以便更全面地描述本發(fā)明涉及的技術(shù)發(fā)展水平。
本發(fā)明的一個(gè)實(shí)施例提供用于對(duì)音頻數(shù)據(jù)編碼的過程。在這個(gè)實(shí)施例中，該過程包括接收來自輸入的未壓縮音頻數(shù)據(jù)；采用濾波器組生成未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜；根據(jù)MDCT頻譜估算用于要編碼的當(dāng)前幀的掩蔽門限，其中，掩蔽門限反映用于當(dāng)前幀的位預(yù)算；根據(jù)掩蔽門限執(zhí)行當(dāng)前幀的量化，其中，在當(dāng)前幀的量化之后，更新用于下一幀的位預(yù)算以便估算下一幀的掩蔽門限；以及對(duì)量化音頻數(shù)據(jù)編碼。
在該過程的另一個(gè)實(shí)施例中，生成MDCT頻譜的步驟還包括采用下式來生成MDCT頻譜
Xi,k=2Σn=0N-1zi,ncos(2πN(n+no)(k+12)),for0≤k≤N/2]]>其中，Xi，k是在塊索引i和頻譜索引k的MDCT系數(shù)；z是加窗口輸入序列；n是樣本索引；k是頻譜系數(shù)索引；i是塊索引；以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048，以及短窗口為256)；其中no計(jì)算為(N/2+1)/2。
在該過程的另一個(gè)實(shí)施例中，估算掩蔽門限的步驟還包括采用MDCT頻譜在比例因子段域中計(jì)算能量；執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù)；計(jì)算音調(diào)索引；執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán))；以及安靜地執(zhí)行與門限的比較；由此輸出用于量化的掩蔽門限。
在該過程的又一個(gè)實(shí)施例中，執(zhí)行量化的步驟還包括采用不均勻量化器按照下式執(zhí)行量化x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中，x_quantized(i)是在比例因子段索引(i)處的量化頻譜值；i是比例因子段索引，x是要量化的段內(nèi)的頻譜值，gl是全局比例因子(速率控制參數(shù))，以及scf(i)是比例因子值(失真控制參數(shù))。
在該過程的又一個(gè)實(shí)施例中，執(zhí)行量化的步驟還包括僅尋找控制失真的比例因子值，不調(diào)節(jié)全局比例因子值，由此把全局比例因子值作為比例因子的第一值(scf(0))。
在該過程的又一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括采用下式線性調(diào)節(jié)變量QNewQ＝Q1+(R1-desired_R)(Q2-Q1)/(R2-R1)其中，NewQ是調(diào)節(jié)“之后”的變量Q；Q1和Q2分別是前一和二幀的Q值；R1和R2是用于前一和前二幀的位數(shù)量；以及desired_R是已使用位的預(yù)期數(shù)量；其中，值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。在該過程的又一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新已調(diào)節(jié)梯度。在該過程的又一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括限制變量Q的值并根據(jù)各個(gè)幀中的能含量按比例地將其分布于三個(gè)幀。在該過程的又一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括通過采用Q的值以及音調(diào)索引對(duì)掩蔽門限的調(diào)節(jié)加權(quán)，以便更好地考慮可用于編碼的位數(shù)量。
本發(fā)明的另一個(gè)實(shí)施例提供用于壓縮未壓縮音頻數(shù)據(jù)的音頻編碼器。在這個(gè)實(shí)施例中，音頻編碼器包括心理聲學(xué)模型(PAM)，用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限，其中，掩蔽門限反映用于當(dāng)前幀的位預(yù)算；以及量化模塊，用于根據(jù)掩蔽門限執(zhí)行當(dāng)前幀的量化，其中，在當(dāng)前幀的量化之后，更新用于下一幀的位預(yù)算以便估算下一幀的掩蔽門限；由此，PAM和量化模塊經(jīng)過電子方式配置，使得PAM通過考慮量化模塊所更新的位狀態(tài)來估算掩蔽門限。在音頻編碼器的另一個(gè)實(shí)施例中，還包括用于接收來自輸入的未壓縮音頻數(shù)據(jù)的部件；以及濾波器組，電連接到接收部件，用于生成未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜；其中，濾波器組電連接到PAM，使得MDCT頻譜被輸出到PAM。在音頻編碼器的另一個(gè)實(shí)施例中，還包括用于對(duì)量化音頻數(shù)據(jù)編碼的編碼模塊。在音頻編碼器的又一個(gè)實(shí)施例中，編碼模塊是熵編碼模塊。
在音頻編碼器的另一個(gè)實(shí)施例中，濾波器組采用下式生成MDCT頻譜Xi,k=2Σn=0N-1zi,ncos(2πN(n+no)(k+12)),for0≤k≤N/2]]>其中，Xi，k是在塊索引i和頻譜索引k處的MDCT系數(shù)；z是加窗口輸入序列；n是樣本索引；k是頻譜系數(shù)索引；i是塊索引；以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048，以及短窗口為256)；其中no計(jì)算為(N/2+1)/2。
在音頻編碼器的另一個(gè)實(shí)施例中，心理聲學(xué)模型(PAM)通過以下操作來估算掩蔽門限采用MDCT頻譜在比例因子段域中計(jì)算能量；執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù)；計(jì)算音調(diào)索引；執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán))；以及安靜地執(zhí)行與門限的比較；由此輸出掩蔽門限用于量化。
在音頻編碼器的另一個(gè)實(shí)施例中，執(zhí)行量化的步驟還包括采用不均勻量化器按照下式執(zhí)行量化x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中，x_quantized(i)是在比例因子段索引(i)處的量化頻譜值；i是比例因子段索引，x是要量化的段內(nèi)的頻譜值，gl是全局比例因子(速率控制參數(shù))，以及scf(i)是比例因子值(失真控制參數(shù))。
在音頻編碼器的一個(gè)實(shí)施例中，執(zhí)行量化的步驟還包括僅尋找控制失真的比例因子值，不調(diào)節(jié)全局比例因子值，由此把全局比例因子值作為比例因子的第一值(scf(0))。
在音頻編碼器的另一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括采用下式線性調(diào)節(jié)變量QNewQ＝Q1+(R1-desired_R)(Q2-Q1)/(R2-R1)其中，NewQ是調(diào)節(jié)“之后”的變量Q；Q1和Q2分別是前一和二幀的Q值；R1和R2是用于前一和前二幀的位數(shù)量；以及desired_R是已使用位的預(yù)期數(shù)量；其中，值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。在音頻編碼器的又一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新已調(diào)節(jié)梯度。在音頻編碼器的又一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括限制變量Q的值并根據(jù)各個(gè)幀中的能含量按比例地將其分布于三個(gè)幀。在編碼器的又一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括通過采用Q的值以及音調(diào)索引對(duì)掩蔽門限的調(diào)節(jié)加權(quán)，以便更好地考慮可用于編碼的位數(shù)量。
本發(fā)明的另一個(gè)實(shí)施例提供一種電子裝置，它包括能夠接收未壓縮音頻數(shù)據(jù)的電子電路；計(jì)算機(jī)可讀媒體，嵌入了音頻編碼器，使得未壓縮音頻數(shù)據(jù)可經(jīng)過壓縮以用于傳送和/或存儲(chǔ)目的；以及能夠把壓縮音頻數(shù)據(jù)輸出給電子裝置的用戶的電子電路；其中，音頻編碼器包括心理聲學(xué)模型(PAM)，用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前值的掩蔽門限，其中，掩蔽門限反映用于當(dāng)前幀的位預(yù)算；以及量化模塊，用于根據(jù)掩蔽門限執(zhí)行當(dāng)前幀的量化，其中，在當(dāng)前幀的量化之后，更新用于下一幀的位預(yù)算以便估算下一幀的掩蔽門限；由此，PAM和量化模塊經(jīng)過電子方式配置，使得PAM通過考慮量化模塊所更新的位狀態(tài)來估算掩蔽門限。
在電子裝置的另一個(gè)實(shí)施例中，音頻編碼器還包括用于接收來自輸入的未壓縮音頻數(shù)據(jù)的部件；以及濾波器組，電連接到接收部件，用于生成未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜；其中，濾波器組電連接到PAM，使得MDCT頻譜被輸出到PAM。在電子裝置的另一個(gè)實(shí)施例中，音頻編碼器還包括用于對(duì)量化音頻數(shù)據(jù)編碼的編碼模塊。在電子裝置的另一個(gè)實(shí)施例中，編碼模塊是熵編碼模塊。
在電子裝置的另一個(gè)實(shí)施例中，濾波器組采用下式生成MDCT頻譜Xi,k=2Σn=0N-1zi,ncos(2πN(n+no)(k+12)),for0≤k≤N/2]]>其中，Xi，k是在塊索引i和頻譜索引k處的MDCT系數(shù)；z是加窗口輸入序列；n是樣本索引；k是頻譜系數(shù)索引；i是塊索引；以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048，以及短窗口為256)；其中no計(jì)算為(N/2+1)/2。
在電子裝置的另一個(gè)實(shí)施例中，心理聲學(xué)模型(PAM)通過以下操作來估算掩蔽門限采用MDCT頻譜在比例因子段域中計(jì)算能量；執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù)；計(jì)算音調(diào)索引；執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán))；以及安靜地執(zhí)行與門限的比較；由此輸出掩蔽門限用于量化。
在電子裝置的另一個(gè)實(shí)施例中，執(zhí)行量化的步驟還包括采用不均勻量化器按照下式執(zhí)行量化
x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中，x_quantized(i)是在比例因子段索引(i)處的量化頻譜值；i是比例因子段索引，x是要量化的段內(nèi)的頻譜值，gl是全局比例因子(速率控制參數(shù))，以及scf(i)是比例因子值(失真控制參數(shù))。
在電子裝置的一個(gè)實(shí)施例中，執(zhí)行量化的步驟還包括僅尋找控制失真的比例因子值，不調(diào)節(jié)全局比例因子值，由此把全局比例因子值作為比例因子的第一值(scf(0))。
在電子裝置的另一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括采用下式線性調(diào)節(jié)變量QNewQ＝Q1+(R1-desired_R)(Q2-Q1)/(R2-R1)其中，NewQ是調(diào)節(jié)“之后”的變量Q；Q1和Q2分別是前一和二幀的Q值；R1和R2是用于前一和前二幀的位數(shù)量；以及desired_R是已使用位的預(yù)期數(shù)量；其中，值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。在電子裝置的又一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新已調(diào)節(jié)梯度。在電子裝置的又一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括限制變量Q的值并根據(jù)各個(gè)幀中的能含量按比例地將其分布于三個(gè)幀。在電子裝置的又一個(gè)實(shí)施例中，執(zhí)行掩蔽門限調(diào)節(jié)的步驟還包括通過采用Q的值以及音調(diào)索引對(duì)掩蔽門限的調(diào)節(jié)加權(quán)，以便更好地考慮可用于編碼的位數(shù)量。
在電子裝置的另一個(gè)實(shí)施例中，電子裝置包括音頻播放器/記錄器、PDA、袖珍組織器、帶音頻記錄功能的照相機(jī)、計(jì)算機(jī)和移動(dòng)電話。
本發(fā)明提供一種用于通過利用心理聲學(xué)模型(PAM)和量化單元的互配低功率實(shí)現(xiàn)AAC-LC編碼器的音頻編碼器和音頻編碼方法。參照?qǐng)D5，提供根據(jù)本發(fā)明的一個(gè)實(shí)施例的AAC-LC編碼器的PAM和量化單元的配置。如上所述，傳統(tǒng)編碼器計(jì)算掩蔽門限要求，并將它作為輸入饋送給量化模塊；具有掩蔽門限的精確估算的構(gòu)思是計(jì)算密集的，并且使位分配模塊的工作是任務(wù)更繁重的。本發(fā)明旨在揭示反映當(dāng)前幀中的位預(yù)算的掩蔽門限，它允許編碼器跳過速率控制循環(huán)。在本發(fā)明中，位分配模塊在確定下一幀的掩蔽門限中起作用，使得確保所使用的位不超過預(yù)算。當(dāng)信號(hào)特性隨時(shí)間改變時(shí)，不斷需要調(diào)整以便讓這個(gè)方案工作。此外，本發(fā)明具有使軟件和硬件實(shí)現(xiàn)為最小的適當(dāng)?shù)暮?jiǎn)單結(jié)構(gòu)。
現(xiàn)在參照?qǐng)D5，本發(fā)明的量化過程包括下文所述的簡(jiǎn)化PAM模塊52接收MDCT 51的輸出作為輸入以計(jì)算掩蔽門限；位分配過程，包括具有調(diào)節(jié)比例因子和全局增益53、計(jì)算失真54和確定失真是否低于掩蔽門限55的單循環(huán)；計(jì)算所使用的位56；調(diào)節(jié)Q調(diào)節(jié)梯度57；以及對(duì)于高質(zhì)量類型，根據(jù)未來幀中的能量分布設(shè)置Q的限制58。與圖3所示的傳統(tǒng)方法的主要差別之一在于位分配模塊，在其中，本發(fā)明僅采用失真控制循環(huán)代替原始的二嵌套循環(huán)。比例因子值經(jīng)過選擇，使得它們滿足掩蔽門限要求。速率控制函數(shù)由按照已使用位的實(shí)際數(shù)量調(diào)節(jié)的變量Q來承擔(dān)。這個(gè)值將用于對(duì)下一幀的掩蔽門限計(jì)算進(jìn)行微調(diào)。
利用表示可用位的狀態(tài)的變量Q，編碼器嘗試修整掩蔽門限以適合位預(yù)算，使得可省略速率控制循環(huán)。心理聲學(xué)模型輸出掩蔽門限，它已經(jīng)結(jié)合從比特率限制中突出的噪聲。Q的調(diào)節(jié)取決于把Q與已使用位的實(shí)際數(shù)量相關(guān)的梯度。這個(gè)梯度被逐幀調(diào)節(jié)，以便反映信號(hào)特性的變化。對(duì)于長(zhǎng)塊和短塊維護(hù)兩個(gè)分開的梯度，并且在塊交換的情況中執(zhí)行重置。
圖6說明根據(jù)本發(fā)明的一個(gè)實(shí)施例、用于掩蔽門限估算的圖5的簡(jiǎn)化PAM 50的功能流程圖。掩蔽門限估算的操作包括采用MDCT頻譜在比例因子段域中計(jì)算能量61；執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù)62；計(jì)算音調(diào)索引63；執(zhí)行掩蔽門限調(diào)節(jié)(以Q加權(quán))64；以及安靜地執(zhí)行與門限的比較65，對(duì)量化模塊輸出掩蔽門限。
現(xiàn)在提供根據(jù)本發(fā)明的一個(gè)實(shí)施例的AAC-LC編碼器的操作的更詳細(xì)描述。要注意，本發(fā)明是現(xiàn)有AAC-LC編碼器的改進(jìn)，所以許多共同特征不作詳細(xì)論述，以便不影響對(duì)本發(fā)明的理解。本發(fā)明的AAC-LC編碼器的操作包括在濾波器組中生成MDCT頻譜，在PAM中估算掩蔽門限，以及執(zhí)行量化和編碼。重點(diǎn)放在本發(fā)明的AAC-LC編碼器的操作與標(biāo)準(zhǔn)AAC-LC編碼器的操作之間的差別。
為了生成MDCT頻譜，AAC-LC編碼器的濾波器組模塊中使用的MDCT用公式表示如下Xi,k=2Σn=0N-1zi,ncos(2πN(n+no)(k+12)),for0≤k≤N/2---(1)]]>其中，Xi，k是在塊索引i和頻譜索引k處的MDCT系數(shù)；z是加窗口輸入序列；n是樣本索引；k是頻譜系數(shù)索引；i是塊索引；以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048，以及短窗口為256)；其中no計(jì)算為(N/2+1)/2。
為了估算掩蔽門限，結(jié)合圖6描述本發(fā)明的簡(jiǎn)化PAM的詳細(xì)操作。簡(jiǎn)化PAM的特征包括下列各項(xiàng)。首先，為了效率的原因，簡(jiǎn)化PAM采用MDCT頻譜進(jìn)行分析。其次，能量等級(jí)的計(jì)算直接在比例因子段域中執(zhí)行。第三，采用簡(jiǎn)單三角擴(kuò)展函數(shù)，其中斜率為每巴克+25dB以及每巴克-10dB。第四，音調(diào)索引采用頻譜平坦性度量來計(jì)算。最后，作為速率控制變量的已加權(quán)Q用來調(diào)節(jié)掩蔽門限。在傳統(tǒng)上，這個(gè)步驟反映信號(hào)音和噪聲的不同掩蔽能力。由于噪聲更好地掩蔽，所以，掩蔽門限在音調(diào)值低時(shí)調(diào)節(jié)成更高，以及在音調(diào)值高時(shí)調(diào)節(jié)成更低。在本發(fā)明中，除了音調(diào)之外，還結(jié)合Q以便對(duì)掩蔽門限進(jìn)行微調(diào)以適合可用位。
對(duì)于位分配量化，AAC采用不均勻量化器
x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]---(2)]]>其中，x_quantized(i)是在比例因子段索引(i)處的量化頻譜值；i是比例因子段索引，x是要量化的段內(nèi)的頻譜值，gl是全局比例因子(速率控制參數(shù))，以及scf(i)是比例因子值(失真控制參數(shù))。
在本發(fā)明中，僅尋找比例因子值以控制失真。全局比例因子值從不調(diào)節(jié)，并且作為比例因子的第一值(scf(0))。
對(duì)于Q和梯度調(diào)節(jié)，圖10說明這些調(diào)節(jié)。Q采用下式線性調(diào)節(jié)NewQ＝Q1+(R1-desired_R)(Q2-Q1)/(R2-R1) (3)其中，NewQ是調(diào)節(jié)“之后”的變量Q；Q1和Q2分別是前一和二幀的Q值；R1和R2是用于前一和前二幀的位數(shù)量；以及desired_R是已使用位的預(yù)期數(shù)量；其中，值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。
當(dāng)Q高時(shí)，掩蔽門限經(jīng)過調(diào)節(jié)，使得它更精確，從而引起所使用位的數(shù)量的增加。另一方面，當(dāng)位預(yù)算低時(shí)，Q將減小，使得在下一幀中，掩蔽門限不要求過多數(shù)量的位。
Q和比特率的相關(guān)取決于信號(hào)的性質(zhì)。圖7、圖8和圖9說明這兩個(gè)變量之間的相關(guān)。Q的不同變化表示用于信號(hào)的不同部分的位的不同變化。因此，把這兩個(gè)變量相關(guān)的梯度必須不斷調(diào)節(jié)。最顯著的實(shí)例是長(zhǎng)塊(圖7和圖8)與短塊(圖9)中梯度之間的差別。本發(fā)明在塊交換事件期間執(zhí)行這個(gè)梯度的硬重置。
在高質(zhì)量類型中，除比特率之外，本發(fā)明還采用三個(gè)幀上的能量分布來確定Q調(diào)節(jié)。這將確保沒有對(duì)具有較高能含量的幀設(shè)置Q的較低值。通過這種方案，取得更大的靈活性，并且獲得幀上的更優(yōu)化位分布。
本發(fā)明提供單循環(huán)速率失真控制算法，它基于掩蔽門限的加權(quán)調(diào)節(jié)，采用由從與根據(jù)能量把位分布于幀的選項(xiàng)配合使用的實(shí)際位所計(jì)算的變化梯度得到的自適應(yīng)變量Q。
本發(fā)明的AAC-LC編碼器可在任何適當(dāng)?shù)碾娮友b置中用于音頻信號(hào)處理。如圖11所示，AAC-LC編碼引擎可把未壓縮音頻數(shù)據(jù)變換為AAC格式的音頻數(shù)據(jù)以便進(jìn)行傳送和存儲(chǔ)。例如音頻播放器/記錄器、PDA、袖珍組織器、帶音頻記錄功能的照相機(jī)、計(jì)算機(jī)和移動(dòng)電話之類的電子裝置包括其中可嵌入AAC-LC算法的計(jì)算機(jī)可讀媒體。
雖然參照具體實(shí)施例描述了本發(fā)明，但是大家會(huì)理解，這些實(shí)施例是說明性的，并且本發(fā)明的范圍不受此限制。對(duì)于本發(fā)明涉及的領(lǐng)域的技術(shù)人員，本發(fā)明的備選實(shí)施例非常明顯。這類備選實(shí)施例被認(rèn)為包含在本發(fā)明的精神和范圍之內(nèi)。因此，本發(fā)明的范圍由所附權(quán)利要求來描述，并由前面的描述支持。
權(quán)利要求
1.一種用于對(duì)音頻數(shù)據(jù)編碼的方法，包括接收來自輸入的未壓縮音頻數(shù)據(jù)；采用濾波器組生成所述未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜；根據(jù)所述MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限，其中，所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算；根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化，其中，在所述當(dāng)前幀的量化之后，更新用于下一幀的位預(yù)算以便估算所述下一幀的掩蔽門限；以及對(duì)所述量化音頻數(shù)據(jù)編碼。
2.如權(quán)利要求1所述的方法，其特征在于，生成MDCT頻譜的所述步驟還包括采用下式來生成MDCT頻譜Xi,k=2Σn=0N-1zi,ncos(2πN(n+no)(k+12)),for0≤k≤N/2]]>其中，Xi，k是在塊索引i和頻譜索引k處的MDCT系數(shù)；z是加窗口輸入序列；n是樣本索引；k是頻譜系數(shù)索引；i是塊索引；以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048，以及短窗口為256)；其中no計(jì)算為(N/2+1)/2。
3.如權(quán)利要求1所述的方法，其特征在于，估算掩蔽門限的所述步驟還包括采用所述MDCT頻譜在比例因子段域中計(jì)算能量；執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù)；計(jì)算音調(diào)索引；執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán))；以及安靜地執(zhí)行與門限的比較；由此輸出所述掩蔽門限用于量化。
4.如權(quán)利要求3所述的方法，其特征在于，執(zhí)行量化的所述步驟還包括采用不均勻量化器按照下式執(zhí)行量化x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中，x_quantized(i)是在比例因子段索引(i)處的量化頻譜值；i是比例因子段索引，x是要量化的段內(nèi)的頻譜值，gl是全局比例因子(速率控制參數(shù))，以及scf(i)是比例因子值(失真控制參數(shù))。
5.如權(quán)利要求4所述的方法，其特征在于，執(zhí)行量化的所述步驟還包括僅尋找控制失真的比例因子值，不調(diào)節(jié)所述全局比例因子值，由此把所述全局比例因子值作為所述比例因子的第一值(scf(0))。
6.如權(quán)利要求3所述的方法，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括采用下式線性調(diào)節(jié)變量QNewQ＝Q1+(R1-desired_R)(Q2-Q1)/(R2-R1)其中，NewQ是調(diào)節(jié)“之后”的變量Q；Q1和Q2分別是前一和二幀的Q值；R1和R2是用于前一和前二幀的位數(shù)量；以及desired_R是已使用位的預(yù)期數(shù)量；其中，值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。
7.如權(quán)利要求6所述的方法，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新所述已調(diào)節(jié)梯度。
8.如權(quán)利要求6所述的方法，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括限制所述變量Q的值并根據(jù)各個(gè)幀中的能含量按比例將其分布于三個(gè)幀。
9.如權(quán)利要求6所述的方法，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括通過采用所述Q的值以及音調(diào)索引對(duì)所述掩蔽門限的調(diào)節(jié)加權(quán)，以便更好地考慮可用于編碼的位數(shù)量。
10.一種音頻編碼器，用于壓縮未壓縮音頻數(shù)據(jù)，所述音頻編碼器包括心理聲學(xué)模型(PAM)，用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限，其中，所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算；以及量化模塊，用于根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化，其中，在所述當(dāng)前幀的量化之后，更新用于下一幀的位預(yù)算以用于估算所述下一幀的掩蔽門限；由此，所述PAM和量化模塊經(jīng)過電子方式配置，使得所述PAM通過考慮所述量化模塊所更新的位狀態(tài)來估算所述掩蔽門限。
11.如權(quán)利要求10所述的音頻編碼器，其特征在于，還包括用于接收來自輸入的未壓縮音頻數(shù)據(jù)的部件；以及濾波器組，電連接到所述接收部件，用于生成所述未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜；其中，所述濾波器組電連接到所述PAM，使得所述MDCT頻譜被輸出到所述PAM。
12.如權(quán)利要求10所述的音頻編碼器，其特征在于，還包括用于對(duì)所述量化音頻數(shù)據(jù)編碼的編碼模塊。
13.如權(quán)利要求12所述的音頻編碼器，其特征在于，所述編碼模塊是熵編碼模塊。
14.如權(quán)利要求11所述的音頻編碼器，其特征在于，所述濾波器組采用下式生成所述MDCT頻譜Xi,k=2Σn=0N-1zi,ncos(2πN(n+no)(k+12)),for0≤k≤N/2]]>其中，Xi，k是在塊索引i和頻譜索引k處的MDCT系數(shù)；z是加窗口輸入序列；n是樣本索引；k是頻譜系數(shù)索引；i是塊索引；以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048，以及短窗口為256)；其中no計(jì)算為(N/2+1)/2。
15.如權(quán)利要求10所述的音頻編碼器，其特征在于，所述心理聲學(xué)模型(PAM)通過以下操作來估算所述掩蔽門限采用所述MDCT頻譜在比例因子段域中計(jì)算能量；執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù)；計(jì)算音調(diào)索引；執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán))；以及安靜地執(zhí)行與門限的比較；由此輸出所述掩蔽門限用于量化。
16.如權(quán)利要求15所述的音頻編碼器，其特征在于，執(zhí)行量化的所述步驟還包括采用不均勻量化器按照下式執(zhí)行量化x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中，x_quantized(i)是在比例因子段索引(i)處的量化頻譜值；i是比例因子段索引，x是要量化的段內(nèi)的頻譜值，gl是全局比例因子(速率控制參數(shù))，以及scf(i)是比例因子值(失真控制參數(shù))。
17.如權(quán)利要求16所述的音頻編碼器，其特征在于，執(zhí)行量化的所述步驟還包括僅尋找控制失真的比例因子值，不調(diào)節(jié)所述全局比例因子值，由此把所述全局比例因子值作為所述比例因子的第一值(scf(0))。
18.如權(quán)利要求15所述的音頻編碼器，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括采用下式線性調(diào)節(jié)變量QNewQ＝Q1+(R1-desired_R)(Q2-Q1)/(R2-R1)其中，NewQ是調(diào)節(jié)“之后”的變量Q；Q1和Q2分別是前一和二幀的Q值；R1和R2是用于前一和前二幀的位數(shù)量；以及desired_R是已使用位的預(yù)期數(shù)量；其中，值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。
19.如權(quán)利要求18所述的音頻編碼器，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新所述已調(diào)節(jié)梯度。
20.如權(quán)利要求18所述的音頻編碼器，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括限制所述變量Q的值并根據(jù)各個(gè)幀中的能含量按比例地將其分布于三個(gè)幀。
21.如權(quán)利要求18所述的音頻編碼器，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括通過采用所述Q的值以及音調(diào)索引對(duì)所述掩蔽門限的調(diào)節(jié)加權(quán)，以便更好地考慮可用于編碼的位數(shù)量。
22.一種電子裝置，包括能夠接收未壓縮音頻數(shù)據(jù)的電子電路；計(jì)算機(jī)可讀媒體，嵌入了音頻編碼器，使得所述未壓縮音頻數(shù)據(jù)可經(jīng)過壓縮以用于傳送和/或存儲(chǔ)目的；以及能夠向所述電子裝置的用戶輸出所述壓縮音頻數(shù)據(jù)的電子電路；其中，所述音頻編碼器包括心理聲學(xué)模型(PAM)，用于根據(jù)MDCT頻譜來估算用于待編碼的當(dāng)前幀的掩蔽門限，其中，所述掩蔽門限反映用于所述當(dāng)前幀的位預(yù)算；以及量化模塊，用于根據(jù)所述掩蔽門限執(zhí)行所述當(dāng)前幀的量化，其中，在所述當(dāng)前幀的量化之后，更新用于下一幀的位預(yù)算以用于估算所述下一幀的掩蔽門限；由此，所述PAM和量化模塊經(jīng)過電子方式配置，使得所述PAM通過考慮所述量化模塊所更新的位狀態(tài)來估算所述掩蔽門限。
23.如權(quán)利要求22所述的電子裝置，其特征在于，所述音頻編碼器還包括用于接收來自輸入的未壓縮音頻數(shù)據(jù)的部件；以及濾波器組，電連接到所述接收部件，用于生成所述未壓縮音頻數(shù)據(jù)的各幀的MDCT頻譜；其中，所述濾波器組電連接到所述PAM，使得所述MDCT頻譜被輸出到所述PAM。
24.如權(quán)利要求22所述的電子裝置，其特征在于，所述音頻編碼器還包括用于對(duì)所述量化音頻數(shù)據(jù)編碼的編碼模塊。
25.如權(quán)利要求24所述的電子裝置，其特征在于，所述編碼模塊是熵編碼模塊。
26.如權(quán)利要求23所述的電子裝置，其特征在于，所述濾波器組采用下式生成所述MDCT頻譜Xi,k=2Σn=0N-1zi,ncos(2πN(n+no)(k+12)),for0≤k≤N/2]]>其中，Xi，k是在塊索引i和頻譜索引k處的MDCT系數(shù)；z是加窗口輸入序列；n是樣本索引；k是頻譜系數(shù)索引；i是塊索引；以及N是窗口長(zhǎng)度(長(zhǎng)窗口為2048，以及短窗口為256)；其中no計(jì)算為(N/2+1)/2。
27.如權(quán)利要求22所述的電子裝置，其特征在于，所述心理聲學(xué)模型(PAM)通過以下操作來估算所述掩蔽門限采用所述MDCT頻譜在比例因子段域中計(jì)算能量；執(zhí)行簡(jiǎn)單三角擴(kuò)展函數(shù)；計(jì)算音調(diào)索引；執(zhí)行掩蔽門限調(diào)節(jié)(以變量Q加權(quán))；以及安靜地執(zhí)行與門限的比較；由此輸出所述掩蔽門限用于量化。
28.如權(quán)利要求27所述的電子裝置，其特征在于，執(zhí)行量化的所述步驟還包括采用不均勻量化器按照下式執(zhí)行量化x_quantized(i)=int[x3/42316(gl-scf(i))+0.4054]]]>其中，x_quantized(i)是在比例因子段索引(i)處的量化頻譜值；i是比例因子段索引，x是要量化的段內(nèi)的頻譜值，gl是全局比例因子(速率控制參數(shù))，以及scf(i)是比例因子值(失真控制參數(shù))。
29.如權(quán)利要求28所述的電子裝置，其特征在于，執(zhí)行量化的所述步驟還包括僅尋找控制失真的比例因子值，不調(diào)節(jié)所述全局比例因子值，由此把所述全局比例因子值作為所述比例因子的第一值(scf(0))。
30.如權(quán)利要求27所述的電子裝置，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括采用下式線性調(diào)節(jié)變量QNewQ＝Q1+(R1-desired_R)(R2-Q1/)(R2-R1)其中，NewQ是調(diào)節(jié)“之后”的變量Q；Q1和Q2分別是前一和二幀的Q值；R1和R2是用于前一和前二幀的位數(shù)量；以及desired_R是已使用位的預(yù)期數(shù)量；其中，值(Q2-Q1)/(R1-R2)是已調(diào)節(jié)梯度。
31.如權(quán)利要求30所述的電子裝置，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括根據(jù)音頻數(shù)據(jù)特性采用在塊交換的情況中執(zhí)行的值的硬重置來連續(xù)更新所述已調(diào)節(jié)梯度。
32.如權(quán)利要求30所述的電子裝置，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括限制所述變量Q的值并根據(jù)各個(gè)幀中的能含量按比例地將其分布于三個(gè)幀。
33.如權(quán)利要求30所述的電子裝置，其特征在于，執(zhí)行掩蔽門限調(diào)節(jié)的所述步驟還包括通過采用所述Q的值以及音調(diào)索引對(duì)所述掩蔽門限的調(diào)節(jié)加權(quán)，以便更好地考慮可用于編碼的位數(shù)量。
34.如權(quán)利要求22所述的電子裝置，其特征在于，所述電子裝置包括音頻播放器/記錄器、PDA、袖珍組織器、帶音頻記錄功能的照相機(jī)、計(jì)算機(jī)和移動(dòng)電話。
全文摘要
本發(fā)明公開用于對(duì)音頻數(shù)據(jù)編碼的方法、用于對(duì)未壓縮音頻數(shù)據(jù)進(jìn)行壓縮的音頻編碼器以及能夠以低功耗對(duì)音頻數(shù)據(jù)編碼的電子裝置。電子裝置包括音頻播放器/記錄器、PDA、袖珍組織器、帶音頻記錄功能的照相機(jī)、計(jì)算機(jī)和移動(dòng)電話。
文檔編號(hào)G10L19/035GK101064106SQ20071010297
公開日2007年10月31日申請(qǐng)日期2007年4月27日優(yōu)先權(quán)日2006年4月28日
發(fā)明者E·庫(kù)尼亞瓦蒂, S·喬治申請(qǐng)人:意法半導(dǎo)體亞太私人有限公司

完整全部詳細(xì)技術(shù)資料下載