(204)分段的數(shù)量。也就是說,可W將目標向量分段上的能量變化與基于 Bmax和Bav込差的闊值相比較。使用與平均每分段能量值Eavg的最大偏差隱含的邏輯可W通 過簡化的方式描述為:當與平均每分段能量的偏差較大時,不同分段的感知重要性會有較 大的差別。應該注意的是,可W通過其他方式來表達"闊值"比較,使得將Bmax和Bavg之差與取 決于或基于Np_init個分段的能量的闊值進行比較。也就是說,W上內(nèi)容可被表達為:當Bmax和 Bavc之差小于取決于目標向量分段能量與針對目標向量X的平均每分段能量值Eavg的最大偏 差的闊值時,分段數(shù)量應該增加,等等。例如,運可W被表達為當M>a(BMAx-BAVG)時或當
?時,劃分的數(shù)量應該增加,其中Ci(Bmax-Bavc)或
可W被表示為闊值。
[0033]關于分段的能量,每分段的對數(shù)能量可W被計算為:
[0035] 其中,i是分段索引,并且k是樣本索引。
[0036] 然后,平均每分段能量可W被定義為:
[0037] 馬昭二歷[億,控)
[0038] 然后,可W將能量變化的度量定義為與平均值的絕對最大對數(shù)能量偏差:
[0039] M = )
[0040] 關于何時添加附加劃分的確定或決定可W基于測試能量變化度量M是否高于基于 Bmax和Bavc的特定闊值:
[OOW 當M>a(Bmax-Bavg)時,設置Np= (Np_init+1);
[0042] 否則,設置 Np = Np_init
[0043] 圖3a示出了每分段平均能量(黑點)和總平均能量Eavg(分段平均的平均)。為了最 小化編碼失真,與對包括較少能量的分段進行編碼相比,期望使用更多的比特來對包括較 多能量的分段進行編碼。從而,當分段之間存在較大的能量變化時,將期望將包括較少能量 的分段的比特重新分配給包括較多能量的分段(假定所有的分段初始被分配至少大約Bavg 個比特,即假定比特在分段上具有初始均勻分布)。圖3b是示出了分段數(shù)量Bmax值和Bavg值的 簡化圖。當Bmax和Bavg之差(本文中還可W被表示為余量)"較小"(例如小于闊值)時,在達到 Bmax之前,將不能將運么多的比特重新分配到高能量含量分段。然而,通過增加分段數(shù)量, Bavg將會減?。ㄟ\在圖3a中通過虛線箭頭示出),從而增加了將更多的比特分配到高能量含 量分段的可能性。通過增加分段的數(shù)量,允許與Bavg的更高的比特數(shù)量正偏差,運使得能夠 重新分配比特。最大允許正偏差是Bmax-Bavg。運里,術語"重新分配"并不意味著在重新分配 之前將平均數(shù)量Bavg的比特實際分配到每個分段,而是僅用來便于對本文提供的方案進行 理解。
[0044] -個示例性實施例可W被描述為:當向量分段之間的能量變化相對于余量Bmax-Bavc"較大"時,劃分和分段的數(shù)量增加"1",然后通過設置一比特標志來向解碼器進行指示。 可W通過使用闊值來執(zhí)行對"較大"的確定,闊值可W是基于例如仿真來選擇的。圖4中示出 了該實施例D在圖4中,能量變化被表不為M,并且在該不例中,關值Mthr基于Bmax-BavgdW下將 進一步描述針對能量變化的表達的不同示例。
[0045] 由于Bmax和Bavg之差(即余量)是比特數(shù)量(其應該與作為能量度量的能量變化(例 如與平均值的最大偏差)相比),因此可W使用調(diào)諧參數(shù)a來使得決定闊值與余量成正比。曰 的值可基于例如仿真導出。
[0046] 此外,存在一些情形,在運些情形中,不認為對上述分段數(shù)量進行分析是有意義 的。運里,分析意味著對Bavg的確定(102)和對分段的最終數(shù)量的確定(103)。在運種情形中, 并不期望執(zhí)行所述分析或在向解碼器指示分段數(shù)量上浪費比特。因此,對所述分析的執(zhí)行 和對結果的指示可W是有條件的,即只有當滿足了至少一個附加條件時才執(zhí)行。一個運類 附加條件可W是向量比特預算高于闊值。運一條件的理由將是當比特預算較低時,沒有那 么多的比特來重新分配給其他分段。另一附加條件可W是劃分或切片的初始數(shù)量應該低于 闊值。運一條件的理由將是例如復雜度限制。
[0047] 應該注意的是,W上描述的實施例意圖是非遞歸的,運意味著復雜度較低。與更為 消耗資源的遞歸方法相比,運可W是有利的。還應注意的是,分段旨在在向量上是至少近似 均勻分布的,即具有至少近似相同的尺寸。與產(chǎn)生具有非常不同的尺寸的分段的方法相比, 運也可W是一個優(yōu)點。
[0048] 本文的實施例還設及一種用于支持劃分的增益形狀向量解碼的方法。所述方法對 應于上文所述的編碼方法。在對增益形狀向量X的每個向量分段的表示受到與允許用于對 向量分段進行編碼的最大比特數(shù)量Bmax相關的限制的情況中,旨在由媒體解碼器執(zhí)行所述 方法。運里,術語"媒體"旨在指代例如音頻和/或視頻。下文將參考圖5描述根據(jù)示例實施例 的方法。圖5中示出的方法包括:針對將被重構的向量Xq,確定(501 )分段的初始數(shù)量化_init; 所述方法還包括:從媒體編碼器接收(502)對是否針對向量Xq應用了增加數(shù)量的分段的指 示;W及基于分段的初始數(shù)量和所接收的指示,確定(503)用于向量Xq的解碼的分段的最終 數(shù)量。然后,可W基于分段的最終數(shù)量,對向量Xq進行解碼(504)。與編碼器側的示例類似, 所述指示可W是通過比特標志的形式接收的,當將應用附加劃分時(化=^_init+l),該比特 標志被設置為例如"1",并且當將使用初始數(shù)量的分段時伽=化_1。1〇,該比特標志被設置 為例如"0"。圖6中還示出了使用標志作為指示符。
[0049] 與編碼器側一致,對指示的接收是有條件的,從而只有當滿足了一個或多個附加 條件時才執(zhí)行。在編碼器側和解碼器側應該使用相同的條件。如前文所述,運些附加條件可 W是向量比特預算高于闊值Tl, W及劃分或分段的初始數(shù)量低于闊值T2,和/或每樣本比特 率Bsmple高于給定界限。(Tl和T2只用來指示針對兩種情況的闊值并不相同)。
[0050] 下文中,將描述本文所提供的方案的更多細節(jié)和變形。在【具體實施方式】的結尾將 描述與上文所述的方法實施例相對應的媒體編碼器和媒體解碼器的實施例。
[0051] 可W通過將目標向量劃分成較小的切片來捕獲目標向量上的能量變化。劃分的益 處將取決于目標向量的能量分布。運可W通過在對每個切片中的能量進行歸一化之后計算 目標信號的方差O 2來示出。假定切片具有相等的尺寸,則運可W被表達為:
[0化3] 其中,燈是切片i的方差,W及Np是分段數(shù)量。
[0054]如圖7所示,通常,對于前幾個劃分,方差值快速地下降,然后達到飽和。注意圖7中 的曲線的形狀,飽和點可W被解釋為不需要更多切片中的進一步分辨率的點。此外,可W注 意到,由于最終劃分將導致各個切片均包括一個樣本(每一個切片具有零方差),所W該曲 線總是收斂到零。圖8示出了示例目標向量W及針對3路和4路劃分的相應切片能量。
[0055]在另一實施例中,針對不同的劃分配置(即,針對不同的分段數(shù)量),對各個切片/ 分段之間的能量的方差進行比較。不同劃分配置之間(例如3個分段與2個分段)的方差的較 大增長指示對目標向量的附加劃分將是有益的。方差V被計算為:
[0057]分段i中的每系數(shù)能量是:
[0059] 其中BWi是分段的長度,
[0060] 并且,每系數(shù)的平均能量是:
[0062] 圖10示出了示例目標向量(上圖似及分別針對示例目標向量的2路劃分(中圖)和 3路劃分(下圖)的相應分段能量。在圖11中,針對變化數(shù)量的分段,示出了分段能量的相應 方差??紤]從2個分段到3個分段的改變,方差V增加,從而指示劃分成3個分段與劃分成2個 分段相比更為有益。
[0063] 在一個實施例中,針對附加劃分的決定是基于W下作出的:
[0064] 如果 - Kv, > 舞
[00化]Np = Np+l
[0066] 發(fā)送標志=1
[0067] 否則
[006引發(fā)送標志=0
[0069] 其中,0是針對兩個連續(xù)數(shù)量的劃分之間的分段能量的方差的增加的較低闊值。當 方差的增加足夠(即,在該示例中,超出闊值e)時,分段數(shù)量增加例如1。如前所述,可W通過 例如使用一個比特來發(fā)信號通知一個附加劃分或沒有任何附加劃分,將附加劃分的使用從 編碼器發(fā)信號通知給解碼器。然而,如果希望的話,可W使用更多的比特來發(fā)信號通知多于 一個附加劃分。
[0070] W上實施例的變化是將歸一化分段中的每系數(shù)平均能量互"'W直接用作能量變化 的度量。運樣做的動機在于,當每系數(shù)平均能量在兩個連續(xù)數(shù)量的劃分之間不改變很多時, 每個分段內(nèi)的分布是相似的,并且不會從進一步的劃分獲益,而兩個連續(xù)數(shù)量的劃分之間 的較大改變則會促使附加劃分。與上述表達相似,可W基于闊值丫作出上述決定:
[0071] 如果巧::巧-巧:"?- > 7
[0072] Np = Np+!
[0073] 發(fā)送標志=1
[0074] 否則 [00"75] 發(fā)送標志=0
[0076] 在另一實施例中,假定運一點并且給定了分段的初始數(shù)量Np_init(例如由于量化器 限制),算法通過W下過程來作出關于是否增加的決定:
[0077] 首先,每分段對數(shù)能量被計算為: f \
[007引.僅,=log?. 5>;三 V k, y
[0079]然后,平均每分段能量可W被定義為:
[誦]心二騰(w({£, )
[0081] 將能量變化的度量定義為與平均值的絕對最大對數(shù)能量偏差:
[0082] M = "?似(批v(A,-貨"G騰)
[0083] 在