国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      丟包掩蔽裝置和方法以及音頻處理系統(tǒng)的制作方法_5

      文檔序號(hào):9621053閱讀:來(lái)源:國(guó)知局
      、E3的旋轉(zhuǎn)聲場(chǎng)信號(hào)112的幀(步驟303)。旋轉(zhuǎn)聲場(chǎng)信號(hào)112對(duì)應(yīng)于自適應(yīng)變換域(例 如,ElE2E3域)中的聲場(chǎng)信號(hào)112。方法300還可以包括對(duì)多個(gè)旋轉(zhuǎn)音頻信號(hào)E1、E2、E3 的第一旋轉(zhuǎn)音頻信號(hào)El進(jìn)行編碼(例如,使用一個(gè)聲道波形編碼器103)的步驟304。此 外,方法300可以包括確定305用于基于第一旋轉(zhuǎn)音頻信號(hào)E1確定多個(gè)旋轉(zhuǎn)音頻信號(hào)E1、 E2、E3中的第二旋轉(zhuǎn)音頻信號(hào)E2的預(yù)測(cè)參數(shù)a2、b2的集合。
      [0271] 圖24b示出了用于根據(jù)空間比特流221和下混合比特流222對(duì)包括多個(gè)重建的音 頻信號(hào)的重建的聲場(chǎng)信號(hào)117的幀進(jìn)行解碼的示例方法350的流程圖。方法350包括根 據(jù)下混合比特流222確定多個(gè)重建的旋轉(zhuǎn)音頻信號(hào)的第一重建的旋轉(zhuǎn)音頻信號(hào) Ι?的步驟351 (例如,使用單個(gè)聲道波形解碼器251)。此外,方法350包括從空間比特流 221中提取預(yù)測(cè)參數(shù)a2、b2的集合的步驟352。方法350進(jìn)行到基于預(yù)測(cè)參數(shù)a2、b2的集 合以及基于第一重建的旋轉(zhuǎn)音頻信?;·Μ(例如,使用參數(shù)化解碼單元255、252、256)確定 353多個(gè)重建的旋轉(zhuǎn)音頻信號(hào)的第二重建的旋轉(zhuǎn)音頻信號(hào)方法350還包括 提取表示能量壓縮正交變換V(例如,KLT)的變換參數(shù)(1、爭(zhēng)、Θ的集合的步驟354,能量壓 縮正交變換V已經(jīng)基于待重建的聲場(chǎng)信號(hào)1100的相應(yīng)的幀確定。此外,方法350包括對(duì)多 個(gè)重建的旋轉(zhuǎn)音頻信號(hào)應(yīng)用355能量壓縮正交變換V的逆變換以產(chǎn)生逆變換聲 場(chǎng)信號(hào)116??梢曰谀孀儞Q聲場(chǎng)信號(hào)116確定重建的聲場(chǎng)信號(hào)117。
      [0272] 在本文件中,已經(jīng)描述了用于對(duì)聲場(chǎng)信號(hào)進(jìn)行編碼的方法和系統(tǒng)。具體地,已經(jīng)描 述了聲場(chǎng)信號(hào)的參數(shù)化編碼方案,該方案使得能夠降低比特率同時(shí)保持給定的感知質(zhì)量。 此外,參數(shù)化編碼方案以低比特率提供了高質(zhì)量下混合信號(hào),這有利于分層電話會(huì)議系統(tǒng) 的實(shí)現(xiàn)。
      [0273] 實(shí)施方式的組合和應(yīng)用場(chǎng)景
      [0274] 以上討論的所有實(shí)施方式及其變型可以用其任意組合來(lái)實(shí)現(xiàn),并且,在不同的部 分/實(shí)施方式中提及的但是具有相同或者相似功能的任意部件都可以實(shí)現(xiàn)為相同的或者 單獨(dú)的部件。
      [0275] 例如,用于單聲道分量的PLC的第一掩蔽單元400的不同實(shí)施方式及變型可以與 用于空間分量的PLC的第二變換器1000和第二掩蔽單元600的不同實(shí)施方式及其變型任 意組合。此外,在圖9A和圖9B中,用于主要和重要性較低的單聲道分量?jī)烧叩姆穷A(yù)測(cè)PLC 的主掩蔽單元408的不同實(shí)施方式和變型可以與用于重要性較低的單聲道分量的預(yù)測(cè)PLC 的預(yù)測(cè)參數(shù)計(jì)算器412、第三掩蔽單元414、預(yù)測(cè)解碼器410和調(diào)整單元416的不同實(shí)施方 式及變型任意組合。
      [0276] 如前面所討論的,包丟失可能出現(xiàn)在從發(fā)起通信終端到服務(wù)器(如果有的話)再 到目的通信終端的路徑上的任何位置。因此,本申請(qǐng)所提出的PLC裝置可以應(yīng)用在服務(wù)器 或通信終端上。當(dāng)如圖12所示應(yīng)用在服務(wù)器中時(shí),可以通過(guò)打包單元900再次對(duì)丟包被掩 蔽的音頻信號(hào)進(jìn)行打包以傳輸至目的通信終端。如果有多個(gè)用戶同時(shí)進(jìn)行交談(這可以使 用語(yǔ)音活動(dòng)檢測(cè)(VAD)技術(shù)來(lái)判斷),在將多個(gè)用戶的話音信號(hào)傳輸至目的通信終端之前, 需要在混合器800中進(jìn)行混合操作以將多個(gè)話音信號(hào)流混合成一個(gè)流。這可以在PLC裝置 的PLC操作之后但是在打包單元900的打包操作之前完成。
      [0277] 當(dāng)如圖13所示應(yīng)用在通信終端中時(shí),可以設(shè)置第二逆變換器700A用于將所生成 的幀變換成中間輸出格式的空間音頻信號(hào)?;蛘?,如圖14所示,可以設(shè)置第二解碼器700B 用于將所生成的幀解碼成時(shí)域中的空間聲音信號(hào)如雙聲道聲音信號(hào)。圖12至圖14中的其 他部件與圖3中的相同并且因此省略其詳細(xì)描述。
      [0278] 因此,本申請(qǐng)還提供了一種音頻處理系統(tǒng)如語(yǔ)音通信系統(tǒng),包括服務(wù)器(如音頻 會(huì)議混合服務(wù)器)和/或通信終端,該服務(wù)器包括如前面討論的丟包掩蔽裝置,該通信終端 包括如前面討論的丟包掩蔽裝置。
      [0279] 可以看出,圖12至圖14所示的服務(wù)器和通信終端位于目的地側(cè)或解碼側(cè),這是因 為所提供的PLC裝置是用于掩蔽在到達(dá)目的地(包括服務(wù)器和目的通信終端)之前出現(xiàn)的 包丟失。相比之下,如參考圖11所討論的第二變換器1000要用在發(fā)起側(cè)或編碼側(cè),在發(fā)起 通信終端或在服務(wù)器中。
      [0280] 因此,上面所討論的音頻處理系統(tǒng)還可以包括作為發(fā)起通信終端的通信終端,其 包括用于將輸入格式的空間音頻信號(hào)變換成傳輸格式的幀的第二變換器1000,其中每個(gè)幀 包括至少一個(gè)單聲道分量和至少一個(gè)空間分量。
      [0281] 如本申請(qǐng)的【具體實(shí)施方式】的開頭所討論的,本申請(qǐng)的實(shí)施方式可以用硬件或軟件 或用兩者實(shí)現(xiàn)。圖15是示出了用于實(shí)現(xiàn)本申請(qǐng)的各個(gè)方面的示例性系統(tǒng)的框圖。
      [0282] 在圖15中,中央處理單元(CPU) 801根據(jù)存儲(chǔ)在只讀存儲(chǔ)器(ROM) 802中的程序或 從存儲(chǔ)部分808加載到隨機(jī)存取存儲(chǔ)器(RAM) 803的程序來(lái)執(zhí)行各種處理。在RAM803中, 也根據(jù)需要存儲(chǔ)當(dāng)CPU801執(zhí)行各種處理等時(shí)所需要的數(shù)據(jù)。
      [0283]CPU801、ROM802和RAM803經(jīng)由總線804彼此連接。輸入/輸出接口 805也連 接到總線804。
      [0284] 下列部件連接到輸入/輸出接口 805 :包括鍵盤、鼠標(biāo)等的輸入部分806;包括顯 示器比如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚(yáng)聲器等的輸出部分807;包括硬盤 等等的存儲(chǔ)部分808 ;以及包括網(wǎng)絡(luò)接口卡比如LAN卡、調(diào)制解調(diào)器等的通信部分809。通 信部分809經(jīng)由網(wǎng)絡(luò)比如互聯(lián)網(wǎng)執(zhí)行通信處理。
      [0285] 根據(jù)需要,驅(qū)動(dòng)器810也連接到輸入/輸出接口 805。可移除介質(zhì)811比如磁盤、 光盤、磁光盤、半導(dǎo)體存儲(chǔ)器等等根據(jù)需要安裝在驅(qū)動(dòng)器810上,以使得從中讀取的計(jì)算機(jī) 程序根據(jù)需要安裝到存儲(chǔ)部分808中。
      [0286] 在通過(guò)軟件實(shí)施上述部件的情況下,從網(wǎng)絡(luò)比如互聯(lián)網(wǎng)或存儲(chǔ)介質(zhì)比如可移除介 質(zhì)811安裝構(gòu)成軟件的程序。
      [0287] 丟包掩蔽方法
      [0288] 在上文的實(shí)施方式中描述丟包掩蔽裝置的過(guò)程中,顯然還公開了一些處理或方 法。下文中,在不重復(fù)上文中已經(jīng)討論的一些細(xì)節(jié)的情況下給出這些方法的概要,但是應(yīng)當(dāng) 注意,雖然這些方法在描述丟包掩蔽裝置的過(guò)程中公開,但是這些方法不一定采用所描述 的那些部件或不一定由那些部件執(zhí)行。例如,丟包掩蔽裝置的實(shí)施方式可以部分地或完全 地使用硬件和/或固件來(lái)實(shí)現(xiàn),而下面討論的丟包掩蔽方法可以完全由計(jì)算機(jī)可執(zhí)行的程 序來(lái)實(shí)現(xiàn)是有可能的,盡管這些方法也可以采用丟包掩蔽裝置的硬件和/或固件。
      [0289] 根據(jù)本申請(qǐng)的實(shí)施方式,提供了一種丟包掩蔽方法用于掩蔽音頻包流中的包丟 失,每個(gè)音頻包包括傳輸格式的至少一個(gè)幀,該至少一個(gè)幀包括至少一個(gè)單聲道分量和至 少一個(gè)空間分量。在本申請(qǐng)中,提出了對(duì)音頻幀中的不同分量進(jìn)行不同的PLC。即,對(duì)于丟 失包中的丟失幀,執(zhí)行用于針對(duì)所述丟失幀生成至少一個(gè)單聲道分量的一種操作以及用于 針對(duì)所述丟失幀生成至少一個(gè)空間分量的另一種操作。在此注意,不一定同時(shí)對(duì)同一丟失 幀執(zhí)行這兩個(gè)操作。
      [0290] 音頻幀(傳輸格式的)可以已經(jīng)基于自適應(yīng)變換進(jìn)行了編碼,自適應(yīng)變換可以將 音頻信號(hào)(輸入格式的,比如LRS信號(hào)或高保真度立體聲響復(fù)制B格式(WXY)信號(hào))變換成 傳輸中的單聲道分量和空間分量。自適應(yīng)變換的一個(gè)示例是參數(shù)化特征分解,并且單聲道 分量可以包括至少一個(gè)特征通道分量,以及空間分量可以包括至少一個(gè)空間參數(shù)。自適應(yīng) 變換的其他示例可以包括主成分分析(PCA)。對(duì)于參數(shù)化特征分解,一個(gè)示例是KLT編碼, KLT編碼可以產(chǎn)生作為特征通道分量的多個(gè)旋轉(zhuǎn)音頻信號(hào),以及多個(gè)空間參數(shù)。通常,空間 參數(shù)從用于將輸入格式的音頻信號(hào)變換成傳輸格式的音頻幀(例如將高保真度立體聲響 復(fù)制B格式的音頻信號(hào)變換成多個(gè)旋轉(zhuǎn)音頻信號(hào))的變換矩陣中推導(dǎo)出。
      [0291] 對(duì)于空間音頻信號(hào),空間參數(shù)的連續(xù)性很重要。因此,為了掩蔽丟失幀,可以通過(guò) 對(duì)包括歷史幀和/或未來(lái)幀的相鄰幀的至少一個(gè)空間分量的值進(jìn)行平滑來(lái)針對(duì)所述丟失 幀生成至少一個(gè)空間分量。另一方法是基于至少一個(gè)相鄰歷史幀和至少一個(gè)相鄰未來(lái)幀中 相應(yīng)的空間分量的值通過(guò)內(nèi)插算法來(lái)針對(duì)所述丟失幀生成至少一個(gè)空間分量。如果存在多 個(gè)連續(xù)的幀,則可以通過(guò)單個(gè)內(nèi)插操作生成所有的丟失幀。另外,一種較簡(jiǎn)單的方式是通過(guò) 復(fù)制上一幀中相應(yīng)的空間分量來(lái)針對(duì)所述丟失幀生成至少一個(gè)空間分量。在后者情況下, 為了確??臻g參數(shù)的穩(wěn)定性,空間參數(shù)可以通過(guò)空間參數(shù)本身的直接平滑或用于得到空間 參數(shù)的變換矩陣比如協(xié)方差矩陣(的元素)的平滑事先在編碼側(cè)被平滑。
      [0292] 對(duì)于單聲道分量,如果要掩蔽丟失幀,可以通過(guò)復(fù)制相鄰幀中的相應(yīng)的單聲道分 量來(lái)生成單聲道分量。在此,相鄰幀表示歷史幀或未來(lái)幀,與丟失幀直接相鄰或在其間具有 其他插入幀。在變型中,可以使用衰減因子。取決于于應(yīng)用場(chǎng)景,對(duì)于丟失幀的某些單聲道 分量,可能不生成,而僅通過(guò)復(fù)制生成至少一個(gè)單聲道分量。具體地,單聲道分量比如特征 通道分量(旋轉(zhuǎn)音頻信號(hào))可以包括主要單聲道分量和具有不同的然而是較低的重要性的 一些其他單聲道分量。因此,可以僅復(fù)制主要單聲道分量或前兩個(gè)重要的單聲道分量,但并 不限于此。
      [0293] 可能有多個(gè)連續(xù)的幀被丟失,比如丟失的包包括多個(gè)音頻幀,或丟失了多個(gè)包。在 這樣的情形下,合理的是,通過(guò)在有或沒有衰減因子的情況下復(fù)制相鄰歷史幀中的相應(yīng)的 單聲道分量來(lái)生成至少一個(gè)較早丟失幀的至少一個(gè)單聲道分量,并且通過(guò)在有或沒有衰減 因子的情況下復(fù)制相鄰未來(lái)幀中的相應(yīng)的單聲道分量來(lái)生成至少一個(gè)較晚丟失幀的至少 一個(gè)單聲道分量。即,在丟失幀中,通過(guò)復(fù)制歷史幀生成較早的幀的單聲道分量,并且通過(guò) 復(fù)制未來(lái)幀生成較晚的幀的單聲道分量。
      [0294] 除了直接復(fù)制之外,在另一實(shí)施方式中,提出了在時(shí)域中進(jìn)行丟失的單聲道分量 的掩蔽。首先,可以將丟失幀之前的至少一個(gè)歷史幀中的至少一個(gè)單聲道分量變換成時(shí)域 信號(hào),然后,針對(duì)時(shí)域信號(hào)掩蔽包丟失,產(chǎn)生丟包被掩蔽的時(shí)域信號(hào)。最后,可以將丟包被掩 蔽的時(shí)域信號(hào)變換成至少一個(gè)單聲道分量的格式,產(chǎn)生與丟失幀中的至少一個(gè)單聲道分量 相對(duì)應(yīng)的生成的單聲道分量。在此,如果使用非重疊方案對(duì)音頻幀中的單聲道分量進(jìn)行編 碼,則僅將上一幀中的單聲道分量變換到時(shí)域就足夠。如果使用重疊方案比如MDCT變換對(duì) 音頻幀中的單聲道分量進(jìn)行編碼,則優(yōu)選地將至少兩個(gè)緊鄰在前的幀變換到時(shí)域。
      [0295] 可替選地,如果存在更多連續(xù)的丟失幀,則一種更高效的雙向方法可以是使用時(shí) 域PLC掩蔽一些丟失幀,而在頻域掩蔽一些丟失幀。一個(gè)示例是,使用時(shí)域PLC掩蔽較早的 丟失幀并且通過(guò)簡(jiǎn)單的復(fù)制、即通過(guò)復(fù)制相鄰的未來(lái)幀中的相應(yīng)的單聲道分量來(lái)掩蔽較晚 的丟失幀。對(duì)于復(fù)制,可以使用或不使用衰減因子。
      [0296] 為了提高編碼效率和比特率效率,可以采用參數(shù)化/預(yù)測(cè)編碼,其中,音頻流中的 每個(gè)音頻幀除了空間參數(shù)和至少一個(gè)單聲道分量(通常是主要單聲道分量)之外還包括要 用于基于幀中的至少一個(gè)單聲道分量來(lái)預(yù)測(cè)幀的至少一個(gè)其他單聲道分量的至少一個(gè)預(yù) 測(cè)參數(shù)。對(duì)于這樣的音頻流,也可以對(duì)于預(yù)測(cè)參數(shù)實(shí)施PLC。如圖16所示,對(duì)于丟失幀,應(yīng) 當(dāng)被傳輸?shù)闹辽僖粋€(gè)單聲道分量(通常是主要單聲道分量)將通過(guò)任何現(xiàn)有的或如前面所 討論的方法,包括時(shí)域PLC、雙向PLC或在有或沒有衰減因子的情況下的復(fù)制等,來(lái)生成(操 作1602)。除此之外,可以生成用于基于主要單聲道分量預(yù)測(cè)其他單聲道分量(通常是重要 性較低的單聲道分量)的預(yù)測(cè)參數(shù)(操作1604)。
      [0297] 可以以與空間參數(shù)的生成相似的方式,比如通過(guò)在有或沒有衰減因子的情況下復(fù) 制上一幀中的相應(yīng)的預(yù)測(cè)參數(shù),平滑相鄰幀的相應(yīng)的預(yù)測(cè)參數(shù)的值或使用歷史幀和未來(lái)幀 中的相應(yīng)的預(yù)測(cè)參數(shù)的值進(jìn)行內(nèi)插,來(lái)實(shí)現(xiàn)預(yù)測(cè)參數(shù)的生成。對(duì)于離散編碼的音頻流的預(yù) 測(cè)PLC(圖18至圖21),可以相似地執(zhí)行生成操作。
      [0298] 在生成了主要單聲道分量和預(yù)測(cè)參數(shù)的情況下,可以基于它們來(lái)預(yù)測(cè)其他單聲道 分量(操作1608),并且生成的主要單聲道分量和預(yù)測(cè)的其他單聲道分量(與空間參數(shù)一 起)構(gòu)成掩蔽包/幀丟失的生成的幀。然而,不一定緊接著生成操作1602和1604之后執(zhí) 行預(yù)測(cè)操作1608。在服務(wù)器中,如果混合不是必要的,則生成的主要單聲道分量和生成的預(yù) 測(cè)參數(shù)可以直接轉(zhuǎn)發(fā)至目的通信終端,在目的通信終端中將執(zhí)行預(yù)測(cè)操作1608以及另外 的操作。
      [0299] 預(yù)測(cè)PLC中的預(yù)測(cè)操作與預(yù)測(cè)編碼中的預(yù)測(cè)操作類似(即使預(yù)測(cè)PLC是相對(duì)于非 預(yù)測(cè)/離散編碼的音頻流執(zhí)行的)。即,可以在有或沒有衰減因子的情況下,使用生成的至 少一個(gè)預(yù)測(cè)參數(shù),基于生成的一個(gè)單聲道分量和其去相關(guān)的版本來(lái)預(yù)測(cè)丟失幀的至少一個(gè) 其他單聲道分量。作為一個(gè)示例,與針對(duì)丟失幀所生成的一個(gè)單聲道分量相對(duì)應(yīng)的歷史幀 中的單聲道分量可以被視為生成的一個(gè)單聲道分量的去相關(guān)版本。對(duì)于離散編碼的音頻流 的預(yù)測(cè)PLC(圖18至圖21),可以相似地執(zhí)行預(yù)測(cè)操作。
      [0300] 還可以將預(yù)測(cè)PLC應(yīng)用于非預(yù)測(cè)/離散編碼音頻流,其中每個(gè)音頻流包括至少兩 個(gè)單聲道分量,通常是主要單聲道分量和至少一個(gè)重要性較低的單聲道分量。在預(yù)測(cè)PLC 中,與前面所討論的預(yù)測(cè)編碼相似的方法用于基于已經(jīng)生成的用于掩蔽丟失幀的主要單聲 道分量預(yù)測(cè)重要性較低的單聲道分量。由于這是在用于離散編碼的音頻流的PLC中,不存 在可得到的預(yù)測(cè)參數(shù),并且它們不能根據(jù)當(dāng)前幀計(jì)算得到(因?yàn)楫?dāng)前幀已經(jīng)丟失并且需要 被生成/恢復(fù))。因此,可以從歷史幀中推出預(yù)測(cè)參數(shù),不管歷史幀是正常傳輸?shù)幕蚴菫榱?PLC的目的被生成/恢復(fù)的。那么在圖17所示的一種實(shí)施方式中,生成至少一個(gè)單聲道分 量包括針對(duì)所述丟失幀生成至少兩個(gè)單聲道分量中的一個(gè)(操作1602)、使用歷史幀計(jì)算 丟失幀的至少一個(gè)預(yù)測(cè)參數(shù)(操作1606)以及使用生成的至少一個(gè)預(yù)測(cè)參數(shù)基于生成的 一個(gè)單聲道分量預(yù)測(cè)丟失幀的至少兩個(gè)單聲道分量中的至少一個(gè)其他單聲道分量(操作 1608)〇
      [0301]對(duì)于離散編碼的音頻流,如果對(duì)于每個(gè)丟失幀總是執(zhí)行預(yù)測(cè)PLC,則當(dāng)存在相對(duì)多 的丟失包時(shí),有時(shí)效率將會(huì)特別低。在這樣的情形下,可以將離散編碼的音頻流的預(yù)測(cè)PLC 和相對(duì)于預(yù)測(cè)編碼的音頻流的普通PLC相結(jié)合。即,一旦已經(jīng)對(duì)于較早的丟失幀計(jì)算了預(yù) 測(cè)參數(shù),則隨后的丟失幀可以通過(guò)前面所討論的普通PLC操作比如復(fù)制、平滑、內(nèi)插等利用 計(jì)算出來(lái)的預(yù)測(cè)參數(shù)。
      [0302] 因此,如圖18所示,對(duì)于多個(gè)連續(xù)的丟失幀,針對(duì)第一丟失幀(操作1603中的 "Y"),那么預(yù)測(cè)參數(shù)將基于(正常傳輸?shù)模┥弦粠?jì)算(操作1606),并且用于預(yù)測(cè)其他單 聲道分量(操作1608)。而且從第二丟失幀開始,可以使用針對(duì)第一丟失幀計(jì)算的預(yù)測(cè)參數(shù) (參見圖18中的虛線箭頭)來(lái)執(zhí)行普通PLC以生成預(yù)測(cè)參數(shù)(操作1604)。
      [0303] 更一般地,可以提出自適應(yīng)PLC方法,該自適應(yīng)PLC方法可以自適應(yīng)地用于預(yù)測(cè)編 碼方案或非預(yù)測(cè)/離散編碼方案。對(duì)于離散編碼方案中的第一丟失幀,將執(zhí)行預(yù)測(cè)PLC;而 對(duì)于離散編碼方案中的后續(xù)的丟失幀,或?qū)τ陬A(yù)測(cè)編碼方案,將執(zhí)行普通PLC。具體地,如 圖19所示,對(duì)于任何丟失幀,可以通過(guò)前面所討論的任何PLC方法生成至少一個(gè)單聲道分 量比如主要單聲道分量(操作1602)。對(duì)于其他通常重要性較低的單聲道分量,可以通過(guò) 不同的方式生成/恢復(fù)它們。如果在丟失幀之前的上一幀中包含至少一個(gè)預(yù)測(cè)參數(shù)(操作 1601的"預(yù)測(cè)編碼"分支),或如果已經(jīng)對(duì)于丟失幀之前的上一幀計(jì)算了至少一個(gè)預(yù)測(cè)參數(shù) (這意味著上一幀也是丟失幀但上一幀的預(yù)測(cè)參數(shù)已經(jīng)在操作1606中計(jì)算),或如果已經(jīng) 針對(duì)丟失幀的上一幀生成了至少一個(gè)預(yù)測(cè)參數(shù)(這意味著上一幀也是丟失幀但上一幀的 預(yù)測(cè)參數(shù)已經(jīng)在操作1606中生成),則可以基于上一幀的至少一個(gè)預(yù)測(cè)參數(shù)通過(guò)普通PLC 方法生成當(dāng)前丟失幀的至少一個(gè)預(yù)測(cè)參數(shù)(操作1604)。那么,僅當(dāng)沒有預(yù)測(cè)參數(shù)包含在丟 失幀的上一幀中(操作1601的"非預(yù)測(cè)編碼"分支),并且沒有對(duì)于丟失幀的上一幀生成/ 計(jì)算預(yù)測(cè)參數(shù)時(shí)(這意味著丟失幀是多個(gè)連續(xù)的丟失幀中的第一丟失幀(操作1603中的 "Y")),可以使用在前幀計(jì)算丟失幀的至少一個(gè)預(yù)測(cè)參數(shù)(操作1606)。然后,可以使用計(jì) 算的至少一個(gè)預(yù)測(cè)參數(shù)(來(lái)自操作1606)或生成的至少一個(gè)預(yù)測(cè)參數(shù)(來(lái)自操作1604)基 于生成的一個(gè)單聲道分量(來(lái)自操作1602)預(yù)測(cè)丟失幀的至少兩個(gè)單聲道分量中的至少一 個(gè)其他單聲道分量(操作1608)。
      [0304] 在變型中,對(duì)于離散編碼的音頻流,預(yù)測(cè)PLC可以與普通PLC結(jié)合以在結(jié)果中提供 更多的隨意性,以使得丟包被掩蔽的音頻流聽起來(lái)更自然。那么,如圖20(對(duì)應(yīng)于圖18)所 示,執(zhí)行預(yù)測(cè)操作1608和生成操作1609兩者,并且將它們的結(jié)果組合(操作1612)以獲得 最終結(jié)果。組合操作1612可以被視為以任何方式用一個(gè)結(jié)果來(lái)調(diào)整另一個(gè)結(jié)果的操作。作 為示例,調(diào)整操作可以包括計(jì)算預(yù)測(cè)的至少一個(gè)其他單聲道分量和生成的至少一個(gè)其他單 聲道分量的加權(quán)平均,作為至少一個(gè)其他單聲道分量的最終結(jié)果。加權(quán)因子將確定預(yù)測(cè)結(jié) 果和生成結(jié)果中的哪個(gè)是主導(dǎo)的,并且可以根據(jù)具體的應(yīng)用情形來(lái)確定。對(duì)于參照?qǐng)D19所 描述的實(shí)施方式,也可以添加組合操作1612,如圖21所示,在此省略其詳細(xì)描述。實(shí)際上, 對(duì)于圖17所示的解決方案,組合操作1612也是可以的,盡管沒有示出。
      [0305] 預(yù)測(cè)參數(shù)的計(jì)算與預(yù)測(cè)/參數(shù)化編碼處理類似。在預(yù)測(cè)編碼處理中,可以基于同 一幀的第一旋轉(zhuǎn)音頻信號(hào)(E1)(主要單聲道分量)和至少一個(gè)第二旋轉(zhuǎn)音頻信號(hào)(E2)(至 少一個(gè)重要性較低的單聲道分量)計(jì)算當(dāng)前幀的預(yù)測(cè)參數(shù)(公式(19)和(20))。具體地, 可以確定預(yù)測(cè)參數(shù),以使得第二旋轉(zhuǎn)音頻信號(hào)(E2)(至少一個(gè)重要性較低的單聲道分量) 與該第二旋轉(zhuǎn)音頻信號(hào)(E2)的相關(guān)的分量之間的預(yù)測(cè)殘差的均方差減小。預(yù)測(cè)參數(shù)還可 以包括能量調(diào)整增益,該能量調(diào)整增益可以基于預(yù)測(cè)殘差的幅值與第一旋轉(zhuǎn)音頻信號(hào)(E1) (主要單聲道分量)的幅值之間的比率計(jì)算。在一種變型中,該計(jì)算可以基于預(yù)測(cè)殘差的均 方根和第一旋轉(zhuǎn)音頻信號(hào)(E1)(主要單聲道分量)的均方根的比率(公式(21)和(22))。 為了避免計(jì)算的能量調(diào)整增益的突然波動(dòng),可以應(yīng)用ducker調(diào)整操作,包括基于第一旋轉(zhuǎn) 音頻信號(hào)(El)(主要單聲道分量)確定去相關(guān)信號(hào);確定去相關(guān)信號(hào)的能量的第二指標(biāo)以 及第一旋轉(zhuǎn)音頻信號(hào)(E1)(主要單聲道分量)的能量的第一指標(biāo);以及如果第二指標(biāo)大于 第一指標(biāo),則基于去相關(guān)信號(hào)確定能量調(diào)整增益(公式(26)至(37))。
      [0306] 在預(yù)測(cè)PLC中,預(yù)測(cè)參數(shù)的計(jì)算是類似的,不同之處在于是針對(duì)當(dāng)前幀(丟失幀) 的,預(yù)測(cè)參數(shù)是基于在前幀計(jì)算的。換言之,針對(duì)丟失幀的上一幀計(jì)算預(yù)測(cè)參數(shù),然后用來(lái) 掩蔽丟失幀。
      [0307] 因此,在預(yù)測(cè)PLC中,可以基于與針對(duì)丟失幀生成的一個(gè)單聲道分量相對(duì)應(yīng)的丟 失幀的上一幀中的單聲道分量,以及與要針對(duì)丟失幀預(yù)測(cè)的單聲道分量相對(duì)應(yīng)的上一幀中 的單聲道分量,來(lái)計(jì)算丟失幀的至少一個(gè)預(yù)測(cè)參數(shù)(公式(9))。具體地,可以確定丟失幀的 至少一個(gè)預(yù)測(cè)參數(shù),以使得與要針對(duì)丟失幀預(yù)測(cè)的單聲道分量相對(duì)應(yīng)的上一幀中的單聲道 分量與該單聲道分量的相關(guān)分量之間的預(yù)測(cè)殘差的均方差減小。
      [0308] 所述至少一個(gè)預(yù)測(cè)參數(shù)還可以包括能量調(diào)整增益,該能量調(diào)整增益可以基于預(yù)測(cè) 殘差的幅值與丟失幀的上一幀中對(duì)應(yīng)于針對(duì)丟失幀所生成的一個(gè)單聲道分量的單聲道分 量的幅值之間的比率計(jì)算。在變型中,第二能量調(diào)整增益可以基于預(yù)測(cè)殘差的均方根和丟 失幀的上一幀中的對(duì)應(yīng)于針對(duì)丟失幀所生成的一個(gè)單聲道分量的單聲道分量的均方根的 比率計(jì)算(公式(10))。
      [0309] 還可以執(zhí)行ducker算法以確保能量調(diào)整增益不會(huì)突然波動(dòng)(公式(11)和(12)): 基于與針對(duì)丟失幀所生成的一個(gè)單聲道分量相對(duì)應(yīng)的丟失幀的上一幀中的單聲道分量確 定去相關(guān)信號(hào);確定去相關(guān)信號(hào)的能量的第二指標(biāo)以及與針對(duì)丟失幀所生成的一個(gè)單聲道 分量相對(duì)應(yīng)的丟失幀的上一幀中的單聲道分量的能量的第一指標(biāo);以及如果第二指標(biāo)大于 第一指標(biāo),則基于去相關(guān)信號(hào)確定第二能量調(diào)整增益。
      [0310] 在PLC之后,就生成了用于替代丟失包的新的包。然后,與正常傳輸?shù)囊纛l包一 起,所生成的包可以經(jīng)過(guò)逆自適應(yīng)變換,變換為逆變換聲場(chǎng)信號(hào),比如WXY信號(hào)。逆自適應(yīng) 變換的一個(gè)例子是逆KLT變換。
      [0311] 與丟包掩蔽裝置的實(shí)施方式類似,PLC方法的實(shí)施方式以及它們的變型的任何組 合都是可能的。
      [0312] 在文中描述的方法和系統(tǒng)可以被實(shí)現(xiàn)為軟件、固件和/或硬件。某些部件例如可 以被實(shí)現(xiàn)為在數(shù)字信號(hào)處理器或微處理器上運(yùn)行的軟件。其他部件例如可以被實(shí)現(xiàn)為硬件 和/或?qū)S眉呻娐?。在描述的方法和系統(tǒng)中遇到的信號(hào)可以被存儲(chǔ)在介質(zhì)上,例如隨機(jī) 訪問存儲(chǔ)器或光學(xué)存儲(chǔ)介質(zhì)。這些信號(hào)可以經(jīng)由網(wǎng)絡(luò)例如無(wú)線電網(wǎng)絡(luò)、衛(wèi)星網(wǎng)絡(luò)、無(wú)線網(wǎng)絡(luò) 或有線網(wǎng)絡(luò),比如因特網(wǎng),被傳送。利用本文中所描述的方法和系統(tǒng)的典型的裝置為用于存 儲(chǔ)和/或渲染(呈現(xiàn))音頻信號(hào)的便攜式電子裝置或其他消費(fèi)者設(shè)備。
      [0313] 請(qǐng)注意,本文中所使用的術(shù)語(yǔ)僅用于描述具體的實(shí)施方式的目的,而非意在限制 本申請(qǐng)。本文中所使用的單數(shù)形式的"一個(gè)"和"該(the)"意在還包括復(fù)數(shù)形式,除非上下 文清楚地指出不同含義。還應(yīng)當(dāng)理解,術(shù)語(yǔ)"包括"在本說(shuō)明書中使用時(shí)指所說(shuō)明的特征、 整體、步驟、操作、元件和/或部件的存在,但是不排除一個(gè)或更多個(gè)其他特征、整體、操作、 步驟、操作、元件、部件和/或其組合的存在或添加。
      [0314] 權(quán)利要求中的相應(yīng)結(jié)構(gòu)、材料、動(dòng)作和所有裝置或步驟的等同物加功能元件意在 包括用于結(jié)合其他具體要求保護(hù)的要求保護(hù)的要素來(lái)執(zhí)行功能的任意結(jié)構(gòu)、材料或動(dòng)作。 對(duì)本申請(qǐng)的描述是用于說(shuō)明和描述的目的,而非意在以所公開的形式來(lái)窮舉或限制本申 請(qǐng)。本領(lǐng)域技術(shù)人員可以在不偏離本申請(qǐng)的范圍和精神的情況下想到對(duì)本申請(qǐng)的很多修改 和變化。
      當(dāng)前第5頁(yè)1 2 3 4 5 6 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1