專利名稱:用于以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的系統(tǒng)及方法
技術(shù)領(lǐng)域:
本系統(tǒng)及方法大體來說涉及語音處理技術(shù)。更明確地說,本系統(tǒng)及方法涉及以與音 頻信號(hào)相關(guān)聯(lián)的幀修改窗門的系統(tǒng)及方法。
背景技術(shù):
通過數(shù)字技術(shù)來傳輸聲音已變得普遍,尤其是在長(zhǎng)距離、數(shù)字無線電電話應(yīng)用、使 用計(jì)算機(jī)的視頻消息傳遞等等中。此又對(duì)確定可經(jīng)由信道發(fā)送的最少量信息月.同時(shí)保持 所重構(gòu)的語音的可察覺質(zhì)量產(chǎn)生了興趣。用于壓縮語音的裝置可用于許多電信領(lǐng)域中。 電信的一個(gè)實(shí)例為無線通信。另一實(shí)例為經(jīng)由計(jì)算機(jī)網(wǎng)絡(luò)(例如,因特網(wǎng))的通信。通 信領(lǐng)域具有許多應(yīng)用,包括(例如)計(jì)算機(jī)、膝上型計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、 無繩電話、尋呼機(jī)、無線局域環(huán)路、無線電話(例如,蜂窩式及便攜式通信系統(tǒng)(PCS) 電話系統(tǒng))、移動(dòng)因特網(wǎng)協(xié)議(IP)電話及衛(wèi)星通信系統(tǒng)。
發(fā)明內(nèi)容
無
圖1說明無線通信系統(tǒng)的一配置;
圖2為說明計(jì)算環(huán)境的一配置的框圖3為說明信號(hào)傳輸環(huán)境的一配置的框圖4A為說明一種用于以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的方法的一配置的流程
5圖4B為說明用于以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的編碼器及解碼器的配置的框
圖5為說明一種用于重構(gòu)音頻信號(hào)的經(jīng)編碼幀的方法的一配置的流程圖; 圖6為說明與多模式解碼器進(jìn)行通信的多模式編碼器的一配置的框圖; 圖7為說明一種音頻信號(hào)編碼方法的一實(shí)例的流程圖8為說明在將窗口函數(shù)應(yīng)用于每一幀之后的多個(gè)幀的一配置的框圖9為說明一種用于將窗口函數(shù)應(yīng)用于與非語音信號(hào)相關(guān)聯(lián)的幀的方法的一配置的 流程圖10為說明--種用于重構(gòu)已由窗口函數(shù)加以修改的幀的方法的一配置的流程圖
及
圖11為通信/計(jì)算裝置的一配置中的某些組件的框圖。
具體實(shí)施例方式
本發(fā)明描述一種用于以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的方法。接收信號(hào)。將所述 信號(hào)分割為多個(gè)幀。確定所述多個(gè)幀內(nèi)的一個(gè)幀是否與非語音信號(hào)相關(guān)聯(lián)。如果確定所 述幀與非語音信號(hào)相關(guān)聯(lián),則將經(jīng)修改的離散余弦變換(MDCT)窗口函數(shù)應(yīng)用于所述
幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域。編碼所述幀。
還描述一種用于以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的設(shè)備。所述設(shè)備包括處理器及 與所述處理器進(jìn)行電子通信的存儲(chǔ)器。指令存儲(chǔ)于所述存儲(chǔ)器中。所述指令可執(zhí)行以 接收信號(hào);將所述信號(hào)分割為多個(gè)幀;確定所述多個(gè)幀內(nèi)的一個(gè)幀是否與非語音信號(hào)相 關(guān)聯(lián);如果確定所述幀與非語音信號(hào)相關(guān)聯(lián),則將經(jīng)修改的離散余弦變換(MDCT)窗 口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域;及編碼所述幀。
還描述一種經(jīng)配置而以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的系統(tǒng)。所述系統(tǒng)包括用于 處理的裝置及用于接收信號(hào)的裝置。所述系統(tǒng)還包括用于將所述信號(hào)分割為多個(gè)幀的裝 置及用于確定所述多個(gè)幀內(nèi)的一個(gè)幀是否與非語音信號(hào)相關(guān)聯(lián)的裝置。所述系統(tǒng)進(jìn)一步 包括用于在確定所述幀與非語音信號(hào)相關(guān)聯(lián)的情況下將經(jīng)修改的離散余弦變換(MDCT)
窗口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域的裝置及用于編碼所 述幀的裝置。
還描述一種經(jīng)配置以存儲(chǔ)一組指令的計(jì)算機(jī)可讀媒體。所述指令可執(zhí)行以接收信 號(hào);將所述信號(hào)分割為多個(gè)幀;確定所述多個(gè)幀內(nèi)的一個(gè)幀是否與非語音信號(hào)相關(guān)聯(lián);
6如果確定所述幀與非語音信號(hào)相關(guān)聯(lián),則將經(jīng)修改的離散余弦變換(MDCT)窗口函數(shù) 應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域;及編碼所述幀。
還描述一種用于選擇待用于計(jì)算幀的經(jīng)修改的離散余弦變換(MDCT)的窗口函數(shù) 的方法。提供用于選擇待用于計(jì)算幀的MDCT的窗口函數(shù)的算法。將所述所選擇的窗口 函數(shù)應(yīng)用于所述幀?;谟深~外編碼模式強(qiáng)加于MDCT編碼模式的約束而以所述MDCT 編碼模式來編碼所述幀,其中所述約束包含所述幀的長(zhǎng)度、先行長(zhǎng)度及延遲。
還描述一種用于重構(gòu)音頻幀的經(jīng)編碼幀的方法。接收包。分解所述包以檢索經(jīng)編碼 幀。合成所述幀的位于第一零填充區(qū)域與第一區(qū)域之間的樣本。向第一長(zhǎng)度的重疊區(qū)域 添加先前幀的先行長(zhǎng)度。存儲(chǔ)所述幀的所述第一長(zhǎng)度的先行。輸出經(jīng)重構(gòu)的幀。
現(xiàn)參看附圖來描述所述系統(tǒng)及所述方法的各種配置,其中相同參考標(biāo)號(hào)指示相同或 功能類似的元件。如大致在本文中的各圖中所描述及說明,可以廣泛的多種不同配置來 布置及設(shè)計(jì)本系統(tǒng)及方法的特征。因此,下文的詳細(xì)描述并不希望限制如所主張的系統(tǒng) 及方法的范圍,而是僅表示所述系統(tǒng)及所述方法的配置。
可將本文中所揭示的配置的許多特征實(shí)施為計(jì)算機(jī)軟件、電子硬件或兩者的組合。 為清楚地說明硬件與軟件的此互換性,將大致就各種組件的功能性來描述所述組件。將 此功能性實(shí)施為硬件還是軟件視特定應(yīng)用及強(qiáng)加于整個(gè)系統(tǒng)的設(shè)計(jì)約束而定。所屬領(lǐng)域 的技術(shù)人員可以針對(duì)每-一特定應(yīng)用的變化的方式來實(shí)施所描述的功能性,但不應(yīng)將所述 實(shí)施方案決策解釋為導(dǎo)致脫離本系統(tǒng)及方法的范圍。
在將所描述的功能性實(shí)施為計(jì)算機(jī)軟件的情況下,此軟件可包括任何類型的位于存 儲(chǔ)器裝置內(nèi)及/或作為電子信號(hào)而經(jīng)由系統(tǒng)總線或網(wǎng)絡(luò)傳輸?shù)挠?jì)算機(jī)指令或計(jì)算機(jī)可執(zhí) 行碼。實(shí)施與本文中所描述的組件相關(guān)聯(lián)的功能性的軟件可包含單個(gè)指令或許多指令, 且可分布在若干不同碼段、分布于不同程序中及分布為跨越若干存儲(chǔ)器裝置。
如本文中所使用,術(shù)語"一配置"、"配置"、"若干配置""所述配置"、 "所述若干配置"、"一個(gè)或一個(gè)以上配置"、"一些配置"、"某些配置"、"一 個(gè)配置"、"另一配置"及其類似物意味著"所揭示的系統(tǒng)及方法的一個(gè)或一個(gè)以上 (但未必全部)配置",除非另外明確規(guī)定。
術(shù)語"確定"(及其語法變體)是以極為廣泛的意義來使用。術(shù)語"確定"包含 廣泛的多種動(dòng)作且因此"確定"可包括核算、計(jì)算、處理、導(dǎo)出、調(diào)查、查找(例如, 在表格、數(shù)據(jù)庫或另一數(shù)據(jù)結(jié)構(gòu)中進(jìn)行查找)、査明及其類似物。并且,"確定"可包 括接收(例如,接收信息)、存取(例如,存取存儲(chǔ)器中的數(shù)據(jù))及其類似物。并且, "確定"可包括解析、選擇、挑選、建立及其類似物。短語"基于"并不意味著"僅基于",除非另外明確規(guī)定。換句話說,短語"基 于"描述"僅基于"與"至少基于"兩者。 一般來說,可使用短語"音頻信號(hào)"來 指可被聽到的信號(hào)。音頻信號(hào)的實(shí)例可包括表示人類語音、器樂及聲樂、音調(diào)聲音等等。
圖1說明碼分多址(CDMA)無線電話系統(tǒng)100,其可包括多個(gè)移動(dòng)臺(tái)102、多個(gè) 基站104、基站控制器(BSC) 106及移動(dòng)交換中心(MSC) 108。 MSC108可經(jīng)配置以 與公共交換電話網(wǎng)絡(luò)(PSTN) 110介接。MSC 108還可經(jīng)配置以與BSC 106介接。系統(tǒng) 100中可存在一個(gè)以上BSC 106。每一基站104可包括至少一個(gè)扇區(qū)(未圖示),其中每 一扇區(qū)可具有全向天線或指向徑向地遠(yuǎn)離基站104的特定方向的天線?;蛘?,每一扇區(qū) 可包括兩個(gè)用于分集接收的天線。每一基站104可經(jīng)設(shè)計(jì)以支持多個(gè)頻率指派??蓪⑸?區(qū)與頻率指派的相交部分稱作CDMA信道。移動(dòng)臺(tái)102可包括蜂窩式或便攜式通信系 統(tǒng)(PCS)電話。
在蜂窩式電話系統(tǒng)IOO的操作期間,基站104可從若干組移動(dòng)臺(tái)102接收若干組反 向鏈路信號(hào)。所述移動(dòng)臺(tái)102可正進(jìn)行電話呼叫或其它通信。由給定基站104所接收的 每一反向鏈路信號(hào)可在所述基站104內(nèi)加以處理??蓪⑺脭?shù)據(jù)轉(zhuǎn)發(fā)到BSC106。所述 BSC 106可提供呼叫資源分配及移動(dòng)性管理功能性(包括對(duì)在基站104之間的軟越區(qū)切 換的編配)。BSC 106還可將所接收的數(shù)據(jù)路由到MSC 108,所述MSC 108提供額外的 路由服務(wù)以用于與PSTN 110介接。類似地,PSTN 110可與MSC 108介接,且所述MSC 108可與BSC 106介接,所述BSC 106又可控制基站104以將若干組轉(zhuǎn)發(fā)鏈路信號(hào)傳輸 到若干組移動(dòng)臺(tái)102。
圖2描繪計(jì)算環(huán)境200的一配置,所述計(jì)算環(huán)境200包括源計(jì)算裝置202、接收計(jì) 算裝置204及接收移動(dòng)計(jì)算裝置206。源計(jì)算裝置202可經(jīng)由網(wǎng)絡(luò)210而與接收計(jì)算裝 置204、 206進(jìn)行通信。網(wǎng)絡(luò)210可為一類型的計(jì)算網(wǎng)絡(luò),其包括(但不限于)因特網(wǎng)、 局域網(wǎng)絡(luò)(LAN)、校園局域網(wǎng)絡(luò)(CAN)、城域網(wǎng)絡(luò)(MAN)、廣域網(wǎng)絡(luò)(WAN)、環(huán) 狀網(wǎng)絡(luò)、星形網(wǎng)絡(luò)、權(quán)標(biāo)環(huán)狀M絡(luò)等等。
在一配置中,源計(jì)算裝置202可對(duì)音頻信號(hào)212進(jìn)行編碼且經(jīng)由網(wǎng)絡(luò)210而將其傳
輸?shù)浇邮沼?jì)算裝置204、 206。音頻信號(hào)212可包括語音信號(hào)、音樂信號(hào)、音調(diào)、背景噪
聲信號(hào)等等。如本文中所使用,"語音信號(hào)"可指由人類語音系統(tǒng)所產(chǎn)生的信號(hào)且"非
語音信號(hào)"可指并非由人類語音系統(tǒng)所產(chǎn)生的信號(hào)(即,音樂、背景噪聲等等)。源計(jì)
算裝置202可為移動(dòng)電話、個(gè)人數(shù)字助理(PDA)、膝上型計(jì)算機(jī)、個(gè)人計(jì)算機(jī)或任何
其它具有處理器的計(jì)算裝置。接收計(jì)算裝置204可為個(gè)人計(jì)算機(jī)、電話等等。接收移動(dòng)
計(jì)算裝置206可為移動(dòng)電話、PDA、膝上型計(jì)算機(jī)或任何其它具有處理器的移動(dòng)計(jì)算裝置。
圖3描繪了信號(hào)傳輸環(huán)境300,其包括編碼器302、解碼器304及傳輸媒體306???在移動(dòng)臺(tái)102或源計(jì)算裝置202內(nèi)實(shí)施編碼器302??稍诨?04、移動(dòng)臺(tái)102、接收計(jì) 算裝置204或接收移動(dòng)計(jì)算裝置206中實(shí)施解碼器304。編碼器302可對(duì)音頻信號(hào)s (n) 310進(jìn)行編碼,從而形成經(jīng)編碼的音頻信號(hào)sene (n) 312??煽缭絺鬏斆襟w306而將經(jīng)編 碼的音頻信號(hào)312傳輸?shù)浇獯a器304。傳輸媒體306可促進(jìn)編碼器302以無線方式將經(jīng) 編碼的音頻信號(hào)-312傳輸?shù)浇獯a器或其可促進(jìn)編碼器302經(jīng)由在編碼器302與解碼器304 之間的有線連接來傳輸經(jīng)編碼的信號(hào)312。解碼器304可解碼sene (n) 312,從而產(chǎn)生經(jīng) 合成的音頻信號(hào)§ (n) 316。
如本文中所使用,術(shù)語"編碼"可通常指包含編碼與解碼兩者的方法。通常,編 碼系統(tǒng)、編碼方法及編碼設(shè)備試圖使經(jīng)由傳輸媒體306所傳輸?shù)奈坏臄?shù)目(即,使Se。c (n) 312的帶寬最小化)最小化,同時(shí)保持可接受的信號(hào)再現(xiàn)(即,s(n)310 & § (n) 316)。經(jīng)編碼的音頻信號(hào)312的組成可根據(jù)由編碼器302所利用的特定音頻編碼模式而 變化。下文描述了各種編碼模式。
可將下文所描述的編碼器302及解碼器304的組件實(shí)施為電子硬件、計(jì)算機(jī)軟件或 兩者的組合。下文就這些組件的功能性而描述了所述組件。將功能性實(shí)施為硬件還是軟 件可視特定應(yīng)用及強(qiáng)加于整個(gè)系統(tǒng)的設(shè)計(jì)約束而定。傳輸媒體306可表示許多不同傳輸 媒體,其包括(但不限于)基于陸地的通信線、基站與衛(wèi)星之間的鏈路、蜂窩式電話與 基站之間的無線通信、移動(dòng)電話與衛(wèi)星之間的無線通信或計(jì)算裝置之間的通信。
通信的每一方可傳輸數(shù)據(jù)以及接收數(shù)據(jù)。每一方可利用編碼器302及解碼器304。 然而,下文將把信號(hào)傳輸環(huán)境300描述為包括位于傳輸媒體306的一端處的編碼器302 及位于另一端處的解碼器304。
在---配置中,s (n) 310可包括在典型對(duì)話(包括不同有聲聲音及靜默周期)期間 所獲得的數(shù)字語音信號(hào)。可將所述語音信號(hào)s (n) 310分割為若千幀,且可將每一幀進(jìn) 一步分割為若干子幀。在執(zhí)行某一塊處理的情況下,可使用這些經(jīng)隨意選擇的幀/子幀邊 界。在此意義上,還可對(duì)子幀執(zhí)行被描述為對(duì)幀所執(zhí)行的操作本文中可互換使用幀及 子幀。并且,可將一個(gè)或一個(gè)以上幀包括于一窗口中,所述窗口可說明各種幀之間的放 置及時(shí)序。
在另一配置中,s (n) 310可包括一非語音信號(hào),例如,音樂信號(hào)??蓪⑺龇钦Z
音信號(hào)分割為若干幀??蓪⒁粋€(gè)或一個(gè)以上幀包括于一窗口中,所述窗口可說明各種幀
之間的放置及時(shí)序。窗口的選擇可視經(jīng)實(shí)施以對(duì)信號(hào)進(jìn)行編碼的編碼技術(shù)及可強(qiáng)加于系統(tǒng)的延遲約束而定。本系統(tǒng)及方法描述一種用于選擇窗口形狀的方法,所述窗口形狀用 于在能夠?qū)φZ音信號(hào)與非語音信號(hào)兩者進(jìn)行編碼的系統(tǒng)中以基于經(jīng)修改離散余弦變換 (MDCT)及逆經(jīng)修改離散余弦變換(IMDCT)的編碼技術(shù)來對(duì)非語音信號(hào)進(jìn)行編碼及 解碼。所述系統(tǒng)可強(qiáng)加約束于可由基于MDCT的編碼器使用多少幀延遲及先行而使得能 夠以均勻速率產(chǎn)生經(jīng)編碼信息。
在一配置中,編碼器302包括可格式化包括與非語音信號(hào)相關(guān)聯(lián)的幀的窗口的窗口 格式化模塊308??删幋a被包括于格式化窗口中的幀且解碼器可通過實(shí)施幀重構(gòu)模塊314 而重構(gòu)所述經(jīng)編碼幀。幀重構(gòu)模塊314可合成所述經(jīng)編碼幀以使得所述幀類似于語音信 號(hào)310的經(jīng)預(yù)編碼幀。
圖4為說明一種用于以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的方法400的一配置的流程 圖。所述方法400可由編碼器302實(shí)施。在一配置中,接收402 —信號(hào)。所述信號(hào)可為 如先前所描述的音頻信號(hào)??蓪⑺鲂盘?hào)分割404為多個(gè)幀??蓱?yīng)用408窗口函數(shù)以產(chǎn) 生窗口月.可產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域作為所述窗口的一部分以用于計(jì)算 經(jīng)修改離散余弦變換(MDCT)。換句話說,窗口的開始部分及結(jié)束部分的值可為零。在 一方面中,第一零填充區(qū)域的長(zhǎng)度及第二零填充區(qū)域的長(zhǎng)度可依據(jù)編碼器302的延遲約 束而變。
可將經(jīng)修改離散余弦變換(MDCT)函數(shù)用于若千音頻編碼標(biāo)準(zhǔn)中以將脈碼調(diào)制 (PCM)信號(hào)樣本或?qū)⑵浣?jīng)處理版本變換為其等效頻域表示。MDCT可類似于IV型離散 余弦變換(DCT),其中幀的額外特性彼此重疊。換句話說,信號(hào)的由MDCT所變換的 連續(xù)幀可彼此重疊50%。
另外,對(duì)于2M個(gè)樣本中的每一幀來說,MDCT可產(chǎn)生M個(gè)變換系數(shù)。MDCT可
為重要取樣完美重構(gòu)濾波器組。為提供完美重構(gòu),可由下式給出從信號(hào)W")(其中n=0、 1、 ...、 2M)的幀獲得的MDCT系數(shù)X(W (其中1< = 0、 1、…、
2M —I
(1)
其中
、(《) = vv(w)J— COS
(2 + M +1)(2& + 1>T-
4Af
(2)
10(其中1^=0、 1、…、M),且w (n)為可滿足普林森-布拉德利(Princen-Bradley) 條件的窗口,所述普林森-布拉德利(Princen-Bradley)條件陳述為
h>2(") + w20+ M) = 1 (3)
在解碼器處,可使用逆MDCT (IMDCT)而將M個(gè)經(jīng)編碼系數(shù)變換回到時(shí)域。如
果i"),(其中k=0、 1、 2、 ...、 M)為所接收的MDCT系數(shù),則對(duì)應(yīng)的IMDCT解碼 器通過根據(jù)下式而首先采用所接收的系數(shù)的IMDCT來獲得2M個(gè)樣本而產(chǎn)生經(jīng)重構(gòu)的 音頻信號(hào)
"o 其中n=0、 1、…、2M-1 (4)
其中& 由方程式(2)來界定,接著向當(dāng)前幀的最初M個(gè)樣本重疊及添加先 前幀的IMDCT輸出的M個(gè)最后樣本及來自下一幀的IMDCT輸出的最初M個(gè)樣本。因 此,如果對(duì)應(yīng)于下一幀的經(jīng)解碼MDCT系數(shù)在一給定時(shí)間不可用,則僅可完整地重構(gòu)當(dāng) 前幀的M個(gè)音頻樣本。
MDCT系統(tǒng)可利用M個(gè)樣本的先行。MDCT系統(tǒng)可包括編碼器,其使用預(yù)定窗 口而獲得音頻信號(hào)或其經(jīng)濾波版本的MDCT;及解碼器,其包括使用與編碼器所使用的 窗口相同的窗口的IMDCT函數(shù)。MDCT系統(tǒng)還可包括重疊及添加模塊。舉例來說,圖 4B說明了 MDCT編碼器401。由預(yù)處理器405接收輸入音頻信號(hào)403。所述預(yù)處理器 405實(shí)施預(yù)處理、線性預(yù)測(cè)編碼(LPC)濾波及其它類型的濾波。從預(yù)處理器405產(chǎn)生 經(jīng)處理的音頻信號(hào)407。將MDCT函數(shù)409應(yīng)用于已被適當(dāng)窗口化的2M個(gè)信號(hào)樣本。 在一配置中,量化器411量化及編碼M個(gè)系數(shù)413且將所述M個(gè)經(jīng)編碼系數(shù)傳輸?shù)?MDCT解碼器429。
解碼器429接收M個(gè)經(jīng)編碼系數(shù)413。使用與編碼器401中的窗口相同的窗口而將 IMDCT 415應(yīng)用于所述M個(gè)所接收系數(shù)413??蓪?M個(gè)信號(hào)值417分類為最初M個(gè) 樣本選擇423且可保存最后M個(gè)樣本419。可通過延遲421而將所述最后M個(gè)樣本419 進(jìn)一步延遲一個(gè)幀。可通過求和器425來對(duì)最初M個(gè)樣本423及經(jīng)延遲的最后M個(gè)樣 本419求和??墒褂盟鼋?jīng)求和的樣本來產(chǎn)生音頻信號(hào)的經(jīng)重構(gòu)的M個(gè)樣本427。通常,在MDCT系統(tǒng)中,可從一當(dāng)前幀的M個(gè)樣本及一未來幀的M個(gè)樣本而導(dǎo)出 2M個(gè)信號(hào)。然而,如果僅來自未來幀的L個(gè)樣本為可用的,則可選擇實(shí)施未來幀的L 個(gè)樣本的窗口。
在經(jīng)由電路交換網(wǎng)絡(luò)而操作的實(shí)時(shí)聲音通信系統(tǒng)中,可由最大可允許編碼延遲來約 束先行樣本的長(zhǎng)度。可假定先行長(zhǎng)度L為可用的。L可小于或等于M。在此條件下,可 能仍然需要使用MDCT (其中連續(xù)幀之間的重疊為L(zhǎng)個(gè)樣本),同時(shí)保持完美的重構(gòu)特 性。
本系統(tǒng)及方法可尤其與實(shí)時(shí)雙向通信系統(tǒng)有關(guān),其中預(yù)期一編碼器產(chǎn)生信息以用于 以規(guī)則的時(shí)間間隔進(jìn)行傳輸而不管對(duì)編碼模式的選擇。所述系統(tǒng)可能不能夠容忍在由編 碼器產(chǎn)生此信息時(shí)的抖動(dòng)或在產(chǎn)生此信息時(shí)的此抖動(dòng)可能不合需要。
在一配置中,將經(jīng)修改離散余弦變換(MDCT)函數(shù)應(yīng)用410于幀。應(yīng)用窗口函數(shù) 可為計(jì)算所述幀的MDCT中的一步驟。在一配置中,MDCT函數(shù)處理2M個(gè)輸入樣本以 產(chǎn)生M個(gè)可接著被量化及傳輸?shù)南禂?shù)。
在一配置中,可編碼412幀。在一方面中,可編碼412所述幀的系數(shù)??墒褂脤⒃?下文予以更完整地論述的各種編碼模式來編碼所述幀??蓪⑺鰩袷交?14于包中且 可傳輸416所述包。在一配置中,將所述包傳輸416到解碼器。
圖5為說明一種用于重構(gòu)音頻信號(hào)的經(jīng)編碼幀的方法500的一配置的流程圖。在一 配置中,可由解碼器304來實(shí)施方法500。可接收502包??蓮木幋a器302接收502所 述包。可分解504所述包以便檢索幀。在一配置中,可解碼506所述幀??芍貥?gòu)508所 述幀。在一實(shí)例中,幀重構(gòu)模塊314重構(gòu)所述幀以類似于音頻信號(hào)的經(jīng)預(yù)編碼幀??奢?出510所述經(jīng)重構(gòu)幀??蓪⑤敵龅膸c額外輸出的幀組合以再現(xiàn)音頻信號(hào)。
圖6為說明跨越通信信道606而與多模式解碼器604進(jìn)行通信的多模式編碼器602 的一配置的框圖。包括多模式編碼器602及多模式解碼器604的系統(tǒng)可為包括若干不同 編碼方案以編碼不同音頻信號(hào)類型的編碼系統(tǒng)。通信信道606可包括射頻(RF)接口。 編碼器602可包括相關(guān)聯(lián)的解碼器(未圖示)。編碼器602及其相關(guān)聯(lián)的解碼器可形成 第一編碼器。解碼器604可包括相關(guān)聯(lián)的編碼器(未圖示)。解碼器604及其相關(guān)的編
碼器可形成第二編碼器。
編碼器602可包括初始參數(shù)計(jì)算模塊618、模式分類模塊622、多個(gè)編碼模式624、 626、 628及包格式化模塊630。將編碼模式624、 626、 628的數(shù)目展示為N,其可表示 任何數(shù)目的編碼模式624、 626、 628。為簡(jiǎn)單起見,展示了三種編碼模式624、 626、 628,
其中虛線指示存在其它編碼模式。
122007800
解碼器604可包括包分解器模塊632、多個(gè)解碼模式634、 636、 638、幀重構(gòu)模塊 640及后濾波器642。將解碼模式634、 636、 638的數(shù)目展示為N,其可表示任何數(shù)目 的解碼模式634、 636、 638。為簡(jiǎn)單起見,展示三種解碼模式634、 636、 638,其中虛
線指示存在其它解碼模式。
可將音頻信號(hào)s(n) 610提供到初始參數(shù)計(jì)算模塊618及模式分類模塊622??蓪?所述信號(hào)610劃分為若干樣本塊(稱作幀)。值n可表示幀數(shù)目或值n可表示幀中的樣 本數(shù)目。在替代配置中,可使用線性預(yù)測(cè)(LP)殘余誤差信號(hào)來替代音頻信號(hào)610???由語音編碼器(例如,碼激勵(lì)線性預(yù)測(cè)(CELP)編碼器)使用所述LP殘余誤差信號(hào)。
初始參數(shù)計(jì)算模塊618可基于當(dāng)前幀而導(dǎo)出各種參數(shù)。在一方面中,這些參數(shù)包括 以下各項(xiàng)中的至少一者線性預(yù)測(cè)編碼(LPC)濾波器系數(shù)、線譜對(duì)(LSP)系數(shù)、規(guī) 范化自相關(guān)函數(shù)(NACF)、開放環(huán)路滯后、零交叉速率、帶能量及共振峰殘余信號(hào)。在 另一方面中,初始參數(shù)計(jì)算模塊618可通過濾波信號(hào)610、計(jì)算音高等等來預(yù)處理信號(hào) 610。
可將初始參數(shù)計(jì)算模塊618耦接到模式分類模塊622。所述模式分類模塊622可在 編碼模式624、 626、 628之間進(jìn)行動(dòng)態(tài)切換。初始參數(shù)計(jì)算模塊618可將關(guān)于當(dāng)前幀的 參數(shù)提供到模式分類模塊622。所述模式分類模塊622可經(jīng)耦接以逐幀地在編碼模式 624、 626、 628之間進(jìn)行動(dòng)態(tài)切換以便選擇用于當(dāng)前幀的適當(dāng)編碼模式624、 626、 628。 模式分類模塊622可通過將所述參數(shù)與預(yù)界定閾值及/或最高值相比較而選擇用于當(dāng)前 幀的特定編碼模式624、 626、 628。舉例來說,可使用MDCT編碼方案來編碼與非語音 信號(hào)相關(guān)聯(lián)的幀。MDCT編碼方案可接收幀且將特定MDCT窗口格式應(yīng)用于所述幀。 下文關(guān)于圖8而描述特定MDCT窗口格式的實(shí)例。
模式分類模塊622可將語音幀分類為語音或非活動(dòng)語音(例如,靜默、背景噪聲或 言語之間的暫停)?;趲闹芷谛裕J椒诸惸K622可將語音幀分類為特定類型的 語音(例如,有聲、無聲或瞬態(tài))。
有聲語音可包括展現(xiàn)出相對(duì)高程度的周期性的語音。音高周期可為語音幀的分量, 其可用于分析及重構(gòu)所述幀的內(nèi)容。無聲語音可包括輔音。瞬態(tài)語音幀可包括有聲語音 與無聲語音之間的過渡??蓪⒓任幢环诸悶橛新曊Z音又未被分類為無聲語音的幀分類為 瞬態(tài)語音。
將幀分類為語音還是非語音可允許使用不同編碼模式624、 626、 628來編碼不同類 型的幀,從而導(dǎo)致更有效地使用共享信道(例如,通信信道606)中的帶寬。
模式分類模塊622可基于幀的分類而選擇用于當(dāng)前幀的編碼模式624、 626、 628??刹⒙?lián)耦接各種編碼模式624、 626、 628。所述編碼模式624、 626、 628中的一者或一 者以上可在任何給定時(shí)間均為操作的。在一配置中,根據(jù)當(dāng)前幀的分類來選擇一個(gè)編碼 模式624、 626、 628。
不同編碼模式624、 626、 628可根據(jù)不同編碼位速率、不同編碼方案或編碼位速率 與編碼方案的不同組合而操作。不同編碼模式624、 626、 628還可將一不同窗口函數(shù)應(yīng) 用于一個(gè)幀。所使用的各種編碼速率可為全速率、半速率、四分之一速率及/或八分之一 速率。所使用的各種編碼模式624、 626、 628可為MDCT編碼、碼激勵(lì)線性預(yù)測(cè)(CELP) 編碼、原型音高周期(PPP)編碼(或波形內(nèi)插(WI)編碼)及/或噪聲激勵(lì)線性預(yù)測(cè)(NELP) 編碼。因此,舉例來說,特定編碼模式624、 626、 628可為MDCT編碼方案,另一編碼 模式可為全速率CELP,另一編碼模式624、 626、 628可為半速率CELP,另一編碼模式 可為624、 626、 628可為全速率PPP,且另一編碼模式624、 626、 628可為NELP。
根據(jù)使用傳統(tǒng)窗口來編碼、傳輸、接收及在解碼器處重構(gòu)音頻信號(hào)的M個(gè)樣本的 MDCT編碼方案,所述MDCT編碼方案利用編碼器處的輸入信號(hào)的2M個(gè)樣本。換句話 說,除音頻信號(hào)的當(dāng)前幀的M個(gè)樣本之外,編碼器可在可開始編碼之前等待收集額外M 個(gè)樣本。在MDCT編碼方案與其它編碼模式(例如,CELP)共存的多模式編碼系統(tǒng)中, 使用用于MDCT計(jì)算的傳統(tǒng)窗口格式可影響整體幀大小及整個(gè)編碼系統(tǒng)的先行長(zhǎng)度。本 系統(tǒng)及方法針對(duì)任何給定幀大小及先行長(zhǎng)度而提供用于MDCT計(jì)算的窗口格式的設(shè)計(jì) 及選擇,使得MDCT編碼方案不會(huì)將約束強(qiáng)加于多模式編碼系統(tǒng)。
根據(jù)CELP編碼模式,可使用LP殘余信號(hào)的經(jīng)量化版本來激勵(lì)線性預(yù)測(cè)聲道模型。 在CELP編碼模式中,可量化當(dāng)前幀。可使用CELP編碼模式來編碼被分類為瞬態(tài)語音 的幀。
根據(jù)NELP編碼模式,可使用經(jīng)濾波的偽隨機(jī)噪聲信號(hào)來模仿LP殘余信號(hào)。NELP 編碼模式可為實(shí)現(xiàn)低位速率的相對(duì)簡(jiǎn)單的技術(shù)??墒褂肗ELP編碼模式來編碼被分類為 無聲語音的幀。
根據(jù)PPP編碼模式,可編碼每一幀內(nèi)的一子組音高周期??赏ㄟ^在這些原型周期之
間進(jìn)行內(nèi)插來重構(gòu)語音信號(hào)的剩余周期。在PPP編碼的時(shí)域?qū)嵤┓桨钢?,可?jì)算第一組
參數(shù),所述第一組參數(shù)描述如何將先前原型周期修改為近似于當(dāng)前原型周期。可選擇一
個(gè)或一個(gè)以上碼向量,當(dāng)對(duì)所述一個(gè)或一個(gè)以上碼向量求和時(shí)其近似于當(dāng)前原型周期與
經(jīng)修改的先前原型周期之間的差。第二組參數(shù)描述這些所選擇的碼向量。在PPP編碼的
頻域?qū)嵤┓桨钢?,可?jì)算一組參數(shù)以描述原型的振幅及相位譜。根據(jù)PPP編碼的實(shí)施方
案,解碼器604可通過基于描述振幅及相位的若千組參數(shù)而重構(gòu)當(dāng)前原型來合成輸出音
14頻信號(hào)616??稍诋?dāng)前經(jīng)重構(gòu)原型周期與先前經(jīng)重構(gòu)原型周期之間的區(qū)域上內(nèi)插語音信 號(hào)。所述原型可包括當(dāng)前幀的一部分,所述部分將被線性地內(nèi)插有同樣位于所述幀內(nèi)的 來自先前幀的原型以便在解碼器604處重構(gòu)音頻信號(hào)610或LP殘余信號(hào)(即,將過去 的原型周期用作當(dāng)前原型周期的預(yù)測(cè)(predictor))。
編碼原型周期而非整個(gè)幀可降低編碼位速率。可以PPP編碼模式來編碼被分類為有 聲語音的幀。通過采用有聲語音的周期性,PPP編碼模式可實(shí)現(xiàn)比CELP編碼模式低的 位速率。
可將所選擇的編碼模式624、 626、 628耦接到包格式化模塊630。所述所選擇的編 碼模式624、 626、 628可編碼或量化當(dāng)前幀且將所述經(jīng)量化的幀參數(shù)612提供到包格式 化模塊630。在一配置中,所述經(jīng)量化的幀參數(shù)是從MDCT編碼方案所產(chǎn)生的編碼系數(shù)。 包格式化模塊630可將所述經(jīng)量化的幀參數(shù)612組合于經(jīng)格式化包613中。包格式化模 塊630可經(jīng)由通信信道606而將經(jīng)格式化包613提供到接收器(未圖示)。所述接收器 可接收、解調(diào)制及數(shù)字化所述經(jīng)格式化包613,且將包613提供到解碼器604。
在解碼器604中,包分解器模塊632可從接收器接收包613。包分解器模塊632可 拆開包63以便檢索經(jīng)編碼幀。包分解器模塊632還可經(jīng)配置以逐包地在解碼模式634、 636、 638之間進(jìn)行動(dòng)態(tài)切換。解碼模式634、 636、 638的數(shù)目可與編碼模式624、 626、 628的數(shù)目相同。每一經(jīng)編號(hào)的編碼模式624、 626、 628可與經(jīng)配置以采用相同編碼位 速率及編碼方案的相應(yīng)經(jīng)類似編號(hào)的解碼模式634、 636、 638相關(guān)聯(lián)。
如果包分解器模塊632檢測(cè)到包613,則分解所述包613并將其提供到相關(guān)的解碼 模式634、 636、 638。相關(guān)的解碼模式634、 636、 638可基于包613內(nèi)的幀而實(shí)施MDCT、 CELP、 PPP或NELP解碼技術(shù)。如果包分解器模塊632并未檢測(cè)到包,則宣告包丟失且 擦除解碼器(未圖示)可執(zhí)行幀擦除處理。可將解碼模式634、 636、 638的并聯(lián)陣列耦 接到幀重構(gòu)模塊640。所述幀重構(gòu)模塊640可重構(gòu)或合成所述幀,從而輸出經(jīng)合成的幀。 可將所述經(jīng)合成的幀與其它經(jīng)合成的幀組合以產(chǎn)生類似于輸入音頻信號(hào)s (n) 610的 經(jīng)合成的音頻信號(hào)§ (n) 616。
圖7為說明音頻信號(hào)編碼方法700的一實(shí)例的流程圖??捎?jì)算702當(dāng)前幀的初始參
數(shù)。在一配置中,初始參數(shù)計(jì)算模塊618計(jì)算702所述參數(shù)。對(duì)于非語音幀來說,所述
參數(shù)可包括一個(gè)或一個(gè)以上系數(shù)以指示所述幀為非語音幀。語音幀可包括以下各項(xiàng)中的
一者或一者以上的參數(shù)線性預(yù)測(cè)編碼(LPC)濾波器系數(shù)、線譜對(duì)(LSP)系數(shù)、規(guī)
范化自相關(guān)函數(shù)(NACF)、開放環(huán)路滯后、帶能量、零交叉速率及共振峰殘余信號(hào)。非
語音幀還可包括例如線性預(yù)測(cè)編碼(LPC)濾波器參數(shù)的參數(shù)。
15可將當(dāng)前幀分類704為語音幀或非語音幀。如先前所提及,語音幀可與語音信號(hào)相 關(guān)聯(lián)且非語音幀可與非語音信號(hào)(即,音樂信號(hào))相關(guān)聯(lián)??苫诓襟E702及704中所 進(jìn)行的幀分類來選擇710編碼器/解碼器模式。如圖6中所示,可并聯(lián)連接各種編碼器/ 解碼器模式。不同編碼器/解碼器模式可根據(jù)不同編碼方案而操作。某些模式可在音頻信 號(hào)s (n) 610的展現(xiàn)某些特性的編碼部分處更為有效。
如先前所解釋,可選擇MDCT編碼方案以編碼被分類為非語音幀(例如,音樂)的 幀??蛇x擇CELP模式以編碼被分類為瞬態(tài)語音的幀??蛇x擇PPP模式以編碼被分類為 有聲語音的幀??蛇x擇NELP模式以編碼被分類為無聲語音的幀??梢宰兓男阅芩?以不同的位速率來頻繁地操作相同編碼技術(shù)。圖6中的不同編碼器/解碼器模式可表示不 同編碼技術(shù)或以不同位速率操作的相同編碼技術(shù)或上述的組合。所選擇的編碼器模式 710可將適當(dāng)?shù)拇翱诤瘮?shù)應(yīng)用于所述幀。舉例來說,如果所選擇的編碼模式為MDCT編 碼方案,則可應(yīng)用本系統(tǒng)及方法的特定MDCT窗口函數(shù)?;蛘?,如果所選擇的編碼模式 為CELP編碼方案,則可將與CELP編碼方案相關(guān)聯(lián)的窗口函數(shù)應(yīng)用于所述幀。所選擇 的編碼器模式可編碼712當(dāng)前幀且將所述經(jīng)編碼幀格式化714于包中??蓪⑺霭鼈鬏?716到解碼器。
圖8為說明在將特定MDCT窗口函數(shù)應(yīng)用于每一幀之后多個(gè)幀802、 804、 806的一 配置的框圖。在一配置中,先前幀802、當(dāng)前幀804及未來幀806可各自被分類為非語 音幀??捎?M來表示當(dāng)前幀804的長(zhǎng)度820。先前幀802及未來幀806的長(zhǎng)度還可為 2M。當(dāng)前幀804可包括第一零填充區(qū)域810及第二零填充區(qū)域818。換句話說,第一零 填充區(qū)域810及第二零填充區(qū)域818中的系數(shù)值可為零。
在一配置中,當(dāng)前幀804還包括重疊長(zhǎng)度812及先行長(zhǎng)度816??蓪⑺鲋丿B長(zhǎng)度 812及所述先行長(zhǎng)度816表示為L(zhǎng)。重疊長(zhǎng)度812可重疊先前幀802的先行長(zhǎng)度。在一 配置中,值L小于值M。在另一配置中,值L等于值M。當(dāng)前幀還可包括單位長(zhǎng)度814, 其中在此長(zhǎng)度814中幀的每一值為一。如所說明,未來幀806可在當(dāng)前幀804的中途點(diǎn) 808處開始。換句話說,未來幀806可在當(dāng)前幀804的長(zhǎng)度M處開始。類似地,先前幀 802可在當(dāng)前幀804的中途點(diǎn)808處結(jié)束。因而,在當(dāng)前幀804上存在先前幀802與未 來幀806的50%重疊。
如果量化器/MDCT系數(shù)模塊在解碼器處可靠地重構(gòu)MDCT系數(shù),則特定MDCT窗
口函數(shù)可促進(jìn)在解碼器處完美地重構(gòu)音頻信號(hào)。在一配置中,量化器/MDCT系數(shù)編碼模
塊在解碼器處可能并未可靠地重構(gòu)MDCT系數(shù)。在此狀況下,解碼器的重構(gòu)保真度可視
量化器/MDCT系數(shù)編碼模塊可靠地重構(gòu)所述系數(shù)的能力而定。如果當(dāng)前幀被先前幀與未來幀兩者重疊50%,則將MDCT窗口應(yīng)用于所述當(dāng)前幀可提供所述當(dāng)前幀的完美重構(gòu)。 另外,如果滿足普林森-布拉德利(Princen-Bradley)條件,則MDCT窗口可提供完美重 構(gòu)。如先前所提及,可將普林森-布拉德利(Princen-Bradley)條件表達(dá)為
w2(w) +w2(n + M) = 1 (3)
其中vv 6^可表示圖8中所說明的MDCT窗口。由方程式(3)所表達(dá)的條件可意 味著幀802、 804、 806上的被添加到不同幀802、 804、 806上的對(duì)應(yīng)點(diǎn)的一點(diǎn)將提供值 一。舉例來說,中途長(zhǎng)度808中先前幀802的被添加到中途長(zhǎng)度808中當(dāng)前幀804的對(duì) 應(yīng)點(diǎn)的一點(diǎn)產(chǎn)生值一。
圖9為說明一種用于將MDCT窗口函數(shù)應(yīng)用于與非語音信號(hào)相關(guān)聯(lián)的幀(例如,圖 8中所描述的當(dāng)前幀804)的方法900的一配置的流程圖。應(yīng)用MDCT窗口函數(shù)的過程 可為計(jì)算MDCT中的一步驟。換句話說,在不使用滿足兩個(gè)連續(xù)窗口之間的50%重疊 的條件及先前所解釋的普林森-布拉德利(Princen-Bradley)條件的窗口的情況下可不應(yīng) 用完美重構(gòu)MDCT。可將方法900中所描述的窗口函數(shù)實(shí)施為將MDCT函數(shù)應(yīng)用于一 個(gè)幀的一部分。在-實(shí)例中,來自當(dāng)前幀804的M個(gè)樣本以及L個(gè)先行樣本為可用的。 L可為任意值。
可產(chǎn)生902當(dāng)前幀804的(M-L) /2個(gè)樣本的第一零填充區(qū)域。如先前所解釋,零 填充可意味著第一零填充區(qū)域810中的樣本的系數(shù)可為零。在一配置中,可提供904當(dāng) 前幀804的L個(gè)樣本的重疊長(zhǎng)度。當(dāng)前幀的L個(gè)樣本的重疊長(zhǎng)度可重疊且添加有卯6先 前幀802的經(jīng)重構(gòu)的先行長(zhǎng)度。當(dāng)前幀804的第一零填充區(qū)域及重疊長(zhǎng)度可重疊先前幀 80250%。在一配置中,可提供908當(dāng)前幀的(M-L)個(gè)樣本。還可提供910當(dāng)前幀的L 個(gè)先行樣本。所述L個(gè)先行樣本可重疊未來幀806。可產(chǎn)生當(dāng)前幀的(M-L) /2個(gè)樣本 的第二零填充區(qū)域。在一配置中,當(dāng)前幀804的L個(gè)先行樣本及第二零填充區(qū)域可重疊 未來幀80650%。已被應(yīng)用方法900的幀可滿足如先前所描述的普林森-布拉德利 (Princen-Bradley)條件。
圖IO為說明一種用于重構(gòu)已由MDCT窗口函數(shù)加以修改的幀的方法1000的一配置
的流程圖。在一配置中,由幀重構(gòu)模塊34來實(shí)施方法1000。可合成1002當(dāng)前幀804
的開始于第一零填充區(qū)域810的末端到(M-L)區(qū)域814的末端的樣本??上虍?dāng)前幀804
的L個(gè)樣本的重疊區(qū)域添加1004先前幀802的先行長(zhǎng)度。在一配置中,可存儲(chǔ)1006開
始于(M-L)區(qū)域814的末端到第二零填充區(qū)域818的開端的當(dāng)前幀804的L個(gè)先行樣本816。在一實(shí)例中,可將L個(gè)先行樣本816存儲(chǔ)于解碼器304的存儲(chǔ)器組件中。在一 配置中,可輸出1008 M個(gè)樣本??蓪⑺敵龅腗個(gè)樣本與額外樣本組合以重構(gòu)當(dāng)前幀 804。
圖11說明了可根據(jù)本文中所描述的系統(tǒng)及方法而用于通信/計(jì)算裝置1108中的各種 組件。通信/計(jì)算裝置1108可包括控制所述裝置1108的操作的處理器1102。還可將所 述處理器1102稱作CPU。存儲(chǔ)器1104 (其可包括只讀存儲(chǔ)器(ROM)及隨機(jī)存取存儲(chǔ) 器(RAM)兩者)將指令及數(shù)據(jù)提供到處理器1102。存儲(chǔ)器1104的一部分還可包括非 易失性隨機(jī)存取存儲(chǔ)器(NVRAM)。
裝置1108還可包括含有傳輸器1110及接收器1112的外殼1122以允許在接入終端 1108與遠(yuǎn)程位置之間傳輸及接收數(shù)據(jù)??蓪鬏斊?110及接收器1112組合于收發(fā)器 1120中??蓪⑻炀€1118附接到外殼1122且將其電耦接到收發(fā)器1120。可將傳輸器1110、 接收器1112、收發(fā)器1120及天線UI8用于通信裝置1108配置中。
裝置1108還包括用于檢測(cè)及量化由收發(fā)器1120所接收的信號(hào)的電平的信號(hào)檢測(cè)器 1106。信號(hào)檢測(cè)器U06檢測(cè)例如總能量、每偽噪聲(PN)碼片的導(dǎo)頻能量、功率譜密 度的信號(hào)及其它信號(hào)。
通信裝置1108的狀態(tài)改變器1114基于當(dāng)前狀態(tài)及由收發(fā)器1120所接收且由信號(hào)檢 測(cè)器1106所檢測(cè)的額外信號(hào)來控制通信/計(jì)算裝置1108的狀態(tài)。裝置1108可能能夠以 若干狀態(tài)中的任一狀態(tài)來操作通信/計(jì)算裝置1108還包括系統(tǒng)確定器1124,所述系統(tǒng)確定器1124用于控制裝置 1108且在確定當(dāng)前服務(wù)提供者系統(tǒng)不適當(dāng)時(shí)確定裝置1108應(yīng)轉(zhuǎn)移到哪一服務(wù)提供者系 統(tǒng)。
通信/計(jì)算裝置U08的各組件可由總線系統(tǒng)1126耦接在一起,除數(shù)據(jù)總線之外,總 線系統(tǒng)1126還可包括功率總線、控制信號(hào)總線及狀態(tài)信號(hào)總線。然而,為清晰起見, 在圖11中將各種總線繪示為總線系統(tǒng)1126。通信/計(jì)算裝置1108還可包括數(shù)字信號(hào)處 理器(DSP) 1116以用于處理信號(hào)。
可使用多種不同技術(shù)及技藝中的任一者來表示信息及信號(hào)。舉例來說,可由電壓、 電流、電磁波、磁場(chǎng)或磁粒子、光場(chǎng)或光學(xué)粒子或其任何組合來表示在以上描述中可能 提及的數(shù)據(jù)、指令、命令、信息、信號(hào)、位、符號(hào)及碼片。
可將結(jié)合本文中所揭示的配置而描述的各種說明性邏輯塊、模塊、電路及算法步驟
實(shí)施為電子硬件、計(jì)算機(jī)軟件或兩者的組合。為清楚地說明硬件與軟件的此互換性,已
在上文大致就其功能性而描述了各種說明性組件、塊、模塊、電路及步驟。將此功能性實(shí)施為硬件還是軟件視特定應(yīng)用及強(qiáng)加于整個(gè)系統(tǒng)的設(shè)計(jì)約束而定。所屬領(lǐng)域的技術(shù)人 員可以針對(duì)每一特定應(yīng)用以多種方式來實(shí)施所描述的功能性,但不應(yīng)將所述實(shí)施方案決 策解釋為導(dǎo)致脫離本發(fā)明系統(tǒng)及方法的范圍。
可通過通用處理器、數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程 門陣列信號(hào)(FPGA)或其它可編程邏輯裝置、離散門或晶體管邏輯、離散硬件組件或 其經(jīng)設(shè)計(jì)以執(zhí)行本文所述功能的任何組合來實(shí)施或執(zhí)行結(jié)合本文所揭示配置而描述的 各種說明性邏輯塊、模塊及電路。通用處理器可為微處理器,但在替代方案中,處理器 可為任何處理器、控制器、微控制器或狀態(tài)機(jī)。還可將處理器實(shí)施為計(jì)算裝置的組合, 例如,DSP與微處理器的組合、多個(gè)微處理器的組合、 一個(gè)或一個(gè)以上微處理器與DSP 核心的聯(lián)合或任何其它此類配置的組合。
結(jié)合本文中所揭示的配置而描述的方法或算法的步驟可直接以硬件、由處理器執(zhí)行 的軟件模塊或所述兩者的組合體現(xiàn)。軟件模塊可駐留于RAM存儲(chǔ)器、快閃存儲(chǔ)器、ROM 存儲(chǔ)器、可擦除可編程只讀存儲(chǔ)器(EPROM)、電可擦除可編程只讀存儲(chǔ)器(EEPROM)、 寄存器、硬盤、可拆卸盤、緊密光盤只讀存儲(chǔ)器(CD-ROM)或此項(xiàng)技術(shù)中已知的任何 其它形式的存儲(chǔ)媒體中??蓪⒋鎯?chǔ)媒體耦接到所述處理器,使得所述處理器可從所述存 儲(chǔ)媒體讀取信息或?qū)⑿畔?與入到所述存儲(chǔ)媒體。在替代例中,所述存儲(chǔ)媒體可與所述處 理器成一體。所述處理器及所述存儲(chǔ)媒體可駐留于ASIC中。所述ASIC可駐留于用戶 終端中。在替代例中,所述處理器及所述存儲(chǔ)媒體可作為離散組件而駐留于用戶終端中。
本文中所揭示的方法包含一個(gè)或一個(gè)以上用于實(shí)現(xiàn)所描述的方法的步驟或動(dòng)作。所 述方法步驟及/或動(dòng)作可彼此互換而不脫離本系統(tǒng)及方法的范圍。換句話說,除非針對(duì)配 置的恰當(dāng)操作而規(guī)定步驟或動(dòng)作的特定次序,否則可修改特定步驟及/或動(dòng)作的次序及/ 或使用而不脫離本系統(tǒng)及方法的范圍。可將本文中所揭示的方法以硬件、軟件、或兩者 實(shí)施。硬件及存儲(chǔ)器的實(shí)例可包括RAM、 ROM、 EPROM、 EEPROM、快閃存儲(chǔ)器、光 盤、寄存器、硬盤、CD-ROM或任何其它類型的硬件及存儲(chǔ)器。
雖然已說明及描述了本系統(tǒng)及方法的特定配置與應(yīng)用,但將理解,所述系統(tǒng)及方法并不 受限于本文中所揭示的精確配置及組件??稍诓幻撾x所主張的系統(tǒng)及方法的精神及范圍 的情況下對(duì)本文中所揭示的方法及系統(tǒng)的布置、操作及細(xì)節(jié)進(jìn)行所屬領(lǐng)域的技術(shù)人員所 顯而易見的多種修改、改變及變化。
權(quán)利要求
1.一種用于以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的方法,所述方法包含接收信號(hào);將所述信號(hào)分割為多個(gè)幀;確定所述多個(gè)幀內(nèi)的一個(gè)幀是否與非語音信號(hào)相關(guān)聯(lián);如果確定所述幀與非語音信號(hào)相關(guān)聯(lián),則將經(jīng)修改離散余弦變換(MDCT)窗口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域;以及對(duì)所述幀進(jìn)行編碼。
2. 根據(jù)權(quán)利要求1所述的方法,其中使用基于MDCT編碼的方案對(duì)所述幀進(jìn)行編碼。
3. 根據(jù)權(quán)利要求1所述的方法,其中所述幀包含2M的長(zhǎng)度,其中M表示所述幀中 的樣本的數(shù)目。
4. 根據(jù)權(quán)利要求1所述的方法,其中所述第一零填充區(qū)域位于所述幀的開端處。
5. 根據(jù)權(quán)利要求1所述的方法,其中所述第二零填充區(qū)域位于所述幀的末端處。
6. 根據(jù)權(quán)利要求1所述的方法,其中所述第一零填充區(qū)域及所述第二區(qū)域包含(M-L) /2的長(zhǎng)度,其中L是小于或等于M的值,且其中M是所述幀中的樣本的數(shù)目。
7. 根據(jù)權(quán)利要求7所述的方法,其進(jìn)一步包含提供長(zhǎng)度為L(zhǎng)的當(dāng)前重疊區(qū)域。
8. 根據(jù)權(quán)利要求7所述的方法,其中長(zhǎng)度為L(zhǎng)的所述重疊區(qū)域重疊且添加有與先前幀 相關(guān)聯(lián)的先行樣本。
9. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包含提供長(zhǎng)度為L(zhǎng)的先行區(qū)域,其中L小 于或等于M,且其中M是所述幀中的樣本的數(shù)目。
10. 根據(jù)權(quán)利要求9所述的方法,其中長(zhǎng)度為L(zhǎng)的所述先行區(qū)域和與未來幀相關(guān)聯(lián)的未 來重疊區(qū)域重疊。
11.根據(jù)權(quán)利要求1所述的方法,其中所述第一零填充區(qū)域及所述當(dāng)前重疊區(qū)域重疊先 前幀50%。
12.根據(jù)權(quán)利要求1所述的方法,其中所述第二零填充區(qū)域及所述先行區(qū)域重疊未來幀 50%。
13.根據(jù)權(quán)利要求1所述的方法,其中添加有來自重疊的幀的相關(guān)聯(lián)樣本的所述幀的每 一樣本的和等于一。
14.一種用于以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的設(shè)備,其包含 處理器存儲(chǔ)器,其與所述處理器進(jìn)行電子通信 指令,其存儲(chǔ)于所述存儲(chǔ)器中,所述指令可執(zhí)行以 接收信號(hào)將所述信號(hào)分割為多個(gè)幀;確定所述多個(gè)幀內(nèi)的一個(gè)幀是否與非語音信號(hào)相關(guān)聯(lián);如果確定所述幀與非語音信號(hào)相關(guān)聯(lián),則將經(jīng)修改離散余弦變換(MDCT)窗 口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域;以及 對(duì)所述幀進(jìn)行編碼。
15. 根據(jù)權(quán)利要求14所述的設(shè)備,其中使用基于MDCT編碼的方案對(duì)所述幀編碼。
16. 根據(jù)權(quán)利要求14所述的設(shè)備,其中所述幀包含等于2M的樣本長(zhǎng)度,其中M表示 所述幀中的樣本的數(shù)目。
17. 根據(jù)權(quán)利要求14所述的設(shè)備,其中所述第一零填充區(qū)域位于所述幀的開端處。
18. 根據(jù)權(quán)利要求14所述的設(shè)備,其中所述第二零填充區(qū)域位于所述幀的末端處。
19. 一種經(jīng)配置而以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的系統(tǒng),其包含: 用于處理的裝置;用于接收信號(hào)的裝置;用于將所述信號(hào)分割為多個(gè)幀的裝置;用于確定所述多個(gè)幀內(nèi)的一個(gè)幀是否與非語音信號(hào)相關(guān)聯(lián)的裝置; 用于在確定所述幀與非語音信號(hào)相關(guān)聯(lián)的情況下將經(jīng)修改離散余弦變換(MDCT)窗口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域的裝置以及用于對(duì)所述幀進(jìn)行編碼的裝置。
20. —種計(jì)算機(jī)可讀媒體,其經(jīng)配置以存儲(chǔ)一組指令,所述指令可執(zhí)行以接收信號(hào)-將所述信號(hào)分割為多個(gè)幀;確定所述多個(gè)幀內(nèi)的一個(gè)幀是否與非語音信號(hào)相關(guān)聯(lián);如果確定所述幀與非語音信號(hào)相關(guān)聯(lián),則將經(jīng)修改離散余弦變換(MDCT)窗口 函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域;以及 對(duì)所述幀進(jìn)行編碼。
21. —種用于選擇待用于計(jì)算幀的經(jīng)修改離散余弦變換(MDCT)的窗口函數(shù)的方法, 所述方法包含提供用于選擇待用于計(jì)算幀的MDCT的窗口函數(shù)的算法 將所述所選擇的窗口函數(shù)應(yīng)用于所述幀;以及基于由額外編碼模式強(qiáng)加于MDCT編碼模式的約束而以所述MDCT編碼模式來 對(duì)所述幀進(jìn)行編碼,其中所述約束包含所述幀的長(zhǎng)度、先行長(zhǎng)度及延遲。
22. —種用于重構(gòu)音頻信號(hào)的經(jīng)編碼幀的方法,所述方法包含接收包;分解所述包以檢索經(jīng)編碼幀合成所述幀的位于第-一零填充區(qū)域與第一區(qū)域之間的樣本; 向第一長(zhǎng)度的重疊區(qū)域添加先前幀的先行長(zhǎng)度 存儲(chǔ)所述幀的所述第一長(zhǎng)度的先行;以及 輸出經(jīng)重構(gòu)的幀。
全文摘要
本發(fā)明描述一種用于以與音頻信號(hào)相關(guān)聯(lián)的幀修改窗口的方法。接收信號(hào)。將所述信號(hào)分割為多個(gè)幀。確定所述多個(gè)幀內(nèi)的一個(gè)幀是否與非語音信號(hào)相關(guān)聯(lián)。如果確定所述幀與非語音信號(hào)相關(guān)聯(lián),則將經(jīng)修改離散余弦變換(MDCT)窗口函數(shù)應(yīng)用于所述幀以產(chǎn)生第一零填充區(qū)域及第二零填充區(qū)域。對(duì)所述幀進(jìn)行編碼。解碼器窗口與編碼器窗口相同。
文檔編號(hào)G10L19/02GK101496098SQ200780028286
公開日2009年7月29日 申請(qǐng)日期2007年7月31日 優(yōu)先權(quán)日2006年7月31日
發(fā)明者文卡特什·克里希南, 阿南塔帕德馬那伯罕·A·坎達(dá)哈達(dá)伊 申請(qǐng)人:高通股份有限公司