国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種參數(shù)域回聲控制裝置和方法

      文檔序號:2832687閱讀:207來源:國知局
      專利名稱:一種參數(shù)域回聲控制裝置和方法
      技術領域
      本發(fā)明涉及通話語音信號處理領域,尤其涉及一種參數(shù)域回聲控制裝置和方法。
      背景技術
      通話語音質(zhì)量是衡量電信網(wǎng)絡優(yōu)劣的關鍵指標之一,也是各電信設備制造商的核心競爭カ之所在。為了在通話過程中保證語音質(zhì)量,關鍵的一點即是需要對通話過程中產(chǎn)生的回聲及其他干擾源進行有效處理,以提升通話雙方的主觀感受。通話過程中所產(chǎn)生的回聲根據(jù)其來源主要可包括電學回聲和聲學回聲兩大類,其中,電學回聲的產(chǎn)生機理如圖I所示,由于電信網(wǎng)絡中的ニ /四線混合變換器(Hybrid)的 工作狀態(tài)與外線阻抗特性緊密相關,當hybrid與外線阻抗不匹配吋,就無法做到將發(fā)送端和接收端完全隔離,因此,如圖I所示,不同的話機和不同長度的用戶線導致在hybrid處信號泄露,從而使得對方用戶能聽到自己的聲音。聲學回聲的產(chǎn)生機理如圖2所示,其主要由揚聲器與話筒之間的稱合導致。參照圖2,從近端揚聲器播放出來的遠端聲音信號總會有一部分通過話筒又傳回遠端,這樣遠端用戶就又聽到了自己的聲音。傳統(tǒng)的回聲控制算法是基于線性域的脈沖編碼調(diào)制(Pulse Code Modulation,PCM)來實現(xiàn)的,所謂線性域,就是基于直接樣點值的方式,如果通信鏈路存在編解碼壓縮環(huán)節(jié),則需要一個對應的解碼器將壓縮碼流完全解碼后還原到樣點值,其適用于所經(jīng)網(wǎng)元 需要解碼或者輸入為線性域PCM的場景。但隨著近年來免二次編解碼操作(Tandem FreeOperation, TF0)和免碼變換操作(Transcoder Free Operation, TrFO)的興起,不需要再在收發(fā)端之間進行多次語音編解碼的轉(zhuǎn)換,因此傳統(tǒng)的回聲控制算法不再適用,而是需要通過參數(shù)域解碼得到參數(shù)域的特征參數(shù),從而在參數(shù)域上進行回聲控制。所謂參數(shù)域解碼,就是只對壓縮碼流進行部分解碼,提取出每ー幀自身的參數(shù)域特征參數(shù),包括固定碼本增益、自適應碼本增益、線譜頻率等,通過修改壓縮碼流中的這些參數(shù)域特征參數(shù)來實現(xiàn)回聲控制,而不需要通過解碼器將壓縮碼流全部還原到樣點值。在參數(shù)域?qū)芈曔M行控制時,由于輸入輸出的都是壓縮編碼信號,對于ー些編碼類型,例如自適應多速率聲碼器(Adaptive Multi Rate Codec, AMR)和增強型全速率聲碼器(Enhanced Full Rate Codec, EFR),其巾貞與巾貞之間是互相關聯(lián)的,不能只簡單獨立地對某一幀進行回聲控制,尤其是在回聲與非回聲切換時,需要進行ー些特殊處理才能使得回聲與非回聲的過渡更為自然?,F(xiàn)有技術提供了ー種可應用于TFO/TrFO業(yè)務場景的回聲控制方法,該方法通過對近端輸入信號中的固定碼本增益和自適應碼本增益進行重新量化輸出,以達到對回聲與非回聲的切換進行過渡處理的目的。圖3示出了現(xiàn)有技術提供的通過上述方法在參數(shù)域?qū)崿F(xiàn)回聲控制的裝置的結構示意圖。然而,現(xiàn)有技術在處理回聲與非回聲的過渡時,當需要對諸如AMR和EFR這樣的編碼類型信號進行相關處理吋,由于這些信號的幀與幀之間存在相互關聯(lián),因此參數(shù)的量化與前一幀該參數(shù)的預測誤差也存在相互關聯(lián)。而現(xiàn)有技術并未對相關的線性預測系數(shù)進行重新量化,因此,通過現(xiàn)有技術對采用上述編碼方式的信號進行處理時,最終解碼得到的線性預測參數(shù)存在出現(xiàn)異常的風險,進而帶來信號的突變,使得回聲與非回聲之間進行切換時無法平滑過渡。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于提供一種參數(shù)域回聲控制裝置,g在解決現(xiàn)有技術中在處理回聲到非回聲過渡時,容易導致回聲與非回聲的切換無法過渡自然的問題。本發(fā)明實施例是這樣實現(xiàn)的,一種參數(shù)域回聲控制裝置,所述裝置包括回聲檢測模塊,用于通過參數(shù)域解碼,分別提取遠端輸出信號和近端輸入信號的參數(shù)域特征參數(shù),并根據(jù)所述參數(shù)域特征參數(shù)檢測近端輸入信號幀是否為回聲幀,所述參數(shù)域特征參數(shù)包括線譜頻率(Line Spectral Frequency, LSF)、固定碼本增益以及自適應碼本增益; 過渡模塊,用于當所述回聲檢測模塊檢測出近端輸入信號幀為非回聲幀時,對該近端輸入信號幀中的固定碼本增益、自適應碼本增益以及LSF預測誤差進行重新量化,并分別替換近端輸入信號幀原始的固定碼本增益、自適應碼本增益和LSF。本發(fā)明的另一目的在于提供一種參數(shù)域回聲控制方法,所述方法包括下述步驟根據(jù)遠端輸出信號和近端輸入信號的參數(shù)域特征參數(shù),檢測近端輸入信號幀是否為回聲幀,所述參數(shù)域特征參數(shù)包括LSF、固定碼本增益以及自適應碼本増益;當檢測出近端輸入信號幀為非回聲幀時,對該近端輸入信號幀中的固定碼本增益、自適應碼本增益以及LSF預測誤差進行重新量化,以分別替換該近端輸入信號幀原始的固定碼本增益、自適應碼本增益和LSF。本發(fā)明實施例對通話過程中產(chǎn)生的回聲在參數(shù)域進行控制,相比于傳統(tǒng)的線性域回聲控制需要對壓縮碼流進行完全解碼的方法,其很大程度上提高了回聲控制的效率,當檢測到非回聲幀時,通過對該非回聲幀的固定碼本增益和自適應碼本增益進行重新量化來完成回聲與非回聲之間的切換,同時,考慮到該非回聲幀中的LSF與前ー幀的LSF預測誤差存在相互關聯(lián),通過對該非回聲幀中的LSF預測誤差進行重新量化以替代原始的LSF,從而降低了最終解碼得到的LSF出現(xiàn)異常的風險,由此避免了信號的突變,實現(xiàn)了回聲與非回聲之間進行切換時的平滑過渡。


      圖I為現(xiàn)有技術提供的電學回聲的產(chǎn)生機理不意圖;圖2為現(xiàn)有技術提供的聲學回聲的產(chǎn)生機理不意圖;圖3為現(xiàn)有技術提供的可應用于TFO/TrFO業(yè)務場景的參數(shù)域回聲控制的裝置的結構示意圖;圖4為本發(fā)明實施例提供的參數(shù)域回聲控制裝置的結構框圖;圖5為本發(fā)明實施例提供的參數(shù)域回聲控制裝置回聲檢測模塊的具體結構圖;圖6為本發(fā)明實施例提供的參數(shù)域回聲控制裝置舒適噪聲插入模塊的具體結構圖;圖7為采用本發(fā)明實施例提供的參數(shù)域回聲控制裝置舒適噪聲插入模塊進行回聲消除的優(yōu)化效果圖;圖8為本發(fā)明實施例提供的參數(shù)域回聲控制裝置過渡模塊的具體結構圖;圖9為采用本發(fā)明實施例提供的參數(shù)域回聲控制裝置過渡模塊進行回聲與非回聲過渡的優(yōu)化效果圖;圖10為本發(fā)明實施例提供的參數(shù)域回聲控制裝置A ロ IP或者ATM組網(wǎng)下的TrFO應用場景;圖11為本發(fā)明實施例提供的參數(shù)域回聲控制裝置A ロ TDM組網(wǎng)下的TFO應用場
      旦 牙ヽ;圖12示出了本發(fā)明實施例提供的參數(shù)域回聲控制方法的實現(xiàn)流程圖;圖13示出了本發(fā)明實施例提供的參數(shù)域回聲控制方法檢測近端輸入信號幀是否為回聲幀的具體流程圖;圖14示出了本發(fā)明實施例提供的參數(shù)域回聲控制方法在當近端輸入信號幀為回聲幀時,對回聲幀進行替換的具體流程圖;圖15示出了本發(fā)明實施例提供的參數(shù)域回聲控制方法當近端輸入信號幀為非回聲幀時,回聲控制方法的具體流程圖。
      具體實施例方式在對通話過程中產(chǎn)生的回聲在參數(shù)域進行控制的過程中,當面臨回聲與非回聲之間的切換時,本發(fā)明實施例對當前幀的LSF預測誤差進行重新量化,并作為近端輸出信號中的LSF輸出,從而在切換過程中考慮了幀與幀之間的聯(lián)系,避免了對當前幀進行獨立處理而導致的回聲與非回聲之間的硬切換,提升了回聲與非回聲之間的過渡效果。圖4示出了本發(fā)明實施例提供的參數(shù)域回聲控制裝置的結構框圖,為了便于說明,僅不出了與本實施例相關的部分。參照圖4,該裝置包括回聲檢測模塊41、舒適噪聲插入模塊42、過渡模塊43和比特打包模塊44 回聲檢測模塊41,通過參數(shù)域解碼,分別提取遠端輸出信號和近端輸入信號的參數(shù)域特征參數(shù),井根據(jù)提取出的參數(shù)域特征參數(shù)檢測近端輸入信號是否為回聲。圖5示出了本發(fā)明實施例提供的參數(shù)域回聲控制裝置回聲檢測模塊的具體結構圖,參照圖5,回聲檢測模塊41包括了 部分解碼單元411,其分別對輸入的遠端輸出信號和近端輸入信號進行部分解碼,從而提取出遠端輸出信號和近端輸入信號當前子幀的參數(shù)域特征參數(shù),包括LSF、基音周期、固定碼本增益、自適應碼本增益、能量以及其他參數(shù)?;ハ嚓P單元412,其將部分解碼單元411提取出的近端輸入信號和遠端輸出信號的兩組參數(shù)域特征參數(shù)分別作為近端向量和遠端(區(qū)間[固定延時,固定延時+動態(tài)延吋])向量,并將這兩組向量分別進行互相關運算,以得到一系列的互相關系數(shù),并記錄每組互相關系數(shù)所對應的時刻。子幀判斷単元413,其將上述一系列互相關系數(shù)中的最大值所對應的遠端區(qū)間中的時刻記錄為初始回聲延時,并判斷該時刻的遠端基音周期與近端基音周期是否均小于第一預設門限(即判斷遠近端基音周期的相似性),或者判斷該時刻的遠端能量與近端能量差是否小于第二預設門限,當判斷結果為是時,則子幀判斷単元413判斷出近端輸入信號的當前子幀為回聲子幀,否則為非回聲子幀。需要說明的是,上述部分解碼單元411、互相關單元412與子幀判斷単元413的計算和判斷均是基于遠端輸出信號和近端輸入信號的當前幀中的每ー個子幀來進行的?;芈暸袛鄥g元414,其在部分解碼單元411、互相關單元412與子幀判斷単元413均對當前幀的全部子幀進行了計算和判斷之后,根據(jù)當前幀中每一個子幀的判斷結果來進行綜合判決,以判斷出近端輸入信號的當前幀為回聲幀還是非回聲幀。在本實施例中,回聲判斷単元414的綜合判決首先需要判斷當前的近端輸入幀是否為靜默(插入)指示(Silence Insertion Descriptor, SID)巾貞,是則無論其是否包含了回聲子幀,均將當前的近端輸入幀判定為非回聲幀;若當前近端輸入幀不是SID幀時,則根據(jù)“少數(shù)服從多數(shù)”的原則,當該近端輸入幀中回聲子幀多于非回聲子幀時,將當前的近端輸入幀判定為回聲幀,反之,當該近端輸入幀中非回聲子幀多于回聲子幀時,將當前的近端輸入幀判定為非回聲幀。上述有關當前幀是否為SID幀的判定過程由下文中的近端輸入判斷単元415執(zhí)行,在此不贅述。作為本發(fā)明的一個實施例,如圖5所示,回聲檢測模塊41還包括了近端輸入判斷單元415、緩存單元416和能量累加單元417,其中近端輸入判斷単元415,對近端輸入信號進行單獨判斷,通過檢測近端輸入信號中當前幀的相關標志位是否指示當前幀為SID幀,從而判斷出近端輸入的當前幀是否為靜音幀。當判斷結果為不是靜音幀時,再通過近端輸入信號部分解碼得到的參數(shù)(例如計算信噪比、頻譜、能量等參數(shù))來綜合判斷當前幀是否為背景噪聲幀。緩存單元416,當近端輸入信號的當前幀為靜音幀或者背景噪聲幀時,則將其部分解碼后得到的LSF在緩存單元416中進行緩存。在本實施例中,緩存單元416對輸入的LSF進行循環(huán)緩存,即只保存距離當前時間最近的8幀LSF。能量累加単元417,其在當近端輸入信號的當前幀為靜音幀或者背景噪聲幀時,對近端輸入信號部分解碼后得到的當前幀能量進行長時平均累加計算。上述緩存單元416和能量累加単元417的輸出結果用于輸入到舒適噪聲插入模塊42,以便更加緩和、自然地對回聲幀進行替換,其具體實施方式
      將在下文進行說明,在此不贅述。本實施例中,在回聲檢測單元41對近端輸入信號是否為回聲進行了檢測之后,根據(jù)檢測的不同結果控制圖4中開關A閉合至Al處或者A2處,當檢測結果為近端輸入信號當前幀為回聲幀時,開關A閉合至Al處時,此時回聲檢測模塊41的輸出結果輸入舒適噪聲插入模塊42,以進ー步對回聲幀進行消除處理;當檢測結果為近端輸入信號當前幀為非回聲幀時,開關A閉合至A2處,此時回聲檢測模塊41的輸出結果輸入過渡模塊43中,并根據(jù)需要進行回聲至非回聲的過渡處理。對回聲幀進行消除,可以通過舒適噪聲插入方法或者回聲衰減方法來實現(xiàn),在此以舒適噪聲插入方法作為實施例進行說明。一般說來,在通話的過程中,大約有40%的時間屬于靜默時間,即約有40%的時間沒有傳輸語音信息,只傳輸了環(huán)境噪聲,因此這部分信號 大部分是無用的信號,如果把這部分信號用另外ー種更低比特率的編碼方式來編碼,則可以實現(xiàn)降低回聲控制開銷且節(jié)省帶寬的目的。目前,AMR、EFR等編碼方式都引入了該不連續(xù)發(fā)射機制。舒適噪聲插入模塊42正是基于上述原理,將回聲檢測模塊41中已確定為回聲的幀用靜音幀或者背景噪聲幀進行替換,再利用低比特率的SID編碼方式編碼后輸出。圖6示出了本發(fā)明實施例提供的參數(shù)域回聲控制裝置舒適噪聲插入模塊的具體結構圖,具體說明如下參照圖6,該舒適噪聲插入模塊42具體包括了 LSF生成單元421和LSF量化單元422,其中LSF生成單元421用于生成將替代回聲幀LSF部分的量化前的LSF。在具體的生成過程中,LSF生成単元421首先對緩存単元416中的當前緩存情況進行判斷,判斷該緩存中是否記錄滿了 8幀的LSF,是則從緩存單元416中隨機選取ー幀LSF,以此作為將要替代回聲幀LSF部分的量化前的LSF ;當該緩存中記錄的LSF數(shù)量小于8幀時,則將已記錄的每 ー幀LSF分別轉(zhuǎn)換為線譜對(Line Spectral Pair, LSP),全部累加后求取LSP均值,再將該LSP均值轉(zhuǎn)換為LSF,以作為替代回聲幀LSF部分的量化前的LSF。LSF量化単元422即根據(jù)不同的編碼類型,對LSF生成単元421輸出的LSF進行相應的量化處理,并替代近端輸入信號原始的LSF部分。通過上述處理方式,采用了低比特率的SID幀對回聲幀進行了替換,即降低了回聲控制的開銷,又節(jié)省了帶寬,同時,利用SID幀對回聲幀進行替換的時域優(yōu)化效果如圖7所示,由圖7可以看出,近端輸入信號為遠端輸出信號的回聲,而最終進行了幀替換的近端輸出信號的電平與近端實際背景噪聲的電平相匹配,由此達到了回聲消除的效果,相應地,進行了幀替換后的近端輸出信號的頻譜也具備與近端實際背景噪聲的頻譜相匹配的優(yōu)化效果。作為本發(fā)明的一個實施例,舒適噪聲插入模塊42還包括了 能量量化単元423,其根據(jù)不同的編碼類型,對能量累加単元417中能量的長時累加平均值進行相應的量化處理,以替代近端輸出信號的能量部分(對于EFR的編碼類型來說對應近端輸出信號的固定碼本增益部分),使得回聲替換后的幀能量變化緩慢,過渡自然,很好地提升了通話方的主觀體驗。在本實施例中,當回聲檢測模塊41判斷出近端輸入信號的當前幀為非回聲幀時,回聲檢測模塊41的輸出進入到過渡模塊43,在過渡模塊43中,對近端輸入信號當前幀的LSF的預測誤差進行了重新量化,從而在切換過程中將幀與幀之間的關系考慮充分,大大降低了例如AMR和EFR等編碼方式從回聲到非回聲過渡中出現(xiàn)異常的風險。該模塊為本發(fā)明的重點,其具體的結構圖如圖8所示,下面進行具體說明參照圖8,過渡模塊43包括LSF預測誤差計算單元431、碼本增益計算單元432和量化單元433,其中LSF預測誤差計算單元431,其首先將近端輸入信號前ー幀的LSF預測誤差與LSF預測誤差系數(shù)相乗,將相乘的結果與LSF均值進行相加運算,得到當前幀的LSF預測值。而后,將近端輸入信號部分解碼后得到的LSF與LSF預測值相減,得到當前幀的量化前的LSF預測誤差,并將該LSF預測誤差進行緩存以便在下ー幀LSF計算時使用。在本實施例中,上述LSF預測誤差系數(shù)以及LSF均值根據(jù)不同的信號編碼方式來確定,針對不同的編碼方式為相應的常數(shù)。
      在本發(fā)明實施例中,通過LSF預測誤差計算單元431,能夠在切換過程中將幀與幀之間的關系考慮充分,大大降低了例如AMR和EFR等編碼方式從回聲到非回聲過渡中出現(xiàn)異常的風險。需要說明的是,上述LSF計算方式不限于在AMR和EFR編碼方式中使用,對于其他編碼方式的參數(shù)域回聲控制中回聲與非回聲的切換同樣適用。碼本增益計算單元432,其對近端輸入信號部分解碼后得到的固定碼本增益和自適應碼本增益進行限制操作,為了避免回聲與非回聲切換時波形突變導致異?,F(xiàn)象的發(fā)生,當部分解碼后得到的固定碼本增益值或者自適應碼本增益值超過I時,將該固定碼本增益值或者自適應碼本增益值設定為1,以保證回聲到非回聲過渡時近端輸出信號解碼后的激勵不會突變。 量化単元433,其分別對LSF預測誤差計算單元431和碼本增益計算單元432輸出 的LSF和碼本增益進行重新量化,并分別替換該近端輸入信號幀原始的LSF、固定碼本增益和自適應碼本增益。圖9示出了采用上述處理方式對回聲與非回聲進行過渡的優(yōu)化效果圖,其中,上圖為未加入LSF過渡的信號處理前后的波形對比圖,可以看出在輸出的信號波形中出現(xiàn)了多處波形突變,而下圖為加入了 LSF過渡的信號處理前后波形對比圖,可以看出在過渡過程中對LSF的預測誤差進行了量化之后,波形突變的現(xiàn)象不再出現(xiàn),大大降低了波形異?,F(xiàn)象發(fā)生的風險。需要特別說明的是,在本實施例中,當需要進行過渡吋,過渡模塊43只對近端輸入信號中的LSF、固定碼本增益以及自適應碼本增益這三部分進行修改后重新量化輸出,對其他參數(shù)不作修改。作為本發(fā)明的一個實施例,參照圖8,過渡模塊43還包括了過渡選擇單元434、參數(shù)記錄單元435和狀態(tài)判斷單元436 過渡選擇單元434,決定當前輸入到過渡模塊43中的非回聲幀是否需要進行過渡。參數(shù)記錄單元435,當過渡選擇單元決定當前輸入到過渡模塊43中的非回聲幀不需要進行過渡,即近端輸入信號當前幀的上一幀也為非回聲幀時,參數(shù)記錄單元435記錄該非回聲幀進行部分解碼后的一些參數(shù)域特征參數(shù)(例如需要在LSP計算單元431中用到的LSF預測誤差),之后該非回聲幀通過直接透傳輸出,而不需要重新計算LSF、固定碼本增益以及自適應碼本増益,很好地降低了回聲控制的處理開銷。狀態(tài)判斷単元436,對量化単元433中輸出的近端輸入信號進行反量化后與原始近端輸入信號進行比較,判斷其中的LSF部分和碼本增益部分是否完全一致,是則將結果輸出給過渡選擇單元436,使過渡選擇單元436將過渡模塊43的內(nèi)部狀態(tài)選擇為不需要過渡的狀態(tài),否則保持過渡模塊43的現(xiàn)有狀態(tài)。同時,在本實施例中,當過渡模塊43的內(nèi)部狀態(tài)進入到不需要過渡的狀態(tài)期間,過渡選擇單元434會對回聲檢測模塊41的輸出結果進行判斷,一旦回聲檢測模塊41輸出了回聲幀,則過渡選擇單元434會再次另過渡模塊43進入到需要過渡的內(nèi)部狀態(tài),以便在下一非回聲幀到來時,能夠及時實現(xiàn)由回聲幀到非回聲幀的切換。由此,在本發(fā)明實施例中,當近端輸入信號長時間未出現(xiàn)回聲時,通過過渡選擇直接對非回聲幀進行透傳,不需要對近端輸入信號的每ー幀都計算LSF、固定碼本增益以及自適應碼本増益,而在需要對回聲與非回聲之間進行切換時,很好地實現(xiàn)了自然過渡,大大降低了出現(xiàn)異常的風險,提升了通話方的主觀體驗。最終,由舒適噪聲插入模塊42或者過渡模塊43中輸出的近端輸入信號輸入到比特打包模塊44中,比特打包模塊44根據(jù)不同的幀類型和幀速率等信息,將輸入的信號進行比特打包。由于比特打包是按照標準協(xié)議來進行,已有相對固定的流程,因此在此不再贅述。上述裝置實施例中,所包括的各個單元只是按照功能邏輯進行劃分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應的功能即可;另外,各功能単元的具體名稱也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護范圍。在本發(fā)明實施例中,以上說明的參數(shù)域回聲控制裝置可以與無線基站、基站控制器、核心網(wǎng)(Universal Media Gateway, UMG)以及其他網(wǎng)關類網(wǎng)元一同組成無線網(wǎng)絡的回聲控制系統(tǒng),也可以與公共交換電話網(wǎng)(Public Switched Telephone Network,PSTN)交換機等設備一同組成PSTN網(wǎng)的回聲控制系統(tǒng),且該裝置提供上行和下行的通信接ロ,通過上 述接ロ并行地提供上行和下行的參數(shù)域回聲控制功能。作為本發(fā)明的ー個具體實施示例,如圖10所示,參數(shù)域回聲控制裝置可以應用于A ロ互聯(lián)網(wǎng)協(xié)議(Internet Protocol, IP)或者異步傳輸模式(Asynchronous TransferMode, ATM)組網(wǎng)下的TrFO場景,且參數(shù)域回聲控制裝置可以部署在無線側,也可以部署在核心網(wǎng)側。在該組網(wǎng)場景下,主被叫兩個終端對應的編碼器類型相同,這樣就省去了進行編解碼轉(zhuǎn)換的必要,節(jié)省了設備成本、提升了語音質(zhì)量。作為本發(fā)明的另ー個具體實施示例,如圖11所示,參數(shù)域回聲控制裝置可以應用于A ロ時分復用(Time Division Multiplexing, TDM)組網(wǎng)下的TFO場景,且參數(shù)域回聲控制裝置可以部署在無線側,也可以部署在核心網(wǎng)側。在該組網(wǎng)場景下,主被叫兩個終端對應的編碼器類型也相同,同樣省去了進行編解碼轉(zhuǎn)換的必要,但仍然多基于PCM數(shù)據(jù)傳輸形式。在該組網(wǎng)場景下,對上行或下行網(wǎng)元中出現(xiàn)回聲進行控制,從而達到提升主觀感受的目的。圖12示出了本發(fā)明實施例提供的參數(shù)域回聲控制方法的實現(xiàn)流程,詳述如下在步驟S1201中,根據(jù)遠端輸出信號和近端輸入信號的參數(shù)域特征參數(shù),檢測近端輸入信號幀是否為回聲幀,所述參數(shù)域特征參數(shù)包括線譜頻率LSF、基音周期、固定碼本増益、自適應碼本增益和能量。由于本發(fā)明實施例是在參數(shù)域中進行回聲控制,只需要針對信號中的參數(shù)域特征參數(shù)進行修改來達到回聲控制的目的,因此首先從遠端輸出信號和輸入信號中提取出用來進行回聲控制的參數(shù)域特征參數(shù)。在步驟S1202中,當檢測出近端輸入信號幀為回聲幀時,將該近端輸入信號幀用靜音幀或者背景噪聲幀進行替換。由于靜音幀和背景噪聲幀均采用較低比特率的SID編碼方式進行傳輸,因此,在本發(fā)明實施例中,當出現(xiàn)回聲幀需要進行回聲消除時,通過將回聲幀替換為靜音幀或者背景噪聲幀,從而達到了降低處理開銷、節(jié)省帶寬的目的。在步驟S1203中,當檢測出近端輸入信號幀為非回聲幀時,對該近端輸入信號幀中的固定碼本增益、自適應碼本增益以及LSF預測誤差進行重新量化,以分別替換近端輸入信號幀原始的固定碼本增益、自適應碼本增益和LSF。在步驟S1204中,根據(jù)近端輸入信號幀的幀類型以及幀速率,對經(jīng)過修改的近端輸入信號進行比特打包輸出。在本發(fā)明實施例中,通過上述步驟,當在參數(shù)域進行回聲控制面臨回聲與非回聲之間的切換時,由于將當前控制輸入信號幀的LSF預測誤差進行重新量化,并作為近端輸出信號中的LSF輸出,從而在切換過程中考慮了當前幀LSF的量化與前ー幀LSF的預測誤差之間的聯(lián)系,避免了對當前幀進行獨立處理而導致的回聲與非回聲之間的硬切換,提升了回聲與非回聲之間的過渡效果。下面,對本發(fā)明實施例提供的參數(shù)域回聲控制方法的實現(xiàn)流程進行一一的具體說明。圖13示出了檢測近端輸入信號幀是否為回聲幀的具體流程,詳述如下
      在步驟S1301中,分別提取遠端輸出信號和近端輸入信號當前子幀的參數(shù)域特征參數(shù),以分別作為近端向量和遠端(區(qū)間[固定延時,固定延時+動態(tài)延時])向量。在步驟S1302中,將得到的遠端向量和近端向量進行互相關運算,得到多組互相關系數(shù),并記錄每組互相關系數(shù)所對應的時刻。在步驟S1303中,取值最大的互相關系數(shù)所對應的時刻即為初始回聲延時,因此,檢測該時刻的遠端基音周期和近端基音周期的相似性,或者通過檢測遠端能量和近端能量的差是否小于ー預設門限,從而判斷當前子幀是否為回聲子幀,是則近端輸入信號的當前子幀為回聲子幀,否則為非回聲子幀。上述步驟S1301至S1303均是對子幀進行處理,因此,在步驟S1304中,根據(jù)近端輸入信號幀中每個子幀的回聲檢測結果進行綜合判決,以判斷近端輸入信號幀是否為回聲幀。圖14示出了當近端輸入信號幀為回聲幀時,對回聲幀進行替換的具體實現(xiàn)流程在步驟S1401中,判斷近端輸入信號幀是否為靜音幀或者背景噪聲幀,是則緩存距離當前時刻最近的8幀近端輸入信號的靜音幀或者背景噪聲幀的LSF。在步驟S1402中,判斷緩存的LSF幀的數(shù)量是否達到了 8巾貞,當緩存的LSF達到8幀時,隨機選取其中ー幀LSF以生成量化前的LSF,當緩存的LSF數(shù)量小于8幀時,將緩存的每ー幀LSF分別轉(zhuǎn)換成LSP后進行全部累加求取LSP均值,再將LSP均值轉(zhuǎn)換成LSF,以生成量化前的LSF。在步驟S1403中,將生成的量化前的LSF進行量化后替代近端輸入信號幀的原始LSF。同時,在本實施例中,當近端輸入信號幀為靜音幀或者背景噪聲幀時,將近端輸入信號的靜音幀或者背景噪聲幀的能量進行長時平均累加,生成能量長時累加均值,再通過將該能量長時累加均值進行量化后以替代近端輸入信號幀的原始能量,以使得回聲替換后的幀能量變化緩慢且過渡自然。圖15示出了當近端輸入信號幀為非回聲幀時,回聲控制方法的具體實現(xiàn)流程在步驟S1501中,判斷非回聲的近端輸入信號幀的固定碼本增益或者自適應碼本増益的值是否超過I,是則將其取值限制為I。通過上述限制操作,能夠保證回聲到非回聲過渡時近端輸出信號解碼后的激勵不會產(chǎn)生突變。在步驟S1502中,將前ー近端輸入信號幀的LSF預測誤差與LSF預測誤差系數(shù)相乘后再與LSF均值相加,得到當前近端輸入信號幀的LSF預測值后,將近端輸入信號幀的LSF與所述LSF預測值相減,得到當前近端輸入信號幀的量化前的LSF預測誤差,其中,LSF預測誤差系數(shù)和LSF均值均由近端輸入信號幀的編碼方式?jīng)Q定。在步驟S1503中,將上述步驟中得到的碼本增益和LSF預測誤差進行重新量化。
      同時,在結束了上述步驟之后,如圖15所示,將重新量化的近端輸入信號與原始近端輸入信號進行比較,判斷兩者的LSF和碼本增益是否完全一致,是則返回相應狀態(tài),不對近端輸入信號幀進行過渡,當不對近端輸入信號幀進行過渡時,則不執(zhí)行上述步驟S1501至S1503,而是在記錄近端輸入信號幀的LSF預測誤差后,直接對近端輸入信號進行輸出,由此,當長時間沒有回聲產(chǎn)生時,通過直接透傳避免了毎次均對碼本増益等參數(shù)進行量化,從而大大減小了回聲控制的開銷。本發(fā)明實施例在對通話回聲在參數(shù)域進行控制的過程中,當面臨回聲與非回聲之間的切換時,通過對當前幀的固定碼本增益和自適應碼本增益進行重新量化來完成回聲與非回聲之間的切換,同時通過對當前幀的LSF的預測誤差進行重新量化,并替代近端輸出信號中的原始LSF輸出,從而在切換過程中考慮了幀與幀之間的聯(lián)系,避免了對當前幀進行獨立處理而導致的回聲與非回聲之間的硬切換,提升了回聲與非回聲之間的過渡效果。本領域技術人員可以理解,本發(fā)明實施例提供的參數(shù)域的回聲控制方法中,其全部或部分步驟是可以通過程序指令相關的硬件來完成。比如可以通過計算機運行程序來完成。該程序可以存儲在可讀取存儲介質(zhì),例如,隨機存儲器、磁盤、光盤等。
      權利要求
      1.一種參數(shù)域的回聲控制裝置,其特征在于,包括 回聲檢測模塊,用于通過參數(shù)域解碼,分別提取遠端輸出信號和近端輸入信號的參數(shù)域特征參數(shù),并根據(jù)所述參數(shù)域特征參數(shù)檢測近端輸入信號幀是否為回聲幀,所述參數(shù)域特征參數(shù)包括線譜頻率LSF、固定碼本增益以及自適應碼本增益; 過渡模塊,用于當所述回聲檢測模塊檢測出近端輸入信號幀為非回聲幀時,對該近端輸入信號幀中的固定碼本增益、自適應碼本增益以及LSF預測誤差進行重新量化,并分別替換該近端輸入信號幀原始的固定碼本增益、自適應碼本增益和LSF。
      2.根據(jù)權利要求I所述的裝置,其特征在于,所述參數(shù)域特征參數(shù)還包括基音周期以及能量,且所述回聲檢測模塊包括 部分解碼單元,用于分別提取遠端輸出信號和近端輸入信號當前子幀的所述參數(shù)域特征參數(shù),以分別構成遠端向量和近端向量; 互相關單元,用于將所述遠端向量與所述近端向量進行互相關運算,得到多組互相關系數(shù),并記錄每組互相關系數(shù)所對應的時刻; 子幀判斷單元,用于通過檢測取值最大的互相關系數(shù)所對應的時刻的遠端基音周期和近端基單周期的相似性,或者通過檢測遠端能量和近端能量的差是否小于一預設門限,來判斷當前子幀是否為回聲子幀; 回聲判斷單元,用于根據(jù)近端輸入信號幀中每個子幀的回聲檢測結果,判斷該近端輸入信號幀是否為回聲幀。
      3.根據(jù)權利要求I所述的裝置,其特征在于,所述過渡模塊包括 LSF預測誤差計算單元,用于通過將前一近端輸入信號幀的LSF預測誤差與LSF預測誤差系數(shù)相乘后再與LSF均值相加,得到當前近端輸入信號幀的LSF預測值;再通過將所述回聲檢測模塊輸出的LSF與所述LSF預測值相減,得到當前近端輸入信號幀的量化前的LSF預測誤差,所述LSF預測誤差系數(shù)和所述LSF均值均為常數(shù),且根據(jù)近端輸入信號幀的編碼方式來確定; 碼本增益計算單元,用于將近端輸入信號幀中值大于I的固定碼本增益或者自適應碼本增益取值限制為I ; 量化單元,用于將所述LSF預測誤差計算單元獲取的LSF預測誤差以及所述碼本增益計算單元輸出的固定碼本增益和自適應碼本增益進行量化,并分別替換該近端輸入信號幀原始的LSF、固定碼本增益和自適應碼本增益。
      4.根據(jù)權利要求3所述的裝置,其特征在于,所述過渡模塊還包括 過渡選擇單元,用于決定所述過渡模塊是否對近端輸入信號幀進行過渡; 參數(shù)記錄單元,用于在所述過渡模塊不對近端輸入信號幀進行過渡時,記錄近端輸入信號幀的LSF預測誤差; 狀態(tài)判斷單元,用于通過將所述量化單元輸出的近端輸入信號與所述回聲檢測模塊輸出的近端輸入信號進行比較,當其中的LSF、固定碼本增益和自適應碼本增益均完全一致時,令所述過渡選擇單元選擇不對近端輸入信號幀進行過渡,否則,保持所述過渡選擇單元的當前狀態(tài)。
      5.根據(jù)權利要求I所述的裝置,其特征在于,所述裝置還包括 舒適噪聲插入模塊,用于當所述回聲檢測模塊檢測出近端輸入信號幀為回聲幀時,將該近端輸入信號幀用靜音幀或者背景噪聲幀進行替換后,以靜默插入指示SID編碼方式進行編碼。
      6.根據(jù)權利要求5所述的裝置,其特征在于,所述回聲檢測模塊包括 近端輸入判斷單元,用于判斷近端輸入信號幀是否為靜音幀或者背景噪聲幀; 緩存單元,用于將近端輸入信號的靜音幀或者背景噪聲幀的LSF進行緩存,所述緩存單元緩存距離當前時刻最近的8幀LSF ; 所述舒適噪聲插入模塊包括 LSF生成單元,用于根據(jù)所述緩存單元中緩存的LSF,生成量化前的LSF ; LSF量化單元,用于將所述LSF生成單元生成的LSF進行量化,并替代近端輸入信號幀原始的LSF。
      7.根據(jù)權利要求6所述的裝置,其特征在于,當所述緩存單元緩存了8幀的LSF時,所述LSF生成單元從所述緩存單元中隨機選取一巾貞LSF以生成量化前的LSF ; 當所述緩存單元緩存的LSF數(shù)量小于8巾貞時,所述LSF生成單元通過將所述緩存單元中緩存的每一幀LSF分別轉(zhuǎn)換成線譜對LSP,將轉(zhuǎn)換成的LSP全部累加后求取LSP均值,再將LSP均值轉(zhuǎn)換成LSF,以生成量化前的LSF。
      8.根據(jù)權利要求5所述的裝置,其特征在于,所述參數(shù)域特征參數(shù)還包括能量,且所述回聲檢測模塊包括 能量累加單元,用于將近端輸入信號的靜音幀或者背景噪聲幀的能量進行長時平均累力口,生成能量長時累加均值; 所述舒適噪聲插入模塊包括 能量量化單元,用于將所述能量長時累加均值進行量化后替代近端輸入信號幀的原始倉tfi。
      9.根據(jù)權利要求I或5所述的裝置,其特征在于,所述裝置還包括 比特打包模塊,用于根據(jù)近端輸入信號幀的幀類型以及幀速率,對所述過渡模塊或者所述舒適噪聲插入模塊輸出的近端輸入信號進行比特打包后,作為近端輸出信號輸出。
      10.一種參數(shù)域的回聲控制方法,其特征在于,所述方法包括下述步驟 根據(jù)遠端輸出信號和近端輸入信號的參數(shù)域特征參數(shù),檢測近端輸入信號幀是否為回聲幀,所述參數(shù)域特征參數(shù)包括LSF、固定碼本增益以及自適應碼本增益; 當檢測出近端輸入信號幀為非回聲幀時,對該近端輸入信號幀中的固定碼本增益、自適應碼本增益以及LSF預測誤差進行重新量化,以分別替換該近端輸入信號幀原始的固定碼本增益、自適應碼本增益和LSF。
      11.根據(jù)權利要求10所述的方法,其特征在于,所述根據(jù)遠端輸出信號和近端輸入信號的參數(shù)域特征參數(shù),檢測近端輸入信號幀是否為回聲幀的步驟具體為 分別提取遠端輸出信號和近端輸入信號當前子幀的所述參數(shù)域特征參數(shù),以分別構成遠端向量和近端向量,所述參數(shù)域特征參數(shù)還包括基音周期和能量; 將所述遠端向量和所述近端向量進行互相關運算,得到多組互相關系數(shù),并記錄每組互相關系數(shù)所對應的時刻; 通過檢測取值最大的互相關系數(shù)所對應的時刻的遠端基音周期和近端基單周期的相似性,或者通過檢測遠端能量和近端能量的差是否小于一預設門限,來判斷當前子幀是否為回聲子幀; 根據(jù)近端輸入信號幀中每個子幀的回聲檢測結果,判斷該近端輸入信號幀是否為回聲幀。
      12.根據(jù)權利要求10所述的方法,其特征在于,所述對近端輸入信號幀中的固定碼本增益和自適應碼本增益進行重新量化的步驟具體為 將近端輸入信號幀中值大于I的固定碼本增益或者自適應碼本增益取值限制為I ; 將經(jīng)過了限制處理的固定碼本增益和自適應碼本增益進行量化。
      13.根據(jù)權利要求10所述的方法,其特征在于,所述對近端輸入信號幀中的LSF預測誤差進行重新量化的步驟具體為 將前一近端輸入信號幀的LSF預測誤差與LSF預測誤差系數(shù)相乘后再與LSF均值相力口,得到當前近端輸入信號幀的LSF預測值,所述LSF預測誤差系數(shù)和所述LSF均值均為常數(shù),且根據(jù)近端輸入信號幀的編碼方式來確定; 將近端輸入信號幀的LSF與所述LSF預測值相減,得到當前近端輸入信號幀的量化前的LSF預測誤差; 將所述LSF預測誤差進行量化。
      14.根據(jù)權利要求13所述的方法,其特征在于,當近端輸入信號幀為非回聲幀時,所述方法還包括下述步驟 將重新量化的近端輸入信號與原始近端輸入信號進行比較,判斷兩者的LSF、固定碼本增益以及自適應碼本增益是否完全一致,是則選擇不對下一近端輸入信號幀進行過渡,否則持續(xù)對近端輸入信號幀進行過渡; 當不對近端輸入信號幀進行過渡時,記錄近端輸入信號幀的LSF預測誤差。
      15.根據(jù)權利要求10所述的方法,其特征在于,當檢測出近端輸入信號幀為回聲幀時,所述方法還包括下述步驟 將該近端輸入信號幀用靜音幀或者背景噪聲幀進行替換后,以SID編碼方式進行編碼。
      16.根據(jù)權利要求15所述的方法,其特征在于,所述將該近端輸入信號幀用靜音幀或者背景噪聲幀進行替換的步驟具體為 判斷近端輸入信號幀是否為靜音幀或者背景噪聲幀,是則緩存距離當前時刻最近的8幀近端輸入信號的靜音幀或者背景噪聲幀的LSF ; 根據(jù)緩存的LSF生成量化前的LSF ; 將生成的量化前的LSF進行量化后替代近端輸入信號幀的原始LSF。
      17.如權利要求16所述的方法,其特征在于,所述根據(jù)緩存的LSF生成量化前的LSF的步驟具體為 當緩存的LSF達到8幀時,隨機選取其中一幀LSF以生成量化前的LSF ; 當緩存的LSF數(shù)量小于8幀時,將緩存的每一幀LSF分別轉(zhuǎn)換成LSP后進行全部累加求取LSP均值,再將LSP均值轉(zhuǎn)換成LSF,以生成量化前的LSF。
      18.根據(jù)權利要求15所述的方法,其特征在于,所述方法還包括下述步驟 將近端輸入信號的靜音幀或者背景噪聲幀的能量進行長時平均累加,生成能量長時累加均值;將所述能量長時累加均值進行量化后替代近端輸入信號幀的原始能量。
      19.根據(jù)權利要求10或者15所述的方法,其特征在于,所述方法還包括下述步驟根據(jù)近端輸入信號幀的幀類型以及幀速率,對經(jīng)過修改的近端輸入信號進行比特打包輸出。
      全文摘要
      本發(fā)明涉及通話語音信號處理領域,尤其涉及一種參數(shù)域回聲控制裝置和方法,所述裝置包括回聲檢測模塊,用于通過參數(shù)域解碼,分別提取遠端輸出信號和近端輸入信號的參數(shù)域特征參數(shù),并根據(jù)所述參數(shù)域特征參數(shù)檢測近端輸入信號幀是否為回聲幀;過渡模塊,用于當所述回聲檢測模塊檢測出近端輸入信號幀為非回聲幀時,對該近端輸入信號幀中的固定碼本增益、自適應碼本增益以及LSF預測誤差進行重新量化,并分別替換該近端輸入信號幀原始的固定碼本增益、自適應碼本增益和LSF。本發(fā)明避免了信號的突變,實現(xiàn)了回聲與非回聲之間進行切換時的平滑過渡。
      文檔編號G10L19/00GK102726034SQ201180003907
      公開日2012年10月10日 申請日期2011年7月25日 優(yōu)先權日2011年7月25日
      發(fā)明者李 杰, 李玉龍, 梁俊斌, 覃景繁 申請人:華為技術有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1