国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語音幀等級的獲取方法及裝置的制作方法

      文檔序號:2823758閱讀:145來源:國知局
      專利名稱:語音幀等級的獲取方法及裝置的制作方法
      技術領域
      本發(fā)明實施例涉及通信技術,尤其涉及一種語音幀等級的獲取方法及裝置。
      背景技術
      在語音通信系統(tǒng)中,利用語音活動檢測(Voice Activity Detector,簡稱VAD)算法,可以將語音信號分為語音幀和靜音幀。其中,接收端的解碼語音質量主要取決于語音幀。由于無線信道和網絡傳輸的不穩(wěn)定性,語音幀的丟幀現象時有發(fā)生。發(fā)明人發(fā)現現有技術中至少存在如下問題現有技術無法獲取語音幀的等級,從而可能使得在后續(xù)不能對語音幀進行有效的處理。

      發(fā)明內容
      本發(fā)明實施例提供一種語音幀等級的獲取方法及裝置,可以獲取語音幀的等級。本發(fā)明實施例提供了一種語音幀等級的獲取方法,包括對語音幀的編碼參數進行解碼,生成第一解碼語音信號和第二解碼語音信號,所述第一解碼語音信號為未丟幀情況下的解碼語音信號,所述第二解碼語音信號為丟幀情況下的解碼語音信號;提取所述第一解碼語音信號的第一特征參數,并提取所述第二解碼語音信號的第二特征參數;根據所述第一特征參數和所述第二特征參數,獲取所述語音幀的特征參數矢量;其中,所述特征參數矢量包括第一特征參數,或者所述特征參數矢量包括第一特征參數和第二特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值和第一特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值和第二特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值、第一特征參數和第二特征參數;根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和所述特征參數矢量,獲取與所述特征參數矢量對應的語音幀細分等級。本發(fā)明實施例還提供了一種語音幀等級的獲取裝置,包括參數解碼模塊,用于對語音幀的編碼參數進行解碼,生成第一解碼語音信號和第二解碼語音信號,所述第一解碼語音信號為未丟幀情況下的解碼語音信號,所述第二解碼語音信號為丟幀情況下的解碼語音信號;參數提取模塊,用于提取所述第一解碼語音信號的第一特征參數,并提取所述第二解碼語音信號的第二特征參數;矢量獲取模塊,用于根據所述第一特征參數和所述第二特征參數,獲取所述語音幀的特征參數矢量;其中,所述特征參數矢量包括第一特征參數,或者所述特征參數矢量包括第一特征參數和第二特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值和第一特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值和第二特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值、第一特征參數和第二特征參數;等級獲取模塊,用于根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和所述特征參數矢量,獲取與所述特征參數矢量對應的語音幀細分等級。由上述技術方案可知,本發(fā)明實施例根據語音幀的編碼參數,解碼生成丟幀情況下和未丟幀情況下的兩組解碼語音信號,基于上述兩組解碼語音信號進行特征參數的提取,根據上述特征參數矢量、預設準則和為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型,獲取與上述兩組解碼語音信號的特征參數的特征參數矢量對應的語音幀細分等級,也就可以得到語音幀的等級。進一步地,在得到語音幀的等級后,可以對上述語音幀采取相應的保護策略,進一步能夠實現對語音幀進行有效保護,從而可以有效保護語音信號中的重要信息,能夠有效減少語音幀的丟幀現象的發(fā)生,提高接收端的解碼語音質量。


      為了更清楚地說明本發(fā)明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1為本發(fā)明一實施例提供的語音幀等級的獲取方法的流程示意圖;圖2為本發(fā)明另一實施例提供的語音幀等級的獲取方法的流程示意圖;圖3為本發(fā)明一實施例提供的語音幀等級的獲取裝置的結構示意圖;圖4為本發(fā)明另一實施例提供的語音幀等級的獲取裝置的結構示意圖。
      具體實施例方式為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。圖1為本發(fā)明一實施例提供的語音幀等級的獲取方法的流程示意圖,如圖1所示, 本實施例的語音幀等級的獲取方法可以包括以下步驟步驟101、對語音幀的編碼參數進行解碼,生成第一解碼語音信號和第二解碼語音信號;其中,上述語音幀的編碼參數是指對語音幀進行編碼后得到的編碼語音信號,也可以稱為語音幀的編碼參數,上述第一解碼語音信號為未丟幀情況下的解碼語音信號,上述第二解碼語音信號為丟幀情況下的解碼語音信號;
      步驟102、提取上述第一解碼語音信號的第一特征參數,并提取上述第二解碼語音信號的第二特征參數;其中,上述第一特征參數或上述第二特征參數可以包括幀能量、線性預測倒譜系數、美爾(Mel)頻標倒譜系數、巴克(Bark)域感知響度中的至少一項。步驟103、根據上述第一特征參數和上述第二特征參數,獲取上述語音幀的特征參
      數矢量;可以理解的是上述特征參數矢量可以包括第一特征參數,或者還可以包括第一特征參數和第二特征參數,或者也可以包括上述第二特征參數與上述第一特征參數的參數差值,或者還可以包括上述第二特征參數與上述第一特征參數的參數差值和第一特征參數,或者也可以包括上述第二特征參數與上述第一特征參數的參數差值和第二特征參數, 或者又可以包括上述第二特征參數與上述第一特征參數的參數差值、第一特征參數和第二特征參數;例如第一特征參數為[xl,yl,zl],第二特征參數為[x2,y2,z2],則對應的特征參數矢量可以為[xl,yl, zl, x2, y2,z2],也可以為[xl_x2,yl_y2,zl_z2],還可以為 [xl-x2, yl-y2, zl_z2,xl, yl, zl],也可以為[xl_x2,yl-y2, zl_z2,x2, y2, z2],又可以為 [xl~x2, yl-y2, zl_z2, xl, yl, zl, x2, y2, z2]。本步驟中的參數差值可以為第二特征參數減去第一特征參數的差值及其差值變換,還可以為第一特征參數減去第二特征參數的差值及其變換,本發(fā)明實施例不做限制。如上所述,第一特征參數或上述第二特征參數可以包括幀能量、線性預測倒譜系數、美爾(Mel)頻標倒譜系數、巴克(Bark)域感知響度中的至少一項,也就是說,第一特征參數或者第二特征參數中可以包括以上幾個分量。相應地,參數差值可以包括幀能量差異、 線性預測倒譜距離、Mel頻標倒譜距離、Bark域感知失真中的至少一項,也就是說,參數差值中可以包括以上幾個分量??梢岳斫獾氖?,當獲取特征參數矢量時,第一特征參數和第二特征參數中包括相同的分量。步驟104、根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和上述特征參數矢量,獲取與上述特征參數矢量對應的語音幀細分等級。本步驟中的數學模型可以包括高斯混合模型(Gaussian Mixture Model,簡稱 GMM)、貝葉斯模型、人工神經網絡等。上述數學模型可以通過多種方式建立,例如可以根據預先指定一定數量的語音幀的解碼語音信號平均意見評分(Mean Opinion kore,簡稱 M0S)分值的下降值,將上述一定數量的語音幀分為N。個語音幀細分等級,每個語音幀細分等級中語音幀的個數相同或相近,從而可以為每個語音幀細分等級上的語音幀的特征參數矢量分別建立的數學模型。根據預設準則,匹配出與獲取的上述特征參數矢量對應的數學模型,從而獲取上述數學模型對應的語音幀細分等級。而此處的,預設準則是指在具體確定語音幀更符合哪個數學模型時采用的判斷準則,例如該準則可以為最大似然估計準則。需要說明的是可以認為語音幀細分等級的取值越大,語音幀的等級也就越高,例如語音幀細分等級的取值為1即等級1表示語音幀具有最低的等級;當然,也可以是語音幀細分等級的取值越小,語音幀的等級也就越高,本實施例對此不做限定,只要能通過不同的語音幀細分等級的取值反映出語音幀的等級高低即可。進一步可以認為語音幀的等級越高,語音幀的重要程度也就越高,例如等級1表示語音幀具有最低的重要程度;當然,也可以是等級越低,重要程度也就越高,本實施例對此不做限定,只要能通過不同的等級反映出語音幀的重要程度即可?;蛘?,也可以通過預設的細分等級閾值(該閾值可以為多個),根據語音幀的細分等級,將語音幀劃分為不同的重要程度。例如,假設通過兩個細分等級閾值,第一細分等級閾值,第二細分等級閾值將語音幀為重要,次重要,不重要三個重要程度。 那么通過比較獲取的語音幀的細分等級與細分等級閾值的關系可以知道該語音幀的重要程度。進一步地,本發(fā)明實施例可以根據獲取的語音幀細分等級,有效地對系統(tǒng)中的語音幀采取相應的保護策略,即可以根據獲取的語音幀細分等級,對語音幀進行相應的發(fā)送或轉發(fā)處理。例如對于重要程度高的語音幀,可以采用較大的功率進行發(fā)送,以提高其抗信道噪聲干擾能力,對于重要程度低的語音幀,可以采用較小的功率發(fā)送,可以使得在保持平均發(fā)送功率不變的前提下,能耗資源實現最優(yōu)分配,從而可以有效地提高接收端的解碼語音質量;當存在多余的帶寬資源時,對于重要程度高的語音幀,可發(fā)送兩次或多次,對于重要程度低的語音幀,可以只發(fā)送一次,通過冗余方式保證重要程度高的語音幀的信息不被丟失,從而可以有效地提高接收端的解碼語音質量。本實施例中,根據語音幀的編碼參數,解碼生成丟幀情況下和未丟幀情況下的兩組解碼語音信號,基于上述兩組解碼語音信號進行特征參數的提取,根據上述特征參數矢量、預設準則和為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型,獲取與上述兩組解碼語音信號的特征參數的特征參數矢量對應的語音幀細分等級,也就可以得到了語音幀的等級,那么也就知道了語音幀的重要程度。進一步地,可以對上述語音幀采取相應的保護策略,進一步能夠實現對語音幀進行有效保護,從而可以有效保護語音信號中的重要信息,能夠有效減少語音幀的丟幀現象的發(fā)生,提高接收端的解碼語音質量。圖2為本發(fā)明另一實施例提供的語音幀等級的獲取方法的流程示意圖,如圖2所示,本實施例的語音幀等級的獲取方法可以包括以下步驟步驟201、對語音幀的編碼參數進行解碼,生成未丟幀情況下的解碼語音信號即正常解碼語音信號和丟幀情況下的解碼語音信號即丟幀補償解碼語音信號;本步驟中,可以基于當前語音幀的編碼參數,利用修正的語音解碼器,分別生成丟幀情況下和未丟幀情況下的兩組解碼語音信號。具體地,本步驟可以由一個正常的語音解碼器即主體語音解碼器來完成,該主體語音解碼器處于正確解碼第n-1幀,等待第η幀語音幀的編碼參數輸入的狀態(tài)??梢约僭O輸入的第η幀語音幀的編碼參數為Cn(i),其中,i = l,...,m??梢酝ㄟ^如下方式生成丟幀情況下的解碼語音信號可以利用上述主體語音解碼器的內置的丟幀錯誤隱藏方法,生成第η幀語音幀丟失情況下的替代語音幀的編碼參數6η ( ),其中,i = 1,. . .,1。建立一個臨時的簡單語音解碼器,拷貝上述主體語音解碼器的狀態(tài)到上述簡單語音解碼器,也就是說可以將該簡單語音解碼器與上述主體語音解碼器看做是一模一樣的兩個語音解碼器??梢岳玫讦菐Z音幀的丟幀替代的編碼參數6 η ( )為上述簡單語音解碼器的輸入,進行語音解碼,生成對應于第η幀語音幀的丟幀補償解碼語音信號,可以記為sn,。。n。(i),其中,i = 1,. . .,N??梢酝ㄟ^如下方式生成未丟幀情況下的解碼語音信號
      可以利用第η幀語音幀的編碼參數cn(i)為上述主體語音解碼器的輸入,進行語音解碼,生成對應于第η幀語音幀的正常解碼語音信號,可以記為sn,。H(i),其中,i = 1,. . .,N。解碼期間,上述主體語音解碼器的狀態(tài)能夠得到正常更新??蛇x地,本實施例中,若對語音幀的語音編碼方案的幀長較短,例如10ms左右, 上述步驟101或者201中,可以進一步采用重復拓展方法或者延遲拓展方法,基于當前語音幀的編碼參數和當前語音幀的下一語音幀的編碼參數,利用修正的語音解碼器,分別生成丟幀情況下和未丟幀情況下的兩組解碼語音信號。從而可以獲得較多的解碼語音信號的樣點,以保證后續(xù)步驟中所提取的特征參數更加準確有效。步驟202、提取上述正常解碼語音信號的特征參數(可以稱為正常特征參數),并提取上述丟幀補償解碼語音信號的特征參數(可以稱為丟幀補償特征參數);其中,上述正常特征參數或上述丟幀補償特征參數可以包括幀能量、線性預測倒譜系數、Mel頻標倒譜系數、Bark域感知響度中的至少一項。也是說,特征參數可以是一個數組的形式(可以將這個數組看做一個矢量)。其中,幀能量、線性預測倒譜系數與Mel頻標倒譜系數的提取方法可以參考現有技術中的方法,此處不再贅述。上述Bark域也稱為臨界頻帶群,是一種頻域的心理聲學概念,反映了人耳的頻率選擇特性?;贐ark域的感知響度可以很好的描述人耳對語音信號的實際感應。Bark域感知響度的提取方法可以包括以下步驟對于輸入的語音信號,首先可以通過離散傅里葉變換,獲得語音信號的頻域表示,計算語音信號的功率譜,然后進行頻域到Bark域的映射,獲得各臨界帶內的音高功率譜密度,在此基礎上可以根據Zwicker公式獲得各臨界頻帶內的感知響度。步驟203、根據上述正常特征參數和上述丟幀補償特征參數,獲取上述語音幀的特征參數矢量;可以理解的是上述特征參數矢量可以包括正常特征參數,或者還可以包括正常特征參數和丟幀補償特征參數,或者也可以包括上述丟幀補償特征參數與上述正常特征參數的參數差值,或者還可以包括上述丟幀補償特征參數與上述正常特征參數的參數差值和正常特征參數,或者也可以包括上述丟幀補償特征參數與上述正常特征參數的參數差值和丟幀補償特征參數,或者又可以包括上述丟幀補償特征參數與上述正常特征參數的參數差值、正常特征參數和丟幀補償特征參數;如上所述,上述正常特征參數和上述丟幀補償特征參數可以包括幀能量、線性預測倒譜系數、美爾(Mel)頻標倒譜系數、巴克(Bark)域感知響度中的至少一項,也就是說, 上述正常特征參數和上述丟幀補償特征參數中可以包括以上幾個分量。相應地,參數差值可以包括幀能量差異、線性預測倒譜距離、Mel頻標倒譜距離、Bark域感知失真中的至少一項,也就是說,參數差值中可以包括以上幾個分量。可以理解的是,當獲取特征參數矢量時, 上述正常特征參數和上述丟幀補償特征參數中包括相同的分量。其中,幀能量差異、線性預測倒譜距離、Mel頻標倒譜距離的獲取方法可以參考現有技術中的方法,此處不再贅述。而Bark域感知失真可以通過以下方式獲取根據上述步驟202提取出的當前幀對應的正確解碼語音信號的各臨界頻帶內的感知響度和丟幀補償解碼語音信號的各臨界頻帶內的感知響度之后,可進一步計算這兩組信號在各臨界帶內的感知響度差,并通過對各臨界帶內的感知響度差進行非線性加權平均,獲得兩組語音信號總體的感知失真。需要說明的是上述特征參數還可以根據具體情況,包括其他能夠體現輸入語音幀的重要性的特征參數,相應地,其對應的特征參數矢量還可以包括其他能夠體現輸入語音幀的重要性的特征參數的參數差值,例如基頻FO和FO差異、過零率和過零率變化等。步驟204、利用線性鑒別分析技術或主成分分析技術,對上述特征參數矢量進行處理;若上述步驟203獲取的特征參數矢量的分量較多、且某些分量間具有較大相關性,則本步驟中可以采用線性鑒別分析技術或主成分分析技術對上述特征參數矢量進行處理,以達到有效提取最能反映不同等級之間差異的特征、去除特征分量間相關性、降低維數的目的,具體方法可以參考《多元統(tǒng)計分析》(作者王靜龍,出版社科學出版社)中第八章第3節(jié)的相關內容、以及《現代模式識別(第2版)》(作者孫即祥,出版社高等教育出版社)中第三章的相關內容,此處不再贅述。步驟205、根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和經過處理的上述特征參數矢量,獲取與經過處理的上述特征參數矢量對應的語音幀細分等級;本步驟可以利用一個分類器(例如細分分類器)來實現,該分類器的設計原則是根據其解碼語音信號平均意見評分(Mean Opinion kore,簡稱M0S)分值的下降值,將所有用于訓練該分類器的語音幀分在N。個語音幀細分等級中,每一個語音幀細分等級中語音幀的個數可以根據需要設置,例如可以是每一個語音幀細分等級中語音幀的個數相同或相近,也可以是不同等級中的語音幀的個數直接滿足一定的比例等等,本實施例對此不做限定。一般,為了能夠達到較好的訓練效果用于訓練該分類的語音幀的個數越多越好。而 Nc的取值可以根據實際需要設置,例如可以是10 20之間的任意整數。具體地,可以認為語音幀細分等級的取值越大,語音幀的等級也就越高,例如語音幀細分等級的取值為1即等級1表示語音幀具有最低的等級,語音幀細分等級N。表示語音幀具有最高的等級;當然, 也可以是語音幀細分等級的取值越小,語音幀的等級也就越高,本實施例對此不做限定,只要能通過不同的語音幀細分等級的取值反映出語音幀的等級高低即可。進一步可以認為語音幀的等級越高,語音幀的重要程度也就越高,例如等級1表示語音幀具有最低的重要程度,等級N。表示語音幀具有最高的重要程度;當然,也可以是等級越低,重要程度也就越高, 本實施例對此不做限定,只要能通過不同的等級反映出語音幀的重要程度即可。具體地,上述分類器中可以為每一個語音幀細分等級上的語音幀的特征參數矢量建立一個對應的一個高斯混合模型(Gaussian Mixture Model,簡稱GMM)。其中,高斯混合模型可以采用最大似然方法進行訓練,采用K均值法初始化模型,然后用Bauman-Welch算法進行迭代,直至收斂。需要說明的是本步驟中,對建立高斯混合模型的上述特征參數矢量也需要利用線性鑒別分析技術或主成分分析技術,以使建立的高斯混合模型適用于上述步驟204經過處理之后的特征參數矢量。利用建立的上述高斯混合模型,獲取與上述特征參數矢量對應的語音幀細分等級的規(guī)則如下假設待分等級的語音幀對應的特征參數矢量為X,首先,計算該特征參數矢量在各高斯混合模型中的似然函數P(x| Xi),其中,i = 1,...,C,其中c為高斯混合模型個數,然后,選擇似然函數的值最大的高斯混合模型對應的語音幀細分等級作為待分級語音幀的等級,也就是說,此處的預設準則為最大似然(maximum likelihood,簡稱ML)估計準則。當然,也可以采取其他的預設準則,例如最大后驗(maximum a posteriori,簡稱MAP) 估計準則等。當采用其他準則時,得到語音幀的細分等級的方式與上述方法類似,此處不再贅述??蛇x地,本步驟中的上述分類器建立的模型還可以采用貝葉斯模型、人工神經網絡等。至此,已經獲取了語音幀細分等級,也就是說獲取到語音幀的等級為N。中的一個, 如圖1所示實施例中的描述,根據語音幀的細分等級可以對語音幀采取相應的保護策略。 然而,在實際應用中,為了將上述語音幀細分等級進一步合并成更少的語音幀目標等級,本實施例的語音幀等級獲取方法還可以包括以下步驟。步驟206、根據每個語音幀目標等級對應的語音幀個數的比例值和每個語音幀細分等級對應的語音幀個數,獲取與上述語音幀細分等級對應的語音幀目標等級。本步驟也可以利用一個分類器(例如閾值分類器)來實現,該分類器的訓練階段,確定上述步驟205中分類器中的模型參數后,將所有訓練用的的語音幀輸入上述步驟 205中的分類器,根據每個細分等級中語音幀的個數可以獲得分類器在訓練集上各語音幀細分等級的實際比例rn,其中,η = 1,. . .,N。。根據預先設置的每個語音幀目標等級對應的
      語音幀個數的比例值即禮、1 2........&,確定對應的閾值Tm,m = 1,. . .,Μ-1。假設上述
      步驟205中利用分類器劃分的語音幀細分等級結果為Ii1,。ut = 1,. . .,N。,利用上述確定的閾值,即可以獲取與上述語音幀細分等級對應的語音幀目標等級。語音幀目標等級的個數可以根據實際需要設置,例如可以是2 4之間的任意整數,下面以語音幀目標等級的個數為2個為例進行說明。具體地,可以認為語音幀目標等級的取值越大,語音幀的等級也就越高,例如語音幀目標等級的取值為1即等級1表示語音幀具有低等級,語音幀目標等級 2表示語音幀具有高等級;當然,也可以是語音幀目標等級的取值越小,語音幀的等級也就越高,本實施例對此不做限定,只要能通過不同的語音幀目標等級的取值反映出語音幀的等級高低即可。進一步可以認為語音幀的等級越高,語音幀的重要程度也就越高,例如等級1表示語音幀具有低重要程度(不重要),等級2表示語音幀具有高重要程度(重要); 當然,也可以是等級越低,重要程度也就越高,本實施例對此不做限定,只要能通過不同的等級反映出語音幀的重要程度即可?;蛘?,也可以通過預設的目標等級閾值(該閾值可以為多個),根據語音幀的目標等級,將語音幀劃分為不同的重要程度。例如,假設通過兩個目標等級閾值,第一目標等級閾值,第二目標等級閾值將語音幀為重要,次重要,不重要三個重要程度。那么通過比較獲取的語音幀的目標等級與目標等級閾值的關系可以知道該語音幀的重要程度。例如可以以語音幀細分等級/語音幀目標等級的取值越大,語音幀的等級越高, 重要程度越高為例。假設上述步驟205中分類器將語音幀劃分出了 10個語音幀細分等級, 語音幀細分等級1中的語音幀的個數是100個,語音幀細分等級2中的語音幀的個數是102 個,語音幀細分等級3中的語音幀的個數是98個,語音幀細分等級4中的語音幀的個數是 100個,語音幀細分等級5中的語音幀的個數是102個,語音幀細分等級6中的語音幀的個數是100個,語音幀細分等級7中的語音幀的個數是98個,語音幀細分等級8中的語音幀
      11的個數是100個,語音幀細分等級9中的語音幀的個數是100個,語音幀細分等級10中的語音幀的個數是100個,若預先設置了兩個語音幀目標等級(例如目標等級為1和2),若預先設置成語音幀目標等級1對應的語音幀的個數占80%,語音幀目標等級2對應的語音幀的個數占20 %,那么,則可以將語音幀細分等級1 8對應的語音幀都劃分到語音幀目標等級1上,即語音幀細分等級1 8對應的語音幀都為語音幀目標等級1,將語音幀細分等級9 10對應的語音幀都劃分到語音幀目標等級2上,即語音幀細分等級9 10對應的語音幀都為語音幀目標等級2。進一步的,本實施例中,在獲取語音幀目標等級后,可以有效地對系統(tǒng)中的語音幀采取相應的保護策略,即可以根據語音幀目標等級對語音幀進行相應的處理(包括發(fā)送或轉發(fā)),例如對于重要程度高(語音幀目標等級2)的語音幀,可以采用較大的功率進行發(fā)送,以提高其抗信道噪聲干擾能力,也就是,語音幀的重要程度越高,就可以采用越大的發(fā)送功率;或者,對于重要程度低(語音幀目標等級1)的語音幀,可以采用較小的功率發(fā)送, 可以使得在保持平均發(fā)送功率不變的前提下,能耗資源實現了最優(yōu)分配,從而有效地提高了接收端的解碼語音質量,那么發(fā)送功率可以隨著語音幀的重要程度降低而降低;或者,當存在多余的帶寬資源時,對于重要程度高(語音幀目標等級幻的語音幀,可發(fā)送兩次或多次,對于重要程度低(語音幀目標等級1)的語音幀,可以只發(fā)送一次,通過冗余方式保證等級高的語音幀的信息不被丟失,從而有效地提高了接收端的解碼語音質量,也就是說,語音幀的重要程度越高,發(fā)送次數就越多。本實施例中,通過根據預先設置的每個語音幀目標等級對應的語音幀個數的比例值和已經獲取的每個語音幀細分等級對應的語音幀個數,獲取與所述語音幀細分等級對應的語音幀目標等級,也就可以得到了語音幀的等級,那么也就知道了語音幀的重要程度。進一步地,可以靈活對上述語音幀采取相應的保護策略,進一步能夠實現對語音幀進行有效保護,從而可以有效保護語音信號中的重要信息,能夠有效減少語音幀的丟幀現象的發(fā)生, 提高接收端的解碼語音質量。本發(fā)明實施例中,由于語音幀的丟失,能夠導致解碼語音信號平均意見評分(Mean Opinion kore,簡稱M0S)分值下降。其中,解碼語音信號MOS分值下降越大,其重要程度越高,在本發(fā)明實施例中所體現的等級就越高。下面可以參見利用本發(fā)明實施例的方法進行的實驗中的具體實驗數據。在實驗中采用美國國家標準技術研究院(National Institute of Standards and Technology,簡稱NIST)美國國家標準技術研究所提供的用于語音識別、語種識別等評測項目的呼叫朋友(CallFriend)和呼叫家人(CallHome)數據庫中的漢語(大陸和臺灣普通話)、英語(美國南方和非南方口音)、德語、法語、西班牙語和阿拉伯語。該數據庫為8kHz采樣μ律壓縮的電話對話語音。由庫中的長語音文件切割出的長度為6-12秒的若干短語音文件,每個語種隨機挑選20個短語音文件構成測試集,剩余的所有短語音文件構成訓練集。得到訓練語音庫后,對所有訓練語音幀進行丟幀解碼,利用語音質量的感知評估(Perceptual Evaluation of Speech Quality,簡稱PESQ)程序進行評分測試,根據PESQ MOS分值的下降值排序進行訓練語音幀細分等級標注。例如利用本發(fā)明實施例的方法進行的實驗中可以對語音幀設置三個等級,分別為非重要語音幀、次重要語音幀和重要語音幀,其實驗結果可以如下所示在GSM全速率語音中,對測試語音文件中的語音幀進行隨機丟幀,當丟幀率為5%時,解碼語音的平均PESQ MOS評分為2. 886 ;丟幀率為10%時,解碼語音的平均PESQ MOS 評分為2. 485 ;丟幀率為15%時,解碼語音的平均PESQ MOS評分為2. 22。利用本發(fā)明實施例提供的語音幀等級的獲取方法獲取出各個語音幀細分等級后,可以只丟失獲取的非重要語音幀,那么當丟幀率為5%時,解碼語音的平均PESQ MOS評分為3. 505 ;丟幀率為10%時, 解碼語音的平均PESQ MOS評分為3. 266 ;丟幀率為15%時,解碼語音的平均PESQ MOS評分為2. 925。當重要幀比例設置為30%時,利用本發(fā)明實施例提供的語音幀等級的獲取方法, 對獲取的所有重要語音幀進行保護以保證其不發(fā)生丟幀,當丟幀率為5%時,解碼語音的平均PESQM0S評分為3. 241 ;丟幀率為10%時,解碼語音的平均PESQ MOS評分為2. 994 ;丟幀率為15%時,解碼語音的平均PESQ MOS評分為2. 804。當重要幀比例設置為30%時,利用本發(fā)明實施例提供的語音幀等級的獲取方法,對獲取的所有重要語音幀進行二次發(fā)送的冗余保護,當丟幀率為5%時,解碼語音的平均PESQ MOS評分為3. 22 ;丟幀率為10%時,解碼語音的平均PESQ MOS評分為2. 929 ;丟幀率為15%時,解碼語音的平均PESQ MOS評分為
      2.683。在GSM半速率語音中,對測試語音文件中的語音幀進行隨機丟幀,當丟幀率為5% 時,解碼語音的平均PESQ MOS評分為2. 906 ;丟幀率為10%時,解碼語音的平均PESQ MOS 評分為2. 578 ;丟幀率為15%時,解碼語音的平均PESQ MOS評分為2. 336。利用本發(fā)明實施例提供的語音幀等級的獲取方法,只丟失獲取的非重要語音幀,當丟幀率為5%時,解碼語音的平均PESQ MOS評分為3. 337 ;丟幀率為10 %時,解碼語音的平均PESQ MOS評分為
      3.278 ;丟幀率為15%時,解碼語音的平均PESQ MOS評分為3. 191。當重要幀比例設置為 30%時,利用本發(fā)明實施例提供的語音幀等級的獲取方法,對獲取的所有重要語音幀進行保護以保證其不發(fā)生丟幀,當丟幀率為5%時,解碼語音的平均PESQ MOS評分為3. 202 ;丟幀率為10%時,解碼語音的平均PESQ MOS評分為3. 057 ;丟幀率為15%時,解碼語音的平均PESQ MOS評分為2. 927。當重要幀比例設置為30%時,利用本發(fā)明實施例提供的語音幀等級的獲取方法,對獲取的所有重要語音幀進行二次發(fā)送的冗余保護,當丟幀率為5%時, 解碼語音的平均PESQ MOS評分為3. 182 ;丟幀率為10%時,解碼語音的平均PESQ MOS評分為2. 997 ;丟幀率為15%時,解碼語音的平均PESQ MOS評分為2. 814。需要說明的是對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據本發(fā)明,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本發(fā)明所必須的。在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。圖3為本發(fā)明一實施例提供的語音幀等級的獲取裝置的結構示意圖,如圖3所示, 本實施例的語音幀等級的獲取裝置可以包括參數解碼模塊31、參數提取模塊32、矢量獲取模塊33和等級獲取模塊34。其中,參數解碼模塊31對語音幀的編碼參數進行解碼,生成第一解碼語音信號和第二解碼語音信號,上述第一解碼語音信號為未丟幀情況下的解碼語音信號,上述第二解碼語音信號為丟幀情況下的解碼語音信號,參數提取模塊32提取參數解碼模塊31生成的上述第一解碼語音信號的第一特征參數,并提取參數解碼模塊31生成的上述第二解碼語音信號的第二特征參數,矢量獲取模塊33根據參數提取模塊32提取的上述第一特征參數與上述第二特征參數,獲取上述語音幀的特征參數矢量,等級獲取模塊34 根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和矢量獲取模塊33獲取的上述特征參數矢量,獲取與矢量獲取模塊33獲取的上述特征參數矢量對應的語音幀細分等級??梢岳斫獾氖巧鲜鎏卣鲄凳噶靠梢园ǖ谝惶卣鲄担蛘哌€可以包括第一特征參數和第二特征參數,或者也可以包括上述第二特征參數與上述第一特征參數的參數差值,或者還可以包括上述第二特征參數與上述第一特征參數的參數差值和第一特征參數,或者也可以包括上述第二特征參數與上述第一特征參數的參數差值和第二特征參數, 或者又可以包括上述第二特征參數與上述第一特征參數的參數差值、第一特征參數和第二特征參數;上述本發(fā)明圖1或圖2所示實施例中的方法均可以由本發(fā)明實施例提供的語音幀等級的獲取裝置實現,而本發(fā)明實施例提供的語音幀處理裝置中的各個模塊的實現方式和交互過程可以參考方法實施例中的相應描述。此外,本發(fā)明實施例提供的語音幀處理裝置可以為用戶設備、基站和路由器等通信設備中的任意一種。本實施例中,預先建立的數學模型可以包括高斯混合模型(Gaussian Mixure Model,簡稱GMM)、貝葉斯模型、人工神經網絡等。上述數學模型可以通過多種方式建立, 例如可以根據預先指定一定數量的語音幀的解碼語音信號平均意見評分(Mean Opinion kore,簡稱M0S)分值的下降值,將上述一定數量的語音幀分為N。個語音幀細分等級,每個語音幀細分等級中語音幀的個數相同或相近,從而可以為每個語音幀細分等級上的語音幀的特征參數矢量分別建立的數學模型。根據預設準則,匹配出與獲取的上述特征參數矢量對應的數學模型,從而獲取上述數學模型對應的語音幀細分等級。而此處的,預設準則是指在具體確定語音幀更符合哪個數學模型時采用的判斷準則,例如該準則可以為最大似然估計準則。具體地,當上述預設準則為最大似然估計準則,上述數學模型為上述高斯混合模型時,上述等級獲取模塊具體用于獲取上述上述特征參數矢量與各個高斯混合模型的似然函數的值,選擇似然函數的值最大的高斯混合模型對應的語音幀細分等級作為上述語音幀的語音幀細分等級。本實施例中,參數解碼模塊根據語音幀的編碼參數,解碼生成丟幀情況下和未丟幀情況下的兩組解碼語音信號,參數提取模塊基于上述兩組解碼語音信號進行特征參數的提取,等級獲取模塊根據預設準則、矢量獲取模塊根據參數提取模塊提取的上述兩組解碼語音信號的特征參數獲取的上述語音幀的特征參數矢量和為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型,獲取與上述特征參數矢量對應的語音幀細分等級, 也就可以得到了語音幀的等級,那么也就知道了語音幀的重要程度。進一步地,可以對上述語音幀采取相應的保護策略,進一步能夠實現對語音幀進行有效保護,從而可以有效保護語音信號中的重要信息,能夠有效減少語音幀的丟幀現象的發(fā)生,提高接收端的解碼語音質量。圖4為本發(fā)明實施例四提供的語音幀等級的獲取裝置的結構示意圖,如圖4所示, 與上一實施例相比,本實施例的語音幀等級的獲取裝置還可以進一步包括矢量處理模塊41,可以用于利用線性鑒別分析技術或主成分分析技術對矢量獲取模塊33獲取的上述特征參數矢量進行處理,以達到有效提取最能反映不同等級之間差異的特征、去除特征分量間相關性、降低維數的目的。相應地,等級獲取模塊34具體可以根據預設準則、矢量獲取模塊33獲取的上述特征參數矢量和為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型,獲取與經過矢量處理模塊41處理的上述特征參數矢量對應的語音幀細分等級,以使對上述語音幀采取相應的保護策略。本實施例中,參數解碼模塊根據語音幀的編碼參數,解碼生成丟幀情況下和未丟幀情況下的兩組解碼語音信號,參數提取模塊基于上述兩組解碼語音信號進行特征參數的提取,通過矢量處理模塊利用線性鑒別分析技術或主成分分析技術,對矢量獲取模塊根據參數提取模塊提取的上述兩組解碼語音信號的特征參數獲取的上述語音幀的特征參數矢量進行處理,達到了有效提取最能反映不同等級之間差異的特征、去除特征分量間相關性、 降低維數的目的,從而使得等級獲取模塊能夠根據根據預設準則、經過矢量處理模塊處理的矢量獲取模塊根據參數提取模塊提取的上述兩組解碼語音信號的特征參數獲取的上述語音幀的特征參數矢量和為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型,獲取與經過矢量處理模塊處理的上述特征參數矢量對應的語音幀細分等級,也就可以得到了語音幀的等級。進一步地,可以對上述語音幀采取相應的保護策略,進一步能夠實現對語音幀進行有效保護,從而可以有效保護語音信號中的重要信息,能夠有效減少語音幀的丟幀現象的發(fā)生,提高接收端的解碼語音質量。進一步地,本實施例的語音幀等級的獲取裝置還可以進一步包括第一處理模塊 43,可以用于根據所述語音幀細分等級,獲知所述語音幀的重要程度,所述語音幀的重要程度越高,采用越大的功率發(fā)送所述語音幀;或者還可以用于根據所述語音幀細分等級,獲知所述語音幀的重要程度,所述語音幀的重要程度越高,對所述語音幀發(fā)送的次數越多。進一步地,本實施例的語音幀等級的獲取裝置還可以進一步包括等級確認模塊 42,可以用于根據每個語音幀目標等級對應的語音幀個數的比例值和每個語音幀細分等級對應的語音幀個數,獲取與等級獲取模塊34獲取的上述語音幀細分等級對應的語音幀目標等級。具體地,等級確認模塊42具體可以用于根據每個語音幀目標等級對應的語音幀個數的比例值和每個語音幀細分等級對應的語音幀個數,確定上述每個語音幀目標等級對應的語音幀細分等級閾值,根據上述語音幀細分等級閾值,獲取與等級獲取模塊34獲取的上述語音幀細分等級對應的語音幀目標等級。進一步地,本實施例的語音幀等級的獲取裝置還可以進一步包括第二處理模塊 44,可以用于根據所述語音幀目標等級,獲知所述語音幀的重要程度,所述重要程度越高, 采用越大的功率發(fā)送所述語音幀;或者還可以用于根據所述語音幀目標等級,獲知所述語音幀的重要程度,所述重要程度越高,對所述語音幀發(fā)送的次數越多。需要說明的是,本發(fā)明實施例提供的語音幀處理裝置中的各個模塊的實現方式和交互過程可以參考方法實施例中的相應描述。本領域普通技術人員可以理解實現上述方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質包括R0M、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質。
      最后應說明的是以上實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術方案的精神和范圍。
      權利要求
      1.一種語音幀等級的獲取方法,其特征在于,包括對語音幀的編碼參數進行解碼,生成第一解碼語音信號和第二解碼語音信號,所述第一解碼語音信號為未丟幀情況下的解碼語音信號,所述第二解碼語音信號為丟幀情況下的解碼語音信號;提取所述第一解碼語音信號的第一特征參數,并提取所述第二解碼語音信號的第二特征參數;根據所述第一特征參數和所述第二特征參數,獲取所述語音幀的特征參數矢量;其中,所述特征參數矢量包括第一特征參數,或者所述特征參數矢量包括第一特征參數和第二特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值和第一特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值和第二特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值、第一特征參數和第二特征參數;根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和所述特征參數矢量,獲取與所述特征參數矢量對應的語音幀細分等級。
      2.根據權利要求1所述的方法,其特征在于,所述對語音幀的編碼參數進行解碼,生成第一解碼語音信號和第二解碼語音信號包括利用第η幀語音幀的的編碼參數cn(i)為主體語音解碼器的輸入,進行語音解碼,生成對應于第η幀語音幀的第一解碼語音信號,其中,η為正整數;利用所述主體語音解碼器的內置的丟幀錯誤隱藏方法,生成第η幀語音幀丟失情況下的替代語音幀的編碼參數5n (i),建立一個臨時的簡單語音解碼器,拷貝所述主體語音解碼器的狀態(tài)到所述簡單語音解碼器,利用第η幀語音幀的丟幀替代的編碼參數δη ( )為所述簡單語音解碼器的輸入,進行語音解碼,生成對應于第η幀語音幀的第二解碼語音信號。
      3.根據權利要求1所述的方法,其特征在于,所述第一特征參數或所述第二特征參數包括幀能量、線性預測倒譜系數、Mel頻標倒譜系數、Bark域感知響度中的至少一項。
      4.根據權利要求1所述的方法,其特征在于,所述根據所述第一特征參數和所述第二特征參數,獲取所述語音幀的特征參數矢量之后還包括利用線性鑒別分析技術或主成分分析技術對所述特征參數矢量進行處理;所述根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和所述特征參數矢量,獲取與所述特征參數矢量對應的語音幀細分等級具體包括根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和所述特征參數矢量,獲取與經過處理的所述特征參數矢量對應的語音幀細分等級。
      5.根據權利要求1所述的方法,其特征在于,所述根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和所述特征參數矢量,獲取與所述特征參數矢量對應的語音幀細分等級之后還包括根據所述語音幀細分等級,獲知所述語音幀的重要程度,所述語音幀的重要程度越高, 采用越大的功率發(fā)送所述語音幀;或者根據所述語音幀細分等級,獲知所述語音幀的重要程度,所述語音幀的重要程度越高, 對所述語音幀發(fā)送的次數越多。
      6.根據權利要求1 5任一權利要求所述的方法,其特征在于,所述根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和所述特征參數矢量,獲取與所述特征參數矢量對應的語音幀細分等級之后還包括根據每個語音幀目標等級對應的語音幀個數的比例值和每個語音幀細分等級對應的語音幀個數,獲取與所述語音幀細分等級對應的語音幀目標等級。
      7.根據權利要求6所述的方法,其特征在于,所述根據每個語音幀目標等級對應的語音幀個數的比例值和每個語音幀細分等級對應的語音幀個數,獲取與所述語音幀細分等級對應的語音幀目標等級包括根據每個語音幀目標等級對應的語音幀個數的比例值和每個語音幀細分等級對應的語音幀個數,確定所述每個語音幀目標等級對應的語音幀細分等級閾值;根據所述語音幀細分等級閾值,獲取與所述語音幀細分等級對應的語音幀目標等級。
      8.根據權利要求6所述的方法,其特征在于,所述根據每個語音幀目標等級對應的語音幀個數的比例值和每個語音幀細分等級對應的語音幀個數,獲取與所述語音幀細分等級對應的語音幀目標等級之后包括根據所述語音幀目標等級,獲知所述語音幀的重要程度,所述語音幀的重要程度越高, 采用越大的功率發(fā)送所述語音幀;或者根據所述語音幀目標等級,獲知所述語音幀的重要程度,所述語音幀的重要程度越高, 對所述語音幀發(fā)送的次數越多。
      9.根據權利要求1 5、7 8任一權利要求所述的方法,其特征在于,所述數學模型包括高斯混合模型、貝葉斯模型或人工神經網絡。
      10.根據權利要求9所述的方法,其特征在于,當所述預設準則為最大似然估計準則, 所述數學模型為所述高斯混合模型時,所述根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和所述特征參數矢量,獲取與所述特征參數矢量對應的語音幀細分等級包括獲取所述特征參數矢量在各個高斯混合模型中的似然函數的值;選擇似然函數的值最大的高斯混合模型對應的語音幀細分等級作為所述語音幀的語音幀細分等級。
      11.一種語音幀等級獲取裝置,其特征在于,包括參數解碼模塊,用于對語音幀的編碼參數進行解碼,生成第一解碼語音信號和第二解碼語音信號,所述第一解碼語音信號為未丟幀情況下的解碼語音信號,所述第二解碼語音信號為丟幀情況下的解碼語音信號;參數提取模塊,用于提取所述第一解碼語音信號的第一特征參數,并提取所述第二解碼語音信號的第二特征參數;矢量獲取模塊,用于根據所述第一特征參數和所述第二特征參數,獲取所述語音幀的特征參數矢量;其中,所述特征參數矢量包括第一特征參數,或者所述特征參數矢量包括第一特征參數和第二特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值和第一特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值和第二特征參數,或者所述特征參數矢量包括所述第二特征參數與所述第一特征參數的參數差值、第一特征參數和第二特征參數;等級獲取模塊,用于根據預設準則、為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型和所述特征參數矢量,獲取與所述特征參數矢量對應的語音幀細分等級。
      12.根據權利要求11所述的裝置,其特征在于,所述裝置還包括矢量處理模塊,用于利用線性鑒別分析技術或主成分分析技術對所述特征參數矢量進行處理;所述等級獲取模塊具體用于根據與經過處理的所述特征參數矢量、預設準則和為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型,獲取與經過處理的所述特征參數矢量對應的語音幀細分等級。
      13.根據權利要求11所述的裝置,其特征在于,所述裝置還包括等級確認模塊,用于根據每個語音幀目標等級對應的語音幀個數的比例值和每個語音幀細分等級對應的語音幀個數,獲取與所述語音幀細分等級對應的語音幀目標等級。
      14.根據權利要求13所述的裝置,其特征在于,所述等級確認模塊具體用于根據每個語音幀目標等級對應的語音幀個數的比例值和每個語音幀細分等級對應的語音幀個數,確定所述每個語音幀目標等級對應的語音幀細分等級閾值,根據所述語音幀細分等級閾值, 獲取與所述語音幀細分等級對應的語音幀目標等級。
      15.根據權利要求11所述的裝置,其特征在于,當所述預設準則為最大似然估計準則, 所述數學模型為高斯混合模型時,所述等級獲取模塊具體用于獲取所述特征參數矢量在各個高斯混合模型中的似然函數的值,選擇似然函數的值最大的高斯混合模型對應的語音幀細分等級作為所述語音幀的語音幀細分等級。
      16.根據權利要求11所述的裝置,其特征在于,所述裝置還包括,第一處理模塊,用于根據所述語音幀細分等級,獲知所述語音幀的重要程度,所述語音幀的重要程度越高,采用越大的功率發(fā)送所述語音幀;或者,所述第一處理模塊用于根據所述語音幀細分等級,獲知所述語音幀的重要程度,所述語音幀的重要程度越高,對所述語音幀發(fā)送的次數越多。
      17.根據權利要求13所述的裝置,其特征在于,所述裝置還包括第二處理模塊,用于根據所述語音幀目標等級,獲知所述語音幀的重要程度,所述語音幀的重要程度越高,采用越大的功率發(fā)送所述語音幀;或者,所述第二處理模塊用于根據所述語音幀目標等級,獲知所述語音幀的重要程度,所述語音幀的重要程度越高,對所述語音幀發(fā)送的次數越多。
      18.根據權利要求11 17任一權利要求所述的裝置,其特征在于,所述語音幀等級獲取裝置為用戶設備、基站和路由器中的任意一種。
      全文摘要
      本發(fā)明實施例提供一種語音幀等級的獲取方法及裝置,根據語音幀的編碼參數,解碼生成丟幀情況下和未丟幀情況下的兩組解碼語音信號,基于上述兩組解碼語音信號進行特征參數的提取,根據上述特征參數矢量、預設準則和為語音幀細分等級上的語音幀的特征參數矢量預先建立的數學模型,獲取與上述兩組解碼語音信號的特征參數的特征參數矢量對應的語音幀細分等級,也就可以得到語音幀的等級。進一步地,在得到語音幀的等級后,可以對上述語音幀采取相應的保護策略,進一步能夠實現對語音幀進行有效保護,從而可以有效保護語音信號中的重要信息,能夠有效減少語音幀的丟幀現象的發(fā)生,提高接收端的解碼語音質量。
      文檔編號G10L19/02GK102376306SQ20101024875
      公開日2012年3月14日 申請日期2010年8月4日 優(yōu)先權日2010年8月4日
      發(fā)明者劉加, 劉小青, 李明, 王林芳 申請人:華為技術有限公司, 清華大學
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1