国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      激活音檢測的方法及裝置的制造方法

      文檔序號:9507160閱讀:306來源:國知局
      激活音檢測的方法及裝置的制造方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及通信領(lǐng)域,尤其是涉及一種激活音檢測(Voice Activity Detection, 簡稱為VAD)的方法及裝置。
      【背景技術(shù)】
      [0002] 正常的語音通話中,用戶有時在說話,有時在聽,這個時候就會在通話過程出現(xiàn)非 激活音階段,正常情況下通話雙方總的非語音激活階段要超過通話雙方總的語音編碼時長 的50%。在非激活音階段,只有背景噪聲,背景噪聲通常沒有任何有用信息。利用這一事 實,在語音頻信號處理過程中,通過VAD算法檢測出于激活音和非激活音,并采用不同的方 法分別進行處理?,F(xiàn)代的很多語音編碼標(biāo)準,如AMR、AMR-WB,都支持VAD功能。在效率方 面,這些編碼器的VAD并不能在所有的典型背景噪聲下都達到很好的性能。特別是在非穩(wěn) 定噪聲下,這些編碼器的VAD效率都較低。而對于音樂信號,這些VAD有時候會出現(xiàn)錯誤檢 測,導(dǎo)致相應(yīng)的處理算法出現(xiàn)明顯的質(zhì)量下降。另外,現(xiàn)有的VAD技術(shù)會存在判決不準確的 情況,例如有的VAD技術(shù)在語音段之前的幾幀檢測不準,有的VAD在語音段之后的幾幀檢測 不準確。
      [0003] 針對相關(guān)技術(shù)中的上述問題,尚無有效地解決方案。

      【發(fā)明內(nèi)容】

      [0004] 針對相關(guān)技術(shù)中,現(xiàn)有的VAD方案檢測不準確等技術(shù)問題,本發(fā)明提供了一種激 活音檢測的方法及裝置,以至少解決上述技術(shù)問題。
      [0005] 根據(jù)本發(fā)明的一個方面,提供了一種VAD的方法,包括:獲取第一特征組中的至少 一個第一類特征參數(shù),第二特征組中的至少一個第二類特征參數(shù),以及至少兩個已有VAD 判決結(jié)果,其中,所述第一類特征參數(shù)和所述第二類特征參數(shù)均為用于VAD檢測的特征參 數(shù);根據(jù)所述第一類特征參數(shù)、所述第二類特征參數(shù)以及所述至少兩個已有激活音檢測判 決結(jié)果進行激活音檢測,得到聯(lián)合VAD判決結(jié)果。
      [0006] 優(yōu)選地,所述第一類特征參數(shù)包括以下至少之一:連續(xù)激活音幀個數(shù)、平均全帶信 噪比、調(diào)性信號標(biāo)志,其中,該平均全帶信噪比為針對預(yù)定數(shù)量幀的全帶信噪比的平均值; 所述第二類特征參數(shù)包括以下至少之一:噪聲類型標(biāo)志、平滑長時平均頻域信噪比、連續(xù)噪 聲幀個數(shù)、頻域信噪比。
      [0007] 優(yōu)選地,根據(jù)所述第一類特征參數(shù)、所述第二類特征參數(shù)以及所述至少兩個已有 VAD判決結(jié)果進行激活音檢測,包括:a)從所述至少兩個已有VAD判決結(jié)果中選擇一個VAD 判決結(jié)果,作為聯(lián)合VAD的初始值;b)如果所述噪聲類型標(biāo)志指示為靜音、且所述頻域信噪 比大于預(yù)設(shè)閾值、所述初始值為非激活音幀時,選擇所述至少兩個已有VAD判決結(jié)果中不 是作為所述初始值的VAD標(biāo)志作為所述聯(lián)合VAD判決結(jié)果;否則執(zhí)行步驟c),其中,所述 VAD標(biāo)志用于指示VAD判決結(jié)果為激活音幀或非激活音幀;c)如果所述平滑長時平均頻域 信噪比小于預(yù)設(shè)閾值、或者噪聲類型不為靜音,則執(zhí)行步驟d),否則,將步驟a)中選擇的所 述VAD判決結(jié)果作為所述聯(lián)合VAD判決結(jié)果;d)在滿足預(yù)設(shè)條件時,對所述至少兩個已有 VAD判決結(jié)果進行邏輯'或'運算,將運算結(jié)果作為所述聯(lián)合VAD判決結(jié)果;否則執(zhí)行步驟 e) ;e)如果所述噪聲類型標(biāo)志指示為靜音,選擇所述至少兩個已有VAD判決結(jié)果中不是作 為所述初始值的VAD標(biāo)志作為所述聯(lián)合VAD判決結(jié)果;否則,將步驟a)中選擇的所述VAD 判決結(jié)果作為所述聯(lián)合VAD判決結(jié)果。
      [0008] 優(yōu)選地,根據(jù)所述第一類特征參數(shù)、所述第二類特征參數(shù)以及所述至少兩個已有 VAD判決結(jié)果進行激活音檢測,包括:a)從所述至少兩個已有VAD判決結(jié)果中選擇一個VAD 判決結(jié)果,作為聯(lián)合VAD的初始值;b)如果所述噪聲類型標(biāo)志指示為靜音、且所述頻域信噪 比大于預(yù)設(shè)閾值、所述初始值為非激活音幀時,選擇所述至少兩個已有VAD判決結(jié)果中不 是作為所述初始值的VAD標(biāo)志作為所述聯(lián)合VAD判決結(jié)果;否則執(zhí)行步驟c),其中,所述 VAD標(biāo)志用于指示VAD判決結(jié)果為激活音幀或非激活音幀;c)如果所述平滑長時平均頻域 信噪比小于預(yù)設(shè)閾值、或者噪聲類型不為靜音,則執(zhí)行步驟d),否則,將步驟a)中選擇的所 述VAD判決結(jié)果作為所述聯(lián)合VAD判決結(jié)果;d)在滿足預(yù)設(shè)條件時,對所述至少兩個已有 VAD判決結(jié)果進行邏輯'或'運算,將運算結(jié)果作為所述聯(lián)合VAD判決結(jié)果;否則執(zhí)行步驟 e) ;e)選擇所述至少兩個已有VAD判決結(jié)果中不是作為所述初始值的VAD標(biāo)志作為所述聯(lián) 合VAD判決結(jié)果。
      [0009] 優(yōu)選地,根據(jù)所述第一類特征參數(shù)、所述第二類特征參數(shù)以及所述至少兩個已有 VAD判決結(jié)果進行激活音檢測,包括:a)從所述至少兩個已有VAD判決結(jié)果中選擇一個VAD 判決結(jié)果作為聯(lián)合VAD的初始值;b)在所述噪聲類型標(biāo)志指示為靜音時,如果所述平滑長 時平均頻域信噪比大于閾值,且所述調(diào)性信號標(biāo)志指示為非調(diào)性信號,選擇所述至少兩個 已有VAD判決結(jié)果中不是作為所述初始值的VAD標(biāo)志作為所述聯(lián)合VAD判決結(jié)果,其中,所 述VAD標(biāo)志用于指示VAD判決結(jié)果為激活音幀或非激活音幀。
      [0010] 優(yōu)選地,根據(jù)所述第一類特征參數(shù)、所述第二類特征參數(shù)以及所述至少兩個已有 VAD判決結(jié)果進行激活音檢測,包括:a)從所述至少兩個已有VAD判決結(jié)果中選擇一個VAD 判決結(jié)果,作為聯(lián)合VAD的初始值;b)在所述噪聲類型標(biāo)志指示為非靜音,且滿足預(yù)設(shè)條件 時,對所述至少兩個已有VAD判決結(jié)果進行邏輯'或'運算,將運算結(jié)果作為所述聯(lián)合VAD判 決結(jié)果。
      [0011] 優(yōu)選地,所述預(yù)設(shè)條件包括以下至少之一:條件1:所述平均全帶信噪比大于第一 閾值;條件2 :所述平均全帶信噪比大于第二閾值,且連續(xù)激活音幀個數(shù)大于預(yù)設(shè)閾值;條 件3 :所述調(diào)性信號標(biāo)志指示為調(diào)性信號;
      [0012] 優(yōu)選地,根據(jù)所述第一類特征參數(shù)、所述第二類特征參數(shù)以及所述至少兩個已有 VAD判決結(jié)果進行激活音檢測,包括:如果所述連續(xù)噪聲幀個數(shù)大于第一指定閾值,且所述 平均全帶信噪比小于第二指定閾值,對所述至少兩個已有VAD判決結(jié)果進行邏輯'與'運 算,將運算結(jié)果作為所述聯(lián)合VAD檢測結(jié)果;否則從所述至少兩個已有VAD判決結(jié)果中任意 選擇其中一個已有VAD判決結(jié)果作為所述聯(lián)合VAD檢測結(jié)果。
      [0013] 優(yōu)選地,所述平滑長時平均頻域信噪比和所述噪聲類型標(biāo)志通過以下方式確定:
      [0014] 根據(jù)當(dāng)前幀的前一幀所對應(yīng)的至少兩個已有VAD判決結(jié)果或者所述前一幀的聯(lián) 合VAD判決結(jié)果中任意一個VAD判決結(jié)果、所述前一幀在第一預(yù)設(shè)時間段內(nèi)的平均激活音 幀能量和前一幀平均背景噪聲能量,計算當(dāng)前幀的平均激活音幀能量和所述當(dāng)前幀平均背 景噪聲能量;
      [0015] 根據(jù)所述當(dāng)前幀在第二預(yù)設(shè)時間段內(nèi)的平均激活音幀能量和平均背景噪聲能量 計算所述當(dāng)前幀在所述第二時間段內(nèi)的長時信噪比;
      [0016] 根據(jù)所述前一幀所對應(yīng)至少兩個已有VAD判決結(jié)果或者所述當(dāng)前幀的所述聯(lián)合 VAD判決結(jié)果中任意一個VAD判決結(jié)果、所述前一幀的頻域信噪比計算所述當(dāng)前幀在第三 預(yù)設(shè)時間段內(nèi)的平滑長時平均頻域信噪比;
      [0017] 根據(jù)所述長時信噪比、所述平滑長時平均頻域信噪比進行噪聲類型標(biāo)志的判斷。
      [0018] 優(yōu)選地,根據(jù)所述長時信噪比、所述平滑長時平均頻域信噪比進行噪聲類型標(biāo)志 的判斷,包括:
      [0019] 設(shè)置噪聲類型為非靜音,在所述長時信噪比大于第一預(yù)設(shè)閾值且所述平均頻域信 噪比大于第二預(yù)設(shè)閾值時,將所述噪聲類型標(biāo)志設(shè)置為靜音。
      [0020] 根據(jù)本發(fā)明的另一個方面,提供了一種激活音檢測VAD的裝置,包括:獲取模塊, 用于獲取第一特征組中的至少一個第一類特征參數(shù),第二特征組中的至少一個第二類特征 參數(shù),以及至少兩個已有VAD判決結(jié)果,其中,所述第一類特征參數(shù)和所述第二類特征參數(shù) 均為用于VAD檢測的特征參數(shù);檢測模塊,用于根據(jù)所述第一類特征參數(shù)、所述第二類特 征參數(shù)以及所述至少兩個已有激活音檢測判決結(jié)果進行激活音檢測,得到聯(lián)合VAD判決結(jié) 果。
      [0021] 優(yōu)選地,所述獲取模塊,包括:第一獲取單元,用于獲取以下至少之一所述第一類 特征參數(shù):連續(xù)激活音幀個數(shù)、平均全帶信噪比、調(diào)性信號標(biāo)志,其中,該平均全帶信噪比為 針對預(yù)定數(shù)量幀的全帶信噪比的平均值;第二獲取單元,用于獲取以下至少之一所述第二 類特征參數(shù):噪聲類型標(biāo)志、平滑長時平均頻域信噪比、連續(xù)噪聲幀個數(shù)、頻域信噪比。
      [0022] 通過本發(fā)明,采用根據(jù)第一特征組中的第一類特征參數(shù)、第二特征組中的第二類 特征參數(shù)以及至少兩個已有VAD判決結(jié)果進行聯(lián)合檢測的技術(shù)手段,解決了相關(guān)技術(shù)中, VAD方案檢測不準確等技術(shù)問題,提高了 VAD的準確性,進而提升了用戶體驗。
      【附圖說明】
      [0023] 此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本申請的一部分,本發(fā) 明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
      [0024] 圖1為根據(jù)本發(fā)明實施例的VAD的方法的流程圖;
      [0025] 圖2為根據(jù)本發(fā)明實施例的VAD的裝置的結(jié)構(gòu)框圖;
      [0026] 圖3為根據(jù)本發(fā)明實施例的VAD的裝置的另一結(jié)構(gòu)框圖;
      [0027] 圖4為根據(jù)本發(fā)明實施例1的VAD方法的流程圖。
      【具體實施方式】
      [0028] 下文中將參考附圖并結(jié)合實施例來詳細說明本發(fā)明。需要說明的是,在不沖突的 情況下,本申請中的實施例及實施例中的特征可以相互組合。
      [0029] 為了解決VAD檢測不準確的問題,以下實施例提供了相應(yīng)的解決方案,以下詳細 說明。
      [0030] 圖1為根據(jù)本發(fā)明實施例的VAD的方法的流程圖。如圖1所示,該方法包括步驟 S102-S104 :
      [0031] 步驟S102,獲取第一特征組(又稱為特征群一)中的至少一個第一類特征參數(shù),第 二特征組(又稱為特征群二)中的至少一個第二類特征參數(shù),以及至少兩個已有VAD判決 結(jié)果,其中,上述第一類特征參數(shù)和上述第二類特征參數(shù)均為用于VAD檢測的特征參數(shù);
      [0032] 步驟S104,根據(jù)第一類特征參數(shù)、第二類特征參數(shù)以及上述至少兩個已有激活音 檢測判決結(jié)果進行激活音檢測,得到聯(lián)合VAD判決結(jié)果。
      [0033] 采用上述各個處理步驟,由于可以根據(jù)第一特征組和第二特征組中的至少一個參 數(shù)和至少兩個已有VAD判決結(jié)果進行VAD的聯(lián)合檢測,因此,可以提高VAD的準確性。
      [0034] 在本實施例中,第一類特征參數(shù)包括以下至少之一:連續(xù)激活音幀個數(shù)、平均全 帶信噪比、調(diào)性信號標(biāo)志,其中,該平均全帶信噪比為針對預(yù)定數(shù)量幀的全帶信噪比的平均 值;
      [0035] 第二類特征參數(shù)包括以下至少之一:噪聲類型標(biāo)志、平滑長時平均頻域信噪比、連 續(xù)噪聲幀個數(shù)、頻域信噪比。其中,平滑長時平均頻域信噪比可以理解為以下含義:對預(yù)定 時間內(nèi)(長時)的多個頻域信噪比取平均值,且進行了平滑處理后得到的頻域信噪比。
      [0036] 步驟S104的實現(xiàn)方式有多種,例如可以通過以下方式實現(xiàn):
      [0037] 以下幾種實現(xiàn)方式的中所述的判決結(jié)束,只是代表某個實現(xiàn)方式的過程結(jié)束,并 不表示在這個過程結(jié)束后不再對聯(lián)合VAD判決結(jié)果進行修正。
      [0038] 第一種實現(xiàn)方式,按照如下步驟執(zhí)行:
      [0039] a)從上述至少兩個已有VAD判決結(jié)果中選擇一個VAD判決結(jié)果,作為聯(lián)合VAD的 初始值;
      [0040] b)如果上述噪聲類型標(biāo)志指示為靜音、且上述頻域信噪比大于預(yù)設(shè)閾值、上述初 始值為非激活音幀時,選擇上述至少兩個已有VAD判決結(jié)果中不是作為上述初始值的VAD 標(biāo)
      當(dāng)前第1頁1 2 3 4 5 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1