国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種語(yǔ)音處理方法及裝置與流程

      文檔序號(hào):39974812發(fā)布日期:2024-11-15 14:22閱讀:23來(lái)源:國(guó)知局
      一種語(yǔ)音處理方法及裝置與流程

      本申請(qǐng)涉及自然語(yǔ)言處理,更具體的說(shuō),是涉及一種語(yǔ)音處理方法及裝置。


      背景技術(shù):

      1、語(yǔ)音端點(diǎn)檢測(cè)的目的是正確區(qū)分檢測(cè)信號(hào)中的語(yǔ)音段和非語(yǔ)音段。目前,語(yǔ)音端點(diǎn)檢測(cè)在語(yǔ)音增強(qiáng)、語(yǔ)音識(shí)別、語(yǔ)音編碼等領(lǐng)域都有著廣泛的應(yīng)用。對(duì)于語(yǔ)音端點(diǎn)檢測(cè)系統(tǒng)而言,準(zhǔn)確性和魯棒性是非常重要的指標(biāo),當(dāng)前主流的方案是利用噪聲估計(jì),提取語(yǔ)音特征,通過(guò)傳統(tǒng)的閾值判斷或者模型匹配,判斷是否是語(yǔ)音幀。但是在有色噪聲場(chǎng)景下,噪聲估計(jì)困難,尤其低信噪比下,噪聲和語(yǔ)音難以區(qū)分,且噪聲估計(jì)容易造成延遲。


      技術(shù)實(shí)現(xiàn)思路

      1、有鑒于此,本申請(qǐng)?zhí)峁┤缦录夹g(shù)方案:

      2、本申請(qǐng)第一方面提供了一種語(yǔ)音處理方法,該方法包括:

      3、對(duì)原始語(yǔ)音信號(hào)進(jìn)行預(yù)處理,得到預(yù)處理數(shù)據(jù);

      4、基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào),所述濾波處理包括基于所述第一函數(shù)得到估計(jì)粒子集,以及基于所述第二函數(shù)確定估計(jì)粒子集中各個(gè)粒子的權(quán)值,所述純語(yǔ)音信號(hào)與所述各個(gè)粒子的權(quán)值相關(guān)。

      5、在一個(gè)可選的實(shí)現(xiàn)中,所述方法還包括:

      6、構(gòu)建包括表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)的語(yǔ)音模型;

      7、利用所述語(yǔ)音模型對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào)。

      8、在一個(gè)可選的實(shí)現(xiàn)中,所述基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào),包括:

      9、按照初始先驗(yàn)概率生成初始粒子集,所述初始粒子集中各個(gè)粒子的權(quán)值相同;

      10、基于所述初始粒子集和所述第一函數(shù)對(duì)應(yīng)的轉(zhuǎn)移函數(shù)估計(jì)得到估計(jì)粒子集;

      11、基于所述估計(jì)粒子集和所述第二函數(shù)對(duì)應(yīng)的概率密度函數(shù)更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值;

      12、基于所述估計(jì)粒子集和其中各個(gè)粒子更新的權(quán)值確定純語(yǔ)音信號(hào)。

      13、在一個(gè)可選的實(shí)現(xiàn)中,所述基于所述估計(jì)粒子集和所述第二函數(shù)對(duì)應(yīng)的概率密度函數(shù)更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值,包括:

      14、確定所述估計(jì)粒子集中所有粒子的均值和方差;

      15、基于所述均值、所述方差和所述概率密度函數(shù)更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值。

      16、在一個(gè)可選的實(shí)現(xiàn)中,在所述基于所述估計(jì)粒子集更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值后,還包括:

      17、基于更新后的權(quán)值確定權(quán)重退化指標(biāo);

      18、在所述權(quán)重退化指標(biāo)超過(guò)設(shè)定閾值時(shí),進(jìn)行粒子集的重采樣。

      19、在一個(gè)可選的實(shí)現(xiàn)中,在所述基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào)后,還包括:

      20、基于所述純語(yǔ)音信號(hào)和所述原始語(yǔ)音信號(hào)確定語(yǔ)音存在概率;

      21、基于所述語(yǔ)音存在概率進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),以確定所述原始語(yǔ)音信號(hào)中的語(yǔ)音時(shí)段。

      22、在一個(gè)可選的實(shí)現(xiàn)中,所述基于所述純語(yǔ)音信號(hào)和所述原始語(yǔ)音信號(hào)確定語(yǔ)音存在概率,包括:

      23、基于所述純語(yǔ)音信號(hào)和所述原始語(yǔ)音信號(hào)分別確定先驗(yàn)信噪比和后驗(yàn)信噪比;

      24、基于所述先驗(yàn)信噪比和所述后驗(yàn)信噪比確定所述原始語(yǔ)音信號(hào)的似然比;

      25、采用激活函數(shù)對(duì)所述似然比進(jìn)行非線性映射處理,得到語(yǔ)音存在概率。

      26、在一個(gè)可選的實(shí)現(xiàn)中,所述激活函數(shù)中包括閾值參數(shù),所述閾值參數(shù)采用直方圖統(tǒng)計(jì)自適應(yīng)更新的方式更新。

      27、在一個(gè)可選的實(shí)現(xiàn)中,所述預(yù)處理數(shù)據(jù)包括多個(gè)語(yǔ)音幀,所述基于所述語(yǔ)音存在概率進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),包括:

      28、基于上一個(gè)語(yǔ)音幀的語(yǔ)音狀態(tài)、當(dāng)前語(yǔ)音幀的所述語(yǔ)音存在概率和設(shè)定的門限值確定當(dāng)前語(yǔ)音幀的語(yǔ)音狀態(tài),所述語(yǔ)音狀態(tài)包括等待語(yǔ)音開(kāi)始、語(yǔ)音中和語(yǔ)音結(jié)束。

      29、本申請(qǐng)第二方面提供了一種語(yǔ)音處理裝置,該裝置包括:

      30、預(yù)處理模塊,用于對(duì)原始語(yǔ)音信號(hào)進(jìn)行預(yù)處理,得到預(yù)處理數(shù)據(jù);

      31、濾波處理模塊,用于基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào),所述濾波處理包括基于所述第一函數(shù)得到估計(jì)粒子集,以及基于所述第二函數(shù)確定估計(jì)粒子集中各個(gè)粒子的權(quán)值,所述純語(yǔ)音信號(hào)與所述各個(gè)粒子的權(quán)值相關(guān)。



      技術(shù)特征:

      1.一種語(yǔ)音處理方法,該方法包括:

      2.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,所述方法還包括:

      3.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,所述基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào),包括:

      4.根據(jù)權(quán)利要求3所述的語(yǔ)音處理方法,所述基于所述估計(jì)粒子集和所述第二函數(shù)對(duì)應(yīng)的概率密度函數(shù)更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值,包括:

      5.根據(jù)權(quán)利要求3所述的語(yǔ)音處理方法,在所述基于所述估計(jì)粒子集更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值后,還包括:

      6.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,在所述基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào)后,還包括:

      7.根據(jù)權(quán)利要求6所述的語(yǔ)音處理方法,所述基于所述純語(yǔ)音信號(hào)和所述原始語(yǔ)音信號(hào)確定語(yǔ)音存在概率,包括:

      8.根據(jù)權(quán)利要求7所述的語(yǔ)音處理方法,所述激活函數(shù)中包括閾值參數(shù),所述閾值參數(shù)采用直方圖統(tǒng)計(jì)自適應(yīng)更新的方式更新。

      9.根據(jù)權(quán)利要求6所述的語(yǔ)音處理方法,所述預(yù)處理數(shù)據(jù)包括多個(gè)語(yǔ)音幀,所述基于所述語(yǔ)音存在概率進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),包括:

      10.一種語(yǔ)音處理裝置,該裝置包括:


      技術(shù)總結(jié)
      本申請(qǐng)公開(kāi)了一種語(yǔ)音處理方法及裝置,方法包括:對(duì)原始語(yǔ)音信號(hào)進(jìn)行預(yù)處理,得到預(yù)處理數(shù)據(jù);基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào),所述濾波處理包括基于所述第一函數(shù)得到估計(jì)粒子集,以及基于所述第二函數(shù)確定估計(jì)粒子集中各個(gè)粒子的權(quán)值,所述純語(yǔ)音信號(hào)與所述各個(gè)粒子的權(quán)值相關(guān)。

      技術(shù)研發(fā)人員:江源
      受保護(hù)的技術(shù)使用者:鼎道智芯(上海)半導(dǎo)體有限公司
      技術(shù)研發(fā)日:
      技術(shù)公布日:2024/11/14
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1