本申請(qǐng)涉及自然語(yǔ)言處理,更具體的說(shuō),是涉及一種語(yǔ)音處理方法及裝置。
背景技術(shù):
1、語(yǔ)音端點(diǎn)檢測(cè)的目的是正確區(qū)分檢測(cè)信號(hào)中的語(yǔ)音段和非語(yǔ)音段。目前,語(yǔ)音端點(diǎn)檢測(cè)在語(yǔ)音增強(qiáng)、語(yǔ)音識(shí)別、語(yǔ)音編碼等領(lǐng)域都有著廣泛的應(yīng)用。對(duì)于語(yǔ)音端點(diǎn)檢測(cè)系統(tǒng)而言,準(zhǔn)確性和魯棒性是非常重要的指標(biāo),當(dāng)前主流的方案是利用噪聲估計(jì),提取語(yǔ)音特征,通過(guò)傳統(tǒng)的閾值判斷或者模型匹配,判斷是否是語(yǔ)音幀。但是在有色噪聲場(chǎng)景下,噪聲估計(jì)困難,尤其低信噪比下,噪聲和語(yǔ)音難以區(qū)分,且噪聲估計(jì)容易造成延遲。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本申請(qǐng)?zhí)峁┤缦录夹g(shù)方案:
2、本申請(qǐng)第一方面提供了一種語(yǔ)音處理方法,該方法包括:
3、對(duì)原始語(yǔ)音信號(hào)進(jìn)行預(yù)處理,得到預(yù)處理數(shù)據(jù);
4、基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào),所述濾波處理包括基于所述第一函數(shù)得到估計(jì)粒子集,以及基于所述第二函數(shù)確定估計(jì)粒子集中各個(gè)粒子的權(quán)值,所述純語(yǔ)音信號(hào)與所述各個(gè)粒子的權(quán)值相關(guān)。
5、在一個(gè)可選的實(shí)現(xiàn)中,所述方法還包括:
6、構(gòu)建包括表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)的語(yǔ)音模型;
7、利用所述語(yǔ)音模型對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào)。
8、在一個(gè)可選的實(shí)現(xiàn)中,所述基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào),包括:
9、按照初始先驗(yàn)概率生成初始粒子集,所述初始粒子集中各個(gè)粒子的權(quán)值相同;
10、基于所述初始粒子集和所述第一函數(shù)對(duì)應(yīng)的轉(zhuǎn)移函數(shù)估計(jì)得到估計(jì)粒子集;
11、基于所述估計(jì)粒子集和所述第二函數(shù)對(duì)應(yīng)的概率密度函數(shù)更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值;
12、基于所述估計(jì)粒子集和其中各個(gè)粒子更新的權(quán)值確定純語(yǔ)音信號(hào)。
13、在一個(gè)可選的實(shí)現(xiàn)中,所述基于所述估計(jì)粒子集和所述第二函數(shù)對(duì)應(yīng)的概率密度函數(shù)更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值,包括:
14、確定所述估計(jì)粒子集中所有粒子的均值和方差;
15、基于所述均值、所述方差和所述概率密度函數(shù)更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值。
16、在一個(gè)可選的實(shí)現(xiàn)中,在所述基于所述估計(jì)粒子集更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值后,還包括:
17、基于更新后的權(quán)值確定權(quán)重退化指標(biāo);
18、在所述權(quán)重退化指標(biāo)超過(guò)設(shè)定閾值時(shí),進(jìn)行粒子集的重采樣。
19、在一個(gè)可選的實(shí)現(xiàn)中,在所述基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào)后,還包括:
20、基于所述純語(yǔ)音信號(hào)和所述原始語(yǔ)音信號(hào)確定語(yǔ)音存在概率;
21、基于所述語(yǔ)音存在概率進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),以確定所述原始語(yǔ)音信號(hào)中的語(yǔ)音時(shí)段。
22、在一個(gè)可選的實(shí)現(xiàn)中,所述基于所述純語(yǔ)音信號(hào)和所述原始語(yǔ)音信號(hào)確定語(yǔ)音存在概率,包括:
23、基于所述純語(yǔ)音信號(hào)和所述原始語(yǔ)音信號(hào)分別確定先驗(yàn)信噪比和后驗(yàn)信噪比;
24、基于所述先驗(yàn)信噪比和所述后驗(yàn)信噪比確定所述原始語(yǔ)音信號(hào)的似然比;
25、采用激活函數(shù)對(duì)所述似然比進(jìn)行非線性映射處理,得到語(yǔ)音存在概率。
26、在一個(gè)可選的實(shí)現(xiàn)中,所述激活函數(shù)中包括閾值參數(shù),所述閾值參數(shù)采用直方圖統(tǒng)計(jì)自適應(yīng)更新的方式更新。
27、在一個(gè)可選的實(shí)現(xiàn)中,所述預(yù)處理數(shù)據(jù)包括多個(gè)語(yǔ)音幀,所述基于所述語(yǔ)音存在概率進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),包括:
28、基于上一個(gè)語(yǔ)音幀的語(yǔ)音狀態(tài)、當(dāng)前語(yǔ)音幀的所述語(yǔ)音存在概率和設(shè)定的門限值確定當(dāng)前語(yǔ)音幀的語(yǔ)音狀態(tài),所述語(yǔ)音狀態(tài)包括等待語(yǔ)音開(kāi)始、語(yǔ)音中和語(yǔ)音結(jié)束。
29、本申請(qǐng)第二方面提供了一種語(yǔ)音處理裝置,該裝置包括:
30、預(yù)處理模塊,用于對(duì)原始語(yǔ)音信號(hào)進(jìn)行預(yù)處理,得到預(yù)處理數(shù)據(jù);
31、濾波處理模塊,用于基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào),所述濾波處理包括基于所述第一函數(shù)得到估計(jì)粒子集,以及基于所述第二函數(shù)確定估計(jì)粒子集中各個(gè)粒子的權(quán)值,所述純語(yǔ)音信號(hào)與所述各個(gè)粒子的權(quán)值相關(guān)。
1.一種語(yǔ)音處理方法,該方法包括:
2.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,所述方法還包括:
3.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,所述基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào),包括:
4.根據(jù)權(quán)利要求3所述的語(yǔ)音處理方法,所述基于所述估計(jì)粒子集和所述第二函數(shù)對(duì)應(yīng)的概率密度函數(shù)更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值,包括:
5.根據(jù)權(quán)利要求3所述的語(yǔ)音處理方法,在所述基于所述估計(jì)粒子集更新所述估計(jì)粒子集中各個(gè)粒子的權(quán)值后,還包括:
6.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,在所述基于表征純語(yǔ)音信號(hào)的第一函數(shù)和表征原始語(yǔ)音信號(hào)的第二函數(shù)對(duì)所述預(yù)處理數(shù)據(jù)進(jìn)行濾波處理,得到純語(yǔ)音信號(hào)后,還包括:
7.根據(jù)權(quán)利要求6所述的語(yǔ)音處理方法,所述基于所述純語(yǔ)音信號(hào)和所述原始語(yǔ)音信號(hào)確定語(yǔ)音存在概率,包括:
8.根據(jù)權(quán)利要求7所述的語(yǔ)音處理方法,所述激活函數(shù)中包括閾值參數(shù),所述閾值參數(shù)采用直方圖統(tǒng)計(jì)自適應(yīng)更新的方式更新。
9.根據(jù)權(quán)利要求6所述的語(yǔ)音處理方法,所述預(yù)處理數(shù)據(jù)包括多個(gè)語(yǔ)音幀,所述基于所述語(yǔ)音存在概率進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),包括:
10.一種語(yǔ)音處理裝置,該裝置包括: