專利名稱:基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種關(guān)鍵詞檢出系統(tǒng)中的局部路徑裁剪方法,具體是在基于似然分裁剪的基礎(chǔ)上添加基于置信度裁剪的方法。
背景技術(shù):
關(guān)鍵詞檢出是從連續(xù)語(yǔ)音中識(shí)別出一組給定詞的過(guò)程,它是一種非受限的語(yǔ)音信號(hào)處理系統(tǒng),允許用戶采用自然的說(shuō)話方式,而不必局限于特定的語(yǔ)法。雖然近年來(lái)關(guān)鍵詞檢出技術(shù)獲得了長(zhǎng)足的進(jìn)步,但是其檢出效率仍不夠高。一般的關(guān)鍵詞檢出系統(tǒng),檢出率通常能達(dá)到90%以上,但是系統(tǒng)效率始終是制約其進(jìn)一步發(fā)展的瓶頸。為此,人們引入 Viterbi Beam解碼過(guò)程來(lái)對(duì)未知語(yǔ)音進(jìn)行解碼,它基于似然分進(jìn)行局部路徑的裁剪。但是這種方法具有一定的局限性,如在解碼過(guò)程中,沒(méi)有考慮觀察矢量的先驗(yàn)概率,解碼得到的只是所有可能的詞序列中與輸入語(yǔ)音最匹配的詞串,但是其置信度不一定足夠高,也就是最匹配的詞串不一定就是實(shí)際語(yǔ)音對(duì)應(yīng)的詞串。它只是擴(kuò)展那些似然分高的局部路徑,而忽略那些似然分低的局部路徑,解碼過(guò)程中完全沒(méi)有考慮各條路徑的可信程度。造成裁剪過(guò)程不充分,搜索空間中保留一些不可能的路徑,增加系統(tǒng)的計(jì)算量,降低系統(tǒng)的實(shí)時(shí)性。 因此,需要研究關(guān)鍵詞檢出中的裁剪過(guò)程,進(jìn)一步提高系統(tǒng)的檢出速度,改善系統(tǒng)的實(shí)時(shí)性。
發(fā)明內(nèi)容
本發(fā)明的目的是為了解決現(xiàn)有關(guān)鍵詞檢出系統(tǒng)解碼過(guò)程中,基于似然分的路徑裁剪不能最大程度地縮減搜索空間,從而導(dǎo)致系統(tǒng)效率低下,關(guān)鍵詞確認(rèn)階段計(jì)算量大的問(wèn)題,本發(fā)明提供了一種基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法。本發(fā)明的基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法是通過(guò)以下步驟實(shí)現(xiàn)的步驟一、輸入語(yǔ)音信號(hào),對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行預(yù)處理,特征提取得到特征矢量序列X= Ix1, &,... },其中S代表自然數(shù);步驟二、根據(jù)Viterbi解碼算法,對(duì)每幀語(yǔ)音特征在預(yù)先定義的識(shí)別網(wǎng)絡(luò)上進(jìn)行解碼,解碼之前,為每條局部路徑增加一個(gè)變量,用于記錄該條局部路徑上的累積置信度得分,并將累積置信度得分初始化為0 ;步驟三、在t時(shí)刻,所有局部路徑向前擴(kuò)展一次,得相應(yīng)局部路徑的活動(dòng)模塊,然后計(jì)算每個(gè)活動(dòng)模型的狀態(tài)q產(chǎn)生特征矢量^的概率,并累加到該條局部路徑的似然分中,同時(shí)計(jì)算每個(gè)活動(dòng)模型中狀態(tài)q相對(duì)于\的后驗(yàn)概率,再將后驗(yàn)概率累加到對(duì)應(yīng)的局部路徑的置信度得分中,獲得每條局部路徑的置信度得分,其中,^ct e X,1 < t < S,t取自然數(shù);步驟四、進(jìn)行基于似然分的狀態(tài)層局部路徑裁剪;步驟五、進(jìn)行基于置信度的狀態(tài)層局部路徑裁剪;步驟六、判斷是否到達(dá)語(yǔ)音末尾,是則轉(zhuǎn)步驟七,否則轉(zhuǎn)步驟二 ;
步驟七、根據(jù)解碼過(guò)程中生成的網(wǎng)格回溯查找關(guān)鍵詞,并基于后驗(yàn)概率確認(rèn)關(guān)鍵詞候選從而得到最終的識(shí)別結(jié)果,完成基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法。本發(fā)明步驟三中獲得每條局部路徑的置信度得分的過(guò)程為步驟1、計(jì)算每個(gè)活動(dòng)模型的狀態(tài)q產(chǎn)生特征矢量^ct的先驗(yàn)概率P (xt)設(shè)在處理 Xt時(shí),系統(tǒng)存在N個(gè)活動(dòng)模型,累加每個(gè)活動(dòng)模型中包含的所有狀態(tài)q產(chǎn)生特征矢量^ct的概率,作為P (Xt)的近似值,即
權(quán)利要求
1.基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法,其特征在于基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法是通過(guò)以下步驟實(shí)現(xiàn)的步驟一、輸入語(yǔ)音信號(hào),對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行預(yù)處理,特征提取得到特征矢量序列X =&1,&,...^},其中3代表自然數(shù);步驟二、根據(jù)Viterbi解碼算法,對(duì)每幀語(yǔ)音特征在預(yù)先定義的識(shí)別網(wǎng)絡(luò)上進(jìn)行解碼, 解碼之前,為每條局部路徑增加一個(gè)變量,用于記錄該條局部路徑上的累積置信度得分,并將累積置信度得分初始化為0 ;步驟三、在t時(shí)刻,所有局部路徑向前擴(kuò)展一次,得相應(yīng)局部路徑的活動(dòng)模塊,然后計(jì)算每個(gè)活動(dòng)模型的狀態(tài)q產(chǎn)生特征矢量^ct的概率,并累加到該條局部路徑的似然分中,同時(shí)計(jì)算每個(gè)活動(dòng)模型中狀態(tài)q相對(duì)于^的后驗(yàn)概率,再將后驗(yàn)概率累加到對(duì)應(yīng)的局部路徑的置信度得分中,獲得每條局部路徑的置信度得分,其中,^ct e X,1 < t < S,t取自然數(shù); 步驟四、進(jìn)行基于似然分的狀態(tài)層局部路徑裁剪; 步驟五、進(jìn)行基于置信度的狀態(tài)層局部路徑裁剪; 步驟六、判斷是否到達(dá)語(yǔ)音末尾,是則轉(zhuǎn)步驟七,否則轉(zhuǎn)步驟二 ; 步驟七、根據(jù)解碼過(guò)程中生成的網(wǎng)格回溯查找關(guān)鍵詞,并基于后驗(yàn)概率確認(rèn)關(guān)鍵詞候選從而得到最終的識(shí)別結(jié)果,完成基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法。
2.根據(jù)權(quán)利要求1所述的基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法,其特征在于步驟三中獲得每條局部路徑的置信度得分的過(guò)程為步驟1、計(jì)算每個(gè)活動(dòng)模型的狀態(tài)q產(chǎn)生特征矢量\的先驗(yàn)概率P (xt)設(shè)在處理&時(shí), 系統(tǒng)存在N個(gè)活動(dòng)模型,累加每個(gè)活動(dòng)模型中包含的所有狀態(tài)q產(chǎn)生特征矢量Xt的概率, 作為P(Xt)的近似值,即
3.根據(jù)權(quán)利要求1或2所述的基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法,其特征在于步驟四中進(jìn)行基于似然分的狀態(tài)層局部路徑裁剪的過(guò)程為步驟1、按照從大到小的順序依次保存任意t時(shí)刻所有局部路徑似然分到數(shù)組 score [1. . . N]中,假設(shè)t時(shí)刻共N條局部路徑;步驟2、任意時(shí)刻t,根據(jù)和該時(shí)刻t的N條局部路徑中的最大似然分^iax,計(jì)算得到t 時(shí)刻的裁剪門(mén)限threshhold(t) = α X (Smax (t)-beam(t)) 其中,beam(t)為第時(shí)刻t時(shí)的束寬度;步驟3、遍歷數(shù)組score[1. . . N],對(duì)于其中的每一個(gè)得分score[i],如果score[i]<threshhold(t),則終止在其對(duì)應(yīng)的局部路徑上的搜索,否則,繼續(xù)在該條局部路徑上進(jìn)行搜索,其中,1彡i彡N。
4.根據(jù)權(quán)利要求1或2所述的基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法,其特征在于步驟五中進(jìn)行基于置信度的狀態(tài)層局部路徑裁剪的過(guò)程為步驟1、按照從大到小的順序依次保存任意t時(shí)刻所有局部路徑的置信度得分到數(shù)組 score [1. . . N]中,假設(shè)t時(shí)刻共N條局部路徑;步驟2、任意時(shí)刻t,根據(jù)裁剪寬度beam(t)和該時(shí)刻t的N條局部路徑中的最大置信度得分Smax,計(jì)算得到t時(shí)刻的裁剪門(mén)限threshhold(t) = α X (Smax (t)-beam(t)) 其中,beam(t)為第時(shí)刻t時(shí)的束寬度;步驟3、遍歷數(shù)組score,對(duì)于其中的每一個(gè)得分score [i],如果score [i]<threshhold(t),則終止在其對(duì)應(yīng)的局部路徑上的搜索,否則,繼續(xù)在該條局部路徑上進(jìn)行搜索。
全文摘要
基于置信度的關(guān)鍵詞檢出系統(tǒng)裁剪方法,涉及關(guān)鍵詞檢出系統(tǒng)中的局部路徑裁剪方法。解決現(xiàn)有基于似然分的路徑裁剪不能最大程度地縮減搜索空間,從而導(dǎo)致系統(tǒng)效率低,關(guān)鍵詞確認(rèn)階段計(jì)算量大的問(wèn)題。將語(yǔ)音特征提取得特征矢量序列,根據(jù)Viterbi解碼,計(jì)算局部路徑上活動(dòng)模型狀態(tài)產(chǎn)生特征矢量的概率,并累加得局部路徑概率得分,再計(jì)算特征矢量的后驗(yàn)概率,累加得局部路徑置信度得分;然后依次進(jìn)行基于似然分和置信度的狀態(tài)層局部路徑裁剪,然后判斷是否到達(dá)語(yǔ)音末尾,是則據(jù)解碼過(guò)程生成的網(wǎng)格回溯找關(guān)鍵詞,得到識(shí)別結(jié)果,否則重新解碼。本發(fā)明能最大程度地縮減搜索空間,能減少30%的關(guān)鍵詞候選。本發(fā)明適用于確認(rèn)階段計(jì)算量大的任務(wù)中。
文檔編號(hào)G10L15/00GK102402984SQ20111028060
公開(kāi)日2012年4月4日 申請(qǐng)日期2011年9月21日 優(yōu)先權(quán)日2011年9月21日
發(fā)明者李海洋, 袁浩, 韓紀(jì)慶 申請(qǐng)人:哈爾濱工業(yè)大學(xué)