国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種增強(qiáng)語音識(shí)別系統(tǒng)模板匹配精確度的方法

      文檔序號(hào):2823474閱讀:576來源:國知局
      專利名稱:一種增強(qiáng)語音識(shí)別系統(tǒng)模板匹配精確度的方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種語音識(shí)別系統(tǒng),特別是涉及一種提高語音識(shí)別系統(tǒng)模板匹配精確度的方法。
      背景技術(shù)
      語音系統(tǒng)是通過對(duì)所收到的語音信號(hào)進(jìn)行處理,提取相應(yīng)的特征或建立相應(yīng)的模型,然后據(jù)此做出語音識(shí)別的判斷。具體來說,語音識(shí)別一般分為兩個(gè)步驟。第一步是系統(tǒng)“學(xué)習(xí)”和“訓(xùn)練”階段,這一階段的任務(wù)是建立識(shí)別基本單元的聲學(xué)模型以及進(jìn)行文法分析的語言模型等,即建立模型庫。第二步是“識(shí)別”或“測試”階段,根據(jù)識(shí)別系統(tǒng)的類型選擇能夠滿足要求的一種識(shí)別方法,采用語音分析方法分析出這種識(shí)別方法所要求的語音特征參數(shù),按照一定的準(zhǔn)則和測度與系統(tǒng)模型進(jìn)行比較,通過判決得出識(shí)別結(jié)果,亦即模式匹配判別。
      識(shí)別系統(tǒng)工作時(shí),首先要將語音信號(hào)經(jīng)放大、帶通濾波、A/D變換后存入存儲(chǔ)器(例如RAM)內(nèi),這就是該語音的模板。這種模板根據(jù)存儲(chǔ)器的大小而達(dá)到一定數(shù)量。一個(gè)未知的語音信號(hào),經(jīng)上述各部分電路,由CPU將此信號(hào)的數(shù)據(jù)存入存儲(chǔ)器內(nèi)的某一特定區(qū)域,將此未知信號(hào)與存儲(chǔ)器內(nèi)各模板逐一比較,我們采用模板匹配法。計(jì)算測度再經(jīng)識(shí)別策略,將識(shí)別測度失真最小的一個(gè)模板輸出,這就是這種識(shí)別系統(tǒng)的工作原理。
      利用模板匹配進(jìn)行語音識(shí)別,首先要對(duì)語音進(jìn)行訓(xùn)練并建立特征模板庫,然后對(duì)采集的語音信號(hào)進(jìn)行特征提取,與模板庫的特征進(jìn)行比較。模板的匹配需要一個(gè)標(biāo)準(zhǔn),這就是失真度的概念。常用的失真測度有歐式距離、數(shù)頻譜距離、倒譜距離,以及板倉—齊藤距離等。
      在進(jìn)行模板匹配時(shí),匹配度為0%-100%之間,普通模板匹配的過程是均勻分割這段區(qū)間,在每個(gè)區(qū)間內(nèi)的匹配度還是進(jìn)行四舍五入來確定它靠近哪個(gè)分界點(diǎn)。在靠近40%-60%這段區(qū)間內(nèi)進(jìn)行匹配的判別比較模糊,很難準(zhǔn)確歸屬為匹配或不匹配。一般的模板匹配方法對(duì)于相似度不太大的語音信號(hào)不容易判斷準(zhǔn)確。

      發(fā)明內(nèi)容
      針對(duì)一般的模板匹配方法對(duì)于相似度不太大的語音信號(hào)不容易判斷準(zhǔn)確的問題,本發(fā)明所提出的方法目的在于采用一種非線性的新型匹配度取值方式,相當(dāng)于將語音信號(hào)的匹配邊界的特征數(shù)據(jù)的抽取密度增大,使得原來模糊的分界部分被細(xì)化而清晰,從而獲得提高模板匹配精確度的效果。
      為達(dá)到所述目的,在比較語音信號(hào)與模板的匹配程度過程中,為語音信號(hào)與模板的匹配程度建立相似函數(shù),對(duì)相似度的臨界部分進(jìn)行非線性聚焦,即離相似與不相似的分界值越近的語音信號(hào),其特征數(shù)據(jù)的抽取密度越大。建立語音信號(hào)與模板的匹配程度的相似函數(shù)的步驟如下1)根據(jù)語音信號(hào)的特點(diǎn),選擇一個(gè)合適的聚焦因子F,其中F∈(0,1);2)確定匹配度好與不好的交界數(shù)值M;3)以匹配度好與不好的交界數(shù)值M為焦點(diǎn),以匹配度低端邊界值邊界0為起點(diǎn),以100%(即1)匹配度為終點(diǎn),在匹配度的取值范圍
      內(nèi)非線性的分為2n+1份,其分段點(diǎn)分別是M×FM×F+M×F2……M×F+M×F2+M×F3+…+M×FnN×F-N×F2-N×F3…-N×Fn+M……N×F-N×F2+MN×F+M其中N=1-M,2n個(gè)分段點(diǎn)將匹配度取值范圍
      范圍分為2n+1份,離相似與不相似的分界值越接近的語音信號(hào),其特征數(shù)據(jù)的抽取密度越大,使得原來模糊的分界被清晰化,大大提高了模板匹配的精確度。


      圖1是語音識(shí)別工作原理圖。
      圖2是建立語音信號(hào)與模板的匹配程度的相似函數(shù)方法的流程圖。
      具體實(shí)施例方式
      下面結(jié)合圖1、圖2說明本發(fā)明的一種實(shí)施方式。
      根據(jù)圖1,語音信號(hào)經(jīng)預(yù)處理,即信號(hào)放大、帶通濾波、A/D變換后,進(jìn)行語音特征參數(shù)提取,根據(jù)訓(xùn)練及識(shí)別模式的不同,在訓(xùn)練模式下存入存儲(chǔ)區(qū)內(nèi)作為該語音的模板,模板根據(jù)存儲(chǔ)區(qū)的大小而達(dá)到一定的數(shù)量。在識(shí)別模式下,將此信號(hào)數(shù)據(jù)存入存儲(chǔ)器的某一特定區(qū)域,將此未知信號(hào)與存儲(chǔ)器內(nèi)各模板逐一比較,我們采用模板匹配法。在進(jìn)行測度估計(jì)時(shí),本發(fā)明的方法采用了一種非線性的新型匹配度取值方式,相當(dāng)于將語音信號(hào)的匹配邊界的特征數(shù)據(jù)的抽取密度增大,使得原來模糊的分界部分被細(xì)化而清晰,從而獲得提高模板匹配精確度的效果。經(jīng)由專家系統(tǒng)進(jìn)行識(shí)別決策,將識(shí)別測度失真最小的一個(gè)模板輸出。
      在比較語音信號(hào)與模板的匹配程度過程中,本發(fā)明為語音信號(hào)與模板的匹配程度建立相似函數(shù),對(duì)相似度的臨界部分進(jìn)行非線性聚焦,即離相似與不相似的分界值越近的語音信號(hào),其特征數(shù)據(jù)的抽取密度越大。
      如圖2所示,建立語音信號(hào)與模板的匹配程度的相似函數(shù)的步驟如下1)根據(jù)語音信號(hào)的特點(diǎn),選擇一個(gè)合適的聚焦因子F,其中F∈(0,1),F(xiàn)取值是根據(jù)經(jīng)驗(yàn)或?qū)嶒?yàn)來選取,因?yàn)檎Z音識(shí)別的對(duì)象總是在不斷變化的,每一套語音識(shí)別系統(tǒng)是針對(duì)特定的對(duì)象而設(shè)計(jì)的,F(xiàn)值相應(yīng)需取不同的值。所以在確定F值之前需做大量的實(shí)驗(yàn),并根據(jù)以往的經(jīng)驗(yàn)或?qū)<抑R(shí)來選取特定的F值;2)確定匹配度好與不好的交界數(shù)值M,其過程與現(xiàn)有技術(shù)相同或類似;3)以匹配度好與不好的交界數(shù)值M為焦點(diǎn),以匹配度低端邊界值邊界0為起點(diǎn),以100%(即1)匹配度為終點(diǎn),在匹配度的取值范圍
      內(nèi)非線性的分為2n+1份,其分段點(diǎn)分別是M×FM×F+M×F2……M×F+M×F2+M×F3+…+M×FnN×F-N×F2-N×F3…-N×Fn+M……N×F-N×F2+MN×F+M其中N=1-M,2n個(gè)分段點(diǎn)將匹配度取值范圍
      范圍分為2n+1份,進(jìn)行非線性劃分后,靠近模糊區(qū)間時(shí),劃分的密度增大,步長(區(qū)間分段的距離)減小,當(dāng)匹配度落入該區(qū)間內(nèi)時(shí),可以以更小的誤差靠近分界點(diǎn)。這樣可以提取更多的特征參數(shù),進(jìn)行匹配,直到匹配度在落在明確匹配或明確不匹配的范圍內(nèi)為止,如60%以上或40%以下。離相似與不相似的分界值越接近的語音信號(hào),其特征數(shù)據(jù)的抽取密度越大,使得原來模糊的分界被清晰化,這樣可以提高此段區(qū)間的利用率,而不是輕易的認(rèn)為不匹配或勉強(qiáng)匹配,大大提高了模板匹配的精確度。而原有的線性劃分方法對(duì)匹配度區(qū)間進(jìn)行線性劃分,在不明確的匹配范圍內(nèi),比如40%-60%,這段區(qū)間的處理比較粗糙,容易出現(xiàn)誤判。因此本發(fā)明的方法相對(duì)原有的線性劃分方法相比,具有更優(yōu)的技術(shù)效果。
      權(quán)利要求
      1.一種提高語音識(shí)別系統(tǒng)模板匹配精確度的方法,其特征在于,進(jìn)行模板匹配時(shí),為語音信號(hào)與模板的匹配程度建立相似函數(shù),對(duì)相似度的臨界部分進(jìn)行非線性聚焦,即離相似與不相似的分界值越近的語音信號(hào),其特征數(shù)據(jù)的抽取密度越大。
      2.根據(jù)權(quán)利要求1所述的提高語音識(shí)別系統(tǒng)模板匹配精確度的方法,其特征在于,所述的相似函數(shù),由以下步驟建立1)根據(jù)語音信號(hào)的特點(diǎn),選擇一個(gè)合適的聚焦因子F,其中F∈(0,1);2)確定匹配度好與不好的交界數(shù)值M;3)以匹配度好與不好的交界數(shù)值M為焦點(diǎn),以匹配度低端邊界值邊界0為起點(diǎn),以100%(即1)匹配度為終點(diǎn),在匹配度的取值范圍
      內(nèi)非線性的分為2n+1份,其分段點(diǎn)分別是M×FM×F+M×F2......M×F+M×F2+M×F3+...+M×FnN×F-N×F2-N×F3...-N×Fn+M......N×F-N×F2+MN×F+M其中N=1-M,2n個(gè)分段點(diǎn)將匹配度取值范圍
      范圍分為2n+1份,進(jìn)行非線性的匹配度取值。
      全文摘要
      本發(fā)明公開了一種提高語音識(shí)別系統(tǒng)模板匹配精確度的方法,此方法在語音識(shí)別系統(tǒng)進(jìn)行模板匹配時(shí),在選取適當(dāng)?shù)木劢挂蜃覨后,為語音信號(hào)與模板的匹配程度建立相似函數(shù),對(duì)相似度的臨界部分進(jìn)行非線性聚焦,即離相似與不相似的分界值越近的語音信號(hào),其特征數(shù)據(jù)的抽取密度越大,使得原來模糊的分界被清晰化,大大提高了模板匹配的精確度。
      文檔編號(hào)G10L15/10GK1790482SQ200510102380
      公開日2006年6月21日 申請(qǐng)日期2005年12月19日 優(yōu)先權(quán)日2005年12月19日
      發(fā)明者危然 申請(qǐng)人:危然
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1