国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取法的制作方法

      文檔序號(hào):2821215閱讀:191來(lái)源:國(guó)知局
      專(zhuān)利名稱(chēng):可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取法的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明是關(guān)于一種語(yǔ)音辨識(shí)的能量參數(shù)求取方法,尤指一種可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法。
      背景技術(shù)
      按,在實(shí)際使用語(yǔ)音人機(jī)接口的環(huán)境中,背景噪聲是一種不可忽視的干擾源,因?yàn)樗拐Z(yǔ)音辨識(shí)的效果大為降低。此種背景噪聲對(duì)于接收到的信號(hào)而言,是一種波形疊加的作用。在統(tǒng)計(jì)特性上,背景噪聲和語(yǔ)音信號(hào)是互為不相關(guān)的。因此在相關(guān)的研究文獻(xiàn)中,噪聲語(yǔ)音的二次統(tǒng)計(jì)量可表為噪聲和語(yǔ)音的二次統(tǒng)計(jì)量的總和。而訊號(hào)的能量即是一種二次統(tǒng)計(jì)量。又根據(jù)語(yǔ)音辨識(shí)相關(guān)的研究文獻(xiàn)公知,語(yǔ)音能量波形的斜率參數(shù)是一種較頻譜類(lèi)別參數(shù)更重要的樣型識(shí)別參數(shù)。
      在目前的研究文獻(xiàn)中,公知語(yǔ)音能量波形是由各音框切片中波形取樣的平方和來(lái)表示Ex&lsqb;t&rsqb;=1N&Sigma;i-1Nxt2&lsqb;i&rsqb;---(1)]]>其中,N為第t個(gè)音框中語(yǔ)音波形取樣點(diǎn)數(shù)。常用的一次和二次斜率參數(shù)可用下二式分別計(jì)算得到dExl(t)dt&cong;&Delta;Exl&lsqb;t&rsqb;=1K&Sigma;i=-DDilogEx&lsqb;t+i&rsqb;---(2)]]>d2Exl(t)dt2&cong;&Delta;2Exl&lsqb;t&rsqb;=&Delta;Exl&lsqb;t+1&rsqb;-&Delta;Exl&lsqb;t-1&rsqb;---(3)]]>其中,Ex^l[t]=log(Ex^[t]),]]>D為橫跨前后音框數(shù),而K=&Sigma;i=-DDi2.]]>在一般的情況下,合并此能量波形的斜率系數(shù)與其它頻譜類(lèi)別系數(shù)構(gòu)成的參數(shù)向量將可增進(jìn)樣型識(shí)別率。然而在噪聲環(huán)境下,假設(shè)背景噪聲和語(yǔ)音信號(hào)在統(tǒng)計(jì)特性上是互不相關(guān)的,故噪聲語(yǔ)音的能量可表為
      Ey(t)&cong;Ex(t)+Ew(t).---(4)]]>若噪聲能量的變動(dòng)速度相對(duì)較慢于語(yǔ)音能量的變動(dòng),則可令噪聲能量Ew(t)為一不隨時(shí)變的常數(shù)值ew,故Ey(t)≈Ex(t)+ew。根據(jù)微分公式,對(duì)數(shù)能量對(duì)時(shí)間的一次微分可表為dExl(t)dt=1Ex(t)dEx(t)dt,---(5)]]>因此對(duì)數(shù)的噪聲語(yǔ)音能量對(duì)時(shí)間的一次微分亦可表為dExl(t)dt=1Ex(t)+ewdEx(t)dt,---(6)]]>因?yàn)樵肼暷芰縠w>0,故dEyl(t)dt&lt;dExl(t)dt,---(7)]]>由以上的推導(dǎo)證明外加噪聲如何使對(duì)數(shù)能量的微分參數(shù)產(chǎn)生失真,而這樣的效果也將影響樣型識(shí)別的效果。故可知在噪聲環(huán)境下的語(yǔ)音的能量波形也會(huì)受到前述噪聲的疊加作用而導(dǎo)致失真,進(jìn)而造成語(yǔ)音辨識(shí)結(jié)果的錯(cuò)誤。

      發(fā)明內(nèi)容
      本發(fā)明的主要目的在于提供一種可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,以改進(jìn)噪聲語(yǔ)音的辨識(shí)率。
      為實(shí)現(xiàn)上述目的,本發(fā)明提供的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,包括一噪聲語(yǔ)音能量計(jì)算步驟,用以計(jì)算出一輸入噪聲語(yǔ)音的噪聲語(yǔ)音能量;一噪聲能量估測(cè)步驟,是用以估測(cè)該輸入噪聲語(yǔ)音中的噪聲能量;一干凈語(yǔ)音能量估測(cè)步驟,是將該噪聲語(yǔ)音能量減去該估測(cè)的噪聲能量以得到估測(cè)的干凈語(yǔ)音能量;以及一能量參數(shù)計(jì)算步驟,是對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行斜率運(yùn)算而求出噪聲語(yǔ)音的對(duì)數(shù)能量差分系數(shù)。
      該噪聲能量估測(cè)步驟是由該噪聲語(yǔ)音能量來(lái)估測(cè)該噪聲語(yǔ)音中的噪聲能量。
      該噪聲能量估測(cè)步驟是由該噪聲語(yǔ)音能量、及一能量動(dòng)態(tài)范圍比值來(lái)估測(cè)噪聲能量,當(dāng)中,該能量動(dòng)態(tài)范圍比值為語(yǔ)音的最大音框能量與最小音框能量的比值。
      該噪聲能量估測(cè)步驟所估測(cè)的噪聲能量為 為e^w=maxt=1,T(Ey(t))-rxmint=1,T(Ey(t))1-rx,]]>當(dāng)中,Ey(t)為噪聲語(yǔ)音能量,T為語(yǔ)音的音框數(shù),rx為干凈語(yǔ)音的能量動(dòng)態(tài)范圍比值。
      該干凈語(yǔ)音估測(cè)步驟所求出的干凈語(yǔ)音能量為Ex^[t]=Ey[t]-e^w.]]>該能量參數(shù)計(jì)算步驟是對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行一次斜率運(yùn)算而求出噪聲語(yǔ)音的對(duì)數(shù)能量的一次差分系數(shù)&Delta;Ex^l[t]=1K&Sigma;i=-DDilog(Ey[t+i]-e^w),]]>當(dāng)中,D為橫跨前后音框數(shù),K=&Sigma;i=-DDi2,]]>Ex^l[t]=log(Ex^[t]).]]>該能量參數(shù)計(jì)算步驟是對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行二次斜率運(yùn)算而求出噪聲語(yǔ)音的對(duì)數(shù)能量的二次差分系數(shù)&Delta;2Ex^l[t]=&Delta;Ex^l[t+1]-&Delta;Ex^l[t-1],]]>當(dāng)中Ex^l[t]=log(Ex^[t]).]]>該噪聲能量估測(cè)步驟是直接計(jì)算純背景噪聲的能量來(lái)估測(cè)噪聲語(yǔ)音中的噪聲能量。
      該噪聲能量估測(cè)步驟所估測(cè)的噪聲能量為ew=1Nw&Sigma;i=1Nww2[i],]]>當(dāng)中w[i]為純背景噪聲,Nw為噪聲波型樣本點(diǎn)數(shù)。
      該干凈語(yǔ)音估測(cè)步驟所求出的干凈語(yǔ)音能量為
      當(dāng)中,α與β與為預(yù)設(shè)的常數(shù)。
      該能量參數(shù)計(jì)算步驟是對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行一次斜率運(yùn)算而求出噪聲語(yǔ)音的對(duì)數(shù)能量的一次差分系數(shù)&Delta;Ex^l[t]=1K&Sigma;i=-DDilog(Ey[t+i]),]]>當(dāng)中,D為橫跨前后音框數(shù),K=&Sigma;i=-DDi2,]]>Ex^l[t]=log(Ex^[t]).]]>該能量參數(shù)計(jì)算步驟是對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行二次斜率運(yùn)算而求出噪聲語(yǔ)音的對(duì)數(shù)能量的二次差分系數(shù)&Delta;2Ex^l[t]=&Delta;Ex^l[t+1]-&Delta;Ex^l[t-1],]]>當(dāng)中Ex^l[t]=log(Ex^[t]).]]>


      圖1為本發(fā)明的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法的一實(shí)施例流程圖。
      圖2為顯示干凈語(yǔ)音數(shù)據(jù)庫(kù)和外加20dB白色噪聲后的能量均方根動(dòng)態(tài)范圍比分布曲線。
      圖3為本發(fā)明的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法的另一圖4為顯示訓(xùn)練語(yǔ)料和人名干凈語(yǔ)音的能量均方根動(dòng)態(tài)范圍比值分布。
      為能更了解本發(fā)明的技術(shù)內(nèi)容,特舉較佳具體實(shí)施例并結(jié)合

      如下。
      請(qǐng)參見(jiàn)圖1,顯示本發(fā)明的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法的一實(shí)施例,其可將噪聲語(yǔ)音能量減去噪聲能量以減少對(duì)數(shù)能量的微分參數(shù)的失真。其中,步驟S101首先計(jì)算輸入噪聲語(yǔ)音y[n]的能量Ey[t],t=1-T為音框索引。
      于步驟S102中,由前述噪聲語(yǔ)音能量Ey[t],及以能量動(dòng)態(tài)范圍比值來(lái)估測(cè)噪聲能量,而一語(yǔ)音能量Ex[t]的動(dòng)態(tài)范圍比值rx定義為該語(yǔ)音的最大音框能量與最小音框能量的比值,亦即rx=maxt=1,T(Ex[t])mint=1,T(Ex[t]),---(8)]]>其中,T為該段語(yǔ)音x的音框數(shù)。此語(yǔ)音能量的動(dòng)態(tài)范圍比值因外加噪聲的作用而變小,亦即,噪聲語(yǔ)音能量Ey[t]的動(dòng)態(tài)范圍比值ry將較不含噪聲語(yǔ)音能量Ex[t]的動(dòng)態(tài)范圍比值rx為小,可表示為rx=maxt=1,T(Ey[t])mint=1,T(Ey[t])=maxt=1,T(Ex[t])+ewmint=1,T(Ex[t])+ew&lt;rx,---(9)]]>其中ew>0為噪聲能量。故若不含噪聲語(yǔ)音的能量動(dòng)態(tài)范圍比值rx為已知、且假設(shè)估測(cè)的噪聲能量為 則將式(9)的分子及分母各減去 可得maxt=1,T(Ey[t])-ewmint=1,T(Ey[t])-ew=rx---(10)]]>故估測(cè)的噪聲能量 可由下式得到e^w=maxt=1,T(Ey[t])-rxmint=1,T(Ey[t])1-rx.---(11)]]>于步驟S103中,將估測(cè)的噪聲能量 由噪聲語(yǔ)音能量Ey[t]中移除,而得到估測(cè)的干凈語(yǔ)音能量Ex^[t]=Ey[t]-e^w---(12)]]>之后,步驟S104即可對(duì)不含噪聲語(yǔ)音能量的對(duì)數(shù)能量 進(jìn)行一次及二次斜率運(yùn)算(delta operation),而分別求出噪聲語(yǔ)音的對(duì)數(shù)能量的一次差分系數(shù)及二次差分系數(shù),如下所示&Delta;Ex^l[t]=1K&Sigma;i=-DDilog(Ey[t+i]-e^w),---(13)]]>
      &Delta;2Ex^l[t]=&Delta;Ex^l[t+1]-&Delta;Ex^l[t-1],---(14)]]>前述步驟S102是假定語(yǔ)音能量的動(dòng)態(tài)范圍比值因外加噪聲的作用而變小,而為驗(yàn)證其正確性,可分別統(tǒng)計(jì)干凈語(yǔ)音及含20dB白色噪聲語(yǔ)音數(shù)據(jù)庫(kù)中個(gè)別音文件的能量均方根動(dòng)態(tài)范圍比值分布,如圖2所示實(shí)線部分為干凈語(yǔ)音的比值分布,虛線部分為含20dB白色噪聲語(yǔ)音的比值分布。由圖2可以看出干凈語(yǔ)音的比值分布是較分散的,但其大部分的比值顯然較噪聲語(yǔ)音的比值為大,而這正好印證了步驟S102所預(yù)期的結(jié)果。
      圖3顯示本發(fā)明的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法的另一實(shí)施例。其中,步驟S300計(jì)算出輸入噪聲語(yǔ)音y[n]的能量Ey[t],而步驟S301是直接計(jì)算純背景噪聲的能量來(lái)估測(cè)噪聲能量,此噪聲能量表示為ew=1Nw&Sigma;i=1NWw2[i]---(15)]]>其中W[i]為純背景噪聲,Nw為噪聲波型樣本點(diǎn)數(shù)。于步驟S302中,將此噪聲能量ew由噪聲語(yǔ)音能量Ey[t]中移除而得到估測(cè)的干凈語(yǔ)音能量 然為避免從噪聲語(yǔ)音能量Ey[t]減去純背景噪聲能量ew時(shí)可能發(fā)生負(fù)值的問(wèn)題,每個(gè)音框的語(yǔ)音能量是由下式計(jì)算得到 其中,α與β為預(yù)設(shè)常數(shù),在本實(shí)施例中,α=0.95,β=0.05。之后,步驟S303即可對(duì)不含噪聲語(yǔ)音能量的對(duì)數(shù)能量 進(jìn)行一次及二次斜率運(yùn)算(delta operation),而分別求出噪聲語(yǔ)音的對(duì)數(shù)能量的一次差分系數(shù)及二次差分系數(shù),如下所示&Delta;Ex^l[t]=1K&Sigma;i=-DDilog(Ey[t+i]),---(17)]]>&Delta;2Ex^l[t]=&Delta;Ex^l[t+1]-&Delta;Ex^l[t-1].---(18)]]>又為驗(yàn)證本發(fā)明在噪聲語(yǔ)音辨識(shí)上的效果,可進(jìn)一步以人名辨識(shí)實(shí)驗(yàn)的正確率來(lái)做比較。實(shí)驗(yàn)中的語(yǔ)音模型訓(xùn)練語(yǔ)料為MAT2000(約2000人所錄制的電話語(yǔ)音數(shù)據(jù)庫(kù)),噪聲語(yǔ)音則由安靜環(huán)境所錄制的語(yǔ)音數(shù)據(jù)庫(kù)和取自NOISEX92的噪聲樣本,依訊雜比20dB、15dB、10dB、5dB、0dB分別由人工合成而得。在本實(shí)驗(yàn)中采用三種噪聲樣本,即白色噪聲、人聲噪音和工廠噪音。干凈語(yǔ)音數(shù)據(jù)庫(kù)是由18位男性和11位女性在安靜室內(nèi)透過(guò)麥克風(fēng)所錄的120中文人名。本實(shí)驗(yàn)的辨識(shí)目標(biāo)則為1073筆人名。訓(xùn)練語(yǔ)料和人名干凈語(yǔ)音的能量均方根動(dòng)態(tài)范圍比值分布如圖4所示,其中,實(shí)線部分為人名干凈語(yǔ)音的比值分布,虛線部分為電話語(yǔ)料的比值分布,可以看到兩者分布范圍約在400以下的區(qū)域,但是人名干凈語(yǔ)音的比值大部分皆大于電話語(yǔ)料。由圖4的結(jié)果,選定10000為噪聲能量估測(cè)所需的能量動(dòng)態(tài)范圍比的常數(shù)值。在實(shí)驗(yàn)中,語(yǔ)音特征向量由26個(gè)參數(shù)組成,其中包含12階Mel-frequency cepstrumcoefficients(MFCCs),12階delta MFCCs,1階delta log energy,及1階deltadelta log energy。在計(jì)算MFCCs的過(guò)程中,采用長(zhǎng)時(shí)間頻譜均值減去法以減少噪聲對(duì)頻譜類(lèi)別參數(shù)的作用。實(shí)驗(yàn)結(jié)果如表1所示,可知本發(fā)明在不同測(cè)試條件下,所得到的辮識(shí)率皆?xún)?yōu)于原公知的方法。
      表1采用本發(fā)明的辨識(shí)結(jié)果比較



      由以上說(shuō)明可知,本發(fā)明是以語(yǔ)音能量波形正規(guī)化米減少疊加噪聲的作用。而以此處理過(guò)的能量波形再求取能量波形相關(guān)參數(shù)可以減少噪聲引起的失真。根據(jù)實(shí)驗(yàn)結(jié)果顯示,以本方法所得的能量波形相關(guān)參數(shù)搭配其它常用的語(yǔ)音參數(shù)可有效地改善噪聲語(yǔ)音的辨識(shí)率。另外,本發(fā)明所需的計(jì)算量并不多,故可以很容易在硬件系統(tǒng)上實(shí)現(xiàn)。
      上述實(shí)施例僅是為了方便說(shuō)明而舉例而已,本發(fā)明所主張的權(quán)利范圍自應(yīng)以申請(qǐng)專(zhuān)利范圍所述為準(zhǔn),而非僅限于上述實(shí)施例。
      權(quán)利要求
      1.一種可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,包括一噪聲語(yǔ)音能量計(jì)算步驟,用以計(jì)算出一輸入噪聲語(yǔ)音的噪聲語(yǔ)音能量;一噪聲能量估測(cè)步驟,是用以估測(cè)該輸入噪聲語(yǔ)音中的噪聲能量;一干凈語(yǔ)音能量估測(cè)步驟,是將該噪聲語(yǔ)音能量減去該估測(cè)的噪聲能量以得到估測(cè)的干凈語(yǔ)音能量;以及一能量參數(shù)計(jì)算步驟,是對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行斜率運(yùn)算而求出噪聲語(yǔ)音的對(duì)數(shù)能量差分系數(shù)。
      2.如權(quán)利要求1所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該噪聲能量估測(cè)步驟是由該噪聲語(yǔ)音能量來(lái)估測(cè)該噪聲語(yǔ)音中的噪聲能量。
      3.如權(quán)利要求2所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該噪聲能量估測(cè)步驟是由該噪聲語(yǔ)音能量、及一能量動(dòng)態(tài)范圍比值來(lái)估測(cè)噪聲能量,當(dāng)中,該能量動(dòng)態(tài)范圍比值為語(yǔ)音的最大音框能量與最小音框能量的比值。
      4.如權(quán)利要求3所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該噪聲能量估測(cè)步驟所估測(cè)的噪聲能量為 為e^w=maxt=1,T(Er&lsqb;t&rsqb;)-rxmint=1,T(Ey&lsqb;t&rsqb;)1-rx,]]>當(dāng)中,Ey(t)為噪聲語(yǔ)音能量,T為語(yǔ)音的音框數(shù),rx為干凈語(yǔ)音的能量動(dòng)態(tài)范圍比值。
      5.如權(quán)利要求4所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該干凈語(yǔ)音估測(cè)步驟所求出的干凈語(yǔ)音能量為Ex^&lsqb;t&rsqb;=Ey&lsqb;t&rsqb;-e^w.]]>
      6.如權(quán)利要求4所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該能量參數(shù)計(jì)算步驟是對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行一次斜率運(yùn)算而求出噪聲語(yǔ)音的對(duì)數(shù)能量的一次差分系數(shù)&Delta;Ex^l&lsqb;t&rsqb;=1K&Sigma;i=-DDilog(Ey&lsqb;t+i&rsqb;-e^w),]]>當(dāng)中,D為橫跨前后音框數(shù),K=&Sigma;i=-DDi2,]]>Ex^l&lsqb;t&rsqb;=log(Ex^&lsqb;t&rsqb;).]]>
      7.如權(quán)利要求4所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該能量參數(shù)計(jì)算步驟是對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行二次斜率運(yùn)算而求出噪聲語(yǔ)音的對(duì)數(shù)能量的二次差分系數(shù)&Delta;2Ex^l&lsqb;t&rsqb;=&Delta;Ex^l&lsqb;t+1&rsqb;-&Delta;Ex^l&lsqb;t-1&rsqb;,]]>當(dāng)中Ex^l&lsqb;t&rsqb;=log(Ex^&lsqb;t&rsqb;).]]>
      8.如權(quán)利要求1所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該噪聲能量估測(cè)步驟是直接計(jì)算純背景噪聲的能量來(lái)估測(cè)噪聲語(yǔ)音中的噪聲能量。
      9.如權(quán)利要求8所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該噪聲能量估測(cè)步驟所估測(cè)的噪聲能量為ew=1Nw&Sigma;i=1Nww2&lsqb;i&rsqb;,]]>當(dāng)中w[i]為純背景噪聲,NW為噪聲波型樣本點(diǎn)數(shù)。
      10.如權(quán)利要求9所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該干凈語(yǔ)音估測(cè)步驟所求出的干凈語(yǔ)音能量為 當(dāng)中,α與β與為預(yù)設(shè)的常數(shù)。
      11.如權(quán)利要求10所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該能量參數(shù)計(jì)算步驟是對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行一次斜率運(yùn)算而求出噪聲語(yǔ)音的對(duì)數(shù)能量的一次差分系數(shù)&Delta;Ex^l&lsqb;t&rsqb;=1K&Sigma;i=-DDilog(Ey&lsqb;t+i&rsqb;),]]>當(dāng)中,D為橫跨前后音框數(shù),K=&Sigma;i=-DDi2,]]>Ex^l&lsqb;t&rsqb;=log(Ex^&lsqb;t&rsqb;).]]>
      12.如權(quán)利要求10所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,該能量參數(shù)計(jì)算步驟是對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行二次斜率運(yùn)算而求出噪聲語(yǔ)音的對(duì)數(shù)能量的二次差分系數(shù)&Delta;2Ex^l&lsqb;t&rsqb;=&Delta;Ex^l&lsqb;t+1&rsqb;-&Delta;Ex^l&lsqb;t-1&rsqb;,]]>當(dāng)中Ex^l&lsqb;t&rsqb;=log(Ex^&lsqb;t&rsqb;).]]>
      13.如權(quán)利要求10所述的可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取方法,其特征在于,α=0.95,β=0.05。
      全文摘要
      本發(fā)明是有關(guān)于一種可增進(jìn)噪聲語(yǔ)音辨識(shí)率的能量參數(shù)求取法,其首先計(jì)算出一輸入噪聲語(yǔ)音的噪聲語(yǔ)音能量;并估測(cè)該輸入噪聲語(yǔ)音中的噪聲能量;再將該噪聲語(yǔ)音能量減去該估測(cè)的噪聲能量,而得到估測(cè)的干凈語(yǔ)音能量;最后,對(duì)該估測(cè)的干凈語(yǔ)音能量的對(duì)數(shù)進(jìn)行斜率運(yùn)算,而求出噪聲語(yǔ)音的對(duì)數(shù)能量差分系數(shù)。
      文檔編號(hào)G10L15/00GK1617225SQ200310118170
      公開(kāi)日2005年5月18日 申請(qǐng)日期2003年11月13日 優(yōu)先權(quán)日2003年11月13日
      發(fā)明者黃泰惠 申請(qǐng)人:財(cái)團(tuán)法人工業(yè)技術(shù)研究院
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1