一種基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法
【專(zhuān)利摘要】本發(fā)明涉及信息處理技術(shù)及傳感信號(hào)處理領(lǐng)域,特別是涉及到一種基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)自動(dòng)語(yǔ)音檢測(cè)方法,本發(fā)明根據(jù)聲音的時(shí)域短時(shí)能量和一定范圍頻域短時(shí)能量變化分別進(jìn)行語(yǔ)音的檢測(cè),最后根據(jù)動(dòng)態(tài)估計(jì)出的背景噪聲能量的大小,選擇最優(yōu)的結(jié)果,從而大幅提高了語(yǔ)音識(shí)別的準(zhǔn)確率并提高了語(yǔ)音識(shí)別對(duì)環(huán)境變化的適應(yīng)性。
【專(zhuān)利說(shuō)明】
一種基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及信息處理技術(shù)及傳感信號(hào)處理領(lǐng)域,特別是涉及到一種基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法。
【背景技術(shù)】
[0002]人工智能應(yīng)用領(lǐng)域的一個(gè)熱點(diǎn)就是語(yǔ)音識(shí)別,目前語(yǔ)音識(shí)別已經(jīng)開(kāi)始在各個(gè)領(lǐng)域廣泛應(yīng)用。語(yǔ)音檢測(cè)的實(shí)現(xiàn)是語(yǔ)音識(shí)別系統(tǒng)實(shí)時(shí)實(shí)現(xiàn)的重要部分,其目的是在復(fù)雜的實(shí)際環(huán)境中區(qū)分語(yǔ)音段與非語(yǔ)音段。有文獻(xiàn)表明,實(shí)際應(yīng)用中識(shí)別率較低部分很大程度是由于未對(duì)語(yǔ)音進(jìn)行正確處理,大量的非語(yǔ)音信息嚴(yán)重影響了語(yǔ)音識(shí)別系統(tǒng)的準(zhǔn)確率,特別是應(yīng)用環(huán)境帶有大量噪聲的語(yǔ)音識(shí)別,正確的語(yǔ)音檢測(cè)技術(shù)可有效地降低系統(tǒng)運(yùn)算量,縮短系統(tǒng)處理時(shí)間,減少移動(dòng)端發(fā)射功率并節(jié)省信道資源,提高語(yǔ)音識(shí)別準(zhǔn)確率,尤其是在復(fù)雜背景噪聲下,語(yǔ)音識(shí)別系統(tǒng)性能的優(yōu)劣在很大程度上取決于語(yǔ)音檢測(cè)技術(shù)的優(yōu)劣,因此穩(wěn)健、精確、實(shí)時(shí)、自適應(yīng)性強(qiáng)及魯棒性好的語(yǔ)音檢測(cè)技術(shù)是每個(gè)語(yǔ)音識(shí)別系統(tǒng)所必需的。
[0003]目前語(yǔ)音識(shí)別技術(shù)在移動(dòng)端尤其是手機(jī)或語(yǔ)音遙控器上應(yīng)用時(shí),主要依靠按鍵方式?jīng)Q定語(yǔ)音的起始和結(jié)束,然而這種方式對(duì)于大量遠(yuǎn)講應(yīng)用則非常不方便,對(duì)遠(yuǎn)講或者是不拿在手上的支持語(yǔ)音識(shí)別的智能設(shè)備、機(jī)器人而言,自動(dòng)語(yǔ)音檢測(cè)系統(tǒng)就是必不可少的部件。
[0004]當(dāng)前自動(dòng)語(yǔ)音檢測(cè)的主流方法是依靠時(shí)域中短時(shí)能量大小,過(guò)零率大小,以及頻域中頻帶能量均方差三種方法來(lái)檢測(cè),具體方法式求出短時(shí)能量、過(guò)零率或者頻帶能量均方差,然后與一個(gè)經(jīng)驗(yàn)閾值進(jìn)行比較,實(shí)驗(yàn)證明,這種單獨(dú)比較短時(shí)能量大小或過(guò)零率大小的方法對(duì)于有噪聲的環(huán)境適應(yīng)性不好,尤其是當(dāng)應(yīng)用環(huán)境發(fā)生變化時(shí),同一環(huán)境的背景噪聲也會(huì)發(fā)生相應(yīng)的變化,而頻帶能量均方差方法對(duì)于安靜環(huán)境也適應(yīng)不好。
[0005]為解決上述問(wèn)題,需要發(fā)明一種根據(jù)時(shí)域和頻域聲音平均能量的變化分別進(jìn)行語(yǔ)音的檢測(cè),最后根據(jù)動(dòng)態(tài)估計(jì)出的背景噪聲大小,選擇最優(yōu)的結(jié)果,從而大幅提高了語(yǔ)音識(shí)別的準(zhǔn)確率以及對(duì)環(huán)境變化的適應(yīng)性。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于克服現(xiàn)有技術(shù)中所存在的上述不足,提供一種能大幅提高語(yǔ)音識(shí)別的準(zhǔn)確率以及對(duì)環(huán)境變化適應(yīng)性的語(yǔ)音檢測(cè)方法。
[0007]為了達(dá)到上述目的,本發(fā)明提供了如下技術(shù)方案。
[0008]—種基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法,其包括以下步驟:
步驟一,載入當(dāng)前幀數(shù)據(jù),所述當(dāng)前幀數(shù)據(jù)為時(shí)域內(nèi)語(yǔ)音數(shù)據(jù);
步驟二,計(jì)算所述時(shí)域內(nèi)語(yǔ)音數(shù)據(jù)的每幀聲音的能量總和作為時(shí)域短時(shí)能量,并將每幀所述時(shí)域內(nèi)語(yǔ)音數(shù)據(jù)通過(guò)FFT變換為頻域數(shù)據(jù);
步驟三,選取所述頻域數(shù)據(jù)一定頻率范圍子帶數(shù)據(jù),計(jì)算所述一定頻率范圍子帶數(shù)據(jù)的能量并累加作為頻域短時(shí)能量; 步驟四,背景噪聲估計(jì)單元計(jì)算出背景噪聲能量,頻域背景能量計(jì)算單元計(jì)算出頻域背景能量;
步驟五,將所述時(shí)域短時(shí)能量與所述背景噪聲能量進(jìn)行比較,結(jié)果為大于所述背景噪聲能量的則為語(yǔ)音,結(jié)果為小于或等于所述背景噪聲能量的則為非語(yǔ)音;
步驟六,將所述頻域短時(shí)能量與所述頻域背景能量進(jìn)行比較,結(jié)果為大于所述頻域背景能量的則為語(yǔ)音,結(jié)果為小于或等于所述頻域背景能量的則為非語(yǔ)音;
步驟七,將所述背景噪聲能量與一系統(tǒng)設(shè)定的閾值一進(jìn)行比較,若大于閾值一則選擇步驟六中比較為語(yǔ)音的結(jié)果,若小于等于閾值一則選擇步驟五中比較為語(yǔ)音的結(jié)果;
步驟八,若所述當(dāng)前幀結(jié)果檢測(cè)為非語(yǔ)音,則將所述當(dāng)前幀的所述時(shí)域短時(shí)能量送到所述背景噪聲估計(jì)單元中累加,累加到第一幀數(shù)后,將累加值除以所述第一幀數(shù)得到新的背景噪聲作為輸出,同時(shí)將所述當(dāng)前幀的所述頻域短時(shí)能量送到所述頻域背景能量計(jì)算單元中累加,累加到第二幀數(shù)后,將累加值除以所述第二幀數(shù)得到新的頻域背景能量作為輸出。
[0009]通常的語(yǔ)音能量具有短時(shí)穩(wěn)定性,而所述背景噪聲能量具有長(zhǎng)時(shí)穩(wěn)定性,所述時(shí)域短時(shí)能量與所述背景噪聲能量進(jìn)行比較,比較結(jié)果作為該時(shí)刻是語(yǔ)音的時(shí)域概率,通常非語(yǔ)音期間周期會(huì)遠(yuǎn)大于語(yǔ)音期間,因?yàn)樗鰰r(shí)域短時(shí)能量可看作可能含語(yǔ)音和所述背景噪聲能量的聲音能量,而時(shí)域長(zhǎng)時(shí)能量主要由所述背景噪聲能量構(gòu)成,所述時(shí)域短時(shí)能量比所述時(shí)域長(zhǎng)時(shí)能量大,則是語(yǔ)音的概率就大,而所述時(shí)域長(zhǎng)時(shí)能量是動(dòng)態(tài)計(jì)算出的,所以能很好的適應(yīng)環(huán)境噪聲的變化,利用所述時(shí)域短時(shí)能量與所述背景噪聲能量比較的方法比較適合安靜的環(huán)境,為了提高語(yǔ)音檢測(cè)的準(zhǔn)確性,使用所述時(shí)域短時(shí)能量與所述背景噪聲能量比較的方法和所述頻域短時(shí)能量與所述頻域背景能量比較的方法相結(jié)合的新方法進(jìn)行語(yǔ)音檢測(cè),提高語(yǔ)音檢測(cè)的準(zhǔn)確性。
[0010]作為本發(fā)明的優(yōu)選方案,步驟五中所述時(shí)域短時(shí)能量與所述背景噪聲能量進(jìn)行比較的方法是用所述時(shí)域短時(shí)能量減去所述背景噪聲能量的差值與系統(tǒng)設(shè)定的閾值二比較,結(jié)果大于所述閾值二則為語(yǔ)音,結(jié)果小于或等于所述閾值二則為非語(yǔ)音;
步驟六中所述頻域短時(shí)能量與所述頻域背景能量進(jìn)行比較的方法是用所述頻域短時(shí)能量減去所述頻域背景能量的差值與系統(tǒng)設(shè)定的閾值三比較,結(jié)果大于所述閾值三則為語(yǔ)音,結(jié)果小于或等于所述閾值三則為非語(yǔ)音。
[0011]作為本發(fā)明的優(yōu)選方案,步驟五中所述時(shí)域短時(shí)能量與所述背景噪聲能量進(jìn)行比較的方法是用所述時(shí)域短時(shí)能量與所述背景噪聲能量的比值與系統(tǒng)設(shè)定的閾值四比較,結(jié)果大于所述閾值四則為語(yǔ)音,結(jié)果小于或等于所述閾值四則為非語(yǔ)音;
步驟六中所述頻域短時(shí)能量與所述頻域背景能量進(jìn)行比較的方法是用所述頻域短時(shí)能量與所述頻域背景能量的比值與系統(tǒng)設(shè)定的閾值五比較,結(jié)果大于所述閾值五則為語(yǔ)音,結(jié)果小于或等于所述閾值五則為非語(yǔ)音。
[0012]作為本發(fā)明的優(yōu)選方案,所述頻率范圍為人語(yǔ)音能量主要分布的頻率范圍,人的聲音頻譜分布比較廣,人聲頻帶區(qū)間可以通過(guò)兩個(gè)參數(shù)來(lái)設(shè)置,一是上頻率閾值,另一個(gè)是下頻率閾值,通常超過(guò)這個(gè)頻率范圍的聲音往往是環(huán)境噪聲或者其他非人聲,在該頻帶范圍內(nèi),環(huán)境噪聲能量受到了較大的抑制,一般來(lái)說(shuō)人聲能量主要集中在300Hz到4000Hz之間,而背景噪聲能量主要分布在300Hz以?xún)?nèi),取人聲主要分布頻帶范圍的能量進(jìn)行比較,因此在該頻帶范圍內(nèi),當(dāng)有語(yǔ)音時(shí),所述頻域短時(shí)能量會(huì)有明顯的增高,因此和所述時(shí)域短時(shí)能量比較類(lèi)似,用所述頻域短時(shí)能量與所述頻域背景能量比較,超過(guò)系統(tǒng)設(shè)置的所述閾值三或者所述閾值五的,則該時(shí)段大概率為語(yǔ)音。
[0013]作為本發(fā)明的優(yōu)選方案,所述幀的時(shí)間范圍大小在10毫秒到50毫秒之間,所述第一幀數(shù)和所述第二幀數(shù)由系統(tǒng)配置。
[0014]作為本發(fā)明的優(yōu)選方案,所述背景噪聲能量是將判斷為非語(yǔ)音期間的所述時(shí)域短時(shí)能量進(jìn)行累加后求平均的結(jié)果。
[0015]作為本發(fā)明的優(yōu)選方案,所述頻域背景能量是將判斷為非語(yǔ)音期間的所述頻域短時(shí)能量進(jìn)行累加后求平均的結(jié)果。
[0016]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果:
本發(fā)明根據(jù)時(shí)域和頻域聲音平均能量的變化分別進(jìn)行語(yǔ)音的檢測(cè),最后根據(jù)動(dòng)態(tài)估計(jì)出的背景噪聲大小,選擇最優(yōu)的結(jié)果,從而大幅提高了語(yǔ)音識(shí)別的準(zhǔn)確率以及對(duì)環(huán)境變化的適應(yīng)性。
【附圖說(shuō)明】
[0017]圖1為本發(fā)明流程圖;
圖2為本發(fā)明運(yùn)行框圖。
【具體實(shí)施方式】
[0018]下面結(jié)合實(shí)施例及【具體實(shí)施方式】對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述,但不應(yīng)將此理解為本發(fā)明上述主體的范圍僅限于以下的實(shí)施例,凡基于本
【發(fā)明內(nèi)容】
所實(shí)現(xiàn)的技術(shù)均屬于本發(fā)明的范圍。
[0019]如圖1所示,一種基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法,其包括以下步驟:
步驟一,載入當(dāng)前幀數(shù)據(jù),當(dāng)前幀數(shù)據(jù)為時(shí)域內(nèi)語(yǔ)音數(shù)據(jù);
步驟二,計(jì)算時(shí)域內(nèi)語(yǔ)音數(shù)據(jù)的每幀聲音的能量總和作為時(shí)域短時(shí)能量,并將每幀時(shí)域內(nèi)語(yǔ)音數(shù)據(jù)通過(guò)FFT變換為頻域數(shù)據(jù);
步驟三,選取頻域數(shù)據(jù)一定頻率范圍子帶數(shù)據(jù),計(jì)算一定頻率范圍子帶數(shù)據(jù)的能量并累加作為頻域短時(shí)能量;
步驟四,背景噪聲估計(jì)單元計(jì)算出背景噪聲能量,頻域背景能量計(jì)算單元計(jì)算出頻域背景能量;
步驟五,將時(shí)域短時(shí)能量與背景噪聲能量進(jìn)行比較,結(jié)果為大于背景噪聲能量的則為語(yǔ)音,結(jié)果為小于或等于背景噪聲能量的則為非語(yǔ)音;
步驟六,將頻域短時(shí)能量與頻域背景能量進(jìn)行比較,結(jié)果為大于頻域背景能量的則為語(yǔ)音,結(jié)果為小于或等于頻域背景能量的則為非語(yǔ)音;
步驟七,將背景噪聲能量與一系統(tǒng)設(shè)定的閾值一進(jìn)行比較,若大于閾值一則選擇步驟六中比較為語(yǔ)音的結(jié)果,若小于等于閾值一則選擇步驟五中比較為語(yǔ)音的結(jié)果;
步驟八,若當(dāng)前幀結(jié)果檢測(cè)為非語(yǔ)音,則將當(dāng)前幀的時(shí)域短時(shí)能量送到背景噪聲估計(jì)單元中累加,累加到第一幀數(shù)后,將累加值除以第一幀數(shù)得到新的背景噪聲能量作為輸出,同時(shí)將當(dāng)前幀的頻域短時(shí)能量送到頻域背景能量計(jì)算單元中累加,累加到第二幀數(shù)后,將累加值除以第二幀數(shù)得到新的頻域背景能量作為輸出。
[0020]如圖1和圖2所示,首先載入當(dāng)前幀數(shù)據(jù),當(dāng)前幀數(shù)據(jù)是時(shí)域內(nèi)語(yǔ)音數(shù)據(jù),在載入當(dāng)前幀數(shù)據(jù)后進(jìn)行時(shí)域短時(shí)能量的計(jì)算,在計(jì)算時(shí)域短時(shí)能量的同時(shí)將時(shí)域內(nèi)語(yǔ)音數(shù)據(jù)通過(guò)FFT變換為頻域數(shù)據(jù),然后計(jì)算頻域短時(shí)能量,由背景噪聲估計(jì)單元計(jì)算出背景噪聲能量,由頻域背景能量計(jì)算單元計(jì)算出頻域背景能量,分別將時(shí)域短時(shí)能量與背景噪聲能量和頻域短時(shí)能量與頻域背景能量進(jìn)行比較,在本實(shí)施例中采用時(shí)域短時(shí)能量與背景噪聲能量的差值與系統(tǒng)設(shè)定的閾值二進(jìn)行比較并頻域短時(shí)能量與頻域背景能量的差值與系統(tǒng)設(shè)定的閾值三進(jìn)行比較的方法,時(shí)域短時(shí)能量減去背景噪聲能量的差值與系統(tǒng)設(shè)定的閾值二比較,結(jié)果大于閾值二則為語(yǔ)音,結(jié)果小于或等于閾值二則為非語(yǔ)音,頻域短時(shí)能量減去頻域背景能量的差值與系統(tǒng)設(shè)定的閾值三比較,結(jié)果大于閾值三則為語(yǔ)音,結(jié)果小于或等于閾值三則為非語(yǔ)音,上述的兩個(gè)比較結(jié)果均輸出,將背景噪聲能量與系統(tǒng)設(shè)置的閾值一進(jìn)行比較,若大于閾值一則選擇步驟六中比較為語(yǔ)音的結(jié)果,若小于等于閾值一則選擇步驟五中比較為語(yǔ)音的結(jié)果,在步驟五和步驟六中比較結(jié)果為非語(yǔ)音的結(jié)果分別輸送至背景噪聲能量估計(jì)單元和頻域背景能量計(jì)算單元中計(jì)算出新的背景噪聲能量和新的頻域背景能量,在本實(shí)施例中人語(yǔ)音能量主要分布的頻率范圍取300Hz到4000Hz,且?guī)臅r(shí)間范圍大小在1暈秒到50暈秒之間。
[0021]在另一實(shí)施例中采用時(shí)域短時(shí)能量與背景噪聲能量的比值與系統(tǒng)設(shè)定的閾值四進(jìn)行比較并頻域短時(shí)能量與頻域背景能量的比值與系統(tǒng)設(shè)定的閾值五進(jìn)行比較的方法,時(shí)域短時(shí)能量與背景噪聲能量的比值與系統(tǒng)設(shè)定的閾值四比較,結(jié)果大于閾值四則為語(yǔ)音,結(jié)果小于或等于閾值四則為非語(yǔ)音,頻域短時(shí)能量與頻域背景能量的比值與系統(tǒng)設(shè)定的閾值五比較,結(jié)果大于閾值五則為語(yǔ)音,結(jié)果小于或等于閾值五則為非語(yǔ)音,其余的計(jì)算過(guò)程均與前述實(shí)施例相同,在此不再贅述。
[0022]在其他實(shí)施例中還可以采用采用時(shí)域短時(shí)能量與背景噪聲能量的差值與系統(tǒng)設(shè)定的閾值六進(jìn)行比較并頻域短時(shí)能量與頻域背景能量的比值與系統(tǒng)設(shè)定的閾值七進(jìn)行比較的方法等。
【主權(quán)項(xiàng)】
1.一種基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法,其包括以下步驟: 步驟一,載入當(dāng)前幀數(shù)據(jù),所述當(dāng)前幀數(shù)據(jù)為時(shí)域內(nèi)語(yǔ)音數(shù)據(jù); 步驟二,計(jì)算所述時(shí)域內(nèi)語(yǔ)音數(shù)據(jù)的每幀聲音的能量總和作為時(shí)域短時(shí)能量,并將每幀所述時(shí)域內(nèi)語(yǔ)音數(shù)據(jù)通過(guò)FFT變換為頻域數(shù)據(jù); 步驟三,選取所述頻域數(shù)據(jù)一定頻率范圍子帶數(shù)據(jù),計(jì)算所述一定頻率范圍子帶數(shù)據(jù)的能量并累加作為頻域短時(shí)能量; 步驟四,背景噪聲能量估計(jì)單元計(jì)算出背景噪聲能量,頻域背景能量計(jì)算單元計(jì)算出頻域背景能量; 步驟五,將所述時(shí)域短時(shí)能量與所述背景噪聲能量進(jìn)行比較,結(jié)果為大于所述背景噪聲能量的則為語(yǔ)音,結(jié)果為小于或等于所述背景噪聲能量的則為非語(yǔ)音; 步驟六,將所述頻域短時(shí)能量與所述頻域背景能量進(jìn)行比較,結(jié)果為大于所述頻域背景能量的則為語(yǔ)音,結(jié)果為小于或等于所述頻域背景能量的則為非語(yǔ)音; 步驟七,將所述背景噪聲能量與一系統(tǒng)設(shè)定的閾值一進(jìn)行比較,若大于閾值一則選擇步驟六中比較為語(yǔ)音的結(jié)果,若小于等于閾值一則選擇步驟五中比較為語(yǔ)音的結(jié)果; 步驟八,若所述當(dāng)前幀結(jié)果檢測(cè)為非語(yǔ)音,則將所述當(dāng)前幀的所述時(shí)域短時(shí)能量送到所述背景噪聲估計(jì)單元中累加,累加到第一幀數(shù)后,將累加值除以所述第一幀數(shù)得到新的背景噪聲能量作為輸出,同時(shí)將所述當(dāng)前幀的所述頻域短時(shí)能量送到所述頻域背景能量計(jì)算單元中累加,累加到第二幀數(shù)后,將累加值除以所述第二幀數(shù)得到新的頻域背景能量作為輸出。2.根據(jù)權(quán)利要求1所述的基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法,其特征在于: 步驟五中所述時(shí)域短時(shí)能量與所述背景噪聲能量進(jìn)行比較的方法是用所述時(shí)域短時(shí)能量減去所述背景噪聲能量的差值與系統(tǒng)設(shè)定的閾值二比較,結(jié)果大于所述閾值二則為語(yǔ)音,結(jié)果小于或等于所述閾值二則為非語(yǔ)音; 步驟六中所述頻域短時(shí)能量與所述頻域背景能量進(jìn)行比較的方法是用所述頻域短時(shí)能量減去所述頻域背景能量的差值與系統(tǒng)設(shè)定的閾值三比較,結(jié)果大于所述閾值三則為語(yǔ)音,結(jié)果小于或等于所述閾值三則為非語(yǔ)音。3.根據(jù)權(quán)利要求1所述的基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)自動(dòng)語(yǔ)音檢測(cè)方法,其特征在于: 步驟五中所述時(shí)域短時(shí)能量與所述背景噪聲能量進(jìn)行比較的方法是用所述時(shí)域短時(shí)能量與所述背景噪聲能量的比值與系統(tǒng)設(shè)定的閾值四比較,結(jié)果大于所述閾值四則為語(yǔ)音,結(jié)果小于或等于所述閾值四則為非語(yǔ)音; 步驟六中所述頻域短時(shí)能量與所述頻域背景能量進(jìn)行比較的方法是用所述頻域短時(shí)能量與所述頻域背景能量的比值與系統(tǒng)設(shè)定的閾值五比較,結(jié)果大于所述閾值五則為語(yǔ)音,結(jié)果小于或等于所述閾值五則為非語(yǔ)音。4.根據(jù)權(quán)利要求1所述的基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法,其特征在于:所述頻率范圍為人語(yǔ)音能量主要分布的頻率范圍,所述頻率范圍通過(guò)上頻率閾值和下頻率閾值確定。5.根據(jù)權(quán)利要求1所述的基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法,其特征在于:所述幀的時(shí)間范圍大小在10毫秒到50毫秒之間,所述第一幀數(shù)和所述第二幀數(shù)由系統(tǒng)配置。6.根據(jù)權(quán)利要求1所述的基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法,其特征在于:所述背景噪聲能量是將判斷為非語(yǔ)音期間的所述時(shí)域短時(shí)能量進(jìn)行累加后求平均的結(jié)果。7.根據(jù)權(quán)利要求1所述的基于動(dòng)態(tài)噪聲估計(jì)時(shí)頻域自適應(yīng)語(yǔ)音檢測(cè)方法,其特征在于:所述頻域背景能量是將判斷為非語(yǔ)音期間的所述頻域短時(shí)能量進(jìn)行累加后求平均的結(jié)果。
【文檔編號(hào)】G10L25/75GK106098076SQ201610393406
【公開(kāi)日】2016年11月9日
【申請(qǐng)日】2016年6月6日 公開(kāi)號(hào)201610393406.X, CN 106098076 A, CN 106098076A, CN 201610393406, CN-A-106098076, CN106098076 A, CN106098076A, CN201610393406, CN201610393406.X
【發(fā)明人】何云鵬
【申請(qǐng)人】成都啟英泰倫科技有限公司