本發(fā)明屬于智能家居技術(shù)領(lǐng)域,特別涉及一種人聲音頻信號(hào)采樣處理方法。
背景技術(shù):
音頻的采集處理過程中,降噪是一個(gè)關(guān)鍵步驟。在日常生活中,降噪是指消除噪音,而對(duì)于擁有更高要求的音頻分類提取過程來說,噪聲指的是除目標(biāo)音源外的所有其他音頻。通常對(duì)于音頻降噪除噪的處理方法,有采樣除噪法、噪聲門等。
采樣除噪法是一些專業(yè)音頻處理軟件比較有效除去持續(xù)穩(wěn)定的背景噪音的一種方法,除噪的原理就是對(duì)噪音的波形樣本進(jìn)行取樣,然后對(duì)爭端素材的波形和采樣噪音樣本分析,自動(dòng)去除噪音;噪聲門則是設(shè)定一個(gè)電平的門限值,低于這個(gè)門限的信號(hào)電平全部過濾掉,高于門限值的信號(hào)電平全部通過。
使用音頻處理軟件雖然能夠在一定程度上實(shí)現(xiàn)噪音消除,提取出目標(biāo)音頻,但也存在先錄音、再處理,需要人工判斷采樣的缺點(diǎn),從實(shí)用角度來講極大限制了未來人工智能領(lǐng)域在語音解析方面的技術(shù)發(fā)展。
隨著人工智能技術(shù)的發(fā)展,人機(jī)語音對(duì)話、聲紋識(shí)別、語音與文字轉(zhuǎn)換、語音語義解析等需求越來越強(qiáng)烈,對(duì)于音頻的采樣、降噪要求也飛速提升,特別是對(duì)與音頻的實(shí)時(shí)分析處理,更是對(duì)產(chǎn)品起到至關(guān)重要的作用。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種人聲音頻信號(hào)采樣處理方法,目的是解決現(xiàn)有人聲語音采集分析中抑制噪聲的問題。
一種人聲音頻信號(hào)采樣處理方法,包括以下步驟:
由麥克風(fēng)偵測并收集無人聲的環(huán)境噪音,該噪音的音頻信號(hào)的模擬信號(hào)以96KHz或以上的采樣頻率采樣,得到該噪音的數(shù)字信號(hào)序列;
計(jì)算獲得與所述數(shù)字信號(hào)序列頻譜相同、相位相差180°的抑噪信號(hào)數(shù)字序列,
將抑噪信號(hào)數(shù)字序列反向還原成模擬信號(hào),將該抑噪模擬信號(hào)與麥克風(fēng)采集的含有人聲的音頻信號(hào)混合,使得抑噪信號(hào)與噪音信號(hào)互相抵消,從而獲取到清晰、無干擾的人聲語音。
進(jìn)一步的,
當(dāng)環(huán)境在發(fā)出噪聲音頻時(shí),麥克風(fēng)采集該噪聲音頻,通過高采樣率芯片將音頻信號(hào)轉(zhuǎn)換成一個(gè)數(shù)值序列,對(duì)該數(shù)值序列進(jìn)行運(yùn)算,獲得與該音頻信號(hào)頻譜相同、相位相差180°的抑噪信號(hào),
麥克風(fēng)采集使用者的人聲語音指令,抑噪信號(hào)通過音響播放,會(huì)與噪音抵消,從而使麥克風(fēng)捕捉到的音頻只有人聲。
本發(fā)明為音頻降噪和處理提供一種技術(shù)方案,通過對(duì)采集的音頻進(jìn)行相位消除的方式來對(duì)目標(biāo)音頻進(jìn)行數(shù)字降噪,該技術(shù)方案能夠廣泛應(yīng)用在智能家居領(lǐng)域,通過此技術(shù)手段,可以在復(fù)雜環(huán)境下將使用者的聲音(人聲)提取出來,進(jìn)行進(jìn)一步的語義分析,從而實(shí)現(xiàn)精準(zhǔn)人機(jī)對(duì)話。
附圖說明
圖1本發(fā)明中模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字序列示意圖。
圖2本發(fā)明中相位消除除噪示意圖。
圖3本發(fā)明實(shí)施例中音頻信號(hào)轉(zhuǎn)換為數(shù)值序列的示意圖。
具體實(shí)施方式
目前常用的數(shù)字音頻采樣率為48KHz,通常適用于miniDV、數(shù)字電視、DVD、DAT、電影和專業(yè)音頻領(lǐng)域,可滿足絕大部分需要。但對(duì)于音頻信號(hào)分析來說,還略有欠缺。當(dāng)采集的音頻信號(hào)帶寬不到采樣頻率的一半(即奈奎斯特頻率),那么此時(shí)這些離散的采樣點(diǎn)能夠完全表示原信號(hào)。高于或處于奈奎斯特頻率的頻率分量會(huì)導(dǎo)致混疊現(xiàn)象,這將使不同聲音信號(hào)的分辨和處理工作變得非常困難。采樣頻率必須大于被采樣信號(hào)帶寬的兩倍,如果信號(hào)的帶寬是100Hz,那么為了避免混疊現(xiàn)象采樣頻率必須大于200Hz,也就是采樣頻率必須至少是信號(hào)中最大頻率分量頻率的兩倍,否則就不能從信號(hào)采樣中恢復(fù)原始信號(hào)。使用擁有96KHz或更高采樣率能力芯片能夠更好地將音頻信號(hào)進(jìn)行還原,從而更好地還原采集到的音頻信號(hào)。
本發(fā)明通過使用超高采樣率的芯片,對(duì)音頻的采樣和處理,將抑噪音頻信號(hào)與源噪音信號(hào)進(jìn)行相位消除,從而達(dá)到降噪效果,實(shí)現(xiàn)音源分離和提取的目的。
首先,由系統(tǒng)麥克風(fēng)接收到噪音的模擬信號(hào),通過采樣芯片(96KHz或更高)將模擬信號(hào)進(jìn)行采樣,得出一系列在時(shí)間上離散的樣值,即樣值序列。對(duì)每個(gè)樣值進(jìn)行離散化處理,將其轉(zhuǎn)換為有限個(gè)離散值,完成模擬信號(hào)到數(shù)字信號(hào)的轉(zhuǎn)變;噪音信號(hào)變?yōu)閿?shù)字信號(hào)后,通過算法計(jì)算將數(shù)字信號(hào)轉(zhuǎn)換為數(shù)值序列,將該數(shù)值序列進(jìn)行二次計(jì)算,獲得與該信號(hào)頻譜相同、相位相差180°的降噪信號(hào)的數(shù)字序列(抑噪信號(hào)),再使用算法將抑噪信號(hào)數(shù)字序列反向還原成模擬信號(hào),將該抑噪信號(hào)與外置麥克風(fēng)采集的音源的音頻信號(hào)混合,抑噪信號(hào)與噪音信號(hào)互相抵消,從而獲取到清晰、無干擾的語音指令。