一種使用多維化技術(shù)進行回聲降噪的方法
【專利摘要】本發(fā)明公開了一種使用多維化技術(shù)進行回聲降噪的方法,其實現(xiàn)過程為:根據(jù)音頻采集設備的多少來定向音源方位,這里的音頻采集設備是指至少兩個采集器;根據(jù)多維空間的幾何特征來模擬聲波的傳導過程,使用多維化技術(shù)處理延時傳送的回聲數(shù)據(jù);通過幾何特征來智能過濾雜波信號,精確控制音頻信號的合成處理;導出合成后的音頻數(shù)據(jù)。該一種使用多維化技術(shù)進行回聲降噪的方法與現(xiàn)有技術(shù)相比,整個降噪過程中并不需要對采集設備做特別的要求,因此相對于專業(yè)的向音頻采集設備來,具有成本低、部署簡便,以及對用戶的專業(yè)水平要求較低等優(yōu)勢;實用性強,適用范圍廣泛,該技術(shù)可被廣泛的應用于各種平臺上的VoIP產(chǎn)品之中,對提升通話質(zhì)量,提高服務品質(zhì)都具有重要的作用,易于推廣。
【專利說明】
一種使用多維化技術(shù)進行回聲降噪的方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及噪聲處理技術(shù)領(lǐng)域,具體地說是一種實用性強、使用多維化技術(shù)進行回聲降噪的方法。
【背景技術(shù)】
[0002]在傳統(tǒng)的音頻降噪技術(shù)中,通常都要通過程序算法來對比并剔除音頻中的雜音數(shù)據(jù),然而類似的方法都存在一個較為明顯的缺陷,那就是對雜音的去除往往不徹底,又或是會降低會話音頻的質(zhì)量。
[0003]這主要是由音頻降噪處理的基本原理所造成的,如附圖1所示,由于傳統(tǒng)音頻文件的固有特性,并不能很好的分辨出聲音的來源與發(fā)聲者的音紋特征,只能通過同時采集并記錄遠端/本地發(fā)聲者的音頻數(shù)據(jù)來對采集的聲音進行對比,從而在回傳的音頻數(shù)據(jù)中剔除遠端發(fā)聲者自己的音頻數(shù)據(jù),如此以來就可以讓遠端的發(fā)聲者聽不到自己說話的聲音。但是在這樣的一種過程中,由于實際環(huán)境的復雜性,時常會導致音頻數(shù)據(jù)在處理上的不同步,從而使得視頻數(shù)據(jù)的處理產(chǎn)生延遲,使得回傳的音頻信號帶有一定程度的回聲拖尾現(xiàn)象。而且,由于音頻波形數(shù)據(jù)無法做到精確的分離,只能對波形進行簡單的裁剪處理,這就使得音頻數(shù)據(jù)的完整性造到了一定程度的破壞,從而不可避免的會造成聲音的缺失或是通話質(zhì)量的下降。
[0004]為解決上述存在的問題,以便更加精準的分離音頻數(shù)據(jù),并在通訊數(shù)據(jù)不做大幅增加的基礎上盡可能的提升音頻傳輸?shù)馁|(zhì)量,現(xiàn)根據(jù)多維化技術(shù)的相關(guān)幾何原理,設計出了一種使用多維化技術(shù)對聲波傳導過程進行幾何化模擬的方法。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的技術(shù)任務是針對以上不足之處,提供一種實用性強、使用多維化技術(shù)進行回聲降噪的方法。
[0006]—種使用多維化技術(shù)進行回聲降噪的方法,其實現(xiàn)過程為:
根據(jù)音頻采集設備的多少來定向音源方位,這里的音頻采集設備是指至少兩個采集器;
根據(jù)多維空間的幾何特征來模擬聲波的傳導過程,使用多維化技術(shù)處理延時傳送的回聲數(shù)據(jù);
通過幾何特征來智能過濾雜波信號,精確控制音頻信號的合成處理;
導出合成后的音頻數(shù)據(jù)。
[0007]定向音源方向的具體過程為:
設置采集器位置,并制定主采集器,采集器用于接收音頻數(shù)據(jù);
監(jiān)聽并偵測不同采集器上所接收的音頻數(shù)據(jù);
對比相同頻率音頻信號在不同采集器上的時間間隔;
根據(jù)時間差和采集器方位設定,在數(shù)據(jù)空間中模擬定位音頻源; 在數(shù)據(jù)空間中設定音源位置。
[0008]使用多維空間模擬技術(shù)找到并定位出可能存在的音源方位,具體為:當主發(fā)聲源的位置為X,噪音源的位置為Y,主采集器的位置為O,輔助采集器的位置分別為A和B,同時音速為V時,通過對比主發(fā)音源到達主采集器0、輔助采集器A、B的時間Χ0、ΧΑ、ΧΒ,根據(jù)音波傳播的物理規(guī)律,計算出主發(fā)音源X的大致方位,再結(jié)合音頻傳輸時間的比例值,最終確定主發(fā)音源X在數(shù)據(jù)空間中的相對方位;采用相同方式,即可計算出噪音源Y的相對方位。
[0009]根據(jù)多維空間的幾何特征來模擬聲波的傳導過程是指在數(shù)據(jù)空間中模擬音波信號的傳遞和疊加過程,其中音頻信號在空間中的傳播以相同速度向四周空間均勻傳遞,因此,其到達不同采集器的時間比例與其間距比例應當相同。
[0010]使用多維化技術(shù)處理延時傳送的回聲數(shù)據(jù)是指使用多維化技術(shù)控制不同音源中的音頻傳遞時間差,即為不同的音源信號設定同步時間差,由于音源信號傳遞到每個采集器上的時間不同,以及回聲在設備間傳輸延遲問題的存在,在消除回聲的時候?qū)Σ煌纛l源的時間維度做出調(diào)整,即對不同的音頻源信號進行時間差矯正。
[0011]合成的音頻信號中包括音頻源信號、噪音信號,在不同的空間維度上記錄不同音源的獨立音頻數(shù)據(jù),即將不同頻率或強度范圍的音頻數(shù)據(jù)存儲在不同的數(shù)據(jù)空間之中。
[0012]與上述合成的音頻信號相對應的,最后導出的音頻數(shù)據(jù)為用戶所指定頻率或強度的音頻數(shù)據(jù),該數(shù)據(jù)同樣為距離主采集器最近的音源數(shù)據(jù)。
[0013]本發(fā)明的一種使用多維化技術(shù)進行回聲降噪的方法,具有以下優(yōu)點:
該發(fā)明的一種使用多維化技術(shù)進行回聲降噪的方法本方法是一種通過多維化幾何特征識別技術(shù)來對音頻通訊進行管理并編碼的技術(shù),經(jīng)過多維化編碼的音頻數(shù)據(jù)既可以保持體積較小的優(yōu)勢,又能夠相對完整的保留多聲道音頻信息,在進行回聲降噪處理時便可以非常容易的找到并剔除那些無用數(shù)據(jù),從而達到無損化降噪的目的;整個降噪過程中并不需要對采集設備做特別的要求,因此相對于專業(yè)的向音頻采集設備來,具有成本低、部署簡便,以及對用戶的專業(yè)水平要求較低等優(yōu)勢;實用性強,適用范圍廣泛,該技術(shù)可被廣泛的應用于各種平臺上的VoIP產(chǎn)品之中,對提升通話質(zhì)量,提高服務品質(zhì)都具有重要的作用,易于推廣。
【附圖說明】
[0014]附圖1為回聲消除前波形圖。
[0015]附圖2為回聲消除后波形圖。
[0016]附圖3為實施例中三個采集器的布局圖。
[0017]附圖4為實施例中主發(fā)聲源、噪音源的相對空間方位圖。
[0018]附圖5為實施例中不同的空間維度上記錄不同音源示意圖。
【具體實施方式】
[0019]下面結(jié)合具體實施例對本發(fā)明作進一步說明。
[0020]本發(fā)明提供一種使用多維化技術(shù)進行回聲降噪的方法,通過多維化幾何特征識別技術(shù)來對音頻通訊進行管理并編碼的技術(shù),經(jīng)過多維化編碼的音頻數(shù)據(jù)既可以保持體積較小的優(yōu)勢,又能夠相對完整的保留多聲道音頻信息,在進行回聲降噪處理時便可以非常容易的找到并剔除那些無用數(shù)據(jù),從而達到無損化降噪的目的。
[0021 ]該方法的實現(xiàn)過程為:
根據(jù)音頻采集設備的多少來定向音源方位,這里的音頻采集設備是指至少兩個采集器;
根據(jù)多維空間的幾何特征來模擬聲波的傳導過程,使用多維化技術(shù)處理延時傳送的回聲數(shù)據(jù);
通過幾何特征來智能過濾雜波信號,精確控制音頻信號的合成處理;
導出合成后的音頻數(shù)據(jù)。
[0022]其具體實施步驟為:
步驟1:調(diào)用函數(shù)MDV_SetRecoder (),設置采集器位置,并制定主采集器。
[0023]步驟2:調(diào)用函數(shù)MDV_LisenVoice(),監(jiān)聽音頻信號輸入。
[0024]步驟3:調(diào)用函數(shù)MDV_Voi ceCompare (),對比相同頻率音頻信號在不同采集器上的時間間隔。
[0025]步驟4:調(diào)用函數(shù)MDV_FindVoiCe(),根據(jù)時間差和采集器方位設定,在數(shù)據(jù)空間中模擬定位音頻源(默認取最小值)。
[0026]步驟5:調(diào)用函數(shù)MDV_ResetVoice(),在數(shù)據(jù)空間中設定音源位置。
[0027]步驟6:調(diào)用函數(shù)MDV_TimeDimens 1n(),為不同的音源信號設定同步時間差。
[0028]步驟7:調(diào)用函數(shù)MDV_RecordVoice(),在不同的數(shù)據(jù)空間中記錄不同頻率/強度范圍的音頻數(shù)據(jù)。
[0029]步驟8:調(diào)用函數(shù)MDV_0utputVoiCe(),輸出指定頻率/強度的音頻數(shù)據(jù)。
[0030]本發(fā)明的實施例采用三個采集器,其中一個為主采集器,兩個輔助采集器,根據(jù)上述步驟,本發(fā)明的具體實施過程為:
I)首先使用數(shù)據(jù)空間技術(shù)定位音頻采集器的空間方位:
采集器數(shù)量應>=2,默認為3,典型的布局(在數(shù)據(jù)空間中需要根據(jù)實際布局的比例關(guān)系設置采集器的空間坐標)如附圖3所示。
[0031]2)監(jiān)聽并偵測不同采集器上所接收到的音頻數(shù)據(jù)。
[0032]計算不同音頻采集器上所接收到的相同音頻信號的時間間隔。
[0033]使用多維空間模擬技術(shù)找到并定位出可能存在的音源方位。
[0034]假設主發(fā)聲源的位置為X,噪音源的位置為Y,主采集器的位置為0,輔助采集器的位置分別為A和B,同時設音速為V,則根據(jù)音波傳播的物理規(guī)律,便可以通過計算音頻信號到達每個采集器之間的時間間隔來估算定位音頻源的相對空間方位,如附圖4所示。
[0035]因為主發(fā)聲源X的音頻信號到達輔助采集器A和B的時間相同(XA和XB),而到達主采集器的時間最短(X0),便可以根據(jù)幾何定律計算出主發(fā)聲源X的大致方位應處于XO軸的延長線上,再結(jié)合音頻傳輸時間的比例值,最終便可以確定主發(fā)聲源X在數(shù)據(jù)空間中的相對方位。
[0036]同理,便可以計算出噪音源Y的方位。
[0037]3)在數(shù)據(jù)空間中模擬音波信號的傳遞和疊加過程。
[0038]參見附圖4,音頻信號在空間中的傳播應是以相同速度向四周空間均勻傳遞,因此,其到達不同采集器的時間比例與其間距比例應當相同。
[0039]5)使用多維化技術(shù)控制不同音源中的音頻傳遞時間差。
[0040]由于音源信號傳遞到每個采集器上的時間不同,以及回聲在設備間傳輸延遲問題的存在,在消除回聲的時候就需要對不同音頻源的時間維度做出調(diào)整,因此,這就需要對不同的音頻源信號進行時間差矯正。
[0041]比如,遠端會話傳遞的音頻數(shù)據(jù),在本地接收之后還要經(jīng)過一系列的處理后才會傳遞給音源設備播放,再經(jīng)過聲波的傳遞進入采集器接收,在這個過程中,將不可避免的產(chǎn)生時間上的延遲,如果回聲降噪運算不進行時間矯正,將很容易在會話的尾部出現(xiàn)簡短回音殘留的問題。
[0042]6)在不同的空間維度上記錄不同音源的獨立音頻數(shù)據(jù)。
[0043]如附圖5所示,在空間中傳遞的噪音信號與音源信號都是以波狀信號均勻分布的,但是由于每個音源發(fā)聲的頻率/強度都不同,可以將不同頻率/強度范圍的音頻數(shù)據(jù)存儲在不同的數(shù)據(jù)空間之中。
[0044]7)輸出用戶所指定的音源數(shù)據(jù),默認為距離主采集器最近的音源數(shù)據(jù)。
[0045]本方法支持根據(jù)音源/音頻頻率等多種方式定向采集音頻數(shù)據(jù),因為不同的音頻數(shù)據(jù)都存儲在不同的數(shù)據(jù)空間之中,因此很容易對音頻數(shù)據(jù)進行分離或整合。
[0046]經(jīng)過上述處理后,最終產(chǎn)生的音頻數(shù)據(jù)的信噪比將得到大幅改善,其實際降噪效果如附圖2所示,甚至在硬件水平滿足適當要求的前提下(如:音頻采集設備的數(shù)量>=3,設備間距和角度都滿足一定條件等),可以精準指定采集環(huán)境中任意一種音源中的數(shù)據(jù),而在此過程中并不需要對采集設備做特別的要求,因此相對于專業(yè)的向音頻采集設備來,具有成本低、部署簡便,以及對用戶的專業(yè)水平要求較低等優(yōu)勢。
[0047]上述【具體實施方式】僅是本發(fā)明的具體個案,本發(fā)明的專利保護范圍包括但不限于上述【具體實施方式】,任何符合本發(fā)明的一種使用多維化技術(shù)進行回聲降噪的方法的權(quán)利要求書的且任何所屬技術(shù)領(lǐng)域的普通技術(shù)人員對其所做的適當變化或替換,皆應落入本發(fā)明的專利保護范圍。
【主權(quán)項】
1.一種使用多維化技術(shù)進行回聲降噪的方法,其特征在于,其實現(xiàn)過程為: 根據(jù)音頻采集設備的多少來定向音源方位,這里的音頻采集設備是指至少兩個采集器; 根據(jù)多維空間的幾何特征來模擬聲波的傳導過程,使用多維化技術(shù)處理延時傳送的回聲數(shù)據(jù); 通過幾何特征來智能過濾雜波信號,精確控制音頻信號的合成處理; 導出合成后的音頻數(shù)據(jù)。2.根據(jù)權(quán)利要求1所述的一種使用多維化技術(shù)進行回聲降噪的方法,其特征在于,定向音源方向的具體過程為: 設置采集器位置,并制定主采集器,采集器用于接收音頻數(shù)據(jù); 監(jiān)聽并偵測不同采集器上所接收的音頻數(shù)據(jù); 對比相同頻率音頻信號在不同采集器上的時間間隔; 根據(jù)時間差和采集器方位設定,在數(shù)據(jù)空間中模擬定位音頻源; 在數(shù)據(jù)空間中設定音源位置。3.根據(jù)權(quán)利要求2所述的一種使用多維化技術(shù)進行回聲降噪的方法,其特征在于,使用多維空間模擬技術(shù)找到并定位出可能存在的音源方位,具體為:當主發(fā)聲源的位置為X,噪音源的位置為Y,主采集器的位置為O,輔助采集器的位置分別為A和B,同時音速為V時,通過對比主發(fā)音源到達主采集器O、輔助采集器A、B的時間XO、XA、XB,根據(jù)音波傳播的物理規(guī)律,計算出主發(fā)音源X的大致方位,再結(jié)合音頻傳輸時間的比例值,最終確定主發(fā)音源X在數(shù)據(jù)空間中的相對方位;采用相同方式,即可計算出噪音源Y的相對方位。4.根據(jù)權(quán)利要求2所述的一種使用多維化技術(shù)進行回聲降噪的方法,其特征在于,根據(jù)多維空間的幾何特征來模擬聲波的傳導過程是指在數(shù)據(jù)空間中模擬音波信號的傳遞和疊加過程,其中音頻信號在空間中的傳播以相同速度向四周空間均勻傳遞,因此,其到達不同采集器的時間比例與其間距比例應當相同。5.根據(jù)權(quán)利要求2所述的一種使用多維化技術(shù)進行回聲降噪的方法,其特征在于,使用多維化技術(shù)處理延時傳送的回聲數(shù)據(jù)是指使用多維化技術(shù)控制不同音源中的音頻傳遞時間差,即為不同的音源信號設定同步時間差,由于音源信號傳遞到每個采集器上的時間不同,以及回聲在設備間傳輸延遲問題的存在,在消除回聲的時候?qū)Σ煌纛l源的時間維度做出調(diào)整,即對不同的音頻源信號進行時間差矯正。6.根據(jù)權(quán)利要求2所述的一種使用多維化技術(shù)進行回聲降噪的方法,其特征在于,合成的音頻信號中包括音頻源信號、噪音信號,在不同的空間維度上記錄不同音源的獨立音頻數(shù)據(jù),即將不同頻率或強度范圍的音頻數(shù)據(jù)存儲在不同的數(shù)據(jù)空間之中。7.根據(jù)權(quán)利要求6所述的一種使用多維化技術(shù)進行回聲降噪的方法,其特征在于,與上述合成的音頻信號相對應的,最后導出的音頻數(shù)據(jù)為用戶所指定頻率或強度的音頻數(shù)據(jù),該數(shù)據(jù)同樣為距離主采集器最近的音源數(shù)據(jù)。
【文檔編號】G10L21/0264GK106067301SQ201610357764
【公開日】2016年11月2日
【申請日】2016年5月26日 公開號201610357764.5, CN 106067301 A, CN 106067301A, CN 201610357764, CN-A-106067301, CN106067301 A, CN106067301A, CN201610357764, CN201610357764.5
【發(fā)明人】張家重, 董毅, 李光瑞, 牛玉峰
【申請人】浪潮(蘇州)金融技術(shù)服務有限公司