語音信號處理方法、裝置及服務(wù)器的制造方法
【專利摘要】本發(fā)明公開了一種語音信號處理方法、裝置及服務(wù)器,屬于通信【技術(shù)領(lǐng)域】。所述方法包括:獲取多個通道的原始語音信號,該原始語音信號為數(shù)字語音信號;對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,該第一語音信號的頻率屬于預(yù)設(shè)頻率范圍;對于每一個通道的第一語音信號,獲取該第一語音信號中每段子信號的響度;根據(jù)該第一語音信號中每段子信號的響度以及該多個通道的同一段子信號的響度和,獲取該第一語音信號中每段子信號的第一權(quán)重;按照該多個通道的第一語音信號中每段子信號的第一權(quán)重和該多個通道的第一語音信號,得到處理后的語音信號。本發(fā)明通過信號的權(quán)重對信號進行處理,提高了語音辨識度。
【專利說明】語音信號處理方法、裝置及服務(wù)器
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,特別涉及一種語音信號處理方法、裝置及服務(wù)器。
【背景技術(shù)】
[0002]隨著通信技術(shù)的日益發(fā)展,在即時通訊應(yīng)用中常常會遇到多個用戶同時進行語音通話的情況,而在進行多方語音通信時,需要將多個通道的語音信號進行混音處理。
[0003]在對多個通道的語音信號進行混音處理時,一般直接將多個通道的語音信號進行
簡單疊加。
[0004]在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:
[0005]在對多個通道的語音信號進行直接疊加時,語音信號中所包含的無用信號也被疊加起來,使得疊加后的語音噪聲較大,造成語音信號的辨識度較低,用戶很難從疊加后的語音中進行辨識。
【發(fā)明內(nèi)容】
[0006]為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實施例提供了一種語音信號處理方法、裝置及服務(wù)器。所述技術(shù)方案如下:
[0007]第一方面,提供了一種語音信號處理方法,所述方法包括:
[0008]獲取多個通道的原始語音信號,所述原始語音信號為數(shù)字語音信號;
[0009]對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,所述第一語音信號的頻率屬于預(yù)設(shè)頻率范圍;
[0010]對于每一個通道的第一語音信號,獲取所述第一語音信號中每段子信號的響度;
[0011]根據(jù)所述第一語音信號中每段子信號的響度以及所述多個通道的同一段子信號的響度和,獲取所述第一語音信號中每段子信號的第一權(quán)重;
[0012]按照所述多個通道的第一語音信號中每段子信號的第一權(quán)重和所述多個通道的第一語音信號,得到處理后的語音信號。
[0013]可選地,按照所述多個通道的第一語音信號中每段子信號的第一權(quán)重和所述多個通道的第一語音信號,得到處理后的語音信號包括:
[0014]根據(jù)所述多個通道的第一權(quán)重的最大值,確定指定閾值;
[0015]對于每一個通道的第一語音信號,將第一權(quán)重小于所述指定閾值的子信號的第二權(quán)重設(shè)置為0,根據(jù)所述第一語音信號中每段子信號的響度和所述多個通道的第一語音信號中同一段子信號中除已將第二權(quán)重設(shè)置為O的子信號以外子信號的響度和,獲取所述第一語音信號中第一權(quán)重不小于所述指定閾值的子信號的第二權(quán)重;
[0016]對于每一個通道的第一語音信號,根據(jù)所述第一語音信號中每段子信號的第二權(quán)重,獲取所述第一語音信號中每段子信號的第三權(quán)重;
[0017]對于每一個通道的原始語音信號,根據(jù)所述第一語音信號中每段子信號的第三權(quán)重調(diào)整所述原始語音信號中對應(yīng)的子信號;[0018]將所述多個通道中調(diào)整后的每段子信號對應(yīng)疊加,得到處理后的語音信號。
[0019]可選地,對于每一個通道的原始語音信號,根據(jù)所述第一語音信號中每段子信號的第三權(quán)重調(diào)整所述原始語音信號中對應(yīng)的子信號包括:
[0020]對于每一段子信號,將所述子信號的第三權(quán)重與所述原始語音信號中所述子信號的幅值相乘,得到調(diào)整后的子信號。
[0021]可選地,根據(jù)所述第一語音信號中每段子信號的第二權(quán)重,獲取所述第一語音信號中每段子信號的第三權(quán)重包括:
[0022]對于每一個通道的第一語音信號,根據(jù)所述第一語音信號中每段子信號的第二權(quán)重,對所述第一語音信號中每段子信號的權(quán)重進行平滑處理,得到所述第一語音信號中每段子信號的第三權(quán)重。
[0023]可選地,將所述多個通道中調(diào)整后的每段子信號疊加,得到處理后的語音信號之后,所述方法還包括:
[0024]當(dāng)所述處理后的語音信號的幅值大于預(yù)設(shè)閾值時,對所述處理后的語音信號進行非線性映射,得到輸出語音信號。
[0025]第二方面,提供了一種語音信號處理裝置,所述裝置包括:
[0026]原始語音信號獲取模塊,用于獲取多個通道的原始語音信號,所述原始語音信號為數(shù)字語音信號;
[0027]濾波模塊,用于對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,所述第一語音信號的頻率屬于預(yù)設(shè)頻率范圍;
[0028]響度獲取模塊,用于對于每一個通道的第一語音信號,獲取所述第一語音信號中每段子信號的響度;
[0029]權(quán)重獲取模塊,用于根據(jù)所述第一語音信號中每段子信號的響度以及所述多個通道的同一段子信號的響度和,獲取所述第一語音信號中每段子信號的第一權(quán)重;
[0030]語音信號處理模塊,用于按照所述多個通道的第一語音信號中每段子信號的第一權(quán)重和所述多個通道的第一語音信號,得到處理后的語音信號。
[0031 ] 可選地,所述語音信號處理模塊包括:
[0032]指定閾值確定單元,用于根據(jù)所述多個通道的第一權(quán)重的最大值,確定指定閾值;
[0033]權(quán)重獲取單元,用于對于每一個通道的第一語音信號,將第一權(quán)重小于所述指定閾值的子信號的第二權(quán)重設(shè)置為0,根據(jù)所述第一語音信號中每段子信號的響度和所述多個通道的第一語音信號中同一段子信號中除已將第二權(quán)重設(shè)置為O的子信號以外子信號的響度和,獲取所述第一語音信號中第一權(quán)重不小于所述指定閾值的子信號的第二權(quán)重;
[0034]所述權(quán)重獲取單元還用于對于每一個通道的第一語音信號,根據(jù)所述第一語音信號中每段子信號的第二權(quán)重,獲取所述第一語音信號中每段子信號的第三權(quán)重;
[0035]所述語音信號處理模塊還包括:調(diào)整單元,用于對于每一個通道的原始語音信號,根據(jù)所述第一語音信號中每段子信號的第三權(quán)重調(diào)整所述原始語音信號中對應(yīng)的子信號;
[0036]語音信號處理單元,用于將所述多個通道中調(diào)整后的每段子信號對應(yīng)疊加,得到處理后的語音信號。[0037]可選地,所述調(diào)整單元還用于對于每一段子信號,將所述子信號的第三權(quán)重與所述原始語音信號中所述子信號的幅值相乘,得到調(diào)整后的子信號。
[0038]可選地,所述權(quán)重獲取單元還用于對于每一個通道的第一語音信號,根據(jù)所述第一語音信號中每段子信號的第二權(quán)重,對所述第一語音信號中每段子信號的權(quán)重進行平滑處理,得到所述第一語音信號中每段子信號的第三權(quán)重。
[0039]可選地,所述裝置還包括:
[0040]語音信號輸出模塊,用于當(dāng)所述處理后的語音信號的幅值大于預(yù)設(shè)閾值時,對所述處理后的語音信號進行非線性映射,得到輸出語音信號。
[0041]第三方面,提供了一種服務(wù)器,所述服務(wù)器包括:處理器和存儲器,所述處理器與所述存儲器相連接,
[0042]所述處理器,用于獲取多個通道的原始語音信號,所述原始語音信號為數(shù)字語音信號;
[0043]所述處理器還用于對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,所述第一語音信號的頻率屬于預(yù)設(shè)頻率范圍;
[0044]所述處理器還用于對于每一個通道的第一語音信號,獲取所述第一語音信號中每段子信號的響度;
[0045]所述處理器還用于根據(jù)所述第一語音信號中每段子信號的響度以及所述多個通道的同一段子信號的響度和,獲取所述第一語音信號中每段子信號的第一權(quán)重;
[0046]所述處理器還用于按照所述多個通道的第一語音信號中每段子信號的第一權(quán)重和所述多個通道的第一語音信號,得到處理后的語音信號。
[0047]本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:
[0048]通過對多個通道的數(shù)字語音信號進行濾波,去掉不包含人正常發(fā)聲的語音信號,得到每一個通道的第一語音信號,并根據(jù)該第一語音信號中每段子信號的響度,對該多個通道的第一語音信號進行處理,得到處理后的語音信號,有效的去除了語音信號中響度較低的無用信號,使得處理后的語音噪聲減少,語音信號的辨識度提高,便于從處理后的語音信號中進行辨識。
【專利附圖】
【附圖說明】
[0049]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0050]圖1是本發(fā)明實施例提供的一種語音信號處理方法流程圖;
[0051]圖2是本發(fā)明實施例提供的一種語音信號處理方法流程圖;
[0052]圖3是本發(fā)明實施例提供的一種語音信號處理裝置結(jié)構(gòu)示意圖;
[0053]圖4是本發(fā)明實施例提供的一種服務(wù)器結(jié)構(gòu)示意圖。
【具體實施方式】
[0054]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進一步地詳細描述。
[0055]圖1是本發(fā)明實施例提供的一種語音信號處理方法流程圖。參見圖1,該實施例的執(zhí)行主體為服務(wù)器,該方法包括:
[0056]101、獲取多個通道的原始語音信號,該原始語音信號為數(shù)字語音信號。
[0057]102、對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,該第一語音信號的頻率屬于預(yù)設(shè)頻率范圍。
[0058]103、對于每一個通道的第一語音信號,獲取該第一語音信號中每段子信號的響度。
[0059]104、根據(jù)該第一語音信號中每段子信號的響度以及該多個通道的同一段子信號的響度和,獲取該第一語音信號中每段子信號的第一權(quán)重。
[0060]105、按照該多個通道的第一語音信號中每段子信號的第一權(quán)重和該多個通道的第一語音信號,得到處理后的語音信號。
[0061]本發(fā)明實施例提供的方法,通過對多個通道的數(shù)字語音信號進行濾波,去掉不包含人正常發(fā)聲的語音信號,得到每一個通道的第一語音信號,并根據(jù)該第一語音信號中每段子信號的響度,對該多個通道的第一語音信號進行處理,得到處理后的語音信號,有效的去除了語音信號中響度較低的無用信號,使得處理后的語音噪聲減少,語音信號的辨識度提高,便于從處理后的語音信號中進行辨識。
[0062]圖2是本發(fā)明實施例提供的一種語音信號處理方法流程圖。參見圖2,該實施例的執(zhí)行主體為服務(wù)器,該方法流程包括:
[0063]201、服務(wù)器獲取多個通道的原始語音信號,該原始語音信號為數(shù)字語音信號。
[0064]該服務(wù)器用于對語音信號進行處理,該服務(wù)器可以為即時通信應(yīng)用的服務(wù)器、會議服務(wù)器等。以即時通信應(yīng)用的服務(wù)器為例,當(dāng)用戶通過即時通信應(yīng)用與多個聯(lián)系人進行語音通信,或用戶在即時通信應(yīng)用的群組中進行語音通信時,服務(wù)器在同一時間段內(nèi)可能會接收到多個用戶的語音信號,以每個用戶的語音信號作為一個通道的語音信號,為了輸出語音信號,服務(wù)器需要將多個通道的語音信號進行步驟201?211的疊加過程。
[0065]服務(wù)器接收多個通道發(fā)送的原始語音信號,該原始語音信號的傳輸為一幀一幀進行,也即是原始語音信號中包括多個在時間上連續(xù)的幀,為了便于描述和理解,本發(fā)明實施例的后續(xù)步驟中僅以子信號來代替幀。其中,原始語音信號為數(shù)字語音信號。
[0066]202、服務(wù)器對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,該第一語音信號的頻率屬于預(yù)設(shè)頻率范圍。
[0067]由于該多個通道的數(shù)字語音信號中不僅包含用戶需要的語音信號,還包含大量無用信號,如噪聲等,為了簡化后續(xù)的語音處理過程,需要從該多個通道的原始語音信號中過濾出人正常發(fā)聲的頻率的語音信號。該步驟202具體為:服務(wù)器根據(jù)預(yù)設(shè)頻率范圍,對每一個通道中的數(shù)字信號進行濾波,過濾掉頻率不在預(yù)設(shè)頻率范圍內(nèi)的數(shù)字語音信號,得到處于預(yù)設(shè)頻率范圍內(nèi)的數(shù)字語音信號,服務(wù)器將該處于預(yù)設(shè)頻率范圍內(nèi)的數(shù)字語音信號作為第一語音信號。
[0068]其中,預(yù)設(shè)頻率范圍可以由技術(shù)人員在開發(fā)時設(shè)置,也可以由用戶在使用的過程中調(diào)整,本發(fā)明實施例對此不做限定。該預(yù)設(shè)頻率范圍具體可以為IOOHz?4KHz,也可以為其他頻率范圍。而且,本發(fā)明實施例中是以人正常發(fā)聲時的聲音頻率來確定預(yù)設(shè)頻率范圍,當(dāng)然,還可以是以其他聲音的頻率來確定該預(yù)設(shè)頻率范圍,本發(fā)明實施對如何確定預(yù)設(shè)頻率范圍不做限定。
[0069]203、服務(wù)器對于每一個通道的第一語音信號,獲取該第一語音信號中每段子信號的響度。
[0070]在語音通信過程中,可以根據(jù)響度區(qū)分有用信號和無用信號,用戶的聲音一般要比背景音的響度大,因此,可以通過響度確定信號中需要去除的部分。
[0071]該步驟203具體為:服務(wù)器根據(jù)預(yù)設(shè)響度算法,計算每一個通道的第一語音信號中每段子信號的響度。其中,預(yù)設(shè)響度算法可以有技術(shù)人員在開發(fā)時設(shè)置,也可以在用戶使用的過程中調(diào)整,本發(fā)明實施例對此不做限定。該預(yù)設(shè)響度算法具體可以為Zwicker響度量測模型,當(dāng)然也可以是其它響度算法,本發(fā)明實施例中以適用于人聲的Zwicker響度量測模型為例進行詳細說明。
[0072]204、服務(wù)器根據(jù)該第一語音信號中每段子信號的響度以及該多個通道的同一段子信號的響度和,獲取該第一語音信號中每段子信號的第一權(quán)重。
[0073]子信號的響度在同一段子信號的響度和中所占的比例可以直接影響到該子信號在疊加后的語音信號中的辨識度,因此,可以通過步驟204確定所有通道中每段子信號的
第一權(quán)重。
[0074]具體地,服務(wù)器將該第一語音信號中同一段子信號的響度進行相加,得到該多個通道的同一段子信號的響度和,服務(wù)器將該第一語音信號中每段子信號的響度與該多個通道的同一段子信號的響度和相除,得到該第一語音信號中每段子信號的第一權(quán)重。
[0075]例如,如果接收語音信號的通道數(shù)為2,分別為通道I和通道2,每一個通道的第一語音信號包括3段子信號,分別為子信號1、子信號2和子信號3,且通道I中的子信號I的響度為1、子信號2的響度為3、子信號3的響度為4,通道2中的子信號I的響度為2、子信號2的響度為5、子信號3的響度為7,則兩個通道的第一語音信號的響度和分別為3、8、11,通道I中的子信號I的第一權(quán)重為1/3、子信號2的第一權(quán)重為3/8、子信號3的第一權(quán)重為4/11,通道2中的子信號I的第一權(quán)重為2/3,子信號2的第一權(quán)重為5/8,子信號3的第一權(quán)重為7/11。
[0076]205、服務(wù)器根據(jù)該多個通道的第一權(quán)重的最大值,確定指定閾值。
[0077]為了過濾掉第一權(quán)重較小的子信號,服務(wù)器需要根據(jù)多個通道的第一權(quán)重來確定指定閾值。該步驟205具體為:服務(wù)器通過對比該第一語音信號中每段子信號的第一權(quán)重,得到該多個通道的第一權(quán)重的最大值,根據(jù)人耳聽覺能夠清晰分辨的語音信號權(quán)重、該多個通道的第一權(quán)重的最大值以及通道環(huán)境,確定指定閾值。
[0078]需要說明的是,該指定閾值具體可以為該多個通道的第一權(quán)重的最大值的0.1倍等,當(dāng)然該指定閾值也可以是有其他表示方式,本發(fā)明實施例對此不做限定。
[0079]206、對于每一個通道的第一語音信號,服務(wù)器將第一權(quán)重小于該指定閾值的子信號的第二權(quán)重設(shè)置為0,根據(jù)該第一語音信號中每段子信號的響度和該多個通道的第一語音信號中同一段子信號中除已將第二權(quán)重設(shè)置為O的子信號以外子信號的響度和,獲取該第一語音信號中第一權(quán)重不小于該指定閾值的子信號的第二權(quán)重。
[0080]具體地,服務(wù)器將第一權(quán)重小于指定閾值的子信號的第二權(quán)重設(shè)置為0,并計算多個通道的第一語音信號中同一段子信號除已將第二權(quán)重設(shè)置為O的子信號以外子信號的響度和,服務(wù)器利用第一語音信號中每段子信號的響度與多個通道的第一語音信號中同一段子信號除已將第二權(quán)重設(shè)置為O的子信號以外子信號的響度和相除,得到該第一語音信號中第一權(quán)重不小于該指定閾值的子信號的第二權(quán)重。
[0081]需要說明的是,上述步驟206的過程,也可以是:服務(wù)器將該第一權(quán)重小于指定閾值的子信號的響度設(shè)置為0,根據(jù)該第一語音信號中每段子信號的響度和多個通道的同一段子信號的響度和,獲取該第一語音信號中每段子信號的第二權(quán)重。其中,對于第一權(quán)重小于指定閾值的子信號,由于該子信號的響度為0,因此,第一權(quán)重小于指定閾值的子信號的第二權(quán)重也為O。
[0082]基于步驟204的示例,兩個通道的第一權(quán)重的最大值為2/3,如果指定閾值為
0.35,則服務(wù)器將通道I中的子信號I的第二權(quán)重設(shè)置為0,根據(jù)步驟206,計算通道I中的子信號2、子信號3和通道2中的子信號1、子信號2、子信號3的響度和,并根據(jù)通道I中的子信號2、子信號3和通道2中的子信號1、子信號2、子信號3的響度,獲取通道I中的子信號2、子信號3和通道2中的子信號1、子信號2、子信號3的第二權(quán)重。
[0083]其中,為了簡化響度的計算過程,服務(wù)器在得到第一語音信號中每段子信號的響度后,可以將第一語音信號中每段子信號設(shè)置信號標識,并將每段子信號的信號標識與該段子信號的響度對應(yīng)存儲,當(dāng)服務(wù)器執(zhí)行步驟206的過程時,服務(wù)器獲取該第一語音信號中每段子信號的信號標識,并根據(jù)該段子信號的信號標識從已存儲的響度中得到該段子信號的響度。其中,信號標識可以根據(jù)通道標號和子信號的標號進行表示,基于步驟204的示例,通道I中的子信號2的信號標識可以表示為12,通道2中的子信號3的信號標識可以表示為23等,當(dāng)然,該信號標識還可以通過其他方式表示,本發(fā)明實施例對此不做限定。
[0084]207、對于每一個通道的第一語音信號,服務(wù)器根據(jù)該第一語音信號中每段子信號的第二權(quán)重,獲取該第一語音信號中每段子信號的第三權(quán)重。
[0085]為了均衡子信號的聲音效果,對于一段子信號來說,當(dāng)獲取到該段子信號的第二權(quán)重時,可以通過服務(wù)器中的二階低通濾波模塊對該段子信號的權(quán)重進行處理。該步驟207具體為:對于每一個通道的第一語音信號中第m段子信號,服務(wù)器根據(jù)該第一語音信號中第m段子信號的第二權(quán)重和第m-Ι段子信號的第三權(quán)重,對該第一語音信號中第m段子信號的權(quán)重進行平滑處理,得到該第一語音信號中第m段子信號的第三權(quán)重,該第m段子信號的第三權(quán)重作為該通道中第m+1段子信號的第三權(quán)重初值,并根據(jù)該第一語音信號中第m+1段子信號的第二權(quán)重,對該第m+1段子信號的權(quán)重進行平滑處理,得到該第m+1段子信號的第三權(quán)重。依據(jù)上述過程進行迭代,得到該第一語音信號中每段子信號的第三權(quán)重。其中,平滑處理可以是將較大的權(quán)重和較小的權(quán)重中和,得到一個中間值,該中間值可以通過插值等算法獲取。
[0086]需要說明的是,對于每一個通道的第I段子信號,服務(wù)器根據(jù)該第I段子信號的第二權(quán)重,獲取該第I段子信號的第三權(quán)重的過程可以為:服務(wù)器根據(jù)該第I段子信號的第二權(quán)重和預(yù)設(shè)初值,對該第I段子信號的權(quán)重進行平滑處理,得到該第I段子信號的第三權(quán)重,相應(yīng)地,該第I段子信號的第三權(quán)重作為第2段子信號的第三權(quán)重初值,以此獲取該第2段子信號的第三權(quán)重。該預(yù)設(shè)初值可以由技術(shù)人員在開發(fā)時設(shè)置,也可以由用戶在使用的過程中調(diào)整,本發(fā)明實施例對此不做限定。
[0087]基于步驟204的示例,通道2中的子信號I的第一權(quán)重為2/3,當(dāng)經(jīng)過步驟206后,通道2中的子信號I的第二權(quán)重為I,服務(wù)器中的二階低通濾波模塊的配置參數(shù)可以為0.7和0.3,預(yù)設(shè)初值為0.6,則根據(jù)通道2中的子信號I預(yù)設(shè)初值和該第二權(quán)重對通道2中的子信號I的權(quán)重進行平滑處理,具體可以為該預(yù)設(shè)初值乘以0.7,該第二權(quán)重乘以0.3,并將兩個結(jié)果相加,將得到的結(jié)果作為通道2中的子信號I的第三權(quán)重,該第三權(quán)重為0.72。該通道2中的子信號I的第三權(quán)重0.72作為該通道2中的子信號2的第三權(quán)重初值,服務(wù)器根據(jù)該通道2中的子信號2的第二權(quán)重5/8,計算得到該通道2中的子信號2第三權(quán)重為
0.6915,并將通道2中的子信號2的第三權(quán)重0.6915作為該通道2中的子信號3的第三權(quán)重初值,通過上述過程,得到該通道2中的子信號3的第三權(quán)重。
[0088]當(dāng)然,服務(wù)器對該第一語音信號中每段子信號的權(quán)重進行平滑處理的方式,還可以是除上述方式以外的其它方式,本發(fā)明實施例對服務(wù)器使用何種方式對子信號的權(quán)重進行平滑處理不做限定。
[0089]208、對于每一個通道的原始語音信號,服務(wù)器根據(jù)該第一語音信號中每段子信號的第三權(quán)重調(diào)整該原始語音信號中對應(yīng)的子信號。
[0090]由于原始語音信號中每段子信號為數(shù)字語音信號,對于每一段子信號,將該子信號的第三權(quán)重與該原始語音信號中該子信號的幅值相乘,得到調(diào)整后的子信號。
[0091]其中,幅值可以用于表示原始語音信號的頻率或信號強度,根據(jù)模數(shù)轉(zhuǎn)換時所采用的采樣參數(shù)不同而變化,當(dāng)然,該幅值還可以由其它參數(shù)表示,本發(fā)明實施例對此不做限定。
[0092]如果接收語音信號的通道數(shù)為2,分別為通道I和通道2,每一個通道的第一語音信號包括3段子信號,分別為子信號1、子信號2和子信號3,通道I中的子信號2包含100個數(shù)據(jù),其中第51個數(shù)據(jù)為10,若通道I中的子信號2的第三權(quán)重為0.2,則將通道I中子信號2的第51個數(shù)據(jù)10乘以0.2,得到調(diào)整后的子信號2的第51個數(shù)據(jù)為2。
[0093]209、服務(wù)器將該多個通道中調(diào)整后的每段子信號對應(yīng)疊加,得到處理后的語音信號。
[0094]具體地,服務(wù)器將多個通道中同一時間段接收到的經(jīng)過權(quán)重調(diào)整的原始語音信號進行疊加,也即是同一時間段中多個通道的每段子信號根據(jù)接收時間對應(yīng)疊加,得到處理后的語音信號。
[0095]當(dāng)該處理后的語音信號的幅值超過了數(shù)字域所能表征的幅值時,服務(wù)器需要對該處理后的語音信號進行進一步處理,防止該處理后的語音中出現(xiàn)破音的現(xiàn)象,則服務(wù)器還可以執(zhí)行如下步驟210:
[0096]210、當(dāng)該處理后的語音信號的幅值大于預(yù)設(shè)閾值時,服務(wù)器對該處理后的語音信號進行非線性映射,得到輸出語音信號。
[0097]具體地,服務(wù)器根據(jù)處理后的語音信號的幅值,確定該處理后的語音信號的幅值是否大于預(yù)設(shè)閾值,當(dāng)該處理后的語音信號的幅值大于預(yù)設(shè)閾值時,服務(wù)器將該處理后的語音信號的幅值大于預(yù)設(shè)閾值的語音信號映射到指定范圍內(nèi),使得輸出語音信號的最大幅值不會超出數(shù)字域所能表征的范圍。
[0098]例如,數(shù)字域的16比特能表示的范圍是-32768?32767,如果預(yù)設(shè)閾值為27000,處理后的語音信號的幅值范圍為-40000?40000,服務(wù)器需要將幅值范圍在-40000?-27000及27000?40000的語音信號進行非線性映射,服務(wù)器將語音信號根據(jù)預(yù)設(shè)規(guī)則映射到指定區(qū)域-32768?32767內(nèi)。其中,預(yù)設(shè)規(guī)則可以是某一個函數(shù),也可以是其它方法,本發(fā)明實施例對此不做限定。
[0099]其中,該預(yù)設(shè)閾值沒有處于數(shù)字域能表征的范圍內(nèi),該預(yù)設(shè)閾值可以由技術(shù)人員在開發(fā)時設(shè)置,也可以由用戶在使用的過程中調(diào)整,本發(fā)明實施例對此不做限定。
[0100]本發(fā)明實施例是以執(zhí)行主體為服務(wù)器為例進行說明,當(dāng)然,該過程還可以在終端設(shè)備上執(zhí)行。
[0101]本發(fā)明實施例提供的方法,通過對多個通道的數(shù)字語音信號進行濾波,去掉不包含人正常發(fā)聲的語音信號,得到每一個通道的第一語音信號,并根據(jù)該第一語音信號中每段子信號的響度,對該多個通道的第一語音信號進行處理,得到處理后的語音信號,有效的去除了語音信號中響度較低的無用信號,使得處理后的語音噪聲減少,語音信號的辨識度提高,便于從處理后的語音信號中進行辨識。進一步地,通過計算每段子信號的第二權(quán)重,并根據(jù)每段子信號的第二權(quán)重,得到每段子信號的第三權(quán)重,從而根據(jù)該第三權(quán)重對語音信號進行疊加,大大降低了處理后語音信號中所包含的噪音信號,語音信號的辨識度大大提高,而且對處理后的語音信號進行非線性處理,防止了輸出語音出現(xiàn)破音現(xiàn)象。
[0102]圖3是本發(fā)明實施例提供的一種語音信號處理裝置結(jié)構(gòu)示意圖。參見圖3,該裝置包括:原始語音信號獲取模塊301、濾波模塊302、響度獲取模塊303、權(quán)重獲取模塊304和語音信號處理模塊305。其中,原始語音信號獲取模塊301,用于獲取多個通道的原始語音信號,該原始語音信號為數(shù)字語音信號;模數(shù)轉(zhuǎn)換模塊301與濾波模塊302相連接,該濾波模塊302,用于對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,該第一語音信號的頻率屬于預(yù)設(shè)頻率范圍;濾波模塊302與響度獲取模塊303相連接,該響度獲取模塊303,用于對于每一個通道的第一語音信號,獲取該第一語音信號中每段子信號的響度;響度獲取模塊303與權(quán)重獲取模塊304相連接,該權(quán)重獲取模塊304,用于根據(jù)該第一語音信號中每段子信號的響度以及該多個通道的同一段子信號的響度和,獲取該第一語音信號中每段子信號的第一權(quán)重;權(quán)重獲取模塊304與語音信號處理模塊305相連接,該語音信號處理模塊305,用于按照該多個通道的第一語音信號中每段子信號的第一權(quán)重和該多個通道的第一語音信號,得到處理后的語音信號。
[0103]可選地,該語音信號處理模塊305包括:
[0104]指定閾值確定單元,用于根據(jù)該多個通道的第一權(quán)重的最大值,確定指定閾值;
[0105]權(quán)重獲取單元,用于對于每一個通道的第一語音信號,將第一權(quán)重小于該指定閾值的子信號的第二權(quán)重設(shè)置為0,根據(jù)該第一語音信號中每段子信號的響度和該多個通道的第一語音信號中同一段子信號中除已將第二權(quán)重設(shè)置為O的子信號以外子信號的響度和,獲取該第一語音信號中第一權(quán)重不小于該指定閾值的子信號的第二權(quán)重;
[0106]該權(quán)重獲取單元還用于對于每一個通道的第一語音信號,根據(jù)該第一語音信號中每段子信號的第二權(quán)重,獲取該第一語音信號中每段子信號的第三權(quán)重;
[0107]該語音信號處理模塊還包括:調(diào)整單元,用于對于每一個通道的原始語音信號,根據(jù)該第一語音信號中每段子信號的第三權(quán)重調(diào)整該原始語音信號中對應(yīng)的子信號;
[0108]語音信號處理單元,用于將該多個通道中調(diào)整后的每段子信號對應(yīng)疊加,得到處理后的語音信號。
[0109]可選地,該調(diào)整單元還用于對于每一段子信號,將該子信號的第三權(quán)重與該原始語音信號中該子信號的幅值相乘,得到調(diào)整后的子信號。
[0110]可選地,該權(quán)重獲取單元還用于對于每一個通道的第一語音信號,根據(jù)該第一語音信號中每段子信號的第二權(quán)重,對該第一語音信號中每段子信號的權(quán)重進行平滑處理,得到該第一語音信號中每段子信號的第三權(quán)重。
[0111]可選地,該裝置還包括:
[0112]語音信號輸出模塊,用于當(dāng)該處理后的語音信號的幅值大于預(yù)設(shè)閾值時,對該處理后的語音信號進行非線性映射,得到輸出語音信號。
[0113]綜上所述,本發(fā)明實施例提供的裝置,通過對多個通道的數(shù)字語音信號進行濾波,去掉不包含人正常發(fā)聲的語音信號,得到每一個通道的第一語音信號,并根據(jù)該第一語音信號中每段子信號的響度,對該多個通道的第一語音信號進行處理,得到處理后的語音信號,有效的去除了語音信號中響度較低的無用信號,使得處理后的語音噪聲減少,語音信號的辨識度提高,便于從處理后的語音信號中進行辨識。
[0114]需要說明的是:上述實施例提供的語音信號處理裝置在對語音信號處理時,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將服務(wù)器的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的語音信號處理裝置與語音信號處理方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。
[0115]圖4是本發(fā)明實施例提供的一種服務(wù)器結(jié)構(gòu)示意圖。參見圖4,該服務(wù)器包括:處理器401和存儲器402,該處理器401與該存儲器402相連接,
[0116]該處理器401,用于獲取多個通道的原始語音信號,該原始語音信號為數(shù)字語音信號;
[0117]該處理器401還用于對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,該第一語音信號的頻率屬于預(yù)設(shè)頻率范圍;
[0118]該處理器401還用于對于每一個通道的第一語音信號,獲取該第一語音信號中每段子信號的響度;
[0119]該處理器401還用于根據(jù)該第一語音信號中每段子信號的響度以及該多個通道的同一段子信號的響度和,獲取該第一語音信號中每段子信號的第一權(quán)重;
[0120]該處理器401還用于按照該多個通道的第一語音信號中每段子信號的第一權(quán)重和該多個通道的第一語音信號,得到處理后的語音信號。
[0121]可選地,該處理器401還用于按照該多個通道的第一語音信號指定閾值確定單元,用于根據(jù)該多個通道的第一權(quán)重的最大值,確定指定閾值;對于每一個通道的第一語音信號,將第一權(quán)重小于該指定閾值的子信號的第二權(quán)重設(shè)置為0,根據(jù)該第一語音信號中每段子信號的響度和該多個通道的第一語音信號中同一段子信號中除已將第二權(quán)重設(shè)置為O的子信號以外子信號的響度和,獲取該第一語音信號中第一權(quán)重不小于該指定閾值的子信號的第二權(quán)重;對于每一個通道的第一語音信號,根據(jù)該第一語音信號中每段子信號的第二權(quán)重,獲取該第一語音信號中每段子信號的第三權(quán)重;對于每一個通道的原始語音信號,根據(jù)該第一語音信號中每段子信號的第三權(quán)重調(diào)整該原始語音信號中對應(yīng)的子信號;將該多個通道中調(diào)整后的每段子信號對應(yīng)疊加,得到處理后的語音信號。
[0122]可選地,該處理器401還用于對于每一段子信號,將該子信號的第三權(quán)重與該原始語音信號中該子信號的幅值相乘,得到調(diào)整后的子信號。
[0123]可選地,該處理器401還用于對于每一個通道的第一語音信號,根據(jù)該第一語音信號中每段子信號的第二權(quán)重,對該第一語音信號中每段子信號的權(quán)重進行平滑處理,得到該第一語音信號中每段子信號的第三權(quán)重。
[0124]可選地,該處理器401還用于當(dāng)該處理后的語音信號的幅值大于預(yù)設(shè)閾值時,對該處理后的語音信號進行非線性映射,得到輸出語音信號。
[0125]本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
[0126]以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種語音信號處理方法,其特征在于,所述方法包括: 獲取多個通道的原始語音信號,所述原始語音信號為數(shù)字語音信號; 對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,所述第一語音信號的頻率屬于預(yù)設(shè)頻率范圍; 對于每一個通道的第一語音信號,獲取所述第一語音信號中每段子信號的響度;根據(jù)所述第一語音信號中每段子信號的響度以及所述多個通道的同一段子信號的響度和,獲取所述第一語音信號中每段子信號的第一權(quán)重; 按照所述多個通道的第一語音信號中每段子信號的第一權(quán)重和所述多個通道的第一語音信號,得到處理后的語音信號。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,按照所述多個通道的第一語音信號中每段子信號的第一權(quán)重和所述多個通道的第一語音信號,得到處理后的語音信號包括: 根據(jù)所述多個通道的第一權(quán)重的最大值,確定指定閾值; 對于每一個通道的第一語音信號,將第一權(quán)重小于所述指定閾值的子信號的第二權(quán)重設(shè)置為O,根據(jù)所述第一語音信號中每段子信號的響度和所述多個通道的第一語音信號中同一段子信號中除已將第二權(quán)重設(shè)置為O的子信號以外子信號的響度和,獲取所述第一語音信號中第一權(quán)重不小于所述指定閾值的子信號的第二權(quán)重; 對于每一個通道的第一語音信號,根據(jù)所述第一語音信號中每段子信號的第二權(quán)重,獲取所述第一語音信號中每段子信號的第三權(quán)重; 對于每一個通道的原始語音信號,根據(jù)所述第一語音信號中每段子信號的第三權(quán)重調(diào)整所述原始語音信號中對應(yīng)的子信號; 將所述多個通道中調(diào)整后的每段子信號對應(yīng)疊加,得到處理后的語音信號。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,對于每一個通道的原始語音信號,根據(jù)所述第一語音信號中每段子信號的第三權(quán)重調(diào)整所述原始語音信號中對應(yīng)的子信號包括: 對于每一段子信號,將所述子信號的第三權(quán)重與所述原始語音信號中所述子信號的幅值相乘,得到調(diào)整后的子信號。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述第一語音信號中每段子信號的第二權(quán)重,獲取所述第一語音信號中每段子信號的第三權(quán)重包括: 對于每一個通道的第一語音信號,根據(jù)所述第一語音信號中每段子信號的第二權(quán)重,對所述第一語音信號中每段子信號的權(quán)重進行平滑處理,得到所述第一語音信號中每段子號的第二權(quán)重。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,將所述多個通道中調(diào)整后的每段子信號疊加,得到處理后的語音信號之后,所述方法還包括: 當(dāng)所述處理后的語音信號的幅值大于預(yù)設(shè)閾值時,對所述處理后的語音信號進行非線性映射,得到輸出語音信號。
6.一種語音信號處理裝置,其特征在于,所述裝置包括: 原始語音信號獲取模塊,用于獲取多個通道的原始語音信號,所述原始語音信號為數(shù)字語音信號; 濾波模塊,用于對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,所述第一語音信號的頻率屬于預(yù)設(shè)頻率范圍;響度獲取模塊,用于對于每一個通道的第一語音信號,獲取所述第一語音信號中每段子信號的響度; 權(quán)重獲取模塊,用于根據(jù)所述第一語音信號中每段子信號的響度以及所述多個通道的同一段子信號的響度和,獲取所述第一語音信號中每段子信號的第一權(quán)重; 語音信號處理模塊,用于按照所述多個通道的第一語音信號中每段子信號的第一權(quán)重和所述多個通道的第一語音信號,得到處理后的語音信號。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述語音信號處理模塊包括: 指定閾值確定單元,用于根據(jù)所述多個通道的第一權(quán)重的最大值,確定指定閾值; 權(quán)重獲取單元,用于對于每一個通道的第一語音信號,將第一權(quán)重小于所述指定閾值的子信號的第二權(quán)重設(shè)置為O,根據(jù)所述第一語音信號中每段子信號的響度和所述多個通道的第一語音信號中同一段子信號中除已將第二權(quán)重設(shè)置為O的子信號以外子信號的響度和,獲取所述第一語音信號中第一權(quán)重不小于所述指定閾值的子信號的第二權(quán)重; 所述權(quán)重獲取單元還用于對于每一個通道的第一語音信號,根據(jù)所述第一語音信號中每段子信號的第二權(quán)重,獲取所述第一語音信號中每段子信號的第三權(quán)重; 所述語音信號處理模塊還包括:調(diào)整單元,用于對于每一個通道的原始語音信號,根據(jù)所述第一語音信號中每段子信號的第三權(quán)重調(diào)整所述原始語音信號中對應(yīng)的子信號; 語音信號處理單元,用于將所述多個通道中調(diào)整后的每段子信號對應(yīng)疊加,得到處理后的語音信號。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述調(diào)整單元還用于對于每一段子信號,將所述子信號的第三權(quán)重與`所述原始語音信號中所述子信號的幅值相乘,得到調(diào)整后的子信號。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述權(quán)重獲取單元還用于對于每一個通道的第一語音信號,根據(jù)所述第一語音信號中每段子信號的第二權(quán)重,對所述第一語音信號中每段子信號的權(quán)重進行平滑處理,得到所述第一語音信號中每段子信號的第三權(quán)重。
10.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述裝置還包括: 語音信號輸出模塊,用于當(dāng)所述處理后的語音信號的幅值大于預(yù)設(shè)閾值時,對所述處理后的語音信號進行非線性映射,得到輸出語音信號。
11.一種服務(wù)器,其特征在于,所述服務(wù)器包括:處理器和存儲器,所述處理器與所述存儲器相連接, 所述處理器,用于獲取多個通道的原始語音信號,所述原始語音信號為數(shù)字語音信號; 所述處理器還用于對每一個通道的原始語音信號進行濾波,得到每一個通道的第一語音信號,所述第一語音信號的頻率屬于預(yù)設(shè)頻率范圍; 所述處理器還用于對于每一個通道的第一語音信號,獲取所述第一語音信號中每段子信號的響度; 所述處理器還用于根據(jù)所述第一語音信號中每段子信號的響度以及所述多個通道的同一段子信號的響度和,獲取所述第一語音信號中每段子信號的第一權(quán)重; 所述處理器還用于按照所述多個通道的第一語音信號中每段子信號的第一權(quán)重和所述多個通道的第一語音信號,得到處理后的語音信號。
【文檔編號】G10L21/0208GK103680513SQ201310681217
【公開日】2014年3月26日 申請日期:2013年12月13日 優(yōu)先權(quán)日:2013年12月13日
【發(fā)明者】馬躍, 胡建強, 張帆, 劉麗, 成家雄, 宋思超 申請人:廣州華多網(wǎng)絡(luò)科技有限公司