在免提通信中的重噪聲條件下改善話音質量的制作方法

文檔序號：10577548閱讀：255來源：國知局

在免提通信中的重噪聲條件下改善話音質量的制作方法
【專利摘要】本發(fā)明涉及在免提通信中的重噪聲條件下改善話音質量。當由話音和噪聲兩者組成的語音信號中的噪聲被抑制時，語音信號中的話音質量通常退化。通過確定不進行噪聲抑制或者噪聲抑制前的語音信號的線性預測編碼(LPC)特性，以及通過確定噪聲抑制后的語音的LPC特性，改善從噪聲抑制后的語音信號得到的話音。那些不同特性的卷積提供改善質量后的話音信號，該話音信號具有被消減或被抑制的原始噪聲水平。
【專利說明】
在免提通信中的重噪聲條件下改善話音質量
【背景技術】
[0001]機動車輛或汽車中的揚聲器所產(chǎn)生的話音清晰度和在這種環(huán)境中由麥克風所檢測的話音清晰度被陪伴移動車輛的幾個噪聲源削減，噪聲源的例子包括馬路噪聲、風噪和發(fā)動機噪聲。盡管已有現(xiàn)有技術的估計和減少話音中噪聲的噪聲抑制算法，它們還易于抑制至少一些話音，并且因此使其逼真度退化。更特別地，現(xiàn)有技術的噪聲抑制技術降低了從其形成話音的元音、輔音和其他聲音的識別特征的可聽性。一種用于在伴隨話音的噪聲被抑制之后改善或恢復聲音或話音逼真度或話音質量的方法和裝置將會是對現(xiàn)有技術的改進。
【附圖說明】
[0002]圖1是提供有“免提”語音系統(tǒng)的機動車輛內(nèi)部的側視圖；
[0003]圖2是用于改善從包括話音和噪聲兩者的語音信號中獲取的話音質量的裝置框圖；
[0004]圖3描繪了用于改善由話音和噪聲兩者構成的語音信號中的話音質量的方法步驟和裝置兩者。
[0005]圖4是用于改善包含話音和噪聲的語音信號中的話音質量的裝置和方法兩者的可替換實施例。
【具體實施方式】
[0006]如在此使用的，“話音質量”是指聲音(例如元音聲音和/或輔音聲音)的識別特性，該識別特性主要由產(chǎn)生它們的聲室的諧振而確定。當識別出元音和輔音特性是清晰可聽到的(即被聽到或能夠被聽到)，則話音質量被認為是良好的。當這些相同特性變得不可聽(即不可聽到或它們的可聽性降低)時，則話音質量被認為是拙劣的。當元音、輔音或其他聲音的識別特性被改善或成為更可聽時，則話音質量被改善。
[0007]可通過抑制易于模糊識別特性的噪聲來改善話音的可聽性。然而，模糊噪聲典型地模糊了聲音的至少一些識別特性。換種方式說，模糊噪聲易于使話音質量退化。在抑制噪聲之后恢復元音聲音和輔音聲音的識別特性改善話音質量。
[0008]圖1描繪了機動車輛100，其乘客艙102或“內(nèi)部”被提供有麥克風104和揚聲器106。麥克風104和揚聲器106共同親合到傳統(tǒng)蜂窩電話108。麥克風104和揚聲器106組成蜂窩電話108的“免提”語音系統(tǒng)的一部分。
[0009]麥克風104被繪制為安裝到后視鏡110上，但是它可位于車輛100的任何地方，只要其能夠檢測來自駕駛員或其他使用者的語音信號。安放麥克風以使其能夠檢測來自基本上車輛100任何地方的車輛使用者的話音112，但是，這導致乘客艙102內(nèi)的背景噪聲114被檢測到。
[0010]如在此使用的，背景噪聲至少包括風噪、道路噪聲和發(fā)動機噪聲。依靠麥克風104的位置，它將聲波轉換成包含話音和背景噪聲兩者的音頻電信號。該電信號從麥克風104輸出由此表示了話音和噪聲。
[0011]現(xiàn)參見揚聲器106，它將來自蜂窩電話108的電信號116轉換成可聽到的聲波118。來自揚聲器的聲波118被投射到車輛110內(nèi)部102，其中它們與前述的背景噪聲114 “混合”。
[0012]機動車輛中的背景噪聲114基本上不可能防止或消除。因此在背景噪聲114被麥克風104拾取之后但在其到達由蜂窩電話108所提供的連接的遠端之前，抑制背景噪聲114是重要的。
[0013]圖2是用于在汽車環(huán)境中抑制背景噪聲并用于在背景噪聲被抑制之后改善話音質量的裝置200的框圖。該裝置200包括耦合到非暫時性存儲設備212的傳統(tǒng)處理器202，該存儲設備存儲處理器202的可執(zhí)行指令。
[0014]處理器從傳統(tǒng)麥克風206接收時域語音信號204，該麥克風的例子包括免提語音系統(tǒng)的麥克風部分。該麥克風206位于機動車輛的乘客艙內(nèi)部，該乘客艙例如是圖1所示的乘客艙102。
[0015]除了從麥克風206接收信號之外，處理器202還將時域音頻信號210提供或“輸出”到傳統(tǒng)揚聲器208，清晰的語音能夠由機動車輛使用者從該揚聲器收聽到。模擬或時域的語音信號210是由處理器202響應于程序指令從頻域信號生成的，該程序指令由處理器202執(zhí)行并且促使處理器202處理從傳統(tǒng)蜂窩電話216接收到的語音信號214。那些指令存儲在經(jīng)由傳統(tǒng)總線215耦合到處理器202的非暫時性存儲設備212中，該總線被熟知為計算機系統(tǒng)中的一系列電氣并聯(lián)的導體，并構成計算機系統(tǒng)的主要傳輸路徑。
[0016]處理器202以及其從存儲器212獲取并執(zhí)行的指令本質上用作為麥克風206和蜂窩電話216之間的接口，該電話也經(jīng)由同一總線215耦合到處理器。處理器202及其執(zhí)行的程序指令由此提供了從麥克風206接收語音信號、處理那些信號以抑制噪聲并產(chǎn)生“噪聲削減后的”語音信號、重新處理噪聲削減后的語音信號以產(chǎn)生改善質量的話音，以及向蜂窩電話216提供改善質量后的話音的電子機制。蜂窩電話216將改善質量的話音調制到射頻信號上。
[0017]現(xiàn)在參考圖3，如其所繪制的，它描繪了用于在語音信號中的噪聲被抑制之后改善語音信號中的話音質量的電氣組件和方法步驟兩者，該語音信號例如是來自圖1和2所示麥克風并且包括話音和噪聲兩者的語音信號。圖3中，該裝置包括接收語音信號304的麥克風302。該語音信號304包括話音和背景噪聲兩者。該背景噪聲不是白噪聲，而是風噪、道路噪聲和發(fā)動機噪聲中的一個或多個。
[0018]從麥克風306輸出的時域語音信號306被提供至傳統(tǒng)快速傅里葉變換(FFT)計算器308，該計算器308的輸出信號310是一串系數(shù)，該系數(shù)中的每個表示語音信號306的采樣的頻率分量。來自FFT計算器的輸出信號310被提供至噪聲抑制器312，該噪聲抑制器處理FFT計算器的頻域輸出310以提供噪聲削減后的輸出語音信號314，該信號仍舊是頻域的。噪聲抑制器312的輸出314被提供至逆快速傅里葉變換(IFFT)轉換器316JFFT 316的輸出318是從麥克風302所接收的語音信號306的時域表述，但是帶有削減的噪聲以及退化的話音質量。輸出318因此是由麥克風302所接收的語音信號304的話音分量的經(jīng)噪聲削減后的但是輕微失真的版本或復制品。
[0019]執(zhí)行快速傅里葉變換、使用FFT抑制語音信號306的頻域表示中的噪聲以及通過逆傅里葉變換316將噪聲抑制后的信號轉換回時域的元件和處理在
【申請人】的申請?zhí)枮?3/012，062、命名為“用于模糊風噪的方法和裝置”、申請日為2011年I月24日的共同未決專利申請中公開，該專利申請的內(nèi)容以其整體通過引用并入本文。還參見
【申請人】的申請?zhí)枮?4/074,495、申請日為2013年11月7日、命名為“改善基于Log-MMSE的噪聲抑制性能的話音概率存在修正器”、代理案號為2013P03107US的共同未決專利申請，該專利申請的內(nèi)容同樣以其整體并入本文，以及參見申請?zhí)枮?4/074,423、申請日為2013年11月7日、命名為“基于MMSE話音概率存在的準確正向SNR估計”、代理案號為2013P03103US的申請，該申請的內(nèi)容同樣以其整體并入本文。
[0020]線性預測編碼或“LPC”是熟知的。它開始于假設話音信號由管末端處的蜂鳴器產(chǎn)生，帶有不定期性添加的雜音和爆音(已知為喔音和爆破聲)。聲帶裙(vocal fold)之間暫時的間隙產(chǎn)生蜂音，該蜂音以強度或響度以及頻率或音高為特征。聲道(嗓子和嘴)構成管，它以其諧振為特征，引起頻帶處于所產(chǎn)生的聲音中的“共振峰(formant)”。雜音和爆音由舌頭、嘴唇和嗓子在咝音和爆破聲過程中的動作產(chǎn)生。
[0021]LPC通過估計共振峰，將它們的影響從話音信號中去除，以及估計剩下的蜂音的強度和頻率來分析話音信號。除去共振峰的過程稱之為反向濾波，并且已濾除模式信號的減法后的剩余信號稱之為殘余(residue)。描述蜂音、共振峰和殘余信號的強度和頻率的數(shù)字可被存儲或發(fā)送到別的地方。話音可通過反向處理進行合成:使用蜂音參數(shù)和殘余以產(chǎn)生源信號，使用共振峰創(chuàng)建表示管的濾波器，并且運行源通過濾波器，產(chǎn)生話音。
[0022]由于話音信號隨時間變化，LPC編碼和話音合成的過程在稱之為幀的話音信號的短片上完成。它們通常大于50幀每秒，并且在這樣的速率下它們可產(chǎn)生清晰話音。
[0023]仍舊參見圖3，線性預測編碼(LPC)是由線性預測編碼估計器320對從逆快速傅里葉變換轉換器316輸出的噪聲抑制后的語音信號318執(zhí)行。LPC估計器步驟320得到的“LPC”系數(shù)或線性預測編碼包括誤差信號322。
[0024]再次參考麥克風302，其輸出信號306通過延遲線或緩沖器324被提供至LPC分析器326IPC分析器326從原始輸入信號306(即由麥克風302所“收聽”的話音和背景噪聲)產(chǎn)生線性預測編碼系數(shù)，并且將幾個(至少十個)LPC系數(shù)328輸出到LPC合成器33(LLPC系數(shù)本質上表示原始語音信號304，即從誤差信號322中抑制的背景噪聲和話音。
[0025]延遲線324確保產(chǎn)生從LPC分析器326輸出的LPC系數(shù)328所需的時間是與由LPC估計器320所提供的LPC系數(shù)同步的時間。由于以下事實:由附圖標記308-316所標識的步驟和結構在表不從麥克風302輸出的時域信號306的數(shù)據(jù)的不連續(xù)幀上執(zhí)行(典型地大約五十幀每秒)，延遲線324由此執(zhí)行幀同步。
[0026]在LPC合成器330中使用傳統(tǒng)現(xiàn)有技術的卷積將從LPC分析器326輸出的系數(shù)328“應用于”誤差信號322。使用了系數(shù)328的誤差信號322的LPC合成產(chǎn)生時域信號332，該時域信號作為對蜂窩電話334的輸入被提供。蜂窩電話332將改善質量的話音信號332調制到載波上以用于發(fā)送到接收器。
[0027]已發(fā)現(xiàn)從由原始輸入信號306得到的LPC系數(shù)以及從噪聲或部分噪聲抑制后的信號322得到的LPC系數(shù)所重構的話音具有超出并且高于從逆快速傅里葉變換轉換器316由其自身輸出的話音的改善的或較高的音質。增加了元音、輔音和其他話音聲音的各種識別特性的可聽性。
[0028]圖4示出圖3中所示裝置和方法的稍微修改的、但盡管如此是可替換的實施例。在圖4中，圖3所示的麥克風302使其輸出信號306被提供至附加的FFT計算器308。從FFT計算器308輸出的頻域信號310是表示由麥克風接收的語音信號中的話音和噪聲的頻率分量的系數(shù)。那些系數(shù)被提供至第一部分噪聲抑制器402。第一噪聲抑制器402的輸出是頻域信號404，其噪聲水平至少部分地被抑制以至少部分地改善由麥克風302所接收的語音信號304的話音質量。第二噪聲抑制器312、逆快速傅里葉變換轉換器314和LPC系數(shù)估計器316在以上描述并繪制在圖3中。因此為了簡潔省略對它們的進一步說明。
[0029]與圖3所示的電路不同，從第一噪聲抑制器402輸出的頻域信號在被提供至第二逆快速傅里葉變換轉換器408之前被提供至延遲線406。從第二逆快速傅里葉變換轉換器408輸出的時域信號410被提供至以上描述并且在圖3中所示的LPC分析器326。
[0030]從LPC分析器306輸出的LPC系數(shù)328被提供至以上描述并且在圖3中繪制的LPC合成器，該合成器的輸出是被提供至蜂窩電話334作為語音輸入調制信號的改善質量后的話音信號412。
[0031]與圖3所示實施例類似，已發(fā)現(xiàn)使用從部分處理過的話音404和誤差信號322獲取的LPC系數(shù)、由包含話音和噪聲的語音信號304重構話音生成話音信號，其質量或逼真度優(yōu)于簡單地從語音信號的噪聲抑制后的版本所得到的。增加了元音、輔音和其他聲音的識別特征的可聽性。
[0032]電氣領域普通技術人員知曉處理器所執(zhí)行的功能和操作也可使用數(shù)字邏輯門和時序邏輯設備來實施。然而，改變或修改處理器的操作比改變硬件連接的電路造價低得多。
[0033]再次參見圖2，處理器202可以是通用微處理器、微控制器或數(shù)字信號處理器。它被繪制為經(jīng)由總線215耦合到非暫時性存儲設備212。處理器202執(zhí)行存儲設備212中存儲的程序指令。那些指令促使處理器202執(zhí)行以上描述的操作。更具體地，處理器202在許多微處理器、微控制器和數(shù)字信號處理器上常見的模擬輸入端口處接收包含話音和噪聲的時域語音信號204。
[0034]所存儲的程序指令促使處理器計算到來的語音信號204的FFT，使用前述的噪聲抑制技術在頻域中抑制噪聲，估計LPC系數(shù)用于噪聲抑制后的信號和產(chǎn)生從麥克風206接收的“干凈的”語音信號204。“干凈的”輸出信號由圖3中的附圖標記318所標識的輸出信號表示。
[0035]卷積是公知的處理。存儲設備212中存儲的指令促使處理器202對已濾波的語音和未濾波或“干凈的”語音“卷積”該LPC系數(shù)，其結果就是原始話音的重構而無噪聲抑制引起的偽像或失真。處理器202以及存儲設備212中存儲的指令由此包括:噪聲抑制器、自身包括LPC估計器的線性預測編碼(LPC)分析器以及誤差信號生成器。改善質量后的話音210被提供至揚聲器或其他形式的語音信號換能器，該換能器從語音頻率電信號生成可聽聲波。
[0036]在優(yōu)選實施例中，來自麥克風206的語音信號214以及發(fā)送到揚聲器208的語音信號經(jīng)過處理器202，并在處理器202和傳統(tǒng)蜂窩電話216之間交換。
[0037]在前的描述僅僅出于說明的目的。本發(fā)明的真實范圍在隨后的權利要求中被闡述。
【主權項】
1.一種在語音信號中的噪聲被抑制之后改善包含話音和噪聲的語音信號中的話音質量的方法，該方法包括: 接收包含話音和噪聲的第一語音信號；確定第一語音信號的特性并產(chǎn)生所述第一語音信號的線性預測編碼(LPC)表示；向噪聲抑制器提供第一語音信號，該噪聲抑制器被配置成抑制第一語音信號中的至少一些噪聲并且由此產(chǎn)生噪聲削減后的語音信號；使用線性預測編碼(LPC)估計方法從噪聲削減后的語音信號生成誤差信號，該誤差信號包括第一語音信號中的至少一些噪聲被去除之后的第一語音信號中的話音；將該誤差信號應用到第一語音信號的LPC表示以合成第二語音信號，該第二語音信號具有削減后的失真話音并且話音質量優(yōu)于第一語音信號中的話音；以及將該第二語音信號提供至被配置成從第二語音信號生成可聽聲波的語音信號換能器。2.如權利要求1的方法，其中將誤差信號應用到LPC的步驟導致元音、輔音和其他聲音的識別特性的可聽性增加。3.如權利要求1的方法，其中接收包含話音和噪聲的第一語音信號的時域表示的步驟發(fā)生在機動車輛中，并且其中將第二語音信號提供至語音信號換能器的步驟發(fā)生在所述車輛中。4.如權利要求1的方法，其中確定第一語音信號特性的步驟包括確定第一語音信號中的話音共振峰并產(chǎn)生話音共振峰的LPC表示。5.如權利要求1的方法，其中生成誤差信號的步驟包括接收第一語音信號的噪聲削減后的失真版本的時域表不。6.如權利要求1的方法，其中將誤差信號應用到第一語音信號的LPC表示的步驟包括由第一語音信號對誤差信號進行卷積。7.—種在抑制語音信號中的噪聲之后改善語音信號中的話音質量的方法，該方法包括: 接收包含話音和噪聲的第一語音信號，該第一語音信號由數(shù)字數(shù)據(jù)幀來表示；對第一語音信號執(zhí)行第一部分噪聲抑制用于提供第一部分噪聲削減后的語音信號；對第一部分噪聲削減后的語音信號執(zhí)行第二部分噪聲抑制以提供第二噪聲削減后的語音信號；確定第一部分噪聲削減后的語音信號的線性預測編碼(LPC)表示；從第二噪聲削減后的語音信號生成誤差信號；將該誤差信號應用到第一部分噪聲削減后的語音信號的LPC表示，以從第一語音信號合成改善質量后的話音信號；接收包含話音和噪聲的第一語音信號，該第一語音信號由數(shù)字數(shù)據(jù)幀來表示；對第一語音信號執(zhí)行第一部分噪聲抑制用于提供第一部分噪聲削減后的語音信號；對第一部分噪聲削減后的語音信號執(zhí)行第二部分噪聲抑制以提供第二噪聲削減后的語音信號；確定第一部分噪聲削減后的語音信號的線性預測編碼(LPC)表示；從第二噪聲削減后的語音信號生成誤差信號；將該誤差信號應用到第一部分噪聲削減后的語音信號的LPC表示，以從第一語音信號合成改善質量后的話音信號；以及將該改善質量后的話音信號提供至語音信號換能器，該語音信號換能器被配置成從時域改善質量后的語音信號產(chǎn)生可聽聲波。8.如權利要求7的方法，其中將誤差信號應用到LPC表示的步驟包括由LPC表示對誤差信號進行卷積。9.如權利要求7的方法，其中接收第一語音信號的步驟以及將改善質量后的話音信號提供至語音信號換能器的步驟發(fā)生在機動車輛中。10.—種用于在第一語音信號中的噪聲被抑制之后改善從具有話音和噪聲的第一語音信號得到的話音質量的裝置，該裝置包括: 第一噪聲抑制器，被配置成: 抑制第一語音信號中的至少一些噪聲以由此產(chǎn)生噪聲削減后的第一語音信號，噪聲削減后的第一語音信號包含從第一語音信號得到的已失真的話音；線性預測編碼(LPC)分析器，包括: 被配置成接收第一語音信號并提供第一語音信號的線性預測編碼(LPC)表示的LPC估計器；誤差信號生成器，包括: 被配置成在第一語音信號中的噪聲至少部分被抑制之后產(chǎn)生噪聲削減后的第一語音信號的線性預測編碼(LPC)表示的線性預測編碼(LPC)估計器；被配置成從第一語音信號的LPC表示以及在第一語音信號中的噪聲至少部分被抑制之后的語音信號的LPC表示來合成話音信號的LPC合成器；以及被配置成從合成后的話音信號生成可聽聲波的語音信號換能器。11.如權利要求10的裝置，其中第一噪聲抑制器、線性預測編碼分析器以及誤差信號生成器中的至少一個包括處理器。12.如權利要求10的裝置，進一步包括機動車輛中的麥克風和蜂窩電話，該麥克風可操作地耦合到第一噪聲抑制器，并且該蜂窩電話可操作地耦合到語音信號換能器，其中從麥克風得到的語音信號中的噪聲被削減，且從麥克風得到的語音信號中的話音被提供至蜂窩電話。13.如權利要求10的裝置，其中噪聲抑制器被配置成抑制風噪、馬路噪聲和發(fā)動機噪聲。
【文檔編號】G10L15/02GK105938714SQ201610205907
【公開日】2016年9月14日
【申請日】2016年3月3日
【發(fā)明人】B·喬希
【申請人】大陸汽車系統(tǒng)公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：B·喬希;
技術所有人：大陸汽車系統(tǒng)公司;
我是此專利的發(fā)明人

上一篇：一種基于語音和心率結合的運動強度檢測方法
上一篇：樂音控制裝置的制造方法

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

噪聲對通信系統(tǒng)的影響相關技術

噪聲下的通信相關技術

通信噪聲相關技術

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

在免提通信中的重噪聲條件下改善話音質量的制作方法