專利名稱:語音增強聲碼器的制作方法
技術領域:
本實用新型涉及一種語音增強聲碼器,屬無線電通訊技術領域。
多帶激勵(MBE,Multi-Band Excitation)語音編碼是一種中低速語音編碼算法,最初由美國麻省理工學院的Daniel W.Griffin博士提出[1],其改進型多帶激勵聲碼器IMBE(4.15Kbits/s,加糾錯編碼后為6.4Kbits/s)已被國際海事衛(wèi)星組織(INMARSAT)定為衛(wèi)星話音通信標準[2],在此基礎上清華大學電子工程系的王田博士在他的博士論文中研究了一種2.4kb/s的IMBE聲碼器算法[3]。
IMBE聲碼器算法的基本原理包括三部分語音分析、語音編/解碼和語音合成。語音分析的目的是為了準確而有效地提取語音生成模型的參數(shù)。MBE語音生成模型的參數(shù)包括基音頻率或基音周期、譜包絡信息、清濁音信息。譜包絡信息包括基音頻率各次諧波的幅度和相位信息,但2.4kb/s的IMBE聲碼器拋棄了相位信息不傳。語音編碼用于把分析所得參數(shù)進行合適的量化和編碼,把語音參數(shù)編成適合于傳輸?shù)谋忍亓鳎徽Z音解碼過程基本上是語音編碼的逆過程,它把接收到的比特流還原為語音參數(shù)。語音合成則是語音分析的逆過程,它用接收到的語音模型參數(shù)去還原原始語音,生成適合人耳聽的語音信號。
IMBE聲碼器本身具有一定的抗噪聲能力,能在高信噪比(SNR,Signal-to-Noise Ratio)下,比如說SNR大于20dB,可靠地工作,但當信噪比進一步降低時,其合成語音的失真迅速增大,當信噪比低于5dB時,幾乎無法正常工作。
本實用新型的目的在于應用語音增強技術研制一種能獨立實時工作的抗噪聲語音增強聲碼器設備,使它在0dB左右的信噪比(白色高斯噪聲)下仍能較好地工作。
本實用新型設計的語音增強聲碼器,包括(1)數(shù)字信號處理器;(2)為數(shù)字信號處理器提供內(nèi)存的靜態(tài)存貯器和程序存貯器,與數(shù)字信號處理器相連的讀端口、寫端口;(3)與信號處理器的管腳相連的數(shù)據(jù)接收和發(fā)送端、接收和發(fā)送時鐘;(4)用于模數(shù)/數(shù)模轉(zhuǎn)換的模擬接口電路,與數(shù)字信號處理器相連,該電路為一芯片;
(5)用于把輸入信號電平轉(zhuǎn)換成模擬接口電路的信號放大和電平轉(zhuǎn)換電路,該電路由實現(xiàn)放大功能的兩個運算放大器、實現(xiàn)反向功能的一個運算放大器和實現(xiàn)電平移位的兩個運算放大器組成;(6)用于放大模擬信號功率,使其能驅(qū)動揚聲器發(fā)聲的功率放大電路,由運算放大器和小功率放大器組成;(7)用于使數(shù)字信號處理器復位的復位電路,由復位開關和二個非門組成;(8)用于將220V交流電源轉(zhuǎn)換成各個電路所要求的直流電壓的電源模塊,由整流電路、濾波電路和穩(wěn)壓電路組成。
本實用新型的語音增強聲碼器,對于平穩(wěn)白色高斯噪聲情況,當信噪比較高時(≥10dB),語音增強聲碼器能顯著提高IMBE聲碼器合成語音的質(zhì)量;當信噪比較低時(≥0dB),語音增強聲碼器能正常工作,合成語音清晰可懂,而此時一般的IMBE聲碼器已無法正常工作,其合成語音夾雜有刺耳的失真信號。
圖1是本實用新型的原理框圖。
圖2是本實用新型的電路原理圖。
圖3是本實用新型的程序主流程圖。
圖4是語音增強程序流程圖。
圖5是模擬接口電路與數(shù)字信號處理器的連接示意圖。
圖6是模擬接口電路的模擬信號差分輸入示例。
圖7是信號放大和電平轉(zhuǎn)換電路圖。
圖8是復位電路圖。
以下結合附圖,詳細介紹本實用新型的原理和工作過程。
語音增強聲碼器是一種基于數(shù)字信號處理器(Digital SignalProcessor,DSP)的語音信號處理設備,通過開關選擇,能對語音信號進行增強與/或壓縮編碼處理,并能在低信噪比下提供設備之間的全雙工語音通信。本設備的原理框圖如附圖1所示。
其基本工作過程是這樣的,由信號輸入端輸入的語音信號經(jīng)過放大和電平轉(zhuǎn)換,生成模數(shù)轉(zhuǎn)換所需要的語音信號,該信號由模擬接口電路經(jīng)8KHz采樣、16bit量化轉(zhuǎn)換成數(shù)字信號,送數(shù)字信號處理器進行語音增強和語音編碼等處理。數(shù)字信號處理器先對數(shù)字化語音進行增強處理以濾除背景噪聲,然后經(jīng)語音分析和量化編碼輸出數(shù)字碼流,同時數(shù)字信號處理器接收來自其他語音增強聲碼器的數(shù)字碼流,經(jīng)解碼得到語音模型參數(shù),然后用這些參數(shù)合成數(shù)字語音,數(shù)字語音再經(jīng)數(shù)模轉(zhuǎn)換轉(zhuǎn)換為模擬語音。最后設備對模擬語音進行功率放大,輸出能驅(qū)動揚聲器工作的語音信號。
語音增強聲碼器的電原理圖如圖2所示。硬件的核心是數(shù)字信號處理器TMS320C31(以下簡稱C31),它在上電復位之后自動啟動其內(nèi)置的引導程序,由引導程序把放在可編程存貯器(EPROM)上的可執(zhí)行代碼加載到工作內(nèi)存中,此后引導程序引導C31執(zhí)行該可執(zhí)行代碼。上述可執(zhí)行代碼包含了實時實現(xiàn)語音增強聲碼器全部功能所需要的所有程序,這其中主要包括數(shù)字信號處理器和模擬接口電路的初始化子程序,語音信號接收/發(fā)送中斷子程序,語音增強算法(MMSE和減譜法)子程序,語音/噪聲自動檢測算法子程序,IMBE聲碼器算法子程序,串行通信算法/中斷子程序,音量自動控制算法子程序等。其中語音增強算法(MMSE和減譜法)、語音/噪聲自動檢測算法、IMBE聲碼器算法等子程序是整個程序的核心。整個語音增強聲碼器程序的流程圖如圖3所示,其中語音增強環(huán)節(jié)的詳細流程圖則如圖4所示。另外,根據(jù)算法選定的參數(shù),每一幀語音輸入數(shù)據(jù)為200點,采樣率為8kHz,所以實時處理時,每一幀的處理時間為25ms。
語音增強聲碼器除核心的數(shù)字信號處理器外,還有一些輔助電路,其功能和結構說明如下。
1)由4片32K×8bit的CY7C199構成的靜態(tài)存貯器(SRAM)為C31提供工作內(nèi)存(32K×32bit),一片128K×8bit的可編程存貯器(EPROM)27C010作為程序存貯器;另外,為了接受面板上選擇開關的值,用兩塊鎖存器74F373設置了兩個8bit的讀端口,為了便于C31復位和控制模擬接口電路,用一塊鎖存器74F373設置了一個寫端口。
2)利用C31的管腿XF0、XF1、CLK0、CLK1和INT0設置了一個串口用于收發(fā)語音編碼碼流,其中XF0和XF1分別為數(shù)據(jù)接收和發(fā)送端,CLK0和CLK1分別為接收和發(fā)送時鐘,INT0則用于檢測同步頭。
3)模擬接口電路(AIC)TLC320AD55用于模數(shù)/數(shù)模轉(zhuǎn)換,它是在單片CMOS芯片上集成的完整的模數(shù)/數(shù)模轉(zhuǎn)換系統(tǒng)。圖5給出了TLC320AD55與TMS320C31詳細的連接框圖。在正式傳輸模數(shù)/數(shù)模數(shù)據(jù)之前,C31是主控器件,它通過寫端口和串口配置TLC320AD55,使得TLC320AD55工作在C31所希望的工作模式下;在正式傳輸數(shù)據(jù)時,TLC320AD55是主控器件,它產(chǎn)生發(fā)送和接收的幀同步信號FSR0和FSX0及兩個串行移位時鐘CLKR0和CLKX0給C31,通知C31在DR0和DX0上接收和發(fā)送模數(shù)/數(shù)模數(shù)據(jù)。
4)信號放大和電平轉(zhuǎn)換電路用于把輸入信號電平轉(zhuǎn)換成模擬接口電路所要求的電平。模擬接口電路TLC320AD55要求模擬信號為差分輸入,最大電平1.5V,并且要求2.5V偏置,如圖6所示。但是系統(tǒng)輸入信號中傳聲器輸入只有幾十mV,即使是線入信號也只有幾百mV,為了能有效地利用TLC320AD55模數(shù)轉(zhuǎn)換的動態(tài)范圍和量化精度,有必要把這些小信號放大得足夠大。另外為了滿足TLC320AD55差分輸入和偏置的要求,也必須作電平調(diào)整。這些都由信號放大和電平轉(zhuǎn)換電路來完成。信號放大和電平轉(zhuǎn)換電路利用反饋運算放大器實現(xiàn),其框圖如圖7所示。
5)功率放大電路用于放大模擬信號功率使其能驅(qū)動揚聲器發(fā)聲,它由兩部分組成由運算放大器構成的前級放大器一方面把TLC320AD55的差分輸出信號轉(zhuǎn)換成非差分信號,另一方面又把信號電平轉(zhuǎn)換到下級功放所需要的電平上;然后由LM386構成的小功率放大器作信號功率放大,使其能推動揚聲器工作。
6)復位電路用于復位C31,當按下復位按鈕后,它產(chǎn)生一個低電平復位信號復位C31,其電原理圖如圖8所示。
7)60MHz晶振和16.384MHz晶振分別為C31和模擬接口電路TLC320AD55提供工作時鐘。
8)電源模塊用于把將220V交流電壓轉(zhuǎn)換為各個電路所要求的直流電壓。該電源模塊包括常規(guī)的整流電路、濾波電路和穩(wěn)壓電路。
權利要求1.一種語音增強聲碼器,其特征在于該聲碼器包括(1)數(shù)字信號處理器;(2)為數(shù)字信號處理器提供內(nèi)存的靜態(tài)存貯器和程序存貯器,與數(shù)字信號處理器相連的讀端口、寫端口;(3)與信號處理器的管腳相連的數(shù)據(jù)接收和發(fā)送端、接收和發(fā)送時鐘;(4)用于模數(shù)/數(shù)模轉(zhuǎn)換的模擬接口電路,與數(shù)字信號處理器相連,該電路為一芯片;(5)用于把輸入信號電平轉(zhuǎn)換成模擬接口電路的信號放大和電平轉(zhuǎn)換電路,該電路由實現(xiàn)放大功能的兩個運算放大器、實現(xiàn)反向功能的一個運算放大器和實現(xiàn)電平移位的兩個運算放大器組成;(6)用于放大模擬信號功率,使其能驅(qū)動揚聲器發(fā)聲的功率放大電路,由運算放大器和小功率放大器組成;(7)用于使數(shù)字信號處理器復位的復位電路,由復位開關和二個非門組成;(8)用于將220V交流電源轉(zhuǎn)換成各個電路所要求的直流電壓的電源模塊,由整流電路、濾波電路和穩(wěn)壓電路組成。
專利摘要本實用新型涉及一種語音增強聲碼器,該聲碼器包括:數(shù)字信號處理器、為數(shù)字信號處理器提供內(nèi)存的存貯器、與信號處理器的管腳相連的數(shù)據(jù)接發(fā)送端、接發(fā)送時鐘、用于模數(shù)/數(shù)模轉(zhuǎn)換的模擬接口電路、信號放大和電平轉(zhuǎn)換電路、功率放大電路、復位電路以及電源模塊。本實用新型的語音增強聲碼器,對于平穩(wěn)白色高斯噪聲情況,當信噪比較高時能顯著提高合成語音的質(zhì)量;當信噪比較低時能正常工作,合成語音清晰可懂。
文檔編號G10L15/20GK2382102SQ9921499
公開日2000年6月7日 申請日期1999年7月9日 優(yōu)先權日1999年7月9日
發(fā)明者曹志剛, 張金杰, 戴懷宇 申請人:清華大學