聲音增強裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及聲音增強裝置,用于被導入有聲音通信、聲音蓄積、聲音合成、聲音識 別系統(tǒng)的車載導航儀、移動電話、內(nèi)線電話系統(tǒng)(interphone)、收音裝置等聲音通信系統(tǒng)、 免提通話系統(tǒng)、電視會議系統(tǒng)、監(jiān)視系統(tǒng)、廣播系統(tǒng)、聲音合成系統(tǒng)等的音質(zhì)改善和聲音識 別系統(tǒng)的識別率的提高,并改善聲音信號的質(zhì)量及清晰度。
【背景技術(shù)】
[0002] 在模擬電話中,關(guān)于通過電話線路發(fā)送來的聲音信號的頻帶,例如上限的頻率被 限制成3400化的狹窄頻帶。因此,現(xiàn)有的電話線路的音質(zhì)不能說太良好。另外,在移動 電話、業(yè)務(wù)無線等的數(shù)字聲音通信中,由于比特率的嚴格限制,帶寬與模擬線路同樣受到限 審IJ,因而在該種情況下音質(zhì)也不能說太良好。對于聲音的子音成分、聲音具有的"個人性 (像某個人的)"和"自然性",時常還處于3400化W上的頻帶,但該些頻帶由于上述的帶寬 限制而丟失很多。
[0003] 另外,近年來隨著聲音壓縮技術(shù)(聲音編碼技術(shù))的發(fā)展,能夠W低比特率無線傳 輸寬帶(例如上限的頻率為7000化)的聲音信號。但是,需要發(fā)送側(cè)終端和接收側(cè)終端雙 方支持對應(yīng)的寬帶聲音編碼/解碼方法,而且在雙方的基站中也需要完備寬帶編碼用的網(wǎng) 絡(luò),因而僅僅是在一部分業(yè)務(wù)通信系統(tǒng)中得到實際應(yīng)用,當在公共電話通信網(wǎng)中實施時不 僅帶來很大的經(jīng)濟負擔,而且普及需要很長的時間。
[0004] 為此,進行了壓縮聲音信號的頻率,將其頻譜整體控制在通過頻帶內(nèi)的嘗試。但 是,在該種方法中,與原有的聲音信號相比,包括含有聲音的基本周期(音調(diào)(pitch))的低 頻帶的信號在內(nèi)都被壓縮在較低的頻率范圍內(nèi),在該被壓縮的信號不再次經(jīng)過解壓縮就被 再現(xiàn)的情況下,所再現(xiàn)的聲音成為不自然地低的音調(diào),存在聲音的個人性消失、質(zhì)量明顯下 降的問題。針對此種情況,雖然通過在接收側(cè)終端將壓縮信號解壓縮能夠解決該問題,但是 為此需要接收側(cè)終端應(yīng)對對在發(fā)送側(cè)終端被壓縮后的高頻信號進行再次展開的作業(yè)。與應(yīng) 對寬帶化同樣,對于不具備將壓縮信息與聲音信號一起發(fā)送并再次將其展開的功能的通信 終端,該種解決方案不實用。
[0005] 針對上述的問題,例如有專利文獻1記載的技術(shù)。在該技術(shù)中,根據(jù)不改變聲音的 音調(diào)而僅將規(guī)定的高頻壓縮的方法,能夠得到清晰的聲音信號。
[0006] 現(xiàn)有技術(shù)文獻
[0007] 專利文獻
[000引專利文獻1 ;日本特開2011-141551號公報
【發(fā)明內(nèi)容】
[0009] 發(fā)明要解決的問題
[0010] 但是,在上述專利文獻1公開的現(xiàn)有技術(shù)中,雖然具有聲音的個人性得到保留的 優(yōu)點,但是,由于僅僅是將壓縮后的高頻信號成分映射至低頻的預先設(shè)定的固定頻帶中,因 而根據(jù)輸入信號的聲音狀態(tài),上述帶寬有時不是最佳的,在該種情況下存在音質(zhì)的劣化不 能避免的問題。
[0011] 本發(fā)明正是為了解決上述問題而提出的,其目的在于,提供一種能夠生成高質(zhì)量 的聲音的聲音增強裝置。
[0012] 用于解決問題的手段
[0013] 本發(fā)明的聲音增強裝置具有:時間-頻率變換部,其將時域的輸入信號變換成作 為頻域信號的功率譜;輸入信號分析部,其根據(jù)功率譜分析輸入信號的狀態(tài);頻帶決定部, 其根據(jù)輸入信號的狀態(tài),在不超過預先設(shè)定的第1頻率的范圍內(nèi)決定邊界頻率;譜壓縮部, 其沿頻率方向壓縮比第1頻率靠上的頻帶的頻率的功率譜;譜合成部,其將壓縮后的功率 譜反映到由第1頻率和邊界頻率決定的頻帶中;W及頻率-時間變換部,其將從譜合成部輸 出的合成功率譜和輸入信號的相位譜變換到時域而得到增強信號。
[0014] 發(fā)明效果
[0015] 本發(fā)明的聲音增強裝置根據(jù)輸入信號的狀態(tài)確定用于決定反映高頻成分的頻帶 的邊界頻率,因而能夠防止譜合成造成的異常噪聲,能夠?qū)崿F(xiàn)良好且清晰的聲音增強處理。
【附圖說明】
[0016] 圖1是表示本發(fā)明的實施方式1的聲音增強裝置的結(jié)構(gòu)圖。
[0017] 圖2是表示本發(fā)明的實施方式1的聲音增強裝置的輸入信號分析部的詳情的結(jié)構(gòu) 圖。
[0018] 圖3是示意地表示本發(fā)明的實施方式1的聲音增強裝置的處理流程的說明圖。
[0019] 圖4是表示本發(fā)明的實施方式1的聲音增強裝置的輸入信號頻譜的一例的說明 圖。
[0020] 圖5是表示基于現(xiàn)有方法的聲音增強處理的說明圖。
[0021] 圖6是表示本發(fā)明的實施方式1的聲音增強裝置的聲音增強處理的說明圖。
【具體實施方式】
[0022] 下面,為了更詳細地說明本發(fā)明,參照【附圖說明】用于實施本發(fā)明的方式。
[0023] 實施方式1
[0024] 圖1是表示本發(fā)明的實施方式1的聲音增強裝置的結(jié)構(gòu)圖。
[0025] 本實施方式1的聲音增強裝置由輸入端子1、時間-頻率變換部2、輸入信號分析 部3、頻帶決定部4、高頻成分切取部5、譜壓縮部6、增益校正部7、譜合成部8、頻率-時間 變換部9、輸出端子10構(gòu)成。另外,圖2是表示輸入信號分析部3的內(nèi)部結(jié)構(gòu)的圖,輸入信 號分析部3由自相關(guān)分析部11、噪聲頻譜估計部12、SN比計算部13、功率比分析部14、判 定部15構(gòu)成。
[0026] 輸入端子1是被輸入聲音信號該樣的信號作為輸入信號的端子。時間-頻率變換 部2是將時域的輸入信號變換成作為頻域信號的功率譜的處理部。輸入信號分析部3是根 據(jù)從時間-頻率變換部2輸出的功率譜分析輸入信號的狀態(tài),即分析輸入信號是聲音還是 噪聲W及在是聲音時是母音還是子音的處理部。頻帶決定部4是根據(jù)由輸入信號分析部 3分析出的輸入信號的狀態(tài),在不超過預先設(shè)定的第1頻率的范圍內(nèi)決定邊界頻率的處理 部。高頻成分切取部5是切取比第1頻率靠上的頻帶的頻率的功率譜的處理部。譜壓縮部 6是沿頻率方向壓縮由高頻成分切取部5切取出的頻帶的功率譜的處理部。增益校正部7 是進行由譜壓縮部6壓縮后的增益校正的處理部。譜合成部8是將由增益校正部7進行增 益校正后的壓縮功率譜反映到由第1頻率和邊界頻率決定的頻帶的處理部。頻率-時間變 換部9是用于將從譜合成部8輸出的合成功率譜和輸入信號的相位譜變換到時域而得到增 強聲音(增強信號)的處理部。輸出端子10是用于將從頻率-時間變換部9輸出的增強 聲音輸出到外部的端子。
[0027] 下面,詳細說明圖2所示的輸入信號分析部3。
[002引 自相關(guān)分析部11是根據(jù)輸入信號的功率譜求出歸一化自相關(guān)函數(shù)的處理部。噪 聲頻譜估計部12是根據(jù)輸入信號的功率譜求出估計噪聲頻譜的處理部。SN比計算部13是 根據(jù)時間-頻率變換部2輸出的功率譜和噪聲頻譜估計部12輸出的估計噪聲頻譜計算原 有帖的平均SN比的處理部。功率比分析部14是根據(jù)輸入信號的功率譜求出高頻/低頻功 率比的處理部。判定部15是輸入時間-頻率變換部2輸出的功率譜、由自相關(guān)分析部11 得到的歸一化自相關(guān)函數(shù)的最大值、由功率比分析部14得到的高頻/低頻功率比W及噪聲 頻譜估計部12輸出的估計噪聲頻譜,進行當前帖的輸入信號是聲音(母音/子音)還是噪 聲的判定的處理部。
[0029] 下面,根據(jù)圖1和圖2說明本發(fā)明的聲音增強裝置的動作原理。
[0030] 首先,在對通過傳聲器等獲取的聲音、音樂等進行A/D(模擬/數(shù)字)變換后,按照 規(guī)定的采樣頻率(例如16曲Z)進行采樣,并且分割成帖單位(例如10ms),通過輸入端子 1輸入到聲音增強裝置。另外,在本實施方式中,將最終得到的處理信號的頻帶設(shè)為0化~ 3400Hz(第1頻率),將0化~3400化稱作通過頻帶,將3400化~8000化稱作高頻頻帶進 行說明。另外,如果沒有特殊指定,則假定對包含0化~8000化的通過頻帶和高頻頻帶的 信號進行處理。并且,將高頻頻帶的信號也稱作高頻成分進行說明。
[0031] 時間-頻率變換部2在對分割成帖單位后的輸入信號x(t)進行例如漢寧窗處理 后,例如下式(1)所示進行512點的高速傅里葉變換(FastFourierTransform;FFT),從 時域的信號變換成作為頻域信號的頻譜成分X(A,k)。
[003引X(A,k) =FT[x(t)] (1)
[0033] 其中,t表示采樣時間,A表示對輸入信號進行帖分割時的帖編號,k表示指定頻 譜的頻帶的頻率成分的編號(W下稱作頻譜編號),F(xiàn)T[ ?]表示高速傅里葉變換處理。然 后,使用下式(2)從輸入信號的頻譜成分得到功率譜Y(A,k),并且得到相位譜0 (A,k)。
[0034]
[003引其中,Re找(A,