發(fā)動(dòng)機(jī)聲音合成的制作方法
【專利摘要】本發(fā)明描述一種用于分析聲音的方法。根據(jù)本發(fā)明的一個(gè)實(shí)例,所述方法包括:提供將要分析的輸入聲音信號(hào)且從所述輸入信號(hào)或從至少一個(gè)引導(dǎo)信號(hào)確定所述輸入信號(hào)的基頻。此外,確定具有所述基頻的高次諧波的頻率,因此確定諧波模型參數(shù)?;谒鲋C波模型參數(shù)合成諧波信號(hào),且通過(guò)從所述輸入信號(hào)減去所述諧波信號(hào)來(lái)估計(jì)殘留信號(hào)?;谒鰵埩粜盘?hào)估計(jì)殘留模型參數(shù)。此外,描述一種用于合成聲音信號(hào)的對(duì)應(yīng)方法。
【專利說(shuō)明】發(fā)動(dòng)機(jī)聲音合成
【技術(shù)領(lǐng)域】
[0001]各種實(shí)施方案涉及聲音合成的領(lǐng)域,特別地涉及合成內(nèi)燃發(fā)動(dòng)機(jī)的聲音。
【背景技術(shù)】
[0002]混合動(dòng)力和電動(dòng)汽車的日益增長(zhǎng)的普及導(dǎo)致城市環(huán)境中新的安全問(wèn)題,因?yàn)榕c(內(nèi)燃)發(fā)動(dòng)機(jī)噪聲相關(guān)的許多聽(tīng)覺(jué)線索可能丟失。解決方案是智能地使車輛更嘈雜。事實(shí)上,好幾個(gè)國(guó)家已經(jīng)建立了要求汽車發(fā)出最小級(jí)別的聲音以便向其它交通參與者警告駛來(lái)的汽車的法規(guī)。
[0003]在該領(lǐng)域中已進(jìn)行分析且合成聲音信號(hào)的一些研究(尤其在語(yǔ)音處理的背景中)。然而,已知方法和算法通常需要強(qiáng)大的數(shù)字信號(hào)處理器,其不適用于如汽車工業(yè)中所要求的低成本應(yīng)用。因此,需要一種用于合成聲音(尤其是內(nèi)燃發(fā)動(dòng)機(jī)的聲音)的有效方法。
【發(fā)明內(nèi)容】
[0004]描述一種用于分析聲音的方法。根據(jù)本發(fā)明的一個(gè)實(shí)例,所述方法包括:提供將要分析的輸入聲音信號(hào)且從所述輸入信號(hào)或從至少一個(gè)引導(dǎo)信號(hào)確定所述輸入信號(hào)的基頻。此外,確定具有所述基頻的高次諧波的頻率,因此確定諧波模型參數(shù)?;谒鲋C波模型參數(shù)合成諧波信號(hào),且通過(guò)從所述輸入信號(hào)減去所述諧波信號(hào)來(lái)估計(jì)殘留信號(hào)?;谒鰵埩粜盘?hào)估計(jì)殘留模型參數(shù)。
[0005]此外,描述一種用于合成聲音信號(hào)的方法。所述合成是基于可(例如)根據(jù)上文描述的分析方法確定的諧波模型參數(shù)和殘留模型參數(shù)的。根據(jù)一個(gè)實(shí)例,所述方法包括:接收至少一個(gè)引導(dǎo)信號(hào),且基于所述至少一個(gè)引導(dǎo)信號(hào)計(jì)算多個(gè)高次諧波的基頻和頻率。此外,提供與所計(jì)算頻率相關(guān)的殘留模型參數(shù)和諧波模型參數(shù)。使用用于高次諧波的所計(jì)算基頻和頻率的諧波模型參數(shù)來(lái)合成諧波信號(hào)。另外,使用殘留模型參數(shù)合成殘留信號(hào)。通過(guò)疊加合成的諧波信號(hào)與殘留信號(hào)來(lái)計(jì)算總聲音信號(hào)。
【專利附圖】
【附圖說(shuō)明】
[0006]參看以下附圖和說(shuō)明書可更好地理解本發(fā)明。圖中的組件未必按比例繪制,而是將重點(diǎn)放在圖示本發(fā)明的原理上。此外,在圖中,相同標(biāo)號(hào)指定對(duì)應(yīng)零件。在圖中:
[0007]圖1是圖示基于正弦曲線信號(hào)模型來(lái)分析發(fā)動(dòng)機(jī)聲音的一般實(shí)例的框圖;
[0008]圖2是圖示基于如下模型來(lái)分析發(fā)動(dòng)機(jī)聲音的一個(gè)實(shí)例的框圖,此模型利用外部引導(dǎo)信號(hào)來(lái)估計(jì)在輸入信號(hào)中呈現(xiàn)的諧波正弦曲線信號(hào)內(nèi)容;
[0009]圖3是使用諧波正弦曲線信號(hào)內(nèi)容的自適應(yīng)引導(dǎo)式估計(jì)來(lái)分析發(fā)動(dòng)機(jī)聲音的另一個(gè)實(shí)例的框圖;
[0010]圖4是圖示圖3的實(shí)例中的諧波正弦曲線信號(hào)分量的適配的框圖;以及
[0011]圖5是圖示使用信號(hào)模型的發(fā)動(dòng)機(jī)聲音的合成的框圖,信號(hào)模型是通過(guò)根據(jù)圖1到圖3的實(shí)例中的一者的信號(hào)分析獲得的?!揪唧w實(shí)施方式】[0012]下面在發(fā)動(dòng)機(jī)或電機(jī)聲音合成的背景中描述一個(gè)或多個(gè)實(shí)施方案。然而,本文中呈現(xiàn)的用于分析和合成聲音的方法也可應(yīng)用于汽車領(lǐng)域外的領(lǐng)域,而且可應(yīng)用于其它目的。如上所述,可能需要電動(dòng)或混合動(dòng)力汽車發(fā)出最小級(jí)別的聲音來(lái)允許人(尤其是行人和聽(tīng)力減退的人)聽(tīng)到駛來(lái)的汽車。在汽車內(nèi)部,內(nèi)燃發(fā)動(dòng)機(jī)的典型聲音也可為所需的,以向司機(jī)提供關(guān)于汽車的操作狀態(tài)(關(guān)于油門控制或其類似者)的聲學(xué)反饋。從汽車外部能感知到的聲音是由高達(dá)30km每小時(shí)到40km每小時(shí)的行駛速度的發(fā)動(dòng)機(jī)聲音支配的。因此,尤其在行駛速度較低的城市區(qū)域中,發(fā)動(dòng)機(jī)聲音是向其它交通參與者警告駛來(lái)的汽車的主要“報(bào)警信號(hào)”。
[0013]在許多應(yīng)用中,所關(guān)注信號(hào)由被寬頻帶噪聲惡化的多個(gè)正弦曲線信號(hào)分量構(gòu)成。為了分析且模型化此類信號(hào),正弦曲線或“諧波”模型是適當(dāng)?shù)?。另外,主要由正弦曲線分量組成的信號(hào)能在不同應(yīng)用中找到,例如,語(yǔ)音處理中的共振峰頻率。正弦曲線模型化也可成功地應(yīng)用于分析且合成由樂(lè)器產(chǎn)生的聲音,這是因?yàn)檫@些樂(lè)器通常產(chǎn)生具有相對(duì)緩慢變化的正弦曲線分量的諧波或接近諧波信號(hào)。正弦曲線模型化提供可聽(tīng)到信號(hào)分量的參數(shù)表示,使得原始信號(hào)可由合成(即,通過(guò)(諧波與殘留)分量的加法(即,疊加))恢復(fù)。
[0014]旋轉(zhuǎn)機(jī)械系統(tǒng)(諸如汽車的內(nèi)燃發(fā)動(dòng)機(jī))具有高諧波含量加寬頻帶噪聲信號(hào),且因此“正弦曲線加殘留”模型良好地適用于分析且合成由真實(shí)世界內(nèi)燃發(fā)動(dòng)機(jī)產(chǎn)生的聲音。出于此目的,由內(nèi)燃發(fā)動(dòng)機(jī)產(chǎn)生的聲音可使用安置在汽車外部的一個(gè)或多個(gè)麥克風(fēng)記錄,同時(shí)汽車位于(例如)滾筒式底盤測(cè)功器中且在不同負(fù)載條件下以及在各種旋轉(zhuǎn)發(fā)動(dòng)機(jī)轉(zhuǎn)速下操作??煞治龅贸龅囊纛l數(shù)據(jù)以從可稍后使用(例如,在電動(dòng)汽車中)的音頻數(shù)據(jù)“提取”模型參數(shù),以通過(guò)使用適當(dāng)合成器以容易方式再生電機(jī)聲音。模型參數(shù)通常不是恒定的,但可尤其地取決于旋轉(zhuǎn)發(fā)動(dòng)機(jī)轉(zhuǎn)速而變化。
[0015]圖1圖示用于在頻域中分析音頻信號(hào)以提取提到的模型參數(shù)的系統(tǒng)。時(shí)間離散(具有時(shí)間索引η)輸入信號(hào)χ[η]是如上文討論通過(guò)測(cè)量獲得的音頻數(shù)據(jù)。在圖1中,測(cè)量通常通過(guò)提供輸入信號(hào)x[n]的輸入信號(hào)源10用符號(hào)表現(xiàn)。信號(hào)x[n]可使用數(shù)字短時(shí)傅里葉變換(STFT)算法(例如,快速傅里葉變換(FFT)算法)變換到頻域。在圖1中,使用參考符號(hào)20標(biāo)記執(zhí)行用于產(chǎn)生頻域中的輸入信號(hào)X(e>)的STFT的功能塊。從頻域中的輸入信號(hào)X(e>)開(kāi)始,所有隨后信號(hào)分析在頻域中進(jìn)行。然而,信號(hào)處理不限于頻域。信號(hào)處理可部分地或甚至排外地在時(shí)域中執(zhí)行。然而,當(dāng)使用頻域信號(hào)處理時(shí),諧波正弦曲線的數(shù)目?jī)H僅由所使用的FFT長(zhǎng)度限制。
[0016]根據(jù)圖1中圖示的系統(tǒng),將輸入信號(hào)X(e>)供應(yīng)到執(zhí)行正弦曲線信號(hào)分量的估計(jì)的功能塊30。在本實(shí)例中,將此功能劃分成兩個(gè)部分,即基頻&的估計(jì)(功能塊31)和具有頻率fl、f2、…、個(gè)諧波正弦曲線的估計(jì)(功能塊32)。在該領(lǐng)域中已知用于完成此任務(wù)的許多方法,且在此處不進(jìn)一步詳細(xì)討論。然而,所有方法是基于可如下表達(dá)的信號(hào)模型的:
[0017]x[n] = Ao-sin(coon+fo) + Arsin(?in+cpi) +...+ AN-sin(coNii+(pN) +
[0018]r[n](l)[0019]即,將輸入信號(hào)x[n]模型化為以下各者的疊加:具有基頻& (對(duì)應(yīng)于角頻率Otl)的正弦曲線信號(hào)、具有頻率到& (分別對(duì)應(yīng)于角頻率O1到ωΝ)的N個(gè)諧波正弦曲線,和寬頻帶非周期性殘留信號(hào)r[n]。正弦曲線信號(hào)估計(jì)(區(qū)塊30)的結(jié)果是包括以下各者的三個(gè)對(duì)應(yīng)向量:估計(jì)的頻率fMf^,f1;…,fN),以及對(duì)應(yīng)量值A(chǔ)= (Atl, A1,…,An),和相位值φ = (φο.φι,..., (Ρν),其中基頻的相位(Po可設(shè)置為零。可針對(duì)各種不同基頻(例如,對(duì)應(yīng)于發(fā)動(dòng)機(jī)的轉(zhuǎn)速900rpm、1000rpm、I IOOrpm等等)確定含有頻率、量值和相位值的這些向量f、A、C|^另外,可針對(duì)不同發(fā)動(dòng)機(jī)負(fù)載或針對(duì)表示發(fā)動(dòng)機(jī)的操作模式的其它非聲學(xué)參數(shù)(齒輪數(shù)、反向齒輪激活等等)來(lái)確定向量f、A、f?
[0020]為了估計(jì)殘留信號(hào)r[n](其也可取決于一個(gè)或多個(gè)非聲學(xué)參數(shù)(齒輪數(shù)、反向齒輪激活等等)),使用估計(jì)的模型參數(shù)(即向量f、A、《P)以通過(guò)個(gè)別正弦曲線的疊加來(lái)合成輸入信號(hào)的總(估計(jì)的)諧波含量。此通過(guò)圖1中的區(qū)塊40實(shí)現(xiàn),且將輸入信號(hào)的得出的估計(jì)的諧波部分在頻域中表示為H(e>)且在時(shí)域中表示為h[n]。可從輸入信號(hào)X(e>)減去合成的信號(hào)H(eju)(參看區(qū)塊50)以獲得殘留信號(hào)R(e>),其是如上所述的時(shí)域信號(hào)r[n]的頻域等效者。殘留信號(hào)可經(jīng)受濾波(例如,非線性平滑濾波器60)。此濾波器應(yīng)被配置來(lái)平滑化殘留信號(hào),即,抑制估計(jì)的殘留信號(hào)R(e>)中的瞬態(tài)產(chǎn)物、尖峰脈沖或其類似者。將已濾波的殘留信號(hào)R’ (eJW)供應(yīng)給區(qū)塊70,區(qū)塊70表示經(jīng)執(zhí)行以獲得特征化殘留信號(hào)的模型參數(shù)的信號(hào)分析。此信號(hào)分析可包括(例如)線性預(yù)測(cè)性編碼(LPC)或簡(jiǎn)單地殘留信號(hào)的功率譜的計(jì)算。舉例來(lái)說(shuō),殘留信號(hào)的功率譜可在不同頻譜區(qū)域(根據(jù)在心理聲學(xué)方面激發(fā)的頻率尺度的頻帶,參看(例如)Fasti, Hugo; Zwicker, Eberhard; Psychoacoustics (3rd.edition), Springer, 2007)中計(jì)算,其可被選擇以考慮心理聲學(xué)方面關(guān)鍵的頻帶限制。使用心理聲學(xué)方面激發(fā)的頻率尺度(諸如Bark或Mel尺度)將允許計(jì)算時(shí)間和內(nèi)存使用的大量減少。
[0021]在因此已獲得用于不同基頻的“諧波”信號(hào)模型參數(shù)以及用于不同非聲學(xué)參數(shù)(例如,發(fā)動(dòng)機(jī)的轉(zhuǎn)速值、齒輪數(shù)、發(fā)動(dòng)機(jī)負(fù)載等等)的殘留信號(hào)模型參數(shù)的情況下,可稍后使用這些模型參數(shù)來(lái)合成現(xiàn)實(shí)發(fā)動(dòng)機(jī)聲音,其對(duì)應(yīng)于根據(jù)圖1分析的由發(fā)動(dòng)機(jī)產(chǎn)生的聲音。
[0022]圖2圖示信號(hào)分析的另一個(gè)實(shí)例,其可看作是根據(jù)圖1的信號(hào)分析的替代。圖2的信號(hào)分析的結(jié)構(gòu)對(duì)應(yīng)于圖1的結(jié)構(gòu),除了正弦曲線信號(hào)估計(jì)30的功能原理。圖2的框圖的剩余部分與圖1的實(shí)例相同。在本實(shí)例中,執(zhí)行引導(dǎo)式諧波正弦曲線估計(jì),其中將(例如)rpm信號(hào)rpm[n]用作引導(dǎo)信號(hào)。在此背景中,rpm信號(hào)通常是表示發(fā)動(dòng)機(jī)的轉(zhuǎn)速的信號(hào),其可(例如)通過(guò)發(fā)動(dòng)機(jī)控制單元(也被稱為動(dòng)力傳動(dòng)系統(tǒng)控制模塊,其在許多汽車中常??赏ㄟ^(guò)CAN總線來(lái)訪問(wèn),CAN=控制器區(qū)域網(wǎng)絡(luò))提供。當(dāng)使用引導(dǎo)式正弦曲線估計(jì)時(shí),基頻不是從輸入信號(hào)X(e>)估計(jì)的,而是直接從引導(dǎo)信號(hào)(其在本實(shí)例中是正測(cè)試的發(fā)動(dòng)機(jī)的rpm信號(hào)rpm[n])獲得的。舉例來(lái)說(shuō),針對(duì)六缸內(nèi)燃發(fā)動(dòng)機(jī),每分鐘1200轉(zhuǎn)數(shù)的發(fā)動(dòng)機(jī)速度得到120Hz的基頻。
[0023]針對(duì)引導(dǎo)式正弦曲線信號(hào)估計(jì),可使用如下信號(hào)模型。因此,將輸入信號(hào)x[n]模型化為
[0024]
【權(quán)利要求】
1.一種用于分析聲音的方法,其包括: 提供輸入信號(hào); 使用所述輸入信號(hào)或至少一個(gè)引導(dǎo)信號(hào)來(lái)確定所述輸入信號(hào)的基頻,且確定所述基頻的高次諧波的頻率,由此確定與所確定的頻率相關(guān)的諧波模型參數(shù); 基于所述諧波模型參數(shù)合成諧波信號(hào); 通過(guò)從所述輸入信號(hào)減去所述諧波信號(hào)確定殘留信號(hào); 基于所述殘留信號(hào)計(jì)算殘留模型參數(shù)。
2.如權(quán)利要求1所述的方法,其中所述輸入信號(hào)變換到頻域,由此在進(jìn)一步處理之前提供頻域輸入信號(hào)。
3.如權(quán)利要求2所述的方法,其中所述頻域輸入信號(hào)的處理完全在所述頻域中執(zhí)行,且由此在所述頻域中計(jì)算所述諧波信號(hào)和所述殘留信號(hào)。
4.如權(quán)利要求1、2或3所述的方法,其中從所述至少一個(gè)引導(dǎo)信號(hào)導(dǎo)出所述高次諧波的所述基頻和所述頻率。
5.如權(quán)利要求4所述的方法,其中確定所述諧波模型參數(shù)包括: 微調(diào)從所述至少一個(gè)引導(dǎo)信號(hào)獲得的所述高次諧波的所述基頻和所述頻率。
6.如權(quán)利要求5所述的方法,其中所述微調(diào)包括: 迭代地修改高次諧波的所確定的頻率和它們的對(duì)應(yīng)振幅和相位值,使得所述殘留信號(hào)的范數(shù)得以最小化。
7.如權(quán)利要求4至6中任一項(xiàng)所述的方法,其中所述諧波模型參數(shù)包括所述高次諧波的所述基頻和所述頻率的頻率向量、對(duì)應(yīng)量值向量和對(duì)應(yīng)相位向量。
8.如權(quán)利要求1至7中任一項(xiàng)所述的方法,其進(jìn)一步包括: 在估計(jì)所述殘留模型參數(shù)之前對(duì)所述殘留信號(hào)進(jìn)行濾波以平滑化所述殘留信號(hào)。
9.如權(quán)利要求1至8中任一項(xiàng)所述的方法,其中確定所述殘留模型參數(shù)包括 計(jì)算所述殘留信號(hào)的功率譜。
10.如權(quán)利要求1至8中任一項(xiàng)所述的方法,其中確定諧波模型參數(shù)包括估計(jì)與高次諧波的所述基頻和所述頻率相關(guān)的相位值和振幅值。
11.一種用于基于特別地根據(jù)如權(quán)利要求1所述的方法確定的諧波模型參數(shù)和殘留模型參數(shù)來(lái)合成聲音信號(hào)的方法,所述方法包括: 接收至少一個(gè)引導(dǎo)信號(hào); 基于所述至少一個(gè)引導(dǎo)信號(hào)計(jì)算多個(gè)高次諧波的所述基頻和頻率; 提供與所計(jì)算頻率相關(guān)的所述殘留模型參數(shù)和所述諧波模型參數(shù); 使用用于高次諧波的所計(jì)算基頻和頻率的所述諧波模型參數(shù)來(lái)合成諧波信號(hào); 使用所述殘留模型參數(shù)合成殘留信號(hào); 通過(guò)疊加所述合成的諧波信號(hào)與所述殘留信號(hào)來(lái)計(jì)算總聲音信號(hào)。
12.如權(quán)利要求11所述的方法,其進(jìn)一步包括: 將已預(yù)濾波的白噪聲添加到所述總聲音信號(hào)。
13.如權(quán)利要求12所述的方法,其中所述預(yù)濾波包括將所述白噪聲的振幅值映射到O到2 π的相位范圍中,由此產(chǎn)生將要添加到所述總聲音信號(hào)的相位信號(hào)。
14.如權(quán)利要求11至13中任一項(xiàng)所述的方法,其中合成所述殘留信號(hào)包括:產(chǎn)生具有功率譜密度的噪聲信號(hào),所述功率譜密度對(duì)應(yīng)于由所述殘留模型參數(shù)表示的功率譜密度。
15.如權(quán)利要求9或14所述的方法,其中在根據(jù)在心理聲學(xué)方面激發(fā)的頻率尺度的不同頻帶中計(jì)算所述功率譜密度,以便考慮在心理聲學(xué)方面關(guān)鍵的頻帶限制。
【文檔編號(hào)】G10K15/02GK103544949SQ201310289860
【公開(kāi)日】2014年1月29日 申請(qǐng)日期:2013年7月11日 優(yōu)先權(quán)日:2012年7月12日
【發(fā)明者】M.克里斯托夫 申請(qǐng)人:哈曼貝克自動(dòng)系統(tǒng)股份有限公司