本發(fā)明涉及3d虛擬聲技術(shù)領(lǐng)域,具體涉及一種基于遠(yuǎn)場信息的近場中垂面虛擬聲的合成方法。
背景技術(shù):
虛擬聲重放采用聲信號處理的方法模擬特定空間方位的虛擬聲像,從而使聽者產(chǎn)生沉浸感和臨場感。由于重放設(shè)備(通常是耳機(jī))簡單、便攜,虛擬聲重放在多媒體電腦、個人音頻移動終端等領(lǐng)域具有廣泛的應(yīng)用。頭相關(guān)傳輸函數(shù)(head-relatedtransferfunction,hrtf)是虛擬聲信號處理的關(guān)鍵。hrtf是自由場情況下聲源到雙耳的聲學(xué)傳輸函數(shù),和聲源方位、距離、聲波頻率、聽者生理結(jié)構(gòu)等相關(guān)。當(dāng)聲源到聽者頭部的距離大于1.0米,hrtf幾乎不隨距離而改變,稱為遠(yuǎn)場hrtf;而當(dāng)聲源到聽者頭部的距離小于1.0米,hrtf隨距離發(fā)生明顯變化,稱為近場hrtf。近場hrtf包含了聲源距離定位的信息,因此它在雙耳距離定位機(jī)理的研究中具有重要意義;同時,隨著手持播放設(shè)備的普及(例如手機(jī)),也需要采用近場hrtf進(jìn)行近場虛擬聲重放的信號處理。
目前,近場hrtf數(shù)據(jù)主要通過測量得到。在實際的近場hrtf測量中,主要存在以下三個方面的困難:(1)由于測量聲源和受試者較近,聲波將不可避免地發(fā)生多重散射和繞射問題,因此需要特定的小尺寸聲源;(2)由于近場hrtf和距離有關(guān),因此需要分別測量不同距離的hrtf,其工作量非常大。(3)hrtf和受試者的生理結(jié)構(gòu)有關(guān)(例如頭部大小、耳廓細(xì)微結(jié)構(gòu)等)。原則上,為了獲得最佳的聲重放效果,需要測量每一個聽者(即受試者)的近場hrtf。目前,已有多個課題組建立了遠(yuǎn)場hrtf數(shù)據(jù)庫,并在互聯(lián)網(wǎng)上公開,例如mit和cipichrtf數(shù)據(jù)庫。如果可以采用已知的遠(yuǎn)場hrtf推導(dǎo)出不同距離的近場hrtf,那就可以避免上述近場hrtf測量的困難,實現(xiàn)近場hrtf的便捷獲取。
聲像的空間定位主要分為水平方向定位和垂直方向定位。水平方位定位主要取決于左耳和右耳hrtf的差異,而垂直方向定位(特別是中垂面上的聲像定位)主要依賴hrtf的頻譜特征。因此,hrtf的頻譜特征的準(zhǔn)確度決定了中垂面聲像定位的準(zhǔn)確度;在中垂面遠(yuǎn)場hrtf推導(dǎo)近場hrtf的過程中,需要特別關(guān)注近場hrtf頻譜特征的準(zhǔn)確再現(xiàn)。
通常,hrtf的相關(guān)研究(包括現(xiàn)有的數(shù)據(jù)庫)采用頭中心坐標(biāo)系,其中hrtf的角度定義為聲源相對于頭中心的角度。然而,hrtf本身定義為聲源到雙耳的傳輸函數(shù),hrtf數(shù)據(jù)也是在雙耳處進(jìn)行撿拾的。因此,在遠(yuǎn)場hrtf推導(dǎo)近場hrtf的過程中,為了保證近場hrtf頻譜特征的準(zhǔn)確性,需要考慮聲源相對于耳(而不是頭中心)的角度。計算表明,遠(yuǎn)場聲源相對于頭中心和相對于耳的角度大致相等;而近場聲源相對于頭中心和相對于耳的角度存在較大偏差,甚至可以達(dá)到30°。這意味著在通常的頭中心坐標(biāo)系情況下,不能直接用遠(yuǎn)場hrtf推導(dǎo)同角度的近場hrtf,需要考慮近場聲源在雙耳坐標(biāo)系和頭中心坐標(biāo)系兩種情況下的角度偏差。
技術(shù)實現(xiàn)要素:
針對遠(yuǎn)場hrtf推導(dǎo)近場hrtf過程中的角度偏差問題,本發(fā)明提供了一種基于角度修正的中垂面近場hrtf的獲取方法。本發(fā)明以遠(yuǎn)、近聲源對耳具有相同的角度為出發(fā)點,推導(dǎo)出中垂面近場hrtf在頭中心坐標(biāo)系中所對應(yīng)的遠(yuǎn)場hrtf的角度(即修正角度),進(jìn)而從已有的采用頭中心坐標(biāo)系的遠(yuǎn)場hrtf數(shù)據(jù)庫中提取相應(yīng)的雙耳hrtf數(shù)據(jù),供后續(xù)合成中垂面近場虛擬聲像。該方法可以準(zhǔn)確、便捷地合成中垂面任意聲源距離處的虛擬聲像。
本發(fā)明的目的通過以下技術(shù)方案實現(xiàn)。
一種中垂面上近場虛擬聲像的合成方法,包括步驟:
步驟1、輸入已知數(shù)據(jù),包括遠(yuǎn)場hrtf基線數(shù)據(jù)庫、三個距離參數(shù),所述的三個距離參數(shù)包括遠(yuǎn)場聲源和頭中心的距離d、人頭半徑a、中垂面上近場目標(biāo)聲像和頭中心的距離d;
步驟2根據(jù)公式,計算右耳r的修正角度θ:
其中,改變中垂面上近場目標(biāo)聲像和頭中心的距離d,就可以獲得不同近場距離的修正角度;
步驟3、提取遠(yuǎn)場hrtffar(θ,r)作為近場目標(biāo)聲像的右耳hrtf,即hrtfnear(r);提取遠(yuǎn)場hrtffar(-θ,l)作為近場目標(biāo)聲像的左耳hrtf,即hrtfnear(l);
步驟4、將近場目標(biāo)聲像的雙耳hrtfnear和輸入聲信號進(jìn)行卷積,并饋給耳機(jī)或揚聲器進(jìn)行聲重放。
進(jìn)一步地,所述遠(yuǎn)場為距離頭中心1米以外的區(qū)域,所述近場為距離頭中心1米以內(nèi)的區(qū)域。
進(jìn)一步地,所述遠(yuǎn)場的hrtf的特征不隨距離而變化,而近場的hrtf的特征隨距離而變化。
進(jìn)一步地,步驟1中所述hrtf基線數(shù)據(jù)庫指目前已有公開的多個遠(yuǎn)場hrtf數(shù)據(jù)庫,包括美國麻省理工學(xué)院mithrtf數(shù)據(jù)庫、美國加利福尼亞大學(xué)戴維斯分校cipichrtf數(shù)據(jù)庫。
進(jìn)一步地,步驟1中所述的人頭半徑a取平均值為8.75cm。
進(jìn)一步地,步驟1中所述的人頭半徑a通過直接測量獲得。
進(jìn)一步地,步驟4中合成的雙耳聲信號直接饋給耳機(jī)重放;當(dāng)采用揚聲器重放時,則需要插入串聲消除算法。
本發(fā)明的原理是:空間任一聲源發(fā)出的聲波,經(jīng)過和聽者生理結(jié)構(gòu)(例如頭、耳廓、軀干等)的相互作用后,到達(dá)雙耳。hrtf反映了上述聲傳輸過程中聲波的改變。無論遠(yuǎn)場或近場,只要聲源相對于耳的方位角相同,對應(yīng)的聲傳輸過程是相同的,因此同角度(相對于耳而言)的遠(yuǎn)近場hrtf具有高度相似的頻譜結(jié)構(gòu)。這就是采用遠(yuǎn)場hrtf推知近場hrtf的理論基礎(chǔ)。然而,遠(yuǎn)場hrtf的研究以及數(shù)據(jù)庫往往采用頭中心坐標(biāo)系。研究發(fā)現(xiàn),由于近場聲源相對于頭中心和相對于耳存在明顯的角度偏差。這意味著相對于耳而言的同角度遠(yuǎn)近場hrtf在頭中心坐標(biāo)系是不同角度的。如果利用現(xiàn)有的頭中心坐標(biāo)系的遠(yuǎn)場hrtf推導(dǎo)近場hrtf必須進(jìn)行角度修正,以確保提取的遠(yuǎn)場hrtf與近場目標(biāo)hrtf相對于耳而言是同角度的??紤]到hrtf頻譜的準(zhǔn)確性對于中垂面虛擬聲像的準(zhǔn)確再現(xiàn)是至關(guān)重要的,本發(fā)明重點推導(dǎo)了中垂面上的角度修正公式。類似的方法也可以推廣到中垂面以外。
相比現(xiàn)有技術(shù),本發(fā)明的優(yōu)勢在于:
(1)采用已有的遠(yuǎn)場hrtf數(shù)據(jù)推導(dǎo)近場hrtf數(shù)據(jù),可以徹底避免繁雜的近場hrtf測量;
(2)考慮了近場hrtf相對于耳和相對于頭中心的角度偏差,采用了相應(yīng)的修正公式,從而提高了遠(yuǎn)場hrtf推導(dǎo)近場hrtf的準(zhǔn)確性;
(3)本發(fā)明可以采用算法語言編制的軟件在多媒體計算機(jī)上實現(xiàn),也可以采用信號處理芯片電路或?qū)S玫募呻娐穼崿F(xiàn),用于多媒體計算機(jī)、各種手持便攜式音頻播放設(shè)備(例如手機(jī))等方面的近距離虛擬聲重放。
附圖說明
圖1是本發(fā)明的實現(xiàn)原理圖。
圖2是本發(fā)明角度修正的示意圖。
圖3是本發(fā)明實施例的多媒體計算機(jī)實現(xiàn)的信號流程圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明做進(jìn)一步的說明,但本發(fā)明要求保護(hù)范圍并不局限于實施例表示的范圍。
圖1是本發(fā)明一種中垂面上近場虛擬聲像的合成方法的實現(xiàn)原理圖。它考慮了近場情況下聲源相對于頭中心和相對于耳的角度偏差,推導(dǎo)出了相應(yīng)的角度修正公式。根據(jù)角度修正公式,可以從遠(yuǎn)場已知hrtf基線數(shù)據(jù)庫中準(zhǔn)確提取近場目標(biāo)hrtf數(shù)據(jù),從而確保中垂面上近場虛擬聲像合成的準(zhǔn)確性。這種中垂面上近場虛擬聲像的合成方法可以避開復(fù)雜的近場hrtf的測量,可以便捷地獲取任意近場距離的虛擬聲像。
一種中垂面上近場虛擬聲像的合成方法,包括步驟:
步驟1、輸入已知數(shù)據(jù),包括遠(yuǎn)場hrtf基線數(shù)據(jù)庫、三個距離參數(shù),所述的三個距離參數(shù)包括遠(yuǎn)場聲源和頭中心的距離d、人頭半徑a、中垂面上近場目標(biāo)聲像和頭中心的距離d;
步驟2、根據(jù)公式,計算右耳r的修正角度θ:
其中,改變中垂面上近場目標(biāo)聲像和頭中心的距離d,就可以獲得不同近場距離的修正角度;
步驟3、提取遠(yuǎn)場hrtffar(θ,r)作為近場目標(biāo)聲像的右耳hrtf,即hrtfnear(r);提取遠(yuǎn)場hrtffar(-θ,l)作為近場目標(biāo)聲像的左耳hrtf,即hrtfnear(l);
步驟4、將近場目標(biāo)聲像的雙耳hrtfnear和輸入聲信號進(jìn)行卷積,并饋給耳機(jī)或揚聲器進(jìn)行聲重放。
具體而言,所述遠(yuǎn)場為距離頭中心1米以外的區(qū)域,所述近場為距離頭中心1米以內(nèi)的區(qū)域。
具體而言,所述遠(yuǎn)場的hrtf的特征不隨距離而變化,而近場的hrtf的特征隨距離而變化。
具體而言,步驟1中所述hrtf基線數(shù)據(jù)庫指目前已有公開的多個遠(yuǎn)場hrtf數(shù)據(jù)庫,包括美國麻省理工學(xué)院mithrtf數(shù)據(jù)庫、美國加利福尼亞大學(xué)戴維斯分校cipichrtf數(shù)據(jù)庫。其中,公開的hrtf基線數(shù)據(jù)庫都會指明其數(shù)據(jù)的測量距離,即遠(yuǎn)場聲源和頭中心的距離d。
具體而言,步驟1中所述的人頭半徑a取平均值為8.75cm,也可以通過直接測量獲得。例如,可以采用體感設(shè)備(如微軟公司出品的kinect)捕獲聽者頭部的三維尺寸,進(jìn)而確定特定聽者的頭半徑。
具體而言,步驟4中合成的雙耳聲信號可以直接饋給耳機(jī)重放;如果采用揚聲器重放,則需要插入串聲消除算法。其中,串聲消除算法的具體數(shù)學(xué)形式和揚聲器的數(shù)量、擺放方式都有關(guān)。
圖2是角度修正的示意圖。由于圖的視角是自頭頂向下俯視,所以中垂面(定義為將人體左右均分的切面)呈現(xiàn)為左右平分頭部的一條虛線。雖然現(xiàn)實中人頭并非一個理想的球形,但是已有研究證實球形是人頭的一種良好近似;同時,由于人類的聽覺具有一定的分辨率,這種近似不會引起聽覺畸變。圖中,o點代表頭中心,a點代表右耳,b點代表期望合成的近場目標(biāo)聲像,∠boc=θ代表修正角,c點代表根據(jù)修正角確定的遠(yuǎn)場已知聲像,oa=a,ob=d,oc=d。從圖中可以看出,ab和ac在同一條直線上,近場聲像b和遠(yuǎn)場聲像c相對于右耳的角度相同,相應(yīng)的遠(yuǎn)場和近場hrtf具有相似的頻譜結(jié)構(gòu)。因此,提取遠(yuǎn)場c點的hrtf作為近場b點的hrtf,即從遠(yuǎn)場c點hrtf推導(dǎo)出近場b點hrtf,具有合理性。圖3是計算機(jī)實現(xiàn)的流程圖,可以采用matlab或者c++語言編程實施。
本發(fā)明的上述實施例僅僅是為清楚地說明本發(fā)明所作的舉例,而并非是對本發(fā)明的實施方式的限定。對于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實施方式予以窮舉。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明權(quán)利要求的保護(hù)范圍之內(nèi)。