專利名稱:用于計算揚(yáng)聲器信號中成分的離散值的裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及波場(wave-field)合成系統(tǒng),尤其是允許運(yùn)動虛擬源的波場合成系統(tǒng)。
背景技術(shù):
在消費(fèi)電子領(lǐng)域中對新技術(shù)和新產(chǎn)品的需求不斷增長。這里,對于新的多媒體系統(tǒng)的成功來說,一個重要的前提條件是分別提供最優(yōu)的功能或性能。這是通過數(shù)字技術(shù)、尤其是計算機(jī)技術(shù)的使用來獲得的。對此的例子是提供改善的逼真的視聽效果的應(yīng)用設(shè)備。在現(xiàn)有技術(shù)的音頻系統(tǒng)中,一個顯著的弱點是真實以及虛擬環(huán)境的空間聲音再現(xiàn)的質(zhì)量。
用于音頻4信號的多通道揚(yáng)聲器再現(xiàn)的方法已經(jīng)為人們所知并且標(biāo)準(zhǔn)化許多年了。所有普通的技術(shù)都具有一個缺點,即揚(yáng)聲器的方位和聽者的位置都已經(jīng)在傳輸格式中留下了烙印。如果揚(yáng)聲器被以錯誤的方式相對于聽者放置,則音頻質(zhì)量會受到顯著影響。最優(yōu)的聲音只有在再現(xiàn)房間的很小區(qū)域內(nèi)才能得到,即所謂最佳聽音位置(sweetspot)。
音頻再現(xiàn)期間的改善的自然空間感以及更強(qiáng)的環(huán)繞(enclosure)可以通過新技術(shù)的幫助而獲得。這種技術(shù)的基礎(chǔ),即所謂波場合成(WFS),已經(jīng)在TU Delft進(jìn)行研究并且在80年代末第一次提出(Berkhout,A.J.;de Vries,D.;Vogel,P.Acoustic control byWave-field Synthesis,JASA 93,1993)。
由于這種方法對于計算性能和傳輸速率的巨大需求,波場合成至今也是極少用于實踐中。今天,微處理器技術(shù)和音頻編碼領(lǐng)域的發(fā)展只允許這種技術(shù)在特定應(yīng)用中使用。在專業(yè)領(lǐng)域中的第一件產(chǎn)品預(yù)計在明年生產(chǎn)出來。幾年以后,用于消費(fèi)領(lǐng)域的第一個波場合成應(yīng)用將能夠上市。
WFS的基礎(chǔ)思想是基于波動理論的惠更斯(Huygens)原理的應(yīng)用。
波獲取的每個點是元波(elementary wave)的起始點,其以球形或圓形方式傳播。
應(yīng)用到聲學(xué)上,輸入的波陣面的任何形式可以通過相鄰排列的大量揚(yáng)聲器(所謂揚(yáng)聲器陣列)來再現(xiàn)。在最簡單的情況中,要被再現(xiàn)的單個點源和揚(yáng)聲器的線性排列,每個揚(yáng)聲器的音頻信號必須被具有時間延遲和幅度定標(biāo)地被饋送,以使各個揚(yáng)聲器發(fā)射的聲場正確地疊加。在多個聲源的情況,為每個聲源單獨(dú)計算對每個揚(yáng)聲器的貢獻(xiàn),并且將所得的信號相加。在具有反射壁的虛擬空間中,也可以通過揚(yáng)聲器陣列,作為附加聲源再現(xiàn)反射。從而,計算性能嚴(yán)重依賴于聲源數(shù)量、錄音室的反射特性和揚(yáng)聲器數(shù)量。
這種技術(shù)的特別優(yōu)點是,自然空間聲音效果能夠穿過再現(xiàn)房間的大片區(qū)域。相對于已知技術(shù),聲源的方向和距離被再現(xiàn)得非常準(zhǔn)確。在有限程度上,虛擬聲源甚至能夠被設(shè)置在真實的揚(yáng)聲器陣列和聽者之間。
雖然波場合成對于其狀態(tài)是已知的環(huán)境工作很好,但是當(dāng)狀態(tài)變化或者當(dāng)基于不對應(yīng)于環(huán)境的實際狀態(tài)的環(huán)境狀態(tài)而進(jìn)行波場合成時,仍然會出現(xiàn)不規(guī)律。
波場合成技術(shù)還可以有利地用于向視覺感知中添加相應(yīng)的空間音頻感知。迄今為止,在虛擬工作室中的制作期間,焦點在于虛擬場景的真實視覺效果的制作上。與影像相匹配的聲學(xué)效果通常是后來通過所謂的后期制作中的人工操作步驟印記(imprint)到音頻信號上的,或者被認(rèn)為實現(xiàn)起來太昂貴和太耗時而被忽略掉。這通常會引起各個感覺印象之間的偏差,這將導(dǎo)致所設(shè)計的空間,即所設(shè)計的場景,被認(rèn)為是不夠真實。
在專業(yè)出版物“Subjective experiments on the effects ofcombining spatialized audio and 2D video projection in audio-visualsystems”,W.de Bruijn and M.Boone,AES convention paper 5582,May 10thto 13th,2003,Munich中,其中給出了關(guān)于在視聽系統(tǒng)中組合空間音頻和二維視頻投影的效果的主觀實驗。尤其突出了,當(dāng)站在與攝像機(jī)不同距離處,并且?guī)缀跏乔昂笳玖⒌膬蓚€說話者在波場合成的幫助下被作為不同的虛擬聲源來看并且重構(gòu)時,觀眾能夠更好地理解這兩個前后站立的說話者。在這種情況下,通過主觀測試發(fā)現(xiàn),當(dāng)這兩個同時說話的說話者分開時,聽者能夠更好地理解和區(qū)分這兩個說話人。
在2001年9月24日到27日在Ilmenau舉行的第46屆國際學(xué)術(shù)會議的會議稿件中,U.Reiter,F(xiàn).Melchior和C.Seidel提交的、題目為“Automatisierte Anpassung der Akustik an virtuelle Rume”的文章中,提出了一種用于自動聲音后處理過程的方法。因此,可視化所需的攝劇組境(film set)的參數(shù),諸如房間大小、表面的紋理(texture)或攝像機(jī)位置以及演員的位置,被檢測以用于它們的聲學(xué)相關(guān),從而產(chǎn)生相應(yīng)的控制數(shù)據(jù)。然后,它們以自動的方式影響用于后期制作的效果和后處理過程,諸如說話人音量對于到攝像機(jī)距離的依賴性或者依賴于房間大小和墻壁情況的混響時間的適應(yīng)。這里,目的是加強(qiáng)虛擬場景的視覺效果以增加真實性感知。
希望能夠“通過攝像機(jī)的耳朵來聽”以使得場景顯得更加真實。其中,希望影像中的聲音事件方位和周圍區(qū)域中的聽覺事件方位之間的相關(guān)盡可能高。這意味著,聲源位置始終適應(yīng)影像。攝像機(jī)參數(shù),諸如推拉(zoom),也被結(jié)合到聲音設(shè)計中,例如兩個揚(yáng)聲器L和R的位置。因此,系統(tǒng)將虛擬工作室中的跟蹤數(shù)據(jù)和相關(guān)聯(lián)的時間代碼一起寫入一個文件。影像、聲音和時間代碼同步錄制在MAZ上。Camdump文件被傳送到計算機(jī),該計算機(jī)由此產(chǎn)生用于音頻工作站的控制數(shù)據(jù),并且通過MIDI接口與來自MAZ的影像同步地將其輸出。在音頻工作站內(nèi)執(zhí)行實際音頻處理,如定位周圍區(qū)域內(nèi)的聲源和插入早期反射和混響。信號被提供用于5.1環(huán)繞揚(yáng)聲器系統(tǒng)。
錄制設(shè)定中的攝像機(jī)跟蹤參數(shù),如聲源位置,可以在真實的攝劇組中記錄。這種數(shù)據(jù)也可以在虛擬工作室中產(chǎn)生。
在虛擬工作室中,演員或者主持人是單獨(dú)處于錄音室中的。特別地,他站在藍(lán)色墻壁的前方,也可以被稱為藍(lán)色盒子或者藍(lán)色墻板。在該藍(lán)色墻上,布置藍(lán)色和淺藍(lán)色條紋的圖案。這種設(shè)計的特點在于條紋具有不同的寬度,從而產(chǎn)生多個條紋組合。在后處理期間,當(dāng)使用虛擬背景代替該藍(lán)色墻壁時,由于藍(lán)色墻上的唯一條紋組合,而使得可能準(zhǔn)確確定攝像機(jī)看的方向。通過該信息的幫助,計算機(jī)能夠為當(dāng)前攝像機(jī)視角確定背景。進(jìn)一步地,評估攝像機(jī)上的用于檢測附加的攝像機(jī)參數(shù)并輸出其的傳感器。通過傳感器技術(shù)檢測的攝像機(jī)的典型參數(shù)分別是三個平移度x、y、z,也被稱為旋轉(zhuǎn)(roll)、傾斜(tilt)、搖晃(pan)的三個旋轉(zhuǎn)度,以及焦距或推拉(zoom),該參數(shù)等于關(guān)于攝像機(jī)的孔徑角的信息。
為了即使沒有影像識別和沒有昂貴的傳感器技術(shù),也能夠確定攝像機(jī)的確切位置,也可以使用跟蹤系統(tǒng),該系統(tǒng)包括多個紅外攝像機(jī),用于確定安裝在攝像機(jī)上的紅外傳感器的位置。從而也確定了攝像機(jī)的位置。利用通過傳感器技術(shù)提供的攝像機(jī)參數(shù)和影像識別評估的條紋信息,實時計算機(jī)現(xiàn)在能夠為當(dāng)前影像計算出背景。然而,藍(lán)色背景所具有的藍(lán)色被從影像中除掉,從而引入虛擬背景代替藍(lán)色背景。
在多數(shù)情況下,遵循基于獲取視覺成像場景的聲學(xué)整體效果的設(shè)想。這可以使用來自影像設(shè)計的術(shù)語“全景”來說明。該“全景”聲音效果對場景中的所有設(shè)定保持通常不變,雖然事物的視線光學(xué)角度經(jīng)常變化很大。光學(xué)細(xì)節(jié)通過相應(yīng)的設(shè)置來突出或在背景中被調(diào)整。在影片的對話創(chuàng)建中的反鏡頭(countershots)也不通過聲音再現(xiàn)。
從而,需要讓觀眾在聽覺上進(jìn)入視聽場景。其中,屏幕或者影像區(qū)域是觀眾的視野和視角。這意味著聲音要以總是對應(yīng)于影像的形式跟隨影像。這對于虛擬工作室是特別重要的,因為例如陳述(moderation)的聲音和主持人當(dāng)時所在的環(huán)境之間一般是不相關(guān)的。為了獲得場景的視聽整體效果,必須模擬與所提供的影像相匹配的房間效果。在該環(huán)境中,聲源方位,由于其是通過例如電影屏幕的觀眾所感知的,所以是這種聲音方案中的一個重要的主觀特征。
在音頻域中,可以通過波場合成(WFS)技術(shù)獲得對于大型聽者區(qū)域很好的空間聲音。如已經(jīng)討論的,波場合成是基于惠更斯原理,根據(jù)原理,可以通過覆蓋元波來形成和構(gòu)建波陣面。根據(jù)數(shù)學(xué)校正理論說明,必須使用在無限小距離中的無限多的源來產(chǎn)生元波。然而,事實上,在相互之間有限小的距離中使用有限數(shù)量的揚(yáng)聲器。按照WFS原理,這些揚(yáng)聲器中的每一個通過來自虛擬源的音頻信號控制,該音頻信號具有特定的延遲和特定的能級。能級和延遲對于所有揚(yáng)聲器來說一般是不同的。
在音頻域中存在所謂的自然多普勒效應(yīng)。這種多普勒效應(yīng)由于源以特定頻率發(fā)送音頻信號、接收器接收該信號和源相對于接收器移動而發(fā)生。由于聲學(xué)波形的“擴(kuò)展”或“壓縮”,這引起音頻信號的頻率根據(jù)移動而對于接收器改變。一般地,人是接收器,并且直接聽到這種頻率變化,例如當(dāng)救護(hù)車響著警報器朝一個人開過來然后經(jīng)過這個人。當(dāng)救護(hù)車在這個人前方時與救護(hù)車在他后面時相比,他將聽到的警報聲具有不同的音高。
多普勒效應(yīng)還分別存在于波場合成或聲場合成中。它是物理地基于與上述自然多普勒效應(yīng)相同的背景的。然而,與自然多普勒效應(yīng)相反,在聲場合成中,在發(fā)送器和接收器之間沒有直接路徑。代替地,區(qū)別在于存在原始發(fā)射器和原始接收器。此外,存在二次發(fā)射器和二次接收器。這種情形將在以下參照圖7進(jìn)行討論。
圖7示出了虛擬源700,其隨著時間的推移而從第一位置沿著移動路徑702移動到第二位置,其中第一位置在圖7中用圈“1”表示,第二位置在圖7中用圈“2”表示。并且,示意性給出了三個揚(yáng)聲器704,其用于象征波場合成揚(yáng)聲器陣列。進(jìn)一步,在該場景中有聽者706,其被安置于圖7所示的示例中,從使得虛擬源的移動路徑是圍繞聽者延伸的圓形路徑,該聽者是該環(huán)形路徑的中心。然而,揚(yáng)聲器704不是設(shè)置在中心,其中當(dāng)虛擬源700位于第一位置時,其到一個揚(yáng)聲器的第一距離為r1,并且該源在其第二位置處則具有第二距離r2。在圖7中所示的場景中,r1不等于r2,而表示虛擬源到聽者706的距離的R1等于聽者706在時間2到虛擬源的距離。另一方面,虛擬源700相對于揚(yáng)聲器704發(fā)生了距離變化,因為r1不等于r2。虛擬源表示原始發(fā)射器,而揚(yáng)聲器704表示原始接收器。同時,揚(yáng)聲器704表示二次發(fā)射器,而聽者706表示二次接收器。
在波場合成中,原始發(fā)射器和原始接收器之間的傳輸是“虛擬”發(fā)生的。這意味著,波場合成算法負(fù)責(zé)波形的波陣面的擴(kuò)展和壓縮的原因。在揚(yáng)聲器704從波場合成模塊接收信號時,首先沒有可聽信號。只有在由揚(yáng)聲器輸出之后,該信號才變成可聽的。從而,多普勒效應(yīng)可以在不同地點發(fā)生。
如果虛擬源相對于揚(yáng)聲器移動,則每個揚(yáng)聲器根據(jù)它相對于移動的虛擬源的特定位置而以不同多普勒效應(yīng)再現(xiàn)信號,因為揚(yáng)聲器是處在不同的位置,并因此相對移動對于每個揚(yáng)聲器是不同的。
另一方面,聽者也可以相對于揚(yáng)聲器移動。然而,尤其是在影院環(huán)境(cinema setting)中,這事實上是無關(guān)緊要的,因為聽者相對于揚(yáng)聲器的移動將總是具有相對小多普勒效應(yīng)的相對慢的移動,因為,如本領(lǐng)域所公知的,多普勒頻移與發(fā)射器和接收器之間的相對運(yùn)動成比例。
前一個多普勒效應(yīng),即當(dāng)虛擬源相對于揚(yáng)聲器移動時,能夠聽起來相對自然但也非常不自然。這取決于移動的方向。如果源遠(yuǎn)離系統(tǒng)的中心移動或者以直線方式向中心移動,則產(chǎn)生自然的效果。參照圖7,這將意味著虛擬源700例如沿著箭頭R1遠(yuǎn)離聽者而移動。
然而,如果虛擬源700“環(huán)繞”聽者移動,如圖7所示,則導(dǎo)致非常不自然的效果,因為原始源和原始接收器(揚(yáng)聲器)之間的相對運(yùn)動是很強(qiáng)的并且在不同原始接收器中也非常不同,這與自然明顯相反,其中在環(huán)繞源的情況下,對于聽者不發(fā)生多普勒效應(yīng),因為在源和聽者之間沒有發(fā)生距離改變。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種改進(jìn)的方案,用于計算揚(yáng)聲器信號中的成分在當(dāng)前時間的離散值,其中減少了由于多普勒效應(yīng)導(dǎo)致的人工噪聲。
該目的是通過根據(jù)權(quán)利要求1的設(shè)備、根據(jù)權(quán)利要求18的方法或根據(jù)權(quán)利要求19的計算機(jī)程序來實現(xiàn)的。
本發(fā)明是基于這樣的認(rèn)識,即可以考慮多普勒效應(yīng),因為它們是源的位置辨別所需信息的一部分。如果這種多普勒效應(yīng)必須被完全忽略,這可能導(dǎo)致沒有最優(yōu)的聲音感受,因為該多普勒效應(yīng)是自然的,并且如果例如虛擬源向聽者移動但是沒有進(jìn)行音頻頻率的多普勒頻移,則可能導(dǎo)致非最優(yōu)效果。
另一方面,根據(jù)本發(fā)明,為了“磨平”多普勒效應(yīng),即雖然它存在但是它的效應(yīng)不導(dǎo)致人工噪聲或者僅導(dǎo)致減少的人工噪聲,執(zhí)行從一個位置到另一個位置的“漸變(panning)”。于是,在現(xiàn)有技術(shù)中,當(dāng)發(fā)生延遲變化時,即當(dāng)虛擬源的位置發(fā)生變化時,簡單地在減小的延遲期間人工插入采樣或者簡單地在增加的延遲期間省略采樣。這引起信號中的急劇的跳變。然而,根據(jù)本發(fā)明,通過實現(xiàn)從虛擬源的一個位置到虛擬源的另一個位置的連續(xù)過渡而減少這些急劇跳變。因此,在漸變區(qū)域中,通過使用在第一位置上對于當(dāng)前時間,即第一時間,有效的音頻信號采樣,和通過使用在第二位置上與當(dāng)前時間,即第二時間,相關(guān)的虛擬源的音頻信號采樣,計算用于漸變區(qū)域中當(dāng)前時間的離散值。
優(yōu)選地,漸變?nèi)缦碌匕l(fā)生,即在當(dāng)?shù)谝晃恢酶淖儾⑶覐亩谝谎舆t信息有效的第一時間時,用于被延遲了第一延遲的音頻信號的加權(quán)因子是100%,而用于被延遲了第二延遲的音頻信號的加權(quán)因子是0%,然后從第一時間到第二時間進(jìn)行這兩個加權(quán)因子的相反變化,以便從一個位置到另一個位置的“平滑地”“漸變”。
本發(fā)明方案表示了在位置信息的某種損失之間的折衷,因為不再以每個新的當(dāng)前時間考慮源的新位置信息,因為在相當(dāng)粗略的步長中進(jìn)行虛擬源的位置更新,其中在源的一個位置和在稍后時間出現(xiàn)的源的第二位置之間進(jìn)行漸變。這是通過首先為相對粗略的空間步長寬度,即時間上相對較遠(yuǎn)的位置信息(當(dāng)然考慮源的速度),執(zhí)行延遲而實現(xiàn)的。從而,導(dǎo)致上述在原始發(fā)射器和原始接收器之間的虛擬多普勒效應(yīng)的延遲變化被磨平,即連續(xù)地從一個延遲變化過渡到另一個。根據(jù)本發(fā)明,通過從一個位置到下一個位置的音量定標(biāo)(volume scaling)來進(jìn)行“漸變”,以避免空間跳躍以及由此產(chǎn)生的可聽到的“喀噠(clicks)”。從而,用具有圓滑邊緣的、適應(yīng)硬信號形狀的信號形狀來代替由于延遲變化而“硬”省略或增加采樣,使得考慮延遲變化,但是避免了由于虛擬源的位置變化而產(chǎn)生的、導(dǎo)致人工噪聲的、對揚(yáng)聲器信號的硬影響。
下面將參照附圖對本發(fā)明的優(yōu)選實施例進(jìn)行討論,其中圖1表示發(fā)明的設(shè)備的框圖;圖2表示可用于本發(fā)明的波場合成環(huán)境的原理圖;圖3表示圖2所示的波場合成模塊的詳細(xì)表示;圖4a表示虛擬源在第一時間具有第一延遲D=0的離散音頻信號波形;圖4b表示與圖4a中相同的音頻信號的表示,但是延遲D=2;圖4c表示在圖4a有效的第一時間和圖4b有效的第二時間之間的時間期間中基于圖4a和4b中所示音頻信號的第一漸變方案,;圖4d表示在比圖4c晚的、圖4b所示信號有效的時間的進(jìn)一步漸變表示;圖5表示基于虛擬源i的揚(yáng)聲器信號中的成分Kij的波形,該揚(yáng)聲器信號由圖4a到4d的波形構(gòu)成;圖6表示在計算圖4a到4d所示的音頻信號中所使用的加權(quán)因子m、n的詳細(xì)表示;
圖7表示用于說明虛擬多普勒效應(yīng)的場景;和圖8表示沒有漸變的成分Kij的波形。
具體實施例方式
在參照圖1詳細(xì)說明本發(fā)明的設(shè)備之前,首先參照圖2對典型的波場合成環(huán)境進(jìn)行說明。包括多個輸入端202、204、206和208以及多個輸出端210、212、214和216的波場合成模塊200是波場合成環(huán)境的中心。用于虛擬源的不同音頻信號通過輸入端202到204提供給波場合成模塊。從而,例如,輸入端202接收虛擬源1的音頻信號以及虛擬源的相關(guān)位置信息。例如在影院環(huán)境中,音頻信號1可以是例如從屏幕的左側(cè)移動到屏幕右側(cè)、并且還可能遠(yuǎn)離觀眾或者靠近觀眾的演員的話音。于是,音頻信號1將是該演員的真實話音,而位置信息作為時間的函數(shù)表示第一演員在錄制環(huán)境中在某一時間的當(dāng)前位置。相對地,音頻信號n將是例如與該第一個演員以相同方式或者不同方式移動的另一個演員的話音。音頻信號n與其相關(guān)的、該另一演員的當(dāng)前位置,通過與音頻信號n同步的位置信息被提供到波場合成模塊200。事實上,分別根據(jù)錄制環(huán)境和工作室存在不同的虛擬源,其中每個虛擬源的音頻信號被作為單獨(dú)的音頻軌道(audio track)被提供到該波場合成模塊200。
如上面所解釋的,一個波場合成模塊通過從輸出端210到216將揚(yáng)聲器信號輸出到單獨(dú)的揚(yáng)聲器來饋送多個揚(yáng)聲器LS1、LS2、LS3、LSm。通過輸出端206,各個揚(yáng)聲器在再現(xiàn)環(huán)境,例如影院,中的位置被提供到波場合成模塊200。在影院中,許多單個揚(yáng)聲器被分組圍繞在觀眾四周,其優(yōu)選地被這樣布置成陣列,使得揚(yáng)聲器既在觀眾前方,即例如在屏幕后面,也在觀眾后面以及在觀眾的右側(cè)和左側(cè)。而且,可以將其他輸出提供給波場合成模塊200,諸如關(guān)于房間音質(zhì)(room acoustics)的信息等,以便能夠在影院中模擬錄制環(huán)境期間實際的房間音質(zhì)。
一般地,例如通過輸出端210提供給揚(yáng)聲器LS1的揚(yáng)聲器信號,將是虛擬源的成分信號的疊加(superposition),其中用于揚(yáng)聲器LS1的揚(yáng)聲器信號包括來自虛擬源1的第一成分,來自虛擬源2的第二成分以及來自虛擬源n的第n成分。各個成分信號被線性疊加,即在它們的計算之后相加,以在聽者的耳朵中再現(xiàn)線性疊加,聽者將聽到他在真實環(huán)境中能夠感知到的聲源的線性疊加。
下面,將參照圖3對波場合成模塊200的詳細(xì)設(shè)計進(jìn)行說明。波場合成模塊200具有非常并行的結(jié)構(gòu),其中從用于每個虛擬源的音頻信號開始和從用于相應(yīng)的虛擬源的位置信息開始,首先計算延遲信息Vi和定標(biāo)因子SFi,其依賴于位置信息和剛才考慮的揚(yáng)聲器的位置,例如具有序號j的揚(yáng)聲器LSj?;谔摂M源的位置信息和考慮的揚(yáng)聲器j的位置來計算延遲信息Vi和定標(biāo)因子SFi是通過在裝置300、302、304、306中實現(xiàn)的已知算法執(zhí)行的?;谘舆t信息Vi(t)和SFi(t)以及基于與單個虛擬源相關(guān)的音頻信號ASi(t),為當(dāng)前時間tA計算在最終獲得的揚(yáng)聲器信號中的成分信號Kij的離散值A(chǔ)Wi(tA)。這是通過裝置310、312、314、316完成的,如圖3中示意性說明的。而且,圖3顯示了對于各個成分信號在時間tA的“閃光錄制(flash lightrecording)”。然后,通過求和器320對各個成分信號求和,以確定對于揚(yáng)聲器j的揚(yáng)聲器信號的當(dāng)前時間tA的離散值,其可以被提供給揚(yáng)聲器用于輸出(例如輸出214,如果揚(yáng)聲器是揚(yáng)聲器LS3)。
如從圖3中可以看出的,首先,對于每個虛擬源單獨(dú)計算一個值,由于延遲和以定標(biāo)因子定標(biāo),其在當(dāng)前時間有效,然后對用于一個揚(yáng)聲器的由于不同虛擬源的所有成分信號求和。如果,例如只存在一個虛擬源,則求和器將被省略,并且,當(dāng)虛擬源1是唯一的虛擬源時,應(yīng)用到圖3中的求和器輸出端的信號將例如對應(yīng)于裝置310所輸出的信號。
下面,將參照圖4a、4b和8討論圖3中所示設(shè)備的操作模式。圖4a示出了虛擬源在時間t′上的示例性音頻信號,時間t′具有從時間t′=0延續(xù)到時間t′=13的離散值。作為在時間t′=0的定標(biāo)因子,假定定標(biāo)因子為1。并且,不失一般性的,假定已經(jīng)通過波場合成模塊在時間t′=0計算了0采樣的延遲。
在第一時間t′=0,其在圖4a中用401進(jìn)一步標(biāo)出,圖4a中所示的虛擬源的音頻信號將被播放,而在圖4a中指示的第二時間402,從具有延遲D=0的音頻信號切換到相同的音頻信號,但是具有延遲D=2。切換時間在圖4a中用箭頭404進(jìn)一步標(biāo)出。
從虛擬源移位D=2的音頻信號在圖4b中給出,作為時間的函數(shù)從當(dāng)前時間t′=-2到t′=12。從而,基于圖4a和圖4b中所示虛擬源的用于揚(yáng)聲器信號的成分包括在圖4a中所示從時間0到時間8的值,以及在圖4b中所示從時間9到在后來當(dāng)被再次通知位置變化的時間的當(dāng)前時間9到12的采樣。該信號在圖8中顯示。可以看出,在切換時間,即從一個位置切換到另一個位置的時間,其中切換在圖8中用404再次標(biāo)出,已經(jīng)省略了兩個采樣。根據(jù)圖4a中所示的音頻信號,具有幅度1的采樣將必然在時間9出現(xiàn),但是在時間10出現(xiàn)具有幅度0的采樣,然而圖8所示的信號已經(jīng)在時間10具有幅度為2的采樣,這是由于延遲D=2的原因。這種兩個采樣的省略導(dǎo)致了上述的虛擬多普勒效應(yīng)。
為了抑制不希望的特性以及抑制由這個從一個延遲切換到另一個延遲而引起的人工噪聲,將使用圖1中所示的本發(fā)明的設(shè)備。圖1示出了一種用于在波場合成系統(tǒng)中計算基于虛擬源i的揚(yáng)聲器j的揚(yáng)聲器信號中的成分Kij對于當(dāng)前時間的離散值的設(shè)備,該波場合成系統(tǒng)具有波場合成模塊和多個揚(yáng)聲器。特別地,波場合成模塊被形成為,通過使用與虛擬源相關(guān)的音頻信號和通過使用指示虛擬源位置的位置信息來確定延遲信息,該延遲信息指示音頻信號相對于成分中的時間基準(zhǔn)延遲多少個采樣。圖1中所示設(shè)備包括用于提供第一延遲和第二延遲的裝置10,其中第一延遲與虛擬源的第一位置相關(guān),第二延遲與虛擬源的第二位置相關(guān)。特別地,虛擬源的第一位置與第一時間相關(guān),而虛擬源的第二位置與比第一時間晚的第二時間相關(guān)。并且,第二位置與第一位置不同。第二位置例如是圖7中用圈“2”表示的虛擬源的位置,而第一位置是在圖7中用圈“1”表示的虛擬源700的位置。
從而,該提供裝置10在輸出側(cè)提供用于第一時間的第一延遲12a和用于第二時間的第二延遲12b。可選地,除了延遲之外,該裝置10還進(jìn)一步形成為輸出用于兩個時間的定標(biāo)因子,如下面所討論的。
在裝置10的輸出端12a、12b的兩個延遲被提供到裝置14,用于確定被延遲第一延遲的音頻信號對于當(dāng)前時間(其可以通過輸入端18被通知)的值,其中該音頻信號通過輸入端16提供到裝置14,以及用于確定被延遲第二延遲的音頻信號對于當(dāng)前時間的第二值。在輸出側(cè),該確定裝置14首先提供被延遲第一延遲的音頻信號在時間ti′=tA的第一值A(chǔ)1(ti′),其在圖1中用20a表示,以及被延遲第二延遲12b的音頻信號在當(dāng)前時間ti′=tA的第二值,其中A1在第一時間確實有效,而A4在第二時間確實有效。
此外,本發(fā)明的設(shè)備包括用于以第一加權(quán)因子對A1的第一值加權(quán)以獲得加權(quán)的第一值24a的裝置22。并且,裝置22還能夠以第二加權(quán)因子n對來自A4的第二值20b加權(quán)以獲得第二加權(quán)的值24b。這兩個加權(quán)值24a和24b被提供到裝置26,用于對這兩個值求和,以得到基于虛擬源i的揚(yáng)聲器j的揚(yáng)聲器信號中的成分Kij對于當(dāng)前時間的“漸變”離散值28。
下面,將根據(jù)圖4c、4d、5和6對圖1所示設(shè)備的功能進(jìn)行示例性說明。在圖4a和4b中解釋的情景中,在10個采樣之后要求從一個延遲切換到另一個延遲。第一時間401是當(dāng)前時間tA=0,而第二時間402是當(dāng)前時間tA=9。
根據(jù)本發(fā)明,對第一時間401的值A(chǔ)1和第二時間402的值A(chǔ)4都不改變。然而,根據(jù)本發(fā)明,對t1401和t2402之間的所有值進(jìn)行修改,即與位于第一時間401和第二時間402之間的當(dāng)前時間tA相關(guān)的值,。從而對于隨后的示例性解釋,當(dāng)前時間從時間t′=1延續(xù)到t′=8。
這在圖6的圖表中以數(shù)學(xué)術(shù)語表示出來,其中將第一加權(quán)因子m表示為在第一時間401和第二時間402之間的當(dāng)前時間的函數(shù)。從而,第一加權(quán)因子m單調(diào)遞減,而第二加權(quán)因子n單調(diào)遞增。在第一時間401,即t′=0,m=1和n=0。另一方面,在時間402,第一加權(quán)因子m=0,第二加權(quán)因子n=1。在第一時間401和第二時間402之間,這兩個加權(quán)因子將具有階躍狀曲線(a step like curve),因為僅能對每個采樣點、而不是連續(xù)地進(jìn)行計算。階躍狀曲線在圖6中以虛線方式表示,其根據(jù)第一時間401和第二時間402之間漸變事件的數(shù)量和預(yù)定的計算性能資源、通常相應(yīng)地靠在連續(xù)線上。
只是示例性的,在圖6所示的實施例中,其也反映在圖4c和4d中,在第一時間401和第二時間402之間使用兩個漸變事件。第一漸變事件在當(dāng)前時間tA=3發(fā)生,而第二漸變事件在當(dāng)前時間tA=6發(fā)生。在圖6中的一條線600中所示出的、具有與第一漸變時間相關(guān)的加權(quán)因子m和n的信號在圖4c中以A2表示。而且,與第二漸變時間602相關(guān)的信號在圖4d中以A3表示。最終計算的(圖4a到4d僅用于說明目的)成分Kij的真實波形在圖5中示出。在圖4a到4d、圖5和圖6中所示的實施例中,不是對于每個新采樣,即以周期長度tA,而是僅僅每三個采樣時間周期地計算新的加權(quán)因子。從而,對于當(dāng)前時間0、1和2,對應(yīng)于這些時間的采樣從圖4a中獲得。對于當(dāng)前時間3、4和5,取圖4c的對于時間3、4和5的采樣。進(jìn)一步,對于時間6、7和8,取屬于圖4d的采樣,而最后對于時間9、10和11以及直到位置的下一個變化或者到下一個漸變動作的其他時間,分別取圖4b的分別對應(yīng)于當(dāng)前時間9、10或11的采樣。圖5和圖8的比較揭示了在當(dāng)前時間tA=9處的采樣周圍的明顯對稱被減輕,其中引起圖8中人工噪聲的兩個采樣的“省略(omitting)”對應(yīng)地在圖5中被“磨平(slurred)”。
當(dāng)圖5中所示的位置更新間隔PAI不僅僅是如圖5所示每三個采樣地執(zhí)行,而是在每個采樣進(jìn)行,使得圖5中的參數(shù)N將變?yōu)?,那么就能獲得“更好的”磨平。在這種情況下,表征第一加權(quán)因子m的階躍曲線將相應(yīng)地更接近于連續(xù)曲線??蛇x地,位置更新間隔也可以被設(shè)定為大于3,從而,例如在第二時間402和第一時間401之間的間隔的中間僅執(zhí)行一次更新,從而在該間隔的前一半,即對于當(dāng)前時間tA=1到4,m=1和n=0,而對于該相應(yīng)間隔的后一半,即對于當(dāng)前時間5、6、7和8,m和n將是0.5,從而在第二時間402,即當(dāng)前時間tA=9,n變?yōu)?而m變?yōu)?。關(guān)于是否在每個采樣執(zhí)行漸變或者是否僅對所有N個采樣執(zhí)行一個漸變,即位置更新,的選擇,可以根據(jù)不同情況而不同。特別地,它可以取決于虛擬源的移動有多快。如果它移動很慢,則使用相對高的參數(shù)N就已經(jīng)足夠,即僅在相對高數(shù)量的采樣之后執(zhí)行新位置更新,即產(chǎn)生圖6中的新“臺階”,而在相反的情況,即當(dāng)虛擬源移動很快時,則優(yōu)選地進(jìn)行更為頻繁的位置更新。
在圖4a-4d中所示的實施例中,假定所考慮的虛擬源的第一位置信息在第一時間401存在,而對于虛擬源的第二位置信息在第二時間402存在,該第二時間402是在第一時間后9個采樣。根據(jù)實施方式,可能出現(xiàn)對于每個采樣存在各自的位置信息,并且這種位置信息可以分別很容易地獲得以用于插值。從而,至此,已經(jīng)在很小的空間中、并因此在時間階躍中為每個中間位置計算了源的移動,以避免從一個延遲切換到另一個延遲期間音頻信號中的可聽到的喀噠聲(clicks),其中這種切換僅在切換之前和之后的采樣差別不太大時被避免。
然而,對于本發(fā)明的漸變,當(dāng)前時間tA必須位于第一時間401和第二時間402之間。根據(jù)本發(fā)明,最小“步長”,即第一時間401和第二時間402之間的最小距離,是兩個采樣周期,從而在第一時間401和第二時間402之間的當(dāng)前時間可以以例如為0.5的各自加權(quán)因子來處理。然而在實際中,優(yōu)選為更大的步長,一方面為了計算時間的原因,另一方面為了產(chǎn)生漸變效果,漸變效果當(dāng)在下一個時間已經(jīng)到達(dá)隨后位置時不發(fā)生,這在常規(guī)波場合成中又導(dǎo)致自然多普勒效應(yīng)。步長寬度,即從第一時間401到第二時間402的距離,的上限在于,自然,隨著距離的增加,越來越多的實際提供的位置信息由于漸變而被忽略,這在極端情況下將導(dǎo)致虛擬源對于聽者的可定位性損失。從而,中等區(qū)域的步長是優(yōu)選的,其還可以根據(jù)實現(xiàn)方式而取決于虛擬源的速度,以實現(xiàn)自適應(yīng)步長控制。
在圖6所示的實施例中,選擇一條線性曲線作為用于第一和第二加權(quán)因子的階躍曲線的“基線”??蛇x地,可以使用正弦、二次、三次等曲線。在這種情況下,其他加權(quán)因子的相應(yīng)曲線將必須是互補(bǔ)的,其中第一和第二加權(quán)因子的和總是等于1或者在預(yù)定容差范圍內(nèi),該容差范圍例如在1的正負(fù)10%之間。一個選擇可以是,例如,對于第一加權(quán)因子,取根據(jù)正弦函數(shù)的平方的曲線,對于第二加權(quán)因子取根據(jù)余弦函數(shù)的平方的曲線,因為對于每個自變量,即對于每個當(dāng)前時間tA,正弦和余弦的平方等于1。
在圖4a到4d,目前已經(jīng)假定,在第一時間401和第二時間402的定標(biāo)因子都等于1。這不是必須這樣的。從而,與虛擬源相關(guān)的音頻信號的每個采樣將具有特定值Bi。然后,波場合成模塊將計算用于第一時間401的第一定標(biāo)因子SF1和用于第二時間402的第二定標(biāo)因子SF2。于是,第一時間401和第二時間402之間的當(dāng)前時間點tA的實際采樣如下AWi=B(tA)*m*SF1+B(tA)*n+SF2。
根據(jù)上式,為了簡化起見,音頻信號的值與兩個加權(quán)因子的乘法可以由該值與這兩個加權(quán)因子的積的乘法來代替。
根據(jù)環(huán)境,如圖1所示的本發(fā)明的方法可以用硬件或軟件實現(xiàn)。該實現(xiàn)可以在數(shù)字存儲介質(zhì),尤其是具有電子可讀控制信號的磁盤或CD,上完成,其中電子可讀控制信號能夠與可編程計算機(jī)系統(tǒng)相結(jié)合以執(zhí)行該方法。從而,一般地,本發(fā)明還包括一種計算機(jī)程序產(chǎn)品,具有存儲在機(jī)器可讀載體上的程序代碼,用于當(dāng)計算機(jī)程序產(chǎn)品在計算機(jī)上運(yùn)行時執(zhí)行本發(fā)明的方法。換句話說,本發(fā)明因此可以實現(xiàn)為計算機(jī)程序,該計算機(jī)程序具有用于當(dāng)計算機(jī)程序在計算機(jī)上執(zhí)行時執(zhí)行該方法的程序代碼。
權(quán)利要求
1.用于在波場合成系統(tǒng)中計算基于虛擬源(i)的揚(yáng)聲器(j)的揚(yáng)聲器信號(322)中成分(Kij)對于當(dāng)前時間(tA)的離散值(28)的設(shè)備,其中所述波場合成系統(tǒng)具有波場合成模塊和多個揚(yáng)聲器(LS1,LS2,LS3,LSm),其中所述波場合成模塊被設(shè)置為通過使用與所述虛擬源相關(guān)的音頻信號(16)和通過使用指示所述虛擬源位置的位置信息來確定延遲信息,所述延遲信息指示所述音頻信號相對于所述成分中的時間基準(zhǔn)延遲多少個采樣,所述設(shè)備包括用于提供與在第一時間所述虛擬源的第一位置相關(guān)的第一延遲(12a)、和用于提供與在稍晚的第二時間所述虛擬源的第二位置相關(guān)的第二延遲(12b)的裝置(10),其中所述第二位置與所述第一位置不同,并且所述當(dāng)前時間(tA)位于所述第一時間(400)和所述第二時間(402)之間;用于確定被延遲所述第一延遲的音頻信號(A1)對于所述當(dāng)前時間(tA)的值、和用于確定被延遲所述第二延遲的音頻信號(A4)對于所述當(dāng)前時間(tA)的值的裝置(14);用于以第一加權(quán)因子(m)對所述第一值加權(quán)以獲得第一加權(quán)值(24a)、和以第二加權(quán)因子(n)對所述第二值加權(quán)以獲得第二加權(quán)值(24b)的裝置(22);以及用于對所述第一加權(quán)值(24a)和所述第二加權(quán)值(24b)求和(26)以得到對于所述當(dāng)前時間(tA)的離散值(28)的裝置。
2.根據(jù)權(quán)利要求1所述的設(shè)備,其中為所述第一和第二時間(400,402)之間的值這樣設(shè)置所述第一加權(quán)因子(m)和所述第二加權(quán)因子(n),使得從所述被延遲第一延遲的音頻信號漸變到所述被延遲第二延遲的音頻信號。
3.根據(jù)權(quán)利要求1或2所述的設(shè)備,其中所述第一加權(quán)因子(m)在所述第一時間(400)和所述第二時間(402)之間遞減,而所述第二加權(quán)因子在所述第一時間(400)和所述第二時間(402)之間遞增。
4.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中所述第一加權(quán)因子在所述第一時間等于1,而在所述第二時間等于0,所述第二加權(quán)因子(n)在所述第一時間等于0,而在所述第二時間等于1。
5.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中所述第一和第二加權(quán)因子取決于所述當(dāng)前時間和所述第一時間(400)或所述第二時間(402)之間的差。
6.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中所述第一加權(quán)因子從所述第一時間到所述第二時間單調(diào)遞減,而所述第二加權(quán)因子從所述第一時間到所述第二時間單調(diào)遞增。
7.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中所述第一加權(quán)因子和所述第二加權(quán)因子的和位于圍繞預(yù)定值的預(yù)定容差范圍之內(nèi)。
8.根據(jù)權(quán)利要求7所述的設(shè)備,其中所述預(yù)定容差范圍是正或負(fù)10%。
9.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中所述音頻信號是被一個采樣周期(TA)間隔開的時間離散值的序列。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其中所述第一時間和所述第二時間是固定的。
11.根據(jù)權(quán)利要求9所述的設(shè)備,其中所述用于提供第一和第二延遲的裝置(10)被設(shè)置為根據(jù)位置信息來設(shè)定所述第一時間和所述第二時間的時間差,使得所述時間差在所述虛擬源以較低速度移動時較大,而所述時間差當(dāng)所述虛擬源以較高速度移動時較小。
12.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中所述第一時間和所述第二時間之間的時間差是N個采樣周期,并且其中所述用于加權(quán)的裝置(22)被設(shè)置為,對于M個連續(xù)的當(dāng)前采樣中的一些使用相同的第一加權(quán)因子和相同的第二加權(quán)因子,其中M小于N并且大于或等于2。
13.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中所述用于加權(quán)的裝置(22)被設(shè)置為,為每個當(dāng)前采樣計算當(dāng)前第一加權(quán)因子和當(dāng)前第二加權(quán)因子,使得用于每個當(dāng)前采樣的第一和第二加權(quán)因子與已經(jīng)為確定的先前采樣所確定的第一和第二加權(quán)因子不同。
14.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中所述用于提供的裝置(10)被設(shè)置為基于用于先前時間的一個或多個延遲來估計用于所述第二時間的第二延遲。
15.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中所述虛擬源的位置信息根據(jù)時間模式與用于所述虛擬源的音頻信號相關(guān),其中所述第一和第二時間被比所述時間模式的兩個模式點之間的時間距離長的時間間隔分隔開。
16.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中對于多個虛擬源存在多個音頻信號,其中為每個虛擬源計算成分信號,并且為一個揚(yáng)聲器將所有成分信號相加以獲得用于所述揚(yáng)聲器的揚(yáng)聲器信號。
17.根據(jù)前述任何一個權(quán)利要求所述的設(shè)備,其中所述波場合成模塊被設(shè)置為除了所述延遲信息之外還計算定標(biāo)信息,所述定標(biāo)信息指示與所述虛擬源相關(guān)的音頻信號要通過哪個定標(biāo)因子來定標(biāo),并且其中所述用于加權(quán)的裝置(22)被設(shè)置為,計算所述第一加權(quán)值(24a)作為所述音頻信號對于當(dāng)前時間的值和用于當(dāng)前時間的第一定標(biāo)因子以及所述第一加權(quán)因子的乘積,并且所述用于加權(quán)的裝置(22)進(jìn)一步被設(shè)置為,計算所述第二加權(quán)值作為所述音頻信號對于當(dāng)前時間的值和用于第二時間的第二定標(biāo)因子以及所述第二加權(quán)因子的乘積。
18.用于在波場合成系統(tǒng)中計算基于虛擬源(i)的揚(yáng)聲器(j)的揚(yáng)聲器信號(322)中成分(Kij)對于當(dāng)前時間(tA)的離散值(28)的方法,其中所述波場合成系統(tǒng)具有波場合成模塊和多個揚(yáng)聲器(LS1,LS2,LS3,LSm),其中所述波場合成模塊被設(shè)置為通過使用與所述虛擬源相關(guān)的音頻信號(16)和通過使用指示所述虛擬源位置的位置信息來確定延遲信息,所述延遲信息指示所述音頻信號相對于所述成分中的時間基準(zhǔn)延遲多少個采樣,所述方法包括提供(10)與所述虛擬源在第一時間的第一位置相關(guān)的第一延遲(12a),和提供與所述虛擬源在稍晚的第二時間的第二位置相關(guān)的第二延遲(12b),其中所述第二位置與所述第一位置不同,并且所述當(dāng)前時間(tA)位于所述第一時間(400)和所述第二時間(402)之間;確定(14)被延遲所述第一延遲的音頻信號(A1)對于所述當(dāng)前時間(tA)的值,和確定被延遲所述第二延遲的音頻信號(A4)對于所述當(dāng)前時間(tA)的值;以第一加權(quán)因子(m)對所述第一值加權(quán)(22)以獲得第一加權(quán)值(24a),和以第二加權(quán)因子(n)對所述第二值加權(quán)以獲得第二加權(quán)值(24b);以及對所述第一加權(quán)值(24a)和所述第二加權(quán)值(24b)求和(26),以得到用于所述當(dāng)前時間(tA)的離散值(28)。
19.計算機(jī)程序,具有用于當(dāng)所述程序在計算機(jī)上運(yùn)行時執(zhí)行根據(jù)權(quán)利要求18所述的方法的程序代碼。
全文摘要
為了減少在波場合成中由于從一個時間到第二時間的延遲變化而導(dǎo)致的多普勒人工噪聲,首先,確定用于第一時間的延遲和用于第二時間(10)的延遲。然后,確定(14)被延遲第一延遲的音頻信號在當(dāng)前時間的值和被延遲第二延遲的音頻信號在當(dāng)前時間的值。接著,利用第一加權(quán)因子對該第一值加權(quán),和利用第二加權(quán)因子(22)對第二值平均,然后對該兩個加權(quán)值相加(26)以得到基于虛擬源的揚(yáng)聲器的揚(yáng)聲器信號中成分在當(dāng)前時間的離散值。從而,通過了解在稍后時間的延遲,實現(xiàn)了從一個延遲到隨后延遲的漸變,這減少了不希望的多普勒人工噪聲。
文檔編號H04R7/00GK1792118SQ200480013309
公開日2006年6月21日 申請日期2004年5月11日 優(yōu)先權(quán)日2003年5月15日
發(fā)明者托馬斯·羅德爾, 托馬斯·斯波爾, 森達(dá)·布瑞克斯 申請人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司