專利名稱:改善最佳收聽區(qū)域內(nèi)的聲場渲染精度的方法和設備的制作方法
技術領域:
本發(fā)明涉及一種使用多個揚聲器根據(jù)第一音頻輸入信號的聲場再現(xiàn)(reproduction)方法和設備,所述多個揚聲器旨在合成其中沒有放置揚聲器的最佳收聽 區(qū)域內(nèi)的聲場,所述聲場被描述為從虛擬源發(fā)出,所述方法包括步驟根據(jù)源自曲面積分 (surface integral)的聲場再現(xiàn)技術使用虛擬源描述數(shù)據(jù)和揚聲器描述數(shù)據(jù)來計算定位 濾波器系數(shù);和應用定位濾波器系數(shù)來過濾所述第一音頻輸入信號,以便形成第二音頻輸 入信號。
背景技術:
聲場再現(xiàn)是指擴展空間部分內(nèi)的聲波場(acoustic wave field)的物理屬性的 合成。這種框架能夠擺脫基于立體聲的聲音再現(xiàn)技術中關于聽眾定位約束的公知限制,即 所謂的“最佳聽音位置(sweet spot)”。該最佳聽音位置是其中依賴于立體聲原理的幻覺 (illusion)有效的小區(qū)域。在兩聲道立體聲的情況下,如果聽眾位于揚聲器中線上,則歌 手的嗓音可能位于兩個揚聲器的中間。這種幻覺被稱作幻象聲源成像(phantom source imaging)。它是通過向兩個揚聲器饋送相同信號而簡單形成的。然而如果聽眾移動,則該 幻覺消失,并且該嗓音將在最近的揚聲器上聽到。因此,幻象聲源成像在“最佳聽音位置”以 外是不可能的。通常假設聽眾離每個揚聲器一段等于揚聲器間隔(spacing)的距離。這使得人們 能夠定義所謂的“搖攝定律(panning laws) ”以便在距聽眾一給定角坐標處安置一虛擬源。 然而,如果聽眾剛好位于該最佳聽音位置處,則這可能被感受到。聲場再現(xiàn)技術在聽眾位置方面不進行任何假設。虛擬聲音成像通過合成目標聲場 來實現(xiàn)。存在三種方法來描述目標聲場·基于對象的描述,·基于波的描述,·表面描述。在基于對象的描述中,目標波場被描述為聲源的集合(ensemble)。每個源進一步 通過它的位置相對于給定參考點及其輻射特性來定義。根據(jù)該描述,聲場可以在任一空間 點被估計。在基于波的描述中,目標聲場被分解為所謂的“空間獨立的波分量”,其提供目標 聲場的空間特性的唯一表示。根據(jù)所選的坐標,空間獨立的波分量通常是 柱面諧波(極坐標),·球面諧波(球面坐標), 平面波(笛卡爾坐標)。為了準確地描述聲場,基于波的描述需要無限數(shù)量的空間獨立的波分量。實際上, 使用有限數(shù)量的分量,這會給出一種在減少的空間部分中保持有效的聲場的描述。最后,表面描述依賴于在子空間Ω的邊界處的目標聲場的壓力和/或壓力梯度的 常規(guī)分量的連續(xù)描述。根據(jù)該描述,目標聲場可以在完整的子空間Ω中使用所謂的曲面積分(Rayleigh 1,Rayleigh 2 和 Kirchhoff-Helmholtz 積分)得以估計。應當注意,存在將使用一種方法的描述變換到另一種方法的轉換 (transformation) 0例如,通過在子空間Ω的邊界處外推由聲學對象輻射的聲場,在表面 描述中能夠容易地轉換基于對象的描述。在過去幾年中,已經(jīng)研發(fā)了數(shù)種方法來合成擴展收聽區(qū)域中的目標波場。這些方 法中的一種方法依賴于通過使用多個揚聲器來重建由虛擬源發(fā)出的聲場的波陣面的曲率 (基于對象的描述)。該方法已被 A. J. Berkhout 在"Aholographic approach to acoustic control,,(Journal of the Audio Eng. Soc. , Vol. 36, pp 977-995,1988)中公開并且己知 為名稱"Wave Field Synthesis,,。第二種方法依賴于波場被分解為空間獨立的波場分量,例如球狀諧波或圓柱狀 諧波(基于波的描述)。該第二種方法已被M.A. Gerzon在“Ambisonicin multichannel broadcasting and video" (Journal of the Audio EngineeringSociety, vol.33, pp. 859-871,1985)中公開。兩種方法被數(shù)學地關聯(lián),如由J6r0meDaniel、Rozenn Nicol 和S6bastienMoreau 在"Further Investigations of High Order Ambisonics and WavefieldSynthesis for Holophonic Sound Imaging(Audio Engineering Society,Proceedings of the 114th AES Convention, Amsterdam, The Netherlands, March22_25,2003),,中公開。它們通常被稱作 Holophonic (全體聲音的)方法。理論上,這些方法允許在所有三維空間中控制某一聽音區(qū)內(nèi)的波場。然而,這僅當 使用無限數(shù)量的揚聲器(連續(xù)分布的揚聲器)時才正確。實際上,使用有限數(shù)量的揚聲器 會在合成的聲場中導致物理的不準確性。舉例來說,波場合成(Wave Field Synthesis)源自Rayleigh (瑞利)1積分,其要 求連續(xù)平面無限分布的理想全向輔助源(揚聲器)。使用三次連續(xù)逼近從Rayleigh 1積分 (假設虛擬源和聽眾處于相同的水平面)來推導波場合成1.將無限平面化成簡位于源和聽眾所在的水平面中的無限線條,2.將無限線條化成簡適合試聽室的線段(segmen),3.將該線段空間取樣成揚聲器所在的有限數(shù)量的位置。在這些逼近之后,將揚聲器陣列認為是聲學孔徑(acoustical aperture),通過該 聲學孔徑,輸入聲場(如從目標聲源發(fā)出)傳播到擴展的且仍有限的收聽區(qū)域。簡單的幾何 學考慮使得人們能夠定義源/揚聲器可視區(qū)域(source/loudspeaker visibility area), 在該源/揚聲器可視區(qū)域中虛擬源通過揚聲器陣列“可視”。術語“可視”此處是指連接虛 擬源和聽眾的直線與揚聲器所在的線段交叉。該源/揚聲器可視區(qū)域25顯示在圖1中,其 中虛擬源5通過僅在有限空間部分中的揚聲器2陣列可視。它勾勒了其中目標聲場可被適 當?shù)睾铣傻乃鲇邢迏^(qū)域,如由 Ε. W. Start 在 “Direct Sound Enhancement byffave Field Synthesis,, (Ph.D.Thesis,Technical University Delft,Delft,TheNetherlands(1997)) 中公開的。源相反地可僅位于有限區(qū)域中,以便它們在整個收聽區(qū)域內(nèi)保持可視,如由 E. Corteel ^"Equalization in extended area using multichannel inversionand wave field synthesis,,(Journal of the Audio Engineering Society, vol. 54, no. 12,2006)中公開的。圖2描述了考慮收聽區(qū)域6和揚聲器2陣列擴展的合成源定位區(qū)域31。通過在收聽區(qū)域周圍添加輔助的揚聲器陣列可以擴展源定位區(qū)域。考慮 所獲得的揚聲器陣列幾何學,Rayleigh 1積分并不再適用。因此使用類似的逼近從 Kirchhoff-Helmholtz積分推導揚聲器驅動信號·逼近1 將輔助源表面化成簡在水平面中的線性分布,·逼近2 選擇相關的揚聲器,·逼近3 將連續(xù)分布取樣成有限數(shù)量的成行揚聲器,如由 R. Nicol 在 “Restitution sonore spatialisee sur une zone etendue applicationala telepresence" (Ph. D. thesis, Universitedu Maine, Le Mans, Fance, 1999)中公開的。在Kirchhoff-HelmhoItz積分的最初公式中,輔助源分布由理想的全向源(單極) 和理想的雙向源(雙極)組成。然而,如由R. Nicol在“Restitutionsonore spatialisee sur une zone etendue !application ala telepresence" (Ph.D.thesis, Universitedu Maine, Le Mans, Fance, 1999)中公開的,揚聲器陣列可被分為兩類(相關揚聲器和不相關 揚聲器),如下1.單極和雙極的作用(contribution)是同相的(相關揚聲器),2.單極和雙極的作用是異相的(不相關揚聲器)并且傾向于彼此補償。如果虛擬源位于收聽區(qū)域之外,則可以根據(jù)虛擬源和輔助源的位置使用簡單的幾 何標準來進行相關揚聲器與不相關揚聲器的鑒別。在虛擬源位于收聽區(qū)域內(nèi)(也被稱作聚 焦源)的情況下,選擇標準也應當考慮參考位置,如在DE 10328335中公開的。通過單極和雙極發(fā)出的聲場具有幾乎相似的時空特性。然而,相關單極和相關 雙極是同相的,并且趨向于僅產(chǎn)生雙聲壓級(double sound pressurelevel),而不相關 單極和不相關雙極是異相的,并且僅趨向于彼此補償。因此,僅相關單極可用于目標聲場 的合成。這是有益的,因為大多數(shù)可用的揚聲器具有更全向的輻射特性。使用“曲面積 分”的簡化可以定義根據(jù)全體聲音原理的更一般分類的聲場渲染(rendering)技術,如由 R.Nicol ^"Restitutionsonore spatialisee sur une zone etendue !application ala telepresence" (Ph. D. thesis, Universitedu Maine, Le Mans, Fance, 1999)中公開白勺?!?出的簡化包括1.減少所需揚聲器分布的空間擴展(對于波場合成的逼近1和2),2.所需揚聲器分布的空間取樣(對于波場合成的逼近3)。對于這些“曲面積分”(Rayleigh 1和Kirchhoff-Helmholtz)的先前定義的逼近 介紹了相對于目標聲場在合成聲場中的不準確性,如由E. Corteel在“Caract6risation et extensions de la Wave Field Synthesis en conditions reelles,, (UniversiteParis 6,PhD thesis,Paris, 2004)中公開的。在波場合成的情況下,將輔助源表面化簡成水平面 中的線性分布(逼近1)將該技術限制為再現(xiàn)水平面中的虛擬源(2D再現(xiàn))并且與目 標相 比修改聲場的級別。逼近2引入了衍射偽差(diffraction artefact),其可以通過逐漸減 少位于陣列末端處的揚聲器來減少。逼近1和2極大地降低了渲染系統(tǒng)的性能(收聽區(qū)域 的大小、虛擬源的定位)。就在收聽區(qū)域內(nèi)的給定位置處的著色或定位精度而言,它們幾乎 不修改聽眾所感知的聲場的質量,如由E. Corteel ^ "Caracterisation etextensions deIa Wave Field Synthesis en conditions reelles,, (UniversiteParis 6, PhD thesis, Paris, 2004)中公幵的。逼近3將目標波場的精確再現(xiàn)僅限制于低于某一頻率,空間取樣 處理的Nyquist頻率,這通常被稱作“空間混疊頻率”。該空間取樣在虛擬源的定位和染色 方面帶來被感知偽差的不準確性,如由E. CorteeU K. V. NGuyen. 0. WarusfeU T. Caulkins 禾口 R. S. Pellegrini 在"Objectiveand subjective comparison of electrodynamic and MAP loudspeakers for WaveField Synthesis,,(30th international conference of the Audio Engineering Society, 2007)中公幵的。 該空間取樣處理對于基于曲面積分的任何聲場再現(xiàn)技術來說都是強制性任務,因 為當前可用的換能(transduction)技術不能持續(xù)地控制聲源的輻射(持續(xù)揚聲器分布)。 該表面必須被空間地取樣,并且這會引起空間混疊偽差,降低了合成的聲場的質量??臻g取 樣處理對聲場再現(xiàn)系統(tǒng)來說是關鍵成本因素,因為它決定了揚聲器和聲道的數(shù)量以便使用 數(shù)字信號處理技術來進行獨立地控制。對于波場合成增加空間混疊頻率的解決方案已被Evert Start在“DirectSound Enhancement by Wave Field Synthesis,,(PhD thesis,Delft University ofTechnology, the Netherlands, 1997)中提出。它包括合成具有定向指數(shù)(directivity index)的虛 擬源,該定向指數(shù)是取決于揚聲器間隔的頻率的遞增函數(shù)。該提出的方法也要求揚聲器具 有相同的輻射特性。然而,該方法在操縱虛擬源的輻射特性上以及在揚聲器的所需輻射特 性上受到約束。后者是最有問題的方面,因為大多數(shù)現(xiàn)有的揚聲器不具有所需的輻射模式。增加空間混疊頻率的另一種解決方案已被Etienne Corteel在“On the useof irregularly spaced loudspeaker arrays for Wave Field Synthesis,potential impact on spatial aliasing frequency" (DAFX06,2006, 可 在 http//www, dafx. ca/ proceedinRs/papers/p 209. pdf中獲得)中公開。它包括使用不規(guī)則間隔的揚聲器陣列 來增加波場合成的空間混疊頻率。它顯示出雙對數(shù)間隔的陣列相對于規(guī)則間隔的揚聲器陣 列(具有相同數(shù)量的揚聲器和相同長度),空間混疊頻率可能增加20%。然而,混疊頻率的 增加僅對于位于收聽區(qū)域之外的源有效。對于位于收聽區(qū)域內(nèi)的源(或者稱作“聚焦源”), 該揚聲器排列與等效的規(guī)則間隔的陣列相比減少了空間混疊頻率。從收聽環(huán)境的室內(nèi)音響效果將會預料到附加的渲染不精確性,如由E. Corteel和 R. Nicol 在"Listening room compensation for wave field synthesis. What can be done ?,,(Proceedings of the 23rd Convention of the AudioEngineering Society, Helsing0r, Danemark, June 2003)中公開的。渲染聲音系統(tǒng)總是與收聽室相互影響,因此 聽眾不能感知目標虛擬聲場,但是能感知該后者與收聽室效果之間的混合物。局部反射和 回響被收聽室添加到由揚聲器產(chǎn)生的聲場,因此聽眾感知的聲場可能或多或少地與期望的 結果有所不同。最明顯的效果取決于能夠產(chǎn)生聲染色、距離感知失真和角定位錯誤的最初 10-30ms內(nèi)的早期反射。對于小的收聽室,房間式樣也可在低頻聽到,降低了清晰度并且 產(chǎn)生聲染色,如由 R. S. Pellegrini 在“AVirtual Listening Room asan Application of Auditory Virtual Environments" (Ph. D. Thesis, Ruhr Universitat Bochum, Germany, 2001)中公開。為了去除收聽室相互影響,一種方式包括考慮沒有回音的收聽環(huán)境或者借助耳 機重放。但是這些解決方案對于大多數(shù)應用而言并不真正地方便。應付該問題的一種更普通的方式是通過場所補償策略而提出的,其旨在抵消——或者更實際地減少——收聽室 對聽眾所感知之的虛擬聲場的影響。場所補償旨在使用多聲道逆濾波技術來抵消收聽環(huán) 境的音響效果,如由 E. Corteel 在 “Caract6risation et extensions de la Wave Field Synthesis en conditions reelles,, (UniversiteParis 6, PhD thesis, Paris,2004)中 公開的。這些技術考慮減少大收聽區(qū)域內(nèi)的某些早期反射的級別。然而,它們在所需的處 理功率上具有嚴重的局限性,并且它們遭受減少現(xiàn)實情形中的效率的重大實際和理論限 制,如由 E. Corteel 在 “Caract6risation et extensions de la Wave Field Synthesis enconditions reelles" (UniversiteParis 6, PhD thesis, Paris, 2004)中公開白勺。計算空間混疊頻率的一個公式已被Etienne Corteel在“On the use ofirregularly spaced loudspeaker arrays for Wave Field Synthesis, potential impacton spatial aliasing frequency" (DAFX06,2006,可在 http://www, dafx. ca/ proceedings/papers/p 209. pdf中獲得)中提出。與先前已知的公式相反,該提出的公式 能夠考慮有限長度的揚聲器陣列以及收聽位置的相關性。它基于在給定收聽位置處揚聲器 對于使用波場合成的虛擬源合成的貢獻的到達時間。在圖4,對于具有相同揚聲器間間隔 (12. 5厘米)但是具有不同長度(1米、2米、5米)的各種揚聲器陣列,顯示了利用所提出 的公式計算的空間混疊頻率。圖3呈現(xiàn)了所考慮的配置的頂視圖,其中黑星代表揚聲器,空 心圓點代表收聽位置,并且實心圓點代表虛擬源。這種模擬顯示與長揚聲器陣列相比,利 用短陣列會獲得大增加的空間混疊頻率。在這種配置中,我們假設1米寬度的受限收聽區(qū) 域。因此,減少揚聲器陣列的長度可被認為是增加混疊頻率的解決方案。然而,這個解決方 案遭受與有限長度的揚聲器陣列相關的各種偽差。首先,源可視區(qū)域(如圖2中所述)非 常有限,其嚴重地限制了聲音再現(xiàn)系統(tǒng)的實際使用。典型地,使用1米長的揚聲器陣列可以 再現(xiàn)僅距圖3的中央收聽位置的-10與10度之間的源,而在使用5米長的揚聲器陣列滿足 可視約束的同時可以再現(xiàn)從-50與50度的源。其次,有限長度的揚聲器陣列與長揚聲器陣 列相比可以帶來更明顯的衍射偽差。這些偽差可以通過逐漸減少位于陣列的末端處但僅在 高頻的揚聲器來精確地補償,如由E. Corteel在“Caract6risation et extensions de la Wave Field Synthesis enconditions reelles"(UniversiteParis 6,PhD thesis,Paris, 2004)中公開的。圖5示出了對于圖3中示出的虛擬源的合成、使用波場合成的各長度的揚聲器陣 列的定向指數(shù)。定向指數(shù)被定義為在正方向上(即在收聽區(qū)域內(nèi))傳遞的聲能與在所有方 向上傳遞的平均聲能之間的頻率相關比率。定向指數(shù)隨后說明了某一方向上(此處是收聽 區(qū)域)的聲能的密度。定向指數(shù)越高,收聽室中擴展的聲能量越低。因此,由于收聽室音響 效果不使用復雜有效的收聽室補償過程,高定向指數(shù)對應于降低的渲染偽差??梢钥闯?,通 過減小揚聲器陣列的長度,它的定向指數(shù)增加,尤其是在800Hz以上的頻率,對于該頻率,1 米長的揚聲器陣列具有最高的定向指數(shù)。然而,在低頻率處,使用更短的揚聲器陣列會獲得 高定向指數(shù)。2米長的陣列在150Hz和800Hz之間具有最高定向指數(shù),并且5米長的揚聲器 陣列在150Hz以下具有最高定向指數(shù)。聲場再現(xiàn)技術不做先驗假設聽眾的位置允許擴展區(qū)域內(nèi)的聲場的再現(xiàn)。對于波 場合成,該區(qū)域通常可能跨越整個收聽室。然而,在室內(nèi)可能有聽眾從來不在的位置,因為 存在家具或簡單地因為它們的任務或情形不需要如此。因此,最佳收聽區(qū)域可被限定為其中聽眾可能最佳站立的地方以及聲音再現(xiàn)偽差將被限制的地方。
發(fā)明內(nèi)容
本發(fā)明的目的是增加最佳受限制收聽區(qū)域(其中聽眾可以站在給定數(shù)量且空間 布置的揚聲器前)內(nèi)的空間混疊頻率。本發(fā)明的另一目的是考慮給定混疊頻率和給定的收 聽區(qū)域擴展來限制所需的揚聲器的數(shù)量,以便對于聲場再現(xiàn)產(chǎn)生成本有效的解決方案。本 發(fā)明的目的還在于限制再現(xiàn)系統(tǒng)與收聽室的相互作用,以便自動地減少收聽室音響效果對 聽眾所感知的聲場的影響。本發(fā)明包括這樣一種方法和設備,即其中,定義用于合成與受限制最佳收聽區(qū)域 內(nèi)的虛擬源相關的目標聲場的每個揚聲器的重要性的等級?;谠摰燃?,源自第一輸入信 號的揚聲器的提供信號被修改,以便通過僅使用對受限制最佳收聽區(qū)域內(nèi)的目標聲場的合 成明顯有益的揚聲器來構建“事實上更短的揚聲器陣列”,增加空間混疊頻率。取代使用物理上更短的陣列(其在虛擬源的定位方面受到限制),本發(fā)明提出了 降低位于源/聽眾可視區(qū)域之外的揚聲器的提供(alimentation)信號的級別。圖6描述 了用于根據(jù)虛擬源5的位置和最佳收聽區(qū)域擴展構建事實上更短的揚聲器陣列的相關聯(lián) 的揚聲器選擇處理。在該附圖中,根據(jù)虛擬源5位置定義相關的源/聽眾可視區(qū)域30,以便 它包括整個最佳收聽區(qū)域6。因此位于源/聽眾可視區(qū)域2. 1內(nèi)的揚聲器可被選擇來形成 事實上更短的陣列。另外,虛擬揚聲器陣列的長度可以是頻率相關的,以便通過在低頻構建 比高頻事實上更長的揚聲器陣列來最大化定向指數(shù)(參考圖5)。本發(fā)明提出了一種更通用 的公式,其定義一種對應于所考慮揚聲器的重要性的揚聲器等級,用以合成受限制的收聽 區(qū)域內(nèi)的目標聲場。換句話說,介紹一種使用多個揚聲器根據(jù)第一音頻輸入信號的聲場再現(xiàn)方法和裝 置,所述多個揚聲器旨在合成其中沒有放置揚聲器的最佳收聽區(qū)域內(nèi)的聲場,所述聲場被 描述為從虛擬源發(fā)出。所述方法包括步驟根據(jù)源自曲面積分的聲場再現(xiàn)技術使用虛擬源 描述數(shù)據(jù)和揚聲器描述數(shù)據(jù)來計算定位濾波器系數(shù)。使用定位濾波器系數(shù)來修改所述第一 音頻輸入信號,以便形成第二音頻輸入信號。因此,計算代表每個揚聲器對于所述最佳收聽 區(qū)域內(nèi)的聲場的合成的重要性的揚聲器等級數(shù)據(jù)。然后,根據(jù)所述揚聲器等級數(shù)據(jù)修改所 述第二音頻輸入信號以形成第三音頻輸入信號。最后,對揚聲器提供第三音頻輸入信號并 且合成聲場。而且,所述方法可以包括步驟其中,所述揚聲器等級數(shù)據(jù)是使用虛擬源描述數(shù) 據(jù)、揚聲器描述數(shù)據(jù)和收聽區(qū)域描述數(shù)據(jù)定義的。并且所述方法可以還包括步驟 其中,所述揚聲器等級對于位于源/聽眾可視區(qū)域外的揚聲器比對于位于源/聽 眾可視區(qū)域內(nèi)的揚聲器通常要低。·其中,源/聽眾可視區(qū)域被定義為在包括整個最佳收聽區(qū)域的虛擬源處的最小 立體角。 其中,位于源/聽眾可視區(qū)域外的揚聲器的揚聲器等級是揚聲器到源/聽眾可視 區(qū)域的邊界的距離的遞減函數(shù)?!て渲校瑩P聲器等級數(shù)據(jù)是通過揚聲器的位置到連接虛擬源的位置與最佳收聽區(qū) 域中的參考收聽位置的連線的距離的遞減函數(shù)而定義的。
9
·其中,修改第二音頻輸入信號以便形成揚聲器的輸入信號暗示至少減小具有低 等級的揚聲器的第二音頻輸入信號的級別。 其中,具有低等級的揚聲器的第二音頻輸入信號的級別降低是頻率相關的?!て渲?,根據(jù)揚聲器等級數(shù)據(jù)修改第二音頻輸入信號以形成第三音頻輸入信號的 步驟被執(zhí)行,以便在最佳收聽區(qū)域中增加在用于計算定位濾波器系數(shù)的聲場渲染技術的定 義中與所需的揚聲器分布的空間取樣相關的Nyquist頻率。而且,本發(fā)明包括一種使用多個揚聲器根據(jù)第一音頻輸入信號的聲場再現(xiàn)裝置, 所述多個揚聲器旨在合成其中沒有放置揚聲器的最佳收聽區(qū)域內(nèi)的聲場,所述聲場被描述 為從虛擬源發(fā)出。所述裝置包括定位濾波器計算裝置,用于使用虛擬源描述數(shù)據(jù)和揚聲器 描述數(shù)據(jù)來計算多個定位濾波器;聲場濾波裝置,用于使用定位濾波器根據(jù)所述第一音頻 輸入信號來計算第二音頻輸入信號。所述裝置的特征在于,揚聲器等級計算裝置,用于計算 代表每個揚聲器對于所述最佳收聽區(qū)域內(nèi)的聲場的合成的重要性的揚聲器等級數(shù)據(jù);收聽 區(qū)域適應計算裝置,用于根據(jù)揚聲器等級來修改所述第二音頻輸入信號,并且形成供給揚 聲器的第三音頻輸入信號。而且,所述裝置可以優(yōu)選地包括以下元件·其中,所述收聽區(qū)域適應計算裝置包括修改濾波器系數(shù)計算裝置用以計算修改 濾波器系數(shù)。 其中,所述收聽區(qū)域適應計算裝置也包括第二音頻輸入信號修改裝置,其使用修 改濾波器系數(shù)來修改所述第二音頻輸入信號。
下文中將借助示例并且參考附圖來更詳細地描述本發(fā)明,其中圖1描述了源/揚聲器可視區(qū)域。圖2描述了源定位區(qū)域。圖3表現(xiàn)所考慮的揚聲器、收聽位置和虛擬源配置的頂視圖。圖4顯示了對于各揚聲器陣列(它們具有相同的揚聲器之間間隔(12. 5厘 米)但是具有不同的長度(1米,2米,5米))的、在圖3中示出的收聽位置處的空間混疊頻率。圖5示出了使用波場合成對于圖3中顯示的虛擬源的合成的各長度的揚聲器陣列 的定向指數(shù)。圖6描述了用于根據(jù)虛擬源位置和最佳收聽區(qū)域擴展構建事實上更短的揚聲器 陣列的選擇過程。圖7描述了根據(jù)現(xiàn)有技術的聲場渲染設備。圖8描述了根據(jù)本發(fā)明的聲場渲染設備。圖9描述了提取揚聲器等級數(shù)據(jù)的第一種方法。圖10描述了提取揚聲器等級數(shù)據(jù)的第二種方法。圖11描述了收聽區(qū)域適應計算裝置。圖12到圖15描述了本發(fā)明的其它實施例。
具體實施例方式圖1到圖5已在說明書的介紹部分進行了討論,并且完全代表現(xiàn)有技術。因此在 這個階段不再對這些附圖進行討論。圖6已被描述并且在這個階段也不再進行討論。圖7描述了根據(jù)現(xiàn)有技術的聲場渲染設備。在該設備中,聲場濾波裝置14使用定 位濾波器系數(shù)7根據(jù)第一音頻輸入信號1計算多個第二音頻信號3。在定位濾波器計算裝 置15中根據(jù)虛擬源描述數(shù)據(jù)8和揚聲器描述數(shù)據(jù)9來計算所述定位濾波器系數(shù)7。相對于 參考位置35定義揚聲器2和虛擬源5的位置(被包含在虛擬源描述數(shù)據(jù)8和揚聲器描述 數(shù)據(jù)9中)。第二音頻信號3驅動合成聲場4的多個揚聲器2。圖8描述了根據(jù)本發(fā)明的聲場渲染設備。在該設備中,聲場濾波裝置14使用定位 濾波器系數(shù)7 (其是在定位濾波器計算裝置15中根據(jù)虛擬源描述數(shù)據(jù)8和揚聲器定位數(shù)據(jù) 9計算的)根據(jù)第一音頻輸入信號1計算多個第二音頻信號3。相對于參考位置35定義揚 聲器2和虛擬源5的位置(被包含在虛擬源描述數(shù)據(jù)8和揚聲器描述數(shù)據(jù)9中)。收聽區(qū) 域適應計算裝置16使用在揚聲器等級計算裝置17中從虛擬源描述數(shù)據(jù)8、揚聲器定位數(shù)據(jù) 9和收聽區(qū)域描述數(shù)據(jù)10得到的揚聲器等級數(shù)據(jù)11,根據(jù)第二音頻輸入信號3來計算第三 音頻輸入信號12。第三音頻信號12驅動合成受限制收聽區(qū)域6中的聲場4的多個揚聲器 2。圖9描述了提取揚聲器等級數(shù)據(jù)11的第一種方法。在該方法中,源聽眾可視區(qū)域 30被定義為包括在圍繞整個最佳收聽區(qū)域6的虛擬源5處的最小立體角內(nèi)。位于源/聽 眾可視區(qū)域30內(nèi)的多個揚聲器2. 1接收高等級,通常是100%。位于源/聽眾可視區(qū)域30 以外的多個揚聲器2. 2接收低等級。揚聲器等級數(shù)據(jù)11可以典型地是揚聲器22到源/聽 眾可視區(qū)域30的邊界20的距離23的遞減函數(shù)。揚聲器22可以典型地接收等級35%,而 距源/聽眾可視區(qū)域30的邊界20更遠距離的揚聲器36可以接收等級10%。圖10描述了提取揚聲器等級數(shù)據(jù)11的第二種方法,對此,根據(jù)圖9的最佳收聽區(qū) 域6降低到單個聽眾參考位置13。在該方法中,揚聲器等級數(shù)據(jù)11被計算為揚聲器22到 源/揚聲器連線18 (連接虛擬源5和參考收聽位置13)的距離19的遞減函數(shù)。圖11描述了收聽區(qū)域適應計算裝置16。在該裝置16中,在第二音頻輸入信號修 改裝置34中使用修改濾波器系數(shù)33來修改第二音頻輸入信號。在修改濾波器系數(shù)計算裝 置32中根據(jù)揚聲器等級數(shù)據(jù)11來計算修改濾波器系數(shù)33。在本發(fā)明的第一實施例中,收聽區(qū)域被限制為其中聽眾所在的有限區(qū)域(不包括 沙發(fā))。在該實施例中,例如可以在與投影的圖像一致的正面區(qū)域放置有限數(shù)量的揚聲器。 根據(jù)本發(fā)明,與具有相同質量(即混疊頻率)的“滿室”收聽區(qū)域相比可以限制揚聲器的數(shù) 量。例如,在波場合成再現(xiàn)系統(tǒng)中,這減少了所需的硬件耗費和成本。該實施例示于圖12 中,其中揚聲器集合2被安裝在聽眾將要坐下的沙發(fā)24所在的房屋中。因此最佳收聽區(qū) 域6可被定義為在聽眾頭部的可能位置的周圍。一方面,這與立體聲再現(xiàn)系統(tǒng)相比提供了 明顯的優(yōu)勢,因為理想的收聽區(qū)域的位置可以由用戶自由地選擇?!白罴崖犚粑恢谩辈辉傧?于由揚聲器位置嚴格定義的位置。另一方面,該示例顯示了例如與傳統(tǒng)波場合成系統(tǒng)相比 的一個優(yōu)點。在最佳收聽區(qū)域中,可以正確地再現(xiàn)聲場。然而,揚聲器的數(shù)量與傳統(tǒng)的波場 合成系統(tǒng)相比明顯地減少。在該實施例中,虛擬源描述數(shù)據(jù)8(參見圖7、8、12)可以包括虛擬源5相對于參考位置35的位置。所考慮的坐標系統(tǒng)可以是笛卡爾坐標、球面坐標或柱面 坐標。虛擬源描述數(shù)據(jù)8也可以包括例如使用一組球面諧波(sphericalharmonics)的頻 率相關系數(shù)描述虛擬源5的輻射特性的數(shù)據(jù),如由E. GWilliams在“Fourier Acoustics, Sound Radiation and Nearfield AcousticalHolography" (Elsevier, Science,1999)中 公開的。揚聲器描述數(shù)據(jù)9(參見圖7、8、12)可以包括揚聲器相對于參考位置35的位置, 優(yōu)選地與虛擬源描述數(shù)據(jù)8相同。所考慮的坐標系統(tǒng)可以是笛卡爾坐標、球面坐標或柱面 坐標。對于虛擬源5,揚聲器描述數(shù)據(jù)9也可以包括例如使用一組球諧函數(shù)的頻率相關系 數(shù)描述揚聲器的輻射特性的數(shù)據(jù)。收聽區(qū)域描述數(shù)據(jù)10描述收聽區(qū)域6相對于參考位置 35的位置和擴展,優(yōu)選地與虛擬源描述數(shù)據(jù)8相同。所考慮的坐標系統(tǒng)可以是笛卡爾坐標、 球面坐標或柱面坐標。定位濾波器系數(shù)7可以使用虛擬源描述數(shù)據(jù)8和揚聲器描述數(shù)據(jù)9 根據(jù)波場合成來定義,如由 E. Corteel 在 “Caract6risation et extensions de la Wave Field Synthesis enconditions reelles"(UniversiteParis 6,PhD thesis,Paris,2004, 可在 http://mediatheque. ircam.fr/articles/textes/Corteel04a/)中公開的。作為結 果的濾波器可以是有限脈沖響應濾波器。第一輸入信號的過濾可以使用定位濾波器系數(shù)7 與第一輸入信號1的卷積來實現(xiàn)。對于接收低等級11的揚聲器,可以計算修改濾波器系數(shù) 33(參見圖11),以便可能地使用頻率相關的衰減因子來減小第二音頻輸入信號3的級別。 該衰減因子可能線性地相關于揚聲器等級數(shù)據(jù)11,遵循指數(shù)形狀,或者簡單地在揚聲器等 級數(shù)據(jù)11的某一閾值以下無效。作為結果的濾波器可以是無限脈沖響應濾波器或者有限 脈沖響應濾波器。第二音頻輸入信號3的修改可以通過卷積第二音頻輸入信號3和修改濾 波器系數(shù)33 (如果使用有限脈沖響應濾波器)來實現(xiàn)。在本發(fā)明的第二實施例中,聽眾可以位于有限數(shù)量的預定收聽位置處(不包括沙 發(fā)、桌子前面的椅子..·)。根據(jù)本發(fā)明,聽眾可以創(chuàng)建預設以便最佳化對這些預定位置的聲 音渲染質量。然后預設可被聽眾直接調用或者通過檢測在預定區(qū)域之一中的聽眾的存在而 調用。圖13示出了與圖12類似的情形,其中除了與沙發(fā)24對應的第一最佳收聽區(qū)域6. 1 以外,第二最佳收聽區(qū)域6. 2被限定在坐在長椅26上的潛在聽眾的位置處。第三最佳收聽 區(qū)域6. 3包括第一和第二最佳收聽區(qū)域6. 1和6. 2,假設渲染質量降低(即下降的混疊頻 率)。在本發(fā)明的第三實施例中,可以跟蹤聽眾的位置,以便持續(xù)地最佳化有效覆蓋的 收聽區(qū)域內(nèi)的聲音渲染質量。圖14展示了跟蹤裝置28提供聽眾27的真實位置(其定義 真實的最佳收聽區(qū)域6)的實施例。本發(fā)明的第四實施例是聲場模擬環(huán)境。在這個實施例中,收聽區(qū)域被局限為 聽眾頭部周圍非常有限的區(qū)域,其中在所有或大多數(shù)聲頻范圍(典型地20-20000HZ或 ΙΟΟ-ΙΟΟΟΟΗζ)上以物理上正確的聲場重構為目標。對于物理上正確的聲音再現(xiàn)的通常 途徑是使用在耳機上的雙耳聲音再現(xiàn),如由Jens Blauert在“Spatial hearing =The psychophysics of human sound localization,,(修i丁片反本,MIT 出片反 土,Cambridge,MA, 1997)中所描述的。實際上,使用頭部相關的傳遞函數(shù)的利用耳機的所述模擬途徑顯現(xiàn) 若干缺點。定位受到前后混淆的干擾,頭部外定位受到限制,并且距離感知不必匹配預期 的真實圖像。佩戴耳機的感覺降低了出現(xiàn)于虛擬環(huán)境的感覺。在過去幾年中,使用耳機 的這種方法已經(jīng)得以廣泛使用,因為理論上它給予再現(xiàn)物理上正確的聽力輸入信號以便
12構建聲音的空間效果(impression)的希望。實踐已經(jīng)顯示這種方法所提供的空間效果 不必匹配期望的空間聲圖像,并且可能由于在對聽眾的各個HRTF的信號處理中所使用的 HRTF的失配,在聽眾之間會發(fā)生感知上的強烈差異。這樣的結果已經(jīng)例如由H. M0Iler5 M. F. S0rensen> C. B. Jensen、D. Hammershoi 在"Binaural technique :Do we need individual recordings ?,,(J. Audio Eng. Soc. , Vol. 44, No. 6, pp. 451-469, June 1996) 中以及由 H. M0ller、D· Hammersh0i、c. B. Jensen、M. F. S0rensen在 ‘‘Evaluation of artificial heads inlistening tests,,(J. Audio Eng. Soc. , Vol. 47, No. 3, pp. 83-100, March 1999)中公開。聽眾的頭部運動也將被記錄以便更新雙耳聲音再現(xiàn),從而聽眾不會具有整個聲音 場景似乎緊隨她/他的感覺。然而,商業(yè)上可用的頭部跟蹤裝置的成本通常較高,并且耳機 信號的更新也可能帶來偽差。與此相反,通過在聽眾頭部周圍構建物理上正確的聲場,對于 單獨的頭部相關傳遞函數(shù)測量或者對于頭部運動的復雜補償是不必要的。使用傳統(tǒng)的聲場渲染技術(例如根據(jù)現(xiàn)有技術的波場合成),將要求大約2cm的 揚聲器間隔來再現(xiàn)所需頻率范圍內(nèi)的物理上正確的聲場。這導致利用非常少的揚聲器的 不切實際的揚聲器設置,這可能在低頻(典型地在200/300HZ以下)是無效的。根據(jù)本發(fā) 明,12. 5厘米的揚聲器間隔可能就足夠(參考圖2中的中央位置),從而減少了所需揚聲器 的數(shù)量,并且允許使用傳統(tǒng)上成本節(jié)約的揚聲器技術將可接受的聲音壓力級別下降到至少 IOOHz0該第四實施例的示例性實現(xiàn)如圖14所示,其中聽眾27被揚聲器集合2包圍,所述 揚聲器集合把聽眾頭部27周圍的非常受限制的最佳區(qū)域6中的至少一個虛擬源5的再現(xiàn) 作為目標。本發(fā)明的應用包括但不限于下列領域高保真聲音再現(xiàn)、家庭影院、汽車內(nèi)部 噪聲模擬、飛機內(nèi)部噪聲模擬、虛擬現(xiàn)實的聲音再現(xiàn)、感知單峰/交叉模式(perceptual unimodal/crossmodal)實驗環(huán)境中的聲音再現(xiàn)。對于本領域的普通技術人員將會清楚的
是,根據(jù)與多個第一音頻輸入信號對應的本發(fā)明,可以合成
元件名稱
1第一輸入音頻信號
2多個揚聲器
2.1位于源/聽眾可視區(qū)域30內(nèi)的揚聲器
2.2位于源/聽眾可視區(qū)域30外的揚聲器
3第二音頻輸入信號
4合成的聲場
5虛擬源
6最佳收聽區(qū)域
6.1第一最佳收聽區(qū)域
6.2第二最佳收聽區(qū)域
6.3第三最佳收聽區(qū)域
7定位濾波器系數(shù)
8虛擬源描述數(shù)據(jù)
9揚聲器描述數(shù)據(jù)
10收聽區(qū)域描述數(shù)據(jù)11揚聲器等級數(shù)據(jù)12第三音頻輸入信號13參考收聽位置14聲場濾波裝置15定位濾波器計算裝置16收聽區(qū)域適應計算裝置17揚聲器等級計算裝置18連接虛擬源5和參考收聽位置13的源/聽眾連線19揚聲器2到源/聽眾連線18的距離20源/聽眾可視區(qū)域的邊界21位于源/聽眾可視區(qū)域30內(nèi)的揚聲器,被考慮用于揚聲器等級11計算22位于源/聽眾可視區(qū)域30外的揚聲器,被考慮用于揚聲器等級11計算23位于源/聽眾可視區(qū)域外的揚聲器到源/聽眾可視區(qū)域的邊界的距離24沙發(fā)25源/揚聲器可視區(qū)域26長椅27聽眾28跟蹤裝置29真實的最佳收聽區(qū)域30源/聽眾可視區(qū)域31源可視區(qū)域32修改濾波器系數(shù)計算裝置33修改濾波器系數(shù)34第二音頻輸入信號修改裝置35參考位置
權利要求
一種使用多個揚聲器(2)根據(jù)第一音頻輸入信號(1)的聲場再現(xiàn)方法,所述多個揚聲器(2)旨在合成其中沒有放置揚聲器(2)的最佳收聽區(qū)域(6)內(nèi)的聲場,所述聲場被描述為從虛擬源(5)發(fā)出,所述方法包括步驟根據(jù)源自曲面積分的聲場再現(xiàn)技術使用虛擬源描述數(shù)據(jù)(8)和揚聲器描述數(shù)據(jù)(9)來計算定位濾波器系數(shù)(7);和應用定位濾波器系數(shù)(7)來過濾所述第一音頻輸入信號(1),以形成第二音頻輸入信號(3),所述方法的特征在于,依靠揚聲器等級數(shù)據(jù)(11)來定義揚聲器等級,所述揚聲器等級數(shù)據(jù)(11)代表每個揚聲器(2)對于所述最佳收聽區(qū)域(6)內(nèi)的聲場的合成的重要性,根據(jù)所述揚聲器等級數(shù)據(jù)(11)修改所述第二音頻輸入信號(3)以形成第三音頻輸入信號(12),并且對揚聲器(2)提供第三音頻輸入信號(12)用以合成聲場(3)。
2.如權利要求1所述的方法,其中所述揚聲器等級數(shù)據(jù)(11)是使用虛擬源描述數(shù)據(jù) (8)、揚聲器描述數(shù)據(jù)(9)和收聽區(qū)域描述數(shù)據(jù)(10)定義的。
3.如權利要求1所述的方法,其中,所述揚聲器等級對于位于源/聽眾可視區(qū)域(30) 外的揚聲器比對于位于源/聽眾可視區(qū)域(30)內(nèi)的揚聲器(21)通常要低。
4.如權利要求3所述的方法,其中,所述源/聽眾可視區(qū)域(30)是通過在包括整個最 佳收聽區(qū)域(6)的虛擬源(5)處的最小立體角定義的。
5.如權利要求3所述的方法,其中,位于所述源/聽眾可視區(qū)域(30)外的揚聲器(22) 的揚聲器等級數(shù)據(jù)(11)是通過揚聲器(22)到所述源/聽眾可視區(qū)域(30)的邊界(20)的 距離(23)的遞減函數(shù)定義的。
6.如權利要求1所述的方法,其中,所述揚聲器等級數(shù)據(jù)(11)是通過揚聲器(2)的位 置到連接虛擬源(5)的位置與所述最佳收聽區(qū)域(6)中的參考收聽位置(13)的連線的距 離(19)的遞減函數(shù)定義的。
7.如權利要求1所述的方法,其中,修改第二音頻輸入信號(3)以便形成第三音頻輸入 信號(12)至少暗示減小具有低等級的揚聲器(2)的第二音頻輸入信號(3)的級別。
8.如權利要求7所述的方法,其中,具有低等級的揚聲器(2)的第二音頻輸入信號(3) 的級別降低是頻率相關的。
9.如權利要求1所述的方法,其中,根據(jù)揚聲器等級數(shù)據(jù)(11)修改第二音頻輸入信號 (3)以便形成第三音頻輸入信號(12)的步驟被執(zhí)行,以便在所述最佳收聽區(qū)域(6)中增加 在用于計算所述定位濾波器系數(shù)(7)的聲場渲染技術的定義中與所需的揚聲器分布的空 間取樣相關的Nyquist頻率。
10.一種使用多個揚聲器(2)根據(jù)第一音頻輸入信號(1)的聲場再現(xiàn)裝置,所述多個 揚聲器(2)旨在合成其中沒有放置揚聲器(2)的最佳收聽區(qū)域(6)內(nèi)的聲場,所述聲場被 描述為從虛擬源(5)發(fā)出,所述裝置包括聲場濾波裝置(14),用于使用定位濾波器系數(shù) (7)根據(jù)所述第一音頻輸入信號(1)來計算第二音頻輸入信號(3),在定位濾波器計算裝置(15)中使用虛擬源描述數(shù)據(jù)(8)和揚聲器描述數(shù)據(jù)(9)來計算所述定位濾波器系數(shù)(7), 其特征在于揚聲器等級計算裝置(17),用于計算代表每個揚聲器(2)對于所述最佳收聽 區(qū)域(6)內(nèi)的聲場的合成的重要性的揚聲器等級數(shù)據(jù)(11);以及收聽區(qū)域適應計算裝置(16),其被設計成根據(jù)所述揚聲器等級數(shù)據(jù)(11)來修改所述第二音頻輸入信號(3),并且 形成供給揚聲器(2)的第三音頻輸入信號(12)。
11.如權利要求10所述的裝置,其中,所述收聽區(qū)域適應計算裝置(16)包括修改濾波器系數(shù)計算裝置(32)用以計算修改濾波器系數(shù)(33)。
12.如權利要求11所述的裝置,其中,所述收聽區(qū)域適應計算裝置(16)也包括第二音 頻輸入信號修改裝置(34),其使用所述修改濾波器系數(shù)(33)來修改所述第二音頻輸入信 號⑶。
全文摘要
本發(fā)明涉及一種使用多個揚聲器(2)根據(jù)第一音頻輸入信號(1)的聲場再現(xiàn)方法和設備,所述多個揚聲器(2)旨在合成其中沒有放置揚聲器(2)的最佳收聽區(qū)域(6)內(nèi)的聲場,所述聲場被描述為從虛擬源(5)發(fā)出。所述方法還包括步驟根據(jù)聲場再現(xiàn)技術使用虛擬源描述數(shù)據(jù)(8)和揚聲器描述數(shù)據(jù)(9)來計算多個定位濾波器系數(shù)(7);和使用定位濾波器系數(shù)(7)來修改所述第一音頻輸入信號(1),以便形成第二音頻輸入信號(3)。因此,定義每個揚聲器(2)對于所述最佳收聽區(qū)域(6)內(nèi)的聲場的合成的重要性的揚聲器等級(11)。然后,根據(jù)所述揚聲器等級(11)修改第二音頻輸入信號(3)以形成第三音頻輸入信號(12)。最后,對揚聲器(2)饋送合成聲場(3)的第三音頻輸入信號(12)。
文檔編號H04S7/00GK101874414SQ200880114138
公開日2010年10月27日 申請日期2008年10月27日 優(yōu)先權日2007年10月30日
發(fā)明者克萊門斯·庫恩-拉洛夫, 艾蒂尼·科蒂爾, 雷納托·佩萊格里尼, 馬賽厄斯·羅森塔爾 申請人:索尼克埃莫申股份公司