本公開一般涉及聲場技術(shù)領(lǐng)域,具體涉及虛擬聲場產(chǎn)生裝置及虛擬聲場產(chǎn)生方法。
背景技術(shù):
隨著娛樂視聽技術(shù)的發(fā)展,在視聽娛樂活動中,越來越面對多樣化的需求。例如,當(dāng)在觀看電視節(jié)目的時候,同一空間中有他人從事其他活動,例如休息睡眠。這時聲音太大會影響他人活動,聲音小自己體驗不佳或聽不清楚。雖然佩戴耳機能夠避免對他人活動的干擾,但耳機對頭部和耳造成壓力,體驗不佳。
另外,盡管電視能夠?qū)崿F(xiàn)多畫面播放,如果多人同時看電視,又希望看不同的頻道,現(xiàn)有技術(shù)通過畫面分割可以實現(xiàn)不同的人看不同的畫面,但同時進行聲音分割卻很困難。這種情況下,雖然理論上通過每人佩戴一個耳機可以實現(xiàn)聲音分離,但多個耳機連接的不便及連接線的線長限制,都使得該收聽的娛樂體驗下降。
再者,在進行體感游戲活動時,游戲創(chuàng)建的虛擬聲場充滿整個房間,由于聲場分散而使得體驗效果下降。
技術(shù)實現(xiàn)要素:
鑒于現(xiàn)有技術(shù)中的上述缺陷或不足,期望提供一種技術(shù)方案,克服上述缺陷或不足。
在本發(fā)明的第一方面,提供一種一種虛擬聲場產(chǎn)生裝置,包括:
音源輸入裝置,用于從外部接收媒體聲音;
定位系統(tǒng),用于定位空間內(nèi)用戶人臉的位置、揚聲器陣列的位置,并計算和校準(zhǔn)所述空間的聲學(xué)模型;
聲場控制器,用于基于所述空間的聲學(xué)模型和特定的聲場模式控制所述媒體聲音;
聲場輸出裝置,用于與所述揚聲器陣列連接,將經(jīng)所述聲場控制器控制的媒體聲音輸出到所述揚聲器陣列。
優(yōu)選地,所述定位系統(tǒng)包括攝像頭和麥克風(fēng)陣列,所述麥克風(fēng)陣列用于接收所述揚聲器陣列發(fā)出的校準(zhǔn)信號確定所述空間的聲學(xué)模型,所述攝像頭基于所述用戶、所述揚聲器陣列及所述麥克風(fēng)陣列的圖像以及所述空間的聲學(xué)模型,確定所述用戶的人臉位置和揚聲器陣列的位置。
優(yōu)選地,所述聲場模式包括全景模式、獨享模式或綜合模式;其中,在所述全景模式下,所述揚聲器陣列作為多聲道音響操作,所述聲場控制器控制所述揚聲器陣列建立充滿整個所述空間的聲場,以房間中心為聲場中心;在獨享模式下,所述聲場控制器控制所述揚聲器陣列建立以所述空間內(nèi)的每個用戶為中心的聲場,為每個用戶建立的聲場之間彼此互不干擾;在綜合模式下,所述聲場控制器控制所述揚聲器陣列建立以所述空間內(nèi)的一個用戶為中心的多維度聲場供用戶選擇使用。
優(yōu)選地,所述虛擬聲場產(chǎn)生裝置還包括聲場模式輸入端子,用于輸入所述用戶選擇的聲場模式或者根據(jù)播放的媒體聲音內(nèi)容自動確定的聲場模式。
進一步地,所述虛擬聲場產(chǎn)生裝置的特定的聲場模式缺省配置為全景模式。
優(yōu)選地,所述空間的聲學(xué)模型隨所述用戶的位置更新而被更新。
可選地,上述任一虛擬聲場產(chǎn)生裝置還包括揚聲器陣列,用于與所述聲場輸出裝置連接播放所述媒體聲音。
在本發(fā)明的第二方面,還提供一種虛擬聲場產(chǎn)生方法,包括:
從外部接收媒體聲音;
定位空間內(nèi)用戶的人臉位置、揚聲器陣列位置,并計算和校準(zhǔn)所述空間的聲學(xué)模型;
基于所述空間的聲學(xué)模型和特定的聲場模式控制所述媒體聲音;
輸出經(jīng)控制的所述媒體聲音。
優(yōu)選地,所述方法進一步包括:確定所述空間的聲學(xué)模型,基于所述空間的聲學(xué)模型以及所述用戶、所述揚聲器陣列及所述麥克風(fēng)陣列的圖像確定所述用戶的人臉位置和揚聲器陣列位置。
優(yōu)選地,所述方法進一步包括:所述聲場模式包括全景模式、獨享模式或綜合模式;其中,在所述全景模式下,所述揚聲器陣列作為多聲道音響操作,所述聲場控制器控制所述揚聲器陣列建立充滿整個所述空間的聲場,以房間中心為聲場中心;在獨享模式下,所述聲場控制器控制所述揚聲器陣列建立以所述空間內(nèi)的每個用戶為中心的聲場,為每個用戶建立的聲場之間彼此互不干擾;在綜合模式下,所述聲場控制器控制所述揚聲器陣列建立以所述空間內(nèi)的一個用戶為中心的多維度聲場供用戶選擇使用。
優(yōu)選地,所述方法進一步包括:其中,其中,所述特定的聲場模式由所述用戶輸入或者根據(jù)播放的媒體聲音內(nèi)容自動確定。
優(yōu)選地,所述方法進一步包括:所述特定的聲場模式缺省配置為全景模式。
優(yōu)選地,所述方法進一步包括:所述空間的聲學(xué)模型隨所述用戶的位置更新而被更新。
通過根據(jù)本發(fā)明實施例的虛擬聲場產(chǎn)生裝置和虛擬聲場產(chǎn)生方法,能夠產(chǎn)生自動跟隨空間內(nèi)用戶位置的多種虛擬聲場,由用戶選擇使用。并且用戶無需佩戴耳機等頭戴式設(shè)備而被聲場自動跟隨,實現(xiàn)自由跟聽。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優(yōu)點將會變得更明顯:
圖1示出根據(jù)本發(fā)明一個實施例的虛擬聲場產(chǎn)生裝置的應(yīng)用環(huán)境的圖;
圖2示出根據(jù)本發(fā)明一個實施例的虛擬聲場產(chǎn)生裝置的組成框圖;
圖3示出根據(jù)本發(fā)明上述實施例的虛擬聲場產(chǎn)生裝置在全景模式下操作的示意圖;
圖4示出根據(jù)本發(fā)明上述實施例的虛擬聲場產(chǎn)生裝置在獨享模式下操作的示意圖;
圖5示出根據(jù)本發(fā)明上述實施例的虛擬聲場產(chǎn)生裝置在綜合模式下操作的示意圖。
圖6示出根據(jù)本發(fā)明上述實施例的虛擬聲場產(chǎn)生裝置進行校準(zhǔn)操作的示意圖;
圖7示出根據(jù)本發(fā)明上述實施例的虛擬聲場產(chǎn)生方法的流程圖。
具體實施方式
下面結(jié)合附圖和實施例對本申請作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋相關(guān)發(fā)明,而非對該發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與發(fā)明相關(guān)的部分。
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結(jié)合實施例來詳細說明本申請。
請參考圖1,圖1示出根據(jù)本發(fā)明一個實施例的虛擬聲場產(chǎn)生裝置的應(yīng)用環(huán)境的圖??臻g100中設(shè)置有根據(jù)本發(fā)明實施例的虛擬聲場產(chǎn)生裝置1,空間可以是房間,客廳或者特定場所。圖1中示出其包含的用于定位的兩個麥克風(fēng)組成的麥克風(fēng)陣列6和一個攝像頭5,虛擬聲場產(chǎn)生裝置的組成未完全示出。組成麥克風(fēng)陣列的麥克風(fēng)6和攝像頭5的數(shù)量可以分別不限于兩個或一個。設(shè)置在虛擬聲場產(chǎn)生裝置兩側(cè)的是揚聲器陣列,包括左側(cè)陣列SPL1、SPL2。。。SPLN和右側(cè)陣列SPL1、SPL2。。。SPLN。N可以為正整數(shù)。
圖2示出該虛擬聲場產(chǎn)生裝置1的組成框圖。其包括音源輸入裝置102、定位系統(tǒng)104、聲場控制器106以及聲場輸出裝置108。各個部分組成如下:
---音源輸入裝置102,其可以采用現(xiàn)有的各種連接方式與外部音源連接,用于輸入想要播放的外部媒體聲音,包括有線或無線連接方式,例如音頻連接線或WiFi。媒體聲音例如來自電視機、影碟機或網(wǎng)絡(luò)音頻。
---定位系統(tǒng)104,用于定位空間內(nèi)用戶的人臉和外部揚聲器陣列的位置,從而計算和校準(zhǔn)該空間的聲學(xué)模型。這里的聲學(xué)模型包括在當(dāng)前空間設(shè)置環(huán)境下校準(zhǔn)聲音從揚聲器陣列中的每個揚聲器傳播到達每個麥克風(fēng)陣列6的空間傳遞函數(shù)組成的空間傳遞函數(shù)矩陣,以及校準(zhǔn)聲音從揚聲器陣列中的每個揚聲器傳播到達用戶臉部的空間傳遞函數(shù)矩陣??臻g內(nèi)有多個用戶時,定位系統(tǒng)104確定每個用戶的人臉位置以及校準(zhǔn)聲音從揚聲器陣列中的每個揚聲器傳播到達每個用戶頭部的空間傳遞函數(shù)矩陣。
---聲場控制器106,用于基于空間的上述聲學(xué)模型和一定的聲場模式控制所述音源的輸出。
---聲場輸出裝置108,與外部的揚聲器陣列連接,用于將經(jīng)控制的音源輸出到外部的揚聲器陣列產(chǎn)生虛擬聲場,其也可以采用有線或無線連接方式。
通過根據(jù)上述實施例的虛擬聲場產(chǎn)生裝置,能夠產(chǎn)生自動跟隨空間內(nèi)用戶位置的多種虛擬聲場,由用戶選擇使用。并且用戶無需佩戴耳機等頭戴式設(shè)備而被聲場自動跟隨,實現(xiàn)了自由跟聽。
這里的聲場模式包括:全景模式、獨享模式或綜合模式。圖3、圖4、圖5分別示出根據(jù)本方實施例的虛擬聲場產(chǎn)生裝置在三種聲場模式配置下的操作示意圖。
如圖3所示,全景模式是以下的聲場模式:揚聲器陣列作為普通的多聲道音響設(shè)備操作,聲場控制器106控制揚聲器陣列建立以空間(例如房間)中心或者以空間內(nèi)的特定位置為聲場中心,充滿整個所述空間的聲場。該特定位置與用戶位置不關(guān)聯(lián)。該模式適用于多個用戶希望共享同一聲音內(nèi)容的情況。
如圖4所示,獨享模式是以下的聲場模式:聲場控制器106控制揚聲器陣列建立分別以空間內(nèi)的多個用戶中的每個用戶為中心的聲場,并且為每個用戶建立的聲場之間彼此互不干擾。這種模式下,聲場控制器106通過對音源輸入裝置102接收來的媒體聲音信號進行相位調(diào)制,例如,發(fā)送至揚聲器陣列的聲音信號中,部分揚聲器接收的聲音信號被移相,從而實現(xiàn)在空間分布上具有特定中心的聲場。各個中心彼此分開,互不干擾。這種分開可以用根據(jù)現(xiàn)有技術(shù)的各種聲音調(diào)制技術(shù)實現(xiàn)。在此模式下,多用戶之間各自享有各自的聲場,彼此之間互不干擾,且各自的聲場中心隨各個用戶的位置移動,避免傳統(tǒng)頭戴式耳機對人的位置的約束。
如圖5所示,綜合模式是以下的聲場模式:聲場控制器106控制揚聲器陣列建立以該空間內(nèi)的一個用戶為中心的多維度聲場,供用戶選擇使用。例如,聲場控制器106控制揚聲器陣列建立以空間內(nèi)的一個用戶為中心的五種效果的聲場,用戶可以選擇其中任意一種或多種疊加使用。在此模式下,一個用戶具有多種聲場效果選擇,從而為用戶創(chuàng)建更為豐富的體驗。這為沉浸式的體感游戲提供更靈活的選擇。
上述定位系統(tǒng)104包括攝像頭和麥克風(fēng)陣列。麥克風(fēng)陣列通過接收揚聲器陣列發(fā)出的校準(zhǔn)聲音信號確定空間的聲學(xué)模型。攝像頭用于識別用戶、揚聲器陣列及麥克風(fēng)陣列6的圖像,定位系統(tǒng)104通過計算在當(dāng)前空間設(shè)置環(huán)境下聲音從揚聲器陣列中的每個揚聲器傳播到達每個麥克風(fēng)陣列6的空間傳遞函數(shù),以及校準(zhǔn)聲音從揚聲器陣列中的每個揚聲器傳播到達每個用戶臉部的空間傳遞函數(shù),確定空間的聲學(xué)模型。基于該空間的聲學(xué)模型,確定用戶的人臉位置、揚聲器陣列位置以及麥克風(fēng)陣列6位置。這里人臉的位置,可以包括指采集獲得圖像中的人臉位置的指向,即用圖像中獲得的二維的指示方向代替位置。例如,以揚聲器陣列中心為位置基準(zhǔn),人臉的位置可以用從揚聲器陣列中的每一個指向每個用戶人臉的指向來表征每個用戶的位置。上述校準(zhǔn)聲音也可以是普通聲音。
圖6示出根據(jù)本發(fā)明上述實施例的虛擬聲場產(chǎn)生裝置進行校準(zhǔn)操作的示意圖。在校準(zhǔn)操作時,聲場控制器106控制揚聲器陣列發(fā)出校準(zhǔn)聲音信號,該校準(zhǔn)聲音信號經(jīng)空間內(nèi)的空氣傳播到達麥克風(fēng)陣列6,例如多個麥克風(fēng)6或拾音頭,被麥克風(fēng)陣列6獲取,根據(jù)聲音傳播速度以及聲音信號的傳播時間,從而能夠獲知在空間的當(dāng)前布局下聲音從揚聲器陣列中的每個揚聲器傳播到達麥克風(fēng)陣列6中每個麥克風(fēng)的聲音傳播特性,即關(guān)于揚聲器陣列的空間傳遞函數(shù)。
另外,定位系統(tǒng)104中的攝像頭包括攝像頭5,其拍攝并識別空間中布置的揚聲器陣列和麥克風(fēng)陣列及用戶人臉的圖像,從而能夠獲知揚聲器陣列、麥克風(fēng)裝置以及用戶人臉相互之間的相對位置。對揚聲器陣列、麥克風(fēng)陣列以及用戶人臉的圖像識別的技術(shù)可以基于現(xiàn)有技術(shù)進行。定位系統(tǒng)104將通過麥克風(fēng)陣列獲取的關(guān)于揚聲器陣列的空間傳遞函數(shù)與通過攝像頭獲取的相對位置信息相結(jié)合,獲得聲音從揚聲器陣列中的每個揚聲器傳播到達每個用戶臉部的空間傳遞函數(shù),即關(guān)于每個用戶的空間傳遞函數(shù),從而確定該空間的完整的聲音模型。該完整的聲音模型包括在當(dāng)前空間設(shè)置環(huán)境下聲音從揚聲器陣列中的每個揚聲器傳播到達每個麥克風(fēng)陣列6的空間傳遞函數(shù)組成的空間傳遞函數(shù)矩陣,以及聲音從揚聲器陣列中的每個揚聲器傳播到達用戶頭部的空間傳遞函數(shù)矩陣。該空間的聲學(xué)模型是個多變量模型。當(dāng)空間內(nèi)的布置改變導(dǎo)致聲音傳播路徑改變時,空間的聲學(xué)模型也改變。當(dāng)用戶的位置改變時,空間的聲學(xué)模型也改變。即:空間的聲學(xué)模型隨用戶的位置更新而被更新。這能夠?qū)崿F(xiàn)根據(jù)用戶實時位置更新聲場中心,實現(xiàn)聲場跟蹤。
聲場控制器基于空間的上述聲音模型,調(diào)節(jié)聲場輸出裝置的輸出,再結(jié)合特定的聲場模式控制輸出給揚聲器陣列的媒體聲音。
定位系統(tǒng)104中的攝像頭自動識別空間內(nèi)的用戶數(shù)目而配置聲場模式。當(dāng)識別空間內(nèi)僅有一個用戶時,虛擬聲場產(chǎn)生裝置的缺省配置為全景模式,即以空間中心或空間內(nèi)的特定位置為中心建立虛擬聲場。當(dāng)識別空間內(nèi)有兩個以上用戶時,虛擬聲場產(chǎn)生裝置的缺省配置為獨享模式。在一種實施方式中,聲場模式也可以由用戶選擇確定。優(yōu)選地,虛擬聲場產(chǎn)生裝置可以具有聲場模式輸入端子,由用戶輸入選擇聲場模式。例如用戶根據(jù)個人喜好選擇綜合模式或全景模式。另外,該聲場模式輸入端子還可以用于輸入根據(jù)要播放的音源內(nèi)容而自動確定的聲場模式。例如,在進行體感游戲時,一種游戲設(shè)備根據(jù)游戲內(nèi)容輸出聲場模式為獨享模式(或全景模式)。在此情況下,虛擬聲場產(chǎn)生裝置的聲場模式輸入端子可以與游戲裝置的聲場模式輸出端相連接,從而獲取外部媒體內(nèi)容的獨享模式(或全景模式)輸入,而代替內(nèi)部的聲場控制器106的聲場模式控制,此時聲場控制器106根據(jù)空間聲學(xué)模型和外部輸入的聲場模式而操作揚聲器陣列。
在一個實施例中,虛擬聲場產(chǎn)生裝置還包括揚聲器陣列。揚聲器陣列用于接收從聲場輸出裝置108輸出的聲音信號。
圖7示出根據(jù)本發(fā)明實施例的虛擬聲場產(chǎn)生方法。包括以下步驟:
S702,從外部接收媒體聲音;
S704,定位空間內(nèi)用戶的人臉位置、揚聲器陣列位置,并計算和校準(zhǔn)所述空間的聲學(xué)模型;
S706,基于所述空間的聲學(xué)模型和特定的聲場模式控制所述媒體聲音輸出;
S708,輸出經(jīng)控制的所述媒體聲音。
優(yōu)選地,上述方法進一步包括:確定所述空間的聲學(xué)模型,基于所述空間的聲學(xué)模型以及所述用戶、所述揚聲器陣列及所述攝像頭5的圖像確定所述用戶的人臉位置、揚聲器陣列位置以及麥克風(fēng)陣列位置。
優(yōu)選地,所述方法進一步包括:所述聲場模式包括全景模式、獨享模式或綜合模式,它們的操作情況如上所述。
上述虛擬聲場產(chǎn)生方法的其他優(yōu)選的實施方式可以從以上描述中獲得。
應(yīng)當(dāng)注意,盡管在附圖中以特定順序描述了本發(fā)明的裝置的組成和方法的操作,但是,這并非要求或者暗示必須按照該特定順序來執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實現(xiàn)期望的結(jié)果。相反,流程圖中描繪的步驟可以改變執(zhí)行順序。附加地或備選地,可以省略某些步驟,將多個步驟合并為一個步驟執(zhí)行,和/或?qū)⒁粋€步驟分解為多個步驟執(zhí)行。