本發(fā)明涉及用于處理娛樂系統(tǒng)中的音頻信號的方法和裝置。
背景技術(shù):
娛樂系統(tǒng)當(dāng)前使用各種不同的音頻源。這里每個音頻源典型地具有特定音量,該音量由所使用的各硬件、軟件和相關(guān)音頻軌道預(yù)定。在改變音頻源之后,用戶通常被迫調(diào)整或重新調(diào)整主音量以獲得與先前主觀感知相同的音量。被稱作術(shù)語“響度”的感知的音量取決于音頻信號的頻率、振幅和時間位置。
根據(jù)線上維基百科全書,響度是人類音量感知的比例映射量(比照http://www.wikipedia.de標(biāo)題“Lautheit”[響度],2015年8月3日版)。
響度是心理聲學(xué)術(shù)語,其描述若干測試人員主要評估感知音量的方式。響度取決于聲壓水平、頻譜和聲音隨時間推移的特性。響度的感知由內(nèi)耳中聲音的處理類型和方式引起。根據(jù)神經(jīng)細(xì)胞的激勵強(qiáng)度,聲音被評估為更大聲或更小聲。當(dāng)聲音被感知為兩倍大時,響度總體是兩倍大。
已知用于定量確定響度的標(biāo)準(zhǔn)化測量方法。然而,在本發(fā)明的上下文中使用的術(shù)語“響度”總體意在被理解為心理聲學(xué)加權(quán)音量,其可以對應(yīng)于根據(jù)標(biāo)準(zhǔn)化測量方法限定的響度(以宋(sone)測量),但也可以利用可選的方法(在適當(dāng)情況下簡化)限定。
在實時處理期間調(diào)整音頻信號的音量的算法是已知的。然而,這些算法使用均衡器、壓縮器或限制器改變相關(guān)聲音軌道或由于該調(diào)整使它們降低動態(tài)范圍。此外,這種類型的算法通常需要高的處理和存儲能力。
關(guān)于現(xiàn)有技術(shù),僅以示例的形式參照WO 2013/154823A2、WO 2004/111994A2、EP 1 805 891B1、EP 1 629 463A2、EP 1 835 487A2和EP 1 763 923A1。
技術(shù)實現(xiàn)要素:
本發(fā)明的目標(biāo)是提供一種用于處理音頻信號的方法和裝置,其中可以獲得在每種情況下對來自不同音頻源的音頻信號中主觀感知的音量或響度的最佳對應(yīng)效果。
該目標(biāo)通過根據(jù)獨立權(quán)利要求1的特征的方法和根據(jù)權(quán)利要求8的特征的裝置來實現(xiàn)。
在根據(jù)本發(fā)明的用于處理娛樂系統(tǒng)中的音頻信號的方法中,來自至少一個音頻源的音頻信號在由娛樂系統(tǒng)回放期間被改變以調(diào)整到心理聲學(xué)響度設(shè)置值,其中在每種情況下基于平均心理聲學(xué)響度最大值執(zhí)行該改變,平均心理聲學(xué)響度最大值是在預(yù)定時間間隔中針對相關(guān)音頻源所確定的。
根據(jù)一個實施例,來自至少兩個不同音頻源的音頻信號在娛樂系統(tǒng)回放期間被改變以調(diào)整到心理聲學(xué)響度設(shè)置值。
本發(fā)明尤其基于執(zhí)行將不同音頻源實時調(diào)整到心理聲學(xué)響度設(shè)置值的構(gòu)思。根據(jù)本發(fā)明的方法尤其基于音頻流的實時數(shù)據(jù),而不需要知道未來值。而且,來自一個或多個音頻源的音頻信號在每種情況下被處理,該處理對每種情況下來自其它音頻源的音頻信號沒有依賴性。
根據(jù)本發(fā)明的方法不需要用于例如由相同音頻源回放的不同音樂或歌曲的音量調(diào)整。作為替代,來自娛樂系統(tǒng)不同音頻源的音頻信號的動態(tài)調(diào)整根據(jù)各自最大主觀感知的響度而實施。
如上文中已經(jīng)提到的,術(shù)語“響度”表示與用戶心理聲學(xué)感知的音量近似成比例的量。該響度可以根據(jù)相關(guān)標(biāo)準(zhǔn)計算,但也可以由簡化的粗略計算限定。尤其地,可以根據(jù)機(jī)動車輛中的特定標(biāo)準(zhǔn)而調(diào)整用于響度限定所需的頻率加權(quán)(例如通過將典型的背景噪聲譜納入考慮)。
根據(jù)一個實施例,音頻信號在每種情況下在改變事件中乘以振幅,該振幅取決于各相關(guān)音頻源。
根據(jù)一個實施例,該振幅在每種情況下計算為響度設(shè)置值和平均心理聲學(xué)響度最大值的商。
根據(jù)一個實施例,平均心理聲學(xué)響度最大值的估算基于針對各音頻源存儲的響度數(shù)據(jù)而實施。
本發(fā)明還設(shè)計用于處理音頻信號的裝置,其中來自至少一個音頻源的音頻信號在娛樂系統(tǒng)回放期間可被改變以調(diào)整到心理聲學(xué)響度設(shè)置值,其中該裝置配置用于實施具有上述特性的方法。關(guān)于該裝置的優(yōu)勢和有利設(shè)計,參照上述與本發(fā)明的方法相關(guān)作出的陳述。
根據(jù)本發(fā)明的處理尤其基于長期的信號信息。這通過極端數(shù)據(jù)簡化來實現(xiàn)。由于在通常情況下振幅的變化只是在無內(nèi)存重寫的情況下非常緩慢地進(jìn)行,因此娛樂系統(tǒng)的聽眾或用戶不能感知到動態(tài)音量或響度變化。而且,因此調(diào)整過程非常穩(wěn)定并僅需要相對較低的處理能量。
本發(fā)明進(jìn)一步的設(shè)計存在于說明書和從屬權(quán)利要求中。
在下文中使用優(yōu)選實施例并參照附圖更詳細(xì)地說明本發(fā)明。
附圖說明
在圖中:
圖1示出了說明根據(jù)本發(fā)明用于音量調(diào)整的方法的示意圖;
圖2示出了用于說明使用根據(jù)本發(fā)明的方法執(zhí)行的最大響度估算的流程圖;
圖3示出了用于說明根據(jù)圖2中的步驟S22的響度限定的可行實施方式;以及
圖4示出了根據(jù)圖2的步驟S29計算平均最大響度的示意性表示。
具體實施方式
根據(jù)圖1,在根據(jù)本發(fā)明的用于音量調(diào)整的方法中,輸入音頻信號11通過乘以由源決定和時間決定的振幅15來改變,從而獲得輸出音頻信號16。振幅15由常數(shù)計算得出,通過音量設(shè)置值(SET)13除以來自音量存儲器14的估算平均最大心理聲學(xué)音量12(在下文中參照圖2更詳細(xì)地說明)得到該常數(shù)。為了避免由于振幅15突變所引起的信號失真,振幅值優(yōu)選地隨隨時間逐漸減弱。
為了計算振幅,根據(jù)本發(fā)明的方法尤其需要心理聲學(xué)音量平均最大值的估算,其中針對該估算實施的過程在下文中參照圖2的流程圖描述。
此處,估算的平均最大響度在下文被稱作EL值(EL=“估算的平均最大響度”)。使用過去可用的各音頻源音頻信號的音量數(shù)據(jù)計算EL值。
為了計算EL值,首先根據(jù)特定音頻軌道的信號頻率測量當(dāng)前響度(圖2中步驟S21和S22)。以這種方式測量的響度值被用于確定固定時間間隔內(nèi)的局部最大值。各當(dāng)前響度最大值被存儲在存儲器中,其中在每種情況下根據(jù)詢問S25(“太大聲”?),如果各自存在的EL值超出了限定的公差,那么存儲在該存儲器中的值在步驟S26中被重寫。如果音頻軌道的當(dāng)前響度小于預(yù)定值,那么調(diào)整在步驟S23(“太小聲”?)中暫停。
在每種情況下根據(jù)步驟S28獲得存儲音頻軌道響度特性的數(shù)據(jù),其依據(jù)固定時間間隔內(nèi)的局部最大值的搜索(步驟S27)。因此存在于存儲器中的值包含相關(guān)音頻源的音頻信號的各響度最大值。根據(jù)存儲的響度最大值計算EL值(步驟S29)。
如果沒有可用的以前的音量值(例如由于涉及新的未知音頻源)或者如果當(dāng)前音量大體大于EL值,執(zhí)行新EL值的快速近似確定。該近似值基于傳入音頻軌道的新響度最大值。只要發(fā)現(xiàn)新的平均最大值,利用該值重寫存儲器內(nèi)容并且再次執(zhí)行根據(jù)本發(fā)明的計算。
圖3示出了用于圖2的步驟22中的響度限定的示意性算法的示例。音頻軌道(S22a)被細(xì)分為單獨的頻率成分(例如通過傅里葉分析)。在步驟S22b中,心理聲學(xué)估算濾波器被應(yīng)用到該離散譜中,例如帶通濾波器,該濾波器可以具有向下開放的拋物線形,其在人耳感知最大值處具有最大值。以這種方式獲得的加權(quán)譜成分的平方被加和并且與步驟S22c中的標(biāo)準(zhǔn)化常數(shù)相乘以產(chǎn)生表示當(dāng)前響度的值(S22d)。除了圖3中所示的響度限定之外,也可以想到針對響度限定的各種其它算法。
圖4示出了用于確定圖2的步驟S29所使用的平均最大響度的可行方法,其僅以示例方式給出。存在于存儲器中的音頻信號優(yōu)選——但并非必須——在步驟30細(xì)分為單獨的框(在該情形中是三個)。在步驟31,函數(shù)被應(yīng)用到單獨的區(qū)段,函數(shù)提供與最大值(對應(yīng)于步驟S28)接近的值,例如和/或和/或其中意指適用的全部值(mean=平均值,max=最大值并且std=標(biāo)準(zhǔn)偏差)。在32處,“遺忘因子”λ可以可選地被應(yīng)用到與最大值接近的單獨的值,其中0<λ<1。因此,與最近的信號相比,以前的信號被給予較少的權(quán)重。最終,在33處,以這種方式獲得的值被相加以形成和(如必要,在之前的平方之后)并且因此在34處獲得值EL。此外,用于確定EL值的各種其它算法是明顯可行的。