專利名稱:信號處理設(shè)備、信號處理方法及其程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種信號處理設(shè)備、信號處理方法及其程序。本發(fā)明尤其 涉及一種適合在將音頻信號分解為其各個音調(diào)分量時使用的信號處理設(shè) 備、信號處理方法及程序。
背景技術(shù):
此前,提出了多種音樂音調(diào)分析技術(shù)用于根據(jù)輸入的音頻信號自動產(chǎn) 生樂譜的自動記譜、或用于檢測輸入音頻信號的音樂特征。音樂音調(diào)分析是一種通過分解為關(guān)于對應于視唱音節(jié)(哆、睞、咪等) 的各個音調(diào)C、 C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A弁以及B的信息12個音調(diào)C、 C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A弁以及B構(gòu)成 單個八度音階(octave )。下文中,按照從低(即低頻)八度音階到高(即 高頻)八度音階的順序,將八度音階稱為八度音階Ol、 02、 03等。另 外,例如將'^度音階01的音調(diào)C稱為C1,將y、度音階02的音調(diào)A弁稱 為A#2。一個給定的八度音階的音調(diào)與較低八度音階音調(diào)相關(guān),這是因為給定 的八度音階的音調(diào)是較低八度音階的音調(diào)的倍數(shù)。換句話說,音調(diào)關(guān)于頻 率成對數(shù)(或指數(shù))分布。例如,如果取音調(diào)A3 (即八度音階03的音 調(diào)A)具有440Hz的頻率(即中心頻率),則音調(diào)A4 (即八度音階04的 音調(diào)A)具有兩倍于440Hz的頻率,也就是880Hz。此外,諸如C和C# 的相鄰音調(diào)之間的頻率(即中心頻率)差隨著y乂度音階的變高而增加。例 如,在低八度音階02 (127.1Hz至254.2Hz)中,C2與C#2之間的差約為6Hz,而在高八度音階06中,C6與C弁6之間的差約為123Hz.另外,給定的八度音階中每個音調(diào)各自的頻帶(即帶寬)是接下來的 較低八度音階中相應的音調(diào)的頻帶的兩倍。用于音頻信號的音樂音調(diào)分析的已有技術(shù)包括利用短時傅立葉變換 的技術(shù)(下文中稱為STFT技術(shù))以及利用小波(wavelet)變換的技術(shù)(下文中稱為小波變換技術(shù))。另外,還有與在本申請中提出的技術(shù)類似 的利用八度音階分割和帶通濾波的技術(shù)(下文中稱為八度音階分割技術(shù))(例如,參見JP-A-2005-275068 )。STFT技術(shù)利用等間隔的頻帶分析音頻信號的頻率分量.由于該原 因,如上所述,因為音調(diào)是關(guān)于頻率成對數(shù)分布的,所以存在在低頻時分 析精度較低的趨勢。利用小波變換技術(shù),可以通過使用能夠提取八度音階的十二分之一 (即單個音調(diào))的基本函數(shù)以理想的時間分辨率和頻率分辨率估計音調(diào)。 然而,小波變換技術(shù)涉及大量復雜的計算。相比而言,利用八度音階分割技術(shù),可以進行音調(diào)分析而在低頻時不 ^it成精度降低,此外與小波變換技術(shù)的計算復雜度相比,計算復雜度降 低。發(fā)明內(nèi)容在相關(guān)技術(shù)的音調(diào)分析方法中,音頻信號的音調(diào)分析主要關(guān)注低頻, 而很少考慮針對高頻的音調(diào)分析。然而,近年來已經(jīng)出現(xiàn)了也關(guān)注高頻的 音調(diào)分析的趨勢。然而,雖然如上所述八度音階分割技術(shù)在低頻時優(yōu)于STFT技術(shù)和小 波技術(shù),但是在高頻時不存在相對于STFT技術(shù)和小波技術(shù)的優(yōu)勢。因此,希望實現(xiàn)一種針對音調(diào)能夠?qū)σ纛l信號中的高頻信號和低頻信 號都進行高效分析的技術(shù)。針對上述情況提出的本發(fā)明可以在音頻信號的高頻和低頻側(cè)針對音 調(diào)高效地分析音頻信號.根據(jù)本發(fā)明的實施例的信號處理設(shè)W析音頻信號,并且設(shè)置有第 一提取裝置,用于從輸入音頻信號中提取包含高頻率的高頻信號;第二提 取裝置,用于從輸入音頻信號中提取包含低頻率的低頻信號;高頻處理裝置,用于分析從音頻信號中提取的高頻信號中包含的多個音調(diào)分量,所述分析利用短時傅立葉變換來進行;低頻處理裝置,用于分析從音頻信號中 提取的低頻信號中包含的多個音調(diào)分量,所述分析通過首先將低頻信號分 割為多個八度音階分量、然后從各個八度音階分量中提取多個音調(diào)分量來 進行;以及合成裝置,用于將包含在分析的高頻信號中的多個音調(diào)分量與 包含在分析的低頻信號中的多個音調(diào)分量合成。高頻處理裝置可以被配置為包括短時傅立葉變換裝置,用于通過利 用短時傅立葉變換分析從音頻信號中提取的高頻信號來獲得等間隔的頻 帶分量;以及求和裝置,用于通過將構(gòu)成各自音調(diào)的多個頻帶的能量求和 來分析包含在分割的高頻信號中的多個音調(diào)分量。低頻處理裝置可以被配置為包括八度音階分割裝置,用于通過重復 將從音頻信號中提取的低頻信號進一步分割為包含高頻率的高頻分量和 包含低頻率的低頻分量、然后分別對該高頻分量和低頻分量進行降釆樣, 將從音頻信號中提取的低頻信號分割為多個八度音頻分量;以及濾波裝 置,用于通過分別對多個八度音階分量中的每個八度音階分量進行濾波來 提取多個音調(diào)分量。低頻處理裝置還可以被配置為進一步包括再采樣裝置,用于對從音 頻信號中提取的低頻信號進行再采樣。根據(jù)本發(fā)明的另 一個實施例的信號處理方法用于分析音頻信號的信 號處理設(shè)備,包括步驟從輸入音頻信號中提取包含高頻率的高頻信號; 從輸入音頻信號中提取包含低頻率的低頻信號;分析從音頻信號中提取的 高頻信號中包含的多個音調(diào)分量,所述分析利用短時傅立葉變換來進行; 分析從音頻信號中提取的低頻信號中包含的多個音調(diào)分量,所述分析通過 首先將低頻信號分割為多個八度音階分量、然后從各個八度音階分量中提 取多個音調(diào)分量來進行;以及將包含在分析的高頻信號中的多個音調(diào)分量 與包含在分析的低頻信號中的多個音調(diào)分量合成。才艮據(jù)本發(fā)明的另一個實施例的程序用于控制分析音頻信號的信號處 理設(shè)備,并且使信號處理設(shè)備的計算機執(zhí)行處理,所述處理包括步驟從 輸入音頻信號中提取包含高頻率的高頻信號;從輸入音頻信號中提取包含 低頻率的低頻信號;分析從音頻信號中提取的高頻信號中包含的多個音調(diào) 分量,所述分析利用短時傅立葉變換來進行;分析從音頻信號中提取的低 頻信號中包含的多個音調(diào)分量,所述分析通過首先將低頻信號分割為多個 八度音階分量、然后從各個八度音階分量中提取多個音調(diào)分量來進行;以及將包含在分析的高頻信號中的多個音調(diào)分量與包含在分析的低頻信號 中的多個音調(diào)分量合成。在本發(fā)明的實施例中,從輸入的音頻信號中提取高頻信號和低頻信 號,高頻信號包含較高頻率的音頻信號,低頻信號包^^較低頻率的音頻信 號。然后,利用短時傅立葉變換對提取的高頻信號進行分析,將其分解為 其中包含的多個音調(diào)分量。另外,通過將低頻信號分割為多個八度音階分 量,然后從每個八度音階分量中提取多個音調(diào)分量來分析提取的低頻信 號,將其分解為其中包含的多個音調(diào)分量。隨后,將包含在分析的高頻信 號中的多個音調(diào)分量與包含在分析的低頻信號中的多個音調(diào)分量進行組 合。根據(jù)本發(fā)明的實施例,可以針對音調(diào)高效地分析較高頻率和較低頻率 的音頻信號.
圖l是用于說明音頻信號的八度音階、音調(diào)和頻率之間的關(guān)系的圖;圖2是示出應用了本發(fā)明的音頻信號分析裝置的示例性結(jié)構(gòu)的框圖;圖3是示出圖2所示的高頻處理器的示例性結(jié)構(gòu)的框圖;圖4是用于說明圖3所示的STFT單元的處理的圖;圖5是用于說明圖3所示的STFT單元的處理的圖;圖6是用于說明圖3所示的能量求和單元的處理的圖;圖7是示出圖2所示的低頻處理器的示例性結(jié)構(gòu)的框圖;圖8是示出圖7所示的八度音階分割塊的示例性結(jié)構(gòu)的框圖;圖9是示出圖8所示的八度音階分割單元的示例性結(jié)構(gòu)的框圖;圖IO是用于說明圖9所示的高通濾波器的處理的圖;圖11是用于說明圖9所示的降采樣(downsample )單元的處理的圖;圖12是示出圖7所示的帶通濾波塊的示例性結(jié)構(gòu)的框圖;圖13是示出圖12所示的帶通濾波器的頻率特性的圖;圖14是用于說明音頻信號分析裝置的分析處理的流程圖;圖15是用于說明圖14的步驟S2中的處理的流程圖;圖16是用于說明圖14的步驟S3中的處理的流程圖;以及 圖17是示出計算機的示例性結(jié)構(gòu)的框圖。
具體實施方式
下文中,將描述根據(jù)本發(fā)明的實施例的音頻信號分析裝置。然而,在 此之前,參照圖l描述音頻信號分析裝置要處理的音頻信號。圖1示出音 頻信號的音調(diào)與頻率之間的關(guān)系。如圖1所示,要處理的音頻信號包含從63.551^到32534.8Hz的范圍 內(nèi)的頻率分量。按照從低頻側(cè)開始的順序,將這些頻率分量分為編號為 Ol到09的9個八度音階。取每個八度音階包含按照從低頻到高頻的順 序朝卜列的12個音調(diào)C、 C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A弁和B。將'^度音階01的12個音調(diào)C、 C#、 D、 D#、 E、 F、 F#、 G、 G#、 A、 A弁和B (下文中也稱為從C到B的12個音調(diào))分別設(shè)定為Cl、 C#l、 Dl、 D#l、 El、 Fl、 F#l、 Gl、 G#l、 Al、 A#l和Bl (下文中也稱為從 Cl到Bl的12個音調(diào))。對/\度音階02到09的音調(diào)ii行類似的i更定。在圖1中,通過將八度音階03的音調(diào)A(即音調(diào)A3 Mt為具有440Hz 的頻率(即中心頻率)的基準音調(diào)來確定每個八度音階中的12個音調(diào)的 頻率。更具體地,因為音調(diào)關(guān)于頻率呈對數(shù)分布,所以將單個八度音階分為 12個音調(diào)得到相鄰音調(diào)的頻率(即中心頻率)的比為l:W (即2的12次 方根)。另外,相鄰音調(diào)的頻率范圍的比也是l:1^。如圖1所示,例如在八度音階3的音調(diào)A3之后接下來的最高音調(diào)是 A#3,因此A弁3的頻率(即中心頻率)變?yōu)?40.0 (A3的頻率)乘以1^, 即466.2Hz.同樣,A弁3之后接下來的最高音調(diào)是B3,因此B3的頻率變 為A弁3的頻率乘以1^,即493,9Hz。類似地,根據(jù)基準音調(diào)確定其它音 調(diào)的頻率。另外,因為單個八度音階被循環(huán)地從C到B的12個音調(diào)定界,所以 單個八度音階的頻率范圍從C的頻率范圍中的最低頻率延伸到B的頻率 范圍中的最高頻率。例如,八度音階04的頻率范圍從C4的頻率范圍中 的最低頻率延伸到B4的頻率范圍中的最高頻率,具體地是從508.4Hz到 1016.7Hz。作為另一個例子,八度音階05的頻率范圍從C5的頻率范圍中的最低頻率延伸到B5的頻率范圍中的最高頻率,具體地是從1016.7Hz 到2033.4Hz。應當認識到,在本說明書中,這里表示為從X Hz到Y(jié) Hz (其中X和Y是任意值)的頻率范圍意為大于等于X Hz并且小于YHz。此外,應當認識到,除了八度音階04以及八度音階03和05的一 部分之外,為了簡要,在圖1中未示出八度音階01到09中的每一個的 12個音調(diào)的中心頻率和頻率范圍。圖2示出根據(jù)本發(fā)明的實施例的音頻信號分析裝置的示例性結(jié)構(gòu)。音 頻信號分析裝置IO對作為時序信號輸入的音頻信號進行處理和分析,從 而針對每個八度音階將音頻信號分解為12個音調(diào)并計算每個音調(diào)的能量。然后,音頻信號分析裝置10的處理結(jié)果可用于進行音樂分析。更具 體地,處理結(jié)果可用于分析音頻信號的音樂特征,例如旋律、和弦進行 (chord progression )、節(jié)奏以及音符數(shù)量。音頻信號分析裝置10包括下列部件高通濾波器(HPF, high-pass filter) 11,提取輸入的音頻信號中包含較高頻率的信號(下文中稱為高頻 信號);低通濾波器(LPF, low-pass filter) 12,提取輸入的音頻信號中 包含較低頻率的信號(下文中稱為低頻信號);高頻處理器13,利用STFT 技術(shù)對提取的高頻信號進行音調(diào)分析;低頻處理器14,利用八度音階分 割技術(shù)對提取的低頻音頻信號進行音調(diào)分析;以及合成單元15,將來自 高頻處理器13的音調(diào)分析結(jié)果與來自低頻處理器14的音調(diào)分析結(jié)果組 合。輸入到音頻信號分析裝置10的音頻信號是通過以預定采樣率對音頻 進行采樣獲得的信號。例如,如果輸入CD (光盤,compact disc)播放 的音頻信號,則音頻信號的采樣頻率是44.1KHz。高通濾波器11從輸入的音頻信號中提取高頻信號(例如包含大于或 等于4066.8Hz的頻率分量的信號,該頻率^1對應于八度音階07中C7的 最低頻率的頻率),然后將提取的高頻信號輸出到高頻處理器13。低通濾波器12從輸入的音頻信號中提取包含高通濾波器11沒有提取 的頻率的低頻信號(在本例子中,是包含小于4066.8Hz的頻率分量的信 號,該頻率是對應于八度音階06中的B6的最高頻率的頻率),然后將提 取的低頻信號輸出到低頻處理器14。應當認識到,高通濾波器11提取的高頻信號與低通濾波器12提取的低頻信號之間的邊界值不固定在例如上述例子中的八度音階06與07之 間的邊界,相反可以改變邊界。例如,在下文中要描述的高頻處理器13 利用STFT技術(shù)將音頻信號分割為等間隔的頻帶時,可以確定邊g使得 包含在單個音調(diào)的頻帶的數(shù)目不小于預定數(shù)目。可選地,可以根據(jù)處理時 間或最終期望的分析精度來確定邊界。如圖3所示,高頻處理器13包括STFT單元21,對從高通濾波器 11接收到的作為輸入的高頻信號施加短時傅立葉變換;以及能量求和單 元22,通過對各自音調(diào)包含的頻率分量的能量求和來計算每一個音調(diào)的 能量。如圖4所示,STFT單元21將從高通濾波器11接收到的作為輸入的 高頻信號分成多個具有預定持續(xù)時間的部分重疊的幀。此外,如圖5所示, STFT單元21對高頻信號幀中的每一個首先施加窗口函數(shù),然后施加快 速傅立葉變換(FFT, fast Fourier transform),其結(jié)果是,高頻信號幀被 細分為多個等間隔的頻帶,并且計算每個頻帶的能量。如圖6所示,能量求和單元22基于來自STFT單元21的輸出,通過 對每個音調(diào)包含的頻帶的各個能量求和來計算每個音調(diào)的能量。如圖7所示,低頻處理器14包括再采樣單元13,對從低通濾波器 12接收到的作為輸入的低頻信號進行再采樣;八度音階分割塊32,將再 采樣的低頻信號分成從Ol到06的多個八度音階;以及帶通濾波器塊(下 文中稱為BPFB, band-pass filter block) 33-1至33-6,從每一個八度音 階的頻率分量中分別^^取從B到C的12個音調(diào).再采樣單元31以預定采樣頻率對作為輸入接收到的低頻信號進行再 采樣,以使得該低頻信號適合八度音階分割塊32進行后續(xù)處理。然后, 再采樣單元31將再采樣的低頻信號輸出到八度音階分割塊32。八度音階分割塊32將從再采樣單元31接收到的作為輸入的再采樣的 低頻信號分成八度音階Ol至06的頻率分量,然后將/\度音階Ol至06 的頻率分量分別輸出到相應的BPFB 33-1至33-6。換句話說,八度音階 分割塊32將八度音階Ol的頻率分量輸出到BPFB 33-1,將八度音階02 的頻率分量輸出到BPFB 33-2。類似地,將八度音階03至06的頻率分 量輸出到其余BPFB。更具體地,在八度音階分割塊32中,作為輸入接收到的低頻信號進 一步被細分為高頻分量和低頻分量。然后,將得到的分量分別降采樣到當前采樣頻率一半的采樣頻率,提取高頻分量的降采樣結(jié)果作為八度音階06的音頻信號。此外,低頻分量的降采樣結(jié)果被繼續(xù)細分為高頻分量和低頻分量,然 后將其降采樣到當前采樣頻率的一半。提取如此獲得的高頻分量的降采樣 結(jié)果作為下一最低的八度音階05的音頻信號。針對其余的八度音階04 至Ol類似地提取音頻信號。以這種方式,在八度音階分割塊32中,重復進行處理,以將低頻信 號分成高頻分量和低頻分量,然后將得到的分量降采樣到當前采樣頻率的 一半,從而提取每一個八度音階的音頻信號。因此,作為通過將輸入到八 度音階分割塊32的音頻信號的采樣頻率除以2>=1,2,...)而得到的值來給 定每一個八度音階的邊界頻率。因此,如果假定不設(shè)置再采樣單元31,在不進行再采樣的情況下將 低頻信號按原樣提供到八度音階分割塊32,則會產(chǎn)生下列問題。例如,如果輸入到音頻信號分析裝置10的音頻信號的采樣頻率為 44.1kHz,則在八度音階分割塊32中將該音頻信號分割到多個頻帶,提取 作為頻率范圍在((44.1/2)/2)kHz至44.1/2kHz的高頻分量的音頻信號。由 于獲得的音頻信號的最高和最低頻率與圖1所示的八度音階Ol至09的 邊界頻率中的任意一個不匹配,因此提取的高頻分量中的較低頻率和/或 較高頻率分量缺乏希望的八度音階中的音調(diào)的部分頻率分量,或者可選 地,在希望的八度音階中包含其它鄰近八度音階中的音調(diào)的部分頻率分 量。為了避免這種問題,再采樣單元31被構(gòu)造成使用兩個預定八度音 階之間的邊界頻率作為基頻,對輸入其中的低頻信號進行再采樣,其中基 頻乘以2的冪以產(chǎn)生進行再采樣的采樣頻率。作為更具體的示例,如果將分離八度音階04和05的邊界頻率 1016.7Hz取作基頻,則使用等于基頻乘以25即32534.7Hz的新的采樣頻 率對該音頻信號進行再采樣。應當認識到,其中對作為基頻的邊界頻率的 選擇是任意的,2的冪的選擇也是任意的。例如,這些值可以根據(jù)具體要 提取哪個包含特定音調(diào)的八度音階來確定。BPFB 33-1至33-6中的每一個包括12個內(nèi)置的帶通濾波器,其使頻 率在從C至B的12個音調(diào)的各個頻率范圍內(nèi)的音頻信號通過。因此,當 BPFB 33-1至33-6中的一個對從八度音階分割塊32作為輸入接收的單個八度音階的音頻信號進行濾波時,^l取包^^從C至B的12個音調(diào)的音頻 信號作為結(jié)果。例如,BPFB 33-1對>^^度音階分割塊32作為輸入接收的八度音階 Ol的音頻信號進行濾波,從而提取從Cl至Bl的12個音調(diào)的信號分量。 作為另一個例子,BPFB 33-2對從八度音階分割塊32作為輸入接收的八 度音階02的音頻信號進行濾波,從而提取從C2至B2的12個音調(diào)的信 號分量。BPFB 33-3至33-6以類似的方式工作。接下來,參考圖8和9詳細描述八度音階分割塊32的示例性結(jié)構(gòu)。 如圖8所示,八度音階分割塊32包括八度音階分割單元51-1至51-5。此 外,如圖9所示,八度音階分割單元51-1包括高通濾波器(HPF)71-1、降 釆樣(DS)單元72-1、低通濾波器(LPF)73-1、降采樣單元74-1、高通濾波 器75以及降采樣單元76。八度音階分割單元51-2包括高通濾波器72-1、 降采樣單元72-2、低通濾波器73-2和降采樣單元74-2。八度音階分割單 元51-3至51-5與八度音階分割單元51-2類似地構(gòu)成。更具體地,八度音階分割單元51-5設(shè)置有高通濾波器71-5,用于 取出作為輸入從再采樣單元31接收到的以32534.7Hz的采樣頻率進行了 再采樣的音頻信號,并且從中提取包含上半部分頻帶的分量(下文中稱為 高頻分量),如圖IO所示;降采樣單元72-5,用于將《^取的高頻分量降采 樣到采樣頻率的一半;低通濾波器73-5,用于取出作為輸入從再采樣單元 31接收到的以32534.7Hz的采樣頻率進行了再采樣的音頻信號,并且從 中提取包含下半部分頻帶的分量(下文中稱為低頻分量);以及降采樣單 元74-5,用于將提取的低頻分量降采樣到采樣頻率的一半。隨后,將從降采樣單元72-5輸出的降采樣后的高頻分量作為八度音 階06的音頻信號提供給后續(xù)的BPFB33-6。另外,將從降采樣單元74-5 輸出的降采樣后的低頻分量提供給八度音階分割單元51-4。應當認識到,與降采樣之前的高頻分量相比,高通濾波器51-5提取 的并且被降采樣單元72-5降采樣到采樣頻率的一半的高頻分量被顛倒 (reverse )。換句話說,與降采樣之前的信號分量(如圖10所示)相比以 相反的順序?qū)诮挡蓸雍蟮母哳l分量中的音調(diào)的信號分量排列在頻 率軸上。因此,如圖ll所示,音調(diào)按照B, A#, A, G#, G, F#, F, E, D#, D, C弁和C的順序排列。與上述類似地構(gòu)成其它八度音階分割單元51-i (i = 4, 3, 2)。將輸入音頻信號分成高頻分量和低頻分量,將這些分量分別降采樣到采樣頻率的一半。然后,將降采樣后的高頻分量作為八度音階o(i+i)的音頻信號提供給后續(xù)的BPFB 33-(i+l),同時將降采樣后的低頻分量提供給八度音階 分割單元51-(i曙l)。然而,在八度音階分割單元51-1中,進一步從降采樣后的低頻分量 中提取高頻分量,然后將其降采樣到采樣頻率的一半。然后,將降采樣結(jié) 果作為八度音階Ol的音頻信號提供給BPFB 33-1?,F(xiàn)在,參考圖12和13詳細描述BPFB 33-1至33-6的示例性結(jié)構(gòu)。 圖12示出BPFB33-1的示例性結(jié)構(gòu)。BPFB 33-1包括帶通濾波器(下文中稱為BPF) 91-1至91-12,其分 別具有對應于Cl至Bl的12個音調(diào)的各個頻率范圍的通帶(passband )。 BPF 91-1至91-12被配置為從作為輸入>^^\度音階分割塊32接收到的八 度音階Ol的音頻信號中分別提取Cl至Bl的12個音調(diào)。然而,如圖ll所示,作為輸入從八度音階分割塊32接收到的單個八 度音階的音頻信號的音調(diào)在頻率軸上以相反的順序排列。由于該原因,如 圖13所示設(shè)計了 BPF91-1至91-12的頻率特性。更具體地,BPF 91-1具有從來自八度音階分割塊32的八度音階分割 單元51-1作為輸入接收到的八度音階01的音頻信號中提取音調(diào)Cl的音 頻信號的特性。BPF91-2具有>^/\度音階Ol的音頻信號中提取音調(diào)C#l 的音頻信號的特性。類似地,BPF 91-3至91-12具有分別拔:取音調(diào)Dl至 Bl的音頻信號的特性。與BPFB 33-1類似地構(gòu)成BPFB 33-2至33-6。然而,構(gòu)成BPFB 33陽2 至33-6中的每一個的12個BPF的頻率特性自然不同于構(gòu)成BPFB 33-1 的BPF 91-1至91-12的頻率特性。現(xiàn)在,參考圖14中的流程圖,描述音頻信號分析裝置IO執(zhí)行的分析 處理。首先,將要分析的音頻信號輸入到音頻信號分析裝置10。在步驟S1 中,當將音頻信號提供給音頻信號分析裝置10的高通濾波器11和低通濾 波器12時,高通濾波器11從輸入的音頻信號中提取高頻信號,并將提取 的高頻信號提供給高頻處理器13。低通濾波器12從輸入的音頻信號中提 取低頻信號,并將提取的低頻信號提供給低頻處理器14。在步驟S2中,高頻處理器13采用STFT技術(shù)對從高通濾波器11提供的高頻信號進行音調(diào)分析,并將音調(diào)分析的結(jié)果輸出到合成單元15?,F(xiàn)在,參考圖15中的流程圖描述高頻處理器13在步驟S2中執(zhí)行的 處理(即高頻信號音調(diào)分析處理)的細節(jié)。在步驟Sll中,高頻處理器13的STFT單元21將從高通濾波器11 提供的高頻信號分成多個部分重疊的具有預定持續(xù)時間的幀。在步驟S12 中,STFT單元21首先對每一個幀中的高頻信號應用窗口函數(shù),然后進 行快速傅立葉變換(FFT)。然后,將從上述處理的結(jié)果獲得的每一個幀的 高頻信號在等間隔的頻帶上的各自能量輸出到能量求和單元22。在步驟S13中,基于來自STFT單元21的輸出,能量求和單元22 通過對包含在給定音調(diào)中的頻帶上的能量求和來計算每一個音調(diào)的能量。 然后,將求和后的能量作為高頻信號的音調(diào)分析結(jié)果輸出到合成單元15。 這結(jié)束了對高頻處理器13執(zhí)行的高頻信號音調(diào)分析處理的描述。返回圖14,在步猓S3中,低頻處理器14采用八度音階分割技# 從低通濾波器12提供的低頻信號進行音調(diào)分析,并將音調(diào)分析結(jié)果輸出 到合成單元15。現(xiàn)在,參考圖16中的流程圖描述低頻處理器14在步驟S3中執(zhí)行的 處理(即低頻信號音調(diào)分析處理)的細節(jié)。在步驟S21中,低頻處理器14的再采樣單元31以預定采樣頻率(例 如,32534.7Hz)對從低通濾波器12提供的低頻信號進行再采樣。然后, 將再采樣后的低頻信號提供至八度音階分割塊32。在步驟S22中,八度音階分割塊32將從再采樣單元31提供的再采樣 后的低頻信號分成八度音階01至06的各個頻率分量。然后,分別將分 割后的八度音階Ol至06的頻率分量輸出到相應的BPFB 33-1至33-6。在步驟S23中,BPFB 33-1至33-6通過對作為輸入>^^\度音階分割 塊32接收到的單個八度音階的音頻信號進行濾波,分別提# C至B的 12個音調(diào)的音頻信號。然后,將各個音調(diào)的音頻信號作為低頻信號的音 調(diào)分析結(jié)果輸出到合成單元15。這結(jié)束了對低頻處理器14執(zhí)行的低頻信 號音調(diào)分析處理的描述。返回圖14,應當i人識到,也可以以相反的順序或者并行執(zhí)行以上描 述的在步驟S2和S3中執(zhí)行的處理。在步驟S4中,合成單元15將高頻處理器13獲得的音調(diào)分析結(jié)果和低頻處理器14獲得的音調(diào)分析結(jié)果合成,并將合成結(jié)果作為對輸入到音 頻信號分析裝置10的音頻信號的分析結(jié)果輸出。這結(jié)束了對音頻信號分 析裝置10執(zhí)行的分析處理的描述。如前所述,根據(jù)音頻信號分析裝置10,由于對音頻信號中的較高頻 信號和較低頻信號分別應用不同的音調(diào)分析技術(shù),因此可以針對音調(diào)高效 地分析音頻信號。更具體地,通過采用STFT技術(shù)分析音頻信號的較高頻信號,與釆用八度音階分割技術(shù)分析較高頻信號的情;;U目比,可以在計算復雜度減小的情況下獲得分析結(jié)果。此外,由于作為副產(chǎn)品(byproduct)從高頻處理器13獲得了 STFT 處理結(jié)果,這些STFT處理結(jié)果也可以用于進行音樂分析或者其它用途??梢酝ㄟ^硬件或軟件來執(zhí)行前述一系列處理。如果在軟件中執(zhí)行該一 系列處理,則內(nèi)置到專用硬件中的計算機可以從程序記錄介質(zhì)中讀取構(gòu)成 該軟件的程序??蛇x地,可以從程序記錄介質(zhì)將程序安裝到例如通用個人 計算機上,個人計算機能夠通過安裝各種程序來執(zhí)行各種功能圖17是示出借助程序來執(zhí)行以上描述的一系列處理的計算機的示例 性硬件結(jié)構(gòu)的框圖。在該計算機中,CPU (中央處理器,central processing unit) 301、 ROM (只讀存儲器,read only memory) 302以及RAM (隨機存儲器, random access memory) 303通過總線304相互連接。另外,總線304還連接到輸X/輸出接口 305。連接到輸"輸出接口 305的有輸入單元306,包M如鍵盤、鼠標和麥克風的部件;輸出裝 置307,包括諸如顯示器和揚聲器的部件;存儲單元308,包拾清如M 和非易失性存儲器的部件;通信單元309,包括諸如網(wǎng)絡(luò)接口的部件;以 及控制可移動介質(zhì)321至324的驅(qū)動310,可移動介質(zhì)是磁盤、光盤、磁 光盤或半導體存儲器。在如上所述構(gòu)成的計算機中,可以作為例如CPU 301經(jīng)由輸V輸出1^執(zhí)行該程序的結(jié)果來進行以上描述的 一 系列處理。應當認識到,可以編寫計算機執(zhí)行的程序,使得按照在本說明書中描 述的順序以時間順序執(zhí)行這些處理、并行執(zhí)行這些處理、或者棉^據(jù)合適的 時序調(diào)用并執(zhí)行這些處理。此外,可以編寫程序以由單個計算機進行處理或者由多個計算機以分 布的方式進行處理。還可以編寫程序以傳送到遠程計算機并執(zhí)行。本領(lǐng)域技術(shù)人員應當理解,可以根據(jù)設(shè)計需要和其它因素來進行各種 變形、組合、子組合和變化,而它們均在所附權(quán)利要求或其等同物的范圍 內(nèi)。
權(quán)利要求
1.一種用于分析音頻信號的信號處理設(shè)備,包括第一提取裝置,用于從輸入音頻信號中提取包含高頻率的高頻信號;第二提取裝置,用于從輸入音頻信號中提取包含低頻率的低頻信號;高頻處理裝置,用于分析從音頻信號中提取的高頻信號中包含的多個音調(diào)分量,所述分析利用短時傅立葉變換來進行;低頻處理裝置,用于分析從音頻信號中提取的低頻信號中包含的多個音調(diào)分量,所述分析通過首先將低頻信號分割為多個八度音階分量、然后從每個八度音階分量中分別提取多個音調(diào)分量來進行;以及合成裝置,用于將包含在分析的高頻信號中的多個音調(diào)分量與包含在分析的低頻信號中的多個音調(diào)分量合成。
2. 如權(quán)利要求1所述的信號處理設(shè)備,其中高頻處理裝置被配置為 包括短時傅立葉變換裝置,用于通過利用短時傅立葉變換分析從音頻信號 中提取的高頻信號來獲得等間隔的頻帶分量;以及求和裝置,用于通過將構(gòu)成各自音調(diào)的多個頻帶的能量求和來分析包 含在分割的高頻信號中的多個音調(diào)分量。
3. 如權(quán)利要求1所述的信號處理設(shè)備,其中低頻處理裝置被配置為 包括八度音階分割裝置,用于通過重復將從音頻信號中提取的低頻信號進 一步分割為包含高頻率的高頻分量和包含低頻率的低頻分量、然后分別對 該高頻分量和低頻分量進行降釆樣,將從音頻信號中提取的低頻信號分割 為多個八度音頻分量;以及濾波裝置,用于通過分別對多個八度音階分量中的每個八度音階分量 進行濾波來^1取多個音調(diào)分量。
4. 如權(quán)利要求3所述的信號處理設(shè)備,其中低頻處理裝置被配置為 進一步包括再采樣裝置,用于對從音頻信號中提取的低頻信號進行再采樣。
5. —種在分析音頻信號的信號處理設(shè)備中使用的信號處理方法,包括步驟從輸入音頻信號中提取包含高頻率的高頻信號;從輸入音頻信號中提取包含低頻率的低頻信號;分析從音頻信號中提取的高頻信號中包含的多個音調(diào)分量,所述分析 利用短時傅立葉變換來進行;分析從音頻信號中提取的低頻信號中包含的多個音調(diào)分量,所述分析 通過首先將低頻信號分割為多個八度音階分量、然后分別從每個八度音階 分量中提取多個音調(diào)分量來進行;以及將包含在分析的高頻信號中的多個音調(diào)分量與包含在分析的低頻信 號中的多個音調(diào)分量合成。
6. —種用于控制分析音頻信號的信號處理設(shè)備的程序,所述程序使 信號處理設(shè)備的計算機執(zhí)行處理,所述處理包括步驟從輸入音頻信號中提取包含高頻率的高頻信號;從輸入音頻信號中提取包含低頻率的低頻信號;分析從音頻信號中提取的高頻信號中包含的多個音調(diào)分量,所述分析 利用短時傅立葉變換來進行;分析從音頻信號中提取的低頻信號中包含的多個音調(diào)分量,所述分析 通過首先將低頻信號分割為多個八度音階分量、然后分別從每個八度音階 分量中提取多個音調(diào)分量來進行;以及將包含在分析的高頻信號中的多個音調(diào)分量與包含在分析的低頻信 號中的多個音調(diào)分量合成。
7. —種分析音頻信號的信號處理設(shè)備,包括第一提取器,被配置為從輸入音頻信號中提取包含高頻率的高頻信號;第二提取器,被配置為從輸入音頻信號中提取包含低頻率的低頻信號;高頻處理器,被配置為分析從音頻信號中提取的高頻信號中包含的多 個音調(diào)分量,所述分析利用短時傅立葉變換來進行;低頻處理器,被配置為分析從音頻信號中提取的低頻信號中包含的多 個音調(diào)分量,所述分析通過首先將低頻信號分割為多個八度音階分量、然后從每個八度音階分量中分別提取多個音調(diào)分量來進行;以及合成單元,被配置為將包含在分析的高頻信號中的多個音調(diào)分量與包 含在分析的低頻信號中的多個音調(diào)分量合成。
全文摘要
本發(fā)明公開了一種信號處理設(shè)備、信號處理方法及其程序。信號處理設(shè)備針對較高頻率和較低頻率采用不同的分析技術(shù)對音頻信號進行音調(diào)分析。當輸入音頻信號時,第一提取器從音頻信號中提取高頻信號,第二提取器從音頻信號中提取低頻信號。高頻處理器通過應用短時傅立葉變換從高頻信號中提取音調(diào)分量。低頻處理器通過將低頻信號分為多個八度音階分量從低頻信號中提取音調(diào)分量。然后,合成單元將如此從高頻信號和低頻信號中提取的音調(diào)分量合成,并輸出分析結(jié)果。
文檔編號G10G3/00GK101404155SQ20081016146
公開日2009年4月8日 申請日期2008年9月27日 優(yōu)先權(quán)日2007年10月5日
發(fā)明者小林由幸 申請人:索尼株式會社