專利名稱:區(qū)分信號(hào)信息內(nèi)容和控制信號(hào)處理功能的音頻系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明主要地涉及音頻系統(tǒng)并且更具體地涉及一種使用自適應(yīng)智能區(qū)分消費(fèi)者音頻生成的音頻信號(hào)的動(dòng)態(tài)內(nèi)容并且控制與音頻信號(hào)關(guān)聯(lián)的信號(hào)處理功能的音頻系統(tǒng)和方法。
背景技術(shù):
音頻音響系統(tǒng)常用來(lái)放大信號(hào)并且再現(xiàn)可聽(tīng)聲音。聲音生成源(諸如蜂窩電話、移 動(dòng)音響系統(tǒng)、多媒體播放器、家庭娛樂(lè)系統(tǒng)、因特網(wǎng)流發(fā)送、計(jì)算機(jī)、筆記本計(jì)算機(jī)、視頻游戲或者其他電子設(shè)備)生成電音頻信號(hào)。向音頻放大器路由音頻信號(hào),該音頻放大器控制量值并且對(duì)音頻信號(hào)執(zhí)行其他信號(hào)處理。音頻放大器可以執(zhí)行濾波、調(diào)制、失真增強(qiáng)或者減少、聲音效果和其他信號(hào)處理功能以增強(qiáng)音頻信號(hào)的音質(zhì)和頻率性質(zhì)。向揚(yáng)聲器發(fā)送放大的音頻信號(hào)以將電信號(hào)轉(zhuǎn)換成可聽(tīng)聲音并且用信號(hào)處理功能引入的增強(qiáng)來(lái)再現(xiàn)聲音生成源。在一個(gè)不例中,聲音生成源可以是移動(dòng)音響系統(tǒng)。移動(dòng)音響系統(tǒng)從發(fā)射器或者衛(wèi)星接收無(wú)線音頻信號(hào)或者從光盤(CD)、存儲(chǔ)器驅(qū)動(dòng)器、音頻帶或者移動(dòng)音響系統(tǒng)的內(nèi)部存儲(chǔ)器接收記錄的聲音信號(hào)。向音頻放大器路由音頻信號(hào)。音頻放大器提供諸如放大、濾波、音調(diào)均衡和聲音效果的特征。用戶調(diào)整音頻放大器的前面板上的旋鈕以撥動(dòng)(dial-in)所需音量、音響效果和聲音效果。音頻放大器的輸出連接到揚(yáng)聲器以生成可聽(tīng)聲音。在一些情況下,音頻放大器和揚(yáng)聲器為分離單元。在其他系統(tǒng)中,單元集成到一個(gè)機(jī)箱(chassis)中。在音頻再現(xiàn)中,普遍根據(jù)音頻信號(hào)的內(nèi)容來(lái)使用多種信號(hào)處理技術(shù)以實(shí)現(xiàn)更佳聲音質(zhì)量并且否則增強(qiáng)收聽(tīng)者對(duì)音頻內(nèi)容的享受和欣賞。例如收聽(tīng)者可以調(diào)整用于不同音樂(lè)風(fēng)格的音頻放大器設(shè)置和聲音效果。音頻放大器可以使用不同壓縮器和均衡設(shè)置以增強(qiáng)聲音質(zhì)量,例如優(yōu)化古典、流行或者搖滾音樂(lè)的再現(xiàn)。通常用控制前面板開(kāi)關(guān)和控制旋鈕控制音頻放大器和其他信號(hào)處理設(shè)備。為了適應(yīng)針對(duì)不同音頻內(nèi)容的處理要求,用戶收聽(tīng)并且通過(guò)設(shè)置開(kāi)關(guān)位置并且轉(zhuǎn)動(dòng)控制旋鈕來(lái)手動(dòng)選擇所需功能(諸如放大、濾波、音調(diào)均衡和聲音效果)。當(dāng)音頻內(nèi)容改變時(shí),用戶必須對(duì)音頻放大器或者其他信號(hào)處理設(shè)備手動(dòng)進(jìn)行調(diào)整以維持音頻信號(hào)的最優(yōu)聲音再現(xiàn)。在一些數(shù)字或者模擬音頻音響系統(tǒng)中,用戶可以配置并且保存優(yōu)選設(shè)置作為預(yù)設(shè)并且然后以后手動(dòng)選擇用于系統(tǒng)的保存的設(shè)置或者工廠預(yù)設(shè)。在如果并非所有則為多數(shù)情況下,由于用戶為了對(duì)音頻放大器或者其他信號(hào)處理設(shè)備進(jìn)行手動(dòng)調(diào)整而需要的時(shí)間,所以在來(lái)自聲音生成源的音頻內(nèi)容的改變與聲音的最優(yōu)再現(xiàn)之間存在固有延遲。如果音頻內(nèi)容從一個(gè)作品到另一個(gè)作品改變,或者甚至在回放單個(gè)作品期間并且用戶想要改變信號(hào)處理功能(例如增加音量或者添加更多低音),則用戶必須手動(dòng)改變音頻放大器設(shè)置。通常需要對(duì)音頻放大器的頻繁手動(dòng)調(diào)整以在多個(gè)音樂(lè)作品的過(guò)程中或者甚至在單個(gè)作品內(nèi)維持最優(yōu)聲音再現(xiàn)。在跟上改變音頻內(nèi)容的嘗試中,多數(shù)用戶很快厭倦對(duì)音頻放大器設(shè)置持續(xù)進(jìn)行手動(dòng)調(diào)整。很少針對(duì)音頻內(nèi)容優(yōu)化音頻放大器,因?yàn)橛脩舴艞夁M(jìn)行手動(dòng)調(diào)整或者因?yàn)橛脩舨荒苓M(jìn)行足夠快的調(diào)整以跟蹤改變音頻內(nèi)容。
發(fā)明內(nèi)容
存在對(duì)實(shí)時(shí)動(dòng)態(tài)地控制音頻放大器或者其他信號(hào)處理設(shè)備的需要。因而在一個(gè)實(shí)施例中,本發(fā)明是一種包括信號(hào)處理器的消費(fèi)者音頻系統(tǒng),該信號(hào)處理器被耦合用于從消費(fèi)者音頻源接收音頻信號(hào)。音頻信號(hào)的動(dòng)態(tài)內(nèi)容控制信號(hào)處理器的操作。在另一實(shí)施例中,本發(fā)明是一種控制消費(fèi)者音頻系統(tǒng)的方法,該方法包括以下步驟提供信號(hào)處理器,該信號(hào)處理器適于用于從消費(fèi)者音頻源接收音頻信號(hào);并且使用音頻信號(hào)的動(dòng)態(tài)內(nèi)容來(lái)控制信號(hào)處理器的操作。 在另一實(shí)施例中,本發(fā)明是一種包括信號(hào)處理器的消費(fèi)者音頻系統(tǒng),該信號(hào)處理器被耦合用于從消費(fèi)者音頻源接收音頻信號(hào)。時(shí)域處理器被耦合用于接收音頻信號(hào)并且生成音頻信號(hào)的時(shí)域參數(shù)。頻域處理器被耦合用于接收音頻信號(hào)并且生成音頻信號(hào)的頻域參數(shù)。簽名數(shù)據(jù)庫(kù)包括多個(gè)簽名記錄,每個(gè)簽名記錄具有時(shí)域參數(shù)和頻域參數(shù)以及控制參數(shù)。識(shí)別檢測(cè)器匹配音頻信號(hào)的時(shí)域參數(shù)和頻域參數(shù)與簽名數(shù)據(jù)庫(kù)的簽名記錄。匹配簽名記錄的控制參數(shù)控制信號(hào)處理器的操作。在另一實(shí)施例中,本發(fā)明是一種控制消費(fèi)者音頻系統(tǒng)的方法,該方法包括以下步驟提供信號(hào)處理器,該信號(hào)處理器適于用于從消費(fèi)者音頻源接收音頻信號(hào),生成音頻信號(hào)的時(shí)域參數(shù),生成音頻信號(hào)的頻域參數(shù),提供包括多個(gè)簽名記錄的簽名數(shù)據(jù)庫(kù),每個(gè)簽名記錄具有時(shí)域參數(shù)和頻域參數(shù)以及控制參數(shù),匹配音頻信號(hào)的時(shí)域參數(shù)和頻域參數(shù)與簽名數(shù)據(jù)庫(kù)的簽名記錄,并且基于匹配簽名記錄的控制參數(shù)控制信號(hào)處理器的操作。
圖I圖示了音頻聲源生成音頻信號(hào)并且通過(guò)信號(hào)處理設(shè)備向揚(yáng)聲器路由音頻信號(hào);
圖2圖示了汽車,該汽車具有連接到揚(yáng)聲器的音頻音響系統(tǒng);
圖3圖示了汽車音響系統(tǒng)的進(jìn)一步細(xì)節(jié),該系統(tǒng)具有連接到揚(yáng)聲器的音頻放大器;
圖4a_4b圖示了連接到記錄設(shè)備的樂(lè)器和聲樂(lè)(vocal);
圖5a_5b圖不了音頻信號(hào)的波形繪 圖6圖示了具有自適應(yīng)智能控制的音頻放大器的框 圖7圖示了頻域和時(shí)域分析塊的框 圖8a-8b圖示了經(jīng)采樣的音頻信號(hào)的時(shí)序幀;
圖9圖不了音頻信號(hào)的分離時(shí)序子巾貞;
圖10圖示了時(shí)域分析塊的框 圖11圖示了頻帶中的時(shí)域能級(jí)隔離塊的框圖;圖12圖示了時(shí)域音符(note)檢測(cè)器塊的框 圖13圖示了時(shí)域起奏(attack)檢測(cè)器的框 圖14圖示了時(shí)域起奏檢測(cè)器的另一實(shí)施例;
圖15圖示了頻域分析塊的框 圖16圖示了頻域音符檢測(cè)器塊的框 圖17圖示了頻率倉(cāng)中的能級(jí)隔離的框 圖18圖示了頻域起奏檢測(cè)器的框 圖19圖示了頻域起奏檢測(cè)器的另一實(shí)施例; 圖20圖示了具有參數(shù)值、加權(quán)值和控制參數(shù)的幀簽名數(shù)據(jù)庫(kù);
圖21圖示了與幀簽名數(shù)據(jù)庫(kù)的計(jì)算機(jī)接口 ;
圖22圖示了用于運(yùn)行時(shí)矩陣和幀簽名數(shù)據(jù)庫(kù)的識(shí)別檢測(cè)器;
圖23圖示了具有音頻放大器的蜂窩電話,該音頻放大器具有自適應(yīng)智能控制;
圖24圖示了具有音頻放大器的家庭娛樂(lè)系統(tǒng),該音頻放大器具有自適應(yīng)智能控制;并
且
圖25圖示了具有音頻放大器的計(jì)算機(jī),該音頻放大器具有自適應(yīng)智能控制。
具體實(shí)施例方式參照附圖在下文描述中在一個(gè)或者多個(gè)實(shí)施例中描述本發(fā)明,在這些附圖中,同樣標(biāo)號(hào)代表相同或者相似兀素。盡管在用于實(shí)現(xiàn)本發(fā)明的目的的最佳模式方面描述本發(fā)明,但是本領(lǐng)域技術(shù)人員將理解它旨在于覆蓋如可以在如所附權(quán)利要求書(shū)限定的本發(fā)明的精神和范圍內(nèi)包括的替代、修改和等同物及其由下文公開(kāi)和附圖支持的它們的等同物。參照?qǐng)D1,音頻音響系統(tǒng)10包括音頻聲源12,該音頻聲源12提供代表聲音內(nèi)容的電信號(hào)。音頻聲源12可以是從發(fā)射器或者衛(wèi)星接收音頻信號(hào)的天線。替代地,音頻聲源12可以是光盤(CD)、存儲(chǔ)器驅(qū)動(dòng)器、音頻帶或者蜂窩電話、移動(dòng)音響系統(tǒng)、多媒體播放器、家庭娛樂(lè)系統(tǒng)、計(jì)算機(jī)、筆記本計(jì)算機(jī)、因特網(wǎng)流發(fā)送、視頻游戲或者能夠回放聲音內(nèi)容的其他消費(fèi)者電子設(shè)備的內(nèi)部存儲(chǔ)器。通過(guò)音頻線纜14向信號(hào)處理設(shè)備16路由來(lái)自音頻聲源12的電信號(hào)用于信號(hào)調(diào)節(jié)和功率放大。信號(hào)處理設(shè)備16可以是音頻放大器、蜂窩電話、家庭影院系統(tǒng)、計(jì)算機(jī)、音頻架(audio rack)或者能夠?qū)σ纛l信號(hào)執(zhí)行信號(hào)處理功能的其他消費(fèi)者設(shè)備。信號(hào)處理功能可以包括放大、濾波、均衡、聲音效果和用戶限定的模塊,這些模塊調(diào)整功率電平并且增強(qiáng)音頻信號(hào)的信號(hào)性質(zhì)。通過(guò)音頻線纜17向揚(yáng)聲器18路由信號(hào)調(diào)節(jié)的音頻信號(hào)以用信號(hào)處理設(shè)備16向音頻信號(hào)中引入的增強(qiáng)來(lái)再現(xiàn)音頻聲源12的聲音內(nèi)容。圖2示出了作為音頻聲源12的移動(dòng)音響系統(tǒng)(在這一情況下為安裝于汽車24的儀表板22內(nèi)的汽車音響系統(tǒng)20)。移動(dòng)音響系統(tǒng)可以安裝于任何基于陸地的車輛、船舶或者航空器。移動(dòng)音響系統(tǒng)也可以是手持單元(例如MP3播放器、蜂窩電話或者其他便攜音頻播放器)。用戶可以如圖3中所示經(jīng)由可視顯示器26以及位于前控制面板30上的控制旋鈕、開(kāi)關(guān)和旋轉(zhuǎn)轉(zhuǎn)盤28手動(dòng)操作汽車音響系統(tǒng)20以在音頻信號(hào)的不同源之間選擇。例如汽車音響系統(tǒng)20通過(guò)天線32從發(fā)射器或者衛(wèi)星接收無(wú)線音頻信號(hào)。替代地,數(shù)字記錄的音頻信號(hào)可以存儲(chǔ)于CD 34、存儲(chǔ)器驅(qū)動(dòng)器36或者音頻帶38上并且向汽車音響系統(tǒng)20的槽40、42和44中插入用于回放。數(shù)字記錄的音頻信號(hào)可以存儲(chǔ)于汽車音響系統(tǒng)20的內(nèi)部存儲(chǔ)器中用于回放。對(duì)于給定聲源,用戶可以使用前控制面板30在多種信號(hào)處理功能(諸如放大、濾波、均衡、聲音效果和用戶限定的模塊,這些模塊增強(qiáng)音頻信號(hào)的信號(hào)性質(zhì))之間手動(dòng)選擇。前控制面板30可以完全可編程、菜單驅(qū)動(dòng)并且使用軟件以用可視顯示器26以及控制旋鈕、開(kāi)關(guān)和旋轉(zhuǎn)轉(zhuǎn)盤28配置和控制聲音再現(xiàn)特征。可視顯示器26與位于前控制面板30上的控制旋鈕、開(kāi)關(guān)和轉(zhuǎn)盤28的組合提供用于用戶接口的對(duì)不同操作模式的控制、對(duì)用于選擇和編輯功能的菜單的訪問(wèn)以及汽車音響系 統(tǒng)20的配置。向汽車音響系統(tǒng)20內(nèi)的音頻放大器路由音頻信號(hào)。向安裝于汽車24內(nèi)的一個(gè)或者多個(gè)揚(yáng)聲器46路由信號(hào)調(diào)節(jié)的音頻信號(hào)。功率放大增加或者減少音頻信號(hào)的功率電平和信號(hào)強(qiáng)度以驅(qū)動(dòng)揚(yáng)聲器并且用音頻放大器向音頻信號(hào)中引入的增強(qiáng)來(lái)再現(xiàn)聲音內(nèi)容。在音頻再現(xiàn)中,普遍根據(jù)音頻源的內(nèi)容(例如演奏或者彈奏風(fēng)格)來(lái)使用多種信號(hào)處理技術(shù)以實(shí)現(xiàn)更佳聲音質(zhì)量并且否則增強(qiáng)收聽(tīng)者對(duì)音頻內(nèi)容的享受和欣賞。例如音頻放大器可以使用不同壓縮器和均衡設(shè)置以增強(qiáng)聲音質(zhì)量(例如優(yōu)化古典或者搖滾音樂(lè)的再現(xiàn))。汽車音響系統(tǒng)20從音頻聲源12 (例如天線32、⑶34、存儲(chǔ)器驅(qū)動(dòng)器36、音頻帶38或者內(nèi)部存儲(chǔ)器)接收音頻信號(hào)。音頻信號(hào)可以源于多種音頻源(諸如樂(lè)器或者記錄的并且向汽車音響系統(tǒng)20傳輸?shù)幕蛘邤?shù)字記錄于CD 34、存儲(chǔ)器驅(qū)動(dòng)器36或者音頻帶38上并且向汽車音響系統(tǒng)20的槽40、42和44中插入用于回放的聲樂(lè))。數(shù)字記錄的音頻信號(hào)可以存儲(chǔ)于汽車音響系統(tǒng)20的內(nèi)部存儲(chǔ)器中。樂(lè)器可以是電子吉他、低音吉他、小提琴、號(hào)(horn)、銅管、鼓、管樂(lè)器、鋼琴、電子鍵盤或者打擊樂(lè)器。音頻信號(hào)可以源于男性或者女性操縱的音頻麥克風(fēng),該男性或者女性具有包括女高音、女中高音、女低音、男高音、男中音和男低音的音域。在諸多情況下,音頻聲音信號(hào)包含根據(jù)作品的旋律和歌詞而混合在一起的與樂(lè)器(例如吉他、鼓、鋼琴和嗓音)的組合關(guān)聯(lián)的聲音內(nèi)容。很多作品包含多個(gè)樂(lè)器和多個(gè)聲樂(lè)分部。在一個(gè)示例中,音頻信號(hào)部分地包含如圖4a中所示電子低音吉他50原創(chuàng)的聲音。當(dāng)用音樂(lè)家的手指或者吉他撥子來(lái)激發(fā)低音吉他50的琴弦52時(shí),琴弦開(kāi)始由拾取器54檢測(cè)的強(qiáng)振動(dòng)或者振蕩。琴弦振動(dòng)隨時(shí)間衰減并且返回到靜止?fàn)顟B(tài),這假設(shè)在振動(dòng)終止之前未再次激發(fā)琴弦。琴弦52的初始激發(fā)稱為起奏階段。起奏階段跟隨有維系階段(sustainphase),在該維系階段期間琴弦振動(dòng)保持相對(duì)強(qiáng)。衰退階段在琴弦振動(dòng)衰減時(shí)跟隨維系階段并且在琴弦返回到靜止?fàn)顟B(tài)時(shí)最終跟隨釋放階段。拾取器54將在起奏階段、維系階段、衰退階段和釋放階段期間的琴弦振蕩轉(zhuǎn)換成電信號(hào)(即模擬音頻信號(hào)),該信號(hào)在基頻和基頻的諧波具有初始并且然后衰退的幅度。圖5a-5b圖示了音頻信號(hào)在時(shí)域中與琴弦在各種彈奏模式中的起奏階段和維系階段并且根據(jù)該圖而與衰退階段和釋放階段對(duì)應(yīng)的幅度響應(yīng)。在圖5b中,下一起奏階段在完成先前衰退階段或者甚至開(kāi)始釋放階段之前開(kāi)始。藝術(shù)家可以在彈奏低音吉他50時(shí)使用多種彈奏風(fēng)格。例如藝術(shù)家可以將他的或者她的手放置于琴頸拾取器(neck pickup)或者琴橋拾取器(bridge pickup)附近并且用手指撥弄激發(fā)琴弦52 (稱為“指彈奏(fingering)風(fēng)格”(用于現(xiàn)代流行、節(jié)奏和藍(lán)調(diào)以及前衛(wèi)風(fēng)格))。藝術(shù)家可以用手指或者手掌拍擊琴弦52 (稱為“拍擊風(fēng)格”(用于現(xiàn)代爵士、鄉(xiāng)土爵士、節(jié)奏和藍(lán)調(diào)以及搖滾風(fēng)格))。藝術(shù)家可以用拇指激發(fā)琴弦52 (稱為“拇指風(fēng)格”(用于摩城節(jié)奏和藍(lán)調(diào)))。藝術(shù)家可以用雙手(每只手撥動(dòng)(fret)音符)輕拍琴弦52 (稱為“輕拍風(fēng)格”(用于前衛(wèi)和現(xiàn)代爵士風(fēng)格))。在其他彈奏風(fēng)格中,已知藝術(shù)家使用指彈奏附件(諸如撥子或者簽子)。在每種情況下,琴弦52以特定幅度和頻率振動(dòng)并且根據(jù)諸如圖5a和5b中所示琴弦振動(dòng)階段生成唯一音頻信號(hào)。通過(guò)音頻線纜56向記錄設(shè)備58路由來(lái)自低音吉他50的音頻信號(hào)。記錄設(shè)備58在CD 34、存儲(chǔ)器驅(qū)動(dòng)器36或者音頻帶38上以數(shù)字或者模擬格式存儲(chǔ)音頻信號(hào)用于在汽車音響系統(tǒng)20上回放。替代地,音頻信號(hào)存儲(chǔ)于記錄設(shè)備58上用于經(jīng)由天線32向汽車音響系統(tǒng)20傳輸。通過(guò)示例方式示出了吉他50生成的并且存儲(chǔ)于記錄設(shè)備58中的音頻信號(hào)。在許多情況下,音頻信號(hào)包含如圖4b中所示例如由樂(lè)隊(duì)或者樂(lè)團(tuán)根據(jù) 作品的旋律和歌詞來(lái)混合在一起的與樂(lè)器(例如吉他60、鼓62、鋼琴64和嗓音66)的組合關(guān)聯(lián)的聲音內(nèi)容。僅舉數(shù)例,作品可以是古典、鄉(xiāng)村、前衛(wèi)、流行、爵士、搖滾、節(jié)奏和藍(lán)調(diào)、說(shuō)唱或者輕音樂(lè)(easy listening)。通過(guò)音頻線纜67路由并且在記錄設(shè)備68上記錄復(fù)合音頻信號(hào)。記錄設(shè)備68以數(shù)字或者模擬格式存儲(chǔ)復(fù)合音頻信號(hào)。向CD 34、存儲(chǔ)器驅(qū)動(dòng)器36、音頻帶38或者內(nèi)部存儲(chǔ)器傳送記錄的復(fù)合音頻信號(hào)用于在汽車音響系統(tǒng)20上回放。替代地,復(fù)合音頻信號(hào)存儲(chǔ)于記錄設(shè)備68上用于經(jīng)由天線32向汽車音響系統(tǒng)20傳輸。回顧圖3,通過(guò)汽車音響系統(tǒng)20中的音頻放大器處理從⑶34、存儲(chǔ)器驅(qū)動(dòng)器36、音頻帶38、天線32或者內(nèi)部存儲(chǔ)器接收的音頻信號(hào)用于多種信號(hào)處理功能。向安裝于汽車24內(nèi)的一個(gè)或者多個(gè)揚(yáng)聲器46路由信號(hào)調(diào)節(jié)的音頻信號(hào)。圖6是包含于汽車音響系統(tǒng)20內(nèi)的音頻放大器70的框圖。音頻放大器70對(duì)音頻信號(hào)執(zhí)行放大和其他信號(hào)處理功能(諸如均衡、濾波、聲音效果和用戶限定的模塊)以調(diào)整功率電平并且否則增強(qiáng)信號(hào)性質(zhì)用于收聽(tīng)體驗(yàn)。音頻源塊71代表天線32、CD 34、存儲(chǔ)器驅(qū)動(dòng)器36、音頻帶38或者汽車音響系統(tǒng)20的內(nèi)部存儲(chǔ)器并且提供音頻信號(hào)。音頻放大器70具有用于音頻信號(hào)的信號(hào)處理路徑,該路徑包括前濾波器塊72、前效果塊74、非線性效果塊76、用戶限定的模塊78、后效果塊80、后濾波器塊82和功率放大塊84。前濾波塊72和后濾波塊82提供各種濾波功能(諸如音頻信號(hào)的低通濾波和帶通濾波)。前濾波和后濾波可以包括在各種頻率范圍上的音調(diào)均衡功能,這些功能用于提升或者衰減具體頻率的電平而不影響鄰近頻率(諸如低音頻率調(diào)整和高音(treble)頻率調(diào)整)。例如音調(diào)均衡可以運(yùn)用傾斜均衡(shelving equalization)用于提升或者衰減在目標(biāo)頻率或者基頻以上或者以下的所有頻率、鈴形均衡用于提升或者衰減在目標(biāo)頻率或者基頻周圍的窄范圍頻率、圖形均衡或者參數(shù)均衡。前效果塊74和后效果塊80向音頻信號(hào)中引入聲音效果(諸如回響、延遲、合唱、哇(wah)、自動(dòng)音量、移相器、哼聲取消器、噪聲門、顫音、音高移位、顫聲和動(dòng)態(tài)壓縮)。非線性效果塊76向音頻信號(hào)中引入非線性效果(諸如m建模、失真、過(guò)載(overdrive)、模糊和調(diào)制)。用戶限定的模塊塊78允許用戶限定定制的信號(hào)處理功能(諸如添加伴奏樂(lè)器、聲樂(lè)和合成器選項(xiàng))。功率放大塊84提供音頻信號(hào)的功率放大或者衰減。向汽車24中的揚(yáng)聲器46路由后信號(hào)處理音頻信號(hào)。對(duì)于圖3中的前控制面板30,音頻放大器70內(nèi)的前濾波器塊72、前效果塊74、非線性效果塊76、用戶限定的模塊78、后效果塊80、后濾波器塊82和功率放大塊84可選擇并且可控制。通過(guò)查看顯示器26并且轉(zhuǎn)動(dòng)控制旋鈕、開(kāi)關(guān)和轉(zhuǎn)盤28,用戶可以手動(dòng)控制音頻放大器70內(nèi)的信號(hào)處理功能的操作。音頻放大器70的特征是有能力根據(jù)音頻信號(hào)的動(dòng)態(tài)內(nèi)容控制信號(hào)處理功能。音頻放大器70運(yùn)用動(dòng)態(tài)自適應(yīng)智能特征,該特征涉及在逐幀基礎(chǔ)上對(duì)音頻信號(hào)的頻域分析和時(shí)域分析以自動(dòng)并且自適應(yīng)地控制音頻放大器內(nèi)的信號(hào)處理功能的操作和設(shè)置以實(shí)現(xiàn)最優(yōu)聲音再現(xiàn)。音頻放大器70的動(dòng)態(tài)自適應(yīng)智能特征在逐幀基礎(chǔ)上檢測(cè)和隔離音頻信號(hào)的頻域特性和時(shí)域特性并且使用該信息控制放大器的信號(hào)處理功能的操作。圖6進(jìn)一步圖示了音頻放大器70的由頻域和時(shí)域分析塊90、幀簽名塊92以及自適應(yīng)智能控制塊94提供的動(dòng)態(tài)自適應(yīng)智能控制特征。向頻域和時(shí)域分析塊90路由音頻信號(hào),在分析塊90中用模數(shù)(A/D)轉(zhuǎn)換器對(duì)音頻信號(hào)采樣并且將音頻信號(hào)布置成多個(gè)時(shí)間漸進(jìn)幀1、2、3、…n,每個(gè)幀包含預(yù)定數(shù)量的采樣。根據(jù)音頻源的音頻源類型或者頻率內(nèi)容將每個(gè)采樣的音頻幀分成子幀。在逐幀基礎(chǔ)上分析音頻信號(hào)的每個(gè)分離子幀以確定它的時(shí)域和頻域內(nèi)容和特性。向幀簽名塊92路由塊90的輸出,其中比較音頻信號(hào)的傳入子幀與建立或者學(xué)習(xí) 的幀簽名的數(shù)據(jù)庫(kù)以確定傳入子幀與幀簽名的數(shù)據(jù)庫(kù)的最佳匹配或者最接近相關(guān)。來(lái)自數(shù)據(jù)庫(kù)的幀簽名包含用于配置音頻放大器70的信號(hào)處理部件的控制參數(shù)。向自適應(yīng)智能控制塊94路由塊92的輸出,其中最佳匹配幀簽名實(shí)時(shí)控制音頻放大器70以對(duì)信號(hào)處理功能連續(xù)并且自動(dòng)進(jìn)行調(diào)整以求最優(yōu)聲音再現(xiàn)。例如基于幀簽名,可以針對(duì)音頻信號(hào)的該特定子幀自動(dòng)增加或者減少音頻信號(hào)的放大??梢葬槍?duì)彈奏的音符自動(dòng)加入或者去除預(yù)設(shè)和聲音效果。依次的下一子幀可以與相同音符關(guān)聯(lián)并且與數(shù)據(jù)庫(kù)中的相同幀簽名匹配,或者依次的下一子幀可以與不同音符關(guān)聯(lián)并且與數(shù)據(jù)庫(kù)中的不同對(duì)應(yīng)幀簽名匹配。音頻信號(hào)的每個(gè)子幀被識(shí)別并且與幀簽名匹配,該幀簽名又控制音頻放大器70內(nèi)的信號(hào)處理功能的操作用于最優(yōu)聲音再現(xiàn)。根據(jù)與音頻信號(hào)的每個(gè)個(gè)別傳入子幀對(duì)應(yīng)的最佳匹配幀簽名調(diào)整音頻放大器70的信號(hào)處理功能以增強(qiáng)它的再現(xiàn)。音頻放大器70的自適應(yīng)智能特征可以學(xué)習(xí)音頻信號(hào)的每個(gè)音符的屬性并且基于用戶反饋進(jìn)行調(diào)整。例如,如果用戶需要更多或者更少放大或者均衡或者插入用于給定音符的特定聲音效果,則音頻放大器向信號(hào)處理功能的控制參數(shù)中構(gòu)建那些用戶偏好以實(shí)現(xiàn)最優(yōu)聲音再現(xiàn)。具有相關(guān)控制參數(shù)的幀簽名數(shù)據(jù)庫(kù)對(duì)信號(hào)處理功能進(jìn)行實(shí)時(shí)調(diào)整。用戶可以限定向音頻放大器70的數(shù)據(jù)庫(kù)中集成的音頻模塊、效果和設(shè)置。利用自適應(yīng)智能,音頻放大器70可以基于當(dāng)前幀簽名來(lái)檢測(cè)并且向音頻信號(hào)自動(dòng)應(yīng)用音調(diào)模塊和設(shè)置。音頻放大器70可以按照需要在相似匹配幀簽名之間插值以選擇用于即時(shí)信號(hào)處理功能的最佳選擇。圖7圖示了頻域和時(shí)域分析塊90的進(jìn)一步細(xì)節(jié),該塊包括采樣音頻塊96、源分離塊98-104、頻域分析塊106和時(shí)域分析塊108。向采樣音頻塊98呈現(xiàn)模擬音頻信號(hào)。采樣音頻塊96使用A/D轉(zhuǎn)換器對(duì)模擬音頻信號(hào)采樣(例如每秒32至1024個(gè)采樣)。將采樣的音頻信號(hào)112組織成一系列時(shí)間漸進(jìn)幀(幀I至幀n),每個(gè)幀包含音頻信號(hào)的預(yù)定數(shù)量的采樣。圖8a不出了巾貞I (該巾貞包含音頻信號(hào)112在時(shí)間序列中的1024個(gè)米樣)、巾貞2 (該巾貞包含音頻信號(hào)112在時(shí)間序列中的接下來(lái)1024個(gè)米樣)、巾貞3 (該巾貞包含音頻信號(hào)112在時(shí)間序列中的接下來(lái)1024個(gè)采樣)并且以此類推至幀η (該幀包含音頻信號(hào)112在時(shí)間序列中的1024個(gè)采樣)。圖8b示出了在如圖15中所描述的時(shí)域到頻域轉(zhuǎn)換中使用的幀I-η的重疊窗114。向源分離塊98-104路由采樣的音頻信號(hào)112以隔離與具體類型的聲源關(guān)聯(lián)的聲音分量。源分離塊98-104將采樣的音頻信號(hào)112分成子幀n、s,其中η為幀號(hào)并且s為分離子幀號(hào)。假設(shè)采樣的音頻信號(hào)包括與多種樂(lè)器和聲樂(lè)關(guān)聯(lián)的聲音分量。例如音頻聲音塊71提供包含聲音分量的音頻信號(hào),該聲音分量來(lái)自吉他60、鼓62、鋼琴64和聲樂(lè)66 (見(jiàn)圖4b)。源分離塊98被配置成標(biāo)識(shí)和隔離與吉他60關(guān)聯(lián)的聲音分量。源分離98標(biāo)識(shí)與吉他60關(guān)聯(lián)的頻率特性并且分離具有采樣的音頻信號(hào)112的那些聲音分量。可以通過(guò)例如用帶通濾波器分析吉他60的頻率特性的幅度和頻率內(nèi)容來(lái)隔離并且標(biāo)識(shí)吉他60的頻率特性。源分離塊98的輸出是包含與吉他60關(guān)聯(lián)的隔離聲音內(nèi)容的分離子幀n,I。以相似方式,源分離塊100被配置成標(biāo)識(shí)并且隔離與鼓62關(guān)聯(lián)的聲音分量。源分離塊100的輸出是包含與鼓62關(guān)聯(lián)的隔離聲音內(nèi)容的分離子幀n,2。源分離塊102被配置成標(biāo)識(shí)并且隔離與鋼琴64關(guān)聯(lián)的聲音分量。源分離塊102的輸出是包含與鋼琴64關(guān)聯(lián)的隔離聲音內(nèi)容的分離子幀n,3。源分離塊104被配置成標(biāo)識(shí)并且隔離與聲樂(lè)66關(guān)聯(lián)的聲音分量。源分離塊104的輸出是包含與聲樂(lè)66關(guān)聯(lián)的隔離聲音內(nèi)容的分離子幀n,S。 在另一實(shí)施例中,源分離塊98標(biāo)識(shí)特定頻帶I (例如100-500HZ)內(nèi)的聲音內(nèi)容并且根據(jù)頻帶I內(nèi)的頻率內(nèi)容分離采樣的音頻信號(hào)112??梢酝ㄟ^(guò)例如用帶通濾波器分析采樣的音頻信號(hào)112的聲音內(nèi)容的幅度和頻率內(nèi)容來(lái)隔離并且標(biāo)識(shí)該聲音內(nèi)容。源分離塊98的輸出是包含頻帶I內(nèi)的隔尚頻率內(nèi)容的分尚子巾貞η, I。以相似方式,源分尚塊100標(biāo)識(shí)與頻帶2 (例如500-1000ΗΖ)關(guān)聯(lián)的頻率特性并且根據(jù)頻帶2內(nèi)的頻率內(nèi)容分離采樣的音頻信號(hào)112。源分離塊100的輸出是包含頻帶2內(nèi)的隔離頻率內(nèi)容的分離子幀η,2。源分離塊102標(biāo)識(shí)與頻帶3 (例如1000-1500ΗΖ)關(guān)聯(lián)的頻率特性并且根據(jù)頻帶3內(nèi)的頻率內(nèi)容分離采樣的音頻信號(hào)112。源分離塊102的輸出是包含頻帶3內(nèi)的隔離頻率內(nèi)容的分離子幀η, 3。源分離塊104標(biāo)識(shí)與頻帶4 (例如1500-2000ΗΖ)關(guān)聯(lián)的頻率特性并且根據(jù)頻帶4內(nèi)的頻率內(nèi)容分離采樣的音頻信號(hào)112。源分離塊104的輸出是包含頻帶4內(nèi)的隔離頻率內(nèi)容的分離子幀η,4。圖9圖示了源分離塊98-104的作為源分離子幀116的輸出。源分離子幀116由分離子幀n,s指明,其中η為幀號(hào)并且s為分離子幀號(hào)。分離子幀1,I是吉他60的聲音內(nèi)容或者圖8a的幀I中的頻帶I的頻率內(nèi)容;分離子幀2,I是吉他60的聲音內(nèi)容或者幀2中的頻帶I的頻率內(nèi)容;分離子幀3,I是吉他60的聲音內(nèi)容或者幀3中的頻帶I的頻率內(nèi)容;分離子幀n,I是吉他60的聲音內(nèi)容或者幀η中的頻帶I的頻率內(nèi)容。分離子幀1,2是鼓62的聲音內(nèi)容或者圖8a的幀I中的頻帶2的頻率內(nèi)容;分離子幀2,2是鼓62的聲音內(nèi)容或者幀2中的頻帶2的頻率內(nèi)容;分離子幀3,2是鼓62的聲音內(nèi)容或者幀3中的頻帶2的頻率內(nèi)容;分離子幀n,2是鼓62的聲音內(nèi)容或者幀η中的頻帶2的頻率內(nèi)容。分離子幀I, 3是鋼琴64的聲音內(nèi)容或者圖8a的幀I中的頻帶3的頻率內(nèi)容;分離子幀2,3是鋼琴64的聲音內(nèi)容或者幀2中的頻帶3的頻率內(nèi)容;分離子幀3,3是鋼琴64的聲音內(nèi)容或者幀3中的頻帶3的頻率內(nèi)容;分離子幀n,3是鋼琴64的聲音內(nèi)容或者幀η中的頻帶3的頻率內(nèi)容。分離子幀1,s是聲樂(lè)66的聲音內(nèi)容或者圖8a的幀I中的頻帶4的頻率內(nèi)容;分離子中貞2, s是聲樂(lè)66的聲首內(nèi)容或者巾貞2中的頻帶4的頻率內(nèi)容;分尚子巾貞3, s是聲樂(lè)66的聲音內(nèi)容或者幀3中的頻帶4的頻率內(nèi)容;分離子幀n,s是聲樂(lè)66的聲音內(nèi)容或者幀η中的頻帶4的頻率內(nèi)容。向頻域分析塊106和時(shí)域分析塊108路由分離子幀n,S。圖10圖示了時(shí)域分 析塊108的進(jìn)一步細(xì)節(jié),該時(shí)域分析塊108包括能級(jí)隔離塊120,該能級(jí)隔離塊120在多個(gè)頻帶中隔離采樣的音頻信號(hào)112的每個(gè)分離子幀n,s的能級(jí)。在圖11中,能級(jí)隔離塊120處理濾波器頻帶122a-122c內(nèi)的在時(shí)間序列中的每個(gè)分離子幀n,s以分離并且隔離音頻信號(hào)的具體頻率。濾波器頻帶122a-122c可以隔離音頻范圍ΙΟΟ-ΙΟΟΟΗζ中的具體頻帶。在一個(gè)實(shí)施例中,濾波器頻帶122a是具有以IOOHz為中心的通帶的帶通濾波器,濾波器頻帶122b是具有以500Hz為中心的通帶的帶通濾波器,并且濾波器頻帶122c是具有以1000Hz為中心的通帶的帶通濾波器。濾波器頻帶122a的輸出包含以IOOHz為中心的分離子幀n,s的能級(jí)。濾波器頻帶122b的輸出包含以500Hz為中心的分離子幀n,s的能級(jí)。濾波器頻帶122c的輸出包含以1000Hz為中心的分離子幀n,s的能級(jí)。其他濾波器頻帶的輸出中的每個(gè)包含用于給定具體頻帶的分離子幀n,s的能級(jí)。峰檢測(cè)器124a監(jiān)視并且存儲(chǔ)以IOOHz為中心的分離子幀n,s的峰能級(jí)。峰檢測(cè)器124b監(jiān)視并且存儲(chǔ)以500Hz為中心的分離子幀n,s的峰能級(jí)。峰檢測(cè)器124c監(jiān)視并且存儲(chǔ)以1000Hz為中心的分離子幀n,s的峰能級(jí)。平滑濾波器126a去除寄生分量并且否則穩(wěn)定以IOOHz為中心的分離子幀n,s的峰能級(jí)。平滑濾波器126b去除寄生分量并且否則穩(wěn)定以500Hz為中心的分離子幀n,s的峰能級(jí)。平滑濾波器126c去除峰能級(jí)的寄生分量并且否則穩(wěn)定以1000Hz為中心的分離子幀n,S。平滑濾波器126a-126c的輸出是在每個(gè)頻帶l_m中的用于每個(gè)分離子巾貞n, s的能級(jí)函數(shù)E (m, η)。圖7的時(shí)域分析塊108如圖10中所示也包括音符檢測(cè)器塊130。塊130檢測(cè)每個(gè)音符的開(kāi)始。音符檢測(cè)器塊130關(guān)聯(lián)琴弦52的起奏階段為音符的開(kāi)始。也就是說(shuō),吉他50或者60上的振動(dòng)琴弦52的起奏階段與具體音符的檢測(cè)重合。對(duì)于其他樂(lè)器,音符檢測(cè)與藝術(shù)家的不同身體動(dòng)作(例如按壓鋼琴或者電子鍵盤的鍵、激發(fā)豎琴的琴弦、在按壓號(hào)上的一個(gè)或者多個(gè)鍵之時(shí)向號(hào)中吐入空氣或者用鼓槌打擊鼓面)關(guān)聯(lián)。在每種情況下,音符檢測(cè)器塊130監(jiān)視分離子幀n,s的時(shí)域動(dòng)態(tài)內(nèi)容并且標(biāo)識(shí)音符的開(kāi)始。圖12示出了包括起奏檢測(cè)器132的音符檢測(cè)器塊130的進(jìn)一步細(xì)節(jié)。一旦為分離子巾貞n, s的每個(gè)頻帶Ι-m確定能級(jí)函數(shù)E(m, η), —個(gè)分離子巾貞n_l, s的能級(jí)l_m如圖13中所示存儲(chǔ)于起奏檢測(cè)器132的塊134中。如濾波器頻帶122a-122c、峰檢測(cè)器124a_124c和平滑濾波器126a-126c確定的用于下一分離子幀n,s的頻帶l_m的能級(jí)存儲(chǔ)于起奏檢測(cè)器132的塊136中。差值塊138確定當(dāng)前分離子幀n,s和先前分離子幀n_l,s的對(duì)應(yīng)頻帶的能級(jí)之間的差。例如從用于分離子幀n,s的頻帶I的能級(jí)減去用于分離子幀n-1,s的頻帶I的能級(jí)。從用于分離子巾貞n, s的頻帶2的能級(jí)減去用于分離子巾貞n-1, s的頻帶2的能級(jí)。從用于分離子巾貞n, s的頻帶m的能級(jí)減去用于分離子巾貞n-1, s的頻帶m的能級(jí)。用于分離子巾貞n-1, s和分離子巾貞n, s的每個(gè)頻帶Ι-m的能級(jí)之差在求和器140中求和。求和器140累積分離子巾貞n-1, s和分離子巾貞n, s的每個(gè)頻帶l_m的能級(jí)E (m, η)之差。音符的開(kāi)始將出現(xiàn)于用于分離子幀n,s的跨全部受監(jiān)視頻帶Ι-m的能級(jí)E(m,n)之差的合計(jì)超過(guò)預(yù)定閾值時(shí)。比較器142比較求和器140的輸出與閾值144。如果求和器140的輸出大于閾值144,則用于分離子幀n,s的在整個(gè)頻率頻譜上的能極E (m,η)之差的累積超過(guò)閾值144并且在即時(shí)分離子幀n,s中檢測(cè)到音符的開(kāi)始。如果求和器140的輸出小于閾值144,則未檢測(cè)到音符的開(kāi)始。
在每個(gè)分離子幀n,s結(jié)束時(shí),起奏檢測(cè)器132將標(biāo)識(shí)即時(shí)分離子幀是否包含音符的開(kāi)始或者即時(shí)分離子幀是否不含音符的開(kāi)始。例如基于分離子幀n,s在頻帶Ι-m的整個(gè)頻譜上的能級(jí)E(m,n)之差的和超過(guò)閾值144,起奏檢測(cè)器132可以將圖9的分離子幀1,s標(biāo)識(shí)為包含音符的開(kāi)始,而圖9的分離子幀2,s和分離子幀3,s沒(méi)有音符的開(kāi)始。圖5a圖示了音符在分離子幀1,s中的點(diǎn)150的開(kāi)始(基于采樣的音頻信號(hào)在頻帶Ι-m內(nèi)的能級(jí)E(m, η))并且音符在分離子幀2,s或者分離子幀3,s中未開(kāi)始。圖5a具有音符在點(diǎn)152的另一次開(kāi)始檢測(cè)。圖5b示出了音符在點(diǎn)154、156和158的開(kāi)始檢測(cè)。圖14圖示了起奏檢測(cè)器132在直接用求和器160對(duì)能級(jí)E (m,η)求和時(shí)的另一實(shí)施例。求和器160累積分離子巾貞n, s在每個(gè)頻帶Ι-m中的能級(jí)E (m, η)。音符的開(kāi)始將出現(xiàn)在用于分離子巾貞n, s的跨全部受監(jiān)視頻帶Ι-m的能級(jí)E(m, η)的合計(jì)超過(guò)預(yù)定閾值時(shí)。比較器162比較求和器160的輸出與閾值164。如果求和器160的輸出大于閾值164,則用于分離子幀n,s的在整個(gè)頻率頻譜上的能級(jí)E(m,η)的累積超過(guò)閾值164并且在即時(shí)分離子幀n,s中檢測(cè)到音符的開(kāi)始。如果求和器160的輸出小于閾值164,則未檢測(cè)到音符的開(kāi) 始。 在每個(gè)幀結(jié)束時(shí),起奏檢測(cè)器132將標(biāo)識(shí)即時(shí)分離子幀是否包含音符的開(kāi)始或者即時(shí)分離子巾貞是否不含音符的開(kāi)始。例如基于分離子巾貞n, s在頻帶Ι-m內(nèi)的能級(jí)E(m,n)的和超過(guò)閾值164,起奏檢測(cè)器132可以將圖9的分離子幀1,s標(biāo)識(shí)為包含音符的開(kāi)始,而圖9的分離子幀2,s和分離子幀3,s無(wú)音符的開(kāi)始。等式(I)提供音符的開(kāi)始檢測(cè)的另一示例。
g E ia n ) = :na X f O, [E Ii; / E I η-1 ] - 11; I :丨其中g(shù)(m,n)是在m個(gè)頻帶的η個(gè)分離子巾貞上的能級(jí)的最大值函數(shù) E (m, η)是頻帶m的分離子巾貞n, s的能級(jí)
E(m, n-1)是頻帶m的分離子巾貞n-1, s的能級(jí)。函數(shù)g(m,n)具有用于每個(gè)頻帶l_m和每個(gè)分離子巾貞n, s的值。如果比值E(m, η)/E(m, n-1)(即在分離子巾貞n, s中的頻帶m的能級(jí)與在分離子巾貞n-1, s中的頻帶m的能級(jí)之比)小于一,則[E(m, n)/E(m, n-l)]-l為負(fù)。在分離子巾貞n, s中的頻帶m的能級(jí)不大于在分離子巾貞n-1, s中的頻帶m的能級(jí)。函數(shù)g(m,n)為零,其指示未發(fā)起起奏階段并且因此未檢測(cè)到音符的開(kāi)始。如果比值E (m, n)/E (m, n-Ι)(即在分離子巾貞n, s中的頻帶m的能級(jí)與在分離子巾貞n-1, s中的頻帶m的能級(jí)之比)大于一(假如值二),則[E(m, n)/E(m, n-l)]-l為正(即值一)。在分離子巾貞n, s中的頻帶m的能級(jí)大于在分離子巾貞n-1, s中的頻帶m的能級(jí)。函數(shù)g(m,n)為[E(m,n)/E(m,n-1)]-I的正值,其指示發(fā)起起奏階段并且因此可能檢測(cè)到音符的開(kāi)始。回顧圖12,起奏檢測(cè)器132向靜默門166、重復(fù)門168和噪聲門170路由音符的開(kāi)始檢測(cè)。并非音符的每個(gè)開(kāi)始檢測(cè)都是真實(shí)的。靜默門166監(jiān)視分離子幀n,s在音符的開(kāi)始檢測(cè)之后的能級(jí)E (m, η)。如果分離子幀n,s在音符的開(kāi)始檢測(cè)之后的能級(jí)E (m, η)由于靜默而為低(例如_45dB),則觸發(fā)音符開(kāi)始的分離子幀n,s的能級(jí)E (m, η)視為寄生并且被拒絕。例如藝術(shù)家可能已經(jīng)無(wú)意地觸摸一個(gè)或者多個(gè)琴弦52而未有意地彈奏音符或者和弦。由于無(wú)意接觸所致的分離子幀n,s的能級(jí)E (m,η)可能已經(jīng)足以檢測(cè)音符的開(kāi)始,但是由于彈奏未繼續(xù)(即分離子幀n,s在音符的開(kāi)始檢測(cè)之后的能級(jí)E (m,η)指示靜默),所以拒絕開(kāi)始檢測(cè)。重復(fù)門168監(jiān)視出現(xiàn)于時(shí)間段內(nèi)的開(kāi)始檢測(cè)數(shù)量。如果在重復(fù)檢測(cè)時(shí)間段(例如50毫秒(ms))內(nèi)檢測(cè)到音符的多個(gè)開(kāi)始,則僅記錄第一開(kāi)始檢測(cè)。也就是說(shuō),拒絕在重復(fù)檢測(cè)時(shí)間段內(nèi)在第一開(kāi)始檢測(cè)之后檢測(cè)到的音符的任何后續(xù)開(kāi)始。噪聲門170監(jiān)視分離子幀n,s在音符的開(kāi)始檢測(cè)周圍的能級(jí)E (m, η)。如果分離子中貞n, s在音符的開(kāi)始檢測(cè)周圍的能級(jí)E(m, η) 一般在低噪聲范圍中,例如能級(jí)E(m, η)為-90dB,則開(kāi)始檢測(cè)被視為可疑并且因?yàn)椴豢煽慷痪芙^。用于即時(shí)分離子幀n,s的音符的有效開(kāi)始檢測(cè)存儲(chǔ)于運(yùn)行時(shí)矩陣174中。圖7的時(shí)域分析塊108如圖10中所示也包括節(jié)拍檢測(cè)器塊172。塊172確定每時(shí)間單位的音符檢測(cè)數(shù)量(即作品的拍子)。音符檢測(cè)器130確定音符的開(kāi)始檢測(cè)。在給定時(shí)間段中記錄音符開(kāi)始檢測(cè)的數(shù)量。在給定時(shí)間段中的音符開(kāi)始檢測(cè)數(shù)量為節(jié)拍。節(jié)拍檢測(cè)器是用于所有頻帶Ι-m的每個(gè)分離子幀n,s的時(shí)域參數(shù)或者特性并且在逐幀基礎(chǔ)上存儲(chǔ)為 運(yùn)行時(shí)矩陣174中的值。響度檢測(cè)器塊176使用能量函數(shù)E(m,η)確定分離子幀n,s的功率譜。功率譜可以是分離子幀n,s的能量函數(shù)E(m,η)的平均值或者均方根(RMS)。節(jié)拍檢測(cè)器是用于所有頻帶Ι-m的每個(gè)分離子幀n,s的時(shí)域參數(shù)或者特性并且在逐幀基礎(chǔ)上存儲(chǔ)為運(yùn)行時(shí)矩陣174中的值。音符時(shí)間塊178確定分離子幀n,s的起奏階段、維系階段、衰退階段和釋放階段的時(shí)間段。音符時(shí)間是用于所有頻帶Ι-m的每個(gè)分離子幀n,s的時(shí)域參數(shù)或者特性并且在逐幀基礎(chǔ)上存儲(chǔ)為運(yùn)行時(shí)矩陣174中的值。圖7中的頻域分析塊106如圖15中所示包括STFT塊180。塊180使用恒定重疊相加(COLA)短時(shí)間傅里葉變換(STFT )或者其他快速傅里葉變換(FFT )來(lái)執(zhí)行分離子幀116在逐幀基礎(chǔ)上的時(shí)域到頻域轉(zhuǎn)換。COLA STFT 180如圖8b中所示使用重疊分析窗114來(lái)執(zhí)行時(shí)域到頻域轉(zhuǎn)換。采樣窗114在COLA STFT分析中針對(duì)附加采樣點(diǎn)按照音頻信號(hào)的預(yù)定采樣數(shù)量(稱為跳躍大小)重疊以保證在相繼幀中對(duì)數(shù)據(jù)相等地加權(quán)。等式(2)提供對(duì)分離子幀116的時(shí)域到頻域轉(zhuǎn)換的一般形式。
Λ_ I
X.,. - H.
r- (: xin;e , .'M.
r;-- u!: 二:丨其中=Xni是在頻域中的音頻信號(hào) X (η)是音頻輸入信號(hào)的第m個(gè)子幀 m是當(dāng)前子巾貞號(hào)
k是頻率倉(cāng) N是STFT大小。在另一實(shí)施例中,塊180在逐幀基礎(chǔ)上使用自回歸函數(shù)來(lái)執(zhí)行分離子幀116的時(shí)域到頻域轉(zhuǎn)換。圖7的頻域分析塊106如圖15中所示也包括音符檢測(cè)器塊182。一旦分離子幀116在頻域中,塊182檢測(cè)每個(gè)音符的開(kāi)始。音符檢測(cè)器塊182關(guān)聯(lián)琴弦52的起奏階段為音符的開(kāi)始。也就是說(shuō),吉他50或者60上的振動(dòng)琴弦52的起奏階段與具體音符的檢測(cè)重合。對(duì)于其他樂(lè)器,音符檢測(cè)與藝術(shù)家的不同身體動(dòng)作(例如按壓鋼琴或者電子鍵盤的鍵、激發(fā)豎琴的琴弦、在按壓號(hào)上的一個(gè)或者多個(gè)鍵之時(shí)向號(hào)中吐入空氣或者用鼓槌打擊鼓面)關(guān)聯(lián)。在每種情況下,音符檢測(cè)器塊182監(jiān)視分離子幀116的頻域動(dòng)態(tài)內(nèi)容并且標(biāo)識(shí)音符的開(kāi)始。圖16示出了頻域音符檢測(cè)器塊182的進(jìn)一步細(xì)節(jié),該頻域音符檢測(cè)器塊182包括能級(jí)隔離塊184,該能級(jí)隔離塊184將分離子幀116的能級(jí)隔離到多個(gè)頻率倉(cāng)中。在圖17中,能級(jí)隔離塊184處理濾波器頻率倉(cāng)188a-188c內(nèi)的每個(gè)頻域分離子幀n,s以分離并且隔離音頻信號(hào)的具體頻率。濾波器頻率倉(cāng)188a-188c可以隔離ΙΟΟ-ΙΟΟΟΗζ的音頻范圍中的具體頻帶。在一個(gè)實(shí)施例中,濾波器頻率倉(cāng)188a以IOOHz為中心,濾波器頻率倉(cāng)188b以500Hz為中心,并且濾波器頻率倉(cāng)188c以1000Hz為中心。濾波器頻率倉(cāng)188a的輸出包含以IOOHz為中心的分離子幀n,s的能級(jí)。濾波器頻率倉(cāng)188b的輸出包含以500Hz為中心的分離子幀n,s的能級(jí)。濾波器頻率倉(cāng)188c的輸出包含以1000Hz為中心的分離子幀n, s的能級(jí)。其他濾波器頻率倉(cāng)的輸出中的每個(gè)包含用于給定具體頻帶的分離子幀n,s的 能級(jí)。峰檢測(cè)器190a監(jiān)視并且存儲(chǔ)以IOOHz為中心的分離子幀n,s的峰能級(jí)。峰檢測(cè)器190b監(jiān)視并且存儲(chǔ)以500Hz為中心的分離子幀n,s的峰能級(jí)。峰檢測(cè)器190c監(jiān)視并且存儲(chǔ)以1000Hz為中心的分離子幀n,s的峰能級(jí)。平滑濾波器192a去除寄生分量并且否則穩(wěn)定以IOOHz為中心的分離子幀n,s的峰能級(jí)。平滑濾波器192b去除寄生分量并且否則穩(wěn)定以500Hz為中心的分離子幀n,s的峰能級(jí)。平滑濾波器192c去除峰能級(jí)的寄生分量并且否則穩(wěn)定以1000Hz為中心的分離子幀n,S。平滑濾波器192a_192c的輸出是在每個(gè)頻率倉(cāng)Ι-m中的用于每個(gè)分離子巾貞n, s的能級(jí)函數(shù)E (m, η)。一個(gè)分離子幀n-1,s的能級(jí)E(m,η)如圖18中所示存儲(chǔ)于起奏檢測(cè)器194的塊196中。如濾波器頻率倉(cāng)188a-188c、峰檢測(cè)器190a_190c和平滑濾波器192a_192c確定的用于下一分離子幀n,s的每個(gè)頻率倉(cāng)Ι-m的能級(jí)存儲(chǔ)于起奏檢測(cè)器194的塊198中。差值塊200確定當(dāng)前分離子幀n,s和先前分離子幀n-1,s的對(duì)應(yīng)倉(cāng)的能級(jí)之間的差。例如從用于分離子幀n,s的頻率倉(cāng)I的能級(jí)減去用于分離子幀n-1,s的頻率倉(cāng)I的能級(jí)。從用于分離子幀n,s的頻率倉(cāng)2的能級(jí)減去用于分離子幀n-1,s的頻率倉(cāng)2的能級(jí)。從用于分離子中貞n, s的頻率倉(cāng)m的能級(jí)減去用于分離子巾貞n-1, s的頻率倉(cāng)m的能級(jí)。用于分離子巾貞n, s和分離子幀n-1,s的每個(gè)頻率倉(cāng)Ι-m的能極之差在求和器202中求和。求和器202累積分離子巾貞n-1, s和分離子巾貞n, s的每個(gè)頻率倉(cāng)In的能級(jí)E (m, η)之差。音符的開(kāi)始將出現(xiàn)于用于分離子幀n,s的跨全部受監(jiān)視頻率倉(cāng)Ι-m的能級(jí)E(m,η)之差的合計(jì)超過(guò)預(yù)定閾值時(shí)。比較器204比較求和器202的輸出與閾值206。如果求和器202的輸出大于閾值206,則用于分離子幀n,s的在整個(gè)頻率頻譜上的能極E (m,η)之差的累積超過(guò)閾值206并且在即時(shí)分離子幀n,s中檢測(cè)到音符的開(kāi)始。如果求和器202的輸出小于閾值206,則未檢測(cè)到音符的開(kāi)始。在每個(gè)子幀結(jié)束時(shí),起奏檢測(cè)器194將標(biāo)識(shí)即時(shí)分離子幀n,s是否包含音符的開(kāi)始或者即時(shí)分離子幀n,s是否不含音符的開(kāi)始。例如,基于分離子幀n,s在頻率倉(cāng)Ι-m的整個(gè)頻譜上的能級(jí)E (m,η)之差的和超過(guò)閾值206,起奏檢測(cè)器194可以將圖9的子幀1,s標(biāo)識(shí)為包含音符的開(kāi)始,而圖9的子幀2,s和子幀3,s無(wú)音符的開(kāi)始。圖5a圖示了音符在子中貞I, s中的點(diǎn)150開(kāi)始(基于分離子巾貞n, s在頻率倉(cāng)Ι-m內(nèi)的能級(jí)E (m, η))并且音符在子幀2,s或者子幀3,s中未開(kāi)始。圖5a具有音符在點(diǎn)152的另一開(kāi)始檢測(cè)。圖5b示出了音符在點(diǎn)154、156和158的開(kāi)始檢測(cè)。圖19圖示了起奏檢測(cè)器194在直接用求和器208對(duì)能級(jí)E (m,η)求和時(shí)的另一實(shí)施例。求和器208累積每個(gè)分離子巾貞n, s和每個(gè)頻率倉(cāng)Ι-m的能級(jí)E (m, η)。音符的開(kāi)始將出現(xiàn)在用于分離子巾貞n, s的跨全部受監(jiān)視頻率倉(cāng)Ι-m的能級(jí)E(m, η)的合計(jì)超過(guò)預(yù)定閾值時(shí)。比較器210比較求和器208的輸出與閾值212。如果求和器208的輸出大于閾值212,則用于分離子幀n,s的在整個(gè)頻率頻譜上的能級(jí)E (m,η)的累積超過(guò)閾值212并且在即時(shí)分離子幀n,s中檢測(cè)到音符的開(kāi)始。如果求和器208的輸出小于閾值212,則未檢測(cè)到音符的開(kāi)始。在每個(gè)分離子幀n,s結(jié)束時(shí),起奏檢測(cè)器194將標(biāo)識(shí)即時(shí)分離子幀n,s是否包含音符的開(kāi)始或者即時(shí)分離子幀n,s是否不含音符的開(kāi)始。例如基于分離子幀n,s在頻率倉(cāng) Ι-m內(nèi)的能級(jí)E (m,η)的和超過(guò)閾值212,起奏檢測(cè)器194可以將圖9的子幀1,s標(biāo)識(shí)為包含音符的開(kāi)始,而圖9的子幀2,s和子幀3,s無(wú)音符的開(kāi)始。等式(I)提供音符的開(kāi)始檢測(cè)的另一圖示。函數(shù)g(m,n)具有用于每個(gè)頻率倉(cāng)l_m和每個(gè)分離子巾貞n, s的值。如果比值E (m, n)/E (m, n-Ι)(即在分離子巾貞n, s中的倉(cāng)m的能級(jí)與在分離子巾貞n-1, s中的倉(cāng)m的能級(jí)之比)小于一,則[E(m, n)/E(m, n-l)]-l為負(fù)。在分離子巾貞n, s中的倉(cāng)m的能級(jí)不大于在分離子巾貞n-1, s中的倉(cāng)m的能級(jí)。函數(shù)g(m,n)為零,其指示未發(fā)起起奏階段并且因此未檢測(cè)到音符的開(kāi)始。如果比值E (m,n)/E (m,n-Ι)(即在分離子幀n,s中的倉(cāng)m的能級(jí)與在分離子幀n-1,s中的倉(cāng)m的能級(jí)之比)大于一(假如值二),貝丨J [E(m, n)/E(m, n-l)]-l為正(即值一)。在分離子巾貞n, s中的倉(cāng)m的能級(jí)大于在分離子中貞n-1, s中的倉(cāng)m的能級(jí)。函數(shù)g(m,n)為[E (m, n)/E (m, n_l) ]-I的正值,其指示發(fā)起起奏階段并且可能檢測(cè)到音符的開(kāi)始?;仡檲D16,起奏檢測(cè)器194向靜默門214、重復(fù)門216和噪聲門218路由音符的開(kāi)始檢測(cè)。并非音符的每個(gè)開(kāi)始檢測(cè)都是真實(shí)的。靜默門214監(jiān)視分離子幀n,s在音符的開(kāi)始檢測(cè)之后的能級(jí)E (m, η)。如果分離子幀n,s在音符的開(kāi)始檢測(cè)之后的能級(jí)E (m, η)由于靜默而為低(例如_45dB),則觸發(fā)音符開(kāi)始的分離子幀n,s的能級(jí)E (m, η)被視為寄生并且被拒絕。例如藝術(shù)家可能已經(jīng)無(wú)意地觸摸一個(gè)或者多個(gè)琴弦52而未有意地彈奏音符或者和弦。由于無(wú)意接觸所致的分離子幀n,s的能級(jí)E (m,η)可能已經(jīng)足以檢測(cè)音符的開(kāi)始,但是由于彈奏未繼續(xù)(即分離子幀n,s在音符的開(kāi)始檢測(cè)之后的能級(jí)E (m,η)指示靜默),所以拒絕開(kāi)始檢測(cè)。重復(fù)門216監(jiān)視出現(xiàn)于時(shí)間段內(nèi)的開(kāi)始檢測(cè)數(shù)量。如果在重復(fù)檢測(cè)時(shí)間段(例如50ms)內(nèi)檢測(cè)到音符的多次開(kāi)始,則僅記錄第一開(kāi)始檢測(cè)。也就是說(shuō),拒絕在重復(fù)檢測(cè)時(shí)間段內(nèi)在第一開(kāi)始檢測(cè)之后檢測(cè)到的音符的任何后續(xù)開(kāi)始。噪聲門218監(jiān)視分離子幀n,s在音符的開(kāi)始檢測(cè)周圍的能級(jí)E (m, η)。如果分離子中貞n, s在音符的開(kāi)始檢測(cè)周圍的能級(jí)E(m, η) 一般在低噪聲范圍中(例如能級(jí)E(m, η)為_(kāi)90dB),則開(kāi)始檢測(cè)被視為可疑并且因?yàn)椴豢煽慷痪芙^。用于即時(shí)分離子幀n,s的音符的有效開(kāi)始檢測(cè)存儲(chǔ)于運(yùn)行時(shí)矩陣174中。
回顧圖15,音高檢測(cè)器塊220確定頻域分離子幀n,s的基頻。給定基頻為通常以Hz為單位的數(shù)值。音高檢測(cè)器是每個(gè)分離子幀n,s的頻域參數(shù)或者特性并且在逐幀基礎(chǔ)上存儲(chǔ)為運(yùn)行時(shí)矩陣174中的值。音符頻譜塊222確定頻域分離子幀n,s的基頻和二次_n次諧波以分析音頻信號(hào)的三色刺激(tri stimuIus )。第一三色刺激(trI)測(cè)量基頻的功率譜。第二三色刺激(trI)測(cè)量頻域分離子幀n,s頻率的2次諧波、3次諧波和4次諧波的平均功率譜。第三三色刺激(tr3)測(cè)量頻域分離子幀n,s頻率的5次諧波至η次諧波的平均功率譜。音符頻譜是每個(gè)分離子幀n,s的頻域參數(shù)或者特性并且在逐幀基礎(chǔ)上存儲(chǔ)為運(yùn)行時(shí)矩陣174中的值。音符泛音(partial)塊224確定頻域分離子幀n,s的亮度(幅度)。亮度B可以由等式(3)確定。音符泛音是每個(gè)分離子幀n,s的頻域參數(shù)或者特性并且逐幀基礎(chǔ)上存儲(chǔ)為運(yùn)行時(shí)矩陣174中的值。
權(quán)利要求
1.一種消費(fèi)者音頻系統(tǒng),包括被耦合用于從消費(fèi)者音頻源接收音頻信號(hào)的信號(hào)處理器,其中所述音頻信號(hào)的動(dòng)態(tài)內(nèi)容控制所述信號(hào)處理器的操作。
2.根據(jù)權(quán)利要求I所述的消費(fèi)者音頻系統(tǒng),還包括 時(shí)域處理器,被耦合用于接收所述音頻信號(hào)并且生成所述音頻信號(hào)的時(shí)域參數(shù); 頻域處理器,被耦合用于接收所述音頻信號(hào)并且生成所述音頻信號(hào)的頻域參數(shù); 簽名數(shù)據(jù)庫(kù),包括多個(gè)簽名記錄,每個(gè)簽名記錄具有時(shí)域參數(shù)和頻域參數(shù)以及控制參數(shù);以及 識(shí)別檢測(cè)器,用于匹配所述音頻信號(hào)的時(shí)域參數(shù)和頻域參數(shù)與所述簽名數(shù)據(jù)庫(kù)的簽名記錄,其中匹配簽名記錄的控制參數(shù)控制所述信號(hào)處理器的操作。
3.根據(jù)權(quán)利要求2所述的消費(fèi)者音頻系統(tǒng),其中所述時(shí)域處理器或者頻域處理器檢測(cè)所述音頻信號(hào)的音符的開(kāi)始。
4.根據(jù)權(quán)利要求2所述的消費(fèi)者音頻系統(tǒng),其中所述時(shí)域參數(shù)包括節(jié)拍檢測(cè)器、響度檢測(cè)器和音符時(shí)間。
5.根據(jù)權(quán)利要求2所述的消費(fèi)者音頻系統(tǒng),其中所述頻域參數(shù)包括音高檢測(cè)器、音符頻譜、音符泛音、音符不調(diào)和度、起奏頻率和諧波導(dǎo)數(shù)。
6.根據(jù)權(quán)利要求I所述的消費(fèi)者音頻系統(tǒng),其中所述信號(hào)處理器包括前濾波器、前效果、非線性效果、用戶限定的模塊、后效果、后濾波器或者功率放大。
7.根據(jù)權(quán)利要求I所述的消費(fèi)者音頻系統(tǒng),其中將所述音頻信號(hào)采樣成采樣的音頻信號(hào)的多個(gè)幀。
8.根據(jù)權(quán)利要求I所述的消費(fèi)者音頻系統(tǒng),其中將采樣的音頻信號(hào)被分離成子幀。
9.根據(jù)權(quán)利要求I所述的消費(fèi)者音頻系統(tǒng),其中所述音頻信號(hào)由樂(lè)器、聲樂(lè)、計(jì)算機(jī)或者電子設(shè)備生成。
10.一種控制消費(fèi)者音頻系統(tǒng)的方法,包括 提供適于從消費(fèi)者音頻源接收音頻信號(hào)的信號(hào)處理器;并且 使用所述音頻信號(hào)的動(dòng)態(tài)內(nèi)容來(lái)控制所述信號(hào)處理器的操作。
11.根據(jù)權(quán)利要求10所述的方法,還包括 生成所述音頻信號(hào)的時(shí)域參數(shù); 生成所述音頻信號(hào)的頻域參數(shù); 提供包括多個(gè)簽名記錄的簽名數(shù)據(jù)庫(kù),每個(gè)簽名記錄具有時(shí)域參數(shù)和頻域參數(shù)以及控制參數(shù); 匹配所述音頻信號(hào)的時(shí)域參數(shù)和頻域參數(shù)與所述簽名數(shù)據(jù)庫(kù)的簽名記錄;并且 基于匹配簽名記錄的控制參數(shù)控制所述信號(hào)處理器的操作。
12.根據(jù)權(quán)利要求11所述的方法,還包括 將所述音頻信號(hào)采樣成多個(gè)幀; 將采樣的音頻信號(hào)分離成子幀;并且 基于分離的子幀生成所述時(shí)域參數(shù)和頻域參數(shù)。
13.根據(jù)權(quán)利要求11所述的方法,其中所述時(shí)域處理器或者頻域處理器檢測(cè)所述音頻信號(hào)的音符的開(kāi)始。
14.根據(jù)權(quán)利要求11所述的方法,其中所述時(shí)域參數(shù)包括節(jié)拍檢測(cè)器、響度檢測(cè)器和音符時(shí)間。
15.根據(jù)權(quán)利要求11所述的方法,其中所述頻域參數(shù)包括音高檢測(cè)器、音符頻譜、音符泛音、音符不調(diào)和度、起奏頻率和諧波導(dǎo)數(shù)。
16.根據(jù)權(quán)利要求10所述的方法,其中所述信號(hào)處理器包括前濾波器、前效果、非線性效果、用戶限定的模塊、后效果、后濾波器或者功率放大。
17.根據(jù)權(quán)利要求10所述的方法,還包括用樂(lè)器、聲樂(lè)、計(jì)算機(jī)或者電子設(shè)備生成所述音頻信號(hào)。
全文摘要
本發(fā)明涉及區(qū)分信號(hào)信息內(nèi)容和控制信號(hào)處理功能的音頻系統(tǒng)和方法。一種消費(fèi)者音頻系統(tǒng)具有被耦合用于接收音頻信號(hào)的信號(hào)處理器。將音頻信號(hào)采樣成多個(gè)幀。根據(jù)聲音生成源的類型或者頻率內(nèi)容將采樣的音頻幀分離成子幀。時(shí)域處理器根據(jù)分離子幀生成時(shí)域參數(shù)。頻域處理器根據(jù)分離子幀生成頻域參數(shù)。時(shí)域處理器或者頻域處理器可以檢測(cè)音頻信號(hào)的音符的開(kāi)始。簽名數(shù)據(jù)庫(kù)具有簽名記錄,每個(gè)簽名記錄具有時(shí)域參數(shù)和頻域參數(shù)以及控制參數(shù)。識(shí)別檢測(cè)器匹配分離子幀的時(shí)域參數(shù)和頻域參數(shù)與簽名數(shù)據(jù)庫(kù)的簽名記錄。匹配簽名的控制參數(shù)記錄信號(hào)處理器的控制操作。
文檔編號(hào)H04R3/00GK102790933SQ20121015317
公開(kāi)日2012年11月21日 申請(qǐng)日期2012年5月17日 優(yōu)先權(quán)日2011年5月17日
發(fā)明者K.L.查普曼, S.J.科蒂, 鄺志云 申請(qǐng)人:芬德樂(lè)器公司