一種提取音樂(lè)特征的方法及裝置制造方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種提取音樂(lè)特征的方法及裝置,所述方法包括:對(duì)接收到的音頻信號(hào)進(jìn)行切分處理,以生成至少兩個(gè)分段音頻信號(hào);對(duì)每個(gè)所述分段音頻信號(hào)進(jìn)行傅里葉變換,獲取每個(gè)所述分段音頻信號(hào)的頻域信號(hào);根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心,作為音樂(lè)特征;根據(jù)每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心、頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的帶寬,作為音樂(lè)特征。本發(fā)明實(shí)施例通過(guò)對(duì)接收的音頻信號(hào)分段,并根據(jù)每段音頻信號(hào)中所有符合條件的頻率信息來(lái)計(jì)算每段音頻信號(hào)的質(zhì)心和帶寬,作為音樂(lè)特征,從而減小了環(huán)境對(duì)音頻信號(hào)特征的影響,提高了系統(tǒng)的辨識(shí)率。
【專(zhuān)利說(shuō)明】一種提取音樂(lè)特征的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信號(hào)處理技術(shù),尤其涉及一種提取音樂(lè)特征的方法及裝置。
【背景技術(shù)】
[0002]CMI (Contend-based Music Identification,基于內(nèi)容的音樂(lè)辨識(shí))是目前智能手機(jī)端的一個(gè)熱門(mén)應(yīng)用。它的應(yīng)用場(chǎng)景是:當(dāng)用戶聽(tīng)到一首自己喜歡但不知道歌名的音樂(lè)時(shí),可以通過(guò)手機(jī)錄制音樂(lè)的幾秒鐘片段,然后由后臺(tái)系統(tǒng)通過(guò)搜索技術(shù)找到該音樂(lè)的各種信息反饋給用戶。為了實(shí)現(xiàn)這一功能,首要任務(wù)是從大量的訓(xùn)練曲庫(kù)中,提取合適的音樂(lè)特征,建立訓(xùn)練集特征索引庫(kù),作為后續(xù)對(duì)待測(cè)試音樂(lè)片段進(jìn)行特征匹配的依據(jù)。
[0003]特征提取是CMI系統(tǒng)的重要組成部分,現(xiàn)有的CMI技術(shù)采用的特征大多為MFCC (Mel Frequency Cepstrum Coefficient,梅爾頻率倒頻系數(shù))、基音、BPM(Beat perMinute,每分鐘節(jié)拍數(shù))等音頻信號(hào)的基礎(chǔ)特征,以及相應(yīng)的演化特征(如一階、二階差分特征XCMI系統(tǒng)中訓(xùn)練曲庫(kù)中的信號(hào)為純音樂(lè)信號(hào),沒(méi)有任何干擾,但待測(cè)試音樂(lè)信號(hào)由于周?chē)h(huán)境噪聲或信道的影響會(huì)有明顯的信號(hào)失真,從而導(dǎo)致訓(xùn)練曲庫(kù)中的信號(hào)特征與待測(cè)試音樂(lè)信號(hào)產(chǎn)生很大的差異,降低了 CMI系統(tǒng)的識(shí)別率。
【發(fā)明內(nèi)容】
[0004]有鑒于此,本發(fā)明實(shí)施例提供了一種提取音樂(lè)特征的方法及裝置,以減少環(huán)境對(duì)音樂(lè)特征的影響,提高系統(tǒng)的識(shí)別率。
[0005]一方面,本發(fā)明實(shí)施例提供了一種提取音樂(lè)特征的方法,所述方法包括:
[0006]對(duì)接收到的音頻信號(hào)進(jìn)行切分處理,以生成至少兩個(gè)分段音頻信號(hào);
[0007]對(duì)每個(gè)所述分段音頻信號(hào)進(jìn)行傅里葉變換,獲取每個(gè)所述分段音頻信號(hào)的頻域信號(hào);
[0008]根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心,作為音樂(lè)特征;
[0009]根據(jù)每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心、頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的帶寬,作為音樂(lè)特征。
[0010]另一方面,本發(fā)明實(shí)施例還提供了 一種提取音樂(lè)特征的裝置,所述裝置包括:
[0011]切分單元,用于對(duì)接收到的音頻信號(hào)進(jìn)行切分處理,以生成至少兩個(gè)分段音頻信號(hào);
[0012]變換單元,用于對(duì)每個(gè)所述分段音頻信號(hào)進(jìn)行傅里葉變換,獲取每個(gè)所述分段音頻信號(hào)的頻域信號(hào);
[0013]第一計(jì)算單元,用于根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心,作為音樂(lè)特征;
[0014]第二計(jì)算單元,用于根據(jù)每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心、頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的帶寬,作為音樂(lè)特征。[0015]本發(fā)明實(shí)施例提供的一種提取音樂(lè)特征的方法及裝置,通過(guò)對(duì)接收的音頻信號(hào)分段,并根據(jù)每段音頻信號(hào)的所有符合條件的頻率信息來(lái)計(jì)算每段音頻信號(hào)的質(zhì)心和帶寬,作為音樂(lè)特征,從而減小了環(huán)境對(duì)音頻信號(hào)特征的影響,準(zhǔn)確提取音樂(lè)特征,進(jìn)而能提高系統(tǒng)對(duì)音樂(lè)的辨識(shí)率。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0016]圖1是本發(fā)明實(shí)施例適用的系統(tǒng)架構(gòu)的示意圖;
[0017]圖2是本發(fā)明第一實(shí)施例提供的提取音樂(lè)特征的方法的流程圖;
[0018]圖3是本發(fā)明第四實(shí)施例提供的提取音樂(lè)特征的裝置的示意圖。
【具體實(shí)施方式】
[0019]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部?jī)?nèi)容。
[0020]本發(fā)明所有實(shí)施例可適用于圖1所示的系統(tǒng)架構(gòu),該系統(tǒng)架構(gòu)主要用于提取音樂(lè)特征并適用到音樂(lè)識(shí)別應(yīng)用中,該系統(tǒng)架構(gòu)中可包括預(yù)處理單元101、特征提取單元102、音頻切分單元103、特征聚類(lèi)單元104和匹配單元105等,所述預(yù)處理單元101用于對(duì)接收到的音樂(lè)信號(hào)預(yù)濾波、傳遞函數(shù)預(yù)測(cè)、降采樣等,產(chǎn)生音頻信號(hào);所述特征提取單元102用于提取音頻信號(hào)的音樂(lè)特征;所述音頻切分單元103用于根據(jù)音樂(lè)特征尋找音頻信號(hào)的突變點(diǎn),并根據(jù)突變點(diǎn)將所述音頻信號(hào)劃分成若干段;所述特征聚類(lèi)單元104用于根據(jù)聚類(lèi)算法,將各個(gè)段的音頻信號(hào)聚類(lèi),提取整段音頻信號(hào)最具代表性的K類(lèi)音樂(lè)特征;所述匹配單元105用于根據(jù)提取到的K類(lèi)音樂(lè)特征在訓(xùn)練數(shù)據(jù)庫(kù)中查找目標(biāo)音樂(lè)。本發(fā)明實(shí)施例提供的方法可以由特征提取單元102來(lái)執(zhí)行。
[0021]實(shí)施例一
[0022]圖2是本發(fā)明第一實(shí)施例提供的提取音樂(lè)特征的方法的流程圖,本實(shí)施例的執(zhí)行主體可以為特征提取單元,所述特征提取單元又可稱(chēng)為提取音樂(lè)特征的裝置,由硬件和/或軟件實(shí)現(xiàn),可以配置于本地的客戶端,還可以配置于網(wǎng)絡(luò)中的服務(wù)器,在此不作具體限定,本實(shí)施例提供的方法具體包括如下步驟:
[0023]步驟201、對(duì)接收到的音頻信號(hào)進(jìn)行切分處理,以生成至少兩個(gè)分段音頻信號(hào)。
[0024]在本方案中,音頻信號(hào)可以是任意來(lái)源,例如用戶自行錄制,或接收獲取的音頻信號(hào)。優(yōu)選的,可以將所述接收的音頻信號(hào)切分成至少兩段長(zhǎng)度相等音頻信號(hào),也可以將所述接收的音頻信號(hào)切分成至少兩段長(zhǎng)度不等的音頻信號(hào),在此不作具體限定。
[0025]例如,具體可以根據(jù)預(yù)先設(shè)置的長(zhǎng)度信息,如10ms,將接收到的音頻信號(hào)切分成至少兩個(gè)長(zhǎng)度相等的分段音頻信號(hào);具體還可以根據(jù)所述接收到的音頻信號(hào)的節(jié)奏信息,如鼓點(diǎn)、旋等,將所述音頻信號(hào)切分成至少兩個(gè)分段音頻信號(hào),由于所述音頻信號(hào)的節(jié)奏信息變化并不是恒定不變的,所以根據(jù)所述節(jié)奏信息得到的每個(gè)分段音頻信號(hào)的長(zhǎng)度也可以不相等。
[0026]步驟202、對(duì)每個(gè)所述分段音頻信號(hào)進(jìn)行傅里葉變換,獲取每個(gè)所述分段音頻信號(hào)的頻域信號(hào)。[0027]步驟203、根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心,作為音樂(lè)特征。
[0028]本方案中,所述接收到的音頻信號(hào)中可能包含有噪聲,噪聲在整個(gè)頻率范圍內(nèi)的分布與所述音頻信號(hào)相比,更加平穩(wěn)。噪聲的存在可能會(huì)嚴(yán)重影響所述音頻信號(hào)頻域上的某個(gè)頻率,但對(duì)于整個(gè)頻域上頻率質(zhì)心來(lái)說(shuō),影響并不大。
[0029]步驟204、根據(jù)每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心、頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的帶寬,作為音樂(lè)特征。
[0030]所述帶寬用來(lái)描述所述接收到的音頻信號(hào)的有效頻率范圍,即使環(huán)境改變,音頻信號(hào)的帶寬也不會(huì)有明顯的變化。
[0031]本發(fā)明實(shí)施例提供的一種提取音樂(lè)特征的方法,通過(guò)對(duì)接收的音頻信號(hào)分段,并根據(jù)每段音頻信號(hào)的所有符合條件的頻率信息來(lái)計(jì)算每段音頻信號(hào)的質(zhì)心和帶寬,作為音樂(lè)特征,從而減小了環(huán)境對(duì)音頻信號(hào)特征的影響,準(zhǔn)確提取音樂(lè)特征,進(jìn)而能提高系統(tǒng)對(duì)音樂(lè)的辨識(shí)率。
[0032]在上述技術(shù)方案的基礎(chǔ)上,所述步驟203根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)的對(duì)應(yīng)頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心,作為音樂(lè)特征,優(yōu)選的,可包括根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,利用下述公式I計(jì)算得到所述頻率質(zhì)心:[0033]
【權(quán)利要求】
1.一種提取音樂(lè)特征的方法,其特征在于,所述方法包括: 對(duì)接收到的音頻信號(hào)進(jìn)行切分處理,以生成至少兩個(gè)分段音頻信號(hào); 對(duì)每個(gè)所述分段音頻信號(hào)進(jìn)行傅里葉變換,獲取每個(gè)所述分段音頻信號(hào)的頻域信號(hào); 根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心,作為音樂(lè)特征; 根據(jù)每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心、頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的帶寬,作為音樂(lè)特征。
2.根據(jù)權(quán)利要求1所述的提取音樂(lè)特征的方法,其特征在于,根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心,作為音樂(lè)特征包括: 根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,利用下述公式I計(jì)算得到所述頻率質(zhì)心:
3.根據(jù)權(quán)利要求2所述的提取音樂(lè)特征的方法,其特征在于,根據(jù)每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心、頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的帶覽,作為首樂(lè)特征包括: 根據(jù)每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心、頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,利用下述公式2計(jì)算得到所述帶寬:
4.根據(jù)權(quán)利要求1-3任一所述的提取音樂(lè)特征的方法,其特征在于,在獲取音樂(lè)特征之后,所述方法還包括: 根據(jù)每個(gè)所述分段音頻信號(hào)的音樂(lè)特征,計(jì)算每個(gè)所述分段音頻信號(hào)的差分特征,作為首樂(lè)特征。
5.根據(jù)權(quán)利要求1-3任一所述的提取音樂(lè)特征的方法,其特征在于,在獲取音樂(lè)特征之后,所述方法還包括: 將提取到的音樂(lè)特征拼接成一個(gè)多維向量,并對(duì)所述多維向量進(jìn)行降維處理。
6.一種提取音樂(lè)特征的裝置,其特征在于,所述裝置包括: 切分單元,用于對(duì)接收到的音頻信號(hào)進(jìn)行切分處理,以生成至少兩個(gè)分段音頻信號(hào);變換單元,用于對(duì)每個(gè)所述分段音頻信號(hào)進(jìn)行傅里葉變換,獲取每個(gè)所述分段音頻信號(hào)的頻域信號(hào); 第一計(jì)算單元,用于根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心,作為音樂(lè)特征; 第二計(jì)算單元,用于根據(jù)每個(gè)所述分段音頻信號(hào)的頻率質(zhì)心、頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,計(jì)算每個(gè)所述分段音頻信號(hào)的帶寬,作為音樂(lè)特征。
7.根據(jù)權(quán)利要求8所述的提取音樂(lè)特征的裝置,其特征在于,所述第一計(jì)算單元具體用于根據(jù)每個(gè)所述分段音頻信號(hào)的頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,利用下述公式I計(jì)算得到所述頻率質(zhì)心:
8.根據(jù)權(quán)利要求7所述的提取音樂(lè)特征的裝置,其特征在于,所述第二計(jì)算單元具體用于根據(jù)每個(gè)所述分段信號(hào)的頻率質(zhì)心、頻域信號(hào)和所述頻域信號(hào)對(duì)應(yīng)的頻率,利用下述公式2計(jì)算得到所述帶寬:
9.根據(jù)權(quán)利要求6-8任一所述的提取音樂(lè)特征的裝置,其特征在于,所述裝置還包括:第三計(jì)算單元,用于在獲取音樂(lè)特征之后,根據(jù)每個(gè)所述分段音頻信號(hào)的音樂(lè)特征,計(jì)算每個(gè)所述分段音頻信號(hào)的差分特征,作為音樂(lè)特征。
10.根據(jù)權(quán)利要求6-8任一所述的提取音樂(lè)特征的裝置,其特征在于,所述裝置還包括:第四計(jì)算單元,用于在獲取音樂(lè)特征之后,將提取到的音樂(lè)特征拼接成一個(gè)多維向量,并對(duì)所述多維向量進(jìn)行降維處理。
【文檔編號(hào)】G10L25/03GK103854661SQ201410104198
【公開(kāi)日】2014年6月11日 申請(qǐng)日期:2014年3月20日 優(yōu)先權(quán)日:2014年3月20日
【發(fā)明者】宋輝 申請(qǐng)人:北京百度網(wǎng)訊科技有限公司