本申請(qǐng)涉及車(chē)輛音樂(lè)系統(tǒng),具體涉及一種音頻特征的提取方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著車(chē)載音樂(lè)系統(tǒng)在現(xiàn)代汽車(chē)中的廣泛應(yīng)用,對(duì)提高車(chē)內(nèi)音樂(lè)體驗(yàn)的需求逐漸增加。傳統(tǒng)車(chē)載音樂(lè)特征提取方法因存在提取的特征不足的技術(shù)問(wèn)題,導(dǎo)致不能滿(mǎn)足用戶(hù)日益增長(zhǎng)的體驗(yàn)需求。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述問(wèn)題,本申請(qǐng)?zhí)峁┝艘环N音頻特征的提取方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),用于解決現(xiàn)有技術(shù)中存在的提取特征不足的技術(shù)問(wèn)題,通過(guò)將初始音頻特征進(jìn)行映射變換處理后,得到包括不同頻率的待處理音頻特征,再采用多個(gè)頻率和分辨率各不相同的梅爾濾波器組對(duì)待處理音頻特征進(jìn)行濾波,以到待處理音頻特征對(duì)應(yīng)的多個(gè)頻譜表示;對(duì)每個(gè)頻譜表示進(jìn)行非線性變換和多級(jí)離散余弦變換,得到多個(gè)頻率系數(shù),最后再將各頻譜表示和各頻率系數(shù)進(jìn)行融合,得到目標(biāo)音頻特征。實(shí)現(xiàn)了對(duì)不同頻率的特征對(duì)應(yīng)采用不同的頻率的梅爾濾波器組進(jìn)行濾波處理,再針對(duì)得到的不同頻譜表示進(jìn)行分別處理,最后再融合,從而能夠?qū)Σ煌l率的特征都進(jìn)行準(zhǔn)確的捕捉和分析,進(jìn)而提高了音頻特征提取的準(zhǔn)確性。同時(shí),不同頻率的特征對(duì)應(yīng)了不同音頻細(xì)節(jié),通過(guò)區(qū)分頻率進(jìn)行分別提取和并行處理后再融合,保證了音頻特征提取的完整性,避免了現(xiàn)有技術(shù)存在的提取特征不足的情況,進(jìn)而滿(mǎn)足了用戶(hù)體驗(yàn)需求,進(jìn)一步提高了用戶(hù)體驗(yàn)度。
2、根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面,提供了一種音頻特征的提取方法,所述方法包括:對(duì)初始音頻特征進(jìn)行映射變換處理,得到映射變換后的待處理音頻特征;其中,所述待處理音頻特征包括多個(gè)不同頻率的音頻特征;采用預(yù)設(shè)的多個(gè)梅爾濾波器組,對(duì)所述待處理音頻特征進(jìn)行濾波處理,得到所述待處理音頻特征對(duì)應(yīng)的多個(gè)頻譜表示;其中各梅爾濾波器組之間的頻率或分辨率不同,一個(gè)所述頻譜表示對(duì)應(yīng)一個(gè)所述梅爾濾波器組;對(duì)每個(gè)所述頻譜表示進(jìn)行非線性變換,得到多個(gè)變換后的頻譜表示;對(duì)每個(gè)所述變換后的頻譜表示進(jìn)行多級(jí)離散余弦變換,得到多個(gè)頻率系數(shù);將各個(gè)所述頻譜表示和各個(gè)所述頻率系數(shù)進(jìn)行融合,得到目標(biāo)音頻特征。
3、在一種可選的方式中,所述對(duì)初始音頻特征進(jìn)行映射變換處理,得到待處理音頻特征步驟之前,還包括:對(duì)原始音樂(lè)信號(hào)進(jìn)行預(yù)處理,得到初始音頻特征。
4、在一種可選的方式中,所述對(duì)原始音樂(lè)信號(hào)進(jìn)行預(yù)處理,得到初始音頻特征,進(jìn)一步包括:對(duì)原始音樂(lè)信號(hào)進(jìn)行編解碼處理,得到格式統(tǒng)一的音樂(lè)數(shù)據(jù);對(duì)所述音樂(lè)數(shù)據(jù)進(jìn)行降采樣處理,得到初始音頻特征。
5、在一種可選的方式中,所述對(duì)初始音頻特征進(jìn)行映射變換處理,得到映射變換后的待處理音頻特征步驟,進(jìn)一步包括:基于預(yù)設(shè)變換對(duì)所述初始音頻特征進(jìn)行映射變換處理,得到包括所述初始音頻特征的頻率和相位的復(fù)平面圖像;其中,所述復(fù)平面圖像則為所述映射變換后的待處理音頻特征,所述復(fù)平面圖像中的點(diǎn)表征所述待處理音頻特征的頻率。
6、在一種可選的方式中,所述對(duì)每個(gè)所述頻譜表示進(jìn)行非線性變換,得到多個(gè)變換后的頻譜表示步驟,進(jìn)一步包括:基于預(yù)設(shè)函數(shù)對(duì)每個(gè)所述頻譜表示進(jìn)行非線性壓縮變換,得到多個(gè)變換后的頻譜表示;其中,所述預(yù)設(shè)函數(shù)包括對(duì)數(shù)函數(shù)或指數(shù)函數(shù)。
7、在一種可選的方式中,所述對(duì)每個(gè)所述變換后的頻譜表示進(jìn)行多級(jí)離散余弦變換,得到多個(gè)頻率系數(shù)步驟,進(jìn)一步包括:遍歷每個(gè)所述變換后的頻譜表示,并將遍歷到的所述變換后的頻譜表示作為目標(biāo)頻譜表示;對(duì)所述目標(biāo)頻譜表示進(jìn)行當(dāng)前層級(jí)的離散余弦變換,并將得到的當(dāng)前層級(jí)的輸出作為下一層級(jí)的離散余弦變換的輸入,重復(fù)本步驟,直至當(dāng)前層級(jí)的數(shù)量達(dá)到預(yù)設(shè)數(shù)量或當(dāng)前層級(jí)的輸出符合預(yù)設(shè)壓縮率時(shí)停止;將停止時(shí)所對(duì)應(yīng)的當(dāng)前層級(jí)的輸出作為所述目標(biāo)頻譜表示的頻率系數(shù),得到各個(gè)所述變換后的頻譜表示對(duì)應(yīng)的頻率系數(shù),進(jìn)而得到多個(gè)頻率系數(shù)。
8、在一種可選的方式中,所述將各個(gè)所述頻譜表示和各個(gè)所述頻率系數(shù)進(jìn)行融合,得到目標(biāo)音頻特征步驟,進(jìn)一步包括:基于加權(quán)平均算法將各個(gè)所述頻率系數(shù)進(jìn)行拼接融合,得到拼接音頻特征;基于深度學(xué)習(xí)算法將所述拼接音頻特征和預(yù)設(shè)特征進(jìn)行特征融合,得到目標(biāo)音頻特征;其中,所述預(yù)設(shè)特征包括預(yù)設(shè)色度特征和預(yù)設(shè)頻譜對(duì)比度特征。
9、根據(jù)本申請(qǐng)實(shí)施例的另一方面,提供了一種音頻特征的提取裝置,包括:特征處理模塊,用于對(duì)初始音頻特征進(jìn)行映射變換處理,得到映射變換后的待處理音頻特征;其中,所述待處理音頻特征包括多個(gè)不同頻率的音頻特征;特征處理模塊,還用于采用預(yù)設(shè)的多個(gè)梅爾濾波器組,對(duì)所述待處理音頻特征進(jìn)行濾波處理,得到所述待處理音頻特征對(duì)應(yīng)的多個(gè)頻譜表示;其中各梅爾濾波器組之間的頻率或分辨率不同,一個(gè)所述頻譜表示對(duì)應(yīng)一個(gè)所述梅爾濾波器組;特征處理模塊,還用于對(duì)每個(gè)所述頻譜表示進(jìn)行非線性變換,得到多個(gè)變換后的頻譜表示;特征處理模塊,還用于對(duì)每個(gè)所述變換后的頻譜表示進(jìn)行多級(jí)離散余弦變換,得到多個(gè)頻率系數(shù);特征融合模塊,用于將各個(gè)所述頻譜表示和各個(gè)所述頻率系數(shù)進(jìn)行融合,得到目標(biāo)音頻特征。
10、根據(jù)本申請(qǐng)實(shí)施例的另一方面,提供了一種計(jì)算機(jī)設(shè)備,包括:,包括:控制器;存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)程序,當(dāng)一個(gè)或多個(gè)程序被控制器執(zhí)行時(shí),使得控制器實(shí)現(xiàn)上述任意一項(xiàng)權(quán)利要求中所述的音頻特征的提取方法。
11、根據(jù)本申請(qǐng)實(shí)施例的又一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一可執(zhí)行指令,所述可執(zhí)行指令在計(jì)算機(jī)裝置/設(shè)備上運(yùn)行時(shí),使得計(jì)算機(jī)裝置/設(shè)備執(zhí)行上述任意一項(xiàng)權(quán)利要求中所述的音頻特征的提取方法的操作。
12、本申請(qǐng)實(shí)施例通過(guò)將初始音頻特征進(jìn)行映射變換處理后,得到包括不同頻率的待處理音頻特征,再采用多個(gè)頻率和分辨率各不相同的梅爾濾波器組對(duì)待處理音頻特征進(jìn)行濾波,以到待處理音頻特征對(duì)應(yīng)的多個(gè)頻譜表示;對(duì)每個(gè)頻譜表示進(jìn)行非線性變換和多級(jí)離散余弦變換,得到多個(gè)頻率系數(shù),最后再將各頻譜表示和各頻率系數(shù)進(jìn)行融合,得到目標(biāo)音頻特征。實(shí)現(xiàn)了對(duì)不同頻率的特征對(duì)應(yīng)采用不同的頻率的梅爾濾波器組進(jìn)行濾波處理,再針對(duì)得到的不同頻譜表示進(jìn)行分別處理,最后再融合,從而能夠?qū)Σ煌l率的特征都進(jìn)行準(zhǔn)確的捕捉和分析,進(jìn)而提高了音頻特征提取的準(zhǔn)確性。同時(shí),不同頻率的特征對(duì)應(yīng)了不同音頻細(xì)節(jié),通過(guò)區(qū)分頻率進(jìn)行分別提取和并行處理后再融合,保證了音頻特征提取的完整性,避免了現(xiàn)有技術(shù)存在的提取特征不足的情況,進(jìn)而滿(mǎn)足了用戶(hù)體驗(yàn)需求,進(jìn)一步提高了用戶(hù)體驗(yàn)度。
13、上述說(shuō)明僅是本申請(qǐng)實(shí)施例技術(shù)方案的概述,為了能夠更清楚了解本申請(qǐng)實(shí)施例的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本申請(qǐng)實(shí)施例的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本申請(qǐng)的具體實(shí)施方式。
1.一種音頻特征的提取方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)初始音頻特征進(jìn)行映射變換處理,得到待處理音頻特征步驟之前,還包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)原始音樂(lè)信號(hào)進(jìn)行預(yù)處理,得到初始音頻特征步驟,進(jìn)一步包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)初始音頻特征進(jìn)行映射變換處理,得到映射變換后的待處理音頻特征步驟,進(jìn)一步包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)每個(gè)所述頻譜表示進(jìn)行非線性變換,得到多個(gè)變換后的頻譜表示步驟,進(jìn)一步包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)每個(gè)所述變換后的頻譜表示進(jìn)行多級(jí)離散余弦變換,得到多個(gè)頻率系數(shù)步驟,進(jìn)一步包括:
7.根據(jù)權(quán)利要求1至6中任意一項(xiàng)所述的方法,其特征在于,所述將各個(gè)所述頻譜表示和所述頻率系數(shù)進(jìn)行融合,得到目標(biāo)音頻特征步驟,進(jìn)一步包括:
8.一種音頻特征的提取裝置,其特征在于,所述裝置包括:
9.一種計(jì)算機(jī)設(shè)備,其特征在于,包括:
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一可執(zhí)行指令,所述可執(zhí)行指令在計(jì)算機(jī)裝置/設(shè)備上運(yùn)行時(shí),使得計(jì)算機(jī)裝置/設(shè)備執(zhí)行如權(quán)利要求1至7中任意一項(xiàng)所述的音頻特征的提取方法的操作。