本申請屬于藍牙音頻,特別是涉及一種高效的基于非負矩陣分解的藍牙接收端單聲道上混方法、裝置、存儲介質(zhì)及設(shè)備。
背景技術(shù):
1、目前主流的藍牙音頻編碼器有:sbc、aac、aptx系列、ldac、lhdc等。在mp3之后,最主流的音頻壓縮格式當屬aac,其低碼率、高音質(zhì)的特點使其應用十分廣泛。很多音樂文件都使用aac格式保存,而且很多中高端手機和藍牙耳機都支持使用aac格式傳輸音樂。
2、藍牙音箱目前比較普及,除了欣賞單聲道與立體聲,人們更希望能提高沉浸感。5.1聲道環(huán)繞聲是使用比較廣泛的音頻格式,其能提供較好的用戶體驗。在多聲道信號中,環(huán)繞聲的一種主要功能是提供環(huán)境聲(ambient)音效,對于沉浸感非常重要。但由于某些原因,相當數(shù)量的aac音源是單聲道的,這些音源在通過具備多聲道的音箱播放時通??梢允褂们爸新暤啦シ牛蛘咔白蠹忧坝衣暤啦シ?,后置環(huán)繞聲道的音箱無法利用,造成資源的浪費,也無法為用戶提供沉浸感。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)中存在的上述技術(shù)問題,本申請?zhí)峁┝艘环N高效的基于非負矩陣分解的藍牙接收端單聲道上混方法、裝置、存儲介質(zhì)及設(shè)備,基于非負矩陣分解,對于藍牙接收端收到的aac格式傳輸?shù)膯温暤酪粼?,在藍牙接收端解碼的同時上混為主聲源和環(huán)境聲,然后在藍牙接收端播放主聲源的同時播放環(huán)境聲,從而增強用戶的沉浸感,提高用戶體驗。
2、為了實現(xiàn)上述目的,本申請采用的第一個技術(shù)方案是:提供一種高效的基于非負矩陣分解的藍牙接收端單聲道上混方法,包括:在藍牙接收端,對輸入的單聲道aac碼流或雙聲道碼流執(zhí)行解碼至時域噪聲整形,得到譜系數(shù)及其對應的幅度譜系數(shù);對譜系數(shù)執(zhí)行單聲道判決,若判決結(jié)果為單聲道,則根據(jù)譜系數(shù)的類型構(gòu)建對應的幅度譜系數(shù)矩陣;對幅度譜系數(shù)矩陣執(zhí)行非負矩陣分解,得到對應的基矩陣和激活矩陣;根據(jù)譜系數(shù)、幅度譜系數(shù)、基矩陣和激活矩陣,計算主聲源譜系數(shù)和環(huán)境聲譜系數(shù);以及分別對主聲源譜系數(shù)和環(huán)境聲譜系數(shù)繼續(xù)執(zhí)行解碼過程,輸出主聲源pcm數(shù)據(jù)和環(huán)境聲pcm數(shù)據(jù)。
3、本申請采用的第二個技術(shù)方案是:提供一種高效的基于非負矩陣分解的藍牙接收端單聲道上混裝置,包括:用于在藍牙接收端,對輸入的單聲道aac碼流或雙聲道碼流執(zhí)行解碼至時域噪聲整形,得到譜系數(shù)及其對應的幅度譜系數(shù)的模塊;用于對譜系數(shù)執(zhí)行單聲道判決,若判決結(jié)果為單聲道,則根據(jù)譜系數(shù)的類型構(gòu)建對應的幅度譜系數(shù)矩陣的模塊;用于對幅度譜系數(shù)矩陣執(zhí)行非負矩陣分解,得到對應的基矩陣和激活矩陣的模塊;用于根據(jù)譜系數(shù)、幅度譜系數(shù)、基矩陣和激活矩陣,計算主聲源譜系數(shù)和環(huán)境聲譜系數(shù)的模塊;用于分別對主聲源譜系數(shù)和環(huán)境聲譜系數(shù)繼續(xù)執(zhí)行解碼過程,輸出主聲源pcm數(shù)據(jù)和環(huán)境聲pcm數(shù)據(jù)的模塊。
4、本申請采用的第三個技術(shù)方案是:提供一種計算機可讀存儲介質(zhì),其存儲有計算機指令,其中計算機指令被操作以執(zhí)行方案一中的高效的基于非負矩陣分解的藍牙接收端單聲道上混方法。
5、本申請采用的第四個技術(shù)方案是:提供一種計算機設(shè)備,其包括處理器和存儲器,存儲器存儲有計算機指令,其中處理器操作計算機指令以執(zhí)行方案一中的高效的基于非負矩陣分解的藍牙接收端單聲道上混方法。
6、本申請技術(shù)方案可以達到的有益效果是:本申請的技術(shù)方案既可以應用于低功耗藍牙,也可以應用于經(jīng)典藍牙,基于非負矩陣分解,對于藍牙接收端收到的aac格式傳輸?shù)膯温暤酪粼?,在藍牙接收端解碼的同時上混為主聲源和環(huán)境聲,然后在藍牙接收端播放主聲源的同時播放環(huán)境聲,給聽眾提供環(huán)境聲的體驗,并使聲像的位置與標準多聲道環(huán)繞聲保持相同,從而增強了用戶的沉浸感,提高了用戶體驗,而且還利用現(xiàn)有的時頻變換和重疊相加,避免了增加算法延時。
1.一種高效的基于非負矩陣分解的藍牙接收端單聲道上混方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的高效的基于非負矩陣分解的藍牙接收端單聲道上混方法,其特征在于,所述對所述譜系數(shù)執(zhí)行單聲道判決,包括:
3.根據(jù)權(quán)利要求1所述的高效的基于非負矩陣分解的藍牙接收端單聲道上混方法,其特征在于,所述譜系數(shù)的類型包括長窗或過渡窗、短窗。
4.根據(jù)權(quán)利要求3所述的高效的基于非負矩陣分解的藍牙接收端單聲道上混方法,其特征在于,所述根據(jù)所述譜系數(shù)的類型構(gòu)建對應的幅度譜系數(shù)矩陣,包括:
5.根據(jù)權(quán)利要求1所述的高效的基于非負矩陣分解的藍牙接收端單聲道上混方法,其特征在于,還包括:
6.根據(jù)權(quán)利要求1所述的高效的基于非負矩陣分解的藍牙接收端單聲道上混方法,其特征在于,還包括:
7.根據(jù)權(quán)利要求1所述的高效的基于非負矩陣分解的藍牙接收端單聲道上混方法,其特征在于,所述分別對所述主聲源譜系數(shù)和所述環(huán)境聲譜系數(shù)繼續(xù)執(zhí)行解碼過程,包括:
8.一種高效的基于非負矩陣分解的藍牙接收端單聲道上混裝置,其特征在于,包括:
9.一種計算機可讀存儲介質(zhì),其存儲有計算機指令,其中所述計算機指令被操作以執(zhí)行權(quán)利要求1-7任一項所述的高效的基于非負矩陣分解的藍牙接收端單聲道上混方法。
10.一種計算機設(shè)備,其包括處理器和存儲器,所述存儲器存儲有計算機指令,其中所述處理器操作所述計算機指令以執(zhí)行權(quán)利要求1-7任一項所述的高效的基于非負矩陣分解的藍牙接收端單聲道上混方法。