本申請涉及衛(wèi)星通信領(lǐng)域,具體而言,涉及一種衛(wèi)星通信語音的壓縮方法、裝置及計算機設(shè)備。
背景技術(shù):
1、目前已經(jīng)存在的衛(wèi)星通信語音壓縮算法,為保證降低語音傳輸所需的帶寬,對衛(wèi)星通信待傳輸?shù)恼Z音的壓縮均需要犧牲語音質(zhì)量,如果想要保證較高的語音質(zhì)量,均需要占用更多的帶寬資源。
技術(shù)實現(xiàn)思路
1、本申請實施例提供了一種衛(wèi)星通信語音的壓縮方法、裝置及計算機設(shè)備,以至少解決相關(guān)技術(shù)中由于為了保證語音質(zhì)量占用過多帶寬資源導致帶寬資源利用率降低的技術(shù)問題。
2、根據(jù)本申請實施例的一個方面,提供了一種衛(wèi)星通信語音的壓縮方法,包括:按照預設(shè)采樣頻率對語音信號進行采樣,獲取樣本語音數(shù)據(jù),其中,所述預設(shè)采樣頻率根據(jù)傳輸所述語音信號的信道狀態(tài)確定;采用目標神經(jīng)網(wǎng)絡模型對待壓縮語音數(shù)據(jù)進行壓縮處理,得到目標語音數(shù)據(jù),其中,所述目標神經(jīng)網(wǎng)絡模型為通過以下方式訓練得到的:將樣本語音數(shù)據(jù)和對所述樣本語音數(shù)據(jù)采樣時的信道狀態(tài)作為輸入,將采用壓縮算法對所述樣本語音數(shù)據(jù)進行壓縮后得到的壓縮語音數(shù)據(jù)作為輸出,對所述目標神經(jīng)網(wǎng)絡模型進行訓練。
3、可選地,按照預設(shè)采樣頻率對語音信號進行采樣,獲取樣本語音數(shù)據(jù),包括:獲取傳輸所述語音信號的信道狀態(tài),所述信道狀態(tài)包括:信道的帶寬和信噪比;根據(jù)所述信道的帶寬和所述信噪比確定傳輸所述語音信號的信道狀態(tài);在所述信道狀態(tài)滿足預設(shè)條件的情況下,采用第一預設(shè)頻率對所述語音信號進行采樣,在所述信道狀態(tài)不滿足預設(shè)條件的情況下,采用第二預設(shè)頻率對所述語音信號進行采樣,所述第一預設(shè)頻率高于所述第二預設(shè)頻率。
4、可選地,采用壓縮算法對所述樣本語音數(shù)據(jù)進行壓縮,包括:將所述樣本語音數(shù)據(jù)進行預加重處理;將預加重處理后的所述樣本語音數(shù)據(jù)分成多個固定長度的幀,其中,所述目標神經(jīng)網(wǎng)絡模型所需迭代的次數(shù)與每個固定長度的幀中包含的語音數(shù)據(jù)樣本數(shù)量相等;將所述多個固定長度的幀進行壓縮,得到所述壓縮語音數(shù)據(jù)。
5、可選地,所述目標神經(jīng)網(wǎng)絡通過以下方式得到,包括:將所述樣本語音數(shù)據(jù)和對所述樣本語音數(shù)據(jù)采樣時的信道狀態(tài)以及所述壓縮語音數(shù)據(jù)確定為訓練數(shù)據(jù)集,并從所述訓練數(shù)據(jù)集中隨機選擇部分數(shù)據(jù)對初始神經(jīng)網(wǎng)絡模型進行預訓練,得到初始模型參數(shù);按照所述初始模型參數(shù)對所述初始神經(jīng)網(wǎng)絡模型進行設(shè)置后,將所述樣本語音數(shù)據(jù)對應的多個固定長度的幀分別輸入所述初始神經(jīng)網(wǎng)絡模型,進行前向傳播,得到模型輸出值;根據(jù)所述模型輸出值與所述壓縮語音數(shù)據(jù)的對比,確定損失函數(shù)值,并根據(jù)所述損失函數(shù)值對所述初始神經(jīng)網(wǎng)絡模型的模型參數(shù)進行調(diào)整,直到損失函數(shù)收斂,得到所述目標神經(jīng)網(wǎng)絡模型。
6、可選地,根據(jù)所述損失函數(shù)值對所述初始神經(jīng)網(wǎng)絡模型的模型參數(shù)進行調(diào)整,包括:獲取所述初始神經(jīng)網(wǎng)絡模型中每個模型參數(shù)對所述損失函數(shù)的梯度;根據(jù)所述每個模型參數(shù)對所述損失函數(shù)的梯度完成對所述每個模型參數(shù)的更新。
7、可選地,將所述樣本語音數(shù)據(jù)進行預加重處理,包括:獲取所述樣本語音數(shù)據(jù)中每個時間點的語音信號;分別對所述每個時間點的語音信號進行一階高通濾波,完成所述預加重處理。
8、可選地,所述方法還包括:在通信衛(wèi)星中部署初始神經(jīng)網(wǎng)絡模型;將所述目標神經(jīng)網(wǎng)絡模型對應的模型參數(shù)下發(fā)至所述通信衛(wèi)星中,以根據(jù)所述模型參數(shù)對所述初始神經(jīng)網(wǎng)絡模型進行調(diào)整,得到所述目標神經(jīng)網(wǎng)絡模型;接收所述通信衛(wèi)星采用所述目標神經(jīng)網(wǎng)絡模型對所述待壓縮語音數(shù)據(jù)的壓縮結(jié)果,并根據(jù)所述壓縮結(jié)果對所述目標神經(jīng)網(wǎng)絡模型進行更新。
9、根據(jù)本申請實施例的另一方面,還提供了一種衛(wèi)星通信語音的壓縮裝置,包括:獲取模塊,用于按照預設(shè)采樣頻率對語音信號進行采樣,獲取樣本語音數(shù)據(jù),其中,所述預設(shè)采樣頻率根據(jù)傳輸所述語音信號的信道狀態(tài)確定;壓縮模塊,用于采用目標神經(jīng)網(wǎng)絡模型對待壓縮語音數(shù)據(jù)進行壓縮處理,得到目標語音數(shù)據(jù),其中,所述目標神經(jīng)網(wǎng)絡模型為通過以下方式訓練得到的:將樣本語音數(shù)據(jù)和對所述樣本語音數(shù)據(jù)采樣時的信道狀態(tài)作為輸入,將采用壓縮算法對所述樣本語音數(shù)據(jù)進行壓縮后得到的壓縮語音數(shù)據(jù)作為輸出,對所述目標神經(jīng)網(wǎng)絡模型進行訓練。
10、根據(jù)本申請實施例的又一方面,還提供了一種計算機設(shè)備,包括:存儲器和處理器,其中,存儲器用于存儲程序指令;處理器,與存儲器連接,用于執(zhí)行上述衛(wèi)星通信語音的壓縮方法。
11、根據(jù)本申請實施例的再一方面,還提供了一種非易失性存儲介質(zhì),該非易失性存儲介質(zhì)包括存儲的計算機程序,其中,該非易失性存儲介質(zhì)所在設(shè)備通過運行計算機程序執(zhí)行上述衛(wèi)星通信語音的壓縮方法。
12、根據(jù)本申請實施例的再一方面,還提供了一種計算機程序產(chǎn)品,包括計算機指令,該計算機指令被處理器執(zhí)行時實現(xiàn)上述衛(wèi)星通信語音的壓縮方法。
13、在本申請實施例中,通過按照預設(shè)采樣頻率對語音信號進行采樣,獲取樣本語音數(shù)據(jù),其中,所述預設(shè)采樣頻率根據(jù)傳輸所述語音信號的信道狀態(tài)確定;采用目標神經(jīng)網(wǎng)絡模型對待壓縮語音數(shù)據(jù)進行壓縮處理,得到目標語音數(shù)據(jù),其中,所述目標神經(jīng)網(wǎng)絡模型為通過以下方式訓練得到的:將樣本語音數(shù)據(jù)和對所述樣本語音數(shù)據(jù)采樣時的信道狀態(tài)作為輸入,將采用壓縮算法對所述樣本語音數(shù)據(jù)進行壓縮后得到的壓縮語音數(shù)據(jù)作為輸出,對所述目標神經(jīng)網(wǎng)絡模型進行訓練,達到了采用神經(jīng)網(wǎng)絡模型對語音數(shù)據(jù)進行壓縮,進而在提高壓縮率的情況下保證語音質(zhì)量的目的,從而實現(xiàn)了提升語音傳輸過程中帶寬利用率的技術(shù)效果,進而解決了相關(guān)技術(shù)中由于為了保證語音質(zhì)量占用過多帶寬資源導致帶寬資源利用率降低的技術(shù)問題。
1.一種衛(wèi)星通信語音的壓縮方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,按照預設(shè)采樣頻率對語音信號進行采樣,獲取樣本語音數(shù)據(jù),包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,采用壓縮算法對所述樣本語音數(shù)據(jù)進行壓縮,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述目標神經(jīng)網(wǎng)絡通過以下方式得到,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)所述損失函數(shù)值對所述初始神經(jīng)網(wǎng)絡模型的模型參數(shù)進行調(diào)整,包括:
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,將所述樣本語音數(shù)據(jù)進行預加重處理,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
8.一種衛(wèi)星通信語音的壓縮裝置,其特征在于,包括:
9.一種計算機設(shè)備,其特征在于,包括:存儲器和處理器,其中,所述存儲器用于存儲程序指令;所述處理器,與所述存儲器連接,用于執(zhí)行權(quán)利要求1至7中任意一項所述的衛(wèi)星通信語音的壓縮方法。
10.一種計算機程序產(chǎn)品,包括計算機指令,其特征在于,所述計算機指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至7中任意一項所述的衛(wèi)星通信語音的壓縮方法。