1.一種基于深度強化學習的低軌巨型星座衛(wèi)星切換方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于深度強化學習的低軌巨型星座衛(wèi)星切換方法,其特征在于,用戶終端與衛(wèi)星之間的可用信道容量利用以下公式計算:
3.根據(jù)權(quán)利要求2所述的基于深度強化學習的低軌巨型星座衛(wèi)星切換方法,其特征在于,信干噪比γm,n(t)利用以下公式計算:
4.根據(jù)權(quán)利要求3所述的基于深度強化學習的低軌巨型星座衛(wèi)星切換方法,其特征在于,信道增益gm,n(t)利用以下公式計算:
5.根據(jù)權(quán)利要求4所述的基于深度強化學習的低軌巨型星座衛(wèi)星切換方法,其特征在于,用戶終端與衛(wèi)星之間的剩余服務(wù)時間利用以下公式計算:
6.根據(jù)權(quán)利要求5所述的基于深度強化學習的低軌巨型星座衛(wèi)星切換方法,其特征在于,衛(wèi)星到設(shè)定網(wǎng)關(guān)衛(wèi)星之間的最小跳數(shù)利用以下方式計算:
7.根據(jù)權(quán)利要求6所述的基于深度強化學習的低軌巨型星座衛(wèi)星切換方法,其特征在于,所述效用函數(shù)表示為:
8.根據(jù)權(quán)利要求7所述的基于深度強化學習的低軌巨型星座衛(wèi)星切換方法,其特征在于,所述第一神經(jīng)網(wǎng)絡(luò)模型通過以下方式訓練:
9.根據(jù)權(quán)利要求1所述的基于深度強化學習的低軌巨型星座衛(wèi)星切換方法,其特征在于,所述選取最大的狀態(tài)-動作價值函數(shù)對應的衛(wèi)星作為接入衛(wèi)星進行切換,進一步包括:
10.一種基于深度強化學習的低軌巨型星座衛(wèi)星切換裝置,其特征在于,包括: