技術(shù)特征:1.一種基于深度強(qiáng)化學(xué)習(xí)與時(shí)間約束的低空航空器沖突解脫方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的基于深度強(qiáng)化學(xué)習(xí)與時(shí)間約束的低空航空器沖突解脫方法,其特征在于,所述s2包括如下步驟:
3.根據(jù)權(quán)利要求2所述的基于深度強(qiáng)化學(xué)習(xí)與時(shí)間約束的低空航空器沖突解脫方法,其特征在于,所述s3包括如下步驟:
4.根據(jù)權(quán)利要求3所述的基于深度強(qiáng)化學(xué)習(xí)與時(shí)間約束的低空航空器沖突解脫方法,其特征在于,所述s4包括如下步驟:
5.根據(jù)權(quán)利要求4所述的基于深度強(qiáng)化學(xué)習(xí)與時(shí)間約束的低空航空器沖突解脫方法,其特征在于,所述s45包括如下步驟:
6.根據(jù)權(quán)利要求5所述的基于深度強(qiáng)化學(xué)習(xí)與時(shí)間約束的低空航空器沖突解脫方法,其特征在于,所述運(yùn)行數(shù)據(jù)包括當(dāng)前時(shí)刻下本體無(wú)人機(jī)的動(dòng)作、狀態(tài)、對(duì)應(yīng)的獎(jiǎng)勵(lì)值和下一時(shí)刻本體無(wú)人機(jī)的狀態(tài),其中,智能體根據(jù)當(dāng)前時(shí)刻的狀態(tài)和動(dòng)作,在執(zhí)行完成當(dāng)前時(shí)刻的動(dòng)作后,得到當(dāng)前時(shí)刻對(duì)應(yīng)的獎(jiǎng)勵(lì)值和下一時(shí)刻智能體的狀態(tài)。
技術(shù)總結(jié)本發(fā)明公開(kāi)了一種基于深度強(qiáng)化學(xué)習(xí)與時(shí)間約束的低空航空器沖突解脫方法,屬于航空安全技術(shù)領(lǐng)域,包括如下步驟:設(shè)置靜態(tài)障礙物和非合作目標(biāo)航空器,以構(gòu)建低空運(yùn)行環(huán)境;構(gòu)建低空運(yùn)行環(huán)境中航空器的狀態(tài)空間和動(dòng)作空間;構(gòu)建帶有時(shí)間約束的獎(jiǎng)勵(lì)函數(shù);根據(jù)帶有時(shí)間約束的獎(jiǎng)勵(lì)函數(shù)、低空運(yùn)行環(huán)境中航空器的狀態(tài)空間和動(dòng)作空間,基于深度強(qiáng)化學(xué)習(xí)模型在低空運(yùn)行環(huán)境中進(jìn)行低空航空器沖突解脫訓(xùn)練,得到訓(xùn)練好深度強(qiáng)化學(xué)習(xí)模型;獲取本體航空器在執(zhí)行實(shí)際沖突解脫任務(wù)中的當(dāng)前狀態(tài),并利用訓(xùn)練好的深度強(qiáng)化學(xué)習(xí)模型輸出獎(jiǎng)勵(lì)值最高時(shí)對(duì)應(yīng)的動(dòng)作,以避免沖突的同時(shí)及時(shí)達(dá)到目標(biāo)位置。本發(fā)明解決了低空航空器的沖突解脫能力和準(zhǔn)點(diǎn)率不足的問(wèn)題。
技術(shù)研發(fā)人員:張志遠(yuǎn),鄭遠(yuǎn),李誠(chéng)龍,顧文勇,胡瀟瀚,劉旭川,肖海濱
受保護(hù)的技術(shù)使用者:中國(guó)民用航空飛行學(xué)院
技術(shù)研發(fā)日:技術(shù)公布日:2024/12/19