本發(fā)明涉及水下航行器運(yùn)動(dòng)控制,尤其涉及一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法、系統(tǒng)及產(chǎn)品。
背景技術(shù):
1、在船舶的運(yùn)動(dòng)控制中,航向控制是其中非常重要的一個(gè)方面,常用的控制方法有pid控制、bang-bang控制以及非線性控制等,這些方法在特定情況下確實(shí)能夠取得不錯(cuò)的控制效果。但對(duì)于實(shí)際的船舶系統(tǒng)而言,其運(yùn)動(dòng)具有復(fù)雜性,航行環(huán)境的未知因素多且變化大,所以這些傳統(tǒng)方法的實(shí)際控制效果往往欠佳。
2、最優(yōu)控制方法是現(xiàn)代控制理論中的一種具有代表性的方法,相比于在船舶控制中被廣泛使用的傳統(tǒng)控制方法,最優(yōu)控制的實(shí)施更加簡(jiǎn)單,無需人工調(diào)整參數(shù),且控制效果良好。在實(shí)際使用最優(yōu)控制方法時(shí),對(duì)于需要提前確定的兩個(gè)參數(shù)矩陣q和r,常常是根據(jù)經(jīng)驗(yàn)人為選取的。這種人工選取的方法最大的缺點(diǎn)在于參數(shù)矩陣q和r的選擇具有局限性,選取過程過于依賴調(diào)試人員的經(jīng)驗(yàn),不能夠根據(jù)實(shí)際的水下航行器情況和控制效果自適應(yīng)地調(diào)整其數(shù)值。q、r矩陣對(duì)于最優(yōu)控制算法的性能有直接的影響,由于船舶系統(tǒng)結(jié)構(gòu)復(fù)雜且具有不確定性,在參數(shù)固定的情況下往往無法保證方法達(dá)到最優(yōu)的控制效果。因此,如何使得最優(yōu)控制方法中的q矩陣和r矩陣能夠根據(jù)實(shí)際控制效果進(jìn)行自適應(yīng)的尋優(yōu)是非常關(guān)鍵的。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明旨在解決船舶航向最優(yōu)控制過程中參數(shù)選取不準(zhǔn)、控制算法缺少自適應(yīng)能力的問題。為此,本發(fā)明提供一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法、系統(tǒng)及產(chǎn)品,實(shí)現(xiàn)了水下航行器航向的自適應(yīng)最優(yōu)控制,減少了算法實(shí)現(xiàn)過程中的人員參與,提高了算法的可靠性,具有良好的應(yīng)用前景。
2、本發(fā)明提供一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法,采用的技術(shù)方案如下:包括:
3、獲取指令航向角,以及水下航行器的航行速度、實(shí)際航向角和轉(zhuǎn)艏角速度;
4、根據(jù)所述航行速度,選取對(duì)應(yīng)的a系數(shù)矩陣和b系數(shù)矩陣;
5、將所述a系數(shù)矩陣和b系數(shù)矩陣輸入卷積神經(jīng)網(wǎng)絡(luò),計(jì)算得到r矩陣和q矩陣;
6、根據(jù)所述指令航向角、航行速度、實(shí)際航向角、轉(zhuǎn)艏角速度、a系數(shù)矩陣、b系數(shù)矩陣、r矩陣和q矩陣,進(jìn)行最優(yōu)控制調(diào)節(jié),計(jì)算得到舵角信號(hào),根據(jù)所述舵角信號(hào)控制水下航行器的航向。
7、進(jìn)一步的,所述航行速度通過多普勒測(cè)速儀獲得,所述實(shí)際航向角通過磁場(chǎng)強(qiáng)度傳感器獲得,所述轉(zhuǎn)艏角速度通過陀螺儀獲得。
8、進(jìn)一步的,將所述a系數(shù)矩陣和b系數(shù)矩陣輸入卷積神經(jīng)網(wǎng)絡(luò),計(jì)算得到r矩陣和q矩陣的過程為:
9、將所述a系數(shù)矩陣和b系數(shù)矩陣拼接,得到增廣矩陣,
10、將增廣矩陣輸入所述卷積神經(jīng)網(wǎng)絡(luò),得到模型輸出結(jié)果,所述模型輸出結(jié)果為r矩陣和q矩陣的合并形式,
11、根據(jù)所述模型輸出結(jié)果,得到r矩陣和q矩陣。
12、進(jìn)一步的,所述卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為:依次連接的3個(gè)卷積層和1個(gè)全連接層。
13、進(jìn)一步的,3個(gè)所述卷積層分別為第一卷積層、第二卷積層和第三卷積層,所述第一卷積層的卷積核為,所述第二卷積層的卷積核為,所述第三卷積層的卷積核為,3個(gè)所述卷積層后均設(shè)置有relu激活函數(shù),所述全連接層后設(shè)置有prelu激活函數(shù)。
14、進(jìn)一步的,所述卷積神經(jīng)網(wǎng)絡(luò)的損失函數(shù)loss為
15、
16、其中,表示實(shí)際航向角,表示指令航向角。
17、進(jìn)一步的,根據(jù)所述指令航向角、航行速度、實(shí)際航向角、轉(zhuǎn)艏角速度、a系數(shù)矩陣、b系數(shù)矩陣、r矩陣和q矩陣,進(jìn)行最優(yōu)控制調(diào)節(jié),計(jì)算得到舵角信號(hào)的過程為:
18、將所述a系數(shù)矩陣、b系數(shù)矩陣、r矩陣和q矩陣,帶入到riccati方程中,得到
19、,
20、其中,a表示a系數(shù)矩陣,b表示b系數(shù)矩陣,r表示r矩陣,q表示q矩陣,p表示常量矩陣p,
21、解得常量矩陣p,將所述常量矩陣p帶入
22、,
23、解得系數(shù)矩陣k,k=[],將系數(shù)帶入
24、,
25、計(jì)算得到舵角信號(hào),其中,表示航行速度,表示轉(zhuǎn)艏角速度,表示實(shí)際航向角,表示指令航向角。
26、本發(fā)明還提供一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制系統(tǒng),采用的技術(shù)方案如下:包括:數(shù)據(jù)獲取單元、ab系數(shù)矩陣計(jì)算單元、rq矩陣計(jì)算單元和最優(yōu)控制調(diào)節(jié)單元,所述數(shù)據(jù)獲取單元分別與所述ab系數(shù)矩陣計(jì)算單元、最優(yōu)控制調(diào)節(jié)單元連接,所述ab系數(shù)矩陣計(jì)算單元分別與所述rq矩陣計(jì)算單元、最優(yōu)控制調(diào)節(jié)單元連接,所述rq矩陣計(jì)算單元與所述最優(yōu)控制調(diào)節(jié)單元連接,
27、所述數(shù)據(jù)獲取單元,用于獲取指令航向角,以及水下航行器的航行速度、實(shí)際航向角和轉(zhuǎn)艏角速度;
28、所述ab系數(shù)矩陣計(jì)算單元,用于根據(jù)所述航行速度,選取對(duì)應(yīng)的a系數(shù)矩陣和b系數(shù)矩陣;
29、所述rq矩陣計(jì)算單元,用于將所述a系數(shù)矩陣和b系數(shù)矩陣輸入卷積神經(jīng)網(wǎng)絡(luò),計(jì)算得到r矩陣和q矩陣;
30、所述最優(yōu)控制調(diào)節(jié)單元,用于根據(jù)所述指令航向角、航行速度、實(shí)際航向角、轉(zhuǎn)艏角速度、a系數(shù)矩陣、b系數(shù)矩陣、r矩陣和q矩陣,進(jìn)行最優(yōu)控制調(diào)節(jié),計(jì)算得到舵角信號(hào),根據(jù)所述舵角信號(hào)控制水下航行器的航向。
31、本發(fā)明還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法。
32、本發(fā)明實(shí)施例中的上述一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果之一:
33、1.本發(fā)明使用了卷積神經(jīng)網(wǎng)絡(luò),使得最優(yōu)控制方法中的q矩陣和r矩陣能夠根據(jù)水下航行器的航向控制效果進(jìn)行自動(dòng)調(diào)整,不再需要人為預(yù)設(shè),有效解決了船舶航向自動(dòng)控制過程中參數(shù)選取不準(zhǔn)、控制算法缺少自適應(yīng)能力的問題。
34、2.本發(fā)明采用最優(yōu)控制方法能夠減少算法實(shí)現(xiàn)過程中的人員參與,直接解算得到最優(yōu)控制參數(shù),無需在不同試驗(yàn)條件下人工調(diào)整控制參數(shù),避免了因人為的主觀因素所導(dǎo)致的控制效果差的情況。
35、本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
1.一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法,其特征在于,包括:
2.如權(quán)利要求1所述的一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法,其特征在于,所述航行速度通過多普勒測(cè)速儀獲得,所述實(shí)際航向角通過磁場(chǎng)強(qiáng)度傳感器獲得,所述轉(zhuǎn)艏角速度通過陀螺儀獲得。
3.如權(quán)利要求1所述的一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法,其特征在于,將所述a系數(shù)矩陣和b系數(shù)矩陣輸入卷積神經(jīng)網(wǎng)絡(luò),計(jì)算得到r矩陣和q矩陣的過程為:
4.如權(quán)利要求1所述的一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法,其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為:依次連接的3個(gè)卷積層和1個(gè)全連接層。
5.如權(quán)利要求4所述的一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法,其特征在于,3個(gè)所述卷積層分別為第一卷積層、第二卷積層和第三卷積層,所述第一卷積層的卷積核為,所述第二卷積層的卷積核為,所述第三卷積層的卷積核為,3個(gè)所述卷積層后均設(shè)置有relu激活函數(shù),所述全連接層后設(shè)置有prelu激活函數(shù)。
6.如權(quán)利要求4所述的一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法,其特征在于,所述卷積神經(jīng)網(wǎng)絡(luò)的損失函數(shù)loss為
7.如權(quán)利要求1所述的一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法,其特征在于,根據(jù)所述指令航向角、航行速度、實(shí)際航向角、轉(zhuǎn)艏角速度、a系數(shù)矩陣、b系數(shù)矩陣、r矩陣和q矩陣,進(jìn)行最優(yōu)控制調(diào)節(jié),計(jì)算得到舵角信號(hào)的過程為:
8.一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制系統(tǒng),其特征在于,用以執(zhí)行如權(quán)利要求1至7任一項(xiàng)所述的一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法,包括:數(shù)據(jù)獲取單元、ab系數(shù)矩陣計(jì)算單元、rq矩陣計(jì)算單元和最優(yōu)控制調(diào)節(jié)單元,所述數(shù)據(jù)獲取單元分別與所述ab系數(shù)矩陣計(jì)算單元、最優(yōu)控制調(diào)節(jié)單元連接,所述ab系數(shù)矩陣計(jì)算單元分別與所述rq矩陣計(jì)算單元、最優(yōu)控制調(diào)節(jié)單元連接,所述rq矩陣計(jì)算單元與所述最優(yōu)控制調(diào)節(jié)單元連接,
9.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至8中任一項(xiàng)所述的一種參數(shù)自適應(yīng)的水下航行器航向最優(yōu)控制方法。