本發(fā)明設(shè)計(jì)深度學(xué)習(xí)的目標(biāo)檢測與識別,具體提供一種基于擴(kuò)散模型的遙感圖像艦船目標(biāo)檢測與識別方法。
背景技術(shù):
1、隨著遙感衛(wèi)星技術(shù)的飛速發(fā)展,遙感圖像艦船目標(biāo)檢測與識別是當(dāng)前遙感領(lǐng)域的研究熱點(diǎn),無論是在民用方面還是軍事方面都有十分重要的意義。在民用方面,它可以通過實(shí)時(shí)監(jiān)測各類艦船的位置和運(yùn)行狀況,有效監(jiān)管海上航行秩序,對潛在風(fēng)險(xiǎn)預(yù)警,從而可以預(yù)防海上交通事故的發(fā)生,保障海員和貨物的安全。它也可以通過監(jiān)測漁船的位置和捕撈情況,如捕撈量和區(qū)域,了解漁場動態(tài)變化,有效監(jiān)督和引導(dǎo)漁船捕撈行為,實(shí)現(xiàn)漁業(yè)資源的可持續(xù)利用和有效管理。在軍事方面,它可以通過監(jiān)測本國及鄰國艦船動向,可以提高海上警戒水平,監(jiān)督海域安全;利用監(jiān)測技術(shù)預(yù)警可能的海上入侵行為,保障國家海上重要設(shè)施和領(lǐng)海主權(quán)。它還可以為軍事行動提供重要的情報(bào)支持,并在海上搜救等應(yīng)急工作中發(fā)揮重要作用。
2、近年來,深度學(xué)習(xí)在圖像識別和目標(biāo)檢測等領(lǐng)域取得突破性進(jìn)展。將其技術(shù)引入遙感監(jiān)測數(shù)據(jù)處理,可通過以下幾方面改善現(xiàn)有問題:首先,利用大量標(biāo)注數(shù)據(jù)訓(xùn)練深度學(xué)習(xí)模型,可以提高對小目標(biāo)和特定目標(biāo)的識別精度,彌補(bǔ)傳統(tǒng)遙感由于分辨率限制難以實(shí)現(xiàn)高清監(jiān)測的不足。其次,基于深度學(xué)習(xí)的多源數(shù)據(jù)融合的方法可以有效降低天氣影響等因素對圖像質(zhì)量的影響,提升監(jiān)測系統(tǒng)的魯棒性。深度學(xué)習(xí)在大數(shù)據(jù)處理上的優(yōu)勢也有望提升遙感監(jiān)測系統(tǒng)的實(shí)時(shí)反應(yīng)能力。同時(shí),通過深度學(xué)習(xí)優(yōu)化數(shù)據(jù)處理流程,在一定程度上可以降低監(jiān)測成本。
3、目前,遙感圖像艦船目標(biāo)檢測技術(shù)主要分為以下四類:
4、1、基于模板匹配的方法;
5、2、基于視覺顯著性的方法;
6、3、基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法;
7、4、基于深度學(xué)習(xí)的方法。
8、基于模板匹配的方法,模板匹配的方法一般依據(jù)艦船目標(biāo)形狀輪廓等特征信息構(gòu)建艦船先驗(yàn)?zāi)0鍘欤罄没瑒哟翱诘炔呗员闅v圖像進(jìn)行區(qū)域匹配以定位艦船目標(biāo)區(qū)域。由于使用了先驗(yàn)?zāi)0?,在圖像區(qū)域搜索策略上也使用效率較低的遍歷策略,故存在檢測效率低、檢測艦船目標(biāo)和背景不靈活等問題。
9、基于視覺顯著性的方法,視覺顯著性主要利用感興趣物體與周圍背景在亮度,顏色,紋理等方面的差異,達(dá)到快速篩選疑似目標(biāo)區(qū)域的目的。該步驟能夠過濾掉大部分海面區(qū)域,快速粗定位到艦船目標(biāo),增加檢測模型的效率。當(dāng)前引入的視覺顯著性模型都是基于自然圖像設(shè)計(jì)的,顯著圖分辨率低,目標(biāo)邊緣模糊。此外視覺顯著性只能篩選出疑似目標(biāo)區(qū)域,還需要額外設(shè)計(jì)目標(biāo)鑒別過程進(jìn)一步剔除虛警。
10、基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法,傳統(tǒng)機(jī)器學(xué)習(xí)的艦船目標(biāo)檢測方法借鑒通用目標(biāo)檢測思路,使用滑動窗口在測試圖像滑動,然后提取手工設(shè)計(jì)特征,輸入到訓(xùn)練好的分類器輸出該滑動窗口是否包含目標(biāo)。盡管基于機(jī)器學(xué)習(xí)的方法在區(qū)分目標(biāo)和背景時(shí)能力較強(qiáng),但基于滑動窗口的窮舉搜索有幾個缺點(diǎn)。首先,由于艦船目標(biāo)的尺寸,長寬比不確定,需要采用多尺度多長寬比窗口來增加檢測準(zhǔn)確性,導(dǎo)致測試窗口數(shù)量龐大,模型相對耗時(shí)。其次,在大幅光學(xué)遙感圖像中,艦船目標(biāo)占比較小,只有少部分窗口包含真實(shí)目標(biāo),導(dǎo)致檢測效率低。
11、基于深度學(xué)習(xí)的方法,相比于傳統(tǒng)艦船檢測與識別方法,基于深度學(xué)習(xí)的艦船目標(biāo)檢測更適應(yīng)于復(fù)雜場景下的目標(biāo)檢測和識別。深度學(xué)習(xí)模型可以通過大量樣本數(shù)據(jù)的訓(xùn)練,對目標(biāo)有更好的特征提取能力和更強(qiáng)的泛化能力,并且模型的可維護(hù)性好,當(dāng)后續(xù)樣本持續(xù)積累后,通過對模型重新訓(xùn)練,而無需重新設(shè)計(jì)模型,可實(shí)現(xiàn)檢測和識別效率的提升。然而,基于深度學(xué)習(xí)方法需要大量的訓(xùn)練數(shù)據(jù)和復(fù)雜的訓(xùn)練階段,依賴于圖形處理單元(gpu)和并行操作。
12、目前獲取的遙感艦船圖像存在以下特點(diǎn):
13、在大范圍遙感圖像中,艦船目標(biāo)通常只占很小一部分,冗余、復(fù)雜的背景環(huán)境干擾給艦船目標(biāo)檢測帶來了巨大挑戰(zhàn),并且不同類型的艦船之間尺度差距較大,近岸海域存在艦船密集排列的問題。
14、由于可見光遙感影像具有廣泛的覆蓋范圍、復(fù)雜的背景和垂直的視角等特點(diǎn)導(dǎo)致艦船目標(biāo)面臨復(fù)雜的背景環(huán)境干擾以及目標(biāo)尺度大小不一的問題,在此條件下能夠快速且準(zhǔn)確地檢測出艦船目標(biāo)成為當(dāng)前急需解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、針對現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于擴(kuò)散模型遙感圖像艦船目標(biāo)檢測與識別方法,解決上述背景技術(shù)中所提出的問題。
2、本發(fā)明為了實(shí)現(xiàn)上述目的具體采用以下技術(shù)方案:
3、一種基于擴(kuò)散模型的遙感圖像艦船目標(biāo)檢測與識別方法,包括如下步驟:
4、s1:運(yùn)行環(huán)境平臺與數(shù)據(jù)集格式;mmdetection框架下基于python版diffusiondet網(wǎng)絡(luò)結(jié)構(gòu),使用的數(shù)據(jù)集格式為coco格式的hrsc2016;
5、s2:將帶有真值框的原始遙感圖像作為輸入,從標(biāo)準(zhǔn)高斯分布的噪聲采樣,將其加入到輸入圖像中,得到一張符合高斯分布的噪聲圖片;
6、s3:將帶有真值框的原始遙感圖像輸入到主干網(wǎng)絡(luò)中提取特征;
7、s4:利用具有通道混合的特征金字塔網(wǎng)絡(luò)cf-fpn對特征圖進(jìn)行多尺度特征融合;
8、s5:檢測解碼器將一組建議框和加高斯噪聲后的真值框作為輸入,從圖像編碼器生成的特征圖中裁剪感興趣區(qū)域;
9、s6:將統(tǒng)一大小的矩形框經(jīng)過全連接層,得到固定大小的特征向量;
10、s7:利用級聯(lián)思想對輸出的矩形框調(diào)整大小,得到調(diào)整后矩形框的坐標(biāo);
11、s8:最后通過兩個全連接層來預(yù)測艦船目標(biāo)的類別和坐標(biāo),得到邊界框的回歸和分類結(jié)果。
12、進(jìn)一步地,所述s4中具有通道混合的特征金字塔網(wǎng)絡(luò)cf-fpn對特征圖進(jìn)行多尺度特征融合的具體過程為:首先利用主干網(wǎng)絡(luò)所提取的{m2,m3,m4,m7}階段的特征圖作為輸入,對這些特征圖進(jìn)行1×1卷積,將不同分辨率的特征圖進(jìn)行上采樣并與之前的特征圖融合,然后進(jìn)行3×3卷積,之后通過由全局平均池化、1×1卷積、組歸一化、relu激活函數(shù)和1×1卷積組成的g模塊對輸入特征圖實(shí)現(xiàn)不同通道之間的信息交互,并與通過3×3卷積后的特征圖進(jìn)行融合,最后對這四個階段的特征圖進(jìn)行自底向上的特征融合得到特征圖f5。將整個特征融合部分放在一起組裝成一個模塊,以模塊為單位去組裝整個網(wǎng)絡(luò)結(jié)構(gòu)。
13、進(jìn)一步地,所述s4中的g模塊能夠充分提高不同通道之間的信息交互能力,并在網(wǎng)絡(luò)中引入自底向上的結(jié)構(gòu),充分融合不同尺度艦船目標(biāo)特征。
14、進(jìn)一步地,所述s1中硬件平臺為ubuntu?20.04.3系統(tǒng)(gnu/linux?5.13.0-44-generic?x86_64)和nvidia?geforce?rtx?3090高性能顯卡的計(jì)算機(jī)。
15、本發(fā)明在diffusiondet的基礎(chǔ)上設(shè)計(jì),通過對其圖像編碼器部分進(jìn)行改進(jìn),引入具有通道混合的特征金字塔網(wǎng)絡(luò)cf-fpn對特征圖進(jìn)行多尺度特征融合,實(shí)現(xiàn)對圖像編碼器部分的結(jié)構(gòu)改進(jìn),從而可以有效提高遙感圖像艦船目標(biāo)的檢測與識別精度,可以將均值平均精度值(map0.5)提升5.8個百分點(diǎn),將最大平均精度(apmax)和最小平均精度(apmin)分別提升4.4個百分點(diǎn)和8.8個百分點(diǎn)。