本發(fā)明涉及圖像處理,尤其涉及一種基于mg-shufflenet網(wǎng)絡(luò)結(jié)構(gòu)的冬捕魚分類識別方法。
背景技術(shù):
1、在冬捕魚自動化分類領(lǐng)域,由于不同種類的冬捕魚體形大小、顏色紋理等特征相似,難以直接進行區(qū)分和分揀,目前尚未有基于圖像識別的冬捕魚種分類識別方法。這給冬捕魚分類識別帶來了極大的挑戰(zhàn),也限制了冬捕魚自動化分揀系統(tǒng)的發(fā)展。在檢測過程中容易出現(xiàn)誤識和漏識的現(xiàn)象,進一步影響了分類識別的準確率和效率。因此,在冬捕魚自動化分類領(lǐng)域,需要借助先進的深度學習技術(shù)和有效的分類識別算法,來提高分類識別的精準度和效率,推進冬捕魚分類識別與分揀系統(tǒng)的發(fā)展進程。
2、基于深度學習的冬捕魚分類識別方法是一項新興的視覺檢測任務(wù),其目的是精確且高效地對不同種類的冬捕魚進行分類識別。尤其在漁業(yè)生產(chǎn)領(lǐng)域,不同種類的冬捕魚形態(tài)特征相似,難以直接進行區(qū)分,為了提高捕撈過程的效率和精準度,也需要對不同種類的冬捕魚進行分類識別。因此,快速、輕量化和高識別準確率的深度學習識別方法更適合用于冬捕魚分類識別任務(wù),可以提高分類識別的性能和效率。該方法能夠?qū)Σ煌N類的冬捕魚進行準確分類識別,具有較高的識別準確率和較快的識別速度。因此,這種基于快速、輕量化和高識別準確率的深度學習識別方法在漁業(yè)生產(chǎn)自動化領(lǐng)域具有廣泛的應(yīng)用和發(fā)展前景。
3、然而,將深度學習技術(shù)應(yīng)用在冬捕魚自動化分類領(lǐng)域中,也存在一些挑戰(zhàn)。主要面臨的挑戰(zhàn)如下:(1)冬捕魚活動的環(huán)境背景通常非常復(fù)雜,可能存在許多干擾物件或冰血跡等,且這些物件與目標冬捕魚的紋理相似,導(dǎo)致模型難以準確識別目標。(2)冬捕魚的不同種類之間體形大小、顏色、紋理等特征非常相似,且在不同的時間和環(huán)境下也可能發(fā)生形態(tài)變化,這都給其自動化分類識別帶來了挑戰(zhàn),導(dǎo)致模型無法準確區(qū)分不同的冬捕魚目標。(3)現(xiàn)有的冬捕魚分類識別模型通常都非常龐大,因為它們基于深度學習模型來構(gòu)建,需要使用大量的訓(xùn)練集和計算資源進行訓(xùn)練,導(dǎo)致它們的參數(shù)量和運算量都很高,難以滿足實際應(yīng)用的實時性需求和實際邊緣設(shè)備的部署。
技術(shù)實現(xiàn)思路
1、本發(fā)明解決上述技術(shù)問題的技術(shù)方案是,提供一種基于mg-shufflenet網(wǎng)絡(luò)結(jié)構(gòu)的冬捕魚分類識別方法,包括以下步驟:
2、采集圖像數(shù)據(jù)集,并對圖像數(shù)據(jù)集進行處理,劃分為訓(xùn)練集和驗證集;
3、構(gòu)建包括mdfa模塊和gcsa注意力機制模塊的網(wǎng)絡(luò)模型:
4、將訓(xùn)練集通過一個3x3的卷積層,捕獲圖像的局部特征;
5、采用平均池化層對卷積后的特征圖進行下采樣;
6、在模塊stage2中,下采樣單元和基本單元各堆疊一次;
7、在模塊stage3中,下采樣單元堆疊一次,基本單元堆疊三次,用于增強特征的學習能力;
8、在模塊stage4中,下采樣單元和基本單元各堆疊一次;
9、通過一個1x1的卷積層,用于跨通道的特征融合和降維;
10、全局池化層將特征圖的空間維度縮減至一個單一值,用于捕捉整個特征圖的全局信息;
11、全連接層接收來自全局池化層的特征向量,并輸出一個預(yù)測值;
12、其中,3x3的卷積層和1x1的卷積層分別引入了mish激活函數(shù)。
13、進一步地,所述下采樣單元和所述基本單元都包括mdfa模塊,所述mdfa模塊包括:
14、第一分支,采用1x1卷積核,用于直接提取特征;
15、第二分支,采用3x3卷積核,空洞率為6,用于擴大感受野;
16、第三分支,采用3x3卷積核,空洞率為12,用于進一步擴大感受野以捕獲更廣泛的上下文信息;
17、第四分支,采用3x3卷積核,空洞率為18,提供最廣的感受野;
18、第五分支,采用全局平均池化,用于提取全局上下文特征,增強模型對整體布局的理解能力;
19、將第一分支、第二分支、第三分支、第四分支及第五分支在通道維度上進行拼接,合成為一個綜合特征圖;
20、將綜合特征圖并行經(jīng)過通道注意力機制和空間注意力機制校準;
21、通道注意力和空間注意力機制的輸出特征圖通過元素加法操作進行融合,得到增強后的特征圖;
22、增強后的特征圖通過一個1x1卷積層進行降維和整合,生成輸出特征圖。
23、進一步地,所述下采樣單元和所述基本單元都包括gcsa模塊,所述gcsa模塊包括:
24、輸入的特征圖首先進行維度置換,從c×h×w?變換到?w×h×c;
25、通過兩層的多層感知器mlp對通道間依賴關(guān)系進行捕捉;第一層mlp將通道數(shù)縮減為原來的1/4倍,隨后通過relu激活函數(shù)引入非線性,再通過第二層mlp將通道數(shù)恢復(fù)到原始維度;進行逆置換恢復(fù)到c×h×w,并通過sigmoid激活函數(shù)生成通道注意力圖;輸入特征圖和通道注意力圖逐元素相乘,得到增強的特征圖;
26、將增強后的特征圖分成4組,每組包含c/4個通道;對分組后的特征圖進行轉(zhuǎn)置操作,用于打亂各組內(nèi)的通道順序;將打亂后的特征圖恢復(fù)為原始形狀?(?c×h×w?);
27、在空間注意力子模塊中,輸入特征圖經(jīng)過一個7x7卷積層,通道數(shù)縮減為原來的1/4倍;經(jīng)過批歸一化和relu激活函數(shù)進行非線性變換;通過第二個7x7卷積層將通道數(shù)恢復(fù)到原始維度?c?,再經(jīng)過批歸一化層;通過sigmoid激活函數(shù)生成空間注意力圖;洗牌后的特征圖和空間注意力圖逐元素相乘,得到輸出特征圖。
28、與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點如下:
29、(1)mg-shufflenet通過集成mdfa和gcsa的優(yōu)點,以及簡化后的shufflenet?v2架構(gòu),實現(xiàn)了高準確性和輕量級的完美平衡。mdfa提高模型對圖像中各種多尺度特征的適應(yīng)能力,同時gcsa模塊通過通道注意力和空間注意力機制的結(jié)合保持了特征的豐富性和準確性。相較于傳統(tǒng)的shufflenet及其他網(wǎng)絡(luò),mg-shufflenet在圖像分類和對象檢測任務(wù)中顯著提高了效率,適用于邊緣設(shè)備部署和實時性要求。
30、(2)東北地區(qū)冬季氣溫低,打撈上來的冬捕魚往往會覆蓋冰塊和血漬等因素,使得冬捕魚識別難度大,識別準確率低。為了克服這樣的問題,采用mish激活函數(shù)來替代傳統(tǒng)的relu激活函數(shù)可以進一步提高模型的識別精度。相比relu激活函數(shù),mish激活函數(shù)在較大輸入范圍內(nèi)更為平滑,可以在訓(xùn)練過程中避免出現(xiàn)漸變爆炸和梯度消失問題,提高模型的穩(wěn)定性和魯棒性。此外,mish激活函數(shù)的非線性特性可以更好地處理復(fù)雜的數(shù)據(jù),提供更準確的激活響應(yīng),從而提高模型的識別精度。采用mish激活函數(shù)可以幫助模型更精確地識別出東北地區(qū)復(fù)雜環(huán)境下打撈上來的冬捕魚,包括被血漬和冰塊覆蓋的捕撈物,可以進一步提高模型的識別精度,幫助提高東北地區(qū)冬捕魚養(yǎng)殖產(chǎn)業(yè)的效益。
31、(3)為了保證冬捕魚分揀環(huán)境中模型實際應(yīng)用的魯棒性,mg-shufflenet模型針對池化層和過擬合問題進行了改進。在池化層方面,使用平均池化(avgpooling)替換了最大池化(maxpooling),這可以減少信息的丟失和不均衡,同時也能提高模型的穩(wěn)健性和泛化能力。此外,在防止過擬合問題上,引入了l2正則化,避免模型在訓(xùn)練過程中出現(xiàn)過擬合現(xiàn)象。l2正則化可以通過增加模型懲罰項來限制參數(shù)的值,從而減少模型的復(fù)雜度,提高魯棒性和泛化能力。