本發(fā)明涉及圖像檢測(cè),具體來說是一種基于改進(jìn)的yolov8s的人體安檢違禁品檢測(cè)模型、方法及系統(tǒng)。
背景技術(shù):
1、傳統(tǒng)的人體安檢違禁品檢測(cè)方法是通過金屬安檢門和人工搜身相結(jié)合來檢測(cè)違禁品。金屬安檢門主要用于檢測(cè)金屬物品,但對(duì)陶瓷、玻璃、塑料等非金屬物質(zhì),以及易燃易爆品和腐蝕性液體則無能為力。安檢人員在金屬安檢門后使用手持式金屬探測(cè)器進(jìn)一步檢查,同時(shí)對(duì)非金屬物品進(jìn)行手工檢查。這種檢測(cè)手段不僅耗時(shí)耗力,可能侵犯?jìng)€(gè)人隱私,還存在人為因素的誤判和疏忽。隨著技術(shù)的發(fā)展,可以使用毫米波安檢門進(jìn)行違禁品的檢測(cè),使用基于深度學(xué)習(xí)的檢測(cè)算法對(duì)通過毫米波成像的圖像進(jìn)行違禁品的識(shí)別檢測(cè),既可以快速完成違禁品的檢測(cè)過程,適應(yīng)快節(jié)奏的安檢需求又有效提高了違禁品檢測(cè)的準(zhǔn)確性。但圖像識(shí)別技術(shù)存在以下技術(shù)問題:在安檢場(chǎng)景中,需要快速完成違禁品的檢測(cè),一些深度學(xué)習(xí)模型雖然檢測(cè)準(zhǔn)確,但參數(shù)量、計(jì)算量和模型體積太大,難以部署在一些受限的邊緣設(shè)備上,所以對(duì)模型的輕量化處理就顯得尤為必要。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明所要解決的技術(shù)問題在于如何構(gòu)建輕量化的人體安檢違禁品檢測(cè)網(wǎng)絡(luò)。
2、本發(fā)明通過以下技術(shù)手段實(shí)現(xiàn)解決上述技術(shù)問題的:
3、基于改進(jìn)的yolov8s的人體安檢違禁品檢測(cè)模型,包括主干網(wǎng)絡(luò)、頸部網(wǎng)絡(luò);
4、所述主干網(wǎng)絡(luò)使用重參數(shù)化后的hgnetv2,在所述頸部網(wǎng)絡(luò)中利用ghostdynamicconv模塊進(jìn)行卷積操作,并使用gcadown模塊作為頸部網(wǎng)絡(luò)中的下采樣操作;
5、所述gcadown為在adown中使用ghostconv模塊作為卷積操作,與adown中的平均池化、最大池化操作和ghostconv構(gòu)造并行分支結(jié)構(gòu)。
6、進(jìn)一步的,所述主干網(wǎng)絡(luò)的具體結(jié)構(gòu)為:重參數(shù)化后的hgnetv2包括hgstem、rep_hgblock和dwconv;
7、hgstem作為預(yù)處理層,首先通過卷積操作提取輸入數(shù)據(jù)的特征,隨后采用最大池化進(jìn)行下采樣,捕捉數(shù)據(jù)在不同尺度上的特征,再和卷積后的特征圖進(jìn)行融合,使得特征信息更加豐富;
8、rep_hgblock利用重參數(shù)化思想,在訓(xùn)練階段,使用1×1、3×3大小的卷積核與batchnorm構(gòu)成并行的多分支結(jié)構(gòu),輸入的特征圖經(jīng)過三個(gè)并行的分支結(jié)構(gòu)最后相加,提取輸入數(shù)據(jù)的多尺度特征信息,增強(qiáng)網(wǎng)絡(luò)對(duì)小目標(biāo)的特征表達(dá)能力;在推理階段,利用重參數(shù)化的方法將1×1、3×3大小的卷積核與batchnorm構(gòu)成并行的多分支結(jié)構(gòu)融合為只有3×3大小卷積核的單分支結(jié)構(gòu);將多分支結(jié)構(gòu)融合為單分支結(jié)構(gòu)的過程是在1×1大小的卷積核的分支上,將1×1大小的卷積核通過填充0值變成3×3大小的卷積核;在只有bn層的分支上,通過填充0的方法構(gòu)造3×3大小的卷積核;然后在每個(gè)分支上,融合卷積層核bn層,卷積公式表示如下:
9、conv(x)=w(x)+b
10、batchnorm公式如式(5)所示,其中,γ,β是可學(xué)習(xí)參數(shù):
11、
12、將卷積和batchnorm融合之后,其表達(dá)式可以表示為:
13、
14、其中,表示均值,表示方差,表示歸一化;
15、最后將三個(gè)分支相加,即可將訓(xùn)練時(shí)的并行多分支結(jié)構(gòu)轉(zhuǎn)換為了推理時(shí)的單分支結(jié)構(gòu);
16、dwconv首先將輸入特征圖的每個(gè)通道分別通過卷積核進(jìn)行卷積操作,在不同的通道上獨(dú)立的學(xué)習(xí)特征,然后將得到的特征圖通過逐點(diǎn)卷積的方式進(jìn)行加權(quán)組合得到最終的特征圖。
17、進(jìn)一步的,ghostdynamicconv模塊包括初始卷積操作和廉價(jià)操作,在初始卷積操作中,首先使用1×1大小卷積核的動(dòng)態(tài)卷積對(duì)輸入大小為c×h×w特征圖的通道數(shù)進(jìn)行壓縮,將通道數(shù)變?yōu)樵瓉淼囊话?,大小為c/2×h×w,將得到的特征圖用于廉價(jià)操作;動(dòng)態(tài)卷積通過聚合多個(gè)線性函數(shù)來定義,表示為
18、
19、其中,表示第k個(gè)線性函數(shù)的權(quán)重,表示第k個(gè)線性函數(shù)的偏置,g表示激活函數(shù),πk(x)表示第k個(gè)線程函數(shù)的注意力權(quán)重,根據(jù)輸入動(dòng)態(tài)調(diào)整;
20、在廉價(jià)操作中,使用3×3大小卷積核的動(dòng)態(tài)卷積對(duì)輸入的特征圖進(jìn)行卷積操作,然后將經(jīng)過卷積操作的特征圖與沒有經(jīng)過卷積操作的特征圖進(jìn)行拼接,恢復(fù)成原來的通道數(shù),此時(shí)特征圖大小為c×h×w。
21、進(jìn)一步的,所述gcadown模塊,在adown中使用ghostconv模塊作為卷積操作,與adown中的平均池化、最大池化操作和ghostconv構(gòu)造并行分支結(jié)構(gòu)。
22、進(jìn)一步的,所述gcadown模塊的操作過程為:輸入c×h×w大小的特征圖首先經(jīng)過2×2大小的池化窗口進(jìn)行平均池化操作,平均池化具體操作如下所示。
23、
24、其中,fi,j表示輸出的值,n表示區(qū)域的個(gè)數(shù),表示輸入數(shù)據(jù)第k個(gè)區(qū)域的值;然后將輸出的特征圖分為兩個(gè)分支,各分支上特征圖的通道數(shù)為原來的一半,大小為c/2×h×w,第一個(gè)分支直接經(jīng)過ghostconv,在ghostconv中,首先使用1×1大小的卷積核聚合通道之的信息特征,然后使用3×3大小的卷積核對(duì)經(jīng)過1×1大小卷積核得到的結(jié)果進(jìn)行卷積操作,將得到的卷積結(jié)果和另一半沒有卷積的通道合并得到最終結(jié)果,最終結(jié)果特征圖的高和寬的尺寸為輸入之前的一半,大小為c/2×h/2×w/2;具體表示如下所示:
25、
26、其中,i表示原圖,io表示輸出圖像,conv1×1表示1×1大小卷積核的卷積操作,conv3×3表示3×3大小卷積核的卷積操作,表示沿著通道維度合并;在第二個(gè)分支上,首先經(jīng)過3×3大小的池化窗口進(jìn)行最大池化操作,將特征圖高和寬的尺寸降低為原來的一半,大小為c/2×h/2×w/2,具體操作如下所示:
27、
28、fi,j表示輸出的值,k表示第k個(gè)區(qū)域,表示輸入數(shù)據(jù)第k個(gè)區(qū)域的值;再將輸出的特征圖經(jīng)過1×1大小的卷積核的ghostconv,得到經(jīng)過第二個(gè)分支的結(jié)果,此時(shí)特征圖大小為c/2×h/2×w/2;最終,將兩個(gè)分支的結(jié)果進(jìn)行拼接,得到大小為c×h/2×w/2的特征圖,再輸出gcadown的結(jié)果。
29、本發(fā)明還提供一種基于改進(jìn)的yolov8s的人體安檢違禁品檢測(cè)模型的檢測(cè)方法,包括以下步驟:首先,將圖像輸入,通過主干網(wǎng)絡(luò)提取圖像特征,其中,rep_hgblock中的卷積操作在訓(xùn)練階段,由1×1、3×3大小的卷積核和批量歸一化層組成的并行多分支結(jié)構(gòu),用于增強(qiáng)圖像的特征表達(dá)能力;在推理階段,會(huì)將并行多分支結(jié)構(gòu)轉(zhuǎn)換為只有3×3大小卷積核的單分支結(jié)構(gòu),提升計(jì)算效率和性能;經(jīng)過主干網(wǎng)絡(luò)之后輸出的特征圖會(huì)經(jīng)過頸部網(wǎng)絡(luò)進(jìn)行更加細(xì)化的特征提取,在頸部網(wǎng)絡(luò)中,首先經(jīng)過上采樣操作將特征圖的高和寬都放大兩倍,然后通過特征融合,將頸部網(wǎng)絡(luò)中的特征與主干網(wǎng)絡(luò)中的特征圖結(jié)合起來,再通過ghostdynamicconv卷積操作,提取更加豐富的圖像特征,在下采樣時(shí),通過gcadown下采樣;最終,經(jīng)過細(xì)化處理的特征圖會(huì)被送入檢測(cè)頭中,進(jìn)行預(yù)測(cè)和分類,得到檢測(cè)結(jié)果。
30、本發(fā)明還提供基于改進(jìn)的yolov8s的人體安檢違禁品檢測(cè)模型的訓(xùn)練方法,包括以下步驟:
31、步驟一:數(shù)據(jù)采集,使用毫米波安檢設(shè)備采集大量帶有違禁品的人體安檢數(shù)據(jù),如攜帶金屬刀、錘子、扳手等金屬物品或陶瓷刀、酒精非金屬物品的圖像數(shù)據(jù);采集數(shù)據(jù)時(shí),需要采集不同大小、形狀、位置和方向的違禁品圖像,以確保模型能夠?qū)W習(xí)到豐富的特征用于提高模型的泛化能力;
32、步驟二:數(shù)據(jù)標(biāo)注,使用labelimg工具對(duì)采集的圖像數(shù)據(jù)進(jìn)行標(biāo)注;標(biāo)注時(shí)需要對(duì)圖像數(shù)據(jù)進(jìn)行精確的標(biāo)注,還需要考慮到違禁品可能被遮擋或部分隱藏的情況,減少漏標(biāo)的情況;將標(biāo)記好的圖像劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集;
33、步驟三:網(wǎng)絡(luò)訓(xùn)練,首先將劃分好的圖像數(shù)據(jù)集輸入到檢測(cè)模型中,這些圖像通過檢測(cè)模型的主干網(wǎng)絡(luò)進(jìn)行初步處理,從圖像中提取出有用的特征信息;接著,將這些特征信息輸入頸部網(wǎng)絡(luò),在頸部網(wǎng)絡(luò)中將不同尺度的特征圖進(jìn)行融合,增強(qiáng)特征的表達(dá)能力;最后,將融合后的特征圖送入檢測(cè)頭部分進(jìn)行預(yù)測(cè),得到最終結(jié)果。
34、本發(fā)明還提供一種基于改進(jìn)的yolov8s的人體安檢違禁品檢測(cè)系統(tǒng),包括上述的檢測(cè)模型。
35、本發(fā)明的優(yōu)點(diǎn)在于:
36、目標(biāo)檢測(cè)準(zhǔn)確率提升:通過使用rephgnetv2、gcadown和ghostdynamicconv三個(gè)網(wǎng)絡(luò)結(jié)構(gòu)對(duì)yolov8s進(jìn)行改進(jìn),在人體安檢違禁品檢測(cè)識(shí)別的場(chǎng)景下,有效提升了違禁品識(shí)別的準(zhǔn)確率。
37、模型文件計(jì)算量下降:通過融合rephgnetv2、gcadown和ghostdynamicconv三個(gè)網(wǎng)絡(luò)結(jié)構(gòu),顯著降低了模型的參數(shù)量和計(jì)算量,由于模型文件體積的減少,更加有利于在資源受限的設(shè)備上部署該模型。