本技術涉及計算機視覺,特別是涉及一種遙感圖像多標簽分類方法、裝置、設備、介質(zhì)及產(chǎn)品。
背景技術:
1、隨著遙感技術的飛速發(fā)展,基于人工智能的遙感圖像分類系統(tǒng)已經(jīng)在土地檢測、城市規(guī)劃、植被覆蓋檢測等領域得到了廣泛的應用。與常規(guī)圖像相比,遙感圖像富含多種語義信息,其中目標物的尺度以及數(shù)量與常規(guī)圖像相比都有較大差異,采用原始的單標簽分類方法解決遙感圖像分類常造成語義信息丟失。多標簽遙感圖像分類算法旨在為一副遙感圖像分配多個標簽,使用多標簽進行遙感圖像分類能夠充分利用遙感圖像語義,對于進一步釋義遙感圖像具有重要意義。
2、在相關技術中,多標簽遙感圖像分類算法的研究大致可以劃分為傳統(tǒng)機器學習和基于深度學習的方法。早期的多標簽分類算法一般先從遙感圖像中提取圖像特征,如紋理特征、光譜特征等,再通過分類器和設計優(yōu)化算法進行標簽分類判別。由于傳統(tǒng)的人工特征對光照變化不敏感,難以捕捉復雜信息,相比之下,深度學習通過自動學習圖像中的層次化特征表示能夠克服傳統(tǒng)方法的弊端,具有更強的特征捕捉能力。然而,基于深度學習的圖像分類算法對數(shù)據(jù)敏感度高,通常需要獲取大量的有標記的數(shù)據(jù)集進行訓練,這類數(shù)據(jù)標注工作受到標注者主觀意識等的影響,在標注過程中難以避免出現(xiàn)錯標和漏標的現(xiàn)象,從而導致噪聲標簽,使用噪聲標簽訓練多標簽遙感圖像分類模型將極大的影響模型的泛化能力,所以在噪聲的干擾下,現(xiàn)有的基于深度學習的多標簽分類方法中多標簽遙感圖像分類模型的精度及泛化能力在很大程度上受到噪聲標簽的影響并且也難以訓練出魯棒性高的多標簽遙感圖像分類模型,導致多標簽分類結果不準確。
技術實現(xiàn)思路
1、本技術的目的是提供一種遙感圖像多標簽分類方法、裝置、設備、介質(zhì)及產(chǎn)品,可提高多標簽遙感圖像分類模型的精度、泛化能力和魯棒性,進而提高多標簽分類結果的準確性。
2、為實現(xiàn)上述目的,本技術提供了如下方案:
3、第一方面,本技術提供了一種遙感圖像多標簽分類方法,包括:
4、獲取訓練樣本集合,所述訓練樣本集合包括多個訓練樣本,每個訓練樣本包括遙感圖像和所述遙感圖像的標簽向量;遙感圖像的標簽向量為根據(jù)表示遙感圖像類別的干凈標簽和噪聲標簽得到的;
5、對于所述訓練樣本集合中任意一個訓練樣本中的遙感圖像,采用弱變換和強變換分別對所述遙感圖像進行處理,得到所述遙感圖像對應的弱變換圖像和強變換圖像;
6、在當前訓練次數(shù)下,將所述遙感圖像對應的弱變換圖像輸入上一訓練次數(shù)下樣本模型的第一分支得到當前訓練次數(shù)下第一分支中的分類器的輸出向量和隱含特征;根據(jù)當前訓練次數(shù)下第一分支中的分類器的輸出向量得到當前訓練次數(shù)下所述遙感圖像對應的弱變換圖像的預測標簽向量;所述樣本模型包括:并行設置的第一分支和第二分支;第一分支和第二分支均包括多標簽遙感圖像分類模型和多層感知機;所述多標簽遙感圖像分類模型包括依次連接的特征編碼器和分類器;第一分支中的多層感知機與第一分支中的特征編碼器的輸出端連接;第二分支中的多層感知機與第二分支中的特征編碼器的輸出端連接;
7、將所述遙感圖像對應的強變換圖像輸入上一訓練次數(shù)下樣本模型的第二分支得到當前訓練次數(shù)下第二分支中的分類器的輸出向量和隱含特征;根據(jù)當前訓練次數(shù)下第二分支中的分類器的輸出向量得到當前訓練次數(shù)下所述遙感圖像對應的強變換圖像的預測標簽向量;
8、根據(jù)當前訓練次數(shù)下第一分支中的分類器的輸出向量和當前訓練次數(shù)下第二分支中的分類器的輸出向量對所述遙感圖像的標簽向量進行矯正得到當前訓練次數(shù)下所述遙感圖像矯正后的標簽向量;
9、根據(jù)當前訓練次數(shù)下所述訓練樣本集合中各遙感圖像矯正后的標簽向量、當前訓練次數(shù)下所述訓練樣本集合中各遙感圖像對應的弱變換圖像的預測標簽向量和隱含特征以及當前訓練次數(shù)下所述訓練樣本集合中各遙感圖像對應的強變換圖像的預測標簽向量和隱含特征計算當前訓練次數(shù)下?lián)p失函數(shù)的值;
10、根據(jù)當前訓練次數(shù)下?lián)p失函數(shù)的值對上一訓練次數(shù)下樣本模型進行訓練得到當前訓練次數(shù)下樣本模型,并判斷是否達到設定訓練次數(shù),若沒有達到設定訓練次數(shù),則進入下一訓練次數(shù),直到達到設定訓練次數(shù),得到訓練好的樣本模型,采用訓練好的樣本模型中第一分支或者第二分支中的多標簽遙感圖像分類模型對目標遙感圖像進行多標簽分類。
11、第二方面,本技術提供了一種遙感圖像多標簽分類裝置,包括:
12、獲取模塊,用于獲取訓練樣本集合,所述訓練樣本集合包括多個訓練樣本,每個訓練樣本包括遙感圖像和所述遙感圖像的標簽向量;遙感圖像的標簽向量為根據(jù)表示遙感圖像類別的干凈標簽和噪聲標簽得到的;
13、數(shù)據(jù)增強模塊,用于對于所述訓練樣本集合中任意一個訓練樣本中的遙感圖像,采用弱變換和強變換分別對所述遙感圖像進行處理,得到所述遙感圖像對應的弱變換圖像和強變換圖像;
14、第一分支計算模塊,用于在當前訓練次數(shù)下,將所述遙感圖像對應的弱變換圖像輸入上一訓練次數(shù)下樣本模型的第一分支得到當前訓練次數(shù)下第一分支中的分類器的輸出向量和隱含特征;根據(jù)當前訓練次數(shù)下第一分支中的分類器的輸出向量得到當前訓練次數(shù)下所述遙感圖像對應的弱變換圖像的預測標簽向量;所述樣本模型包括:并行設置的第一分支和第二分支;第一分支和第二分支均包括多標簽遙感圖像分類模型和多層感知機;所述多標簽遙感圖像分類模型包括依次連接的特征編碼器和分類器;第一分支中的多層感知機與第一分支中的特征編碼器的輸出端連接;第二分支中的多層感知機與第二分支中的特征編碼器的輸出端連接;
15、第二分支計算模塊,用于將所述遙感圖像對應的強變換圖像輸入上一訓練次數(shù)下樣本模型的第二分支得到當前訓練次數(shù)下第二分支中的分類器的輸出向量和隱含特征;根據(jù)當前訓練次數(shù)下第二分支中的分類器的輸出向量得到當前訓練次數(shù)下所述遙感圖像對應的強變換圖像的預測標簽向量;
16、矯正模塊,用于根據(jù)當前訓練次數(shù)下第一分支中的分類器的輸出向量和當前訓練次數(shù)下第二分支中的分類器的輸出向量對所述遙感圖像的標簽向量進行矯正得到當前訓練次數(shù)下所述遙感圖像矯正后的標簽向量;
17、損失函數(shù)計算模塊,用于根據(jù)當前訓練次數(shù)下所述訓練樣本集合中各遙感圖像矯正后的標簽向量、當前訓練次數(shù)下所述訓練樣本集合中各遙感圖像對應的弱變換圖像的預測標簽向量和隱含特征以及當前訓練次數(shù)下所述訓練樣本集合中各遙感圖像對應的強變換圖像的預測標簽向量和隱含特征計算當前訓練次數(shù)下?lián)p失函數(shù)的值;
18、訓練模塊,用于根據(jù)當前訓練次數(shù)下?lián)p失函數(shù)的值對上一訓練次數(shù)下樣本模型進行訓練得到當前訓練次數(shù)下樣本模型,并判斷是否達到設定訓練次數(shù),若沒有達到設定訓練次數(shù),則進入下一訓練次數(shù),直到達到設定訓練次數(shù),得到訓練好的樣本模型,采用訓練好的樣本模型中第一分支或者第二分支中的多標簽遙感圖像分類模型對目標遙感圖像進行多標簽分類。
19、第三方面,本技術提供了一種計算機設備,包括:存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)上述中任一項所述的遙感圖像多標簽分類方法。
20、第四方面,本技術提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)上述中任一項所述的遙感圖像多標簽分類方法。
21、第五方面,本技術提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)上述中任一項所述的遙感圖像多標簽分類方法。
22、根據(jù)本技術提供的具體實施例,本技術公開了以下技術效果:
23、本技術提供了一種遙感圖像多標簽分類方法、裝置、設備、介質(zhì)及產(chǎn)品,通過采用弱變換和強變換分別對遙感圖像進行處理,得到遙感圖像對應的弱變換圖像和強變換圖像以及根據(jù)當前訓練次數(shù)下第一分支中的分類器的輸出向量和當前訓練次數(shù)下第二分支中的分類器的輸出向量對所述遙感圖像的標簽向量進行矯正得到當前訓練次數(shù)下所述遙感圖像矯正后的標簽向量,盡可能在復雜噪聲標簽訓練中矯正噪聲標簽,以提高弱監(jiān)督環(huán)境下遙感圖像多標簽分類的性能,解決了現(xiàn)有的多標簽遙感圖像分類方法易受到噪聲標簽的影響,難以訓練魯棒的多標簽遙感圖像分類模型的問題,實現(xiàn)了提高多標簽遙感圖像分類模型的精度、泛化能力和魯棒性,進而提高多標簽分類結果的準確性的技術效果。