本發(fā)明涉及圖像分類,尤其涉及一種基于局部學習的深度領域適應目標識別方法及系統。
背景技術:
1、隨著人工智能技術的快速發(fā)展,圖像分類任務在眾多領域中發(fā)揮著至關重要的作用。然而,在實際應用中,常常會遇到以下問題:不同領域或場景下的圖像數據往往具有不同的分布特征。例如,不同光照條件、不同拍攝角度、不同設備采集的圖像,其顏色、紋理、形狀等特征可能存在較大差異。這種數據分布的差異使得在一個數據集上訓練得到的圖像分類模型難以直接應用于另一個具有不同分布的數據集,從而降低了模型的泛化能力。
2、在某些特定領域,獲取大量標注好的圖像數據是非常困難且昂貴的。例如,醫(yī)學圖像領域,由于專業(yè)知識的要求和數據隱私的限制,很難收集到大規(guī)模的標注數據。而深度學習模型通常需要大量的標注數據才能取得較好的性能,數據的稀缺性成為了制約圖像分類任務的一個重要因素。
3、現實世界中的圖像分類任務往往是動態(tài)變化的,需要模型能夠快速適應新的圖像數據和分類需求。傳統的圖像分類方法通常需要重新收集數據并進行模型訓練,這一過程耗時耗力。
4、為了解決上述問題,本發(fā)明提出一種基于局部學習的深度領域適應目標識別方法及系統。
技術實現思路
1、本發(fā)明的目的在于提出一種基于局部學習的深度領域適應目標識別方法及系統以解決背景技術中所提出的問題:
2、現有圖像分類技術中,不同來源、不同場景下的圖像數據分布差異大,已訓練的分類模型難以直接適應新的分布,導致在新數據上的分類性能下降。特定領域中獲取大量標注圖像數據成本高、難度大,而現有方法在數據稀缺情況下難以訓練出高性能的分類模型。面對動態(tài)變化的圖像分類任務,傳統方法重新收集數據和訓練模型耗時耗力,不能快速適應新數據和新需求。
3、為了實現上述目的,本發(fā)明采用了如下技術方案:
4、一種基于局部學習的深度領域適應目標識別方法,包括如下步驟:
5、s1、選定源目標圖像數據和待識別的目標圖像數據;
6、s2、對選定的源目標圖像數據和待識別的目標圖像數據進行預處理,分別輸入alexnet網絡;
7、s3、分別針對源目標圖像數據和待識別的目標圖像數據,采用k近鄰標準,確定鄰域,以此建立局部協方差矩陣,獲得基于仿射不變度量表示的源目標圖像數據和待識別的目標圖像數據分布差異度量;
8、s4、建立深度領域適應損失函數,實現待識別的目標圖像數據分類。
9、優(yōu)選地,所述s2中的預處理操作包括:歸一化處理、數據增強處理、灰度化處理、直方圖均衡化處理和尺寸調整處理,再分別將處理后的源目標圖像數據和待識別的目標圖像數據作為源alexnet網絡和目標alexnet網絡的輸入;當圖像數據集的量級為百及以下量級時,將數據集分別按照7∶3的比例劃分為訓練集和測試集;當圖像數據集的量級為千時,將數據集分別按照8∶2的比例劃分為訓練集和測試集;當圖像數據集的量級為萬及以上量級時,將數據集分別按照9∶1的比例劃分為訓練集和測試集。
10、優(yōu)選地,所述s3具體如下:
11、對于源目標圖像數據和待識別的目標圖像數據采用k近鄰標準,分別尋找組成最近鄰特征空間的k個近鄰圖像;
12、對源目標圖像數據進行如下的局部線性表示:
13、
14、其中,表示源目標圖像數據在最近鄰特征空間中投影:表示線性表示系數;表示源目標圖像數據中距離最近并組成最近鄰特征空間的k幅圖像;
15、對待識別的目標圖像數據進行如下的局部線性表示:
16、
17、其中,表示源目標圖像數據在最近鄰特征空間中投影:表示線性表示系數;表示源目標圖像數據中距離最近并組成最近鄰特征空間的k幅圖像;
18、分別構建基于局部學習的源目標圖像數據局部協方差矩陣和待識別的目標圖像數據局部協方差矩陣如下:
19、
20、
21、其中,ns表示所有源目標圖像數據幅數;ns表示待識別目標圖像數據幅數;f(·)表示基于alexnet網絡的非線性映射函數;
22、建立基于局部學習的表征對稱正定流形距離的仿射不變度量矩陣,表示源目標圖像數據和待識別的目標圖像數據分布差異如下:
23、
24、其中,為lairm(cs,ct)為源目標圖像數據和待識別的目標圖像數據的分布差異;||·||2表示歐式距離。
25、優(yōu)選地,所述s4具體如下:
26、采用基于局部學習的仿射不變度量表示的分布差異作為alexnet網絡領域適應損失函數,并采用交叉熵作為待識別目標圖像分類損失函數,故總的深度學習損失函數表示如下:
27、ltotal=lcross-entroy+αlled
28、其中,lcross-entroy表示交叉熵損失;α為一個常數。
29、一種基于局部學習的深度領域適應目標識別系統,包括:
30、目標圖像數據選定模塊:用于選定源目標圖像數據和待識別的目標圖像數據;
31、目標圖像數據預處理模塊:用于對源目標圖像數據和待識別的目標圖像數據進行預處理,分別輸入alexnet網絡深度卷積神經網絡;
32、分布差異度量建立模塊:分別針對源目標圖像數據和待識別的目標圖像數據,采用k近鄰標準,獲得鄰域并投影,建立局部協方差矩陣;
33、待識別目標圖像數據分類模塊:用于建立深度領域適應損失函數,實現待識別的目標圖像數據分類。
34、與現有技術相比,本發(fā)明提供了一種基于局部學習的深度領域適應目標識別方法及系統,具備以下有益效果:
35、本發(fā)明利用局部學習精準捕捉目標局部特征,提高復雜場景下識別準確率,結合深度領域適應減小不同領域數據差異;建立能表征源目標圖像數據和待識別的目標圖像數據分布差異的損失函數,且損失函數基于局部學習的仿射不變度量的方式搭建,能夠基于流形局部學習構建局部協方差矩陣,更好的度量源域與目標域的分布差異,優(yōu)化基于alexnet網絡的深度框架,提高目標圖像的識別效果和性能,增強模型泛化能力和魯棒性,能應對干擾和數據變化,為實際應用提供更準確高效的目標識別解決方案。
1.一種基于局部學習的深度領域適應目標識別方法,其特征在于,包括如下步驟:
2.根據權利要求1所述的一種基于局部學習的深度領域適應目標識別方法,其特征在于,所述s2中的預處理操作包括:歸一化處理、數據增強處理、灰度化處理、直方圖均衡化處理和尺寸調整處理,再分別將處理后的源目標圖像數據和待識別的目標圖像數據作為源alexnet網絡和目標alexnet網絡的輸入;當圖像數據集的量級為百及以下量級時,將數據集分別按照7:3的比例劃分為訓練集和測試集;當圖像數據集的量級為千時,將數據集分別按照8∶2的比例劃分為訓練集和測試集;當圖像數據集的量級為萬及以上量級時,將數據集分別按照9∶1的比例劃分為訓練集和測試集。
3.根據權利要求2所述的一種基于局部學習的深度領域適應目標識別方法,其特征在于,所述s3具體如下:
4.根據權利要求3所述的一種基于局部學習的深度領域適應目標識別方法,其特征在于,所述s4具體如下:
5.如權利要求1-4任意一項權利要求所述的一種基于局部學習的深度領域適應目標識別系統,其特征在于,包括: