一種基于流形距離表征的艦船目標分類識別算法
【技術領域】
[0001] 本發(fā)明設及計算機應用技術領域,尤其設及一種基于流形距離表征的艦船目標分 類識別算法。
【背景技術】
[0002] 艦船作為海上重要的載體,其自動檢測與識別的效率如何,一定程度上關系到我 軍奪海戰(zhàn)爭的勝負成敗。特別是近年來,隨著衛(wèi)星遙感技術的發(fā)展壯大,基于光學遙感圖像 的識別算法表現(xiàn)出了自身優(yōu)勢,引起了國內(nèi)外學者的高度重視,涌現(xiàn)出了一系列具有一定 理論參考意義及應用價值的研究成果。
[0003] -般而言,解決目標分類的關鍵問題在于如何聚類,而聚類最主要的因素在于目 標對象間的相似度的度量,傳統(tǒng)相似度的計算方法一般僅參考目標對象間的夾角或距離, 例如余弦相似度、歐式距離。運些方法缺少對目標對象空間分布情況的分析,片面認為參與 運算的特征或屬性對數(shù)據(jù)的劃分能力的影響效果是等同的,運顯然是不符合目標對象的實 際分布情況的,從而影響了目標分類的精確性。
[0004] 究其分類識別的基本思想是根據(jù)提取的特征向量為類別未知的目標指派某一類 另1|。其中,比較常見的算法有:1^近鄰化-舶曰'631:-舶1邑111301',1(順)、支持向量機(5叫口01'1 Vector Machine,SVM)、分層判別回歸化ierarchical Discriminant Regression,皿R)、概 率生成模型(Probability Generative Model,PGM)等方法。針對上述幾種典型的分類算 法,仿真對比實驗表明,概率生成模型的識別效果較好。但在實際運用時,現(xiàn)有的運些算法 都缺少對樣本規(guī)模和樣本相似關系衡量的全面考察。
【發(fā)明內(nèi)容】
[0005] 為了克服現(xiàn)有技術的不足,本發(fā)明提供一種基于流形距離表征的艦船目標分類識 別算法。
[0006] 本發(fā)明為解決上述技術問題所采用的技術方案是:
[0007] -種基于流形距離表征的艦船目標分類識別算法,包括W下步驟:
[000引步驟1:在樣本流形空間中,首先構建一個加權無向圖G(V,E),其中V表示頂點,它 由樣本集組成,E表示邊集。
[0009]步驟2:假設p(Vi,Vj)為樣本Vi、V非;f在的路徑,又假設P為路徑p(Vi,Vj)上任兩個樣 本間的路徑,Pm為路徑p(Vi,Vj)上的第m個樣本,由最短路徑計算原理,得到流形距離的計算 公式:
[0011]上式中,權值1?化,哦+1二其中,色柄郵,節(jié)饑知1)為局部鄰域 C(Pm<,,r)區(qū)域內(nèi)的局部反賭值,C(Pmt,,r)表示樣本P訊。、Pm+痛接中線上距離二者最近的樣 本點,且。、- 2口
[0012]步驟3:假設樣本Vi的鄰居節(jié)點為Vj、Vk,則根據(jù)步驟(2)定義的流形距離,若L(Vi, Vj) < L(Vi,Vk),則鄰居節(jié)點Vj占優(yōu)于Vk,記做Vj>Vk,反之,若Vk占優(yōu)于Vj,記做Vj<Vk;
[001 ;3]在占優(yōu)關系定義的基礎上,令集合V = {Vi,V2,V3,…,Vi,…,Vn},貝帷集合V中,若Vi >Vi+i,則記做 V>={Vi,V2,V3,...,Vi,...,VN};反之,若 Vi<Vi+i,則記做 V<={Vi,V2,V3,…, Vi,…,Vn}。集合¥>或¥<就稱作優(yōu)勢集。
[0014]步驟4:基于上述定義,首先根據(jù)樣本Vi和其鄰居樣本間的流形距離進行快速排 序,于是得到一個對應的優(yōu)勢集V'>,假設V'>={Vi,V2,V3,-,,Vk,-,,VN};
[001引步驟5:對于優(yōu)勢集V,>,從前往后依次選?。?,個(雌^ =2W3:,N代表樣本集個數(shù)) 樣本作為樣本Vi的鄰居樣本,并將其帶入概率生成模型中求解得到分類識別結果。
[0016] 作為優(yōu)選,步驟2中所述的權值Wmk.mk+1的公式推導如下:
[001引上式中,〔知71,,,?-)表示^樣本口}0.。為中屯、,1'為半徑的化11曲圓鄰域,換耐為?%(,、口111+1 連接中線上距離二者最近的樣本點,公(Pmy書mwi) < r < O為高斯分布方
差,一般取其經(jīng)驗值 a,0為調(diào)節(jié)因子,且 0?
[0019] 作為優(yōu)選,調(diào)節(jié)因子0 = 0.5。
[0020] 本發(fā)明的有益效果是:
[0021] 1、對于某兩個樣本而言,流形距離指的是基于流形空間上的二者之間的最短距 離,它使得同一流形分布中距離較近的樣本指定給同一類別,不同流形分布中的樣本指定 給不同類別,它較傳統(tǒng)的歐式距離更能準確表達樣本間存在的真實差異情況。
[0022] 2、用局部反賭算子來衡量樣本所賦予的權值,可W實現(xiàn)擴大低密度區(qū)域內(nèi)的樣本 間的距離,縮小高密度區(qū)域內(nèi)的樣本間的距離運一目的。
[0023] 3、通過定義基于流形距離表征的相似度選擇標準和基于該標準的優(yōu)勢集基礎上 的樣本數(shù)量的限制,可加快艦船目標識別的精度和速度,提高艦船目標識別的效率。
【附圖說明】
[0024] 圖1是本發(fā)明的基于歐式空間表示的樣本分布示意圖;
[0025] 圖2是本發(fā)明的賭函數(shù)及反賭函數(shù)圖像;
[0026] 圖3是本發(fā)明的基于流形距離度量的樣本空間分布示意圖;
[0027] 圖4是本發(fā)明的艦船目標識別切片實驗數(shù)據(jù);
[002引圖5是本發(fā)明的各個算法性能對比直方圖;
[0029] 圖6是本發(fā)明的艦船目標識別實驗數(shù)據(jù)。
【具體實施方式】
[0030] 下面結合附圖及實施例對本發(fā)明作進一步說明。
[0031] 傳統(tǒng)的距離例如歐式距離并不能準確表達樣本間存在的真實差異情況,如圖1所 示,樣本A、C之間的距離遠大于樣本A、B之間的距離。若按照歐式空間上距離的大小進行劃 分,那么A和B將被歸類為同一空間,C將被劃分為另一空間上,顯然,采用運種分類方法所得 到的分類結果與=個樣本的實際分布情況是相惇的。為此研究中引入了流形空間的概念, 旨在縮小位于高密度區(qū)域內(nèi)的樣本間的距離,擴大位于低密度區(qū)域內(nèi)的樣本間的距離,使 樣本的空間分布情況趨向于其真實分布。
[0032] 該計算方法的具體實施步驟如下:
[0033] (1)定義Hou曲圓鄰域
[0034] 設(X,D)為一個可度量的空間,且XEX,則對于給定的實數(shù)r>0,有集合:
[0035] {yeX|D(x,y) <r}
[0036] 將上式Wx為中屯、,r為半徑的化U曲圓鄰域記做CU, r),其中,D表示基于歐式距離 的度量標準,計算公式為。=麥-yf O
[0037] (2)定義局部反賭算子
[003引 Wxi、Xj的中點XO為中屯、,:T為半徑的化U曲圓鄰域上,借鑒局部賭算子的定義,給出 局部反賭算子的概念,其公式計算如下:
[0041] 其中,f (Xk)表示點Xk處的像素灰度,P(Xk)表示Xk發(fā)生的概率密度,e〉0,一般取值 為e = 2X l(ri5DC(xo,;r)表示XO所在的Hough圓局部鄰域,r的取值范圍為D(xi,xj)如。D (xi,Xj)〇
[0042] 運里^函數(shù)7 =-別〇邑^)、7 =-別〇邑(1-義),義£(0,1)為例,對比說明局部賭算子和 局部反賭算子的性質。如圖2所示,不同于函數(shù)y = -xlog(x),函數(shù)y = -xlog(l-x)在區(qū)間(0, 1)內(nèi)是單獨遞增的,且隨變量值的增加函數(shù)值的增幅越來越快,其圖像性質接近于指數(shù)函 數(shù)的變化性質。
[0043]根據(jù)局部反賭算子基本性質可知,由于其函數(shù)變換趨勢接近于指數(shù)函數(shù),所W基 于局部反賭算子的計算會導致目標"過增長"效應,需要對其進行修正。為此,首先將函數(shù)Ig (1-P(祉))進行麥克勞林展開:
[0045] 運里,〇<0<l,〇<p(xk)<l。因為(p(xk)r 一 0,所W首先采用一次多項式來擬合 IgQ-P(Xk)),然后通過高斯分布函數(shù)對局部反賭算子進行"微調(diào)",最后通過設置兩個調(diào)整 因子a、e綜合對局部反賭算子進行修正,故局部反賭算子的計算公式可表示如下:
[0047] 上式中,〇為高斯分布方差,一般取其經(jīng)驗值
0<1,本發(fā)明取值e=o.5。
[0048] 由局部反賭算子的性質可知,對于圖像灰度變化均勻的區(qū)域,其局部反賭值較小, 而對于圖像灰度變化較大的區(qū)域,其局部反賭值較大。因此,用局部反賭算子來衡量樣本所 賦予的權值,可W實現(xiàn)擴大低密度區(qū)域內(nèi)的樣本間的距離,縮小高密度區(qū)域內(nèi)的樣本間的 距離運一目的。
[0049] (3)定義流形距離
[0050] 在樣本流形空間中,首先構建一個加權無向圖G(V,E),其中V表示頂點,它由樣本 集組成,E表示邊集。假設p(Vi,Vj)為樣本Vi、Vj所在的路徑,又假設P為路徑p(Vi,Vj)上任兩 個樣本間的路徑,Pm為路徑p(Vi,Vj)上的第m個樣本。由最短路徑計算原理,得到流形距離的 計算公式:
[00對上式中,權值W附神tk+i二訊fc+i),其中,訊fc+i)為局部鄰域 C(PmD,r)區(qū)域內(nèi)的局部反賭值,C(輪。,r)表示樣本Pm。Pm+痛接中線上距離二者最近的樣 本點,且0(P饑k, Prrik-H )含 r 含 20(Pmk, Pm…);
[0053] 根據(jù)上述定義,如圖3所示,在流形