一種基于分層稀疏判別特征學(xué)習(xí)的高光譜圖像分類方法
【專利摘要】本發(fā)明具體公開(kāi)了一種基于分層稀疏判別特征學(xué)習(xí)的高光譜圖像分類方法,主要用于解決現(xiàn)有技術(shù)不能很好的學(xué)習(xí)高光譜數(shù)據(jù)鄰域塊的特征表示的問(wèn)題。其實(shí)現(xiàn)步驟為:輸入高光譜圖像數(shù)據(jù)樣本集,從中選擇訓(xùn)練集和測(cè)試集;基于選出的訓(xùn)練集和樣本集,利用基于稀疏編碼的分層判別特征學(xué)習(xí)方法,得到第一層判別特征及第二層判別特征;將第一層判別特征及第二層判別特征結(jié)合,得到分層判別特征;基于分層判別特征,利用支撐矢量機(jī)分類,輸出分類結(jié)果。本發(fā)明在空間金字塔稀疏編碼模型的基礎(chǔ)上,加入了類標(biāo)監(jiān)督信息的判別字典學(xué)習(xí),且基于空間金字塔稀疏模型采用二層判別特征學(xué)習(xí),增強(qiáng)了特征的判別性,提高了分類精度,使得對(duì)高光譜數(shù)據(jù)分類更加準(zhǔn)確。
【專利說(shuō)明】-種基于分層稀疏判別特征學(xué)習(xí)的高光譜圖像分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理【技術(shù)領(lǐng)域】,涉及機(jī)器學(xué)習(xí)和高光譜圖像處理,具體是一種基 于分層稀疏判別特征學(xué)習(xí)的高光譜圖像分類方法,本發(fā)明可以通過(guò)對(duì)高光譜數(shù)據(jù)進(jìn)行判別 特征學(xué)習(xí),恰當(dāng)?shù)谋碚鞒龈吖庾V圖像不同地物的特征,從而在此基礎(chǔ)上實(shí)現(xiàn)計(jì)算機(jī)自主的 對(duì)于高光譜圖像不同地物進(jìn)行分類識(shí)別。
【背景技術(shù)】
[0002] 高光譜圖像的地物分類是目前高光譜圖像處理領(lǐng)域的研究熱點(diǎn),其研究主要致力 于尋找使計(jì)算機(jī)智能地學(xué)習(xí)和識(shí)別不同圖像目標(biāo)的技術(shù)方法。高光譜圖像具有比較高的光 譜分辨率,通常能達(dá)到KT2a數(shù)量級(jí),同時(shí)波段多,光譜通道數(shù)多達(dá)數(shù)十甚至數(shù)百個(gè)以上,而 且各通道間往往是連續(xù)的。高光譜圖像的地物分類在地質(zhì)調(diào)查、農(nóng)作物災(zāi)害監(jiān)測(cè)、大氣污染 和軍事目標(biāo)打擊等領(lǐng)域均有良好應(yīng)用前景。最為普遍的高光譜圖像地物分類方法通常是: (1)輸入一幅高光譜圖像;(2)從中選取訓(xùn)練樣本和測(cè)試樣本;(3)通過(guò)特征學(xué)習(xí)的方法分 別對(duì)訓(xùn)練樣本和測(cè)試樣本學(xué)習(xí)特征;(4)將所學(xué)的特征通過(guò)分類器進(jìn)行分類;(5)得到分類 結(jié)果。其中的一個(gè)關(guān)鍵問(wèn)題就是如何從大量帶有冗余的高光譜數(shù)據(jù)中提取有用信息,使用 合適的特征學(xué)習(xí)方法表征出不同地物的表示,因?yàn)楸硎镜暮侠砼c否決定了后續(xù)分類的性能 上限。另外,由于高光譜具有數(shù)據(jù)量大、冗余信息多、波段多等不利因素,因此要求對(duì)高光譜 數(shù)據(jù)特征學(xué)習(xí)時(shí)用到的技術(shù)方法高效、簡(jiǎn)單且有一定抗噪聲干擾能力。
[0003] Jianchao Yang 等人在論文 "Linear Spatial Pyramid Matching Using Sparse Coding for Image Classification"(CVPR,2009)中利用基于 Sparse Coding 的方法對(duì)原 始高光譜圖像數(shù)據(jù)進(jìn)行空間金字塔最大池化特征編碼,最后結(jié)合分類器進(jìn)行分類。該方法 的具體步驟為第1步:提取樣本SIFT特征;第2步:訓(xùn)練字典;第3步:根據(jù)字典對(duì)SIFT 特征進(jìn)行編碼得到稀疏編碼向量,對(duì)稀疏編碼向量做最大池化算法得到每個(gè)樣本的最終特 征;第4步:對(duì)最終特征用線性支持矢量機(jī)方法進(jìn)行分類。這種方法雖然對(duì)特征編碼相對(duì)準(zhǔn) 確,但是,仍然存在的不足之處是,該方法比較依賴于稀疏編碼的好壞。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明針對(duì)上述現(xiàn)有技術(shù)的不足,提出一種新的基于稀疏編碼的分層判別特征學(xué) 習(xí)方法,在對(duì)高光譜圖像數(shù)據(jù)進(jìn)行稀疏編碼時(shí)加入了類標(biāo)信息,在分層特征學(xué)習(xí)的過(guò)程中 加入了結(jié)構(gòu)信息,使得地物分類特征更具判別性,從而進(jìn)一步提高對(duì)高光譜數(shù)據(jù)圖像不同 地物的智能識(shí)別能力。
[0005] 本發(fā)明的技術(shù)方案是:一種基于分層稀疏判別特征學(xué)習(xí)的高光譜圖像分類方法, 包括以下步驟:
[0006] (1)輸入包含C類地物的高光譜遙感圖像數(shù)據(jù),每個(gè)像素即為樣本,將樣本用光譜 特征向量表示,樣本的特征維數(shù)為h,所有樣本構(gòu)成樣本集Y = e Rm ?其中yi為第i 個(gè)樣本,N為樣本總個(gè)數(shù),R表示實(shí)數(shù)域;
[0007] (2)隨機(jī)從每類樣本集中選出10%的樣本作為訓(xùn)練集Ytrata e Rh,H1表示訓(xùn)練 集樣本數(shù)目,剩余的90%樣本作為測(cè)試集¥_ e ,n2表示測(cè)試集樣本數(shù)目;
[0008] (3)基于訓(xùn)練集Ytrain和樣本集Y,利用基于稀疏編碼的分層判別特征學(xué)習(xí)方法,得 到第一層判別特征集及第二層判別特征集t = ,其中,#為對(duì)應(yīng)于樣本集 i ; I I=I I 11=1 Y第i個(gè)樣本的第一層判別特征,;!為對(duì)應(yīng)于樣本集Y第i個(gè)樣本的第二層判別特征:
[0009] 3a)從訓(xùn)練集中隨機(jī)選取K1個(gè)訓(xùn)練樣本作為第一層判別字典的初始化字典 ,利用判別K-SVD字典學(xué)習(xí)方法,得到第一層判別字典D ;
[0010] 3b)基于第一層判別字典D,利用正交匹配追蹤算法得到所有樣本的第一層稀疏 編碼特征 2 = [I,,Z2,…,Z v] G ;
[0011] 3c)根據(jù)所有樣本的第一層稀疏編碼特征,利用第一層判別特征學(xué)習(xí)方法,得到第 一層判別特征集f = e RaiA>v及第二層輸入特征集& e = ;
[0012] 3d)從訓(xùn)練集對(duì)應(yīng)的第二層輸入特征集中隨機(jī)選取K2個(gè)作為第二層判別字典的初 始化字典D' 2,結(jié)合對(duì)應(yīng)的類標(biāo)矩陣和判別矩陣,類似于第一層判別字典學(xué)習(xí)方法優(yōu)化判 別字典目標(biāo)函數(shù),得到第二層判別字典〇2 G R5a^A ;
[0013] 3e)基于樣本集Y的第二層輸入特征集和第二層判別字典,利用正交匹配追蹤算 法得到每個(gè)樣本的第二層稀疏編碼特征《,=〇,<1),#斤5^3),?, (4>],1 = 1,2,"、1對(duì)所有樣本 的第二層稀疏編碼特征利用最大池化算法,得到第二層判別特征集t = e Ra.,.v ;
[0014] (4)合并第一層判別特征集f和第二層判別特征集§,得到樣本集Y的分層判別 特征集F,F(xiàn)= F;F ;
[0015] (5)將訓(xùn)練集和測(cè)試集對(duì)應(yīng)的分層判別特征集輸入到支撐矢量機(jī),得到測(cè)試集的 分類標(biāo)簽向量,該類標(biāo)簽向量即為該高光譜圖像的分類結(jié)果。
[0016] 上述步驟3a)中判別K-SVD字典學(xué)習(xí)方法的具體步驟為:
[0017] 第1步,基于訓(xùn)練集Ytrain,判別K-SVD字典學(xué)習(xí)方法的目標(biāo)函數(shù)如下:
【權(quán)利要求】
1. 一種基于分層稀疏判別特征學(xué)習(xí)的高光譜圖像分類方法,其特征在于,包括以下步 驟: (1) 輸入包含C類地物的高光譜遙感圖像數(shù)據(jù),每個(gè)像素即為樣本,將樣本用光譜特征 向量表示,樣本的特征維數(shù)為h,所有樣本構(gòu)成樣本集
> 其中yi為第i個(gè)樣 本,N為樣本總個(gè)數(shù),R表示實(shí)數(shù)域; (2) 隨機(jī)從每類樣本集中選出10 %的樣本作為訓(xùn)練集
,^表示訓(xùn)練集樣 本數(shù)目,剩余的90 %樣本作為測(cè)試集
,n2表示測(cè)試集樣本數(shù)目; (3) 基于訓(xùn)練集YtMin和樣本集Y,利用基于稀疏編碼的分層判別特征學(xué)習(xí)方法,得到第 一層判別特征集
及第二層判別特征集
,其中,|?為對(duì)應(yīng)于樣本集Y第i 個(gè)樣本的第一層判別特征,|為對(duì)應(yīng)于樣本集Y第i個(gè)樣本的第二層判別特征: f 3a)從訓(xùn)練集中隨機(jī)選取&個(gè)訓(xùn)練樣本作為第一層判別字典的初始化字典
I 利用判別K-SVD字典學(xué)習(xí)方法,得到第一層判別字典D; 3b)基于第一層判別字典D,利用正交匹配追蹤算法得到所有樣本的第一層稀疏編碼 特征
3c)根據(jù)所有樣本的第一層稀疏編碼特征,利用第一層判別特征學(xué)習(xí)方法,得到第一層 判別特征集
及第二層輸入特征集
3d)從訓(xùn)練集對(duì)應(yīng)的第二層輸入特征集中隨機(jī)選取K2個(gè)作為第二層判別字典的初始化 字典D' 2,結(jié)合對(duì)應(yīng)的類標(biāo)矩陣和判別矩陣,類似于第一層判別字典學(xué)習(xí)方法優(yōu)化判別字 典目標(biāo)函數(shù),得到第二層判別字典
3e)基于樣本集Y的第二層輸入特征集和第二層判別字典,利用正交匹配追蹤算法得 到每個(gè)樣本的第二層稀疏編碼特征
i= 1,2,…,N,對(duì)所有樣本的第 二層稀疏編碼特征利用最大池化算法,得到第二層判別特征集
(4) 合并第一層判別特征集|?和第二層判別特征集|,得到樣本集Y的分層判別特征集 F,
(5) 將訓(xùn)練集和測(cè)試集對(duì)應(yīng)的分層判別特征集輸入到支撐矢量機(jī),得到測(cè)試集的分類 標(biāo)簽向量,該類標(biāo)簽向量即為該高光譜圖像的分類結(jié)果。
2. 根據(jù)權(quán)利要求1所述的一種基于分層稀疏判別特征學(xué)習(xí)的高光譜圖像分類方法,其 特征在于,所述步驟3a)中判別K-SVD字典學(xué)習(xí)方法的具體步驟為: 第1步,基于訓(xùn)練集YtMin,判別K-SVD字典學(xué)習(xí)方法的目標(biāo)函數(shù)如下:
其中,上述式子第一項(xiàng)為重構(gòu)誤差項(xiàng),第二項(xiàng)為判別稀疏編碼約束項(xiàng),第三項(xiàng)為分類誤 差項(xiàng),D表示第一層判別字典,包含Ki個(gè)字典原子,每個(gè)原子維數(shù)為d,W表示分類變換矩陣, A表示線性變換矩陣,X表示稀疏編碼系數(shù)矩陣,||*|表示12范數(shù)的平方和,a和P表示平 衡類標(biāo)判別項(xiàng)和分類誤差項(xiàng)的正則參數(shù),取值范圍是1?5, 表示理想狀況下的 判別稀疏編碼系數(shù)矩陣,若D中第k個(gè)字典原子與訓(xùn)練樣本集YtMin中第i個(gè)樣本屬于同一 類時(shí),則Qki值為1,不同類時(shí)為〇,HeE&B|表示訓(xùn)練樣本的類標(biāo)矩陣,若Ytrain中第i個(gè)樣 本屬于第c(c= 1,2,…,C)類,1^為1,否則為0,\表示稀疏編碼系數(shù)矩陣X的第i列向 量,II?II:表示h范數(shù),e為定義的1(T6 ; 第2步,為了求解判別K-SVD字典學(xué)習(xí)方法的目標(biāo)函數(shù),改寫為:
其中,
,(0T表示矩陣的 轉(zhuǎn)置,對(duì)該目標(biāo)函數(shù)利用K-SVD字典學(xué)習(xí)方法進(jìn)行求解,從而得到第一層判別字典D。
3. 根據(jù)權(quán)利要求1所述的一種基于分層稀疏判別特征學(xué)習(xí)的高光譜圖像分類方法,其 特征在于,所述步驟3b)中正交匹配追蹤算法的具體步驟為: 第1步,基于第一層判別字典D,正交匹配追蹤算法的目標(biāo)優(yōu)化函數(shù)如下:
其中,yi表示樣本集Y的第i個(gè)樣本,Zi表示yi的稀疏編碼系數(shù),S為定義的1(T6 ; 第2步,構(gòu)造殘差項(xiàng),殘差項(xiàng)構(gòu)造為r?=yi,i= 1,2…N,索引集A°SK維零向量, 初始化變量J= 1 ; 第3步,找出殘差與字典D中的第j列+內(nèi)積最大所對(duì)應(yīng)的下標(biāo)入,即
第4步,更新索引集Aa),Aa)(J)=入;更新所選擇的字典原子列構(gòu)成的集合口^ =D(:,人《(1:刀),用最小二乘法得到了階逼近的
,新殘差!^ = Yi-D^Zi,J=J+1 ; 第5步,判斷是否迭代結(jié)束:如果J彡K且仍有yi未作為殘差項(xiàng),則返回第2步,否則, 若J<K且yi,i= 1,2…N都作為殘差項(xiàng)則程序結(jié)束,若J>K,則返回到第3步繼續(xù)執(zhí)行。
4. 根據(jù)權(quán)利要求1所述的一種基于分層稀疏判別特征學(xué)習(xí)的高光譜圖像分類方法,其 特征在于,所述步驟3c)中第一層判別特征學(xué)習(xí)方法的具體步驟為: 第1步,以每個(gè)樣本的稀疏編碼特征Zi,i= 1,2,…,N為中心,取鄰域窗口大小為 (2m+l)X(2m+l)內(nèi)所有樣本的稀疏編碼特征構(gòu)成稀疏編碼塊Zi,i= 1,2,…,N,Zi為 (2m+l)X(2m+l)XI的一個(gè)三維矩陣; 第2步,對(duì)每個(gè)樣本的稀疏編碼塊21進(jìn)行分塊,利用(m+l)X(m+l)的滑動(dòng)窗口,劃窗 步長(zhǎng)為m,從上到下,從左到右遍歷Zy依次提取稀疏編碼表示子塊
和 Z,H),總共4個(gè)子塊,每個(gè)子塊的規(guī)模為(m+1)X(m+1)XI; 第3步,依次對(duì)得到的4個(gè)子塊進(jìn)行空間金字塔最大池化算法
,j= 1,2, 3, 4 其中,SM(〇表示進(jìn)行空間金字塔最大池化操作,
,j= 1,2,3,4,U代 表空間金字塔分解層數(shù),Vu是位于空間金字塔第u層的所有塊的總數(shù)目,M( ?)表示最大池 化算法,
第4步,按矩陣行組合的方式
得到第i個(gè)樣本的第一層判別特征I;,按矩陣列組合的方式
得到第i個(gè)樣本的第二層輸入特征。
【文檔編號(hào)】G06K9/66GK104408478SQ201410647211
【公開(kāi)日】2015年3月11日 申請(qǐng)日期:2014年11月14日 優(yōu)先權(quán)日:2014年11月14日
【發(fā)明者】張向榮, 焦李成, 梁云龍, 馬文萍, 侯彪, 劉若辰, 馬晶晶, 白靜 申請(qǐng)人:西安電子科技大學(xué)