本發(fā)明屬于圖像處理
技術領域:
,更進一步涉及圖像分類
技術領域:
中的一種基于非下采樣輪廓波變換(nonsubsamplecontourlettransform,nsct)和棧式自編碼器(stackedauto-encoder,sae)的高光譜圖像分類方法。本發(fā)明可應用于地質勘探領域中的高光譜圖像的分類,為地物圖像的繪制提供參考。
背景技術:
:高光譜遙感是一種具有較高光譜分辨率的成像技術,它具有“圖譜合一”的特點,所獲得的圖像數(shù)據(jù)不僅包含了地面物體非常豐富的光譜信息,而且也體現(xiàn)了地面目標的空間結構分布。遙感圖像分類就是根據(jù)少量有標記樣本預測剩余無標記樣本的類別的過程。盡管高光譜圖像較高的光譜分辨率為圖像分類提供了可能,但是高光譜圖像的精確分類仍然存在著一些難題,比如像素的維度較高、噪聲干擾、較高的空間域和光譜域冗余。傳統(tǒng)的淺層學習方法不能有效地提取有代表性的特征,造成區(qū)域分類混亂問題。考慮到相同類別的地物通常具有相似的空間結構,因此必須充分利用高光譜圖像的空間域特征,才能有效提高高光譜圖像的分類精度。yushichen等人在其發(fā)表的論文“deeplearning-basedclassificationofhyperspectraldata,”(ieeejournalofselectedtopicsinappliedearthobservationsandremotesensing,2014,7(6),2094-2107)中提出了一種基于棧式自編碼器的高光譜圖像分類方法。該方法將局部鄰域窗作為當前像素的空間域特征,然后將光譜特征和空間域特征進行融合,接著采用棧式自編碼器從融合后的空譜特征中提取出有代表性的特征,最后采用了多項式邏輯回歸分類器預測當前像素的類別。該方法雖然綜合使用了空間域和光譜域信息,但是仍然存在的不足之處是,基于鄰域窗的空域特征提取方法在提取空間域特征時,不能很好地利用空間鄰域相關性,降低神經(jīng)網(wǎng)絡模型的分類精度。西安電子科技大學在申請的專利文獻“基于收縮自編碼器的sar圖像分類方法”(專利申請?zhí)枺?01610407324.6,公開號:cn106096650a)中公開了一種基于收縮自編碼器的圖像分類方法。該方法首先對輸入sar圖像進行一層小波分解,得到1個低頻系數(shù)子帶和3個高頻系數(shù)子帶,然后將分解后的高頻系數(shù)子帶進行堆疊,最后采用棧式自編碼器對堆疊后的圖像進行分類。該方法存在的不足之處是,該方法只考慮了當前像素的水平、垂直、和對角三個方向,未能充分利用其它方向性信息。而且,該方法并未利用一些結構上的先驗知識,比如鄰域像素之間的相關性等。技術實現(xiàn)要素:本發(fā)明的目的在于克服上述已有技術的不足,提出了一種基于nsct和sae的高光譜圖像分類方法。本發(fā)明與現(xiàn)有技術中其他高光譜圖像分類技術相比,能夠充分利用空間鄰域像素的相關性,提取到魯棒性更強的空間域特征,從而提高了模型的分類準確率。本發(fā)明實現(xiàn)上述目的的思路是:先對高光譜圖像進行預處理,然后通過非下采樣輪廓波變換nsct得到像素的局部紋理特征,接著將像素的局部紋理特征向量和光譜特征向量首尾連接,最后采用棧式自動編碼器sae和softmax分類器,獲得待分類樣本集的分類結果。本發(fā)明實現(xiàn)的具體步驟如下:(1)輸入圖像:輸入一幅包含不同地物的高光譜圖像;(2)預處理:(2a)對輸入的高光譜圖像的像素值進行歸一化操作,得到歸一化圖像;(2b)采用主成分分析方法,將歸一化圖像的光譜維度降低至4維,得到降維后的圖像;(3)進行非下采樣輪廓波變換:對降維后的圖像進行非下采樣輪廓波變換nsct,得到變換域的56個高頻系數(shù)子帶;(4)選取系數(shù)子帶在56個高頻系數(shù)子帶中任意選取一個系數(shù)子帶;(5)選取正方形鄰域圖像塊(5a)在所取系數(shù)子帶中任意選取一個系數(shù);(5b)在所取系數(shù)中取一個大小為17×17像素的正方形鄰域圖像塊;(6)提取像素的局部紋理特征:(6a)按照下式,對所取正方形鄰域圖像塊中每個像素進行離散化操作,得到離散化像素:pi=f(li/m×32)其中,pi表示所取正方形鄰域圖像塊中第i個像素的離散化值,f()表示向上取整操作,li表示所取正方形鄰域圖像塊中第i個像素的值,m表示所取正方形鄰域圖像塊中像素的最大值;(6b)將所取正方形鄰域圖像塊中的所有離散化像素組成離散化矩陣;(6c)在高頻系數(shù)子帶中每個系數(shù)的離散化矩陣中,提取橫向和縱向間隔均為5的所有像素對;(6d)將所有像素對按照灰度值進行分組;(6e)將每個組的像素對個數(shù)組成灰度共生矩陣;(6f)按照下式,對灰度共生矩陣中每個元素進行歸一化操作,得到歸一化值:其中,qj表示灰度共生矩陣中第j個元素的歸一化值,pj表示灰度共生矩陣中第j個元素的值,∑表示求和操作,n表示灰度共生矩陣中元素的個數(shù);(6g)將所有的歸一化值組成歸一化矩陣;(6h)按照下式,計算歸一化矩陣的熵值,將該熵值作為像素的局部紋理特征:其中,e表示圖像塊的灰度共生矩陣的熵值,qk表示歸一化矩陣中第k個元素的值,log表示以2為底的自然對數(shù)操作;(7)判斷是否選取完所選系數(shù)子帶的所有系數(shù),若是,則執(zhí)行步驟(8);否則,執(zhí)行步驟(5);(8)判斷56個高頻系數(shù)子帶是否選取完,若是,則執(zhí)行步驟(9);否則,執(zhí)行步驟(4);(9)獲得三維圖像矩陣:對每一個像素的局部紋理特征和輸入的高光譜圖像中相同位置的光譜特征進行首尾相連,得到包含局部紋理特征和光譜特征的三維圖像矩陣;(10)選擇訓練樣例:從圖像矩陣中的每一類像素中隨機選擇10%的像素,作為訓練樣例;(11)構建棧式自編碼器sae:(11a)將訓練樣例作為自編碼器的輸入特征向量;(11b)利用隱藏層特征向量計算公式,生成第一層自編碼器隱藏層的特征向量;(11c)利用輸出層特征向量計算公式,生成第一層自編碼器輸出層的特征向量;(11d)利用自編碼器的訓練方法,優(yōu)化第一層自編碼器的參數(shù);(11e)將第一層自編碼器的隱藏層特征向量作為第二層自編碼器的輸入特征向量,采用與步驟(11b)、步驟(11c)、步驟(11d)相同的方法,構建第二層自編碼器;(12)得到全連接層的特征向量:利用全連接層特征向量公式,對第二層自編碼器的隱藏層特征向量進行非線性變換操作,得到全連接層的特征向量;(13)微調模型中的參數(shù):將全連接層的輸出特征向量作為softmax分類器的輸入特征向量,對棧式自編碼器和softmax分類器組成的神經(jīng)網(wǎng)絡模型,采用反向傳播方法微調模型中的參數(shù);(14)輸出高光譜圖像的分類結果:將圖像矩陣的每一個像素作為神經(jīng)網(wǎng)絡模型的輸入,輸出高光譜圖像的分類結果圖。本發(fā)明與現(xiàn)有技術相比具有以下優(yōu)點:第一,由于本發(fā)明將像素的鄰域圖像塊的灰度共生矩陣的熵值,作為像素的局部紋理特征,克服了現(xiàn)有技術在提取空間特征時,不能很好地利用空間鄰域相關性的缺點,使得本發(fā)明所提取的空間特征能夠更好地反映像素的局部紋理結構,特征的魯棒性更強。第二,由于本發(fā)明采用棧式自編碼器提取更高抽象層次的特征,克服了現(xiàn)有淺層學習算法造成的區(qū)域分類混亂步驟,使得本發(fā)明具有分類精度高的優(yōu)點。附圖說明圖1為本發(fā)明的流程圖;圖2為本發(fā)明仿真使用的paviauniversity圖像;圖3為本發(fā)明的仿真圖。具體實施方式下面結合附圖對本發(fā)明作進一步的詳細描述。參照圖1,本發(fā)明的具體實施步驟如下。步驟1,輸入圖像。輸入一幅包含不同地物的高光譜圖像。步驟2,預處理。對輸入的高光譜圖像的像素值進行歸一化操作,得到歸一化圖像。采用主成分分析方法,將歸一化圖像的光譜維度降低至4維,得到降維后的圖像。步驟3,進行非下采樣輪廓波變換。非下采樣輪廓波變換nsct的步驟如下:構造拉普拉斯金字塔濾波器和方向濾波器組。對降維后圖像的所有光譜子帶進行3層非下采樣輪廓波變換,每一層的方向子帶個數(shù)分別為2、4、8,得到56個高頻系數(shù)子帶和1個低頻系數(shù)子帶。步驟4,選取系數(shù)子帶在56個高頻系數(shù)子帶中任意選取一個系數(shù)子帶。步驟5,選取正方形鄰域圖像塊在所取系數(shù)子帶中任意選取一個系數(shù)。在所取系數(shù)中取一個大小為17×17像素的正方形鄰域圖像塊。步驟6,提取像素的局部紋理特征。按照下式,對所取正方形鄰域圖像塊中每個像素進行離散化操作,得到離散化像素:pi=f(li/m×32)其中,pi表示所取正方形鄰域圖像塊中第i個像素的離散化值,f()表示向上取整操作,li表示所取正方形鄰域圖像塊中第i個像素的值,m表示所取正方形鄰域圖像塊中像素的最大值。將所取正方形鄰域圖像塊中的所有離散化像素組成離散化矩陣。在高頻系數(shù)子帶中每個系數(shù)的離散化矩陣中,提取橫向和縱向間隔均為5的所有像素對。將所有像素對按照灰度值進行分組。將每個組的像素對個數(shù)組成灰度共生矩陣。按照下式,對灰度共生矩陣中每個元素進行歸一化操作,得到歸一化值:其中,qj表示灰度共生矩陣中第j個元素的歸一化值,pj表示灰度共生矩陣中第j個元素的值,∑表示求和操作,n表示灰度共生矩陣中元素的個數(shù)。將所有的歸一化值組成歸一化矩陣。按照下式,計算歸一化矩陣的熵值,將該熵值作為像素的局部紋理特征:其中,e表示圖像塊的灰度共生矩陣的熵值,qk表示歸一化矩陣中第k個元素的值,log表示以2為底的自然對數(shù)操作。步驟7,判斷是否選取完所選系數(shù)子帶的所有系數(shù),若是,則執(zhí)行步驟(8);否則,執(zhí)行步驟(5);步驟8,判斷56個高頻系數(shù)子帶是否選取完,若是,則執(zhí)行步驟(9);否則,執(zhí)行步驟(4);步驟9,獲得三維圖像矩陣。對每一個像素的局部紋理特征和輸入的高光譜圖像中相同位置的光譜特征進行首尾相連,得到包含局部紋理特征和光譜特征的三維圖像矩陣。步驟10,選擇訓練樣例。從三維圖像矩陣中的每一類像素中隨機選擇10%的像素,作為訓練樣例。步驟11,構建棧式自編碼器sae。將訓練樣例作為自編碼器的輸入特征向量。利用隱藏層特征向量計算公式,生成第一層自編碼器隱藏層的特征向量。所述的隱藏層特征向量計算公式如下:y=f(w(1)x+b(1))其中,y表示自編碼器隱藏層的特征向量,f(·)表示sigmoid非線性激活操作,w(1)表示自編碼器的輸入層和隱藏層之間的權值參數(shù),x表示自編碼器的輸入特征向量,b(1)表示自編碼器的隱藏層神經(jīng)元的偏置參數(shù)。利用輸出層特征向量計算公式,生成第一層自編碼器輸出層的特征向量。所述的輸出層特征向量計算公式如下:z=f(w(2)y+b(2))其中,z表示自編碼器輸出層的特征向量,w(2)表示自編碼器的隱藏層和輸出層之間的權值參數(shù),b(2)表示自編碼器的輸出層神經(jīng)元的偏置參數(shù)。利用自編碼器的訓練方法,優(yōu)化第一層自編碼器的參數(shù)。所述的自編碼器的訓練方法步驟如下:第一步,按照下式,計算收縮自編碼器的重構誤差值:其中,j(θ)表示自編碼器的重構誤差值,∑表示求和操作,tn={x(1),x(2),...,x(n)}表示包含n個樣例的訓練樣例集合,||·||2表示二范數(shù)的平方操作。第二步,利用隨機梯度下降算法,調整自編碼器中的權值參數(shù)和偏置參數(shù),獲得自編碼器的最小重構誤差值。將第一層自編碼器的隱藏層特征向量作為第二層自編碼器的輸入特征向量,采用與步驟(11b)、步驟(11c)、步驟(11d)相同的方法,構建第二層自編碼器。步驟12,進行非線性變換操作。利用全連接層特征向量公式,對第二層自編碼器的隱藏層特征向量進行非線性變換操作,生成全連接層的特征向量。所述的全連接層特征向量計算公式如下:s=f(w(3)y+b(3))其中,s表示全連接層的輸出特征向量,w(3)表示全連接層的權值參數(shù),b(3)表示全連接層的偏置參數(shù)。步驟13,微調模型中的參數(shù):將全連接層的輸出特征向量作為softmax分類器的輸入特征向量,對棧式自編碼器和softmax分類器組成的神經(jīng)網(wǎng)絡模型,采用反向傳播方法微調模型中的參數(shù)。步驟14,輸出高光譜圖像的分類結果。將圖像矩陣的每一個像素作為神經(jīng)網(wǎng)絡模型的輸入,輸出高光譜圖像的分類結果圖。下面結合仿真對本發(fā)明的效果做進一步說明。1、仿真實驗條件:表1paviauniversity圖像中的9類數(shù)據(jù)類別類別名稱個數(shù)1asphalt(柏油)66312meadows(草場)186493gravel(碎石)20994trees(樹木)30645paintedmetalsheets(金屬板畫)13456baresoil(裸地)50297bitumen(瀝青)13308self-blockingbricks(磚塊)36829shadows(陰影)947本發(fā)明的仿真試驗是在主頻2.6ghz的intelxeoncpue5-2692v2、內存64gb的硬件環(huán)境和theano0.8.2的軟件環(huán)境下進行的。本發(fā)明的輸入高光譜圖像為德國的反射式成像光譜儀rosis在意大利北部獲取的paviauniversity高光譜圖像,該paviauniversity高光譜圖像的大小為610×340×103,光譜波段數(shù)為103。該高光譜圖像共包括9類地物。圖2為paviauniversity圖像的真實地物類別示意圖,表1列出了9類地物的名稱以及每類地物的像素個數(shù)。2、仿真內容和仿真結果分析:在仿真實驗中所用方法為本發(fā)明方法和現(xiàn)有2種方法,其中:現(xiàn)有方法1:melgani等人在“classificationofhyperspectralremotesensingimageswithsupportvectormachines,”ieeetransactionsongeoscience&remotesensing,2004,42(8):1778-1790.中提出的分類方法,簡稱svm分類方法;現(xiàn)有方法2:cheny等人在“deeplearning-basedclassificationofhyperspectraldata,”ieeejournalofselectedtopicsinappliedearthobservations&remotesensing,2014,7(6):2094-2107.中提出的基于棧式自編碼器的分類方法,簡稱sae-lr分類方法。仿真實驗1,用本發(fā)明方法與上述的2種現(xiàn)有方法分別對paviauniversity圖像數(shù)據(jù)進行分類,結果如圖3,其中,圖3(a)為采用支持向量機svm分類器對高光譜圖像paviauniversity數(shù)據(jù)進行分類的仿真圖,圖3(b)為采用基于棧式自編碼器的分類方法對高光譜圖像paviauniversity數(shù)據(jù)進行分類的仿真圖,圖3(c)為本發(fā)明方法對高光譜圖像paviauniversity數(shù)據(jù)進行分類的仿真圖。從圖(3a)、圖(3b)和圖(3c)這三個圖中對裸地的分類結果可以看出,不同分類方法的分類效果差別很大,svm分類方法效果最差,本發(fā)明的分類方法效果最好。本發(fā)明的仿真實驗2,利用客觀評價指標,分別對本發(fā)明方法和上述2種方法的分類結果給出定量分析。在本發(fā)明的仿真實驗中,采用以下三個常用的指標來評價分類性能:第一個評價指標是總精度oa,表示正確分類的樣本占所有樣本的比例,值越大,說明分類效果越好。第二個評價指標是平均精度aa,表示每一類分類精度的平均值,值越大,說明分類效果越好。第三個評價指標是kappa系數(shù),表示混淆矩陣中不同的權值,值越大,說明分類效果越好。用上述客觀評價指標對圖3中各方法的分類性能進行評價的結果如表2。表2.各方法分類結果的定量分析一覽表方法總精度(%)平均精度(%)kappa系數(shù)本發(fā)明99.6699.5899.55svm93.4091.5591.24sae-lr96.0094.1594.74從表2可以看出,本發(fā)明較兩種現(xiàn)有方法有更好的分類性能。同基于光譜特征的svm算法相比,本發(fā)明的總精度和平均精度分別提高了6%和8%左右,這表明局部紋理特征在高光譜圖像分類任務中起著重要作用。同sae-lr算法相比,本發(fā)明的總精度和平均精度分別提高了3%和5%左右,這表明本發(fā)明中采用的空間局部特征提取算法相比于傳統(tǒng)鄰域窗的方法有很大的優(yōu)勢。綜上可知,本發(fā)明采用的空域特征提取方法可以充分地利用高光譜圖像的空間局部結構信息,具有很高的分類準確率。并且,由于本發(fā)明采用了深度神經(jīng)網(wǎng)絡結構,可以有效地提取出輸入數(shù)據(jù)中更加抽象的特征。本方法對于光譜維度較高、空間結構復雜的高光譜圖像,也具有很強的分類能力,是一種非常高效的高光譜圖像分類方法。當前第1頁12