一種稀疏自適應(yīng)半監(jiān)督多流形學(xué)習(xí)的高光譜影像分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及高光譜數(shù)據(jù)處理方法與應(yīng)用技術(shù)領(lǐng)域,具體涉及一種稀疏自適應(yīng)半監(jiān) 督多流形學(xué)習(xí)的高光譜影像分類方法。
【背景技術(shù)】
[0002] 高光譜遙感技術(shù)自20世紀(jì)80年代以來快速發(fā)展,其影像記錄了地物目標(biāo)的連續(xù) 光譜,包含的信息更豐富,具備了識別更多種類的地物目標(biāo)以及更高精度進(jìn)行目標(biāo)分類的 能力。但由于高光譜數(shù)據(jù)由大量波段構(gòu)成高維特征空間,大多數(shù)算法的復(fù)雜度隨維數(shù)呈指 數(shù)關(guān)系增長,對其處理需要更大的計(jì)算量,且其波段間具有高度相關(guān)性和冗余性,同時存在 維數(shù)很高,分類時易因Hughes現(xiàn)象而無法獲得理想結(jié)果等問題??茖W(xué)家通過研宄發(fā)現(xiàn):高 光譜數(shù)據(jù)可被描述為在低維嵌入空間上的流形(Manifold),即:高維空間的點(diǎn)是在少數(shù)獨(dú) 立變量的共同作用下在觀測空間張成一個流形,如果能有效的發(fā)現(xiàn)其內(nèi)在的主要變量,便 能更好地了解高維數(shù)據(jù)的本質(zhì)屬性和特點(diǎn)。維數(shù)約減是解決以上問題的有效辦法,能夠降 低數(shù)據(jù)的維數(shù),得到高維數(shù)據(jù)有意義的低維表示,以便理解其內(nèi)在的結(jié)構(gòu)及后續(xù)處理。
[0003] 迄今為止,在高維數(shù)據(jù)處理的研宄領(lǐng)域中,國內(nèi)外學(xué)者已經(jīng)提出了一系列較為經(jīng) 典的降維算法,主要包括:主成分分析(Principal Component Analysis,PCA)、線性判別 分析(Linear Discriminant Analysis,LDA)、獨(dú)立成分分析(Independent Component Analysis,ICA)、非負(fù)矩陣因子(Non-negative Matrix Factorization,NMF)等。這些方 法的思想就是根據(jù)一定的性能目標(biāo)來尋找一線性或非線性的空間變換,把原始信號數(shù)據(jù)壓 縮到一個低維子空間,使數(shù)據(jù)在子空間中的分布更加緊湊,為數(shù)據(jù)的更好描述提供了手段, 另外計(jì)算的復(fù)雜度也得到了大大降低。由于這些維數(shù)約簡方法具有描述性強(qiáng)、計(jì)算代價 小、易實(shí)現(xiàn)及可分性好的特點(diǎn),因而在高維數(shù)據(jù)特征提取的研宄中占據(jù)了主導(dǎo)地位。但高 光譜遙感數(shù)據(jù)具有十分復(fù)雜的非線性結(jié)構(gòu),并不全是線性分布的,子空間方法并不能揭示 出高光譜數(shù)據(jù)中的非線性特性,無法反映出數(shù)據(jù)點(diǎn)的可分性和非線性,因而使用子空間方 法對高光譜遙感數(shù)據(jù)進(jìn)行維數(shù)約簡并不能取得較好的效果。針對這些問題,He等提出了局 部保持投影(Local Preserving Projrction,LPP)和鄰域保持嵌入算法(Neighborhood Preserving Embedding,NPE)等流形學(xué)習(xí)方法,其通過相似圖保留樣本的局部近鄰結(jié)構(gòu),在 一定程度上保持了原始數(shù)據(jù)的非線性流形,但是這兩種算法依賴于人工預(yù)定義的相似圖, 要獲得好的性能往往需要更多的訓(xùn)練樣本,存在如近鄰參數(shù)選擇困難(如近鄰數(shù)k、核寬 〇 )、噪聲敏感等問題,分類效果受到限制。
[0004] 稀疏保持投影(Sparsity Preserving Projections,SPP)是最近提出的一種基 于稀疏表示理論的無監(jiān)督降維算法。該算法不同于傳統(tǒng)方法的圖構(gòu)建方式(如K-近鄰), 其利用樣本間的稀疏重構(gòu)關(guān)系建圖,是全局性的稀疏構(gòu)圖算法,并歸結(jié)為L1范數(shù)最小化問 題。SPP算法不僅利用稀疏表示的自然判別能力,而且無需人為地選擇近鄰參數(shù)值,一定程 度上緩解了近鄰參數(shù)選擇的困難。在高光譜圖像分類中,常面對的是大量的未標(biāo)記數(shù)據(jù)以 及相對較少的有標(biāo)記數(shù)據(jù)。雖然SPP算法無需對訓(xùn)練樣本進(jìn)行標(biāo)記,但是沒有有效利用標(biāo) 記樣本中所提供的鑒別信息。
[0005] 但是,上述方法都是假設(shè)數(shù)據(jù)中只存在一個單一流形,在實(shí)際應(yīng)用中,數(shù)據(jù)中存在 多個不同的流形結(jié)構(gòu)。Xiao等提出了一種多流形的面部表情識別,能夠有效地揭示出不同 面部表情的內(nèi)在多流形特性,采用了遺傳算法尋求各流形的最優(yōu)嵌入維度,再由最小化重 構(gòu)誤差分類器進(jìn)行分類,在面部表情識別中取得的較好的識別效果。Li和yang等人在人 臉識別中分別提出了非參數(shù)鑒別多流形和多流形鑒別分析,揭示了人臉數(shù)據(jù)中的多流形結(jié) 構(gòu),并取得了很好的識別效果。Tong等人提出一種多流形投影算法應(yīng)用于工業(yè)過程監(jiān)測 和故障診斷中,揭示出局部和全局流形特性,在工業(yè)監(jiān)測和故障診斷中取得了較好的效果。 Valencia-Aguirre等人提出基于多流形的非線性維數(shù)約簡方法,并用于C0IL-100數(shù)據(jù)的 可視化研宄,取得了較好的多流形結(jié)構(gòu)的可視效果。王立志等在"多線性局部與全局保持嵌 入在高光譜遙感影像分類中的應(yīng)用"一文中發(fā)現(xiàn)高光譜遙感數(shù)據(jù)中存在多個不同的低維流 形結(jié)構(gòu),采用了局部全局保持嵌入提取出了各流形的鑒別特征,在高光譜地物分類中取得 了較好的分類效果。
[0006] 在稀疏多流形的研宄中,Sun等提出了一種基于稀疏表示的多流形分析,揭示出了 不同紋理圖像的內(nèi)在特性,并取得了較好的分類結(jié)果。Elhamifar等人提出了一種稀疏流形 聚類與嵌入(Sparse Manifold Clustering and Embedding,SMCE)算法,該方法能夠自適 應(yīng)的選取來自同一流形的數(shù)據(jù),這些來自同一流形的數(shù)據(jù)點(diǎn)跨越了同一低維仿射子空間, 在此基礎(chǔ)上構(gòu)建的相似圖能更好地揭示出數(shù)據(jù)中不同流形的內(nèi)在特性,在數(shù)據(jù)聚類中具有 很好的效果,但該方法只在訓(xùn)練樣本有定義,不能直接出來新樣本,存在"樣本外學(xué)習(xí)"問 題,而且該方法沒有充分利用訓(xùn)練樣本的類別信息,限制了算法的鑒別能力。
[0007] 因此,如何從標(biāo)記數(shù)據(jù)以及未標(biāo)記數(shù)據(jù)中提取出有用的知識來改善學(xué)習(xí)性能、提 高分類精度,在高光譜圖像分類領(lǐng)域中尤為重要。
【發(fā)明內(nèi)容】
[0008] 針對現(xiàn)有技術(shù)存在的上述不足,本發(fā)明的目的在于提供一種稀疏自適應(yīng)半監(jiān)督多 流形學(xué)習(xí)的高光譜影像分類方法,其通過半監(jiān)督稀疏鑒別嵌入算法對高光譜遙感影像進(jìn)行 維數(shù)簡約,利用少量有標(biāo)記訓(xùn)練樣本以及部分無標(biāo)記訓(xùn)練樣本來發(fā)現(xiàn)蘊(yùn)藏在高維數(shù)據(jù)的內(nèi) 在屬性以及低維流形結(jié)構(gòu),以提高對高光譜遙感影像中地物類別的分類精度。
[0009] 為了實(shí)現(xiàn)上述目的,本發(fā)明采用了如下的技術(shù)手段:
[0010] 一種稀疏自適應(yīng)半監(jiān)督多流形學(xué)習(xí)的高光譜影像分類方法,包括如下步驟:
[0011] 1)讀入高光譜遙感影像數(shù)據(jù);
[0012] 2)將高光譜遙感影像中每一個數(shù)據(jù)點(diǎn)根據(jù)其光譜波段生成一個光譜數(shù)據(jù)向量,從 而由各個數(shù)據(jù)點(diǎn)的光譜數(shù)據(jù)向量組成整幅高光譜遙感影像的光譜數(shù)據(jù)矩陣;
[0013] 3)從高光譜遙感影像中選取部分?jǐn)?shù)據(jù)點(diǎn)作為樣本數(shù)據(jù)點(diǎn),由各個樣本數(shù)據(jù)點(diǎn)的光 譜數(shù)據(jù)向量組成樣本數(shù)據(jù)矩陣,并根據(jù)先驗(yàn)知識從樣本數(shù)據(jù)矩陣中選取部分樣本數(shù)據(jù)點(diǎn)的 光譜數(shù)據(jù)向量進(jìn)行已知地物類別的標(biāo)注,生成相應(yīng)的樣本類別標(biāo)簽;
[0014] 4)利用樣本數(shù)據(jù)矩陣分別對其中每個樣本數(shù)據(jù)點(diǎn)的光譜數(shù)據(jù)向量在仿射空間中 構(gòu)建稀疏優(yōu)化模型,并優(yōu)化求解得到每個樣本數(shù)據(jù)點(diǎn)對應(yīng)的仿射空間表示向量,從而得到 樣本數(shù)據(jù)矩陣對應(yīng)的仿射空間表示矩陣;
[0015] 5)根據(jù)樣本數(shù)據(jù)矩陣中標(biāo)注有樣本類別標(biāo)簽的樣本數(shù)據(jù)點(diǎn)進(jìn)行半監(jiān)督多流形劃 分,構(gòu)建所有樣本數(shù)據(jù)點(diǎn)的多流形稀疏相似圖;
[0016] 6)根據(jù)仿射空間表示矩陣和樣本數(shù)據(jù)矩陣中標(biāo)記的樣本類別標(biāo)簽,利用半監(jiān)督方 法確定多流形稀疏相似圖中各樣本數(shù)據(jù)點(diǎn)之間的相似權(quán)重值,且根據(jù)多流形稀疏相似圖中 不同流形結(jié)構(gòu)的劃分關(guān)系,得到各個流形的半監(jiān)督相似權(quán)重矩陣,進(jìn)而由各個流形的半監(jiān) 督相似權(quán)重矩陣組成多流形稀疏相似圖的半監(jiān)督相似權(quán)重對角矩陣;
[0017] 7)構(gòu)建低維嵌入目標(biāo)優(yōu)化函數(shù),利用多流形稀疏相似圖的半監(jiān)督相似權(quán)重對角矩 陣通過稀疏多流形嵌入算法計(jì)算得到各流形的投影矩陣,進(jìn)而得到每個流形中各個樣本數(shù) 據(jù)點(diǎn)相對于其投影矩陣所投影的低維嵌入特征;
[0018] 8)對高光譜遙感影像中的測試數(shù)據(jù)點(diǎn),分別利用各流形的投影矩陣對測試數(shù)據(jù)點(diǎn) 的光譜數(shù)據(jù)向量進(jìn)行投影,得到測試數(shù)據(jù)點(diǎn)的光譜數(shù)據(jù)向量分別在各流形的投影矩陣下的 低維嵌入特征;
[