專利名稱::一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,屬于高光譜數(shù)據(jù)處理方法與應(yīng)用
技術(shù)領(lǐng)域:
,適用于高光譜數(shù)據(jù)監(jiān)督分類的理論方法和應(yīng)用技術(shù)研咒。
背景技術(shù):
:高光譜遙感數(shù)據(jù)監(jiān)督分類的方法主要包括兩大類基于光譜特征匹配的方法和基于統(tǒng)計(jì)分析模型的方法。由于高光譜數(shù)據(jù)獲取過程中,受到大氣、地形、光照等條件的影響,使得其獲得的地物光譜特征變化較大,因此,基于光譜特征匹配的方法會出現(xiàn)不同地物之間混淆較大、不穩(wěn)定等問題,使得分類結(jié)果精度降低;基于統(tǒng)計(jì)分析模型的方法主要是對高光譜數(shù)據(jù)樣本的總體特征進(jìn)行統(tǒng)計(jì)分析,根據(jù)樣本采樣點(diǎn)統(tǒng)計(jì)分布特征實(shí)現(xiàn)不同地物的分類。但是在統(tǒng)計(jì)分析模型建立過程中為了實(shí)現(xiàn)精確的分類,需要對樣本進(jìn)行分布假設(shè)以及大量的統(tǒng)計(jì)參數(shù)實(shí)現(xiàn)分類建模。對數(shù)(Logistic)兩分類模型廣泛的應(yīng)用于醫(yī)學(xué)和生物學(xué),尤其在流行病學(xué)得到及其廣泛的應(yīng)用。1989年Hosmer和Lemeshow將Logistic回歸模型的響應(yīng)變量擴(kuò)展到*(*>2),使得Logistic回歸模型成功應(yīng)用到*(*>2)類別的分類問題。近年來隨著遙感技術(shù)的發(fā)展和數(shù)據(jù)處理的需求,Logisitc回歸模型被引入到遙感圖像分類應(yīng)用中。與高斯分類模型相似,Logistic是監(jiān)督分類模型,需要訓(xùn)練樣本估計(jì)模型參數(shù)。但在Logistic回歸模型中,僅僅需要對影響因變量的因素進(jìn)行線性關(guān)系假設(shè),不需要對圖像中樣本進(jìn)行任何分布假設(shè)。通常情況下,需要對高光譜數(shù)據(jù)降維后才能實(shí)現(xiàn)Logistic建模,否則將帶來龐大的計(jì)算負(fù)擔(dān),但是數(shù)據(jù)降維方法將在減少數(shù)據(jù)維數(shù)的同時丟失光譜的細(xì)節(jié)特征,從而導(dǎo)致相似類別的混淆。
發(fā)明內(nèi)容本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種不需要樣本分布假設(shè)、參數(shù)估計(jì)少的高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法。本發(fā)明的技術(shù)解決方案為一種利用分形理論實(shí)現(xiàn)較少訓(xùn)練樣本條件下的高精度高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,該方法主要利用分形理論和統(tǒng)計(jì)分析模型,通過計(jì)算光諳的多重分形譜參數(shù)實(shí)現(xiàn)Logistic建模,最后利用最大似然估計(jì)模型參數(shù)估計(jì),從而實(shí)現(xiàn)高光譜數(shù)據(jù)的監(jiān)督分類。多重分形i普主要通過光譜概率測度計(jì)算和配分函數(shù)估計(jì)得到,并根據(jù)多重分形譜的特點(diǎn)選擇a'、"mm、"max、/(j作為Logistic建模參數(shù),從而在有效降低模型估計(jì)參數(shù)數(shù)目的同時增加類間可分性。本發(fā)明一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,其步驟如下(1)讀入高光譜數(shù)據(jù);(2)確定分類類別數(shù)目,并選擇訓(xùn)練樣本和測試樣本;(3)計(jì)算多重分形譜參數(shù);(4)建立基于多重分形譜參數(shù)的對數(shù)回歸多類別分類模型;(5)利用極大似然估計(jì)進(jìn)行模型求解;(6)利用概率最大原則進(jìn)行分類,并計(jì)算分類精度。其中,步驟(1)中所述的讀入高光i普數(shù)據(jù)為X-[x"x2,…,xJ,"為像元數(shù)。其中,步驟(2)中所述的分類類別數(shù)目為J,訓(xùn)練樣本和測試樣本選擇根據(jù)參考圖像和地面調(diào)查確定,且訓(xùn)練樣本與測試樣本不相同。其中,步驟(3)中所述的多重分形譜/(cO計(jì)算如下首先計(jì)算光譜概率測度S柳式中,iV(。表示光譜曲線劃分為尺寸是5的一維小盒子的個數(shù),《.(。表示盒子尺寸為5時第/個小盒子內(nèi)所有光譜波段的輻亮度數(shù)值之和;然后估計(jì)配分函數(shù),配分函數(shù)a(。為光譜概率測度f(。的g階矩式中,《為權(quán)重因子,iV(。為尺度^下的盒子數(shù)目。再通過光譜概率測度計(jì)算與配分函數(shù)估計(jì)得到的尺度函數(shù)r(《)log2&(《)》,log2《+C(《)式中r(《)為尺度函數(shù)。最后,通過勒讓德(Legendre)變換/()與r(《)聯(lián)系起來,并得到如下關(guān)系式其中,《為權(quán)重因子。本發(fā)明建模過程中選擇的多重分形譜參數(shù)為其中,《'為多重分形語/(")最大值點(diǎn)對應(yīng)的Holder指數(shù),"她和"^表示給定條件下概率奇異性的最小值和最大值,/("^)為光譜曲線上Holder指數(shù)取最小值的波段子集分形維數(shù)。其中,步驟(4)所述的基于參考類別NC建立的基于多重分形譜參數(shù)的對數(shù)回歸多類別分類模型如下戶尸WC其中,NC為參考類別,J為類別數(shù)目,j=l,2,...,J-l,S為輸入變量屬于第j個類別的概率,^、"min、"■、/K,J分別為多重分形譜參數(shù),A,為模型待估計(jì)參數(shù),j=l,2"."J-l,i=0,l,.."4。其中步驟(5)所述的利用極大似然方法進(jìn)行模型參數(shù)估計(jì)過程如下對步驟(4)建立的模型進(jìn)行極大似然參數(shù)估計(jì),采用牛頓-拉臾遜(Newton-Raphson)迭代法解得M7為參考類別的Logistic模型參數(shù)的極大似然估計(jì)值為A=(U",A2,U,4),7'=1,2,../-1。其中,步驟(6)所述的分類準(zhǔn)則為概率最大原則,即z/f(x):maxCf;(x),尸2(x),…A(;c))貝'JxeG,x屬于第/個類別的概率最大,那么就將其歸入類別G,;分類精度分析采用混淆矩陣和Kappa系數(shù)實(shí)現(xiàn)。本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于克服了傳統(tǒng)的基于統(tǒng)計(jì)分析模型的高光語數(shù)據(jù)監(jiān)督分類方法參數(shù)估計(jì)多、樣本假設(shè)分布等局限,本方法利用多重分形理論和Logsitic模型,實(shí)現(xiàn)了高精度的地物類型分類。它具有以下的優(yōu)點(diǎn)(1)采用統(tǒng)計(jì)分析模型,解決了由于光語特征匹配高光譜遙感數(shù)據(jù)監(jiān)督分類方法受大氣、光照、地形等外界影響較大帶來的誤差增多和可靠性下降等問題;(2)利用Logistic多類別模型進(jìn)行高光譜數(shù)據(jù)分類,不需要對樣本分布進(jìn)行假設(shè);(3)引入多重分形理論,建立基于多重分形參數(shù)的Logistic多類別分類模型,有效的利用了光譜曲線的差異和細(xì)節(jié)信息,并降低了模型估計(jì)參數(shù)數(shù)目、提高了類間可分性。圖1為本發(fā)明中多重分形參數(shù)"'、"min、"max、/(",)的定義示意圖;具體實(shí)施例方式為了更好的說明本發(fā)明涉及的高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,利用PHI航空高光i普數(shù)據(jù)進(jìn)行江蘇方麓茶場地區(qū)農(nóng)作物精細(xì)分類。本發(fā)明一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,具體實(shí)現(xiàn)步驟如下(1)讀入高光譜數(shù)據(jù)讀入方麓茶場推掃高光譜成像儀(PHI)高光譜數(shù)據(jù),數(shù)據(jù)大小為210x150x64,波段區(qū)間455~805nm;(2)確定分類類別數(shù)目,并選擇訓(xùn)練樣本根據(jù)參考圖像,分類類別數(shù)目為」=6,訓(xùn)練樣本和測試樣本根據(jù)參考圖像獲得,具體的分類類別、訓(xùn)練樣本與測試樣本如下表所示;<table>tableseeoriginaldocumentpage7</column></row><table>(3)計(jì)算多重分形譜參數(shù)首先計(jì)算光譜概率測度<formula>formulaseeoriginaldocumentpage7</formula>式中,W(。表示光譜曲線劃分為尺寸是S的一維小盒子的個數(shù),S,(。表示盒子尺寸為5時第/個小盒子內(nèi)所有光讒波段的輻亮度數(shù)值之和;然后估計(jì)配分函數(shù),配分函數(shù)a(。為光譜概率測度《(。的^階矩,=1式中,《為權(quán)重因子,A^)為尺度5下的盒子數(shù)目。再通過光譜概率測度計(jì)算與配分函數(shù)估計(jì)得到的尺度函數(shù)r(《)log2&(《)《,l。g2《+C(g)式中r(《)為尺度函數(shù)。最后,通過Legendre變換/(a)與r(《)聯(lián)系起來,并得到如下關(guān)系式<formula>formulaseeoriginaldocumentpage7</formula>其中,《為權(quán)重因子。本發(fā)明建模過程中選擇的多重分形譜參數(shù)為[">,,",,/(",)]7,其中,"'為多重分形譜/(")最大值點(diǎn)對應(yīng)的Holder指數(shù),"隨和",表示給定條件下概率奇異性的最小值和最大值,/(,J為光譜曲線上Holder指數(shù)取最小值的波段子集分形維數(shù),各參數(shù)定義如圖l所示;(4)建立基于多重分形譜參數(shù)的Logistic多類別分類模型以水(W2)^作為參考類別,得到Logistic分類模型的判別函數(shù)如下lOg(^)=A。+A,"*+A2"min+A]"max+/^/(min)尸6尸6log(,)=A。++/52amm+A3"max+A4/("咖)(5)利用極大似然估計(jì)進(jìn)行模型求解,得到的以水(W2)^作為參考類別,其余五個類別均具有一套獨(dú)立的參數(shù),得到Logistic分類模型的判別函數(shù)如下=譜".柳.-<5W.""m+S7.7脇_+"7.97氛.J《《/og^l")=-〃269+;7W9a'+277.2j。湖-+2W.卵/U(6)利用概率最大原則進(jìn)行分類,并計(jì)算分類精度分類準(zhǔn)則為概率最大原則,即,/S(x)-max(S(x),尸2(x),…A(x))則xeG,,x屬于第/個類別的概率最大,那么就將其歸入類別G,;分類精度分析采用混淆矩陣和Kappa系數(shù)實(shí)現(xiàn),如下表所示分類精度。多重分形參數(shù)Logisitc分類模型對測試樣本分類混淆矩陣8C4T6T7V2V13W2分類精度C47973000099.625%T616264000094.286%T72427301097.500%V200100240096.000%V130201970198.500%W200000譜100.00%Kappa系數(shù)0.981總體精度98.506%從利用本發(fā)明方法得到的分類結(jié)果可以看出總體分類精度達(dá)到98.506%,主要原因是經(jīng)過多重分形參數(shù)的計(jì)算,類別間的差別較明顯。水稻(C4)、茶(T7)、紅薯(V2)、及水(W2)光譜可分性較高,基于多重分形參數(shù)的Logistic監(jiān)督分類精度都在95。/。以上;對于較難區(qū)分的竹(T6)與香菜(V13),通過提取光譜曲線的多重分形參數(shù),有效的提高了地物間的可分性,建立的基于多重分形參數(shù)的Logistic監(jiān)督分類方法對竹(T6)和香菜(V13)的分類精度分別達(dá)94%與98%;多重分形譜參數(shù)的kappa系數(shù)為0.981,分類結(jié)果的一致4交高。權(quán)利要求1、一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,其特征在于它包含以下步驟(1)讀入高光譜數(shù)據(jù);(2)確定分類類別數(shù)目,并選擇訓(xùn)練樣本和測試樣本;(3)計(jì)算多重分形譜參數(shù);(4)建立基于多重分形譜參數(shù)的對數(shù)回歸多類別分類模型;(5)利用極大似然估計(jì)進(jìn)行模型求解;(6)利用概率最大原則進(jìn)行分類,并計(jì)算分類精度。2、根據(jù)權(quán)利要求1所述的一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,其中步驟(3)計(jì)算多重分形譜參數(shù)包括[">m,","_,/("m』7,其中,"'為多重分形i普/(")最大值點(diǎn)對應(yīng)的Holder指數(shù),"自和"^表示給定條件下概率奇異性的最小值和最大值,/("^)為光譜曲線上Holder指數(shù)取最小值的波段子集分形維數(shù)。3、根據(jù)權(quán)利要求1所述的一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,其中步驟(4)建立的基于多重分形譜參數(shù)的對數(shù)回歸模型為<formula>formulaseeoriginaldocumentpage2</formula>其中,NC為參考類別,J為類別數(shù)目,j=l,2,...,J-l,巧為輸入變量屬于第j個類別的概率,a'、amin、《_、/(_)分別為多重分形譜參數(shù),A,為模型待估計(jì)參數(shù),j=l,2,...,J-l,i=0,l,...,4。全文摘要一種高光譜遙感數(shù)據(jù)多類別監(jiān)督分類方法,包含以下步驟(1)讀入高光譜數(shù)據(jù);(2)確定類別數(shù)目,并選擇訓(xùn)練樣本和測試樣本;(3)計(jì)算多重分形譜參數(shù);(4)建立基于多重分形譜參數(shù)的對數(shù)回歸多類別分類模型;(5)利用極大似然估計(jì)進(jìn)行模型求解;(6)利用概率最大原則進(jìn)行分類,并計(jì)算分類精度。該方法不需要對變量的概率分布進(jìn)行任何假設(shè),并且分類器模型中需要估計(jì)的參數(shù)數(shù)目較少,通過多重分形特征增加類內(nèi)一致性的同時提高了類間的可分性。因而,該方法在訓(xùn)練樣本的數(shù)量較小的情況下能夠獲得較高的分類精度。文檔編號G06K9/66GK101667253SQ200910093539公開日2010年3月10日申請日期2009年9月25日優(yōu)先權(quán)日2009年9月25日發(fā)明者娜李,牛志宇,賈國瑞,趙慧潔申請人:北京航空航天大學(xué)