本發(fā)明涉及遙感影像分析領(lǐng)域,特別是涉及一種基于核稀疏表示的快速遙感目標(biāo)檢測識別方法。
背景技術(shù):
由于遙感影像的復(fù)雜性,在整幅大幅面的遙感影像中檢測多類感興趣目標(biāo)物是一個較難的課題研究方向。在計算機視覺領(lǐng)域中,BOVW模型已被廣泛地研究并應(yīng)用到圖像分類與模式識別任務(wù)中。近年來,BOVW模型也被引入到遙感目標(biāo)檢測識別領(lǐng)域中,并且取得了很好的性能。然而目前所提出的方法既沒有在實施檢測識別算法前,對大幅面的遙感影像進行預(yù)處理即對興趣目標(biāo)區(qū)域的預(yù)測處理,也未能在特征編碼階段充分捕捉到所抽取特征間相似度。這分別意味著大量無意義的冗余計算與信息丟失對檢測識別性能的負面影響。更加重要的是,這些方法或者模型都是針對某一特定的目標(biāo)物提出的,這就在很大程度上限制了他們的應(yīng)用范圍。與此同時,已有文獻指出顯著圖的方法可以用來預(yù)測潛在候選興趣目標(biāo)物的區(qū)域位置,這是因為興趣目標(biāo)物在視覺機制上通常與背景有著明顯的不同。同時,已有文獻提出核稀疏表示的方法,通過核函數(shù),隱形地將輸入數(shù)據(jù)映射到高維特征空間,同時保證在特征空間的輸入數(shù)據(jù)的稀疏變得更加稀疏,這種稀疏的性質(zhì)對于修正稀疏表示的缺陷、提高數(shù)據(jù)間的鑒別性以及提升分類性能有著很好的作用。
然而,上述的方法既沒有在實施檢測識別算法前,對大幅面的遙感影像進行預(yù)處理即對興趣目標(biāo)區(qū)域的預(yù)測處理,也未能在特征編碼階段充分捕捉到所抽取特征間相似度。這分別意味著大量無意義的冗余計算與信息丟失對檢測識別性能的負面影響。更加重要的是,以上的方法或者模型都是針對某一特定的目標(biāo)物提出的,這就在很大程度上限制了他們的應(yīng)用范圍。
技術(shù)實現(xiàn)要素:
發(fā)明目的:本發(fā)明的目的是提供一種能夠解決現(xiàn)有技術(shù)中存在的缺陷的基于核稀疏表示的快速遙感目標(biāo)檢測識別方法。
技術(shù)方案:本發(fā)明所述的基于核稀疏表示的快速遙感目標(biāo)檢測識別方法包括以下步驟:
S1:創(chuàng)建四個RGB特征通道;
S2:計算給定圖像的四個特征通道的四相傅里葉變換,提取相位譜,通過逆傅里葉變換重建四個特征通道的圖像,從而生成顯著圖;
S3:對步驟S2得到的顯著圖進行二值化劃分,提取候選興趣區(qū)域;
S4:通過有效子窗搜索算法掃描搜索框得到待測圖像塊,形成遙感目標(biāo)圖像塊訓(xùn)練集;
S5:對遙感目標(biāo)圖像塊訓(xùn)練集進行SIFT特征提取,生成稀疏字典;
S6:采用空間金字塔對SIFT特征進行映射;
S7:核稀疏表示;
S8:求解核稀疏表示;
S9:目標(biāo)的空間金字塔向量表示;
S10:結(jié)合線性的支持向量機分類算法完成識別任務(wù)。
進一步,所述步驟S7中的核稀疏表示如式(1)所示:
其中v=[v1,v2,v3,…,vN]∈RN×K為稀疏編碼系數(shù),ξ為重構(gòu)殘差,K(■,■)為mercer核函數(shù),x=[x1,x2,x3,…,xN]∈RN×D為訓(xùn)練圖像集的SIFT特征,為映射后的稀疏字典,為映射后的特征集,U=[u1,u2,u3,…,uK]∈RK×D為視覺字典。
進一步,所述步驟S8中,采用基于主成分析的正交匹配追蹤算法求解核稀疏表示:設(shè)定0<ξ<<1,0<ω<<K,0<h≤K,K為稀疏度,h為主成分析降維后的維度,計算稀疏字典的核矩陣Q∈RK×K對應(yīng)的正則化特征向量,對于每個正則化特征向量,計算它的核向量Y∈R1×K,再通過矩陣B對Q與Y進行降維,結(jié)果分別為A=QBT=(a1,a2,a3,…,aK)∈RK×h和y=Y(jié)BT∈R1×h,然后以新產(chǎn)生的矩陣A作為字典,向量y作為輸入特征,運用OMP算法生成稀疏系數(shù)v∈R1×K作為圖像向量表示。
進一步,所述步驟S3中,提取候選興趣區(qū)域的方法為:二值化顯著圖,將其中正向像素點數(shù)目超過設(shè)定的閾值的區(qū)域作為候選興趣區(qū)域。
進一步,所述閾值根據(jù)式(2)進行設(shè)定:
Threshold=Mean+n×Variance, (2)
其中Mean為圖像灰度值的均值,Variance為圖像灰度值的方差,n為人為設(shè)定值。
進一步,所述步驟S5中,采用K-means++聚類算法計算SIFT特征,生成稀疏字典。
進一步,所述步驟S9中,目標(biāo)的空間金字塔向量表示是采用最大匯聚方法對核稀疏編碼進行最終的匯聚,其中的最大匯聚方法如式(3)所示:
Max:r=max(|v1|,|v1|,|v2|,|v3|,…,|vM|) (3)其中vi是步驟S8得到的V=(v1,v2,v3,…,vM)∈RM×(21K)中的元素,1≤i≤M,M為SIFT特征的個數(shù),K為稀疏度,r∈R1×(21K)為該圖像塊的最終編碼向量。
有益效果:與現(xiàn)有技術(shù)相比,本發(fā)明具有如下的有益效果:
(1)本發(fā)明提取出了具有預(yù)測性的候選興趣區(qū)域,加快了目標(biāo)檢測識別的速度、提高了目標(biāo)識別精度;
(2)本發(fā)明基于視覺字典與核稀疏表示圖像特征表示模型減少了冗余計算、加快了圖像描述速度;
(3)本發(fā)明加快了核稀疏表示。
附圖說明
圖1為本發(fā)明具體實施方式的方法示意圖;
圖2為本發(fā)明具體實施方式的空間金字塔映射的示意圖。
具體實施方式
本具體實施方式公開了一種基于核稀疏表示的快速遙感目標(biāo)檢測識別方法,如圖1所示,包括以下步驟:
S1:創(chuàng)建四個RGB特征通道RG(t)、BY(t)、I(t)和M(t),如式(1)—(4)所示;
RG(t)=R(t)-G(t) (1)
BY(t)=R(t)-G(t) (2)
M(t)=|I(t)-I(t-τ)| (4)
其中,r(t),g(t),b(t)分別代表圖像的RGB三通道,R(t)、G(t)和B(t)如式(5)—(7)所示,I(t)表示t時刻的圖像;
S2:計算給定圖像的四個特征通道的四相傅里葉變換,提取相位譜,通過逆傅里葉變換重建四個特征通道的圖像,從而生成顯著圖。
S3:對步驟S2得到的顯著圖進行二值化劃分,提取候選興趣區(qū)域;提取候選興趣區(qū)域的方法為:二值化顯著圖,將其中正向像素點數(shù)目超過設(shè)定的閾值的區(qū)域作為候選興趣區(qū)域;其中的閾值根據(jù)式(8)進行設(shè)定:
Threshold=Mean+n×Variance, (8)
其中Mean為圖像灰度值的均值,Variance為圖像灰度值的方差,n為人為設(shè)定值。因此,當(dāng)滑動窗口掃過整幅遙感影像的某個區(qū)域時,如果該圖像對應(yīng)的二值化區(qū)域內(nèi)的正像素點數(shù)目大于Threshold,則提取此時掃描窗口中的圖像塊作為候選興趣區(qū)域,否則該區(qū)域視為背景區(qū)。
S4:通過有效子窗搜索算法(ESS算法)掃描搜索框得到待測圖像塊,形成遙感目標(biāo)圖像塊訓(xùn)練集;
S5:對遙感目標(biāo)圖像塊訓(xùn)練集進行SIFT特征提取,采用K-means++聚類算法計算SIFT特征,生成稀疏字典。;
S6:采用空間金字塔對SIFT特征進行映射:對于圖像的SIFT特征通過聚類算法生成的長度為K的字典,將每個圖像按照1×1、2×2、4×4劃分成3層圖像子塊如圖2,并為各層賦權(quán)值,權(quán)重依次為1/4、1/4、1/2。對每個子塊的特征進行字典表達匯聚后串聯(lián)成21K長度的字典表示。
S7:核稀疏表示:通過將輸入特征與字典基同時映射到高維或無限維的特征空間中F進行相似度匹配從而得到更具鑒別性的稀疏系數(shù)。核稀疏表示如式(9)所示:
其中v=[v1,v2,v3,…,vN]∈RN×K為稀疏編碼系數(shù),ξ為重構(gòu)殘差,K(■,■)為mercer核函數(shù),x=[x1,x2,x3,…,xN]∈RN×D為訓(xùn)練圖像集的SIFT特征,為映射后的稀疏字典,為映射后的特征集,U=[u1,u2,u3,…,uK]∈RK×D為視覺字典。
S8:求解核稀疏表示:采用基于主成分析的正交匹配追蹤算法(KPOMP算法)求解核稀疏表示:設(shè)定0<ξ《1,0<ω《K,0<h≤K,K為稀疏度,h為主成分析降維后的維度,計算稀疏字典的核矩陣Q∈RK×K對應(yīng)的正則化特征向量,對于每個正則化特征向量,計算它的核向量Y∈R1×K,再通過矩陣B對Q與Y進行降維,結(jié)果分別為A=QBT=(a1,a2,a3,…,aK)∈RK×h和y=Y(jié)BT∈R1×h,然后以新產(chǎn)生的矩陣A作為字典,向量y作為輸入特征,運用OMP算法生成稀疏系數(shù)v∈R1×K作為圖像向量表示。
S9:目標(biāo)的空間金字塔向量表示:目標(biāo)的空間金字塔向量表示是采用最大匯聚方法對核稀疏編碼進行最終的匯聚,其中的最大匯聚方法如式(10)所示:
Max:r=max(|v1|,|v1|,|v2|,|v3|,…,|vM|) (10)
其中vi是步驟S8得到的V=(v1,v2,v3,…,vM)∈RM×(21K)中的元素,1≤i≤M,M為SIFT特征的個數(shù),K為稀疏度,r∈R1×(21K)為該圖像塊的最終編碼向量。
S10:結(jié)合線性的支持向量機分類算法完成識別任務(wù)。