專利名稱:一種基于上下文約束的目標(biāo)識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于遙感圖像處理領(lǐng)域,更具體地,涉及一種基于上下文約束的目標(biāo)識(shí)別方法。
背景技術(shù):
遙感圖像的目標(biāo)檢測(cè)及識(shí)別以其重要的軍事和民用價(jià)值,在近幾年來得到了飛速發(fā)展。然而由于衛(wèi)星遙感圖像數(shù)據(jù)量大,利用人工逐一分析并提取感興趣信息是一項(xiàng)艱苦且耗時(shí)的任務(wù),這就迫切需要我們利用計(jì)算機(jī)輔助技術(shù)來對(duì)遙感圖像進(jìn)行分析。自動(dòng)目標(biāo)識(shí)別是其中一個(gè)重要且具有挑戰(zhàn)性的研究方向。目前針對(duì)這一問題,研究方法主要是以提供目標(biāo)模板或建立目標(biāo)模型,在全圖范圍內(nèi)進(jìn)行搜索匹配為主,這類方法在圖像較小時(shí)通常比較適用且效果良好,但是對(duì)于大尺度的遙感圖像來說,其計(jì)算量大,速度慢。而對(duì)遙感圖像進(jìn)行場(chǎng)景分類則是一種十分有效地解決目標(biāo)識(shí)別問題的方法。遙感圖像存儲(chǔ)了大量豐富的信息,圖像結(jié)構(gòu)復(fù)雜,既包括地形、植被、水紋等自然特征,有包括了建筑物和道路等這樣的人工地物,為目標(biāo)識(shí)別造成了一定的困難。此外,在目標(biāo)識(shí)別任務(wù)中,我們可以發(fā)現(xiàn),感興趣目標(biāo)往往依賴于特定的地物類型,因此,通過事先對(duì)遙感圖像進(jìn)行場(chǎng)景分類,可以為目標(biāo)識(shí)別提供上下文信息,縮小感興趣區(qū)域范圍,提高識(shí)別效率和準(zhǔn)確率。近年來,隨著模式識(shí)別技術(shù)的發(fā)展,用于場(chǎng)景分類的新的理論和方法技術(shù)相繼涌現(xiàn)。如神經(jīng)網(wǎng)絡(luò)和決策樹的分類精度一般都高于最大似然法,然而它們都不是穩(wěn)定的分類器;如將模糊理論引入神經(jīng)網(wǎng)絡(luò)的方法,可以通過構(gòu)造遙感模糊分類模型,根據(jù)隸屬度大小劃分類別,但是關(guān)于隸屬度函數(shù)的確定,至今沒有成熟的理論和法則,往往需要專家經(jīng)驗(yàn),具有主觀性,是模糊分類方法最大的缺點(diǎn)。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)的缺陷,本發(fā)明的目的在于提供一種基于上下文約束的目標(biāo)識(shí)別方法,針對(duì)的目標(biāo)為自然場(chǎng)景中的人造建筑物,通過對(duì)遙感圖像進(jìn)行基于mean-shift與改進(jìn)LBP特征的快速場(chǎng)景分類,為目標(biāo)識(shí)別提供有效的上下文約束信息,并根據(jù)目標(biāo)在場(chǎng)景中與背景的空間位置依存關(guān)系,在特定場(chǎng)景區(qū)域內(nèi)提取特征,識(shí)別感興趣目標(biāo),提高目標(biāo)識(shí)別效率和準(zhǔn)確率。為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于上下文約束的目標(biāo)識(shí)別方法,包括以下步驟(I)接收遙感目標(biāo)圖像,利用RGB將其轉(zhuǎn)化為灰度圖像,并利用mean-shift方法對(duì)灰度圖像進(jìn)行區(qū)域分割,以生成初始分割圖像(2)采用區(qū)域生長(zhǎng)法對(duì)初始分割圖像進(jìn)行標(biāo)記,使得輸出結(jié)果中所有的點(diǎn)都是由1、中的某個(gè)值進(jìn)行標(biāo)記,該值表示該點(diǎn)所在連通域的序號(hào),同一個(gè)連通域內(nèi)使用相同的標(biāo)記值,不同連通域使用不同的標(biāo)記值,其中N表示輸出連通域的個(gè)數(shù);
(3)根據(jù)步驟(2)的標(biāo)記結(jié)果采用改進(jìn)LBP算法對(duì)灰度圖像進(jìn)行場(chǎng)景分類;(4)根據(jù)步驟(3)獲得的場(chǎng)景類別標(biāo)記圖,采用基于場(chǎng)景上下文約束的方法計(jì)算感興趣區(qū)域。(5)根據(jù)步驟(4)中的感興趣區(qū)域結(jié)果,計(jì)算每個(gè)感興趣區(qū)域框內(nèi)的特征向量。(6)將上述步驟(5)中得到的特征向量輸入到預(yù)先訓(xùn)練好的分類模型中,輸出分類結(jié)果,識(shí)別目標(biāo)。步驟(I)具體包括以下子步驟(1-1)對(duì)灰度圖像進(jìn)行mean-shift濾波,并存儲(chǔ)濾波后灰度圖像的所有η個(gè)像素點(diǎn)(Z1, Z2,. . . Zn)在d維空間的收斂點(diǎn)(y:,。,Z2,。,. . . Zn c),其中d為正整數(shù);(1-2)選取像素點(diǎn)集合(Zl,z2,. . . Zn)中在空間域中小于閾值113且在頻域中小于閾值&的m個(gè)像素點(diǎn),生成一個(gè)聯(lián)合域集合(C1, C2,. . . Cm),其中hs為正整數(shù),表示在圖像平滑時(shí)采用的空間域帶寬大小,hr為正的浮點(diǎn)數(shù)類型,表示圖像平滑時(shí)采用的值域帶寬;(1-3)為η個(gè)像素點(diǎn)分別分配標(biāo)記值(L1, L2, . . . Ln),對(duì)于η個(gè)像素點(diǎn)中的第i個(gè)像素點(diǎn),須滿足當(dāng)Li等于(1,2…m)中的一個(gè)元素P時(shí),有Zi e Cp ;(1-4)去除空間域上圖像區(qū)域大小小于M的圖像區(qū)域,并將其合并至相鄰區(qū)域中,以形成N個(gè)連通域,N個(gè)連通域形成初始分割圖像Iseg ;其中M值表示初始分割圖像中每個(gè)區(qū)域的最小像素個(gè)數(shù),且N < m ;(1-5)輸出初 始分割圖像Iseg及連通域個(gè)數(shù)N。步驟(2)具體包括以下子步驟(2-1)為初始分割圖像Iseg建立二維標(biāo)記矩陣MhXw,大小為hXw,初始化二維標(biāo)記矩陣Mhxw中的每個(gè)元素為O,并初始化二維標(biāo)記矩陣中的連通域標(biāo)記號(hào)k = O,其中h表示初始分割圖像Iseg的高度,w表示初始分割圖像Iseg的寬度,且O < k彡N ;(2-2)對(duì)二維標(biāo)記矩陣Mhxw進(jìn)行逐行逐列掃描,以判斷是否查找到一個(gè)零元素,其在矩陣M中的行列號(hào)分別為i和j,若查找到則表示在初始分割圖像Iseg中存在有未標(biāo)記的像素點(diǎn),并進(jìn)入步驟(2-3),否則繼續(xù)掃描,當(dāng)掃描到最后一個(gè)元素時(shí),進(jìn)入步驟(2-6);(2-3)設(shè)置 k=k+l,并設(shè)置 M(i,j) = k ;(2-4)在二維標(biāo)記矩陣Mhxw中以(i,j)為中心點(diǎn)進(jìn)行8鄰域搜索,以判斷是否查找到一個(gè)零元素,其在矩陣M中的行列號(hào)分別為X和y,如果有則進(jìn)入步驟(2-5),否則繼續(xù)搜索,若搜索結(jié)束,則返回步驟(2-2);(2-5)在初始分割圖像Iseg中判斷坐標(biāo)為(X,y)的像素點(diǎn)的值是否和坐標(biāo)為(i,j)的像素點(diǎn)的值相等,如果相等,則設(shè)置M(x,y) = k,返回步驟(2-4);(2-6)最終生成一個(gè)由I N中的值標(biāo)記的二維矩陣M,M中每個(gè)元素(i,j)的值P表示在原灰度圖像中像素點(diǎn)(i, j)屬于第P個(gè)連通域Regionp,其中I < p < N。步驟(3)具體包括以下子步驟(3-1)以模板窗口的方式遍歷灰度圖像,以計(jì)算該窗口內(nèi)的LBP值,即LBPu,v,其中U,V為該3X3窗口內(nèi)中心像素點(diǎn)的位置,并計(jì)算全圖中所有像素點(diǎn)的LBP值;(3-2)統(tǒng)計(jì)步驟(2)中獲得的初始分割圖像Iseg中每個(gè)連通域Regionp內(nèi)的LBP直方圖HistLBP,橫坐標(biāo)X為L(zhǎng)BP值,范圍為(Γ255,縱坐標(biāo)為該局部區(qū)域內(nèi)LBP = x出現(xiàn)的次數(shù);
(3-3)對(duì) LBP 直方圖 HistLBP 進(jìn)行歸一化,使得
權(quán)利要求
1.一種基于上下文約束的目標(biāo)識(shí)別方法,其特征在于,包括以下步驟 (1)接收遙感目標(biāo)圖像,利用RGB將其轉(zhuǎn)化為灰度圖像,并利用mean-shift方法對(duì)灰度圖像進(jìn)行區(qū)域分割,以生成初始分割圖像 (2)采用區(qū)域生長(zhǎng)法對(duì)初始分割圖像進(jìn)行標(biāo)記,使得輸出結(jié)果中所有的點(diǎn)都是由I N中的某個(gè)值進(jìn)行標(biāo)記,該值表示該點(diǎn)所在連通域的序號(hào),同一個(gè)連通域內(nèi)使用相同的標(biāo)記值,不同連通域使用不同的標(biāo)記值,其中N表示輸出連通域的個(gè)數(shù); (3)根據(jù)步驟(2)的標(biāo)記結(jié)果采用改進(jìn)LBP算法對(duì)灰度圖像進(jìn)行場(chǎng)景分類; (4)根據(jù)步驟(3)獲得的場(chǎng)景類別標(biāo)記圖,采用基于場(chǎng)景上下文約束的方法計(jì)算感興趣區(qū)域。
(5)根據(jù)步驟(4)中的感興趣區(qū)域結(jié)果,計(jì)算每個(gè)感興趣區(qū)域框內(nèi)的特征向量。
(6)將上述步驟(5)中得到的特征向量輸入到預(yù)先訓(xùn)練好的分類模型中,輸出分類結(jié)果,識(shí)別目標(biāo)。
2.根據(jù)權(quán)利要求1所述的目標(biāo)識(shí)別方法,其特征在于,步驟(I)具體包括以下子步驟 (1-1)對(duì)灰度圖像進(jìn)行mean-shift濾波,并存儲(chǔ)濾波后灰度圖像的所有η個(gè)像素點(diǎn)(Z1, Z2, . . . ζη)在d維空間的收斂點(diǎn)(Y1,。,Z2,。,. . . zn;c),其中d為正整數(shù); (1-2)選取像素點(diǎn)集合(Zl,z2,. . . zn)中在空間域中小于閾值匕且在頻域中小于閾值hr的m個(gè)像素點(diǎn),生成一個(gè)聯(lián)合域集合(C1, C2,. . . Cm),其中hs為正整數(shù),表示在圖像平滑時(shí)采用的空間域帶寬大小,hr為正的浮點(diǎn)數(shù)類型,表示圖像平滑時(shí)采用的值域帶寬; (1-3)為η個(gè)像素點(diǎn)分別分配標(biāo)記值(L1, L2,. . . Ln),對(duì)于η個(gè)像素點(diǎn)中的第i個(gè)像素點(diǎn),須滿足當(dāng)Li等于(1,2…m)中的一個(gè)元素P時(shí),有Zi e Cp ; (1-4)去除空間域上圖像區(qū)域大小小于M的圖像區(qū)域,并將其合并至相鄰區(qū)域中,以形成N個(gè)連通域,N個(gè)連通域形成初始分割圖像Iseg ;其中M值表示初始分割圖像中每個(gè)區(qū)域的最小像素個(gè)數(shù),且NSm; (1-5)輸出初始分割圖像Iseg及連通域個(gè)數(shù)N。
3.根據(jù)權(quán)利要求1所述的目標(biāo)識(shí)別方法,其特征在于,步驟(2)具體包括以下子步驟 (2-1)為初始分割圖像Iseg建立二維標(biāo)記矩陣MhXw,大小為hXw,初始化二維標(biāo)記矩陣Mhxw中的每個(gè)元素為O,并初始化二維標(biāo)記矩陣中的連通域標(biāo)記號(hào)k = O,其中h表示初始分割圖像Iseg的高度,w表示初始分割圖像Iseg的寬度,且O < k彡N ; (2-2)對(duì)二維標(biāo)記矩陣Mhxw進(jìn)行逐行逐列掃描,以判斷是否查找到一個(gè)零元素,其在矩陣M中的行列號(hào)分別為i和j,若查找到則表示在初始分割圖像Iseg中存在有未標(biāo)記的像素點(diǎn),并進(jìn)入步驟(2-3),否則繼續(xù)掃描,當(dāng)掃描到最后一個(gè)元素時(shí),進(jìn)入步驟(2-6); (2-3)設(shè)置 k=k+l,并設(shè)置 M(i,j) = k; (2-4)在二維標(biāo)記矩陣Mhxw中以(i,j)為中心點(diǎn)進(jìn)行8鄰域搜索,以判斷是否查找到一個(gè)零元素,其在矩陣M中的行列號(hào)分別為X和y,如果有則進(jìn)入步驟(2-5),否則繼續(xù)搜索,若搜索結(jié)束,則返回步驟(2-2); (2-5)在初始分割圖像Iseg中判斷坐標(biāo)為(X,y)的像素點(diǎn)的值是否和坐標(biāo)為(i,j)的像素點(diǎn)的值相等,如果相等,則設(shè)置M(x,y) = k,返回步驟(2-4); (2-6)最終生成一個(gè)由I N中的值標(biāo)記的二維矩陣M,M中每個(gè)元素(i,j)的值P表示在原灰度圖像中像素點(diǎn)(i, j)屬于第P個(gè)連通域Regionp,其中I < p < N。
4.根據(jù)權(quán)利要求1所述的目標(biāo)識(shí)別方法,其特征在于,步驟(3)具體包括以下子步驟 (3-1)以模板窗口的方式遍歷灰度圖像,以計(jì)算該窗口內(nèi)的LBP值,即LBPu, v,其中U,V為該3X3窗口內(nèi)中心像素點(diǎn)的位置,并計(jì)算全圖中所有像素點(diǎn)的LBP值;(3-2)統(tǒng)計(jì)步驟(2)中獲得的初始分割圖像Iseg中每個(gè)連通域Regionp內(nèi)的LBP直方圖 HistLBP,橫坐標(biāo)X為L(zhǎng)BP值,范圍為(Γ255,縱坐標(biāo)為該局部區(qū)域內(nèi)LBP = x出現(xiàn)的次數(shù);
5.根據(jù)權(quán)利要求1所述的目標(biāo)識(shí)別方法,其特征在于,步驟(4)具體包括以下子步驟 (4-1)將待識(shí)別目標(biāo)可能存在的場(chǎng)景類別區(qū)域作為前景區(qū)域,其他場(chǎng)景類別區(qū)域作為背景區(qū)域,分割步驟(3)中獲得的標(biāo)記圖,將前景區(qū)域內(nèi)的像素值使用灰度值255替換,背景區(qū)域的像素值采用灰度值O替換,獲得二值
圖1ltesh ;(4-2)對(duì)上述步驟(4-1)中的獲得的二值圖1ltesh進(jìn)行預(yù)處理操作;具體為對(duì)二值圖1i^sh中的255所在的局部區(qū)域進(jìn)行先膨脹后腐蝕的操作,并獲得新的二值圖1ThMsh_MW ; (4-3)根據(jù)步驟(4-2)中得到的二值圖1Thresh-MW,對(duì)原始灰度圖像進(jìn)行感興趣區(qū)域計(jì)算;(4-4)根據(jù)二值圖1ThMsh_nOT中灰度值為255的區(qū)域,在線特征圖1lim對(duì)應(yīng)區(qū)域內(nèi)滑動(dòng)一定的矩形框大小,以50個(gè)像素為步長(zhǎng),計(jì)算線段長(zhǎng)度,統(tǒng)計(jì)每個(gè)矩形框內(nèi)的線段密度分布。
6.根據(jù)權(quán)利要求1所述的目標(biāo)識(shí)別方法,其特征在于,步驟(5)具體為,對(duì)步驟(5)中提取的感興趣區(qū)域框,根據(jù)空間關(guān)系計(jì)算每個(gè)框內(nèi)的線段特征,構(gòu)成幾何結(jié)構(gòu),并采用特征袋方式組合產(chǎn)生特征向量。
7.根據(jù)權(quán)利要求1所述的目標(biāo)識(shí)別方法,其特征在于,步驟(6)具體為,以步驟(5)中的特征提取算法計(jì)算得到特征向量,并輸入到SVM分類器中進(jìn)行訓(xùn)練,生成分類模型,然后, 再將當(dāng)前計(jì)算得到的特征向量輸入到該分類模型中,計(jì)算得到目標(biāo)類別。
全文摘要
本發(fā)明公開了一種基于上下文約束的目標(biāo)識(shí)別方法,屬于遙感圖像處理領(lǐng)域,用于遙感圖像場(chǎng)景分類及目標(biāo)的檢測(cè)識(shí)別。該方法首先對(duì)圖像進(jìn)行濾波處理,然后進(jìn)行區(qū)域分割,將圖像分割為多個(gè)連通域,并對(duì)每個(gè)連通域進(jìn)行標(biāo)記,其次,計(jì)算每個(gè)連通域的特征向量,并輸入到事先訓(xùn)練好的分類器中進(jìn)行場(chǎng)景分類計(jì)算,輸出類別標(biāo)記圖,接著,在此基礎(chǔ)上,根據(jù)需要識(shí)別的目標(biāo),在標(biāo)記圖上劃定目標(biāo)可能存在的局部區(qū)域范圍,并對(duì)該局部區(qū)域進(jìn)行預(yù)處理操作,在該區(qū)域內(nèi)計(jì)算感興趣區(qū)域,最后,提取特征,并輸入到分類器中進(jìn)行識(shí)別。本發(fā)明提供了一種快速、有效的場(chǎng)景分類方法,旨在為目標(biāo)識(shí)別提供有效的上下文約束,提高識(shí)別效率和準(zhǔn)確率。
文檔編號(hào)G06K9/66GK103049763SQ201210524038
公開日2013年4月17日 申請(qǐng)日期2012年12月7日 優(yōu)先權(quán)日2012年12月7日
發(fā)明者王岳環(huán), 劉暢, 陳君靈, 王軍, 宋萌萌, 顏小運(yùn) 申請(qǐng)人:華中科技大學(xué)