国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于概率潛語義分析模型的面向對象影像聚類方法

      文檔序號:6452749閱讀:535來源:國知局
      專利名稱:一種基于概率潛語義分析模型的面向對象影像聚類方法
      技術領域
      本發(fā)明涉及圖像分析領域,尤其是涉及一種遙感影像處理的方法。
      背景技術
      潛語義分析模型(Latent Semantic Analysis, LSA)是一種自然語言分析技術,由 Deerwester等人于年1990提出。該模型認為通過分析文檔與詞的共生矩陣,可較好地提取文檔對應的語義信息。在實際文檔識別與檢索應用中,文檔與詞之間的語義信息一般通過概率主題來表示,在此基礎上從而形成一系列的概率主題模型。一般而言,概率主題模型均擁有一個共同的理論前提,即每個文檔均是由多個主題依據(jù)不同的比例混合構成的,但是不同的概率主題模型對于文檔或主題的先驗分布擁有不同的統(tǒng)計分布假設,從而適用于不同的分析目標。由于概率主題模型可較好的分析文檔、主題以及詞之間的統(tǒng)計相關關系,該類模型在計算機視覺、模式識別等領域均有較好的應用,在自然圖像識別、檢索、場景分析中有著較成功的應用案例。與此同時,在高分辨率遙感影像的分類研究中,影像、像元以及像元的歸屬類別之間的關系,與概率主題模型求解的問題極為相似,存在一定天然的關聯(lián)關系, 可嘗試將該模型應用于遙感影像分類研究。目前使用較多的概率主題模型為概率潛語義分析(PLSA)模型與潛Dirichlet分析(LDA)模型,在不同的實際應用過程中也發(fā)展出了一系列的擴展模型。自然語言處理往往需要分析隱含于詞背后的涵義,普通的詞頻分析方法不能取得較好的結果,而潛語義分析模型(LSA)通過利用奇異值分解將高維的詞-文檔共生矩陣映射至低維的語義空間,從而體現(xiàn)出深層次語義關系。Hofmarm在LSA模型的基礎上,構建了概率潛語義分析模型(PLSA),擁有更堅實的數(shù)學基礎及易于利用的數(shù)據(jù)生成模型,可為信息提供更好的語義分析。PLSA模型分析的對象為文檔與詞匯的共生矩陣。若假設該矩陣由有M個文檔,N個詞的詞匯表構成,則共生矩陣集可被視為一個MXN的矩陣。該共生矩陣中的任何一個文檔可視為文檔集D = W1, d2,…,dM}中的一個數(shù)據(jù),任何一個詞均可視為詞匯集W= Iw1, w2,···,%}中的一個數(shù)據(jù)。共生矩陣中每一個文檔與每一個詞的語義關系需要通過一個主題來聯(lián)系起來,這個主題可被視為潛變量集Z= Iz1, z2,···, zj中的一個數(shù)據(jù)。PLSA模型是通過文檔與詞的共生矩陣來分析文檔集、詞匯集與潛變量集之間的關聯(lián)關系,從而獲取文檔與詞的語義信息。在PLSA模型中,文檔、潛變量及詞的概率生成模型通??啥x為·文檔Cli歸屬于文檔集D的概率為P (Cli);·文檔Cli中潛變量Zk的條件概率為P (zk/dj ;·文檔Cli中潛變量Zk對應詞Wj的條件概率為P (wj/zk);將概率生成模型中的條件概率可轉換一定的聯(lián)合概率模型,具體公式如式(1)與 (2)所示。P(C^Wj)=P(Cli)P(WjAli)(1)
      權利要求
      1.一種高分辨遙感影像的聚類分析方法,其特征在于該方法包括如下步驟1)影像文檔的生成;2)影像最佳聚類個數(shù)的確定;3)利用影像文檔結合PLSA模型獲取每文檔中視覺詞對應主題類型的條件概率分布;4)結合視覺詞的多個鄰域文檔計算原始影像中每個像元對應于每個聚類類型的條件概率分布,最終選擇使最大的聚類類型作為像元的聚類類型。
      2.如權利要求1所述的高分辨遙感影像的聚類分析方法,其特征在于該方法中步驟1)為影像文檔以是hXh的子影像塊來表示的,而影像文檔集是通過將原始影像劃分為具備一定重疊程度的子影像塊來實現(xiàn)生成的。
      3.如權利要求1所述的高分辨遙感影像的聚類分析方法,其特征在于該方法中步驟1)為影像文檔集依據(jù)影像文檔生成過程中重疊程度的不同而劃分為影像訓練文檔集與影像推斷文檔集,其中不重疊的影像文檔構影像訓練文檔集,而重疊的影像文檔構成影像推斷文檔集。
      4.如權利要求2或3所述的高分辨遙感影像的聚類分析方法,其特征在于該方法中步驟1)為只有訓練文檔被用來估計視覺詞與主題之間的條件概率分布P(w|z);當P(w|z)被估計出來后,訓練文檔中視覺詞與主題之間的條件概率分布具備典型性,影像推斷文檔集中的視覺詞與主題的條件概率分布符合相同的分布;然后在固定視覺詞與主題的條件概率分布P(w|z)的基礎上,通過影像推斷文檔集的EM算法迭代推斷出每個文檔中每個視覺詞對應主題的條件概率分布P (z I d,w),從而能夠獲取原始影像中每個像元在其鄰域文檔中對應主題的條件概率分布。
      5.如權利要求1所述的高分辨遙感影像的聚類分析方法,其特征在于該方法中步驟2)為聚類中心個數(shù)的選擇是通過MDL準則來實現(xiàn)的;MDL準則假設影像的特征符合高斯混合分布的特征,并利用最小描述長度的條件約束來獲取最佳聚類中心個數(shù)。
      6.如權利要求1所述的高分辨遙感影像的聚類分析方法,其特征在于該方法中步驟3)為當影像的聚類中心個數(shù)確定之后,通過利用PLSA模型來估計推斷文檔集中每個視覺詞對應主題的條件概率的分布;該條件概率的估計流程整體上可以劃分為兩部分為PLSA 模型訓練與PLSA模型推斷;影像文檔集在整體上被劃分為兩種類型,分別為訓練文檔集與推斷文檔集,而這兩種文檔集將被有效地應用于條件概率估計流程的兩個階段;在PLSA模型的訓練階段,利用訓練文檔集構建詞與文檔的詞頻共生矩陣,然后結合PLSA模型的訓練可以獲得訓練文檔集中視覺詞對應主題的條件概率P (w I ζ)。
      7.如權利要求1所述的高分辨遙感影像的聚類分析方法,其特征在于該方法中步驟4)為通過上述NSPLSA方法的基本流程,原始影像中每個像元在其鄰域文檔中的主題概率分布信息均可得到;每個像元都被多個鄰域文檔覆蓋,而利用Wj表示原始影像中的像元j時,需要通過計算條件概率分布^(Zkj, )來最終該判定該像元最終的聚類類別歸屬。
      8.如權利要求7所述的高分辨遙感影像的聚類分析方法,其特征在于該方法中步驟4) 為包括四個步驟1)、確定原始影像中每個像元對應的覆蓋該像元的所有鄰域文檔;具體而言,是通過給定的視覺詞q的坐標Ov yq)來尋找該像元對應的鄰域文檔集Dq,其中Dq中每個文檔在空間位置上均覆蓋視覺詞q ;2)、利用視覺詞q的坐標Ovyq)與鄰域文檔集Dq中鄰域文檔Cli的文檔中心坐標 (~,八)來計算視覺詞在其鄰域文檔中的概率權重PWi I Ci,q),具體計算公式為
      9.如權利要求1所述的高分辨遙感影像的聚類分析方法,其特征在于該方法包括步驟1)影像文檔以是hXh的子影像塊來表示的,而影像文檔集是通過將原始影像劃分為具備一定重疊程度的子影像塊來實現(xiàn)生成的;影像文檔集依據(jù)影像文檔生成過程中重疊程度的不同而劃分為影像訓練文檔集與影像推斷文檔集,其中不重疊的影像文檔構影像訓練文檔集,而重疊的影像文檔構成影像推斷文檔集;只有訓練文檔被用來估計視覺詞與主題之間的條件概率分布P(Wlz);當P(w|z)被估計出來后,訓練文檔中視覺詞與主題之間的條件概率分布具備典型性,影像推斷文檔集中的視覺詞與主題的條件概率分布符合相同的分布;然后在固定視覺詞與主題的條件概率分布P (W Iz)的基礎上,通過影像推斷文檔集獲取每個文檔中每個視覺詞對應主題的概率分布P (z I d,w),從而能夠獲取原始影像中每個像元在其鄰域文檔中對應主題的概率分布;步驟2)聚類中心個數(shù)的選擇是通過MDL準則來實現(xiàn)的;MDL準則假設影像的特征符合高斯混合分布的特征,并利用最小描述長度的條件約束來獲取最佳聚類中心個數(shù);步驟3)當影像的聚類中心個數(shù)確定之后,通過利用PLSA模型來估計推斷文檔集中每個視覺詞對應主題的條件概率的分布;該條件概率的估計流程整體劃分為兩部分為PLSA 模型訓練與PLSA模型推斷;影像文檔集在整體上被劃分為兩種類型,分別為訓練文檔集與推斷文檔集,而這兩種文檔集將被有效地應用于條件概率估計流程的兩個階段;在PLSA模型的訓練階段,利用訓練文檔集構建詞與文檔的詞頻共生矩陣,然后結合PLSA模型的訓練可以獲得訓練文檔集中視覺詞對應主題的條件概率P (w I ζ);步驟4)為原始影像中每個像元在其鄰域文檔中的主題概率分布信息均可得到;每個像元都被多個鄰域文檔覆蓋,而利用Wj表示原始影像中的像元j時,通過計算條件概率分布乂…仏&?)來最終該判定該像元最終的聚類類別歸屬;包括四個步驟確定原始影像中每個像元對應的覆蓋該像元的所有鄰域文檔;具體而言,是通過給定的視覺詞q的坐標Ov yq)來尋找該像元對應的鄰域文檔集Dq,其中Dq中每個文檔在空間位置上均覆蓋視覺詞q ;利用視覺詞q的坐標O^ytl)與鄰域文檔集Dq中鄰域文檔Cli的坐標信息(、,來計算視覺詞在其鄰域文檔中的概率權重PWi I Ci,q),具體計算公式為
      全文摘要
      本發(fā)明涉及一種基于概率潛語義分析(PLSA)模型的面向對象影像聚類方法。通過將影像分割為不同尺寸的矩形影像塊并引入計算機視覺的圖像分析方法,從而將影像像素視為視覺詞、影像塊視為影像文檔、像元歸屬的主題視為聚類中心。依據(jù)影像塊的重疊程度將影像文檔劃分為訓練文檔集與推斷文檔集,然后利用訓練文檔訓練PLSA模型可獲取影像聚類的最佳聚類中心與訓練文檔中視覺詞與主題的先驗概率。將推斷文檔中的視覺詞的先驗概率視為與訓練文檔中的先驗概率一致,利用PLSA模型的EM算法循環(huán)迭代推斷出文檔集中每個文檔中視覺詞的主題類型,從而確定出每個視覺詞在其鄰域文檔中的主題類型。分析視覺詞與領域文檔的距離并進行一定的高斯距離權重分配,選擇權重最大的主題視為聚類類型,從而將空間信息引入聚類算法,最終形成面向對象的影像聚類結果。本發(fā)明方法可以得到一般單純使用像元信息進行聚類所無法實現(xiàn)的效果,從而可以滿足不同高分辨率遙感影像分析與應用的需求。
      文檔編號G06K9/62GK102314610SQ201010220330
      公開日2012年1月11日 申請日期2010年7月7日 優(yōu)先權日2010年7月7日
      發(fā)明者唐宏, 易文斌, 陳云浩 申請人:北京師范大學
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1