本發(fā)明涉及利用互聯(lián)網地圖數(shù)據進行地表覆蓋變化檢測的方法及系統(tǒng)。
背景技術:
地表覆蓋及變化是環(huán)境變化研究、地理世情監(jiān)測、可持續(xù)發(fā)展規(guī)劃等不可或缺的重要基礎信息和關鍵參量,對于研究地球系統(tǒng)的能量平衡、碳循環(huán)及其他生物地球化學循環(huán)、氣候變化等有著十分重要的意義。傳統(tǒng)的地表覆蓋變化檢測方法主要基于遙感影像,通過對比不同時期遙感影像中的光譜信息,提取地表覆蓋類型及其變化信息。該方法耗時耗力、生產周期長,無法滿足地表覆蓋產品快速更新的需求。因此,需要發(fā)展一種新的地表覆蓋變化快速檢測方法。
目前,已經出現(xiàn)了諸多應用眾源地理數(shù)據進行地表覆蓋變化檢測的方法。例如,“johnson,briana.,andkotaroiizuka."integratingopenstreetmapcrowdsourceddataandlandsattime-seriesimageryforrapidlanduse/landcover(lulc)mapping:casestudyofthelagunadebayareaofthephilippines."appliedgeography67(2016):140-149.”中利用openstreetmap中的建筑物、水體、綠地數(shù)據,作為地表覆蓋變化的參考數(shù)據,并用于遙感數(shù)據中地表覆蓋類型的變化檢測?!癴onte,cidáliacosta,etal."generatingup-to-dateanddetailedlanduseandlandcovermapsusingopenstreetmapandglobeland30."isprsinternationaljournalofgeo-information6.4(2017):125.”中將所有osm中的數(shù)據類型分為不同的地表覆蓋類型,對globeland30中2010年的地表覆蓋數(shù)據進行變化檢測。上述研究通過利用眾源地理數(shù)據,實現(xiàn)了地表覆蓋的快速變化檢測。然而,由于眾源地理數(shù)據大多來自未經過訓練的志愿者,其數(shù)據質量無法保證,并且其覆蓋范圍為志愿者主要活動區(qū)域,數(shù)據更新也無法保證。因此,將其做為數(shù)據源進行地表覆蓋變化檢測,在一定程度上影響了精度。
近年來,隨著互聯(lián)網地圖公司的興起,以及商用互聯(lián)網地圖的廣泛應用,出現(xiàn)了諸如百度地圖、高德地圖等互聯(lián)網地圖數(shù)據。這些數(shù)據來源于專業(yè)的商業(yè)公司,其精度高、更新實時、覆蓋面廣,也包含了大量能夠反映地表覆蓋類型的信息。因此,將商用互聯(lián)網地圖數(shù)據應用于地表覆蓋變化檢測是一條可行途徑。
技術實現(xiàn)要素:
本發(fā)明的目的就是為了解決上述問題,提供利用互聯(lián)網地圖數(shù)據進行地表覆蓋變化檢測的方法及系統(tǒng),由于互聯(lián)網數(shù)據包含了點、線、面等多種不同的數(shù)據類型,同時其文本信息類型多樣,無法直接應用于地表覆蓋變化檢測。
為了實現(xiàn)上述目的,本發(fā)明采用如下技術方案:
利用互聯(lián)網地圖數(shù)據進行地表覆蓋變化檢測的方法,包括如下步驟:
步驟a:將地表覆蓋區(qū)域劃分為若干個柵格單元,利用每個柵格單元中內互聯(lián)網地圖數(shù)據的位置信息,將互聯(lián)網地圖數(shù)據與劃分后的柵格單元進行空間位置疊加;
步驟b:對互聯(lián)網地圖數(shù)據中的文本信息進行分類,使互聯(lián)網地圖數(shù)據的文本信息與地表覆蓋類型相對應;
步驟c:對每個柵格單元進行地表覆蓋類型的變化檢測。
優(yōu)選的,所述步驟a中地表覆蓋區(qū)域的柵格單元劃分:依據需要進行變化檢測的地表覆蓋產品的分辨率,將地表覆蓋區(qū)域劃分n個與分辨率相同的柵格單元ri,j,其中,r為劃分的柵格單元,i為柵格單元r的行數(shù),j為柵格單元r的列數(shù)。
優(yōu)選的,所述步驟b中,對互聯(lián)網地圖數(shù)據中的文本信息進行分類:提取每個柵格單元中互聯(lián)網地圖數(shù)據的文本信息,利用層次狄利克雷過程算法,對每個柵格單元內的文本信息進行自動分類。
優(yōu)選的,所述步驟c:首先,依據需要進行變化檢測的地表覆蓋產品,提取每個柵格單元中包含的原有地表覆蓋類型cl;繼而,依據步驟b中的文本信息分類結果,提取每個柵格單元內文本信息類型ct;如果cl=ct,則保留需要進行變化檢測的地表覆蓋產品的類型;如果cl≠ct,則保留互聯(lián)網地圖數(shù)據的文本信息類型,作為新的地表覆蓋類型,去除原有地表覆蓋產品的類型,從而完成地表覆蓋的變化檢測。
步驟b例如,互聯(lián)網地圖數(shù)據中的“購物商場”歸類為地表覆蓋中的“人造地表”類型,“高爾夫球場”歸類為“草地”。
所述步驟b包括:
步驟b1:提取每個柵格單元中互聯(lián)網地圖數(shù)據的文本信息,將每個柵格單元內的文本信息作為一個文檔di;所有文檔定義為d∈{d1,d2,d3....dn},其中,n為所有地表覆蓋柵格單元的數(shù)量;
步驟b2:利用層次狄利克雷過程算法,對每個柵格單元內的文本信息進行自動分類,使其與地表覆蓋類型相對應:
利用層次狄利克雷過程算法計算得到每種地表覆蓋類型的分類概率gj,取概率最大的類型為最終的分類類型:
g0~dp(γ,h);(1)
gj~dp(α,g0);(2)
其中,g0、gj為兩個狄利克雷過程,h為假設的度量空間的一個分布,γ、α分別為滿足公式(1)(2)中狄利克雷分布的兩個參數(shù),由經驗值取得;
其中,狄利克雷過程g的計算公式如下:
其中,dir(·)為狄利克雷分布,計算公式為:
其中,b(α)為對于參數(shù)α的b(·)函數(shù),計算公式為:
其中,γ(·)為gamma函數(shù),表示為αi的階乘。
利用互聯(lián)網地圖數(shù)據進行地表覆蓋變化檢測的系統(tǒng),包括:
疊加模塊:將地表覆蓋區(qū)域劃分為若干個柵格單元,利用每個柵格單元中內互聯(lián)網地圖數(shù)據的位置信息,將互聯(lián)網地圖數(shù)據與劃分后的柵格單元進行空間位置疊加;
分類模塊:對互聯(lián)網地圖數(shù)據中的文本信息進行分類,使互聯(lián)網地圖數(shù)據的文本信息與地表覆蓋類型相對應;
檢測模塊:對每個柵格單元進行地表覆蓋類型的變化檢測。
優(yōu)選的,所述疊加模塊中地表覆蓋區(qū)域的柵格單元劃分:依據需要進行變化檢測的地表覆蓋產品的分辨率,將地表覆蓋區(qū)域劃分n個與分辨率相同的柵格單元ri,j,其中,r為劃分的柵格單元,i為柵格單元r的行數(shù),j為柵格單元r的列數(shù)。
優(yōu)選的,所述分類模塊中,對互聯(lián)網地圖數(shù)據中的文本信息進行分類:提取每個柵格單元中互聯(lián)網地圖數(shù)據的文本信息,利用層次狄利克雷過程算法,對每個柵格單元內的文本信息進行自動分類。
優(yōu)選的,所述檢測模塊:首先,依據需要進行變化檢測的地表覆蓋產品,提取每個柵格單元中包含的原有地表覆蓋類型cl;繼而,依據步驟b中的文本信息分類結果,提取每個柵格單元內文本信息類型ct;如果cl=ct,則保留需要進行變化檢測的地表覆蓋產品的類型;如果cl≠ct,則保留互聯(lián)網地圖數(shù)據的文本信息類型,作為新的地表覆蓋類型,去除原有地表覆蓋產品的類型,從而完成地表覆蓋的變化檢測。
本發(fā)明的有益效果是:首先,依照需要進行變化檢測的地表覆蓋產品的分辨率,劃分地表覆蓋區(qū)域的柵格單元;繼而,提取每個柵格單元的中互聯(lián)網地圖數(shù)據的文本信息,利用層次狄利克雷過程算法,對每個柵格單元進行地表覆蓋分類;最后,將分類后每個柵格單元的地表覆蓋類型與需要進行變化檢測的地表覆蓋產品的類型進行對比,以達到地表覆蓋變化檢測的目的。
附圖說明
圖1為地表覆蓋變化檢測方法示意圖;
圖2為北京市部分區(qū)域的高德地圖數(shù)據與地表覆蓋柵格單元疊加示意圖;
圖3(a)-圖3(b)為北京市部分地區(qū)地表覆蓋單元及地表覆蓋分類結果圖;
圖4(a)-圖4(b)為地表覆蓋變化檢測結果圖。
具體實施方式
下面結合附圖與實施例對本發(fā)明作進一步說明。
為了對本發(fā)明的技術特征、目的和效果有更加清楚的理解,現(xiàn)以北京市局部互聯(lián)網地圖數(shù)據集為例,對照附圖說明本發(fā)明的具體實施方式。
下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。
本發(fā)明所提出的一種基于poi數(shù)據的地表覆蓋分類方法,如圖1所示,所述方法基于互聯(lián)網地圖數(shù)據進行地表覆蓋變化檢測;所述地表覆蓋檢測方法包括地表覆蓋區(qū)域的柵格單元劃分和基于層次狄利克雷過程算法的互聯(lián)網地圖數(shù)據的文本信息分類;所述方法包括如下步驟:
為了對本發(fā)明的技術特征、目的和效果有更加清楚的理解,本專利的互聯(lián)網地圖選用2016年高德地圖,選取了北京市作為實施區(qū)域,應用到了高德地圖中的建筑物、水體、綠地、poi圖層。高德地圖數(shù)據作為變化檢測數(shù)據,變化前的地表覆蓋數(shù)據選用2010年globeland30地表覆蓋數(shù)據。
a:地表覆蓋區(qū)域的柵格單元劃分。依據需要進行變化檢測的地表覆蓋產品的分辨率,將地表覆蓋區(qū)域劃分n個與其分辨率相同的柵格單元ri,j,其中,r為劃分的柵格單元,i、j為柵格單元r的行數(shù)和列數(shù)。利用每個柵格單元中內互聯(lián)網地圖數(shù)據的位置信息,將互聯(lián)網地圖數(shù)據與與劃分后的柵格單元進行空間位置疊加;
圖2為北京市部分區(qū)域的高德地圖數(shù)據與地表覆蓋柵格單元疊加示意圖,共計得到3718個地表覆蓋柵格單元。
b:對互聯(lián)網地圖數(shù)據中的文本信息進行分類。提取每個柵格單元中互聯(lián)網地圖數(shù)據的文本信息,利用層次狄利克雷過程算法,對每個柵格單元內的文本信息進行自動分類,使其與地表覆蓋類型相對應。例如,互聯(lián)網地圖數(shù)據中的“購物商場”歸類為地表覆蓋中的“人造地表”類型,“高爾夫球場”歸類為“草地”。
a:提取每個柵格單元中互聯(lián)網地圖數(shù)據的文本信息,將每個柵格單元內的文本信息作為一個文檔di。所有文檔定義為d∈{d1,d2,d3....dn},其中,n為所有地表覆蓋柵格單元的數(shù)量。
以圖2的研究區(qū)域為例,提取地表覆蓋柵格單元的文本信息d,其中,每個柵格單元的文本信息作為文檔di,圖3(a)為北京市部分地區(qū)的地表覆蓋柵格單元示意圖。
b:利用層次狄利克雷過程算法,對每個柵格單元內的文本信息進行自動分類,使其與地表覆蓋類型相對應。層次狄利克雷過程算法計算得到每種地表覆蓋類型的分類概率,取其概率最大的類型為其最終的分類類型。其公式如下:
g0~dp(γ,h)(1)
gj~dp(α,g0)(2)
其中,g0、gj為兩個狄利克雷過程dp,h為假設的度量空間的一個分布,γ、α為滿足公式(1)(2)中狄利克雷分布的兩個參數(shù),由經驗值取得。其中,狄利克雷過程g的計算公式如下:
其中,d為步驟b1所述文檔,dir(·)為狄利克雷分布,其計算公式如下:
其中,b(α)為對于參數(shù)α的b(·)函數(shù)。其計算公式為:
其中,γ(·)為gamma函數(shù),表示為αi的階乘。
為了將高德地圖數(shù)據歸類為人造地表、綠地、水體和耕地等地表覆蓋類型,利用層次狄利克雷過程算法,計算每個柵格單元中文本信息的地表覆蓋分類概率,提取概率最大的地表覆蓋類型,作為每個柵格單元的地表覆蓋類型。圖3(b)為北京市部分地區(qū)地表覆蓋分類結果示意圖。
c:對每個柵格單元進行地表覆蓋類型的變化檢測。首先,依據需要進行變化檢測的地表覆蓋產品,提取每個柵格單元中其包含的原有地表覆蓋類型cl。繼而,依據步驟b中的文本信息分類結果,提取每個柵格單元內文本信息類型ct。若cl=ct,則保留需要進行變化檢測的地表覆蓋產品的類型;若cl≠ct,則保留互聯(lián)網地圖數(shù)據的文本信息類型,作為新的地表覆蓋類型,去除原有地表覆蓋產品的類型。即完成了地表覆蓋的變化檢測。
本專利將2010年globeland30中草地和林地歸類為綠地,提取每個地表覆蓋柵格單元中的globeland30地表覆蓋類型。若globeland30的地表覆蓋類型與步驟b分類所得地表覆蓋類型一致,則保留該區(qū)域globeland30的地表覆蓋類型。若地表覆蓋類型不一致,則保留該區(qū)域內高德地圖分類所得地表覆蓋類型。圖4(a)為北京市部分地區(qū)的地表覆蓋變化檢測示意圖圖,圖4(b)為北京市地表覆蓋變化檢測示意圖。
上述雖然結合附圖對本發(fā)明的具體實施方式進行了描述,但并非對本發(fā)明保護范圍的限制,所屬領域技術人員應該明白,在本發(fā)明的技術方案的基礎上,本領域技術人員不需要付出創(chuàng)造性勞動即可做出的各種修改或變形仍在本發(fā)明的保護范圍以內。