域空氣質(zhì)量估計(jì)方法流程圖;
[0028] 圖2是本發(fā)明城市的網(wǎng)格劃分示意圖;
[0029] 圖3是本發(fā)明訓(xùn)練階段的流程圖;
[0030] 圖4是本發(fā)明的組合分類器最優(yōu)子集搜索過(guò)程示意圖;
[0031] 圖5是本發(fā)明估計(jì)階段的流程圖。
【具體實(shí)施方式】
[0032] 下面結(jié)合具體實(shí)施例對(duì)本發(fā)明進(jìn)行進(jìn)一步描述,但本發(fā)明的保護(hù)范圍并不僅限于 此:
[0033] 實(shí)施例:如圖1所示,一種基于協(xié)同訓(xùn)練的城市區(qū)域空氣質(zhì)量估計(jì)方法,包括預(yù)處 理階段、訓(xùn)練階段、估計(jì)階段;
[0034] 預(yù)處理階段包括:
[0035] 1)把城市劃分成不相交的網(wǎng)格,每個(gè)網(wǎng)格g具有相同的長(zhǎng)和寬,g. A表示g的影響 區(qū)域,由g及其周圍的八個(gè)網(wǎng)格組成。如圖2所示,每個(gè)小正方形是一個(gè)網(wǎng)格,帶陰影的小 正方形網(wǎng)格的影響區(qū)域?yàn)榇蠛诳蛘叫螀^(qū)域。每個(gè)網(wǎng)格區(qū)域g的空氣質(zhì)量視為一樣,所以 g的大小不能太大,如可設(shè)為IkmX Ikm ;
[0036] 2)找到含有空氣監(jiān)測(cè)站點(diǎn)的網(wǎng)格并抽取這些網(wǎng)格對(duì)應(yīng)的每小時(shí)的空氣質(zhì)量和空 間特征,包括交通相關(guān)特征F t、POI相關(guān)特征Fp、路網(wǎng)結(jié)構(gòu)相關(guān)特征F1^簽到特征F。等。F t 包含網(wǎng)格影響區(qū)域范圍內(nèi)所有路段過(guò)去1小時(shí)的平均車速和車速方差大??;Fp包含網(wǎng)格影 響區(qū)域范圍內(nèi)所有POI在各個(gè)類別下的數(shù)目;^包含網(wǎng)格影響區(qū)域范圍內(nèi)高速公路路段長(zhǎng) 度和非高速公路路段長(zhǎng)度;F。包含過(guò)去1小時(shí)在網(wǎng)格影響區(qū)域范圍內(nèi)用新浪微博簽到的人 數(shù);
[0037] 3)基于式子(1)所示的歐式距離度量函數(shù),查找與網(wǎng)格g相近的k個(gè)最近的含空 氣監(jiān)測(cè)站的網(wǎng)格G,d( Xi,Xj)表示兩個(gè)特征向量Xi、Xj之間的距離,特征向量為網(wǎng)格的POI相 關(guān)特征和路網(wǎng)結(jié)構(gòu)特征,即X = [Fp, Fj ;
[0038] d (xi; Xj) = (Xi-Xj)T (Xi-Xj) (1)
[0039] 4)根據(jù)g和網(wǎng)格集合G生成訓(xùn)練樣本,建有空氣監(jiān)測(cè)點(diǎn)的網(wǎng)格生成有標(biāo)記訓(xùn)練樣 本,其余的網(wǎng)格生成未標(biāo)記的訓(xùn)練樣本。設(shè)某網(wǎng)格為^,則^和步驟3)查找的近鄰網(wǎng)格之 一 gj可生成如式子(2)所示的特征向量。其中F/表示gi的交通相關(guān)特征,f表示gi的簽 到特征,分別表示 gi、g,J個(gè)網(wǎng)格POI相關(guān)特征的皮爾森相關(guān)系數(shù)和路 網(wǎng)結(jié)構(gòu)特征的皮爾森相關(guān)系數(shù),diSt( gi,gj)表示兩個(gè)網(wǎng)格的物理距離,P表示含空氣監(jiān)測(cè) 站的網(wǎng)格&監(jiān)測(cè)的空氣質(zhì)量值。然后,g和網(wǎng)格集合G生成如式子(3)所示的特征向量,其 中g(shù)i,g 2,…,gk表示g的k個(gè)近鄰網(wǎng)格。
【主權(quán)項(xiàng)】
1. 一種基于協(xié)同訓(xùn)練的城市區(qū)域空氣質(zhì)量估計(jì)方法,其特征在于,包括預(yù)處理階段、訓(xùn) 練階段、估計(jì)階段; 預(yù)處理階段包括: 1) 把城市劃分成不相交的網(wǎng)格,每個(gè)網(wǎng)格g內(nèi)的空氣質(zhì)量相同; 2) 抽取含有空氣監(jiān)測(cè)站點(diǎn)的網(wǎng)格對(duì)應(yīng)的每小時(shí)的空氣質(zhì)量和空間特征; 3) 基于歐式距離查找與網(wǎng)格g相近的k個(gè)最近的含空氣監(jiān)測(cè)站點(diǎn)的網(wǎng)格G ; 4) 根據(jù)網(wǎng)格g和網(wǎng)格集合G生成有標(biāo)記和無(wú)標(biāo)記的樣本; 訓(xùn)練階段: I) 半監(jiān)督學(xué)習(xí):通過(guò)對(duì)有標(biāo)記樣本進(jìn)行可重復(fù)性取樣獲得η個(gè)有標(biāo)記訓(xùn)練集,并對(duì)有 標(biāo)記訓(xùn)練集訓(xùn)練得到η個(gè)分類器;η個(gè)分類器分別對(duì)未標(biāo)記的樣本進(jìn)行標(biāo)記得到高置信度 的未標(biāo)記樣本,從中挑選樣本加入訓(xùn)練集直到挑選的新標(biāo)記樣本數(shù)目不為0,輸出分類器模 型; II) 組合分類器剪枝:設(shè)置組合分類器的剪枝度量標(biāo)準(zhǔn);采用基于Pareto算法在輸出 的分類器模型中搜索最優(yōu)的分類器組合,輸出剪枝后的組合分類器; 估計(jì)階段: i) 輸入待估計(jì)空氣質(zhì)量的位置的經(jīng)煒度信息,并根據(jù)經(jīng)煒度信息獲取所屬的網(wǎng)格g, 抽取網(wǎng)格g的空間特征Fg;抽取網(wǎng)格g所在城市的所有空氣質(zhì)量監(jiān)測(cè)站點(diǎn)所屬網(wǎng)格的空間 特征,得到特征向量Fe; ii) 基于歐式距離從Fe中查找到與F g相近的k個(gè)最近的特征向量,k個(gè)最近的特征向 量對(duì)應(yīng)k個(gè)網(wǎng)格,由k個(gè)網(wǎng)格得到網(wǎng)格集合G ; iii) 網(wǎng)格g和網(wǎng)格集合G生成一個(gè)向量; iv) 根據(jù)訓(xùn)練階段輸出的組合分類器對(duì)步驟iii)得到的特征向量進(jìn)行投票,得到并輸 出投票結(jié)果,投票結(jié)果為估計(jì)的空氣質(zhì)量值。
2. 根據(jù)權(quán)利要求1所述的一種基于協(xié)同訓(xùn)練的城市區(qū)域空氣質(zhì)量估計(jì)方法,其特征在 于,所述的空間特征包括:交通相關(guān)特征Ft、路網(wǎng)結(jié)構(gòu)相關(guān)特征POI相關(guān)特征Fp、簽到特 征Fc。
3. 根據(jù)權(quán)利要求1所述的一種基于協(xié)同訓(xùn)練的城市區(qū)域空氣質(zhì)量估計(jì)方法,其特征在 于,所述預(yù)處理階段通過(guò)如下式所示的歐氏距離度量函數(shù)查找與網(wǎng)格g相近的k個(gè)最近的 含空氣監(jiān)測(cè)站點(diǎn)的網(wǎng)格G : d (xj, Xj) 一 (Xj-Xj) (xj-Xj) 其中,(Kxi, Xj)表示兩個(gè)特征向量Xp Xj之間的距離,特征向量為網(wǎng)格的POI相關(guān)特征 和路網(wǎng)結(jié)構(gòu)特征,即X = [Fp, Fj。
4. 根據(jù)權(quán)利要求1所述的一種基于協(xié)同訓(xùn)練的城市區(qū)域空氣質(zhì)量估計(jì)方法,其特征在 于,所述預(yù)處理階段的步驟4)具體為建有空氣監(jiān)測(cè)點(diǎn)的網(wǎng)格生成有標(biāo)記訓(xùn)練樣本,集合內(nèi) 其余的網(wǎng)格生成未標(biāo)記的訓(xùn)練樣本。
5. 根據(jù)權(quán)利要求1所述的一種基于協(xié)同訓(xùn)練的城市區(qū)域空氣質(zhì)量估計(jì)方法,其特征在 于:所述訓(xùn)練階段半監(jiān)督學(xué)習(xí)的從高置信度的未標(biāo)記樣本挑選樣本加入訓(xùn)練集的挑選標(biāo)準(zhǔn) 為樣本的conf值的高低,從conf值高的樣本進(jìn)行挑選。
【專利摘要】本發(fā)明涉及一種基于協(xié)同訓(xùn)練的城市區(qū)域空氣質(zhì)量估計(jì)方法,本發(fā)明充分利用區(qū)域的空間特征,如該區(qū)域的交通狀況、路網(wǎng)結(jié)構(gòu)等特征,基于多分類器的協(xié)同訓(xùn)練的半監(jiān)督學(xué)習(xí)方法對(duì)區(qū)域的特征向量進(jìn)行建模,學(xué)習(xí)得到多個(gè)分類器;然后對(duì)這些分類器進(jìn)行剪枝,形成最終的組合分類器;用剪枝后的組合分類器模型對(duì)無(wú)空氣監(jiān)測(cè)站的區(qū)域進(jìn)行空氣質(zhì)量等級(jí)估計(jì)。該方法可以在空氣監(jiān)測(cè)站有限的情況下如何根據(jù)帶空氣監(jiān)測(cè)站的區(qū)域和無(wú)空氣監(jiān)測(cè)站的區(qū)域在空間上的各種區(qū)別估計(jì)出空氣質(zhì)量等級(jí),且估計(jì)結(jié)果準(zhǔn)確。
【IPC分類】G06K9-62
【公開(kāi)號(hào)】CN104834944
【申請(qǐng)?zhí)枴緾N201510274239
【發(fā)明人】陳嶺, 王敬昌, 趙江奇, 趙麗娜, 蔡雅雅
【申請(qǐng)人】杭州尚青科技有限公司
【公開(kāi)日】2015年8月12日
【申請(qǐng)日】2015年5月26日