一種空氣質(zhì)量pm2.5預(yù)測方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于環(huán)境監(jiān)測技術(shù)領(lǐng)域,尤其涉及一種空氣質(zhì)量PM2.5預(yù)測方法及系統(tǒng)。
【背景技術(shù)】
[0002]顆粒物質(zhì)(Particulate matter,PM),是空氣中懸浮顆粒的術(shù)語,包括灰塵、污垢、煙灰和液滴。直徑在2.5毫米至10微粒之間的“粗”顆粒(PMlO),可以被人體吸入并聚集在呼吸系統(tǒng)(呼吸道)內(nèi),直徑小于2.5微米(PM2.5)指“微細”顆粒,體積特別小(大約是人類頭發(fā)直徑的1/30)能夠被人體吸入并深入到肺部組織,影響肺功能,是目前危害最大的顆粒。粉碎研磨工序及剛鋪好或未鋪好的道路產(chǎn)生“粗”顆粒如灰塵等;“微細”顆粒源自所有類型的燃燒活動(機動車輛、電廠、燃料不完全燃燒等)及特定的工業(yè)(紡織業(yè),冶煉業(yè)等);化石燃料或垃圾焚燒過程中產(chǎn)生的氣體(硫、氮)與空氣水蒸氣及陽光發(fā)生化學反應(yīng)間接形成PM2.5。
[0003]由于PM2.5的相關(guān)影響因子數(shù)據(jù)具有明顯的時空性而且呈非線性變化,采用現(xiàn)有基于向量模式的PM2.5預(yù)測方法容易出現(xiàn)以下問題:1)容易破壞原始數(shù)據(jù)的時空結(jié)構(gòu)信息;2)容易破壞原始數(shù)據(jù)的內(nèi)在相關(guān)性,掩蓋數(shù)據(jù)原本存在的高階依賴性;3)計算復(fù)雜度以及存儲成本較高。
【發(fā)明內(nèi)容】
[0004]鑒于此,本發(fā)明實施例提供一種空氣質(zhì)量PM2.5預(yù)測方法及系統(tǒng),以解決現(xiàn)有技術(shù)存在的上述問題。
[0005]第一方面,本發(fā)明實施例提供了一種空氣質(zhì)量PM2.5預(yù)測方法,所述空氣質(zhì)量PM2.5預(yù)測方法包括:
[0006]以預(yù)定的規(guī)格對研宄區(qū)域進行網(wǎng)格化;
[0007]獲取各個網(wǎng)格內(nèi)的影響因子數(shù)據(jù)以及監(jiān)測站監(jiān)測到的空氣質(zhì)量數(shù)據(jù);
[0008]將各個網(wǎng)格內(nèi)的所述影響因子數(shù)據(jù)整合在一起構(gòu)成四階張量,并對所述四階張量進行歸一化處理;
[0009]基于歸一化處理后的影響因子張量數(shù)據(jù)以及所述空氣質(zhì)量數(shù)據(jù)中提取的PM2.5濃度數(shù)據(jù),建立張量樣本數(shù)據(jù)庫,所述張量樣本數(shù)據(jù)庫中包含訓練樣本和目標樣本;
[0010]構(gòu)建初始的支持張量回歸模型;
[0011]將所述張量樣本數(shù)據(jù)庫中包含PM2.5影響因子張量數(shù)據(jù)以及PM2.5濃度數(shù)據(jù)的訓練樣本作為輸入數(shù)據(jù),對所述初始的支持張量回歸模型進行訓練;
[0012]通過交替投影算法確定所述初始的支持張量回歸模型的參數(shù),獲得最終的支持張量回歸模型;
[0013]通過所述最終的支持張量回歸模型對所述張量樣本數(shù)據(jù)庫中的目標樣本進行預(yù)測,以獲取該目標樣本中的PM2.5濃度數(shù)據(jù)。
[0014]第二方面,本發(fā)明實施例提供了一種空氣質(zhì)量PM2.5預(yù)測系統(tǒng),所述空氣質(zhì)量PM2.5預(yù)測系統(tǒng)包括:
[0015]網(wǎng)格化單元,用于以預(yù)定的規(guī)格對研宄區(qū)域進行網(wǎng)格化;
[0016]數(shù)據(jù)獲取單元,用于獲取各個網(wǎng)格內(nèi)的影響因子數(shù)據(jù)以及監(jiān)測站監(jiān)測到的空氣質(zhì)量數(shù)據(jù);
[0017]四階張量構(gòu)建單元,用于將各個網(wǎng)格內(nèi)的所述影響因子數(shù)據(jù)整合在一起構(gòu)成四階張量,并對所述四階張量進行歸一化處理;
[0018]樣本數(shù)據(jù)庫建立單元,用于基于歸一化處理后的影響因子張量數(shù)據(jù)以及所述空氣質(zhì)量數(shù)據(jù)中提取的PM2.5濃度數(shù)據(jù),建立張量樣本數(shù)據(jù)庫,所述張量樣本數(shù)據(jù)庫中包含訓練樣本和目標樣本;
[0019]回歸模型構(gòu)建單元,用于構(gòu)建初始的支持張量回歸模型;
[0020]訓練單元,用于將所述張量樣本數(shù)據(jù)庫中包含PM2.5影響因子張量數(shù)據(jù)以及PM2.5濃度數(shù)據(jù)的訓練樣本作為輸入數(shù)據(jù),對所述初始的支持張量回歸模型進行訓練;
[0021]參數(shù)確定單元,用于通過交替投影算法確定所述初始的支持張量回歸模型的參數(shù),獲得最終的支持張量回歸模型;
[0022]預(yù)測單元,用于通過所述最終的支持張量回歸模型對所述張量樣本數(shù)據(jù)庫中的目標樣本進行預(yù)測,以獲取該目標樣本中的PM2.5濃度數(shù)據(jù)。
[0023]本發(fā)明實施例與現(xiàn)有技術(shù)相比存在的有益效果是:1)本發(fā)明實施例將影響空氣質(zhì)量的影響因子數(shù)據(jù)設(shè)計為四階張量的表達模式,該表達模式能夠保留時空數(shù)據(jù)固有的時空結(jié)構(gòu)信息及內(nèi)在相關(guān)性,從而可以大幅度提高預(yù)測的效率以及預(yù)測的準確率;2)在模型構(gòu)建上,采用支持張量回歸模型,該模型中的未知參數(shù)較少,從而可以有效避免機器學習中的過擬合問題,并可以解決研宄區(qū)域中監(jiān)測站過少帶來的小樣本問題;3)在大數(shù)據(jù)環(huán)境下,采用支持張量回歸模型可以直接對原始數(shù)據(jù)進行處理分析,從而可以大幅降低計算復(fù)雜度和存儲成本,具有較強的易用性和實用性。
【附圖說明】
[0024]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0025]圖1是本發(fā)明實施例提供的空氣質(zhì)量PM2.5預(yù)測方法的實現(xiàn)流程示意圖;
[0026]圖2是本發(fā)明實施例提供的四階張量表示的示意圖;
[0027]圖3是本發(fā)明實施例提供的支持張量回歸模型實際應(yīng)用效果的示例圖;
[0028]圖4是本發(fā)明實施例提供的空氣質(zhì)量PM2.5預(yù)測系統(tǒng)的組成結(jié)構(gòu)示意圖。
【具體實施方式】
[0029]以下描述中,為了說明而不是為了限定,提出了諸如特定系統(tǒng)結(jié)構(gòu)、技術(shù)之類的具體細節(jié),以便透切理解本發(fā)明實施例。然而,本領(lǐng)域的技術(shù)人員應(yīng)當清楚,在沒有這些具體細節(jié)的其它實施例中也可以實現(xiàn)本發(fā)明。在其它情況中,省略對眾所周知的系統(tǒng)、裝置、電路以及方法的詳細說明,以免不必要的細節(jié)妨礙本發(fā)明的描述。
[0030]為了說明本發(fā)明所述的技術(shù)方案,下面通過具體實施例來進行說明。
[0031]圖1為本發(fā)明實施例提供的空氣質(zhì)量PM2.5預(yù)測方法的實現(xiàn)流程,其主要包括以下步驟:
[0032]步驟S101,以預(yù)定的規(guī)格對研宄區(qū)域進行網(wǎng)格化。
[0033]示例性的,所述預(yù)定的規(guī)格可以為1KM*1KM。
[0034]步驟S102,獲取各個網(wǎng)格內(nèi)的影響因子數(shù)據(jù)以及監(jiān)測站監(jiān)測到的空氣質(zhì)量數(shù)據(jù)。
[0035]需要說明的是,所述影響因子數(shù)據(jù)為PM2.5相關(guān)的影響因子數(shù)據(jù)。每個網(wǎng)格對應(yīng)的研宄區(qū)域可能存在監(jiān)測站,也可能不存在監(jiān)測站,對存在監(jiān)測站的研宄區(qū)域,獲取該監(jiān)測站監(jiān)測到的空氣質(zhì)量數(shù)據(jù)。
[0036]步驟S103,將各個網(wǎng)格內(nèi)的所述影響因子數(shù)據(jù)整合在一起構(gòu)成四階張量,并對所述四階張量進行歸一化處理,以突出各影響因子數(shù)據(jù)的時空效應(yīng)。
[0037]在本發(fā)明實施例中,所述四階張量由多個三階張量組成,每個三階張量包括經(jīng)度、維度和時間三個影響因子,其中經(jīng)瑋度范圍為監(jiān)測站所在網(wǎng)格覆蓋的經(jīng)瑋度,各經(jīng)瑋坐標處有所有影響因子的數(shù)據(jù)信息。所述四階張量中前三階張量分別為經(jīng)度、維度和時間;所述第四階張量為影響PM2.5的相關(guān)因子,包括但不限于:氣象因子(溫度、濕度、氣壓、風速等)、交通因子(單位面積內(nèi)的車流量、車速分布)、人口因子(單位面積內(nèi)的人口流量)、路網(wǎng)因子(高速公路分布、十字路口分布等)、興趣點因子(網(wǎng)格內(nèi)的大型工廠、公園、超市、娛樂設(shè)施、學校、賓館、機場等的分布)等,如圖2所示。
[0038]本發(fā)明實施例在全面分析并提取影響PM2.5濃度的時空影響因子數(shù)據(jù)后,將所述影響因子數(shù)據(jù)設(shè)計為面向時間、經(jīng)度、瑋度、影響PM2.5的相關(guān)因子的四階張量。將不同的影響因子以三階張量的形式表示并整合在一起,從而保留了數(shù)據(jù)的時空結(jié)構(gòu)信息及內(nèi)在相關(guān)性。
[0039]步驟S104,基于歸一化處理后的影響因子張量數(shù)據(jù)以及所述空氣質(zhì)量數(shù)據(jù)中提取的PM2.5濃度數(shù)據(jù),建