一種基于大數據的建筑能耗主要影響因素分析方法
【專利摘要】本發(fā)明公開了一種基于大數據的建筑能耗主要影響因素分析方法,首先,對建筑大數據進行搜集與抽取,構建能耗數據表;然后,對所獲得的建筑大數據進行數據預處理,解決所獲得的建筑大數據中存在的數據缺失、異常、空值等問題;進一步,在建筑大數據基礎上,采用主成分分析方法對收集到的建筑大數據進行降維,減少影響因素數量且保留原始數據的主要信息,通過獲取更加優(yōu)越的新的綜合因素來構造影響建筑能耗的核心因素,為降低建筑運行能耗、實現(xiàn)建筑節(jié)能管控提供依據。
【專利說明】
-種基于大數據的建筑能耗主要影響因素分析方法
技術領域
[0001] 本發(fā)明設及一種基于大數據的建筑能耗主要影響因素分析方法。
【背景技術】
[0002] 中國的能源主要消費于工業(yè)生產、交通運輸W及建筑行業(yè)。我國建筑能耗的總量 逐年上升,在能源總消費量中所占的比例已從上世紀屯十年代末的10%,上升到27.45%, 逐漸接近Ξ成,到2014年為止,我國建筑能耗約占社會總能耗的33%。隨著城市化進程的加 快和人民生活質量的改善,我國建筑耗能比例最終還將上升至35%左右。建筑能耗所占社 會總能耗的比重已非常大,成為制約我國經濟發(fā)展的一大問題。
[0003] 影響建筑能耗的可能因素有很多,比如建筑類型、建筑用途、建筑面積、建筑長寬 比、建筑層高、墻體厚度、墻窗比、室內溫度、室內濕度、人員密度、照明時間、室外環(huán)境、上班 周期、建筑電能消耗或/和建筑用熱量等等。如何從大量因素中確定影響建筑能耗的主要因 素一直W來是研究人員與技術人員關屯、的問題。但由于因素眾多、條件各異,該問題一直W 來也未能得到完美解決。
【發(fā)明內容】
[0004] 本發(fā)明為了解決上述問題,提出了一種基于大數據的建筑能耗主要影響因素分析 方法,本方法對建筑大數據進行捜集與抽取,基于大數據分析,對建筑能耗的主要影響因素 進行挖掘,獲取更加優(yōu)越的新的綜合因素來構造影響建筑能耗的核屯、因素,為降低建筑運 行能耗、實現(xiàn)建筑節(jié)能管控提供依據。
[0005] 為了實現(xiàn)上述目的,本發(fā)明采用如下技術方案:
[0006] -種基于大數據的建筑能耗主要影響因素分析方法,包括W下步驟:
[0007] (1)對建筑大數據進行捜集與抽取,采集建筑用基本信息,確定所有影響因素,構 建建筑能耗數據表;
[000引(2)對建筑大數據進行預處理,填充缺失信息值、消除噪聲值,將建筑大數據進行 規(guī)范化,確定建筑能耗影響因素集合;
[0009] (3)對建筑大數據進行零均值化處理、方差歸一化,形成標準化矩陣,求取建筑能 耗影響因素的特征協(xié)方差矩陣;
[0010] (4)求取建筑能耗影響因素特征協(xié)方差矩陣的特征值,根據其計算各個影響因素 的貢獻率和累計貢獻率;
[0011] (5)根據累計貢獻率確定主要影響因素,構建主要影響因素決策陣,W貢獻率確認 各個主要影響因素的權重系數,線性加權求和確定核屯、因素。
[0012] 所述步驟(1)中,建筑用基本信息包括設計數據、能耗數據、環(huán)境數據、人員數據、 設備數據或/和監(jiān)控數據。
[0013] 所述步驟(1)中,建筑能耗數據表的影響因素包括抽取建筑類型、建筑用途、建筑 面積、建筑長寬比、建筑層高、墻體厚度、墻窗比、室內溫度、室內濕度、人員密度、照明時間、 室外環(huán)境、上班周期、建筑電能消耗或/和建筑用熱量,每一類影響因素包括多個樣本。
[0014] 所述步驟(2)中,對建筑大數據的缺失值進行填充,若存在數據為零,那么判定該 數據為缺失值,使用均值填充法對該位置的數據進行缺失值的填充操作。
[0015] 所述步驟(2)中,采用分箱方法對含噪聲的建筑大數據進行光滑處理,對任意的數 據d,取其前k個相鄰數據W及其后的k個相鄰數據,取運些數據的均值,利用均值替代該數 據d。
[0016] 所述步驟(2)中,采用最小-最大規(guī)范化方法實現(xiàn)對建筑數據的規(guī)范化,使建筑大 數據落入設定的區(qū)間中,使建筑能耗影響因素映射到該區(qū)間內。
[0017] 所述步驟(4)中,求取建筑能耗影響因素特征協(xié)方差矩陣的特征值,將其按大小順 序排列,并求出每個特征值對應的特征向量,形成歸一化后的單位向量。
[0018] 所述步驟(4)中,各個建筑能耗印象因素的貢獻率為每個建筑耗能影響因素的特 征值與所有特征值之和的比值,累計貢獻率定義為前k個建筑耗能影響因素的特征值之和 在全部特征值總和中所占的比重。
[0019] 進一步的,所述步驟(4)中,設定累計貢獻率闊值,若計算的前k個建筑耗能影響因 素的累計貢獻率大于闊值,則前k個建筑耗能影響因素為主要影響因素。
[0020] 所述步驟(5)中,具體方法為:求取建筑數據樣本在單位特征向量上的投影,得到 主要影響因素決策矩陣,用各個建筑能耗主要影響因素的貢獻率作為權重系數,線性加權 求和得到建筑能耗主要影響因素的表達式。
[0021] 本發(fā)明的有益效果為:
[0022] (1)本發(fā)明對所獲得的建筑大數據進行數據預處理,解決所獲得的建筑大數據中 存在的數據缺失、異常、空值等問題;
[0023] (2)采用主成分分析方法對收集到的建筑大數據進行降維,減少影響因素數量且 保留原始數據的主要信息,通過獲取更加優(yōu)越的新的綜合因素來構造影響建筑能耗的核屯、 因素,為降低建筑運行能耗、實現(xiàn)建筑節(jié)能管控提供依據。
【附圖說明】
[0024] 圖1是本發(fā)明基于大數據的建筑能耗主要影響因素挖掘流程圖。
【具體實施方式】:
[0025] 下面結合附圖與實施例對本發(fā)明作進一步說明。
[0026] 隨著物聯(lián)網的發(fā)展,我們獲得了海量的關于建筑的各類設計數據、傳感數據、操作 數據、環(huán)境數據、能耗數據,且數據量飛速增長,結構化、半結構化和非結構化數據共存,使 得建筑領域也進入了 "大數據時代"。通過對建筑大數據進行分析挖掘,可W獲得有價值的 知識,為獲得影響建筑能耗的主要因素提供有效途徑。針對上述問題,本發(fā)明提出了一種基 于大數據的建筑能耗主要影響因素的挖掘方法,能夠為理清影響建筑能耗的主要因素提供 支持,為降低建筑運行能耗、提升建筑節(jié)能及管理水平提供有價值的工具。
[0027] 如圖1所示,本發(fā)明提出了一種基于大數據的建筑能耗主要影響因素挖掘方法。首 先,對建筑大數據進行捜集與抽取,構建能耗數據表;然后,對所獲得的建筑大數據進行數 據預處理,解決所獲得的建筑大數據中存在的數據缺失、異常、空值等問題;進一步,在建筑 大數據基礎上,采用主成分分析方法對收集到的建筑大數據進行降維,減少影響因素數量 且保留原始數據的主要信息,通過獲取更加優(yōu)越的新的綜合因素來構造影響建筑能耗的核 屯、因素,為降低建筑運行能耗、實現(xiàn)建筑節(jié)能管控提供依據。
[002引具體包括:
[0029] 步驟一:對建筑大數據進行捜集與抽取,構建建筑能耗數據表
[0030] 目前,我們獲得了關于建筑運行的各類數據,包括設計數據、能耗數據、環(huán)境數據、 人員數據、設備數據、監(jiān)控數據等等。運些數據里面既包括結構化數據,也包括半結構化數 據及非結構化數據。有些數據,比如安全監(jiān)控視頻數據,在能耗影響因素分析方面沒有價 值。因此,首先進行建筑大數據的捜集與抽取工作,主要抽取建筑類型、建筑用途、建筑面 積、建筑長寬比、建筑層高、墻體厚度、墻窗比、室內溫度、室內濕度、人員密度、照明時間、室 外環(huán)境、上班周期、建筑電能消耗、建筑用熱量等數據,構建表1所示的數據表。為方便起見, 假定數據表有η個列,每個列對應一種可能影響能耗的因素,數據表中有N個行,每行對應相 應的記錄數據。
[0031] 表1建筑大數據表
[0032]
[0033] 步驟二:建筑大數據的預處理
[0034] 對收集到的建筑大數據進行數據預處理,解決所獲得的建筑大數據中存在的數據 缺失、異常、空值等問題。具體步驟如下:
[0035] I、建筑大數據中缺失值的填充:若存在數據為零,那么判定該數據為缺失值,應該 對該位置的數據進行缺失值的填充操作。建筑大數據缺失值填充選擇的方法為均值填充 法:如果數據dij = 0(l y含N,1 y如),那么令
然后用μ代替數據dij。
[0036] II、建筑大數據中噪聲的光滑:為克服噪聲數據對建筑能耗影響因素分析的影響, 采用分箱方法對含噪聲的建筑大數據進行光滑,具體步驟如下:
[0037] 對任意的數據du,取其前k個"鄰居"數據d(i-k川…,d(i-i)j,W及其后k個"鄰居"數 據d(i + l)j,…,d(i+k)j。令
然后用化代替建筑數據cUj的值。
[0038] III、建筑大數據的規(guī)范化:將建筑大數據進行規(guī)范化,使之落入一個小的特定區(qū) 間防中。采用最小-最大規(guī)范化方法實現(xiàn)對建筑數據的規(guī)范化,具體步驟如 下:
[0039] 假定Wj,和Afj,為建筑能耗影響因素 dj的最小值與最大值,最小-最大規(guī)范化通過 計算
[0040] i
[0041] 將建筑能耗影響因素 d沖的數據dij映射到區(qū)間["η"",,' -"w'W,, 1中的數據dij'中 去。
[0042] 步驟建筑大數據的主要影響因素挖掘
[0043] 對預處理后的建筑大數據采用主成分分析法進行挖掘來獲得影響建筑能耗的核 屯、因素。具體步驟如下:
[0044] I、對建筑大數據進行零均值化處理并對數據作方差歸一化。具體步驟如下:
[0045] 4
然后我們把建筑耗能影響因素 d沖的所有建筑數據dij(l y <N) 都用di廣μ.冰代替。令然后把每一個數據dij(l y如)用dij/o.j代 替。
[0046] 原始的建筑大數據經過處理后,得到關于建筑大數據的標準化矩陣Z:
[0047]
[0048] 根據經過處理后得到的建筑大數據標準化矩陣Z求取建筑能耗影響因素的特征協(xié) 方差矩陣,求得協(xié)方差矩陣為:
[0049]
[0050] 其中 cov(z.s,z.t)=E(z.sZ.t)-E(z.s化(z.t)
[0051] 求取建筑能耗影響因素特征協(xié)方差矩陣的特征值λι,···,λη,并使其按從大到小順 序排列,即λι > λ2 >…> λη > 0,并求出每個特征值對應的特征向量ζ?,…,ζη,其中ζ?,…,ζη 為歸一化后的單位向量。
[0052] 根據建筑能耗影響因素特征協(xié)方差矩陣的特征值計算各影響因素的貢獻率與累 計貢獻率。其中,第j個建筑耗能影響因素貢獻率為
。建筑能耗影響因素累計 貢獻率定義為前k個主要建筑耗能影響因素的特征值之和在全部特征值總和中所占的比 重,即
。該比值越大,說明前k個建筑耗能影響因素越能作為綜合代表。
[0053] 根據建筑能耗主要影響因素累計貢獻率確定前k個主要影響因素。取累計貢獻率
的k值所對應的第1、第2···第k化含η)個主要影響因素。
[0054] 求出Zi= (Zii,Zi2,…,Zin)T, i = l,2,…,Ν的k個建筑大數據主要影響因素分量Uij = ZiTCjJ = l,2,-,,k,得到關于建筑大數據的主要影響因素決策陣U:
[ο化5]
[0056] 其中m(i = l,2,…,N)為第i個建筑大數據樣本的量,它的第j(j = l,2,…,k)個分 量UU是建筑數據樣本Zi在單位特征向量上的投影。
[0057] 用各個建筑能耗主要影響因素的貢獻率作為權重系數,線性加權求和得到建筑能 耗主要影響因素的表達式:
[0化引
[0059]上述雖然結合附圖對本發(fā)明的【具體實施方式】進行了描述,但并非對本發(fā)明保護范 圍的限制,所屬領域技術人員應該明白,在本發(fā)明的技術方案的基礎上,本領域技術人員不 需要付出創(chuàng)造性勞動即可做出的各種修改或變形仍在本發(fā)明的保護范圍W內。
【主權項】
1. 一種基于大數據的建筑能耗主要影響因素分析方法,其特征是:包括以下步驟: (1) 對建筑大數據進行搜集與抽取,采集建筑用基本信息,確定所有影響因素,構建建 筑能耗數據表; (2) 對建筑大數據進行預處理,填充缺失信息值、消除噪聲值,將建筑大數據進行規(guī)范 化,確定建筑能耗影響因素集合; (3) 對建筑大數據進行零均值化處理、方差歸一化,形成標準化矩陣,求取建筑能耗影 響因素的特征協(xié)方差矩陣; (4) 求取建筑能耗影響因素特征協(xié)方差矩陣的特征值,根據其計算各個影響因素的貢 獻率和累計貢獻率; (5) 根據累計貢獻率確定主要影響因素,構建主要影響因素決策陣,以貢獻率確認各個 主要影響因素的權重系數,線性加權求和確定核心因素。2. 如權利要求1所述的一種基于大數據的建筑能耗主要影響因素分析方法,其特征是: 所述步驟(1)中,建筑用基本信息包括設計數據、能耗數據、環(huán)境數據、人員數據、設備數據 或/和監(jiān)控數據。3. 如權利要求1所述的一種基于大數據的建筑能耗主要影響因素分析方法,其特征是: 所述步驟(1)中,建筑能耗數據表的影響因素包括抽取建筑類型、建筑用途、建筑面積、建筑 長寬比、建筑層高、墻體厚度、墻窗比、室內溫度、室內濕度、人員密度、照明時間、室外環(huán)境、 上班周期、建筑電能消耗或/和建筑用熱量,每一類影響因素包括多個樣本。4. 如權利要求1所述的一種基于大數據的建筑能耗主要影響因素分析方法,其特征是: 所述步驟(2)中,對建筑大數據的缺失值進行填充,若存在數據為零,那么判定該數據為缺 失值,使用均值填充法對該位置的數據進行缺失值的填充操作。5. 如權利要求1所述的一種基于大數據的建筑能耗主要影響因素分析方法,其特征是: 所述步驟(2)中,采用分箱方法對含噪聲的建筑大數據進行光滑處理,對任意的數據d,取其 前k個相鄰數據以及其后的k個相鄰數據,取這些數據的均值,利用均值替代該數據d。6. 如權利要求1所述的一種基于大數據的建筑能耗主要影響因素分析方法,其特征是: 所述步驟(2)中,采用最小-最大規(guī)范化方法實現(xiàn)對建筑數據的規(guī)范化,使建筑大數據落入 設定的區(qū)間中,使建筑能耗影響因素映射到該區(qū)間內。7. 如權利要求1所述的一種基于大數據的建筑能耗主要影響因素分析方法,其特征是: 所述步驟(4)中,求取建筑能耗影響因素特征協(xié)方差矩陣的特征值,將其按從大到小順序排 列,并求出每個特征值對應的特征向量,形成歸一化后的單位向量。8. 如權利要求1所述的一種基于大數據的建筑能耗主要影響因素分析方法,其特征是: 所述步驟(4)中,各個建筑能耗印象因素的貢獻率為每個建筑耗能影響因素的特征值與所 有特征值之和的比值,累計貢獻率定義為前k個建筑耗能影響因素的特征值之和在全部特 征值總和中所占的比重。9. 如權利要求8所述的一種基于大數據的建筑能耗主要影響因素分析方法,其特征是: 所述步驟(4)中,設定累計貢獻率閾值,若計算的前k個建筑耗能影響因素的累計貢獻率大 于閾值,則前k個建筑耗能影響因素為主要影響因素。10. 如權利要求1所述的一種基于大數據的建筑能耗主要影響因素分析方法,其特征 是:所述步驟(5)中,具體方法為:求取建筑數據樣本在單位特征向量上的投影,得到主要影 響因素決策矩陣,用各個建筑能耗主要影響因素的貢獻率作為權重系數,線性加權求和得 到建筑能耗主要影響因素的表達式。
【文檔編號】G06Q10/06GK105825323SQ201610136375
【公開日】2016年8月3日
【申請日】2016年3月10日
【發(fā)明人】李成棟, 丁子祥, 王麗, 尚芳, 張桂青
【申請人】山東建筑大學