基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法
【專利摘要】本發(fā)明公開了一種基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,采取一種先進(jìn)的多元回歸分析方法,通過將自變量和因變量的高維數(shù)據(jù)空間投影到相應(yīng)的低維特征空間,分別得到自變量與因變量的相互正交的特征向量,再建立自變量和因變量的特征向量間的線性回歸關(guān)系。它在選取特征向量時強(qiáng)調(diào)自變量對因變量的解釋和預(yù)測作用,去除了對回歸無益的噪聲的影響,使模型包含最小的變量數(shù),因而其模型具有較好的魯棒性和預(yù)測的穩(wěn)定性。可為疏浚作業(yè)產(chǎn)量的優(yōu)化研究打下理論基礎(chǔ),達(dá)到高效率、高產(chǎn)量、低能耗的目的,對挖泥船進(jìn)行產(chǎn)量預(yù)測具有重要意義。
【專利說明】基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及基于偏最小二乘回歸分析在疏浚作業(yè)產(chǎn)量預(yù)測模型中的應(yīng)用,屬于疏 浚工程領(lǐng)域。
【背景技術(shù)】
[0002] 疏浚工程是水利水運工程的重要項目?,F(xiàn)代疏浚作業(yè)主要依靠挖泥船來進(jìn)行,而 產(chǎn)量是衡量挖泥船效率的重要標(biāo)準(zhǔn)。絞吸式挖泥船疏浚作業(yè)是一個多因素相互作用、相互 影響的過程,產(chǎn)量的影響因素非常多且復(fù)雜。在現(xiàn)階段疏浚施工中,主要還是以人工優(yōu)化為 基礎(chǔ),依靠以往經(jīng)驗判斷疏浚施工的主要作業(yè)參數(shù),施工效率較低。如何確保合理有效的工 藝決策,減少調(diào)控參數(shù),降低操作復(fù)雜性,成為疏浚低能耗、低排放、高效率的關(guān)鍵問題。因 此,實現(xiàn)疏浚作業(yè)產(chǎn)量預(yù)測模型意義重大。
[0003] 偏最小二乘法(Partial least squares, PLS)是一種先進(jìn)的多元回歸分析方法, 通過將自變量和因變量的高維數(shù)據(jù)空間投影到相應(yīng)的低維特征空間,分別得到自變量和因 變量的相互正交特征向量,再建立自變量和因變量特征向量的一元線性回歸關(guān)系。與主成 分分析(Primary Component Analysis,PCA)相比較:PLS不僅可有效地克服普通最小二乘 回歸方法的共線性問題,它在選取特征向量時強(qiáng)調(diào)自變量對因變量的解釋和預(yù)測作用,去 除了對回歸無益噪聲的影響,是模型包含最少的變量數(shù),因而PLS模型具有更好的魯棒性 和預(yù)測穩(wěn)定性。PLS方法的良好性能使得它在工業(yè)過程的建模與控制中得到廣泛的應(yīng)用。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于克服上述缺陷,利用現(xiàn)有的偏最小二乘回歸方法,提供基于偏 最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,對挖泥船產(chǎn)量預(yù)測模型建立進(jìn)行分析, 為疏浚作業(yè)產(chǎn)量的優(yōu)化研究打下理論基礎(chǔ),達(dá)到高效率、高產(chǎn)量、低能耗的目的,對挖泥船 進(jìn)行產(chǎn)量預(yù)測具有重要意義。
[0005] 為了解決上述問題,本發(fā)明裝置所采用的技術(shù)方案為:一種基于偏最小二乘回歸 的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,其特征在于包括以下步驟:
[0006] 步驟(1):收集影響疏浚作業(yè)產(chǎn)量因素變量的數(shù)據(jù)資料,確定P個分析變量,列出 因變量與自變量樣本矩陣;其中,P為正整數(shù);
[0007] 步驟(2):對樣本矩陣進(jìn)行標(biāo)準(zhǔn)化處理;
[0008] 步驟(3):根據(jù)標(biāo)準(zhǔn)樣本矩陣,提取主成分;
[0009] 步驟(4):根據(jù)提取主成分終止判斷準(zhǔn)則,依次計算出主成分對自變量、因變量信 息的解釋能力;
[0010] 步驟(5):確定主成分個數(shù);
[0011] 步驟(6):根據(jù)主成分個數(shù),建立回歸預(yù)測方程。
[0012] 上述步驟(1)中的樣本矩陣如下:
[0013] 設(shè)對p個自變量x2,…xp和q個因變量yp y2,…yq行了 η次觀測,分別記自 變量與因變量的"樣本點X變量"型的數(shù)據(jù)矩陣為:
[0014] X = (XijOnxp = (Xi,x2, . . . xp), i = 1,2. . . , n ; j = 1,2, . . . P
[0015] Y = (yij)nxq = (yi? y2? · · · yq)? ? = 1? 2 , . . . , n ;j = 1,2, . . . q
[0016] 上述步驟(2)中矩陣標(biāo)準(zhǔn)化處理如下:
[0017] 記標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣為:
[0018] E0 = (eiJ)nXp 和 Ε0 = (?^)ηΧ(1
[0019] 其中
【權(quán)利要求】
1. 基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,其特征在于,包括以下步 驟: 步驟(1):收集影響疏浚作業(yè)產(chǎn)量因素變量的數(shù)據(jù)資料,確定P個分析變量,列出因變 量與自變量樣本矩陣;其中,P為正整數(shù); 步驟(2):對樣本矩陣進(jìn)行標(biāo)準(zhǔn)化處理; 步驟(3):根據(jù)標(biāo)準(zhǔn)樣本矩陣,提取主成分; 步驟(4):根據(jù)提取主成分終止判斷準(zhǔn)則,依次計算出主成分對自變量、因變量信息的 解釋能力; 步驟(5):確定主成分個數(shù); 步驟(6):根據(jù)主成分個數(shù),建立回歸預(yù)測方程。
2. 根據(jù)權(quán)利要求1所述的基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,其 特征在于,所述步驟(1)中的樣本矩陣如下: 設(shè)對P個自變量Xi,x2,…xp和q個因變量丫:,%,…行了 η次觀測,分別記自變量 與因變量的"樣本點X變量"型的數(shù)據(jù)矩陣為: X - (xj j) nXp - (Xj,x2,· · · Xp),i - 1? 2 . . . , n ; j - 1,2,···ρ Y = (yij)nxq = (yi,y2,· · · yq),i = i,2...,n;j = i,2,...q。
3. 根據(jù)權(quán)利要求1所述的基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,其 特征在于,所述步驟(2)中矩陣標(biāo)準(zhǔn)化處理過程如下: 記標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣為: E 〇 = (θυ)ηΧρ 和 F〇=知)- 其中
(1-1)
(1-2) 式中(1-1)和式中(1-2)中,
分別為矩陣X與Y的第j列數(shù)據(jù)的平均值,sxpsyj 為矩陣X與Y的第j列數(shù)據(jù)的標(biāo)準(zhǔn)差。
4. 根據(jù)權(quán)利要求1所述的基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,其 特征在于,步驟(3)中主成分提取的計算步驟如下: ①第一輪主成分提取 求矩陣
的最大特征值所對應(yīng)單位特征向量Wl,得自變量的第一個主成分,h =EqW! 求矩陣
的最大特征值所對應(yīng)單位特征向量Cl,得因變量的第一個主成分, ul = F0C! 求殘差矩陣
0-3) (1-4) 式中(1-3)中
式中(1-4)中
②新一輪主成分提取 令^ = Ερ匕=匕,對殘差矩陣進(jìn)行新一輪的主成分提取 設(shè)第h步的計算結(jié)果為 th = Eh-iWh (1-5) % = Fh-ich (1-6)
(1-7)
(1-8) 式(1-5)?(1-8)中,
5. 根據(jù)權(quán)利要求1所述的基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,其 特征在于,所述步驟(4)中的提取主成分終止判斷準(zhǔn)則采用復(fù)測定系數(shù)準(zhǔn)則, 由統(tǒng)計量
(1-9) 評價自變量系統(tǒng)的前h個主成分是否對因變量Y系統(tǒng)有足夠的解釋能力; 復(fù)測定系數(shù)
度量的是由前h個主成分構(gòu)建的回歸方程能夠解釋的變異信息量占總 變異的百分比,當(dāng)h = m且復(fù)測定系數(shù)
的值足夠大時,可在第m步終止主成分提取計算, 其中
在復(fù)測定系數(shù).
i的應(yīng)用中,參考統(tǒng)計量
(1-10) 值的大小,
度量的是自變量X系統(tǒng)被提取的變異信息量。
6. 根據(jù)權(quán)利要求1所述的基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,其 特征在于,所述步驟(4)中主成分對自變量、因變量信息的解釋能力的計算過程如下: 記P 2 (y」;th)是主成分th與因變量yj的簡單相關(guān)系數(shù)的平方,t h對因變量系統(tǒng)Y的解 釋能力: RcKyj ;th) = p 2(yj ;th) (1-11)
(M2) h,t2, · · ·,tm對因變量系統(tǒng)Y的累計解釋能力:
(1-13) 依據(jù)式(1-11)?(1-13),計算各主成分對因變量Υ的解釋能力; 記Ρ 2 ;th)是主成分th與自變量&的簡單相關(guān)系數(shù)的平方,th對自變量系統(tǒng)X的解 釋能力: Rd(Xj ;th) = p 2(xj ;th) (1-14)
(M5) h,t2, · · ·,tm對自變量系統(tǒng)X的累計解釋能力
(1-16) 依據(jù)式(1-14)?(1-16)計算各主成分對自變量X的解釋能力。
7. 根據(jù)權(quán)利要求1所述的基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,其 特征在于所述步驟(5)中主成分個數(shù)的確定如下: 分別繪制主成分和主成分對因變量Y解釋能力總信息及自變量X解釋能力總信息柱狀 圖,找出Rdh(Cum) > 85%時,兩者的主成分個數(shù),然后對其兩者取主成分個數(shù)交集。
8. 根據(jù)權(quán)利要求1所述的基于偏最小二乘回歸的疏浚作業(yè)產(chǎn)量預(yù)測模型建立方法,其 特征在于,所述步驟¢)中根據(jù)主成分個數(shù),建立回歸預(yù)測方程過程如下: ① 建立F。關(guān)于主成分tp t2,...,乜的多元線性回歸方程
(1-17) ② 變換為關(guān)于標(biāo)準(zhǔn)化變量的PLS回歸方程 將
代入方程(1-17),得F。關(guān)于E。的PLS回歸方程
(1-18) 其中,
為單位矩陣。 ③ 還原為關(guān)于原始變量的PLS回歸方程 將方程(1-18)還原成關(guān)于原始變量的PLS回歸方程
(1-]9} 其中,ak是矩陣
的第k個列向量,知是%的第i個分量,i = 1,2,…, m, k 二 1,2, · · · , q〇
【文檔編號】G06F19/00GK104123451SQ201410340375
【公開日】2014年10月29日 申請日期:2014年7月16日 優(yōu)先權(quán)日:2014年7月16日
【發(fā)明者】李凱凱, 許煥敏, 穆乃超, 宋慶峰, 周玉剛 申請人:河海大學(xué)常州校區(qū)