基于統(tǒng)計(jì)信號處理的時間序列預(yù)測模型選擇方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種時間序列預(yù)測模型的選擇方法。
【背景技術(shù)】
[0002] 時間序列預(yù)測模型與時間序列特性之間的匹配程度決定了預(yù)測效果,因此需要針 對時間序列為其選擇適合的時間序列預(yù)測模型進(jìn)行預(yù)測分析。然而,在現(xiàn)有研宄中,主要基 于經(jīng)驗(yàn)或少量的實(shí)驗(yàn)進(jìn)行預(yù)測模型的選擇,在選擇過程中主觀因素影響較多,并且即使采 用實(shí)驗(yàn)方式進(jìn)行模型選擇,往往也只是使用單一的評價指標(biāo)進(jìn)行片面的適用性評價并基于 這種片面的評價結(jié)果進(jìn)行模型的選擇,這樣選擇出的模型往往不是綜合性能最優(yōu)的。
[0003] 因此,當(dāng)前缺少一種高效、全面的對時間序列預(yù)測模型選擇方法,能夠綜合考慮時 間序列特性與預(yù)測模型之間的匹配性以及對時間序列預(yù)測模型適用性的全面量化評價,實(shí) 現(xiàn)時間序列預(yù)測模型的快速、準(zhǔn)確選擇,為無專業(yè)背景知識的人提供一定的模型選擇建議。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明目的是為了解決現(xiàn)有時間序列預(yù)測模型的選擇效率低、準(zhǔn)確度低,專業(yè)背 景淺薄的工作人員無法快速、準(zhǔn)確地選擇時間序列預(yù)測模型的問題,提供了一種基于統(tǒng)計(jì) 信號處理的時間序列預(yù)測模型選擇方法。
[0005] 本發(fā)明所述基于統(tǒng)計(jì)信號處理的時間序列預(yù)測模型選擇方法,該選擇方法的具體 過程為:
[0006] 步驟1、獲取輸入時間序列的特性,根據(jù)時間序列種類和時間序列特性的對應(yīng)關(guān) 系,確定輸入時間序列的種類;
[0007] 所述輸入時間序列的特性包括幅值連續(xù)性、長記憶特性、季節(jié)性和趨勢性;
[0008] 步驟2、對輸入時間序列進(jìn)行特性分析,獲取時間序列種類與候選預(yù)測模型的映射 關(guān)系;
[0009] 步驟3、根據(jù)確定的種類與候選預(yù)測模型的映射關(guān)系,將對應(yīng)種類的m個候選預(yù)測 模型作為定性選擇預(yù)測模型;
[0010] 步驟4、采用與定性選擇預(yù)測模型相同的建模時間序列,對定性選擇預(yù)測模型進(jìn)行 相同步長的預(yù)測,根據(jù)預(yù)測結(jié)果獲取定性選擇預(yù)測模型的適用性量化評價指標(biāo),所述適用 性量化評價指標(biāo)包括整體誤差指標(biāo)、局部誤差指標(biāo)、無量綱準(zhǔn)則性指標(biāo)和實(shí)驗(yàn)性能指標(biāo);
[0011] 步驟5、根據(jù)步驟4中獲取的適用性量化評價指標(biāo),獲取整體誤差指標(biāo)中性能指標(biāo) 最優(yōu)的兩個預(yù)測模型,獲取局部誤差指標(biāo)中性能指標(biāo)最優(yōu)的兩個預(yù)測模型,獲取無量綱準(zhǔn) 則性指標(biāo)中性能指標(biāo)最優(yōu)的兩個預(yù)測模型,獲取實(shí)驗(yàn)性能指標(biāo)中性能指標(biāo)最優(yōu)的兩個預(yù)測 豐旲型;
[0012] 步驟6、對步驟5獲取的八個預(yù)測模型進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)每個預(yù)測模型被選為最優(yōu)預(yù) 測模型的次數(shù);
[0013] 步驟7、選擇被選為最優(yōu)預(yù)測模型次數(shù)最多的兩個預(yù)測模型,作為最優(yōu)預(yù)測模型的 備選模型;
[0014] 步驟8、采用DM檢驗(yàn)法對步驟7獲取的兩個備選模型進(jìn)行預(yù)測能力差異檢驗(yàn),判斷 兩個備選模型的預(yù)測能力的優(yōu)劣及優(yōu)劣程度,選擇性能最優(yōu)的模型作為最終的最優(yōu)預(yù)測模 型,完成時間序列預(yù)測模型的選擇。
[0015] 本發(fā)明的優(yōu)點(diǎn):本發(fā)明提出了一種結(jié)合定性選擇和定量選擇的時間序列預(yù)測模型 選擇方法,能夠基于時間序列特性實(shí)現(xiàn)定性模型選擇、快速縮小候選預(yù)測模型的范圍,能夠 基于預(yù)測模型適用性量化評價體系實(shí)現(xiàn)預(yù)測模型適用性的全面、準(zhǔn)確的量化評價實(shí)現(xiàn)定量 選擇,從定性選擇給出的候選預(yù)測模型中選擇最優(yōu)、最適合當(dāng)前時間序列及預(yù)測需求的預(yù) 測模型,為實(shí)際的時間序列預(yù)測應(yīng)用提供一定的模型選擇建議,尤其為無專業(yè)背景知識的 人提供模型選擇建議。本發(fā)明通過結(jié)合時間序列特性分析和量化的模型適用性評價,完成 包含定性和定量兩個環(huán)節(jié)的模型選擇,實(shí)現(xiàn)最優(yōu)模型的選擇。通過定性選擇完成候選模型 范圍的快速縮小和劃定,通過定量選擇完成客觀、全面的量化評價和最優(yōu)模型選擇。最終可 以為無經(jīng)驗(yàn)人員在實(shí)際的時間序列預(yù)測應(yīng)用中提供針對當(dāng)前時間序列和預(yù)測需求的最優(yōu) 預(yù)測模型的參考建議。
【附圖說明】
[0016] 圖1是本發(fā)明所述基于統(tǒng)計(jì)信號處理的時間序列預(yù)測模型選擇方法的原理圖;
[0017] 圖2是基于統(tǒng)計(jì)信號處理的時間序列預(yù)測的分類關(guān)系。
【具體實(shí)施方式】
【具體實(shí)施方式】 [0018] 一:下面結(jié)合圖1說明本實(shí)施方式,本實(shí)施方式所述基于統(tǒng)計(jì)信號 處理的時間序列預(yù)測模型選擇方法,該選擇方法的具體過程為:
[0019] 步驟1、獲取輸入時間序列的特性,根據(jù)時間序列種類和時間序列特性的對應(yīng)關(guān) 系,確定輸入時間序列的種類;
[0020] 所述輸入時間序列的特性包括幅值連續(xù)性、長記憶特性、季節(jié)性和趨勢性;
[0021] 步驟2、對輸入時間序列進(jìn)行特性分析,獲取時間序列種類與候選預(yù)測模型的映射 關(guān)系;
[0022] 步驟3、根據(jù)確定的種類與候選預(yù)測模型的映射關(guān)系,將對應(yīng)種類的m個候選預(yù)測 模型作為定性選擇預(yù)測模型;
[0023] 步驟4、采用與定性選擇預(yù)測模型相同的建模時間序列,對定性選擇預(yù)測模型進(jìn)行 相同步長的預(yù)測,根據(jù)預(yù)測結(jié)果獲取定性選擇預(yù)測模型的適用性量化評價指標(biāo),所述適用 性量化評價指標(biāo)包括整體誤差指標(biāo)、局部誤差指標(biāo)、無量綱準(zhǔn)則性指標(biāo)和實(shí)驗(yàn)性能指標(biāo);
[0024] 步驟5、根據(jù)步驟4中獲取的適用性量化評價指標(biāo),獲取整體誤差指標(biāo)中性能指標(biāo) 最優(yōu)的兩個預(yù)測模型,獲取局部誤差指標(biāo)中性能指標(biāo)最優(yōu)的兩個預(yù)測模型,獲取無量綱準(zhǔn) 則性指標(biāo)中性能指標(biāo)最優(yōu)的兩個預(yù)測模型,獲取實(shí)驗(yàn)性能指標(biāo)中性能指標(biāo)最優(yōu)的兩個預(yù)測 豐旲型;
[0025] 步驟6、對步驟5獲取的八個預(yù)測模型進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)每個預(yù)測模型被選為最優(yōu)預(yù) 測模型的次數(shù);
[0026] 步驟7、選擇被選為最優(yōu)預(yù)測模型次數(shù)最多的兩個預(yù)測模型,作為最優(yōu)預(yù)測模型的 備選模型;
[0027] 步驟8、采用DM檢驗(yàn)法對步驟7獲取的兩個備選模型進(jìn)行預(yù)測能力差異檢驗(yàn),判斷 兩個備選模型的預(yù)測能力的優(yōu)劣及優(yōu)劣程度,選擇性能最優(yōu)的模型作為最終的最優(yōu)預(yù)測模 型,完成時間序列預(yù)測模型的選擇。
[0028] 本實(shí)施方式中,步驟8所述的DM檢驗(yàn)法時指Diebold-Mariano檢驗(yàn),是通過輸出 的統(tǒng)計(jì)量DM和假設(shè)機(jī)率p-value來判斷兩個模型是否存在明顯的預(yù)測能力差異。假設(shè)對 模型1和模型2的預(yù)測能力進(jìn)行比較,若輸出DM統(tǒng)計(jì)量為負(fù)值,表明模型2的預(yù)測能力比 模型1的預(yù)測能力差,且DM統(tǒng)計(jì)量絕對值越大,二者預(yù)測能力相差越多。DM檢驗(yàn)以兩個預(yù) 測模型存在明顯預(yù)測能力差異為默認(rèn)的假設(shè),通過假設(shè)檢驗(yàn)得到P-value取值,p-value越 小表明顯著度越高,則接受原假設(shè),即兩個模型的預(yù)測能力差異性越大。一般,P-value小 于0. 05即為顯著,p-value小于0. 01即為非常顯著,即二者預(yù)測能力差異非常明顯。
[0029] 本實(shí)施方式中,根據(jù)時間序列的幅值的連續(xù)性將其分為連續(xù)時間序列和離散時間 序列;根據(jù)長記憶性的存在與否將時間序列分為長記憶性和短記憶性序列;根據(jù)時間序列 季節(jié)性和趨勢性的存在與否將時間序列分為相應(yīng)的種類;按照穩(wěn)定性分類,可以分為平穩(wěn) 時間序列和非平穩(wěn)時間序列;按照時間序列中是否包含不確定性因素可以將時間序列分為 確定性時間序列和隨機(jī)性時間序列,隨機(jī)性時間序列又可以分為平穩(wěn)隨機(jī)序列、非平穩(wěn)隨 機(jī)序列和白噪聲序列?,F(xiàn)有的時間序列種類劃分,一般依照一個或兩個特性對時間序列進(jìn) 行簡單的種類劃分。而對于預(yù)測模型而言,往往對時間序列的要求要更為細(xì)化,簡單的單指 標(biāo)對時間序列進(jìn)行的二分類得到的種類與時間序列預(yù)測模型的對應(yīng)性不好,使得某一類時 間序列對應(yīng)大量的預(yù)測模型。因此,有必要對現(xiàn)有的分類方法進(jìn)行匯總,綜合實(shí)際的預(yù)測需 求以及模型的一般需求,采用多指標(biāo)實(shí)現(xiàn)對時間序列的分類。時間序列的變動特征可以劃 分為四類:長期趨勢、季節(jié)變動、循環(huán)變動和不規(guī)則變動。此外,時間序列的特性往往用隨機(jī) 性、平穩(wěn)性和季節(jié)性進(jìn)行刻畫。因此,時間序列特性指標(biāo)需要考慮到趨勢性、季節(jié)性、隨機(jī)性 等特性。本實(shí)施方式采用的特性有:幅值連續(xù)性、長記憶性、趨勢性、季節(jié)性。
【具體實(shí)施方式】 [0030] 二:本實(shí)施方式對實(shí)施方式一作進(jìn)一步說明,步驟1所述時間序列 種類和時間序列特性的對應(yīng)關(guān)系為:
[0031] 時間序列特性為幅值連續(xù)、隨機(jī)游走性的時間序列為種類1;
[0032] 時間序列特性為幅值連續(xù)、短記憶性的時間序列為種類2;
[0033] 時間序列特性為幅值連續(xù)、趨勢性、季節(jié)性的時間序列為種類3;
[0034] 時間序列特性為幅值連續(xù)、趨勢性、指數(shù)趨勢的時間序列為種類4;
[0035] 時間序列特性為幅值連續(xù)、趨勢性、非指數(shù)趨勢的時間序列為種類5;
[0036] 時間序列特性為幅值連續(xù)、