一種基于核極限學習機的風險預測的方法和裝置的制造方法
【專利摘要】本發(fā)明適用于計算機領(lǐng)域,提供了一種基于核極限學習機的風險預測的方法和裝置,旨在解決現(xiàn)有技術(shù)中無法確定核極限學習機的懲罰系數(shù)和核寬的最佳值,導致風險預測精確度不高的問題。方法包括:獲取預定數(shù)量的企業(yè)的經(jīng)營數(shù)據(jù);對經(jīng)營數(shù)據(jù)進行標準化;利用灰狼算法優(yōu)化核極限學習機的懲罰系數(shù)和核寬,得到優(yōu)化后的懲罰系數(shù)和核寬;基于優(yōu)化后的懲罰系數(shù)和核寬構(gòu)建核極限學習機的預測模型;根據(jù)預測模型進行風險預測。通過本發(fā)明的技術(shù)方案,將灰狼算法融入核極限學習機來確定懲罰系數(shù)和核寬的最佳值,構(gòu)建出更加準確的預測模型,實現(xiàn)對風險的有效預測,提高預測精確度,在輔助金融機構(gòu)對企業(yè)經(jīng)營風險進行科學合理有效的預測中具有重要的應用價值。
【專利說明】
-種基于核極限學習機的風險預測的方法和裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明設及計算機技術(shù)領(lǐng)域,尤其設及一種基于核極限學習機的風險預測的方法 和裝置。
【背景技術(shù)】
[0002] 為了減少企業(yè)經(jīng)營風險尤其是破產(chǎn)風險對金融機構(gòu)造成的損失,通過建立安全有 效的風險預警機制并對企業(yè)經(jīng)營風險進行預測的方法,是金融機構(gòu)保持投資回報的有效方 式。
[0003] 目前已有的企業(yè)經(jīng)營風險預測方法主要可分為兩類,即基于統(tǒng)計學模型的方法和 基于人工智能的方法?;诮y(tǒng)計學模型的預測方法主要有單變量分析法、多元判別分析法、 羅吉斯特回歸模型和因子分析法。相比于基于統(tǒng)計學模型的預測方法,基于人工智能的預 測方法因其優(yōu)越的性能而被廣泛應用于金融風險預測領(lǐng)域。
[0004] 當前,基于人工智能的預測方法主要有基于人工神經(jīng)網(wǎng)絡、基于支持向量機、基于 k近鄰、基于貝葉斯模型、基于極限學習機、基于混合模型W及集成學習等方法,運些方法都 已經(jīng)成功的應用于金融風險預測領(lǐng)域。其中,基于人工神經(jīng)網(wǎng)絡的方法由于其能夠較好地 捕捉數(shù)據(jù)中的非線性關(guān)系而得到廣泛地應用收。但基于人工神經(jīng)網(wǎng)絡的方法因通常采用梯 度下降法進行學習而存在易陷入局部最小值的不足,同時網(wǎng)絡構(gòu)建過程也需要對大量的參 數(shù)進行調(diào)整而難W建立起最優(yōu)的模型。為了克服神經(jīng)網(wǎng)絡的運些缺點,出現(xiàn)了一種新的神 經(jīng)網(wǎng)絡學習方法即極限學習機。由于極限學習機具有良好的學習泛化能力,基于極限學習 的模型已經(jīng)開始應用于金融破產(chǎn)預測、經(jīng)濟生命周期預測和企業(yè)信用評估等風險預測和評 估中。由于極限學習機的輸入?yún)?shù)值隨機產(chǎn)生,導致模型的性能不夠穩(wěn)定,為了解決該問 題,核極限學習機的概念被提出。相比于極限學習機,核極限學習機不需要隨機設置輸入層 和隱藏層的權(quán)值,因而能夠獲得更高的訓練速度,基于核極限學習機的企業(yè)經(jīng)營風險預測 相比其他預測方法更加準確。
[0005] 然而,現(xiàn)有研究表明核極限學習機的性能易受兩個參數(shù)影響,即懲罰系數(shù)和核寬。 懲罰系數(shù)用于確定擬合誤差最小化和輸入之間的權(quán)衡重量最小化,核寬定義了從輸入空間 到高維特征空間的非線性映射關(guān)系。運兩個關(guān)鍵參數(shù)需要預先確定,如何確定最優(yōu)的懲罰 系數(shù)和最優(yōu)的核寬,一直未獲得較好的解決,目前,通常采用的方法是利用網(wǎng)格捜索方法確 定它們的值,但網(wǎng)絡捜索方法易陷入局部最優(yōu),因而導致風險預測的精確度不高。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的在于提供一種基于核極限學習機的風險預測的方法和裝置,旨在解 決現(xiàn)有技術(shù)中無法確定核極限學習機的懲罰系數(shù)和核寬的最佳值,導致風險預測的精確度 不高的問題。
[0007] 本發(fā)明的第一方面,提供一種基于核極限學習機的風險預測的方法,包括:
[000引獲取預定數(shù)量的企業(yè)的經(jīng)營數(shù)據(jù),所述經(jīng)營數(shù)據(jù)包括預定個數(shù)的屬性特征的特征 值;
[0009] 對所述經(jīng)營數(shù)據(jù)進行標準化;
[0010] 基于標準化后的所述經(jīng)營數(shù)據(jù),利用灰狼算法優(yōu)化核極限學習機的懲罰系數(shù)和核 寬,得到優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬,所述優(yōu)化后的懲罰系數(shù)用于確定擬合誤差最 小化W及輸入數(shù)據(jù)之間的權(quán)衡重量最小化,所述優(yōu)化后的核寬為從輸入空間到高維特征空 間的非線性映射關(guān)系;
[0011] 基于所述優(yōu)化后的懲罰系數(shù)和所述優(yōu)化后的核寬構(gòu)建所述核極限學習機的預測 模型;
[0012] 根據(jù)所述預測模型進行風險預測。
[0013] 本發(fā)明的第二方面,提供一種基于核極限學習機的風險預測的裝置,包括:
[0014] 數(shù)據(jù)獲取模塊,用于獲取預定數(shù)量的企業(yè)的經(jīng)營數(shù)據(jù),所述經(jīng)營數(shù)據(jù)包括預定個 數(shù)的屬性特征的特征值;
[0015] 標準化模塊,用于對所述經(jīng)營數(shù)據(jù)進行標準化;
[0016] 灰狼優(yōu)化模塊,用于基于標準化后的所述經(jīng)營數(shù)據(jù),利用灰狼算法優(yōu)化核極限學 習機的懲罰系數(shù)和核寬,得到優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬,所述優(yōu)化后的懲罰系數(shù) 用于確定擬合誤差最小化W及輸入數(shù)據(jù)之間的權(quán)衡重量最小化,所述優(yōu)化后的核寬為從輸 入空間到高維特征空間的非線性映射關(guān)系;
[0017] 模型構(gòu)建模塊,用于基于所述優(yōu)化后的懲罰系數(shù)和所述優(yōu)化后的核寬構(gòu)建所述核 極限學習機的預測模型;
[0018] 預測模塊,用于根據(jù)所述預測模型進行風險預測。
[0019] 本發(fā)明與現(xiàn)有技術(shù)相比存在的有益效果是:通過將灰狼算法融入核極限學習機來 確定核極限學習機的懲罰系數(shù)和核寬,由于灰狼算法通過模仿自然界中狼群的社會等級和 獵食行為獲得問題的最優(yōu)解,因此具有更好的捜索能力,能夠確定核極限學習機的懲罰系 數(shù)和核寬的最佳值,從而可W構(gòu)建出更加準確的核極限學習機的預測模型,實現(xiàn)對企業(yè)經(jīng) 營風險的有效預測,并大大提高了預測的精確度,在輔助金融機構(gòu)對企業(yè)經(jīng)營風險進行科 學合理有效的預測中具有重要的應用價值。
【附圖說明】
[0020] 圖1是本發(fā)明實施例一提供的一種基于核極限學習機的風險預測的方法的流程 圖;
[0021] 圖2是本發(fā)明實施例二提供的一種基于核極限學習機的風險預測的方法的流程 圖;
[0022] 圖3是本發(fā)明實施例=提供的一種基于核極限學習機的風險預測的裝置的結(jié)構(gòu)示 意圖;
[0023] 圖4是本發(fā)明實施例四提供的一種基于核極限學習機的風險預測的裝置的結(jié)構(gòu)示 意圖。
【具體實施方式】
[0024] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,W下結(jié)合附圖及實施例,對 本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用W解釋本發(fā)明,并 不用于限定本發(fā)明。
[0025] W下結(jié)合具體附圖對本發(fā)明的實現(xiàn)進行詳細的描述。
[0026] 實施例一.
[0027] 圖1是本發(fā)明實施例一提供的一種基于核極限學習機的風險預測的方法的流程 圖,具體包括步驟SlOl至S104,詳述如下:
[0028] S101、獲取預定數(shù)量的企業(yè)的經(jīng)營數(shù)據(jù),該經(jīng)營數(shù)據(jù)包括預定個數(shù)的屬性特征的 特征值。
[0029] 具體地,企業(yè)經(jīng)營數(shù)據(jù)指從會計學角度定義的企業(yè)當前經(jīng)濟狀況的屬性特征,屬 性特征代表一系列的金融比率,具體可W但不限于包括現(xiàn)金/流動負債比(cash/current liabilities)、現(xiàn)金/總資產(chǎn)比(cash/total assets)、流動資產(chǎn)/流動負載比(current assets/current liabilities)、流動資產(chǎn) / 總資產(chǎn) t:t(current assets/total assets)、營 運資金/總資產(chǎn)比(working capital/total assets)、營運資金/銷售額比(working capital/sales)、銷售額/庫存比(sales/inventoiT)、銷售額/應收賬款比(sales/ receivables)等。
[0030] 在預定數(shù)量的企業(yè)中,每一個企業(yè)都提供預定個數(shù)的屬性特征,運些預定數(shù)量的 企業(yè)的預定個數(shù)的屬性特征的特征值構(gòu)成全部經(jīng)營數(shù)據(jù)。
[0031] S102、對經(jīng)營數(shù)據(jù)進行標準化。
[0032] 具體地,在每一個企業(yè)的經(jīng)營數(shù)據(jù)中,對每一個屬性特征均進行標準化處理,使得 標準化處理后的經(jīng)營數(shù)據(jù)能夠準確有效的支撐灰狼算法的實現(xiàn)。
[0033] 進一步地,可W按照公式(1)對經(jīng)營數(shù)據(jù)進行標準化處理:
[0034]
(1)
[0035] 其中,sy[i]'為第y個企業(yè)的第i個屬性特征標準化后的特征值,sy[i]為第y個企業(yè) 的第i個屬性特征的特征值,S[i]max為預定數(shù)量的企業(yè)的第i個屬性特征的最大值,S[i]min 為預定數(shù)量的企業(yè)的第i個屬性特征的最小值,yG[l,門,Y為預定數(shù)量的企業(yè),iG[l,I],I 為預定個數(shù)的屬性特征。
[0036] S103、基于標準化后的經(jīng)營數(shù)據(jù),利用灰狼算法優(yōu)化核極限學習機的懲罰系數(shù)和 核寬,得到優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬,優(yōu)化后的懲罰系數(shù)用于確定擬合誤差最小 化W及輸入數(shù)據(jù)之間的權(quán)衡重量最小化,優(yōu)化后的核寬為從輸入空間到高維特征空間的非 線性映射關(guān)系。
[0037] 具體地,灰狼算法的過程是根據(jù)標準化后的經(jīng)營數(shù)據(jù)計算灰狼的位置,并確定排 在前=位的灰狼的位置,并根據(jù)運前=位灰狼的位置,使其他的灰狼跟隨著運=只最優(yōu)秀 的灰狼去圍捕獵物,即讓其他灰狼的位置不斷圍繞和接近運=只灰狼,每更新一次位置即 完成一次迭代過程,并得到狼群的一個新的位置集合,反復迭代直到達到預置的最大迭代 次數(shù)為止。
[0038] 每一只灰狼的位置包括兩個參數(shù),即懲罰系數(shù)和核寬,懲罰系數(shù)用于確定擬合誤 差最小化W及輸入數(shù)據(jù)之間的權(quán)衡重量最小化,核寬為從輸入空間到高維特征空間的非線 性映射關(guān)系。因此,在通過灰狼算法得到的狼群的最終位置集合中,排在第一位的灰狼即頭 狼的位置的兩個參數(shù)即為優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬。
[0039] S104、基于優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬構(gòu)建核極限學習機的預測模型。
[0040] 具體地,基于步驟S103得到的優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬,進行核極限學 習機的預測模型的構(gòu)建。
[0041] S105、根據(jù)預測模型進行風險預測。
[0042] 具體地,根據(jù)步驟S104構(gòu)建的核極限學習機的預測模型,可W對企業(yè)經(jīng)營風險進 行預測。
[0043] 本實施例中,通過將灰狼算法融入核極限學習機來確定核極限學習機的懲罰系數(shù) 和核寬,由于灰狼算法通過模仿自然界中狼群的社會等級和獵食行為獲得問題的最優(yōu)解, 因此具有更好的捜索能力,能夠確定核極限學習機的懲罰系數(shù)和核寬的最佳值,從而可W 構(gòu)建出更加準確的核極限學習機的預測模型,實現(xiàn)對企業(yè)經(jīng)營風險的有效預測,并大大提 高了預測的精確度,在輔助金融機構(gòu)對企業(yè)經(jīng)營風險進行科學合理有效的預測中具有重要 的應用價值。
[0044] 實施例二:
[0045] 圖2是本發(fā)明實施例二提供的一種基于核極限學習機的風險預測的方法的流程 圖,具體包括步驟S201至S208,詳述如下:
[0046] S201、獲取預定數(shù)量的企業(yè)的經(jīng)營數(shù)據(jù),該經(jīng)營數(shù)據(jù)包括預定個數(shù)的屬性特征的 特征值。
[0047] 具體地,企業(yè)經(jīng)營數(shù)據(jù)指從會計學角度定義的企業(yè)當前經(jīng)濟狀況的屬性特征,屬 性特征代表一系列的金融比率,具體可W但不限于包括現(xiàn)金/流動負債比(cash/current liabilities)、現(xiàn)金/總資產(chǎn)比(cash/total assets)、流動資產(chǎn)/流動負載比(current assets/current liabilities)、流動資產(chǎn) / 總資產(chǎn) t:t(current assets/total assets)、營 運資金/總資產(chǎn)比(working capital/total assets)、營運資金/銷售額比(working capital/sales)、銷售額/庫存比(sales/inventoiT)、銷售額/應收賬款比(sales/ receivables)等。
[004引在預定數(shù)量的企業(yè)中,每一個企業(yè)都提供預定個數(shù)的屬性特征,運些預定數(shù)量的 企業(yè)的預定個數(shù)的屬性特征的特征值構(gòu)成了全部經(jīng)營數(shù)據(jù)。
[0049] S202、對經(jīng)營數(shù)據(jù)進行標準化。
[0050] 在每一個企業(yè)的經(jīng)營數(shù)據(jù)中,對每一個屬性特征均進行標準化處理,使得標準化 處理后的經(jīng)營數(shù)據(jù)能夠準確有效的支撐灰狼算法的實現(xiàn)。
[0051] 具體地,可W按照公式(2)對經(jīng)營數(shù)據(jù)進行標準化處理:
[0052](2)
[0053] 其中,SyLi」'
為第y個企業(yè)的第i個屬性特征標準化后的特征值,Sy[ i]為第y個企業(yè) 的第i個屬性特征的特征值,S[i]max為預定數(shù)量的企業(yè)的第i個屬性特征的最大值,S[i]min 為預定數(shù)量的企業(yè)的第i個屬性特征的最小值,yG[l,門,Y為預定數(shù)量的企業(yè),iG[l,I],I 為預定個數(shù)的屬性特征。
[0054] S203、初始化灰狼參數(shù),該灰狼參數(shù)包括最大迭代次數(shù)T、灰狼個數(shù)M、懲罰系數(shù)C的 捜索范圍[Cmin,Cmax]和核寬丫的捜索范圍[丫 min, 丫 max]。
[0055]具體地,對灰狼算法中需要用到的灰狼參數(shù)進行初始化,可W但不限于包括最大 迭代次數(shù)T、灰狼個數(shù)M、懲罰系數(shù)C的捜索范圍[Cmin,Cmax]和核寬丫的捜索范圍[丫 min, y max] O
[0化6] S204、設置每一只灰狼的位置Xm,并建立灰狼位置矩陣1。
[0057]具體地,按照公式(3)設置每一只灰狼的位置Xm:
[0化引 Xm=(Xml,Xm2) (3)
[0059] 其中,Xmi為灰狼m在當前位置時懲罰系數(shù)的值,為灰狼m在當前位置時核寬的 值,niE [1 ,M] , Xml E [ Cmin , Cmax ] , E [丫 min , 丫 max ]。
[0060] 根據(jù)每一只灰狼的位置Xm,按照公式(4)構(gòu)建灰狼位置矩陣^。
[0061 ]
' 4)
[0062] S205、計算每一只灰狼的適應度fm。
[0063] 具體地,適應度fm為基于Xm計算得到的核極限學習機的準確度ACC,核極限學習機 的準確度ACC是對步驟S202得到的標準化后的經(jīng)營數(shù)據(jù)進行K折交叉驗證后,獲取的平均準 確度,核極限學習機的準確度ACC按照公式(5)計算得到:
[0064]
(5)
[0065] 其中,acck為第k折交叉驗證的準確度,K為大于0的整數(shù)。
[0066] 交叉驗證(Cross-validation)是指在給定的建模樣本中,拿出大部分樣本進行模 型構(gòu)建,留小部分樣本對所建立的模型進行預報,并求運小部分樣本的預報誤差,運個過程 一直進行,直到所有的樣本都被預報了一次而且僅被預報一次。交叉驗證的目的是為了得 到可靠穩(wěn)定的模型。K折交叉驗證化-fold cross-validation)是交叉驗證的一種具體形 式,常用的K折交叉驗證為10折交叉驗證(10-fold cross validation)。
[0067] 在本實施例中,K折交叉驗證化-fold cross-validation)是指將步驟S202得到的 標準化后的經(jīng)營數(shù)據(jù)分割成K個子樣本,輪流將其中一個子樣本作為測試數(shù)據(jù),其他K-I個 子樣本作為訓練數(shù)據(jù),保證每一個子樣本都有一次作為測試數(shù)據(jù)的機會。交叉驗證重復K 次,每個子樣本驗證一次,每一次交叉驗證的結(jié)果即為acck,平均K次交叉驗證的結(jié)果得到 一個單一估測值,即核極限學習機的準確度ACC。
[0068] S206、按照適應度fm對灰狼進行排序,得到具有最高適應度的灰狼a的位置、具 有次高適應度的灰狼e的位置和適應度第=高的灰狼S的位置。
[0069] 具體地,對灰狼按照步驟S205得到的適應度fm的值進行排序,得到具有最高適應 度的灰狼a的位置具有次高適應度的灰狼e的位置和適應度第=高的灰狼S的位置 fd,其中具有最高適應度的灰狼a作為頭狼。
[0070] S207、分別計算灰狼a、灰狼e和灰狼S距離獵物的距離D、4和&。
[0071] 具體地,按照公式(6)計算計算灰狼a、灰狼0和灰狼S距離獵物的距離
[0072]
(后)
[0073] 其中,這、這和S通過公
十算得到,為[0,1]之間的隨機數(shù),即;^取不同 的隨機數(shù)分別得到ci、ミ和ミ,l為當前的灰狼位置矩陣,f。、和為在當前灰狼位 置矩陣中排在前=位的灰狼的位置。
[0074] S208、完成對灰狼位置矩陣^的更新。
[00巧]具體地,按照公式(7)對灰狼位置矩陣1進行更新:
[0076]
(7)
[0077] 其中,4、4和4通過公式
計算得到:
,t為當前迭代次 數(shù),tG[l,T],3隨著迭代次數(shù)t的增加會在巧Ijo之間線性遞減,;^為[0,1]之間的隨機數(shù),即 n取不同的隨機數(shù)分別得到4、石和4,&、馬和這通過公式(6)計算得到。
[0078] 灰狼算法的核屯、思想是讓除去排在狼群前=位的其他灰狼跟隨著運=只優(yōu)秀的 灰狼去圍捕獵物,運是灰狼算法的算法生物學核屯、意義所在。在具體算法中,運個核屯、思想 是通過公式(7)來模擬實現(xiàn)的。其中,
的含義是讓狼群中除去灰狼a之外的 其他灰狼跟隨著灰狼a去獵食,即其他灰狼的位置不斷接近灰狼a
的含義 是讓狼群中除去灰狼e之外的其他灰狼跟隨著灰狼e去獵食,即其他灰狼的位置不斷接近灰 狼e,
的含義是讓狼群中除去灰狼S之外的其他灰狼跟隨著灰狼S去獵食, 即其他灰狼的位置不斷接近灰狼S:
的含義則是對圍繞著運=只優(yōu)秀的灰 狼產(chǎn)生的新的狼群的S個灰狼位置矩陣^和;?,進行平均,所得到的I即為此次迭代 后更新的狼群的灰狼位置矩陣4。
[0079] S209、判斷當前迭代次數(shù)t是否達到所述最大迭代次數(shù)T,如果是,則執(zhí)行步驟 S210,否則根據(jù)更新后的灰狼位置矩陣J返回步驟S205繼續(xù)執(zhí)行。
[0080] 具體地,如果當前迭代次數(shù)t是否達到所述最大迭代次數(shù)T,則灰狼優(yōu)化完成,執(zhí)行 步驟S210,否則根據(jù)更新后的灰狼位置矩陣X返回步驟S205繼續(xù)進行迭代。
[0081 ] S210、輸出灰狼a的位置Xa= (Xal,Xa2),其中Xal為優(yōu)化后的懲川系數(shù)C,Xa2為優(yōu)化后 的核寬T。
[0082] 具體地,當前迭代次數(shù)t達到所述最大迭代次數(shù)T時,此時最新的灰狼位置矩陣1 中排在第一位的頭狼的位置的參數(shù)即為優(yōu)化后的懲罰系數(shù)C和優(yōu)化后的核寬丫。即灰狼a的 位置Xa=Ual,Xa2)中,XU為優(yōu)化后的懲罰系數(shù)C,Xa2為優(yōu)化后的核寬丫。
[0083] S211、基于優(yōu)化后的懲罰系數(shù)C和優(yōu)化后的核寬丫構(gòu)建核極限學習機的預測模型。
[0084] 具體地,基于優(yōu)化后的懲罰系數(shù)C和優(yōu)化后的核寬丫,按照公式(8)構(gòu)建核極限學 習機的預測模型:
[0085]
(8) 1234567 其中,S為待測試樣本,SI,…,SN為訓練樣本,N為預置的訓練樣本數(shù),nG[l,N], Q ELM為預置的符合Mercer定理構(gòu)造的核矩陣。 2 待測試樣本是指在現(xiàn)有的數(shù)據(jù)集即步驟S202得到的標準化后的經(jīng)營數(shù)據(jù)中,按照 預設的規(guī)則取一定數(shù)量的樣本,作為檢測模型性能的數(shù)據(jù),訓練樣本是指除去待檢測樣本 的其他樣本,作為訓練模型的訓練樣本。待測試樣本和訓練樣本的樣本個數(shù)由N的取值決 定。 3 Mercer定理是指任何半正定的函數(shù)都可W作為核函數(shù)。 4 S212、根據(jù)預測模型進行風險預測。 5 具體地,根據(jù)步驟S211構(gòu)建的核極限學習機的預測模型,可W對企業(yè)經(jīng)營風險進 行預測。 6 本實施例中,通過將灰狼算法融入核極限學習機來確定核極限學習機的懲罰系數(shù) 和核寬,具體地,將懲罰系數(shù)和核寬設定為灰狼的位置參數(shù)并設置灰狼位置矩陣,通過計算 灰狼的適應度并對適應度的值進行排序,得到適應度排在前=位的灰狼的位置,并根據(jù)前 =位的灰狼位置不斷更新灰狼位置矩陣,使其他灰狼的位置不斷接近運=只灰狼,即通過 模仿自然界中狼群的社會等級和獵食行為獲得問題的最優(yōu)解,即核極限學習機的懲罰系數(shù) 和核寬的最佳值,從而可W構(gòu)建出更加準確的核極限學習機的預測模型,實現(xiàn)對企業(yè)經(jīng)營 風險的有效預測,并大大提高了預測的精確度,在輔助金融機構(gòu)對企業(yè)經(jīng)營風險進行科學 合理有效的預測中具有重要的應用價值。 7 實施例
[0093] 圖3是本發(fā)明實施例=提供的一種基于核極限學習機的風險預測的裝置的結(jié)構(gòu)示 意圖,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。圖3示例的一種基于核極限學 習機的風險預測的裝置可W是前述實施例一提供的一種基于核極限學習機的風險預測的 方法的執(zhí)行主體。圖3示例的集中基于核極限學習機的風險預測的裝置主要包括:數(shù)據(jù)獲取 模塊31、標準化模塊32、灰狼優(yōu)化模塊33、模型構(gòu)建模塊34和預測模塊35。各功能模塊詳細 說明如下:
[0094] 數(shù)據(jù)獲取模塊31,用于獲取預定數(shù)量的企業(yè)的經(jīng)營數(shù)據(jù),該經(jīng)營數(shù)據(jù)包括預定個 數(shù)的屬性特征的特征值;
[00M]標準化模塊32,用于對經(jīng)營數(shù)據(jù)進行標準化;
[0096] 灰狼優(yōu)化模塊33,用于基于標準化后的經(jīng)營數(shù)據(jù),利用灰狼算法優(yōu)化核極限學習 機的懲罰系數(shù)和核寬,得到優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬,優(yōu)化后的懲罰系數(shù)用于確 定擬合誤差最小化W及輸入數(shù)據(jù)之間的權(quán)衡重量最小化,優(yōu)化后的核寬為從輸入空間到高 維特征空間的非線性映射關(guān)系;
[0097] 模型構(gòu)建模塊34,用于基于優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬構(gòu)建核極限學習機 的預測模型;
[0098] 預測模塊35,用于根據(jù)預測模型進行風險預測。
[0099] 本實施例提供的一種基于核極限學習機的風險預測的裝置中各模塊實現(xiàn)各自功 能的過程,具體可參考前述圖1所示實施例的描述,此處不再寶述。
[0100] 從上述圖3示例的一種基于核極限學習機的風險預測的裝置可知,本實施例中,通 過將灰狼算法融入核極限學習機來確定核極限學習機的懲罰系數(shù)和核寬,由于灰狼算法通 過模仿自然界中狼群的社會等級和獵食行為獲得問題的最優(yōu)解,因此具有更好的捜索能 力,能夠確定核極限學習機的懲罰系數(shù)和核寬的最佳值,從而可W構(gòu)建出更加準確的核極 限學習機的預測模型,實現(xiàn)對企業(yè)經(jīng)營風險的有效預測,并大大提高了預測的精確度,在輔 助金融機構(gòu)對企業(yè)經(jīng)營風險進行科學合理有效的預測中具有重要的應用價值。
[0101] 實施例四:
[0102] 圖4是本發(fā)明實施例四提供的一種基于核極限學習機的風險預測的裝置的結(jié)構(gòu)示 意圖,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。圖4示例的一種基于核極限學 習機的風險預測的裝置可W是前述實施例二提供的一種基于核極限學習機的風險預測的 方法的執(zhí)行主體。圖4示例的集中基于核極限學習機的風險預測的裝置主要包括:數(shù)據(jù)獲取 模塊41、標準化模塊42、灰狼優(yōu)化模塊43、模型構(gòu)建模塊44和預測模塊45。各功能模塊詳細 說明如下:
[0103] 數(shù)據(jù)獲取模塊41,用于獲取預定數(shù)量的企業(yè)的經(jīng)營數(shù)據(jù),該經(jīng)營數(shù)據(jù)包括預定個 數(shù)的屬性特征的特征值;
[0104] 標準化模塊42,用于對經(jīng)營數(shù)據(jù)進行標準化;
[0105] 灰狼優(yōu)化模塊43,用于基于標準化后的經(jīng)營數(shù)據(jù),利用灰狼算法優(yōu)化核極限學習 機的懲罰系數(shù)和核寬,得到優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬,優(yōu)化后的懲罰系數(shù)用于確 定擬合誤差最小化W及輸入數(shù)據(jù)之間的權(quán)衡重量最小化,優(yōu)化后的核寬為從輸入空間到高 維特征空間的非線性映射關(guān)系;
[0106] 模型構(gòu)建模塊44,用于基于優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬構(gòu)建核極限學習機 的預測模型;
[0107] 預測模塊45,用于根據(jù)預測模型進行風險預測。
[0108] 進一步地,標準化模塊42,還用于:
[0109] 按如下公式對經(jīng)營數(shù)據(jù)進行標準化:
[0110]
[0111] 其中,Sy[i]'為第y個企業(yè)的第i個屬性特征標準化后的特征值,Sy[i]為第y個企業(yè) 的第i個屬性特征的特征值,S[i]max為所述預定數(shù)量的企業(yè)的第i個屬性特征的最大值,S
[i]min為所述預定數(shù)量的企業(yè)的第i個屬性特征的最小值,y G [1,門,Y為所述預定數(shù)量的企 業(yè),i G [ 1,I ],I為所述預定個數(shù)的屬性特征。
[0112] 進一步地,灰狼優(yōu)化模塊43包括:
[0113] 初始化子模塊431,用于初始化灰狼參數(shù),該灰狼參數(shù)包括最大迭代次數(shù)T、灰狼個 數(shù)M、懲罰系數(shù)C的捜索范圍[Cmin,Cmax]和核寬丫的捜索范圍[丫 min, 丫 max];
[0114] 位置設置子模塊432,用于按如下公式設置每一只灰狼的位置Xm,并建立灰狼位置 矩陣;;
[0115;
[0116; 1234567 其中,Xml為灰狼m在當前位置時懲罰系數(shù)的值,為灰狼m在當前位置時核寬的 值,niE [1 ,M] , Xml E [ Cmin , Cmax ] , E [丫 min , 丫 max ]; 2 優(yōu)化迭代子模塊433,用于根據(jù)標準化后的經(jīng)營數(shù)據(jù)計算灰狼的適應度,并按照適 應度對灰狼進行排序,更新灰狼位置得到更新后的灰狼位置矩陣i,完成一次灰狼優(yōu)化迭 代,并根據(jù)更新后的灰狼位置矩陣1繼續(xù)進行灰狼優(yōu)化迭代,直到達到最大迭代次數(shù)T為 止,輸出當前灰狼位置矩陣J中頭狼的位置,根據(jù)頭狼的位置得到優(yōu)化后的懲罰系數(shù)C和優(yōu) 化后的核寬丫。 3 進一步地,優(yōu)化迭代子模塊433,還用于: 4 計算每一只灰狼的適應度fm,該適應度fm為基于Xm計算得到的核極限學習機的準 確度ACC,準確度ACC為基于標準化后的經(jīng)營數(shù)據(jù)的K折交叉驗證獲取的平均準確度,準確度 ACC的計宵公古責? 5
[0121]
6 其中,acck為第k折交叉驗證的準確度,K為大于0的整數(shù); 7 按照適應度fm對灰狼進行排序,得到具有最高適應度的灰狼Cl的位置之<<、具有次 高適應度的灰狼e的位置和適應度第=高的灰狼S的位置J
[0124] 按照如下公式分別計算灰狼a、灰狼e和灰狼S距離獵物的距離、/^和6、
[0125]
[0126]
[0127]
[0128] 其中,S、Q和^通過公式? =2,"^十算得到,端為[0,1 ]之間的隨機數(shù);
[0129] 按照如下公式完成對灰狼位置矩陣X的更新:
[0130]
[0131]
[0132]
[0133]
[0134] 其中,4、和4通過公式
計算得到:
,t為當前迭代次 數(shù),*£[1,門,;^;%[0,1]之間的隨機數(shù);
[0135] 如果當前迭代次數(shù)t尚未達到最大迭代次數(shù)T,則根據(jù)更新后的灰狼位置矩陣X繼 續(xù)進行灰狼優(yōu)化迭代,直到當前迭代次數(shù)t達到最大迭代次數(shù)T為止;
[0136] 輸出灰狼a的位置Xa= (Xal,Xa2),其中Xal為優(yōu)化后的懲罰系數(shù)C,Xa2為優(yōu)化后的核 寬丫。
[0137] 進一步地,模型構(gòu)建模塊44包括:
[0138] 預測模型構(gòu)建子模塊441,用于基于優(yōu)化后的懲罰系數(shù)C和優(yōu)化后的核寬T,按照 如下公式構(gòu)建核極限學習機的預測模型:
[0139]
[0140]
[0141] 其中,S為待測試樣本,Si,…,SN為訓練樣本,N為預置的訓練樣本數(shù),n G [ 1,N], Q ELM為預置的符合Mercer定理構(gòu)造的核矩陣。
[0142] 本實施例提供的一種基于核極限學習機的風險預測的裝置中各模塊實現(xiàn)各自功 能的過程,具體可參考前述圖2所示實施例的描述,此處不再寶述。
[0143] 從上述圖4示例的一種基于核極限學習機的風險預測的裝置可知,本實施例中,通 過將灰狼算法融入核極限學習機來確定核極限學習機的懲罰系數(shù)和核寬,具體地,將懲罰 系數(shù)和核寬設定為灰狼的位置參數(shù)并設置灰狼位置矩陣,通過計算灰狼的適應度并對適應 度的值進行排序,得到適應度排在前=位的灰狼的位置,并根據(jù)前=位的灰狼位置不斷更 新灰狼位置矩陣,使其他灰狼的位置不斷接近運=只灰狼,即通過模仿自然界中狼群的社 會等級和獵食行為獲得問題的最優(yōu)解,即核極限學習機的懲罰系數(shù)和核寬的最佳值,從而 可W構(gòu)建出更加準確的核極限學習機的預測模型,實現(xiàn)對企業(yè)經(jīng)營風險的有效預測,并大 大提高了預測的精確度,在輔助金融機構(gòu)對企業(yè)經(jīng)營風險進行科學合理有效的預測中具有 重要的應用價值。
[0144] 需要說明的是,本說明書中的各個實施例均采用遞進的方式描述,每一個實施例 重點說明的都是與其他實施例的不同之處,各個實施例之間相同或者相似的部分互相參見 即可。對于裝置類實施例而言,由于其與方法實施例基本相似,所W描述的比較簡單,相關(guān) 之處參見方法實施例的部分說明即可。
[0145] 值得注意的是,上述裝置實施例中,所包括的各個模塊只是按照功能邏輯進行劃 分的,但并不局限于上述的劃分,只要能夠?qū)崿F(xiàn)相應的功能即可;另外,各功能模塊的具體 名稱也只是為了便于相互區(qū)分,并不用于限制本發(fā)明的保護范圍。
[0146] 本領(lǐng)域普通技術(shù)人員可W理解,實現(xiàn)上述各實施例方法中的全部或部分步驟是可 W通過程序來指令相關(guān)的硬件來完成,相應的程序可W存儲于一計算機可讀取存儲介質(zhì) 中,所述的存儲介質(zhì),如R0M/RAM、磁盤或光盤等。
[0147] W上所述僅為本發(fā)明的較佳實施例而已,并不用W限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1. 一種基于核極限學習機的風險預測的方法,其特征在于,包括: 獲取預定數(shù)量的企業(yè)的經(jīng)營數(shù)據(jù),所述經(jīng)營數(shù)據(jù)包括預定個數(shù)的屬性特征的特征值; 對所述經(jīng)營數(shù)據(jù)進行標準化; 基于標準化后的所述經(jīng)營數(shù)據(jù),利用灰狼算法優(yōu)化核極限學習機的懲罰系數(shù)和核寬, 得到優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬,所述優(yōu)化后的懲罰系數(shù)用于確定擬合誤差最小化 以及輸入數(shù)據(jù)之間的權(quán)衡重量最小化,所述優(yōu)化后的核寬為從輸入空間到高維特征空間的 非線性映射關(guān)系; 基于所述優(yōu)化后的懲罰系數(shù)和所述優(yōu)化后的核寬構(gòu)建所述核極限學習機的預測模型; 根據(jù)所述預測模型進行風險預測。2. 根據(jù)權(quán)利要求1所述的基于核極限學習機的風險預測的方法,其特征在于,所述對所 述經(jīng)營數(shù)據(jù)進行標準化包括: 按如下公式對所述經(jīng)營數(shù)據(jù)進行標準化:其中,sy[i] '為第y個企業(yè)的第i個屬性特征標準化后的特征值,sy[i]為第y個企業(yè)的第 i個屬性特征的特征值,s[i]max為所述預定數(shù)量的企業(yè)的第i個屬性特征的最大值,s[i]min 為所述預定數(shù)量的企業(yè)的第i個屬性特征的最小值,ye [?,γ],γ為所述預定數(shù)量的企業(yè),i e [ I,I ],I為所述預定個數(shù)的屬性特征。3. 根據(jù)權(quán)利要求1所述的基于核極限學習機的風險預測的方法,其特征在于,所述基于 標準化后的所述經(jīng)營數(shù)據(jù),利用灰狼算法優(yōu)化核極限學習機的懲罰系數(shù)和核寬,得到優(yōu)化 后的懲罰系數(shù)和優(yōu)化后的核寬包括: 初始化灰狼參數(shù),所述灰狼參數(shù)包括最大迭代次數(shù)T、灰狼個數(shù)M、懲罰系數(shù)C的搜索范 圍[Cmin,C歷]和核寬γ的搜索范圍[ymin,ymax]; 按如下公式設置每一只灰狼的位置Xm,并建立灰狼位置矩陣^£其中,Xml為灰狼m在當前位置時所述懲罰系數(shù)的值,Xm2為灰狼m在當前位置時所述核寬 的值[I,M],Xml G [ Cmin,Cmax ],Xm2 G γ min,γ max ]; 根據(jù)標準化后的所述經(jīng)營數(shù)據(jù)計算灰狼的適應度,并按照所述適應度對灰狼進行排 序,更新灰狼位置得到更新后的灰狼位置矩陣^,完成一次灰狼優(yōu)化迭代,并根據(jù)所述更新 后的灰狼位置矩陣i繼續(xù)進行所述灰狼優(yōu)化迭代,直到達到所述最大迭代次數(shù)τ為止,輸出 當前灰狼位置矩陣?中頭狼的位置,根據(jù)所述頭狼的位置得到優(yōu)化后的懲罰系數(shù)C和優(yōu)化 后的核寬γ。4. 根據(jù)權(quán)利要求3所述的基于核極限學習機的風險預測的方法,其特征在于,所述根據(jù) 標準化后的所述經(jīng)營數(shù)據(jù)計算灰狼的適應度,并按照所述適應度對灰狼進行排序,更新灰 狼位置得到更新后的灰狼位置矩陣?,完成一次灰狼優(yōu)化迭代,并根據(jù)所述更新后的灰狼 位置矩陣?繼續(xù)進行所述灰狼優(yōu)化迭代,直到達到所述最大迭代次數(shù)T為止,輸出當前灰狼 位置矩陣?中頭狼的位置,根據(jù)所述頭狼的位置得到優(yōu)化后的懲罰系數(shù)C和優(yōu)化后的核寬 γ包括: 計算所述每一只灰狼的適應度fm,所述適應度fm為基于Xm計算得到的所述核極限學習 機的準確度ACC,所述準確度ACC為基于標準化后的所述經(jīng)營數(shù)據(jù)的K折交叉驗證獲取的平 均準確度,所述準確度ACC的計算公式為:其中,aCCk為第k折交叉驗證的準確度,K為大于O的整數(shù); 按照所述適應度對灰狼進行排序,得到具有最高適應度的灰狼α的位置?β、具有次高 適應度的灰狼邱勺位置i和適應度第三高的灰狼δ的位置; 按照如下公式分別計算所述灰狼α、所述灰狼β和所述灰狼S距離獵物的距離、? 和汐. 其中,C1、通過公式汐=2;1計算得到,?為[〇,ι]之間的隨機數(shù); 按照如下公式完成對灰狼位置矩陣?的更新:其中,4、為和為.通過公式I = 計算得到'為當前迭代次數(shù),te [1,1'],^為[0,1]之間的隨機數(shù);如果所述當前迭代次數(shù)t尚未達到所述最大迭代次數(shù)T,則根據(jù)更新后的灰狼位置矩陣 ^繼續(xù)進行灰狼優(yōu)化迭代,直到所述當前迭代次數(shù)t達到所述最大迭代次數(shù)T為止; 輸出灰狼α的位置Xa =( Xcil,Χα2 ),其中Xcil為優(yōu)化后的懲罰系數(shù)C,Xa2為優(yōu)化后的核寬γ。5. 根據(jù)權(quán)利要求1所述的基于核極限學習機的風險預測的方法,其特征在于,所述基于 所述優(yōu)化后的懲罰系數(shù)和所述優(yōu)化后的核寬構(gòu)建所述核極限學習機的預測模型包括: 基于所述優(yōu)化后的懲罰系數(shù)C和所述優(yōu)化后的核寬γ,按照如下公式構(gòu)建所述核極限 學習機的預涮樽型,K(s,sn)=exp(-y | |s-sn| |2) 其中,S為待測試樣本,S1,…,SN為訓練樣本,N為預置的訓練樣本數(shù),ηε[1,Ν],ΩΕυ^ 預置的符合Mercer定理構(gòu)造的核矩陣。6. -種基于核極限學習機的風險預測的裝置,其特征在于,包括: 數(shù)據(jù)獲取模塊,用于獲取預定數(shù)量的企業(yè)的經(jīng)營數(shù)據(jù),所述經(jīng)營數(shù)據(jù)包括預定個數(shù)的 屬性特征的特征值; 標準化模塊,用于對所述經(jīng)營數(shù)據(jù)進行標準化; 灰狼優(yōu)化模塊,用于基于標準化后的所述經(jīng)營數(shù)據(jù),利用灰狼算法優(yōu)化核極限學習機 的懲罰系數(shù)和核寬,得到優(yōu)化后的懲罰系數(shù)和優(yōu)化后的核寬,所述優(yōu)化后的懲罰系數(shù)用于 確定擬合誤差最小化以及輸入數(shù)據(jù)之間的權(quán)衡重量最小化,所述優(yōu)化后的核寬為從輸入空 間到高維特征空間的非線性映射關(guān)系; 模型構(gòu)建模塊,用于基于所述優(yōu)化后的懲罰系數(shù)和所述優(yōu)化后的核寬構(gòu)建所述核極限 學習機的預測模型; 預測模塊,用于根據(jù)所述預測模型進行風險預測。7. 根據(jù)權(quán)利要求6所述的基于核極限學習機的風險預測的裝置,其特征在于,所述標準 化模塊包括: 標準化處理子模塊,用于按如下公式對所述經(jīng)營數(shù)據(jù)進行標準化:其中,sy[ i ] '為第y個企業(yè)的第i個屬性特征標準化后的特征值,Sy[i ]為第y個企業(yè)的第 i個屬性特征的特征值,s[i]max為所述預定數(shù)量的企業(yè)的第i個屬性特征的最大值,s[i]min 為所述預定數(shù)量的企業(yè)的第i個屬性特征的最小值,ye [1,Y],Y為所述預定數(shù)量的企業(yè),i e [ I,I ],I為所述預定個數(shù)的屬性特征。8. 根據(jù)權(quán)利要求6所述的基于核極限學習機的風險預測的裝置,其特征在于,所述灰狼 優(yōu)化模塊包括: 初始化子模塊,用于初始化灰狼參數(shù),所述灰狼參數(shù)包括最大迭代次數(shù)T、灰狼個數(shù)M、 懲罰系數(shù)C的搜索范圍[Cmin,Cmax]和核寬γ的搜索范圍[ymin,; 位置設置子模塊,用于按如下公式設置每一只灰狼的位置Xm,并建立灰狼位置矩陣 Xm - ( Xml,Xm2 )其中,Xml為灰狼m在當前位置時所述懲罰系數(shù)的值,Xm2為灰狼m在當前位置時所述核寬 的值[I,M],Xml G [ Cmin,Cmax ],Xm2 G γ min,γ max ]; 優(yōu)化迭代子模塊,用于根據(jù)標準化后的所述經(jīng)營數(shù)據(jù)計算灰狼的適應度,并按照所述 適應度對灰狼進行排序,更新灰狼位置得到更新后的灰狼位置矩陣?,完成一次灰狼優(yōu)化 迭代,并根據(jù)所述更新后的灰狼位置矩陣i繼續(xù)進行所述灰狼優(yōu)化迭代,直到達到所述最 大迭代次數(shù)T為止,輸出當前灰狼位置矩陣}中頭狼的位置,根據(jù)所述頭狼的位置得到優(yōu)化 后的懲罰系數(shù)C和優(yōu)化后的核寬γ。9.根據(jù)權(quán)利要求8所述的基于核極限學習機的風險預測的裝置,其特征在于,所述優(yōu)化 迭代子模塊,還用于: 計算所述每一只灰狼的適應度fm,所述適應度fm為基于Xm計算得到的所述核極限學習 機的準確度ACC,所述準確度ACC為基于標準化后的所述經(jīng)營數(shù)據(jù)的K折交叉驗證獲取的平 均準確度,所述準確度ACC的計算公式為:其中,acck為第k折交叉驗證的準確度,K為大于O的整數(shù); 按照所述適應度對灰狼進行排序,得到具有最高適應度的灰狼α的位置具有次高 適應度的灰狼邱勺位置/#和適應度第三高的灰狼δ的位置; 按照如下公式分別計算所述灰狼α、所述灰狼β和所述灰狼S距離獵物的距離 和爲:::其中,4、在和Q通過公式5=2/^計算得到,?為[〇,1]之間的隨機數(shù); 按照如下公式完成對灰狼位置矩陣?的更新:其中,4、為和為.通過公式J = 計算得到,:為當前迭代次數(shù),tG [1,1'],€為[0,1]之間的隨機數(shù); 如果所述當前迭代次數(shù)t尚未達到所述最大迭代次數(shù)T,則根據(jù)更新后的灰狼位置矩陣 ?繼續(xù)進行灰狼優(yōu)化迭代,直到所述當前迭代次數(shù)t達到所述最大迭代次數(shù)T為止; 輸出灰狼α的位置Xa =( Xal,Χα2 ),其中Xcil為優(yōu)化后的懲罰系數(shù)C,Xa2為優(yōu)化后的核寬γ。10.根據(jù)權(quán)利要求6所述的基于核極限學習機的風險預測的裝置,其特征在于,所述模 型構(gòu)建模塊包括: 預測模型構(gòu)建子模塊,用于基于所述優(yōu)化后的懲罰系數(shù)C和所述優(yōu)化后的核寬γ,按照 如下公式構(gòu)建所述核極限學習機的預測模型:K(s,sn)=exp(-y | |s-sn| Γ) 其中,S為待測試樣本,S1,…,SN為訓練樣本,N為預置的訓練樣本數(shù),ηε[1,Ν],ΩΕυ^ 預置的符合Mercer定理構(gòu)造的核矩陣。
【文檔編號】G06Q10/04GK106022517SQ201610326839
【公開日】2016年10月12日
【申請日】2016年5月17日
【發(fā)明人】陳慧靈, 趙學華, 王名鏡, 童長飛, 蔡振鬧, 李俊, 沈立明, 王科杰, 朱彬磊
【申請人】溫州大學