国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于IFOA?SVM的個人信用風險評估方法與流程

      文檔序號:12887984閱讀:328來源:國知局
      一種基于IFOA?SVM的個人信用風險評估方法與流程

      本發(fā)明涉及信用風險評估方法,特別涉及基于改進果蠅算法優(yōu)化svm的個人信用風險評估方法,屬于人工智能方法在信用風險評估領域的運用。



      背景技術:

      在無抵押純信用貸款熱不斷升溫的形勢下,各商業(yè)銀行均把貸款業(yè)務作為發(fā)展的重點。然而2016年銀監(jiān)會發(fā)布的《中國銀行業(yè)運行報告》五大行的不良貸款余額為8079.5億元,不良貸款率同比增長25.7%。阻礙信貸業(yè)務發(fā)展的主要原因是商業(yè)銀行對貸款風險的管理水平較低,缺乏有效的個人信用評估方法。信用風險評估模型的準確率每上升一個百分點,就可為商業(yè)銀行帶來以萬計的利潤。因此研究個人信用風險評估具有很強的實用價值。

      人工智能模型相比于統(tǒng)計模型能夠更好的解決類似于信用風險評估這種非線性模式分類問題。常用的人工智能模型有貝葉斯網(wǎng)絡、決策樹(decisiontrees,dt)、支持向量機(supportvectormachine,svm)和bp神經(jīng)網(wǎng)絡等。svm尤其是在解決小規(guī)模樣本、非線性和高維模式識別等問題時,總能表現(xiàn)出良好的性能,因此svm在信用風險評估中也得到了廣泛的應用。然而大量研究表明:svm表現(xiàn)較好,但并不總是能取得最好的效果。svm有很強的學習能力和泛化能力,但svm模型預測性能的優(yōu)劣卻與參數(shù)的選擇密切相關。因此采用有效的方法搜尋最佳的svm參數(shù),獲取較高的分類準確度是目前研究的熱點問題。國內(nèi)外學者提出的有關支持向量機模型參數(shù)(懲罰因子和核函數(shù)參數(shù))優(yōu)化的方法主要包括梯度下降法(gradientdescent,gd)、粒子群優(yōu)化算法(particleswarmoptimization,pso)、果蠅優(yōu)化算法(foa)和遺傳算法(geneticalgorithm,ga)等。如姜明輝等(2007)為克服人為選擇參數(shù)的隨機性,用遺傳算法優(yōu)化svm參數(shù),提高了預測精度。wang,etal(2013)提出用果蠅算法對svm參數(shù)進行優(yōu)化,運用于船舶操作的預測,預測精度比pso-svm和ga-svm預測精度都高。針對傳統(tǒng)果蠅優(yōu)化算法在對參數(shù)優(yōu)化時,容易陷入局部極值的缺陷。本發(fā)明對foa進行了改進,提出了一種改進的果蠅優(yōu)化算法來優(yōu)化svm的參數(shù),并將其應用于信用風險評估中。為了體現(xiàn)該模型評估效果的優(yōu)越性,與網(wǎng)格法搜索參數(shù)的svm、ga-svm和foa-svm的評估效果進行對比,實驗結果證明ifoa-svm模型在信用風險評估中可以獲得更高的準確率。



      技術實現(xiàn)要素:

      本發(fā)明的目的在于針對傳統(tǒng)果蠅優(yōu)化算法在對參數(shù)優(yōu)化時,容易陷入局部極值的缺陷,對果蠅算法進行改進,提供一種改進果蠅算法優(yōu)化svm的個人信用風險評估方法,有效提高信用風險評估的準確率。

      本發(fā)明提供一種基于ifoa-svm的個人信用風險評估方法,包括:

      步驟1),根據(jù)貸款人的個人數(shù)據(jù)對信用評價指標進行量化,確定基于ifoa-svm個人信用風險評價模型的目標函數(shù);

      步驟2),基于支持向量機建立用來對貸款人進行信用評估的svm模型,判別函數(shù)為其中k(xi,yj)為核函數(shù),b為常數(shù),ai為拉格朗日因子i=1,2...n;

      步驟3),對果蠅算法進行改進。

      步驟4),采用改進的果蠅算法優(yōu)化svm參數(shù),用改進的果蠅算法對懲罰因子c和核函數(shù)g進行全局尋優(yōu),得到兩個參數(shù)的最優(yōu)解。最優(yōu)解參數(shù)代入到步驟2中的svm模型進行學習訓練,建立基于ifoa-svm的個人信用風險評估模型;

      步驟5),將步驟1中的部分用作測試的貸款人數(shù)據(jù)帶入到步驟4中的基于ifoa-svm的個人信用風險評估模型,并與網(wǎng)格法搜索參數(shù)的svm、ga-svm和foa-svm的評估效果進行對比,四種模型的對比結果如表1所示。

      表1四類模型分類結果對比

      所述步驟1包括以下子步驟:

      (1,1)本發(fā)明所使用的個人信貸數(shù)據(jù)是來源第五屆“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽。選取1000個借款者信息及其對應的信用評級信息,其中500組作為訓練數(shù)據(jù),500組用于測試數(shù)據(jù)。訓練樣本集與測試樣本集分布情況如表2所示:

      表2樣本集分布情況

      (1,2)選取銀行賬戶的狀態(tài)、持續(xù)月份、信用歷史、信用保證金額度、儲蓄存款賬戶/債券、目前工作狀態(tài)、婚姻關系、個人居住情況、不動產(chǎn)、年齡、分期付款計劃、在這家銀行現(xiàn)有的信貸數(shù)量、可提供的擔保人、電話號碼有無注冊、是否為外籍人士這15個評級指標作為輸入變量,最后輸出的是其信用評級:1代表有風險,0代表無風險。

      表3指標選擇及量化方法

      (1,3)目標函數(shù)設置為svm對數(shù)據(jù)進行預測后的均方根誤差,并使得均方誤差最小化。

      所述步驟2包括以下子步驟:

      (2,1)對于給定的線性可分數(shù)據(jù)集d維空間中的線性判別函數(shù)g(x)=w·x+b,則可用超平面:w·x+b=0進行樣本分離,式中w為法向量,b為偏移。對于線性可分情況下,采用yi(w·xi+b)-1≥0,i=1,2...n表示。

      (2,2)對于線性不可分的情況,可以將松弛變量ξi引入到約束條件中,在中引入懲罰因子c來解決該問題。

      (2,3)當是非線性問題時,引入核函數(shù)其中σ>0;

      (2,4)建立的個人信用風險評估的svm模型為

      所述步驟3包括以下子步驟:

      (3,1)針對傳統(tǒng)果蠅優(yōu)化算法在對參數(shù)優(yōu)化時,容易陷入局部極值的缺陷,本發(fā)明對果蠅算法進行了改進,改進方法如下:

      在傳統(tǒng)的果蠅算法foa中,是找出當前味道濃度最優(yōu)的一只果蠅位置,然后果蠅群飛向該濃度最大的果蠅位置,果蠅飛向目的地難免會出現(xiàn)誤差,將導致尋找最優(yōu)味道濃度值的速度減緩。在傳統(tǒng)果蠅算法foa中,放飛一次就尋找最優(yōu)解,尋得一個近似最優(yōu)解的概率較小。針對上述問題,本發(fā)明提出一種改進的果蠅算法(improvingfruitflyoptimizationalgorithm,ifoa),可以提高算法尋優(yōu)效率的同時有效地保證算法的尋優(yōu)精度。ifoa是找出當前味道濃度較優(yōu)的n個精英果蠅位置,對這些位置進行加權處理,得到一個最優(yōu)加權位置,讓果蠅群向該位置飛去。放飛操作進行n次,選擇味道濃度均值最優(yōu)的一次放飛。改進的果蠅算法不僅提高了找到最優(yōu)解的概率,也使找到最優(yōu)解的速度得到了加快。

      所述步驟(3,1)具體包括以下子步驟:

      步驟a1,隨機初始化果蠅群體位置x1與y1,果蠅群體個數(shù)為m,果蠅種群迭代次數(shù)為n。

      步驟a2,由于事先無法得知食物所在的位置,所以先估計果蠅與坐標原點的距離d(i,:),然后計算味道濃度判定值s(i,:),此值為距離的倒數(shù)。

      步驟a3,尋找出此果蠅群體中味道濃度最高的n只精英果蠅,對其位置進行加權處理,得到加權最優(yōu)的位置

      步驟a4,讓果蠅群體憑借視覺飛往該加權最優(yōu)位置此操作執(zhí)行n次,選出目標函數(shù)均值最優(yōu)的一次放飛。

      步驟a5,保留均值最優(yōu)的味道濃度值f與最優(yōu)加權果蠅位置。

      步驟4包括以下子步驟:

      (4,1)初始化改進的果蠅算法中果蠅種群的大小和迭代次數(shù),選擇svm模型的相關參數(shù)(svm采用rbf徑向基函數(shù)作為核函數(shù))。本文中svm的參數(shù)k-cv方法,此法中k=3。設置果蠅種群規(guī)模為20,迭代代數(shù)為50。

      (4,2)建立svm訓練模型并進行測試,計算適應度函數(shù),得到每一次迭代中果蠅群規(guī)模中最佳參數(shù)組合,并記錄下來。

      步驟5包括以下子步驟:

      部分用作測試的貸款人數(shù)據(jù)帶入到步驟4中的基于ifoa-svm的個人信用風險評估模型,進行貸款人的信用風險評估。

      附圖說明

      圖1為改進的果蠅算法流程圖;

      圖2為建立ifoa-svm模型流程圖;

      圖3ifoa迭代曲線圖;

      圖4參數(shù)c和g果蠅個體的搜索位置圖;

      圖5ifoa-svm個人信用評估預測結果;

      圖6網(wǎng)格法svm模型測試集預測結果;

      圖7ga-svm模型測試集預測結果;

      圖8foa-svm模型測試集預測結果。

      有益效果

      與現(xiàn)有技術相比,本發(fā)明的有益效果在于:改進之后的果蠅算法可以提高算法尋優(yōu)效率的同時有效地保證了算法的尋優(yōu)精度。與網(wǎng)格法搜索參數(shù)的svm、ga-svm和foa-svm的評估效果進行對比,實驗結果證明ifoa-svm模型在信用風險評估中可以獲得更高的準確率。提高了預測性能,具有較強的實用性,為銀行等金融機構明確貸款客戶信用,降低貸款風險提供有效的依據(jù)。

      具體實施方式

      以下結合附圖具體說明本發(fā)明技術方案。

      步驟1),根據(jù)貸款人的個人數(shù)據(jù)對信用評價指標進行量化,確定基于ifoa-svm個人信用風險評價模型的目標函數(shù);

      步驟2),基于支持向量機建立用來對貸款人進行信用評估的svm模型,判別函數(shù)為其中k(xi,yj)為核函數(shù),b為常數(shù),ai為拉格朗日因子i=1,2...n;

      步驟3),對果蠅算法進行改進;

      步驟4),采用改進的果蠅算法優(yōu)化svm參數(shù),用改進的果蠅算法對懲罰因子c和核函數(shù)g進行全局尋優(yōu),得到兩個參數(shù)的最優(yōu)解;最優(yōu)解參數(shù)代入到步驟2中的svm模型進行學習訓練,建立基于ifoa-svm的個人信用風險評估模型;

      步驟5),將步驟1中的部分用作測試的貸款人數(shù)據(jù)帶入到步驟4)中的基于ifoa-svm的個人信用風險評估模型,并與網(wǎng)格法搜索參數(shù)的svm、ga-svm和foa-svm的評估效果進行對比。

      所述步驟1)包括以下子步驟:

      (1,1)選取1000個借款者信息及其對應的信用評級信息,其中500組作為訓練數(shù)據(jù),500組用于測試數(shù)據(jù);

      (1,2)選取銀行賬戶的狀態(tài)、持續(xù)月份、信用歷史、信用保證金額度、儲蓄存款賬戶/債券、目前工作狀態(tài)、婚姻關系、個人居住情況、不動產(chǎn)、年齡、分期付款計劃、在這家銀行現(xiàn)有的信貸數(shù)量、可提供的擔保人、電話號碼有無注冊、是否為外籍人士這15個評級指標作為輸入變量,最后輸出的是其信用評級:1代表有風險,0代表無風險;

      (1,3)目標函數(shù)設置為svm對數(shù)據(jù)進行預測后的均方根誤差,并使得均方誤差最小化。

      所述步驟2)包括以下子步驟:

      (2,1)對于給定的線性可分數(shù)據(jù)集d維空間中的線性判別函數(shù)g(x)=w·x+b,則可用超平面:w·x+b=0進行樣本分離,式中w為法向量,b為偏移;對于線性可分情況下,采用yi(w·xi+b)-1≥0,i=1,2...n表示;

      (2,2)對于線性不可分的情況,可以將松弛變量ξi引入到約束條件中,在中引入懲罰因子c來解決該問題;

      (2,3)當是非線性問題時,引入核函數(shù)其中σ>0;

      (2,4)建立的個人信用風險評估的svm模型為

      所述步驟3)包括以下子步驟:

      (3,1)針對傳統(tǒng)果蠅優(yōu)化算法在對參數(shù)優(yōu)化時,具體包括以下子步驟:

      步驟a1,隨機初始化果蠅群體位置x1與y1,果蠅群體個數(shù)為m,果蠅種群迭代次數(shù)為n;

      步驟a2,由于事先無法得知食物所在的位置,所以先估計果蠅與坐標原點的距離d(i,:),然后計算味道濃度判定值s(i,:),此值為距離的倒數(shù);

      步驟a3,尋找出此果蠅群體中味道濃度最高的n只精英果蠅,對其位置進行加權處理,得到加權最優(yōu)的位置

      步驟a4,讓果蠅群體憑借視覺飛往該加權最優(yōu)位置此操作執(zhí)行n次,選出目標函數(shù)均值最優(yōu)的一次放飛;

      步驟a5,保留均值最優(yōu)的味道濃度值f與最優(yōu)加權果蠅位置。

      4、如權利要求1所述的方法,其特征在于,步驟4包括以下子步驟:

      (4,1)初始化改進的果蠅算法中果蠅種群的大小和迭代次數(shù),選擇svm模型的相關參數(shù),svm采用rbf徑向基函數(shù)作為核函數(shù);采用svm的參數(shù)k-cv方法,k=3;設置果蠅種群規(guī)模為20,迭代代數(shù)為50;

      (4,2)建立svm訓練模型并進行測試,計算適應度函數(shù),得到每一次迭代中果蠅群規(guī)模中最佳參數(shù)組合,并記錄下來;圖3為ifoa對svm進行參數(shù)優(yōu)化的迭代曲線圖,從圖3中可以發(fā)現(xiàn)ifoa在果蠅覓食初期,果蠅搜索范圍是最大化,果蠅的全局尋優(yōu)能力也最強,第1次迭代就達到了較優(yōu)適應度值為8.6%。隨著果蠅覓食迭代次數(shù)的增加,逐漸的接近著最優(yōu)適應度值。覓食中后期,隨著局部搜索能力的增強,有輕微的適應度值的調(diào)整,最后在第29次迭代處達到最終的適應度值(最低均方誤差)為7.6%。此時取得svm模型的最優(yōu)c和g參數(shù)。代表參數(shù)c的歷代果蠅都是在x軸坐標系范圍[55:100]內(nèi)分布。果蠅的搜索范圍很大且最優(yōu)果蠅個體分布較為集中。同樣代表參數(shù)g的歷代果蠅都是在y軸坐標系范圍[35:75]內(nèi)分布,與參數(shù)c的搜索范圍相比較小,但具備很強的局部搜索能力。果蠅在搜索過程中果蠅群中個體搜索參數(shù)的位置分布圖如圖4所示。通過計算可得,此時c=98.9373,g=46.4587,由此可見ifoa能夠有效地搜索支持向量機模型的c和g參數(shù)。

      所述步驟5)包括以下子步驟:

      部分用作測試的貸款人數(shù)據(jù)帶入到步驟4)中的基于ifoa-svm的個人信用風險評估模型,進行貸款人的信用風險評估,為了體現(xiàn)ifoa-svm模型分類評估效果的優(yōu)越性,分別與網(wǎng)格法搜索參數(shù)的svm、ga-svm評估效果進行對比。預測結果如圖5所示。為了體現(xiàn)ifoa-svm模型分類評估效果的優(yōu)越性,分別與網(wǎng)格法搜索參數(shù)的svm、ga-svm和foa-svm的評估效果進行對比。網(wǎng)格法搜索到最優(yōu)參數(shù)c為2.2974,g為0.0474,預測結果如圖6所示。眾所周知遺傳算法優(yōu)化svm參數(shù)效果較優(yōu),本發(fā)明中其和foa/ifoa的種群數(shù)目、進化代數(shù)和參數(shù)尋優(yōu)范圍等參數(shù)設置基本相同,遺傳算法尋得最優(yōu)參數(shù)c為47.6161,g為50.6952,ga-svm模型的預測結果如圖7所示。果蠅算法尋得最優(yōu)參數(shù)c為71.3187,g為48.1275,foa-svm模型的預測結果如圖8所示。ifoa-svm評估的準確率均高于其他模型,果蠅算法優(yōu)化后能減少誤判數(shù),顯著提高信用風險評估的準確度。

      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1