国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于森林區(qū)分度模型的預測方法及系統的制作方法

      文檔序號:6499138閱讀:667來源:國知局
      基于森林區(qū)分度模型的預測方法及系統的制作方法
      【專利摘要】本發(fā)明公開了一種基于森林區(qū)分度模型的預測方法及系統,該方法包括:步驟1,基于隨機森林算法使用建模數據進行建模,對所述建模數據進行分箱,并經過區(qū)分度模型求解,獲得建模結果;步驟2,根據建立的模型和所述建模結果,對待預測的數據進行打分,獲得預測結果。本發(fā)明能提供一種簡單的、擴展的、有據可循的分箱方法,它簡化了對數據的考量,及不需要精通較高深的運算理論,就能夠使用該方法得到較好的分箱結果,從而得到效果較好的預測結果。這在很大程度上也提高了建模的效率和模型的精度。
      【專利說明】基于森林區(qū)分度模型的預測方法及系統
      【技術領域】
      [0001]本發(fā)明涉及評分卡建?!炯夹g領域】,尤其涉及一種基于森林區(qū)分度模型的預測方法及系統。
      【背景技術】
      [0002]評分卡是一個基于統計學的分析工具,它可以通過分析已經發(fā)生的現象,根據歷史數據和各種相關因素,來預測將來某個特定結果發(fā)生的概率。分析的基礎是一系列描述歷史數據的互相關聯的因素、變量、預測值或者回歸方程的獨立變量,我們稱之為預測變量。待預測的某個特定結果稱為目標變量。評分卡建模技術就是基于評分卡,建立預測變量和目標變量之間映射關系的技術,這種映射關系就是評分卡模型。評分卡模型的常用模型方法,有線性回歸、邏輯回歸、神經網絡、決策樹、區(qū)分度等。比如,我們可以通過分析已有的信用卡使用者的還款情況,來預測一個信用卡申請者在將來是否可能出現逾期不還款的行為。雖然授信者通過人工分析客戶的歷史信用資料,同樣可以得到這樣的分析結果,但利用信用評分卻更加快速、更加客觀、更具有一致性。
      [0003]區(qū)分度模型是一種較穩(wěn)定,且可解釋性強的模型,在金融和電信領域廣泛應用。區(qū)分度模型的目標變量是二分類型的,即其取值范圍為兩個值,如:好/壞,逾期/不逾期,是/否,等等。建模的目的是為了有效的區(qū)分好樣本和壞樣本。如圖1C,假定壞樣本的分布如圖中部分1,好樣本的分布如圖中部分2,為了能夠最好的區(qū)分出來好壞樣本,我們設想最好的情況是壞樣本的分布中 不包含好的樣本,好樣本分布中不包含壞的樣本,這樣我們就可能達到完全分出來好壞樣本的目的。當然在實際的操作過程中我們不可能達到理想的分布,但是我們的目標就是希望最大化的接近這種目的,因此在這個圖中希望好壞樣本交叉重疊的部分達到最小,當他們完全沒有交叉重疊時也就是我們設想的理想情況了。
      [0004]基于這種想法,提出了 DIV的公式(DIV公式的數學思想來源于Fisher判別分析方法。Fisher判別分析是模式識別領域廣泛應用的一種分類方法,它根據最大化類間離散度、同時最小化類內離散度的準則,確定一系列線性變化方向,使各類之間最大程度的分離。)至今,該方法已成功應用于評估消費者信用風險、巖質邊坡穩(wěn)定性評價、非線性統計過程監(jiān)控與故障診斷等眾多領域。美國FICO公司提出的Divergence模型便是將Fisher判別方法與具有現實意義的限制條件相結合,從而成功應用于信用評估領域,大大方便了業(yè)務對模型的要求:
      【權利要求】
      1.一種基于森林區(qū)分度模型的預測方法,其特征在于,包括: 步驟1,基于隨機森林算法使用建模數據進行建模,對所述建模數據進行分箱,并經過區(qū)分度模型求解,獲得建模結果; 步驟2,根據建立的模型和所述建模結果,對待預測的數據進行打分,獲得預測結果。
      2.如權利要求1所述的森林區(qū)分度模型建立方法,其特征在于,所述步驟I包括: 步驟11,基于所述隨機森林算法,對所述建模數據進行分箱,獲得分箱結果; 步驟12,根據所述分箱結果將所述建模數據的變量轉換為啞變量,利用所述啞變量進行區(qū)分度模型求解,獲得各分箱權重; 步驟13,根據所述各分箱權重計算所述建模數據中每個記錄的分數,獲得評分結果; 步驟14,根據所述評分結果,決定區(qū)分好壞的分數,獲得建模結果。
      3.如權利要求2所述的基于森林區(qū)分度模型的預測方法,其特征在于,所述步驟11包括: 步驟111,隨機抽取部分建模數據作為樹的根節(jié)點,并加入到待分叉的樹節(jié)點集合中;步驟112,判斷所述待 分叉的樹節(jié)點集合是否為空,如果為空,則返回所述根節(jié)點的樹;如果不為空,則從所述待分叉的樹節(jié)點集合中選擇一個節(jié)點,并從所述待分叉的樹節(jié)點集合中刪除該節(jié)點; 步驟113,判斷所述節(jié)點是否符合節(jié)點分叉條件,如果不符合條件,則返回步驟112,否則計算該節(jié)點的分叉的變量和分叉的值; 步驟114,根據所述分叉的變量和分叉的值,得到所述分叉節(jié)點的左子節(jié)點和右子節(jié)點,并均加入所述待分叉的樹節(jié)點集合中。
      4.如權利要求2所述的基于森林區(qū)分度模型的預測方法,其特征在于,所述步驟13包括: 步驟131,根據所述各分箱權重,確定對應的多個葉子節(jié)點的權重; 步驟132,根據每個葉子節(jié)點所代表的區(qū)間,獲知某條記錄在葉子節(jié)點區(qū)間的分布,將所述記錄分布的所有葉子節(jié)點的權重加起來,得到該記錄對應的分數; 步驟133,根據步驟132計算所有記錄對應的分數,獲得評分結果。
      5.如權利要求1所述的基于森林區(qū)分度模型的預測方法,其特征在于,所述步驟2中: 根據所述各分箱權重計算所述待預測數據中每個記錄的分數,獲得評分結果。
      6.一種基于森林區(qū)分度模型的預測系統,其特征在于,包括: 建模模塊,基于隨機森林算法使用建模數據進行建模,對所述建模數據進行分箱,并經過區(qū)分度模型求解,獲得建模結果; 預測模塊,根據建立的模型和所述建模結果,對待預測的數據進行打分,獲得預測結果O
      7.如權利要求6所述的森林區(qū)分度模型建立系統,其特征在于,所述建模模塊包括: 分箱模塊,基于所述隨機森林算法,對所述建模數據進行分箱,獲得分箱結果; 區(qū)分模塊,根據所述分箱結果將所述建模數據的變量轉換為啞變量,利用所述啞變量進行區(qū)分度模型求解,獲得各分箱權重; 計算模塊,根據所述各分箱權重計算所述建模數據中每個記錄的分數,獲得評分結果;分割模塊,根據所述評分結果,決定區(qū)分好壞的分數,獲得建模結果。
      8.如權利要求7所述的基于森林區(qū)分度模型的預測系統,其特征在于,所述分箱模塊包括: 抽取模塊,隨機抽取部分建模數據作為樹的根節(jié)點,并加入到待分叉的樹節(jié)點集合中; 第一判斷處理模塊,判斷所述待分叉的樹節(jié)點集合是否為空,如果為空,則返回所述根節(jié)點的樹;如果不為空,則從所述待分叉的樹節(jié)點集合中選擇一個節(jié)點,并從所述待分叉的樹節(jié)點集合中刪除該節(jié)點; 第二判斷處理模塊,判斷所述節(jié)點是否符合節(jié)點分叉條件,如果不符合條件,則返回第一判斷處理模塊,否則計算該節(jié)點的分叉的變量和分叉的值; 結果獲得模塊,根據所述分叉的變量和分叉的值,得到所述分叉節(jié)點的左子節(jié)點和右子節(jié)點,并均加入所述待分叉的樹節(jié)點集合中。
      9.如權利要求7所述的基于森林區(qū)分度模型的預測系統,其特征在于,所述計算模塊包括: 權重獲得模塊,根據所述各分箱權重,確定對應的多個葉子節(jié)點的權重; 權重處理模塊,根據每個葉子節(jié)點所代表的區(qū)間,獲知某條記錄在葉子節(jié)點區(qū)間的分布,將所述記錄分布的所有葉子節(jié)點的權重加起來,得到該記錄對應的分數; 評分模塊,根據權重處理模塊計算所有記錄對應的分數,獲得評分結果。
      10.如權利要求6所述的基于 森林區(qū)分度模型的預測方法,其特征在于,所述預測模塊中: 根據所述各分箱權重計算所述待預測數據中每個記錄的分數,獲得評分結果。
      【文檔編號】G06Q10/04GK103942604SQ201310018641
      【公開日】2014年7月23日 申請日期:2013年1月18日 優(yōu)先權日:2013年1月18日
      【發(fā)明者】鄭茂林, 徐春香, 寧慶慶, 戴霞, 呂盡軒, 裴曉景, 王靜, 張明昊, 李勝濤, 曾祥洪 申請人:上海安迪泰信息技術有限公司
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1