国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于決策樹算法的制造業(yè)材料采購分析方法與流程

      文檔序號:11063805閱讀:967來源:國知局
      一種基于決策樹算法的制造業(yè)材料采購分析方法與制造工藝

      本發(fā)明涉及企業(yè)管理領(lǐng)域,具體地涉及用算法分析制造業(yè)材料采購問題領(lǐng)域。



      背景技術(shù):

      隨著全球市場一體化以及信息時(shí)代的來臨,專業(yè)生產(chǎn)能夠發(fā)揮其巨大的作用,企業(yè)采購的比重也大大增加,采購的重要性日益被人們所認(rèn)識。在全球范圍內(nèi),在工業(yè)企業(yè)的產(chǎn)品構(gòu)成中,采購的原料以及零部件成本隨著行業(yè)不同而不同,大體在30%-90%,平均水平在60%以上。從世界范圍來說,對于一個(gè)典型的企業(yè),采購成本(包括原材料,零部件)要占60%。而在中國的工業(yè)企業(yè),各種物資的采購成本要占到企業(yè)銷售成本的70%。顯然采購成本是企業(yè)管理中的主體和核心部分,采購是企業(yè)管理中“最有價(jià)值”的部分。另外,根據(jù)國家經(jīng)貿(mào)委1999年發(fā)布的有關(guān)數(shù)據(jù),如果國有大中型企業(yè)每年降低采購成本2%-3%,則可增加效益500多億人民幣,相當(dāng)于1997年國有工業(yè)企業(yè)實(shí)現(xiàn)的利潤總和。因此,采購受到了社會各界相當(dāng)?shù)闹匾暎偈共少徰芯砍蔀楫?dāng)今社會的熱點(diǎn)問題之一。

      C4.5算法是決策樹類算法的一種,由Quinlan于1993年提出,現(xiàn)已居于決策樹經(jīng)典分類之首。C4.5算法是ID3算法的改進(jìn)算法,是一種基于信息增益率的決策分析算法。具體而言,它是以算法選擇信息增益的擴(kuò)充信息增益率為屬性選擇度量,爭取克服算法中關(guān)于多值屬性選擇的偏向性問題,其關(guān)于決策樹分類器模型的構(gòu)造過程同算法相同。

      C4.5算法產(chǎn)生的分類規(guī)則易于理解,準(zhǔn)確率較高。但是在構(gòu)造樹的過程中,需要對數(shù)據(jù)集進(jìn)行多次的順序掃描和排序,因而導(dǎo)致算法的效率較低。并且,由于其根據(jù)字段進(jìn)行分類的特性,當(dāng)類別較多時(shí),其錯誤率較高。



      技術(shù)實(shí)現(xiàn)要素:

      針對現(xiàn)有技術(shù)的上述不足,本發(fā)明要解決的技術(shù)問題是提供一種基于C4.5算法的制造業(yè)材料采購分析方法。

      本發(fā)明的目的是克服現(xiàn)有技術(shù)中存在的問題:C4.5算法掃描樣本次數(shù)多效率低,準(zhǔn)確率達(dá)不到想要效果以及C4.5在物料采購分析時(shí)只是基于字段分析,錯誤率高。

      本發(fā)明為實(shí)現(xiàn)上述目的所采用的技術(shù)方案是:一種基于C4.5算法的制造業(yè)材料采購分析方法。該算法的步驟如下:

      步驟1:計(jì)算屬性的信息熵:把采購的供應(yīng)商、價(jià)格、數(shù)量等信息作為C4.5算法的樣本集參數(shù),按照算法計(jì)算出屬性的信息熵。

      步驟2:計(jì)算分割后的類別的條件熵:將樣本集分割成若干個(gè)屬性,計(jì)算屬性條件熵。

      步驟3:計(jì)算類別的信息熵:利用信息熵公式計(jì)算類別的信息熵。

      步驟4:判斷所有屬性是否計(jì)算完,已計(jì)算完轉(zhuǎn)到步驟1,否則轉(zhuǎn)步驟5。

      步驟5:計(jì)算信息增益率:信息增益率為屬性的信息熵與類別信息熵之差。

      步驟6:按分裂屬性值創(chuàng)建決策樹:在某一屬性集合中將最大增益率的屬性作為分列屬性,將最大增益率的屬性作為樹雙親結(jié)點(diǎn),其余的作為該結(jié)點(diǎn)的孩子。

      步驟7:剪枝判定:當(dāng)決策樹劃分得太細(xì),數(shù)據(jù)量很大時(shí),需要設(shè)定一個(gè)規(guī)則,使算法及時(shí)收斂,避免算法的無限分支和無限增長,即剪枝。本發(fā)明采用前剪枝法結(jié)合樹深度限定法對決策樹進(jìn)行剪枝。

      步驟8:判斷是否構(gòu)建完決策樹,如果構(gòu)建完成,則轉(zhuǎn)步驟9,否則轉(zhuǎn)步驟1。

      步驟9:輸出決策分析結(jié)果:本發(fā)明采用后剪枝法對建立好的決策樹進(jìn)行剪枝,構(gòu)建最優(yōu)決策樹。最優(yōu)決策樹即為決策分析結(jié)果。

      本發(fā)明的有益效果是:

      1.通過前剪枝法和樹深度限定法對決策樹的分割進(jìn)行限制,防止算法無限發(fā)散。

      2.利用信息增益標(biāo)準(zhǔn)差作為前剪枝法的限定條件,提高了算法的準(zhǔn)確率。

      3.通過后剪枝法構(gòu)建最優(yōu)決策樹。簡單有效,易于實(shí)現(xiàn)和理解。最優(yōu)決策樹將給出一個(gè)確定的采購方案,簡單明了,實(shí)用性高。

      附圖說明

      圖1為一種基于C4.5算法的制造業(yè)材料采購分析方法流程圖

      具體實(shí)施方式

      為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合算法流程圖 進(jìn)行詳細(xì)、具體說明。

      一、算法基本思想

      決策樹是一種基于分類思想的決策分析方法,ID3算法是基于信息增量的決策樹分析算法,C4.5算法是ID3算法的改進(jìn)算法,是一種基于信息增益率的決策分析算法。本發(fā)明通過利用改進(jìn)的C4.5算法分析預(yù)測制造業(yè)材料的采購問題。通過前剪枝法和樹深度限定法對決策樹的分割進(jìn)行限制,通過后剪枝法構(gòu)建最優(yōu)決策樹。最優(yōu)決策樹將給出一個(gè)確定的采購方案,即:哪個(gè)材料到哪個(gè)供應(yīng)商那里去采購,采購多少,才能保證作業(yè)車間生產(chǎn)正常有序進(jìn)行。

      二、具體實(shí)施步驟

      將物料供應(yīng)商的類型、等級、所能供給的數(shù)量、所供給物料的質(zhì)量信用度、供應(yīng)商規(guī)模等信息抽象到C4.5算法中,作為算法的數(shù)據(jù)樣本、屬性等參數(shù)。具體問題具體給出對應(yīng)的參數(shù)關(guān)系。改進(jìn)的C4.5算法具體實(shí)施步驟如下:

      步驟1:計(jì)算屬性的信息熵:設(shè)S為已知類標(biāo)號的數(shù)據(jù)樣本集,類標(biāo)號屬性為C={Ci|i=1,2,...,z},定義了m個(gè)不同類的Ci(i=1,2,...,z)。設(shè)Ci,s是S中Ci類數(shù)據(jù)樣本的集合,|S|和|Ci,s|分別表示S和Ci,s的樣本個(gè)數(shù)。則對Ci,s的信息熵Info(S)定義如下:

      其中,pi是Ci,s中任意數(shù)據(jù)樣本屬于類Ci的概率,Info(S)的實(shí)際意義是類別S中數(shù)據(jù)樣本分類的平均信息量。

      步驟2:計(jì)算分割后的類別的條件熵:若分類屬性Ai={aij|j=1,2,...,ni}將S劃分成ni個(gè)不同的子集Sij={(Xi,Yi)∈S|xij=aij}表示數(shù)據(jù)樣本集S中在Ai上的取值為aij的所有樣本組成的集合。選擇S的一個(gè)屬性A,則類別分割后的類別條件熵計(jì)算公式為:

      步驟3:計(jì)算類別的信息熵:若選擇屬性Ai作為分裂屬性,則類別信息熵為:

      步驟4:判斷所有屬性是否計(jì)算完,已計(jì)算完轉(zhuǎn)到步驟1,否則轉(zhuǎn)步驟5。

      步驟5:信息增益率的計(jì)算:信息增益率使用分裂信息值將信息增益規(guī)范化。屬性Ai的信息增益為

      從信息增益的計(jì)算公式可以看出,Gain(Ai)的實(shí)際意義是基于屬性Ai分裂后,數(shù)據(jù)集所含信息量的有效減少量。信息增益越大,表明按屬性Ai對數(shù)據(jù)集分裂所需的期望信息越少,即屬性Ai解決的不確定信息量越大,分裂后的輸出分區(qū)越純。

      則信息增益率為:

      步驟6:按分裂屬性值創(chuàng)建決策樹:決策樹基于數(shù)據(jù)結(jié)構(gòu)中樹的概念。決策樹C4.5的創(chuàng)建是通過將所有屬性的信息增益率按大小排序,然后將各個(gè)屬性作為分支的根節(jié)點(diǎn)的順序。

      在某一屬性集合中將最大增益率的屬性作為分列屬性,即θ=max{GainRatio(A)},即將最大增益率的屬性作為樹雙親結(jié)點(diǎn),其余的作為該結(jié)點(diǎn)的孩子。

      步驟7:剪枝判定:當(dāng)決策樹劃分得太細(xì),數(shù)據(jù)量很大時(shí),需要設(shè)定一個(gè)規(guī)則,使算法及時(shí)收斂,避免算法無限分支無限增長,即剪枝。本發(fā)明采用前剪枝法結(jié)合樹深度限定法對決策樹進(jìn)行剪枝。具體的實(shí)施如下:

      前剪枝法:前剪枝法是指在構(gòu)造樹的過程中知道某些節(jié)點(diǎn)可以剪掉時(shí),就不對此類節(jié)點(diǎn)進(jìn)行分裂。本發(fā)明通過計(jì)算增益率方差來確定是否對某一節(jié)點(diǎn)剪枝。增益率標(biāo)準(zhǔn)差大于某一設(shè)定值,則對該節(jié)點(diǎn)剪枝,否則可以分割建立其子樹。數(shù)學(xué)公式描述為:

      σi=GainRatio(Ai)-μ

      如果σi>ε(標(biāo)準(zhǔn)差限定值),則剪枝,否則繼續(xù)分割生成決策子樹。

      樹深度限定法:設(shè)定一個(gè)確定的樹深度值L,當(dāng)決策樹的深度到達(dá)L以后,停止分割。

      步驟8:判斷是否構(gòu)建完決策樹,如果構(gòu)建完成,則轉(zhuǎn)步驟9,否則轉(zhuǎn)步驟1。

      步驟9:輸出決策分析結(jié)果:創(chuàng)建了決策樹后,可以清晰的看到各個(gè)屬性的效果,但是要得到一個(gè)具體的方案,還需要進(jìn)一步的分析才能得到確切的決策方案。本發(fā)明采用后剪枝法對建立好的決策樹進(jìn)行剪枝,最后留下最優(yōu)決策樹作為最終的決策樹。后剪枝方法描述為:在建立好一顆決策樹以后,通過一定的剪枝標(biāo)準(zhǔn)來確定該剪掉的子樹。本發(fā)明對后剪枝標(biāo)準(zhǔn)設(shè)定為:通過計(jì)算價(jià)值函數(shù)值,來判定如何構(gòu)建最優(yōu)決策樹。價(jià)值函數(shù)用信息增益來刻畫。具體計(jì)算如下:

      (1)在決策樹的第L層剪枝:

      計(jì)算第L層節(jié)點(diǎn)的價(jià)值函數(shù)值:cl,i=Gain(Ai)。

      選第L層節(jié)點(diǎn)中價(jià)值函數(shù)值最大的節(jié)點(diǎn)作為最優(yōu)決策樹第L層的右孩子,選該右孩子的兄弟節(jié)點(diǎn)中價(jià)值函數(shù)值最大的兄弟節(jié)點(diǎn)作為最優(yōu)決策樹第L層的左孩子。其余的第L層的節(jié)點(diǎn)剪掉。

      (2)在決策樹第2層到(L-1)層節(jié)點(diǎn)剪枝:

      計(jì)算第l層的價(jià)值函數(shù):

      cl,i=cl+1,i+Gain(Ai),l=2,3,...,(L-1)。

      其中,cl+1,i為第l層節(jié)點(diǎn)的在第(l+1)層的還未被剪掉的孩子價(jià)值,明顯地,如果沒有留下來的孩子,則cl+1,i=0。同樣的,選第l層節(jié)點(diǎn)中價(jià)值函數(shù)值最大的節(jié)點(diǎn)作為最優(yōu)決策樹第l層的右孩子,選該右孩子的兄弟節(jié)點(diǎn)中價(jià)值函數(shù)值最大的兄弟節(jié)點(diǎn)作為最優(yōu)決策樹第l層的左孩子。其余的第l層的節(jié)點(diǎn)剪掉。如此下去,最終會得到一棵最優(yōu)決策樹。最優(yōu)決策樹即為決策分析結(jié)果。

      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1