国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      分類模型訓(xùn)練方法及裝置的制造方法

      文檔序號:9350397閱讀:289來源:國知局
      分類模型訓(xùn)練方法及裝置的制造方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種分類模型訓(xùn)練方法及裝置。
      【背景技術(shù)】
      [0002]隨著信息技術(shù)的不斷發(fā)展,時下已經(jīng)步入了大數(shù)據(jù)時代。比如,商家或企業(yè)等可通過其提供的各種服務(wù)平臺收集到海量用戶數(shù)據(jù)。其中,海量數(shù)據(jù)中常常隱藏了各種各樣的有用信息,這些信息通??蓪ι虅?wù)管理、生產(chǎn)控制、市場分析、工程設(shè)計或科學(xué)探索等方面提供巨大幫助,因此數(shù)據(jù)挖掘技術(shù)受到了各個領(lǐng)域人員的極大關(guān)注。其中,數(shù)據(jù)挖掘的基本任務(wù)便是對海量數(shù)據(jù)進行分類,而對數(shù)據(jù)分類通常基于訓(xùn)練好的分類模型實現(xiàn)。
      [0003]現(xiàn)在技術(shù)中在訓(xùn)練分類模型時,首先選取用于模型訓(xùn)練的正例樣本和負例樣本。其中,正例樣本指代訓(xùn)練模型用的全部樣本中已被標(biāo)記的樣本。比如,正例樣本可為具有相同需求或興趣的一類人群。負例樣本從全部樣本中未被標(biāo)記的樣本里選取,樣本個數(shù)與正例樣本個數(shù)一致。之后,根據(jù)該正例樣本和該負例樣本進行一輪模型訓(xùn)練,得到分類模型。
      [0004]在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:
      [0005]當(dāng)全部樣本數(shù)量較少時,正例樣本和負例樣本的數(shù)量隨之減少,且負例樣本中可能包括了一些正例樣本,致使負例樣本的純凈度不高,由于正例樣本和負例樣本的區(qū)分度不好,所以根據(jù)這樣的正例樣本和負例樣本經(jīng)過一輪模型訓(xùn)練后得到的分類模型穩(wěn)定性不好,分類精確度較低,甚至?xí)霈F(xiàn)欠擬合現(xiàn)象。

      【發(fā)明內(nèi)容】

      [0006]為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實施例提供了一種分類模型訓(xùn)練方法及裝置。所述技術(shù)方案如下:
      [0007]—方面,提供了一種分類模型訓(xùn)練方法,所述方法包括:
      [0008]根據(jù)本輪正例樣本和本輪負例樣本進行模型訓(xùn)練,得到本輪分類模型;
      [0009]若所述本輪分類模型不滿足指定條件,則利用所述本輪分類模型對全部樣本進行分類,根據(jù)分類結(jié)果在所述全部樣本中選取特定樣本,所述特定樣本被所述本輪分類模型預(yù)測為正例樣本;
      [0010]將所述本輪正例樣本和所述特定樣本作為下一輪正例樣本,根據(jù)所述下一輪正例樣本確定所述下一輪負例樣本;
      [0011]根據(jù)所述下一輪正例樣本和所述下一輪負例樣本,繼續(xù)執(zhí)行上述模型訓(xùn)練和樣本處理過程,直至得到滿足所述指定條件的分類模型。
      [0012]另一方面,提供了一種分類模型訓(xùn)練裝置,所述裝置包括:
      [0013]模型訓(xùn)練模塊,用于根據(jù)本輪正例樣本和本輪負例樣本進行模型訓(xùn)練,得到本輪分類模型;
      [0014]樣本處理模塊,用于若所述本輪分類模型不滿足指定條件,則利用所述本輪分類模型對全部樣本進行分類,根據(jù)分類結(jié)果在所述全部樣本中選取特定樣本,所述特定樣本被所述本輪分類模型預(yù)測為正例樣本;將所述本輪正例樣本和所述特定樣本作為下一輪正例樣本,根據(jù)所述下一輪正例樣本確定所述下一輪負例樣本;
      [0015]所述模型訓(xùn)練模塊,用于根據(jù)所述下一輪正例樣本和所述下一輪負例樣本,繼續(xù)執(zhí)行上述模型訓(xùn)練過程;
      [0016]所述樣本處理模塊,用于繼續(xù)根據(jù)下一輪分類模型執(zhí)行上述樣本處理過程,直至得到滿足所述指定條件的分類模型。
      [0017]本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:
      [0018]在進行模型訓(xùn)練過程中,根據(jù)本輪正例樣本和本輪負例樣本進行模型訓(xùn)練,得到本輪分類模型;若本輪分類模型不滿足指定條件,則利用本輪分類模型對全部樣本進行分類,根據(jù)分類結(jié)果在全部樣本中選取特定樣本;將本輪正例樣本和特定樣本作為下一輪正例樣本,根據(jù)下一輪正例樣本確定下一輪負例樣本;之后根據(jù)下一輪正例樣本和下一輪負例樣本,繼續(xù)執(zhí)行上述模型訓(xùn)練和樣本處理過程,直至得到滿足指定條件的分類模型,本發(fā)明在一輪模型訓(xùn)練后,若得到的分類模型不滿足指定條件,則基于該分類模型選取特定樣本疊加到正例樣本中,并通過多輪迭代過程進行模型訓(xùn)練。隨著正例樣本數(shù)量的不斷增加,負例樣本中包含的潛在正例樣本會隨之下降,可有效提升負例樣本中的樣本純凈度,由于正例樣本和負例樣本的區(qū)分度較好,所以根據(jù)多次進行數(shù)量疊加的正例樣本和負例樣本進行多輪模型訓(xùn)練后得到的分類模型穩(wěn)定性較好,分類精確度較高。
      【附圖說明】
      [0019]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
      [0020]圖1是本發(fā)明實施例提供的一種分類模型訓(xùn)練方法的流程圖;
      [0021]圖2是本發(fā)明實施例提供的一種分類模型訓(xùn)練方法的流程圖;
      [0022]圖3是本發(fā)明實施例提供的一種分類模型訓(xùn)練裝置的結(jié)構(gòu)示意圖;
      [0023]圖4是本發(fā)明實施例提供的一種服務(wù)器的結(jié)構(gòu)示意圖。
      【具體實施方式】
      [0024]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進一步地詳細描述。
      [0025]圖1是本發(fā)明實施例提供的一種分類模型訓(xùn)練方法的流程圖。參見圖1,本發(fā)明實施例提供的方法流程包括:
      [0026]101、根據(jù)本輪正例樣本和本輪負例樣本進行模型訓(xùn)練,得到本輪分類模型。
      [0027]102、若本輪分類模型不滿足指定條件,則利用本輪分類模型對全部樣本進行分類,根據(jù)分類結(jié)果在全部樣本中選取特定樣本,特定樣本被本輪分類模型預(yù)測為正例樣本。
      [0028]103、將本輪正例樣本和特定樣本作為下一輪正例樣本,根據(jù)下一輪正例樣本確定下一輪負例樣本。
      [0029]104、根據(jù)下一輪正例樣本和下一輪負例樣本,繼續(xù)執(zhí)行上述模型訓(xùn)練和樣本處理過程,直至得到滿足指定條件的分類模型。
      [0030]本發(fā)明實施例提供的方法,在進行模型訓(xùn)練過程中,根據(jù)本輪正例樣本和本輪負例樣本進行模型訓(xùn)練,得到本輪分類模型;若本輪分類模型不滿足指定條件,則利用本輪分類模型對全部樣本進行分類,根據(jù)分類結(jié)果在全部樣本中選取特定樣本;將本輪正例樣本和特定樣本作為下一輪正例樣本,根據(jù)下一輪正例樣本確定下一輪負例樣本;之后根據(jù)下一輪正例樣本和下一輪負例樣本,繼續(xù)執(zhí)行上述模型訓(xùn)練和樣本處理過程,直至得到滿足指定條件的分類模型,本發(fā)明在一輪模型訓(xùn)練后,若得到的分類模型不滿足指定條件,則基于該分類模型選取特定樣本疊加到正例樣本中,并通過多輪迭代過程進行模型訓(xùn)練。隨著正例樣本數(shù)量的不斷增加,負例樣本中包含的潛在正例樣本會隨之下降,可有效提升負例樣本中的樣本純凈度,由于正例樣本和負例樣本的區(qū)分度較好,所以根據(jù)多次進行數(shù)量疊加的正例樣本和負例樣本進行多輪模型訓(xùn)練后得到的分類模型穩(wěn)定性較好,分類精確度較尚O
      [0031]可選地,根據(jù)本輪正例樣本和本輪負例樣本進行模型訓(xùn)練之前,該方法還包括:
      [0032]基于本輪正例樣本的數(shù)量,在全部樣本中除正例樣本之外的剩余樣本里選取本輪負例樣本;
      [0033]在本輪正例樣本中選取第一樣本,在本輪負例樣本中選取第二樣本,第一樣本和第二樣本中包含的樣本數(shù)量一致;
      [0034]根據(jù)本輪正例樣本和本輪負例樣本進行模型訓(xùn)練,包括:
      [0035]根據(jù)正例樣本中除第一樣本之外的剩余樣本、負例樣本中除第二樣本之外的剩余樣本,進行模型訓(xùn)練。
      [0036]可選地,利用本輪分類模型對全部樣本進行分類之前,該方法還包括:
      [0037]根據(jù)第一樣本和第二樣本,對本輪分類模型進行評估,得到評估結(jié)果;
      [0038]根據(jù)評估結(jié)果判斷本輪分類模型是否滿足指定條件;
      [0039]當(dāng)評估結(jié)果優(yōu)于設(shè)置的分類性能指標(biāo)時,確定本輪分類模型滿足指定條件。
      [0040]可選地,根據(jù)分類結(jié)果在全部樣本中選取被分類為正例樣本的指定個樣本,包括:
      當(dāng)前第1頁1 2 3 4 5 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1