国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于市場行情數(shù)據(jù)源的模型訓練方法

      文檔序號:9866267閱讀:265來源:國知局
      一種基于市場行情數(shù)據(jù)源的模型訓練方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及市場數(shù)據(jù)的模型訓練方法,特別是一種基于市場行情數(shù)據(jù)源的模型訓練方法。
      【背景技術(shù)】
      [0002]目前,隨著數(shù)據(jù)獲取技術(shù)的發(fā)展和智能設備的普及,市場信息的獲取日益便捷,同時,對于金融產(chǎn)品價格走向需求也日益提高?,F(xiàn)有市場預判的流程主要是先針對行情數(shù)據(jù)提取特征,之后使用某些分類器進行分類。對數(shù)據(jù)進行標記十分昂貴,需要花費大量的人力資源,而從互聯(lián)網(wǎng)上獲取到大多缺乏標注。同時對于一組數(shù)據(jù),可以有多種不同類型的特征屬性解讀:如可以使用不同特征提取方法對數(shù)據(jù)進行特征抽取,每一種方法抽取到的特征構(gòu)成一個屬性集;另外,市場數(shù)據(jù)本來就具有多種資源來源,從這些附帶的資源中也可以提取出特征。傳統(tǒng)的方法一方面需要獲取有標記的數(shù)據(jù)進行分類器的訓練,一方面依賴于特定的特征,無法較好地利用未標記和多組不同的特征屬性集。
      [0003]市場預判往往也是多個公司、研究組織的共同需求。不同的公司或者研究組織會針對其獲取的數(shù)據(jù)使用他們自己的方法提取特征,之后根據(jù)他們提取的特征進行分類器的訓練。將多個公司(組織)的特征進行結(jié)合,無疑可以得到更好的特征,但是各組特征涉及多個公司(組織)的隱私信息,如提取特征的具體技術(shù),這些往往不適合和他人共享,因此需要一種具有隱私保護的利用不同特征進行預判的方法。

      【發(fā)明內(nèi)容】

      [0004]本發(fā)明要解決的技術(shù)問題是針對現(xiàn)有技術(shù)的不足,提出一種成本低、市場信息獲取便捷,可避免浪費人力資源的基于市場行情數(shù)據(jù)源的模型訓練方法。
      [0005]本發(fā)明要解決的技術(shù)問題是通過以下技術(shù)方案實現(xiàn)的。本發(fā)明是一種基于市場行情數(shù)據(jù)源的模型訓練方法,其特點是:包括以下步驟:(I)搜集數(shù)據(jù):從行情數(shù)據(jù)源獲取訓練模型樣本的數(shù)據(jù)特征屬性集,將每一個數(shù)據(jù)特征屬性集看作一個視圖;(2)分類標記:所述每一個視圖上利用本視圖的分類器進行分類提取并分別對類別進行標注,判斷對數(shù)據(jù)特征的分類是否完成,若完成,則獲得搜集到訓練模型樣本的所有數(shù)據(jù),若未完成,則等待所有數(shù)據(jù)分類直至完成;(3)獲取訓練模型:將每個視圖中訓練模型樣本搜集到的所有數(shù)據(jù)拼接成一個矩陣,從而獲得每一個視圖的預測結(jié)果,若預測結(jié)果不滿足要求,則轉(zhuǎn)入步驟(2)繼續(xù)分類,若預測結(jié)果滿足要求,則得到每一個類別的分類器,從而最終獲得訓練模型。
      [0006]優(yōu)選的,所述步驟(I)的行情數(shù)據(jù)源為若干不同的數(shù)據(jù)源。
      [0007]優(yōu)選的,所述步驟(I)中的行情數(shù)據(jù)源獲取數(shù)據(jù)特征屬性集包括使用不同的特征提取方法對行情數(shù)據(jù)進行特征提取。
      [0008]與現(xiàn)有技術(shù)相比,本發(fā)明所提供的利用多數(shù)具有的示例分類方法,實施過程中能夠充分利用有標記數(shù)據(jù)和未標記數(shù)據(jù)上不同數(shù)據(jù)源的多種特征屬性,適合數(shù)據(jù)源很多的情況,同時在整個訓練過程中能夠確保每一個數(shù)據(jù)源的特征屬性不被其它數(shù)據(jù)源所獲取。
      【附圖說明】
      [0009]圖1為本發(fā)明的流程框圖。
      【具體實施方式】
      [0010]以下參照附圖,進一步描述本發(fā)明的具體技術(shù)方案,以便于本領(lǐng)域的技術(shù)人員進一步地理解本發(fā)明,而不構(gòu)成其權(quán)力的限制。
      [0011]實施例1,參照圖1,一種基于市場行情數(shù)據(jù)源的模型訓練方法,包括以下步驟:(I)搜集數(shù)據(jù):從行情數(shù)據(jù)源獲取訓練模型樣本的數(shù)據(jù)特征屬性集,將每一個數(shù)據(jù)特征屬性集看作一個視圖;(2)分類標記:所述每一個視圖上利用本視圖的分類器進行分類提取并分別對類別進行標注,判斷對數(shù)據(jù)特征的分類是否完成,若完成,則獲得搜集到訓練模型樣本的所有數(shù)據(jù),若未完成,則等待所有數(shù)據(jù)分類直至完成;(3)獲取訓練模型:將每個視圖中訓練模型樣本搜集到的所有數(shù)據(jù)拼接成一個矩陣,從而獲得每一個視圖的預測結(jié)果,若預測結(jié)果不滿足要求,則轉(zhuǎn)入步驟(2)繼續(xù)分類,這需同時完成步驟(2)中分類器的分類提取與類別的標注才算滿足,若預測結(jié)果滿足要求,則得到每一個類別的分類器,從而最終獲得訓練模型。本發(fā)明首先需要確定預判寫作內(nèi)容并搜集數(shù)據(jù)。在步驟(2)中所述的分類器可以為決策樹分類器,其提供一個數(shù)據(jù)特征屬性集,決策樹通過在屬性集的基礎上作出一系列的決策,將數(shù)據(jù)分類,這個過程類似于通過一個植物的特征來辨認植物,可以應用這樣的分類器來判定某人的信用程度。
      [0012]實施例2,實施例1所述的一種基于市場行情數(shù)據(jù)源的模型訓練方法中:所述步驟(I)的行情數(shù)據(jù)源為若干不同的數(shù)據(jù)源。
      [0013]實施例3,實施例1或2所述的一種基于市場行情數(shù)據(jù)源的模型訓練方法中:所述步驟(I)中的行情數(shù)據(jù)源獲取數(shù)據(jù)特征屬性集包括使用不同的特征提取方法對行情數(shù)據(jù)進行特征提取。所述從不同數(shù)據(jù)源獲取特征屬性集包括使用不同的特征提取方法對行情數(shù)據(jù)進行特征提取;使用網(wǎng)絡上的附帶信息作為其它數(shù)據(jù)源或從真實存在的多數(shù)據(jù)源(如社交網(wǎng)絡)提取特征等。
      [0014]步驟(2)中所述在每一個視圖上利用本視圖的特征屬性訓練分類器具體為:在每一個視圖上構(gòu)建線性分類器,分類器的維度同時取決于數(shù)據(jù)類別的數(shù)目和該視圖特征屬性集的維度,使用最小二乘方法在有標記樣本上使得分類器的預測結(jié)果和真實的結(jié)果盡可能相似。
      [0015]所述步驟(3)中的矩陣可通過APM數(shù)字矩陣處理器進行優(yōu)化處理,從而使每一個視圖的預測結(jié)果盡可能一致。其具體為:在每一個視圖上對訓練集中所有數(shù)據(jù)進行類別的預測,得到預測結(jié)果,其維度同時取決于訓練集中示例的數(shù)目C和類別數(shù)目。將所有視圖的預測結(jié)果拼接,得到一個擴展的矩陣表示APM。使各個視圖的預測結(jié)果一致即優(yōu)化APM的秩,使其盡可能低秩。優(yōu)化目標及使得APM的秩為C-1,和理想情況下的秩相同。
      【主權(quán)項】
      1.一種基于市場行情數(shù)據(jù)源的模型訓練方法,其特征在于,包括以下步驟: (1)搜集數(shù)據(jù):從行情數(shù)據(jù)源獲取訓練模型樣本的數(shù)據(jù)特征屬性集,將每一個數(shù)據(jù)特征屬性集看作一個視圖; (2)分類標記:所述每一個視圖上利用本視圖的分類器進行分類提取并分別對類別進行標注,判斷對數(shù)據(jù)特征的分類是否完成,若完成,則獲得搜集到訓練模型樣本的所有數(shù)據(jù),若未完成,則等待所有數(shù)據(jù)分類直至完成; (3)獲取訓練模型:將每個視圖中訓練模型樣本搜集到的所有數(shù)據(jù)拼接成一個矩陣,從而獲得每一個視圖的預測結(jié)果,若預測結(jié)果不滿足要求,則轉(zhuǎn)入步驟(2)繼續(xù)分類,若預測結(jié)果滿足要求,則得到每一個類別的分類器,從而最終獲得訓練模型。2.根據(jù)權(quán)利要求1所述的基于市場行情數(shù)據(jù)源的模型訓練方法,其特征在于:所述步驟(I)的行情數(shù)據(jù)源為若干不同的數(shù)據(jù)源。3.根據(jù)權(quán)利要求1所述的基于市場行情數(shù)據(jù)源的模型訓練方法,其特征在于:所述步驟(I)中的行情數(shù)據(jù)源獲取數(shù)據(jù)特征屬性集包括使用不同的特征提取方法對行情數(shù)據(jù)進行特征提取。
      【專利摘要】一種基于市場行情數(shù)據(jù)源的模型訓練方法,包括以下步驟:(1)搜集數(shù)據(jù);(2)分類標記;(3)獲取訓練模型。本發(fā)明所提供的利用多數(shù)具有的示例分類方法,實施過程中能夠充分利用有標記數(shù)據(jù)和未標記數(shù)據(jù)上不同數(shù)據(jù)源的多種特征屬性,適合數(shù)據(jù)源很多的情況,同時在整個訓練過程中能夠確保每一個數(shù)據(jù)源的特征屬性不被其它數(shù)據(jù)源所獲取。
      【IPC分類】G06Q10/04
      【公開號】CN105631544
      【申請?zhí)枴緾N201510992078
      【發(fā)明人】不公告發(fā)明人
      【申請人】蘇州晨川通信科技有限公司
      【公開日】2016年6月1日
      【申請日】2015年12月25日
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1