国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于時(shí)間序列的計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法

      文檔序號(hào):9866199閱讀:234來(lái)源:國(guó)知局
      一種基于時(shí)間序列的計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的領(lǐng)域,尤其是涉及一種基于時(shí)間序列的計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法。
      【背景技術(shù)】
      [0002]隨著社會(huì)信息化的不斷發(fā)展,信息技術(shù)應(yīng)用領(lǐng)域的不斷拓展,各個(gè)應(yīng)用領(lǐng)域包括經(jīng)濟(jì)、醫(yī)療、建筑、環(huán)境等均積累了越來(lái)越多的數(shù)據(jù)。自上世紀(jì)八十年代開(kāi)始,世界各地的數(shù)據(jù)總量飛速增長(zhǎng),甚至幾個(gè)月就會(huì)增長(zhǎng)一倍,然而如何有效的利用、分析這些數(shù)據(jù)信息,并從中獲取其隱藏的有用信息,則成了一個(gè)巨大的挑戰(zhàn)。在這些海量的數(shù)據(jù)中,有一部分?jǐn)?shù)據(jù)是按時(shí)間順序有序排列的,這類(lèi)數(shù)據(jù)便稱之為時(shí)間序列(Time Series)。各個(gè)應(yīng)用領(lǐng)域中均存在時(shí)間序列,通過(guò)深入研究這些時(shí)間序列,發(fā)現(xiàn)序列背后所隱藏的潛在規(guī)律以及有價(jià)值的信息具有重大的社會(huì)意義和經(jīng)濟(jì)價(jià)值。
      [0003]近年來(lái),隨著數(shù)據(jù)量的增加,一些數(shù)據(jù)分析方法無(wú)法有效提取出更多有價(jià)值的數(shù)據(jù)信息,因此一種新的數(shù)據(jù)分析方法一一數(shù)據(jù)挖掘(Data Mining)技術(shù)便產(chǎn)生了。數(shù)據(jù)挖掘技術(shù)不僅能分析已有的數(shù)據(jù),還可從原有數(shù)據(jù)中預(yù)測(cè)未來(lái)未知的信息,譬如,通過(guò)數(shù)據(jù)挖掘可以預(yù)測(cè)到下月某商場(chǎng)的銷(xiāo)售量等。何為數(shù)據(jù)挖掘?數(shù)據(jù)挖掘可以以許多不同的形式被定義,簡(jiǎn)單來(lái)說(shuō),數(shù)據(jù)挖掘就是從海量的數(shù)據(jù)信息中提取出有價(jià)值的信息,原有的數(shù)據(jù)大部分是有模糊噪聲的數(shù)據(jù),但在這些數(shù)據(jù)中又存在著很多潛在價(jià)值。挖掘的過(guò)程是通過(guò)利用各個(gè)領(lǐng)域的技術(shù)知識(shí)對(duì)海量數(shù)據(jù)進(jìn)行處理分析,挖掘出可以有益于人們進(jìn)行更高層次的分析決策的內(nèi)容。
      [0004]目前,雖然國(guó)內(nèi)外對(duì)數(shù)據(jù)挖掘的研究已取得不少的成果,但對(duì)各個(gè)應(yīng)用領(lǐng)域的時(shí)間序列的挖掘卻沒(méi)有通用性,譬如對(duì)金融領(lǐng)域的數(shù)據(jù)挖掘的方法在醫(yī)療領(lǐng)域應(yīng)用時(shí)所得到的性能效果不是很好?,F(xiàn)在大多數(shù)的方法可能只是在某一個(gè)方面表現(xiàn)出較為良好的性能,而不能在其他各個(gè)方面綜合起來(lái)有一個(gè)很好的性能。顯然,以往對(duì)時(shí)間序列的研究還是存在著一些不足的,對(duì)于不同領(lǐng)域的時(shí)間序列挖掘問(wèn)題,傳統(tǒng)的挖掘方法己不適用,需尋求一些新的技術(shù)和方法。

      【發(fā)明內(nèi)容】

      [0005]本發(fā)明的目的是克服現(xiàn)有技術(shù)中存在的上述缺陷,提供一種基于時(shí)間序列的計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法,使其能夠有效地處理數(shù)據(jù)量大、維度高的時(shí)間序列數(shù)據(jù),方法簡(jiǎn)單易行,不依賴于具體序列,能高效地進(jìn)行數(shù)據(jù)挖掘聚類(lèi),將適量數(shù)據(jù)有效壓縮并保留其數(shù)據(jù)的主要特征。
      [0006]為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于時(shí)間序列的計(jì)算機(jī)數(shù)據(jù)挖掘方法,該方法包括如下步驟:
      [0007]步驟1:輸入給定樣本集父、¥,其中父={叉1,叉2,...^}、Y={yi,y2,...,yn};
      [0008]步驟2:對(duì)輸入樣本集進(jìn)行去噪、歸一化處理;
      [0009]步驟3:對(duì)時(shí)間序列X、Y進(jìn)行極值點(diǎn)求取,得到極值點(diǎn)序列X’、Y’;
      [0010]步驟4:對(duì)所得到的區(qū)域極值點(diǎn)序列Χ’、Υ’進(jìn)行等長(zhǎng)處理,等長(zhǎng)處理后得到長(zhǎng)度均為k的分類(lèi)序列Χ”、Υ”;
      [0011]步驟5:對(duì)處理后的分類(lèi)序列Χ”、Υ”進(jìn)行類(lèi)距離計(jì)算,其中,類(lèi)距離(KX1)表示為:
      [0012]d(Xi) =min I X1-Yj I ;
      [0013]其中,Xi是分類(lèi)序列X”中的任意一個(gè)數(shù),Yj是分類(lèi)序列Y”中的任意一個(gè)數(shù);
      [0014]步驟6:將類(lèi)距離最大的兩類(lèi)進(jìn)行合并,合并后類(lèi)別數(shù)減少一個(gè);
      [0015]步驟7:返回步驟5、6,繼續(xù)循環(huán)執(zhí)行,直到聚類(lèi)數(shù)等于預(yù)設(shè)的數(shù)值,即可聚類(lèi)結(jié)束;
      [0016]步驟8:輸出聚類(lèi)結(jié)果。
      [0017]與現(xiàn)有技術(shù)相比,本發(fā)明的主要優(yōu)勢(shì)在于:
      [0018]本發(fā)明提供了一種基于時(shí)間序列的計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法,該計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法通過(guò)對(duì)輸入樣本集X、Y進(jìn)行去噪、歸一化處理,并對(duì)處理后的時(shí)間序列進(jìn)行極值點(diǎn)求取,得到極值點(diǎn)序列Χ’、γ’;再對(duì)Χ’、γ’進(jìn)行等長(zhǎng)處理,等長(zhǎng)處理后得到長(zhǎng)度相等的分類(lèi)序列X”、Y” ;然后對(duì)處理后的序列X”、Υ”進(jìn)行類(lèi)距離計(jì)算,將距離最大的兩類(lèi)進(jìn)行合并,合并后類(lèi)別數(shù)減少一個(gè);接著對(duì)處理后的分類(lèi)序列Χ”、γ”循環(huán)執(zhí)行類(lèi)距離計(jì)算并且合并距離最大的兩類(lèi),直到聚類(lèi)數(shù)等于預(yù)設(shè)的數(shù)據(jù),即可聚類(lèi)結(jié)束;最后輸出聚類(lèi)結(jié)果。該方法能夠有效地處理數(shù)據(jù)量大、維度高的時(shí)間序列數(shù)據(jù),方法簡(jiǎn)單易行,不依賴于具體序列,能高效地進(jìn)行數(shù)據(jù)挖掘聚類(lèi),將海量數(shù)據(jù)有效壓縮并保留其數(shù)據(jù)的主要特征。
      【附圖說(shuō)明】
      [0019]圖1為本發(fā)明的實(shí)現(xiàn)原理框圖。
      【具體實(shí)施方式】
      [0020]以下結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】進(jìn)行詳細(xì)說(shuō)明,以便本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明。
      [0021]如圖1所示,是本發(fā)明所述的一種基于時(shí)間序列的計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法的【具體實(shí)施方式】,其具體實(shí)施步驟為:
      [0022]步驟1:輸入給定樣本集父、¥,其中父={叉1,叉2,...^}、Y={yi,y2,...,yn};
      [0023]步驟2:對(duì)輸入樣本集進(jìn)行去噪、歸一化處理;
      [0024]步驟3:對(duì)時(shí)間序列X、Y進(jìn)行極值點(diǎn)求取,得到極值點(diǎn)序列X’、Y’;
      [0025]步驟4:對(duì)所得到的區(qū)域極值點(diǎn)序列Χ’、Υ’進(jìn)行等長(zhǎng)處理,等長(zhǎng)處理后得到長(zhǎng)度均為k的分類(lèi)序列Χ”、Υ”;
      [0026]步驟5:對(duì)處理后的分類(lèi)序列Χ”、Υ”進(jìn)行類(lèi)距離計(jì)算,其中,類(lèi)距離Cl(X1)表示為:
      [0027]d(Xi) =min I X1-Yj I ;
      [0028]其中,Xi是分類(lèi)序列X”中的任意一個(gè)數(shù),Yj是分類(lèi)序列Y”中的任意一個(gè)數(shù);
      [0029]步驟6:將類(lèi)距離最大的兩類(lèi)進(jìn)行合并,合并后類(lèi)別數(shù)減少一個(gè);
      [0030]步驟7:返回步驟5、6,繼續(xù)循環(huán)執(zhí)行,直到聚類(lèi)數(shù)等于預(yù)設(shè)的數(shù)值,即可聚類(lèi)結(jié)束;
      [0031]步驟8:輸出聚類(lèi)結(jié)果。
      [0032]該計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法通過(guò)對(duì)輸入樣本集X、Y進(jìn)行去噪、歸一化處理,并對(duì)處理后的時(shí)間序列進(jìn)行極值點(diǎn)求取,得到極值點(diǎn)序列x’、Y’;再對(duì)x’、Y’進(jìn)行等長(zhǎng)處理,等長(zhǎng)處理后得到長(zhǎng)度相等的分類(lèi)序列X”、Υ” ;然后對(duì)處理后的序列X”、Υ”進(jìn)行類(lèi)距離計(jì)算,將距離最大的兩類(lèi)進(jìn)行合并,合并后類(lèi)別數(shù)減少一個(gè);接著對(duì)處理后的分類(lèi)序列X”、Y”循環(huán)執(zhí)行類(lèi)距離計(jì)算并且合并距離最大的兩類(lèi),直到聚類(lèi)數(shù)等于預(yù)設(shè)的數(shù)據(jù),即可聚類(lèi)結(jié)束;最后輸出聚類(lèi)結(jié)果。該方法能夠有效地處理數(shù)據(jù)量大、維度高的時(shí)間序列數(shù)據(jù),方法簡(jiǎn)單易行,不依賴于具體序列,能高效地進(jìn)行數(shù)據(jù)挖掘聚類(lèi),將海量數(shù)據(jù)有效壓縮并保留其數(shù)據(jù)的主要特征。
      [0033]以上實(shí)施方式僅為說(shuō)明本發(fā)明的技術(shù)思想,不能以此限定本發(fā)明的保護(hù)范圍,凡是按照本發(fā)明提出的技術(shù)思想,在技術(shù)方案基礎(chǔ)上所做的任何改動(dòng),均落入本發(fā)明保護(hù)范圍之內(nèi)。
      【主權(quán)項(xiàng)】
      1.一種基于時(shí)間序列的計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法,其特征在于,該方法包括以下步驟: 步驟1:輸入給定樣本集Χ、γ,其中X={xi,x2,...,xn}、Y={yi,y2,...,yn}; 步驟2:對(duì)輸入樣本集進(jìn)行去噪、歸一化處理; 步驟3:對(duì)時(shí)間序列X、Y進(jìn)行極值點(diǎn)求取,得到極值點(diǎn)序列X ’、Y ’ ; 步驟4:對(duì)所得到的區(qū)域極值點(diǎn)序列X’、Y’進(jìn)行等長(zhǎng)處理,等長(zhǎng)處理后得到長(zhǎng)度均為k的分類(lèi)序列X”、Y”; 步驟5:對(duì)處理后的分類(lèi)序列Χ”、Υ”進(jìn)行類(lèi)距離計(jì)算,其中,類(lèi)距離Cl(X1)表示為: d(Xi) =min | X1-Yj | ; 其中,X1是分類(lèi)序列X”中的任意一個(gè)數(shù),Yj是分類(lèi)序列Y”中的任意一個(gè)數(shù); 步驟6:將類(lèi)距離最大的兩類(lèi)進(jìn)行合并,合并后類(lèi)別數(shù)減少一個(gè); 步驟7:返回步驟5、6,繼續(xù)循環(huán)執(zhí)行,直到聚類(lèi)數(shù)等于預(yù)設(shè)的數(shù)值,即可聚類(lèi)結(jié)束; 步驟8:輸出聚類(lèi)結(jié)果。
      【專利摘要】本發(fā)明公開(kāi)了一種基于時(shí)間序列的計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法,該計(jì)算機(jī)數(shù)據(jù)挖掘聚類(lèi)方法通過(guò)對(duì)輸入樣本集X、Y進(jìn)行去噪、歸一化處理,并對(duì)處理后的時(shí)間序列進(jìn)行極值點(diǎn)求取,得到極值點(diǎn)序列Xˊ、Yˊ;再對(duì)Xˊ、Yˊ進(jìn)行等長(zhǎng)處理,等長(zhǎng)處理后得到長(zhǎng)度相等的分類(lèi)序列X”、Y”;然后對(duì)處理后的序列X”、Y”進(jìn)行類(lèi)距離計(jì)算,將距離最大的兩類(lèi)進(jìn)行合并,合并后類(lèi)別數(shù)減少一個(gè);接著對(duì)處理后的分類(lèi)序列X”、Y”循環(huán)執(zhí)行類(lèi)距離計(jì)算并且合并距離最大的兩類(lèi),直到聚類(lèi)數(shù)等于預(yù)設(shè)的數(shù)據(jù),即可聚類(lèi)結(jié)束;最后輸出聚類(lèi)結(jié)果。該方法能夠有效地處理數(shù)據(jù)量大、維度高的時(shí)間序列數(shù)據(jù),方法簡(jiǎn)單易行,不依賴于具體序列,能高效地進(jìn)行數(shù)據(jù)挖掘聚類(lèi),將海量數(shù)據(jù)有效壓縮并保留其數(shù)據(jù)的主要特征。
      【IPC分類(lèi)】G06F17/30, G06K9/62
      【公開(kāi)號(hào)】CN105631475
      【申請(qǐng)?zhí)枴緾N201510992669
      【發(fā)明人】李潔, 孫燕, 石成富
      【申請(qǐng)人】石成富
      【公開(kāi)日】2016年6月1日
      【申請(qǐng)日】2015年12月25日
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1