国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      DPI規(guī)則的生成方法及裝置與流程

      文檔序號(hào):12375641閱讀:580來源:國(guó)知局
      DPI規(guī)則的生成方法及裝置與流程

      本發(fā)明涉及網(wǎng)絡(luò)數(shù)據(jù)傳輸技術(shù)領(lǐng)域,尤其涉及一種DPI規(guī)則的生成方法及裝置。



      背景技術(shù):

      DPI(Deep Packet Inspection,深度業(yè)務(wù)識(shí)別)是一種對(duì)網(wǎng)絡(luò)中不同的業(yè)務(wù)流進(jìn)行區(qū)分的技術(shù),DPI通過分析業(yè)務(wù)流中數(shù)據(jù)包的深度特征值和協(xié)議行為識(shí)別出數(shù)據(jù)屬性及業(yè)務(wù)類型,通過不同客戶、不同業(yè)務(wù)的標(biāo)識(shí)為網(wǎng)絡(luò)業(yè)務(wù)的精細(xì)化分析及控制提供支持。

      目前,移動(dòng)互聯(lián)網(wǎng)的業(yè)務(wù)應(yīng)用層出不窮,且同一應(yīng)用的版本更新頻繁,導(dǎo)致當(dāng)前DPI規(guī)則庫(kù)的基于已知業(yè)務(wù)識(shí)別的DPI規(guī)則無(wú)法滿足業(yè)務(wù)分析的需要,造成DPI規(guī)則無(wú)法準(zhǔn)確識(shí)別互聯(lián)網(wǎng)數(shù)據(jù)中的業(yè)務(wù)數(shù)據(jù)。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明提供一種DPI規(guī)則的生成方法及裝置,旨在解決DPI規(guī)則庫(kù)的DPI規(guī)則無(wú)法準(zhǔn)確識(shí)別互聯(lián)網(wǎng)數(shù)據(jù)中的業(yè)務(wù)數(shù)據(jù)的技術(shù)問題。

      為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種DPI規(guī)則的生成方法,所述DPI規(guī)則的生成方法包括以下步驟:

      獲取互聯(lián)網(wǎng)數(shù)據(jù),基于DPI規(guī)則庫(kù)的DPI規(guī)則識(shí)別所述互聯(lián)網(wǎng)數(shù)據(jù);

      在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),分析所述未識(shí)別數(shù)據(jù),以獲取所述未識(shí)別數(shù)據(jù)的第一特征,其中,所述未識(shí)別數(shù)據(jù)為所述互聯(lián)網(wǎng)數(shù)據(jù)中所述DPI規(guī)則無(wú)法識(shí)別的互聯(lián)網(wǎng)數(shù)據(jù);

      基于所述第一特征編譯生成DPI規(guī)則;

      將所述DPI規(guī)則存儲(chǔ)至所述DPI規(guī)則庫(kù)。

      優(yōu)選地,所述在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),分析所述未識(shí)別數(shù)據(jù),以獲取所述未識(shí)別數(shù)據(jù)的第一特征的步驟包括:

      在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),獲取所述未識(shí)別數(shù)據(jù)的第二特征;

      基于所述第二特征過濾所述未識(shí)別數(shù)據(jù),以獲取業(yè)務(wù)數(shù)據(jù);

      分析所述業(yè)務(wù)數(shù)據(jù),以獲取所述業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征;

      將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征。

      優(yōu)選地,在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),獲取所述未識(shí)別數(shù)據(jù)的第二特征的步驟與所述基于所述第二特征過濾所述未識(shí)別數(shù)據(jù),以獲取業(yè)務(wù)數(shù)據(jù)的步驟之間,所述DPI規(guī)則的生成方法還包括:

      獲取所述第二特征對(duì)應(yīng)的第一目標(biāo)IP地址和/或第一用戶數(shù)據(jù);

      在所述第一目標(biāo)IP地址與所述第二特征對(duì)應(yīng)的第二目標(biāo)IP地址不一致時(shí),采用所述第二目標(biāo)IP更新所述未識(shí)別數(shù)據(jù)中的第一目標(biāo)IP地址;

      和/或,在所述第一用戶數(shù)據(jù)與所述第二特征對(duì)應(yīng)的第二用戶數(shù)據(jù)不一致時(shí),采用所述第二用戶數(shù)據(jù)更新所述未識(shí)別數(shù)據(jù)中的所述第一用戶數(shù)據(jù)。

      優(yōu)選地,所述分析所述業(yè)務(wù)數(shù)據(jù),以獲取所述業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征的步驟包括:

      將所述業(yè)務(wù)數(shù)據(jù)分為多組業(yè)務(wù)數(shù)據(jù)組;

      對(duì)所述業(yè)務(wù)數(shù)據(jù)組的相同序列的載荷報(bào)文進(jìn)行數(shù)據(jù)挖掘,以獲取各個(gè)所述業(yè)務(wù)數(shù)據(jù)組的業(yè)務(wù)特征;

      將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征。

      優(yōu)選地,所述將所述DPI規(guī)則存儲(chǔ)至DPI規(guī)則庫(kù)的步驟包括:

      判斷生成的所述DPI規(guī)則與所述DPI規(guī)則庫(kù)的所述DPI規(guī)則是否沖突;

      在生成的所述DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則均不存在沖突時(shí),將所述DPI規(guī)則存儲(chǔ)至DPI規(guī)則庫(kù)。

      此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種DPI規(guī)則的生成裝置,所述DPI規(guī)則的生成裝置包括:

      識(shí)別模塊,用于獲取互聯(lián)網(wǎng)數(shù)據(jù),基于DPI規(guī)則庫(kù)的DPI規(guī)則識(shí)別所述互聯(lián)網(wǎng)數(shù)據(jù);

      分析模塊,用于在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),分析所述未識(shí)別數(shù)據(jù),以獲取所述未識(shí)別數(shù)據(jù)的第一特征,其中,所述未識(shí)別數(shù)據(jù)為所述互聯(lián)網(wǎng)數(shù)據(jù)中所述DPI規(guī)則無(wú)法識(shí)別的互聯(lián)網(wǎng)數(shù)據(jù);

      編譯模塊,用于基于所述第一特征編譯生成DPI規(guī)則;

      存儲(chǔ)模塊,用于將所述DPI規(guī)則存儲(chǔ)至所述DPI規(guī)則庫(kù)。

      優(yōu)選地,所述分析模塊包括:

      第一獲取單元,用于在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),獲取所述未識(shí)別數(shù)據(jù)的第二特征;

      過濾單元,用于基于所述第二特征過濾所述未識(shí)別數(shù)據(jù),以獲取業(yè)務(wù)數(shù)據(jù);

      分析單元,用于分析所述業(yè)務(wù)數(shù)據(jù),以獲取所述業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征,并將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征。

      優(yōu)選地,所述分析模塊還包括:

      第二獲取單元,用于所述第二特征對(duì)應(yīng)的第一目標(biāo)IP地址和/或第一用戶數(shù)據(jù);

      更新單元,用于在所述第一目標(biāo)IP地址與所述第二特征對(duì)應(yīng)的第二目標(biāo)IP地址不一致時(shí),采用所述第二目標(biāo)IP更新所述未識(shí)別數(shù)據(jù)中的第一目標(biāo)IP地址;和/或,用于在所述第一用戶數(shù)據(jù)與所述第二特征對(duì)應(yīng)的第二用戶數(shù)據(jù)不一致時(shí),采用所述第二用戶數(shù)據(jù)更新所述未識(shí)別數(shù)據(jù)中的所述第一用戶數(shù)據(jù)。

      優(yōu)選地,所述分析單元包括:

      分組子單元,用于將所述業(yè)務(wù)數(shù)據(jù)分為多組業(yè)務(wù)數(shù)據(jù)組;

      數(shù)據(jù)挖掘子單元,用于對(duì)所述業(yè)務(wù)數(shù)據(jù)組的相同序列的載荷報(bào)文進(jìn)行數(shù)據(jù)挖掘,以獲取各個(gè)所述業(yè)務(wù)數(shù)據(jù)組的業(yè)務(wù)特征,并將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征。

      優(yōu)選地,所述存儲(chǔ)模塊包括:

      判斷單元,用于判斷生成的所述DPI規(guī)則與所述DPI規(guī)則庫(kù)的所述DPI規(guī)則是否沖突;

      存儲(chǔ)單元,用于在生成的所述DPI規(guī)則與所述DPI規(guī)則庫(kù)的所述DPI規(guī)則不存在沖突時(shí),將所述DPI規(guī)則存儲(chǔ)至DPI規(guī)則庫(kù)。

      本發(fā)明首先通過獲取互聯(lián)網(wǎng)數(shù)據(jù),基于DPI規(guī)則庫(kù)的DPI規(guī)則識(shí)別所述互聯(lián)網(wǎng)數(shù)據(jù),以獲取未識(shí)別數(shù)據(jù);接著分析所述未識(shí)別數(shù)據(jù),以獲取所述未識(shí)別數(shù)據(jù)的業(yè)務(wù)特征;然后基于所述業(yè)務(wù)特征編譯生成DPI規(guī)則;最后存儲(chǔ)所述DPI規(guī)則至所述DPI規(guī)則庫(kù)。根據(jù)獲取到的互聯(lián)網(wǎng)數(shù)據(jù)獲取未識(shí)別數(shù)據(jù)、分析未識(shí)別數(shù)據(jù)的業(yè)務(wù)特征,基于業(yè)務(wù)特征編譯生成DPI規(guī)則,并基于DPI 規(guī)則更新DPI規(guī)則庫(kù),完成了DPI規(guī)則庫(kù)的實(shí)時(shí)自動(dòng)更新,避免出現(xiàn)DPI規(guī)則庫(kù)的DPI規(guī)則無(wú)法準(zhǔn)確識(shí)別互聯(lián)網(wǎng)數(shù)據(jù)中的業(yè)務(wù)數(shù)據(jù)的問題,提高了數(shù)據(jù)識(shí)別的識(shí)別率和準(zhǔn)確率。

      附圖說明

      圖1為本發(fā)明DPI規(guī)則的生成方法第一實(shí)施例的流程示意圖;

      圖2為圖1中步驟S40的細(xì)化流程示意圖;

      圖3為圖1中步驟S20第一實(shí)施例的細(xì)化流程示意圖;

      圖4為圖1中步驟S20第二實(shí)施例的細(xì)化流程示意圖;

      圖5為圖3中步驟S23的細(xì)化流程示意圖;

      圖6為DPI規(guī)則的生成裝置第一實(shí)施例的功能模塊示意圖;

      圖7為圖6中存儲(chǔ)模塊的細(xì)化功能模塊示意圖;

      圖8為圖6中分析模塊第一實(shí)施例的細(xì)化功能模塊示意圖;

      圖9為圖6中分析模塊第二實(shí)施例的細(xì)化功能模塊示意圖;

      圖10為圖8中分析單元的細(xì)化功能模塊示意圖。

      本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明。

      具體實(shí)施方式

      應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

      本發(fā)明提供一種DPI規(guī)則的生成方法。

      參照?qǐng)D1,圖1為DPI規(guī)則的生成方法第一實(shí)施例的流程示意圖。

      在本實(shí)施例中,該DPI規(guī)則的生成方法包括:

      步驟S10,獲取互聯(lián)網(wǎng)數(shù)據(jù),基于DPI規(guī)則庫(kù)的DPI規(guī)則識(shí)別所述互聯(lián)網(wǎng)數(shù)據(jù);

      采集/獲取移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù),基于DPI規(guī)則庫(kù)的DPI規(guī)則識(shí)別采集/獲取到的移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)。

      步驟S20,在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),分析所述未識(shí)別數(shù)據(jù),以獲取所述未識(shí)別數(shù)據(jù)的第一特征,其中,所述未識(shí)別數(shù)據(jù)為所述互聯(lián)網(wǎng)數(shù) 據(jù)中所述DPI規(guī)則無(wú)法識(shí)別的互聯(lián)網(wǎng)數(shù)據(jù);

      在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),對(duì)未識(shí)別數(shù)據(jù)進(jìn)行分析,用以獲取未識(shí)別數(shù)據(jù)的第一特征。采用固有特征集包含的特征、未識(shí)別數(shù)據(jù)的負(fù)載和/或未識(shí)別數(shù)據(jù)中多數(shù)數(shù)據(jù)流的相同序列具有的共同特征等基于數(shù)據(jù)挖掘算法獲取第一特征。該第一特征為固有特征集包含的特征、未識(shí)別數(shù)據(jù)的負(fù)載和/或未識(shí)別數(shù)據(jù)中多數(shù)數(shù)據(jù)流的相同序列具有的共同特征中的一種或幾種;其中負(fù)載是指未識(shí)別數(shù)據(jù)包含的對(duì)應(yīng)的服務(wù)器等加密數(shù)據(jù)序列。

      步驟S30,基于所述第一特征編譯生成DPI規(guī)則;

      基于獲取的第一特征編譯生成DPI規(guī)則。編譯方式可以采用現(xiàn)有DPI規(guī)則的編譯方式,也可以采用其他編譯方式,譬如現(xiàn)有DPI規(guī)則的編譯方式優(yōu)化后的編譯方式等,本實(shí)施例中不做進(jìn)一步地限定。

      步驟S40,將所述DPI規(guī)則存儲(chǔ)至所述DPI規(guī)則庫(kù)。

      將編譯生成的DPI規(guī)則存儲(chǔ)至DPI規(guī)則庫(kù),即基于編譯生成的DPI規(guī)則更新DPI規(guī)則庫(kù),其更新過程采用熱更新。

      在其他實(shí)施例中,請(qǐng)參考圖2,步驟S40包括:

      步驟S41、判斷生成的所述DPI規(guī)則與所述DPI規(guī)則庫(kù)的所述DPI規(guī)則是否沖突;

      步驟S42、在生成的所述DPI規(guī)則與所述DPI規(guī)則庫(kù)的所述DPI規(guī)則不存在沖突時(shí),將所述DPI規(guī)則存儲(chǔ)至DPI規(guī)則庫(kù)。

      在基于生成的DPI規(guī)則搜索的數(shù)據(jù)與基于DPI規(guī)則庫(kù)的DPI規(guī)則搜索的數(shù)據(jù)一致、基于生成的DPI規(guī)則搜索的數(shù)據(jù)包含或者包含于基于DPI規(guī)則庫(kù)的DPI規(guī)則搜索的數(shù)據(jù)、或基于生成的DPI規(guī)則搜索的數(shù)據(jù)與基于DPI規(guī)則庫(kù)的DPI規(guī)則搜索的數(shù)據(jù)具有相同的數(shù)據(jù)時(shí),判定所述DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則發(fā)送沖突。在所述DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則存在沖突時(shí),分析所述DPI規(guī)則以及對(duì)應(yīng)沖突的DPI規(guī)則,找出發(fā)生沖突的原因,基于該原因修改DPI規(guī)則,在修改后的DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則不存在沖突,則存儲(chǔ)修改的DPI規(guī)則至DPI規(guī)則庫(kù),其中,在基于生成的DPI規(guī)則搜索的數(shù)據(jù)包含或者包含于基于DPI規(guī)則庫(kù)的DPI規(guī)則搜索的數(shù)據(jù)時(shí),設(shè)置生成的DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則的優(yōu)先級(jí),并基于設(shè)置后的生成的DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則更新DPI規(guī)則庫(kù);否則,繼續(xù)修改或者 放棄該DPI規(guī)則。

      在基于編譯生成的DPI規(guī)則更新DPI規(guī)則庫(kù)之后,即可采用更新后DPI規(guī)則庫(kù)的DPI規(guī)則識(shí)別移動(dòng)互聯(lián)網(wǎng)中新出現(xiàn)的業(yè)務(wù)數(shù)據(jù)。

      本實(shí)施例DPI規(guī)則的生成方法,首先通過獲取互聯(lián)網(wǎng)數(shù)據(jù),基于DPI規(guī)則庫(kù)的DPI規(guī)則識(shí)別所述互聯(lián)網(wǎng)數(shù)據(jù);接著在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),分析所述未識(shí)別數(shù)據(jù),以獲取所述未識(shí)別數(shù)據(jù)的第一特征;然后基于所述第一特征編譯生成DPI規(guī)則;最后將所述DPI規(guī)則存儲(chǔ)至所述DPI規(guī)則庫(kù)。根據(jù)獲取到的互聯(lián)網(wǎng)數(shù)據(jù)獲取未識(shí)別數(shù)據(jù)、分析未識(shí)別數(shù)據(jù)的業(yè)務(wù)特征,基于業(yè)務(wù)特征編譯生成DPI規(guī)則,并基于DPI規(guī)則更新DPI規(guī)則庫(kù),完成了DPI規(guī)則庫(kù)的實(shí)時(shí)自動(dòng)更新,避免出現(xiàn)DPI規(guī)則庫(kù)的DPI規(guī)則無(wú)法準(zhǔn)確識(shí)別互聯(lián)網(wǎng)數(shù)據(jù)中的業(yè)務(wù)數(shù)據(jù)的問題,提高了數(shù)據(jù)識(shí)別的識(shí)別率和準(zhǔn)確率。

      參照?qǐng)D3,圖3為圖1中步驟S20第一實(shí)施例的細(xì)化流程示意圖。

      基于第一實(shí)施例提出本發(fā)明DPI規(guī)則的生成方法中步驟S20的細(xì)化流程的實(shí)施例,本實(shí)施例中,步驟S20包括:

      步驟S21,在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),獲取所述未識(shí)別數(shù)據(jù)的第二特征;

      基于未識(shí)別數(shù)據(jù)的明文數(shù)據(jù)采用現(xiàn)有的協(xié)議獲取未識(shí)別數(shù)據(jù)的第二特征,第二特征包括域名等未識(shí)別數(shù)據(jù)的明文數(shù)據(jù)特征,并以該第二特征作為對(duì)應(yīng)未識(shí)別數(shù)據(jù)的業(yè)務(wù)名稱。

      步驟S22,基于所述第二特征過濾所述未識(shí)別數(shù)據(jù),以獲取業(yè)務(wù)數(shù)據(jù);

      過濾未識(shí)別數(shù)據(jù),去除未識(shí)別數(shù)據(jù)的非業(yè)務(wù)數(shù)據(jù),保證剩余的未識(shí)別數(shù)據(jù)為純業(yè)務(wù)數(shù)據(jù)??梢酝ㄟ^獲取未識(shí)別數(shù)據(jù)中的用戶數(shù)據(jù)及用戶數(shù)據(jù)對(duì)應(yīng)的目標(biāo)IP地址,在用戶數(shù)據(jù)及用戶數(shù)據(jù)對(duì)應(yīng)的目標(biāo)IP地址均能夠與第二特征匹配成功時(shí),該用戶數(shù)據(jù)對(duì)應(yīng)的未識(shí)別數(shù)據(jù)為業(yè)務(wù)數(shù)據(jù);在用戶數(shù)據(jù)及用戶數(shù)據(jù)對(duì)應(yīng)的目標(biāo)IP地址不能同時(shí)與第二特征匹配成功時(shí),該用戶數(shù)據(jù)對(duì)應(yīng)的未識(shí)別數(shù)據(jù)為非業(yè)務(wù)數(shù)據(jù)。本實(shí)施的過濾未識(shí)別數(shù)據(jù)的方式可以講未識(shí)別數(shù)據(jù)中的非業(yè)務(wù)數(shù)據(jù)刪除或者標(biāo)示為非業(yè)務(wù)數(shù)據(jù)。

      步驟S23,分析所述業(yè)務(wù)數(shù)據(jù),以獲取所述業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征;

      采用固有特征集包含的特征、未識(shí)別數(shù)據(jù)的負(fù)載和/或未識(shí)別數(shù)據(jù)中多數(shù) 數(shù)據(jù)流的相同序列具有的共同特征等基于數(shù)據(jù)挖掘算法分析業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征。該業(yè)務(wù)特征為固有特征集包含的特征、未識(shí)別數(shù)據(jù)的負(fù)載和/或未識(shí)別數(shù)據(jù)中多數(shù)數(shù)據(jù)流的相同序列具有的共同特征中的一種或幾種;其中負(fù)載是指未識(shí)別數(shù)據(jù)包含的對(duì)應(yīng)的服務(wù)器等加密數(shù)據(jù)序列。

      步驟S24,將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征。

      在其他實(shí)施例中,請(qǐng)參照?qǐng)D4,在步驟S21和步驟S22之間,DPI規(guī)則的生成方法還包括:

      步驟S25,獲取所述第二特征對(duì)應(yīng)的第一目標(biāo)IP地址和/或第一用戶數(shù)據(jù);

      其中,第一目標(biāo)IP地址、第一用戶數(shù)據(jù)分別為未識(shí)別數(shù)據(jù)中第二特征對(duì)應(yīng)的目標(biāo)IP地址和用戶數(shù)據(jù)。

      步驟S26,在所述第一目標(biāo)IP地址與所述第二特征對(duì)應(yīng)的第二目標(biāo)IP地址不一致時(shí),采用所述第二目標(biāo)IP更新所述未識(shí)別數(shù)據(jù)中的第一目標(biāo)IP地址;

      和/或,在所述第一用戶數(shù)據(jù)與所述第二特征對(duì)應(yīng)的第二用戶數(shù)據(jù)不一致時(shí),采用所述第二用戶數(shù)據(jù)更新所述未識(shí)別數(shù)據(jù)中的所述第一用戶數(shù)據(jù)。

      其中,第二目標(biāo)IP地址為互聯(lián)網(wǎng)數(shù)據(jù)中第二特征對(duì)應(yīng)的目標(biāo)IP地址,第二用戶數(shù)據(jù)為互聯(lián)網(wǎng)數(shù)據(jù)中第二特征對(duì)應(yīng)的用戶數(shù)據(jù)。

      通過獲取未識(shí)別數(shù)據(jù)中所述第二特征對(duì)應(yīng)的第一目標(biāo)IP地址和/或第一用戶數(shù)據(jù),并在所述第一目標(biāo)IP地址與所述第二特征對(duì)應(yīng)的第二目標(biāo)IP地址不一致時(shí),采用所述第二目標(biāo)IP更新所述未識(shí)別數(shù)據(jù)中的第一目標(biāo)IP地址,和/或,在所述第一用戶數(shù)據(jù)與所述第二特征對(duì)應(yīng)的第二用戶數(shù)據(jù)不一致時(shí),采用所述第二用戶數(shù)據(jù)更新所述未識(shí)別數(shù)據(jù)中的所述第一用戶數(shù)據(jù)。補(bǔ)全了未識(shí)別數(shù)據(jù),確保了第二特征對(duì)應(yīng)的未識(shí)別數(shù)據(jù)的完整性,進(jìn)而提高了后續(xù)生成的DPI規(guī)則的準(zhǔn)確率。

      本實(shí)施例中,通過第二特征過濾所述未識(shí)別數(shù)據(jù),獲取未識(shí)別數(shù)據(jù)中的業(yè)務(wù)數(shù)據(jù),并通過分析所述業(yè)務(wù)數(shù)據(jù)獲取所述業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征,并將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征,提高了第一特征的準(zhǔn)確性,進(jìn)而提高了后續(xù)生成的DPI規(guī)則的準(zhǔn)確率。

      參照?qǐng)D5,圖5為圖3中步驟S23的細(xì)化流程示意圖。

      基于上一實(shí)施例提出本發(fā)明DPI規(guī)則的生成方法中步驟S23的細(xì)化流程 的實(shí)施例,本實(shí)施例中,步驟S23包括:

      步驟S231,將所述業(yè)務(wù)數(shù)據(jù)分為多組業(yè)務(wù)數(shù)據(jù)組;

      以用戶流為單位將所述業(yè)務(wù)數(shù)據(jù)分為多組業(yè)務(wù)數(shù)據(jù)組,分組時(shí)可以以N個(gè)用戶流為一組對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行分組。用戶流是指用戶訪問某一服務(wù)器時(shí),與該服務(wù)器IP連接過程中的產(chǎn)生的數(shù)據(jù)流。

      步驟S232,對(duì)所述業(yè)務(wù)數(shù)據(jù)組的相同序列的載荷報(bào)文進(jìn)行數(shù)據(jù)挖掘,以獲取各個(gè)所述業(yè)務(wù)數(shù)據(jù)組的業(yè)務(wù)特征。

      采用數(shù)據(jù)挖掘算法對(duì)每一個(gè)業(yè)務(wù)數(shù)據(jù)組的相同序列的載荷報(bào)文進(jìn)行數(shù)據(jù)挖掘,以獲取所述業(yè)務(wù)數(shù)據(jù)組的業(yè)務(wù)特征,該業(yè)務(wù)特征是指能夠覆蓋預(yù)設(shè)比例以上的業(yè)務(wù)數(shù)據(jù)組的業(yè)務(wù)數(shù)據(jù)的共同特征,即業(yè)務(wù)數(shù)據(jù)組預(yù)設(shè)比例以上的業(yè)務(wù)數(shù)據(jù)的共同特征,或者業(yè)務(wù)數(shù)據(jù)組預(yù)設(shè)比例以上的業(yè)務(wù)數(shù)據(jù)都包含該業(yè)務(wù)特征,其中預(yù)設(shè)比例是為保證后續(xù)生成的DPI規(guī)則的準(zhǔn)確率而預(yù)先設(shè)置的比例,該預(yù)設(shè)比例可以根據(jù)需求設(shè)置為90%、95%等比例。

      步驟S233,將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征。

      本實(shí)施例中,通過將所述業(yè)務(wù)數(shù)據(jù)分為多組業(yè)務(wù)數(shù)據(jù)組;并對(duì)所述業(yè)務(wù)數(shù)據(jù)組的相同序列的載荷報(bào)文進(jìn)行數(shù)據(jù)挖掘,以獲取所述業(yè)務(wù)數(shù)據(jù)組的業(yè)務(wù)特征,并將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征;分組且采用數(shù)據(jù)挖掘的方式獲取業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征,提高了業(yè)務(wù)特征的準(zhǔn)確性。

      本發(fā)明進(jìn)一步提供一種DPI規(guī)則的生成裝置。

      參照?qǐng)D6,圖6為DPI規(guī)則的生成裝置第一實(shí)施例的功能模塊示意圖。

      在本實(shí)施例中,該DPI規(guī)則的生成裝置包括:

      識(shí)別模塊10,用于獲取互聯(lián)網(wǎng)數(shù)據(jù),基于DPI規(guī)則庫(kù)的DPI規(guī)則識(shí)別所述互聯(lián)網(wǎng)數(shù)據(jù);

      識(shí)別模塊10采集/獲取移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù),基于DPI規(guī)則庫(kù)的DPI規(guī)則識(shí)別采集/獲取到的移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)。

      分析模塊20,在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),分析所述未識(shí)別數(shù)據(jù),以獲取所述未識(shí)別數(shù)據(jù)的第一特征,其中,所述未識(shí)別數(shù)據(jù)為所述互聯(lián)網(wǎng)數(shù)據(jù)中所述DPI規(guī)則無(wú)法識(shí)別的互聯(lián)網(wǎng)數(shù)據(jù);

      在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),分析模塊20對(duì)未識(shí)別數(shù)據(jù)進(jìn)行分 析,用以獲取未識(shí)別數(shù)據(jù)的第一特征。分析模塊20采用固有特征集包含的特征、未識(shí)別數(shù)據(jù)的負(fù)載和/或未識(shí)別數(shù)據(jù)中多數(shù)數(shù)據(jù)流的相同序列具有的共同特征等基于數(shù)據(jù)挖掘算法獲取第一特征。該第一特征為固有特征集包含的特征、未識(shí)別數(shù)據(jù)的負(fù)載和/或未識(shí)別數(shù)據(jù)中多數(shù)數(shù)據(jù)流的相同序列具有的共同特征中的一種或幾種;其中負(fù)載是指未識(shí)別數(shù)據(jù)包含的對(duì)應(yīng)的服務(wù)器等加密數(shù)據(jù)序列。

      編譯模塊30,用于基于所述第一特征編譯生成DPI規(guī)則;

      編譯模塊30基于獲取的第一特征編譯生成DPI規(guī)則。編譯方式可以采用現(xiàn)有DPI規(guī)則的編譯方式,也可以采用其他編譯方式,譬如現(xiàn)有DPI規(guī)則的編譯方式優(yōu)化后的編譯方式等,本實(shí)施例中不做進(jìn)一步地限定。

      存儲(chǔ)模塊40,用于將所述DPI規(guī)則存儲(chǔ)至所述DPI規(guī)則庫(kù)。

      存儲(chǔ)模塊40將編譯生成的DPI規(guī)則存儲(chǔ)至DPI規(guī)則庫(kù),即基于編譯生成的DPI規(guī)則更新DPI規(guī)則庫(kù),其更新過程采用熱更新。

      在其他實(shí)施例中,請(qǐng)參考圖7,所述存儲(chǔ)模塊40包括:

      判斷單元41,用于判斷所述生成的DPI規(guī)則與所述DPI規(guī)則庫(kù)的所述DPI規(guī)則是否沖突;

      存儲(chǔ)單元42,用于在生成的所述DPI規(guī)則與所述DPI規(guī)則庫(kù)的所述DPI規(guī)則不存在沖突時(shí),將所述DPI規(guī)則存儲(chǔ)至DPI規(guī)則庫(kù)。

      在基于生成的DPI規(guī)則搜索的數(shù)據(jù)與基于DPI規(guī)則庫(kù)的DPI規(guī)則搜索的數(shù)據(jù)一致、基于生成的DPI規(guī)則搜索的數(shù)據(jù)包含或者包含于基于DPI規(guī)則庫(kù)的DPI規(guī)則搜索的數(shù)據(jù)、或基于生成的DPI規(guī)則搜索的數(shù)據(jù)與基于DPI規(guī)則庫(kù)的DPI規(guī)則搜索的數(shù)據(jù)具有相同的數(shù)據(jù)時(shí),判斷單元41判定所述DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則發(fā)送沖突。在所述DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則存在沖突時(shí),分析所述DPI規(guī)則以及對(duì)應(yīng)沖突的DPI規(guī)則,找出發(fā)生沖突的原因,基于該原因修改DPI規(guī)則,在修改后的DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則不存在沖突,則存儲(chǔ)修改的DPI規(guī)則至DPI規(guī)則庫(kù),其中,在基于生成的DPI規(guī)則搜索的數(shù)據(jù)包含或者包含于基于DPI規(guī)則庫(kù)的DPI規(guī)則搜索的數(shù)據(jù)時(shí),設(shè)置生成的DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則的優(yōu)先級(jí),并基于設(shè)置后的生成的DPI規(guī)則與DPI規(guī)則庫(kù)的DPI規(guī)則更新DPI規(guī)則庫(kù);否則,繼續(xù)修改或者放棄該DPI規(guī)則。

      本實(shí)施例DPI規(guī)則的生成裝置,首先通過識(shí)別模塊10獲取互聯(lián)網(wǎng)數(shù)據(jù),基于DPI規(guī)則庫(kù)的DPI規(guī)則識(shí)別所述互聯(lián)網(wǎng)數(shù)據(jù);接著在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),分析模塊20分析所述未識(shí)別數(shù)據(jù),以獲取所述未識(shí)別數(shù)據(jù)的第一特征;然后編譯模塊30基于所述第一特征編譯生成DPI規(guī)則;最后存儲(chǔ)模塊40將所述DPI規(guī)則存儲(chǔ)至所述DPI規(guī)則庫(kù)。根據(jù)獲取到的互聯(lián)網(wǎng)數(shù)據(jù)獲取未識(shí)別數(shù)據(jù)、分析未識(shí)別數(shù)據(jù)的業(yè)務(wù)特征,基于業(yè)務(wù)特征編譯生成DPI規(guī)則,并基于DPI規(guī)則更新DPI規(guī)則庫(kù),完成了DPI規(guī)則庫(kù)的實(shí)時(shí)自動(dòng)更新,避免出現(xiàn)DPI規(guī)則庫(kù)的DPI規(guī)則無(wú)法準(zhǔn)確識(shí)別互聯(lián)網(wǎng)數(shù)據(jù)中的業(yè)務(wù)數(shù)據(jù)的問題,提高了數(shù)據(jù)識(shí)別的識(shí)別率和準(zhǔn)確率。

      參照?qǐng)D8,圖8為圖6中分析模塊第一實(shí)施例的細(xì)化功能模塊示意圖。

      基于第一實(shí)施例提出本發(fā)明DPI規(guī)則的生成裝置中分析模塊的細(xì)化功能模塊的實(shí)施例,本實(shí)施例中,所述分析模塊20包括:

      第一獲取單元21,用于在所述互聯(lián)網(wǎng)數(shù)據(jù)存在未識(shí)別數(shù)據(jù)時(shí),獲取所述未識(shí)別數(shù)據(jù)的第二特征;

      第一獲取單元21基于未識(shí)別數(shù)據(jù)的明文數(shù)據(jù)采用現(xiàn)有的協(xié)議獲取未識(shí)別數(shù)據(jù)的第二特征,第二特征包括域名等未識(shí)別數(shù)據(jù)的明文數(shù)據(jù)特征,并以該第二特征作為對(duì)應(yīng)未識(shí)別數(shù)據(jù)的業(yè)務(wù)名稱。

      過濾單元22,用于基于所述第二特征過濾所述未識(shí)別數(shù)據(jù),以獲取業(yè)務(wù)數(shù)據(jù);

      過濾單元22過濾未識(shí)別數(shù)據(jù),去除未識(shí)別數(shù)據(jù)的非業(yè)務(wù)數(shù)據(jù),保證剩余的未識(shí)別數(shù)據(jù)為純業(yè)務(wù)數(shù)據(jù)??梢酝ㄟ^獲取未識(shí)別數(shù)據(jù)中的用戶數(shù)據(jù)及用戶數(shù)據(jù)對(duì)應(yīng)的目標(biāo)IP地址,在用戶數(shù)據(jù)及用戶數(shù)據(jù)對(duì)應(yīng)的目標(biāo)IP地址均能夠與第二特征匹配成功時(shí),該用戶數(shù)據(jù)對(duì)應(yīng)的未識(shí)別數(shù)據(jù)為業(yè)務(wù)數(shù)據(jù);在用戶數(shù)據(jù)及用戶數(shù)據(jù)對(duì)應(yīng)的目標(biāo)IP地址不能同時(shí)與第二特征匹配成功時(shí),該用戶數(shù)據(jù)對(duì)應(yīng)的未識(shí)別數(shù)據(jù)為非業(yè)務(wù)數(shù)據(jù)。本實(shí)施的過濾未識(shí)別數(shù)據(jù)的方式可以講未識(shí)別數(shù)據(jù)中的非業(yè)務(wù)數(shù)據(jù)刪除或者標(biāo)示為非業(yè)務(wù)數(shù)據(jù)。

      分析單元23,用于分析所述業(yè)務(wù)數(shù)據(jù),以獲取所述業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征,并將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征。

      分析單元23采用固有特征集包含的特征、未識(shí)別數(shù)據(jù)的負(fù)載和/或未識(shí)別 數(shù)據(jù)中多數(shù)數(shù)據(jù)流的相同序列具有的共同特征等基于數(shù)據(jù)挖掘算法分析業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征。該業(yè)務(wù)特征為固有特征集包含的特征、未識(shí)別數(shù)據(jù)的負(fù)載和/或未識(shí)別數(shù)據(jù)中多數(shù)數(shù)據(jù)流的相同序列具有的共同特征中的一種或幾種;其中負(fù)載是指未識(shí)別數(shù)據(jù)包含的對(duì)應(yīng)的服務(wù)器等加密數(shù)據(jù)序列。

      在其他實(shí)施例中,請(qǐng)參照?qǐng)D9,所述分析模塊20還包括:

      第二獲取單元24,用于獲取所述第二特征對(duì)應(yīng)的第一目標(biāo)IP地址和/或第一用戶數(shù)據(jù);

      其中,第一目標(biāo)IP地址、第一用戶數(shù)據(jù)分別為未識(shí)別數(shù)據(jù)中第二特征對(duì)應(yīng)的目標(biāo)IP地址和用戶數(shù)據(jù)。

      更新單元25,用于在所述第一目標(biāo)IP地址與所述第二特征對(duì)應(yīng)的第二目標(biāo)IP地址不一致時(shí),采用所述第二目標(biāo)IP更新所述未識(shí)別數(shù)據(jù)中的第一目標(biāo)IP地址;和/或,在所述第一用戶數(shù)據(jù)與所述第二特征對(duì)應(yīng)的第二用戶數(shù)據(jù)不一致時(shí),采用所述第二用戶數(shù)據(jù)更新所述未識(shí)別數(shù)據(jù)中的所述第一用戶數(shù)據(jù)。

      其中,第二目標(biāo)IP地址為互聯(lián)網(wǎng)數(shù)據(jù)中第二特征對(duì)應(yīng)的目標(biāo)IP地址,第二用戶數(shù)據(jù)為互聯(lián)網(wǎng)數(shù)據(jù)中第二特征對(duì)應(yīng)的用戶數(shù)據(jù)。

      通過第二獲取單元24獲取未識(shí)別數(shù)據(jù)中所述第二特征對(duì)應(yīng)的第一目標(biāo)IP地址和/或第一用戶數(shù)據(jù),在所述第一目標(biāo)IP地址與所述第二特征對(duì)應(yīng)的第二目標(biāo)IP地址不一致時(shí),更新單元25采用所述第二目標(biāo)IP更新所述未識(shí)別數(shù)據(jù)中的第一目標(biāo)IP地址,和/或,在所述第一用戶數(shù)據(jù)與所述第二特征對(duì)應(yīng)的第二用戶數(shù)據(jù)不一致時(shí),更新單元25采用所述第二用戶數(shù)據(jù)更新所述未識(shí)別數(shù)據(jù)中的所述第一用戶數(shù)據(jù)。補(bǔ)全了未識(shí)別數(shù)據(jù),確保了第二特征對(duì)應(yīng)的未識(shí)別數(shù)據(jù)的完整性,進(jìn)而提高了后續(xù)生成的DPI規(guī)則的準(zhǔn)確率。

      本實(shí)施例中,通過過濾單元22基于第二特征過濾所述未識(shí)別數(shù)據(jù)獲取未識(shí)別數(shù)據(jù)中的業(yè)務(wù)數(shù)據(jù),并通過分析所述業(yè)務(wù)數(shù)據(jù)獲取所述業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征,并將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征,提高了第一特征的準(zhǔn)確性,進(jìn)而提高了后續(xù)生成的DPI規(guī)則的準(zhǔn)確率。

      參照?qǐng)D10,圖10為圖8中分析單元的細(xì)化功能模塊示意圖。

      基于上一實(shí)施例提出本發(fā)明DPI規(guī)則的生成裝置中分析單元的細(xì)化流功能模塊程的實(shí)施例,本實(shí)施例中,所述分析單元23包括:

      分組子單元231,用于將所述業(yè)務(wù)數(shù)據(jù)分為多組業(yè)務(wù)數(shù)據(jù)組;

      分組子單元231以用戶流為單位將所述業(yè)務(wù)數(shù)據(jù)分為至少兩組業(yè)務(wù)數(shù)據(jù)組,分組時(shí)也可以以N個(gè)用戶流為一組對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行分組。用戶流是指用戶成功訪問某一服務(wù)器IP時(shí),訪問過程中的全部數(shù)據(jù)。

      數(shù)據(jù)挖掘子單元232,用于對(duì)所述業(yè)務(wù)數(shù)據(jù)組的相同序列的載荷報(bào)文進(jìn)行數(shù)據(jù)挖掘,以獲取各個(gè)所述業(yè)務(wù)數(shù)據(jù)組的業(yè)務(wù)特征,并將獲取的所述業(yè)務(wù)特征作為所述未識(shí)別數(shù)據(jù)的第一特征。

      數(shù)據(jù)挖掘子單元232采用數(shù)據(jù)挖掘算法對(duì)每一個(gè)業(yè)務(wù)數(shù)據(jù)組的相同序列的載荷報(bào)文進(jìn)行數(shù)據(jù)挖掘,以獲取所述業(yè)務(wù)數(shù)據(jù)組的業(yè)務(wù)特征,該業(yè)務(wù)特征是指能夠覆蓋預(yù)設(shè)比例以上的業(yè)務(wù)數(shù)據(jù)組的業(yè)務(wù)數(shù)據(jù)的共同特征,即業(yè)務(wù)數(shù)據(jù)組預(yù)設(shè)比例以上的業(yè)務(wù)數(shù)據(jù)的共同特征,或者業(yè)務(wù)數(shù)據(jù)組預(yù)設(shè)比例以上的業(yè)務(wù)數(shù)據(jù)都包含該業(yè)務(wù)特征,其中預(yù)設(shè)比例是為保證后續(xù)生成的DPI規(guī)則的準(zhǔn)確率而預(yù)先設(shè)置的比例,該預(yù)設(shè)比例可以根據(jù)需求設(shè)置為90%、95%等。

      本實(shí)施例中,分組子單元221將所述業(yè)務(wù)數(shù)據(jù)分為多組業(yè)務(wù)數(shù)據(jù)組;數(shù)據(jù)挖掘子單元222對(duì)所述業(yè)務(wù)數(shù)據(jù)組的相同序列的載荷報(bào)文進(jìn)行數(shù)據(jù)挖掘,以獲取各個(gè)所述業(yè)務(wù)數(shù)據(jù)組的業(yè)務(wù)特征;分組且采用數(shù)據(jù)挖掘的方式獲取業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)特征,提高了業(yè)務(wù)特征的準(zhǔn)確性。

      以上僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。

      當(dāng)前第1頁(yè)1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1