本技術(shù)涉及計(jì)算機(jī),具體而言,涉及一種應(yīng)用于數(shù)據(jù)中臺構(gòu)建的數(shù)據(jù)處理方法及系統(tǒng)。
背景技術(shù):
1、隨著信息技術(shù)的迅猛發(fā)展,數(shù)據(jù)中臺作為企業(yè)數(shù)據(jù)管理和服務(wù)的重要樞紐,其安全性問題日益凸顯。網(wǎng)絡(luò)入侵行為對數(shù)據(jù)中臺的安全構(gòu)成了嚴(yán)重威脅,因此,如何有效地檢測和防御網(wǎng)絡(luò)入侵成為了亟待解決的問題。
2、在傳統(tǒng)的網(wǎng)絡(luò)入侵檢測與防御方法中,主要依賴于靜態(tài)的規(guī)則庫和簽名匹配技術(shù)來識別已知的攻擊模式。然而,這種方法在面對新型、未知的網(wǎng)絡(luò)入侵時(shí),往往顯得力不從心。此外,傳統(tǒng)的防御方法也無法很好地應(yīng)對復(fù)雜多變的網(wǎng)絡(luò)環(huán)境和攻擊手段。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本技術(shù)的目的在于提供一種應(yīng)用于數(shù)據(jù)中臺構(gòu)建的數(shù)據(jù)處理方法及系統(tǒng)。
2、依據(jù)本技術(shù)的第一方面,提供一種應(yīng)用于數(shù)據(jù)中臺構(gòu)建的數(shù)據(jù)處理方法,應(yīng)用于數(shù)據(jù)中臺服務(wù)系統(tǒng),所述方法包括:
3、獲取應(yīng)用于數(shù)據(jù)中臺構(gòu)建的第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列和第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列,所述第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列和所述第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的網(wǎng)絡(luò)入侵類別不同,所述第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的模板配置規(guī)模大于所述第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的模板配置規(guī)模;
4、將所述第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列分為多個(gè)模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)子序列,基于所述第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的模板配置規(guī)模和所述第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的模板配置規(guī)模的規(guī)模比值,確定每個(gè)所述模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)子序列的抽取規(guī)模;
5、基于所述抽取規(guī)模對每個(gè)所述模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)子序列進(jìn)行數(shù)據(jù)抽取,以生成第三模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列,并基于所述第三模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列和所述第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列生成樣例學(xué)習(xí)數(shù)據(jù)序列,所述第三模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的模板配置規(guī)模和所述第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的模板配置規(guī)模的規(guī)模比值小于設(shè)定比值;
6、基于所述樣例學(xué)習(xí)數(shù)據(jù)序列對網(wǎng)絡(luò)入侵預(yù)測模型進(jìn)行模型參數(shù)學(xué)習(xí),生成完成模型參數(shù)學(xué)習(xí)的所述網(wǎng)絡(luò)入侵預(yù)測模型;
7、基于完成模型參數(shù)學(xué)習(xí)的所述網(wǎng)絡(luò)入侵預(yù)測模型對目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)進(jìn)行分類,生成所述目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)的分類預(yù)測結(jié)果,并基于所述目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)的分類預(yù)測結(jié)果對待構(gòu)建數(shù)據(jù)中臺進(jìn)行安全防護(hù)強(qiáng)化配置,所述分類預(yù)測結(jié)果表征所述目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)的網(wǎng)絡(luò)入侵類別。
8、在第一方面的一種可能的實(shí)施方式中,所述獲取應(yīng)用于數(shù)據(jù)中臺構(gòu)建的第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列和第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列,包括:
9、從初始網(wǎng)絡(luò)入侵日志中獲取攜帶攻擊類型標(biāo)簽的基準(zhǔn)入侵日志,所述攻擊類型標(biāo)簽表征所述基準(zhǔn)入侵日志的網(wǎng)絡(luò)入侵類別;
10、對所述基準(zhǔn)入侵日志進(jìn)行編碼,生成所述基準(zhǔn)入侵日志的入侵路徑編碼矢量;
11、基于所述基準(zhǔn)入侵日志的入侵路徑編碼矢量確定所述第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列和第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列。
12、在第一方面的一種可能的實(shí)施方式中,所述從初始網(wǎng)絡(luò)入侵日志中獲取攜帶攻擊類型標(biāo)簽的基準(zhǔn)入侵日志,包括:
13、獲取所述基準(zhǔn)入侵日志的初始入侵知識點(diǎn);
14、基于所述基準(zhǔn)入侵日志的初始入侵知識點(diǎn),確定入侵行為評估信息;
15、基于所述入侵行為評估信息和入侵特征模板,從所述基準(zhǔn)入侵日志中清除噪聲入侵日志,生成更新后的所述基準(zhǔn)入侵日志。
16、在第一方面的一種可能的實(shí)施方式中,所述對所述基準(zhǔn)入侵日志進(jìn)行編碼,生成所述基準(zhǔn)入侵日志的入侵路徑編碼矢量,包括:
17、依據(jù)所述基準(zhǔn)入侵日志的先驗(yàn)攻擊行為記錄,構(gòu)建所述基準(zhǔn)入侵日志的初始入侵知識矢量,所述初始入侵知識矢量至少包括攻擊類型、攻擊來源和攻擊目標(biāo);
18、依據(jù)所述基準(zhǔn)入侵日志的攻擊模式,構(gòu)建所述基準(zhǔn)入侵日志的攻擊策略滲透特征;
19、基于設(shè)定的時(shí)間窗口對所述基準(zhǔn)入侵日志的初始入侵知識矢量和攻擊策略滲透特征進(jìn)行序列化處理,以融合出不同時(shí)間窗口的融合后的初始入侵知識矢量和融合后的攻擊策略滲透特征;
20、對融合前的初始入侵知識矢量和融合后的初始入侵知識矢量中的至少一個(gè)與攻擊策略滲透特征進(jìn)行編碼,以獲取所述基準(zhǔn)入侵日志的第一編碼矢量;
21、對所述基準(zhǔn)入侵日志的第一編碼矢量中的分類矢量進(jìn)行處理,生成所述基準(zhǔn)入侵日志的第二編碼矢量;
22、將所述基準(zhǔn)入侵日志的第一編碼矢量和第二編碼矢量進(jìn)行拼接,生成所述基準(zhǔn)入侵日志的入侵路徑編碼矢量,所述基準(zhǔn)入侵日志的入侵路徑編碼矢量為數(shù)值型入侵路徑編碼矢量。
23、在第一方面的一種可能的實(shí)施方式中,所述對融合前的初始入侵知識矢量和融合后的初始入侵知識矢量中的至少一個(gè)與攻擊策略滲透特征進(jìn)行編碼,以獲取所述基準(zhǔn)入侵日志的第一編碼矢量,包括:
24、對所述融合前的初始入侵知識矢量和融合后的初始入侵知識矢量中的至少一個(gè)攻擊策略滲透特征中的結(jié)構(gòu)化矢量進(jìn)行規(guī)則化轉(zhuǎn)換;及
25、對所述融合前的初始入侵知識矢量和融合后的初始入侵知識矢量中的至少一個(gè)和攻擊策略滲透特征中的非結(jié)構(gòu)化矢量進(jìn)行離散化轉(zhuǎn)換。
26、在第一方面的一種可能的實(shí)施方式中,所述將所述第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列分為多個(gè)模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)子序列,基于所述第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的模板配置規(guī)模和所述第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的模板配置規(guī)模的規(guī)模比值,確定每個(gè)所述模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)子序列的抽取規(guī)模,包括:
27、在所述第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列和所述第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的規(guī)模比值大于所述設(shè)定比值時(shí),基于所述設(shè)定比值、所述模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)子序列的模板配置規(guī)模和所述第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列的模板配置規(guī)模,確定所述抽取規(guī)模。
28、在第一方面的一種可能的實(shí)施方式中,所述基于所述樣例學(xué)習(xí)數(shù)據(jù)序列對網(wǎng)絡(luò)入侵預(yù)測模型進(jìn)行模型參數(shù)學(xué)習(xí),生成完成模型參數(shù)學(xué)習(xí)的所述網(wǎng)絡(luò)入侵預(yù)測模型,包括:
29、任意提取所述樣例學(xué)習(xí)數(shù)據(jù)序列中的每個(gè)樣例學(xué)習(xí)數(shù)據(jù)的多個(gè)特征,并輸入初始學(xué)習(xí)算法,以生成風(fēng)險(xiǎn)加權(quán)預(yù)測樹;
30、迭代執(zhí)行所述任意提取所述樣例學(xué)習(xí)數(shù)據(jù)序列中的每個(gè)樣例學(xué)習(xí)數(shù)據(jù)的多個(gè)特征,并輸入初始學(xué)習(xí)算法,以生成風(fēng)險(xiǎn)加權(quán)預(yù)測樹的步驟,直至生成x個(gè)所述風(fēng)險(xiǎn)加權(quán)預(yù)測樹,所述x為大于1的正整數(shù);及
31、對x個(gè)所述風(fēng)險(xiǎn)加權(quán)預(yù)測樹進(jìn)行集成學(xué)習(xí)以生成所述網(wǎng)絡(luò)入侵預(yù)測模型。
32、在第一方面的一種可能的實(shí)施方式中,所述基于所述樣例學(xué)習(xí)數(shù)據(jù)序列對網(wǎng)絡(luò)入侵預(yù)測模型進(jìn)行模型參數(shù)學(xué)習(xí),生成完成模型參數(shù)學(xué)習(xí)的所述網(wǎng)絡(luò)入侵預(yù)測模型,包括:
33、將所述樣例學(xué)習(xí)數(shù)據(jù)序列,劃分為第一子序列和第二子序列;
34、依據(jù)初始化權(quán)重信息和所述第一子序列,對所述網(wǎng)絡(luò)入侵預(yù)測模型進(jìn)行模型參數(shù)學(xué)習(xí),所述初始化權(quán)重信息包括所述模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)子序列的規(guī)模、所述x和任意提取所述樣例學(xué)習(xí)數(shù)據(jù)序列中的每個(gè)樣例學(xué)習(xí)數(shù)據(jù)的特征的規(guī)模;
35、對所述網(wǎng)絡(luò)入侵預(yù)測模型進(jìn)行網(wǎng)絡(luò)入侵預(yù)測行為的學(xué)習(xí);
36、依據(jù)網(wǎng)絡(luò)入侵預(yù)測行為的學(xué)習(xí)后的模型參數(shù)信息,繼續(xù)對所述網(wǎng)絡(luò)入侵預(yù)測模型進(jìn)行模型參數(shù)學(xué)習(xí),生成完成模型參數(shù)學(xué)習(xí)的所述網(wǎng)絡(luò)入侵預(yù)測模型,并依據(jù)所述第二子序列對所述完成模型參數(shù)學(xué)習(xí)的網(wǎng)絡(luò)入侵預(yù)測模型進(jìn)行測試;
37、在第一方面的一種可能的實(shí)施方式中,所述基于完成模型參數(shù)學(xué)習(xí)的所述網(wǎng)絡(luò)入侵預(yù)測模型對目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)進(jìn)行分類,生成所述目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)的分類預(yù)測結(jié)果,包括:
38、對獲取的目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)集進(jìn)行編碼,生成所述目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)的入侵路徑編碼矢量;
39、將所述目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)的入侵路徑編碼矢量輸入到完成模型參數(shù)學(xué)習(xí)的所述網(wǎng)絡(luò)入侵預(yù)測模型中的每個(gè)所述風(fēng)險(xiǎn)加權(quán)預(yù)測樹,以使得每個(gè)所述風(fēng)險(xiǎn)加權(quán)預(yù)測樹均輸出網(wǎng)絡(luò)入侵分類數(shù)據(jù);
40、基于每個(gè)所述風(fēng)險(xiǎn)加權(quán)預(yù)測樹輸出的所述網(wǎng)絡(luò)入侵分類數(shù)據(jù),生成所述分類預(yù)測結(jié)果。
41、在第一方面的一種可能的實(shí)施方式中,所述網(wǎng)絡(luò)入侵分類數(shù)據(jù)包括所述目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)屬于不同所述網(wǎng)絡(luò)入侵類別的置信度,所述基于每個(gè)所述風(fēng)險(xiǎn)加權(quán)預(yù)測樹輸出的所述網(wǎng)絡(luò)入侵分類數(shù)據(jù),生成所述分類預(yù)測結(jié)果,包括:
42、計(jì)算每個(gè)所述網(wǎng)絡(luò)入侵類別的置信度大于預(yù)設(shè)置信度的所述網(wǎng)絡(luò)入侵分類數(shù)據(jù)的規(guī)模;
43、確定所述規(guī)模大于所述x的一半的所述網(wǎng)絡(luò)入侵類別為所述分類預(yù)測結(jié)果。
44、依據(jù)本技術(shù)的第二方面,提供一種數(shù)據(jù)中臺服務(wù)系統(tǒng),所述數(shù)據(jù)中臺服務(wù)系統(tǒng)包括處理器以及可讀存儲介質(zhì),所述可讀存儲介質(zhì)存儲有程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)前述的應(yīng)用于數(shù)據(jù)中臺構(gòu)建的數(shù)據(jù)處理方法。
45、依據(jù)本技術(shù)的第三方面,提供提供一種計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)中存儲有計(jì)算機(jī)可執(zhí)行指令,在監(jiān)測到所述計(jì)算機(jī)可執(zhí)行指令被執(zhí)行時(shí),實(shí)現(xiàn)前述的應(yīng)用于數(shù)據(jù)中臺構(gòu)建的數(shù)據(jù)處理方法。
46、依據(jù)以上任意一個(gè)方面,本技術(shù)實(shí)施例通過獲取兩種不同網(wǎng)絡(luò)入侵類別的模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列,并依據(jù)它們的模板配置規(guī)模進(jìn)行智能化處理,使得該方法能夠更全面、精準(zhǔn)地應(yīng)對各種網(wǎng)絡(luò)入侵情況,提升了數(shù)據(jù)中臺服務(wù)系統(tǒng)的安全防護(hù)能力。通過分割第一模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列,并基于規(guī)模比值確定抽取規(guī)模,實(shí)現(xiàn)了對數(shù)據(jù)的高效利用,優(yōu)化了數(shù)據(jù)處理流程,同時(shí)降低了計(jì)算復(fù)雜度,提高了處理速度。通過生成第三模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列,并與第二模板網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)序列結(jié)合生成樣例學(xué)習(xí)數(shù)據(jù)序列,保證了模型學(xué)習(xí)的全面性和準(zhǔn)確性,為后續(xù)的模型參數(shù)學(xué)習(xí)提供了優(yōu)質(zhì)的數(shù)據(jù)基礎(chǔ)。利用樣例學(xué)習(xí)數(shù)據(jù)序列對網(wǎng)絡(luò)入侵預(yù)測模型進(jìn)行模型參數(shù)學(xué)習(xí),使得模型能夠更準(zhǔn)確地預(yù)測和識別各種網(wǎng)絡(luò)入侵行為,從而增強(qiáng)了數(shù)據(jù)中臺服務(wù)系統(tǒng)的安全防護(hù)能力。通過對目標(biāo)網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)進(jìn)行分類,并基于分類預(yù)測結(jié)果對待構(gòu)建數(shù)據(jù)中臺進(jìn)行安全防護(hù)強(qiáng)化配置,實(shí)現(xiàn)了對待構(gòu)建數(shù)據(jù)中臺的個(gè)性化保護(hù),有效提升了數(shù)據(jù)中臺的安全性和穩(wěn)定性。由此,能夠顯著提升數(shù)據(jù)中臺服務(wù)系統(tǒng)的安全防護(hù)能力,優(yōu)化數(shù)據(jù)處理流程,提高處理速度,為數(shù)據(jù)中臺的安全穩(wěn)定運(yùn)行提供了保障。