基于支持向量機(jī)的入侵檢測(cè)方法
【專利摘要】本發(fā)明屬于模式識(shí)別領(lǐng)域,提供了一種基于支持向量機(jī)的入侵檢測(cè)方法,包括如下步驟,數(shù)據(jù)預(yù)處理,對(duì)數(shù)據(jù)進(jìn)行特征加權(quán),對(duì)數(shù)據(jù)進(jìn)行特征提取,利用改進(jìn)的SVM進(jìn)行入侵檢測(cè)。本發(fā)明降低了次要因素對(duì)分類性能的影響,降低了維數(shù)和縮減數(shù)據(jù)冗余信息,減少了運(yùn)算量,提高了支持向量機(jī)的分類性能和入侵檢測(cè)精度。
【專利說明】基于支持向量機(jī)的入侵檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及模式識(shí)別領(lǐng)域,尤其涉及入侵檢測(cè)領(lǐng)域。
【背景技術(shù)】
[0002]入侵檢測(cè)本質(zhì)上是個(gè)分類問題,屬于模式識(shí)別的范疇。目前為止,各種技術(shù)諸如數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、數(shù)據(jù)融合和神經(jīng)網(wǎng)絡(luò)等都在入侵檢測(cè)工作中取得了可觀的成果,而支持向量機(jī)(Support Vector Machine,簡(jiǎn)稱SVM)作為一種新興的機(jī)器學(xué)習(xí)方法也取得了一定的成績(jī)。傳統(tǒng)SVM在入侵檢測(cè)中的應(yīng)用,雖說在檢測(cè)精度以及效率上有所提高,但是入侵檢測(cè)數(shù)據(jù)數(shù)據(jù)量大,維數(shù)多,導(dǎo)致核矩陣的計(jì)算量大,同時(shí)一些次要因素會(huì)影響其最優(yōu)分類面的選擇,因此,傳統(tǒng)的SVM還存在著應(yīng)用上的缺陷。比如,不能解決入侵檢測(cè)原始數(shù)據(jù)量大,且具有高維性,冗余性所導(dǎo)致的運(yùn)算量大,訓(xùn)練時(shí)間長(zhǎng)的問題,未對(duì)SVM的參數(shù)進(jìn)行優(yōu)化。
【發(fā)明內(nèi)容】
[0003]本發(fā)明針對(duì)上述現(xiàn)有技術(shù)存在的問題作出改進(jìn),即本發(fā)明要解決的技術(shù)問題是提供一種基于支持向量機(jī)的入侵檢測(cè)方法,這種基于支持向量機(jī)的入侵檢測(cè)方法降低了次要因素對(duì)分類性能的影響;降低了維數(shù)和縮減數(shù)據(jù)冗余信息,較少了運(yùn)算量;提高了支持向量機(jī)的分類性能,提高了入侵檢測(cè)的實(shí)時(shí)性和入侵檢測(cè)精度。
[0004]為了解決上述技術(shù)問題,本發(fā)明提供了如下的技術(shù)方案:
[0005]一種基于支持向量機(jī)的入侵檢測(cè)方法,包括如下步驟:
[0006]S1.數(shù)據(jù)預(yù)處理,對(duì)于捕獲的網(wǎng)絡(luò)數(shù)據(jù)流進(jìn)行預(yù)處理,即將字符變量轉(zhuǎn)化為數(shù)字變量,所有字符屬性對(duì)應(yīng)一張數(shù)值字典;
[0007]S2.對(duì)數(shù)據(jù)進(jìn)行特征加權(quán),將所有的41個(gè)特征分成3個(gè)集合進(jìn)行特征加權(quán),降低次要因素對(duì)分類結(jié)果的影響;
[0008]S3.對(duì)數(shù)據(jù)進(jìn)行特征提取,對(duì)特征加權(quán)過得數(shù)據(jù)利用核主成分分析進(jìn)行特征提取,降低數(shù)據(jù)的維數(shù)和冗余信息,減少計(jì)算量,提取完的數(shù)據(jù)作為SVM的輸入向量;
[0009]S4.利用SVM進(jìn)行入侵檢測(cè),使用組合核函數(shù)作為SVM的內(nèi)部核函數(shù),同時(shí)利用遺傳算法對(duì)核函數(shù)參數(shù)及組合核函數(shù)的加權(quán)系數(shù)進(jìn)行尋優(yōu),以此來提高SVM的分類性能。
[0010]其中,在對(duì)數(shù)據(jù)進(jìn)行特征加權(quán)中,對(duì)訓(xùn)練數(shù)據(jù)的部分特征的值的加權(quán)變換轉(zhuǎn)換為對(duì)最優(yōu)分類面的權(quán)值向量w的加權(quán);當(dāng)使用核函數(shù)時(shí),考慮到可能的高維特征空間中含指數(shù)形式,選權(quán)值的形式為2k,k > O。
[0011]進(jìn)一步的,在對(duì)數(shù)據(jù)進(jìn)行特征加權(quán)時(shí),所述的3個(gè)集合分別是:
[0012]對(duì)正常數(shù)據(jù)影響較大的特征集:
[0013]A1 = {10,17,25,26,27,28,29,38}
[0014]對(duì)異常數(shù)據(jù)影響較大的特征集:
[0015]A2 = {I, 3,5,6,23,24,32,33,36,39}
[0016]對(duì)以上兩類影響不大的特征集:[0017]A0 = {2,4,7,8,9,11,12,13,14,15,16,18,19,20,21,22,30,31,34,35,37,40,41}
[0018]定義論域X = (Xi I i e Z, I≤i≤41},其中Xi表示第i維特征。X對(duì)分類結(jié)果影響程度定義模糊集合A,其隸屬函數(shù)表示為:
【權(quán)利要求】
1.一種基于支持向量機(jī)的入侵檢測(cè)方法,其特征在于: S1.數(shù)據(jù)預(yù)處理,對(duì)于捕獲的網(wǎng)絡(luò)數(shù)據(jù)流進(jìn)行預(yù)處理,將字符變量轉(zhuǎn)化為數(shù)字變量,所有字符屬性對(duì)應(yīng)一張數(shù)值字典; S2.對(duì)數(shù)據(jù)進(jìn)行特征加權(quán),將數(shù)據(jù)樣本分為兩類:正常數(shù)據(jù)和異常數(shù)據(jù),并將所有的41個(gè)特征分成3個(gè)集合; S3.對(duì)數(shù)據(jù)進(jìn)行特征提取,對(duì)特征加權(quán)過得數(shù)據(jù)利用核主成分分析進(jìn)行特征提取,提取完的數(shù)據(jù)作為SVM的輸入向量; S4.利用SVM進(jìn)行入侵檢測(cè),對(duì)SVM中的核函數(shù)進(jìn)行優(yōu)化,將兩個(gè)核函數(shù)進(jìn)行線性加權(quán)形成組合核函數(shù),同時(shí)利用遺傳算法對(duì)核函數(shù)參數(shù)及兩個(gè)核函數(shù)組合的加權(quán)系數(shù)進(jìn)行優(yōu)化。
2.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)的入侵檢測(cè)方法,其特征在于:在對(duì)數(shù)據(jù)進(jìn)行特征加權(quán)中,對(duì)訓(xùn)練數(shù)據(jù)的部分特征的值的加權(quán)變換轉(zhuǎn)換為對(duì)最優(yōu)分類面的權(quán)值向量w的加權(quán);當(dāng)使用核函數(shù)時(shí),考慮到可能的高維特征空間中含指數(shù)形式,選權(quán)值的形式為2k,k> O。
3.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)的入侵檢測(cè)方法,其特征在于:在對(duì)數(shù)據(jù)進(jìn)行特征加權(quán)時(shí),所述的3個(gè)集合分別是: 對(duì)正常數(shù)據(jù)影響較大的特征集:
A1 = {10,17,25,26,27,28,29,38} 對(duì)異常數(shù)據(jù)影響較大的特征集:
A2 = {I, 3,5,6,23,24,32,33,36,39} 對(duì)以上兩類影響不大的特征集:
A0 = {2,4,7,8,9,11,12,13,14,15,16,18,19,20,21,22,30,31,34,35,37,40,41} 定義論域X= (Xi I i e Z, I≤i≤41},其中Xi表示第i維特征;X對(duì)分類結(jié)果影響程度定義模糊集合A,其隸屬函數(shù)表示為:
4.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)的入侵檢測(cè)方法,其特征在于:SVM進(jìn)行入侵檢測(cè)的過程為,若處于SVM訓(xùn)練狀態(tài),則訓(xùn)練SVM,并將訓(xùn)練后的結(jié)果即若干個(gè)支持向量存入SVM支持向量庫;若處于SVM預(yù)測(cè)狀態(tài),則由SVM預(yù)測(cè)模塊對(duì)輸入向量進(jìn)行預(yù)測(cè)。
5.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)的入侵檢測(cè)方法,其特征在于:選用Poly核函數(shù)和RBF核函數(shù)進(jìn)行組合,形成的組合核函數(shù)為:
PoIy+RBF:
K (X,Xi) = α [ (X.Xi) +l]q+(l-α ) exp (-1 | X-Xi \\2/ ο2)式中,權(quán)系數(shù)α (O < α < I)調(diào)節(jié)兩種核函數(shù)。
【文檔編號(hào)】H04L12/26GK104009886SQ201410223413
【公開日】2014年8月27日 申請(qǐng)日期:2014年5月23日 優(yōu)先權(quán)日:2014年5月23日
【發(fā)明者】陳桂林, 王生光, 徐靜妹, 李雷 申請(qǐng)人:南京郵電大學(xué)