特征屬性Xk出現(xiàn)的次數(shù),count(X)表示分類權(quán)限集集 合Xne3W中權(quán)限特征集的個(gè)數(shù),α表示不同權(quán)限特征屬性對(duì)分類的影響程度,且量化了權(quán)限特 征屬性與其類別屬性之間的關(guān)系,Xg為Android應(yīng)用程序的權(quán)限特征屬性集的集合,(^是 Android應(yīng)用程序的類別,S卩非惡意性應(yīng)用程序和惡意性應(yīng)用程序兩類,P(Xnew)對(duì)于所有類 為常數(shù),因此比較后驗(yàn)概率是只需要pUnewICOP^r最大即可判斷應(yīng)用程序是否具有惡意 性;
[0027 ] 對(duì)所得的具有惡意性的Andr0id應(yīng)用程序的權(quán)限特征集,對(duì)惡意性Andr0id應(yīng)用程 序進(jìn)行惡意性等級(jí)劃分,計(jì)算惡意性等級(jí)如下:
[0028]
[0029]
[0030]
[0031 ]其中,Pv表示該待測(cè)試樣本應(yīng)用程序在惡意性程序中出現(xiàn)的概率;Pm表示該待測(cè)試 樣本應(yīng)用程序在非惡意性程序中出現(xiàn)的概率;Pv(Xi)代表第i個(gè)權(quán)限特征集在惡意性程序中 出現(xiàn)的概率;PnUO代表第i個(gè)權(quán)限特征集在非惡意性程序中出現(xiàn)的概率。
[0032]本發(fā)明的有益效果在于:本發(fā)明通過(guò)對(duì)Android應(yīng)用程序樣本進(jìn)行反編譯得到其 所使用的相關(guān)權(quán)限,為了后面樸素貝葉斯模型的建立,本發(fā)明采用了偏相關(guān)系數(shù)對(duì)Android 應(yīng)用程序權(quán)限特征屬性進(jìn)行相關(guān)度分析,對(duì)權(quán)限特征屬性進(jìn)行降維預(yù)處理,然后利用互信 息和笛卡爾積方法對(duì)降維后的權(quán)限特征集進(jìn)行相關(guān)性聚類去冗余,得到新的分類權(quán)限特征 集,由于聚類后的權(quán)限集之間相關(guān)性很低,幾乎是相互獨(dú)立的關(guān)系,因此滿足了樸素貝葉斯 屬性相互獨(dú)立的條件,在此基礎(chǔ)上構(gòu)建樸素貝葉斯分類器,能使應(yīng)用程序分類決策相關(guān)性 高,另外對(duì)樸素貝葉斯所做改進(jìn)進(jìn)一步提高Android應(yīng)用程序惡意性的檢測(cè)率,在聚類過(guò)程 中設(shè)定閾值也可以避免過(guò)擬合的現(xiàn)象,對(duì)惡意性進(jìn)行等級(jí)劃分,這在實(shí)際應(yīng)用上提高了應(yīng) 用程序在安裝時(shí)的安全性,本發(fā)明用于未來(lái)Android應(yīng)用軟件安裝前的安全性檢測(cè),可以提 醒用戶應(yīng)用程序是否具有惡意性以及惡意性強(qiáng)度和等級(jí),這對(duì)應(yīng)用程序使用的安全性研究 具有深遠(yuǎn)的意義和廣闊的研究。
【附圖說(shuō)明】
[0033] 為了使本發(fā)明的目的、技術(shù)方案和有益效果更加清楚,本發(fā)明提供如下附圖進(jìn)行 說(shuō)明:
[0034] 圖1為本發(fā)明所述方法的流程示意圖;
[0035]圖2是對(duì)權(quán)限特征進(jìn)行降維預(yù)處理的示意圖;
[0036]圖3為對(duì)降維預(yù)處理后的權(quán)限特征聚類去冗余的示意圖。
【具體實(shí)施方式】
[0037]下面將結(jié)合附圖,對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)的描述。
[0038]圖1為本發(fā)明所述方法的流程示意圖,如圖所示,本發(fā)明所述的android應(yīng)用程序 惡意性的靜態(tài)檢測(cè)方法主要包括以下四個(gè)步驟:步驟一:收取并創(chuàng)建惡意性應(yīng)用程序和非 惡意性應(yīng)用程序的樣本庫(kù),分別對(duì)其APK樣本進(jìn)行反編譯處理得到AndroidManifest.xml文 件,然后提取該文件的權(quán)限特征,獲得權(quán)限特征集;步驟二:利用Android權(quán)限特征屬性變量 之間的相關(guān)性關(guān)系,其中任意兩個(gè)變量之間的相關(guān)性可能是由于第三個(gè)變量的存在所表現(xiàn) 出來(lái)的,對(duì)此提出一種基于偏相關(guān)系數(shù)對(duì)權(quán)限特征屬性進(jìn)行相關(guān)性分析的方法,對(duì)權(quán)限特 征集進(jìn)行降維預(yù)處理,該方法首先通過(guò)計(jì)算兩個(gè)權(quán)限特征屬性變量之間的簡(jiǎn)單相關(guān)系數(shù)
廣其中(:〇¥^^)是11與1」之間的協(xié)方差,.0_(灸濟(jì)續(xù)是11與1』之間的標(biāo) 準(zhǔn)差,將計(jì)算所得的簡(jiǎn)單相關(guān)系數(shù)做成相關(guān)系數(shù)矩陣R,計(jì)算|R|行列式中的代數(shù) 余子式Aii,Aij,Ajj,然后帶入特征權(quán)限屬性變量之間的偏相關(guān)系數(shù)
式進(jìn)行計(jì)算,根據(jù)得到的偏相關(guān)系數(shù)IP 的值判斷權(quán)限特征屬性之間的相關(guān)性大小,去除相關(guān)性低的權(quán)限特征屬性,得到降維預(yù)處 理后的權(quán)限特征集;步驟三:利用基于互信息理論和笛卡爾積方法,提出的一種基于互信息 和笛卡爾積的改進(jìn)的樸素貝葉斯分類模型方法,對(duì)權(quán)限特征集降維預(yù)處理后獲取的權(quán)限特 征集進(jìn)行聚類去冗余,(1)計(jì)算預(yù)處理后權(quán)限特征屬性變量Xi與類別變量C的相關(guān)度Cor(Xi,C),按從大到小的順序排列構(gòu)成原始屬性集X-ori; (2)計(jì)算X-ori中的第一個(gè)屬性變量X-〇ri(l)與其它屬性變量的相關(guān)度C〇r(X-〇ri(l),Xj); (3)對(duì)X-ori中除X-ori(l)之外的其它 變量Xj,若Cor(X-ori(1),Xj)>Cor(Xj,C),則認(rèn)為該變量與X-ori(1)高度相關(guān),將其加入父-〇ri(1)的相關(guān)集中;(4)X-ori(1)及其相關(guān)集中的前m個(gè)變量的笛卡爾積Xne3wl作為新屬性集 加入Xnew,同時(shí)從X-ori中刪除X-ori(1)及其相關(guān)集中的所有變量;(5)重復(fù)(2)-(4),直到 Λ'-oWi為止;步驟四:基于分類屬性集的集合Xnew構(gòu)建樸素貝葉斯分類器,通過(guò)樣本訓(xùn)練獲 得先驗(yàn)概率,然后用測(cè)試集樣本通過(guò)計(jì)算后驗(yàn)概率判斷所檢測(cè)的Android應(yīng)用程序是否具 有惡意性,對(duì)具有惡意性的Android應(yīng)用程序按概率方法進(jìn)行等級(jí)劃分。
[0039]在步驟一中,對(duì)收取并創(chuàng)建的惡意性應(yīng)用程序和非惡意性應(yīng)用程序的樣本庫(kù)分別 進(jìn)行反編譯處理得到Androi(Manifest.xml文件,提取其權(quán)限特征,獲得權(quán)限特征集;
[0040]圖2是對(duì)權(quán)限特征進(jìn)行降維預(yù)處理的示意圖,在步驟二中,該方法通過(guò)利用基于偏 相關(guān)系數(shù)對(duì)權(quán)限特征屬性變量之間的相關(guān)性關(guān)系進(jìn)行分析,對(duì)權(quán)限特征屬性進(jìn)行降維預(yù)處 理,分析權(quán)限特征屬性之間相關(guān)性的方法模型如下:
[0041]
[0042]
[0043]
[0044]
[0045]其中r(xi,xj)為簡(jiǎn)單相關(guān)系數(shù);Cov(Xi,Xj)是Xi與Xj之間的協(xié)方差;
之間的標(biāo)準(zhǔn)差;AiA'AB為由簡(jiǎn)單相關(guān)系數(shù)做成矩陣R的|R|行列式中以,陽(yáng),印的 代數(shù)余子式;M1嗔η階行列式|R|的余子式,即去掉η階行列式|R|中第i行第j列后剩下的n-1 階行列式即為Μ1 \通過(guò)計(jì)算兩個(gè)權(quán)限特征屬性變量之間的簡(jiǎn)單相關(guān)系數(shù)
?算所得的簡(jiǎn)單相關(guān)系數(shù)做成相關(guān)系數(shù)矩陣R,計(jì)算|R|行列式中ru, rii,ru的代數(shù)會(huì)子式A11 ,Aij ,Ajj,然后帶入特征權(quán)限屬性變量之間的偏相關(guān)系數(shù)
公式進(jìn)行計(jì)算,根據(jù)得到的偏相關(guān)系數(shù)IP 的值判斷權(quán)限特征屬性之間的相關(guān)性大小,去除相關(guān)性低的權(quán)限特征屬性,得到降維預(yù)處 理后的權(quán)限特征集。
[0046]圖3為對(duì)降維預(yù)處理后的權(quán)限特征聚類去冗余的示意圖,在步驟三中,利用基于互 信息理論和笛卡爾積方法,提出的一種基于互信息和笛卡爾積的改進(jìn)的樸素貝葉斯分類模 型方法,對(duì)權(quán)限特征集降維預(yù)處理后獲取的權(quán)限特征集進(jìn)行聚類去冗余,聚類去冗余模型 如下:
[0047]
[0048]
[0049] 其中Cor(Xi,C)表示權(quán)限特征屬性變量Xi和類別屬性變量C之間的相關(guān)度,Cor(Xi, Xj)表示權(quán)限特征屬性變量XdPh之間的相關(guān)度,計(jì)算方式如下:
[0050] 1)計(jì)算各權(quán)限特征屬性變量Xi與類別變量C的相關(guān)度Cor(Xi,C),按從大到小的順 序排列構(gòu)成原始屬性集Χ-ori;
[0051] 2)計(jì)算X-ori中的第一個(gè)屬性變量X-ori(l)與其它屬性變量的相關(guān)度Cor(X_ori (l),Xj);
[0052] 3)對(duì)X-ori中除X-ori(l)之外的其它變量Xj,若(:〇ΗΧ-〇Η(1),Χ」)>(:〇ΗΧ」,〇,則 認(rèn)為該變量與X-〇ri(1)高度相關(guān),將其加入X-ori(1)的相關(guān)集中;
[0053] 4)X_ori(l)及其相關(guān)集中的前m個(gè)變量的笛卡爾積Xnewl作為新屬性集加入Xnew,同 時(shí)從X-ori中刪除X-ori(1)及其相關(guān)集中的所有變量;
[0054] 5)重復(fù)(2)-(4),直到X-ori=0為止。