一種web網(wǎng)頁篡改識別方法及系統(tǒng)的制作方法

文檔序號：6597469閱讀：218來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種web網(wǎng)頁篡改識別方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及網(wǎng)絡(luò)安全領(lǐng)域，尤其涉及一種TOB網(wǎng)頁篡改識別方法及系統(tǒng)。
背景技術(shù)：
隨著互聯(lián)網(wǎng)應(yīng)用技術(shù)的不斷發(fā)展，網(wǎng)站已經(jīng)深入人們的生活，發(fā)揮著越來越重要的作用。外部網(wǎng)站因需要被公眾訪問而暴露于因特網(wǎng)上，容易成為黑客的攻擊目標(biāo)。雖然目前已有防火墻、入侵檢測等安全防范手段，但現(xiàn)代操作系統(tǒng)的復(fù)雜性和多樣性導(dǎo)致系統(tǒng) 漏洞層出不窮，防不勝防。黑客入侵和WEB頁面篡改的事件時有發(fā)生。目前TOB篡改模式主要有兩種主要形式WEB頁面被完全篡改(完全被新文件替換)和WEB頁面被部分篡改(WEB頁面大部分內(nèi)容沒有被修改，而其中部分圖片、文字內(nèi)容或者超鏈接被修改)。對于以上兩種類型的網(wǎng)頁篡改攻擊，經(jīng)過統(tǒng)計發(fā)現(xiàn)，第一種情況占絕大多數(shù)，而后者相對較少。并且從管理員角度而言，最擔(dān)心的篡改是第一種，因?yàn)檫@種篡改影響面最大。目前一般的TOB網(wǎng)頁防篡改技術(shù)方案，較多采用可靠的WEB服務(wù)器核心內(nèi)嵌式，其篡改檢測過程運(yùn)行于WEB服務(wù)器內(nèi)部，與TOB服務(wù)器無縫結(jié)合。WEB網(wǎng)頁正常發(fā)布時，為其計算出唯一的加密水印。每次網(wǎng)頁被瀏覽時，都對網(wǎng)頁進(jìn)行水印比對，實(shí)時地確保每個網(wǎng)頁的真實(shí)性。這種技術(shù)方案對每個網(wǎng)頁文件產(chǎn)生一個水印并保存在服務(wù)器上，每次公眾瀏覽該網(wǎng)頁時，服務(wù)器就進(jìn)行水印檢測，以判斷網(wǎng)頁是否被篡改。但是，經(jīng)過分析發(fā)現(xiàn)，目前較多采用的這種WEB頁面防篡改技術(shù)方案有以下不足(1)服務(wù)器上要保存所有網(wǎng)頁的水印，并且每次公眾瀏覽都要進(jìn)行水印檢測，對服務(wù)器的運(yùn)行帶來較大的負(fù)擔(dān)。(2)如果黑客將網(wǎng)頁及其水印一同篡改，則不能有效地檢測出來。(3)目前的技術(shù)方案還比較簡單，且部署網(wǎng)頁防篡改系統(tǒng)或產(chǎn)品需要改變現(xiàn)有的單服務(wù)器模式，增加額外的服務(wù)器，并改變服務(wù)器的架構(gòu)。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題，在于需要提供一種WEB網(wǎng)頁篡改識別方法及系統(tǒng)，以實(shí)現(xiàn)對WEB頁面的篡改識別。為了解決上述技術(shù)問題，本發(fā)明提供了一種TOB網(wǎng)頁篡改識別系統(tǒng)，包括網(wǎng)頁獲取模塊，用于獲取TOB頁面；模式提取模塊，與所述網(wǎng)頁獲取模塊相連，用于對所述WEB頁面進(jìn)行模式提取，生成所述WEB頁面的頁面模式；基線數(shù)據(jù)庫，用于保存WEB頁面比較基線；篡改識別模塊，與所述模式提取模塊及基線數(shù)據(jù)庫相連，用于根據(jù)所述TOB頁面比較基線對作為識別目標(biāo)的目標(biāo)WEB頁面的頁面模式進(jìn)行篡改識別，獲得識別結(jié)果。
優(yōu)選地，該系統(tǒng)進(jìn)一步包括基線建立模塊，與所述模式提取模塊及基線數(shù)據(jù)庫相連，用于根據(jù)未經(jīng)篡改的TOB 頁面的頁面模式，生成所述WEB頁面比較基線并保存到所述基線數(shù)據(jù)庫。優(yōu)選地，所述網(wǎng)頁獲取模塊包括地址接收子模塊，用于接收所述TOB頁面的頁面地址；頁面請求子模塊，與所述地址接收子模塊相連，用于根據(jù)所述頁面地址，向WEB服務(wù)器發(fā)出頁面請求，以獲取所述WEB頁面；響應(yīng)分析子模塊，用于從所述TOB服務(wù)器返回的頁面響應(yīng)中提取出所述TOB網(wǎng)頁。優(yōu)選地，所述模式提取模塊包括解析子模塊，與所述網(wǎng)頁獲取模塊相連，用于從所述TOB頁面中提取文檔對象模型樹；落葉樹生成子模塊，與所述解析子模塊相連，用于對所述文檔對象模型樹進(jìn)行刪葉處理，生成文檔對象模型落葉樹；序列化子模塊，與所述落葉樹生成子模塊相連，用于對所述文檔對象模型落葉樹進(jìn)行序列化，生成落葉樹節(jié)點(diǎn)序列；模式輸出子模塊，與所述序列化子模塊相連，用于將所述落葉樹節(jié)點(diǎn)序列作為所述WEB頁面的頁面模式進(jìn)行輸出。為了解決上述技術(shù)問題，本發(fā)明還提供了一種TOB網(wǎng)頁篡改識別方法，包括獲取WEB頁面；對所述WEB頁面進(jìn)行模式提取，生成所述WEB頁面的頁面模式；根據(jù)預(yù)存的TOB頁面比較基線對作為識別目標(biāo)的目標(biāo)WEB頁面的頁面模式進(jìn)行篡改識別，獲得識別結(jié)果。優(yōu)選地，該方法進(jìn)一步包括根據(jù)未經(jīng)篡改的TOB頁面的頁面模式，生成所述WEB頁面比較基線并保存。優(yōu)選地，獲取所述TOB頁面的步驟，包括接收所述TOB頁面的頁面地址；根據(jù)所述頁面地址，向TOB服務(wù)器發(fā)出頁面請求，以獲取該WEB頁面；從所述WEB服務(wù)器返回的頁面響應(yīng)中提取出所述WEB網(wǎng)頁。優(yōu)選地，所述WEB頁面的頁面地址，包括所述WEB頁面的IP地址或者域名。優(yōu)選地，對所述WEB頁面進(jìn)行模式提取，生成所述頁面模式的步驟，包括從所述WEB頁面中提取文檔對象模型樹；對所述文檔對象模型樹進(jìn)行刪葉處理，生成文檔對象模型落葉樹；對所述文檔對象模型落葉樹進(jìn)行序列化，生成落葉樹節(jié)點(diǎn)序列；將所述落葉樹節(jié)點(diǎn)序列作為所述TOB頁面的頁面模式。與現(xiàn)有技術(shù)相比，本發(fā)明技術(shù)方案在網(wǎng)頁服務(wù)器的外部進(jìn)行TOB網(wǎng)頁篡改檢測，克服了現(xiàn)有技術(shù)由服務(wù)器自己產(chǎn)生和驗(yàn)證頁面水印的技術(shù)缺陷，減小了服務(wù)器的負(fù)擔(dān)，提高了檢測效率，而且不會對頁面服務(wù)器產(chǎn)生任何影響，實(shí)現(xiàn)了 WEB頁面的篡改識別。而且，基于網(wǎng)絡(luò)技術(shù)，本發(fā)明技術(shù)方案實(shí)現(xiàn)了 WEB頁面篡改的遠(yuǎn)程檢測，不需要在客戶網(wǎng)站上安裝任何軟件，也不會向客戶網(wǎng)站發(fā)送有害探測包。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述，并且，部分地從說明書中變得顯而易見，或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。

附圖用來提供對本發(fā)明的進(jìn)一步理解，并且構(gòu)成說明書的一部分，與本發(fā)明的實(shí) 施例一起用于解釋本發(fā)明，并不構(gòu)成對本發(fā)明的限制。在附圖中圖1為本發(fā)明TOB網(wǎng)頁篡改識別系統(tǒng)實(shí)施例的結(jié)構(gòu)示意圖；圖2為圖1所示實(shí)施例中網(wǎng)頁獲取模塊的組成示意圖；圖3為圖1所示實(shí)施例中模式提取模塊的組成示意圖；圖4為本發(fā)明TOB網(wǎng)頁篡改識別方法實(shí)施例的流程示意圖；圖5為圖4所示方法實(shí)施例中步驟S410的流程示意圖；圖6為圖4所示方法實(shí)施例中步驟S420的流程示意圖；圖7為一種DOM樹示意圖；圖8為對應(yīng)于圖7所示DOM樹的DOM落葉樹示意圖。
具體實(shí)施例方式以下將結(jié)合附圖及實(shí)施例來詳細(xì)說明本發(fā)明的實(shí)施方式，借此對本發(fā)明如何應(yīng)用技術(shù)手段來解決技術(shù)問題，并達(dá)成技術(shù)效果的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。需要說明的是，如果不沖突，本發(fā)明實(shí)施例以及實(shí)施例中的各個特征可以相互結(jié) 合，均在本發(fā)明的保護(hù)范圍之內(nèi)。另外，在附圖的流程圖示出的步驟可以在諸如一組計算機(jī) 可執(zhí)行指令的計算機(jī)系統(tǒng)中執(zhí)行，并且，雖然在流程圖中示出了邏輯順序，但是在某些情況下，可以以不同于此處的順序執(zhí)行所示出或描述的步驟。圖1是本發(fā)明TOB網(wǎng)頁篡改識別系統(tǒng)實(shí)施例的結(jié)構(gòu)示意圖。如圖1所示，該系統(tǒng) 實(shí)施例主要包括網(wǎng)頁獲取模塊110、模式提取模塊120、基線建立模塊130、基線數(shù)據(jù)庫140 以及篡改識別模塊150，其中網(wǎng)頁獲取模塊110，用于獲取TOB頁面；模式提取模塊120，與該網(wǎng)頁獲取模塊110相連，用于對該網(wǎng)頁獲取模塊110獲取的TOB頁面進(jìn)行模式提取，生成該WEB頁面的頁面模式；基線建立模塊130，與該模式提取模塊120相連，對于正常的未經(jīng)篡改的TOB頁面，用于根據(jù)該模式提取模塊120生成的正常的未經(jīng)篡改的WEB頁面的頁面模式，生成WEB頁面比較基線；基線數(shù)據(jù)庫140，與該基線建立模塊130相連，用于保存由該基線建立模塊130建立的TOB頁面比較基線；篡改識別模塊150，與該模式提取模塊120及基線數(shù)據(jù)庫140相連，用于在進(jìn)行 WEB頁面的篡改識別時，根據(jù)基線數(shù)據(jù)庫140保存的TOB頁面比較基線對作為識別目標(biāo)的目標(biāo)TOB頁面的頁面模式進(jìn)行篡改識別，獲得識別結(jié)果。其中，該系統(tǒng)實(shí)施例在還未進(jìn)行篡改識別時，需要先根據(jù)正常的未經(jīng)篡改的WEB 頁面建立該基線數(shù)據(jù)庫140，然后才能用于篡改識別時對目標(biāo)TOB頁面進(jìn)行篡改識別。也即應(yīng)該在該基線數(shù)據(jù)庫140建立完成之后，才能進(jìn)行后續(xù)的目標(biāo)WEB頁面的篡改識別。當(dāng)然，如果該基線數(shù)據(jù)庫140預(yù)先存儲有WEB頁面比較基線，則可以直接對目標(biāo)WEB頁面進(jìn)行篡改識別，而不需要再重新生成WEB頁面比較基線。上述正常的未經(jīng)篡改的TOB頁面，可以在TOB服務(wù)器對外發(fā)布WEB頁面之前，以 TOB客戶端的方式，基于安全(如加密等)傳輸技術(shù)，通過統(tǒng)一資源定位器(URL)從TOB服務(wù)器處獲得。如此，還可以區(qū)別WEB頁面發(fā)布方的主動修改與外界對WEB頁面篡改行為。上述篡改識別模塊150在進(jìn)行篡改識別時，如果在基線數(shù)據(jù)庫140中檢索到存在有與目標(biāo)TOB頁面的頁面模式相同的WEB頁面比較基線，則認(rèn)為該目標(biāo)WEB頁面未經(jīng)篡改，否則認(rèn)為該目標(biāo)WEB頁面已經(jīng)被篡改。圖2為圖1所示實(shí)施例中網(wǎng)頁獲取模塊110的組成示意圖。如圖2所示，該網(wǎng)頁獲取模塊110主要包括地址接收子模塊210、頁面請求子模塊220、響應(yīng)分析子模塊230以及網(wǎng)頁輸出子模塊對0，其中地址接收子模塊210，用于接收外部輸入的TOB頁面的頁面地址，該頁面地址可以是TOB頁面的IP地址，也可以是TOB頁面的域名；頁面請求子模塊220，與該地址接收子模塊210相連，用于根據(jù)地址接收子模塊 210接收的頁面地址，向TOB服務(wù)器發(fā)出頁面請求以獲取該WEB頁面，該請求的格式可以與瀏覽器向服務(wù)器發(fā)出的頁面請求格式相同；響應(yīng)分析子模塊230，用于接收從TOB服務(wù)器返回的頁面響應(yīng)，并從該頁面響應(yīng)中提取出HTML格式的TOB網(wǎng)頁；該響應(yīng)信息可以是一個正常的服務(wù)器對瀏覽器請求的響應(yīng)消息；網(wǎng)頁輸出子模塊M0，與該響應(yīng)分析子模塊230及模式提取模塊120相連，用于將響應(yīng)分析子模塊230提取的TOB頁面發(fā)送給模式提取模塊120。圖3為圖1所示實(shí)施例中模式提取模塊120的組成示意圖。如圖3所示，該模式提取模塊120主要包括解析子模塊310、落葉樹生成子模塊320、序列化子模塊330以及模式輸出子模塊；340，其中解析子模塊310，與該網(wǎng)頁獲取模塊110相連，用于對HTML格式的TOB頁面進(jìn)行文檔對象模型(DOM)解析，從HTML格式的TOB頁面中提取出DOM樹；一種具體的提取方式是使用開源HTML解析器(如HTMLXX)來實(shí)現(xiàn)；落葉樹生成子模塊320，與該解析子模塊310相連，用于對DOM樹進(jìn)行刪葉處理，刪除該解析子模塊310提取出的DOM樹中的葉節(jié)點(diǎn)，生成DOM落葉樹；序列化子模塊330，與該落葉樹生成子模塊320相連，用于對該DOM落葉樹進(jìn)行序列化，將該落葉樹生成子模塊320生成的DOM落葉樹轉(zhuǎn)化成落葉樹節(jié)點(diǎn)序列；模式輸出子模塊340，與該序列化子模塊330相連，用于將序列化子模塊330轉(zhuǎn)化獲得的落葉樹節(jié)點(diǎn)序列作為該WEB頁面的頁面模式進(jìn)行輸出。圖4是本發(fā)明TOB網(wǎng)頁篡改識別方法實(shí)施例的流程示意圖。結(jié)合圖1至圖3所示的系統(tǒng)實(shí)施例，圖4所示的該方法實(shí)施例，主要包括如下步驟步驟S410，獲取TOB頁面；步驟S420，對獲取的TOB頁面進(jìn)行模式提取，生成該WEB頁面的頁面模式；步驟S430，根據(jù)正常的未經(jīng)篡改的TOB頁面的頁面模式，生成TOB頁面比較基線并保存；步驟S440，根據(jù)保存的TOB頁面比較基線，對作為識別目標(biāo)的目標(biāo)W^頁面的頁面模式進(jìn)行篡改識別，獲得識別結(jié)果。其中，該方法實(shí)施例在還未進(jìn)行TOB頁面的篡改識別時，需要先根據(jù)正常的未經(jīng) 篡改的WEB頁面保存TOB頁面比較基線，然后再進(jìn)行對目標(biāo)WEB頁面的篡改識別。當(dāng)然，如果在進(jìn)行篡改識別之前就預(yù)先保存有WEB頁面比較基線，則可以直接對目標(biāo)WEB頁面進(jìn)行篡改識別，而不需要再重新生成WEB頁面比較基線。上述篡改識別過程中，如果檢索到存在有與目標(biāo)TOB頁面的頁面模式相同的WEB 頁面比較基線，則認(rèn)為該目標(biāo)WEB頁面未經(jīng)篡改，否則認(rèn)為該目標(biāo)WEB頁面已經(jīng)被篡改。圖5是圖4所示方法實(shí)施例中步驟S410的流程示意圖。結(jié)合圖1至圖3所示的系統(tǒng)實(shí)施例，該步驟S410的流程主要包括如下步驟步驟S510，接收外部輸入的TOB頁面的頁面地址；該頁面地址可以是WEB頁面的 IP地址，也可以是WEB頁面的域名；步驟S520，根據(jù)接收的該頁面地址，向TOB服務(wù)器發(fā)出頁面請求，以獲取該WEB頁面，該請求的格式可以與瀏覽器向服務(wù)器發(fā)出的頁面請求格式相同；步驟S530，接收從TOB服務(wù)器返回的頁面響應(yīng)，并從該頁面響應(yīng)中提取出HTML格式的TOB網(wǎng)頁；該響應(yīng)信息可以是一個正常的服務(wù)器對瀏覽器請求的響應(yīng)消息。圖6是圖4所示方法實(shí)施例中步驟S420的流程示意圖。結(jié)合圖1至圖3所示的系統(tǒng)實(shí)施例，該步驟S420的流程主要包括如下步驟步驟S610，對HTML格式的TOB頁面進(jìn)行DOM解析，從HTML格式的TOB頁面中提取出DOM樹；一種具體的提取方式是使用開源HTML解析器(如HTMLXX)來實(shí)現(xiàn)；比如，某一個頁面文檔的內(nèi)容如下<HTML><head><title>D0M Example</title></head><body><hl>D0M Example 0ne</hl>
This Page is a Example of DOM 丨 </p></body></HTML>從該頁面文檔提取出的DOM樹如圖7所示；步驟S620，對DOM樹進(jìn)行刪葉處理，刪除所提取出的DOM樹中的葉節(jié)點(diǎn)，生成DOM 落葉樹；比如，對生成的DOM樹進(jìn)行先序遍歷，若發(fā)現(xiàn)一個節(jié)點(diǎn)是葉節(jié)點(diǎn)，則將其刪除；圖7 所示的DOM樹，其對應(yīng)的DOM落葉樹如圖8所示；步驟S630，對該DOM落葉樹進(jìn)行序列化，將該DOM落葉樹轉(zhuǎn)化成落葉樹節(jié)點(diǎn)序列，將該落葉樹節(jié)點(diǎn)作為該WEB頁面的頁面模式；比如，一種序列化的方法是，對DOM樹進(jìn)行先序遍歷，然后即可得到該樹的一個節(jié)
8點(diǎn)序列；為便于比較，在節(jié)點(diǎn)序列中，每個節(jié)點(diǎn)用一個三元組(節(jié)點(diǎn)名稱，節(jié)點(diǎn)類型，節(jié)點(diǎn) 值)來表示，這樣得到的頁面模式就是一個三元組序列；比如圖8所示的DOM落葉樹，其節(jié)點(diǎn)名稱和值均為空，序列化后的得到的落葉樹節(jié)點(diǎn)序列為(，<HTML>, ) (，<head>,)(， <title>，) (，<body>, ) (，<hl>, ) (，
，)。對應(yīng)于圖8所示的DOM落葉樹，上述步驟S440識別到目標(biāo)TOB頁面的頁面模式 (三元組序列)與WEB頁面比較基線(三元組序列)相同，則認(rèn)為該目標(biāo)WEB頁面未經(jīng)篡改，否則認(rèn)為該目標(biāo)WEB頁面已經(jīng)被篡改。需要說明的是，在附圖的流程圖示出的步驟可以在諸如一組計算機(jī)可執(zhí)行指令的計算機(jī)系統(tǒng)中執(zhí)行，并且，雖然在流程圖中示出了邏輯順序，但是在某些情況下，可以以不同于此處的順序執(zhí)行所示出或描述的步驟。另外，本領(lǐng)域的技術(shù)人員應(yīng)該明白，上述的本發(fā) 明的各模塊或各步驟可以用通用的計算裝置來實(shí)現(xiàn)，它們可以集中在單個的計算裝置上，或者分布在多個計算裝置所組成的網(wǎng)絡(luò)上，可選地，它們可以用計算裝置可執(zhí)行的程序代碼來實(shí)現(xiàn)，從而，可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行，或者將它們分別制作成各個集成電路模塊，或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實(shí)現(xiàn)。這樣，本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。雖然本發(fā)明所揭露的實(shí)施方式如上，但所述的內(nèi)容只是為了便于理解本發(fā)明而采用的實(shí)施方式，并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員，在不脫離本發(fā)明所揭露的精神和范圍的前提下，可以在實(shí)施的形式上及細(xì)節(jié)上作任何的修改與變化，但本發(fā)明的專利保護(hù)范圍，仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。
權(quán)利要求
1.一種WEB網(wǎng)頁篡改識別系統(tǒng)，其特征在于，包括網(wǎng)頁獲取模塊，用于獲取WEB頁面；模式提取模塊，與所述網(wǎng)頁獲取模塊相連，用于對所述WEB頁面進(jìn)行模式提取，生成所述TOB頁面的頁面模式；基線數(shù)據(jù)庫，用于保存WEB頁面比較基線；篡改識別模塊，與所述模式提取模塊及基線數(shù)據(jù)庫相連，用于根據(jù)所述WEB頁面比較基線對作為識別目標(biāo)的目標(biāo)WEB頁面的頁面模式進(jìn)行篡改識別，獲得識別結(jié)果。
2.如權(quán)利要求1所述的系統(tǒng)，其特征在于，該系統(tǒng)進(jìn)一步包括基線建立模塊，與所述模式提取模塊及基線數(shù)據(jù)庫相連，用于根據(jù)未經(jīng)篡改的WEB頁面的頁面模式，生成所述WEB頁面比較基線并保存到所述基線數(shù)據(jù)庫。
3.如權(quán)利要求1或2所述的系統(tǒng)，其特征在于，所述網(wǎng)頁獲取模塊包括地址接收子模塊，用于接收所述WEB頁面的頁面地址；頁面請求子模塊，與所述地址接收子模塊相連，用于根據(jù)所述頁面地址，向WEB服務(wù)器發(fā)出頁面請求，以獲取所述WEB頁面；響應(yīng)分析子模塊，用于從所述WEB服務(wù)器返回的頁面響應(yīng)中提取出所述WEB網(wǎng)頁。
4.如權(quán)利要求1或2所述的系統(tǒng)，其特征在于，所述模式提取模塊包括解析子模塊，與所述網(wǎng)頁獲取模塊相連，用于從所述WEB頁面中提取文檔對象模型樹；落葉樹生成子模塊，與所述解析子模塊相連，用于對所述文檔對象模型樹進(jìn)行刪葉處理，生成文檔對象模型落葉樹；序列化子模塊，與所述落葉樹生成子模塊相連，用于對所述文檔對象模型落葉樹進(jìn)行序列化，生成落葉樹節(jié)點(diǎn)序列；模式輸出子模塊，與所述序列化子模塊相連，用于將所述落葉樹節(jié)點(diǎn)序列作為所述WEB 頁面的頁面模式進(jìn)行輸出。
5.一種WEB網(wǎng)頁篡改識別方法，其特征在于，包括獲取TOB頁面；對所述WEB頁面進(jìn)行模式提取，生成所述WEB頁面的頁面模式；根據(jù)預(yù)存的WEB頁面比較基線對作為識別目標(biāo)的目標(biāo)TOB頁面的頁面模式進(jìn)行篡改識別，獲得識別結(jié)果。
6.如權(quán)利要求5所述的方法，其特征在于，該方法進(jìn)一步包括根據(jù)未經(jīng)篡改的WEB頁面的頁面模式，生成所述WEB頁面比較基線并保存。
7.如權(quán)利要求5或6所述的方法，其特征在于，獲取所述WEB頁面的步驟，包括接收所述WEB頁面的頁面地址；根據(jù)所述頁面地址，向WEB服務(wù)器發(fā)出頁面請求，以獲取該WEB頁面；從所述WEB服務(wù)器返回的頁面響應(yīng)中提取出所述TOB網(wǎng)頁。
8.如權(quán)利要求7所述的方法，其特征在于所述WEB頁面的頁面地址，包括所述WEB頁面的IP地址或者域名。
9.如權(quán)利要求5或6所述的方法，其特征在于，對所述WEB頁面進(jìn)行模式提取，生成所述頁面模式的步驟，包括從所述WEB頁面中提取文檔對象模型樹；對所述文檔對象模型樹進(jìn)行刪葉處理，生成文檔對象模型落葉樹；對所述文檔對象模型落葉樹進(jìn)行序列化，生成落葉樹節(jié)點(diǎn)序列；將所述落葉樹節(jié)點(diǎn)序列作為所述WEB頁面的頁面模式。
全文摘要
本發(fā)明公開了一種WEB網(wǎng)頁篡改識別方法及系統(tǒng)，以實(shí)現(xiàn)對WEB頁面的篡改識別，其中該系統(tǒng)包括網(wǎng)頁獲取模塊，用于獲取WEB頁面；模式提取模塊，與網(wǎng)頁獲取模塊相連，用于對WEB頁面進(jìn)行模式提取，生成WEB頁面的頁面模式；基線數(shù)據(jù)庫，用于保存WEB頁面比較基線；篡改識別模塊，與模式提取模塊及基線數(shù)據(jù)庫相連，用于根據(jù)WEB頁面比較基線對作為識別目標(biāo)的目標(biāo)WEB頁面的頁面模式進(jìn)行篡改識別，獲得識別結(jié)果。與現(xiàn)有技術(shù)相比，本發(fā)明技術(shù)方案在網(wǎng)頁服務(wù)器的外部進(jìn)行WEB網(wǎng)頁篡改檢測，提高了檢測效率，實(shí)現(xiàn)了WEB頁面的篡改識別。
文檔編號G06F17/30GK102129528SQ20101003427
公開日2011年7月20日申請日期2010年1月19日優(yōu)先權(quán)日2010年1月19日
發(fā)明者葉潤國, 周濤, 孫海波, 胡振宇, 黃宇鴻申請人:北京啟明星辰信息安全技術(shù)有限公司, 北京啟明星辰信息技術(shù)股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：胡振宇;孫海波;周濤;葉潤國;黃宇鴻
技術(shù)所有人：北京啟明星辰信息技術(shù)股份有限公司;北京啟明星辰信息安全技術(shù)有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

網(wǎng)頁防篡改系統(tǒng)相關(guān)技術(shù)

網(wǎng)頁防篡改系統(tǒng)排名相關(guān)技術(shù)

iguard網(wǎng)頁防篡改系統(tǒng)相關(guān)技術(shù)

網(wǎng)頁防篡改系統(tǒng)報價相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種web網(wǎng)頁篡改識別方法及系統(tǒng)的制作方法