国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種web網(wǎng)頁篡改識別方法及系統(tǒng)的制作方法

      文檔序號:6597469閱讀:218來源:國知局
      專利名稱:一種web網(wǎng)頁篡改識別方法及系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及網(wǎng)絡(luò)安全領(lǐng)域,尤其涉及一種TOB網(wǎng)頁篡改識別方法及系統(tǒng)。
      背景技術(shù)
      隨著互聯(lián)網(wǎng)應(yīng)用技術(shù)的不斷發(fā)展,網(wǎng)站已經(jīng)深入人們的生活,發(fā)揮著越來越重要 的作用。外部網(wǎng)站因需要被公眾訪問而暴露于因特網(wǎng)上,容易成為黑客的攻擊目標(biāo)。雖然 目前已有防火墻、入侵檢測等安全防范手段,但現(xiàn)代操作系統(tǒng)的復(fù)雜性和多樣性導(dǎo)致系統(tǒng) 漏洞層出不窮,防不勝防。黑客入侵和WEB頁面篡改的事件時有發(fā)生。目前TOB篡改模式主要有兩種主要形式WEB頁面被完全篡改(完全被新文件替 換)和WEB頁面被部分篡改(WEB頁面大部分內(nèi)容沒有被修改,而其中部分圖片、文字內(nèi)容 或者超鏈接被修改)。對于以上兩種類型的網(wǎng)頁篡改攻擊,經(jīng)過統(tǒng)計發(fā)現(xiàn),第一種情況占絕大多數(shù),而后 者相對較少。并且從管理員角度而言,最擔(dān)心的篡改是第一種,因?yàn)檫@種篡改影響面最大。目前一般的TOB網(wǎng)頁防篡改技術(shù)方案,較多采用可靠的WEB服務(wù)器核心內(nèi)嵌式,其 篡改檢測過程運(yùn)行于WEB服務(wù)器內(nèi)部,與TOB服務(wù)器無縫結(jié)合。WEB網(wǎng)頁正常發(fā)布時,為其 計算出唯一的加密水印。每次網(wǎng)頁被瀏覽時,都對網(wǎng)頁進(jìn)行水印比對,實(shí)時地確保每個網(wǎng)頁 的真實(shí)性。這種技術(shù)方案對每個網(wǎng)頁文件產(chǎn)生一個水印并保存在服務(wù)器上,每次公眾瀏覽 該網(wǎng)頁時,服務(wù)器就進(jìn)行水印檢測,以判斷網(wǎng)頁是否被篡改。但是,經(jīng)過分析發(fā)現(xiàn),目前較多采用的這種WEB頁面防篡改技術(shù)方案有以下不足(1)服務(wù)器上要保存所有網(wǎng)頁的水印,并且每次公眾瀏覽都要進(jìn)行水印檢測,對服 務(wù)器的運(yùn)行帶來較大的負(fù)擔(dān)。(2)如果黑客將網(wǎng)頁及其水印一同篡改,則不能有效地檢測出來。(3)目前的技術(shù)方案還比較簡單,且部署網(wǎng)頁防篡改系統(tǒng)或產(chǎn)品需要改變現(xiàn)有的 單服務(wù)器模式,增加額外的服務(wù)器,并改變服務(wù)器的架構(gòu)。

      發(fā)明內(nèi)容
      本發(fā)明所要解決的技術(shù)問題,在于需要提供一種WEB網(wǎng)頁篡改識別方法及系統(tǒng), 以實(shí)現(xiàn)對WEB頁面的篡改識別。為了解決上述技術(shù)問題,本發(fā)明提供了一種TOB網(wǎng)頁篡改識別系統(tǒng),包括網(wǎng)頁獲取模塊,用于獲取TOB頁面;模式提取模塊,與所述網(wǎng)頁獲取模塊相連,用于對所述WEB頁面進(jìn)行模式提取,生 成所述WEB頁面的頁面模式;基線數(shù)據(jù)庫,用于保存WEB頁面比較基線;篡改識別模塊,與所述模式提取模塊及基線數(shù)據(jù)庫相連,用于根據(jù)所述TOB頁面 比較基線對作為識別目標(biāo)的目標(biāo)WEB頁面的頁面模式進(jìn)行篡改識別,獲得識別結(jié)果。
      優(yōu)選地,該系統(tǒng)進(jìn)一步包括基線建立模塊,與所述模式提取模塊及基線數(shù)據(jù)庫相連,用于根據(jù)未經(jīng)篡改的TOB 頁面的頁面模式,生成所述WEB頁面比較基線并保存到所述基線數(shù)據(jù)庫。優(yōu)選地,所述網(wǎng)頁獲取模塊包括地址接收子模塊,用于接收所述TOB頁面的頁面地址;頁面請求子模塊,與所述地址接收子模塊相連,用于根據(jù)所述頁面地址,向WEB服 務(wù)器發(fā)出頁面請求,以獲取所述WEB頁面;響應(yīng)分析子模塊,用于從所述TOB服務(wù)器返回的頁面響應(yīng)中提取出所述TOB網(wǎng)頁。優(yōu)選地,所述模式提取模塊包括解析子模塊,與所述網(wǎng)頁獲取模塊相連,用于從所述TOB頁面中提取文檔對象模 型樹;落葉樹生成子模塊,與所述解析子模塊相連,用于對所述文檔對象模型樹進(jìn)行刪 葉處理,生成文檔對象模型落葉樹;序列化子模塊,與所述落葉樹生成子模塊相連,用于對所述文檔對象模型落葉樹 進(jìn)行序列化,生成落葉樹節(jié)點(diǎn)序列;模式輸出子模塊,與所述序列化子模塊相連,用于將所述落葉樹節(jié)點(diǎn)序列作為所 述WEB頁面的頁面模式進(jìn)行輸出。為了解決上述技術(shù)問題,本發(fā)明還提供了一種TOB網(wǎng)頁篡改識別方法,包括獲取WEB頁面;對所述WEB頁面進(jìn)行模式提取,生成所述WEB頁面的頁面模式;根據(jù)預(yù)存的TOB頁面比較基線對作為識別目標(biāo)的目標(biāo)WEB頁面的頁面模式進(jìn)行篡 改識別,獲得識別結(jié)果。優(yōu)選地,該方法進(jìn)一步包括根據(jù)未經(jīng)篡改的TOB頁面的頁面模式,生成所述WEB頁面比較基線并保存。優(yōu)選地,獲取所述TOB頁面的步驟,包括接收所述TOB頁面的頁面地址;根據(jù)所述頁面地址,向TOB服務(wù)器發(fā)出頁面請求,以獲取該WEB頁面;從所述WEB服務(wù)器返回的頁面響應(yīng)中提取出所述WEB網(wǎng)頁。優(yōu)選地,所述WEB頁面的頁面地址,包括所述WEB頁面的IP地址或者域名。優(yōu)選地,對所述WEB頁面進(jìn)行模式提取,生成所述頁面模式的步驟,包括從所述WEB頁面中提取文檔對象模型樹;對所述文檔對象模型樹進(jìn)行刪葉處理,生成文檔對象模型落葉樹;對所述文檔對象模型落葉樹進(jìn)行序列化,生成落葉樹節(jié)點(diǎn)序列;將所述落葉樹節(jié)點(diǎn)序列作為所述TOB頁面的頁面模式。與現(xiàn)有技術(shù)相比,本發(fā)明技術(shù)方案在網(wǎng)頁服務(wù)器的外部進(jìn)行TOB網(wǎng)頁篡改檢測, 克服了現(xiàn)有技術(shù)由服務(wù)器自己產(chǎn)生和驗(yàn)證頁面水印的技術(shù)缺陷,減小了服務(wù)器的負(fù)擔(dān),提 高了檢測效率,而且不會對頁面服務(wù)器產(chǎn)生任何影響,實(shí)現(xiàn)了 WEB頁面的篡改識別。而且, 基于網(wǎng)絡(luò)技術(shù),本發(fā)明技術(shù)方案實(shí)現(xiàn)了 WEB頁面篡改的遠(yuǎn)程檢測,不需要在客戶網(wǎng)站上安 裝任何軟件,也不會向客戶網(wǎng)站發(fā)送有害探測包。
      本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變 得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在說明書、權(quán)利 要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。


      附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實(shí) 施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中圖1為本發(fā)明TOB網(wǎng)頁篡改識別系統(tǒng)實(shí)施例的結(jié)構(gòu)示意圖;圖2為圖1所示實(shí)施例中網(wǎng)頁獲取模塊的組成示意圖;圖3為圖1所示實(shí)施例中模式提取模塊的組成示意圖;圖4為本發(fā)明TOB網(wǎng)頁篡改識別方法實(shí)施例的流程示意圖;圖5為圖4所示方法實(shí)施例中步驟S410的流程示意圖;圖6為圖4所示方法實(shí)施例中步驟S420的流程示意圖;圖7為一種DOM樹示意圖;圖8為對應(yīng)于圖7所示DOM樹的DOM落葉樹示意圖。
      具體實(shí)施例方式以下將結(jié)合附圖及實(shí)施例來詳細(xì)說明本發(fā)明的實(shí)施方式,借此對本發(fā)明如何應(yīng)用 技術(shù)手段來解決技術(shù)問題,并達(dá)成技術(shù)效果的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。需要說明的是,如果不沖突,本發(fā)明實(shí)施例以及實(shí)施例中的各個特征可以相互結(jié) 合,均在本發(fā)明的保護(hù)范圍之內(nèi)。另外,在附圖的流程圖示出的步驟可以在諸如一組計算機(jī) 可執(zhí)行指令的計算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況 下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。圖1是本發(fā)明TOB網(wǎng)頁篡改識別系統(tǒng)實(shí)施例的結(jié)構(gòu)示意圖。如圖1所示,該系統(tǒng) 實(shí)施例主要包括網(wǎng)頁獲取模塊110、模式提取模塊120、基線建立模塊130、基線數(shù)據(jù)庫140 以及篡改識別模塊150,其中網(wǎng)頁獲取模塊110,用于獲取TOB頁面;模式提取模塊120,與該網(wǎng)頁獲取模塊110相連,用于對該網(wǎng)頁獲取模塊110獲取 的TOB頁面進(jìn)行模式提取,生成該WEB頁面的頁面模式;基線建立模塊130,與該模式提取模塊120相連,對于正常的未經(jīng)篡改的TOB頁面, 用于根據(jù)該模式提取模塊120生成的正常的未經(jīng)篡改的WEB頁面的頁面模式,生成WEB頁 面比較基線;基線數(shù)據(jù)庫140,與該基線建立模塊130相連,用于保存由該基線建立模塊130建 立的TOB頁面比較基線;篡改識別模塊150,與該模式提取模塊120及基線數(shù)據(jù)庫140相連,用于在進(jìn)行 WEB頁面的篡改識別時,根據(jù)基線數(shù)據(jù)庫140保存的TOB頁面比較基線對作為識別目標(biāo)的目 標(biāo)TOB頁面的頁面模式進(jìn)行篡改識別,獲得識別結(jié)果。其中,該系統(tǒng)實(shí)施例在還未進(jìn)行篡改識別時,需要先根據(jù)正常的未經(jīng)篡改的WEB 頁面建立該基線數(shù)據(jù)庫140,然后才能用于篡改識別時對目標(biāo)TOB頁面進(jìn)行篡改識別。也即應(yīng)該在該基線數(shù)據(jù)庫140建立完成之后,才能進(jìn)行后續(xù)的目標(biāo)WEB頁面的篡改識別。當(dāng)然, 如果該基線數(shù)據(jù)庫140預(yù)先存儲有WEB頁面比較基線,則可以直接對目標(biāo)WEB頁面進(jìn)行篡 改識別,而不需要再重新生成WEB頁面比較基線。上述正常的未經(jīng)篡改的TOB頁面,可以在TOB服務(wù)器對外發(fā)布WEB頁面之前,以 TOB客戶端的方式,基于安全(如加密等)傳輸技術(shù),通過統(tǒng)一資源定位器(URL)從TOB服 務(wù)器處獲得。如此,還可以區(qū)別WEB頁面發(fā)布方的主動修改與外界對WEB頁面篡改行為。上述篡改識別模塊150在進(jìn)行篡改識別時,如果在基線數(shù)據(jù)庫140中檢索到存在 有與目標(biāo)TOB頁面的頁面模式相同的WEB頁面比較基線,則認(rèn)為該目標(biāo)WEB頁面未經(jīng)篡改, 否則認(rèn)為該目標(biāo)WEB頁面已經(jīng)被篡改。圖2為圖1所示實(shí)施例中網(wǎng)頁獲取模塊110的組成示意圖。如圖2所示,該網(wǎng)頁 獲取模塊110主要包括地址接收子模塊210、頁面請求子模塊220、響應(yīng)分析子模塊230以 及網(wǎng)頁輸出子模塊對0,其中地址接收子模塊210,用于接收外部輸入的TOB頁面的頁面地址,該頁面地址可以 是TOB頁面的IP地址,也可以是TOB頁面的域名;頁面請求子模塊220,與該地址接收子模塊210相連,用于根據(jù)地址接收子模塊 210接收的頁面地址,向TOB服務(wù)器發(fā)出頁面請求以獲取該WEB頁面,該請求的格式可以與 瀏覽器向服務(wù)器發(fā)出的頁面請求格式相同;響應(yīng)分析子模塊230,用于接收從TOB服務(wù)器返回的頁面響應(yīng),并從該頁面響應(yīng)中 提取出HTML格式的TOB網(wǎng)頁;該響應(yīng)信息可以是一個正常的服務(wù)器對瀏覽器請求的響應(yīng)消 息;網(wǎng)頁輸出子模塊M0,與該響應(yīng)分析子模塊230及模式提取模塊120相連,用于將 響應(yīng)分析子模塊230提取的TOB頁面發(fā)送給模式提取模塊120。圖3為圖1所示實(shí)施例中模式提取模塊120的組成示意圖。如圖3所示,該模式 提取模塊120主要包括解析子模塊310、落葉樹生成子模塊320、序列化子模塊330以及模 式輸出子模塊;340,其中解析子模塊310,與該網(wǎng)頁獲取模塊110相連,用于對HTML格式的TOB頁面進(jìn)行文 檔對象模型(DOM)解析,從HTML格式的TOB頁面中提取出DOM樹;一種具體的提取方式是 使用開源HTML解析器(如HTMLXX)來實(shí)現(xiàn);落葉樹生成子模塊320,與該解析子模塊310相連,用于對DOM樹進(jìn)行刪葉處理,刪 除該解析子模塊310提取出的DOM樹中的葉節(jié)點(diǎn),生成DOM落葉樹;序列化子模塊330,與該落葉樹生成子模塊320相連,用于對該DOM落葉樹進(jìn)行序 列化,將該落葉樹生成子模塊320生成的DOM落葉樹轉(zhuǎn)化成落葉樹節(jié)點(diǎn)序列;模式輸出子模塊340,與該序列化子模塊330相連,用于將序列化子模塊330轉(zhuǎn)化 獲得的落葉樹節(jié)點(diǎn)序列作為該WEB頁面的頁面模式進(jìn)行輸出。圖4是本發(fā)明TOB網(wǎng)頁篡改識別方法實(shí)施例的流程示意圖。結(jié)合圖1至圖3所示 的系統(tǒng)實(shí)施例,圖4所示的該方法實(shí)施例,主要包括如下步驟步驟S410,獲取TOB頁面;步驟S420,對獲取的TOB頁面進(jìn)行模式提取,生成該WEB頁面的頁面模式;步驟S430,根據(jù)正常的未經(jīng)篡改的TOB頁面的頁面模式,生成TOB頁面比較基線并保存;步驟S440,根據(jù)保存的TOB頁面比較基線,對作為識別目標(biāo)的目標(biāo)W^頁面的頁面 模式進(jìn)行篡改識別,獲得識別結(jié)果。其中,該方法實(shí)施例在還未進(jìn)行TOB頁面的篡改識別時,需要先根據(jù)正常的未經(jīng) 篡改的WEB頁面保存TOB頁面比較基線,然后再進(jìn)行對目標(biāo)WEB頁面的篡改識別。當(dāng)然,如 果在進(jìn)行篡改識別之前就預(yù)先保存有WEB頁面比較基線,則可以直接對目標(biāo)WEB頁面進(jìn)行 篡改識別,而不需要再重新生成WEB頁面比較基線。上述篡改識別過程中,如果檢索到存在有與目標(biāo)TOB頁面的頁面模式相同的WEB 頁面比較基線,則認(rèn)為該目標(biāo)WEB頁面未經(jīng)篡改,否則認(rèn)為該目標(biāo)WEB頁面已經(jīng)被篡改。圖5是圖4所示方法實(shí)施例中步驟S410的流程示意圖。結(jié)合圖1至圖3所示的 系統(tǒng)實(shí)施例,該步驟S410的流程主要包括如下步驟步驟S510,接收外部輸入的TOB頁面的頁面地址;該頁面地址可以是WEB頁面的 IP地址,也可以是WEB頁面的域名;步驟S520,根據(jù)接收的該頁面地址,向TOB服務(wù)器發(fā)出頁面請求,以獲取該WEB頁 面,該請求的格式可以與瀏覽器向服務(wù)器發(fā)出的頁面請求格式相同;步驟S530,接收從TOB服務(wù)器返回的頁面響應(yīng),并從該頁面響應(yīng)中提取出HTML格 式的TOB網(wǎng)頁;該響應(yīng)信息可以是一個正常的服務(wù)器對瀏覽器請求的響應(yīng)消息。圖6是圖4所示方法實(shí)施例中步驟S420的流程示意圖。結(jié)合圖1至圖3所示的 系統(tǒng)實(shí)施例,該步驟S420的流程主要包括如下步驟步驟S610,對HTML格式的TOB頁面進(jìn)行DOM解析,從HTML格式的TOB頁面中提取 出DOM樹;一種具體的提取方式是使用開源HTML解析器(如HTMLXX)來實(shí)現(xiàn);比如,某一個頁面文檔的內(nèi)容如下<HTML><head><title>D0M Example</title></head><body><hl>D0M Example 0ne</hl>
      This Page is a Example of DOM 丨 </p></body></HTML>從該頁面文檔提取出的DOM樹如圖7所示;步驟S620,對DOM樹進(jìn)行刪葉處理,刪除所提取出的DOM樹中的葉節(jié)點(diǎn),生成DOM 落葉樹;比如,對生成的DOM樹進(jìn)行先序遍歷,若發(fā)現(xiàn)一個節(jié)點(diǎn)是葉節(jié)點(diǎn),則將其刪除;圖7 所示的DOM樹,其對應(yīng)的DOM落葉樹如圖8所示;步驟S630,對該DOM落葉樹進(jìn)行序列化,將該DOM落葉樹轉(zhuǎn)化成落葉樹節(jié)點(diǎn)序列, 將該落葉樹節(jié)點(diǎn)作為該WEB頁面的頁面模式;比如,一種序列化的方法是,對DOM樹進(jìn)行先序遍歷,然后即可得到該樹的一個節(jié)
      8點(diǎn)序列;為便于比較,在節(jié)點(diǎn)序列中,每個節(jié)點(diǎn)用一個三元組(節(jié)點(diǎn)名稱,節(jié)點(diǎn)類型,節(jié)點(diǎn) 值)來表示,這樣得到的頁面模式就是一個三元組序列;比如圖8所示的DOM落葉樹,其 節(jié)點(diǎn)名稱和值均為空,序列化后的得到的落葉樹節(jié)點(diǎn)序列為(,<HTML>, ) (,<head>,)(, <title>,) (,<body>, ) (,<hl>, ) (,
      ,)。對應(yīng)于圖8所示的DOM落葉樹,上述步驟S440識別到目標(biāo)TOB頁面的頁面模式 (三元組序列)與WEB頁面比較基線(三元組序列)相同,則認(rèn)為該目標(biāo)WEB頁面未經(jīng)篡 改,否則認(rèn)為該目標(biāo)WEB頁面已經(jīng)被篡改。需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機(jī)可執(zhí)行指令的 計算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不 同于此處的順序執(zhí)行所示出或描述的步驟。另外,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā) 明的各模塊或各步驟可以用通用的計算裝置來實(shí)現(xiàn),它們可以集中在單個的計算裝置上, 或者分布在多個計算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計算裝置可執(zhí)行的程序代 碼來實(shí)現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成 各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實(shí)現(xiàn)。這 樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。雖然本發(fā)明所揭露的實(shí)施方式如上,但所述的內(nèi)容只是為了便于理解本發(fā)明而采 用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本 發(fā)明所揭露的精神和范圍的前提下,可以在實(shí)施的形式上及細(xì)節(jié)上作任何的修改與變化, 但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。
      權(quán)利要求
      1.一種WEB網(wǎng)頁篡改識別系統(tǒng),其特征在于,包括 網(wǎng)頁獲取模塊,用于獲取WEB頁面;模式提取模塊,與所述網(wǎng)頁獲取模塊相連,用于對所述WEB頁面進(jìn)行模式提取,生成所 述TOB頁面的頁面模式;基線數(shù)據(jù)庫,用于保存WEB頁面比較基線;篡改識別模塊,與所述模式提取模塊及基線數(shù)據(jù)庫相連,用于根據(jù)所述WEB頁面比較 基線對作為識別目標(biāo)的目標(biāo)WEB頁面的頁面模式進(jìn)行篡改識別,獲得識別結(jié)果。
      2.如權(quán)利要求1所述的系統(tǒng),其特征在于,該系統(tǒng)進(jìn)一步包括基線建立模塊,與所述模式提取模塊及基線數(shù)據(jù)庫相連,用于根據(jù)未經(jīng)篡改的WEB頁 面的頁面模式,生成所述WEB頁面比較基線并保存到所述基線數(shù)據(jù)庫。
      3.如權(quán)利要求1或2所述的系統(tǒng),其特征在于,所述網(wǎng)頁獲取模塊包括 地址接收子模塊,用于接收所述WEB頁面的頁面地址;頁面請求子模塊,與所述地址接收子模塊相連,用于根據(jù)所述頁面地址,向WEB服務(wù)器 發(fā)出頁面請求,以獲取所述WEB頁面;響應(yīng)分析子模塊,用于從所述WEB服務(wù)器返回的頁面響應(yīng)中提取出所述WEB網(wǎng)頁。
      4.如權(quán)利要求1或2所述的系統(tǒng),其特征在于,所述模式提取模塊包括解析子模塊,與所述網(wǎng)頁獲取模塊相連,用于從所述WEB頁面中提取文檔對象模型樹; 落葉樹生成子模塊,與所述解析子模塊相連,用于對所述文檔對象模型樹進(jìn)行刪葉處 理,生成文檔對象模型落葉樹;序列化子模塊,與所述落葉樹生成子模塊相連,用于對所述文檔對象模型落葉樹進(jìn)行 序列化,生成落葉樹節(jié)點(diǎn)序列;模式輸出子模塊,與所述序列化子模塊相連,用于將所述落葉樹節(jié)點(diǎn)序列作為所述WEB 頁面的頁面模式進(jìn)行輸出。
      5.一種WEB網(wǎng)頁篡改識別方法,其特征在于,包括 獲取TOB頁面;對所述WEB頁面進(jìn)行模式提取,生成所述WEB頁面的頁面模式; 根據(jù)預(yù)存的WEB頁面比較基線對作為識別目標(biāo)的目標(biāo)TOB頁面的頁面模式進(jìn)行篡改識 別,獲得識別結(jié)果。
      6.如權(quán)利要求5所述的方法,其特征在于,該方法進(jìn)一步包括根據(jù)未經(jīng)篡改的WEB頁面的頁面模式,生成所述WEB頁面比較基線并保存。
      7.如權(quán)利要求5或6所述的方法,其特征在于,獲取所述WEB頁面的步驟,包括 接收所述WEB頁面的頁面地址;根據(jù)所述頁面地址,向WEB服務(wù)器發(fā)出頁面請求,以獲取該WEB頁面; 從所述WEB服務(wù)器返回的頁面響應(yīng)中提取出所述TOB網(wǎng)頁。
      8.如權(quán)利要求7所述的方法,其特征在于所述WEB頁面的頁面地址,包括所述WEB頁面的IP地址或者域名。
      9.如權(quán)利要求5或6所述的方法,其特征在于,對所述WEB頁面進(jìn)行模式提取,生成所 述頁面模式的步驟,包括從所述WEB頁面中提取文檔對象模型樹;對所述文檔對象模型樹進(jìn)行刪葉處理,生成文檔對象模型落葉樹; 對所述文檔對象模型落葉樹進(jìn)行序列化,生成落葉樹節(jié)點(diǎn)序列; 將所述落葉樹節(jié)點(diǎn)序列作為所述WEB頁面的頁面模式。
      全文摘要
      本發(fā)明公開了一種WEB網(wǎng)頁篡改識別方法及系統(tǒng),以實(shí)現(xiàn)對WEB頁面的篡改識別,其中該系統(tǒng)包括網(wǎng)頁獲取模塊,用于獲取WEB頁面;模式提取模塊,與網(wǎng)頁獲取模塊相連,用于對WEB頁面進(jìn)行模式提取,生成WEB頁面的頁面模式;基線數(shù)據(jù)庫,用于保存WEB頁面比較基線;篡改識別模塊,與模式提取模塊及基線數(shù)據(jù)庫相連,用于根據(jù)WEB頁面比較基線對作為識別目標(biāo)的目標(biāo)WEB頁面的頁面模式進(jìn)行篡改識別,獲得識別結(jié)果。與現(xiàn)有技術(shù)相比,本發(fā)明技術(shù)方案在網(wǎng)頁服務(wù)器的外部進(jìn)行WEB網(wǎng)頁篡改檢測,提高了檢測效率,實(shí)現(xiàn)了WEB頁面的篡改識別。
      文檔編號G06F17/30GK102129528SQ20101003427
      公開日2011年7月20日 申請日期2010年1月19日 優(yōu)先權(quán)日2010年1月19日
      發(fā)明者葉潤國, 周濤, 孫海波, 胡振宇, 黃宇鴻 申請人:北京啟明星辰信息安全技術(shù)有限公司, 北京啟明星辰信息技術(shù)股份有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1