惡意論壇的識別方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種惡意論壇的識別方法及裝置。該方法包括獲取待訪問論壇的論壇名稱和該論壇的版塊名稱;將論壇名稱和版塊名稱分別與預(yù)存關(guān)鍵詞庫中的惡意關(guān)鍵詞進(jìn)行匹配;若匹配成功,則識別該論壇為惡意論壇。通過本發(fā)明,無論對已知的惡意論壇或未知的惡意論壇,均能夠?qū)ζ溥M(jìn)行識別,克服了現(xiàn)有技術(shù)中只能對已知的惡意論壇進(jìn)行識別的缺陷。
【專利說明】惡意論壇的識別方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,特別是涉及一種惡意論壇的識別方法及裝置。
【背景技術(shù)】
[0002]惡意論壇是指故意在計算機系統(tǒng)上執(zhí)行惡意任務(wù)的病毒、蠕蟲和特洛伊木馬等的非法論壇。這類論壇通常都有一個共同特點,他們通常情況下是以某種頁面形式讓人們正常瀏覽頁面內(nèi)容,同時非法獲取用戶計算機中的各種數(shù)據(jù)?,F(xiàn)如今,惡意論壇嚴(yán)重地影響用戶的網(wǎng)絡(luò)環(huán)境,所以,對惡意論壇的識別也已經(jīng)成為保證網(wǎng)絡(luò)安全的重要工作之一,目前,通常采用如下兩種技術(shù)對惡意論壇進(jìn)行識別。
[0003]第一種,在防火墻的內(nèi)存中存儲有惡意論壇的IP (Internet Protocol,網(wǎng)絡(luò)之間互連的協(xié)議)地址以及符合該IP地址的所有URL (Uniform Resource Locator,統(tǒng)一資源定位符)的對應(yīng)關(guān)系。當(dāng)獲取到用戶訪問某論壇的URL請求時,還要獲取該論壇的IP地址,根據(jù)該論壇的IP地址在防火墻內(nèi)存中查找該IP地址對應(yīng)的所有URL,并將論壇URL與防火墻內(nèi)存中該IP地址對應(yīng)的所有URL進(jìn)行對比,對比成功則說明該論壇為惡意論壇。
[0004]第二種,將用戶想要訪問的論壇的URL與惡意關(guān)鍵詞列表頁匹配,在匹配結(jié)果中選取基準(zhǔn)關(guān)鍵字,并對這組關(guān)鍵字進(jìn)行順序標(biāo)號標(biāo)識,若該組關(guān)鍵字的順序號標(biāo)識數(shù)目與保存的惡意關(guān)鍵詞表中的該組關(guān)鍵字的順序號標(biāo)識數(shù)目一致,則說明該論壇為惡意論壇。
[0005]上述兩種技術(shù)均為基于URL對比的方式,這就需要預(yù)先獲取到惡意論壇的URL并存儲,因此僅能夠?qū)σ阎膼阂庹搲M(jìn)行識別和過濾,對未知的惡意論壇無法進(jìn)行識別和處理。
【發(fā)明內(nèi)容】
[0006]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的惡意論壇的識別方法及裝置。
[0007]本發(fā)明提供了一種惡意論壇的識別方法,包括:
[0008]獲取待訪問論壇的論壇名稱和論壇的版塊名稱;
[0009]將論壇名稱和版塊名稱分別與預(yù)存關(guān)鍵詞庫中的惡意關(guān)鍵詞進(jìn)行匹配;
[0010]若匹配成功,則識別論壇為惡意論壇。
[0011]進(jìn)一步地,在識別論壇為惡意論壇之后,還包括:
[0012]收集所有已知惡意論壇的論壇名稱和版塊名稱并進(jìn)行處理,得到論壇名稱列表和版塊名稱列表;
[0013]對論壇名稱列表和版塊名稱列表進(jìn)行熱點聚合,得到新惡意關(guān)鍵詞,將新惡意關(guān)鍵詞添加到關(guān)鍵詞庫中。
[0014]進(jìn)一步地,對論壇名稱列表和版塊名稱列表進(jìn)行熱點聚合,得到新惡意關(guān)鍵詞,包括:
[0015]根據(jù)最長公共子序列LCS算法,生成與論壇名稱列表和版塊名稱列表各自對應(yīng)的熱點詞表;
[0016]根據(jù)詞語出現(xiàn)頻率在各個熱點詞表中選擇熱點關(guān)鍵詞;
[0017]將獲取的各個熱點關(guān)鍵詞進(jìn)行合并,作為新惡意關(guān)鍵詞。
[0018]進(jìn)一步地,各個熱點詞表的生成方式包括:
[0019]對于論壇名稱列表和版塊名稱列表而言,
[0020]采用最長公共子序列LCS算法對其中包含的每兩個詞進(jìn)行匹配;
[0021]獲取每兩個詞之間的最長公共子序列,作為熱點關(guān)鍵詞;
[0022]將獲取的所有熱點關(guān)鍵詞進(jìn)行組合,得到與其對應(yīng)的熱點詞表。
[0023]進(jìn)一步地,根據(jù)詞語出現(xiàn)頻率在各個熱點詞表中選擇熱點關(guān)鍵詞,包括:
[0024]根據(jù)預(yù)設(shè)規(guī)則分別對各個熱點詞表中的熱點關(guān)鍵詞進(jìn)行篩選;
[0025]在篩選后的各個熱點詞表中選擇出現(xiàn)頻率由高到低的預(yù)設(shè)個數(shù)熱點關(guān)鍵詞。
[0026]進(jìn)一步地,根據(jù)預(yù)設(shè)規(guī)則分別對各個熱點詞表中的熱點關(guān)鍵詞進(jìn)行篩選,包括:
[0027]對各個熱點詞表進(jìn)行常用語去除處理,其中,常用語為使用頻率超過預(yù)設(shè)次數(shù)的詞語;
[0028]判斷處理后的各個熱點詞表中的熱點關(guān)鍵詞所對應(yīng)的論壇是否為惡意論壇;
[0029]若是,保留該關(guān)鍵詞;
[0030]若否,去除該關(guān)鍵詞。
[0031]進(jìn)一步地,收集所有已知惡意論壇的論壇名稱和版塊名稱并進(jìn)行處理,包括:
[0032]收集所有已知惡意論壇的論壇名稱和版塊名稱并存入各自對應(yīng)的預(yù)處理庫;
[0033]對各個預(yù)處理庫中、來自同一網(wǎng)絡(luò)之間互連協(xié)議IP地址的名稱進(jìn)行消重處理。
[0034]進(jìn)一步地,對論壇名稱列表和版塊名稱列表進(jìn)行熱點聚合,包括:
[0035]每隔預(yù)設(shè)時間對論壇名稱列表和版塊名稱列表進(jìn)行熱點聚合。
[0036]進(jìn)一步地,惡意關(guān)鍵詞包括論is名稱關(guān)鍵詞和版塊名稱關(guān)鍵詞;
[0037]將論壇名稱以及版塊名稱分別與預(yù)存關(guān)鍵詞庫中的惡意關(guān)鍵詞進(jìn)行匹配,包括:
[0038]將論壇名稱與論壇名稱關(guān)鍵詞匹配,將版塊名稱與版塊名稱關(guān)鍵詞匹配;
[0039]當(dāng)論壇名稱與論壇名稱關(guān)鍵詞匹配,且版塊名稱與版塊名稱關(guān)鍵詞匹配時,則確認(rèn)匹配成功;
[0040]當(dāng)論壇名稱與論壇名稱關(guān)鍵詞匹配,且版塊名稱關(guān)鍵詞為空時,則確認(rèn)匹配成功;
[0041]當(dāng)版塊名稱與版塊名稱關(guān)鍵詞匹配,且論壇名稱關(guān)鍵詞為空時,則確認(rèn)匹配成功;
[0042]否則,確認(rèn)匹配失敗,則論壇為非惡意論壇。
[0043]本發(fā)明還提供了一種惡意論壇的識別裝置,包括:
[0044]存儲器,配置為存儲包含惡意關(guān)鍵詞的關(guān)鍵詞庫;
[0045]用戶輸入接口,配置為接收用戶訪問論壇的指示;
[0046]名稱獲取器,配置為獲取待訪問論壇的論壇名稱和論壇的版塊名稱;
[0047]名稱匹配器,配置為讀取存儲器和名稱獲取器,將論壇名稱和版塊名稱分別與關(guān)鍵詞庫中的惡意關(guān)鍵詞進(jìn)行匹配;
[0048]惡意論壇識別器,配置為若名稱匹配器確認(rèn)匹配成功,則識別論壇為惡意論壇。[0049]進(jìn)一步地,上述裝置還包括:
[0050]名稱處理器,配置為收集所有已知惡意論壇的論壇名稱和版塊名稱并進(jìn)行處理,得到論壇名稱列表和版塊名稱列表;
[0051]聚合生成器,配置為對名稱處理器得到的論壇名稱列表和版塊名稱列表進(jìn)行熱點聚合,得到新惡意關(guān)鍵詞,將新惡意關(guān)鍵詞存儲到存儲器的關(guān)鍵詞庫中。
[0052]進(jìn)一步地,聚合生成器包括:
[0053]詞表生成單元,配置為根據(jù)最長公共子序列LCS算法,生成與論壇名稱列表和版塊名稱列表各自對應(yīng)的熱點詞表;
[0054]選取單元,配置為根據(jù)詞語出現(xiàn)頻率在詞表生成單元生成的各個熱點詞表中選擇熱點關(guān)鍵詞;
[0055]合并單元,配置為將選取單元獲取的各個熱點關(guān)鍵詞進(jìn)行合并,作為新惡意關(guān)鍵詞,將新惡意關(guān)鍵詞存儲到存儲器的關(guān)鍵詞庫中。
[0056]進(jìn)一步地,詞表生成單元還配置為按照如下方式生成各個熱點詞表:
[0057]對于論壇名稱列表和版塊名稱列表而言,
[0058]采用最長公共子序列LCS算法對其中包含的每兩個詞進(jìn)行匹配;
[0059]獲取每兩個詞之間的最長公共子序列,作為熱點關(guān)鍵詞;
[0060]將獲取的所有熱點關(guān)鍵詞進(jìn)行組合,得到與其對應(yīng)的熱點詞表。
[0061]進(jìn)一步地,選取單元配置為按照如下方式在各個熱點詞表中選擇熱點關(guān)鍵詞:
[0062]根據(jù)預(yù)設(shè)規(guī)則分別對詞表生成單元生成的各個熱點詞表中的熱點關(guān)鍵詞進(jìn)行篩選;
[0063]在篩選后的各個熱點詞表中選擇出現(xiàn)頻率由高到低的預(yù)設(shè)個數(shù)熱點關(guān)鍵詞。
[0064]進(jìn)一步地,選取單元還配置為按照如下方式對各個熱點詞表中的熱點關(guān)鍵詞進(jìn)行篩選:
[0065]對詞表生成單元生成的各個熱點詞表進(jìn)行常用語去除處理,其中,常用語為使用頻率超過預(yù)設(shè)次數(shù)的詞語;
[0066]判斷處理后的各個熱點詞表中的熱點關(guān)鍵詞所對應(yīng)的論壇是否為惡意論壇;
[0067]若是,保留該關(guān)鍵詞;
[0068]若否,去除該關(guān)鍵詞。
[0069]進(jìn)一步地,名稱處理器配置為:
[0070]收集所有已知惡意論壇的論壇名稱和版塊名稱并存入各自對應(yīng)的預(yù)處理庫;
[0071]對各個預(yù)處理庫中、來自同一網(wǎng)絡(luò)之間互連協(xié)議IP地址的名稱進(jìn)行消重處理,得到論壇名稱列表和版塊名稱列表。
[0072]進(jìn)一步地,聚合生成器還配置為每隔預(yù)設(shè)時間對論壇名稱列表和版塊名稱列表進(jìn)行熱點聚合,得到新惡意關(guān)鍵詞,將新惡意關(guān)鍵詞存儲到存儲器的關(guān)鍵詞庫中。
[0073]進(jìn)一步地,存儲器中的惡意關(guān)鍵詞包括論壇名稱關(guān)鍵詞和版塊名稱關(guān)鍵詞;
[0074]名稱匹配器配置為按照如下方式執(zhí)行匹配操作:
[0075]將論壇名稱與論壇名稱關(guān)鍵詞匹配,將版塊名稱與版塊名稱關(guān)鍵詞匹配;
[0076]當(dāng)論壇名稱與論壇名稱關(guān)鍵詞匹配,且版塊名稱與版塊名稱關(guān)鍵詞匹配時,則確認(rèn)匹配成功;[0077]當(dāng)論壇名稱與論壇名稱關(guān)鍵詞匹配,且版塊名稱關(guān)鍵詞為空時,則確認(rèn)匹配成功;
[0078]當(dāng)版塊名稱與版塊名稱關(guān)鍵詞匹配,且論壇名稱關(guān)鍵詞為空時,則確認(rèn)匹配成功;
[0079]否則,確認(rèn)匹配失敗,則論壇為非惡意論壇。
[0080]本發(fā)明提供了一種惡意論壇的識別方法及裝置,通過本發(fā)明,使終端能夠識別出與關(guān)鍵詞庫中惡意關(guān)鍵詞匹配的論壇為惡意論壇。在每次識別惡意論壇之后,還會進(jìn)行熱點聚合生成新惡意關(guān)鍵詞,并將其存入關(guān)鍵詞庫。新惡意關(guān)鍵詞的添加,豐富了關(guān)鍵詞庫,從而使得本發(fā)明能夠識別出更多的惡意論壇。
[0081]可見,對于本發(fā)明,無論待識別的論壇為已知論壇還是未知論壇,只要其論壇名稱和版塊名稱能夠與關(guān)鍵詞庫中的惡意關(guān)鍵詞相匹配,就能夠?qū)ζ溥M(jìn)行識別,克服了現(xiàn)有技術(shù)中只能對已知的惡意論壇進(jìn)行識別的缺陷。進(jìn)一步地,現(xiàn)有技術(shù)中,當(dāng)惡意論壇的URL的存儲數(shù)量較大時,會導(dǎo)致查找效率降低,而本發(fā)明在對惡意論壇進(jìn)行識別時,以論壇的論壇名稱和版塊名稱為單位進(jìn)行處理,從而提高了惡意論壇的識別效率。另外,由于現(xiàn)有技術(shù)中惡意論壇的IP地址經(jīng)常發(fā)生變化,而當(dāng)原IP地址已經(jīng)為正常論壇所用時,就易導(dǎo)致將原IP地址對應(yīng)的論壇識別為惡意論壇,而本發(fā)明在識別惡意論壇時,僅使用論壇名稱和版塊名稱即可,從而能夠有效地避免了誤將正常論壇識別為惡意論壇。
[0082]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
[0083]根據(jù)下文結(jié)合附圖對本發(fā)明具體實施例的詳細(xì)描述,本領(lǐng)域技術(shù)人員將會更加明了本發(fā)明的上述以及其他目的、優(yōu)點和特征。
【專利附圖】
【附圖說明】
[0084]通過閱讀下文優(yōu)選實施方式的詳細(xì)描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0085]圖1是根據(jù)本發(fā)明一個實施例的一種惡意論壇的識別方法流程圖;
[0086]圖2是根據(jù)本發(fā)明一個實施例的熱點聚合方法流程圖;
[0087]圖3是根據(jù)本發(fā)明一個實施例的一種惡意論壇的識別裝置框圖。
【具體實施方式】
[0088]在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
[0089]相關(guān)技術(shù)提及,在識別惡意論壇時,均為基于URL對比的方式來識別待訪問的論壇是否為惡意論壇,因此,僅能夠?qū)σ阎膼阂庹搲M(jìn)行識別和處理,對未知的惡意論壇無法進(jìn)行識別和處理。為了解決上述技術(shù)問題,本發(fā)明實施例提供了一種惡意論壇的識別方法及裝置。
[0090]下面結(jié)合附圖,對本發(fā)明實施例提供的一種惡意論壇的識別方法及裝置進(jìn)行詳細(xì)地說明。本發(fā)明實施例對具有瀏覽論壇功能的終端進(jìn)行了改進(jìn),例如,本實施例中的終端可以為PC (Personal Computer,個人計算機)、手機、手持電腦等用戶終端設(shè)備。
[0091]實施例一
[0092]本實施例為本發(fā)明的一個具體應(yīng)用場景,通過本實施例,能夠更加清楚、具體地闡述本發(fā)明所提供的方法。
[0093]圖1示出了根據(jù)本發(fā)明一個實施例的一種惡意論壇的識別方法流程圖。該方法具體包括步驟SlOl至S106。
[0094]S101,獲取用戶待訪問論壇的論壇名稱和版塊名稱。
[0095]本實施例中,論壇名稱和版塊名稱為論壇指示了論壇的所包括的內(nèi)容。開發(fā)者在為論壇名稱命名時,一般情況會根據(jù)內(nèi)容來對其進(jìn)行命名,每個論壇只有一個名稱。但是,論壇中的內(nèi)容是以版塊的形式進(jìn)行劃分的,一個論壇中通常至少要包括一個版塊,每個版塊包含了不同話題的內(nèi)容,所以,版塊名稱可以根據(jù)所涉及的話題內(nèi)容來設(shè)定。例如:名稱為“攝影帝國”的論壇,其在版塊劃分和命名時,可以按照攝影的場景來進(jìn)行,如版塊名稱具體可以為“繽紛世界”、“海底世界”等,當(dāng)用戶看到不同的版塊名稱時,就能夠快速地得知其包含的話題,便于用戶選擇自己感興趣的版塊進(jìn)行瀏覽。
[0096]在獲取到該論壇的論壇名稱和版塊名稱之后,執(zhí)行步驟S102。在步驟S102中,將獲取的論壇名稱和版塊名稱分別與預(yù)存關(guān)鍵詞庫中的惡意關(guān)鍵詞進(jìn)行匹配,并確認(rèn)是否匹配成功。若確認(rèn)匹配成功,則觸發(fā)步驟S103將該論壇識別為惡意論壇的操作,若匹配不成功,則觸發(fā)步驟S104將該論壇識別為非惡意論壇的操作。
[0097]可選地,為了實現(xiàn)本步驟S102,需要在終端中預(yù)先存儲一個關(guān)鍵詞庫,該關(guān)鍵詞庫中包括了已經(jīng)收集的關(guān)于惡意論壇的惡意關(guān)鍵詞。需要說明的是,關(guān)鍵詞庫中包括的惡意關(guān)鍵詞為兩類,其中一類為論壇名稱關(guān)鍵詞,用于與獲取的論壇名稱進(jìn)行匹配,另一類為版塊名稱關(guān)鍵詞,用于與獲取的版塊名稱進(jìn)行匹配。其中,論壇名稱關(guān)鍵詞為與預(yù)先統(tǒng)計的惡意論壇名稱相關(guān)的詞,版塊名稱關(guān)鍵詞為與預(yù)先統(tǒng)計的惡意論壇的版塊名稱相關(guān)的詞,關(guān)鍵詞庫中的論壇名稱關(guān)鍵詞和版塊名稱關(guān)鍵詞以詞組的形式存儲??蛇x地,在本實施例中,關(guān)鍵詞庫中每組惡意關(guān)鍵詞的存儲結(jié)構(gòu)如下表一所不。
[0098]表一
[0099]
【權(quán)利要求】
1.一種惡意論壇的識別方法,包括: 獲取待訪問論壇的論壇名稱和所述論壇的版塊名稱; 將所述論壇名稱和所述版塊名稱分別與預(yù)存關(guān)鍵詞庫中的惡意關(guān)鍵詞進(jìn)行匹配; 若匹配成功,則識別所述論壇為惡意論壇。
2.根據(jù)權(quán)利要求1所述的方法,其中,在識別所述論壇為惡意論壇之后,還包括: 收集所有已知惡意論壇的論壇名稱和版塊名稱并進(jìn)行處理,得到論壇名稱列表和版塊名稱列表; 對所述論壇名稱列表和所述版塊名稱列表進(jìn)行熱點聚合,得到新惡意關(guān)鍵詞,將所述新惡意關(guān)鍵詞添加到所述關(guān)鍵詞庫中。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述對所述論壇名稱列表和所述版塊名稱列表進(jìn)行熱點聚合,得到新惡意關(guān)鍵詞,包括: 根據(jù)最長公共子序列LCS算法,生成與所述論壇名稱列表和所述版塊名稱列表各自對應(yīng)的熱點詞表; 根據(jù)詞語出現(xiàn)頻率在各個熱點詞表中選擇熱點關(guān)鍵詞; 將獲取的各個熱點關(guān)鍵詞進(jìn)行合并,作為新惡意關(guān)鍵詞。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述根據(jù)詞語出現(xiàn)頻率在各個熱點詞表中選擇熱點關(guān)鍵詞,包括: 根據(jù)預(yù)設(shè)規(guī)則分別對各個熱點詞表中的熱點關(guān)鍵詞進(jìn)行篩選; 在篩選后的各個熱點詞表中選擇出現(xiàn)頻率由高到低的預(yù)設(shè)個數(shù)熱點關(guān)鍵詞。
5.根據(jù)權(quán)利要求1至4任一項所述的方法,其中,所述惡意關(guān)鍵詞包括論壇名稱關(guān)鍵詞和版塊名稱關(guān)鍵詞; 將所述論壇名稱以及所述版塊名稱分別與預(yù)存關(guān)鍵詞庫中的惡意關(guān)鍵詞進(jìn)行匹配,包括: 將所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,將所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配; 當(dāng)所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,且所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配時,則確認(rèn)匹配成功; 當(dāng)所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,且所述版塊名稱關(guān)鍵詞為空時,則確認(rèn)匹配成功; 當(dāng)所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配,且所述論壇名稱關(guān)鍵詞為空時,則確認(rèn)匹配成功; 否則,確認(rèn)匹配失敗,則所述論壇為非惡意論壇。
6.一種惡意論壇的識別裝置,包括: 存儲器,配置為存儲包含惡意關(guān)鍵詞的關(guān)鍵詞庫; 用戶輸入接口,配置為接收用戶訪問論壇的指示; 名稱獲取器,配置為獲取待訪問論壇的論壇名稱和所述論壇的版塊名稱; 名稱匹配器,配置為讀取所述存儲器和所述名稱獲取器,將所述論壇名稱和所述版塊名稱分別與所述關(guān)鍵詞庫中的惡意關(guān)鍵詞進(jìn)行匹配; 惡意論壇識別器,配置為若所述名稱匹配器確認(rèn)匹配成功,則識別所述論壇為惡意論壇。
7.根據(jù)權(quán)利要求6所述的裝置,其中,所述裝置還包括: 名稱處理器,配置為收集所有已知惡意論壇的論壇名稱和版塊名稱并進(jìn)行處理,得到論壇名稱列表和版塊名稱列表; 聚合生成器,配置為對所述名稱處理器得到的論壇名稱列表和版塊名稱列表進(jìn)行熱點聚合,得到新惡意關(guān)鍵詞,將所述新惡意關(guān)鍵詞存儲到所述存儲器的關(guān)鍵詞庫中。
8.根據(jù)權(quán)利要求6或7所述的裝置,其中,所述聚合生成器包括: 詞表生成單元,配置為根據(jù)最長公共子序列LCS算法,生成與所述論壇名稱列表和所述版塊名稱列表各自對應(yīng)的熱點詞表; 選取單元,配置為根據(jù)詞語出現(xiàn)頻率在所述詞表生成單元生成的各個熱點詞表中選擇熱點關(guān)鍵詞; 合并單元,配置為將所述選取單元獲取的各個熱點關(guān)鍵詞進(jìn)行合并,作為新惡意關(guān)鍵詞,將所述新惡意關(guān)鍵詞存儲到所述存儲器的關(guān)鍵詞庫中。
9.根據(jù)權(quán)利要求8所述的裝置,其中,所述選取單元配置為按照如下方式在各個熱點詞表中選擇熱點關(guān)鍵詞: 根據(jù)預(yù)設(shè)規(guī)則分別對所述詞表生成單元生成的各個熱點詞表中的熱點關(guān)鍵詞進(jìn)行篩選; 在篩選后的各個熱點詞表中選擇出現(xiàn)頻率由高到低的預(yù)設(shè)個數(shù)熱點關(guān)鍵詞。
10.根據(jù)權(quán)利要求6至9任一項所述的裝置,其中,所述存儲器中的惡意關(guān)鍵詞包括論壇名稱關(guān)鍵詞和版塊名稱關(guān)鍵詞; 所述名稱匹配器配置為按照如下方式執(zhí)行匹配操作: 將所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,將所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配; 當(dāng)所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,且所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配時,則確認(rèn)匹配成功; 當(dāng)所述論壇名稱與所述論壇名稱關(guān)鍵詞匹配,且所述版塊名稱關(guān)鍵詞為空時,則確認(rèn)匹配成功; 當(dāng)所述版塊名稱與所述版塊名稱關(guān)鍵詞匹配,且所述論壇名稱關(guān)鍵詞為空時,則確認(rèn)匹配成功; 否則,確認(rèn)匹配失敗,則所述論壇為非惡意論壇。
【文檔編號】H04L29/06GK103475642SQ201310368712
【公開日】2013年12月25日 申請日期:2013年8月22日 優(yōu)先權(quán)日:2013年8月22日
【發(fā)明者】朱珊珊, 林英杰 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司