国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      網(wǎng)絡(luò)垃圾信息過濾架構(gòu)、網(wǎng)絡(luò)垃圾信息清除系統(tǒng)及其方法

      文檔序號:7686001閱讀:270來源:國知局
      專利名稱:網(wǎng)絡(luò)垃圾信息過濾架構(gòu)、網(wǎng)絡(luò)垃圾信息清除系統(tǒng)及其方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及信息過濾技術(shù),特別涉及網(wǎng)絡(luò)垃圾信息過濾架構(gòu)、網(wǎng)絡(luò)垃圾 信息清除系統(tǒng)及網(wǎng)絡(luò)垃圾信息清除方法。
      背景技術(shù)
      近年來,隨著網(wǎng)絡(luò)技術(shù)的推陳出新,在網(wǎng)絡(luò)傳播領(lǐng)域,除網(wǎng)絡(luò)新聞,網(wǎng)
      絡(luò)論壇等傳統(tǒng)網(wǎng)絡(luò)應(yīng)用外,又出現(xiàn)了博客Blog、維基WIKI、聚合新聞RSS 等新形態(tài)的信息交互模式。范圍廣,交互性強、更新速度快的互聯(lián)網(wǎng)傳播從 根本上改變了傳播者與受傳者之間的關(guān)系,是對傳統(tǒng)媒介的傳播模式的解構(gòu) 和顛覆。在網(wǎng)絡(luò)這個人人共同擁有的信息平臺上,傳播者和受傳者處于完全 平等的地位,共同享有根據(jù)自己的需要選擇信息和自由發(fā)表意見和觀點的權(quán) 利。但也正是由于網(wǎng)絡(luò)信息傳播的自由性和快速性,致使網(wǎng)絡(luò)上出現(xiàn)了大量 的垃圾信息,這些垃圾信息的來源以及所帶來的負面影響主要有以下幾個方 面
      1、 非法的營銷者通過大批量的發(fā)送重復垃圾廣告的方式,強占網(wǎng)絡(luò)媒體 最醒目的位置,強迫網(wǎng)友閱讀垃圾商業(yè)廣告。因為缺乏管理和制約,濫發(fā)廣 告的內(nèi)容往往比較低級,被絕大部分網(wǎng)友所厭惡。
      2、 別有用心者利用網(wǎng)絡(luò)媒體大量散步謠言,使不明真相者難以辨別。
      3、 色情及反動等不良信息通過網(wǎng)絡(luò)媒體大量傳播,對社會安定造成不良 影響。
      垃圾信息的一種發(fā)送方式是由機器自動發(fā)送。由機器自動搜集互聯(lián)網(wǎng)上 的信息傳播平臺,通過程序自動注冊發(fā)文用的帳號,并利用程序自動大量地 發(fā)送垃圾信息到信息傳播平臺中,通過占領(lǐng)信息傳播平臺的主要頁面的方式 來達到傳播的目的。
      為了對抗這種機器發(fā)送垃圾信息情況,人們提出了驗證碼技術(shù)。因為用
      計算機程序識別圖像有很高的技術(shù)難度,利用這一特點,驗證碼圖像被廣泛 用來區(qū)分計算機程序和真人。信息傳播平臺會在注冊甚至發(fā)文的時候設(shè)置驗 證碼關(guān)卡,要求注冊者或者發(fā)文者看一張圖片,識別出圖片的內(nèi)容,并用這 種方法屏蔽機器注冊和發(fā)文。常見的驗證碼圖片內(nèi)容是添加了圖像干擾因素 的數(shù)字、字母或者漢字。
      但是驗證碼技術(shù)只能察覺機器自動發(fā)文,不能察覺人工發(fā)送垃圾信息。 自動化批量發(fā)文被驗證碼技術(shù)所屏蔽后,垃圾發(fā)文者仍可以雇傭大量廉價的 兼職人員,手動發(fā)布廣告,通過人工識別驗證碼的方式來規(guī)避驗證碼的攔截。 這種發(fā)文方式相對于自動發(fā)文來說,發(fā)文數(shù)量有所減少,但是會專門對那些 訪問量比較大的精品信息傳播平臺發(fā)動重點攻擊。
      為了規(guī)避人工發(fā)送垃圾信息,并取得更好地屏蔽垃圾信息的效果,人們 又提出了垃圾信息特征屏蔽技術(shù)。其利用垃圾信息共有的一些特征來屏蔽掉 垃圾信息。如現(xiàn)在許多信息傳播平臺的管理軟件中有一個設(shè)定"關(guān)鍵詞"的 功能,管理員可以設(shè)定一些被禁止的"關(guān)鍵詞",在網(wǎng)友發(fā)文中如果出現(xiàn)了某 些"關(guān)鍵詞",則信息傳播平臺會自動屏蔽掉關(guān)鍵詞或者整篇網(wǎng)文。
      除了設(shè)定"關(guān)鍵詞",還可以提取垃圾信息的其它特征信息,如國家專利
      局申請?zhí)枮?00610099111.8的專利提出了 一種垃圾信息過濾方法,其通過提 取垃圾信息的發(fā)送者的名稱來作為過濾途徑,請參見圖1,其包括以下步驟 S101,接收即時信息。
      S103,提取發(fā)送者名稱,在預置的違規(guī)發(fā)送者名稱庫查驗發(fā)送者。其中, 所述違規(guī)發(fā)送者名稱庫存儲在預置時間內(nèi)發(fā)送即時信息次數(shù)超過一定數(shù)值的 發(fā)送者名稱。
      S105,根據(jù)查驗結(jié)果進行判斷。 S107,如果是,則將所述即時信息丟棄。 S109,如果否,則將所述即時信息傳送到指定客戶端顯示。 此垃圾信息過濾方法通過對發(fā)送者的限制,可有效地防止某一發(fā)送者在 短時間內(nèi)發(fā)送大量的垃圾信息,可以更好的維護即時通信系統(tǒng)的應(yīng)用環(huán)境。 但是,現(xiàn)在信息傳播平臺所采用的提取垃圾信息的特征信息的方式來屏
      蔽垃圾信息仍然有其局限性。因為信息傳播平臺的分散性,每個信息傳播平 臺屏蔽垃圾文件的特征信息都保存在各自獨立的數(shù)據(jù)庫中,信息傳播平臺之 間無法共享,造成每個渠道管理員都需要花大量的重復勞動去整理不完整的 垃圾特征信息。而相應(yīng)的,垃圾信息發(fā)送者則會使用各種方法逃避信息傳播 平臺對其的過濾,如變換垃圾信息的形式,添加隨機空格,或添加圖片等方 法,給判斷垃圾信息增加了難度。
      另外,也因為現(xiàn)在各個信息傳播平臺所采用屏蔽垃圾信息的方式不完整, 所以難免會出現(xiàn)"錯殺,,及"漏殺,,的情況。如以"關(guān)鍵詞"的匹配方式作 為垃圾信息判斷準則的,無法應(yīng)對現(xiàn)實中復雜的廣告文情況。像"賣車"和 電話號碼一起出現(xiàn)的時候才是賣車廣告,而"關(guān)4建詞"匹配無法判別一個字 串是否電話號碼,也無法把兩個條件結(jié)合起來。結(jié)果是,要么把所有有"賣 車"的全部刪除,要么把所有電話全部屏蔽,致使"錯殺好人"。又如上述垃 圾信息過濾方法對設(shè)定時間內(nèi)重復發(fā)送的信息的名稱進行屏蔽,會造成普通 發(fā)文者也無法在一定的時間間隔內(nèi)重復發(fā)送信息,而且只要垃圾信息發(fā)送者 變更發(fā)文的間隔,便可以逃過對其垃圾信息的封鎖。
      縱上所述,現(xiàn)在的信息傳播平臺的垃圾信息屏蔽方式存在著不完整性, 而導致出現(xiàn)垃圾信息的"錯殺,,和"漏殺"等問題。

      發(fā)明內(nèi)容
      本發(fā)明的目的是提供一種網(wǎng)絡(luò)垃圾信息過濾架構(gòu),以解決現(xiàn)有技術(shù)中, 信息傳播平臺的垃圾信息屏蔽方式存在著不完整性,而導致出現(xiàn)垃圾信息的 "錯殺"和"漏殺"的問題。
      本發(fā)明的再一目的是提供一種網(wǎng)絡(luò)垃圾信息清除系統(tǒng),以解決現(xiàn)有技術(shù) 中,信息傳播平臺的垃圾信息屏蔽方式存在著不完整性,而導致出現(xiàn)垃圾信 息的"錯殺"和"漏殺"的問題。
      本發(fā)明的另一目的是提供一種網(wǎng)絡(luò)垃圾信息清除方法,以解決現(xiàn)有技術(shù) 中,信息傳播平臺的垃圾信息屏蔽方式存在著不完整性,而導致出現(xiàn)垃圾信 息的"錯殺"和"漏殺"的問題。
      本發(fā)明提出一種網(wǎng)絡(luò)垃圾信息過濾架構(gòu),其包括多個網(wǎng)友終端、至少一 個信息傳播平臺以及網(wǎng)絡(luò)垃圾信息清除系統(tǒng)。網(wǎng)友終端設(shè)置于各種公共場所 或個人場所,用以向互聯(lián)網(wǎng)收發(fā)信息。信息傳播平臺通過網(wǎng)絡(luò)與網(wǎng)友終端相 連,用以與網(wǎng)友終端進行信息交換,及儲存并發(fā)布網(wǎng)友終端上傳的信息。網(wǎng) 絡(luò)垃圾信息清除系統(tǒng)通過網(wǎng)絡(luò)分別與網(wǎng)友終端及信息傳播平臺相連,用以根 據(jù)接受到的網(wǎng)友終端的舉報以及自身的判斷,對信息傳播平臺上發(fā)布的垃圾 信息進行過濾。此網(wǎng)絡(luò)垃圾信息清除系統(tǒng)又包括至少一個舉報端、采集端、 準則建立模塊以及判斷模塊。舉報端用以接收網(wǎng)友終端及工作人員從信息傳 播平臺上發(fā)現(xiàn)的垃圾信息樣本。采集端通過網(wǎng)絡(luò)與信息傳播平臺相連,用以 從信息傳播平臺采集信息。準則建立模塊與舉報端及采集端相連,用以根據(jù) 舉報端接收到的垃圾信息樣本,以及從采集端獲取的信息樣本,采用模式識 別技術(shù)和自然語言處理技術(shù)的成熟算法,提取并存儲垃圾信息的共同特征, 作為垃圾信息的判斷準則,以及根據(jù)垃圾信息的過濾結(jié)果修正已存儲的判斷 準則。判斷模塊與準則建立模塊相連,用以存儲準則建立模塊建立的垃圾信 息的判斷準則,以及利用垃圾信息的判斷準則,對所有的信息傳播平臺上每 曰發(fā)布的信息進行檢查,并將檢查出的垃圾信息進行攔截或屏蔽。
      依照本發(fā)明較佳實施例所述的網(wǎng)絡(luò)垃圾信息過濾架構(gòu),其網(wǎng)絡(luò)垃圾信息 清除系統(tǒng)還包括至少一個管理員終端,管理員終端分別與準則建立模塊及判 斷模塊相連,用以批閱判斷模塊的檢查結(jié)果,將檢查正確的垃圾信息刪除, 并將垃圾信息刪除結(jié)果反饋給準則建立模塊,以對垃圾信息的判斷準則進行 修正。
      依照本發(fā)明較佳實施例所述的網(wǎng)絡(luò)垃圾信息過濾架構(gòu),其網(wǎng)絡(luò)垃圾信息 清除系統(tǒng)還包括人工設(shè)置模塊,其與準則建立模塊相連,用以對準則建立模 塊所建立的垃圾信息的判斷準則進行人工整理, -使準則建立模塊建立垃圾信 息的判斷準則時可以依據(jù)人工的經(jīng)驗。
      依照本發(fā)明較佳實施例所述的網(wǎng)絡(luò)垃圾信息過濾架構(gòu),其網(wǎng)絡(luò)垃圾信息 清除系統(tǒng)還包括信息整理模塊,其與采集端相連,用以將采集端從信息傳播 平臺采集到的信息進行頁面版式分析,濾除頁面廣告和其它網(wǎng)站分類導航信 息,并提取信息的標題、發(fā)布人ID、發(fā)布時間、正文、相關(guān)圖片作為判斷所 采集到的信息是否為垃圾信息的依據(jù)。
      本發(fā)明再提出 一種網(wǎng)絡(luò)垃圾信息清除系統(tǒng),其通過網(wǎng)絡(luò)與至少 一個信息 傳播平臺及多個網(wǎng)友終端相連,用以根據(jù)網(wǎng)友終端及工作人員的舉報濾除信 息傳播平臺上的垃圾信息,其包括至少一個舉報端、采集端、準則建立模塊 以及判斷模塊。舉報端用以接收網(wǎng)友終端及工作人員從信息傳播平臺上發(fā)現(xiàn) 的垃圾信息樣本。采集端通過網(wǎng)絡(luò)與信息傳播平臺相連,用以從信息傳播平 臺采集信息。準則建立模塊與舉報端及采集端相連,用以根據(jù)舉報端接收到 的垃圾信息樣本,以及從采集端獲取的信息樣本,釆用模式識別技術(shù)和自然 語言處理技術(shù)的成熟算法,提取并存儲垃圾信息的共同特征,作為垃圾信息 的判斷準則,以及根據(jù)垃圾信息的過濾結(jié)果修正已存儲的判斷準則。判斷模 塊與準則建立模塊相連,用以存儲準則建立模塊建立的垃圾信息的判斷準則, 以及利用垃圾信息的判斷準則,對所有的信息傳播平臺上每日發(fā)布的信息進
      行檢查,并將^r查出的垃圾信息進行攔截或屏蔽。
      依照本發(fā)明較佳實施例所述的網(wǎng)絡(luò)垃圾信息清除系統(tǒng),其還包括至少一 個管理員終端,管理員終端分別與準則建立模塊及判斷模塊相連,用以批閱 判斷模塊的檢查結(jié)果,將檢查正確的垃圾信息刪除,并將垃圾信息刪除結(jié)果 反饋給準則建立模塊,以對垃圾信息的判斷準則進行修正。
      依照本發(fā)明較佳實施例所述的網(wǎng)絡(luò)垃圾信息清除系統(tǒng),其還包括人工設(shè) 置模塊,其與準則建立模塊相連,用以對準則建立模塊所建立的垃圾信息的 判斷準則進行人工整理,使準則建立模塊建立垃圾信息的判斷準則時可以依 據(jù)人工的經(jīng)驗。
      依照本發(fā)明較佳實施例所述的網(wǎng)絡(luò)垃圾信息清除系統(tǒng),其還包括信息整 理模塊,其與采集端相連,用以將采集端從信息傳播平臺采集到的信息進行 頁面版式分析,濾除頁面廣告和其它網(wǎng)站分類導航信息,并提取信息的標題、 發(fā)布人ID、發(fā)布時間、正文、相關(guān)圖片作為判斷所釆集到的信息是否為垃圾 信息的依據(jù)。
      本發(fā)明另提出一種網(wǎng)絡(luò)垃圾信息清除方法,用以根據(jù)多個網(wǎng)友終端及工
      作人員的舉報濾除至少一個信息傳播平臺上的垃圾信息,其包括以下步驟
      首先,接收網(wǎng)友終端及工作人員從信息傳播平臺上發(fā)現(xiàn)的垃圾信息樣本。其 次,從信息傳播平臺釆集信息。然后,根據(jù)網(wǎng)友終端舉報的垃圾信息樣本, 以及從信息傳播平臺上獲取的信息樣本,采用模式識別技術(shù)和自然語言處理 技術(shù)的成熟算法,并結(jié)合管理員的經(jīng)驗,提取并存儲垃圾信息的共同特征, 作為垃圾信息的判斷準則。最后,利用垃圾信息的判斷準則,對所有的信息 傳播平臺上每日發(fā)布的信息進行檢查,并將檢查出的垃圾信息進行攔截或屏蔽。
      依照本發(fā)明較佳實施例所述的網(wǎng)絡(luò)垃圾信息清除方法,其還包括以下步
      驟首先,對檢查出的并已攔截或屏蔽的垃圾信息進行批閱。然后,將檢查 正確的垃圾信息刪除。最后,反饋垃圾信息的刪除結(jié)果,并依據(jù)刪除結(jié)果對 垃圾信息的判斷準則進行修正。
      相對于現(xiàn)有技術(shù),本發(fā)明具有以下幾個優(yōu)點
      1、 因為垃圾信息發(fā)送的特點是數(shù)量多,重復性高,且垃圾信息發(fā)送者只 有大量散步垃圾信息才能達到其影響目標。本發(fā)明則利用互聯(lián)網(wǎng)將信息傳播 平臺聯(lián)合起來,只要一個垃圾信息被舉報,其特征就會凈皮鎖定,從而被本發(fā) 明的網(wǎng)絡(luò)垃圾信息清除系統(tǒng)相關(guān)的所有的網(wǎng)將信息傳播平臺所禁止。因此, 本發(fā)明可以有效防御垃圾信息的大量復制和傳播。
      2、 本發(fā)明采用自然語言處理技術(shù)和模式識別技術(shù)共同建立垃圾信息的判 斷準則,具有很高的靈活性,可以自動捕捉到不同形式和不斷變化的垃圾文 特征,有效防止對垃圾信息的"漏殺,,。
      3、 本發(fā)明在將垃圾信息屏蔽或攔截后,通過管理員終端進行批閱核實, 經(jīng)確認為垃圾信息后才進行刪除,有效避免了對垃圾信息的"錯殺"。
      4、 本發(fā)明在建立垃圾信息的判斷準則時,可以依據(jù)管理員的知識和經(jīng)驗 來指定,使判斷準則的建立更靈活更準確。


      圖i為國家專利局申請?zhí)枮?00610099111.8的專利實施例的一種垃圾信 息過濾方法流程圖2為本發(fā)明實施例的 一種網(wǎng)絡(luò)垃圾信息過濾架構(gòu)示意圖; 圖3為本發(fā)明實施例的一種網(wǎng)絡(luò)垃圾信息清除系統(tǒng)示意圖; 圖4為本發(fā)明實施例的另 一種網(wǎng)絡(luò)垃圾信息清除系統(tǒng)示意圖; 圖5為本發(fā)明實施例的一種網(wǎng)絡(luò)垃圾信息清除方法示意圖; 圖6為本發(fā)明實施例的另 一種網(wǎng)絡(luò)垃圾信息清除方法示意圖7為本發(fā)明實施例的再一種網(wǎng)絡(luò)垃圾信息過濾架構(gòu)示意圖。
      具體實施例方式
      本發(fā)明的原理是根據(jù)眾多網(wǎng)友終端的舉報建立一個適用于所有信息傳播 平臺的垃圾信息判斷準則,并通過垃圾信息判斷準則來對信息傳播平臺上的 垃圾信息進行過濾,因此參與服務(wù)的信息傳播平臺越多,則垃圾信息判斷準 則就越完善,對垃圾信息的過濾就越有效率。
      以下結(jié)合附圖,具體說明本發(fā)明。
      請參見圖2,其為本發(fā)明實施例的一種網(wǎng)絡(luò)垃圾信息過濾架構(gòu)示意圖。此
      網(wǎng)絡(luò)垃圾信息過濾架構(gòu)包括多個網(wǎng)友終端203、多個信息傳播平臺205以及網(wǎng)
      絡(luò)垃圾信息清除系統(tǒng)207。網(wǎng)友終端203、信息傳播平臺205及網(wǎng)絡(luò)垃圾信息
      清除系統(tǒng)207之間通過互聯(lián)網(wǎng)209相連。網(wǎng)友終端203設(shè)置于各種公共場所
      或個人場所,其可以是個人電腦、手機等具有上網(wǎng)功能的設(shè)備。信息傳播平
      臺205是網(wǎng)上所有可供網(wǎng)友發(fā)表文字、圖片或視頻信息的信息交流平臺,通
      過信息傳播平臺205,大量的網(wǎng)友終端203可以自發(fā)地進行信息交換和交流。
      信息傳播平臺205可以是如論壇、博客、維基WIKI、聚合新聞RSS等信息傳
      播渠道。而網(wǎng)絡(luò)垃圾信息清除系統(tǒng)207的作用是過濾掉指定或所有信息傳播
      平臺205上的垃圾信息,如廣告、謠言等,使眾多網(wǎng)友終端203具有一個良
      好的信息交流環(huán)境。其中,本發(fā)明對信息傳播平臺上垃圾信息的過濾方式分 為報告式與屏蔽式兩種。
      下面對網(wǎng)絡(luò)垃圾信息清除系統(tǒng)的結(jié)構(gòu)與工作方式進行說明,首先來說明
      報告式,請參見圖3 ,其為本發(fā)明實施例的 一種網(wǎng)絡(luò)垃圾信息清除系統(tǒng)結(jié)構(gòu)圖。
      此網(wǎng)絡(luò)垃圾信息清除系統(tǒng)207包括舉報端303、采集端305、準則建立模塊307 以及判斷模塊309。舉報端303及采集端305連接至互聯(lián)網(wǎng),準則建立模塊 307與舉報端303及采集端305相連,判斷模塊309與采集端305及準則建立 模塊307相連。
      此網(wǎng)絡(luò)垃圾信息清除系統(tǒng)207工作時,通過舉報端303接收網(wǎng)友終端203 及工作人員的舉報,即接收其在各種信息傳播平臺205上發(fā)現(xiàn)的垃圾信息的 樣本,如各種網(wǎng)站、論壇上的廣告、反動謠言等。工作人員是指管理舉報端 303的內(nèi)部人員。而網(wǎng)友終端203可以直接通過網(wǎng)絡(luò)向舉才艮端303發(fā)送垃圾信 息樣本,或者也可以在網(wǎng)友終端203處安裝舉報用的軟件,當網(wǎng)友終端203 發(fā)現(xiàn)垃圾信息時通過軟件來抓取并發(fā)送,方便網(wǎng)友終端203的操作。若網(wǎng)友 終端203的數(shù)量比較龐大,可以設(shè)置多個舉報端303來接收及處理舉報的樣 本。
      在舉報端303接收舉報的同時,采集端305實時從各種信息傳播平臺205 上采集每日更新的所有信息,如論壇中網(wǎng)友終端203發(fā)表的文章、圖片等。 可以通過在采集端305設(shè)置采集路徑,并指定對哪些信息傳播平臺205進行
      信息采集。其中,采集端305所采集的信息包括垃圾信息,也包括非垃圾信

      ("、0
      而準則建立模塊307根據(jù)科艮端303接收到的垃圾信息樣本,以及從采 集端305獲取的信息樣本,采用模式識別技術(shù)和自然語言處理技術(shù)的成熟算 法,提取并存儲垃圾信息的共同特征,作為垃圾信息的判斷準則,并存放到 判斷模塊309中。自然語言處理技術(shù)是利用計算機信息技術(shù)處理自然語言, 是人工智能和計算機語言學的一個分支。它研究自然語言的自動生成和機器 理解的問題。本發(fā)明利用這個技術(shù)自動理解網(wǎng)絡(luò)文字的傾向和意圖,挑選出 那些有不良意圖的網(wǎng)絡(luò)信息,讓疑似垃圾信息的網(wǎng)絡(luò)信息自動地從海量的發(fā) 文中暴露出來?;谥悄苤形姆衷~的關(guān)鍵詞、敏感詞等自動檢測技術(shù),可以 有效地輔助發(fā)現(xiàn)并預警垃圾信息。模式識別技術(shù)(Pattern Recognition)是指 對表征事物或現(xiàn)象地各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進行
      處理和分析,以對事物或現(xiàn)象進行描述、辨認、分類和理解的過程,是信息 科學和人工智能的重要組成部分。包括文本識別、語義識別、圖像識別、聲 音識別、視頻識別等多個應(yīng)用領(lǐng)域。本發(fā)明利用這個領(lǐng)域中自動對事物進行 "辨別"和"分類"的技術(shù),自動地尋找出垃圾信息共同地特征,自動地建 立垃圾信息地判別準則。才莫式識別技術(shù)具有可礦展性,即可以從少量地垃圾 信息樣本中,總結(jié)出適用于所有垃圾信息地判別準則。所以本發(fā)明利用模式 識別技術(shù)和自然語言處理技術(shù)的成熟算法可以對垃圾信息進行準確的歸類與 總結(jié),靈活地處理具有各種特征或者不斷變化的垃圾信息,并且可以根據(jù)網(wǎng)
      友終端203及工作人員的舉報來實時改進與更新垃圾信息的判斷準則。
      應(yīng)用最廣的模式識別技術(shù)是進行文字識別,如通過手寫板輸入簽名,并 由計算機自動判斷是不是本人的簽名。計算機要識別本人的簽名,就必須要 獲取正面和負面兩方面的樣本,正面樣本是本人的字跡,而負面樣本是其他 人的字跡。模式識別的方法通過計算和比較,找出本人的字跡與其他人字跡 相比最顯著的特征,最簡單的特征可能是本人在書寫某些特定筆畫的時候的 書寫方向、速度和力度的變化(比如,本人寫一個勾的時候,豎與提之間的 夾角不會超過30度…)。計算機將這些特征以判別準則的形式存儲起來,新出 現(xiàn)一個簽名,計算機提取這個新簽名的相應(yīng)特征,參照判別準則來判定是否 是本人的簽名。而在垃圾信息處理的過程中,也有判斷垃圾文和非垃圾文的 問題。同樣也需要通過分析正負樣本,獲取垃圾文的特征,然后建立判別準 則。就是運用模式識別的技術(shù),做垃圾信息區(qū)分的過程。
      最簡單的自然語言處理技術(shù)是分詞。比如,"科學研究不能有一點馬虎"。 做分詞的時候,計算^L自動將句子切分成科學研究l不能l有|一點|馬虎。 句中只有一個名詞詞組(科學研究),計算機就知道這句話是關(guān)于科學研究 的,而不是關(guān)于"馬"或者"虎"這兩種動物的。通過自然語言處理方法, 計算機可以部分"理解"文章。幫助本人們區(qū)分垃圾信息。
      建立了垃圾信息的判斷準則后,由判斷模塊309利用垃圾信息的判斷準 則,對采集端305獲取的信息傳播平臺上每日發(fā)布的信息進行檢查,并將檢 查出的垃圾信息進行攔截或屏蔽。這樣,本發(fā)明的網(wǎng)絡(luò)垃圾信息清除系統(tǒng)207
      可以對互聯(lián)網(wǎng)上所有的或指定的信息傳播平臺205進行監(jiān)控,所以, 一個垃 圾信息只要被一個網(wǎng)友終端203及工作人員舉報,就會將其從所有相關(guān)的信 息傳播平臺205上屏蔽掉,極為有效地防御了垃圾信息的大量復制和傳播。 另外,因為每個信息傳播平臺205可能會有其獨有的特征,所以可以在判斷 模塊309中為采集端305所采集的每個信息傳播平臺205設(shè)置相應(yīng)的特殊準 則庫,并在檢查垃圾信息時結(jié)合特殊準則庫,使判斷更加準確。
      其中,采集端305與舉報端303也可以是同一個連接到互聯(lián)網(wǎng),而具有 不同軟件功能的裝置來實現(xiàn)其各自不同的功能。
      請參見圖4,其為本發(fā)明實施例的再一種網(wǎng)絡(luò)垃圾信息清除系統(tǒng)示意圖。 此網(wǎng)絡(luò)垃圾信息清除系統(tǒng)207包括舉報端303、采集端305、準則建立模塊307、 判斷模塊309、管理員終端403、人工設(shè)置模塊405、以及信息整理模塊407。 舉報端303及采集端305連接至互聯(lián)網(wǎng),準則建立模塊307與舉報端303及 采集端305相連,判斷模塊309與采集端305及準則建立模塊307相連。管 理員終端403分別與準則建立模塊307及判斷模塊309相連。人工設(shè)置模塊 405與準則建立模塊307相連。信息整理模塊407與采集端305相連。
      此網(wǎng)絡(luò)垃圾信息清除系統(tǒng)207工作時,通過舉才艮端303接收網(wǎng)友終端203 及工作人員的舉報并接收其在各種信息傳播平臺205上發(fā)現(xiàn)的垃圾信息的樣 本,如各種網(wǎng)站、論壇上的廣告、反動謠言等。同時,采集端305從各種信 息傳播平臺205上采集具有普遍代表性的信息,如論壇中網(wǎng)友終端203發(fā)表 的文章、圖片等,普遍代表性的信息包括垃圾信息,也包括非垃圾信息。然 后由信息整理模塊407將采集端305從信息傳播平臺采集到的信息進行頁面 版式分析,濾除頁面廣告和其它網(wǎng)站分類導航信息,并提取信息的標題、發(fā) 布人ID、發(fā)布時間、正文、相關(guān)圖片作為判斷所采集到的信息是否為垃圾信 息的依據(jù),此信息整理^t塊407的作用是將采集到的海量的信息提取所需要 的部分,使后續(xù)的檢查工作更便捷,減少判斷模塊309的工作量。而準則建 立模塊307根據(jù)舉報端303接收到的垃圾信息樣本,以及從釆集端305獲取 的信息樣本,采用模式識別技術(shù)和自然語言處理技術(shù)的成熟算法,提取并存 儲垃圾信息的共同特征,作為垃圾信息的判斷準則,并存放在判斷模塊309
      中。另外,本實施例還可以根據(jù)人工經(jīng)驗并結(jié)合判斷垃圾信息的歷史記錄,
      通過人工設(shè)置模塊405對判斷準則進行調(diào)整,充分利用人腦的智慧,使垃圾 信息的判斷準則更加準確。
      建立了垃圾信息的判斷準則后,由判斷模塊309利用垃圾信息的判斷準 則,對采集端305獲取的信息傳播平臺上每日發(fā)布的信息進行檢查,并將檢 查出的垃圾信息進行攔截或屏蔽。為了避免判斷模塊309將非垃圾信息屏蔽 掉,因而本實施例還設(shè)置了管理員終端403,管理員終端403對判斷模塊309 屏蔽掉的垃圾信息進行批閱,并最終將判斷模塊309判斷正確的垃圾信息刪 除。若管理員終端403發(fā)現(xiàn)判斷模塊309判斷錯誤的非垃圾信息被屏蔽,則 解除判斷模塊309對其的屏蔽。并且,管理員終端403還可以將垃圾信息刪 除結(jié)果反饋給準則建立模塊307,以對垃圾信息的判斷準則進行修正。其中, 人工設(shè)置模塊405的功能也可以由管理員終端403來完成,即管理員可以憑 借自身對垃圾信息的判斷經(jīng)驗來對判斷準則進行設(shè)置。
      下面介紹屏蔽式的網(wǎng)絡(luò)垃圾信息清除系統(tǒng),請參見圖7,其為本發(fā)明再一 種網(wǎng)絡(luò)垃圾信息過濾架構(gòu)示意圖。此網(wǎng)絡(luò)垃圾信息過濾架構(gòu)中的網(wǎng)絡(luò)垃圾信 息清除系統(tǒng)207包括舉報端303、采集端305、準則建立模塊307以及判斷模 塊309。舉報端303、采集端305及判斷模塊309連接至互聯(lián)網(wǎng),準則建立模 塊307分別與舉報端303、采集端305及判斷模塊309相連。
      此網(wǎng)絡(luò)垃圾信息清除系統(tǒng)207在工作過程中,由舉才艮端303接收網(wǎng)友終 端203及工作人員的舉報,即接收其在各種信息傳播平臺205上發(fā)現(xiàn)的垃圾 信息的樣本。同時由采集端305采集信息傳播平臺205上具有普遍代表性的 信息,如多個圖片信息中的一個具有代表性的信息,其中采集端305的工作 也可以由人工來完成。而準則建立模塊307根據(jù)舉報端303接收到的垃圾信 息樣本,以及從采集端305獲取的代表性的信息樣本,采用模式識別技術(shù)和 自然語言處理技術(shù)的成熟算法,提取并存儲垃圾信息的共同特征,作為垃圾 信息的判斷準則,并存放到判斷模塊309中。
      而判斷模塊309直接根據(jù)垃圾信息的判斷準則對各種信息傳播平臺205 進行過濾,并濾除符合準則的垃圾信息。也即是說,判斷模塊309通過互聯(lián)
      網(wǎng)209與信息傳播平臺205緊密地結(jié)合在一起的,在網(wǎng)友終端203向信息傳 播平臺205提交信息的時候直接判別是否是垃圾信息,是垃圾則直接屏蔽。 相當于在網(wǎng)友終端203和信息傳播平臺205之間插入了判別模塊309進行過 濾。因此,屏蔽式的網(wǎng)絡(luò)垃圾信息清除系統(tǒng)207無需采集信息傳播平臺上的 所有信息,但是需要與信息傳播平臺205的深度合作。
      另外,屏蔽式的網(wǎng)絡(luò)垃圾信息清除系統(tǒng)207也可以引入上述信息管理模 塊407、管理員終端403及人工設(shè)置模塊405的功能,使垃圾信息的過濾功能 更加完善。
      本發(fā)明還提出 一種網(wǎng)絡(luò)垃圾信息清除系統(tǒng),其通過網(wǎng)絡(luò)與至少 一個信息 傳播平臺及多個網(wǎng)友終端相連,用以根據(jù)網(wǎng)友終端及工作人員的舉報濾除信 息傳播平臺上的垃圾信息,其結(jié)構(gòu)與功能與前述網(wǎng)絡(luò)垃圾信息過濾架構(gòu)中的 網(wǎng)絡(luò)垃圾信息清除系統(tǒng)207相同,此處不再復述。
      本發(fā)明另提出 一種網(wǎng)絡(luò)垃圾信息清除方法,用以根據(jù)多個網(wǎng)友終端及工 作人員的舉報濾除至少一個信息傳播平臺上的垃圾信息,請參見圖5,其為本 發(fā)明實施例的 一種網(wǎng)絡(luò)垃圾信息清除方法示意圖。
      S501,接收網(wǎng)友終端及工作人員從信息傳播平臺上發(fā)現(xiàn)的垃圾信息樣本。
      網(wǎng)友終端可以直接通過網(wǎng)絡(luò)發(fā)送垃圾信息樣本,或者也可以在網(wǎng)友終端處安裝舉報用的軟件,當網(wǎng)友終端發(fā)現(xiàn)垃圾信息時通過軟件來抓取并發(fā)送,方便網(wǎng)友終端的操作。工作人員是指對網(wǎng)友終端舉報的垃圾信息進行管理的 人員,其本身也可以進行舉報。
      S503,從信息傳播平臺采集信息。其中,從信息傳播平臺上所釆集的信息可以是如論壇中上每日發(fā)表的文章、圖片等網(wǎng)文。
      S505,根據(jù)舉報的垃圾信息樣本,以及從信息傳播平臺上獲取的信息樣本,采用模式識別技術(shù)和自然語言處理技術(shù)的成熟算法,并結(jié)合管理員的經(jīng) 驗,提取并存儲垃圾信息的共同特征,作為垃圾信息的判斷準則。
      自然語言處理技術(shù)是利用計算機信息技術(shù)處理自然語言,是人工智能和計算機語言學的一個分支。它研究自然語言的自動生成和機器理解的問題。
      本發(fā)明利用這個技術(shù)自動理解網(wǎng)絡(luò)文字的傾向和意圖,挑選出那些有不良意 圖的網(wǎng)絡(luò)信息,讓疑似垃圾信息的網(wǎng)絡(luò)信息自動地從海量的發(fā)文中暴露出來。 基于智能中文分詞的關(guān)鍵詞、敏感詞等自動檢測技術(shù),可以有效地輔助發(fā)現(xiàn)
      并預警垃圾信息。模式識別技術(shù)(Pattern Recognition)是指對表征事物或現(xiàn) 象地各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進行處理和分析,以 對事物或現(xiàn)象進行描述、辨認、分類和理解的過程,是信息科學和人工智能 的重要組成部分。包括文本識別、語義識別、圖像識別、聲音識別、視頻識 別等多個應(yīng)用領(lǐng)域。本發(fā)明利用這個領(lǐng)域中自動對事物進行"辨別"和"分 類,,的技術(shù),自動地尋找出垃圾信息共同地特征,自動地建立垃圾信息地判 別準則。模式識別技術(shù)具有可礦展性,即可以從少量地垃圾信息樣本中,總 結(jié)出適用于所有垃圾信息地判別準則。所以本發(fā)明利用模式識別技術(shù)和自然 語言處理技術(shù)的成熟算法可以對垃圾信息進行準確的歸類與總結(jié),靈活地處 理具有各種特征或者不斷變化的垃圾信息,并且可以根據(jù)網(wǎng)友終端及工作人 員的舉報來實時改進與更新垃圾信息的判斷準則。
      應(yīng)用最廣的模式識別技術(shù)是進行文字識別,如通過手寫板輸入簽名,并 由計算機自動判斷是不是本人的簽名。計算機要識別本人的簽名,就必須要 獲取正面和負面兩方面的樣本,正面樣本是本人的字跡,而負面樣本是其他 人的字跡。模式識別的方法通過計算和比較,找出本人的字跡與其他人字跡 相比最顯著的特征,最簡單的特征可能是本人在書寫某些特定筆畫的時候的 書寫方向、速度和力度的變化(比如,本人寫一個勾的時候,豎與提之間的 夾角不會超過30度...)。計算機將這些特征以判別準則的形式存儲起來,新出 現(xiàn)一個簽名,計算機提取這個新簽名的相應(yīng)特征,參照判別準則來判定是否 是本人的簽名。而在垃圾信息處理的過程中,也有判斷垃圾文和非垃圾文的 問題。同樣也需要通過分析正負樣本,獲取垃圾文的特征,然后建立判別準 則。就是運用模式識別的技術(shù),做垃圾信息區(qū)分的過程。
      最簡單的自然語言處理技術(shù)是分詞。比如,"科學研究不能有一點馬虎"。 做分詞的時候,計算機自動將句子切分成科學研究l不能l有|一點|馬虎。 句中只有一個名詞詞組(科學研究),計算機就知道這句話是關(guān)于科學研究
      的,而不是關(guān)于"馬"或者"虎"這兩種動物的。通過自然語言處理方法, 計算機可以部分"理解,,文章。幫助本人們區(qū)分垃圾信息。
      S507,利用垃圾信息的判斷準則,對信息傳播平臺上每日發(fā)布的信息進 行檢查,并將檢查出的垃J及信息進行攔截或屏蔽。
      這樣,采用本發(fā)明的網(wǎng)絡(luò)垃圾信息清除方法可以對互聯(lián)網(wǎng)上所有的或指 定的信息傳播平臺進行監(jiān)控,所以, 一個垃圾信息只要被舉報,就會將其從 所有相關(guān)的信息傳播平臺上屏蔽掉,極為有效地防御了垃圾信息的大量復制 和傳播。
      請參見圖6,其為本發(fā)明實施例的另一種網(wǎng)絡(luò)垃圾信息清除方法示意圖。 S601,接收網(wǎng)友終端及工作人員從信息傳播平臺上發(fā)現(xiàn)的垃圾信息樣本。 S603,從信息傳播平臺采集信息。
      S605,根據(jù)舉報的垃圾信息樣本,以及從信息傳播平臺上獲取的信息樣 本,采用模式識別技術(shù)和自然語言處理技術(shù)的成熟算法,并結(jié)合管理員的經(jīng) 驗,提取并存儲垃圾信息的共同特征,作為垃圾信息的判斷準則。
      S607,利用垃圾信息的判斷準則,對信息傳播平臺上每日發(fā)布的信息進 行檢查,并將檢查出的垃圾信息進行攔截或屏蔽。
      S609,對檢查出的并已攔截或屏蔽的垃圾信息進行批閱。 S611,將檢查正確的垃圾信息刪除。
      S613,反饋垃圾信息的刪除結(jié)果,并依據(jù)刪除結(jié)果對垃圾信息的判斷準 則進行修正。
      為了避免將非垃圾信息屏蔽掉,因而本實施例還對屏蔽或屏蔽的垃圾信息 進行批閱。若發(fā)現(xiàn)檢查錯誤的非垃圾信息被屏蔽,則解除對其的屏蔽。并且, 還可以將垃圾信息刪除結(jié)果進行反饋,以對垃圾信息的判斷準則進行修正。
      相對于現(xiàn)有技術(shù),本發(fā)明具有以下幾個優(yōu)點
      1、因為垃圾信息發(fā)送的特點是數(shù)量多,重復性高,且垃圾信息發(fā)送者只 有大量散步垃圾信息才能達到其影響目標。本發(fā)明則利用互聯(lián)網(wǎng)將信息傳播
      平臺聯(lián)合起來,只要一個垃圾信息被舉報,其特征就會被鎖定,從而被本發(fā) 明的網(wǎng)絡(luò)垃圾信息清除系統(tǒng)相關(guān)的所有的網(wǎng)將信息傳播平臺所禁止。因此, 本發(fā)明可以有效防御垃圾信息的大量復制和傳播。
      2、 本發(fā)明采用自然語言處理技術(shù)和模式識別技術(shù)共同建立垃圾信息的判 斷準則,具有很高的靈活性,可以自動捕捉到不同形式和不斷變化的垃圾文 特征,有效防止對垃圾信息的"漏殺"。
      3、 本發(fā)明在將垃圾信息屏蔽或攔截后,通過管理員終端進行批閱核實, 經(jīng)確認為垃圾信息后才進行刪除,有效避免了對垃圾信息的"錯殺"。
      4、 本發(fā)明在建立垃圾信息的判斷準則時,可以依據(jù)管理員的知識和經(jīng)驗 來指定,使判斷準則的建立更靈活、更準確、更人性化。
      以上公開的僅為本發(fā)明的幾個具體實施例,但本發(fā)明并非局限于此,任 何本領(lǐng)域的技術(shù)人員能思之的變化,都應(yīng)落在本發(fā)明的保護范圍內(nèi)。
      權(quán)利要求
      1、一種網(wǎng)絡(luò)垃圾信息過濾架構(gòu),其特征在于,包括多個網(wǎng)友終端,其設(shè)置于各種公共場所或個人場所,用以向互聯(lián)網(wǎng)收發(fā)信息;至少一個信息傳播平臺,其通過網(wǎng)絡(luò)與該些網(wǎng)友終端相連,用以與該些網(wǎng)友終端進行信息交換,及儲存并發(fā)布該些網(wǎng)友終端上傳的信息;一網(wǎng)絡(luò)垃圾信息清除系統(tǒng),其通過網(wǎng)絡(luò)分別與該些網(wǎng)友終端及該些信息傳播平臺相連,用以根據(jù)接受到的該些網(wǎng)友終端的舉報以及自身的判斷,對該些信息傳播平臺上發(fā)布的垃圾信息進行過濾,其又包括至少一個舉報端,用以接收該些網(wǎng)友終端及工作人員從該些信息傳播平臺上發(fā)現(xiàn)的垃圾信息樣本;一采集端,其通過網(wǎng)絡(luò)與該些信息傳播平臺相連,用以從該些信息傳播平臺采集信息;一準則建立模塊,其與該些舉報端及該采集端相連,用以根據(jù)該些舉報端接收到的垃圾信息樣本,以及從該采集端獲取的信息樣本,采用模式識別技術(shù)和自然語言處理技術(shù)的成熟算法,提取并存儲垃圾信息的共同特征,作為垃圾信息的判斷準則,以及根據(jù)垃圾信息的過濾結(jié)果修正已存儲的判斷準則;一判斷模塊,其與該準則建立模塊相連,用以存儲該準則建立模塊建立的垃圾信息的判斷準則,以及利用垃圾信息的判斷準則,對所有的信息傳播平臺上每日發(fā)布的信息進行檢查,并將檢查出的垃圾信息進行攔截或屏蔽。
      2、 如權(quán)利要求1所述的網(wǎng)絡(luò)垃圾信息過濾架構(gòu),其特征在于,其網(wǎng)絡(luò)垃 圾信息清除系統(tǒng)還包括至少 一個管理員終端,該些管理員終端分別與該準則 建立模塊及該判斷模塊相連,其用以批閱該判斷模塊的檢查結(jié)果,將檢查正 確的垃圾信息刪除,并將垃圾信息刪除結(jié)果反饋給準則建立模塊,以對垃圾 信息的判斷準則進行修正。
      3、 如權(quán)利要求1所述的網(wǎng)絡(luò)垃圾信息過濾架構(gòu),其特征在于,其網(wǎng)絡(luò)垃 圾信息清除系統(tǒng)還包括一人工設(shè)置模塊,其與該準則建立模塊相連,用以對 該準則建立模塊所建立的垃圾信息的判斷準則進行人工整理,使該準則建立 模塊建立垃圾信息的判斷準則時可以依據(jù)人工的經(jīng)驗。
      4、 如權(quán)利要求1所述的網(wǎng)絡(luò)垃圾信息過濾架構(gòu),其特征在于,其網(wǎng)絡(luò)垃 圾信息清除系統(tǒng)還包括一信息整理模塊,其與該采集端相連,用以將該采集 端從該些信息傳播平臺采集到的信息進行頁面版式分析,濾除頁面廣告和其 它網(wǎng)站分類導航信息,并提取信息的標題、發(fā)布人ID、發(fā)布時間、正文、相 關(guān)圖片作為判斷所采集到的信息是否為垃圾信息的依據(jù)。
      5、 一種網(wǎng)絡(luò)垃圾信息清除系統(tǒng),其通過網(wǎng)絡(luò)與至少一個信息傳播平臺及 多個網(wǎng)友終端相連,用以根據(jù)該些網(wǎng)友終端及工作人員的舉報濾除該些信息 傳播平臺上的垃圾信息,其包括至少一個舉報端,用以接收該些網(wǎng)友終端及工作人員從該些信息傳播平 臺上發(fā)現(xiàn)的垃圾信息樣本;一采集端,其通過網(wǎng)絡(luò)與該些信息傳播平臺相連,用以從該些信息傳播 平臺采集信息;一準則建立模塊,其與該些舉報端及該采集端相連,用以根據(jù)該些舉報 端接收到的垃圾信息樣本,以及從該采集端獲取的信息樣本,采用模式識別 技術(shù)和自然語言處理技術(shù)的成熟算法,提取并存儲垃圾信息的共同特征,作 為垃圾信息的判斷準則,以及根據(jù)垃圾信息的過濾結(jié)果修正已存儲的判斷準 則;一判斷模塊,其與該準則建立模塊相連,用以存儲該準則建立模塊建立 的垃圾信息的判斷準則,以及利用垃圾信息的判斷準則,對所有的信息傳播 平臺上每日發(fā)布的信息進行檢查,并將檢查出的垃圾信息進行攔截或屏蔽。
      6、 如權(quán)利要求5所述的網(wǎng)絡(luò)垃圾信息清除系統(tǒng),其特征在于,其還包括 至少 一個管理員終端,該些管理員終端分別與該準則建立模塊及該判斷模塊 相連,其用以批閱該判斷模塊的檢查結(jié)果,將檢查正確的垃圾信息刪除,并 將垃圾信息刪除結(jié)果反饋給準則建立模塊,以對垃圾信息的判斷準則進行修正。
      7、 如權(quán)利要求5所述的網(wǎng)絡(luò)垃圾信息清除系統(tǒng),其特征在于,其還包括 一人工設(shè)置模塊,其與該準則建立模塊相連,用以對該準則建立模塊所建立 的垃圾信息的判斷準則進行人工整理,使該準則建立模塊建立垃圾信息的判 斷準則時可以依據(jù)人工的經(jīng)驗。
      8、 如權(quán)利要求5所述的網(wǎng)絡(luò)垃圾信息清除系統(tǒng),其特征在于, 一信息整 理模塊,其與該采集端相連,用以將該采集端從該些信息傳播平臺采集到的 信息進行頁面版式分析,濾除頁面廣告和其它網(wǎng)站分類導航信息,并提取信 息的標題、發(fā)布人ID、發(fā)布時間、正文、相關(guān)圖片作為判斷所采集到的信息 是否為垃圾信息的依據(jù)。
      9、 一種網(wǎng)絡(luò)垃圾信息清除方法,用以根據(jù)多個網(wǎng)友終端及工作人員的舉 報濾除至少 一個信息傳播平臺上的垃圾信息,其包括以下步驟接收該些網(wǎng)友終端及工作人員從該些信息傳播平臺上發(fā)現(xiàn)的垃圾信息樣本;從該些信息傳播平臺采集信息;根據(jù)該些網(wǎng)友終端舉報的垃圾信息樣本,以及從該些信息傳播平臺上獲 取的信息樣本,采用模式識別技術(shù)和自然語言處理技術(shù)的成熟算法,并結(jié)合 管理員的經(jīng)驗,提^F又并存儲垃圾信息的共同特征,作為垃圾信息的判斷準則;利用垃圾信息的判斷準則,對所有的信息傳播平臺上每日發(fā)布的信息進 行檢查,并將檢查出的垃圾信息進行攔截或屏蔽。
      10、 如權(quán)利要求9所述的網(wǎng)絡(luò)垃圾信息清除方法,其特征在于,還包括 以下步驟對檢查出的并已攔截或屏蔽的垃圾信息進行批閱; 將檢查正確的垃圾信息刪除;反饋垃圾信息的刪除結(jié)果,并依據(jù)刪除結(jié)果對垃圾信息的判斷準則進行修正。
      全文摘要
      本發(fā)明提出一種網(wǎng)絡(luò)垃圾信息過濾架構(gòu)、網(wǎng)絡(luò)垃圾信息清除系統(tǒng)及其方法,其網(wǎng)絡(luò)垃圾信息過濾架構(gòu)包括多個網(wǎng)友終端、至少一個信息傳播平臺以及網(wǎng)絡(luò)垃圾信息清除系統(tǒng)。信息傳播平臺通過網(wǎng)絡(luò)與網(wǎng)友終端相連。網(wǎng)絡(luò)垃圾信息清除系統(tǒng)通過網(wǎng)絡(luò)分別與網(wǎng)友終端及信息傳播平臺相連。網(wǎng)絡(luò)垃圾信息清除系統(tǒng)又包括至少一個舉報端、采集端、準則建立模塊以及判斷模塊。本發(fā)明通過網(wǎng)絡(luò)垃圾信息清除系統(tǒng)對可以一個或多個信息傳播平臺上的垃圾信息進行過濾,且本發(fā)明能夠有效防御垃圾信息的大量復制及傳播,以及不會出現(xiàn)對垃圾信息的“錯殺”、“漏殺”。
      文檔編號H04L12/58GK101340308SQ20081004186
      公開日2009年1月7日 申請日期2008年8月19日 優(yōu)先權(quán)日2008年8月19日
      發(fā)明者焦天石, 翁時鋒 申請人:翁時鋒;焦天石
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1