專利名稱:針對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行剪裁和過(guò)濾的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在互聯(lián)網(wǎng)使用過(guò)程中針對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行剪裁和過(guò)濾的方法,屬于計(jì)算機(jī)技術(shù)領(lǐng)域。
背景技術(shù):
隨著互聯(lián)網(wǎng)和手機(jī)產(chǎn)品的發(fā)展,越來(lái)越多的用戶選擇手機(jī)上網(wǎng),使用手機(jī)上網(wǎng)方便,快捷,靈活。但在信息高速發(fā)展的時(shí)代,我們面臨的又是信息爆炸問(wèn)題,網(wǎng)絡(luò)流量問(wèn)題和訪問(wèn)速度問(wèn)題,而手機(jī)又不具備普通PC機(jī)大屏幕,操作方便的優(yōu)點(diǎn),如果能在小屏幕手機(jī)上快速的獲得所需信息,使用戶能夠清晰明了看到關(guān)注焦點(diǎn),獲得關(guān)鍵數(shù)據(jù),就會(huì)達(dá)到事半功倍的效果。因此,我們采取對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行特定裁剪和過(guò)濾,屏蔽冗余內(nèi)容,獲得預(yù)定信息,有效快捷的對(duì)內(nèi)容進(jìn)行精準(zhǔn)定位。
發(fā)明內(nèi)容
本發(fā)明目的在于提供一種面向?qū)ヂ?lián)網(wǎng)網(wǎng)頁(yè)進(jìn)行內(nèi)容提取過(guò)濾的應(yīng)用軟件構(gòu)件模型,按此方法提取的網(wǎng)頁(yè)內(nèi)容滿足特定需求。網(wǎng)頁(yè)內(nèi)容的剪裁和過(guò)濾要依據(jù)原始數(shù)據(jù),按照既定需求實(shí)現(xiàn)內(nèi)容提取。在方法規(guī)劃時(shí),考慮提取內(nèi)容的多變性、靈活些和易操作性,設(shè)計(jì)了用于網(wǎng)頁(yè)內(nèi)容分析提取的函數(shù)解釋器,這些函數(shù)解釋器被指定分擔(dān)一些簡(jiǎn)單數(shù)據(jù)處理任務(wù),并且由過(guò)濾部分完成特定的數(shù)據(jù)處理任務(wù),將數(shù)據(jù)處理結(jié)果匯聚到輸出語(yǔ)句;按照本發(fā)明的所構(gòu)建的系統(tǒng)在運(yùn)行時(shí),它們按照數(shù)據(jù)規(guī)劃接受查詢、簡(jiǎn)單處理、輸出等任務(wù),將信息傳回主控系統(tǒng)。顯然現(xiàn)有軟件構(gòu)件模型不適用于對(duì)網(wǎng)絡(luò)原始內(nèi)容過(guò)濾提取的應(yīng)用。在本發(fā)明中,考慮到網(wǎng)站內(nèi)容的有效性和實(shí)時(shí)性的特點(diǎn),提出了內(nèi)容過(guò)濾器和規(guī)則解釋器的處理模式。內(nèi)容過(guò)濾器是運(yùn)行在移動(dòng)互聯(lián)網(wǎng)中的任何一個(gè)網(wǎng)站之上,對(duì)網(wǎng)站內(nèi)容進(jìn)行內(nèi)容選取的過(guò)濾器。該過(guò)濾器是根據(jù)此類應(yīng)用場(chǎng)景所提出的需求,例如網(wǎng)絡(luò)流量低,內(nèi)容簡(jiǎn)潔清晰,硬件資源有限,可適用大多數(shù)網(wǎng)站等特點(diǎn),實(shí)現(xiàn)了一種通過(guò)正文檢索對(duì)原有網(wǎng)站內(nèi)容進(jìn)行實(shí)時(shí)選取、過(guò)濾和整合的技術(shù)方法。規(guī)則解釋器是構(gòu)成規(guī)則文件分析處理的執(zhí)行單元,對(duì)預(yù)編譯的規(guī)則文件執(zhí)行解釋輸出,獲得預(yù)定義的網(wǎng)頁(yè)內(nèi)容。規(guī)則解釋器為規(guī)則解釋應(yīng)用程序提供了常量解釋器,變量解釋器,查詢解釋器,嵌套解釋器,置換解釋器, 提取解釋器,循環(huán)解釋器,校驗(yàn)解釋器,字串拼合解釋器,模板解釋器,調(diào)用c程序解釋器, 輸出解釋器等。每個(gè)函數(shù)解釋器都有輸入輸出端子,執(zhí)行一定的功能,得到預(yù)定內(nèi)容。不僅有利于用戶訪問(wèn)INTERNET時(shí)減少網(wǎng)絡(luò)流量,減少信息冗余,對(duì)信息進(jìn)行精準(zhǔn)定位;同時(shí)也可對(duì)用戶進(jìn)行定制,針對(duì)不同類型用戶,獲取對(duì)應(yīng)的關(guān)注內(nèi)容。本發(fā)明適用于對(duì)網(wǎng)頁(yè)內(nèi)容實(shí)現(xiàn)剪裁和過(guò)濾,按本發(fā)明實(shí)現(xiàn)的系統(tǒng)能夠滿足完成頻繁的內(nèi)容提取和過(guò)濾這項(xiàng)重要需求,也能滿足應(yīng)用的多樣性需求,對(duì)那些限制網(wǎng)絡(luò)流量和要求數(shù)據(jù)精準(zhǔn)定位的應(yīng)用提供很好的支持。
圖1用于說(shuō)明裁剪和過(guò)濾處理系統(tǒng)。圖2用于說(shuō)明規(guī)則解釋器處理系統(tǒng)。
具體實(shí)施例方式本發(fā)明目的在于提供一種面向?qū)ヂ?lián)網(wǎng)網(wǎng)頁(yè)進(jìn)行內(nèi)容提取過(guò)濾的應(yīng)用軟件構(gòu)件模型。按本發(fā)明提取的網(wǎng)頁(yè)內(nèi)容滿足特定需求如降低網(wǎng)絡(luò)流量和獲取精準(zhǔn)內(nèi)容,其網(wǎng)頁(yè)內(nèi)容的有效性和充分性承擔(dān)從一般網(wǎng)站到我們普通的互聯(lián)網(wǎng)網(wǎng)站資源,總體上需要充分發(fā)揮有限資源利用率的最大化,還要保證響應(yīng)內(nèi)容的實(shí)時(shí)有效性等特點(diǎn),同時(shí)也能滿足應(yīng)用的多樣性需求,對(duì)那些沒有實(shí)時(shí)性要求的應(yīng)用或任務(wù)提供很好的支持。這樣的需求無(wú)論是個(gè)人網(wǎng)站,還是商業(yè)網(wǎng)站都是不能滿足需求。內(nèi)容過(guò)濾是裁剪過(guò)濾的核心,是解決網(wǎng)站內(nèi)容冗余、網(wǎng)絡(luò)數(shù)據(jù)過(guò)多的關(guān)鍵。處理在進(jìn)行內(nèi)容過(guò)濾時(shí)執(zhí)行內(nèi)容過(guò)濾器和規(guī)則解釋器外,在應(yīng)用程序設(shè)計(jì)階段增加了規(guī)則文件編寫工作,就能將一個(gè)完整的網(wǎng)頁(yè)數(shù)據(jù)分解為若干個(gè)小塊數(shù)據(jù)流才能符合這種內(nèi)容裁剪過(guò)濾的需求。內(nèi)容過(guò)濾器是運(yùn)行在移動(dòng)互聯(lián)網(wǎng)中的任何一個(gè)網(wǎng)站之上,基于規(guī)則解釋器對(duì)網(wǎng)站內(nèi)容進(jìn)行內(nèi)容選取、信息過(guò)濾、服務(wù)聚合等操作的過(guò)濾器器。該過(guò)濾器是根據(jù)此類應(yīng)用場(chǎng)景所提出的需求,例如網(wǎng)絡(luò)流量低,內(nèi)容簡(jiǎn)潔清晰,硬件資源有限,可適用大多數(shù)網(wǎng)站等特點(diǎn),實(shí)現(xiàn)了一種通過(guò)正文檢索對(duì)原有網(wǎng)站內(nèi)容進(jìn)行實(shí)時(shí)選取、過(guò)濾和整合的技術(shù)方法。在內(nèi)容過(guò)濾器系統(tǒng)中,通過(guò)規(guī)則解釋器解釋執(zhí)行預(yù)定義地規(guī)則文件,實(shí)現(xiàn)對(duì)原有網(wǎng)頁(yè)內(nèi)容的分析,從而可以獲得關(guān)鍵數(shù)據(jù),減少信息冗余,快捷地獲得預(yù)定內(nèi)容,達(dá)到事半功倍的效果。在本發(fā)明中,考慮到網(wǎng)絡(luò)資源數(shù)據(jù)雖具有多樣性,但卻保持標(biāo)簽一致性的特定,提出了規(guī)則解釋器過(guò)濾模型。規(guī)則解釋器是一個(gè)處理執(zhí)行系統(tǒng),是一個(gè)或一系列開放的規(guī)則執(zhí)行過(guò)程,是本裁剪過(guò)濾方法的基本調(diào)度單位。規(guī)則解釋器為應(yīng)用程序提供了常量解釋器, 變量解釋器,查詢解釋器,嵌套解釋器,置換解釋器,提取解釋器,循環(huán)解釋器,校驗(yàn)解釋器, 字串拼合解釋器,模板解釋器,調(diào)用c程序解釋器,輸出解釋器等。每個(gè)函數(shù)解釋器都有輸入輸出,執(zhí)行一定的功能,得到預(yù)定內(nèi)容。規(guī)則解釋器執(zhí)行處理了預(yù)定義的規(guī)則文件,所謂規(guī)則文件是由一系列規(guī)則解釋語(yǔ)句組成,方便用于程序?qū)崿F(xiàn),它針對(duì)特定用戶需求,對(duì)原始網(wǎng)頁(yè)進(jìn)行分析識(shí)別出符合特定需求的網(wǎng)頁(yè)內(nèi)容。下面結(jié)合相應(yīng)的
此方法實(shí)現(xiàn)的關(guān)鍵點(diǎn)。圖1說(shuō)明剪裁和過(guò)濾處理系統(tǒng)。通過(guò)網(wǎng)絡(luò)傳入原始數(shù)據(jù),過(guò)濾器中規(guī)則文件進(jìn)行解釋,獲取該網(wǎng)頁(yè)所對(duì)應(yīng)的規(guī)則函數(shù),以原始數(shù)據(jù)為源,通過(guò)規(guī)則解釋器對(duì)規(guī)則函數(shù)進(jìn)行語(yǔ)句解析,獲得既定內(nèi)容。圖2說(shuō)明規(guī)則解釋器處理系統(tǒng)。給出了規(guī)則解釋器的工作處理過(guò)程,對(duì)規(guī)則文件進(jìn)行分析,根據(jù)規(guī)則文件中的規(guī)則語(yǔ)句執(zhí)行對(duì)應(yīng)函數(shù)解釋器,獲得處理進(jìn)行輸出。工業(yè)應(yīng)用性本發(fā)明可用于對(duì)網(wǎng)絡(luò)內(nèi)容進(jìn)行裁剪過(guò)濾,按本發(fā)明實(shí)現(xiàn)的過(guò)濾系統(tǒng)滿足對(duì)互聯(lián)網(wǎng)網(wǎng)頁(yè)的有效性和實(shí)時(shí)性的需求。 以上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種針對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行剪裁和過(guò)濾的方法,其特征在于,其支持對(duì)特定于互聯(lián)網(wǎng)網(wǎng)站的內(nèi)容過(guò)濾和規(guī)則解釋;內(nèi)容過(guò)濾和規(guī)則解釋是通過(guò)對(duì)預(yù)定義的一個(gè)或一系列的規(guī)則語(yǔ)句的執(zhí)行過(guò)程,是該裁剪過(guò)濾的基本調(diào)度單位。
2.如權(quán)利要求1所屬的內(nèi)容過(guò)濾器和規(guī)則解釋器系統(tǒng),其支持符合HTML和WML語(yǔ)法的內(nèi)容過(guò)濾,翻譯解釋,通過(guò)對(duì)預(yù)定義的規(guī)則文件的執(zhí)行處理,得到特定過(guò)濾、裁減內(nèi)容,并將其進(jìn)行呈現(xiàn)。
全文摘要
本發(fā)明針對(duì)一般的網(wǎng)頁(yè)內(nèi)容,通過(guò)特定裁減和過(guò)濾的方法,提供符合特定標(biāo)準(zhǔn)的內(nèi)容,并符合呈現(xiàn)的條件。
文檔編號(hào)G06F17/30GK102567356SQ20101060005
公開日2012年7月11日 申請(qǐng)日期2010年12月22日 優(yōu)先權(quán)日2010年12月22日
發(fā)明者奉旭輝, 張斌, 顧玉良 申請(qǐng)人:北京凱思昊鵬軟件工程技術(shù)有限公司