国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法

      文檔序號(hào):7972462閱讀:292來(lái)源:國(guó)知局
      專利名稱:網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種創(chuàng)建交互式網(wǎng)頁(yè)應(yīng)用的網(wǎng)頁(yè)開(kāi)發(fā)技術(shù),尤其涉及一種基于網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法。
      背景技術(shù)
      現(xiàn)有的互聯(lián)網(wǎng)技術(shù),如AJAX(全稱為“Asynchronous JavaScriptand XML”,譯為“異步JavaScript和XML”),是指一種創(chuàng)建交互式網(wǎng)頁(yè)應(yīng)用的網(wǎng)頁(yè)開(kāi)發(fā)技術(shù),它有機(jī)地組合了以下幾種技術(shù)基于web標(biāo)準(zhǔn)(全稱為“standards-based presentation”,譯為互聯(lián)網(wǎng))XHTML+CSS的表示,XHTML全稱為“The ExtensibleHyperText Markup Language”(譯為“可擴(kuò)展標(biāo)識(shí)語(yǔ)言”),CSS全稱為“Cascading style Sheets”(譯作“層疊樣式表單”);使用XML和XSLT進(jìn)行數(shù)據(jù)交換及相關(guān)操作,XML全稱為“Extensible Markup Language”(譯為“可擴(kuò)展標(biāo)記語(yǔ)言”),XSLT全稱為“eXtensible Stylesheet Language Transformation”,是一種用來(lái)轉(zhuǎn)換XML文檔結(jié)構(gòu)的語(yǔ)言;使用DOM進(jìn)行動(dòng)態(tài)顯示及交互,DOM全稱為“Document ObjectModel”,即文檔對(duì)象模型,XML將數(shù)據(jù)組織為一顆樹,所以DOM就是對(duì)這顆樹的一個(gè)對(duì)象描敘;通俗的說(shuō),就是通過(guò)解析XML文檔,為XML文檔在邏輯上建立一個(gè)樹模型,樹的節(jié)點(diǎn)是一個(gè)個(gè)對(duì)象,我們通過(guò)存取這些對(duì)象就能夠存取XML文檔的內(nèi)容;RSS是站點(diǎn)用來(lái)和其他站點(diǎn)之間共享內(nèi)容的一種簡(jiǎn)易方式(也叫聚合內(nèi)容)的技術(shù)。最初源自瀏覽器“新聞?lì)l道”的技術(shù),現(xiàn)在通常被用于新聞和其他按順序排列的網(wǎng)站,例如博客;RSS的幾個(gè)縮寫來(lái)源1、Really Simple Syndication(真正簡(jiǎn)易的聚合),2、Rich Site Summary(豐富的站點(diǎn)摘要),3、RDF Site Summary(RDF站點(diǎn)摘要);API就是應(yīng)用程序編程接口,它是能用來(lái)操作組件、應(yīng)用程序或者操作系統(tǒng)的一組函數(shù);典型的情況下,API由一個(gè)或多個(gè)提供某種特殊功能的程序模塊組成;使用XMLHttpRequest進(jìn)行異步數(shù)據(jù)查詢、檢索,XMLHttpRequest是一套可以在Javascript、VbScript、Jscript等腳本語(yǔ)言中通過(guò)http協(xié)議傳送或從接收XML及其他數(shù)據(jù)的一套API;使用JavaScript將所有的東西綁定在一起,JavaScript是一種基于對(duì)象(Object)和事件驅(qū)動(dòng)(Event Driven)并具有安全性能的腳本語(yǔ)言;類似于DHTML或LAMP,AJAX不是指一種單一的技術(shù),而是有機(jī)地利用了一系列相關(guān)的技術(shù)。AJAX的應(yīng)用使用支持以上技術(shù)的web瀏覽器作為運(yùn)行平臺(tái),這些最常用的瀏覽器目前包括MozillaFirefox、Internet Explorer、Opera、Konqueror及Safari。DHTML全稱“Dynamic HTML”,是指HTML、CSS和客戶端腳本的一種集成;LAMP是LINUX+APACHE+MYSQL+PHP四個(gè)開(kāi)源軟件的英文第一個(gè)子母的縮寫,HTML全稱為“Hyper Text Mark-up Language”(是指“超文本標(biāo)記語(yǔ)言”),XPATH是用來(lái)幫助XSLT在XML源文檔中查找定位信息的語(yǔ)言。
      傳統(tǒng)的web應(yīng)用允許用戶填寫表單,當(dāng)提交表單時(shí)就向web服務(wù)器發(fā)送一個(gè)請(qǐng)求;服務(wù)器接收并處理傳來(lái)的表單,然后返回一個(gè)新的網(wǎng)頁(yè)。這個(gè)做法浪費(fèi)了許多帶寬,因?yàn)樵谇昂髢蓚€(gè)頁(yè)面中的大部分HTML代碼往往是相同的;由于每次應(yīng)用的交互都需要向服務(wù)器發(fā)送請(qǐng)求,應(yīng)用的響應(yīng)時(shí)間就依賴于服務(wù)器的響應(yīng)時(shí)間,這導(dǎo)致了用戶界面的響應(yīng)比本地應(yīng)用慢得多。
      與此不同,AJAX應(yīng)用可以僅向服務(wù)器發(fā)送并取回必需的數(shù)據(jù),它使用SOAP或其它一些基于XML的web service接口,并在客戶端采用JavaScript處理來(lái)自服務(wù)器的響應(yīng)。因?yàn)樵诜?wù)器和瀏覽器之間交換的數(shù)據(jù)大量減少,結(jié)果我們就能看到響應(yīng)更快的應(yīng)用。同時(shí)很多的處理工作可以在發(fā)出請(qǐng)求的客戶端機(jī)器上完成,所以網(wǎng)速大大加快。
      在互聯(lián)網(wǎng)上,用戶獲取信息方式有兩種,第一是不知道信息源,利用搜索引擎來(lái)查找信息;第二種是知道信息源,通過(guò)收藏夾或書簽記錄信息源的鏈接,來(lái)分別訪問(wèn)這些網(wǎng)站。大量實(shí)踐表明,收藏鏈接多了,與用戶相關(guān)信息比較分散,無(wú)法有效管理,時(shí)間長(zhǎng)了容易忘記檢查重要信息的更新。
      為此,用戶具有對(duì)于網(wǎng)頁(yè)微內(nèi)容的提取、聚合和自動(dòng)更新功能的需求,用戶需要對(duì)互聯(lián)網(wǎng)信息進(jìn)行跟蹤、采集、處理和挖掘,給每一個(gè)網(wǎng)絡(luò)客戶自由的空間,提供用戶之間交流平臺(tái),提供分享的功能,根據(jù)行業(yè)領(lǐng)域的需求來(lái)整合所有自己感興趣的網(wǎng)絡(luò)內(nèi)容和網(wǎng)絡(luò)服務(wù),重新打造出一個(gè)個(gè)全新的縱深的網(wǎng)絡(luò)平臺(tái),并幫助用戶創(chuàng)造自己的商業(yè)價(jià)值,因此對(duì)于微內(nèi)容和元數(shù)據(jù)的創(chuàng)建、發(fā)布、同步、瀏覽、聽(tīng)取等應(yīng)用需要新的處理方法。

      發(fā)明內(nèi)容
      針對(duì)現(xiàn)有技術(shù)存在的問(wèn)題,本發(fā)明所要解決的技術(shù)問(wèn)題是要提供一種有效地根據(jù)網(wǎng)頁(yè)內(nèi)容的功能來(lái)分區(qū)網(wǎng)頁(yè)微內(nèi)容,并將網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新,通過(guò)AJAX技術(shù)讓用戶在瀏覽器端選擇感興趣的微內(nèi)容,并通過(guò)DHTML將選擇的微內(nèi)容群通過(guò)鼠標(biāo)拖拽進(jìn)行排版,動(dòng)態(tài)生成用戶個(gè)性化的頁(yè)面,其中的微內(nèi)容將隨原網(wǎng)頁(yè)的更新而更新。
      為達(dá)上述目的,本發(fā)明基于網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法,其特征是包括下述步驟①、用戶端輸入網(wǎng)頁(yè)的地址,向后臺(tái)服務(wù)器端發(fā)出訪問(wèn)請(qǐng)求,由服務(wù)器端的網(wǎng)頁(yè)抓取子系統(tǒng)通過(guò)http協(xié)議下載網(wǎng)頁(yè)的html內(nèi)容,檢查數(shù)據(jù)的完整性和語(yǔ)法的合法性,將合法的內(nèi)容傳遞到服務(wù)器端的網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng);②、服務(wù)器端的網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng)解析html文本數(shù)據(jù),然后按超鏈接群標(biāo)記不同的微內(nèi)容板塊或欄目,以及原始微內(nèi)容的父輩節(jié)點(diǎn),然后將標(biāo)記的html文本內(nèi)容傳回到用戶端;③、服務(wù)器端的微內(nèi)容選擇子系統(tǒng),分析內(nèi)容中的標(biāo)記并聯(lián)系對(duì)應(yīng)的鼠標(biāo)事件,用戶通過(guò)鼠標(biāo)左右鍵的操作,選中原始微內(nèi)容或其父輩節(jié)點(diǎn),并可以多選,添加到用戶端微內(nèi)容桌面子系統(tǒng);此時(shí)當(dāng)系統(tǒng)給出一個(gè)取消指令,系統(tǒng)返回步驟①;否則繼續(xù)進(jìn)行步驟④;④、用戶端微內(nèi)容桌面子系統(tǒng)提供多頁(yè)面、多欄目和自由排版等編輯功能,使用戶使用簡(jiǎn)單的鼠標(biāo)點(diǎn)擊和拖拽到相關(guān)對(duì)應(yīng)項(xiàng)目,完成頁(yè)面的布置;⑤、服務(wù)器端的微內(nèi)容比較子系統(tǒng)應(yīng)用抓取子系統(tǒng)定時(shí)更新用戶定制的信息,比較兩個(gè)時(shí)點(diǎn)的網(wǎng)頁(yè)內(nèi)容,并過(guò)濾出更新的內(nèi)容以備用戶端微內(nèi)容桌面子系統(tǒng)的查詢及提醒服務(wù)的需求。
      進(jìn)一步的,在步驟④完成后,所述用戶端桌面子系統(tǒng)數(shù)據(jù)更新過(guò)程包括在微內(nèi)容桌面子系統(tǒng)中應(yīng)用非同步的xmlhttprequest協(xié)議,啟動(dòng)微內(nèi)容自動(dòng)更新子系統(tǒng)定時(shí)向服務(wù)器查詢最新更新,并用最新的信息替換頁(yè)面上的信息。
      本發(fā)明利用網(wǎng)絡(luò)微信息提取和聚合方法,用戶可以把常去網(wǎng)頁(yè)的欄目剪切下來(lái),通過(guò)簡(jiǎn)簡(jiǎn)單單的拖動(dòng)操作,就可以創(chuàng)建編輯不同主題的頁(yè)面。利用AJAX動(dòng)態(tài)服務(wù)聚合方法,將豐富多彩的網(wǎng)絡(luò)服務(wù)管理起來(lái),用戶可以在桌面上進(jìn)行搜索,關(guān)注股票、跟蹤新聞,查閱來(lái)自不同郵箱的郵件,閱讀博客等各項(xiàng)網(wǎng)絡(luò)服務(wù),還能很方便的引進(jìn)第三方的服務(wù)。該方法突破了一般在線RSS聚合器的局限,不僅僅支持RSS聚合,而且可以跟蹤、解析和聚合來(lái)自任意網(wǎng)頁(yè)的內(nèi)容(包括不支持RSS或其它API的網(wǎng)站),并且支持內(nèi)容的發(fā)散。網(wǎng)站制作人,博客作家可以借此方法轉(zhuǎn)播來(lái)自其它網(wǎng)站的動(dòng)態(tài)內(nèi)容加入自己的網(wǎng)頁(yè)和博客中。
      本發(fā)明的積極效果如下免費(fèi)的網(wǎng)絡(luò)監(jiān)測(cè)工具,能幫用戶隨時(shí)監(jiān)測(cè)所有感興趣的網(wǎng)站(如拍賣物品的竟價(jià)狀況、股票、交通、天氣預(yù)報(bào)和在線交易等)歷史記錄,并隨時(shí)給你更新內(nèi)容的提醒;免費(fèi)讓用戶建立自己的個(gè)人桌面,而桌面內(nèi)容可來(lái)自用戶喜愛(ài)的其它任意網(wǎng)站,幫用戶實(shí)現(xiàn)與朋友共享自己的個(gè)人桌面;能夠一邊聽(tīng)音樂(lè),一邊在線聊天,一邊看網(wǎng)絡(luò)新聞而從不錯(cuò)過(guò)一次重要的在線活動(dòng);能夠做到,用戶無(wú)論在哪兒,都能收到自己定制的網(wǎng)絡(luò)及時(shí)信息;能整合用戶所有的Email帳戶,像新浪、搜狐、網(wǎng)易、21CN、126、Yahoo信箱、Gmail信箱、Hotmail等都可以匯聚在個(gè)人桌面上。


      圖1為本發(fā)明實(shí)施例的系統(tǒng)模塊圖;圖2為本發(fā)明實(shí)施例注釋文件的邏輯流程圖;圖3為本發(fā)明實(shí)施例的系統(tǒng)邏輯控制圖。
      具體實(shí)施例方式
      為能進(jìn)一步了解本發(fā)明的特征、技術(shù)手段以及所達(dá)到的具體目的、功能,下面結(jié)合附圖與具體實(shí)施方式
      對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述本發(fā)明相關(guān)結(jié)構(gòu)主要包括以下系統(tǒng)(或部件)網(wǎng)頁(yè)抓取子系統(tǒng)1、網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng)2、微內(nèi)容選擇子系統(tǒng)3、微內(nèi)容桌面子系統(tǒng)4、微內(nèi)容自動(dòng)更新子系統(tǒng)5、微內(nèi)容比較子系統(tǒng)6構(gòu)成的。
      本發(fā)明基于實(shí)現(xiàn)網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)方法的主要流程包括下述步驟①、用戶端輸入網(wǎng)頁(yè)的地址,向后臺(tái)服務(wù)器端發(fā)出訪問(wèn)請(qǐng)求,由服務(wù)器端的網(wǎng)頁(yè)抓取子系統(tǒng)1通過(guò)http協(xié)議下載網(wǎng)頁(yè)的html內(nèi)容,檢查數(shù)據(jù)的完整性和語(yǔ)法的合法性,將合法的內(nèi)容傳遞到服務(wù)器端的網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng)2;②、服務(wù)器端的網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng)2解析html文本數(shù)據(jù),然后按超鏈接群標(biāo)記不同的微內(nèi)容板塊或欄目,以及原始微內(nèi)容的父輩節(jié)點(diǎn),然后將標(biāo)記的html文本內(nèi)容傳回到用戶端;③、服務(wù)器端的微內(nèi)容選擇子系統(tǒng)3,分析內(nèi)容中的標(biāo)記并聯(lián)系對(duì)應(yīng)的鼠標(biāo)事件,用戶通過(guò)鼠標(biāo)左右鍵的操作,選中原始微內(nèi)容或其父輩節(jié)點(diǎn),并可以多選,添加到用戶端微內(nèi)容桌面子系統(tǒng)4;此時(shí)當(dāng)系統(tǒng)給出一個(gè)取消指令,系統(tǒng)返回步驟①;否則繼續(xù)進(jìn)行步驟④;④、用戶端微內(nèi)容桌面子系統(tǒng)4提供多頁(yè)面、多欄目和自由排版等編輯功能,使用戶使用簡(jiǎn)單的鼠標(biāo)點(diǎn)擊和拖拽到相關(guān)對(duì)應(yīng)項(xiàng)目,完成頁(yè)面的布置;⑤、服務(wù)器端的微內(nèi)容比較子系統(tǒng)6應(yīng)用抓取子系統(tǒng)定時(shí)更新用戶定制的信息,比較兩個(gè)時(shí)點(diǎn)的網(wǎng)頁(yè)內(nèi)容,并過(guò)濾出更新的內(nèi)容以備用戶端微內(nèi)容桌面子系統(tǒng)4的查詢及提醒服務(wù)的需求。
      在步驟④完成后,所述用戶端桌面子系統(tǒng)數(shù)據(jù)更新過(guò)程包括在微內(nèi)容桌面子系統(tǒng)4中應(yīng)用非同步的xmlhttprequest協(xié)議,啟動(dòng)微內(nèi)容自動(dòng)更新子系統(tǒng)5定時(shí)向服務(wù)器查詢最新更新,并用最新的信息替換頁(yè)面上的信息。
      步驟①所述的網(wǎng)頁(yè)抓取子系統(tǒng)1,是一組服務(wù)器端軟件模塊,根據(jù)用戶提供的網(wǎng)頁(yè)地址,模仿互聯(lián)網(wǎng)瀏覽器向目標(biāo)網(wǎng)站發(fā)送HTTP請(qǐng)求,并附帶HTTP請(qǐng)求相關(guān)的COOKIE等相關(guān)信息;接收目標(biāo)網(wǎng)站返回的網(wǎng)頁(yè)內(nèi)容——HTML超文本鏈接代碼,分析代碼的完整性和合法性,并處理返回錯(cuò)誤和超時(shí)。
      步驟①所述的網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng)2,是一組服務(wù)器端軟件模塊,分析和標(biāo)記由網(wǎng)頁(yè)抓取子系統(tǒng)返回的網(wǎng)頁(yè)內(nèi)容——HTML超文本鏈接代碼;首先解析HTML超文本鏈接代碼為DOM數(shù)據(jù)結(jié)構(gòu),然后遍歷DOM樹結(jié)構(gòu),找到超文本鏈接群,并定義為微內(nèi)容,標(biāo)記微內(nèi)容結(jié)點(diǎn)和其父結(jié)點(diǎn)。
      步驟②所述的超鏈接群,是在網(wǎng)頁(yè)中由超鏈接組成的內(nèi)容板塊。例如,新浪新聞網(wǎng)頁(yè)中的“國(guó)內(nèi)新聞”,“體育新聞”。一般是由網(wǎng)頁(yè)編輯根據(jù)內(nèi)容信息分類或優(yōu)先次序,并通過(guò)HTML標(biāo)記出的一組超鏈接。
      步驟③所述的微內(nèi)容選擇子系統(tǒng)3,是一組在客戶瀏覽器里運(yùn)行的javascript腳本,分析由服務(wù)器端網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng)生成的帶有標(biāo)記的HTML代碼,在微內(nèi)容結(jié)點(diǎn)上設(shè)置相應(yīng)鼠標(biāo)事件;當(dāng)用戶在被操作頁(yè)面上移動(dòng)鼠標(biāo)時(shí),用不同顏色呈現(xiàn)微內(nèi)容區(qū)域,用戶點(diǎn)鼠標(biāo)左鍵將選中該微內(nèi)容,如果繼續(xù)點(diǎn)鼠標(biāo)左鍵將擴(kuò)大選中的范圍,用戶可以多選,用戶鼠標(biāo)移動(dòng)到任意選中的微內(nèi)容區(qū)域,并點(diǎn)鼠標(biāo)右鍵將取消選中的區(qū)域;用戶確認(rèn)完成后,本子系統(tǒng)將用戶所有選中的微內(nèi)容的編號(hào)通過(guò)XMLHTTPREQUEST發(fā)回服務(wù)器。
      步驟③所述的微內(nèi)容桌面子系統(tǒng)4是一組在客戶瀏覽器里運(yùn)行的javascript腳本。讓用戶通過(guò)鼠標(biāo)的拖拽調(diào)整所添加的微內(nèi)容模塊的大小,位置,顏色和版式等布局。其原理是通過(guò)動(dòng)態(tài)改變?yōu)g覽器中網(wǎng)頁(yè)的DOM樹結(jié)構(gòu),讓用戶自己可以調(diào)整自己網(wǎng)頁(yè)的內(nèi)容,布局和風(fēng)格。并能夠添加,刪除微內(nèi)容模塊和多頁(yè)面。將相關(guān)設(shè)置信息保持到服務(wù)器端的數(shù)據(jù)庫(kù)。當(dāng)用戶再次打開(kāi)自己的頁(yè)面時(shí),本系統(tǒng)將動(dòng)態(tài)的將上述設(shè)置信息從服務(wù)器端下載,并根據(jù)設(shè)置信息,向服務(wù)器加載微內(nèi)容信息和其他功能模塊。
      步驟⑤所述的微內(nèi)容比較子系統(tǒng)6,是一組服務(wù)器端軟件模塊,對(duì)同一網(wǎng)頁(yè)的不同版本的內(nèi)容進(jìn)行比較;除了需要不同版本的完整內(nèi)容,還需要知道被定制的微內(nèi)容板塊的編號(hào);本系統(tǒng)采用網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng),對(duì)新舊內(nèi)容進(jìn)行分析和標(biāo)記,在新內(nèi)容中尋找和被定制微內(nèi)容相同XPATH的微內(nèi)容模塊,如果找到就將該微內(nèi)容列入成功更新的隊(duì)列,否則列入需要修復(fù)的隊(duì)列供微內(nèi)容自動(dòng)更新子系統(tǒng)進(jìn)一步處理。
      上述的微內(nèi)容自動(dòng)更新子系統(tǒng)5,是一組服務(wù)器端軟件模塊,定時(shí)通過(guò)網(wǎng)頁(yè)抓取子系統(tǒng)獲得用戶目標(biāo)網(wǎng)頁(yè)的最新內(nèi)容,并通過(guò)微內(nèi)容比較子系統(tǒng),將目標(biāo)網(wǎng)頁(yè)的最新內(nèi)容和數(shù)據(jù)庫(kù)里存儲(chǔ)的內(nèi)容進(jìn)行比較;過(guò)濾出更新了的微內(nèi)容,同時(shí)更新數(shù)據(jù)庫(kù)里完整的網(wǎng)頁(yè)內(nèi)容和相關(guān)的微內(nèi)容;如果在最新內(nèi)容中找不到定制的微內(nèi)容板塊,將此板塊放入需要修復(fù)的名單中,等待維護(hù)人員,人工修復(fù);如果人工修復(fù)過(guò)程還是找不到相應(yīng)內(nèi)容,就刪除該微內(nèi)容板塊,當(dāng)微內(nèi)容板塊被用戶加載時(shí),本系統(tǒng)將返回提示信息,告知本微內(nèi)容板塊不存在,用戶可以選擇重新定制。
      采用了本發(fā)明的‘i的’web2.0個(gè)人桌面與傳統(tǒng)靜態(tài)視窗桌面相比,其最大優(yōu)勢(shì)在于,它管理的是在線的信息和服務(wù)。是流動(dòng)的,是隨時(shí)更新的,也就是說(shuō)永遠(yuǎn)是最新最快的!它為信息的共享與協(xié)作處理事務(wù)提供了天然良好的支持,為用戶創(chuàng)造了與時(shí)俱進(jìn)的有利保障!它打破了傳統(tǒng)的應(yīng)用程序發(fā)布,安裝和升級(jí)的模式,方便安全,隨時(shí)upgrade,永遠(yuǎn)on line!通過(guò)以上方法,任何用戶都可以創(chuàng)造和產(chǎn)生微內(nèi)容,一則網(wǎng)志、一篇文章、一幅圖片、一個(gè)收藏的書簽……,但這不是最重要的,因?yàn)樵赪eb 1.0時(shí)代也可以創(chuàng)造眾多微內(nèi)容,但Web 2.0最重要的是“可重用”,通過(guò)微內(nèi)容的結(jié)構(gòu)化(xml)、開(kāi)放性(開(kāi)放API)以及工具無(wú)關(guān)性(如用RSS可以使用多種工具來(lái)聚合和利用這些微內(nèi)容,不必局限于生成內(nèi)容的原始網(wǎng)站),網(wǎng)站變?yōu)榱丝勺x寫的服務(wù),用戶可以在任何地方使用這些微內(nèi)容,用戶將直接參與網(wǎng)站內(nèi)容層面的構(gòu)建,最大程度的展示個(gè)人的作用,達(dá)成個(gè)性化的豐富應(yīng)用。
      目前而言,該技術(shù)是現(xiàn)在全球唯一能對(duì)任意網(wǎng)頁(yè)(HTML)內(nèi)容進(jìn)行提取和聚合的新型操作系統(tǒng),突破了一般在線RSS聚合器的局限。不僅僅支持RSS聚合,而且可以跟蹤、解析和聚合來(lái)自任意網(wǎng)頁(yè)的內(nèi)容(包括不支持RSS或其它API的網(wǎng)站),并且支持內(nèi)容的發(fā)散。網(wǎng)站制作人,博客作家可以借此方法轉(zhuǎn)播來(lái)自其它網(wǎng)站的動(dòng)態(tài)內(nèi)容加入自己的網(wǎng)頁(yè)和博客中。
      與現(xiàn)有技術(shù)比較簡(jiǎn)表

      以上所舉實(shí)施例僅用為方便舉例說(shuō)明本發(fā)明,并非對(duì)本發(fā)明作任何形式上的限制,任何所屬技術(shù)領(lǐng)域中具有通常知識(shí)者,若在不脫離本發(fā)明所提技術(shù)特征的范圍內(nèi),利用本發(fā)明所揭示技術(shù)內(nèi)容所作出局部更動(dòng)或修飾的等效實(shí)施例,并未脫離本發(fā)明的技術(shù)特征內(nèi)容,均仍屬于本發(fā)明技術(shù)特征的范圍內(nèi)。
      權(quán)利要求
      1.本發(fā)明基于網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法,其特征是包括下述步驟①、用戶端輸入網(wǎng)頁(yè)的地址,向后臺(tái)服務(wù)器端發(fā)出訪問(wèn)請(qǐng)求,由服務(wù)器端的網(wǎng)頁(yè)抓取子系統(tǒng)(1)通過(guò)http協(xié)議下載網(wǎng)頁(yè)的html內(nèi)容,檢查數(shù)據(jù)的完整性和語(yǔ)法的合法性,將合法的內(nèi)容傳遞到服務(wù)器端的網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng)(2);②、服務(wù)器端的網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng)(2)解析html文本數(shù)據(jù),然后按超鏈接群標(biāo)記不同的微內(nèi)容板塊或欄目,以及原始微內(nèi)容的父輩節(jié)點(diǎn),然后將標(biāo)記的html文本內(nèi)容傳回到用戶端;③、服務(wù)器端的微內(nèi)容選擇子系統(tǒng)(3),分析內(nèi)容中的標(biāo)記并聯(lián)系對(duì)應(yīng)的鼠標(biāo)事件,用戶通過(guò)鼠標(biāo)左右鍵的操作,選中原始微內(nèi)容或其父輩節(jié)點(diǎn),并可以多選,添加到用戶端微內(nèi)容桌面子系統(tǒng)(4);此時(shí)當(dāng)系統(tǒng)給出一個(gè)取消指令,系統(tǒng)返回步驟①;否則繼續(xù)進(jìn)行步驟④;④、用戶端微內(nèi)容桌面子系統(tǒng)(4)提供多頁(yè)面、多欄目和自由排版等編輯功能,使用戶使用簡(jiǎn)單的鼠標(biāo)點(diǎn)擊和拖拽到相關(guān)對(duì)應(yīng)項(xiàng)目,完成頁(yè)面的布置;⑤、服務(wù)器端的微內(nèi)容比較子系統(tǒng)(6)應(yīng)用抓取子系統(tǒng)定時(shí)更新用戶定制的信息,比較兩個(gè)時(shí)點(diǎn)的網(wǎng)頁(yè)內(nèi)容,并過(guò)濾出更新的內(nèi)容以備用戶端微內(nèi)容桌面子系統(tǒng)(4)的查詢及提醒服務(wù)的需求。
      2.根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法中,其特征在于步驟④完成后,所述用戶端桌面子系統(tǒng)數(shù)據(jù)更新過(guò)程包括在微內(nèi)容桌面子系統(tǒng)(4)中應(yīng)用非同步的xmlhttprequest協(xié)議,啟動(dòng)微內(nèi)容自動(dòng)更新子系統(tǒng)(5)定時(shí)向服務(wù)器查詢最新更新,并用最新的信息替換頁(yè)面上的信息。
      3.根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法中,其特征在于步驟①所述的網(wǎng)頁(yè)抓取子系統(tǒng)(1),是一組服務(wù)器端軟件模塊,根據(jù)用戶提供的網(wǎng)頁(yè)地址,模仿互聯(lián)網(wǎng)瀏覽器向目標(biāo)網(wǎng)站發(fā)送HTTP請(qǐng)求,并附帶HTTP請(qǐng)求相關(guān)的COOKIE等相關(guān)信息;接收目標(biāo)網(wǎng)站返回的網(wǎng)頁(yè)內(nèi)容——HTML超文本鏈接代碼,分析代碼的完整性和合法性,并處理返回錯(cuò)誤和超時(shí)。
      4.根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法中,其特征在于步驟①所述的網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng)(2),是一組服務(wù)器端軟件模塊,分析和標(biāo)記由網(wǎng)頁(yè)抓取子系統(tǒng)返回的網(wǎng)頁(yè)內(nèi)容——HTML超文本鏈接代碼;首先解析HTML超文本鏈接代碼為DOM數(shù)據(jù)結(jié)構(gòu),然后遍歷DOM樹結(jié)構(gòu),找到超文本鏈接群,并定義為微內(nèi)容,標(biāo)記微內(nèi)容結(jié)點(diǎn)和其父結(jié)點(diǎn)。
      5.根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法中,其特征在于步驟③所述的微內(nèi)容選擇子系統(tǒng)(3),是一組在客戶瀏覽器里運(yùn)行的javascript腳本,分析由服務(wù)器端網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng)生成的帶有標(biāo)記的HTML代碼,在微內(nèi)容結(jié)點(diǎn)上設(shè)置相應(yīng)鼠標(biāo)事件;當(dāng)用戶在被操作頁(yè)面上移動(dòng)鼠標(biāo)時(shí),用不同顏色呈現(xiàn)微內(nèi)容區(qū)域,用戶點(diǎn)鼠標(biāo)左鍵將選中該微內(nèi)容,如果繼續(xù)點(diǎn)鼠標(biāo)左鍵將擴(kuò)大選中的范圍,用戶可以多選,用戶鼠標(biāo)移動(dòng)到任意選中的微內(nèi)容區(qū)域,并點(diǎn)鼠標(biāo)右鍵將取消選中的區(qū)域;用戶確認(rèn)完成后,本子系統(tǒng)將用戶所有選中的微內(nèi)容的編號(hào)通過(guò)XMLHTTPREQUEST發(fā)回服務(wù)器。
      6.根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法中,其特征在于步驟③所述的微內(nèi)容桌面子系統(tǒng)(4)是一組在客戶瀏覽器里運(yùn)行的javascript腳本。讓用戶通過(guò)鼠標(biāo)的拖拽調(diào)整所添加的微內(nèi)容模塊的大小,位置,顏色和版式等布局。其原理是通過(guò)動(dòng)態(tài)改變?yōu)g覽器中網(wǎng)頁(yè)的DOM樹結(jié)構(gòu),讓用戶自己可以調(diào)整自己網(wǎng)頁(yè)的內(nèi)容,布局和風(fēng)格。并能夠添加,刪除微內(nèi)容模塊和多頁(yè)面。將相關(guān)設(shè)置信息保持到服務(wù)器端的數(shù)據(jù)庫(kù)。當(dāng)用戶再次打開(kāi)自己的頁(yè)面時(shí),本系統(tǒng)將動(dòng)態(tài)的將上述設(shè)置信息從服務(wù)器端下載,并根據(jù)設(shè)置信息,向服務(wù)器加載微內(nèi)容信息和其他功能模塊。
      7.根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法中,其特征在于步驟⑤所述的微內(nèi)容比較子系統(tǒng)(6),是一組服務(wù)器端軟件模塊,對(duì)同一網(wǎng)頁(yè)的不同版本的內(nèi)容進(jìn)行比較;除了需要不同版本的完整內(nèi)容,還需要知道被定制的微內(nèi)容板塊的編號(hào);本系統(tǒng)采用網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng),對(duì)新舊內(nèi)容進(jìn)行分析和標(biāo)記,在新內(nèi)容中尋找和被定制微內(nèi)容相同XPATH的微內(nèi)容模塊,如果找到就將該微內(nèi)容列入成功更新的隊(duì)列,否則列入需要修復(fù)的隊(duì)列供微內(nèi)容自動(dòng)更新子系統(tǒng)進(jìn)一步處理。
      8.根據(jù)權(quán)利要求2所述的網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法中,其特征在于所述的微內(nèi)容自動(dòng)更新子系統(tǒng)(5),是一組服務(wù)器端軟件模塊,定時(shí)通過(guò)網(wǎng)頁(yè)抓取子系統(tǒng)獲得用戶目標(biāo)網(wǎng)頁(yè)的最新內(nèi)容,并通過(guò)微內(nèi)容比較子系統(tǒng),將目標(biāo)網(wǎng)頁(yè)的最新內(nèi)容和數(shù)據(jù)庫(kù)里存儲(chǔ)的內(nèi)容進(jìn)行比較;過(guò)濾出更新了的微內(nèi)容,同時(shí)更新數(shù)據(jù)庫(kù)里完整的網(wǎng)頁(yè)內(nèi)容和相關(guān)的微內(nèi)容;如果在最新內(nèi)容中找不到定制的微內(nèi)容板塊,將此板塊放入需要修復(fù)的名單中,等待維護(hù)人員,人工修復(fù);如果人工修復(fù)過(guò)程還是找不到相應(yīng)內(nèi)容,就刪除該微內(nèi)容板塊,當(dāng)微內(nèi)容板塊被用戶加載時(shí),本系統(tǒng)將返回提示信息,告知本微內(nèi)容板塊不存在,用戶可以選擇重新定制。
      全文摘要
      本發(fā)明涉及一種網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新系統(tǒng)的方法。本發(fā)明提供一種有效地根據(jù)網(wǎng)頁(yè)內(nèi)容的功能來(lái)分區(qū)網(wǎng)頁(yè)微內(nèi)容,并將網(wǎng)頁(yè)微內(nèi)容提取、聚合和自動(dòng)更新,動(dòng)態(tài)生成用戶個(gè)性化的頁(yè)面,其中的微內(nèi)容將隨原網(wǎng)頁(yè)的更新而更新。本發(fā)明的方法是先在用戶端輸入網(wǎng)頁(yè)的地址,將合法的內(nèi)容傳遞到服務(wù)器端的網(wǎng)頁(yè)微內(nèi)容分析子系統(tǒng),然后按超鏈接群標(biāo)記不同的微內(nèi)容板塊或欄目,將標(biāo)記的html文本內(nèi)容傳回到用戶端,選中原始微內(nèi)容或其父輩節(jié)點(diǎn),添加到用戶端微內(nèi)容桌面子系統(tǒng),完成頁(yè)面的布置。本發(fā)明利用網(wǎng)絡(luò)微信息提取和聚合方法,用戶可以在桌面上進(jìn)行搜索,方便的引進(jìn)第三方的服務(wù),整合用戶需要的網(wǎng)上信息。
      文檔編號(hào)H04L29/06GK1959679SQ200610152708
      公開(kāi)日2007年5月9日 申請(qǐng)日期2006年9月25日 優(yōu)先權(quán)日2006年9月25日
      發(fā)明者徐凱, 王亮 申請(qǐng)人:北京愛(ài)笛星科技有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1