獲取信息的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種獲取信息的方法和裝置,屬于互聯(lián)網(wǎng)領(lǐng)域。所述方法包括:當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁;提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容;將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。本發(fā)明將下載到的內(nèi)容按純文本的形式順序拼接到一起輸出,使用戶能夠不被其他與正文內(nèi)容相關(guān)的信息所干擾,提高了用戶在使用瀏覽器進行閱讀時的體驗感。
【專利說明】獲取信息的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,特別涉及一種獲取信息的方法和裝置。
【背景技術(shù)】
[0002]隨著移動終端的發(fā)展,瀏覽器已經(jīng)成為移動互聯(lián)網(wǎng)重要入口之一,越來越多的用戶喜歡在移動終端上通過瀏覽器來閱讀小說等長篇文字或者圖片內(nèi)容。然而,瀏覽器上供連續(xù)閱讀的網(wǎng)頁都是分頁存放的,相鄰網(wǎng)頁的間距也比較大,使得用戶在需要閱讀下一頁網(wǎng)頁時須將目前網(wǎng)頁拖拽較長距離。而且,很多網(wǎng)頁內(nèi)都存在大量的如廣告和重復(fù)標題等用戶無需閱讀的信息,這些用戶無需閱讀的信息進一步地干擾了用戶閱讀網(wǎng)頁正文。
【發(fā)明內(nèi)容】
[0003]為了解決上述問題,本發(fā)明提供了一種獲取信息的方法和裝置。所述技術(shù)方案如下:
[0004]一方面,提供了一種獲取信息的方法,所述方法包括:
[0005]當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁;
[0006]提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容;
[0007]將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。
[0008]另一方面,提供了一種獲取信息的裝置,所述裝置包括:
[0009]下載模塊,用于當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁;
[0010]提取模塊,用于提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容;
[0011]輸出模塊,用于將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。
[0012]本發(fā)明實施例的有益效果是:當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁;提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容;將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。在客戶端接收到訪問請求時,下載至少兩頁內(nèi)容,并將下載到的內(nèi)容按純文本的形式順序拼接到一起輸出,使用戶能夠不被其他與正文內(nèi)容相關(guān)的信息所干擾,提高了用戶在使用瀏覽器進行閱讀時的體驗感。
【專利附圖】
【附圖說明】
[0013]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0014]圖1是本發(fā)明實施例一提供的一種獲取信息的方法流程圖;
[0015]圖2是本發(fā)明實施例二提供的一種獲取信息的方法流程圖;
[0016]圖3是本發(fā)明實施例三提供的一種獲取信息的裝置結(jié)構(gòu)示意圖;[0017]圖4是本發(fā)明實施例三提供的另一種獲取信息的裝置結(jié)構(gòu)示意圖。
【具體實施方式】
[0018]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進一步地詳細描述。
[0019]實施例一
[0020]參見圖1,本實施例中提供了一種獲取信息的方法,所述方法包括:
[0021]101、當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁;
[0022]102、提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容;
[0023]103、將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。
[0024]本實施例可選地,所述下載至少兩頁所述預(yù)設(shè)的網(wǎng)頁之前,還包括:
[0025]確定需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù)。
[0026]其中,所述確定需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù),包括:
[0027]獲取所述客戶端的接入點信息,
[0028]根據(jù)所述客戶端的接入點信息判斷所述客戶端的接入類型是否是按流量計費的,如果所述客戶端的接入網(wǎng)類型不是按流量計費的,則確定下載所述預(yù)設(shè)網(wǎng)頁中第一預(yù)設(shè)頁數(shù)的網(wǎng)頁,如果所述客戶端的接入網(wǎng)類型是按流量計費的,則確定下載所述預(yù)設(shè)網(wǎng)頁中第二預(yù)設(shè)頁數(shù)的網(wǎng)頁。
[0029]可選地,當所述客戶端的接入類型不是按流量計費時,所述將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出之后,還包括:
[0030]當接收到所述客戶端請求顯示下一頁的請求時,下載所述第一預(yù)設(shè)頁數(shù)之后的網(wǎng)頁。
[0031]可選地,當所述客戶端的接入類型為按流量計費時,所述將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出之后,還包括:
[0032]獲取所述客戶端已緩存的當前頁面的拼接數(shù)量,判斷所述當前頁面的拼接數(shù)量是否已超過閾值,如果是,則淘汰所述當前頁面中的指定網(wǎng)頁,并下載所述第二預(yù)設(shè)頁數(shù)之后的網(wǎng)頁。
[0033]優(yōu)選地,所述提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容,包括:
[0034]剪裁掉所述下載到的網(wǎng)頁的非正文信息,并對所述剪裁后的正文信息按純文本的形式進行重排版,得到所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容。
[0035]本實施例的有益效果是:當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁;提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容;將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。在客戶端接收到訪問請求時,下載至少兩頁內(nèi)容,并將下載到的內(nèi)容按純文本的形式順序拼接到一起輸出,使用戶能夠不被其他與正文內(nèi)容相關(guān)的信息所干擾,提高了用戶在使用瀏覽器進行閱讀時的體驗感。
[0036]實施例二
[0037]本發(fā)明實施例提供了一種獲取信息的方法,本實施例中,為用戶提供預(yù)設(shè)的瀏覽器,當用戶在客戶端上使用該預(yù)設(shè)的瀏覽器閱讀小說等長篇文字或是圖片內(nèi)容時,為用戶提供閱讀模式,閱讀模式是指在用戶使用該預(yù)設(shè)的瀏覽器閱讀小說等長篇圖文信息時,通過智能判斷,自動將用戶可能閱讀到的網(wǎng)頁從網(wǎng)絡(luò)上下載下來,并且以一種接近讀書排版的方式將前一頁和后一頁拼接在一起,讓用戶進入一種沉浸式的閱讀狀態(tài)。本實施例中的客戶端包括:手機等便攜式手持設(shè)備,對此本實施例不做具體限定。
[0038]在實際應(yīng)用中,可根據(jù)客戶端接入網(wǎng)絡(luò)的類型不同,在該瀏覽器中為用戶提供快速閱讀模式和省流量閱讀模式。其中,在不按流量計費的網(wǎng)絡(luò)環(huán)境下可以選擇進入快速閱讀模式,在快速閱讀模式下,由于網(wǎng)絡(luò)環(huán)境比較好,不按流量收取費用,所以可以在接收到客戶端的訪問請求時,多下載些網(wǎng)絡(luò)內(nèi)容,如下載第一預(yù)設(shè)頁數(shù)的網(wǎng)頁,并對第一預(yù)設(shè)頁數(shù)的網(wǎng)頁進行解析后,緩存到顯示列表中等待顯示。例如,第一預(yù)設(shè)頁數(shù)為N,則依次下載N頁的網(wǎng)頁內(nèi)容,并對下載到的網(wǎng)頁進行解析存放到顯示列表中。在緩存的第N+1個空間存放第N+1頁未解析的源代碼,當接收到客戶端顯示下一頁的請求時,下載第N+1頁的網(wǎng)頁內(nèi)容,并在對該網(wǎng)頁內(nèi)容進行解析后放入到顯示隊列中。本實施例中只需本地運算解析就可以顯示下一頁的內(nèi)容,避免了再次請求網(wǎng)絡(luò)接收數(shù)據(jù)的等待時間。其中,不按流量計費的網(wǎng)絡(luò)環(huán)境包括=WIFI等網(wǎng)絡(luò)環(huán)境,對此本實施例不做具體限定。其中第一預(yù)設(shè)頁數(shù)包括:2頁、3頁或5頁等,對此本實施例并不做具體限定,可以根據(jù)網(wǎng)絡(luò)環(huán)境調(diào)整第一預(yù)設(shè)頁數(shù)的大小,如在網(wǎng)絡(luò)環(huán)境好的情況下第一預(yù)設(shè)頁數(shù)為5頁,在網(wǎng)絡(luò)環(huán)境差的情況下,第一預(yù)設(shè)頁數(shù)為3頁。
[0039]在按流量計費的網(wǎng)絡(luò)環(huán)境下可以選擇進入省流量閱讀模式,在省流量閱讀模式下,為了節(jié)省客戶端的流量,在接收到客戶端的訪問請求時,下載第二預(yù)設(shè)頁數(shù)的網(wǎng)頁內(nèi)容。其中,第二預(yù)設(shè)頁數(shù)包括2頁或3頁等,第二預(yù)設(shè)頁數(shù)可以根據(jù)客戶端的計費情況進行調(diào)整,對此本實施例不做具體限定。按流量計費的網(wǎng)絡(luò)環(huán)境包括:GPRS等網(wǎng)絡(luò)環(huán)境,對此本實施例不做具體限定。
[0040]參見圖2,方法流程具體包括:
[0041]201、接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求,確定需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù)。
[0042]本實施例中,可選地,在下載預(yù)設(shè)的網(wǎng)頁之前,根據(jù)客戶端當前的接入網(wǎng)類型,先確定需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù)。其中,確定需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù),包括:獲取所述客戶端的接入點信息,根據(jù)所述客戶端的接入點信息判斷所述客戶端的接入類型是否是按流量計費的,如果所述客戶端的接入網(wǎng)類型不是按流量計費的,則確定下載所述預(yù)設(shè)網(wǎng)頁中第一預(yù)設(shè)頁數(shù)的網(wǎng)頁,如果所述客戶端的接入網(wǎng)類型是按流量計費的,則確定下載所述預(yù)設(shè)網(wǎng)頁中第二預(yù)設(shè)頁數(shù)的網(wǎng)頁。
[0043]本實施例中,在具體實現(xiàn)中,在客戶端使用預(yù)設(shè)的瀏覽器時,網(wǎng)頁按照現(xiàn)有的分頁模式打開,但是在分頁模式的網(wǎng)頁上設(shè)置“閱讀模式”的選擇按鈕,如果用戶選擇該按鈕,則客戶端進行預(yù)設(shè)的瀏覽器提供的閱讀模式,如果用戶不選擇閱讀模式,則默認用戶使用現(xiàn)有技術(shù)中的閱讀方式,每次點擊下一頁以獲取下一頁的內(nèi)容。當然,閱讀模式的選擇也可以通過其它方式實現(xiàn),對此本實施例不做具體限定。
[0044]202、根據(jù)所述確定需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù)下載所述預(yù)設(shè)網(wǎng)頁中的網(wǎng)頁。
[0045]例如,當客戶端的接入網(wǎng)類型為WIFI接入時,確定下載的頁數(shù)為第一預(yù)設(shè)頁數(shù),則根據(jù)第一預(yù)設(shè)頁數(shù)下載所述預(yù)設(shè)網(wǎng)頁中的網(wǎng)頁;當客戶端的接入網(wǎng)類型為GPRS接入時,確定下載第二預(yù)設(shè)頁數(shù)的內(nèi)容,根據(jù)第二預(yù)設(shè)頁數(shù)下載所述預(yù)設(shè)網(wǎng)頁中的網(wǎng)頁。
[0046]其中,所述根據(jù)所述確定的需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù)下載所述預(yù)設(shè)網(wǎng)頁中的網(wǎng)頁,包括:按順序下載并解析所述確定的需要下載的頁數(shù)中的第一頁內(nèi)容;判斷所述已經(jīng)下載的網(wǎng)頁的頁數(shù)是否與所述確定需要下載的頁數(shù)相匹配,如果是,則暫停下載所述預(yù)設(shè)網(wǎng)頁中的網(wǎng)頁,否則查找所述第一頁上的關(guān)鍵字,根據(jù)所述關(guān)鍵字下載并解析第二頁網(wǎng)頁,直至下載到所述確定需要下載的頁數(shù)。在確定需要下載的頁數(shù)后,自動查找網(wǎng)頁中的關(guān)鍵字,并自動下載關(guān)鍵字對應(yīng)的鏈接內(nèi)容。其中關(guān)鍵字包括:“下一頁”,數(shù)字頁碼等,對此本實施例不做具體限定。如,需要下載的頁數(shù)為5頁,則先下載并解析第一頁,查找第一頁上的關(guān)鍵字,如關(guān)鍵字為“下一頁”,則自動下載并解析“下一頁”對應(yīng)的鏈接內(nèi)容,并重復(fù)上述下載過程,直至下載到5頁的內(nèi)容。
[0047]203、提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容,將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。
[0048]本實施例中,為了讓用戶獲得更好的閱讀體驗,提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容,并將所述正文內(nèi)容按預(yù)定順序拼接并輸出,使用戶能夠不被非正文信息所干擾,進入一種沉浸式的閱讀狀態(tài)。其中正文內(nèi)容包括圖片、文字或是視頻內(nèi)容,對此本實施例不做具體限定。其中具體的,提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容,包括:剪裁掉所述下載到的網(wǎng)頁的非正文信息,并對所述剪裁后的正文信息按純文本的形式進行重排版,得到所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容。其中非正文信息包括:網(wǎng)頁的頁頭、頁尾和廣告信息等。將正文信息重排版成純文本信息,類似書本文字樣式,并消除頁面與頁面之間的距離,從而呈現(xiàn)給用戶純文本的閱讀內(nèi)容,使用戶在閱讀時獲得更好的體驗。
[0049]204、當所述客戶端的接入網(wǎng)類型為不按流量計費時,當接收到所述客戶端請求顯示下一頁的請求時,下載所述第一預(yù)設(shè)頁數(shù)之后的網(wǎng)頁。
[0050]例如,在客戶端為WIFI接入的情境下,當前頁顯示完畢后,客戶端接收用戶的指令請求顯示下一頁的內(nèi)容,則在接收到客戶端該項請求后,自動下載預(yù)設(shè)網(wǎng)頁中還未下載到的內(nèi)容,從而將新一頁的網(wǎng)絡(luò)請求歸并在上一頁的顯示后自動觸發(fā),在網(wǎng)絡(luò)速度較慢的情況下,采用此種方式可以使用戶流暢的瀏覽頁面。
[0051]205、當所述客戶端的接入網(wǎng)類型為按流量計費時,獲取所述客戶端已緩存的當前頁面的拼接數(shù)量,判斷所述當前頁面的拼接數(shù)量是否已超過閾值,如果是,則淘汰所述當前頁面中的指定網(wǎng)頁,并下載所述第二預(yù)設(shè)頁數(shù)之后的內(nèi)容。
[0052]本步驟中,獲取所述客戶端已緩存的當前頁面的拼接數(shù)量,當客戶端緩存的內(nèi)容達到淘汰條件時,淘汰已經(jīng)達到淘汰條件的內(nèi)容,并從網(wǎng)絡(luò)請求解析還未下載到的預(yù)設(shè)網(wǎng)頁中的內(nèi)容,將新一頁顯示出來。
[0053]其中,淘汰條件是指預(yù)先定義一個閾值,當達到該閾值時,則淘汰當前頁面中的指定網(wǎng)頁,其中閾值可以是固定值,也可以根據(jù)當前剩余內(nèi)存動態(tài)調(diào)整,對此本實施例不做具體限定。其中指定網(wǎng)頁是指當前頁面中最前面的一頁或是多頁,對此本實施例不做具體限定。
[0054]本實施例的有益效果是:當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁;提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容;將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。在客戶端接收到訪問請求時,下載至少兩頁內(nèi)容,并將下載到的內(nèi)容按純文本的形式順序拼接到一起輸出,使用戶能夠不被其他與正文內(nèi)容相關(guān)的信息所干擾,提高了用戶在使用瀏覽器進行閱讀時的體驗感。且在客戶端接收到訪問請求時,自動下載至少兩頁的內(nèi)容,并按順序拼接到一起輸出,不需要用戶每次點擊下一頁下載內(nèi)容,減少了用戶的操作和每次點擊下一頁等待網(wǎng)絡(luò)的響應(yīng)時間,進一步提高了用戶在使用瀏覽器進行閱讀時的體驗感。
[0055]實施例三
[0056]參見圖3,本發(fā)明實施例提供了一種獲取信息的裝置,所述裝置包括:下載模塊301,提取模塊302和輸出模塊303。
[0057]下載模塊301,用于當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁;
[0058]提取模塊302,用于提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容;
[0059]輸出模塊303,用于將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。
[0060]參見圖4,所述裝置還包括:
[0061]確定模塊304,用于在所述下載模塊301下載至少兩頁所述預(yù)設(shè)的網(wǎng)頁之前,確定需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù)。
[0062]參見圖4,所述確定模塊304包括:
[0063]獲取單元304a,用于獲取所述客戶端的接入點信息,
[0064]確定單元304b,用于根據(jù)所述客戶端的接入點信息判斷所述客戶端的接入類型是否是按流量計費的,如果所述客戶端的接入網(wǎng)類型不是按流量計費的,則確定下載所述預(yù)設(shè)網(wǎng)頁中第一預(yù)設(shè)頁數(shù)的網(wǎng)頁,如果所述客戶端的接入網(wǎng)類型是按流量計費的,則確定下載所述預(yù)設(shè)網(wǎng)頁中第二預(yù)設(shè)頁數(shù)的網(wǎng)頁。
[0065]可選地,當所述客戶端的接入類型不是按流量計費時,在所述輸出模塊303將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出之后,當所述下載模塊301接收到所述客戶端請求顯示下一頁的請求時,所述下載模塊還用于下載所述第一預(yù)設(shè)頁數(shù)之后的網(wǎng)頁。
[0066]可選地,當所述客戶端的接入類型為按流量計費時,在所述輸出模塊303將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出之后,所述下載模塊301還用于獲取所述客戶端已緩存的當前頁面的拼接數(shù)量,判斷所述當前頁面的拼接數(shù)量是否已超過閾值,如果是,則淘汰所述當前頁面中的指定網(wǎng)頁,并下載所述第二預(yù)設(shè)頁數(shù)之后的網(wǎng)頁。
[0067]其中,所述提取模塊302具體用于:
[0068]剪裁掉所述下載到的網(wǎng)頁的非正文信息,并對所述剪裁后的正文信息按純文本的形式進行重排版,得到所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容。
[0069]本實施例的有益效果是:當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁;提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容;將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。在客戶端接收到訪問請求時,下載至少兩頁內(nèi)容,并將下載到的內(nèi)容按純文本的形式順序拼接到一起輸出,使用戶能夠不被其他與正文內(nèi)容相關(guān)的信息所干擾,提高了用戶在使用瀏覽器進行閱讀時的體驗感。
[0070]需要說明的是:上述實施例提供的獲取信息的裝置中,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。
[0071]另外,上述實施例提供的獲取信息的裝置與獲取信息的方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。[0072]上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。
[0073]本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
[0074]以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種獲取信息的方法,其特征在于,所述方法包括: 當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁; 提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容; 將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述下載至少兩頁所述預(yù)設(shè)的網(wǎng)頁之前,還包括: 確定需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述確定需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù),包括: 獲取所述客戶端的接入點信息, 根據(jù)所述客戶端的接入點信息判斷所述客戶端的接入類型是否是按流量計費的,如果所述客戶端的接入網(wǎng)類型不是按流量計費的,則確定下載所述預(yù)設(shè)網(wǎng)頁中第一預(yù)設(shè)頁數(shù)的網(wǎng)頁,如果所述客戶端的接入網(wǎng)類型是按流量計費的,則確定下載所述預(yù)設(shè)網(wǎng)頁中第二預(yù)設(shè)頁數(shù)的網(wǎng)頁。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,當所述客戶端的接入類型不是按流量計費時,所述將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出之后,還包括: 當接收到所述客戶端請求顯示下一頁的請求時,下載所述第一預(yù)設(shè)頁數(shù)之后的網(wǎng)頁。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,當所述客戶端的接入類型為按流量計費時,所述將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出之后,還包括: 獲取所述客戶端已緩存的當前頁面的拼接數(shù)量,判斷所述當前頁面的拼接數(shù)量是否已超過閾值,如果是,則淘汰所述當前頁面中的指定網(wǎng)頁,并下載所述第二預(yù)設(shè)頁數(shù)之后的網(wǎng)頁。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容包括: 剪裁掉所述下載到的網(wǎng)頁的非正文信息,并對所述剪裁后的正文信息按純文本的形式進行重排版,得到所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容。
7.一種獲取信息的裝置,其特征在于,所述裝置包括: 下載模塊,用于當接收客戶端訪問預(yù)設(shè)網(wǎng)頁的請求時,下載至少兩頁所述預(yù)設(shè)網(wǎng)頁; 提取模塊,用于提取所述至少兩頁的預(yù)設(shè)網(wǎng)頁中的正文內(nèi)容; 輸出模塊,用于將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 確定模塊,用于在所述下載模塊下載至少兩頁所述預(yù)設(shè)的網(wǎng)頁之前,確定需要下載的所述預(yù)設(shè)網(wǎng)頁的頁數(shù)。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述確定模塊包括: 獲取單元,用于獲取所述客戶端的接入點信息, 確定單元,用于根據(jù)所述客戶端的接入點信息判斷所述客戶端的接入類型是否是按流量計費的,如果所述客戶端的接入網(wǎng)類型不是按流量計費的,則確定下載所述預(yù)設(shè)網(wǎng)頁中第一預(yù)設(shè)頁數(shù)的網(wǎng)頁,如果所述客戶端的接入網(wǎng)類型是按流量計費的,則確定下載所述預(yù)設(shè)網(wǎng)頁中第二預(yù)設(shè)頁數(shù)的網(wǎng)頁。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,當所述客戶端的接入類型不是按流量計費時,在所述輸出模塊將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出之后,當所述下載模塊接收到所述客戶端請求顯示下一頁的請求時,所述下載模塊還用于下載所述第一預(yù)設(shè)頁數(shù)之后的網(wǎng)頁。
11.根據(jù)權(quán)利要求9所述的裝置,其特征在于,當所述客戶端的接入類型為按流量計費時,在所述輸出模塊將所述預(yù)設(shè)網(wǎng)頁的正文內(nèi)容按預(yù)定順序拼接并輸出之后,所述下載模塊還用于獲取所述客戶端已緩存的當前頁面的拼接數(shù)量,判斷所述當前頁面的拼接數(shù)量是否已超過閾值,如果是,則淘汰所述當前頁面中的指定網(wǎng)頁,并下載所述第二預(yù)設(shè)頁數(shù)之后的網(wǎng)頁。
12.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述提取模塊具體用于: 剪裁掉所述下載到的網(wǎng)頁的非正文信息,并對所述剪裁后的正文信息按純文本的形式進行重排版,得到所述預(yù) 設(shè)網(wǎng)頁的正文內(nèi)容。
【文檔編號】G06F17/30GK103678393SQ201210350647
【公開日】2014年3月26日 申請日期:2012年9月20日 優(yōu)先權(quán)日:2012年9月20日
【發(fā)明者】韓梓鑫, 王國強, 陳展, 黃水成, 孫鵬 申請人:騰訊科技(深圳)有限公司