專利名稱:網(wǎng)頁文本壓縮方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及移動(dòng)互聯(lián)網(wǎng)的網(wǎng)頁瀏覽技術(shù)領(lǐng)域,更為具體地,涉及一種網(wǎng)頁文本壓縮方法和裝置。
背景技術(shù):
網(wǎng)頁文件存儲(chǔ)時(shí)使用的編碼,是網(wǎng)頁最為重要的編碼。如果網(wǎng)頁文件為靜態(tài)的HTML文件,則Web Server將直接發(fā)送該文件至客戶端的瀏覽器;如果網(wǎng)頁文件為動(dòng)態(tài)生成的HTML文件,則Web Server會(huì)根據(jù)動(dòng)態(tài)腳本文件存儲(chǔ)的編碼來生成相應(yīng)編碼的數(shù)據(jù),而這些數(shù)據(jù)將成為發(fā)送到Client Browser的HTML文件。由于網(wǎng)頁文件自身的特性以及不同編碼方式的特點(diǎn),對于同一個(gè)網(wǎng)頁文件,如果采用不同的編碼方式進(jìn)行存儲(chǔ),其占用的字節(jié)很有可能不同。例如在一個(gè)以gbk編碼存放的PHP腳本當(dāng)中,使用echo ‘我愛你’,則會(huì)產(chǎn)生數(shù)據(jù)CE D2B0AE C4E3六個(gè)字節(jié)的數(shù)據(jù),這六個(gè)字節(jié)的數(shù)據(jù)是‘我愛你’的GBK編碼;而如果在一個(gè)以utf-8編碼存放的PHP腳本當(dāng)中,執(zhí)行echo ‘我愛你’,則會(huì)產(chǎn)生數(shù)據(jù)E68891E788B1E4BD AO九個(gè)字節(jié)的數(shù)據(jù),這九個(gè)字節(jié)的數(shù)據(jù)是‘我愛你’的UTF-8編碼。對于終端用戶而言,服務(wù)端傳輸過來的HTML文件的編碼主要由服務(wù)端HTML文件或者腳本文件的存儲(chǔ)編碼決定,而瀏覽器端提交用戶數(shù)據(jù)時(shí)使用的編碼,只取決于當(dāng)前瀏覽器查看網(wǎng)頁使用的編碼,與HTML網(wǎng)頁本身的文件的編碼沒有任何關(guān)系。在現(xiàn)有技術(shù)中,通過手機(jī)瀏覽器瀏覽網(wǎng)頁時(shí)往往使用固定的編碼方式處理,用戶只能被動(dòng)地采用既定的編碼方式處理所有的網(wǎng)頁數(shù)據(jù),而不能夠智能的選擇一種合適的編碼方式,經(jīng)常會(huì)出現(xiàn)“大材小用”的情況,導(dǎo)致手機(jī)瀏覽器內(nèi)存占用比較大,浪費(fèi)了手機(jī)的內(nèi)存。而對于手機(jī)這類硬件條件有限的移動(dòng)終端而言,有限的內(nèi)存往往不能容忍這種浪費(fèi),這種固定編碼方式對內(nèi)存的“盲目”占用極大地影響了用戶的體驗(yàn)。這種情況在一些低端的手機(jī)上面問題尤為明顯,用戶往往打開1-2個(gè)窗口就可能出現(xiàn)爆內(nèi)存網(wǎng)頁打不開的情況,嚴(yán)重影響用戶體驗(yàn)。
發(fā)明內(nèi)容
鑒于上述問題,本發(fā)明提供一種能夠根據(jù)不同的語言環(huán)境智能選擇合適編碼方式存儲(chǔ)網(wǎng)頁頁面的方法和裝置,以達(dá)到節(jié)省終端內(nèi)存的目的。根據(jù)本發(fā)明的一個(gè)方面,提供了一種網(wǎng)頁文本壓縮方法,包括根據(jù)移動(dòng)終端瀏覽器的網(wǎng)頁打開請求獲取終端當(dāng)前的語言環(huán)境;根據(jù)所述語言環(huán)境初始化與所述語言環(huán)境對應(yīng)的字符容器;接收所請求的網(wǎng)頁數(shù)據(jù),解析所述網(wǎng)頁數(shù)據(jù),并利用所述相應(yīng)的字符容器合并存儲(chǔ)所述網(wǎng)頁數(shù)據(jù);其中,在根據(jù)所述語言環(huán)境初始化相應(yīng)的字符容器的過程中,具體包括判斷所述語言環(huán)境是否屬于拉丁語系,如果是,則將所述字符容器初始化為存儲(chǔ)uft-8編碼方式的數(shù)據(jù);否則初始化存儲(chǔ)uft-16編碼方式的數(shù)據(jù)。根據(jù)本發(fā)明的另一方面,提供了一種網(wǎng)頁文本壓縮裝置,包括語言環(huán)境確定單元,用于根據(jù)移動(dòng)終端瀏覽器的網(wǎng)頁打開請求獲取終端當(dāng)前的語言環(huán)境;字符容器初始化單元,用于根據(jù)所述語言環(huán)境初始化與所述語言環(huán)境對應(yīng)的字符容器;數(shù)據(jù)傳輸單元,用于接收所請求的網(wǎng)頁數(shù)據(jù);數(shù)據(jù)解析存儲(chǔ)單元,用于解析所述網(wǎng)頁數(shù)據(jù),并利用所述相應(yīng)的字符容器合并存儲(chǔ)所述網(wǎng)頁數(shù)據(jù);其中,所述字符容器初始化單元包括判斷單元,用于判斷所述語言環(huán)境是否屬于拉丁語系,如果是,則所述字符容器初始化單元將字符容器初始化為存儲(chǔ)uft-8編碼方式的數(shù)據(jù);否則初始化為存儲(chǔ)uft-16編碼方式的數(shù)據(jù)。本發(fā)明采用智能的切換編碼方式存儲(chǔ)網(wǎng)頁,對于采用拉丁語系語言(如英語)的網(wǎng)頁米用utf-8編碼方式存儲(chǔ),中文的網(wǎng)頁就米用utf-16編碼存儲(chǔ),從而為不同語言的網(wǎng)頁選用不同的編碼,“量體裁衣”,在硬件條件有限的移動(dòng)終端尤其是一些低端的手機(jī)平臺(tái)很好的利用的極為有限的內(nèi)存,讓用戶能夠多開幾個(gè)窗口,極大的提高了用戶體驗(yàn)。為了實(shí)現(xiàn)上述以及相關(guān)目的,本發(fā)明的一個(gè)或多個(gè)方面包括后面將詳細(xì)說明并在權(quán)利要求中特別指出的特征。下面的說明以及附圖詳細(xì)說明了本發(fā)明的某些示例性方面。然而,這些方面指示的僅僅是可使用本發(fā)明的原理的各種方式中的一些方式。此外,本發(fā)明旨在包括所有這些方面以及它們的等同物。
通過參考以下結(jié)合附圖的說明及權(quán)利要求書的內(nèi)容,并且隨著對本發(fā)明的更全面理解,本發(fā)明的其它目的及結(jié)果將更加明白及易于理解。在附圖中圖1為根據(jù)本發(fā)明實(shí)施例的網(wǎng)頁文本壓縮方法的流程圖;圖2為根據(jù)本發(fā)明實(shí)施例的存儲(chǔ)容器的適配和存儲(chǔ)優(yōu)化的示意圖;圖3為根據(jù)本發(fā)明實(shí)施例的網(wǎng)頁文本壓縮裝置的方框示意圖。在所有附圖中相同的標(biāo)號(hào)指示相似或相應(yīng)的特征或功能。
具體實(shí)施例方式在下面的描述中,出于說明的目的,為了提供對一個(gè)或多個(gè)實(shí)施例的全面理解,闡述了許多具體細(xì)節(jié)。然而,很明顯,也可以在沒有這些具體細(xì)節(jié)的情況下實(shí)現(xiàn)這些實(shí)施例。在其它例子中,為了便于描述一個(gè)或多個(gè)實(shí)施例,公知的結(jié)構(gòu)和設(shè)備以方框圖的形式示出。由于目前作為移動(dòng)互聯(lián)網(wǎng)載體的主要為手機(jī),因此,在下面對比本發(fā)明具體實(shí)施方式
的表述中,“移動(dòng)終端”、“手機(jī)”均是指用戶訪問移動(dòng)互聯(lián)網(wǎng)所使用的目標(biāo)載體,同時(shí)可以將“手機(jī)”理解為“移動(dòng)終端”的一種但不是唯一的一種具體表現(xiàn)形式。以下將以手機(jī)為例對本發(fā)明提供的網(wǎng)頁文本壓縮方法和裝置進(jìn)行示例性說明。為了解決現(xiàn)有技術(shù)中使用固定的編碼方式存儲(chǔ)網(wǎng)頁給手機(jī)內(nèi)存帶來的浪費(fèi)問題,本發(fā)明提出一種根據(jù)語言環(huán)境確定存儲(chǔ)網(wǎng)頁內(nèi)容的編碼方式的網(wǎng)頁文本壓縮方法,根據(jù)語言環(huán)境,判斷使用什么編碼來存儲(chǔ)網(wǎng)頁的內(nèi)容,從而盡量用合適的編碼方式來儲(chǔ)存頁面,達(dá)到節(jié)省手機(jī)內(nèi)存的目的。從通常的手機(jī)應(yīng)用角度出發(fā),用戶手機(jī)中使用的語言和用戶所處的位置密切相關(guān),如果是歐美國家或地區(qū),手機(jī)中一般使用拉丁語系(又稱印歐語系)的語言,如英語、德語、法語等;而在亞洲所使用的語言,本發(fā)明中將其劃分為非拉丁語系,比如中國用戶的手機(jī)中使用的語言一般是中文,日本、韓國用戶的手機(jī)中使用的語言一般是日文、韓文。本發(fā)明就根據(jù)手機(jī)應(yīng)用語言的不同這一特點(diǎn)采用不同的編碼方式存儲(chǔ)網(wǎng)頁內(nèi)容,根據(jù)手機(jī)的語言環(huán)境智能判斷存儲(chǔ)方式,優(yōu)化手機(jī)瀏覽器的內(nèi)存使用。另外,為了表述的方便,在下面的具體實(shí)施方式
表述中,僅以拉丁語系中的英語和非拉丁語系的中文為例來對本發(fā)明的根據(jù)語言環(huán)境的不公采用不同的網(wǎng)頁文本壓縮策略的技術(shù)方案進(jìn)行說明。圖1示出了根據(jù)本發(fā)明的網(wǎng)頁文本壓縮方法的流程圖。如圖1所示,在步驟SlOl中,移動(dòng)瀏覽器通過用戶打開網(wǎng)頁的請求獲取當(dāng)前的語言環(huán)境。具體地,所述當(dāng)前的語言環(huán)境是根據(jù)網(wǎng)站所在的國家或其它對語言進(jìn)行說明的標(biāo)示來進(jìn)行判斷的。在一個(gè)優(yōu)選的實(shí)施例中移動(dòng)瀏覽器初始化的時(shí)候要求用戶選擇語言,然后移動(dòng)瀏覽器根據(jù)用戶選擇的語言確定所述當(dāng)前的語言環(huán)境。在步驟S102中,根據(jù)所述語言環(huán)境初始化字符容器。本發(fā)明所述的“字符容器”,指的是存儲(chǔ)相關(guān)網(wǎng)頁數(shù)據(jù)的存儲(chǔ)空間,具體實(shí)現(xiàn)的時(shí)候是通過在軟件代碼中申請一個(gè)“類”來存儲(chǔ)網(wǎng)頁數(shù)據(jù),例如在Java語言里面通過申請String類來存儲(chǔ)網(wǎng)頁數(shù)據(jù),比如“導(dǎo)航”等這些網(wǎng)頁文字。在一個(gè)優(yōu)選的實(shí)施例中,會(huì)先申請一些額外的空間來儲(chǔ)存類的頭部(一些附加的描述信息),然后再申請真正的空間來存儲(chǔ)網(wǎng)頁文字,一個(gè)不放文字的空字符容器要占用空間,例如4byte的空間。具體地,本步驟中移動(dòng)瀏覽器獲取當(dāng)前語言環(huán)境后判斷是否為屬于拉丁語系(如英語)。如果判斷屬于拉丁語系,則將字符容器初始化為存儲(chǔ)uft-8編碼方式的數(shù)據(jù);否則將字符容器初始化為存儲(chǔ)uft-16編碼方式的數(shù)據(jù)。在一個(gè)優(yōu)選的實(shí)施例中,用戶打開一個(gè)中文網(wǎng)頁的時(shí)候,移動(dòng)瀏覽器判斷出語言環(huán)境為非拉丁語系語言,則將字符容器初始化為存儲(chǔ)uft-16編碼方式的數(shù)據(jù)。在另一個(gè)優(yōu)選的實(shí)施例中,用戶打開一個(gè)英文網(wǎng)頁的時(shí)候,移動(dòng)瀏覽器判斷出語言環(huán)境為英文,則將字符容器初始化為存儲(chǔ)uft-8編碼方式的數(shù)據(jù)。在步驟S103中,接收所請求的網(wǎng)頁數(shù)據(jù),解析所述接收的網(wǎng)頁數(shù)據(jù),并利用初始化后的字符容器合并存儲(chǔ)所述網(wǎng)頁數(shù)據(jù)。具體地,由于網(wǎng)頁數(shù)據(jù)的源碼中文字對象本身是零散分開的,即采用多個(gè)字符容器進(jìn)行存儲(chǔ),本步驟中將原來存儲(chǔ)在多個(gè)字符容器中的文字對象采用首尾相接的方式采用一個(gè)字符容器進(jìn)行合并存儲(chǔ)。進(jìn)一步地,為了定位文字對象的具體位置為所述網(wǎng)頁數(shù)據(jù)增加索引,以根據(jù)索引值從所述字符容器中適配文字對象。圖2示出了根據(jù)本發(fā)明實(shí)施例的網(wǎng)頁數(shù)據(jù)在字符容器中存儲(chǔ)方法的示意圖。如圖2所示,通過移動(dòng)瀏覽器顯示給用戶的網(wǎng)頁數(shù)據(jù)(導(dǎo)航、體育、娛樂、新聞、微博、軍事、股票等)。將這些文字對象合并在一起,采用一個(gè)字符容器來存儲(chǔ)以減小字符容器本身占用的空間。合并存儲(chǔ)之后,就需要對存儲(chǔ)的內(nèi)容進(jìn)行適配和索引,以便需要使用時(shí)可以正常找回。如圖2所示,“導(dǎo)航”、“體育”、“娛樂”等文字進(jìn)行合并、首尾相接存儲(chǔ),并增加相應(yīng)的索引值,如“導(dǎo)航”對應(yīng)的索引值為(0,1)、“體育”對應(yīng)的索引值為(2,3)、“娛樂”對應(yīng)的索引值為(4,5)?!八饕焙汀皵?shù)據(jù)內(nèi)容”這兩部分內(nèi)容分別存儲(chǔ)在兩個(gè)內(nèi)存塊中,并且在這兩個(gè)內(nèi)存塊之間建立對應(yīng)關(guān)系。本發(fā)明實(shí)施例提供的網(wǎng)頁文本壓縮方法,一方面,采用一個(gè)字符容器來存儲(chǔ)網(wǎng)頁數(shù)據(jù)以減小字符容器本身所占用的空間。在一個(gè)實(shí)例中,“導(dǎo)航”、“體育”、“娛樂”這三個(gè)文字對象在未采用本發(fā)明的壓縮方法時(shí)需要占用:(4+2+2)+ (4+2+2) +(4+2+2) =24byte的空間,采用本發(fā)明的壓縮方法時(shí)則占用4+ (2+2)+ (2+2)+ (2+2)=16byte的空間。即三個(gè)文字對象就節(jié)約了 Sbyte的空間。對于含有龐大文字內(nèi)容的網(wǎng)頁數(shù)據(jù)來說可以得知本發(fā)明提供的文本壓縮方法可以大大節(jié)約存儲(chǔ)空間。另外一方面,通過這種合并和適配索引處理,可以使得程序的上層不必關(guān)心下層的存儲(chǔ)容器具體是用的uft-16編碼還是uft-8編碼或者其他什么編碼來存儲(chǔ),只需要告訴容器要去讀原網(wǎng)頁中某一 下標(biāo)的文字(例如“導(dǎo)航”),那么適配層便會(huì)根據(jù)索引值(例如(O, I 從存儲(chǔ)容器中找到相應(yīng)的文字,這種采用合并方式統(tǒng)一進(jìn)行管理的結(jié)構(gòu)清晰、低耦合的存儲(chǔ)方式,可以顯著節(jié)約內(nèi)存消耗。通過上述技術(shù)方案的表述可以看出,相對于現(xiàn)有技術(shù)采用固定編碼方式存儲(chǔ)網(wǎng)頁的情況,本發(fā)明所提供的網(wǎng)頁文本壓縮方法的應(yīng)用能夠更加有效地利用手機(jī)等移動(dòng)終端有限的內(nèi)存,更加有利于用戶體驗(yàn)。本發(fā)明所帶來的技術(shù)效果具體可以從以下兩個(gè)應(yīng)用實(shí)施例看出。實(shí)例一:以前一些低端的手機(jī)使用移動(dòng)瀏覽器打開大頁面的時(shí)候會(huì)出現(xiàn)加載不全的問題,問題的原因是內(nèi)存不足的時(shí)候,瀏覽器會(huì)放棄繼續(xù)加載頁面內(nèi)容。而如果采用本發(fā)明提供的網(wǎng)頁文本壓縮方法,就可以顯著降低網(wǎng)頁加載時(shí)對內(nèi)存的占用量,頁面占用內(nèi)存降下來了,大頁面也就能加載完全了。實(shí)例二:以前一些低端手機(jī)使用移動(dòng)瀏覽器,瀏覽過幾個(gè)頁面嘗試后退時(shí),經(jīng)常出現(xiàn)需要重新聯(lián)網(wǎng)的情況,這是因?yàn)閮?nèi)存不足時(shí),瀏覽器會(huì)清理掉緩存在內(nèi)存中的歷史頁面數(shù)據(jù),歷史頁面被回收后,后退到這個(gè)頁面就需要重新聯(lián)網(wǎng)獲取數(shù)據(jù),影響用戶使用;而如果采用本發(fā)明提供的網(wǎng)頁文本壓縮方法,就可以顯著降低網(wǎng)頁加載時(shí)對內(nèi)存的占用量,頁面占用內(nèi)存降下來了,用戶點(diǎn)擊后退重新聯(lián)網(wǎng)的概率也降低了很多,提高了用戶體驗(yàn)。與上述網(wǎng)頁文本壓縮方法相對應(yīng),本發(fā)明還提供一種網(wǎng)頁文本壓縮裝置。圖3示出了根據(jù)本發(fā)明的網(wǎng)頁文本壓縮裝置300的方框示意圖。如圖3所示,網(wǎng)頁文本壓縮裝置300包括語言環(huán)境確定單元310、字符容器初始化單元320、數(shù)據(jù)傳輸單元330和數(shù)據(jù)解析存儲(chǔ)單元340。其中,字符容器初始化單元320可以包括判斷單元(圖中未示出)。具體地,作為示例,在用戶通過移動(dòng)瀏覽器請求打開一個(gè)網(wǎng)頁時(shí),首先由語言環(huán)境確定單元310根據(jù)移動(dòng)終端瀏覽器的網(wǎng)頁打開請求獲取終端當(dāng)前的語言環(huán)境;然后字符容器初始化單元320根據(jù)語言環(huán)境確定單元310所確定的語言環(huán)境初始化與該語言環(huán)境對應(yīng)的字符容器;當(dāng)語言環(huán)境屬于拉丁語系時(shí)(如英語),字符容器初始化單元320將字符容器初始化為uft-8字符容器,當(dāng)語言環(huán)境不屬于拉丁語系時(shí),初始化為uft-16字符容器。在確定編碼方式的字符容器初始化之后,數(shù)據(jù)傳輸單元330開始接收終端瀏覽器所請求的網(wǎng)頁數(shù)據(jù);然后再由數(shù)據(jù)解析存儲(chǔ)單元340解析所接收的網(wǎng)頁數(shù)據(jù),并利用相應(yīng)的字符容器合并存儲(chǔ)所述網(wǎng)頁數(shù)據(jù)。其中,字符容器初始化單元可以包括判斷單元,用于判斷所述語言環(huán)境是否屬于拉丁語系,如果是,則所述字符容器初始化單元將字符容器初始化為存儲(chǔ)uft-8編碼方式的數(shù)據(jù);否則初始化為存儲(chǔ)uft-16編碼方式的數(shù)據(jù)。另外,為了進(jìn)一步降低網(wǎng)頁存儲(chǔ)對內(nèi)存的消耗,還可以對待存儲(chǔ)的網(wǎng)頁數(shù)據(jù)進(jìn)行合并、適配索引處理,具體實(shí)現(xiàn)為數(shù)據(jù)解析存儲(chǔ)單元340還可以包括內(nèi)容優(yōu)化存儲(chǔ)單元341和適配單元342,其中,內(nèi)容優(yōu)化存儲(chǔ)單元341用于將所述網(wǎng)頁源碼中零散分開的文字對象合并、首尾相接存儲(chǔ)在存儲(chǔ)容器中;適配單元342用于為所述存儲(chǔ)容器增加適配索引,以根據(jù)索引值從所述存儲(chǔ)容器中適配相應(yīng)的文字對象。如上參照附圖以示例的方式描述根據(jù)本發(fā)明的網(wǎng)頁文本壓縮方法和裝置。但是,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,對于上述本發(fā)明所提出的網(wǎng)頁文本壓縮方法及裝置,還可以在不脫離本發(fā)明內(nèi)容的基礎(chǔ)上做出各種改進(jìn)。因此,本發(fā)明的保護(hù)范圍應(yīng)當(dāng)由所附的權(quán)利要求書的內(nèi)容確定。
權(quán)利要求
1.一種網(wǎng)頁文本壓縮方法,包括: 根據(jù)移動(dòng)終端瀏覽器的網(wǎng)頁打開請求獲取終端當(dāng)前的語言環(huán)境; 根據(jù)所述語言環(huán)境初始化與所述語言環(huán)境對應(yīng)的字符容器; 接收所請求的網(wǎng)頁數(shù)據(jù),解析所述網(wǎng)頁數(shù)據(jù)并利用所述相應(yīng)的字符容器合并存儲(chǔ)所述網(wǎng)頁數(shù)據(jù);其中, 在根據(jù)所述語言環(huán)境初始化相應(yīng)的字符容器的過程中,具體包括: 判斷所述語 言環(huán)境是否屬于拉丁語系,如果是,則將所述字符容器初始化為存儲(chǔ)Uft-S編碼方式的數(shù)據(jù);否則初始化為存儲(chǔ)uft-16編碼方式的數(shù)據(jù)。
2.如權(quán)利要求1所述的網(wǎng)頁文本壓縮方法,其中,在解析所述接收的網(wǎng)頁數(shù)據(jù),并利用所述相應(yīng)的字符容器存儲(chǔ)所述網(wǎng)頁數(shù)據(jù)的過程中,進(jìn)一步對所述網(wǎng)頁數(shù)據(jù)進(jìn)行適配處理和內(nèi)容優(yōu)化,具體包括: 將所述網(wǎng)頁數(shù)據(jù)的源碼中零散分開的文字對象合并、首尾相接存儲(chǔ)在字符容器中; 為所述字符容器增加適配索引,以根據(jù)索引值從所述字符容器中適配相應(yīng)的文字對象。
3.如權(quán)利要求1所述的網(wǎng)頁文本壓縮方法,其中, 所述屬于拉丁語系的語言環(huán)境包括英語、德語、法語。
4.如權(quán)利要求1所述的網(wǎng)頁文本壓縮方法,其中,所述字符容器為存儲(chǔ)相關(guān)網(wǎng)頁數(shù)據(jù)的存儲(chǔ)空間,通過在軟件代碼中申請一個(gè)“類”來存儲(chǔ)網(wǎng)頁數(shù)據(jù)實(shí)現(xiàn)。
5.如權(quán)利要求4所述的網(wǎng)頁文本壓縮方法,其中,在通過在軟件代碼中申請一個(gè)“類”來存儲(chǔ)網(wǎng)頁數(shù)據(jù)的過程中, 先申請部分額外的空間來儲(chǔ)存表示附加的描述信息的類的頭部,然后再申請真正的空間來存儲(chǔ)所述網(wǎng)頁數(shù)據(jù)。
6.一種網(wǎng)頁文本壓縮裝置,包括: 語言環(huán)境確定單元,用于根據(jù)移動(dòng)終端瀏覽器的網(wǎng)頁打開請求獲取終端當(dāng)前的語言環(huán)境; 字符容器初始化單元,用于根據(jù)所述語言環(huán)境初始化與所述語言環(huán)境對應(yīng)的字符容器; 數(shù)據(jù)傳輸單元,用于接收所請求的網(wǎng)頁數(shù)據(jù); 數(shù)據(jù)解析存儲(chǔ)單元,用于解析所述接收的網(wǎng)頁數(shù)據(jù),并利用所述相應(yīng)的字符容器合并存儲(chǔ)所述網(wǎng)頁數(shù)據(jù); 其中,所述字符容器初始化單元包括: 判斷單元,用于判斷所述語言環(huán)境是否屬于拉丁語系,如果是,則所述字符容器初始化單元將所述字符容器初始化為存儲(chǔ)uft-8編碼方式的數(shù)據(jù);否則初始化為存儲(chǔ)uft-16編碼方式的數(shù)據(jù)。
7.如權(quán)利要求6所述的網(wǎng)頁文本壓縮裝置,其中,所述數(shù)據(jù)解析存儲(chǔ)單元包括: 內(nèi)容優(yōu)化存儲(chǔ)單元,用于將所述網(wǎng)頁數(shù)據(jù)的源碼中零散分開的文字對象合并、首尾相接存儲(chǔ)在存儲(chǔ)容器中; 適配單元,用于為所述存儲(chǔ)容器增加適配索引,以根據(jù)索引值從所述存儲(chǔ)容器中適配相應(yīng)的文字對象。
8.如權(quán)利要求6所述的網(wǎng)頁文本壓縮裝置,其中,所述字符容器為存儲(chǔ)相關(guān)網(wǎng)頁數(shù)據(jù)的存儲(chǔ)空間,通過在軟件代碼中申請一個(gè)“類”來存儲(chǔ)網(wǎng)頁數(shù)據(jù)實(shí)現(xiàn)。
9.如權(quán)利要求8所述的網(wǎng)頁文本壓縮裝置,其中,在通過在軟件代碼中申請一個(gè)“類”來存儲(chǔ)網(wǎng)頁數(shù)據(jù)的過程中, 先申請部分額外的空間來儲(chǔ)存表示附加的描述信息的類的頭部,然后再申請真正的空間來存儲(chǔ)所述網(wǎng)頁 數(shù)據(jù)。
全文摘要
本發(fā)明提供了一種網(wǎng)頁文本壓縮方法和裝置,其中的方法包括根據(jù)移動(dòng)終端瀏覽器的網(wǎng)頁打開請求獲取終端當(dāng)前的語言環(huán)境;根據(jù)語言環(huán)境初始化與所述語言環(huán)境對應(yīng)的字符容器;接收所請求的網(wǎng)頁數(shù)據(jù);解析所述接收的網(wǎng)頁數(shù)據(jù),并利用所述相應(yīng)的字符容器合并存儲(chǔ)所述網(wǎng)頁數(shù)據(jù);其中,在根據(jù)所述語言環(huán)境初始化相應(yīng)的字符容器的過程中,具體包括判斷所述語言環(huán)境是否屬于拉丁語系,如果是,則初始化為存儲(chǔ)uft-8編碼方式的數(shù)據(jù);否則初始化為存儲(chǔ)uft-16編碼方式的數(shù)據(jù)。本發(fā)明能夠根據(jù)語言環(huán)境,智能的判斷存儲(chǔ)方式,并且對存儲(chǔ)內(nèi)容進(jìn)行優(yōu)化和適配處理,有效降低網(wǎng)頁數(shù)據(jù)對瀏覽器的內(nèi)存占用。
文檔編號(hào)G06F17/22GK103077159SQ20121059391
公開日2013年5月1日 申請日期2012年12月31日 優(yōu)先權(quán)日2012年12月31日
發(fā)明者梁捷, 俞永福, 何小鵬, 朱順炎, 楊興 申請人:廣州市動(dòng)景計(jì)算機(jī)科技有限公司