專利名稱:富文本內(nèi)容的處理方法和服務(wù)器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)安全技術(shù)領(lǐng)域,具體涉及一種富文本內(nèi)容的處理方法和服務(wù)器。
背景技術(shù):
在WEB2. O時(shí)代,網(wǎng)絡(luò)產(chǎn)品提供文本發(fā)布入口讓用戶來(lái)產(chǎn)生內(nèi)容。為了滿足用戶創(chuàng)造內(nèi)容更加豐富化的需求,文本發(fā)布入口通常支持富文本格式的內(nèi)容,即包含HTML標(biāo)簽的內(nèi)容。用戶通過(guò)文本發(fā)布入口將富文本內(nèi)容發(fā)布到服務(wù)端,服務(wù)端需要對(duì)富文本內(nèi)容進(jìn)行安全檢查和過(guò)濾,然后進(jìn)行存儲(chǔ)和展現(xiàn)?,F(xiàn)有的富文本的傳輸與過(guò)濾方法具體為用戶在瀏覽器端創(chuàng)造富文本,然后瀏覽器直接將富文本發(fā)送到服務(wù)端;服務(wù)端對(duì)富文本進(jìn)行詞法分析和語(yǔ)法分析,對(duì)可能產(chǎn)生安全問(wèn)題的內(nèi)容進(jìn)行過(guò)濾,最終得到相對(duì)安全的內(nèi)容。但是,由于富文本的內(nèi)容非常復(fù)雜,而且各個(gè)瀏覽器對(duì)富文本支持的一些語(yǔ)法上有差異,導(dǎo)致服務(wù)端過(guò)濾的時(shí)候需要知道所有瀏覽器一些細(xì)微的特性,工作量非常巨大。并且有些特征是由于瀏覽器的BUG導(dǎo)致的。這種情況下,雖然服務(wù)端做了大量的安全過(guò)濾工作,但往往還是會(huì)出現(xiàn)安全漏洞,危及產(chǎn)品安全??偠灾?wù)端對(duì)富文本的過(guò)濾邏輯非常復(fù)雜,而且也不能保證100%安全;服務(wù)端的過(guò)濾十分耗時(shí),會(huì)對(duì)性能產(chǎn)生一定影響,從而影響用戶的發(fā)布效率。
S明內(nèi)容鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的富文本內(nèi)容的處理方法和服務(wù)器。根據(jù)本發(fā)明的一個(gè)方面,提供了一種富文本內(nèi)容的處理方法。富文本內(nèi)容包括一個(gè)或者多個(gè)標(biāo)簽,一個(gè)或者多個(gè)標(biāo)簽嵌套,并且每個(gè)標(biāo)簽具有相關(guān)聯(lián)的一個(gè)或者多個(gè)屬性。根據(jù)本發(fā)明的富文本內(nèi)容處理方法還包括獲取對(duì)富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)對(duì)富文本內(nèi)容中的各個(gè)標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述;將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對(duì)象化數(shù)據(jù),對(duì)象化數(shù)據(jù)包括與各個(gè)標(biāo)簽和屬性相對(duì)應(yīng)的一個(gè)或者多個(gè)數(shù)據(jù)對(duì)象;使用預(yù)先配置的規(guī)則對(duì)對(duì)象化數(shù)據(jù)進(jìn)行處理,以便刪除與預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對(duì)應(yīng)的數(shù)據(jù)對(duì)象之外的數(shù)據(jù)對(duì)象;以及將處理后的數(shù)據(jù)對(duì)象進(jìn)行轉(zhuǎn)義處理,以獲得經(jīng)處理的富文本內(nèi)容。根據(jù)本發(fā)明的另一方面,提供了 一種服務(wù)器,包括網(wǎng)絡(luò)接口,適于獲取對(duì)富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù),富文本內(nèi)容包括一個(gè)或者多個(gè)標(biāo)簽,一個(gè)或者多個(gè)標(biāo)簽嵌套,并且每個(gè)標(biāo)簽具有相關(guān)聯(lián)的一個(gè)或者多個(gè)屬性,而結(jié)構(gòu)化數(shù)據(jù)對(duì)富文本內(nèi)容中的各個(gè)標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述;數(shù)據(jù)轉(zhuǎn)換器,適于將網(wǎng)絡(luò)接口獲得的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對(duì)象化數(shù)據(jù),對(duì)象化數(shù)據(jù)包括與各個(gè)標(biāo)簽和屬性相對(duì)應(yīng)的一個(gè)或者多個(gè)數(shù)據(jù)對(duì)象;過(guò)濾器,適于使用預(yù)先配置的規(guī)則對(duì)由數(shù)據(jù)轉(zhuǎn)換器轉(zhuǎn)換得到的對(duì)象化數(shù)據(jù)進(jìn)行處理,以便刪除與預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對(duì)應(yīng)的數(shù)據(jù)對(duì)象之外的數(shù)據(jù)對(duì)象;轉(zhuǎn)義器,適于將過(guò)濾器處理后的數(shù)據(jù)對(duì)象進(jìn)行轉(zhuǎn)義處理,以獲得經(jīng)處理的富文本內(nèi)容。根據(jù)本發(fā)明提供的方案,通過(guò)獲取對(duì)富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù),將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對(duì)象化數(shù)據(jù),使用預(yù)先配置的規(guī)則對(duì)對(duì)象化數(shù)據(jù)進(jìn)行處理,以便刪除與預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對(duì)應(yīng)的數(shù)據(jù)對(duì)象之外的數(shù)據(jù)對(duì)象,也即過(guò)濾掉預(yù)先配置的規(guī)則定義的要保留的信息以外的信息,再進(jìn)行轉(zhuǎn)義處理以獲得經(jīng)處理的富文本內(nèi)容。本發(fā)明將富文本內(nèi)容通過(guò)兩步轉(zhuǎn)換成為數(shù)據(jù)對(duì)象再進(jìn)行過(guò)濾處理,與現(xiàn)有技術(shù)直接對(duì)富文本內(nèi)容本身進(jìn)行過(guò)濾相比,大大簡(jiǎn)化了對(duì)富文本內(nèi)容過(guò)濾的處理邏輯,使得處理性能大大提高。另外,這樣轉(zhuǎn)化后的富文本內(nèi)容即保留了原富文本內(nèi)容的絕大部分格式,又更加規(guī)范,從而減少了由于富文本內(nèi)容而導(dǎo)致頁(yè)面呈現(xiàn)出現(xiàn)問(wèn)題的缺陷。另外,根據(jù)本發(fā)明提供的方案,通過(guò)將對(duì)富文本內(nèi)容的處理過(guò)程分解為在客戶端上進(jìn)行的一部分處理和在服務(wù)器上進(jìn)行的另一部分處理。在客戶端上首先把富文本內(nèi)容轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),然后在服務(wù)器上對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行再次處理并轉(zhuǎn)化為富文本內(nèi)容,由于結(jié)構(gòu)化數(shù)據(jù)更容易處理,所以這種方案,可以把有可能由于客戶端差異而導(dǎo)致的富文本內(nèi)容的格式缺陷留在客戶端處來(lái)進(jìn)行處理,而服務(wù)器僅僅處理基本沒(méi)有格式缺陷的數(shù)據(jù),從而可以大大簡(jiǎn)化服務(wù)器處的處理過(guò)程。上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式
。
通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中圖1示出了一段文本的示意圖;圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的富文本內(nèi)容的處理方法的流程圖;圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的富文本內(nèi)容的處理系統(tǒng)的結(jié)構(gòu)框圖。
具體實(shí)施例方式下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi)的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。本文中所提到的富文本內(nèi)容是一種包含標(biāo)簽(如HTML標(biāo)簽)的文本內(nèi)容。更為具體地說(shuō),富文本內(nèi)容包括一個(gè)或者多個(gè)標(biāo)簽,其中一個(gè)或者多個(gè)標(biāo)簽可以嵌套,即一個(gè)標(biāo)簽中可以包含一個(gè)或多個(gè)其它的標(biāo)簽。每個(gè)標(biāo)簽可以具有相關(guān)聯(lián)的一個(gè)或者多個(gè)屬性。圖1示出了一段文本的示意圖,這段文本對(duì)應(yīng)的富文本內(nèi)容如下<hl>—種富文本傳輸與過(guò)濾裝置</hl><img src=//http : //ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80 j.jpg" width="440"height="315"/></p> 〈span style=〃color:#548dd4; 〃>兩個(gè)男孩同時(shí)喜歡上了一個(gè)女孩,吸引住男孩的究竟是女孩身上的什么特質(zhì)呢?想清楚了這個(gè)問(wèn)題的男孩成了哲學(xué)家,沒(méi)想清楚這個(gè)問(wèn)題的成了這個(gè)女人的丈夫。〈/span〉</p><strong>by welefen</strong>(<a href = ^http : // www. we I ef en.com〃target=〃_self〃 >http://www. welefen. com〈/a>)</p>在上述富文本內(nèi)容中,“<hl> —種富文本傳輸與過(guò)濾裝置</hl>”為一個(gè)HTML標(biāo)簽。“<img src=//http : //ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80 j.jpg//width=//440//height=//315///></p>”為一個(gè)HTML標(biāo)簽,這個(gè)HTML標(biāo)簽中還嵌套了另一個(gè)HTML標(biāo)簽“〈img src = //http://ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80j.jpg " width="440"height="315"/>”。另外,在 HTML 標(biāo)簽“〈img src=//http://ww2.sinaimg. cn/bmiddle/68361562gwldy4vayca80j. jpg " width="440"height="315"/>,,中,“src = "http://ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80j.jpg" width=〃440〃height=〃315" ”為該HTML標(biāo)簽的3個(gè)屬性,分別表示圖片的url,寬度和高度。本發(fā)明以圖1所示的文本對(duì)應(yīng)的富文本內(nèi)容作為例子,進(jìn)一步介紹本發(fā)明的技術(shù)方案。圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的富文本內(nèi)容的處理方法200的流程圖。如圖2所示,方法200始于步驟S201,其中服務(wù)器獲取對(duì)富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù)。也就是說(shuō),在服務(wù)器對(duì)富文本內(nèi)容進(jìn)行處理之前,需要首先將富文本內(nèi)容轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)??蛇x擇地,可以事先在客戶端處進(jìn)行該轉(zhuǎn)化。因此,在本方法中,在客戶端獲取到用戶在客戶端創(chuàng)造的富文本內(nèi)容之后,客戶端對(duì)富文本內(nèi)容進(jìn)行轉(zhuǎn)化得到結(jié)構(gòu)化數(shù)據(jù),該結(jié)構(gòu)化數(shù)據(jù)是對(duì)富文本內(nèi)容中的各個(gè)標(biāo)簽和屬性進(jìn)行的結(jié)構(gòu)化描述??蛇x地,結(jié)構(gòu)化數(shù)據(jù)包括各個(gè)標(biāo)簽的標(biāo)簽名、標(biāo)簽內(nèi)容和與該標(biāo)簽相關(guān)聯(lián)的一個(gè)或者多個(gè)屬性,以及各個(gè)標(biāo)簽之間的嵌套關(guān)系。具體地,根據(jù)本發(fā)明的一個(gè)實(shí)施例,駐留在客戶端的javascript代碼將富文本內(nèi)容轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。舉例而言,對(duì)上述富文本內(nèi)容進(jìn)行轉(zhuǎn)化得到的結(jié)構(gòu)化數(shù)據(jù)為[ {〃tag〃 〃hl〃,〃child〃 [ {〃text〃 〃\n — 種富文本傳輸與過(guò)濾裝置\11"}]},{ " text":"\n"},{ " tag":"p","child":
n〃},{ " tag〃〃img〃,〃attr〃{ " src〃"http://ww2.sinaimg.cn/bmiddle/68361562gwldy4vayca80j. jpg", "width":"440","height":"315"}},{ " text": O ]},{〃 text": O,{〃 tag": "p", "chiIcT: [ {"text": O,{" tag": "span", "attr": { " style": "color: #548dd4; "}, "child": [ { " text":"兩個(gè)男孩同時(shí)喜歡上了一個(gè)女孩,吸引住男孩的究竟是女孩身上的什么特質(zhì)呢?想清楚了這個(gè)問(wèn)題的男孩成了哲學(xué)家,沒(méi)想清楚這個(gè)問(wèn)題的成了這個(gè)女人的丈夫?!▆]},{〃teXt〃:〃\n〃}]},{"text 、η"},{ " tag":"p", "chilcT:[{"text": O,{ " tag":"strong", "chiIcT:[{"text",by welefen^} ]}, { " text": " O,{"tag": "a", "attr": { " href " ,http://www.welefen.com〃,〃target〃〃self〃}, 〃child〃[{〃text〃〃http://www.welefen.這是一種JSON格式的結(jié)構(gòu)化數(shù)據(jù),本發(fā)明并不受限于此,并且所有可以對(duì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化描述的格式都在本發(fā)明的保護(hù)范圍之內(nèi)。如上所述,結(jié)構(gòu)化數(shù)據(jù){" tag〃:〃hl","child": [{" text〃:〃\n—種富文本傳輸與過(guò)濾裝置\n"}]}是由標(biāo)簽“<hl> —種富文本傳輸與過(guò)濾裝置</hl>”轉(zhuǎn)化得到的,該結(jié)構(gòu)化數(shù)據(jù)包括標(biāo)簽的標(biāo)簽名“hl”,標(biāo)簽內(nèi)容“一種富文本傳輸與過(guò)濾裝置”。其中,結(jié)構(gòu)化數(shù)據(jù){ 〃 tag": "P", "chilcT: [ {"text": η},{ 〃 tag": "img'"attr": { 〃 src": "http://ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80j.jpg〃,"width":〃440〃,"height":"315"}},{ " text": "\n"} ]}是由標(biāo)簽“〈pXimg src=//http://ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80j. jpg//width=//440//height=//315///></p>”轉(zhuǎn)化得到的,該結(jié)構(gòu)化數(shù)據(jù)包括標(biāo)簽的標(biāo)簽名“P”和“img”和對(duì)應(yīng)的標(biāo)簽內(nèi)容,以及與標(biāo)簽相關(guān)聯(lián)的屬性“〃attr〃 { " src〃 〃http://ww2. sinaimg. cn/bmiddle/68361562gwldy4vayca80j. jpg", "width":"440","height":"315"}”,其中“ text":"\n} ”表示標(biāo)簽內(nèi)容中的換行。另外,標(biāo)簽名為“P”的標(biāo)簽與標(biāo)簽名為“img”的標(biāo)簽的嵌套關(guān)系也體現(xiàn)在結(jié)構(gòu)化數(shù)據(jù)中,具體為標(biāo)簽名為“ img”的標(biāo)簽是標(biāo)簽名為“p”的標(biāo)簽的標(biāo)簽內(nèi)容。
在客戶端得到上述結(jié)構(gòu)化數(shù)據(jù)之后,將其傳遞給服務(wù)器,服務(wù)器由此獲取對(duì)富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù)。隨后,方法200進(jìn)入步驟S202,其中服務(wù)器將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對(duì)象化數(shù)據(jù)。具體地,服務(wù)器可以利用各種編程語(yǔ)言原生提供的功能將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對(duì)象化數(shù)據(jù)。轉(zhuǎn)換得到的對(duì)象化數(shù)據(jù)包括與各個(gè)標(biāo)簽和屬性相對(duì)應(yīng)的一個(gè)或者多個(gè)數(shù)據(jù)對(duì)象??蛇x地,步驟S202將字符串形式的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為具有相互關(guān)聯(lián)關(guān)系的一個(gè)或者多個(gè)數(shù)據(jù)對(duì)象。以結(jié)構(gòu)化數(shù)據(jù)具有JSON格式為例,JSON格式是指將javascript對(duì)象中的一組數(shù)據(jù)轉(zhuǎn)換得到的字符串格式,對(duì)于這種格式的結(jié)構(gòu)化數(shù)據(jù),可以使用PHP語(yǔ)言中的json_decode方法實(shí)現(xiàn)對(duì)結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)換。json_deCode方法是將JSON格式的字符串進(jìn)行解碼,從而轉(zhuǎn)換為PHP的關(guān)聯(lián)數(shù)組,即具有相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)對(duì)象。應(yīng)當(dāng)注意的是,本發(fā)明不受限于具體編程語(yǔ)言,所以可以把JSON格式的字符串轉(zhuǎn)換為具有相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)對(duì)象都在本發(fā)明的保護(hù)范圍之內(nèi)。隨后,方法200進(jìn)入步驟S203,其中服務(wù)器使用預(yù)先配置的規(guī)則對(duì)對(duì)象化數(shù)據(jù)進(jìn)行處理,以便刪除與預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對(duì)應(yīng)的數(shù)據(jù)對(duì)象之外的數(shù)據(jù)對(duì)象。預(yù)先配置的規(guī)則可以為白名單規(guī)則,該白名單規(guī)則定義了允許保留的標(biāo)簽和屬性。例如,下文中示出了一個(gè)與白名單規(guī)則相對(duì)應(yīng)的配置文件
權(quán)利要求
1.一種富文本內(nèi)容的處理方法,所述富文本內(nèi)容包括一個(gè)或者多個(gè)標(biāo)簽,所述一個(gè)或者多個(gè)標(biāo)簽嵌套,并且每個(gè)標(biāo)簽具有相關(guān)聯(lián)的一個(gè)或者多個(gè)屬性,該方法包括 獲取對(duì)富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù),所述結(jié)構(gòu)化數(shù)據(jù)對(duì)所述富文本內(nèi)容中的各個(gè)標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述; 將所述結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對(duì)象化數(shù)據(jù),所述對(duì)象化數(shù)據(jù)包括與各個(gè)標(biāo)簽和屬性相對(duì)應(yīng)的一個(gè)或者多個(gè)數(shù)據(jù)對(duì)象; 使用預(yù)先配置的規(guī)則對(duì)所述對(duì)象化數(shù)據(jù)進(jìn)行處理,以便刪除與所述預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對(duì)應(yīng)的數(shù)據(jù)對(duì)象之外的數(shù)據(jù)對(duì)象; 將處理后的數(shù)據(jù)對(duì)象進(jìn)行轉(zhuǎn)義處理,以獲得經(jīng)處理的富文本內(nèi)容。
2.根據(jù)權(quán)利要求1所述的方法,所述結(jié)構(gòu)化數(shù)據(jù)包括各個(gè)標(biāo)簽的標(biāo)簽名、標(biāo)簽內(nèi)容和與該標(biāo)簽相關(guān)聯(lián)的一個(gè)或者多個(gè)屬性,以及各個(gè)標(biāo)簽之間的嵌套關(guān)系。
3.根據(jù)權(quán)利要求1或2所述的方法,所述將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為對(duì)象化數(shù)據(jù)對(duì)象包括將字符串形式的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為具有相互關(guān)聯(lián)關(guān)系的一個(gè)或者多個(gè)數(shù)據(jù)對(duì)象。
4.根據(jù)權(quán)利要求3所述的方法,所述結(jié)構(gòu)化數(shù)據(jù)具有JSON格式。
5.一種服務(wù)器,包括 網(wǎng)絡(luò)接口,適于獲取對(duì)富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù),所述富文本內(nèi)容包括一個(gè)或者多個(gè)標(biāo)簽,所述一個(gè)或者多個(gè)標(biāo)簽嵌套,并且每個(gè)標(biāo)簽具有相關(guān)聯(lián)的一個(gè)或者多個(gè)屬性,所述結(jié)構(gòu)化數(shù)據(jù)對(duì)所述富文本內(nèi)容中的各個(gè)標(biāo)簽和屬性進(jìn)行結(jié)構(gòu)化描述; 數(shù)據(jù)轉(zhuǎn)換器,適于將所述網(wǎng)絡(luò)接口獲得的所述結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對(duì)象化數(shù)據(jù),所述對(duì)象化數(shù)據(jù)包括與各個(gè)標(biāo)簽和屬性相對(duì)應(yīng)的一個(gè)或者多個(gè)數(shù)據(jù)對(duì)象; 過(guò)濾器,適于使用預(yù)先配置的規(guī)則對(duì)由所述數(shù)據(jù)轉(zhuǎn)換器轉(zhuǎn)換得到的所述對(duì)象化數(shù)據(jù)進(jìn)行處理,以便刪除與所述預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對(duì)應(yīng)的數(shù)據(jù)對(duì)象之外的數(shù)據(jù)對(duì)象; 轉(zhuǎn)義器,適于將所述過(guò)濾器處理后的數(shù)據(jù)對(duì)象進(jìn)行轉(zhuǎn)義處理,以獲得經(jīng)處理的富文本內(nèi)容。
6.根據(jù)權(quán)利要求5所述的服務(wù)器,所述網(wǎng)絡(luò)接口得到的結(jié)構(gòu)化數(shù)據(jù)包括各個(gè)標(biāo)簽的標(biāo)簽名、標(biāo)簽內(nèi)容和與該標(biāo)簽相關(guān)聯(lián)的一個(gè)或者多個(gè)屬性,以及各個(gè)標(biāo)簽之間的嵌套關(guān)系。
7.根據(jù)權(quán)利要求5或6所述的服務(wù)器,所述數(shù)據(jù)轉(zhuǎn)換器進(jìn)一步適于將所述網(wǎng)絡(luò)接口獲得的字符串形式的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為具有相互關(guān)聯(lián)關(guān)系的一個(gè)或者多個(gè)數(shù)據(jù)對(duì)象。
8.根據(jù)權(quán)利要求7所述的服務(wù)器,所述結(jié)構(gòu)化數(shù)據(jù)具有JSON格式。
全文摘要
本發(fā)明公開(kāi)了一種富文本內(nèi)容的處理方法和服務(wù)器。其中方法包括獲取對(duì)富文本內(nèi)容進(jìn)行轉(zhuǎn)化而得到的結(jié)構(gòu)化數(shù)據(jù);將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為對(duì)象化數(shù)據(jù);使用預(yù)先配置的規(guī)則對(duì)對(duì)象化數(shù)據(jù)進(jìn)行處理,以便刪除與預(yù)先配置的規(guī)則定義要保留的標(biāo)簽和屬性相對(duì)應(yīng)的數(shù)據(jù)對(duì)象之外的數(shù)據(jù)對(duì)象;將處理后的數(shù)據(jù)對(duì)象進(jìn)行轉(zhuǎn)義處理,以獲得經(jīng)處理的富文本內(nèi)容。本發(fā)明將富文本內(nèi)容通過(guò)兩步轉(zhuǎn)換成為數(shù)據(jù)對(duì)象再進(jìn)行過(guò)濾處理,與現(xiàn)有技術(shù)直接對(duì)富文本內(nèi)容本身進(jìn)行過(guò)濾相比,大大簡(jiǎn)化了對(duì)富文本內(nèi)容過(guò)濾的處理邏輯,使得處理性能大大提高。
文檔編號(hào)G06F17/22GK103034622SQ20121051842
公開(kāi)日2013年4月10日 申請(qǐng)日期2012年12月5日 優(yōu)先權(quán)日2012年12月5日
發(fā)明者李成銀 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司