国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種電子文檔的處理方法及裝置制造方法

      文檔序號(hào):6628887閱讀:197來源:國知局
      一種電子文檔的處理方法及裝置制造方法【專利摘要】本發(fā)明實(shí)施例提供了一種電子文檔的處理方法及裝置。一方面,本發(fā)明實(shí)施例通過獲得包含電子文檔中表格的第一圖片信息,進(jìn)而依據(jù)所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,所述以第二排版方式顯示的所述電子文檔包含所述第一圖片信息。因此,本發(fā)明實(shí)施例提供的技術(shù)方案能夠自動(dòng)生成包含電子文檔中表格的圖片,從而實(shí)現(xiàn)提高電子文檔的重排版處理的效率。【專利說明】—種電子文檔的處理方法及裝置【【
      技術(shù)領(lǐng)域
      】】[0001]本發(fā)明涉及計(jì)算機(jī)【
      技術(shù)領(lǐng)域
      】,尤其涉及一種電子文檔的處理方法及裝置。【【
      背景技術(shù)
      】】[0002]目前,客戶端顯示電子文檔時(shí),為了能夠依據(jù)客戶端的大小來排列電子文檔中的文檔內(nèi)容,如文字、表格和圖片等,需要對(duì)待顯示的電子文檔進(jìn)行重排版處理,其方法是:先將電子文檔由版式格式轉(zhuǎn)化成流式格式,然后對(duì)流式格式的電子文檔進(jìn)行重排版處理。[0003]然而,現(xiàn)有技術(shù)中在將電子文檔由版式格式轉(zhuǎn)化成流式格式時(shí),電子文檔中的表格經(jīng)過轉(zhuǎn)化后,會(huì)出現(xiàn)表格中文字的排版混亂或者表格中的文字丟失的問題,進(jìn)而會(huì)影響電子文檔中其他文檔內(nèi)容的重排版處理。為了解決該問題,現(xiàn)有技術(shù)中是由用戶手動(dòng)將表格錄入到待顯示的電子文檔中,這種電子文檔的處理方式使得表格的處理效率比較低,從而導(dǎo)致電子文檔的重排版處理的效率比較低?!尽?br/>發(fā)明內(nèi)容】】[0004]有鑒于此,本發(fā)明實(shí)施例提供了一種電子文檔的處理方法及裝置,能夠自動(dòng)生成包含電子文檔中表格的圖片,從而實(shí)現(xiàn)提高電子文檔的重排版處理的效率。[0005]本發(fā)明實(shí)施例的一方面,提供一種電子文檔的處理方法,包括:[0006]獲得包含電子文檔中表格的第一圖片信息;[0007]依據(jù)所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,所述以第二排版方式顯示的所述電子文檔包含所述第一圖片信息。[0008]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述獲得包含電子文檔中表格的第一圖片信息,包括:[0009]獲得所述電子文檔中表格的范圍信息;[0010]獲得包含所述電子文檔的第二圖片信息;[0011]依據(jù)所述范圍信息,從所述第二圖片信息中截取所述第一圖片信息。[0012]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述獲得所述電子文檔中表格的范圍信息,包括:[0013]依據(jù)所述電子文檔中文檔內(nèi)容的屬性信息,獲得所述電子文檔中的線條;[0014]依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。[0015]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息,包括:[0016]依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,對(duì)所述電子文檔中的線條進(jìn)行分組處理,以獲得M個(gè)線條組,M為大于或者等于I的整數(shù);[0017]獲得所述M個(gè)線條組中符合表格特征的N個(gè)線條組,N為大于或者等于1,且小于或者等于M的整數(shù);[0018]獲得所述N個(gè)線條組中每個(gè)所述線條組對(duì)應(yīng)的表格的四個(gè)端點(diǎn)坐標(biāo)信息;[0019]依據(jù)所述四個(gè)端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。[0020]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述依據(jù)所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,包括:[0021]對(duì)版式格式的所述電子文檔進(jìn)行轉(zhuǎn)化處理,以獲得以第一排版方式顯示的流式格式的所述電子文檔;[0022]依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。[0023]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔,包括:[0024]利用所述第一圖片信息,替換所述以第一排版方式顯示的流式格式的所述電子文檔中所述第一圖片信息所包含的表格;[0025]對(duì)經(jīng)過替換處理后獲得的以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。[0026]本發(fā)明實(shí)施例的一方面,提供一種電子文檔的處理裝置,包括:[0027]獲取單元,用于獲得包含電子文檔中表格的第一圖片信息;[0028]處理單元,用于依據(jù)所述獲取單元獲得的所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,所述以第二排版方式顯示的所述電子文檔包含所述第一圖片信息。[0029]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述獲取單元,具體用于:[0030]獲得所述電子文檔中表格的范圍信息;[0031]獲得包含所述電子文檔的第二圖片信息;[0032]依據(jù)所述范圍信息,從所述第二圖片信息中截取所述第一圖片信息。[0033]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述獲得所述電子文檔中表格的范圍信息,具體為:[0034]依據(jù)所述電子文檔中文檔內(nèi)容的屬性信息,獲得所述電子文檔中的線條;[0035]依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。[0036]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息,具體為:[0037]依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,對(duì)所述電子文檔中的線條進(jìn)行分組處理,以獲得M個(gè)線條組,M為大于或者等于I的整數(shù);[0038]獲得所述M個(gè)線條組中符合表格特征的N個(gè)線條組,N為大于或者等于1,且小于或者等于M的整數(shù);[0039]獲得所述N個(gè)線條組中每個(gè)所述線條組對(duì)應(yīng)的表格的四個(gè)端點(diǎn)坐標(biāo)信息;[0040]依據(jù)所述四個(gè)端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。[0041]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述處理單元,具體用于:[0042]對(duì)版式格式的所述電子文檔進(jìn)行轉(zhuǎn)化處理,以獲得以第一排版方式顯示的流式格式的所述電子文檔;[0043]依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。[0044]如上所述的方面和任一可能的實(shí)現(xiàn)方式,進(jìn)一步提供一種實(shí)現(xiàn)方式,所述依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔,具體為:[0045]利用所述第一圖片信息,替換所述以第一排版方式顯示的流式格式的所述電子文檔中所述第一圖片信息所包含的表格;[0046]對(duì)經(jīng)過替換處理后獲得的以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。[0047]由以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下有益效果:[0048]本發(fā)明實(shí)施例通過獲得包含電子文檔中表格的第一圖片信息,進(jìn)而依據(jù)所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,所述以第二排版方式顯示的所述電子文檔包含所述第一圖片信肩、O[0049]本發(fā)明實(shí)施例提供的技術(shù)方案能夠自動(dòng)生成包含電子文檔中表格的圖片,然后利用該圖片實(shí)現(xiàn)電子文檔的重排版處理,重排版處理后獲得的電子文檔中包含該圖片。與現(xiàn)有技術(shù)中手動(dòng)在錄入表格的處理方式相比,可以提高表格的處理效率,從而提高電子文檔的重排版處理的效率?!尽緦@綀D】【附圖說明】】[0050]為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其它的附圖。[0051]圖1是本發(fā)明實(shí)施例所提供的電子文檔的處理方法的流程示意圖;[0052]圖2是本發(fā)明實(shí)施例所提供的電子文檔的處理裝置的功能方塊圖。【【具體實(shí)施方式】】[0053]為了更好的理解本發(fā)明的技術(shù)方案,下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例進(jìn)行詳細(xì)描述。[0054]應(yīng)當(dāng)明確,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。[0055]在本發(fā)明實(shí)施例中使用的術(shù)語是僅僅出于描述特定實(shí)施例的目的,而非旨在限制本發(fā)明。在本發(fā)明實(shí)施例和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義。[0056]應(yīng)當(dāng)理解,本文中使用的術(shù)語“和/或”僅僅是一種描述關(guān)聯(lián)對(duì)象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/或B,可以表示:單獨(dú)存在A,同時(shí)存在A和B,單獨(dú)存在B這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對(duì)象是一種“或”的關(guān)系。[0057]應(yīng)當(dāng)理解,盡管在本發(fā)明實(shí)施例中可能采用術(shù)語第一、第二等來描述圖片信息,但這些關(guān)鍵詞不應(yīng)限于這些術(shù)語。這些術(shù)語僅用來將圖片信息彼此區(qū)分開。例如,在不脫離本發(fā)明實(shí)施例范圍的情況下,第一圖片信息也可以被稱為第二圖片信息,類似地,第二圖片信息也可以被稱為第一圖片信息。[0058]取決于語境,如在此所使用的詞語“如果”可以被解釋成為“在……時(shí)”或“當(dāng)……時(shí)”或“響應(yīng)于確定”或“響應(yīng)于檢測”。類似地,取決于語境,短語“如果確定”或“如果檢測(陳述的條件或事件)”可以被解釋成為“當(dāng)確定時(shí)”或“響應(yīng)于確定”或“當(dāng)檢測(陳述的條件或事件)時(shí)”或“響應(yīng)于檢測(陳述的條件或事件)”。[0059]本發(fā)明實(shí)施例給出一種電子文檔的處理方法,請參考圖1,其為本發(fā)明實(shí)施例所提供的電子文檔的處理方法的流程示意圖,如圖所示,該方法包括以下步驟:[0060]S101,獲得包含電子文檔中表格的第一圖片信息。[0061]具體的,本發(fā)明實(shí)施例中,在對(duì)電子文檔進(jìn)行重排版處理之前,需要先獲得包含該電子文檔中表格的第一圖片信息。[0062]舉例說明,獲得包含電子文檔中表格的第一圖片信息的方法可以包括但不限于:[0063]首先,獲得所述電子文檔中表格的范圍信息。然后,獲得包含所述電子文檔的第二圖片信息。最后,依據(jù)所述范圍信息,從所述第二圖片信息中截取所述第一圖片信息。[0064]其中,獲得所述電子文檔中表格的范圍信息的方法可以包括但不限于:首先,依據(jù)所述電子文檔中文檔內(nèi)容的屬性信息,獲得所述電子文檔中的線條。然后,依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。[0065]其中,依據(jù)所述范圍信息,從所述第二圖片信息中截取所述第一圖片信息的方法可以包括但不限于:依據(jù)獲得的范圍信息,并利用截圖工具,對(duì)該第二圖片信息進(jìn)行裁剪處理,以獲得包含電子文檔中表格的第一圖片信息。[0066]需要說明的是,所述電子文檔指的是版式格式的電子文檔。版式格式的電子文檔指的是利用一種絕對(duì)描述方式,在自定義的坐標(biāo)系中,明確記錄了電子文檔中每個(gè)文檔內(nèi)容的顯示位置和尺寸等,使電子文檔打印出來的結(jié)果與在終端上瀏覽的結(jié)果一致,而且在任何終端下具有顯示一致性的特點(diǎn),以保證真實(shí)地重現(xiàn)文檔的原貌。例如,目前的可移植文檔格式(PortableDocumentFormat,PDF)就是一種比較典型的版式格式。[0067]優(yōu)選的,所述電子文檔中文檔內(nèi)容可以包括但不限于文字、表格和圖片等。[0068]例如,若所述電子文檔為TOF,可以但不限于利用重排版工具,如XPDF、MuPDF或者KindlePDF閱讀器(KindlePDFViewer,KPV)等,對(duì)電子文檔中文檔內(nèi)容進(jìn)行遍歷,以讀取每個(gè)文檔內(nèi)容的屬性信息。該屬性信息可以包括但不限于文檔內(nèi)容的類型信息。若文檔內(nèi)容的類型信息與線條的類型信息一致,則可以確定該文檔內(nèi)容是線條,這樣,就可以從電子文檔中識(shí)別出若干線條。[0069]例如,線條的類型信息可以包括但不限于“path”,如果重排版工具發(fā)現(xiàn)當(dāng)前遍歷到的文檔內(nèi)容的類型信息是“path”,則可以確定當(dāng)前文檔內(nèi)容是線條。[0070]舉例說明,依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息的方法可以包括但不限于:首先,依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,對(duì)所述電子文檔中的線條進(jìn)行分組處理,以獲得M個(gè)線條組,M為大于或者等于I的整數(shù)。然后,獲得所述M個(gè)線條組中符合表格特征的N個(gè)線條組,N為大于或者等于1,且小于或者等于M的整數(shù)。最后,獲得所述N個(gè)線條組中每個(gè)所述線條組對(duì)應(yīng)的表格的四個(gè)端點(diǎn)坐標(biāo)信息;依據(jù)所述四個(gè)端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。[0071]例如,若所述電子文檔為HF,可以但不限于利用重排版工具,如XPDF、MuPDF或者KPV等,獲得電子文檔中線條的屬性信息,該屬性信息可以包括但不限于線條的端點(diǎn)坐標(biāo)信息。依據(jù)線條的端點(diǎn)坐標(biāo)信息可以從電子文檔中若干線條中,獲得水平線條和垂直線條。其中,水平線條的端點(diǎn)坐標(biāo)信息中,兩端點(diǎn)的X軸坐標(biāo)值不同,但y軸坐標(biāo)值相同;垂直線條的端點(diǎn)坐標(biāo)信息中,兩端點(diǎn)的I軸坐標(biāo)值相同,但X軸坐標(biāo)值不同。[0072]另外,可以依據(jù)獲得的水平線條及其端點(diǎn)坐標(biāo)信息、垂直線條及其端點(diǎn)坐標(biāo)信息,可以將彼此相交的線條劃分為一個(gè)線條組。[0073]例如,若線條A與線條B相交,且線條B與線條C相交,可以將線條A、線條B和線條C劃分到一個(gè)線條組。[0074]可以理解的,通過將若干水平線條和垂直線條劃分為不同線條組,可以將同一電子文檔中屬于不同表格的線條劃分開,劃分為一個(gè)線條組的線條因?yàn)楸舜讼嘟?,因此可以確定屬于同一線條組的線條是屬于同一個(gè)表格的。[0075]在將電子文檔中獲得的若干線條劃分為M個(gè)線條組后,可以依據(jù)預(yù)設(shè)的表格特征,依此判斷M個(gè)線條組中每個(gè)線條組是否符合該表格特征,這樣,就可以獲得M個(gè)線條組中符合表格特征的N個(gè)線條組。另外,若某線條組不符合該表格特征,則丟棄該線條組。[0076]例如,所述表格特征可以包括但不限于:同一線條組的所有水平線條的左端點(diǎn)的X軸坐標(biāo)值都大于或者等于某一坐標(biāo)值,右端點(diǎn)的X軸坐標(biāo)值都小于或者等于某一坐標(biāo)值。以及,同一線條組的所有垂直線條的下端點(diǎn)的I軸坐標(biāo)值都大于或者等于某一坐標(biāo)值,上端點(diǎn)的y軸坐標(biāo)值都小于或者等于某一坐標(biāo)值等。[0077]對(duì)于獲得的N個(gè)線條組,可以依據(jù)每個(gè)線條組中每個(gè)線條的端點(diǎn)坐標(biāo)信息,獲得每個(gè)線條組對(duì)應(yīng)的表格的四個(gè)端點(diǎn)坐標(biāo)信息。線條組對(duì)應(yīng)的表格指的是該線條組中所有線條組成的表格。[0078]其中,所述四個(gè)端點(diǎn)坐標(biāo)信息包括該線條組中X軸坐標(biāo)值最小且I軸坐標(biāo)值最小的一個(gè)端點(diǎn)(xmin,ymin)、x軸坐標(biāo)值最大且y軸坐標(biāo)值最小的一個(gè)端點(diǎn)(xmax,ymin)、x軸坐標(biāo)值最小且I軸坐標(biāo)值最大的一個(gè)端點(diǎn)(xmin,yfflax)以及X軸坐標(biāo)值最大且I軸坐標(biāo)值最大的一個(gè)端點(diǎn)(xmax,ymax),依據(jù)該四個(gè)端點(diǎn)坐標(biāo)信息,獲得電子文檔中該表格的范圍信息。例如,該范圍信息可以包括但不限于Xniin?χ_、ymin?ymax。[0079]在確定電子文檔中表格的范圍信息后,可以將該電子文檔轉(zhuǎn)化成第二圖片信息。然后依據(jù)獲得的電子文檔中表格的范圍信息,對(duì)該第二圖片信息進(jìn)行裁剪處理,就可以獲得第二圖片信息中該范圍信息所指示的范圍內(nèi)的第二圖片信息,第二圖片信息中該范圍信息所指示的范圍內(nèi)的第二圖片信息就是包含電子文檔中該表格的第一圖片信息。[0080]例如,若所述電子文檔為HF,可以但不限于利用XPDF、MuPDF或者KPV等,將電子文檔轉(zhuǎn)化為第二圖片信息。然后依據(jù)范圍信息生成裁剪代碼,運(yùn)行該裁剪代碼,以使得該裁剪代碼可以依據(jù)范圍信息,對(duì)第二圖片信息進(jìn)行裁剪處理。其中,裁剪代碼可以利用但不限于超文本預(yù)處理器(HypertextPreprocessor,PHP)或者C++匯編語言等實(shí)現(xiàn)。[0081]S102,依據(jù)所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,所述以第二排版方式顯示的所述電子文檔包含所述第一圖片信息。[0082]具體的,在獲得包含電子圖片中表格的第一圖片信息后,可以依據(jù)該第一圖片信息,對(duì)以第一排版方式顯示的電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的電子文檔。[0083]舉例說明,依據(jù)該第一圖片信息,對(duì)以第一排版方式顯示的電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的電子文檔的方法可以包括但不限于:[0084]首先,對(duì)版式格式的所述電子文檔進(jìn)行轉(zhuǎn)化處理,以獲得以第一排版方式顯示的流式格式的所述電子文檔。然后,依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。[0085]需要說明的是,由于版式格式的電子文檔包含文檔內(nèi)容以及文檔內(nèi)容的屬性信息,沒有段落的劃分標(biāo)識(shí),所以需要對(duì)版式格式的電子文檔進(jìn)行段落劃分處理,以完成版式格式的電子文檔到流式格式的電子文檔的轉(zhuǎn)化處理。[0086]其中,可以但不限于利用重排版工具,如XPDF、MuPDF或者KPV等,對(duì)版式格式的電子文檔中的文檔內(nèi)容進(jìn)行遍歷,以獲得每個(gè)文字的坐標(biāo)信息。然后,依據(jù)文字的坐標(biāo)信息,可以判斷出屬于同一段落的文字,這樣就可以實(shí)現(xiàn)對(duì)電子文檔中的文檔內(nèi)容進(jìn)行段落劃分。然后利用分段標(biāo)識(shí),對(duì)電子文檔進(jìn)行重新分段,以實(shí)現(xiàn)將版式格式的電子文檔轉(zhuǎn)化為流式格式的電子文檔。[0087]例如,所述分段標(biāo)識(shí)可以包括但不限于回車。[0088]例如,若某一行文字的最末端有位置可以放置文字,但是卻沒有放置文字,則表示下一行文字是下一段落。[0089]再例如,若某兩行文字之間的距離大于一定閾值,也可以確定其中的第二行文字是另一段落。[0090]其中,所述流式格式可以包括但不限于txt格式或者word格式等。[0091]舉例說明,所述依據(jù)所述圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述流式格式的電子文檔的方法可以包括但不限于:[0092]首先,利用所述第一圖片信息,替換所述以第一排版方式顯示的流式格式的所述電子文檔中所述第一圖片信息所包含的表格。然后,對(duì)經(jīng)過替換處理后獲得的以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。[0093]例如,可以在以第一排版方式顯示的流式格式的所述電子文檔中表格的對(duì)應(yīng)區(qū)域的文字刪除,以刪除版式格式的電子文檔中的表格。然后在上述對(duì)應(yīng)區(qū)域插入獲得的包含該表格的第一圖片信息,從而實(shí)現(xiàn)利用第一圖片信息替換以第一排版方式顯示的流式格式的所述電子文檔中所述圖片信息包含的表格。這樣,就可以在轉(zhuǎn)化處理后,將流式格式的電子文檔中出現(xiàn)的排版混亂或者文字丟失的表格的內(nèi)容去除掉,并以包含該表格的第一圖片信息替代,即可以實(shí)現(xiàn)表格的保留,還不會(huì)影響電子文檔中其他文檔內(nèi)容的重排版處理。[0094]其中,可以依據(jù)顯示該電子文檔的客戶端的寬度信息、該客戶端中設(shè)置的文字大小等信息,對(duì)以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述流式格式的電子文檔。[0095]可以理解的,在進(jìn)行重排版處理前,將會(huì)干擾其他文檔內(nèi)容重排版的表格中的文字刪除,并以相應(yīng)的圖片信息替換,就可以即在以第二排版方式顯示的所述流式格式的電子文檔中保留了該表格,同時(shí)又不會(huì)影響其他文檔內(nèi)容的重排版處理。[0096]需要說明的是,本發(fā)明實(shí)施例中所涉及的終端可以包括但不限于個(gè)人計(jì)算機(jī)(PersonalComputer,PC)、個(gè)人數(shù)字助理(PersonalDigitalAssistant,PDA)、無線手持設(shè)備、平板電腦(TabletComputer)、手機(jī)、MP3播放器、MP4播放器等。[0097]需要說明的是,SlOl?S102的執(zhí)行主體可以為電子文檔的處理裝置,該裝置可以位于本地終端的應(yīng)用,或者還可以為位于本地終端的應(yīng)用中的插件或軟件開發(fā)工具包(SoftwareDevelopmentKit,SDK)等功能單元,本發(fā)明實(shí)施例對(duì)此不進(jìn)行特別限定。[0098]可以理解的是,所述應(yīng)用可以是安裝在終端上的應(yīng)用程序(nativeApp),或者還可以是終端上的瀏覽器的一個(gè)網(wǎng)頁程序(webApp),本發(fā)明實(shí)施例對(duì)此不進(jìn)行限定。[0099]本發(fā)明實(shí)施例進(jìn)一步給出實(shí)現(xiàn)上述方法實(shí)施例中各步驟及方法的裝置實(shí)施例。[0100]請參考圖2,其為本發(fā)明實(shí)施例所提供的電子文檔的處理裝置的功能方塊圖。如圖所示,該裝置包括:[0101]獲取單元20,用于獲得包含電子文檔中表格的第一圖片信息;[0102]處理單元21,用于依據(jù)所述獲取單元獲得的所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,所述以第二排版方式顯示的所述電子文檔包含所述第一圖片信息。[0103]優(yōu)選的,所述獲取單元20,具體用于:[0104]獲得所述電子文檔中表格的范圍信息;[0105]獲得包含所述電子文檔的第二圖片信息;[0106]依據(jù)所述范圍信息,從所述第二圖片信息中截取所述第一圖片信息。[0107]優(yōu)選的,所述獲得所述電子文檔中表格的范圍信息,具體為:[0108]依據(jù)所述電子文檔中文檔內(nèi)容的屬性信息,獲得所述電子文檔中的線條;[0109]依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。[0110]優(yōu)選的,所述依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息,具體為:[0111]依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,對(duì)所述電子文檔中的線條進(jìn)行分組處理,以獲得M個(gè)線條組,M為大于或者等于I的整數(shù);[0112]獲得所述M個(gè)線條組中符合表格特征的N個(gè)線條組,N為大于或者等于1,且小于或者等于M的整數(shù);[0113]獲得所述N個(gè)線條組中每個(gè)所述線條組對(duì)應(yīng)的表格的四個(gè)端點(diǎn)坐標(biāo)信息;[0114]依據(jù)所述四個(gè)端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。[0115]優(yōu)選的,所述處理單元21,具體用于:[0116]對(duì)版式格式的所述電子文檔進(jìn)行轉(zhuǎn)化處理,以獲得以第一排版方式顯示的流式格式的所述電子文檔;[0117]依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。[0118]優(yōu)選的,所述依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔,具體為:[0119]利用所述第一圖片信息,替換所述以第一排版方式顯示的流式格式的所述電子文檔中所述第一圖片信息所包含的表格;[0120]對(duì)經(jīng)過替換處理后獲得的以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。[0121]由于本實(shí)施例中的各單元能夠執(zhí)行圖1所示的方法,本實(shí)施例未詳細(xì)描述的部分,可參考對(duì)圖1的相關(guān)說明。[0122]本發(fā)明實(shí)施例的技術(shù)方案具有以下有益效果:[0123]本發(fā)明實(shí)施例通過獲得包含電子文檔中表格的第一圖片信息,進(jìn)而依據(jù)所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,所述以第二排版方式顯示的所述電子文檔包含所述第一圖片信息。本發(fā)明實(shí)施例提供的技術(shù)方案能夠自動(dòng)生成包含電子文檔中表格的圖片,然后利用該圖片實(shí)現(xiàn)電子文檔的重排版處理,重排版處理后獲得的電子文檔中包含該圖片。與現(xiàn)有技術(shù)中手動(dòng)在錄入表格的處理方式相比,可以提高表格的處理效率,從而提高電子文檔的重排版處理的效率。[0124]所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。[0125]在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如,多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。[0126]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。[0127]另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。[0128]上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)裝置(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)裝置等)或處理器(Processor)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(Read-OnlyMemory,ROM)、隨機(jī)存取存儲(chǔ)器(RandomAccessMemory,RAM)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。[0129]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。【權(quán)利要求】1.一種電子文檔的處理方法,其特征在于,所述方法包括:獲得包含電子文檔中表格的第一圖片信息;依據(jù)所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,所述以第二排版方式顯示的所述電子文檔包含所述第一圖片信息。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲得包含電子文檔中表格的第一圖片信息,包括:獲得所述電子文檔中表格的范圍信息;獲得包含所述電子文檔的第二圖片信息;依據(jù)所述范圍信息,從所述第二圖片信息中截取所述第一圖片信息。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲得所述電子文檔中表格的范圍信息,包括:依據(jù)所述電子文檔中文檔內(nèi)容的屬性信息,獲得所述電子文檔中的線條;依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息,包括:依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,對(duì)所述電子文檔中的線條進(jìn)行分組處理,以獲得M個(gè)線條組,M為大于或者等于I的整數(shù);獲得所述M個(gè)線條組中符合表格特征的N個(gè)線條組,N為大于或者等于1,且小于或者等于M的整數(shù);獲得所述N個(gè)線條組中每個(gè)所述線條組對(duì)應(yīng)的表格的四個(gè)端點(diǎn)坐標(biāo)信息;依據(jù)所述四個(gè)端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述依據(jù)所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,包括:對(duì)版式格式的所述電子文檔進(jìn)行轉(zhuǎn)化處理,以獲得以第一排版方式顯示的流式格式的所述電子文檔;依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔,包括:利用所述第一圖片信息,替換所述以第一排版方式顯示的流式格式的所述電子文檔中所述第一圖片信息所包含的表格;對(duì)經(jīng)過替換處理后獲得的以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。7.一種電子文檔的處理裝置,其特征在于,所述裝置包括:獲取單元,用于獲得包含電子文檔中表格的第一圖片信息;處理單元,用于依據(jù)所述獲取單元獲得的所述第一圖片信息,對(duì)以第一排版方式顯示的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的所述電子文檔,所述以第二排版方式顯示的所述電子文檔包含所述第一圖片信息。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述獲取單元,具體用于:獲得所述電子文檔中表格的范圍信息;獲得包含所述電子文檔的第二圖片信息;依據(jù)所述范圍信息,從所述第二圖片信息中截取所述第一圖片信息。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述獲得所述電子文檔中表格的范圍信息,具體為:依據(jù)所述電子文檔中文檔內(nèi)容的屬性信息,獲得所述電子文檔中的線條;依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息,具體為:依據(jù)所述線條的端點(diǎn)坐標(biāo)信息,對(duì)所述電子文檔中的線條進(jìn)行分組處理,以獲得M個(gè)線條組,M為大于或者等于I的整數(shù);獲得所述M個(gè)線條組中符合表格特征的N個(gè)線條組,N為大于或者等于1,且小于或者等于M的整數(shù);獲得所述N個(gè)線條組中每個(gè)所述線條組對(duì)應(yīng)的表格的四個(gè)端點(diǎn)坐標(biāo)信息;依據(jù)所述四個(gè)端點(diǎn)坐標(biāo)信息,獲得所述電子文檔中表格的范圍信息。11.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述處理單元,具體用于:對(duì)版式格式的所述電子文檔進(jìn)行轉(zhuǎn)化處理,以獲得以第一排版方式顯示的流式格式的所述電子文檔;依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述依據(jù)所述第一圖片信息,對(duì)所述以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔,具體為:利用所述第一圖片信息,替換所述以第一排版方式顯示的流式格式的所述電子文檔中所述第一圖片信息所包含的表格;對(duì)經(jīng)過替換處理后獲得的以第一排版方式顯示的流式格式的所述電子文檔進(jìn)行重排版處理,以獲得以第二排版方式顯示的流式格式的所述電子文檔?!疚臋n編號(hào)】G06F17/25GK104281562SQ201410510359【公開日】2015年1月14日申請日期:2014年9月28日優(yōu)先權(quán)日:2014年9月28日【發(fā)明者】徐明申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1