一種文檔合并方法和系統(tǒng)的制作方法

文檔序號：6375768閱讀：182來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種文檔合并方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及文檔處理技術(shù)，尤其涉及一種文檔合并方法和系統(tǒng)。
背景技術(shù)：
隨著計算機(jī)應(yīng)用的普及，電子文檔逐漸取代了原始的紙質(zhì)文檔，成為人們生活和工作中必不可少的文件獲取渠道。的在實(shí)際使用中，有時用戶可能需要對比閱讀相似內(nèi)容的不同版本，例如不同語言版本的同一文件、不同人填寫的同一報表等。但是不同版本通常用不同的文檔進(jìn)行存儲，當(dāng)用戶需要對比閱覽時，通常采用以下兩種方式1、在多個不同文檔間進(jìn)行切換，這需要同時打開多個窗口，或者不停的開啟關(guān)閉閱讀軟件，不僅給操作系統(tǒng)造成較重負(fù)擔(dān)，而且不便于用戶操作，影響了用戶體驗(yàn)；2、將多個文檔進(jìn)行合并，但是現(xiàn)有的文檔處理軟件在合并文檔時，只能按照整體順序依次進(jìn)行合并，即按照第I個文檔、第2個文檔……第η個文檔的順序合并，當(dāng)用戶需要瀏覽第I個文檔的第一頁在第2個文檔上
的對應(yīng)內(nèi)容時，可能需要將瀏覽頁面跳至較遠(yuǎn)的位置，甚至用戶可能無法知曉確切位置，只能慢慢查找，這無疑是一項(xiàng)較為繁瑣的工作，會影響用戶的閱讀體驗(yàn)。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例所要解決的技術(shù)問題在于，提供一種文檔合并方法和系統(tǒng)?？墒褂脩粼谝粋€合成的文檔中方便地對照瀏覽相似內(nèi)容的不同版本。為了解決上述技術(shù)問題，本發(fā)明實(shí)施例提供了一種文檔合并方法，包括
根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元；
根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中；
根據(jù)所述存儲空間中的讀取單元生成合成文檔。其中，所述單元劃分規(guī)則包括每個原始文檔的一頁為一個讀取單元；
所述單元讀取規(guī)則包括按照頁碼順序讀取。其中，所述單元劃分規(guī)則包括每個原始文檔的偶數(shù)頁為一個讀取單元，奇數(shù)頁為另一個讀取單元。其中，所述單元劃分規(guī)則包括不同原始文檔的讀取單元的大小是根據(jù)所述原始文檔的語言類型確定的。其中，所述單元劃分規(guī)則包括每個原始文檔包含的讀取單元的數(shù)目相同。相應(yīng)地，本發(fā)明還提供一種文檔合并系統(tǒng)，包括
讀取單元劃分模塊，用于根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元；
讀取單元排列模塊，用于根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中；
合成文檔生成模塊，用于根據(jù)所述存儲空間中的讀取單元生成合成文檔。
其中，所述單元劃分規(guī)則包括每個原始文檔的一頁為一個讀取單元；
所述單元讀取規(guī)則包括按照頁碼順序讀取。其中，所述單元劃分規(guī)則包括每個原始文檔的偶數(shù)頁為一個讀取單元，奇數(shù)頁為另一個讀取單元。其中，所述單元劃分規(guī)則包括不同原始文檔的讀取單元的大小是根據(jù)所述原始文檔的語言類型確定的。其中，所述單元劃分規(guī)則包括每個原始文檔包含的讀取單元的數(shù)目相同。實(shí)施本發(fā)明實(shí)施例，具有如下有益效果通過將每個原始文檔劃分為至少一個讀取單元，按照一定的規(guī)則將不同原始文檔中對應(yīng)的讀取單元排列在一起，然后生成合并后的文檔，可以方便用戶在一個文檔中對照瀏覽相似內(nèi)容的不同版本，解決了現(xiàn)有技術(shù)的文檔處理軟件在合并文檔時，只能按照整體順序依次進(jìn)行合并導(dǎo)致的瀏覽繁瑣問題，提升了
用戶體驗(yàn)。

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動的前提下，還可以根據(jù)這些附圖獲得其他的附圖。圖I是本發(fā)明提供的文檔合并方法的第一實(shí)施例流程圖2是本發(fā)明提供的文檔合并方法的第二實(shí)施例流程圖3是本發(fā)明提供的文檔合并系統(tǒng)的第一實(shí)施例結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。請參見圖1，是本發(fā)明提供的文檔合并方法的第一實(shí)施例流程圖，該方法包括在步驟S100，根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單
元。單元劃分規(guī)則可以是系統(tǒng)默認(rèn)的或由用戶預(yù)先根據(jù)自己的需求進(jìn)行設(shè)置的任意合適規(guī)貝U。例如，單元劃分規(guī)則可以是每個原始文檔的一頁為一個讀取單元。又例如，單元劃分規(guī)則可以是每個原始文檔的偶數(shù)頁為一個讀取單元，奇數(shù)頁為另一個讀取單元。在步驟S101，根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中。單元讀取規(guī)則同樣可以是系統(tǒng)默認(rèn)的或由用戶預(yù)先根據(jù)自己的需求進(jìn)行設(shè)置的任意合適規(guī)則。例如，單元讀取規(guī)則可以是按照頁碼順序讀取。又例如，單元讀取規(guī)則還可以是先讀取奇數(shù)頁碼，再讀取偶數(shù)頁碼。在步驟S102，根據(jù)所述存儲空間中的讀取單元生成合成文檔。需要說明的是，本發(fā)明實(shí)施例提供的文檔合并方法中的文檔是只是針對PDF文檔而言的，那么在進(jìn)行PDF文檔合并時，要從PDF文檔和其他文檔的屬性來說，PDF文檔有“頁”的概念，而其他文檔是沒有“頁”的概念的，這里的“頁”和我們在Word里的看到的頁是有區(qū)別的。首先，PDF文檔中的頁和頁上的內(nèi)容是獨(dú)立的，而word等其他文檔中的頁和內(nèi)容是互相依賴的，PDF文檔刪除掉頁上的內(nèi)容，頁面依然存在。而Word刪除掉了頁上的內(nèi)容，頁也就被刪除掉了，所以Word里沒有刪除頁面這個功能。其次，在進(jìn)行PDF文檔合并時，需要提取每個文檔中每一頁的信息結(jié)構(gòu)然后重新寫到合并后文檔的數(shù)據(jù)結(jié)構(gòu)中，而其他文檔的合并只是內(nèi)容上的一個追加而已。本發(fā)明實(shí)施例提供的文檔合并方法，通過將每個原始文檔劃分為至少一個讀取單元，按照一定的規(guī)則將不同原始文檔中對應(yīng)的讀取單元排列在一起，然后生成合并后的文檔，可以方便用戶在一個文檔中對照瀏覽相似內(nèi)容的不同版本，提升了用戶體驗(yàn)。請參見圖2，是本發(fā)明提供的文檔合并方法的第二實(shí)施例流程圖。在該實(shí)施例中，假設(shè)有η個原始文檔，每個原始文檔都有m頁。下面將以每個讀取單元為原始頁碼的一頁為例進(jìn)行說明。該方法包括
在步驟S200，將每個原始文檔的每一頁作為一個提取單元。在步驟S201，初始化x0的值，令χ0=1。在步驟S202，判斷x0的值是否大于m。若步驟S202的判斷結(jié)果為否，則執(zhí)行步驟S203。在步驟S203，按照原始文檔f原始文檔η的順序依次提取每個原始文檔的第χ0頁，作為合成文檔的第η* (χ0-1)+1頁至第η*χ0頁，放入預(yù)置的存儲空間中。在步驟S204，將χ0的值增加I。然后返回執(zhí)行步驟S202。若步驟S202的判斷結(jié)果為是，則執(zhí)行步驟S205。在步驟S205，根據(jù)存儲空間中的讀取單元生成合成文檔。圖2僅僅是本發(fā)明的一個實(shí)施例，當(dāng)每個原始文檔的頁碼相同，且需要每頁對照時較常使用，因?yàn)樗鼘?shí)現(xiàn)簡單，處理速度較快，有利于提高效率。但是當(dāng)原始文檔的頁碼不同，每頁的內(nèi)容并不完全對應(yīng)時，這種方法可能存在影響閱讀效果。例如，若原始文檔是同一文件的不同語言版本，由于相同內(nèi)容以不同語言表示時長度可能不一樣，例如同樣的內(nèi)容用中文表示需要2頁，用英文表示可能需要3頁，用日文表示可能需要4頁，若仍然以I頁為讀取單元，很可能造成內(nèi)容上的不對應(yīng)。這時，可以采取其他單元劃分方法，例如，使每個原始文檔包含的讀取單元的數(shù)目相同。又例如，可以根據(jù)原始文檔的語言類型來確定該原始文檔中選取的讀取單元的大小，將中文的讀取單元設(shè)為2頁，英文的讀取單元設(shè)為3頁，日文的讀取單元設(shè)為4頁等。請參見圖3，是本發(fā)明提供的文檔合并系統(tǒng)的第一實(shí)施例結(jié)構(gòu)示意圖，該系統(tǒng)包括
讀取單元劃分模塊310，用于根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元。單元劃分規(guī)則可以是系統(tǒng)默認(rèn)的或由用戶預(yù)先根據(jù)自己的需求進(jìn)行設(shè)置的任意合適規(guī)則。例如，單元劃分規(guī)則可以是每個原始文檔的一頁為一個讀取單元。又例如，單元劃分規(guī)則可以是每個原始文檔的偶數(shù)頁為一個讀取單元，奇數(shù)頁為另一個讀取單
J Li ο讀取單元排列模塊320，用于根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中。單元讀取規(guī)則同樣可以是系統(tǒng)默認(rèn)的或由用戶預(yù)先根據(jù)自己的需求進(jìn)行設(shè)置的任意合適規(guī)則。例如，單元讀取規(guī)則可以是按照頁碼順序讀取。又例如，單元讀取規(guī)則還可以是先讀取奇數(shù)頁碼，再讀取偶數(shù)頁碼。合成文檔生成模塊330，用于根據(jù)所述存儲空間中的讀取單元生成合成文檔。本發(fā)明實(shí)施例提供的文檔合并系統(tǒng)，通過將每個原始文檔劃分為至少一個讀取單元，按照一定的規(guī)則將不同原始文檔中對應(yīng)的讀取單元排列在一起，然后生成合并后的文檔，可以方便用戶在一個文檔中對照瀏覽相似內(nèi)容的不同版本，提升了用戶體驗(yàn)。以讀取單元劃分模塊310取原始文檔的一頁為讀取單元來舉例說明，假設(shè)有η個原始文檔，每個原始文檔有m頁。讀取單元排列模塊320可以按照原始文檔f原始文檔η的順序依次提取每個原始文檔的第I頁，作為合成文檔的第I至η頁，放入預(yù)置的存儲空間；然后按照原始文檔廣原始文檔η的順序依次提取每個原始文檔的第2頁，作為合成文檔的第η+1至2η頁，放入該存儲空間；以此類推，按照原始文檔廣原始文檔η的順序依次提取每個原始文檔的第m頁，作為合成文檔的第n (m-l)+l至nm頁，放入該存儲空間。最
后，合成文檔生成模塊330根據(jù)該存儲空間中存儲的讀取單元合并生成合成文檔。當(dāng)然，這僅僅是本發(fā)明的一個實(shí)施例，當(dāng)每個原始文檔的頁碼相同，且需要每頁對照時較常使用，因?yàn)樗鼘?shí)現(xiàn)簡單，處理速度較快，有利于提高效率。但是當(dāng)原始文檔的頁碼不同，每頁的內(nèi)容并不完全對應(yīng)時，這種方法可能存在影響閱讀效果。例如，若原始文檔是同一文件的不同語言版本，由于相同內(nèi)容以不同語言表示時長度可能不一樣，例如同樣的內(nèi)容用中文表示需要2頁，用英文表示可能需要3頁，用日文表示可能需要4頁，若仍然以I頁為讀取單元，很可能造成內(nèi)容上的不對應(yīng)。這時，可以采取其他單元劃分方法，例如，使每個原始文檔包含的讀取單元的數(shù)目相同。又例如，可以根據(jù)原始文檔的語言類型來確定該原始文檔中選取的讀取單元的大小，將中文的讀取單元設(shè)為2頁，英文的讀取單元設(shè)為3頁，日文的讀取單元設(shè)為4頁等。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程，是可以通過計算機(jī)程序來指令相關(guān)的硬件來完成，所述的程序可存儲于一計算機(jī)可讀取存儲介質(zhì)中，該程序在執(zhí)行時，可包括如上述各方法的實(shí)施例的流程。其中，所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory, ROM)或隨機(jī)存儲記憶體(Random AccessMemory, RAM)等。以上所揭露的僅為本發(fā)明一種較佳實(shí)施例而已，當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍，本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分流程，并依本發(fā)明權(quán)利要求所作的等同變化，仍屬于發(fā)明所涵蓋的范圍。
權(quán)利要求
1.一種文檔合并方法，其特征在于，包括根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元；根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中；根據(jù)所述存儲空間中的讀取單元生成合成文檔。
2.根據(jù)權(quán)利要求I所述的文檔合并方法，其特征在于，所述單元劃分規(guī)則包括每個原始文檔的一頁為一個讀取單元；所述單元讀取規(guī)則包括按照頁碼順序讀取。
3.根據(jù)權(quán)利要求I所述的文檔合并方法，其特征在于，所述單元劃分規(guī)則包括每個原始文檔的偶數(shù)頁為一個讀取單元，奇數(shù)頁為另一個讀取單元。
4.根據(jù)權(quán)利要求I所述的文檔合并方法，其特征在于，所述單元劃分規(guī)則包括不同原始文檔的讀取單元的大小是根據(jù)所述原始文檔的語言類型確定的。
5.根據(jù)權(quán)利要求I所述的文檔合并方法，其特征在于，所述單元劃分規(guī)則包括每個原始文檔包含的讀取單元的數(shù)目相同。
6.一種文檔合并系統(tǒng)，其特征在于，包括讀取單元劃分模塊，用于根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元；讀取單元排列模塊，用于根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中；合成文檔生成模塊，用于根據(jù)所述存儲空間中的讀取單元生成合成文檔。
7.根據(jù)權(quán)利要求6所述的文檔合并系統(tǒng)，其特征在于，所述單元劃分規(guī)則包括每個原始文檔的一頁為一個讀取單元；所述單元讀取規(guī)則包括按照頁碼順序讀取。
8.根據(jù)權(quán)利要求6所述的文檔合并系統(tǒng)，其特征在于，所述單元劃分規(guī)則包括每個原始文檔的偶數(shù)頁為一個讀取單元，奇數(shù)頁為另一個讀取單元。
9.根據(jù)權(quán)利要求6所述的文檔合并系統(tǒng)，其特征在于，所述單元劃分規(guī)則包括不同原始文檔的讀取單元的大小是根據(jù)所述原始文檔的語言類型確定的。
10.根據(jù)權(quán)利要求6所述的文檔合并系統(tǒng)，其特征在于，所述單元劃分規(guī)則包括每個原始文檔包含的讀取單元的數(shù)目相同。
全文摘要
本發(fā)明實(shí)施例公開了一種文檔合并方法，包括根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元；根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中；根據(jù)所述存儲空間中的讀取單元生成合成文檔。本發(fā)明實(shí)施例還公開了一種文檔合并系統(tǒng)。采用本發(fā)明，可以方便用戶在一個文檔中對照瀏覽相似內(nèi)容的不同版本，提升了用戶體驗(yàn)。
文檔編號G06F17/21GK102880653SQ20121030919
公開日2013年1月16日申請日期2012年8月28日優(yōu)先權(quán)日2012年8月28日
發(fā)明者原野申請人:深圳市萬興軟件有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：原野
技術(shù)所有人：深圳市萬興軟件有限公司
我是此專利的發(fā)明人

上一篇：一種集裝箱智能管理系統(tǒng)及方法
上一篇：一種保障接入控制器在高負(fù)載下正常工作的方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種文檔合并方法和系統(tǒng)的制作方法