專利名稱:一種文檔合并方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及文檔處理技術(shù),尤其涉及一種文檔合并方法和系統(tǒng)。
背景技術(shù):
隨著計算機(jī)應(yīng)用的普及,電子文檔逐漸取代了原始的紙質(zhì)文檔,成為人們生活和工作中必不可少的文件獲取渠道。的在實(shí)際使用中,有時用戶可能需要對比閱讀相似內(nèi)容的不同版本,例如不同語言版本的同一文件、不同人填寫的同一報表等。但是不同版本通常用不同的文檔進(jìn)行存儲,當(dāng)用戶需要對比閱覽時,通常采用以下兩種方式1、在多個不同文檔間進(jìn)行切換,這需要同時打開多個窗口,或者不停的開啟關(guān)閉閱讀軟件,不僅給操作系統(tǒng)造成較重負(fù)擔(dān),而且不便于用戶操作,影響了用戶體驗(yàn);2、將多個文檔進(jìn)行合并,但是現(xiàn)有的文檔處理軟件在合并文檔時,只能按照整體順序依次進(jìn)行合并,即按照第I個文檔、第2個文檔……第η個文檔的順序合并,當(dāng)用戶需要瀏覽第I個文檔的第一頁在第2個文檔上
的對應(yīng)內(nèi)容時,可能需要將瀏覽頁面跳至較遠(yuǎn)的位置,甚至用戶可能無法知曉確切位置,只能慢慢查找,這無疑是一項(xiàng)較為繁瑣的工作,會影響用戶的閱讀體驗(yàn)。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例所要解決的技術(shù)問題在于,提供一種文檔合并方法和系統(tǒng)??墒褂脩粼谝粋€合成的文檔中方便地對照瀏覽相似內(nèi)容的不同版本。為了解決上述技術(shù)問題,本發(fā)明實(shí)施例提供了一種文檔合并方法,包括
根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元;
根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中;
根據(jù)所述存儲空間中的讀取單元生成合成文檔。其中,所述單元劃分規(guī)則包括每個原始文檔的一頁為一個讀取單元;
所述單元讀取規(guī)則包括按照頁碼順序讀取。其中,所述單元劃分規(guī)則包括每個原始文檔的偶數(shù)頁為一個讀取單元,奇數(shù)頁為另一個讀取單元。其中,所述單元劃分規(guī)則包括不同原始文檔的讀取單元的大小是根據(jù)所述原始文檔的語言類型確定的。其中,所述單元劃分規(guī)則包括每個原始文檔包含的讀取單元的數(shù)目相同。相應(yīng)地,本發(fā)明還提供一種文檔合并系統(tǒng),包括
讀取單元劃分模塊,用于根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元;
讀取單元排列模塊,用于根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中;
合成文檔生成模塊,用于根據(jù)所述存儲空間中的讀取單元生成合成文檔。
其中,所述單元劃分規(guī)則包括每個原始文檔的一頁為一個讀取單元;
所述單元讀取規(guī)則包括按照頁碼順序讀取。其中,所述單元劃分規(guī)則包括每個原始文檔的偶數(shù)頁為一個讀取單元,奇數(shù)頁為另一個讀取單元。其中,所述單元劃分規(guī)則包括不同原始文檔的讀取單元的大小是根據(jù)所述原始文檔的語言類型確定的。其中,所述單元劃分規(guī)則包括每個原始文檔包含的讀取單元的數(shù)目相同。實(shí)施本發(fā)明實(shí)施例,具有如下有益效果通過將每個原始文檔劃分為至少一個讀取單元,按照一定的規(guī)則將不同原始文檔中對應(yīng)的讀取單元排列在一起,然后生成合并后的文檔,可以方便用戶在一個文檔中對照瀏覽相似內(nèi)容的不同版本,解決了現(xiàn)有技術(shù)的文檔處理軟件在合并文檔時,只能按照整體順序依次進(jìn)行合并導(dǎo)致的瀏覽繁瑣問題,提升了
用戶體驗(yàn)。
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I是本發(fā)明提供的文檔合并方法的第一實(shí)施例流程 圖2是本發(fā)明提供的文檔合并方法的第二實(shí)施例流程 圖3是本發(fā)明提供的文檔合并系統(tǒng)的第一實(shí)施例結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。請參見圖1,是本發(fā)明提供的文檔合并方法的第一實(shí)施例流程圖,該方法包括 在步驟S100,根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單
元。單元劃分規(guī)則可以是系統(tǒng)默認(rèn)的或由用戶預(yù)先根據(jù)自己的需求進(jìn)行設(shè)置的任意合適規(guī)貝U。例如,單元劃分規(guī)則可以是每個原始文檔的一頁為一個讀取單元。又例如,單元劃分規(guī)則可以是每個原始文檔的偶數(shù)頁為一個讀取單元,奇數(shù)頁為另一個讀取單元。在步驟S101,根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中。單元讀取規(guī)則同樣可以是系統(tǒng)默認(rèn)的或由用戶預(yù)先根據(jù)自己的需求進(jìn)行設(shè)置的任意合適規(guī)則。例如,單元讀取規(guī)則可以是按照頁碼順序讀取。又例如,單元讀取規(guī)則還可以是先讀取奇數(shù)頁碼,再讀取偶數(shù)頁碼。在步驟S102,根據(jù)所述存儲空間中的讀取單元生成合成文檔。需要說明的是,本發(fā)明實(shí)施例提供的文檔合并方法中的文檔是只是針對PDF文檔而言的,那么在進(jìn)行PDF文檔合并時,要從PDF文檔和其他文檔的屬性來說,PDF文檔有“頁”的概念,而其他文檔是沒有“頁”的概念的,這里的“頁”和我們在Word里的看到的頁是有區(qū)別的。首先,PDF文檔中的頁和頁上的內(nèi)容是獨(dú)立的,而word等其他文檔中的頁和內(nèi)容是互相依賴的,PDF文檔刪除掉頁上的內(nèi)容,頁面依然存在。而Word刪除掉了頁上的內(nèi)容,頁也就被刪除掉了,所以Word里沒有刪除頁面這個功能。其次,在進(jìn)行PDF文檔合并時,需要提取每個文檔中每一頁的信息結(jié)構(gòu)然后重新寫到合并后文檔的數(shù)據(jù)結(jié)構(gòu)中,而其他文檔的合并只是內(nèi)容上的一個追加而已。本發(fā)明實(shí)施例提供的文檔合并方法,通過將每個原始文檔劃分為至少一個讀取單元,按照一定的規(guī)則將不同原始文檔中對應(yīng)的讀取單元排列在一起,然后生成合并后的文檔,可以方便用戶在一個文檔中對照瀏覽相似內(nèi)容的不同版本,提升了用戶體驗(yàn)。請參見圖2,是本發(fā)明提供的文檔合并方法的第二實(shí)施例流程 圖。在該實(shí)施例中,假設(shè)有η個原始文檔,每個原始文檔都有m頁。下面將以每個讀取單元為原始頁碼的一頁為例進(jìn)行說明。該方法包括
在步驟S200,將每個原始文檔的每一頁作為一個提取單元。在步驟S201,初始化x0的值,令χ0=1。在步驟S202,判斷x0的值是否大于m。若步驟S202的判斷結(jié)果為否,則執(zhí)行步驟S203。在步驟S203,按照原始文檔f原始文檔η的順序依次提取每個原始文檔的第χ0頁,作為合成文檔的第η* (χ0-1)+1頁至第η*χ0頁,放入預(yù)置的存儲空間中。在步驟S204,將χ0的值增加I。然后返回執(zhí)行步驟S202。若步驟S202的判斷結(jié)果為是,則執(zhí)行步驟S205。在步驟S205,根據(jù)存儲空間中的讀取單元生成合成文檔。圖2僅僅是本發(fā)明的一個實(shí)施例,當(dāng)每個原始文檔的頁碼相同,且需要每頁對照時較常使用,因?yàn)樗鼘?shí)現(xiàn)簡單,處理速度較快,有利于提高效率。但是當(dāng)原始文檔的頁碼不同,每頁的內(nèi)容并不完全對應(yīng)時,這種方法可能存在影響閱讀效果。例如,若原始文檔是同一文件的不同語言版本,由于相同內(nèi)容以不同語言表示時長度可能不一樣,例如同樣的內(nèi)容用中文表示需要2頁,用英文表示可能需要3頁,用日文表示可能需要4頁,若仍然以I頁為讀取單元,很可能造成內(nèi)容上的不對應(yīng)。這時,可以采取其他單元劃分方法,例如,使每個原始文檔包含的讀取單元的數(shù)目相同。又例如,可以根據(jù)原始文檔的語言類型來確定該原始文檔中選取的讀取單元的大小,將中文的讀取單元設(shè)為2頁,英文的讀取單元設(shè)為3頁,日文的讀取單元設(shè)為4頁等。請參見圖3,是本發(fā)明提供的文檔合并系統(tǒng)的第一實(shí)施例結(jié)構(gòu)示意圖,該系統(tǒng)包括
讀取單元劃分模塊310,用于根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元。單元劃分規(guī)則可以是系統(tǒng)默認(rèn)的或由用戶預(yù)先根據(jù)自己的需求進(jìn)行設(shè)置的任意合適規(guī)則。例如,單元劃分規(guī)則可以是每個原始文檔的一頁為一個讀取單元。又例如,單元劃分規(guī)則可以是每個原始文檔的偶數(shù)頁為一個讀取單元,奇數(shù)頁為另一個讀取單
J Li ο讀取單元排列模塊320,用于根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中。單元讀取規(guī)則同樣可以是系統(tǒng)默認(rèn)的或由用戶預(yù)先根據(jù)自己的需求進(jìn)行設(shè)置的任意合適規(guī)則。例如,單元讀取規(guī)則可以是按照頁碼順序讀取。又例如,單元讀取規(guī)則還可以是先讀取奇數(shù)頁碼,再讀取偶數(shù)頁碼。合成文檔生成模塊330,用于根據(jù)所述存儲空間中的讀取單元生成合成文檔。本發(fā)明實(shí)施例提供的文檔合并系統(tǒng),通過將每個原始文檔劃分為至少一個讀取單元,按照一定的規(guī)則將不同原始文檔中對應(yīng)的讀取單元排列在一起,然后生成合并后的文檔,可以方便用戶在一個文檔中對照瀏覽相似內(nèi)容的不同版本,提升了用戶體驗(yàn)。以讀取單元劃分模塊310取原始文檔的一頁為讀取單元來舉例說明,假設(shè)有η個原始文檔,每個原始文檔有m頁。讀取單元排列模塊320可以按照原始文檔f原始文檔η的順序依次提取每個原始文檔的第I頁,作為合成文檔的第I至η頁,放入預(yù)置的存儲空間;然后按照原始文檔廣原始文檔η的順序依次提取每個原始文檔的第2頁,作為合成文檔的第η+1至2η頁,放入該存儲空間;以此類推,按照原始文檔廣原始文檔η的順序依次提取每個原始文檔的第m頁,作為合成文檔的第n (m-l)+l至nm頁,放入該存儲空間。最
后,合成文檔生成模塊330根據(jù)該存儲空間中存儲的讀取單元合并生成合成文檔。當(dāng)然,這僅僅是本發(fā)明的一個實(shí)施例,當(dāng)每個原始文檔的頁碼相同,且需要每頁對照時較常使用,因?yàn)樗鼘?shí)現(xiàn)簡單,處理速度較快,有利于提高效率。但是當(dāng)原始文檔的頁碼不同,每頁的內(nèi)容并不完全對應(yīng)時,這種方法可能存在影響閱讀效果。例如,若原始文檔是同一文件的不同語言版本,由于相同內(nèi)容以不同語言表示時長度可能不一樣,例如同樣的內(nèi)容用中文表示需要2頁,用英文表示可能需要3頁,用日文表示可能需要4頁,若仍然以I頁為讀取單元,很可能造成內(nèi)容上的不對應(yīng)。這時,可以采取其他單元劃分方法,例如,使每個原始文檔包含的讀取單元的數(shù)目相同。又例如,可以根據(jù)原始文檔的語言類型來確定該原始文檔中選取的讀取單元的大小,將中文的讀取單元設(shè)為2頁,英文的讀取單元設(shè)為3頁,日文的讀取單元設(shè)為4頁等。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機(jī)可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory, ROM)或隨機(jī)存儲記憶體(Random AccessMemory, RAM)等。以上所揭露的僅為本發(fā)明一種較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分流程,并依本發(fā)明權(quán)利要求所作的等同變化,仍屬于發(fā)明所涵蓋的范圍。
權(quán)利要求
1.一種文檔合并方法,其特征在于,包括 根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元; 根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中; 根據(jù)所述存儲空間中的讀取單元生成合成文檔。
2.根據(jù)權(quán)利要求I所述的文檔合并方法,其特征在于,所述單元劃分規(guī)則包括每個原始文檔的一頁為一個讀取單元; 所述單元讀取規(guī)則包括按照頁碼順序讀取。
3.根據(jù)權(quán)利要求I所述的文檔合并方法,其特征在于,所述單元劃分規(guī)則包括每個原始文檔的偶數(shù)頁為一個讀取單元,奇數(shù)頁為另一個讀取單元。
4.根據(jù)權(quán)利要求I所述的文檔合并方法,其特征在于,所述單元劃分規(guī)則包括不同原始文檔的讀取單元的大小是根據(jù)所述原始文檔的語言類型確定的。
5.根據(jù)權(quán)利要求I所述的文檔合并方法,其特征在于,所述單元劃分規(guī)則包括每個原始文檔包含的讀取單元的數(shù)目相同。
6.一種文檔合并系統(tǒng),其特征在于,包括 讀取單元劃分模塊,用于根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元; 讀取單元排列模塊,用于根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中; 合成文檔生成模塊,用于根據(jù)所述存儲空間中的讀取單元生成合成文檔。
7.根據(jù)權(quán)利要求6所述的文檔合并系統(tǒng),其特征在于,所述單元劃分規(guī)則包括每個原始文檔的一頁為一個讀取單元; 所述單元讀取規(guī)則包括按照頁碼順序讀取。
8.根據(jù)權(quán)利要求6所述的文檔合并系統(tǒng),其特征在于,所述單元劃分規(guī)則包括每個原始文檔的偶數(shù)頁為一個讀取單元,奇數(shù)頁為另一個讀取單元。
9.根據(jù)權(quán)利要求6所述的文檔合并系統(tǒng),其特征在于,所述單元劃分規(guī)則包括不同原始文檔的讀取單元的大小是根據(jù)所述原始文檔的語言類型確定的。
10.根據(jù)權(quán)利要求6所述的文檔合并系統(tǒng),其特征在于,所述單元劃分規(guī)則包括每個原始文檔包含的讀取單元的數(shù)目相同。
全文摘要
本發(fā)明實(shí)施例公開了一種文檔合并方法,包括根據(jù)預(yù)設(shè)的單元劃分規(guī)則將每個原始文檔分別劃分為至少一個讀取單元;根據(jù)預(yù)設(shè)的單元讀取規(guī)則依次從每個原始文檔中提取對應(yīng)的讀取單元放入預(yù)置的存儲空間中;根據(jù)所述存儲空間中的讀取單元生成合成文檔。本發(fā)明實(shí)施例還公開了一種文檔合并系統(tǒng)。采用本發(fā)明,可以方便用戶在一個文檔中對照瀏覽相似內(nèi)容的不同版本,提升了用戶體驗(yàn)。
文檔編號G06F17/21GK102880653SQ20121030919
公開日2013年1月16日 申請日期2012年8月28日 優(yōu)先權(quán)日2012年8月28日
發(fā)明者原野 申請人:深圳市萬興軟件有限公司