国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種文檔并行處理方法及系統(tǒng)的制作方法

      文檔序號(hào):6585048閱讀:244來(lái)源:國(guó)知局
      專利名稱:一種文檔并行處理方法及系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于文檔處理技術(shù)領(lǐng)域,具體涉及一種文檔并行處理方法及系統(tǒng)。
      背景技術(shù)
      在日常生活和工作中,文檔占有著重要的地位,尤其是在報(bào)業(yè)與出版業(yè)。目前,文 檔的處理技術(shù)主要有文本處理、樣式處理、格式處理和痕跡比對(duì)。文本處理,顧名思義主要是處理文檔中的文字信息,即文檔的內(nèi)容。雖然文字是文 檔的主體,但是單單的文本處理已經(jīng)無(wú)法滿足現(xiàn)在社會(huì)對(duì)文檔處理的要求。樣式處理主要 指文本是以何種形式呈現(xiàn),如加粗、傾斜、下劃線等等。格式處理主要指文本是怎么組織的, 如對(duì)文本內(nèi)容進(jìn)行標(biāo)號(hào)等。痕跡比對(duì)是對(duì)文檔被處理的軌跡進(jìn)行跟蹤,顯示出每個(gè)人對(duì)文 檔的修改,是綜合運(yùn)行文本處理、樣式處理和格式處理的處理方式。雖然上述文檔處理技術(shù)已經(jīng)比較成熟,但是隨著社會(huì)分工的細(xì)化,在文檔處理的 專業(yè)領(lǐng)域,上述文檔處理技術(shù)已經(jīng)不能滿足人們的需要。人們追求對(duì)現(xiàn)有生產(chǎn)力的最大化 利用,即并行處理,現(xiàn)有的文檔處理技術(shù)還無(wú)法達(dá)到這個(gè)要求。例如,責(zé)任編輯接到一篇投 稿,需要經(jīng)過(guò)A、B和C三位編輯處理后再由責(zé)任編輯對(duì)A、B和C三位編輯的修改進(jìn)行確認(rèn)。 按照目前的文檔處理技術(shù),責(zé)任編輯需要將稿件先傳送給編輯A,編輯A處理完后將稿件傳 送給編輯B ;編輯B處理完成后將稿件再傳送給編輯C ;編輯C處理完成后最終將稿件傳到 責(zé)任編輯手中。責(zé)任編輯打開(kāi)文檔處理器,文檔處理器顯示出每位編輯所作的修改,責(zé)任編 輯對(duì)三位編輯的修改進(jìn)行確認(rèn)。由此可見(jiàn)目前的文檔處理是一個(gè)串行的過(guò)程,效率較低, 效率較低的瓶頸不在人,而在于目前的文檔處理技術(shù)沒(méi)有支持對(duì)文檔的并行處理。微軟公司的字處理軟件Word提供了一種通過(guò)對(duì)文檔的比較來(lái)確定文檔修改痕跡 的方法,但存在如下缺陷l.Word只能同時(shí)比較兩個(gè)文檔,不能實(shí)現(xiàn)對(duì)多個(gè)文檔同時(shí)進(jìn)行比較;2. Word不僅對(duì)文檔的純文本進(jìn)行比較,而且還比較樣式,因此比較結(jié)果不精確;3. Word記錄對(duì)文檔的所有修改操作,比較繁瑣。例如,對(duì)文檔中一段文字先進(jìn)行了 修改,然后又改回了原來(lái)的文字,從整體上來(lái)說(shuō),等于沒(méi)有修改,但Word卻記錄了兩次修改 操作。

      發(fā)明內(nèi)容
      針對(duì)現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的是提供一種文檔并行處理方法及系 統(tǒng)。該方法及系統(tǒng)能夠同時(shí)比較多個(gè)文檔,并在一個(gè)文檔中展現(xiàn)出所有對(duì)同一文檔進(jìn)行修 改的修改痕跡。為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下一種文檔并行處理方法,包括以下步驟(1)對(duì)原始文檔進(jìn)行并行修改,生成若干個(gè)修改文檔;(2)將所有修改文檔和原始文檔進(jìn)行合并,生成合并文檔,所述合并文檔中包含所有修改文檔的所有修改痕跡以及修改痕跡所屬修改文檔標(biāo)記;(3)呈現(xiàn)包含所有修改痕跡的合并文檔內(nèi)容。一種文檔并行處理系統(tǒng),包括若干用于對(duì)原始文檔進(jìn)行修改,并生成修改文檔的 文檔修改模塊;與若干個(gè)文檔修改模塊連接,將所有修改文檔和原始文檔進(jìn)行合并,生成合并文 檔的文檔修改痕跡處理模塊,所述合并文檔中包含所有修改文檔的所有修改痕跡以及修改 痕跡所屬修改文檔標(biāo)記;以及與文檔修改痕跡處理模塊連接,用于呈現(xiàn)合并文檔內(nèi)容的文檔修改痕跡呈現(xiàn) 模塊。本發(fā)明所述方法及系統(tǒng),通過(guò)對(duì)所有修改文檔與原始文檔的比較,實(shí)現(xiàn)了所有修 改文檔的修改痕跡在一個(gè)文檔中顯示,并能夠區(qū)分出不同的修改文檔對(duì)原始文檔所作的修 改。而且,能夠并行處理多個(gè)文檔,并通過(guò)對(duì)文檔進(jìn)行預(yù)處理,在文檔比較之前去除了文檔 格式與樣式的方式,提高了文檔比較的效率和準(zhǔn)確性。


      圖1是本發(fā)明所述文檔并行處理系統(tǒng)的優(yōu)選實(shí)施方式的結(jié)構(gòu)方框圖;圖2是具體實(shí)施方式
      中圖1所示文檔修改痕跡處理模塊的結(jié)構(gòu)方框圖;圖3是具體實(shí)施方式
      中采用圖1所示系統(tǒng)并行處理文檔的方法流程圖;圖4是具體實(shí)施方式
      中圖3所示方法將所有文檔進(jìn)行合并,生成合并文檔的流程 圖;圖5是實(shí)施例中展現(xiàn)所有修改痕跡的效果圖。
      具體實(shí)施例方式本發(fā)明的核心思想是并行對(duì)同一原始文檔進(jìn)行修改,生成多個(gè)修改文檔;然后 通過(guò)比較所有修改文檔和原始文檔,將所有文檔進(jìn)行合并,生成合并文檔,該合并文檔中包 含所有修改文檔的所有修改痕跡以及修改痕跡所屬修改文檔標(biāo)記;最后呈現(xiàn)包含所有修改 痕跡和修改痕跡所屬修改文檔標(biāo)記的合并文檔內(nèi)容,并對(duì)所有修改痕跡進(jìn)行確認(rèn),接受或 拒絕對(duì)原始文檔所作的修改。所述修改痕跡是指對(duì)文檔內(nèi)容修改的標(biāo)記,如標(biāo)記出文檔增 加的內(nèi)容或文檔刪除的內(nèi)容等。下面結(jié)合具體實(shí)施方式
      和附圖,對(duì)本發(fā)明進(jìn)行詳細(xì)描述。圖1是本發(fā)明所述文檔并行處理系統(tǒng)的優(yōu)選實(shí)施方式的結(jié)構(gòu)方框圖。該系統(tǒng)包括 若干個(gè)文檔修改模塊1、與若干個(gè)文檔修改模塊1連接的文檔修改痕跡處理模塊2、與文檔 修改痕跡處理模塊2連接的文檔修改痕跡呈現(xiàn)模塊3、以及與文檔修改痕跡呈現(xiàn)模塊3連接 的文檔修改痕跡確認(rèn)模塊4。文檔修改模塊1用于對(duì)原始文檔進(jìn)行修改,生成修改文檔。若干個(gè)文檔修改模塊 1可以并行對(duì)同一個(gè)原始文檔進(jìn)行修改,生成若干個(gè)修改文檔,提交給文檔修改痕跡處理模 塊2。文檔修改模塊1的數(shù)量由對(duì)原始文檔進(jìn)行修改的用戶數(shù)量以及文檔修改痕跡處理模 塊2能夠并行處理的文檔數(shù)量確定。文檔修改痕跡處理模塊2用于將所有修改文檔和原始文檔進(jìn)行合并,生成合并文檔,提交給文檔修改痕跡呈現(xiàn)模塊3。所述合并文檔中包含所有修改文檔的所有修改痕跡以 及修改痕跡所屬修改文檔標(biāo)記。文檔修改痕跡呈現(xiàn)模塊3用于呈現(xiàn)包含所有修改痕跡和修改痕跡所屬修改文檔 標(biāo)記的合并文檔內(nèi)容。文檔修改痕跡確認(rèn)模塊4用于對(duì)文檔修改痕跡呈現(xiàn)模塊3呈現(xiàn)的修改痕跡進(jìn)行確 認(rèn)。圖2是圖1中文檔修改痕跡處理模塊2的具體結(jié)構(gòu)方框圖。該模塊2包括文檔預(yù) 處理子模塊21、與文檔預(yù)處理子模塊21連接的文檔合并子模塊22、以及與文檔合并子模塊 22連接的文檔合并結(jié)果生成子模塊23。文檔預(yù)處理子模塊21用于將原始文檔與對(duì)原始文檔經(jīng)過(guò)不同修改后的若干個(gè)修 改文檔進(jìn)行預(yù)處理,生成去掉樣式與格式的純文本。文檔合并子模塊22用于對(duì)所有文檔進(jìn) 行建模,并通過(guò)比較建模后的修改文檔純文本與原始文檔純文本將所有文檔進(jìn)行合并,合 并后的文檔包含所有修改文檔的所有修改痕跡以及修改痕跡所屬修改文檔標(biāo)記。文檔合并 結(jié)果生成子模塊23用于對(duì)合并文檔內(nèi)容進(jìn)行再處理,生成可顯示的文檔內(nèi)容數(shù)據(jù)。圖3是采用圖1所示系統(tǒng)并行處理文檔的方法流程圖。該方法包括以下步驟(1)若干個(gè)文檔修改模塊1對(duì)原始文檔進(jìn)行并行修改,生成若干個(gè)修改文檔,分別 為文檔1、文檔2……文檔n,提交給文檔修改痕跡處理模塊2 ;(2)文檔修改痕跡處理模塊2將所有文檔進(jìn)行合并,生成合并文檔,提交給文檔修 改痕跡呈現(xiàn)模塊3,合并文檔中包含所有修改文檔的所有修改痕跡和修改痕跡所屬修改文 檔標(biāo)記;(3)文檔修改痕跡呈現(xiàn)模塊3呈現(xiàn)包含所有修改痕跡和修改痕跡所屬修改文檔標(biāo) 記的合并文檔內(nèi)容;(4)文檔修改痕跡確認(rèn)模塊4對(duì)文檔修改痕跡呈現(xiàn)模塊3呈現(xiàn)的所有修改痕跡進(jìn) 行確認(rèn),接受或拒絕對(duì)原始文檔所作的修改。步驟O)中,將所有文檔進(jìn)行合并,生成合并文檔的具體過(guò)程如圖4所示,包括以 下步驟①文檔預(yù)處理子模塊21將原始文檔和若干個(gè)修改文檔進(jìn)行預(yù)處理,生成去掉樣 式與格式的純文本,提交給文檔合并子模塊22。由于各個(gè)修改文檔的樣式與格式可能不同,所以各個(gè)修改文檔呈現(xiàn)的效果也會(huì)不 同。但是,文檔的不同呈現(xiàn)效果與文檔內(nèi)容是如何被修改的沒(méi)有關(guān)系,檢測(cè)對(duì)文檔格式與樣 式的修改痕跡不僅繁瑣而且沒(méi)有意義,還容易出現(xiàn)錯(cuò)誤,因此對(duì)文檔進(jìn)行預(yù)處理,去掉文檔 的格式與樣式信息,這樣可以提高文檔比較的準(zhǔn)確性與效率。②文檔合并子模塊22先對(duì)所有文檔的純文本進(jìn)行建模,即將每個(gè)文檔的純文本 包含的字符切分成一個(gè)一個(gè)的獨(dú)立單元,每個(gè)獨(dú)立單元的數(shù)據(jù)結(jié)構(gòu)為其包含的具體字符和 該字符的操作類型,如下所示enum oprType{unhandled = 0,same = 1,
      6
      add = 2,del = 3,};typedef struct{wchar_t character ;oprType type ;} oneChar ;其中,“wchar_t”表示獨(dú)立單元包含的具體字符,“oprType”表示該字符的操作類
      型。“enum oprType”中定義了所有的操作類型,包括未處理“unhandled”、相同“same”、增 加“add”和刪除“del”。經(jīng)過(guò)上述處理后,所有文檔的純文本便由若干個(gè)(由每個(gè)文檔純文本包含的字符 數(shù)決定)如上所述數(shù)據(jù)結(jié)構(gòu)的獨(dú)立單元集合組成,獨(dú)立單元的排列順序與文檔中字符的排 列順序相同。③文檔合并子模塊22將所有建模后的文檔合并成一個(gè)包含所有修改痕跡和修改 痕跡所屬修改文檔標(biāo)記的文檔(以下簡(jiǎn)稱合并文檔)。在合并過(guò)程中確定每個(gè)字符的操作 類型及所屬文檔標(biāo)記。文檔合并子模塊22比較建模后的修改文檔純文本與原始文檔純文本,將所有 文檔中均包含的字符(即未經(jīng)過(guò)修改的字符)的操作類型置為“same”,將增加的字符 的操作類型置為“add”,將刪除的字符的操作類型置為“del”。在未進(jìn)行比較之前,所有 修改文檔中字符的操作類型均為“unhandled”,即步驟②中建模后字符的操作類型均為 "unhandled,,。④對(duì)標(biāo)記了每個(gè)字符的操作類型和修改痕跡所屬修改文檔標(biāo)記后的合并文檔進(jìn) 行處理,生成描述合并文檔內(nèi)容的數(shù)據(jù),其數(shù)據(jù)結(jié)構(gòu)如下typedef struct{wstring str ;oprType type ;int version ;}fragment ;該數(shù)據(jù)結(jié)構(gòu)是對(duì)上述一個(gè)獨(dú)立單元的數(shù)據(jù)結(jié)構(gòu)的擴(kuò)展,即對(duì)位置連續(xù)并具有相同 操作類型的字符進(jìn)行合并,合并為一個(gè)字符串,該字符串具有共同的操作類型。例如,假設(shè) 如下內(nèi)容“根據(jù)國(guó)務(wù)院辦公室……”中的“根據(jù)國(guó)務(wù)院”部分是所有文檔中共同擁有的,具 有共同的操作類型“same”,因此將“根”、“據(jù)”、“國(guó)”、“務(wù)”、“院”五個(gè)獨(dú)立單元中的字符合并 成一個(gè)字符串“根據(jù)國(guó)務(wù)院”,形成一個(gè)新的獨(dú)立單元,其操作類型為“same”?!稗k公室”為 一個(gè)修改文檔中增加的內(nèi)容,所以其操作類型為“add”,將“辦”、“公”、“室”三個(gè)獨(dú)立單元中 的字符合并成一個(gè)字符串“辦公室”,形成一個(gè)新的獨(dú)立單元,類型為“add”?!皏ersion”表 示字符串所屬文檔的標(biāo)記。⑤文檔合并結(jié)果生成子模塊23對(duì)上一步生成的不便于直接顯示的合并文檔內(nèi)容數(shù)據(jù)作進(jìn)一步處理,生成直觀的、可用于直接顯示的文檔數(shù)據(jù)??梢圆捎肏TML以不同的方 式來(lái)標(biāo)記字符的顯示效果,例如,用黑色(字符顏色)表示所有文檔中相同的字符(即未經(jīng) 過(guò)修改的原始文檔中的字符),字符顏色加下劃線表示操作類型是“add”的字符,字符顏色 加刪除線表示操作類型是“del”的文本,并用不同的顏色標(biāo)識(shí)不同的修改文檔的修改痕跡。下面以修改如下內(nèi)容的原始文檔為例,對(duì)上述方法進(jìn)行舉例說(shuō)明?!案鶕?jù)國(guó)務(wù)院統(tǒng)一部署,今年第四季度,在保障企業(yè)退休人員、城鄉(xiāng)低保對(duì)象等低 收入群眾基本生活的同時(shí),國(guó)家有關(guān)部門(mén)將進(jìn)一步完善有關(guān)政策措施,加大資助困難學(xué)生、 優(yōu)撫救濟(jì)、住房保障等方面的工作力度”本實(shí)施例中,原始文檔由用戶“小李”編輯。由用戶“小李”編輯的原始文檔需要由 “小張”、“小明”和“小王”審查,三個(gè)用戶可以通過(guò)文檔修改模塊1對(duì)原始文檔進(jìn)行修改,即 文檔修改模塊1為三個(gè)。最后由“小趙”對(duì)所有文檔的修改痕跡進(jìn)行確認(rèn)。如果采用現(xiàn)有的方式,只能先將原始文檔發(fā)送給“小張”,“小張”處理完后再發(fā)送 給“小明”,“小明”處理完后再發(fā)送給“小王”,“小王”處理完后再發(fā)送給“小趙”確認(rèn)。這種 串行的方式顯然效率較低。采用本發(fā)明所述方法,可以將原始文檔,同時(shí)發(fā)送給“小張”、“小明”和“小王”進(jìn) 行處理,處理完成后將三個(gè)處理后的修改文檔提交給文檔修改痕跡處理模塊2。其中,“小張”對(duì)原始文檔修改如下,記為修改文檔1 :“根據(jù)國(guó)務(wù)院辦公室統(tǒng)一部署,今年第四季度,在保障企業(yè)退休人員、城鄉(xiāng)低保對(duì) 象等低收入群眾基本生活的同時(shí),國(guó)家有關(guān)部門(mén)將進(jìn)一步完善有關(guān)政策措施,加大資助困 難學(xué)生、優(yōu)撫救濟(jì)、住房保障等方面的工作”。“小明”對(duì)原始文檔修改如下,記為修改文檔2 “根據(jù)國(guó)務(wù)院統(tǒng)一部署,今年第四季度,在全力保障企業(yè)退休人員、城鄉(xiāng)低保對(duì)象 等低收入群眾基本生活的同時(shí),國(guó)家有關(guān)部門(mén)將進(jìn)一步完善有關(guān)政策措施,加大資助困難 學(xué)生、優(yōu)撫救濟(jì)、住房保障等方面的工作。落實(shí)好家庭家庭經(jīng)濟(jì)困難學(xué)生資助政策體系,確保家庭經(jīng)濟(jì)困難學(xué)生都能上得起 大學(xué)、接受職業(yè)教育,今年中央財(cái)政共安排助學(xué)經(jīng)費(fèi)223億元?!薄!靶⊥酢睂?duì)原始文檔修改如下,記為修改文檔3 “根據(jù)國(guó)務(wù)院統(tǒng)一部署,今年第四季度,在全力保障企業(yè)退休人員、城鄉(xiāng)低保對(duì)象 等低收入群眾基本生活的同時(shí),中央政府有關(guān)部門(mén)將進(jìn)一步完善有關(guān)政策措施,加大資助 困難學(xué)生、優(yōu)撫救濟(jì)、住房保障等方面的工作”。文檔修改痕跡處理模塊2接收到原始文檔和修改文檔1、修改文檔2、修改文檔3 后,先由文檔預(yù)處理子模塊21將原始文檔和修改文檔1、修改文檔2、修改文檔3的樣式和 格式去除,生成純文本,提交給文檔合并子模塊22。文檔合并子模塊22先對(duì)四個(gè)文檔的純 文本進(jìn)行建模,將每個(gè)文檔純文本中的字符切分成一個(gè)一個(gè)的獨(dú)立單元,每個(gè)獨(dú)立單元包 含具體字符和該字符的操作類型。本實(shí)施例中,對(duì)原始文檔的純文本建模后其表現(xiàn)形式為 “{ ‘根,,unhandled} { ‘據(jù)’,unhandled} { ‘國(guó)’,unhandled} { ‘務(wù)’,unhandled} { ‘院,, unhandled}……”。其中,括號(hào)內(nèi)前面為具體字符,后面為操作類型,在比較之前所有字符的 操作類型均為“unhandled”。完成對(duì)所有文檔純文本建模后,通過(guò)比較修改文檔1純文本(以下簡(jiǎn)稱修改文檔1)、修改文檔2純文本(以下簡(jiǎn)稱修改文檔幻和修改文檔3純文本(以下簡(jiǎn)稱修改文檔3) 與原始文檔純文本(以下簡(jiǎn)稱原始文檔),將所有文檔進(jìn)行合并,生成合并文檔,合并文檔 中包含所有修改文檔的所有修改痕跡以及修改痕跡所屬文檔標(biāo)記,如果是原始文檔內(nèi)容, 則標(biāo)記為原始文檔。然后將位置連續(xù)且操作類型相同的字符合并成一個(gè)字符串。下面以修改文檔1為例說(shuō)明修改后的文檔與原始文檔的比較過(guò)程。修改文檔1與 原始文檔有兩處不同一是在“根據(jù)國(guó)務(wù)院”后添加了“辦公室” ;二是刪除了原始文檔中的 “力度”。首先按照尋找兩個(gè)字符串最大相同子串的算法(該算法為現(xiàn)有技術(shù)中的算法), 得到最大子串為“統(tǒng)一部署,今年第四季度,在保障企業(yè)退休人員、城鄉(xiāng)低保對(duì)象等低收入 群眾基本生活的同時(shí),國(guó)家有關(guān)部門(mén)將進(jìn)一步完善有關(guān)政策措施,加大資助困難學(xué)生、優(yōu)撫 救濟(jì)、住房保障等方面的工作”。這樣原始文檔和修改文檔1依據(jù)最大的相同部分可以分別 被分成三部分相同的部分,相同部分以前的部分,相同部分以后的部分。然后處理相同部分以前的部分。原始文檔為“根據(jù)國(guó)務(wù)院”,修改文檔1為“根據(jù) 國(guó)務(wù)院辦公室”,兩者最大的相同部分為“根據(jù)國(guó)務(wù)院”,“辦公室”在原始文檔中不存在,在 修改文檔1中存在。于是得到如下結(jié)果{ ‘跟,,same,0}{ ‘據(jù),,same,0}{ ‘國(guó),,same,0}{ ‘務(wù),,same,0}{ ‘院,,same,0} { ‘辦,,add,0}{ ‘公,,add,0}{ ‘室,,add,0}。再處理相同部分后面的文本,其處理過(guò)程與處理相同部分以前部分的處理方式相 同,遞歸進(jìn)行上述過(guò)程,完成對(duì)整個(gè)文檔的處理。按照上述方法再分別將修改文檔2和3與原始文檔進(jìn)行比較,得到處理結(jié)果。最 后將原始文檔和修改文檔1、2和3進(jìn)行合并,按照字符類型為same的字符為參考點(diǎn),將類 型為add的字符平行排列,將類型為del的相同部分進(jìn)行合并。再將類型相同的連續(xù)字符 合并成字符串。本實(shí)施例中,處理后合并文檔內(nèi)容的數(shù)據(jù)結(jié)構(gòu)如下{ ‘根據(jù)國(guó)務(wù)院’,Same,0}{ ‘辦公室’,add,1} { ‘統(tǒng)一部署,今年第四季度,在’, same,0}{ ‘全力’,add,2}{ ‘保障企業(yè)退休人員、城鄉(xiāng)低保對(duì)象等低收入群眾基本生活的同 時(shí),,,憲,0}{ ‘國(guó)家’,del,3}{ ‘中央政府’,add,3} { ‘有關(guān)部門(mén)將進(jìn)一步完善有關(guān)政策 措施,加大資助困難學(xué)生、優(yōu)撫救濟(jì)、住房保障等方面的工作’,same,0} { ‘力度’,del,l、2、 3}{ ‘。,,add,2}{ ‘落實(shí)好家庭家庭經(jīng)濟(jì)困難學(xué)生資助政策體系,確保家庭經(jīng)濟(jì)困難學(xué)生都能上得 起大學(xué)、接受職業(yè)教育,今年中央財(cái)政共安排助學(xué)經(jīng)費(fèi)223億元?!?,add,2}。其中的數(shù)字表示修改文檔的編號(hào),0表示原始文檔,1表示修改文檔1,以此類推。文檔合并結(jié)果生成子模塊23對(duì)上述合并文檔內(nèi)容進(jìn)行再處理,生成可顯示的文 檔內(nèi)容數(shù)據(jù)。采用HTML以不同的方式來(lái)標(biāo)記字符的顯示效果,操作類型為“same”的字符 串用黑色顯示,操作類型為“add”的字符串用顏色加下劃線顯示,操作類型為“del”的字符 串用顏色加刪除線顯示,用不同的顏色標(biāo)識(shí)不同的修改版本。本實(shí)施例中,HTML格式如下〈pXspan color = “black”〉根據(jù)國(guó)務(wù)院〈/spanXspan color =“blue”Xu>辦公 室 </u></span><span color = “black”〉統(tǒng)一部署,今年第四季度,在〈/spanXspancolor = “darkorchid”>全力〈/spanXspan color = “black” >全力保障企業(yè)退休人員、城鄉(xiāng) 低保對(duì)象等低收入群眾基本生活的同時(shí),〈/spanXspan color = “blueviolet” >國(guó)家</spanXspan color = "blueviolet,,> 中央政府 </span><spancolor = "black,,> 有關(guān)部 門(mén)將進(jìn)一步完善有關(guān)政策措施,加大資助困難學(xué)生、優(yōu)撫救濟(jì)、住房保障等方面的工作</ spanXspan color = "red,,> 力度 </span><span color = "blueviolet,,>。</span></ pXpXspan color = “darkorchid”〉落實(shí)好家庭經(jīng)濟(jì)困難學(xué)生資助政策體系,確保家庭經(jīng) 濟(jì)困難學(xué)生都能上得起大學(xué)、接受職業(yè)教育,今年中央財(cái)政共安排助學(xué)經(jīng)費(fèi)223億元。</ spanX/p>。最后,由文檔修改痕跡呈現(xiàn)模塊3呈現(xiàn)包含所有修改痕跡的數(shù)據(jù),如圖5所示,文 檔修改痕跡確認(rèn)模塊4對(duì)所有修改痕跡進(jìn)行確認(rèn),接受或者拒絕修改痕跡,并且可以再次 對(duì)文檔進(jìn)行編輯。顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精 神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其同等技術(shù)的范圍 之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
      權(quán)利要求
      1.一種文檔并行處理方法,包括以下步驟(1)對(duì)原始文檔進(jìn)行并行修改,生成若干個(gè)修改文檔;(2)將所有修改文檔和原始文檔進(jìn)行合并,生成合并文檔;所述合并文檔中包含所有 修改文檔的所有修改痕跡以及修改痕跡所屬修改文檔標(biāo)記;(3)呈現(xiàn)合并文檔內(nèi)容。
      2.如權(quán)利要求1所述的文檔并行處理方法,其特征在于步驟(1)中所述修改文檔的 個(gè)數(shù)為2個(gè)或2個(gè)以上。
      3.如權(quán)利要求1或2所述的文檔并行處理方法,其特征在于步驟(2)中所述將所有 修改文檔和原始文檔進(jìn)行合并,生成合并文檔的具體過(guò)程包括以下步驟(a)對(duì)所有文檔進(jìn)行預(yù)處理,生成去掉樣式與格式的純文本;(b)對(duì)所有文檔純文本進(jìn)行建模,將每個(gè)文檔純文本包含的字符切分成一個(gè)一個(gè)的獨(dú) 立單元,每個(gè)獨(dú)立單元的數(shù)據(jù)結(jié)構(gòu)為其包含的具體字符和該字符的操作類型;(c)比較建模后的修改文檔純文本與原始文檔純文本,將所有文檔純文本合并成一個(gè) 包含所有修改文檔的所有修改痕跡以及修改痕跡所屬修改文檔標(biāo)記的合并文檔;(d)將合并文檔中位置連續(xù)且操作類型相同的字符合并成一個(gè)字符串,并確定該字符 串的操作類型及所屬文檔標(biāo)記;(e)確定合并文檔內(nèi)容數(shù)據(jù)中所有字符的顯示方式,生成可用于顯示的文檔內(nèi)容數(shù)據(jù)。
      4.如權(quán)利要求3所述的文檔并行處理方法,其特征在于所述操作類型包括“未處理”、 “相同”、“增加”和“刪除”;步驟(b)中每個(gè)文檔建模后,其包含的所有字符的操作類型均為 “未處理”。
      5.如權(quán)利要求4所述的文檔并行處理方法,其特征在于步驟(c)中所述比較建模后 的修改文檔純文本與原始文檔純文本的具體過(guò)程包括以下步驟(cl)找出修改文檔與原始文檔中最大的相同子串;(c2)將修改文檔劃分為最大相同子串前面部分、最大相同子串部分和最大相同子串后 面部分;(c3)對(duì)最大相同子串前面部分重復(fù)步驟(c 1)至步驟(c2),直到不存在最大的相同子 串,確定修改文檔對(duì)原始文檔所作的修改;(c4)對(duì)最大相同子串后面部分重復(fù)步驟(cl)至步驟(c2),直到不存在最大的相同子 串,確定修改文檔對(duì)原始文檔所作的修改。
      6.如權(quán)利要求5所述的文檔并行處理方法,其特征在于步驟(c)中,將修改文檔中與 原始文檔相同的字符的操作類型置為“相同”,增加的字符的操作類型置為“增加”,刪除的 字符的操作類型置為“刪除”。
      7.如權(quán)利要求4至6之一所述的文檔并行處理方法,其特征在于步驟(e)中,將操作 類型為“相同”的字符串用黑色顯示,操作類型為“增加”的字符串用一種顏色加下劃線顯 示,操作類型為“刪除”的字符串用一種顏色加刪除線顯示,并用不同的顏色表示屬于不同 修改文檔的修改痕跡。
      8.如權(quán)利要求3所述的文檔并行處理方法,其特征在于步驟(e)中,采用HTML對(duì)合 并文檔內(nèi)容數(shù)據(jù)中的所有字符的顯示方式進(jìn)行描述。
      9.如權(quán)利要求1所述的文檔并行處理方法,其特征在于所述方法在呈現(xiàn)合并文檔內(nèi)容后,還包括對(duì)所有修改痕跡進(jìn)行確認(rèn),接受或拒絕對(duì)原始文檔所作修改的步驟。
      10.一種文檔并行處理系統(tǒng),包括若干用于對(duì)原始文檔進(jìn)行修改,并生成修改文檔的文 檔修改模塊(1);與若干個(gè)文檔修改模塊(1)連接,將所有修改文檔和原始文檔進(jìn)行合并,生成合并文 檔的文檔修改痕跡處理模塊(2),所述合并文檔中包含所有修改文檔的所有修改痕跡以及 修改痕跡所屬修改文檔標(biāo)記;以及與文檔修改痕跡處理模塊(2)連接,用于呈現(xiàn)合并文檔內(nèi)容的文檔修改痕跡呈現(xiàn) 模塊⑶。
      11.如權(quán)利要求10所述的文檔并行處理系統(tǒng),其特征在于所述文檔修改痕跡處理模 塊(2)包括用于對(duì)原始文檔和所有修改文檔進(jìn)行預(yù)處理,生成去掉樣式與格式的純文本的 文檔預(yù)處理子模塊(21);與文檔預(yù)處理子模塊(21)連接,用于對(duì)所有文檔進(jìn)行建模,并通過(guò)比較建模后的修改 文檔純文本與原始文檔純文本將所有文檔進(jìn)行合并的文檔合并子模塊(22);以及與文檔合并子模塊(22)連接,用于對(duì)合并文檔內(nèi)容進(jìn)行再處理,生成可顯示的文 檔內(nèi)容數(shù)據(jù)的文檔合并結(jié)果生成子模塊(23)。
      12.如權(quán)利要求10或11所述的文檔并行處理系統(tǒng),其特征在于所述系統(tǒng)還包括與文 檔修改痕跡呈現(xiàn)模塊(3)連接,用于對(duì)所有修改痕跡進(jìn)行確認(rèn)的文檔痕跡確認(rèn)模塊(4)。
      全文摘要
      本發(fā)明公開(kāi)了一種文檔并行處理方法及系統(tǒng),屬于文檔處理技術(shù)領(lǐng)域?,F(xiàn)有文檔處理方法及系統(tǒng)不能同時(shí)對(duì)三個(gè)或三個(gè)以上的文檔進(jìn)行比較,而且精確性和效率較差。本發(fā)明所述方法及系統(tǒng),并行對(duì)同一原始文檔進(jìn)行修改,生成多個(gè)修改文檔;然后通過(guò)比較所有修改文檔和原始文檔,將所有文檔進(jìn)行合并,生成合并文檔,該合并文檔中包含所有修改文檔的所有修改痕跡以及修改痕跡所屬修改文檔標(biāo)記;最后呈現(xiàn)包含所有修改痕跡和修改痕跡所屬修改文檔標(biāo)記的合并文檔內(nèi)容,并對(duì)所有修改痕跡進(jìn)行確認(rèn),接受或拒絕對(duì)原始文檔所作的修改。本發(fā)明特別適用于需要多人對(duì)同一文檔進(jìn)行并行編輯的場(chǎng)合。
      文檔編號(hào)G06F17/24GK102096660SQ200910241908
      公開(kāi)日2011年6月15日 申請(qǐng)日期2009年12月15日 優(yōu)先權(quán)日2009年12月15日
      發(fā)明者王緯, 紀(jì)永鳳 申請(qǐng)人:北京北大方正電子有限公司, 北大方正集團(tuán)有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1