文檔處理系統(tǒng)和方法
【專利摘要】本發(fā)明公開了一種文檔處理系統(tǒng)和方法,該方法包括:應(yīng)用軟件發(fā)送指令到平臺軟件,對抽象非結(jié)構(gòu)化信息進(jìn)行操作;平臺軟件接收到來自所述應(yīng)用軟件的指令,根據(jù)所述指令,對與所述抽象非結(jié)構(gòu)化信息對應(yīng)的存儲數(shù)據(jù)執(zhí)行所述操作;其中,所述抽象非結(jié)構(gòu)化信息與所述存儲數(shù)據(jù)的數(shù)據(jù)方式無關(guān)。本發(fā)明的這種系統(tǒng)和方法將應(yīng)用層和數(shù)據(jù)處理層分離,有利于產(chǎn)業(yè)分工,以及達(dá)到文檔互操作、信息資源互聯(lián)互通等有益效果。
【專利說明】文檔處理系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種文檔處理系統(tǒng)和方法。
【背景技術(shù)】
[0002]信息可大致分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),其中以書面文檔和流媒體為主的非結(jié)構(gòu)化數(shù)據(jù)根據(jù)資料統(tǒng)計占有量超過百分之七十。結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)比較簡單,即一個二維表結(jié)構(gòu),其處理技術(shù)以數(shù)據(jù)為代表,主要是利用數(shù)據(jù)庫系統(tǒng)進(jìn)行處理,從上世紀(jì)七八十年代開始發(fā)展,到九十年代達(dá)到頂峰,研發(fā)和應(yīng)用已經(jīng)比較成熟。非結(jié)構(gòu)化數(shù)據(jù)則沒有固定數(shù)據(jù)結(jié)構(gòu),因此對非結(jié)構(gòu)化數(shù)據(jù)的處理非常的復(fù)雜。
[0003]目前處理各種非結(jié)構(gòu)化文檔的軟件已經(jīng)比較普及,形成了多種文檔格式林立的狀況。例如,文檔編輯目前就存在Microsoft的word、WPS、永中的Office、Red的Office等。通常,一個內(nèi)容管理軟件往往要處理二三百種文檔格式,而且這些格式還在不斷更新,給這類軟件的開發(fā)帶來了巨大的困難。如何解決文檔通用性、進(jìn)行數(shù)字內(nèi)容提取、格式兼容越來越成為人們的關(guān)注點,人們迫切希望解決以下問題:
[0004]I)文檔不通用:
[0005]基本上,不同用戶只能交換同一種軟件處理的文檔,無法交換不同軟件處理的文檔,形成信息封閉。
[0006]2)訪問接口不統(tǒng)一、數(shù)據(jù)兼容代價太高:
[0007]不同的文檔處理軟件之間,文件格式互不兼容,在處理過程中要么利用對方組件解析(前提是對方提供相應(yīng)接口),要么自己投入研發(fā)力量從頭到尾的解析對方的格式。
[0008]3)信息安全較差:
[0009]目前針對書面文檔的權(quán)限控制手段單一,主要是數(shù)據(jù)加密、口令認(rèn)證。因為信息泄露,每年造成巨大損失的公司案例層出不窮。
[0010]4)都是針對單個文檔的處理,缺乏多文檔管理手段:
[0011]每個人電腦中都有大量文檔,但多個文檔之間缺乏有效的組織管理,而且資源共享很難。如,字庫/字體文件、全文數(shù)據(jù)檢索等。
[0012]5)頁面分層的技術(shù)不完善:
[0013]目前一些軟件,如Adobe的photoshop, Microsoft的word,多多少少已經(jīng)有層的概念,但層的功能還比較單一,管理手段比較簡單,不能滿足應(yīng)用需求。
[0014]6)檢索手段不夠豐富:
[0015]隨著信息的海量化,用任何一個關(guān)鍵詞來搜索都會得到數(shù)量龐大的檢索結(jié)果,全文檢索技術(shù)基本解決了查全率的問題,但查準(zhǔn)率迅速上升為首要問題?,F(xiàn)有技術(shù)還沒有很充分地利用全部信息來解決查準(zhǔn)率問題,例如每個文字的字體、字號完全可以用來判斷該文字的重要性,但都在檢索時被忽略了。
[0016]雖然各大公司目前都努力將自己特有的文檔格式發(fā)展為市場標(biāo)準(zhǔn),各標(biāo)準(zhǔn)組織也致力于制訂通用的文檔格式標(biāo)準(zhǔn)。但不管是專有的文檔格式(如.doc)還是開放的文檔格式(如roF),只要是以文檔格式為標(biāo)準(zhǔn),就不可避免產(chǎn)生以下問題:
[0017]a)重復(fù)開發(fā),效果不統(tǒng)一:
[0018]使用同一標(biāo)準(zhǔn)的不同軟件都需要自己去解釋、生成該格式的文檔,造成大量重復(fù)開發(fā),而且會因為各家解釋程序不同,例如有的完善有的相對簡單,有的支持新版本有的只支持舊版本數(shù)據(jù),同一文檔在不同軟件下顯現(xiàn)出不同的版式,甚至出現(xiàn)解釋錯誤導(dǎo)致無法打開文檔。
[0019]b)阻礙創(chuàng)新:
[0020]軟件是不斷創(chuàng)新的行業(yè),但由于每增加一個新功能就需要增加描述該功能的信息,而且只有等到標(biāo)準(zhǔn)修訂的時候才能增加新的格式,因此把存儲格式固定死,將會妨礙技術(shù)創(chuàng)新的競爭。
[0021]c)影響檢索性能:
[0022]對海量信息,需要增加大量的檢索信息以提高檢索性能,但固定死的存儲格式難以增加檢索信息
[0023]d)影響可移植性和可伸縮性:
[0024]在不同的系統(tǒng)環(huán)境下,不同的應(yīng)用需求,可能會有不同的存儲要求。例如,存儲在硬盤上就需要考慮如何減少磁頭尋道的次數(shù)以提高性能,而在嵌入式應(yīng)用中數(shù)據(jù)都相當(dāng)于存儲在內(nèi)存中的,就不存在這個問題。例如,同一個廠商的數(shù)據(jù)庫軟件在不同平臺上就可能會使用不同的存儲格式。因此,設(shè)置文檔存儲標(biāo)準(zhǔn)將會影響系統(tǒng)的可移植性和可伸縮性。
[0025]現(xiàn)有技術(shù)中最開放、可交換性最好的文檔是Adobe Acrobat的F1DF15然而,雖然F1DF已經(jīng)成為全球文檔分發(fā)、交換的事實標(biāo)準(zhǔn),但也不能實現(xiàn)在不同的軟件之間交換PDF文檔,也就是說,不能實現(xiàn)PDF文檔的互操作性。而且,無論是Acrobat還是Office,都只能對單文檔進(jìn)行處理,缺乏對多文檔的管理功能,不具備對文檔庫進(jìn)行操作的功能。
[0026]另外,在文檔信息安全的方面,現(xiàn)有技術(shù)也存在較多缺陷。Word和PDF這些應(yīng)用最廣泛的文檔,都是采用對數(shù)據(jù)加密或者口令認(rèn)證等進(jìn)行數(shù)據(jù)安全控制,沒有提供系統(tǒng)的身份認(rèn)證機(jī)制,對權(quán)限的控制都是整個文檔范圍的,不能細(xì)化到文檔內(nèi)的任意區(qū)域,無法對任意邏輯數(shù)據(jù)設(shè)定加密和簽名?,F(xiàn)有的內(nèi)容管理系統(tǒng)雖然能夠提供較好的身份認(rèn)證機(jī)制,但由于與文檔處理系統(tǒng)是分離的,不僅管理粒度只能做到文檔級,而且無法在文檔使用過程中對文檔實施安全控制,難以進(jìn)行必要的安全管理。由此可見,由于現(xiàn)有的安全機(jī)制與文檔處理是分離的模塊,容易出現(xiàn)安全縫隙。
【發(fā)明內(nèi)容】
[0027]本發(fā)明實施例提供了一種文檔處理的系統(tǒng)和方法,實現(xiàn)對文檔的互操作。
[0028]本發(fā)明實施例提供的文檔處理方法,包括:
[0029]應(yīng)用軟件發(fā)送指令到平臺軟件,以對抽象非結(jié)構(gòu)化信息進(jìn)行操作;
[0030]平臺軟件接收到來自所述應(yīng)用軟件的指令,根據(jù)所述指令,對與所述抽象非結(jié)構(gòu)化信息對應(yīng)的存儲數(shù)據(jù)執(zhí)行所述操作;
[0031]其中,所述抽象非結(jié)構(gòu)化信息與所述存儲數(shù)據(jù)的數(shù)據(jù)方式無關(guān)。
[0032]本發(fā)明實施例提供的一種文檔處理系統(tǒng),包括:
[0033]應(yīng)用軟件,用于發(fā)送指令到平臺軟件,以對抽象非結(jié)構(gòu)化信息進(jìn)行操作;[0034]平臺軟件,用于接收到來自所述應(yīng)用軟件的指令,根據(jù)所述指令,對與所述抽象非結(jié)構(gòu)化信息對應(yīng)的存儲數(shù)據(jù)執(zhí)行所述操作;
[0035]其中,所述抽象非結(jié)構(gòu)化信息與所述存儲數(shù)據(jù)的數(shù)據(jù)方式無關(guān)。
[0036]本發(fā)明實施例提供的一種文檔處理方法,包括:
[0037]第一應(yīng)用軟件發(fā)送第一指令到平臺軟件,以創(chuàng)建第一抽象文檔;
[0038]所述平臺軟件接收所述第一指令,創(chuàng)建與所述第一抽象文檔對應(yīng)的存儲數(shù)據(jù);
[0039]第二應(yīng)用軟件發(fā)送第二指令到所述平臺軟件以打開所述創(chuàng)建的存儲數(shù)據(jù);
[0040]所述平臺軟件接收所述第二指令,打開并解析所述存儲數(shù)據(jù),生成與所述存儲數(shù)據(jù)對應(yīng)的第二抽象文檔;
[0041]其中所述第一指令與第二指令符合相同的接口標(biāo)準(zhǔn)。
[0042]本發(fā)明實施例提供的一種文檔處理系統(tǒng),包括:
[0043]第一應(yīng)用軟件,用于發(fā)送第一指令到平臺軟件,以創(chuàng)建第一抽象文檔;
[0044]所述平臺軟件,用于接收所述第一指令,創(chuàng)建與所述第一抽象文檔對應(yīng)的存儲數(shù)據(jù);
[0045]第二應(yīng)用軟件,用于發(fā)送第二指令到平臺軟件以打開所述創(chuàng)建的存儲數(shù)據(jù);
[0046]所述平臺軟件,進(jìn)一步用于接收所述第二指令,打開并解析所述存儲數(shù)據(jù),生成與所述存儲數(shù)據(jù)對應(yīng)的第二抽象文檔;
[0047]其中所述第一指令與第二指令符合相同的接口標(biāo)準(zhǔn)。
[0048]本發(fā)明實施例提供的一種文檔處理方法,包括:
[0049]第一平臺軟件解析以第一數(shù)據(jù)格式存儲的第一存儲數(shù)據(jù),生成與所述存儲數(shù)據(jù)對應(yīng)的第一抽象文檔;
[0050]所述應(yīng)用軟件發(fā)送第一指令到所述第一平臺軟件,以獲取所述第一抽象文檔的所有信息;發(fā)送第二指令到第二平臺軟件,以創(chuàng)建與所述第一抽象文件相同或相似的第二抽象文檔;
[0051]所述第二平臺軟件根據(jù)所述第二指令,創(chuàng)建與所述第二抽象文檔對應(yīng)并按第二數(shù)據(jù)格式存儲的第二存儲數(shù)據(jù);
[0052]其中所述第一指令和第二指令符合相同的接口標(biāo)準(zhǔn)。
[0053]本發(fā)明實施例提供的一種文檔處理系統(tǒng),包括:
[0054]第一平臺軟件,用于解析以第一數(shù)據(jù)格式存儲的第一存儲數(shù)據(jù),生成與所述存儲數(shù)據(jù)對應(yīng)的第一抽象文檔;
[0055]所述應(yīng)用軟件,用于發(fā)送第一指令到所述第一平臺軟件,以獲取所述第一抽象文檔的所有信息;發(fā)送第二指令到第二平臺軟件,以創(chuàng)建與所述第一抽象文件相同或相似的第二抽象文檔;
[0056]所述第二平臺軟件,用于根據(jù)所述第二指令,創(chuàng)建與所述第二抽象文檔對應(yīng)并按第二數(shù)據(jù)格式存儲的第二存儲數(shù)據(jù);
[0057]其中所述第一指令和第二指令符合相同的接口標(biāo)準(zhǔn)。
[0058]利用本發(fā)明實施例提供的方法和系統(tǒng),應(yīng)用軟件對一個抽象文檔執(zhí)行操作,因此它無需考慮文檔的數(shù)據(jù)是如何存儲的。平臺軟件維護(hù)抽象文檔和存儲數(shù)據(jù)(如具有某種格式的文檔文件)之間的關(guān)系,如平臺軟件將應(yīng)用軟件針對抽象問的那個的操作映射到對存儲數(shù)據(jù)的實際操作,并對存儲數(shù)據(jù)執(zhí)行此操作。這樣應(yīng)用軟件和平臺軟件實現(xiàn)了分工,進(jìn)而實現(xiàn)文檔的互操作。
【專利附圖】
【附圖說明】
[0059]圖1為依照本發(fā)明的文檔處理系統(tǒng)的結(jié)構(gòu)框圖。
[0060]圖2示出了依照本發(fā)明優(yōu)選實施例的通用文檔模型的組織結(jié)構(gòu)。
[0061]圖3示出了圖2所示通用文檔模型中文檔庫對象的組織結(jié)構(gòu)。
[0062]圖4示出了圖3所示文檔庫對象中文檔庫輔助對象的組織結(jié)構(gòu)。
【具體實施方式】
[0063]以下結(jié)合附圖及實施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用于解釋本發(fā)明,并不用于限定本發(fā)明。
[0064]如圖1所示,依照本發(fā)明的文檔處理系統(tǒng)主要包括應(yīng)用軟件、接口層、文檔庫系統(tǒng)和存儲設(shè)備。
[0065]其中的應(yīng)用軟件包括現(xiàn)有的任何文檔處理和內(nèi)容管理軟件,這些應(yīng)用軟件都位于文檔處理系統(tǒng)的應(yīng)用層,通過發(fā)送符合接口標(biāo)準(zhǔn)的指令來對文檔進(jìn)行操作,所述操作都是對符合通用文檔模型的文檔進(jìn)行的,與具體存儲格式無關(guān)。
[0066]其中的接口層符合規(guī)范應(yīng)用層和文檔庫系統(tǒng)之間交互的接口標(biāo)準(zhǔn),所述應(yīng)用層通過接口層向文檔庫系統(tǒng)發(fā)送標(biāo)準(zhǔn)指令,所述文檔庫系統(tǒng)通過接口層向應(yīng)用層返回執(zhí)行的結(jié)果。由此可見,由于應(yīng)用軟件均可以通過接口層發(fā)出標(biāo)準(zhǔn)指令,對符合通用文檔模型的文檔進(jìn)行操作,所以不同的應(yīng)用軟件可以通過同一文檔庫系統(tǒng)對同一文檔進(jìn)行操作,同一應(yīng)用軟件也可以通過不同文檔庫系統(tǒng)對不同格式的文檔進(jìn)行操作。
[0067]優(yōu)選地,接口層可包括上接口單元和下接口單元,應(yīng)用層通過上接口單元發(fā)送標(biāo)準(zhǔn)指令至下接口單元,文檔庫系統(tǒng)通過下接口單元接收標(biāo)準(zhǔn)指令,下接口單元還用于將文檔庫系統(tǒng)的執(zhí)行結(jié)果通過上接口單元返回給應(yīng)用系統(tǒng)。在實現(xiàn)上,上接口單元可位于應(yīng)用層中,下接口單元可位于文檔庫系統(tǒng)中。
[0068]其中的文檔庫系統(tǒng)為文檔處理系統(tǒng)的核心層,根據(jù)應(yīng)用軟件通過接口層發(fā)來的標(biāo)準(zhǔn)指令執(zhí)行具體的文檔處理操作。
[0069]其中的存儲設(shè)備為文檔處理系統(tǒng)的存儲層,常用的是硬盤或者內(nèi)存,也可以是光盤、閃存、軟盤、磁帶,也可以是遠(yuǎn)程的存儲設(shè)備,總之只要具備數(shù)據(jù)的存儲能力即可。在存儲設(shè)備中存儲有多個文檔,但對應(yīng)用軟件而言并不需要關(guān)心文檔的具體存儲方式。
[0070]由此可見,依照本發(fā)明,使得應(yīng)用層和數(shù)據(jù)處理層真正分離開來,文檔不再與特定應(yīng)用軟件綁定,應(yīng)用軟件不再直接跟具體的文檔格式打交道,不同的應(yīng)用軟件可以對符合通用文檔模型的同一文檔進(jìn)行編輯,使不同應(yīng)用軟件之間具有良好的文檔互操作性。
[0071]本發(fā)明還公開了一種應(yīng)用軟件,其包括用于發(fā)出標(biāo)準(zhǔn)指令的接口單元,所述標(biāo)準(zhǔn)指令用于對符合通用文檔模型的文檔進(jìn)行操作。
[0072]本發(fā)明還公開了一種文檔庫系統(tǒng),其包括:用于接收標(biāo)準(zhǔn)指令的接口單元;和,用于根據(jù)該標(biāo)準(zhǔn)指令對符合通用文檔模型的文檔進(jìn)行操作的處理單元。
[0073]本發(fā)明還公開了一種接口層,其包括:[0074]上接口單元,用于發(fā)送對符合通用文檔模型的文檔進(jìn)行操作的標(biāo)準(zhǔn)指令;
[0075]下接口單元,用于接收該標(biāo)準(zhǔn)指令。
[0076]進(jìn)一步,上接口單元可以根據(jù)應(yīng)用層發(fā)出的指令生成標(biāo)準(zhǔn)指令,下接口單元判斷接收到的指令是否符合標(biāo)準(zhǔn),并解析符合標(biāo)準(zhǔn)的指令。
[0077]圖2是本發(fā)明的一優(yōu)選實施例的通用文檔模型。如圖2所示,該通用文檔模型包含文檔倉庫、文檔庫、文檔集、文檔、頁、層、對象組、版面對象等多個層次。
[0078]其中,文檔倉庫由一個或多個文檔庫組成,文檔庫之間的關(guān)系相對于文檔庫之下的層次之間的關(guān)系相對要松散一些,文檔庫之間可以非常簡單地組合和拆離,而不用對文檔庫本身的數(shù)據(jù)做改動,該多個文檔庫之間往往沒有建立統(tǒng)一索引(特別是全文索引),很多對文檔倉庫的檢索操作一般都需要遍歷各文檔庫的索引,而沒有統(tǒng)一的索引可用。每個文檔庫由一個或多個文檔集組成,每個文檔集由一個或多個文檔組成,還可以包含任意數(shù)量的子文檔集。這里所說的文檔相當(dāng)于目前普通的一個文檔文件(例如DOC文檔),通用文檔模型可以規(guī)定一個文檔只能屬于一個文檔集,但也可以允許一個文檔屬于多個文檔集。文檔庫不是多個文檔的簡單組合,它把多個文檔緊密地組織起來,特別是為文檔內(nèi)容統(tǒng)一建立了各種檢索索引后就能帶來更大的便利性。
[0079]每個文檔由一頁或存在一定順序(如前后順序)的多頁組成,每頁的版心可以不同,而且版心也不一定是矩形的,可以是任意形狀,可以用一條或多條封閉曲線表示版心。
[0080]每頁又由一層或按一定順序(如上下順序)的多層組成,各層之間如同玻璃板的疊加關(guān)系。層由任意數(shù)量的版面對象和對象組組成,版面對象是指狀態(tài)(如字體、字號、顏色、ROP等)、文字(包括符號)、圖形(如直線、曲線、填充了指定顏色的閉合區(qū)域、漸變色等)、圖象(如TIF、JPEG、BMP、JBIG等)、語義信息(如標(biāo)題開始、標(biāo)題結(jié)束、換行等)、源文件、腳本、插件、嵌入式對象、書簽、鏈接、流媒體、二進(jìn)制數(shù)據(jù)流等。一個或多個版面對象可以組成一個對象組。對象組也可以包含任意數(shù)量的子對象組。
[0081]文檔庫、文檔集、文檔、頁、層都可以還包括元數(shù)據(jù)(如名稱、最后修改時間等,其類型可以根據(jù)應(yīng)用需求來設(shè)置)和/或歷史痕跡;文檔中還可以包括導(dǎo)航信息、導(dǎo)讀信息、微縮版面;也可以把微縮版面放在頁或者層這個層次;文檔庫、文檔集、文檔、頁、層、對象組都可以還包括數(shù)字簽名;語義信息最好跟著版面信息走,這樣可以避免數(shù)據(jù)冗余,也比較容易與版面建立對應(yīng)關(guān)系;文檔庫、文檔還可以包括字庫、圖像等共享資源。
[0082]該通用文檔模型還可以定義一個或多個角色,為每個角色分配一定權(quán)限。權(quán)限以文檔庫、文檔集、文檔、頁、層、對象組、元數(shù)據(jù)為單元進(jìn)行分配,定義每個角色對該單元是否可讀、是否可寫、是否可復(fù)制、是否可打印,等等。
[0083]該通用文檔模型是一個超越以往單個文檔對應(yīng)單個文件的方式,文檔庫中包含多個文檔集、文檔集中包含多個文檔,而對于文檔庫中文檔內(nèi)容,采用了細(xì)粒度的訪問和安全控制,可以具體訪問文檔庫中某個文字或者矩形,而不像現(xiàn)在的文檔管理系統(tǒng)只能訪問到文件名。
[0084]圖3示出了本發(fā)明一優(yōu)選實施例的通用文檔模型所涉及的各對象的組織結(jié)構(gòu)示意圖。所述的各對象的組織結(jié)構(gòu)是樹狀結(jié)構(gòu),是逐層展開、細(xì)化的。
[0085]文檔倉庫對象是由一個或多個文檔庫對象組成(圖中未示出)。
[0086]如圖3所示,文檔庫對象包括一個或多個文檔集對象、任意數(shù)量文檔庫輔助對象和任意數(shù)量的文檔庫共享對象。
[0087]如圖4所示,所述的文檔庫輔助對象包括元數(shù)據(jù)對象、角色對象、權(quán)限對象、插件對象、索引信息對象、腳本對象、數(shù)字簽名對象、歷史痕跡對象等。文檔庫共享對象是指文檔庫中的不同文檔可能共享的對象,如字庫對象、圖像對象等。
[0088]依照本發(fā)明,使得應(yīng)用層和數(shù)據(jù)處理層分離,使得同一文檔能在不同的應(yīng)用軟件之間通用,使不同應(yīng)用軟件之間具有良好的文檔互操作性。
[0089]依照本發(fā)明,形成產(chǎn)業(yè)分工,減少重復(fù)開發(fā),并更加專業(yè)、完備、正確;對文檔的基本操作都在文檔庫系統(tǒng)中處理,各應(yīng)用軟件不必重復(fù)開發(fā)。而且由于文檔庫系統(tǒng)是由專業(yè)廠商開發(fā),相關(guān)技術(shù)的專業(yè)性、完備性、正確性較有保障,而且應(yīng)用軟件廠商和用戶可以選擇做的最好的一家文檔庫系統(tǒng)廠商,從而保證處理效果的正確性和一致性。
[0090]依照本發(fā)明,提供多文檔甚至海量文檔的管理機(jī)制,使文檔之間能夠有效組織起來,便于檢索、查詢、保管,便于嵌入較強的信息安全機(jī)制。
[0091]依照本發(fā)明,提供更好的安全機(jī)制,可以設(shè)置多種角色,細(xì)粒度地設(shè)置每個角色的權(quán)限。其中細(xì)粒度是雙重的,一方面可以對整個文檔或文檔的一個細(xì)微之處進(jìn)行權(quán)限設(shè)置,另一方面可以設(shè)置種類非常多的權(quán)限,而不僅僅是傳統(tǒng)的讀/寫/不可訪問三級。
[0092]依照本發(fā)明,鼓勵創(chuàng)新,合理競爭。形成合理的產(chǎn)業(yè)分工后,各文檔庫系統(tǒng)廠商和各應(yīng)用軟件廠商就會在領(lǐng)域展開競爭,而不會再出現(xiàn)Microsoft Word—樣靠文檔格式來壟斷應(yīng)用軟件的情形發(fā)生。各文檔庫系統(tǒng)廠商也可以在標(biāo)準(zhǔn)之外增加新的功能以吸引用戶,標(biāo)準(zhǔn)并不會對創(chuàng)新形成束縛。
[0093]依照本發(fā)明,便于優(yōu)化性能,有更好的可移植性和可伸縮性。無論是什么平臺,什么樣的性能,都可以遵循同樣的調(diào)用接口,使得在不改變接口標(biāo)準(zhǔn)的情況下可以不斷優(yōu)化性能,并移植到不同的平臺。
[0094]以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種文檔處理方法,其特征在于,包括: 應(yīng)用軟件發(fā)送指令到平臺軟件,以對抽象非結(jié)構(gòu)化信息進(jìn)行操作; 平臺軟件接收到來自所述應(yīng)用軟件的指令,根據(jù)所述指令,對與所述抽象非結(jié)構(gòu)化信息對應(yīng)的存儲數(shù)據(jù)執(zhí)行所述操作; 其中,所述抽象非結(jié)構(gòu)化信息與所述存儲數(shù)據(jù)的數(shù)據(jù)方式無關(guān)。
2.如權(quán)利要求1所述的方法,其特征在于,所述抽象非結(jié)構(gòu)化信息不具有存儲。
3.如權(quán)利要求1所述的方法,其特征在于,所述抽象非結(jié)構(gòu)化信息包括可視化信息,和/或流媒體信息,和/或多維信息,和/或安全控制信息,和/或文檔組織信息,和/或交互信息。
4.如權(quán)利要求1所述的方法,其特征在于,通過發(fā)送命令串或調(diào)用函數(shù)來發(fā)送指令。
5.如權(quán)利要求1所述的方法,其特征在于,所述存儲數(shù)據(jù)為一個或多個磁盤文件,部分磁盤文件,數(shù)據(jù)庫的一個或多個字段,或磁盤分區(qū)的一個區(qū)域。
6.如權(quán)利要求1所述的方法,其特征在于,所述抽象非結(jié)構(gòu)化信息包括多個頁的可視化信息。
7.如權(quán)利要求1所述的方法,其特征在于,所述抽象非結(jié)構(gòu)化信息符合預(yù)定義文檔模型。
8.如權(quán)利要求1所述的方法,其特征在于,所述預(yù)定義文檔模型為樹形結(jié)構(gòu),并且包括至少文檔對象、頁對象以及用于描述版面的對象。
9.如權(quán)利要求8所述的方法,其特征在于,所述用于描述版面的對象可以是文字對象、圖片對象和圖形對象的任一項或任幾項的組合。
10.如權(quán)利要求9所述的方法,其特征在于,所述用于描述版面的對象還可以是狀態(tài)對象、文字對象、直線對象、曲線對象、圓弧對象、路徑對象、漸變色對象、圖像對象、流媒體對象、元數(shù)據(jù)對象、批注對象、語義信息對象、源文件對象、腳本對象、插件對象、二進(jìn)制數(shù)據(jù)流對象、書簽對象以及超鏈接對象中任一項或任幾項的組合。
【文檔編號】G06F17/30GK103577459SQ201210272218
【公開日】2014年2月12日 申請日期:2012年8月1日 優(yōu)先權(quán)日:2012年8月1日
【發(fā)明者】王東臨 申請人:天津書生投資有限公司