專利名稱::信息處理設(shè)備及其方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及分析結(jié)構(gòu)化的文檔數(shù)據(jù)、并以結(jié)構(gòu)單位(unitofstructure)輸出該分析結(jié)果的信息處理設(shè)備及其方法。
背景技術(shù):
:在輸入XML這樣的結(jié)構(gòu)化文檔數(shù)據(jù)(structureddocumentdata)并進(jìn)行分析的信息處理設(shè)備中,例如,在用SAX語法分析程序(parser)分析完XML文檔數(shù)據(jù)的某元素(element)的結(jié)束元素時(shí),處理分析結(jié)果。日本特開2000-148438號(hào)公報(bào)中公開了這樣的技術(shù)讓用戶指定構(gòu)成元素的元素名,僅分析該指定的元素,并輸出其分析結(jié)果。當(dāng)在成為要輸入的文檔數(shù)據(jù)的處理單位的文檔結(jié)構(gòu)單位內(nèi)輸入了大的數(shù)據(jù)時(shí),信息處理設(shè)備需要大量資源(resource)去處理該文檔。例如,要輸入的XML文檔數(shù)據(jù)通過“imgsrc=...”這樣的描述(description),在src屬性中嵌入了大尺寸的圖像數(shù)據(jù)時(shí),為了保持該圖像數(shù)據(jù)在分析過程中的狀態(tài),需要大容量的緩沖區(qū)。這里,如果設(shè)置與該結(jié)構(gòu)化文檔相對(duì)應(yīng)的獨(dú)立的接口,則有可能不需要大容量的緩沖區(qū)就能進(jìn)行處理,但為了使應(yīng)用程序支持該接口需要高成本。
發(fā)明內(nèi)容本發(fā)明的目的在于,解決上述現(xiàn)有技術(shù)中的問題。本發(fā)明是鑒于上述問題而完成的,因此本發(fā)明的特征在于,提供一種信息處理設(shè)備及其方法,即使以預(yù)先確定的處理單位輸入具有大容量的數(shù)據(jù)的文檔數(shù)據(jù),也能夠以較少的資源進(jìn)行分析并輸出。根據(jù)本發(fā)明,提出如下所示的信息處理設(shè)備。即,本發(fā)明提供一種處理結(jié)構(gòu)化的文檔數(shù)據(jù)的信息處理設(shè)備,包括接收裝置,接收結(jié)構(gòu)化的文檔數(shù)據(jù);字符串檢測(cè)裝置,檢測(cè)包含在上述結(jié)構(gòu)化的文檔數(shù)據(jù)中的、表示是以作為第1數(shù)據(jù)格式的文本數(shù)據(jù)格式描述的數(shù)據(jù)的字符串;數(shù)據(jù)轉(zhuǎn)換裝置,與上述文檔數(shù)據(jù)的接收處理相并行地,將跟在由上述字符串檢測(cè)裝置檢測(cè)出的上述字符串后讀入的數(shù)據(jù),轉(zhuǎn)換成以作為第2數(shù)據(jù)格式的二進(jìn)制數(shù)據(jù)格式描述的數(shù)據(jù);以及二進(jìn)制數(shù)據(jù)存儲(chǔ)裝置,將由上述數(shù)據(jù)轉(zhuǎn)換裝置所轉(zhuǎn)換的以二進(jìn)制數(shù)據(jù)格式描述的數(shù)據(jù)存儲(chǔ)于存儲(chǔ)器。根據(jù)本發(fā)明,提出如下所示的信息處理方法。即,本發(fā)明提供一種處理結(jié)構(gòu)化的文檔數(shù)據(jù)的信息處理方法,其特征在于,包括接收步驟,接收結(jié)構(gòu)化的文檔數(shù)據(jù);字符串檢測(cè)步驟,檢測(cè)包含在上述結(jié)構(gòu)化的文檔數(shù)據(jù)中的、表示是以作為第1數(shù)據(jù)格式的文本數(shù)據(jù)格式描述的數(shù)據(jù)的字符串;數(shù)據(jù)轉(zhuǎn)換步驟,與上述文檔數(shù)據(jù)的接收處理相并行地,將跟在由上述字符串檢測(cè)步驟檢測(cè)出的上述預(yù)定的字符串后讀入的數(shù)據(jù),轉(zhuǎn)換成以作為第2數(shù)據(jù)格式的二進(jìn)制數(shù)據(jù)格式描述的數(shù)據(jù);以及二進(jìn)制數(shù)據(jù)存儲(chǔ)步驟,將由上述數(shù)據(jù)轉(zhuǎn)換步驟所轉(zhuǎn)換的以二進(jìn)制數(shù)據(jù)格式描述的數(shù)據(jù)存儲(chǔ)于存儲(chǔ)器。上述特征通過獨(dú)立權(quán)利要求中記載的特征的組合而實(shí)現(xiàn),從屬權(quán)利要求用于限定對(duì)發(fā)明更有利的具體例子。本發(fā)明的其他特點(diǎn)、目的和優(yōu)點(diǎn),將通過接下來的參照附圖進(jìn)行的說明得到明確,在所有的附圖中,對(duì)相同或類似的部分標(biāo)注相同的標(biāo)號(hào)。附圖包含在說明書中,構(gòu)成本說明書的一部分,用于說明本發(fā)明的實(shí)施方式,并與其說明一起用于闡明本發(fā)明的原理。圖1是說明包括本發(fā)明的實(shí)施例的打印處理裝置(printprocessingapparatus)的打印系統(tǒng)(printsystem)的概要的結(jié)構(gòu)圖。圖2是說明本實(shí)施例的打印處理裝置的硬件結(jié)構(gòu)的框圖。圖3是表示本發(fā)明的實(shí)施例1的打印處理裝置所接收到的文檔數(shù)據(jù)的一部分的例子的圖。圖4是說明實(shí)施例1的打印處理裝置的處理的流程圖。圖5是說明在圖4的步驟S4的處理中,根據(jù)所輸入的文檔數(shù)據(jù)的描述求出最佳擴(kuò)展名(extension)的處理的詳細(xì)情況的流程圖。圖6是表示將文件的擴(kuò)展名與表示所輸入的文檔數(shù)據(jù)中包含的擴(kuò)展名的字符串對(duì)應(yīng)起來的表的一例的圖。圖7是表示在實(shí)施例1中由圖4的步驟S2轉(zhuǎn)換數(shù)據(jù)格式時(shí),根據(jù)所輸入的文檔數(shù)據(jù)的描述選擇適當(dāng)?shù)霓D(zhuǎn)換方式的動(dòng)作的流程圖。圖8是表示轉(zhuǎn)換數(shù)據(jù)格式時(shí),描述有轉(zhuǎn)換成怎樣的數(shù)據(jù)格式的表的一例的圖。圖9是表示由本發(fā)明的實(shí)施例2的打印處理裝置接收到的文檔數(shù)據(jù)的一部分的例子的圖。圖10說明實(shí)施例2的打印處理裝置的處理的流程圖。圖11是說明在圖10的步驟S34的處理中,根據(jù)所輸入的文檔數(shù)據(jù)的描述使之包括最佳擴(kuò)展名的處理的詳細(xì)情況的流程圖。圖12是表示在實(shí)施例2中由圖10的步驟S32轉(zhuǎn)換數(shù)據(jù)格式時(shí),根據(jù)所輸入的文檔數(shù)據(jù)的描述選擇適當(dāng)?shù)霓D(zhuǎn)換方式的動(dòng)作的流程圖。具體實(shí)施例方式下面,參照附圖詳細(xì)說明本發(fā)明的優(yōu)選實(shí)施例。以下的實(shí)施例,并不用于限定本申請(qǐng)的權(quán)利要求書中的發(fā)明,另外,在本實(shí)施例中說明的特征的所有組合,不一定都是解決發(fā)明所必需的手段。圖1是說明包括本發(fā)明的實(shí)施例的打印處理裝置的打印系統(tǒng)的概要的結(jié)構(gòu)圖。在圖1中,打印處理裝置103經(jīng)由LAN102與數(shù)字照相機(jī)101和PC105連接,能夠從這些設(shè)備接收XML文檔數(shù)據(jù)(XMLdocument)等結(jié)構(gòu)化文檔數(shù)據(jù),并將其打印在記錄介質(zhì)上。該LAN120可以用例如WAN、USB線路等其他通信線路置換。另外,打印處理裝置103經(jīng)由USB線路、SCSI,與由硬盤存儲(chǔ)器等構(gòu)成的保存文檔、圖像、聲音數(shù)據(jù)等文件的存儲(chǔ)裝置104連接。PC105與該LAN102連接,能夠經(jīng)由LAN102對(duì)打印處理裝置103指示數(shù)據(jù)的打印。在該圖1中,數(shù)字照相機(jī)101、PC105經(jīng)由LAN102與打印處理裝置103連接,除此之外,當(dāng)然還可以連接其他的計(jì)算機(jī)設(shè)備、圖像輸入輸出設(shè)備。圖2是說明本實(shí)施例的打印處理裝置103的硬件結(jié)構(gòu)的框圖。在圖2中,CPU201按照存儲(chǔ)在ROM202中的程序控制該裝置整體的動(dòng)作。在該處理中,例如還包括將經(jīng)由LAN102從數(shù)字照相機(jī)101接收到的XML文檔數(shù)據(jù)中包含的圖像數(shù)據(jù)轉(zhuǎn)換成打印圖像,并輸出到打印部(printengine)206進(jìn)行打印等控制。ROM202中存儲(chǔ)有由CPU201執(zhí)行的程序、包含后述的表等的各種固定數(shù)據(jù)。RAM203由SRAM、DRAM等構(gòu)成,在CPU201進(jìn)行控制處理時(shí)存儲(chǔ)各種程序控制變量等。另外,各種設(shè)定參數(shù)、各種工作用緩沖區(qū)也存儲(chǔ)在該RAM203中。打印部206是以例如噴墨方式(ink-jetmethod)、或電攝影方式(electricphotographingmethod)等將圖像打印在記錄介質(zhì)上的打印引擎。LANI/F207,是用于將該打印處理裝置103連接于LAN102并接收XML文檔數(shù)據(jù)的接口。USBI/F208是用于與USB210連接的接口。根據(jù)打印處理裝置103的結(jié)構(gòu),還可以進(jìn)一步添加掃描部、調(diào)制解調(diào)器等。接下來,說明本實(shí)施例的打印處理裝置103對(duì)經(jīng)由LAN102接收到的結(jié)構(gòu)化的文檔(XML文檔數(shù)據(jù))進(jìn)行分析處理時(shí)的動(dòng)作。關(guān)于傳輸該結(jié)構(gòu)化的文檔時(shí)的協(xié)議,在本實(shí)施例中不特別限定。<實(shí)施例1>該實(shí)施例1的特征在于當(dāng)在某元素的起始檢測(cè)出表示該元素的屬性(attribute)的特定字符串時(shí),與基于LANI/F207的該元素內(nèi)的數(shù)據(jù)的接收處理、分析處理并行地,執(zhí)行將與該元素的特定字符串相對(duì)應(yīng)的scr屬性的屬性數(shù)據(jù)的數(shù)據(jù)格式,轉(zhuǎn)換成其他數(shù)據(jù)格式的處理。圖3是舉例說明本發(fā)明的實(shí)施例1的打印處理裝置103所接收到的文檔數(shù)據(jù)的一部分的圖。圖3所示的文檔數(shù)據(jù)是用XML描述的。打印處理裝置103,通過檢測(cè)在sample元素的第一行所描述的“src=”dataimage/jpeg;base64”,識(shí)別出作為src屬性的屬性數(shù)據(jù)包含對(duì)jpeg圖像(二進(jìn)制數(shù)據(jù))進(jìn)行了base64編碼后的文本數(shù)據(jù)的情況。在該特定字符串以后,包含通過進(jìn)行base64編碼而得到的文本數(shù)據(jù)“ROIGOD...YKAAA7”(經(jīng)base64編碼,用字符代碼描述的jpeg圖像數(shù)據(jù))。圖4是說明該實(shí)施例1的打印處理裝置103的打印處理的流程圖,執(zhí)行該處理的程序存儲(chǔ)在ROM202中,在CPU201的控制下執(zhí)行。這里,以接收到圖3所示的文檔的情況進(jìn)行說明。在圖3中,src屬性的起始字符串“dataimage/jpeg;base64”,在遵從IETF的RFC2397在XML文檔數(shù)據(jù)的屬性數(shù)據(jù)中描述某種數(shù)據(jù)時(shí)使用。這里,“image/jpeg”表示數(shù)據(jù)的媒體類型,表示jpeg編碼后的圖像數(shù)據(jù)?!癰ase64”表示數(shù)據(jù)的編碼方式。該實(shí)施例1的打印處理裝置103,從起始處開始依次讀入接收到的XML文檔數(shù)據(jù)內(nèi)的數(shù)據(jù),進(jìn)行分析處理。與該接收處理相并行地,將用文本數(shù)據(jù)格式描述的圖像數(shù)據(jù)轉(zhuǎn)換成二進(jìn)制數(shù)據(jù)格式的數(shù)據(jù),并將該轉(zhuǎn)換后的二進(jìn)制數(shù)據(jù)格式的圖像存儲(chǔ)到RAM203中。然后,該處理后,進(jìn)行所存儲(chǔ)的圖像數(shù)據(jù)的打印處理。這里,存儲(chǔ)在RAM203中的二進(jìn)制數(shù)據(jù)的容量,少于XML文檔數(shù)據(jù)中的編碼后的文本數(shù)據(jù)的容量,因此,可以減少RAM203的容量。首先,在步驟S1的分析處理中,判斷各元素的起始是否包含上述特定字符串(例如上述字符串“src=”dataimage/jpeg;base64”)。當(dāng)判斷為不包含特定字符串時(shí)結(jié)束該處理。當(dāng)在步驟S1中判斷為包含特定字符串時(shí)進(jìn)入步驟S2,執(zhí)行跟在特定字符串后面的src屬性的屬性數(shù)據(jù)的讀入(接收處理)和其分析處理。另外,與此相并行地,將所讀入的屬性數(shù)據(jù)的數(shù)據(jù)格式(在上述例子中為文本數(shù)據(jù))轉(zhuǎn)換為其他數(shù)據(jù)格式(在上述例子中為二進(jìn)制數(shù)據(jù)),并在打印部206執(zhí)行打印處理。在實(shí)施例1中,將上述特定字符串取為“dataimage/jpeg;base64”。該特定字符串表示是將jpeg編碼后的圖像數(shù)據(jù)用base64進(jìn)行編碼后的數(shù)據(jù)。這里的數(shù)據(jù)格式的轉(zhuǎn)換,是將base64編碼后的數(shù)據(jù)轉(zhuǎn)換成base64解碼后的二進(jìn)制格式的數(shù)據(jù),以減小轉(zhuǎn)換后的數(shù)據(jù)大小。由此,數(shù)據(jù)量約減少為3/4。這樣轉(zhuǎn)換后的圖像數(shù)據(jù),可以進(jìn)行打印處理,也可以作為圖像文件保存到與打印處理裝置103連接的外部存儲(chǔ)裝置104中。此時(shí),為了能夠檢索文件的保存地址,生成識(shí)別信息并將其添加到XML文檔數(shù)據(jù)中。在實(shí)施例1中,作為識(shí)別信息(identificationdata)生成該文件的URI。接下來,在步驟S3中,判斷是否存在尚未讀入的屬性數(shù)據(jù),如果有則返回步驟S2,與上述同樣接著讀入屬性數(shù)據(jù),并將數(shù)據(jù)格式轉(zhuǎn)換后保存到圖像文件中。也可以將添加有識(shí)別信息的XML文檔數(shù)據(jù)保存到存儲(chǔ)裝置104中。Base64編碼是指將二進(jìn)制數(shù)據(jù)轉(zhuǎn)換成64種ASCII字符的操作。然后,以6bit表示要使用的ASCII字符。即,3字節(jié)(24bit)二進(jìn)制數(shù)據(jù)被轉(zhuǎn)換為4個(gè)ASCII字符。ASCII字符的有效位是6bit,但作為數(shù)據(jù)以1字節(jié)(8bit)來表示,因此,3字節(jié)的二進(jìn)制數(shù)據(jù)被編碼為4字節(jié)的數(shù)據(jù)。由此,圖3所示的base64編碼后的數(shù)據(jù)的數(shù)據(jù)量,增為原來的二進(jìn)制數(shù)據(jù)的數(shù)據(jù)量的4/3倍。這次通過對(duì)其解碼,在打印處理裝置103中減少數(shù)據(jù)量。這樣在步驟S3中,當(dāng)所有的src屬性的屬性數(shù)據(jù)的分析處理、打印處理結(jié)束后,進(jìn)入步驟S4,不刪除原來的base64編碼后的屬性數(shù)據(jù),而代之以將該所生成的識(shí)別信息作為分析結(jié)果描述在XML文檔數(shù)據(jù)中。這里,添加描述了鏈接信息(linkdata)的擴(kuò)展名,該鏈接信息能夠用來參照該解碼后的數(shù)據(jù)的保存地址。由此,作為XML文檔數(shù)據(jù)的外部鏈接能夠參照?qǐng)D像數(shù)據(jù)。另外,通過這樣添加適當(dāng)?shù)臄U(kuò)展名,能夠利用該擴(kuò)展名判斷該數(shù)據(jù)的內(nèi)容。如上所述,通過步驟S2、S3的處理,能夠減少整體的數(shù)據(jù)量。由此,即使RAM203的存儲(chǔ)容量減少也能進(jìn)行打印處理。另外,在打印處理裝置103中執(zhí)行再次打印時(shí),即使不再次進(jìn)行數(shù)據(jù)的轉(zhuǎn)換處理,也能夠通過參照該連接信息,讀出二進(jìn)制數(shù)據(jù)執(zhí)行再次打印處理。圖5是說明在圖4的步驟S4的處理中,根據(jù)所輸入的文檔數(shù)據(jù)的描述求出最佳擴(kuò)展名的處理的詳細(xì)情況的流程圖。這里,預(yù)先準(zhǔn)備圖6那樣的與擴(kuò)展名相對(duì)應(yīng)的表。圖6表示如前所述、在將轉(zhuǎn)換了數(shù)據(jù)格式后的數(shù)據(jù)作為文件保存時(shí),將該文件的擴(kuò)展名與表示所輸入的文檔數(shù)據(jù)中包含的擴(kuò)展名的字符串對(duì)應(yīng)起來的表的一個(gè)例子。該表例如存儲(chǔ)在ROM202中。在該例子中,“image/jpeg”對(duì)應(yīng)于擴(kuò)展名“jpg”。首先,在步驟S11中,在保存屬性數(shù)據(jù)時(shí),判斷在上述步驟S1中檢測(cè)出的特定字符串中是否包含圖6所示的擴(kuò)展名對(duì)應(yīng)表(character-stringtoextensiontable)的記錄的字符串。當(dāng)不包含時(shí)進(jìn)入步驟S12,附加既定的擴(kuò)展名后保存。而當(dāng)包含時(shí),在步驟S13中參照?qǐng)D6所示的表,附加與表示該擴(kuò)展名的字符串相對(duì)應(yīng)的擴(kuò)展名后保存。在該實(shí)施例1的情況下,如圖3所示,包含擴(kuò)展名的字符串“image/jpeg”,因此,參照?qǐng)D6的表附加與該字符串相對(duì)應(yīng)的擴(kuò)展名“jpg”后保存。另外,也能根據(jù)該所輸入的文檔數(shù)據(jù)選擇適當(dāng)?shù)臄?shù)據(jù)格式的轉(zhuǎn)換方式。圖7是表示在實(shí)施例1中,由圖4的步驟S2轉(zhuǎn)換數(shù)據(jù)格式時(shí),根據(jù)所輸入的文檔數(shù)據(jù)的描述選擇適當(dāng)?shù)霓D(zhuǎn)換方式的動(dòng)作的流程圖。這里,預(yù)先準(zhǔn)備圖8所示的數(shù)據(jù)轉(zhuǎn)換方式對(duì)應(yīng)表。圖8是表示轉(zhuǎn)換數(shù)據(jù)格式時(shí)描述了轉(zhuǎn)換成怎樣的數(shù)據(jù)格式的表的例子的圖。該表例如存儲(chǔ)在ROM202中。在該例子中,“base64”對(duì)應(yīng)于轉(zhuǎn)換成base64的解碼“base64_decode”。首先,在步驟S21中,當(dāng)在上述圖4的步驟S2轉(zhuǎn)換屬性數(shù)據(jù)的數(shù)據(jù)格式時(shí),判斷在步驟S1檢測(cè)出的特定字符串中,是否包含處于圖8所示的數(shù)據(jù)轉(zhuǎn)換格式對(duì)應(yīng)表的記錄的轉(zhuǎn)換方式的識(shí)別字符串。當(dāng)不包含時(shí)進(jìn)入步驟S22,以既定的(predetermined)數(shù)據(jù)轉(zhuǎn)換方式轉(zhuǎn)換數(shù)據(jù)格式。而當(dāng)包含時(shí),在步驟S23中參照?qǐng)D8的表,轉(zhuǎn)換成與該識(shí)別字符串相對(duì)應(yīng)的數(shù)據(jù)格式。在該實(shí)施例1中,由于包含有字符串“base64”,所以,通過“base64_decode(){”(base64解碼)轉(zhuǎn)換數(shù)據(jù)格式。即,將用base64編碼后的文本數(shù)據(jù)解碼成二進(jìn)制數(shù)據(jù)。如上所述,在實(shí)施例1中,將用src屬性的“dataimage/jpeg;base64”編碼后的jpeg圖像數(shù)據(jù)轉(zhuǎn)換成二進(jìn)制格式的數(shù)據(jù)后存儲(chǔ),并將該jpeg數(shù)據(jù)作為文件保存。由此,能夠減少原來的文檔數(shù)據(jù)的數(shù)據(jù)量。進(jìn)而,在XML文檔數(shù)據(jù)中描述表示該所保存的文件的URI,以代替通過“dataimage/jpeg;base64”編碼后的jpeg圖像數(shù)據(jù)。由此,在后面的步驟中,能夠根據(jù)該URI訪問該所保存的數(shù)據(jù)。這樣,即使存儲(chǔ)容量少,也能進(jìn)行打印處理。<實(shí)施例2>在本發(fā)明的實(shí)施例2中說明以下情況在圖9所示的描述格式中,作為屬性的種類信息檢測(cè)出某元素的起始標(biāo)識(shí)中描述的特定字符串時(shí),與該屬性值的讀出相并行地,將作為其元素內(nèi)容描述的數(shù)據(jù)的格式轉(zhuǎn)換為其他格式,并進(jìn)行打印處理。該實(shí)施例2中的打印系統(tǒng)和打印處理裝置103的硬件結(jié)構(gòu),與上述實(shí)施例1的情況相同,因此省略其說明。圖9是舉例說明由本發(fā)明的實(shí)施例2的打印處理裝置103接收到的文檔數(shù)據(jù)的一部分的圖。如圖9所示,該文檔是用XML描述的。這里,作為元素的type屬性(表示元素種類的信息)描述有“image/jpeg”這樣的表示媒體類型的字符串(type=“image/jpeg”)。圖10說明實(shí)施例2的打印處理裝置103的處理的流程圖,執(zhí)行該處理的程序存儲(chǔ)在ROM202中,在CPU201的控制下執(zhí)行。實(shí)施例2的打印處理裝置103,也與實(shí)施例1相同,從起始處開始依次接收并讀入接收到的XML文檔數(shù)據(jù),進(jìn)行分析處理。首先,在步驟S31的分析處理中,判斷各元素的屬性中是否沒有描述預(yù)定的type屬性“image/jpeg”。當(dāng)判斷為沒有描述時(shí),結(jié)束該分析處理。當(dāng)在步驟S31中判斷為描述有預(yù)定的type屬性時(shí)進(jìn)入步驟S32,執(zhí)行元素內(nèi)容的接收和其分析處理。并且,與此相并行地,將該元素內(nèi)容轉(zhuǎn)換為其他數(shù)據(jù)格式,并進(jìn)行打印處理。該數(shù)據(jù)格式的轉(zhuǎn)換與上述實(shí)施例1相同,當(dāng)為base64編碼后的數(shù)據(jù)時(shí)進(jìn)行base64解碼,以減小數(shù)據(jù)尺寸。該轉(zhuǎn)換后的數(shù)據(jù)的保存,也與上述實(shí)施例1相同,作為文件保存在存儲(chǔ)裝置104中。在該實(shí)施例2中,保存時(shí)也生成并添加能夠參照其保存地址的識(shí)別信息。在實(shí)施例2中,作為文件保存在存儲(chǔ)裝置104中,并將URI作為識(shí)別信息附加在其上并存儲(chǔ)。在這樣保存后的步驟S33中,判斷該文檔中是否存在尚未讀入的剩余的元素內(nèi)容,如果有則返回步驟S32,與上述同樣進(jìn)行數(shù)據(jù)轉(zhuǎn)換處理,并根據(jù)轉(zhuǎn)換后的圖像數(shù)據(jù)進(jìn)行打印處理。作為轉(zhuǎn)換后的圖像數(shù)據(jù)的保存地址的識(shí)別信息,與上述實(shí)施例1相同,可以根據(jù)所輸入的文檔數(shù)據(jù)的描述使之包含最佳擴(kuò)展名。這樣,在步驟S33中保存后所有的元素內(nèi)容后進(jìn)入步驟S34,將該所生成的識(shí)別信息作為分析結(jié)果進(jìn)行描述,以代替原來的元素內(nèi)容。圖11是說明在圖10的步驟S34的處理中,根據(jù)所輸入的文檔數(shù)據(jù)的描述使之包含最佳擴(kuò)展名的處理的詳細(xì)情況的流程圖。這里,也預(yù)先準(zhǔn)備上述圖6那樣的擴(kuò)展名對(duì)應(yīng)表。在圖10的步驟S32中保存元素內(nèi)容時(shí),首先,在步驟S41中,判斷在相同的元素內(nèi)的描述中是否包含處于圖6的擴(kuò)展名對(duì)應(yīng)表的記錄的擴(kuò)展名的識(shí)別字符串。當(dāng)不包含時(shí)進(jìn)入步驟S42,附加既定的擴(kuò)展名后保存該轉(zhuǎn)換后的數(shù)據(jù)。而在步驟S41中判斷為包含處于記錄的擴(kuò)展名的識(shí)別字符串時(shí),進(jìn)入步驟S43,參照?qǐng)D6附加對(duì)應(yīng)的擴(kuò)展名后保存。在實(shí)施例2的情況下,相同的元素的type屬性值中包含有字符串“image/jpeg”,因此附加擴(kuò)展名“jpg”后保存。另外,也可以根據(jù)所輸入的文檔數(shù)據(jù)選擇適當(dāng)?shù)臄?shù)據(jù)格式的轉(zhuǎn)換方式。圖12是表示在實(shí)施例2中,在圖10的步驟S32轉(zhuǎn)換數(shù)據(jù)格式時(shí),根據(jù)所輸入的文檔數(shù)據(jù)的描述選擇適當(dāng)?shù)霓D(zhuǎn)換方式的動(dòng)作的流程圖。此時(shí),也預(yù)先準(zhǔn)備圖8那樣的數(shù)據(jù)轉(zhuǎn)換方式對(duì)應(yīng)表。在步驟S32中對(duì)元素內(nèi)容進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換時(shí),首先,在步驟S51中,判斷相同元素內(nèi)的描述中是否包含處于圖8的數(shù)據(jù)轉(zhuǎn)換格式對(duì)應(yīng)表的記錄的轉(zhuǎn)換方式的識(shí)別字符串。當(dāng)不包含時(shí)進(jìn)入步驟S52,以既定的方式轉(zhuǎn)換數(shù)據(jù)格式。而當(dāng)包含時(shí)進(jìn)入步驟S53,按照?qǐng)D8的表,以對(duì)應(yīng)的方式轉(zhuǎn)換數(shù)據(jù)格式。在實(shí)施例2中,由于相同元素的type屬性值中包含“image/jpeg”這樣的字符串,所以通過base64解碼來轉(zhuǎn)換數(shù)據(jù)格式。一般僅憑媒體類型“image/jpeg”不能判斷是否經(jīng)過了base64編碼,但利用對(duì)應(yīng)表,通過預(yù)先規(guī)定與字符串“image/jpeg”相對(duì)應(yīng)的數(shù)據(jù)轉(zhuǎn)換格式,能夠識(shí)別適當(dāng)?shù)臄?shù)據(jù)轉(zhuǎn)換方式。如上所述,根據(jù)實(shí)施例2,描述新生成的URI,以取代從sample元素的起始標(biāo)識(shí)(starttag)到結(jié)束標(biāo)識(shí)(endtag)為止的內(nèi)容。然后,進(jìn)入分析處理,按該文檔數(shù)據(jù)的結(jié)構(gòu)單位輸出分析結(jié)果。然后,通過求出附加在該文件上的URI,能夠訪問所保存的文件數(shù)據(jù)。在以上說明的第1和第2實(shí)施例中,以打印處理裝置為例進(jìn)行了說明,但本發(fā)明不限于此,同樣也能應(yīng)用于例如便攜式電話、顯示器、存儲(chǔ)單元等其他外圍設(shè)備或計(jì)算機(jī)等通用信息處理設(shè)備。例如,也能應(yīng)用于聲音再現(xiàn)裝置。具體來講,與讀出通過在XML文檔數(shù)據(jù)中進(jìn)行base64編碼而描述的文本數(shù)據(jù)相并行地,將其轉(zhuǎn)換成二進(jìn)制格式的聲音數(shù)據(jù)(audiodata),對(duì)轉(zhuǎn)換后的聲音數(shù)據(jù)進(jìn)行再現(xiàn)或保存。如上所述,根據(jù)本實(shí)施例,能夠根據(jù)文檔數(shù)據(jù)中的特定字符串的檢測(cè),與此后的文檔文件內(nèi)的數(shù)據(jù)的接收處理相并行地,將其轉(zhuǎn)換為更小的數(shù)據(jù)尺寸的數(shù)據(jù)格式的數(shù)據(jù),并進(jìn)行打印處理,或保存到文件中。另外,根據(jù)本實(shí)施例,即使所輸入的文檔數(shù)據(jù)的結(jié)構(gòu)單位內(nèi)包含圖像數(shù)據(jù)那樣的大的數(shù)據(jù),即使是存儲(chǔ)器等資源少的設(shè)備也能有效地進(jìn)行處理。另外,由于輸入輸出接口與以往相同,所以,應(yīng)用本實(shí)施例時(shí)的應(yīng)用程序一側(cè)的對(duì)應(yīng)成本可以變小。本發(fā)明還包括通過以下方式實(shí)現(xiàn)的情況通過向系統(tǒng)或裝置直接或遠(yuǎn)程地提供實(shí)現(xiàn)上述實(shí)施例的功能的軟件的程序,該系統(tǒng)或裝置的計(jì)算機(jī)讀出并執(zhí)行該所提供的程序代碼。這時(shí),只要具有程序的功能即可,其形式不需要是程序。因此,為了實(shí)現(xiàn)本發(fā)明的功能處理,安裝在該計(jì)算機(jī)中的程序代碼本身也實(shí)現(xiàn)本發(fā)明。即,本發(fā)明還包括用于實(shí)現(xiàn)本發(fā)明的功能處理的計(jì)算機(jī)程序本身。此時(shí),只要具有程序的功能即可,而不管程序的形式如何,可以是目標(biāo)代碼、由解釋程序執(zhí)行的程序,提供給OS的腳本數(shù)據(jù)等。作為用于提供該程序代碼的記錄介質(zhì),例如有floppy(注冊(cè)商標(biāo))盤、硬盤、光盤、光磁盤、MO、CD-ROM、CD-R、CD-RW、磁帶、非易失性的存儲(chǔ)卡、ROM、DVD(DVD-ROM、DVD-R)等。作為其他的供給程序的方法,可以通過使用客戶計(jì)算機(jī)的瀏覽器連接到互聯(lián)網(wǎng)的主頁,從該主頁將本發(fā)明的計(jì)算機(jī)程序本身或壓縮的包含自動(dòng)安裝功能的文件下載到硬盤等記錄介質(zhì)。而且,可以通過將構(gòu)成本發(fā)明的程序的程序代碼劃分為多個(gè)文件,并從不同的主頁下載各文件來實(shí)現(xiàn)供給。換句話說,本發(fā)明的權(quán)利要求還包括對(duì)多個(gè)用戶下載由計(jì)算機(jī)實(shí)現(xiàn)本發(fā)明的功能處理的程序文件的WWW(萬維網(wǎng))服務(wù)器。而且,本發(fā)明還可以通過以下方式實(shí)現(xiàn),即對(duì)本發(fā)明的程序進(jìn)行加密并存儲(chǔ)在CD-ROM等存儲(chǔ)介質(zhì)上,向用戶分發(fā)存儲(chǔ)介質(zhì),允許符合預(yù)定條件的用戶經(jīng)互聯(lián)網(wǎng)從主頁下載解密的密鑰信息,通過使用該密鑰信息執(zhí)行加密的程序,使其安裝到計(jì)算機(jī)中。此外,不僅有通過執(zhí)行所讀出的程序?qū)崿F(xiàn)上述實(shí)施例的功能的情況,當(dāng)然還包括以下情況,即根據(jù)該程序代碼的指示,在計(jì)算機(jī)上運(yùn)行的操作系統(tǒng)(OS)等進(jìn)行實(shí)際處理的一部分或全部,通過該處理能實(shí)現(xiàn)上述實(shí)施例的功能。并且,將從存儲(chǔ)介質(zhì)讀出的程序,寫入插入計(jì)算機(jī)的功能擴(kuò)展板或連接在計(jì)算機(jī)上的功能擴(kuò)展單元所具備的存儲(chǔ)器之后,按照該程序的指示,該功能擴(kuò)展板或功能擴(kuò)展單元所具備的CPU等進(jìn)行實(shí)際處理的一部分或全部,通過該處理,實(shí)現(xiàn)上述實(shí)施例的功能。本發(fā)明不限于上述實(shí)施例,可以在本發(fā)明的范圍內(nèi)進(jìn)行各種變更和修改。附加的權(quán)利要求書公開本發(fā)明的范圍。權(quán)利要求1.一種處理結(jié)構(gòu)化的文檔數(shù)據(jù)的信息處理設(shè)備,其特征在于,包括接收裝置,接收上述結(jié)構(gòu)化的文檔數(shù)據(jù);字符串檢測(cè)裝置,檢測(cè)包含在上述結(jié)構(gòu)化的文檔數(shù)據(jù)中的、表示是以作為第1數(shù)據(jù)格式的文本數(shù)據(jù)格式描述的數(shù)據(jù)的字符串;數(shù)據(jù)轉(zhuǎn)換裝置,與上述文檔數(shù)據(jù)的接收處理相并行地,將跟在由上述字符串檢測(cè)裝置檢測(cè)出的上述字符串后讀入的數(shù)據(jù),轉(zhuǎn)換成以作為第2數(shù)據(jù)格式的二進(jìn)制數(shù)據(jù)格式描述的數(shù)據(jù);以及二進(jìn)制數(shù)據(jù)存儲(chǔ)裝置,將由上述數(shù)據(jù)轉(zhuǎn)換裝置所轉(zhuǎn)換的以二進(jìn)制數(shù)據(jù)格式描述的數(shù)據(jù)存儲(chǔ)到存儲(chǔ)器中。2.根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其特征在于由上述數(shù)據(jù)轉(zhuǎn)換裝置所轉(zhuǎn)換的以二進(jìn)制數(shù)據(jù)格式描述的數(shù)據(jù),是圖像數(shù)據(jù)或聲音數(shù)據(jù)。3.根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其特征在于上述第2數(shù)據(jù)格式的數(shù)據(jù)量比上述第1數(shù)據(jù)格式的數(shù)據(jù)量少。4.根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其特征在于上述數(shù)據(jù)轉(zhuǎn)換裝置,將二進(jìn)制數(shù)據(jù)格式的數(shù)據(jù)的連接信息描述在上述結(jié)構(gòu)化的文檔數(shù)據(jù)中,取代以上述第1數(shù)據(jù)格式描述的數(shù)據(jù)。5.一種處理結(jié)構(gòu)化的文檔數(shù)據(jù)的信息處理方法,其特征在于,包括接收步驟,由接收裝置接收上述結(jié)構(gòu)化的文檔數(shù)據(jù);字符串檢測(cè)步驟,檢測(cè)包含在上述結(jié)構(gòu)化的文檔數(shù)據(jù)中的、表示是以作為第1數(shù)據(jù)格式的文本數(shù)據(jù)格式描述的數(shù)據(jù)的字符串;數(shù)據(jù)轉(zhuǎn)換步驟,與上述文檔數(shù)據(jù)的接收處理相并行地,將跟在上述字符串檢測(cè)步驟中檢測(cè)出的上述字符串后讀入的數(shù)據(jù),轉(zhuǎn)換成以作為第2數(shù)據(jù)格式的二進(jìn)制數(shù)據(jù)格式描述的數(shù)據(jù);以及二進(jìn)制數(shù)據(jù)存儲(chǔ)步驟,將在上述數(shù)據(jù)轉(zhuǎn)換步驟中所轉(zhuǎn)換的以二進(jìn)制數(shù)據(jù)格式描述的數(shù)據(jù)存儲(chǔ)到存儲(chǔ)器中。6.根據(jù)權(quán)利要求5所述的信息處理方法,其特征在于在上述數(shù)據(jù)轉(zhuǎn)換步驟中所轉(zhuǎn)換的以二進(jìn)制數(shù)據(jù)格式描述的數(shù)據(jù),是圖像數(shù)據(jù)或聲音數(shù)據(jù)。7.根據(jù)權(quán)利要求5所述的信息處理方法,其特征在于上述第2數(shù)據(jù)格式的數(shù)據(jù)量比上述第1數(shù)據(jù)格式的數(shù)據(jù)量少。8.根據(jù)權(quán)利要求5所述的信息處理方法,其特征在于還包括處理步驟,將二進(jìn)制數(shù)據(jù)格式的數(shù)據(jù)的連接信息描述在上述存儲(chǔ)器的結(jié)構(gòu)化的文檔數(shù)據(jù)中,取代以上述第1數(shù)據(jù)格式描述的數(shù)據(jù)。全文摘要本發(fā)明提供一種信息處理設(shè)備及其方法,分析結(jié)構(gòu)化的文檔數(shù)據(jù)并以結(jié)構(gòu)單位輸出該分析結(jié)果,所述信息處理設(shè)備及其方法,檢測(cè)包含在結(jié)構(gòu)化的文檔數(shù)據(jù)中的、表示第1數(shù)據(jù)格式的特定字符串;當(dāng)檢測(cè)到該特定字符串后,將與該特定字符串相對(duì)應(yīng)的數(shù)據(jù),轉(zhuǎn)換成與第1數(shù)據(jù)格式不同的第2數(shù)據(jù)格式。文檔編號(hào)G06F17/27GK1841382SQ20061006519公開日2006年10月4日申請(qǐng)日期2006年3月27日優(yōu)先權(quán)日2005年3月28日發(fā)明者石崎透申請(qǐng)人:佳能株式會(huì)社