專利名稱:數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及媒體處理裝置及涉及例如適用于金融機(jī)構(gòu)文件處理的數(shù)據(jù)媒體處理方法,并特別涉及進(jìn)行對諸如個人文件等具有各種格式的文件的處理的數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法。
背景技術(shù):
近年來,作為閱讀當(dāng)作圖象數(shù)據(jù)(一個圖象)的字符信息并然后識別字符的裝置,諸如光學(xué)字符閱讀裝置(OCR裝置)得到發(fā)展,并在各種行業(yè)中,廣泛使用圖象數(shù)據(jù)閱讀裝置以便達(dá)到業(yè)務(wù)上效率的擴(kuò)充等。
例如,在金融機(jī)構(gòu)等的窗口操作的操作者通過使用上述圖象數(shù)據(jù)閱讀裝置有效處理文件媒體(多個文件)而達(dá)到業(yè)務(wù)的擴(kuò)充。
特別,為了在進(jìn)行上述這種文件處理的業(yè)務(wù)中有效達(dá)到擴(kuò)充,不僅需要同類型的文件媒體(專用于識別處理的媒體),而且還需要自動地處理具有不同格式的文件媒體。
這樣,使用圖象數(shù)據(jù)閱讀裝置的文件媒體的處理能夠通過使用例如圖115所示的文件處理裝置對于多種文件媒體進(jìn)行。
特別,參照圖115,標(biāo)號1001表示用于閱讀文件的圖象數(shù)據(jù)的圖象數(shù)據(jù)閱讀裝置。圖象數(shù)據(jù)閱讀裝置1001連接到計(jì)算機(jī)1002使得它能夠在計(jì)算機(jī)1002的控制下進(jìn)行圖象數(shù)據(jù)的閱讀操作。可注意的是,例如圖象掃描器或者傳真機(jī)用作為圖象數(shù)據(jù)閱讀裝置1001。
同時,計(jì)算機(jī)1002作為用于控制圖象數(shù)據(jù)閱讀裝置1001的控制裝置由諸如鍵盤或者鼠標(biāo)(圖115中只示出鍵盤)用于從操作者輸入指令、數(shù)據(jù)等的輸入單元1002-1,計(jì)算機(jī)主機(jī)1002-2,及用于顯示數(shù)據(jù)、控制信息等顯示單元1002-3組成。可注意到,由圖象數(shù)據(jù)閱讀裝置1001所閱讀的圖象數(shù)據(jù)的字符識別處理是由計(jì)算機(jī)主機(jī)1002-2進(jìn)行的。
進(jìn)而,標(biāo)號硬盤1003表示一個硬盤。硬盤1003連接到計(jì)算機(jī)1002并預(yù)先存儲信息(下面稱為“定義對象的信息”)1003A到1003C,...,該信息對于例如圖116所示的每一種類的文件,指定要被識別的字符數(shù)據(jù)的位置信息,及字符的類型,數(shù)目等等。
可注意的是,能夠使用如圖116或117所示的圖象數(shù)據(jù)閱讀和識別裝置1005替代上述的圖象數(shù)據(jù)閱讀裝置1001。圖象數(shù)據(jù)閱讀和識別裝置1005能夠進(jìn)行類似于圖象數(shù)據(jù)閱讀裝置1001的圖象數(shù)據(jù)閱讀操作以及字符識別。
為了使用圖象數(shù)據(jù)閱讀和識別裝置1005識別出現(xiàn)在例如圖116所示的電費(fèi)付款通知單1004上的字符數(shù)據(jù),通過操作者操作鍵盤1002-1指定文件類型(這種情形下,定義對象信息1003B對應(yīng)于電費(fèi)付款通知單1004(文件B))。
然后,計(jì)算機(jī)1002訪問硬盤1003取得被指定的文件的定義對象信息1003B,并向圖象數(shù)據(jù)閱讀和識別裝置1005報(bào)告該定義對象信息1003B。
繼而,圖象數(shù)據(jù)閱讀和識別裝置1005能夠基于作為來自計(jì)算機(jī)1002的控制信息的定義對象信息1003B實(shí)現(xiàn)圖象數(shù)據(jù)的閱讀和字符識別的處理。
可是,在處理諸如參照圖116上述的文件的過程中,由于定義對象信息是對每一要閱讀的文件通過操作者的指定而被指定的,故加重了操作者的負(fù)擔(dān),并且此外,當(dāng)定義對象在數(shù)量上增加時,可能出現(xiàn)指定的錯誤。在需要處理數(shù)千種文件的地方,對于操作者指定一個定義對象實(shí)際上是困難的。
因而,此間如圖117所示還提出另一方法,在文件1004規(guī)定的位置處1004a記錄用于標(biāo)識一個文件以便同任何其它文件相區(qū)別的ID號碼(這種情形下是′0102′),使得文件的閱讀處理能夠自動地進(jìn)行而無需如上述那樣由操作者指定文件類型。
由剛才所述的方法,當(dāng)文件的圖象數(shù)據(jù)要由圖象數(shù)據(jù)閱讀和識別裝置1005閱讀時,可通過首先識別在預(yù)定位置1004a所記錄的ID號碼,然后使用對應(yīng)于所識別的ID號碼的定義對象信息(這種情形下為1003B)實(shí)現(xiàn)字符的識別。
然而在要閱讀圖象數(shù)據(jù)時,如果在諸如圖象數(shù)據(jù)閱讀裝置1001或者圖象數(shù)據(jù)閱讀和識別裝置1005等光學(xué)閱讀裝置中(例如文件處理裝置)文件等所放置的位置錯位時,或甚至例如閱讀與其定義對象信息預(yù)先存儲在硬盤1003中的文件相同的文件,則由于字符數(shù)據(jù)區(qū)域,即字形等等區(qū)域?qū)⒄拯c(diǎn)(物理原點(diǎn))的圖象坐標(biāo)不表現(xiàn)為與定義對象信息的圖象相同的坐標(biāo),而在文件處理裝置中等判斷布局彼此不同。
在文件處理裝置等中,除非在彼此調(diào)整了所閱讀圖象數(shù)據(jù)的布局和定義對象信息的布局之后進(jìn)行圖象數(shù)據(jù)的字符識別,否則有時不能正規(guī)地進(jìn)行字符識別處理。因而,各個圖象的參照點(diǎn)被提取,并且各個圖象對該參照點(diǎn)的坐標(biāo)彼此進(jìn)行比較以實(shí)現(xiàn)布局之間的重合的鑒別。
這里,主要使用以下兩者方法取得圖象數(shù)據(jù)的參照點(diǎn)。要注意的是,作為先決條件,供閱讀的對象文件是事先打印的文件并且文件在表格上的打印位置以高度精確管理。
根據(jù)第一方法,當(dāng)文件的圖象數(shù)據(jù)由圖象數(shù)據(jù)閱讀裝置閱讀時,表格端邊緣1006的左上轉(zhuǎn)角位置P確定為參照點(diǎn),該裝置中如圖118(a)所示,被閱讀的文件的表格端邊緣1006與閱讀背景1007能夠彼此識別開。
根據(jù)第二方法,當(dāng)文件的圖象數(shù)據(jù)要由圖象掃描器或者傳真機(jī)閱讀時,由于閱讀背景1009與被閱讀的表格端邊緣1008如在圖118(b)所見不能彼此識別開,故在對象文件表格上打印一個參照標(biāo)號R供預(yù)先閱讀,并且從圖象數(shù)據(jù)抽取這個標(biāo)號R且被判斷為參照點(diǎn)。
第二個方法優(yōu)點(diǎn)在于,由于參照點(diǎn)位置是作為參照標(biāo)號R預(yù)先打印的,故即使在閱讀裝置中文件所放置的位置移動,參照點(diǎn)也能夠被穩(wěn)定地抽取。
然而,在文件處理裝置等中,即使通過上述方法精確抽取了參照點(diǎn),如果圖象數(shù)據(jù)的閱讀方向不是正確的方向,則圖象數(shù)據(jù)的字符說明方向也不是正確的方向,因而字符識別處理不能進(jìn)行。
例如如圖119中所示,如果其上的信息是在水平方向所述一轉(zhuǎn)帳票具(文件C)1010在錯誤的方向(在圖119中垂直方向)上被閱讀,則這樣所閱讀的轉(zhuǎn)帳票具1010的圖象數(shù)據(jù)是在錯誤的方向上顯示的,如顯示單元1002-3上參照符號1010A所示。
因而,由文件處理裝置等進(jìn)行字符識別處理時,操作者必須目視觀察顯示單元1002-3以判斷文件閱讀方向是否正確,并當(dāng)文件的閱讀方向不正確時,從鍵盤1002-1輸入指令以便旋轉(zhuǎn)所閱讀的文件圖象數(shù)據(jù)90度或180度,使得實(shí)現(xiàn)圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理,以便文件的圖象數(shù)據(jù)能夠在如顯示單元1002-3上由參照符號1010B標(biāo)記的正確方向上顯示。
順便來說,在通常向銀行帳戶匯付工作中,操作者輸入在文件上所述的帳戶號碼、姓名、款的數(shù)量等等信息,該文件是來自文件處理裝置1000的鍵盤1002-1等的一個匯付請求票具。這時,操作者目視地交替觀察文件及顯示單元1002-3以便進(jìn)行輸入操作。
然而,在文件和顯示單元1002-3目視被交替地觀察以便按這樣的方式進(jìn)行輸入操作的地方,由于涉及到操作者眼睛很多的運(yùn)動,故問題在于目視可辨別性變壞并且有可能文件的條目和屏幕上的條目之間的匹配被搞錯。
于是,又一種文件處理裝置已經(jīng)提出,其中文件由圖象數(shù)據(jù)閱讀裝置1001等閱讀,并且所閱讀的圖象數(shù)據(jù)本身與圖象數(shù)據(jù)字符識別的結(jié)果一同顯示在顯示單元1002-3上。
使用文件處理裝置,由于文件上描述的信息能夠直接在顯示單元1002-3上目視觀察到,故可減少眼睛的運(yùn)動,因而在對字符識別結(jié)果的確認(rèn)和修改時能夠減少字符識別的結(jié)果和圖象數(shù)據(jù)之間匹配的差錯。
同時,近年來,通過使用客戶機(jī)-服務(wù)器系統(tǒng)的服務(wù)器以高速度集中方式進(jìn)行數(shù)據(jù)處理的方法主要在金融機(jī)構(gòu)等采用。
例如,提出把對于金融機(jī)構(gòu)的每一個銀行(業(yè)務(wù)辦公室)安裝的客戶機(jī)與安裝在地區(qū)中心的服務(wù)器通過專線或交換線互聯(lián)而構(gòu)成一個客戶機(jī)-服務(wù)器系統(tǒng),并通過服務(wù)器集中進(jìn)行文件處理以達(dá)到業(yè)務(wù)效率的提高。
在以這種方式由服務(wù)器進(jìn)行集中處理的地方,由于集中到服務(wù)器上的數(shù)據(jù)量變得非常大,操作者不能通過服務(wù)器進(jìn)行文件處理。于是,必須設(shè)計(jì)其中無需操作者的干預(yù)服務(wù)器能夠自動地進(jìn)行文件處理的系統(tǒng)。
于是,如果其上描述文件上的ID號碼的文件如上述參照圖117所述的文件標(biāo)識處理用于剛才所說明的客戶機(jī)-服務(wù)器系統(tǒng),則服務(wù)器能夠自動地辨別文件的類型并進(jìn)行文件的閱讀處理。
繼而,還是使用客戶機(jī)-服務(wù)器系統(tǒng),其中由圖象數(shù)據(jù)閱讀裝置所閱讀的圖象數(shù)據(jù)本身與圖象數(shù)據(jù)字符識別的結(jié)果一同顯示在顯示單元上,文件上所描述的信息能夠直接在顯示單元上目視觀察,從而在對字符識別的結(jié)果的確認(rèn)與修改時降低了字符識別的結(jié)果與圖象數(shù)據(jù)之間的匹配出錯。
可是,在處理參照圖117的上述這種文件的技術(shù)中,可被閱讀的文件媒體只是對于文件處理裝置專用而生產(chǎn)的文件媒體,并且由于不能使用通常所使用的普通文件,這時問題就在于,專用的文件必須重新生成。
同時,在如上參照圖118(a)所述這種第一參照點(diǎn)抽取方法中,由于在表格上文件的打印位置必須以高精確度進(jìn)行管理,其中涉及例如由字處理器等打印的文件,如果人工放置表格,則在很多情形下每當(dāng)進(jìn)行打印時打印位置會變化。因而,這時問題就在于,設(shè)置表格端邊緣1006的左上轉(zhuǎn)角位置P為參照點(diǎn)是不適宜的。
進(jìn)而,在如上參照圖118(b)所述這種第二參照點(diǎn)抽取方法中,供閱讀的對象文件是其上參照標(biāo)記R被打印的專用文件,并且問題在于,涉及其上沒有打印參照標(biāo)記R的普通文件的地方,則參照點(diǎn)不能被抽取。
進(jìn)而,又使用在用于文件閱讀器等其中文件中表的特別點(diǎn)用作為參照點(diǎn)的識別技術(shù)中所采用的技術(shù),則問題在于,供識別的對象文件的布局在一定程度上不能規(guī)定,該技術(shù)在功能上不是很有效的。
應(yīng)當(dāng)注意,即使在作為其圖象先前已經(jīng)被閱讀過的同一文件再次閱讀,由于在圖象閱讀時灰塵、模糊等原因,會發(fā)現(xiàn)所閱讀的圖象與先前的不同了,并在這種情形下,相同的參照點(diǎn)可能有時不能被抽取。
而且,為了使得服務(wù)器能夠自動地進(jìn)行參照圖119所示的圖象數(shù)據(jù)的那種旋轉(zhuǎn)校正處理,這必須進(jìn)行實(shí)際閱讀的圖象數(shù)據(jù)的字符識別,并然后依靠是否能夠進(jìn)行字符識別而進(jìn)行辨別,看文件的閱讀方向是對還是錯,而這里它問題就在于,這大大地妨礙了工作效率的提高。
同時,在以上所描述的這種方法中,其中圖象數(shù)據(jù)字符識別的結(jié)果與圖象數(shù)據(jù)本身顯示在顯示單元上以便進(jìn)行字符識別的結(jié)果的確認(rèn)和修改,由于通過目視觀察進(jìn)行圖象數(shù)據(jù)和確認(rèn)項(xiàng)目之間匹配,于是問題在于,圖象數(shù)據(jù)包含大量的待確認(rèn)的項(xiàng)目,故錯誤的識別仍難于避免。
進(jìn)而,在圖象數(shù)據(jù)不能一次顯示在顯示單元時,顯示屏必須滾屏以便向后查看數(shù)據(jù),這種情形下,必須按動所需的鍵以便進(jìn)行滾屏操作。于是問題在于操作復(fù)雜化了。
本發(fā)明是在看到如上述的諸問題而作出的,本發(fā)明的一個目的在于提供一種數(shù)據(jù)媒體處理裝置和數(shù)據(jù)媒體處理方法,使用該裝置和方法能夠進(jìn)行通常所使用的文件并具有如私人票具等各種格式的文件處理。
本發(fā)明的另一個目的在于,提供一種數(shù)據(jù)媒體處理方法,其中即使對于在由字處理器等在普通紙上所打印的文件,也無需使用如以往技術(shù)中諸如表格端邊緣、參照標(biāo)記等而能夠從所打印的文件的圖象數(shù)據(jù)自動地進(jìn)行穩(wěn)定正常的抽取參照點(diǎn)的處理。
本發(fā)明的又一個目的在于提供一種數(shù)據(jù)媒體處理方法,按這種方法,由圖象數(shù)據(jù)閱讀裝置所閱讀的圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理能夠自動地進(jìn)行。
本發(fā)明的另一目的是為了提供一種數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法,其中強(qiáng)調(diào)圖象數(shù)據(jù)部分基于事先定義的信息而顯示以提高可識別性,并允許平穩(wěn)地進(jìn)行確認(rèn)和修改處理。
本發(fā)明的又一個目的是提供一種數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法,其中在字符單元中的字符圖象從文件單元中或者項(xiàng)目單元中的圖象數(shù)據(jù)抽取,并且對字符圖象進(jìn)行編輯,以便減少打字的運(yùn)動及比較的對象,此外允許高度精確性的確認(rèn),使得校正確認(rèn)操作所需的勞動和時間能夠顯著減少。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個方面,提供了一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其中,當(dāng)符號圖象信息沒有被成功地轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有被成功轉(zhuǎn)換的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與同不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在顯示單元上,并且不可識別符號圖象信息被強(qiáng)調(diào)顯示。。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其中,圖象中要被轉(zhuǎn)換為代碼信息的最小組成單元的符號圖象信息,相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表示的符號信息而被顯示在顯示單元上。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理裝置,包括圖象讀取部分,用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分,用于識別由所述圖象讀取部分讀取的圖象中的符號圖象信息,并將該符號圖象信息轉(zhuǎn)換為對應(yīng)的代碼信息;顯示單元,用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;以及讀取符號圖象顯示控制部分,用于當(dāng)符號圖象信息沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息時,使其轉(zhuǎn)換沒有成功進(jìn)行的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與同不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在所述顯示單元上;所述讀取符號圖象顯示控制部分包含用于強(qiáng)調(diào)顯示不可識別符號圖象信息的強(qiáng)調(diào)顯示裝置。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理裝置,包括圖象讀取部分,用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分,用于識別由所述圖象讀取部分讀取的圖象中的符號圖象信息,并將該符號圖象信息轉(zhuǎn)換為對應(yīng)的代碼信息;顯示單元,用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;最小組成單元符號圖象信息抽取部分,用于對于每一條最小組成單元的符號圖象信息,抽取圖象中要被轉(zhuǎn)換為代碼信息的最小組成單元的符號圖象信息;以及最小組成單元符號圖象顯示控制部分,用于使由所述最小組成單元符號圖象信息抽取部分所抽取的最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表示的符號信息而被顯示。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其中,當(dāng)符號圖象信息沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有成功轉(zhuǎn)換的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與同不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在顯示單元上,并且不可識別符號圖象信息被強(qiáng)調(diào)顯示,并且然后,當(dāng)對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù)由數(shù)據(jù)輸入裝置的操作輸入時,已經(jīng)被強(qiáng)調(diào)顯示的不可識別符號圖象信息按不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示該不可識別符號圖象信息已經(jīng)被修改,并且基于正確答案數(shù)據(jù)修改該不可識別符號圖象信息。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其中,要被轉(zhuǎn)換為代碼信息的多條同類最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表示的符號信息而被顯示,同時僅強(qiáng)調(diào)顯示所期望的一條符號圖象信息,并且然后,當(dāng)對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù)由數(shù)據(jù)輸入裝置的操作輸入時,已經(jīng)被強(qiáng)調(diào)顯示的該一條符號圖象信息按不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示該一條符號圖象信息已經(jīng)被修改,并且基于正確答案數(shù)據(jù)修改對應(yīng)于該一條符號圖象信息的錯誤識別的信息。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理裝置,包括圖象讀取部分,用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分,用于識別由所述圖象讀取部分讀取的圖象中的符號圖象信息,并將該符號圖象信息轉(zhuǎn)換為對應(yīng)的代碼信息;顯示單元,用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;讀取符號圖象顯示控制部分,用于當(dāng)符號圖象信息沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息時,使其轉(zhuǎn)換沒有成功進(jìn)行的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與同不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在所述顯示單元上;強(qiáng)調(diào)顯示裝置,用于使不可識別符號圖象信息被強(qiáng)調(diào)顯示;數(shù)據(jù)輸入裝置,用于輸入對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù);強(qiáng)調(diào)顯示改變裝置,用于當(dāng)正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置的操作輸入時,使到此時已經(jīng)被強(qiáng)調(diào)顯示的不可識別符號圖象信息以與表示修改完成的強(qiáng)調(diào)方式不同的強(qiáng)調(diào)方式被顯示;以及識別信息修改裝置,用于當(dāng)正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置的操作輸入時,基于該正確答案數(shù)據(jù)修改不可識別符號圖象信息。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理裝置,包括圖象讀取部分,用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分,用于識別由所述圖象讀取部分讀取的圖象中的符號圖象信息,并將該符號圖象信息轉(zhuǎn)換為對應(yīng)的代碼信息;顯示單元,用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;最小組成單元符號圖象信息抽取部分,用于對于每一條最小組成單元的符號圖象信息,抽取圖象中要被轉(zhuǎn)換為代碼信息的最小組成單元的符號圖象信息;最小組成單元符號圖象顯示控制部分,用于使由所述最小組成單元符號圖象信息抽取部分所抽取的多條最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表示的符號信息而被顯示;強(qiáng)調(diào)顯示裝置,用于使得僅強(qiáng)調(diào)顯示所期望的一條符號圖象信息;數(shù)據(jù)輸入裝置,用于輸入對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù);強(qiáng)調(diào)顯示改變裝置,用于當(dāng)正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置的操作輸入時,使到此時已經(jīng)被強(qiáng)調(diào)顯示的一條符號圖象信息以與表示修改完成的強(qiáng)調(diào)方式不同的強(qiáng)調(diào)方式被顯示;以及識別信息修改裝置,用于當(dāng)正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置的操作輸入時,基于該正確答案數(shù)據(jù)修改對應(yīng)于該一條符號圖象信息的錯誤識別的信息。
根據(jù)本發(fā)明,基于從其信息是以任意格式描述的數(shù)據(jù)媒體而讀出的圖象,用于識別信息的數(shù)據(jù)媒體處理裝置的特征在于,它包括以下裝置用于從所閱讀的圖象數(shù)據(jù)抽取包括格式在內(nèi)的對于數(shù)據(jù)媒體唯有的特征并從這些特征規(guī)定被識別的信息所出現(xiàn)的位置的裝置,以及用于識別由該裝置所規(guī)定的位置處的圖象數(shù)據(jù)以便鑒別信息的圖象識別裝置。
特別地,根據(jù)本發(fā)明,基于從其信息是以任意格式描述的數(shù)據(jù)媒體而讀出的圖象,用于識別信息的數(shù)據(jù)媒體處理裝置的特征在于,它包括布局分析處理部分用于抽取所閱讀的圖象布局的特征以分析布局的結(jié)構(gòu)并基于所抽取的特征邏輯上表示該布局;備選布局存儲部分,其中存儲備選的的布局;以及布局的對比檢驗(yàn)處理部分,用于使用由布局分析處理部分所抽取的布局特征作為限制檢索項(xiàng)從備選布局存儲部分檢索備選布局以便對比檢驗(yàn)是否出現(xiàn)了一個相符的備選布局。
其中,數(shù)據(jù)媒體處理裝置可進(jìn)而包括一個分析預(yù)處理部分,用于對圖象進(jìn)行所需的預(yù)處理,這在由布局分析處理部分進(jìn)行布局分析處理之前形成一個識別對象。
或者布局分析處理部分至少能夠包含一個布局特征抽取部分用于抽取圖象的布局特征,以及一個布局分析部分用于基于由布局特征抽取部分所抽取的布局特征分析布局的結(jié)構(gòu)。
進(jìn)而,布局分析處理部分的構(gòu)成使得,它首先抽取布局的特征,然后抽取布局的邏輯原點(diǎn),且布局對比檢驗(yàn)處理部分的構(gòu)成使得,它參照由布局分析處理部分所抽取的邏輯原點(diǎn)對比檢驗(yàn)是否有相符的備選布局。
這里,布局具有由劃線所形成的表格結(jié)構(gòu),布局特征抽取部分包括用于抽取布局的劃線的劃線抽取部分,而布局分析部分包括基于由布局特征抽取部分所抽取的布局的劃線用于分析由劃線形成的表格結(jié)構(gòu)的表格結(jié)構(gòu)分析部分。同時,布局具有不包含劃線的無劃線表格結(jié)構(gòu),布局特征抽取部分包括一個條目數(shù)據(jù)抽取部分用于抽取布局的條目數(shù)據(jù),同時布局分析部分包括表格結(jié)構(gòu)分析部分用于基于由布局特征抽取部分所抽取的布局的條目數(shù)據(jù)分析無劃線的表格結(jié)構(gòu)。
進(jìn)而,布局分析處理部分能夠這樣構(gòu)造,使得它判斷圖象中的標(biāo)題區(qū)域,識別標(biāo)題區(qū)域中的的標(biāo)題條目并判斷對應(yīng)的條目數(shù)據(jù)。
或者,數(shù)據(jù)媒體處理裝置能夠這樣構(gòu)造,使得備選布局存儲部分的構(gòu)造存儲壓縮的備選布局的信息,而布局對比檢驗(yàn)處理部分壓縮處理由布局分析處理部分所抽取的布局特征,并應(yīng)用布局的壓縮特征作為限制檢索項(xiàng)從備選布局存儲部分檢索壓縮的備選布局,以便對比檢驗(yàn)是否出現(xiàn)了相符的備選布局。
又或者,備選布局存儲部分可這樣構(gòu)造使得通過學(xué)習(xí)能夠更新備選布局的信息。
在具有上述結(jié)構(gòu)的本發(fā)明數(shù)據(jù)媒體處理裝置中,在信息出現(xiàn)位置鑒定步驟,從所閱讀的圖象抽取包括格式在內(nèi)的數(shù)據(jù)媒體唯有的特征,并從特征,鑒定待識別的信息所出現(xiàn)的位置,并在圖象識別步驟中,識別在前面的步驟鑒定的位置處的圖象,以便由此鑒別信息,基于從其上信息以任意格式描述的數(shù)據(jù)媒體所閱讀的圖象實(shí)現(xiàn)信息的識別。
特別,在本發(fā)明數(shù)據(jù)媒體處理裝置中,在布局分析處理步驟中,抽取讀取的圖象布局的特征以便分析布局的結(jié)構(gòu),并基于所抽取的特征邏輯上表示該布局。并在布局對比檢驗(yàn)步驟中,應(yīng)用在布局分析處理步驟中所抽取的布局特征作為限制檢索項(xiàng)而檢索存儲在備選布局存儲部分的備選布局,以便由此對比檢驗(yàn)符合的備選布局是否出現(xiàn),以便基于從其上信息以任意格式描述的數(shù)據(jù)媒體讀取的圖象實(shí)現(xiàn)信息的識別。
在布局分析處理步驟中,可以首先抽取布局的特征并然后抽取布局邏輯原點(diǎn),并在布局對比檢驗(yàn)處理步驟中,可參照在布局分析處理步驟中所抽取的邏輯原點(diǎn)鑒別信息。
進(jìn)而,在布局分析處理步驟中,可鑒別讀取的圖象布局是否在預(yù)定的方向,并可基于鑒別的結(jié)果轉(zhuǎn)換讀取的圖象數(shù)據(jù)使得布局能夠在預(yù)定的方向。讀取的圖象數(shù)據(jù)的轉(zhuǎn)換處理可以是那種旋轉(zhuǎn)布局的處理。
這里,布局具有由劃線形成的表格結(jié)構(gòu),在布局分析處理步驟中,抽取布局的劃線,并基于所抽取的布局劃線分析由劃線形成的表格結(jié)構(gòu)。同時,在布局不包含劃線的無劃線表格結(jié)構(gòu)之處,在布局分析處理步驟中,抽取布局的項(xiàng)目數(shù)據(jù),并基于所抽取的布局的項(xiàng)目數(shù)據(jù)分析無劃線的表格結(jié)構(gòu)。
進(jìn)而,在布局分析處理步驟中,能夠確定圖象中的標(biāo)題區(qū)域,并能夠確認(rèn)標(biāo)題區(qū)域中的標(biāo)題項(xiàng)目信息及確定對應(yīng)的項(xiàng)目數(shù)據(jù)。
在壓縮的備選布局信息存儲到備選布局存儲部分之處,在布局對比檢驗(yàn)處理步驟中,對在布局分析處理步驟中所抽取的布局特征進(jìn)行壓縮處理,并應(yīng)用先前步驟中壓縮的布局特征作為限制檢索項(xiàng)從備選布局存儲部分檢索壓縮的備選布局,并然后,基于檢索的結(jié)果,對比檢驗(yàn)是否出現(xiàn)了符合的備選布局。
進(jìn)而,在備選布局中信息由備選布局存儲部分通過學(xué)習(xí)而更新。
于是,本發(fā)明的數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于,由于日常產(chǎn)生的各種文件或圖象被電子化自動地分析,使用通常的輸入系統(tǒng)(OCR輸入系統(tǒng),數(shù)據(jù)輸入系統(tǒng)等等)的輸入工作的效率能夠大大提高。
進(jìn)而,由于布局記錄信息是基于任何類型的任意文件布局識別的結(jié)果而產(chǎn)生的,并通過學(xué)習(xí)寄存到備選布局存儲部分,因而具有相同布局的文件鑒別能夠自動地進(jìn)行,于是可以降低用于產(chǎn)生專用文件所需的勞務(wù)和費(fèi)用。進(jìn)而,由于輸入能夠在學(xué)習(xí)之后立即進(jìn)行,故達(dá)到基于本裝置的系統(tǒng)的安裝周期能夠減小。
進(jìn)而,由于文件的圖象數(shù)據(jù)是正常分析處理的,故對于不同于專用的昂貴的OCR文件的文件自動識別處理,其裁剪錯誤或打印錯誤很少。
根據(jù)本發(fā)明,用于基于從其上的信息以任意格式描述的數(shù)據(jù)媒體讀取的圖象識別信息的數(shù)據(jù)媒體處理方法的特征在于,它包括抽取格式的邏輯原點(diǎn)的邏輯原點(diǎn)抽取步驟,參照在前面步驟抽取的邏輯原點(diǎn)抽取包括格式在內(nèi)的數(shù)據(jù)媒體唯有的特征,并從特征確定待識別的信息出現(xiàn)的位置的信息出現(xiàn)位置確定步驟,以及當(dāng)在前面的步驟確定的位置處的圖象要被識別時,參照在邏輯原點(diǎn)抽取步驟所抽取的邏輯原點(diǎn),鑒別信息的圖象識別步驟。
在邏輯原點(diǎn)抽取步驟,不僅能夠抽取格式的邏輯原點(diǎn),而且能夠抽取向邏輯原點(diǎn)提供輔助信息的邏輯原點(diǎn)輔助坐標(biāo)信息,并在圖象識別步驟,參照邏輯原點(diǎn)和邏輯原點(diǎn)輔助坐標(biāo)信息能夠鑒別信息。
布局具有由劃線形成的表格結(jié)構(gòu)之處,抽取有關(guān)定義表格結(jié)構(gòu)的轉(zhuǎn)角之一的坐標(biāo)信息作為格式的邏輯原點(diǎn)。
這時,可以抽取有關(guān)其余轉(zhuǎn)角的坐標(biāo)信息作為邏輯原點(diǎn)輔助坐標(biāo)信息。
特別,在布局具有由劃線形成的表格結(jié)構(gòu)之處,抽取具有最小X坐標(biāo)和最小Y坐標(biāo)定義表格結(jié)構(gòu)轉(zhuǎn)角之一的坐標(biāo)信息作為格式的邏輯原點(diǎn)。
這時,可以抽取具有最大X坐標(biāo)和最小Y坐標(biāo)的另一個轉(zhuǎn)角的坐標(biāo)信息,以及具有最小X坐標(biāo)和最大Y坐標(biāo)的又一個轉(zhuǎn)角的坐標(biāo)信息以及具有最大X坐標(biāo)和最大Y坐標(biāo)的另外一個轉(zhuǎn)角的坐標(biāo)信息,作為邏輯原點(diǎn)輔助坐標(biāo)信息。
另一方面,在布局具有不包含劃線的無劃線表格結(jié)構(gòu)之處,抽取關(guān)于該布局中的條目數(shù)據(jù)的外接矩形轉(zhuǎn)角之一的坐標(biāo)信息作為該格式的邏輯原點(diǎn)。
這時,可以抽取關(guān)于該外接(circumscribed)矩形其它轉(zhuǎn)角的坐標(biāo)信息作為邏輯原點(diǎn)輔助坐標(biāo)信息。
更特別地,在布局具有不包括劃線的無劃線表格結(jié)構(gòu)之處,抽取具有最小X坐標(biāo)和最小Y坐標(biāo)的外接矩形轉(zhuǎn)角之一的坐標(biāo)信息作為該格式的邏輯原點(diǎn)。
這時,可以抽取具有最大X坐標(biāo)和最小Y坐標(biāo)的外接矩形的另一個轉(zhuǎn)角的坐標(biāo)信息,以及具有最小X坐標(biāo)和最大Y坐標(biāo)的另一個轉(zhuǎn)角的坐標(biāo)信息以及具有最大X坐標(biāo)和最大Y坐標(biāo)的另一個轉(zhuǎn)角的坐標(biāo)信息,作為邏輯原點(diǎn)輔助坐標(biāo)信息。
于是,本發(fā)明的數(shù)據(jù)媒體處理方法的優(yōu)點(diǎn)在于,由于處理對象文件的布局分析是基于劃線條目或者從圖象數(shù)據(jù)抽取的條目數(shù)據(jù)進(jìn)行的,并且由布局分析所得的區(qū)域轉(zhuǎn)角的坐標(biāo)之中預(yù)定的坐標(biāo)被確定為邏輯原點(diǎn)坐標(biāo)和校正坐標(biāo),故邏輯原點(diǎn)坐標(biāo)和校正坐標(biāo)甚至可從普通文件而不是其上印制了參照標(biāo)記等專用文件的圖象數(shù)據(jù)抽取。
進(jìn)而,由于在抽取邏輯原點(diǎn)時同時抽取校正坐標(biāo)作為邏輯原點(diǎn)的附加信息,故在布局對比檢驗(yàn)處理中邏輯原點(diǎn)的對比檢驗(yàn)時能夠可靠地檢測到相一致。
特別,由于邏輯原點(diǎn)的對比檢驗(yàn)是通過與所考慮的邏輯原點(diǎn)坐標(biāo)相關(guān)的校正坐標(biāo)的坐標(biāo)對比檢驗(yàn)進(jìn)行的,故即使在圖象閱讀時位置發(fā)生變動,布局中的對比檢驗(yàn)處理也可以可靠地進(jìn)行。
進(jìn)而,根據(jù)本發(fā)明,用于基于從其上信息以任意格式描述的數(shù)據(jù)媒體所讀取的圖象而識別信息的數(shù)據(jù)媒體處理方法的特征在于,包含格式在內(nèi)的數(shù)據(jù)媒體唯有的特征從讀取的圖象數(shù)據(jù)中抽取并然后壓縮處理,并使用該壓縮處理的特征作為限制檢索項(xiàng)檢索存儲在存儲部分的參照壓縮信息以便對比檢驗(yàn)是否存在相符的參照壓縮信息,然后基于對比檢驗(yàn)的結(jié)果識別特定位置處的圖象以便鑒別該信息。
這里在對特征壓縮處理之前,可以對讀取的圖象數(shù)據(jù)進(jìn)行偏斜校正或變形校正處理。
而且,在對特征進(jìn)行壓縮處理時,參照構(gòu)成讀取的圖象數(shù)據(jù)的劃線項(xiàng)目的水平劃線對其上側(cè)劃線共同具有相同劃線的那些劃線項(xiàng)目進(jìn)行Y坐標(biāo)單一化處理,并參照構(gòu)成讀取的圖象數(shù)據(jù)的劃線項(xiàng)目的垂直劃線對其左側(cè)劃線共同具有相同劃線的那些劃線項(xiàng)目進(jìn)行X坐標(biāo)單一化處理。
或者,在對特征進(jìn)行壓縮處理時,轉(zhuǎn)換特征為對應(yīng)的比特流,并對該比特流進(jìn)行壓縮處理并作為矩陣表格。
于是,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理方法的優(yōu)點(diǎn)在于,由于對作為布局成分之一的劃線項(xiàng)目的布局進(jìn)行壓縮處理并表示為矩陣表格,并在布局對比檢驗(yàn)時對這種矩陣表格彼此進(jìn)行對比檢驗(yàn),故布局對比檢驗(yàn)處理速度不依賴劃線項(xiàng)目數(shù)目而僅對對比檢驗(yàn)的一個對象的布局?jǐn)?shù)目成正比線性地增加,并且大量文件的布局的對比檢驗(yàn)處理可以高速進(jìn)行。
進(jìn)而,由于在其上劃線項(xiàng)目的布局被反射的位表格的壓縮處理之前,對讀取的圖象數(shù)據(jù)進(jìn)行偏斜校正及變形校正處理,并對劃線項(xiàng)目進(jìn)行Y坐標(biāo)單一化處理及X坐標(biāo)單一化處理,故在閱讀圖象數(shù)據(jù)時發(fā)生的布局變化可被吸收。
進(jìn)而,根據(jù)本發(fā)明,用于基于從其上信息以任意格式描述的數(shù)據(jù)媒體所讀取的圖象而識別信息的數(shù)據(jù)媒體處理方法其特征在于,它包括記錄步驟,在該步驟進(jìn)行抽取所讀取的圖象的布局的特征,分析布局的結(jié)構(gòu),在一顯示單元上顯示所分析的布局結(jié)構(gòu),對顯示的布局結(jié)構(gòu)設(shè)定預(yù)定的特征數(shù)據(jù)識別區(qū)域,通過外部輸入裝置輸入對應(yīng)于該區(qū)域中的標(biāo)志信息的代碼數(shù)據(jù),從特征數(shù)據(jù)識別區(qū)域和代碼數(shù)據(jù)產(chǎn)生區(qū)域特征數(shù)據(jù),并在與所分析的布局結(jié)構(gòu)的鏈接關(guān)系中寄存區(qū)域特征數(shù)據(jù);并包括對比檢驗(yàn)步驟,在該步驟進(jìn)行抽取分別讀取的圖象的特征,分析布局結(jié)構(gòu),檢索作為參照數(shù)據(jù)的在記錄步驟所記錄的區(qū)域特征數(shù)據(jù)及布局結(jié)構(gòu),并對比檢驗(yàn)是否存在相符的區(qū)域特征數(shù)據(jù)。
這里,當(dāng)對應(yīng)于區(qū)域中的標(biāo)志信息的代碼數(shù)據(jù)在記錄步驟輸入時,輸入具有對應(yīng)于標(biāo)志信息的有效性代碼數(shù)據(jù)。
于是,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理方法,由于擴(kuò)展了類似于字符識別裝置的區(qū)域圖象特征抽取機(jī)制和特征對比檢驗(yàn)機(jī)制,并與布局識別系統(tǒng)相結(jié)合,故指定區(qū)域中任意圖形的圖象的識別處理能夠與布局識別處理以聯(lián)鎖關(guān)系進(jìn)行。
進(jìn)而,由于對比檢驗(yàn)對象的區(qū)域特征數(shù)據(jù)記錄在與布局信息的鏈接關(guān)系中,故對比檢驗(yàn)的對象能夠限制在一個布局的單元,因而不需要進(jìn)行普通字符識別處理所需的大量的那種對比檢驗(yàn)處理,故能夠達(dá)到高識別速率。
此外,如果橡膠密封、簽字等項(xiàng)目指定為特征數(shù)據(jù)識別項(xiàng)目,那么這種由普通字符識別所不能識別的橡膠密封、簽字等項(xiàng)目則是能夠識別的,并且對應(yīng)的代碼數(shù)據(jù)能夠作為橡膠密封、簽字等項(xiàng)目的特征區(qū)域識別的結(jié)果而獲得。
進(jìn)而,根據(jù)本發(fā)明,用于基于從其上信息以任意格式描述的數(shù)據(jù)媒體所讀取的圖象而識別信息的數(shù)據(jù)媒體處理方法的特征在于,它包括布局分析處理步驟,該步驟抽取對讀取的圖象布局特征,分析該布局的結(jié)構(gòu),基于所抽取的特征判定圖象中的標(biāo)題區(qū)域,識別標(biāo)題區(qū)域中的標(biāo)題項(xiàng)目信息,判定對應(yīng)的項(xiàng)目數(shù)據(jù)并邏輯表示該布局;并包括布局對比檢驗(yàn)處理步驟,該步驟使用在布局分析處理步驟中抽取的布局特征作為檢索限制項(xiàng)檢索存儲在備選布局存儲部分中的備選布局,以便對比檢驗(yàn)是否存在相符的備選布局。
該數(shù)據(jù)媒體處理方法特征還在于,布局分析處理步驟包括標(biāo)題位置備選判定步驟,該步驟基于布局結(jié)構(gòu)分析的結(jié)果判定標(biāo)題位置備選;以及標(biāo)題項(xiàng)目的對比檢驗(yàn)步驟,該步驟與前面步驟所判定的標(biāo)題位置備選進(jìn)行對比檢驗(yàn)標(biāo)題區(qū)域中的標(biāo)題項(xiàng)目信息。
在標(biāo)題項(xiàng)目對比檢驗(yàn)步驟中進(jìn)行標(biāo)題項(xiàng)目的對比檢驗(yàn)時,在對要對比檢驗(yàn)的圖象數(shù)據(jù)進(jìn)行規(guī)范化處理之后進(jìn)行標(biāo)題項(xiàng)目的對比檢驗(yàn)處理。
于是,本發(fā)明的數(shù)據(jù)媒體處理方法的優(yōu)點(diǎn)在于,由于通過從分析對象的文件圖象劃線項(xiàng)目結(jié)構(gòu)進(jìn)行檢索和對比檢驗(yàn)標(biāo)題位置的標(biāo)題分析處理而進(jìn)行布局識別處理,能夠標(biāo)識標(biāo)題項(xiàng)目和對應(yīng)于標(biāo)題項(xiàng)目的項(xiàng)目數(shù)據(jù),以便自動地分析對應(yīng)于文件上描述的標(biāo)題的項(xiàng)目信息,故無需進(jìn)行標(biāo)題項(xiàng)目的字符識別處理即可立即進(jìn)行項(xiàng)目數(shù)據(jù)的字符識別。
同時,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象數(shù)據(jù)閱讀裝置,用于閱讀作為具有以其一種格式描述的所需信息的數(shù)據(jù)媒體的文件的圖象數(shù)據(jù),一個圖象數(shù)據(jù)存儲器,用于存儲由圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù),文件標(biāo)識信息抽取裝置,用于從存儲在圖象數(shù)據(jù)存儲器中的文件的圖象數(shù)據(jù)抽取文件上所描述的所需的文件標(biāo)識信息,一個文件標(biāo)識字典,用于寄存由文件標(biāo)識信息抽取裝置作為對特定文件的文件標(biāo)識信息而抽取的文件標(biāo)識信息,參照裝置,用于參照由圖象數(shù)據(jù)閱讀裝置所讀取并存儲在圖象數(shù)據(jù)存儲器的任意文件的圖象數(shù)據(jù)以便檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標(biāo)識字典中的文件標(biāo)識信息,以及文件標(biāo)識裝置,用于基于由參照裝置參照的結(jié)果標(biāo)識該任意文件是否為特定的文件。
進(jìn)而,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象數(shù)據(jù)閱讀裝置用于閱讀作為具有以其一種格式描述的所需信息的數(shù)據(jù)媒體的文件的圖象數(shù)據(jù),一個圖象數(shù)據(jù)存儲器和一個文件存儲器用于存儲由圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù),文件標(biāo)識信息抽取裝置用于從存儲在圖象數(shù)據(jù)存儲器中的文件的圖象數(shù)據(jù)抽取文件上所描述的所需的文件標(biāo)識信息,一個文件標(biāo)識字典用于寄存由文件標(biāo)識信息抽取裝置作為對特定文件的文件標(biāo)識信息而抽取的文件標(biāo)識信息,驗(yàn)證裝置用于讀出存儲在文件存儲器中的特定文件的圖象數(shù)據(jù)并驗(yàn)證該特定文件的圖象數(shù)據(jù)是否包含寄存在文件標(biāo)識字典中所寄存的文件標(biāo)識信息,鑒別裝置用于基于由驗(yàn)證裝置驗(yàn)證的結(jié)果鑒別是否能夠識別該特定的文件,參照裝置用于參照由圖象數(shù)據(jù)閱讀裝置所讀取并存儲在圖象數(shù)據(jù)存儲器的任意文件的圖象數(shù)據(jù)以便檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標(biāo)識字典中的文件標(biāo)識信息,以及文件標(biāo)識裝置用于基于由參照裝置參照的結(jié)果標(biāo)識該任意文件是否為特定的文件。
這里,參照裝置也可作為驗(yàn)證裝置,而文件標(biāo)識裝置也可作為鑒別裝置。
在具有上述結(jié)構(gòu)的本發(fā)明數(shù)據(jù)媒體處理裝置中,從作為由圖象數(shù)據(jù)閱讀裝置所閱讀并具有以其格式描述的所需信息的數(shù)據(jù)媒體的特定文件的圖象數(shù)據(jù),抽取該特定文件上所描述的文件標(biāo)識信息,并將該文件標(biāo)識信息寄存到文件標(biāo)識字典,并然后借助于圖象數(shù)據(jù)閱讀裝置讀取任意文件的圖象數(shù)據(jù),之后參照任意文件的圖象數(shù)據(jù)以檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標(biāo)識字典中的文件標(biāo)識信息,以便標(biāo)識任意文件是否為特定文件。
進(jìn)而,在本發(fā)明的數(shù)據(jù)媒體處理裝置中,從作為由圖象數(shù)據(jù)閱讀裝置所閱讀并具有以其上格式描述的所需信息的數(shù)據(jù)媒體的特定文件的圖象數(shù)據(jù),抽取該特定文件上所描述的文件標(biāo)識信息,并將該文件標(biāo)識信息寄存到文件標(biāo)識字典,并然后再次輸入特定文件的圖象數(shù)據(jù),并驗(yàn)證輸入的特定文件圖象數(shù)據(jù)是否包含寄存在文件標(biāo)識字典中的文件標(biāo)識信息以鑒別特定文件的識別是否為可能,此后當(dāng)能夠識別特定文件時,借助于圖象數(shù)據(jù)閱讀裝置讀取任意文件的圖象數(shù)據(jù),并參照任意文件的圖象數(shù)據(jù)以檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標(biāo)識字典中的文件標(biāo)識信息,以便標(biāo)識任意文件是否為特定文件。
這里當(dāng)文件標(biāo)識信息要寄存到文件標(biāo)識字典中時,由圖象數(shù)據(jù)閱讀裝置所閱讀的特定文件的圖象數(shù)據(jù)能夠顯示在顯示單元上,并且能夠從所顯示的特定文件的圖象數(shù)據(jù)中指定包含特定文件上所描述的文件標(biāo)識信息的圖象的區(qū)域,以便抽取文件標(biāo)識信息。
或者當(dāng)文件標(biāo)識信息要寄存到文件標(biāo)識字典中時,能夠從由圖象數(shù)據(jù)閱讀裝置所讀取的特定文件圖象數(shù)據(jù)自動地抽取在特定文件上所描述的特定文件標(biāo)識信息。
又或者,當(dāng)文件標(biāo)識信息要寄存到文件標(biāo)識字典中時,在文件標(biāo)識信息寄存到文件標(biāo)識字典中時,能夠存儲在寄存時所讀取的特定文件的圖象數(shù)據(jù),并且當(dāng)文件標(biāo)識信息要寄存到文件標(biāo)識字典中時,存儲的特定文件圖象數(shù)據(jù)能夠再次作為特定文件的圖象數(shù)據(jù)輸入,并能夠驗(yàn)證輸入的特定文件的圖象數(shù)據(jù)是否包含寄存在文件標(biāo)識字典中的文件標(biāo)識信息,以便鑒別該特定文件是否能夠識別。
于是本發(fā)明的數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于,由于即使多個類型的要由圖象閱讀裝置閱讀的文件以混合狀態(tài)出現(xiàn),也能夠自動地驗(yàn)證其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置讀取的文件的類型,于是操作者無需熟悉每一文件的定義而能夠進(jìn)行操作,因而預(yù)期能夠改進(jìn)工作效率。該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)還在于,用于標(biāo)識文件自身的ID號碼等不必在文件上描述,并可以使用普通的文件,因而該數(shù)據(jù)媒體處理裝置能夠自然適用于現(xiàn)有的系統(tǒng)。
進(jìn)而,由于能夠驗(yàn)證由操作者指定的文件標(biāo)識信息是否正確,故該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于,文件的錯誤鑒別能夠完全避免,因而改進(jìn)了裝置的可靠性。
此外,由于參照裝置也作為驗(yàn)證裝置,而文件標(biāo)識裝置也作為鑒別裝置,故該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于能夠簡化裝置的結(jié)構(gòu)。
進(jìn)而,改根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于,它包括一個圖象閱讀部分用于閱讀具有標(biāo)志信息的數(shù)據(jù)媒體的一個圖象,一個標(biāo)志識別部分用于識別由圖象閱讀部分所閱讀的圖象中的標(biāo)志圖象信息并轉(zhuǎn)換該標(biāo)志圖象信息為對應(yīng)的代碼信息,一個顯示單元用于以所讀取的圖象的狀態(tài)顯示標(biāo)志圖象信息,以及一個所讀取的標(biāo)志圖象顯示控制部分,用于當(dāng)標(biāo)志圖象信息沒有被成功地轉(zhuǎn)換為對應(yīng)的代碼信息時,引起沒有成功進(jìn)行轉(zhuǎn)換的不能識別的標(biāo)志圖象信息以所讀取的圖象狀態(tài)同與不能識別的標(biāo)志圖象信息相關(guān)的標(biāo)志圖象信息一同顯示在顯示單元上,所讀取的標(biāo)志圖象顯示控制部分包含強(qiáng)調(diào)顯示部分用于強(qiáng)調(diào)顯示不能識別的標(biāo)志圖象信息。
這里,數(shù)據(jù)媒體處理裝置還包括一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于不能識別的標(biāo)志圖象信息的正確回答數(shù)據(jù),以及正確回答數(shù)據(jù)顯示裝置,用于當(dāng)由數(shù)據(jù)輸入裝置的操作輸入正確回答數(shù)據(jù)時,引起正確回答數(shù)據(jù)顯示在顯示單元上不同于不能識別的標(biāo)志信息顯示區(qū)域的正確回答數(shù)據(jù)顯示區(qū)域中。
該數(shù)據(jù)媒體處理裝置進(jìn)而能夠包括強(qiáng)調(diào)顯示改變裝置,用于當(dāng)由數(shù)據(jù)輸入裝置的操作輸入正確回答數(shù)據(jù)時,引起已經(jīng)按強(qiáng)調(diào)顯示的不能識別的標(biāo)志圖象信息以表明不能識別的標(biāo)志圖象信息已經(jīng)被修改的不同的強(qiáng)調(diào)方式顯示。
或者,該數(shù)據(jù)媒體處理裝置進(jìn)而能夠包括強(qiáng)調(diào)顯示改變裝置,用于當(dāng)正確回答數(shù)據(jù)由正確回答數(shù)據(jù)顯示裝置顯示在顯示單元上不同于不能識別的標(biāo)志圖象信息顯示區(qū)域的正確回答數(shù)據(jù)顯示區(qū)域中時,引起已經(jīng)按強(qiáng)調(diào)顯示的不能識別的標(biāo)志圖象信息以表明不能識別的標(biāo)志圖象信息已經(jīng)被修改的不同的強(qiáng)調(diào)方式顯示。
特別,根據(jù)本發(fā)明其中讀取具有標(biāo)志信息的數(shù)據(jù)媒體的圖象并識別讀取圖象中的標(biāo)志圖象信息且轉(zhuǎn)換為對應(yīng)的代碼信息的數(shù)據(jù)媒體處理裝置的特征在于,當(dāng)標(biāo)志圖象信息沒有成功地轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有被成功地轉(zhuǎn)換的不能識別的標(biāo)志信息以所讀取的圖象狀態(tài)與同不能識別的標(biāo)志圖象信息相關(guān)的標(biāo)志圖象信息一同顯示在顯示單元上,并且不能識別的標(biāo)志圖象信息按強(qiáng)調(diào)方式顯示,并然后當(dāng)通過數(shù)據(jù)輸入裝置的操作輸入對應(yīng)于不能識別的標(biāo)志圖象信息的正確答案數(shù)據(jù)時,已經(jīng)按強(qiáng)調(diào)方式顯示的不能識別的標(biāo)志圖象信息以不同的強(qiáng)調(diào)方式顯示,該方式表明不能識別的標(biāo)志圖象信息已經(jīng)被修改。
簡而言之,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象閱讀部分用于閱讀具有標(biāo)志信息的數(shù)據(jù)媒體圖象,一個標(biāo)志識別部分用于識別由圖象閱讀部分所讀取的圖象中的標(biāo)志圖象信息并轉(zhuǎn)換該標(biāo)志圖象信息為對應(yīng)的代碼信息,一個顯示單元用于以讀取的圖象狀態(tài)顯示標(biāo)志圖象信息,以及一個讀取的標(biāo)志圖象顯示控制部分用于當(dāng)標(biāo)志圖象信息沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息時引起沒有成功進(jìn)行轉(zhuǎn)換的不能識別的標(biāo)志圖象信息,在顯示單元上以讀取的圖象狀態(tài)與同不能識別的標(biāo)志圖象信息相關(guān)標(biāo)志圖象信息一同顯示,強(qiáng)調(diào)顯示部分用于引起不能識別的標(biāo)志圖象信息按強(qiáng)調(diào)方式顯示,一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于不能識別的圖象信息的正確答案數(shù)據(jù),強(qiáng)調(diào)顯示改變裝置用于當(dāng)正確答案數(shù)據(jù)由數(shù)據(jù)輸入裝置的操作輸入時,引起直到這時已經(jīng)被強(qiáng)調(diào)顯示的不能識別的標(biāo)志圖象信息以表明修改完成不同的強(qiáng)調(diào)方式顯示,以及識別信息修改裝置用于當(dāng)正確答案數(shù)據(jù)由數(shù)據(jù)輸入裝置的操作輸入時基于正確答案數(shù)據(jù)而修改不能識別的標(biāo)志信息。
在具有上述結(jié)構(gòu)的本發(fā)明的數(shù)據(jù)媒體處理裝置中,當(dāng)讀取了具有標(biāo)志信息數(shù)據(jù)媒體圖象并且識別讀取的圖象中標(biāo)志圖象信息且轉(zhuǎn)換為對應(yīng)的代碼信息時,如果標(biāo)志圖象信息沒有成功地轉(zhuǎn)換為對應(yīng)的代碼信息,則沒有成功被轉(zhuǎn)換的不能識別的標(biāo)志圖象信息,在顯示單元上以讀取的圖象狀態(tài)與同不能識別的標(biāo)志圖象信息相關(guān)標(biāo)志圖象信息一同顯示,并且不能識別的標(biāo)志圖象信息以強(qiáng)調(diào)方式顯示。
進(jìn)而,當(dāng)對應(yīng)于不能識別的標(biāo)志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,正確答案數(shù)據(jù)顯示在顯示單元上不同于不能識別的標(biāo)志圖象信息的顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中。
或者當(dāng)對應(yīng)于不能識別的標(biāo)志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,已經(jīng)按強(qiáng)調(diào)方式顯示的不能識別的標(biāo)志圖象信息以不同的強(qiáng)調(diào)方式顯示,該方式表明不能識別的標(biāo)志圖象信息已經(jīng)被修改。
又或者當(dāng)對應(yīng)于不能識別的標(biāo)志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,正確答案數(shù)據(jù)顯示在顯示單元上不同于不能識別的標(biāo)志圖象信息的顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中,同時已經(jīng)按強(qiáng)調(diào)方式顯示的不能識別的標(biāo)志圖象信息以不同的強(qiáng)調(diào)方式顯示,該方式表明不能識別的標(biāo)志圖象信息已經(jīng)被修改。
于是,由本發(fā)明的數(shù)據(jù)媒體處理裝置,當(dāng)標(biāo)志圖象信息沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有成功進(jìn)行轉(zhuǎn)換的不能識別的標(biāo)志圖象信息在顯示單元上以讀取的圖象狀態(tài)與同不能識別的標(biāo)志圖象信息相關(guān)標(biāo)志圖象信息一同顯示,并且不能識別的標(biāo)志圖象信息以強(qiáng)調(diào)方式顯示。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于,即使例如因?yàn)榇罅康淖冃巫址鴺?biāo)志圖象信息不能被識別,可通過參照字符串中的前面及后繼字符等的圖象信息進(jìn)行高精度的確認(rèn)操作,于是用于正確與錯誤之間的確認(rèn)操作所需的勞務(wù)和時間能夠降低。
進(jìn)而,當(dāng)對應(yīng)于不能識別的標(biāo)志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,在顯示單元上正確答案數(shù)據(jù)顯示在不同于不能識別的標(biāo)志圖象信息顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中,因而,標(biāo)志圖象信息與已經(jīng)輸入的正確答案數(shù)據(jù)可通過目視觀察再確認(rèn)。于是,該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于用于正確與錯誤之間的確認(rèn)操作所需的勞務(wù)和時間能夠降低,并可進(jìn)行高精度的確認(rèn)操作。
此外,當(dāng)對應(yīng)于不能識別的標(biāo)志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,在顯示單元上正確答案數(shù)據(jù)顯示在不同于不能識別的標(biāo)志圖象信息顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中,同時已經(jīng)按強(qiáng)調(diào)方式顯示的不能識別的標(biāo)志圖象信息以不同強(qiáng)調(diào)方式顯示,該方式表明不能識別的標(biāo)志圖象信息已經(jīng)被修改。于是,標(biāo)志圖象信息與已經(jīng)輸入的正確答案數(shù)據(jù)可通過目視觀察再確認(rèn)。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于可進(jìn)行高精度的確認(rèn)操作,并且對是否已經(jīng)進(jìn)行了對于不能識別的標(biāo)志的輸入或者修改為錯誤識別的標(biāo)志的標(biāo)識能夠容易作出,結(jié)果是改進(jìn)了目視的識別能力,防止了操作者等等雙重修改等等,此外用于正確與錯誤之間的確認(rèn)操作所需的勞務(wù)和時間能夠降低。
進(jìn)而,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象閱讀部分用于閱讀具有標(biāo)志信息的數(shù)據(jù)媒體圖象,一個標(biāo)志識別部分用于識別由圖象閱讀部分所讀取的圖象中的標(biāo)志圖象信息并轉(zhuǎn)換該標(biāo)志圖象信息為對應(yīng)的代碼信息,一個顯示單元用于以讀取的圖象狀態(tài)顯示標(biāo)志圖象信息,以及一個最小組合單元標(biāo)志圖象信息抽取部分用于抽取最小組合單元的標(biāo)志圖象信息,以便對于最小組合單元的每一片標(biāo)志圖象信息該圖象信息被轉(zhuǎn)換為圖象中的代碼信息,以及最小組合單元標(biāo)志圖象顯示控制部分,用于引起由最小組合單元標(biāo)志圖象信息抽取部分所抽取的最小組合單元標(biāo)志圖象信息,按照與通過由標(biāo)志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標(biāo)志信息的對應(yīng)關(guān)系被顯示。
這里,最小組合單元標(biāo)志圖象顯示控制部分可具有引起多片同類的最小組合單元標(biāo)志圖象信息,按照與通過由標(biāo)志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標(biāo)志信息的對應(yīng)關(guān)系被顯示,并包含強(qiáng)調(diào)顯示裝置用于引起僅是所希望的一片標(biāo)志圖象信息按強(qiáng)調(diào)方式顯示。
或者,該數(shù)據(jù)媒體處理裝置能夠進(jìn)而包括相關(guān)的標(biāo)志圖象顯示裝置用于顯示一片標(biāo)志圖象信息使之以讀取的圖象狀態(tài)與同一片標(biāo)志圖象信息相關(guān)的標(biāo)志圖象信息一同被顯示在顯示單元上,并且相關(guān)的標(biāo)志圖象顯示裝置能夠包含強(qiáng)調(diào)顯示裝置用于引起一片標(biāo)志圖象信息以強(qiáng)調(diào)方式被顯示。
又或者,該數(shù)據(jù)媒體處理裝置能夠進(jìn)而包括一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于一片標(biāo)志圖象信息的正確答案數(shù)據(jù),以及正確答案數(shù)據(jù)顯示裝置用于當(dāng)正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時引起正確答案數(shù)據(jù)被顯示在一個正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于一片標(biāo)志圖象信息和與一片標(biāo)志圖象信息相關(guān)的標(biāo)志圖象信息所顯示的區(qū)域。
另外,該數(shù)據(jù)媒體處理裝置還能夠包括一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于一片標(biāo)志圖象信息的正確答案數(shù)據(jù),以及強(qiáng)調(diào)顯示改變裝置用于當(dāng)由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時引起已經(jīng)以強(qiáng)調(diào)方式顯示的一片標(biāo)志圖象信息以不同的強(qiáng)調(diào)方式顯示,該方式表明一片標(biāo)志圖象信息已經(jīng)被修改。
或另外,該數(shù)據(jù)媒體處理裝置還能夠包括一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于一片標(biāo)志圖象信息的正確答案數(shù)據(jù),正確答案數(shù)據(jù)顯示裝置用于當(dāng)正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時引起正確答案數(shù)據(jù)被顯示在一個正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于一片標(biāo)志圖象信息和與一片標(biāo)志圖象信息相關(guān)的標(biāo)志圖象信息所顯示的區(qū)域,以及強(qiáng)調(diào)顯示改變裝置用于當(dāng)由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時引起已經(jīng)以強(qiáng)調(diào)方式顯示的一片標(biāo)志圖象信息以不同的強(qiáng)調(diào)方式顯示,該方式表明一片標(biāo)志圖象信息已經(jīng)被修改。
特別,根據(jù)本發(fā)明,其中閱讀具有標(biāo)志圖象信息的數(shù)據(jù)媒體的圖象、并識別所讀取的圖象中的標(biāo)志圖象信息、且轉(zhuǎn)換為對應(yīng)的代碼信息的媒體處理方法的特征在于要被轉(zhuǎn)換為圖象中的代碼信息的多片同類的最小組合單元標(biāo)志圖象信息,按照與通過由標(biāo)志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標(biāo)志信息的對應(yīng)關(guān)系被顯示,同時僅是所希望的一片標(biāo)志圖象信息按強(qiáng)調(diào)方式顯示,并然后當(dāng)對應(yīng)于該一片標(biāo)志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,已經(jīng)按強(qiáng)調(diào)方式顯示的一片標(biāo)志圖象信息以不同的強(qiáng)調(diào)方式被顯示,該方式表明一片標(biāo)志圖象信息已經(jīng)被修改,從而對應(yīng)于一片標(biāo)志圖象信息錯誤識別的信息基于正確答案數(shù)據(jù)被修改。
簡而言之,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象閱讀部分用于閱讀具有標(biāo)志信息的數(shù)據(jù)媒體圖象,一個標(biāo)志識別部分用于識別由圖象閱讀部分所讀取的圖象中的標(biāo)志圖象信息并轉(zhuǎn)換該標(biāo)志圖象信息為對應(yīng)的代碼信息,一個顯示單元用于以讀取的圖象狀態(tài)顯示標(biāo)志圖象信息,以及一個最小組合單元標(biāo)志圖象信息抽取部分用于抽取最小組合單元的標(biāo)志圖象信息,以便對于最小組合單元的每一片標(biāo)志圖象信息該圖象信息被轉(zhuǎn)換為圖象中的代碼信息,一個最小組合單元標(biāo)志圖象顯示控制部分,用于引起由最小組合單元標(biāo)志圖象信息抽取部分所抽取的最小組合單元的多片標(biāo)志圖象信息,按照與通過由標(biāo)志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標(biāo)志信息的對應(yīng)關(guān)系被顯示,強(qiáng)調(diào)顯示裝置用于引起僅是所希望的一片標(biāo)志圖象信息按強(qiáng)調(diào)方式顯示,一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于一片標(biāo)志圖象信息的正確答案數(shù)據(jù),強(qiáng)調(diào)顯示改變裝置用于當(dāng)由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時引起直到這時已經(jīng)以強(qiáng)調(diào)方式顯示的一片標(biāo)志圖象信息以不同的強(qiáng)調(diào)方式顯示,該方式表明一片標(biāo)志圖象信息完成修改,以及識別信息修改裝置用于當(dāng)由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時基于正確答案數(shù)據(jù)修改對應(yīng)于一片標(biāo)志圖象信息的錯誤識別信息。
在具有上述結(jié)構(gòu)的本發(fā)明的數(shù)據(jù)媒體處理裝置中,當(dāng)閱讀具有標(biāo)志信息的數(shù)據(jù)媒體圖象并識別所讀取的圖象中的標(biāo)志圖象信息且轉(zhuǎn)換為對應(yīng)的代碼信息時,在顯示單元上以對應(yīng)于由轉(zhuǎn)換標(biāo)志圖象信息所獲得的代碼信息表示的標(biāo)志信息的關(guān)系顯示要被轉(zhuǎn)換為圖象中的代碼信息最小組合單元的標(biāo)志圖象信息。
在相同類型的最小組合單元的多片標(biāo)志圖象信息以對應(yīng)于由轉(zhuǎn)換標(biāo)志圖象信息所獲得的代碼信息表示的標(biāo)志信息的關(guān)系而顯示之處,只有所希望的一片標(biāo)志圖象信息按強(qiáng)調(diào)方式顯示。
或者,所希望的一片標(biāo)志圖象信息以所讀取的圖象狀態(tài)在顯示單元上與同該標(biāo)志圖象信息片相關(guān)的標(biāo)志圖象信息一同顯示,并且該一片標(biāo)志圖象信息是按強(qiáng)調(diào)方式顯示的。
而且,當(dāng)對應(yīng)于該一片標(biāo)志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于該一片標(biāo)志圖象信息及與該一片標(biāo)志圖象信息相關(guān)的標(biāo)志圖象信息被顯示的區(qū)域。
或者,當(dāng)對應(yīng)于該一片標(biāo)志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,已經(jīng)以強(qiáng)調(diào)方式顯示的該一片標(biāo)志圖象信息按不同的強(qiáng)調(diào)方式顯示,該方式表明該一片標(biāo)志圖象信息已被修改。
又或者,當(dāng)對應(yīng)于該一片標(biāo)志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于該一片標(biāo)志圖象信息及與該一片標(biāo)志圖象信息相關(guān)的標(biāo)志圖象信息被顯示的區(qū)域,并且已經(jīng)以強(qiáng)調(diào)方式顯示的該一片標(biāo)志圖象信息按不同的強(qiáng)調(diào)方式顯示,該方式表明該一片標(biāo)志圖象信息已被修改。
于是,由本發(fā)明的數(shù)據(jù)媒體處理裝置,由于標(biāo)志顯示在允許這些標(biāo)志易于目視觀察的一個單元中,其顯示方式使得只有相同的標(biāo)志顯示在顯示單元的相同區(qū)域中,并且只有所希望的一片標(biāo)志圖象信息按強(qiáng)調(diào)方式顯示,故操作者只要參照圖象信息就能夠確認(rèn)識別的結(jié)果,而無需參照相關(guān)的圖象信息,因而減少了操作者的眼睛的運(yùn)動。而且,只有被處理的標(biāo)志圖象信息按強(qiáng)調(diào)方式顯示以便減少比較的對象數(shù)目。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于,正確與錯誤之間的確認(rèn)操作所需的勞務(wù)和時間能夠顯著降低。
而且,由于所希望的一片標(biāo)志圖象信息以所讀取的圖象狀態(tài)與該片標(biāo)志圖象信息相關(guān)標(biāo)志圖象信息一同顯示在顯示單元中,并且一片標(biāo)志圖象信息是按強(qiáng)調(diào)方式顯示的,故該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于,即使例如由于該標(biāo)志圖象信息是一個變形很大的字符而不能被識別,也能通過參照字符串中前面的及后面的字符等進(jìn)行高精度的確認(rèn)操作,因而正確與錯誤之間的確認(rèn)操作所需的勞務(wù)和時間能夠顯著降低。
進(jìn)而,當(dāng)對應(yīng)于該一片標(biāo)志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于該一片標(biāo)志圖象信息及與該一片標(biāo)志圖象信息相關(guān)的標(biāo)志圖象信息被顯示的區(qū)域,并且已經(jīng)以強(qiáng)調(diào)方式顯示的該一片標(biāo)志圖象信息按不同的強(qiáng)調(diào)方式顯示,該方式表明該一片標(biāo)志圖象信息已被修改。于是,標(biāo)志圖象信息和輸入的正確答案時間能夠通過目視觀察再確認(rèn)。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于,能夠進(jìn)行高精度的確認(rèn)操作,并且對于是否進(jìn)行了對于一個不能識別的標(biāo)志的輸入或者修改為被錯誤識別的標(biāo)志,能夠易于作出標(biāo)識,結(jié)果是改進(jìn)了目視鑒別力而防止了操作者的雙重修改等等,此外能夠降低正確與錯誤之間的確認(rèn)操作所需的勞務(wù)和時間。
而且,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象數(shù)據(jù)輸入裝置用于輸入包含多個項(xiàng)目信息在內(nèi)的數(shù)據(jù)媒體圖象數(shù)據(jù),一個具有圖象數(shù)據(jù)顯示區(qū)域和項(xiàng)目顯示區(qū)域的顯示單元,項(xiàng)目顯示區(qū)域具有多個項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分,一個顯示控制裝置用于引起通過圖象數(shù)據(jù)輸入裝置所獲得的圖象數(shù)據(jù)顯示在圖象數(shù)據(jù)顯示區(qū)域中,并用于當(dāng)對應(yīng)于所希望的項(xiàng)目之一的圖象數(shù)據(jù)部分的數(shù)據(jù)要由數(shù)據(jù)輸入裝置輸入時,引起光標(biāo)指示顯示在項(xiàng)目顯示區(qū)域中所希望的一個項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分,以及一個圖象數(shù)據(jù)局部強(qiáng)調(diào)顯示裝置用于在以下情形下引起只有所希望的項(xiàng)目對應(yīng)的圖象數(shù)據(jù)部分按強(qiáng)調(diào)方式顯示,即當(dāng)通過顯示控制裝置光標(biāo)指示顯示在項(xiàng)目顯示區(qū)域中的項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分的所希望的一個項(xiàng)目數(shù)據(jù)輸入顯示部分時,其狀態(tài)為其中包含多個項(xiàng)目信息的圖象數(shù)據(jù)顯示在顯示單元的圖象數(shù)據(jù)顯示區(qū)域中。
這里,顯示控制裝置除了圖象數(shù)據(jù)局部強(qiáng)調(diào)顯示裝置之外,能夠包含圖象數(shù)據(jù)強(qiáng)調(diào)顯示刪除裝置用于當(dāng)光標(biāo)指示通過光標(biāo)移動操作裝置移動到不同于所希望的項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分的另一個項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分時,刪除對應(yīng)于該項(xiàng)目的圖象數(shù)據(jù)部分的強(qiáng)調(diào)顯示,以及強(qiáng)調(diào)顯示轉(zhuǎn)變控制裝置用于控制圖象數(shù)據(jù)局部強(qiáng)調(diào)顯示裝置,使得響應(yīng)圖象數(shù)據(jù)強(qiáng)調(diào)顯示刪除裝置,只有對應(yīng)于不同的項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分的不同項(xiàng)目的圖象數(shù)據(jù)部分能夠按強(qiáng)調(diào)方式顯示。
或者,顯示控制裝置除了圖象數(shù)據(jù)局部強(qiáng)調(diào)顯示裝置,圖象數(shù)據(jù)強(qiáng)調(diào)顯示刪除裝置和強(qiáng)調(diào)顯示轉(zhuǎn)變控制裝置之外,能夠包含顯示屏滾屏裝置用于引起沒有在顯示單元上顯示的圖象數(shù)據(jù)部分在顯示單元上顯示。
進(jìn)而,該圖象數(shù)據(jù)局部強(qiáng)調(diào)顯示裝置能夠包含可響應(yīng)來自外部的指令而改變強(qiáng)調(diào)顯示部分的改變裝置。
在具有上述結(jié)構(gòu)的本發(fā)明的數(shù)據(jù)媒體處理裝置中,當(dāng)包含多個項(xiàng)目的信息數(shù)據(jù)媒體的圖象數(shù)據(jù)顯示在顯示單元上時,只有對應(yīng)于確定的一個項(xiàng)目的圖象數(shù)據(jù)部分被強(qiáng)調(diào)顯示。
當(dāng)對應(yīng)于所希望的一個項(xiàng)目的圖象數(shù)據(jù)部分的數(shù)據(jù)要以這樣的狀態(tài)被輸入,即其中包含多個項(xiàng)目信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)在顯示單元上的圖象數(shù)據(jù)顯示區(qū)域中顯示時,如果光標(biāo)指示顯示在顯示單元上與圖象數(shù)據(jù)顯示區(qū)域分開設(shè)置的項(xiàng)目顯示區(qū)域的所希望的一個項(xiàng)目輸入顯示區(qū)域部分,則只有對應(yīng)的所希望的項(xiàng)目圖象數(shù)據(jù)部分按強(qiáng)調(diào)顯示,并當(dāng)此后要輸入對應(yīng)于另一個項(xiàng)目的圖象數(shù)據(jù)部分的數(shù)據(jù)時,如果光標(biāo)指示從所希望的項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分移動到不同的一個項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分,則所希望項(xiàng)目的對應(yīng)的圖象數(shù)據(jù)部分的強(qiáng)調(diào)顯示被刪除,而不同的項(xiàng)目的對應(yīng)的圖象數(shù)據(jù)部分按強(qiáng)調(diào)顯示。
或者,當(dāng)對應(yīng)于顯示單元上顯示的所希望的一個項(xiàng)目的圖象數(shù)據(jù)部分的數(shù)據(jù)要按照這樣的狀態(tài)被輸入,即其中包含多個項(xiàng)目的信息在內(nèi)的數(shù)據(jù)媒體的圖象數(shù)據(jù)部分顯示在顯示單元上圖象數(shù)據(jù)顯示區(qū)域中時,如果光標(biāo)指示顯示在顯示單元上與圖象數(shù)據(jù)顯示區(qū)域分開設(shè)置的項(xiàng)目顯示區(qū)域所希望的一個項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分,那么只有對應(yīng)的所希望的項(xiàng)目的圖象數(shù)據(jù)部分按強(qiáng)調(diào)顯示,并當(dāng)此后對應(yīng)于沒有顯示在顯示單元上一個不同的項(xiàng)目的圖象數(shù)據(jù)部分的數(shù)據(jù)被輸入時,如果光標(biāo)指示從所希望的項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分移動到不同的一個項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分,則所希望的項(xiàng)目的對應(yīng)的圖象數(shù)據(jù)部分的強(qiáng)調(diào)顯示被刪除,同時進(jìn)行滾屏以便不同項(xiàng)目的圖象數(shù)據(jù)部分能夠顯示在顯示單元的圖象數(shù)據(jù)顯示區(qū)域中以便顯示在顯示單元的圖象數(shù)據(jù)顯示區(qū)域中顯示不同項(xiàng)目的圖象數(shù)據(jù)部分,并按強(qiáng)調(diào)方式顯示該不同項(xiàng)目對應(yīng)的圖象數(shù)據(jù)部分。
于是,由本發(fā)明的數(shù)據(jù)媒體處理裝置,如果光標(biāo)指示顯示在數(shù)據(jù)將向其輸入的項(xiàng)目數(shù)據(jù)輸入顯示區(qū)域部分之一,則被同時參照的一個項(xiàng)目的圖象數(shù)據(jù)部分按強(qiáng)調(diào)方式顯示。于是,即使一個操作者先從顯示單元移開其目光然后又觀察顯示單元,也能夠防止該操作者觀察到錯誤的項(xiàng)目。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于,防止了在參照圖象數(shù)據(jù)時匹配中的錯誤識別,由此提高了目視鑒別力,能夠防止輸入操作所需的勞務(wù)和時間,同時防止誤輸入。
進(jìn)而,當(dāng)一個要被參照的項(xiàng)目的圖象數(shù)據(jù)沒有在顯示單元上顯示時,能夠響應(yīng)強(qiáng)調(diào)顯示部分的運(yùn)動進(jìn)行自動滾屏。于是,該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于,例如能夠減少按壓鍵盤之類費(fèi)時的操作。
此外,還能夠使得操作者改變強(qiáng)調(diào)顯示部分的類型或區(qū)域。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點(diǎn)在于它能夠根據(jù)用途而使用。
圖1是表示根據(jù)本發(fā)明的一個實(shí)施例數(shù)據(jù)媒體處理裝置的一般結(jié)構(gòu)的功能框圖;圖2到圖4是表示根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置處理過程的圖示;圖5是表示本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置布局分析處理部分的結(jié)構(gòu)的功能框圖;圖6是表示根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置文件處理過程的圖示;
圖7是表示根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置的一個圖象閱讀器的簡略透視圖;圖8和圖9是功能框圖,其中標(biāo)注出由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理;圖10和圖11是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所處理的文件例子的圖示;圖12和圖13是表示根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置的圖象數(shù)據(jù)旋轉(zhuǎn)校正處理的流程圖;圖14是表示根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置的原點(diǎn)抽取和對比檢驗(yàn)處理應(yīng)用的處理過程圖示;圖15(a)和15(b),圖16與圖17是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所處理的文件例子的圖示;圖18是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的邏輯原點(diǎn)抽取處理的流程圖;圖19是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的邏輯原點(diǎn)校正坐標(biāo)的相符鑒別的圖示;圖20(a)和20(b)是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所處理的文件例子的圖示;圖21是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的邏輯原點(diǎn)對比檢驗(yàn)處理的流程圖;圖22是處理過程示意圖,其中標(biāo)注了由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的矩陣對比檢驗(yàn)處理;圖23是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的矩陣表產(chǎn)生處理的圖示;圖24(a)和24(b)是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的矩陣表格產(chǎn)生處理時對圖象數(shù)據(jù)坐標(biāo)規(guī)范化處理的圖示;圖25到圖27是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的矩陣表產(chǎn)生處理時位表格產(chǎn)生處理的圖示;
圖28是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所產(chǎn)生的矩陣表格的圖示;圖29和圖30是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的矩陣表格對比檢驗(yàn)處理的流程圖;圖31(a)和31(b)是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的矩陣表格對比檢驗(yàn)處理時矩陣信息的圖示;圖32是處理過程示意圖,其中標(biāo)注出由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的特征數(shù)據(jù)識別處理;圖33和圖34是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的字符數(shù)據(jù)識別處理的圖示;圖35和圖36是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所處理的交換一般轉(zhuǎn)帳文件的圖示;圖37是處理過程示意圖,其中標(biāo)注出由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理;圖38是表示用于由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理中所使用的劃線項(xiàng)目結(jié)構(gòu)信息的圖示;圖39是表示用于由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理中所使用的劃線項(xiàng)目結(jié)構(gòu)信息的劃線屬性的圖示;圖40和圖41(a)到圖41(d)是表示用于由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理中所使用的劃線項(xiàng)目結(jié)構(gòu)信息表格的圖示;圖42、圖43(a)及圖43(b)是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理中使用的對比檢驗(yàn)位置搜尋規(guī)則的圖示;圖44是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理流程圖;圖45是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理結(jié)果的一例的圖示;
圖46(a)到圖46(c),圖47(a)到圖47(c)及圖48(a)到48(c)是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理時標(biāo)題的例子的圖示;圖49是表示在由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理時規(guī)范化處理的一例的圖示;圖50是表示用于由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理中所應(yīng)用的項(xiàng)目標(biāo)題詞典的圖示;圖51(a)及圖51(b)是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理時標(biāo)題項(xiàng)目數(shù)據(jù)的對比檢驗(yàn)結(jié)果的一例的圖示;圖52(a)到圖52(c)是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析處理時基于標(biāo)題校正規(guī)則的對比檢驗(yàn)結(jié)果的校正的圖示;圖53是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析的流程圖;圖54(a)到圖54(h)及55(a)到圖55(f)是表示由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析中使用的標(biāo)題部分劃線項(xiàng)目與數(shù)據(jù)部分劃線項(xiàng)目之間的連接規(guī)則的圖示;圖56是表示在由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析時對應(yīng)于標(biāo)題項(xiàng)目的項(xiàng)目數(shù)據(jù)位置判定結(jié)果分析的圖示;圖57和圖58是表示在由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析時不同信息的鏈接關(guān)系的的圖示;圖59(a)到圖59(b)是表示在由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析時鏈接到功能項(xiàng)目的項(xiàng)目數(shù)據(jù)的圖示;圖60(a)到圖60(f)是表示在由根據(jù)本發(fā)明的該實(shí)施例數(shù)據(jù)媒體處理裝置所進(jìn)行的標(biāo)題分析時款數(shù)項(xiàng)目鏈接處理的圖示;圖61是表示根據(jù)本發(fā)明的該實(shí)施例圖象數(shù)據(jù)顯示裝置的結(jié)構(gòu)的示意圖;圖62和圖63是表示根據(jù)本發(fā)明的該實(shí)施例圖象數(shù)據(jù)顯示裝置的功能框圖;圖64到圖66是表示根據(jù)本發(fā)明的該實(shí)施例圖象數(shù)據(jù)顯示裝置的操作的流程圖;圖67是表示根據(jù)本發(fā)明的該實(shí)施例圖象數(shù)據(jù)顯示裝置的顯示單元的一個顯示一例的圖示;圖68是表示由根據(jù)本發(fā)明的該實(shí)施例圖象數(shù)據(jù)顯示裝置所產(chǎn)生的相關(guān)信息的圖示;圖69是表示由根據(jù)本發(fā)明的該實(shí)施例圖象數(shù)據(jù)顯示裝置所產(chǎn)生的強(qiáng)調(diào)信息的圖示;圖70到78是表示根據(jù)本發(fā)明的該實(shí)施例圖象數(shù)據(jù)顯示裝置的顯示單元的顯示的例子的圖示;圖79是表示由根據(jù)本發(fā)明的該實(shí)施例圖象數(shù)據(jù)顯示裝置產(chǎn)生的強(qiáng)調(diào)信息的圖示;圖80到圖85是表示根據(jù)本發(fā)明的該實(shí)施例圖象數(shù)據(jù)顯示裝置的顯示單元的顯示例子的圖示;圖86是表示根據(jù)本發(fā)明的該實(shí)施例閱讀標(biāo)志顯示-識別信息修改裝置的結(jié)構(gòu)的示意圖;圖87到圖89是根據(jù)本發(fā)明的該實(shí)施例閱讀標(biāo)志顯示-識別信息修改裝置的功能框圖;圖90到圖97是根據(jù)本發(fā)明的該實(shí)施例閱讀標(biāo)志顯示-識別信息修改裝置的操作的流程圖;圖98是表示由根據(jù)本發(fā)明的該實(shí)施例閱讀標(biāo)志顯示-識別信息修改裝置所產(chǎn)生的整面圖象的圖示;圖99是表示由根據(jù)本發(fā)明的該實(shí)施例閱讀標(biāo)志顯示-識別信息修改裝置所產(chǎn)生的識別字符信息的圖示;圖100是表示由根據(jù)本發(fā)明的該實(shí)施例閱讀標(biāo)志顯示-識別信息修改裝置所產(chǎn)生的相關(guān)信息的圖示;
圖101到圖104是表示根據(jù)本發(fā)明的該實(shí)施例閱讀標(biāo)志顯示-識別信息修改裝置的顯示例子的圖示;圖105是表示根據(jù)本發(fā)明的該實(shí)施例第一變形的文件標(biāo)識裝置的框圖;圖106是一控制框圖,其中標(biāo)注出根據(jù)本發(fā)明的該實(shí)施例第一變形的文件標(biāo)識裝置的操作;圖107是表示根據(jù)本發(fā)明的該實(shí)施例第一變形的文件標(biāo)識裝置在登記步驟操作時操作的流程圖;圖108是表示根據(jù)本發(fā)明的該實(shí)施例第一變形的文件標(biāo)識裝置在登記步驟操作時操作的操作圖示;圖109是一控制框圖,其中標(biāo)注出根據(jù)本發(fā)明的該實(shí)施例第一變形的文件標(biāo)識裝置在登記步驟操作時的操作;圖110是表示根據(jù)本發(fā)明的該實(shí)施例第一變形的文件標(biāo)識裝置在登記步驟操作時操作的操作的流程圖;圖111是一控制框圖,其中標(biāo)注出根據(jù)本發(fā)明的該實(shí)施例第一變形的文件標(biāo)識裝置在登記步驟操作時的操作;圖112是表示根據(jù)本發(fā)明的該實(shí)施例第一變形的文件標(biāo)識裝置在應(yīng)用步驟操作時操作的操作的流程圖;圖113是表示根據(jù)本發(fā)明的該實(shí)施例第二變形的文件標(biāo)識裝置的控制框圖;圖114是表示根據(jù)本發(fā)明的該實(shí)施例第二變形的文件標(biāo)識裝置的操作流程圖;圖115是表示一文件識別裝置結(jié)構(gòu)的示意圖;圖116是表示該文件識別裝置操作的圖示;圖117是表示對該文件識別裝置操作的變形的圖示;圖118(a)和118(b)是表示圖象數(shù)據(jù)參照點(diǎn)抽取方法的圖示;以及圖119是表示圖象數(shù)據(jù)旋轉(zhuǎn)校正處理的圖示。
具體實(shí)施例方式
(a)本發(fā)明的實(shí)施例的說明(a1)數(shù)據(jù)媒體處理裝置的說明圖1是表示根據(jù)本發(fā)明的一個實(shí)施例數(shù)據(jù)媒體處理裝置的一般結(jié)構(gòu)的功能框圖。
這里,圖1中所示的數(shù)據(jù)媒體處理裝置30實(shí)現(xiàn)基于從具有諸如個人票據(jù)等各種格式的文件媒體(文件)所讀取的圖象數(shù)據(jù)(圖象)的信息識別。
數(shù)據(jù)媒體處理裝置30具體由例如由安裝在金融機(jī)構(gòu)的每一分支辦公室(業(yè)務(wù)辦公室)的客戶機(jī)(CL)35和安裝在地區(qū)中心并通過交換線路36等連接到客戶機(jī)35的服務(wù)器(SV)39組成,并且各個業(yè)務(wù)辦公室的文件處理由地區(qū)中心的服務(wù)器39集中進(jìn)行。
特別地,該數(shù)據(jù)媒體處理裝置30不僅能夠?qū)τ谠撐募幚硌b置產(chǎn)生的專用文件進(jìn)行處理,而且通過分析文件的圖象數(shù)據(jù)布局以識別對象文件的格式而能夠處理其上信息以任意格式輸入的文件,以便基于文件格式識別的結(jié)果處理和實(shí)現(xiàn)字符的識別。
數(shù)據(jù)媒體處理裝置30如圖1中所示在功能上包括一個布局識別處理模塊16,一個字符識別處理模塊17和一個操作者確認(rèn)/校正處理模塊18。
布局識別處理模塊16實(shí)現(xiàn)對由一個圖象數(shù)據(jù)閱讀裝置所讀取的圖象數(shù)據(jù)19的布局識別處理,并包含一個分析預(yù)處理部分1,一個布局分析處理部分2,一個布局對比檢驗(yàn)處理部分3及一個布局編輯處理部分4。
分析預(yù)處理部分1產(chǎn)生一低密度圖象用于在識別對象的圖象數(shù)據(jù)19格式轉(zhuǎn)換之后的分析處理,以便減少布局的變化因素以提高分析的精確度,并除去圖象數(shù)據(jù)上在分析處理時造成精確度惡化的因素的灰塵等。
布局分析處理部分2參照分析詞典13從讀取的圖象數(shù)據(jù)抽取作為布局特征的劃線項(xiàng)目及項(xiàng)目數(shù)據(jù),基于這樣抽取的劃線項(xiàng)目及項(xiàng)目數(shù)據(jù)而分析布局的結(jié)構(gòu)并邏輯上表示該布局。
簡而言之,布局分析處理部分2功能上是作為從所讀取的圖象數(shù)據(jù)抽取文件媒體特有的特征的裝置,并基于該特征確定待識別的信息所出現(xiàn)的位置。
更具體來說,布局分析處理部分2分析識別對象圖象的布局以抽取作為布局特征而構(gòu)成該布局的各種成分(劃線項(xiàng)目和項(xiàng)目數(shù)據(jù)),并從這樣抽取的布局特征產(chǎn)生對該布局粗略限制項(xiàng)的該布局的關(guān)鍵信息,以便在隨后階段由布局對比檢驗(yàn)處理部分3進(jìn)行布局對比檢驗(yàn)處理時檢索已登記的布局信息。
如圖5中所示,布局分析處理部分2至少包含用于抽取圖象布局特征的布局特征抽取部分2A,及用于基于由布局特征抽取部分2A所抽取的布局特征而分析布局結(jié)構(gòu)的布局分析部分2B。
布局特征抽取部分2A包括一個劃線抽取部分2C和一個項(xiàng)目數(shù)據(jù)抽取部分2D,而布局分析部分2B包括一個表格結(jié)構(gòu)分析部分2E。
在布局具有由劃線所形成的表格結(jié)構(gòu)之處,作為由布局的劃線所形成的最小矩形的劃線項(xiàng)目是由劃線抽取部分2C抽取的,并且由劃線項(xiàng)目形成的表格結(jié)構(gòu)由表格結(jié)構(gòu)分析部分2E基于所抽取的劃線項(xiàng)目進(jìn)行分析。
另一方面,在布局具有沒有劃線的無劃線表格結(jié)構(gòu)之處,布局的項(xiàng)目數(shù)據(jù)由項(xiàng)目數(shù)據(jù)抽取部分2D抽取,并且無劃線的表格結(jié)構(gòu)由表格結(jié)構(gòu)分析部分2E基于這樣抽取的布局項(xiàng)目數(shù)據(jù)進(jìn)行分析。
而且,在抽取了劃線項(xiàng)目和項(xiàng)目數(shù)據(jù)之后,布局分析處理部分2抽取布局的邏輯原點(diǎn)(logic origin)。
特別地,布局分析處理部分2通過標(biāo)號處理實(shí)現(xiàn)(2-1)標(biāo)號圖象的產(chǎn)生,用于對比檢驗(yàn)的(2-2)文件圖象的邏輯原點(diǎn)和模糊級信息的抽取,(2-3)劃線項(xiàng)目的抽取和由(上述的)劃線項(xiàng)目所形成的表格結(jié)構(gòu)的分析,(2-4)項(xiàng)目數(shù)據(jù)的抽取和沒有劃線出現(xiàn)(上述的)項(xiàng)目表格結(jié)構(gòu)的分析,以及(2-5)標(biāo)題區(qū)域的判定和標(biāo)題項(xiàng)目的識別以及對應(yīng)的項(xiàng)目數(shù)據(jù)的判定(標(biāo)題分析處理)。
要注意的是,由(2-1)中標(biāo)號處理所進(jìn)行的標(biāo)號圖象的產(chǎn)生處理是從所輸入的圖象數(shù)據(jù)(二進(jìn)制圖象數(shù)據(jù))計(jì)算連接成分(彼此連接的二進(jìn)制圖象成分),以產(chǎn)生具有適用于各個連接成分的標(biāo)號的標(biāo)號圖象。例如這一標(biāo)號處理由“連接區(qū)域抽取裝置和方法”(日本專利公開申請No.Heisei 08-55219)得知。
同時,在(2-3)中的劃線項(xiàng)目的抽取處理是從由劃線所圍繞的字符數(shù)據(jù)、圖形形式等等抽取劃線部分并對劃線部分與數(shù)據(jù)部分彼此分開的處理。例如該劃線項(xiàng)目的抽取處理可由“圖象抽取系統(tǒng)”(日本專利公開申請No.Heisei 06-309498)得知。
進(jìn)而,在(2-5)中的標(biāo)題分析處理判定一個圖象中的標(biāo)題區(qū)(標(biāo)題項(xiàng)目),識別標(biāo)題區(qū)域中的標(biāo)題項(xiàng)目信息并判定對應(yīng)的項(xiàng)目數(shù)據(jù)。
特別地,在本實(shí)施例中,布局分析處理部分2標(biāo)識標(biāo)題項(xiàng)目及對應(yīng)于標(biāo)題項(xiàng)目的項(xiàng)目數(shù)據(jù),使得項(xiàng)目數(shù)據(jù)的字符識別能夠在沒有由字符識別處理模塊17進(jìn)行標(biāo)題項(xiàng)目的字符識別處理情形下立即進(jìn)行。
以上所說明的處理(2-2)將在(a2)原點(diǎn)抽取與對比檢驗(yàn)處理的說明中詳細(xì)描述,而處理(2-5)將在(a6)標(biāo)題分析處理的說明中詳細(xì)描述。
順便而言,布局對比檢驗(yàn)處理部分3的功能是作為圖象識別裝置用于使用由布局分析處理部分2作為限制檢索項(xiàng)所抽取的布局特征(劃線項(xiàng)目和項(xiàng)目數(shù)據(jù)),而從布局?jǐn)?shù)據(jù)庫(布局DB)14檢索備選布局,并對它們進(jìn)行對比檢驗(yàn)看是否存在一相符的備選布局,以便識別在由布局分析處理部分2所確定的一個位置處的一個圖象而鑒別在所確定的位置處的信息。
布局DB 14是在其中存儲備選布局信息的備選布局存儲部分,并在本實(shí)施例中,存儲壓縮的備選布局信息作為備選布局信息。要注意的是,這里的布局信息壓縮處理將在以下詳述。
布局DB 14還具有布局校正信息用于校正由布局分析處理部分2所進(jìn)行的布局分析結(jié)果的校正,布局分析的結(jié)果是使用布局校正信息由將在以下說明的布局編輯處理部分4校正的,使得隨后的處理能夠以高精度進(jìn)行。
而且,布局DB 14的內(nèi)容是基于由布局識別處理模塊16或操作者確認(rèn)/校正處理模塊18通過學(xué)習(xí)備選布局信息被更新的,因而消除了由操作者等向布局DB 14進(jìn)行備選布局信息記錄操作的必要性,達(dá)到了操作的簡化。
布局對比檢驗(yàn)處理部分3參照由布局分析處理部分2所抽取的邏輯原點(diǎn)實(shí)現(xiàn)對比檢驗(yàn),以檢驗(yàn)是否存在相符的備選布局。
特別地,布局對比檢驗(yàn)處理部分3應(yīng)用由布局分析處理部分2所產(chǎn)生的布局關(guān)鍵信息檢索并對比檢驗(yàn)存儲在布局DB 14中的布局信息以獲得相符的布局信息。
而且,當(dāng)上述的對比檢驗(yàn)處理部分3實(shí)現(xiàn)布局的檢索和對比檢驗(yàn)時,它首先使用布局關(guān)鍵信息作為粗略限制項(xiàng)的檢索限制項(xiàng)檢索布局DB 14,并然后對于作為檢索的結(jié)果所獲得的多個備選布局進(jìn)行詳細(xì)的對比檢驗(yàn)以判定相符的布局。
更特別地,在與備選布局進(jìn)行詳細(xì)對比檢驗(yàn)處理時,布局對比檢驗(yàn)處理部分3限制項(xiàng)的細(xì)節(jié)程度的升序進(jìn)行(3-1)劃線項(xiàng)目位矩陣的對比檢驗(yàn),(3-2)劃線項(xiàng)目位置與劃線項(xiàng)目屬性的細(xì)化對比檢驗(yàn),(3-3)項(xiàng)目數(shù)據(jù)位置的對比檢驗(yàn),(3-4)標(biāo)題位置與標(biāo)題內(nèi)容的對比檢驗(yàn)以及(3-5)區(qū)域圖象(唯一圖象)的特征數(shù)據(jù)的對比檢驗(yàn)。
在這里劃線項(xiàng)目位矩陣的對比檢驗(yàn)(3-1)是通過對由布局分析處理部分2所抽取的布局特征的壓縮處理,并應(yīng)用已壓縮處理的布局特征作為檢索限制項(xiàng)從布局DB 14檢索壓縮的備選布局而進(jìn)行的對比檢驗(yàn)。
特別地,在本實(shí)施例中,布局DB 14具有存儲在其中的壓縮的備選布局信息,并且布局對比檢驗(yàn)處理部分3產(chǎn)生壓縮處理的布局信息并相互對比檢驗(yàn)壓縮的布局信息,以達(dá)到高速布局對比檢驗(yàn)處理。
注意,處理(3-1)將在(a4)矩陣對比檢驗(yàn)處理說明中詳細(xì)描述,處理(3-2)到(3-4)將在(a6)標(biāo)題分析處理說明中詳細(xì)描述,以及處理(3-5)將在(b)本發(fā)明的實(shí)施例變型的說明中詳細(xì)描述。
進(jìn)而,在布局DB 14中作為由布局對比檢驗(yàn)處理部分3所進(jìn)行的布局DB 14的檢索和對比檢驗(yàn)的結(jié)果存在相符的布局之處,基于如上所述從布局DB 14所得的布局校正信息布局編輯處理部分4校正布局分析的結(jié)果,并然后輸出該校正的布局信息作為布局識別結(jié)果20。
要注意,其中使用了布局校正信息的校正的內(nèi)容是標(biāo)題位置及標(biāo)題內(nèi)容的校正,以及鏈接到標(biāo)題的項(xiàng)目數(shù)據(jù)位置與項(xiàng)目數(shù)據(jù)屬性的校正。
另一方面,在布局DB 14中作為由布局對比檢驗(yàn)處理部分3所進(jìn)行的布局DB 14的檢索和對比檢驗(yàn)的結(jié)果不存在相符的布局之處,布局編輯處理部分4判定布局分析的結(jié)果作為新的布局并作為其本來那樣的布局信息(布局識別結(jié)果)輸出該布局。
順便而言,字符識別處理模塊17對來自布局識別處理模塊16的布局識別結(jié)果20進(jìn)行字符識別處理,并包含一個字符識別定義產(chǎn)生部分5,字符識別處理部分6以及知識處理部分7。
字符識別定義產(chǎn)生部分5基于作為布局識別結(jié)果20輸出的布局信息而產(chǎn)生一個字符識別定義(臨時定義)21,該定義定義了要由字符識別處理部分6使用的字符識別對象項(xiàng)目數(shù)據(jù)位置和項(xiàng)目數(shù)據(jù)屬性。
雖然布局識別結(jié)果20的項(xiàng)目數(shù)據(jù)信息是以對分析對象圖象的左上角的絕對坐標(biāo)輸出的,但是分析對象圖象左上角由于在圖象閱讀時形式位置的變化不一定與固定的位置相符。
因而,每當(dāng)與分析對象圖象一致時字符識別定義產(chǎn)生部分5動態(tài)地產(chǎn)生字符識別定義21。
字符識別處理部分6使用由字符識別定義產(chǎn)生部分5從布局信息所產(chǎn)生的字符識別定義21,對于字符識別對象的圖象數(shù)據(jù)進(jìn)行字符識別處理,并取得識別結(jié)果的代碼數(shù)據(jù)。
知識處理部分7參照在其中記錄了用于識別結(jié)果的校正信息的知識數(shù)據(jù)庫(知識DB)15校正字符識別處理部分6的識別結(jié)果代碼數(shù)據(jù),并輸出校正的代碼數(shù)據(jù)作為字符識別結(jié)果22。
操作者確認(rèn)/校正處理模塊18是這樣一個模塊,其中布局識別結(jié)果20和字符識別結(jié)果22顯示在終端單元(例如圖1中的一個客戶機(jī)10),并由操作者進(jìn)行對圖象數(shù)據(jù)處理結(jié)果的確認(rèn)和修改處理,該模塊還包含一個布局屏幕顯示處理部分8及字符識別結(jié)果屏幕顯示處理部分9。
基于布局識別結(jié)果20的布局信息,布局屏幕顯示處理部分8顯示識別對象圖象及諸如標(biāo)題位置和標(biāo)題內(nèi)容,對應(yīng)的項(xiàng)目位置等分析的結(jié)果,以便允許操作者對布局識別結(jié)果20和字符識別結(jié)果22進(jìn)行修改和確認(rèn)。
本實(shí)施例中,如同以下在(a7)對識別字符的確認(rèn)和修改處理中所詳述那樣,擴(kuò)大了普通的修改和確認(rèn)處理使得在對應(yīng)的文件圖象上的識別結(jié)果與標(biāo)題內(nèi)容的代碼數(shù)據(jù)和/或項(xiàng)目數(shù)據(jù)按類似的形式顯示在客戶機(jī)10的顯示單元上,以便能夠?qū)Σ季中畔⑦M(jìn)行修改和確認(rèn)處理。
字符識別結(jié)果屏幕顯示處理部分9,在屏幕上與布局屏幕顯示處理部分8的顯示一致地顯示對應(yīng)于字符識別對象圖象的識別項(xiàng)目的字符識別結(jié)果的代碼數(shù)據(jù)。
而且,在客戶機(jī)10中,由一操作者確認(rèn)對應(yīng)于顯示單元上所顯示的識別對象圖象的布局識別結(jié)果20和/或字符識別結(jié)果22,并根據(jù)需要對布局識別結(jié)果20和字符識別結(jié)果22進(jìn)行修改。
要注意,圖1所示的數(shù)據(jù)媒體處理裝置30除了布局識別除了模塊16之外還包括字符識別處理模塊17,和上述的操作者確認(rèn)/校正處理模塊18,布局登記信息產(chǎn)生處理部分11和知識登記信息產(chǎn)生處理部分12。
布局登記信息產(chǎn)生處理部分11把由操作者修改的內(nèi)容作為校正數(shù)據(jù)加到布局識別結(jié)果20布局信息中(這由圖4中的學(xué)習(xí)布局信息28表示,該圖將在以下說明),以產(chǎn)生布局校正信息被存儲到布局DB 14中。要注意,這樣產(chǎn)生的布局校正信息在其校正內(nèi)容被鑒別之后由布局DB 14進(jìn)行學(xué)習(xí)并登記到其中。
而且,布局登記信息產(chǎn)生處理部分11把由操作者修改的內(nèi)容作為校正數(shù)據(jù)加到布局識別結(jié)果20的布局信息中,以產(chǎn)生分析詞典學(xué)習(xí)信息24(這在以下將說明的圖4中由登記布局信息29表示)。這樣產(chǎn)生的分析詞典學(xué)習(xí)信息24在其校正內(nèi)容被鑒別之后由分析詞典13進(jìn)行學(xué)習(xí)并登記到其中。
知識登記信息產(chǎn)生處理部分12把由操作者修改的內(nèi)容作為校正數(shù)據(jù)加到字符識別結(jié)果22的代碼數(shù)據(jù)中以產(chǎn)生用于知識DB 15的知識學(xué)習(xí)信息23,并且這樣產(chǎn)生的學(xué)習(xí)數(shù)據(jù)由知識DB 15學(xué)習(xí)并登記到其中。
在具有上述結(jié)構(gòu)的本發(fā)明該實(shí)施例的數(shù)據(jù)媒體處理裝置30中,當(dāng)閱讀具有任意格式的文件的圖象數(shù)據(jù)19時,對圖象數(shù)據(jù)19的布局進(jìn)行分析以識別對象文件的格式供處理之用,并且文件的字符識別基于文件的格式識別的結(jié)果進(jìn)行。
然后,布局識別結(jié)果20和字符識別結(jié)果22由操作者確認(rèn)并根據(jù)需要進(jìn)行修改。
以下將參照圖2到圖4說明數(shù)據(jù)媒體處理裝置30的操作。
首先,將參照圖2說明當(dāng)用于處理的對象文件的布局是一新出現(xiàn)的布局時的處理。
首先,在布局識別處理模塊16的分析預(yù)處理部分1中,對用于處理的對象文件的圖象數(shù)據(jù)進(jìn)行分析預(yù)處理(步驟A1)。
然后,布局分析處理部分2從供識別的對象圖象抽取作為布局成分的劃線項(xiàng)目和項(xiàng)目數(shù)據(jù),并參照分析詞典13作為分析結(jié)果輸出布局中的標(biāo)題項(xiàng)目位置和對應(yīng)于該項(xiàng)目內(nèi)容的項(xiàng)目數(shù)據(jù)位置(步驟A2)。
這里,步驟A2的布局分析處理步驟是一學(xué)習(xí)出現(xiàn)位置確定步驟,其中從讀取的圖象數(shù)據(jù)抽取文件媒體所特有的特征,并基于這些特征確定待識別的信息的位置,并抽取讀取的圖象布局的特征,分析布局的結(jié)構(gòu)并以抽取的特征邏輯表示該布局。
而且,布局分析處理步驟A2包括在抽取了布局的劃線項(xiàng)目和項(xiàng)目數(shù)據(jù)之后抽取布局的邏輯原點(diǎn)的步驟,并進(jìn)而包括鑒別讀取的圖象布局是否具有預(yù)定方向的步驟,以及基于該步驟鑒別的結(jié)果轉(zhuǎn)換讀取的圖象數(shù)據(jù)的步驟,使得布局能夠具有預(yù)定的方向。要注意,對于讀取的圖象數(shù)據(jù)的轉(zhuǎn)換處理是使得布局旋轉(zhuǎn)的處理,并且這一處理將在出現(xiàn)的以下(a3)圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理的說明中詳細(xì)說明。
這里,在布局具有由劃線所形成的表格結(jié)構(gòu)之處,布局分析處理步驟A2包括從圖象數(shù)據(jù)抽取劃線項(xiàng)目的步驟,和基于在該步驟所抽取的劃線項(xiàng)目分析由劃線所形成的表格結(jié)構(gòu)的步驟。
另一方面,在布局具有沒有劃線的無劃線表格結(jié)構(gòu)之處,布局分析處理步驟A2包括從圖象數(shù)據(jù)抽取項(xiàng)目數(shù)據(jù)的步驟,和基于在該步驟所抽取的項(xiàng)目數(shù)據(jù)分析無劃線表格結(jié)構(gòu)的步驟。
進(jìn)而,布局分析處理步驟A2包括判定圖象中標(biāo)題區(qū)域、識別標(biāo)題區(qū)域中的標(biāo)題項(xiàng)目信息并判定對應(yīng)的項(xiàng)目數(shù)據(jù)的步驟。
然后,布局對比檢驗(yàn)處理部分3使用抽取的布局成分(劃線項(xiàng)目和項(xiàng)目數(shù)據(jù))作為檢索項(xiàng)檢索布局DB 14。然而,由于供處理的對象文件是新文件,對應(yīng)的布局在布局DB 14中不存在,因而不能取得備選布局信息和布局校正信息(步驟A3)。
這里,在步驟A3中的布局對比檢驗(yàn)處理步驟是一圖象識別步驟,其中識別在步驟A2所確定的位置處的圖象數(shù)據(jù)以判定在所確定的位置處的信息,并使用在步驟A2所抽取的布局的特征作為檢索限制項(xiàng)而檢索存儲在布局DB 14中的備選布局,以實(shí)現(xiàn)對比檢驗(yàn)看是否存在相符的備選布局。
布局對比檢驗(yàn)處理步驟A3包括參照在步驟A2所抽取的邏輯原點(diǎn)鑒別信息的步驟,并進(jìn)而包括壓縮處理在步驟A2中所抽取的布局特征的壓縮處理步驟,使用在該步驟壓縮的布局特征作為限制檢索項(xiàng)從布局DB 14檢索壓縮的備選布局的步驟,以及基于在該步驟的檢索結(jié)果進(jìn)行對比檢驗(yàn)以檢驗(yàn)是否存在相符的備選布局的步驟。
進(jìn)而,布局編輯處理部分4以無校正校正信息狀態(tài)(步驟A4)產(chǎn)生一布局識別結(jié)果20,由于在步驟A3沒有得到作為對比檢驗(yàn)一個結(jié)果的備選布局信息和布局校正信息。
字符識別處理模塊17的字符識別識別定義產(chǎn)生部分5基于在步驟A4所產(chǎn)生的布局識別結(jié)果20產(chǎn)生一字符識別定義21(圖4的步驟A14)。
此后,字符識別處理部分6使用在步驟A14所產(chǎn)生的字符識別定義21進(jìn)行字符識別對象的項(xiàng)目數(shù)據(jù)的字符識別,以便取得識別結(jié)果的代碼數(shù)據(jù)(圖4的步驟A15)。
進(jìn)而,參照在其中記錄了用于識別結(jié)果的校正信息的知識DB15,知識處理部分7校正在步驟A15取得的識別結(jié)果代碼數(shù)據(jù),以產(chǎn)生字符識別結(jié)果22(圖4的步驟A16)。
這里,操作者確認(rèn)/校正處理模塊18的布局屏幕顯示處理部分8參照在步驟A4所產(chǎn)生的布局識別結(jié)果20并向客戶機(jī)10的顯示單元輸出標(biāo)題項(xiàng)目內(nèi)容和對應(yīng)于該標(biāo)題的位置的項(xiàng)目數(shù)據(jù)位置(圖4所示的布局分析信息26)。進(jìn)而,布局屏幕顯示處理部分8向客戶機(jī)10的顯示單元輸出讀取的圖象數(shù)據(jù)(圖4所示的屏幕顯示圖象27)(步驟A5)。
進(jìn)而,字符識別結(jié)果屏幕顯示處理部分9向客戶機(jī)10的顯示單元輸出對應(yīng)于字符識別對象圖象的識別項(xiàng)目的字符識別結(jié)果22(該字符識別結(jié)果22在步驟A16中產(chǎn)生),該輸出與布局屏幕顯示處理部分8進(jìn)行的顯示是一致的。
這里,顯示在客戶機(jī)10的顯示單元上的布局識別結(jié)果20和字符識別結(jié)果22的確認(rèn)和修改操作是由操作者進(jìn)行的(步驟A6)。
進(jìn)而,布局信息產(chǎn)生處理部分11從來自操作者進(jìn)行的確認(rèn)和修改布局操作的結(jié)果產(chǎn)生對布局(布局登記信息)的校正信息。
要注意,步驟A7中所產(chǎn)生的布局登記信息是作為對該布局的校正信息[布局DB學(xué)習(xí)信息25(學(xué)習(xí)布局信息28)和分析詞典學(xué)習(xí)信息24(登記布局信息29)]在布局DB 14和分析詞典13上被反映的,從而實(shí)現(xiàn)布局學(xué)習(xí)處理(步驟A8)。
特別地,在步驟A8中,備選布局信息通過在布局DB 14中的學(xué)習(xí)而被更新。
繼而,參照圖2將說明供處理的對象文件的布局是再次出現(xiàn)的布局時的處理。
首先,布局識別處理模塊16的分析預(yù)處理部分1進(jìn)行如上所述的供處理的對象文件圖象數(shù)據(jù)19的分析預(yù)處理(步驟A1)。
然后,布局分析處理部分2按類似于上述步驟A2中的方式分析布局,并輸出該布局分析的結(jié)果(步驟A9)。
進(jìn)而,布局對比檢驗(yàn)處理部分3使用所抽取的布局成分(劃線項(xiàng)目和項(xiàng)目數(shù)據(jù))作為檢索項(xiàng)檢索布局DB 14,以取得相符的布局的詳細(xì)信息和布局校正信息(步驟A10)。
這時,由于供處理的對象文件再次出現(xiàn),故對應(yīng)的備選布局信息作為布局DB 14檢索的結(jié)果被報(bào)告,并且布局的詳細(xì)信息與這樣報(bào)告的備選布局進(jìn)行對比檢驗(yàn)以鑒別布局之間的一致性。
要注意,在鑒別出布局彼此一致的地方,布局編輯處理部分4實(shí)現(xiàn)在步驟A11到A13的處理判定該布局為一個已經(jīng)存在的布局。另一方面,在作為對比檢驗(yàn)的結(jié)果判定出不一致,則布局編輯處理部分4實(shí)現(xiàn)步驟A4到A8的處理判定該布局為一個新的布局。
這里,基于作為布局DB 14檢索的結(jié)果所取得的布局校正信息,布局編輯處理部分4校正布局分析的結(jié)果和對應(yīng)于該數(shù)據(jù)的位置的數(shù)據(jù)位置,以產(chǎn)生布局識別結(jié)果20(步驟A11)。
字符識別處理模塊17的處理類似于上述與圖4的步驟A14到A15相關(guān)的處理。
這里,操作者確認(rèn)/校正處理模塊18的布局屏幕顯示處理部分8參照在步驟A11中所產(chǎn)生的布局識別結(jié)果20,并向客戶機(jī)10的顯示器輸出標(biāo)題項(xiàng)目內(nèi)容和對應(yīng)于該標(biāo)題位置的項(xiàng)目數(shù)據(jù)位置(圖4中所示的布局分析信息26)。進(jìn)而,布局屏幕顯示處理部分8向客戶機(jī)10的顯示單元輸出讀取的圖象數(shù)據(jù)(圖4中所示的屏幕顯示圖象27)(步驟A12)。
同時,字符識別結(jié)果屏幕顯示處理部分9與由布局屏幕顯示處理部分8進(jìn)行的顯示一致地,向客戶機(jī)10的顯示單元輸出對應(yīng)于字符識別對象圖象的識別項(xiàng)目的字符識別結(jié)果22(這字符識別結(jié)果22是在步驟A16產(chǎn)生的)。
這里,顯示在客戶機(jī)10的顯示單元上的布局識別結(jié)果20的確認(rèn)操作和/或字符識別結(jié)果22的確認(rèn)與修改操作由操作者進(jìn)行(步驟A13)。
要注意,供處理的對象文件的布局是一個現(xiàn)有的布局,由于對于分析對象圖象的處理在當(dāng)步驟A13中布局的確認(rèn)操作完成時的時間點(diǎn)被完成的,故沒有進(jìn)行由布局登記信息產(chǎn)生處理部分11產(chǎn)生布局登記信息。
最后,將說明圖6所示的數(shù)據(jù)媒體處理裝置30進(jìn)行文件處理。
這里,在每一醫(yī)務(wù)室中,文件的圖象數(shù)據(jù)由圖象數(shù)據(jù)閱讀裝置(例如,電傳機(jī)31,圖象掃描器32或者如圖6中所示的DATA-EXE33或圖6和7中所示的圖象閱讀器34)。
這里,由圖象掃描器32、DATA-EXE 33或圖象閱讀器34讀取的圖象數(shù)據(jù)傳送到客戶機(jī)35。
然后,來自傳真機(jī)31的圖象數(shù)據(jù)通過交換機(jī)線路(ISDN/公共網(wǎng)絡(luò))36和傳真機(jī)適配器37傳送到地區(qū)中心服務(wù)器39,同時通過交換機(jī)線路(ISDN/公共網(wǎng)絡(luò))36和通信適配器38來自客戶機(jī)35的圖象數(shù)據(jù)傳送到地區(qū)中心服務(wù)器39。
服務(wù)器39自動地并集中地進(jìn)行從各個醫(yī)務(wù)室傳送的文件圖象數(shù)據(jù)的分析處理,并存儲私人票據(jù)識別軟件成分40,包括知識數(shù)據(jù)庫(知識dB)15,布局?jǐn)?shù)據(jù)庫(布局DB)14及集中的字符識別裝置6。
服務(wù)器39具有對應(yīng)于上述圖1中所示布局識別處理模塊16和字符識別處理模塊17的功能,而作為提供了這些功能的軟件私人票據(jù)識別軟件成分40安裝在硬盤上或者其它未示出的存儲上,以便進(jìn)行相應(yīng)的處理。
進(jìn)而,地區(qū)中心還包括客戶機(jī)(CL)10以便確認(rèn)和修改由服務(wù)器39進(jìn)行的圖象數(shù)據(jù)分析處理結(jié)果。
特別地,客戶機(jī)10具有對應(yīng)于上述圖1所示的操作者確認(rèn)/校正處理模塊18的功能。在客戶機(jī)10中,提供上述這種功能的適用的軟件安裝在硬盤上或者其它未示出的存儲上,以便進(jìn)行相應(yīng)的處理。
然后,圖象數(shù)據(jù)的布局和結(jié)果的字符識別顯示在客戶機(jī)10的顯示單元上,而操作者可參照顯示單元以實(shí)現(xiàn)對圖象數(shù)據(jù)分析結(jié)果的確認(rèn)或者修改。
要注意,為了允許諸如被引入到地區(qū)中心的票據(jù)文件的處理,圖象閱讀器34和DATA-EYE 33作為圖象數(shù)據(jù)閱讀裝置連接到客戶機(jī)10,使得由這些圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù)能夠傳送到服務(wù)器39。
進(jìn)而,由服務(wù)器39分析的文件分析的結(jié)果通過分支服務(wù)器(BS)41傳送到作為主機(jī)設(shè)備的主計(jì)算機(jī)(未示出)。
這樣,利用根據(jù)本發(fā)明的該實(shí)施例的數(shù)據(jù)媒體處理裝置30,通過自動地電子化地分析每天出現(xiàn)的各種文件或文件圖象能夠大大提高使用通常的輸入系統(tǒng)(OCR輸入系統(tǒng),數(shù)據(jù)輸入系統(tǒng)等)輸入工作的效率。
特別地,利用根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置30,能夠構(gòu)成不僅能夠處理用于普通輸入系統(tǒng)的專用文件,而且能夠處理現(xiàn)有的如其原樣的各種各樣任意文件的輸入系統(tǒng)。
更特別地,通過自動地分析構(gòu)成金融機(jī)構(gòu)等的輸入工作對象的私人一般轉(zhuǎn)帳文件的布局(由最終用戶所產(chǎn)生的一般轉(zhuǎn)帳票據(jù)),能夠直接進(jìn)行字符識別處理和輸入處理,并能夠進(jìn)行私人一般轉(zhuǎn)帳票據(jù)的完全自動的識別處理。
通過基于任意票據(jù)任何各種各樣類型的布局識別結(jié)果20產(chǎn)生布局登記信息并學(xué)習(xí)和記錄該結(jié)果到布局DB 14,此后能夠自動地進(jìn)行對于具有相同布局文件的鑒別,因而可降低對于產(chǎn)生專用文件所需的勞務(wù)和費(fèi)用,并在學(xué)習(xí)之后能夠立即輸入。因而,能夠達(dá)到降低包括現(xiàn)有裝置30在內(nèi)的系統(tǒng)引入周期。
進(jìn)而,由于正常地對文件的圖象數(shù)據(jù)進(jìn)行分析,能夠達(dá)到對不同于昂貴的專用OCR文件的文件的自動識別處理,由此減少了剪切錯誤或打印錯誤。
(a2)原點(diǎn)抽取與對比檢驗(yàn)處理的說明圖14是表示由根據(jù)本發(fā)明的該實(shí)施例的數(shù)據(jù)媒體處理裝置進(jìn)行的原點(diǎn)抽取與對比檢驗(yàn)處理的應(yīng)用的處理示意圖。
一般,即使使用光學(xué)閱讀裝置(掃描器,傳真機(jī)等)閱讀具有相同布局的圖象,由于在閱讀時位置的位移,各個布局的成分(劃線項(xiàng)目與項(xiàng)目數(shù)據(jù))對圖象物理原點(diǎn)的坐標(biāo)也不會出現(xiàn)出相等的數(shù)值。
于是,當(dāng)比較布局的成分以鑒別布局的一致性時,必須使得從各個布局所抽取的邏輯原點(diǎn)的位置匹配,計(jì)算布局的各個成分對邏輯原點(diǎn)相對坐標(biāo)并使用相對坐標(biāo)對比檢驗(yàn)這些布局。
由于在圖象閱讀時必須排除諸如灰塵或污物之類圖象的任何變形因素而穩(wěn)定地抽取這一邏輯原點(diǎn),故必須選擇能夠以充分高的精度穩(wěn)定抽取的坐標(biāo)位置為邏輯原點(diǎn)。
因而,本實(shí)施例中,平行使用了多種抽取方法來抽取邏輯原點(diǎn),使得即使在處理具有任意布局的文件時也能夠抽取到正規(guī)穩(wěn)定的邏輯原點(diǎn)。
這里,在根據(jù)本發(fā)明的該實(shí)施例的數(shù)據(jù)媒體處理裝置30中,在圖14中可見,由布局分析處理部分2進(jìn)行的布局分析處理步驟A2(和A9)包括抽取格式的邏輯原點(diǎn)的邏輯原點(diǎn)抽取步驟M1,及參照步驟M1中抽取的邏輯原點(diǎn)抽取包括格式在內(nèi)的媒體特有的特征,并從抽取的特征確定待識別的信息所出現(xiàn)的位置的信息出現(xiàn)位置確定步驟。
同時,由布局對比檢驗(yàn)處理部分3進(jìn)行的布局對比檢驗(yàn)處理步驟A3(和A10)包括在信息出現(xiàn)位置確定步驟所確定的位置的圖象識別時參照在邏輯原點(diǎn)抽取步驟M1(步驟M2)所抽取的邏輯原點(diǎn)進(jìn)行布局對比檢驗(yàn)的圖象識別步驟,以鑒別所抽取的字符信息。
進(jìn)而,在由布局分析處理部分2所進(jìn)行的邏輯原點(diǎn)抽取步驟M1中,除了抽取格式的邏輯原點(diǎn)之外,還抽取向邏輯原點(diǎn)提供輔助信息的邏輯原點(diǎn)輔助坐標(biāo)信息,并在由布局對比檢驗(yàn)處理部分3所進(jìn)行的圖象識別步驟中,參照邏輯原點(diǎn)和邏輯原點(diǎn)輔助坐標(biāo)信息(步驟M2)進(jìn)行布局對比檢驗(yàn)處理,以鑒別所抽取的特征信息。
這里,本實(shí)施例中,在具有其中由劃線形成的表格結(jié)構(gòu)之處,在定義了該表格結(jié)構(gòu)的轉(zhuǎn)角中抽取具有最小X坐標(biāo)和最小Y坐標(biāo)的轉(zhuǎn)角的坐標(biāo)信息[(圖15(a)中所示的坐標(biāo)A]作為格式的邏輯原點(diǎn),并作為邏輯原點(diǎn)輔助坐標(biāo)信息,抽取具有最大X坐標(biāo)和最小Y坐標(biāo)的另一個轉(zhuǎn)角,具有最小X坐標(biāo)和最大Y坐標(biāo)的另一個轉(zhuǎn)角以及具有最大X坐標(biāo)和最大Y坐標(biāo)的另一個轉(zhuǎn)角[分別為圖15(a)中所示的坐標(biāo)Aa,Ab,Ac]。
在布局具有沒有劃線的無劃線表格結(jié)構(gòu)中,例如如圖17所示,抽取在外接矩形的轉(zhuǎn)角中具有最小X坐標(biāo)和最小Y坐標(biāo)的轉(zhuǎn)角的坐標(biāo)信息(圖17中所示的坐標(biāo)D)作為該格式的邏輯原點(diǎn),并作為邏輯原點(diǎn)輔助坐標(biāo)信息,抽取具有最大X坐標(biāo)和最小Y坐標(biāo)的外接矩形的另一個轉(zhuǎn)角,具有最小X坐標(biāo)和最大Y坐標(biāo)的另一個轉(zhuǎn)角以及具有最大X坐標(biāo)和最大Y坐標(biāo)的另一個轉(zhuǎn)角(分別為圖17中所示的坐標(biāo)Da,Db,Dc)。
這里,將首先說明邏輯原點(diǎn)抽取處理。
邏輯原點(diǎn)的抽取處理是由圖5所示的布局分析部分2B的表格結(jié)構(gòu)分析部分2E具體進(jìn)行的。
基于由布局特征抽取部分2A的劃線抽取部分2C所抽取的劃線項(xiàng)目和由布局特征抽取部分2A的項(xiàng)目數(shù)據(jù)抽取部分2D所抽取的項(xiàng)目數(shù)據(jù),表格結(jié)構(gòu)分析部分2E具體分析劃線項(xiàng)目的外接矩形,由劃線項(xiàng)目所形成的表格結(jié)構(gòu)的最大外接矩形,和項(xiàng)目數(shù)據(jù)的外接矩形,從這些矩形抽取轉(zhuǎn)角的坐標(biāo)并設(shè)置預(yù)定的坐標(biāo)為邏輯原點(diǎn)坐標(biāo)和校正坐標(biāo)。
以下將參照圖18中所示的流程圖說明這時布局分析處理部分2的操作。
首先在處理對象布局基于劃線之處,作為邏輯原點(diǎn)抽取處理的預(yù)處理,布局特征抽取部分2A的劃線抽取部分2C從作為抽取對象的圖象數(shù)據(jù)抽取劃線(步驟B1),并然后抽取由所抽取的劃線形成的最小矩形作為劃線項(xiàng)目(步驟B2)。
然后,布局分析部分2B的表格結(jié)構(gòu)分析部分2E鑒別劃線項(xiàng)目是否已經(jīng)被抽取(步驟B3),并在劃線項(xiàng)目已經(jīng)被抽取且這樣抽取的劃線項(xiàng)目寬和高彼此近似相等地就位之處,這些劃線項(xiàng)目被認(rèn)為并分組為具有邏輯關(guān)系的一個劃線項(xiàng)目組(步驟B4)。
進(jìn)而,表格結(jié)構(gòu)分析部分2E鑒別在該組中是否出現(xiàn)一個表格結(jié)構(gòu)(這里表格結(jié)構(gòu)表示由2行x2列或更多的劃線項(xiàng)目組所形成的一個區(qū)域)(步驟B5)。
這里,在出現(xiàn)表格結(jié)構(gòu)之處,表格結(jié)構(gòu)分析部分2E抽取表格結(jié)構(gòu)中象圖15(a)中斜線部分I所示那種最大矩形區(qū)域并取得該矩形區(qū)域的四個轉(zhuǎn)角的坐標(biāo)(步驟B6)。
然后,該矩形的左上角坐標(biāo)A(Xo,Yo)被設(shè)置為邏輯原點(diǎn),而其余的右上角坐標(biāo)Aa,左下角坐標(biāo)Ab及右下角坐標(biāo)Ac的三個位置設(shè)置為對邏輯原點(diǎn)的校正坐標(biāo)(步驟B7和步驟B8)。
另一方面,在如圖15(b)中所看到的出現(xiàn)多個表格結(jié)構(gòu)之處,表格結(jié)構(gòu)分析部分2E抽取各個表格結(jié)構(gòu)(參照斜線部分I)并取得每一個矩形區(qū)域的四個轉(zhuǎn)角的坐標(biāo)(步驟B6)。
然后,當(dāng)每一表格結(jié)構(gòu)的邏輯原點(diǎn)在水平方向和垂直方向投影時的坐標(biāo)B(最小X坐標(biāo),最小Y坐標(biāo))[這就是,(Xo,Yo)]被設(shè)置為邏輯原點(diǎn),而三個位置即坐標(biāo)Ba(最大X坐標(biāo),最小Y坐標(biāo)),坐標(biāo)Bb(最小X坐標(biāo),最大Y坐標(biāo))及坐標(biāo)Bc(最大X坐標(biāo),最大Y坐標(biāo))被設(shè)置為對邏輯原點(diǎn)的校正坐標(biāo)(步驟B7和步驟B8)。
進(jìn)而,在任何劃線項(xiàng)目組中不出現(xiàn)表格結(jié)構(gòu)之處,表格結(jié)構(gòu)分析部分2E抽取如圖16中斜線部分I所示位于最外的劃線項(xiàng)目的矩形區(qū)域之一,并取得每一個矩形區(qū)域的四個轉(zhuǎn)角的坐標(biāo)(步驟B12)。
然后,當(dāng)每一矩形的邏輯原點(diǎn)在水平方向和垂直方向投影時的坐標(biāo)C[(最小X坐標(biāo),最小Y坐標(biāo)),這就是,(Xo,Yo)]被設(shè)置為邏輯原點(diǎn),而三個位置即坐標(biāo)Ca(最大X坐標(biāo),最小Y坐標(biāo)),坐標(biāo)Cb(最小X坐標(biāo),最大Y坐標(biāo))及坐標(biāo)Cc(最大X坐標(biāo),最大Y坐標(biāo))被設(shè)置為對邏輯原點(diǎn)的校正坐標(biāo)(步驟B13和步驟B14)。
順便來說,在布局完全不包含劃線項(xiàng)目之處,布局特征抽取部分2A的項(xiàng)目數(shù)據(jù)抽取部分2D抽取布局中的項(xiàng)目數(shù)據(jù),而表格結(jié)構(gòu)方向部分2E抽取那些如圖17斜線I所示位于最外側(cè)的項(xiàng)目數(shù)據(jù)的矩形區(qū)域,并取得每一個矩形區(qū)域的四個轉(zhuǎn)角的坐標(biāo)(步驟B9)。
然后,當(dāng)每一矩形的邏輯原點(diǎn)在水平方向和垂直方向投影時的坐標(biāo)D(最小X坐標(biāo),最小Y坐標(biāo)),這就是,(Xo,Yo)]被設(shè)置為邏輯原點(diǎn),而三個位置即坐標(biāo)Da(最大X坐標(biāo),最小Y坐標(biāo)),坐標(biāo)Db(最小X坐標(biāo),最大Y坐標(biāo))及坐標(biāo)Dc(最大X坐標(biāo),最大Y坐標(biāo))被設(shè)置為對邏輯原點(diǎn)的校正坐標(biāo)(步驟B10和步驟B11)。
進(jìn)而,表格結(jié)構(gòu)方向部分2E不僅取得如上述方式所抽取的邏輯原點(diǎn)坐標(biāo)和對邏輯原點(diǎn)的校正坐標(biāo),而且取得作為在抽取邏輯原點(diǎn)時所采用的方法的記錄信息的邏輯原點(diǎn)抽取方法(即,表示每一邏輯原點(diǎn)已經(jīng)從表格結(jié)構(gòu),劃線項(xiàng)目及項(xiàng)目數(shù)據(jù)的哪一個抽取的信息)。
要注意,在以下的說明中,指示諸如上述邏輯原點(diǎn)抽取方法的邏輯原點(diǎn)可能被稱為表格邏輯原點(diǎn),劃線項(xiàng)目邏輯原點(diǎn)或項(xiàng)目數(shù)據(jù)邏輯原點(diǎn)。
然后,布局分析處理部分2向布局對比檢驗(yàn)處理部分3作為邏輯原點(diǎn)信息發(fā)送出邏輯原點(diǎn)抽取方法,邏輯原點(diǎn)坐標(biāo)及邏輯原點(diǎn)校正坐標(biāo)。
以下將說明邏輯原點(diǎn)對比檢驗(yàn)處理。
該邏輯原點(diǎn)對比檢驗(yàn)處理是由以上圖1中所示的布局對比檢驗(yàn)處理部分3進(jìn)行的。
在進(jìn)行布局之間的對比時,布局的布局成分坐標(biāo)被轉(zhuǎn)換為對邏輯原點(diǎn)的相對坐標(biāo),而該相對坐標(biāo)彼此進(jìn)行比較以實(shí)現(xiàn)從布局所抽取的邏輯原點(diǎn)的比較。
然而實(shí)際上,即使布局相同,由于在閱讀時諸如對圖象的污染或弄臟等變化因素可能有時也檢測不到邏輯原點(diǎn)的一致性。
這時,基于一個邏輯原點(diǎn)的信息,再次動態(tài)地檢測其它邏輯原點(diǎn),并然后鑒別邏輯原點(diǎn)之間的一致性。
將參照圖21所示的流程圖說明這時布局對比檢驗(yàn)處理部分3的操作。
首先,在本實(shí)施例中,由于使用多種方法由上述的布局分析處理部分2抽取抽取邏輯原點(diǎn),故在對邏輯原點(diǎn)之間對比檢驗(yàn)之前先要進(jìn)行對邏輯原點(diǎn)抽取方法之間的一致性鑒別(步驟C1和C2)。
如果邏輯原點(diǎn)的抽取方法彼此之間是一致的,則如在圖19所見,對布局L1和另一個布局L2的邏輯原點(diǎn)校正坐標(biāo)彼此進(jìn)行比較以鑒別邏輯原點(diǎn)校正坐標(biāo)之間的一致性(步驟C3到C5)。
這里,在鑒別為校正坐標(biāo)之間一致之處,基于布局L1的邏輯原點(diǎn)坐標(biāo)E(最小X坐標(biāo),最小Y坐標(biāo))和布局L2的邏輯原點(diǎn)坐標(biāo)F(最小X坐標(biāo),最小Y坐標(biāo))計(jì)算布局L1的Ea到Ec的校正坐標(biāo)及布局L2的Fa到Fc的校正坐標(biāo)的相對坐標(biāo)(Ea′到Ec′及Fa′到Fc′),并通過相對坐標(biāo)之間的一致性鑒別進(jìn)行校正坐標(biāo)之間的一致性鑒別。
特別地,通過作出包含邏輯原點(diǎn)坐標(biāo)信息的校正坐標(biāo)之間的一致性鑒別而鑒別邏輯坐標(biāo)之間的一致性以便對布局進(jìn)行對比檢驗(yàn)(步驟C6)相對坐標(biāo)計(jì)算的表達(dá)式由以下表達(dá)式(1)到(6)給出(相對坐標(biāo)Ea′)=(校正坐標(biāo)Ea)-(邏輯原點(diǎn)坐標(biāo)E)......(1)(相對坐標(biāo)Eb′)=(校正坐標(biāo)Eb)-(邏輯原點(diǎn)坐標(biāo)E)......(2)(相對坐標(biāo)Ec′)=(校正坐標(biāo)Ec)-(邏輯原點(diǎn)坐標(biāo)E)......(3)(相對坐標(biāo)Fa′)=(校正坐標(biāo)Fa)-(邏輯原點(diǎn)坐標(biāo)E)......(4)(相對坐標(biāo)Fb′)=(校正坐標(biāo)Fb)-(邏輯原點(diǎn)坐標(biāo)E)......(5)(相對坐標(biāo)Fc′)=(校正坐標(biāo)Fc)-(邏輯原點(diǎn)坐標(biāo)E)......(6)進(jìn)而,由以下表達(dá)式(7)到(9)給出對于相對坐標(biāo)之間的一致性要求|(相對坐標(biāo)Ea′)-(相對坐標(biāo)Fa′)|≤ε(ε一致性范圍)......(7)|(相對坐標(biāo)Eb′)-(相對坐標(biāo)Fb′)|≤ε(ε一致性范圍)......(8)|(相對坐標(biāo)Ec′)-(相對坐標(biāo)Fc′)|≤ε(ε一致性范圍)......(9)另一方面,在邏輯原點(diǎn)抽取方法彼此不一致(參照步驟C2)或校正坐標(biāo)彼此不一致(參照步驟C4)之處,則基于其它布局的邏輯原點(diǎn)信息進(jìn)行布局之一的邏輯坐標(biāo)再抽取。
這里,如果由于圖20中所見對劃線的污染布局L1部分地不能檢測,則在圖20(b)可見使用布局L1的邏輯原點(diǎn)信息(邏輯原點(diǎn)抽取方法,邏輯原點(diǎn)坐標(biāo)G和校正坐標(biāo)Ga到Gc)抽取布局L2的新的邏輯原點(diǎn)坐標(biāo)H′和新的檢測坐標(biāo)H′a,Hb和Hc(步驟C7和C8)。
在這時邏輯原點(diǎn)信息再抽取時,在圖20(a)和20(b)中可見首先從布局L1和布局L2的邏輯原點(diǎn)坐標(biāo)和校正坐標(biāo)分別計(jì)算X坐標(biāo)之間的差Xa,Xb,和X′a,X′b,及Y坐標(biāo)之間的差Ya,Yb,和Y′a,Y′b。
以下如表達(dá)式(10)到(17)給出計(jì)算這些差的表達(dá)式
(布局L1)差Xa=|(校正坐標(biāo)Ga的X坐標(biāo))-(邏輯原點(diǎn)坐標(biāo)G的X坐標(biāo))|......(10)差Xb=|(校正坐標(biāo)Gc的X坐標(biāo))-(校正坐標(biāo)Gb的X坐標(biāo))|......(11)差Ya=|(校正坐標(biāo)Gb的Y坐標(biāo))-(邏輯原點(diǎn)坐標(biāo)G的Y坐標(biāo))|......(12)差Yb=|(校正坐標(biāo)Gc的Y坐標(biāo))-(校正坐標(biāo)Ga的Y坐標(biāo))|......(13)(布局L2)差X′a=|(校正坐標(biāo)Ha的X坐標(biāo))-(邏輯原點(diǎn)坐標(biāo)H的X坐標(biāo))|......(14)差X′b=|(校正坐標(biāo)Hc的X坐標(biāo))-(校正坐標(biāo)Hb的X坐標(biāo))|......(15)差Ya=|(校正坐標(biāo)Hb的Y坐標(biāo))-(邏輯原點(diǎn)坐標(biāo)H的Y坐標(biāo))|......(16)差Yb=|(校正坐標(biāo)Hc的Y坐標(biāo))-(校正坐標(biāo)Ha的Y坐標(biāo))|......(17)然后,所計(jì)算的差彼此進(jìn)行比較以鑒別一些差是否一致。
這里,由于對于布局L1和布局L2,差Ya和Y′a不一致,并且差Yb和差Y′b不一致,故從布局L2的坐標(biāo)中搜尋與布局L1的差Ya和Yb一致的差。
換言之,邏輯原點(diǎn)和校正坐標(biāo)是從布局L2內(nèi)根據(jù)對于布局L1的邏輯原點(diǎn)抽取方法搜尋的(參照步驟C7和C8)。
如果作為搜尋的結(jié)果成功地檢測出一致的坐標(biāo),則在圖20(a)可見這些坐標(biāo)用作為邏輯原點(diǎn)H′和校正坐標(biāo)H′a。
另一方面,如果如果作為搜尋的結(jié)果沒有成功地檢測出一致的坐標(biāo),那么按上述類似的方式邏輯原點(diǎn)和校正坐標(biāo)是從布局L1內(nèi)根據(jù)對于布局L2的邏輯原點(diǎn)抽取方法搜尋的(參照步驟C9和C10)。
要注意,如果用這一方法也不能成功地檢測出一致的坐標(biāo),則不進(jìn)行布局之間的對比檢驗(yàn)(步驟C11)。
這樣,由根據(jù)本發(fā)明的該實(shí)施例的原點(diǎn)抽取和對比檢驗(yàn)處理,由于供處理的對象文件的布局分析是基于從圖象數(shù)據(jù)所抽取的劃線項(xiàng)目和項(xiàng)目數(shù)據(jù)進(jìn)行的,并判定由布局分析所獲得的區(qū)域的轉(zhuǎn)角坐標(biāo)中預(yù)定的坐標(biāo)為邏輯原點(diǎn)坐標(biāo)和校正坐標(biāo),故邏輯原點(diǎn)坐標(biāo)和校正坐標(biāo)也能夠從不同于其上印制有標(biāo)記等專用文件的普通文件的圖象數(shù)據(jù)抽取。
而且,由于從多種邏輯原點(diǎn)抽取方法中動態(tài)地選擇一個優(yōu)化的方法,故能夠進(jìn)行適合于供處理的對象文件布局的邏輯原點(diǎn)抽取。
此外,由于在邏輯原點(diǎn)抽取時,同時抽取校正坐標(biāo)作為邏輯原點(diǎn)的補(bǔ)充信息,故在布局對比檢驗(yàn)處理中邏輯原點(diǎn)之間對比檢驗(yàn)時,能夠以一定的可靠性檢驗(yàn)到一致性。
特別地,由于邏輯原點(diǎn)之間的對比檢驗(yàn)是通過其中邏輯原點(diǎn)坐標(biāo)相結(jié)合的校正坐標(biāo)的相對坐標(biāo)之間的對比檢驗(yàn)進(jìn)行的,故即使在圖象閱讀時發(fā)生位移,布局之間的對比檢驗(yàn)處理也能夠可靠地進(jìn)行。
而且,即使在因?yàn)橛谢覊m、污染等而邏輯原點(diǎn)不能正確地抽取之處,由于使用校正坐標(biāo)根據(jù)對其它布局的邏輯原點(diǎn)抽取方法進(jìn)行邏輯原點(diǎn)的再抽取,故能夠判定可被可靠地抽取的另一個點(diǎn)為邏輯原點(diǎn)。
要注意,雖然在本實(shí)施例中布局的左上轉(zhuǎn)角處的點(diǎn)判定為邏輯原點(diǎn),但邏輯原點(diǎn)并不限于此,而是右上轉(zhuǎn)角,左下轉(zhuǎn)角或右下轉(zhuǎn)角也可判定為邏輯原點(diǎn)。
(a3)圖象數(shù)據(jù)旋轉(zhuǎn)校正處理的說明一般,在文件處理裝置等裝置中,如果供閱讀的對象文件的閱讀方向是不正確的方向,那么不能進(jìn)行字符識別處理,因?yàn)閳D象數(shù)據(jù)(圖象)的字符表示方向不是一個正確的方向。
因而,在根據(jù)本發(fā)明的該實(shí)施例的數(shù)據(jù)媒體處理裝置中,在上述的原點(diǎn)抽取處理時,判定所讀取的圖象的方向,而如果圖象的方向是錯誤的,則對于圖象要進(jìn)行旋轉(zhuǎn)校正處理,使得圖象的方向能夠變?yōu)檎_的方向。因而,即使供閱讀的對象文件的閱讀方向是錯誤的,也能夠進(jìn)行如下所述的圖象的布局分析處理和/或字符識別處理。
這里,圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理是由上述圖1和5中所示的布局分析處理部分2進(jìn)行的。為了實(shí)現(xiàn)圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理,布局分析處理部分2包括判定所讀取的圖象的布局是否指向預(yù)定的的方向的步驟,以及基于前面步驟中判定結(jié)果旋轉(zhuǎn)所讀取的圖象數(shù)據(jù)的布局的步驟,使得該布局能夠指向預(yù)定的方向。
這里,其中標(biāo)注出由本發(fā)明的數(shù)據(jù)媒體處理裝置30所進(jìn)行的圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理的功能框圖示于圖8和9。圖8為其中具有劃線項(xiàng)目的一文件要被處理的一功能框圖,而圖9是其中沒有劃線項(xiàng)目的另一文件要被處理的功能框圖。
當(dāng)有劃線項(xiàng)目的一文件要被處理時,如圖8所示在數(shù)據(jù)媒體處理裝置30中,發(fā)揮作用的有以下部分圖象輸入部分301,圖象數(shù)據(jù)存儲器302,旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303,劃線抽取部分(劃線抽取部分)2C,劃線項(xiàng)目信息存儲部分304,劃線項(xiàng)目分析部分(表格結(jié)構(gòu)分析部分)2E,垂直/水平鑒別設(shè)置部分305,水平延伸劃線項(xiàng)目存儲部分306,圖象90度旋轉(zhuǎn)部分307,圖象180度旋轉(zhuǎn)部分308,及字符串識別模塊(字符識別處理模塊)17。
圖象輸入部分301讀取文件的圖象數(shù)據(jù)等。圖象數(shù)據(jù)存儲器302是供暫時存儲所讀取的圖象數(shù)據(jù)的一個存儲器。
旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303是一個用于存儲對其已經(jīng)進(jìn)行了旋轉(zhuǎn)校正處理的圖象數(shù)據(jù)的存儲器。后來的布局識別處理,字符識別處理等等使用存儲在旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303中的圖象數(shù)據(jù)進(jìn)行。
劃線項(xiàng)目抽取部分(劃線抽取部分)2C搜尋所讀取的圖象數(shù)據(jù),以便自動地抽取構(gòu)成由劃線所形成的最小矩形的劃線項(xiàng)目。劃線項(xiàng)目信息存儲部分304是用于存儲由劃線抽取部分2C所抽取的劃線項(xiàng)目信息的一個存儲器。
劃線項(xiàng)目分析部分(表格結(jié)構(gòu)分析部分)2E分析劃線項(xiàng)目信息存儲部分304中所存儲的劃線項(xiàng)目的形狀是垂直延伸形狀還是水平延伸形狀,以便判定圖象數(shù)據(jù)的閱讀方向是垂直閱讀方向還是水平閱讀方向。
在銀行、企業(yè)等中所處理的大部分票據(jù)、文件等通常是水平方向表示的。因而,劃線項(xiàng)目在大多數(shù)情形下是水平延伸的,于是水平延伸的劃線項(xiàng)目多于垂直延伸的劃線項(xiàng)目的狀態(tài)被設(shè)置為垂直/水平鑒別設(shè)置部分305的標(biāo)準(zhǔn),并基于這樣設(shè)置的標(biāo)準(zhǔn),鑒別圖象數(shù)據(jù)的閱讀方向。
水平延伸劃線項(xiàng)目存儲部分306存儲已經(jīng)被表格結(jié)構(gòu)分析處理部分2E判定為水平延伸的劃線項(xiàng)目的劃線項(xiàng)目。
在劃線項(xiàng)目被表格結(jié)構(gòu)分析處理部分2E判定為垂直延伸的劃線項(xiàng)目時,圖象90度旋轉(zhuǎn)部分307旋轉(zhuǎn)圖象數(shù)據(jù)90度以實(shí)現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
字符串識別處理部分17識別劃線項(xiàng)目中的字符,并當(dāng)字符識別不能由字符識串別部分17成功地進(jìn)行時,圖象180度旋轉(zhuǎn)部分308旋轉(zhuǎn)該圖象數(shù)據(jù)180度以便實(shí)現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
要注意,旋轉(zhuǎn)校正的圖象數(shù)據(jù)存儲到圖象數(shù)據(jù)存儲器302中和旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303中2,并類似于上述方式由劃線項(xiàng)目抽取部分2C,劃線項(xiàng)目分析部分2E以及字符串識別部分17進(jìn)行處理。
另一方面,如圖9中可見當(dāng)無劃線項(xiàng)目的另一文件要被處理時,在數(shù)據(jù)媒體處理裝置30中,發(fā)揮作用的有以下部分圖象輸入部分301,圖象數(shù)據(jù)存儲器302,旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303,標(biāo)記部分309,標(biāo)記信息存儲部分310,字符區(qū)域結(jié)合部分311,字符區(qū)域結(jié)合規(guī)則部分312,結(jié)合結(jié)果存儲部分313,字符串垂直/水平鑒別設(shè)置部分314,圖象90度旋轉(zhuǎn)部分307,圖象180度旋轉(zhuǎn)部分308,及字符串識別模塊(字符識別處理模塊)17。
圖象輸入部分301,圖象數(shù)據(jù)存儲器302及旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303具有上述類似的功能和結(jié)構(gòu)。
標(biāo)記部分309對于從象素信息抽取相繼的點(diǎn)信息進(jìn)行標(biāo)記處理。標(biāo)記信息存儲部分310是用于存儲由標(biāo)記部分309所抽取的相繼點(diǎn)信息的一個存儲器。
字符區(qū)域結(jié)合部分311基于由標(biāo)記部分309所抽取的相繼點(diǎn)信息根據(jù)由字符區(qū)域結(jié)合規(guī)則部分312所設(shè)置的結(jié)合規(guī)則結(jié)合相繼的字符為一字符串以抽取項(xiàng)目數(shù)據(jù)。結(jié)合結(jié)果存儲部分313存儲由字符區(qū)域結(jié)合部分311所抽取的項(xiàng)目數(shù)據(jù)。
特別地,標(biāo)記部分309,標(biāo)記信息存儲部分310,字符區(qū)域結(jié)合部分311,字符區(qū)域結(jié)合規(guī)則部分312及結(jié)合結(jié)果存儲部分313協(xié)同構(gòu)成項(xiàng)目數(shù)據(jù)抽取部分2D。
字符串垂直/水平鑒別部分314分析由字符區(qū)域結(jié)合部分311所抽取的項(xiàng)目數(shù)據(jù)的形狀是垂直延伸的形狀還是水平延伸的形狀以鑒別圖象數(shù)據(jù)的閱讀方向是垂直閱讀方向還是水平閱讀方向。
而且,當(dāng)項(xiàng)目數(shù)據(jù)的字符串由字符串垂直/水平鑒別部分314判定為垂直延伸的字符串時,圖象90度旋轉(zhuǎn)部分307旋轉(zhuǎn)該圖象數(shù)據(jù)90度以實(shí)現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
字符串識別部分17識別項(xiàng)目數(shù)據(jù)中的字符。當(dāng)字符識別不能由字符串識別部分17成功地進(jìn)行時,圖象180度旋轉(zhuǎn)部分308旋轉(zhuǎn)圖象數(shù)據(jù)180度以實(shí)現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
要注意,旋轉(zhuǎn)校正的圖象數(shù)據(jù)存儲到圖象數(shù)據(jù)存儲器302和旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303并由標(biāo)記部分309,字符區(qū)域結(jié)合部分311,字符串垂直/水平鑒別部分314和字符串識別部分17以類似于上述方式處理。
在具有上述結(jié)構(gòu)的根據(jù)本發(fā)明該實(shí)施例的數(shù)據(jù)媒體處理裝置中,如果圖象數(shù)據(jù)從圖象輸入部分301輸入,則劃線項(xiàng)目或項(xiàng)目數(shù)據(jù)從圖象數(shù)據(jù)抽取。
這里,在圖象數(shù)據(jù)包含劃線項(xiàng)目之處,劃線項(xiàng)目由劃線項(xiàng)目抽取部分2C抽取,并且由表格結(jié)構(gòu)分析部分2E分析,由表格結(jié)構(gòu)分析部分2E所抽取的劃線項(xiàng)目的形狀是垂直延伸形狀還是水平延伸形狀的哪一個。
然后,在分析出劃線項(xiàng)目形狀為垂直延伸形狀之處,圖象數(shù)據(jù)由圖象90度旋轉(zhuǎn)部分307旋轉(zhuǎn)校正90度。
另一方面,在分析出劃線項(xiàng)目的形狀為水平延伸形狀之處,劃線項(xiàng)目的字符識別由字符串識別部分17進(jìn)行,但是當(dāng)字符識別不能成功地進(jìn)行時,該圖象數(shù)據(jù)由圖象180旋轉(zhuǎn)部分308旋轉(zhuǎn)校正180度。
此外,在圖象數(shù)據(jù)不包含劃線項(xiàng)目之處,項(xiàng)目數(shù)據(jù)由字符區(qū)域結(jié)合部分311抽取,并由字符區(qū)域結(jié)合分析部分311分析由字符區(qū)域結(jié)合部分311所抽取的項(xiàng)目數(shù)據(jù)的形狀是垂直延伸形狀還是水平延伸形狀的哪一個。
這里,在分析出項(xiàng)目數(shù)據(jù)的形狀為水平延伸形狀之處,劃線項(xiàng)目的字符識別由字符串識別部分17進(jìn)行,但是當(dāng)字符識別不能成功地進(jìn)行時,該圖象數(shù)據(jù)由圖象180旋轉(zhuǎn)部分308旋轉(zhuǎn)校正180度。
然后將參照圖12和13所示的流程圖進(jìn)而說明該數(shù)據(jù)媒體處理裝置30的圖象數(shù)據(jù)旋轉(zhuǎn)校正處理。
首先,進(jìn)行待處理的供圖象識別的票據(jù),文件等的圖象數(shù)據(jù)閱讀(步驟G1)。要注意,票據(jù)、文件等的表可能從任何方向被閱讀。
例如,當(dāng)閱讀具有如圖10所示的這種劃線項(xiàng)目的文件320時,所讀取的圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302(步驟G2)。要注意,只有在第一次閱讀時,同一圖象數(shù)據(jù)也存儲到旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303中(步驟G3)。
然后,抽取圖象數(shù)據(jù)中的劃線項(xiàng)目(例如在圖10中,表示出劃線項(xiàng)目M)。
這里,如果成功地抽取了劃線項(xiàng)目,則劃線項(xiàng)目信息存儲到劃線項(xiàng)目信息存儲部分304(步驟G5和G6)。
表格結(jié)構(gòu)分析部分2E基于存儲在劃線項(xiàng)目信息存儲部分304的劃線項(xiàng)目信息分析每一劃線項(xiàng)目的形狀,并對劃線項(xiàng)目是垂直延伸還是水平延伸的劃線項(xiàng)目進(jìn)行鑒別及分類(步驟G7和G8)。然后,在劃線項(xiàng)目信息的劃線項(xiàng)目為水平延伸的劃線項(xiàng)目之處,它存儲到水平延伸的劃線項(xiàng)目存儲部分306(步驟G9)。
進(jìn)而,表格結(jié)構(gòu)分析部分2E基于由垂直/水平鑒別設(shè)置部分305所設(shè)置的標(biāo)準(zhǔn)鑒別水平延伸的劃線項(xiàng)目數(shù)目是否大于垂直延伸的劃線項(xiàng)目數(shù)目以便鑒別圖象數(shù)據(jù)的閱讀方向是正確還是錯誤(步驟G10)。
這里,如果表格結(jié)構(gòu)方向部分2E鑒別出水平延伸的劃線項(xiàng)目較大,則由字符串識別部分17進(jìn)行字符識別(從步驟G10的YES途徑到步驟G11)。
如果由字符串識別部分17成功地進(jìn)行了字符的識別,則判定圖象數(shù)據(jù)的閱讀方向是正常的(步驟G12的YES途徑)。
另一方面,如果由字符串識別部分17沒有成功地進(jìn)行字符的識別,則由于有可能圖象已經(jīng)旋轉(zhuǎn)了180度(即圖象被垂直地反轉(zhuǎn)),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,圖象180度旋轉(zhuǎn)部分308對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G14)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G4到G12)。
另一方面,如果由表格結(jié)構(gòu)分析部分2E鑒別出垂直于是的劃線項(xiàng)目數(shù)目較大,則待存儲到圖象數(shù)據(jù)存儲器302的圖象數(shù)據(jù)由圖象90度旋轉(zhuǎn)部分308進(jìn)行90度的旋轉(zhuǎn)校正(步驟G13)。于是,旋轉(zhuǎn)后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述的處理的處理(步驟G4到G12)。
然后,如果在進(jìn)行了90度旋轉(zhuǎn)校正處理之后對圖象數(shù)據(jù)仍沒有成功地由字符串識別部分17進(jìn)行字符的識別,則由于有可能圖象處于旋轉(zhuǎn)了180度的狀態(tài),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,圖象180度旋轉(zhuǎn)部分308對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G14)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G4到G12)。
另一方面,如果在上述步驟G5沒有成功地抽取劃線項(xiàng)目,則由于其中存在這樣的情形,例如讀取到如圖11所示沒有劃線項(xiàng)目的文件321,則進(jìn)行以下的處理以抽取項(xiàng)目數(shù)據(jù)。
首先,標(biāo)記部分309從存儲在旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)抽取標(biāo)記信息(例如圖11中所示的標(biāo)記信息N)(從步驟G5的NO途徑到圖13的步驟G15)。所抽取的標(biāo)記信息存儲到標(biāo)記信息存儲部分310(步驟G16)。
然后,字符區(qū)域結(jié)合部分311基于字符區(qū)域結(jié)合規(guī)則部分312的規(guī)則結(jié)合存儲在標(biāo)記信息存儲部分310中的標(biāo)記信息的各個片斷為一個字符串。于是,抽取項(xiàng)目數(shù)據(jù)(例如,圖11中,其中七個標(biāo)記信息片斷“出”,“張”,“旅”,“費(fèi)”,“精”,“算”,和“書”被結(jié)合為一個字符串的字符區(qū)域的結(jié)合結(jié)果(“出張旅費(fèi)精算書”)表示為項(xiàng)目數(shù)據(jù))(步驟G17),并且該結(jié)合結(jié)果存儲到結(jié)合結(jié)果存儲部分313(步驟G18)。
進(jìn)而,字符串垂直/水平鑒別部分314鑒別水平延伸的項(xiàng)目數(shù)據(jù)數(shù)目是否大于垂直延伸的項(xiàng)目數(shù)據(jù)的數(shù)目以鑒別圖象數(shù)據(jù)的閱讀方向是正確還是錯誤的(步驟G19)。
這里,如果由字符串垂直/水平鑒別部分314鑒別出水平延伸的項(xiàng)目數(shù)據(jù)的數(shù)目較大,則由字符串識別部分17進(jìn)行字符識別(步驟G20)。
如果由字符串識別部分17成功地進(jìn)行了字符識別,則判定圖象數(shù)據(jù)的閱讀方向是正常的(步驟G21)。
反之如果由字符串識別部分17沒有成功地進(jìn)行字符的識別,則由于有可能圖象處于旋轉(zhuǎn)了180度的狀態(tài),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G23)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G15到G21)。
另一方面,如果由字符串垂直/水平鑒別部分314鑒別出垂直延伸的項(xiàng)目數(shù)據(jù)的數(shù)目較大,則存儲在圖象數(shù)據(jù)存儲器302中的圖象數(shù)據(jù)由圖象80度旋轉(zhuǎn)部分308旋轉(zhuǎn)校正90度(步驟G22)。于是,旋轉(zhuǎn)之后的圖象數(shù)據(jù)此后存儲到旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G15到G21)。
然后,如果在90度旋轉(zhuǎn)校正處理進(jìn)行之后對圖象數(shù)據(jù)仍不能由字符串識別部分17進(jìn)行字符的識別,則由于有可能圖象處于旋轉(zhuǎn)了180度的狀態(tài),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,由圖象180度旋轉(zhuǎn)部分308對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G23)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G15到G21)。
這樣,使用根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置30,從讀取的圖象數(shù)據(jù)中抽取劃線項(xiàng)目或者項(xiàng)目數(shù)據(jù),并鑒別所抽取的劃線項(xiàng)目或項(xiàng)目數(shù)據(jù)的形狀是為水平延伸形狀還是垂直延伸形狀。如果劃線項(xiàng)目或項(xiàng)目數(shù)據(jù)的形狀為垂直延伸形狀,則對圖象數(shù)據(jù)進(jìn)行90度的旋轉(zhuǎn)校正。然后,如果即使在劃線項(xiàng)目或項(xiàng)目數(shù)據(jù)的形狀為水平延伸的形狀之處也不能成功地進(jìn)行字符識別,則進(jìn)行圖象數(shù)據(jù)的180度旋轉(zhuǎn)校正。于是,從圖象數(shù)據(jù)究竟在什么方向被讀取,可自動地鑒別圖象數(shù)據(jù)的閱讀方向,并當(dāng)圖象數(shù)據(jù)的閱讀方向錯誤時,圖象數(shù)據(jù)能夠自動地被旋轉(zhuǎn)校正。結(jié)果,數(shù)據(jù)媒體處理裝置30的優(yōu)點(diǎn)在于,可以避免由操作者進(jìn)行確認(rèn)和旋轉(zhuǎn)校正操作,并可有效地由客戶機(jī)-服務(wù)器系統(tǒng)進(jìn)行文件的自動處理。
(a4)矩陣對比檢驗(yàn)處理的說明一般在文件處理裝置等裝置中,由于在供處理的對象文件的布局與存儲在布局DB等之中的布局之間進(jìn)行對比檢驗(yàn)處理時,對各個布局的成分(劃線項(xiàng)目,項(xiàng)目數(shù)據(jù)等)相繼進(jìn)行對比檢驗(yàn),以實(shí)現(xiàn)坐標(biāo),尺寸等等之間的比較,在布局的成分?jǐn)?shù)(N)增加時,對比檢驗(yàn)操作的次數(shù)增加得很多,因而大量文件的布局對比檢驗(yàn)處理不能以高速進(jìn)行。
于是,在根據(jù)本發(fā)明的該實(shí)施例的數(shù)據(jù)媒體處理裝置30中,作為布局成分之一的劃線項(xiàng)目布局被壓縮處理并表示為矩陣表,并在布局之間對比檢驗(yàn)時,它們的矩陣表彼此進(jìn)行對比檢驗(yàn),使得大量文件布局的對比檢驗(yàn)處理能夠以高速進(jìn)行。
這里,根據(jù)本發(fā)明的該實(shí)施例的數(shù)據(jù)媒體處理裝置30是這樣構(gòu)造的布局對比檢驗(yàn)處理部分3對由布局分析處理部分2所抽取的劃線項(xiàng)目的布局進(jìn)行壓縮處理以將其表示為一個矩陣表,并使用該矩陣表作為限制檢索項(xiàng)目檢索存儲在布局DB 14中參照矩陣表以便對比檢驗(yàn)是否存在相符的矩陣表?;趯Ρ葯z驗(yàn)的結(jié)果,字符識別處理模塊17鑒別在特定位置的圖象信息。
這里,在圖22中示出其中標(biāo)注了根據(jù)本實(shí)施例的數(shù)據(jù)媒體處理裝置30的矩陣對比檢驗(yàn)處理的處理過程示意圖。
在數(shù)據(jù)媒體處理裝置30中,如圖22所示,如果首先閱讀供處理的對象文件并輸入分析對象的圖象數(shù)據(jù)19,然后布局分析處理部分2分析所輸入的圖象數(shù)據(jù)以抽取劃線部分并抽取由劃線部分所形成的矩形作為劃線項(xiàng)目。
這時,從劃線部分等計(jì)算圖象的傾斜度,并對所抽取的各個劃線項(xiàng)目的坐標(biāo)位置進(jìn)行傾斜校正。進(jìn)而,抽取布局的邏輯原點(diǎn)和校正坐標(biāo),并作為布局信息設(shè)置校正的劃線項(xiàng)目的坐標(biāo)位置,邏輯原點(diǎn)和校正坐標(biāo)(步驟F1)。
然后,布局對比檢驗(yàn)處理部分3對于對應(yīng)于輸入的圖象數(shù)據(jù)產(chǎn)生一個10 DPI(每英寸點(diǎn)數(shù))的位表,并在位表上對應(yīng)的位置處布局信息的最低行中標(biāo)繪出各個劃線項(xiàng)目的左上坐標(biāo)和劃線項(xiàng)目的右下坐標(biāo)。
進(jìn)而,根據(jù)在一行中是否存在數(shù)據(jù)對所產(chǎn)生的位表進(jìn)行壓縮處理,并根據(jù)行的構(gòu)造規(guī)律在行方向上進(jìn)行壓縮處理以產(chǎn)生一矩陣表(步驟F2)。
這樣壓縮的矩陣表與其它布局信息一同存儲到布局DB 14(步驟F3)。
要注意,上述的步驟F1對應(yīng)于圖2所示的步驟A2,而上述的步驟F2和F3對應(yīng)于圖2所示的步驟A3。
進(jìn)而,在數(shù)據(jù)媒體處理裝置30中,如果讀取了供對比檢驗(yàn)的對象文件并輸入了方向?qū)ο蟮膱D象數(shù)據(jù)19,那么布局分析處理部分2進(jìn)行類似于上述步驟F1的處理,并設(shè)置劃線項(xiàng)目的坐標(biāo)位置,邏輯原點(diǎn)和校正坐標(biāo)作為布局信息(步驟F4)。
然后,布局對比檢驗(yàn)處理部分3對所輸入的圖象數(shù)據(jù)進(jìn)行類似于上述步驟F2的處理以產(chǎn)生一矩陣表(步驟F5)。
這里,布局對比檢驗(yàn)處理部分3從布局DB 14讀出對比檢驗(yàn)對象的矩陣表并參照布局的各個邏輯原點(diǎn)以行為單元對比檢驗(yàn)位位置,以實(shí)現(xiàn)在讀取的對比檢驗(yàn)對象的矩陣表與在上述步驟F5中產(chǎn)生的矩陣表之間的對比檢驗(yàn)。
進(jìn)而,從矩陣表的位位置對比檢驗(yàn)的結(jié)果計(jì)算出的關(guān)于所有對比檢驗(yàn)位的數(shù)目計(jì)算出相符的位數(shù)目,并作為矩陣表相符比例輸出對比檢驗(yàn)結(jié)果200(步驟F6)。
要注意,上述的步驟F4對應(yīng)于圖2中所示的步驟A9,而上述的步驟F5和F6對應(yīng)于圖2中所示的步驟A10。
這里,將參照圖23說明上述步驟F2和F5中的矩陣表產(chǎn)生處理。
首先,從作為矩陣表產(chǎn)生對象的一個圖象抽取劃線,并從所抽取的劃線抽取劃線項(xiàng)目(由劃線所形成的最小矩形區(qū)域)。這時,基于布局的傾向度信息對于所抽取的劃線項(xiàng)目的各個坐標(biāo)進(jìn)行傾斜校正(步驟F21)。
然后,校驗(yàn)布局上的每一劃線的線性以獲得劃線的變形率,并對在步驟F21中校正的劃線項(xiàng)目傾斜的坐標(biāo)進(jìn)行變形校正(步驟F22)。
進(jìn)而,參照形成劃線項(xiàng)目的水平劃線以設(shè)置其上面的劃線共同具有相同的劃線以至它們都具有相同的數(shù)值的那些劃線項(xiàng)目的左上轉(zhuǎn)角Y坐標(biāo)數(shù)值,以實(shí)現(xiàn)如圖24(a)中所見的Y坐標(biāo)的正規(guī)化(步驟F23)。參照形成劃線項(xiàng)目的垂直劃線以設(shè)置其左側(cè)的劃線共同具有相同的劃線以至它們都具有相同的數(shù)值的那些劃線項(xiàng)目的左上轉(zhuǎn)角X坐標(biāo)數(shù)值,以實(shí)現(xiàn)如圖24(b)中所見的X坐標(biāo)的正規(guī)化(步驟F24)。
特別地,在本實(shí)施例中,在其上反映出劃線項(xiàng)目的布局的位表壓縮處理之前,對所讀取的圖象數(shù)據(jù)進(jìn)行傾斜校正和變形校正處理(參照步驟F21和F22),并然后參照形成劃線項(xiàng)目的水平劃線,以便對其上面的劃線共同具有相同的劃線的那些劃線項(xiàng)目進(jìn)行Y坐標(biāo)的歸一化處理(參照步驟F23),此后參照形成劃線項(xiàng)目的垂直劃線,以便對其左側(cè)劃線共同具有相同劃線的那些劃線項(xiàng)目進(jìn)行X坐標(biāo)的歸一化處理(參照步驟F24),以便吸收在閱讀圖象數(shù)據(jù)中所產(chǎn)生的布局中的變化。
進(jìn)而,對于布局上的所有的劃線項(xiàng)目,根據(jù)在具有相同Y坐標(biāo)劃線項(xiàng)目的單元中位表指定的分辨率對劃線項(xiàng)目的左上轉(zhuǎn)角的坐標(biāo)進(jìn)行坐標(biāo)轉(zhuǎn)換(位串轉(zhuǎn)換),并在圖25中所見的表對應(yīng)的位置處設(shè)置位。
這時,設(shè)置被轉(zhuǎn)換的劃線項(xiàng)目的Y坐標(biāo)之間的距離以便如圖26中所見排列管理信息J(步驟F25)。
這里,對由步驟F25中的轉(zhuǎn)換所產(chǎn)生的位表進(jìn)行處理以便如圖27中所見從頂行開始相繼進(jìn)行行的比較,并且具有相同位結(jié)構(gòu)的相繼的行在行方向被壓縮為一行以產(chǎn)生壓縮的系位信息K,并作為行壓縮信息向行管理信息J設(shè)置壓縮完成標(biāo)志Q(步驟F26)。
然后如圖28中所見,作為一個矩陣表設(shè)置這樣產(chǎn)生的包含壓縮行位信息K和行管理信息J的矩陣表信息S(步驟F27)。
特別地,在本實(shí)施例中,在劃線項(xiàng)目的布局壓縮處理時,劃線項(xiàng)目的布局被轉(zhuǎn)換為對應(yīng)的位串,而對位串進(jìn)行壓縮處理。然后,這樣壓縮處理的位表設(shè)置為矩陣表。于是,在布局對比檢驗(yàn)時對比檢驗(yàn)操作的數(shù)目只是與對比檢驗(yàn)對象的布局的數(shù)目成比例地線性增加,而不依賴于布局的成分?jǐn)?shù)目(N),于是能夠以高速進(jìn)行大量文件布局的對比檢驗(yàn)處理。
進(jìn)而,將參照圖29和30的流程圖說明上述步驟F6中的矩陣表對比檢驗(yàn)處理。
首先,布局對比檢驗(yàn)處理部分3產(chǎn)生并獲得例如在圖31(a)中所見那樣的對比檢驗(yàn)源矩陣信息,并設(shè)置壓縮的對比檢驗(yàn)源矩陣信息的行位信息(K1)為對比檢驗(yàn)源工作區(qū)域(步驟D1)。
進(jìn)而,例如從布局DB 14取得如圖31(b)中所示的那種對比檢驗(yàn)?zāi)繕?biāo)矩陣信息,并向一個對比檢驗(yàn)?zāi)繕?biāo)工作區(qū)設(shè)置壓縮的對比檢驗(yàn)?zāi)繕?biāo)矩陣信息的行位信息(K′1)(步驟D2)。
然后,布局對比檢驗(yàn)處理部分3相繼地對壓縮的行位信息(K1)和(K′1)從頂位開始進(jìn)行比較和對比檢驗(yàn)以實(shí)現(xiàn)對一行的對比檢驗(yàn)(步驟D3)。
這里,如果壓縮的行位信息(K1)和(K′1)表現(xiàn)不相符,則設(shè)置不相符作為對比檢驗(yàn)的結(jié)果200(參照圖22)(步驟D4和D10)。然而,由于這里的壓縮的行位信息(K1)和(K′1)是相符的,故基于行管理信息J向?qū)Ρ葯z驗(yàn)源工作區(qū)設(shè)置對比檢驗(yàn)源壓縮的行位信息K(步驟D4和D5)。
在步驟D5,參照行管理信息J(步驟E1),并且如果對于對應(yīng)的行管理信息J設(shè)置壓縮完成標(biāo)記Q,則鑒別出該行是壓縮行,并向?qū)Ρ葯z驗(yàn)源工作區(qū)設(shè)置最后對比檢驗(yàn)的行的壓縮行位信息K(步驟E2和E4)。然而,如果對于行管理信息J的對應(yīng)的行沒有設(shè)置壓縮完成標(biāo)志Q,則鑒別出該行為非壓縮行,并向?qū)Ρ葯z驗(yàn)源工作區(qū)設(shè)置新的的對應(yīng)行的壓縮行位信息K(步驟E2和E3)。
進(jìn)而,還基于行管理信息J′向?qū)Ρ葯z驗(yàn)?zāi)繕?biāo)工作區(qū)設(shè)置對比檢驗(yàn)?zāi)繕?biāo)壓縮行位信息K′(步驟D6)。
而且在步驟D6,類似于上述步驟D5,參照行管理信息J′(步驟E1),并且如果對于對應(yīng)的行管理信息J′設(shè)置壓縮完成標(biāo)記Q′,則鑒別出該行是壓縮行,并向?qū)Ρ葯z驗(yàn)源工作區(qū)設(shè)置最后對比檢驗(yàn)的行的壓縮行位信息K′(步驟E2和E4)。然而,如果對于行管理信息J′的對應(yīng)的行沒有設(shè)置壓縮完成標(biāo)志Q′,則鑒別出該行為非壓縮行,并向?qū)Ρ葯z驗(yàn)源工作區(qū)設(shè)置新的的對應(yīng)行的壓縮行位信息K′(步驟E2和E3)。
如果對于所有的行壓縮行位信息K和K′標(biāo)記的結(jié)果證實(shí)在固定區(qū)域內(nèi)所有的行是彼此相符的,則設(shè)置一致性作為對比檢驗(yàn)結(jié)果200(步驟D7到D9)。
反之,如果在比較處理中發(fā)現(xiàn)不一致或者比較對象之一的行位信息在比較完成之前結(jié)束,則設(shè)置不一致性作為對比檢驗(yàn)結(jié)果200(步驟D7、D8和D10)。
這樣,使用根據(jù)本發(fā)明的該實(shí)施例的媒體處理裝置的矩陣對比檢驗(yàn)處理,由于作為布局成分之一的劃線項(xiàng)目的布局被壓縮處理以至表示為矩陣表,并在布局比較時,對矩陣表彼此之間進(jìn)行對比檢驗(yàn),故布局的對比檢驗(yàn)處理速度僅僅對對象布局對比檢驗(yàn)的數(shù)目成比例地增加,而不依賴于劃線項(xiàng)目的數(shù)目。于是,能夠以高速進(jìn)行大量文件的布局對比檢驗(yàn)處理。
這時,由于對比檢驗(yàn)對象布局表示在構(gòu)成布局的劃線項(xiàng)目中,故布局可穩(wěn)定地被表示。
而且,由于在其上反映出劃線項(xiàng)目的布局的位表的壓縮處理之前,對讀取的圖象數(shù)據(jù)進(jìn)行傾斜校正和變形校正處理,并對各個劃線項(xiàng)目進(jìn)行Y坐標(biāo)歸一化處理及X坐標(biāo)歸一化處理,故在閱讀圖象時所產(chǎn)生的布局中的變化可被吸收。
進(jìn)而,由于根據(jù)一階文件的特征壓縮位表,故文件中的布局成分的數(shù)目能夠有效地壓縮表示。
(a5)特征數(shù)據(jù)識別處理的說明一般,在字符識別裝置中,由于普通的字符構(gòu)成一個識別對象,必須使用考慮了識別率的用于識別對象所產(chǎn)生的字典,而任意動態(tài)指定的圖形形式是不能被識別的。
而且,由于識別對象事先假設(shè)為字符,就存在諸如識別對象區(qū)域方面的限制以及設(shè)定供識別的定義對象方面的限制,而任意的區(qū)域是不能設(shè)定為識別對象的。
因而,根據(jù)本發(fā)明該實(shí)施例的數(shù)據(jù)媒體處理裝置30是這樣構(gòu)造的,使得包含在字符識別處理中不能識別字符的區(qū)域圖象(布局),圖形形式等作為特征數(shù)據(jù)被記錄,同時對應(yīng)于該特征數(shù)據(jù)的代碼數(shù)據(jù)作為對布局附加的信息被記錄,并在布局對比檢驗(yàn)處理時,進(jìn)行布局的特征數(shù)據(jù)之間的對比檢驗(yàn),并在發(fā)現(xiàn)相符的特征數(shù)據(jù)時,取得對應(yīng)于特征數(shù)據(jù)的代碼數(shù)據(jù)并在顯示器上顯示為識別的結(jié)果,于是在字符識別處理中不能被識別的字符,圖形形式等。
其中標(biāo)注了根據(jù)本發(fā)明該實(shí)施例的數(shù)據(jù)媒體處理裝置30的特征數(shù)據(jù)識別處理的處理示意圖示于圖32中。
在根據(jù)本實(shí)施例的數(shù)據(jù)媒體處理裝置30中,如圖32所示,由右下步驟進(jìn)行特征數(shù)據(jù)識別處理通過學(xué)習(xí)處理向布局DB 14記錄特征數(shù)據(jù)的記錄步驟(步驟H1,A6和H2),以及對比檢驗(yàn)記錄的特征數(shù)據(jù)是否包含與分開讀取的圖形相符的特征數(shù)據(jù)的對比檢驗(yàn)步驟(步驟H3)。
在記錄步驟中,抽取所讀取的圖象布局中的特征以便分析布局的結(jié)構(gòu)(步驟H1),并且所分析的布局顯示在一形式單元403上(步驟A6)。然后,如圖33所示,進(jìn)行布局學(xué)習(xí)處理(步驟H2),以便對于所顯示的布局結(jié)構(gòu)設(shè)置預(yù)定的的特征數(shù)據(jù)記錄區(qū)域T(在圖33中由斜線所表示),并且借助于外部輸入裝置404輸入對應(yīng)于區(qū)域T中的標(biāo)記信息(在圖33中“富士通株式會社”)的代碼數(shù)據(jù)U[在圖33中,“Fujitsu(Ltd)”],此后從特征數(shù)據(jù)識別區(qū)域T和代碼數(shù)據(jù)U產(chǎn)生區(qū)域特征數(shù)據(jù),并以同上述分析的布局結(jié)構(gòu)相鏈接的狀態(tài)被記錄。
在根據(jù)本實(shí)施例的數(shù)據(jù)媒體處理裝置30中,通過在區(qū)域特征數(shù)據(jù)的識別時對于特征數(shù)據(jù)識別區(qū)域T進(jìn)行歸一化處理,能夠在對比檢驗(yàn)步驟可靠地進(jìn)行區(qū)域特征數(shù)據(jù)的對比檢驗(yàn),這將在以下說明。
在這一記錄步驟,由于在輸入對應(yīng)于標(biāo)記信息的代碼數(shù)據(jù)U時向上述區(qū)域T輸入了具有對應(yīng)于標(biāo)記信息意義的代碼數(shù)據(jù),故如果它識別出特征數(shù)據(jù)識別區(qū)域T,作為識別的結(jié)果數(shù)據(jù)媒體處理裝置30能夠在屏幕上顯示出對應(yīng)的代碼數(shù)據(jù)。
另一方面,在對比檢驗(yàn)步驟中,在上述的記錄步驟之后,抽取分開讀取的圖象特征,并然后使用在記錄步驟所記錄的區(qū)域特征數(shù)據(jù)和布局結(jié)構(gòu)作為參照數(shù)據(jù)檢索布局DB 14以便對比檢驗(yàn)是否有相符的布局。
當(dāng)具有上述結(jié)構(gòu)的根據(jù)本發(fā)明該實(shí)施例的數(shù)據(jù)媒體處理裝置30實(shí)現(xiàn)特征數(shù)據(jù)識別處理時,通過學(xué)習(xí)處理字符數(shù)據(jù)記錄到布局DB14,并對比檢驗(yàn)是否有某個記錄的特征數(shù)據(jù)與分開讀取的圖象相符。然后,如果發(fā)現(xiàn)了相符的特征數(shù)據(jù),則取得對應(yīng)于該特征數(shù)據(jù)的代碼數(shù)據(jù)并作為識別的結(jié)果顯示在顯示對于403上。
將參照圖32到34更為詳細(xì)地說明數(shù)據(jù)媒體處理裝置30這時的操作。
特別地,如圖32中所見,如果布局分析的一個對象文件圖象19是新讀取的,則布局分析處理部分2分析該對象文件的布局以產(chǎn)生布局信息(步驟H1)。
這里,在操作者確認(rèn)/校正處理模塊18(參照圖1)中,一文件的圖象及所分析的圖象信息顯示在顯示對于403上,并且如圖33中所見,由操作者設(shè)置一個特征數(shù)據(jù)識別區(qū)域T(“富士通株式會社”),并從外部輸入裝置404輸入對應(yīng)的代碼數(shù)據(jù)U[“Fujitsu(Ltd)”](步驟H6)。
進(jìn)而,布局記錄信息產(chǎn)生處理部分11從由操作者指定的區(qū)域T和輸入的代碼數(shù)據(jù)U產(chǎn)生區(qū)域特征數(shù)據(jù),并學(xué)習(xí)該區(qū)域特征數(shù)據(jù),且作為布局校正數(shù)據(jù)與由布局識別處理模塊16所取得的布局信息一同記錄到布局DB 14(步驟H2)。
于是,在記錄步驟中的操作是由操作者確認(rèn)/校正處理模塊18和上述布局記錄信息產(chǎn)生處理部分11進(jìn)行的。
在區(qū)域特征數(shù)據(jù)這樣記錄到布局DB 14之后,如果再次讀取與上述處理的相同的文件圖象19,則布局分析處理部分2分析該對象文件并產(chǎn)生布局信息。
進(jìn)而,布局對比檢驗(yàn)處理部分3使用所分析的布局信息作為檢索項(xiàng)檢索布局DB 14以便取得對于在步驟H2學(xué)習(xí)和記錄的文件的布局校正信息。
這里,對于所取得的布局校正信息的區(qū)域特征數(shù)據(jù)是否包含對應(yīng)于要被分析的文件的圖象的區(qū)域特征數(shù)據(jù)進(jìn)行對比檢驗(yàn)。如果對比檢驗(yàn)的結(jié)果證實(shí)某個區(qū)域特征數(shù)據(jù)滿足與要被分析的文件圖象相符的項(xiàng),則對應(yīng)于該區(qū)域特征數(shù)據(jù)的代碼數(shù)據(jù)U設(shè)置為布局識別結(jié)果(步驟H3)。
然后,在操作者確認(rèn)/校正處理模塊18中,所讀取的文件圖象和布局識別結(jié)果20顯示在顯示單元403上,并且如圖34所見以類似于一般字符識別結(jié)果22的方式,在顯示單元403上作為特征數(shù)據(jù)識別結(jié)果顯示出特征數(shù)據(jù)識別區(qū)域T及對應(yīng)的代碼數(shù)據(jù)U(步驟A13)。
這樣,利用根據(jù)本發(fā)明該實(shí)施例的媒體處理裝置的特征數(shù)據(jù)識別處理,在功能上擴(kuò)充了類似于字符識別裝置的區(qū)域圖象特征抽取機(jī)制和特征對比檢驗(yàn)機(jī)制,并且與布局識別系統(tǒng)相結(jié)合,使得在記錄步驟由操作者所指定的特征數(shù)據(jù)識別區(qū)域T和對應(yīng)的代碼數(shù)據(jù)U(識別結(jié)果代碼)被動態(tài)地學(xué)習(xí)并與布局分析分結(jié)果一同記錄到布局DB 14,并在要對具有所學(xué)習(xí)布局相同布局的文件進(jìn)行識別時,在對比檢驗(yàn)步驟從布局DB 14與布局信息一同取得區(qū)域特征數(shù)據(jù),并對該區(qū)域特征數(shù)據(jù)與識別對象的文件圖象的區(qū)域進(jìn)行對比檢驗(yàn),此后取得對應(yīng)的代碼數(shù)據(jù)U作為對比檢驗(yàn)的結(jié)果并作為識別的結(jié)果被設(shè)置且輸出,于是允許在指定的區(qū)域中的圖形形式的圖象的識別處理與布局識別處理相關(guān)聯(lián)地進(jìn)行。
特別地,通過記錄任意指定區(qū)域的圖象作為識別對象區(qū)域,該任意區(qū)域可被識別以取得對應(yīng)的代碼數(shù)據(jù)而無需限于字符,并通過動態(tài)地對識別對象區(qū)域與布局信息一同學(xué)習(xí)到布局DB 14中,當(dāng)布局再次出現(xiàn)時,能夠與布局識別處理相關(guān)聯(lián)地進(jìn)行識別對象區(qū)域的識別處理。
進(jìn)而,在本實(shí)施例中,由于對比檢驗(yàn)的對象的區(qū)域特征數(shù)據(jù)與布局信息相關(guān)聯(lián)地被記錄,故對比檢驗(yàn)的對象能夠限制在布局單元中,并從而無需進(jìn)行如普通的字符識別裝置所需的大量對比檢驗(yàn)處理,而能夠達(dá)到高的識別率。
此外,由于多個識別對象區(qū)域可設(shè)置在同一文件中,使得其數(shù)據(jù)具有關(guān)聯(lián)關(guān)系,故能夠彼此匹配地記錄布局中識別對象區(qū)域的位置信息和數(shù)據(jù)結(jié)構(gòu)。
要注意,上述這種特征數(shù)據(jù)識別處理也能夠用于′kanji′項(xiàng)目的′kana′識別處理,或者交換一般轉(zhuǎn)帳文件的客戶/接受者(recipient)的識別處理。
特別地,當(dāng)文件上的′kanji′項(xiàng)目要作為特征數(shù)據(jù)被識別時,則進(jìn)入到′kanji′的項(xiàng)目的區(qū)域被指定為特征區(qū)域,并且對應(yīng)的代碼數(shù)據(jù)輸入到′kana′,并且特征數(shù)據(jù)與代碼數(shù)據(jù)被學(xué)習(xí)且與文件的布局信息一同被記錄。
在采用這一對策之處,如果對具有與另一個被學(xué)習(xí)和識別的文件的布局相同布局的文件進(jìn)行布局識別,則′kana′的代碼數(shù)據(jù)能夠作為′kanji′的項(xiàng)目的特征區(qū)域的識別結(jié)果而取得。
進(jìn)而,類似于′kanji′的項(xiàng)目的特征數(shù)據(jù)識別處理的情形,如果橡皮圖章、簽字等的項(xiàng)目指定為特征數(shù)據(jù)識別項(xiàng)目,則不能通過普通字符識別被識別的橡皮圖章、簽字等的項(xiàng)目能夠被識別,并且對應(yīng)的代碼數(shù)據(jù)能夠作為橡皮圖章、簽字等的特征區(qū)域的識別結(jié)果而取得。
此外,在交換一般的轉(zhuǎn)帳文件中,要被輸入的客戶的全名或者接受者的全名項(xiàng)目是沒有任意組合的,但是具有與文件相關(guān)的關(guān)系(參見圖35和36)。
于是,通過學(xué)習(xí)和記錄,當(dāng)客戶或者接受者的全名要作為特征數(shù)據(jù)識別項(xiàng)目、在鏈接關(guān)系中它們的關(guān)系被學(xué)習(xí)和記錄時,在特征數(shù)據(jù)對比檢驗(yàn)時能夠進(jìn)行高精度的識別。
(a6)標(biāo)題分析處理的說明在根據(jù)本發(fā)明該數(shù)據(jù)媒體處理裝置30中,是自動地進(jìn)行標(biāo)題分析處理的,其中從分析對象文件圖象的劃線項(xiàng)目結(jié)構(gòu)和對應(yīng)于文件上所輸入的標(biāo)題的項(xiàng)目信息搜尋并對比檢驗(yàn)標(biāo)題位置。
這里,根據(jù)本實(shí)施例的數(shù)據(jù)媒體處理裝置30包括布局分析處理步驟A2(或者A9)邏輯表示讀取的圖象布局,以及布局對比檢驗(yàn)處理步驟A3(或者A10)對比檢驗(yàn)在布局DB 14中是否存在與讀取的圖象的布局相符的布局.該布局分析處理步驟A2(或者A9)抽取讀取的圖象布局的劃線項(xiàng)目,分析布局的結(jié)構(gòu),從抽取的劃線項(xiàng)目判定圖象中的標(biāo)題區(qū)域,識別標(biāo)題區(qū)域中的標(biāo)題項(xiàng)目信息以判定對應(yīng)的項(xiàng)目數(shù)據(jù)并邏輯表示該布局,而這些是由布局分析處理部分2的布局分析部分2B實(shí)現(xiàn)的。
該布局分析處理步驟A2(或者A9)包括基于布局結(jié)構(gòu)分析的結(jié)果判定標(biāo)題位置備選項(xiàng)的標(biāo)題位置備選判定步驟,以及標(biāo)題項(xiàng)目對比檢驗(yàn)步驟,在該步驟對標(biāo)題區(qū)域中的標(biāo)題項(xiàng)目信息與在標(biāo)題位置備選判定步驟所判定的標(biāo)題位置備選項(xiàng)進(jìn)行對比檢驗(yàn)。
要注意,標(biāo)題項(xiàng)目對比檢驗(yàn)步驟中的標(biāo)題項(xiàng)目的對比檢驗(yàn)處理,是在標(biāo)題項(xiàng)目對比檢驗(yàn)步驟中,對要被對比檢驗(yàn)的圖象數(shù)據(jù)按上述參照圖49那種方式進(jìn)行正規(guī)化處理之后實(shí)現(xiàn)的。
另一方面,布局對比檢驗(yàn)處理步驟A3(或者A10)應(yīng)用在布局分析處理步驟所抽取的布局的劃線項(xiàng)目作為檢索限制項(xiàng)而檢索布局DB 14中存儲的備選布局,要被對比檢驗(yàn)是否有相符的備選布局,而這是由布局對比檢驗(yàn)處理部分3實(shí)現(xiàn)的。
這里,在圖37中示出標(biāo)注出根據(jù)本實(shí)施例的數(shù)據(jù)媒體處理裝置30布局分析處理部分2的布局分析部分2B的標(biāo)題分析處理的示意圖。
如在圖37中所見,布局分析部分2B進(jìn)行作為標(biāo)題位置備選判定步驟K9的處理,這包括劃線項(xiàng)目結(jié)構(gòu)分析處理(步驟K1)以及項(xiàng)目標(biāo)題位置搜尋處理(步驟K2),并然后進(jìn)行作為標(biāo)題項(xiàng)目對比檢驗(yàn)步驟K10的處理,這包括項(xiàng)目標(biāo)題對比檢驗(yàn)處理(K3),超復(fù)數(shù)特征數(shù)據(jù)抽取對比檢驗(yàn)處理(步驟K4),標(biāo)題對比檢驗(yàn)結(jié)果校正處理(步驟K5),項(xiàng)目數(shù)據(jù)位置搜尋處理(步驟K6),項(xiàng)目數(shù)據(jù)部分鏈接處理(步驟K7)及款額項(xiàng)目鏈接處理(步驟K8)。
分析字典13存儲標(biāo)題搜尋規(guī)則505,項(xiàng)目標(biāo)題字典507,標(biāo)題校正規(guī)則508以及數(shù)據(jù)搜尋規(guī)則509。
在劃線項(xiàng)目結(jié)構(gòu)分析處理(步驟K1)中,參照通過布局分析所獲得的劃線項(xiàng)目信息502和表格結(jié)構(gòu)信息(未示出)而產(chǎn)生一劃線項(xiàng)目結(jié)構(gòu)信息表(劃線項(xiàng)目結(jié)構(gòu)信息TBL)503作為以標(biāo)題位置搜尋規(guī)則待評價的規(guī)則關(guān)鍵信息,這將在以下說明。
作為由布局分析部分2B的表格結(jié)構(gòu)分析部分2E表格結(jié)構(gòu)分析的一個結(jié)果,示于圖38的這種結(jié)構(gòu)信息被添加到各個劃線項(xiàng)目中。
以下將參照圖38說明劃線項(xiàng)目信息502。劃線項(xiàng)目ID是用于各個劃線項(xiàng)目標(biāo)識的ID信息,并在劃線項(xiàng)目抽取時進(jìn)行唯一的編號。組ID是當(dāng)劃線項(xiàng)目被分組時加到相同組的標(biāo)識ID。塊ID是用于各個單元之間標(biāo)識的ID,同一組被劃分為單元而具有相同劃線項(xiàng)目結(jié)構(gòu)。
表格結(jié)構(gòu)表示由一個組ID標(biāo)識的劃線項(xiàng)目是否具有一表格結(jié)構(gòu),并為了防止表格結(jié)構(gòu)的存在與不存在之間的鑒別被固定,表格結(jié)構(gòu)的存在與不存在之間的鑒別以項(xiàng)目行數(shù)/項(xiàng)目列數(shù)進(jìn)行。要注意,項(xiàng)目行數(shù)表示劃線項(xiàng)目表格的行結(jié)構(gòu)以一組的表格矩形出現(xiàn),而項(xiàng)目列數(shù)表示劃線項(xiàng)目表格的列結(jié)構(gòu)以一組的表格矩形出現(xiàn)。
進(jìn)而,劃線項(xiàng)目屬性是各個劃線項(xiàng)目作為布局的成分的屬性信息,并且屬性與文件布局的對應(yīng)關(guān)系示于圖39中。
如在圖39中所見,可得到以下項(xiàng)目作為不同于表格結(jié)構(gòu)的劃線項(xiàng)目的劃線項(xiàng)目。
(a)1劃線項(xiàng)目[1](b)2劃線項(xiàng)目[2](c)塊劃線項(xiàng)目[B](d)嵌套劃線項(xiàng)目[I]同時,如在圖39中所見,可獲得以下項(xiàng)目作為表格結(jié)構(gòu)劃線項(xiàng)目。
(e)屬于標(biāo)題行的劃線項(xiàng)目[H]
(f)屬于腳注行的劃線項(xiàng)目[F](g)屬于本體行的劃線項(xiàng)目[D](h)屬于向上凸起的劃線項(xiàng)目[U](i)屬于向下凸起的劃線項(xiàng)目[L]要注意,由于圖39所示的文件布局不包含腳注行,而且(f)屬于腳注線的劃線項(xiàng)目不出現(xiàn)。
同時,(a)到(i)的[]中出現(xiàn)的1,2,B,I,H,F(xiàn),D,U和L為各個劃線屬性的代碼。
順便來說,行信息指示在劃線項(xiàng)目表格中的劃線項(xiàng)目行數(shù),而列信息指示在劃線項(xiàng)目表格中的劃線項(xiàng)目列數(shù)。
例如如圖39(d)中所示,同時,層次信息指示作為劃線項(xiàng)目屬性的具有嵌套結(jié)構(gòu)的劃線項(xiàng)目層次關(guān)系。
進(jìn)而,頂/末指示同一組中劃線項(xiàng)目的位置信息。
然后,參照通過布局分析所獲得的上述這種劃線項(xiàng)目信息502和表格結(jié)構(gòu)信息而產(chǎn)生劃線項(xiàng)目結(jié)構(gòu)信息表格(TBL)503[參照圖40和41(a)到41(d)]。
另一方面,在項(xiàng)目本體位置搜尋處理(步驟K2)中,在步驟K1中所產(chǎn)生的劃線項(xiàng)目結(jié)構(gòu)信息表格503的劃線項(xiàng)目以標(biāo)題位置搜尋規(guī)則評價[參見圖42,43(a)和43(b)]以便判定標(biāo)題位置備選項(xiàng)。
標(biāo)題搜尋規(guī)則505設(shè)計(jì)為就供分析的對象文件在確認(rèn)度中以它們較高階的一個開始,而對象文件為交換一般轉(zhuǎn)帳文件(第一階表格)的標(biāo)題搜尋規(guī)則505的一個例子給出如下。
首先,以下說明不是用于表格結(jié)構(gòu)的標(biāo)題位置搜尋規(guī)則。
非表格結(jié)構(gòu)的劃線項(xiàng)目可能包含向上凸起的劃線項(xiàng)目,向下凸起的劃線項(xiàng)目及包含屬于同一組作為表格結(jié)構(gòu)的腳注的劃線項(xiàng)目,和屬于非表格結(jié)構(gòu)組的一組而且不形成一個表格的劃線項(xiàng)目,并且以下將說明用于這些劃線項(xiàng)目的標(biāo)題位置搜尋規(guī)則。
(a)在涉及單個劃線項(xiàng)目之處,標(biāo)題部分出現(xiàn)在劃線項(xiàng)目中(*數(shù)據(jù)部分共同存在)。
(b)在涉及一嵌套的劃線項(xiàng)目之處,標(biāo)題部分出現(xiàn)在該嵌套的左側(cè)劃線項(xiàng)目處。
(c)在涉及一嵌套的劃線項(xiàng)目之處,標(biāo)題部分出現(xiàn)在該嵌套的上側(cè)劃線項(xiàng)目處。
(d)在涉及兩個或者更多劃線項(xiàng)目之處,標(biāo)題部分出現(xiàn)在頂部劃線項(xiàng)目處。
(e)在涉及兩個或者更多劃線項(xiàng)目之處,標(biāo)題部分出現(xiàn)在頂部劃線項(xiàng)目及下一個劃線項(xiàng)目處。
進(jìn)而,以下將說明用于表格結(jié)構(gòu)部分的標(biāo)題搜尋規(guī)則505。
表格結(jié)構(gòu)劃線項(xiàng)目出現(xiàn)在包含一個表格矩形或者在同一組2行X2列或更多的劃線項(xiàng)目中最大矩形部分,并且標(biāo)頭部分出現(xiàn)在最大矩形部分的頂行,同時本體2部分出現(xiàn)在隨后的行部分。
以下將說明用于上述這種劃線項(xiàng)目的標(biāo)題位置搜尋規(guī)則。
(f)具有多個涉及部分的標(biāo)題項(xiàng)目出現(xiàn)在表格結(jié)構(gòu)部分的頭行。
(g)在表格結(jié)構(gòu)部分的頭行中出現(xiàn)嵌套劃線項(xiàng)目之處,在劃線項(xiàng)目的上側(cè)出現(xiàn)復(fù)標(biāo)題。
(h)在表格結(jié)構(gòu)部分的頭行中出現(xiàn)嵌套劃線項(xiàng)目之處,在劃線項(xiàng)目的下側(cè)出現(xiàn)子標(biāo)題。
當(dāng)布局分析部分2B在步驟K2實(shí)現(xiàn)項(xiàng)目標(biāo)題位置搜尋處理時,例如基于上述這種標(biāo)題搜尋規(guī)則505進(jìn)行對構(gòu)成標(biāo)題對比檢驗(yàn)對象的標(biāo)題位置備選項(xiàng)的判定,并將參照圖44的流程圖說明這時的處理過程。
首先,從在步驟K1所產(chǎn)生的劃線項(xiàng)目結(jié)構(gòu)信息表503抽取劃線項(xiàng)目信息(步驟J1)。
然后,基于標(biāo)題搜尋規(guī)則505進(jìn)行標(biāo)題位置的評價(步驟J2),并記錄評價的結(jié)果到劃線項(xiàng)目結(jié)構(gòu)信息表503(步驟J3)。
這里,要鑒別標(biāo)題位置的評價是否已經(jīng)基于所有的標(biāo)題搜尋規(guī)則505進(jìn)行過,并且如果保留有某個規(guī)則沒有用于標(biāo)題位置的評價,則標(biāo)題位置的評價基于該規(guī)則進(jìn)行(步驟J4到步驟J2和J3)。
進(jìn)而,要鑒別標(biāo)題位置的評價是否已經(jīng)對于所有的劃線項(xiàng)目信息進(jìn)行過,并且如果保留有某個劃線項(xiàng)目信息還沒有用于評價,則對該保留的劃線項(xiàng)目信息進(jìn)行評價(步驟J5到步驟J1和J4)。
然后,在標(biāo)題評價對于所有的劃線項(xiàng)目信息已經(jīng)完成之后,參照操作參數(shù)信息501中的評價參照數(shù)值判定標(biāo)題位置備選項(xiàng)(步驟J6)。
例如,對于圖39所示的文件,由圖45中的網(wǎng)狀(網(wǎng)格部分V)表示的劃線項(xiàng)目判定為標(biāo)題位置備選項(xiàng)。
進(jìn)而,在項(xiàng)目標(biāo)題對比檢驗(yàn)處理中(步驟K3),對于基于標(biāo)題搜尋規(guī)則505所判定的標(biāo)題位置備選項(xiàng)進(jìn)行對于超復(fù)雜特征數(shù)據(jù)的抽取對比檢驗(yàn)處理以便使用項(xiàng)目標(biāo)題字典507對比檢驗(yàn)出現(xiàn)在劃線項(xiàng)目中的項(xiàng)目數(shù)據(jù)(步驟K4)。然后,基于對比檢驗(yàn)的結(jié)果判定標(biāo)題位置備選項(xiàng)的劃線項(xiàng)目的位置與對應(yīng)于該標(biāo)題的功能項(xiàng)目。
這里,將說明構(gòu)成對比檢驗(yàn)對象的標(biāo)題項(xiàng)目數(shù)據(jù)(在標(biāo)題劃線項(xiàng)目中的項(xiàng)目數(shù)據(jù))。標(biāo)題位置備選項(xiàng)的劃線項(xiàng)目可能包括多個標(biāo)題項(xiàng)目數(shù)據(jù)。
這時,通過以下方法判定構(gòu)成對比檢驗(yàn)對象的標(biāo)題項(xiàng)目數(shù)據(jù)。
首先,假設(shè)構(gòu)成對比檢驗(yàn)對象的標(biāo)題項(xiàng)目數(shù)據(jù)為標(biāo)題位置備選項(xiàng)的劃線項(xiàng)目中最大項(xiàng)目數(shù)據(jù),例如如圖46(a)中所見。
這里,如果標(biāo)題是單一功能標(biāo)題,則由于在對比檢驗(yàn)只有一個標(biāo)題項(xiàng)目數(shù)據(jù)起作用,假設(shè)其余的項(xiàng)目數(shù)據(jù)為灰塵或某些裝飾的原來單元,例如如圖46(b)中所見。但是即使在標(biāo)題為復(fù)功能標(biāo)題之處,也要假設(shè)標(biāo)題項(xiàng)目數(shù)據(jù)通常為連續(xù)出現(xiàn)的,例如如圖46(c)中所見。
同時,在如圖47(a)中所見垂直書寫的標(biāo)題或由如圖47(b)或47(c)中那種多行組成的標(biāo)題的情形,則假設(shè)對比檢驗(yàn)對象的標(biāo)題項(xiàng)目數(shù)據(jù)出現(xiàn)在包含連續(xù)項(xiàng)目數(shù)據(jù)的區(qū)域中。
特別地,假設(shè)垂直書寫的項(xiàng)目數(shù)據(jù)是從與頂行的項(xiàng)目數(shù)據(jù)相同的X坐標(biāo)相近的位置開始的,垂直書寫的項(xiàng)目數(shù)據(jù)出現(xiàn)在與隨后的項(xiàng)目數(shù)據(jù)結(jié)合的頂行項(xiàng)目數(shù)據(jù)的區(qū)域中。
然而,在如圖48(a)或48(b)中所示的那種復(fù)標(biāo)題的情形或如圖所示48(c)多行標(biāo)題情形,標(biāo)題項(xiàng)目數(shù)據(jù)不能被正確地判定。
于是,在該處理中,只有在上述狀態(tài)下結(jié)合的區(qū)域被視為項(xiàng)目數(shù)據(jù)處理。
順便來說,在標(biāo)題項(xiàng)目對比檢驗(yàn)步驟K10中的超復(fù)雜特征數(shù)據(jù)抽取對比檢驗(yàn)處理(步驟K4)中,對標(biāo)題項(xiàng)目進(jìn)行正規(guī)化處理。于是,即使在不同文件之間在字體或者印刷字體/印刷間距中存在差別,在對比檢驗(yàn)時要被匹配的標(biāo)題項(xiàng)目數(shù)據(jù)的所有圖象仍能夠存儲到項(xiàng)目標(biāo)題字典507中。
為了克服印刷字體中的差別,采取了一個對策以實(shí)現(xiàn)標(biāo)題項(xiàng)目對比檢驗(yàn),這是通過重心劃分為四部分(手寫字符識別技術(shù))的正規(guī)化處理之后由基于超復(fù)雜字符的對比檢驗(yàn)進(jìn)行的。
同時,為了克服印刷間距的差別,采取了一個對策以便對要被對比檢驗(yàn)的標(biāo)題項(xiàng)目數(shù)據(jù)字符之間的空隙正規(guī)化,如圖49中所見使得它們能具有固定的大小(例如一個點(diǎn))。
進(jìn)而,為了克服項(xiàng)目標(biāo)題的字體的的差別,采取了一個對策,使得表示標(biāo)題表達(dá)方式的多種字體事先在項(xiàng)目標(biāo)題字典507中。
作為超復(fù)雜特征信息在它們正規(guī)化處理之后,項(xiàng)目標(biāo)題字典507事先存儲從采樣文件取得的標(biāo)題項(xiàng)目數(shù)據(jù)的圖象。進(jìn)而,為了吸收標(biāo)題之間字體的差別,指示相同功能的項(xiàng)目標(biāo)題被分類并存儲在相同的類別中,如圖50中所見。
然后,當(dāng)標(biāo)題項(xiàng)目數(shù)據(jù)在步驟K4由字符通過比檢驗(yàn)抽取處理進(jìn)行對比檢驗(yàn)時,類別ID、標(biāo)題圖象ID和各個備選標(biāo)題的差度作為對比檢驗(yàn)的結(jié)果按備選項(xiàng)的順序報(bào)告,如圖51(a)和51(b)中所見。
進(jìn)而,參照操作參數(shù)信息501的標(biāo)題對比檢驗(yàn)參數(shù)(Th1和Th2)判定在標(biāo)題項(xiàng)目位置的標(biāo)題內(nèi)容。
特別,滿足對比檢驗(yàn)結(jié)果的第一備選標(biāo)題差度等于或低于對比檢驗(yàn)參數(shù)(Th1)的要求,以及滿足對比檢驗(yàn)結(jié)果的第一備選項(xiàng)與具有不同類型ID的另一備選項(xiàng)之間的差度差別等于或高于對比檢驗(yàn)參數(shù)(Th2)的差度差別要求的這些內(nèi)容被判定為在標(biāo)題項(xiàng)目位置處的的標(biāo)題內(nèi)容。
例如,在圖51所示的例子中,如果在假設(shè)Th1=1,000和Th2=2,000之下進(jìn)行評價,則獲得以下的結(jié)果,并從而能夠看到對比檢驗(yàn)結(jié)果滿足上述的兩個要求(差度要求和差度差別要求)。
差度要求(350)≤(Th1=1,000)→OK差度差別要求|2,700-350|≥(Th2=2,000)→OK當(dāng)在這種方式下進(jìn)行標(biāo)題項(xiàng)目數(shù)據(jù)的對比檢驗(yàn)時,可能的結(jié)果情形是(情形1),其中所有對比檢驗(yàn)結(jié)果為OK標(biāo)題項(xiàng)目的分析完全成功地進(jìn)行,而另一種情形(情形2),其中對某些標(biāo)題項(xiàng)目的分析不成功,并且另一情形是(情形3),其中對幾乎所有的標(biāo)題項(xiàng)目分析都不成功。
這里,在情形1的情形下,對比檢驗(yàn)的結(jié)果報(bào)告它們是作為標(biāo)題分析的結(jié)果,但是在情形3的情形下,判定標(biāo)題分析結(jié)果是不成功的,并且報(bào)告文件識別的結(jié)果為不符合要求的本意。
另一方面,在情形2的情形下,進(jìn)行標(biāo)題對比檢驗(yàn)結(jié)果的校正處理(步驟K5)。于是,在一特定情形下,能夠?qū)€沒有進(jìn)行分析的標(biāo)題項(xiàng)目進(jìn)行分析。
對于作為標(biāo)題項(xiàng)目的對比檢驗(yàn)的結(jié)果由表格結(jié)構(gòu)部分的標(biāo)題行所定義的基本標(biāo)題項(xiàng)目,在以下情形下,根據(jù)標(biāo)題校正規(guī)則508(使用標(biāo)題校正規(guī)則508的標(biāo)題對比檢驗(yàn)結(jié)果校正處理,步驟K5)進(jìn)行校正。要注意,只有在對比檢驗(yàn)的結(jié)果沒有定義時標(biāo)題校正規(guī)則508才被采用,但是不能在拒絕對比檢驗(yàn)結(jié)果的方式下使用。
這里,如在圖52(a)所見在具有嵌套結(jié)構(gòu)的復(fù)合標(biāo)題項(xiàng)目之一不定義之處,如果使用標(biāo)題校正規(guī)則508進(jìn)行校正,則從復(fù)合標(biāo)題項(xiàng)目的功能項(xiàng)目內(nèi)容能夠唯一地判定其余的功能項(xiàng)目(這是由于在復(fù)合標(biāo)題項(xiàng)目的“NAME OF FINANCIAL ORGAN”情形下,“NAME OF BANK”與“NAME OF BANK OFFICE”必定對應(yīng)于嵌套的標(biāo)題項(xiàng)目),能夠?qū)ι形闯晒Φ乇环治龅臉?biāo)題項(xiàng)目進(jìn)行分析。
進(jìn)而,如在圖52(b)所見,例如如果在只有一般轉(zhuǎn)帳文件的標(biāo)題行中主要項(xiàng)目的標(biāo)題之一不定義之處,使用標(biāo)題校正規(guī)則508進(jìn)行校正,則由于從功能名稱信息表唯一地判定了要包含在標(biāo)題行中的功能項(xiàng)目,故能夠?qū)ι形闯晒Φ乇环治龅臉?biāo)題項(xiàng)目(被嵌套部分W)進(jìn)行分析。
此外,如果如圖52(c)中所見在只有要被包含的非標(biāo)題行的基本標(biāo)題項(xiàng)目之一未定義,并且只有未定義的標(biāo)題備選位置之一出現(xiàn)之處,使用使用標(biāo)題校正規(guī)則508進(jìn)行校正,則在標(biāo)題位置備選項(xiàng)與基本標(biāo)題項(xiàng)目數(shù)目彼此相符之處,能夠?qū)ι形闯晒Φ乇环治龅臉?biāo)題項(xiàng)目(被嵌套部分W)進(jìn)行分析,因?yàn)樗軌蛲ㄟ^任何定義的標(biāo)題的消除法被判定。
要注意,在圖52(a)到52(c)中,尚未成功地被分析的任何標(biāo)題項(xiàng)目由被嵌套部分W表示,而已經(jīng)通過標(biāo)題對比檢驗(yàn)校正處理進(jìn)行了分析的任何其它標(biāo)題項(xiàng)目由另外的被嵌套部分W′表示。
同時,在項(xiàng)目數(shù)據(jù)位置搜尋處理(步驟K6)中,搜尋對應(yīng)于作為標(biāo)題項(xiàng)目對比檢驗(yàn)結(jié)果最后定義的標(biāo)題項(xiàng)目的項(xiàng)目數(shù)據(jù)的劃線項(xiàng)目位置。
首先,類似于對標(biāo)題項(xiàng)目(標(biāo)題劃線項(xiàng)目)位置的搜尋,通過使用數(shù)據(jù)搜尋規(guī)則509評價劃線項(xiàng)目結(jié)構(gòu)信息表503的各個劃線項(xiàng)目,進(jìn)行對應(yīng)于標(biāo)題部分的項(xiàng)目數(shù)據(jù)的劃線項(xiàng)目位置的搜尋。
這里,項(xiàng)目數(shù)據(jù)位置的搜尋與標(biāo)題項(xiàng)目位置的搜尋之不同在于,在項(xiàng)目數(shù)據(jù)位置搜尋情形下,由于標(biāo)題項(xiàng)目已經(jīng)被定義,故首先評價標(biāo)題以便選擇搜尋規(guī)則,并然后把該規(guī)則用于各個劃線項(xiàng)目,而在標(biāo)題項(xiàng)目位置搜尋的情形下,因?yàn)樯婕皹?biāo)題項(xiàng)目的對比檢驗(yàn)處理,故首先判定標(biāo)題位置的備選項(xiàng),在項(xiàng)目數(shù)據(jù)位置搜尋的情形下,項(xiàng)目數(shù)據(jù)位置必須作為搜尋處理的結(jié)果判定。
然后,在搜尋項(xiàng)目數(shù)據(jù)位置中,基于劃線項(xiàng)目結(jié)構(gòu)信息表503和數(shù)據(jù)搜尋規(guī)則509,判定對應(yīng)于已經(jīng)判定的標(biāo)題項(xiàng)目的項(xiàng)目數(shù)據(jù)位置(項(xiàng)目數(shù)據(jù)的劃線項(xiàng)目位置)。
然后將參照圖53的流程圖說明該操作。首先抽取通過標(biāo)題分析所判定的標(biāo)題項(xiàng)目信息(步驟L1),并判定對應(yīng)于這樣抽取的標(biāo)題項(xiàng)目的數(shù)據(jù)搜尋規(guī)則509(步驟L2)。
此后,從劃線項(xiàng)目結(jié)構(gòu)信息表503抽取劃線項(xiàng)目信息(步驟L3),并以數(shù)據(jù)搜尋規(guī)則509進(jìn)行評價(步驟L4)。
然后,由該評價的結(jié)果判定項(xiàng)目數(shù)據(jù)位置,并作為功能名稱信息設(shè)置所判定的項(xiàng)目數(shù)據(jù)位置的劃線ID(步驟L5)。
進(jìn)而,鑒別是否對于所有的劃線項(xiàng)目信息已經(jīng)完成評價,并且如果評價已經(jīng)完成,則繼而進(jìn)行對于下一個劃線項(xiàng)目信息的評價(步驟L6和L3到L5)。
進(jìn)而,鑒別是否對應(yīng)于所有的標(biāo)題項(xiàng)目信息的項(xiàng)目數(shù)據(jù)位置都已經(jīng)被判定,如果還遺留有其項(xiàng)目數(shù)據(jù)位置沒有被判定的標(biāo)題項(xiàng)目,則對下一個標(biāo)題項(xiàng)目信息進(jìn)行處理(步驟L7和L2到L6)。
這里,除非涉及表格結(jié)構(gòu),則標(biāo)題部分劃線項(xiàng)目與涉及部分劃線項(xiàng)目之間的連接規(guī)則按以下方式定義。
(a)數(shù)據(jù)部分的劃線項(xiàng)目為跟隨標(biāo)題部分的劃線項(xiàng)目[參見圖54(a)和54(b)]。
(b)在沒有跟隨標(biāo)題部分的劃線項(xiàng)目之處,數(shù)據(jù)部分出現(xiàn)在該標(biāo)題部分的同一劃線項(xiàng)目中[參見圖54(c)]。
(c)在多個劃線項(xiàng)目跟隨標(biāo)題部分之處,數(shù)據(jù)部分出現(xiàn)在直到另一個無關(guān)的標(biāo)題出現(xiàn)的位置的劃線項(xiàng)目中[參見圖54(d)和54(e)]。
(d)在標(biāo)題部分以嵌套的劃線項(xiàng)目成對出現(xiàn)之處,數(shù)據(jù)部分出現(xiàn)在子劃線項(xiàng)目中[參見圖54(f)和54(g)]。
(e)在出現(xiàn)兩個劃線項(xiàng)目之處,有可能標(biāo)題部分與數(shù)據(jù)部分會出現(xiàn)在同一劃線項(xiàng)目中[參見圖54(h)]。
同時,在涉及表格結(jié)構(gòu)之處,標(biāo)題部分劃線項(xiàng)目與涉及部分劃線項(xiàng)目之間的連接規(guī)則按以下方式定義。
(f)在表格為垂直的一維表格之處,數(shù)據(jù)部分跟隨標(biāo)題劃線項(xiàng)目的列方向的劃線項(xiàng)目[參見圖55(a)]。
(g)在表格為垂直的一維表格并且標(biāo)題包含兩列之處,數(shù)據(jù)部分跟隨標(biāo)題劃線項(xiàng)目的列方向的劃線項(xiàng)目[參見圖55(b)]。
(h)在表格為垂直的一維表格并且標(biāo)題包含嵌套項(xiàng)目之處,數(shù)據(jù)部分跟隨成對的標(biāo)題劃線項(xiàng)目方向的劃線項(xiàng)目[參見圖55(c)]。
(i)在表格為垂直的一維表格并且標(biāo)題為復(fù)合標(biāo)題之處,數(shù)據(jù)部分跟隨復(fù)合標(biāo)題劃線項(xiàng)目列方向的劃線項(xiàng)目[參見圖55(d)]。
(j)在表格為水平一維表格之處,數(shù)據(jù)部分跟隨標(biāo)題劃線項(xiàng)目的行方向的劃線項(xiàng)目[參見圖55(e)]。
(k)在表格為二維表格之處,數(shù)據(jù)部分跟隨標(biāo)題劃線項(xiàng)目的列/行方向的劃線項(xiàng)目[參見圖55(f)]。
這里,對應(yīng)于標(biāo)題項(xiàng)目的項(xiàng)目數(shù)據(jù)位置的判定例子示于圖56中。要注意,在圖56中,每一標(biāo)題項(xiàng)目的判定位置是由網(wǎng)格部分X指示的,同時項(xiàng)目數(shù)據(jù)位置由X′表示,標(biāo)題項(xiàng)目判定位置與項(xiàng)目數(shù)據(jù)位置之間的鏈接關(guān)系由箭頭標(biāo)號表示。
進(jìn)而,在項(xiàng)目數(shù)據(jù)部分鏈接處理(步驟K7)中,參照對應(yīng)于標(biāo)題劃線項(xiàng)目的數(shù)據(jù)部分劃線項(xiàng)目的位置而判定數(shù)據(jù)部分劃線項(xiàng)目中項(xiàng)目數(shù)據(jù)的位置并設(shè)置它們之間的鏈接關(guān)系。
從標(biāo)題部分到對應(yīng)的項(xiàng)目數(shù)據(jù)部分的鏈接關(guān)系示于圖57和58。
這里,在多于一個項(xiàng)目數(shù)據(jù)出現(xiàn)在劃線項(xiàng)目中或者其中出現(xiàn)項(xiàng)目數(shù)據(jù)部分的矩形區(qū)域中之處,則根據(jù)操作參數(shù)信息501判定要與功能項(xiàng)目鏈接的項(xiàng)目數(shù)據(jù)。
在要從單一功能項(xiàng)目被鏈接之處,從指定的行和列位置根據(jù)操作參數(shù)信息501鏈接指定行數(shù)和指定列數(shù)項(xiàng)目數(shù)據(jù)[參見59(a)]。
這里,在要從單一功能項(xiàng)目被鏈接之處,項(xiàng)目數(shù)據(jù)鏈接的操作參數(shù)信息501包括以下信息。
(a)鏈接由一指定行開始的指定數(shù)目的行(*缺省指定行=第一行,指定行數(shù)=一行)。然而,在項(xiàng)目數(shù)據(jù)行數(shù)目小于指定行數(shù)目之處,鏈接區(qū)域中所有的項(xiàng)目數(shù)據(jù)行。
(b)鏈接由一指定列開始的指定數(shù)目的列(*缺省指定列=第一列,指定列數(shù)=所有的列數(shù))。然而,在項(xiàng)目數(shù)據(jù)列數(shù)目小于指定列數(shù)目之處,鏈接區(qū)域中所有的項(xiàng)目數(shù)據(jù)列。
另一方面,在要從復(fù)合功能項(xiàng)目鏈接之處,根據(jù)操作參數(shù)信息501按功能項(xiàng)目的定義順序鏈接來自指定行和指定列的指定行數(shù)和指定列數(shù)的項(xiàng)目數(shù)據(jù)[參見59圖(b)]。
這里,在要從復(fù)合功能項(xiàng)目鏈接之處,項(xiàng)目數(shù)據(jù)鏈接的操作參數(shù)信息501包括以下信息。
(c)在N≥K并且M<K之處,項(xiàng)目數(shù)據(jù)行按功能項(xiàng)目鏈接順序分配。
(d)在N<K并且M≥K之處,項(xiàng)目數(shù)據(jù)列按功能項(xiàng)目鏈接順序分配。
(e)在N≥K并且M≥K之處,項(xiàng)目數(shù)據(jù)行按功能項(xiàng)目鏈接順序分配。
(f)在N≥K并且M≥K之處,項(xiàng)目數(shù)據(jù)列按功能項(xiàng)目鏈接順序分配。
(g)在N<K并且M<K之處,分配不可能,故項(xiàng)目數(shù)據(jù)不鏈接。
要注意,在以上說明中,N是項(xiàng)目行數(shù),M是項(xiàng)目列數(shù),而K是功能項(xiàng)目數(shù)。
然后,在款額鏈接處理(步驟K8)中,在被分析的標(biāo)題項(xiàng)目的功能項(xiàng)目是一款額,一項(xiàng)服務(wù)費(fèi)等之處,校驗(yàn)對應(yīng)的項(xiàng)目數(shù)據(jù)屬于其中的劃線項(xiàng)目,并且如果該結(jié)構(gòu)為列定界的劃線項(xiàng)目,則各個單一列劃線項(xiàng)目彼此連接而形成單一項(xiàng)目數(shù)據(jù)信息,并且項(xiàng)目數(shù)據(jù)鏈接到功能項(xiàng)目。
這里,在對應(yīng)于標(biāo)題部分的項(xiàng)目數(shù)據(jù)部分劃分為三個或者更多的(根據(jù)操作參數(shù)指定數(shù)值)劃線項(xiàng)目,且各個劃線項(xiàng)目的尺寸低于操作參數(shù)設(shè)定值,此外判定了標(biāo)題功能為一款額之處,則鑒別出劃線項(xiàng)目為列定界劃線項(xiàng)目[參見圖60(a)和60(b)]。
然后,如果鑒別出項(xiàng)目數(shù)據(jù)部分的劃線項(xiàng)目是由一列定界劃線項(xiàng)目形成的,則各個劃線項(xiàng)目鏈接之間的關(guān)系從頂列的劃線項(xiàng)目開始相繼設(shè)置,并作為相繼的劃線項(xiàng)目處理劃線項(xiàng)目以連接這些劃線項(xiàng)目[參見圖60(c)]。
進(jìn)而在項(xiàng)目數(shù)據(jù)部分的劃線項(xiàng)目是由對列定界劃線項(xiàng)目形成之處,由于各個劃線項(xiàng)目中的項(xiàng)目數(shù)據(jù)也是被劃分的狀態(tài),故對各個劃項(xiàng)目數(shù)據(jù)組合處理以設(shè)置它們?yōu)閱我豁?xiàng)目數(shù)據(jù),彼此連接這些項(xiàng)目數(shù)據(jù)[參見圖60(d)]。
要注意,雖然以上說明了劃線項(xiàng)目為一列定界劃線項(xiàng)目的情形,三列對講機(jī)劃線項(xiàng)目也可以類似的方式處理。
又對于三列定界款額部分,劃線項(xiàng)目與項(xiàng)目數(shù)據(jù)的連接按與單列定界款額部分的情形類似的方式進(jìn)行。然而,由于三列定界款額部分具有較小的列寬度和較小的劃線項(xiàng)目數(shù),故設(shè)置了與單列定界款額部分不同的要求[參見圖60(e)和60(f)]。
當(dāng)具有上述結(jié)構(gòu)的根據(jù)本發(fā)明的該實(shí)施例的數(shù)據(jù)媒體處理裝置30進(jìn)行標(biāo)題分析處理時,在布局分析處理步驟A2(或A9)中,抽取所讀取的圖象的布局特征以便分析布局的結(jié)構(gòu),并校驗(yàn)所抽取的特征判定圖象中的標(biāo)題區(qū)域。然后,識別標(biāo)題標(biāo)題區(qū)域中的標(biāo)題項(xiàng)目信息并判定對應(yīng)的項(xiàng)目數(shù)據(jù),并邏輯上表示該布局。
然后,在布局對比檢驗(yàn)處理步驟A3(或A10)中,應(yīng)用在布局分析處理步驟A2(或A9)所抽取的布局特征作為限制檢索項(xiàng),檢索存儲在布局DB 14中的備選布局,以便對比檢驗(yàn)是否存在相符的備選布局。
這樣,應(yīng)用根據(jù)本發(fā)明該實(shí)施例的數(shù)據(jù)媒體處理裝置30,由于在供分析的對象文件上所描述的標(biāo)題項(xiàng)目和對應(yīng)于該標(biāo)題項(xiàng)目的項(xiàng)目數(shù)據(jù)能夠通過進(jìn)行了標(biāo)題分析處理之后的布局識別處理進(jìn)行標(biāo)識,其中在標(biāo)題分析處理中,從文件的圖象劃線項(xiàng)目結(jié)構(gòu)搜尋和對比檢驗(yàn)標(biāo)題位置并自動分析對應(yīng)于文件上所描述的標(biāo)題的項(xiàng)目信息,故在沒有進(jìn)行標(biāo)題項(xiàng)目的字符識別處理之下能夠立即進(jìn)行項(xiàng)目數(shù)據(jù)的字符識別。
(a7)對識別結(jié)果的確認(rèn)和修改處理的說明(1)圖象數(shù)據(jù)顯示裝置的說明圖61是表示本發(fā)明該實(shí)施例的圖象數(shù)據(jù)顯示裝置640的結(jié)構(gòu)的示意圖。圖象數(shù)據(jù)顯示裝置640通過作為圖象數(shù)據(jù)顯示其上描述了一個人(這個人由其姓名確定)要匯款,帳號(帳目No.),匯款額度等等的文件進(jìn)行匯款請求處理,并通過操作者操作鍵盤等輸入諸如帳號,姓名,及匯款額度等匯款數(shù)據(jù),,或者通過操作者的目視觀察進(jìn)行確認(rèn)由其它什么裝置等所進(jìn)行的圖象數(shù)據(jù)(匯款數(shù)據(jù))的字符識別結(jié)果是正確或錯誤并必要時對字符識別結(jié)果進(jìn)行修改而進(jìn)行匯款請求處理。圖象數(shù)據(jù)顯示裝置640對應(yīng)于圖6所示的數(shù)據(jù)媒體處理裝置的客戶機(jī)10。
特別,圖象數(shù)據(jù)顯示裝置640是這樣構(gòu)造的雖然操作者能夠目視觀察顯示在一顯示單元上的圖象數(shù)據(jù)并進(jìn)行輸入操作,但是例如當(dāng)文件由諸如OCR裝置這樣的圖象數(shù)據(jù)處理裝置讀取時,字符識別字符識別能夠自動地進(jìn)行,并且操作者能夠進(jìn)行僅涉及被錯誤識別的或尚未成功地識別的字符輸入操作。
圖61所示的圖象數(shù)據(jù)顯示裝置640包括作為圖象數(shù)據(jù)輸入裝置的一個圖象掃描器621A和一個光學(xué)字符閱讀裝置(OCR裝置)621B,一個作為數(shù)據(jù)輸入裝置的鍵盤631,一個作為顯示控制裝置的計(jì)算機(jī)主機(jī)629,一個顯示單元630和一個硬盤622。
要注意,圖象數(shù)據(jù)顯示裝置640是連接到圖6所示的服務(wù)器39上的,其功能是作為工作站從圖象掃描器621A向服務(wù)器39輸出圖象數(shù)據(jù)(匯款數(shù)據(jù)),檢索由服務(wù)器39所識別的圖象數(shù)據(jù)字符的字符識別結(jié)果,并在顯示單元630上顯示檢索出的字符識別結(jié)果,并向服務(wù)器39輸出由操作者確認(rèn)和修改過的匯款數(shù)據(jù)。
圖象掃描器621A閱讀標(biāo)號多個項(xiàng)目的銀行的匯款請求票據(jù)等的文件,并向圖象數(shù)據(jù)顯示裝置640輸入圖象數(shù)據(jù)。
OCR裝置621B類似于圖象掃描器6221A,閱讀圖象數(shù)據(jù)并進(jìn)行所讀取的圖象數(shù)據(jù)的字符識別。
在本實(shí)施例中,對于圖象數(shù)據(jù)顯示裝置640裝設(shè)了圖象掃描器621A和OCR裝置621B這兩者,以便能夠處理各種格式的圖象數(shù)據(jù)。
要注意,在圖象數(shù)據(jù)由OCR裝置621B閱讀之處,圖象數(shù)據(jù)的字符識別結(jié)果是顯示在圖象數(shù)據(jù)顯示裝置640的顯示單元630上的。
顯示單元630具有一個圖象數(shù)據(jù)顯示區(qū)域611和一個項(xiàng)目數(shù)據(jù)顯示區(qū)域614,并如圖70中所見那樣顯示輸入的文件圖象數(shù)據(jù)。
這里,圖象數(shù)據(jù)顯示區(qū)域611是這樣一個區(qū)域部分,在其中要顯示從圖象掃描器621A或OCR裝置621B輸入的文件圖象數(shù)據(jù)。
圖象數(shù)據(jù)顯示區(qū)域611顯示包括多個項(xiàng)目信息的圖象數(shù)據(jù),并在圖70中顯示包括“帳號(帳戶No.)”,“姓名”,“代理銀行(交易)”和“款額”四個項(xiàng)目612的信息的圖象數(shù)據(jù)。
設(shè)置項(xiàng)目數(shù)據(jù)顯示區(qū)域614是為了使用鍵盤631輸入對應(yīng)于圖象數(shù)據(jù)顯示區(qū)域611所希望的一個項(xiàng)目612的圖象數(shù)據(jù)部分的匯款數(shù)據(jù)。
項(xiàng)目數(shù)據(jù)顯示區(qū)域614具有多個數(shù)據(jù)輸入顯示區(qū)域部分615。在圖70中,圖象數(shù)據(jù)顯示區(qū)域614具有四個數(shù)據(jù)輸入顯示區(qū)域部分615即“項(xiàng)目1到項(xiàng)目4”,其中“項(xiàng)目1”對應(yīng)于“帳號”;“項(xiàng)目2”對應(yīng)于“姓名”;“項(xiàng)目3”對應(yīng)于“交易”;和“項(xiàng)目4”對應(yīng)于“款額”。
所希望的數(shù)據(jù)輸入顯示區(qū)部分615之一由光標(biāo)指示器616表示,并能夠輸入顯示在所希望的對應(yīng)于它的項(xiàng)目612之一的圖象數(shù)據(jù)部分的匯款數(shù)據(jù)。要注意,數(shù)據(jù)的輸入能夠使用作為數(shù)據(jù)輸入裝置的鍵盤631進(jìn)行。
進(jìn)而,圖61中所示的圖象數(shù)據(jù)顯示裝置640包括上述的硬盤622。硬盤622作為用于存儲作為定義信息的圖象數(shù)據(jù)分區(qū)信息定義存儲部分。要注意,圖象數(shù)據(jù)分區(qū)信息表示用于把從圖象掃描器621A或者OCR裝置621B輸入的文件圖象數(shù)據(jù)劃分為多個項(xiàng)目612的圖象數(shù)據(jù)部分的信息。
示于圖61的計(jì)算機(jī)主機(jī)629功能是作為顯示控制裝置(以下計(jì)算機(jī)主機(jī)629能夠稱為顯示控制裝置629),并在圖象數(shù)據(jù)顯示區(qū)域611中顯示通過從圖象掃描器621A或者OCR裝置621B輸入的圖象數(shù)據(jù)所獲得的圖象數(shù)據(jù)。進(jìn)而計(jì)算機(jī)主機(jī)629還指示,當(dāng)對應(yīng)于所希望的項(xiàng)目612之一的圖象數(shù)據(jù)部分的數(shù)據(jù)從鍵盤613被輸入時,光標(biāo)指示器616在用于項(xiàng)目數(shù)據(jù)顯示區(qū)域614中所希望的項(xiàng)目612的數(shù)據(jù)輸入顯示區(qū)域615。
計(jì)算機(jī)主機(jī)629使用存儲在硬盤622的圖象數(shù)據(jù)分區(qū)信息,識別從圖象掃描器621A或者OCR裝置612B輸入的文件的圖象數(shù)據(jù)的劃線,轉(zhuǎn)換該劃線為包含多個項(xiàng)目612圖象數(shù)據(jù)部分的表格,并在圖象數(shù)據(jù)顯示區(qū)域611中顯示通過轉(zhuǎn)換所獲得的圖象數(shù)據(jù)。
進(jìn)而,圖61和62所示計(jì)算機(jī)主機(jī)629并作為顯示控制裝置包括一個強(qiáng)調(diào)信息產(chǎn)生處理部分623,一個作為圖象數(shù)據(jù)局部強(qiáng)調(diào)顯示裝置的強(qiáng)調(diào)顯示部分624,一個作為圖象數(shù)據(jù)強(qiáng)調(diào)顯示刪除裝置的強(qiáng)調(diào)顯示刪除部分625,一個作為強(qiáng)調(diào)顯示轉(zhuǎn)移控制裝置的強(qiáng)調(diào)顯示轉(zhuǎn)移控制部分626和作為顯示屏幕滾動裝置的屏幕滾動部分627。
強(qiáng)調(diào)信息產(chǎn)生處理部分623參照從作為圖象數(shù)據(jù)輸入裝置所輸入的圖象數(shù)據(jù),或存儲在硬盤622上的圖象數(shù)據(jù)劃分信息(定義信息),以產(chǎn)生相關(guān)信息P和強(qiáng)調(diào)信息Q。
如圖68中所見,相關(guān)信息P是用于使得“項(xiàng)目1到項(xiàng)目4”在與“帳號”,“姓名”,“交易”和“款額”的對應(yīng)關(guān)系中分別相關(guān)的信息。
強(qiáng)調(diào)信息Q是用于在圖象數(shù)據(jù)顯示區(qū)域611中進(jìn)行強(qiáng)調(diào)顯示的信息,并具有包含對應(yīng)于指示項(xiàng)目612的科目“科目1到科目4”的強(qiáng)調(diào)顯示類型的強(qiáng)調(diào)顯示屬性信息,以及一個強(qiáng)調(diào)顯示區(qū)域。要注意,“科目1到科目4”分別對應(yīng)于“帳號”,“姓名”,“交易”和“款額”。
進(jìn)而,強(qiáng)調(diào)顯示類型包括一個網(wǎng)格,一個裝飾劃線等等,并在本實(shí)施例中,作為強(qiáng)調(diào)顯示,向?qū)?yīng)于“科目1”和“科目3”的項(xiàng)目612顯示設(shè)置一個寬框顯示方式,并向?qū)?yīng)于“科目2”和“科目4”的項(xiàng)目顯示設(shè)置一個網(wǎng)格顯示方式,使得“科目1到科目4”順序地被強(qiáng)調(diào)顯示,能夠設(shè)置不同的強(qiáng)調(diào)顯示以達(dá)到較高的可視性。
同時,強(qiáng)調(diào)顯示區(qū)域使用包含X坐標(biāo)和Y坐標(biāo)的坐標(biāo)(以點(diǎn)為單位)指示任何項(xiàng)目612的強(qiáng)調(diào)顯示部分613的開始和結(jié)束,并且對于每一項(xiàng)目612可任意設(shè)置強(qiáng)調(diào)顯示部分613的尺寸。
相關(guān)信息P和強(qiáng)調(diào)信息Q在圖64所示的流程圖的步驟A1′和A2′中產(chǎn)生。
如果在計(jì)算機(jī)主機(jī)629的控制之下,在其中包含多個項(xiàng)目的信息的圖象數(shù)據(jù)顯示在圖象數(shù)據(jù)顯示區(qū)域611中的狀態(tài)下,在項(xiàng)目數(shù)據(jù)顯示區(qū)域614中對于項(xiàng)目612數(shù)據(jù)輸入顯示區(qū)域部分615之內(nèi)對于所希望的項(xiàng)目612之一的數(shù)據(jù)輸入顯示區(qū)域部分615之一之處,光標(biāo)指示器616被指示,則強(qiáng)調(diào)顯示部分624僅強(qiáng)調(diào)顯示對應(yīng)于如由標(biāo)號613所指的數(shù)據(jù)輸入顯示區(qū)域部分615的所希望的項(xiàng)目612之一的圖象數(shù)據(jù)部分。
特別地,當(dāng)在用于所希望的項(xiàng)目612之一的數(shù)據(jù)輸入顯示區(qū)域部分615中指示光標(biāo)指示器616時,當(dāng)通過目視觀察要進(jìn)行圖象數(shù)據(jù)與輸入項(xiàng)目之間的匹配以允許進(jìn)行平滑的輸入操作時,則強(qiáng)調(diào)顯示部分624僅強(qiáng)調(diào)顯示對應(yīng)于對帶有提高可視性的網(wǎng)格、裝飾劃線等項(xiàng)目612的數(shù)據(jù)輸入顯示區(qū)域部分615的圖象數(shù)據(jù)部分。
進(jìn)而,強(qiáng)調(diào)顯示刪除部分625刪除由強(qiáng)調(diào)顯示部分624所強(qiáng)調(diào)的所希望的項(xiàng)目612之一的圖象數(shù)據(jù)部分的強(qiáng)調(diào)顯示部分613,以便轉(zhuǎn)換項(xiàng)目612的顯示為該強(qiáng)調(diào)顯示之前的狀態(tài)。特別地,如果光標(biāo)指示器616通過光標(biāo)移動操作移動到不同于對于所希望的項(xiàng)目612之一的數(shù)據(jù)輸入顯示區(qū)域部分615的對于另一個項(xiàng)目612之一的數(shù)據(jù)輸入顯示區(qū)域部分616,則強(qiáng)調(diào)顯示刪除部分625刪除對應(yīng)于該項(xiàng)目的圖象數(shù)據(jù)部分的強(qiáng)調(diào)顯示部分613。
強(qiáng)調(diào)顯示轉(zhuǎn)移控制部分626的作用在于與強(qiáng)調(diào)顯示刪除部分625的聯(lián)鎖關(guān)系,并進(jìn)行控制,使得在強(qiáng)調(diào)顯示刪除部分625刪除對應(yīng)的一定的項(xiàng)目612之一的圖象數(shù)據(jù)部分的強(qiáng)調(diào)顯示部分613之后,移動光標(biāo)指示器616到對于另一個項(xiàng)目612的數(shù)據(jù)輸入顯示區(qū)域部分615,并只有對應(yīng)于對于由光標(biāo)指示器616所指示的項(xiàng)目612的數(shù)據(jù)輸入顯示區(qū)域部分615的項(xiàng)目612的圖象數(shù)據(jù)部分由強(qiáng)調(diào)顯示部分624強(qiáng)調(diào)顯示。
進(jìn)而,屏幕滾動部分627從圖象數(shù)據(jù)的部分顯示在顯示單元630的狀態(tài),顯示在顯示單元630上沒有顯示的那些圖象數(shù)據(jù)。
強(qiáng)調(diào)顯示部分624具有作為變化裝置的變化部分628。變化部分628響應(yīng)來自外部的指令,例如使用鍵盤,而改變強(qiáng)調(diào)顯示類型或區(qū)域,并包含變化信息獲取部分628A和強(qiáng)調(diào)信息變化部分628B。
變化信息獲取部分628A獲取以下將要說明的變化信息R。強(qiáng)調(diào)信息變化部分628B使用變化信息R更新將在以下說明的強(qiáng)調(diào)信息Q以便產(chǎn)生強(qiáng)調(diào)信息Q′。
實(shí)際上,能夠向計(jì)算機(jī)主機(jī)629提供如同強(qiáng)調(diào)顯示部分624,強(qiáng)調(diào)顯示刪除部分625,強(qiáng)調(diào)顯示轉(zhuǎn)移控制部分626及屏幕滾動部分627的功能的適當(dāng)?shù)能浖惭b到硬盤622或某種其它的存儲器,以構(gòu)成圖象數(shù)據(jù)顯示裝置640。
根據(jù)本實(shí)施例具有上述結(jié)構(gòu)的圖象數(shù)據(jù)顯示裝置640以如下方式操作。
圖67中示出當(dāng)文件的圖象數(shù)據(jù)從圖62所示的圖象數(shù)據(jù)劃分裝置621(圖象掃描器621A或者OCR裝置621B)輸入并顯示在顯示單元(圖62中未示出)時的一個初始屏幕。
這時,如圖67中所見,包含多個項(xiàng)目信息的圖象數(shù)據(jù),即包含“帳號”,“姓名”,“交易”和“款額”四個項(xiàng)目信息的圖象數(shù)據(jù),顯示在顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611中。
另一方面,當(dāng)輸入的匯款數(shù)據(jù)要被輸入時,光標(biāo)指示器616移動到所希望的一個數(shù)據(jù)輸入顯示區(qū)域部分615以輸入對應(yīng)于所希望的項(xiàng)目612之一的圖象數(shù)據(jù)部分的匯款數(shù)據(jù)。這時,如在圖70中所見,所希望的項(xiàng)目612的圖象數(shù)據(jù)部分通過強(qiáng)調(diào)顯示部分624以強(qiáng)調(diào)顯示部分613被強(qiáng)調(diào)顯示,并從圖71到76可見,在光標(biāo)指示器616移動時強(qiáng)調(diào)顯示部分613也在圖象數(shù)據(jù)顯示區(qū)域611中移動。
要注意,雖然圖象數(shù)據(jù)的字符識別結(jié)果沒有在圖67和70到76中所示的數(shù)據(jù)輸入顯示區(qū)域部分615中顯示,它自然能夠另外顯示。
這里,在圖70中,示出當(dāng)“帳號(0001)”的項(xiàng)目612被強(qiáng)調(diào)顯示時的顯示單元。
如果在圖70所見的那種狀態(tài)下操作者借助于鍵盤631輸入“0001”,然后人工操作鍵盤631在項(xiàng)目數(shù)據(jù)顯示區(qū)域614中移動光標(biāo)指示器616從“項(xiàng)目1”到“項(xiàng)目2”,然后強(qiáng)調(diào)顯示部分613響應(yīng)由強(qiáng)調(diào)顯示轉(zhuǎn)移控制部分626的操作在如圖71中所見的圖象數(shù)據(jù)顯示區(qū)域611從“帳號(0001)”移動到“姓名(Taro Fuji)”。這種狀態(tài)下,操作者將使用鍵盤631輸入“Taro Fuji”。
類似地如果操作者借助于鍵盤631輸入“Taro Fuji”并人工操作鍵盤631移動光標(biāo)指示器616從“項(xiàng)目2”到“項(xiàng)目3”,則強(qiáng)調(diào)顯示部分613如圖72所見通過強(qiáng)調(diào)顯示轉(zhuǎn)移控制部分626從“姓名(TaroFuji)”移動到“交易(010)”。然后,如果操作者進(jìn)而輸入“010”并移動光標(biāo)指示器616從“項(xiàng)目3”到“項(xiàng)目4”,則強(qiáng)調(diào)顯示部分613通過強(qiáng)調(diào)顯示轉(zhuǎn)移控制部分626如圖73中所見從“交易(010)”移動到“款額(¥12,000)”。而且這時,操作者自然將使用鍵盤輸入“010”和“¥12,000”。
例如,如果在這樣輸入作為對應(yīng)于“項(xiàng)目4”的匯款數(shù)據(jù)的款額數(shù)據(jù)“¥12,000”之后按動了鍵盤631的回車鍵,則對應(yīng)于“項(xiàng)目1到項(xiàng)目4”的匯款數(shù)據(jù)(帳號、姓名、交易和款額數(shù)據(jù))示出到圖6中所示的服務(wù)器39。
然后,響應(yīng)回車鍵的按動,光標(biāo)指示器616再次從“項(xiàng)目4”移動到“項(xiàng)目1”,并且通過強(qiáng)調(diào)顯示轉(zhuǎn)移控制部分626如圖74中所見在第二行強(qiáng)調(diào)顯示部分613從“款額(¥12,000)”移動到“帳號(0010)”。此后,每次重復(fù)上述的操作,圖象數(shù)據(jù)顯示區(qū)域611中的項(xiàng)目612可被一次又一次地強(qiáng)調(diào)顯示。
換言之,對應(yīng)于出現(xiàn)光標(biāo)指示器616的數(shù)據(jù)輸入顯示區(qū)域部分615的項(xiàng)目612之一被強(qiáng)調(diào)顯示,并在光標(biāo)指示器616移動時,強(qiáng)調(diào)顯示部分613在不同的項(xiàng)目612之間也移動。
同時,匯款數(shù)據(jù)的輸入在具有光標(biāo)指示器616的數(shù)據(jù)輸入顯示區(qū)域部分615處進(jìn)行,并如果光標(biāo)指示數(shù)據(jù)向其輸入的數(shù)據(jù)輸入顯示區(qū)域部分615之一移動,則同時被參照的項(xiàng)目612的圖象數(shù)據(jù)部分被強(qiáng)調(diào)顯示。于是,能夠防止當(dāng)數(shù)據(jù)被參照時匹配中的錯誤識別要被增加目視的可視性,由此輸入操作所需的勞務(wù)能夠被降低并可防止匯款數(shù)據(jù)的誤輸入。
如果假設(shè)上述的匯款數(shù)據(jù)輸入處理進(jìn)而進(jìn)行到如圖75中所見顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611最低行中的″款額(¥1,765)″被強(qiáng)調(diào)顯示,然后在沒有在顯示單元630上顯示的某些項(xiàng)目612保持在低于“款額(¥1,765)”之處,如果光標(biāo)指示器616在項(xiàng)目數(shù)據(jù)顯示區(qū)域614中從“項(xiàng)目4”移動到“項(xiàng)目1”,則如圖76中所示通過強(qiáng)調(diào)顯示轉(zhuǎn)移控制部分626,在圖象數(shù)據(jù)顯示區(qū)域611中顯示屏幕627和強(qiáng)調(diào)顯示部分613按對應(yīng)關(guān)系從″款額(¥1,765)″移動到“帳號(2148)”。
換言之,在處于圖象數(shù)據(jù)顯示區(qū)域611的最低位置的項(xiàng)目612之一被強(qiáng)調(diào)顯示而在顯示單元630上沒有被顯示的某些項(xiàng)目612保持在低于項(xiàng)目612之處,則能夠通過在數(shù)據(jù)輸入顯示區(qū)域部分615之間移動光標(biāo)指示器616使得顯示屏自動地滾屏。
要注意,雖然在圖76中顯示屏的滾動一個個項(xiàng)目地進(jìn)行并且項(xiàng)目“帳號(2148)”被顯示,但是顯示滾動的方式不限于此,并且通過移動“帳號(2148)”到最上行使得低于它們的一屏的其它項(xiàng)目能夠被顯示,對于一屏(七個項(xiàng)目)的所有的項(xiàng)目能夠被交替地滾動。
這里,如圖70到76中所示這種強(qiáng)調(diào)顯示的移動控制是由強(qiáng)調(diào)顯示部分624、強(qiáng)調(diào)顯示刪除部分625、強(qiáng)調(diào)顯示轉(zhuǎn)移控制部分626以及屏幕滾動部分627進(jìn)行的,并在以下參照圖65更詳細(xì)地說明這時的操作流。
例如,如果如圖70到71中所見在項(xiàng)目數(shù)據(jù)顯示區(qū)域614中光標(biāo)指示器616從“項(xiàng)目1”移動到“項(xiàng)目2”,即如果構(gòu)成圖象數(shù)據(jù)顯示區(qū)域611中的輸入對象的項(xiàng)目612之一變?yōu)椴煌谝呀?jīng)是上一個輸入對象的項(xiàng)目612之一,則鑒別在上一次輸入時強(qiáng)調(diào)顯示的屬性(強(qiáng)調(diào)顯示類型或者強(qiáng)調(diào)顯示區(qū)域)是否已經(jīng)發(fā)生變化(步驟B1′)。
然后,如果強(qiáng)調(diào)顯示的屬性已經(jīng)發(fā)生變化,則強(qiáng)調(diào)顯示刪除625使得在先前的顯示中項(xiàng)目612的圖象數(shù)據(jù)顯示部分的強(qiáng)調(diào)顯示屬性返回到普通顯示屬性(變化之前的屬性)以刪除強(qiáng)調(diào)顯示(步驟B2′),并為下一個項(xiàng)目612取得相關(guān)信息(步驟B3′)。
此后,強(qiáng)調(diào)顯示部分624參照相關(guān)信息P鑒別關(guān)于構(gòu)成輸入對象的該項(xiàng)目612的相關(guān)信息P是否出現(xiàn)(步驟B4′),如果關(guān)于構(gòu)成輸入對象的該項(xiàng)目612的相關(guān)信息P出現(xiàn),則取得顯示部分624取得強(qiáng)調(diào)信息Q,并且變化信息獲取部分628A參照該強(qiáng)調(diào)信息Q而取得取得顯示屬性中的變化信息(步驟B5′)。
進(jìn)而,鑒別對應(yīng)于構(gòu)成輸入對象的項(xiàng)目612的圖象數(shù)據(jù)部分是否在顯示單元630上顯示以鑒別是否需要自動滾屏(步驟B6′)。如果不需要自動滾屏,則強(qiáng)調(diào)信息改變部分628B以步驟B5′中所要求的變化信息改變圖象數(shù)據(jù)部分的強(qiáng)調(diào)顯示屬性,并且如圖70和71中所見,強(qiáng)調(diào)顯示部分613從“帳號(0001)”移動到“姓名(TaroFuji)”。
另一方面,如果在步驟B6′中鑒別出需要自動滾屏,則如圖75和76中所見滾屏部分627響應(yīng)強(qiáng)調(diào)顯示部分613的移動進(jìn)行自動滾屏處理(步驟B7′),并且強(qiáng)調(diào)信息改變部分628B以步驟B5′中所要求的變化信息改變圖象數(shù)據(jù)部分的強(qiáng)調(diào)顯示屬性(步驟B8′)。
這樣,強(qiáng)調(diào)顯示的移動控制是這樣進(jìn)行的,即鑒別強(qiáng)調(diào)顯示屬性中的變化是否已經(jīng)發(fā)生,并如果強(qiáng)調(diào)顯示屬性中的變化已經(jīng)發(fā)生,則任何項(xiàng)目612的上一個強(qiáng)調(diào)顯示被刪除,并鑒別關(guān)于構(gòu)成輸入對象的項(xiàng)目612之一的相關(guān)信息P是否出現(xiàn),并如果關(guān)于構(gòu)成輸入對象的項(xiàng)目612之一的相關(guān)信息P出現(xiàn),則需要強(qiáng)調(diào)顯示屬性中的變化信息。
進(jìn)而,鑒別是否需要自動滾屏,并如果不需要自動滾屏,則改變強(qiáng)調(diào)顯示屬性,但是如果需要自動滾屏,則進(jìn)行自動滾屏處理并然后改變強(qiáng)調(diào)顯示屬性。
順便來說,通過改變強(qiáng)調(diào)信息Q能夠任意改變強(qiáng)調(diào)顯示部分613的顯示類型和顯示區(qū)域。
這將通過例子的方式說明,其中例如在77中所示顯示單元30上,作為圖象數(shù)據(jù)顯示區(qū)域611的最低階處的項(xiàng)目612的“款額(¥4,321)”被強(qiáng)調(diào)顯示。
這時,從圖69和79的強(qiáng)調(diào)信息Q可見,“款額(¥4,321)”的項(xiàng)目612的強(qiáng)調(diào)顯示部分613能夠通過定義開始位置坐標(biāo)(320,180)以及結(jié)束位置坐標(biāo)(420,200)而唯一地判定。要注意,開始位置坐標(biāo)(320,180)是在對應(yīng)于“科目4(款額)”的“No.7開始”處所指示的坐標(biāo),而結(jié)束位置坐標(biāo)(420,200)是在對應(yīng)于“科目4(款額)”的“No.7結(jié)束”處所指示的坐標(biāo)。
然后,如圖78中所見,如果強(qiáng)調(diào)顯示部分613的開始位置坐標(biāo)(320,180)變?yōu)?360,180),則圖77中所示的項(xiàng)目612的“款額(¥4,321)”的強(qiáng)調(diào)顯示部分613的區(qū)域變?yōu)閳D78中所見的狹窄的區(qū)域。
通過改變強(qiáng)調(diào)信息Q的開始位置的坐標(biāo)或者結(jié)束位置的坐標(biāo),能夠任意設(shè)置強(qiáng)調(diào)顯示部分613的區(qū)域的大小。
強(qiáng)調(diào)顯示信息Q的這種改變能夠這樣進(jìn)行,即通過使用作為數(shù)據(jù)輸入裝置的鍵盤或某些其它裝置,向圖象數(shù)據(jù)顯示裝置640輸入改變強(qiáng)調(diào)顯示屬性的指令而改變圖62和63中所示的部分628。
特別地,在改變部分628中,如果變化信息獲取部分628A要求變化信息R,則強(qiáng)調(diào)信息改變部分628B更新強(qiáng)調(diào)信息Q以產(chǎn)生強(qiáng)調(diào)信息Q′,并在以下將參照圖66說明這時的操作流程。
如果變化信息R輸入,則變化信息獲取部分628A首先進(jìn)行強(qiáng)調(diào)信息改變開始識別處理(步驟C1′)及強(qiáng)調(diào)信息改變結(jié)束識別處理(步驟C2′),并然后進(jìn)行改變信息獲取處理(步驟C3′)以識別強(qiáng)調(diào)信息Q以什么方式已經(jīng)被改變。
然后,例如如圖79中所見,根據(jù)識別的結(jié)果,強(qiáng)調(diào)信息改變部分628B進(jìn)行強(qiáng)調(diào)信息更新處理(步驟C4′)及強(qiáng)調(diào)信息改變處理(步驟C5′),以便更新強(qiáng)調(diào)信息而產(chǎn)生強(qiáng)調(diào)信息Q′。
由于強(qiáng)調(diào)顯示部分613的顯示類型和顯示區(qū)域能夠這樣任意改變,故強(qiáng)調(diào)顯示能夠根據(jù)應(yīng)用自由地進(jìn)行。
要注意,雖然圖象數(shù)據(jù)字符識別的結(jié)果沒有顯示在圖77或78所示的數(shù)據(jù)輸入顯示區(qū)域部分615中,但數(shù)據(jù)自然能夠被交替顯示。
于是,由根據(jù)本實(shí)施例的圖象數(shù)據(jù)顯示裝置640,如果改變指示移動到數(shù)據(jù)要被輸入的數(shù)據(jù)輸入顯示區(qū)域部分615,則同時被參照的項(xiàng)目612的圖象數(shù)據(jù)部分被強(qiáng)調(diào)顯示。于是,即使操作者目光一時離開了顯示單元630并然后又觀看顯示單元630,也能夠防止操作者看錯了項(xiàng)目612。于是,該圖象數(shù)據(jù)顯示裝置640的優(yōu)點(diǎn)在于,當(dāng)圖象數(shù)據(jù)被參照時防止了匹配中的誤識別并改進(jìn)了可視性,并此外降低了用于輸入操作的勞務(wù),防止了誤輸入。
進(jìn)而,當(dāng)要被參照項(xiàng)目612的圖象數(shù)據(jù)沒有顯示在顯示單元630上時,由于能夠響應(yīng)強(qiáng)調(diào)顯示部分613的移動而自動滾屏,故圖象數(shù)據(jù)顯示裝置640的優(yōu)點(diǎn)還在于,例如可以減少諸如按鍵這種無益的操作。
進(jìn)而,圖象數(shù)據(jù)顯示裝置640的優(yōu)點(diǎn)在于,強(qiáng)調(diào)顯示部分613的類型或區(qū)域可以由操作者改變并可根據(jù)用途而使用。
要注意,雖然本實(shí)施例中當(dāng)顯示在顯示單元上的文件的圖象數(shù)據(jù)進(jìn)行強(qiáng)調(diào)顯示時,預(yù)定的項(xiàng)目612如圖70中所見被整個地強(qiáng)調(diào)顯示,但是強(qiáng)調(diào)顯示方式不限于此,并且例如預(yù)定項(xiàng)目612的部分能夠如圖80所見以另外方式強(qiáng)調(diào)顯示。
這里,在圖80所示的顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611中,顯示了包含五個項(xiàng)目“帳號”、“科目”“銀行名字/分理處名字”、“接受者”及“款額”的信息的圖象數(shù)據(jù)。
當(dāng)要輸入?yún)R款數(shù)據(jù)時,光標(biāo)指示器616被移動到所希望的一個數(shù)據(jù)輸入顯示部分615,并且對應(yīng)的匯款數(shù)據(jù)輸入到所希望的一個項(xiàng)目612的圖象數(shù)據(jù)部分。這時,如圖80中所見,所希望的項(xiàng)目612的圖象數(shù)據(jù)部分以強(qiáng)調(diào)顯示部分613被強(qiáng)調(diào)顯示(在“銀行名字/分理處名字(Fujitsu銀行)”的位置),并在光標(biāo)指示器616移動時,如圖81和82中所見強(qiáng)調(diào)顯示部分613也在圖象數(shù)據(jù)顯示區(qū)域611中移動。
要注意,雖然在圖82中強(qiáng)調(diào)顯示的是項(xiàng)目612的字符“接受者(Ichiro Yamada)”,但是如圖83中所見,另外也可以對整個項(xiàng)目612強(qiáng)調(diào)顯示。
進(jìn)而,例如如圖84中所見,文件的圖象數(shù)據(jù)能夠另外對各個信息在顯示單元630上顯示。
這里,在圖84所示的顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611中,顯示了包含七個項(xiàng)目“銀行名字”、“分理處名字”、“帳號”、“科目”、“款額”、“接受者”及“客戶”的信息的圖象數(shù)據(jù)。
類似地,當(dāng)要顯示匯款數(shù)據(jù)時,光標(biāo)指示器616移動到所希望的數(shù)據(jù)輸入顯示區(qū)域部分616,并且對應(yīng)的匯款數(shù)據(jù)輸入到所希望的項(xiàng)目612′的圖象數(shù)據(jù)部分。這時,如圖84中所見所希望的項(xiàng)目612′的圖象數(shù)據(jù)部分以強(qiáng)調(diào)顯示部分613(“科目(1)”的位置)被強(qiáng)調(diào)顯示,并在光標(biāo)指示器616移動時,如圖85中所見,強(qiáng)調(diào)顯示部分613也在圖象數(shù)據(jù)顯示區(qū)域611中移動。
而且在文件的圖象數(shù)據(jù)這樣顯示之處,能夠達(dá)到本實(shí)施例的類似的那些優(yōu)點(diǎn)。
要注意,雖然如圖80到85所示在數(shù)據(jù)輸入顯示區(qū)域部分615中沒有顯示出圖象數(shù)據(jù)字符識別的結(jié)果,但是這里自然能夠按其它方式顯示。
進(jìn)而,雖然在本實(shí)施例中,由圖象數(shù)據(jù)輸入裝置閱讀銀行中所使用的文件并且作為圖象數(shù)據(jù)在一個顯示單元之類的屏幕上顯示,但是數(shù)據(jù)媒體不限于此,而是某些其它類型的數(shù)據(jù)(例如一個名單)也可由圖象數(shù)據(jù)輸入裝置閱讀并作為圖象數(shù)據(jù)在一個顯示單元之類的屏幕上顯示。而且這時,也可達(dá)到類似于本實(shí)施例的優(yōu)點(diǎn)。
此外,雖然本實(shí)施例中操作者目視地觀察讀取的圖象數(shù)據(jù)并進(jìn)行輸入操作,例如當(dāng)文件由圖象數(shù)據(jù)輸入裝置閱讀文件時,字符識別能夠以另外方式自動地進(jìn)行,同時操作者僅對于包含被誤識別的或者不能成功識別的字符的項(xiàng)目進(jìn)行輸入操作。
在采用上述結(jié)構(gòu)之處,能夠達(dá)到本實(shí)施例那些類似的優(yōu)點(diǎn),并且此外能夠顯著減少輸入操作所需的勞務(wù)和時間。
(2)讀取的符號顯示-識別信息修改裝置的說明在上節(jié)(1)中詳細(xì)說明的圖象數(shù)據(jù)顯示裝置640中,由于圖象數(shù)據(jù)的編輯和顯示是以包含多個字符的項(xiàng)目單元進(jìn)行的,當(dāng)要對自動字符識別的結(jié)果是正確還是錯誤進(jìn)行確認(rèn)時,通過目視觀察從相繼出現(xiàn)在圖象數(shù)據(jù)中的不同字符中進(jìn)行對應(yīng)于被識別的確認(rèn)對象的字符的字符選擇。因而,由于眼睛的移動和涉及許多比較對象,對于正確與錯誤之間的確認(rèn)操作可能需要許多勞務(wù)和時間。
因而,這種情形下,付款請求處理能夠使用如圖86所示的那種讀取符號顯示-識別信息修改裝置進(jìn)行。
例如,讀取符號顯示-識別信息修改裝置740取得其上作為圖象寫有諸如款項(xiàng)類別和要支付的款額的付款數(shù)據(jù)的文件,并通過自動字符識別轉(zhuǎn)換付款數(shù)據(jù)的圖象為代碼信息以進(jìn)行付款請求處理。然而,是由操作者使用鍵盤之類對在轉(zhuǎn)換時不能識別或者誤識別的字符(字符包括數(shù)字。這類似地適用于以下的說明)進(jìn)行修改。
這里,讀取符號顯示-識別信息修改裝置740對應(yīng)于圖6中所示的數(shù)據(jù)媒體處理裝置30的客戶機(jī)10,并且在它連接到圖6所示的服務(wù)器39之處,它的作用是作為一個工作站進(jìn)行對不能識別的字符或者誤識別的字符的修改處理,這類似于對于由連接到服務(wù)器39的集中化的字符識別處理部分6進(jìn)行的圖象字符識別的結(jié)果,并向服務(wù)器39輸出修改的結(jié)果。
為此目的,如圖86所示,讀取符號顯示-識別信息修改裝置740包括一個作為圖象移動部分的圖象閱讀器721,一個作為數(shù)據(jù)輸入裝置的鍵盤722,一個硬盤723,一個作為符號識別裝置的計(jì)算機(jī)主機(jī)724和一個顯示單元725。
圖象閱讀器721閱讀全區(qū)域的圖象P,該圖象是具有諸如其上寫出例如圖98所示的付款數(shù)據(jù)的文件上的數(shù)字或者字符的符號信息的圖象,并向計(jì)算機(jī)主機(jī)724輸入作為數(shù)字、字符之類的圖象信息的符號圖象信息的全區(qū)域的圖象P。
要注意,雖然該符號圖象信息是由最小組成單元的的數(shù)字或者字符單元組成,但是它不限于此,并且能夠使用數(shù)字和/或字符集合作為組成單元。進(jìn)而,多個這種全區(qū)域圖象P能夠被聚集保持。
鍵盤722由操作者人工操作輸入作為正確答案數(shù)據(jù)的適當(dāng)?shù)拇a數(shù)據(jù),該數(shù)據(jù)對應(yīng)于沒有被成功地自動識別或者被誤識別的符號圖象信息。
進(jìn)而,顯示單元725顯示從圖象閱讀器由721在閱讀圖象狀態(tài)所輸入的符號圖象信息,并包括一個不能識別的符號圖象信息顯示區(qū)域732A,一個符號圖象信息顯示區(qū)域733A,一個相關(guān)符號圖象信息顯示區(qū)域733B,及一個正確答案數(shù)據(jù)顯示區(qū)域733C。
不能識別的符號圖象信息顯示區(qū)域732A與其周圍的符號圖象信息一同顯示沒有成功被自動識別的符號圖象信息,并對于這種不能識別的符號圖象信息采用取得顯示,使得它能夠從周圍的符號圖象信息被標(biāo)識出。例如,在圖101的屏幕A中,“1.′?′(拒絕字符)”所示的“2034”中的“3”是不能識別的符號圖象信息,而“2”、“0”和“4”對應(yīng)于周圍的符號圖象信息。
符號圖象信息顯示區(qū)域733A在一個要轉(zhuǎn)換為代碼信息的圖象中顯示最小組成單元的符號圖象信息,這是按照由符號圖象信息的轉(zhuǎn)換所獲得的代碼信息表示的符號信息的對應(yīng)關(guān)系顯示的。
特別地,例如對于數(shù)字,從圖101的屏幕A可見,作為通過劃分一個圖象所獲得的最小組成單元的符號圖象信息,提供了對應(yīng)于“0”到“9”的區(qū)域,并且相同的符號顯示在相同的區(qū)域,其方式是表示“1”的符號圖象信息都顯示在對應(yīng)于“1”的區(qū)域中,以便能夠減少眼睛的移動。
相關(guān)符號圖象信息顯示區(qū)域733B是這樣構(gòu)造的,例如當(dāng)通過參照字符行的前后字符能夠易于對自動字符識別的結(jié)果的正確和錯誤之間進(jìn)行確認(rèn)和修改時,圍繞按強(qiáng)調(diào)顯示的符號信息的圖象信息響應(yīng)例如鍵盤722的參照鍵的按動而被顯示以供參照。例如,在圖103的屏幕F中,“1175”的“7”為按強(qiáng)調(diào)顯示的符號圖象信息,而“1”、“1”和“5”是圍繞它的圖象信息。
正確答案數(shù)據(jù)顯示區(qū)域733C顯示從鍵盤722作為正確答案輸入的適當(dāng)?shù)拇a數(shù)據(jù)。例如,在圖103的屏幕中,表示出“7”是被輸入的。
進(jìn)而,圖86所示的讀取符號顯示-識別信息修改裝置740包括上述的硬盤723。硬盤723作用是作為定義信息存儲部分用于存儲讀取的指定信息作為定義信息。要注意,讀取的指定信息表示有關(guān)全區(qū)域圖象P的劃分以及作為代碼數(shù)據(jù)的識別的信息。
圖86所示的計(jì)算機(jī)主機(jī)724功能是作為符號識別裝置(計(jì)算機(jī)主機(jī)724以下可稱為符號識別裝置724),并識別從圖象閱讀器721輸入的圖象符號的圖象信息,轉(zhuǎn)換該符號的圖象信息為代碼數(shù)據(jù),進(jìn)行符號圖象的預(yù)定處理并在顯示單元725上顯示該圖象。
圖86和87所示作為符號識別裝置的計(jì)算機(jī)主機(jī)724包括一個作為符號識別部分的字符識別部分726,一個讀取符號圖象顯示控制部分727,一個作為正確答案數(shù)據(jù)顯示裝置的正確答案數(shù)據(jù)顯示部分728,一個作為最小組合單元符號圖象信息抽取部分的字符圖象抽取處理部分729,一個作為最小組合單元符號圖象顯示看錯部分的字符圖象顯示處理部分730,一個作為相關(guān)符號圖象顯示裝置的相關(guān)符號圖象顯示部分731,一個作為識別信息修改裝置的識別信息修改部分752,以及一個相關(guān)信息產(chǎn)生部分741。
字符識別部分726識別由圖象閱讀器721所讀取的圖象中的符號圖象信息,并轉(zhuǎn)換它為對應(yīng)的代碼信息。字符識別部分726具有類似于例如字符識別裝置之類的功能。
字符識別部分726參照由圖象閱讀裝置721所讀取的全區(qū)域圖象P或存儲在硬盤723上的讀指定信息(定義信息)以產(chǎn)生識別字符信息S。
識別字符信息S表示由字符識別部分726識別的字符的代碼數(shù)據(jù)并如圖99中所見由“項(xiàng)目名稱”、“項(xiàng)目列數(shù)”和“識別結(jié)果”表示。
“項(xiàng)目名稱”對應(yīng)于圖98的全區(qū)域圖象P中的“水價格”及“電費(fèi)帳單”并具有項(xiàng)目“SUI-1到SUI-4”及“DEN-1到DEN-4”。
“項(xiàng)目列數(shù)”是一個項(xiàng)目的列的數(shù)目,并在這時設(shè)定為使得可輸入六個字符和/或數(shù)字?!白R別結(jié)果”表示識別為字符的代碼數(shù)據(jù)的代碼信息。要注意,從與另外所示的正確答案數(shù)據(jù)相比可見,“SUI-1”和“SUI-4”識別的結(jié)果分別是該識別為不可能和該識別有錯誤。
當(dāng)符號圖象信息沒有成功地被轉(zhuǎn)換為對應(yīng)的代碼信息時,讀符號圖象顯示控制部分727在顯示單元725上與讀取的圖象狀態(tài)中的未識別的符號圖象信息相關(guān)符號圖象信息一同顯示這一未識別的沒有成功轉(zhuǎn)換的符號圖象信息。
特別地,讀符號圖象顯示控制部分727在顯示單元725上顯示即沒有被字符識別部分726識別也沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息的符號圖象信息,該信息是作為未識別的符號圖象信息與位于未識別的符號圖象信息周圍的相關(guān)的符號圖象信息一同在未識別的符號圖象信息顯示區(qū)域732A中以讀取的圖象狀態(tài)顯示的。
進(jìn)而,讀取的符號圖象顯示控制部分727包括一個強(qiáng)調(diào)顯示部分727A作為強(qiáng)調(diào)顯示裝置用于強(qiáng)調(diào)顯示未識別的符號圖象信息,以便使得易于由操作者識別出未識別的符號圖象信息。
讀符號圖象顯示控制部分727還包括一個強(qiáng)調(diào)顯示改變部分727B作為強(qiáng)調(diào)顯示改變裝置,用于如果正確答案數(shù)據(jù)由正確答案數(shù)據(jù)顯示部分728顯示在顯示單元725上不同于未識別的符號圖象信息顯示區(qū)域732A的正確答案數(shù)據(jù)顯示區(qū)域733C中,則改變已經(jīng)強(qiáng)調(diào)顯示的未識別的符號圖象信息的顯示為表示完成修改的另一種強(qiáng)調(diào)顯示。
字符圖象抽取處理部分729抽取圖象中最小組合單元的符號圖象信息,以轉(zhuǎn)換為用于最小組合單元符號圖象信息每一片的代碼信息。
特別地,字符圖象抽取處理部分729劃分并抽取其最小組合單元例如為數(shù)字或字符的符號圖象信息為以數(shù)字或字符為單元的信息并作為這樣的信息,并參照存儲在硬盤723上的全區(qū)域圖象P或者讀指定信息(定義信息)以產(chǎn)生相關(guān)信息R。
字符圖象信息和相關(guān)信息R通過執(zhí)行圖91所示的流程圖的步驟B1″到B8″而產(chǎn)生。
特別地,全區(qū)域圖象P劃分為字符單元以產(chǎn)生字符圖象信息(步驟B1″),并取得全區(qū)域圖象P上的字符圖象信息的位置(文件上的位置)信息(步驟B2″)。
然后,鑒別字符圖象信息是否指定給預(yù)定的項(xiàng)目(水價格,電費(fèi)帳單等),并如果字符圖象信息指定給預(yù)定的項(xiàng)目,則字符圖象信息對于各個項(xiàng)目被分類(步驟B4″),并設(shè)置各個圖象信息在各個項(xiàng)目中的位置信息(步驟B5″)。
在字符圖象信息沒有指定給預(yù)定的項(xiàng)目之處,它對于有關(guān)作為項(xiàng)目的行的各個項(xiàng)目被分類(步驟B6″),并設(shè)置各個項(xiàng)目中的字符圖象信息的位置信息(步驟B7″)。
使用這樣設(shè)置的各個項(xiàng)目中的字符圖象信息的位置信息產(chǎn)生相關(guān)信息R(步驟B8″)。要注意,相關(guān)信息R具有與被識別的字符相關(guān)的識別字符信息。
字符圖象顯示處理部分730具有引起由字符圖象抽取處理部分729所抽取的最小組成單元的符號圖象信息(例如以數(shù)字或者字符為單元的圖象信息)按照與通過符號圖象信息轉(zhuǎn)換所獲得的代碼信息所代表的符號信息的對應(yīng)關(guān)系而顯示的功能,并具有引起相同類型的多片最小組合單元的符號圖象信息按照與與通過符號圖象信息轉(zhuǎn)換所獲得的代碼信息所代表的符號信息的對應(yīng)關(guān)系而顯示的功能。
具體來說,例如字符圖象顯示處理部分730引起通過由字符圖象抽取處理部分729所抽取的“1”的圖象信息的轉(zhuǎn)換所獲得的代碼信息,顯示在在顯示單元725上“0”到“9”等多個符號被顯示的符號圖象信息顯示區(qū)域733A的部分內(nèi)“1”這個符號信息要被顯示的部分處。
字符圖象顯示處理部分730包括一個作為用于僅對于所希望的一個符號圖象信息進(jìn)行強(qiáng)調(diào)顯示的強(qiáng)調(diào)顯示裝置的強(qiáng)調(diào)顯示部分730A,使得易于識別當(dāng)前正在被處理的圖象信息。
進(jìn)而,如果由作為數(shù)據(jù)輸入裝置的鍵盤722的操作而輸入正確答案數(shù)據(jù),則作為強(qiáng)調(diào)顯示改變裝置的強(qiáng)調(diào)顯示改變部分730B進(jìn)行另一個強(qiáng)調(diào)顯示,該強(qiáng)調(diào)顯示表示對于已經(jīng)按強(qiáng)調(diào)方式被強(qiáng)調(diào)的一個符號的信息的修改的完成,以使得在修改之前該符號圖象信息與修改之后該符號圖象信息之間易于識別。
在顯示單元725上相關(guān)的符號圖象顯示部分731一同顯示符號圖象的信息與讀取的圖象狀態(tài)中的符號圖象信息相關(guān)的符號信息。
具體來說,在顯示單元725上的相關(guān)符號圖象信息顯示區(qū)域733B中,相關(guān)符號圖象顯示部分731一同顯示一個符號圖象的信息與位于讀取的圖象狀態(tài)的符號圖象信息周圍的相關(guān)的符號圖象信息,并當(dāng)通過例如參照字符行中先前的和隨后的字符而能夠?qū)ψ址詣幼R別的結(jié)果的修改的正確和錯誤之間易于進(jìn)行確認(rèn)時,則顯示供參照而被強(qiáng)調(diào)顯示的圖象信息周圍的圖象信息。
進(jìn)而,相關(guān)符號圖象顯示部分731包括作為強(qiáng)調(diào)顯示裝置用于對符號圖象的信息進(jìn)行強(qiáng)調(diào)顯示的一個強(qiáng)調(diào)顯示部分731A,并使得易于從相關(guān)的符號圖象信息識別。
如果正確答案數(shù)據(jù)通過鍵盤722的操作輸入,則正確答案顯示部分728引起正確答案數(shù)據(jù)被顯示在顯示單元725上的正確答案數(shù)據(jù)顯示區(qū)域733C中,該區(qū)域是不同于符號圖象信息顯示區(qū)域733A及相關(guān)符號圖象信息顯示區(qū)域733B的一個區(qū)域。
進(jìn)而,如果從鍵盤722輸入對于不能識別的符號圖象信息或者誤識別的符號圖象信息的正確答案數(shù)據(jù),則識別信息修改部分752寄存正確答案數(shù)據(jù)作為正確答案代碼數(shù)據(jù)以實(shí)現(xiàn)對不能識別的符號圖象信息或者誤識別的符號圖象信息的修改,并如圖88中所見包括一個修改信息取得處理部分742和修改結(jié)果反映處理部分743。
相關(guān)信息產(chǎn)生部分741參照相關(guān)信息R和識別字符信息S以產(chǎn)生具有識別字符信息的相關(guān)信息R′。
如圖100中所見,相關(guān)信息R′表示多個字符信息的“全區(qū)域圖象上的位置和尺寸”,“對應(yīng)的字符項(xiàng)目名稱”,“對應(yīng)的項(xiàng)目圖象名稱”,“項(xiàng)目內(nèi)列位置”,“識別字符”,“字符識別信息中的位移”和“修改完成標(biāo)志”。
這里,“全區(qū)域圖象上的位置和尺寸”表示全區(qū)域圖象P上的字符圖象信息的位置信息并以比特單位表示。
“對應(yīng)的字符項(xiàng)目名稱”表示字符圖象信息所屬的項(xiàng)目(諸如“SUI-1到SUI-4”)?!皩?yīng)的項(xiàng)目圖象名稱”表示字符圖象信息所屬的項(xiàng)目,并對應(yīng)于“對應(yīng)的字符項(xiàng)目名稱”(諸如“SUI-1到SUI-4”)。
例如,雖然圖99所示的項(xiàng)目“SUI-1”對應(yīng)于識別字符信息“1050”,但它包含圖100中所見的字符圖象1到4的信息并具有“ISUI-1”的圖象名稱。
此外,“項(xiàng)目內(nèi)列位置”表示在一個項(xiàng)目中字符圖象信息的位置?!白R別字符”表示表示字符信息S,并表示識別位置“1”在項(xiàng)目中第三列位置,“0”在第四列位置,“5”在第五列位置,并且“0”第六列位置。
進(jìn)而,雖然在圖100中“修改完成標(biāo)志”都是“OFF”,當(dāng)對不能識別的字符或誤識別的字符進(jìn)行修改時,對應(yīng)于字符圖象的信息的“修改完成標(biāo)志”則變?yōu)椤癘N”使得表示出對其修改已經(jīng)進(jìn)行。
要注意,字符圖象信息也由“字符識別信息中的位移”信息定義。
相關(guān)信息R’由諸如圖92中所示的處理產(chǎn)生。
首先,對于由項(xiàng)目和/或行表示的各個位置信息對識別字符信息S進(jìn)行分類(步驟C1′),而被分類的識別字符信息S加到對應(yīng)的相關(guān)信息R上(步驟C2′)。然后,鑒別識別字符信息S的項(xiàng)目和/或行內(nèi)字符的數(shù)目是否在相關(guān)信息R的項(xiàng)目或者行內(nèi)字符數(shù)目之內(nèi)(步驟C3′)。進(jìn)而鑒別識別字符信息S的項(xiàng)目和/或行的數(shù)目是否在相關(guān)信息R的項(xiàng)目或者行數(shù)目之內(nèi)(步驟C4′)。然后基于該鑒別,更新相關(guān)信息R以產(chǎn)生相關(guān)信息R′。
實(shí)際上,讀符號顯示-識別信息修改裝置740是通過向計(jì)算機(jī)主機(jī)724裝設(shè)適當(dāng)?shù)挠布?gòu)成的,這些硬件能夠向硬盤提供上述功能部分,諸如字符識別部分726,讀符號圖象顯示控制部分727,字符圖象抽取處理部分729,字符圖象顯示處理部分730,相關(guān)符號圖象顯示部分731,正確答案數(shù)據(jù)圖象顯示部分728以及相關(guān)信息產(chǎn)生部分741。
根據(jù)本實(shí)施例具有上述結(jié)構(gòu)的讀符號顯示-識別信息修改裝置740操作方式如下。
供閱讀的對象文件的全區(qū)域圖象P由圖87所示的圖象閱讀裝置721產(chǎn)生,并且全區(qū)域圖象P轉(zhuǎn)換為字符圖象信息,并應(yīng)用讀指定信息(定義信息)由符號識別裝置724產(chǎn)生相關(guān)信息R′。
當(dāng)應(yīng)用相關(guān)信息R′字符圖象信息顯示在顯示單元上時,顯示單元725上的初始屏幕如圖101的屏幕A那樣。
這時,作為拒絕字符和位于該拒絕字符周圍的“2034”和“1201”顯示在不能識別的符號圖象信息顯示區(qū)域732A中,并且表示“0”到“9”的字符圖象顯示在符號圖象信息顯示區(qū)域733A中“0”到“9”的區(qū)域中。
要注意,顯示在不能識別的符號圖象信息顯示區(qū)域732A中的“2034”以寬框強(qiáng)調(diào)顯示,以便指示這些字符是修改對象,并且作為不能識別的字符的拒絕字符“3”以斜線強(qiáng)調(diào)顯示。類似地,在不能識別的符號圖象信息顯示區(qū)域732A中顯示的“1201”中,作為不能識別的字符的拒絕字符“2”以斜線強(qiáng)調(diào)顯示。
這里,如圖101到104中所示這種字符圖象信息的顯示是由圖87中所示的符號識別這種724進(jìn)行的,并且將參照圖93說明這時的操作流程。
首先,符號識別這種724取得全區(qū)域圖象P(步驟D1″),并復(fù)制相關(guān)信息R′且對其按識別字符信息S的順序分類(步驟D2″)。
鑒別該識別字符是否為不能識別的拒絕字符(步驟D3″),并如果它為拒絕字符,則符號識別裝置724取得圍繞它的和/或一個項(xiàng)目的字符圖象信息并在不能識別的符號圖象信息顯示區(qū)域732A中顯示該信息(步驟D4″)。要注意,步驟D1″到D4″的操作按這種拒絕字符的數(shù)目重復(fù)(步驟D5″)。
另一方面,當(dāng)識別字符不是拒絕字符時,符號識別裝置724在符號圖象信息顯示區(qū)域733A的對應(yīng)區(qū)域中顯示該字符圖象信息(步驟D6″),并且步驟D6″的操作按識別字符的數(shù)目重復(fù)(步驟D7″)。
如果操作者使用鍵盤722在圖101所示的初始屏幕A那樣的狀態(tài)輸入“3”作為正確答案數(shù)據(jù),則“3”正確答案數(shù)據(jù)顯示區(qū)域733C中,并然后例如如果按動確定鍵,則如屏幕B上所示,顯示在不能識別的符號圖象信息顯示區(qū)域732A中的作為在“2034”的拒絕字符的“3”的位置的強(qiáng)調(diào)顯示從斜線顯示變?yōu)榫W(wǎng)格強(qiáng)調(diào)顯示,這指示拒絕字符已經(jīng)被修改。識別字符信息S與此一同被修改,并且相關(guān)信息R′被更新。
進(jìn)而,在屏幕B上,相應(yīng)指示“2034”中的拒絕字符“3”已經(jīng)被修改的網(wǎng)格強(qiáng)調(diào)顯示的變化,寬框的強(qiáng)調(diào)顯示自動地施加到下一個修改對象的“1201”上。
進(jìn)而,如果在上述屏幕B的那種狀態(tài)下,操作者使用鍵盤722輸入“2”作為正確答案數(shù)據(jù),則“2”顯示在正確答案數(shù)據(jù)顯示區(qū)域733C中。然后,如果按動確定鍵,則顯示在不能識別的符號圖象信息顯示區(qū)域732A中作為在“1201”的拒絕字符的“2”的位置的強(qiáng)調(diào)顯示從斜線顯示變?yōu)榫W(wǎng)格強(qiáng)調(diào)顯示,這指示拒絕字符已經(jīng)被修改。識別字符信息S對此響應(yīng)而被修改,并且相關(guān)信息R′被更新。
順便來說,在顯示在符號圖象信息顯示區(qū)域733A的“0”到“9”區(qū)域中表示“0”到“9”字符圖象的任何一個為不同之處,即在字符圖象信息被誤識別之處,例如如果操作者按動鍵盤722的Tab鍵,則寬框的強(qiáng)調(diào)顯示從“1.′?′(即將字符)”移動到顯示單元725的“2.′0′”的區(qū)域,如圖102中所見。
進(jìn)而,如果重復(fù)按動tab鍵,則如圖103的屏幕E中所見寬框的強(qiáng)調(diào)顯示移動到“3.′1′”區(qū)域。重復(fù)這樣作,表示修改對象的寬框強(qiáng)調(diào)顯示相繼在顯示單元725中移動。
特別地,當(dāng)寬框的強(qiáng)調(diào)顯示要在“0”到“9”的區(qū)域之間移動時,按動tab鍵以選擇所希望的字符圖象的信息,并在圖103的屏幕E上作為誤識別的結(jié)果而顯示的字符圖象信息“7”(即“7”的圖象已經(jīng)被轉(zhuǎn)換為“1”的代碼信息)以寬框強(qiáng)調(diào)顯示。
這里,在“7”的字符圖象信息是正確還是錯誤不能由其自身易于辨別之處,如果如圖89所見操作者按動鍵盤722的參照鍵,則從如圖103屏幕所見,作為相關(guān)符號圖象顯示裝置的相關(guān)符號圖象顯示部分731參照相關(guān)信息R′在相關(guān)符號圖象顯示區(qū)域733B顯示參照圖象。
如果,在上述屏幕F這種狀態(tài)下,操作者使用鍵盤722輸入“7”作為正確答案數(shù)據(jù)并按動確定鍵,則“7”顯示在正確答案數(shù)據(jù)顯示區(qū)域733C中,并且“7”的字符圖象信息的代碼信息從誤識別的“1”修改為“7”,如圖104中所見。然后,表示這種修改已經(jīng)進(jìn)行的網(wǎng)格強(qiáng)調(diào)顯示施加到“7”的字符圖象信息上。
特別地,識別字符信息S和相關(guān)信息R′被更新,并且指示修改已經(jīng)進(jìn)行的的強(qiáng)調(diào)顯示施加到“7”的修改的字符圖象信息上。
這里,如圖89中所示的參照圖象顯示處理如以上所述由相關(guān)符號圖象顯示部分731進(jìn)行,并且將參照圖97說明這時的操作流程。
首先,鑒別參照圖象是否被顯示(步驟H1′)。如果參照圖象沒有被顯示,則相關(guān)符號圖象顯示部分731檢索按強(qiáng)調(diào)顯示的相關(guān)對象的字符圖象信息的相關(guān)信息R′(步驟H2′)。
然后,取得圍繞相關(guān)對象和/或項(xiàng)目的字符圖象信息的圖象信息(步驟H3′),并且設(shè)置參照圖象要顯示的位置為使得參照圖象不會覆蓋按強(qiáng)調(diào)顯示的相關(guān)對象的字符圖象信息的位置(步驟H4′)。然后,顯示參照圖象(步驟H5′)。
要注意,如果在參照圖象顯示時再次按動參照鍵,則參照圖象被刪除(步驟H6′)。
這里,通過圖87和88中所示的相關(guān)信息獲取處理部分742與相關(guān)結(jié)果反映處理部分743,以及作為強(qiáng)調(diào)顯示改變裝置的強(qiáng)調(diào)顯示改變部分727B,進(jìn)行對于如圖101到104中所見的字符圖象信息的這種修改,以下將參照圖94到96說明這時的操作流程。
如圖88中所見,如果操作者通過鍵盤722輸入正確答案數(shù)據(jù),則該正確答案數(shù)據(jù)作為修改信息輸入到修改信息獲取處理部分742,而修改結(jié)果反映處理部分743使用修改信息和相關(guān)信息R′產(chǎn)生識別字符信息S,并修改與更新相關(guān)信息R′。同時,強(qiáng)調(diào)顯示改變部分727B參照修改信息向已經(jīng)被修改的項(xiàng)目施加指示這種修改的強(qiáng)調(diào)顯示。
這時,如圖94中所見輸入屏幕被顯示(步驟E1″)那樣,修改信息獲取處理部分742鑒別識別字符是否為不能識別的字符的拒絕字符(步驟E2″)。如果識別字符為拒絕字符,則修改信息獲取處理部分742向外圍和/或項(xiàng)目圖象信息施加表示該外/圍項(xiàng)目圖象信息為供修改的拒絕項(xiàng)目的寬框強(qiáng)調(diào)顯示(步驟E3″),并向作為識別字符的該拒絕字符施加不同于寬框的斜線式的另一種強(qiáng)調(diào)顯示(步驟E4″)。
反之,如果識別字符不是拒絕字符,則寬框的強(qiáng)調(diào)顯示施加到該字符圖象信息(步驟E5″)。
這里,例如如果由操作者操作鍵盤722按動TAB鍵或參照鍵(用于在由TAB鍵移動方向相反方向上移動光標(biāo)的鍵)(步驟E6”),則指示修改對象的寬框的強(qiáng)調(diào)顯示被移動而使得下一個字符圖象信息能夠被表示為修改對象(步驟E7″)。如果寬框的強(qiáng)調(diào)顯示移動到最后的字符圖象信息,然后這一操作由第一字符圖象信息開始進(jìn)行(步驟E8″)。
要注意,如果按動其它鍵,則向修改信息產(chǎn)生部分741報(bào)告修改信息(步驟E9″)。
另一方面,圖88所示的修改結(jié)果反映處理部分743,如圖95中所見,檢索按強(qiáng)調(diào)顯示的字符圖象信息的相關(guān)信息R′(步驟F1″),修改識別字符(不能識別的字符或者誤識別字符)(步驟F2″),修改相關(guān)信息R′的識別字符(步驟F3″),并顯示或刪除參照圖象(步驟F4″)。
進(jìn)而,圖88所示的強(qiáng)調(diào)顯示修改部分727B如圖96中所見取得修改信息(步驟G1″)并施加表示修改已經(jīng)進(jìn)行的強(qiáng)調(diào)顯示(步驟G2″)。
如上所述,由讀符號顯示-識別信息修改裝置740對字符圖象信息的顯示與修改以及參照圖象的顯示,如圖90中所見,是通過以下步驟進(jìn)行的獲取作為全區(qū)域圖象P的圖象數(shù)據(jù)(步驟A1″),抽取字符圖象信息(步驟A2″),獲取識別字符圖象信息(步驟A3″),產(chǎn)生相關(guān)信息(步驟A4″),顯示字符圖象信息(步驟A5″),獲取修改信息(步驟A6″),按動數(shù)據(jù)鍵或參照鍵(步驟A7″),響應(yīng)世界鍵的按動而反映修改結(jié)果(步驟A8″),強(qiáng)調(diào)顯示修改的字符圖象信息(步驟A9″),以及由計(jì)算機(jī)主機(jī)724響應(yīng)參照鍵的按動而顯示參照圖象(步驟A10″),并且這一處理是對于所有被顯示的字符圖象信息進(jìn)行的(步驟A11″)。
這樣,使用根據(jù)本實(shí)施例的讀符號顯示-識別信息修改裝置740,沒有被計(jì)算機(jī)主機(jī)724成功地識別的不能識別的字符的圖象信息,在讀取的圖象狀態(tài)下在顯示單元725上圍繞不能識別的字符與字符圖象信息一同顯示,并且向不能識別的字符的圖象信息施加強(qiáng)調(diào)顯示。于是,的讀符號顯示-識別信息修改裝置740的優(yōu)點(diǎn)在于,通過參照字符行中前后的字符圖象信息,能夠進(jìn)行高精確度的確認(rèn)操作,并能夠降低正確與錯誤之間的確認(rèn)操作所需的勞務(wù)和時間。
進(jìn)而,使用使用根據(jù)本實(shí)施例的讀符號顯示-識別信息修改裝置740,如果對應(yīng)于不能識別的字符或者誤識別的字符的正確答案數(shù)據(jù)通過操作鍵盤722輸入,則正確答案數(shù)據(jù)顯示在顯示單元725上,并且直到現(xiàn)在被強(qiáng)調(diào)強(qiáng)調(diào)顯示的不能識別的字符或者誤識別的圖象信息以表示完成修改的不同的強(qiáng)調(diào)顯示而被顯示。于是,該讀符號顯示-識別信息修改裝置740的優(yōu)點(diǎn)在于,能夠易于辨別一個字符對其一個不能識別的字符的輸入或者對一個誤識別的字符的修改已經(jīng)進(jìn)行與另一個字符對其這種操作沒有進(jìn)行,于是提高了目視可辨別性而防止了被操作者雙重修改等,從而顯著降低了正確和錯誤之間的確認(rèn)操作所需的勞務(wù)和時間。
此外,使用根據(jù)本實(shí)施例的讀符號顯示-識別信息修改裝置740,符號能夠以易于進(jìn)行目視觀察的單位被顯示,使得只有相同的符號顯示在顯示單元上相同的區(qū)域中,并只向所希望的一個字符圖象的信息施加強(qiáng)調(diào)顯示。于是,讀符號顯示-識別信息修改裝置740的優(yōu)點(diǎn)在于,操作者只要參照圖象信息而無需參照相關(guān)的外圍字符圖象的信息即能夠確認(rèn)識別結(jié)果為正確或者錯誤,于是能夠顯著減少操作者眼睛的移動,其優(yōu)點(diǎn)還在于能夠把強(qiáng)調(diào)顯示僅施加到正在被處理的字符圖象信息以減少比較對象,并且顯著降低了正確和錯誤之間的確認(rèn)操作所需的勞務(wù)和時間。
進(jìn)而,使用根據(jù)本實(shí)施例的讀符號顯示-識別信息修改裝置740,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于其中顯示如上述的一個字符圖象信息和與該字符圖象信息相關(guān)的周圍字符圖象信息的區(qū)域。于是,讀符號顯示-識別信息修改裝置740的優(yōu)點(diǎn)在于,能夠通過目視觀察對字符圖象信息和輸入的正確答案數(shù)據(jù)進(jìn)行再確認(rèn),于是降低了正確和錯誤之間的確認(rèn)操作所需的勞務(wù)和時間,此外確認(rèn)操作能夠以高精確度進(jìn)行。
要注意,雖然本實(shí)施例中,當(dāng)要修改不能識別的字符或者誤識別的字符時,對于不能識別的字符或者誤識別的字符所輸入的正確答案數(shù)據(jù)顯示在顯示單元725的正確答案數(shù)據(jù)顯示區(qū)域733C中,不能識別的字符或者誤識別的字符能夠以另外的方式被修改而不必對不能識別的字符或者誤識別字符顯示正確答案,或者另外只對于不能識別的字符和誤識別的字符之一的正確答案能夠被顯示以修改不能識別的字符或者誤識別的字符。
進(jìn)而,雖然本實(shí)施例中,如圖98中所見的那種表格格式的文件用作為其上描述存入數(shù)據(jù)的文件,都是其上描述存入數(shù)據(jù)的文件不限于此,而是可使用任何其它格式的文件。
(b)對本發(fā)明該實(shí)施例的修改的說明(b1)根據(jù)對該實(shí)施例的第一修改的文件識別裝置的說明圖105是表示根據(jù)對本發(fā)明的該實(shí)施例的第一修改的文件識別裝置。而且圖105所示的文件識別裝置能夠由以下裝置組成圖象數(shù)據(jù)閱讀裝置811,計(jì)算機(jī)812(這一計(jì)算機(jī)812包括如下所述的一個輸入部分812-1,一個顯示單元812-2,及一個控制部分812-3),以及類似于上述圖115的硬盤的一個硬盤813(參照標(biāo)號1001,1002和1003)。
圖象數(shù)據(jù)閱讀裝置811閱讀文件的圖象數(shù)據(jù),并對于這一圖象數(shù)據(jù)閱讀裝置811能夠使用類似于參照圖115上述的一個光學(xué)字符閱讀裝置(OCR裝置),一個圖象掃描器等。
基于由圖象數(shù)據(jù)閱讀裝置811所讀取的文件的圖象數(shù)據(jù),控制部分812-3進(jìn)行作為文件數(shù)據(jù)的處理,并能夠由作為CPU和存儲器的計(jì)算機(jī)812的功能部分形成。
進(jìn)而,類似于參照圖115前面所述的部分,控制部分812-3連接到諸如鍵盤或鼠標(biāo)等輸入部分(參照在以下將說明的圖106的標(biāo)號812-1),該輸入部分用于由操作者輸入數(shù)據(jù)、指令等到控制部分812-3,并連接到一個顯示單元(參照在以下將說明的圖106的標(biāo)號812-2),該顯示單元用于顯示由圖象數(shù)據(jù)閱讀裝置811所閱讀的圖象數(shù)據(jù)等。
硬盤(文件存儲器)813存儲所有由圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù)。
順便來說,如圖105所示,控制部分812-3在功能上包括一個圖象數(shù)據(jù)截取部分815,一個文件標(biāo)識字典部分816,一個數(shù)據(jù)比較部分817,一個閾值設(shè)定部分818,一個文件鑒別部分819,一個定義尺寸部分820,一個定義存儲表821,一個字符識別部分822,及一個字符識別結(jié)果存儲部分823。
圖象數(shù)據(jù)存儲器814存儲由圖象數(shù)據(jù)閱讀裝置811曾經(jīng)讀取的文件的圖象數(shù)據(jù)。圖象數(shù)據(jù)截取部分815具有作為文件標(biāo)識信息抽取裝置的功能并形成一抽取對象,該抽取裝置用于響應(yīng)基于由操作者進(jìn)行的輸入部分812-1的操作的信息指令(標(biāo)識信息),從存儲在圖象數(shù)據(jù)存儲器814的文件的圖象數(shù)據(jù)抽取在文件上描述的所希望的文件標(biāo)識信息。
當(dāng)上述的圖象數(shù)據(jù)截取部分815從標(biāo)識信息抽取所需的文件標(biāo)識信息時,由圖象數(shù)據(jù)閱讀裝置811讀取的文件的圖象數(shù)據(jù)顯示(投影)在顯示單元812-2上,并且操作者能夠基于顯示在顯示單元812-2上的圖象數(shù)據(jù)指令標(biāo)識信息。
要注意,作為通過圖象數(shù)據(jù)截取部分815構(gòu)成抽取對象的信息,例如通過軟件或固件處理操作者能夠指令例如任何所述的信息,諸如字符信息,標(biāo)記,文件上描述的印章或劃線,并且圖象數(shù)據(jù)截取部分815自動地抽取被指令的信息的坐標(biāo)位置信息,所述信息大小信息及數(shù)據(jù)信息,作為文件標(biāo)識信息。
進(jìn)而,文件標(biāo)識字典部分(文件標(biāo)識字典)816記錄由圖象數(shù)據(jù)截取部分815作為特定文件的文件標(biāo)識所抽取文件標(biāo)識信息。
更具體來說,如圖108所見,加有ID號碼′0101′文件類型A的文件標(biāo)識信息存儲在區(qū)域816a中,而加有ID號碼′0102′文件類型B的文件標(biāo)識信息存儲在區(qū)域816b中。
于是,作為從通過圖象數(shù)據(jù)閱讀裝置811所讀取的特定文件的圖象數(shù)據(jù)抽取寫在文件上的標(biāo)識信息并向文件標(biāo)識字典部分816記錄文件標(biāo)識信息的記錄步驟的操作是由上述圖象數(shù)據(jù)存儲器814,圖象數(shù)據(jù)截取部分815及文件標(biāo)識字典部分816進(jìn)行的。
要注意,雖然當(dāng)文件標(biāo)識信息要被記錄到文件標(biāo)識字典部分816時,由上述的圖象數(shù)據(jù)閱讀裝置811所讀取的文件的圖象數(shù)據(jù)一度存儲到圖象數(shù)據(jù)存儲器814中,但是由圖象數(shù)據(jù)閱讀裝置所閱讀的所有文件的圖象數(shù)據(jù)是存儲到硬盤813上的。
數(shù)據(jù)比較部分817具有作為校驗(yàn)裝置的功能,用于讀出存儲在圖象數(shù)據(jù)存儲器814中的特定文件的圖象數(shù)據(jù)并校驗(yàn)該特定文件的圖象數(shù)據(jù)是否包含存儲在文件標(biāo)識字典部分816中記錄的文件標(biāo)識信息,并還具有作為參照裝置的功能,用于檢測由圖象數(shù)據(jù)閱讀裝置811所讀取的并存儲在圖象數(shù)據(jù)存儲器814中的任意文件的圖象數(shù)據(jù)是否包含存儲在文件標(biāo)識字典部分816中的文件標(biāo)識信息,從而簡化了裝置的結(jié)構(gòu)。
進(jìn)而,文件鑒別部分819具有作為鑒別裝置的功能,用于鑒別特定文件的識別是否能夠基于由作為校驗(yàn)裝置的數(shù)據(jù)比較部分817所校驗(yàn)的結(jié)果進(jìn)行以便鑒別該特定文件是否已經(jīng)被完全確定為一個文件,并具有作為文件標(biāo)識裝置的另一個功能,用于基于由作為參照裝置的比較部分所進(jìn)行的參照的結(jié)果辨別任意一個文件是否為一個特定的文件,從而簡化了裝置的結(jié)構(gòu)。
更具體來說,作為校驗(yàn)裝置的數(shù)據(jù)比較部分817,從文件標(biāo)識字典部分816一個接一個圖象地從存儲在硬盤813有關(guān)所有文件的圖象數(shù)據(jù),相繼抽取由圖象數(shù)據(jù)截取部分815按文件的圖象數(shù)據(jù)為單元所抽取的信息,以及對應(yīng)的文件標(biāo)識信息,并對比檢驗(yàn)這些信息。作為鑒別裝置的文件鑒別部分819,基于來自數(shù)據(jù)比較部分817的文件標(biāo)識信息對比檢驗(yàn)的結(jié)果,而鑒別該文件是否能夠被唯一無誤地確定。
進(jìn)而,作為參照裝置的數(shù)據(jù)比較部分817對由圖象數(shù)據(jù)截取部分815從由圖象數(shù)據(jù)閱讀裝置811輸入的圖象數(shù)據(jù)所抽取的信息,與來自文件標(biāo)識字典部分816對應(yīng)的文件標(biāo)識信息進(jìn)行對比檢驗(yàn),以便計(jì)算相符的程度。作為文件鑒別裝置的文件鑒別部分819對于來自數(shù)據(jù)比較部分817的文件標(biāo)識信息與來自閾值設(shè)定部分818的閾值進(jìn)行比較,以鑒別從圖象數(shù)據(jù)閱讀裝置811所輸入的圖象數(shù)據(jù)的文件是否能夠被辨別。
于是,進(jìn)行作為鑒別特定文件的識別是否可能的檢驗(yàn)步驟的操作,并通過上述的文件標(biāo)識字典部分816,數(shù)據(jù)比較部分817,閾值設(shè)置部分818和文件鑒別部分819進(jìn)行作為鑒別任意文件是否為特定文件的操作步驟的操作。
換言之,上述的記錄步驟對應(yīng)于圖3的<當(dāng)布局第一次出現(xiàn)時>的處理(布局分析處理A2,操作者處理A6及布局學(xué)習(xí)處理A8),而上述的檢驗(yàn)步驟和操作步驟對應(yīng)于圖3的<當(dāng)布局再次出現(xiàn)時>的處理(布局分析處理A9,布局對比檢驗(yàn)處理A10,和操作者處理A13)。
要注意,在基于來自上述閾值設(shè)定部分818的閾值信息由文件的鑒別部分819進(jìn)行一致性鑒別時,來自上述閾值設(shè)定部分818的閾值信息設(shè)定為這樣的程度,即使得鑒別的進(jìn)行能夠吸收在圖象數(shù)據(jù)閱讀注重811的閱讀操作時的誤差,文件自身的打印誤差等等。
當(dāng)文件鑒別部分819鑒別有關(guān)任意文件為特定文件時,即當(dāng)系統(tǒng)操作時文件識別部分819成功地識別出其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置811讀取的文件是一個對應(yīng)于記錄在文件識別字典部分816中的文件標(biāo)識信息的特定文件時,定義存儲部分820從定義存儲表821讀出用于文件上所描述的數(shù)據(jù)的識別的定義信息,并在其中存儲該定義信息一次。
定義存儲表821存儲定義信息(例如,閱讀位置信息,字符屬性信息,閱讀列數(shù)等等),該信息要用于對應(yīng)于記錄在文件標(biāo)識字典部分816中文件標(biāo)識信息的一個特定文件上所描述的內(nèi)容的字符識別。
字符識別部分822接收存儲在上述圖象數(shù)據(jù)存儲器814中的圖象數(shù)據(jù),且該數(shù)據(jù)與已經(jīng)成功地被標(biāo)識為記錄在文件標(biāo)識字典部分816中的一個特定文件的文件及對應(yīng)于來自定義存儲部分820的圖象數(shù)據(jù)的定義信息相關(guān),并且字符識別部分822根據(jù)該定義信息進(jìn)行該圖象數(shù)據(jù)的字符識別處理。
進(jìn)而,字符識別結(jié)果存儲部分823存儲由字符識別部分822所識別的字符信息。
以下就上述的記錄步驟,檢驗(yàn)步驟和操作步驟,說明根據(jù)具有上述結(jié)構(gòu)的本發(fā)明該實(shí)施例的第一修改的文件標(biāo)識裝置的的操作。
·記錄步驟中的處理的說明首先,以下參照標(biāo)出了記錄步驟中的操作的圖106中所示的控制框圖以及表示在圖107和圖108中所示的記錄步驟中的操作的流程圖,說明根據(jù)本實(shí)施例的文件標(biāo)識裝置在記錄步驟中的操作。
具體來說,如圖108中所見,如果響應(yīng)操作者的操作由圖象數(shù)據(jù)閱讀裝置811閱讀電費(fèi)繳納通知文件824B的圖象數(shù)據(jù)(圖107的步驟B1),則所讀取的圖象數(shù)據(jù)一度存儲到圖象數(shù)據(jù)存儲裝置814中(圖107的步驟B2),并且該圖象數(shù)據(jù)也存儲到硬盤813使得由圖象數(shù)據(jù)閱讀裝置811讀取的所有圖象數(shù)據(jù)被存儲(圖107的步驟B3)。要注意,如圖108中所見由圖象數(shù)據(jù)閱讀裝置811讀取的圖象數(shù)據(jù)顯示在顯示單元812-2上(圖107的步驟B4)。
這里,在存儲在圖象數(shù)據(jù)存儲器814和硬盤813中的圖象數(shù)據(jù)為有關(guān)對于第一時間所讀取的一個文件的圖象數(shù)據(jù)之處,文件標(biāo)識信息存儲到如下所述的文件標(biāo)識字典部分816中。
具體而言,在操作者參照顯示單元812-2并操作輸入部分812-1時,構(gòu)成抽取對象的多片信息被指令到圖象數(shù)據(jù)截取部分815(圖107的步驟B5)。
圖象數(shù)據(jù)截取部分815從存儲在圖象數(shù)據(jù)存儲器814中的文件的圖象數(shù)據(jù)中自動地抽取文件上所描述的信息中的位置信息,尺寸信息及數(shù)據(jù)信息(圖107的步驟B6),并作為文件的標(biāo)識信息記錄這些信息到文件標(biāo)識字典部分816(圖107的步驟B)。
例如,如圖108中所見,操作者操作輸入部分812-1指定表示繳納通知的繳納款項(xiàng)內(nèi)容的“電費(fèi)”為第一信息,并指定表示付費(fèi)人的姓名的“Ichiro Fuji”為第二信息。于是,圖象數(shù)據(jù)截取部分815存儲上述第一信息的位置信息,尺寸信息和數(shù)據(jù)信息,并抽取第二信息的位置信息,尺寸信息和數(shù)據(jù)信息。
因而,所抽取的文件824B的文件標(biāo)識信息作為其ID號碼為“0102”的B類文件的文件標(biāo)識信息存儲到文件標(biāo)識字典部分816的區(qū)域816b。
要注意,在根據(jù)本修改的文件標(biāo)識裝置中,由圖象數(shù)據(jù)截取部分815所截取的圖象數(shù)據(jù)通常僅用于文件的標(biāo)識。
進(jìn)而,在根據(jù)本修改的文件標(biāo)識裝置中,通過記錄多片關(guān)于一個文件的文件標(biāo)識信息,無需進(jìn)行以上如(a5)特征數(shù)據(jù)識別處理中所述的圖象數(shù)據(jù)的歸一化處理,而能夠在以下所述的的檢驗(yàn)步驟和操作步驟標(biāo)識一個文件。
·檢驗(yàn)步驟中的處理的說明接下來,以下將參照標(biāo)出檢驗(yàn)步驟操作的圖109中所示的控制框圖和表示檢驗(yàn)步驟中的操作的圖110中所示的流程圖,說明根據(jù)本實(shí)施例的文件標(biāo)識裝置在檢驗(yàn)步驟中的操作。
如上所述,在記錄步驟,文件表示信息記錄到文件表示字典部分816。然后,進(jìn)行作為檢驗(yàn)步驟的操作,在該步驟使用記錄在文件標(biāo)識字典部分816中的文件標(biāo)識信息,檢驗(yàn)存儲在硬盤816上的所有文件的圖象是否能夠確定性地被標(biāo)識。
具體而言,使用在記錄步驟硬盤813操作時所存儲的及記錄在文件標(biāo)識字典部分816中的所有文件的圖象(全部文件的圖象),對于一個文件的每一圖象與記錄在文件標(biāo)識字典部分816中的文件標(biāo)識信息進(jìn)行對比檢驗(yàn)。
更具體來說,來自硬盤813的文件的圖象通過圖象數(shù)據(jù)存儲器814輸出到圖象數(shù)據(jù)截取部分815(圖110的步驟C1),并且圖象數(shù)據(jù)截取部分815基于文件標(biāo)識字典部分816中的對應(yīng)文件的文件標(biāo)識信息的位置信息和尺寸信息抽取用于對比檢驗(yàn)的數(shù)據(jù)。
數(shù)據(jù)比較部分817接收來自圖象數(shù)據(jù)截取部分815的對比檢驗(yàn)數(shù)據(jù)和作為來自文件標(biāo)識字典部分816的文件標(biāo)識信息的數(shù)據(jù)信息(圖110的步驟C2和C3),并且參照它們之間數(shù)據(jù)的一致程度進(jìn)行比較和對比檢驗(yàn)(圖110的步驟C4)。
文件鑒別部分819接收來自數(shù)據(jù)比較部分817的結(jié)果和來自閾值設(shè)定部分818的閾值,并當(dāng)所有文件標(biāo)識信息的一致性程度在閾值范圍之內(nèi)時,由于數(shù)據(jù)彼此吻合,故文件鑒別部分819鑒別出從硬盤813所抽取的文件的類型能夠被唯一確定,并記錄該確定的文件類型(從步驟C5的YES路線到步驟C6)。
另一方面,當(dāng)來自數(shù)據(jù)比較部分817的文件標(biāo)識信息的某些一致性程度不在閾值范圍之內(nèi)時,則數(shù)據(jù)彼此不吻合,故鑒別出文件的類型不能被確定(從步驟C5的NO路線到步驟C7)。然后,如果上述的處理沒有對于文件標(biāo)識字典部分816的所有文件類型完成,則對于記錄在文件標(biāo)識字典部分816中下一個文件類型的文件標(biāo)識信息進(jìn)行類似的處理(從步驟C7的NO路線到步驟C2)。于是,除非對于所有的文件類型確定了文件,不進(jìn)行在步驟C6的處理。
然后,對于存儲在硬盤813中的所有類型的文件圖象按類似于上述方式進(jìn)行文件標(biāo)識信息的一致性程度的鑒別(步驟C8)。
進(jìn)而,如果存儲在硬盤813中的所有類型的文件圖象已經(jīng)成功地確定為各個不同的文件,則判定檢驗(yàn)為OK,并且作為檢驗(yàn)步驟的操作而結(jié)束(從步驟C9的YES路線到步驟C10)。然而在任何其它情形下,判定存儲在文件標(biāo)識字典部分816中的文件標(biāo)識信息有缺陷,并且有缺陷的文件報(bào)告給操作者以便請求對于文件再指定文件標(biāo)識信息(從步驟C9的NO路線到步驟C11)。
于是,如果在記錄步驟之后從硬盤再次輸入特定文件的圖象數(shù)據(jù),并由數(shù)據(jù)比較部分817檢驗(yàn)該輸入的特定文件是否包含記錄在文件標(biāo)識字典部分816中的文件標(biāo)識信息,由圖象數(shù)據(jù)截取部分815能夠鑒別該特定文件的識別是否為可能。
·操作步驟操作的說明接下來,參照標(biāo)注出操作步驟的操作的圖111中所示的控制框圖以及表示操作步驟中的操作的圖112中所示的流程圖,將說明根據(jù)本實(shí)施例的文件標(biāo)識裝置在操作步驟中的操作。
如上所述,在檢驗(yàn)步驟中,使用記錄在文件標(biāo)識字典部分816中的文件標(biāo)識信息,檢驗(yàn)存儲在硬盤813上的所有文件的圖象是否能夠被確定。在檢驗(yàn)結(jié)束之后,在裝置的實(shí)際操作中,對于任意一個文件的圖象數(shù)據(jù)進(jìn)行諸如下述的確定文件類型的操作步驟的操作。
具體而言,如果一定的文件的圖象數(shù)由操作者通過圖象數(shù)據(jù)閱讀裝置811的操作而被閱讀(圖112的步驟D1),則所讀取的圖象數(shù)據(jù)一度存儲到圖象數(shù)據(jù)存儲器814中(圖112的步驟D2)。
然后,基于構(gòu)成一定的文件的類型的文件標(biāo)識信息的位置信息和尺寸信息,圖象數(shù)據(jù)截取部分815從多個位置抽取并截取一度存儲在圖象數(shù)據(jù)存儲器814中的圖象數(shù)據(jù)(標(biāo)識信息)(步驟D3和D4)。
然后,數(shù)據(jù)比較部分817計(jì)算由圖象數(shù)據(jù)截取部分815所截取的所有圖象數(shù)據(jù)的數(shù)據(jù)信息與構(gòu)成該文件的標(biāo)識信息的數(shù)據(jù)信息之間的一致性程度以實(shí)現(xiàn)比較和鑒別(步驟D5)。
進(jìn)而,文件鑒別部分819比較作為來自數(shù)據(jù)比較部分817的比較和鑒別的結(jié)果而計(jì)算的一致性程度與對于一致性程度在閾值設(shè)定部分818中所設(shè)定的標(biāo)準(zhǔn),以便鑒別從由圖象數(shù)據(jù)閱讀裝置811所讀取的圖象數(shù)據(jù)與來自文件標(biāo)識字典部分816的文件標(biāo)識信息是否能夠確定文件的類型(步驟D6)。
具體來說,當(dāng)?shù)谝晃募愋虯的圖象數(shù)據(jù)從圖象數(shù)據(jù)閱讀裝置811讀取,同時第二文件類型B的文件標(biāo)識信息用作為構(gòu)成比較對象的來自文件標(biāo)識字典816文件標(biāo)識信息時,鑒別不一致性,并且使用關(guān)于來自文件標(biāo)識字典部分816的另一文件類型的文件標(biāo)識信息進(jìn)行一致程度的鑒別(從步驟D3的NO路線經(jīng)過步驟D8的NO路線到步驟D3)。
另一方面,例如,當(dāng)?shù)谝晃募愋虯的圖象數(shù)據(jù)從圖象數(shù)據(jù)閱讀裝置811讀入時,如果來自文件標(biāo)識字典部分816的構(gòu)成比較對象的文件標(biāo)識信息是關(guān)于第一文件類型A的信息,則對于該文件標(biāo)識信息鑒別鑒別一致性,并且讀入的圖象數(shù)據(jù)確定為相關(guān)文件類型。這時所確定的文件類型存儲到控制部分812-3中未示出的一個存儲器中(從步驟D的YES路線到D7)。
要注意,在由上述的文件鑒別部分819進(jìn)行鑒別時,如果由圖象數(shù)據(jù)截取部分815所截取的多個位置的圖象數(shù)據(jù)任何之一與來自文件標(biāo)識字典部分816的文件標(biāo)識信息不相符,則它被鑒別為不同類型的文件。
然后基于存儲在文件標(biāo)識字典部分816的所有各個類型的文件的文件標(biāo)識信息,對來自由上述圖象數(shù)據(jù)閱讀部分811所讀取圖象數(shù)據(jù)的文件標(biāo)識信息的一致性程度進(jìn)行類似于上述鑒別的的鑒別(步驟D8)。
這里,如果由圖象數(shù)據(jù)閱讀部分811所讀取圖象數(shù)據(jù)已經(jīng)由上述一致性程度鑒別成功地確定為一個文件類型的數(shù)據(jù),則所確定的文件類型輸出到定義存儲部分820(參照圖105)(從步驟D9的YES路線到步驟D10)。
然而,如果該圖象數(shù)據(jù)沒有被確定為一個文件類型的數(shù)據(jù),則例如借助于顯示單元812-2向操作者報(bào)告文件確定失敗(從步驟D9的NO路線到步驟D11)。
要注意,如果確定為一個類型的文件類型輸入到定義存儲部分820,則定義存儲部分820從定義存儲表821讀出對應(yīng)于所確定的文件類型的定義信息(讀位置信息,字符屬性信息,讀列數(shù)目等等)。
于是,字符識別部分822識別其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置811讀取并存儲在圖象數(shù)據(jù)存儲器814中的文件上所描述的定義信息和字符信息,并作為識別的結(jié)果存儲該字符信息到字符識別結(jié)果存儲部分823。
于是當(dāng)特定文件已經(jīng)在檢驗(yàn)步驟被成功地識別時,通過借助于圖象數(shù)據(jù)閱讀裝置811閱讀任意文件的圖象數(shù)據(jù)并參照任意文件的圖象數(shù)據(jù)以檢測該圖象數(shù)據(jù)是否包含記錄在文件標(biāo)識字典部分816中的文件標(biāo)識信息,能夠標(biāo)識該任意文件是否為特定文件并可進(jìn)行字符識別。
這樣,使用根據(jù)本發(fā)明的該實(shí)施例的第一修改的文件標(biāo)識裝置,由于它包含圖象數(shù)據(jù)閱讀裝置811,圖象數(shù)據(jù)存儲器814,硬盤813,圖象數(shù)據(jù)截取部分815,文件標(biāo)識字典部分816,數(shù)據(jù)比較部分817及文件鑒別部分819,在該裝置操作中,能夠自動地標(biāo)識其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置811讀取的文件的類型。于是,即使要由圖象數(shù)據(jù)閱讀裝置811讀取的多種類型文件以混合狀態(tài)出現(xiàn),操作者無需知道每一文件的定義而能夠處理這些文件。于是,該文件識別裝置的優(yōu)點(diǎn)在于能夠達(dá)到工作的高效率。該文件識別裝置的優(yōu)點(diǎn)還在于,,用于標(biāo)識文件本身的ID號碼等無需在文件上說明而可使用普通的文件,于是該文件標(biāo)識裝置能夠易于用于現(xiàn)有的系統(tǒng)。
進(jìn)而,在向文件標(biāo)識字典部分816記錄文件識別信息時,只要操作者指定該信息同時目視觀察投影在顯示單元812-2上的供記錄的對象文件的圖象數(shù)據(jù)即能夠自動地取得必要的文件標(biāo)識信息。于是,易于產(chǎn)生用于文件標(biāo)識的字典,并能夠達(dá)到在工作效率的改進(jìn)。
進(jìn)而,由于該文件標(biāo)識裝置包含作為檢驗(yàn)裝置的數(shù)據(jù)比較部分817和作為鑒別裝置的文件鑒別部分819,故能夠檢驗(yàn)由操作者所指定的文件標(biāo)識信息是否正確。于是,該文件標(biāo)識裝置的優(yōu)點(diǎn)在于,完全消除了文件標(biāo)識中的錯誤并改進(jìn)了裝置的可靠性。
進(jìn)而,在操作者指令一個文件中多個位置作為標(biāo)識信息之處,能夠比基于指定單個位置時的標(biāo)識信息那樣所抽取的文件標(biāo)識信息更高的精度從基于標(biāo)識信息所抽取的文件標(biāo)識信息而標(biāo)識文件。
(b2)根據(jù)該實(shí)施例的第二修改的文件標(biāo)識裝置的說明圖113是表示根據(jù)本發(fā)明該實(shí)施例第二修改的文件標(biāo)識裝置的一個框圖,并具體示出其中標(biāo)注出記錄標(biāo)注操作的控制框圖。
圖113中所示的文件標(biāo)識裝置具有基本上與參照圖105上述文件標(biāo)識裝置類似的結(jié)構(gòu),所不同之處在于,文件標(biāo)識信息抽取裝置包含一個自動標(biāo)題部分抽取部分815a,自動項(xiàng)目標(biāo)題部分抽取部分815b和文件標(biāo)識信息截取部分815c。
自動科目部分抽取部分815a自動地抽取有關(guān)存儲在圖象數(shù)據(jù)存儲器814中的文件被視為科目部分的圖象數(shù)據(jù)部分的位置信息(例如參照作為示于圖108中上述第一文件標(biāo)識信息的′電費(fèi)率′)。
自動項(xiàng)目標(biāo)題部分抽取部分815b自動地從存儲在圖象數(shù)據(jù)存儲器814中的有關(guān)一個文件的圖象數(shù)據(jù)抽取一個項(xiàng)目部分的位置信息。
基于來自自動科目部分抽取部分815a和自動項(xiàng)目標(biāo)題部分抽取部分815b的位置信息,文件標(biāo)識信息截取部分815c從存儲在圖象數(shù)據(jù)存儲器814中的圖象數(shù)據(jù)截取科目部分和項(xiàng)目部分尺寸信息及作為文件標(biāo)識信息的數(shù)據(jù)信息。
使用具有上述結(jié)構(gòu)根據(jù)本發(fā)明該實(shí)施例的第二修改的文件標(biāo)識裝置,作為類似于上述實(shí)施例的記錄標(biāo)步驟的操作,如果圖象數(shù)據(jù)閱讀裝置811響應(yīng)操作者的操作而讀取一個文件的圖象數(shù)據(jù)(圖114的步驟E1),那么圖象數(shù)據(jù)存儲器814存儲一度存儲所讀取的圖象數(shù)據(jù)(圖114的步驟E2),并且該圖象數(shù)據(jù)還存儲到硬盤813使得由圖象數(shù)據(jù)一度裝置811所讀取的所有圖象數(shù)據(jù)被存儲(圖114的步驟E3)。
然后,自動科目部分抽取部分815a自動地抽取似乎是文件科目的部分的位置信息(圖114的步驟E4),并且自動項(xiàng)目標(biāo)題部分抽取部分815b自動地抽取劃線項(xiàng)目中所描述的項(xiàng)目標(biāo)題的位置信息(圖114的步驟E5)。
基于來自上述自動科目部分抽取部分815a和自動項(xiàng)目標(biāo)題部分抽取部分815b的位置信息,文件標(biāo)識信息截取部分815c抽取尺寸信息和數(shù)據(jù)信息(圖114的步驟E6),并記錄位置信息和尺寸信息以及對應(yīng)于該位置信息作為文件標(biāo)識信息的數(shù)據(jù)信息到文件標(biāo)識字典部分816(圖114的步驟E7)。
要注意,檢驗(yàn)步驟或操作步驟中的操作基本上類似于上述實(shí)施例的操作。
于是,使用上述參照圖105文件標(biāo)識裝置,雖然操作者根據(jù)本實(shí)施例參照顯示單元812-2并操作輸入部分812-1指定用于文件標(biāo)識信息抽取的標(biāo)識信息,但是特定文件上所描述的特定文件標(biāo)識信息能夠自動地從由圖象數(shù)據(jù)閱讀裝置811所讀取的特定文件的圖象數(shù)據(jù)抽取并記錄到文件標(biāo)識字典部分816。于是,其中的優(yōu)點(diǎn)在于,操作者的操作效率能夠顯著改進(jìn)。
要注意,在上述參照圖113的實(shí)施例中,雖然使用科目部分和項(xiàng)目部分作為用于文件標(biāo)識信息抽取的標(biāo)識信息,但是此外文件的任何其它部分(固定信息部分)也可使用。
(b3)其它在上述本發(fā)明該實(shí)施例的修改中,作為檢驗(yàn)裝置的數(shù)據(jù)比較部分817和作為鑒別裝置的文件鑒別部分819進(jìn)行檢驗(yàn)步驟的操作,這操作的進(jìn)行是通過在記錄步驟之后當(dāng)特定文件的圖象數(shù)據(jù)再次輸入時檢驗(yàn)輸入的特定文件的圖象數(shù)據(jù)是否包含記錄在文件標(biāo)識字典部分816中的文件標(biāo)識信息以便鑒別該特定文件的識別是否可能。然而,即使省略檢驗(yàn)步驟的操作,至少在裝置的操作中,由于其圖象數(shù)據(jù)由圖象數(shù)據(jù)閱讀裝置811讀取的文件的類型能夠被自動地標(biāo)識,即使要由圖象數(shù)據(jù)閱讀裝置811讀取的多個類型文件混合狀態(tài)出現(xiàn),操作者也能夠處理這些文件而無需知道每一文件的定義。于是,其中的優(yōu)點(diǎn)在于,科研改進(jìn)工作效率。進(jìn)而,用于標(biāo)識文件本身的ID號碼等不需要在文件上描述,于是能夠使用普通的文件。于是另一個優(yōu)點(diǎn)在于,易于用于現(xiàn)有的系統(tǒng)。
進(jìn)而,在記錄文件標(biāo)識信息到文件標(biāo)識字典816時,只要如果操作者在觀察投影到顯示單元812-2上的供記錄的對象文件的圖象數(shù)據(jù)時進(jìn)行指定,則能夠自動地取得必要的文件標(biāo)識信息。于是,易于產(chǎn)生用于文件之間的標(biāo)識的字典,并能夠達(dá)到工作效率的改進(jìn)。
如上所述,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置和數(shù)據(jù)媒體處理方法適用于處理例如金融機(jī)構(gòu)中的文件,并特別地,由于能夠自動地處理具有各種格式的文件諸如私人文件等,故該數(shù)據(jù)媒體處理裝置和數(shù)據(jù)媒體處理方法被認(rèn)為有很高的可使用性。
權(quán)利要求
1.一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其特征在于,當(dāng)符號圖象信息沒有被成功地轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有被成功轉(zhuǎn)換的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與和不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在顯示單元(725)上,并且不可識別符號圖象信息被強(qiáng)調(diào)顯示。
2.如權(quán)利要求1中所述的數(shù)據(jù)媒體處理方法,其特征在于,當(dāng)對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置(722)的操作輸入時,正確答案數(shù)據(jù)被顯示在所述顯示單元(725)上的不同于不可識別符號圖象信息顯示區(qū)域(723A)的正確答案數(shù)據(jù)顯示區(qū)域(733C)上。
3.如權(quán)利要求1中所述的數(shù)據(jù)媒體處理方法,其特征在于,當(dāng)對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置(722)的操作輸入時,已經(jīng)被強(qiáng)調(diào)顯示的不可識別符號圖象信息按不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示不可識別符號圖象信息已經(jīng)被修改。
4.如權(quán)利要求1中所述的數(shù)據(jù)媒體處理方法,其特征在于,當(dāng)對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置(722)的操作輸入時,正確答案數(shù)據(jù)被顯示在所述顯示單元(725)上的不同于不可識別符號圖象信息顯示區(qū)域(732A)的正確答案數(shù)據(jù)顯示區(qū)域(733C)中,同時已經(jīng)被強(qiáng)調(diào)顯示的不可識別符號圖象信息按不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示不可識別符號圖象信息已經(jīng)被修改。
5.一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其特征在于,圖象中要被轉(zhuǎn)換為代碼信息的最小組成單元的符號圖象信息,相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表示的符號信息而被顯示在顯示單元(725)上。
6.如權(quán)利要求5中所述的數(shù)據(jù)媒體處理方法,其特征在于,在多條同類最小組成單元的符號圖象信息相應(yīng)于通過由符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表示的符號信息而被顯示時,僅強(qiáng)調(diào)顯示多條符號圖象信息中期望的一條信息。
7.如權(quán)利要求5中所述的數(shù)據(jù)媒體處理方法,其特征在于,期望的一條符號圖象信息以一個讀取圖象的狀態(tài)與和該條符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在所述顯示單元(725)上,并且該一條符號圖象信息被強(qiáng)調(diào)顯示。
8.如權(quán)利要求7中所述的數(shù)據(jù)媒體處理方法,其特征在于,當(dāng)對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置(722)的操作輸入時,正確答案數(shù)據(jù)被顯示在正確答案數(shù)據(jù)顯示區(qū)域(733C)上,該區(qū)域不同于顯示該一條符號圖象信息以及與該一條符號圖象信息相關(guān)聯(lián)的符號圖象信息的區(qū)域(733A)。
9.如權(quán)利要求7中所述的數(shù)據(jù)媒體處理方法,其特征在于,當(dāng)對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置(722)的操作輸入時,已經(jīng)被強(qiáng)調(diào)顯示的該一條符號圖象信息以不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示該一條符號圖象信息已經(jīng)被修改。
10.如權(quán)利要求8中所述的數(shù)據(jù)媒體處理方法,其特征在于,當(dāng)對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置(722)的操作輸入時,正確答案數(shù)據(jù)被顯示在正確答案數(shù)據(jù)顯示區(qū)域(733C)上,該區(qū)域不同于顯示該一條符號圖象信息以及與該一條符號圖象信息相關(guān)聯(lián)的符號圖象信息的區(qū)域(733A),并且已經(jīng)被強(qiáng)調(diào)顯示的該一條符號圖象信息以不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示該一條符號圖象信息已經(jīng)被修改。
11.一種數(shù)據(jù)媒體處理裝置,其特征為它包括圖象讀取部分(721),用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分(726),用于識別由所述圖象讀取部分(721)讀取的圖象中的符號圖象信息,并將該符號圖象信息轉(zhuǎn)換為對應(yīng)的代碼信息;顯示單元(725),用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;以及讀取符號圖象顯示控制部分(727),用于當(dāng)符號圖象信息沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息時,使其轉(zhuǎn)換沒有成功進(jìn)行的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與和不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在所述顯示單元(725)上;所述讀取符號圖象顯示控制部分(727)包含用于強(qiáng)調(diào)顯示不可識別符號圖象信息的強(qiáng)調(diào)顯示裝置(727A)。
12.如權(quán)利要求11中所述的數(shù)據(jù)媒體處理裝置,其特征在于,該裝置還包括數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù);以及正確答案數(shù)據(jù)顯示裝置(728),用于當(dāng)正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使正確答案數(shù)據(jù)被顯示在所述顯示單元上的不同于不可識別符號圖象信息顯示區(qū)域的一個正確答案數(shù)據(jù)顯示區(qū)域(733C)內(nèi)。
13.如權(quán)利要求12中所述的數(shù)據(jù)媒體處理裝置,其特征在于,該裝置還包括強(qiáng)調(diào)顯示改變裝置(727B),用于當(dāng)正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使已經(jīng)被強(qiáng)調(diào)顯示的符號圖象信息以不同的強(qiáng)調(diào)方式被顯示,其中該強(qiáng)調(diào)方式表示不可識別符號圖象信息已經(jīng)被修改。
14.如權(quán)利要求12中所述的數(shù)據(jù)媒體處理裝置,其特征在于,該裝置還包括強(qiáng)調(diào)顯示改變裝置(727B),用于當(dāng)正確答案數(shù)據(jù)由所述正確答案數(shù)據(jù)顯示裝置(728)顯示在所述顯示單元(725)上的不同于所述不可識別符號圖象信息顯示區(qū)域(732A)的所述正確答案數(shù)據(jù)顯示區(qū)域(733C)內(nèi)時,使已經(jīng)被強(qiáng)調(diào)顯示的不可識別符號圖象信息按不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示不可識別符號圖象信息已經(jīng)被修改。
15.一種數(shù)據(jù)媒體處理裝置,其特征在于它包括圖象讀取部分(721),用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分(726),用于識別由所述圖象讀取部分(721)讀取的圖象中的符號圖象信息,并將該符號圖象信息轉(zhuǎn)換為對應(yīng)的代碼信息;顯示單元(725),用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;最小組成單元符號圖象信息抽取部分(729),用于對于每一條最小組成單元的符號圖象信息,抽取圖象中要被轉(zhuǎn)換為代碼信息的最小組成單元的符號圖象信息;以及最小組成單元符號圖象顯示控制部分(730),用于使由所述最小組成單元符號圖象信息抽取部分(729)所抽取的最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表示的符號信息而被顯示。
16.如權(quán)利要求15中所述的數(shù)據(jù)媒體處理裝置,其特征在于,所述最小組成單元符號圖象顯示控制部分(730)具有使多條同類的最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表示的符號信息而被顯示的功能,以及包括強(qiáng)調(diào)顯示裝置(730A),用于使得僅強(qiáng)調(diào)顯示所期望的一條符號圖象信息。
17.如權(quán)利要求15中所述的數(shù)據(jù)媒體處理裝置,其特征在于,它還包括相關(guān)符號圖象顯示裝置(731),用于在所述顯示單元(725)上以一個讀取圖象的狀態(tài)顯示要被顯示的該一條符號圖象信息以及和該一條符號圖象信息相關(guān)聯(lián)的符號圖象信息,以及所述相關(guān)符號圖象顯示裝置(731)包含強(qiáng)調(diào)顯示裝置(731A),用于使該一條符號圖象信息被強(qiáng)調(diào)顯示。
18.如權(quán)利要求15中所述的數(shù)據(jù)媒體處理裝置,其特征在于它還包括數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù);以及正確答案數(shù)據(jù)顯示裝置(728),用于當(dāng)正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域(733C)內(nèi),該區(qū)域不同于顯示該一條符號圖象信息以及與該一條符號圖象信息相關(guān)聯(lián)的符號圖象信息的區(qū)域(732A)。
19.如權(quán)利要求15中所述的數(shù)據(jù)媒體處理裝置,其特征在于它還包括數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù);以及強(qiáng)調(diào)顯示改變裝置(730B),用于當(dāng)正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使已經(jīng)被強(qiáng)調(diào)顯示的該一條符號圖象信息按不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示該一條符號圖象信息已經(jīng)被修改。
20.如權(quán)利要求15中所述的數(shù)據(jù)媒體處理裝置,其特征在于它還包括數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù);正確答案數(shù)據(jù)顯示裝置(728),用于當(dāng)正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域(733C)內(nèi),該區(qū)域不同于顯示該一條符號圖象信息與和該一條符號圖象信息相關(guān)聯(lián)的符號圖象信息的區(qū)域(733A);以及強(qiáng)調(diào)顯示改變裝置(730B),用于當(dāng)正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使已經(jīng)被強(qiáng)調(diào)顯示的該一條符號圖象信息按不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示該一條符號圖象信息已經(jīng)被修改。
21.一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其特征在于,當(dāng)符號圖象信息沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有成功轉(zhuǎn)換的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與和不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在顯示單元(725)上,并且不可識別符號圖象信息被強(qiáng)調(diào)顯示,并且然后,當(dāng)對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù)由數(shù)據(jù)輸入裝置(722)的操作輸入時,已經(jīng)被強(qiáng)調(diào)顯示的不可識別符號圖象信息按不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示該不可識別符號圖象信息已經(jīng)被修改,并且基于正確答案數(shù)據(jù)修改該不可識別符號圖象信息。
22.一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其特征在于,要被轉(zhuǎn)換為代碼信息的多條同類最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表示的符號信息而被顯示,同時僅強(qiáng)調(diào)顯示所期望的一條符號圖象信息,并且然后當(dāng)對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù)由數(shù)據(jù)輸入裝置(722)的操作輸入時,已經(jīng)被強(qiáng)調(diào)顯示的該一條符號圖象信息按不同的強(qiáng)調(diào)方式顯示,其中該強(qiáng)調(diào)方式表示該一條符號圖象信息已經(jīng)被修改,并且基于正確答案數(shù)據(jù)修改對應(yīng)于該一條符號圖象信息的錯誤識別的信息。
23.一種數(shù)據(jù)媒體處理裝置,其特征在于它包括圖象讀取部分(721),用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分(726),用于識別由所述圖象讀取部分(721)讀取的圖象中的符號圖象信息,并將該符號圖象信息轉(zhuǎn)換為對應(yīng)的代碼信息;顯示單元(725),用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;讀取符號圖象顯示控制部分(727),用于當(dāng)符號圖象信息沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息時,使其轉(zhuǎn)換沒有成功進(jìn)行的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與和不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在所述顯示單元(725)上;強(qiáng)調(diào)顯示裝置(727A),用于使不可識別符號圖象信息被強(qiáng)調(diào)顯示;數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù);強(qiáng)調(diào)顯示改變裝置(727B),用于當(dāng)正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使到此時已經(jīng)被強(qiáng)調(diào)顯示的不可識別符號圖象信息以與表示修改完成的強(qiáng)調(diào)方式不同的強(qiáng)調(diào)方式被顯示;以及識別信息修改裝置(752),用于當(dāng)正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置(722)的操作輸入時,基于該正確答案數(shù)據(jù)修改不可識別符號圖象信息。
24.一種數(shù)據(jù)媒體處理裝置,其特征在于它包括圖象讀取部分(721),用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分(726),用于識別由所述圖象讀取部分(721)讀取的圖象中的符號圖象信息,并將該符號圖象信息轉(zhuǎn)換為對應(yīng)的代碼信息;顯示單元(725),用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;最小組成單元符號圖象信息抽取部分(729),用于對于每一條最小組成單元的符號圖象信息,抽取圖象中要被轉(zhuǎn)換為代碼信息的最小組成單元的符號圖象信息;最小組成單元符號圖象顯示控制部分(730),用于使由所述最小組成單元符號圖象信息抽取部分(729)所抽取的多條最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表示的符號信息而被顯示;強(qiáng)調(diào)顯示裝置(730A),用于使得僅強(qiáng)調(diào)顯示所期望的一條符號圖象信息;數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù);強(qiáng)調(diào)顯示改變裝置(730B),用于當(dāng)正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使到此時已經(jīng)被強(qiáng)調(diào)顯示的一條符號圖象信息以與表示修改完成的強(qiáng)調(diào)方式不同的強(qiáng)調(diào)方式被顯示;以及識別信息修改裝置(752),用于當(dāng)正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置(722)的操作輸入時,基于該正確答案數(shù)據(jù)修改對應(yīng)于該一條符號圖象信息的錯誤識別的信息。
全文摘要
本發(fā)明公開了一種數(shù)據(jù)媒體處理方法和裝置。在該數(shù)據(jù)媒體處理方法中,具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其中,當(dāng)符號圖象信息沒有被成功地轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有被成功轉(zhuǎn)換的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與和不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在顯示單元上,并且不可識別符號圖象信息被強(qiáng)調(diào)顯示。
文檔編號G06K9/20GK101030254SQ200610151750
公開日2007年9月5日 申請日期1996年7月30日 優(yōu)先權(quán)日1995年7月31日
發(fā)明者江口真一, 勝又裕, 千葉亙一, 松野秀樹, 永野義博, 牛田和秀, 鐮田英夫, 松橋智浩, 稻岡秀行, 渡部英一, 直井聰, 坂根俊司, 小原勝利, 山本一范, 渡邊和人, 木嶋順之, 山崎芳則, 町田泰孝 申請人:富士通株式會社