專利名稱:數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法
技術(shù)領域:
本發(fā)明涉及媒體處理裝置及涉及例如適用于金融機構(gòu)文件處理的數(shù)據(jù)媒體處理方法,并特別涉及進行對諸如個人文件等具有各種格式的文件的處理的數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法。
背景技術(shù):
近年來,作為閱讀當作圖象數(shù)據(jù)(一個圖象)的字符信息并然后識別字符的裝置,諸如光學字符閱讀裝置(OCR裝置)得到發(fā)展,并在各種行業(yè)中,廣泛使用圖象數(shù)據(jù)閱讀裝置以便達到業(yè)務上效率的擴充等。
例如,在金融機構(gòu)等的窗口操作的操作者通過使用上述圖象數(shù)據(jù)閱讀裝置有效處理文件媒體(多個文件)而達到業(yè)務的擴充。
特別,為了在進行上述這種文件處理的業(yè)務中有效達到擴充,不僅需要同類型的文件媒體(專用于識別處理的媒體),而且還需要自動地處理具有不同格式的文件媒體。
這樣,使用圖象數(shù)據(jù)閱讀裝置的文件媒體的處理能夠通過使用例如圖115所示的文件處理裝置對于多種文件媒體進行。
特別,參照圖115,標號1001表示用于閱讀文件的圖象數(shù)據(jù)的圖象數(shù)據(jù)閱讀裝置。圖象數(shù)據(jù)閱讀裝置1001連接到計算機1002使得它能夠在計算機1002的控制下進行圖象數(shù)據(jù)的閱讀操作??勺⒁獾氖?,例如圖象掃描器或者傳真機用作為圖象數(shù)據(jù)閱讀裝置1001。
同時,計算機1002作為用于控制圖象數(shù)據(jù)閱讀裝置1001的控制裝置由諸如鍵盤或者鼠標(圖115中只示出鍵盤)用于從操作者輸入指令、數(shù)據(jù)等的輸入單元1002-1,計算機主機1002-2,及用于顯示數(shù)據(jù)、控制信息等顯示單元1002-3組成??勺⒁獾剑蓤D象數(shù)據(jù)閱讀裝置1001所閱讀的圖象數(shù)據(jù)的字符識別處理是由計算機主機1002-2進行的。
進而,標號硬盤1003表示一個硬盤。硬盤1003連接到計算機1002并預先存儲信息(下面稱為“定義對象的信息”)1003A到1003C,...,該信息對于例如圖116所示的每一種類的文件,指定要被識別的字符數(shù)據(jù)的位置信息,及字符的類型,數(shù)目等等。
可注意的是,能夠使用如圖116或117所示的圖象數(shù)據(jù)閱讀和識別裝置1005替代上述的圖象數(shù)據(jù)閱讀裝置1001。圖象數(shù)據(jù)閱讀和識別裝置1005能夠進行類似于圖象數(shù)據(jù)閱讀裝置1001的圖象數(shù)據(jù)閱讀操作以及字符識別。
為了使用圖象數(shù)據(jù)閱讀和識別裝置1005識別出現(xiàn)在例如圖116所示的電費付款通知單1004上的字符數(shù)據(jù),通過操作者操作鍵盤1002-1指定文件類型(這種情形下,定義對象信息1003B對應于電費付款通知單1004(文件B))。
然后,計算機1002訪問硬盤1003取得被指定的文件的定義對象信息1003B,并向圖象數(shù)據(jù)閱讀和識別裝置1005報告該定義對象信息1003B。
繼而,圖象數(shù)據(jù)閱讀和識別裝置1005能夠基于作為來自計算機1002的控制信息的定義對象信息1003B實現(xiàn)圖象數(shù)據(jù)的閱讀和字符識別的處理。
可是,在處理諸如參照圖116上述的文件的過程中,由于定義對象信息是對每一要閱讀的文件通過操作者的指定而被指定的,故加重了操作者的負擔,并且此外,當定義對象在數(shù)量上增加時,可能出現(xiàn)指定的錯誤。在需要處理數(shù)千種文件的地方,對于操作者指定一個定義對象實際上是困難的。
因而,此間如圖117所示還提出另一方法,在文件1004規(guī)定的位置處1004a記錄用于標識一個文件以便同任何其它文件相區(qū)別的ID號碼(這種情形下是′0102′),使得文件的閱讀處理能夠自動地進行而無需如上述那樣由操作者指定文件類型。
由剛才所述的方法,當文件的圖象數(shù)據(jù)要由圖象數(shù)據(jù)閱讀和識別裝置1005閱讀時,可通過首先識別在預定位置1004a所記錄的ID號碼,然后使用對應于所識別的ID號碼的定義對象信息(這種情形下為1003B)實現(xiàn)字符的識別。
然而在要閱讀圖象數(shù)據(jù)時,如果在諸如圖象數(shù)據(jù)閱讀裝置1001或者圖象數(shù)據(jù)閱讀和識別裝置1005等光學閱讀裝置申(例如文件處理裝置)文件等所放置的位置錯位時,或甚至例如閱讀與其定義對象信息預先存儲在硬盤1003中的文件相同的文件,則由于字符數(shù)據(jù)區(qū)域,即字形等等區(qū)域?qū)⒄拯c(物理原點)的圖象坐標不表現(xiàn)為與定義對象信息的圖象相同的坐標,而在文件處理裝置中等判斷布局彼此不同。
在文件處理裝置等中,除非在彼此調(diào)整了所閱讀圖象數(shù)據(jù)的布局和定義對象信息的布局之后進行圖象數(shù)據(jù)的字符識別,否則有時不能正規(guī)地進行字符識別處理。因而,各個圖象的參照點被提取,并且各個圖象對該參照點的坐標彼此進行比較以實現(xiàn)布局之間的重合的鑒別。
這里,主要使用以下兩者方法取得圖象數(shù)據(jù)的參照點。要注意的是,作為先決條件,供閱讀的對象文件是事先打印的文件并且文件在表格上的打印位置以高度精確管理。
根據(jù)第一方法,當文件的圖象數(shù)據(jù)由圖象數(shù)據(jù)閱讀裝置閱讀時,表格端邊緣1006的左上轉(zhuǎn)角位置P確定為參照點,該裝置中如圖118(a)所示,被閱讀的文件的表格端邊緣1006與閱讀背景1007能夠彼此識別開。
根據(jù)第二方法,當文件的圖象數(shù)據(jù)要由圖象掃描器或者傳真機閱讀時,由于閱讀背景1009與被閱讀的表格端邊緣1008如在圖118(b)所見不能彼此識別開,故在對象文件表格上打印一個參照標號R供預先閱讀,并且從圖象數(shù)據(jù)抽取這個標號R且被判斷為參照點。
第二個方法優(yōu)點在于,由于參照點位置是作為參照標號R預先打印的,故即使在閱讀裝置中文件所放置的位置移動,參照點也能夠被穩(wěn)定地抽取。
然而,在文件處理裝置等中,即使通過上述方法精確抽取了參照點,如果圖象數(shù)據(jù)的閱讀方向不是正確的方向,則圖象數(shù)據(jù)的字符說明方向也不是正確的方向,因而字符識別處理不能進行。
例如如圖119中所示,如果其上的信息是在水平方向所述一轉(zhuǎn)帳票具(文件C)1010在錯誤的方向(在圖119中垂直方向)上被閱讀,則這樣所閱讀的轉(zhuǎn)帳票具1010的圖象數(shù)據(jù)是在錯誤的方向上顯示的,如顯示單元1002-3上參照符號1010A所示。
因而,由文件處理裝置等進行字符識別處理時,操作者必須目視觀察顯示單元1002-3以判斷文件閱讀方向是否正確,并當文件的閱讀方向不正確時,從鍵盤1002-1輸入指令以便旋轉(zhuǎn)所閱讀的文件圖象數(shù)據(jù)90度或180度,使得實現(xiàn)圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理,以便文件的圖象數(shù)據(jù)能夠在如顯示單元1002-3上由參照符號1010B標記的正確方向上顯示。
順便來說,在通常向銀行帳戶匯付工作中,操作者輸入在文件上所述的帳戶號碼、姓名、款的數(shù)量等等信息,該文件是來自文件處理裝置1000的鍵盤1002-1等的一個匯付請求票具。這時,操作者目視地交替觀察文件及顯示單元1002-3以便進行輸入操作。
然而,在文件和顯示單元1002-3目視被交替地觀察以便按這樣的方式進行輸入操作的地方,由于涉及到操作者眼睛很多的運動,故問題在于目視可辨別性變壞并且有可能文件的條目和屏幕上的條目之間的匹配被搞錯。
于是,又一種文件處理裝置已經(jīng)提出,其中文件由圖象數(shù)據(jù)閱讀裝置1001等閱讀,并且所閱讀的圖象數(shù)據(jù)本身與圖象數(shù)據(jù)字符識別的結(jié)果一同顯示在顯示單元1002-3上。
使用文件處理裝置,由于文件上描述的信息能夠直接在顯示單元1002-3上目視觀察到,故可減少眼睛的運動,因而在對字符識別結(jié)果的確認和修改時能夠減少字符識別的結(jié)果和圖象數(shù)據(jù)之間匹配的差錯。
同時,近年來,通過使用客戶機-服務器系統(tǒng)的服務器以高速度集中方式進行數(shù)據(jù)處理的方法主要在金融機構(gòu)等采用。
例如,提出把對于金融機構(gòu)的每一個銀行(業(yè)務辦公室)安裝的客戶機與安裝在地區(qū)中心的服務器通過專線或交換線互聯(lián)而構(gòu)成一個客戶機-服務器系統(tǒng),并通過服務器集中進行文件處理以達到業(yè)務效率的提高。
在以這種方式由服務器進行集中處理的地方,由于集中到服務器上的數(shù)據(jù)量變得非常大,操作者不能通過服務器進行文件處理。于是,必須設計其中無需操作者的干預服務器能夠自動地進行文件處理的系統(tǒng)。
于是,如果其上描述文件上的ID號碼的文件如上述參照圖117所述的文件標識處理用于剛才所說明的客戶機-服務器系統(tǒng),則服務器能夠自動地辨別文件的類型并進行文件的閱讀處理。
繼而,還是使用客戶機-服務器系統(tǒng),其中由圖象數(shù)據(jù)閱讀裝置所閱讀的圖象數(shù)據(jù)本身與圖象數(shù)據(jù)字符識別的結(jié)果一同顯示在顯示單元上,文件上所描述的信息能夠直接在顯示單元上目視觀察,從而在對字符識別的結(jié)果的確認與修改時降低了字符識別的結(jié)果與圖象數(shù)據(jù)之間的匹配出錯。
可是,在處理參照圖117的上述這種文件的技術(shù)中,可被閱讀的文件媒體只是對于文件處理裝置專用而生產(chǎn)的文件媒體,并且由于不能使用通常所使用的普通文件,這時問題就在于,專用的文件必須重新生成。
同時,在如上參照圖118(a)所述這種第一參照點抽取方法中,由于在表格上文件的打印位置必須以高精確度進行管理,其中涉及例如由字處理器等打印的文件,如果人工放置表格,則在很多情形下每當進行打印時打印位置會變化。因而,這時問題就在于,設置表格端邊緣1006的左上轉(zhuǎn)角位置P為參照點是不適宜的。
進而,在如上參照圖118(b)所述這種第二參照點抽取方法中,供閱讀的對象文件是其上參照標記R被打印的專用文件,并且問題在于,涉及其上沒有打印參照標記R的普通文件的地方,則參照點不能被抽取。
進而,又使用在用于文件閱讀器等其中文件中表的特別點用作為參照點的識別技術(shù)中所采用的技術(shù),則問題在于,供識別的對象文件的布局在一定程度上不能規(guī)定,該技術(shù)在功能上不是很有效的。
應當注意,即使在作為其圖象先前已經(jīng)被閱讀過的同一文件再次閱讀,由于在圖象閱讀時灰塵、模糊等原因,會發(fā)現(xiàn)所閱讀的圖象與先前的不同了,并在這種情形下,相同的參照點可能有時不能被抽取。
而且,為了使得服務器能夠自動地進行參照圖119所示的圖象數(shù)據(jù)的那種旋轉(zhuǎn)校正處理,這必須進行實際閱讀的圖象數(shù)據(jù)的字符識別,并然后依靠是否能夠進行字符識別而進行辨別,看文件的閱讀方向是對還是錯,而這里它問題就在于,這大大地妨礙了工作效率的提高。
同時,在以上所描述的這種方法中,其中圖象數(shù)據(jù)字符識別的結(jié)果與圖象數(shù)據(jù)本身顯示在顯示單元上以便進行字符識別的結(jié)果的確認和修改,由于通過目視觀察進行圖象數(shù)據(jù)和確認項目之間匹配,于是問題在于,圖象數(shù)據(jù)包含大量的待確認的項目,故錯誤的識別仍難于避免。
進而,在圖象數(shù)據(jù)不能一次顯示在顯示單元時,顯示屏必須滾屏以便向后查看數(shù)據(jù),這種情形下,必須按動所需的鍵以便進行滾屏操作。于是問題在于操作復雜化了。
本發(fā)明是在看到如上述的諸問題而作出的,本發(fā)明的一個目的在于提供一種數(shù)據(jù)媒體處理裝置和數(shù)據(jù)媒體處理方法,使用該裝置和方法能夠進行通常所使用的文件并具有如私人票具等各種格式的文件處理。
本發(fā)明的另一個目的在于,提供一種數(shù)據(jù)媒體處理方法,其中即使對于在由字處理器等在普通紙上所打印的文件,也無需使用如以往技術(shù)中諸如表格端邊緣、參照標記等而能夠從所打印的文件的圖象數(shù)據(jù)自動地進行穩(wěn)定正常的抽取參照點的處理。
本發(fā)明的又一個目的在于提供一種數(shù)據(jù)媒體處理方法,按這種方法,由圖象數(shù)據(jù)閱讀裝置所閱讀的圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理能夠自動地進行。
本發(fā)明的另一目的是為了提供一種數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法,其中強調(diào)圖象數(shù)據(jù)部分基于事先定義的信息而顯示以提高可識別性,并允許平穩(wěn)地進行確認和修改處理。
本發(fā)明的又一個目的是提供一種數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法,其中在字符單元中的字符圖象從文件單元中或者項目單元中的圖象數(shù)據(jù)抽取,并且對字符圖象進行編輯,以便減少打字的運動及比較的對象,此外允許高度精確性的確認,使得校正確認操作所需的勞動和時間能夠顯著減少。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個方面,提供了一種數(shù)據(jù)媒體處理方法,其中,當包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)被顯示在顯示單元上時,僅強調(diào)顯示對應于某一個項目的圖象數(shù)據(jù)的一部分。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理方法,其中,當對應于所期望的項目之一的圖象數(shù)據(jù)部分的數(shù)據(jù)要以下述這樣一種狀態(tài)被輸入時,所述狀態(tài)為包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)被顯示在顯示單元上的圖象數(shù)據(jù)顯示區(qū)域中,如果光標指示被顯示在所述顯示單元上的、與所述圖象數(shù)據(jù)顯示區(qū)域分開設置的項目顯示區(qū)域的所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分之一上,則僅強調(diào)顯示對應的所期望項目的圖象數(shù)據(jù)部分。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理方法,其中,當對應于所期望的項目之一的圖象數(shù)據(jù)部分的數(shù)據(jù)要以下述這樣一種狀態(tài)被輸入時,所述狀態(tài)為包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)被顯示在顯示單元上的圖象數(shù)據(jù)顯示區(qū)域中,如果光標指示被顯示在顯示單元上的、與所述圖象數(shù)據(jù)顯示區(qū)域分開設置的項目顯示區(qū)域的所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分之一上,則僅強調(diào)顯示對應的所期望項目的圖象數(shù)據(jù)部分;以及然后當對應于另外一個項目的圖象數(shù)據(jù)部分的數(shù)據(jù)要被輸入時,如果所述光標指示從所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分移動到一個不同的項目數(shù)據(jù)輸入顯示區(qū)域部分,則所期望項目的對應圖象數(shù)據(jù)部分的強調(diào)顯示被刪除,而該不同項目的對應圖象數(shù)據(jù)部分則被強調(diào)顯示。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理方法,其中,當對應于顯示在顯示單元上的所期望的項目之一的圖象數(shù)據(jù)部分的數(shù)據(jù)要以下述這樣一種狀態(tài)被輸入時,所述狀態(tài)為包含多個項目的信息的數(shù)據(jù)媒體的部分圖象數(shù)據(jù)被顯示在顯示單元上的圖象數(shù)據(jù)顯示區(qū)域中,如果光標指示被顯示在所述顯示單元上的、與所述圖象數(shù)據(jù)顯示區(qū)域分開設置的項目顯示區(qū)域的所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分之一上,則僅強調(diào)顯示對應的所期望項目的圖象數(shù)據(jù)部分;以及當此后要輸入對應于沒有被顯示在所述顯示單元上的一個不同項目的圖象數(shù)據(jù)部分的數(shù)據(jù)時,如果所述光標指示從所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分移動到一個不同的項目數(shù)據(jù)輸入顯示區(qū)域部分,則所期望項目的對應圖象數(shù)據(jù)部分的強調(diào)顯示被刪除,同時進行滾屏,使得不同項目的圖象數(shù)據(jù)部分能夠被顯示在所述顯示單元的所述圖象數(shù)據(jù)顯示區(qū)域中,以便在所述顯示單元的所述圖象數(shù)據(jù)顯示區(qū)域中顯示該不同項目的圖象數(shù)據(jù)部分,并且強調(diào)顯示該不同項目的對應的圖象數(shù)據(jù)部分。
根據(jù)本發(fā)明的另一個方面,還提供了一種數(shù)據(jù)媒體處理裝置,包括圖象數(shù)據(jù)輸入裝置,用于輸入包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù);顯示單元,具有圖象數(shù)據(jù)顯示區(qū)域以及具有多個項目數(shù)據(jù)輸入顯示區(qū)域部分的項目顯示區(qū)域;顯示控制裝置,用于使通過所述圖象數(shù)據(jù)輸入裝置所獲得的圖象數(shù)據(jù)被顯示在所述圖象數(shù)據(jù)顯示區(qū)域中,并且用于當對應于所期望的項目之一的圖象數(shù)據(jù)部分的數(shù)據(jù)要由數(shù)據(jù)輸入裝置輸入時,使光標指示被顯示在所述項目顯示區(qū)域中的所期望的所述項目數(shù)據(jù)輸入顯示區(qū)域部分之一上;以及圖象數(shù)據(jù)部分強調(diào)顯示裝置,用于當光標指示由所述顯示控制裝置以下述一種狀態(tài)顯示在所述項目顯示區(qū)域中的所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分之一上時,其中所述狀態(tài)為包含多個項目的信息的圖象數(shù)據(jù)顯示在所述顯示單元的所述圖象數(shù)據(jù)顯示區(qū)域中,使得僅強調(diào)顯示所期望項目的對應圖象數(shù)據(jù)部分。
根據(jù)本發(fā)明,基于從其信息是以任意格式描述的數(shù)據(jù)媒體而讀出的圖象,用于識別信息的數(shù)據(jù)媒體處理裝置的特征在于,它包括以下裝置用于從所閱讀的圖象數(shù)據(jù)抽取包括格式在內(nèi)的對于數(shù)據(jù)媒體唯有的特征并從這些特征規(guī)定被識別的信息所出現(xiàn)的位置的裝置,以及用于識別由該裝置所規(guī)定的位置處的圖象數(shù)據(jù)以便鑒別信息的圖象識別裝置。
特別地,根據(jù)本發(fā)明,基于從其信息是以任意格式描述的數(shù)據(jù)媒體而讀出的圖象,用于識別信息的數(shù)據(jù)媒體處理裝置的特征在于,它包括布局分析處理部分用于抽取所閱讀的圖象布局的特征以分析布局的結(jié)構(gòu)并基于所抽取的特征邏輯上表示該布局;備選布局存儲部分,其中存儲備選的的布局;以及布局的對比檢驗處理部分,用于使用由布局分析處理部分所抽取的布局特征作為限制檢索項從備選布局存儲部分檢索備選布局以便對比檢驗是否出現(xiàn)了一個相符的備選布局。
其中,數(shù)據(jù)媒體處理裝置可進而包括一個分析預處理部分,用于對圖象進行所需的預處理,這在由布局分析處理部分進行布局分析處理之前形成一個識別對象。
或者布局分析處理部分至少能夠包含一個布局特征抽取部分用于抽取圖象的布局特征,以及一個布局分析部分用于基于由布局特征抽取部分所抽取的布局特征分析布局的結(jié)構(gòu)。
進而,布局分析處理部分的構(gòu)成使得,它首先抽取布局的特征,然后抽取布局的邏輯原點,且布局對比檢驗處理部分的構(gòu)成使得,它參照由布局分析處理部分所抽取的邏輯原點對比檢驗是否有相符的備選布局。
這里,布局具有由劃線所形成的表格結(jié)構(gòu),布局特征抽取部分包括用于抽取布局的劃線的劃線抽取部分,而布局分析部分包括基于由布局特征抽取部分所抽取的布局的劃線用于分析由劃線形成的表格結(jié)構(gòu)的表格結(jié)構(gòu)分析部分。同時,布局具有不包含劃線的無劃線表格結(jié)構(gòu),布局特征抽取部分包括一個條目數(shù)據(jù)抽取部分用于抽取布局的條目數(shù)據(jù),同時布局分析部分包括表格結(jié)構(gòu)分析部分用于基于由布局特征抽取部分所抽取的布局的條目數(shù)據(jù)分析無劃線的表格結(jié)構(gòu)。
進而,布局分析處理部分能夠這樣構(gòu)造,使得它判斷圖象中的標題區(qū)域,識別標題區(qū)域中的的標題條目并判斷對應的條目數(shù)據(jù)。
或者,數(shù)據(jù)媒體處理裝置能夠這樣構(gòu)造,使得備選布局存儲部分的構(gòu)造存儲壓縮的備選布局的信息,而布局對比檢驗處理部分壓縮處理由布局分析處理部分所抽取的布局特征,并應用布局的壓縮特征作為限制檢索項從備選布局存儲部分檢索壓縮的備選布局,以便對比檢驗是否出現(xiàn)了相符的備選布局。
又或者,備選布局存儲部分可這樣構(gòu)造使得通過學習能夠更新備選布局的信息。
在具有上述結(jié)構(gòu)的本發(fā)明數(shù)據(jù)媒體處理裝置中,在信息出現(xiàn)位置鑒定步驟,從所閱讀的圖象抽取包括格式在內(nèi)的數(shù)據(jù)媒體唯有的特征,并從特征,鑒定待識別的信息所出現(xiàn)的位置,并在圖象識別步驟中,識別在前面的步驟鑒定的位置處的圖象,以便由此鑒別信息,基于從其上信息以任意格式描述的數(shù)據(jù)媒體所閱讀的圖象實現(xiàn)信息的識別。
特別,在本發(fā)明數(shù)據(jù)媒體處理裝置中,在布局分析處理步驟中,抽取讀取的圖象布局的特征以便分析布局的結(jié)構(gòu),并基于所抽取的特征邏輯上表示該布局。并在布局對比檢驗步驟中,應用在布局分析處理步驟中所抽取的布局特征作為限制檢索項而檢索存儲在備選布局存儲部分的備選布局,以便由此對比檢驗符合的備選布局是否出現(xiàn),以便基于從其上信息以任意格式描述的數(shù)據(jù)媒體讀取的圖象實現(xiàn)信息的識別。
在布局分析處理步驟中,可以首先抽取布局的特征并然后抽取布局邏輯原點,并在布局對比檢驗處理步驟中,可參照在布局分析處理步驟中所抽取的邏輯原點鑒別信息。
進而,在布局分析處理步驟中,可鑒別讀取的圖象布局是否在預定的方向,并可基于鑒別的結(jié)果轉(zhuǎn)換讀取的圖象數(shù)據(jù)使得布局能夠在預定的方向。讀取的圖象數(shù)據(jù)的轉(zhuǎn)換處理可以是那種旋轉(zhuǎn)布局的處理。
這里,布局具有由劃線形成的表格結(jié)構(gòu),在布局分析處理步驟中,抽取布局的劃線,并基于所抽取的布局劃線分析由劃線形成的表格結(jié)構(gòu)。同時,在布局不包含劃線的無劃線表格結(jié)構(gòu)之處,在布局分析處理步驟中,抽取布局的項目數(shù)據(jù),并基于所抽取的布局的項目數(shù)據(jù)分析無劃線的表格結(jié)構(gòu)。
進而,在布局分析處理步驟中,能夠確定圖象中的標題區(qū)域,并能夠確認標題區(qū)域中的標題項目信息及確定對應的項目數(shù)據(jù)。
在壓縮的備選布局信息存儲到備選布局存儲部分之處,在布局對比檢驗處理步驟中,對在布局分析處理步驟中所抽取的布局特征進行壓縮處理,并應用先前步驟中壓縮的布局特征作為限制檢索項從備選布局存儲部分檢索壓縮的備選布局,并然后,基于檢索的結(jié)果,對比檢驗是否出現(xiàn)了符合的備選布局。
進而,在備選布局中信息由備選布局存儲部分通過學習而更新。
于是,本發(fā)明的數(shù)據(jù)媒體處理裝置的優(yōu)點在于,由于日常產(chǎn)生的各種文件或圖象被電子化自動地分析,使用通常的輸入系統(tǒng)(OCR輸入系統(tǒng),數(shù)據(jù)輸入系統(tǒng)等等)的輸入工作的效率能夠大大提高。
進而,由于布局記錄信息是基于任何類型的任意文件布局識別的結(jié)果而產(chǎn)生的,并通過學習寄存到備選布局存儲部分,因而具有相同布局的文件鑒別能夠自動地進行,于是可以降低用于產(chǎn)生專用文件所需的勞務和費用。進而,由于輸入能夠在學習之后立即進行,故達到基于本裝置的系統(tǒng)的安裝周期能夠減小。
進而,由于文件的圖象數(shù)據(jù)是正常分析處理的,故對于不同于專用的昂貴的OCR文件的文件自動識別處理,其裁剪錯誤或打印錯誤很少。
根據(jù)本發(fā)明,用于基于從其上的信息以任意格式描述的數(shù)據(jù)媒體讀取的圖象識別信息的數(shù)據(jù)媒體處理方法的特征在于,它包括抽取格式的邏輯原點的邏輯原點抽取步驟,參照在前面步驟抽取的邏輯原點抽取包括格式在內(nèi)的數(shù)據(jù)媒體唯有的特征,并從特征確定待識別的信息出現(xiàn)的位置的信息出現(xiàn)位置確定步驟,以及當在前面的步驟確定的位置處的圖象要被識別時,參照在邏輯原點抽取步驟所抽取的邏輯原點,鑒別信息的圖象識別步驟。
在邏輯原點抽取步驟,不僅能夠抽取格式的邏輯原點,而且能夠抽取向邏輯原點提供輔助信息的邏輯原點輔助坐標信息,并在圖象識別步驟,參照邏輯原點和邏輯原點輔助坐標信息能夠鑒別信息。
布局具有由劃線形成的表格結(jié)構(gòu)之處,抽取有關(guān)定義表格結(jié)構(gòu)的轉(zhuǎn)角之一的坐標信息作為格式的邏輯原點。
這時,可以抽取有關(guān)其余轉(zhuǎn)角的坐標信息作為邏輯原點輔助坐標信息。
特別,在布局具有由劃線形成的表格結(jié)構(gòu)之處,抽取具有最小X坐標和最小Y坐標定義表格結(jié)構(gòu)轉(zhuǎn)角之一的坐標信息作為格式的邏輯原點。
這時,可以抽取具有最大X坐標和最小Y坐標的另一個轉(zhuǎn)角的坐標信息,以及具有最小X坐標和最大Y坐標的又一個轉(zhuǎn)角的坐標信息以及具有最大X坐標和最大Y坐標的另外一個轉(zhuǎn)角的坐標信息,作為邏輯原點輔助坐標信息。
另一方面,在布局具有不包含劃線的無劃線表格結(jié)構(gòu)之處,抽取關(guān)于該布局中的條目數(shù)據(jù)的外接矩形轉(zhuǎn)角之一的坐標信息作為該格式的邏輯原點。
這時,可以抽取關(guān)于該外接(circumscribed)矩形其它轉(zhuǎn)角的坐標信息作為邏輯原點輔助坐標信息。
更特別地,在布局具有不包括劃線的無劃線表格結(jié)構(gòu)之處,抽取具有最小X坐標和最小Y坐標的外接矩形轉(zhuǎn)角之一的坐標信息作為該格式的邏輯原點。
這時,可以抽取具有最大X坐標和最小Y坐標的外接矩形的另一個轉(zhuǎn)角的坐標信息,以及具有最小X坐標和最大Y坐標的另一個轉(zhuǎn)角的坐標信息以及具有最大X坐標和最大Y坐標的另一個轉(zhuǎn)角的坐標信息,作為邏輯原點輔助坐標信息。
于是,本發(fā)明的數(shù)據(jù)媒體處理方法的優(yōu)點在于,由于處理對象文件的布局分析是基于劃線條目或者從圖象數(shù)據(jù)抽取的條目數(shù)據(jù)進行的,并且由布局分析所得的區(qū)域轉(zhuǎn)角的坐標之中預定的坐標被確定為邏輯原點坐標和校正坐標,故邏輯原點坐標和校正坐標甚至可從普通文件而不是其上印制了參照標記等專用文件的圖象數(shù)據(jù)抽取。
進而,由于在抽取邏輯原點時同時抽取校正坐標作為邏輯原點的附加信息,故在布局對比檢驗處理中邏輯原點的對比檢驗時能夠可靠地檢測到相一致。
特別,由于邏輯原點的對比檢驗是通過與所考慮的邏輯原點坐標相關(guān)的校正坐標的坐標對比檢驗進行的,故即使在圖象閱讀時位置發(fā)生變動,布局中的對比檢驗處理也可以可靠地進行。
進而,根據(jù)本發(fā)明,用于基于從其上信息以任意格式描述的數(shù)據(jù)媒體所讀取的圖象而識別信息的數(shù)據(jù)媒體處理方法的特征在于,包含格式在內(nèi)的數(shù)據(jù)媒體唯有的特征從讀取的圖象數(shù)據(jù)中抽取并然后壓縮處理,并使用該壓縮處理的特征作為限制檢索項檢索存儲在存儲部分的參照壓縮信息以便對比檢驗是否存在相符的參照壓縮信息,然后基于對比檢驗的結(jié)果識別特定位置處的圖象以便鑒別該信息。
這里在對特征壓縮處理之前,可以對讀取的圖象數(shù)據(jù)進行偏斜校正或變形校正處理。
而且,在對特征進行壓縮處理時,參照構(gòu)成讀取的圖象數(shù)據(jù)的劃線項目的水平劃線對其上側(cè)劃線共同具有相同劃線的那些劃線項目進行Y坐標單一化處理,并參照構(gòu)成讀取的圖象數(shù)據(jù)的劃線項目的垂直劃線對其左側(cè)劃線共同具有相同劃線的那些劃線項目進行X坐標單一化處理。
或者,在對特征進行壓縮處理時,轉(zhuǎn)換特征為對應的比特流,并對該比特流進行壓縮處理并作為矩陣表格。
于是,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理方法的優(yōu)點在于,由于對作為布局成分之一的劃線項目的布局進行壓縮處理并表示為矩陣表格,并在布局對比檢驗時對這種矩陣表格彼此進行對比檢驗,故布局對比檢驗處理速度不依賴劃線項目數(shù)目而僅對對比檢驗的一個對象的布局數(shù)目成正比線性地增加,并且大量文件的布局的對比檢驗處理可以高速進行。
進而,由于在其上劃線項目的布局被反射的位表格的壓縮處理之前,對讀取的圖象數(shù)據(jù)進行偏斜校正及變形校正處理,并對劃線項目進行Y坐標單一化處理及X坐標單一化處理,故在閱讀圖象數(shù)據(jù)時發(fā)生的布局變化可被吸收。
進而,根據(jù)本發(fā)明,用于基于從其上信息以任意格式描述的數(shù)據(jù)媒體所讀取的圖象而識別信息的數(shù)據(jù)媒體處理方法其特征在于,它包括記錄步驟,在該步驟進行抽取所讀取的圖象的布局的特征,分析布局的結(jié)構(gòu),在一顯示單元上顯示所分析的布局結(jié)構(gòu),對顯示的布局結(jié)構(gòu)設定預定的特征數(shù)據(jù)識別區(qū)域,通過外部輸入裝置輸入對應于該區(qū)域中的標志信息的代碼數(shù)據(jù),從特征數(shù)據(jù)識別區(qū)域和代碼數(shù)據(jù)產(chǎn)生區(qū)域特征數(shù)據(jù),并在與所分析的布局結(jié)構(gòu)的鏈接關(guān)系中寄存區(qū)域特征數(shù)據(jù);并包括對比檢驗步驟,在該步驟進行抽取分別讀取的圖象的特征,分析布局結(jié)構(gòu),檢索作為參照數(shù)據(jù)的在記錄步驟所記錄的區(qū)域特征數(shù)據(jù)及布局結(jié)構(gòu),并對比檢驗是否存在相符的區(qū)域特征數(shù)據(jù)。
這里,當對應于區(qū)域中的標志信息的代碼數(shù)據(jù)在記錄步驟輸入時,輸入具有對應于標志信息的有效性代碼數(shù)據(jù)。
于是,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理方法,由于擴展了類似于字符識別裝置的區(qū)域圖象特征抽取機制和特征對比檢驗機制,并與布局識別系統(tǒng)相結(jié)合,故指定區(qū)域中任意圖形的圖象的識別處理能夠與布局識別處理以聯(lián)鎖關(guān)系進行。
進而,由于對比檢驗對象的區(qū)域特征數(shù)據(jù)記錄在與布局信息的鏈接關(guān)系中,故對比檢驗的對象能夠限制在一個布局的單元,因而不需要進行普通字符識別處理所需的大量的那種對比檢驗處理,故能夠達到高識別速率。
此外,如果橡膠密封、簽字等項目指定為特征數(shù)據(jù)識別項目,那么這種由普通字符識別所不能識別的橡膠密封、簽字等項目則是能夠識別的,并且對應的代碼數(shù)據(jù)能夠作為橡膠密封、簽字等項目的特征區(qū)域識別的結(jié)果而獲得。
進而,根據(jù)本發(fā)明,用于基于從其上信息以任意格式描述的數(shù)據(jù)媒體所讀取的圖象而識別信息的數(shù)據(jù)媒體處理方法的特征在于,它包括布局分析處理步驟,該步驟抽取對讀取的圖象布局特征,分析該布局的結(jié)構(gòu),基于所抽取的特征判定圖象中的標題區(qū)域,識別標題區(qū)域中的標題項目信息,判定對應的項目數(shù)據(jù)并邏輯表示該布局;并包括布局對比檢驗處理步驟,該步驟使用在布局分析處理步驟中抽取的布局特征作為檢索限制項檢索存儲在備選布局存儲部分中的備選布局,以便對比檢驗是否存在相符的備選布局。
該數(shù)據(jù)媒體處理方法特征還在于,布局分析處理步驟包括標題位置備選判定步驟,該步驟基于布局結(jié)構(gòu)分析的結(jié)果判定標題位置備選;以及標題項目的對比檢驗步驟,該步驟與前面步驟所判定的標題位置備選進行對比檢驗標題區(qū)域中的標題項目信息。
在標題項目對比檢驗步驟中進行標題項目的對比檢驗時,在對要對比檢驗的圖象數(shù)據(jù)進行規(guī)范化處理之后進行標題項目的對比檢驗處理。
于是,本發(fā)明的數(shù)據(jù)媒體處理方法的優(yōu)點在于,由于通過從分析對象的文件圖象劃線項目結(jié)構(gòu)進行檢索和對比檢驗標題位置的標題分析處理而進行布局識別處理,能夠標識標題項目和對應于標題項目的項目數(shù)據(jù),以便自動地分析對應于文件上描述的標題的項目信息,故無需進行標題項目的字符識別處理即可立即進行項目數(shù)據(jù)的字符識別。
同時,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象數(shù)據(jù)閱讀裝置,用于閱讀作為具有以其一種格式描述的所需信息的數(shù)據(jù)媒體的文件的圖象數(shù)據(jù),一個圖象數(shù)據(jù)存儲器,用于存儲由圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù),文件標識信息抽取裝置,用于從存儲在圖象數(shù)據(jù)存儲器中的文件的圖象數(shù)據(jù)抽取文件上所描述的所需的文件標識信息,一個文件標識字典,用于寄存由文件標識信息抽取裝置作為對特定文件的文件標識信息而抽取的文件標識信息,參照裝置,用于參照由圖象數(shù)據(jù)閱讀裝置所讀取并存儲在圖象數(shù)據(jù)存儲器的任意文件的圖象數(shù)據(jù)以便檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息,以及文件標識裝置,用于基于由參照裝置參照的結(jié)果標識該任意文件是否為特定的文件。
進而,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象數(shù)據(jù)閱讀裝置用于閱讀作為具有以其一種格式描述的所需信息的數(shù)據(jù)媒體的文件的圖象數(shù)據(jù),一個圖象數(shù)據(jù)存儲器和一個文件存儲器用于存儲由圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù),文件標識信息抽取裝置用于從存儲在圖象數(shù)據(jù)存儲器中的文件的圖象數(shù)據(jù)抽取文件上所描述的所需的文件標識信息,一個文件標識字典用于寄存由文件標識信息抽取裝置作為對特定文件的文件標識信息而抽取的文件標識信息,驗證裝置用于讀出存儲在文件存儲器中的特定文件的圖象數(shù)據(jù)并驗證該特定文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中所寄存的文件標識信息,鑒別裝置用于基于由驗證裝置驗證的結(jié)果鑒別是否能夠識別該特定的文件,參照裝置用于參照由圖象數(shù)據(jù)閱讀裝置所讀取并存儲在圖象數(shù)據(jù)存儲器的任意文件的圖象數(shù)據(jù)以便檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息,以及文件標識裝置用于基于由參照裝置參照的結(jié)果標識該任意文件是否為特定的文件。
這里,參照裝置也可作為驗證裝置,而文件標識裝置也可作為鑒別裝置。
在具有上述結(jié)構(gòu)的本發(fā)明數(shù)據(jù)媒體處理裝置中,從作為由圖象數(shù)據(jù)閱讀裝置所閱讀并具有以其格式描述的所需信息的數(shù)據(jù)媒體的特定文件的圖象數(shù)據(jù),抽取該特定文件上所描述的文件標識信息,并將該文件標識信息寄存到文件標識字典,并然后借助于圖象數(shù)據(jù)閱讀裝置讀取任意文件的圖象數(shù)據(jù),之后參照任意文件的圖象數(shù)據(jù)以檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息,以便標識任意文件是否為特定文件。
進而,在本發(fā)明的數(shù)據(jù)媒體處理裝置中,從作為由圖象數(shù)據(jù)閱讀裝置所閱讀并具有以其上格式描述的所需信息的數(shù)據(jù)媒體的特定文件的圖象數(shù)據(jù),抽取該特定文件上所描述的文件標識信息,并將該文件標識信息寄存到文件標識字典,并然后再次輸入特定文件的圖象數(shù)據(jù),并驗證輸入的特定文件圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息以鑒別特定文件的識別是否為可能,此后當能夠識別特定文件時,借助于圖象數(shù)據(jù)閱讀裝置讀取任意文件的圖象數(shù)據(jù),并參照任意文件的圖象數(shù)據(jù)以檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息,以便標識任意文件是否為特定文件。
這里當文件標識信息要寄存到文件標識字典中時,由圖象數(shù)據(jù)閱讀裝置所閱讀的特定文件的圖象數(shù)據(jù)能夠顯示在顯示單元上,并且能夠從所顯示的特定文件的圖象數(shù)據(jù)中指定包含特定文件上所描述的文件標識信息的圖象的區(qū)域,以便抽取文件標識信息。
或者當文件標識信息要寄存到文件標識字典中時,能夠從由圖象數(shù)據(jù)閱讀裝置所讀取的特定文件圖象數(shù)據(jù)自動地抽取在特定文件上所描述的特定文件標識信息。
又或者,當文件標識信息要寄存到文件標識字典中時,在文件標識信息寄存到文件標識字典中時,能夠存儲在寄存時所讀取的特定文件的圖象數(shù)據(jù),并且當文件標識信息要寄存到文件標識字典中時,存儲的特定文件圖象數(shù)據(jù)能夠再次作為特定文件的圖象數(shù)據(jù)輸入,并能夠驗證輸入的特定文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息,以便鑒別該特定文件是否能夠識別。
于是本發(fā)明的數(shù)據(jù)媒體處理裝置的優(yōu)點在于,由于即使多個類型的要由圖象閱讀裝置閱讀的文件以混合狀態(tài)出現(xiàn),也能夠自動地驗證其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置讀取的文件的類型,于是操作者無需熟悉每一文件的定義而能夠進行操作,因而預期能夠改進工作效率。該數(shù)據(jù)媒體處理裝置的優(yōu)點還在于,用于標識文件自身的ID號碼等不必在文件上描述,并可以使用普通的文件,因而該數(shù)據(jù)媒體處理裝置能夠自然適用于現(xiàn)有的系統(tǒng)。
進而,由于能夠驗證由操作者指定的文件標識信息是否正確,故該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,文件的錯誤鑒別能夠完全避免,因而改進了裝置的可靠性。
此外,由于參照裝置也作為驗證裝置,而文件標識裝置也作為鑒別裝置,故該數(shù)據(jù)媒體處理裝置的優(yōu)點在于能夠簡化裝置的結(jié)構(gòu)。
進而,改根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置的優(yōu)點在于,它包括一個圖象閱讀部分用于閱讀具有標志信息的數(shù)據(jù)媒體的一個圖象,一個標志識別部分用于識別由圖象閱讀部分所閱讀的圖象中的標志圖象信息并轉(zhuǎn)換該標志圖象信息為對應的代碼信息,一個顯示單元用于以所讀取的圖象的狀態(tài)顯示標志圖象信息,以及一個所讀取的標志圖象顯示控制部分,用于當標志圖象信息沒有被成功地轉(zhuǎn)換為對應的代碼信息時,引起沒有成功進行轉(zhuǎn)換的不能識別的標志圖象信息以所讀取的圖象狀態(tài)同與不能識別的標志圖象信息相關(guān)的標志圖象信息一同顯示在顯示單元上,所讀取的標志圖象顯示控制部分包含強調(diào)顯示部分用于強調(diào)顯示不能識別的標志圖象信息。
這里,數(shù)據(jù)媒體處理裝置還包括一個數(shù)據(jù)輸入裝置用于輸入對應于不能識別的標志圖象信息的正確回答數(shù)據(jù),以及正確回答數(shù)據(jù)顯示裝置,用于當由數(shù)據(jù)輸入裝置的操作輸入正確回答數(shù)據(jù)時,引起正確回答數(shù)據(jù)顯示在顯示單元上不同于不能識別的標志信息顯示區(qū)域的正確回答數(shù)據(jù)顯示區(qū)域中。
該數(shù)據(jù)媒體處理裝置進而能夠包括強調(diào)顯示改變裝置,用于當由數(shù)據(jù)輸入裝置的操作輸入正確回答數(shù)據(jù)時,引起已經(jīng)按強調(diào)顯示的不能識別的標志圖象信息以表明不能識別的標志圖象信息已經(jīng)被修改的不同的強調(diào)方式顯示。
或者,該數(shù)據(jù)媒體處理裝置進而能夠包括強調(diào)顯示改變裝置,用于當正確回答數(shù)據(jù)由正確回答數(shù)據(jù)顯示裝置顯示在顯示單元上不同于不能識別的標志圖象信息顯示區(qū)域的正確回答數(shù)據(jù)顯示區(qū)域中時,引起已經(jīng)按強調(diào)顯示的不能識別的標志圖象信息以表明不能識別的標志圖象信息已經(jīng)被修改的不同的強調(diào)方式顯示。
特別,根據(jù)本發(fā)明其中讀取具有標志信息的數(shù)據(jù)媒體的圖象并識別讀取圖象中的標志圖象信息且轉(zhuǎn)換為對應的代碼信息的數(shù)據(jù)媒體處理裝置的特征在于,當標志圖象信息沒有成功地轉(zhuǎn)換為對應的代碼信息時,沒有被成功地轉(zhuǎn)換的不能識別的標志信息以所讀取的圖象狀態(tài)與同不能識別的標志圖象信息相關(guān)的標志圖象信息一同顯示在顯示單元上,并且不能識別的標志圖象信息按強調(diào)方式顯示,并然后當通過數(shù)據(jù)輸入裝置的操作輸入對應于不能識別的標志圖象信息的正確答案數(shù)據(jù)時,已經(jīng)按強調(diào)方式顯示的不能識別的標志圖象信息以不同的強調(diào)方式顯示,該方式表明不能識別的標志圖象信息已經(jīng)被修改。
簡而言之,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象閱讀部分用于閱讀具有標志信息的數(shù)據(jù)媒體圖象,一個標志識別部分用于識別由圖象閱讀部分所讀取的圖象中的標志圖象信息并轉(zhuǎn)換該標志圖象信息為對應的代碼信息,一個顯示單元用于以讀取的圖象狀態(tài)顯示標志圖象信息,以及一個讀取的標志圖象顯示控制部分用于當標志圖象信息沒有被成功轉(zhuǎn)換為對應的代碼信息時引起沒有成功進行轉(zhuǎn)換的不能識別的標志圖象信息,在顯示單元上以讀取的圖象狀態(tài)與同不能識別的標志圖象信息相關(guān)標志圖象信息一同顯示,強調(diào)顯示部分用于引起不能識別的標志圖象信息按強調(diào)方式顯示,一個數(shù)據(jù)輸入裝置用于輸入對應于不能識別的圖象信息的正確答案數(shù)據(jù),強調(diào)顯示改變裝置用于當正確答案數(shù)據(jù)由數(shù)據(jù)輸入裝置的操作輸入時,引起直到這時已經(jīng)被強調(diào)顯示的不能識別的標志圖象信息以表明修改完成不同的強調(diào)方式顯示,以及識別信息修改裝置用于當正確答案數(shù)據(jù)由數(shù)據(jù)輸入裝置的操作輸入時基于正確答案數(shù)據(jù)而修改不能識別的標志信息。
在具有上述結(jié)構(gòu)的本發(fā)明的數(shù)據(jù)媒體處理裝置中,當讀取了具有標志信息數(shù)據(jù)媒體圖象并且識別讀取的圖象中標志圖象信息且轉(zhuǎn)換為對應的代碼信息時,如果標志圖象信息沒有成功地轉(zhuǎn)換為對應的代碼信息,則沒有成功被轉(zhuǎn)換的不能識別的標志圖象信息,在顯示單元上以讀取的圖象狀態(tài)與同不能識別的標志圖象信息相關(guān)標志圖象信息一同顯示,并且不能識別的標志圖象信息以強調(diào)方式顯示。
進而,當對應于不能識別的標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,正確答案數(shù)據(jù)顯示在顯示單元上不同于不能識別的標志圖象信息的顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中。
或者當對應于不能識別的標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,已經(jīng)按強調(diào)方式顯示的不能識別的標志圖象信息以不同的強調(diào)方式顯示,該方式表明不能識別的標志圖象信息已經(jīng)被修改。
又或者當對應于不能識別的標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,正確答案數(shù)據(jù)顯示在顯示單元上不同于不能識別的標志圖象信息的顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中,同時已經(jīng)按強調(diào)方式顯示的不能識別的標志圖象信息以不同的強調(diào)方式顯示,該方式表明不能識別的標志圖象信息已經(jīng)被修改。
于是,由本發(fā)明的數(shù)據(jù)媒體處理裝置,當標志圖象信息沒有被成功轉(zhuǎn)換為對應的代碼信息時,沒有成功進行轉(zhuǎn)換的不能識別的標志圖象信息在顯示單元上以讀取的圖象狀態(tài)與同不能識別的標志圖象信息相關(guān)標志圖象信息一同顯示,并且不能識別的標志圖象信息以強調(diào)方式顯示。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,即使例如因為大量的變形字符而標志圖象信息不能被識別,可通過參照字符串中的前面及后繼字符等的圖象信息進行高精度的確認操作,于是用于正確與錯誤之間的確認操作所需的勞務和時間能夠降低。
進而,當對應于不能識別的標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,在顯示單元上正確答案數(shù)據(jù)顯示在不同于不能識別的標志圖象信息顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中,因而,標志圖象信息與已經(jīng)輸入的正確答案數(shù)據(jù)可通過目視觀察再確認。于是,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于用于正確與錯誤之間的確認操作所需的勞務和時間能夠降低,并可進行高精度的確認操作。
此外,當對應于不能識別的標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,在顯示單元上正確答案數(shù)據(jù)顯示在不同于不能識別的標志圖象信息顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中,同時已經(jīng)按強調(diào)方式顯示的不能識別的標志圖象信息以不同強調(diào)方式顯示,該方式表明不能識別的標志圖象信息已經(jīng)被修改。于是,標志圖象信息與已經(jīng)輸入的正確答案數(shù)據(jù)可通過目視觀察再確認。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于可進行高精度的確認操作,并且對是否已經(jīng)進行了對于不能識別的標志的輸入或者修改為錯誤識別的標志的標識能夠容易作出,結(jié)果是改進了目視的識別能力,防止了操作者等等雙重修改等等,此外用于正確與錯誤之間的確認操作所需的勞務和時間能夠降低。
進而,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象閱讀部分用于閱讀具有標志信息的數(shù)據(jù)媒體圖象,一個標志識別部分用于識別由圖象閱讀部分所讀取的圖象中的標志圖象信息并轉(zhuǎn)換該標志圖象信息為對應的代碼信息,一個顯示單元用于以讀取的圖象狀態(tài)顯示標志圖象信息,以及一個最小組合單元標志圖象信息抽取部分用于抽取最小組合單元的標志圖象信息,以便對于最小組合單元的每一片標志圖象信息該圖象信息被轉(zhuǎn)換為圖象中的代碼信息,以及最小組合單元標志圖象顯示控制部分,用于引起由最小組合單元標志圖象信息抽取部分所抽取的最小組合單元標志圖象信息,按照與通過由標志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標志信息的對應關(guān)系被顯示。
這里,最小組合單元標志圖象顯示控制部分可具有引起多片同類的最小組合單元標志圖象信息,按照與通過由標志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標志信息的對應關(guān)系被顯示,并包含強調(diào)顯示裝置用于引起僅是所希望的一片標志圖象信息按強調(diào)方式顯示。
或者,該數(shù)據(jù)媒體處理裝置能夠進而包括相關(guān)的標志圖象顯示裝置用于顯示一片標志圖象信息使之以讀取的圖象狀態(tài)與同一片標志圖象信息相關(guān)的標志圖象信息一同被顯示在顯示單元上,并且相關(guān)的標志圖象顯示裝置能夠包含強調(diào)顯示裝置用于引起一片標志圖象信息以強調(diào)方式被顯示。
又或者,該數(shù)據(jù)媒體處理裝置能夠進而包括一個數(shù)據(jù)輸入裝置用于輸入對應于一片標志圖象信息的正確答案數(shù)據(jù),以及正確答案數(shù)據(jù)顯示裝置用于當正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時引起正確答案數(shù)據(jù)被顯示在一個正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于一片標志圖象信息和與一片標志圖象信息相關(guān)的標志圖象信息所顯示的區(qū)域。
另外,該數(shù)據(jù)媒體處理裝置還能夠包括一個數(shù)據(jù)輸入裝置用于輸入對應于一片標志圖象信息的正確答案數(shù)據(jù),以及強調(diào)顯示改變裝置用于當由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時引起已經(jīng)以強調(diào)方式顯示的一片標志圖象信息以不同的強調(diào)方式顯示,該方式表明一片標志圖象信息已經(jīng)被修改。
或另外,該數(shù)據(jù)媒體處理裝置還能夠包括一個數(shù)據(jù)輸入裝置用于輸入對應于一片標志圖象信息的正確答案數(shù)據(jù),正確答案數(shù)據(jù)顯示裝置用于當正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時引起正確答案數(shù)據(jù)被顯示在一個正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于一片標志圖象信息和與一片標志圖象信息相關(guān)的標志圖象信息所顯示的區(qū)域,以及強調(diào)顯示改變裝置用于當由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時引起已經(jīng)以強調(diào)方式顯示的一片標志圖象信息以不同的強調(diào)方式顯示,該方式表明一片標志圖象信息已經(jīng)被修改。
特別,根據(jù)本發(fā)明,其中閱讀具有標志圖象信息的數(shù)據(jù)媒體的圖象、并識別所讀取的圖象中的標志圖象信息、且轉(zhuǎn)換為對應的代碼信息的媒體處理方法的特征在于要被轉(zhuǎn)換為圖象中的代碼信息的多片同類的最小組合單元標志圖象信息,按照與通過由標志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標志信息的對應關(guān)系被顯示,同時僅是所希望的一片標志圖象信息按強調(diào)方式顯示,并然后當對應于該一片標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,已經(jīng)按強調(diào)方式顯示的一片標志圖象信息以不同的強調(diào)方式被顯示,該方式表明一片標志圖象信息已經(jīng)被修改,從而對應于一片標志圖象信息錯誤識別的信息基于正確答案數(shù)據(jù)被修改。
簡而言之,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象閱讀部分用于閱讀具有標志信息的數(shù)據(jù)媒體圖象,一個標志識別部分用于識別由圖象閱讀部分所讀取的圖象中的標志圖象信息并轉(zhuǎn)換該標志圖象信息為對應的代碼信息,一個顯示單元用于以讀取的圖象狀態(tài)顯示標志圖象信息,以及一個最小組合單元標志圖象信息抽取部分用于抽取最小組合單元的標志圖象信息,以便對于最小組合單元的每一片標志圖象信息該圖象信息被轉(zhuǎn)換為圖象中的代碼信息,一個最小組合單元標志圖象顯示控制部分,用于引起由最小組合單元標志圖象信息抽取部分所抽取的最小組合單元的多片標志圖象信息,按照與通過由標志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標志信息的對應關(guān)系被顯示,強調(diào)顯示裝置用于引起僅是所希望的一片標志圖象信息按強調(diào)方式顯示,一個數(shù)據(jù)輸入裝置用于輸入對應于一片標志圖象信息的正確答案數(shù)據(jù),強調(diào)顯示改變裝置用于當由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時引起直到這時已經(jīng)以強調(diào)方式顯示的一片標志圖象信息以不同的強調(diào)方式顯示,該方式表明一片標志圖象信息完成修改,以及識別信息修改裝置用于當由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時基于正確答案數(shù)據(jù)修改對應于一片標志圖象信息的錯誤識別信息。
在具有上述結(jié)構(gòu)的本發(fā)明的數(shù)據(jù)媒體處理裝置中,當閱讀具有標志信息的數(shù)據(jù)媒體圖象并識別所讀取的圖象中的標志圖象信息且轉(zhuǎn)換為對應的代碼信息時,在顯示單元上以對應于由轉(zhuǎn)換標志圖象信息所獲得的代碼信息表示的標志信息的關(guān)系顯示要被轉(zhuǎn)換為圖象中的代碼信息最小組合單元的標志圖象信息。
在相同類型的最小組合單元的多片標志圖象信息以對應于由轉(zhuǎn)換標志圖象信息所獲得的代碼信息表示的標志信息的關(guān)系而顯示之處,只有所希望的一片標志圖象信息按強調(diào)方式顯示。
或者,所希望的一片標志圖象信息以所讀取的圖象狀態(tài)在顯示單元上與同該標志圖象信息片相關(guān)的標志圖象信息一同顯示,并且該一片標志圖象信息是按強調(diào)方式顯示的。
而且,當對應于該一片標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于該一片標志圖象信息及與該一片標志圖象信息相關(guān)的標志圖象信息被顯示的區(qū)域。
或者,當對應于該一片標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,已經(jīng)以強調(diào)方式顯示的該一片標志圖象信息按不同的強調(diào)方式顯示,該方式表明該一片標志圖象信息已被修改。
又或者,當對應于該一片標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于該一片標志圖象信息及與該一片標志圖象信息相關(guān)的標志圖象信息被顯示的區(qū)域,并且已經(jīng)以強調(diào)方式顯示的該一片標志圖象信息按不同的強調(diào)方式顯示,該方式表明該一片標志圖象信息已被修改。
于是,由本發(fā)明的數(shù)據(jù)媒體處理裝置,由于標志顯示在允許這些標志易于目視觀察的一個單元中,其顯示方式使得只有相同的標志顯示在顯示單元的相同區(qū)域中,并且只有所希望的一片標志圖象信息按強調(diào)方式顯示,故操作者只要參照圖象信息就能夠確認識別的結(jié)果,而無需參照相關(guān)的圖象信息,因而減少了操作者的眼睛的運動。而且,只有被處理的標志圖象信息按強調(diào)方式顯示以便減少比較的對象數(shù)目。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,正確與錯誤之間的確認操作所需的勞務和時間能夠顯著降低。
而且,由于所希望的一片標志圖象信息以所讀取的圖象狀態(tài)與該片標志圖象信息相關(guān)標志圖象信息一同顯示在顯示單元中,并且一片標志圖象信息是按強調(diào)方式顯示的,故該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,即使例如由于該標志圖象信息是一個變形很大的字符而不能被識別,也能通過參照字符串中前面的及后面的字符等進行高精度的確認操作,因而正確與錯誤之間的確認操作所需的勞務和時間能夠顯著降低。
進而,當對應于該一片標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于該一片標志圖象信息及與該一片標志圖象信息相關(guān)的標志圖象信息被顯示的區(qū)域,并且已經(jīng)以強調(diào)方式顯示的該一片標志圖象信息按不同的強調(diào)方式顯示,該方式表明該一片標志圖象信息已被修改。于是,標志圖象信息和輸入的正確答案時間能夠通過目視觀察再確認。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,能夠進行高精度的確認操作,并且對于是否進行了對于一個不能識別的標志的輸入或者修改為被錯誤識別的標志,能夠易于作出標識,結(jié)果是改進了目視鑒別力而防止了操作者的雙重修改等等,此外能夠降低正確與錯誤之間的確認操作所需的勞務和時間。
而且,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象數(shù)據(jù)輸入裝置用于輸入包含多個項目信息在內(nèi)的數(shù)據(jù)媒體圖象數(shù)據(jù),一個具有圖象數(shù)據(jù)顯示區(qū)域和項目顯示區(qū)域的顯示單元,項目顯示區(qū)域具有多個項目數(shù)據(jù)輸入顯示區(qū)域部分,一個顯示控制裝置用于引起通過圖象數(shù)據(jù)輸入裝置所獲得的圖象數(shù)據(jù)顯示在圖象數(shù)據(jù)顯示區(qū)域中,并用于當對應于所希望的項目之一的圖象數(shù)據(jù)部分的數(shù)據(jù)要由數(shù)據(jù)輸入裝置輸入時,引起光標指示顯示在項目顯示區(qū)域中所希望的一個項目數(shù)據(jù)輸入顯示區(qū)域部分,以及一個圖象數(shù)據(jù)局部強調(diào)顯示裝置用于在以下情形下引起只有所希望的項目對應的圖象數(shù)據(jù)部分按強調(diào)方式顯示,即當通過顯示控制裝置光標指示顯示在項目顯示區(qū)域中的項目數(shù)據(jù)輸入顯示區(qū)域部分的所希望的一個項目數(shù)據(jù)輸入顯示部分時,其狀態(tài)為其中包含多個項目信息的圖象數(shù)據(jù)顯示在顯示單元的圖象數(shù)據(jù)顯示區(qū)域中。
這里,顯示控制裝置除了圖象數(shù)據(jù)局部強調(diào)顯示裝置之外,能夠包含圖象數(shù)據(jù)強調(diào)顯示刪除裝置用于當光標指示通過光標移動操作裝置移動到不同于所希望的項目數(shù)據(jù)輸入顯示區(qū)域部分的另一個項目數(shù)據(jù)輸入顯示區(qū)域部分時,刪除對應于該項目的圖象數(shù)據(jù)部分的強調(diào)顯示,以及強調(diào)顯示轉(zhuǎn)變控制裝置用于控制圖象數(shù)據(jù)局部強調(diào)顯示裝置,使得響應圖象數(shù)據(jù)強調(diào)顯示刪除裝置,只有對應于不同的項目數(shù)據(jù)輸入顯示區(qū)域部分的不同項目的圖象數(shù)據(jù)部分能夠按強調(diào)方式顯示。
或者,顯示控制裝置除了圖象數(shù)據(jù)局部強調(diào)顯示裝置,圖象數(shù)據(jù)強調(diào)顯示刪除裝置和強調(diào)顯示轉(zhuǎn)變控制裝置之外,能夠包含顯示屏滾屏裝置用于引起沒有在顯示單元上顯示的圖象數(shù)據(jù)部分在顯示單元上顯示。
進而,該圖象數(shù)據(jù)局部強調(diào)顯示裝置能夠包含可響應來自外部的指令而改變強調(diào)顯示部分的改變裝置。
在具有上述結(jié)構(gòu)的本發(fā)明的數(shù)據(jù)媒體處理裝置中,當包含多個項目的信息數(shù)據(jù)媒體的圖象數(shù)據(jù)顯示在顯示單元上時,只有對應于確定的一個項目的圖象數(shù)據(jù)部分被強調(diào)顯示。
當對應于所希望的一個項目的圖象數(shù)據(jù)部分的數(shù)據(jù)要以這樣的狀態(tài)被輸入,即其中包含多個項目信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)在顯示單元上的圖象數(shù)據(jù)顯示區(qū)域中顯示時,如果光標指示顯示在顯示單元上與圖象數(shù)據(jù)顯示區(qū)域分開設置的項目顯示區(qū)域的所希望的一個項目輸入顯示區(qū)域部分,則只有對應的所希望的項目圖象數(shù)據(jù)部分按強調(diào)顯示,并當此后要輸入對應于另一個項目的圖象數(shù)據(jù)部分的數(shù)據(jù)時,如果光標指示從所希望的項目數(shù)據(jù)輸入顯示區(qū)域部分移動到不同的一個項目數(shù)據(jù)輸入顯示區(qū)域部分,則所希望項目的對應的圖象數(shù)據(jù)部分的強調(diào)顯示被刪除,而不同的項目的對應的圖象數(shù)據(jù)部分按強調(diào)顯示。
或者,當對應于顯示單元上顯示的所希望的一個項目的圖象數(shù)據(jù)部分的數(shù)據(jù)要按照這樣的狀態(tài)被輸入,即其中包含多個項目的信息在內(nèi)的數(shù)據(jù)媒體的圖象數(shù)據(jù)部分顯示在顯示單元上圖象數(shù)據(jù)顯示區(qū)域中時,如果光標指示顯示在顯示單元上與圖象數(shù)據(jù)顯示區(qū)域分開設置的項目顯示區(qū)域所希望的一個項目數(shù)據(jù)輸入顯示區(qū)域部分,那么只有對應的所希望的項目的圖象數(shù)據(jù)部分按強調(diào)顯示,并當此后對應于沒有顯示在顯示單元上一個不同的項目的圖象數(shù)據(jù)部分的數(shù)據(jù)被輸入時,如果光標指示從所希望的項目數(shù)據(jù)輸入顯示區(qū)域部分移動到不同的一個項目數(shù)據(jù)輸入顯示區(qū)域部分,則所希望的項目的對應的圖象數(shù)據(jù)部分的強調(diào)顯示被刪除,同時進行滾屏以便不同項目的圖象數(shù)據(jù)部分能夠顯示在顯示單元的圖象數(shù)據(jù)顯示區(qū)域中以便顯示在顯示單元的圖象數(shù)據(jù)顯示區(qū)域中顯示不同項目的圖象數(shù)據(jù)部分,并按強調(diào)方式顯示該不同項目對應的圖象數(shù)據(jù)部分。
于是,由本發(fā)明的數(shù)據(jù)媒體處理裝置,如果光標指示顯示在數(shù)據(jù)將向其輸入的項目數(shù)據(jù)輸入顯示區(qū)域部分之一,則被同時參照的一個項目的圖象數(shù)據(jù)部分按強調(diào)方式顯示。于是,即使一個操作者先從顯示單元移開其目光然后又觀察顯示單元,也能夠防止該操作者觀察到錯誤的項目。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,防止了在參照圖象數(shù)據(jù)時匹配中的錯誤識別,由此提高了目視鑒別力,能夠防止輸入操作所需的勞務和時間,同時防止誤輸入。
進而,當一個要被參照的項目的圖象數(shù)據(jù)沒有在顯示單元上顯示時,能夠響應強調(diào)顯示部分的運動進行自動滾屏。于是,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,例如能夠減少按壓鍵盤之類費時的操作。
此外,還能夠使得操作者改變強調(diào)顯示部分的類型或區(qū)域。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于它能夠根據(jù)用途而使用。
圖1是表示根據(jù)本發(fā)明的一個實施例數(shù)據(jù)媒體處理裝置的一般結(jié)構(gòu)的功能框圖;圖2到圖4是表示根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置處理過程的圖示;圖5是表示本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置布局分析處理部分的結(jié)構(gòu)的功能框圖;圖6是表示根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置文件處理過程的圖示;圖7是表示根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置的一個圖象閱讀器的簡略透視圖;圖8和圖9是功能框圖,其中標注出由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理;圖10和圖11是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所處理的文件例子的圖示;圖12和圖13是表示根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置的圖象數(shù)據(jù)旋轉(zhuǎn)校正處理的流程圖;圖14是表示根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置的原點抽取和對比檢驗處理應用的處理過程圖示;圖15(a)和15(b),圖16與圖17是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所處理的文件例子的圖示;
圖18是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的邏輯原點抽取處理的流程圖;圖19是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的邏輯原點校正坐標的相符鑒別的圖示;圖20(a)和20(b)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所處理的文件例子的圖示;圖21是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的邏輯原點對比檢驗處理的流程圖;圖22是處理過程示意圖,其中標注了由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣對比檢驗處理;圖23是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣表產(chǎn)生處理的圖示;圖24(a)和24(b)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣表格產(chǎn)生處理時對圖象數(shù)據(jù)坐標規(guī)范化處理的圖示;圖25到圖27是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣表產(chǎn)生處理時位表格產(chǎn)生處理的圖示;圖28是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所產(chǎn)生的矩陣表格的圖示;圖29和圖30是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣表格對比檢驗處理的流程圖;圖31(a)和31(b)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣表格對比檢驗處理時矩陣信息的圖示;圖32是處理過程示意圖,其中標注出由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的特征數(shù)據(jù)識別處理;圖33和圖34是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的字符數(shù)據(jù)識別處理的圖示;圖35和圖36是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所處理的交換一般轉(zhuǎn)帳文件的圖示;
圖37是處理過程示意圖,其中標注出由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理;圖38是表示用于由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理中所使用的劃線項目結(jié)構(gòu)信息的圖示;圖39是表示用于由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理中所使用的劃線項目結(jié)構(gòu)信息的劃線屬性的圖示;圖40和圖41(a)到圖41(d)是表示用于由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理中所使用的劃線項目結(jié)構(gòu)信息表格的圖示;圖42、圖43(a)及圖43(b)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理中使用的對比檢驗位置搜尋規(guī)則的圖示;圖44是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理流程圖;圖45是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理結(jié)果的一例的圖示;圖46(a)到圖46(c),圖47(a)到圖47(c)及圖48(a)到48(c)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理時標題的例子的圖示;圖49是表示在由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理時規(guī)范化處理的一例的圖示;圖50是表示用于由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理中所應用的項目標題詞典的圖示;圖51(a)及圖51(b)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理時標題項目數(shù)據(jù)的對比檢驗結(jié)果的一例的圖示;圖52(a)到圖52(c)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理時基于標題校正規(guī)則的對比檢驗結(jié)果的校正的圖示;圖53是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析的流程圖;圖54(a)到圖54(h)及55(a)到圖55(f)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析中使用的標題部分劃線項目與數(shù)據(jù)部分劃線項目之間的連接規(guī)則的圖示;圖56是表示在由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析時對應于標題項目的項目數(shù)據(jù)位置判定結(jié)果分析的圖示;圖57和圖58是表示在由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析時不同信息的鏈接關(guān)系的的圖示;圖59(a)到圖59(b)是表示在由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析時鏈接到功能項目的項目數(shù)據(jù)的圖示;圖60(a)到圖60(f)是表示在由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析時款數(shù)項目鏈接處理的圖示;圖61是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的結(jié)構(gòu)的示意圖;圖62和圖63是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的功能框圖;圖64到圖66是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的操作的流程圖;圖67是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的顯示單元的一個顯示一例的圖示;圖68是表示由根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置所產(chǎn)生的相關(guān)信息的圖示;圖69是表示由根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置所產(chǎn)生的強調(diào)信息的圖示;圖70到78是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的顯示單元的顯示的例子的圖示;圖79是表示由根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置產(chǎn)生的強調(diào)信息的圖示;圖80到圖85是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的顯示單元的顯示例子的圖示;圖86是表示根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置的結(jié)構(gòu)的示意圖;圖87到圖89是根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置的功能框圖;圖90到圖97是根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置的操作的流程圖;圖98是表示由根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置所產(chǎn)生的整面圖象的圖示;圖99是表示由根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置所產(chǎn)生的識別字符信息的圖示;圖100是表示由根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置所產(chǎn)生的相關(guān)信息的圖示;圖101到圖104是表示根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置的顯示例子的圖示;圖105是表示根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置的框圖;圖106是一控制框圖,其中標注出根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置的操作;圖107是表示根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在登記步驟操作時操作的流程圖;圖108是表示根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在登記步驟操作時操作的操作圖示;圖109是一控制框圖,其中標注出根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在登記步驟操作時的操作;
圖110是表示根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在登記步驟操作時操作的操作的流程圖;圖111是一控制框圖,其中標注出根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在登記步驟操作時的操作;圖112是表示根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在應用步驟操作時操作的操作的流程圖;圖113是表示根據(jù)本發(fā)明的該實施例第二變形的文件標識裝置的控制框圖;圖114是表示根據(jù)本發(fā)明的該實施例第二變形的文件標識裝置的操作流程圖;圖115是表示一文件識別裝置結(jié)構(gòu)的示意圖;圖116是表示該文件識別裝置操作的圖示;圖117是表示對該文件識別裝置操作的變形的圖示;圖118(a)和118(b)是表示圖象數(shù)據(jù)參照點抽取方法的圖示;以及圖119是表示圖象數(shù)據(jù)旋轉(zhuǎn)校正處理的圖示。
具體實施例方式
(a)本發(fā)明的實施例的說明(a1)數(shù)據(jù)媒體處理裝置的說明圖1是表示根據(jù)本發(fā)明的一個實施例數(shù)據(jù)媒體處理裝置的一般結(jié)構(gòu)的功能框圖。
這里,圖1中所示的數(shù)據(jù)媒體處理裝置30實現(xiàn)基于從具有諸如個人票據(jù)等各種格式的文件媒體(文件)所讀取的圖象數(shù)據(jù)(圖象)的信息識別。
數(shù)據(jù)媒體處理裝置30具體由例如由安裝在金融機構(gòu)的每一分支辦公室(業(yè)務辦公室)的客戶機(CL)35和安裝在地區(qū)中心并通過交換線路36等連接到客戶機35的服務器(SV)39組成,并且各個業(yè)務辦公室的文件處理由地區(qū)中心的服務器39集中進行。
特別地,該數(shù)據(jù)媒體處理裝置30不僅能夠?qū)τ谠撐募幚硌b置產(chǎn)生的專用文件進行處理,而且通過分析文件的圖象數(shù)據(jù)布局以識別對象文件的格式而能夠處理其上信息以任意格式輸入的文件,以便基于文件格式識別的結(jié)果處理和實現(xiàn)字符的識別。
數(shù)據(jù)媒體處理裝置30如圖1中所示在功能上包括一個布局識別處理模塊16,一個字符識別處理模塊17和一個操作者確認/校正處理模塊18。
布局識別處理模塊16實現(xiàn)對由一個圖象數(shù)據(jù)閱讀裝置所讀取的圖象數(shù)據(jù)19的布局識別處理,并包含一個分析預處理部分1,一個布局分析處理部分2,一個布局對比檢驗處理部分3及一個布局編輯處理部分4。
分析預處理部分1產(chǎn)生一低密度圖象用于在識別對象的圖象數(shù)據(jù)19格式轉(zhuǎn)換之后的分析處理,以便減少布局的變化因素以提高分析的精確度,并除去圖象數(shù)據(jù)上在分析處理時造成精確度惡化的因素的灰塵等。
布局分析處理部分2參照分析詞典13從讀取的圖象數(shù)據(jù)抽取作為布局特征的劃線項目及項目數(shù)據(jù),基于這樣抽取的劃線項目及項目數(shù)據(jù)而分析布局的結(jié)構(gòu)并邏輯上表示該布局。
簡而言之,布局分析處理部分2功能上是作為從所讀取的圖象數(shù)據(jù)抽取文件媒體特有的特征的裝置,并基于該特征確定待識別的信息所出現(xiàn)的位置。
更具體來說,布局分析處理部分2分析識別對象圖象的布局以抽取作為布局特征而構(gòu)成該布局的各種成分(劃線項目和項目數(shù)據(jù)),并從這樣抽取的布局特征產(chǎn)生對該布局粗略限制項的該布局的關(guān)鍵信息,以便在隨后階段由布局對比檢驗處理部分3進行布局對比檢驗處理時檢索已登記的布局信息。
如圖5中所示,布局分析處理部分2至少包含用于抽取圖象布局特征的布局特征抽取部分2A,及用于基于由布局特征抽取部分2A所抽取的布局特征而分析布局結(jié)構(gòu)的布局分析部分2B。
布局特征抽取部分2A包括一個劃線抽取部分2C和一個項目數(shù)據(jù)抽取部分2D,而布局分析部分2B包括一個表格結(jié)構(gòu)分析部分2E。
在布局具有由劃線所形成的表格結(jié)構(gòu)之處,作為由布局的劃線所形成的最小矩形的劃線項目是由劃線抽取部分2C抽取的,并且由劃線項目形成的表格結(jié)構(gòu)由表格結(jié)構(gòu)分析部分2E基于所抽取的劃線項目進行分析。
另一方面,在布局具有沒有劃線的無劃線表格結(jié)構(gòu)之處,布局的項目數(shù)據(jù)由項目數(shù)據(jù)抽取部分2D抽取,并且無劃線的表格結(jié)構(gòu)由表格結(jié)構(gòu)分析部分2E基于這樣抽取的布局項目數(shù)據(jù)進行分析。
而且,在抽取了劃線項目和項目數(shù)據(jù)之后,布局分析處理部分2抽取布局的邏輯原點(logic origin)。
特別地,布局分析處理部分2通過標號處理實現(xiàn)(2-1)標號圖象的產(chǎn)生,用于對比檢驗的(2-2)文件圖象的邏輯原點和模糊級信息的抽取,(2-3)劃線項目的抽取和由(上述的)劃線項目所形成的表格結(jié)構(gòu)的分析,(2-4)項目數(shù)據(jù)的抽取和沒有劃線出現(xiàn)(上述的)項目表格結(jié)構(gòu)的分析,以及(2-5)標題區(qū)域的判定和標題項目的識別以及對應的項目數(shù)據(jù)的判定(標題分析處理)。
要注意的是,由(2-1)中標號處理所進行的標號圖象的產(chǎn)生處理是從所輸入的圖象數(shù)據(jù)(二進制圖象數(shù)據(jù))計算連接成分(彼此連接的二進制圖象成分),以產(chǎn)生具有適用于各個連接成分的標號的標號圖象。例如這一標號處理由“連接區(qū)域抽取裝置和方法”(日本專利公開申請No.Heisei 08-55219)得知。
同時,在(2-3)中的劃線項目的抽取處理是從由劃線所圍繞的字符數(shù)據(jù)、圖形形式等等抽取劃線部分并對劃線部分與數(shù)據(jù)部分彼此分開的處理。例如該劃線項目的抽取處理可由“圖象抽取系統(tǒng)”(日本專利公開申請No.Heisei 06-309498)得知。
進而,在(2-5)中的標題分析處理判定一個圖象中的標題區(qū)(標題項目),識別標題區(qū)域中的標題項目信息并判定對應的項目數(shù)據(jù)。
特別地,在本實施例中,布局分析處理部分2標識標題項目及對應于標題項目的項目數(shù)據(jù),使得項目數(shù)據(jù)的字符識別能夠在沒有由字符識別處理模塊17進行標題項目的字符識別處理情形下立即進行。
以上所說明的處理(2-2)將在(a2)原點抽取與對比檢驗處理的說明中詳細描述,而處理(2-5)將在(a6)標題分析處理的說明中詳細描述。
順便而言,布局對比檢驗處理部分3的功能是作為圖象識別裝置用于使用由布局分析處理部分2作為限制檢索項所抽取的布局特征(劃線項目和項目數(shù)據(jù)),而從布局數(shù)據(jù)庫(布局DB)14檢索備選布局,并對它們進行對比檢驗看是否存在一相符的備選布局,以便識別在由布局分析處理部分2所確定的一個位置處的一個圖象而鑒別在所確定的位置處的信息。
布局DB 14是在其中存儲備選布局信息的備選布局存儲部分,并在本實施例中,存儲壓縮的備選布局信息作為備選布局信息。要注意的是,這里的布局信息壓縮處理將在以下詳述。
布局DB 14還具有布局校正信息用于校正由布局分析處理部分2所進行的布局分析結(jié)果的校正,布局分析的結(jié)果是使用布局校正信息由將在以下說明的布局編輯處理部分4校正的,使得隨后的處理能夠以高精度進行。
而且,布局DB 14的內(nèi)容是基于由布局識別處理模塊16或操作者確認/校正處理模塊18通過學習備選布局信息被更新的,因而消除了由操作者等向布局DB 14進行備選布局信息記錄操作的必要性,達到了操作的簡化。
布局對比檢驗處理部分3參照由布局分析處理部分2所抽取的邏輯原點實現(xiàn)對比檢驗,以檢驗是否存在相符的備選布局。
特別地,布局對比檢驗處理部分3應用由布局分析處理部分2所產(chǎn)生的布局關(guān)鍵信息檢索并對比檢驗存儲在布局DB 14中的布局信息以獲得相符的布局信息。
而且,當上述的對比檢驗處理部分3實現(xiàn)布局的檢索和對比檢驗時,它首先使用布局關(guān)鍵信息作為粗略限制項的檢索限制項檢索布局DB 14,并然后對于作為檢索的結(jié)果所獲得的多個備選布局進行詳細的對比檢驗以判定相符的布局。
更特別地,在與備選布局進行詳細對比檢驗處理時,布局對比檢驗處理部分3限制項的細節(jié)程度的升序進行(3-1)劃線項目位矩陣的對比檢驗,(3-2)劃線項目位置與劃線項目屬性的細化對比檢驗,(3-3)項目數(shù)據(jù)位置的對比檢驗,(3-4)標題位置與標題內(nèi)容的對比檢驗以及(3-5)區(qū)域圖象(唯一圖象)的特征數(shù)據(jù)的對比檢驗。
在這里劃線項目位矩陣的對比檢驗(3-1)是通過對由布局分析處理部分2所抽取的布局特征的壓縮處理,并應用已壓縮處理的布局特征作為檢索限制項從布局DB 14檢索壓縮的備選布局而進行的對比檢驗。
特別地,在本實施例中,布局DB 14具有存儲在其中的壓縮的備選布局信息,并且布局對比檢驗處理部分3產(chǎn)生壓縮處理的布局信息并相互對比檢驗壓縮的布局信息,以達到高速布局對比檢驗處理。
注意,處理(3-1)將在(a4)矩陣對比檢驗處理說明中詳細描述,處理(3-2)到(3-4)將在(a6)標題分析處理說明中詳細描述,以及處理(3-5)將在(b)本發(fā)明的實施例變型的說明中詳細描述。
進而,在布局DB 14中作為由布局對比檢驗處理部分3所進行的布局DB 14的檢索和對比檢驗的結(jié)果存在相符的布局之處,基于如上所述從布局DB 14所得的布局校正信息布局編輯處理部分4校正布局分析的結(jié)果,并然后輸出該校正的布局信息作為布局識別結(jié)果20。
要注意,其中使用了布局校正信息的校正的內(nèi)容是標題位置及標題內(nèi)容的校正,以及鏈接到標題的項目數(shù)據(jù)位置與項目數(shù)據(jù)屬性的校正。
另一方面,在布局DB 14中作為由布局對比檢驗處理部分3所進行的布局DB 14的檢索和對比檢驗的結(jié)果不存在相符的布局之處,布局編輯處理部分4判定布局分析的結(jié)果作為新的布局并作為其本來那樣的布局信息(布局識別結(jié)果)輸出該布局。
順便而言,字符識別處理模塊17對來自布局識別處理模塊16的布局識別結(jié)果20進行字符識別處理,并包含一個字符識別定義產(chǎn)生部分5,字符識別處理部分6以及知識處理部分7。
字符識別定義產(chǎn)生部分5基于作為布局識別結(jié)果20輸出的布局信息而產(chǎn)生一個字符識別定義(臨時定義)21,該定義定義了要由字符識別處理部分6使用的字符識別對象項目數(shù)據(jù)位置和項目數(shù)據(jù)屬性。
雖然布局識別結(jié)果20的項目數(shù)據(jù)信息是以對分析對象圖象的左上角的絕對坐標輸出的,但是分析對象圖象左上角由于在圖象閱讀時形式位置的變化不一定與固定的位置相符。
因而,每當與分析對象圖象一致時字符識別定義產(chǎn)生部分5動態(tài)地產(chǎn)生字符識別定義21。
字符識別處理部分6使用由字符識別定義產(chǎn)生部分5從布局信息所產(chǎn)生的字符識別定義21,對于字符識別對象的圖象數(shù)據(jù)進行字符識別處理,并取得識別結(jié)果的代碼數(shù)據(jù)。
知識處理部分7參照在其中記錄了用于識別結(jié)果的校正信息的知識數(shù)據(jù)庫(知識DB)15校正字符識別處理部分6的識別結(jié)果代碼數(shù)據(jù),并輸出校正的代碼數(shù)據(jù)作為字符識別結(jié)果22。
操作者確認/校正處理模塊18是這樣一個模塊,其中布局識別結(jié)果20和字符識別結(jié)果22顯示在終端單元(例如圖1中的一個客戶機10),并由操作者進行對圖象數(shù)據(jù)處理結(jié)果的確認和修改處理,該模塊還包含一個布局屏幕顯示處理部分8及字符識別結(jié)果屏幕顯示處理部分9。
基于布局識別結(jié)果20的布局信息,布局屏幕顯示處理部分8顯示識別對象圖象及諸如標題位置和標題內(nèi)容,對應的項目位置等分析的結(jié)果,以便允許操作者對布局識別結(jié)果20和字符識別結(jié)果22進行修改和確認。
本實施例中,如同以下在(a7)對識別字符的確認和修改處理中所詳述那樣,擴大了普通的修改和確認處理使得在對應的文件圖象上的識別結(jié)果與標題內(nèi)容的代碼數(shù)據(jù)和/或項目數(shù)據(jù)按類似的形式顯示在客戶機10的顯示單元上,以便能夠?qū)Σ季中畔⑦M行修改和確認處理。
字符識別結(jié)果屏幕顯示處理部分9,在屏幕上與布局屏幕顯示處理部分8的顯示一致地顯示對應于字符識別對象圖象的識別項目的字符識別結(jié)果的代碼數(shù)據(jù)。
而且,在客戶機10中,由一操作者確認對應于顯示單元上所顯示的識別對象圖象的布局識別結(jié)果20和/或字符識別結(jié)果22,并根據(jù)需要對布局識別結(jié)果20和字符識別結(jié)果22進行修改。
要注意,圖1所示的數(shù)據(jù)媒體處理裝置30除了布局識別除了模塊16之外還包括字符識別處理模塊17,和上述的操作者確認/校正處理模塊18,布局登記信息產(chǎn)生處理部分11和知識登記信息產(chǎn)生處理部分12。
布局登記信息產(chǎn)生處理部分11把由操作者修改的內(nèi)容作為校正數(shù)據(jù)加到布局識別結(jié)果20布局信息中(這由圖4中的學習布局信息28表示,該圖將在以下說明),以產(chǎn)生布局校正信息被存儲到布局DB 14中。要注意,這樣產(chǎn)生的布局校正信息在其校正內(nèi)容被鑒別之后由布局DB 14進行學習并登記到其中。
而且,布局登記信息產(chǎn)生處理部分11把由操作者修改的內(nèi)容作為校正數(shù)據(jù)加到布局識別結(jié)果20的布局信息中,以產(chǎn)生分析詞典學習信息24(這在以下將說明的圖4中由登記布局信息29表示)。這樣產(chǎn)生的分析詞典學習信息24在其校正內(nèi)容被鑒別之后由分析詞典13進行學習并登記到其中。
知識登記信息產(chǎn)生處理部分12把由操作者修改的內(nèi)容作為校正數(shù)據(jù)加到字符識別結(jié)果22的代碼數(shù)據(jù)中以產(chǎn)生用于知識DB 15的知識學習信息23,并且這樣產(chǎn)生的學習數(shù)據(jù)由知識DB 15學習并登記到其中。
在具有上述結(jié)構(gòu)的本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置30中,當閱讀具有任意格式的文件的圖象數(shù)據(jù)19時,對圖象數(shù)據(jù)19的布局進行分析以識別對象文件的格式供處理之用,并且文件的字符識別基于文件的格式識別的結(jié)果進行。
然后,布局識別結(jié)果20和字符識別結(jié)果22由操作者確認并根據(jù)需要進行修改。
以下將參照圖2到圖4說明數(shù)據(jù)媒體處理裝置30的操作。
首先,將參照圖2說明當用于處理的對象文件的布局是一新出現(xiàn)的布局時的處理。
首先,在布局識別處理模塊16的分析預處理部分1中,對用于處理的對象文件的圖象數(shù)據(jù)進行分析預處理(步驟A1)。
然后,布局分析處理部分2從供識別的對象圖象抽取作為布局成分的劃線項目和項目數(shù)據(jù),并參照分析詞典13作為分析結(jié)果輸出布局中的標題項目位置和對應于該項目內(nèi)容的項目數(shù)據(jù)位置(步驟A2)。
這里,步驟A2的布局分析處理步驟是一學習出現(xiàn)位置確定步驟,其中從讀取的圖象數(shù)據(jù)抽取文件媒體所特有的特征,并基于這些特征確定待識別的信息的位置,并抽取讀取的圖象布局的特征,分析布局的結(jié)構(gòu)并以抽取的特征邏輯表示該布局。
而且,布局分析處理步驟A2包括在抽取了布局的劃線項目和項目數(shù)據(jù)之后抽取布局的邏輯原點的步驟,并進而包括鑒別讀取的圖象布局是否具有預定方向的步驟,以及基于該步驟鑒別的結(jié)果轉(zhuǎn)換讀取的圖象數(shù)據(jù)的步驟,使得布局能夠具有預定的方向。要注意,對于讀取的圖象數(shù)據(jù)的轉(zhuǎn)換處理是使得布局旋轉(zhuǎn)的處理,并且這一處理將在出現(xiàn)的以下(a3)圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理的說明中詳細說明。
這里,在布局具有由劃線所形成的表格結(jié)構(gòu)之處,布局分析處理步驟A2包括從圖象數(shù)據(jù)抽取劃線項目的步驟,和基于在該步驟所抽取的劃線項目分析由劃線所形成的表格結(jié)構(gòu)的步驟。
另一方面,在布局具有沒有劃線的無劃線表格結(jié)構(gòu)之處,布局分析處理步驟A2包括從圖象數(shù)據(jù)抽取項目數(shù)據(jù)的步驟,和基于在該步驟所抽取的項目數(shù)據(jù)分析無劃線表格結(jié)構(gòu)的步驟。
進而,布局分析處理步驟A2包括判定圖象中標題區(qū)域、識別標題區(qū)域中的標題項目信息并判定對應的項目數(shù)據(jù)的步驟。
然后,布局對比檢驗處理部分3使用抽取的布局成分(劃線項目和項目數(shù)據(jù))作為檢索項檢索布局DB 14。然而,由于供處理的對象文件是新文件,對應的布局在布局DB 14中不存在,因而不能取得備選布局信息和布局校正信息(步驟A3)。
這里,在步驟A3中的布局對比檢驗處理步驟是一圖象識別步驟,其中識別在步驟A2所確定的位置處的圖象數(shù)據(jù)以判定在所確定的位置處的信息,并使用在步驟A2所抽取的布局的特征作為檢索限制項而檢索存儲在布局DB 14中的備選布局,以實現(xiàn)對比檢驗看是否存在相符的備選布局。
布局對比檢驗處理步驟A3包括參照在步驟A2所抽取的邏輯原點鑒別信息的步驟,并進而包括壓縮處理在步驟A2中所抽取的布局特征的壓縮處理步驟,使用在該步驟壓縮的布局特征作為限制檢索項從布局DB 14檢索壓縮的備選布局的步驟,以及基于在該步驟的檢索結(jié)果進行對比檢驗以檢驗是否存在相符的備選布局的步驟。
進而,布局編輯處理部分4以無校正校正信息狀態(tài)(步驟A4)產(chǎn)生一布局識別結(jié)果20,由于在步驟A3沒有得到作為對比檢驗一個結(jié)果的備選布局信息和布局校正信息。
字符識別處理模塊17的字符識別識別定義產(chǎn)生部分5基于在步驟A4所產(chǎn)生的布局識別結(jié)果20產(chǎn)生一字符識別定義21(圖4的步驟A14)。
此后,字符識別處理部分6使用在步驟A14所產(chǎn)生的字符識別定義21進行字符識別對象的項目數(shù)據(jù)的字符識別,以便取得識別結(jié)果的代碼數(shù)據(jù)(圖4的步驟A15)。
進而,參照在其中記錄了用于識別結(jié)果的校正信息的知識DB15,知識處理部分7校正在步驟A15取得的識別結(jié)果代碼數(shù)據(jù),以產(chǎn)生字符識別結(jié)果22(圖4的步驟A16)。
這里,操作者確認/校正處理模塊18的布局屏幕顯示處理部分8參照在步驟A4所產(chǎn)生的布局識別結(jié)果20并向客戶機10的顯示單元輸出標題項目內(nèi)容和對應于該標題的位置的項目數(shù)據(jù)位置(圖4所示的布局分析信息26)。進而,布局屏幕顯示處理部分8向客戶機10的顯示單元輸出讀取的圖象數(shù)據(jù)(圖4所示的屏幕顯示圖象27)(步驟A5)。
進而,字符識別結(jié)果屏幕顯示處理部分9向客戶機10的顯示單元輸出對應于字符識別對象圖象的識別項目的字符識別結(jié)果22(該字符識別結(jié)果22在步驟A16中產(chǎn)生),該輸出與布局屏幕顯示處理部分8進行的顯示是一致的。
這里,顯示在客戶機10的顯示單元上的布局識別結(jié)果20和字符識別結(jié)果22的確認和修改操作是由操作者進行的(步驟A6)。
進而,布局信息產(chǎn)生處理部分11從來自操作者進行的確認和修改布局操作的結(jié)果產(chǎn)生對布局(布局登記信息)的校正信息。
要注意,步驟A7中所產(chǎn)生的布局登記信息是作為對該布局的校正信息[布局DB學習信息25(學習布局信息28)和分析詞典學習信息24(登記布局信息29)]在布局DB 14和分析詞典13上被反映的,從而實現(xiàn)布局學習處理(步驟A8)。
特別地,在步驟A8中,備選布局信息通過在布局DB 14中的學習而被更新。
繼而,參照圖2將說明供處理的對象文件的布局是再次出現(xiàn)的布局時的處理。
首先,布局識別處理模塊16的分析預處理部分1進行如上所述的供處理的對象文件圖象數(shù)據(jù)19的分析預處理(步驟A1)。
然后,布局分析處理部分2按類似于上述步驟A2中的方式分析布局,并輸出該布局分析的結(jié)果(步驟A9)。
進而,布局對比檢驗處理部分3使用所抽取的布局成分(劃線項目和項目數(shù)據(jù))作為檢索項檢索布局DB 14,以取得相符的布局的詳細信息和布局校正信息(步驟A10)。
這時,由于供處理的對象文件再次出現(xiàn),故對應的備選布局信息作為布局DB 14檢索的結(jié)果被報告,并且布局的詳細信息與這樣報告的備選布局進行對比檢驗以鑒別布局之間的一致性。
要注意,在鑒別出布局彼此一致的地方,布局編輯處理部分4實現(xiàn)在步驟A11到A13的處理判定該布局為一個已經(jīng)存在的布局。另一方面,在作為對比檢驗的結(jié)果判定出不一致,則布局編輯處理部分4實現(xiàn)步驟A4到A8的處理判定該布局為一個新的布局。
這里,基于作為布局DB 14檢索的結(jié)果所取得的布局校正信息,布局編輯處理部分4校正布局分析的結(jié)果和對應于該數(shù)據(jù)的位置的數(shù)據(jù)位置,以產(chǎn)生布局識別結(jié)果20(步驟A11)。
字符識別處理模塊17的處理類似于上述與圖4的步驟A14到A15相關(guān)的處理。
這里,操作者確認/校正處理模塊18的布局屏幕顯示處理部分8參照在步驟A11中所產(chǎn)生的布局識別結(jié)果20,并向客戶機10的顯示器輸出標題項目內(nèi)容和對應于該標題位置的項目數(shù)據(jù)位置(圖4中所示的布局分析信息26)。進而,布局屏幕顯示處理部分8向客戶機10的顯示單元輸出讀取的圖象數(shù)據(jù)(圖4中所示的屏幕顯示圖象27)(步驟A12)。
同時,字符識別結(jié)果屏幕顯示處理部分9與由布局屏幕顯示處理部分8進行的顯示一致地,向客戶機10的顯示單元輸出對應于字符識別對象圖象的識別項目的字符識別結(jié)果22(這字符識別結(jié)果22是在步驟A16產(chǎn)生的)。
這里,顯示在客戶機10的顯示單元上的布局識別結(jié)果20的確認操作和/或字符識別結(jié)果22的確認與修改操作由操作者進行(步驟A13)。
要注意,供處理的對象文件的布局是一個現(xiàn)有的布局,由于對于分析對象圖象的處理在當步驟A13中布局的確認操作完成時的時間點被完成的,故沒有進行由布局登記信息產(chǎn)生處理部分11產(chǎn)生布局登記信息。
最后,將說明圖6所示的數(shù)據(jù)媒體處理裝置30進行文件處理。
這里,在每一醫(yī)務室中,文件的圖象數(shù)據(jù)由圖象數(shù)據(jù)閱讀裝置(例如,電傳機31,圖象掃描器32或者如圖6中所示的DATA-EXE33或圖6和7中所示的圖象閱讀器34)。
這里,由圖象掃描器32、DATA-EXE 33或圖象閱讀器34讀取的圖象數(shù)據(jù)傳送到客戶機35。
然后,來自傳真機31的圖象數(shù)據(jù)通過交換機線路(ISDN/公共網(wǎng)絡)36和傳真機適配器37傳送到地區(qū)中心服務器39,同時通過交換機線路(ISDN/公共網(wǎng)絡)36和通信適配器38來自客戶機35的圖象數(shù)據(jù)傳送到地區(qū)中心服務器39。
服務器39自動地并集中地進行從各個醫(yī)務室傳送的文件圖象數(shù)據(jù)的分析處理,并存儲私人票據(jù)識別軟件成分40,包括知識數(shù)據(jù)庫(知識dB)15,布局數(shù)據(jù)庫(布局DB)14及集中的字符識別裝置6。
服務器39具有對應于上述圖1中所示布局識別處理模塊16和字符識別處理模塊17的功能,而作為提供了這些功能的軟件私人票據(jù)識別軟件成分40安裝在硬盤上或者其它未示出的存儲上,以便進行相應的處理。
進而,地區(qū)中心還包括客戶機(CL)10以便確認和修改由服務器39進行的圖象數(shù)據(jù)分析處理結(jié)果。
特別地,客戶機10具有對應于上述圖1所示的操作者確認/校正處理模塊18的功能。在客戶機10中,提供上述這種功能的適用的軟件安裝在硬盤上或者其它未示出的存儲上,以便進行相應的處理。
然后,圖象數(shù)據(jù)的布局和結(jié)果的字符識別顯示在客戶機10的顯示單元上,而操作者可參照顯示單元以實現(xiàn)對圖象數(shù)據(jù)分析結(jié)果的確認或者修改。
要注意,為了允許諸如被引入到地區(qū)中心的票據(jù)文件的處理,圖象閱讀器34和DATA-EYE 33作為圖象數(shù)據(jù)閱讀裝置連接到客戶機10,使得由這些圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù)能夠傳送到服務器39。
進而,由服務器39分析的文件分析的結(jié)果通過分支服務器(BS)41傳送到作為主機設備的主計算機(未示出)。
這樣,利用根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置30,通過自動地電子化地分析每天出現(xiàn)的各種文件或文件圖象能夠大大提高使用通常的輸入系統(tǒng)(OCR輸入系統(tǒng),數(shù)據(jù)輸入系統(tǒng)等)輸入工作的效率。
特別地,利用根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置30,能夠構(gòu)成不僅能夠處理用于普通輸入系統(tǒng)的專用文件,而且能夠處理現(xiàn)有的如其原樣的各種各樣任意文件的輸入系統(tǒng)。
更特別地,通過自動地分析構(gòu)成金融機構(gòu)等的輸入工作對象的私人一般轉(zhuǎn)帳文件的布局(由最終用戶所產(chǎn)生的一般轉(zhuǎn)帳票據(jù)),能夠直接進行字符識別處理和輸入處理,并能夠進行私人一般轉(zhuǎn)帳票據(jù)的完全自動的識別處理。
通過基于任意票據(jù)任何各種各樣類型的布局識別結(jié)果20產(chǎn)生布局登記信息并學習和記錄該結(jié)果到布局DB 14,此后能夠自動地進行對于具有相同布局文件的鑒別,因而可降低對于產(chǎn)生專用文件所需的勞務和費用,并在學習之后能夠立即輸入。因而,能夠達到降低包括現(xiàn)有裝置30在內(nèi)的系統(tǒng)引入周期。
進而,由于正常地對文件的圖象數(shù)據(jù)進行分析,能夠達到對不同于昂貴的專用OCR文件的文件的自動識別處理,由此減少了剪切錯誤或打印錯誤。
(a2)原點抽取與對比檢驗處理的說明圖14是表示由根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置進行的原點抽取與對比檢驗處理的應用的處理示意圖。
一般,即使使用光學閱讀裝置(掃描器,傳真機等)閱讀具有相同布局的圖象,由于在閱讀時位置的位移,各個布局的成分(劃線項目與項目數(shù)據(jù))對圖象物理原點的坐標也不會出現(xiàn)出相等的數(shù)值。
于是,當比較布局的成分以鑒別布局的一致性時,必須使得從各個布局所抽取的邏輯原點的位置匹配,計算布局的各個成分對邏輯原點相對坐標并使用相對坐標對比檢驗這些布局。
由于在圖象閱讀時必須排除諸如灰塵或污物之類圖象的任何變形因素而穩(wěn)定地抽取這一邏輯原點,故必須選擇能夠以充分高的精度穩(wěn)定抽取的坐標位置為邏輯原點。
因而,本實施例中,平行使用了多種抽取方法來抽取邏輯原點,使得即使在處理具有任意布局的文件時也能夠抽取到正規(guī)穩(wěn)定的邏輯原點。
這里,在根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置30中,在圖14中可見,由布局分析處理部分2進行的布局分析處理步驟A2(和A9)包括抽取格式的邏輯原點的邏輯原點抽取步驟M1,及參照步驟M1中抽取的邏輯原點抽取包括格式在內(nèi)的媒體特有的特征,并從抽取的特征確定待識別的信息所出現(xiàn)的位置的信息出現(xiàn)位置確定步驟。
同時,由布局對比檢驗處理部分3進行的布局對比檢驗處理步驟A3(和A10)包括在信息出現(xiàn)位置確定步驟所確定的位置的圖象識別時參照在邏輯原點抽取步驟M1(步驟M2)所抽取的邏輯原點進行布局對比檢驗的圖象識別步驟,以鑒別所抽取的字符信息。
進而,在由布局分析處理部分2所進行的邏輯原點抽取步驟M1中,除了抽取格式的邏輯原點之外,還抽取向邏輯原點提供輔助信息的邏輯原點輔助坐標信息,并在由布局對比檢驗處理部分3所進行的圖象識別步驟中,參照邏輯原點和邏輯原點輔助坐標信息(步驟M2)進行布局對比檢驗處理,以鑒別所抽取的特征信息。
這里,本實施例中,在具有其中由劃線形成的表格結(jié)構(gòu)之處,在定義了該表格結(jié)構(gòu)的轉(zhuǎn)角中抽取具有最小X坐標和最小Y坐標的轉(zhuǎn)角的坐標信息[(圖15(a)中所示的坐標A]作為格式的邏輯原點,并作為邏輯原點輔助坐標信息,抽取具有最大X坐標和最小Y坐標的另一個轉(zhuǎn)角,具有最小X坐標和最大Y坐標的另一個轉(zhuǎn)角以及具有最大X坐標和最大Y坐標的另一個轉(zhuǎn)角[分別為圖15(a)中所示的坐標Aa,Ab,Ac]。
在布局具有沒有劃線的無劃線表格結(jié)構(gòu)中,例如如圖17所示,抽取在外接矩形的轉(zhuǎn)角中具有最小X坐標和最小Y坐標的轉(zhuǎn)角的坐標信息(圖17中所示的坐標D)作為該格式的邏輯原點,并作為邏輯原點輔助坐標信息,抽取具有最大X坐標和最小Y坐標的外接矩形的另一個轉(zhuǎn)角,具有最小X坐標和最大Y坐標的另一個轉(zhuǎn)角以及具有最大X坐標和最大Y坐標的另一個轉(zhuǎn)角(分別為圖17中所示的坐標Da,Db,Dc)。
這里,將首先說明邏輯原點抽取處理。
邏輯原點的抽取處理是由圖5所示的布局分析部分2B的表格結(jié)構(gòu)分析部分2E具體進行的。
基于由布局特征抽取部分2A的劃線抽取部分2C所抽取的劃線項目和由布局特征抽取部分2A的項目數(shù)據(jù)抽取部分2D所抽取的項目數(shù)據(jù),表格結(jié)構(gòu)分析部分2E具體分析劃線項目的外接矩形,由劃線項目所形成的表格結(jié)構(gòu)的最大外接矩形,和項目數(shù)據(jù)的外接矩形,從這些矩形抽取轉(zhuǎn)角的坐標并設置預定的坐標為邏輯原點坐標和校正坐標。
以下將參照圖18中所示的流程圖說明這時布局分析處理部分2的操作。
首先在處理對象布局基于劃線之處,作為邏輯原點抽取處理的預處理,布局特征抽取部分2A的劃線抽取部分2C從作為抽取對象的圖象數(shù)據(jù)抽取劃線(步驟B1),并然后抽取由所抽取的劃線形成的最小矩形作為劃線項目(步驟B2)。
然后,布局分析部分2B的表格結(jié)構(gòu)分析部分2E鑒別劃線項目是否已經(jīng)被抽取(步驟B3),并在劃線項目已經(jīng)被抽取且這樣抽取的劃線項目寬和高彼此近似相等地就位之處,這些劃線項目被認為并分組為具有邏輯關(guān)系的一個劃線項目組(步驟B4)。
進而,表格結(jié)構(gòu)分析部分2E鑒別在該組中是否出現(xiàn)一個表格結(jié)構(gòu)(這里表格結(jié)構(gòu)表示由2行×2列或更多的劃線項目組所形成的一個區(qū)域)(步驟B5)。
這里,在出現(xiàn)表格結(jié)構(gòu)之處,表格結(jié)構(gòu)分析部分2E抽取表格結(jié)構(gòu)中象圖15(a)中斜線部分I所示那種最大矩形區(qū)域并取得該矩形區(qū)域的四個轉(zhuǎn)角的坐標(步驟B6)。
然后,該矩形的左上角坐標A(Xo,Yo)被設置為邏輯原點,而其余的右上角坐標Aa,左下角坐標Ab及右下角坐標Ac的三個位置設置為對邏輯原點的校正坐標(步驟B7和步驟B8)。
另一方面,在如圖15(b)中所看到的出現(xiàn)多個表格結(jié)構(gòu)之處,表格結(jié)構(gòu)分析部分2E抽取各個表格結(jié)構(gòu)(參照斜線部分I)并取得每一個矩形區(qū)域的四個轉(zhuǎn)角的坐標(步驟B6)。
然后,當每一表格結(jié)構(gòu)的邏輯原點在水平方向和垂直方向投影時的坐標B(最小X坐標,最小Y坐標)[這就是,(Xo,Yo)]被設置為邏輯原點,而三個位置即坐標Ba(最大X坐標,最小Y坐標),坐標Bb(最小X坐標,最大Y坐標)及坐標Bc(最大X坐標,最大Y坐標)被設置為對邏輯原點的校正坐標(步驟B7和步驟B8)。
進而,在任何劃線項目組中不出現(xiàn)表格結(jié)構(gòu)之處,表格結(jié)構(gòu)分析部分2E抽取如圖16中斜線部分I所示位于最外的劃線項目的矩形區(qū)域之一,并取得每一個矩形區(qū)域的四個轉(zhuǎn)角的坐標(步驟B12)。
然后,當每一矩形的邏輯原點在水平方向和垂直方向投影時的坐標C[(最小X坐標,最小Y坐標),這就是,(Xo,Yo)]被設置為邏輯原點,而三個位置即坐標Ca(最大X坐標,最小Y坐標),坐標Cb(最小X坐標,最大Y坐標)及坐標Cc(最大X坐標,最大Y坐標)被設置為對邏輯原點的校正坐標(步驟B13和步驟B14)。
順便來說,在布局完全不包含劃線項目之處,布局特征抽取部分2A的項目數(shù)據(jù)抽取部分2D抽取布局中的項目數(shù)據(jù),而表格結(jié)構(gòu)方向部分2E抽取那些如圖17斜線I所示位于最外側(cè)的項目數(shù)據(jù)的矩形區(qū)域,并取得每一個矩形區(qū)域的四個轉(zhuǎn)角的坐標(步驟B9)。
然后,當每一矩形的邏輯原點在水平方向和垂直方向投影時的坐標D(最小X坐標,最小Y坐標),這就是,(Xo,Yo)]被設置為邏輯原點,而三個位置即坐標Da(最大X坐標,最小Y坐標),坐標Db(最小X坐標,最大Y坐標)及坐標Dc(最大X坐標,最大Y坐標)被設置為對邏輯原點的校正坐標(步驟B10和步驟B11)。
進而,表格結(jié)構(gòu)方向部分2E不僅取得如上述方式所抽取的邏輯原點坐標和對邏輯原點的校正坐標,而且取得作為在抽取邏輯原點時所采用的方法的記錄信息的邏輯原點抽取方法(即,表示每一邏輯原點已經(jīng)從表格結(jié)構(gòu),劃線項目及項目數(shù)據(jù)的哪一個抽取的信息)。
要注意,在以下的說明中,指示諸如上述邏輯原點抽取方法的邏輯原點可能被稱為表格邏輯原點,劃線項目邏輯原點或項目數(shù)據(jù)邏輯原點。
然后,布局分析處理部分2向布局對比檢驗處理部分3作為邏輯原點信息發(fā)送出邏輯原點抽取方法,邏輯原點坐標及邏輯原點校正坐標。
以下將說明邏輯原點對比檢驗處理。
該邏輯原點對比檢驗處理是由以上圖1中所示的布局對比檢驗處理部分3進行的。
在進行布局之間的對比時,布局的布局成分坐標被轉(zhuǎn)換為對邏輯原點的相對坐標,而該相對坐標彼此進行比較以實現(xiàn)從布局所抽取的邏輯原點的比較。
然而實際上,即使布局相同,由于在閱讀時諸如對圖象的污染或弄臟等變化因素可能有時也檢測不到邏輯原點的一致性。
這時,基于一個邏輯原點的信息,再次動態(tài)地檢測其它邏輯原點,并然后鑒別邏輯原點之間的一致性。
將參照圖21所示的流程圖說明這時布局對比檢驗處理部分3的操作。
首先,在本實施例中,由于使用多種方法由上述的布局分析處理部分2抽取抽取邏輯原點,故在對邏輯原點之間對比檢驗之前先要進行對邏輯原點抽取方法之間的一致性鑒別(步驟C1和C2)。
如果邏輯原點的抽取方法彼此之間是一致的,則如在圖19所見,對布局L1和另一個布局L2的邏輯原點校正坐標彼此進行比較以鑒別邏輯原點校正坐標之間的一致性(步驟C3到C5)。
這里,在鑒別為校正坐標之間一致之處,基于布局L1的邏輯原點坐標E(最小X坐標,最小Y坐標)和布局L2的邏輯原點坐標F(最小X坐標,最小Y坐標)計算布局L1的Ea到Ec的校正坐標及布局L2的Fa到Fc的校正坐標的相對坐標(Ea′到Ec′及Fa′到Fc′),并通過相對坐標之間的一致性鑒別進行校正坐標之間的一致性鑒別。
特別地,通過作出包含邏輯原點坐標信息的校正坐標之間的一致性鑒別而鑒別邏輯坐標之間的一致性以便對布局進行對比檢驗(步驟C6)相對坐標計算的表達式由以下表達式(1)到(6)給出(相對坐標Ea′)=(校正坐標Ea)-(邏輯原點坐標E)......(1)(相對坐標Eb′)=(校正坐標Eb)-(邏輯原點坐標E)......(2)(相對坐標Ec′)=(校正坐標Ec)-(邏輯原點坐標E)......(3)(相對坐標Fa′)=(校正坐標Fa)-(邏輯原點坐標E)......(4)(相對坐標Fb′)=(校正坐標Fb)-(邏輯原點坐標E)......(5)(相對坐標Fc′)=(校正坐標Fc)-(邏輯原點坐標E)......(6)進而,由以下表達式(7)到(9)給出對于相對坐標之間的一致性要求|(相對坐標Ea′)-(相對坐標Fa′)|≤ε(ε一致性范圍)......(7)
|(相對坐標Eb′)-(相對坐標Fb′)|≤ε(ε一致性范圍)......(8)|(相對坐標Ec′)-(相對坐標Fc′)|≤ε(ε一致性范圍)......(9)另一方面,在邏輯原點抽取方法彼此不一致(參照步驟C2)或校正坐標彼此不一致(參照步驟C4)之處,則基于其它布局的邏輯原點信息進行布局之一的邏輯坐標再抽取。
這里,如果由于圖20中所見對劃線的污染布局L1部分地不能檢測,則在圖20(b)可見使用布局L1的邏輯原點信息(邏輯原點抽取方法,邏輯原點坐標G和校正坐標Ga到Gc)抽取布局L2的新的邏輯原點坐標H′和新的檢測坐標H′a,Hb和Hc(步驟C7和C8)。
在這時邏輯原點信息再抽取時,在圖20(a)和20(b)中可見首先從布局L1和布局L2的邏輯原點坐標和校正坐標分別計算X坐標之間的差Xa,Xb,和X′a,X′b,及Y坐標之間的差Ya,Yb,和Y′a,Y′b。
以下如表達式(10)到(17)給出計算這些差的表達式(布局L1)差Xa=|(校正坐標Ga的X坐標)-(邏輯原點坐標G的X坐標)|......(10)差Xb=|(校正坐標Gc的X坐標)-(校正坐標Gb的X坐標)|......(11)差Ya=|(校正坐標Gb的Y坐標)-(邏輯原點坐標G的Y坐標)|......(12)差Yb=|(校正坐標Gc的Y坐標)-(校正坐標Ga的Y坐標)|......(13)(布局L2)差X′a=|(校正坐標Ha的X坐標)-(邏輯原點坐標H的X坐標)|......(14)差X′b=|(校正坐標Hc的X坐標)-(校正坐標Hb的X坐標)|......(15)差Ya=|(校正坐標Hb的Y坐標)-(邏輯原點坐標H的Y坐標)|......(16)差Yb=|(校正坐標Hc的Y坐標)-(校正坐標Ha的Y坐標)|......(17)然后,所計算的差彼此進行比較以鑒別一些差是否一致。
這里,由于對于布局L1和布局L2,差Ya和Y′a不一致,并且差Yb和差Y′b不一致,故從布局L2的坐標中搜尋與布局L1的差Ya和Yb一致的差。
換言之,邏輯原點和校正坐標是從布局L2內(nèi)根據(jù)對于布局L1的邏輯原點抽取方法搜尋的(參照步驟C7和C8)。
如果作為搜尋的結(jié)果成功地檢測出一致的坐標,則在圖20(a)可見這些坐標用作為邏輯原點H′和校正坐標H′a。
另一方面,如果如果作為搜尋的結(jié)果沒有成功地檢測出一致的坐標,那么按上述類似的方式邏輯原點和校正坐標是從布局L1內(nèi)根據(jù)對于布局L2的邏輯原點抽取方法搜尋的(參照步驟C9和C10)。
要注意,如果用這一方法也不能成功地檢測出一致的坐標,則不進行布局之間的對比檢驗(步驟C11)。
這樣,由根據(jù)本發(fā)明的該實施例的原點抽取和對比檢驗處理,由于供處理的對象文件的布局分析是基于從圖象數(shù)據(jù)所抽取的劃線項目和項目數(shù)據(jù)進行的,并判定由布局分析所獲得的區(qū)域的轉(zhuǎn)角坐標中預定的坐標為邏輯原點坐標和校正坐標,故邏輯原點坐標和校正坐標也能夠從不同于其上印制有標記等專用文件的普通文件的圖象數(shù)據(jù)抽取。
而且,由于從多種邏輯原點抽取方法中動態(tài)地選擇一個優(yōu)化的方法,故能夠進行適合于供處理的對象文件布局的邏輯原點抽取。
此外,由于在邏輯原點抽取時,同時抽取校正坐標作為邏輯原點的補充信息,故在布局對比檢驗處理中邏輯原點之間對比檢驗時,能夠以一定的可靠性檢驗到一致性。
特別地,由于邏輯原點之間的對比檢驗是通過其中邏輯原點坐標相結(jié)合的校正坐標的相對坐標之間的對比檢驗進行的,故即使在圖象閱讀時發(fā)生位移,布局之間的對比檢驗處理也能夠可靠地進行。
而且,即使在因為有灰塵、污染等而邏輯原點不能正確地抽取之處,由于使用校正坐標根據(jù)對其它布局的邏輯原點抽取方法進行邏輯原點的再抽取,故能夠判定可被可靠地抽取的另一個點為邏輯原點。
要注意,雖然在本實施例中布局的左上轉(zhuǎn)角處的點判定為邏輯原點,但邏輯原點并不限于此,而是右上轉(zhuǎn)角,左下轉(zhuǎn)角或右下轉(zhuǎn)角也可判定為邏輯原點。
(a3)圖象數(shù)據(jù)旋轉(zhuǎn)校正處理的說明一般,在文件處理裝置等裝置中,如果供閱讀的對象文件的閱讀方向是不正確的方向,那么不能進行字符識別處理,因為圖象數(shù)據(jù)(圖象)的字符表示方向不是一個正確的方向。
因而,在根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置中,在上述的原點抽取處理時,判定所讀取的圖象的方向,而如果圖象的方向是錯誤的,則對于圖象要進行旋轉(zhuǎn)校正處理,使得圖象的方向能夠變?yōu)檎_的方向。因而,即使供閱讀的對象文件的閱讀方向是錯誤的,也能夠進行如下所述的圖象的布局分析處理和/或字符識別處理。
這里,圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理是由上述圖1和5中所示的布局分析處理部分2進行的。為了實現(xiàn)圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理,布局分析處理部分2包括判定所讀取的圖象的布局是否指向預定的的方向的步驟,以及基于前面步驟中判定結(jié)果旋轉(zhuǎn)所讀取的圖象數(shù)據(jù)的布局的步驟,使得該布局能夠指向預定的方向。
這里,其中標注出由本發(fā)明的數(shù)據(jù)媒體處理裝置30所進行的圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理的功能框圖示于圖8和9。圖8為其中具有劃線項目的一文件要被處理的一功能框圖,而圖9是其中沒有劃線項目的另一文件要被處理的功能框圖。
當有劃線項目的一文件要被處理時,如圖8所示在數(shù)據(jù)媒體處理裝置30中,發(fā)揮作用的有以下部分圖象輸入部分301,圖象數(shù)據(jù)存儲器302,旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303,劃線抽取部分(劃線抽取部分)2C,劃線項目信息存儲部分304,劃線項目分析部分(表格結(jié)構(gòu)分析部分)2E,垂直/水平鑒別設置部分305,水平延伸劃線項目存儲部分306,圖象90度旋轉(zhuǎn)部分307,圖象180度旋轉(zhuǎn)部分308,及字符串識別模塊(字符識別處理模塊)17。
圖象輸入部分301讀取文件的圖象數(shù)據(jù)等。圖象數(shù)據(jù)存儲器302是供暫時存儲所讀取的圖象數(shù)據(jù)的一個存儲器。
旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303是一個用于存儲對其已經(jīng)進行了旋轉(zhuǎn)校正處理的圖象數(shù)據(jù)的存儲器。后來的布局識別處理,字符識別處理等等使用存儲在旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303中的圖象數(shù)據(jù)進行。
劃線項目抽取部分(劃線抽取部分)2C搜尋所讀取的圖象數(shù)據(jù),以便自動地抽取構(gòu)成由劃線所形成的最小矩形的劃線項目。劃線項目信息存儲部分304是用于存儲由劃線抽取部分2C所抽取的劃線項目信息的一個存儲器。
劃線項目分析部分(表格結(jié)構(gòu)分析部分)2E分析劃線項目信息存儲部分304中所存儲的劃線項目的形狀是垂直延伸形狀還是水平延伸形狀,以便判定圖象數(shù)據(jù)的閱讀方向是垂直閱讀方向還是水平閱讀方向。
在銀行、企業(yè)等中所處理的大部分票據(jù)、文件等通常是水平方向表示的。因而,劃線項目在大多數(shù)情形下是水平延伸的,于是水平延伸的劃線項目多于垂直延伸的劃線項目的狀態(tài)被設置為垂直/水平鑒別設置部分305的標準,并基于這樣設置的標準,鑒別圖象數(shù)據(jù)的閱讀方向。
水平延伸劃線項目存儲部分306存儲已經(jīng)被表格結(jié)構(gòu)分析處理部分2E判定為水平延伸的劃線項目的劃線項目。
在劃線項目被表格結(jié)構(gòu)分析處理部分2E判定為垂直延伸的劃線項目時,圖象90度旋轉(zhuǎn)部分307旋轉(zhuǎn)圖象數(shù)據(jù)90度以實現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
字符串識別處理部分17識別劃線項目中的字符,并當字符識別不能由字符識串別部分17成功地進行時,圖象180度旋轉(zhuǎn)部分308旋轉(zhuǎn)該圖象數(shù)據(jù)180度以便實現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
要注意,旋轉(zhuǎn)校正的圖象數(shù)據(jù)存儲到圖象數(shù)據(jù)存儲器302中和旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303中2,并類似于上述方式由劃線項目抽取部分2C,劃線項目分析部分2E以及字符串識別部分17進行處理。
另一方面,如圖9中可見當無劃線項目的另一文件要被處理時,在數(shù)據(jù)媒體處理裝置30中,發(fā)揮作用的有以下部分圖象輸入部分301,圖象數(shù)據(jù)存儲器302,旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303,標記部分309,標記信息存儲部分310,字符區(qū)域結(jié)合部分311,字符區(qū)域結(jié)合規(guī)則部分312,結(jié)合結(jié)果存儲部分313,字符串垂直/水平鑒別設置部分314,圖象90度旋轉(zhuǎn)部分307,圖象180度旋轉(zhuǎn)部分308,及字符串識別模塊(字符識別處理模塊)17。
圖象輸入部分301,圖象數(shù)據(jù)存儲器302及旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303具有上述類似的功能和結(jié)構(gòu)。
標記部分309對于從象素信息抽取相繼的點信息進行標記處理。標記信息存儲部分310是用于存儲由標記部分309所抽取的相繼點信息的一個存儲器。
字符區(qū)域結(jié)合部分311基于由標記部分309所抽取的相繼點信息根據(jù)由字符區(qū)域結(jié)合規(guī)則部分312所設置的結(jié)合規(guī)則結(jié)合相繼的字符為一字符串以抽取項目數(shù)據(jù)。結(jié)合結(jié)果存儲部分313存儲由字符區(qū)域結(jié)合部分311所抽取的項目數(shù)據(jù)。
特別地,標記部分309,標記信息存儲部分310,字符區(qū)域結(jié)合部分311,字符區(qū)域結(jié)合規(guī)則部分312及結(jié)合結(jié)果存儲部分313協(xié)同構(gòu)成項目數(shù)據(jù)抽取部分2D。
字符串垂直/水平鑒別部分314分析由字符區(qū)域結(jié)合部分311所抽取的項目數(shù)據(jù)的形狀是垂直延伸的形狀還是水平延伸的形狀以鑒別圖象數(shù)據(jù)的閱讀方向是垂直閱讀方向還是水平閱讀方向。
而且,當項目數(shù)據(jù)的字符串由字符串垂直/水平鑒別部分314判定為垂直延伸的字符串時,圖象90度旋轉(zhuǎn)部分307旋轉(zhuǎn)該圖象數(shù)據(jù)90度以實現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
字符串識別部分17識別項目數(shù)據(jù)中的字符。當字符識別不能由字符串識別部分17成功地進行時,圖象180度旋轉(zhuǎn)部分308旋轉(zhuǎn)圖象數(shù)據(jù)180度以實現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
要注意,旋轉(zhuǎn)校正的圖象數(shù)據(jù)存儲到圖象數(shù)據(jù)存儲器302和旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303并由標記部分309,字符區(qū)域結(jié)合部分311,字符串垂直/水平鑒別部分314和字符串識別部分17以類似于上述方式處理。
在具有上述結(jié)構(gòu)的根據(jù)本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置中,如果圖象數(shù)據(jù)從圖象輸入部分301輸入,則劃線項目或項目數(shù)據(jù)從圖象數(shù)據(jù)抽取。
這里,在圖象數(shù)據(jù)包含劃線項目之處,劃線項目由劃線項目抽取部分2C抽取,并且由表格結(jié)構(gòu)分析部分2E分析,由表格結(jié)構(gòu)分析部分2E所抽取的劃線項目的形狀是垂直延伸形狀還是水平延伸形狀的哪一個。
然后,在分析出劃線項目形狀為垂直延伸形狀之處,圖象數(shù)據(jù)由圖象90度旋轉(zhuǎn)部分307旋轉(zhuǎn)校正90度。
另一方面,在分析出劃線項目的形狀為水平延伸形狀之處,劃線項目的字符識別由字符串識別部分17進行,但是當字符識別不能成功地進行時,該圖象數(shù)據(jù)由圖象180旋轉(zhuǎn)部分308旋轉(zhuǎn)校正180度。
此外,在圖象數(shù)據(jù)不包含劃線項目之處,項目數(shù)據(jù)由字符區(qū)域結(jié)合部分311抽取,并由字符區(qū)域結(jié)合分析部分311分析由字符區(qū)域結(jié)合部分311所抽取的項目數(shù)據(jù)的形狀是垂直延伸形狀還是水平延伸形狀的哪一個。
這里,在分析出項目數(shù)據(jù)的形狀為水平延伸形狀之處,劃線項目的字符識別由字符串識別部分17進行,但是當字符識別不能成功地進行時,該圖象數(shù)據(jù)由圖象180旋轉(zhuǎn)部分308旋轉(zhuǎn)校正180度。
然后將參照圖12和13所示的流程圖進而說明該數(shù)據(jù)媒體處理裝置30的圖象數(shù)據(jù)旋轉(zhuǎn)校正處理。
首先,進行待處理的供圖象識別的票據(jù),文件等的圖象數(shù)據(jù)閱讀(步驟G1)。要注意,票據(jù)、文件等的表可能從任何方向被閱讀。
例如,當閱讀具有如圖10所示的這種劃線項目的文件320時,所讀取的圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302(步驟G2)。要注意,只有在第一次閱讀時,同一圖象數(shù)據(jù)也存儲到旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303中(步驟G3)。
然后,抽取圖象數(shù)據(jù)中的劃線項目(例如在圖10中,表示出劃線項目M)。
這里,如果成功地抽取了劃線項目,則劃線項目信息存儲到劃線項目信息存儲部分304(步驟G5和G6)。
表格結(jié)構(gòu)分析部分2E基于存儲在劃線項目信息存儲部分304的劃線項目信息分析每一劃線項目的形狀,并對劃線項目是垂直延伸還是水平延伸的劃線項目進行鑒別及分類(步驟G7和G8)。然后,在劃線項目信息的劃線項目為水平延伸的劃線項目之處,它存儲到水平延伸的劃線項目存儲部分306(步驟G9)。
進而,表格結(jié)構(gòu)分析部分2E基于由垂直/水平鑒別設置部分305所設置的標準鑒別水平延伸的劃線項目數(shù)目是否大于垂直延伸的劃線項目數(shù)目以便鑒別圖象數(shù)據(jù)的閱讀方向是正確還是錯誤(步驟G10)。
這里,如果表格結(jié)構(gòu)方向部分2E鑒別出水平延伸的劃線項目較大,則由字符串識別部分17進行字符識別(從步驟G10的YES途徑到步驟G11)。
如果由字符串識別部分17成功地進行了字符的識別,則判定圖象數(shù)據(jù)的閱讀方向是正常的(步驟G12的YES途徑)。
另一方面,如果由字符串識別部分17沒有成功地進行字符的識別,則由于有可能圖象已經(jīng)旋轉(zhuǎn)了180度(即圖象被垂直地反轉(zhuǎn)),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,圖象180度旋轉(zhuǎn)部分308對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G14)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G4到G12)。
另一方面,如果由表格結(jié)構(gòu)分析部分2E鑒別出垂直于是的劃線項目數(shù)目較大,則待存儲到圖象數(shù)據(jù)存儲器302的圖象數(shù)據(jù)由圖象90度旋轉(zhuǎn)部分308進行90度的旋轉(zhuǎn)校正(步驟G13)。于是,旋轉(zhuǎn)后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述的處理的處理(步驟G4到G12)。
然后,如果在進行了90度旋轉(zhuǎn)校正處理之后對圖象數(shù)據(jù)仍沒有成功地由字符串識別部分17進行字符的識別,則由于有可能圖象處于旋轉(zhuǎn)了180度的狀態(tài),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,圖象180度旋轉(zhuǎn)部分308對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G14)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G4到G12)。
另一方面,如果在上述步驟G5沒有成功地抽取劃線項目,則由于其中存在這樣的情形,例如讀取到如圖11所示沒有劃線項目的文件321,則進行以下的處理以抽取項目數(shù)據(jù)。
首先,標記部分309從存儲在旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)抽取標記信息(例如圖11中所示的標記信息N)(從步驟G5的NO途徑到圖13的步驟G15)。所抽取的標記信息存儲到標記信息存儲部分310(步驟G16)。
然后,字符區(qū)域結(jié)合部分311基于字符區(qū)域結(jié)合規(guī)則部分312的規(guī)則結(jié)合存儲在標記信息存儲部分310中的標記信息的各個片斷為一個字符串。于是,抽取項目數(shù)據(jù)(例如,圖11中,其中七個標記信息片斷“出”,“張”,“旅”,“費”,“精”,“算”,和“書”被結(jié)合為一個字符串的字符區(qū)域的結(jié)合結(jié)果(“出張旅費精算書”)表示為項目數(shù)據(jù))(步驟G17),并且該結(jié)合結(jié)果存儲到結(jié)合結(jié)果存儲部分313(步驟G18)。
進而,字符串垂直/水平鑒別部分314鑒別水平延伸的項目數(shù)據(jù)數(shù)目是否大于垂直延伸的項目數(shù)據(jù)的數(shù)目以鑒別圖象數(shù)據(jù)的閱讀方向是正確還是錯誤的(步驟G19)。
這里,如果由字符串垂直/水平鑒別部分314鑒別出水平延伸的項目數(shù)據(jù)的數(shù)目較大,則由字符串識別部分17進行字符識別(步驟G20)。
如果由字符串識別部分17成功地進行了字符識別,則判定圖象數(shù)據(jù)的閱讀方向是正常的(步驟G21)。
反之如果由字符串識別部分17沒有成功地進行字符的識別,則由于有可能圖象處于旋轉(zhuǎn)了180度的狀態(tài),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G23)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G15到G21)。
另一方面,如果由字符串垂直/水平鑒別部分314鑒別出垂直延伸的項目數(shù)據(jù)的數(shù)目較大,則存儲在圖象數(shù)據(jù)存儲器302中的圖象數(shù)據(jù)由圖象80度旋轉(zhuǎn)部分308旋轉(zhuǎn)校正90度(步驟G22)。于是,旋轉(zhuǎn)之后的圖象數(shù)據(jù)此后存儲到旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G15到G21)。
然后,如果在90度旋轉(zhuǎn)校正處理進行之后對圖象數(shù)據(jù)仍不能由字符串識別部分17進行字符的識別,則由于有可能圖象處于旋轉(zhuǎn)了180度的狀態(tài),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,由圖象180度旋轉(zhuǎn)部分308對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G23)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G15到G21)。
這樣,使用根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置30,從讀取的圖象數(shù)據(jù)中抽取劃線項目或者項目數(shù)據(jù),并鑒別所抽取的劃線項目或項目數(shù)據(jù)的形狀是為水平延伸形狀還是垂直延伸形狀。如果劃線項目或項目數(shù)據(jù)的形狀為垂直延伸形狀,則對圖象數(shù)據(jù)進行90度的旋轉(zhuǎn)校正。然后,如果即使在劃線項目或項目數(shù)據(jù)的形狀為水平延伸的形狀之處也不能成功地進行字符識別,則進行圖象數(shù)據(jù)的180度旋轉(zhuǎn)校正。于是,從圖象數(shù)據(jù)究竟在什么方向被讀取,可自動地鑒別圖象數(shù)據(jù)的閱讀方向,并當圖象數(shù)據(jù)的閱讀方向錯誤時,圖象數(shù)據(jù)能夠自動地被旋轉(zhuǎn)校正。結(jié)果,數(shù)據(jù)媒體處理裝置30的優(yōu)點在于,可以避免由操作者進行確認和旋轉(zhuǎn)校正操作,并可有效地由客戶機-服務器系統(tǒng)進行文件的自動處理。
(a4)矩陣對比檢驗處理的說明一般在文件處理裝置等裝置中,由于在供處理的對象文件的布局與存儲在布局DB等之中的布局之間進行對比檢驗處理時,對各個布局的成分(劃線項目,項目數(shù)據(jù)等)相繼進行對比檢驗,以實現(xiàn)坐標,尺寸等等之間的比較,在布局的成分數(shù)(N)增加時,對比檢驗操作的次數(shù)增加得很多,因而大量文件的布局對比檢驗處理不能以高速進行。
于是,在根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置30中,作為布局成分之一的劃線項目布局被壓縮處理并表示為矩陣表,并在布局之間對比檢驗時,它們的矩陣表彼此進行對比檢驗,使得大量文件布局的對比檢驗處理能夠以高速進行。
這里,根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置30是這樣構(gòu)造的布局對比檢驗處理部分3對由布局分析處理部分2所抽取的劃線項目的布局進行壓縮處理以將其表示為一個矩陣表,并使用該矩陣表作為限制檢索項目檢索存儲在布局DB 14中參照矩陣表以便對比檢驗是否存在相符的矩陣表?;趯Ρ葯z驗的結(jié)果,字符識別處理模塊17鑒別在特定位置的圖象信息。
這里,在圖22中示出其中標注了根據(jù)本實施例的數(shù)據(jù)媒體處理裝置30的矩陣對比檢驗處理的處理過程示意圖。
在數(shù)據(jù)媒體處理裝置30中,如圖22所示,如果首先閱讀供處理的對象文件并輸入分析對象的圖象數(shù)據(jù)19,然后布局分析處理部分2分析所輸入的圖象數(shù)據(jù)以抽取劃線部分并抽取由劃線部分所形成的矩形作為劃線項目。
這時,從劃線部分等計算圖象的傾斜度,并對所抽取的各個劃線項目的坐標位置進行傾斜校正。進而,抽取布局的邏輯原點和校正坐標,并作為布局信息設置校正的劃線項目的坐標位置,邏輯原點和校正坐標(步驟F1)。
然后,布局對比檢驗處理部分3對于對應于輸入的圖象數(shù)據(jù)產(chǎn)生一個10 DPI(每英寸點數(shù))的位表,并在位表上對應的位置處布局信息的最低行中標繪出各個劃線項目的左上坐標和劃線項目的右下坐標。
進而,根據(jù)在一行中是否存在數(shù)據(jù)對所產(chǎn)生的位表進行壓縮處理,并根據(jù)行的構(gòu)造規(guī)律在行方向上進行壓縮處理以產(chǎn)生一矩陣表(步驟F2)。
這樣壓縮的矩陣表與其它布局信息一同存儲到布局DB 14(步驟F3)。
要注意,上述的步驟F1對應于圖2所示的步驟A2,而上述的步驟F2和F3對應于圖2所示的步驟A3。
進而,在數(shù)據(jù)媒體處理裝置30中,如果讀取了供對比檢驗的對象文件并輸入了方向?qū)ο蟮膱D象數(shù)據(jù)19,那么布局分析處理部分2進行類似于上述步驟F1的處理,并設置劃線項目的坐標位置,邏輯原點和校正坐標作為布局信息(步驟F4)。
然后,布局對比檢驗處理部分3對所輸入的圖象數(shù)據(jù)進行類似于上述步驟F2的處理以產(chǎn)生一矩陣表(步驟F5)。
這里,布局對比檢驗處理部分3從布局DB 14讀出對比檢驗對象的矩陣表并參照布局的各個邏輯原點以行為單元對比檢驗位位置,以實現(xiàn)在讀取的對比檢驗對象的矩陣表與在上述步驟F5中產(chǎn)生的矩陣表之間的對比檢驗。
進而,從矩陣表的位位置對比檢驗的結(jié)果計算出的關(guān)于所有對比檢驗位的數(shù)目計算出相符的位數(shù)目,并作為矩陣表相符比例輸出對比檢驗結(jié)果200(步驟F6)。
要注意,上述的步驟F4對應于圖2中所示的步驟A9,而上述的步驟F5和F6對應于圖2中所示的步驟A10。
這里,將參照圖23說明上述步驟F2和F5中的矩陣表產(chǎn)生處理。
首先,從作為矩陣表產(chǎn)生對象的一個圖象抽取劃線,并從所抽取的劃線抽取劃線項目(由劃線所形成的最小矩形區(qū)域)。這時,基于布局的傾向度信息對于所抽取的劃線項目的各個坐標進行傾斜校正(步驟F21)。
然后,校驗布局上的每一劃線的線性以獲得劃線的變形率,并對在步驟F21中校正的劃線項目傾斜的坐標進行變形校正(步驟F22)。
進而,參照形成劃線項目的水平劃線以設置其上面的劃線共同具有相同的劃線以至它們都具有相同的數(shù)值的那些劃線項目的左上轉(zhuǎn)角Y坐標數(shù)值,以實現(xiàn)如圖24(a)中所見的Y坐標的正規(guī)化(步驟F23)。參照形成劃線項目的垂直劃線以設置其左側(cè)的劃線共同具有相同的劃線以至它們都具有相同的數(shù)值的那些劃線項目的左上轉(zhuǎn)角X坐標數(shù)值,以實現(xiàn)如圖24(b)中所見的X坐標的正規(guī)化(步驟F24)。
特別地,在本實施例中,在其上反映出劃線項目的布局的位表壓縮處理之前,對所讀取的圖象數(shù)據(jù)進行傾斜校正和變形校正處理(參照步驟F21和F22),并然后參照形成劃線項目的水平劃線,以便對其上面的劃線共同具有相同的劃線的那些劃線項目進行Y坐標的歸一化處理(參照步驟F23),此后參照形成劃線項目的垂直劃線,以便對其左側(cè)劃線共同具有相同劃線的那些劃線項目進行X坐標的歸一化處理(參照步驟F24),以便吸收在閱讀圖象數(shù)據(jù)中所產(chǎn)生的布局中的變化。
進而,對于布局上的所有的劃線項目,根據(jù)在具有相同Y坐標劃線項目的單元中位表指定的分辨率對劃線項目的左上轉(zhuǎn)角的坐標進行坐標轉(zhuǎn)換(位串轉(zhuǎn)換),并在圖25中所見的表對應的位置處設置位。
這時,設置被轉(zhuǎn)換的劃線項目的Y坐標之間的距離以便如圖26中所見排列管理信息J(步驟F25)。
這里,對由步驟F25中的轉(zhuǎn)換所產(chǎn)生的位表進行處理以便如圖27中所見從頂行開始相繼進行行的比較,并且具有相同位結(jié)構(gòu)的相繼的行在行方向被壓縮為一行以產(chǎn)生壓縮的系位信息K,并作為行壓縮信息向行管理信息J設置壓縮完成標志Q(步驟F26)。
然后如圖28中所見,作為一個矩陣表設置這樣產(chǎn)生的包含壓縮行位信息K和行管理信息J的矩陣表信息S(步驟F27)。
特別地,在本實施例中,在劃線項目的布局壓縮處理時,劃線項目的布局被轉(zhuǎn)換為對應的位串,而對位串進行壓縮處理。然后,這樣壓縮處理的位表設置為矩陣表。于是,在布局對比檢驗時對比檢驗操作的數(shù)目只是與對比檢驗對象的布局的數(shù)目成比例地線性增加,而不依賴于布局的成分數(shù)目(N),于是能夠以高速進行大量文件布局的對比檢驗處理。
進而,將參照圖29和30的流程圖說明上述步驟F6中的矩陣表對比檢驗處理。
首先,布局對比檢驗處理部分3產(chǎn)生并獲得例如在圖31(a)中所見那樣的對比檢驗源矩陣信息,并設置壓縮的對比檢驗源矩陣信息的行位信息(K1)為對比檢驗源工作區(qū)域(步驟D1)。
進而,例如從布局DB 14取得如圖31(b)中所示的那種對比檢驗目標矩陣信息,并向一個對比檢驗目標工作區(qū)設置壓縮的對比檢驗目標矩陣信息的行位信息(K′1)(步驟D2)。
然后,布局對比檢驗處理部分3相繼地對壓縮的行位信息(K1)和(K′1)從頂位開始進行比較和對比檢驗以實現(xiàn)對一行的對比檢驗(步驟D3)。
這里,如果壓縮的行位信息(K1)和(K′1)表現(xiàn)不相符,則設置不相符作為對比檢驗的結(jié)果200(參照圖22)(步驟D4和D10)。然而,由于這里的壓縮的行位信息(K1)和(K′1)是相符的,故基于行管理信息J向?qū)Ρ葯z驗源工作區(qū)設置對比檢驗源壓縮的行位信息K(步驟D4和D5)。
在步驟D5,參照行管理信息J(步驟E1),并且如果對于對應的行管理信息J設置壓縮完成標記Q,則鑒別出該行是壓縮行,并向?qū)Ρ葯z驗源工作區(qū)設置最后對比檢驗的行的壓縮行位信息K(步驟E2和E4)。然而,如果對于行管理信息J的對應的行沒有設置壓縮完成標志Q,則鑒別出該行為非壓縮行,并向?qū)Ρ葯z驗源工作區(qū)設置新的的對應行的壓縮行位信息K(步驟E2和E3)。
進而,還基于行管理信息J′向?qū)Ρ葯z驗目標工作區(qū)設置對比檢驗目標壓縮行位信息K′(步驟D6)。
而且在步驟D6,類似于上述步驟D5,參照行管理信息J′(步驟E1),并且如果對于對應的行管理信息J′設置壓縮完成標記Q′,則鑒別出該行是壓縮行,并向?qū)Ρ葯z驗源工作區(qū)設置最后對比檢驗的行的壓縮行位信息K′(步驟E2和E4)。然而,如果對于行管理信息J′的對應的行沒有設置壓縮完成標志Q′,則鑒別出該行為非壓縮行,并向?qū)Ρ葯z驗源工作區(qū)設置新的的對應行的壓縮行位信息K′(步驟E2和E3)。
如果對于所有的行壓縮行位信息K和K′標記的結(jié)果證實在固定區(qū)域內(nèi)所有的行是彼此相符的,則設置一致性作為對比檢驗結(jié)果200(步驟D7到D9)。
反之,如果在比較處理中發(fā)現(xiàn)不一致或者比較對象之一的行位信息在比較完成之前結(jié)束,則設置不一致性作為對比檢驗結(jié)果200(步驟D7、D8和D10)。
這樣,使用根據(jù)本發(fā)明的該實施例的媒體處理裝置的矩陣對比檢驗處理,由于作為布局成分之一的劃線項目的布局被壓縮處理以至表示為矩陣表,并在布局比較時,對矩陣表彼此之間進行對比檢驗,故布局的對比檢驗處理速度僅僅對對象布局對比檢驗的數(shù)目成比例地增加,而不依賴于劃線項目的數(shù)目。于是,能夠以高速進行大量文件的布局對比檢驗處理。
這時,由于對比檢驗對象布局表示在構(gòu)成布局的劃線項目中,故布局可穩(wěn)定地被表示。
而且,由于在其上反映出劃線項目的布局的位表的壓縮處理之前,對讀取的圖象數(shù)據(jù)進行傾斜校正和變形校正處理,并對各個劃線項目進行Y坐標歸一化處理及X坐標歸一化處理,故在閱讀圖象時所產(chǎn)生的布局中的變化可被吸收。
進而,由于根據(jù)一階文件的特征壓縮位表,故文件中的布局成分的數(shù)目能夠有效地壓縮表示。
(a5)特征數(shù)據(jù)識別處理的說明一般,在字符識別裝置中,由于普通的字符構(gòu)成一個識別對象,必須使用考慮了識別率的用于識別對象所產(chǎn)生的字典,而任意動態(tài)指定的圖形形式是不能被識別的。
而且,由于識別對象事先假設為字符,就存在諸如識別對象區(qū)域方面的限制以及設定供識別的定義對象方面的限制,而任意的區(qū)域是不能設定為識別對象的。
因而,根據(jù)本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置30是這樣構(gòu)造的,使得包含在字符識別處理中不能識別字符的區(qū)域圖象(布局),圖形形式等作為特征數(shù)據(jù)被記錄,同時對應于該特征數(shù)據(jù)的代碼數(shù)據(jù)作為對布局附加的信息被記錄,并在布局對比檢驗處理時,進行布局的特征數(shù)據(jù)之間的對比檢驗,并在發(fā)現(xiàn)相符的特征數(shù)據(jù)時,取得對應于特征數(shù)據(jù)的代碼數(shù)據(jù)并在顯示器上顯示為識別的結(jié)果,于是在字符識別處理中不能被識別的字符,圖形形式等。
其中標注了根據(jù)本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置30的特征數(shù)據(jù)識別處理的處理示意圖示于圖32中。
在根據(jù)本實施例的數(shù)據(jù)媒體處理裝置30中,如圖32所示,由右下步驟進行特征數(shù)據(jù)識別處理通過學習處理向布局DB 14記錄特征數(shù)據(jù)的記錄步驟(步驟H1,A6和H2),以及對比檢驗記錄的特征數(shù)據(jù)是否包含與分開讀取的圖形相符的特征數(shù)據(jù)的對比檢驗步驟(步驟H3)。
在記錄步驟中,抽取所讀取的圖象布局中的特征以便分析布局的結(jié)構(gòu)(步驟H1),并且所分析的布局顯示在一形式單元403上(步驟A6)。然后,如圖33所示,進行布局學習處理(步驟H2),以便對于所顯示的布局結(jié)構(gòu)設置預定的的特征數(shù)據(jù)記錄區(qū)域T(在圖33中由斜線所表示),并且借助于外部輸入裝置404輸入對應于區(qū)域T中的標記信息(在圖33中“富士通株式會社”)的代碼數(shù)據(jù)U[在圖33中,“Fujitsu(Ltd)”],此后從特征數(shù)據(jù)識別區(qū)域T和代碼數(shù)據(jù)U產(chǎn)生區(qū)域特征數(shù)據(jù),并以同上述分析的布局結(jié)構(gòu)相鏈接的狀態(tài)被記錄。
在根據(jù)本實施例的數(shù)據(jù)媒體處理裝置30中,通過在區(qū)域特征數(shù)據(jù)的識別時對于特征數(shù)據(jù)識別區(qū)域T進行歸一化處理,能夠在對比檢驗步驟可靠地進行區(qū)域特征數(shù)據(jù)的對比檢驗,這將在以下說明。
在這一記錄步驟,由于在輸入對應于標記信息的代碼數(shù)據(jù)U時向上述區(qū)域T輸入了具有對應于標記信息意義的代碼數(shù)據(jù),故如果它識別出特征數(shù)據(jù)識別區(qū)域T,作為識別的結(jié)果數(shù)據(jù)媒體處理裝置30能夠在屏幕上顯示出對應的代碼數(shù)據(jù)。
另一方面,在對比檢驗步驟中,在上述的記錄步驟之后,抽取分開讀取的圖象特征,并然后使用在記錄步驟所記錄的區(qū)域特征數(shù)據(jù)和布局結(jié)構(gòu)作為參照數(shù)據(jù)檢索布局DB 14以便對比檢驗是否有相符的布局。
當具有上述結(jié)構(gòu)的根據(jù)本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置30實現(xiàn)特征數(shù)據(jù)識別處理時,通過學習處理字符數(shù)據(jù)記錄到布局DB14,并對比檢驗是否有某個記錄的特征數(shù)據(jù)與分開讀取的圖象相符。然后,如果發(fā)現(xiàn)了相符的特征數(shù)據(jù),則取得對應于該特征數(shù)據(jù)的代碼數(shù)據(jù)并作為識別的結(jié)果顯示在顯示對于403上。
將參照圖32到34更為詳細地說明數(shù)據(jù)媒體處理裝置30這時的操作。
特別地,如圖32中所見,如果布局分析的一個對象文件圖象19是新讀取的,則布局分析處理部分2分析該對象文件的布局以產(chǎn)生布局信息(步驟H1)。
這里,在操作者確認/校正處理模塊18(參照圖1)中,一文件的圖象及所分析的圖象信息顯示在顯示對于403上,并且如圖33中所見,由操作者設置一個特征數(shù)據(jù)識別區(qū)域T(“富士通株式會社”),并從外部輸入裝置404輸入對應的代碼數(shù)據(jù)U[“Fujitsu(Ltd)”](步驟H6)。
進而,布局記錄信息產(chǎn)生處理部分11從由操作者指定的區(qū)域T和輸入的代碼數(shù)據(jù)U產(chǎn)生區(qū)域特征數(shù)據(jù),并學習該區(qū)域特征數(shù)據(jù),且作為布局校正數(shù)據(jù)與由布局識別處理模塊16所取得的布局信息一同記錄到布局DB 14(步驟H2)。
于是,在記錄步驟中的操作是由操作者確認/校正處理模塊18和上述布局記錄信息產(chǎn)生處理部分11進行的。
在區(qū)域特征數(shù)據(jù)這樣記錄到布局DB 14之后,如果再次讀取與上述處理的相同的文件圖象19,則布局分析處理部分2分析該對象文件并產(chǎn)生布局信息。
進而,布局對比檢驗處理部分3使用所分析的布局信息作為檢索項檢索布局DB 14以便取得對于在步驟H2學習和記錄的文件的布局校正信息。
這里,對于所取得的布局校正信息的區(qū)域特征數(shù)據(jù)是否包含對應于要被分析的文件的圖象的區(qū)域特征數(shù)據(jù)進行對比檢驗。如果對比檢驗的結(jié)果證實某個區(qū)域特征數(shù)據(jù)滿足與要被分析的文件圖象相符的項,則對應于該區(qū)域特征數(shù)據(jù)的代碼數(shù)據(jù)U設置為布局識別結(jié)果(步驟H3)。
然后,在操作者確認/校正處理模塊18中,所讀取的文件圖象和布局識別結(jié)果20顯示在顯示單元403上,并且如圖34所見以類似于一般字符識別結(jié)果22的方式,在顯示單元403上作為特征數(shù)據(jù)識別結(jié)果顯示出特征數(shù)據(jù)識別區(qū)域T及對應的代碼數(shù)據(jù)U(步驟A13)。
這樣,利用根據(jù)本發(fā)明該實施例的媒體處理裝置的特征數(shù)據(jù)識別處理,在功能上擴充了類似于字符識別裝置的區(qū)域圖象特征抽取機制和特征對比檢驗機制,并且與布局識別系統(tǒng)相結(jié)合,使得在記錄步驟由操作者所指定的特征數(shù)據(jù)識別區(qū)域T和對應的代碼數(shù)據(jù)U(識別結(jié)果代碼)被動態(tài)地學習并與布局分析分結(jié)果一同記錄到布局DB 14,并在要對具有所學習布局相同布局的文件進行識別時,在對比檢驗步驟從布局DB 14與布局信息一同取得區(qū)域特征數(shù)據(jù),并對該區(qū)域特征數(shù)據(jù)與識別對象的文件圖象的區(qū)域進行對比檢驗,此后取得對應的代碼數(shù)據(jù)U作為對比檢驗的結(jié)果并作為識別的結(jié)果被設置且輸出,于是允許在指定的區(qū)域中的圖形形式的圖象的識別處理與布局識別處理相關(guān)聯(lián)地進行。
特別地,通過記錄任意指定區(qū)域的圖象作為識別對象區(qū)域,該任意區(qū)域可被識別以取得對應的代碼數(shù)據(jù)而無需限于字符,并通過動態(tài)地對識別對象區(qū)域與布局信息一同學習到布局DB 14中,當布局再次出現(xiàn)時,能夠與布局識別處理相關(guān)聯(lián)地進行識別對象區(qū)域的識別處理。
進而,在本實施例中,由于對比檢驗的對象的區(qū)域特征數(shù)據(jù)與布局信息相關(guān)聯(lián)地被記錄,故對比檢驗的對象能夠限制在布局單元中,并從而無需進行如普通的字符識別裝置所需的大量對比檢驗處理,而能夠達到高的識別率。
此外,由于多個識別對象區(qū)域可設置在同一文件中,使得其數(shù)據(jù)具有關(guān)聯(lián)關(guān)系,故能夠彼此匹配地記錄布局中識別對象區(qū)域的位置信息和數(shù)據(jù)結(jié)構(gòu)。
要注意,上述這種特征數(shù)據(jù)識別處理也能夠用于′kanji′項目的′kana′識別處理,或者交換一般轉(zhuǎn)帳文件的客戶/接受者(recipient)的識別處理。
特別地,當文件上的′kanji′項目要作為特征數(shù)據(jù)被識別時,則進入到′kanji′的項目的區(qū)域被指定為特征區(qū)域,并且對應的代碼數(shù)據(jù)輸入到′kana′,并且特征數(shù)據(jù)與代碼數(shù)據(jù)被學習且與文件的布局信息一同被記錄。
在采用這一對策之處,如果對具有與另一個被學習和識別的文件的布局相同布局的文件進行布局識別,則′kana′的代碼數(shù)據(jù)能夠作為′kanji′的項目的特征區(qū)域的識別結(jié)果而取得。
進而,類似于′kanji′的項目的特征數(shù)據(jù)識別處理的情形,如果橡皮圖章、簽字等的項目指定為特征數(shù)據(jù)識別項目,則不能通過普通字符識別被識別的橡皮圖章、簽字等的項目能夠被識別,并且對應的代碼數(shù)據(jù)能夠作為橡皮圖章、簽字等的特征區(qū)域的識別結(jié)果而取得。
此外,在交換一般的轉(zhuǎn)帳文件中,要被輸入的客戶的全名或者接受者的全名項目是沒有任意組合的,但是具有與文件相關(guān)的關(guān)系(參見圖35和36)。
于是,通過學習和記錄,當客戶或者接受者的全名要作為特征數(shù)據(jù)識別項目、在鏈接關(guān)系中它們的關(guān)系被學習和記錄時,在特征數(shù)據(jù)對比檢驗時能夠進行高精度的識別。
(a6)標題分析處理的說明在根據(jù)本發(fā)明該數(shù)據(jù)媒體處理裝置30中,是自動地進行標題分析處理的,其中從分析對象文件圖象的劃線項目結(jié)構(gòu)和對應于文件上所輸入的標題的項目信息搜尋并對比檢驗標題位置。
這里,根據(jù)本實施例的數(shù)據(jù)媒體處理裝置30包括布局分析處理步驟A2(或者A9)邏輯表示讀取的圖象布局,以及布局對比檢驗處理步驟A3(或者A10)對比檢驗在布局DB 14中是否存在與讀取的圖象的布局相符的布局.該布局分析處理步驟A2(或者A9)抽取讀取的圖象布局的劃線項目,分析布局的結(jié)構(gòu),從抽取的劃線項目判定圖象中的標題區(qū)域,識別標題區(qū)域中的標題項目信息以判定對應的項目數(shù)據(jù)并邏輯表示該布局,而這些是由布局分析處理部分2的布局分析部分2B實現(xiàn)的。
該布局分析處理步驟A2(或者A9)包括基于布局結(jié)構(gòu)分析的結(jié)果判定標題位置備選項的標題位置備選判定步驟,以及標題項目對比檢驗步驟,在該步驟對標題區(qū)域中的標題項目信息與在標題位置備選判定步驟所判定的標題位置備選項進行對比檢驗。
要注意,標題項目對比檢驗步驟中的標題項目的對比檢驗處理,是在標題項目對比檢驗步驟中,對要被對比檢驗的圖象數(shù)據(jù)按上述參照圖49那種方式進行正規(guī)化處理之后實現(xiàn)的。
另一方面,布局對比檢驗處理步驟A3(或者A10)應用在布局分析處理步驟所抽取的布局的劃線項目作為檢索限制項而檢索布局DB 14中存儲的備選布局,要被對比檢驗是否有相符的備選布局,而這是由布局對比檢驗處理部分3實現(xiàn)的。
這里,在圖37中示出標注出根據(jù)本實施例的數(shù)據(jù)媒體處理裝置30布局分析處理部分2的布局分析部分2B的標題分析處理的示意圖。
如在圖37中所見,布局分析部分2B進行作為標題位置備選判定步驟K9的處理,這包括劃線項目結(jié)構(gòu)分析處理(步驟K1)以及項目標題位置搜尋處理(步驟K2),并然后進行作為標題項目對比檢驗步驟K10的處理,這包括項目標題對比檢驗處理(K3),超復數(shù)特征數(shù)據(jù)抽取對比檢驗處理(步驟K4),標題對比檢驗結(jié)果校正處理(步驟K5),項目數(shù)據(jù)位置搜尋處理(步驟K6),項目數(shù)據(jù)部分鏈接處理(步驟K7)及款額項目鏈接處理(步驟K8)。
分析字典13存儲標題搜尋規(guī)則505,項目標題字典507,標題校正規(guī)則508以及數(shù)據(jù)搜尋規(guī)則509。
在劃線項目結(jié)構(gòu)分析處理(步驟K1)中,參照通過布局分析所獲得的劃線項目信息502和表格結(jié)構(gòu)信息(未示出)而產(chǎn)生一劃線項目結(jié)構(gòu)信息表(劃線項目結(jié)構(gòu)信息TBL)503作為以標題位置搜尋規(guī)則待評價的規(guī)則關(guān)鍵信息,這將在以下說明。
作為由布局分析部分2B的表格結(jié)構(gòu)分析部分2E表格結(jié)構(gòu)分析的一個結(jié)果,示于圖38的這種結(jié)構(gòu)信息被添加到各個劃線項目中。
以下將參照圖38說明劃線項目信息502。劃線項目ID是用于各個劃線項目標識的ID信息,并在劃線項目抽取時進行唯一的編號。組ID是當劃線項目被分組時加到相同組的標識ID。塊ID是用于各個單元之間標識的ID,同一組被劃分為單元而具有相同劃線項目結(jié)構(gòu)。
表格結(jié)構(gòu)表示由一個組ID標識的劃線項目是否具有一表格結(jié)構(gòu),并為了防止表格結(jié)構(gòu)的存在與不存在之間的鑒別被固定,表格結(jié)構(gòu)的存在與不存在之間的鑒別以項目行數(shù)/項目列數(shù)進行。要注意,項目行數(shù)表示劃線項目表格的行結(jié)構(gòu)以一組的表格矩形出現(xiàn),而項目列數(shù)表示劃線項目表格的列結(jié)構(gòu)以一組的表格矩形出現(xiàn)。
進而,劃線項目屬性是各個劃線項目作為布局的成分的屬性信息,并且屬性與文件布局的對應關(guān)系示于圖39中。
如在圖39中所見,可得到以下項目作為不同于表格結(jié)構(gòu)的劃線項目的劃線項目。
(a)1劃線項目[1](b)2劃線項目[2](c)塊劃線項目[B](d)嵌套劃線項目[I]同時,如在圖39中所見,可獲得以下項目作為表格結(jié)構(gòu)劃線項目。
(e)屬于標題行的劃線項目[H](f)屬于腳注行的劃線項目[F](g)屬于本體行的劃線項目[D](h)屬于向上凸起的劃線項目[U](i)屬于向下凸起的劃線項目[L]要注意,由于圖39所示的文件布局不包含腳注行,而且(f)屬于腳注線的劃線項目不出現(xiàn)。
同時,(a)到(i)的[]中出現(xiàn)的1,2,B,I,H,F(xiàn),D,U和L為各個劃線屬性的代碼。
順便來說,行信息指示在劃線項目表格中的劃線項目行數(shù),而列信息指示在劃線項目表格中的劃線項目列數(shù)。
例如如圖39(d)中所示,同時,層次信息指示作為劃線項目屬性的具有嵌套結(jié)構(gòu)的劃線項目層次關(guān)系。
進而,頂/末指示同一組中劃線項目的位置信息。
然后,參照通過布局分析所獲得的上述這種劃線項目信息502和表格結(jié)構(gòu)信息而產(chǎn)生劃線項目結(jié)構(gòu)信息表格(TBL)503[參照圖40和41(a)到41(d)]。
另一方面,在項目本體位置搜尋處理(步驟K2)中,在步驟K1中所產(chǎn)生的劃線項目結(jié)構(gòu)信息表格503的劃線項目以標題位置搜尋規(guī)則評價[參見圖42,43(a)和43(b)]以便判定標題位置備選項。
標題搜尋規(guī)則505設計為就供分析的對象文件在確認度中以它們較高階的一個開始,而對象文件為交換一般轉(zhuǎn)帳文件(第一階表格)的標題搜尋規(guī)則505的一個例子給出如下。
首先,以下說明不是用于表格結(jié)構(gòu)的標題位置搜尋規(guī)則。
非表格結(jié)構(gòu)的劃線項目可能包含向上凸起的劃線項目,向下凸起的劃線項目及包含屬于同一組作為表格結(jié)構(gòu)的腳注的劃線項目,和屬于非表格結(jié)構(gòu)組的一組而且不形成一個表格的劃線項目,并且以下將說明用于這些劃線項目的標題位置搜尋規(guī)則。
(a)在涉及單個劃線項目之處,標題部分出現(xiàn)在劃線項目中(*數(shù)據(jù)部分共同存在)。
(b)在涉及一嵌套的劃線項目之處,標題部分出現(xiàn)在該嵌套的左側(cè)劃線項目處。
(c)在涉及一嵌套的劃線項目之處,標題部分出現(xiàn)在該嵌套的上側(cè)劃線項目處。
(d)在涉及兩個或者更多劃線項目之處,標題部分出現(xiàn)在頂部劃線項目處。
(e)在涉及兩個或者更多劃線項目之處,標題部分出現(xiàn)在頂部劃線項目及下一個劃線項目處。
進而,以下將說明用于表格結(jié)構(gòu)部分的標題搜尋規(guī)則505。
表格結(jié)構(gòu)劃線項目出現(xiàn)在包含一個表格矩形或者在同一組2行×2列或更多的劃線項目中最大矩形部分,并且標頭部分出現(xiàn)在最大矩形部分的頂行,同時本體2部分出現(xiàn)在隨后的行部分。
以下將說明用于上述這種劃線項目的標題位置搜尋規(guī)則。
(f)具有多個涉及部分的標題項目出現(xiàn)在表格結(jié)構(gòu)部分的頭行。
(g)在表格結(jié)構(gòu)部分的頭行中出現(xiàn)嵌套劃線項目之處,在劃線項目的上側(cè)出現(xiàn)復標題。
(h)在表格結(jié)構(gòu)部分的頭行中出現(xiàn)嵌套劃線項目之處,在劃線項目的下側(cè)出現(xiàn)子標題。
當布局分析部分2B在步驟K2實現(xiàn)項目標題位置搜尋處理時,例如基于上述這種標題搜尋規(guī)則505進行對構(gòu)成標題對比檢驗對象的標題位置備選項的判定,并將參照圖44的流程圖說明這時的處理過程。
首先,從在步驟K1所產(chǎn)生的劃線項目結(jié)構(gòu)信息表503抽取劃線項目信息(步驟J1)。
然后,基于標題搜尋規(guī)則505進行標題位置的評價(步驟J2),并記錄評價的結(jié)果到劃線項目結(jié)構(gòu)信息表503(步驟J3)。
這里,要鑒別標題位置的評價是否已經(jīng)基于所有的標題搜尋規(guī)則505進行過,并且如果保留有某個規(guī)則沒有用于標題位置的評價,則標題位置的評價基于該規(guī)則進行(步驟J4到步驟J2和J3)。
進而,要鑒別標題位置的評價是否已經(jīng)對于所有的劃線項目信息進行過,并且如果保留有某個劃線項目信息還沒有用于評價,則對該保留的劃線項目信息進行評價(步驟J5到步驟J1和J4)。
然后,在標題評價對于所有的劃線項目信息已經(jīng)完成之后,參照操作參數(shù)信息501中的評價參照數(shù)值判定標題位置備選項(步驟J6)。
例如,對于圖39所示的文件,由圖45中的網(wǎng)狀(網(wǎng)格部分V)表示的劃線項目判定為標題位置備選項。
進而,在項目標題對比檢驗處理中(步驟K3),對于基于標題搜尋規(guī)則505所判定的標題位置備選項進行對于超復雜特征數(shù)據(jù)的抽取對比檢驗處理以便使用項目標題字典507對比檢驗出現(xiàn)在劃線項目中的項目數(shù)據(jù)(步驟K4)。然后,基于對比檢驗的結(jié)果判定標題位置備選項的劃線項目的位置與對應于該標題的功能項目。
這里,將說明構(gòu)成對比檢驗對象的標題項目數(shù)據(jù)(在標題劃線項目中的項目數(shù)據(jù))。標題位置備選項的劃線項目可能包括多個標題項目數(shù)據(jù)。
這時,通過以下方法判定構(gòu)成對比檢驗對象的標題項目數(shù)據(jù)。
首先,假設構(gòu)成對比檢驗對象的標題項目數(shù)據(jù)為標題位置備選項的劃線項目中最大項目數(shù)據(jù),例如如圖46(a)中所見。
這里,如果標題是單一功能標題,則由于在對比檢驗只有一個標題項目數(shù)據(jù)起作用,假設其余的項目數(shù)據(jù)為灰塵或某些裝飾的原來單元,例如如圖46(b)中所見。但是即使在標題為復功能標題之處,也要假設標題項目數(shù)據(jù)通常為連續(xù)出現(xiàn)的,例如如圖46(c)中所見。
同時,在如圖47(a)中所見垂直書寫的標題或由如圖47(b)或47(c)中那種多行組成的標題的情形,則假設對比檢驗對象的標題項目數(shù)據(jù)出現(xiàn)在包含連續(xù)項目數(shù)據(jù)的區(qū)域中。
特別地,假設垂直書寫的項目數(shù)據(jù)是從與項行的項目數(shù)據(jù)相同的X坐標相近的位置開始的,垂直書寫的項目數(shù)據(jù)出現(xiàn)在與隨后的項目數(shù)據(jù)結(jié)合的頂行項目數(shù)據(jù)的區(qū)域中。
然而,在如圖48(a)或48(b)中所示的那種復標題的情形或如圖所示48(c)多行標題情形,標題項目數(shù)據(jù)不能被正確地判定。
于是,在該處理中,只有在上述狀態(tài)下結(jié)合的區(qū)域被視為項目數(shù)據(jù)處理。
順便來說,在標題項目對比檢驗步驟K10中的超復雜特征數(shù)據(jù)抽取對比檢驗處理(步驟K4)中,對標題項目進行正規(guī)化處理。于是,即使在不同文件之間在字體或者印刷字體/印刷間距中存在差別,在對比檢驗時要被匹配的標題項目數(shù)據(jù)的所有圖象仍能夠存儲到項目標題字典507中。
為了克服印刷字體中的差別,采取了一個對策以實現(xiàn)標題項目對比檢驗,這是通過重心劃分為四部分(手寫字符識別技術(shù))的正規(guī)化處理之后由基于超復雜字符的對比檢驗進行的。
同時,為了克服印刷間距的差別,采取了一個對策以便對要被對比檢驗的標題項目數(shù)據(jù)字符之間的空隙正規(guī)化,如圖49中所見使得它們能具有固定的大小(例如一個點)。
進而,為了克服項目標題的字體的的差別,采取了一個對策,使得表示標題表達方式的多種字體事先在項目標題字典507中。
作為超復雜特征信息在它們正規(guī)化處理之后,項目標題字典507事先存儲從采樣文件取得的標題項目數(shù)據(jù)的圖象。進而,為了吸收標題之間字體的差別,指示相同功能的項目標題被分類并存儲在相同的類別中,如圖50中所見。
然后,當標題項目數(shù)據(jù)在步驟K4由字符通過比檢驗抽取處理進行對比檢驗時,類別ID、標題圖象ID和各個備選標題的差度作為對比檢驗的結(jié)果按備選項的順序報告,如圖51(a)和51(b)中所見。
進而,參照操作參數(shù)信息501的標題對比檢驗參數(shù)(Th1和Th2)判定在標題項目位置的標題內(nèi)容。
特別,滿足對比檢驗結(jié)果的第一備選標題差度等于或低于對比檢驗參數(shù)(Th1)的要求,以及滿足對比檢驗結(jié)果的第一備選項與具有不同類型ID的另一備選項之間的差度差別等于或高于對比檢驗參數(shù)(Th2)的差度差別要求的這些內(nèi)容被判定為在標題項目位置處的的標題內(nèi)容。
例如,在圖51所示的例子中,如果在假設Th1=1,000和Th2=2,000之下進行評價,則獲得以下的結(jié)果,并從而能夠看到對比檢驗結(jié)果滿足上述的兩個要求(差度要求和差度差別要求)。
差度要求(350)≤(Th1=1,000)→OK差度差別要求
|2,700-350|≥(Th2=2,000)→OK當在這種方式下進行標題項目數(shù)據(jù)的對比檢驗時,可能的結(jié)果情形是(情形1),其中所有對比檢驗結(jié)果為OK標題項目的分析完全成功地進行,而另一種情形(情形2),其中對某些標題項目的分析不成功,并且另一情形是(情形3),其中對幾乎所有的標題項目分析都不成功。
這里,在情形1的情形下,對比檢驗的結(jié)果報告它們是作為標題分析的結(jié)果,但是在情形3的情形下,判定標題分析結(jié)果是不成功的,并且報告文件識別的結(jié)果為不符合要求的本意。
另一方面,在情形2的情形下,進行標題對比檢驗結(jié)果的校正處理(步驟K5)。于是,在一特定情形下,能夠?qū)€沒有進行分析的標題項目進行分析。
對于作為標題項目的對比檢驗的結(jié)果由表格結(jié)構(gòu)部分的標題行所定義的基本標題項目,在以下情形下,根據(jù)標題校正規(guī)則508(使用標題校正規(guī)則508的標題對比檢驗結(jié)果校正處理,步驟K5)進行校正。要注意,只有在對比檢驗的結(jié)果沒有定義時標題校正規(guī)則508才被采用,但是不能在拒絕對比檢驗結(jié)果的方式下使用。
這里,如在圖52(a)所見在具有嵌套結(jié)構(gòu)的復合標題項目之一不定義之處,如果使用標題校正規(guī)則508進行校正,則從復合標題項目的功能項目內(nèi)容能夠唯一地判定其余的功能項目(這是由于在復合標題項目的“NAME OF FINANCIAL ORGAN”情形下,“NAME OF BANK”與“NAME OF BANK OFFICE”必定對應于嵌套的標題項目),能夠?qū)ι形闯晒Φ乇环治龅臉祟}項目進行分析。
進而,如在圖52(b)所見,例如如果在只有一般轉(zhuǎn)帳文件的標題行中主要項目的標題之一不定義之處,使用標題校正規(guī)則508進行校正,則由于從功能名稱信息表唯一地判定了要包含在標題行中的功能項目,故能夠?qū)ι形闯晒Φ乇环治龅臉祟}項目(被嵌套部分W)進行分析。
此外,如果如圖52(c)中所見在只有要被包含的非標題行的基本標題項目之一未定義,并且只有未定義的標題備選位置之一出現(xiàn)之處,使用使用標題校正規(guī)則508進行校正,則在標題位置備選項與基本標題項目數(shù)目彼此相符之處,能夠?qū)ι形闯晒Φ乇环治龅臉祟}項目(被嵌套部分W)進行分析,因為它能夠通過任何定義的標題的消除法被判定。
要注意,在圖52(a)到52(c)中,尚未成功地被分析的任何標題項目由被嵌套部分W表示,而已經(jīng)通過標題對比檢驗校正處理進行了分析的任何其它標題項目由另外的被嵌套部分W′表示。
同時,在項目數(shù)據(jù)位置搜尋處理(步驟K6)中,搜尋對應于作為標題項目對比檢驗結(jié)果最后定義的標題項目的項目數(shù)據(jù)的劃線項目位置。
首先,類似于對標題項目(標題劃線項目)位置的搜尋,通過使用數(shù)據(jù)搜尋規(guī)則509評價劃線項目結(jié)構(gòu)信息表503的各個劃線項目,進行對應于標題部分的項目數(shù)據(jù)的劃線項目位置的搜尋。
這里,項目數(shù)據(jù)位置的搜尋與標題項目位置的搜尋之不同在于,在項目數(shù)據(jù)位置搜尋情形下,由于標題項目已經(jīng)被定義,故首先評價標題以便選擇搜尋規(guī)則,并然后把該規(guī)則用于各個劃線項目,而在標題項目位置搜尋的情形下,因為涉及標題項目的對比檢驗處理,故首先判定標題位置的備選項,在項目數(shù)據(jù)位置搜尋的情形下,項目數(shù)據(jù)位置必須作為搜尋處理的結(jié)果判定。
然后,在搜尋項目數(shù)據(jù)位置中,基于劃線項目結(jié)構(gòu)信息表503和數(shù)據(jù)搜尋規(guī)則509,判定對應于已經(jīng)判定的標題項目的項目數(shù)據(jù)位置(項目數(shù)據(jù)的劃線項目位置)。
然后將參照圖53的流程圖說明該操作。首先抽取通過標題分析所判定的標題項目信息(步驟L1),并判定對應于這樣抽取的標題項目的數(shù)據(jù)搜尋規(guī)則509(步驟L2)。
此后,從劃線項目結(jié)構(gòu)信息表503抽取劃線項目信息(步驟L3),并以數(shù)據(jù)搜尋規(guī)則509進行評價(步驟L4)。
然后,由該評價的結(jié)果判定項目數(shù)據(jù)位置,并作為功能名稱信息設置所判定的項目數(shù)據(jù)位置的劃線ID(步驟L5)。
進而,鑒別是否對于所有的劃線項目信息已經(jīng)完成評價,并且如果評價已經(jīng)完成,則繼而進行對于下一個劃線項目信息的評價(步驟L6和L3到L5)。
進而,鑒別是否對應于所有的標題項目信息的項目數(shù)據(jù)位置都已經(jīng)被判定,如果還遺留有其項目數(shù)據(jù)位置沒有被判定的標題項目,則對下一個標題項目信息進行處理(步驟L7和L2到L6)。
這里,除非涉及表格結(jié)構(gòu),則標題部分劃線項目與涉及部分劃線項目之間的連接規(guī)則按以下方式定義。
(a)數(shù)據(jù)部分的劃線項目為跟隨標題部分的劃線項目[參見圖54(a)和54(b)]。
(b)在沒有跟隨標題部分的劃線項目之處,數(shù)據(jù)部分出現(xiàn)在該標題部分的同一劃線項目中[參見圖54(c)]。
(c)在多個劃線項目跟隨標題部分之處,數(shù)據(jù)部分出現(xiàn)在直到另一個無關(guān)的標題出現(xiàn)的位置的劃線項目中[參見圖54(d)和54(e)]。
(d)在標題部分以嵌套的劃線項目成對出現(xiàn)之處,數(shù)據(jù)部分出現(xiàn)在子劃線項目中[參見圖54(f)和54(g)]。
(e)在出現(xiàn)兩個劃線項目之處,有可能標題部分與數(shù)據(jù)部分會出現(xiàn)在同一劃線項目中[參見圖54(h)]。
同時,在涉及表格結(jié)構(gòu)之處,標題部分劃線項目與涉及部分劃線項目之間的連接規(guī)則按以下方式定義。
(f)在表格為垂直的一維表格之處,數(shù)據(jù)部分跟隨標題劃線項目的列方向的劃線項目[參見圖55(a)]。
(g)在表格為垂直的一維表格并且標題包含兩列之處,數(shù)據(jù)部分跟隨標題劃線項目的列方向的劃線項目[參見圖55(b)]。
(h)在表格為垂直的一維表格并且標題包含嵌套項目之處,數(shù)據(jù)部分跟隨成對的標題劃線項目方向的劃線項目[參見圖55(c)]。
(i)在表格為垂直的一維表格并且標題為復合標題之處,數(shù)據(jù)部分跟隨復合標題劃線項目列方向的劃線項目[參見圖55(d)]。
(j)在表格為水平一維表格之處,數(shù)據(jù)部分跟隨標題劃線項目的行方向的劃線項目[參見圖55(e)]。
(k)在表格為二維表格之處,數(shù)據(jù)部分跟隨標題劃線項目的列/行方向的劃線項目[參見圖55(f)]。
這里,對應于標題項目的項目數(shù)據(jù)位置的判定例子示于圖56中。要注意,在圖56中,每一標題項目的判定位置是由網(wǎng)格部分X指示的,同時項目數(shù)據(jù)位置由X′表示,標題項目判定位置與項目數(shù)據(jù)位置之間的鏈接關(guān)系由箭頭標號表示。
進而,在項目數(shù)據(jù)部分鏈接處理(步驟K7)中,參照對應于標題劃線項目的數(shù)據(jù)部分劃線項目的位置而判定數(shù)據(jù)部分劃線項目中項目數(shù)據(jù)的位置并設置它們之間的鏈接關(guān)系。
從標題部分到對應的項目數(shù)據(jù)部分的鏈接關(guān)系示于圖57和58。
這里,在多于一個項目數(shù)據(jù)出現(xiàn)在劃線項目中或者其中出現(xiàn)項目數(shù)據(jù)部分的矩形區(qū)域中之處,則根據(jù)操作參數(shù)信息501判定要與功能項目鏈接的項目數(shù)據(jù)。
在要從單一功能項目被鏈接之處,從指定的行和列位置根據(jù)操作參數(shù)信息501鏈接指定行數(shù)和指定列數(shù)項目數(shù)據(jù)[參見59(a)]。
這里,在要從單一功能項目被鏈接之處,項目數(shù)據(jù)鏈接的操作參數(shù)信息501包括以下信息。
(a)鏈接由一指定行開始的指定數(shù)目的行(*缺省指定行=第一行,指定行數(shù)=一行)。然而,在項目數(shù)據(jù)行數(shù)目小于指定行數(shù)目之處,鏈接區(qū)域中所有的項目數(shù)據(jù)行。
(b)鏈接由一指定列開始的指定數(shù)目的列(*缺省指定列=第一列,指定列數(shù)=所有的列數(shù))。然而,在項目數(shù)據(jù)列數(shù)目小于指定列數(shù)目之處,鏈接區(qū)域中所有的項目數(shù)據(jù)列。
另一方面,在要從復合功能項目鏈接之處,根據(jù)操作參數(shù)信息501按功能項目的定義順序鏈接來自指定行和指定列的指定行數(shù)和指定列數(shù)的項目數(shù)據(jù)[參見59圖(b)]。
這里,在要從復合功能項目鏈接之處,項目數(shù)據(jù)鏈接的操作參數(shù)信息501包括以下信息。
(c)在N≥K并且M<K之處,項目數(shù)據(jù)行按功能項目鏈接順序分配。
(d)在N<K并且M≥K之處,項目數(shù)據(jù)列按功能項目鏈接順序分配。
(e)在N≥K并且M≥K之處,項目數(shù)據(jù)行按功能項目鏈接順序分配。
(f)在N≥K并且M≥K之處,項目數(shù)據(jù)列按功能項目鏈接順序分配。
(g)在N<K并且M<K之處,分配不可能,故項目數(shù)據(jù)不鏈接。
要注意,在以上說明中,N是項目行數(shù),M是項目列數(shù),而K是功能項目數(shù)。
然后,在款額鏈接處理(步驟K8)中,在被分析的標題項目的功能項目是一款額,一項服務費等之處,校驗對應的項目數(shù)據(jù)屬于其中的劃線項目,并且如果該結(jié)構(gòu)為列定界的劃線項目,則各個單一列劃線項目彼此連接而形成單一項目數(shù)據(jù)信息,并且項目數(shù)據(jù)鏈接到功能項目。
這里,在對應于標題部分的項目數(shù)據(jù)部分劃分為三個或者更多的(根據(jù)操作參數(shù)指定數(shù)值)劃線項目,且各個劃線項目的尺寸低于操作參數(shù)設定值,此外判定了標題功能為一款額之處,則鑒別出劃線項目為列定界劃線項目[參見圖60(a)和60(b)]。
然后,如果鑒別出項目數(shù)據(jù)部分的劃線項目是由一列定界劃線項目形成的,則各個劃線項目鏈接之間的關(guān)系從頂列的劃線項目開始相繼設置,并作為相繼的劃線項目處理劃線項目以連接這些劃線項目[參見圖60(c)]。
進而在項目數(shù)據(jù)部分的劃線項目是由對列定界劃線項目形成之處,由于各個劃線項目中的項目數(shù)據(jù)也是被劃分的狀態(tài),故對各個劃項目數(shù)據(jù)組合處理以設置它們?yōu)閱我豁椖繑?shù)據(jù),彼此連接這些項目數(shù)據(jù)[參見圖60(d)]。
要注意,雖然以上說明了劃線項目為一列定界劃線項目的情形,三列對講機劃線項目也可以類似的方式處理。
又對于三列定界款額部分,劃線項目與項目數(shù)據(jù)的連接按與單列定界款額部分的情形類似的方式進行。然而,由于三列定界款額部分具有較小的列寬度和較小的劃線項目數(shù),故設置了與單列定界款額部分不同的要求[參見圖60(e)和60(f)]。
當具有上述結(jié)構(gòu)的根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置30進行標題分析處理時,在布局分析處理步驟A2(或A9)中,抽取所讀取的圖象的布局特征以便分析布局的結(jié)構(gòu),并校驗所抽取的特征判定圖象中的標題區(qū)域。然后,識別標題標題區(qū)域中的標題項目信息并判定對應的項目數(shù)據(jù),并邏輯上表示該布局。
然后,在布局對比檢驗處理步驟A3(或A10)中,應用在布局分析處理步驟A2(或A9)所抽取的布局特征作為限制檢索項,檢索存儲在布局DB 14中的備選布局,以便對比檢驗是否存在相符的備選布局。
這樣,應用根據(jù)本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置30,由于在供分析的對象文件上所描述的標題項目和對應于該標題項目的項目數(shù)據(jù)能夠通過進行了標題分析處理之后的布局識別處理進行標識,其中在標題分析處理中,從文件的圖象劃線項目結(jié)構(gòu)搜尋和對比檢驗標題位置并自動分析對應于文件上所描述的標題的項目信息,故在沒有進行標題項目的字符識別處理之下能夠立即進行項目數(shù)據(jù)的字符識別。
(a7)對識別結(jié)果的確認和修改處理的說明(1)圖象數(shù)據(jù)顯示裝置的說明圖61是表示本發(fā)明該實施例的圖象數(shù)據(jù)顯示裝置640的結(jié)構(gòu)的示意圖。圖象數(shù)據(jù)顯示裝置640通過作為圖象數(shù)據(jù)顯示其上描述了一個人(這個人由其姓名確定)要匯款,帳號(帳目No.),匯款額度等等的文件進行匯款請求處理,并通過操作者操作鍵盤等輸入諸如帳號,姓名,及匯款額度等匯款數(shù)據(jù),,或者通過操作者的目視觀察進行確認由其它什么裝置等所進行的圖象數(shù)據(jù)(匯款數(shù)據(jù))的字符識別結(jié)果是正確或錯誤并必要時對字符識別結(jié)果進行修改而進行匯款請求處理。圖象數(shù)據(jù)顯示裝置640對應于圖6所示的數(shù)據(jù)媒體處理裝置的客戶機10。
特別,圖象數(shù)據(jù)顯示裝置640是這樣構(gòu)造的雖然操作者能夠目視觀察顯示在一顯示單元上的圖象數(shù)據(jù)并進行輸入操作,但是例如當文件由諸如OCR裝置這樣的圖象數(shù)據(jù)處理裝置讀取時,字符識別字符識別能夠自動地進行,并且操作者能夠進行僅涉及被錯誤識別的或尚未成功地識別的字符輸入操作。
圖61所示的圖象數(shù)據(jù)顯示裝置640包括作為圖象數(shù)據(jù)輸入裝置的一個圖象掃描器621A和一個光學字符閱讀裝置(OCR裝置)621B,一個作為數(shù)據(jù)輸入裝置的鍵盤631,一個作為顯示控制裝置的計算機主機629,一個顯示單元630和一個硬盤622。
要注意,圖象數(shù)據(jù)顯示裝置640是連接到圖6所示的服務器39上的,其功能是作為工作站從圖象掃描器621A向服務器39輸出圖象數(shù)據(jù)(匯款數(shù)據(jù)),檢索由服務器39所識別的圖象數(shù)據(jù)字符的字符識別結(jié)果,并在顯示單元630上顯示檢索出的字符識別結(jié)果,并向服務器39輸出由操作者確認和修改過的匯款數(shù)據(jù)。
圖象掃描器621A閱讀標號多個項目的銀行的匯款請求票據(jù)等的文件,并向圖象數(shù)據(jù)顯示裝置640輸入圖象數(shù)據(jù)。
OCR裝置621B類似于圖象掃描器6221A,閱讀圖象數(shù)據(jù)并進行所讀取的圖象數(shù)據(jù)的字符識別。
在本實施例中,對于圖象數(shù)據(jù)顯示裝置640裝設了圖象掃描器621A和OCR裝置621B這兩者,以便能夠處理各種格式的圖象數(shù)據(jù)。
要注意,在圖象數(shù)據(jù)由OCR裝置621B閱讀之處,圖象數(shù)據(jù)的字符識別結(jié)果是顯示在圖象數(shù)據(jù)顯示裝置640的顯示單元630上的。
顯示單元630具有一個圖象數(shù)據(jù)顯示區(qū)域611和一個項目數(shù)據(jù)顯示區(qū)域614,并如圖70中所見那樣顯示輸入的文件圖象數(shù)據(jù)。
這里,圖象數(shù)據(jù)顯示區(qū)域611是這樣一個區(qū)域部分,在其中要顯示從圖象掃描器621A或OCR裝置621B輸入的文件圖象數(shù)據(jù)。
圖象數(shù)據(jù)顯示區(qū)域611顯示包括多個項目信息的圖象數(shù)據(jù),并在圖70中顯示包括“帳號(帳戶No.)”,“姓名”,“代理銀行(交易)”和“款額”四個項目612的信息的圖象數(shù)據(jù)。
設置項目數(shù)據(jù)顯示區(qū)域614是為了使用鍵盤631輸入對應于圖象數(shù)據(jù)顯示區(qū)域611所希望的一個項目612的圖象數(shù)據(jù)部分的匯款數(shù)據(jù)。
項目數(shù)據(jù)顯示區(qū)域614具有多個數(shù)據(jù)輸入顯示區(qū)域部分615。在圖70中,圖象數(shù)據(jù)顯示區(qū)域614具有四個數(shù)據(jù)輸入顯示區(qū)域部分615即“項目1到項目4”,其中“項目1”對應于“帳號”;“項目2”對應于“姓名”;“項目3”對應于“交易”;和“項目4”對應于“款額”。
所希望的數(shù)據(jù)輸入顯示區(qū)部分615之一由光標指示器616表示,并能夠輸入顯示在所希望的對應于它的項目612之一的圖象數(shù)據(jù)部分的匯款數(shù)據(jù)。要注意,數(shù)據(jù)的輸入能夠使用作為數(shù)據(jù)輸入裝置的鍵盤631進行。
進而,圖61中所示的圖象數(shù)據(jù)顯示裝置640包括上述的硬盤622。硬盤622作為用于存儲作為定義信息的圖象數(shù)據(jù)分區(qū)信息定義存儲部分。要注意,圖象數(shù)據(jù)分區(qū)信息表示用于把從圖象掃描器621A或者OCR裝置621B輸入的文件圖象數(shù)據(jù)劃分為多個項目612的圖象數(shù)據(jù)部分的信息。
示于圖61的計算機主機629功能是作為顯示控制裝置(以下計算機主機629能夠稱為顯示控制裝置629),并在圖象數(shù)據(jù)顯示區(qū)域611中顯示通過從圖象掃描器621A或者OCR裝置621B輸入的圖象數(shù)據(jù)所獲得的圖象數(shù)據(jù)。進而計算機主機629還指示,當對應于所希望的項目612之一的圖象數(shù)據(jù)部分的數(shù)據(jù)從鍵盤613被輸入時,光標指示器616在用于項目數(shù)據(jù)顯示區(qū)域614中所希望的項目612的數(shù)據(jù)輸入顯示區(qū)域615。
計算機主機629使用存儲在硬盤622的圖象數(shù)據(jù)分區(qū)信息,識別從圖象掃描器621A或者OCR裝置612B輸入的文件的圖象數(shù)據(jù)的劃線,轉(zhuǎn)換該劃線為包含多個項目612圖象數(shù)據(jù)部分的表格,并在圖象數(shù)據(jù)顯示區(qū)域611中顯示通過轉(zhuǎn)換所獲得的圖象數(shù)據(jù)。
進而,圖61和62所示計算機主機629并作為顯示控制裝置包括一個強調(diào)信息產(chǎn)生處理部分623,一個作為圖象數(shù)據(jù)局部強調(diào)顯示裝置的強調(diào)顯示部分624,一個作為圖象數(shù)據(jù)強調(diào)顯示刪除裝置的強調(diào)顯示刪除部分625,一個作為強調(diào)顯示轉(zhuǎn)移控制裝置的強調(diào)顯示轉(zhuǎn)移控制部分626和作為顯示屏幕滾動裝置的屏幕滾動部分627。
強調(diào)信息產(chǎn)生處理部分623參照從作為圖象數(shù)據(jù)輸入裝置所輸入的圖象數(shù)據(jù),或存儲在硬盤622上的圖象數(shù)據(jù)劃分信息(定義信息),以產(chǎn)生相關(guān)信息P和強調(diào)信息Q。
如圖68中所見,相關(guān)信息P是用于使得“項目1到項目4”在與“帳號”,“姓名”,“交易”和“款額”的對應關(guān)系中分別相關(guān)的信息。
強調(diào)信息Q是用于在圖象數(shù)據(jù)顯示區(qū)域611中進行強調(diào)顯示的信息,并具有包含對應于指示項目612的科目“科目1到科目4”的強調(diào)顯示類型的強調(diào)顯示屬性信息,以及一個強調(diào)顯示區(qū)域。要注意,“科目1到科目4”分別對應于“帳號”,“姓名”,“交易”和“款額”。
進而,強調(diào)顯示類型包括一個網(wǎng)格,一個裝飾劃線等等,并在本實施例中,作為強調(diào)顯示,向?qū)凇翱颇?”和“科目3”的項目612顯示設置一個寬框顯示方式,并向?qū)凇翱颇?”和“科目4”的項目顯示設置一個網(wǎng)格顯示方式,使得“科目1到科目4”順序地被強調(diào)顯示,能夠設置不同的強調(diào)顯示以達到較高的可視性。
同時,強調(diào)顯示區(qū)域使用包含X坐標和Y坐標的坐標(以點為單位)指示任何項目612的強調(diào)顯示部分613的開始和結(jié)束,并且對于每一項目612可任意設置強調(diào)顯示部分613的尺寸。
相關(guān)信息P和強調(diào)信息Q在圖64所示的流程圖的步驟A1′和A2′中產(chǎn)生。
如果在計算機主機629的控制之下,在其中包含多個項目的信息的圖象數(shù)據(jù)顯示在圖象數(shù)據(jù)顯示區(qū)域611中的狀態(tài)下,在項目數(shù)據(jù)顯示區(qū)域614中對于項目612數(shù)據(jù)輸入顯示區(qū)域部分615之內(nèi)對于所希望的項目612之一的數(shù)據(jù)輸入顯示區(qū)域部分615之一之處,光標指示器616被指示,則強調(diào)顯示部分624僅強調(diào)顯示對應于如由標號613所指的數(shù)據(jù)輸入顯示區(qū)域部分615的所希望的項目612之一的圖象數(shù)據(jù)部分。
特別地,當在用于所希望的項目612之一的數(shù)據(jù)輸入顯示區(qū)域部分615中指示光標指示器616時,當通過目視觀察要進行圖象數(shù)據(jù)與輸入項目之間的匹配以允許進行平滑的輸入操作時,則強調(diào)顯示部分624僅強調(diào)顯示對應于對帶有提高可視性的網(wǎng)格、裝飾劃線等項目612的數(shù)據(jù)輸入顯示區(qū)域部分615的圖象數(shù)據(jù)部分。
進而,強調(diào)顯示刪除部分625刪除由強調(diào)顯示部分624所強調(diào)的所希望的項目612之一的圖象數(shù)據(jù)部分的強調(diào)顯示部分613,以便轉(zhuǎn)換項目612的顯示為該強調(diào)顯示之前的狀態(tài)。特別地,如果光標指示器616通過光標移動操作移動到不同于對于所希望的項目612之一的數(shù)據(jù)輸入顯示區(qū)域部分615的對于另一個項目612之一的數(shù)據(jù)輸入顯示區(qū)域部分616,則強調(diào)顯示刪除部分625刪除對應于該項目的圖象數(shù)據(jù)部分的強調(diào)顯示部分613。
強調(diào)顯示轉(zhuǎn)移控制部分626的作用在于與強調(diào)顯示刪除部分625的聯(lián)鎖關(guān)系,并進行控制,使得在強調(diào)顯示刪除部分625刪除對應的一定的項目612之一的圖象數(shù)據(jù)部分的強調(diào)顯示部分613之后,移動光標指示器616到對于另一個項目612的數(shù)據(jù)輸入顯示區(qū)域部分615,并只有對應于對于由光標指示器616所指示的項目612的數(shù)據(jù)輸入顯示區(qū)域部分615的項目612的圖象數(shù)據(jù)部分由強調(diào)顯示部分624強調(diào)顯示。
進而,屏幕滾動部分627從圖象數(shù)據(jù)的部分顯示在顯示單元630的狀態(tài),顯示在顯示單元630上沒有顯示的那些圖象數(shù)據(jù)。
強調(diào)顯示部分624具有作為變化裝置的變化部分628。變化部分628響應來自外部的指令,例如使用鍵盤,而改變強調(diào)顯示類型或區(qū)域,并包含變化信息獲取部分628A和強調(diào)信息變化部分628B。
變化信息獲取部分628A獲取以下將要說明的變化信息R。強調(diào)信息變化部分628B使用變化信息R更新將在以下說明的強調(diào)信息Q以便產(chǎn)生強調(diào)信息Q′。
實際上,能夠向計算機主機629提供如同強調(diào)顯示部分624,強調(diào)顯示刪除部分625,強調(diào)顯示轉(zhuǎn)移控制部分626及屏幕滾動部分627的功能的適當?shù)能浖惭b到硬盤622或某種其它的存儲器,以構(gòu)成圖象數(shù)據(jù)顯示裝置640。
根據(jù)本實施例具有上述結(jié)構(gòu)的圖象數(shù)據(jù)顯示裝置640以如下方式操作。
圖67中示出當文件的圖象數(shù)據(jù)從圖62所示的圖象數(shù)據(jù)劃分裝置621(圖象掃描器621A或者OCR裝置621B)輸入并顯示在顯示單元(圖62中未示出)時的一個初始屏幕。
這時,如圖67中所見,包含多個項目信息的圖象數(shù)據(jù),即包含“帳號”,“姓名”,“交易”和“款額”四個項目信息的圖象數(shù)據(jù),顯示在顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611中。
另一方面,當輸入的匯款數(shù)據(jù)要被輸入時,光標指示器616移動到所希望的一個數(shù)據(jù)輸入顯示區(qū)域部分615以輸入對應于所希望的項目612之一的圖象數(shù)據(jù)部分的匯款數(shù)據(jù)。這時,如在圖70中所見,所希望的項目612的圖象數(shù)據(jù)部分通過強調(diào)顯示部分624以強調(diào)顯示部分613被強調(diào)顯示,并從圖71到76可見,在光標指示器616移動時強調(diào)顯示部分613也在圖象數(shù)據(jù)顯示區(qū)域611中移動。
要注意,雖然圖象數(shù)據(jù)的字符識別結(jié)果沒有在圖67和70到76中所示的數(shù)據(jù)輸入顯示區(qū)域部分615中顯示,它自然能夠另外顯示。
這里,在圖70中,示出當“帳號(0001)”的項目612被強調(diào)顯示時的顯示單元。
如果在圖70所見的那種狀態(tài)下操作者借助于鍵盤631輸入“0001”,然后人工操作鍵盤631在項目數(shù)據(jù)顯示區(qū)域614中移動光標指示器616從“項目1”到“項目2”,然后強調(diào)顯示部分613響應由強調(diào)顯示轉(zhuǎn)移控制部分626的操作在如圖71中所見的圖象數(shù)據(jù)顯示區(qū)域611從“帳號(0001)”移動到“姓名(Taro Fuji)”。這種狀態(tài)下,操作者將使用鍵盤631輸入“Taro Fuji”。
類似地如果操作者借助于鍵盤631輸入“Taro Fuji”并人工操作鍵盤631移動光標指示器616從“項目2”到“項目3”,則強調(diào)顯示部分613如圖72所見通過強調(diào)顯示轉(zhuǎn)移控制部分626從“姓名(TaroFuji)”移動到“交易(010)”。然后,如果操作者進而輸入“010”并移動光標指示器616從“項目3”到“項目4”,則強調(diào)顯示部分613通過強調(diào)顯示轉(zhuǎn)移控制部分626如圖73中所見從“交易(010)”移動到“款額(¥12,000)”。而且這時,操作者自然將使用鍵盤輸入“010”和“¥12,000”。
例如,如果在這樣輸入作為對應于“項目4”的匯款數(shù)據(jù)的款額數(shù)據(jù)“¥12,000”之后按動了鍵盤631的回車鍵,則對應于“項目1到項目4”的匯款數(shù)據(jù)(帳號、姓名、交易和款額數(shù)據(jù))示出到圖6中所示的服務器39。
然后,響應回車鍵的按動,光標指示器616再次從“項目4”移動到“項目1”,并且通過強調(diào)顯示轉(zhuǎn)移控制部分626如圖74中所見在第二行強調(diào)顯示部分613從“款額(¥12,000)”移動到“帳號(0010)”。此后,每次重復上述的操作,圖象數(shù)據(jù)顯示區(qū)域611中的項目612可被一次又一次地強調(diào)顯示。
換言之,對應于出現(xiàn)光標指示器616的數(shù)據(jù)輸入顯示區(qū)域部分615的項目612之一被強調(diào)顯示,并在光標指示器616移動時,強調(diào)顯示部分613在不同的項目612之間也移動。
同時,匯款數(shù)據(jù)的輸入在具有光標指示器616的數(shù)據(jù)輸入顯示區(qū)域部分615處進行,并如果光標指示數(shù)據(jù)向其輸入的數(shù)據(jù)輸入顯示區(qū)域部分615之一移動,則同時被參照的項目612的圖象數(shù)據(jù)部分被強調(diào)顯示。于是,能夠防止當數(shù)據(jù)被參照時匹配中的錯誤識別要被增加目視的可視性,由此輸入操作所需的勞務能夠被降低并可防止匯款數(shù)據(jù)的誤輸入。
如果假設上述的匯款數(shù)據(jù)輸入處理進而進行到如圖75中所見顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611最低行中的″款額(¥1,765)″被強調(diào)顯示,然后在沒有在顯示單元630上顯示的某些項目612保持在低于“款額(¥1,765)”之處,如果光標指示器616在項目數(shù)據(jù)顯示區(qū)域614中從“項目4”移動到“項目1”,則如圖76中所示通過強調(diào)顯示轉(zhuǎn)移控制部分626,在圖象數(shù)據(jù)顯示區(qū)域611中顯示屏幕627和強調(diào)顯示部分613按對應關(guān)系從″款額(¥1,765)″移動到“帳號(2148)”。
換言之,在處于圖象數(shù)據(jù)顯示區(qū)域611的最低位置的項目612之一被強調(diào)顯示而在顯示單元630上沒有被顯示的某些項目612保持在低于項目612之處,則能夠通過在數(shù)據(jù)輸入顯示區(qū)域部分615之間移動光標指示器616使得顯示屏自動地滾屏。
要注意,雖然在圖76中顯示屏的滾動一個個項目地進行并且項目“帳號(2148)”被顯示,但是顯示滾動的方式不限于此,并且通過移動“帳號(2148)”到最上行使得低于它們的一屏的其它項目能夠被顯示,對于一屏(七個項目)的所有的項目能夠被交替地滾動。
這里,如圖70到76中所示這種強調(diào)顯示的移動控制是由強調(diào)顯示部分624、強調(diào)顯示刪除部分625、強調(diào)顯示轉(zhuǎn)移控制部分626以及屏幕滾動部分627進行的,并在以下參照圖65更詳細地說明這時的操作流。
例如,如果如圖70到71中所見在項目數(shù)據(jù)顯示區(qū)域614中光標指示器616從“項目1”移動到“項目2”,即如果構(gòu)成圖象數(shù)據(jù)顯示區(qū)域611中的輸入對象的項目612之一變?yōu)椴煌谝呀?jīng)是上一個輸入對象的項目612之一,則鑒別在上一次輸入時強調(diào)顯示的屬性(強調(diào)顯示類型或者強調(diào)顯示區(qū)域)是否已經(jīng)發(fā)生變化(步驟B1′)。
然后,如果強調(diào)顯示的屬性已經(jīng)發(fā)生變化,則強調(diào)顯示刪除625使得在先前的顯示中項目612的圖象數(shù)據(jù)顯示部分的強調(diào)顯示屬性返回到普通顯示屬性(變化之前的屬性)以刪除強調(diào)顯示(步驟B2′),并為下一個項目612取得相關(guān)信息(步驟B3′)。
此后,強調(diào)顯示部分624參照相關(guān)信息P鑒別關(guān)于構(gòu)成輸入對象的該項目612的相關(guān)信息P是否出現(xiàn)(步驟B4′),如果關(guān)于構(gòu)成輸入對象的該項目612的相關(guān)信息P出現(xiàn),則取得顯示部分624取得強調(diào)信息Q,并且變化信息獲取部分628A參照該強調(diào)信息Q而取得取得顯示屬性中的變化信息(步驟B5′)。
進而,鑒別對應于構(gòu)成輸入對象的項目612的圖象數(shù)據(jù)部分是否在顯示單元630上顯示以鑒別是否需要自動滾屏(步驟B6′)。如果不需要自動滾屏,則強調(diào)信息改變部分628B以步驟B5′中所要求的變化信息改變圖象數(shù)據(jù)部分的強調(diào)顯示屬性,并且如圖70和71中所見,強調(diào)顯示部分613從“帳號(0001)”移動到“姓名(TaroFuji)”。
另一方面,如果在步驟B6′中鑒別出需要自動滾屏,則如圖75和76中所見滾屏部分627響應強調(diào)顯示部分613的移動進行自動滾屏處理(步驟B7′),并且強調(diào)信息改變部分628B以步驟B5′中所要求的變化信息改變圖象數(shù)據(jù)部分的強調(diào)顯示屬性(步驟B8′)。
這樣,強調(diào)顯示的移動控制是這樣進行的,即鑒別強調(diào)顯示屬性中的變化是否已經(jīng)發(fā)生,并如果強調(diào)顯示屬性中的變化已經(jīng)發(fā)生,則任何項目612的上一個強調(diào)顯示被刪除,并鑒別關(guān)于構(gòu)成輸入對象的項目612之一的相關(guān)信息P是否出現(xiàn),并如果關(guān)于構(gòu)成輸入對象的項目612之一的相關(guān)信息P出現(xiàn),則需要強調(diào)顯示屬性中的變化信息。
進而,鑒別是否需要自動滾屏,并如果不需要自動滾屏,則改變強調(diào)顯示屬性,但是如果需要自動滾屏,則進行自動滾屏處理并然后改變強調(diào)顯示屬性。
順便來說,通過改變強調(diào)信息Q能夠任意改變強調(diào)顯示部分613的顯示類型和顯示區(qū)域。
這將通過例子的方式說明,其中例如在77中所示顯示單元30上,作為圖象數(shù)據(jù)顯示區(qū)域611的最低階處的項目612的“款額(¥4,321)”被強調(diào)顯示。
這時,從圖69和79的強調(diào)信息Q可見,“款額(¥4,321)”的項目612的強調(diào)顯示部分613能夠通過定義開始位置坐標(320,180)以及結(jié)束位置坐標(420,200)而唯一地判定。要注意,開始位置坐標(320,180)是在對應于“科目4(款額)”的“No.7開始”處所指示的坐標,而結(jié)束位置坐標(420,200)是在對應于“科目4(款額)”的“No.7結(jié)束”處所指示的坐標。
然后,如圖78中所見,如果強調(diào)顯示部分613的開始位置坐標(320,180)變?yōu)?360,180),則圖77中所示的項目612的“款額(¥4,321)”的強調(diào)顯示部分613的區(qū)域變?yōu)閳D78中所見的狹窄的區(qū)域。
通過改變強調(diào)信息Q的開始位置的坐標或者結(jié)束位置的坐標,能夠任意設置強調(diào)顯示部分613的區(qū)域的大小。
強調(diào)顯示信息Q的這種改變能夠這樣進行,即通過使用作為數(shù)據(jù)輸入裝置的鍵盤或某些其它裝置,向圖象數(shù)據(jù)顯示裝置640輸入改變強調(diào)顯示屬性的指令而改變圖62和63中所示的部分628。
特別地,在改變部分628中,如果變化信息獲取部分628A要求變化信息R,則強調(diào)信息改變部分628B更新強調(diào)信息Q以產(chǎn)生強調(diào)信息Q′,并在以下將參照圖66說明這時的操作流程。
如果變化信息R輸入,則變化信息獲取部分628A首先進行強調(diào)信息改變開始識別處理(步驟C1′)及強調(diào)信息改變結(jié)束識別處理(步驟C2′),并然后進行改變信息獲取處理(步驟C3′)以識別強調(diào)信息Q以什么方式已經(jīng)被改變。
然后,例如如圖79中所見,根據(jù)識別的結(jié)果,強調(diào)信息改變部分628B進行強調(diào)信息更新處理(步驟C4′)及強調(diào)信息改變處理(步驟C5′),以便更新強調(diào)信息而產(chǎn)生強調(diào)信息Q′。
由于強調(diào)顯示部分613的顯示類型和顯示區(qū)域能夠這樣任意改變,故強調(diào)顯示能夠根據(jù)應用自由地進行。
要注意,雖然圖象數(shù)據(jù)字符識別的結(jié)果沒有顯示在圖77或78所示的數(shù)據(jù)輸入顯示區(qū)域部分615中,但數(shù)據(jù)自然能夠被交替顯示。
于是,由根據(jù)本實施例的圖象數(shù)據(jù)顯示裝置640,如果改變指示移動到數(shù)據(jù)要被輸入的數(shù)據(jù)輸入顯示區(qū)域部分615,則同時被參照的項目612的圖象數(shù)據(jù)部分被強調(diào)顯示。于是,即使操作者目光一時離開了顯示單元630并然后又觀看顯示單元630,也能夠防止操作者看錯了項目612。于是,該圖象數(shù)據(jù)顯示裝置640的優(yōu)點在于,當圖象數(shù)據(jù)被參照時防止了匹配中的誤識別并改進了可視性,并此外降低了用于輸入操作的勞務,防止了誤輸入。
進而,當要被參照項目612的圖象數(shù)據(jù)沒有顯示在顯示單元630上時,由于能夠響應強調(diào)顯示部分613的移動而自動滾屏,故圖象數(shù)據(jù)顯示裝置640的優(yōu)點還在于,例如可以減少諸如按鍵這種無益的操作。
進而,圖象數(shù)據(jù)顯示裝置640的優(yōu)點在于,強調(diào)顯示部分613的類型或區(qū)域可以由操作者改變并可根據(jù)用途而使用。
要注意,雖然本實施例中當顯示在顯示單元上的文件的圖象數(shù)據(jù)進行強調(diào)顯示時,預定的項目612如圖70中所見被整個地強調(diào)顯示,但是強調(diào)顯示方式不限于此,并且例如預定項目612的部分能夠如圖80所見以另外方式強調(diào)顯示。
這里,在圖80所示的顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611中,顯示了包含五個項目“帳號”、“科目”“銀行名字/分理處名字”、“接受者”及“款額”的信息的圖象數(shù)據(jù)。
當要輸入?yún)R款數(shù)據(jù)時,光標指示器616被移動到所希望的一個數(shù)據(jù)輸入顯示部分615,并且對應的匯款數(shù)據(jù)輸入到所希望的一個項目612的圖象數(shù)據(jù)部分。這時,如圖80中所見,所希望的項目612的圖象數(shù)據(jù)部分以強調(diào)顯示部分613被強調(diào)顯示(在“銀行名字/分理處名字(Fujitsu銀行)”的位置),并在光標指示器616移動時,如圖81和82中所見強調(diào)顯示部分613也在圖象數(shù)據(jù)顯示區(qū)域611中移動。
要注意,雖然在圖82中強調(diào)顯示的是項目612的字符“接受者(Ichiro Yamada)”,但是如圖83中所見,另外也可以對整個項目612強調(diào)顯示。
進而,例如如圖84中所見,文件的圖象數(shù)據(jù)能夠另外對各個信息在顯示單元630上顯示。
這里,在圖84所示的顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611中,顯示了包含七個項目“銀行名字”、“分理處名字”、“帳號”、“科目”、“款額”、“接受者”及“客戶”的信息的圖象數(shù)據(jù)。
類似地,當要顯示匯款數(shù)據(jù)時,光標指示器616移動到所希望的數(shù)據(jù)輸入顯示區(qū)域部分616,并且對應的匯款數(shù)據(jù)輸入到所希望的項目612′的圖象數(shù)據(jù)部分。這時,如圖84中所見所希望的項目612′的圖象數(shù)據(jù)部分以強調(diào)顯示部分613(“科目(1)”的位置)被強調(diào)顯示,并在光標指示器616移動時,如圖85中所見,強調(diào)顯示部分613也在圖象數(shù)據(jù)顯示區(qū)域611中移動。
而且在文件的圖象數(shù)據(jù)這樣顯示之處,能夠達到本實施例的類似的那些優(yōu)點。
要注意,雖然如圖80到85所示在數(shù)據(jù)輸入顯示區(qū)域部分615中沒有顯示出圖象數(shù)據(jù)字符識別的結(jié)果,但是這里自然能夠按其它方式顯示。
進而,雖然在本實施例中,由圖象數(shù)據(jù)輸入裝置閱讀銀行中所使用的文件并且作為圖象數(shù)據(jù)在一個顯示單元之類的屏幕上顯示,但是數(shù)據(jù)媒體不限于此,而是某些其它類型的數(shù)據(jù)(例如一個名單)也可由圖象數(shù)據(jù)輸入裝置閱讀并作為圖象數(shù)據(jù)在一個顯示單元之類的屏幕上顯示。而且這時,也可達到類似于本實施例的優(yōu)點。
此外,雖然本實施例中操作者目視地觀察讀取的圖象數(shù)據(jù)并進行輸入操作,例如當文件由圖象數(shù)據(jù)輸入裝置閱讀文件時,字符識別能夠以另外方式自動地進行,同時操作者僅對于包含被誤識別的或者不能成功識別的字符的項目進行輸入操作。
在采用上述結(jié)構(gòu)之處,能夠達到本實施例那些類似的優(yōu)點,并且此外能夠顯著減少輸入操作所需的勞務和時間。
(2)讀取的符號顯示-識別信息修改裝置的說明在上節(jié)(1)中詳細說明的圖象數(shù)據(jù)顯示裝置640中,由于圖象數(shù)據(jù)的編輯和顯示是以包含多個字符的項目單元進行的,當要對自動字符識別的結(jié)果是正確還是錯誤進行確認時,通過目視觀察從相繼出現(xiàn)在圖象數(shù)據(jù)中的不同字符中進行對應于被識別的確認對象的字符的字符選擇。因而,由于眼睛的移動和涉及許多比較對象,對于正確與錯誤之間的確認操作可能需要許多勞務和時間。
因而,這種情形下,付款請求處理能夠使用如圖86所示的那種讀取符號顯示-識別信息修改裝置進行。
例如,讀取符號顯示-識別信息修改裝置740取得其上作為圖象寫有諸如款項類別和要支付的款額的付款數(shù)據(jù)的文件,并通過自動字符識別轉(zhuǎn)換付款數(shù)據(jù)的圖象為代碼信息以進行付款請求處理。然而,是由操作者使用鍵盤之類對在轉(zhuǎn)換時不能識別或者誤識別的字符(字符包括數(shù)字。這類似地適用于以下的說明)進行修改。
這里,讀取符號顯示-識別信息修改裝置740對應于圖6中所示的數(shù)據(jù)媒體處理裝置30的客戶機10,并且在它連接到圖6所示的服務器39之處,它的作用是作為一個工作站進行對不能識別的字符或者誤識別的字符的修改處理,這類似于對于由連接到服務器39的集中化的字符識別處理部分6進行的圖象字符識別的結(jié)果,并向服務器39輸出修改的結(jié)果。
為此目的,如圖86所示,讀取符號顯示-識別信息修改裝置740包括一個作為圖象移動部分的圖象閱讀器721,一個作為數(shù)據(jù)輸入裝置的鍵盤722,一個硬盤723,一個作為符號識別裝置的計算機主機724和一個顯示單元725。
圖象閱讀器721閱讀全區(qū)域的圖象P,該圖象是具有諸如其上寫出例如圖98所示的付款數(shù)據(jù)的文件上的數(shù)字或者字符的符號信息的圖象,并向計算機主機724輸入作為數(shù)字、字符之類的圖象信息的符號圖象信息的全區(qū)域的圖象P。
要注意,雖然該符號圖象信息是由最小組成單元的的數(shù)字或者字符單元組成,但是它不限于此,并且能夠使用數(shù)字和/或字符集合作為組成單元。進而,多個這種全區(qū)域圖象P能夠被聚集保持。
鍵盤722由操作者人工操作輸入作為正確答案數(shù)據(jù)的適當?shù)拇a數(shù)據(jù),該數(shù)據(jù)對應于沒有被成功地自動識別或者被誤識別的符號圖象信息。
進而,顯示單元725顯示從圖象閱讀器由721在閱讀圖象狀態(tài)所輸入的符號圖象信息,并包括一個不能識別的符號圖象信息顯示區(qū)域732A,一個符號圖象信息顯示區(qū)域733A,一個相關(guān)符號圖象信息顯示區(qū)域733B,及一個正確答案數(shù)據(jù)顯示區(qū)域733C。
不能識別的符號圖象信息顯示區(qū)域732A與其周圍的符號圖象信息一同顯示沒有成功被自動識別的符號圖象信息,并對于這種不能識別的符號圖象信息采用取得顯示,使得它能夠從周圍的符號圖象信息被標識出。例如,在圖101的屏幕A中,“1.′?′(拒絕字符)”所示的“2034”中的“3”是不能識別的符號圖象信息,而“2”、“0”和“4”對應于周圍的符號圖象信息。
符號圖象信息顯示區(qū)域733A在一個要轉(zhuǎn)換為代碼信息的圖象中顯示最小組成單元的符號圖象信息,這是按照由符號圖象信息的轉(zhuǎn)換所獲得的代碼信息表示的符號信息的對應關(guān)系顯示的。
特別地,例如對于數(shù)字,從圖101的屏幕A可見,作為通過劃分一個圖象所獲得的最小組成單元的符號圖象信息,提供了對應于“0”到“9”的區(qū)域,并且相同的符號顯示在相同的區(qū)域,其方式是表示“1”的符號圖象信息都顯示在對應于“1”的區(qū)域中,以便能夠減少眼睛的移動。
相關(guān)符號圖象信息顯示區(qū)域733B是這樣構(gòu)造的,例如當通過參照字符行的前后字符能夠易于對自動字符識別的結(jié)果的正確和錯誤之間進行確認和修改時,圍繞按強調(diào)顯示的符號信息的圖象信息響應例如鍵盤722的參照鍵的按動而被顯示以供參照。例如,在圖103的屏幕F中,“1175”的“7”為按強調(diào)顯示的符號圖象信息,而“1”、“1”和“5”是圍繞它的圖象信息。
正確答案數(shù)據(jù)顯示區(qū)域733C顯示從鍵盤722作為正確答案輸入的適當?shù)拇a數(shù)據(jù)。例如,在圖103的屏幕中,表示出“7”是被輸入的。
進而,圖86所示的讀取符號顯示-識別信息修改裝置740包括上述的硬盤723。硬盤723作用是作為定義信息存儲部分用于存儲讀取的指定信息作為定義信息。要注意,讀取的指定信息表示有關(guān)全區(qū)域圖象P的劃分以及作為代碼數(shù)據(jù)的識別的信息。
圖86所示的計算機主機724功能是作為符號識別裝置(計算機主機724以下可稱為符號識別裝置724),并識別從圖象閱讀器721輸入的圖象符號的圖象信息,轉(zhuǎn)換該符號的圖象信息為代碼數(shù)據(jù),進行符號圖象的預定處理并在顯示單元725上顯示該圖象。
圖86和87所示作為符號識別裝置的計算機主機724包括一個作為符號識別部分的字符識別部分726,一個讀取符號圖象顯示控制部分727,一個作為正確答案數(shù)據(jù)顯示裝置的正確答案數(shù)據(jù)顯示部分728,一個作為最小組合單元符號圖象信息抽取部分的字符圖象抽取處理部分729,一個作為最小組合單元符號圖象顯示看錯部分的字符圖象顯示處理部分730,一個作為相關(guān)符號圖象顯示裝置的相關(guān)符號圖象顯示部分731,一個作為識別信息修改裝置的識別信息修改部分752,以及一個相關(guān)信息產(chǎn)生部分741。
字符識別部分726識別由圖象閱讀器721所讀取的圖象中的符號圖象信息,并轉(zhuǎn)換它為對應的代碼信息。字符識別部分726具有類似于例如字符識別裝置之類的功能。
字符識別部分726參照由圖象閱讀裝置721所讀取的全區(qū)域圖象P或存儲在硬盤723上的讀指定信息(定義信息)以產(chǎn)生識別字符信息S。
識別字符信息S表示由字符識別部分726識別的字符的代碼數(shù)據(jù)并如圖99中所見由“項目名稱”、“項目列數(shù)”和“識別結(jié)果”表示。
“項目名稱”對應于圖98的全區(qū)域圖象P中的“水價格”及“電費帳單”并具有項目“SUI-1到SUI-4”及“DEN-1到DEN-4”。
“項目列數(shù)”是一個項目的列的數(shù)目,并在這時設定為使得可輸入六個字符和/或數(shù)字?!白R別結(jié)果”表示識別為字符的代碼數(shù)據(jù)的代碼信息。要注意,從與另外所示的正確答案數(shù)據(jù)相比可見,“SUI-1”和“SUI-4”識別的結(jié)果分別是該識別為不可能和該識別有錯誤。
當符號圖象信息沒有成功地被轉(zhuǎn)換為對應的代碼信息時,讀符號圖象顯示控制部分727在顯示單元725上與讀取的圖象狀態(tài)中的未識別的符號圖象信息相關(guān)符號圖象信息一同顯示這一未識別的沒有成功轉(zhuǎn)換的符號圖象信息。
特別地,讀符號圖象顯示控制部分727在顯示單元725上顯示即沒有被字符識別部分726識別也沒有被成功轉(zhuǎn)換為對應的代碼信息的符號圖象信息,該信息是作為未識別的符號圖象信息與位于未識別的符號圖象信息周圍的相關(guān)的符號圖象信息一同在未識別的符號圖象信息顯示區(qū)域732A中以讀取的圖象狀態(tài)顯示的。
進而,讀取的符號圖象顯示控制部分727包括一個強調(diào)顯示部分727A作為強調(diào)顯示裝置用于強調(diào)顯示未識別的符號圖象信息,以便使得易于由操作者識別出未識別的符號圖象信息。
讀符號圖象顯示控制部分727還包括一個強調(diào)顯示改變部分727B作為強調(diào)顯示改變裝置,用于如果正確答案數(shù)據(jù)由正確答案數(shù)據(jù)顯示部分728顯示在顯示單元725上不同于未識別的符號圖象信息顯示區(qū)域732A的正確答案數(shù)據(jù)顯示區(qū)域733C中,則改變已經(jīng)強調(diào)顯示的未識別的符號圖象信息的顯示為表示完成修改的另一種強調(diào)顯示。
字符圖象抽取處理部分729抽取圖象中最小組合單元的符號圖象信息,以轉(zhuǎn)換為用于最小組合單元符號圖象信息每一片的代碼信息。
特別地,字符圖象抽取處理部分729劃分并抽取其最小組合單元例如為數(shù)字或字符的符號圖象信息為以數(shù)字或字符為單元的信息并作為這樣的信息,并參照存儲在硬盤723上的全區(qū)域圖象P或者讀指定信息(定義信息)以產(chǎn)生相關(guān)信息R。
字符圖象信息和相關(guān)信息R通過執(zhí)行圖91所示的流程圖的步驟B1″到B8″而產(chǎn)生。
特別地,全區(qū)域圖象P劃分為字符單元以產(chǎn)生字符圖象信息(步驟B1″),并取得全區(qū)域圖象P上的字符圖象信息的位置(文件上的位置)信息(步驟B2″)。
然后,鑒別字符圖象信息是否指定給預定的項目(水價格,電費帳單等),并如果字符圖象信息指定給預定的項目,則字符圖象信息對于各個項目被分類(步驟B4″),并設置各個圖象信息在各個項目中的位置信息(步驟B5″)。
在字符圖象信息沒有指定給預定的項目之處,它對于有關(guān)作為項目的行的各個項目被分類(步驟B6″),并設置各個項目中的字符圖象信息的位置信息(步驟B7″)。
使用這樣設置的各個項目中的字符圖象信息的位置信息產(chǎn)生相關(guān)信息R(步驟B8″)。要注意,相關(guān)信息R具有與被識別的字符相關(guān)的識別字符信息。
字符圖象顯示處理部分730具有引起由字符圖象抽取處理部分729所抽取的最小組成單元的符號圖象信息(例如以數(shù)字或者字符為單元的圖象信息)按照與通過符號圖象信息轉(zhuǎn)換所獲得的代碼信息所代表的符號信息的對應關(guān)系而顯示的功能,并具有引起相同類型的多片最小組合單元的符號圖象信息按照與與通過符號圖象信息轉(zhuǎn)換所獲得的代碼信息所代表的符號信息的對應關(guān)系而顯示的功能。
具體來說,例如字符圖象顯示處理部分730引起通過由字符圖象抽取處理部分729所抽取的“1”的圖象信息的轉(zhuǎn)換所獲得的代碼信息,顯示在在顯示單元725上“0”到“9”等多個符號被顯示的符號圖象信息顯示區(qū)域733A的部分內(nèi)“1”這個符號信息要被顯示的部分處。
字符圖象顯示處理部分730包括一個作為用于僅對于所希望的一個符號圖象信息進行強調(diào)顯示的強調(diào)顯示裝置的強調(diào)顯示部分730A,使得易于識別當前正在被處理的圖象信息。
進而,如果由作為數(shù)據(jù)輸入裝置的鍵盤722的操作而輸入正確答案數(shù)據(jù),則作為強調(diào)顯示改變裝置的強調(diào)顯示改變部分730B進行另一個強調(diào)顯示,該強調(diào)顯示表示對于已經(jīng)按強調(diào)方式被強調(diào)的一個符號的信息的修改的完成,以使得在修改之前該符號圖象信息與修改之后該符號圖象信息之間易于識別。
在顯示單元725上相關(guān)的符號圖象顯示部分731一同顯示符號圖象的信息與讀取的圖象狀態(tài)中的符號圖象信息相關(guān)的符號信息。
具體來說,在顯示單元725上的相關(guān)符號圖象信息顯示區(qū)域733B中,相關(guān)符號圖象顯示部分731一同顯示一個符號圖象的信息與位于讀取的圖象狀態(tài)的符號圖象信息周圍的相關(guān)的符號圖象信息,并當通過例如參照字符行中先前的和隨后的字符而能夠?qū)ψ址詣幼R別的結(jié)果的修改的正確和錯誤之間易于進行確認時,則顯示供參照而被強調(diào)顯示的圖象信息周圍的圖象信息。
進而,相關(guān)符號圖象顯示部分731包括作為強調(diào)顯示裝置用于對符號圖象的信息進行強調(diào)顯示的一個強調(diào)顯示部分731A,并使得易于從相關(guān)的符號圖象信息識別。
如果正確答案數(shù)據(jù)通過鍵盤722的操作輸入,則正確答案顯示部分728引起正確答案數(shù)據(jù)被顯示在顯示單元725上的正確答案數(shù)據(jù)顯示區(qū)域733C中,該區(qū)域是不同于符號圖象信息顯示區(qū)域733A及相關(guān)符號圖象信息顯示區(qū)域733B的一個區(qū)域。
進而,如果從鍵盤722輸入對于不能識別的符號圖象信息或者誤識別的符號圖象信息的正確答案數(shù)據(jù),則識別信息修改部分752寄存正確答案數(shù)據(jù)作為正確答案代碼數(shù)據(jù)以實現(xiàn)對不能識別的符號圖象信息或者誤識別的符號圖象信息的修改,并如圖88中所見包括一個修改信息取得處理部分742和修改結(jié)果反映處理部分743。
相關(guān)信息產(chǎn)生部分741參照相關(guān)信息R和識別字符信息S以產(chǎn)生具有識別字符信息的相關(guān)信息R′。
如圖100中所見,相關(guān)信息R′表示多個字符信息的“全區(qū)域圖象上的位置和尺寸”,“對應的字符項目名稱”,“對應的項目圖象名稱”,“項目內(nèi)列位置”,“識別字符”,“字符識別信息中的位移”和“修改完成標志”。
這里,“全區(qū)域圖象上的位置和尺寸”表示全區(qū)域圖象P上的字符圖象信息的位置信息并以比特單位表示。
“對應的字符項目名稱”表示字符圖象信息所屬的項目(諸如“SUI-1到SUI-4”)?!皩捻椖繄D象名稱”表示字符圖象信息所屬的項目,并對應于“對應的字符項目名稱”(諸如“SUI-1到SUI-4”)。
例如,雖然圖99所示的項目“SUI-1”對應于識別字符信息“1050”,但它包含圖100中所見的字符圖象1到4的信息并具有“ISUI-1”的圖象名稱。
此外,“項目內(nèi)列位置”表示在一個項目中字符圖象信息的位置?!白R別字符”表示表示字符信息S,并表示識別位置“1”在項目中第三列位置,“0”在第四列位置,“5”在第五列位置,并且“0”第六列位置。
進而,雖然在圖100中“修改完成標志”都是“OFF”,當對不能識別的字符或誤識別的字符進行修改時,對應于字符圖象的信息的“修改完成標志”則變?yōu)椤癘N”使得表示出對其修改已經(jīng)進行。
要注意,字符圖象信息也由“字符識別信息中的位移”信息定義。
相關(guān)信息R’由諸如圖92中所示的處理產(chǎn)生。
首先,對于由項目和/或行表示的各個位置信息對識別字符信息S進行分類(步驟C1′),而被分類的識別字符信息S加到對應的相關(guān)信息R上(步驟C2′)。然后,鑒別識別字符信息S的項目和/或行內(nèi)字符的數(shù)目是否在相關(guān)信息R的項目或者行內(nèi)字符數(shù)目之內(nèi)(步驟C3′)。進而鑒別識別字符信息S的項目和/或行的數(shù)目是否在相關(guān)信息R的項目或者行數(shù)目之內(nèi)(步驟C4′)。然后基于該鑒別,更新相關(guān)信息R以產(chǎn)生相關(guān)信息R′。
實際上,讀符號顯示-識別信息修改裝置740是通過向計算機主機724裝設適當?shù)挠布?gòu)成的,這些硬件能夠向硬盤提供上述功能部分,諸如字符識別部分726,讀符號圖象顯示控制部分727,字符圖象抽取處理部分729,字符圖象顯示處理部分730,相關(guān)符號圖象顯示部分731,正確答案數(shù)據(jù)圖象顯示部分728以及相關(guān)信息產(chǎn)生部分741。
根據(jù)本實施例具有上述結(jié)構(gòu)的讀符號顯示-識別信息修改裝置740操作方式如下。
供閱讀的對象文件的全區(qū)域圖象P由圖87所示的圖象閱讀裝置721產(chǎn)生,并且全區(qū)域圖象P轉(zhuǎn)換為字符圖象信息,并應用讀指定信息(定義信息)由符號識別裝置724產(chǎn)生相關(guān)信息R′。
當應用相關(guān)信息R′字符圖象信息顯示在顯示單元上時,顯示單元725上的初始屏幕如圖101的屏幕A那樣。
這時,作為拒絕字符和位于該拒絕字符周圍的“2034”和“1201”顯示在不能識別的符號圖象信息顯示區(qū)域732A中,并且表示“0”到“9”的字符圖象顯示在符號圖象信息顯示區(qū)域733A中“0”到“9”的區(qū)域中。
要注意,顯示在不能識別的符號圖象信息顯示區(qū)域732A中的“2034”以寬框強調(diào)顯示,以便指示這些字符是修改對象,并且作為不能識別的字符的拒絕字符“3”以斜線強調(diào)顯示。類似地,在不能識別的符號圖象信息顯示區(qū)域732A中顯示的“1201”中,作為不能識別的字符的拒絕字符“2”以斜線強調(diào)顯示。
這里,如圖101到104中所示這種字符圖象信息的顯示是由圖87中所示的符號識別這種724進行的,并且將參照圖93說明這時的操作流程。
首先,符號識別這種724取得全區(qū)域圖象P(步驟D1″),并復制相關(guān)信息R′且對其按識別字符信息S的順序分類(步驟D2″)。
鑒別該識別字符是否為不能識別的拒絕字符(步驟D3″),并如果它為拒絕字符,則符號識別裝置724取得圍繞它的和/或一個項目的字符圖象信息并在不能識別的符號圖象信息顯示區(qū)域732A中顯示該信息(步驟D4″)。要注意,步驟D1″到D4″的操作按這種拒絕字符的數(shù)目重復(步驟D5″)。
另一方面,當識別字符不是拒絕字符時,符號識別裝置724在符號圖象信息顯示區(qū)域733A的對應區(qū)域中顯示該字符圖象信息(步驟D6″),并且步驟D6″的操作按識別字符的數(shù)目重復(步驟D7″)。
如果操作者使用鍵盤722在圖101所示的初始屏幕A那樣的狀態(tài)輸入“3”作為正確答案數(shù)據(jù),則“3”正確答案數(shù)據(jù)顯示區(qū)域733C中,并然后例如如果按動確定鍵,則如屏幕B上所示,顯示在不能識別的符號圖象信息顯示區(qū)域732A中的作為在“2034”的拒絕字符的“3”的位置的強調(diào)顯示從斜線顯示變?yōu)榫W(wǎng)格強調(diào)顯示,這指示拒絕字符已經(jīng)被修改。識別字符信息S與此一同被修改,并且相關(guān)信息R′被更新。
進而,在屏幕B上,相應指示“2034”中的拒絕字符“3”已經(jīng)被修改的網(wǎng)格強調(diào)顯示的變化,寬框的強調(diào)顯示自動地施加到下一個修改對象的“1201”上。
進而,如果在上述屏幕B的那種狀態(tài)下,操作者使用鍵盤722輸入“2”作為正確答案數(shù)據(jù),則“2”顯示在正確答案數(shù)據(jù)顯示區(qū)域733C中。然后,如果按動確定鍵,則顯示在不能識別的符號圖象信息顯示區(qū)域732A中作為在“1201”的拒絕字符的“2”的位置的強調(diào)顯示從斜線顯示變?yōu)榫W(wǎng)格強調(diào)顯示,這指示拒絕字符已經(jīng)被修改。識別字符信息S對此響應而被修改,并且相關(guān)信息R′被更新。
順便來說,在顯示在符號圖象信息顯示區(qū)域733A的“0”到“9”區(qū)域中表示“0”到“9”字符圖象的任何一個為不同之處,即在字符圖象信息被誤識別之處,例如如果操作者按動鍵盤722的Tab鍵,則寬框的強調(diào)顯示從“1.′?′(即將字符)”移動到顯示單元725的“2.′0′”的區(qū)域,如圖102中所見。
進而,如果重復按動tab鍵,則如圖103的屏幕E中所見寬框的強調(diào)顯示移動到“3.′1′”區(qū)域。重復這樣作,表示修改對象的寬框強調(diào)顯示相繼在顯示單元725中移動。
特別地,當寬框的強調(diào)顯示要在“0”到“9”的區(qū)域之間移動時,按動tab鍵以選擇所希望的字符圖象的信息,并在圖103的屏幕E上作為誤識別的結(jié)果而顯示的字符圖象信息“7”(即“7”的圖象已經(jīng)被轉(zhuǎn)換為“1”的代碼信息)以寬框強調(diào)顯示。
這里,在“7”的字符圖象信息是正確還是錯誤不能由其自身易于辨別之處,如果如圖89所見操作者按動鍵盤722的參照鍵,則從如圖103屏幕所見,作為相關(guān)符號圖象顯示裝置的相關(guān)符號圖象顯示部分731參照相關(guān)信息R′在相關(guān)符號圖象顯示區(qū)域733B顯示參照圖象。
如果,在上述屏幕F這種狀態(tài)下,操作者使用鍵盤722輸入“7”作為正確答案數(shù)據(jù)并按動確定鍵,則“7”顯示在正確答案數(shù)據(jù)顯示區(qū)域733C中,并且“7”的字符圖象信息的代碼信息從誤識別的“1”修改為“7”,如圖104中所見。然后,表示這種修改已經(jīng)進行的網(wǎng)格強調(diào)顯示施加到“7”的字符圖象信息上。
特別地,識別字符信息S和相關(guān)信息R′被更新,并且指示修改已經(jīng)進行的的強調(diào)顯示施加到“7”的修改的字符圖象信息上。
這里,如圖89中所示的參照圖象顯示處理如以上所述由相關(guān)符號圖象顯示部分731進行,并且將參照圖97說明這時的操作流程。
首先,鑒別參照圖象是否被顯示(步驟H1′)。如果參照圖象沒有被顯示,則相關(guān)符號圖象顯示部分731檢索按強調(diào)顯示的相關(guān)對象的字符圖象信息的相關(guān)信息R′(步驟H2′)。
然后,取得圍繞相關(guān)對象和/或項目的字符圖象信息的圖象信息(步驟H3′),并且設置參照圖象要顯示的位置為使得參照圖象不會覆蓋按強調(diào)顯示的相關(guān)對象的字符圖象信息的位置(步驟H4′)。然后,顯示參照圖象(步驟H5′)。
要注意,如果在參照圖象顯示時再次按動參照鍵,則參照圖象被刪除(步驟H6′)。
這里,通過圖87和88中所示的相關(guān)信息獲取處理部分742與相關(guān)結(jié)果反映處理部分743,以及作為強調(diào)顯示改變裝置的強調(diào)顯示改變部分727B,進行對于如圖101到104中所見的字符圖象信息的這種修改,以下將參照圖94到96說明這時的操作流程。
如圖88中所見,如果操作者通過鍵盤722輸入正確答案數(shù)據(jù),則該正確答案數(shù)據(jù)作為修改信息輸入到修改信息獲取處理部分742,而修改結(jié)果反映處理部分743使用修改信息和相關(guān)信息R′產(chǎn)生識別字符信息S,并修改與更新相關(guān)信息R′。同時,強調(diào)顯示改變部分727B參照修改信息向已經(jīng)被修改的項目施加指示這種修改的強調(diào)顯示。
這時,如圖94中所見輸入屏幕被顯示(步驟E1″)那樣,修改信息獲取處理部分742鑒別識別字符是否為不能識別的字符的拒絕字符(步驟E2″)。如果識別字符為拒絕字符,則修改信息獲取處理部分742向外圍和/或項目圖象信息施加表示該外/圍項目圖象信息為供修改的拒絕項目的寬框強調(diào)顯示(步驟E3″),并向作為識別字符的該拒絕字符施加不同于寬框的斜線式的另一種強調(diào)顯示(步驟E4″)。
反之,如果識別字符不是拒絕字符,則寬框的強調(diào)顯示施加到該字符圖象信息(步驟E5″)。
這里,例如如果由操作者操作鍵盤722按動TAB鍵或參照鍵(用于在由TAB鍵移動方向相反方向上移動光標的鍵)(步驟E6”),則指示修改對象的寬框的強調(diào)顯示被移動而使得下一個字符圖象信息能夠被表示為修改對象(步驟E7″)。如果寬框的強調(diào)顯示移動到最后的字符圖象信息,然后這一操作由第一字符圖象信息開始進行(步驟E8″)。
要注意,如果按動其它鍵,則向修改信息產(chǎn)生部分741報告修改信息(步驟E9″)。
另一方面,圖88所示的修改結(jié)果反映處理部分743,如圖95中所見,檢索按強調(diào)顯示的字符圖象信息的相關(guān)信息R′(步驟F1″),修改識別字符(不能識別的字符或者誤識別字符)(步驟F2″),修改相關(guān)信息R′的識別字符(步驟F3″),并顯示或刪除參照圖象(步驟F4″)。
進而,圖88所示的強調(diào)顯示修改部分727B如圖96中所見取得修改信息(步驟G1″)并施加表示修改已經(jīng)進行的強調(diào)顯示(步驟G2″)。
如上所述,由讀符號顯示-識別信息修改裝置740對字符圖象信息的顯示與修改以及參照圖象的顯示,如圖90中所見,是通過以下步驟進行的獲取作為全區(qū)域圖象P的圖象數(shù)據(jù)(步驟A1″),抽取字符圖象信息(步驟A2″),獲取識別字符圖象信息(步驟A3″),產(chǎn)生相關(guān)信息(步驟A4″),顯示字符圖象信息(步驟A5″),獲取修改信息(步驟A6″),按動數(shù)據(jù)鍵或參照鍵(步驟A7″),響應世界鍵的按動而反映修改結(jié)果(步驟A8″),強調(diào)顯示修改的字符圖象信息(步驟A9″),以及由計算機主機724響應參照鍵的按動而顯示參照圖象(步驟A10″),并且這一處理是對于所有被顯示的字符圖象信息進行的(步驟A11″)。
這樣,使用根據(jù)本實施例的讀符號顯示-識別信息修改裝置740,沒有被計算機主機724成功地識別的不能識別的字符的圖象信息,在讀取的圖象狀態(tài)下在顯示單元725上圍繞不能識別的字符與字符圖象信息一同顯示,并且向不能識別的字符的圖象信息施加強調(diào)顯示。于是,的讀符號顯示-識別信息修改裝置740的優(yōu)點在于,通過參照字符行中前后的字符圖象信息,能夠進行高精確度的確認操作,并能夠降低正確與錯誤之間的確認操作所需的勞務和時間。
進而,使用使用根據(jù)本實施例的讀符號顯示-識別信息修改裝置740,如果對應于不能識別的字符或者誤識別的字符的正確答案數(shù)據(jù)通過操作鍵盤722輸入,則正確答案數(shù)據(jù)顯示在顯示單元725上,并且直到現(xiàn)在被強調(diào)強調(diào)顯示的不能識別的字符或者誤識別的圖象信息以表示完成修改的不同的強調(diào)顯示而被顯示。于是,該讀符號顯示-識別信息修改裝置740的優(yōu)點在于,能夠易于辨別一個字符對其一個不能識別的字符的輸入或者對一個誤識別的字符的修改已經(jīng)進行與另一個字符對其這種操作沒有進行,于是提高了目視可辨別性而防止了被操作者雙重修改等,從而顯著降低了正確和錯誤之間的確認操作所需的勞務和時間。
此外,使用根據(jù)本實施例的讀符號顯示-識別信息修改裝置740,符號能夠以易于進行目視觀察的單位被顯示,使得只有相同的符號顯示在顯示單元上相同的區(qū)域中,并只向所希望的一個字符圖象的信息施加強調(diào)顯示。于是,讀符號顯示-識別信息修改裝置740的優(yōu)點在于,操作者只要參照圖象信息而無需參照相關(guān)的外圍字符圖象的信息即能夠確認識別結(jié)果為正確或者錯誤,于是能夠顯著減少操作者眼睛的移動,其優(yōu)點還在于能夠把強調(diào)顯示僅施加到正在被處理的字符圖象信息以減少比較對象,并且顯著降低了正確和錯誤之間的確認操作所需的勞務和時間。
進而,使用根據(jù)本實施例的讀符號顯示-識別信息修改裝置740,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于其中顯示如上述的一個字符圖象信息和與該字符圖象信息相關(guān)的周圍字符圖象信息的區(qū)域。于是,讀符號顯示-識別信息修改裝置740的優(yōu)點在于,能夠通過目視觀察對字符圖象信息和輸入的正確答案數(shù)據(jù)進行再確認,于是降低了正確和錯誤之間的確認操作所需的勞務和時間,此外確認操作能夠以高精確度進行。
要注意,雖然本實施例中,當要修改不能識別的字符或者誤識別的字符時,對于不能識別的字符或者誤識別的字符所輸入的正確答案數(shù)據(jù)顯示在顯示單元725的正確答案數(shù)據(jù)顯示區(qū)域733C中,不能識別的字符或者誤識別的字符能夠以另外的方式被修改而不必對不能識別的字符或者誤識別字符顯示正確答案,或者另外只對于不能識別的字符和誤識別的字符之一的正確答案能夠被顯示以修改不能識別的字符或者誤識別的字符。
進而,雖然本實施例中,如圖98中所見的那種表格格式的文件用作為其上描述存入數(shù)據(jù)的文件,都是其上描述存入數(shù)據(jù)的文件不限于此,而是可使用任何其它格式的文件。
(b)對本發(fā)明該實施例的修改的說明(b1)根據(jù)對該實施例的第一修改的文件識別裝置的說明圖105是表示根據(jù)對本發(fā)明的該實施例的第一修改的文件識別裝置。而且圖105所示的文件識別裝置能夠由以下裝置組成圖象數(shù)據(jù)閱讀裝置811,計算機812(這一計算機812包括如下所述的一個輸入部分812-1,一個顯示單元812-2,及一個控制部分812-3),以及類似于上述圖115的硬盤的一個硬盤813(參照標號1001,1002和1003)。
圖象數(shù)據(jù)閱讀裝置811閱讀文件的圖象數(shù)據(jù),并對于這一圖象數(shù)據(jù)閱讀裝置811能夠使用類似于參照圖115上述的一個光學字符閱讀裝置(OCR裝置),一個圖象掃描器等。
基于由圖象數(shù)據(jù)閱讀裝置811所讀取的文件的圖象數(shù)據(jù),控制部分812-3進行作為文件數(shù)據(jù)的處理,并能夠由作為CPU和存儲器的計算機812的功能部分形成。
進而,類似于參照圖115前面所述的部分,控制部分812-3連接到諸如鍵盤或鼠標等輸入部分(參照在以下將說明的圖106的標號812-1),該輸入部分用于由操作者輸入數(shù)據(jù)、指令等到控制部分812-3,并連接到一個顯示單元(參照在以下將說明的圖106的標號812-2),該顯示單元用于顯示由圖象數(shù)據(jù)閱讀裝置811所閱讀的圖象數(shù)據(jù)等。
硬盤(文件存儲器)813存儲所有由圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù)。
順便來說,如圖105所示,控制部分812-3在功能上包括一個圖象數(shù)據(jù)截取部分815,一個文件標識字典部分816,一個數(shù)據(jù)比較部分817,一個閾值設定部分818,一個文件鑒別部分819,一個定義尺寸部分820,一個定義存儲表821,一個字符識別部分822,及一個字符識別結(jié)果存儲部分823。
圖象數(shù)據(jù)存儲器814存儲由圖象數(shù)據(jù)閱讀裝置811曾經(jīng)讀取的文件的圖象數(shù)據(jù)。圖象數(shù)據(jù)截取部分815具有作為文件標識信息抽取裝置的功能并形成一抽取對象,該抽取裝置用于響應基于由操作者進行的輸入部分812-1的操作的信息指令(標識信息),從存儲在圖象數(shù)據(jù)存儲器814的文件的圖象數(shù)據(jù)抽取在文件上描述的所希望的文件標識信息。
當上述的圖象數(shù)據(jù)截取部分815從標識信息抽取所需的文件標識信息時,由圖象數(shù)據(jù)閱讀裝置811讀取的文件的圖象數(shù)據(jù)顯示(投影)在顯示單元812-2上,并且操作者能夠基于顯示在顯示單元812-2上的圖象數(shù)據(jù)指令標識信息。
要注意,作為通過圖象數(shù)據(jù)截取部分815構(gòu)成抽取對象的信息,例如通過軟件或固件處理操作者能夠指令例如任何所述的信息,諸如字符信息,標記,文件上描述的印章或劃線,并且圖象數(shù)據(jù)截取部分815自動地抽取被指令的信息的坐標位置信息,所述信息大小信息及數(shù)據(jù)信息,作為文件標識信息。
進而,文件標識字典部分(文件標識字典)816記錄由圖象數(shù)據(jù)截取部分815作為特定文件的文件標識所抽取文件標識信息。
更具體來說,如圖108所見,加有ID號碼′0101′文件類型A的文件標識信息存儲在區(qū)域816a中,而加有ID號碼′0102′文件類型B的文件標識信息存儲在區(qū)域816b中。
于是,作為從通過圖象數(shù)據(jù)閱讀裝置811所讀取的特定文件的圖象數(shù)據(jù)抽取寫在文件上的標識信息并向文件標識字典部分816記錄文件標識信息的記錄步驟的操作是由上述圖象數(shù)據(jù)存儲器814,圖象數(shù)據(jù)截取部分815及文件標識字典部分816進行的。
要注意,雖然當文件標識信息要被記錄到文件標識字典部分816時,由上述的圖象數(shù)據(jù)閱讀裝置811所讀取的文件的圖象數(shù)據(jù)一度存儲到圖象數(shù)據(jù)存儲器814中,但是由圖象數(shù)據(jù)閱讀裝置所閱讀的所有文件的圖象數(shù)據(jù)是存儲到硬盤813上的。
數(shù)據(jù)比較部分817具有作為校驗裝置的功能,用于讀出存儲在圖象數(shù)據(jù)存儲器814中的特定文件的圖象數(shù)據(jù)并校驗該特定文件的圖象數(shù)據(jù)是否包含存儲在文件標識字典部分816中記錄的文件標識信息,并還具有作為參照裝置的功能,用于檢測由圖象數(shù)據(jù)閱讀裝置811所讀取的并存儲在圖象數(shù)據(jù)存儲器814中的任意文件的圖象數(shù)據(jù)是否包含存儲在文件標識字典部分816中的文件標識信息,從而簡化了裝置的結(jié)構(gòu)。
進而,文件鑒別部分819具有作為鑒別裝置的功能,用于鑒別特定文件的識別是否能夠基于由作為校驗裝置的數(shù)據(jù)比較部分817所校驗的結(jié)果進行以便鑒別該特定文件是否已經(jīng)被完全確定為一個文件,并具有作為文件標識裝置的另一個功能,用于基于由作為參照裝置的比較部分所進行的參照的結(jié)果辨別任意一個文件是否為一個特定的文件,從而簡化了裝置的結(jié)構(gòu)。
更具體來說,作為校驗裝置的數(shù)據(jù)比較部分817,從文件標識字典部分816一個接一個圖象地從存儲在硬盤813有關(guān)所有文件的圖象數(shù)據(jù),相繼抽取由圖象數(shù)據(jù)截取部分815按文件的圖象數(shù)據(jù)為單元所抽取的信息,以及對應的文件標識信息,并對比檢驗這些信息。作為鑒別裝置的文件鑒別部分819,基于來自數(shù)據(jù)比較部分817的文件標識信息對比檢驗的結(jié)果,而鑒別該文件是否能夠被唯一無誤地確定。
進而,作為參照裝置的數(shù)據(jù)比較部分817對由圖象數(shù)據(jù)截取部分815從由圖象數(shù)據(jù)閱讀裝置811輸入的圖象數(shù)據(jù)所抽取的信息,與來自文件標識字典部分816對應的文件標識信息進行對比檢驗,以便計算相符的程度。作為文件鑒別裝置的文件鑒別部分819對于來自數(shù)據(jù)比較部分817的文件標識信息與來自閾值設定部分818的閾值進行比較,以鑒別從圖象數(shù)據(jù)閱讀裝置811所輸入的圖象數(shù)據(jù)的文件是否能夠被辨別。
于是,進行作為鑒別特定文件的識別是否可能的檢驗步驟的操作,并通過上述的文件標識字典部分816,數(shù)據(jù)比較部分817,閾值設置部分818和文件鑒別部分819進行作為鑒別任意文件是否為特定文件的操作步驟的操作。
換言之,上述的記錄步驟對應于圖3的<當布局第一次出現(xiàn)時>的處理(布局分析處理A2,操作者處理A6及布局學習處理A8),而上述的檢驗步驟和操作步驟對應于圖3的<當布局再次出現(xiàn)時>的處理(布局分析處理A9,布局對比檢驗處理A10,和操作者處理A13)。
要注意,在基于來自上述閾值設定部分818的閾值信息由文件的鑒別部分819進行一致性鑒別時,來自上述閾值設定部分818的閾值信息設定為這樣的程度,即使得鑒別的進行能夠吸收在圖象數(shù)據(jù)閱讀注重811的閱讀操作時的誤差,文件自身的打印誤差等等。
當文件鑒別部分819鑒別有關(guān)任意文件為特定文件時,即當系統(tǒng)操作時文件識別部分819成功地識別出其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置811讀取的文件是一個對應于記錄在文件識別字典部分816中的文件標識信息的特定文件時,定義存儲部分820從定義存儲表821讀出用于文件上所描述的數(shù)據(jù)的識別的定義信息,并在其中存儲該定義信息一次。
定義存儲表821存儲定義信息(例如,閱讀位置信息,字符屬性信息,閱讀列數(shù)等等),該信息要用于對應于記錄在文件標識字典部分816中文件標識信息的一個特定文件上所描述的內(nèi)容的字符識別。
字符識別部分822接收存儲在上述圖象數(shù)據(jù)存儲器814中的圖象數(shù)據(jù),且該數(shù)據(jù)與已經(jīng)成功地被標識為記錄在文件標識字典部分816中的一個特定文件的文件及對應于來自定義存儲部分820的圖象數(shù)據(jù)的定義信息相關(guān),并且字符識別部分822根據(jù)該定義信息進行該圖象數(shù)據(jù)的字符識別處理。
進而,字符識別結(jié)果存儲部分823存儲由字符識別部分822所識別的字符信息。
以下就上述的記錄步驟,檢驗步驟和操作步驟,說明根據(jù)具有上述結(jié)構(gòu)的本發(fā)明該實施例的第一修改的文件標識裝置的的操作。
·記錄步驟中的處理的說明首先,以下參照標出了記錄步驟中的操作的圖106中所示的控制框圖以及表示在圖107和圖108中所示的記錄步驟中的操作的流程圖,說明根據(jù)本實施例的文件標識裝置在記錄步驟中的操作。
具體來說,如圖108中所見,如果響應操作者的操作由圖象數(shù)據(jù)閱讀裝置811閱讀電費繳納通知文件824B的圖象數(shù)據(jù)(圖107的步驟B1″′),則所讀取的圖象數(shù)據(jù)一度存儲到圖象數(shù)據(jù)存儲裝置814中(圖107的步驟B2″′),并且該圖象數(shù)據(jù)也存儲到硬盤813使得由圖象數(shù)據(jù)閱讀裝置811讀取的所有圖象數(shù)據(jù)被存儲(圖107的步驟B3″′)。要注意,如圖108中所見由圖象數(shù)據(jù)閱讀裝置811讀取的圖象數(shù)據(jù)顯示在顯示單元812-2上(圖107的步驟B4″′)。
這里,在存儲在圖象數(shù)據(jù)存儲器814和硬盤813中的圖象數(shù)據(jù)為有關(guān)對于第一時間所讀取的一個文件的圖象數(shù)據(jù)之處,文件標識信息存儲到如下所述的文件標識字典部分816中。
具體而言,在操作者參照顯示單元812-2并操作輸入部分812-1時,構(gòu)成抽取對象的多片信息被指令到圖象數(shù)據(jù)截取部分815(圖107的步驟B5″′)。
圖象數(shù)據(jù)截取部分815從存儲在圖象數(shù)據(jù)存儲器814中的文件的圖象數(shù)據(jù)中自動地抽取文件上所描述的信息中的位置信息,尺寸信息及數(shù)據(jù)信息(圖107的步驟B6″′),并作為文件的標識信息記錄這些信息到文件標識字典部分816(圖107的步驟B″′)。
例如,如圖108中所見,操作者操作輸入部分812-1指定表示繳納通知的繳納款項內(nèi)容的“電費”為第一信息,并指定表示付費人的姓名的“Ichiro Fuji”為第二信息。于是,圖象數(shù)據(jù)截取部分815存儲上述第一信息的位置信息,尺寸信息和數(shù)據(jù)信息,并抽取第二信息的位置信息,尺寸信息和數(shù)據(jù)信息。
因而,所抽取的文件824B的文件標識信息作為其ID號碼為“0102”的B類文件的文件標識信息存儲到文件標識字典部分816的區(qū)域816b。
要注意,在根據(jù)本修改的文件標識裝置中,由圖象數(shù)據(jù)截取部分815所截取的圖象數(shù)據(jù)通常僅用于文件的標識。
進而,在根據(jù)本修改的文件標識裝置中,通過記錄多片關(guān)于一個文件的文件標識信息,無需進行以上如(a5)特征數(shù)據(jù)識別處理中所述的圖象數(shù)據(jù)的歸一化處理,而能夠在以下所述的的檢驗步驟和操作步驟標識一個文件。
·檢驗步驟中的處理的說明接下來,以下將參照標出檢驗步驟操作的圖109中所示的控制框圖和表示檢驗步驟中的操作的圖110中所示的流程圖,說明根據(jù)本實施例的文件標識裝置在檢驗步驟中的操作。
如上所述,在記錄步驟,文件表示信息記錄到文件表示字典部分816。然后,進行作為檢驗步驟的操作,在該步驟使用記錄在文件標識字典部分816中的文件標識信息,檢驗存儲在硬盤816上的所有文件的圖象是否能夠確定性地被標識。
具體而言,使用在記錄步驟硬盤813操作時所存儲的及記錄在文件標識字典部分816中的所有文件的圖象(全部文件的圖象),對于一個文件的每一圖象與記錄在文件標識字典部分816中的文件標識信息進行對比檢驗。
更具體來說,來自硬盤813的文件的圖象通過圖象數(shù)據(jù)存儲器814輸出到圖象數(shù)據(jù)截取部分815(圖110的步驟C1″′),并且圖象數(shù)據(jù)截取部分815基于文件標識字典部分816中的對應文件的文件標識信息的位置信息和尺寸信息抽取用于對比檢驗的數(shù)據(jù)。
數(shù)據(jù)比較部分817接收來自圖象數(shù)據(jù)截取部分815的對比檢驗數(shù)據(jù)和作為來自文件標識字典部分816的文件標識信息的數(shù)據(jù)信息(圖110的步驟C2″′和C3″′),并且參照它們之間數(shù)據(jù)的一致程度進行比較和對比檢驗(圖110的步驟C4″′)。
文件鑒別部分819接收來自數(shù)據(jù)比較部分817的結(jié)果和來自閾值設定部分818的閾值,并當所有文件標識信息的一致性程度在閾值范圍之內(nèi)時,由于數(shù)據(jù)彼此吻合,故文件鑒別部分819鑒別出從硬盤813所抽取的文件的類型能夠被唯一確定,并記錄該確定的文件類型(從步驟C5″′的YES路線到步驟C6″′)。
另一方面,當來自數(shù)據(jù)比較部分817的文件標識信息的某些一致性程度不在閾值范圍之內(nèi)時,則數(shù)據(jù)彼此不吻合,故鑒別出文件的類型不能被確定(從步驟C5″′的NO路線到步驟C7″′)。然后,如果上述的處理沒有對于文件標識字典部分816的所有文件類型完成,則對于記錄在文件標識字典部分816中下一個文件類型的文件標識信息進行類似的處理(從步驟C7″′的NO路線到步驟C2″′)。于是,除非對于所有的文件類型確定了文件,不進行在步驟C6″′的處理。
然后,對于存儲在硬盤813中的所有類型的文件圖象按類似于上述方式進行文件標識信息的一致性程度的鑒別(步驟C8″′)。
進而,如果存儲在硬盤813中的所有類型的文件圖象已經(jīng)成功地確定為各個不同的文件,則判定檢驗為OK,并且作為檢驗步驟的操作而結(jié)束(從步驟C9″′的YES路線到步驟C10″′)。然而在任何其它情形下,判定存儲在文件標識字典部分816中的文件標識信息有缺陷,并且有缺陷的文件報告給操作者以便請求對于文件再指定文件標識信息(從步驟C9″′的NO路線到步驟C11″′)。
于是,如果在記錄步驟之后從硬盤再次輸入特定文件的圖象數(shù)據(jù),并由數(shù)據(jù)比較部分817檢驗該輸入的特定文件是否包含記錄在文件標識字典部分816中的文件標識信息,由圖象數(shù)據(jù)截取部分815能夠鑒別該特定文件的識別是否為可能。
·操作步驟操作的說明接下來,參照標注出操作步驟的操作的圖111中所示的控制框圖以及表示操作步驟中的操作的圖112中所示的流程圖,將說明根據(jù)本實施例的文件標識裝置在操作步驟中的操作。
如上所述,在檢驗步驟中,使用記錄在文件標識字典部分816中的文件標識信息,檢驗存儲在硬盤813上的所有文件的圖象是否能夠被確定。在檢驗結(jié)束之后,在裝置的實際操作中,對于任意一個文件的圖象數(shù)據(jù)進行諸如下述的確定文件類型的操作步驟的操作。
具體而言,如果一定的文件的圖象數(shù)由操作者通過圖象數(shù)據(jù)閱讀裝置811的操作而被閱讀(圖112的步驟D1″′),則所讀取的圖象數(shù)據(jù)一度存儲到圖象數(shù)據(jù)存儲器814中(圖112的步驟D2″′)。
然后,基于構(gòu)成一定的文件的類型的文件標識信息的位置信息和尺寸信息,圖象數(shù)據(jù)截取部分815從多個位置抽取并截取一度存儲在圖象數(shù)據(jù)存儲器814中的圖象數(shù)據(jù)(標識信息)(步驟D3″′和D4″′)。
然后,數(shù)據(jù)比較部分817計算由圖象數(shù)據(jù)截取部分815所截取的所有圖象數(shù)據(jù)的數(shù)據(jù)信息與構(gòu)成該文件的標識信息的數(shù)據(jù)信息之間的一致性程度以實現(xiàn)比較和鑒別(步驟D5″′)。
進而,文件鑒別部分819比較作為來自數(shù)據(jù)比較部分817的比較和鑒別的結(jié)果而計算的一致性程度與對于一致性程度在閾值設定部分818中所設定的標準,以便鑒別從由圖象數(shù)據(jù)閱讀裝置811所讀取的圖象數(shù)據(jù)與來自文件標識字典部分816的文件標識信息是否能夠確定文件的類型(步驟D6″′)。
具體來說,當?shù)谝晃募愋虯的圖象數(shù)據(jù)從圖象數(shù)據(jù)閱讀裝置811讀取,同時第二文件類型B的文件標識信息用作為構(gòu)成比較對象的來自文件標識字典816文件標識信息時,鑒別不一致性,并且使用關(guān)于來自文件標識字典部分816的另一文件類型的文件標識信息進行一致程度的鑒別(從步驟D3″′的NO路線經(jīng)過步驟D8″′的NO路線到步驟D3″′)。
另一方面,例如,當?shù)谝晃募愋虯的圖象數(shù)據(jù)從圖象數(shù)據(jù)閱讀裝置811讀入時,如果來自文件標識字典部分816的構(gòu)成比較對象的文件標識信息是關(guān)于第一文件類型A的信息,則對于該文件標識信息鑒別鑒別一致性,并且讀入的圖象數(shù)據(jù)確定為相關(guān)文件類型。這時所確定的文件類型存儲到控制部分812-3中未示出的一個存儲器中(從步驟D″′的YES路線到D7″′)。
要注意,在由上述的文件鑒別部分819進行鑒別時,如果由圖象數(shù)據(jù)截取部分815所截取的多個位置的圖象數(shù)據(jù)任何之一與來自文件標識字典部分816的文件標識信息不相符,則它被鑒別為不同類型的文件。
然后基于存儲在文件標識字典部分816的所有各個類型的文件的文件標識信息,對來自由上述圖象數(shù)據(jù)閱讀部分811所讀取圖象數(shù)據(jù)的文件標識信息的一致性程度進行類似于上述鑒別的的鑒別(步驟D8″′)。
這里,如果由圖象數(shù)據(jù)閱讀部分811所讀取圖象數(shù)據(jù)已經(jīng)由上述一致性程度鑒別成功地確定為一個文件類型的數(shù)據(jù),則所確定的文件類型輸出到定義存儲部分820(參照圖105)(從步驟D9″′的YES路線到步驟D10″′)。
然而,如果該圖象數(shù)據(jù)沒有被確定為一個文件類型的數(shù)據(jù),則例如借助于顯示單元812-2向操作者報告文件確定失敗(從步驟D9″′的NO路線到步驟D11″′)。
要注意,如果確定為一個類型的文件類型輸入到定義存儲部分820,則定義存儲部分820從定義存儲表821讀出對應于所確定的文件類型的定義信息(讀位置信息,字符屬性信息,讀列數(shù)目等等)。
于是,字符識別部分822識別其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置811讀取并存儲在圖象數(shù)據(jù)存儲器814中的文件上所描述的定義信息和字符信息,并作為識別的結(jié)果存儲該字符信息到字符識別結(jié)果存儲部分823。
于是當特定文件已經(jīng)在檢驗步驟被成功地識別時,通過借助于圖象數(shù)據(jù)閱讀裝置811閱讀任意文件的圖象數(shù)據(jù)并參照任意文件的圖象數(shù)據(jù)以檢測該圖象數(shù)據(jù)是否包含記錄在文件標識字典部分816中的文件標識信息,能夠標識該任意文件是否為特定文件并可進行字符識別。
這樣,使用根據(jù)本發(fā)明的該實施例的第一修改的文件標識裝置,由于它包含圖象數(shù)據(jù)閱讀裝置811,圖象數(shù)據(jù)存儲器814,硬盤813,圖象數(shù)據(jù)截取部分815,文件標識字典部分816,數(shù)據(jù)比較部分817及文件鑒別部分819,在該裝置操作中,能夠自動地標識其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置811讀取的文件的類型。于是,即使要由圖象數(shù)據(jù)閱讀裝置811讀取的多種類型文件以混合狀態(tài)出現(xiàn),操作者無需知道每一文件的定義而能夠處理這些文件。于是,該文件識別裝置的優(yōu)點在于能夠達到工作的高效率。該文件識別裝置的優(yōu)點還在于,用于標識文件本身的ID號碼等無需在文件上說明而可使用普通的文件,于是該文件標識裝置能夠易于用于現(xiàn)有的系統(tǒng)。
進而,在向文件標識字典部分816記錄文件識別信息時,只要操作者指定該信息同時目視觀察投影在顯示單元812-2上的供記錄的對象文件的圖象數(shù)據(jù)即能夠自動地取得必要的文件標識信息。于是,易于產(chǎn)生用于文件標識的字典,并能夠達到在工作效率的改進。
進而,由于該文件標識裝置包含作為檢驗裝置的數(shù)據(jù)比較部分817和作為鑒別裝置的文件鑒別部分819,故能夠檢驗由操作者所指定的文件標識信息是否正確。于是,該文件標識裝置的優(yōu)點在于,完全消除了文件標識中的錯誤并改進了裝置的可靠性。
進而,在操作者指令一個文件中多個位置作為標識信息之處,能夠比基于指定單個位置時的標識信息那樣所抽取的文件標識信息更高的精度從基于標識信息所抽取的文件標識信息而標識文件。
(b2)根據(jù)該實施例的第二修改的文件標識裝置的說明圖113是表示根據(jù)本發(fā)明該實施例第二修改的文件標識裝置的一個框圖,并具體示出其中標注出記錄標注操作的控制框圖。
圖113中所示的文件標識裝置具有基本上與參照圖105上述文件標識裝置類似的結(jié)構(gòu),所不同之處在于,文件標識信息抽取裝置包含一個自動標題部分抽取部分815a,自動項目標題部分抽取部分815b和文件標識信息截取部分815c。
自動科目部分抽取部分815a自動地抽取有關(guān)存儲在圖象數(shù)據(jù)存儲器814中的文件被視為科目部分的圖象數(shù)據(jù)部分的位置信息(例如參照作為示于圖108中上述第一文件標識信息的′電費率′)。
自動項目標題部分抽取部分815b自動地從存儲在圖象數(shù)據(jù)存儲器814中的有關(guān)一個文件的圖象數(shù)據(jù)抽取一個項目部分的位置信息。
基于來自自動科目部分抽取部分815a和自動項目標題部分抽取部分815b的位置信息,文件標識信息截取部分815c從存儲在圖象數(shù)據(jù)存儲器814中的圖象數(shù)據(jù)截取科目部分和項目部分尺寸信息及作為文件標識信息的數(shù)據(jù)信息。
使用具有上述結(jié)構(gòu)根據(jù)本發(fā)明該實施例的第二修改的文件標識裝置,作為類似于上述實施例的記錄標步驟的操作,如果圖象數(shù)據(jù)閱讀裝置811響應操作者的操作而讀取一個文件的圖象數(shù)據(jù)(圖114的步驟E1″′),那么圖象數(shù)據(jù)存儲器814存儲一度存儲所讀取的圖象數(shù)據(jù)(圖114的步驟E2″′),并且該圖象數(shù)據(jù)還存儲到硬盤813使得由圖象數(shù)據(jù)一度裝置811所讀取的所有圖象數(shù)據(jù)被存儲(圖114的步驟E3″′)。
然后,自動科目部分抽取部分815a自動地抽取似乎是文件科目的部分的位置信息(圖114的步驟E4″′),并且自動項目標題部分抽取部分815b自動地抽取劃線項目中所描述的項目標題的位置信息(圖114的步驟E5″′)。
基于來自上述自動科目部分抽取部分815a和自動項目標題部分抽取部分815b的位置信息,文件標識信息截取部分815c抽取尺寸信息和數(shù)據(jù)信息(圖114的步驟E6″′),并記錄位置信息和尺寸信息以及對應于該位置信息作為文件標識信息的數(shù)據(jù)信息到文件標識字典部分816(圖114的步驟E7″′)。
要注意,檢驗步驟或操作步驟中的操作基本上類似于上述實施例的操作。
于是,使用上述參照圖105文件標識裝置,雖然操作者根據(jù)本實施例參照顯示單元812-2并操作輸入部分812-1指定用于文件標識信息抽取的標識信息,但是特定文件上所描述的特定文件標識信息能夠自動地從由圖象數(shù)據(jù)閱讀裝置811所讀取的特定文件的圖象數(shù)據(jù)抽取并記錄到文件標識字典部分816。于是,其中的優(yōu)點在于,操作者的操作效率能夠顯著改進。
要注意,在上述參照圖113的實施例中,雖然使用科目部分和項目部分作為用于文件標識信息抽取的標識信息,但是此外文件的任何其它部分(固定信息部分)也可使用。
(b3)其它在上述本發(fā)明該實施例的修改中,作為檢驗裝置的數(shù)據(jù)比較部分817和作為鑒別裝置的文件鑒別部分819進行檢驗步驟的操作,這操作的進行是通過在記錄步驟之后當特定文件的圖象數(shù)據(jù)再次輸入時檢驗輸入的特定文件的圖象數(shù)據(jù)是否包含記錄在文件標識字典部分816中的文件標識信息以便鑒別該特定文件的識別是否可能。然而,即使省略檢驗步驟的操作,至少在裝置的操作中,由于其圖象數(shù)據(jù)由圖象數(shù)據(jù)閱讀裝置811讀取的文件的類型能夠被自動地標識,即使要由圖象數(shù)據(jù)閱讀裝置811讀取的多個類型文件混合狀態(tài)出現(xiàn),操作者也能夠處理這些文件而無需知道每一文件的定義。于是,其中的優(yōu)點在于,科研改進工作效率。進而,用于標識文件本身的ID號碼等不需要在文件上描述,于是能夠使用普通的文件。于是另一個優(yōu)點在于,易于用于現(xiàn)有的系統(tǒng)。
進而,在記錄文件標識信息到文件標識字典816時,只要如果操作者在觀察投影到顯示單元812-2上的供記錄的對象文件的圖象數(shù)據(jù)時進行指定,則能夠自動地取得必要的文件標識信息。于是,易于產(chǎn)生用于文件之間的標識的字典,并能夠達到工作效率的改進。
如上所述,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置和數(shù)據(jù)媒體處理方法適用于處理例如金融機構(gòu)中的文件,并特別地,由于能夠自動地處理具有各種格式的文件諸如私人文件等,故該數(shù)據(jù)媒體處理裝置和數(shù)據(jù)媒體處理方法被認為有很高的可使用性。
權(quán)利要求
1.一種數(shù)據(jù)媒體處理方法,其特征在于,當包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)被顯示在顯示單元(630)上時,僅強調(diào)顯示對應于某一個項目的圖象數(shù)據(jù)的一部分。
2.一種數(shù)據(jù)媒體處理方法,其特征在于,當對應于所期望的項目之一(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)要以下述這樣一種狀態(tài)被輸入時,所述狀態(tài)為包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)被顯示在顯示單元(630)上的圖象數(shù)據(jù)顯示區(qū)域(611)中,如果光標指示(616)被顯示在所述顯示單元(630)上的、與所述圖象數(shù)據(jù)顯示區(qū)域(611)分開設置的項目顯示區(qū)域(614)的所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分之一(615)上,則僅強調(diào)顯示對應的所期望項目(612)的圖象數(shù)據(jù)部分。
3.一種數(shù)據(jù)媒體處理方法,其特征在于,當對應于所期望的項目之一(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)要以下述這樣一種狀態(tài)被輸入時,所述狀態(tài)為包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)被顯示在顯示單元(630)上的圖象數(shù)據(jù)顯示區(qū)域(611)中,如果光標指示(616)被顯示在顯示單元(630)上的、與所述圖象數(shù)據(jù)顯示區(qū)域(611)分開設置的項目顯示區(qū)域(614)的所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分之一(615)上,則僅強調(diào)顯示對應的所期望項目(612)的圖象數(shù)據(jù)部分;以及然后當對應于另外一個項目(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)要被輸入時,如果所述光標指示(616)從所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分(615)移動到一個不同的項目數(shù)據(jù)輸入顯示區(qū)域部分(615),則所期望項目(612)的對應圖象數(shù)據(jù)部分的強調(diào)顯示被刪除,而該不同項目(612)的對應圖象數(shù)據(jù)部分則被強調(diào)顯示。
4.一種數(shù)據(jù)媒體處理方法,其特征在于,當對應于顯示在顯示單元(630)上的所期望的項目之一(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)要以下述這樣一種狀態(tài)被輸入時,所述狀態(tài)為包含多個項目的信息的數(shù)據(jù)媒體的部分圖象數(shù)據(jù)被顯示在顯示單元(630)上的圖象數(shù)據(jù)顯示區(qū)域(611)中,如果光標指示(616)被顯示在所述顯示單元(630)上的、與所述圖象數(shù)據(jù)顯示區(qū)域(611)分開設置的項目顯示區(qū)域(614)的所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分之一(615)上,則僅強調(diào)顯示對應的所期望項目(612)的圖象數(shù)據(jù)部分;以及當此后要輸入對應于沒有被顯示在所述顯示單元(630)上的一個不同項目(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)時,如果所述光標指示(616)從所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分(615)移動到一個不同的項目數(shù)據(jù)輸入顯示區(qū)域部分(615),則所期望項目(612)的對應圖象數(shù)據(jù)部分的強調(diào)顯示被刪除,同時進行滾屏,使得不同項目(612)的圖象數(shù)據(jù)部分能夠被顯示在所述顯示單元(630)的所述圖象數(shù)據(jù)顯示區(qū)域(611)中,以便在所述顯示單元(630)的所述圖象數(shù)據(jù)顯示區(qū)域(611)中顯示該不同項目(612)的圖象數(shù)據(jù)部分,并且強調(diào)顯示該不同項目(612)的對應的圖象數(shù)據(jù)部分。
5.一種數(shù)據(jù)媒體處理裝置,其特征在于它包括圖象數(shù)據(jù)輸入裝置(621,621A,621B),用于輸入包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù);顯示單元(630),具有圖象數(shù)據(jù)顯示區(qū)域(611)以及具有多個項目數(shù)據(jù)輸入顯示區(qū)域部分(615)的項目顯示區(qū)域(614);顯示控制裝置(629),用于使通過所述圖象數(shù)據(jù)輸入裝置(621,621A,621B)所獲得的圖象數(shù)據(jù)被顯示在所述圖象數(shù)據(jù)顯示區(qū)域(611)中,并且用于當對應于所期望的項目之一(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)要由數(shù)據(jù)輸入裝置(631)輸入時,使光標指示(616)被顯示在所述項目顯示區(qū)域(614)中的所期望的所述項目數(shù)據(jù)輸入顯示區(qū)域部分之一(615)上;以及圖象數(shù)據(jù)部分強調(diào)顯示裝置(624),用于當光標指示(616)由所述顯示控制裝置(629)以下述一種狀態(tài)顯示在所述項目顯示區(qū)域(614)中的所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分之一(615)上時,其中所述狀態(tài)為包含多個項目的信息的圖象數(shù)據(jù)顯示在所述顯示單元(630)的所述圖象數(shù)據(jù)顯示區(qū)域(611)中,使得僅強調(diào)顯示所期望項目(612)的對應圖象數(shù)據(jù)部分。
6.如權(quán)利要求5中所述的數(shù)據(jù)媒體處理裝置,其特征在于,所述顯示控制裝置(629)除了包括所述圖象數(shù)據(jù)部分強調(diào)顯示裝置(624)之外,還包括圖象數(shù)據(jù)強調(diào)顯示刪除裝置(625),用于當所述光標指示(616)通過光標移動操作裝置(631)移動到不同于所期望的項目數(shù)據(jù)輸入顯示區(qū)域部分(615)的另一個項目數(shù)據(jù)輸入顯示區(qū)域部分(615)時,刪除對應于該項目(612)的圖象數(shù)據(jù)部分的強調(diào)顯示;以及強調(diào)顯示轉(zhuǎn)移控制裝置(626),用于控制所述圖象數(shù)據(jù)部分強調(diào)顯示裝置(624),使得響應于所述圖象數(shù)據(jù)強調(diào)顯示刪除裝置(625),而僅強調(diào)顯示對應于該不同項目數(shù)據(jù)輸入顯示區(qū)域部分(615)的不同項目(612)的圖象數(shù)據(jù)部分。
7.如權(quán)利要求5中所述的數(shù)據(jù)媒體處理裝置,其特征在于,所述顯示控制裝置(629)除了包括所述圖象數(shù)據(jù)部分強調(diào)顯示裝置(624)、圖象數(shù)據(jù)強調(diào)顯示刪除裝置(625)及強調(diào)顯示轉(zhuǎn)移控制裝置(626)之外,還包括顯示滾屏裝置(627),用于使沒有被顯示在所述顯示單元(630)上的圖象數(shù)據(jù)部分顯示在所述顯示單元(630)上。
全文摘要
本發(fā)明公開了一種數(shù)據(jù)媒體處理方法和裝置。在該數(shù)據(jù)媒體處理方法中,當包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)被顯示在顯示單元上時,僅強調(diào)顯示對應于某一個項目的圖象數(shù)據(jù)的一部分。
文檔編號G06K9/20GK101030255SQ20061015175
公開日2007年9月5日 申請日期1996年7月30日 優(yōu)先權(quán)日1995年7月31日
發(fā)明者江口真一, 勝又裕, 千葉亙一, 松野秀樹, 永野義博, 牛田和秀, 鐮田英夫, 松橋智浩, 稻岡秀行, 渡部英一, 直井聰, 坂根俊司, 小原勝利, 山本一范, 渡邊和人, 木嶋順之, 山崎芳則, 町田泰孝 申請人:富士通株式會社