專利名稱:文書識別裝置和信件分檢機(jī)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及使用文字識別技術(shù)讀取并解釋記載在紙面上的文字信息的文書識別裝置和使用該文書識別裝置的信件分檢機(jī)。
以往,在使用文字識別技術(shù)讀取用文字串表示的紙面上的文字信息時(shí),是按照從左到右(從上到下)的順序一個(gè)字一個(gè)字地讀取該文字串的。并且,根據(jù)該讀取結(jié)果,在比方說表示地址信息時(shí)就依次給出(日本的場合)縣名、市鎮(zhèn)村名、街道號碼、門牌號碼、房間號碼等解釋。其中,為了對街道號碼、門牌號碼、房間號碼給出解釋,使用與它們相關(guān)的標(biāo)記的知識是很有效的,如日本專利公報(bào)“住所讀取裝置和方法”(特開平8-234505)所公開的那樣。這里,簡單地描述一下它的內(nèi)容。作為街道號碼的例子,雖然“1-2”、“1番2號”、“一番二號”是不同的標(biāo)記,但是,卻全部表示相同的住所。只要能判別紙面上的地址信息與哪種標(biāo)記對應(yīng),就可以提高讀取精度,這是很容易想象的。因此,為了使用這些標(biāo)記知識,預(yù)先將表示標(biāo)記圖形的文字串保持在詞典中,將該標(biāo)記圖形與一個(gè)字一個(gè)字地讀取的結(jié)果進(jìn)行對照,從而給出對街道號碼和房間號碼的解釋。與上述“1-2”、“1番2號”、“一番二號”對應(yīng)的標(biāo)記圖形為“N-N”、“N番N號”、“K番K號”。這里,“N”是表示數(shù)字的通配符符號,“K”是表示漢字?jǐn)?shù)字的通配符符號?!?”、“番”、“號”是將英文數(shù)字串分開的分離符號。
作為應(yīng)用這樣的文書識別裝置的領(lǐng)域之一,有采用信件分檢機(jī)進(jìn)行郵件分揀的業(yè)務(wù)。在該業(yè)務(wù)中,除了地址中的鎮(zhèn)域名外,為了確定街道號碼、門牌號碼、房間號碼等住所,必須全部讀取所需要的文字信息,重新排列為郵件的投遞人進(jìn)行投遞的順序。以往,該業(yè)務(wù)全部是由人手進(jìn)行的,隨著使用信件分檢機(jī)的機(jī)械化,可以壓縮人工費(fèi)和解決人手不足的問題。
另一方面,由于分檢機(jī)不能讀取的郵件還得由人手進(jìn)行分檢,所以,這部分工作將增加人工費(fèi)用。因此,提高信件分檢機(jī)的地址信息的讀取率,對降低投遞成本是非常重要的。特別是10萬件郵件的1%就是1000件,提高讀取精度所帶來的降低成本的效果是非常高的。因此,街道號碼、門牌號碼、房間號碼的高識別率在信件分檢機(jī)的領(lǐng)域具有非常重要的意義。
但是,在信件的地址名中,存在下列影響高精度的識別率的標(biāo)記上的問題。
(1)文字圖形間的空白在信件地址中,如
圖1(1)所示的那樣,為了表現(xiàn)街道號碼與房間號碼的分界,使文字圖形間的間隔比周圍的文字分得開,存在在該處存在空白的標(biāo)記。在打字時(shí),文字多數(shù)是按等間距書寫的,所以,該空白信息的檢測很容易。但是,如(2)所示的那樣用手寫時(shí),文字圖形的間距及大小的變化很大,所以,在文字圖形間是否存在空白的信息就不一定明確。因此,在檢測到存在空白時(shí),判斷數(shù)字之間是否分離并讀取正確的地址信息是非常困難的。
(2)換行在信件地址名中,如圖1(3)所示的那樣,為了表現(xiàn)街道號碼與房間號碼的分界,有時(shí)也使用換行標(biāo)記。另一方面,如(4)的例子所示的那樣,在無意分界的地方同樣也存在被強(qiáng)制地?fù)Q行的情形。這樣的例子,在直接郵寄的信件中是常見的標(biāo)記,在1行的文字?jǐn)?shù)超過一定值時(shí),就強(qiáng)制地?fù)Q行來打印住所。因此,在地址標(biāo)記中存在換行的信息時(shí),根據(jù)換行來判斷數(shù)字之間是否分離并讀取正確的地址信息是非常困難的。
因此,本發(fā)明的目的旨在高精度地讀取街道號碼、門牌號碼、房間號碼,解決以下2個(gè)問題(1)在識別裝置根據(jù)文字圖形間的空白信息的解釋和使用該信息的地址的高精度識別文字圖形間的間距及文字大小檢測到在該處存在空白的信息時(shí),必須判斷該信息是否可以解釋為就是用于分離街道號碼、門牌號碼、房間號碼的分離信息。
本發(fā)明的目的在于,在解釋中存在不確定性時(shí),就建立是分離信息和不是分離信息兩方面的假說,并在以后的處理中進(jìn)行驗(yàn)證,從而實(shí)現(xiàn)高精度的識別方式。
(2)換行信息的解釋和使用該信息對地址的高精度識別識別裝置根據(jù)文字圖形間的相對位置關(guān)系檢測到在該處存在行信息時(shí),必須判斷該信息是否可以解釋為就是用于分離街道號碼、門牌號碼、房間號碼的分離信息。本發(fā)明的目的在于,在解釋中存在不確定性時(shí),就建立是分離信息和不是分離信息兩方面的假說,并在以后的處理階段進(jìn)行驗(yàn)證,從而實(shí)現(xiàn)高精度的識別的方式。
為了解決上述問題,本發(fā)明提供了一種將記錄在紙張上的地址信息變換為數(shù)字圖像數(shù)據(jù)并使用該數(shù)字圖像數(shù)據(jù)根據(jù)關(guān)于地址信息的知識數(shù)據(jù)庫進(jìn)行地址信息的識別的文書識別裝置,其特征在于具有輸入上述數(shù)字圖像數(shù)據(jù)并從輸入的圖像中分割出文字行信息進(jìn)而分割出文字信息進(jìn)行識別并對分割出的各文字圖形輸出識別候補(bǔ)文字群的文字識別單元;通過將從文字識別單元輸出的識別候補(bǔ)文字群與存儲城鎮(zhèn)域名信息的街道域名詞典進(jìn)行對照來識別城鎮(zhèn)域名同時(shí)檢測在分割出的文字行中估計(jì)是書寫了街道號碼、門牌號碼、房間號碼的區(qū)域的開頭或末尾的城鎮(zhèn)域名識別單元;從上述街道號碼估計(jì)區(qū)域的開頭或末尾根據(jù)未處理的各文字圖形間的相對的幾何關(guān)系生成用于將文字串之間分離的分離信息假說的幾何分離信息假說生成單元;從上述街道號碼估計(jì)區(qū)域的開頭或末尾將與未處理的各文字圖形對應(yīng)的候補(bǔ)文字群中的英文數(shù)字變換為用表示任意的英文數(shù)字的通配符符號置換后的候補(bǔ)文字群的通配符變換單元;輸入通配符變換單元的輸出和上述幾何分離信息假說生成由上述通配符符號表現(xiàn)的街道號碼、門牌號碼、房間號碼的標(biāo)記圖形時(shí)生成將幾何分離信息假說作為表示圖形中的分離信息使用的標(biāo)記圖形假說和不作為分離信息使用的標(biāo)記圖形假說的標(biāo)記圖形羈生成單元;將從上述標(biāo)記圖形假說生成單元輸出的標(biāo)記圖形假說與從文字識別單元輸出的候補(bǔ)文字群進(jìn)行對照并將標(biāo)記圖形中的通配符符號復(fù)原為原來的候補(bǔ)文字從而輸出街道號碼、門牌號碼、房間號碼的文字串候補(bǔ)的文字串候補(bǔ)生成單元;和將從上述城鎮(zhèn)域名識別單元輸出的識別結(jié)果與從上述文字串復(fù)原單元輸出的街道號碼、門牌號碼、房間號碼組合生成表示住所的文字串和表示與其對應(yīng)的住所的住所代碼以及判斷該住所代碼在地址號碼詞典中是否存在并輸出存在的候補(bǔ)的地址號碼對照單元。
另外,本發(fā)明的特征還在于標(biāo)記圖形假說生成單元具有使用自動裝置將把用上述通配符符號表現(xiàn)的街道號碼、門牌號碼、房間號碼等各種標(biāo)記圖形作為單詞文字串保持的標(biāo)記圖形單詞詞典與通配符變換單元的輸出結(jié)果和標(biāo)記圖形單詞詞典存儲的單詞進(jìn)行對照并輸出多個(gè)標(biāo)記圖形單詞假說的標(biāo)記圖形單詞對照單元和在文字串中存在上述幾何分離信息假說的位置將從上述標(biāo)記單詞對照單元輸出的標(biāo)記圖形單詞假說之間連接生成街道號碼、門牌號碼、房間號碼標(biāo)記圖形假說時(shí)分別生成對連接的單詞假說間賦予分離信息的屬性的標(biāo)記圖形假說和不賦予分離信息的屬性的標(biāo)記圖形假說的標(biāo)記圖形單詞綜合單元。
另外,本發(fā)明的特征在于在識別記錄在郵件上的地址信息并根據(jù)識別結(jié)果按不同地址進(jìn)行分檢的信件分檢機(jī)中,作為用于識別上述地址信息的裝置具有上述結(jié)構(gòu)的文書識別裝置。
圖1是表示街道號碼、門牌號碼、房間號碼標(biāo)記的示例圖。
圖2是表示文書識別裝置的基本功能結(jié)構(gòu)圖。
圖3是表示地址名文字信息的示例圖。
圖4是表示文字行分割結(jié)果的示例圖。
圖5是表示文字分割假說網(wǎng)絡(luò)的示意圖。
圖6是表示城鎮(zhèn)域名識別數(shù)據(jù)流的示意圖。
圖7是表示與所選擇的路徑對應(yīng)的文字候補(bǔ)網(wǎng)格圖。
圖8是表示城鎮(zhèn)域名知識的示例圖。
圖9是表示使用有限自動裝置的單詞對照的示意圖。
圖10是表示單詞候補(bǔ)網(wǎng)格的形式的例子的示意圖。
圖11是表示街道號碼、門牌號碼、房間號碼識別處理流程圖。
圖12是表示幾何分離信息抽出結(jié)果的示例圖。
圖13是表示帶幾何分離信息屬性的網(wǎng)格的示例圖。
圖14是表示通配符變換規(guī)則的示意圖。
圖15是表示通配符網(wǎng)格的示意圖。
圖16是表示街道號碼、門牌號碼、房間號碼的標(biāo)記圖形知識的示例圖。
圖17是表示使用有限自動裝置的表示圖形的單詞對照的示意圖。
圖18是表示單詞候補(bǔ)網(wǎng)格的形式的示例圖。
圖19是表示標(biāo)記圖形候補(bǔ)生成結(jié)果的示意圖。
圖20是表示英文數(shù)字復(fù)原候補(bǔ)的示意圖。
圖21是表示地址號碼詞典的結(jié)構(gòu)例的示意圖。
圖22表示了一個(gè)分類符號串候補(bǔ)樹的例子。
圖23是表示包括文書識別裝置的信件分檢機(jī)的結(jié)構(gòu)圖。
首先,簡單地說明一下本發(fā)明的原理。
作為地址名標(biāo)記的例子,先考慮圖1(3)的情況。圖中,在“1-2”與“1-201”之間存在換行信息。但是,僅根據(jù)圖像信息不能判斷該信息是表示將文字串分開的分離信息還是表示非分離信息。因此,使用換行這樣的文字圖形間的幾何信息、文字圖形的識別結(jié)果以及街道號碼的標(biāo)記的知識生成假定換行不表示分離信息的街道號碼假說“1-21-201”和假定換行表示分離信息的假說“1-2-1-201”這樣2個(gè)假說。然后,將存儲實(shí)際存在的住所代碼的地址號碼詞典與上面各個(gè)街道號碼假說進(jìn)行對照,并認(rèn)為登錄在詞典上的一方是正確的解釋,并輸出該假說。
這樣,在換行及空白這樣的解釋中有存在不確定的信息時(shí),本發(fā)明的基本出發(fā)點(diǎn)就是建立多個(gè)假說并在后級的處理中驗(yàn)證哪個(gè)假說是正確的多重假說檢驗(yàn)方式。
下面,詳細(xì)說明本實(shí)施例。
圖2是文書識別裝置的基本功能結(jié)構(gòu)。讀取對象的紙張301上有(比方說)圖3所示的記載。該紙張經(jīng)過圖像讀入處理201,通過掃描器輸入圖像,然后變換成數(shù)字圖像數(shù)據(jù)。文書識別裝置對該圖像數(shù)據(jù)進(jìn)行文字區(qū)域的分割202、文字分割假說的生成203、城鎮(zhèn)域名識別204和街道號碼識別205的處理,并輸出識別結(jié)果208。
文書識別的第1個(gè)處理,就是文字區(qū)域的分割202。從紙張301的圖像中檢測記載區(qū)域302,然后進(jìn)而對各文字行如圖4所示的那樣分割出圖像區(qū)域401、402。
其次的處理就是文字分割假說的生成處理203。這里,所述的“假說”和“候補(bǔ)”意義相同。
然后,處理逐行分割出的文字行圖像401、402,如圖5所示的那樣,生成文字分割假說,作為網(wǎng)絡(luò)進(jìn)行表示(圖中只表示出了圖4的文字行的一部分)。
通過稱為“標(biāo)記”的處理,抽出構(gòu)成圖像的像素的值為1(表示黑)的連續(xù)的區(qū)域。將抽出的連結(jié)的黑像素的塊(圖形)稱為黑連結(jié)成分。將相鄰的黑連結(jié)成分(1個(gè)或多個(gè))視為構(gòu)成1個(gè)文字的最小部分(基本成分),由它們構(gòu)成圖5所示的網(wǎng)絡(luò)的基干部。其次,匯總有可能構(gòu)成1個(gè)文字和不能構(gòu)成1個(gè)文字的幾個(gè)相鄰的基本成分,附加在圖案的旁邊。通過對對全體進(jìn)行該處理,便可作成圖5所示的文字分割假說網(wǎng)絡(luò)。
文字的分割很難,在文字識別之前不能唯一地決定。因此,如圖5所示,在假說的形式中保留有可能存在的分割方式,并以這些多個(gè)假說為對象進(jìn)行以下各個(gè)識別處理。
這里,圖5只表示出了圖4的文字行401的前半部分。即,與“1-2”以后的文字串對應(yīng)的部分雖然也有數(shù)據(jù)存在,但是,在圖5中為了簡化圖示而沒有示出。
該網(wǎng)絡(luò)將分割出的文字(或該部分)的圖像和它們的組合(也有1個(gè)的情況)圖像附屬于弧線(圖中線上面的梯形),將各個(gè)不同的分割方式表現(xiàn)在1個(gè)圖案(網(wǎng)絡(luò))中。圖5是用圖示表示它們,但是,也可以作為計(jì)算機(jī)內(nèi)部的數(shù)據(jù)來表現(xiàn)。圖中,弧線3表示與“都”的左偏旁部分對應(yīng)的部分圖像,弧線4表示與“都”的右偏旁部分對應(yīng)的部分圖像。另外,弧線16是將這2部分圖像組合的圖像,表示另一種分割假說。
城鎮(zhèn)域名識別204是在輸入上述分割假說網(wǎng)絡(luò)206后使用事前知識進(jìn)行文字識別和知識處理,并輸出在城鎮(zhèn)域名候補(bǔ)和分割假說網(wǎng)絡(luò)中到何處為止進(jìn)行了識別對照的指示信息207。
下面,使用圖6說明城鎮(zhèn)域名識別處理的詳細(xì)情況。文字識別601是在參照文字識別詞典604對附屬于上述文字分割假說網(wǎng)絡(luò)的弧線部分圖像進(jìn)行處理后根據(jù)該信息決定弧線的組合,并輸出圖7所示的文字候補(bǔ)網(wǎng)格。
作為文字識別方式,也可以使用先有技術(shù)。作為識別印刷漢字和手寫漢字的方式,已知的有抽出文字筆劃的方向性的“方向性圖形整合法”。這里,雖然省略了詳細(xì)說明,但是,用圖形整合法可以將未知圖形的圖像(或特征矢量)與另外有限存儲在文字識別詞典中的參照圖形(圖像或特征矢量)的類似性作為稱為類似度的0到1的數(shù)值(實(shí)數(shù))進(jìn)行計(jì)量。
圖7所示的識別結(jié)果,是按類似度大的順序?qū)⑽淖址诸惣捌漕愃贫冗M(jìn)行排列的結(jié)果,稱為文字候補(bǔ)網(wǎng)格。圖中,第2行的標(biāo)識符就是在圖6中選擇的弧線號碼,是將文字識別結(jié)果的類似度高的圖形的組合羅列的結(jié)果。
這里的意圖在于在圖5中,如弧線1、2那樣,如果部分圖像或它們的組合圖像是實(shí)際可以存在的圖形,它就與登錄在圖形詞典中的參照圖形類似,所以,可以推測其類似度大。相反,如弧線4、7那樣,如果部分圖像是實(shí)際不存在的圖形,則在圖形詞典中也不存在與其對應(yīng)的參照圖形,所以,其類似度就小。這樣,通過使用文字識別作成類似度大的部分圖像的組合,來執(zhí)行文字識別和分割。
實(shí)際上,有時(shí)最佳路徑也是錯誤的,所以,不僅要選擇類似度的總和最大的路徑而且還要選擇第2位、第3位等多個(gè)路徑,向后級的處理傳送。
因此,只作成該數(shù)量的文字候補(bǔ)網(wǎng)格。以后的處理,就以這些文字候補(bǔ)網(wǎng)格為對象。在圖5和圖7中,只表示出了一部分,但是,這些處理是對圖4所示的全部文字行進(jìn)行的。
其次,城鎮(zhèn)域名對照處理部分602是對根據(jù)所有的文字行作成的多個(gè)文字候補(bǔ)網(wǎng)格進(jìn)行的。該處理部分參照以表格數(shù)據(jù)的形式保持圖8所示的城鎮(zhèn)域名知識的城鎮(zhèn)域名對照詞典進(jìn)行處理。該詞典具有出現(xiàn)在都道府縣名、市鎮(zhèn)村名、街區(qū)名中的單詞知識(圖8(a)、(b)、(c))。此外,在該單詞知識中也包括哪個(gè)單詞可以與哪個(gè)單詞接續(xù)的信息。
例如,在圖8(b)中,如果市標(biāo)識符為C0517的“千代田區(qū)”的主標(biāo)識符為K31,就進(jìn)行存儲,看一下圖8(a)的都道府縣名表,它存儲的是“東京都”。即,表示在單詞“東京都”之后可以接續(xù)單詞“千代田區(qū)”。同樣,對于“千代田區(qū)”,根據(jù)圖8(c)的街區(qū)名表“千代田區(qū)”,存儲的是接續(xù)“神田駿河臺”等。
城鎮(zhèn)域名對照處理,是使用這些單詞知識和它們的組合知識從文字候補(bǔ)網(wǎng)格中識別單詞串(句)例如“東京都·千代田區(qū)·神田駿河臺”的處理,這有已知的方式。下面,為了幫助理解本發(fā)明,說明該方式。
為此,先根據(jù)文字候補(bǔ)網(wǎng)格構(gòu)成圖9所示的有限自動裝置,通過將單詞(文字串)輸入該自動裝置,可以判斷該單詞是否為可以根據(jù)該文字候補(bǔ)集合再構(gòu)成的單詞即是否可以將該單詞作為識別結(jié)果。該處理就是單詞對照的處理。
具體而言,作成比網(wǎng)格的行數(shù)多1的狀態(tài)(圖9中的圓圈符號),用從某一狀態(tài)向下一狀態(tài)的遷移鏈(箭頭)表示1個(gè)文字候補(bǔ)。例如,作成第1文字的第1位候補(bǔ)“東”為從狀態(tài)0至狀態(tài)1的第1遷移鏈、第1文字的第2位候補(bǔ)“果”為從狀態(tài)0至狀態(tài)1的遷移鏈、第2文字的第1位候補(bǔ)“宗”為從狀態(tài)1至狀態(tài)2的遷移鏈…這樣的自動裝置。利用眾所周知的方法,在軟件方面使用狀態(tài)遷移表可以很容易地作成有限自動裝置。
某一單詞是否可以根據(jù)文字候補(bǔ)集合再構(gòu)成,可以根據(jù)構(gòu)成該單詞的文字串的各文字通過該有限自動裝置的哪個(gè)遷移鏈進(jìn)行判斷。
例如,為了看出單詞“東京都”是否位于最初的3個(gè)文字,先看文字“東”從狀態(tài)0通過哪個(gè)鏈遷移到狀態(tài)1。使用狀態(tài)遷移表的自動裝置,就可以高速地實(shí)現(xiàn)該檢索。圖9的情況,可知第1個(gè)鏈就是“東”。其次,同樣檢索文字“京”從狀態(tài)1通過哪個(gè)鏈向狀態(tài)2遷移。這時(shí),可知是第2個(gè)鏈。
同樣,可知文字“都”是通過第2個(gè)鏈從狀態(tài)2向狀態(tài)3遷移的。這時(shí),單詞“東京都”的存在的確信度可以用各個(gè)文字候補(bǔ)的類似度總和表示。
或者,也有使用通過哪個(gè)鏈來計(jì)算惡化度的方法。這時(shí),通過第1鏈時(shí)惡化度為0、通過第2鏈時(shí)惡化度為1、通過第3鏈時(shí)惡化度為2。本例的情況,“東京都”的惡化度為0+1+1=2。
在該檢索處理中,如果對某一文字不存在對應(yīng)的遷移鏈時(shí),就假定通過圖9的“其他”的遷移鏈。與“其他”的鏈對應(yīng)的類似度或惡化度,事前補(bǔ)充作為一個(gè)參量的常數(shù)。
該處理在邏輯上對具有可能性的所有的單詞都從所有的狀態(tài)開始進(jìn)行。其結(jié)果可以用圖10的單詞候補(bǔ)網(wǎng)格的形式進(jìn)行表示。例如,圖10表示從狀態(tài)0(第1文字)中將單詞“東京都”和“XXX”作為候補(bǔ)、從狀態(tài)1(第2文字)中將單詞“京都”作為候補(bǔ)、從狀態(tài)2(第3文字)中將將單詞“YYY”作為候補(bǔ)。最后的候補(bǔ)是從狀態(tài)6(第7文字)開始的單詞“SSS”和“神田駿河臺”。這樣,單詞候補(bǔ)網(wǎng)格就是以在哪個(gè)位置可以有什么樣的單詞這樣的確信度或惡化度進(jìn)行表示的。到作成該單詞候補(bǔ)網(wǎng)格為止,是城鎮(zhèn)域名對照處理部分602的前半部分的處理。
城鎮(zhèn)域名對照處理部分602的后半部分的處理,是從單詞候補(bǔ)中選出只滿足組合規(guī)則的單詞。這就是從單詞候補(bǔ)網(wǎng)格的末端(右端)的單詞候補(bǔ)開始,參照圖8所示的城鎮(zhèn)域名知識中的單詞接續(xù)信息順序檢驗(yàn)可以與左邊接續(xù)的單詞在單詞候補(bǔ)網(wǎng)格中是否存在。
結(jié)果如圖10所示,“神田駿河臺”可以接續(xù)“千代田區(qū)”,但是,由圖可知,可以與單詞“SSS”接續(xù)的單詞候補(bǔ)不存在。
最后,可以將“東京都·千代田區(qū)·神田駿河臺”作為句子的候補(bǔ)。
根據(jù)情況不同,有時(shí)存在多個(gè)句子成為候補(bǔ),這時(shí),可以使用綜合確信度或綜合惡化度選擇順位好的一個(gè)句子。
或者,也可以將多個(gè)候補(bǔ)并列地傳送給后級的處理,在后級進(jìn)行最終的判斷。
在候補(bǔ)采用判斷部分603中,進(jìn)行從城鎮(zhèn)域名對照處理部602輸出的城鎮(zhèn)域名候補(bǔ)是否為妥當(dāng)?shù)膶φ战Y(jié)果的判斷。例如,參考城鎮(zhèn)域名候補(bǔ)的確信度的值進(jìn)行閾值處理。
按照上述方式進(jìn)行城鎮(zhèn)域名識別處理204,結(jié)果,就是識別出了例如文字串“東京都千代田區(qū)神田駿河臺”,并將該文字串和表示該文字串的街區(qū)標(biāo)識符“T2121”作為數(shù)據(jù)207向后級的處理部分傳送。
但是,該數(shù)據(jù)中不僅包含所謂的識別結(jié)果“東京都千代田區(qū)神田駿河臺”,而且也包含表示與文字候補(bǔ)網(wǎng)格中的哪一部分對應(yīng)的數(shù)據(jù)。這樣,后級的處理例如街道號碼識別處理205就可以知道自己下一個(gè)要處理的部分是何處。
更具體而言,就是包含表示間從圖4的文字行、第1行的“東京都...”開始到“...駿河臺”的識別對照處理的指示信息。這樣,就可以知道下一個(gè)應(yīng)處理的部分是“1-2”以后的文字串。這時(shí),指針信息可以用圖7的文字候補(bǔ)網(wǎng)格中的標(biāo)識符號碼的形式表示。
下面,使用圖11說明街道號碼識別205。在街道號碼識別中,進(jìn)行尚未進(jìn)行處理的處理對象“1-2”以后的文字串的識別對照處理。
在文字識別處理1101中輸入文字分割假說203和城鎮(zhèn)域名識別結(jié)果207后,使用文字識別詞典1108利用和城鎮(zhèn)域名識別204中的文字識別601相同的方式進(jìn)行文字識別,并輸出候補(bǔ)文字網(wǎng)格1111。
幾何信息抽出處理1102是在輸入文字分割假說203和候補(bǔ)文字網(wǎng)格1111后,輸出與文字間的空白或換行這樣的幾何分離信息假說屬性相關(guān)聯(lián)的帶幾何分離信息屬性的網(wǎng)格1112。該處理可以使用已知的方式實(shí)現(xiàn)。下面,使用圖12說明本處理的詳細(xì)情況。
為了抽出空白信息,首先根據(jù)文字分割假說附帶的幾何信息求出與行方向?qū)?yīng)的各個(gè)分割的文字圖像的重心,并測定相鄰的重心間的距離。1201表示其結(jié)果。1202的部分具有相鄰的重心間的距離的2倍的距離。并且,如果該重心間的距離相對于行的高度大于某一一定的閾值,就認(rèn)為該處存在空白,使之與分割出的圖像相關(guān)聯(lián),賦予該屬性。1204表示空白信息的候補(bǔ)存在于該文字圖形之后。對于換行屬性,也判定文字圖形間的相對的位置關(guān)系,并賦予同樣的屬性。1203是它們的處理結(jié)果,幾何分離信息的假說以符號串的形式來表現(xiàn)。最后,幾何分離信息假說如圖13那樣對于文字候補(bǔ)網(wǎng)格與對應(yīng)的位置關(guān)聯(lián)地作為帶幾何分離信息屬性的網(wǎng)格1112而輸出。
通配符網(wǎng)格生成處理1103接收帶幾何分離信息屬性的網(wǎng)格1112,參照圖14所示的通配符變換規(guī)則,將網(wǎng)格中的候補(bǔ)文字變換為通配符符號。例如,如圖13中的記載文字號碼13那樣,對于記載文字“1”,考慮候補(bǔ)“1”、“7”上升到網(wǎng)格中的情況。這些候補(bǔ)文字分別變換為符號“N”、“N”,這時(shí),由于成為相同的符號,所以,合并為1個(gè)。對于記載文字號碼14的記載文字“-”,候補(bǔ)“丿(之)”、“-”上升到網(wǎng)格中,所以,分別變換為符號“丿”、“-”。以后,反復(fù)進(jìn)行同樣的處理。變換后的通配符網(wǎng)格示于圖15。在該網(wǎng)格中,幾何分離信息屬性與通配符文字網(wǎng)格相關(guān)聯(lián)地存儲。并且,為了后級的處理而輸出該通配符網(wǎng)格1113。
標(biāo)記圖形對照處理1104接收通配符網(wǎng)格1113,查找標(biāo)記圖形詞典1109進(jìn)行對照處理。該詞典在內(nèi)部以表形式的數(shù)據(jù)保持圖16所示的街道號碼、門牌號碼、房間號碼以及它們的標(biāo)記知識。具體而言,對于街道號碼標(biāo)記、門牌號碼標(biāo)記、房間號碼標(biāo)記(例如,“1-2”的部分的標(biāo)記),是存儲可以具有什么樣的形式的表。圖中,符號“N”表示阿拉伯?dāng)?shù)字、符號“NN”表示2位的阿拉伯?dāng)?shù)字、符號“NNN”表示3位的阿拉伯?dāng)?shù)字、“A”表示字母、“の”、“丿”、“-”表示分離符號(定界符)。圖中雖然未示出,但是,在街區(qū)標(biāo)記圖形表中,預(yù)先也登錄了與上述“1番2號”或豎寫時(shí)的“一の二”等標(biāo)記方法對應(yīng)的圖形。
首先,根據(jù)通配符網(wǎng)格1113作成圖17所示的有限自動裝置,向該處輸入與P001、P002、P003、P004對應(yīng)的標(biāo)記圖形(“N-N”等),在各狀態(tài)間遷移,累計(jì)與通過的路徑對應(yīng)的成本。
該處理使用和城鎮(zhèn)域名對照處理602相同的方法執(zhí)行。通過控制自動裝置中對照的開始位置,在任意的位置進(jìn)行單詞對照。但是,在該自動裝置中,街道號碼位于開頭,所以,只從狀態(tài)1開始進(jìn)行單詞對照。單詞對照的結(jié)果作為圖18所示的單詞網(wǎng)格而輸出。
進(jìn)行單詞對照后,將街道號碼、門牌號碼、房間號碼以及它們的標(biāo)記圖形單詞連接,生成將街道號碼、門牌號碼、房間號碼并列的一連串的標(biāo)記。這里,根據(jù)文字候補(bǔ)網(wǎng)格附帶的空白屬性或換行屬性控制各單詞的連接。即,連接對象標(biāo)記圖形單詞的連接部分為數(shù)字時(shí),在連接的部分存在空白或換行的屬性時(shí),就將分離信息的屬性附加到該處進(jìn)行連接。相反,在與空白或換行不一致時(shí),如果連接,將生成重復(fù)的標(biāo)記圖形假說,所以,不進(jìn)行連接。
例如,在圖18中,用箭頭所示的單詞間連接的情況下,在連接位置存在空白或換行的屬性,所以,是判定為可以連接的標(biāo)記圖形候補(bǔ)。假定不存在空白屬性1804時(shí),若著眼于單詞1801、1802、1803,將1801與1803連接時(shí),將重復(fù)生成與1802相同的假說。這樣,將數(shù)字之間連接生成標(biāo)記假說時(shí),如果在該處不存在分離信息的屬性,就生成與其他的標(biāo)記圖形單詞相同的假說。因此,不進(jìn)行標(biāo)記圖形單詞的連接。
按照上述規(guī)則連接的結(jié)果,在被視為重復(fù)的標(biāo)記時(shí),就刪除重復(fù)的標(biāo)記。例如,將“N”與“N-”連接的標(biāo)記和“N-N”相同,所以,將其中之一刪除。
此外,多數(shù)情況是街道號碼、門牌號碼、房間號碼的標(biāo)記的末尾與空白或行末一致。因此,末尾與空白或換行不一致的候補(bǔ),就視為不適當(dāng)?shù)募僬f的可能性高,從而增加惡化度。
這些標(biāo)記圖形對照的結(jié)果是輸出圖19所示的標(biāo)記圖形的候補(bǔ)1114。圖中,“=”表示幾何分離信息插入到該處。
在文字串候補(bǔ)生成處理1105中,輸入上升到高位的標(biāo)記圖形候補(bǔ)1114和帶幾何分離信息屬性的網(wǎng)格1112后,將標(biāo)記圖形中的英文數(shù)字部分與對應(yīng)的網(wǎng)格的候補(bǔ)文字進(jìn)行比較,輸出復(fù)原為原來的文字的文字串候補(bǔ)1115。圖20(1)~(4)分別是與圖19的(1)~(4)對應(yīng)的候補(bǔ)。
在地址號碼對照1106中,參照地址號碼詞典1110對照在文字串候補(bǔ)生成處理1105中得到的候補(bǔ)實(shí)際上是否存在。圖21表示地址號碼詞典的結(jié)構(gòu)例。如圖所示,將實(shí)際存在的住所按層次保存在詞典中,判斷在登錄到該詞典中的住所中是否存在在英文數(shù)字復(fù)原處理1105中得到的候補(bǔ)。如果判定存在,就向后級輸出候補(bǔ),如果判定不存在,就排除該候補(bǔ)。在圖20的候補(bǔ)中,選擇(1)作為地址號碼對照候補(bǔ)1116而輸出。
在候補(bǔ)采用判斷1107中,和城鎮(zhèn)域名識別204的候補(bǔ)采用判斷603一樣進(jìn)行在前級的對照中得到的候補(bǔ)是否妥當(dāng)?shù)呐袛唷?br>
在本實(shí)施例中,作為幾何分離信息,采用的是文字間的空白或換行,但是,并不限于此,也可以使用顏色信息、有無下劃線、字體形狀、文字的大小或行寬的不同等其他信息。
此外,使用幾何分離信息的標(biāo)記圖形假說的生成方式不限于本實(shí)施例。在本實(shí)施例中,是通過在標(biāo)記圖形單詞連接的控制中使用分離信息來實(shí)現(xiàn)插入幾何分離信息的標(biāo)記圖形假說和不插入的標(biāo)記圖形假說的各假說生成的。例如,如以下所述,也可以通過其他方式來實(shí)現(xiàn)。
首先,作為第1方式,和本實(shí)施例一樣,輸入幾何分離信息屬性網(wǎng)格,與標(biāo)記圖形單詞進(jìn)行對照。然后,在標(biāo)記圖形單詞連接的庫中不使用分離信息而將單詞之間連接。結(jié)果,對于上升到高位的標(biāo)記圖形候補(bǔ),執(zhí)行以下的處理。著眼于存在確定的幾何分離信息的位置,假定在該處存在分離信息,追加生成將分離信息插入到標(biāo)記圖形單詞中的標(biāo)記圖形假說。例如,在圖19(2)的例中,根據(jù)“N-NN-NNN”的標(biāo)記圖形單詞生成“N-N=N-NNN”及“N-N=N-NN=N”。這里,“=”表示根據(jù)幾何信息生成的分離信息。
作為第2方式,將空白插入到標(biāo)記圖形單詞中的單詞和不插入的單詞都登錄到詞典中后,著眼于存在確定的幾何分離信息的位置時(shí),分別生成將例如空白的文字代碼插入到候補(bǔ)文字網(wǎng)格的相應(yīng)的位置的網(wǎng)格和不插入的網(wǎng)格,通過與上述各候補(bǔ)文字網(wǎng)格進(jìn)行對照便可生成。即,第2方式是生成以文字代碼的形式表示幾何分離信息的多個(gè)候補(bǔ)文字網(wǎng)格并對它們分別進(jìn)行標(biāo)記圖形對照的方式。
作為第3方式,標(biāo)記圖形的信息不是作為存儲在詞典中的文字串的信息來表現(xiàn)的,例如,對于在日本專利公報(bào)特開平6-124366中所示的方式,也可以生成使用同樣的空白或換行的信息的標(biāo)記圖形假說。在本發(fā)明中,考慮位置關(guān)系的制約,將文字分割的候補(bǔ)以樹結(jié)構(gòu)的形式來表現(xiàn),此外,將與其節(jié)點(diǎn)對應(yīng)的識別結(jié)果根據(jù)字種附加上標(biāo)號,檢驗(yàn)該標(biāo)號的排列,生成標(biāo)記圖形的假說。這里,在檢驗(yàn)排列的規(guī)則中預(yù)先追加將空白及換行作為分離信息使用的排列的規(guī)則。此外,在將空白或換行這樣的幾何分離信息的屬性賦予各節(jié)點(diǎn)、檢驗(yàn)排列并生成標(biāo)記圖形假說時(shí),分別生成插入空白或換行的分離信息的標(biāo)記圖形假說和不插入的標(biāo)記圖形假說。
作為第4方式,如特開平8-180142中所示的那樣,對于將滿足預(yù)先決定的標(biāo)記規(guī)則的分類符號串候補(bǔ)用樹結(jié)構(gòu)表現(xiàn)標(biāo)記圖形的方式,也可以生成使用同樣的空白或換行的信息的標(biāo)記圖形假說。在本發(fā)明中,對與文字分割的候補(bǔ)對應(yīng)的識別結(jié)果根據(jù)字種進(jìn)行分類。然后,根據(jù)文字分割候補(bǔ)的位置關(guān)系的制約和分類符號間的連接關(guān)系的制約,用樹結(jié)構(gòu)的形式表現(xiàn)分類符號串候補(bǔ)。根據(jù)該樹結(jié)構(gòu)再次展開作為各分類符號的發(fā)生源的文字,并作成文字串候補(bǔ)后,應(yīng)用街道號碼范圍規(guī)則來選擇文字串候補(bǔ)。這里,在預(yù)先將在文字分割的候補(bǔ)間可以存在的空白或換行這樣的幾何分離信息的屬性賦予文字分割的候補(bǔ)、檢驗(yàn)分類的排列并生成樹結(jié)構(gòu)時(shí),分別生成插入空白或換行的分離信息的標(biāo)記假說和不插入的標(biāo)記假說。圖22表示所生成的候補(bǔ)樹的例子。用虛線包圍的部分是由本發(fā)明追加的。圖中,“N”是表示數(shù)字的分類符號、“Sh”是表示“-”的分類符號、“Si”是表示幾何分離信息的分類符號。圖23是表示搭載文書識別裝置的信件分檢機(jī)的概略結(jié)構(gòu)圖。
2000是信件分檢機(jī)的總體體系(機(jī)構(gòu)部分),由將多張紙頁順序供給掃描器的供給機(jī)構(gòu)2001、掃描器2002、將掃描過的紙頁向分檢機(jī)構(gòu)傳送的傳送機(jī)構(gòu)2003、從中央控制計(jì)算機(jī)2006接收決定紙頁的傳送前往地的分檢信息進(jìn)行紙頁的分檢的分檢機(jī)構(gòu)2004構(gòu)成。此外,機(jī)構(gòu)部2000具有多個(gè)控制用的計(jì)算機(jī),這些計(jì)算機(jī)在中央控制計(jì)算機(jī)2006的指示下控制機(jī)構(gòu)部分2000全體。
2007是文書識別裝置,由輸入從掃描器2002讀取了記載在紙張上的地址信息的圖像數(shù)據(jù)并向中央處理裝置(CPU)輸出的輸入接口2008、輸入圖像數(shù)據(jù)并進(jìn)行地址信息識別的中央處理裝置(CPU)2009及2010、存儲用于進(jìn)行地址信息處理的程序及供識別對照使用的事前知識的存儲器2013、存儲裝載在存儲器2013中的程序及事前知識的2次存儲裝置2014和將由中央處理裝置(CPU)識別的識別結(jié)果數(shù)據(jù)向中央控制計(jì)算機(jī)2006輸出的通信接口2016構(gòu)成。
在圖22中,中央處理裝置(CPU)示出了2臺,但是,在處理能力不足時(shí),可以實(shí)際裝配2臺以上?;蛘?,將文書識別裝置2007并列地設(shè)置所需要的臺數(shù)。這些文書識別裝置分擔(dān)處理高速讀取的圖像數(shù)據(jù)2015。
中央控制計(jì)算機(jī)2006從通信接口2011解釋在通信數(shù)據(jù)2016中包含的識別結(jié)果數(shù)據(jù),按照預(yù)先編程的邏輯作成分檢信息并向分檢機(jī)構(gòu)輸出。
在本實(shí)施例中,說明了用掃描器作為圖像信息讀取寫在紙面上的文字信息從而進(jìn)行文字識別的方法,但是,最近,也有很多情況是電子的圖像信息已存儲到了計(jì)算機(jī)系統(tǒng)中,不言而喻,本發(fā)明也可以適用于識別和解釋這樣的圖像信息。
如上所述,按照本發(fā)明,在著眼于存在用于將文字串分開的幾何分離信息假說的確定的位置時(shí),生成假定該處存在分離信息的標(biāo)記和假定不存在的標(biāo)記的各標(biāo)記圖形假說。
然后,根據(jù)這些標(biāo)記圖形假說和文字識別結(jié)果生成住所代碼,通過將實(shí)際的住所與存儲的地址名詞典進(jìn)行對照,來確定正確地解釋的標(biāo)記從而識別住所。通過這些處理,便可正確地識別使用空白或換行等幾何分離信息標(biāo)記的地址信息。
另外,如圖1的(3)、(4)所示,開始可以由本發(fā)明正確地解釋換行的信息并讀取地址的標(biāo)記,大多都是大量地作成郵購廣告單那樣的相同種類的郵件時(shí)的地址。在郵電局,這種相同種類的郵件多數(shù)是集中地放到信件分檢機(jī)上進(jìn)行分檢的。這里,信件分檢機(jī)具有讀取郵件上的地址信息并按各投遞地址分檢郵件的功能。因此,在上述那樣的信件分檢機(jī)的運(yùn)用方法中,提高讀取郵件的地址進(jìn)行分檢的分檢效率的效果特別大。
權(quán)利要求
1.一種文書識別裝置,包括將記載在紙頁上的地址信息作為數(shù)字圖像數(shù)據(jù)進(jìn)行讀取的圖像讀取單元;從上述數(shù)字圖像數(shù)據(jù)中分割并輸出包含上述地址信息的文字行的文字行分割單元;具有文字識別詞典的輸入該分割出的上述文字行并分割出文字信息、參照上述文字識別詞典進(jìn)行文字識別并輸出多個(gè)文字識別候補(bǔ)的文字識別單元;具有城鎮(zhèn)域名對照詞典的輸入上述多個(gè)文字識別候補(bǔ)、參照上述城鎮(zhèn)域名對照詞典對上述多個(gè)文字識別候補(bǔ)對照城鎮(zhèn)域名并輸出該城鎮(zhèn)域名候補(bǔ)的城鎮(zhèn)域名對照單元;輸入上述城鎮(zhèn)域名候補(bǔ)并判斷是否將上述城鎮(zhèn)域名候補(bǔ)作為城鎮(zhèn)域名識別結(jié)果采用,在判定采用時(shí)將上述城鎮(zhèn)域名候補(bǔ)作為城鎮(zhèn)域名識別結(jié)果而輸出的第1候補(bǔ)采用判斷單元;輸入上述多個(gè)文字識別候補(bǔ)和上述城鎮(zhèn)域名識別結(jié)果、具有保持包含用符號或數(shù)字表示的街道號碼、門牌號碼、房間號碼中的某一個(gè)的地址號碼的標(biāo)記圖形的標(biāo)記圖形詞典和保持與包含城鎮(zhèn)域名、街道號碼、門牌號碼、房間號碼中的某一個(gè)的地址號碼的對應(yīng)關(guān)系的地址號碼詞典的將上述多個(gè)文字識別候補(bǔ)中包含的一個(gè)或多個(gè)文字與上述標(biāo)記圖形詞典進(jìn)行對照并輸出該標(biāo)記圖形的對照結(jié)果、參照該標(biāo)記圖形的對照結(jié)果和上述城鎮(zhèn)域名識別結(jié)果以及上述地址號碼詞典將上述多個(gè)文字識別候補(bǔ)與包含街道號碼、門牌號碼、房間號碼中的某一個(gè)的地址號碼進(jìn)行對照并輸出上述地址號碼的地址號碼對照對應(yīng);輸入上述地址號碼候補(bǔ)、判斷是否將上述地址號碼候補(bǔ)作為地址號碼識別結(jié)果采用、在判定采用時(shí)就將上述地址號碼候補(bǔ)作為地址號碼識別結(jié)果而輸出的第2候補(bǔ)采用判斷單元,其特征在于上述地址號碼對照單元包含檢測在上述多個(gè)文字識別候補(bǔ)中包含的一個(gè)或多個(gè)文字的幾何配置關(guān)系、生成將上述多個(gè)文字識別候補(bǔ)中包含的文字串之間分離的第1分離信息假說和不將上述多個(gè)文字識別候補(bǔ)中包含的文字串之間分離的第2分離信息假說的幾何分離信息假說生成單元,參照上述第1上述分離信息假說和上述第2上述分離信息假說,對照地址號碼。
2.如權(quán)利要求1所述的文書識別裝置,其特征在于上述地址號碼對照單元對照地址號碼的上述多個(gè)文字識別候補(bǔ)是從上述文字識別單元輸出的上述多個(gè)文字識別候補(bǔ)中排除了由上述城鎮(zhèn)域名對照單元對照過的上述多個(gè)文字識別候補(bǔ)的多個(gè)文字識別候補(bǔ)。
3.如權(quán)利要求1所述的文書識別裝置,其特征在于上述幾何配置關(guān)系是在上述多個(gè)文字識別候補(bǔ)中包含的2個(gè)文字間的空白或在上述多個(gè)文字識別候補(bǔ)中包含的換行。
4.如權(quán)利要求1所述的文書識別裝置,其特征在于上述幾何分離信息假說生成單元通過求在上述多個(gè)文字識別候補(bǔ)中包含的文字的文字圖像的重心、測定相鄰的文字間的距離來檢測上述2個(gè)文字間的空白。
5.如權(quán)利要求1所述的文書識別裝置,其特征在于上述地址號碼對照單元將在上述多個(gè)文字識別候補(bǔ)中包含的1個(gè)或多個(gè)文字置換為符號或數(shù)字,與上述標(biāo)記圖形詞典進(jìn)行對照。
6.一種信件分撿機(jī),包括將記載在紙頁上的地址信息作為數(shù)字圖像數(shù)據(jù)進(jìn)行讀取的圖像讀取單元;從上述數(shù)字圖像數(shù)據(jù)中分割并輸出包含上述地址信息的文字行的文字行分割單元;具有文字識別詞典的輸入該分割出的上述文字行并分割出文字信息、參照上述文字識別詞典進(jìn)行文字識別并輸出多個(gè)文字識別候補(bǔ)的文字識別單元;具有城鎮(zhèn)域名對照詞典的輸入上述多個(gè)文字識別候補(bǔ)、參照上述城鎮(zhèn)域名對照詞典對上述多個(gè)文字識別候補(bǔ)對照城鎮(zhèn)域名并輸出該城鎮(zhèn)域名候補(bǔ)的城鎮(zhèn)域名對照單元;輸入上述城鎮(zhèn)域名候補(bǔ)并判斷是否將上述城鎮(zhèn)域名候補(bǔ)作為城鎮(zhèn)域名識別結(jié)果采用,在判定采用時(shí)將上述城鎮(zhèn)域名候補(bǔ)作為城鎮(zhèn)域名識別結(jié)果而輸出的第1候補(bǔ)采用判斷單元;輸入上述多個(gè)文字識別候補(bǔ)和上述城鎮(zhèn)域名識別結(jié)果、具有保持包含用符號或數(shù)字表示的街道號碼、門牌號碼、房間號碼中的某一個(gè)的地址號碼的標(biāo)記圖形的標(biāo)記圖形詞典和保持與包含城鎮(zhèn)域名、街道號碼、門牌號碼、房間號碼中的某一個(gè)的地址號碼的對應(yīng)關(guān)系的地址號碼詞典的將上述多個(gè)文字識別候補(bǔ)中包含的一個(gè)或多個(gè)文字與上述標(biāo)記圖形詞典進(jìn)行對照并輸出該標(biāo)記圖形的對照結(jié)果、參照該標(biāo)記圖形的對照結(jié)果和上述城鎮(zhèn)域名識別結(jié)果以及上述地址號碼詞典將上述多個(gè)文字識別候補(bǔ)與包含街道號碼、門牌號碼、房間號碼中的某一個(gè)的地址號碼進(jìn)行對照并輸出上述地址號碼的地址號碼對照對應(yīng);輸入上述地址號碼候補(bǔ)、判斷是否將上述地址號碼候補(bǔ)作為地址號碼識別結(jié)果采用、在判定采用時(shí)就將上述地址號碼候補(bǔ)作為地址號碼識別結(jié)果而輸出的第2候補(bǔ)采用判斷單元,其特征在于上述地址號碼對照單元包含檢測在上述多個(gè)文字識別候補(bǔ)中包含的一個(gè)或多個(gè)文字的幾何配置關(guān)系、生成將上述多個(gè)文字識別候補(bǔ)中包含的文字串之間分離的第1分離信息假說和不將上述多個(gè)文字識別候補(bǔ)中包含的文字串之間分離的第2分離信息假說的幾何分離信息假說生成單元,參照上述第1上述分離信息假說和上述第2上述分離信息假說,對照地址號碼。
7.如權(quán)利要求6所述的信件分檢機(jī),其特征在于上述地址號碼對照單元對照地址號碼的上述多個(gè)文字識別候補(bǔ)是從上述文字識別單元輸出的上述多個(gè)文字識別候補(bǔ)中排除了由上述城鎮(zhèn)域名對照單元對照過的上述多個(gè)文字識別候補(bǔ)的多個(gè)文字識別候補(bǔ)。
8.如權(quán)利要求6所述的信件分檢機(jī),其特征在于上述幾何配置關(guān)系是在上述多個(gè)文字識別候補(bǔ)中包含的2個(gè)文字間的空白或在上述多個(gè)文字識別候補(bǔ)中包含的換行。
9.如權(quán)利要求6所述的信件分檢機(jī),其特征在于上述幾何分離信息假說生成單元通過求在上述多個(gè)文字識別候補(bǔ)中包含的文字的文字圖像的重心、測定相鄰的文字間的距離來檢測上述2個(gè)文字間的空白。
10.如權(quán)利要求6所述的信件分檢機(jī),其特征在于上述地址號碼對照單元將在上述多個(gè)文字識別候補(bǔ)中包含的1個(gè)或多個(gè)文字置換為符號或數(shù)字,與上述標(biāo)記圖形詞典進(jìn)行對照。
全文摘要
本發(fā)明提供在地址名標(biāo)記中存在意義的解釋有不確定性的文字間的空白信息或換行信息時(shí)高精度地識別解釋地址信息的裝置。經(jīng)文字識別處理輸出各文字圖形的候補(bǔ)文字網(wǎng)格。幾何分離信息抽出單元抽出地址文字串中的分離信息假說,并與候補(bǔ)文字網(wǎng)格關(guān)聯(lián)地輸出。通過通配符網(wǎng)格生成處理生成用表示任意的英文數(shù)字的通配符符號表現(xiàn)的網(wǎng)格。標(biāo)記網(wǎng)形對照單元標(biāo)記圖形詞典與通配符網(wǎng)格進(jìn)行對照。
文檔編號G06K9/72GK1254903SQ9912353
公開日2000年5月31日 申請日期1999年11月10日 優(yōu)先權(quán)日1998年11月10日
發(fā)明者緒方日佐男, 藤澤浩道, 古川直廣, 灑匂裕, 寺本正人, 渡邊成 申請人:株式會社日立制作所