国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      漢字識別方法和裝置的制作方法

      文檔序號:6427929閱讀:167來源:國知局

      專利名稱::漢字識別方法和裝置的制作方法
      技術(shù)領(lǐng)域
      :本發(fā)明涉及漢字識別技術(shù),特別涉及ー種漢字識別方法和裝置。
      背景技術(shù)
      :隨著光學(xué)文字識別(OCR:0pticalCharacterRecognition)正確率的提高,其應(yīng)用也越來越廣泛,如大量應(yīng)用于自動化辦公中。圖I是現(xiàn)有技術(shù)中光學(xué)識別引擎的結(jié)構(gòu)示意圖;圖2是利用光學(xué)識別引擎的切分模塊101對文本圖像進(jìn)行切分后的圖像單元的示意圖;圖3是對切分后的圖像單元進(jìn)行選擇的示意圖;圖4是左右結(jié)構(gòu)的標(biāo)準(zhǔn)漢字的示意圖。如圖I所示,該光學(xué)識別引擎主要包括切分模塊101和識別模塊102;其中,切分模塊101用于將包含多個文字的文本圖像(TextImage)切分為圖像單元(Segments),如圖2所示,利用該文本圖像為“信息外圍設(shè)備”201,切分模塊101對文本圖像201切分后獲得多個圖像単元202,如圖2所示用豎線分開的各個圖像単元202;識別模塊102用于將切分模塊101對文本圖像201切分后獲得的圖像單元202進(jìn)行識別,以獲得可編輯文字(EditableText),如圖2所示,獲得可編輯的文字203。如圖2所示,在切分模塊101對文本圖像進(jìn)行切分時,會出現(xiàn)切分錯誤。例如,有些單個字符的文字圖像可能被切分為多個圖像單元,如單個字符“信”被切分為“イ”和“言”;單個字符“外”,被切分為“夕”和“卜”,這樣最終導(dǎo)致識別錯誤。由于ー個標(biāo)準(zhǔn)漢字的圖像單元的識別相似度比一個非標(biāo)準(zhǔn)漢字的識別相似度高,因此,目前對于切分錯誤的問題,如對于ー個單個字符被切分為多個圖像單元的錯誤,可結(jié)合識別技術(shù)對切分錯誤的圖像單元進(jìn)行修正,即通過識別相似度的高低來選擇識別相似度高的圖像單元,從而可以避免切分錯誤。例如,在切分模塊101對文本圖像201進(jìn)行切分獲得圖像單元202后,為了避免上述的切分錯誤,可將相鄰的兩個圖像單元進(jìn)行合并,例如,如圖3所示,將圖像単元“イ”、“言”進(jìn)行合并,然后對“イ、言”和合并后的圖像單元“信”進(jìn)行識別,比較識別相似度,由于“信”是標(biāo)準(zhǔn)漢字的圖像單元,“イ、言”識別后為“イ、育”不是標(biāo)準(zhǔn)漢字的圖像單元,因此,對圖像単元“信”的識別相似度高于對圖像単元“イ、言”的識別相似度,這樣,選擇合并后的識別相似度高的圖像單元“信”來修正切分錯誤的圖像單元“イ、育”,即最終選擇“信”的圖像單元來代替“イ”和”育”。由上述可知,通過選擇相似度高的圖像單元,可以得到正確的切分単元,圖3所示的是ー個結(jié)合識別進(jìn)行切分選擇的例子。但是在實(shí)現(xiàn)本發(fā)明的過程中發(fā)明人發(fā)現(xiàn)上述技術(shù)的缺陷在于如圖4所示,對于左右結(jié)構(gòu)的標(biāo)準(zhǔn)漢字,如“外”,且該左右結(jié)構(gòu)的標(biāo)準(zhǔn)漢字的左部分和右部分均為標(biāo)準(zhǔn)漢字,即“夕”和“卜”,光學(xué)識別引擎(OCR)會將該左右結(jié)構(gòu)的漢字切分為兩個圖像單元,即使利用上述切分錯誤修正方法也無法解決上述切分錯誤的問題,從而最終導(dǎo)致識別錯誤。
      發(fā)明內(nèi)容本發(fā)明實(shí)施例的目的在于提供ー種漢字識別方法和裝置,通過利用對文本圖像進(jìn)行識別后獲得的識別信息中的識別編碼信息和圖像單元位置信息檢測錯誤切分的圖像單元并對錯誤切分的圖像單元進(jìn)行修正,從而可提高識別精度,解決現(xiàn)有技術(shù)中存在的問題。根據(jù)本發(fā)明實(shí)施例的ー個方面提供了ー種漢字識別裝置,該裝置包括第一識別單元,該第一識別單元用于對文本圖像進(jìn)行切分和識別,以獲得識別信息;其中,該識別信息包括對該文本圖像進(jìn)行切分后獲得的多個圖像単元在該文本圖像中的位置信息、以及對該圖像単元進(jìn)行識別所獲得的識別編碼信息;錯誤檢測單元,該錯誤檢測單元用于利用該第一識別單元獲得該識別編碼信息和位置信息檢測錯誤切分的圖像單元;錯誤修正単元,該錯誤修正単元用于對該錯誤檢測單元檢測出的該錯誤切分的圖像單元進(jìn)行修正;第二識別單元,該第二識別單元用于對該錯誤修正単元修正后的該圖像單元進(jìn)行識別,以獲得相應(yīng)的識別編碼信息。根據(jù)本發(fā)明實(shí)施例的另ー個方面提供了ー種漢字識別方法,該方法包括第一識別步驟,對文本圖像進(jìn)行切分和識別,以獲得識別信息;其中,該識別信息包括對該文本圖像進(jìn)行切分后獲得的多個圖像単元在該文本圖像中的位置信息、以及對該圖像單元進(jìn)行識別獲得的識別編碼信息;錯誤檢測步驟,利用該識別信息中的該識別編碼信息和位置信息檢測錯誤切分的圖像單元;錯誤修正步驟,對檢測出的該錯誤切分的圖像單元進(jìn)行修正;第二識別步驟,對修正后的該圖像單元進(jìn)行識別,以獲得相應(yīng)的識別編碼信息。本發(fā)明實(shí)施例的有益效果在干通過對文本圖像進(jìn)行切分和識別以獲得識別信息,利用該識別信息中的識別編碼信息和圖像單元位置信息查找錯誤切分的圖像單元,合并相鄰的錯誤切分的圖像單元,并將合并的圖像単元替換該切分錯誤的圖像單元,從而可提聞識別精度,解決現(xiàn)有技術(shù)中存在的問題。參照后文的說明和附圖,詳細(xì)公開了本發(fā)明的特定實(shí)施方式,指明了本發(fā)明的原理可以被采用的方式。應(yīng)該理解,本發(fā)明的實(shí)施方式在范圍上并不因而受到限制。在所附權(quán)利要求的精神和條款的范圍內(nèi),本發(fā)明的實(shí)施方式包括許多改變、修改和等同。針對ー種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個或更多個其它實(shí)施方式中使用,與其它實(shí)施方式中的特征相組合,或替代其它實(shí)施方式中的特征。應(yīng)該強(qiáng)調(diào),術(shù)語“包括/包含”在本文使用時指特征、整件、步驟或組件的存在,但并不排除一個或更多個其它特征、整件、步驟或組件的存在或附加。圖I是現(xiàn)有技術(shù)中光學(xué)識別引擎的結(jié)構(gòu)示意圖;圖2是利用光學(xué)識別引擎的切分模塊101對文本圖像進(jìn)行切分后的圖像單元的示意圖3是對切分后的圖像單元進(jìn)行選擇的示意圖;圖4是左右結(jié)構(gòu)的標(biāo)準(zhǔn)漢字的示意圖;圖5是三個定寬漢字的示意圖;圖6是本發(fā)明實(shí)施例I的漢字識別裝置構(gòu)成示意圖;圖7是圖6中的錯誤檢測單元的構(gòu)成示意圖;圖8是圖7中字寬計算單元的構(gòu)成示意圖;圖9是本發(fā)明實(shí)施例I中各個圖像單元的位置信息示意圖;圖10是圖7中檢測單元的構(gòu)成示意圖;圖11是圖6中錯誤修正單元的構(gòu)成示意圖;圖12是本發(fā)明實(shí)施例2的漢字識別方法流程圖;圖13是本發(fā)明實(shí)施例3的漢字識別方法的應(yīng)用實(shí)例流程圖;圖14是對文本圖像分別利用現(xiàn)有的OCR技術(shù)和本發(fā)明實(shí)施例的識別方法進(jìn)行識別的識別結(jié)果示意圖。具體實(shí)施例方式下面結(jié)合附圖對本發(fā)明的各種實(shí)施方式進(jìn)行說明。這些實(shí)施方式只是示例性的,不是對本發(fā)明的限制。為了使本領(lǐng)域的技術(shù)人員能夠容易地理解本發(fā)明的原理和實(shí)施方式,本發(fā)明的實(shí)施方式以下述的漢字識別裝置為例進(jìn)行說明。在實(shí)現(xiàn)本發(fā)明的過程中發(fā)明人發(fā)現(xiàn),目前漢字排版一般采用固定寬度的漢字字形,如圖5所示,展示了三個定寬漢字的例子,這樣排版結(jié)果整齊清晰易于閱讀。因此,對于采用固定寬度漢字字形排版的漢字圖像,可以認(rèn)為該圖像中的漢字圖像単元都具有相同的寬度。若利用寬度信息檢測錯誤切分的圖像單元可提高識別精度,并且該方法簡單容易實(shí)現(xiàn),并解決現(xiàn)有技術(shù)中存在的上述問題,圖6是本發(fā)明實(shí)施例I的漢字識別裝置的構(gòu)成示意圖。如圖6所示,該裝置包括第一識別單元601、錯誤檢測單元602、錯誤修正単元603和第二識別單元604;其中,第一識別單元601,用于對文本圖像進(jìn)行切分和識別,以獲得識別信息;其中,該識別信息包括對文本圖像進(jìn)行切分后獲得的多個圖像単元(Segments)在文本圖像中的位置信息、以及對圖像單元進(jìn)行識別所獲得的識別編碼信息;錯誤檢測單元602,用于利用第一識別單601獲得該識別編碼信息和位置信息檢測錯誤切分的圖像單元;錯誤修正単元603,用于對錯誤檢測単元602檢測出的錯誤切分的圖像單元進(jìn)行修正;第二識別單元604,用于對錯誤修正単元603修正后的圖像單元進(jìn)行識別,以獲得相應(yīng)的識別編碼信息。在本實(shí)施例中,第一識別單元601對文本圖像進(jìn)行切分后獲得的多個圖像單元可采用矩形表示,該圖像単元在文本圖像中的位置信息可以是各個圖像単元在ー維方向上的坐標(biāo)信息;但不限于上述表示方式,還可采用其他形式來表示,對于其他形式表示的位置信息比如輪廓表示的単元,可通過投影輪廓的坐標(biāo)信息得到一維坐標(biāo)信息,其中輪廓是指圖像単元的外邊界;并且第一識別單元601對圖像単元進(jìn)行識別所獲得的識別編碼信息是標(biāo)準(zhǔn)漢字的數(shù)字表示,例如可采用漢字國際擴(kuò)展碼GBK或者采用統(tǒng)ー碼UNICODE表示,每個識別編碼信息對應(yīng)ー個漢字。在第一識別單元601對文本圖像進(jìn)行切分和識別后,可能會由于錯誤切分而導(dǎo)致最終的錯誤識別,如圖2所示,對于“信”被切分為“イ”和“言”;對于“外”,被切分為“夕”和“卜”,并且切分后的圖像單元分別對應(yīng)兩個標(biāo)準(zhǔn)漢字。雖然可采用
      背景技術(shù)
      中的方法結(jié)合識別技術(shù)對錯誤切分的圖像單元進(jìn)行檢測并修正,但是對于左右結(jié)構(gòu)的漢字且切分后左部分和右部分均為標(biāo)準(zhǔn)漢字的情況,無法采用上述方法解決,但通過本發(fā)明實(shí)施例I的裝置,錯誤檢測單元602可利用多個圖像単元在文本圖像中的位置信息獲得的平均字寬(ACW)和識別編碼信息來檢測錯誤切分的圖像單元;并且錯誤修正単元603可對檢測出的相鄰的兩個錯誤切分的圖像單元進(jìn)行合并,并且將合并后的圖像單元替換相鄰的兩個錯誤切分的圖像單元,從而提高識別精度,解決現(xiàn)有技術(shù)中存在的上述問題。在錯誤修正單元603對相鄰的兩個錯誤切分的圖像單元進(jìn)行修正后,第二識別單元604可對修正后的圖像單元重新進(jìn)行識別,從而獲得該修正后的圖像單元對應(yīng)的識別編碼信息,這樣,將第一識別單元601獲得的識別編碼信息與第二識別單元602修正后的識別編碼信息相結(jié)合,最終可獲得對該文本圖像進(jìn)行識別的識別編碼信息。在本實(shí)施例中,該裝置還可包括文字輸出單元(未示出),用于將第一識別單元601和第二識別單元602獲得的該識別編碼信息對應(yīng)的標(biāo)準(zhǔn)漢字輸出。在上述實(shí)施例中,第一識別單元601和第二識別單元604可采用OCR引擎實(shí)現(xiàn),具體的切分和識別方式與現(xiàn)有技術(shù)類似,此處不再贅述。在上述實(shí)施例中,各個單元可使用邏輯部件構(gòu)成,該邏輯部件例如為現(xiàn)場可編程邏輯部件、微處理器、計算機(jī)中使用的處理器等。由上述實(shí)施例可知,通過對文本圖像進(jìn)行切分和識別以獲得識別信息,利用該識別信息中的識別編碼信息和圖像單元位置信息查找錯誤切分的圖像單元,合并相鄰的錯誤切分的圖像單元,并將合并的圖像単元替換該切分錯誤的圖像單元,從而可提高識別精度,解決現(xiàn)有技術(shù)中存在的問題。在上述實(shí)施例中,錯誤檢測單元602可利用多個圖像単元在文本圖像中的位置信息獲得的平均字寬(ACW)和識別編碼信息來檢測錯誤切分的圖像單元。圖7是圖6所示的錯誤檢測單元的構(gòu)成示意圖。如圖7所示,錯誤檢測單元602可具體包括字寬計算単元701和檢測單元702;其中,字寬計算単元701,用于利用第一識別單元601獲得的位置信息確定平均字寬(ACff);檢測單元702,用于利用第一識別單元601獲得的識別編碼信息和平均字寬對多個圖像單元逐一進(jìn)行檢測,以找到半字寬(HWS)的圖像單元,該半字寬的圖像単元為檢測出的錯誤切分的圖像單元。通過識別編碼信息和利用位置信息獲得的平均字寬可檢測出錯誤切分的圖像單元,檢測方法簡單,解決了現(xiàn)有技術(shù)中無法檢測左右結(jié)構(gòu)的標(biāo)準(zhǔn)漢字且左部分和右部分均為標(biāo)準(zhǔn)漢字的切分錯誤的問題。圖8是圖7中字寬計算單元701的構(gòu)成示意圖。如圖7所示,字寬計算單元701包括寬度計算單元801、排序單元802和字寬確定単元803;其中,寬度計算單元801,用于利用第一識別單元701獲得的位置信息計算出每個圖像単元的寬度;排序單元802,用于將所有圖像單元的寬度置于ー個數(shù)組并進(jìn)行排序;字寬確定單元803用于將數(shù)組中的中位數(shù)作為平均字寬。在上述實(shí)施例中,若圖像單元采用矩形表示,則各個圖像單元在文本圖像中的位置信息可以通過各個圖像単元在ー維方向上的坐標(biāo)信息表示,這樣通過每個圖像單元所在的矩形的邊長的兩個端點(diǎn)在ー維方向上的坐標(biāo)值來計算每個圖像単元的寬度。圖9是本發(fā)明實(shí)施例I中各個圖像單元的位置信息示意圖(單位為cm)。如圖9所示,例如第一個圖像単元“イ”所在矩形的邊長的兩個端點(diǎn)的坐標(biāo)值分別為(0,0.5),第ニ個圖像単元“言”所在矩形的邊長的兩個端點(diǎn)的坐標(biāo)值分別為(0.5,I.5),第三個圖像單元“息”所在矩形的邊長的兩個端點(diǎn)的坐標(biāo)值分別為(I.5,3.0),依次類推。這樣,寬度計算單元801可根據(jù)上述坐標(biāo)值分別計算出各個圖像単元的寬度,如第一個圖像単元的寬度為0.5,第二個圖像単元的寬度為I.0,第三個圖像単元的寬度為I.5,依次類推,可計算出所有圖像單元的寬度。排序單元802將所有圖像單元的寬度置于ー個數(shù)組并進(jìn)行排序,其中,可按照寬度從小到大或者從大到小的順序進(jìn)行排序。字寬確定単元803可將數(shù)組中的中位數(shù)作為平均字寬,若寬度個數(shù)為奇數(shù)個,可取中間的值作為中位數(shù),若寬度個數(shù)為偶數(shù)個,可取中間的兩個值其中之作為中位數(shù),并將該中位數(shù)作為平均字寬(ACW)。圖10是圖7中檢測單元的構(gòu)成示意圖。如圖10所示,在檢測單元702利用識別編碼信息和平均字寬對ー個圖像單元進(jìn)行檢測時,檢測単元702包括第一判斷単元1001、第ニ判斷単元1002和第一確定單元1003;其中,第一判斷単元1001,用于判斷檢測的圖像單元對應(yīng)的第一個候選識別編碼是否為標(biāo)準(zhǔn)漢字編碼,其中,該第一候選編碼為識別編碼信息中的第一個編碼信息,其對應(yīng)的標(biāo)準(zhǔn)漢字為識別出的與實(shí)際的漢字最接近;第二判斷單元1002,用于在第一判斷単元1001的判斷結(jié)果為是時,判斷圖像單元的寬度是否小于平均字寬與預(yù)定參數(shù)的乘積,其中,預(yù)定參數(shù)為小于I且大于0的數(shù)值,其中,該預(yù)定參數(shù)可選擇0-1之間的任意數(shù)值,例如,可選擇2/3等;第一確定單元1003,用于在第二判斷単元1002的判斷結(jié)果為是時,確定檢測的圖像單元為半字寬的圖像単元(HWS),將該半字寬的圖像單元作為檢測出的錯誤切分的圖像單元。這樣,通過上述檢測單元可對所有的圖像單元進(jìn)行檢測,最終獲得所有的錯誤切分的圖像單元。圖11是圖6中錯誤修正單元的構(gòu)成示意圖。如圖10所示,錯誤修正單元603包括合并單兀1101和替換單兀1002;其中,合并單元1101,用于將檢測單元檢測出的相鄰的兩個半字寬的圖像單元進(jìn)行合井;替換單元1102,用于將合并單元1101合并后的圖像單元替換該相鄰的兩個半字寬的圖像單元。通過上述方法,可將錯誤切分的圖像單元進(jìn)行修正,尤其是對于左右結(jié)構(gòu)的漢字且左右部分均為標(biāo)準(zhǔn)漢字的錯誤切分進(jìn)行修正,最終提高識別精度。在上述實(shí)施例中,各個單元可使用邏輯部件構(gòu)成,該邏輯部件例如為現(xiàn)場可編程邏輯部件、微處理器、計算機(jī)中使用的處理器等。由上述實(shí)施例可知,通過對文本圖像進(jìn)行切分和識別以獲得識別信息,利用該識別信息中的識別編碼信息和圖像單元位置信息查找錯誤切分的圖像單元,合并相鄰的錯誤切分的圖像單元,并將合并的圖像単元替換該切分錯誤的圖像單元,從而可提高識別精度,解決現(xiàn)有技術(shù)中存在的問題。圖12是本發(fā)明實(shí)施例2的漢字識別方法流程圖。如圖12所示,該方法包括步驟1201,第一識別步驟,對文本圖像進(jìn)行切分和識別,以獲得識別信息;其中,該識別信息包括對該文本圖像進(jìn)行切分后獲得的多個圖像単元在該文本圖像中的位置信息、以及對該圖像單元進(jìn)行識別獲得的識別編碼信息;步驟1202,錯誤檢測步驟,利用該識別信息中的該識別編碼信息和位置信息檢測錯誤切分的圖像單元;步驟1203,錯誤修正步驟,對檢測出的該錯誤切分的圖像單元進(jìn)行修正;步驟1204,第二識別步驟,對修正后的該圖像單元進(jìn)行識別,以獲得相應(yīng)的識別編石馬ィ目息?!び缮鲜鰧?shí)施例可知,通過對文本圖像進(jìn)行切分和識別以獲得識別信息,利用該識別信息中的識別編碼信息和圖像單元位置信息查找錯誤切分的圖像單元,合并相鄰的錯誤切分的圖像單元,并將合并的圖像単元替換該切分錯誤的圖像單元,從而可提高識別精度,解決現(xiàn)有技術(shù)中存在的問題。在本實(shí)施例中,在步驟1202中,可利用多個圖像單元在文本圖像中的位置信息獲得的平均字寬(ACW)和識別編碼信息來檢測錯誤切分的圖像單元,可采用如下方式檢測錯誤切分的圖像單元利用該位置信息確定平均字寬;利用該識別編碼信息和該平均字寬對該多個圖像単元逐一進(jìn)行檢測,以找到半字寬的圖像単元,其中該半字寬的圖像単元為檢測出的錯誤切分的圖像單元。其中,具體的利用該位置信息確定平均字寬的方法如實(shí)施例I中所述,可包括利用該位置信息計算出每個圖像単元的寬度;將所有圖像單元的寬度置于ー個數(shù)組并進(jìn)行排序;將該數(shù)組中的中位數(shù)作為平均字寬。此外,在利用識別編碼信息和平均字寬對多個圖像単元中的一個圖像単元進(jìn)行檢測時,可具體采用如下方式判斷檢測的該圖像単元對應(yīng)的第一個候選識別編碼是否為標(biāo)準(zhǔn)漢字編碼;若判斷結(jié)果為是,則進(jìn)一歩判斷該圖像単元的寬度是否小于該平均字寬與預(yù)定參數(shù)的乘積,其中,該預(yù)定參數(shù)為小于I且大于O的數(shù)值;若判斷結(jié)果為是,則確定檢測的該圖像單元為半字寬的圖像單元,此處,將半字寬的圖像単元作為錯誤切分的圖像單元。在本實(shí)施例中,在步驟1203中,可采用如下方式對相鄰的半字寬的圖像單元進(jìn)行修正將檢測出的相鄰的兩個半字寬的圖像單元進(jìn)行合并;將合并后的圖像單元替換該相鄰的兩個半字寬的圖像単元。以下結(jié)合具體的實(shí)例對本發(fā)明的漢字識別方法進(jìn)行說明。圖13是本發(fā)明實(shí)施例3的漢字識別方法的應(yīng)用實(shí)例流程圖,圖14是對文本圖像分別利用現(xiàn)有的OCR技術(shù)和本發(fā)明實(shí)施例的識別方法進(jìn)行識別的識別結(jié)果示意圖。如圖13所示,該方法可包括步驟步驟1301,對文本圖像進(jìn)行切分和識別,以獲得識別信息;其中,該識別信息包括對該文本圖像進(jìn)行切分后獲得的多個圖像単元在該文本圖像中的位置信息、以及對該圖像單元進(jìn)行識別獲得的識別編碼信息;其中,該識別編碼信息和位置信息如實(shí)施例I中所述,此處不再贅述。步驟1302,利用步驟1301中獲得的位置信息確定平均字寬;其中,具體包括利用該位置信息計算出每個圖像単元的寬度;將所有圖像單元的寬度置于ー個數(shù)組并進(jìn)行排序;將該數(shù)組中的中位數(shù)作為平均字寬。步驟1303,利用該識別編碼信息和該平均字寬對該多個圖像単元逐一進(jìn)行檢測,以找到半字寬的圖像単元,其中該半字寬的圖像単元為檢測出的錯誤切分的圖像單元;其中,在對多個圖像單元中的一個圖像單元進(jìn)行檢測時,可采用如下方式判斷檢測的該圖像單元對應(yīng)的第一個候選識別編碼是否為標(biāo)準(zhǔn)漢字編碼;若判斷結(jié)果為是,則進(jìn)一歩判斷該圖像単元的寬度是否小于該平均字寬與預(yù)定參數(shù)的乘積,其中,該預(yù)定參數(shù)為小于I且大于O的數(shù)值;若判斷結(jié)果為是,則確定檢測的該圖像單元為半字寬的圖像単元,此處,將半字寬的圖像単元作為錯誤切分的圖像單元。步驟1304,將檢測出的相鄰的兩個半字寬的圖像單元進(jìn)行合井。步驟1305,將合并后的圖像單元替換該相鄰的兩個半字寬的圖像単元。步驟1306,對修正后的該圖像單元進(jìn)行識別,以獲得相應(yīng)的識別編碼信息。步驟1307,輸出修正后的所有識別編碼信息對應(yīng)的漢字;其中所有識別編碼信息可包括步驟1301中被修正的圖像單元以外的圖像單元對應(yīng)的識別編碼信息、以及修正后的圖像單元對應(yīng)的識別編碼信息。如圖14所示,在使用現(xiàn)有的OCR識別技術(shù)進(jìn)行識別時,其識別結(jié)果見1401,其中,對于“外”被識別為“外”和“卜”;“信”被識別為“イ”和“育”,導(dǎo)致識別精度較低。如圖14所示,通過使用本發(fā)明實(shí)施例的上述識別方法,可對上述文本圖像進(jìn)行精確的識別,減少識別錯誤的發(fā)生,見1402。由上述實(shí)施例可知,通過對文本圖像進(jìn)行切分和識別以獲得識別信息,利用該識別信息中的識別編碼信息和圖像單元位置信息查找錯誤切分的圖像單元,合并相鄰的錯誤切分的圖像單元,并將合并的圖像単元替換該切分錯誤的圖像單元,從而可提高識別精度,解決現(xiàn)有技術(shù)中存在的問題。由上述實(shí)施例可知,通過對文本圖像進(jìn)行切分和識別以獲得識別信息,利用該識別信息中的識別編碼信息和圖像單元位置信息查找錯誤切分的圖像單元,合并相鄰的錯誤切分的圖像單元,并將合并的圖像単元替換該切分錯誤的圖像單元,從而可提高識別精度,解決現(xiàn)有技術(shù)中存在的問題。本發(fā)明以上的裝置和方法可以由硬件實(shí)現(xiàn),也可以由硬件結(jié)合軟件實(shí)現(xiàn)。本發(fā)明涉及這樣的計算機(jī)可讀程序,當(dāng)該程序被邏輯部件所執(zhí)行吋,能夠使該邏輯部件實(shí)現(xiàn)上文所述的裝置或構(gòu)成部件,或使該邏輯部件實(shí)現(xiàn)上文所述的各種方法或步驟。該邏輯部件例如為現(xiàn)場可編程邏輯部件、微處理器、計算機(jī)中使用的處理器等。本發(fā)明還涉及用于存儲以上程序的存儲介質(zhì),如硬盤、磁盤、光盤、DVD、flash存儲器等。以上結(jié)合具體的實(shí)施方式對本發(fā)明進(jìn)行了描述,但本領(lǐng)域技術(shù)人員應(yīng)該清楚,這些描述都是示例性的,并不是對本發(fā)明保護(hù)范圍的限制。本領(lǐng)域技術(shù)人員可以根據(jù)本發(fā)明的精神和原理對本發(fā)明做出各種變型和修改,這些變型和修改也在本發(fā)明的范圍內(nèi)。權(quán)利要求1.ー種漢字識別裝置,所述裝置包括第一識別單元,所述第一識別單元用于對文本圖像進(jìn)行切分和識別,以獲得識別信息;其中,所述識別信息包括對所述文本圖像進(jìn)行切分后獲得的多個圖像単元在所述文本圖像中的位置信息、以及對所述圖像単元進(jìn)行識別所獲得的識別編碼信息;錯誤檢測單元,所述錯誤檢測單元用于利用所述第一識別單元獲得所述識別編碼信息和位置信息檢測錯誤切分的圖像單元;錯誤修正単元,所述錯誤修正単元用于對所述錯誤檢測單元檢測出的所述錯誤切分的圖像單元進(jìn)行修正;第二識別單元,所述第二識別單元用于對所述錯誤修正単元修正后的所述圖像單元進(jìn)行識別,以獲得相應(yīng)的識別編碼信息。2.根據(jù)權(quán)利要求I所述的裝置,其中,所述錯誤檢測單元包括字寬計算単元,所述字寬計算單元用于利用所述第一識別單元獲得的位置信息確定平均字寬;檢測單元,所述檢測単元用于利用所述第一識別單元獲得的所述識別編碼信息和所述平均字寬對所述多個圖像單元逐一進(jìn)行檢測,以找到半字寬的圖像単元,所述半字寬的圖像単元為檢測出的錯誤切分的圖像單元。3.根據(jù)權(quán)利要求2所述的裝置,其中,所述字寬計算單元包括寬度計算單元,所述寬度計算單元用于利用所述第一識別單元獲得的位置信息計算出每個圖像単元的寬度;排序單元,所述排序単元用于將所有圖像單元的寬度置于ー個數(shù)組并進(jìn)行排序;字寬確定単元,所述字寬確定單元用于將所述數(shù)組中的中位數(shù)作為平均字寬。4.根據(jù)權(quán)利要求2所述的裝置,其中,所述檢測単元利用所述識別編碼信息和平均字寬對ー個圖像單元進(jìn)行檢測時,包括第一判斷単元,所述第一判斷単元用于判斷檢測的所述圖像単元對應(yīng)的第一個候選識別編碼是否為標(biāo)準(zhǔn)漢字編碼;第二判斷単元,所述第二判斷単元用于在所述第一判斷単元的判斷結(jié)果為是時,判斷所述圖像単元的寬度是否小于所述平均字寬與預(yù)定參數(shù)的乘積,其中,所述預(yù)定參數(shù)為小于I且大于O的數(shù)值;第一確定單元,所述第一確定單元用于在所述第二判斷単元的判斷結(jié)果為是時,確定檢測的所述圖像單元為半字寬的圖像単元。5.根據(jù)權(quán)利要求2所述的裝置,其中,所述錯誤修正単元包括合并單元,所述合并単元用于將所述檢測単元檢測出的相鄰的兩個半字寬的圖像単元進(jìn)行合并;替換單元,所述替換単元用于將所述合并単元合并后的圖像單元替換所述相鄰的兩個半字寬的圖像単元。6.ー種漢字識別方法,所述方法包括第一識別步驟,對文本圖像進(jìn)行切分和識別,以獲得識別信息;其中,所述識別信息包括對所述文本圖像進(jìn)行切分后獲得的多個圖像単元在所述文本圖像中的位置信息、以及對所述圖像單元進(jìn)行識別獲得的識別編碼信息;錯誤檢測步驟,利用所述識別信息中的所述識別編碼信息和位置信息檢測錯誤切分的圖像單元;錯誤修正步驟,對檢測出的所述錯誤切分的圖像單元進(jìn)行修正;第二識別步驟,對修正后的所述圖像單元進(jìn)行識別,以獲得相應(yīng)的識別編碼信息。7.根據(jù)權(quán)利要求6所述的方法,其中,所述錯誤檢測步驟包括利用所述位置信息確定平均字寬;利用所述識別編碼信息和所述平均字寬對所述多個圖像單元逐一進(jìn)行檢測,以找到半字寬的圖像単元,其中所述半字寬的圖像単元為檢測出的錯誤切分的圖像單元。8.根據(jù)權(quán)利要求7所述的方法,其中,所述利用識別編碼信息和平均字寬對ー個圖像單元進(jìn)行檢測時,包括判斷檢測的所述圖像単元對應(yīng)的第一個候選識別編碼是否為標(biāo)準(zhǔn)漢字編碼;若判斷結(jié)果為是,則進(jìn)一歩判斷所述圖像単元的寬度是否小于所述平均字寬與預(yù)定參數(shù)的乘積,其中,所述預(yù)定參數(shù)為小于I且大于O的數(shù)值;若判斷結(jié)果為是,則確定檢測的所述圖像單元為半字寬的圖像単元。9.根據(jù)權(quán)利要求7所述的方法,其中,所述利用位置信息獲得平均字寬,包括利用所述位置信息計算出每個圖像単元的寬度;將所有圖像單元的寬度置于ー個數(shù)組并進(jìn)行排序;將所述數(shù)組中的中位數(shù)作為平均字寬。10.根據(jù)權(quán)利要求7所述的方法,其中,所述錯誤修正步驟包括將檢測出的相鄰的兩個半字寬的圖像單元進(jìn)行合并;將合并后的圖像單元替換所述相鄰的兩個半字寬的圖像單元。全文摘要本發(fā)明提供一種漢字識別裝置和方法,該裝置包括第一識別單元用于對文本圖像進(jìn)行切分和識別,以獲得識別信息;錯誤檢測單元,用于利用該第一識別單元獲得識別信息中圖像單元的位置信息和識別編碼信息檢測錯誤切分的圖像單元;錯誤修正單元,用于對該錯誤檢測單元檢測出的該錯誤切分的圖像單元進(jìn)行修正;第二識別單元,用于對該錯誤修正單元修正后的該圖像單元進(jìn)行識別,以獲得相應(yīng)的識別編碼信息。通過本發(fā)明實(shí)施例,利用對文本圖像進(jìn)行識別后獲得的識別信息中的識別編碼信息和圖像單元位置信息檢測錯誤切分的圖像單元并對錯誤切分的圖像單元進(jìn)行修正,從而可提高識別精度,解決現(xiàn)有技術(shù)中存在的問題。文檔編號G06K9/20GK102867178SQ20111018713公開日2013年1月9日申請日期2011年7月5日優(yōu)先權(quán)日2011年7月5日發(fā)明者徐文權(quán),河源,孫俊,于浩,直井聰申請人:富士通株式會社
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1