国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種彎曲書面文字識別方法

      文檔序號:8488101閱讀:1708來源:國知局
      一種彎曲書面文字識別方法
      【專利說明】
      所屬技術(shù)領(lǐng)域
      [0001]本發(fā)明屬于數(shù)字圖像處理技術(shù),涉及一種彎曲書面文字識別方法。
      【背景技術(shù)】
      [0002]隨著現(xiàn)代科技的不斷進步和發(fā)展,電子產(chǎn)品的大量普及,越來越多的人們選擇在電子平臺進行閱讀和學習。但是大量的文檔只有紙質(zhì)版,這就需要將大量的紙質(zhì)文檔進行電子化并進行文字識別。由于數(shù)碼相機的便攜性、方便性,越來越多的人采用數(shù)碼相機對文檔進行圖像采集,在對書面進行電子化的時候,一些文檔由于厚度較大,不能完全的展平,因此采集的圖像大多會出現(xiàn)類似于柱面中間凸、兩邊凹的現(xiàn)象。為了便于閱讀和識別,后期處理需要將彎曲書面圖像展平?,F(xiàn)如今存在的曲面展平技術(shù)大多需要曲面多個角度的圖像組合一起,求出圖像的3D信息,然后進行展平,這種技術(shù)圖像采集比較麻煩,因此如何更方便、更準確、更簡單的進行彎曲書面矯正,為文字識別創(chuàng)造好的基礎(chǔ)成為人們追求的目標。

      【發(fā)明內(nèi)容】

      [0003]本發(fā)明的目的是提供一種速度快效果好的彎曲書面文字識別方法。本發(fā)明的技術(shù)方案如下:
      [0004]一種彎曲書面文字識別方法,包括下列步驟:
      [0005]I)采集彎曲書面的曲面圖像;
      [0006]2)對曲面圖像進行預(yù)處理,獲取各個文本行連通區(qū)域;
      [0007]3)求取各個文本行的基準線及基準線方程fn(x),X e (0,len),n e (1,N),N為基準線數(shù)量,Ien曲面圖像的寬度,fn(x)表示基準線的縱坐標值,X表示基準線的橫坐標值,下標η表示不同的基準線;
      [0008]4)采用Hough變換檢測彎曲書面所有基準線中,最長的直線部分,直線所在方向即為彎曲書面圖像展平的方向;
      [0009]5)求出Hough變換所得最長直線部分的角度,并將圖像順時針旋轉(zhuǎn)相應(yīng)的角度,使圖像展平的方向變?yōu)樗椒较?,并?)中得到的基準線方程也要進行相應(yīng)的變換,得到全新的基準線方程Fn(X);
      [0010]6)求出每條基準線方程Fn(X)斜率為O時,其橫坐標的值Xtl,并求得其對應(yīng)縱坐標的值Fn(Xtl),斜率為O時縱坐標的值,決定著其所在基準線展開后縱坐標的值。
      [0011]7)曲面中最頂部一條基準線F1(X)上面的區(qū)域只有一邊存在基準線,對此區(qū)域每列像素豎直向下移動F1(X)-Fn(Xtl)像素距離,將此區(qū)域下邊的基準線變?yōu)樗降模?br>[0012]8)曲面中最頂部一條基準線F1(X)和最底部一條基準線Fn(X)中間區(qū)域兩邊都存在基準線,圖像展平后兩邊基準線之間的距離Fn+1 (?)-Fn(Xtl)與圖像展平前兩邊基準線之間的差值Fn+1 (x) -Fn (x)不一定相等,所以對此區(qū)域每列像素進行豎直移動加縮放處理,采用雙線性內(nèi)插值算法進行縮放;
      [0013]9)曲面中最底部一條基準線Fn(X)下面的區(qū)域只有一邊存在基準線,對此區(qū)域每列像素豎直向下移動Fn(X)-Fn(Xci)像素距離,將此區(qū)域上邊的基準線變?yōu)樗降模?br>[0014]10)對經(jīng)過上述操作展平的彎曲書面圖像進行文字識別。
      [0015]作為優(yōu)選實施方式,步驟2)采用如下的預(yù)處理方法:
      [0016]a)根據(jù)圖像的像素大小和經(jīng)驗值,刪除二值圖像中面積小于一個標點符號面積的對象,去除噪聲的影響,得到經(jīng)過預(yù)處理后的二值圖像;
      [0017]b)設(shè)定一個矩形,其長度根據(jù)兩個字體中心之間的水平距離確定,寬度根據(jù)字體高度的1/2確定,利用此矩形對二值圖像進行形態(tài)學的開閉運算,將每行文本連成同一連通區(qū)域。
      [0018]c)根據(jù)文本行的高度預(yù)設(shè)一個高度閾值,根據(jù)文本行的長度預(yù)設(shè)一個長度閾值;
      [0019]d)計算出每個連通區(qū)域的高度值和寬度值,將高度值大于高度閾值的連通區(qū)域去除,消除書面中高度較高的插圖的影響;將長度值短于長度閾值的連通區(qū)域去除,消除書面中長度較短的文本行的影響;然后刪除面積小于一個字體面積的對象,最終得到各個文本行連通區(qū)域;
      [0020]步驟3)采用的方法為:根據(jù)得到的各個文本行連通區(qū)域的上邊界和下邊界,求出每組上邊界和下邊界對應(yīng)橫坐標的中值,對中值采用三階函數(shù)進行曲線擬合,得到彎曲書面的各個文本行的基準線及其對應(yīng)的方程基準線方程fn(x) = anx2+bnx2+cnx+dn,an,bn,cn,4為常數(shù)。
      [0021]本發(fā)明采用矩形結(jié)構(gòu)對圖像進行形態(tài)學的開閉運算,求出的文本行連通區(qū)域上下邊界能夠跟文本行的上下邊界緊密貼合,使其連通區(qū)域不受字體內(nèi)部比重的影響,求出的中線具有更高的精度。本方法只采用幾種形態(tài)學的開閉運算和三階曲線擬合運算來定位基準線,運算簡單,具有更高的速度,用此類基準線進行曲面書面展開后的圖像具有更平的效果,從而為之后的文字識別打下良好基礎(chǔ)。本發(fā)明的文字識別方法,在進行彎曲書面展平過程中只需單幅圖像,不需要彎曲書面進行多次圖像采集,展開過程簡單、方便。
      【附圖說明】
      [0022]圖1初始圖像
      [0023]圖2形態(tài)學開閉運算后的模糊圖像
      [0024]圖3只含有較長文本行部分的模糊圖像
      [0025]圖4中線定位結(jié)果的局部放大圖像(文本行中白色線條表示中線)
      [0026]圖5基準線定位結(jié)果(文本行中黑色線條表示基準線)
      [0027]圖6基準線定位結(jié)果的局部放大圖像(文本行中黑色線條表示基準線)
      [0028]圖7基準線圖(粗白線部分為檢測出的最長直線)
      [0029]圖8每條基準線斜率為O時的位置(基準線中O點的位置)
      [0030]圖9頂部區(qū)域展平
      [0031]圖10中部區(qū)域展平
      [0032]圖11底部區(qū)域展平
      [0033]圖12前后部分區(qū)域?qū)Ρ葓D,(a)、(c)、(e)為展平前的部分區(qū)域,(b)、(d)、(f)為對應(yīng)的展平后區(qū)域。
      [0034]圖13本發(fā)明采用的基于基準線的彎曲書面展平流程圖
      【具體實施方式】
      [0035]下面結(jié)合附圖和實施例對本發(fā)明進行說明。本發(fā)明具體包括下列步驟:
      [0036]I)采集彎曲書面的曲面圖像,如圖1所示。
      [0037]2)對曲面圖像進行灰度變換,并進行二值化。然后根據(jù)圖像的像素大小和經(jīng)驗值,刪除二值圖像中面積小于一個標點符號面積的對象,去除噪聲的影響,得到經(jīng)過預(yù)處理后的二值圖像。
      [0038]3)設(shè)定一個矩形,其長度根據(jù)兩個字體中心之間的水平距離確定,寬度根據(jù)字體高度的1/2確定,利用此矩形對圖像進行形態(tài)學的開閉運算,將每行文本連成同一連通區(qū)域,如圖2所示。
      [0039]4)根據(jù)文本行的高度預(yù)設(shè)一個高度閾值,大小約為文本行高度的三倍;根據(jù)文本行的長度預(yù)設(shè)一個長度閾值,大小約為文本行最大長度的3/4 ;
      [0040]5)計算出每個連通區(qū)域的高度值和寬度值,將高度值大于高度閾值的連通區(qū)域去除,消除書面中高度較高的插圖的影響;將長度值短于長度閾值的連通區(qū)域去除,消除書面中長度較短的文本行的影響;然后刪除面積小于一個字體面積的對象,最
      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1