国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種圖像表格文字切分方法

      文檔序號:9811011閱讀:526來源:國知局
      一種圖像表格文字切分方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及圖像識別領(lǐng)域,特別涉及一種圖像表格文字切分方法。
      【背景技術(shù)】
      [0002] 圖像識別技術(shù)是目前智能識別技術(shù)領(lǐng)域中非常重要的發(fā)展方向,圖像識別的發(fā)展 經(jīng)歷了三個階段:文字識別、數(shù)字圖像處理與識別、物體識別;其中在眾多的圖像識別技術(shù) 中,對圖像文字的識別技術(shù)顯得尤為重要,這是因為圖像文字往往比單純圖像包含更加重 要的可利用信息,而且圖像文字識別技術(shù)所應(yīng)用的領(lǐng)域也很重要。文字識別一般是識別文 字、字母、數(shù)字和符號,從印刷文字識別到手寫文字識別,應(yīng)用非常廣泛。圖像識別問題的數(shù) 學(xué)本質(zhì)屬于模式空間到類別空間的映射問題。目前,在圖像識別的發(fā)展中,主要有三種識別 方法:統(tǒng)計模式識別、結(jié)構(gòu)模式識別、模糊模式識別。
      [0003] 隨著圖像文字的深入發(fā)展,越來越多種類的圖像文字資料,被納入圖像文字識別 的范疇中,其中表格作為文字?jǐn)?shù)據(jù)記錄匯總最精簡表達(dá)方式,或者數(shù)據(jù)統(tǒng)計、結(jié)果分析中最 常用的表達(dá)格式,是各種數(shù)據(jù)分析工具中基礎(chǔ)工具。表格在各行各業(yè)應(yīng)用的廣泛性不言而 喻。不難看出對于表格式圖像文字識別的重要性,比如對一個企業(yè)年度業(yè)績報表,可能包含 企業(yè)年度業(yè)績中最重要的統(tǒng)計數(shù)據(jù)和分析結(jié)果,這些信息的重要性和概括性是其他任何材 料所比擬不了的,目前的網(wǎng)絡(luò)信息中充斥著各種表格資料,但是很多表格都是以圖片的形 式提供,比如各種掃描檔案文件、PDF文件,自動識別這些圖像表格資料,將圖片類型的表格 內(nèi)容還原成數(shù)字資料是將這些資料進(jìn)行快速處理和分析的基礎(chǔ)。
      [0004] 但是,由于表格資料本身的表格結(jié)構(gòu)特征,使得表格圖像文字的識別比一般的普 通圖像文字資料更加困難。現(xiàn)有文字識別技術(shù)在對圖像中文字識別時,首先需要將圖像中 的字符串切分開,形成包含單個文字的小圖片,然后使用一定的方法對切分后的文字進(jìn)行 識別。而進(jìn)行文字切分最常用的方法為投影法,即是將圖像文字二值化處理后,通過垂直投 影找到兩個文字之間的分界線,根據(jù)分界線將文字切分開來。由于表格的框線的存在,直接 使用傳統(tǒng)的投影法所實現(xiàn)的文字切分和識別就不太現(xiàn)實。同時由于表格本身結(jié)構(gòu)的復(fù)雜多 變,復(fù)雜多變的輪廓框線使得投影法難以實現(xiàn)將表格文字信息的切分。面對大量的圖像表 格數(shù)據(jù)的快速分析需要,亟待一種快速,準(zhǔn)確,完整的圖像表格文字切分方法。

      【發(fā)明內(nèi)容】

      [0005] 本發(fā)明的目的在于克服現(xiàn)有技術(shù)中所存在的上述不足,提供一種圖像表格文字切 分方法,能夠快速準(zhǔn)確的將圖像表格中的文字信息切分出來。本發(fā)明首先檢測出待識別圖 像表格中的單元格,提取出單元格的輪廓點集,根據(jù)單元格的輪廓點集,構(gòu)造出包含單元格 輪廓點集的面積最小的矩形區(qū)域,提取出該矩形區(qū)域的四角頂點坐標(biāo),根據(jù)該四角頂點坐 標(biāo)將對應(yīng)單元格中的文字信息切分提取出來,在單元格內(nèi)容整體切分出來的基礎(chǔ)上,通過 側(cè)向投影實現(xiàn)單元格中的行切分,再通過垂直投影實現(xiàn)每一行的單個文字切分。通過本發(fā) 明方法實現(xiàn)的圖像表格文字切分,單元格切分準(zhǔn)確,切分效率高;克服了一直以來圖像表格 文字識別中切分困難的問題。
      [0006] 為了實現(xiàn)上述發(fā)明目的,本發(fā)明提供以下技術(shù)方案,
      [0007] 一種圖像表格文字切分方法,包含以下實現(xiàn)過程:
      [0008] 將待處理圖片進(jìn)行二值化處理,檢測出所述圖像表格中的單元格,依次將各單元 格中的內(nèi)容作為一個整體切分出來,形成對應(yīng)的子圖片;
      [0009] 再使用投影法將子圖片中的文字信息切分出來。
      [0010] 具體的,本圖像表格文字切分方法采用以下實現(xiàn)步驟:
      [0011] (1)將待處理圖像表格進(jìn)行二值化處理,使用openCV圖像處理工具中的 f indcontours函數(shù)檢測出圖像表格單元格輪廓;將檢測出的單元格輪廓的點集提取出來放 置在對應(yīng)的點類中(如:用Vectorl,Vector2,Vector3......來表示);f indcontours函數(shù)能 夠根據(jù)表格框線輪廓的特點將單元格的輪廓檢測出來,并將檢測出的單元格輪廓點集提取 出來,檢測效率高。
      [0012] (2)對所述步驟(1)提取出的單元格輪廓點集,調(diào)用minAreaRect函數(shù)構(gòu)建出包含 單元格輪廓點集的面積最小的旋轉(zhuǎn)矩形區(qū)域;并提取出該旋轉(zhuǎn)矩形區(qū)域的四角頂點坐標(biāo) 占 .
      [0013] (3)根據(jù)四角頂點坐標(biāo)值將對應(yīng)單元格中的文字信息作為整體切分出來,形成對 應(yīng)的子圖片;
      [0014] (4)采用投影法將所述子圖片中的文字信息依次切分出來。
      [0015]進(jìn)一步的,所述步驟(3)中根據(jù)minAreaRect函數(shù)提取出的旋轉(zhuǎn)矩形區(qū)域的四角頂 點坐標(biāo),計算出表格單元文字信息切分點,比如提取出的四角頂點坐標(biāo)分別是:左下角頂點 的坐標(biāo)為(xl,yl),右下角頂點的坐標(biāo)為(x2,y2),右上角頂點的坐標(biāo)為(x3,y3),左上角頂 點的坐標(biāo)為(x4,y4);在四角頂點坐標(biāo)的基礎(chǔ)上,比較X1、x4的大小,選取其中的較大值Max (X1,x4),比較x2、x3的大小,選取其中的較小值Min(x2,x3),比較y 1、y2的大小,選取其中的 較大值Max(yl,y2),比較y3、y4的大小,選取其中的較小值Min(y3,y4),根據(jù)X = Max(xl, x4),X=Min(x2,x3),Y = Max(yl,y2),Y=Min(y3,y4);將這四條直線所圍成的矩形區(qū)域?qū)?單元格中的文字信息作為整體切分出來,形成對應(yīng)子圖片。實際應(yīng)用中圖像表格在進(jìn)行識 別時,不帶任何傾斜角度的情況極其少見,即使經(jīng)過初步的矯正,仍然可能帶有小角度的傾 斜,此外利用minAreaRect函數(shù)提取出的旋轉(zhuǎn)矩形區(qū)域也有可能具有小角度的傾斜,本發(fā)明 利用這種圖像表格識別的特點,通過上述單元格內(nèi)容切分方法,在進(jìn)行單元格文字信息切 分過程中,巧妙的將單元格子圖片的邊框線去除了,為后續(xù)步驟的單元格文字信息切分創(chuàng) 造了有利的條件。
      [0016] 進(jìn)一步的,所述步驟(4)中,根據(jù)橫向投影和縱向投影坐標(biāo)確定每個文字的坐標(biāo)位 置,根據(jù)坐標(biāo)位置可以依次把單個文字切分出來,子圖片中切分出來的文字可以按照原有 的順序進(jìn)行識別,保證了子圖片中文字識別的順序和邏輯準(zhǔn)確性。
      [0017] 進(jìn)一步的,所述步驟(4)中對切分出來的單元格文字圖像進(jìn)行側(cè)向投影,計算出一 行的非〇像素的個數(shù),并將該值放到pro jection_y類中。每一行非0像素的計算方法為:
      ,i是行數(shù),j是列數(shù),pix(i,j)是對應(yīng)像素值,n+1是總的列數(shù)。
      [0018] 進(jìn)一步的,所述步驟(4)中對projection_y類中的元素進(jìn)行遍歷,變量k遍歷范圍 為從1開始到pro jection_y · size( )-1結(jié)束。如果pro jection_y[k] =0,pro jection_y[k+l ] >0, project ion_y[k+2]>0,則判斷k為某一行的起始切分點,并將其放到類vector〈int> top中;如果pro jection_y[k] = 0,pro jection_y[k_l] >0,pro jection_y [k_2] >0,則判斷 k為某一行的終點切分點,并將其放到類vector〈int>bottom中;top. size() = bottom, size ()?;陬恡op和bottom中的元素值即可將單元格中的文字行向切分出來,對應(yīng)的兩個坐標(biāo) 值也就是該行所有文字的上下兩個y坐標(biāo)。
      [0019]進(jìn)一步的,對于切分出來的每一行的文字圖像進(jìn)行垂直投影,計算出一列的非0像 素的個數(shù),并將該值放到P r 0 j e c t i ο η _ X類中。每一列非0像素的計算方法為:
      :j是列數(shù),i是行數(shù),PiX(i,j)是對應(yīng)像素值,m+1是總的行數(shù)。
      [0020] 進(jìn)一步的,對pro jection_x類中的元素進(jìn)行遍歷,變量k遍歷范圍為從1開始到 pro jection_x .size()_l結(jié)束。如果pro ject ion_x[k] = 0,pro ject ion_x [k+Ι ] >0, projection_x[k+2]>0,則判斷k為某一文字塊的起始切分點,并將其放到類vector〈int> left中;如果pro jection_x[k] = 0,pro jection_x[k_l ] >0,pro jection_x[k_2] >0,則判 斷k為某一文字塊的終點切分點,并將其放到類vector〈int>right中;遍歷完后left. size ()應(yīng)該等于right. size()。類left和right中的元素值就是單文字可選用切分位置。
      [0021] 經(jīng)過上述投影過程,根據(jù)橫向投影和縱向投影坐標(biāo)就可以確定每個文字的坐標(biāo)位 置。根據(jù)坐標(biāo)位置可以把單個文字切分出來,根據(jù)切分出的子圖片順序位置,進(jìn)行對應(yīng)的文 字識別,可以保證圖像表格中每個單元表格中識別出的文字順序的準(zhǔn)確,識別出的文字邏 輯還原準(zhǔn)確率高。
      [0022] 與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果:本發(fā)明提供一種圖像表格文字切分方法,本 方法首先檢測出待識別圖像表格中的
      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1