一種基于對比度增強法的降質文檔圖像二值化方法
【技術領域】
[0001] 本發(fā)明涉及基于對比度增強法的降質文檔圖像二值化方法。屬于圖像處理技術領 域,涉及對降質文檔圖像的二值化方法,可用于OCR系統(tǒng)對降質文檔圖像字符識別的預處 理,具體是一種基于對比度增強法的降質文檔圖像二值化方法。
【背景技術】
[0002] OCR技術(Optical Character Recognition,光學字符識別)是將紙質文字信息 錄入到計算機中最高效的方法。而OCR系統(tǒng)的識別效率則取決于文檔圖像的質量。對于降 質文檔圖像的識別,目前的OCR技術存在的不足主要表現(xiàn)為二值化后的文檔圖像丟失了大 量的有效信息,無法得到連續(xù)、完整的筆畫結構,嚴重影響后續(xù)的識別結果。雖然大量學者 已經對文檔圖像二值化研究多年,但對于從降質文檔圖像(如圖像中存在陰影、非均勻光 照、墨跡透背、模糊等)中提取出清晰字符仍是圖像處理領域的一個難點。
【發(fā)明內容】
[0003] 本發(fā)明是要解決現(xiàn)有方法無法從降質文檔圖像中提取出清晰字符的問題,而提供 了一種基于對比度增強法的降質文檔圖像二值化方法。
[0004] -種基于對比度增強法的降質文檔圖像二值化方法,按以下步驟實現(xiàn):
[0005] 步驟1 :讀取降質文檔圖像,對降質文檔圖像進行灰度變換,輸出灰度級為256的 灰度圖像;
[0006] 步驟2 :利用四叉樹原理,根據(jù)灰度對比度信息,區(qū)分強灰度對比度區(qū)域與弱灰度 對比度區(qū)域;
[0007] 步驟3 :對于強灰度對比度區(qū)域,采用弱灰度對比度增強法調整區(qū)域像素點灰度 值;對于弱灰度對比度區(qū)域,采用強灰度對比度增強法調整區(qū)域像素點灰度值;
[0008] 步驟4 :根據(jù)強灰度對比度區(qū)域與弱灰度對比度區(qū)域像素點灰度值出現(xiàn)的頻率確 定局部閾值;
[0009] 步驟5 :令強灰度對比度區(qū)域與弱灰度對比度區(qū)域像素點灰度值大于局部閾值的 像素點的灰度值為255 ;令強灰度對比度區(qū)域與弱灰度對比度區(qū)域像素點灰度值小于局部 閾值的像素點的灰度值為〇,輸出二值圖像。
[0010] 發(fā)明效果:
[0011] 因此本發(fā)明提出一種新的二值化算法,針對不同的降質原因,在不同的區(qū)域選擇 恰當?shù)膮^(qū)域對比度增強法,從而達到理想的分割效果。
[0012] 應用本實施方式算法處理的二值圖像,具有最高的F-measure值(高于次高OTSU 算法4% )、最高的PSNR值(高于次高Sauvola算法5% )及較低的NRM值。說明本實施方 式算法可以最好的還原目標像素點,同時說明應用本實施方式算法輸出的二值圖像最接近 實際未降質文檔的二值圖像,且本實施方式算法的誤分割率較小。說明應用本實施方式算 法處理的降質文檔圖像具有最優(yōu)的分割質量。
【附圖說明】
[0013] 圖1為本發(fā)明流程圖;
[0014] 圖2(a)是第一次區(qū)域劃分原理示意圖;
[0015] 圖2(b)是第二次區(qū)域劃分原理示意圖;其中,所述□背景區(qū)域;隱灰度對比度顯 著區(qū)域;腿灰度對比度較顯著區(qū)域;
[0016] 圖3 (a)為待測試圖像;
[0017] 圖3 (b)為用OTSU方法的二值化圖像;
[0018] 圖3 (c)為用Niblack方法的二值化圖像;
[0019] 圖3 (d)為用Sauvola方法的二值化圖像;
[0020] 圖3 (e)為用Singh方法的二值化圖像;
[0021] 圖3(f)為用本發(fā)明方法的二值化圖像;
[0022] 圖4(a)為待測試圖像;
[0023] 圖4 (b)為用OTSU方法的二值化圖像;
[0024] 圖4 (c)為用Niblack方法的二值化圖像;
[0025] 圖4 (d)為用Sauvola方法的二值化圖像;
[0026] 圖4 (e)為用Singh方法的二值化圖像;
[0027] 圖4(f)為用本發(fā)明方法的二值化圖像;
[0028] 圖5 (a)為待測試圖像;
[0029] 圖5 (b)為用OTSU方法的二值化圖像;
[0030] 圖5 (c)為用Niblack方法的二值化圖像;
[0031] 圖5 (d)為用Sauvola方法的二值化圖像;
[0032] 圖5 (e)為用Singh方法的二值化圖像;
[0033] 圖5 (f)為用本發(fā)明方法的二值化圖像;
[0034] 圖6 (a)為待測試圖像;
[0035] 圖6 (b)為用OTSU方法的二值化圖像;
[0036] 圖6 (c)為用Niblack方法的二值化圖像;
[0037] 圖6 (d)為用Sauvola方法的二值化圖像;
[0038] 圖6 (e)為用Singh方法的二值化圖像;
[0039] 圖6 (f)為用本發(fā)明方法的二值化圖像。
【具體實施方式】
【具體實施方式】 [0040] 一:本實施方式的一種基于對比度增強法的降質文檔圖像二值化方 法,按以下步驟實現(xiàn):
[0041] 步驟1 :讀取降質文檔圖像,對降質文檔圖像進行灰度變換,輸出灰度級為256的 灰度圖像;
[0042] 步驟2 :利用四叉樹原理,根據(jù)灰度對比度信息,區(qū)分強灰度對比度區(qū)域與弱灰度 對比度區(qū)域;
[0043] 步驟3 :對于強灰度對比度區(qū)域,采用弱灰度對比度增強法調整區(qū)域像素點灰度 值;對于弱灰度對比度區(qū)域,采用強灰度對比度增強法調整區(qū)域像素點灰度值;
[0044] 步驟4 :根據(jù)強灰度對比度區(qū)域與弱灰度對比度區(qū)域像素點灰度值出現(xiàn)的頻率確 定局部閾值;
[0045] 步驟5 :令強灰度對比度區(qū)域與弱灰度對比度區(qū)域像素點灰度值大于局部閾值的 像素點的灰度值為255 ;令強灰度對比度區(qū)域與弱灰度對比度區(qū)域像素點灰度值小于局部 閾值的像素點的灰度值為〇,輸出二值圖像。
【具體實施方式】 [0046] 二:本實施方式與一不同的是:所述步驟2具體為:
[0047] (2a)計算降質文檔圖像像素點坐標為(X,y)處灰度值為f(x, y)的灰度對比度 D (X, y),其計算公式為:
[0048] D(x,y) = max [Dh (x, y), Dv (x, y) ] (I)
[0049] Dh(x, y) = | f (x, y)-f (χ-l, y) (2)
[0050] Dv(x, y) = I f (x, y)-f (x, y-1) (3)
[0051] 其中,Dh(x, y)和Dv(x, y)分別是像素點f(x, y)水平方向和豎直方向的灰度對比 度,f (x-1,y)是f (X,y)水平方向左側像素點的灰度值,f (X,y-ι)是f (X,y)豎直方向下側 像素點的灰度值;
[0052] (2b)利用四叉樹原理,根據(jù)灰度對比度對降質文檔圖像進行區(qū)域劃分:
[0053] 第一次四分后,若任一區(qū)域內的最大灰度對比度小于等于a倍整體區(qū)域的最大灰 度對比度,即公式4,說明該區(qū)域的灰度變化不顯著,則認為該區(qū)域均為背景區(qū)域,直接輸出 該區(qū)域,對剩余區(qū)域繼續(xù)進行細分;
[0054] Dftliax (X,y)彡 a · Dentiremax (χ, y) (4)
[0055] 其中,所述DD_(x,y)為第一次四分后任一區(qū)域內的最大灰度對比度, Daitiraiiax(Xj)為整體區(qū)域的最大灰度對比度;
[0056] (2c)第二次四分后,若任一第二次四分后形成的DD區(qū)域內的最大灰度對比度小 于等于a倍的第一次四分后任一區(qū)域內的最大灰度對比度,即公式5,說明該區(qū)域的灰度變 化不顯著,則認為該區(qū)域均為背景區(qū)域,直接輸出該區(qū)域;
[0057] 若任一第二次四分后形成的AC區(qū)域內的最大灰度對比度大于等于b倍的第一次 四分后形成的A區(qū)域內的最大灰度對比度,即公式6,說明該區(qū)域為灰度變化非常顯著區(qū) 域,則對該區(qū)域進行弱灰度對比度增強法處理;
[0058] 若任一第二次四分后形成的BA區(qū)域內的最大灰度對比度介于a和b倍的第一次 四分后形成的B區(qū)域內的最大灰度對比度之間即公式7,說明該區(qū)域為灰度變化較顯著區(qū) 域,則對該區(qū)域進行強灰度對比度增強法處理;
[0062] 其中,所述Ddd_ (X,y)第二次四分后形成的DD區(qū)域內的最大灰度對比度, DACnax(x,y)第二次四分后形成的AC區(qū)域內的最大灰度對比度,DBAmax(x,y)第二次四分后形 成的BA區(qū)域內的最大灰度對比度,D amx (χ, y)第一次四分后形成的A區(qū)域內的最大灰度對 比度,DB_(x,y)第一次四分后形成的B區(qū)域內的最大灰度對比度。
[0063] 實驗證明a e [0, 0· 4],b e [0· 7, 1]。且對圖像進行兩次四分來確定區(qū)域的灰度 變化屬性是最佳四分次數(shù),過多的四分會導致計算量過大,且容易將噪聲點誤分成目標,不 能很好的將噪點處理掉。過少的四分雖然會減小計算量,但同時也將丟失過多的細節(jié),達不 到理想的分割效果。
[0064] 其它步驟及參數(shù)與【具體實施方式】一相同。
【具體實施方式】 [0065] 三:本實施方式與一或二不同的是:所述步驟3具體 為:
[0066] (3a)對于灰度變化非常顯著區(qū)域,采用弱灰度對比度增強法,將區(qū)域內各像素點 灰度值調整為