專利名稱:基于像素鄰域特征的自適應(yīng)文字圖像的二值化處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一 種文字圖像的二值化處理方法,具體來說,它涉及一種利用全局和局部閾值對基于像素鄰域特征的自適應(yīng)文字圖像的二值化處理方法。
背景技術(shù):
二值化是數(shù)字圖像處理技術(shù)中的一項基本技術(shù),也是許多圖像處理技術(shù)的預(yù)處理技術(shù),在自動目標(biāo)識別(ATR)、圖象分析、文本增強和光學(xué)字符識別(OCR)等圖像處理中得到廣泛應(yīng)用。現(xiàn)有的二值化方法大多屬于閾值化方法,而在不同的應(yīng)用中,閾值的選取決定著圖像特征信息的保留。因此,自動閾值選取的方法非常值得研究,好的自動閾值選取方法不僅能夠保留圖像中有用的信息,而且還可以減少時間上的開銷。圖像二值化技術(shù)的關(guān)鍵在于如何選取閾值,根據(jù)其對像素的處理方式,主要分為
三類(1)全局閾值法整個圖像采用單一閾值T (全局閾值)進行圖像二值化。一般由圖像的直方圖或灰度的空間分布確定一個全局閾值T,將圖像中每個像素的灰度值與T進行比較。若大于T,則取為前景色;否則,取為背景色。典型的全局閾值法有Ostu法、最大熵方法等。全局閾值法在目標(biāo)和背景灰度相差較明顯時效果比較突出,但是這種方法往往容易忽略細節(jié),當(dāng)圖像中存在較多的陰影或者圖像灰度變化比較復(fù)雜時往往很難得到理想的效果。(2)局部閾值法由當(dāng)前像素灰度值與該像素周圍點灰度特征來確定像素的閾值。通過定義考察點的鄰域,并由鄰域計算模板實現(xiàn)考察點灰度與鄰域點的比較。典型的局部閾值法有Bernsen法、Nilblack法等。局部閾值法能夠適應(yīng)較為復(fù)雜的情況,比全局閾值法有更為廣泛的應(yīng)用。但它們往往忽略了圖像的邊界特征信息,使得原圖像中的一些不同區(qū)域在二值化后變成了一塊大區(qū)域,造成二值化結(jié)果圖像某些重要信息的丟失。而在一些如醫(yī)學(xué)圖像分割和顆粒分析等應(yīng)用中,往往需要結(jié)果圖像能夠較好地保留邊界特征信息,這對后續(xù)的圖像分析是非常重要的。(3)動態(tài)閾值法當(dāng)光照不均勻或者背景灰度變化較大等情況時,必須根據(jù)像素的坐標(biāo)位置關(guān)系自動確定不同閾值,實施動態(tài)的閾值確定。該法的閾值選擇不僅取決于該像素及周圍像素的灰度值,而且還與該像素的坐標(biāo)位置有關(guān)。動態(tài)閾值二值化能夠處理品質(zhì)較差的圖像甚至單峰直方圖,但因為動態(tài)閾值化方法常常需要對圖像中每個像素點都計算閾值,即對整幅圖像求出一個閾值面(通常是曲面)計算量很大,運算速度一般比較慢, 由于具有比較費時和某些失真的缺點,這在一定程度上阻礙其發(fā)展。迭代法是較為常見的一種動態(tài)閾值確定技術(shù)。
發(fā)明內(nèi)容
針對以上的不足,本發(fā)明提供了一種利用全局和局部閾值對基于像素鄰域特征的自適應(yīng)文字圖像的二值化處理方法,它包括
a)對文本圖像進行全局亮度調(diào)整,提高文本圖像中目標(biāo)字符與背景的灰度對比度;b)自適應(yīng)選取鄰域計算模板的大??;c)根據(jù)選取的領(lǐng)域計算模板的大小將文本圖像的文字信息分成文字塊;d)采用全局與局部閾值結(jié)合的方法對每個文字塊進行逐點二值化處理。所述步驟a)與步驟b)之間還包括步驟ab)采用雙三次插值算法對文本圖像進行縮放處理。所述步驟a)包括al)定義文本圖像的任意一點處的像素值為該點的亮度值Y,對亮度值Y進行歸一化處理,I表示歸一化后該點的亮度值,I = Y/255 ;a2)計算圖像整體的灰度平均值Ial,
權(quán)利要求
1.一種基于像素鄰域特征的自適應(yīng)文字圖像的二值化處理方法,其特征在于,它包括a)對文本圖像進行全局亮度調(diào)整,提高文本圖像中目標(biāo)字符與背景的灰度對比度;b)自適應(yīng)選取鄰域計算模板的大??;c)根據(jù)選取的領(lǐng)域計算模板的大小將文本圖像的文字信息分成文字塊;d)采用全局與局部閾值結(jié)合的方法對每個文字塊進行逐點二值化處理。
2.根據(jù)權(quán)利要求1所述的基于像素鄰域特征的自適應(yīng)文字圖像的二值化處理方法,其特征在于,所述步驟a)與步驟b)之間還包括步驟ab)采用雙三次插值算法對文本圖像進行縮放處理。
3.根據(jù)權(quán)利要求1所述的基于像素鄰域特征的自適應(yīng)文字圖像的二值化處理方法,其特征在于,所述步驟a)包括al)定義文本圖像的任意一點處的像素值為該點的亮度值Y,對亮度值Y進行歸一化處理,I表示歸一化后該點的亮度值,
4.根據(jù)權(quán)利要求1所述的基于像素鄰域特征的自適應(yīng)文字圖像的二值化處理方法,其特征在于,所述步驟b)包括bl)定義文本圖像中的最大和最小灰度值分別為rmax和rmin,全局閾值初值為
5.根據(jù)權(quán)利要求4所述的基于像素鄰域特征的自適應(yīng)文字圖像的二值化處理方法,其特征在于,所述步驟d)包括dl)比較考察點(x,y)的灰度值f(x,y)與全局閾值Tk+1,如果考察點(x,y)的灰度值 f(x,y)小于或等于Tk+1,則轉(zhuǎn)到d2);否則,目標(biāo)像素點灰度值g(x,y)的值為255,繼續(xù)掃描下一點,并轉(zhuǎn)到dl);d2)求出以考察點為中心的模板內(nèi)的平均灰度avg(X,y); d3)比較考察點的灰度值f(x,y)與由步驟d2)得到的平均灰度avg(X,y),如果考察點的灰度值f(x,y)大于平均灰度avg(x,y),那么目標(biāo)像素點灰度值g(x,y)的值為255,否則目標(biāo)像素點灰度值g(x,y)為0,繼續(xù)掃描下一點,并轉(zhuǎn)到dl)。
全文摘要
本發(fā)明公開了一種利用全局和局部閾值對基于像素鄰域特征的自適應(yīng)文字圖像的二值化處理方法,首先,對文本圖像進行全局亮度調(diào)整,增加圖像中較暗部分的比重,提高文本圖像中目標(biāo)字符與背景的灰度對比度;然后,采用雙三次插值算法對文本圖像進行縮放處理,增大字符筆畫之間的空隙;接著,統(tǒng)計目標(biāo)字符的筆畫寬度d,從而確定鄰域計算模板的大小w;再根據(jù)確定的領(lǐng)域計算模板的大小將文本圖像的文字信息分成文字塊;最后,采用全局與局部閾值結(jié)合的方法對每個文字塊進行逐點二值化處理。本發(fā)明能有效地使文字筆畫從背景中分割出來,避免斷筆、偽影等現(xiàn)象,保持筆畫的連通性,而且減少對文本圖像中像素點計算局部閾值的情況,極大提高運算速度。
文檔編號G06K9/38GK102289668SQ20111026414
公開日2011年12月21日 申請日期2011年9月7日 優(yōu)先權(quán)日2011年9月7日
發(fā)明者朱雄泳, 楊勁, 譚洪舟 申請人:朱雄泳, 楊勁, 譚洪舟