針對(duì)文檔圖像的水平和垂直線檢測(cè)和移除的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及文檔圖像處理,具體地,本發(fā)明涉及用于檢測(cè)和移除文檔圖像中的水平線和垂直線的方法。
【背景技術(shù)】
[0002]文檔圖像通常指的是表示包含大量文本的文檔的頁(yè)面的數(shù)字圖像。文檔圖像常常包含線,具體地,包含水平線和垂直線,諸如表格線、文本的下劃線等。因?yàn)樽址?字母和其它符號(hào))通常是文檔圖像分析(諸如光學(xué)字符識(shí)別(0CR)、文檔認(rèn)證等)的焦點(diǎn),所以常常期望移除線。這些線一般沿著一個(gè)方向很長(zhǎng),如果這些線未被明確地移除,則在之后進(jìn)行的連接成分(connected component)分析中可能引起誤差和錯(cuò)誤。已經(jīng)提出了用于線檢測(cè)和移除的各種方法,諸如霍夫變換、游程長(zhǎng)度編碼、形態(tài)學(xué)分析等。然而,當(dāng)這些方法應(yīng)用于實(shí)際文檔上時(shí),它們通常受圖像質(zhì)量以及圖像的二值化程度的影響。此外,在已知的線移除方法中,文本下劃線的移除常??赡芨淖兣c該下劃線交叉的字符的特征。許多已知的方法還遭受不完整的線移除。
【發(fā)明內(nèi)容】
[0003]本發(fā)明針對(duì)一種線檢測(cè)和移除方法以及相關(guān)設(shè)備,基本上消除由于現(xiàn)有技術(shù)的限制和缺點(diǎn)而導(dǎo)致的問(wèn)題中的一個(gè)或多個(gè)。
[0004]本發(fā)明的目的是提供一種線檢測(cè)和移除方法,可以完全移除線并保留與下劃線交叉的字符的特征。
[0005]本發(fā)明的另外的特征和優(yōu)點(diǎn)將在下面的描述中進(jìn)行陳述,并且部分地根據(jù)本說(shuō)明書(shū)將是清楚的,或者可以通過(guò)實(shí)施本發(fā)明來(lái)獲悉。本發(fā)明的目標(biāo)和其它優(yōu)點(diǎn)將通過(guò)在撰寫(xiě)的說(shuō)明書(shū)及其權(quán)利要求書(shū)以及附圖中具體指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和達(dá)成。
[0006]為了實(shí)現(xiàn)這些和/或其它目的,如所實(shí)施的和廣義地描述的,本發(fā)明提供一種用于從二值文檔圖像移除水平線的方法,該方法包括以下步驟:(a)獲得與二值圖像的每個(gè)像素相關(guān)聯(lián)的筆劃寬度,其中,與給定像素相關(guān)聯(lián)的筆劃寬度被定義為包括該像素的連續(xù)前景像素的水平游程長(zhǎng)度和垂直游程長(zhǎng)度中的較小者;(b)獲得表示檢測(cè)到的水平線的邊界框;(c)計(jì)算水平線的每個(gè)水平位置處的最大筆劃寬度,其中,給定水平位置處的最大筆劃寬度被定義為與位于該水平位置處的屬于水平線的所有前景像素相關(guān)聯(lián)的筆劃寬度的最大值;(d)針對(duì)位于沿著邊界框的水平位置處的每個(gè)前景像素列,如果該水平位置處的最大筆劃寬度小于邊界框的以該水平位置為中心的窗口內(nèi)的所有水平位置處的最大筆劃寬度的中間值,則將它們移除;(e)提取邊界框中的在步驟⑷之后余留的所有連接成分,并移除既不在邊界框的頂邊界上方延伸預(yù)定量、也不在邊界框的底邊界下方延伸預(yù)定量的任何連接成分;以及(f)使用水平線作為結(jié)構(gòu)元素來(lái)對(duì)從步驟(e)得到的二值圖像執(zhí)行閉運(yùn)算。
[0007]在另一方面,本發(fā)明提供一種用于從二值文檔圖像移除垂直線的方法,該方法包括以下步驟:(a)獲得與二值圖像的每個(gè)像素相關(guān)聯(lián)的筆劃寬度,其中,與給定像素相關(guān)聯(lián)的筆劃寬度被定義為包括該像素的連續(xù)前景像素的水平游程長(zhǎng)度和垂直游程長(zhǎng)度中的較小者;(b)獲得表示檢測(cè)到的垂直線的邊界框;(c)計(jì)算垂直線的每個(gè)垂直位置處的最大筆劃寬度,其中,給定垂直位置處的最大筆劃寬度被定義為與位于該垂直位置處的屬于垂直線的所有前景像素相關(guān)聯(lián)的筆劃寬度的最大值;(d)計(jì)算垂直線的高寬比;(e)如果所述高寬比大于或等于閾值比,則移除垂直線中的最大筆劃寬度小于線寬度閾值的任何部分;以及(f)提取邊界框中的連接成分,并移除既不接觸邊界框的左邊界、也不接觸邊界框的右邊界的所有連接成分。
[0008]在另一方面,本發(fā)明提供一種用于從二值文檔圖像移除水平線的計(jì)算機(jī)裝置,該計(jì)算機(jī)裝置包括:(a)用于獲得與二值圖像的每個(gè)像素相關(guān)聯(lián)的筆劃寬度的部件,其中,與給定像素相關(guān)聯(lián)的筆劃寬度被定義為包括該像素的連續(xù)前景像素的水平游程長(zhǎng)度和垂直游程長(zhǎng)度中的較小者;(b)用于獲得表示檢測(cè)到的水平線的邊界框的部件;(c)用于計(jì)算水平線的每個(gè)水平位置處的最大筆劃寬度的部件,其中,給定水平位置處的最大筆劃寬度被定義為與位于該水平位置處的屬于水平線的所有前景像素相關(guān)聯(lián)的筆劃寬度的最大值;
(d)用于針對(duì)位于沿著邊界框的水平位置處的每個(gè)前景像素列進(jìn)行如下處理的部件:如果該水平位置處的最大筆劃寬度小于邊界框的以該水平位置為中心的窗口內(nèi)的所有水平位置處的最大筆劃寬度的中間值,則將它們移除;(e)用于提取邊界框中的在部件(d)的處理之后余留的所有連接成分、并移除既不在邊界框的頂邊界上方延伸預(yù)定量、也不在邊界框的底邊界下方延伸預(yù)定量的任何連接成分的部件;以及(f)用于使用水平線作為結(jié)構(gòu)元素來(lái)對(duì)從部件(e)得到的二值圖像執(zhí)行閉運(yùn)算的部件。
[0009]另外,在以上計(jì)算機(jī)裝置中,部件(c)可以包括:用于將邊界框劃分為多個(gè)水平布置的窗口的部件;針對(duì)每個(gè)窗口:用于通過(guò)水平地投影該窗口內(nèi)的圖像塊以產(chǎn)生直方圖并獲得該直方圖的峰位置作為該窗口內(nèi)的水平線段的垂直中心位置來(lái)獲得所述垂直中心位置的部件;用于在該窗口的每個(gè)水平位置處,識(shí)別與所述垂直中心位置處的前景像素連接的所有連續(xù)的前景像素的部件;以及用于計(jì)算與在用于識(shí)別的部件的處理中識(shí)別的所有連續(xù)的前景像素相關(guān)聯(lián)的筆劃寬度中的最大一個(gè)的部件。
[0010]另外,在以上計(jì)算機(jī)裝置中,還可以包括:用于在部件(d)的處理之前,確定邊界框中的水平線的長(zhǎng)寬比的部件,其中,僅當(dāng)所述長(zhǎng)寬比大于預(yù)定閾值時(shí),才執(zhí)行部件(d)、
(e)和(f)ο
[0011]另外,在以上計(jì)算機(jī)裝置中,可以在部件(c)的處理之后執(zhí)行用于確定的部件,并且其中,所述長(zhǎng)寬比是邊界框的長(zhǎng)度與水平線的所有水平位置處的最大筆劃寬度的中間值的比率。
[0012]另外,在以上計(jì)算機(jī)裝置中,在部件(e)的處理之后,還可以包括:用于在頂邊界和底邊界處將邊界框擴(kuò)大第二預(yù)定量的部件;以及用于移除擴(kuò)大的邊界框中的既不接觸邊界框的頂邊界、也不接觸邊界框的底邊界的連接成分的部件。
[0013]另外,以上計(jì)算機(jī)裝置還可以用于從二值文檔圖像移除垂直線,該計(jì)算機(jī)裝置包括:(g)用于獲得與二值圖像的每個(gè)像素相關(guān)聯(lián)的筆劃寬度的部件,其中,與給定像素相關(guān)聯(lián)的筆劃寬度被定義為包括該像素的連續(xù)前景像素的水平游程長(zhǎng)度和垂直游程長(zhǎng)度中的較小者;(h)用于獲得表示檢測(cè)到的垂直線的邊界框的部件;(i)用于計(jì)算垂直線的每個(gè)垂直位置處的最大筆劃寬度的部件,其中,給定垂直位置處的最大筆劃寬度被定義為與位于該垂直位置處的屬于垂直線的所有前景像素相關(guān)聯(lián)的筆劃寬度的最大值;(j)用于計(jì)算垂直線的高寬比的部件;(k)用于如果所述高寬比大于或等于閾值比,則移除垂直線中的最大筆劃寬度小于線寬度閾值的任何部分的部件;以及(1)用于提取邊界框中的連接成分、并移除既不接觸邊界框的左邊界、也不接觸邊界框的右邊界的所有連接成分的部件。
[0014]另外,在以上計(jì)算機(jī)裝置中,部件(j)可以包括:用于計(jì)算垂直線的所有垂直位置處的最大筆劃寬度的中間值的部件;以及用于計(jì)算垂直線的高寬比的部件,該高寬比被定義為邊界框的高度和最大筆劃寬度的中間值的