一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法
【專利摘要】本發(fā)明公開了一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,包括以下步驟:使用Canny算子提取邊緣,將真?zhèn)芜吘壞0鍖?duì)應(yīng)的像素灰度矩陣轉(zhuǎn)換成特征向量,進(jìn)行標(biāo)記,利用K最近鄰算法根據(jù)標(biāo)記的特征向量去除樣本的偽邊緣;根據(jù)字符的筆畫結(jié)構(gòu)特征和斷續(xù)邊緣線段的端點(diǎn)之間的距離構(gòu)建不同的連接模式,形成像素場景;依照各個(gè)像素場景中各邊緣線段的位置關(guān)系、線段的灰度信息以及線段之間的距離,確定線段端點(diǎn)的連接方式,進(jìn)行邊緣擬合,形成字符輪廓。本發(fā)明提取的邊緣準(zhǔn)確,擬合得到的刻劃字符輪廓完整,為后續(xù)的字符特征提取帶來了很大方便。
【專利說明】
一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法。
【背景技術(shù)】
[0002]字符邊緣提取及其擬合可以構(gòu)成字符的完整輪廓,是字符識(shí)別過程中的重要環(huán)節(jié)。對(duì)于光學(xué)刻劃字符,常用的邊緣提取方法和擬合方法都不能得到良好的結(jié)果。由于刻劃字符圖像的產(chǎn)生過程中,采用條形光源使得與光源平行的筆劃會(huì)產(chǎn)生高灰度值的像素,而與光源垂直的筆劃會(huì)產(chǎn)生低灰度值的像素,背景的像素值介于以上兩種像素之間,如圖1所示。因而,Canny算子無法提取刻劃字符的真實(shí)邊緣,這是因?yàn)镃anny算子本質(zhì)上是基于梯度的邊緣提取方法。在一個(gè)筆劃的中間由于光照方向的不同產(chǎn)生了低灰度值像素和高灰度值兩種像素,在其交界處產(chǎn)生了大幅度的灰度變化,Canny算子的梯度非最大值抑制算法捕捉到這些變化,把相應(yīng)位置的像素作為邊緣,但它們并不是刻劃字符的真實(shí)邊緣點(diǎn)。
[0003]即使采用某種方法去除偽邊緣點(diǎn),也會(huì)產(chǎn)生斷續(xù)間隔比較大的不連續(xù)邊緣。若要采用常用的邊緣擬和方法如閾值化順序邊緣連接的輪廓提取方法多閾值選取與邊緣連接的邊緣檢測算法以及神經(jīng)網(wǎng)絡(luò)邊緣擬合都不會(huì)取得良好的結(jié)果,這是因?yàn)檫@些方法都只是適合于斷續(xù)點(diǎn)之間的距離較近的情形。
【發(fā)明內(nèi)容】
[0004]本發(fā)明為了解決上述問題,提出了一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,本方法首先使用Canny算子提取邊緣,基于灰度信息和結(jié)構(gòu)信息提取像素特征,使用k最近鄰方法消除Canny算子產(chǎn)生的偽邊緣點(diǎn),繼而基于字符的結(jié)構(gòu)特征實(shí)現(xiàn)斷續(xù)邊緣的擬合形成字符的輪廓,形成的刻劃字符輪廓完整、準(zhǔn)確。
[0005]為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
[0006]—種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,包括以下步驟:
[0007](I)使用Canny算子提取邊緣,將真?zhèn)芜吘壞0鍖?duì)應(yīng)的像素灰度矩陣轉(zhuǎn)換成特征向量,進(jìn)行標(biāo)記,利用K最近鄰算法根據(jù)標(biāo)記的特征向量去除樣本的偽邊緣;
[0008](2)根據(jù)字符的筆畫結(jié)構(gòu)特征和斷續(xù)邊緣線段的端點(diǎn)之間的距離構(gòu)建不同的連接模式,形成像素場景;
[0009](3)依照各個(gè)像素場景中各邊緣線段的位置關(guān)系、線段的灰度信息以及線段之間的距離,確定線段端點(diǎn)的連接方式,進(jìn)行邊緣擬合,形成字符輪廓。
[0010]所述步驟(I)中,具體步驟包括:
[0011](1-1)將真?zhèn)芜吘壞0鍖?duì)應(yīng)的像素灰度矩陣轉(zhuǎn)換成特征向量,同時(shí)分配相應(yīng)的分類標(biāo)號(hào);
[0012](1-2)根據(jù)歐式距離在特征空間中選擇k個(gè)距離最近的樣本;
[0013](1-3)統(tǒng)計(jì)K-最近鄰樣本中每個(gè)分類標(biāo)號(hào)出現(xiàn)的次數(shù);
[0014](1-4)選擇出現(xiàn)頻率最大的類標(biāo)號(hào)作為待分類邊緣點(diǎn)的類標(biāo)號(hào)。
[0015]優(yōu)選的,所述步驟(1-1)中,將真?zhèn)芜吘壞0鍖?duì)應(yīng)的像素灰度矩陣轉(zhuǎn)換成長度為9的特征向量。
[0016]所述步驟(2)中,綜合考慮字符的筆畫結(jié)構(gòu)特征和斷續(xù)邊緣線段的端點(diǎn)之間的距離概括出多種連接模式,將每種連接模式作為一個(gè)像素場景,不同的連接模式采取不同的邊緣擬和方法。
[0017]所述步驟(2)中,根據(jù)待擬合的邊緣線段位于筆畫的位置,彼此之間的排列結(jié)構(gòu),像素灰度值的大小關(guān)系和位置關(guān)系的不同來確定不同的像素場景。
[0018]所述步驟(3)中,將各個(gè)像素場景的線段的端點(diǎn)作為元素,形成鏈表,進(jìn)行邊緣擬合,從鏈表的第一個(gè)邊緣線段的第一個(gè)端點(diǎn)開始,通過鏈表確定每個(gè)端點(diǎn)與下一端點(diǎn)的距離和端點(diǎn)周圍設(shè)定距離范圍內(nèi)的線段數(shù)目。
[0019]所述步驟(3)中,在鏈表中開始搜索是否存在與第一端點(diǎn)的距離小于設(shè)定值的端點(diǎn),若存在,則將兩個(gè)端點(diǎn)進(jìn)行連接,端點(diǎn)坐標(biāo)采用一次多項(xiàng)式擬和,刪除鏈表中的所述兩個(gè)端點(diǎn)的連接線段,同時(shí)鏈表長度減I。
[0020]所述步驟(3)中,在鏈表中搜索距離第一端點(diǎn)小于設(shè)定距離范圍的線段,若存在上述線段,則記錄線段的端點(diǎn),統(tǒng)計(jì)線段數(shù)目,根據(jù)線段的數(shù)目、灰度級(jí)線段位置與像素場景相對(duì)應(yīng),確定其所屬像素場景。
[0021]所述步驟(3)中,端點(diǎn)的連接采用坐標(biāo)擬合的方法。
[0022]優(yōu)選的,所述設(shè)定距離范圍為字符筆畫寬度的2-3倍。
[0023]本發(fā)明的有益效果為:
[0024](I)本發(fā)明提取的邊緣準(zhǔn)確,擬合得到的刻劃字符輪廓完整,為后續(xù)的字符特征提取帶來了很大方便。
[0025](2)本發(fā)明基于字符的結(jié)構(gòu)特征去確定斷續(xù)邊緣線段方式,實(shí)際上是模擬人的視覺和認(rèn)知原理;無論第一個(gè)線段是哪一個(gè)線段,也無論這些線段端點(diǎn)之間的距離多大,由于它們都是字符某個(gè)或相鄰的兩個(gè)筆畫上,都能實(shí)現(xiàn)正確的連接。
【附圖說明】
[0026]圖1為本發(fā)明的刻劃字符圖像示意圖;
[0027]圖2為本發(fā)明的偽邊緣模板集合示意圖;
[0028]圖3為本發(fā)明的真邊緣模板集合示意圖;
[0029]圖4為本發(fā)明的場景模板集合示意圖;
[0030]圖5為本發(fā)明的連接模式3示意圖;
[0031 ]圖6為傳統(tǒng)方法Canny算子提取的邊緣圖,有偽邊緣點(diǎn);
[0032]圖7為本發(fā)明去除偽邊緣的結(jié)果示意圖;
[0033]圖8為擬合過程及其結(jié)果圖;
[0034]圖9為本發(fā)明的流程圖。
【具體實(shí)施方式】
:
[0035]下面結(jié)合附圖與實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明。
[0036]基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,包括以下步驟:
[0037]步驟一,基于k最近鄰算法去除偽邊緣。
[0038]特征空間的合理選擇是正確分類的最關(guān)鍵要素,既要考慮特征描述的準(zhǔn)確性,還要考慮樣本的平衡問題。K最近鄰算法的缺點(diǎn)是當(dāng)樣本不平衡時(shí),有可能導(dǎo)致當(dāng)輸入一個(gè)新樣本時(shí),該樣本的k個(gè)鄰居中大容量類的樣本占多數(shù)。
[0039]分析canny算子提取的邊緣點(diǎn)周邊像素的灰度分布發(fā)現(xiàn),真邊緣點(diǎn)和假邊緣點(diǎn)的8鄰域灰度分布具有明顯的不同。偽邊緣點(diǎn)總是處于一個(gè)筆畫中高灰度像素和低灰度像素的交界,真邊緣點(diǎn)要么處于高灰度像素和背景中灰度像素的交界,要么處于低灰度像素和背景中灰度像素的交界。為此使用像素的8鄰域作為其特征,為敘述方便,稱像素的8鄰域?yàn)檫吘壞0?,真邊緣像素點(diǎn)的8鄰域叫做真邊緣模板,偽邊緣像素點(diǎn)的8鄰域叫做偽邊緣模板,真、偽邊緣模板構(gòu)成了運(yùn)用k最近鄰算法的特征空間。
[0040]由于偽邊緣點(diǎn)總是處于一個(gè)筆畫中兩種灰度級(jí)別的像素區(qū)域的交界,按照偽邊緣點(diǎn)上下左右周圍像素點(diǎn)的灰度取值情況將偽邊緣模板分為以下8類,共32種結(jié)構(gòu)。前16種模板中處于中心的偽邊緣點(diǎn)為低灰度值,后16種模板中偽邊緣點(diǎn)為高灰度值,如圖2所示。
[0041]真邊緣點(diǎn)要么處于高灰度像素區(qū)域和背景的交界,要么處于低灰度區(qū)域和背景的交界。因而按照邊緣點(diǎn)上下左右周圍像素點(diǎn)的灰度取值情況將真邊緣模板分為以下六類,24種結(jié)構(gòu),如圖3所示。
[0042]需要說明,模板中三種灰度的取值是通過直方圖分析用高、中、低三種灰度像素的灰度均值來表示的。
[0043]算法步驟:
[0044]將真?zhèn)芜吘壞0鍖?duì)應(yīng)的像素灰度矩陣轉(zhuǎn)換成長度為9的特征向量,同時(shí)分配相應(yīng)的分類標(biāo)號(hào);
[0045]根據(jù)歐式距離在特征空間中選擇k個(gè)距離最近的樣本;
[0046]統(tǒng)計(jì)K-最近鄰樣本中每個(gè)分類標(biāo)號(hào)出現(xiàn)的次數(shù);
[0047]選擇出現(xiàn)頻率最大的類標(biāo)號(hào)作為待分類邊緣點(diǎn)的類標(biāo)號(hào)。
[0048]步驟二,基于結(jié)構(gòu)特征的斷續(xù)邊緣擬合。
[0049]1.特征描述
[0050]綜合考慮字符的筆畫結(jié)構(gòu)特征和斷續(xù)邊緣線段的端點(diǎn)之間的距離概括出16種連接模式,涉及16種實(shí)際的像素場景,不同的連接模式采取不同的邊緣擬和方法。具體來說就是在不同的連接模式下,根據(jù)各邊緣線段的位置關(guān)系、線段的灰度信息以及線段之間的距離等三個(gè)要素選擇正確的邊緣端點(diǎn)連接關(guān)系。
[0051]16種像素場景如圖4所示,它們的筆畫特征描述如下。
[0052]場景I,待擬和的三個(gè)邊緣線段處于一個(gè)筆畫的末端,兩條平行邊緣線段具有相同的灰度級(jí)別,另外一個(gè)邊緣線段的像素灰度高于前者,一個(gè)邊緣端點(diǎn)附近有兩個(gè)其它邊緣的端點(diǎn),需要選擇其中的一個(gè)進(jìn)行邊緣擬合。
[0053]場景2待擬和的四個(gè)邊緣線段處于一個(gè)筆畫的中部,且呈對(duì)稱排列結(jié)構(gòu),像素灰度值高的一對(duì)線段相對(duì)位置處于右上方,像素灰度值低的一對(duì)線段相對(duì)位置處于左下方。一個(gè)邊緣端點(diǎn)附近有三個(gè)其它邊緣的端點(diǎn),需要選擇其中的一個(gè)進(jìn)行邊緣擬合。
[0054]場景3到場景5都和場景2相似,區(qū)別在于場景3中像素灰度值高的一對(duì)線段相對(duì)位置處于左上方,像素灰度值低的一對(duì)線段相對(duì)位置處于右下方;場景4中像素灰度值高的一對(duì)線段相對(duì)位置處于右下方,像素灰度值低的一對(duì)線段相對(duì)位置處于左上方;場景5中像素灰度值高的一對(duì)線段相對(duì)位置處于左下方,像素灰度值低的一對(duì)線段相對(duì)位置處于右上方;
[0055]場景6至場景8是后敘場景15經(jīng)過邊緣擬合后衍生出的幾種情形。場景6和5相似,區(qū)別在于像素灰度值低的一對(duì)線段相對(duì)位置一個(gè)處于右下方,另一個(gè)處于右上方。場景8和3相似,像素灰度值高的一對(duì)線段相對(duì)位置一個(gè)處于左上方,一個(gè)處于右上方。場景7中像素灰度值高的一對(duì)線段相對(duì)位置是左右關(guān)系,像素灰度值高的一對(duì)線段相對(duì)位置是上下關(guān)系O
[0056]場景9至場景12是后續(xù)場景13和場景14經(jīng)過邊緣擬合后衍生出的幾種情形。待擬和的四個(gè)邊緣線段中,有三個(gè)線段是低灰度像素值,另一個(gè)是高灰度值。像素灰度值低的三條線段都是垂直或接近垂直的線段,呈平行或上下一致的規(guī)則排列關(guān)系。像素灰度值高的線段是水平的線段。一個(gè)邊緣端點(diǎn)附近有三個(gè)其它邊緣的端點(diǎn),需要選擇其中的一個(gè)進(jìn)行邊緣擬合。
[0057]場景13,待擬和的六個(gè)邊緣線段處于橫筆畫與豎筆畫交界處,且呈對(duì)稱排列結(jié)構(gòu),像素灰度值高的一對(duì)線段相對(duì)位置處于右側(cè),像素灰度值低的兩對(duì)線段相對(duì)位置分別處于左上方和左下方。一個(gè)邊緣端點(diǎn)附近有5個(gè)其它邊緣的端點(diǎn),需要選擇其中的一個(gè)進(jìn)行邊緣擬合。場景14相似于場景13,二者呈水平景象關(guān)系。
[0058]場景15,待擬和的六個(gè)邊緣線段呈星形對(duì)稱分布關(guān)系,按照斜率大小分為三組線段,斜率為零的一對(duì)線段都具有較高的像素灰度值,斜率為負(fù)的一對(duì)線段具有較低的像素灰度值,另一對(duì)線段則一條具有較高的像素灰度值一條具有較低的像素灰度值。
[0059]場景16,待擬和的八個(gè)邊緣線段呈星形對(duì)稱分布關(guān)系,按照斜率大小和坐標(biāo)位置分為四對(duì)線段,分別處于左上、左下、右上、右下方。一個(gè)邊緣端點(diǎn)附近有7個(gè)其它邊緣的端點(diǎn),需要選擇其中的一個(gè)進(jìn)行邊緣擬合。
[0060]2.具體描述:
[0061 ]用Ci(i = l,2....η)表示鏈表中的任一邊緣線段,Ci(I)和Ci(2)表示其第I端點(diǎn)和第2端點(diǎn)。邊緣擬合時(shí),總是從鏈表中的第一個(gè)邊緣線段的Cl(I)開始,我們關(guān)心Cl(I)與其它邊緣線段Ci(i = 2....η)的端點(diǎn)Ci(I)和端點(diǎn)Ci(2)的距離Dli(I)和Dli(2)。邊緣擬合還關(guān)心端點(diǎn)Cl(I)周圍一定距離范圍Dn內(nèi)的線段數(shù)目N,以便判斷當(dāng)前連接屬于哪一種連接模式。使用投影法檢測字符筆劃的寬度w,觀察和實(shí)驗(yàn)發(fā)現(xiàn)取Dn = 2.5W是合適的。
[0062]首先,在{以(1),以(2)丨=2,3...}中搜索01丨(1)或01丨(2)小于0.3抑的端點(diǎn)(^_(10(j = 2,3...k= I,2),如果Cj (k)存在,Cl (I)與Cj(k)直接連接,端點(diǎn)坐標(biāo)采用一次多項(xiàng)式擬和,刪除鏈表中的Cj,鏈表長度減I。此為連接模式I。
[0063]其次,在{Ci1 = 2,3...}中搜索11^11(011(1),011(2))小于2.5抑的線段(^,如果(^存在,記錄這些端點(diǎn)Cj (k)k = I,2。根據(jù)線段數(shù)目Number,劃分為以下幾種方式:
[0064](I)如果Number = I,且不是字符輪廓的最后一個(gè)斷續(xù)邊緣線段,Cl(I)與Cj(k)直接連接。此為連接模式I。
[0065](2)如果Number = 2,,對(duì)應(yīng)于場景I,使用灰度和斜率信息選擇連接路徑。此為連接模式2。
[0066](3)如果Number = 3,對(duì)應(yīng)于場景2到場景12,使用線段的灰度信息以及線段的位置關(guān)系進(jìn)行區(qū)分,選擇不同的端點(diǎn)連接方法。相應(yīng)地稱為連接模式3,6......13。
[0067 ] (4)如果Number = 4,5,去掉距離最遠(yuǎn)的線段,按照Number = 3處理。
[0068](5)如果Number = 6對(duì)應(yīng)于場景13,14,15,使用線段的灰度信息、斜率信息以及位置關(guān)系進(jìn)行區(qū)分,選擇不同的連接方法。稱為連接模式14,15,16。
[0069](6)如果Number>7,通常發(fā)生在斷續(xù)邊緣線段長度較短,在2.5W范圍內(nèi)斷續(xù)邊緣線段比較稠密的情形,如字符“B”的中間部分就屬于這種情況。其中當(dāng)Number = S時(shí),可以根據(jù)線段的斜率判斷如果對(duì)應(yīng)于場景16(兩對(duì)平行線段),就根據(jù)線段的位置關(guān)系進(jìn)行連接,稱為連接模式16;否則和其它Number>7的情況一樣作如下相同的處理,減小搜索范圍,取Dn =I.5W,重新搜索端點(diǎn)Cl (I)周圍Dn范圍內(nèi)的線段數(shù)目N,使得N〈 = 6,然后按照上述方法確定連接模式。
[0070]3.邊緣擬合方法
[0071 ]實(shí)際上是場景識(shí)別從而確定連接模式,下面以連接模式3為例說明。當(dāng)Number = 3時(shí),共有場景2到場景12等十種場景,Cl(I)周圍有3個(gè)線段,需要確定Cl(I)和另外三條線段中的哪一條線段的哪一個(gè)端點(diǎn)去連接,在場景2到場景12等十一種場景產(chǎn)生連接模式3到連接模式13等十一種連接模式。
[0072]采用集合分解的方法進(jìn)行場景識(shí)別,識(shí)別時(shí)需要使用各線段的灰度信息、距離信息和斜率信息。線段Cl隨著線段連接長度不斷增加,從Cl (I)開始取其10個(gè)點(diǎn)求其平均坐標(biāo)XYl(x,y)和平均灰度Bgrayl;其余三條線段的平均坐標(biāo)和平均灰度分別用XY2(x,y),XY3(x,y),XY4(x,y WPBgrayl,Bgray2,Bgray3,Bgray4表示。
[0073]十一種場景構(gòu)成集合B。首先,根據(jù)三條線段的灰度信息將集合B劃分成子集BI和132。131包含場景2到場景8共七個(gè)場景,四條線段的平均灰度1^瓜71,1^作72,1^瓜73,1^作74中,一對(duì)線段的像素灰度值較高,而另一對(duì)線段的像素灰度值較低;B2包含場景9到場景12,四條線段中一條線段的像素灰度值較高,另外三條線段的像素灰度值較低。
[0074]其次,根據(jù)集合線段的距離信息將BI劃分成子集Bll和B12。使用平均坐標(biāo)ΧΥ1(χ,y)計(jì)算兩個(gè)灰度相等(近)的線段的距離,高灰度值的一對(duì)線段之間的距離用Hgd表示,低灰度值的一對(duì)線段之間的距離為LgcLBll包含場景3,4,5,6,四個(gè)場景,Hgd和Lgd都小于1.5W;B12包含場景6、7、8三個(gè)場景,Hgd和Lgd中只有一個(gè)小于1.5W。
[0075]集合Bll、B12和B2都是不能再分的最小集合。集合Bll的四種場景對(duì)應(yīng)于連接模式
3、4、5、6;集合812的三種場景對(duì)應(yīng)于連接模式7、8、9;集合82的四種場景對(duì)應(yīng)于連接模式
10、11、12、13。
[0076]在集合Bll中,根據(jù)線段的相對(duì)位置關(guān)系來區(qū)分四種場景。低灰度值的一對(duì)線段對(duì)的行、列平均值用LL和LH表示,高灰度值的一對(duì)線段對(duì)的行、列平均值用HL和HH表示,若LL>HL且LH〈HH則為場景2,亦即連接模式3;若LL>HL且LH>HH則為場景3,亦即連接模式4;若LL〈HL且LH〈HH則為場景4,亦即連接模式5;若LL〈HL且LH>HH則為場景5,亦即連接模式6。
[0077]在集合B12中,使用線段的斜率信息區(qū)分三種場景。高灰度線段對(duì)的斜率分別用HSl和HS2表示,低灰度線段對(duì)的斜率分別用LSl和LS2表示。若HSl =HS2則為場景6亦即連接模式7,若LSI = LS2則為場景8亦即連接模式9,否則為場景7亦即連接模式8。
[0078]在集合B2中,需要根據(jù)灰度信息和列位置信息從三條低灰度線段中排除左右平行排列的一對(duì)低灰度線段,計(jì)算剩余的一條低灰度線段各像素的行平均LLl值與列平均值LHl,同時(shí)計(jì)算高灰度線段各像素的行平均HLl值與列平均值HHl,利用位置信息LLl、LH1、HLl、HH1確定二者的位置關(guān)系從而區(qū)分出場景9到場景12,亦即連接模式10到13。
[0079]確定連接模式后,需要進(jìn)一步確定各個(gè)線段的在其場景中的具體位置,方能確定具體的端點(diǎn)連接關(guān)系,從而實(shí)現(xiàn)邊緣擬和。仍以連接模式3為例說明。
[0080]共有四個(gè)線段{ClCi Cj Ck},ij k = 2,3,4.…N,集合中的第一條線段總是Cl。上述特征識(shí)別中的灰度排序結(jié)果用{Ca Cb Ce Cd}表示,Ca和Cb是一對(duì)像素灰度值較低的一對(duì)線段,Ce和Cd則是一對(duì)像素灰度值較高的一對(duì)線段。
[0081 ]比較Ca和Cb的列平均值,列平均值小的賦之標(biāo)號(hào)④,列平均值大的賦之標(biāo)號(hào)③;比較Ce和Cd的行平均值,行平均值小的賦之標(biāo)號(hào)①,行平均值大的賦之標(biāo)號(hào)②。如果線段Cl的標(biāo)號(hào)為①,就選擇標(biāo)號(hào)為④的線段作為連接線段,如果線段Cl的標(biāo)號(hào)為④,就選擇標(biāo)號(hào)為①的線段作為連接線段;如果線段Cl的標(biāo)號(hào)為②,就選擇標(biāo)號(hào)為③的線段作為連接線段,如果線段Cl的標(biāo)號(hào)為③,就選擇標(biāo)號(hào)為②的線段作為連接線段。線段Cl的連接端點(diǎn)總是取Cl
(I),被連接線段的連接端點(diǎn)在上述特征識(shí)別中已經(jīng)確定。
[0082]端點(diǎn)連接采用坐標(biāo)擬和的方法,如果端點(diǎn)之間的距離小于0.8W,采用I次多項(xiàng)式擬和,否則采用2次多項(xiàng)式擬和。
[0083]仿真結(jié)果:
[0084]以典型字符G為例進(jìn)行說明,如圖6所示,現(xiàn)有單純使用Canny算子提取的邊緣,有偽邊緣點(diǎn)。如圖7所示,采用步驟一去除偽邊緣的結(jié)果,結(jié)合圖8中步驟二擬合過程及其結(jié)果,可以看出,本發(fā)明能夠很好地去除不連續(xù)的問題,且沒有偽邊緣,識(shí)別準(zhǔn)確度高,擬合得到的刻劃字符輪廓完整。
[0085]上述雖然結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】進(jìn)行了描述,但并非對(duì)本發(fā)明保護(hù)范圍的限制,所屬領(lǐng)域技術(shù)人員應(yīng)該明白,在本發(fā)明的技術(shù)方案的基礎(chǔ)上,本領(lǐng)域技術(shù)人員不需要付出創(chuàng)造性勞動(dòng)即可做出的各種修改或變形仍在本發(fā)明的保護(hù)范圍以內(nèi)。
【主權(quán)項(xiàng)】
1.一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,其特征是:包括以下步驟: (1)使用Canny算子提取邊緣,將真?zhèn)芜吘壞0鍖?duì)應(yīng)的像素灰度矩陣轉(zhuǎn)換成特征向量,進(jìn)行標(biāo)記,利用K最近鄰算法根據(jù)標(biāo)記的特征向量去除樣本的偽邊緣; (2)根據(jù)字符的筆畫結(jié)構(gòu)特征和斷續(xù)邊緣線段的端點(diǎn)之間的距離構(gòu)建不同的連接模式,形成像素場景; (3)依照各個(gè)像素場景中各邊緣線段的位置關(guān)系、線段的灰度信息以及線段之間的距離,確定線段端點(diǎn)的連接方式,進(jìn)行邊緣擬合,形成字符輪廓。2.如權(quán)利要求1所述的一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,其特征是:所述步驟(I)中,具體步驟包括: (1-1)將真?zhèn)芜吘壞0鍖?duì)應(yīng)的像素灰度矩陣轉(zhuǎn)換成特征向量,同時(shí)分配相應(yīng)的分類標(biāo)號(hào); (1-2)根據(jù)歐式距離在特征空間中選擇k個(gè)距離最近的樣本; (1-3)統(tǒng)計(jì)K-最近鄰樣本中每個(gè)分類標(biāo)號(hào)出現(xiàn)的次數(shù); (1-4)選擇出現(xiàn)頻率最大的類標(biāo)號(hào)作為待分類邊緣點(diǎn)的類標(biāo)號(hào)。3.如權(quán)利要求2所述的一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,其特征是:所述步驟(1-1)中,將真?zhèn)芜吘壞0鍖?duì)應(yīng)的像素灰度矩陣轉(zhuǎn)換成長度為9的特征向量。4.如權(quán)利要求1所述的一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,其特征是:所述步驟(2)中,綜合考慮字符的筆畫結(jié)構(gòu)特征和斷續(xù)邊緣線段的端點(diǎn)之間的距離概括出多種連接模式,將每種連接模式作為一個(gè)像素場景,不同的連接模式采取不同的邊緣擬和方法。5.如權(quán)利要求1所述的一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,其特征是:所述步驟(2)中,根據(jù)待擬合的邊緣線段位于筆畫的位置,彼此之間的排列結(jié)構(gòu),像素灰度值的大小關(guān)系和位置關(guān)系的不同來確定不同的像素場景。6.如權(quán)利要求1所述的一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,其特征是:所述步驟(3)中,將各個(gè)像素場景的線段的端點(diǎn)作為元素,形成鏈表,進(jìn)行邊緣擬合,從鏈表的第一個(gè)邊緣線段的第一個(gè)端點(diǎn)開始,通過鏈表確定每個(gè)端點(diǎn)與下一端點(diǎn)的距離和端點(diǎn)周圍設(shè)定距離范圍內(nèi)的線段數(shù)目。7.如權(quán)利要求1所述的一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,其特征是:所述步驟(3)中,在鏈表中開始搜索是否存在與第一端點(diǎn)的距離小于設(shè)定值的端點(diǎn),若存在,則將兩個(gè)端點(diǎn)進(jìn)行連接,端點(diǎn)坐標(biāo)采用一次多項(xiàng)式擬和,刪除鏈表中的所述兩個(gè)端點(diǎn)的連接線段,同時(shí)鏈表長度減I。8.如權(quán)利要求1所述的一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,其特征是:所述步驟(3)中,在鏈表中搜索距離第一端點(diǎn)小于設(shè)定距離范圍的線段,若存在上述線段,則記錄線段的端點(diǎn),統(tǒng)計(jì)線段數(shù)目,根據(jù)線段的數(shù)目、灰度級(jí)線段位置與像素場景相對(duì)應(yīng),確定其所屬像素場景。9.如權(quán)利要求1所述的一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,其特征是:所述步驟(3)中,端點(diǎn)的連接采用坐標(biāo)擬合的方法。10.如權(quán)利要求6所述的一種基于結(jié)構(gòu)特征的光學(xué)刻劃字符邊緣提取和邊緣擬合方法,其特征是:所述設(shè)定距離范圍為字符筆畫寬度的2-3倍。
【文檔編號(hào)】G06T7/00GK106023191SQ201610327790
【公開日】2016年10月12日
【申請(qǐng)日】2016年5月16日
【發(fā)明人】許鴻奎, 韓曉, 曲懷敬
【申請(qǐng)人】山東建筑大學(xué)