一種基于pcnn的印文提取方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于PCNN的印文提取方法,包括以下步驟:1)對(duì)原始印文圖像進(jìn)行二值化的處理,得到更好處理的二值化印文圖像。2)對(duì)待處理的二值化印文圖像進(jìn)行連續(xù)的腐蝕和膨脹操作,重塑圖像。3)對(duì)于重塑的圖像進(jìn)行填充操作,得到填充圖像Image1,將重塑的圖像減去填充圖像得到待處理的另一圖像Image2。4)把上述兩種圖像分別輸入脈沖耦合神經(jīng)網(wǎng)絡(luò)模型中,得到相應(yīng)的輸出結(jié)果圖像。5)對(duì)于輸出的結(jié)果圖像按照相應(yīng)的細(xì)化結(jié)果公式進(jìn)行細(xì)化操作,得到最終的細(xì)化結(jié)果圖像。本發(fā)明克服傳統(tǒng)的人工印章識(shí)別中存在的缺陷,獲得相對(duì)理想的結(jié)果。
【專(zhuān)利說(shuō)明】-種基于PCNN的印文提取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)字圖像處理的應(yīng)用【技術(shù)領(lǐng)域】,涉及一種基于PCNN的印文提取方法。
【背景技術(shù)】
[0002] 圖像的檢索和相關(guān)的處理識(shí)別,在信息量呈現(xiàn)爆炸性增長(zhǎng)的今天,在人們的社會(huì) 生產(chǎn)和日常生活中越來(lái)越凸顯其重要的作用。人類(lèi)主要是通過(guò)圖像這一媒介來(lái)直接獲取和 交換信息。隨著計(jì)算機(jī)技術(shù)和人工智能的迅速發(fā)展,對(duì)數(shù)字圖像的處理正成為社會(huì)和學(xué)術(shù) 界研究的熱點(diǎn)。傳統(tǒng)上對(duì)于圖像的檢索處理方式是通過(guò)人眼來(lái)觀察圖像的形狀,大小,顏色 等信息,然后經(jīng)人類(lèi)的神經(jīng)中樞系統(tǒng)對(duì)其做出判別,識(shí)別率很高,但是其在處理速度方面卻 難以滿(mǎn)足當(dāng)今各項(xiàng)應(yīng)用的要求。
[0003] 對(duì)于數(shù)字圖像進(jìn)行處理在人工智能,機(jī)器學(xué)習(xí),數(shù)字圖像處理,計(jì)算機(jī)視覺(jué)等相關(guān) 領(lǐng)域有著非常重要的應(yīng)用,逐漸成為了國(guó)內(nèi)外學(xué)者的關(guān)注方向。近年來(lái),有一種被稱(chēng)作脈沖 奉禹合神經(jīng)網(wǎng)絡(luò)PCNN(Pulse Coupled Neural Networks)的人工神經(jīng)網(wǎng)絡(luò)的模型正逐漸的被 應(yīng)用于圖像處理中。PCNN模型是一種非常接近人類(lèi)大腦神經(jīng)網(wǎng)絡(luò)的生物網(wǎng)絡(luò)模型,在圖像 處理,圖像識(shí)別,決策優(yōu)化方面存在著有別與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì),具有廣闊的應(yīng)用前 景。它模擬了生物的視覺(jué)特性,具有生物學(xué)的相關(guān)背景,被稱(chēng)之為第三代神經(jīng)網(wǎng)絡(luò)。早在 1999年,Izhikevich從數(shù)學(xué)上嚴(yán)格證明了實(shí)際的生物細(xì)胞模型與PCNN模型是一致的,有所 不同的只是變量的坐標(biāo)而已。研究表明,PCNN具有的基本特性有變閾值特性,非線(xiàn)性調(diào)制 特性,同步脈沖發(fā)放現(xiàn)象,捕獲特性,動(dòng)態(tài)脈沖發(fā)放現(xiàn)象,自動(dòng)波特性和綜合時(shí)空特性,可以 將其應(yīng)用于圖像去噪,圖像分割,圖像邊緣檢測(cè)等等。PCNN所具有的同步和自動(dòng)波的重要屬 性,得到了研究人員的關(guān)注,對(duì)于數(shù)字圖像的相關(guān)處理有著良好的效果。
[0004] 印章圖像因?yàn)槠涑休d的屬性,所以它一般是出現(xiàn)在有著復(fù)雜背景介質(zhì)的地方,這 也給印文的辨識(shí)增加了很大的難度。其背景中還包含了一些其他的和印文圖像相似的結(jié) 構(gòu),這些內(nèi)容的顏色和印文圖像非常相似,同樣造成了印文辨識(shí)的困難。
[0005] 印文的提取的主要步驟如下:先對(duì)原始的RGB顏色空間的印文圖像進(jìn)行二值化的 處理,使得圖像變得簡(jiǎn)單,圖像的數(shù)據(jù)信息會(huì)因此減少,但是卻能夠凸顯出我們需要的目標(biāo) 輪廓,接著提取出印文的輪廓骨架,讓提取出來(lái)的骨架和原始的圖像轉(zhuǎn)化成的二值化印文 圖像進(jìn)行融合,這樣最終就把印文的主要特征結(jié)構(gòu)給提取出來(lái)。對(duì)于印文的模版圖像和待 比對(duì)的圖像都需要進(jìn)行這樣的相關(guān)處理,這樣把圖像轉(zhuǎn)換成為計(jì)算機(jī)能夠理解的特征,按 照特征進(jìn)行比對(duì),最終得出鑒別的結(jié)果。
[0006] 原始圖像是一個(gè)基于RGB顏色空間的圖像,那么通過(guò)OpenCV這一跨平臺(tái)的計(jì)算機(jī) 視覺(jué)庫(kù)里面的API函數(shù),能夠很方便的實(shí)現(xiàn)將原始圖像轉(zhuǎn)換為灰度圖像,接著繼續(xù)將灰度 圖像轉(zhuǎn)換成更好處理的二值化的圖像,二值化的圖像能夠大大減少處理信息,簡(jiǎn)化問(wèn)題。由 于印文本身結(jié)構(gòu)的特殊性,可以料想到,進(jìn)行二值化處理后的圖像會(huì)存在一定數(shù)量的結(jié)構(gòu) 上的空洞,不利于對(duì)圖像的處理,這時(shí)候應(yīng)該采取形態(tài)學(xué)上的連續(xù)腐蝕操作,形態(tài)學(xué)上的腐 蝕是將圖像中的某些結(jié)構(gòu)元給去除掉,腐蝕會(huì)縮小并細(xì)化二值化圖像中的部分,在印文中 就會(huì)將細(xì)小的邊界和結(jié)構(gòu)給過(guò)濾干凈,進(jìn)行完連續(xù)的腐蝕操作,還要對(duì)圖像進(jìn)行連續(xù)的膨 脹操作,與腐蝕有所不同的,膨脹會(huì)在一定程度上粗化或者說(shuō)增加二值化圖像中的部分,重 塑圖像,然后對(duì)最終的圖像進(jìn)行邊界的提取,這樣就能夠得到的符合要求的結(jié)果圖像。
[0007] 圖像中的一個(gè)空洞可以被定義成為由前景像素相連接的邊界所包圍的一個(gè)背景 區(qū)域。對(duì)空洞的填充也是圖像處理的幾種常用辦法。
[0008] 大小為mXn的二值圖像F (假設(shè)圖像中背景的灰度值是1,對(duì)象的灰度值是0),設(shè) 定F(i,j)表示第(i,j)個(gè)像素的灰度值。在把圖像F輸入到神經(jīng)網(wǎng)絡(luò)前,對(duì)像素的灰度值 F(i,j)進(jìn)行預(yù)處理: ''、、</ <mA< j <n
[0009] /W(廠(/,./))=,', . (I)
[2,otherwise
[0010] 接著把F輸入到網(wǎng)絡(luò)中一直到?jīng)]有新的神經(jīng)元點(diǎn)火,那么最終得到的結(jié)果就是空 洞填充的結(jié)果。這一步的操作為接下來(lái)對(duì)圖像骨架細(xì)化,然后進(jìn)行印文提取有重要的作用。 [0011] 所謂圖像細(xì)化,指的是對(duì)二值化圖像骨架化的一種操作運(yùn)算。細(xì)化就是對(duì)圖像進(jìn) 行一層層的剝離,把圖像中一些不重要的部分給濾去,但是最重要的是仍然保持圖像原來(lái) 的大致形狀。這對(duì)于印文圖像的提取起到了很大的作用。現(xiàn)有技術(shù)中尚未發(fā)現(xiàn)有一種能夠 把印文骨架快速的從復(fù)雜的印文背景中提取出來(lái)的方法。
【發(fā)明內(nèi)容】
[0012] 本發(fā)明的目的在于克服上述技術(shù)存在的缺陷,提供一種基于PCNN的印文提取方 法,采用的細(xì)化算法能夠把印文骨架快速的從復(fù)雜的印文背景中提取出來(lái)。其具體技術(shù)方 案為:
[0013] 一種基于PCNN的印文提取方法,包括以下步驟:
[0014] 1)對(duì)原始印文圖像進(jìn)行二值化的處理,得到更好處理的二值化印文圖像。
[0015] 2)對(duì)待處理的二值化印文圖像進(jìn)行連續(xù)的腐蝕和膨脹操作,重塑圖像。
[0016] 3)對(duì)于重塑的圖像進(jìn)行填充操作,得到填充圖像Imagel,將重塑的圖像減去填充 圖像得到待處理的另一圖像Image2。
[0017] 4)把上述兩種圖像分別輸入脈沖耦合神經(jīng)網(wǎng)絡(luò)模型中,得到相應(yīng)的輸出結(jié)果圖 像。
[0018] 5)對(duì)于輸出的結(jié)果圖像按照相應(yīng)的細(xì)化結(jié)果公式進(jìn)行細(xì)化操作,得到最終的細(xì)化 結(jié)果圖像。
[0019] 與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:
[0020] 對(duì)于有著復(fù)雜蓋印的印文圖像的提取有著良好的應(yīng)用,利用計(jì)算機(jī)技術(shù)對(duì)印文圖 像進(jìn)行數(shù)字化的處理,進(jìn)行印文圖像的提取和比對(duì),能夠排除復(fù)雜情況下印文圖像的殘缺, 紋理粗細(xì)不一致以及可能存在的背景噪聲給印文圖像識(shí)別帶來(lái)的干擾。把神經(jīng)網(wǎng)絡(luò)模型 和印文圖像的提取結(jié)合起來(lái),能夠發(fā)揮出神經(jīng)網(wǎng)絡(luò)出色的容錯(cuò)能力和較強(qiáng)的泛化和適應(yīng)能 力,使得印章的識(shí)別具有更高的準(zhǔn)確性和效率。由于神經(jīng)網(wǎng)絡(luò)具有和大腦類(lèi)似的特點(diǎn),加上 應(yīng)用計(jì)算機(jī)出色的計(jì)算能力,能夠克服傳統(tǒng)的人工印章識(shí)別中存在的缺陷,獲得相對(duì)理想 的結(jié)果。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0021] 圖1是本發(fā)明基于PCNN的印文提取方法的流程圖。
【具體實(shí)施方式】
[0022] 為了使本發(fā)明實(shí)現(xiàn)的技術(shù)手段、創(chuàng)作特征、達(dá)成目的與功效易于明白了解,下面結(jié) 合附圖和具體實(shí)例,進(jìn)一步闡述本發(fā)明。
[0023] 在圖1中,Imagel和Image2是兩幅二值圖像,在第η次點(diǎn)火的時(shí)候,分別用O1(Ii), (? (η)來(lái)表不輸出。細(xì)化的結(jié)果公式為:
[0024] R(η) - R(η-1) V ((O1(Ii) Λ O2(η)) V (O1Oi-I) Λ O2(η))) (2)
[0025] 實(shí)際上Imagel是原始圖像通過(guò)空洞填充算法得到的,Image2則是由Imagel和二 值化后的圖像相減得到的。通過(guò)PCNN神經(jīng)網(wǎng)絡(luò)模型得到最終的結(jié)果。由于待操作的圖像 在先決條件上要求是封閉的,那么形態(tài)學(xué)上的腐蝕和膨脹的操作就很有必要。
[0026] 在得到了印章的骨架之后,將印章圖像的骨架提取的圖像和印文的二值化圖像在 形態(tài)學(xué)上進(jìn)行完腐蝕和膨脹操作之后的圖像進(jìn)行融合,可以得到一個(gè)新的融合圖像。
[0027] 不變矩的主要的原理是來(lái)自于對(duì)圖像變換不敏感的基本區(qū)域的幾個(gè)矩作為形狀 特征。不變矩在圖像的物理意義上并沒(méi)有什么定義,只是純數(shù)學(xué)上的定義,在一幅連續(xù)圖像 的情況下,假設(shè)圖像的函數(shù)是f(x,y),那么圖像的P+q階幾何矩(即標(biāo)準(zhǔn)矩)就可以定義 為:
【權(quán)利要求】
1. 一種基于PO^N的印文提取方法,其特征在于,包括W下步驟: 1) 對(duì)原始印文圖像進(jìn)行二值化的處理,得到更好處理的二值化印文圖像; 2) 對(duì)待處理的二值化印文圖像進(jìn)行連續(xù)的腐蝕和膨脹操作,重塑圖像; 3) 對(duì)于重塑的圖像進(jìn)行填充操作,得到填充圖像Imagel,將重塑的圖像減去填充圖像 得到待處理的另一圖像Image2 ; 4) 把上述兩種圖像分別輸入脈沖禪合神經(jīng)網(wǎng)絡(luò)模型中,得到相應(yīng)的輸出結(jié)果圖像; 5) 對(duì)于輸出的結(jié)果圖像按照相應(yīng)的細(xì)化結(jié)果公式進(jìn)行細(xì)化操作,得到最終的細(xì)化結(jié)果 圖像。
【文檔編號(hào)】G06K9/46GK104463171SQ201410746225
【公開(kāi)日】2015年3月25日 申請(qǐng)日期:2014年12月9日 優(yōu)先權(quán)日:2014年12月9日
【發(fā)明者】彭德中, 章毅, 呂建成, 張蕾, 張海仙, 桑永勝, 郭際香, 毛華, 胡鵬, 林毅 申請(qǐng)人:四川大學(xué)