文字識別方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種文字識別方法和裝置。
【背景技術(shù)】
[0002] 文字識別領(lǐng)域中,文字的描述特征在很大程度上決定了識別的準(zhǔn)確率和識別速 度。一般的文字識別中,基于二值圖像的文字識別方法受前期預(yù)處理的影響較大,適合拍照 質(zhì)量很好的應(yīng)用場合。但對于打印的小票或其他印刷品,常常存在打印字不清晰,或印墨不 均勻的情況,適合采用灰度圖像的識別方法。
[0003] 基于灰度圖像的識別方法中,主流的化g特征法適用于數(shù)字的識別,G油or特征法 適用于中文的識別。G油or特征識別法是通過不同尺度和方向的G油or核對圖像進(jìn)行卷積 運算,然后抽取卷積圖像后的像素點作為文字的描述特征。該方法具有較高的識別率,但運 算量比較大,對識別速度有較大的影響。
【發(fā)明內(nèi)容】
[0004] 本申請旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0005] 為此,本申請的一個目的在于提出一種文字識別方法,該方法可W準(zhǔn)確高效地識 別圖像中的文字。
[0006] 本申請的另一個目的在于提出一種文字識別裝置。
[0007] 為達(dá)到上述目的,本申請實施例提出的文字識別方法,包括:根據(jù)預(yù)設(shè)的特征算 子,獲取待識別的圖像的特征向量,所述特征算子用于根據(jù)當(dāng)前處理的像素點的不同方向 上的相鄰的局部像素點進(jìn)行運算;將所述待識別的圖像的特征向量與預(yù)先獲取的文字樣本 的特征向量進(jìn)行比對,獲取所述待識別的圖像的文字識別結(jié)果,其中,所述文字樣本的特征 向量是根據(jù)所述特征算子對所述文字樣本進(jìn)行運算后得到的。
[0008] 本申請實施例提出的文字識別方法,通過根據(jù)預(yù)設(shè)的特征算子,獲取待識別的圖 像的特征向量并與預(yù)先獲取的文字樣本的特征向量進(jìn)行比對,獲取待識別的圖像的文字識 別結(jié)果,由于特征向量是根據(jù)預(yù)設(shè)的特征算子對當(dāng)前處理的像素點的不同方向上的相鄰的 局部像素點進(jìn)行運算得到的,對文字的特征表述更加準(zhǔn)確,提高了識別準(zhǔn)確率,且計算簡 單,提高了識別速度。
[0009] 為達(dá)到上述目的,本申請實施例提出的文字識別裝置,包括:獲取模塊,用于根據(jù) 預(yù)設(shè)的特征算子,獲取待識別的圖像的特征向量,所述特征算子用于根據(jù)當(dāng)前處理的像素 點的不同方向上的相鄰的局部像素點進(jìn)行運算;識別模塊,用于將所述待識別的圖像的特 征向量與預(yù)先獲取的文字樣本的特征向量進(jìn)行比對,獲取所述待識別的圖像的文字識別結(jié) 果,其中,所述文字樣本的特征向量是根據(jù)所述特征算子對所述文字樣本進(jìn)行運算后得到 的。
[0010] 本申請實施例提出的文字識別裝置,通過根據(jù)預(yù)設(shè)的特征算子,獲取待識別的圖 像的特征向量并與預(yù)先獲取的文字樣本的特征向量進(jìn)行比對,獲取待識別的圖像的文字識 別結(jié)果,由于特征向量是根據(jù)預(yù)設(shè)的特征算子對當(dāng)前處理的像素點的不同方向上的相鄰的 局部像素點進(jìn)行運算得到的,對文字的特征表述更加準(zhǔn)確,提高了識別準(zhǔn)確率,且計算簡 單,提高了識別速度。
[0011] 本申請附加的方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本申請的實踐了解到。
【附圖說明】
[0012] 本申請上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變 得明顯和容易理解,其中:
[0013] 圖1是本申請一個實施例提出的文字識別方法的流程示意圖;
[0014] 圖2是本申請一個實施例中的特征算子的示意圖;
[0015] 圖3是本申請一個實施例中的分別采用每種特征算子,對所述待識別的圖像進(jìn)行 運算,得到與所述特征算子數(shù)量相同的至少一組的特征向量的流程示意圖;
[0016] 圖4是本申請一個實施例中采用特征算子a對待識別的圖像進(jìn)行運算,得到第一 圖像和第二圖像的示意圖;
[0017] 圖5是本申請一個實施例中根據(jù)所述第一圖像得到第一組一維向量并根據(jù)所述 第二圖像得到第二組一維向量的示意圖;
[0018] 圖6是本申請另一實施例提出的文字識別方法的流程示意圖;
[0019] 圖7是本申請另一實施例的文字識別裝置的結(jié)構(gòu)示意圖;
[0020] 圖8是本申請另一實施例的文字識別裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0021] 下面詳細(xì)描述本申請的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考 附圖描述的實施例是示例性的,僅用于解釋本申請,而不能理解為對本申請的限制。相反, 本申請的實施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同 物。
[0022] 下面參考附圖描述根據(jù)本申請實施例的文字識別方法和裝置。
[0023] 圖1是本申請一實施例提出的文字識別方法的流程示意圖,該方法包括:
[0024] SlOl ;根據(jù)預(yù)設(shè)的特征算子,獲取待識別的圖像的特征向量,所述特征算子用于根 據(jù)當(dāng)前處理的像素點的不同方向上的相鄰的局部像素點進(jìn)行運算。
[00巧]其中,預(yù)設(shè)的特征算子包括至少一種。在本申請的一個實施例中,如圖2所示,特 征算子可W是如下算子中的至少一項:
[0026] 第一種特征算子(圖2中的算子a),所述第一種特征算子用于根據(jù)當(dāng)前處理的像 素點的相鄰行的局部像素點進(jìn)行運算;
[0027] 第二種特征算子(圖2中的算子b),所述第二種特征算子用于根據(jù)當(dāng)前處理的像 素點的相鄰列的局部像素點進(jìn)行運算;
[0028] 第H種特征算子(圖2中的算子C),所述第H種特征算子用于根據(jù)當(dāng)前處理的像 素點的一種相鄰對角線的局部像素點進(jìn)行運算;
[0029] 第四種特征算子(圖2中的算子d),所述第四種特征算子用于根據(jù)當(dāng)前處理的像 素點的另一種相鄰對角線的局部像素點進(jìn)行運算。
[0030] 具體地,可W分別采用每種特征算子,對所述待識別的圖像進(jìn)行運算,得到與所述 特征算子數(shù)量相同的至少一組的特征向量,對所述至少一組的特征向量進(jìn)行組合,獲取待 識別的圖像的特征向量。
[0031] 進(jìn)一步地,參見圖3,分別采用每種特征算子,對所述待識別的圖像進(jìn)行運算,得到 與所述特征算子數(shù)量相同的至少一組的特征向量,可W通過W下步驟實現(xiàn):
[0032] S301 ;分別采用每種特征算子,對待識別的圖像進(jìn)行運算,得到第一圖像和第二圖 像。
[0033] 下面將W算子a為例對至少一組的特征向量的計算方法進(jìn)行說明。
[0034] 具體地,參見圖4,對于輸入的待識別的圖像Img,其經(jīng)過算子a進(jìn)行局部運算后會 得到兩張同樣大小的圖像ImgO和Imgl。對圖中的每個非邊緣像素點PO,可W采用如下方 式確定所述像素點對應(yīng)的第一圖像和第二圖像中的像素點的值:
[0035] 獲取所述每種特征算子描述的方向上與所述像素點相鄰的第一組像素點的灰度 值和第二組像素點的灰度值;獲取所述第一組像素點的灰度值之和與所述第二組像素點的 灰度值之和之間的差值。具體地,在利用算子a進(jìn)行計算時,則為計算PO上下相鄰行局部 像素點的灰度值之和的差值V ;v= (pl+p2+p3)-(p4+p5+p6);其中,局部像素點是指左右和 /或上下相鄰的像素點。送一步驟與現(xiàn)有的邊緣計算算子的方法相近,但在本方案中,為了 去除因光照或打印不均勻造成的局部差值波動較大、便于向量歸一化,還需要根據(jù)預(yù)先設(shè) 置的闊值和比較方向,對所述差值V進(jìn)行二值化處理,得到第一圖像中的像素點的值,W及 第二圖像中的像素點的值: ,[I^V > B "[切< -6
[0036] 鐘二1。、交; 0,[0,!?>-5
[0037] 其中,PO'是第一圖像中的像素點的值,PO"是第二圖像中的像素點的值,V是差 值,5是預(yù)先設(shè)置的闊值。
[003引經(jīng)過二值化處理后,PO'和PO"的輸出值變得比較穩(wěn)定,受光照打印質(zhì)量的影響很 小。5的取值,在具體實施例中可W取3*10,即默認(rèn)像素間最小有10個灰度級的差別。
[0039] 上式中第一圖像與第二圖像中的差值V的比較方向不同,是由于圖像中的字,局 部存在從黑到白、從白到黑的跳變,通過送兩種不同的比較可W判斷跳變的方式,或者是平 坦的區(qū)域,從而達(dá)到對局部像素紋理較準(zhǔn)確的表示。
[0040] S302;根據(jù)所述第一圖像得到第一組一維向量,根據(jù)所述第二圖像得到第二組一 維向量。
[0041] 通常在文字識別中,圖像大小為64*64或40*40,如果利用算子a計算后直接將 圖像ImgO、Imgl中的像素點的值排成一維向量,則特征向量的維數(shù)將很大(2*64*64