圖像文字識(shí)別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像識(shí)別技術(shù)領(lǐng)域,尤其涉及一種圖像文字識(shí)別方法及裝置。
【背景技術(shù)】
[0002]目前,對(duì)圖像中的文字一般只是通過(guò)簡(jiǎn)單的圖像分割處理來(lái)進(jìn)行識(shí)別,無(wú)法根據(jù)圖像中的文字特征來(lái)進(jìn)行自適應(yīng)調(diào)節(jié),導(dǎo)致現(xiàn)有的圖像文字識(shí)別方法精度較低,無(wú)法滿足實(shí)際應(yīng)用的需求。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的主要目的在于解決現(xiàn)有的圖像文字識(shí)別方法對(duì)文字的識(shí)別精度較低的技術(shù)問(wèn)題。
[0004]為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種圖像文字識(shí)別方法,所述方法包括以下步驟:
[0005]將圖像進(jìn)行二值化處理,獲取圖像對(duì)應(yīng)的矩陣;
[0006]分析圖像的矩陣行間紋理特征,獲取圖像的文字矩陣參數(shù);
[0007]基于所述文字矩陣參數(shù)對(duì)圖像進(jìn)行切分,獲取圖像的文字子塊;
[0008]對(duì)所述文字子塊進(jìn)行圖像分割以獲取所述文字子塊中的文字信息,并對(duì)所述文字信息進(jìn)行識(shí)別。
[0009]優(yōu)選地,所述分析圖像的矩陣行間紋理特征,獲取圖像的文字矩陣參數(shù)的步驟包括:
[0010]將圖像的矩陣坐標(biāo)中的字體用第一像素值表示,背景用第二像素值表示,統(tǒng)計(jì)圖像的矩陣坐標(biāo)中每行第二像素值的個(gè)數(shù),獲取一數(shù)組;
[0011]獲取所述數(shù)組中數(shù)值大于預(yù)設(shè)基準(zhǔn)值的行的行號(hào),將所述數(shù)組中數(shù)值大于預(yù)設(shè)基準(zhǔn)值的行中符合預(yù)設(shè)條件的行組合之間的行號(hào)距離作為一個(gè)行寬參數(shù),統(tǒng)計(jì)所述數(shù)組中的若干行寬參數(shù),對(duì)若干行寬參數(shù)取平均值,獲取所述數(shù)組的行寬參數(shù);
[0012]根據(jù)獲取的所述數(shù)組的行寬參數(shù)獲取所述數(shù)組的列寬參數(shù),并根據(jù)所述行寬參數(shù)和列寬參數(shù)獲取所述數(shù)組的字體大小參數(shù)。
[0013]優(yōu)選地,所述將所述數(shù)組中數(shù)值大于預(yù)設(shè)基準(zhǔn)值的行中符合預(yù)設(shè)條件的行組合之間的行號(hào)距離作為一個(gè)行寬參數(shù)的步驟具體為:
[0014]將所述數(shù)組中至少連續(xù)兩次大于預(yù)設(shè)基準(zhǔn)值的行組合與下一至少連續(xù)兩次大于預(yù)設(shè)基準(zhǔn)值的行組合之間的行號(hào)距離作為一個(gè)行寬參數(shù)。
[0015]優(yōu)選地,所述對(duì)所述文字子塊進(jìn)行圖像分割以獲取所述文字子塊中的文字信息,并對(duì)所述文字信息進(jìn)行識(shí)別的步驟具體為:
[0016]基于預(yù)設(shè)的聚類(lèi)算法對(duì)切分后的文字子塊進(jìn)行圖像分割處理,獲取所述文字子塊中的文字信息,并根據(jù)所述文字信息在預(yù)置的系統(tǒng)文字庫(kù)中進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果對(duì)圖像中的文字進(jìn)行識(shí)別。
[0017]優(yōu)選地,所述分析圖像的矩陣行間紋理特征,獲取圖像的文字矩陣參數(shù)的步驟之前還包括:
[0018]利用矩陣實(shí)驗(yàn)室中的圖像配準(zhǔn)函數(shù)在圖像及預(yù)設(shè)的基準(zhǔn)圖像中選定若干對(duì)匹配點(diǎn),并根據(jù)所述若干對(duì)匹配點(diǎn)對(duì)圖像進(jìn)行配準(zhǔn)處理,獲取圖像配準(zhǔn)參數(shù);
[0019]基于所述圖像配準(zhǔn)參數(shù)對(duì)圖像對(duì)應(yīng)的矩陣中的任意坐標(biāo)值進(jìn)行變換處理,獲取變換后的圖像矩陣坐標(biāo)。
[0020]此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種圖像文字識(shí)別裝置,所述圖像文字識(shí)別裝置包括:
[0021]二值化模塊,用于將圖像進(jìn)行二值化處理,獲取圖像對(duì)應(yīng)的矩陣;
[0022]分析模塊,用于分析圖像的矩陣行間紋理特征,獲取圖像的文字矩陣參數(shù);
[0023]切分模塊,用于基于所述文字矩陣參數(shù)對(duì)圖像進(jìn)行切分,獲取圖像的文字子塊;
[0024]識(shí)別模塊,用于對(duì)所述文字子塊進(jìn)行圖像分割以獲取所述文字子塊中的文字信息,并對(duì)所述文字信息進(jìn)行識(shí)別。
[0025]優(yōu)選地,所述分析模塊包括:
[0026]數(shù)組獲取單元,用于將圖像的矩陣坐標(biāo)中的字體用第一像素值表示,背景用第二像素值表示,統(tǒng)計(jì)圖像的矩陣坐標(biāo)中每行第二像素值的個(gè)數(shù),獲取一數(shù)組;
[0027]行寬參數(shù)獲取單元,用于獲取所述數(shù)組中數(shù)值大于預(yù)設(shè)基準(zhǔn)值的行的行號(hào),將所述數(shù)組中數(shù)值大于預(yù)設(shè)基準(zhǔn)值的行中符合預(yù)設(shè)條件的行組合之間的行號(hào)距離作為一個(gè)行寬參數(shù),統(tǒng)計(jì)所述數(shù)組中的若干行寬參數(shù),對(duì)若干行寬參數(shù)取平均值,獲取所述數(shù)組的行寬參數(shù);
[0028]字體大小參數(shù)獲取單元,用于根據(jù)獲取的所述數(shù)組的行寬參數(shù)獲取所述數(shù)組的列寬參數(shù),并根據(jù)所述行寬參數(shù)和列寬參數(shù)獲取所述數(shù)組的字體大小參數(shù)。
[0029]優(yōu)選地,所述行寬參數(shù)獲取單元還用于:
[0030]將所述數(shù)組中至少連續(xù)兩次大于預(yù)設(shè)基準(zhǔn)值的行組合與下一至少連續(xù)兩次大于預(yù)設(shè)基準(zhǔn)值的行組合之間的行號(hào)距離作為一個(gè)行寬參數(shù)。
[0031]優(yōu)選地,所述識(shí)別模塊具體用于:
[0032]基于預(yù)設(shè)的聚類(lèi)算法對(duì)切分后的文字子塊進(jìn)行圖像分割處理,獲取所述文字子塊中的文字信息,并根據(jù)所述文字信息在預(yù)置的系統(tǒng)文字庫(kù)中進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果對(duì)圖像中的文字進(jìn)行識(shí)別。
[0033]優(yōu)選地,所述圖像文字識(shí)別裝置還包括:
[0034]配準(zhǔn)模塊,用于利用矩陣實(shí)驗(yàn)室中的圖像配準(zhǔn)函數(shù)在圖像及預(yù)設(shè)的基準(zhǔn)圖像中選定若干對(duì)匹配點(diǎn),并根據(jù)所述若干對(duì)匹配點(diǎn)對(duì)圖像進(jìn)行配準(zhǔn)處理,獲取圖像配準(zhǔn)參數(shù);基于所述圖像配準(zhǔn)參數(shù)對(duì)圖像對(duì)應(yīng)的矩陣中的任意坐標(biāo)值進(jìn)行變換處理,獲取變換后的圖像矩陣坐標(biāo)。
[0035]本發(fā)明提出的一種圖像文字識(shí)別方法及裝置,通過(guò)對(duì)待識(shí)別圖像的矩陣行間紋理特征進(jìn)行分析,估算出圖像中文字的相關(guān)矩陣參數(shù),再基于文字的相關(guān)矩陣參數(shù)對(duì)圖像切分獲取文字子塊,并對(duì)文字子塊進(jìn)行識(shí)別,由于是通過(guò)估算出的文字的相關(guān)矩陣參數(shù)來(lái)進(jìn)行切分、識(shí)別,能根據(jù)圖像中文字的特性進(jìn)行自適應(yīng)調(diào)節(jié),提高了切分獲取文字子塊的準(zhǔn)確性,及對(duì)圖像中文字識(shí)別的精度。
【附圖說(shuō)明】
[0036]圖1為本發(fā)明圖像文字識(shí)別方法第一實(shí)施例的流程示意圖;
[0037]圖2為圖1中步驟S20的細(xì)化流程示意圖;
[0038]圖3為本發(fā)明圖像文字識(shí)別方法第二實(shí)施例的流程示意圖;
[0039]圖4為本發(fā)明圖像文字識(shí)別裝置第一實(shí)施例的功能模塊示意圖;
[0040]圖5為圖4中分析模塊02的細(xì)化功能模塊示意圖;
[0041]圖6為本發(fā)明圖像文字識(shí)別裝置第二實(shí)施例的功能模塊示意圖。
[0042]本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說(shuō)明。
【具體實(shí)施方式】
[0043]應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0044]本發(fā)明提供一種圖像文字識(shí)別方法。
[0045]參照?qǐng)D1,圖1為本發(fā)明圖像文字識(shí)別方法第一實(shí)施例的流程示意圖。
[0046]在第一實(shí)施例中,該圖像文字識(shí)別方法包括:
[0047]步驟S10,將圖像進(jìn)行二值化處理,獲取圖像對(duì)應(yīng)的矩陣;
[0048]將待識(shí)別的圖像進(jìn)行二值化處理,獲取其對(duì)應(yīng)的一維的矩陣,以便后續(xù)對(duì)圖像進(jìn)行分析時(shí)直接對(duì)其矩陣進(jìn)行分析。
[0049]步驟S20,分析圖像的矩陣行間紋理特征,獲取圖像的文字矩陣參數(shù);
[0050]利用圖像的矩陣行間紋理特征來(lái)進(jìn)行分析,估算出圖像中文字的特征參數(shù),如可體現(xiàn)圖像中文字特性的行寬、列寬、文字大小等文字矩陣參數(shù),這樣,即可根據(jù)不同圖像的矩陣獲取其中相應(yīng)的文字矩陣參數(shù),能根據(jù)不同圖像中文字的不同特性自適應(yīng)的獲取其對(duì)應(yīng)的文字矩陣參數(shù)。本實(shí)施例中,待識(shí)別的圖像可以是jpg、bmp、png等圖像格式,在此不作限定。
[0051]步驟S30,基于所述文字矩陣參數(shù)對(duì)圖像進(jìn)行切分,獲取圖像的文字子塊;
[0052]獲取到圖像的文字矩陣參數(shù)后,根據(jù)該文字矩陣參數(shù)對(duì)圖像進(jìn)行切分,將圖像切分為若干文字子塊,由于是根據(jù)能體現(xiàn)圖像中文字特性的文字矩陣參數(shù)來(lái)對(duì)圖像進(jìn)行切分,使得切分后的文字子塊能最大程度的包含文字的有效信息,提高了切分圖像的準(zhǔn)確性及合理性,且有利于提升后續(xù)對(duì)文字子塊識(shí)別的精度。
[0053]步驟S40,對(duì)所述文字子塊進(jìn)行圖像分割以獲取所述文字子塊中的文字信息,并對(duì)所述文字信息進(jìn)行識(shí)別。
[0054]由于二值化處理后的圖像中只包括文字與背景這兩種像素,基于預(yù)設(shè)的聚類(lèi)算法對(duì)切分后的文字子塊