圖像文字識(shí)別方法及裝置的制造方法_2

文檔序號(hào)：9866210閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>圖像文字識(shí)別方法及裝置的制造方法

進(jìn)行圖像分割處理，僅保留切分后的文字子塊中的文字信息也即文字像素，去除背景像素給識(shí)別帶來(lái)的干擾，根據(jù)所述文字信息在預(yù)置的系統(tǒng)文字庫(kù)中進(jìn)行比對(duì)，其中，所述系統(tǒng)文字庫(kù)中預(yù)先存儲(chǔ)有常用文字信息，根據(jù)比對(duì)圖像分割后的文字子塊中的文字信息與所述系統(tǒng)文字庫(kù)中預(yù)先存儲(chǔ)的常用文字信息的相似度來(lái)對(duì)文字子塊中的文字進(jìn)行識(shí)別，也即對(duì)圖像中的文字進(jìn)行識(shí)別。
[0055]本實(shí)施例通過(guò)對(duì)待識(shí)別圖像的矩陣行間紋理特征進(jìn)行分析，估算出圖像中文字的相關(guān)矩陣參數(shù)，再基于文字的相關(guān)矩陣參數(shù)對(duì)圖像切分獲取文字子塊，并對(duì)文字子塊進(jìn)行識(shí)別，由于是通過(guò)估算出的文字的相關(guān)矩陣參數(shù)來(lái)進(jìn)行切分、識(shí)別，能根據(jù)圖像中文字的特性進(jìn)行自適應(yīng)調(diào)節(jié)，提高了切分獲取文字子塊的準(zhǔn)確性，且極大地提升了對(duì)圖像中文字識(shí)別的精度。
[0056]具體地,如圖2所示,上述步驟S20可以包括:
[0057]步驟S201，將圖像的矩陣坐標(biāo)中的字體用第一像素值表示，背景用第二像素值表示，統(tǒng)計(jì)圖像的矩陣坐標(biāo)中每行第二像素值的個(gè)數(shù)，獲取一數(shù)組；
[0058]將待識(shí)別的圖像進(jìn)行二值化處理后，將圖像的矩陣坐標(biāo)中的字體用第一像素值表示，背景用第二像素值表示，如可設(shè)定第一像素值為0，第二像素值為255。統(tǒng)計(jì)圖像的矩陣坐標(biāo)中每行第二像素值即255的個(gè)數(shù),形成一數(shù)組Numwhite,記為:Numwhite = [nunvnum；；......numj，其中η為圖像矩陣的行數(shù)，Iium1代表第i行第二像素值即255值的個(gè)數(shù)。需要說(shuō)明的是，由于目前大多數(shù)圖像中都是以文字為黑色，背景為白色，因此，本實(shí)施例中，以第一像素值為黑色像素值、第二像素值為白色像素值為例進(jìn)行說(shuō)明，當(dāng)然，也不限定第一像素值、第二像素值為其他不同顏色像素值的情況。又由于圖像中背景如字里行間的顏色相對(duì)單一，幾乎均為白色，而字體所在的連續(xù)行雖然黑色像素值集中，但同樣存在大量白色像素值，即字體的黑色像素并沒(méi)有將整個(gè)字體行填滿(mǎn)，因此，在本實(shí)施例中，優(yōu)選統(tǒng)計(jì)圖像的矩陣坐標(biāo)中每行白色像素值，即將每行的白色像素值作為基準(zhǔn)值，這樣，對(duì)區(qū)分圖像矩陣坐標(biāo)中的字體打和空白打更加準(zhǔn)確有效。
[0059]步驟S202，獲取所述數(shù)組中數(shù)值大于預(yù)設(shè)基準(zhǔn)值的行的行號(hào)，將所述數(shù)組中數(shù)值大于預(yù)設(shè)基準(zhǔn)值的行中符合預(yù)設(shè)條件的行組合之間的行號(hào)距離作為一個(gè)行寬參數(shù)，統(tǒng)計(jì)所述數(shù)組中的若干行寬參數(shù)，對(duì)若干行寬參數(shù)取平均值，獲取所述數(shù)組的行寬參數(shù)；
[0060]理論上，數(shù)組Numwhlte中Imm1的最大值應(yīng)該為圖像矩陣的列數(shù)m，即表明圖像矩陣中有若干列為空白。但在實(shí)際應(yīng)用中，由于前期對(duì)圖像的預(yù)處理工作可能存在誤差，使得不一定每個(gè)空白行中所有值都為白色像素值即255。因此，為了增加統(tǒng)計(jì)的魯棒性，設(shè)定預(yù)設(shè)基準(zhǔn)值P為列數(shù)m的85 %，即設(shè)定預(yù)設(shè)基準(zhǔn)值P = m*85%，只要圖像矩陣中某一行白色像素值即255值的個(gè)數(shù)Iium1大于預(yù)設(shè)基準(zhǔn)值P，則判斷該行是空白行，這樣，能提升統(tǒng)計(jì)結(jié)果的準(zhǔn)確性，減小實(shí)際應(yīng)用中誤差帶來(lái)的干擾。
[0061]獲取所述數(shù)組中數(shù)值大于預(yù)設(shè)基準(zhǔn)值P的行Iium1的行號(hào)i，并將所述數(shù)組中數(shù)值大于預(yù)設(shè)基準(zhǔn)值P的行中符合預(yù)設(shè)條件的行組合之間的行號(hào)距離作為一個(gè)行寬參數(shù)，如可將所述數(shù)組中數(shù)值連續(xù)大于預(yù)設(shè)基準(zhǔn)值P的行作為一連續(xù)行組合，將連續(xù)行組合之間的行號(hào)距離作為一個(gè)行寬參數(shù)，在本實(shí)施例中，優(yōu)選為將所述數(shù)組中至少連續(xù)兩次大于預(yù)設(shè)基準(zhǔn)值的行組合與下一至少連續(xù)兩次大于預(yù)設(shè)基準(zhǔn)值的行組合之間的行號(hào)距離作為一個(gè)行寬參數(shù)，這樣，能準(zhǔn)確的計(jì)算出空白行組合之間每一字體行的行寬，統(tǒng)計(jì)所述數(shù)組中的若干行寬參數(shù)，由于各個(gè)行寬參數(shù)之間可能存在差異，因此需對(duì)若干行寬參數(shù)求平均值并取整，作為所述數(shù)組的最終的行寬參數(shù)。
[0062]步驟S203，根據(jù)獲取的所述數(shù)組的行寬參數(shù)獲取所述數(shù)組的列寬參數(shù)，并根據(jù)所述行寬參數(shù)和列寬參數(shù)獲取所述數(shù)組的字體大小參數(shù)。
[0063]由于圖像中文字一般占用的是正方形方格，因此，在本實(shí)施例中，直接將獲取的所述數(shù)組的行寬參數(shù)作為所述數(shù)組的列寬參數(shù)，再根據(jù)所述行寬參數(shù)和列寬參數(shù)即可獲取所述數(shù)組的字體大小參數(shù)，這樣，最終獲取的字體大小參數(shù)能準(zhǔn)確的體現(xiàn)不同圖像中的文字大小特性；當(dāng)然，本發(fā)明并不排除行寬和列寬不等的情況，當(dāng)文字行寬和列寬不相等時(shí)，可以采用與獲取數(shù)組的行寬參數(shù)相同的方法來(lái)獲取數(shù)組的列寬參數(shù)。需要說(shuō)明的是，雖然圖像文字中出現(xiàn)的標(biāo)點(diǎn)符號(hào)在一定程度上會(huì)影響到獲取的字體大小參數(shù)，但由于后續(xù)圖像分割算法對(duì)于因標(biāo)點(diǎn)影響的文字子塊分割不全問(wèn)題有模糊識(shí)別能力，再加上一般情況下文字中每行的標(biāo)點(diǎn)一般不會(huì)超過(guò)10%，因此，本實(shí)施例中標(biāo)點(diǎn)符號(hào)對(duì)圖像文字識(shí)別的影響不大。
[0064]進(jìn)一步地，上述步驟S40中預(yù)設(shè)的聚類(lèi)算法可以是K均值聚類(lèi)算法，基于K均值聚類(lèi)算法對(duì)切分后的文字子塊進(jìn)行圖像分割處理的步驟可以包括:
[0065]首先，任意選取一個(gè)切分后的文字子塊進(jìn)行圖像分割，對(duì)該文字子塊所對(duì)應(yīng)原圖像中的矩陣進(jìn)行處理，變成一個(gè)一維向量VR，并在VR向量中隨意選取兩個(gè)點(diǎn)A和B，作為聚類(lèi)的初始聚類(lèi)中心；
[0066]計(jì)算VR向量中任意一個(gè)點(diǎn)與這兩個(gè)初始聚類(lèi)中心A和B的距離；將VR中的點(diǎn)根據(jù)其距離兩個(gè)初始聚類(lèi)中心的距離分為兩類(lèi)，即距離A點(diǎn)較近的屬于A類(lèi)，距離B點(diǎn)較近的屬于B類(lèi)；
[0067]移動(dòng)聚類(lèi)中心到各自的點(diǎn)群中心，即A類(lèi)選取其中心點(diǎn)作為新的聚類(lèi)中心，B類(lèi)選取其中心點(diǎn)作為新的聚類(lèi)中心；
[0068]重復(fù)將VR中的點(diǎn)根據(jù)其距離兩個(gè)初始聚類(lèi)中心的距離分為兩類(lèi)的步驟，更新聚類(lèi)中心重新計(jì)算VR中的點(diǎn)與兩個(gè)聚類(lèi)中心的距離，并再次將VR中的點(diǎn)劃分成新的兩組，然后，再計(jì)算新的分組的聚類(lèi)中心；
[0069]依次循環(huán)，直至聚類(lèi)中心固定在某兩個(gè)點(diǎn)，停止以上循環(huán)計(jì)算，最終將VR中的點(diǎn)劃分成兩類(lèi)，即最終將切分后的文字子塊中文字與背景這兩種像素進(jìn)行分割，獲取切分后的文字子塊中的文字信息也即文字像素。
[0070]參照?qǐng)D3，圖3為本發(fā)明圖像文字識(shí)別方法第二實(shí)施例的流程示意圖。
[0071]在第二實(shí)施例中，在上述步驟S20之前還包括:
[0072]步驟S50，利用矩陣實(shí)驗(yàn)室中的圖像配準(zhǔn)函數(shù)在圖像及預(yù)設(shè)的基準(zhǔn)圖像中選定若干對(duì)匹配點(diǎn)，并根據(jù)所述若干對(duì)匹配點(diǎn)對(duì)圖像進(jìn)行配準(zhǔn)處理，獲取圖像配準(zhǔn)參數(shù)；基于所述圖像配準(zhǔn)參數(shù)對(duì)圖像對(duì)應(yīng)的矩陣中的任意坐標(biāo)值進(jìn)行變換處理，獲取變換后的圖像矩陣坐標(biāo)。
[0073]本實(shí)施例中，在將圖像進(jìn)行二值化處理，獲取圖像對(duì)應(yīng)的矩陣后，將該圖像對(duì)應(yīng)的一維的矩陣記為IA1，其中η代表一維矩陣的行數(shù)，m代表一維矩陣的列數(shù)。利用矩陣實(shí)驗(yàn)室(Matlab)中的圖像配準(zhǔn)函數(shù)在圖像及預(yù)設(shè)的基準(zhǔn)圖像中選定若干對(duì)匹配點(diǎn)，并根據(jù)所述若干對(duì)匹配點(diǎn)對(duì)圖像進(jìn)行配準(zhǔn)處理，獲取圖像配準(zhǔn)參數(shù)，具體地，調(diào)用Matlab中的圖像配準(zhǔn)函數(shù) cpselect (input, base)和 cp2tform(input, base), [input]和[base]兩個(gè)向量分別表示待配準(zhǔn)的圖像和預(yù)設(shè)的基準(zhǔn)圖像所對(duì)應(yīng)的一維向量，先利用cpselect (input, base)函數(shù)在待配準(zhǔn)的圖像和預(yù)設(shè)的基準(zhǔn)圖像中選定若干對(duì)匹配點(diǎn)，分別存放在向量[input_points]、[base_points]中，再調(diào)用cp2tform函數(shù)，設(shè)定匹配參數(shù)為線(xiàn)性變換linearconformal,得到圖像配準(zhǔn)參數(shù)T,其中，
[0074]T = cp2tform(input_points, base_points, ’linear conformal')。
[0075]獲取圖像配準(zhǔn)參數(shù)T后，基于所述圖像配準(zhǔn)參數(shù)T對(duì)所述一維矩陣中的任意坐標(biāo)值進(jìn)行變換處理，如設(shè)定(w，z)為待配準(zhǔn)的圖像矩陣IJni中的任意坐標(biāo)值，圖像配準(zhǔn)參數(shù)T作為變換參數(shù)，可進(jìn)行平移、縮放和旋轉(zhuǎn)等變換處理。則根據(jù)所述圖像配準(zhǔn)參數(shù)T進(jìn)行變換后得到的配準(zhǔn)后的圖像矩陣坐標(biāo)(X，y) = T(w, z)。
[0076]本實(shí)施例中，在分析圖像的矩陣行間紋理特征之前，先對(duì)待識(shí)別的圖像進(jìn)行配準(zhǔn)處理，這樣，能使后續(xù)對(duì)圖像文字進(jìn)行識(shí)別時(shí)，待識(shí)別的圖像接近于預(yù)設(shè)的基準(zhǔn)圖像，使圖像的

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁(yè)1 2 3 4

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像識(shí)別裝置相關(guān)技術(shù)

慧眼圖像文字識(shí)別軟件相關(guān)技術(shù)

圖像識(shí)別文字相關(guān)技術(shù)

圖像文字識(shí)別技術(shù)相關(guān)技術(shù)

慧眼圖像文字識(shí)別相關(guān)技術(shù)

識(shí)別圖像中的文字相關(guān)技術(shù)

在線(xiàn)圖像識(shí)別文字相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

圖像文字識(shí)別方法及裝置的制造方法_2