區(qū)域提取方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本公開(kāi)涉及圖像處理領(lǐng)域,特別涉及一種區(qū)域提取方法及裝置。
【背景技術(shù)】
[0002]身份證的自動(dòng)識(shí)別技術(shù)是一種通過(guò)圖像處理對(duì)身份證上的文字信息進(jìn)行識(shí)別的技術(shù)。
[0003]相關(guān)技術(shù)提供了一種身份證的自動(dòng)識(shí)別方法,通過(guò)身份證掃描設(shè)備按照固定的相對(duì)位置對(duì)身份證進(jìn)行掃描,得到身份證的掃描圖像;對(duì)掃描圖像中的η個(gè)預(yù)定區(qū)域進(jìn)行文字識(shí)別,得到姓名信息、性別信息、民族信息、出生日期信息、地址信息和公民身份號(hào)碼信息中的至少一種。但是對(duì)于直接拍攝得到的身份證圖像,仍然有較大的識(shí)別難度。
【發(fā)明內(nèi)容】
[0004]為了解決相關(guān)技術(shù)中存在的問(wèn)題,本公開(kāi)提供一種區(qū)域提取方法及裝置。所述技術(shù)方案如下:
[0005]根據(jù)本公開(kāi)實(shí)施例的第一方面,提供一種區(qū)域提取方法,該方法包括:
[0006]獲取證件圖像中第一信息區(qū)域的區(qū)域位置;
[0007]根據(jù)第一信息區(qū)域的區(qū)域位置確定出第二信息區(qū)域;
[0008]對(duì)第二信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域。
[0009]在一個(gè)可選的實(shí)施例中,區(qū)域位置采用頂點(diǎn)坐標(biāo)表示;
[0010]根據(jù)第一信息區(qū)域的區(qū)域位置確定第二信息區(qū)域,包括:
[0011]根據(jù)第一信息區(qū)域的至少兩個(gè)頂點(diǎn)坐標(biāo)和預(yù)定的相對(duì)位置關(guān)系,確定出第二信息區(qū)域,相對(duì)位置關(guān)系是頂點(diǎn)坐標(biāo)與第二信息區(qū)域之間的相對(duì)位置關(guān)系。
[0012]在一個(gè)可選的實(shí)施例中,第一信息區(qū)域是第二代身份證中的公民身份號(hào)碼區(qū)域,至少兩個(gè)頂點(diǎn)坐標(biāo)是公民身份號(hào)碼區(qū)域的兩個(gè)頂點(diǎn)坐標(biāo),第二信息區(qū)域是第二代身份證中的地址信息區(qū)域;
[0013]根據(jù)第一信息區(qū)域的至少兩個(gè)頂點(diǎn)坐標(biāo)和預(yù)定的相對(duì)位置關(guān)系,確定出第二信息區(qū)域,包括:
[0014]根據(jù)兩個(gè)頂點(diǎn)坐標(biāo)中與地址信息區(qū)域最接近的一個(gè)頂點(diǎn)坐標(biāo)的豎坐標(biāo),確定出地址信息區(qū)域的下邊緣;
[0015]根據(jù)最接近的一個(gè)頂點(diǎn)坐標(biāo)的豎坐標(biāo)和預(yù)定高度,確定出地址信息區(qū)域的上邊緣;
[0016]根據(jù)兩個(gè)頂點(diǎn)坐標(biāo)中任意一個(gè)頂點(diǎn)坐標(biāo)的橫坐標(biāo)和第一預(yù)定寬度,確定出地址信息區(qū)域的左邊緣;
[0017]根據(jù)兩個(gè)頂點(diǎn)坐標(biāo)中任意一個(gè)頂點(diǎn)坐標(biāo)的橫坐標(biāo)和第二預(yù)定寬度,確定出地址信息區(qū)域的右邊緣;
[0018]根據(jù)下邊緣、上邊緣、左邊緣和右邊緣裁剪出地址信息區(qū)域。
[0019]在一個(gè)可選的實(shí)施例中,對(duì)第二信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域,包括:
[0020]對(duì)第二信息區(qū)域進(jìn)行二值化,得到二值化后的第二信息區(qū)域;
[0021]對(duì)二值化后的第二信息區(qū)域按照水平方向計(jì)算第一直方圖,第一直方圖包括:每行像素點(diǎn)的豎坐標(biāo)和每行像素點(diǎn)中前景色像素點(diǎn)的累加值;
[0022]根據(jù)第一直方圖中前景色像素點(diǎn)的累加值大于第一閾值的行所組成的連續(xù)行集合,識(shí)別得到η行文字區(qū)域,η為正整數(shù);
[0023]對(duì)于第i行文字區(qū)域,按照豎直方向計(jì)算第二直方圖,第二直方圖包括:每列像素點(diǎn)的橫坐標(biāo)和每列像素點(diǎn)中前景色像素點(diǎn)的累加值,η多i多1,i為正整數(shù);
[0024]根據(jù)第二直方圖中前景色像素點(diǎn)的累加值大于第二閾值的列所組成的連續(xù)列集合,識(shí)別得到&個(gè)字符區(qū)域。
[0025]在一個(gè)可選的實(shí)施例中,該方法還包括:
[0026]根據(jù)第一直方圖中前景色像素點(diǎn)的累加值大于第一閾值的行所組成的連續(xù)行集合,識(shí)別得到相鄰兩行文字區(qū)域之間的行間距;
[0027]在行間距大于第三閾值時(shí),將與第二信息區(qū)域的邊緣更接近的一行文字區(qū)域進(jìn)行丟棄,邊緣為上邊緣或下邊緣。
[0028]在一個(gè)可選的實(shí)施例中,該方法還包括:
[0029]根據(jù)第二直方圖中前景色像素點(diǎn)的累加值大于第二閾值的列所組成的連續(xù)列集合,識(shí)別得到相鄰兩個(gè)字符區(qū)域之間的字間距;
[0030]在相鄰兩個(gè)字符區(qū)域位于第二信息區(qū)域的左側(cè)且字間距大于第四閾值時(shí),將相鄰兩個(gè)字符區(qū)域中位于右側(cè)的字符區(qū)域識(shí)別為當(dāng)前行文字區(qū)域中的第一個(gè)字符區(qū)域;
[0031]在相鄰兩個(gè)字符區(qū)域位于第二信息區(qū)域的右側(cè)且字間距大于第五閾值時(shí),將相鄰兩個(gè)字符區(qū)域中位于左側(cè)的字符區(qū)域識(shí)別為當(dāng)前行文字區(qū)域中的最后一個(gè)字符區(qū)域。
[0032]根據(jù)本公開(kāi)實(shí)施例的第二方面,提供一種區(qū)域提取裝置,該裝置包括:
[0033]獲取模塊,被配置為獲取證件圖像中第一信息區(qū)域的區(qū)域位置;
[0034]確定模塊,被配置為根據(jù)第一信息區(qū)域的區(qū)域位置確定出第二信息區(qū)域;
[0035]識(shí)別模塊,被配置為對(duì)第二信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域。
[0036]在一個(gè)可選的實(shí)施例中,區(qū)域位置米用頂點(diǎn)坐標(biāo)表不;
[0037]確定模塊,被配置為根據(jù)第一信息區(qū)域的至少兩個(gè)頂點(diǎn)坐標(biāo)和預(yù)定的相對(duì)位置關(guān)系,確定出第二信息區(qū)域,相對(duì)位置關(guān)系是頂點(diǎn)坐標(biāo)與第二信息區(qū)域之間的相對(duì)位置關(guān)系。
[0038]在一個(gè)可選的實(shí)施例中,第一信息區(qū)域是第二代身份證中的公民身份號(hào)碼區(qū)域,至少兩個(gè)頂點(diǎn)坐標(biāo)是公民身份號(hào)碼區(qū)域的兩個(gè)頂點(diǎn)坐標(biāo),第二信息區(qū)域是第二代身份證中的地址信息區(qū)域;
[0039]確定模塊,包括:
[0040]第一確定子模塊,被配置為根據(jù)兩個(gè)頂點(diǎn)坐標(biāo)中與地址信息區(qū)域最接近的一個(gè)頂點(diǎn)坐標(biāo)的豎坐標(biāo),確定出地址信息區(qū)域的下邊緣;
[0041]第二確定子模塊,被配置為根據(jù)最接近的一個(gè)頂點(diǎn)坐標(biāo)的豎坐標(biāo)和預(yù)定高度,確定出地址信息區(qū)域的上邊緣;
[0042]第三確定子模塊,被配置為根據(jù)兩個(gè)頂點(diǎn)坐標(biāo)中任意一個(gè)頂點(diǎn)坐標(biāo)的橫坐標(biāo)和第一預(yù)定寬度,確定出地址信息區(qū)域的左邊緣;
[0043]第四確定子模塊,被配置為根據(jù)兩個(gè)頂點(diǎn)坐標(biāo)中任意一個(gè)頂點(diǎn)坐標(biāo)的橫坐標(biāo)和第二預(yù)定寬度,確定出地址信息區(qū)域的右邊緣;
[0044]裁剪子模塊,被配置為根據(jù)下邊緣、上邊緣、左邊緣和右邊緣裁剪出地址信息區(qū)域。
[0045]在一個(gè)可選的實(shí)施例中,識(shí)別模塊,包括:
[0046]二值化子模塊,被配置為對(duì)第二信息區(qū)域進(jìn)行二值化,得到二值化后的第二信息區(qū)域;
[0047]第一計(jì)算子模塊,被配置為對(duì)二值化后的第二信息區(qū)域按照水平方向計(jì)算第一直方圖,第一直方圖包括:每行像素點(diǎn)的豎坐標(biāo)和每行像素點(diǎn)中前景色像素點(diǎn)的累加值;
[0048]行識(shí)別子模塊,被配置為根據(jù)第一直方圖中前景色像素點(diǎn)的累加值大于第一閾值的行所組成的連續(xù)行集合,識(shí)別得到η行文字區(qū)域,η為正整數(shù);
[0049]第二計(jì)算子模塊,被配置為對(duì)于第i行文字區(qū)域,按照豎直方向計(jì)算第二直方圖,第二直方圖包括:每列像素點(diǎn)的橫坐標(biāo)和每列像素點(diǎn)中前景色像素點(diǎn)的累加值,η多i多1,i為正整數(shù);
[0050]字符識(shí)別子模塊,被配置為根據(jù)第二直方圖中前景色像素點(diǎn)的累加值大于第二閾值的列所組成的連續(xù)列集合,識(shí)別得到&個(gè)字符區(qū)域。
[0051]在一個(gè)可選的實(shí)施例中,該裝置還包括:
[0052]行間距識(shí)別模塊,被配置為根據(jù)第一直方圖中前景色像素點(diǎn)的累加值大于第一閾值的行所組成的連續(xù)行集合,識(shí)別得到相鄰兩行文字區(qū)域之間的行間距;
[0053]丟棄模塊,被配置為在行間距大于第三閾值時(shí),將與第二信息區(qū)域的邊緣更接近的一行文字區(qū)域進(jìn)行丟棄,邊緣為上邊緣或下邊緣。
[0054]在一個(gè)可選的實(shí)施例中,該裝置還包括:
[0055]字間距識(shí)別模塊,被配置為根據(jù)第二直方圖中前景色像素點(diǎn)的累加值大于第二閾值的列所組成的連續(xù)列集合,識(shí)別得到相鄰兩個(gè)字符區(qū)域之間的字間距;
[0056]文字識(shí)別模塊,被配置為在相鄰兩個(gè)字符區(qū)域位于第二信息區(qū)域的左側(cè)且字間距大于第四閾值時(shí),將相鄰兩個(gè)字符區(qū)域中位于右側(cè)的字符區(qū)域識(shí)別為當(dāng)前行文字區(qū)域中的第一個(gè)字符區(qū)域;
[0057]單字符識(shí)別模塊,被配置為在相鄰兩個(gè)字符區(qū)域位于第二信息區(qū)域的右側(cè)且字間距大于第五閾值時(shí),將相鄰兩個(gè)字符區(qū)域中位于左側(cè)的字符區(qū)域識(shí)別為當(dāng)前行文字區(qū)域中的最后一個(gè)字符區(qū)域。
[0058]根據(jù)本公開(kāi)實(shí)施例的第三方面,提供一種區(qū)域提取裝置,該裝置包括:
[0059]處理器;
[0060]用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
[0061]其中,處理器被配置為:
[0062]獲取證件圖像中第一信息區(qū)域的區(qū)域位置;
[0063]根據(jù)第一信息區(qū)域的區(qū)域位置確定出第二信息區(qū)域;
[0064]對(duì)第二信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域。
[0065]本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
[0066]通過(guò)獲取證件圖像中第一信息區(qū)域的區(qū)域位置;根據(jù)第一信息區(qū)域的區(qū)域位置確定出第二信息區(qū)域;對(duì)第二信息區(qū)域進(jìn)行區(qū)域切割,得到至少一個(gè)字符區(qū)域;解決了相關(guān)技術(shù)中對(duì)于直接拍攝得到的證件圖像中的某些信息區(qū)域的識(shí)別難度大和對(duì)某些信息區(qū)域的定位不準(zhǔn)確的問(wèn)題;達(dá)到了通過(guò)證件圖像中第一信息區(qū)域的區(qū)域位置確定第二信息區(qū)域,并對(duì)第二信息區(qū)域進(jìn)行切割,從而對(duì)第二信息區(qū)域準(zhǔn)確定位和對(duì)第二信息區(qū)域中的字符區(qū)域進(jìn)行準(zhǔn)確識(shí)別的效果。
[0067]應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性的,并不能限制本公開(kāi)。
【附圖說(shuō)明】
[0068]此處的附圖被并入說(shuō)明書(shū)中并構(gòu)成本說(shuō)明書(shū)的一部分,示出了符合本公開(kāi)的實(shí)施例,并于說(shuō)明書(shū)一起用于解釋本公開(kāi)的原理。
[0069]圖1是根據(jù)一示例性實(shí)施例示出的一種區(qū)域提取方法的流程圖;
[0070]圖2A是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域提取方法的流程圖;
[0071]圖2B是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域提取方法的流程圖;
[0072]圖2C是根據(jù)一示例性實(shí)施例示出的一種確定地址信息區(qū)域下邊緣的示意圖;
[0073]圖2D是根據(jù)一示例性實(shí)施例示出的一種確定地址信息區(qū)域上邊緣的示意圖;
[0074]圖2E是根據(jù)一示例性實(shí)施例示出的一種確定地址信息區(qū)域左邊緣的示意圖;
[0075]圖2F是根據(jù)一示例性實(shí)施例示出的一種確定地址信息區(qū)域右邊緣的示意圖;
[0076]圖2G是根據(jù)一示例性實(shí)施例示出的一種確定地址信息區(qū)域的示意圖;
[0077]圖3A是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域提取方法的流程圖;
[0078]圖3B是根據(jù)一示例性實(shí)施例示出的一種第二信息區(qū)域二值化的示意圖;
[0079]圖3C是根據(jù)一示例性實(shí)施例示出的一種按照水平方向計(jì)算第一直方圖的示意圖;
[0080]圖3D是根據(jù)一示例性實(shí)施例示出的一種連續(xù)行集合的示意圖;
[0081]圖3E是根據(jù)一示例性實(shí)施例示出的一種按照豎直方向計(jì)算第二直方圖的示意圖;
[0082]圖3F是根據(jù)一示例性實(shí)施例示出的一種連續(xù)列集合的示意圖;
[0083]圖4A是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域提取方法的流程圖;
[0084]圖4B是根據(jù)一示例性實(shí)施例示出的一種相鄰兩行文字區(qū)域之間行間距的示意圖;
[0085]圖5A是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域提取方法的流程圖;
[0086]圖5B是根據(jù)一示例性實(shí)施例示出的一種相鄰兩個(gè)字符區(qū)域之間字符間距的示意圖;
[0087]圖6是根據(jù)一示例性實(shí)施例示出的一種區(qū)域提取裝置的框圖;
[0088]圖7是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域提取裝置的框圖;
[0089]圖8是根據(jù)另一示例性實(shí)施例示出的一種區(qū)域提取裝置的框圖;
[0090]圖9是根據(jù)再