專利名稱:基于k-l變換和ls-svm的車牌字符識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種機動車牌字符圖像的自動識別方法,屬于模式識別、計算機圖像處理和智 能交通系統(tǒng)(Intelligent Transport System, ITS)控制技術(shù)領(lǐng)域。車牌自動識別技術(shù)是智能交 通系統(tǒng)中的重要組成部分。
背景技術(shù):
采用車牌自動識別技術(shù)組成的車牌識別系統(tǒng)(License Plate Recognition System LPRS)是 一個基于圖像處理、計算機視覺、模式識別等技術(shù)的高度智能化的綜合集成系統(tǒng),作為道路 交通管理自動化的重要手段和車輛監(jiān)測的一個重要環(huán)節(jié),在道路交通監(jiān)視和控制中占有很重 要的地位。車牌識別系統(tǒng)包含了硬件和軟件兩部分在硬件上,由可控輔助照明光源、攝像 機、圖像采集、微處理控制器、通信等模塊組成;在軟件上,由車牌定位、車牌字符分割、 車牌字符識別等應(yīng)用軟件組成。車牌字符識別方法的識別率和識別速度是車牌識別技術(shù)中的兩個重要指標(biāo),也是衡量車 牌識別系統(tǒng)優(yōu)劣和系統(tǒng)組成的核心。車牌識別系統(tǒng)可以在無需為車輛加裝任何特殊裝置的情況下,實現(xiàn)對車輛的自動檢測和 監(jiān)控。車牌識別系統(tǒng)從攝像機攝取的車輛圖像中自動提取車牌字符圖像,經(jīng)過必要的預(yù)處理 后,自動分割出車牌圖像中的各位字符進(jìn)行識別,從而實現(xiàn)對車牌的正確識別。目前,我國使用的車牌字符集是由漢字、英文字母、數(shù)字和英文字母+數(shù)字這四種字符集 組成。在車牌自動識別技術(shù)中,常用的車牌字符識別方法有① 模板匹配 一 容易導(dǎo)致相似字符的區(qū)分能力差,以及特征數(shù)據(jù)維數(shù)過大而導(dǎo)致識別速 度慢等問題。對于有變形、位移、傾斜等字符,很容易產(chǎn)生誤識。② 神經(jīng)網(wǎng)絡(luò) 一 雖然具有較強的模式分類能力,但算法的收斂速度較慢,且無法保證其 全局最優(yōu),面臨網(wǎng)絡(luò)輸入數(shù)據(jù)的選擇和網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計等問題。利用神經(jīng)網(wǎng)絡(luò)法進(jìn)行車牌字符 識別其識別率很大程度上依賴于訓(xùn)練樣本的數(shù)量,在無特征提取的情況下識別的正確率相對 較低。③ 特征匹配法 一 由于對結(jié)構(gòu)特征的描述和運算要占用大量的存儲和計算資源,因此算 法在實現(xiàn)上相對復(fù)雜、識別速度慢。 支持向量機(SVM) —在解決有限樣本、非線性及高維模式識別問題中,該方法表 現(xiàn)出了許多特有的優(yōu)越性能,且具有適應(yīng)性強和效率高的特點。這些都非常適合車牌字符識 別的要求。但是,SVM也有不足之處,比如對于復(fù)雜問題的分類精度不夠高訓(xùn)練樣本混 疊嚴(yán)重時,SVM分類面就過于復(fù)雜,易產(chǎn)生過學(xué)習(xí)情況;對于有些復(fù)雜情況,由于SVM集 較大,將導(dǎo)致決策速度較慢等。發(fā)明內(nèi)容針對車牌識別中識別率和識別速度難以同時提高這一難點,本發(fā)明提出了一種基于K-L 變換(最優(yōu)正交變換)和LS-SVM (最小二乘-支持向量機)相結(jié)合的車牌字符識別方法。該 方法所設(shè)計的分類器較好地解決了其他車牌字符識別方法中存在的不可分區(qū)域情況,具有較 高的識別率和識別速度及分類推廣能力。 本發(fā)明采用以下技術(shù)方案一種基于K-L變換和LS-SVM的車牌字符識別方法,其特征為,該車牌字符識別方法包括以下步驟首先,將一幅完整的車牌圖像分割成單個車牌字符圖像,并對車牌字符圖像進(jìn)行預(yù)處理,所述預(yù)處理主要包括字符區(qū)域的去邊框、字符的傾斜校正以及去噪;使用K-L變換對預(yù)處理后的車牌字符圖像進(jìn)行特征提取,并降低車牌字符圖像特征空間 維數(shù);采用基于二叉樹的多類LS-SVM分類方法解決車牌字符的多類分類問題,根據(jù)車牌字符的 排列特征,設(shè)計四組基于二叉樹的LS-SVM分類器來分別實現(xiàn)車牌中的"英文字母"、"數(shù)字"、"漢字"和"英文字母+數(shù)字"的識別,以提高識別率和識別速度及分類推廣能力。本發(fā)明在K-L變換對車牌字符圖像進(jìn)行特征提取和有效降低車牌字符圖像特征空間維數(shù) 的基礎(chǔ)上,采用基于二叉樹的多類LS-SVM分類器,對降維后的車牌字符圖像特征進(jìn)行分類識 別,有效地解決了傳統(tǒng)SVM (支持向量機)訓(xùn)練速度慢、計算量大的缺陷,克服了其他車牌識 別方法中存在不可分區(qū)域的情況,使識別率和識別速度及分類推廣能力同時得到提高。
下面結(jié)合附圖和實施方式,對本發(fā)明進(jìn)一步說明 圖l為分類器的處理流程; 圖2為基于聚類的LS-SVM二叉樹分類器模型。
具體實施方式
在圖l中,以每個車牌字符作為一個樣本。根據(jù)我國車牌字符的排列順序特征,分別設(shè)計 4類子分類器來進(jìn)行有針對性地識別,即漢字分類器、數(shù)字分類器、英文字母分類器和數(shù)字+ 英文字母分類器。根據(jù)字符在車牌中的相應(yīng)位置將其輸入到對應(yīng)的子分類器中。在每個子分 類器中 一部分字符作為測試樣本; 一部分作為訓(xùn)練樣本。本發(fā)明的技術(shù)方案首先對分割后的單個車牌字符圖像進(jìn)行預(yù)處理,得到標(biāo)準(zhǔn)的大小為 /7X/7 (長寬均為外像素)的單個車牌字符二值圖像,記作《(7=1, 2,…,7)(這里假設(shè)共/j幅字符圖像),然后將每個字符圖像像素逐行首尾相連,構(gòu)成一個/7X77的矢量。該矢量的均值矢量及協(xié)方差矩陣分別為<formula>formula see original document page 7</formula>由工程矩陣?yán)碚摽芍?,協(xié)方差矩陣i 為nxn階方陣,設(shè)其特征值義,從大到小排列為 義^義2^.2A (《="x"),每一個/1,相對應(yīng)的特征向量為《々=1,2,...,。, 一般選擇前面/n 個最大特征值對應(yīng)的主特征矢量構(gòu)成尺維狀態(tài)空間中的w維特征子空間,使得^!^'/i^ (3)《盡口J-能的大,覓盡可能的小,即盡可能的保存圖像的特征信息,又可減小表征圖像的 特征的維數(shù),采用K-L變換的目的是尋找任意統(tǒng)計分布的數(shù)據(jù)集合中主要分量的子集。因為 在變換域中,能量主要集中在特征值義,大的系數(shù)中。前面已經(jīng)將義,值按從大到小的順序排列 了,舍掉特征值較小的A,值對應(yīng)的特征向量后構(gòu)成新的變換核矩陣,從而達(dá)到既保存圖像的 特征信息,又可減小表征圖像的特征的維數(shù)得目的;這里m代表要保留下來的;i,.的個數(shù),m 越大則參與計算的A,越多,^越大,就會使保存的圖像信息越多,這不利于降低圖像特征的 維數(shù)。因此,需要將m取一個合適的值來達(dá)到既保存圖像的特征信息,又可減小表征圖像的 特征維數(shù)的一個平衡。為了達(dá)到降維的目的,m取值要盡量的小,同時也要保證有足夠的圖 像信息被保留下來,即5要足夠的人;m以及5的取值是一個均衡的過程,需要根據(jù)實際 情況進(jìn)行實驗,得到個折中的取值;取這w個特征值所對應(yīng)的特征向量為字符圖像的特征 向量,得到原樣本圖像空間的最優(yōu)降維;K-L變換在有效降低字符圖像特征空間維數(shù)的同時, 充分保留了變換對象的主要信息,能夠獲得互不相關(guān)的新特征,起到減少相關(guān)性,突出差異 性的效果。將它應(yīng)用于車牌字符的識別,可以簡化字符特征的提取過程,減小訓(xùn)練的運算量,縮短識別時間,提高識別的正確率。最后,將從訓(xùn)練樣本中提取的特征輸入LS-SVM訓(xùn)練得到相關(guān)的經(jīng)驗值,并將這些經(jīng)驗 值輸入到LS-SVM分類器中,與測試樣本中提取的特征進(jìn)行最終的判斷得出分類結(jié)果。圖2是基于聚類的LS-SVM 二叉樹分類器模型首先將所有類別分成兩個子類,再將子 類進(jìn)一步劃分成兩個次級子類,如此循環(huán)下去,直到得到最后一個單獨的類別為止;然后, 對每個決策節(jié)點的兩類分類問題用LS-SVM進(jìn)行分類;傳統(tǒng)的SVM需要求解二次規(guī)劃問題,使求解的計算量大;而LS-SVM將SVM中的不等 式轉(zhuǎn)換為等式,大大降低了運算量;采用基于二叉樹的多類分類方法能較好地解決車牌字符識別中的多類分類問題;在聚類分析中,本發(fā)明以類類之間的兩個最近的樣本向量之間的歐氏距離作為兩類之間的 距離,例如類Z^與類Z《之間的距離Ap— =w/m{||x,—j^||, eZp' x; eZ《} (4)由以上定義,顯然有A^^^A《一p, A",0,基于此距離而生成二叉樹的LS-SVM多類分類器算法流程如下(1) 由式(4)計算類類間的距離A,力.G,1,2,…,;U力');(2) 對于每個類,都有與其他類的距離值,對這些距離值按由小到大的順序排列,并重新編 號。例如,第i類與其它類距離值A(chǔ),力U產(chǎn)1,2,…,)U力')按由小到大的順序排列為《《《2… 《;(3) 根據(jù)《(Z=1,2,...,A:)值,由大到小的順序?qū)ο鄳?yīng)的類別排序,當(dāng)存在兩個或兩個以上的 類別具有相同的《時,在比較它們的《大小,以此類推,若它們的《,《...,d"都相同,則 把類別小的類排在前面,最終得到所有類別的排列m, , 《2...,(4) 由類標(biāo)號排序 ,"2..., 《4生成二叉樹;(5) 根據(jù)生成的二叉樹利用二值LS-SVM訓(xùn)練算法構(gòu)造二叉樹各內(nèi)結(jié)點的最優(yōu)超平面,以第 w類樣本為正樣本,其余的為負(fù)樣本。利用LS-SVM算法構(gòu)造節(jié)點處的二值子分類器,依次下 去,直到所有的二值分類器訓(xùn)練完,得到基于二叉樹的多分類LS-SVM分類模型。在聚類分析中,以類一類之間的兩個最近的樣本向量之間的歐氏距離作為兩類之間的距離。對于W類分類問題,該方法只需要構(gòu)造w-i個分類器,不存在不可識別域(即不可分區(qū) 域的情況),分類時也不需要遍歷所有的分類器,這樣就保證了分類的效率。利用聚類分析中的類距離作為二叉樹的生成依據(jù)。二叉樹的生成方法是讓與其它類相隔最遠(yuǎn)的類最先分割出來。以圖2所示的一個有四類的分類問題為例首先將與其他三類相距最遠(yuǎn)的"類別4"分 離出來;在剩下的3類中,"類別1"與其他的兩類距離最遠(yuǎn),將其分離;余下
權(quán)利要求
1.一種基于K-L變換和LS-SVM的車牌字符識別方法,其特征為,該車牌字符識別方法包括以下步驟首先,將車牌字符分割成單個車牌字符圖像,并對車牌字符圖像進(jìn)行預(yù)處理,所述預(yù)處理主要包括字符區(qū)域的去邊框、字符的傾斜校正以及去噪;使用K-L變換對預(yù)處理后的車牌字符圖像進(jìn)行特征提取,并降低車牌字符圖像特征空間維數(shù);采用基于二叉樹的多類LS-SVM分類方法解決車牌字符的多類分類問題,根據(jù)車牌字符的排列特征,設(shè)計四組基于二叉樹的LS-SVM分類器來分別實現(xiàn)車牌中的“英文字母”、“數(shù)字”、“漢字”和“英文字母+數(shù)字”的識別,以提高車牌字符的識別率和識別速度及分類推廣能力。
2. 根據(jù)權(quán)利要求l所述的識別方法,使用K-L變換對車牌字符圖像進(jìn)行特征提取以及降低 車牌字符圖像特征空間維數(shù),其特征是(1) 首先對分割后的單個車牌字符圖像進(jìn)行預(yù)處理后得到標(biāo)準(zhǔn)的大小為"x"的單個 車牌字符二值圖像,記作Z, (i=l, 2,…,",其中/7X/7表示長寬均為/HM象素,J表示字符圖像的個數(shù);(2) 然后將每個字符圖像像素逐行首尾相連,構(gòu)成一個nxw的矢量,該矢量的均值 矢量及協(xié)方差矩陣分別為柳J — 土x, (1)協(xié)方差矩陣w為"x"階方陣,設(shè)其特征值;i,從大到小排列為;i^;i2^.2;it ,每一個義,相對應(yīng)的特征向量為a,,其中/=1,2, ..., K,《="x";(3) 選擇前面m個最大特征值對應(yīng)的主特征矢量構(gòu)成《維狀態(tài)空間中的m維特征子空間,使得3盡可能的大,W盡可能的小,即盡可能的保存圖像的特征信息,又可減小表征圖像 特征的維數(shù)。3和m的取值,需要根據(jù)實際情況進(jìn)行實驗,得到一個折中的取值;(4)取這m個特征值所對應(yīng)的特征向量為字符圖像的特征向量,得到原樣本圖像空 間的最優(yōu)降維,K-L變換在有效降低字符圖像特征空間維數(shù)的同時,充分保留了變換對 象的主要信息,能夠獲得互不相關(guān)的新特征,起到減少相關(guān)性,突出差異性的效果可以 簡化字符特征的提取過程,減小訓(xùn)練的運算量,縮短識別時間,提高識別的正確率。
3. 根據(jù)權(quán)利要求1所述的識別方法,采用所述基于二叉樹的多類LS-SVM分類方法來解 決車牌字符識別中的多類分類問題,其特征是在聚類分析中,以類和類之間的兩個最近的樣本向量之間的歐氏距離作為兩類之間的距 離,例如,類Zp與類Zq之間的距離如下式所示-g二wm(ll;c,.一xjl, x,eZp, xyeZ《} (4) 由以上定義,Am = A^, p=0。
4. 根據(jù)權(quán)利要求3所述的識別方法,其特征是,基于所述類距離而生成二叉樹LS-SVM多 類分類器算法流程如下(1) 由式④計算類和類間的距離A,力U戶1二.,,M力');(2) 對于每個類,計算與其他類的距離值,對這些距離值按由小到大的順序排列,并重 新編號,第i類與其它類距離值A(chǔ),力U產(chǎn)1,2,…,U力')按由小到大的順序排列為dj《《2…《(i,—1 ;(3) 根據(jù)最小的類距離《(/=1,2,...,/0值,按由大到小的順序?qū)ο鄳?yīng)的類別排序,當(dāng)存 在兩個或兩個以上的類別具有相同的最小類距離《時,再比較它們的第二小類距離《大小, 以此類推,若它們的^,《...,《—"都相同,則把類別小的類排在前面,最終得到所有類 別的排列",,"2..., "A.;(4) 由類標(biāo)號排序",,"2..., "^生成二叉樹;(5) 根據(jù)生成的二叉樹利用二值LS-SVM訓(xùn)練算法構(gòu)造二叉樹各內(nèi)結(jié)點的最優(yōu)超平面, 以第^類樣本為正樣本,其余的為負(fù)樣本,利用LS-SVM算法構(gòu)造節(jié)點處的二值子分類器, 依次下去,直到所有的二值分類器訓(xùn)練完,得到基于二叉樹的多分類LS-SVM分類模型。
5. 根據(jù)權(quán)利要求l-4所述的識別方法,其特征為,利用聚類分析中的類距離作為二叉樹 的生成依據(jù),二叉樹的生成方法是讓與其他類相隔最遠(yuǎn)的類最先分割出來;所述四組基于二叉樹的LS-SVM分類器,首先將與其它三類相距最遠(yuǎn)的類別分離出來;在剩下的3 類中,再將與另兩類距離最遠(yuǎn)的一類分離;余下的兩類構(gòu)造最后的LS-SVM子分類器, 并位于二叉樹的最低層,從而實現(xiàn)車牌中的"英文字母"、"數(shù)字"、"漢字"和"英文字 母+數(shù)字"的識別,使系統(tǒng)的識別率和識別速度及分類推廣能力都能得以提高。
全文摘要
本發(fā)明公開的一種基于K-L變換和LS-SVM相結(jié)合的車牌字符識別方法中,首先采用K-L變換的方法對車牌的字符圖像進(jìn)行特征降維;然后,根據(jù)車牌字符圖像的排列特征,采用聚類分析中的類距離方法,設(shè)計四組最佳二叉樹的LS-SVM子分類器來分別實現(xiàn)車牌字符中的英文字母、數(shù)字、漢字和英文字母+數(shù)字的識別。本發(fā)明所采用的方法較好的解決了其他車牌字符識別方法中存在不可識別域,分類時也不需要遍歷所有的分類器,大大提高了分類效率,縮短了車牌字符特征的提取過程,減少樣本訓(xùn)練的運算量和車牌字符的識別時間,使車牌識別系統(tǒng)的識別率和識別速度及分類推廣能力同時得以提高。
文檔編號G06K9/62GK101329734SQ200810070060
公開日2008年12月24日 申請日期2008年7月31日 優(yōu)先權(quán)日2008年7月31日
發(fā)明者李志敏, 凡 黃 申請人:重慶大學(xué)