国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于優(yōu)化卷積架構的圖像目標識別方法

      文檔序號:6638502閱讀:243來源:國知局
      一種基于優(yōu)化卷積架構的圖像目標識別方法
      【專利摘要】本發(fā)明公開了一種基于優(yōu)化卷積架構的圖像目標識別方法,該方法首先對輸入圖像進行采集和增強處理形成樣本;然后基于優(yōu)化的卷積架構對樣本進行訓練;最后用訓練后的卷積架構對圖像目標進行分類識別。其中,卷積架構的優(yōu)化包括:ReLU激活函數(shù);局部響應歸一化;卷積區(qū)重疊合并;神經(jīng)元連接Drop-out技術;啟發(fā)式學習。與現(xiàn)有技術相比,本發(fā)明能夠擴充帶標簽樣本,支持較多對象分類并獲得較快的訓練收斂速度和較高的圖像目標識別率,并具備更高的魯棒性。
      【專利說明】一種基于優(yōu)化卷積架構的圖像目標識別方法

      【技術領域】
      [0001] 本發(fā)明屬于圖像分析識別【技術領域】,具體涉及一種基于優(yōu)化卷積架構的圖像目標 識別方法。

      【背景技術】
      [0002] 目前,模式識別作為機器學習中的熱門研宄領域,隨著計算機網(wǎng)絡圖像數(shù)據(jù)的海 量出現(xiàn)越來越受到重視。為了有效管理圖像數(shù)據(jù)并更好的為用戶服務,圖像目標的自動識 別變得尤為重要。
      [0003] 傳統(tǒng)的圖形識別方法如SVM(Support Vector Machine,支持向量機)、Boosting主 要是通過提取圖像的特征再進行分類識別。卷積神經(jīng)網(wǎng)絡則是一種基于監(jiān)督的深度學習模 型,實質是模擬人腦機制構建具有多隱層的學習網(wǎng)絡,其"感受野"和權值共享的網(wǎng)絡結構 降低了模型復雜度,并對平移、縮放、傾斜等變形具有高度不變性。以圖像直接作為網(wǎng)絡輸 入,卷積神經(jīng)網(wǎng)絡通過逐層特征變換來學習更抽象的特征表達以達到分類識別的目的。
      [0004] Yann LeCun提出卷積神經(jīng)網(wǎng)絡是一種基于監(jiān)督的深度學習模型,實質是模擬人腦 機制構建具有多隱層的學習網(wǎng)絡,其"感受野"和權值共享的網(wǎng)絡結構降低了模型復雜度, 并對平移、縮放、傾斜等變形具有高度不變性。具體而言,卷積神經(jīng)網(wǎng)絡包括卷積層、采樣 層、全連接層和輸出層。其中,卷積層以圖像直接作為網(wǎng)絡輸入,通過與不同的卷積濾波器 卷積得到多個特征圖。特征圖經(jīng)降采樣操作降低維數(shù)并通過激活函數(shù)得到采樣層。采樣層 輸出直接作為下一卷積層的輸入,這一卷積、采樣操作可重復多次。全連接層以最高卷積層 的特征為輸入并映射為向量輸出。輸出層則是一個C-類的softmax分類器。
      [0005] 卷積神經(jīng)網(wǎng)絡應用于手寫數(shù)字開始,基于卷積神經(jīng)網(wǎng)絡的圖像分類技術已經(jīng)應用 于車型、人臉等識別任務上,并在訓練收斂速度和識別率取得了較好的效果。盡管如此,目 前卷積神經(jīng)網(wǎng)絡在模式識別中的應用還存在以下缺陷:
      [0006] 第一,盡管當前圖像數(shù)據(jù)海量,但由于基于監(jiān)督的學習方式其訓練數(shù)據(jù)需要帶標 簽,使當前卷積神經(jīng)網(wǎng)絡應用的分類對象較少且受限于訓練庫。
      [0007] 第二,在對較多圖像類別進行識別時,卷積神經(jīng)網(wǎng)絡規(guī)模相應增大,其待訓練參數(shù) 大幅增長,容易出現(xiàn)過擬合現(xiàn)象。
      [0008] 第三,卷積神經(jīng)網(wǎng)絡對新的對象識別任務的可移植性不強,即在面對未知復雜的 圖像識別對象時,訓練收斂速度和目標識別率上很難以讓用戶滿意。


      【發(fā)明內(nèi)容】

      [0009] 針對現(xiàn)有技術所存在的上述技術問題,本發(fā)明提供了一種基于優(yōu)化卷積架構的圖 像目標識別方法,能夠擴充帶標簽樣本,支持較多對象分類并獲得較快的訓練收斂速度和 較高的圖像目標識別率。
      [0010] 一種基于優(yōu)化卷積架構的圖像目標識別方法,包括如下步驟:
      [0011] (1)對輸入的樣本圖像進行圖像增強處理;
      [0012] (2)利用處理后得到的樣本圖像對卷積神經(jīng)網(wǎng)絡進行優(yōu)化訓練;
      [0013] (3)輸入目標圖像至訓練好的卷積神經(jīng)網(wǎng)絡中,以對該目標圖像進行分類識別。 [0014] 所述的樣本圖像來自目前圖像識別領域最大且語義學上分類最全的訓練庫 ImageNet0
      [0015] 所述的步驟(1)中對樣本圖像進行圖像增強處理的具體過程如下:
      [0016] I. 1圖像平移和翻轉:在樣本圖像四周和中心分別提取固定大小的圖像塊并做水 平翻轉,以得到擴增10倍的圖像訓練集;
      [0017] 1. 2圖像的RGB顏色通道強度變更:對于每一樣本圖像,在對圖像RGB像素值做 PCA處理后,通過以下算式將像素各通道主成份倍乘對應標準高斯隨機量化的特征值,將結 果添加到原始的RGB通道分量上,以改變像素的顏色強度:
      [0018] Ixy - [R xy, Gxy, Bxy] + [PR, PG, PB] [ a R λ R,a G λ G, a B 入 B]
      [0019] 其中:Ixy為任一像素變更后的顏色強度,Rxy、G xy、Bxy對應為該像素變更前對應紅 色、綠色、藍色三個通道上的顏色強度值,PjP λ κ分別為顏色強度值Rxy對應的3X3協(xié)方 差矩陣的特征向量和特征值,Pe和λ e分別為顏色強度值Gxy對應的3X3協(xié)方差矩陣的特 征向量和特征值,PjP λ B分別為顏色強度值Bxy對應的3X3協(xié)方差矩陣的特征向量和特 征值,aK、a e、αΒ均為標準正太分布下產(chǎn)生的隨機變量值。
      [0020] 所述的步驟(2)在對卷積神經(jīng)網(wǎng)絡架構進行優(yōu)化訓練過程中,通過卷積濾波器對 輸入進行卷積操作提取特征時,為使卷積架構充分利用同一特征核映射圖鄰近神經(jīng)元的信 息,采取減少降采樣步進的方式,使降采樣區(qū)域部分重疊的方法進行卷積。
      [0021] 所述的步驟(2)在對卷積神經(jīng)網(wǎng)絡架構進行優(yōu)化訓練過程中,特征圖在降采樣處 理后,對圖像中神經(jīng)元輸出采用ReLU(修正線性單元)作為建模激活函數(shù),函數(shù)的具體表達 如下:
      [0022] f (X) = max (0, X)
      [0023] 其中:x為函數(shù)的輸入,f(x)表示為神經(jīng)元輸出。
      [0024] 所述的步驟(2)在對卷積神經(jīng)網(wǎng)絡架構進行優(yōu)化訓練過程中,在卷積層根據(jù)以下 算式對卷積濾波器輸出得到的多個特征圖進行歸一化處理:
      [0025]

      【權利要求】
      1. 一種基于優(yōu)化卷積架構的圖像目標識別方法,包括如下步驟: (1) 對輸入的樣本圖像進行圖像增強處理; (2) 利用處理后得到的樣本圖像對卷積神經(jīng)網(wǎng)絡進行優(yōu)化訓練; (3) 輸入目標圖像至訓練好的卷積神經(jīng)網(wǎng)絡中,以對該目標圖像進行分類識別。
      2. 根據(jù)權利要求1所述的圖像目標識別方法,其特征在于:所述的樣本圖像來自目前 圖像識別領域最大且語義學上分類最全的訓練庫ImageNet。
      3. 根據(jù)權利要求1所述的圖像目標識別方法,其特征在于:所述的步驟(1)中對樣本 圖像進行圖像增強處理的具體過程如下: 1. 1圖像平移和翻轉:在樣本圖像四周和中心分別提取固定大小的圖像塊并做水平翻 轉,以得到擴增10倍的圖像訓練集; 1. 2圖像的RGB顏色通道強度變更:對于每一樣本圖像,在對圖像RGB像素值做PCA處 理后,通過以下算式將像素各通道主成份倍乘對應標準高斯隨機量化的特征值,將結果添 加到原始的RGB通道分量上,以改變像素的顏色強度: T Ixy = [Rxy,GXy,BXy] + [PR, PG, PB][a.R XR, OCg Xg, αΒ XB]T 其中:Ixy為任一像素變更后的顏色強度,R xy、Gxy、Bxy對應為該像素變更前對應紅色、綠 色、藍色三個通道上的顏色強度值,匕和λ κ分別為顏色強度值Rxy對應的3X3協(xié)方差矩陣 的特征向量和特征值,Pe和λ e分別為顏色強度值G xy對應的3 X 3協(xié)方差矩陣的特征向量和 特征值,PjP λ B分別為顏色強度值Bxy對應的3X3協(xié)方差矩陣的特征向量和特征值,a κ、 a e、a Β均為標準正態(tài)分布下產(chǎn)生的隨機變量值。
      4. 根據(jù)權利要求1所述的圖像目標識別方法,其特征在于:所述的步驟(2)在對卷積 神經(jīng)網(wǎng)絡架構進行優(yōu)化訓練過程中,通過卷積濾波器對輸入進行卷積操作提取特征時,為 使卷積架構充分利用同一特征核映射圖鄰近神經(jīng)元的信息,采取減少降采樣步進的方式, 使降采樣區(qū)域部分重疊的方法進行卷積。
      5. 根據(jù)權利要求1所述的圖像目標識別方法,其特征在于:所述的步驟(2)在對卷 積神經(jīng)網(wǎng)絡架構進行優(yōu)化訓練過程中,特征圖在降采樣處理后,對圖像中神經(jīng)元輸出采用 ReLU(修正線性單元)作為建模激活函數(shù),函數(shù)的具體表達如下: f (X) = max (0, X) 其中:x為函數(shù)的輸入,f(x)表示為神經(jīng)元輸出。
      6. 根據(jù)權利要求1所述的圖像目標識別方法,其特征在于:所述的步驟(2)在對卷積 神經(jīng)網(wǎng)絡架構進行優(yōu)化訓練過程中,在卷積層根據(jù)以下算式對卷積濾波器輸出得到的多個 特征圖進行歸一化處理:
      其中:aJP (寸應為第i個和第j個核函數(shù)在特征圖任一像素位置的神經(jīng)元響應,b i 對應為Bi歸一化后的神經(jīng)元響應,N為卷積層的核函數(shù)總數(shù),k、η、α、β均為由驗證集決 定的參數(shù)。
      7. 根據(jù)權利要求1所述的圖像目標識別方法,其特征在于:所述的步驟(2)在對卷積 神經(jīng)網(wǎng)絡架構進行優(yōu)化訓練過程中,對于神經(jīng)元采用Drop-out技術,將隱層神經(jīng)元輸出以 50%的概率設為零,被丟棄神經(jīng)元不再參與前向傳遞和后向傳播。
      8. 根據(jù)權利要求1所述的圖像目標識別方法,其特征在于:所述的步驟(2)在對卷積 神經(jīng)網(wǎng)絡架構進行優(yōu)化訓練過程中,采取啟發(fā)式算法更新學習速率。
      【文檔編號】G06N3/02GK104517122SQ201410767043
      【公開日】2015年4月15日 申請日期:2014年12月12日 優(yōu)先權日:2014年12月12日
      【發(fā)明者】王雪姣, 王梁昊, 李東曉, 張明 申請人:浙江大學
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1