本申請涉及圖像識別領(lǐng)域,特別是涉及一種圖像分類識別模型的訓(xùn)練方法和裝置、圖像分類識別方法。
背景技術(shù):
1、圖像所傳達的信息比其他形式更直觀、更豐富。圖像識別技術(shù)是指利用計算機對圖像進行處理和識別,代替人來完成分類識別工作,使其具有類似于人類視覺的高級智能,廣泛應(yīng)用于目標(biāo)特征的提取和分類。而傳統(tǒng)模型訓(xùn)練方法所訓(xùn)練得到的圖像識別模型僅基于對圖像目標(biāo)局部特征節(jié)點的識別和分析,難以滿足大規(guī)模圖像分類和特征提取的要求,其對大規(guī)模圖像的分類識別精度較低。而隨著大數(shù)據(jù)時代的到來,對大規(guī)模圖像分類的處理越來越多。
2、針對傳統(tǒng)模型訓(xùn)練方法所訓(xùn)練得到的圖像識別模型對大規(guī)模圖像的分類識別精度較低的問題,目前還沒有提出有效的解決方案。
技術(shù)實現(xiàn)思路
1、在本發(fā)明中提供了一種圖像分類識別模型的訓(xùn)練方法和裝置、圖像分類識別方法,以解決傳統(tǒng)模型訓(xùn)練方法所訓(xùn)練得到的圖像識別模型對大規(guī)模圖像的分類識別精度較低的問題。
2、第一個方面,在本發(fā)明中提供了一種圖像分類識別模型的訓(xùn)練方法,圖像分類識別模型采用卷積神經(jīng)網(wǎng)絡(luò)以及圖像分類識別模型包括第一分類器、第二分類器和第三分類器,其特征在于,所述訓(xùn)練方法包括多輪訓(xùn)練步驟,每輪所述訓(xùn)練步驟包括:
3、構(gòu)建所述第一分類器、所述第二分類器和所述第三分類器的訓(xùn)練集,所述訓(xùn)練集中包括若干圖像樣本;
4、從所述第一分類器的訓(xùn)練集中,隨機且有放回地抽取n個圖像樣本加入第一訓(xùn)練子集,并將未被抽取的圖像樣本加入第一傳遞子集;
5、通過所述第一訓(xùn)練子集對所述第一分類器進行訓(xùn)練,并通過訓(xùn)練后的所述第一分類器對所述第一傳遞子集中的圖像樣本進行分類以及將分類錯誤的m1個圖像樣本加入第二訓(xùn)練子集;
6、從所述第二分類器的訓(xùn)練集中,隨機且有放回地抽取n-m1個圖像樣本加入第二訓(xùn)練子集,并將未被抽取的圖像樣本加入第二傳遞子集;
7、通過所述第二訓(xùn)練子集對所述第二分類器進行訓(xùn)練,并通過訓(xùn)練后的所述第二分類器對所述第二傳遞子集中的圖像樣本進行分類以及將分類錯誤的m2個圖像樣本加入第三訓(xùn)練子集;
8、從所述第三分類器的訓(xùn)練集中,隨機且有放回地抽取n-m2個圖像樣本加入第三訓(xùn)練子集;
9、通過所述第三訓(xùn)練子集對所述第三分類器進行訓(xùn)練。
10、第二個方面,在本發(fā)明中提供了一種圖像分類識別方法,通過采用卷積神經(jīng)網(wǎng)絡(luò)的圖像分類識別模型對圖像進行分類,所述圖像分類識別模型通過第一個方面所述的圖像分類識別模型的訓(xùn)練方法進行訓(xùn)練得到。
11、第三個方面,在本發(fā)明中提供了一種圖像分類識別模型的訓(xùn)練裝置,圖像分類識別模型采用卷積神經(jīng)網(wǎng)絡(luò)以及圖像分類識別模型包括第一分類器、第二分類器和第三分類器,所述訓(xùn)練裝置包括:
12、訓(xùn)練集構(gòu)建模塊,用于構(gòu)建所述第一分類器、所述第二分類器和所述第三分類器的訓(xùn)練集,所述訓(xùn)練集中包括若干圖像樣本;
13、第一抽取模塊,用于從所述第一分類器的訓(xùn)練集中,隨機且有放回地抽取n個圖像樣本加入第一訓(xùn)練子集,并將未被抽取的圖像樣本加入第一傳遞子集;
14、第一訓(xùn)練模塊,用于通過所述第一訓(xùn)練子集對所述第一分類器進行訓(xùn)練,并通過訓(xùn)練后的所述第一分類器對所述第一傳遞子集中的圖像樣本進行分類以及將分類錯誤的m1個圖像樣本加入第二訓(xùn)練子集;
15、第二抽取模塊,用于從所述第二分類器的訓(xùn)練集中,隨機且有放回地抽取n-m1個圖像樣本加入第二訓(xùn)練子集,并將未被抽取的圖像樣本加入第二傳遞子集;
16、第二訓(xùn)練模塊,用于通過所述第二訓(xùn)練子集對所述第二分類器進行訓(xùn)練,并通過訓(xùn)練后的所述第二分類器對所述第二傳遞子集中的圖像樣本進行分類以及將分類錯誤的m2個圖像樣本加入第三訓(xùn)練子集;
17、第三抽取模塊,用于從所述第三分類器的訓(xùn)練集中,隨機且有放回地抽取n-m2個圖像樣本加入第三訓(xùn)練子集;
18、第三訓(xùn)練模塊,用于通過所述第三訓(xùn)練子集對所述第三分類器進行訓(xùn)練。
19、第四個方面,在本發(fā)明中提供了一種電子設(shè)備,包括存儲器和處理器,所述存儲器中存儲有計算機程序,所述處理器被設(shè)置為運行所述計算機程序以執(zhí)行第一個方面所述的圖像分類識別模型的訓(xùn)練方法。
20、與相關(guān)技術(shù)相比,本發(fā)明提供的圖像分類識別模型的訓(xùn)練方法對boosting方法進行應(yīng)用和改進,采用三個分類器構(gòu)成強分類器,不僅將上一分類器錯誤分類的圖像樣本加入下一分類器的訓(xùn)練子集,還保證了每個分類器的訓(xùn)練子集具有相同的圖像樣本數(shù)量,并結(jié)合bagging采樣方法為每個分類器的訓(xùn)練子集進行樣本采樣。通過該訓(xùn)練方法得到的圖像分類識別模型對大規(guī)模圖像具有較高的分類識別精度,解決了傳統(tǒng)模型訓(xùn)練方法所訓(xùn)練得到的圖像識別模型對大規(guī)模圖像的分類識別精度較低的問題。
21、本申請的一個或多個實施例的細節(jié)在以下附圖和描述中提出,以使本申請的其他特征、目的和優(yōu)點更加簡明易懂。
1.一種圖像分類識別模型的訓(xùn)練方法,圖像分類識別模型采用卷積神經(jīng)網(wǎng)絡(luò)以及圖像分類識別模型包括第一分類器、第二分類器和第三分類器,其特征在于,所述訓(xùn)練方法包括多輪訓(xùn)練步驟,每輪所述訓(xùn)練步驟包括:
2.根據(jù)權(quán)利要求1所述的圖像分類識別模型的訓(xùn)練方法,其特征在于,所述從所述第二分類器的訓(xùn)練集中,隨機且有放回地抽取n-m1個圖像樣本加入第二訓(xùn)練子集,并將未被抽取的圖像樣本加入第二傳遞子集,包括:
3.根據(jù)權(quán)利要求1所述的圖像分類識別模型的訓(xùn)練方法,其特征在于,所述從所述第三分類器的訓(xùn)練集中,隨機且有放回地抽取n-m2個圖像樣本加入第三訓(xùn)練子集,包括:
4.根據(jù)權(quán)利要求1所述的圖像分類識別模型的訓(xùn)練方法,其特征在于,在第一輪訓(xùn)練步驟中,所述第一分類器、所述第二分類器和所述第三分類器的訓(xùn)練集相同;
5.根據(jù)權(quán)利要求4所述的圖像分類識別模型的訓(xùn)練方法,其特征在于,所述訓(xùn)練方法還包括樣本標(biāo)記步驟,所述樣本標(biāo)記步驟根據(jù)已標(biāo)記的圖像樣本對未標(biāo)記的圖像樣本進行標(biāo)簽傳播標(biāo)記,標(biāo)記后的圖像樣本用于構(gòu)建所述訓(xùn)練集和所述候選樣本集;
6.根據(jù)權(quán)利要求5所述的圖像分類識別模型的訓(xùn)練方法,其特征在于,第i個語義標(biāo)簽的權(quán)重wi的計算公式如下:
7.根據(jù)權(quán)利要求1-6中任一項所述的圖像分類識別模型的訓(xùn)練方法,其特征在于,所述訓(xùn)練方法的截止條件包括:
8.一種圖像分類識別方法,其特征在于,通過采用卷積神經(jīng)網(wǎng)絡(luò)的圖像分類識別模型對圖像進行分類,所述圖像分類識別模型通過權(quán)利要求1-7中任一項所述的圖像分類識別模型的訓(xùn)練方法進行訓(xùn)練得到。
9.一種圖像分類識別模型的訓(xùn)練裝置,圖像分類識別模型采用卷積神經(jīng)網(wǎng)絡(luò)以及圖像分類識別模型包括第一分類器、第二分類器和第三分類器,其特征在于,所述訓(xùn)練裝置包括:
10.一種電子設(shè)備,包括存儲器和處理器,其特征在于,所述存儲器中存儲有計算機程序,所述處理器被設(shè)置為運行所述計算機程序以執(zhí)行權(quán)利要求1至7中任一項所述的圖像分類識別模型的訓(xùn)練方法。