一種基于卷積神經(jīng)網(wǎng)絡(luò)的變電站屬性分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于卷積神經(jīng)網(wǎng)絡(luò)的變電站屬性分類方法,屬于屬性分類的新型 神經(jīng)網(wǎng)絡(luò)技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 近年來,隨著人們對變電站安防技術(shù)的需求不斷增長以及安防設(shè)備的不斷發(fā)展, 產(chǎn)生了大量的監(jiān)控圖像以及視頻,然而對于這些大量出現(xiàn)的監(jiān)控資料,現(xiàn)階段仍然缺乏有 效的處理方法。傳統(tǒng)的手工標(biāo)注、人工分析不僅耗時而且費(fèi)力,導(dǎo)致監(jiān)控人員對這些監(jiān)控資 料的處理處于非常低效的狀態(tài),工作人員迫切需要一個智能的工具來自動檢索、智能分析 特定的場景例如變電站、營業(yè)廳、輸電線路等,以及特定的對象例如變壓器、刀閘、絕緣子、 人等。
[0003] 在計算機(jī)視覺領(lǐng)域中,通過對每一幅圖片建立一個包含中層語義信息的屬性表, 便可以知道該幅圖片中包含的所有的屬性;然而建立一個準(zhǔn)確且有用的屬性表是非常困難 以及耗時的工作。屬性表既需要包含和類別相關(guān)的信息也需要包含對象層次的信息,而且 還需要符合人們的具體需求。隨著監(jiān)控設(shè)備的不斷增加,監(jiān)控圖像和視頻飛速增加,人們得 到的屬性類別越來越多,導(dǎo)致屬性表的建立變得更加困難。
【發(fā)明內(nèi)容】
[0004] 目的:為了克服現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供一種基于卷積神經(jīng)網(wǎng)絡(luò)的變 電站屬性分類方法。
[0005] 技術(shù)方案:為解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:
[0006] -種基于卷積神經(jīng)網(wǎng)絡(luò)的變電站屬性分類方法,其特征在于:包括如下步驟:
[0007] 步驟一:構(gòu)建變電站圖像數(shù)據(jù)庫,這個數(shù)據(jù)庫包括變電站、變壓器、刀閘、輸電線 路、絕緣子、營業(yè)廳、人七類圖像;所有圖像包括的內(nèi)容都是現(xiàn)實(shí)的變電站相關(guān)場景和器件; 所有圖像均設(shè)置為256X256像素;
[0008] 步驟二:構(gòu)建屬性表,對數(shù)據(jù)庫中的所有圖像構(gòu)建屬性表,所述屬性表包括七個數(shù) 值,所述七個數(shù)值分別對應(yīng)變電站、變壓器、刀閘、輸電線路、絕緣子、營業(yè)廳、人七類屬性, 若圖像中包括該項(xiàng)屬性則對應(yīng)數(shù)值設(shè)置為1,否則設(shè)置為〇;
[0009] 步驟三:預(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型,為避免過擬合現(xiàn)象,在圖片庫ImageNet上預(yù)訓(xùn) 練卷積神經(jīng)網(wǎng)絡(luò)模型,所述圖片庫ImageNet包括1000類不同的圖像,所述卷積神經(jīng)網(wǎng)絡(luò)的 第8層參數(shù)均設(shè)置為1000;
[0010]步驟四:學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò),在步驟三的基礎(chǔ)上,繼續(xù)學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型; [0011]步驟五:利用學(xué)習(xí)好的卷積神經(jīng)網(wǎng)絡(luò)模型對圖像進(jìn)行屬性分類,包括如下步驟:
[0012] 5a:利用所有訓(xùn)練圖像的均值對圖像進(jìn)行歸一化處理;
[0013] 5b:利用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)對圖像進(jìn)行測試,得到該圖像的所有屬性的分布 概率;
[0014] 5c:基于設(shè)定好的閾值0.5得到預(yù)測屬性表,再對比所有測試圖像的真實(shí)屬性表和 預(yù)測屬性表,計算得到各類屬性的分類準(zhǔn)確率。
[0015]作為優(yōu)選方案,所述步驟四包括如下步驟:
[0016] 4a:所有圖像隨機(jī)地劃分成訓(xùn)練圖像和測試圖像,所述訓(xùn)練圖像和測試圖像各占 50% ;
[0017] 4b:將訓(xùn)練圖像全部作一個旋轉(zhuǎn),并將旋轉(zhuǎn)后的圖像擴(kuò)充到訓(xùn)練圖像中;
[0018] 4c:將新加入的圖像按照步驟二的方法建立屬性表;
[0019] 4d:將卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的第8層設(shè)置為7,卷積神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)率設(shè)置為 0.000001,并按照0.7的丟失率隨機(jī)地丟棄70 %的參數(shù)。
[0020] 作為優(yōu)選方案,所述卷積神經(jīng)網(wǎng)絡(luò)模型Softmax層改為Sigmoid層。
[0021] 有益效果:本發(fā)明提供的一種基于卷積神經(jīng)網(wǎng)絡(luò)的變電站屬性分類方法,利用建 立了一個和變電站相關(guān)的圖像數(shù)據(jù)庫,該數(shù)據(jù)庫中所有圖像在背景、角度、光照、尺度等方 面具有很大的差異性;我們將每一類圖像的類別對應(yīng)成一種屬性,并為每一幅圖片生成一 個屬性表;預(yù)先在大型數(shù)據(jù)庫上訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),并利用該卷積神經(jīng)網(wǎng)絡(luò)的模型參數(shù),從 而解決了模型過擬合現(xiàn)象;對每一幅待測圖像,都能準(zhǔn)確輸出該待測圖像包含的每一類屬 性,即圖像包含的場景、對象信息。
[0022] 本發(fā)明能夠非常準(zhǔn)確地檢索到和變電站相關(guān)的特定場景以及特定對象,能夠幫助 變電站安防人員高效地處理監(jiān)控資料,在一定程度上填補(bǔ)了智能安防的技術(shù)空缺。主要創(chuàng) 新點(diǎn)在于巧妙地將圖像所包含的特定場景和特定對象對應(yīng)成一種屬性,進(jìn)而建立起一個用 來表征圖像的二值屬性表,同時改進(jìn)傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),使其能夠?qū)Π鄬傩缘?圖像進(jìn)行準(zhǔn)確識別和分類。改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)克服了傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)只能對單一屬 性進(jìn)行分類的缺點(diǎn),達(dá)到平均分類準(zhǔn)確率為94.7%,具有非常強(qiáng)的可行性和實(shí)用性。
【附圖說明】
[0023]圖1為本發(fā)明屬性分類學(xué)習(xí)流程圖。
【具體實(shí)施方式】
[0024]下面結(jié)合附圖對本發(fā)明作更進(jìn)一步的說明。
[0025]如圖1所示,一種基于卷積神經(jīng)網(wǎng)絡(luò)的變電站屬性分類方法,首先,建立了一個包 括七類圖像的數(shù)據(jù)庫,七類圖像分別為變電站、變壓器、刀閘、輸電線路、絕緣子、營業(yè)廳、 人;所有圖像均來自監(jiān)控視頻、監(jiān)控圖像、互聯(lián)網(wǎng),每一類圖像包括的圖像個數(shù)為60至140之 間。針對每一幅圖像,標(biāo)注得到一個屬性表,例如,{1,1,1,0,0,0,0}表明該幅圖像包括了變 電站、變壓器、刀閘這三類屬性。建立的變電站數(shù)據(jù)庫對于將要解決的問題是非常具有挑戰(zhàn) 性和難度的,具體表現(xiàn)在以下幾個方面:
[0026] 1.圖像在姿態(tài)、光照、尺度上具有很大的差異性;
[0027] 2.圖像的背景非常復(fù)雜;
[0028] 3.有些對象在圖像中是非常小的,檢測該類對象具有很大的難度;
[0029] 4.每張圖像包含的屬性具有很大的差異性;
[0030]將建立好的變電站數(shù)據(jù)