国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種室內(nèi)場景的分類方法及裝置與流程

      文檔序號:11251421閱讀:1076來源:國知局
      一種室內(nèi)場景的分類方法及裝置與流程

      本發(fā)明屬于計算機技術(shù)領(lǐng)域,尤其涉及一種室內(nèi)場景的分類方法及裝置。



      背景技術(shù):

      智能識別和分類是計算機視覺中重點研究的問題。在眾多的研究中,熱點主要聚焦于物體識別(一張圖片包含一個或多個物體)和人臉識別(一張帶人臉的圖像)。相比于這些研究,室內(nèi)場景識別極具挑戰(zhàn),是最為困難的分類任務(wù)之一。其難點主要在于室內(nèi)場景不僅包含了大量不同的物體,而且這些物體在空間中的擺放形式千差萬別,要對室內(nèi)場景進行準(zhǔn)確地分類,不僅要分析場景中物體的信息,還需提取整個場景結(jié)構(gòu)的特征。

      為了提高識別場景的能力,不少學(xué)者對此進行了深入研究,提出了很多行之有效的方法。目前的場景識別分類方法主要包括空間金字塔法、基于高層次語義信息的方法和基于卷積神經(jīng)網(wǎng)絡(luò)的方法。

      這些方法有著明顯的缺陷,空間金字塔法的特征表示只依賴于低層次的幾何信息,缺少對高層次語義信息的提取,識別場景的能力很受限制,基于高層次語義信息的場景識別方法受限于所選物體的范圍,大大地影響了模型分類的能力,基于卷積神經(jīng)網(wǎng)絡(luò)的方法主要缺點在于訓(xùn)練過程需要消耗大量的資源,而且主要在物體的檢測和分類上效果明顯,例如,使用基于卷積神經(jīng)網(wǎng)絡(luò)的方法在計算機視覺系統(tǒng)識別(imagenet)數(shù)據(jù)集上進行物體識別時,可以達到94%的識別率,而使用基于卷積神經(jīng)網(wǎng)絡(luò)的方法在公開的mit-67數(shù)據(jù)集上進行場景的分類時,只能達到69%的識別率,原因是室內(nèi)場景的識別不只依賴于場景中的物體,還需要連接物體之間的整體關(guān)系,而卷積神經(jīng)網(wǎng)絡(luò)方法直接提取的特征不能較好地把握整體和局部信息的融合。



      技術(shù)實現(xiàn)要素:

      本發(fā)明的目的在于提供一種室內(nèi)場景的分類方法及裝置,旨在解決現(xiàn)有的場景識別分類方法的準(zhǔn)確性不高、分類速率不佳的問題。

      一方面,本發(fā)明提供了一種室內(nèi)場景的分類方法,所述方法包括下述步驟:

      接收輸入的待分類場景圖片;

      根據(jù)預(yù)設(shè)的觀測區(qū)域定位模型從所述待分類場景圖片中獲取當(dāng)前局部觀測區(qū)域;

      對所述當(dāng)前局部觀測區(qū)域的圖像信息進行處理,以得到所述待分類場景圖片的特征向量;

      根據(jù)所述特征向量獲取所述待分類場景圖片的分類預(yù)測結(jié)果,判斷所述分類預(yù)測結(jié)果是否滿足預(yù)設(shè)的場景圖片分類條件;

      當(dāng)所述分類預(yù)測結(jié)果不滿足所述場景圖片分類條件時,根據(jù)所述觀測區(qū)域定位模型從所述待分類場景圖片中獲取下一局部觀測區(qū)域,并將所述下一局部觀測區(qū)域設(shè)置為所述當(dāng)前局部觀測區(qū)域,跳轉(zhuǎn)至所述對所述當(dāng)前局部觀測區(qū)域的圖像信息進行處理,以得到所述待分類場景圖片的特征向量的步驟;

      當(dāng)所述分類預(yù)測結(jié)果滿足所述場景圖片分類條件時,根據(jù)所述分類預(yù)測結(jié)果獲取所述待分類場景圖片的分類標(biāo)簽。

      另一方面,本發(fā)明提供了一種室內(nèi)場景的分類裝置,所述裝置包括:

      圖片接收單元,用于接收輸入的待分類場景圖片;

      區(qū)域獲取單元,用于根據(jù)預(yù)設(shè)的觀測區(qū)域定位模型從所述待分類場景圖片中獲取當(dāng)前局部觀測區(qū)域;

      向量獲取單元,用于對所述當(dāng)前局部觀測區(qū)域的圖像信息進行處理,以得到所述待分類場景圖片的特征向量;

      條件判斷單元,用于根據(jù)所述特征向量獲取所述待分類場景圖片的分類預(yù)測結(jié)果,判斷所述分類預(yù)測結(jié)果是否滿足預(yù)設(shè)的場景圖片分類條件;

      重復(fù)執(zhí)行單元,用于當(dāng)所述分類預(yù)測結(jié)果不滿足所述場景圖片分類條件時,根據(jù)所述觀測區(qū)域定位模型從所述待分類場景圖片中獲取下一局部觀測區(qū)域,并將所述下一局部觀測區(qū)域設(shè)置為所述當(dāng)前局部觀測區(qū)域,并觸發(fā)所述向量獲取單元對所述當(dāng)前局部觀測區(qū)域的圖像信息進行處理;以及

      場景分類單元,用于當(dāng)所述分類預(yù)測結(jié)果滿足所述場景圖片分類條件時,根據(jù)所述分類預(yù)測結(jié)果獲取所述待分類場景圖片的分類標(biāo)簽。

      本發(fā)明在接收輸入的待分類場景圖片后,根據(jù)預(yù)設(shè)的觀測區(qū)域定位模型從待分類場景圖片中獲取當(dāng)前局部觀測區(qū)域,對當(dāng)前局部觀測區(qū)域的圖像信息進行處理,以得到待分類場景圖片的特征向量,根據(jù)特征向量獲取待分類場景圖片的分類預(yù)測結(jié)果,判斷分類預(yù)測結(jié)果是否滿足預(yù)設(shè)的場景圖片分類條件,當(dāng)分類預(yù)測結(jié)果不滿足場景圖片分類條件時,根據(jù)觀測區(qū)域定位模型從待分類場景圖片中獲取下一局部觀測區(qū)域,并將下一局部觀測區(qū)域設(shè)置為當(dāng)前局部觀測區(qū)域,跳轉(zhuǎn)至對當(dāng)前局部觀測區(qū)域的圖像信息進行處理,以得到待分類場景圖片的特征向量的步驟,直至分類預(yù)測結(jié)果滿足場景圖片分類條件,當(dāng)分類預(yù)測結(jié)果滿足場景圖片分類條件時,根據(jù)分類預(yù)測結(jié)果獲取待分類場景圖片的分類標(biāo)簽,從而提高了場景識別分類的分類速率和準(zhǔn)確性。

      附圖說明

      圖1是本發(fā)明實施例一提供的室內(nèi)場景的分類方法的實現(xiàn)流程圖;

      圖2是本發(fā)明實施例二提供的室內(nèi)場景的分類方法中建立觀測區(qū)域定位模型的實現(xiàn)流程圖;

      圖3是本發(fā)明實施例三提供的室內(nèi)場景的分類裝置的結(jié)構(gòu)示意圖;以及

      圖4是本發(fā)明實施例四提供的室內(nèi)場景的分類裝置的結(jié)構(gòu)示意圖。

      具體實施方式

      為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

      以下結(jié)合具體實施例對本發(fā)明的具體實現(xiàn)進行詳細(xì)描述:

      實施例一:

      圖1示出了本發(fā)明實施例一提供的室內(nèi)場景的分類方法的實現(xiàn)流程,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分,詳述如下:

      在步驟s101中,接收輸入的待分類場景圖片。

      在步驟s102中,根據(jù)預(yù)設(shè)的觀測區(qū)域定位模型從待分類場景圖片中獲取當(dāng)前局部觀測區(qū)域。

      在本發(fā)明實施例中,待分類場景圖片為待識別分類的室內(nèi)場景對應(yīng)的圖片。為了降低識別分類過程中計算的復(fù)雜度,提高識別分類的可控性,根據(jù)觀測區(qū)域定位模型每次只從場景圖片中選擇一個局部觀測區(qū)域,以進行識別和分類。

      在步驟s103中,對當(dāng)前局部觀測區(qū)域的圖像信息進行處理,以得到待分類場景圖片的特征向量。

      在本發(fā)明實施例中,優(yōu)選地,在獲取到當(dāng)前局部觀測區(qū)域的圖像信息之后,對當(dāng)前局部觀測區(qū)域的圖像信息進行處理時,首先對當(dāng)前局部觀測區(qū)域的圖像信息進行編碼,得到局部特征向量,然后對得到的局部特征向量與預(yù)先得到的特征向量執(zhí)行融合操作,得到待分類場景圖片圖像信息的特征向量,從而提高了特征向量的全面性,進而提高對場景圖片分類的準(zhǔn)確性。

      在步驟s104中,根據(jù)特征向量獲取待分類場景圖片的分類預(yù)測結(jié)果。

      在步驟s105中,判斷分類預(yù)測結(jié)果是否滿足預(yù)設(shè)的場景圖片分類條件。

      在本發(fā)明實施例中,分類預(yù)測結(jié)果包括分類結(jié)果和對應(yīng)的預(yù)測概率,在得到待分類場景圖片圖像信息的特征向量之后,根據(jù)特征向量可以預(yù)測得到場景圖片的多個分類結(jié)果及對應(yīng)的預(yù)測概率,多個分類結(jié)果的預(yù)測概率總和為100%,判斷這些多個分類結(jié)果中是否存在對應(yīng)的預(yù)測概率大于預(yù)設(shè)閾值的分類結(jié)果,即判斷分類預(yù)測結(jié)果是否滿足預(yù)設(shè)的對待分類場景圖片進行分類的條件。作為示例地,預(yù)測概率的預(yù)設(shè)閾值可以設(shè)置為65%,判斷這些多個分類結(jié)果中是否存在對應(yīng)的預(yù)測概率大于65%的分類結(jié)果。

      在步驟s106中,當(dāng)分類預(yù)測結(jié)果不滿足場景圖片分類條件時,根據(jù)觀測區(qū)域定位模型從待分類場景圖片中獲取下一局部觀測區(qū)域,并將下一局部觀測區(qū)域設(shè)置為當(dāng)前局部觀測區(qū)域,跳轉(zhuǎn)至對當(dāng)前局部觀測區(qū)域的圖像信息進行處理,以得到待分類場景圖片的特征向量的步驟。

      在本發(fā)明實施例中,當(dāng)這些多個分類結(jié)果中不存在對應(yīng)的預(yù)測概率大于預(yù)設(shè)閾值的分類結(jié)果時,說明現(xiàn)有的分類預(yù)測結(jié)果不滿足預(yù)設(shè)的對待分類場景圖片進行分類的條件,若要實現(xiàn)對待分類場景圖片的分類,還需要獲取場景圖片更多的區(qū)域信息,因此,根據(jù)觀測區(qū)域定位模型獲取下一個局部觀測區(qū)域,并將下一局部觀測區(qū)域設(shè)置為當(dāng)前局部觀測區(qū)域,重復(fù)進行圖像信息處理并獲取分類預(yù)測結(jié)果,直至分類預(yù)測結(jié)果滿足場景圖片分類條件。

      在步驟s107中,當(dāng)分類預(yù)測結(jié)果滿足場景圖片分類條件時,根據(jù)分類預(yù)測結(jié)果獲取待分類場景圖片的分類標(biāo)簽。

      在本發(fā)明實施例中,當(dāng)這些預(yù)測得到的多個分類結(jié)果中存在對應(yīng)的預(yù)測概率大于預(yù)設(shè)閾值的分類結(jié)果時,說明分類預(yù)測結(jié)果已經(jīng)滿足預(yù)設(shè)的對待分類場景圖片進行分類的條件,即已經(jīng)可以實現(xiàn)對待分類場景圖片的分類,因此,獲取分類預(yù)測結(jié)果中對應(yīng)的預(yù)測概率大于預(yù)設(shè)閾值的分類結(jié)果,將該分類結(jié)果設(shè)置為待分類場景圖片的分類標(biāo)簽,從而提高了場景圖片分類的準(zhǔn)確性。

      在本發(fā)明實施例中,接收輸入的待分類場景圖片,根據(jù)預(yù)設(shè)的觀測區(qū)域定位模型從待分類場景圖片中獲取當(dāng)前局部觀測區(qū)域,從而降低了待分類場景圖片識別分類的復(fù)雜度,提高了識別分類的可控性,對當(dāng)前局部觀測區(qū)域的圖像信息進行處理,以得到待分類場景圖片的特征向量,從而提高場景圖片分類的分類速率,根據(jù)特征向量獲取待分類場景圖片的分類預(yù)測結(jié)果,判斷分類預(yù)測結(jié)果是否滿足預(yù)設(shè)的場景圖片分類條件,當(dāng)分類預(yù)測結(jié)果不滿足場景圖片分類條件時,根據(jù)觀測區(qū)域定位模型從待分類場景圖片中獲取下一局部觀測區(qū)域,并將下一局部觀測區(qū)域設(shè)置為當(dāng)前局部觀測區(qū)域,重復(fù)進行圖像信息處理并獲取分類預(yù)測結(jié)果,直至分類預(yù)測結(jié)果滿足場景圖片分類條件,當(dāng)分類預(yù)測結(jié)果滿足場景圖片分類條件時,根據(jù)分類預(yù)測結(jié)果獲取待分類場景圖片的分類標(biāo)簽,從而提高了場景圖片分類的準(zhǔn)確性。

      實施例二:

      圖2示出了本發(fā)明實施例二提供的室內(nèi)場景的分類方法中建立觀測區(qū)域定位模型的實現(xiàn)流程,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分,詳述如下:

      在步驟s201中,接收輸入的待訓(xùn)練場景圖片,根據(jù)預(yù)設(shè)的高斯分布從待訓(xùn)練場景圖片中獲取當(dāng)前訓(xùn)練用局部觀測區(qū)域。

      在本發(fā)明實施例中,待訓(xùn)練場景圖片為室內(nèi)場景的局部觀測區(qū)域定位訓(xùn)練過程中輸入的需要分類的場景圖片。為了降低識別分類過程中計算的復(fù)雜度,提高識別分類的可控性,根據(jù)觀測區(qū)域定位模型每次從場景圖片中選擇一個局部觀測區(qū)域,以進行識別和分類。優(yōu)選地,在訓(xùn)練過程中可以根據(jù)實際情況調(diào)整局部觀測區(qū)域的大小,以優(yōu)化訓(xùn)練結(jié)果。

      在步驟s202中,根據(jù)當(dāng)前訓(xùn)練用局部觀測區(qū)域?qū)Υ?xùn)練場景圖片進行分類操作并計算分類操作的獎勵值。

      在本發(fā)明實施例中,通過對當(dāng)前訓(xùn)練用局部觀測區(qū)域的圖像信息的處理,得到待訓(xùn)練場景圖片的特征向量之后,根據(jù)特征向量對待訓(xùn)練場景圖片進行分類,得到待訓(xùn)練場景圖片的分類標(biāo)簽。優(yōu)選地,在獲取到局部觀測區(qū)域的圖像信息之后,在對當(dāng)前訓(xùn)練用局部觀測區(qū)域的圖像信息進行處理時,首先對當(dāng)前訓(xùn)練用局部觀測區(qū)域的圖像信息進行編碼,得到局部特征向量,然后對得到的局部特征向量與預(yù)先得到的特征向量執(zhí)行融合操作,得到待分類場景圖片圖像信息的特征向量,從而提高了特征向量的全面性,進而提高對場景圖片分類的準(zhǔn)確性。優(yōu)選地,在訓(xùn)練過程中可以調(diào)節(jié)特征向量的維度,以優(yōu)化訓(xùn)練結(jié)果。

      在本發(fā)明實施例中,在每次得到待訓(xùn)練場景圖片的分類標(biāo)簽之后,獲取待訓(xùn)練場景圖片的標(biāo)準(zhǔn)分類標(biāo)簽,判斷得到的待訓(xùn)練場景圖片的分類標(biāo)簽是否正確,并計算分類的獎勵值。優(yōu)選地,在計算分類的獎勵值時,根據(jù)分類獎勵值的計算公式

      計算分類的獎勵值,其中,rt為第t次分類的獎勵值,t為分類次數(shù),y為訓(xùn)練得到的分類標(biāo)簽,losst為第t次分類的分類誤差,y=maxylogp(y)表示得到的分類標(biāo)簽是正確的,從而避免重復(fù)觀察同樣區(qū)域,避免觀測噪聲太多的區(qū)域。優(yōu)選地,在訓(xùn)練過程中可適當(dāng)改變獎勵值的計算公式中的反饋值,以優(yōu)化模型收斂的速度,從而優(yōu)化訓(xùn)練模型。

      在步驟s203中,判斷是否達到預(yù)設(shè)的訓(xùn)練結(jié)束條件。

      在步驟s204中,當(dāng)未達到預(yù)設(shè)的訓(xùn)練結(jié)束條件時,根據(jù)高斯分布從待訓(xùn)練場景圖片中獲取下一訓(xùn)練用局部觀測區(qū)域,將下一訓(xùn)練用局部觀測區(qū)域設(shè)置為當(dāng)前訓(xùn)練用局部觀測區(qū)域,跳轉(zhuǎn)至根據(jù)當(dāng)前訓(xùn)練用局部觀測區(qū)域?qū)Υ?xùn)練場景圖片進行分類操作并計算分類操作的獎勵值的步驟。

      在本發(fā)明實施例中,在訓(xùn)練的過程中,下一訓(xùn)練用局部觀測區(qū)域可以從一個給定方差的高斯分布中采樣得到。重復(fù)對采樣得到的下一訓(xùn)練用局部觀測區(qū)域進行識別,根據(jù)識別到的信息對待訓(xùn)練場景圖片進行分類,得到分類標(biāo)簽,每一次分類都可以通過計算得到對應(yīng)的獎勵值。

      在步驟s205中,當(dāng)達到預(yù)設(shè)的訓(xùn)練結(jié)束條件時,獲取所有待訓(xùn)練場景圖片中每張待訓(xùn)練場景圖片的獎勵值的代數(shù)和,以得到每張待訓(xùn)練場景圖片的總獎勵值,根據(jù)總獎勵值建立總獎勵值最大化的觀測區(qū)域定位模型。

      在本發(fā)明實施例中,若達到預(yù)設(shè)的訓(xùn)練結(jié)束條件,則獲取待訓(xùn)練場景圖片的獎勵值的代數(shù)和,以得到這張待訓(xùn)練場景圖片的總獎勵值,所有待訓(xùn)練場景圖片中每張待訓(xùn)練場景圖片都有對應(yīng)的總獎勵值,根據(jù)總獎勵值建立可以使總獎勵值最大化的觀測區(qū)域定位模型,以用于在對待分類場景圖片分類的過程中確定最優(yōu)的下一個局部觀測區(qū)域,從而提高場景識別分類的分類速率和準(zhǔn)確性。

      本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,所述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,所述的存儲介質(zhì),如rom/ram、磁盤、光盤等。

      實施例三:

      圖3示出了本發(fā)明實施例三提供的室內(nèi)場景的分類裝置的結(jié)構(gòu),為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。

      在本發(fā)明實施例中,室內(nèi)場景的分類裝置包括圖片接收單元31、區(qū)域獲取單元32、向量獲取單元33、條件判斷單元34以及場景分類單元35,其中:

      圖片接收單元31,用于接收輸入的待分類場景圖片。

      區(qū)域獲取單元32,用于根據(jù)預(yù)設(shè)的觀測區(qū)域定位模型從待分類場景圖片中獲取當(dāng)前局部觀測區(qū)域。

      向量獲取單元33,用于對當(dāng)前局部觀測區(qū)域的圖像信息進行處理,以得到待分類場景圖片的特征向量。

      在本發(fā)明實施例中,優(yōu)選地,在獲取到局部觀測區(qū)域的圖像信息之后,對局部觀測區(qū)域的圖像信息進行處理時,首先對局部觀測區(qū)域的圖像信息進行編碼,得到局部特征向量,然后對得到的局部特征向量與預(yù)先得到的特征向量執(zhí)行融合操作,得到待分類場景圖片圖像信息的特征向量,從而提高了特征向量的全面性,進而提高對場景圖片分類的準(zhǔn)確性。

      因此,優(yōu)選地,該向量獲取單元33包括:

      編碼操作單元331,用于對當(dāng)前局部觀測區(qū)域的圖像信息進行編碼,得到局部特征向量;以及

      融合操作單元332,用于對局部特征向量與預(yù)先存儲的特征向量執(zhí)行融合操作,得到場景圖片的特征向量。

      條件判斷單元34,用于根據(jù)特征向量獲取待分類場景圖片的分類預(yù)測結(jié)果,判斷分類預(yù)測結(jié)果是否滿足預(yù)設(shè)的場景圖片分類條件。

      重復(fù)執(zhí)行單元35,用于當(dāng)分類預(yù)測結(jié)果不滿足場景圖片分類條件時,根據(jù)觀測區(qū)域定位模型從待分類場景圖片中獲取下一局部觀測區(qū)域,并將下一局部觀測區(qū)域設(shè)置為當(dāng)前局部觀測區(qū)域,并觸發(fā)向量獲取單元33對當(dāng)前局部觀測區(qū)域的圖像信息進行處理。

      場景分類單元36,用于當(dāng)分類預(yù)測結(jié)果滿足場景圖片分類條件時,根據(jù)分類預(yù)測結(jié)果獲取待分類場景圖片的分類標(biāo)簽。

      在本發(fā)明實施例中,當(dāng)這些預(yù)測得到的多個分類結(jié)果中存在對應(yīng)的預(yù)測概率大于預(yù)設(shè)閾值的分類結(jié)果時,說明分類預(yù)測結(jié)果已經(jīng)滿足預(yù)設(shè)的對待分類場景圖片進行分類的條件,即已經(jīng)可以實現(xiàn)對待分類場景圖片的分類,因此,場景分類單元獲取分類預(yù)測結(jié)果中對應(yīng)的預(yù)測概率大于預(yù)設(shè)閾值的分類結(jié)果,將該分類結(jié)果設(shè)置為待分類場景圖片的分類標(biāo)簽,從而提高了場景圖片分類的準(zhǔn)確性。

      在本發(fā)明實施例中,室內(nèi)場景的分類裝置的各單元可由相應(yīng)的硬件或軟件單元實現(xiàn),各單元可以為獨立的軟、硬件單元,也可以集成為一個軟、硬件單元,在此不用以限制本發(fā)明。各單元的具體實施方式可參考前述實施例一的描述,在此不再贅述。

      實施例四:

      圖4示出了本發(fā)明實施例四提供的室內(nèi)場景的分類裝置的結(jié)構(gòu),為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分。

      在本發(fā)明實施例中,室內(nèi)場景的分類裝置包括訓(xùn)練區(qū)域獲取單元401、區(qū)域訓(xùn)練單元402、循環(huán)訓(xùn)練單元403、定位模型建立單元404、圖片接收單元405、區(qū)域獲取單元406、向量獲取單元407、條件判斷單元408以及場景分類單元409,其中:

      訓(xùn)練區(qū)域獲取單元401,用于接收輸入的待訓(xùn)練場景圖片,根據(jù)預(yù)設(shè)的高斯分布從待訓(xùn)練場景圖片中獲取當(dāng)前訓(xùn)練用局部觀測區(qū)域。

      區(qū)域訓(xùn)練單元402,用于根據(jù)當(dāng)前訓(xùn)練用局部觀測區(qū)域?qū)Υ?xùn)練場景圖片進行分類操作并計算分類操作的獎勵值。

      在本發(fā)明實施例中,在每次得到待訓(xùn)練場景圖片的分類標(biāo)簽之后,獲取待訓(xùn)練場景圖片的標(biāo)準(zhǔn)分類標(biāo)簽,判斷得到的待訓(xùn)練場景圖片的分類標(biāo)簽是否正確,獎勵值計算單元根據(jù)判斷結(jié)果計算分類的獎勵值。優(yōu)選地,在計算分類的獎勵值時,根據(jù)分類獎勵值的計算公式

      計算分類的獎勵值,其中,rt為第t次分類的獎勵值,t為分類次數(shù),y為訓(xùn)練得到的分類標(biāo)簽,losst為第t次分類的分類誤差,y=maxylogp(y)表示得到的分類標(biāo)簽是正確的,從而避免重復(fù)觀察同樣區(qū)域,避免觀測噪聲太多的區(qū)域。優(yōu)選地,在訓(xùn)練過程中可適當(dāng)改變獎勵值的計算公式中的反饋值,以優(yōu)化模型收斂的速度,從而優(yōu)化訓(xùn)練模型。

      因此,優(yōu)選地,該區(qū)域訓(xùn)練單元402包括:

      訓(xùn)練分類單元4021,用于對當(dāng)前訓(xùn)練用局部觀測區(qū)域的圖像信息進行處理,得到待訓(xùn)練場景圖片的當(dāng)前特征向量,根據(jù)當(dāng)前特征向量對待訓(xùn)練場景圖片進行分類,得到待訓(xùn)練場景圖片的分類標(biāo)簽;以及

      獎勵值計算單元4022,用于獲取待訓(xùn)練場景圖片的標(biāo)準(zhǔn)分類標(biāo)簽,將得到的分類標(biāo)簽與標(biāo)準(zhǔn)分類標(biāo)簽進行比較,判斷得到的分類標(biāo)簽是否正確,根據(jù)判斷結(jié)果計算分類的獎勵值。

      優(yōu)選地,該獎勵值計算單元4022包括:

      計算子單元,用于計算分類誤差,獲取分類次數(shù),通過分類獎勵值的計算公式

      計算分類的獎勵值,其中,rt為第t次分類的獎勵值,t為分類次數(shù),y為訓(xùn)練得到的分類標(biāo)簽,losst為第t次分類的分類誤差,y=maxylogp(y)表示得到的分類標(biāo)簽是正確的。

      循環(huán)訓(xùn)練單元403,用于當(dāng)未達到預(yù)設(shè)的訓(xùn)練結(jié)束條件時,根據(jù)高斯分布從待訓(xùn)練場景圖片中獲取下一訓(xùn)練用局部觀測區(qū)域,將下一訓(xùn)練用局部觀測區(qū)域設(shè)置為當(dāng)前訓(xùn)練用局部觀測區(qū)域,并觸發(fā)區(qū)域訓(xùn)練單元402根據(jù)當(dāng)前訓(xùn)練用局部觀測區(qū)域?qū)Υ?xùn)練場景圖片進行分類操作并計算分類操作的獎勵值。

      定位模型建立單元404,用于當(dāng)達到預(yù)設(shè)的訓(xùn)練結(jié)束條件時,獲取所有待訓(xùn)練場景圖片中每張待訓(xùn)練場景圖片的獎勵值的代數(shù)和,以得到每張待訓(xùn)練場景圖片的總獎勵值,根據(jù)總獎勵值建立總獎勵值最大化的觀測區(qū)域定位模型。

      圖片接收單元405,用于接收輸入的待分類場景圖片。

      區(qū)域獲取單元406,用于根據(jù)預(yù)設(shè)的觀測區(qū)域定位模型從待分類場景圖片中獲取當(dāng)前局部觀測區(qū)域。

      向量獲取單元407,用于對當(dāng)前局部觀測區(qū)域的圖像信息進行處理,以得到待分類場景圖片的特征向量。

      條件判斷單元408,用于根據(jù)特征向量獲取待分類場景圖片的分類預(yù)測結(jié)果,判斷分類預(yù)測結(jié)果是否滿足預(yù)設(shè)的場景圖片分類條件。

      在本發(fā)明實施例中,得到待分類場景圖片圖像信息的特征向量之后,根據(jù)特征向量可以預(yù)測得到場景圖片的多個分類結(jié)果及對應(yīng)的預(yù)測概率,多個分類結(jié)果的預(yù)測概率總和為100%,條件判斷單元判斷這些多個分類結(jié)果中是否存在對應(yīng)的預(yù)測概率大于預(yù)設(shè)閾值的分類結(jié)果,即判斷分類預(yù)測結(jié)果是否滿足預(yù)設(shè)的對待分類場景圖片進行分類的條件。

      重復(fù)執(zhí)行單元409,用于當(dāng)分類預(yù)測結(jié)果不滿足場景圖片分類條件時,根據(jù)觀測區(qū)域定位模型從待分類場景圖片中獲取下一局部觀測區(qū)域,并將下一局部觀測區(qū)域設(shè)置為當(dāng)前局部觀測區(qū)域,并觸發(fā)向量獲取單元407對當(dāng)前局部觀測區(qū)域的圖像信息進行處理。

      場景分類單元410,用于當(dāng)分類預(yù)測結(jié)果滿足場景圖片分類條件時,根據(jù)分類預(yù)測結(jié)果獲取待分類場景圖片的分類標(biāo)簽。

      在本發(fā)明實施例中,室內(nèi)場景的分類裝置的各單元可由相應(yīng)的硬件或軟件單元實現(xiàn),各單元可以為獨立的軟、硬件單元,也可以集成為一個軟、硬件單元,在此不用以限制本發(fā)明。各單元的具體實施方式可參考前述實施例的描述,在此不再贅述。

      以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。

      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1