国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于多圖片目標識別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的制作方法

      文檔序號:39978497發(fā)布日期:2024-11-15 14:27閱讀:19來源:國知局
      一種基于多圖片目標識別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的制作方法

      本發(fā)明涉及人工智能領(lǐng)域,具體是指一種基于多圖片目標識別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。


      背景技術(shù):

      1、ai識別領(lǐng)域里目標檢測技術(shù),是目前和未來人工智能領(lǐng)域的重要應(yīng)用。目前的目標檢測技術(shù)主要有基于深度學(xué)習(xí)的目標檢測算法:

      2、two-stage?algorithms(兩階段算法)

      3、1.r-cnn系列(包括r-cnn,fast?r-cnn,faster?r-cnn):引入深度學(xué)習(xí)進行特征提取,準確性高,但計算成本高,尤其是r-cnn和fast?r-cnn在生成區(qū)域提議(regionproposals)上效率低。

      4、2.mask?r-cnn:在faster?r-cnn基礎(chǔ)上增加了實例分割功能,精確度高,但計算復(fù)雜度高,速度較慢。

      5、one-stage?algorithms(一階段算法)

      6、1.yolo(you?only?look?once)系列(包括yolov1至yolov5):以速度見長,可以實現(xiàn)實時檢測,但尤其在早期版本中,對小目標檢測和定位精度不如兩階段算法。

      7、2.ssd(single?shot?multibox?detector):同樣追求速度與精度的平衡,但可能在面對高度重疊或小目標時表現(xiàn)不佳。

      8、3.retinanet:為了解決一階段算法中正負樣本不均衡的問題而設(shè)計,但相比一些優(yōu)化過的兩階段算法,精度可能略低。

      9、而以上神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)使用時,對遮擋和光照變化敏感:

      10、多數(shù)算法在目標被遮擋或光照條件劇烈變化時表現(xiàn)會下降,當出顯遮擋或光照發(fā)生變化時,圖像的紋理和輪廓也發(fā)生了變化識別準確率就下降。

      11、同時對于動態(tài)目標的檢測準確度不高:

      12、因為現(xiàn)有的目標檢測是針對視頻里的每張圖片在進行圖像分析,而不是視頻序列進行分析所以,對于上述目標檢測神經(jīng)網(wǎng)絡(luò)而言,沒有所謂動靜之分。

      13、當攝像頭在運動狀態(tài)下很難準確追蹤動太態(tài)目標:

      14、因為現(xiàn)有的目標檢測是針對視頻里的每張圖片在進行圖像分析,而不是視頻序列進行分析所以,對于上述算法而言,感受的都相對靜態(tài)的畫面,所以區(qū)分不了目標是否是靜態(tài)還是動態(tài)。


      技術(shù)實現(xiàn)思路

      1、本發(fā)明要解決的技術(shù)問題是,克服以上技術(shù)缺陷,提供一種可以基于多圖使用,減少光照與遮擋敏感,保證檢測準確率的一種基于多圖片目標識別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。

      2、為解決上述技術(shù)問題,本發(fā)明提供的技術(shù)方案為:一種基于多圖片目標識別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括目標檢測神經(jīng)網(wǎng)絡(luò),所述目標檢測神經(jīng)網(wǎng)絡(luò)設(shè)有更多通道入口,所述目標檢測神經(jīng)網(wǎng)絡(luò)設(shè)有多個圖片同時輸入的入口設(shè)計結(jié)構(gòu),所述目標檢測神經(jīng)網(wǎng)絡(luò)的入口層的結(jié)構(gòu)設(shè)計為接收多個圖片合成的多通道張量數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的入口層接受通道數(shù)量為n*ch,其中n為入口層同時接收的圖片數(shù),ch為圖片通道數(shù)量。

      3、優(yōu)選的,所述目標檢測神經(jīng)網(wǎng)絡(luò)包括輸入層、特征提取層、檢測層和輸出層,所述輸入層設(shè)有>3通道入口,特征提取層包括卷積層、池化層和融合層,所述檢測層包括預(yù)測目標位置與類別。

      4、優(yōu)選的,所述圖片數(shù)據(jù)的預(yù)處理包括針對視頻流進行序列圖片的提取,包括相等間隔的連續(xù)圖片與隨機間隔的不連續(xù)圖片,將選擇的圖片進行輸入至輸入層。

      5、優(yōu)選的,在輸入至輸入層前還包括圖片的灰度化處理、幾何裁切、歸一化和濾波處理。

      6、優(yōu)選的,所述檢測層包括yolo、ssd或faster?r-cnn模型。

      7、本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點在于:在本發(fā)明中采用了多圖片同時ai學(xué)習(xí)和訓(xùn)練的方式和方法,神經(jīng)網(wǎng)絡(luò)不再是依賴單張圖片的信息,所以檢測的信息更加精準,多張圖片的輸入,保留了目標對象的完整正常信息,減少光照對目標檢測的影響,多圖片和序列圖片的使用保留了上下文信息能夠很好的區(qū)分動態(tài)目標和靜態(tài)目標。



      技術(shù)特征:

      1.一種基于多圖片目標識別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其特征在于:包括目標檢測神經(jīng)網(wǎng)絡(luò),所述神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)具有能接受多個圖片同時輸入的輸入層,所述目標檢測神經(jīng)網(wǎng)絡(luò)的輸入層結(jié)構(gòu)為接收多個圖片合成的多通道張量數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的輸入層接受通道數(shù)量為n*ch,其中n為神經(jīng)網(wǎng)絡(luò)輸入層能同時接收的圖片數(shù),ch為每個圖片通道數(shù)量,其中n>1。

      2.根據(jù)權(quán)利要求1所述的一種基于多圖片目標識別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其特征在于:所述神經(jīng)網(wǎng)絡(luò)包括能接受多圖片同時時輸入的神經(jīng)網(wǎng)絡(luò):

      3.根據(jù)權(quán)利要求1所述的一種基于多圖片目標識別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其特征在于:所述圖片數(shù)據(jù)的預(yù)處理包括針對視頻流進行序列圖片的提取,包括相等間隔的連續(xù)圖片與隨機間隔的不連續(xù)圖片,將選擇的圖片進行輸入至輸入層使用。


      技術(shù)總結(jié)
      本發(fā)明公開了一種基于多圖片目標識別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括目標檢測神經(jīng)網(wǎng)絡(luò),所述目標檢測神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計有支持多個圖片同時輸入的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的入口層(輸入層)接受通道數(shù)量為n*ch的圖片張量,其中n為入層能同時接收的圖片個數(shù),ch為圖片通道數(shù)量。本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點在于:提供一種可以基于多圖使用,減少光照與遮擋敏感,保證檢測準確率的一種基于多圖片目標識別的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。

      技術(shù)研發(fā)人員:李金雨
      受保護的技術(shù)使用者:陜西知匯電子科技有限公司
      技術(shù)研發(fā)日:
      技術(shù)公布日:2024/11/14
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1