国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      目標(biāo)對象檢測方法、裝置、終端設(shè)備及計算機可讀存儲介質(zhì)與流程

      文檔序號:39976389發(fā)布日期:2024-11-15 14:24閱讀:19來源:國知局
      目標(biāo)對象檢測方法、裝置、終端設(shè)備及計算機可讀存儲介質(zhì)與流程

      本申請涉及計算機,具體涉及一種目標(biāo)對象檢測方法、裝置、終端設(shè)備及計算機可讀存儲介質(zhì)。


      背景技術(shù):

      1、在遠程會議、線上培訓(xùn)等視頻場景中,通常需要專業(yè)的攝像師對視頻畫面中的發(fā)言人進行判斷,并對發(fā)言人進行實時跟蹤檢測地拍攝。但隨著機器學(xué)習(xí)領(lǐng)域的發(fā)展,現(xiàn)如今大多采用人臉檢測模型對視頻中人物進行嘴部狀態(tài)檢測的方式來檢測目標(biāo)發(fā)言人,以節(jié)省聘請專業(yè)攝像師的成本和時間。

      2、然而,由于嘴部狀態(tài)的唇動信息存在難以捕捉、動作無規(guī)律、與發(fā)言動作無法產(chǎn)生較強關(guān)聯(lián)等缺陷,使得在真實的視頻場景中,大多人臉檢測模型不僅難以準(zhǔn)確地實現(xiàn)目標(biāo)檢測,還會出現(xiàn)諸如視頻畫面切換頻繁、目標(biāo)檢測錯誤等缺陷。


      技術(shù)實現(xiàn)思路

      1、本申請?zhí)峁┝艘环N目標(biāo)對象檢測方法,能夠有效地提升在視頻場景中檢測發(fā)言目標(biāo)對象的準(zhǔn)確性和穩(wěn)定性。

      2、第一方面,本申請?zhí)峁┝艘环N目標(biāo)對象檢測方法,所述方法包括:

      3、對每個候選對象的人臉圖像進行處理,得到每個候選對象的特征信息;

      4、對所述特征信息進行處理,從每個候選對象中檢測發(fā)言的目標(biāo)對象。

      5、第二方面,本申請還提供了一種人臉檢測模型訓(xùn)練裝置,所述裝置包括:

      6、人臉圖像處理模塊,用于對每個候選對象的人臉圖像進行處理,得到每個候選對象的特征信息;

      7、目標(biāo)對象檢測模塊,用于對所述特征信息進行處理,從每個候選對象中檢測發(fā)言的目標(biāo)對象。

      8、第三方面,本申請還提供了一種終端設(shè)備,所述終端設(shè)備包括處理器、存儲器以及存儲于所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)任一項所述的目標(biāo)對象檢測方法中的步驟。

      9、第四方面,本申請還提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行以實現(xiàn)任一項所述的目標(biāo)對象檢測方法中的步驟。

      10、本申請?zhí)峁┑哪繕?biāo)對象檢測方法、裝置、終端設(shè)備以及計算機可讀存儲介質(zhì),通過對候選對象的人臉圖像進行處理,提取出候選對象較為豐富的特征信息,并基于豐富的特征信息檢測發(fā)言的目標(biāo)對象,從而能夠有效地提升在視頻場景中檢測發(fā)言目標(biāo)對象的準(zhǔn)確性和穩(wěn)定性。



      技術(shù)特征:

      1.一種目標(biāo)對象檢測方法,其特征在于,所述方法包括:

      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述特征信息包括每個候選對象在當(dāng)前時間窗口的嘴部特征序列;

      3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述拼接特征序列,從每個候選對象中檢測發(fā)言的目標(biāo)對象,包括:

      4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述拼接特征序列,從每個候選對象中檢測發(fā)言的目標(biāo)對象之后,還包括:

      5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對所述每個候選對象在當(dāng)前時間窗口的發(fā)言概率,以及每個候選對象在當(dāng)前時間窗口的嘴部特征序列進行融合,得到每個候選對象在當(dāng)前時間窗口的融合特征序列,包括:

      6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述從每個候選對象中檢測發(fā)言的目標(biāo)對象之后,還包括:

      7.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述從每個候選對象中檢測發(fā)言的目標(biāo)對象之后,還包括:

      8.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述從每個候選對象中檢測發(fā)言的目標(biāo)對象之后,還包括:

      9.根據(jù)權(quán)利要求8所述的方法,其特征在于,基于所述偏移量,確定拍攝視頻畫面的云臺對應(yīng)的云臺轉(zhuǎn)角,包括:

      10.一種目標(biāo)對象檢測裝置,其特征在于,所述裝置包括:

      11.一種終端設(shè)備,其特征在于,所述終端設(shè)備包括處理器、存儲器以及存儲于所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)權(quán)利要求1至9中任一項所述的目標(biāo)對象檢測方法中的步驟。

      12.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行以實現(xiàn)權(quán)利要求1至9任一項所述的目標(biāo)對象檢測方法中的步驟。


      技術(shù)總結(jié)
      本申請?zhí)峁┝艘环N目標(biāo)對象檢測方法、裝置、終端設(shè)備及計算機可讀存儲介質(zhì),該方法包括:對每個候選對象的人臉圖像進行處理,得到每個候選對象的特征信息;對所述特征信息進行處理,從每個候選對象中檢測發(fā)言的目標(biāo)對象。本申請能夠有效地提升在視頻場景中檢測發(fā)言目標(biāo)對象的準(zhǔn)確性和穩(wěn)定性。

      技術(shù)研發(fā)人員:范財理,黨杰
      受保護的技術(shù)使用者:TCL科技集團股份有限公司
      技術(shù)研發(fā)日:
      技術(shù)公布日:2024/11/14
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1