国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于數(shù)據(jù)分析的高仿真數(shù)字人形象生成方法與流程

      文檔序號:40237443發(fā)布日期:2024-12-06 17:00閱讀:26來源:國知局
      基于數(shù)據(jù)分析的高仿真數(shù)字人形象生成方法與流程

      本發(fā)明涉及數(shù)字人形象生成,特別涉及基于數(shù)據(jù)分析的高仿真數(shù)字人形象生成方法。


      背景技術(shù):

      1、隨著計算機圖形學(xué)和人工智能技術(shù)的發(fā)展,數(shù)字人形象生成技術(shù)已經(jīng)取得了顯著的進展。

      2、但現(xiàn)有技術(shù)中的高仿真數(shù)字人形象生成方法還存在以下不足:

      3、不同的多模態(tài)融合網(wǎng)絡(luò)策略可能會生成具有不同效果的數(shù)字人形象;每種融合策略都有其特定的優(yōu)勢和局限性,可能會在數(shù)字人形象的逼真度、自然度、情感表達等方面產(chǎn)生不同的影響,現(xiàn)有技術(shù)不能對不同的多模態(tài)融合網(wǎng)絡(luò)策略生成數(shù)字人形象的效果進行分析和評估,從而選取最佳的多模態(tài)融合網(wǎng)絡(luò)策略,導(dǎo)致生成的數(shù)字人形象效果和體驗較差。

      4、為此,推出一種基于數(shù)據(jù)分析的高仿真數(shù)字人形象生成方法。


      技術(shù)實現(xiàn)思路

      1、有鑒于此,本發(fā)明提供基于數(shù)據(jù)分析的高仿真數(shù)字人形象生成方法,以解決上述背景技術(shù)提出的問題。

      2、本發(fā)明的目的可以通過以下技術(shù)方案實現(xiàn):基于數(shù)據(jù)分析的高仿真數(shù)字人形象生成方法,包括:

      3、數(shù)據(jù)收集:收集目標人物的面部、身體、動作和語音數(shù)據(jù);

      4、特征提取:對目標人物所收集的數(shù)據(jù)進行分析,提取關(guān)鍵特征,從而建立目標人物所對應(yīng)的數(shù)據(jù)模型;

      5、特征融合:采用多模態(tài)融合網(wǎng)絡(luò)策略,將面部、身體、動作和語音特征融合,生成初步的數(shù)字人形象,生成完成后對不同融合策略的效果進行分析,基于分析的結(jié)果以選取最佳策略,并基于選取的最佳策略生成目標人物的應(yīng)用數(shù)字人形象;

      6、仿真優(yōu)化:通過迭代優(yōu)化算法,不斷調(diào)整數(shù)字人形象的生成參數(shù),提高仿真度;

      7、用戶交互:提供用戶交互接口,允許用戶根據(jù)需要調(diào)整數(shù)字人形象的細節(jié);

      8、數(shù)據(jù)加密:對生成數(shù)字人形象的數(shù)據(jù)進行加密,由此構(gòu)建當前目標人物生成數(shù)字人形象的加密圖案。

      9、在一些實施例中,對不同融合策略的效果進行分析,具體為:

      10、預(yù)設(shè)用于測試效果的數(shù)據(jù)集;其中數(shù)據(jù)集內(nèi)包括多樣化的面部表情、身體動作以及語音樣本;

      11、確定評估數(shù)字人形象效果的指標,包括逼真度、自然度、同步性以及一致性;

      12、首先從數(shù)據(jù)集中提取所需測試的參考圖像,使用生成的數(shù)字人形象產(chǎn)生對應(yīng)參考圖像的測試圖像,應(yīng)用圖像質(zhì)量評估算法對測試圖像和參考圖像進行比較分析,對于每對參考圖像和測試圖像,分別計算結(jié)構(gòu)相似性指數(shù)、多尺度結(jié)構(gòu)相似性以及峰值信噪比,并分別標記為a、b以及c;

      13、將計算的a、b以及c標準化到相同的尺度,通過預(yù)設(shè)a、b以及c的各組取值范圍,設(shè)定每組a、b以及c所對應(yīng)的取值范圍對應(yīng)一個效果評分;將a、b以及c與對應(yīng)的各組取值范圍進行匹配,從而得到每對參考圖像和測試圖像之間a、b以及c的效果評分;

      14、預(yù)設(shè)a、b以及c每個指標的權(quán)重系數(shù),將a、b以及c所對應(yīng)的效果評分分別與對應(yīng)權(quán)重系數(shù)進行相乘,然后求和得到每對參考圖像和測試圖像的綜合評分;

      15、隨后對于每對參考圖像和測試圖像的綜合評分進行均值的計算,將計算的均值作為生成數(shù)字人形象的逼真指數(shù)gai;其中i表示生成數(shù)字人形象的編號,其中i=1,2...k,k為生成數(shù)字人形象的總數(shù)。

      16、在一些實施例中,對不同融合策略的效果進行分析,進一步:

      17、從數(shù)據(jù)集中提取所需測試動作的關(guān)鍵幀和運動軌跡;并根據(jù)提取所需測試動作的關(guān)鍵幀和運動軌跡,生成數(shù)字人形象所需的動作指令,利用對應(yīng)動作指令生成相應(yīng)的動作序列,并對生成的數(shù)字人形象動作進行關(guān)鍵點追蹤;從追蹤結(jié)果中提取關(guān)鍵點在連續(xù)幀中的位置數(shù)據(jù),對于每一對連續(xù)幀,計算關(guān)鍵點的位移,將位移除以幀的時間間隔,得到關(guān)鍵點的速度;隨后計算速度序列的一階導(dǎo)數(shù),即速度隨時間的變化率;進一步計算一階導(dǎo)數(shù)的導(dǎo)數(shù),得到加速度的變化率,即二階導(dǎo)數(shù);

      18、計算二階導(dǎo)數(shù)的標準差,作為測試動作的平滑度;建立一個評分機制對得到的平滑度進行分數(shù)的量化,通過預(yù)設(shè)平滑度的各組取值范圍,設(shè)定每組取值范圍對應(yīng)一個自然度評分;將計算的平滑度與預(yù)設(shè)的各組取值范圍進行匹配,從而將得到的平滑度進行分數(shù)的轉(zhuǎn)化;

      19、提取不同測試動作的自然度評分,預(yù)設(shè)不同測試動作所對應(yīng)的權(quán)重系數(shù),將不同測試動作的自然度評分別與對應(yīng)的權(quán)重系數(shù)相乘,然后求和得到生成數(shù)字人形象的自然指數(shù)gbi。

      20、在一些實施例中,對不同融合策略的效果進行分析,還包括:

      21、從數(shù)據(jù)集中提取所需測試的面部表情、身體動作以及語音數(shù)據(jù);利用生成的數(shù)字人形象執(zhí)行提取的測試數(shù)據(jù),對面部表情和身體動作的時間序列數(shù)據(jù)進行時間序列分析,提取時序特征,使用時間戳將語音數(shù)據(jù)與面部表情和身體動作特征對齊;

      22、計算面部表情和身體動作的時間序列與語音數(shù)據(jù)的時間序列之間的交叉相關(guān)性;測量面部表情和身體動作的關(guān)鍵點變化與語音特征的相位差;確定面部表情和身體動作與語音數(shù)據(jù)的延遲,即動作與語音開始點的餓時間差;

      23、根據(jù)得到的交叉相關(guān)性、相位差以及延遲,將交叉相關(guān)性、相位差以及延遲分別標記為e、r以及t,預(yù)設(shè)e、r以及t的各組取值范圍,設(shè)定每組e、r以及t所對應(yīng)的取值范圍對應(yīng)一個同步性評分,將生成數(shù)字人形象的交叉相關(guān)性、相位差以及延遲進行同步性評分的轉(zhuǎn)化;

      24、預(yù)設(shè)交叉相關(guān)性、相位差以及延遲所對應(yīng)的權(quán)重系數(shù),將生成數(shù)字人形象的交叉相關(guān)性、相位差以及延遲分別與對應(yīng)的權(quán)重系數(shù)相乘,然后求和得到生成數(shù)字人形象的同步性指數(shù)gci。

      25、在一些實施例中,基于分析的結(jié)果以選取最佳策略,具體為:

      26、預(yù)設(shè)不同的測試場景,并通過分析和計算得到不同測試場景下生成數(shù)字人形象的逼真指數(shù)gai、自然指數(shù)gbi以及同步性指數(shù)gci;將對應(yīng)測試場景的編號標記為e,其中e=1,2...s,其中s為預(yù)設(shè)測試場景的總數(shù);

      27、將上述不同測試場景下生成數(shù)字人形象的逼真指數(shù)gai、自然指數(shù)gbi以及同步性指數(shù)gci分別標記為、以及,并代入公式(1)和(2),進行加權(quán)計算得到不同測試場景下生成數(shù)字人形象的效果評估指數(shù)kqfi;其中通過公式(1)計算得到對應(yīng)測試場景下生成數(shù)字人形象的場景評估指數(shù),公式(1)中的、以及分別表示在不同測試場景下的及格逼真指數(shù)、及格自然指數(shù)以及及格同步性指數(shù),、以及分別為不同測試場景下逼真指數(shù)、自然指數(shù)以及同步性指數(shù)的影響權(quán)重因子;

      28、其中公式(2)中的表示不同測試場景下生成數(shù)字人形象效果評估指數(shù)kqfi的影響權(quán)重因子;

      29、將計算的各組效果評估指數(shù)kqfi進行從大到小的排序,選取效果評估指數(shù)kqfi最大的數(shù)字人形象生成融合策略作為最佳策略,并基于選取的最佳策略生成目標人物的應(yīng)用數(shù)字人形象。

      30、在一些實施例中,對生成數(shù)字人形象的數(shù)據(jù)進行加密,具體為:

      31、首先基于當前目標人物所生成的數(shù)字人形象,生成一組唯一的隨機代碼;其中代碼由數(shù)字、字母以及符號組成;基于自定義的轉(zhuǎn)化規(guī)則,對代碼中的字母和符號進行數(shù)字的轉(zhuǎn)化,預(yù)設(shè)各字母和符號分別對應(yīng)一個0-10的數(shù)字,提取代碼中的字母和符號并根據(jù)自定義的轉(zhuǎn)換規(guī)則進行轉(zhuǎn)換后,得到當前目標人物所生成數(shù)字人形象的一連串數(shù)字集合;

      32、對一連串的數(shù)字集合應(yīng)用預(yù)設(shè)的計算公式進行進一步處理,預(yù)設(shè)的計算公式為{(ce+cr)×1.59+cb}×0.85;其中ce表示一連串數(shù)字集合中的具體數(shù)值,cr和cb為預(yù)設(shè)的附加值,且取值>0,具體取值由技術(shù)人員進行設(shè)定;

      33、對一連串的數(shù)字集合進行處理完成后,得到當前目標人物所生成數(shù)字人形象的處理數(shù)字集合。

      34、在一些實施例中,構(gòu)建當前目標人物生成數(shù)字人形象的加密圖案,具體為:

      35、提取處理數(shù)字集合中的每一組數(shù)字,并將每一組數(shù)字的具體數(shù)值作為圓的半徑構(gòu)建圓形,設(shè)定每組數(shù)字對應(yīng)圓形的圓心處于同一直線上,繪制完第一組數(shù)字所構(gòu)建的圓形后,將第二組數(shù)字所構(gòu)建圓形的繪制圓心選在第一組構(gòu)建圓形的邊緣,以此類推,直至繪制完最后一組數(shù)字所構(gòu)建的圓形,由此得到當前目標人物生成數(shù)字人形象的加密圖案。

      36、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:

      37、本發(fā)明通過采用多模態(tài)融合網(wǎng)絡(luò)策略,將面部、身體、動作和語音特征融合,生成高仿真的數(shù)字人形象,并基于效果分析選取最佳融合策略,引入逼真指數(shù)、自然指數(shù)和同步性指數(shù),結(jié)合設(shè)定的不同測試場景,得到不同測試場景下的場景評估指數(shù),進一步根據(jù)不同測試場景下的場景評估指數(shù),得到不同融合策略下數(shù)字人形象的效果評估指數(shù),全面評估數(shù)字人形象生成的效果,確保在多樣化的應(yīng)用環(huán)境中表現(xiàn)穩(wěn)定,提高了數(shù)字人形象的逼真度、自然度和情感表達;

      38、本發(fā)明通過對生成的數(shù)字人形象數(shù)據(jù)進行加密處理,構(gòu)建加密圖案,增強了數(shù)據(jù)的安全性,保護了數(shù)字人形象的數(shù)據(jù)免受未授權(quán)訪問和濫用。

      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1