技術(shù)特征:1.一種基于雙經(jīng)驗(yàn)池tddpg和ddpg-雙重3q學(xué)習(xí)模型的水體富營養(yǎng)化預(yù)測(cè)方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的步驟4中,構(gòu)建的ddpg-雙重3q學(xué)習(xí)模型中,在第一重3q學(xué)習(xí)中,智能體b在單個(gè)時(shí)間步獲得雙經(jīng)驗(yàn)池tddpg預(yù)測(cè)模型、addpg預(yù)測(cè)模型和rdpg預(yù)測(cè)模型的初步預(yù)測(cè)結(jié)果以及對(duì)應(yīng)的三個(gè)q值,利用三個(gè)q值更新最終q學(xué)習(xí)策略q*,基于q*進(jìn)行選擇哪個(gè)狀態(tài)模型的決策。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的步驟22中,使用的transformer結(jié)構(gòu)包含的編碼器和解碼器各有6層。
技術(shù)總結(jié)本發(fā)明是一種基于雙經(jīng)驗(yàn)池TDDPG和DDPG?雙重3Q學(xué)習(xí)模型的水體富營養(yǎng)化預(yù)測(cè)方法,用于水質(zhì)監(jiān)測(cè)。本發(fā)明方法將水體富營養(yǎng)化預(yù)測(cè)問題轉(zhuǎn)換為馬爾可夫決策問題,獲取水體富營養(yǎng)化的水質(zhì)多參數(shù)時(shí)序,構(gòu)建基于雙經(jīng)驗(yàn)池的TDDPG預(yù)測(cè)模型、ADDPG預(yù)測(cè)模型和RDPG預(yù)測(cè)模型,由歷史數(shù)據(jù)預(yù)測(cè)未來水質(zhì)數(shù)據(jù);將三個(gè)預(yù)測(cè)模型的初步預(yù)測(cè)結(jié)果、預(yù)測(cè)結(jié)果的誤差分別作為第一重和第二重3Q學(xué)習(xí)的狀態(tài)集,智能體在單個(gè)時(shí)間步?jīng)Q策選擇的初步預(yù)測(cè)結(jié)果和誤差,將二者疊加獲取最終預(yù)測(cè)結(jié)果,計(jì)算水體富營養(yǎng)化程度。本發(fā)明提高了預(yù)測(cè)水質(zhì)數(shù)據(jù)的精度和準(zhǔn)確性,避免陷入局部最優(yōu),兼顧了訓(xùn)練效率,為水體富營養(yǎng)化預(yù)測(cè)提供了準(zhǔn)確有效的實(shí)用方案。
技術(shù)研發(fā)人員:王立,盧俊峰,寧超然,王小藝,許繼平,趙峙堯,張慧妍,于家斌,孫茜,白玉廷
受保護(hù)的技術(shù)使用者:北京工商大學(xué)
技術(shù)研發(fā)日:技術(shù)公布日:2024/10/10