本發(fā)明屬于通信感知一體化,它特別涉及關(guān)于通信感知一體化系統(tǒng)中雙功發(fā)射信號(hào)與雙功接收機(jī)的設(shè)計(jì)。
背景技術(shù):
1、隨著電子設(shè)備數(shù)量的增加,頻譜資源變得稀缺,使得原本獨(dú)立工作的通信和感知系統(tǒng)開(kāi)始向通感一體化方向發(fā)展。通感一體化系統(tǒng)具有降低系統(tǒng)能耗,減少電子干擾的優(yōu)點(diǎn),成為了下一代無(wú)線通信的一個(gè)有前途的發(fā)展方向。
2、在現(xiàn)有關(guān)于通感一體化系統(tǒng)的研究工作中,大部分的接收機(jī)僅考慮雷達(dá)任務(wù)或通信任務(wù)。針對(duì)共存式通感一體化系統(tǒng),在文獻(xiàn)1(chiriyath?a.r,paul?b,blissd.w.simultaneous?radar?detection?and?communications?performance?with?cluttermitigation[c].2017ieee?radar?conference,seattle,usa,2017,0279-0284)中,提出了聯(lián)合接收機(jī),先實(shí)現(xiàn)通信譯碼,得到通信傳輸信息后,再進(jìn)行連續(xù)干擾相消去除通信信號(hào),最后進(jìn)行雷達(dá)檢測(cè)任務(wù)。在文獻(xiàn)2(dong?y,liu?f,xiong?y.joint?receiver?design?forintegrated?sensing?and?communications[j].ieee?communications?letters,2023,27(7):1854-1858)中,考慮了存在通信譯碼誤差情況下,同時(shí)利用通信直達(dá)路徑和雷達(dá)目標(biāo)反射路徑實(shí)現(xiàn)目標(biāo)反射系數(shù)的估計(jì)。然而并未有針對(duì)雙功通感一體化系統(tǒng)雙功接收機(jī)的相關(guān)研究工作。
3、由于通信和感知對(duì)信號(hào)的需求不同,需要對(duì)發(fā)射信號(hào)進(jìn)行設(shè)計(jì)以平衡通信和感知的性能。在接收端,考慮通信主要任務(wù)是譯碼傳輸信息,雷達(dá)主要任務(wù)是檢測(cè)目標(biāo)是否存在,通過(guò)設(shè)計(jì)檢測(cè)器完成檢測(cè),設(shè)計(jì)譯碼器實(shí)現(xiàn)譯碼。進(jìn)一步的,發(fā)端的信號(hào)以及收端的檢測(cè)器、譯碼器可以進(jìn)行聯(lián)合設(shè)計(jì),以提升系統(tǒng)性能。然而,傳統(tǒng)方法下的收發(fā)聯(lián)合設(shè)計(jì)依賴于噪聲和信道等的統(tǒng)計(jì)特性,且在復(fù)雜的噪聲信道統(tǒng)計(jì)特性下,面臨復(fù)雜度較高的問(wèn)題。因此,在多輸入多輸出(mimo)雙功通感一體化系統(tǒng)中,考慮基于機(jī)器學(xué)習(xí)的收發(fā)聯(lián)合設(shè)計(jì)方法是有必要的。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明針對(duì)背景技術(shù)的不足解決的技術(shù)問(wèn)題是,獲得了多目標(biāo)場(chǎng)景下,通感一體化系統(tǒng)中一種基于機(jī)器學(xué)習(xí)的雙功發(fā)射信號(hào)與雙功接收機(jī)的聯(lián)合優(yōu)化方法。
2、本發(fā)明技術(shù)方案為一種基于機(jī)器學(xué)習(xí)的通感一體化雙功收發(fā)網(wǎng)絡(luò)聯(lián)合設(shè)計(jì)方法,該方法包括:
3、步驟1:采用so-ocdm信號(hào)作為發(fā)射的雙功信號(hào),構(gòu)建第m個(gè)發(fā)射機(jī)在時(shí)刻kts發(fā)射的so-ocdm信號(hào)表達(dá)式smk,m=1,...,m;
4、
5、其中,m為總發(fā)射機(jī)數(shù)量,k為采樣點(diǎn)索引,ts為采樣時(shí)間間隔,fδ為相鄰發(fā)射機(jī)發(fā)射信號(hào)的頻率間隔,em為發(fā)射信號(hào)的能量,p為ocdm符號(hào)數(shù),l為一個(gè)ocdm符號(hào)中包含的chirp子載波數(shù),bp,l,m為第m個(gè)發(fā)射機(jī)發(fā)射的第p個(gè)符號(hào)中第l個(gè)子載波上調(diào)制通信符號(hào),qp,l,m[k]包含了保護(hù)間隔和chirp子載波;
6、
7、tgi,m為保護(hù)間隔持續(xù)時(shí)間,tm為符號(hào)持續(xù)時(shí)間,to,m為完整ocdm符號(hào)持續(xù)時(shí)間,且滿足to,m=tgi,m+tm;
8、步驟2:將m個(gè)待設(shè)計(jì)的發(fā)射信號(hào)參數(shù)表示為矢量形式λ;
9、
10、其中,λm=[em,tm]t,m表示發(fā)射機(jī)數(shù)量,(·)t表示轉(zhuǎn)置;
11、步驟3:構(gòu)建信號(hào)設(shè)計(jì)網(wǎng)絡(luò),包含ddpg算法模塊和so-ocdm信號(hào)產(chǎn)生器,ddpg表示深度確定性策略梯度,ddpg算法模塊包含了演員網(wǎng)絡(luò)、評(píng)論家網(wǎng)絡(luò)、目標(biāo)演員網(wǎng)絡(luò)和目標(biāo)評(píng)論家網(wǎng)絡(luò);信號(hào)設(shè)計(jì)網(wǎng)絡(luò)與雙功接收網(wǎng)絡(luò)第i次交互過(guò)程中,演員網(wǎng)絡(luò)的輸入為接收信號(hào)能量矢量,輸出為優(yōu)化的so-ocdm信號(hào)參數(shù)向量;
12、
13、其中,接收信號(hào)能量矢量γi=[γ11,...,γm,...,γmn]t,γmn是第n個(gè)接收機(jī)接收到的來(lái)自第m個(gè)發(fā)射機(jī)的信號(hào)能量,表示演員網(wǎng)絡(luò),θa是演員網(wǎng)絡(luò)的可訓(xùn)練參數(shù),是演員網(wǎng)絡(luò)的輸出;評(píng)論家網(wǎng)絡(luò)的輸入為接收信號(hào)能量矢量γi和so-so-ocdm信號(hào)參數(shù)向量輸出是對(duì)動(dòng)作狀態(tài)價(jià)值的估計(jì)值θc是評(píng)論家網(wǎng)絡(luò)的可訓(xùn)練參數(shù);目標(biāo)演員網(wǎng)絡(luò)用于產(chǎn)生下一時(shí)刻接收信號(hào)能量矢量γi+1對(duì)應(yīng)的信號(hào)參數(shù)向量是目標(biāo)演員網(wǎng)絡(luò)的可訓(xùn)練參數(shù),γi+1是網(wǎng)絡(luò)輸入,是網(wǎng)絡(luò)輸出;目標(biāo)評(píng)論家網(wǎng)絡(luò)用于評(píng)估下一時(shí)刻接收信號(hào)能量矢量γi+1和信號(hào)參數(shù)向量對(duì)應(yīng)的動(dòng)作狀態(tài)價(jià)值是目標(biāo)評(píng)論家網(wǎng)絡(luò)的可訓(xùn)練參數(shù);雙功接收網(wǎng)絡(luò)通過(guò)有線反饋鏈路向信號(hào)設(shè)計(jì)網(wǎng)絡(luò)反饋的信道信息后γi,信號(hào)設(shè)計(jì)網(wǎng)絡(luò)產(chǎn)生對(duì)應(yīng)信道信息下的信號(hào)參數(shù)向量so-ocdm信號(hào)產(chǎn)生器再根據(jù)信號(hào)參數(shù)向量產(chǎn)生對(duì)應(yīng)的雙功so-ocdm信號(hào);
14、步驟4:計(jì)算第n個(gè)雙功接收機(jī)在第i次交互時(shí),時(shí)刻kts的接收信號(hào)為rn,i[k];
15、
16、其中,為g個(gè)目標(biāo)反射的m條目標(biāo)反射路徑信號(hào)之和,為m條直達(dá)路徑信號(hào)之和,zn,i[k]為噪聲;和分別表示目標(biāo)反射路徑和直達(dá)路徑的路徑衰落系數(shù),和表示目標(biāo)反射路徑和直達(dá)路徑的時(shí)延,sm,i(.)表示第i次交互時(shí)第m個(gè)發(fā)射機(jī)發(fā)射的信號(hào);
17、步驟5:組合目標(biāo)信息向量和通信信息向量,構(gòu)建通感一體化信息向量ψi;
18、
19、其中,
20、ρi=[ρ1,i,...,ρj,i,...ρj,i]t
21、bi=[b1,i,...,bm,i,...,bm,i]t
22、bm,i=[b1,1,m,i,...,bl,p,m,i,...,bl,p,m,i]
23、bl,p,m,i=[bl,p,m,1,i,...,bl,p,m,d,i,...,bl,p,m,d,i]
24、j,i表示第j個(gè)格點(diǎn)是否有目標(biāo),bl,p,m,d,i表示第m個(gè)發(fā)射機(jī)發(fā)射的第p個(gè)符號(hào)中第l個(gè)子載波上的第d個(gè)比特;
25、步驟6:構(gòu)建基于監(jiān)督學(xué)習(xí)的雙功接收機(jī)網(wǎng)絡(luò),其包含信號(hào)預(yù)處理模塊,全連接網(wǎng)絡(luò)和一個(gè)比較器;在信號(hào)預(yù)處理模塊,對(duì)信號(hào)進(jìn)行去保護(hù)間隔、帶通濾波、去啁啾子載波、堆疊操作,得到信號(hào)矢量
26、其中,
27、
28、kgi,m為保護(hù)間隔的采樣點(diǎn)數(shù),ko,m為完成符號(hào)的采樣點(diǎn)數(shù),k'ts∈[pto,m+tgi,m,pto,m+to,m),(·)*表示共軛運(yùn)算,k′表示去除保護(hù)間隔后的樣本索引;
29、步驟7:信號(hào)矢量被輸入全連接網(wǎng)絡(luò),網(wǎng)絡(luò)輸出為估計(jì)的通感一體化信息向量;
30、
31、其中,第i次交互時(shí)的接收信號(hào)矢量,θdfr是雙功接收機(jī)網(wǎng)絡(luò)的可訓(xùn)練參數(shù),是雙功接收機(jī)網(wǎng)絡(luò)的輸出;將網(wǎng)絡(luò)輸出與門(mén)限進(jìn)行比較,做出最后的判決結(jié)果ψi;
32、步驟8:確定信號(hào)設(shè)計(jì)網(wǎng)絡(luò)的目標(biāo)函數(shù)、雙功接收機(jī)網(wǎng)絡(luò)的損失函數(shù)和參數(shù)更新方式;
33、步驟9:根據(jù)so-ocdm信號(hào)模型產(chǎn)生發(fā)射信號(hào),然后產(chǎn)生接收信號(hào)以及對(duì)應(yīng)的標(biāo)簽ψi;在訓(xùn)練信號(hào)設(shè)計(jì)網(wǎng)絡(luò)時(shí),信號(hào)設(shè)計(jì)網(wǎng)絡(luò)與雙功接收機(jī)網(wǎng)絡(luò)交互i次,每交互一次就更新一次信號(hào)設(shè)計(jì)網(wǎng)絡(luò)參數(shù);在訓(xùn)練雙功接收機(jī)網(wǎng)絡(luò)時(shí),信號(hào)設(shè)計(jì)網(wǎng)絡(luò)與雙功接收機(jī)網(wǎng)絡(luò)交互i次,當(dāng)所有的交互過(guò)程都完成后,更新雙功接收機(jī)網(wǎng)絡(luò)參數(shù);交替迭代訓(xùn)練信號(hào)設(shè)計(jì)網(wǎng)絡(luò)和雙功接收機(jī)網(wǎng)絡(luò),實(shí)現(xiàn)雙功收發(fā)的聯(lián)合訓(xùn)練;在訓(xùn)練雙功接收機(jī)網(wǎng)絡(luò)時(shí),固定信號(hào)設(shè)計(jì)網(wǎng)絡(luò)參數(shù)θa、θc、和對(duì)θdfr進(jìn)行更新;在訓(xùn)練信號(hào)設(shè)計(jì)網(wǎng)絡(luò)時(shí),固定網(wǎng)絡(luò)參數(shù)θdfr,對(duì)θa、θc、和進(jìn)行更新;兩個(gè)訓(xùn)練步驟交替迭代直到整個(gè)網(wǎng)絡(luò)收斂;表示目標(biāo)演員網(wǎng)絡(luò)可訓(xùn)練參數(shù),表示目標(biāo)評(píng)論家網(wǎng)絡(luò)可訓(xùn)練參數(shù);
34、步驟10:根據(jù)發(fā)射信號(hào)模型生成so-ocdm信號(hào),信號(hào)經(jīng)過(guò)信道后得到接收信號(hào),將接收信號(hào)輸入雙功接收機(jī)網(wǎng)絡(luò),得到網(wǎng)絡(luò)的輸出;最后將網(wǎng)絡(luò)的輸出ψi與標(biāo)簽進(jìn)行比較ψi,以評(píng)估系統(tǒng)性能。
35、進(jìn)一步的,所述步驟8的具體方法為:
36、訓(xùn)練演員網(wǎng)絡(luò)的目標(biāo)函數(shù)l(θa)為:
37、
38、其中,表示評(píng)論家網(wǎng)絡(luò),表示關(guān)于信號(hào)參數(shù)向量和信號(hào)能量向量求期望,信號(hào)參數(shù)向量i表示總的交互次數(shù),信號(hào)能量向量γ∈{γi|i=1,...,i};在第u次迭代時(shí),根據(jù)梯度上升更新θa,即
39、
40、其中,ηa是演員網(wǎng)絡(luò)的學(xué)習(xí)率,←表示賦值操作,θa,u是第u次迭代時(shí)的演員網(wǎng)絡(luò)的參數(shù),是l(θa)在參數(shù)θa=θa,u-1時(shí)的梯度;對(duì)目標(biāo)演員網(wǎng)絡(luò)中的進(jìn)行軟更新,
41、
42、其中,0<<βs<1是軟更新的權(quán)重因子,表示第u次迭代時(shí)的目標(biāo)演員網(wǎng)絡(luò);
43、評(píng)論家網(wǎng)絡(luò)的目標(biāo)函數(shù)l(θc)為,
44、
45、其中,獎(jiǎng)勵(lì)表示第i次交互的獎(jiǎng)勵(lì),下一個(gè)接收信號(hào)能量向量γ′∈{γi+1|i=1,...,i},βtd表示折扣因子,表示目標(biāo)評(píng)論家網(wǎng)絡(luò),表示評(píng)論家網(wǎng)絡(luò),表示關(guān)于信號(hào)參數(shù)向量,接收信號(hào)能量矢量,獎(jiǎng)勵(lì)和下一時(shí)刻的接收信號(hào)能量矢量求期望;在第u次迭代時(shí),有
46、
47、其中,ηc是學(xué)習(xí)率,θc,u表示第u次迭代時(shí)演員網(wǎng)絡(luò)參數(shù),是l(θc)在參數(shù)θc=θc,u1時(shí)的梯度;目標(biāo)評(píng)論家網(wǎng)絡(luò)和評(píng)論家網(wǎng)絡(luò)具有相同的網(wǎng)絡(luò)架構(gòu)和相同的初始化網(wǎng)絡(luò)參數(shù),對(duì)目標(biāo)演員網(wǎng)絡(luò)也進(jìn)行軟更新,有
48、
49、其中,表示第u次迭代時(shí)目標(biāo)演員網(wǎng)絡(luò)參數(shù);
50、雙功接收機(jī)網(wǎng)絡(luò)的損失函數(shù)ldfr(θdfr)為:
51、
52、其中,表示關(guān)于接收信號(hào)矢量與通感一體化信息向量求期望,ψ={ψi|i1,...,i},ψq和表示ψ和中的第q個(gè)元素,q=1,...,q,q為元素總個(gè)數(shù),lisac={lisac,i|i=1,...,i}是每個(gè)訓(xùn)練數(shù)據(jù)的損失,采用梯度下降對(duì)網(wǎng)絡(luò)中可訓(xùn)練參數(shù)進(jìn)行訓(xùn)練,
53、
54、其中,ηdfr是學(xué)習(xí)率,是l(θdfr)在參數(shù)θdfr=θdfr,u1時(shí)的梯度。
55、本發(fā)明的有益效果是:通過(guò)設(shè)計(jì)雙功接收機(jī),利用同一接收信號(hào)同時(shí)實(shí)現(xiàn)譯碼和多目標(biāo)檢測(cè)任務(wù),提升了系統(tǒng)性能。進(jìn)一步,通過(guò)采用強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí),實(shí)現(xiàn)對(duì)雙功發(fā)射信號(hào)與雙功接收機(jī)的聯(lián)合設(shè)計(jì)。相較于傳統(tǒng)的方法,基于機(jī)器學(xué)習(xí)的方法對(duì)信道、目標(biāo)和雜波等的數(shù)學(xué)模型依賴性更小,同時(shí)可以有效提升系統(tǒng)性能,為通感一體化領(lǐng)域的收發(fā)聯(lián)合設(shè)計(jì)問(wèn)題提供了一種可行方法。