本發(fā)明涉及數(shù)據(jù)處理方法及系統(tǒng),尤其涉及一種適合無線分布式感知系統(tǒng)的數(shù)據(jù)處理方法及系統(tǒng)。
背景技術(shù):隨著集成電路、無線通信等各領(lǐng)域技術(shù)的不斷進(jìn)步,無線分布式感知系統(tǒng)已經(jīng)廣泛應(yīng)用于工農(nóng)業(yè)控制、生物醫(yī)療、環(huán)境質(zhì)量監(jiān)測、搶險救災(zāi)以及國防軍事等領(lǐng)域。在無線分布式感知系統(tǒng)中,各分布式節(jié)點(diǎn)分別采集到局部數(shù)據(jù)之后,將數(shù)據(jù)通過無線鏈路直接或間接傳遞給匯聚節(jié)點(diǎn),然后通過匯聚節(jié)點(diǎn)的融合處理得到全貌信息。所以感知數(shù)據(jù)的傳輸與處理策略是無線分布式感知系統(tǒng)的支撐技術(shù),其有效性與可靠性直接決定了各種無線分布式感知系統(tǒng)的價值與應(yīng)用前景。在已有的研究中,感知數(shù)據(jù)的傳輸與處理策略可大致分為兩類:(1)基于特定路由的多跳存儲轉(zhuǎn)發(fā)策略。這種策略是最傳統(tǒng)的信息傳輸策略,它的優(yōu)點(diǎn)是設(shè)計簡單,而且匯聚節(jié)點(diǎn)對全貌信息的感知是一個漸進(jìn)過程。但存在的問題是數(shù)據(jù)傳輸效率不高,且對抗鏈路中斷或節(jié)點(diǎn)失效等干擾因素的能力差。(2)基于網(wǎng)絡(luò)編碼的數(shù)據(jù)傳輸與處理策略。2000年,RudolfAhlswede等人在《NetworkInformationFlow》論文里提出了網(wǎng)絡(luò)編碼的概念,指出對組播網(wǎng)絡(luò)中的某些節(jié)點(diǎn)附加額外的編碼操作能使源點(diǎn)與組播成員間達(dá)到最大流最小割的組播速率,證明了組播網(wǎng)絡(luò)中利用線性編碼達(dá)到最大信息流量的可能性。同年,在論文《Linearnetworkcoding》中,Li等人提出了線性編碼的方法,將數(shù)據(jù)塊看作是某個基上的向量并在節(jié)點(diǎn)中將其進(jìn)行線性變換,之后再發(fā)送出去。它指出了對于有向的組播網(wǎng)絡(luò)只需采用線性網(wǎng)絡(luò)編碼即可達(dá)到最大組播速率。2004年,在論文《Decentralizednetworkcoding》中,CFragouli等人首次針對組播網(wǎng)絡(luò)提出了確定系數(shù)的分布式網(wǎng)絡(luò)編碼算法,其核心思想是將網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)分割成若干個子樹,并保證每個子樹的編碼向量屬于其父樹編碼向量的擴(kuò)張空間,且任意兩個子樹的共有信宿的編碼向量均線性無關(guān)。該方法具有良好的可擴(kuò)展性,但是只是一個次優(yōu)的算法,因?yàn)樵撍惴ㄋ璧淖帜副砜臻g隨節(jié)點(diǎn)規(guī)模呈線性增長。2006年,TraceyHo等人在論文《ARandomLinearNetworkCodingApproachtoMulticast》中,給出了一種隨機(jī)系數(shù)的分布式網(wǎng)絡(luò)編碼算法,其編碼系數(shù)從有限域中均勻隨機(jī)選取。該方法對線性相關(guān)的信源具有信息壓縮作用,適用于鏈路動態(tài)變化的場景,當(dāng)給定的字母表足夠大時能漸進(jìn)達(dá)到最大組播速率,具有很強(qiáng)的實(shí)用性。而具體到分布式無線傳感器網(wǎng)絡(luò),針對沒有匯聚節(jié)點(diǎn),每個節(jié)點(diǎn)自貯存信息直到被收集節(jié)點(diǎn)采集走的場景,在論文《Decentralizederasurecodesfordistributednetworkedstorage》與《Datapersistenceinlarge-scalesensornetworkswithdecentralizedfountaincodes》中分別提出分布式擦除碼和分布式噴泉碼兩種糾刪碼,能夠有效減少傳輸和計算能耗并降低解碼復(fù)雜性。但是遺憾在于它們并沒有發(fā)掘出無線傳感器網(wǎng)絡(luò)中信號的可壓縮性。綜上所述,相對于第一種傳輸策略,網(wǎng)絡(luò)編碼的引入大大提升感知數(shù)據(jù)的傳輸效率,且對抗鏈路中斷或節(jié)點(diǎn)失效等不穩(wěn)定因素的能力較佳。但這種策略仍然存在兩個較大缺陷:一是沒有利用感知數(shù)據(jù)的內(nèi)在相關(guān)性,無法對感知數(shù)據(jù)實(shí)現(xiàn)分布式壓縮,致使對傳輸有效性的挖掘不夠;二是匯聚節(jié)點(diǎn)的解碼存在“全有或全無”(All-or-Nothing)問題。
技術(shù)實(shí)現(xiàn)要素:為了解決現(xiàn)有技術(shù)中的問題,本發(fā)明提供了一種適合無線分布式感知系統(tǒng)的數(shù)據(jù)處理方法。本發(fā)明提供了一種適合無線分布式感知系統(tǒng)的數(shù)據(jù)處理方法,包括如下步驟:A.傳感器節(jié)點(diǎn)采集具有相關(guān)性的感知數(shù)據(jù);B.中間節(jié)點(diǎn)利用隨機(jī)線性網(wǎng)絡(luò)編碼對感知數(shù)據(jù)進(jìn)行處理;C.傳感器節(jié)點(diǎn)為N個,匯聚節(jié)點(diǎn)為m個,設(shè)源數(shù)據(jù)為x,匯聚節(jié)點(diǎn)接收的數(shù)據(jù)為y,匯聚節(jié)點(diǎn)把接收到的輸入向量進(jìn)行組合,得到線性方程組y=Φx,由于m<N,方程組是欠定的,故將解欠定方程組的問題轉(zhuǎn)化為l1最小化問題,從而重構(gòu)原始感知數(shù)據(jù);D.接收端接收原始感知數(shù)據(jù);、l1最小化問題:如果原始信號x是稀疏的或者是可壓縮的,那么x的恢復(fù)問題可以看作為如下形式的優(yōu)化問題:s.t.y=Φx。作為本發(fā)明的進(jìn)一步改進(jìn),在所述步驟C中,利用壓縮感知理論,解決l1最小化問題,對原始感知數(shù)據(jù)進(jìn)行重構(gòu)。作為本發(fā)明的進(jìn)一步改進(jìn),在所述步驟C中,通過貪婪算法解決l1最小化問題,利用有限的測量值對原始感知數(shù)據(jù)進(jìn)行重構(gòu)。作為本發(fā)明的進(jìn)一步改進(jìn),所述貪婪算法采用正交匹配追蹤算法。作為本發(fā)明的進(jìn)一步改進(jìn),在所述步驟A中,傳感器節(jié)點(diǎn)采集具有相關(guān)性的感知數(shù)據(jù)形成數(shù)據(jù)包,并將該數(shù)據(jù)包傳輸給中間節(jié)點(diǎn);所述數(shù)據(jù)包由包頭部分和數(shù)據(jù)部分組成,所述包頭部分由時間標(biāo)記和全局編碼向量構(gòu)成,所述數(shù)據(jù)部分為感知數(shù)據(jù);同一時隙被采集到的數(shù)據(jù)包被認(rèn)為是同一代的包,時間標(biāo)記是一個整數(shù),時間標(biāo)記代表著該數(shù)據(jù)包屬于第幾代;全局編碼向量由N個單精度浮點(diǎn)數(shù)表示,其中N值等于傳感器節(jié)點(diǎn)個數(shù);然后從集合{1,2,…N}中為每個節(jié)點(diǎn)分配ID,如果某個數(shù)據(jù)包由ID為i的源點(diǎn)發(fā)出,全局編碼向量將會被初始化為單位向量,其中只有第i個元素值為1,其余元素均為0。本發(fā)明還提供了一種適合無線分布式感知系統(tǒng)的數(shù)據(jù)處理系統(tǒng),包括:采集單元,用于傳感器節(jié)點(diǎn)采集具有相關(guān)性的感知數(shù)據(jù);處理單元,用于中間節(jié)點(diǎn)利用隨機(jī)線性網(wǎng)絡(luò)編碼對感知數(shù)據(jù)進(jìn)行處理;轉(zhuǎn)化及重構(gòu)單元,用于將解欠定方程組的問題轉(zhuǎn)化為l1最小化問題,傳感器節(jié)點(diǎn)為N個,匯聚節(jié)點(diǎn)為m個,設(shè)源數(shù)據(jù)為x,匯聚節(jié)點(diǎn)接收的數(shù)據(jù)為y,匯聚節(jié)點(diǎn)把接收到的輸入向量進(jìn)行組合,得到線性方程組y=Φx,由于m<N,方程組是欠定的,從而重構(gòu)原始感知數(shù)據(jù);接收單元,用于接收端接收原始感知數(shù)據(jù)。作為本發(fā)明的進(jìn)一步改進(jìn),在所述轉(zhuǎn)化及重構(gòu)單元中,利用壓縮感知理論,解決l1最小化問題,對原始感知數(shù)據(jù)進(jìn)行重構(gòu)。作為本發(fā)明的進(jìn)一步改進(jìn),在所述轉(zhuǎn)化及重構(gòu)單元中,通過貪婪算法解決l1最小化問題,利用有限的測量值對原始感知數(shù)據(jù)進(jìn)行重構(gòu)。作為本發(fā)明的進(jìn)一步改進(jìn),所述貪婪算法采用正交匹配追蹤算法。作為本發(fā)明的進(jìn)一步改進(jìn),在所述采集單元中,傳感器節(jié)點(diǎn)采集具有相關(guān)性的感知數(shù)據(jù)形成數(shù)據(jù)包,并將該數(shù)據(jù)包傳輸給中間節(jié)點(diǎn);所述數(shù)據(jù)包由包頭部分和數(shù)據(jù)部分組成,所述包頭部分由時間標(biāo)記和全局編碼向量構(gòu)成,所述數(shù)據(jù)部分為感知數(shù)據(jù);同一時隙被采集到的數(shù)據(jù)包被認(rèn)為是同一代的包,時間標(biāo)記是一個整數(shù),時間標(biāo)記代表著該數(shù)據(jù)包屬于第幾代;全局編碼向量由N個單精度浮點(diǎn)數(shù)表示,其中N值等于傳感器節(jié)點(diǎn)個數(shù);然后從集合{1,2,…N}中為每個節(jié)點(diǎn)分配ID,如果某個數(shù)據(jù)包由ID為i的源點(diǎn)發(fā)出,全局編碼向量將會被初始化為單位向量,其中只有第i個元素值為1,其余元素均為0。本發(fā)明的有益效果是:由于本發(fā)明在匯聚節(jié)點(diǎn)解碼階段引入了壓縮感知理論,有效解決了“全有或全無”問題。根據(jù)壓縮感知理論,源數(shù)據(jù)的重構(gòu)只需要少量編碼數(shù)據(jù)包,且隨著接收到的編碼數(shù)據(jù)包數(shù)量的逐漸增多,重構(gòu)性能越來越好,匯聚節(jié)點(diǎn)對全貌數(shù)據(jù)的感知是漸進(jìn)型的,避免了“全有或全無”問題。附圖說明圖1是本發(fā)明的中間節(jié)點(diǎn)隨機(jī)網(wǎng)絡(luò)編碼的示意圖。圖2是本發(fā)明的數(shù)據(jù)包格式示意圖。圖3是本發(fā)明的源數(shù)據(jù)包發(fā)出時GCV初始化示意圖。圖4是本發(fā)明的方法流程圖。圖5是本發(fā)明的原理框圖。圖6是鄂霍次克海中的傳感器節(jié)點(diǎn)的大致分布示意圖。圖7是節(jié)點(diǎn)采集數(shù)據(jù)的溫度圖。圖8是隨機(jī)節(jié)點(diǎn)順序下,溫度值讀數(shù)與經(jīng)過離散余弦變換后的形式。圖9是調(diào)整節(jié)點(diǎn)順序后,溫度值讀數(shù)與經(jīng)過離散余弦變換后的形式。圖10是任意有序數(shù)據(jù)在離散余弦變換上展開后的系數(shù)值。圖11是不同大小的G的情況GΨ滿足RIP的概率圖。圖12是傳統(tǒng)網(wǎng)絡(luò)編碼方案與壓縮網(wǎng)絡(luò)編碼方案分別在每一代中匯聚節(jié)點(diǎn)收到的G的秩的值。圖13是傳統(tǒng)網(wǎng)絡(luò)編碼方案與壓縮網(wǎng)絡(luò)編碼方案在重構(gòu)出的數(shù)據(jù)包個數(shù)與數(shù)據(jù)采集效率上的對比圖。具體實(shí)施方式如圖4所示,本發(fā)明公開了一種適合無線分布式感知系統(tǒng)的數(shù)據(jù)處理方法,包括如下步驟:在步驟S1中,傳感器節(jié)點(diǎn)采集具有相關(guān)性的感知數(shù)據(jù);在步驟S2中,中間節(jié)點(diǎn)利用隨機(jī)線性網(wǎng)絡(luò)編碼對感知數(shù)據(jù)進(jìn)行處理;在步驟S3中,傳感器節(jié)點(diǎn)為N個,匯聚節(jié)點(diǎn)為m個,設(shè)源數(shù)據(jù)為x,匯聚節(jié)點(diǎn)接收的數(shù)據(jù)為y,匯聚節(jié)點(diǎn)把接收到的輸入向量進(jìn)行組合,得到線性方程組y=Φx,由于m<N,方程組是欠定的,故將解欠定方程組的問題轉(zhuǎn)化為l1最小化問題,從而重構(gòu)原始感知數(shù)據(jù);在步驟S4中,接收端接收原始感知數(shù)據(jù)。l1最小化問題:如果原始信號x是稀疏的或者是可壓縮的,那么x的恢復(fù)問題可以看作為如下形式的優(yōu)化問題:s.t.y=Φx。由于目標(biāo)函數(shù)是零范數(shù)的,而零范數(shù)是非凸的,所以很難求解。我們可以用一范數(shù)代替零范數(shù),將非凸的問題轉(zhuǎn)化為凸問題的求解。而且已經(jīng)證明,一范數(shù)的最小化即l1最小化亦能使問題得到解決。在所述步驟S3中,利用壓縮感知理論,解決l1最小化問題,對原始感知數(shù)據(jù)進(jìn)行重構(gòu)。作為本發(fā)明的優(yōu)選實(shí)施例,在所述步驟S3中,通過貪婪算法解決l1最小化問題,利用有限的測量值對原始感知數(shù)據(jù)進(jìn)行重構(gòu)。所述貪婪算法采用正交匹配追蹤算法。在所述步驟S1中,傳感器節(jié)點(diǎn)采集具有相關(guān)性的感知數(shù)據(jù)形成數(shù)據(jù)包,并將該數(shù)據(jù)包傳輸給中間節(jié)點(diǎn);所述數(shù)據(jù)包由包頭部分和數(shù)據(jù)部分組成,所述包頭部分由時間標(biāo)記和全局編碼向量構(gòu)成,所述數(shù)據(jù)部分為感知數(shù)據(jù);同一時隙被采集到的數(shù)據(jù)包被認(rèn)為是同一代的包,時間標(biāo)記是一個整數(shù),時間標(biāo)記代表著該數(shù)據(jù)包屬于第幾代;全局編碼向量由N個單精度浮點(diǎn)數(shù)表示,其中N值等于傳感器節(jié)點(diǎn)個數(shù);然后從集合{1,2,…N}中為每個節(jié)點(diǎn)分配ID,如果某個數(shù)據(jù)包由ID為i的源點(diǎn)發(fā)出,全局編碼向量將會被初始化為單位向量,其中只有第i個元素值為1,其余元素均為0。本發(fā)明還公開了一種適合無線分布式感知系統(tǒng)的數(shù)據(jù)處理系統(tǒng),包括:采集單元,用于傳感器節(jié)點(diǎn)采集具有相關(guān)性的感知數(shù)據(jù);處理單元,用于中間節(jié)點(diǎn)利用隨機(jī)線性網(wǎng)絡(luò)編碼對感知數(shù)據(jù)進(jìn)行處理;轉(zhuǎn)化及重構(gòu)單元,用于將解欠定方程組的問題轉(zhuǎn)化為l1最小化問題,傳感器節(jié)點(diǎn)為N個,匯聚節(jié)點(diǎn)為m個,設(shè)源數(shù)據(jù)為x,匯聚節(jié)點(diǎn)接收的數(shù)據(jù)為y,匯聚節(jié)點(diǎn)把接收到的輸入向量進(jìn)行組合,得到線性方程組y=Φx,由于m<N,方程組是欠定的,從而重構(gòu)原始感知數(shù)據(jù);接收單元,用于接收端接收原始感知數(shù)據(jù)。在所述轉(zhuǎn)化及重構(gòu)單元中,利用壓縮感知理論,解決l1最小化問題,對原始感知數(shù)據(jù)進(jìn)行重構(gòu)。在所述轉(zhuǎn)化及重構(gòu)單元中,通過貪婪算法解決l1最小化問題,利用有限的測量值對原始感知數(shù)據(jù)進(jìn)行重構(gòu)。所述貪婪算法采用正交匹配追蹤算法。在所述采集單元中,傳感器節(jié)點(diǎn)采集具有相關(guān)性的感知數(shù)據(jù)形成數(shù)據(jù)包,并將該數(shù)據(jù)包傳輸給中間節(jié)點(diǎn);所述數(shù)據(jù)包由包頭部分和數(shù)據(jù)部分組成,所述包頭部分由時間標(biāo)記和全局編碼向量構(gòu)成,所述數(shù)據(jù)部分為感知數(shù)據(jù);同一時隙被采集到的數(shù)據(jù)包被認(rèn)為是同一代的包,時間標(biāo)記是一個整數(shù),時間標(biāo)記代表著該數(shù)據(jù)包屬于第幾代;全局編碼向量由N個單精度浮點(diǎn)數(shù)表示,其中N值等于傳感器節(jié)點(diǎn)個數(shù);然后從集合{1,2,…N}中為每個節(jié)點(diǎn)分配ID,如果某個數(shù)據(jù)包由ID為i的源點(diǎn)發(fā)出,全局編碼向量將會被初始化為單位向量,其中只有第i個元素值為1,其余元素均為0。本發(fā)明要解決的技術(shù)問題首先是網(wǎng)絡(luò)編碼策略中匯聚節(jié)點(diǎn)解碼的“全有或全無”(All-or-Nothing)問題:即如果信源發(fā)出N個原始數(shù)據(jù)包,為了重構(gòu)原始數(shù)據(jù),目的節(jié)點(diǎn)必須收到至少N個線性獨(dú)立的數(shù)據(jù)包。如果收到的數(shù)據(jù)少于N個,那么幾乎無法重構(gòu)任何原始數(shù)據(jù)。該問題會導(dǎo)致嚴(yán)重的丟包問題,從而影響整個網(wǎng)絡(luò)的吞吐量,極大地限制了無線分布式感知系統(tǒng)的應(yīng)用空間。此外,現(xiàn)有技術(shù)對無線分布式感知系統(tǒng)的另一特性挖掘利用不足:感知數(shù)據(jù)往往存在內(nèi)在相關(guān)性。這種內(nèi)在相關(guān)性決定了可以對分布式感知數(shù)據(jù)實(shí)施壓縮以進(jìn)一步提高傳輸效率、節(jié)省能源。本發(fā)明就是利用隨機(jī)線性網(wǎng)絡(luò)編碼與壓縮感知之間的天然契合性(由于隨機(jī)線性網(wǎng)絡(luò)編碼方案中的編碼操作與壓縮感知中的隨機(jī)投影操作是相似的),提出以網(wǎng)絡(luò)編碼為手段來實(shí)現(xiàn)對分布式感知數(shù)據(jù)的壓縮測量與重構(gòu)。從而解決了“全有或全無”與分布式壓縮問題,并保留了網(wǎng)絡(luò)編碼策略原有的優(yōu)點(diǎn)。在步驟S2中(技術(shù)特征1),節(jié)點(diǎn)將接收到的數(shù)據(jù)包利用通過隨機(jī)方法選擇的系數(shù)進(jìn)行隨機(jī)線性組合,再將它傳輸出去。參照圖1,假設(shè)源與接收端均為2個的情況下,其中x1與x2為源數(shù)據(jù),ξi是從有限域中隨機(jī)選取的系數(shù),每條邊上箭頭標(biāo)示的是在該條邊上傳輸?shù)奶幚斫Y(jié)果。我們假設(shè)源的個數(shù)為N,接收端的個數(shù)為m,源數(shù)據(jù)包的長度為L,向量表示形式為xi=[xi1,xi2,…xiL],那么網(wǎng)絡(luò)中任意一條邊e上傳輸?shù)男蛄衴(e)則可以表示為線性組合的形式y(tǒng)(e)=g(e)·[x1T,x2T…xNT]T。其中向量g(e)=[g1,g2…gN]即為邊e上的全局編碼向量(GCV)。矩陣形式見下式:在一個或多個時步之后,根據(jù)傳統(tǒng)網(wǎng)絡(luò)編碼方案,只要矩陣G的秩為N,那么源數(shù)據(jù)都可以由任意匯聚節(jié)點(diǎn)在同一時間點(diǎn)由輸入邊接收到的符號序列重構(gòu)出來。中間節(jié)點(diǎn)利用隨機(jī)線性網(wǎng)絡(luò)編碼對感知數(shù)據(jù)進(jìn)行處理的步驟如下:1.如圖1所示,兩個源X1與X2發(fā)送數(shù)據(jù);2.到達(dá)下一個節(jié)點(diǎn)后,將X1與X2乘以隨機(jī)系數(shù)后相加,即將X1與X2進(jìn)行隨機(jī)線性組合后整合為一個數(shù)據(jù)再次發(fā)送出去;3.到達(dá)下一級節(jié)點(diǎn)后,將上一級整合后的數(shù)據(jù)作為接收到的數(shù)據(jù)再次進(jìn)行隨機(jī)線性組合,即重復(fù)2的過程,之后再將再次組合的一個數(shù)據(jù)發(fā)送出去;4.重復(fù)以上步驟,直至發(fā)送到匯聚節(jié)點(diǎn)為止。本發(fā)明的數(shù)據(jù)包格式(技術(shù)特征2):參照圖2,它不需要任何集中式的圖形結(jié)構(gòu)或是集中式的編碼、解碼函數(shù)。包頭區(qū)域由兩個部分組成:時間標(biāo)記與全局編碼向量。在實(shí)際的網(wǎng)絡(luò)中,不同節(jié)點(diǎn)并不會同時接收或傳輸數(shù)據(jù)包,而是可能按順序接收包含不可合并部分的多個數(shù)據(jù)包。不同路徑上有重疊部分的數(shù)據(jù)包也通常會受限于損耗、障礙、多徑時延或是其他由于路徑?jīng)_突帶來的變化。在本技術(shù)(發(fā)明)中,所有含可合并數(shù)據(jù)的包(也就是同一時隙被采集到的數(shù)據(jù)包)被認(rèn)為是同一代的包。時間標(biāo)記是一個整數(shù),代表著該數(shù)據(jù)包屬于第幾代。全局編碼向量由N個單精度浮點(diǎn)數(shù)表示,其中N值等于該無線傳感器網(wǎng)絡(luò)中的節(jié)點(diǎn)個數(shù)。然后從集合{1,2,…N}中為每個節(jié)點(diǎn)分配ID。參照圖3,如果某個數(shù)據(jù)包由ID為i的源點(diǎn)發(fā)出,全局編碼向量將會被初始化為單位向量,其中只有第i個元素值為1,其余元素均為0,。根據(jù)所述理論,如果收到的包的全局編碼向量中有非零元素,那么ID與非零元素相對應(yīng)的源點(diǎn)的信息就包含在這個包中。步驟S3中(技術(shù)特征3),WSN中的任意信號都可以看成是一個實(shí)值、有限、一維、離散的向量,實(shí)域中大小為N×1的列向量可表示為x=[x1,x2,…,xN]T。實(shí)域中的任意信號x可以按照標(biāo)準(zhǔn)正交基展開,由N×1的向量ψj表示,ψj=[ψj1,ψj2,…,ψjN]T,j=1,2,…,N。利用ψj作為列向量的N×N的基矩陣Ψ=[ψ1|ψ2|…|ψN],信號x的表達(dá)式見下式:orx=Ψs,式中s=[s1,s2,…,sN]T。由上述可知,信號既能用x表示,也能用s表示。x是在時間或空間域上,s則是在Ψ域上。如果信號x是由K個基向量線性組合而成,那么x就是K項(xiàng)稀疏的。也就是說,在上式中的系數(shù)si僅有K個是非零的。一個特殊情況是當(dāng)K<<N時,只有s中值較大的系數(shù)占很少的比例時,信號x才是可壓縮的。我們考慮一個欠定的方程組y=Φx,其中Φ是大小為m×N的隨機(jī)投影矩陣(m<N),x是K項(xiàng)稀疏的或是在Ψ域上可壓縮的。那么該方程組可改寫成y=Φx=ΦΨs。根據(jù)壓縮感知中的結(jié)論,如果積矩陣ΦΨ滿足RIP性質(zhì)——對所有s,||s||0≤K,則存在一個δ2k∈(0,1),使得——那么x能否有效重構(gòu)的問題就轉(zhuǎn)化為一個l1最小化問題:s.t.y=Φx,x=Ψs。再考慮到技術(shù)特征1提到的隨機(jī)線性網(wǎng)絡(luò)編碼系統(tǒng),全局編碼向量矩陣G是隨機(jī)生成的,并且[x1jx2j…xNj]T是可壓縮的。在構(gòu)造一個合適的G并找到感知數(shù)據(jù)的稀疏特性的條件下,甚至當(dāng)G非滿秩時,我們也能夠通過解決l1最小化問題來重構(gòu)源數(shù)據(jù)。在步驟S3中(技術(shù)特征4),l1最小化已證明可以用于精確重構(gòu),并且存在一個高效、精確的處理方式解決上文提及的凸優(yōu)化問題。貪婪算法依靠的是對信號稀疏系數(shù)和支撐集的迭代估計,一種方式是在到達(dá)收斂規(guī)則前對信號的支撐集進(jìn)行迭代識別,還有一種是在每次試圖解釋測量值失配的迭代中得到稀疏信號的改進(jìn)估計。正交匹配追蹤算法(OMP)是最為簡單和普遍的貪婪算法之一,它在積矩陣ΦΨ中找到與測量值相關(guān)性最強(qiáng)的一列,然后將各列與信號的殘差相關(guān),再重復(fù)這一步。這里的殘差,即是從原始測量向量中減去部分估計信號的貢獻(xiàn)得到的。如果測量矩陣滿足RIP性質(zhì),對于K項(xiàng)稀疏的信號x與無噪聲的測量值y,OMP至少能保證在K次迭代之后精確還原出x。在技術(shù)特征4中,通過通過貪婪算法解決l1最小化問題的方法:(算法1(正交匹配追蹤算法)輸入:CS測量值y,測量矩陣Θ=ΦΨ={θi,i=1,2,...,N},其中Φ∈R,Ψ∈R。初始化:索引殘差r=y,稀疏表達(dá)式s=0∈RN。迭代:輸出:稀疏表達(dá)式s,與源數(shù)據(jù)x=Ψs本地編碼向量(LCV)的選擇(技術(shù)特征5):根據(jù)2005年Jaggi等人在論文《PolynomialTimeAlgorithmsforMulticastNetworkCodeConstruction》中提到的,如果本地編碼向量是隨機(jī)生成的并處于一個足夠大的有限域中,那么如同信號一樣,任意匯聚節(jié)點(diǎn)收到的全局編碼矩陣G都是高概率滿秩的。但是,在一個有限域中,保證感知信號可以被稀疏表示并且GΨ滿足壓縮感知理論的RIP性質(zhì)的前提下,找到一個合適的基Ψ是比較困難的。這里選擇Rademacher分布在實(shí)域上的隨機(jī)變量來構(gòu)造本地編碼向量,見下式:式中mi(e)為邊e的LCV的第i個元素的值。我們知道,在多次的乘法操作之后,匯聚節(jié)點(diǎn)收到的全局編碼矩陣G將變成正態(tài)分布。在合適的場景下,例如海洋氣候傳感器網(wǎng)絡(luò)中,空間相關(guān)的測量值在經(jīng)過適當(dāng)組合與離散余弦變換后是可壓縮的。本技術(shù)(發(fā)明)的實(shí)施方式中的論證證明了,在上述場景下,GΨ(正態(tài)分布隨機(jī)矩陣與離散余弦變換)有十分好的RIP特性。本技術(shù)(發(fā)明)與傳統(tǒng)方法相比具有如下優(yōu)點(diǎn):1、由于本發(fā)明在中間節(jié)點(diǎn)編碼階段利用了網(wǎng)絡(luò)編碼技術(shù),有效提升了無線傳感器網(wǎng)絡(luò)中的感知數(shù)據(jù)的傳輸效率。由技術(shù)特征1帶來的,中間節(jié)點(diǎn)利用的隨機(jī)線性網(wǎng)絡(luò)編碼雖然簡單,但卻是一個強(qiáng)大的編碼方案。在廣播傳輸方案中,它利用非集中式的算法可以將網(wǎng)絡(luò)吞吐量達(dá)到最佳值。在傳統(tǒng)的WSN場景下,集中式的網(wǎng)絡(luò)管理和控制十分復(fù)雜,隨機(jī)線性網(wǎng)絡(luò)編碼能夠有效地使每個節(jié)點(diǎn)以非集中的方式工作并達(dá)到最優(yōu)性能。因此,不必需要知道所有的網(wǎng)絡(luò)配置,就可以使網(wǎng)絡(luò)節(jié)點(diǎn)分布式工作。2、由于本發(fā)明給出了可行的改進(jìn)的數(shù)據(jù)包格式,有效利用了無線傳感器網(wǎng)絡(luò)中信號的相關(guān)性。由技術(shù)特征2帶來的,在有益效果1的基礎(chǔ)上進(jìn)一步改善了數(shù)據(jù)傳輸?shù)挠行浴?、由于本發(fā)明在匯聚節(jié)點(diǎn)解碼階段引入了壓縮感知理論,有效解決了“全有或全無”問題。由技術(shù)特征3、4帶來的,根據(jù)壓縮感知理論,源數(shù)據(jù)的重構(gòu)只需要少量編碼數(shù)據(jù)包,且隨著接收到的編碼數(shù)據(jù)包數(shù)量的逐漸增多,重構(gòu)性能越來越好,匯聚節(jié)點(diǎn)對全貌數(shù)據(jù)的感知是漸進(jìn)型的,避免了“全有或全無”問題。技術(shù)特征5則是保證該有益效果可行的理論基礎(chǔ)。參照圖4,本發(fā)明首先需要采集有相關(guān)性的感知數(shù)據(jù)。我們利用美國國家海洋數(shù)據(jù)中心的數(shù)據(jù)進(jìn)行數(shù)值實(shí)驗(yàn),數(shù)據(jù)來自分布在鄂霍次克海中的傳感器測量值,圖6描述了傳感器節(jié)點(diǎn)的大致分布,每個傳感器節(jié)點(diǎn)采集到的數(shù)據(jù)如圖7所示。參照圖5,為了評估感知數(shù)據(jù)的相關(guān)性與壓縮性能,選擇同一時間鄂霍次克海中分布節(jié)點(diǎn)的感知的一系列溫度數(shù)據(jù)。首先按照隨機(jī)順序從節(jié)點(diǎn)中讀取數(shù)據(jù),圖8中顯示的是它們的讀數(shù)與經(jīng)過離散余弦變換后的形式。可以發(fā)現(xiàn)相對較大的系數(shù)占絕大多數(shù)。然后,經(jīng)過若干次測試,再選擇一個更加合適的節(jié)點(diǎn)排列并將節(jié)點(diǎn)按照此順序編號。之后按順序收集所有節(jié)點(diǎn)的數(shù)據(jù),在某時間點(diǎn)它們的讀數(shù)與離散余弦變換后的表達(dá)式如圖9所示。最后,按照上述順序讀取數(shù)據(jù),我們測試了2012年鄂霍次克海的所有溫度數(shù)據(jù),如圖10所示,任意有序數(shù)據(jù)在離散余弦變換上的展開式只有13至16個系數(shù)不接近0。然后考慮由GCV矩陣和DCT矩陣組成的測量矩陣(GΨ)的RIP性質(zhì)。在本發(fā)明中,待處理信號x的長度為N=118,它在離散余弦變換上的線性組合有K=13~16個系數(shù)不接近零,所以匯聚節(jié)點(diǎn)隨機(jī)接收的GCV矩陣的大小為m×118,m=30,45,60,75。根據(jù)公式我們研究不同m下的δ。圖11表明了當(dāng)匯聚節(jié)點(diǎn)收到的G的秩達(dá)到75時,測量矩陣會以高概率滿足RIP性質(zhì),即信號x能夠以高概率精確重構(gòu)。為了簡單而不失普遍性,我們在118個節(jié)點(diǎn)中會隨機(jī)選取一個作為匯聚節(jié)點(diǎn)。每次試驗(yàn)發(fā)送500代數(shù)據(jù)包,圖12顯示的是每一代中匯聚節(jié)點(diǎn)收到的GCV矩陣的秩。在利用有限域元素作為本地編碼向量的傳統(tǒng)網(wǎng)絡(luò)編碼方案中,匯聚節(jié)點(diǎn)以83.5的概率收到滿秩的GCV矩陣。而在利用Rademacher分布隨機(jī)系數(shù)作為本地編碼向量的壓縮網(wǎng)絡(luò)編碼方案中,每一代匯聚節(jié)點(diǎn)收到GCV矩陣幾乎都是非滿秩,但是所有秩的值都大于75,大致在85-110范圍內(nèi)。圖13A展示的是兩種方案以代為自變量精確重構(gòu)出的數(shù)據(jù)包個數(shù)。經(jīng)過對兩種方案數(shù)據(jù)采集效率比率的計算發(fā)現(xiàn),本技術(shù)(發(fā)明)的效率比傳統(tǒng)網(wǎng)絡(luò)編碼方案高出20%~35%,比較結(jié)果如圖13B所示。WSN即WirelessSensorNetwork的縮寫,中文含義為無線傳感器網(wǎng)絡(luò)。壓縮感知:WSN中的任意信號都可以看成是一個實(shí)值、有限、一維、離散的向量,實(shí)域中大小為N×1的列向量可表示為x=[x1,x2,…,xN]T。實(shí)域中的任意信號x可以按照標(biāo)準(zhǔn)正交基展開,由N×1的向量ψj表示,ψj=[ψj1,ψj2,…,ψjN]T,j=1,2,…,N。利用ψj作為列向量的N×N的基矩陣Ψ=[ψ1|ψ2|…|ψN],信號x的表達(dá)式見下式:orx=Ψs(2)其中s=[s1,s2,…,sN]T。由上述可知,信號既能用x表示,也能用s表示。x是在時間或空間域上,s則是在Ψ域上。如果信號x是由K個基向量線性組合而成,那么x就是K項(xiàng)稀疏的。也就是說,在式(2)中的系數(shù)si僅有K個是非零的。一個特殊情況是當(dāng)K<<N時,只有s中值較大的系數(shù)占很少的比例時,信號x才是可壓縮的??紤]一個欠定的方程組:y=Φx(3)其中Φ是大小為m×N的隨機(jī)投影矩陣(m<N),x是K項(xiàng)稀疏的或是在Ψ域上可壓縮的。那么該方程組可改寫成:y=Φx=ΦΨs(4)根據(jù)壓縮感知中的結(jié)論,如果積矩陣Θ=ΦΨ滿足RIP性質(zhì):對任意K=1,2,…,定義矩陣Θ的等距常量δK為滿足下式的最小值,其中s滿足||s||0≤K:如果δK<1,稱矩陣Θ滿足K階RIP;那么x能否有效重構(gòu)的問題就轉(zhuǎn)化為一個l1最小化問題:s.t.y=Φx,x=Ψs(6)由隨機(jī)線性網(wǎng)絡(luò)編碼可知,全局編碼向量矩陣G是隨機(jī)生成的,并且向量[β1jβ2j…βNj]T是可壓縮的。在生成一個合適的G并且感知數(shù)據(jù)滿足稀疏特性的條件下,甚至當(dāng)G非滿秩時,我們也能夠通過解決l1最小化問題來重構(gòu)源數(shù)據(jù)。壓縮采樣信號的重建問題存在多種求解方案,包括基追蹤(BasisPursuit,BP)、貪婪算法等?;粉櫨哂休^好的重建性能,但是運(yùn)算量較大。貪婪算法將重建問題看作過完備字典的信號稀疏分解問題求解,其經(jīng)典算法如匹配追蹤算法、正交匹配追蹤(OrthogonalMatchingPursuit,OMP)算法等。正交匹配追蹤算法(OMP)是最為簡單和普遍的貪婪算法之一,它在ΦΨ中找到與測量值相關(guān)性最強(qiáng)的一列,然后將各列與信號的殘差相關(guān),再重復(fù)這一步[18]。這里的殘差,即是從原始測量向量中減去部分估計信號的貢獻(xiàn)得到的。如果測量矩陣滿足RIP性質(zhì),對于K項(xiàng)稀疏的信號x與無噪聲的測量值y,OMP至少能保證在K次迭代之后精確還原出x。該算法正式的定義如下:算法1(正交匹配追蹤算法)輸入:CS測量值y,測量矩陣Θ=ΦΨ={θi,i=1,2,...,N},其中Φ∈R,Ψ∈R。初始化:索引殘差r=y,稀疏表達(dá)式s=0∈RN。迭代:輸出:稀疏表達(dá)式s,與源數(shù)據(jù)x=Ψs。以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對本發(fā)明所作的進(jìn)一步詳細(xì)說明,不能認(rèn)定本發(fā)明的具體實(shí)施只局限于這些說明。對于本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干簡單推演或替換,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。