專利名稱:多源異類無人機偵察圖像通用壓縮方法
技術(shù)領(lǐng)域:
本發(fā)明屬于數(shù)字視頻圖像處理技術(shù)領(lǐng)域,具體涉及一種多源異類無人機偵察圖像的通用壓縮方法。
背景技術(shù):
無人機的偵察圖像視頻數(shù)據(jù)存在大量冗余,這些冗余包括時域冗余、空域冗余、譜間冗余、統(tǒng)計冗余以及心理視覺冗余,為了便于數(shù)據(jù)的存儲與傳輸,必須消除上述冗余而對其進(jìn)行壓縮。在無人機系統(tǒng)中實時傳輸?shù)臄?shù)碼相機取代了膠片航空偵察相機,高清晰度數(shù)字電視取代標(biāo)準(zhǔn)制式電視,前視紅外儀,多光譜、高光譜圖像,及高分辨率、遠(yuǎn)距離、多模式的合成孔徑雷達(dá)(SAR)都在無人機平臺上紛紛應(yīng)用,所以來源于無人機偵察的圖像數(shù)據(jù)趨向于多源化,如SAR圖像、高光譜圖像和視頻等。由于無人機飛行高度較高,速度快,機載傳感器視場角較大,所以無人機偵察圖像中所感興趣的偵察目標(biāo)(如軍車、坦克等)像素少,幀內(nèi)相關(guān)性較普通圖像差,幀間相關(guān)性即時間相關(guān)性也不強,普通的壓縮算法往往將這些偵察目標(biāo)都壓縮掉了或嚴(yán)重變形,所以需要找到一種適合于無人機偵察圖像特點的壓縮算法。目前應(yīng)用較多而且壓縮效果較顯著的方法是的基于H.264 (動態(tài))和JPEG2000標(biāo)準(zhǔn)(靜態(tài))的壓縮方法。H.264編碼的基本思想是:將每幀圖像進(jìn)行16X 16個像素點的宏塊劃分,以各塊運動矢量代表圖像序列各幀的運動內(nèi)容,根據(jù)幀的類型(I幀、P幀或B幀)選擇幀內(nèi)編碼或幀間編碼模式,使用前面已編碼幀或參考幀對后續(xù)幀進(jìn)行運動估計和補償生成預(yù)測宏塊,預(yù)測宏塊P和當(dāng)前宏塊相減,得到圖像殘差塊,然后經(jīng)過整數(shù)DCT變換、量化、重排序、熵編碼等部分的處理,完成編碼過程。JPEG2000編碼的基本思想是:先對源圖像數(shù)據(jù)進(jìn)行前期預(yù)處理,再對處理后的圖像進(jìn)行離散小波變換(DWT),然后對變換后的小波系數(shù)進(jìn)行量化、位平面編碼、分層裝配和打包,最后形成JPEG2000標(biāo)準(zhǔn)的輸出碼流。在國內(nèi),針對多源異類數(shù)據(jù)源的壓縮工作以分立系統(tǒng)為主,如進(jìn)行視頻壓縮采用專門的視頻壓縮模塊,進(jìn)行SAR雷達(dá)壓縮采用專門的壓縮模塊,進(jìn)行高光譜圖像壓縮采用另一種專用模塊。關(guān)于無人機圖像壓縮的綜合處理工作,從目前掌握的文獻(xiàn)看來,依然寥寥無幾,從綜合處理層面的關(guān)注還十分欠缺,缺乏一種系統(tǒng)級的解決方案。對于多源異類的無人機偵察圖像,其圖像壓縮模塊在算法、數(shù)據(jù)接口適配等方面均無法兼容。在圖像壓縮方面,無人機偵察圖像數(shù)據(jù)既有單幀的靜止圖像又有多幀的視頻圖像,而JPEG2000只能壓縮靜態(tài)圖像,H.264壓縮標(biāo)準(zhǔn)使用DCT變換時恢復(fù)圖像有明顯的塊效應(yīng);而且無人機圖像中所感興趣的偵察目標(biāo)(如軍車、坦克等)像素少,幀內(nèi)相關(guān)性較普通圖像差,幀間相關(guān)性即時間相關(guān)性也不強,H.264標(biāo)準(zhǔn)中也沒有專門針對這類圖像有效的幀內(nèi)預(yù)測方法。
發(fā)明內(nèi)容
本發(fā)明的目的是為了解決上述問題,圍繞無人機偵察視頻、SAR圖像、高光譜圖像特點,提出了多源異類無人機偵察圖像通用壓縮方法,整合H.264和JPEG2000壓縮標(biāo)準(zhǔn),將無人機偵察視頻、SAR圖像和高光譜圖像三類圖像的壓縮融合到一個綜合壓縮處理系統(tǒng)中。一種多源異類無人機偵察圖像通用壓縮方法,包括以下幾個步驟:第一步,建立無人機異類圖像壓縮接口的適配方法;具體包括:(I)建立不同數(shù)據(jù)源接口 ;數(shù)據(jù)源包括SAR圖像、高光譜圖像和視頻信息,利用高速總線接口作為SAR圖像、高光譜圖像的接口,利用數(shù)字采集作為視頻信息的接口,通過兩種接口,分別采集SAR圖像、高光譜圖像、視頻信息;(2)建立異類數(shù)據(jù)的映射模型;建立映射模型,使數(shù)據(jù)源到數(shù)據(jù)目標(biāo)的屬性對應(yīng),標(biāo)記SAR圖像為00,高光譜圖像為01,視頻數(shù)據(jù)為10,若結(jié)果中出現(xiàn)11則判定為出錯;(3)格式轉(zhuǎn)換將數(shù)據(jù)源中的單幀或者多幀的視頻圖像都轉(zhuǎn)換為yuv數(shù)據(jù)格式;第二步,對H.264編碼方法進(jìn)行了改進(jìn),建立無人機多源圖像通用性壓縮方法;具體包括:(I)宏塊劃分;將yuv數(shù)據(jù)格式的數(shù)據(jù)源視頻圖像中每一幀視頻圖像分成16x16像素大小的宏塊;(2)根據(jù)不同類別圖像視頻信息,分別進(jìn)行預(yù)測編碼;如果是多幀動態(tài)視頻,采用幀間預(yù)測和幀內(nèi)預(yù)測編碼;如果是單幀的SAR圖像或者高光譜圖像,采用幀內(nèi)預(yù)測編碼,得到當(dāng)前宏塊的預(yù)測值;(3)將經(jīng)過步驟(2)得到的宏塊預(yù)測值與原宏塊相減,得到圖像殘差塊;(4)對圖像殘差塊進(jìn)行離散小波變換;(5)熵編碼利用H.264/AVC標(biāo)準(zhǔn)中的熵編碼對控制信息以及量化后的殘差數(shù)據(jù)、運動矢量信息進(jìn)行數(shù)據(jù)壓縮,在完成熵編碼后,得到壓縮圖像的壓縮碼流,經(jīng)網(wǎng)絡(luò)自適應(yīng)層供傳輸和存儲用。本發(fā)明的優(yōu)點在于:(I)米用統(tǒng)一接口適配技術(shù),多輸入多輸出,方案系統(tǒng);(2)針對性強,在處理過程中較好的契合了無人機圖像特點;(3)消除了壓縮圖像恢復(fù)時的塊效應(yīng)。
圖1是本發(fā)明的方法流程圖;圖2是本發(fā)明的第二步的流程圖;圖3是本發(fā)明中Planar預(yù)測過程示意圖;圖4是本發(fā)明中9/7小波提升算法結(jié)構(gòu)具體實施例方式下面將結(jié)合附圖對本發(fā)明的具體實施方式
進(jìn)行詳細(xì)說明。本發(fā)明的一種多源異類無人機偵察圖像通用壓縮方法,流程如圖1所示,包括以下幾個步驟:第一步,建立無人機異類圖像壓縮接口的適配方法。H.264視頻壓縮編碼標(biāo)準(zhǔn)只能針對本身特定格式的信息進(jìn)行壓縮,而無人機采集到的圖像視頻信息有多種格式,如多幀視頻信息、高光譜圖像、SAR圖像等,通過適配方法,實現(xiàn)對多種異構(gòu)數(shù)據(jù)源的適配、集成和處理,為將多種信息格式區(qū)分轉(zhuǎn)換得到便于H.264標(biāo)準(zhǔn)壓縮的格式。本發(fā)明的壓縮接口的適配方法具體包括:(I)建立不同數(shù)據(jù)源接口 ;數(shù)據(jù)源包括SAR圖像、高光譜圖像和視頻信息,其擁有不同的接入讀取方式,利用高速總線接口(例如,同步422通訊板)作為SAR圖像、高光譜圖像的接口,利用數(shù)字采集作為視頻信息的接口,通過兩種接口,分別采集SAR圖像、高光譜圖像、視頻信息;( 2 )建立異類數(shù)據(jù)的映射模型;壓縮前后必須明確不同數(shù)據(jù)信息的種類,使得在解壓縮之后圖像的特征也能方便識別。由于解壓縮數(shù)據(jù)的輸出均為yuv格式,這就需要在數(shù)據(jù)列與其屬性信息之間建立一個映射關(guān)系,建立異類數(shù)據(jù)的映射模型;建立映射模型,使數(shù)據(jù)源到數(shù)據(jù)目標(biāo)的屬性對應(yīng),便于解壓之后圖像的識別,標(biāo)記SAR圖像為00,高光譜圖像為01,視頻數(shù)據(jù)為10,若結(jié)果中出現(xiàn)11則判定為出錯。(3)格式轉(zhuǎn)換因為后續(xù)采用H.264視頻編碼的壓縮標(biāo)準(zhǔn),所以,將數(shù)據(jù)源中的單幀或者多幀的視頻圖像都轉(zhuǎn)換為yuv數(shù)據(jù)格式。第二步,綜合現(xiàn)有壓縮編碼方法與標(biāo)準(zhǔn),對H.264編碼方法進(jìn)行了改進(jìn),建立無人機多源圖像通用性壓縮方法,流程如圖2所示,具體包括:(I)宏塊劃分;H.264中引入的幀內(nèi)預(yù)測模式,考慮了單幅視頻圖像中規(guī)則物體和規(guī)則背景的空間冗余,提出了基于兩種塊大小4x4和16x16的幀內(nèi)預(yù)測方法,其中基于16x16塊的幀內(nèi)預(yù)測尤其對平坦區(qū)域有效,而且由于無人機飛行高度較高,速度快,機載傳感器視場角較大,所以無人機偵察圖像中所感興趣的目標(biāo)像素少,幀內(nèi)相關(guān)性較普通圖像差,幀間相關(guān)性即時間相關(guān)性也不強,因此根據(jù)控制參數(shù)信息,首先,將yuv數(shù)據(jù)格式的數(shù)據(jù)源視頻圖像中每一幀視頻圖像分成16x16像素大小的宏塊。(2)根據(jù)不同類別圖像視頻信息,分別進(jìn)行預(yù)測編碼;根據(jù)H.264標(biāo)準(zhǔn)壓縮方法,根據(jù)當(dāng)前輸入宏塊中當(dāng)前幀的類型,分別進(jìn)行預(yù)測編碼:如果是多幀動態(tài)視頻,采用幀間預(yù)測和幀內(nèi)預(yù)測編碼;如果是單幀的SAR圖像或者高光譜圖像,采用幀內(nèi)預(yù)測編碼,得到當(dāng)前宏塊的預(yù)測值。由于無人機飛行高度較高,速度快,機載傳感器視場角較大,所以無人機偵察圖像中所感興趣的目標(biāo)像素少,幀內(nèi)相關(guān)性較普通圖像差,幀間相關(guān)性即時間相關(guān)性也不強,所以對于幀內(nèi)預(yù)測編碼可采用適合處理紋理比較平滑區(qū)域的HEVC (高效視頻編碼)幀內(nèi)planar (平面)預(yù)測,它允許變換塊的大小根據(jù)幀內(nèi)預(yù)測殘差的特性進(jìn)行自適應(yīng)的調(diào)整。大塊的變換相對于小塊的變換,一方面能夠提供更好的能量集中效果,并能在量化后保存更多的圖像細(xì)節(jié),但是另一方面在量化后卻會帶來更多的振鈴效應(yīng)。因此,根據(jù)當(dāng)前塊信號的特性,自適應(yīng)的選擇變換塊大小,可以得到能量集中、細(xì)節(jié)保留程度以及圖像的振鈴效應(yīng)三者最優(yōu)的折中。Planar預(yù)測模式適合紋理比較平滑的區(qū)域,對當(dāng)前塊中每個像素使用不同的預(yù)測值。例如,如圖3所示為planar預(yù)測過程。對當(dāng)前宏塊中的每一個像素,都使用水平和垂直兩個方向的線性插值的平均作為當(dāng)前像素的預(yù)測值。用下列公式表示,即:P (X,y) = ((S-χ).P (O, y)+X.P (O, S) + (S-y).P (x,O)+y.P (S,O)+S)/2S其中:P(x,y)表示當(dāng)前要預(yù)測的像素,P (O, y)表示當(dāng)前宏塊左邊與當(dāng)前要預(yù)測像素同一行的參考像素,Ρ(χ,Ο)表示當(dāng)前宏塊上方與當(dāng)前要預(yù)測像素同一列的參考像素,P (O, S)表示圖3中標(biāo)記為“Τ”的像素,P (S,O)表示圖3中標(biāo)記為“L”的像素,S表示當(dāng)前預(yù)測單元的寬度,x、y代表了當(dāng)前要預(yù)測像素的位置。T、L均是指圖像中最小組成單元,也就是圖像的最小圖像單元。從公式中可以看出,經(jīng)Planar模式預(yù)測后的預(yù)測像素將呈現(xiàn)出從左上方到右下方漸變的趨勢。幀間預(yù)測采用原H.264標(biāo)準(zhǔn)壓縮方法的幀間預(yù)測方法。(3)將經(jīng)過步驟(2)得到的宏塊預(yù)測值與原宏塊相減,得到圖像殘差塊。(4)對圖像殘差塊進(jìn)行DWT (離散小波)變換與量化。變換編碼和量化技術(shù)來消除圖像信號中的頻域相關(guān)性和減小圖像編碼的動態(tài)范圍,從而達(dá)到進(jìn)一步壓縮的目的。雖然DCT變換計算簡單,有快速實現(xiàn)方法,但在壓縮時恢復(fù)圖像有明顯的塊效應(yīng);而小波變換具有更好的能量集中性,壓縮比高,壓縮速度快,壓縮后能保持圖像的特征基本不變,在傳遞過程中可以抗干擾,且同時具有視頻局部化特性,變換后系數(shù)的特征有利于編碼,因此小波變換的編碼方法具有更好的壓縮性能。所以通過對H.264視頻編碼標(biāo)準(zhǔn)進(jìn)行改進(jìn),對圖像殘差塊采用DWT變換。小波變換有極好的能量聚集作用,但在實現(xiàn)時需要作卷積,因此復(fù)雜性較高。而提升模型的引入,使得小波變換時的卷積操作可以通過提升和拉伸步驟完成,進(jìn)一步降低小波變換的運算,它具有如下優(yōu)點:I)、本位操作、節(jié)省內(nèi)存;2)、利用復(fù)合賦值,減少浮點運算量,速度快、效率高;3)、一個上升步驟中的所有操作是并行的,而多個上升步驟之間是串行的;4)、逆變換過程極其簡單;經(jīng)過大量的對比實驗,對圖像實現(xiàn)能量聚集效果最好的是9/7小波基,其低頻濾波器為9抽頭,而高頻濾波器則為7抽頭。其提升方式完成的公式如下:9/7提升小波的步驟中有4個提升步(1-4)和兩個拉伸步(5_6);Y (2n+l) =Xext (2n+l) + ( α X [Xext (2n) +Xext (2η+2) ]) [Stepl]Y (2η) =Xext (2η) + ( β X [Y (2η_1) +Y (2η+1) ]) [Step2] Y (2η+1) =Y (2η+1) + ( y X [Y (2η) +Y (2η+2) ]) [Step3]
Υ(2η)=Υ(2η) + ( δ X [Y(2n_l)+Y(2n+1)]) [Step4]Υ(2η+1)=-ΚΧΥ(2η+1) [Step5]Υ(2η) = (1/Κ) X Y (2η) [Step6]其中:χ(η)為輸入信號,Xext (η)為χ(η)偶序號采樣組成的子信號,α,β,γ,δ,k為常數(shù)。各參數(shù)為
權(quán)利要求
1.一種多源異類無人機偵察圖像通用壓縮方法,包括以下幾個步驟: 第一步,建立無人機異類圖像壓縮接口的適配方法; 具體包括: (1)建立不同數(shù)據(jù)源接口; 數(shù)據(jù)源包括SAR圖像、高光譜圖像和視頻信息,利用高速總線接口作為SAR圖像、高光譜圖像的接口,利用數(shù)字采集作為視頻信息的接口,通過兩種接口,分別采集SAR圖像、高光譜圖像、視頻信息; (2)建立異類數(shù)據(jù)的映射模型; 建立映射模型,使數(shù)據(jù)源到數(shù)據(jù)目標(biāo)的屬性對應(yīng),標(biāo)記SAR圖像為00,高光譜圖像為01,視頻數(shù)據(jù)為10,若結(jié)果中出現(xiàn)11則判定為出錯; (3)格式轉(zhuǎn)換 將數(shù)據(jù)源中的單幀或者多幀的視頻圖像都轉(zhuǎn)換為yuv數(shù)據(jù)格式; 第二步,對H.264編碼方法進(jìn)行了改進(jìn),建立無人機多源圖像通用性壓縮方法; 具體包括: (O宏塊劃分; 將yuv數(shù)據(jù)格式的數(shù)據(jù)源視頻圖像中每一幀視頻圖像分成16x16像素大小的宏塊; (2)根據(jù)不同類別圖像視頻信息,分別進(jìn)行預(yù)測編碼; 如果是多幀動態(tài)視頻,采用幀間預(yù)測和幀內(nèi)預(yù)測編碼;如果是單幀的SAR圖像或者高光譜圖像,采用幀內(nèi)預(yù)測編碼,得到當(dāng)前宏塊的預(yù)測值; (3)將經(jīng)過步驟(2)得到的宏塊預(yù)測值與原宏塊相減,得到圖像殘差塊; (4)對圖像殘差塊進(jìn)行離散小波變換; (5)熵編碼 利用H.264/AVC標(biāo)準(zhǔn)中的熵編碼對控制信息以及量化后的殘差數(shù)據(jù)、運動矢量信息進(jìn)行數(shù)據(jù)壓縮,在完成熵編碼后,得到壓縮圖像的壓縮碼流,經(jīng)網(wǎng)絡(luò)自適應(yīng)層供傳輸和存儲用。
2.根據(jù)權(quán)利要求1所述的一種多源異類無人機偵察圖像通用壓縮方法,第二步(2)中的幀內(nèi)預(yù)測編碼采用高效視頻編碼幀內(nèi)平面預(yù)測,即HEVC planar預(yù)測。
3.根據(jù)權(quán)利要求1所述的一種多源異類無人機偵察圖像通用壓縮方法,第二步(4)離散小波采用9/7小波基。
全文摘要
本發(fā)明公開了一種多源異類無人機偵察圖像通用壓縮方法,屬于數(shù)字視頻圖像處理技術(shù)領(lǐng)域,首先通過壓縮系統(tǒng)的接口讀入圖像視頻信息,并將其轉(zhuǎn)換為統(tǒng)一的格式,然后利用改進(jìn)的H.264視頻編碼標(biāo)準(zhǔn)對其進(jìn)行壓縮編碼得到壓縮碼流。本發(fā)明針對無人機多任務(wù)載荷、多模式工作的特點,可以用于無人機以前視紅外儀等不同設(shè)備采集得到的視頻信息、SAR圖像、高光譜圖像的壓縮工作,并且解壓縮之后的圖像源信息可辨,方案系統(tǒng)化。
文檔編號H04N7/26GK103108182SQ20131001996
公開日2013年5月15日 申請日期2013年1月18日 優(yōu)先權(quán)日2013年1月18日
發(fā)明者丁文銳, 康傳波, 李紅光, 魯愛英 申請人:北京航空航天大學(xué)