一種用電信息采集系統(tǒng)遠(yuǎn)程信道報(bào)文壓縮方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種用電信息采集系統(tǒng)遠(yuǎn)程信道報(bào)文壓縮領(lǐng)域,屬于電力系統(tǒng)中報(bào)文數(shù)據(jù)無(wú)損壓縮技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]主站系統(tǒng)與集中器之間通信是用電信息采集系統(tǒng)中一個(gè)重要組成部分,其通信下行報(bào)文可以是主站對(duì)集中器請(qǐng)求各類(lèi)數(shù)據(jù),查詢(xún)參數(shù),控制命令等。其最常見(jiàn)的上行報(bào)文一般是響應(yīng)召測(cè)的各種實(shí)時(shí)數(shù)據(jù)以及歷史(凍結(jié),曲線(xiàn))數(shù)據(jù)。當(dāng)上行報(bào)文數(shù)據(jù)較大時(shí),報(bào)文會(huì)分成多幀傳輸,而每幀遵循GW376.1通信協(xié)議,各幀之間有相同的數(shù)據(jù)結(jié)構(gòu),故存在一定冗余信息。另一方面,電力系統(tǒng)售電環(huán)節(jié)的調(diào)度系統(tǒng),營(yíng)銷(xiāo)系統(tǒng)等各類(lèi)應(yīng)用越來(lái)越依靠用電信息采集系統(tǒng)數(shù)據(jù)的及時(shí)獲取,故主站采集數(shù)據(jù)時(shí)必須在一定程度上保證數(shù)據(jù)的實(shí)時(shí)性,以便營(yíng)銷(xiāo)系統(tǒng)對(duì)采集數(shù)據(jù)進(jìn)行分析并作出相應(yīng)處理。故對(duì)遠(yuǎn)程信道報(bào)文壓縮后再傳輸是十分有必要。
[0003]目前,實(shí)際應(yīng)用的用電信息采集系統(tǒng)遠(yuǎn)程信道一般采用GPRS信道或230M無(wú)線(xiàn)專(zhuān)網(wǎng)信道,其通信方式存在諸多不足之處。低壓居民集中抄表是用電信息采集典型的應(yīng)用,且用電信息采集數(shù)據(jù)種類(lèi)繁多,當(dāng)集中器采集幾百戶(hù)電能表時(shí)。通信量非常大,數(shù)據(jù)傳輸?shù)街髡疽馁M(fèi)大量時(shí)間。電網(wǎng)部門(mén)不僅需要支付很高運(yùn)行費(fèi)用,而且通信速率較低,傳輸時(shí)延較大,數(shù)據(jù)實(shí)時(shí)性有時(shí)不能保證。不適應(yīng)用電信息采集系統(tǒng)中對(duì)報(bào)文傳輸過(guò)程中高效,可靠,安全等方面要求。
【發(fā)明內(nèi)容】
[0004]為了滿(mǎn)足用電信息采集系統(tǒng)對(duì)遠(yuǎn)程通信報(bào)文實(shí)時(shí)分析和高效傳輸?shù)臉I(yè)務(wù)要求。報(bào)文壓縮技術(shù)應(yīng)具備高壓縮比,算法復(fù)雜度低,占用內(nèi)存小等特點(diǎn)。鑒于此,本發(fā)明的目的是提供一種用于用電信息采集系統(tǒng)中遠(yuǎn)程信道通信報(bào)文高壓縮比的壓縮方法,在在本發(fā)明只需要在報(bào)文傳輸進(jìn)行壓縮預(yù)處理就可以大幅降低通信量,降低對(duì)通信信道所需帶寬要求。
[0005]在該方法中,根據(jù)已壓縮數(shù)據(jù)逐步建立起基于多階上下文的字符集概率分布模型,并隨著壓縮過(guò)程的進(jìn)行以一定的方式自適應(yīng)的更新該模型,即學(xué)習(xí)機(jī)制。通過(guò)準(zhǔn)確的建模預(yù)測(cè)符號(hào)概率,再經(jīng)算術(shù)編碼模塊壓縮后再輸出。預(yù)測(cè)模型預(yù)測(cè)得越準(zhǔn)確,壓縮效果就越逼近數(shù)據(jù)信息熵。
[0006]本發(fā)明采用的技術(shù)方案如下:一種用電信息采集系統(tǒng)遠(yuǎn)程信道報(bào)文壓縮方法,包括主站下發(fā)集中器命令,集中器響應(yīng)主站命令并生成上行報(bào)文,集中器對(duì)上行報(bào)文進(jìn)行壓縮,然后傳輸?shù)街髡?,主站接收到被壓縮的上行報(bào)文后,進(jìn)行解壓縮過(guò)程,同理,由主站到集中器下行報(bào)文傳輸過(guò)程為其逆過(guò)程。其中所述對(duì)上行報(bào)文進(jìn)行壓縮的步驟如下:
[0007]根據(jù)上行報(bào)文中各階上下文的分布特性進(jìn)行在線(xiàn)建模,建立起基于多階上下文的字符集概率分布模型;根據(jù)字符集概率分布模型中已建立好的上下文信息預(yù)測(cè)下一個(gè)到達(dá)字符的符號(hào)概率,編碼該符號(hào)概率并輸出;同時(shí)根據(jù)已編碼字符更新各階上下文的分布特性,自適應(yīng)的更新字符集概率分布模型。
[0008]具體地,所述字符集概率分布模型是一種多層上下文相關(guān)的概率模型,對(duì)于報(bào)文中將要編碼的某一字符,利用已編碼的字符串逐步構(gòu)建的上下文樹(shù)的概要信息得到該字符在各階上下文中預(yù)測(cè)頻率,從而得到該字符的累積概率。
[0009]為了更好地實(shí)施本發(fā)明,所述預(yù)測(cè)概率的計(jì)算方式如下:針對(duì)某一待編碼字符,在當(dāng)前長(zhǎng)上下文中尋找是否出現(xiàn)與待編碼字符相同的字符,如有則輸出該字符的累積頻率和上一字符的累積頻率;若沒(méi)有出與待編碼字符相同的字符,則輸出一個(gè)逃逸字符,且退回到下一較短上下文,直到第O階上下文,即待編碼字符本身,給待編碼字符分配概率為待編碼字符出現(xiàn)的次數(shù)與已經(jīng)讀入符號(hào)的個(gè)數(shù)之比;若待編碼字符之前從未出現(xiàn)過(guò),則為-1階上下文,給待編碼字符分配固定概率為1/256。
[0010]在上述過(guò)程中所述在長(zhǎng)上下文中尋找是否出現(xiàn)與待編碼字符相同的字符過(guò)程中,當(dāng)由高階上下文轉(zhuǎn)向低階上下文時(shí),高階上下文中出現(xiàn)過(guò)的該字符便不再退到低階上下文尋找。
[0011 ]所述編碼符號(hào)概率采用自適應(yīng)的算術(shù)編碼,即根據(jù)當(dāng)前字符的符號(hào)概率分布,和上一字符的符號(hào)概率分布編碼所述當(dāng)前待字符。
[0012]本發(fā)明還提供了一種用電信息采集系統(tǒng)遠(yuǎn)程信道報(bào)文壓縮系統(tǒng),包括主站和集中器,主站下發(fā)集中器命令,集中器響應(yīng)主站命令并生成上行報(bào)文,在此過(guò)程中所述集中器對(duì)上行報(bào)文進(jìn)行壓縮,然后傳輸?shù)街髡?,主站接收到被壓縮的上行報(bào)文后,進(jìn)行解壓縮;同理,由主站到集中器下行報(bào)文傳輸過(guò)程為其逆過(guò)程。其中所述對(duì)上行報(bào)文進(jìn)行壓縮由以下模塊實(shí)現(xiàn):
[0013]字符集概率分布模型,根據(jù)上行報(bào)文中各階上下文的分布特性進(jìn)行在線(xiàn)建模,建立起基于多階上下文的字符集概率分布模型;算術(shù)編碼模塊,根據(jù)字符集概率分布模型中已建立好的上下文信息預(yù)測(cè)下一個(gè)到達(dá)字符的符號(hào)概率,編碼該符號(hào)概率并輸出;學(xué)習(xí)模塊,根據(jù)已編碼字符更新各階上下文的分布特性,自適應(yīng)的更新字符集概率分布模型。
[0014]本發(fā)明的優(yōu)勢(shì)之處在于以下幾點(diǎn):
[0015]1.通過(guò)對(duì)報(bào)文數(shù)據(jù)上下文建模能自適應(yīng)的學(xué)習(xí)各階上下文中字符的統(tǒng)計(jì)信息,從而較準(zhǔn)確地預(yù)測(cè)下一字符概率,最大程度上用較少的比特表示出現(xiàn)概率較高的字符,用較多的比特表示出現(xiàn)概率較低的字符,從而提高壓縮比,其壓縮效果高于一般的LZ系列的壓縮算法。
[0016]2.用電信息采集系統(tǒng)遠(yuǎn)程信道報(bào)文數(shù)據(jù)都是遵循376.1的幀格式,幀與幀之間有相同的格式,存在著一些的冗余信息。且在各種電能質(zhì)量或電能量曲線(xiàn)數(shù)據(jù)中相鄰采樣點(diǎn)數(shù)據(jù)之間有較強(qiáng)相關(guān)性。例如,電能質(zhì)量數(shù)據(jù)在不同的時(shí)刻也存在著相同的后綴。這種特性剛好符合上下文相關(guān)模型,因此應(yīng)用該方法可以取得較好的壓縮效果。
[0017]3.適用算術(shù)編碼作為最后的輸出編碼,而算術(shù)編碼是接近于信息熵的編碼。
[0018]4.在存儲(chǔ)上下文方面采用三叉樹(shù)的數(shù)據(jù)結(jié)構(gòu),減少了查找和更新上下文所需的算法步驟,降低了算法的復(fù)雜度。
[0019]5.本方法在實(shí)施過(guò)程中,只需在集中器和主站系統(tǒng)方面接受數(shù)據(jù)前端嵌入壓縮/解壓縮模塊,只需軟件上的升級(jí),而無(wú)需硬件上的改進(jìn),故可以進(jìn)行在線(xiàn)升級(jí),實(shí)施成本較低,易于實(shí)現(xiàn)。
[0020]6.本方法實(shí)現(xiàn)復(fù)雜度低,壓縮、解壓縮耗時(shí)短,在一定程度上保證了數(shù)據(jù)傳輸?shù)膶?shí)時(shí)性。
【附圖說(shuō)明】
[0021 ]圖1為本發(fā)明壓縮/解壓縮模塊結(jié)構(gòu)示意圖;
[0022]圖2為原用電信息采集系統(tǒng)示意圖;
[0023]圖3為本發(fā)明在用電信息采集系統(tǒng)中應(yīng)用場(chǎng)景示意圖;
[0024]圖4壓縮算法具體實(shí)現(xiàn)流程示意圖。
【具體實(shí)施方式】
[0025]為了使本發(fā)明的目的,技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)發(fā)明進(jìn)行進(jìn)一步的詳細(xì)說(shuō)明。
[0026]實(shí)施例一,本發(fā)明提供了一種用于用電信息采集系統(tǒng)主站與集中器之間的通信報(bào)文壓縮系統(tǒng),如圖1所示。
[0027]概率模型:在本方法中使用一種多層上下文相關(guān)的概率模型,其主要有以下特點(diǎn),對(duì)于報(bào)文中將要編碼的某一待編碼字符,利用已編碼的字符串逐步構(gòu)建的上下文樹(shù)的概要信息得到待編碼字符在各階上下文中累積頻率。有兩種機(jī)制計(jì)算該字符的預(yù)測(cè)概率。
[0028]第一種是后退機(jī)制,即在當(dāng)前長(zhǎng)上下文中尋找是否出現(xiàn)該待編碼字符,如有則輸出該待編碼字符的累積頻率和上一字符的累積頻率。若沒(méi)有出現(xiàn),則輸出一個(gè)逃逸字符,且退回到下一較短上下文。直到第O階上下文,即該待編碼字符本身,給它分配概率為該符號(hào)出現(xiàn)的次數(shù)與已經(jīng)讀入符號(hào)的個(gè)數(shù)之比。若該待編碼字符之前從未出現(xiàn)過(guò),則模型轉(zhuǎn)為-1階上下文,給它分配固定概率為1/256。因?yàn)槭M(jìn)制報(bào)文數(shù)據(jù)字符集個(gè)數(shù)256。第二種是混合機(jī)制,將每個(gè)上下文中該字符的預(yù)測(cè)概率。按一定的權(quán)值加權(quán)求和。其權(quán)值是該符號(hào)在當(dāng)前上下文出現(xiàn)次數(shù)的函數(shù)。這里采用第一種方法。另外在概率模型后退機(jī)制中使用一種排除法,當(dāng)上下文由高階轉(zhuǎn)向較低階上下文時(shí),高階上下文中出現(xiàn)過(guò)的字符在低階上下文中被排除掉,因?yàn)槿舾唠A上下文中出現(xiàn)該字符,則不會(huì)后退到低階上下文。這樣可以增大低階上下