基于elz編碼算法的生物信號(hào)的量化等級(jí)表示方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信號(hào)處理領(lǐng)域,具體涉及應(yīng)用在生物信號(hào)領(lǐng)域中基于粗?;^程的LZ 復(fù)雜度變形算法。
【背景技術(shù)】
[0002] LZ復(fù)雜度是一種表征時(shí)間序列里出現(xiàn)新模式速率的方法,是以粗?;^程為基礎(chǔ) 的,是用來評(píng)估有限序列的隨機(jī)性的一種途徑,其變形也是通過變化的粗?;^程產(chǎn)生的。 LZ復(fù)雜度及其變形已經(jīng)廣泛應(yīng)用于生物信號(hào)的復(fù)雜度的分析中。至今,已經(jīng)有很多LZ復(fù)雜 度變形的算法,但是能準(zhǔn)確又清楚的算法并不多。它們不僅不能很好的反映出原始信號(hào)的 細(xì)節(jié),而且不能區(qū)分出原始信號(hào)的隨機(jī)性和混沌特性。每個(gè)LZ復(fù)雜度變形的算法的規(guī)則不 同,因此信號(hào)處理后結(jié)果也不同。
[0003] 計(jì)算LZ復(fù)雜度先將信號(hào)進(jìn)行粗?;^程。粗粒化過程是信號(hào)x必須被轉(zhuǎn)化成一 些符號(hào)序列R,必須為簡化計(jì)算而運(yùn)行。此過程之后,符號(hào)序列的LZ復(fù)雜度的計(jì)數(shù)器c(n) 被描述為:
[0004] (1)使S和Q分別表示兩個(gè)字符串,SQ是S和Q的串聯(lián),SQ31字符串在他最后一個(gè) 字符被刪除時(shí)來自于SQ(JT表示在字符串中最后一個(gè)字符被刪除的操作),讓v(SQJT)表示 SQji所有不同子字符串的詞匯。最初,c(n) = 1,S=Si,Q=s2,所以v(SQjt) =si.
[0005] ⑵總之,S=SiS;;,…,sr,Q=sr+1,所以SQjt=SiS;;,…,s;如果Q屬于v(SQjt), 那么\+1,也就是Q是SQJr的子串,S并沒有改變,并且更新Q為\+1^+2,然后判斷Q是否屬 于v(SQJT),重復(fù)這個(gè)過程一直到Q不屬于v(SQJT)。
[0006] ⑶現(xiàn)在,Q=sr+1sr+2,…,sr+i不是SQjt=s而,…,srsr+1,…,sr+i丨,的子串。所以 c(n)加 1.
[0007] ⑷然后,S被更新為S=SiS;;,…,sr+i,這時(shí)Q=sr+i+1
[0008] 這個(gè)過程一直重復(fù)到Q是最后的字符。此時(shí)c(n)是包含在R內(nèi)的不同子串的數(shù) 量。最后c(n)歸一化為
[0009] (1)
[0010] n是信號(hào)x的長度,a是包含序列R在內(nèi)的可能信號(hào)的數(shù)目,c(n)是歸一化的LZ 復(fù)雜度表示包含新序列在內(nèi)的上升的比率。
[0011] LZ復(fù)雜度是以粗?;^程為基礎(chǔ),而粗?;^程是將信號(hào)轉(zhuǎn)換成一個(gè)含有少量帶 有符號(hào)的序列。繼粗粒化過程之后,使用公式將符號(hào)序列的復(fù)雜度算出。目前比較常用的 LZ復(fù)雜度算法有CLZ復(fù)雜度(classicalLempel-Zivcomplexity,經(jīng)典復(fù)雜度)算法和 MLZ復(fù)雜度(multistateLempel-Zivcomplexity,多態(tài)復(fù)雜度)算法。但是使用CLZ算法 的復(fù)雜度會(huì)丟失原始信號(hào)一部分的有效信息,MLZ算法在信號(hào)有高振幅的幅值或者不期望 的噪聲的情況之下會(huì)將信號(hào)中這些不必要的信息量化,得不到精確的量化等級(jí)。
[0012] CLZ復(fù)雜度是通過與閾值比較將信號(hào)轉(zhuǎn)換為二值符號(hào)序列。即當(dāng)信號(hào)值比閾值大 時(shí),信號(hào)被置為1,否則為0。閾值的選擇是信號(hào)的平均值或者是中值。
[0013] MLZ復(fù)雜度將x信號(hào)轉(zhuǎn)換成一個(gè)0,1,2, ...,y-1的S序列,y是一個(gè)大于3的整 數(shù)。信號(hào)的上下界1,和1s是確定的,y+1閾值是上界1 ,和下界1 3的距離。U是y+1閾值, n是信號(hào)的長度,S序列的y狀態(tài)滿足公式如下:
[0014]
[0015] CLZ復(fù)雜度算法中粗?;^程經(jīng)常造成過度粗?;恍┰夹盘?hào)的有用信息在 此過程中丟失,甚至從根本上改變其動(dòng)態(tài)特征。MLZ復(fù)雜度算法不僅可以量化原始信號(hào)復(fù)雜 度還能反映時(shí)間序列的幅度變化,但實(shí)際上因?yàn)樾盘?hào)中一些多余的信息是沒必要被量化的 (比如一些噪聲干擾),因此量化的等級(jí)不會(huì)變的更好。這兩種方法只是反映出序列的隨機(jī) 性,不能區(qū)分序列的隨機(jī)性和非線性混沌特征,所以這兩個(gè)算法并不能準(zhǔn)確分析時(shí)間序列 的復(fù)雜度。對(duì)于實(shí)際信號(hào)的數(shù)據(jù)突變,CLZ算法對(duì)該現(xiàn)象的不能及時(shí)反映,即算法的靈敏度 低。使用現(xiàn)有復(fù)雜度算法處理信號(hào)無法準(zhǔn)確的檢測(cè)出心律不齊,因此有必要設(shè)計(jì)一個(gè)保留 原始信號(hào)重要信息并且靈敏度高的LZ復(fù)雜度算法。
[0016] 現(xiàn)有的算法對(duì)生物信號(hào)的復(fù)雜度分析存在諸多問題,因此亟需一種新的算法來實(shí) 現(xiàn)對(duì)生物信號(hào)的復(fù)雜度分析。
【發(fā)明內(nèi)容】
[0017] 為解決現(xiàn)有技術(shù)存在的不足,本發(fā)明公開了基于粗?;^程的ELZ復(fù)雜度 (encodingLempel-Zivcomplexity,編碼復(fù)雜度)算法,該算法在應(yīng)用到生物信號(hào)處理中 大大的保留了原始信號(hào)的信息,更好的區(qū)分去隨機(jī)信號(hào)和混沌信號(hào),提高了程序的準(zhǔn)確度。
[0018] 為實(shí)現(xiàn)上述目的,本發(fā)明的具體方案如下:
[0019] 基于ELZ編碼算法的生物信號(hào)的量化等級(jí)表示方法,包括以下步驟:
[0020] 步驟一:獲取生物信號(hào)x(i),i= 1,2,…,n,求出生物信號(hào)的平均值;生物信號(hào)為 心電信號(hào)或腦電信號(hào),心電信號(hào)通過心電圖機(jī)獲得;
[0021] 步驟二:將生物信號(hào)數(shù)據(jù)與平均值進(jìn)行比較,如果小于平均值,則該生物信號(hào)對(duì)應(yīng) 的第一個(gè)二進(jìn)制位Bdi)等于零,否則等于1 ;
[0022] 步驟三:該生物信號(hào)數(shù)據(jù)與前一個(gè)生物信號(hào)數(shù)據(jù)之差如果小于零,則該生物信號(hào) 對(duì)應(yīng)的第二個(gè)二進(jìn)制位&(1)等于零,否則等于1,并且定義&(1) = 0 ;
[0023] 步驟四:定義距離dis為dis(i+l) = | (X(i+l)-x(i)) |,將距離dis的平均值記 為dism,flag(i+l)是信號(hào)數(shù)據(jù)x(i+l)的flag,代表當(dāng)前點(diǎn)x(i+l)和前一點(diǎn)x(i)距離遠(yuǎn) 近的水平;
[0024] 步驟五:當(dāng)前生物信號(hào)對(duì)應(yīng)的dis(i+1)與距離dis的平均值之差dism如果小于 零,則flag(i+1)為零,否則等于1 ;
[0025] 步驟六:第三個(gè)二進(jìn)制位B3 為:B3 (i+1) =NOT(B2 (i+1)XORflag(i+1)),并且定義 B3(l) = 0 ;
[0026] 步驟七:獲得的生物信號(hào)對(duì)應(yīng)的第一個(gè)二進(jìn)制位、第二個(gè)二進(jìn)制位及第三個(gè)二進(jìn) 制位。
[0027] 步驟八:對(duì)生物醫(yī)學(xué)信號(hào)的每個(gè)點(diǎn)重復(fù)上述步驟,直到遍歷所有的點(diǎn)。
[0028] 進(jìn)一步的,獲得的生物信號(hào)對(duì)應(yīng)的第一個(gè)二進(jìn)制位、第二個(gè)二進(jìn)制位及第三個(gè)二 進(jìn)制位用于計(jì)算LZ復(fù)雜度?;舅枷胧牵瑫r(shí)間序列的每一個(gè)點(diǎn)變換為一個(gè)三位二進(jìn)制編 碼。
[0029] 進(jìn)一步的,本發(fā)明的方法適用于高斯噪聲、隨機(jī)序列(MIX(p)),混沌序列 (Logi(4.0)andLogi(3. 8))和周期序列的量化等級(jí)表示。
[0030] 對(duì)于步驟二可以看出Bdi)可以反映出信號(hào)的整體變化趨勢(shì),但是失去大量的信 號(hào)的詳細(xì)信息。從步驟三中可以看出B2可以反映出信號(hào)的詳細(xì)成分,并且可以使原來信號(hào) 中信號(hào)值較大數(shù)值變的更大,較小數(shù)值變得更小。例如,信號(hào)的當(dāng)前點(diǎn)比前一個(gè)點(diǎn)大并且高 于整個(gè)時(shí)間序列的平均值時(shí),(i)和B2 (i)這兩個(gè)二進(jìn)制位都被置為1,即變成二進(jìn)制中兩 個(gè)二進(jìn)制位的最大值。同理,當(dāng)前點(diǎn)比前一點(diǎn)小并且比序列的平均值小時(shí),Bji)和^(1)這 兩個(gè)二進(jìn)制位都被置為〇,即變成二進(jìn)制中兩個(gè)二進(jìn)制位的最小值。步驟四中flag(i+1)是 x(i+l)的flag,代表當(dāng)前點(diǎn)x(i+l)和前一點(diǎn)x(i)距離遠(yuǎn)近的程度。當(dāng)flag(i+l)是0,則 表示點(diǎn)x(i+l)與點(diǎn)x(i)相對(duì)較近,否則,這兩個(gè)點(diǎn)離得相對(duì)較遠(yuǎn)。當(dāng)B2(i)和flag(i)都 等于1,它代表點(diǎn)x(i)與x(i-1)相對(duì)比較遠(yuǎn),即x(i)比x(i-1)大很多。按照設(shè)計(jì)原則可以 使較大數(shù)值二進(jìn)制中變得更大,B3(i)被編碼成1。同樣的,如果B2(i)等于0并且flag(i) 等于1,它代表點(diǎn)x(i)與x(i-l)相對(duì)比較遠(yuǎn),所以x(i)比x(i-l)小很多。
[0031] 本發(fā)明包括了三個(gè)二進(jìn)制位,即有8個(gè)量化等級(jí),不僅可以有效地反映原始信號(hào) 的細(xì)節(jié)信息和動(dòng)態(tài)特征,也可以避免量化多余的信息。針對(duì)現(xiàn)有LZ復(fù)雜度算法的不足和不 完善,本發(fā)明將提供一種可靠性好、靈敏度高的復(fù)雜度測(cè)試方法。應(yīng)用微分變換原理,對(duì)符 號(hào)序列的每一位二進(jìn)制代碼進(jìn)行編碼,顯示出每一位的性質(zhì)特征。
[0032] 本發(fā)明的有益效果:
[0033] 本發(fā)明對(duì)每一個(gè)二進(jìn)制位進(jìn)行編碼,可以使信號(hào)的有效信息保留下來。高斯噪聲 等隨機(jī)信號(hào)的ELZ復(fù)雜度值比混沌信號(hào)的復(fù)雜度值大,并且在序列長度大于400的情況下, 隨著序列長度的增加ELZ復(fù)雜度值保持穩(wěn)定。<