一種針對(duì)高通量基因測(cè)序圖像的去噪方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)字圖像降噪領(lǐng)域,具體涉及一種針對(duì)高通量基因測(cè)序圖像的去噪方 法。
【背景技術(shù)】
[0002] 高通量基因測(cè)序圖像承載著豐富的人類基因信息,極高的清晰度要求已經(jīng)成為衡 量實(shí)驗(yàn)成功的重要環(huán)節(jié)。但是由于高通量基因測(cè)序圖像在獲取或者傳輸?shù)倪^(guò)程中,會(huì)生成 多種類型的噪聲,這些噪聲影響后續(xù)的圖像處理、點(diǎn)檢測(cè)、以及Base Calling等操作,因此, 對(duì)圖像進(jìn)行去噪具有重大意義。而主要噪聲包括如下兩類:①高通量基因測(cè)序的原始圖像 通過(guò)CCD相機(jī)獲得,當(dāng)光通過(guò)傳感器產(chǎn)生信號(hào)電荷的過(guò)程視為隨機(jī)過(guò)程,而在單位時(shí)間內(nèi), 電荷數(shù)目在平均值上小的波動(dòng)被認(rèn)為是泊松噪聲。②待測(cè)序的圖像含有的噪聲具有隨機(jī)性 或者概率性,在實(shí)際應(yīng)用中,經(jīng)常會(huì)被建模成為均值為零的白噪聲,而圖像中堿基灰度分布 滿足高斯分布,因此這種白噪聲就會(huì)是高斯白噪聲。所以,高通量基因測(cè)序的圖像含有的噪 聲包括高斯噪聲、泊松噪聲。
[0003] 通過(guò)CCD相機(jī)獲得的高通量基因測(cè)序圖像中,由于待測(cè)序列的每個(gè)堿基都受到熒 光蛋白的標(biāo)記,在圖像中顯示成為由幾個(gè)像素組成的亮點(diǎn)。所以圖像是由多個(gè)大小不同的 亮斑組成,并且圖像極具紋理密度多樣性的特性。由于獲得圖片質(zhì)量受到設(shè)備的限制,原始 圖片的信噪比很低。目前針對(duì)待測(cè)序圖像的去噪算法分為兩類:空間域的圖像去噪算法和 頻率域的圖像去噪算法??臻g域的圖像去噪算法包括:高斯平滑濾波器,頂帽變換濾波器 等;頻率域的圖像去噪算法包括:基于硬閾值的小波閾值收縮法,基于軟閾值的小波閾值 收縮法等。
[0004] (1)高斯平滑濾波
[0005] 若對(duì)原圖I使用高斯核G。進(jìn)行圖像平滑去噪,濾波后的圖像J應(yīng)表示為:
[0006]
[0007]公式中*代表卷積符號(hào)。針對(duì)圖像中不相干的噪聲,這種平滑去噪方式與濾波器 的選取有關(guān),經(jīng)選擇的濾波器可以使得去噪后的圖像信噪比最大。這是因?yàn)辄c(diǎn)擴(kuò)散函數(shù) (Point Spread Function,PSF)修改了每個(gè)亮點(diǎn)的像素分布,進(jìn)而能夠通過(guò)高斯平滑得到 更好的去噪效果。
[0008] ⑵頂帽變換濾波
[0009] Yoshitaka Kimori等人提出將改進(jìn)的頂帽變換算法用于高通量基因測(cè)序圖像的 去噪和點(diǎn)識(shí)別。通過(guò)將原圖按照逆時(shí)針旋轉(zhuǎn)N次相同的角度得到N幅圖像,每幅圖像使用 線性結(jié)構(gòu)元素進(jìn)行開(kāi)運(yùn)算,然后將經(jīng)過(guò)處理后的圖像按順時(shí)針的方向還原成原圖像,選取N 幅圖像相同位置最大的灰度值構(gòu)成開(kāi)運(yùn)算后的圖像,最后用原圖減去經(jīng)過(guò)開(kāi)運(yùn)算后的圖像 得到實(shí)驗(yàn)結(jié)果。該方法通過(guò)選取大小合適的線性結(jié)構(gòu)元素來(lái)抑制噪聲,并能有效的進(jìn)行點(diǎn) 檢測(cè)。
[0010] ⑶基于硬閾值的小波閾值收縮法
[0011] Donoho和Johnstone等人提出小波收縮法,小波變換主要是通過(guò)獲得少量較大數(shù) 值的小波系數(shù),進(jìn)而獲得真實(shí)信號(hào)中較大的能量,并且將小波系數(shù)中因?yàn)樵肼曇鸬妮^小 數(shù)值丟棄。因此小波收縮函數(shù)具有兩個(gè)特征:1.舍棄數(shù)值小的小波系數(shù);2.保留數(shù)值大的 小波系數(shù)。小波收縮法分為閾值去噪法和比例去噪法,而閾值去噪法是其中較常用的方法。 基于硬閾值的小波閾值收縮法是將一副圖像進(jìn)行小波分解后,得到不同頻率的小波系數(shù), 將得到的小波系數(shù)與設(shè)計(jì)的閾值進(jìn)行對(duì)比,通過(guò)以下公式得到估計(jì)小波系數(shù),對(duì)于大于閾 值的小波系數(shù)保留,對(duì)于小于閾值的小波系數(shù)歸零。最后進(jìn)行圖像重構(gòu),得到去噪圖像。
[0012] C2)
[0013] (4)基于軟閾值的小波閾值收縮法
[0014] 基于軟閾值的小波閾值收縮法是將一副圖像進(jìn)行小波分解后,得到不同頻率的小 波系數(shù),將得到的小波系數(shù)與設(shè)計(jì)的閾值進(jìn)行對(duì)比,通過(guò)以下公式得到估計(jì)小波系數(shù),對(duì)于 大于閾值的小波系數(shù)要減去閾值系數(shù),對(duì)于小于閾值的小波系數(shù)歸零。最后進(jìn)行圖像重構(gòu), 得到去噪后的圖像。
[0015] (3)
[0016] 以下是幾種常用的閾值計(jì)算公式:
[0017] ① VisuShrink 閾值
[0018] D. L. Dononho 和 L. M. Johnstone 在 1"4 年提出 Visushrink 閾值,Visushrink 閾 值為:
[0019]
(4)
[0020] 其中〇代表噪聲標(biāo)準(zhǔn)差,N代表信號(hào)的長(zhǎng)度。
[0021] ②Gaussian分布的置信區(qū)間閾值
[0022] 零均值的Gaussian分布變量大部分都會(huì)落在[-3 0,3 0 ],落在這個(gè)區(qū)間外的概 率很小。因此,通過(guò)選擇A =3〇~4〇,小波系數(shù)的絕對(duì)值小于閾值會(huì)被認(rèn)為是噪聲,而 大于閾值的小波系數(shù)被認(rèn)為主要由信號(hào)系數(shù)組成。
[0023] 由于噪聲的多樣性,高斯濾波器大部分只能去除一種類型的噪聲,而且在消除噪 聲的同時(shí),圖像噪聲的邊緣會(huì)變模糊。而頂帽變換濾波器該方法通過(guò)選取大小合適的線性 結(jié)構(gòu)元素來(lái)抑制噪聲,并能有效的進(jìn)行點(diǎn)檢測(cè)。但是由于待測(cè)序堿基的大小不是固定的,所 以堿基的大小影響線性結(jié)構(gòu)元素的選取,進(jìn)而影響頂帽變換濾波器的性能。而小波硬閾值 收縮法可以得到較好的局部特征,但是由于估計(jì)小波系數(shù)的分布含有兩個(gè)斷點(diǎn),會(huì)造成振 鈴、偽吉布斯等視覺(jué)失真現(xiàn)象。而且該算法會(huì)隨著數(shù)據(jù)的微小變換而變換,所以該算法會(huì)產(chǎn) 生較大的方差和不穩(wěn)定性現(xiàn)象。而小波軟閾值收縮算法的估計(jì)系數(shù)雨雖然整體的連續(xù)性 好,使得去噪效果相對(duì)平滑。但是該算法仍然存在缺點(diǎn),會(huì)隨著大的小波閾值的收縮,產(chǎn)生 較大的偏差。并且估計(jì)系數(shù)與真實(shí)系數(shù)之間存在恒定的誤差,造成重構(gòu)圖像出現(xiàn)不必要的 誤差。
【發(fā)明內(nèi)容】
[0024] 本發(fā)明的目的在于提供一種用于去除高通量測(cè)序圖像噪聲的方法,旨在解決現(xiàn)有 技術(shù)對(duì)高通量基因測(cè)序圖像進(jìn)行去噪操作時(shí)存在的問(wèn)題,比如去噪效果不好,去噪后的圖 片存在失真現(xiàn)象。為了實(shí)現(xiàn)目的,本發(fā)明提供了一種基于新的小波閾值收縮的圖像去噪方 法,該方法是通過(guò)在頻率域內(nèi)實(shí)現(xiàn)對(duì)圖像進(jìn)行去噪處理,相對(duì)于現(xiàn)有技術(shù)中具有去噪性能 更好的優(yōu)點(diǎn)。
[0025] 本發(fā)明具體通過(guò)如下技術(shù)方案實(shí)現(xiàn):
[0026] 一種針對(duì)高通量基因測(cè)序圖像的去噪方法,其包括以下步驟:
[0027] (1)對(duì)測(cè)序圖像使用小波函數(shù)進(jìn)行小波分解,得到每一層小波系數(shù)
[0028] m鐘甜標(biāo)一巨/丨、姑茗撒?彳+曾m當(dāng)前/丨、波系數(shù)對(duì)應(yīng)的全局閾值入1:
[0029]
[0030] 其中medianhi)代表小波系數(shù)對(duì)應(yīng)的中值,mum;;代表圖像的行和列,k代表 系數(shù);
[0031] (3)通過(guò)每一層小波系數(shù)%和對(duì)應(yīng)的全局閾值Xi,求出每一層小波系數(shù)對(duì)應(yīng)的 估計(jì)小波系數(shù);
[0032]
,V J
[0033]其中,a > 1,asE,r是調(diào)整因子,sgn(x)代表信號(hào)函數(shù),當(dāng)大于0時(shí),信號(hào) 函數(shù)值為1 ;當(dāng)%小于〇,信號(hào)函數(shù)值為-1 ;
[0034] (4)使用小波重構(gòu)算法得到去噪后的圖像:針對(duì)每一層估計(jì)小波系數(shù)得到去噪后 的圖像,
[0035]
[0036] 其中N代表最大小波分解層數(shù),MN(x,y)代表經(jīng)過(guò)小波分解算法后得到的低頻分 量,A 代表每一層估計(jì)小波系數(shù)。
[0037] 進(jìn)一步地,所述步驟(1)具體為:采用di trous小波和它的0-3 spline version 對(duì)圖像進(jìn)行小波分解,包括如下步驟:
[0038] a.初始化i =0,則第0層的圖像為原圖M。;
[0039]b.變量i自加,圖像%i每行每列都與一個(gè)一維的核h進(jìn)行卷積,卷積后圖像表示 為%,核h表示為矩陣
中且在矩陣的元素之間插入(21 Ll)個(gè)零;
[0040]c.計(jì)算每一層小波系數(shù):;(k)=Mi i (k) -Mi (k)。
[0041] 本發(fā)明的有益效果是:本發(fā)明具有如下優(yōu)點(diǎn):本發(fā)明提出的基于d! trous小波閾 值去噪算法,是對(duì)基于硬閾值的各向同性非抽取離散小波算法的改進(jìn),具體操作是使用特 定的小波對(duì)高通量基因測(cè)序的圖像進(jìn)行小波分解,針對(duì)每一層小波系數(shù),提出使用A范數(shù)計(jì) 算全局閾值。通過(guò)全局閾值和每一層小波系數(shù)構(gòu)建估計(jì)小波系數(shù)表達(dá)式,最后使用小波重 構(gòu)算法得到去噪后的圖像。本發(fā)明的方法滿足Nyquist采樣定理,具有移不變性;魯棒性 高,針對(duì)不同類型的噪聲,算法的去噪效果都很顯著;對(duì)比各種基于小波閾值去噪算法,圖 像得到的信噪比結(jié)果是最優(yōu)的。
【附圖說(shuō)明】
[0042] 圖1是本發(fā)明的方法流程圖;
[0043] 圖2是原始的高通量基因測(cè)序圖像;
[0044] 圖3是添加標(biāo)準(zhǔn)差5。為20的尚斯噪聲的測(cè)序圖;
[0045] 圖4是添加標(biāo)準(zhǔn)差S。為30的高斯噪聲的測(cè)序圖;
[0046] 圖5是添加泊松噪聲后的測(cè)序圖像,其中圖5 (a)是含噪聲圖像,圖5(b)是圖5 (a) 中的某亮斑灰度分布圖,圖5(c)是圖5(a)中某亮斑去背景的灰度分布圖;
[0047] 圖6是使用IUWT(hard thresholding)算法進(jìn)行圖像去噪的示意圖,其中圖6(a) 是IUWT(hard thresholding)去噪圖,圖b(b)是圖6(a)中的某亮斑灰度分布圖,圖6(c) 是圖6(a)中某亮斑去背景的灰度分布圖;
[0048] 圖7是使用IUWT (soft thresholding)算法進(jìn)行圖像去噪的示意圖,其中圖7(a) 是IUWT (soft thresholding)去噪圖,圖7(b)是圖