專利名稱:一種基于熒光顯微圖像的亞細胞定位方法
技術(shù)領(lǐng)域:
本發(fā)明屬于生物信息技術(shù)領(lǐng)域,特別涉及一種基于熒光顯微圖像的亞細胞定位方法。
背景技術(shù):
基因革命引領(lǐng)了基因和蛋白質(zhì)測序的快速增長,現(xiàn)在,人們的關(guān)注力轉(zhuǎn)向了編碼蛋白質(zhì)的功能。亞細胞定位是指某種蛋白或表達產(chǎn)物在細胞內(nèi)的具體存在部位。如僅在核內(nèi)存在,還是胞質(zhì)內(nèi)存在,還是細胞膜上存在,這在生物信息學(xué)上有很重要的意義。目前自動熒光顯微技術(shù)的發(fā)展,使得蛋白質(zhì)亞細胞可以在高通量的情況下成像定位,因此需要快速的自動計算技術(shù)和有效的算法來對亞細胞圖像進行有效的量化、辨識和分類。目前,人們把計算機技術(shù)應(yīng)用到生物學(xué)領(lǐng)域,利用計算機來代替部分人類的腦力 勞動對海量的生物信息進行辨識和分類,從中得出有價值的信息[2]。圖像統(tǒng)計已經(jīng)證明在區(qū)分定位方面有很成功的應(yīng)用,但其常用的方法計算相對較慢,并經(jīng)常需要從實驗圖像中單獨選擇細胞,從而限制了處理能力和潛在應(yīng)用的范圍。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于熒光顯微圖像的亞細胞定位方法。本發(fā)明的技術(shù)方案是,一種基于熒光顯微圖像的亞細胞定位方法,包括以下步驟步驟1,首先對基于熒光顯微圖像的亞細胞定位圖像進行預(yù)處理,對每一副亞細胞定位圖像,計算其像素值大于30的所有像素的均值U,然后把值小于u-30的像素點的像素值賦為零,得到預(yù)處理后的亞細胞定位圖像,步驟2,計算亞細胞圖像定位像素點與其鄰接點的差值,即在步驟I中得到預(yù)處理后的亞細胞定位圖像中,對每一個像素值大于零的像素點,計算與其鄰接的8個像素點的像素差值,把大于該像素點值的鄰接點標記為1,否則標記為O,然后以該像素點周圍標記為I的鄰接點的個數(shù)把該像素點劃歸為9類;步驟3,提取亞細胞定位圖像特征,即通過步驟2,首先統(tǒng)計出該亞細胞定位圖像每一類包含的像素點個數(shù),其次,根據(jù)亞細胞定位圖像像素點的差值矩陣模型,統(tǒng)計每一類的亞細胞定位圖像像素點的大于零的值總和和小于零的值總和,最后再根據(jù)每一類中各個像素點差值的絕對值之和,可以得到每一類的方差,這樣總共得到36組特征量;步驟4,根據(jù)提取的36組亞細胞定位圖像特征量,利用支持向量機算法,對亞細胞定位圖像進行訓(xùn)練預(yù)測,實現(xiàn)基于熒光顯微圖像的亞細胞定位。步驟I中所述的對亞細胞定位圖像進行預(yù)處理步驟包括,首先,對于亞細胞定位圖像,篩選出亞細胞圖像中值大于30的像素值,并計算其均值U,如式I所示Sum Value= Σ (1>30). (I)
u=mean (Sum Value).然后把該圖像中值小于u-30的像素值賦為零,如式2所示,1=0, if (Ku-30) (2)步驟2中所述的亞細胞圖像定位像素點與其鄰接點的差值的步驟包括,根據(jù)預(yù)處理后得到的亞細胞定位圖像,其像素值范圍為0,u-30 255,在圖像1>0的像素點,計算其與鄰接點的差值,如式3所示,差值大于零的標記為1,其他的標記為0,得至IJ下表中9種模型矩陣,每一個像素點對應(yīng)表中一種情況,得到(0)-(8)共9種特征量,
權(quán)利要求
1.一種基于熒光顯微圖像的亞細胞定位方法,其特征在于,包括以下步驟步驟1,首先對基于熒光顯微圖像的亞細胞定位圖像進行預(yù)處理,對每一副亞細胞定位圖像,計算其像素值大于30的所有像素的均值U,然后把值小于U-30的像素點的像素值賦為零,得到預(yù)處理后的亞細胞定位圖像,步驟2,計算亞細胞圖像定位像素點與其鄰接點的差值,即在步驟I中得到預(yù)處理后的亞細胞定位圖像中,對每一個像素值大于零的像素點,計算與其鄰接的8個像素點的像素差值,把大于該像素點值的鄰接點標記為I,否則標記為O,然后以該像素點周圍標記為I的鄰接點的個數(shù)把該像素點劃歸為9類;步驟3,提取亞細胞定位圖像特征,即通過步驟2,首先統(tǒng)計出該亞細胞定位圖像每一類包含的像素點個數(shù),其次,根據(jù)亞細胞定位圖像像素點的差值矩陣模型,統(tǒng)計每一類的亞細胞定位圖像像素點的大于零的值總和和小于零的值總和,最后再根據(jù)每一類中各個像素點差值的絕對值之和,可以得到每一類的方差,這樣總共得到36組特征量;步驟4,根據(jù)提取的36組亞細胞定位圖像特征量,利用支持向量機算法,對亞細胞定位圖像進行訓(xùn)練預(yù)測,實現(xiàn)基于熒光顯微圖像的亞細胞定位。
2.如權(quán)利要求1所述的基于熒光顯微圖像的亞細胞定位方法,其特征在于,步驟I中所述的對亞細胞定位圖像進行預(yù)處理步驟包括,首先,對于亞細胞定位圖像,篩選出亞細胞圖像中值大于30的像素值,并計算其均值 U,如式I所示Sum Value= Σ (1>30). (I) u=mean(Sum Value).然后把該圖像中值小于u-30的像素值賦為零,如式2所示,1=0, if (Ku-30) (2)。
3.如權(quán)利要求1所述的基于熒光顯微圖像的亞細胞定位方法,其特征在于,步驟2中所述的亞細胞圖像定位像素點與其鄰接點的差值的步驟包括,根據(jù)預(yù)處理后得到的亞細胞定位圖像,其像素值范圍為0,u-30 255,在圖像1>0的像素點,計算其與鄰接點的差值,如式3所示,差值大于零的標記為I,其他的標記為0,得到下表中9種模型矩陣,每一個像素點對應(yīng)表中一種情況,得到(0)-(8)共9種特征量,
4.如權(quán)利要求1所述的基于熒光顯微圖像的亞細胞定位方法,其特征在于,步驟3中所述的提取亞細胞定位圖像特征步驟包括,鄰接點差值計算之后,統(tǒng)計出該亞細胞圖像每一類包含的像素點個數(shù),其次,根據(jù)亞細胞圖像像素點的差值矩陣,對該點大于零和小于零的差值分別求和,再求該點差值的絕對值之和,如式4所示,然后分別統(tǒng)計每一類的亞細胞圖像像素點的大于零的值總和和小于零的值總和,最后再根據(jù)每一類中各個像素點差值的絕對值之和,可以得到每一類的方差,這樣總共得到36組特征量,suml= Σ (l_b>0) sum2= Σ (l_b〈0) (4) sum3=suml_sum2這樣通過累加之后,每種情況下亞細胞圖像像素點的suml和sum2,以及sum3的方差, 再加上每種情況下亞細胞圖像像素點的總個數(shù),一共可以提取出亞細胞圖像的9x4=36組特征量。
5.如權(quán)利要求1所述的基于熒光顯微圖像的亞細胞定位方法,其特征在于,步驟4中所述的對于亞細胞定位圖像訓(xùn)練預(yù)測的步驟包括,采用熒光抗體或者其他探劑檢測的包括10類細胞器的特定細胞器的內(nèi)源性蛋白或要素,每幅圖像被附有一個附加的用DNA特定染劑4’,6- 二脒基-2-苯基吲哚(DAPI)復(fù)染的細胞圖像,該染劑凸顯圖像中每一個細胞的細胞核位置,收集的502副內(nèi)源性定位圖像,均為固定的HeLa細胞圖像,取自油浸下60倍率,該圖像均為768x512像素的8位灰度圖像,每幅含有13個細胞。
全文摘要
本發(fā)明公開了一種基于熒光顯微圖像的亞細胞定位方法。對每一副亞細胞定位圖像計算其像素值大于30的所有像素均值u,對像素值小于u-30的賦予零值,得到預(yù)處理后的亞細胞圖像。計算圖像中每一個灰度值大于零的像素點與其8個鄰接點差值,把大于該中心像素點值的鄰接點標記為1,否則標記為0,每個中心像素點8領(lǐng)域為1的個數(shù)分別為0到8。根據(jù)該像素點周圍標記為1的鄰接點的個數(shù)把該像素點劃歸為9類。統(tǒng)計出圖像每一類包含的像素點個數(shù)。根據(jù)圖像像素點的差值矩陣模型,可得到每類像素點的鄰接正值之和、負值之和、絕對值之和,總共得到36個特征量。最后,根據(jù)提取的36組亞細胞圖像特征量,利用支持向量機算法,對圖像進行訓(xùn)練預(yù)測。
文檔編號G06F19/18GK103020488SQ201210588110
公開日2013年4月3日 申請日期2012年12月29日 優(yōu)先權(quán)日2012年12月29日
發(fā)明者黃繼風(fēng), 李超, 胡金家, 黃虹, 汪雪紅, 鄭利 申請人:上海師范大學(xué)