專利名稱::Cb法微核圖像中雙核淋巴細胞的準確快速提取方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及輻射生物劑量學領(lǐng)域中微核(Micronucleus,MN)的自動化檢測,是一種微核圖像計算機自動分析中目標區(qū)域的提取方法,特別是放射醫(yī)學領(lǐng)域中可用作輻射生物劑量計的CB法微核圖像中雙核淋巴細胞的準確、快速、自動提取方法。
背景技術(shù):
:人外周血淋巴細胞胞質(zhì)分裂阻滯法(Cytokinesis-block,CB法)微核試驗的主要分析指標是微核率,計算公式為p(^卜;c/"x1000^,式中/7為每千個雙核淋巴細胞中的微核數(shù);"為觀察的雙核淋巴細胞數(shù);JC為"個雙核淋巴細胞中所含的微核數(shù)。其中,雙核淋巴細胞區(qū)域的準確、快速提取是CB法微核圖像自動分析的關(guān)鍵技術(shù)和難題,直接影響著雙核淋巴細胞的準確判別和微核率的準確計數(shù)。針對微核圖像中雙核淋巴細胞區(qū)域的提取問題,對檢索到的有關(guān)文獻進行研究發(fā)現(xiàn),其實現(xiàn)方法主要可分為兩類一是單閾值分割方法或邊緣檢測方法,僅能夠獲取細胞核(微核)的信息,記為方法I;二是雙閾值分割方法,能同時獲取細胞質(zhì)和細胞核(微核)的信息,記為方法II。方法I和方法II各有優(yōu)缺點,詳見表l。表l微核圖像分割方法的分類與比較<table>tableseeoriginaldocumentpage3</column></row><table>對于方法I,即單閾值分割方法或邊緣檢測方法,只能獲取細胞核(微核)信息,在判別雙核淋巴細胞時無法利用細胞的輪廓信息加以限制,其缺陷是(1)易將如下情況誤判為雙核淋巴細胞①有粘連的兩個單核細胞,其內(nèi)部單核的面積和周長接近,盡管這種情況較少,見圖l(a);②兩個臨近的裸核,其面積和周長接近,較為常見,見圖l(b)、(C)和(f);③尤其是圖l(f)中,有4個面積相近的細胞核,不知將判別為幾個雙核細胞。這都將會導致雙核淋巴細胞的誤計數(shù)(假陰性),從而影響微核率的準確計數(shù)。(2)不能識別有粘連的雙核,見圖l(d),但是淋巴細胞中雙核有粘連的情況卻是較為常見的,而且在雙核細胞中占據(jù)一定比例,如若不能對其進行識別,將會影響計數(shù)統(tǒng)計。(3)對于雙核位于細胞一側(cè)、而微核位于另一側(cè)的情況(較為常見),見圖l(e),根據(jù)文獻[3]中的后續(xù)自動分析步驟①找到雙核質(zhì)心連線的中點O(X,Y);②以該中點為圓心、以半徑為R1作圓,正好將該雙核包含在內(nèi),記為圓01;@將圓01擴大10%,記為圓02(其半徑為R2),并認為圓02最接近細胞的原始大??;④再判斷圓02內(nèi)部的微核情況。由圖l(e)可以看到,MN-3能被包含在圓02內(nèi)部,MN-2卻被劈成兩部分,而MN-1卻位于圓02之外,這將會漏掉MN-l,甚至還會漏掉MN-2,從而導致微核的誤計數(shù)(假陽性)。采用方法II,即雙閾值分割的方法,在判別淋巴細胞時,從理論上講由于能夠利用細胞質(zhì)的信息(即細胞輪廓)加以限制,故應(yīng)該可以克服方法I存在的缺陷。文獻[6]通過尋找微核圖像灰度直方圖中的兩個局部最小值來確定分割雙閾值,然而微核圖像的灰度直方圖中往往并非恰好僅有兩個局部最小值(可能僅有l(wèi)個,還可能有3個、甚至更多個),且分割效果不理想。文獻[7]則先計算使微核圖像的熵最小時的閾值T1,然后利用公式T241+(h2-hl)/3計算得到第2個分割閥值T2,其中hl和h2分別為灰度直方圖中左側(cè)和右側(cè)邊緣處的灰度值,1/3為一經(jīng)驗值,該方法有時會出現(xiàn)丁2>255的情況,導致無法正常進行分割,且分割效果也不理想。文獻[6]和[7]中所采用的兩種方法不可靠,且對微核制片質(zhì)量要求非常高。分割迅速、應(yīng)用較為廣泛的雙閾值分割方法主要有最大類間方差法、最大熵法和迭代法,而不是文獻[6,7]中采用的方法。由于細胞核(微核)與細胞質(zhì)、細胞質(zhì)與背景的對比度較低,而且背景和細胞質(zhì)的顏色不均勻,導致雙閥值分割的方法難以準確、快速的將細胞質(zhì)區(qū)域提取出來。圖2(a)和(d)分別為兩幅微核圖像(CB法培養(yǎng)),RGB格式,尺寸1500X1000pixel,分別采用最大熵法和迭代法對其進行雙閾值分割;圖2(b)和(e)分別為分割出的細胞質(zhì)區(qū)域,可以看出,細胞質(zhì)區(qū)域被大量的污染區(qū)域所包圍、干擾;圖2(c)和(f)分別為分割出的細胞核(微核)區(qū)域,可以看出,細胞核(微核)區(qū)域又被部分細胞質(zhì)所包圍、干擾??梢姡捎梅椒↖I,在分割細胞質(zhì)、細胞核(微核)的具體實現(xiàn)過程中存在著嚴重的干擾,難以準確、快速的將細胞質(zhì)信息、細胞核(微核)信息分別提取出來。由上述分析可見,在CB法微核圖像的自動分析過程中(1)若采用方法I,處理速度較快,但由于該方法僅有細胞核(微核)的信息可利用,卻無細胞質(zhì)信息(即細胞輪廓)可利用,存在著較為嚴重的缺陷,易產(chǎn)生假計數(shù);(2)若采用方法II,理論上可同時利用細胞質(zhì)和細胞核的信息來判別雙核淋巴細胞,與方法I相比,識別應(yīng)該更準確,但雙閾值分割方法難以準確分割出細胞質(zhì)的信息;(3)考慮到微核圖像快速自動分析的要求,其他更為復(fù)雜的分割算法也不宜采用。因此,若想實現(xiàn)雙核淋巴細胞區(qū)域的準確、快速自動識別,就必須要切實解決細胞質(zhì)的準確分割這一難題。
發(fā)明內(nèi)容本發(fā)明的目的便是解決上述難題,設(shè)計出了一種CB法微核圖像中雙核淋巴細胞區(qū)域的準確、快速、自動提取的方法。按照標準方法(中華人民共和國衛(wèi)生行業(yè)標準-WS/T187-1999,淋巴細胞微核估算受照劑量方法)進行微核制片,對于采集(顯微鏡物鏡放大倍數(shù)20X)到的RGB格式的微核圖像,本發(fā)明中雙核淋巴細胞目標區(qū)域的快速準確提取是按照如下步驟完成的1代數(shù)減運算對于采集到的RGB格式的微核圖像MN—rgb(尺寸為1500X1000pixel),進行代數(shù)減運算(R分量-B分量,其中R為紅色分量、B為藍色分量)。利用代數(shù)減運算初步獲得的目標圖像MN—rb中,還含有椒鹽噪聲和面積大小不一的污染區(qū)域,需要分別采用中值濾波和形態(tài)學濾波的方法進行處理。2中值濾波對代數(shù)減運算得到的目標圖像MN—rb采用中值濾波(5X5窗口)進行濾波降噪,主要考慮了如下因素(l)微核圖像分割時大量存在的是椒鹽噪聲,中值濾波恰好可以較好的濾除圖像中的椒鹽噪聲,且同時能較好的保護目標區(qū)域的邊界;(2)中值濾波的缺點是"有時會濾除圖像中的細線狀的和小塊的目標區(qū)域",然而微核圖像中不存在細線狀目標(核質(zhì)橋除外),所濾除的"小塊目標區(qū)域"也遠達不到微核的大小,即微核不會被濾除,細胞核更不會被濾除;(3)與其它濾波算法相比,中值濾波算法簡單、運算量小,能夠滿足微核圖像快速分析的需要;(4)后續(xù)采用形態(tài)學濾波和面積閾值方法濾除微小目標時,不至于再對每個噪聲和污點都進行分析,可以提高運算速度。3形態(tài)學濾波中值濾波后的目標圖像(已轉(zhuǎn)化為二值圖像),采用半徑為6的圓盤(disk,r=6)先進行開運算、然后再進行閉運算,濾除圖像中的雜質(zhì)和面積較小的污染區(qū)域,而保留下淋巴細胞區(qū)域和面積稍大的少數(shù)污染區(qū)域,同時目標區(qū)域內(nèi)部的小孔洞也能被填充。對于保留的面積稍大的少數(shù)污染區(qū)域,需要進一步采用設(shè)定面積閾值和灰度均值的方法來進行剔除。4剔除邊界區(qū)域?qū)τ诤驼⒑藞D像邊界有粘連的目標區(qū)域進行剔除。5面積閥值計算并統(tǒng)計一定數(shù)量(〉200)獨立淋巴細胞的面積(Area)分布情況,設(shè)定其面積分布范圍為[A1,A2],可以對Area<Al和Area>A2的目標區(qū)域進行剔除。Area〉A(chǔ)l的目標區(qū)域為淋巴細胞區(qū)域和少數(shù)面積較大的污染區(qū)域,對于污染區(qū)域采用灰度閾值進行剔除。在物鏡20X、目鏡10X時觀察微核樣片,視野中的淋巴細胞、細胞核及微核均能用肉眼看清楚,且大小合適。物鏡20X下采集微核圖像,尺寸設(shè)定為1000X750pixel,目測確定500個獨立的淋巴細胞,計算并統(tǒng)計其面積分布情況。500個獨立淋巴細胞的面積分布見圖3,面積平均值為2223.5pixel,其中AreaG[lOOO,3500]的細胞百分比為98.2%;而AreaE[1000,1500]的細胞僅占觀測細胞總數(shù)的7.6%,其中絕大部分為單核淋巴細胞,且細胞核被細胞壁緊緊裹住,導致這些淋巴細胞的面積偏小。因此,設(shè)定淋巴細胞的面積下限值A(chǔ)l-1000pixel。對亍面積超過3500pixd的目標區(qū)域,主要是面積巨大的淋巴細胞或者是有粘連的細胞區(qū)域,故可設(shè)置A2=3500pixel。因此,通過設(shè)定面積閾值[1000,3500pixel]能夠初步完成對獨立淋巴細胞區(qū)域的初步提取。對于Area〉3500pixel區(qū)域中有粘連的淋巴細胞,可分為三種情況,即細胞串聯(lián)、細胞并聯(lián)、細胞串并聯(lián),見圖4。其中串聯(lián)的細胞區(qū)域的粘連較為簡單,且所占比例較大,應(yīng)予以分離和判別;而并聯(lián)和串并聯(lián)細胞區(qū)域的粘連情況較為復(fù)雜,即便人工觀察也比較費力,采用計算機圖像分析時更加困難,極易導致錯誤計數(shù),且浪費時間,故不予分析。如果不分析粘連細胞區(qū)域,則設(shè)定A2=3500pixel;如果對粘連的淋巴細胞區(qū)域進行分離和識別,則應(yīng)該合理的設(shè)置面積上限閾值A(chǔ)2,從而保留粘連的細胞區(qū)域;本識別方法中僅對串聯(lián)的細胞區(qū)域進行識別。細胞串聯(lián)可以是2個細胞串聯(lián),也可以是3個串聯(lián),甚至是更多個(但較為少見),見圖4(a)和(d);細胞并聯(lián)則至少要有3個細胞,見圖4(b);而細胞的串并聯(lián)至少要有4個細胞,見圖4(c)。因此,將3個細胞的平均面積之和作為上限閾值,即2223.5X3=6670.5pixel,并適當擴大為A2=8000pixel。6圓度閾值圓度,也稱形狀因子(Figureparameter,FP),主要用來描述目標區(qū)域邊界的復(fù)雜程度,其值介于01之間。目標區(qū)域越接近圓形,其圓度值越接近l;而其它形狀的目標區(qū)域的圓度值都小于1;邊界越復(fù)雜,圓度值越小。圓度計算公式為尸尸=4"。/《,式中^。為目標區(qū)域的面積;尸o為目標區(qū)域的周長(即區(qū)域邊界8鏈碼的長度)。計算并統(tǒng)計一定數(shù)量(>200)獨立淋巴細胞的圓度值,當FP20.5時,目標區(qū)域為獨立的淋巴細胞或邊界較為光滑的污染區(qū)域;當fP〈0.5時,目標區(qū)域為有粘連的細胞區(qū)域或形態(tài)不規(guī)則的污染區(qū)域。因此,設(shè)定圓度閾值尸尸=0.5。7灰度閾值對于Areae[Al,A2]的目標區(qū)域,由于污染區(qū)域內(nèi)部不含細胞核,其灰度均值偏高(記為&),而細胞區(qū)域內(nèi)部含有細胞核(微核),其灰度均值偏低(記為A)。計算出整幅微核圖像的灰度均值(記為^),滿足^</^<//,,設(shè)置一個較小的調(diào)節(jié)閾值^(<5=8),若某區(qū)域的灰度均值/V"^C"。-。,即為污染區(qū)域,進行剔除。保留下來的目標區(qū)域,其Area〉A(chǔ)l、灰度均值/V^〈C"。-。,即為淋巴細胞區(qū)域。圖5為一幅微核圖像,其內(nèi)部的ll個目標區(qū)域己用其外接矩形標記,分別計算其灰度均值、面積和圓度,結(jié)果見表2。其中圖5的灰度均值為163.05。<table>tableseeoriginaldocumentpage6</column></row><table>由表2可以看出首先采用面積閾值,即滿足AreaE[1000,3500]的目標區(qū)域有2、4、5、7、8、10、11;然后利用圓度閾值篩選,即滿足尸尸>0.5的目標區(qū)域為2、4、5、10、11;再利用灰度閥值篩選,區(qū)域10和11的灰度均值分別為167.3453和156.6102,均明顯大f2,4,5區(qū)域的灰度均值,故只保留子區(qū)域2,4和5。對照圖5可以看出,目標區(qū)域2、4和5均為獨立的淋巴細胞,己被準確的提取出來。8串聯(lián)淋巴細胞的提取對于3500<Area<8000pixel、F尸〈0.5、//grey<(//。-。的區(qū)域,能夠準確的判別為有粘連的淋巴細胞區(qū)域。延展度(Elongation,El),也稱體態(tài)比,指目標區(qū)域的短軸與長軸之比,其值介T01之間。目標區(qū)域越接近圓形或方形時E1值越接近于1,若E1值越小則表示目標區(qū)域越扁平,該特征可把較纖細的物體與方形或圓形物體區(qū)分開。統(tǒng)計一定數(shù)量(>200)粘連淋巴細胞的延展度,設(shè)定延展度閾值El-0.8,當EK0.8時,目標區(qū)域為串聯(lián)的淋巴細胞。9雙核淋巴細胞的判別對于提取出來的淋巴細胞區(qū)域2、4和5,再按如下準則判別其是否為雙核淋巴細胞-(1)淋巴細胞輪廓內(nèi)部含兩個獨立的細胞核,若為單核、三核、四核及多核,均舍棄;(2)雙核面積接近、色度深淺相同;(3)如果雙核之間有一個或多個核質(zhì)橋連接,橋?qū)挷粦?yīng)寬于主核直徑的1/4;(4)雙核邊界可以粘連,但不應(yīng)該重疊,若粘連則必須能識別各自的界限。本發(fā)明與已有的微核圖像分割方法比較,雙核淋巴細胞目標區(qū)域的提取效果理想,而且速度較快,既克服了方法I的缺陷,又徹底解決了方法II難以實現(xiàn)的雙核淋巴細胞輪廓的提取問題,為微核圖像的自動分析提供了技術(shù)保障。本發(fā)明對雙核淋巴細胞區(qū)域的提取,首先根據(jù)微核圖像的特點進行了代數(shù)減運算,然后逐步增加條件、篩選出了圖像中所需的目標區(qū)域。這種分析思路同樣適用于其它顯微圖像中特定目標區(qū)域的提取。圖1為方法I所不能正確判別和計數(shù)的微核圖像;圖2為方法II分割出的細胞質(zhì)和細胞核(微核)圖像;圖3為500個獨立淋巴細胞的面積分布直方圖;圖4為淋巴細胞串聯(lián)、并聯(lián)、串并聯(lián)的示意圖5為將圖11中各目標區(qū)域的輪廓與圖8相疊加的效果圖,其中02和05子區(qū)域為雙核淋巴細胞;圖6是本發(fā)明提取雙核淋巴細胞的流程框圖7為本發(fā)明設(shè)計的CB法微核圖像自動分析的流程圖8為一幅實際的微核圖像;圖9為采用代數(shù)減運算(R分量-B分量)得到的二值圖像;圖10為采用中值濾波和形態(tài)學濾波,并移除邊界目標后的圖像(已取反顯示);圖11為采用面積閾值方法濾除Area〈Al目標區(qū)域后的圖像。具體實施例方式本發(fā)明中有關(guān)算法的實現(xiàn)是在MATLAB7.0中實現(xiàn)的,實施步驟如下1代數(shù)減運算MN0=imread('Name.jpg,);。/。讀入微核圖像Name.jpgMN—rb=[MN0(:,:,l)HMN0(:,:,3)];%代數(shù)減,R分量-B分量2中值濾波MN—m=medfilt2(MN—rb,[55]);%對MN_rb進行中值濾波,5X5窗口3形態(tài)學濾波sel=strel('disk',6);%建立1"=6的圓盤結(jié)構(gòu)元素MN—close=imclose(MN_m,sel);%形態(tài)閉運算MN_open=imopen(MN一close,sel);%形態(tài)開運算se2=strel('disk',l);%建立1"=1的圓盤結(jié)構(gòu)元素SM=imerode(MN—open,se2);%邊界平滑,腐蝕運算l次SMI=imerode(SM,se2);%再腐蝕運算1次4移除邊界目標SM2=imclearborder(SMl);%移除邊界粘連區(qū)域5獨立淋巴細胞的判別條件為'Areae[1000pixe/,<FP20,56串聯(lián)淋巴細胞的判別與分離串聯(lián)淋巴細胞區(qū)域的判別條件為Areae[3500/7/xe/,8000/7—F尸<0.5'五/<0.8串聯(lián)淋巴細胞的分離,參考并改進了傅蓉等人在《計算機工程與應(yīng)用》,2007,43(17):21-23上發(fā)表的"基于凹點搜索的重疊細胞圖像自動分離的算法研究",即首先尋找分離點對,然后連接分離點對。分離點對位于串聯(lián)細胞區(qū)域的輪廓上,且滿足條件①分離點對位于細胞的連接處,②點對之間的距離是局部最短的,并增加一個條件,即"③點對連線上各像素點的灰度值接近",以防有細胞核或微核被連線分割。7雙核淋巴細胞的判別(1)提取一個獨立的淋巴細胞區(qū)域(或分離開的串聯(lián)淋巴細胞),由于此時淋巴細胞僅由細胞質(zhì)、細胞核(微核)兩部分構(gòu)成,利用Otsu方法進行單閼值分割細胞核(微核);(2)對淋巴細胞輪廓內(nèi)的目標區(qū)域(細胞核、微核)進行標記,判別是否有且僅有兩個面積相近、且足夠大的區(qū)域,其圓度值和灰度均值也應(yīng)相近;(3)如果兩個細胞核有粘連,利用延展度(即區(qū)域的短軸和長軸之比)進行判別,并進行分離;(4)如果滿足上述3條,則判別為一個雙核淋巴細胞。8權(quán)利要求1.一種CB法微核圖像自動分析中雙核淋巴細胞區(qū)域的自動提取方法,其特征在于包括如下步驟(1)代數(shù)減運算,R分量-B分量,初步獲得淋巴細胞區(qū)域;(2)利用中值濾波和形態(tài)學濾波,濾除脈沖噪聲和雜質(zhì);(3)統(tǒng)計確定一定數(shù)量獨立淋巴細胞(>200個)的面積分布閾值[A1,A2],Area<A1的區(qū)域予以剔除,Area>A1的目標區(qū)域分為獨立淋巴細胞、粘連淋巴細胞、面積較大的污染;(4)利用灰度閾值,濾除Area>A1目標區(qū)域中的污染區(qū)域;(5)利用圓度閾值和面積閾值,識別區(qū)分獨立的淋巴細胞區(qū)域和有粘連的淋巴細胞區(qū)域;(6)對于獨立的淋巴細胞區(qū)域,利用其輪廓內(nèi)雙核的面積比值、圓度值、灰度均值,判別其是否為雙核淋巴細胞;(7)利用圓度閾值和延展度判別出粘連淋巴細胞中的串聯(lián)細胞,并進行分離,對于并聯(lián)或串并聯(lián)的粘連淋巴細胞不予分析。2.對于權(quán)利要求1所述的微核圖像,其微核標本按照《淋巴細胞微核估算受照劑量方法》(中華人民共和國衛(wèi)生行業(yè)標準WS/T187-1999)進行制備;普通顯微鏡(物鏡放大倍數(shù)20X,冃鏡放大倍數(shù)10X)下自動采集微核圖像,保存為RGB格式。3.對于權(quán)利要求1中面積閾值的上限和下限,即Al=1000pixel和A2=3500pixel,是統(tǒng)計尺寸為1500X1000pixel微核圖像中的一定數(shù)量獨立淋巴細胞得到的;如果微核圖像尺寸改變,則Al和A2的值需按照微核圖像面積改變的比例進行調(diào)整。4.對于權(quán)利要求l中的粘連淋巴細胞區(qū)域,若需要對粘連的淋巴細胞區(qū)域進行分離和識別,則需擴大面積上限閾值A(chǔ)2:8000pixel,從而能保留下粘連的細胞區(qū)域;若不需分析粘連細胞區(qū)域,則可設(shè)置A2=3500pixel,以將其剔除。全文摘要本發(fā)明涉及輻射生物劑量學領(lǐng)域中CB法微核圖像中雙核淋巴細胞區(qū)域的準確、快速自動提取,實現(xiàn)步驟如下對采集的RGB格式、尺寸為1500×1000pixel微核圖像MN_rgb進行代數(shù)減運算(R分量-B分量),獲得圖像MN_rb;對圖像MN_rb進行中值濾波(5×5窗口)和形態(tài)學濾波(disk,r=6),并剔除邊界粘連的區(qū)域,獲得圖像MN_m;然后利用圓度閾值和灰度閾值篩選Area∈[1000pixel,3500pixel]目標區(qū)域中的獨立淋巴細胞;利用圓度閾值、灰度閾值和延展度篩選Area∈[3500pixel,8000pixel]目標區(qū)域中的串聯(lián)細胞,并進行分離;判別獨立的或分離后的淋巴細胞是否為雙核淋巴細胞。本發(fā)明設(shè)計的方法實現(xiàn)了CB法微核圖像中雙核淋巴細胞的自動提取,具有提取準確、快速等優(yōu)點,為研制CB法微核圖像的自動分析系統(tǒng)邁出了至為關(guān)鍵的一步。文檔編號G06T7/60GK101639941SQ200910000649公開日2010年2月3日申請日期2009年1月13日優(yōu)先權(quán)日2009年1月13日發(fā)明者張學清,曹珍山,杰杜,閆學昆,英陳,駱億生申請人:中國人民解放軍軍事醫(yī)學科學院放射與輻射醫(yī)學研究所