本發(fā)明屬于圖像重建
技術(shù)領(lǐng)域:
,尤其涉及一種基于gpu加速pet圖像重建的方法。
背景技術(shù):
:小動物pet系統(tǒng)因其能在生物實(shí)驗(yàn)中得到高分辨率的圖像而得到廣泛的發(fā)展。而采用一對平板探測器的pet成像系統(tǒng),由于其結(jié)構(gòu)簡潔,工程上易于實(shí)現(xiàn),兼有開放性和可調(diào)節(jié)性,一直受到研究人員的關(guān)注。同時在諸多臨床聚焦性檢查和治療中,需要針對局部部位得到高質(zhì)量的pet圖像。基于平板結(jié)構(gòu)的系統(tǒng)可針對特定部位和特定應(yīng)用進(jìn)行系統(tǒng)定制和優(yōu)化,在可承受的成本下獲得高的靈敏度和空間分辨率。這些優(yōu)勢在針對特定部位腫瘤的治療規(guī)劃和療效監(jiān)測方面具有獨(dú)特的潛在價值。然而當(dāng)想進(jìn)一步提升靈敏度時,doi效應(yīng)成為了首要解決的問題。為了解決doi問題,各種基于物理與統(tǒng)計模型的重建方法被提出來。盡管這些方法起到了顯著的作用,然而巨大的計算量不能有效的使用這些方法。doi效應(yīng)的主要問題是仿真模型與實(shí)際的成像過程存在偏差,可通過更為復(fù)雜物理與統(tǒng)計模型來仿真系統(tǒng)矩陣解決此問題然而復(fù)雜的數(shù)學(xué)模型往往會使得系統(tǒng)矩陣的數(shù)據(jù)量更為龐大。綜上所述,現(xiàn)有技術(shù)存在的問題是:目前解決doi效應(yīng)的方法存在巨大的計算量不能有效的使用,使得系統(tǒng)矩陣的數(shù)據(jù)量更為龐大。技術(shù)實(shí)現(xiàn)要素:針對現(xiàn)有技術(shù)存在的問題,本發(fā)明提供了一種基于gpu加速pet圖像重建的方法。本發(fā)明是這樣實(shí)現(xiàn)的,一種基于gpu加速pet圖像重建的方法,所述基于gpu加速pet圖像重建的方法包括以下步驟:步驟一,通過蒙特卡羅仿真生成系統(tǒng)矩陣,根據(jù)平板pet系統(tǒng)的對稱性,分別基于響應(yīng)線與體素提取系統(tǒng)矩陣的子集;步驟二,數(shù)據(jù)輸入,基于系統(tǒng)矩陣關(guān)于響應(yīng)線的子集,進(jìn)行前向投影的計算,計算過程中根據(jù)響應(yīng)線的對稱性計算系統(tǒng)矩陣關(guān)于響應(yīng)線的子集的補(bǔ)集;步驟三,基于系統(tǒng)矩陣關(guān)于體素的子集,進(jìn)行反向投影的計算,計算過程中根據(jù)體素的對稱性計算系統(tǒng)矩陣關(guān)于體素的子集的補(bǔ)集,對重建圖像進(jìn)行數(shù)據(jù)更新,迭代結(jié)束,數(shù)據(jù)輸出。進(jìn)一步,所述基于gpu加速pet圖像重建的方法包括以下步驟:步驟一,獲得系統(tǒng)矩陣,通過蒙特卡羅仿真生成系統(tǒng)矩陣,擁有80×104×208個體素,以保證系統(tǒng)矩陣中擁有對稱性的響應(yīng)線穿過相同個數(shù)的體素;步驟二,數(shù)據(jù)輸入,從掃描的γ射線獲得符合數(shù)據(jù),經(jīng)過預(yù)處理后,由cpu讀入到內(nèi)存中,再由內(nèi)存導(dǎo)入顯存中;將系統(tǒng)矩陣基于響應(yīng)線的子集讀入顯存,循環(huán)系統(tǒng)矩陣基于響應(yīng)線子集中的響應(yīng)線,循環(huán)過程中為每條與子集中響應(yīng)線平行的響應(yīng)線分配一個block來執(zhí)行,每層重建圖像中的體素后插入與其有對稱關(guān)系的三個體素,并導(dǎo)入gpu的紋理內(nèi)存中;步驟三,反向投影,將系統(tǒng)矩陣基于體素的子集讀入顯存,循環(huán)前40層,若每層所需視野范圍為80×160個體素,則需要為每層40×80個體素分配至gpu中的單獨(dú)block來執(zhí)行,重建所需前向投影數(shù)據(jù)的每個數(shù)據(jù)后插入與其有對稱關(guān)系的其它七個數(shù)據(jù),并存儲在gpu的紋理內(nèi)存中;步驟四,數(shù)據(jù)更新,對重建圖像每個體素進(jìn)行更新,若迭代未結(jié)束,重復(fù)前向投影的計算,迭代結(jié)束,數(shù)據(jù)輸出。進(jìn)一步,所述步驟一中:基于體素的系統(tǒng)矩陣子集為探測器中心晶體所對應(yīng)的前40層所有體素40×16個及穿過這些體素的響應(yīng)線,從平板探測器大小為52×104個晶體的所組成的pet系統(tǒng)對應(yīng)的系統(tǒng)矩陣中提取基于體素的系統(tǒng)矩陣子集。進(jìn)一步,所述步驟二中:線程分配過程如下:(1)根據(jù)gpu的特性設(shè)置每個block的尺寸;(2)根據(jù)系統(tǒng)矩陣子集中的響應(yīng)線的位置計算平行響應(yīng)線的個數(shù);(3)根據(jù)平行響應(yīng)線的個數(shù)設(shè)置block的個數(shù);(4)按照所述線程塊設(shè)置執(zhí)行內(nèi)核程序。進(jìn)一步,所述(4)中每個block計算與子集中平行的響應(yīng)線的同時,計算與平行響應(yīng)線存在對稱關(guān)系的另外三條響應(yīng)線,四條響應(yīng)線擁有相同的權(quán)值,且相同權(quán)值的體素位置對稱。進(jìn)一步,所述步驟三中:線程分配過程如下:(1)根據(jù)gpu的特性設(shè)置每個block的尺寸;(2)根據(jù)所需視野范圍設(shè)置所述block的個數(shù);(3)按照所述block設(shè)置執(zhí)行內(nèi)核程序。進(jìn)一步,所述(3)中每個block計算當(dāng)前體素及其穿過的響應(yīng)線的同時計算與其擁有對稱關(guān)系的七個體素,穿過八個體素的響應(yīng)線擁有對稱關(guān)系,且權(quán)值相同。本發(fā)明的另一目的在于提供一種應(yīng)用所述基于gpu加速pet圖像重建的方法的pet成像系統(tǒng)。本發(fā)明的另一目的在于提供一種應(yīng)用所述基于gpu加速pet圖像重建的方法的平板pet系統(tǒng)。本發(fā)明的優(yōu)點(diǎn)及積極效果為:使用的系統(tǒng)矩陣由蒙特卡洛(mc)仿真而成,它包含3百萬的lor和1百萬的體素。這給系統(tǒng)矩陣的存儲與使用帶來了極大的困難;cheng-yingchou等使用系統(tǒng)矩陣基于lor的子集,再基于lor的對稱性來重建的方法使這個問題的到了極大的改善(choucy,dongy,hungy,etal.acceleratingimagereconstructionindual-headpetsystembygpuandsymmetryproperties.[j].plosone,2012,7(12):e50540.),但基于lor的系統(tǒng)矩陣在反向投影的計算中使用極為不便。與使用基于lor的系統(tǒng)矩陣相類似,系統(tǒng)矩陣基于體素的子集,在前向投影的計算中也有同樣的問題;而本發(fā)明將兩種算法結(jié)合起來,使得重建速度進(jìn)一步提高。本發(fā)明能夠有效的減少pet圖像重建的時間,提高算法效率,適用于平板pet系統(tǒng);針對復(fù)雜的數(shù)學(xué)模型帶來的巨大計算量的問題,能有效減少pet圖像重建的時間;同時在相同的時間內(nèi)本發(fā)明迭代次數(shù)更多,能夠有效的提升重建圖像的靈敏度;本發(fā)明使用ml-em算法來進(jìn)行重建,ml-em算法是一種迭代重建算法,迭代重建算法越接近收斂狀態(tài),重建效果越好,靈敏度也越高。相同的時間內(nèi)本發(fā)明迭代次數(shù)更多,更接近收斂狀態(tài)。本發(fā)明適用于平板pet系統(tǒng),能夠?yàn)檠芯啃游矬w內(nèi)代謝過程以及生物體局部代謝狀態(tài)提供更為精確的功能信息;在更短時間內(nèi)成像可以實(shí)現(xiàn)對一些動態(tài)的生理過程的實(shí)時觀測。同時高分辨率的pet圖像在確定腫瘤的生物靶區(qū)方面能提供精確的信息,從而幫助醫(yī)生規(guī)劃更為精確的治療方案;另外高靈敏度和高分辨率的pet成像能對早期復(fù)發(fā)的微小病灶進(jìn)行檢測,為制定下一步治療方案提供重要信息。加速前后前向投影與反向投影單次迭代時間對比,其前向投影加速了125倍,反向投影加速了98倍,單次迭代時間加速了111倍。附圖說明圖1是本發(fā)明實(shí)施例提供的基于gpu加速pet圖像重建的方法流程圖。圖2是本發(fā)明實(shí)施例提供的基于cpu的pet圖像重建結(jié)果示意圖。圖3是本發(fā)明實(shí)施例提供的基于gpu的pet圖像加速重建結(jié)果示意圖。圖4是本發(fā)明實(shí)施例提供的圖2、圖3pet圖像重建結(jié)果取中心一列像素的對比曲線示意圖。具體實(shí)施方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合實(shí)施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。下面結(jié)合附圖對本發(fā)明的應(yīng)用原理作詳細(xì)的描述。如圖1所示,本發(fā)明實(shí)施例提供的基于gpu加速pet圖像重建的方法包括以下步驟:s101:通過蒙特卡羅仿真生成系統(tǒng)矩陣,根據(jù)平板pet系統(tǒng)的對稱性,分別基于lor與體素提取系統(tǒng)矩陣的子集;s102:數(shù)據(jù)輸入,基于系統(tǒng)矩陣關(guān)于lor的子集,進(jìn)行前向投影的計算,計算過程中根據(jù)lor的對稱性計算系統(tǒng)矩陣關(guān)于lor的子集的補(bǔ)集;s103:基于系統(tǒng)矩陣關(guān)于體素的子集,進(jìn)行反向投影的計算,計算過程中根據(jù)體素的對稱性計算系統(tǒng)矩陣關(guān)于體素的子集的補(bǔ)集,對重建圖像進(jìn)行數(shù)據(jù)更新,迭代結(jié)束,數(shù)據(jù)輸出。下面結(jié)合具體實(shí)施例對本發(fā)明的應(yīng)用原理作進(jìn)一步的描述。本發(fā)明的實(shí)施例結(jié)合每個平板探測器擁有(26×52)個晶體的平板pet系統(tǒng)為例進(jìn)行描述;具體包括以下步驟:步驟1,獲得系統(tǒng)矩陣通過蒙特卡羅仿真生成系統(tǒng)矩陣,擁有80×104×208個體素,以保證系統(tǒng)矩陣中擁有對稱性的lor穿過相同個數(shù)的體素。基于lor的系統(tǒng)矩陣子集為一探測器邊角晶體與另一探測器所有晶體所連接lor的集合,共計26×52條。對所有系統(tǒng)矩陣子集中l(wèi)or所穿過的體素進(jìn)行坐標(biāo)變換,變換后所有體素位于80×204×308的體素空間內(nèi),以保證對lor進(jìn)行平移運(yùn)算時,其體素不超過視野范圍。基于體素的系統(tǒng)矩陣子集為探測器中心晶體所對應(yīng)的前40層所有體素(40×16個)及穿過這些體素的lor,為保證通過對稱性可得到完整的系統(tǒng)矩陣,應(yīng)從平板探測器大小為(52×104)個晶體的所組成的pet系統(tǒng)對應(yīng)的系統(tǒng)矩陣中提取基于體素的系統(tǒng)矩陣子集,使得通過平移性計算其它體素所穿過的lor時沒有缺失,同時為保證其與基于lor計算得到的系統(tǒng)矩陣擁有相同的視野范圍,應(yīng)對體素子集中的體素進(jìn)行坐標(biāo)變換。步驟2,前向投影數(shù)據(jù)輸入,從掃描的γ射線獲得符合數(shù)據(jù),經(jīng)過預(yù)處理后,由cpu讀入到內(nèi)存中,再由內(nèi)存導(dǎo)入顯存中。將系統(tǒng)矩陣基于lor的子集讀入顯存,循環(huán)系統(tǒng)矩陣基于lor子集中的lor,循環(huán)過程中為每條與子集中l(wèi)or平行的lor分配一個block來執(zhí)行,每層重建圖像中的體素后插入與其有對稱關(guān)系的三個體素,并導(dǎo)入gpu的紋理內(nèi)存中,其中線程分配過程如下:(1)根據(jù)gpu的特性設(shè)置每個block的尺寸;(2)根據(jù)系統(tǒng)矩陣子集中的lor的位置計算平行l(wèi)or的個數(shù);(3)根據(jù)平行l(wèi)or的個數(shù)設(shè)置block的個數(shù);(4)按照所述線程塊設(shè)置執(zhí)行內(nèi)核程序;步驟(4)中每個block計算與子集中平行的lor的同時,計算與平行l(wèi)or存在對稱關(guān)系的另外三條lor,四條lor擁有相同的權(quán)值,且相同權(quán)值的體素位置對稱。步驟3,反向投影將系統(tǒng)矩陣基于體素的子集讀入顯存,循環(huán)前40層,若每層所需視野范圍為(80×160)個體素,則需要為每層(40×80)個體素分配至gpu中的單獨(dú)block來執(zhí)行,超過所需視野范圍的體素不計算,重建所需前向投影數(shù)據(jù)的每個數(shù)據(jù)后插入與其有對稱關(guān)系的其它七個數(shù)據(jù),并存儲在gpu的紋理內(nèi)存中,其中線程分配過程如下:(1)根據(jù)gpu的特性設(shè)置每個block的尺寸;(2)根據(jù)所需視野范圍設(shè)置所述block的個數(shù);(3)按照所述block設(shè)置執(zhí)行內(nèi)核程序;步驟(3)中每個block計算當(dāng)前體素及其穿過的lor的同時計算與其擁有對稱關(guān)系的七個體素,穿過八個體素的lor擁有對稱關(guān)系,且權(quán)值相同。步驟4,數(shù)據(jù)更新對重建圖像每個體素進(jìn)行更新,若迭代未結(jié)束,重復(fù)前向投影的計算,迭代結(jié)束,數(shù)據(jù)輸出。下面結(jié)合對比對本發(fā)明的應(yīng)用效果作詳細(xì)的描述。通過蒙特卡羅仿真十二個同樣大小的點(diǎn)源,直徑為0.5mm,活度為1μci,得到前向數(shù)據(jù),所用的平板pet系統(tǒng)每個平板探測器擁有(26×52)個晶體,每個晶體表面大小為(2㎜×2㎜),重建體素大小為(0.5㎜×0.5㎜×0.5㎜)。對仿真的前向數(shù)據(jù)分別使用加速前的算法與加速后的算法重建,對比起重建結(jié)果與重建時間。圖2是加速前迭代30次的重建圖像。圖3是加速后迭代30次的重建圖像。圖4對比加速前后的重建圖像,取重建圖像中心一列像素做對比,兩條曲線完全重合。表1是加速前后前向投影與反向投影單次迭代時間對比,其前向投影加速了125倍,反向投影加速了98倍,單次迭代時間加速了111倍。表1加速前后前向投影與反向投影時間對比前向投影(s)前向投影(s)合計(s)加速前182.078159.346341.424加速后1.4531.6123.065本發(fā)明能夠直接應(yīng)用到pet成像領(lǐng)域。特別是在復(fù)雜的數(shù)學(xué)模型導(dǎo)致系統(tǒng)矩陣計算量巨大的情況之下,加速效果尤為明顯。適用于平板pet系統(tǒng),能夠?yàn)檠芯啃游矬w內(nèi)代謝過程以及生物體局部代謝狀態(tài)提供更為精確的功能信息。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁12