專利名稱:基于數(shù)據(jù)挖掘的腦部膠質(zhì)瘤計(jì)算機(jī)輔助診斷系統(tǒng)的實(shí)現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于數(shù)據(jù)挖掘的腦部膠質(zhì)瘤計(jì)算機(jī)輔助診斷系統(tǒng)的實(shí)現(xiàn)方法,涉及模式識(shí)別、數(shù)據(jù)挖掘和放射醫(yī)學(xué)等領(lǐng)域,能直接應(yīng)用于腦部膠質(zhì)瘤惡性程度高低的計(jì)算機(jī)輔助診斷。
背景技術(shù):
腦部膠質(zhì)瘤是一種較為罕見(jiàn)的疾病,治療主要取決于腫瘤的惡性程度。其惡性程度的正確判別關(guān)系到是否需要為病人進(jìn)行危險(xiǎn)程度很高的腦部手術(shù)。若能較可靠地根據(jù)病人癥狀判斷出惡性程度的高與低就可能避免不必要的手術(shù)風(fēng)險(xiǎn)和開(kāi)支。
當(dāng)前腦膠質(zhì)瘤惡性程度的診斷主要依據(jù)是腦核磁共振圖像的分析。但對(duì)于大多數(shù)放射科醫(yī)生,由于缺乏積累足夠病例的機(jī)會(huì),進(jìn)行正確判斷是一困難的工作。楊本強(qiáng)等(楊本強(qiáng),吳振化,周麗娟大腦膠質(zhì)瘤病的MRI診斷中國(guó)臨床醫(yī)學(xué)影像雜志2000.11(4)229-231)探討了核磁共振圖像在腦膠質(zhì)瘤惡性程度診斷方面的臨床價(jià)值,并結(jié)合9例病例分析了腦膠質(zhì)瘤惡性程度診斷的部分經(jīng)驗(yàn)。但由于病例較少,可供正確判斷的經(jīng)驗(yàn)仍很難總結(jié)。顯然,如果一腦膠質(zhì)瘤病人的惡性程度被錯(cuò)誤診斷,將會(huì)造成治療的延誤或極大的手術(shù)風(fēng)險(xiǎn)。為解決該問(wèn)題,可從一個(gè)大的醫(yī)療中心(如上海市華山醫(yī)院-國(guó)內(nèi)神經(jīng)外科最著名的醫(yī)院之一)收集大量的病例,從中發(fā)現(xiàn)核磁共振圖像的讀片結(jié)果與腦膠質(zhì)瘤惡性程度之間的規(guī)律。
計(jì)算機(jī)輔助醫(yī)療診斷是人工智能的一個(gè)研究方向,將它用于腦部膠質(zhì)瘤惡性程度的判別可以使更多的醫(yī)生利用該方面已積累的知識(shí)或經(jīng)驗(yàn)。實(shí)現(xiàn)這一目標(biāo)首先需要解決的問(wèn)題是如何獲得診斷知識(shí)(癥狀和疾病惡性程度間的規(guī)律)。傳統(tǒng)的方法是由專門的人員向擅長(zhǎng)診斷這一疾病的人類專家請(qǐng)教,然后對(duì)專家總結(jié)的規(guī)律進(jìn)行整理并將它們形式化作為計(jì)算機(jī)診斷的依據(jù)。然而,這一過(guò)程中存在著知識(shí)獲取的“瓶頸”。數(shù)據(jù)挖掘(Data mining)作為機(jī)器學(xué)習(xí)領(lǐng)域的新熱點(diǎn)為解決這一問(wèn)題提供了新的手段。但必須考慮下列一些要求1)正確性達(dá)到領(lǐng)域?qū)<业乃?,診斷正確率應(yīng)超過(guò)80%。
2)容錯(cuò)性對(duì)于相同的腦核磁共振圖像不同的放射科醫(yī)生可能得出不同的描述。以膠質(zhì)瘤的外形為例,可能的描述包括圓形、橢圓形、不規(guī)則形,而在實(shí)際情況下,并不存在精確的圓形或橢圓形。對(duì)于這種不確定性,應(yīng)盡可能保持診斷結(jié)果的穩(wěn)健。
3)缺失值由于費(fèi)用或必要性方面的原因,一些診斷病例中某些項(xiàng)目的值為空。此時(shí)仍能有效判斷。
4)可理解性診斷規(guī)律應(yīng)能被放射科醫(yī)生理解,最好是簡(jiǎn)潔的語(yǔ)言描述。
Aptéand和Weiss(AptéChidanand and Weiss Sholom(1997)“Data miningwith decision trees and decision rules”“Future Generation ComputerSystems”,1997,13,pp.197-210)提出用決策樹(shù)方法來(lái)發(fā)現(xiàn)診斷規(guī)律,但生成的決策樹(shù)節(jié)點(diǎn)很多,不易理解,并且容易出現(xiàn)過(guò)擬合問(wèn)題(因數(shù)據(jù)噪聲而產(chǎn)生多余的決策樹(shù)節(jié)點(diǎn))。Agrawal(Agrawal R,Mannila H,Srikant R,Toivonen H.,andVerkamo A.I.(1998)“Fast Discovery of Association Rules”“Advances inKnowledge Discovery and Data Mining”(Morgan Kaufmann,San Mateo,CA)UsamaM.fayyad pp.307-328)等提出粗糙集理論來(lái)挖掘關(guān)聯(lián)規(guī)則。但粗糙集理論不易處理實(shí)數(shù)型數(shù)據(jù)和不確定描述,生成的規(guī)則數(shù)量較多,不簡(jiǎn)潔并且不易理解?;贐P訓(xùn)練學(xué)習(xí)算法的多層感知器網(wǎng)絡(luò)能得到高的診斷正確率但可理解性非常差。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對(duì)現(xiàn)有技術(shù)的不足,提出一種基于數(shù)據(jù)挖掘的腦部膠質(zhì)瘤計(jì)算機(jī)輔助診斷系統(tǒng)實(shí)現(xiàn)方法,根據(jù)收集的腦膠質(zhì)瘤病人的病例庫(kù),挖掘和發(fā)現(xiàn)腦膠質(zhì)瘤惡性程度的診斷規(guī)則,并根據(jù)此規(guī)則來(lái)建立腦膠質(zhì)瘤惡性程度計(jì)算機(jī)輔助診斷專家系統(tǒng),用于腦膠質(zhì)瘤惡性程度的自動(dòng)診斷,以減少誤診率和病人痛苦。
為實(shí)現(xiàn)這樣的目的,本發(fā)明采用基于改進(jìn)的模糊極小極大神經(jīng)網(wǎng)絡(luò)(FuzzyMinimum-Maximum Neural Network,F(xiàn)MMNN)的模糊規(guī)則提取方法,從收集的腦膠質(zhì)瘤病人的病例庫(kù)(包括核磁共振圖像(MRI)的讀片結(jié)果以及術(shù)后診斷結(jié)果)中挖掘和發(fā)現(xiàn)腦膠質(zhì)瘤惡性程度的診斷規(guī)則,根據(jù)挖掘和發(fā)現(xiàn)的惡性程度診斷規(guī)則建立腦膠質(zhì)瘤惡性程度計(jì)算機(jī)輔助診斷專家系統(tǒng),再利用所建立的診斷系統(tǒng),對(duì)任何輸入的新案例預(yù)報(bào)得出該案例的惡性程度,從而給醫(yī)生的后續(xù)治療與診斷提供幫助。
本發(fā)明所利用的病例數(shù)據(jù)庫(kù)儲(chǔ)存有從醫(yī)院收集的腦膠質(zhì)瘤病人的信息,包括病人的個(gè)人信息(性別、年齡)、病人的腦核磁共振圖像及其專家的讀片結(jié)果(形狀、輪廓、包膜、水腫、占位效應(yīng)、增強(qiáng)后強(qiáng)化、血供、壞死/囊變、鈣化、出血、T1加權(quán)、T2加權(quán)),每一個(gè)特征描述稱為屬性,病人術(shù)后得到的膠質(zhì)瘤惡性程度診斷結(jié)果分成高度/低度惡性兩個(gè)類別,而包含了某個(gè)病人所有上述屬性值和診斷結(jié)果的記錄稱為樣本,所有這些信息被存儲(chǔ)在一個(gè)專門數(shù)據(jù)庫(kù)中。
本發(fā)明的基于數(shù)據(jù)挖掘的腦部膠質(zhì)瘤計(jì)算機(jī)輔助診斷系統(tǒng)實(shí)現(xiàn)方法按如下步驟進(jìn)行1、屬性的數(shù)字化處理。針對(duì)病例數(shù)據(jù)庫(kù)中每一個(gè)屬性,統(tǒng)計(jì)不同的描述形式,并按照大小(如年齡)、輕重(如水腫)等描述形式進(jìn)行排序,然后分別用相應(yīng)順序的整數(shù)來(lái)代替。即將屬性值映射成一個(gè)整數(shù)序列。對(duì)于不存在的屬性值要標(biāo)明。
2、對(duì)數(shù)值化后的各屬性建立模糊隸屬度數(shù)值化過(guò)程結(jié)束后,定義一個(gè)敏感度因子r,在同一屬性的不同取值間建立隸屬關(guān)系。即,對(duì)于某一個(gè)屬性A,其第k個(gè)取值vk與第j個(gè)取值vj之間的隸屬度值為μ=max(0,1-r|vj-vk|maxA-minA).]]>這里maxA是屬性A的最大取值,minA是屬性A的最小取值。實(shí)驗(yàn)發(fā)現(xiàn)測(cè)試錯(cuò)誤率的大小與r沒(méi)有明顯的規(guī)律,所以很難用高效率的方法優(yōu)化r,一般r取0-10之間的值。
3、超盒生成與擴(kuò)張對(duì)每一個(gè)訓(xùn)練樣本,根據(jù)其類別計(jì)算它到所有的類別相同的超盒的隸屬度,并選擇具有最大隸屬度的超盒Adk。如果不存在相同類別的超盒就生成一個(gè)包括了該訓(xùn)練樣本的超盒;如果存在超盒Adk,就檢驗(yàn)把該訓(xùn)練樣本包括進(jìn)去的超盒擴(kuò)張操作是否導(dǎo)致模糊誤差減小或在模糊誤差不增加的前提下分類錯(cuò)誤率減小,如果減小就執(zhí)行超盒擴(kuò)張操作;否則生成一個(gè)新的超盒。
當(dāng)算法為一個(gè)含有若干缺失屬性的樣本生成超盒時(shí),將超盒在缺失屬性上的上邊界和下邊界放置在該屬性的最大和最小值上。而當(dāng)算法為一個(gè)含有若干缺失屬性的樣本擴(kuò)張超盒時(shí),超盒在對(duì)應(yīng)屬性上的上、下邊界位置保持不變。這一改進(jìn)使FMMNN能夠處理缺失屬性。
在本發(fā)明中,為增強(qiáng)最終結(jié)果的可讀性和可理解性,某樣本到類別相同的超盒的隸屬度mAjk(Sample)是由下式計(jì)算的mAjk(Sample)=mini=1,2,...p(maxe∈Vi′μi,e(Si))=mini=1,2,...p(maxe∈Vi′μi,numeric_presention_of(e)(xi))]]>這里μ為步驟2中定義的某屬性A兩個(gè)不同取值間的隸屬度值。
這里提到的模糊誤差和是為提高算法的穩(wěn)健性而引入的。模糊誤差和Efuzzy=Σi=1nΣc=1l(dic-mic)2,]]>其中n是訓(xùn)練樣本總數(shù),l是樣本類別總數(shù),dic是第i個(gè)樣本類別c的真實(shí)隸屬度值,mic是根據(jù)當(dāng)前分類器獲得的第i個(gè)樣本對(duì)類別c的歸一化隸屬度值。
4、重疊檢測(cè)相同類別的超盒允許重疊,所以只要檢測(cè)某類超盒內(nèi)是否含有不同類別的樣本,或含有的不同類別的樣本是否超過(guò)一個(gè)預(yù)定值,如果是就說(shuō)明不同類別超盒間存在重疊,否則說(shuō)明沒(méi)有重疊。
5、超盒收縮對(duì)存在重疊的超盒,檢驗(yàn)收縮操作是否導(dǎo)致模糊誤差減小或在模糊誤差不增加的前提下分類錯(cuò)誤率減小,如果是就執(zhí)行收縮操作,否則不執(zhí)行。
6、對(duì)超盒進(jìn)行額外的擴(kuò)張上述步驟執(zhí)行結(jié)束后,如果某個(gè)訓(xùn)練樣本的數(shù)值化表示對(duì)不同類別的超盒具有相同的隸屬度值,那么與該樣本同類別的超盒將獲得額外的θ/10(或更小)的微小擴(kuò)張。這些微小的擴(kuò)張只發(fā)生在能夠使該樣本被正確分類的邊界上。在這一過(guò)程中,如果超盒的微小擴(kuò)張導(dǎo)致模糊誤差和Efuzzy減小或分類錯(cuò)誤率減小,就執(zhí)行超盒擴(kuò)張操作;否則不執(zhí)行。
7、如果任意一個(gè)超盒在前面的步驟中被修改,則重復(fù)從第3步開(kāi)始的操作。如果沒(méi)被修改,說(shuō)明已經(jīng)找到了所有的超盒。訓(xùn)練過(guò)程即告結(jié)束。生成的超盒構(gòu)成了一個(gè)模糊分類器。
8、模糊規(guī)則提取將超盒轉(zhuǎn)化成“if…then…”的模糊規(guī)則形式,并據(jù)此整理實(shí)現(xiàn)腦膠質(zhì)瘤惡性程度計(jì)算機(jī)輔助診斷的專家系統(tǒng)。
傳統(tǒng)的FMMNN只包括超盒的生成與擴(kuò)張,重疊檢測(cè)和超盒收縮三個(gè)基本操作。在此基礎(chǔ)上本發(fā)明做了3個(gè)改進(jìn)①為提高穩(wěn)健性,在第3與第6步中的超盒擴(kuò)張中引入模糊誤差Efuzzy=Σi=1nΣc=1l(dic-mic)2]]>其中n是訓(xùn)練樣本總數(shù),l是樣本類別總數(shù),dic是第i個(gè)樣本類別c的真實(shí)隸屬度值,mic是根據(jù)當(dāng)前分類器獲得的第i個(gè)樣本對(duì)類別c的歸一化隸屬度值。②在第3步的超盒生成中,當(dāng)算法為一個(gè)含有若干缺失屬性的樣本生成超盒時(shí),將超盒在缺失屬性上的上邊界和下邊界放置在該屬性的最大和最小值上。而當(dāng)算法為一個(gè)含有若干缺失屬性的樣本擴(kuò)張超盒時(shí),超盒在對(duì)應(yīng)屬性上的上、下邊界位置保持不變。這一改進(jìn)使FMMNN能夠處理缺失屬性。③在第3步的超盒生成中,為增強(qiáng)最終結(jié)果的可讀性和可理解性,樣本到超盒Ajk的隸屬度值改由下式計(jì)算獲得mAjk(Sample)=mini=1,2,...p(maxe∈Vi′μi,e(Si))=mini=1,2,...p(maxe∈Vi′μi,numeric_presention_of(e)(xi))]]>當(dāng)關(guān)于腦膠質(zhì)瘤惡性程度診斷的模糊規(guī)則被提取后,運(yùn)用這些腦膠質(zhì)瘤惡性程度診斷的模糊規(guī)則在計(jì)算機(jī)上建立腦膠質(zhì)瘤惡性程度計(jì)算機(jī)輔助診斷的專家系統(tǒng)。在實(shí)際應(yīng)用中,當(dāng)通過(guò)該專家系統(tǒng)輸入待診斷病人的信息(性別、年齡、腫瘤部位特征描述),該專家系統(tǒng)根據(jù)輸入的信息以及腦膠質(zhì)瘤惡性程度診斷的模糊規(guī)則集,通過(guò)模糊推理得出該病人的腦膠質(zhì)瘤惡性程度的預(yù)報(bào),從而給醫(yī)生的后續(xù)治療與診斷提供幫助。
本發(fā)明的方法能夠獲得較高的測(cè)試準(zhǔn)確率。由于在同一屬性不同取值間建立的隸屬度關(guān)系使得本方法能夠利用更多實(shí)際上相似的樣本,從中發(fā)現(xiàn)更具代表性的決策規(guī)則,而傳統(tǒng)的決策樹(shù)算法和關(guān)聯(lián)規(guī)則提取不能利用這種隸屬度關(guān)系。在一些訓(xùn)練樣本少,含有不確定屬性,要求挖掘結(jié)果簡(jiǎn)潔易理解的特殊應(yīng)用中,本發(fā)明的方法更具有實(shí)用價(jià)值。
本發(fā)明建立的腦膠質(zhì)瘤惡性程度計(jì)算機(jī)輔助診斷專家系統(tǒng),可以用于腦膠質(zhì)瘤良惡性程度的自動(dòng)診斷以及邊遠(yuǎn)地區(qū)醫(yī)生和年青醫(yī)生的診斷培訓(xùn),能較可靠地根據(jù)病人癥狀判斷出惡性程度的高與低,避免不必要的手術(shù)風(fēng)險(xiǎn)和開(kāi)支,減少誤診率和病人痛苦。
圖1為本發(fā)明的專家系統(tǒng)操作界面示意。
具體實(shí)施例方式以下結(jié)合具體的實(shí)施例對(duì)本發(fā)明的技術(shù)方案作進(jìn)一步詳細(xì)描述。
實(shí)施例采用的大腦膠質(zhì)瘤病例數(shù)據(jù)庫(kù)共有280份,由復(fù)旦大學(xué)附屬華山醫(yī)院提供,不包括姓名等私人信息。每個(gè)病例(樣本)都選取了14項(xiàng)MRI讀片結(jié)果和病人大腦膠質(zhì)瘤的真實(shí)惡性程度的屬性記錄。這些記錄多采用文字方式記錄,記為T={(x→l,yl)}.]]>(l=1,2,…,280),x→l={xl1,xl2,···,xlp,···,xl14}]]>含14個(gè)屬性,樣本的類別總數(shù)為2(良性/惡性),以yl∈{1,2}表示。
整個(gè)系統(tǒng)實(shí)現(xiàn)過(guò)程如下
1.屬性的數(shù)字化把文字描述映射成整數(shù)序列,對(duì)每一個(gè)屬性經(jīng)過(guò)上述變換,可以將<s1,s2,…,sp>數(shù)值化為<x1,x2,…,xp>。si為文字表現(xiàn)形式,xi為數(shù)字表現(xiàn)形式。
如性別“女性”數(shù)字化成0,“男性”數(shù)字化成1;年齡直接使用;出血“無(wú)”數(shù)字化成1,“急性”數(shù)字化成2,“慢性”數(shù)字化成3,等等。
2.模糊隸屬度的確定對(duì)于一個(gè)屬性A,其第k個(gè)取值與第j個(gè)取值之間的隸屬度值為μ=max(0,1-r|vj-vk|maxA-minA).]]>這里vj和vk是指屬性的兩個(gè)不同值,maxA是屬性A的最大取值,minA是屬性A的最小取值。本例中r=1。
以“年紀(jì)”屬性為例,如果r=1,那么“老”(數(shù)值化為1)和“中”(數(shù)值化為2)對(duì)“青”(數(shù)值化為3)的隸屬度值分別為0和0.5。
3.超盒生成與擴(kuò)張對(duì)每一個(gè)訓(xùn)練樣本 計(jì)算它到所有類別為yl的超盒的隸屬度,并選擇具有最大隸屬度的超盒Ajk(j=y(tǒng)l)。若不存在這樣的超盒,算法將生成一個(gè)新的超盒Ajr(j=y(tǒng)l),且wjri←xli,vjri←xli(1-1)若Ajr存在,則需判斷下式是否成立pθ≥Σi=1p(max(wjki,xli)-min(vjki,xli))]]>若上式不成立,算法也將按照(1-1)式生成一個(gè)新的超盒,否則對(duì)Ajk按如下方式進(jìn)行擴(kuò)張
vjkinew←min(vjkiold,xli),wjkinew←max(wjkiold,xli),∀i=1,2,···,p]]>擴(kuò)張后超盒Ajk將包含樣本 θ是一個(gè)預(yù)設(shè)值,這里取θ=1。
4.重疊檢測(cè)檢測(cè)不同類別超盒間是否存在重疊。
樣本各屬性的取值范圍均歸一化到
,例中按以下方法判斷任意兩個(gè)不同類別的超盒Ajk和Aht間是否存在重疊,并且在發(fā)現(xiàn)重疊時(shí)找出重疊范圍最小的屬性保存在s中。判別方法如下引入兩個(gè)常量δold和i,并設(shè)定初值δold=1,i=1,對(duì)第i個(gè)屬性進(jìn)行4項(xiàng)判斷(a)當(dāng)vjki<vhti<wjki<whti時(shí),δnew=wjki-vhti;(b)當(dāng)vhti<vjki<whti<wjki時(shí),δnew=whti-vjki;(c)當(dāng)vjki<vhti<whti<wjki時(shí),δnew=min(whti-vjki,wjki-vhti);(d)當(dāng)vhti<vjki<wjki<whti時(shí),δnew=min(whti-vjki,wjki-vhti);(這里j和h是指類別,k和t是指超盒號(hào)碼,vjki和wjki是超盒第i維的下邊界和上邊界)若上述中沒(méi)有一項(xiàng)能夠被滿足,那么Ajk和Aht間不存在重疊,計(jì)算結(jié)束。否則(上述中至少有一項(xiàng)被滿足)說(shuō)明有重疊區(qū),此時(shí)判斷δnew是否小于δold;若是,則把δnew值賦給δold,并記s=i,若存在第i+1個(gè)屬性則令i=i+l繼續(xù)上述判斷;否則計(jì)算結(jié)束。
5.超盒收縮對(duì)存在重疊的超盒依次收縮。如果對(duì)某個(gè)超盒的收縮操作導(dǎo)致模糊誤差減小或在模糊誤差不增加的前提下分類錯(cuò)誤率減小,那么該操作將被執(zhí)行;否則該操作將被阻止。按照以上4種情況對(duì)應(yīng)作以下處理
(a)當(dāng)vjks<vhts<wjks<whts時(shí),wjksnew=vhtsnew←wjksold+vhtsold2;]]>(b)當(dāng)vhts<vjks<whts<wjks時(shí),whtsnew=vjksnew←whtsold+vjksold2;]]>(c)當(dāng)vjks<vhts<whts<wjks且(whts-vjks)≤(wjks-vhts)時(shí),vjksnew←whtsold;當(dāng)vjks<vhts<whts<wjks且(whts-vjks>(wjks-vhts)時(shí),wjksnew←vhtsold;(d)當(dāng)vhts<vjks<vjks<whts且(whts-vjks)≤(wjks-vhts)時(shí),whtsnew←vjksold;當(dāng)vhts<vjks<wjks<whts且(whts-vjks>(wjks-vhts)時(shí),vhtsnew←wjksold;6.對(duì)超盒進(jìn)行額外的擴(kuò)張上述步驟執(zhí)行結(jié)束后,如果某個(gè)訓(xùn)練樣本的數(shù)值化表示對(duì)不同類別的超盒具有相同的隸屬度值,那么支持該樣本真實(shí)類別的超盒將獲得額外的微小擴(kuò)張。這些微小的擴(kuò)張只發(fā)生在能夠使該樣本被正確分類的邊界上。在這一過(guò)程中,如果超盒的微小擴(kuò)張導(dǎo)致Efuzzy減小或分類錯(cuò)誤率減小,那么這一操作將被執(zhí)行;否則這一操作將被阻止。
7.如果任意一個(gè)超盒在前面的步驟中被修改,則重復(fù)從第四步開(kāi)始的操作。如果沒(méi)被修改,說(shuō)明已經(jīng)找到了所有的超盒,訓(xùn)練過(guò)程即告結(jié)束。生成的超盒構(gòu)成了一個(gè)模糊分類器。
8.模糊規(guī)則提取將280份病例組成訓(xùn)練樣本集合,采用基于改進(jìn)的FMMNN的模糊規(guī)則提取算法獲得以下模糊規(guī)則規(guī)則_A1年齡in(1~53)AND水腫in(無(wú),輕度)AND血供in(一般,一般+略多)THEN低度惡性規(guī)則_A2年齡in(34~59)AND占位效應(yīng)in(中度,嚴(yán)重)AND增強(qiáng)后強(qiáng)化in(不均勻)AND血供in(豐富)AND出血in(無(wú),急性)THEN高度惡性最后據(jù)此整理實(shí)現(xiàn)可以輔助專家做腦膠質(zhì)瘤診斷的專家系統(tǒng)。它們?cè)谟?xùn)練集上的準(zhǔn)確率達(dá)到了84.64%(對(duì)低度惡性89.94%,對(duì)高度惡性76.58%)。
規(guī)則的使用可以用以下實(shí)例說(shuō)明某女性病人22歲,MRI讀片結(jié)果表明大腦膠質(zhì)瘤的形狀不規(guī)則;輪廓部分清;包膜不完整;水腫輕;占位效應(yīng)中度;增強(qiáng)后強(qiáng)化不均勻;血供豐富;壞死/囊變有;鈣化無(wú);出血無(wú);T1加權(quán)等信號(hào)或等信號(hào)伴隨低信號(hào);T2加權(quán)高信號(hào)。這一病例對(duì)上述兩規(guī)則的隸屬度分別為0.18和0.91,應(yīng)為高度惡性。模糊規(guī)則的判斷結(jié)果與手術(shù)觀察一致。
本發(fā)明實(shí)現(xiàn)的專家系統(tǒng)操作界面如圖1所示。在實(shí)際應(yīng)用中,利用本發(fā)明方法建立的腦部膠質(zhì)瘤計(jì)算機(jī)輔助診斷系統(tǒng),只要輸入相關(guān)的病人信息,就可以預(yù)報(bào)得出該案例的惡性程度,從而給醫(yī)生的后續(xù)治療與診斷提供幫助。同時(shí)病人的數(shù)據(jù)可加入病例數(shù)據(jù)庫(kù)。
權(quán)利要求
1.一種基于數(shù)據(jù)挖掘的腦部膠質(zhì)瘤計(jì)算機(jī)輔助診斷系統(tǒng)實(shí)現(xiàn)方法,其特征在于包括如下具體步驟1)屬性的數(shù)字化處理針對(duì)病例數(shù)據(jù)庫(kù)中每一個(gè)屬性,按照不同的描述形式進(jìn)行排序,分別用相應(yīng)順序的整數(shù)來(lái)代替,即將屬性值映射成一個(gè)整數(shù)序列,對(duì)于不存在的屬性值要標(biāo)明;2)對(duì)數(shù)值化后的各屬性建立模糊隸屬度數(shù)值化過(guò)程結(jié)束后,定義一個(gè)敏感度因子r,在同一屬性的不同取值間建立隸屬關(guān)系,即,對(duì)于某一個(gè)屬性A,其第k個(gè)取值vk與第j個(gè)取值vj之間的隸屬度值為μ=max(0,1-r|vj-vk|maxA-minA),]]>這里maxA是屬性A的最大取值,minA是屬性A的最小取值,r一般取0-10之間的值;3)超盒生成與擴(kuò)張對(duì)每一個(gè)訓(xùn)練樣本,根據(jù)其類別計(jì)算它到所有的類別相同的超盒的隸屬度,并選擇具有最大隸屬度的超盒Adk,如果不存在相同類別的超盒就生成一個(gè)包括了該訓(xùn)練樣本的超盒;如果存在超盒Adk,就檢驗(yàn)把該訓(xùn)練樣本包括進(jìn)去的超盒擴(kuò)張操作是否導(dǎo)致模糊誤差減小或在模糊誤差不增加的前提下分類錯(cuò)誤率減小,如果減小就執(zhí)行超盒擴(kuò)張操作;否則生成一個(gè)新的超盒;模糊誤差和Efuzzy=Σi=1nΣc=1l(dic-mic)2,]]>其中n是訓(xùn)練樣本總數(shù),1是樣本類別總數(shù),dic是第i個(gè)樣本類別c的真實(shí)隸屬度值,mic是根據(jù)當(dāng)前分類器獲得的第i個(gè)樣本對(duì)類別c的歸一化隸屬度值;4)重疊檢測(cè)相同類別的超盒允許重疊,所以只要檢測(cè)不同類別超盒間是否存在重疊;5)超盒收縮對(duì)存在重疊的超盒,檢驗(yàn)收縮操作是否導(dǎo)致模糊誤差減小或在模糊誤差不增加的前提下分類錯(cuò)誤率減小,如果是就執(zhí)行收縮操作,否則不執(zhí)行;6)對(duì)超盒進(jìn)行額外的擴(kuò)張上述步驟執(zhí)行結(jié)束后,如果某個(gè)訓(xùn)練樣本的數(shù)值化表示對(duì)不同類別的超盒具有相同的隸屬度值,那么與該樣本同類別的超盒將獲得額外的微小擴(kuò)張,這些微小的擴(kuò)張只發(fā)生在能夠使該樣本被正確分類的邊界上,在這一過(guò)程中,如果超盒的微小擴(kuò)張導(dǎo)致模糊誤差和Efuzzy減小或分類錯(cuò)誤率減小,就執(zhí)行超盒擴(kuò)張操作;否則不執(zhí)行;7)如果任意一個(gè)超盒在前面的步驟中被修改,則重復(fù)從第3步開(kāi)始的操作,如果沒(méi)被修改,說(shuō)明已經(jīng)找到了所有的超盒,訓(xùn)練過(guò)程即告結(jié)束,生成的超盒構(gòu)成了一個(gè)模糊分類器;8)模糊規(guī)則提取將超盒轉(zhuǎn)化成“if…then…”的模糊規(guī)則形式,并據(jù)此整理實(shí)現(xiàn)腦膠質(zhì)瘤惡性程度計(jì)算機(jī)輔助診斷的專家系統(tǒng)。
全文摘要
一種基于數(shù)據(jù)挖掘的腦部膠質(zhì)瘤計(jì)算機(jī)輔助診斷系統(tǒng)實(shí)現(xiàn)方法,利用已有的腦膠質(zhì)瘤病人的病例數(shù)據(jù)庫(kù)中的信息,首先對(duì)病例庫(kù)中的數(shù)據(jù)進(jìn)行屬性數(shù)字化處理,并對(duì)數(shù)值化后的各屬性建立模糊隸屬關(guān)系,然后采用基于改進(jìn)的模糊極小極大神經(jīng)網(wǎng)絡(luò)FMMNN的模糊規(guī)則提取方法,從病例庫(kù)中挖掘和發(fā)現(xiàn)腦膠質(zhì)瘤惡性程度的診斷規(guī)則,根據(jù)診斷規(guī)則建立腦膠質(zhì)瘤惡性程度計(jì)算機(jī)輔助診斷專家系統(tǒng)。本發(fā)明的方法所建立的診斷系統(tǒng),對(duì)任何輸入的新案例可預(yù)報(bào)得出該案例的惡性程度,能夠獲得較高的測(cè)試準(zhǔn)確率,從而給醫(yī)生的后續(xù)治療與診斷提供幫助,避免不必要的手術(shù)風(fēng)險(xiǎn)和開(kāi)支,減少誤診率和病人痛苦。
文檔編號(hào)G06F19/00GK1547149SQ200310109069
公開(kāi)日2004年11月17日 申請(qǐng)日期2003年12月4日 優(yōu)先權(quán)日2003年12月4日
發(fā)明者楊杰, 葉晨洲, 耿道穎, 楊 杰 申請(qǐng)人:上海交通大學(xué)