專利名稱:基于高斯核函數(shù)模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及模式識別和人工智能技術(shù)領(lǐng)域,具體涉及一種基于高斯核函數(shù)模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法。
背景技術(shù):
乳腺癌是女性排名第一的常見惡性腫瘤。據(jù)統(tǒng)計全球每年平均約有130萬人新患乳腺癌,女性乳腺癌患者占女性新發(fā)惡性腫瘤的30%,排名女性惡性腫瘤發(fā)病率第一位。乳腺癌同樣是我國女性最常見的惡性腫瘤。乳腺癌可以通過臨床病史,體格檢查,乳房X線照相術(shù),超聲造影檢查出來。但是,權(quán)威性診斷乳腺腫塊必須采用細(xì)針抽吸活檢,中心活檢或者切除手術(shù)。其中,細(xì)針抽吸活檢方法是最容易也是最快獲取乳腺活組織的方法,對女性液性囊腫檢查很有效。目前國內(nèi)外先后運(yùn)用線性規(guī)劃,線性判別分析(LDA),神經(jīng)網(wǎng)絡(luò),支持向量機(jī)來區(qū)分乳腺癌診斷數(shù)據(jù)集(WDBC)的良性和惡性乳房腫塊。但是線性規(guī)劃,線性判別分析(LDA)的分類準(zhǔn)確率低;神經(jīng)網(wǎng)絡(luò)計算復(fù)雜,參數(shù)設(shè)置困難且易陷入局部極小點;支持向量機(jī)參數(shù)估計難度大,計算復(fù)雜。自從Zadeh教授提出模糊集以來,模糊模式識別技術(shù)已被廣泛用于許多領(lǐng)域。模糊模式識別包括無監(jiān)督模糊學(xué)習(xí)和有監(jiān)督模糊學(xué)習(xí)。模糊聚類是著名的無監(jiān)督模糊學(xué)習(xí)方法,如模糊C-均值聚類(FCM),可能性C-均值聚類(PCM)和廣義噪聲聚類(GNC)等。模糊有監(jiān)督學(xué)習(xí)方法有模糊k近鄰(FKNN),模糊判別分析(FDA),模糊Fisher分類器,模糊支持向量機(jī)(FSVM)等。模糊模型通常表現(xiàn)出比傳統(tǒng)模型更好的性能。例如,F(xiàn)CM是一個眾所周知的模糊聚類模型,它比硬C-均值聚類(HCM)更好。FSVM比SVM更適合減少噪聲和野值.模糊Fisher分類器在處理由于照明條件不好導(dǎo)致的模糊臉部圖像時效果更好。同時,利用改進(jìn)的模糊隸屬度函數(shù),將使得訓(xùn)練集中的不同樣本對散射矩陣重新定義所做貢獻(xiàn)不同。模糊非相關(guān)判別轉(zhuǎn)換方法(武小紅,武斌,周建江《模糊非相關(guān)判別轉(zhuǎn)換及其應(yīng)用》,中國圖象圖形學(xué)報,2009, 14(9) : 1832-1836.)建立在模糊類間散射矩陣,模糊總體散射矩陣和模糊類內(nèi)散射矩陣基礎(chǔ)上,其特征向量滿足廣義瑞利商方程,同時也滿足樣本到模糊非相關(guān)優(yōu)化判別向量上的投影是非相關(guān)的。模糊非相關(guān)判別轉(zhuǎn)換方法在處理帶有模糊性的線性特征提取方面要優(yōu)于非相關(guān)判別轉(zhuǎn)換方法。但是,模糊非相關(guān)判別轉(zhuǎn)換方法在處理線性不可分問題方面存在難度,處理效果往往不理想。因此如何擴(kuò)展模糊非相關(guān)判別轉(zhuǎn)換方法的功能,使之能夠處理線性不可分問題是個亟待解決的問題。
發(fā)明內(nèi)容
針對上述現(xiàn)有的良性和惡性乳房腫塊判別方法的缺陷和不足,本發(fā)明的目的是提出一種基于高斯核函數(shù)的模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法,該方法將高斯核函數(shù)引入到模糊非相關(guān)判別轉(zhuǎn)換方法,構(gòu)造基于高斯核函數(shù)的模糊非相關(guān)判別轉(zhuǎn)換,提取乳腺癌診斷數(shù)據(jù)集的非線性特征以處理線性不可分問題,利用非線性映射將乳腺癌診斷數(shù)據(jù)集數(shù)據(jù)映射到高維特征空間,用高斯核函數(shù)隱式實現(xiàn)在高維特征空間的計算,從而可以避免“維數(shù)災(zāi)難”的問題,能提取乳腺癌診斷數(shù)據(jù)集樣本數(shù)據(jù)的非線性鑒別信息,分類準(zhǔn)確率高。提高了分類準(zhǔn)確率,達(dá)到快速,準(zhǔn)確地判別良性還是惡性乳房腫塊。該方法具體為首先,將從乳腺癌診斷數(shù)據(jù)集利用模糊K-近鄰法得到模糊隸屬度值,由模糊C-均值聚類方法得到每類的類中心值,從而實現(xiàn)數(shù)據(jù)的模糊化處理;接著計算核模糊線性判別分析的最大特征值對應(yīng)的特征向量并將該特征向量作為本發(fā)明方法最優(yōu)鑒別向量集的第I個特征向量;然后根據(jù)乳腺癌診斷數(shù)據(jù)集到模糊非相關(guān)優(yōu)化鑒別向量上的投影非相關(guān)性原則計算本發(fā)明方法的一組最優(yōu)鑒別向量集,利用核函數(shù)實現(xiàn)模糊非相關(guān)判別轉(zhuǎn)換的非線性轉(zhuǎn)換。最后將乳腺癌診斷數(shù)據(jù)集進(jìn)行非線性轉(zhuǎn)換而實現(xiàn)乳腺癌的正確判別。為實現(xiàn)本發(fā)明的目的,采用的技術(shù)方案具體包括以下步驟步驟一、將乳腺癌診斷數(shù)據(jù)集模糊化處理;步驟二、最優(yōu)鑒別向量集的第I個特征向量的計算;步驟三、一組最優(yōu)鑒別向量集的計算;步驟四、利用核函數(shù)實現(xiàn)乳腺癌診斷數(shù)據(jù)集的非線性轉(zhuǎn)換。步驟五、實現(xiàn)良性乳房腫塊數(shù)據(jù)和惡性乳房腫塊數(shù)據(jù)的分類。所述步驟一中對乳腺癌診斷數(shù)據(jù)集的模糊化處理方法如下1.用K-近鄰法獲得樣本Xk Uk屬于第j類)的K個近鄰樣本,則Xk的模糊隸屬度值則按如下規(guī)律計算
權(quán)利要求
1.一種基于高斯核函數(shù)模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法,其特征在于首先,將乳腺癌診斷數(shù)據(jù)集利用模糊K-近鄰法得到模糊隸屬度值,由模糊C-均值聚類方法得到每類的類中心值,從而實現(xiàn)數(shù)據(jù)的模糊化處理;接著計算核模糊線性判別分析的最大特征值對應(yīng)的特征向量并將該特征向量作為本發(fā)明方法最優(yōu)鑒別向量集的第I個特征向量;然后根據(jù)乳腺癌數(shù)據(jù)集到模糊非相關(guān)優(yōu)化鑒別向量上的投影非相關(guān)性原則計算本發(fā)明方法的一組最優(yōu)鑒別向量集;接下來利用核函數(shù)實現(xiàn)模糊非相關(guān)判別轉(zhuǎn)換的非線性轉(zhuǎn)換,最后將乳腺癌診斷數(shù)據(jù)集進(jìn)行非線性轉(zhuǎn)換而實現(xiàn)乳腺癌的正確判別。
2.根據(jù)權(quán)利要求1所述的基于高斯核函數(shù)模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法,其特征在于,該方法包括以下步驟步驟一將乳腺癌診斷數(shù)據(jù)集進(jìn)行模糊化處理;步驟二 最優(yōu)鑒別向量集的第I個特征向量的計算;步驟三一組最優(yōu)鑒別向量集的計算;步驟四利用核函數(shù)實現(xiàn)乳腺癌診斷數(shù)據(jù)集的非線性轉(zhuǎn)換;步驟五實現(xiàn)良性乳房腫塊數(shù)據(jù)和惡性乳房腫塊數(shù)據(jù)的分類。
3.根據(jù)權(quán)利要求2所述的基于高斯核函數(shù)模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法,其特征在于,所述步驟一中將乳腺癌診斷數(shù)據(jù)集模糊化處理方法如下(1)用K-近鄰法獲得樣本XkCxk屬于第j類)的K個近鄰樣本,則Xk的模糊隸屬度值則按如下規(guī)律計算
4.根據(jù)權(quán)利要求2所述的基于高斯核函數(shù)模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法,其特征在于,所述步驟二中最優(yōu)鑒別向量集的第I個特征向量的計算如下
5.根據(jù)權(quán)利要求2所述的基于高斯核函數(shù)模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法,其特征在于,所述步驟三中一組最優(yōu)鑒別向量集的計算如下N-1PM a r+1 = β a r+1這里P= Ι-ΝΑτ(ΑΝΑτΓ Α,04和β分別為上面方程所求的特征向量和所對應(yīng)的特征值,I 為單位矩陣,A= [Ct1Ct 2··· a Jt ;a i, ct 2,…,a r是一組最優(yōu)鑒別向量集。
6.根據(jù)權(quán)利要求2所述的基于高斯核函數(shù)模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法,其特征在于,所述步驟四中利用核函數(shù)實現(xiàn)非線性轉(zhuǎn)換計算如下
7.根據(jù)權(quán)利要求2所述的基于高斯核函數(shù)模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法,其特征在于,所述步驟五中實現(xiàn)良性乳房腫塊數(shù)據(jù)和惡性乳房腫塊數(shù)據(jù)的分類方法是用最近鄰分類器和“l(fā)eave one out”即“留一”策略來實現(xiàn)良性乳房腫塊數(shù)據(jù)和惡性乳房腫塊數(shù)據(jù) 的分類。
全文摘要
本發(fā)明是一種基于高斯核函數(shù)模糊非相關(guān)判別轉(zhuǎn)換的乳腺癌判別方法,將核函數(shù)理論用于模糊非相關(guān)判別轉(zhuǎn)換,實現(xiàn)乳腺癌的快速、準(zhǔn)確判別。首先,實現(xiàn)數(shù)據(jù)的模糊化處理;接著計算最優(yōu)鑒別向量集的第1個特征向量;然后計算本發(fā)明方法的一組最優(yōu)鑒別向量集,利用核函數(shù)實現(xiàn)模糊非相關(guān)判別轉(zhuǎn)換的非線性轉(zhuǎn)換;最后將乳腺癌診斷數(shù)據(jù)集進(jìn)行非線性轉(zhuǎn)換而實現(xiàn)乳腺癌的正確判別。本發(fā)明解決了模糊非相關(guān)判別轉(zhuǎn)換難以處理線性不可分問題,利用非線性映射將乳腺癌診斷數(shù)據(jù)集數(shù)據(jù)映射到高維特征空間,用高斯核函數(shù)隱式實現(xiàn)在高維特征空間的計算,從而可以避免“維數(shù)災(zāi)難”的問題,能提取乳腺癌診斷數(shù)據(jù)集的非線性鑒別信息,分類準(zhǔn)確率高。
文檔編號G06F17/30GK102999593SQ201210465559
公開日2013年3月27日 申請日期2012年11月16日 優(yōu)先權(quán)日2012年11月16日
發(fā)明者武小紅, 孫俊, 傅海軍, 陸繼遠(yuǎn) 申請人:江蘇大學(xué)