国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于高斯模糊積分的hbv分類方法

      文檔序號:9235624閱讀:393來源:國知局
      一種基于高斯模糊積分的hbv分類方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明設(shè)及分類預(yù)測的研究領(lǐng)域,特別設(shè)及一種基于高斯模糊積分的皿V分類方 法。
      【背景技術(shù)】
      [0002] 目前,現(xiàn)實(shí)應(yīng)用中很多問題設(shè)及到分類預(yù)測,研究者已經(jīng)從最初的線性分類器擴(kuò) 展到了非線性分類器的使用。傳統(tǒng)的模糊積分就是一種用于處理非線性問題的信息融合工 具。而模糊積分自身也存在著極大的局限性,比如經(jīng)典模糊測度的表示僅限于[0,1]區(qū)間, W及傳統(tǒng)模糊積分所能處理的數(shù)據(jù)只能根據(jù)被積函數(shù)沿直線投影來獲得積分值,而實(shí)際的 數(shù)據(jù)分布并不是單純線性的。

      【發(fā)明內(nèi)容】

      [0003] 本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)與不足,提供一種基于高斯模糊積分 的皿V分類方法。
      [0004] 本發(fā)明的目的通過W下的技術(shù)方案實(shí)現(xiàn):
      [0005] -種基于高斯模糊積分的皿V分類方法,包括下述步驟:
      [0006]S1、從皿V數(shù)據(jù)庫中篩選皿V患者的DNA序列;
      [0007] S2、數(shù)據(jù)庫根據(jù)聚類方法分為四個(gè)小的數(shù)據(jù)集合B1、C1、C2 W及C3 ;
      [0008] S3、對數(shù)據(jù)集進(jìn)行分類,依靠分類器的分類和病例的真實(shí)類別,可W有四種結(jié)果用 于預(yù)測評價(jià);
      [0009] 真正類---患者診斷為患病,而真有病的情況;
      [0010] 假正類---患者診斷為患病,而未患病的情況;
      [0011] 真負(fù)類---患者診斷為無病,而真無病的情況;
      [0012] 假負(fù)類---患者診斷為無病,而真有病的情況;
      [001引令TP,化TN和FN分別表示真正類、假正類、真負(fù)類和假負(fù)類的數(shù)目,對于每個(gè)學(xué) 習(xí)和評價(jià)實(shí)驗(yàn),Accuracy準(zhǔn)確度、Sensitivity敏感度和Specificity特異性定義如下,用 作分類的性能或適應(yīng)度的指示器;
      [0014] Accura巧=(TP+TN)/^(TP+TN+FP+FN),
      [00 巧]Sensitivity = TP/(TP+FN),
      [0016] Specificity=TN/(TN+FP).
      [0017] S4、將高斯模糊積分構(gòu)造的分類器應(yīng)用于皿V數(shù)據(jù)庫,對皿V進(jìn)行分類,所述高斯 模糊積分構(gòu)造的分類器具體為:
      [001引假設(shè)給定特征集X = {Xi, X2,…,X。},f為特征函數(shù),相應(yīng)的特征值為 f (Xi),f (X2),…,f (X。),將特征值進(jìn)行降序排列滿足f (V )《f咕')《f (X。'),其中 (x/,又2',…,X。')是(X。X2,…,X。)的變開多;
      [0019] 將被積函數(shù)擴(kuò)展為高斯形式,并基于此構(gòu)建擴(kuò)展模糊積分分類器,基于高斯函數(shù) 的模糊積分定義如下:
      [0020] 通過投影所有待分類數(shù)據(jù)會在L軸求得一個(gè)高斯模糊積分值,此時(shí)可采用一個(gè)線 性分類方法將該些虛擬值進(jìn)行分類,在一次投影后并不一定能夠正確分類所有數(shù)據(jù),通過 不斷學(xué)習(xí)得到一組優(yōu)化的模糊測度值,來對虛擬點(diǎn)在L上的分布進(jìn)行調(diào)節(jié),直至獲得滿意 分類結(jié)果。
      [0021] 優(yōu)選的,步驟S2中,分子進(jìn)化分析由生物信息分析軟件MEGA 3.0實(shí)現(xiàn)完成,并同 步采用進(jìn)化樹完成了皿V的同質(zhì)性聚類,特征提取采用基于信息滴排序的方法,基因特征 按照信息增益進(jìn)行排序,選取最前位的特征作為用于分類器的潛力特征,并經(jīng)多次驗(yàn)證實(shí) 驗(yàn),取前5位基因結(jié)果最優(yōu)。
      [0022] 優(yōu)選的,步驟S3中,使用簡單的整數(shù)值0, 1,2和3作為數(shù)字化的初始值,W分別表 示特征的離散值。
      [0023] 優(yōu)選的,步驟S4中,所述的模糊測度值通過遺傳算法進(jìn)行優(yōu)化學(xué)習(xí),該步驟中描 述的n個(gè)基因特征對應(yīng)的一組模糊測度包含2D-1個(gè)值,遺傳算法中需要由一組具有2"-1個(gè) 基因的染色體表示,通過變異、交叉和復(fù)制運(yùn)算因子,經(jīng)過多代的進(jìn)化學(xué)習(xí),最終遺傳算法 的適應(yīng)函數(shù)滿足停止條件,此時(shí)獲得的染色體中每個(gè)基因位對應(yīng)的值即為模糊測度值。
      [0024] 本發(fā)明與現(xiàn)有技術(shù)相比,具有如下優(yōu)點(diǎn)和有益效果:
      [00巧]1、本發(fā)明基于高斯分布的模糊積分,通過高斯函數(shù)表示被積函數(shù)來完成模糊積分 的投影,然后再根據(jù)投影得到的虛擬積分值進(jìn)行線性分類,提高皿V分類精度,簡化了皿V 分類過程。
      [0026] 2、本發(fā)明采用的高斯模糊積分呈現(xiàn)最高的測試敏感度,對于疾病確診和研究具有 積極的輔助作用。
      【附圖說明】
      [0027] 圖1是本發(fā)明基于高斯模糊積分的皿V分類方法的流程圖;
      [0028] 圖2(a)是本發(fā)明一種取值情況下的高斯函數(shù)的投影圖;
      [0029] 圖2(b)是本發(fā)明另一種取值情況下的高斯函數(shù)的投影圖。
      【具體實(shí)施方式】
      [0030] 下面結(jié)合實(shí)施例及附圖對本發(fā)明作進(jìn)一步詳細(xì)的描述,但本發(fā)明的實(shí)施方式不限 于此。
      [00引]實(shí)施例
      [0032] 如圖1所示,本實(shí)施例基于高斯模糊積分的皿V分類方法,包括下述步驟:
      [0033] S1、從皿V數(shù)據(jù)庫中篩選皿V患者的DNA序列;皿V數(shù)據(jù)庫是來自香港威爾±醫(yī)院 的實(shí)例,包含98個(gè)非患病者和100個(gè)陽性患病者。
      [0034] S2、皿V患者的DNA序列由生物專家精屯、挑選,盡量使統(tǒng)計(jì)偏差最小。數(shù)據(jù)庫可W 根據(jù)聚類方法分為四個(gè)小的數(shù)據(jù)集合B1、C1、C2 W及C3,每個(gè)子庫的病人如表1所示;
      [00巧]表1皿V數(shù)據(jù)集描述
      [0036]
      [0037] S3、對數(shù)據(jù)集進(jìn)行分類,依靠分類器的分類和病例的真實(shí)類別,可W有四種結(jié)果用 于預(yù)測評價(jià);
      [0038] 真正類---患者診斷為患病,而真有病的情況;
      [0039] 假正類---患者診斷為患病,而未患病的情況;
      [0040] 真負(fù)類---患者診斷為無病,而真無病的情況;
      [0041] 假負(fù)類---患者診斷為無病,而真有病的情況;
      [004引令TP,化TN和FN分別表示真正類、假正類、真負(fù)類和假負(fù)類的數(shù)目,對于每個(gè)學(xué) 習(xí)和評價(jià)實(shí)驗(yàn),Accuracy準(zhǔn)確度、Sensitivity敏感度和Specificity特異性定義如下,用 作分類的性能或適應(yīng)度的指示器;
      [0043]Accura巧=(TP+TN)/^(TP+TN+FP+FN),
      [0044] Sensitivity = TP/(TP+FN),
      [0045] Specificity = TN/(TN+FP).
      [0046] 醫(yī)藥專家通常更傾向于較高的敏感度,即低準(zhǔn)確度和特異性是可接受的平衡狀 態(tài),只要準(zhǔn)確度和特異性是合理的。該意味著我們寧愿讓更多的人確診為患病,而不要錯(cuò) 過那些真正患病的人。在該些數(shù)據(jù)庫中,所有特征是分類型特征。每個(gè)特征有四個(gè)符號型 的值A(chǔ),C,G和T。為了使用非線性模型,我們使用簡單的整數(shù)值0, 1,2和3作為數(shù)字化的初 始值,W分別表示特征的離散值。
      [0047] S4、將高斯模糊積分(Gaussian-FI)構(gòu)造的分類器應(yīng)用于皿V數(shù)據(jù)庫,并和之前研 究中的結(jié)果進(jìn)行比較,如表2所示,包含多個(gè)經(jīng)典算法的測試結(jié)果,包括神經(jīng)網(wǎng)絡(luò)(NN)、決 策樹值T)、貝葉斯(NB),支撐向量機(jī)(SVM) W及傳統(tǒng)模糊積分(FI),我們用多個(gè)數(shù)據(jù)庫的平 均值來衡量性能,最好的值用黑體突出顯示。表中可見,SVM雖具有最好的分類精度,敏感 性卻相對較差。對于篩查測試,醫(yī)藥專家通常喜歡更高的敏感度,即較低的精度和特異性對 于高敏感度處于一個(gè)合理的可接受的平衡狀態(tài)。我們寧愿讓更多的人接受確診測試,而不 要錯(cuò)過任何一個(gè)真正的癌癥患者。高斯模糊積分呈現(xiàn)最高的測試敏感度,對于疾病確診和 研究具有積極的輔助作用。
      [0048] 上述高斯模糊積分的分類方法具體為:
      [004引假設(shè)給定特征集X = {X。X2,…,X。},f為特征函數(shù),相應(yīng)的特征值為 f (Xi),f (X2),…,f (X。),本實(shí)施例將特征值進(jìn)行降序排列滿足f (Xi')《f咕')《… 《f (X。'),其
      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1