專利名稱:使用機器學習來進行心磁圖分類的制作方法
使用機器學習來進行心磁圖分類本申請是2004年7月1日提交的申請?zhí)枮?00480018683. 8、名稱為‘使用機器學 習來進行心磁圖分類’的分案申請。
背景技術:
雖然心磁描記法(MCG)早在二十世紀六十年代就被引入作為可能的診斷工具,但 是花費了近三十年的時間才成功地證明了它的臨床價值?,F在,它代表新近出現的、全世界 醫(yī)院中內科醫(yī)師采用的心臟病學技術之一。MCG方法的臨床應用明顯受益于現代多通道傳 感器技術、成熟的軟件以及硬件中的最新改善,所述硬件允許使用所述設備而無需磁屏蔽室。MCG研究是快速的、安全的并且是完全非侵入性的。因此,它為患者提供了極大的 便利。目前,許多組織從事建立參考數據庫和數據標準化的工作。在多種臨床應用中,MCG 已經提供了臨床上有益的結果。例如,MCG可以診斷并且定位急性心肌梗塞、區(qū)分具有或不 具有惡性心室心律不齊易感性的心肌梗塞患者、檢測心室肥厚和心臟移植之后的排異性、 定位心室預激勵的位置和各類心律不齊以及揭示胎兒心律不齊和傳導紊亂[40]。另外,最 近已經研究了 MCG的其它幾種臨床應用心肌病的檢測和危險分類(擴張、肥大、心律不齊、 糖尿病)、自發(fā)心室纖維性顫動之后的危險分類、心肌耐久性的檢測和定位以及胎兒生長和 神經系統(tǒng)完整性的后續(xù)檢查。某些研究已經明顯地表明MCG對復極(化)過程中(例如 在心肌梗塞之后或者在遺傳性長QT綜合癥[42]中)的變化非常靈敏。在[41]中可以找 到MCG應用以及目前使用的分析技術的最相關的綜述。然而,具有重大挑戰(zhàn)性的是減少或者消除因MCG數據的人為解釋所引入的偏離, 并且明顯改善基于機器的分類性能和推廣質量,并同時使計算機處理時間與實時診斷相容。當把人工智能(機器學習)應用于測量數據時,始終執(zhí)行三個基本步驟1、數據 測量,2、測量數據的預處理,3、自適應分類器的訓練。將這種基本方案編入EKG/ECG數據 或者其它生物數據的專利包括美國專利5,092, 343 ;5, 280,792 ;5, 465, 308 ;5, 680, 866 ; 5,819,007 ;6,128,608 ;6,248,063 ;6,443,889 ;6,572,560 ;6,714,925 以及 6,728,691。使用人工智能進行MCG場圖分析十分局限于數據。把人工智能應用于分析生物磁 性信號的一篇參考文獻是第5,417,211號美國專利,公開了一種用來對活體內發(fā)生的電生 理活動所生成的場圖進行分類的方法,包括如下步驟使用多通道測量設備來測量作為對 象體外電生理活動結果而出現的場圖、生成對應于所測場圖的特征向量、把所述特征向量 提供給自適應分類器以及利用訓練場圖來訓練自適應分類器,其中所述訓練場圖已經由可 定位電生理活動代用模型生成。所述方法還包括步驟在自適應分類器的輸出端為每個場 圖生成概率值,該概率值表示能夠由所選可定位代用模型來生成每一個場圖的概率。類似 于上面引用的EKG/ECG參考文獻,該文獻論述了機器學習對測量數據的普遍適用性,但是 它沒有提及改善分類性能以及推廣質量的細節(jié)。在所有情況中,用于確定成功的兩個關鍵措施是分類性能以及推廣質量。對非預
4處理數據進行訓練會導致很差的分類結果,而所謂的過度訓練則防礙自適應分類器推廣到 實際數據的正常識別。成功的關鍵在于數據的最優(yōu)預處理,迄今為止,本文引用的任何參考文獻還沒有 實現這一點。最重要的是識別能確定被探查數據集的所屬分類的所有特征。識別那些特征 既不是顯而易見的也不是微不足道的。此外,這些特征可以根據生物系統(tǒng)的不同以及測量 數據類型的不同而有所不同。因此,大部分基于人工智能的過程都在如何執(zhí)行預處理方面 存在差別。正如此處將要詳細公開的那樣,為機器學習而使用核變換以及小波變換對數據進 行預處理為成功的機器學習方法提供了基礎,就準確分類、推廣質量以及處理速度而言,所 述方法明顯改進了現有技術。這些內容在本文引用的任何現有技術中均沒有被公開或者建 議。
發(fā)明內容
本文公開了在心磁描記術中使用機器學習進行圖形識別,所述心磁描記術測量心 臟的電生理活動所發(fā)射的磁場。使用直接核方法來將異常MCG心臟圖形與正常圖形加以分 離。對于無監(jiān)督學習來說,引入了基于直接核的自組織映射。對于有監(jiān)督學習來說,使用了 直接核部分最小二乘以及(直接)核嶺回歸。然后把這些結果與經典支持向量機以及核部 分最小二乘相比較。在測試以前,根據該訓練數據的有效子集來調整用于這些方法的超參 數。研究內容還包括使用局部、垂直、水平以及二維(全局)馬氏(Mahanalobis,馬哈拉諾 比斯)縮放、小波變換以及通過濾波進行變量選擇來進行預處理。對所有三種方法都類似 的結果令人鼓舞,它超過了已訓練專家所達到的分類質量。本文公開了一種用于分類心動描記數據的設備以及相關方法,包括把核變換應用 于從用來檢測電磁心臟活動的傳感器所獲取的檢測數據,產生變換數據,然后使用機器學 習來分類已變換數據。
在所附權利要求書中闡明了被認為具有新穎性的本發(fā)明的特征。然而參照下述結 合附圖進行的描述可以理解本發(fā)明以及其進一步的目的和優(yōu)勢,所述附圖匯總如下圖1舉例說明了在包括6X6柵格的36個通道中經由一個心動周期所收集的已過 濾平均瞬態(tài)MCG曲線。圖2是說明正確圖形和錯誤圖形數目(基于36個測試數據的陰性和陽性情況)以 及心磁圖數據的執(zhí)行時間的圖表。支持向量機庫(SVMLib)和核部分最小二乘(K-PLS)采 用時間域,而其余的方法采用D-4小波域。圖3是說明用于為心磁圖數據創(chuàng)建預測模型的不同方法的質量測度的圖表。圖4是對小波變換數據的基于K-PLS的35種測試病例的誤差曲線圖。圖5是表示假陽性和假陰性之間的可能權衡的接收器操作員特性(R0C)曲線。圖6是基于(左)直接核主元分析(DK-PCA)和(右)直接核PLS(DK-PLS)的73 個訓練數據的投影圖?;疾〉那闆r被為實心圓圈。沒有畫出測試數據。圖7說明在環(huán)繞模式中,基于9X18直接核自組織映射(DK-S0M)顯示在自組織映象上的測試數據。圖8說明了對測試數據集使用不同技術所得的局部缺血預測結果。圖9是以直接核方法作為數據預處理步驟的操作示意圖。圖10是說明用于直接核方法的、采用核居中來進行數據預處理的流程圖。圖11是自組織映射(S0M)的典型結構。圖12是此處公開的、用于心動描記數據自動分類的技術的列表。
具體實施例方式此公開內容描述了在心磁描記術(MCG)中使用直接核方法和支持向量機進行圖 形識別,所述心磁描記術用于測量人類心臟的電生理活動所發(fā)射的磁場。用于MCG的、基于 SQUID的測量設備目前正處于獨立開發(fā)階段,其中所述設備可被用于普通的醫(yī)院房間(不 需特別地屏蔽電磁干擾)。所述系統(tǒng)的操作是計算機控制的,并且在很大程度上是自動的。 專用軟件被用來進行精確的24位控制和獲取數據,然后進行濾波、求均值、電/磁活動定 位、心臟電流重構和診斷評分推導。對MCG記錄的解釋還遺留有挑戰(zhàn)性問題。因此,此公開內容考慮了用于自動解釋 MCG測量結果,從而使用于分析的人工輸入最少的方法。測試集中于檢測局部缺血,這是 在許多可能導致心臟病發(fā)作的常見心臟疾病中出現的一種情況,在美國這是死亡的主要原 因,但這僅僅是示例性的,而不是限制性的。在科學上,此公開內容考慮了兩類分離問題(患病的心臟與健康的心臟),其中描 述符(數據點)的數目超出數據集的數目。因此,此公開內容現在集中致力于解決該問題 的兩個任務。第一個有待回答的問題是所述問題究竟是線性還是非線性,因為這將確定能夠解 決所述問題的可能候選函數的類別(稱為“假設”或者“機器學習技術”)。我們的目標在 于保持分離過程自身的線性,如果預處理中有非線性,則對非線性進行編碼。后者可以通過 在執(zhí)行實際機器學習之前把(非線性)核變換應用于所述數據來實現(我們把對核變換數 據進行操作的技術稱為“非線性”技術)。因此,如果所述數據包含非線性,那么與非線性技 術相比,純粹的線性方法將顯示出很差的性能。第二個目的在于尋求(或者開發(fā))實際解決該分離問題的機器學習技術。此處的 焦點主要不在于得到最優(yōu)的解決方案,而是得到對所述數據執(zhí)行得同樣好的一類技術。這 有助于建立對所選模型以及它們的推廣能力的信心(一個假設能對不在訓練集中的數據 正確分類的能力被稱為其“推廣性”)。很容易開發(fā)對所述訓練數據能進行最優(yōu)操作但是無 法預測未見數據的模型(所述現象經常被稱為過度訓練)。然而,建立(并且調整)只基于 少數數據就能進行良好預測的模型是非常困難的。我們將從論述數據獲取和預處理開始。特別是,我們討論對于不同的學習方法,哪 種預處理適合。此后,我們核心結果不同機器學習技術對于我們的問題的性能的比較,以 及評估預測質量和調整參數選擇的方法。此后,我們討論特征選擇。數據獲取和預處理MCG數據是在軀干上方的36個部位通過在彼此相鄰的位置中進行四次順序測量 來獲取的。在每個位置中,九個傳感器使用1000赫茲的采樣速率在90秒內測量心臟磁場,從而產生36個單獨時間序列。對于缺血診斷來說,需要0. 5赫茲至20赫茲的帶寬,所以采 用了使用六次貝塞耳濾波器特性的100赫茲硬件低通濾波器,繼之采用利用相同特性、但 更高次的20赫茲附加數字低通濾波器。為了消除剩余的隨機噪聲分量,使用心動周期的R 峰最大值作為觸發(fā)點來平均整個時間序列。對于自動分類來說,我們采用來自心動周期J 點和T峰[5]之間的時窗的數據,其中根據所測數據內插了 32個均勻間隔的點的值。所述 訓練數據包括73個病例,這些病例易于由已訓練專家目測分類。該測試對一組36個病例 進行,所述病例包括其心磁圖對執(zhí)行目測分類的已訓練專家產生誤導或迷惑的患者。在該情況下,通過首先從每個信號中減掉偏移值來預處理數據。然后,我們研究 對于我們的多變量時間序列信號最有效的預處理,包括局部、垂直、水平和二維(全局) 馬氏縮放以及小波變換。一個重要的考慮是保護數據局部性,這是通過對每個信號應用 DaUbeChieS(多布西)_4小波變換[3]來實現的。之所以選擇它,是由于在每個內插的時間 信號中的數據集(32)相對較小。只有用于觀察輸入端的數據局部性的S0M和K-PLS方法 不要求這種變換。接下來,我們對數據進行馬氏縮放,首先對所有36個信號進行,然后垂直 進行(對所有信號,但基于S0M的方法除外)。圖1中顯示了被內插至ST段[5]中32個等 間隔點并且在對每一個單個信號進行馬氏縮放之后的36個信號的典型數據集。MCG數據分類的預測津樽機器學習的目的在于將某些智能決策基礎委托給計算機。在其當前形式中,機器 學習的重要部分是開發(fā)魯棒的分類、回歸工具和特征選擇方法。在心臟診斷環(huán)境中,機器學習的最終目的是要能夠識別有意義的特征,所述特征 可以解釋所述模型并且能夠表述具有透明度的專家規(guī)則。機器學習的關鍵因素是防止過度訓練。Tikhonov(基霍諾夫)調整的概念在機器 學習中是達到這個目的的一種十分有效的概念。機器學習中的第二個問題是需要構造可靠 的非線性方法。支持向量機(SVM)以及其它基于核的方法(諸如核主元分析、核嶺回歸以 及部分最小二乘)都是把非線性及調整合并到機器學習方法中去的有效方法。在機器學習中,當前具有挑戰(zhàn)性的問題是特征多于數據的大型問題、在數據中存 在許多不確定因素以及噪音的問題以及具有混合模式的無序多類分類問題。對正確預處理的需要極度取決于領域的選擇,但是研究不同的預處理方法,并將 領域的專業(yè)知識合并到這個預處理階段是使機器學習方法可行的關鍵因素。我們的目的在于不僅識別“最佳”的機器學習方法,而且識別對數據能夠執(zhí)行得同 樣好的一類技術。因此,我們考慮SVM,這是機器學習領域的一種主要工具。我們也使用可 能比SVM更易于調整或者更易于硬件實現、但是預期其性能可以與SVM媲美的其它基于核 的方法。成功的機器學習的一個關鍵在于數據的預處理。許多不同的預處理情況是值得考 慮的。我們如下區(qū)分四類預處理1、歸一化為了使得數據能夠被加以比較需要這樣做。這通常指的是數據被按比 例縮放并去偏。然而,這里人們有許多選擇。2、信息定位所謂定位,我們指的是應用能夠重排數據的變換來使包含絕大部分 信息的系數被首先呈現。一個突出的例子是小波變換,它甚至能保持信息的局部性。3、特征選擇這通常對已經變換的數據執(zhí)行。它指的是不包含信息或者包含很少信息的系數被剔除以便減少輸入域的維數。這對于加速學習尤其有益。4、核變換所述核變換是使回歸模型非線性的一種簡明的方式。核是包含數據集 的相似性測度的矩陣或者是指該數據集的自身數據之間的相似性,或者是指與其它數據 之間的相似性(例如,支持向量[2])。很明顯,這樣做提供了用于改進心動圖分類的方法的 多種組合。首先討論歸一化。這是機器學習中使所有描述符居中并且使它們具有單位方差的 常用方法。相同的過程然后也被應用于響應。居中及方差歸一化的這個過程被稱為馬氏縮 放。雖然馬氏縮放不是對所述數據進行預處理的唯一方式,但是,要進行能夠很好適用于全 體數據的預處理,這大概是最普遍的并且最魯棒的方式。如果我們把特征向量表示為f,那 么馬氏縮放將產生被重新縮放的特征向量f,并且可以被總結為2'=⑴
std{z)其中f表示平均值,而Std(2)表示屬性2的標準差。當36個時間序列被(沿時間軸)分別單獨縮放時,我們將稱其為“水平馬氏縮 放”,當一個時刻的所有36個點都被縮放時,則稱其為“垂直馬氏縮放”,而當所有32個時刻 的36個點都被縮放時,則稱其為“全局馬氏縮放”。接下來我們討論定位。應用小波變換[10] —方面有助于定位信息的“熱點”,另一 方面有助于定位對所述信號沒有貢獻的“冷區(qū)”。小波變換比傅里葉變換更加合適的屬性在 于單個小波函數是空間定位的。傅里葉正弦和余弦函數卻不是如此。小波變換不具有單獨 的基函數集,但具有可能基函數的無窮集?!澳负瘮怠被蛘摺胺治鲂〔ā?CP(X)的擴展和平移定義了一個正交基,亦稱小波基
-S/) = 2t <D(2"s x-l) (2)變量s和1是整數,用于縮放和擴張母函數①(x)以便生成小波,諸如Daubechies 小波系列??s放指數s表明小波的寬度,而位置指數1給出其位置。應當注意的是,所述母 函數通過2的冪來重新縮放或者“擴展”,并且按照整數平移。之所以對小波基特別感興趣 是因為縮放和擴展所引起的自相似性。一旦我們了解了所述的母函數,那么我們就可以理 解與所述基有關的一切。為了以不同的分辯率覆蓋我們的數據域,把所述分析小波用于縮放公式W(x) = NZ (-l)kck+iO(2x + k)(3)
k=-l其中W(x)是母函數①(x)的縮放函數,而ck是小波系數。所述小波系數必須滿 足如下形式的線性二次型約束
N-lN-12,IXcw =(4)
k=0 k=0其中S是S函數而1是位置指數。小波最有用的特征之一是科學家可以很容易用它來選擇適用于給定問題的給定 小波系統(tǒng)的定義系數。在Daubechies的論文[3]中,她開發(fā)了能夠很好地表示多項式特性 的特定小波系統(tǒng)族。對于MCG時間序列來說,所謂的“Daubechies 4”小波表現出了最優(yōu)性能。我們現在轉而討論核變換。核變換及其調整是改進心動圖分類能力的重要成分。 因此,我們將比較詳細地解釋這一概念,并且強調在應用核變換時通常被忽略的某些主要 問題。核變換是使回歸模型非線性的一種簡明方式。核變換至少可以追溯到二十世紀初 期,當時希爾伯特把核引入數學文獻。核是包含數據集的相似性測度的矩陣或者是指該數 據集自身的數據之間的相似性,或者是指與其它數據之間的相似性。核的典型用途是作為 主元分析中的相關矩陣,其中特征核包含了屬性或者特征之間的線性相似性測度。在支持 向量機中,所述核的各元是數據之間而不是特征之間的相似性測度,并且這些相似性測度 通常是非線性的。存在許多可能的非線性相似性測度,但是為了便于進行數學處理,所述核 必須滿足某些條件,既所謂的Mercer (默塞爾)條件[2、11、15]。
kin
k2n(5)上述表達式引入了 n個數據的數據核矩陣交皿的通用結構。所述核矩陣是一個對 稱矩陣,其中每個元均包含兩個數據向量之間的(線性或者非線性)相似性。存在許多不 同的可能方法來定義相似性尺度,譬如作為線性相似性測度的點積以及作為非線性相似性 測度的徑向基函數核或RBF核。所述RBF核是最廣泛使用的非線性核,它的元被定義為k ^ Kij ~ e (6)應當注意的是,在上面的核定義中,所述核元包含數據點之間以負指數表示的歐 幾里得距離,這是相異性(而不是相似性)測度。所述負指數還包含自由參數o,這是RBF 核的Parzen(帕爾遜)窗口寬度。用于選擇Parzen窗口的正確選擇通常通過對外部有效 集合進行附加調整來確定,這種調整被稱為超調整。o的精確選擇不是關鍵,通常存在某個 使模型質量穩(wěn)定的相對較寬的o選擇范圍。這里把核變換作為數據變換應用于獨立的預處理階段。我們實際上利用非線性數 據核來替代所述數據,并且應用傳統(tǒng)的線性預測模型。我們引入了對數據的非線性核變換 采用傳統(tǒng)線性算法的方法,并且在這里被定義為“直接核方法”。這種直接核方法的簡潔和 優(yōu)勢在于該問題的非線性特征被記錄在該核中,并且對于所應用的算法而言是透明的。人們還可以在神經網絡類型的流圖中表示該核變換,并且第一隱層現在會產生核 變換數據,而第一層的權重正是訓練數據的描述符。第二層包含可以采用數值方法來計算 的權重,譬如采用核嶺回歸方法(參見圖9)。當使用徑向基函數核時,這類神經網絡看上去 往往與徑向基函數神經網絡[17、18]非常相似,只是第二層的權重計算結果不同。通過使所述核居中來處理偏移值也是重要的。參見通用的預測方程
令=X w(7)
J n 八 nm vv mV' /
9 Km =
11 21
kl2 ^22
knl k
n2
其中把權向量伊^應用于數據矩陣X.以便達到(預測)輸出&,不存在恒定的偏 置項。結果,對于被居中的數據而言,該偏移項(“偏離”)始終是零,無須被顯式包含在內。 包含該偏離值的更加通用的預測模型不是應用公式7,而是被寫成
n=XnmWm+b(8)其中b是偏離項。因為我們實施了首先通過馬氏縮放來使數據居中的操作,所以 此偏離項是零,可以忽略。在處理核時,由于需要某些類型的偏離值,所以情況更加復雜。這里我們將只給出 一個技巧,在實際情況中很適用的技巧,要了解說明其原因的更多細節(jié),可以參見文獻[11、 12、16、19]。即使應用核變換之前對數據進行了馬氏縮放,所述核仍需要某些類型的居中以 便能夠忽略預測模型中的偏離項。用于使核居中的直截了當的方式是從每一列訓練數據核 中減去平均值,并且當使測試核居中時,存儲此平均值供以后調用。用于使該核居中的第二 個步驟是再次審查最新獲得的垂直居中的核,這次是逐行進行,并且從每一水平行中減去 行平均值。對測試數據的核需要按照類似過程以一致的方式加以居中。在該情況下,所存儲 的訓練數據核的列平均值將被用于測試數據核的垂直居中。然后這種垂直居中的測試核再 被水平居中,即,為每一行計算垂直居中測試核的平均值,并且該垂直居中測驗核的每個水 平元由該元減去該行平均值來替代。如上所述,這個用于使核居中的算法的優(yōu)點在于它同樣適用于矩形數據核。圖 10中畫出了對所述訓練數據、有效數據以及測試數據的流程圖,用于預處理所述數據、對該 數據應用核變換、然后使該核居中。對無監(jiān)督以及有監(jiān)督學習方法都進行了研究。對于無監(jiān)督學習來說,由于經常把 S0M應用于新穎性檢測和自動聚類,所以使用了直接核(DK)-SOM。所使用的DK-S0M具有展 開邊緣的9 X 18六邊形網絡。對于有監(jiān)督學習來說,使用了四種基于核的回歸算法對從復 數數據空間提取相關參數有效的經典支持向量機;由Rosipal (羅西帕爾)[10]提出的核部 分最小二乘K-PLS ;直接核部分最小二乘(DK-PLS)以及最小二乘支持向量機(即LS-SVM, 亦稱核嶺回歸)。支持向量機或者SVM由于它們的效率、模型靈活性、預測功效以及理論上的透明 度已經被經證明是強有力的機器學習工具[2、11、15]。SVM的非線性屬性可以僅僅歸因于 核變換,而諸如自組織映射或者S0M[9]之類的其它方法從本質上講就是非線性的,因為它 們包含各種基于鄰域的運算。與SVM不同,S0M的主要用途常常是作為可視化工具[4]來 在某種二維映射上揭示高維數數據的潛在相似性/聚類結構,而不是用于回歸或者分類預 測。使用了內部開發(fā)的、用于分析的Analyze/StripMiner軟件包[14],但也使用了適 用于所述SVM模型的SVMLib[l]。DK-SOM、SVM、DK-PLS以及LS-SVM中的參數值已在測試之 前使用所述訓練集進行了優(yōu)化。結果與已訓練專家實現的分類質量相似,并且對于所有已 測試方法均類似,即便這些方法使用了不同的數據預處理。這一點非常重要,因為它表明在 任何測試方法中不存在過度訓練。DK-PLS、SVMLib以及LS-SVM之間的吻合程度特別好,對 于這些數據而言,這些方法之間沒有明顯差異。圖2和3中顯示了所述結果。圖2列出了對于陽性和陰性情況正確分類的圖形數目和錯誤的數目。圖3提供了預測質量的附加測度。 圖8中顯示了進一步的結果。在圖8中,RMSE表示均方根誤差(越小越好),而CC[% ]指 的是正確分類情況的百分比。DK-PLS方法獲得了最優(yōu)的結果,它也表現出了最強的魯棒性。 這已勝過組合的三個標準測試(ECG、ECH0以及Troponin I)的預測精度,對于這些患者來 講,這個精度是58%。 調整之后,SVM的Parzen窗口寬度o被選擇為10。在SVMLib中,調整參數C如 [10]中所建議的那樣被設置為1/X?;谄渌鼞肹14]和縮放實驗的經驗,對于n個數 據核,根據如下公式來確定嶺參數入
更普遍的是,憑經驗,我們已經發(fā)現入正比于數據數目n的3/2次冪。直接核方法(DK-PLS及LS-SVM)、K_PLS和傳統(tǒng)的基于核的SVM (SVMLib)之間的一 致性表明由此公式產生的嶺參數近似最優(yōu)的選擇。現在轉而討論用于評定模型質量的尺度,對于回歸問題,獲取錯誤的另一個方式 是通過均方根誤差指標或者RMSE,依照如下公式把它定義為均方差的平均值(對于訓練集 或者測試集) 雖然均方根誤差是用于比較不同預測方法對同一數據的性能的有效方法,但是從 RMSE取決于數據的響應如何被縮放這個意義上講,它不是絕對的尺度。為了克服此障礙,還 使用了對響應值的縮放和幅值依賴性較小的附加誤差測度。用于評定已訓練模型質量的第 一尺度是r2,它被按照如下公式定義為響應的目標值和預測值之間的平方相關系數 其中nteain表示訓練集中的數據點的數目。r2取0和1之間的值,并且r2的值越 高,模型越好。使用r2來評定模型質量的明顯缺陷在于它只表示線性相關,表明如果把P 繪制成y的函數,那么預測值在多大程度上排成一行。雖然當r2等于1時,人們會期待得到 接近完美的模型,但情況并不總是這樣。第二種用于評定已訓練模型質量的更為有效的尺 度是所謂的“壓縮r平方”,或者R2,經常用于化學計量學建模[6],其中R2被定義為[7] R2被認為是比r2更好的測度,因為它同樣考慮到殘差。正如r2 —樣,R2的范圍在 0和1之間,并且R2的值越高,模型越佳。R2的尺度通常小于r2。對于較大數據集來說,R2 勢必收斂至r2,并且r2和R2之間對于這種數據的比較經常揭示隱藏的偏離值。
為了評定有效集和測試集的質量,我們引入了類似的尺度q2和Q2,對于測試集內 的數據而言,q2和Q2分別被定義為l_r2和1-R2。對于能對測試數據進行理想預測的模型 來說,我們往往希望q2和Q2等于零。引入在訓練集和測試集之間對稱的尺度的理由實際上 是為了避免混淆。Q2和q2的值應用于有效集或測試集,為了獲得良好的預測模型,人們往 往希望這些值非常低。R2和r2的值應用于訓練數據,很容易發(fā)現,如果預測值接近實際值, 那么它們兩個都接近于1。因此,它們中的任何一個與1有顯著偏差都表明模型具有很差的 預測能力。同所述核方法相比,部分最小二乘那樣的線性方法會產生很差的預測模型。對于 K-PLS和DK-PLS來說,選擇了 5個隱藏變量,但是結果并非決定性地取決于隱藏變量數目的 正確選擇。還嘗試了直接核主元分析(DK-PCA),這是K-PCA的直接核方案[11-12,16],但 是結果對主元數目的選擇更加敏感,而且不如使用其它直接核方法所獲得的結果那么好。圖4中顯示了基于小波變換數據和DK-PLS的心磁圖數據的典型預測結果。從該圖 可見,在預測值中,總共六個數據點被錯誤分類(一個健康的或陰性情況,五個缺血情況)。 已訓練專家也難以根據通過專用方法獲得的時變磁場的二維可視顯示來正確識別這些病 例。對于醫(yī)療數據來說,能夠在假陰性和假陽性情況之間,或者在靈敏度和特異性之 間(它們是與假陽性和假陰性相關的不同尺度)做出權衡通常是非常重要的。在機器學習 方法中,這種權衡可以很容易通過改變解釋所述分類的閾值來實現。例如,在圖4中,人們 可以不使用零作為判別值,而是將判別閾值移動到更加理想的水平,從而影響假陽性/假 陰性的比例。判別值的這種改變的所有可能結果的匯總可以用R0C曲線顯示,圖5所示為上述 情況。R0C曲線(或者接收器操作員特性)的概念源自二十世紀四十年代用于識別飛行器 的雷達設備的早期開發(fā),并且在[13]中予以概述。圖6顯示了基于(左)直接核主元分析(DK-PCA)和(右)直接核PLS(DK-PLS) 的73個訓練數據的投影?;疾〉那闆r被表示為實心圓圈。與圖6左側顯示的DK-PCA的結 果相比,圖6的右側顯示了根據DK-PLS的前兩個元所得到的不同類之間的更清楚的分離和 較寬的邊緣。最初用明暗交叉線顯示在這些圖(pharmaplot)上的測試數據表明,對兩種方 法,健康和患病情況之間分離得極好。圖7表示環(huán)繞方式中在六邊形網格上的基于直接核S0M的典型9X18自組織映 射。所述環(huán)繞方式指的是左右邊界(以及頂部和底部邊界)互相滲透,并且所述映射是環(huán) 狀投影的展開。黑色六邊形表明患病的情況,明亮六邊形表明健康的情況。全彩色的六邊 形表明訓練數據的位置,白色和黑色陰影編號是健康和患病測試情況的圖形識別符。大部 分錯誤分類實際上出現在映射的邊界區(qū)域。該映射中的單元通過半監(jiān)督學習而被染色,就 是說,包含36X32或者1152個特征的每一數據向量通過表示色彩的附加場來補充。對于 權重向量,數據向量中的彩色元依照類似方式被更新,但是不使用它們來計算用于確定獲 勝單元的距離尺度。常規(guī)S0M實現方式的結果映射與直接核DK-S0M獲得的映射非常相似。 在128兆奔騰III計算機上生成DK-S0M的執(zhí)行時間是28秒,而生成普通S0M需要960秒, 這是因為在對數據進行核變換之后,數據大小從原始的1152有效地降至73 (訓練數據的數 目)。S0M和DK-S0M的精細調整在監(jiān)控模式下采用學習向量的量化來完成[9]。雖然基于S0M和DK-S0M的結果仍然非常好,但是它們不如利用其它基于核的方法(SVMLib、LS-SVM和 K-PLS)所獲得的結果那樣好。特征詵擇上一部分中介紹的結果是采用所有1152(36X32)個描述符獲得的。如果人們可 以精確識別用于進行優(yōu)良二元分類所需的最重要信息在時間或小波信號的什么位置,或者 是對每位患者在不同位置測量的36個心磁圖信號中的哪些信號,那么這往往可以給所屬 領域的專家提供更有價值的信息。這種信息可以通過特征選擇來推導。特征選擇,即對數據向量的最重要的輸入參數的識別,可以依照兩種不同的方式 來進行過濾方式和環(huán)繞方式。通常,這兩個方法互相獨立地被采用;然而,在這份公開內 容的范圍內及其關聯的權利要求書中,它們也可以結合使用。在過濾方式中,基于事先規(guī)定的并且通常是無監(jiān)督的程序來刪除特征。這種程序 的一個例子可以是刪除包含四個0離群值的描述符列,在化學計量學的PLS應用中經常發(fā) 生這種情況。另外常見的是,在過濾模式中刪除“表親(cousin)”描述符,即與其它描述符 的相關性達95%以上的特征。根據建模方法,慣用的方法是刪除表親描述符并且只保留以 下的描述符(i)與響應變量具有最高相關性的描述符,或者(ii)對解釋所述模型的領域 專家具有最清楚的域透明度的描述符。特征選擇的第二種方式是基于環(huán)繞方式。人們希望只保留獲得良好預測模型所必 需的最相關的特征。建模質量通常在適當選擇最優(yōu)特征子集之后得以改善。確定特征的正 確子集可以基于不同的概念來進行,而且由此生成的特征子集經常取決于建模方法。環(huán)繞 方式中的特征選擇通常采用訓練集和有效集來進行,而且該有效集被用來確認所述模型沒 有因選擇一組虛假描述符而過度訓練。特征選擇的兩個通常可用的方法是基于遺傳算法和 靈敏度分析的使用。利用遺傳算法方法的思想是要能夠從訓練集內獲得最優(yōu)特征子集,而且對于有效 集也表現出良好的性能。靈敏度分析的概念[8]采用了特征的凸顯性,即,一旦已經構造了預測模型,就對 每一個描述符的平均值使用所述模型,并且所述描述符在最小值和最大值之間一次一個地 加以調節(jié)。描述符的靈敏度是指預測響應中的變化。它的前提是,當描述符的靈敏度很低 時,它大概不是構造良好模型的主要描述符。在一個迭代步驟期間可以刪除幾個最不靈敏 的特征,靈敏度分析過程被多次重復,直到留下某個近似最優(yōu)的特征集。遺傳算法方法和靈 敏度分析方法都是真正的軟計算方法,并且要求一些啟發(fā)和經驗。兩個方案的優(yōu)點在于,遺 傳算法和靈敏度方法是通用的方法,它們不依賴于特定的建模方法。有關機器學習的進一步評述我們在此不是回顧所有可資利用的機器學習技術,而是首先討論為什么我們不簡 單地使用支持向量機(SVM)這個同時適用于線性和非線性問題的最新解決方案??茖W地 講,如上所述,我們的目標是找到對于給定問題能夠執(zhí)行得同樣好的一類技術以便確保獲 得穩(wěn)定的解。在此類技術中,最優(yōu)模型是最易于調整并且執(zhí)行最迅速的一個。把這些模型 以SVM作為標準進行比較有助于驗證任何最新開發(fā)的技術的性能。關于有監(jiān)督學習,我們在此就有監(jiān)督學習中的所謂機器學習悖論給予簡短說明, 這是開發(fā)了大量模型以便走出困境的原因。
通常把數據矩陣表示為XNm,把響應向量表示為&,假定在數據集內存在N個數據 點和m個描述特征。我們想要通過歸納法按照如下方式從XNm推斷出(記為XNm
),即我們的推理模型由n個訓練數據點導出,而且對采樣以外的數據(即N-n個有效數據 以及測試數據點)工作得很好。換言之,我們旨在構造如下類型的線性預測模型
(13)此公式假定一個必須在先前步驟中確定的已知權重向量伊m,在最優(yōu)情況下,實際 學習滿足公式
(14)這里,X.是訓練數據,并且瓦表示該已知解(“標記”)。應當注意,所述數據矩陣通常是不對稱的。如果是這種情況,那么采用數據矩陣的 逆就能直截了當地得到一個答案。因此,我們將采用偽逆變換,這通常不會產生y的精確預 測值,但是將從最小二乘意義上依照最優(yōu)方式來預測y。以下舉例說明對權重向量的偽逆 解 Kf = X^X.是所謂的“特征核矩陣”,并且是機器學習悖論的理由學習只是因為 特征中的冗余而出現——但是,&是病態(tài)的(降秩的)。正如先前表明的那樣,存在多種方 式來解決所述悖論1、通過采用主元(計算特征核的特征向量)來固定KF的秩降[18]2、通過調整使用KF+入I來代替KF(嶺回歸)[17,20-23]3、通過局部學習我們使用了四個基于核的回歸算法對從復數數據空間中提取相關參數有效的經 典支持向量機[2、1215];由Rosipal提出的核部分最小二乘K-PLS[10];直接核部分最小 二乘(DK-PLS)以及最小二乘支持向量機(即LS-SVM,亦稱核嶺回歸[24-28])。另外,我們 測試了直接核主元分析(DK-PCA)。部分最小二乘(PLS)是QSAR和化學度量學中的標準分析方法之一 [29]。核 PLS(K-PLS)是最近開發(fā)的PLS非線性方案,由Rosipal和Tre jo (特里喬)提出[10]。K_PLS 與SVM功能相當,但是SVM不同,結果變得更加穩(wěn)定。K-PLS目前被用來預測與人血清蛋白 的結合親和力。在作為此公開內容的基礎的工作中,我們將K-PLS改進為DK-PLS,并且利用了 在 Analyze/Stripminer 程序中為 K-PLS、DK-PLS, DK-PCA 和 LS-SVM 開發(fā)代碼的早期經 驗[14]。K-PLS和DK-PLS之間的差異在于在K方法中使用特征(數據)核矩陣,而在DK 方法中,此矩陣由(非線性)核變換矩陣來替代。對于計算矩陣求逆來說,我們應用了在 Analyze/Stripminer程序中實現的Mailer (穆勒)的比例共軛梯度算法[30]?,F在討論無監(jiān)督學習,我們注意到所述S0M[9、17、31_36]是由K0h0nen(科荷南)開發(fā)的無監(jiān)督學習神經網絡。所述S0M是基于競爭學習的迭代方法。它提供從高維輸入數 據空間到低維輸出映象的映射,這通常是一維或者二維映射,參見圖11。元(或者數據點) 被載入輸入層,所述S0M則使用競爭學習算法加以訓練[4]。所述權重依照如下公式來更 新
0125] 其中a是學習速率參數。由于學習的結果,所述輸入數據將被映射到“獲勝的”神 經元。由于這個過程,所述S0M經常被用于降維和聚類。此外,S0M的顯著的特征是它保 留輸入數據從高維輸入空間到輸出映象上的拓撲結構的方式是輸入數據之間的相對距離 或多或少得到了保留[38]。在輸入空間中位置彼此靠近的輸入數據點被映射到輸出映象上 的鄰近神經元?;赟0M的觀察法是數據探索的通用工具。它們被用于數據的聚類、相關 檢測和投影[4、39]。傳統(tǒng)的S0M是一種基于高維輸入數據到低維輸出映象上的投影的方法。這里公開 的是一種新的基于核的S0M。所述核S0M現在根據數據的核表達式來加以訓練,而不是根據 原始數據來訓練。這里使用核變換數據不足以“揭示”數據中的非線性,這是因為S0M原本 是非線性的,但是因為該核具有更少的有效特征,所以增加了(學習)速度??偠灾?,我們已經使用并且開發(fā)了圖12所示的一組機器學習工具。結束語MCG數據的二元分類代表某種具有挑戰(zhàn)性的問題,但是如果要使MCG在臨床實踐 中成功,那么它的求解是非常重要的。把現有機器學習技術(諸如S0M和SVM)應用于MCG 數據將產生74%的預測精度。首先把數據變換到小波域并對小波系數應用核變換,甚至單 獨應用核變換而不用小波變換,可以取得非常顯著的改進。這樣做使預測精度增加至83%。Rosipal[10]提出的核PLS(K-PLS)、直接核PLS (DK-PLS)、支持向量機(SVMLib)和 最小二乘SVM(LS-SVM)之間的結果的一致性通常非常好。在這種情況下,DK-PLS具有優(yōu)越 的性能,而基于核的方法之間的差異不是很顯著。這種極高的一致性顯示出了直接核方法 的魯棒性。只有當通過公式(1)選擇的嶺參數接近最優(yōu)時,才可以實現它。在支持向量機 中,這種選擇還定義了調整參數C,并且C被取為1/入。獲得的結果對于醫(yī)學界來說是十分有意義的。對于檢測由冠狀動脈血管造影術定 義的缺血而言,DK-PLS被用來達到92%的靈敏度和75%的特異性。應當注意的是,MCG是 一種純功能性的工具,對于心臟電生理學中的異常十分靈敏,因此,可只診斷疾病的結果。 然而,金標(gold standard,冠狀動脈血管造影術)是一種純解剖學工具,并且診斷缺血性 心臟病的一個原因。由于MCG檢測金標無法看見的異常,所以它將始終生成“假陽性”,這就 解釋了為什么在這種應用中特異性比較低。應注意的是,這里是把核變換作為獨立預處理階段的數據變換加以應用的。數據 實際上由非線性數據核替代,并且后來應用傳統(tǒng)的線性預測模型。對數據的非線性核變換 采用傳統(tǒng)線性算法的方法定義了這里所謂的“直接核方法”。這種直接核方法的簡潔性和優(yōu) 點在于問題的非線性方面被記錄在所述核中,并且對于所應用的算法而言是透明的。雖然本文論述的核在本質上是高斯型曲線,但是這只是示例性的,而不是限制性 的。例如,不作為限制,還可以使用所謂的仿樣核,并且將其視為本公開內容的范圍之內。雖然已經舉例說明并且描述了本發(fā)明的某些首選的特征,但是本領域技術人員將
15會想出多種修改、改變和替換。因此應當理解,所附權利要求書旨在覆蓋屬于本發(fā)明真實精 神之內的所有這些修改和變化。參考文獻References[1]C. -C. Chang and C. -J. Lin, LibSVM, OSU, see http: //www, csie. ntu. edu. tw/~cilin/1ibsvmSVMLib.[2]N. Cristianini and J. Shawe-Taylor[2000]Support Vector Machines and Other Kernel-Based Learning Methods, Cambridge University Press.[3]I.Daubechies[1992], Ten Lectures on Wavelets, Siam,Philadelphia, PA.[4]G. Deboeck and T. Kohonen(Eds. )[1998]Visual Explorations in Finance with Self-Organizing Maps. Springer.[5]V. Froelicher, K. Shetler, and E. Ashley [2002] "Better Decisions through Science :Exercise Testing Scores. "Progress in Cardiovascular Diseases, Vol. 44(5),pp. 385-414.[6] A. Golbraikh and A. Tropsha[2002] "Beware of q21”Journal of Molecular Graphics and Modelling, Vol 20,pp.269-276.[7]R. A. Johnson and D. ff. ffichem[2000]Applied Multivariate Statistical Analysis,2 ed. , Prentice Hall.[8]R. H. Kewley, and M. J. Embrechts [2000] "Data Strip Mining for the Virtual Design of Pharmaceuticals with Neural Networks,,,IEEE Transactions on Neural Networks, Vol. 11(3),pp.668-679.[9]T.Kohonen[1997]Self-Organizing Maps,2nd Edition, Springer.[10]R. Rosipal and L. J. Trejo [2001] "Kernel Partial Least Squares Regression in Reproducing Kernel Hilbert Spaces,,,Journal of Machine Learning Research, Vol. 2,pp.97—128.[11]B. SchSlkopfand A. J. Smola[2002]Learning with Kernels, MIT Press.[12]B. Schslkopf.A. Smola,and K_R Muller[1998]"Nonlinear Component Analysis as a Kernel Eigenvalue Problem,,,Neural Computuation, Vol.10,129-1319,1998.[13] J. A. Swets, R. M. Dawes, and J. Monahan [2000] "Better Decisions through Science,,,Scientific American, pp. 2-87.[14]The Analyze/StripMiner, the description and the code are available at http:/www, drugmining. com.[15]V. Vapnik[1998]Statistical Learning Theory, John ffiley&Sons.[16]ff. ffu,D. L. Massarat and S. de Jong[1997] "The Kernel PCA Algorithm for Wide Data. Part II :Fast Cross~Va1idation and Application in Classification of NIR Data,,,Chemometrics and Intelligent Laboratory Systems, Vol. 37,pp.271-280.[17]A. E. Hoerl,and R. ff. Kennard[1970]"Ridge Regression :Biased Estimation for Non-Orthogonal Problems, ”Technometrics, Vol. 12, pp. 9-82.[18] J. Principe, N. R. Euliano, and ff. C. Lefebre [2000]Neural and Adaptive
16Systems :Fundamentcls through Simulations,John Wiley&Sons, Inc.[19]W. Wu. D. L. Massarat and S. de Jong[1997] “The Kernel PCA Algorithm for Wide Data. Part I Theory and Algorithms,” Chemometrics and Intelligent Laboratory Systems, Vol. 36,pp.165-172.[20]Vladimir Cherkassky and Filip Mulier[1998]Learning from Data. Concepts,Theory, and Methods,JohnWi1ey&Sons, Inc.[21]S. Haykin[1999]Neural Networks :A Comprehensive Foundation(2nd Ed.), Prentice Hall.[22]A. N. Tikhonov[1963] "On Solving Incorrectly Posed Problems and Method of Regularization, ”Doklady Akademii Nauk USSR,Vol. 151,pp.501-504.[23]A. N. Tikhonov and V. Y. Arsenin[1977]Solutions of ill-Posed Problems, W. H. Winston. Washigton D. C.[24]Evgeniou T. , Pontil, and M. Poggio, T. [2000] "Statistical Learning Theory :A Primer,,,International Journal of Computer Vision, Vol. 38 (1), pp. 9-13.[25]T. Evgeniou,M. Pontil, and T. Poggio [2000]"Regularization Networks and Support Vector Machines,,,in Advances in Large Margin Classifiers,MIT Press.[26]Poggio,T.,and Smale S.,[2003] “The Mathematics of Learning :Dealing with Data,” To appear in Notices of the AMS, May2003.[27]Suykens,J. A. K. and Vandewalle,J. [1999]"Least-Squares Support Vector Machine Classifiiers,,,Neural Processing letters,Vol. 9 (3), pp. 293-300,Vol. 14, pp. 71-84.[28] Suykens, J. A. K.,van Gestel,T. de Brabanter,J. De Moor, M.,and Vandewalle,J. [2003]Least Squares Support Vector Machines,World Scientifiic Pub Co,Singapore.[29] Svante Wold, Michael Sjdstr0mv and L e n n a r t Eriksson[2001] “PLS-Regression :a Basic Tool of Chemometrics, "Chemometrics and Intelligent Laboratory Systems,58 109-130.[30] Maiter, M.F.,[1993] “A Scaled Conjugate Gradient Algorithm for Fast Supervised Learning,,,Neural Networks, Vol. 6, pp. 525-534.[31]H. Ritter,T. Kohonen,"Self-Organizing Semantic Maps,” Biological Cybernetics, vol. 61,pp.241—254,1989.[32]T.Kohonen, Self Organization and Associative Memory,2nd ed., Springer-Verlag,1988.[33]T. Kohonen, "The Self-Organizing Map, ”Neurocomputing,21(1) :1_6, November 1998.[34]T. Kohonen, ‘‘Thing You Haven,t Heard about the Self-Organizing Map,,,IEEE International Conference on Neural Network, vol. 3, pp. 1147-1156,1993,[35] T. Kohonen, "Generalization of the Self-Organizing Map,,,International Joint Conference on Neural Networks, vol. 1, pp. 21-26,1993.
[36]G.Deboeck and T.Kohonen, Visual Explorations in Finance with Self-Organizing Maps, Springer,2000.[37]H. C. Card, G. K. Rosendakl, D. K. Mcneill, and R. D. Mcleod, "Competitive Learning Algorithms and Neurocomputer Architecture,,,IEEE Transactions on Computers,vol. 47,no. 8,pp. 847—858,August 1998.[38] J. S. Kirk, and J. M. Zurada,"Motivation for Genetically-Trained Topography-Preserving Map,,,International Joint Conference on Neural Networks 2002,vol. 1,pp.394-399,2002.[39] J. Vesanto, J. Himberg, M. Siponen, and A. Ollisimula,“Enhancing S0M Based Dara Visualization,,,Proceedings of the International Conference on Soft Computing and Information/Intelligent Systems, pp.64-67,1998.[40]G. Stroink,W. Moshage, S. Achenbach :“Cardiomagnetism,,. In :Magnetism in Medicine, W. Andri, H. Nowak, eds. Berlin :Wiley VCH ;1998 ;136-189.[41]M. Makijarvi, J. Montonen, J. Nenonen :"Clinical application of magnetocardiographic mapping,,in Cardiac mapping M. Shenasa,M. Borgreffe, G. Breithardt, Eds. Mount Kisco,NY :Futura Publishing Co,2003.[42]M. Makijirvi, K. Brockmeier, U. Leder, et al. :“New trends in clinical magnetocardiography" . In Biomag96 :Proc.of the 10th Internat.Conf.on Biomagnetism,Aine C.,et al.,eds.,New York :Springer,2000 ;410-417.
權利要求
一種自動識別有意義的特征并且形成用于分類心磁描記數據的專家規(guī)則的方法,包括將小波變換應用于從檢測由病人的心臟活動產生的電磁場的傳感器獲取的檢測數據,以產生小波域數據;將核變換應用于所述小波域數據,從而得到變換數據;以及采用機器學習,由所述變換數據來識別所述有意義的特征并且形成所述專家規(guī)則。
2.權利要求1所述的方法,其中,所述核變換滿足Mercer條件。
3.權利要求1所述的方法,所述核變換包括徑向基函數。
4.權利要求1所述的方法,所述應用核變換的步驟包括 把所述變換數據分配至神經網絡的第一隱層;應用訓練數據描述符作為所述神經網絡的所述第一隱層的權重;并且 數值計算所述神經網絡的第二隱層的權重。
5.權利要求1所述的方法,還包括采用直接核部分最小二乘(DK-PLS)機器學習來分類所述變換數據。
6.如權利要求1所述的方法,所述把上述檢測數據轉換為小波域數據包括 把Daubechies小波變換應用于上述檢測數據。
7.權利要求1所述的方法,還包括從上述小波域數據中選擇用于改進所述心動描記數據分類的諸特征。
8.權利要求1所述的方法,還包括 歸一化上述檢測數據。
9.權利要求8所述的方法,所述歸一化上述檢測數據還包括 對上述檢測數據進行馬氏縮放。
10.權利要求1所述的方法,還包括 使所述核變換的核居中。
11.一種用于自動識別有意義的特征并且形成用于分類心動描記數據的專家規(guī)則的設 備,包括用于如下目的的計算機化存儲、處理以及編程將小波變換應用于從檢測由病人的心臟活動產生的電磁場的傳感器獲取的檢測數據, 以產生小波域數據;將核變換應用于所述小波域數據,從而得到變換數據;以及采用機器學習,由所述變換數據來識別所述有意義的特征并且形成所述專家規(guī)則。
12.權利要求11所述的設備,其中所述核變換滿足Mercer條件。
13.權利要求11所述的設備,所述核變換包括徑向基函數。
14.權利要求11所述的設備,所述用于應用核變換的計算機化存儲、處理以及編程還 包括用于如下目的的計算機化存儲、處理以及編程把所述變換數據分配至神經網絡的第一隱層;應用訓練數據描述符作為所述神經網絡的上述第一隱層的權重;并且數值計算所述神經網絡的第二隱層的權重。
15.權利要求11所述的設備,還包括用于如下目的的計算機化存儲、處理以及編程 采用直接核部分最小二乘(DK-PLS)機器學習來分類所述變換數據。
16.權利要求11所述的設備,所述用于把上述檢測數據轉換到小波域數據的計算機化 存儲、處理以及編程包括用于如下目的的計算機化存儲、處理以及編程把Daubechies小波變換應用于上述檢測數據。
17.權利要求11所述的設備,還包括用于如下目的的計算機化存儲、處理以及編程 從所述小波域數據中選擇用于改進所述心動描記數據分類的諸特征。
18.權利要求11所述的設備,還包括用于如下目的的計算機化存儲、處理以及編程 歸一化上述檢測數據。
19.權利要求18所述的設備,所述用于歸一化上述檢測數據的計算機化存儲、處理以 及編程包括用于如下目的的計算機化存儲、處理以及編程對上述檢測數據進行馬氏縮放。
20.權利要求11所述的設備,還包括用于如下目的的計算機化存儲、處理以及編程 使所述核變換的核居中。
全文摘要
本發(fā)明公開了在心磁描記術中使用機器學習來進行模式識別,所述心磁描記術用于測量心臟電生理活動所發(fā)射的磁場。使用直接核方法來將異常MCG心臟圖形與正常的圖形加以分離。對于無監(jiān)督學習來說,引入了基于直接核的自組織映射。對于有監(jiān)督學習來說,使用了直接核部分最小二乘以及(直接)核嶺回歸。然后把這些結果與經典支持向量機以及核部分最小二乘相比較。由此,公開了一種用于分類心動描記數據的設備以及相關聯的方法,包括把核變換應用于從用來檢測電磁心臟活動的傳感器獲取的測數據,產生變換數據,然后使用機器學習來分類已變換數據。
文檔編號A61B5/08GK101926646SQ20101022492
公開日2010年12月29日 申請日期2004年7月1日 優(yōu)先權日2003年7月1日
發(fā)明者伯勒斯洛·K·希曼斯基, 卡斯滕·斯特尼克爾, 馬克·J·恩布克斯 申請人:卡迪爾馬格成像公司