專利名稱:用于融合臨床和圖像特征進(jìn)行計算機(jī)輔助診斷的系統(tǒng)和方法
用于融合臨床和圖像特征進(jìn)行計算機(jī)輔助診斷的系統(tǒng)和方
法本申請涉及醫(yī)學(xué)診斷領(lǐng)域。尤其適用于計算機(jī)輔助診斷(CADx)算法和模式分類算法。不過,其還適用于對醫(yī)學(xué)診斷感興趣的其他領(lǐng)域。一種類型的CADx系統(tǒng)能夠估計在CT掃描上發(fā)現(xiàn)的肺結(jié)節(jié)是惡性的可能性。不過, 與僅僅依賴圖像信息來定位潛在異常的計算機(jī)輔助檢測算法不同的是,與惡性評估相關(guān)聯(lián)的決策過程通常包括非成像證物的結(jié)合。僅僅分析CT掃描圖像很少足以評估孤立的肺結(jié)節(jié)。批判性研究表明,診斷等級和放射性特征的感知都受到患者歷史的影響。具體地說,對于肺結(jié)節(jié)而言,研究工作已經(jīng)明確地分析了臨床危險因素調(diào)節(jié)惡性統(tǒng)計概率的程度。開發(fā)計算機(jī)輔助診斷算法因此包括臨床特征以補(bǔ)充圖像中的信息。結(jié)合不同數(shù)據(jù)類型(例如,但不限于臨床和成像數(shù)據(jù))與用戶訪問算法的方式以及使用系統(tǒng)時使用的工作流程直接相關(guān)。出于性能效率的原因,希望能在用戶訪問系統(tǒng)之前執(zhí)行盡可能多的計算機(jī)輔助診斷計算。當(dāng)前診斷系統(tǒng)的一個問題是它們的效率低,因?yàn)楫?dāng)前的系統(tǒng)需要輸入所有數(shù)據(jù),無論該數(shù)據(jù)是否是作出診斷實(shí)際需要的。因此希望通過例如使不會顯著改變診斷的無關(guān)臨床數(shù)據(jù)的輸入最少或消除,使得用戶必須輸入的信息量最小化??梢詮碾娮咏】涤涗浿刑崛∨R床信息。不過,數(shù)據(jù)字段可能缺失或不完整,信息可能是未知的。當(dāng)前診斷系統(tǒng)的另一個問題是它們?nèi)狈τ糜谔幚砣笔Щ虿煌暾R床信息的技術(shù)。所以,希望開發(fā)一種計算,其能夠評估并提供可用的臨床信息之內(nèi)的可能結(jié)果范圍。本申請?zhí)峁┝艘环N克服上述問題和其他問題的改進(jìn)系統(tǒng)和方法。根據(jù)一個方面,提供了一種使用醫(yī)學(xué)圖像數(shù)據(jù)執(zhí)行計算機(jī)輔助診斷的系統(tǒng)。該系統(tǒng)通過將數(shù)據(jù)庫中的醫(yī)學(xué)記錄和概率與當(dāng)前圖像數(shù)據(jù)比較以做出醫(yī)學(xué)診斷,以假設(shè)醫(yī)學(xué)診斷并提供診斷正確的概率。如果診斷概率下降到閾值水平以下,系統(tǒng)提示醫(yī)學(xué)用戶輸入更多臨床數(shù)據(jù),以便提供更多信息,基于更多信息,系統(tǒng)能夠生成正確概率更高的醫(yī)學(xué)診斷。根據(jù)另一方面,提供了一種利用醫(yī)學(xué)圖像執(zhí)行計算機(jī)輔助診斷的方法。該方法通過將數(shù)據(jù)庫中的醫(yī)學(xué)記錄和概率與當(dāng)前圖像數(shù)據(jù)比較而執(zhí)行醫(yī)學(xué)診斷,以假設(shè)醫(yī)學(xué)診斷并計算診斷正確的概率。如果診斷概率下降到特定閾值水平以下,則該方法要求醫(yī)學(xué)用戶獲得更多臨床數(shù)據(jù),以便提供更多信息依據(jù),基于更多信息,可以執(zhí)行更精確且更確定的醫(yī)學(xué)診斷。另一個優(yōu)點(diǎn)是為了改善工作流程將計算分成更小部分,使得效率得到改善。直到需要數(shù)據(jù)的這種時間之前不會檢索所有數(shù)據(jù)。在認(rèn)為患者需要數(shù)據(jù)之前不檢索數(shù)據(jù)。提供了另一個優(yōu)點(diǎn)以處理缺失或不完整的臨床信息。再一個優(yōu)點(diǎn)是提供了一種基于數(shù)據(jù)可用性將CADx計算分成兩個或更多步驟的接口和系統(tǒng)工作流程。再一個優(yōu)點(diǎn)是提供了一種在不同數(shù)據(jù)流變?yōu)榭捎脮r用于結(jié)合它們的計算方法。在閱讀和理解以下詳細(xì)描述后,更多優(yōu)點(diǎn)和益處對于本領(lǐng)域普通技術(shù)人員將變得顯而易見。本申請可以具體化成各種部件和部件布置以及各種步驟和步驟安排。附圖的作用僅在于對優(yōu)選實(shí)施例進(jìn)行圖示,不應(yīng)認(rèn)為其對本申請構(gòu)成限制。圖IA圖示出了 CADx診斷方法;圖IB圖示出了 CADx診斷系統(tǒng);圖2圖示出了用于生成分類算法的方式;圖3圖示出了用于分類器的訓(xùn)練方法;圖4圖示出了用于生成分類算法的另一種方式;圖5圖示出了并入群的另一種分類器;圖6圖示出了分類器在新未知病例中工作的方式;圖7圖示出了貝葉斯分析執(zhí)行風(fēng)險分析的方式;圖8圖示出了概念驗(yàn)證的試驗(yàn)結(jié)果;以及圖9圖示出了系統(tǒng)布局和部件間的交互作用。參考
圖1A,計算機(jī)輔助診斷方法100包括CADx分類器算法,其理想地在兩種數(shù)據(jù) (“數(shù)據(jù)類型1”和“數(shù)據(jù)類型2”)上運(yùn)行。臨床數(shù)據(jù)描述患者健康史、家族史、體形和生活方式各方面,包括例如但不限于抽煙、宿疾等這種要素。圖像數(shù)據(jù)包括χ射線、CT掃描和對患者執(zhí)行的任何其他類型的醫(yī)學(xué)成像。CADx算法將患者(例如肺氣腫狀態(tài),淋巴結(jié)狀態(tài)) CT圖像中的圖像數(shù)據(jù)(在本范例中即數(shù)據(jù)類型1)與臨床參數(shù)(在本范例中視為數(shù)據(jù)類型 2)中的臨床數(shù)據(jù)組合。該方法中的第一步包括從數(shù)據(jù)倉庫110檢索一組與患者相關(guān)聯(lián)的數(shù)據(jù)的步驟。這種數(shù)據(jù)可以包括一個或多個定量變量。例如,如果數(shù)據(jù)類型1更容易獲得,則檢索數(shù)據(jù)類型 1而非數(shù)據(jù)類型2,在本范例中就是這種情況。優(yōu)選無需用戶交互進(jìn)行這種檢索。例如從醫(yī)院PACS(圖片歸檔和通信系統(tǒng))自動檢索胸廓掃描的CT體積(在本范例中即數(shù)據(jù)類型 1)。下一步包括向數(shù)據(jù)類型1的數(shù)據(jù)應(yīng)用CADx算法120。這種計算的結(jié)果尚未表示 CADx算法步驟的最后診斷。優(yōu)選無需用戶交互進(jìn)行這種操作。例如CADx步驟100運(yùn)行計算機(jī)輔助檢測算法以在掃描上定位肺節(jié)結(jié),運(yùn)行分割算法以界定肺節(jié)結(jié)的邊界,處理圖像以從圖像數(shù)據(jù)中提取一組描述節(jié)結(jié)的數(shù)值特征。模式分類算法然后僅僅基于成像數(shù)據(jù)估計這個節(jié)結(jié)是惡性的可能性。該方法100尚未接收數(shù)據(jù)類型2數(shù)據(jù)來完成診斷。因此方法100測試提出的數(shù)據(jù)類型2數(shù)據(jù)的不同可能值(在這種情況下,由三個不同箭頭代表三個不同可能值),利用這些測試值,通過操作步驟130、140、150執(zhí)行的操作完成CADx計算。如果數(shù)據(jù)類型2可能有 N個不同值,那么計算N個CADx結(jié)果,數(shù)據(jù)類型2的每個測試值一個結(jié)果。例如CADx算法基于肺氣腫和淋巴結(jié)狀態(tài)的提出的所有不同可能組合調(diào)節(jié)基于圖像的分類輸出。由于這些都是二元變量(是/否),所以可能有四種不同組合。結(jié)果,現(xiàn)在CADx針對惡性的可能性具有四種潛在的答案。如果可能值的數(shù)目非常大或如果一些變量是連續(xù)的,則這個步驟變得更加復(fù)雜。當(dāng)被計算機(jī)可操作軟件模塊輸出時,合并這些輸出并被用作比較器的輸入。計算機(jī)可操作軟件模塊比較器步驟160比較N個不同候選CADx計算結(jié)果或針對惡性可能性的潛在方案并判斷它們是否在預(yù)設(shè)公差之內(nèi)??梢栽诂F(xiàn)場部署產(chǎn)品之前設(shè)置公差,或可以由用戶設(shè)置公差。如果候選CADx結(jié)果在預(yù)設(shè)公差之內(nèi)(即,知道數(shù)據(jù)類型2無影響,所以數(shù)據(jù)類型1足以做出診斷),然后顯示步驟190為用戶顯示以下各項中的一個或多個CADx計算結(jié)果的平均值、中值、范圍或方差??梢酝ㄟ^圖形方式顯示結(jié)果。例如對于一位患者,CADx算法發(fā)現(xiàn)肺氣腫和淋巴結(jié)狀態(tài)的四種組合在0-1的尺度上產(chǎn)生0. 81,0. 83、 0. 82和0. 82的惡性可能性。由于這些值都非常接近,所以無需向用戶征詢這些變量或查詢第二數(shù)據(jù)庫。在放射科醫(yī)師加載該病例時,該方法已經(jīng)完成了所有前面步驟并報告CADx算法估計惡性可能性在0. 81-0. 83之間。如果候選CADx計算結(jié)果差異很大(即知道數(shù)據(jù)類型2可能改變診斷,因此收集該信息很重要),那么方法170要求用戶提供重要的臨床信息。然后使用這一精確信息識別向用戶顯示(ISO)N個CADx輸出值中的哪個。例如對于另一位患者,CADx方法發(fā)現(xiàn)肺氣腫和淋巴結(jié)狀態(tài)的四種組合在0-1的尺度上產(chǎn)生0. 45,0. 65,0. 71和0. 53的惡性可能性。 四種估計如此不同,因此數(shù)據(jù)類型2可能改變診斷結(jié)果。在放射科醫(yī)師加載該病例時,該方法已經(jīng)完成了所有前面步驟,但向放射科醫(yī)師報告要完成CADx計算需要額外的信息(即, 數(shù)據(jù)類型幻。肺氣腫和淋巴結(jié)狀態(tài)是由用戶人工輸入的?;谠黾拥念愋?的數(shù)據(jù),CADx 選擇四種可能性之一(例如0. 65)作為其最終估計。向用戶顯示180這一最終結(jié)果。如果需要額外的數(shù)據(jù)類型2數(shù)據(jù)但無法得到,那么可以向用戶提供N種可能結(jié)果, 連同沒有足夠數(shù)據(jù)以完成計算的免責(zé)聲明。例如對于另一位患者,無法得到淋巴結(jié)狀態(tài), 可能是因?yàn)閽呙栉锤采w必要的解剖結(jié)構(gòu)。因此放射科醫(yī)師輸入正確的肺氣腫狀態(tài),而報告淋巴結(jié)狀態(tài)為未知的。利用肺氣腫數(shù)據(jù),計算機(jī)能夠?qū)⒖赡茌敵龅姆秶鷱?0.45,0.65, 0. 71,0. 53)縮小到(0. 45,0. 53),但仍然不能預(yù)測該結(jié)節(jié)更可能(> 0. 50)是惡性的還是更可能不是惡性的(< 0. 50)。該方法于是向放射科醫(yī)師報告,對患者可能患癌癥的估計為 0. 45-0. 53,但需要額外的數(shù)據(jù)來進(jìn)一步縮小答案的范圍??梢酝ㄟ^層次的方式擴(kuò)展這個過程,補(bǔ)充額外的數(shù)據(jù)流,每個數(shù)據(jù)流都具有額外的測試值和候選答案。上文所述的CADx方法之內(nèi)的算法可用于執(zhí)行隱含的計算。初始的數(shù)據(jù)類型1數(shù)據(jù)計算可以提取圖像,但不是分類步驟。不過,臨床特征的數(shù)量很大,潛在值的多樣使得對所有可能組合進(jìn)行窮舉測試是不切實(shí)際的。因此,使用新型方法以直接類似于上述工作流程的方式融合臨床和成像特征。參考肺CADx應(yīng)用的范例給出該方法的描述,并假設(shè)數(shù)據(jù)類型1是成像數(shù)據(jù),數(shù)據(jù)類型2是臨床數(shù)據(jù)。不過,應(yīng)當(dāng)認(rèn)為該方法對于需要多數(shù)據(jù)流的任何 CADx分類任務(wù)都是通用的。這里提供了將CADx產(chǎn)生的數(shù)據(jù)分成多個部分的三種不同算法方法(A)分類器選擇方法I ; (B)分類器選擇方法II ; (C)貝葉斯分析。在一種方法中,將明確的臨床數(shù)據(jù)轉(zhuǎn)換成與圖像數(shù)據(jù)兼容的數(shù)值形式。然后在數(shù)據(jù)選擇和分類器訓(xùn)練期間相對于圖像數(shù)據(jù)等價地處理經(jīng)變換的臨床數(shù)據(jù)。這種變換的范例是Ι-of-C編碼方案。在這種編碼之后,從成像數(shù)據(jù)中導(dǎo)出的數(shù)據(jù)或編碼的明確臨床變量之間沒有區(qū)別。肺CADx應(yīng)用提供了一種用于執(zhí)行這種數(shù)據(jù)融合的新方法。參考圖1B,提供了用于在計算機(jī)輔助診斷方法100中融合臨床和圖像的系統(tǒng)101, 其并入了計算機(jī)可操作設(shè)備,包括,但不限于嵌入到計算機(jī)存儲器之內(nèi)的計算機(jī)數(shù)據(jù)庫數(shù)據(jù)存儲器、計算機(jī)輸出顯示終端、用于輸入數(shù)據(jù)的鍵盤、用于導(dǎo)入和提取數(shù)據(jù)的接口以及實(shí)現(xiàn)所提應(yīng)用功能需要的任何硬件和軟件部件。系統(tǒng)執(zhí)行圖1所描述的方法100的步驟。該系統(tǒng)使用軟件處理來自數(shù)據(jù)倉庫111的數(shù)據(jù)。該軟件在處理器102上運(yùn)行,處理器在基于 CADx算法121的系統(tǒng)上實(shí)施不完整數(shù)據(jù)。利用處理器102處理數(shù)據(jù),處理器102包括執(zhí)行三種估計131、141、151中的至少一個并隨后將這一生成的數(shù)據(jù)移動到比較器146的軟件。 比較器使用計算機(jī)可操作計算模塊評估基于不完整數(shù)據(jù)的診斷是否與利用完整數(shù)據(jù)生成的估計診斷顯著不同。如果不完整數(shù)據(jù)和完整數(shù)據(jù)的診斷數(shù)據(jù)沒有顯著差異165,那么兩個結(jié)果是兩個結(jié)果的平均值,由處理器102提供167平均值并在諸如視頻顯示器的計算機(jī)輸出模塊103上顯示。然而,如果結(jié)果是不同的163,那么針對數(shù)據(jù)類型2的數(shù)據(jù)進(jìn)行查詢 171,由處理器102提供診斷并在計算機(jī)可操作輸出模塊103中顯示175。參考圖2,第一分類器選擇方法200(方法I)基于為不同的患者子組生成特定(一個或多個)分類器。開發(fā)這種算法的方法從步驟210開始,其中找到一組具有多個數(shù)據(jù)類型的患者以進(jìn)行訓(xùn)練。在下一步驟220中,在數(shù)據(jù)類型1的圖像數(shù)據(jù)上歸納出決策樹作為第一級分類器,以基于最后結(jié)果對患者大致分類。然后在步驟230中使用決策樹對訓(xùn)練數(shù)據(jù)庫中的患者分層,也稱為產(chǎn)生患者層。圖2的示意圖200指代的是兩組高風(fēng)險和低風(fēng)險, 但在產(chǎn)品應(yīng)用中可能有任意數(shù)量的組。然后在步驟MO中基于數(shù)據(jù)類型2的臨床數(shù)據(jù),針對每個患者層獨(dú)立地開發(fā)分類器。在該圖中,這是指用于高風(fēng)險和低風(fēng)險組的分類器。分類器的構(gòu)建可能涉及多個步驟以及構(gòu)建一個或多個子分類器群的分類。在步驟250中,臨床決策樹和用于兩個或更多個子組的獨(dú)立分類器是存儲的輸出。參考圖3,用于分類器選擇的訓(xùn)練方法目標(biāo)在于為不同的臨床“風(fēng)險”組產(chǎn)生特定的基于圖像的分類器。圖3中的圖表示出了如何組合臨床和圖像數(shù)據(jù)以執(zhí)行診斷300。臨床數(shù)據(jù)310是從第一病例312開始,進(jìn)行到給定的N個病例314的病例集合,其中N是表示病例數(shù)量的整數(shù),每個個體病例代表特定患者。每個病例包含患者的姓名或標(biāo)識符316以及關(guān)于患者收集的一系列屬性318。這些屬性包括,但不限于抽煙和鍛煉,或例如,但不限于身高和體重的物理屬性。這些屬性必然還包括與關(guān)注中的診斷相關(guān)聯(lián)的事實(shí),例如,但不限于患者是否患有癌癥。將這些輸入到?jīng)Q策樹算法320中,決策樹算法包括用于為生成新決策樹分支進(jìn)行訓(xùn)練的模塊322、用于檢查分支的交叉驗(yàn)證模塊324以及用于去除不再相關(guān)的分支的修剪模塊326。使用決策樹算法320產(chǎn)生或輸出臨床決策樹330。圖像340的訓(xùn)練數(shù)據(jù)包括一系列病例,從第一病例342開始,進(jìn)行到給定的N個病例344,每個個體病例代表特定患者。病例342、344代表與病例312、314相同的患者。每個病例包含患者的姓名或標(biāo)識符346以及關(guān)于患者和患者醫(yī)學(xué)圖像收集的一系列屬性348。 屬性必然包括與關(guān)注中的診斷相關(guān)聯(lián)的事實(shí),例如,但不限于患者是否患有癌癥。屬性還包括,但不限于圖像及圖像區(qū)域的描述性特征,例如,但不限于對比度、紋理、形狀、亮度和亮度變化的描述信息。結(jié)合決策樹算法320和臨床數(shù)據(jù)310,使用來自圖像340的訓(xùn)練數(shù)據(jù)的這些病例來產(chǎn)生分層數(shù)據(jù)350。產(chǎn)生分層數(shù)據(jù)350,基于特定健康背景的人可能有或沒有給定疾病或病情的概率, 即基于臨床數(shù)據(jù)310中包含的信息,確定個體病例是否呈現(xiàn)患有給定疾病或病情的高風(fēng)險 352或低風(fēng)險354??赡苄愿叩娜吮环诸惓筛唢L(fēng)險360成像數(shù)據(jù),而患這種疾病可能性低的人被分類成低風(fēng)險370。高風(fēng)險360和低風(fēng)險370人都是由分類器開發(fā)模塊380分析的。 利用380和輸入訓(xùn)練數(shù)據(jù)360開發(fā)具體圖像分類器390以對高風(fēng)險患者分類。利用380和輸入訓(xùn)練數(shù)據(jù)370開發(fā)具體圖像分類器395以對低風(fēng)險患者分類。參考圖4,基于選出一個或多個被發(fā)現(xiàn)針對不同患者子組性能良好的分類器提供第二分類器選擇400 (方法II)。在第一步410中,找到一組具有多種數(shù)據(jù)類型的患者用于訓(xùn)練。然后,在步驟420中,在數(shù)據(jù)類型1(即臨床數(shù)據(jù))上歸納出決策樹作為第一級分類器,以基于最后結(jié)果對患者大致分類。在步驟430中使用決策樹對訓(xùn)練數(shù)據(jù)庫中的患者分層。在圖4的方法400中,我們將這兩組患者結(jié)果稱為高風(fēng)險和低風(fēng)險,但這個數(shù)字可以是任何值。在步驟440中基于數(shù)據(jù)類型2 (即臨床數(shù)據(jù))開發(fā)一大組可能分類器,忽略患者的任何分層??梢酝ㄟ^使訓(xùn)練中使用的數(shù)據(jù)隨機(jī)化并且組合一個或多個特征選擇或分類器算法來獲得這些分類器的多樣性。在步驟450中測試每個分類器針對訓(xùn)練數(shù)據(jù)(數(shù)據(jù)類型2) 的性能。在步驟460中,將對每個患者層具有高性能的那些分類器保持在獨(dú)立的組中。針對y患者層的結(jié)果462為y,但未必是不相關(guān)的分類器組??梢詫⒚恳粚由系摩苽€最佳分類器464放入對應(yīng)的分類器組中,或者,所有基于精確度、靈敏度、特異性或其他度量特征具有最低性能的分類器466。在步驟470中,每層中的分類器組形成分類器群。在步驟480 中,臨床決策樹和用于兩個或更多個子組的獨(dú)立分類器群被作為輸出存儲。分類器是基于最終結(jié)果的患者分類。群是基于預(yù)測能力排列的一組分類器。群中的分類器一起能夠比個體分類器更好且更精確地預(yù)測。參考圖5,開發(fā)各式各樣的基于圖像的分類器,然后使用臨床數(shù)據(jù)決定針對不同的臨床“風(fēng)險”組使用哪個分類器。接下來將這樣產(chǎn)生的分類器用于對新的、先前未見過的患者500進(jìn)行計算機(jī)輔助診斷。應(yīng)用這些分類器的方法非常類似于圖3中所示的方法。臨床數(shù)據(jù)510是從第一病例512開始,進(jìn)行到給定的第N個病例514的病例集合, 每個個體病例代表特定患者。每個病例包含患者的姓名或標(biāo)識符516以及關(guān)于患者收集的一系列屬性518。屬性包括,但不限于抽煙和鍛煉,或例如,但不限于身高和體重的物理屬性。這些屬性必然還包括與關(guān)注中的診斷相關(guān)聯(lián)的事實(shí),例如,但不限于患者是否患有癌癥。決策樹算法520訪問這些屬性,決策樹算法自身包括用于為生成新決策樹分支進(jìn)行訓(xùn)練的模塊522、用于檢查分支的交叉驗(yàn)證的模塊524以及用于去除不再相關(guān)的分支的修剪的模塊526。使用決策樹算法520產(chǎn)生臨床決策樹530。圖像540的訓(xùn)練數(shù)據(jù)包括一系列病例,從第一病例542開始,進(jìn)行到第N病例M4, 每個個體病例代表特定患者。病例M2、544與病例512、514表示相同患者。每個病例包含患者的姓名或標(biāo)識符M6以及關(guān)于患者和患者的醫(yī)學(xué)圖像收集的一系列屬性M8。屬性必然包括與關(guān)注中的診斷相關(guān)聯(lián)的事實(shí),例如,但不限于患者是否患有癌癥。屬性還包括,但不限于圖像及圖像區(qū)域的描述性特征,例如,但不限于對比度、紋理、形狀、亮度和亮度變化的描述信息。與決策樹算法520組合使用這些病例以生成分層數(shù)據(jù)550。分層數(shù)據(jù)550是一系列至少一個病例552到第N個病例554,產(chǎn)生分層數(shù)據(jù)以基于特定健康背景的人可能有或沒有給定疾病或病情的概率,即基于臨床數(shù)據(jù)510中包含的信息,確定個體病例是否呈現(xiàn)出患有給定疾病或病情的高風(fēng)險556或低風(fēng)險558。可能性高的人被分類成高風(fēng)險552成像數(shù)據(jù),而患這種疾病可能性低的人會被分類成低風(fēng)險554。圖像訓(xùn)練數(shù)據(jù)540還被發(fā)送到包括特征572選擇部分和訓(xùn)練574部分的群模塊 570。這種群生成方式產(chǎn)生并存儲包括多個分類器582的基于圖像的分類器庫580,所述分類器能夠?qū)⒉±?46及其成像屬性548與適當(dāng)診斷相關(guān)聯(lián)。然后將這些分類器582應(yīng)用到 583自測試數(shù)據(jù)模塊556。高風(fēng)險552和低風(fēng)險554的人都將隨后通過自我測試556進(jìn)行分析。
接下來,高風(fēng)險結(jié)果是接收器操作特征曲線(ROC)處理器560。在高風(fēng)險分類器區(qū)域590中記錄針對高風(fēng)險的最佳分類器群。類似地,低風(fēng)險結(jié)果會被發(fā)送到低風(fēng)險結(jié)果 ROC 562。在低風(fēng)險分類器區(qū)域592中記錄針對低風(fēng)險的最佳分類器群。圖6示出了分類器選擇系統(tǒng)如何對新的未知病例600操作的示意圖。新病例臨床數(shù)據(jù)610模塊包括至少一個新病例612,新病例包括病例名稱614和一系列要素616。這個病例被發(fā)送到類似于圖3和5中分別示出的臨床決策樹330和530的臨床決策樹620。選擇兩個備選路徑之一。新病例圖像數(shù)據(jù)630模塊包括至少一個新病例632,新病例包括病例名稱634和一系列要素636。這至少一個新病例代表與新病例臨床數(shù)據(jù)模塊610中表示的相同的人。發(fā)送這個病例,由兩個備選路徑分類。在一條路徑中,使用基于圖像的用于高風(fēng)險的分類器群 640。這個高風(fēng)險分類器群640類似于前述模塊390和590。在第二路徑中,使用基于圖像的用于低風(fēng)險的分類器群650。這個低風(fēng)險分類器群650類似于前述模塊392和592。臨床決策樹的結(jié)果是使用路徑選擇激活哪個路徑?;顒勇窂皆试S在惡性可能性模塊660中存儲兩個基于圖像的分類器群結(jié)果之一的結(jié)果(高風(fēng)險結(jié)果或低風(fēng)險結(jié)果)。參考圖7,通過貝葉斯分析700方法提供了將CADx問題分成部分的第三種方法。 在這里,使用貝葉斯分析關(guān)鍵相關(guān)方程式的總結(jié)來分析風(fēng)險因素。痛苦(affliction)的似然比710,縮寫為LR 711,等于(750)靈敏度764除以一減去特異性766的公式760。發(fā)生 722的幾率720等于(750)概率774除以一減去同樣概率774的值776的公式770。諸如, 但不限于癌癥的疾病732的后驗(yàn)可能性730等于(750)癌癥先驗(yàn)可能性764乘以通過類似于似然比711的方法計算的一系列似然比766的公式780。疾病的概率740,例如,但不限于癌癥概率742,等于(750)可能性792除以可能性792加一 794的公式790,其中可能性 792是以類似于先前計算的可能性722、732的方法計算的。在這種實(shí)現(xiàn)本申請的方法中,將構(gòu)造基于圖像特征的CADx系統(tǒng)。將使用這種基于圖像的系統(tǒng)首先向未知病例分配惡性的可能性。這種基于圖像的CADx輸出將充當(dāng)先驗(yàn)概率。將基于臨床特征的貝葉斯分析調(diào)節(jié)這種概率。如前所述,將進(jìn)行測試,以查看概率的貝葉斯修改是否影響最終計算的結(jié)果。將僅在通過比較計算而認(rèn)為必要時才為用戶提供臨床 fn息ο參考圖8,提供了肺CADx應(yīng)用800中兩個分類器選擇系統(tǒng)300、500的概念驗(yàn)證。 接收器操作特征曲線(ROC)包括通過在X軸上繪示1減去特異性,在Y軸上繪示靈敏度形成的針對二元分類器系統(tǒng)的曲線圖。這條繪制曲線下方的區(qū)域?yàn)锳z,是精確度的指標(biāo)。值 1. O代表完美精確測試,值.9到1代表極好測試,值.8到.9代表良好測試,值.7到.8代表合理的測試,值.6到.7代表較差測試,低于.6的值代表失敗的測試。ROCAz代表給出這些值的ROC曲線下方的面積。利用肺結(jié)節(jié)數(shù)據(jù)集執(zhí)行概念驗(yàn)證測試。利用線性判別分類器的隨機(jī)子空間群執(zhí)行分類。在X軸上顯示平均子集大小,其增大到最大值820,即60。Y軸包含ROCh值,該值增加到最大值840,大約為0.9。曲線給出了兩種方法。在通過方式300導(dǎo)出的第一方法 I 860中,隨著子集大小增大,ROC Az的值穩(wěn)定增加880,到達(dá)峰值882,穩(wěn)定在884,在886 開始顯著下降,結(jié)束于最低值888上方。在通過方式500導(dǎo)出的第二方法II 870中,隨著子集大小增加,ROC Az的值穩(wěn)定增大890,穩(wěn)定892,到達(dá)峰值894,穩(wěn)定下降896,并結(jié)束于其最低值898。通常,隨著平均子集大小增加,對于方法I和II兩者,ROC Az的值都增大, 直到子集大小達(dá)到30。然后,隨著子集大小減小,ROC h開始減小。方法II 870表現(xiàn)為比方法I 860更精確。h與子集大小的關(guān)系與前面公開的使用常規(guī)分類器群方法的結(jié)果一致。因此,我們相信這里描述的方法能夠匹配現(xiàn)有技術(shù)CADx系統(tǒng)的診斷精確度,同時獲得很好地適合于臨床應(yīng)用的改進(jìn)工作流程和接口的益處。進(jìn)一步執(zhí)行初始測試以證實(shí)所提出的方法700的合理性。將沒有臨床特征的“留一”CADx結(jié)果與患者年齡信息組合。使用線性判別分類器的隨機(jī)子空間群生成基于圖像的分類器,獲得0.861的^。利用貝葉斯統(tǒng)計將這與年齡組合獲得0.877的^。這些結(jié)果證實(shí)了這種貝葉斯方法進(jìn)行數(shù)據(jù)融合的可行性和潛力。參考圖9,該系統(tǒng)采用醫(yī)學(xué)圖像910,醫(yī)學(xué)圖像910被輸入到計算機(jī)可操作系統(tǒng)920 中進(jìn)行處理。在計算機(jī)可操作系統(tǒng)920上執(zhí)行的決策引擎訪問來自計算機(jī)輔助診斷數(shù)據(jù)庫 930的基于計算機(jī)的分類器系統(tǒng)。在計算機(jī)可操作系統(tǒng)920上執(zhí)行分類器系統(tǒng)以基于圖像數(shù)據(jù)910計算部分診斷并基于可能的臨床數(shù)據(jù)進(jìn)一步計算可能的完整診斷。決策引擎基于這些診斷判斷是否需要額外的臨床數(shù)據(jù)。如果需要,向具有顯示終端970的接口引擎980 發(fā)送對額外臨床數(shù)據(jù)的請求,其向操作員查詢額外信息。如果有的話,然后將這種額外信息發(fā)送到?jīng)Q策引擎以計算最后診斷。然后將這個診斷發(fā)送到計算機(jī)顯示終端970?;蛘?,如果操作員不能提供額外信息,或如果決策引擎判定不需要額外數(shù)據(jù),那么可以在計算機(jī)顯示終端970上顯示決策引擎計算的部分結(jié)果或可能診斷。進(jìn)一步在決策數(shù)據(jù)庫930中存儲計算的結(jié)果??梢栽谟嬎銠C(jī)可操作系統(tǒng)920的決策引擎和接口引擎980之間進(jìn)行通信?;蛘?,決策引擎和接口引擎980都可以在同一計算機(jī)設(shè)備中。保健領(lǐng)域中的關(guān)鍵應(yīng)用包括基于圖像的臨床決策支持系統(tǒng),尤其是用于治療的計算機(jī)輔助診斷系統(tǒng)和臨床決策支持(CDS)系統(tǒng),其可以集成于醫(yī)學(xué)成像系統(tǒng)、成像工作站、 患者監(jiān)測系統(tǒng)和保健信息學(xué)之內(nèi)。具體的基于圖像的計算機(jī)輔助診斷和治療CDS系統(tǒng)包括,但不限于基于CT、MRI、超聲波、PET或SPECT的用于肺癌、乳腺癌、結(jié)腸癌、前列腺癌的那些系統(tǒng)。集成可能涉及在放射醫(yī)學(xué)工作站(例如,PMW,Philips Extended Brilliance 工作站)或PACS (例如iSite )中使用本申請。已經(jīng)參考優(yōu)選實(shí)施例描述了本申請。在閱讀并理解了前述詳細(xì)說明的情況下,其他人可以想到修改和變更。意圖將本申請解釋為包括所有這樣的修改和變更,只要這些修改和變更在所附權(quán)利要求或其等價物的范圍之內(nèi)。
權(quán)利要求
1.一種用于提供醫(yī)學(xué)圖像的交互式計算機(jī)輔助分析的系統(tǒng),包括 圖像處理器(910),其用于處理醫(yī)學(xué)圖像數(shù)據(jù)(940);決策引擎(920),其用于僅基于經(jīng)處理的醫(yī)學(xué)圖像數(shù)據(jù)產(chǎn)生診斷并基于額外臨床數(shù)據(jù)的可能值進(jìn)一步評估可能的診斷結(jié)果;數(shù)據(jù)庫(930),其包括在先診斷、在先診斷伴隨的概率(960),以及用于在僅給出圖像數(shù)據(jù)、給出具有不完整臨床數(shù)據(jù)的圖像數(shù)據(jù)或給出具有臨床數(shù)據(jù)的圖像數(shù)據(jù)時評估疾病概率的分類器算法;接口引擎(980),其用于請求和輸入臨床數(shù)據(jù);以及顯示終端(970),其用于顯示所述計算機(jī)輔助分析的結(jié)果。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述決策引擎(920)在所述顯示終端(970)上顯示平均診斷并確定(160)做出明確診斷(660)所需要的額外數(shù)據(jù),例如臨床數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其中,臨床數(shù)據(jù)包括病史、健康史、家族史、物理測量結(jié)果和人口統(tǒng)計數(shù)據(jù)中的至少一種。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,使用所述圖像數(shù)據(jù)或所述臨床數(shù)據(jù)中的至少一個,以針對具體疾病(350)將數(shù)據(jù)分層為高風(fēng)險或低風(fēng)險。
5.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,將所述病例數(shù)據(jù)庫(930)用于以下中的至少一個量化風(fēng)險因素,產(chǎn)生基于圖像的分類器庫,以及導(dǎo)出群。
6.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述決策引擎(920) 基于可獲得的圖像數(shù)據(jù)和可獲得的臨床數(shù)據(jù)確定疾病的概率; 基于一系列針對不可獲得的臨床數(shù)據(jù)的可能值重新確定概率;將可獲得的數(shù)據(jù)得出的所述概率以及可獲得的數(shù)據(jù)加潛在不可獲得的數(shù)據(jù)得出的所述概率進(jìn)行比較;基于對所述醫(yī)學(xué)圖像數(shù)據(jù)的評價估計疾病的可能性;基于所述醫(yī)學(xué)圖像數(shù)據(jù)加上臨床數(shù)據(jù)的不同值估計具體疾病的可能性;以及比較所估計的可能性以確定哪種不可獲得的數(shù)據(jù)會顯著影響所估計的可能性。
7.一種確定是否需要額外數(shù)據(jù)以做出醫(yī)學(xué)診斷的方法,包括 接收醫(yī)學(xué)圖像數(shù)據(jù);將當(dāng)前癥狀集與在先診斷集比較;以及基于所述比較的結(jié)果,確定哪種不可獲得的數(shù)據(jù)對所確定的概率有顯著影響。
8.根據(jù)權(quán)利要求7所述的方法,其中,響應(yīng)于所估計的可能性在預(yù)選閾值之內(nèi)匹配,給出估計的疾病可能性。
9.根據(jù)權(quán)利要求7所述的方法,其中,響應(yīng)于所比較的可能性在閾值之外,提示用戶需要哪種不可獲得的臨床數(shù)據(jù)以使所比較的可能性位于所述閾值之內(nèi)。
10.根據(jù)權(quán)利要求7所述的方法,其中,在數(shù)據(jù)庫(510)中記錄圖像、臨床和診斷數(shù)據(jù)。
11.根據(jù)權(quán)利要求10所述的方法,其中,使用所述數(shù)據(jù)庫以增大至少一個將來診斷的置信度。
12.—種計算機(jī)輔助診斷(CADx)系統(tǒng),包括處理器(920),其被編程為執(zhí)行根據(jù)權(quán)利要求7所述的方法;以及顯示器(970),其顯示診斷和估計的概率。
13.一種計算機(jī)可編程介質(zhì),其包括計算機(jī)程序,當(dāng)在計算機(jī)上加載時所述計算機(jī)程序控制所述計算機(jī)執(zhí)行根據(jù)權(quán)利要求7所述的方法。
14.一種將計算機(jī)輔助診斷(CADx)分成部分以減少用戶輸入的方法,所述方法包括 定義具有多個數(shù)據(jù)類型的一組患者以用于訓(xùn)練O10);在臨床數(shù)據(jù)上歸納出決策樹作為分類器以基于最終結(jié)果(220)對所述患者大致分類, 所述決策樹對訓(xùn)練數(shù)據(jù)庫中的所述患者分層,以獲得將患者分類在高風(fēng)險組或低風(fēng)險組 (230)的患者層;基于來自每個患者層O40)的成像數(shù)據(jù)開發(fā)至少一個分類器(380);以及存儲所述決策樹并針對兩個或更多個子組分離分類器。
15.根據(jù)權(quán)利要求14所述的方法,還包括使用所述決策樹將所述患者分層為低風(fēng)險或高風(fēng)險G30); 基于所述成像數(shù)據(jù)開發(fā)一大組可能分類器,忽略患者的任何分層G40); 針對每個所述分類器(450)測試對所述訓(xùn)練數(shù)據(jù)的性能,將對每個患者層具有高性能的分類器保持在獨(dú)立組中,從而使得針對y個患者層的結(jié)果包括y組分類器;以及在所述分類器組中放置以下中的至少一個每層的ζ個最佳分類器,或所有對精確度、 靈敏度、特異性或其他度量特性性能要求最低的分類器(460)。
16.一種應(yīng)用已分成部分的計算機(jī)輔助診斷的方法,所述方法包括 定義至少包括成像數(shù)據(jù)的輸入患者數(shù)據(jù);向所述輸入患者數(shù)據(jù)應(yīng)用從不同患者層導(dǎo)出的圖像分類器以產(chǎn)生所述患者的多個診斷假設(shè);請求輸入關(guān)于所述患者的額外臨床信息;向關(guān)于所述患者的額外臨床信息應(yīng)用臨床決策樹以確定所述患者所屬的層;以及使用這種分層從所述多個診斷假設(shè)中選擇最后診斷。
全文摘要
一種提供醫(yī)學(xué)圖像的計算機(jī)輔助分析的系統(tǒng)和方法使用圖像處理器(910)處理醫(yī)學(xué)圖像數(shù)據(jù)。決策引擎(920)基于圖像數(shù)據(jù)(940)產(chǎn)生診斷。決策引擎基于圖像數(shù)據(jù)估計疾病概率并評估任何不可用數(shù)據(jù)的相關(guān)性。使用結(jié)果以從用戶那里請求獲得這種不可用數(shù)據(jù),用于計算更完整的診斷,或者由于缺少額外數(shù)據(jù)或不完整診斷結(jié)果的置信度問題,以不完整形式顯示結(jié)果??梢栽谳敵鼋K端(970)上顯示診斷結(jié)果或可以在數(shù)據(jù)庫(930)中存儲診斷結(jié)果。
文檔編號G06F19/00GK102165453SQ200980137501
公開日2011年8月24日 申請日期2009年9月9日 優(yōu)先權(quán)日2008年9月26日
發(fā)明者L·博羅茨基, M·C·李 申請人:皇家飛利浦電子股份有限公司