專利名稱::診斷和監(jiān)測動脈粥樣硬化性心血管疾病的方法和組合物的制作方法診斷和監(jiān)測動脈粥樣硬化性心血管疾病的方法和組合物相關(guān)申請的交叉引用本申請要求2005年6月24日提交的美國臨時申請60/693,756的優(yōu)先權(quán),該份申請的內(nèi)容出于所有目的全文納入本文作為參考。
背景技術(shù):
:發(fā)明領(lǐng)域本申請涉及生物信息學(xué)和動脈粥樣硬化性疾病領(lǐng)域。具體地說,本發(fā)明涉及用于動脈粥樣硬化性疾病的診斷、監(jiān)測和治療劑開發(fā)的方法和組合物。相關(guān)領(lǐng)域描述由于我們進行早期和準確診斷然后進行積極治療的能力有限,動脈粥樣硬化性心血管疾病(ASCVD)依舊是全球發(fā)病率和死亡率的主要原因。ASCVD患者代表了不均勻的一群個體,其所患疾病以不同的速度和截然不同的模式發(fā)展。雖然ASCVD患者明顯有適當(dāng)?shù)闹委煼椒ǎ磕甑膹?fù)發(fā)率和死亡率依舊有2-4%。由于我們不能準確地鑒定可從積極風(fēng)險降低(aggressiveriskreduction)中獲益的那些患者,初級預(yù)防(primaryprevention)的各種優(yōu)點還未實現(xiàn)。雖然某些疾病標記已顯示能在群體水平預(yù)測治療的結(jié)果和反應(yīng),但它們不夠靈敏或特異,從而不足以臨床應(yīng)用于個體患者。因此,超過半數(shù)的冠狀動脈疾病患者的首次臨床表現(xiàn)便是心肌梗塞或死亡。體檢和目前的診斷方法不能準確測定個體患ASCVD并發(fā)癥的風(fēng)險。己知的風(fēng)險因素,例如高血壓、高脂血癥、糖尿病、家族史和吸煙未能確立動脈粥樣硬化性疾病的診斷方法。依賴于解剖學(xué)數(shù)據(jù)(例如,冠狀動脈造影術(shù)、冠狀動脈鈣化度(coronarycalciumscore)、CT或MRI血管造影術(shù))的診斷方法缺乏有關(guān)該疾病過程的生物學(xué)活性的信息,對未來心臟活動(cardiacevent)的預(yù)測不佳。功能性評估內(nèi)皮功能可以是非特異性的并且與動脈粥樣硬化性疾病過程的存在無關(guān),雖然一些數(shù)據(jù)證明這些測量值有預(yù)后價值。個體生物標記,例如脂質(zhì)和炎性標記已顯示能預(yù)測ASCVD患者對治療的結(jié)果和反應(yīng),一些標記用作產(chǎn)生動脈粥樣硬化性疾病的重要風(fēng)險因子。然而,迄今為止,沒有一種生物標記足夠特異從而足以臨床應(yīng)用于診斷個體患者的ASCVD。動脈粥樣硬化性心血管疾病的復(fù)雜性質(zhì)據(jù)信,動脈粥樣硬化通常是涉及多種生物學(xué)途徑的復(fù)雜疾病。動脈粥樣硬化性疾病過程的自然變遷史以及對風(fēng)險因素的反應(yīng)不同和個體的治療反應(yīng)變化部分反映了遺傳背景和它們與導(dǎo)致該疾病發(fā)生和改變的環(huán)境因素之間錯綜復(fù)雜的相互作用中的差異。心血管系統(tǒng)本身的復(fù)雜性質(zhì)也影響動脈粥樣硬化性疾病,在該系統(tǒng)中,解剖學(xué)、功能和生物學(xué)均在健康和疾病中發(fā)揮至關(guān)重要的作用。由于這種復(fù)雜性,一種標記或方法不可能產(chǎn)生足夠的信息而獲取該疾病過程的真實性質(zhì)。單一生物標記方法炎癥ASCVD的各階段均涉及炎癥,據(jù)信炎癥是動脈粥樣硬化的病理生理學(xué)基礎(chǔ)的主要部分,其提供該疾病過程的潛在標記。在許多流行病學(xué)研究中循環(huán)炎性生物標記升高已顯示能對心血管風(fēng)險分層次并評估對治療的反應(yīng)。目前,雖然炎癥的通用標記可能用于對風(fēng)險分層次,但它們不足以鑒定個體中是否存在CAD,因為許多標記缺乏特異性。出于相似的原因,炎癥的通用標記,例如C-反應(yīng)性蛋白(CRP)和紅細胞沉降率(ESR)早已不用作其它炎性疾病,例如狼瘡和類風(fēng)濕性關(guān)節(jié)炎的特異性診斷標記,雖然它們依舊是臨床實踐中對風(fēng)險分層次和(評估)治療反應(yīng)的重要標記。個體對環(huán)境風(fēng)險因素的反應(yīng)不均勻也可能誘導(dǎo)ASCVD標記濃度高度變化。在這點上,一種炎性蛋白所攜帶的生物學(xué)信息不足以全面代表血管炎性狀態(tài),從而不能準確鑒定是否存在疾病或其嚴重程度。動脈粥樣硬化的病理生理學(xué)基礎(chǔ)動脈粥樣硬化斑塊由累積的胞內(nèi)和胞外脂質(zhì)、平滑肌細胞、結(jié)締組織和葡萄糖胺聚糖構(gòu)成。動脈粥樣硬化最早的可檢測損傷是由充滿脂質(zhì)的泡沫細胞構(gòu)成的脂肪紋,這些細胞是作為單核細胞從循環(huán)(系統(tǒng))遷移入內(nèi)膜的內(nèi)皮下層中的巨噬細胞,脂肪紋隨后演化成由圍繞以結(jié)締組織的內(nèi)膜平滑肌細胞和胞內(nèi)及胞外脂質(zhì)構(gòu)成的纖維斑塊。已有人提出了相關(guān)的假設(shè)來解釋動脈粥樣硬化的發(fā)病機理。脂質(zhì)假說假定血7槳LDL水平升高會導(dǎo)致LDL透入動脈壁中,造成脂質(zhì)累積在平滑肌細胞和巨噬細胞中。LDL對生長因子起反應(yīng)還會促進平滑肌細胞增生以及遷移入內(nèi)膜下和內(nèi)膜區(qū)域中。在此環(huán)境中,LDL得到修飾或氧化,從而更能造成動脈粥樣硬化。修飾或氧化的LDL對單核細胞有趨化性,促使它們遷移入內(nèi)膜,早期出現(xiàn)在脂肪紋中和轉(zhuǎn)化為巨噬細胞并駐留在內(nèi)膜下隔室中。巨噬細胞表面的清道夫受體促進氧化的LDL進入這些細胞,將它們轉(zhuǎn)化成充滿脂質(zhì)的巨噬細胞和泡沫細胞。氧化的LDL還對內(nèi)皮細胞有毒性,可導(dǎo)致它們功能障礙或因更嚴重的損傷而喪失。慢性內(nèi)皮損傷假說假定各種機理造成的內(nèi)皮損傷導(dǎo)致內(nèi)皮喪失,血小板附著到內(nèi)皮下膜、血小板凝集、單核細胞和T-細胞淋巴細胞的趨化作用并釋放血小板衍生和單核細胞衍生的生長因子,這些生長因子能誘導(dǎo)平滑肌細胞從介質(zhì)遷移入內(nèi)膜中并在其中復(fù)制、合成結(jié)締組織和蛋白聚糖進而形成纖維斑塊。其它細胞,例如巨噬細胞、內(nèi)皮細胞、動脈平滑肌細胞也產(chǎn)生能促進平滑肌(細胞)增生并胞外基質(zhì)產(chǎn)生的生長因子。內(nèi)皮功能障礙包括提高了內(nèi)皮對脂蛋白和其它血漿成分的滲透性,附著分子的表達和生長因子的加工從而導(dǎo)致單核細胞、巨噬細胞和T淋巴細胞附著增加。這些細胞可經(jīng)內(nèi)皮遷移并將自己定位于內(nèi)皮下層中。泡沫細胞也釋放生長因子和細胞因子,從而能促進平滑肌細胞遷移和刺激血管內(nèi)膜(neointimal)增殖,基序、、繼續(xù)累積脂質(zhì)并支持內(nèi)皮細胞功能障礙。臨床和實驗室研究顯示炎癥在粥樣斑的產(chǎn)生、發(fā)展和不穩(wěn)定中起主要作用。"自身免疫"假說假定炎性免疫學(xué)過程是動脈粥樣硬化的最早階段的特征,其由抵御內(nèi)源性抗原的體液和細胞免疫反應(yīng)來啟動。人Hsp60表達本身是由幾種應(yīng)激因素啟動的對損傷的反應(yīng),所述應(yīng)激因素已知是動脈粥樣硬化的風(fēng)險因素,例如高血壓。氧化的LDL是動脈粥樣硬化自身抗原的另一候選對象。已在動脈粥樣硬化患者中檢測到oxLDL的抗體,動脈粥樣硬化損傷中也發(fā)現(xiàn)了它們。從人動脈粥樣硬化損傷處分離的T淋巴細胞已顯示對oxLDL有反應(yīng),其是細胞免疫應(yīng)答中的主要自身抗原。所提出的與動脈粥樣硬化有關(guān)的第三種自身抗原是2-糖蛋白1(2GPI),其是用作體外抗凝劑的一種糖蛋白。動脈粥樣硬化斑塊中發(fā)現(xiàn)了2GPI,在易患動脈粥樣硬化的轉(zhuǎn)基因小鼠中用2GPI高度免疫或轉(zhuǎn)移2GPI-反應(yīng)性T細胞增強了脂肪紋形成。感染可通過誘導(dǎo)炎癥和自身免疫力而導(dǎo)致動脈粥樣硬化產(chǎn)生。許多研究證明了傳染性因子,病毒(巨細胞病毒、單純皰疹病毒、腸病毒、甲肝病毒)和細菌(肺炎衣原體(C.p"ewwom力e)、幽門螺桿菌(//.j^/on')、牙周病原體)在動脈粥樣硬化中的作用。近年來,已有人提出了新的"病原體負荷"假說,提示多種傳染性因子可導(dǎo)致了動脈粥樣硬化,感染所致的心血管疾病風(fēng)險與個體所接觸的病原體數(shù)量有關(guān)。對于一種微生物,肺炎衣原體可能與動脈粥樣硬化最相關(guān)。這些假說關(guān)系密切,不是相互排斥的。修飾的LDL對培養(yǎng)的內(nèi)皮細胞具有細胞毒性,可誘導(dǎo)內(nèi)皮損傷,吸引單核細胞和巨噬細胞并刺激平滑肌生長。修飾的LDL還能抑制巨噬細胞活動性,從而使得巨噬細胞一旦在內(nèi)皮下間隙中轉(zhuǎn)化成泡沫細胞,即被截留。此外,再生的內(nèi)皮細胞(損傷后)功能受損,其從血漿攝取LDL增加。動脈粥樣硬化的特征在于除非臨界狹窄、血栓形成、動脈瘤或栓塞接連發(fā)生否則不為人知。首先,癥狀和體征反映出受影響的組織的血流量不能隨需求而增加,例如心絞痛發(fā)作、間歇性跛行。癥狀和體征通常隨著粥樣斑緩慢侵入血管腔而逐漸發(fā)展。然而,當(dāng)主要的動脈被急性阻塞時,癥狀和體征可能是驚人的。如上所述,目前,因為缺乏合適的診斷方法,超過半數(shù)的冠狀動脈疾病患者的首次臨床表現(xiàn)便是心肌梗塞或死亡。預(yù)防和治療的進一步發(fā)展取決于開發(fā)出將焦點集中在血管壁初級炎性過程上的方案,該過程在動脈粥樣硬化性疾病的病因?qū)W中是基礎(chǔ)性的。沒有能準確報道血管壁疾病活性和/或程度的良好替代標記便不可能開發(fā)出能完全確定風(fēng)險、監(jiān)測風(fēng)險的作用向原發(fā)病緩解降低或開發(fā)靶向血管壁的新型治療劑的方法。一種有前途的方法是鑒定能反映血管炎癥程度和特征的循環(huán)蛋白。已鑒定到許多免疫調(diào)制蛋白作為替代標記具有一定價值,但這些生物標記尚未顯示添加了足夠的信息從而能應(yīng)用于臨床。這是因為^未能同時顧及所檢測的多種標記的數(shù)據(jù),^未能將單個標記數(shù)據(jù)與調(diào)節(jié)循環(huán)蛋白水平并混淆信息模式的臨床數(shù)據(jù)整合,遺傳變異促進了編碼這些標記的基因表達水平并混淆了豐度測定,和W缺乏在ASCVD中激活的特異性免疫途徑的有關(guān)信息,而這些信息能用于更好地選擇生物標記。最后,現(xiàn)有技術(shù)未能提供可利用一組循環(huán)蛋白的檢測值的有效診斷或預(yù)測方法。未滿足的臨床與科學(xué)需求因此,將鑒定患血管炎癥和動脈粥樣硬化性心血管疾病個體的改進工具用于臨床醫(yī)學(xué)和生物醫(yī)學(xué)研究的需求未獲滿足。目前,雖然對動脈粥樣硬化的機制和情況的了解在增加,但我們用于鑒定高風(fēng)險患者并預(yù)測預(yù)防方案效力的方法依舊不夠。因此,需要新方法來更好地診斷風(fēng)險患者;鑒定動脈粥樣硬化性疾病患者可啟動急需的治療從而能改善臨床結(jié)果。發(fā)明概述本發(fā)明提供檢測循環(huán)蛋白表達來診斷、監(jiān)測動脈粥樣硬化病癥并開發(fā)相關(guān)治療劑的方法,所述動脈粥樣硬化病癥包括但不限于會導(dǎo)致心絞痛、不穩(wěn)定心絞痛、急性冠狀動脈綜合征、心肌梗塞和心力衰竭的病癥。具體地說,本發(fā)明鑒定和描述了在動脈粥樣硬化患者中表達有差異的循環(huán)蛋白,所述蛋白包括但不限于循環(huán)炎性標記。本文鑒定的循環(huán)炎性標記包括MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1。檢測本文所鑒定蛋白質(zhì)的循環(huán)水平可將患者分類為屬于各種動脈粥樣硬化情況,包括動脈粥樣硬化性疾病、無疾病、心肌梗塞、穩(wěn)定的心絞痛、接受藥物治療、未治療等,所述蛋白質(zhì)是因動脈粥樣硬化過程而在血管壁中特異性產(chǎn)生的。還可用這種分類預(yù)測心血管活動和對治療的反應(yīng);并用于預(yù)測和評估心血管疾病的并發(fā)癥。在本發(fā)明的一個實施方式中,對于表明動脈粥樣硬化各階段及其臨床后遺癥的各種情況,評估一組蛋白質(zhì)的表達情況(expressionprome)。這樣一組蛋白質(zhì)所提供的鑒別水平是用單個標記做不到的。在一個實施方式中,通過檢測蛋白質(zhì)濃度或含量來測定表達分布。分析方法可包括但不限于利用數(shù)據(jù)集形成預(yù)測模型,將測試樣品數(shù)據(jù)輸入這種模型根據(jù)動脈粥樣硬化分類來分類樣品,其中所述分類選自動脈粥樣硬化性疾病分類、健康分類、血管炎癥分類、用藥分類、不用藥分類和冠狀動脈鈣化度分類,以及根據(jù)該方法的輸出來分類樣品。在一些實施方式中,利用這種預(yù)測模型通過獲得哺乳動物對象樣品相關(guān)數(shù)據(jù)集來分類該樣品,其中所述數(shù)據(jù)集包括至少3種、至少4種或至少5種選自以下的蛋白質(zhì)標記MCP1;MCP2;MCP3;MCP4;嗜酸細胞活化趨化因子;IP10;MCSF;IL3;TNFa;Ang2;IL5;IL7;IGF1;IL10;INFy;VEGF;MIPla;RANTES;IL6;IL8;ICAM;TIMP1;CCL19;TCA4/6kine/CCL21;CSF3;TRANCE;IL2;IL4;IL13;Illb;MCP5;CCL9;CXCL1/GR01;GROa;IL12;和痩蛋白(leptin)。數(shù)據(jù)任選包括臨床指征(clinicalindicia)的概況;其它蛋白質(zhì)表達情況;代謝指標;遺傳信息等。本發(fā)明的預(yù)測模型利用由本文所述一組或多組標記獲得的定量數(shù)據(jù)。在一些實施方式中,預(yù)測模型能提供一定水平的分類準確率;即該模型滿足了所需的質(zhì)量閾值(qualitythreshold)。有意義的質(zhì)量閾值可提供滿足給定閾值的AUC或準確率,這些術(shù)語(AUC;準確率)中的一種或兩種在本文中可稱為質(zhì)量指標(qualitymetric)。預(yù)測模型可提供一種質(zhì)量指標,例如分類的準確率或AUC為至少約0.7,至少約0.8、至少約0.9或更高。用這種模型可以正確選擇參數(shù),從而能在靈敏度和選擇性之間提供所需平衡。在其它實施方式中,循環(huán)蛋白分析被用于篩選生物學(xué)活性物質(zhì)的動脈粥樣硬化治療效力的方法。在這種方法中,將動脈粥樣硬化相關(guān)細胞,例如血管壁細胞等在培養(yǎng)物中或在體內(nèi)與候選物質(zhì)接觸,并測定這種接觸對一種或多種標記,例如一組標記表達的作用。在另一實施方式中,分析上述循環(huán)蛋白的差異表達被用于患者用在遵循一定治療方案的方法中。當(dāng)患者曾接受了某種治療,在單個時間點或一段時期內(nèi)測定一種或多種標記(例如一組標記)的表達,所述治療包括藥物、多種藥物、非藥理學(xué)干預(yù)以及它們的組合等。在另一方法中,采用3種或更多本文鑒定的動脈粥樣硬化相關(guān)蛋白的相對量來診斷或監(jiān)測個體的動脈粥樣硬化。本文鑒定的蛋白組還可包括其它臨床指征;其它蛋白質(zhì)表達情況;代謝指標;遺傳信息等。在另一實施方式中,本發(fā)明包括通過以下步驟分類哺乳動物對象樣品的方法獲得樣品相關(guān)數(shù)據(jù)集,其中所述數(shù)據(jù)集包括至少3種、或至少4種、或至少5種、或至少6種、或至少7種、或至少8種、或至少9種或9種以上選自以下的蛋白質(zhì)標記的定量數(shù)據(jù)MCP1、MCP2、MCP3、MCP4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1;將數(shù)據(jù)輸入利用數(shù)據(jù)分類樣品的分析方法,其中所述分類選自動脈粥樣硬化性疾病分類、健康分類、血管炎癥分類、藥物接觸分類、未接觸藥物分類和冠狀動脈鈣化度分類;和根據(jù)該方法的輸出來分類樣品。在另一實施方式中,本發(fā)明包括通過以下步驟分類哺乳動物對象樣品的方法:獲得樣品相關(guān)數(shù)據(jù)集,其中所述數(shù)據(jù)集包括至少3種、或至少4種、或至少5種、或至少6種蛋白質(zhì)標記的定量數(shù)據(jù),各標記顯示了循環(huán)蛋白質(zhì)濃度與動脈粥樣硬化血管組織RNA濃度之間的相互關(guān)系;將數(shù)據(jù)輸入利用數(shù)據(jù)分類樣品的分析方法,其中所述分類選自動脈粥樣硬化性疾病分類、健康分類、血管炎癥分類、藥物接觸分類、未接觸藥物分類和冠狀動脈鈣化度分類;和根據(jù)該方法的輸出來分類樣品。附圖簡述圖1.喂食高脂飲食的載脂蛋白(apo)E-缺陷型小鼠中隨動脈粥樣硬化進展的時間依賴性血清炎性蛋白表達。熱圖(heatmap)是血清濃度水平的圖形化顯示,其中,x-軸是各血清樣品,y-軸是蛋白質(zhì)標記。數(shù)值表示喂食高脂飲食的apoE-缺陷型小鼠在基線(TOO;"=5)和10(丁10;w=5)、16(T16;w=4)、24(T24;w=5)及40周(T40;"=5)時的血清蛋白表達水平。請注意,對于16周時間點,數(shù)值獲自另一獨立數(shù)據(jù)集。圖2.apoE-缺陷型小鼠和對照小鼠的循環(huán)炎性蛋白表達水平。熱圖是標準化表達數(shù)值表的圖形化顯示。數(shù)值表示喂食高脂飲食的apoE-小鼠平行組在基線(TOO)0=9)和40周(T40)時(n=9),以及喂食高脂飲食的C57B1/6(11=5)和C3H/HeJ(n二3)小鼠在基線和40周時(n值分別為5,5)的循環(huán)蛋白平均表達水平(log2)。喂食高脂飲食的apoE-缺陷型小鼠的炎性標記水平最高,而C3H/HeJ小鼠的水平最低,盡管它也喂食高脂飲食。采用N-向ANOVA鑒定各種情況下的統(tǒng)計學(xué)顯著差異。在最右邊一列中,報道的p-值未考慮飲食、品系和時間之間可能的相互作用。下文討論了這些因素的影響和它們彼此的相互作用。圖3.小鼠動脈粥樣硬化分類血清炎性標記的蛋白質(zhì)組學(xué)簽名(proteomicsignaturepattern)。A鑒定動脈粥樣硬化分類蛋白質(zhì)亞組。采用各種分類算法,包括微陣列預(yù)測分析(PAM)、遞歸特征排除(recursivefeatureelimination)(RFE)、支持向量機(supportvectormachine)(SVM)禾卩ANOVA,根據(jù)準確區(qū)分4種不同動脈粥樣硬化性疾病階段(基線時和10、24及40周時喂食高脂飲食的apoE-缺陷型小鼠)小鼠的能力對一亞組的標記進行排名。這些標記中的部分用所有分類算法進行了排名。&小鼠動脈粥樣硬化性疾病的分類準確率(混淆矩陣(confusionmatrix))。為測定小鼠分類蛋白質(zhì)預(yù)測疾病嚴重程度的準確率,我們使用以前鑒定的優(yōu)選蛋白質(zhì)標記(Cc121、Ccl9、Csf3、Tnfsfll、Vegfa、Cclll、Ccl2)。用SVM算法交叉驗證根據(jù)疾病階段分組的小鼠實驗。用1,000-步7V-倍交叉驗證方法測定分類準確率,25。/。的實驗用作測試組(testgroup),其余的用作訓(xùn)練組(traininggroup)。結(jié)果以表格形式表示,混淆矩陣如"方法"部分所述。標記"真"表示"的確患病",而"預(yù)測的"表示"預(yù)計患病"。C:一獨立數(shù)據(jù)集的分類。采用SVM算法,我們能將獨立數(shù)據(jù)集("測試")歸入最接近原實驗組("己知的")的時間點組別。已知實驗包括獲得蛋白分類符(classifier)組的原始分析中的4個時間點。獨立實驗組獲自未包括在原始組中的16-周時間點。熱圖中顯示了一對多比較(one-vs-allcomparison)所得各實驗的SVM評分(親和度)。16-周時的蛋白質(zhì)分布情況與原始數(shù)據(jù)集中10-周時是更相關(guān)。圖4.優(yōu)選分類符標記的血清水平和血管基因表達之間的相關(guān)性。A:為研究這些血清標記中一個亞組的疾病相關(guān)基因表達,我們研究了它們在血清來源小鼠主動脈中的基因時序表達(temporalexpression)。采用定量實時RT-PCR(qRT-PCR),我們能使這些標記的時間依賴性血清蛋白質(zhì)水平與它們的血管壁基因表達相關(guān)。測定了血清蛋白質(zhì)水平的loglO-標準化平均表達比與主動脈基因表達值的loglO-標準化平均表達比的皮爾遜相關(guān)性(Pearsoncorrelation)。將各時間點的蛋白質(zhì)微陣列除以apoE缺陷型小鼠的基線水平得到蛋白質(zhì)水平平均比(n:4-9)。將各時間點的重復(fù)qRT-PCR反應(yīng)結(jié)果除以apoE-缺陷型小鼠的基線值得到基因表達水平的平均比。請注意,對于16-周時間點,數(shù)值獲自另一獨立數(shù)據(jù)集。B:皮爾遜相關(guān)性數(shù)值的相關(guān)性矩陣總結(jié)表,比較了血清蛋白質(zhì)水平的標準化平均比值、血管基因表達的標準化平均比值和喂食高脂飲食時間(loglO-喂食周數(shù))。顯著性水平為0.05(雙側(cè)檢驗(2-tailed))。圖5.對象的臨床特征。名義變量(Nominalvariable)(*)以計數(shù)(%)表示,連續(xù)變量(continuousvariables)(卞)以中值(四分位數(shù)間距((interquartilesrange))表示。$通過皮爾遜卡方或曼-惠特尼U檢驗進行適當(dāng)比較。基于10000次抽樣比較,采用蒙特卡洛方法計算顯著性。BP(血壓);FH(家族史);ACEI(血管緊張素轉(zhuǎn)換酶抑制劑);BB((3阻斷劑);CCB(鈣通道阻斷劑);AB(ct阻斷劑);ASA(乙13酰水楊酸);BMI(體重指數(shù));DBP(舒張壓);SBP(收縮壓);HR(心率);CRP(C-反應(yīng)性蛋白)。圖6.就臨床特征進行調(diào)整前后,冠狀動脈疾病患者和健康對照的血清趨化因子分布。所示數(shù)據(jù)為幾何平均數(shù)(95。/。CI)。通過GLM多變量分析進行調(diào)節(jié),通過t-檢驗比較調(diào)整后平均數(shù)。*模型1,就年齡和腰圍進行調(diào)整;t模型2,如同模型l進行調(diào)整,并就治療(ACE抑制劑、他汀類藥物和阿司匹林)調(diào)整。圖7.臨床變量和病例比對照的兩維層次聚類法(hierarchicalclustering)。圖8.主成分分析證明趨化因子、胰島素耐受性情況和一個其它臨床變量(例如高血壓和高脂血癥)亞組可以解釋在對象中觀察到的差異中的60-70%,其中炎癥標記是主要因素。圖9.該表格顯示了用于測定排名變量的最佳數(shù)量從而能以最低誤差率將實驗分類成正確組的支持向量機(SVM)和遞歸特征排除(RFE)。通過1000次重復(fù)交叉驗證計算最佳誤差率或分類誤差,其中25%的實驗用作測試組,其余實驗用作訓(xùn)練組。圖10.ROC曲線。圖11.該表格顯示了預(yù)測冠狀動脈疾病的對數(shù)回歸模型(LogisticRegressionmodel)。模型l)逐步前向選擇(Stepwiseforwardselection),缺失數(shù)值不估算;2)逐步前向選擇,采用條件均值(conditionalmeans)進行缺失數(shù)據(jù)估算;3)臨床變量和趨化因子評分的逐步前向選擇。獨立變量年齡、性別、舒張壓(DBP)、收縮壓(SBP)、心率、血漿胰島素、C-反應(yīng)性蛋白和趨化因子(模型1和2:嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4和MIP-la;模型3:趨化因子評分)。圖12.—系列0)八模型的預(yù)期八1;(:數(shù)值和8.£.,標記數(shù)如圖所示依次增多。圖13.—系列對數(shù)回歸模型的預(yù)期AUC數(shù)值和S.E.,標記數(shù)如圖所示依次增多。圖14.LDA模型預(yù)測,MCP-1標記不在可用預(yù)測標記組之列。該新模型用Ang-2、IGF-1和M-CSF作為另一種標記組合來超越AUC>0.75的閾值。圖15a.采用赤池信息量基準(AkaikeInformationCriterion)(AIC)選擇對數(shù)回歸模型的標記。圖151^.—系列對數(shù)回歸模型的預(yù)期八1;(:數(shù)值和8衛(wèi).,標記數(shù)如圖所示依次增多(=在標記選擇過程中采用aic標準從完整模型中依次除去標記數(shù)的倒序)。圖16.包括臨床變量和生物學(xué)標記的對數(shù)回歸模型。圖17.包括臨床可變變量和生物學(xué)標記的對數(shù)回歸模型。包括"P阻斷劑"(DC512)和"他汀類藥物"(DC3005)及MCP-4的模型產(chǎn)生的AUC預(yù)計值超過0.85。圖18.以下三組的第一辨別變量(discriminantvariate)值分布的箱線圖(boxplot):"未治療的"、"ACE或他汀類藥物"和"ACE和他汀類藥物"。發(fā)明詳述定義除非另有表述,權(quán)利要求書和說明書中使用的術(shù)語如下所述。術(shù)語"改善"指疾病狀態(tài),例如動脈粥樣硬化性疾病狀態(tài)的治療中獲得的任何有益的治療結(jié)果,包括預(yù)防、嚴重程度或進展的減緩、緩解或治愈。本文所用的術(shù)語"哺乳動物"包括人和非人,包括但不限于人、非人靈長類、狗、貓、鼠、牛、馬和豬。述及兩條或多條核酸或多肽序列時的術(shù)語"相同性"百分比指當(dāng)比較和排列對比兩條或多條序列或子序列的最大一致性時,利用一種下述序列比較算法(例如,BLASTP和BLASTN或技術(shù)人員可用的其它算法)或通過目測檢測到有一定百分比的核苷酸或氨基酸殘基相同。取決于具體應(yīng)用,"相同性"百分比可以涉及進行比較的序列區(qū)域,例如功能性結(jié)構(gòu)域,或者涉及待比較的兩條序列的全長。為了進行序列比較,通常將一條序列用作供測試序列與之相比的參比序列。當(dāng)使用序列比較算法時,將測試序列和參比序列輸入計算機,根據(jù)需要設(shè)定子序列的坐標,并設(shè)定序列算法程序參數(shù)。序列比較算法于是根據(jù)所設(shè)定的程序參數(shù)計算一條或多條測試序列相對于參比序列的序列相同性百分比。可通過以下方法對要比較的序列進行最佳比對排列,例如Smith和Waterman的局部同源算法(Adv.Appl.Math.2:482(1981))、Needleman和Wunsch的同源比對算法(J.Mol.Biol.48:443(1970))、Pearson和Lipman的相似度檢索法(Proc.Nat'l.Acad.Sci.USA85:2444(1988))、計算機執(zhí)行這些算法(威斯康星遺傳學(xué)軟件包的GAP、BESTFIT、FASTA和TFASTA,遺傳學(xué)計算機組(GeneticsComputerGroup),575ScienceDr.,麥迪遜,威斯康星州)或目測(通常參見Ausubel,F(xiàn)M等,CurrentProtocolsinMolecularBiology(《最新分子生物學(xué)方法》),4,約翰威立父子公司(JohnWiley&Sons,Inc.),布魯克林,紐約,A.1E.1-A.1F.11,1996-2004)。適合于測定序列相同性百分比和序列相似性百分比的算法的一個實例是Altschul等(J.Mol.Biol.215:403-410(1990))所述的BLAST算法。執(zhí)行BLAST分析的軟件可從生物技術(shù)信息國家中心(NationalCenterforBiotechnologyInformation)公開獲f尋(www.ncbi.nlm.nih.gov/)。術(shù)語"足量"表示足以產(chǎn)生所需作用的用量,例如足以改變蛋白質(zhì)表達特征的用量。術(shù)語"治療有效量"是能有效緩解疾病癥狀的用量。治療有效量可以是"預(yù)防有效量",因為預(yù)防可視為治療。TP:真陽性TN:真陰性FP:假陽性FN:假陰性N:陰性樣品總數(shù)P:陽性樣品總數(shù)A:樣品總數(shù)_準確率=(TP+TN)/A平均CV誤差=平均分類誤差誤差=1-平均準確率靈敏度=TP/P=TP/(TP+FN)特異性=TN/N=TN/(TN+FP)本申請所用的縮寫包括以下CAD=冠狀動脈疾??;MIPla=MIPla;LDA=線性辨別分析;MI=心肌梗塞;ASCVD=動脈粥樣硬化性心血管疾病。必須注意,除非文中另有明確表述,說明書和隨附的權(quán)利要求書中所用的單數(shù)形式"一"、"一個"和"該"包括復(fù)數(shù)含意。在本文中,動脈粥樣硬化(也稱為動脈硬化、動脈粥樣化血管疾病、動脈阻塞性疾病)指特征在于血管壁上有斑塊累積及血管炎癥的心血管疾病。所述斑塊由胞內(nèi)和胞外脂質(zhì)、平滑肌細胞、結(jié)締組織、炎性細胞和葡萄糖胺聚糖累計而成。炎癥與脂質(zhì)累積常在血管壁中聯(lián)合發(fā)生,血管炎癥是動脈粥樣硬化性疾病過程的標志。心肌梗塞是通常由流向心肌部分的冠狀動脈血液突然減少導(dǎo)致的缺血性心肌壞死。在絕大多數(shù)急性MI患者中,急性血栓(常與斑塊破裂有關(guān))阻塞了向受損區(qū)域供血的動脈。斑塊破裂通常發(fā)生在以前被富集于炎性細胞中的動脈粥樣硬化斑塊所部分阻塞之處。據(jù)估計,動脈粥樣硬化斑塊中內(nèi)皮機能障礙和血管炎癥所誘導(dǎo)的血小板功能改變導(dǎo)致血栓形成。心肌梗塞可分類成ST升高和非ST升高型MI(也稱為不穩(wěn)定心絞痛)。兩種心肌梗塞形式中均有心肌壞死。ST升高型心肌梗塞中有透壁心肌損傷,從而導(dǎo)致心電圖上ST升高。在非ST升高型心肌梗塞中,損傷在心內(nèi)膜下,不引起心電圖上ST段升高。心肌梗塞(ST升高型和非ST升高型)代表了一種不穩(wěn)定的動脈粥樣硬化性心血管疾病。急性冠狀動脈綜合征包括各種形式的不穩(wěn)定冠狀動脈疾病。心絞痛指向心血流不足導(dǎo)致的胸部疼痛或不適。心絞痛可視為動脈粥樣硬化性心血管疾病的癥狀之一。心絞痛可分類為穩(wěn)定型,其遵循一種規(guī)律的慢性癥狀模式,與不穩(wěn)定動脈粥樣硬化性心血管疾病不同。穩(wěn)定型動脈粥樣硬化性心血管疾病的病理生理學(xué)基礎(chǔ)也是復(fù)雜的,但在生物學(xué)上區(qū)別于不穩(wěn)定型。穩(wěn)定心絞痛一般不是心肌壞死。心力衰竭可能是心肌梗塞導(dǎo)致的心肌機能障礙所致。目前方法的幾個特征值得注意。動脈粥樣硬化和相關(guān)的病癥是通過評估是否存在一種或一組蛋白質(zhì)標記的血檢來診斷的。所述標記包括MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL國3、TNFa、Ang-2、IL-5、IL-7和IGF-1。已知,這些標記在動脈粥樣硬化過程中在血管壁中特異性產(chǎn)生。在一些實施方式中,這種預(yù)測模型利用從循環(huán)標記獲得的定量數(shù)據(jù),所述標記包括MCP1;MCP2;MCP3;MCP4;嗜酸細胞活化趨化因子;IP10;MCSF;IL3;TNFa;Ang2;IL5;IL7;IGF1;IL10;INFy;VEGF;MIPla;RANTES;IL6;IL8;ICAM;TIMP1;CCL19;TCA4/6kine/CCL21;CSF3;TRANCE;IL2;IL4;IL13;Illb;MCP5;CCL9;CXCL1/GR01;GROa;IL12;和痩蛋白。有用的其它循環(huán)標記包括sVCAM;sICAM-l;E-選擇蛋白;P-選擇蛋白;白介素-6,白介素-18;肌酸激酶;LDL,oxLDL,LDL粒度,脂蛋白(a);肌鈣蛋白I,肌鈣蛋白T;LPLA2;CRP;HDL,甘油三酯,胰島素,BNP(腦鈉尿肽),神經(jīng)趨化蛋白(fractalkine),骨橋蛋白,骨保護素,制瘤素-M,髓過氧化物酶,ADMA,PAI-1(纖溶酶原激活物抑制劑),SAA(循環(huán)淀粉樣蛋白A),t-PA(組織型纖維蛋白溶酶原激活劑),sCD40配體,血纖蛋白原,高半胱氨酸,D-二聚體,白細胞計數(shù);還可包括本文所述的各種其它標記,包括指征,代謝指標,遺傳信息和其它循環(huán)標記。在本發(fā)明的某些實施方式中,由患者樣品獲取分類數(shù)據(jù)集,其中該數(shù)據(jù)集包括選自以下的至少三種蛋白質(zhì)標記的定量數(shù)據(jù)MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-l。所述至少三種蛋白質(zhì)標記可包括選自以下的標記組(markerset):MCP-l、IGF國1、TNFa;MCP-1、IGF墨1、M-CSF;ANG-2、IGF-1、M-CSF;和MCP-4,IGF-1,M-CSF。當(dāng)數(shù)據(jù)集包括至少四種蛋白質(zhì)標記的定量數(shù)據(jù)時,所述至少四種蛋白質(zhì)標記可選自下組MCP-1,MCP-2,MCP-3,MCP-4,嗜酸細胞活化趨化因子,IP-IO,M-CSF,IL-3,TNFa,Ang-2,IL-5,IL-7和IGF-1;MCP-1,IGF-1,TNFa,IL-5;MCP陽1,IGF-1,M-CSF,MCP匿2;ANG隱2,IGF-1,M-CSF,IL-5;MCP-1,IGF-1,TNFa,MCP-2;和MCP-4,IGF-1,M墨CSF,IL-5。當(dāng)數(shù)據(jù)集包括至少五種標記的定量數(shù)據(jù)時,所述至少五種標記可包括選自以下的標記組MCP-1,MCP-2,MCP-3,MCP-4,嗜酸細胞活化趨化因子,IP-IO,M-CSF,IL-3,TNFa,Ang-2,IL-5,IL誦7和IGF-1;MCP-1,IGF-1,TNFa,IL-5,M陽CSF;MCP陽1,IGF隱l,M-CSF,MCP隱2,IP-10;ANG隱2,IGF匿1,M-CSF,IL-5,TNFa;MCP-1,IGF扁1,TNFa,MCP-2,IP-10;MCP-4,IGF-1,M-CSF,IL隱5,TNFa;和MCP-4,IGF-1,M-CSF,IL-5,MCP-2。在本發(fā)明的另一實施方式中,至少兩種、至少三種、至少四種、至少五種或更多種標記選自M-CSF、嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4、IL-3、IL-5、IL-7、IL-8、MIPla、TNFa和RANTES。鑒定動脈粥樣硬化相關(guān)循環(huán)蛋白能提供診斷和預(yù)后方法,所述方法能通過檢測所鑒定循環(huán)蛋白的水平變化來檢測病癥(例如冠狀動脈疾病、動脈粥樣硬化等)的發(fā)生,特別是這種病癥表明有心肌梗塞、心力衰竭等傾向時;或評估個體這種疾病18的易發(fā)性。這些方法還包括篩選治療劑和方法的效力;給疾病分階段和分類;等等??刹捎迷缙跈z測來測定進程性疾病的發(fā)生,從而能用合適的預(yù)防性或保護性手段加以干預(yù)。感興趣的循環(huán)蛋白包括表1所列的那些<table>tableseeoriginaldocumentpage20</column></row><table><image>imageseeoriginaldocumentpage21</image><formula>formulaseeoriginaldocumentpage22</formula><table>tableseeoriginaldocumentpage23</column></row><table><table>tableseeoriginaldocumentpage24</column></row><table><formula>formulaseeoriginaldocumentpage25</formula>CCL3||SCYA3||CCL3||MIP1A||LD78-all巨噬細胞炎性蛋白l-all小的可誘導(dǎo)細胞因子A3H趨化因子(C-C基序)配體3II趨化因子,CC基序,配體3||趨化因子(C-C基序)配體36348畫_002983(SE^IDNO:182)CX756573,M27281,M32977,S85192,X62568AC069363,D90144,M23178,X04018,AF043339,BC071834,D00044,D63785,M23452,M25315,X03754,CR591007畫—011337(SEQIDNO:183)AL596122,M73061,X53372,AF065939,AF065940,AF065941,AF065942,AF065943,AK150590,AK150634,AK150698,AK151581,AK152648,AK153155,AK155058,J04491,M23447,X12531,AA895994NP一002974,Pl6"l47,Q14745(SEQIDNOS184-186)NP_035467,P10855'Q5Q麗0(SEQ1DNOS187-189)CCL5||TCP228||SCYA5||CCL5||T細胞特異性RANTESIIT細胞特異性蛋白p228H小的可誘導(dǎo)細胞因子A5卩趨化因子(C-C基序)配體5||趨化因子,CC基序,配體5||活化后調(diào)節(jié)的,通常是T細胞表達的,估計是分泌的II趨化因子(C-C基序)配體56352麗—002985(SEQIDNO:190)AB023652,AB023653,AB023654,AC015849,AF088219,DQO17060,AF043341,AF266753,BC008600,BG272739'M21121,BM917378雨—013653(SEQIDNO:191)AB051897,AL596122,,298,X70675,AF065944,AF065945,AF065946,AF065947,AF128187,AK003101,AK158074,AY722103,BC033508,CT0腿5,M77747,S37648,AI020884NP一002976,P13501,Q9UBL2(SEQIDNOS192-194)NP_038681,P30882,Q5XZF2(SEQIDNOS195-197)IL6HIL6IIIFNB2IIHSFIIBSF2II干擾素,P-2H雜交瘤生長因子卄B-細胞分化因子IIB-細胞剌激因子2H白介素6(干擾素,P2川BMI增加中的HGF血清IL6水平,修飾物||白介素6(干擾素,P2)3569雨—000600(SEQIDNO:198)AC073072,AF372214,CH236948,X04402,Y00081,BC015511,BTO19748,BTO19749,NM一031168(SE^IDNO:199)AC112933,M20572,M24221,M36996,X51457,AK089780,AK150440,NP—000591,P0f231,Q75MH2,Q8N6X1(SEQIDNOS200-203)NP—112445,f08505(SEQIDNOS204-205)<table>tableseeoriginaldocumentpage27</column></row><table>TIMP1HTIMP1IIHCIIIEPAII膠原酵抑制劑,人IITIMP金屬肽酶抑制劑lll金屬肽酶1的組織抑制劑(紅系增能活性,膠原酶抑制劑川CCL19||CCL19||ELC||MIP3B||SCYA19IIEBIl-配體趨化因子IIEXODUS3||巨噬細胞炎性蛋白3-則趨化因子,CC基序,配體19||趨化因子(C-C基序)配體19||小的可誘導(dǎo)細胞因子亞族A,成員19||CCL21||SCYA21||CCL21||SLC||EXODUS2||二級淋巴組織趨化因子ll趨化因子,CC基TIMP金屬肽酶抑制劑17076畫一003254(SE^IDNO:222)趨化因子(C-C基序)配體196363謹—006274(SEQIDNO:235)趨化因子(C-C基序)配6366函002989(SEQIDNO:AK152527,AK152530'AK152556,AK156417,AK168275,AK171502,AK171520,AK172321,BC008626,CTO10246,CT010302,X16624,X52264,X54331AY932824,畫011593AL671885,NP003245;NP03572D11139,L47361,(SE^IDNO:M21162,Q5§JP21,3,&2032,Z84466,223)M28308,Q5H9A7,Q60734AK074854,M28309,Q6FGX5,(SEQIDBC000866,M28310,2,NOSBC007097,M28311,P01033;232-234)BQ181804,M28312,X69413Q14252;BU857950,AY622853,(J9UCU1CR407638,BC008I07,(SEQIDNOSCR541982,BC034260,224-231)CR590572,BC051260,CR593351,M17243,CR602090,V00755,X04684M12670,M59906,S68252,X02598,X03124,A10416AJ223410,觀一0U888AF307988,NP006265,NP036018AL162231,AF308159,Q6rBD6,,071)460,AB000887,(SE(JIDNO:AL772334,Q99731Q548P0BC027968,236)AF059208,CR456868,AK144337,(SEQIDNOS(SEQIDCR623730,U77180,AK156269,237-239)NOSU88321,BM720436BC025130,240-242)BC051472,BE864988AF030572,NM—023052NP002980,NP—075539AJ005654,00^585,AL162231,(SEQIDNO:Q5VZ73,(SEQID<formula>formulaseeoriginaldocumentpage29</formula>胞刺激因子1||白介素43565應(yīng)一000589'薩—172348(SE^IDNOS288-289)IL13HIL13II白介素13||白介素133596蘭—002188(SE^IDNO:300)BC066254,X01663,X01664,,Q9C001BC066255,X01665,X52618,(SEQIDNOSBC066256,AF065914,275-285)BC066257,AF065915,BC070338,AF065916,DQ231169,AF352786,S77834,S77835,AF538059,S82692,U25676,AF542383,V00564,X01586,AF542384,A14844AF542385,AY147902,K02292,U41494,U41504,U41505,U41506,X01772,X66058,X73040AC004039,麗021283AC005742,NP758858,NP06725AF395008,(SE^IDNO:AL596095,P05112,8,f07750,AF465829,290)AL645741,Q5FC01,Q5SV00M23442,X06750,U07869,X05064,Q6麗P0,(SEQIDAB102862,X05252,X05253,Q6NZ77,NOSAF043336,AB174765,Q9UPB9297-299)BC066277,AF352783,(SEQIDNOSBC066278,BC027514,29卜296)BC067514,M13238,BC067515,M25892,X03532BC070123,M13982,X81851AC004039,畫008355AC005742,NP002179,NP03238AF172149,(SE^IDNO:AL645741,P352251,#"20109,AF172150,301)L13028,M23504,Q4VB50Q5SUZ9AF193838,,Q4VB51(SEQIDAF193839,,Q4VB52NOSAF193840,,Q4VB53308-310)AF377331,(SEQDNOSAF416600,302-307)AY008331,AY008332,L13029,L42079,L42080,U10307,U31120,AF043334,BC096138,gob80030864.1敦滔*被25/74m<table>tableseeoriginaldocumentpage31</column></row><table><table>tableseeoriginaldocumentpage32</column></row><table><formula>formulaseeoriginaldocumentpage33</formula>除了本申請中以名稱、登錄號或序列指定的具體生物標記外,本發(fā)明還考慮采用與所例舉序列有至少卯%或至少95%或至少97%相同且目前知導(dǎo)的或?qū)⒈话l(fā)現(xiàn)可用于本發(fā)明方法的生物標記變體。這些變體可代表多態(tài)性、間接變體、突變等。本發(fā)明的診斷方法可用各種技術(shù)和試劑。在本發(fā)明的一個實施方式中,可檢驗血液樣品或衍生自血液的樣品,例如血檢、循環(huán)(蛋白)等中是否存在多肽。通常抽取血液樣品,然后檢驗衍生產(chǎn)物,例如血檢或血清??衫锰禺愋越Y(jié)合成分檢測這些多肽。將抗體用于這一目的尤其值得關(guān)注。這種試驗可采用多種形式,包括抗體陣列;ELISA和RIA;在懸液和/或溶液中進行標記抗體的結(jié)合然后通過流式細胞術(shù)、質(zhì)譜法等進行檢測等等。檢測可利用一種或一組抗體,優(yōu)選陣列形式的一組抗體。表達簽名(expressionsignature)通常聯(lián)用檢測方法與結(jié)果分析來測定是否存在與疾病簽名統(tǒng)計學(xué)意義上顯著的匹配。在另一實施方式中,采用體內(nèi)成像來檢測心臟組織中是否存在動脈粥樣硬化相關(guān)蛋白。這些方法可采用,例如這些蛋白質(zhì)的經(jīng)標記的特異性抗體或配體。在這些實施方式中,將多肽特異性的以可測方式標記的抗體、配體等物質(zhì)給予個體(例如,通過注射),采用標準成像技術(shù)(包括但不限于磁共振成象、計算機化斷層顯像掃描等)來定位被標記的細胞。檢測可采用一種成像試劑或多種成像試劑的混合物。在另一實施方式中,分析血管(優(yōu)選受動脈粥樣硬化影響的一條或多條血管)組織的mRNA樣品中的動脈粥樣硬化指示性遺傳學(xué)簽名(geneticsignature)。所提供的循環(huán)蛋白表達模式表現(xiàn)了動脈粥樣硬化中的炎性簽名的特征,并進一步將特定的免疫相關(guān)路徑與糖尿病和藥物療法關(guān)聯(lián)起來。雖然目前的數(shù)據(jù)顯示它們在動脈粥樣硬化的炎癥反應(yīng)中具有顯著的作用,但將血管壁中的免疫路徑與疾病的一些關(guān)鍵方面關(guān)聯(lián)起來的直接數(shù)據(jù)依然很少,所述關(guān)鍵方面包括風(fēng)險因素影響初級炎性反應(yīng)(primaryinflammatoryprocess)的機制和調(diào)節(jié)例如高血壓和高脂血癥等風(fēng)險因素的藥物如何特異性地影響了炎癥的機制。本發(fā)明鑒定了可用于診斷和分類動脈粥樣硬化性心血管疾病的炎癥生物標記的表達分布情況。在診斷患者動脈粥樣硬化和相關(guān)病癥的方法中,獲取本文提供的生物標記在血液、血清等中的表達模式,將其與對照值比較來確診。本發(fā)明分析還可包括源于臨床變量的輸入值。例如,可將患者的血源樣品例如血液、血漿、血清等加給一種或一組特異性結(jié)合試劑來確定是否存在要找的標記。該項分析一般包括至少一種本文所述的標記,例如M-CSF、嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4、IL-3、IL-5、IL陽7、IL-8、MIPla、TNFa、Ang國2、IGF陽1和RANTES,通常是至少兩種標記,更常見是至少三種標記,還可包括4、5、6、7種或最多所有的標記。優(yōu)選的標記組包括以下標記中的至少3種MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1,可以包括4、5、6、7、8、9、10、11、12種或所有標記o該項分析還可包括可能存在于血清或組織樣品中的其它蛋白質(zhì)的表達信息。采用適用于具體標記的方法來獲得定量信息。標記包括但不限于SVCAM;SICAM-1;E-選擇蛋白;P-選擇蛋白;白介素-6,白介素-18;肌酸激酶;LDL,oxLDL,LDL粒度,月旨蛋白(a);肌,丐蛋白I,肌銬蛋白T;LPLA2;CRP;Ccl9;Ccl2;Ccl21;Ccll9;IL-5;Tnfsf11;Vegfa;Cxcll;瘦蛋白,HDL,甘油三酯,胰島素,BNP(腦鈉尿肽(brainnatureticpeptide)),神經(jīng)趨化蛋白,骨橋蛋白,骨保護素,制瘤素-M,髓過氧化物酶,ADMA,PAI-1(纖溶酶原激活物抑制劑),SAA(血清淀粉樣蛋白A),t-PA(組織型纖維蛋白溶酶原激活劑),sCD40配體,血纖蛋白原,高半胱氨酸,D-二聚體,白細胞計數(shù)等。其它變量包括臨床指征,通常是對這些臨床指征進行評估后將所得數(shù)據(jù)與循環(huán)標記分析組合用于某算法。這些臨床標記包括但不限于性別;年齡;葡萄糖;胰島素;體重指數(shù)(BMI);心率;腰圍;舒張壓;收縮壓;血脂障礙;吸煙否;等等。其它變量包括用外周血測定的基因表達指標、代謝指標和遺傳學(xué)信息本發(fā)明方法可用于取定動脈粥樣硬化的階段、動脈粥樣硬化預(yù)后、評估動脈粥樣硬化的進展程度、監(jiān)測治療反應(yīng)等。鑒于本文所述,本領(lǐng)域普通技術(shù)人員不難理解如何用本發(fā)明實現(xiàn)這些應(yīng)用。例如,可如下確定動脈粥樣硬化階段一組數(shù)據(jù)集與從階段已知的疾病樣品所獲得的一份或多份數(shù)據(jù)集作比較;或者,構(gòu)建能預(yù)測階段的模型,然后將某數(shù)據(jù)集輸入該模型以獲得預(yù)測的階段??刹捎妙愃品椒▉硖峁﹦用}粥樣硬化的預(yù)后。可通過觀察預(yù)測模型例如上述模型所得的一種或多種預(yù)測值的隨時間變化來監(jiān)測進展。可采用本發(fā)明方法并確定已知疾病患者的一種或多種分類結(jié)果是否接近或落入常規(guī)分類來測定治療反應(yīng)。采用上述方法,如本領(lǐng)域所知,定量測定某測試樣品中的標記。然后將如此35獲得的定量數(shù)據(jù)應(yīng)用于分析性分類方法。在這種方法中,根據(jù)某算法處理原始數(shù)據(jù),其中該算法已用訓(xùn)練組的數(shù)據(jù)預(yù)先確定,參照本文實施例所述。一種算法可用本文提供的訓(xùn)練組的數(shù)據(jù),或用本文提供的指導(dǎo)來產(chǎn)生處理另一不同數(shù)據(jù)組的算法。分析性分類方法可采用各種統(tǒng)計學(xué)分析方法來處理定量數(shù)據(jù)并提供樣品的分類信息。有用方法的實例包括線性辨別分析、遞歸特征排除、微陣列預(yù)測分析、對數(shù)回歸、CART算法、FlexTree算法、LART算法、隨機森林算法(randomforestalgorithm)、MART算法、機械學(xué)習(xí)算法(machinelearningalgorithm);等等。采用這些方法中的任一種,用動脈粥樣硬化數(shù)據(jù)集建立預(yù)測模型。在建立這種模型的過程中,將包含對照和患病樣品的數(shù)據(jù)集用作訓(xùn)練組。訓(xùn)練組包所有感興趣標記的數(shù)據(jù)。本文提供了感興趣標記的預(yù)測模型的實例,例如參見實施例6-10。本文所示的預(yù)測模型利用了多項蛋白質(zhì)水平測定的結(jié)果,提供能以所需準確率將個體分類為屬于特定狀態(tài)的算法,其中狀態(tài)可以是動脈粥樣硬化或非動脈粥樣硬化。感興趣的分類包括但不限于將樣品指定為一種或多種動脈粥樣硬化性疾病狀態(tài)i)動脈粥樣硬化狀態(tài)與非動脈粥樣硬化狀態(tài),ii)MI狀態(tài)與心絞痛狀態(tài),iii)低鈣狀態(tài)與高鈣狀態(tài)??筛鶕?jù)預(yù)測模型法作出分類,所述方法設(shè)定一閾值,據(jù)此閾值確定某樣品屬于某給定類別的概率。該概率優(yōu)選至少50%、或至少60%或至少70%或至少80%或更高。還可通過確定獲得的數(shù)據(jù)集與參比數(shù)據(jù)集相比是否有統(tǒng)計學(xué)顯著的差異來作出分類。如果存在所述差異,則認定獲得數(shù)據(jù)集的來源樣品不屬于參比數(shù)據(jù)集代表的類別。相反,如果在統(tǒng)計學(xué)上這樣的比較與參比數(shù)據(jù)集的差異不明顯,則將獲得數(shù)據(jù)集的來源樣品歸入?yún)⒈葦?shù)據(jù)集代表的類別??筛鶕?jù)某模型提供某具體數(shù)值或數(shù)值范圍的AUC或準確率等質(zhì)量指標準確率的能力來評估其預(yù)測能力。在一些實施方式中,所需的質(zhì)量閾值是分類某樣品的準確率如下所示的預(yù)測模型至少約0.7、至少約0.75、至少約0.8、至少約0.85、至少約0.9、至少約0.95或更高。作為另一指標,所需的質(zhì)量閾值可以指分類某樣品的AUC(曲線下面積)如下所示的預(yù)測模型至少約0.7、至少約0.75、至少約0.8、至少約0.85、至少約0.9、至少約0.95或更高。本領(lǐng)域已知可以"調(diào)諧"預(yù)測模型的相對靈敏度和特異性以提高選擇性指標或靈敏度指標,這項指標具有反比關(guān)系。可根據(jù)所進行的測試的具體要求調(diào)節(jié)上述模型的限度來提供選定的靈敏度或特異性水平。靈敏度或/和特異性可以至少約0.7、至少約0.75、至少約0.8、至少約0.85、至少約0.9或更高??赏ㄟ^檢測各標記的數(shù)值來初步分析原始數(shù)據(jù),通常按一式三份或多次一式三份進行??梢蕴幚頂?shù)據(jù),例如可利用標準曲線轉(zhuǎn)換原始數(shù)據(jù),一式三份檢測值的平均值可用于計算各患者的平均值和標準偏差??上绒D(zhuǎn)換這些數(shù)值,再用于模型中,例如log-轉(zhuǎn)換,Box-Cox轉(zhuǎn)換(參見Box和Cox,(1964)J.RoyalStat.Soc.,B系列,26:211-246)等。然后將數(shù)據(jù)輸入按照狀態(tài)分類樣品的預(yù)測模型。可將得到的信息傳遞給患者或?qū)I(yè)醫(yī)護人員。為建立動脈粥樣硬化狀態(tài)的預(yù)測模型,在訓(xùn)練組中使用包括已知對照樣品和對應(yīng)于感興趣的動脈粥樣硬化分類的樣品的強大數(shù)據(jù)集。采用普遍認可的標準選擇取樣規(guī)模。如上所述,可采用不同的統(tǒng)計學(xué)方法獲得高度準確的預(yù)測模型。實施例5、ll和12給出了這種分析的實例。在一個實施方式中,基于預(yù)測模型進行層次聚類法,其中,將皮爾遜相關(guān)性用作聚類指標。一種方法是將患者動脈粥樣硬化數(shù)據(jù)集視作"有監(jiān)督的學(xué)習(xí)(supervisedlearning)"中的"學(xué)習(xí)樣品"。CART是一項醫(yī)藥學(xué)應(yīng)用標準(Singer(1999)RecursivePartitioningintheHealthSciences,其if普林格公司(Springer)),該方法可通過以下步驟改進將任一項定性特征轉(zhuǎn)換成定量特征;根據(jù)所得顯著性水平對這些特征進行分選,通過樣品再用法(samplereusemethod)來評估霍特林T2統(tǒng)計量(Hotelling'sT2statistic);并適當(dāng)?shù)貞?yīng)用拉索法(lassomethod)。預(yù)測問題轉(zhuǎn)換成了仍與預(yù)測相關(guān)聯(lián)的回歸問題,實際上通過在對回歸質(zhì)量的評估中適當(dāng)運用Gini分類標準。該方法產(chǎn)生了稱為FlexTree的方法(Huang(2004)PNAS101:10529-10534)。用于模擬和用于SNP和其它形式的數(shù)據(jù)時,F(xiàn)lexTree效果良好。已開發(fā)了自動執(zhí)行FlexTree的軟件?;蛘呖捎肔ARTree或LART。幸運的是,近年來已開發(fā)出了稱為LARTree(或簡單LART)的方法(Turnbull(2005)ClassificationTreeswithSubsetAnalysisSelectionbytheLasso,斯坦福大學(xué))。拉索該名稱反映其為二叉樹(binarytree),如CART和FlexTree中那樣;拉索法(Lasso),如前所述;通過Efron等所謂的的LARS((2004)AnnalsofStatistics32:407-451)執(zhí)行拉索法。也可參見Huang等,(2004)Tree-structuredsupervisedlearningandthegeneticsofhypertension.ProcNatlAcadSciUSA.101(29):10529陽34??捎玫钠渌治龇椒òㄟ壿嫽貧w(logicregression)。一種邏輯回歸方法見Ruczinski(2003)JournalofComputationalandGraphicalStatistics12:475-512。邏輯回歸與CART的相似之處在于其分類符(classifier)可以展示為二叉樹。其不同之處在于各節(jié)點(node)具有關(guān)于特征的布爾語句(Booleanstatement),該語句比CART產(chǎn)生的簡單"和"語句更全面。另一種方法是最近收縮形心(nearestshrunkencentroid)的方法(Tibshirani(2002)PNAS99:6567-72)。該技術(shù)是k-均值樣(k-means-like)的,但優(yōu)點在于通過收縮聚類中心,可以自動選擇特征(如拉索方法一樣)從而能將注意力集中于能提供信息的少量特征。該方法可作為PAM軟件購得,使用廣泛。其它兩組算法是隨機森林算法(Breiman(2001)MachineLearning45:5-32)和MART算法(Hastie(2001)TheElementsofStatisticalLearning,斯普林格公司)。這兩種方法早己是"委員會方法(committeemethod)"。因此,它們包括對結(jié)果進行"表決"的預(yù)測符。為提供顯著性定級,可以測定錯誤發(fā)現(xiàn)率(falsediscoveryrate)(FDR)。首先,產(chǎn)生不相似度數(shù)值的一組零分布(nulldistribution)。在一個實施方式中,對觀察到的分布的數(shù)值進行排序,獲得了幾乎零概率(outofchance)的相關(guān)系數(shù)分布序列,從而能產(chǎn)生相應(yīng)的相關(guān)系數(shù)的零分布(參見,納入本文作為參考的Tusher等,(2001)PNAS98,5116-21)。通過以下步驟獲得零分布組對每一種測得分布的數(shù)值進行排序;計算所有分布的成對相關(guān)系數(shù)(pair-wisecorrelationcoefficients);計算該排序的相關(guān)系數(shù)的概率密度函數(shù);重復(fù)該過程N次,其中N是較大的數(shù)值,通常是300。利用該N種分布可以計算出相關(guān)系數(shù)值相關(guān)值(平均值、中值等),這些相關(guān)系數(shù)的數(shù)值大于由給定顯著性水平實測相似度數(shù)值分布所得的(相似度)數(shù)值。FDR是預(yù)計假顯著相關(guān)的數(shù)量(根據(jù)隨機數(shù)據(jù)集中大于該選定皮爾遜相關(guān)系數(shù)的相關(guān)數(shù)來估算)與經(jīng)驗數(shù)據(jù)(顯著相關(guān))中大于該選定皮爾遜相關(guān)系數(shù)的相關(guān)的數(shù)之比。該限界相關(guān)值可應(yīng)用于不同實驗分布數(shù)據(jù)之間的相關(guān)性。利用上述分布,可選擇顯著性的置信水平??捎迷撝眯潘酱_定高于隨機結(jié)果的相關(guān)系數(shù)最低值。采用該方法可獲得正相關(guān)、負相關(guān)或這二者的閾值。利用所得閾值,用戶可過濾成對的相關(guān)系數(shù)的觀測值,排除未超過閾值的那些。此外,還可估算某給定閾值的假陽性率。對于各種"隨機相關(guān)"分布,可以確定有多少觀測值落在閾值范圍外。該方法提供了一個數(shù)值序列。該序列的平均值和標準偏差顯示潛在假陽性的平均數(shù)及其標準偏差。在另一分析方法中,分別將橫斷分析(cross-sectionalanalysis)中選擇的變量用作預(yù)測符。鑒于具體的ASCVD結(jié)果,患者觀察期的隨機長度,蛋白質(zhì)組學(xué)特征和其它特征的選擇,分析存活率的參數(shù)方法可能優(yōu)于廣泛應(yīng)用的半-參數(shù)Cox模型。存活率的威布爾參數(shù)擬合可以使風(fēng)險率(hazardrate)單調(diào)升高、降低或維持恒定,還具有發(fā)現(xiàn)比風(fēng)險比表示(hazardsrepresentation)(與Cox模型一樣)和加速失效時間表示(failure-timerepresentation)。采用該模型可實現(xiàn)在建立回歸系數(shù)的近最大似然度估算函數(shù)(estimator)時用到的所有統(tǒng)計學(xué)標準工具的功能。此外,還可利用Cox模型,主要是由于拉索方法將共變量(covariate)數(shù)量降低至了可操控的規(guī)模,這將顯著簡化分析,使得對存活率的完全非參數(shù)評估方法成為可能。這些統(tǒng)計學(xué)工具適用于所有格式的蛋白質(zhì)組學(xué)數(shù)據(jù)。本發(fā)明提供了一組易于測定并具有高信息含量的生物標記、臨床和遺傳學(xué)數(shù)據(jù),所述信息是檢測臨床上顯著的動脈粥樣硬化性冠狀動脈血管疾病個體。而且,本發(fā)明的算法還提供了關(guān)于未來心血管疾病風(fēng)險的信息。在預(yù)測模型的建立中,可能需要選擇一標記亞組,即至少3種、至少4種、至少5種、至少6種直至整組標記。通常,根據(jù)定量樣品分析所需來選擇標記亞組,例如考慮試劑的可得性,定量測定的方便性等,但同時仍應(yīng)確保不失為高度準確的預(yù)測模型。選擇大量高信息含量標記來構(gòu)建分類模型需要確定性能指標(performancemetdc)和用戶-定義閾值,用這些指標和閾值來建立能根據(jù)該指標提供有用預(yù)測信息的模型。例如,性能指標可以是預(yù)測的靈敏度和/或特異性、AUC以及預(yù)測模型的總準確率。如實施例5、11和12所述,訓(xùn)練模型中可采用多種方法。選擇標記亞組可以是為了進行標記亞組的前向選擇或反向選擇??刹皇褂萌繕擞浂x擇標記的數(shù)量來優(yōu)化模型性。確定最佳標記數(shù)的一種方法是選擇能產(chǎn)生具有所需預(yù)測能力(例如,AUC>0.75,或相當(dāng)?shù)撵`敏度/特異性指標)的模型的標記數(shù),所需預(yù)測能力與各種39組合和各種數(shù)量經(jīng)給定算法所得該指標的最髙值相差小于一個標準偏差。試劑和試劑盒本發(fā)明還提供了用于實施一種或多種上述方法的試劑及包含所述實際的試劑盒。所述試劑及其試劑盒可以多種多樣。有用的試劑包括專門為用于產(chǎn)生動脈粥樣硬化病癥相關(guān)循環(huán)蛋白標記的上述表達分布所用的試劑。這種試劑的一種類型是能結(jié)合感興趣標記組的抗體陣列或試劑盒。本領(lǐng)域已知多種不同的陣列形式,這些陣列具有多種不同的探針結(jié)構(gòu)、基板組成和連接技術(shù)。代表性陣列或試劑盒包含用于定量測定選自以下的至少2種、至少3種、至少4種、至少5種或更多種標記的試劑或由這些試劑構(gòu)成M-CSF、嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4、IL-3、IL-5、IL-7、IL-8、MIPla、TNFa禾卩RANTES。在其它實施方式中,代表性陣列或試劑盒包含用于定量測定選自以下的至少3種蛋白質(zhì)標記的試劑或由這些試劑構(gòu)成MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1。所述至少3種蛋白質(zhì)標記可包含選自以下的標記組或由其構(gòu)成MCP-1、IGF-1、TNFa;MCP-1、IGF-1、M-CSF;ANG-2、IGF隱1、M-CSF;和MCP-4、IGF-1、M-CSF。在其它實施方式中,代表性陣列或試劑盒包含用于定量測定選自以下的至少4種蛋白質(zhì)標記的試劑或由這些試劑構(gòu)成MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL國7和IGF-1。所述至少4種蛋白質(zhì)標記可包含以下標記(組)或由其構(gòu)成MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL誦5、IL-7和IGF-1;MCP-1、IGF-1、TNFa、IL-5;MCP-1、IGF國1、M-CSF、MCP-2;ANG陽2、IGF-1、M國CSF、IL-5;MCP-1、IGF-1、TNFa、MCP曙2;禾口MCP-4、IGF-1、M-CSF、IL隱5。在其它實施方式中,代表性陣列或試劑盒包含用于定量測定選自以下的至少5種蛋白質(zhì)標記的試劑或由這些試劑構(gòu)成MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1。所述至少5種標記可包含選自以下的標記組或由其構(gòu)成MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL陽5、IL-7和IGF隱1;MCP-1、IGF-1、TNFa、IL陽5、M-CSF;MCP-1、IGF-1、M-CSF、MCP-2、IP-10;ANG陽2、IGF-1、M-CSF、IL-5、TNFa;MCP-1、IGF-1、TNFa、MCP-2、IP陽10;MCP-4、IGF-1、M陽CSF、IL-5、TNFa;和MCP-4、IGF-1、M-CSF、IL-5、MCP-2。這些試劑盒還可裝有用于統(tǒng)計學(xué)分析一種或多種表型的軟件包,還可裝有用于計算分類概率的參比數(shù)據(jù)庫。試劑盒可裝有用于各種方法的組份,例如抽取和處理血液樣品的裝置,二期抗體(secondstageantibody)、ELISA試劑、試管、離心柱(spincolumn)等。除了以上組分,所述試劑盒還可裝有實施所述方法的使用說明書。所述試劑盒中的這些使用說明書可采取多種形式,一個試劑盒中可裝有一份或多份使用說明書。這些使用說明書可采取的一種形式是試劑盒包裝上或包裝內(nèi)附件上的印刷在合適介質(zhì)或底材上的信息,如印刷了信息的一張或多張紙。另一種方式是記錄了信息的計算機可讀介質(zhì),例如軟盤、CD等。還有另一種方式是網(wǎng)址,可經(jīng)因特網(wǎng)遠程獲得信息。試劑盒中裝有任何適宜的工具。實施例以下是實施本發(fā)明的具體實施方式的實施例。提供這些實施例只是說明性目的,不是打算以任何方式性質(zhì)本發(fā)明的范圍。已努力確保所用數(shù)值(例如,用量、溫度等)的準確率,但當(dāng)然應(yīng)考慮到有一些實驗誤差及偏差。實施例l:動物模型中動脈粥樣硬化的血清標記由小鼠蛋白質(zhì)陣列獲得的血清生物標記數(shù)據(jù)由于已知多條生物學(xué)途徑參與人和小鼠血管組織內(nèi)的轉(zhuǎn)錄,設(shè)計了一項概念驗證研究(proofofconceptstudy)來檢驗多分析物方法是否能提高動脈粥樣硬化進程中各種階段之間的區(qū)分32。該項研究證明定量測定多種疾病相關(guān)的生物標記能提供靈敏度和特異性更高的方法來評定小鼠的動脈粥樣硬化性疾病,并看望用于人類。該項研究中鑒定的優(yōu)選血清蛋白質(zhì)分類符代表了不同的動脈粥樣硬化相關(guān)生物學(xué)過程,包括巨噬細胞趨化反應(yīng)(chemoattraction)(Cc19、Ccl2)、T-細胞趨化因子活性(Ccl21和Ccl19)、先天免疫力(IL-5)、血管鈣化(Tnfsfll)、血管生成41(Vegfa)和高脂誘導(dǎo)的炎癥(Cxcll、瘦蛋白)。從這些標記的同步檢測值獲得的簽名提高了正確確定小鼠動脈粥樣硬化性疾病進程階段所需的特異性。如以下實施例3和4所述,在前瞻性人隊列研究中(cohortstudy)進一步驗證了該方法的可靠性。為鑒定能與疾病進程和血管壁中基因表達都關(guān)聯(lián)的血清蛋白表達模式,我們利用了縱斷面實驗設(shè)計(longitudinalexperimentaldesign)和小鼠遺傳學(xué)模型加飲食的組合,這些組合產(chǎn)生了不同程度的動脈粥樣硬化。此處,我們利用蛋白質(zhì)陣列來鑒定小鼠血清中表達水平不同的一組炎性生物標記,所述水平與疾病程度相關(guān)。還通過定量實時逆轉(zhuǎn)錄酶聚合酶鏈式反應(yīng)(RTPCR)評估這些標記中一亞組的血管壁基因表達。采用分類算法鑒定一組最靈敏的鑒別符(discriminator),我們能證明血管衍生炎性生物標記的獨特簽名能準確預(yù)測小鼠動脈粥樣硬化性疾病的不同嚴重程度。方法實驗沒#、欲桌逾獰#/7激吝iA^.所有實驗得到了斯坦福動物研究委員會(StanfordCommitteeonAnimalResearch)的批準。以前己描述了總體實驗設(shè)計(45)。3周齡的雌性叩oE敲除(C57BL/6L4poe加7[/"c)、C57B1/6J和C3H/HeJ小鼠購自杰克遜實驗室公司(JacksonLaboratory)(巴港,緬因州)。4周齡時,這些小鼠有些繼續(xù)喂食常規(guī)食物,有些喂食包含21%無水乳脂和0.15%膽固醇(Dyets號101511;戴茨公司(Dyets),伯利恒,賓夕法尼亞州)的高脂飲食,最長40周。如前所述,在每個時間點通過眶后法收集5-9只同隊列高脂飲食apoE-缺陷型小鼠的血清。為建立飲食和遺傳差異的對照,也在基線和40周時收集喂食常規(guī)食物的叩oE敲除小鼠(C57BL/6J-^oe加/f/"c)以及分別喂食常規(guī)食物和高脂飲食的野生型C57Bl/6J和C3H/HeJ小鼠的血清。如前所述(45),在各條件(品系-飲食組合)的各時間點收集15只小鼠(3組,每組5只)的主動脈來分離RNA,與血清收集時間表平行。如前所述采用改進的兩步純化方法(45,47)分離總RNA。過去曾定量測定(測定整個主動脈中損傷區(qū)域的百分比)過該隊列小鼠的主動脈動脈粥樣硬化斑塊,并己記載在現(xiàn)有文獻中(45)。為了分類,還采用了高脂飲食2周、apoE-缺陷型、16-周齡的另一獨立小鼠隊列(4組,每組3-4只)的血清和主動脈。按照現(xiàn)有技術(shù)(45-47,49)合并RNA和血清樣品來進行微陣列雜交。所有樣品加工和蛋白質(zhì)雜交均同時進行以消除任何潛在的技術(shù)變差。歪/^^主激芯^V雜3^浙J^^^^^按照生產(chǎn)商的使用說明書,使用扎奧米克斯1200試驗工作站(Zyomyx1200Assaystation)(扎奧米克斯公司(Zyomyx))將血清樣品與扎奧米克斯鼠科細胞因子生物芯片(ZyomyxMurineCytokineBioChips)(扎奧米克斯公司,海達德,加利福尼亞州)雜交。為準確測定測試血清中的蛋白質(zhì)水平,制作各分析物的9-點校驗曲線(各校驗曲線請參見附錄S4;可通過尸/z"/o/og/cfl/GeMom/a(生理學(xué)基因組學(xué))網(wǎng)址獲得)。l使用扎奧米克斯100熒光掃描儀(Zyomyx100fluorescencescanner)掃描蛋白質(zhì)生物芯片,使用GenPixPro和ZyomyxZDR4001版軟件進行微陣列的網(wǎng)格定位。測定芯片內(nèi)變率(所有陰性對照特征的標準偏差與那些特征平均強度的比值)和芯片間變率(平均標準偏差與平均中值強度的比值M乍為為質(zhì)量控制指標。根據(jù)分析物,蛋白質(zhì)陣列提供的對照差率范圍是3%至約15%,靈敏度為l-l,000pg/ml(參見,各分析物的校驗曲線附錄,可從http:〃physiolgenomics.physiology.org/cgi/content/full/00240.2005/DC1獲得)(11)。不在校驗曲線的線性部分的數(shù)值標記為缺失數(shù)值。然后將數(shù)值形式的原始數(shù)據(jù)輸入專用于微陣列數(shù)據(jù)分析的奧雷克爾關(guān)系型數(shù)據(jù)庫(Oraclerelationaldatabase)(CoBi)(基因數(shù)據(jù)公司(GeneData))。利用熱圖構(gòu)建軟件(HeatM叩Buildersoftware)(7)制作熱圖。詳細的補充方法可從http:〃physiolgenomics.physiology.org/cgi/謹tent/ful畫240.2005/DCl獲得。歪^^:遂雍#"茲^7^_^^^>已有關(guān)于蛋白質(zhì)選擇和分類算法的記載(45)。簡言之,在有監(jiān)督的分析(supervisedanalyses)中,,我們使用5.0版的表達者(Expressionist)軟件(基因數(shù)據(jù)公司),該軟件采用多種分類算法,根據(jù)各基因區(qū)分高脂飲食apoE-小鼠的0、10、24和40周時間點的能力對基因進行排名。這些算法包括方差分析(ANOVA)、支持向量機(SVM)(4)和遞歸特征排除(RFE)(16),該算法是SVM權(quán)重的遞歸算法,其中,反復(fù)進行基因排名并且每次除去固定比例的最低分者(35)。我們還使用已知的微陣列預(yù)測分析(PAM)作為附加分類算法(48)。然后,用各方法確定能以最低誤差率將各實驗正確歸類的最佳數(shù)量的排名基因用它們。通過交叉驗證計算最佳誤差率或分類誤差,其中,25%的實驗用作測試組,其余的用作訓(xùn)練組。這一過程對ANOVA、SVM和RFE算法重復(fù)1,000次。對于SVM和RFE,我們的分析采用線性核模型(linearkernel);非線性高斯核模型(Gaussiankernel)得到類似的結(jié)果。然后,將這一最小分類符基因亞組用于另一獨立數(shù)據(jù)集的交叉驗證和分類。詳細的方法見http:〃physiolgenomics.physiology.org/cgi/content/fu11/00240.2005/DC1。資/A激立游J^^^桌游^"義驗^^7分橋.為測定用先前鑒定的蛋白質(zhì)小亞組進行分類的準確率,我們利用SVM算法(線性核模型)和交叉驗證產(chǎn)生混淆矩陣,重復(fù)地將實驗分為75%的訓(xùn)練組、25%的測試組。結(jié)果以表格形式表示。如前所述,我們還利用SVM算法對獨立的實驗組進行了分類(45,50)。在此項分析中,我們將apoE-缺陷型小鼠的4個時間點的數(shù)據(jù)作為訓(xùn)練組,獨立的實驗組作為測試組。以熱圖方式圖示各實驗根據(jù)一對多比較的SVM輸出值(參見圖3),該值是上述4種SVM分類符各自的標準化邊際值(normalizedmarginvalue)。SVM輸出值使得我們能看出新實驗是如何根據(jù)四種SVM超平面分類的。詳細方法可從http:〃physiolgenomics.physiology.org/cgi/content/full/00240.2005/DC1獲f尋。^^^^^r-尸0.用于Taqman分析的10個基因的引物和探針購自請求式應(yīng)用生物系統(tǒng)試驗公司(AppliedBiosystemsAssays-on-Demand)(表2)。表2<table>tableseeoriginaldocumentpage44</column></row><table>Mu—IL-6Mm004461卯一mlMu_T^ANCEHs.3337918600Mm00441908_mlM;—MCP-5定制設(shè)計按照現(xiàn)有技術(shù)(45-47),使用從三組主動脈(每組5根)獲得的代表性RNA樣品一式三份進行反應(yīng)。結(jié)果欽溶星W、^動嚴蕭存硬眾過薦^蚤A廣表這游好,樣式.我們己報導(dǎo)(45)了該隊列apoE-缺陷型小鼠中動脈粥樣硬化的損傷程度。鑒于apoE缺陷型小鼠主動脈以及主動脈瓣膜中廣泛存在的動脈粥樣硬化損傷,這些研究中未檢查其它血管床。為鑒定與動脈粥樣硬化損傷程度相關(guān)的血清標記,我們使用蛋白質(zhì)微陣列在疾病發(fā)展時程中同時測定了高脂飲食apoE-缺陷型小鼠30個炎性標記的血清水平。我們將喂食常規(guī)食物的apoE-缺陷型小鼠以及野生型C57Bl/6JandC3H/HeJ小鼠的兩個時間點的數(shù)據(jù)作為對照。所檢測的30種標記中有8種未顯示明顯的血清表達水平。該隊列小鼠中,22個標記顯示獨特的時間相關(guān)表達模式,其中一些與前述主動脈中動脈粥樣硬化程度密切相關(guān)(圖1)(45)。這些標記包括各種趨化因子(Ccl2、Ccl9、Cclll、Cell9、Ccl21、Cxcll和Cxcl2)和幾種細胞因子f112、114、115、116、1110和U12)以及其它炎性蛋白(Csfl、Csf2、Csf3、Ifng、Tnfsfll)和Vegfa。與作為對照的野生型C57B1/6J和C3H/HeJ小鼠相比,這些標記中的絕大多數(shù)在apoE-缺陷型小鼠中表達較高(圖2)。如前所述,在相似的條件下,對照小鼠不發(fā)生組織學(xué)意義上明顯的動脈粥樣硬化損傷(47);因此,很容易將疾病相關(guān)變化與諸如高脂飲食和衰老等其它因素相區(qū)開來。/i^f汰會^7:^老分志游^^"特,絲歪/^^;^^.為說明高脂飲食、衰老和遺傳背景所致的非動脈粥樣硬化依賴性血清蛋白質(zhì)水平變化,我們使用了許多對照,其中包括熟知的具有不同患動脈粥樣硬化傾向的兩種小鼠品系,使用了兩種不同的飲食和縱斷面實驗設(shè)計。己知這些對照小鼠不發(fā)生動脈粥樣硬化損傷,因此,它們是用來說明這些獨立變量以及這些變量之間可能的相互作用的合適對照。結(jié)果,我們鑒定到了apoE-缺陷型小鼠中可能與各變量有關(guān)的差異表達的蛋白質(zhì)并區(qū)分出了與血管疾病過程專性相關(guān)的那些蛋白質(zhì)。簡單ANOVA顯示,不同飲食-品系-時間組合之間,至少12種標記表達有差別(圖2)。為說明這三種獨立變量之間可能的相互作用,我們采用三向ANOVA。三種獨立的變量有三種一級相互作用(時間-品系、時間-飲食、品系-飲食)和一種二級相互作用(時間-品系-飲食)。在說明所有這三種因素之間相互作用的過程中,我們鑒定了5種差異表達的蛋白質(zhì)(3-向ANOVA,尸<0.05),包括Ccl9、Ccl21、Cclll、Csfl和1112b。在較晚的時間點,許多炎性標記的血清水平升高,表示高脂飲食還在C57B1/6野生型小鼠中激發(fā)了炎性應(yīng)答(圖2)。在另一方面,C3H/HeJ小鼠的炎性標記水平最低,即使喂食高脂飲食亦是如此。該發(fā)現(xiàn)與我們過去的研究結(jié)果一致,在過去的研究中我們比較了C3H/HeJ小鼠與C57B1/6J小鼠的主動脈血管壁基因表達。當(dāng)時研究的結(jié)論是,C57B1/6J小鼠在動脈粥樣硬化過程中表達炎性標記的遺傳傾向性較高。鑒定^嚴虛獰W游好/^錄^絲歪A廣表這簽名.人類癌癥的分類方法就腫瘤的臨床特征提供了大量信息,包括轉(zhuǎn)移的傾向性、藥物反應(yīng)和長期預(yù)后(13、23、33、43)。對動脈粥樣硬化來說,分類算法的臨床用途在于預(yù)測未來事件。在以前的研究中,我們應(yīng)用分類算法確定了一組基因,這些基因在血管壁中的表達能準確區(qū)分小鼠和人動脈粥樣硬化血管組織中疾病的嚴重程度(45)。在本次研究中,我們采用相似的方法來鑒定血清蛋白最小亞組,用該組蛋白按照準確己知的小鼠動脈粥樣硬化四階段將各蛋白質(zhì)組學(xué)實驗準確分類(圖3)。在此,我們采用幾種熟知的分類算法來鑒定最能區(qū)分不同疾病狀態(tài)小鼠的變量。這些算法包括RFE、SVM和ANOVA。我們還用PAM作為附加分類算法。這些算法根據(jù)蛋白質(zhì)在高脂飲食apoE-小鼠中區(qū)分O、10、24和40周時間點的能力對這些蛋白質(zhì)進行排名。我們的結(jié)果顯示,大多數(shù)算法鑒定了一個蛋白質(zhì)小亞組(Cc121、Ccl9、Csf3、Tnfsfll、Vegfa、Cclll、Ccl2)(圖3A)。該組標記簽名的預(yù)測能力優(yōu)于任何單一標記,因為單一標記都不能準確區(qū)分不同的疾病狀態(tài)(分析未顯示)。為確定這些蛋白質(zhì)的血清水平按照不同疾病狀態(tài)對小鼠進行分類的效用,我們采用SVM算法(線性核模型)通過交叉驗證(反復(fù)的將按75%訓(xùn)練組和25%測試組分組)產(chǎn)生了一個混淆矩陣。該算法顯示,這些血清蛋白質(zhì)表達的簽名能以高達100%的準確準確率區(qū)分患病和未患病的小鼠組(圖3B),并且還能高準確準確率(79.6-100%)地將疾病中期的小鼠與其它階段的區(qū)分開來(圖35)。教J^^"^^游^"義驗^^/7i^^.—組分類符蛋白質(zhì)具有效用的重要證明是它們能對來自獨立實驗的數(shù)據(jù)進行準確分類。為驗證分類符蛋白質(zhì)的效用,我們研究了它們將準確獨立的一組16周齡apoE-缺陷型小鼠準確分類的能力。采用SVM算法,我們能將準確平行進行的各實驗準確地歸入正確的疾病進展階段(圖3C)。據(jù)該獨立組小鼠的蛋白質(zhì)表達與原實驗組(IO周齡)的蛋白質(zhì)表達模式之間的最高相關(guān)性所示,這些分類符蛋白質(zhì)將使得驗證數(shù)據(jù)集與訓(xùn)練組中最接近的時間點準確匹配。必需指出的是,在該分析中,訓(xùn)練組("已知")中不包括獨立數(shù)據(jù)集("測試")。生欽標記i清歪^^水乎與逾,壁基齒表達7大乎賴關(guān).據(jù)估計,循環(huán)蛋白水平與血管壁中的分子事件和表達水平相關(guān)的那些生物標記可提供最多的血管疾病相關(guān)信息。為査明這些相關(guān)性并從生物標記數(shù)據(jù)獲得與動脈粥樣硬化的病理生理學(xué)有關(guān)的信息,我們研究了高信息含量生物標記編碼基因的血管壁基因表達模式。采用定量實時RT-PCR,我們能確立數(shù)種標記的血清蛋白水平與它們的血管RNA表達之間的關(guān)聯(lián)。在被研究的標記中,Ccl21(r=0.91)、Ccl2(r=0.97)、Ccl19(r=0.80)和Cclll(r=0.67)顯示基因表達的時間相關(guān)行增加與血清水平之間高度相關(guān)(圖4)。這些數(shù)據(jù)雖然還包括這些標記在其它組織中的表達,但它們提示表達與血管壁動脈粥樣硬化特別相關(guān)。通過比較血清蛋白質(zhì)水平、血管基因表達和高脂飲食時間(loglO(喂食周數(shù)))的標準化平均比值來測定皮爾遜相關(guān)值。如果動脈粥樣硬化血管壁中的mRNA表達與所編碼蛋白質(zhì)的血清水平之間的相關(guān)系數(shù)(r)是至少0.6、至少0.7、至少0.8、至少0.9或更高,則將這種相關(guān)性視作顯著。討論明顯需要改進的工具來診斷和治療臨床前動脈粥樣硬化。雖然目前對動脈粥樣硬化的機制和情況的了解越來越多,但我們鑒定髙風(fēng)險患者和預(yù)測冠狀動脈疾病預(yù)防手段效力的方法依然不夠。由于缺乏動脈粥樣硬化性疾病的高靈敏性、高特異性生物標記,半數(shù)以上此類患者的首次臨床表現(xiàn)便是心肌梗塞或死亡(19,20)。曾就動脈粥樣硬化研究了小鼠和人的幾種炎性標記,結(jié)果支持動脈粥樣硬化的炎性假說(38)。然而,各項研究僅關(guān)注少數(shù)幾個單用標記上,一些研究沒有進行縱斷面實驗,只有少數(shù)研究證明在血管水平上與基因表達直接相關(guān)(25,29,34)。雖然目前已提出用通用炎癥標記劃分患者動脈粥樣硬化疾病風(fēng)險級別,但不曾用這些標記在無癥狀患者中就確定準確疾病類別進行篩選,更重要的是未曾用于預(yù)測首次心血管病變。例如C-反應(yīng)性蛋白(CRP)和血纖蛋白原等標記缺乏特異性的原因可能在于它們不是血管衍生蛋白,可作為各種器官中炎癥的信號。還可能,由于高危人群之間的異質(zhì)性,單獨一種標記提供的信息不足以準確預(yù)測疾病。出于相似的原因,這些通用炎癥標記,例如CRP和沉降速率(ESR)早已不被用作其狼瘡(SLE)和類風(fēng)濕性關(guān)節(jié)炎(RA)等它炎性疾病的特異性診斷標記。我們曾經(jīng)采用本發(fā)明所用的實驗設(shè)計對小鼠主動脈組織RNA分布進行研究,證明可以鑒定到少量能夠按照疾病嚴重程度進行分類的基因(45)。顯然,由于不易對血管組織直接進行處理,鑒定血清中的蛋白質(zhì)標記對于開發(fā)診斷人冠狀動脈疾病的診斷工具來說具有實際意義。在本文報道的工作中,我們研究了炎性血清生物標記豐度模式以及這些生物標記的亞組是否可用于就疾病進展對動物進行分類。在科學(xué)上,這兩類信息是互補的,明顯加強了對疾病詳細分子機制的理解,所述機制包括從基因轉(zhuǎn)錄到翻譯到胞內(nèi)途徑到向血清中分泌遞質(zhì)。如上所述,鑒定某給定疾病狀態(tài)的血清標記分布能開發(fā)可人用的非侵入性診斷方法。因為我們還具有基于微陣列的患病組織轉(zhuǎn)錄情況詳細全景(transcriptionallandscape),我們能用該圖估測導(dǎo)致炎性介質(zhì)表達的途徑中的上游組分,這是開發(fā)高度靶向性治療手段的第一步。實際上,然后可用血清試驗(例如本文所述)來檢驗這種治療手段的最終效果。我們用蛋白質(zhì)微陣列同時(檢測)多種動脈粥樣硬化小鼠模型的血清蛋白質(zhì)表達分布,所述模型具有不同的動脈粥樣硬化易感性和嚴重程度。用與分類癌癥進程和類型所用相似的分類算法,我們能證實這些血管衍生生物標記的獨特簽名能準確預(yù)測不同程度的小鼠動脈粥樣硬化。在以前的研究中(45),我們的分析顯示16周時間點獲得的獨立數(shù)據(jù)集的微陣列基因表達分布與24周時間點的更相關(guān),而在此次研究中,相近時間點的蛋白質(zhì)分布與IO周時間點的更相關(guān)?;谠摪l(fā)現(xiàn)可能產(chǎn)生許有趣的假設(shè)。由于目前蛋白質(zhì)微陣列中的探針數(shù)量有限,本發(fā)明研究中的蛋白質(zhì)分類符不同于以前研究中鑒定的基因分類符。血清蛋白質(zhì)表達的時間相關(guān)行增加還可能滯后于血管壁基因表達水平的變化。由于相同標記的血管基因表達和血清蛋白質(zhì)水平之間可能因各種因素(例如轉(zhuǎn)錄后修飾和蛋白質(zhì)穩(wěn)定性)而不直接相關(guān),這些數(shù)據(jù)的重要驗證是證明這些標記中亞組的疾病相關(guān)血管基因表達。我們證實這些標記的時間相關(guān)性血清水平與它們在血管壁中的基因表達相關(guān)。疾病進展與血管基因表達的時間依賴性關(guān)聯(lián)提示標記產(chǎn)生的主要部位是血管壁。然而,如以前的報道所述(22),血管可能不是炎性標記的唯一來源,其它組織,例如肌肉、脾臟、脂肪組織或肝臟可能也影響著這些標記的血清水平。在我們的研究中評估的一種標記是116,已知其產(chǎn)生于肌肉和肝臟以及血管壁。制得關(guān)注的是,116的血清豐度與疾病的時序性發(fā)展不相關(guān),與血管壁中的基因表達只有微弱相關(guān)性。這些發(fā)現(xiàn)提示其它組織可能也影響著一些標記(例如116)的血清水平,但這些標記的水平與所研究的疾病狀態(tài)不相關(guān),也無助于分類(對象)。一些全身性炎性標記的血清水平還可能應(yīng)研究所用不同小鼠之間代謝參數(shù)差異而變得復(fù)雜。業(yè)已證明,高脂飲食激發(fā)在肝內(nèi)炎性應(yīng)答(22)。這些基因在整個高脂喂食期間維持高水平表達。為了設(shè)立關(guān)于這些全身性效應(yīng)的對照,我們在動脈粥樣硬化早期和晚期都對高脂飲食的小鼠進行了比較,結(jié)果,血清脂質(zhì)水平不變(14)而動脈粥樣硬化程度改變。因此,這些代謝參數(shù)與隨時間線性增加的標記血清水平之間相關(guān)性不佳。因此,血管衍生標記的時序性變化與動脈粥樣硬化的程度更相關(guān),與脂質(zhì)水平則不甚相關(guān)。本項研究所鑒定的這些標記有力地支持了動脈粥樣硬化的炎癥性質(zhì),所鑒定的各標記能提供了了解疾病在小鼠中潛在機制的部分信息。這些標記包括巨噬細胞和T細胞重要特異性趨化因子。Ccl21(原來稱為Exodus-2/SLC/6Ckine/TCA4)是至今鑒定的最強T細胞趨化劑,其在T細胞附著和從血管向炎癥組織部位轉(zhuǎn)移中發(fā)揮著重要作用(30)。在我們的實驗中,相關(guān)趨化因子Cxcll2和Ccll9也高水平表達,它們通過激活淋巴細胞功能相關(guān)的抗原-l(LFA-l)來介導(dǎo)T細胞與內(nèi)皮強烈結(jié)合(6,15)。重要的是,據(jù)信,在正常免疫應(yīng)答期間Ccl21不參與T細胞的效應(yīng)細胞功能,但在T細胞介導(dǎo)的自身免疫疾病中,它被發(fā)現(xiàn)在內(nèi)皮細胞中高水平地誘導(dǎo)性表達(8)。因此,疾病相關(guān)性高水平循環(huán)Ccl21這一新發(fā)現(xiàn)和以及高度相關(guān)的CCL21在患病血管壁中的表達提出了一個問題,即在小鼠中,自身免疫過程是否參與了動脈粥樣硬化的發(fā)展(44)。人疾病期間的Cc121水平尚有待測定。Ccll9[巨噬細胞炎性蛋白(MIP)-3b]與Ccl21的功能有些相似。其與相同的受體即Ccr7結(jié)合,是T細胞和B細胞的強效趨化劑。但與Ccl21不同,Ccl19似乎還采與正常的T細胞功能。其在動脈粥樣硬化性血管中的表達以及血清水平與主動脈基因表達之間的高度相關(guān)性均是新發(fā)現(xiàn)。Ccl2(Mcpl或JE)(3)和Cclll(嗜酸細胞活化趨化因子)(10,17)在動脈粥樣硬化中的作用已很清楚,這些證實了我們的發(fā)現(xiàn)。我們也記載了Cxcl2(MIP-2)和Cxcll(KC)的血清水平在動脈粥樣硬化小鼠的血清中均升高,與其它研究者所述的血清水平一致(29)。如其它研究者的研究所述(29),我們發(fā)現(xiàn)Cxll2(MIP-2)的可靠性較低。此外,鑒于血清水平與主動脈基因表達的相關(guān)性較低,大量的Cxcl2可能是有非血管性組織產(chǎn)生的,這證實了以前的結(jié)論(29)。然而,我們發(fā)現(xiàn)與Cxcl2血管基因表達的相關(guān)性仍優(yōu)于例如116和Csf3等其它標記。盡管Cxcll(KC)的水平升高,我們發(fā)現(xiàn)該標記不是疾病的穩(wěn)定預(yù)測符,這與近年來的研究一致(34)。近年來有報道將^g力描述成急性冠狀動脈綜合征的獨立預(yù)測符(18,24)。我們的研究在至少三種所用算法中支持Vegfa是合理的分類符,從而證實其可應(yīng)用于監(jiān)測人類疾病。我們的另一非常值得關(guān)注的發(fā)現(xiàn)是Tnfsfll(TRANCE)在動脈粥樣硬化中的作用。Tnfsfl1是腫瘤壞死因子(TNF)細胞因子家族的一員,并且是骨保護素的配體,是破骨細胞分化和活化中起到關(guān)鍵因子。該蛋白質(zhì)也稱為樹突狀細胞存活因子(dentriticcellsurvivorfactor),參與調(diào)節(jié)T細胞依賴性免疫應(yīng)答。近年來,骨保護素被認為是進行性人動脈粥樣硬化和人心血管疾病的潛在風(fēng)險因子(21,37)。據(jù)推測在動脈粥樣硬化中起作用的其它細胞因子包括1112b(25)和115(9)。雖然我們證明了它們的血清水平能預(yù)測疾病狀態(tài),但我們未能證實1112b在動脈粥樣硬化損傷時的血管特異性表達??傊?,我們鑒定的優(yōu)選血清蛋白分類符涵概了多種動脈粥樣硬化生物學(xué)過程,包括巨噬細胞趨化反應(yīng)(Ccl9,Ccl2)、T細胞趨化因子活性(Ccl21和Ccl19)、先天免疫性(115)、血管鈣化(Tnfsfll)、血管生成(Vegfa)和高脂誘導(dǎo)的炎癥(Cxcll,可能還有瘦蛋白)。同時檢測這些標記獲得的簽名代表著不同的動脈粥樣硬化相關(guān)性生物學(xué)過程,有望滿足診斷動脈粥樣硬化性疾病的特異性要求。如實施例3-12所述,通過合適的前瞻性人試驗對該方法的進一步驗證獲得了用于動脈粥樣硬化和冠狀動脈疾病的改良篩選診斷工具。參考文獻1.Ffl"SooA:i^ca/]^ar26^3.貝塞斯達,馬里蘭州國家心臟、肺和血液研究院(NationalHeart,Lung,andBloodInstitute),2003.2.MoA/ctt_yMoC/zaW6oo/t,2002.貝塞斯達,馬里蘭州國家心臟、肺和血液研究院,2002.3.AielloRJ,Bou腦aPA,LindseyS,WengW,NatoliE,RollinsBJ和MilosPM.Monocytechemoattractantprotein-1acceleratesatherosclerosisinapolipoproteinE-deficientmice.^4Wer/osc/erJ7wowZ)Fasc19:1518—1525,1999.4.BurgesCJC.Atutorialonsupportvectormachinesforpatternrecognition.DfltoM/m'wg《"ow/ec/geZ)^cov2:121—167,1998.5.BursillCA,ChannonKM禾卩GreavesDR.Theroleofchemokinesinatherosclerosis:recentevidencefromexperimentalmodelsandpopulationgenetics.Cw/rC^/"丄&Wo/15:145-149,2004.6.CampbellJJ,HedrickJ,ZlotnikA,SianiMA,ThompsonDA禾卩ButcherEC.Chemokinesandthearrestoflymphocytesrollingunderflowconditions.5Wewce279:381—384,1998.7.ChenMM,AshleyEA,DengDX,TsalenkoA,DengA,TabibiazarR,Ben-DorA,FensterB,YangE,KingJY,FowlerM,RobbinsR,JohnsonFL,BmhnL,McDonaghT,DargieH,YakhiniZ,TsaoPS禾卩QuertermousT.Novelroleforthepotentendogenousinotropeapelininhumancardiacdysfunction.C7rcw/Wo"108:1432—1439,2003.8.ChristophersonKW二世,HoodAF,TraversJB,RamseyH禾口HromasRA.EndothelialinductionoftheT-cellchemokineCCL21inT-cellautoimmunediseases.B/oot/101:801—806,2003.9.DaughertyA,RateriDL禾卩KingVL.IL-5linksadaptiveandnaturalimmunityinreducingatheroscleroticdisease.■/C7//"veW114:317—319,2004.10.EconomouE,TousoulisD,KatiniotiA,StefanadisC,TrikasA,PitsavosC,TentolourisC,ToutouzaMG禾口ToutouzasP.Chemokinesinpatientswithischaemicheartdiseaseandtheeffectofcoronaryangioplasty,/"f/CaWo/80:55—60,2001.11.FeezorRJ,BakerHV,XiaoW,LeeWA,HuberTS,Mindri廳M,KimRA,Ruiz-TaylorL,MoldawerLL,DavisRW禾口SeegerJM.Genomicandproteomicdeterminantsofoutcomeinpatientsundergoingthoracoabdominalaorticaneurysmrepair.J"7mmwwo/172:7103—7109,2004.12.GlassCK禾口WitztumJL.Atherosclerosis.Theroadahead.CW/104:503—516,2001.13.GolubTR,SlonimDK,TamayoP,HuardC,GaasenbeekM,MesirovJP,CollerH,LohML,DowningJR,CaligiuriMA,BloomfieldCD和LanderES.Molecularclassificationofcancer:classdiscoveryandclasspredictionbygeneexpressionmonitoring.>SWece286:531—537,1999.14.GrimsditchDC,PenfoldS,LatchamJ,Vidgeon-HartM,GrootPH和BensonGM.C3HapoE(」」micehavelessatherosclerosisthanC57BLapoE(丄)micedespitehavingamoreatherogenicserumlipidprofile.A/zemyc/ems7'>y151:389—397,2000.15.G飄MD,TangemannK,TamC,CysterJG,RosenSD和WilliamsLT.AchemokineexpressedinlymphoidhighendothelialvenulespromotestheadhesionandchemotaxisofnaiveTlymphocytes./VocAto/^4cad95:258—263,1998.16.GuyonI,WestonJ,BarnhillS禾卩VapnikV.Geneselectionforcancerclassificationusingsupportvectormachines.Mac/'e46:389,2002.17.HaleyKJ,LillyCM,YangJH,FengY,KennedySP,TuriTG,ThompsonJF,SukhovaGH,LibbyP禾口LeeRT.OverexpressionofeotaxinandtheCCR3receptorinhumanatherosclerosis:usinggenomictechnologytoidentifyapotentialnovelpathwayofvascularinflammation.C7rcw/加'ow102:2185—2189,2000.18.HeeschenC,DimmelerS,HammCW,F(xiàn)ichtlschererS,SimoonsML禾卩ZeiherAM.Pregnancy-associatedplasmaprotein-Alevelsinpatientswithacutecoronarysyndromes:comparisonwithmarkersofsystemicinflammation,plateletactivation,andmyocardialnecrosis.Co//CaWo/45:229—237,2005.19.KannelWB和McGeeDL.Epidemiologyofsuddendeath:insightsfromtheFraminghamStudy.CarWomscC7/"15:93—105,1985.20.KannelWB禾口SchatzkinA.Suddendeath:lessonsfromsubsetsinpopulationstudies.J"爿mCo//Cani/o/5:141B-149B,1985.21.KiechlS,SchettG,WenningG,RedlichK,OberhollenzerM,MayrA,SanterP,SmolenJ,PoeweW禾口WilleitJ.Osteoprotegerinisariskfactorforprogressiveatherosclerosisandcardiovasculardisease.C7rcw/a"ow109:2175—2180:2004.22.KimS,SohnI,AhnJI,LeeKH禾卩LeeYS.Hepaticgeneexpressionprofilesinalong-termhigh-fatdiet-inducedobesitymousemodel.340:99-109,2004.23.LapointeJ,LiC,HigginsJP,vandeRijnM,BairE,MontgomeryK,FerrariM,EgevadL,RayfordW,BergerheimU,EkmanP,DeMarzoAM,TibshiraniR,BotsteinD,BrownPO,BrooksJD禾卩PollackJR.Geneexpressionprofilingidentifiesclinicallyrelevantsubtypesofprostatecancer./VocTVaWJcad101:811—816,2004.24.LeeSH,WolfPL,EscuderoR,DeutschR,JamiesonSW禾卩ThistlethwaitePA.Earlyexpressionofangiogenesisfactorsinacutemyocardialischemiaandinfarction.TV五wg/JAfed342:626—633,2000.25.LeeTS,YenHC,PanCC和ChauLY.Theroleofinterleukin12inthedevelopmentofatherosclerosisinApoE-deficientmice.JWe".osc/er7T^om6Fasc腸/19:734—742,1999.26.LibbyP.Inflammationinatherosclerosis.TVaZwre420:868—874,2002.27.LucasAD禾卩GreavesDR.Atherosclerosis:roleofchemokinesandmacrophages.五x戸^vMo/Me<i2001:1—18,2001.28.LusterAD.Chemokines—chemotacticcytokinesthatmediateinflammation.混wg〃Med338:436—445,1998.29.MurphyN,BruckdorferKR,GrimsditchDC,OverendP,Vidgeon-HartM,GrootPH,BensonGM禾卩GrahamA.TemporalrelationshipsbetweencirculatinglevelsofCCandCXCchemokinesanddevelopingatherosclerosisinapolipoproteinE*3Leidenmice.JWen'osc/er7T^om6Fasc23:1615—1620,2003.30.NagiraM,ImaiT,HieshimaK,KusudaJ,RidanpaaM,TakagiS,NishimuraM,KakizakiM,NomiyamaH禾口YoshieO.MolecularcloningofanovelhumanCCchemokinesecondarylymphoid-tissuechemokinethatisapotentchemoattractantforlymphocytesandmappedtochromosome9部分13./C/zem272:19518-19524,1997.31.NakashimaY,PlumpAS,RainesEW,BreslowJL禾卩RossR.ApoE-deficientmicedeveloplesionsofallphasesofatherosclerosisthroughoutthearterialtree,^他〃'osc/er77zr謹614:133—140,1994.32.NapoliC,PalinskiW,DiMinnoG禾卩D'ArmientoFP.DeterminationofatherogenesisinapolipoproteinE-knockoutmice.iVw^*Me似6CofWovcwcZ)/>y10:209—215,2000.33.PaikS,ShakS,TangG,KimC,BakerJ,CroninM,BaehnerFL,WalkerMG,WatsonD,ParkT,HillerW,FisherER,WickerhamDL,BryantJ禾口WolmarkN.Amultigeneassaytopredictrecurrenceoftamoxifen-treated,node-negativebreastcancer.A^"g7/她d351:2817—2826,2004.34.ParkinSL,PritchettJP,GrimsditchDC,BruckdorferKR,SahotaPK,LloydA,OverendP禾口BensonGM.CirculatinglevelsofthechemokinesJEandKCinfemaleC3Hapolipoprotein-E-deficientandC57BLapolipoprotein-E-deficientmiceaspotentialmarkersofatherosclerosisdevelopment.Soc7><my32:128—130,2004.35.RamaswamyS,TamayoP,RifldnR,MukherjeeS,YeangCH,AngeloM,LaddC,ReichM,LatulippeE,MesirovJP,PoggioT,GeraldW,LodaM,LanderES禾口GolubTR.Multiclasscancerdiagnosisusingtumorgeneexpressionsignatures./VoctVw/Jcaaf^SW98:15149—15154,2001.36.ReddickRL,ZhangSH禾卩MaedaN.AtherosclerosisinmicelackingapoE.Evaluationoflesionaldevelopmentandprogression.Jwe"'osc/erT7zr麵614:141—147,1994.5437.RheeEJ,LeeWY,KimSY,KimBJ,SungKC,KimBS,KangJH,OhKW,OhES,BaekKH,KangMI,WooHY,ParkHS,KimSW,LeeMH和ParkJR.Therelationshipofserumosteoprotegerinlevelswithcoronaryarterydiseaseseverity,leftventricularhypertrophyandC國reactiveprotein.C7/w108:237—243,2004.38.RidkerPM,BrownNJ,VaughanDE,HarrisonDG禾卩MehtaJL.Establishedandemergingplasmabiomarkersinthepredictionoffirstatherothromboticevents.C/,c由/o"109:IV6—IV19,2004.39.RidkerPM,CannonCP,MorrowD,RifaiN,RoseLM,McCabeCH,PfefferMA禾口Brau而aldE.C隱reactiveproteinlevelsandoutcomesafterstatintherapy.A^五"g〃MW352:20_28,2005.40.RifaiN禾口RidkerPM.Inflammatorymarkersandcoronaryheartdisease.C鮮13:383—389,2002.41.RossR.Atherosclerosis—aninflammatorydisease.W£>g//Mec/340:115—126,1999.42.SaadeddinSM,HabbabMA禾卩FernsGA.Markersofinflammationandcoronaryarterydisease.MedSc/MomY8:RA5—RA12,2002.43.SorlieT,PerouCM,TibshiraniR,AasT,GeislerS,JohnsenH,HastieT,EisenMB,vandeRijnM,JeffreySS,ThorsenT,QuistH,MateseJC,BrownPO,BotsteinD,EysteinLonningP禾口Borresen-DaleAL.Geneexpressionpatternsofbreastcarcinomasdistinguishtumorsubclasseswithclinicalimplications.淑"cWS"',98:10869—10874,2001.44.StemmeS,FaberB,HolmJ,WiklundO,WitztumJL禾口HanssonGK.Tlymphocytesfromhumanatheroscleroticplaquesrecognizeoxidizedlowdensitylipoprotein.A^/JcfldSc/92:3893—3897,1995.45.TabibiazarR,WagnerRA,AshleyEA,KingJY,FerraraR,SpinJM,SananDA,NarasimhanB,TibshiraniR,TsaoPS,EfronB禾口QuertermousT.Signaturepatternsofgeneexpressioninmouseatherosclerosisandtheircorrelationtohumancoronarydisease.尸/2戶'o/Gewom/cs22:213—226,2005.46.TabibiazarR,WagnerRA,LiaoA禾口QuertermousT.Transcriptionalprofilingoftheheartrevealschamber-specificgeneexpressionpatterns.Cz>c93:1193-1201,2003.47.TabibiazarR,WagnerRA,SpinJM,AshleyEA,NarasimhanB,RubinEMEfronB,TsaoPS,TibshiraniR禾口QuertermousT.Mousestrain-specificdifferencesinvascularwallgeneexpressionandtheirrelationshiptovasculardisease.JWen'osc/er7T^om6Fasc25:302—308,2005.48.TibshiraniR,HastieT,NarasimhanB禾口ChuG.Diagnosisofmultiplecancertypesbyshrunkencentroidsofgeneexpression._/VaZ/JcadSc/99:6567-6572,2002.49.WagnerRA,TabibiazarR,PowersJ,BernsteinD禾口QuertermousT.Genome-wideexpressionprofilingofacardiacpressureoverloadmodelidentifiesmajormetabolicandsignalingpathwayresponses./Mo/Ce//CaWo/37:1159—1170,2004.50.YeangCH,RamaswamyS,TamayoP,MukherjeeS,RifkinRM,AngeloM,ReichM,LanderE,MesirovJ禾卩GolubT.Molecularclassificationofmultipletumortypes.腸/"/or顧"cs17,增干'J1:S316-S322,2001.實施例2:蛋白質(zhì)微陣列分析為評估不同趨化因子(嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4、IL-8、MIPla和RANTES)的抗體陣列的性能,我們用市售施萊歇爾和舒爾蛋白質(zhì)微斑點陣列(FastQuant人趨化因子,S&S拜爾森斯公司(S&SBioscenceslnc.),基涅,新罕布什爾州,美國)。該陣列平臺采與點樣在包被了3-D硝基纖維素表面的標準顯微鏡載玻片上的多種高特異單克隆性抗體。作為人循環(huán)(血)樣品,我們選擇了有病史、運動試驗確定陽性(positiveexercisetest)或接受過冠狀動脈導(dǎo)管術(shù)的一組11個已知嚴重冠狀動脈病例,和沒有病史及運動試驗或冠狀動脈造影呈陰性的9個對照。收集循環(huán)(血)樣品,冷凍保存于-80°C,融化后立即用在陣列上。各樣品在一式兩份的兩個陣列上溫育。用一次點樣(printmn)制備的總共8塊載玻片(每塊載玻片上8個陣列)對11份患者樣品和9份對照進行測評。該項研究中對各樣品進行的重復(fù)實驗顯示陣列之間的重現(xiàn)性良好。對于各抗體,將同一陣列上4重復(fù)特征扣除了背景信號的信號中值與重復(fù)實驗中的各個中值作圖比較。重復(fù)實驗的檢測值之間相關(guān)系數(shù)大多為0.99,表明兩組陣列數(shù)據(jù)之間的一致性優(yōu)良。在以下分析中,各分析物循環(huán)檢測值表示一種循環(huán)(血)樣品的四次檢測值的平均值,其中扣除了空白載玻片的相應(yīng)平均檢測值,用差值的log(10)數(shù)值進行分析。將對照9份樣品組的蛋白質(zhì)水平與病例組11份樣品的蛋白質(zhì)水平作比較。對于每種蛋白質(zhì),采用高斯誤差評分法(Gaussianerrorscore)比較病例和對照組的蛋白質(zhì)水平分布,并制作成熱圖,所述評分法檢測按照各組樣品數(shù)值擬合的正態(tài)分布交疊。高斯分布圖顯示了兩組中MMP-2/TIMP-2復(fù)合物的蛋白質(zhì)水平實際分布。一種蛋白質(zhì)檢測值不能明確分開這些組中的少量個體,高斯圖中明顯可見重疊的信號分布。雖然本項工作的目的不是鑒定分類算法,但通過將少量優(yōu)選蛋白組合并用費希爾線性辨別分析來區(qū)分病例樣品和對照樣品是可能的。我們用標準ELISA夾心試驗,用與該陣列所用相同的捕捉抗體和檢測抗體驗證了該陣列所得的結(jié)果。雖然該陣列所用的抗體對是購買的并己由供應(yīng)商驗證適用于ELISA,還是先檢查然后將用于陣列以確保它們符合靈敏度要求。采用ELISA方法分析病例和對照人循環(huán)樣品,將ELISA數(shù)據(jù)與陣列數(shù)據(jù)相比較。分析物之一循環(huán)瘦蛋白的比較數(shù)據(jù)顯示,無論以10倍還是20-倍樣品稀釋液進行ELISA,相關(guān)性良好。實施例3:用于準確預(yù)測和診斷人冠狀動脈疾病的循環(huán)炎性標記簽名人血清生物標記的前期試驗數(shù)據(jù)由于實施例1和2獲得的結(jié)果令人鼓舞,我們研究了是否可用蛋白質(zhì)微陣列鑒定血清炎性蛋白質(zhì)的簽名用作人類動脈粥樣硬化性疾病的高靈敏度、高特異性標記。為此,我們設(shè)計一項病例-對照嵌套研究(nestedcase-controlstudy),通過以檢測動脈粥樣硬化風(fēng)險因素和遺傳決定因素為目的的大型臨床流行病學(xué)研究選擇了51位臨床明顯CAD患者和44位健康對照。用蛋白質(zhì)微陣列對報名時收集的血清樣品進行多種炎性標記的同時檢測。有一個亞組的所測分析物在病例受試者中的濃度明顯較高。采用這些標記的血清表達分布的分類算法能準確相對于對照將CAD對象準確分級。此外,這些生物標記的獨特簽名明顯提高了CAD其它已知標記的預(yù)測能力。在該前期研究中,我們證明循環(huán)炎性標記的特征模式能準確鑒定動脈粥樣硬化患者。引言動脈粥樣硬化性心血管疾病(ASCVD)是發(fā)達國家中發(fā)病率和死亡率的主要原因1>2。然而,由于缺乏準確的早期診斷標記,超過半數(shù)的冠狀動脈疾病(CAD)患者的首次臨床表現(xiàn)便是心肌梗塞或死亡3'41'2。炎癥在ASCVD的所有階段均涉及,認為其是動脈粥樣硬化的病理生理學(xué)基礎(chǔ),從而提供了該疾病過程的潛在標記5'6'在大型流行病學(xué)研究中,血清炎性生物標記升高已顯示能區(qū)分心血管風(fēng)險的級別并評估治療反應(yīng)89。雖然可能可用于風(fēng)險定級,目前的炎性標記缺乏足夠的疾病特異性,因而不能用作CAD診斷的篩選工具。例如C-反應(yīng)性蛋白(CRP)和血纖蛋白原等目前的標記缺乏準確性的原因可能在于它們既不是主要衍生自血管壁又不是主要由參與血管炎性過程的細胞產(chǎn)生的,并且可能作為許多不同器官和組織中的炎癥信號。此外,還可能,因為高危人群的疾病表型異質(zhì)性,單獨一種標記提供的信息不足以準確評估冠狀動脈循環(huán)系統(tǒng)中的血管損壞。出于相似的原因,這些通用炎癥標記,例如CRP和紅細胞沉降率(ESR)早己不被用作例如狼瘡(SLE)和類風(fēng)濕性關(guān)節(jié)炎(RA)等其它炎性疾病的特異性診斷標記,盡管它們依舊是臨床實踐中對風(fēng)險定級和測評治療反應(yīng)的工具。因此,亟需能更準確反映ASCVD活性并能用作鑒定患者的高度靈敏、高特異性試驗的生物標記。我們推測,循環(huán)炎性蛋白質(zhì)的獨特簽名可更好地鑒定CAD。為解決該問題,我們設(shè)計了一次嵌套病例-對照研究(nestedcase-controlstudy),通過從ADVANCE研究(動脈粥樣硬化性疾病,血管功能和遺傳流行病學(xué)(AtheroscleroticDisease,F/lscularFuNction,&GenetiC五pidemiology))選擇51位最近發(fā)生過心肌梗塞(MI)的患者和44位健康對照,所述ADVANCE研究是關(guān)于動脈粥樣硬化遺傳易感性的群體研究。用商品化購得的蛋白質(zhì)微陣列對報名時收集的血清樣品進行9種炎性標記的同時檢測。數(shù)據(jù)分析包括了大量臨床變量,例如病史、用藥情況、個人和家族史(一級親屬)以及血漿葡萄糖、胰島素和C-反應(yīng)性蛋白(CRP)58水平。統(tǒng)計學(xué)算法鑒定到蛋白質(zhì)生物標記簽名,當(dāng)所述簽名與其它臨床變量聯(lián)用時能準確鑒別CAD患者和對照。方法逮者絲鋪微薪所有研究方案均經(jīng)由學(xué)院評審委員會評審和批準。從ADVANCE研究隊列的兩個不同組別中隨機選擇患者,所述ADVANCE研究是斯坦福心血管部門(StanfordCardiovasculardivision)和北加利福尼亞凱撒永久醫(yī)療保健項目(NorthernCaliforniaKaiserPermanenteMedicalCareProgmm)研究部合作進行的一項更大規(guī)模的遺傳流行病學(xué)研究,其目的是調(diào)查心血管疾病的遺傳決定因素。舊金山海灣地區(qū)(SanFranciscoBayArea)的總共3666人參與了ADVANCE,根據(jù)性別和年齡對這些人進行分類以代表北加利福尼亞州人口狀況。所有可能參加試驗對象書面表示知情并同意參與,研究方案得到斯坦福大學(xué)和凱撒研究部門的人類對象委員會(HumanSubjectsCommittees)的批準。ADVANCE研究隊列由特征明確的臨床組別構(gòu)成743位年輕、明顯健康的對照(組1);1023位年長的對照(組2);503位年輕的CAD病例(組3);926位年長的新近診斷CAD病例,病歷記載在報名時已發(fā)生過首次心肌梗塞(MI),首次心肌梗塞時間距離報名時間的中值是3.4個月(組4);和471位年長的穩(wěn)定心絞痛首次發(fā)作病例(組5)。我們通過性別隨機取樣法從組2和組4中選擇了95例高加索受試者、44位MI病例和51位對照。大型ADVANCE研究數(shù)據(jù)庫包括例如病史、用藥情況、個人和家族史(一級親屬)以及血漿葡萄糖、胰島素和C-反應(yīng)性蛋白(CRP)水平和脂質(zhì)分布。只在組2中測得了脂質(zhì)分布。病例受試者包括45-75歲老年男性和55-75歲女性,都是因急性MI首次發(fā)現(xiàn)CAD。鑒定這些受試者的標準是出院主診斷碼(primaryhospitaldischargediagnosiscode)為410.x,并且,住院期間或入院前72小時內(nèi)心臟酶類升高(肌鈣蛋白I水平24.0ng/mL,或者,CK-MB25.6ng/ml與CK-MB%23.3ng/mL至少其一)。導(dǎo)引病變(indexevent)(中值為3.4個月)后7-20周采集血清。ADVANCE研究委員會審閱了臨床文件,確認了診斷結(jié)論。對照是不同性別的60-69歲老人,據(jù)其主要醫(yī)師報告并檢索凱撒永久數(shù)據(jù)庫(KaiserPermanenteDatabase)的結(jié)果,他們沒有任何ASCVD表現(xiàn)或其它重癥疾病的臨床史。在報名參見ADVANCE后的首次尋訪時擦劑臨床數(shù)據(jù)和空腹血清樣品。用標準方法檢測葡萄糖和胰島素的血漿濃度。通過高靈敏度ELISA試驗測定CRP。節(jié)廣微A辨效微微湮為測定9種不同趨化因子(嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-3、MCP-4、IL-8、MIPla和RANTES)的濃度,我們使用市售施萊歇爾和舒爾蛋白質(zhì)微斑點陣列(FastQuant人趨化因子,S&S拜爾森斯公司,基涅,新罕布什爾州,美國)。該陣列平臺采用點樣在包被了3-D硝基纖維素表面的標準顯微鏡載玻片上的多種高特異單克隆性抗體。這些標記的靈敏度和特異性以及與常規(guī)ELISA的相關(guān)性是已知的。己確定這些標記之間沒有交叉反應(yīng)性。按照生產(chǎn)商的使用說明書使血漿樣品與蛋白質(zhì)微陣列雜交,然后加入生物素化的第二抗體和Cy5-鏈霉親和素偶聯(lián)物。用AxonGenepix4000B微陣列掃描儀和特征提取軟件(ArrayVisionFast8.0,S&S拜爾森斯公司)將掃描圖像轉(zhuǎn)化成數(shù)字強度,由此測得雜交后熒光強度。根據(jù)內(nèi)標參比值由熒光強度值算得絕對濃度。根據(jù)具體分析物,快速定量(FastQuant)蛋白質(zhì)陣列的對照變率為3%至約15%,靈敏度為1-10pg/ml??焖俣康鞍踪|(zhì)陣列的準確率與具有相似線性范圍的相應(yīng)ELISA相當(dāng)1Q'U。目前研究的具體的其他方法和質(zhì)量控制見發(fā)行人的在線網(wǎng)址(其他材料可參見Ardigo,Tabibiazar等,"SignaturePatternsofCirculatingBiomarkersAccuratelyPredictPresenceofCoronaryArteryDisease"),包括陣歹U重現(xiàn)性和標準曲線。隨后用局部視窗工作站(localWindowsworkstation)分析原始數(shù)值數(shù)據(jù)并其遷移到專用于微陣列數(shù)據(jù)分析的奧雷克爾關(guān)系型數(shù)據(jù)庫(Omclerelationaldatabase)。出于技術(shù)原因,RANTES和IL-8不包括在后續(xù)分析中。RANTES標準曲線不是S形,因此不具有計算濃度的線性部分。在病例和對照樣品中,大多數(shù)IL-8值在標準曲線界限之外。統(tǒng)^"學(xué)分橋用曼-惠特尼的U檢驗(連續(xù)變量)和卡方檢驗(名義變量采)測定兩組之間的臨床特征差異。用蒙特卡洛方法計算顯著性水平。在對U檢驗和5C檢驗所示組件分布不均衡的臨床變量進行調(diào)整之前和之后進行通用線性模型(GLM)多變量分析來鑒定病例和對照之間的趨化因子差異。用接受器工作特性(ROC)曲線檢驗趨化因子的診斷性能。采用12對數(shù)回歸(LR)分析來驗證趨化因子數(shù)值是否可區(qū)分病例和對照。在雙變量分析中兩組之間差別顯著的年齡、性別和臨床變量也納入這些模型作為獨立變量。由于兩組之間在用藥(常規(guī)CAD處方藥,例如ACE-抑制劑和他汀類藥物)方面的差異會在模型中引入假的疾病預(yù)測符,我們決定從分析中排成關(guān)于藥物治療的所有信息。構(gòu)建了三種LR模型應(yīng)對以下問題獨立變量的數(shù)量相對升髙,存在缺失值(8位對象中約10個值)和趨化因子濃度之間的共線性。對變量(采納概率(entryprobability)為0.05;排除概率(removalprobability)為0.15)進行兩次前向逐步選擇不進行缺失數(shù)據(jù)估算和采用條件均值進行缺失數(shù)據(jù)估算。專用于解決共線性問題的第三LR模型包括連同臨床變量的趨化因子評分。評分計算包括在一個l-10級別標度(根據(jù)十分位數(shù))上對各趨化因子濃度進行重新編碼,然后求得各測得趨化因子的平均級數(shù)。關(guān)于檢驗、模型構(gòu)建和缺失數(shù)據(jù)估算的詳盡描述可在線查閱以作補充。采用基于視窗系統(tǒng)的SPSS統(tǒng)計學(xué)軟件(12.0版)(SPSS公司(SPSSInc.),芝加哥,伊利諾斯州)進行U和5C2檢驗、GLM、ROC禾QLR。為總覽數(shù)據(jù)結(jié)構(gòu),我們進行了兩維層次聚類法分析(2D-HC)。利用開源軟件Tmev,3.0版(TM4套件,遺傳學(xué)研究院(TheInstituteforGenomicResearch),羅克維爾,馬里蘭州)"構(gòu)建2D-HC。分析中用完全連鎖和皮爾遜相關(guān)性作為距離指標。為測定我們的數(shù)據(jù)中最大方差的方向,我們采用依據(jù)log2的主成分分析(PCA)。節(jié)織體敘嫉微吝誠..曾有關(guān)于蛋白質(zhì)選擇和分類算法的記載(Tabibiazar2005PhysiolGenomics.2005年7月14日;22(2):213-26),納入作為參考)。簡言之,在有監(jiān)督的分析中,我們用多種分類算法根據(jù)基因區(qū)分病例和對照的效用對其進行排名。該項分析所用的算法包括支持向量機(SVM)"和遞歸特征排除(RFE)",RFE是SVM的遞歸算法,其中,反復(fù)進行變量排名并且每次除去固定比例的最低分者16。用SVM-RFE確定能以最低誤差率將各實驗正確歸類的最佳數(shù)量的排名基因。通過1000次遞歸交叉驗證計算最佳出錯率或分類誤差,其中25%的實驗用作測試組,其余的用作訓(xùn)練組。作為SVM結(jié)果的內(nèi)部驗證,我們還采用了以下監(jiān)督分類算法分類和回歸樹(CART)、線性辨別分析(LDA)和對數(shù)回歸(見本章前述)。CART是一種采用一系列"如果-則(if-then)"二叉邏輯條件的的靈活的層次分類系統(tǒng),該系統(tǒng)允許對結(jié)果的個性化(individualization)程度和分類誤差的比例成本(proportionalcost)進行設(shè)定。為獲得高準確率的分類,我們設(shè)定終端節(jié)點(terminalnode)僅包含純粹亞組或不超過5個對象。先驗信息(prioriinformation)包括兩種類別大小相等且分類誤差成本(misclassificationcost)相等。通過多次隨機置換10%的對象來交叉驗證結(jié)果。結(jié)果靡離床錄C如圖5所示,病例組和對照組在體現(xiàn)已確知為CAD風(fēng)險因素的諸多重要特征上有差異。病例對象的胰島素耐受表型更明顯,血漿胰島素濃度更高,BMI略高(雖然不明顯),腰圍更大和血脂異常比例更高。然而,在兩組之間的血液葡萄糖水平和糖尿病比例相僅。患者的血壓,不論是收縮壓還是舒張壓都明顯低于對照,盡管有更常見的高血壓病史。該事實至少可部分揭示為多用抗高血壓藥物(96.7%比之43.2%)和次級預(yù)防性處方藥例如ACE-抑制劑、卩阻斷劑、他汀類藥物和阿司匹林等所致。而且,雖然CAD患者的一級親屬中冠狀動脈疾病比例高于對照,但兩組間的糖尿病、血脂異常、高血壓和中風(fēng)的家族史沒有明顯不同。有意思的是,雖然兩組在血管和代謝表型上有明顯差異,但CRP濃度沒有可檢測的差異。瘋靜詹麵飾記雖然兩組之間的CRP沒有差異,但多變量GLM風(fēng)險顯示病例組的其它循環(huán)炎性標記高于對照(圖6),即使在就臨床變量和藥物治療進行調(diào)整后亦是如此。比較病例與對照的無監(jiān)督數(shù)據(jù)分析鑒于CAD患者中炎性標記的水平升高,我們研究了利用這些信息通過無監(jiān)督分析將患者準確分類的可行性。兩維層次聚類法表明CAD患者和對照患者傾向于形成大型同質(zhì)集群,雖然有個別病例和對照維持在這些大型集群之外群體外(圖7)。對于被測變量,臨床參數(shù)集中為一組,趨化因子則形成另一組。有意思的是,CRP水平與代謝參數(shù)的關(guān)聯(lián)度高于趨化因子水平。主成分分析發(fā)現(xiàn),在對象中觀察到差異有60-70%可解釋為趨化因子、胰島素耐受性和部分其它臨床變量(例如高血壓和高脂血癥)所致,其中,炎癥標記是主要因素(圖8)。^^眾茵f獰^"浙游床變量遂/f瘋激浙應(yīng)街汰吝游分類為確定能準確區(qū)分病例對象和對照對象的最佳、最小變量組,我們采用了SVM分類算法(Tabibiazar2005PhysiolGenomics.2005年7月14日;22(2):213-26)。SVM鑒定了能高度準確區(qū)分不同程度對象的一組15個變量(分類誤差率<10%)(圖9)。除了已知的CAD風(fēng)險因素外,檢測循環(huán)趨化因子明顯加強了疾病預(yù)測。為驗證我們的發(fā)現(xiàn),我們采用了多種其它分類算法,結(jié)果,對于預(yù)測CAD:LR(80%靈敏度,88%特異性)、LDA(73%,94%)和CART(80%,88%)表現(xiàn)出了相當(dāng)?shù)母咚届`敏度和特異性。麗蕭標記改夢7T裙嚴/緣體遂療游分類用ROC曲線進一步評估了單一變量和多個變量區(qū)分病例對象和對照對象的分類能力。在趨化因子中,MCP-4看來是最靈敏的,MCP-1是特異性最強的,二者均顯示良好的準確率(AUC分別是0.896和0.849)(圖10A)。應(yīng)該注意的是,CRP似乎無助于在流行病學(xué)范疇以外鑒定疾病,而血管炎癥的特異性標記則更準確。圖11顯示了三種對數(shù)回歸分析的結(jié)果,其中,趨化因子或者通過分步選擇(模型1和2)引入,或著作為組合分值(模型3)引入。在CAD患者中,三種模型中有兩種的總準確率超過90%,這支持了這一推測使用多種標記區(qū)分ASCVD患者能提供更多信息。LR模型的分類性能與最佳趨化因子,MCP-1和-4(的曲線)的比較是對該假設(shè)的進一步證明(圖IOB)。顯然,采用多標記算法明顯能更好地預(yù)計是否存在疾病。討論需要診斷和治療臨床前ASCVD的更好的工具。目前,雖然對動脈粥樣硬化的機制和情況的了解越來越多,但我們?nèi)匀鄙儆糜阼b定高風(fēng)險患者并預(yù)測預(yù)防方案之效果的方法。越來越多證據(jù)暗示血管炎癥是動脈粥樣硬化各階段中主要的病理生理學(xué)過程5,并且,已就炎性標記用于診斷的可能性進行了數(shù)項研究17。雖然目前的炎癥通用標記被認為可能可用于評定風(fēng)險級別,它們不足以在普通人群中鑒定CAD18。這些標記缺乏特異性的原因可能在于它們不是血管衍生標記,并且可能是指示各種器官中的炎癥的信號。個體對環(huán)境風(fēng)險因素的反應(yīng)不一致性也可能導(dǎo)致了ASCVD標記濃度的高度不同。在這點上,一種炎性蛋白所攜帶的生物學(xué)信息可能不足以全面表征血管炎性狀態(tài),因而可能無法準確鑒定是疾病的存在及程度。相比之下,采用多種炎性標記特征的多維方法可提供動脈粥樣硬化相關(guān)血管炎癥的病征簽名。本發(fā)明的研究用實驗支持了這一假設(shè)并提示用多種炎性標記可有效鑒定患冠狀動脈心臟病的患者。由于血管炎癥是動脈粥樣硬化的病理生理學(xué)基礎(chǔ),動脈粥樣硬化血管中產(chǎn)生的趨化因子是CAD標記的主要候選者。趨化因子是白細胞和內(nèi)皮細胞被活化時產(chǎn)生的一群可構(gòu)成網(wǎng)絡(luò)架構(gòu)的趨化蛋白質(zhì)19。它們的主要作用是使白細胞在組織中累積并活化,它們與幾種細胞受體的相互作用參與形成炎性滲透的特異性2Q'21。趨化因子常成組存在,各組的組成不同,這種趨化因子組的生物學(xué)效應(yīng)與單個因子的生物學(xué)效應(yīng)可能極其不同,因此,測定細胞因子和趨化因子表達的總體模式比單一蛋白質(zhì)試驗更可能獲得有意義的生物學(xué)信息。我們的數(shù)據(jù)清楚地顯示臨床CAD個體中數(shù)種趨化因子血漿濃度的調(diào)變不同于健康對照,即使在就己知臨床變量進行調(diào)整后亦是如此。因此,結(jié)合這些標記的多變量模型能準確區(qū)分這兩組的樣品。據(jù)假設(shè),采用多種分析物的預(yù)測模型遠比采用一種炎性蛋白質(zhì)的模型準確。這些結(jié)果得到了多種不同算法多變量統(tǒng)計學(xué)分析的驗證,不同算法的的結(jié)果高度一致。各模型的一致性以及不同試驗所得結(jié)果的重現(xiàn)性提示趨化因子特征提供了血管疾病的強烈信號。盡管隊列的規(guī)模較小并且患者正接受所有可能的治療,但這些結(jié)果仍然具有非常顯著的意義。在我們的數(shù)據(jù)中,盡管血管和代謝表型明顯不同,但在病例和對照之間未觀察到CRP水平有明顯不同。這可能是因為樣品規(guī)模較小,并且,使用降CRP藥物(例如他汀類藥物和阿司匹林)較多的緣故。然而,雖然經(jīng)治療,但有心肌梗塞病史的個體患冠狀動脈疾病的風(fēng)險依舊高于沒有CAD病史的人22。而且,CRP的主要臨床用途被認為是在經(jīng)典風(fēng)險因素不確定時更準確地區(qū)分個體,但對該提法依然有爭議23。雖然治療期間CRP水平降低可用作治療反應(yīng)指數(shù)89,但在我們的橫斷面研究中,CRP提供的信息不比其它臨床變量多。我們的研究存在一些局限性。病例對象的血清樣品是在急癥之后(7周-20周,中值為3.4個月)采集的。雖然炎性標記通常會在4-8周內(nèi)回復(fù)至基線水平,我們不能排除急癥導(dǎo)致炎性標記水平改變的可能性。我們的研究設(shè)計也未確認蛋白質(zhì)組學(xué)特征用于區(qū)分病例和對照的的預(yù)后價值,雖然在我們所鑒定的蛋白質(zhì)組學(xué)特征可能的確具有預(yù)測原發(fā)(primary)或繼發(fā)(secondary)事件的預(yù)后價值。我們的生物標記組明顯不是完全清單。實際上,利用更多分析物的陣列有望提高診斷ASCVD的靈敏度和特異性。然而,本發(fā)明的初步研究證明了利用蛋白質(zhì)微陣列同時監(jiān)測多種生物標記的可行性。總之,我們己鑒定了循環(huán)血清炎性標記組,它們的獨特簽名能準確區(qū)分CAD患者和對照。后文實施例5報道了驗證該方法的大規(guī)模研究。參考文獻1.NHLBImorbidityandmortalitychartbook,2002.貝塞斯達,馬里蘭州國家心臟、肺和血液研究院,2002年5約;2002.2.NHLBIfactbook,fiscalyear2003.貝塞斯達,馬里蘭州國家心臟、月巿和血液研究院,2004年2月;2003:35-53.3.KannelWB,SchatzkinA.Suddendeath:lessonsfromsubsetsinpopulationstudies.JAmCollCardiol.1985年1月;5(6增刊):141B-149B.4.KannelWB,McGeeDL.Epidemiologyofsuddendeath:insightsfromtheFraminghamStudy.CardiovascClin.1985;15(3):93-105.5.RossR.Atherosclerosis—aninflammatorydisease.NEnglJMed.1999年1月14日;340(2):115-126.6.GlassCK,WitztumJL.Atherosclerosis,theroadahead.Cell.2001年2月23日;104(4):503-516.7.LibbyP.Inflammationinatherosclerosis.Nature.2002年12月19-26日;420(6917):868陽874.8.RifaiN,RidkerPM.Inflammatorymarkersandcoronaryheartdisease.CurrOpinLipidol.2002年8月;13(4):383-389.9.RidkerPM,CannonCP,MorrowD等,C-reactiveproteinlevelsandoutcomesafterstatintherapy.NEnglJMed.2005年1月6日;352(1):20-28.10.參見生產(chǎn)商的信息(Whatman;S&S公司(Schleicher&Schuell)).11.參見生產(chǎn)商的信息(Whatman;S&S公司).12.ZweigMH,CampbellG.Receiver-operatingcharacteristic(ROC)plots:afundamentalevaluationtoolinclinicalmedicine.ClinChem.1993年4月;39(4):561-577.13.SaeedAI,SharovV,WhiteJ等,TM4:afree,open-sourcesystemformicroarraydatamanagementandanalysis.Biotechniques.2003年2月;34(2):374-378.14.BurgesCJC.Atutorialonsupportvectormachinesforpatternrecognition.DataMiningandKnowledgeDiscovery.1998;2(2):121-167.15.GuyonI,WestonJ,BarnhillS等,Geneselectionforcancerclassificationusingsupportvectormachines.MachineLearning.2002;46(l/3):389.16.RamaswamyS,TamayoP,RifkinR等,Multiclasscancerdiagnosisusingtumorgeneexpressionsignatures.ProcNatlAcadSciUSA.2001年12月18日;98(26):15149-15154.17.RidkerPM,BrownNJ,VaughanDE等,Establishedandemergingplasmabiomarkersinthepredictionoffirstatherothromboticevents.Circulation.2004年1月29日;109(25增刊1):IV6-19.18.PearsonTA,MensahGA,AlexanderRW等,Markersofinflammationandcardiovasculardisease:applicationtoclinicalandpublichealthpractice:AstatementforhealthcareprofessionalsfromtheCentersforDiseaseControlandPreventionandtheAmericanHeartAssociation.Circulation.2003年1月28曰;107(3):499-511.19.CharoIF,TaubmanMB.Chemokinesinthepathogenesisofvasculardisease.CircRes.2004年10月29日;95(9):858扁866.20.SallustoF,MackayCR,LanzavecchiaA.SelectiveexpressionoftheeotaxinreceptorCCR3byhumanThelper2cells.Science.1997年9月26日;277(5334):2005-2007.21.LusterAD.Chemokines—chemotacticcytokinesthatmediateinflammation.NEnglJMed.1998年2月12日;338(7):436-445.22.ThirdReportoftheNationalCholesterolEducationProgram(NCEP)ExpertPanelonDetection,Evaluation,andTreatmentofHighBloodCholesterolinAdults66(AdultTreatmentPanelIII)finalreport.Circulation.2002年12月17日;106(25):3143-3421.23.LevinsonSS.Briefreviewandcriticalexaminationoftheuseofhs隱CRPforcardiacriskassessmentwiththeconclusionthatitisprematuretousethistest.ClinChimActa.2005年1月;356(1-2):1-8.24.TabibiazarR,WagnerRA,AshleyEA,KingJY,FerraraR,SpinJM,SananDA,NarasimhanB,TibshiraniR,TsaoPS,EfronB,QuertermousT.Signaturepatternsofgeneexpressioninmouseatherosclerosisandtheircorrelationtohumancoronarydisease.PhysiolGenomics.2005年7月14日;22(2):213-26。實施例4:用于準確分類冠狀動脈疾病的炎性標記的數(shù)據(jù)分析用購得的施萊歇爾和舒爾人趨化因子芯片進行研究。我們使用該陣列評估了選自雷諾茲中心(ReynoldsCenter)隊列的100份樣品中的循環(huán)趨化因子水平。所檢測的趨化因子是MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IL-8、RANTES、MIP-la和IP-10,雖然IL8和RANTES值落在線性范圍之外。通過對雷諾茲隊列中選定SNP的重新測序和基因分型對廣泛研究了編碼MCP-1、MCP-2、MCP-3、嗜酸細胞活化趨化因子、IL-8和RANTES的遺傳基因座。循環(huán)樣品來自有心肌梗塞病史的50位個體和50位年齡匹配的對照(參見前文隊列描述)。雖然對照在其它變量上不匹配,但性別和種族及其它變量的聯(lián)合分布是相似的。陣列與生產(chǎn)商提供的試劑雜交、清洗,并用艾克松(Axon)掃描儀掃描,用S&S公司專有軟件(陣列視TM夸特⑧(ArrayVisionTMQu肌t,進行特征提取。用該陣列所包括的試劑產(chǎn)生標準曲線,測定各份循環(huán)樣品的濃度。分析采用新方法,但延用以下主張的基礎(chǔ)前提條件是臨床和基因分型數(shù)據(jù)的納入能增加生物標記數(shù)據(jù)的信息,用于就與疾病狀態(tài)/活性無關(guān)的個體間趨化因子水平差異進行標準化。通過測定具有這些匹配數(shù)據(jù)的趨化因子豐度、臨床數(shù)據(jù)和各SNP的基因分型信息進行分析。區(qū)分病例和對照以及發(fā)現(xiàn)能用于區(qū)分的那些變量是雙類別(two-class)"分類"的基本問題。雖然單個分類符可能也行,但在它們中進行"公投"(vote)通常更好。實際上,在分類符中進行"公投"的方法十分常見,其中兩種是"打包法(bagging)"和"補強法(boosting)"。我們在分析之初只用4種分類符,就每一個受試者在它們中進行簡單公投。采用交叉驗證的標準方法例如5-倍交叉驗證來評估預(yù)期性能。因此,將數(shù)據(jù)組隨機分成大小幾乎相等的5個亞組。依次地,每一次驗證在80%的數(shù)據(jù)上展開(并進行次間公投),取20%的數(shù)據(jù)計算結(jié)果。然后計算五組結(jié)果的平均值。也可使用更完備的樣品再用方法來評估預(yù)期準確率。對99位對象的初步樣品進行了所述分析。變量包括嗜酸細胞活化趨化因子、IP-IO、MCP-1、MCP-2、MCP-4、MIPla、性別、年齡、葡萄糖、胰島素、CRP和脂肪(FAT)。測定變量FAT作為BMI和腰圍(WAIST)的首要組分,以線性方式造成后文兩預(yù)測符91%的差異。共有51例MI和48位對照。我們用經(jīng)驗值(empiricalpriors)來預(yù)測雙類別問題的貝葉斯分類規(guī)則;這樣,它們幾乎是每類0.5。將分類誤差成本取作相等。(當(dāng)然,對于雙類別問題,只有先驗概率乘積與分類誤差成本的比值才是重要的。在這里,該比值約為1。)年齡為60歲-72歲,其中,下端的權(quán)重高于上端。平均值是64.7歲,第25、50和75區(qū)間百分位數(shù)分別是62、64、67;年齡的標準偏差是3.1。在以下實施例中,LDA指費希爾線性辨別分析。下文描述了稱為CART、FlexTree和LART的方法。對于LART技術(shù),首先用簡單的拉索法減少預(yù)測符的數(shù)量。如何進行分類的詳見下文。FlexTree和LART中的一個重要細節(jié)是回歸系數(shù)的霍特林丁2分選量,這對于它們的預(yù)測能力很重要。由分類移交的權(quán)重用于LART加權(quán)拉索(方法)。表3.經(jīng)5倍交叉驗證的性能<table>tableseeoriginaldocumentpage68</column></row><table>表4.所述方法鑒定的變量<table>tableseeoriginaldocumentpage68</column></row><table>進一步分析結(jié)合了所述預(yù)測符,還有前述99位對象的SNP基因型信息。分類誤差的5-倍交叉驗證百分比降低至10%,而靈敏度提高至85%,特異性提高至92%。在該項分析中,采用簡單的拉索法來縮小所包括的SNP數(shù)目。并且,用某基因內(nèi)SNP信息的CART來估算所有缺失的SNP值??傊?,這些分析強有力地明顯支持了本文所述的發(fā)明。盡管只評估了少量分析物和臨床變量,但通過多種方法獲得了相當(dāng)好的分類結(jié)果。所有方法均對循環(huán)趨化因子檢測值進行了選擇,不同方法之間有重疊,其中,MIPloc、MCP-4和嗜酸細胞活化趨化因子在多種算法中非常突出。這些分析提示基因分型數(shù)據(jù)可能提供更多的有用信息。目前作為動脈粥樣硬化性疾病標準診斷方法的高靈敏度CRP在這些分析中沒有用處,這提示多種疾病相關(guān)炎性標記的水平可能提供明顯優(yōu)于現(xiàn)有預(yù)測符的改進。我們通過聚類法(無監(jiān)督的學(xué)習(xí))總結(jié)了多項特征和各參數(shù)的聯(lián)合分布。在我們的層次聚類法方法中(圖6),列是個體(變量),行是特征。在該算法中,各列各行逐次類聚,目的是產(chǎn)生"相近"的特征組和樣品組??醋兞康念惥?,非常有意思的是,趨化因子MCP-2、MIPl-a、MCP-1、IP-IO、嗜酸細胞活化趨化因子和MCP-4緊密群集在一起??崭挂葝u素水平、FAT(BMI和腹圍的首要成分)和葡萄糖這些代謝變量也群集在一起,這符合考慮到這些變量在葡萄糖代謝和胰島素耐受中彼此關(guān)聯(lián)所做的預(yù)期。未發(fā)現(xiàn)性別和年齡接近任一上述集群,二者保持獨立。令人感興趣的是,hsCRP未與趨化因子類聚而與代謝變量類聚,表明hsCRP水平與血管炎癥的關(guān)聯(lián)度不及多趨化因子簽名。如同期望,樣品集群在類別成員上是不一致的。這些分析表明,無監(jiān)督的學(xué)習(xí)(聚類)不足以進行有監(jiān)督的學(xué)習(xí)(分類)。根據(jù)迄今所得結(jié)果,如果要進行準確分類,必需有這樣的分類分案該分案不僅根據(jù)特征而且根據(jù)結(jié)果(可預(yù)示純以特征為依據(jù)對后續(xù)觀察結(jié)果所做的分類)進行組別分類。實施例5:1330位患者的大型臨床試驗準確預(yù)測和診斷動脈粥樣硬化性心血管疾病和血管炎癥的循環(huán)生物標記的簽名驗證多標記特征的大型臨床試驗的血清生物標記數(shù)據(jù)受到前期臨床試驗結(jié)果的鼓舞,我們檢驗了多標記特征是否能在更大的試驗中得到驗證以及它們是否可用作人類動脈粥樣硬化性疾病的高度靈敏、高特異性標記。為此,我們采用包括400例臨床顯著ASCVD和930位對照的大型臨床流行病學(xué)研究。該項研究的目標是檢驗動脈粥樣硬化的風(fēng)險因素和新的其它決定因素。用蛋白質(zhì)微陣列將報名時收集的血清樣品用于同時檢測多種炎性標記。此處采用前期研究所用的精確法(exactmethod)(詳見前述實施例)。一亞組分析物的濃度病例中明顯較高。用這些標記的血清表達特征,分類算法根據(jù)與對照的比較對CAD病例進行了準確的分級。此外,由生物標記形成的簽名明顯提高了其它已知CAD標記的預(yù)測能力。該較大試驗不僅驗證了我們先前的發(fā)現(xiàn),還為使用多標記方法來準確預(yù)測和診斷動脈粥樣硬化性心血管疾病及其各種臨床后遺癥提供了更多實例。預(yù)測動脈粥樣硬化性疾病選擇髙信息含量的標記選擇多個高信息含量標記來構(gòu)建分類模型需要限定性能指標和用戶定義的閾值,從而能根據(jù)該指標構(gòu)成具有實用預(yù)測能力的模型。后文中,我們將目標量值(targetquantity)定為"曲線下面積"(AUC),預(yù)測的靈敏度和/或特異性以及預(yù)測模型的總準確率?,F(xiàn)在開始描述選擇構(gòu)建預(yù)測模型的項數(shù)的一種方法。在該實施方式中,我們描述了在沒有任何臨床變量和/或調(diào)節(jié)因子存在下選擇標記的方法。該方法如下所述我們首先將我們的訓(xùn)練數(shù)據(jù)隨機分成10組,各組包括"健康"或"患病"的對象,各自與它們在全體樣品中的數(shù)量成正比。各對象用其24種標記的檢測值和疾病狀態(tài)標簽(無標簽表示"健康",有標簽則為"患病")。我們選擇9組,就24種標記中的每一種(MCP-1、IGF隱1、TNFa、IL-5、M-CSF、MCP-2、IPIO、MCP隱4、IL-3、IFNy、Ang-2、IL-7、IL-IO、嗜酸細胞活化趨化因子、IL-2、IL-4、ICAM-1、IL-6、IL-12p40、MIPla、IL-5、MCP-3、IL13、ILlb)用給定的算法(例如線性辨別分析、二次方程辨別分析、對數(shù)回歸等)用9組的所有數(shù)據(jù)訓(xùn)練模型(即,我們創(chuàng)建了一訓(xùn)練亞組)。然后我們將該模型應(yīng)用于沒有參加訓(xùn)練的第10組,我們對檢測誤差"e"和或許多上述預(yù)測質(zhì)量指標值(qualitymeasure)進行了估算。我們重復(fù)以上過程10次,每次隨機取樣9組來產(chǎn)生訓(xùn)練樣本并用第10組來估算檢驗誤差"e"和預(yù)測質(zhì)量指標值。然后,我們用這10份數(shù)據(jù)構(gòu)成的樣本估算各質(zhì)量指標值和/或誤差以及我們估算值方差的預(yù)期值。已知這些數(shù)值后,將能提高模型的平均預(yù)測能力的標記選作模型的第一項。我們可改用另一改善指標來替代預(yù)測質(zhì)量指標平均值,例如,我們可改選預(yù)期質(zhì)量指標值與其方差估算值的比值最高的項目。將第一項加入該模型后,我們對在當(dāng)前選擇步驟中未被中選的其余標記重復(fù)上述過程。這樣,在第二步驟中,我們對其余標記重復(fù)上述計算。通過選擇最能提高我們的目標預(yù)測質(zhì)量指標值的選項,或用當(dāng)前模型預(yù)期值的某種組合減去新模型的值并就那些指標的誤差標準化,來選擇第二模型項。圖12顯示了將該方法應(yīng)用于一組1300個對象的結(jié)果。我們選擇AUC>0.75為閾值作為我們的目標預(yù)測質(zhì)量指標,我們用線性辨別分析模型選擇項目。使用以下標記MCP-1滿足質(zhì)量閾值。圖13顯示了用對數(shù)回歸模型選擇項目的結(jié)果,其中,診斷樣品(discoverysample)和質(zhì)量閾值不變。與之前的實施例比較發(fā)現(xiàn),兩種模型只有頭兩項相同(MCP-1、IGF-1),第三項不同(TNFa比之M-CSF)。因此,我們可采用多種標記和多種預(yù)測模型的組合,這將超越我們的質(zhì)量閾值。為證實我們能替換標記而仍然滿足某預(yù)測質(zhì)量指標的要求,我們從用于選擇的可用標記組合中除去標記MCP-1并重復(fù)以上方法。圖14給出使用LDA模型和前述1300位對象所得的結(jié)果。新的一組兩種標記包括Ang-2、IGF-1,這兩種二標記能提供AUC〉0.75的模型。作為不同選擇標準的實例,我們提供了采用AIC標準在對數(shù)模型框架內(nèi)獲得的結(jié)果。該標準通常用于選擇對數(shù)回歸模型的最佳項數(shù)。該標準平衡了因除去某項導(dǎo)致的誤差增加與自由度降低(失去了原由該相為模型提供的自由度)。減項過程通常始于完整模型,終止于某項的除去導(dǎo)致AIC值升高之時。圖15a示出了減項結(jié)果與AIC標準的函數(shù)關(guān)系(所示減項過程超過了最佳點)。圖15b顯示了一模型隨項數(shù)增加的AUC預(yù)測情況。按照從完整模型即包含所有24種標記的模型中減項(主要按AIC標準選擇項目)相反的順序在上述模型中加入項。后一方法(減項)利用至少一種標記(MCP-1)產(chǎn)生了一個預(yù)計AUC>0.75的對數(shù)回歸模型??刹捎们跋蜻x擇(本實施例中的第一、第二和第三例)或反向選擇(本實施例中的第四例)或前向/反向選擇方案完成項目選擇。該方案能檢驗所有在前一步驟中從當(dāng)前縮減模型中除去的項。相同的選擇方法可拓展為同時包括標記和臨床變量。后面的兩幅圖顯示了以下情況的結(jié)果對數(shù)回歸模型的候選變量在全部16種標記之外還包括"高脂血癥"(DC912)和"索引日(indexday)之前的160天內(nèi)使用過降脂藥物"(圖16)或"使用他汀類藥物"、"使用ACE阻斷劑"(圖17)。這些實施例表明,可用組中的臨床變量替換獲得AUC>0.75所需的至少3標記組中的標記。高脂血癥(DC912)和MCP-4組合所獲得模型的AUC預(yù)期值約為0.85。采用上述方法,我們還能選定了無需使用所有標記來優(yōu)化模型性的標記數(shù)目。確定最佳項數(shù)的一種方法是選擇能獲得具有如下所述平均預(yù)測能力(以AUC檢測,或相當(dāng)?shù)撵`敏度/特異性指標)的模型的項數(shù),所述平均預(yù)測能力與各種組合和各種數(shù)量的給定算法所得最高值相差不超過1個標準偏差。再看圖17,包括以下標記的對數(shù)回歸模型滿足了這些要求DC512、DC3005、MCP-4、IGF-1、M-CSF、IL-5、MCP-2、IP-IO。實施例6:ACE抑制劑反應(yīng)預(yù)測模型采用實施例5所述的方法,我們用對數(shù)回歸或線性辨別分析建立了能根據(jù)ACE抑制劑實用情況分類樣品的模型。按照對象狀態(tài)(對照或病例)調(diào)整這些模型,因為標記的總水平取決于我們的試驗對象是否健康。這些模型可用于多種方法,例如篩選化合物來鑒定可用作ACE抑制劑或作用于會聚性途徑(convergentpathway)的其它物質(zhì)以及監(jiān)測ACE抑制劑的療效。在第一個實施例中,將所述化合物給予哺乳動物對象,采集所述對象的一份或多份樣品,獲得一份或多份樣品的數(shù)據(jù)集。這些數(shù)據(jù)集經(jīng)ACE抑制劑反應(yīng)預(yù)測模型處理,用所得結(jié)果來分類樣品。如果樣品分類為來自ACE抑制劑用藥者,則該化合物可能是推定ACE抑制劑。在第二個實施例中,獲得對象的一份或多份樣品,由那些樣品所得的數(shù)據(jù)集經(jīng)ACE抑制劑反應(yīng)預(yù)測模型處理。如果樣品分類為來自ACE抑制劑用藥者,則治療可能有效。如果隨時間多次取樣顯示從該模型獲得的預(yù)測符值有時間依賴性改變,則藥物治療的療效可能正在改變,預(yù)測符值趨近于用藥分類指標還是趨近于非用藥分類指標指示著療效改變的方向。示例性模型所用的蛋白質(zhì)標記連同模型的性能特征見下表5和6。表5.ACE抑制劑預(yù)測模型1對數(shù)回歸所用的變量分類誤AUC靈敏度特異性準確率差MCP-1、IGF-1、TNFa、MCP-2、0.3650.6880.6410.6320.635IPIO、IL-5、M-CSF、MCP隱4、MCP國3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子表6.ACE抑制劑預(yù)測模型2線性辨別分析所用的變量分類誤AUC靈敏度特異性準確率差MCP-l、IGF隱l、TNFa、MCP-2、0.3760.6890.6320.6200.624IPIO、IL-5、M-CSF、MCP-4、MCP國3、IL-3、Ang-2、IL國7、嗜酸細胞活化趨化因子實施例7:ACE抑制劑或他汀類藥物使用情況預(yù)測模型采用實施例5所述的方法,我們用對數(shù)回歸或線性辨別分析建立了能根據(jù)ACE抑制劑或他汀類藥物實用情況分類樣品的模型。按照對象狀態(tài)(對照或病例)調(diào)整這些模型,因為標記的總水平取決于我們的試驗對象是否健康。這些模型可用于多種方法,例如篩選化合物來鑒定可用作ACE抑制劑或他汀類藥物或作用于收縮途徑的其它物質(zhì)以及監(jiān)測ACE抑制劑或他汀類藥物的療效。在第一個實施例中,將所述化合物給予哺乳動物對象,采集所述對象的一份或多份樣品,獲得一份或多份樣品的數(shù)據(jù)集。這些數(shù)據(jù)集經(jīng)ACE抑制劑或他汀類藥物使用情況預(yù)測模型處理,利用所得結(jié)果來分類樣品。如果樣品分類為來自ACE抑制劑或他汀類藥物用藥者,則化合物可能是推定的ACE抑制劑或他汀類藥物。在第二個實施例中,獲得對象的一份或多份樣品,由那些樣品所得的數(shù)據(jù)集經(jīng)ACE抑制劑或他汀類藥物使用情況預(yù)測模型處理。如果樣品分類為來自ACE抑制劑或他汀類藥物用藥者,則治療可能有效。如果隨時間多次取樣顯示從該模型獲得的預(yù)測符值有時間依賴性改變,則藥物治療的療效可能正在改變,預(yù)測符值趨近于用藥分類指標還是趨近于非用藥分類指標指示著療效改變的方向。示例性模型所用的蛋白質(zhì)標記連同模型的性能特征見下表7和8。藥物應(yīng)用反應(yīng)的生物標記分布我們的研究表明,標記組可用于監(jiān)測藥物對炎癥水平的作用。檢查多個標記(IL-2、IL-5、IL-4)的數(shù)值分布,我們證明劑量作用是對照接受藥物治療數(shù)量的函數(shù)(即,無藥物治療比之一種藥物治療或兩種藥物)。作為該方案的一個實例,我們用3種藥物反應(yīng)性標記作為一組(IL-2、IL-4和IL-5)。為產(chǎn)生單一組合評分(singlecombinedscore),我們建立了線性辨別分析模型,其中,反應(yīng)變量取以下值"未治療的"、"ACE或他汀類藥物"、"ACE和他汀類藥物",并且,我們將第一辨別變量用作組合評分的替代品。圖18顯示了被認為"健康"("對照")的對象的結(jié)果,所示為三個"治療"組各自的箱線圖。各箱線圖的灰色部分從各類別的數(shù)值分布的第一分位數(shù)延伸到第三分位數(shù)。為有助于目測觀察類別之間中值水平的差異,在中值附近加了"凹口"。弓l線(whisker)的延伸長度為分位數(shù)間距(interquantiledistance)的1.5倍。該圖中未包括溢出值。組合評分明顯隨藥物數(shù)目增加而顯示下降趨勢。各組的凹口幾乎不重疊這一事實表明中值的差異非常顯著。生物標記組的表現(xiàn)優(yōu)于單用一種生物標記??刹捎没籼亓謋方法獲得多種標記的單一評分,由此進行相似的分析。此時,我們能根據(jù)霍特林公式估算未治療組數(shù)據(jù)的協(xié)方差矩陣,計算各對象的"距離"。這后一方法不僅可用于建立許多標記的"組合距離(combineddistance)"來監(jiān)測藥物劑量效應(yīng),還可用于對劑量效應(yīng)作推定性檢驗。(參見納入本文作為參考的Hotelling,H.(1947).MultivariateQualityControl.刊于C.Eisenhart,M.W.Hastay禾口W.A.WalHs編,rec/zm々weso/Sto"W/ca/v4wa/,/s.紐約麥克勞-希爾公司(McGraw-Hill.))。表7.ACE抑制劑或他汀類藥物預(yù)測模型1對數(shù)回歸<table>tableseeoriginaldocumentpage74</column></row><table>表8.ACE抑制劑或他汀類藥物預(yù)測模型2線性辨別分析<table>tableseeoriginaldocumentpage74</column></row><table>實施例8:冠狀動脈鈣化度預(yù)測模型采用實施例5所述的方法,我們用對數(shù)回歸或線性辨別分析建立了能根據(jù)預(yù)測的冠狀動脈鈣化度分類樣品的模型。示例性模型所用的蛋白質(zhì)標記連同模型的性能特征見下表9和10。表9.冠狀動脈鈣化度預(yù)測模型1對數(shù)回歸-萬用的變量分類誤AUC'靈敏度特異性準確率差MCP-l、IGF-l、TNFa、MCP陽2、0.4700.5360.5670.5000.530IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子表10.冠狀動脈鈣化度預(yù)測模型2線性辨別分析所用的變量分類誤差MCP匿l、IGF-l、TNFa、MCP-2、0.461IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL匿3、Ang隱2、IL-7、嗜酸細胞活化趨化因子實施例9:穩(wěn)定與不穩(wěn)定動脈粥樣硬化性疾病預(yù)測模型采用實施例5所述的方法,我們用對數(shù)回歸或線性辨別分析建立能將樣品分類為穩(wěn)定(即心絞痛)類或不穩(wěn)定(即心肌梗塞)類的模型。示例性模型所用的蛋白質(zhì)標記連同模型的性能特征見下表11和12。表11.穩(wěn)定與不穩(wěn)定疾病預(yù)測模型1對數(shù)回歸所用的變量分類誤AUC靈敏度特異性準確率差MCP-l、IGF-l、TNFa、MCP匿2、0.4380.5660.5630.5620.562IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子AUC靈敏度特異性準確率0.5600.5780.5050.539表12.穩(wěn)定與不穩(wěn)定疾病預(yù)測模型2線性辨別分析所用的變量分類誤AUC靈敏度特異性準確率差MCP曙l、IGF-l、TNFa、MCP-2、0.4440.5770.5830.5290.556IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子實施例10:疾病與健康對照預(yù)測模型采用實施例5所述的方法,我們用對數(shù)回歸或線性辨別分析建立能將樣品分類為疾病(即心絞痛或心肌梗塞)類或健康對照類的模型。示例性模型所用的蛋白質(zhì)標記連同模型的性能特征見下表13和14。表13和14還表明模型的性能如何隨標記的組合被取代而改變。表13.疾病與對照預(yù)測模型1線性辨別分析所用的變量MCP-1、IGF-1、TNFa、MCP-2、IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子MCP-1、IGF-1、TNFaMCP-1、IGF-1、M-CSFAng-2、IGF-1、M-CSFMCP-4、IGF-1、M-CSFMCP-1、IGF-1、TNFa、IL-5MCP-1、IGF-1、M-CSF、MCP-2Ang-2、IGF-1、M-CSF、IL-5MCP-1、IGF-1、TNFa、MCP-2MCP-1、IGF-1、TNFa、IL-5、M-CSFMCP-1、IGF-1、IPIO、MCP-2、M-CSFAng-2、IGF-1、TNFa、IL-5、M-CSFMCP-1、IGF-1、TNFa、MCP-2、IP10MCP-4、IGF-1、M-CSF、TNFa、IL-5MCP-4、IGF-1、M-CSF、MCP-2、IL-5分類誤差0.1580.2450.2350.2580,2580.2250.2270.2390.2400.2130.1840.2160.2030.2210.246AUC0.9150.8270.8250.7980.7890.8500.8420.8160.8420.8670.8740,8550.8780.8550.807靈敏度0.8470.8040,7860.7180.7210.8170.8010.7540.7920.8370.8070.8070.7840.8120.736特異性0,8400.7330.7560.7530.7500,7570,7600.7640.7460.7650.8210.7740.8020.7650.761準確率0.8420,7550.7650.7420.7420.7750,7730.7610.7600.7870.8160.7840.7970.7790.754表14.疾病與對照預(yù)測模型2對數(shù)回歸分類誤所用的變量差A(yù)UC靈敏度特異性準確率MCP-1、IGF-1、TNFa、MCP-2、IPIO、IL-5、M-CSF、MCP-4、MCP-3、IL-3、Ang-2、IL-7、嗜酸細胞活化趨化因子0■1530,.9160,.8590.8410.847MCP-1、IGF-1、TNFa0.2370,.8350,.8040■7450.763MCP-1、IGF-1、M-CSF0.2390,.8310,.7890,.7490.761Ang-2、IGF-1、M-CSF0■2570,,7990,■7340.7470.743MCP-4、IGF-1、M-CSF0.2580,■7920,.7330,■7450.742MCP-1、IGF-1、TNFa、IL-50■2210,,8560,.8260,.7590■779MCP-1、IGF-1、M-CSF、MCP-20,.2360,,8450,.7940..7500.764Ang-2、IGF-1、M-CSF、IL-50,■2430.,8130,.7660,.7540,.757MCP-1、IGF-1、TNFa、MCP-20,■2350.,8490,■7840,.7570,.765MCP-1、IGF-1、TNFa、IL-5、M-CSF0,.2120.,8680.,8320,.7690,.788MCP-1、IGF-1、IPIO、MCP-2、M-CSF0,.1870.,8760.■8040,,8160.,813Ang-2、IGF-1、TNFa、IL-5、M-CSF0,.2200.,8550.,謝o:,7710.■780MCP-1、IGF-1、TNFa、MCP-2、IP100,.2020.,8810.,7940.■7990.,798MCP-4、IGF-1、M-CSF、TNFa、IL-50,,2230.,8570.,8070.,7640.,777MCP-4、IGF-1、M-CSF、MCP-2、IL-50.■2580.8100.,7340.,7460.,742實施例lh利用LDA模型的分類我們根據(jù)以下標記的數(shù)值將患者分為"對照"或"疾病"MCP-1、IGF-1和TNFa。兩類取相等的分類誤差成本。根據(jù)LDA方法,如果方程(l)的左側(cè)大于該方程的右側(cè),則將上述標記的值為x的新對象分入"疾病"類,方程中a)指數(shù)2對應(yīng)于"疾病"狀態(tài)b)指數(shù)1對應(yīng)于"對照"狀態(tài)c)N是訓(xùn)練組的總規(guī)模d)Nl、N2是訓(xùn)練組中"對照"和"疾病"對象的數(shù)量e)2是用訓(xùn)練組估算的協(xié)方差矩陣f)^,2are分別是"對照"和"疾病"樣品的均值向量。i:'±1一a",)>!/:2—》卩s、j+,og(:A'丄〃v.)k堪(ava')(i)為構(gòu)建用于預(yù)測的LDA模型,我們使用包括上述3種標記值的訓(xùn)練組,對象包括398位"對照"和398位"疾病"對象。標記值先轉(zhuǎn)換為loglO值,用所得數(shù)值估算方程1所需的各項。訓(xùn)練組的協(xié)方差矩陣和均值向量等于協(xié)方差矩陣MCP-1IGF隱1TNFaMCP-10.1241550.0695870.06659IGF-10.0695871.3219710.664374TNFa0.066590.6643740.565535"對照"和"疾病"狀態(tài)的均值標記向量:對照1.8915522.8309810.781913疾病1.2239762.3246830.990313方程1所需的協(xié)方差矩陣的逆陣是VIV2V318.6075990.13735-1.1748720.137351.848967-2.188283-1.17487-2.188284.477304我們分類具有以下數(shù)值(經(jīng)loglO轉(zhuǎn)換)的對象對象l:MCP隱1IGF隱1TNFa0.7169981.3161010.287882根據(jù)這些數(shù)值和方程1,方程的左側(cè)等于0.5291794,而方程的右側(cè)等于3.232524。根據(jù)左側(cè)小于右側(cè)的事實,該對象分類為"對照"。我們分類具有以下loglO轉(zhuǎn)換后標記數(shù)值的第二位對象對象2:MCP國1IGF-1TNFa1.9915091.11130310.536339根據(jù)這些數(shù)值和利用方程1,方程的左側(cè)等于4.461167,而方程的右側(cè)依舊是3.232524。根據(jù)該比較,該對象分類為"疾病"。本實施例和以下實施例參考納入本文作為參考的"TheelementsofStatisticalLearning.DataMining,InferenceandPrediction",Hastie,T.,Tibshirani,R.,F(xiàn)riedman,J.,SpringerSeriesinStatistics,2001)。實施例12:利用對數(shù)回歸模型分類我們根據(jù)以下標記的數(shù)值將患者分為"對照"或"疾病"MCP-l、IGF-1和M-CSF。兩類取相等的分類誤差成本。根據(jù)對數(shù)回歸方法,如果k類^疾病)與K類(]寸照)的后驗概率(posteriorprobability)比值的對數(shù)大于0,則將上述標記數(shù)值為x的新對象歸入疾病類,否則其歸為對照(方程2)。log!^^W;=A。丄化i為擬合對數(shù)回歸模型,我們使用的訓(xùn)練組包括398位"對照"和398位"疾病"對象。各對象的三種標記的數(shù)值經(jīng)先轉(zhuǎn)換為loglO值。對數(shù)回歸擬合提供了以下系數(shù):b0blb2b3-4.950593.334-1.276751.279328分類了所述三種標記具有以下數(shù)值的新對象:MCP-1IGF-1M-CSF對象11.6799313.4937811.169145以下計算式b0+bl*、MCP-r+b2*、IGF-l、+b3求、M-CSF'等于-2.031。如上所述,該對象的線性預(yù)測符值小于O,分類為"對照"。根據(jù)以下數(shù)值分類另一位對象MCP國1IGF-1M-CSF對象22.1082521.71490.539566采用相同的系數(shù)和公式,線性預(yù)測符等于0.5799186,對象2分類為"疾病"。本說明書引用的各出版物出于所有目的全文納入本文作為參考。除了在本說明書全文中所列的那些出版物,以下出版物也出于所有目的全文納入本文作為參考TabibiazarR,WagnerRA,DengA,TsaoPS,QuertermousT.Proteomicprofilesofseruminflammatorymarkersaccuratelypredictatherosclerosisinmice.P/戸'o/2006年4月13日;25(2):194-202。79權(quán)利要求1.一種將獲自哺乳動物的樣品分類的方法,包括獲得與所述樣品相關(guān)的數(shù)據(jù)集,所述數(shù)據(jù)集包括至少三種選自下組蛋白質(zhì)標記的定量數(shù)據(jù)MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-10、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1;將所述數(shù)據(jù)輸入用所述數(shù)據(jù)分類所述樣品的分析方法,其中所述分類選自動脈粥樣硬化性心血管疾病分類、健康分類、用藥物接觸分類、不用藥分類;和根據(jù)所述方法的輸出值分類所述樣品。2.如權(quán)利要求l所述的方法,其特征在于,所述分析方法使用預(yù)測模型。3.如權(quán)利要求l所述的方法,其特征在于,所述分析方法包括比較所述獲得的數(shù)據(jù)集與參比數(shù)據(jù)集。4.如權(quán)利要求3所述的方法,其特征在于,所述參比數(shù)據(jù)集包括獲自一位或多位健康對照的數(shù)據(jù),或包括獲自一位或多位診斷患有動脈粥樣硬化性疾病的對象的數(shù)據(jù)。5.如權(quán)利要求3所述的方法,其特征在于,還包括獲得所述獲得的數(shù)據(jù)集與所述參比數(shù)據(jù)集的相似度的統(tǒng)計學(xué)指標。6.如權(quán)利要求5所述的方法,其特征在于,所述統(tǒng)計學(xué)指標通過將所述獲得的數(shù)據(jù)集的至少三個參數(shù)與所述參比數(shù)據(jù)集的相應(yīng)參數(shù)比較得出。7.如權(quán)利要求l所述的方法,其特征在于,所述至少三種蛋白質(zhì)標記包括選自下組的標記組MCP-1,IGF-1,TNFa;MCP-l,IGF-1,M-CSF;ANG陽2,IGF-1,M-CSF;和MCP-4,IGF-1,M-CSF。8.如權(quán)利要求l所述的方法,其特征在于,所述數(shù)據(jù)集包括至少四種選自下組的蛋白質(zhì)標記的定量數(shù)據(jù)MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1。9.如權(quán)利要求8所述的方法,其特征在于,所述至少四種蛋白質(zhì)標記包括選自下組的標記組MCP-1,IGF-1,TNFa,IL-5;MCP-1,IGF-1,M-CSF,MCP-2;ANG-2,IGF-1,M-CSF,IL-5;MCP隱1,IGF-1,TNFa,MCP-2;和MCP-4,IGF-1,M國CSF,IL-5。10.如權(quán)利要求l所述的方法,其特征在于,所述數(shù)據(jù)集包括至少五種選自下組的標記的定量數(shù)據(jù)MCP-1、MCP-2、MCP-3、MCP-4、嗜酸細胞活化趨化因子、IP-IO、M-CSF、IL-3、TNFa、Ang-2、IL-5、IL-7和IGF-1。11.如權(quán)利要求IO所述的方法,其特征在于,所述至少五種蛋白質(zhì)標記選自下組MCP-1、IGF國1、TNFa、IL-5、M-CSF;MCP-1、IGF國1、M-CSF、MCP-2、IP-10;ANG-2、IGF-1、M-CSF、IL-5、TNFa;MCP-1、IGF-1、TNFa、MCP-2、IP-10;MCP-4、IGF-1、M隱CSF、IL-5、TNFa;和MCP-4、IGF-1、M陽CSF、IL-5、MCP-2。12.—種分類獲自哺乳動物的樣品的方法,包括獲得與所述樣品相關(guān)的數(shù)據(jù)集,其中所述數(shù)據(jù)集包括至少3種選自下組的蛋白質(zhì)標記的定量數(shù)據(jù)MCP1;MCP2;MCP3;MCP4;嗜酸細胞活化趨化因子;IP10;MCSF;IL3;TNFa;Ang2;IL5;IL7;IGF1;IL10;INFy;VEGF;MIPla;RANTES;IL6;IL8;ICAM;TIMP1;CCL19;TCA4/6kine/CCL21;CSF3;TRANCE;IL2;IL4;IL13;Illb;MCP5;CCL9;CXCL1/GR01;GROa;IL12;和瘦蛋白;將所述數(shù)據(jù)輸入用所述數(shù)據(jù)分類所述樣品的預(yù)測模型,其中所述分類選自動脈粥樣硬化性心血管疾病分類、健康分類、用藥分類、不用藥分類,其中所述預(yù)測模型的至少一項分類質(zhì)量指標值為至少0.7;和根據(jù)所述預(yù)測模型的輸出值分類所述樣品。13.如權(quán)利要求12所述的方法,其特征在于,所述預(yù)測模型的分類質(zhì)量指標值為至少0.8。14.如權(quán)利要求13所述的方法,其特征在于,所述預(yù)測模型的分類質(zhì)量指標值為至少0.9。15.如權(quán)利要求12所述的方法,其特征在于,所述質(zhì)量指標選自AUC和準確率。16.如權(quán)利要求12所述的方法,其特征在于,調(diào)整所述預(yù)測模型的限度使得靈敏度或特異性至少其一是至少0.7。17.如權(quán)利要求14所述的方法,其特征在于,調(diào)整所述預(yù)測模型的限度使得靈敏度或特異性至少其一是至少0.7。18.如權(quán)利要求l所述的方法,其特征在于,所述動脈粥樣硬化性疾病分類選自下組冠狀動脈疾病、心肌梗塞和心絞痛。19.如權(quán)利要求l所述的方法,其特征在于,還包括使用所述分類進行動脈粥樣硬化診斷、確定動脈粥樣硬化階段、動脈粥樣硬化預(yù)后、血管炎癥水平、評估動脈粥樣硬化發(fā)展程度、監(jiān)測治療反應(yīng)、預(yù)測冠狀動脈鈣化度、或區(qū)分動脈粥樣硬化性疾病的穩(wěn)定和不穩(wěn)定表現(xiàn)。20.如權(quán)利要求1所述的方法,其特征在于,所述數(shù)據(jù)集還包括一種或多種臨床指標的數(shù)據(jù)。21.如權(quán)利要求20所述的方法,其特征在于,所述一種或多種臨床指征選自下組年齡、性別、LDL濃度、HDL濃度、甘油三酯濃度、血壓、體重指數(shù)、CRP濃度、冠狀動脈鈣化度、腰圍、吸煙情況、心血管疾病病史、心血管疾病家族史、心率、空腹胰島素濃度、空腹葡萄糖濃度、糖尿病狀態(tài)和使用高血壓藥物的情況。22.如權(quán)利要求1所述的方法,其特征在于,所述樣品包括血液或血液衍生物。23.如權(quán)利要求l所述的方法,其特征在于,所述分析方法包括采用線性辨別分析模型、支持向量機分類算法、遞歸特征排除模型、微陣列模型預(yù)測分析、對數(shù)回歸模型、CART算法、FlexTree算法、LART算法、隨機森林算法、MART算法或機械學(xué)習(xí)算法。24.如權(quán)利要求23所述的方法,其特征在于,所述方法包括利用線性辨別分析模型或?qū)?shù)回歸模型,所述模型包括提供高于0.75的質(zhì)量指標的參數(shù)項。25.如權(quán)利要求l所述的方法,其特征在于,還包括實現(xiàn)對在多個不同時刻獲得的對象的多份樣品的多種分類。26.—種將獲自哺乳動物的樣品分類的方法,包括獲得與所述樣品相關(guān)的數(shù)據(jù)集,其中所述數(shù)據(jù)集包括至少3種選自下組的蛋白質(zhì)標記的定量數(shù)據(jù),各標記顯示循環(huán)蛋白質(zhì)濃度與動脈粥樣硬化性血管組織RNA濃度之間的關(guān)聯(lián);將所述數(shù)據(jù)輸入用所述數(shù)據(jù)分類所述樣品的分析方法,其中所述分類選自動脈粥樣硬化性心血管疾病分類、健康分類、用藥分類、不用藥分類;和根據(jù)所述方法的輸出值分類所述樣品。27.如權(quán)利要求26所述的方法,其特征在于,所述關(guān)聯(lián)的特征在于皮爾遜相關(guān)系數(shù)至少是0.6。28.如權(quán)利要求27所述的方法,其特征在于,所述至少三種蛋白質(zhì)標記包括一種或多種選自下組的蛋白質(zhì)標記MCP-1、CCL21、CCL19、CCL112、TNFSF11和CCXll。29.如權(quán)利要求26所述的方法,其特征在于,所述哺乳動物是人。30.—種將獲自哺乳動物的樣品分類的方法,包括獲得與所述樣品相關(guān)的數(shù)據(jù)集,其中所述數(shù)據(jù)集包括至少3種選自下組的蛋白質(zhì)標記的定量數(shù)據(jù),各標記顯示循環(huán)蛋白質(zhì)濃度與動脈粥樣硬化性血管組織RNA濃度之間的關(guān)聯(lián);將所述數(shù)據(jù)輸入用所述數(shù)據(jù)分類所述樣品的預(yù)測模型,其中所述分類選自動脈粥樣硬化性心血管疾病分類、健康分類、用藥分類、不用藥分類,其中所述預(yù)測模型的至少一項分類質(zhì)量指標值為至少0.7;和根據(jù)所述預(yù)測模型的輸出值分類所述樣品。31.如權(quán)利要求30所述的方法,其特征在于,所述關(guān)聯(lián)的特征在于皮爾遜相關(guān)系數(shù)至少是0.6。32.如權(quán)利要求31所述的方法,其特征在于,所述至少三種蛋白質(zhì)標記包括一種或多種選自下組的蛋白質(zhì)標記MCP-1、CCL21、CCL19、CCL112、TNFSF11禾卩CCXll。33.如權(quán)利要求30所述的方法,其特征在于,所述哺乳動物是人。全文摘要本發(fā)明鑒定了在動脈粥樣硬化中差異性表達的循環(huán)蛋白。這些蛋白質(zhì),特別是作為一組蛋白質(zhì)的循環(huán)水平能將急性心肌梗塞患者與穩(wěn)定的勞累性心絞痛患者及無動脈粥樣硬化性心血管病史者區(qū)分開來。這些蛋白水平還可預(yù)測心血管事件、測定治療效力、確定病程階段等。例如,這些標記蛋白可用作開發(fā)血管特異性藥物制劑所需的替代臨床表征的生物標記。文檔編號G01N33/48GK101495862SQ200680030864公開日2009年7月29日申請日期2006年6月26日優(yōu)先權(quán)日2005年6月24日發(fā)明者B·K·特爾布爾,E·海托普羅斯,P·S·曹,R·A·奧爾森,R·塔比比亞扎,T·科特莫斯申請人:利蘭·斯坦福青年大學(xué)托管委員會