專利名稱:用于鑒別鼻咽癌中的預后型亞類的基因表達譜的制作方法
用于鑒別鼻咽癌中的預后型亞類的基因表達譜本申請為2008年05月22日提交的申請?zhí)枮?00680043762. 3標題為“用于鑒別
鼻咽癌中的預后型亞類的基因表達譜”的申請的分案申請本發(fā)明總體上涉及評估和/或預測鼻咽癌的狀態(tài)和結(jié)果的方法,包括測定與這種癌癥相關(guān)的基因的表達水平,由此使得可以對這些癌癥患者的結(jié)果進行個體化預測或評估。導言鼻咽癌(NPC)是一種獨特類型的頭頸部癌癥,其與上呼吸消化道的其它惡性腫瘤在流行病學、病理學、臨床表現(xiàn)和對治療的反應(yīng)方面有所不同工’2。據(jù)信NPC的發(fā)生與 Epstein-Barr病毒(EBV)感染相關(guān)3’4。這種類型的癌癥在中國南方地區(qū)、臺灣和東南亞地區(qū)是地方流行病(25-30/100,000/年)5_8。其是更具侵潤性的頭頸部癌癥之一,可以侵入相鄰器官、侵襲咽后和頸部淋巴結(jié)并傳播于遠離部位9_"。在過去的三十年期間放射治療的進展得以成功地長期控制NPC12_16。毫無疑問,放療是治療NPC的主要方法。疾病I期和II期患者僅利用放療就可具有較高的治愈率。然而,70%以上的新診斷的NPC患者處于疾病的III期和IV期14’17。這些患者另外需要同時進行化療以改善其治療結(jié)果15’16。另外,大約30%的疾病III期和IVa/b期NPC患者最后產(chǎn)生遠處轉(zhuǎn)移14’17,即在NPC的局部區(qū)域外的轉(zhuǎn)移。10-20%的NPC患者在最初診斷時即出現(xiàn)遠處轉(zhuǎn)移并處于疾病IVc期14’17。在發(fā)生遠處轉(zhuǎn)移之后不久,大多數(shù)患者死于該病。遠處轉(zhuǎn)移通常在III期和IV期NPC患者未出現(xiàn)局部區(qū)域復發(fā)的情況下發(fā)生,是最重要的預后因
ο近來的元分析(meta-analysis)表明晚期NPC患者生存期改善可能是同時進行全身性化療而可能防止和控制遠處轉(zhuǎn)移的結(jié)果15’16??紤]到70%以上的NPC患者處于疾病的 III期和IV期,及大約30%的這些患者中可發(fā)生遠處轉(zhuǎn)移14’17,因此需要在首發(fā)時即成功鑒別具有高遠處轉(zhuǎn)移風險的患者,從而進一步改善這些患者的生存期。當這種預測變成現(xiàn)實時,就可以應(yīng)用目前最優(yōu)的治療方法,然后可以設(shè)計臨床試驗測試更新的治療方法,以更有效地防止和控制遠處轉(zhuǎn)移從而改善總體生存期。已知遠處轉(zhuǎn)移的風險隨著NPC的更晚期階段而增加14’17,已經(jīng)使用 Μ分級以指導選擇放療和化療的合適組合,以防止遠處轉(zhuǎn)移及改善長期生存15’16’31。例如,在臺灣臺北辜公亮基金會和信治癌中心對AJCC的III期患者(具有T1N2M0和T2aN2M0疾病的排除在外)已經(jīng)同時用化療-放療(CCRT)加上兩個周期的順鉬和5-FU的輔助化療進行了治療31。 IVa/b患者用CCRT治療,隨后進行2個周期的輔助化療及每周一次用5-FU和甲酰四氫葉酸維持化療共6個月31。盡管許多III期患者對這種治療反應(yīng)良好并具有極佳的生存期(圖 6),但是大約20%的III期患者發(fā)生遠處轉(zhuǎn)移并且生存期不佳。在開始治療的三年內(nèi)發(fā)生遠處轉(zhuǎn)移的III期患者的總體生存期和無轉(zhuǎn)移生存期與IVa/b期NPC患者的重疊(圖6)。這些發(fā)現(xiàn)提出這樣的問題,即處于發(fā)生遠處轉(zhuǎn)移風險的III期患者是否應(yīng)該通過新輔助化療、更新或更強的輔助化療和/或維持化療而更積極地進行治療。對處于發(fā)生遠處轉(zhuǎn)移的IVa/b期NPC患者的治療的適當性也是一個問題(圖6)。所有這些發(fā)現(xiàn)強調(diào)在診斷時和在開始治療之前鑒別出處于發(fā)生遠處轉(zhuǎn)移風險中的NPC患者的臨床重要性。鑒別這種患者及排除處于低遠處轉(zhuǎn)移風險中的III期和IVa/b期NPC患者的能力對于進行更有效的臨床試驗非常重要。如先前所報道,微陣列分析已經(jīng)成功用于鑒別腫瘤分類的分子標記18_22及其臨床特點23_3°,例如預測各種類型惡性腫瘤患者發(fā)生遠處轉(zhuǎn)移的風險及總體生存期。其它研究涉
及 NPC3"54。也參見2002年10月M日申請的美國專利申請No. 60/420, 729、2002年10 月25日申請的美國專利申請No. 60/421,102、2002年10月25日申請的美國專利申請 No. 60/421,062、2002年11月8日申請的美國專利申請No. 60/424, 701、2002年11月8日申請的美國專利申請No. 60/424,718、2002年11月8日申請的美國專利申請No. 60/424,715、 2002年11月12日申請的美國專利申請No.60/425,256、2003年2月21日申請的美國專利申請No. 60/448, 462、2003年2月21日申請的美國專利申請No. 60/448, 466、2003 年3月27日申請的美國專利申請No.60/457,877、2003年3月31日申請的美國專利申請No. 60/458, 373,2002年11月12日申請的美國專利申請No. 10/291, 878,2002年 11月12日申請的美國專利申請No. 10/291,886、2002年11月12日申請的國際專利申請No. US02/38216、及2002年11月12日申請的國際專利申請No. US02/38222、2004年 12月20日申請的美國專利申請No. 11/015,764、2005年3月觀日申請的美國專利申請 No. 11/090, 294及2005年3月25日申請的美國臨時申請No. 60/665,652的描述,所述文獻中使用的方法學在此并入作參考。發(fā)明概述本發(fā)明鑒別了 NPC患者中的涉及遠處轉(zhuǎn)移的基因組特征(genomic signatures)。 改良的對NPC患者發(fā)生遠處轉(zhuǎn)移進行預測的方法使得臨床醫(yī)生可以鑒別處于高風險中的個體患者,對他們可以選擇合適的治療方法(例如放療和/或化療)以防止和/或改善遠處轉(zhuǎn)移并改善長期生存率。因此,本發(fā)明一方面涉及使NPC患者中的基因表達水平與所述患者中的風險因子和臨床結(jié)果相關(guān)聯(lián)的方法。因此,本發(fā)明涉及一種評估鼻咽癌患者發(fā)生遠處轉(zhuǎn)移風險的方法,所述方法包括評估所述患者樣品中下表4和5中列出的至少一個基因的表達譜。優(yōu)選地,在患者樣品、優(yōu)選NPC組織樣品中評估表4中列出的基本上全部的、特別是全部52個基因和/或表5中列出的基本上全部的、特別是全部12個基因的表達水平。因此,可以利用表4或5中的兩或多個基因,只要用于概率分析而評估的基因的數(shù)目與疾病結(jié)果(例如遠處轉(zhuǎn)移)相關(guān)聯(lián)即可。在其它實施方案中,對于所述12個基因系列,可以利用其中的3或多個、4或多個、 5或多個、6或多個、7或多個、8或多個、9或多個、10或多個,或者11或多個基因。對于所述52個基因系列,也可以利用這樣數(shù)目的基因,或者12或多個、…、15或多個、…、20或多個、…、25或多個、…、30或多個、…、35或多個、…、40或多個、…、45或多個、…、 50或多個、51或多個基因,以及在此未明確表述的其它基因數(shù)目。在下文描述的組合方法中也可以利用來自每個系列的所述的基因數(shù)目。當然,為了優(yōu)化結(jié)果,通常利用全部或者基本全部的基因。因此,另一方面,前述方法中使用的基因是本文列出的一或多個基因。本發(fā)明還涉及在例如介質(zhì)或試劑盒等中的與遠處轉(zhuǎn)移相關(guān)的這些基因的全部或亞集的集合,并且本發(fā)明涉及進行本發(fā)明方法使用的相關(guān)的方法、介質(zhì)和試劑盒。
根據(jù)本發(fā)明的另一方面,所分析的患者樣品可以是任何組織,例如血液、腫瘤或細胞等。優(yōu)選地,所述樣品來自NPC腫瘤。獲得所分析樣品的方法為本領(lǐng)域所已知。本發(fā)明提供了與評估或預測NPC患者中的遠處轉(zhuǎn)移相關(guān)的基因集合。這些基因具有與至少一種這種癌癥表型相關(guān)的表達模式(即水平表達或無表達)。可以理解NPC中也包含另外的基因。對于本發(fā)明,對自具有完整記錄的臨床數(shù)據(jù)的NPC患者收集的組織活檢樣品進行基因表達模式研究。所有進行研究的活檢樣品均在液氮中貯存。僅對總RNA無明顯降解的樣品進行研究。為了使與操作者相關(guān)的變量最小化,在腫瘤樣品的處理和微陣列數(shù)據(jù)的收集中僅包括兩名經(jīng)高級培訓的技術(shù)人員。他們隨機處理相似數(shù)目的具有高和低遠處轉(zhuǎn)移風險的患者的樣品。對由這兩名技術(shù)人員進行和收集的微陣列數(shù)據(jù)的統(tǒng)計學分析未示出任何統(tǒng)計學偏差(圖7)。在研究過程中還使用相同的流體自動輸送儀(fluidic station)和相同的掃描儀。為了進一步使得與芯片生產(chǎn)、樣品處理、cRNA的荷載量及芯片處理相關(guān)的變量最小化,使用Affymetrix MAS 5. 0軟件將每個微陣列的基因表達強度數(shù)據(jù)校正為切尾均值 (trimmed mean) 500,隨后根據(jù)先前在我們實驗室中確定的NPC參考標準對每個探針集的表達強度進行分位數(shù)校正。見實施例I所述。這種校正方法的效果通過對比六個隨機選擇的 NPC樣品重復測定的GeneChip結(jié)果而確認。結(jié)果示出在探針水平的分位數(shù)(qaimtile)校正程序?qū)τ谛U龑嶒炞兞看_實有效(圖8)。進行嚴密監(jiān)視下的分析。如先前所述,在開始治療的三年內(nèi)未發(fā)生遠處轉(zhuǎn)移的大多數(shù)NPC患者具有良好的長期生存率,生存結(jié)果不佳的NPC患者通常在首次治療后的三年內(nèi)發(fā)生遠處轉(zhuǎn)移。這兩組在臨床上處于疾病兩端的患者的活檢組織樣品用于分析中,以鑒別用于預測遠處轉(zhuǎn)移的更可靠的分子標記。最近報道了采取這種方法發(fā)現(xiàn)可靠的分子預測因子(predictor)的益處35。同時,如Simon等%所述,過匹配(overf itting)是從具有高維測量值的有限數(shù)目的患者中發(fā)現(xiàn)類別預測因子的一個嚴重缺陷。為了克服過匹配問題,一組用于確證的真正獨立的測試病例被包括進來,并且在這項研究中包含盡可能多的患者。138名符合條件的患者被包括進來。另外,將來自低風險和高風險組的1/3的患者在研究剛開始時隨機分配至一個獨立測試組(test set)以進行確認。重要的臨床變量如年齡、性別、腫瘤階段、隨訪持續(xù)時間被考慮以用于隨機化。所有測試組病例均未參與訓練過程中預測基因的選擇和預測規(guī)則的確定。本發(fā)明的測試組的結(jié)果顯示靈敏性、特異性和總精確性與文獻中針對其它類型實體腫瘤報道的結(jié)果相當或更好23’24’27_3°。存活的腫瘤細胞和周圍的淋巴/炎癥/介質(zhì)細胞的數(shù)量在不同患者的活檢組織樣品之間可以顯著變化(生物學異質(zhì)性)。然而,由于可利用的活檢組織的數(shù)量非常有限及 RNA的不穩(wěn)定性,因此對用于基因表達譜分析的活檢組織樣品未進行組織學檢驗。同樣,診斷性活檢組織樣品的組織學與預測結(jié)果的精確性無關(guān)聯(lián),因為用于診斷和GeneChip研究的活檢部位不同。與活檢組織樣品的異質(zhì)性相關(guān)的噪音(noise)會限制預測的精確性。本發(fā)明產(chǎn)生了兩項優(yōu)選的預測規(guī)則。見實施例IV和V所示。一項基于52個基因的特征和k-NN分類方法,另一項基于12個基因和邏輯回歸(logistic regression)。在一組中,來自9個不同SOM簇的52個基因被用于進行預測。它們總結(jié)于表4。在這 52 個基因中,根據(jù) NIAID-DAVID Tools (http //appsl. niaid. nih. gov/david/),有參與信號轉(zhuǎn)導(η = 9)、mRNA加工(η = 7)、轉(zhuǎn)錄調(diào)節(jié)(η = 3)、蛋白質(zhì)合成(η = 4)、核苷酸代謝(n = 4)、脂質(zhì)代謝(n = 3)、蛋白質(zhì)折疊(n = 3)、胞質(zhì)分裂(n = 2)、核轉(zhuǎn)運(n = 2)、 蛋白質(zhì)分解代謝(n = 2)、抗細胞凋亡(n = 1)、ΑΤΡ合成(η = 1)、細胞周期(n = 1)、免疫應(yīng)答(η = 1)、胞內(nèi)蛋白質(zhì)轉(zhuǎn)運(η = 1)和氨基酸轉(zhuǎn)運(η = 1)的成員。剩余7個基因的功能未知。在高風險組中,這52個基因中有22個基因表達降低,3個基因表達增加。當對比高風險和低風險組的預測基因的表達強度時,注意到在預測的高風險組中幾乎所有參與mRNA 加工、核轉(zhuǎn)運、核苷酸代謝和蛋白質(zhì)折疊的基因的平均表達水平均更高。相反,在預測處于高遠處轉(zhuǎn)移風險組中,所有參與轉(zhuǎn)錄調(diào)節(jié)和蛋白質(zhì)分解代謝的基因的表達均降低。對于基于12個基因的預測方法,有6個基因也存在于通過k-NN方法進行預測的所述52個基因中。根據(jù)Affymterix探針集ID,其它6個基因不存在于所述52個基因的列表中。這12個基因總結(jié)于表5。在這12個基因中,有3個基因參與蛋白質(zhì)折疊,2個基因參與蛋白質(zhì)合成,2個基因參與核糖體生物發(fā)生(biogenesis),2個基因參與核苷酸代謝,1 個基因參與mRNA加工和蛋白質(zhì)分解代謝。最后一個基因(假設(shè)蛋白質(zhì)FLJU671)已知具有核仁外切核酸酶基序,其實際功能未知。所有12個基因的功能均顯示出與所述52個基因中的那些基因的功能明顯重疊。注意到未包含在所述52個基因中的6個基因之一(不含POU結(jié)構(gòu)域的蛋白質(zhì))實際上與所述52個基因中的不同探針集ID所表示的基因相同。 這個基因參與mRNA加工。所述12個基因的組中的3個基因是含有相同伴侶蛋白的t_復合物I(TCP-I)的α、β、Y亞單位34,它們參與腫瘤細胞增殖。亞單位α和Υ的基因既存在于所示12個基因中,也存在于所述52個基因中。亞單位β的基因僅存在于所述12 個基因中。所有這些發(fā)現(xiàn)示出這兩組預測基因之間的高度一致性。使用預測規(guī)則的結(jié)果示出52個基因的預測方法較12個基因的預測方法假陽性率低(14%對觀%)。相反,52個基因的預測方法較12個基因的預測方法具有較高的假陰性率(31%對15%)。當所述預測方法用于選擇具有高遠處轉(zhuǎn)移風險的患者進行臨床試驗時, 需要將假陽性和假陰性率降低至最小值,以便保護低風險患者的安全和對高風險患者的正確治療。例如,可以將所述兩種方法組合成為一種方法。僅認可兩種方法的一致結(jié)果。不一致的結(jié)果被看作是不確定結(jié)果(η = 8)。見實施例VI所述。通過采取這種方法,假陽性率降低至10%。假陰性率為大約15%。盡管在獨立測試中不確定病例占所有患者的 19% (8/42),但是通過組合使用分子預測因子僅將2名臨床高風險患者指定為屬于不確定范疇。以這種方式,以排除15% (2/13)的臨床高風險患者的代價,錯誤地將低風險的患者 (good risk patient)劃分在高風險患者試驗組中的幾率可被有效最小化。其它15%的臨床高風險患者被錯誤地預測為低風險患者(表6)。然而,至少70%的高風險患者將得以正確鑒別并可以包括在針對高風險患者設(shè)計的臨床試驗中。因此,已經(jīng)鑒別了 52個基因和12個基因的可靠分子學特征,以預測處于發(fā)生遠處轉(zhuǎn)移的高風險或低風險狀態(tài)的NPC患者。所述預測經(jīng)42個獨立測試組病例確認。由獨立測試組評估的總精確性對于所述52個基因特征、12個基因特征及其組合特征分別為81 %、 76%和85%。這些結(jié)果與近來公布的也使用獨立測試組進行確認的預測研究結(jié)果相當28’3°。據(jù)報道預測乳腺癌對新輔助化療反應(yīng)的準確率為78% 28,預測頭頸部鱗狀細胞癌的淋巴結(jié)轉(zhuǎn)移的準確率為86% 3°。所述分子特征可用于指導在NPC患者中進行新的新輔助化療、輔助化療、維持化療和/或靶向治療,以用于防止、改善和控制遠處轉(zhuǎn)移及進一步改善長期生存率。具有遠處轉(zhuǎn)移的低或高風險的NPC患者的鑒別也可以降低治療過度或不足的比率。NPC轉(zhuǎn)移相關(guān)基因的集合可以是物理集合(physical collection)或虛擬集合 (virtual collection)。物理集合包括一群不同的核酸分子,其中NPC癌癥相關(guān)基因存在于所述群中,即所述群中有相應(yīng)于所述集合中的NPC癌癥相關(guān)基因的基因組序列,或者更常見地,編碼序列的核酸分子。在許多實施方案中,所述核酸分子的序列與其相應(yīng)的基因的有義鏈基本相同或相同,或者與其相應(yīng)的有義鏈互補,通常與其相應(yīng)的有義鏈在嚴格條件下雜交。雜交條件(即低、中等、或高嚴格條件)的確定為本領(lǐng)域技術(shù)人員所已知。嚴格雜交條件的一個例子是在50°C或更高溫度下在0. 1330(151111氯化鈉/1.51111檸檬酸鈉)中雜交。 嚴格雜交條件的另一個例子是在42°C在如下溶液中保溫過夜50%甲酰胺,5XSSC(150mM NaCl,15mM檸檬酸三鈉),50mM磷酸鈉(pH7. 6),5XDenhardt' s溶液,10%硫酸葡聚糖,及 20mg/ml變性剪切的鮭精DNA ;隨后在大約65°C在0. 1 X SSC中洗滌濾膜。嚴格雜交條件是至少與上述條件一樣嚴格的雜交條件,其中如果與上述特定嚴格條件至少大約80%、通常至少大約90% —樣嚴格,則認為是至少一樣嚴格的。其它嚴格條件為本領(lǐng)域所已知,也可以用于鑒別本發(fā)明這個特殊實施方案的核酸。組成所述物理集合的核酸可以是單鏈或雙鏈核酸。另外,組成所述物理集合的核酸可以是線性或環(huán)狀核酸,各個核酸分子除了 NPC癌癥相關(guān)基因之外還可包括其它序列, 例如載體序列。各種不同核酸可以組成所述物理集合,例如庫,如本發(fā)明的載體庫,其中不同類型核酸的例子包括但非限于DNA,例如cDNA等,RNA,例如mRNA、cRNA等等。所述物理集合的核酸可以存在于溶液中或者粘附即附著于固體支持物上,如在陣列實施方案中的基質(zhì)上,關(guān)于這種不同實施方案的進一步描述在下文提供。本發(fā)明還提供了 NPC相關(guān)基因的虛擬集合。虛擬集合是指包括集合的基因的序列信息的一或多個數(shù)據(jù)文件或者其它計算機可讀數(shù)據(jù)組織元件,其中所述序列信息可以是基因組序列信息,但通常是編碼序列信息。所述虛擬集合可以記錄在任何便利的計算機或處理器可讀存儲介質(zhì)上。其上存儲了所述集合數(shù)據(jù)的計算機或處理器可讀存儲介質(zhì)可以是任何便利的介質(zhì),包括⑶、DAT、軟盤、RAM、ROM等,所述介質(zhì)能由裝置的硬件部分讀取。本發(fā)明還提供了 NPC相關(guān)基因的表達譜數(shù)據(jù)庫。這種數(shù)據(jù)庫通常包含具有NPC相關(guān)表型的各種細胞/組織的表達譜,如NPC的各個階段、陰性表達譜、預后譜等,在下文對這類譜進一步描述。所述表達譜及其數(shù)據(jù)庫可以提供在各種介質(zhì)中以便于其應(yīng)用?!敖橘|(zhì)”是指含有本發(fā)明所述表達譜信息的產(chǎn)品。本發(fā)明的數(shù)據(jù)庫可以記錄在計算機可讀介質(zhì)例如可以由計算機直接讀取和存取的任何介質(zhì)上。這種介質(zhì)包括但非限于磁性存儲介質(zhì),如軟盤、硬盤存儲介質(zhì)及磁帶;光學存儲介質(zhì)如⑶-ROM ;電子存儲介質(zhì)如RAM和ROM ;及這些存儲介質(zhì)的混合物如磁性/光學存儲介質(zhì)。本領(lǐng)域技術(shù)人員可易于意識到目前已知的任何計算機可讀介質(zhì)可怎樣用于產(chǎn)生包含本發(fā)明數(shù)據(jù)庫信息的產(chǎn)品。“記錄”是指使用本領(lǐng)域已知的任何方法在計算機可讀介質(zhì)上存儲信息的過程?;谟糜诖嫒∷鎯π畔⒌姆绞剑梢赃x擇任何便利的數(shù)據(jù)存儲結(jié)構(gòu)??梢允褂酶鞣N數(shù)據(jù)處理器程序和格式進行存儲,例如文字處理文本文件(word processing text file),數(shù)據(jù)庫模式(database format)等。如本文所用,“基于計算機的系統(tǒng)”是指用于分析本發(fā)明信息的硬件、軟件和數(shù)據(jù)存儲裝置。本發(fā)明的基于計算機系統(tǒng)的最小硬件包含一個中央處理器(CPU)、輸入裝置、輸出裝置,及數(shù)據(jù)存儲裝置。技術(shù)人員可易于意識到任一種目前可利用的基于計算機的系統(tǒng)均適用于本發(fā)明中。數(shù)據(jù)存儲裝置可包括任何包含如上述本發(fā)明信息的記錄制品,或者可以存取這種制品的記憶存取裝置??梢允褂幂斎牒洼敵鲅b置的許多結(jié)構(gòu)格式以在本發(fā)明的基于計算機的系統(tǒng)中輸入和輸出信息。輸出裝置的一種格式是對與參考表達譜具有不同程度相似性的表達譜進行排列(rank)。這種表示為技術(shù)人員提供了相似性的排列,并且可以鑒別測試的表達譜中包含的相似性程度?;虮磉_譜可以在一個時間點測定或者在一段時間的幾個時間點測定?;虻谋磉_水平可以通過本領(lǐng)域已知的任何方法確定(例如定量的聚合酶鏈反應(yīng)(PCR)、逆轉(zhuǎn)錄酶/ 聚合酶PCR)或者通過將開發(fā)的可提供關(guān)于基因表達的定量信息的方法確定。在另一個實施方案中,基因表達水平是通過量化基因表達產(chǎn)物如蛋白質(zhì)、多肽或核酸分子(例如mRNA、tRNA、rRNA)而確定的。量化核酸可以通過對核酸進行直接量化或者通過對相應(yīng)的調(diào)節(jié)基因或調(diào)節(jié)序列元件進行量化而進行。另外,可以對基因的變體如剪切變體和多態(tài)性變體進行量化。在另一個實施方案中,基因表達是通過量化從mRNA翻譯的蛋白質(zhì)或多肽的水平而測定的。量化樣品中蛋白質(zhì)或多肽的水平并使這種數(shù)據(jù)與表達水平相關(guān)聯(lián)的方法為本領(lǐng)域所已知。例如,特異于蛋白質(zhì)或多肽的多克隆或單克隆抗體可以通過本領(lǐng)域已知的方法獲得,并用于檢測和/或測量樣品或標本中的蛋白質(zhì)或多肽。在一個優(yōu)選的實施方案中,基因表達是通過量化樣品或標本中的mRNA水平而測定。這可以通過本領(lǐng)域已知的任何方法進行。在一個實施方案中,將mRNA與包含特異于感興趣的基因的固定的核酸探針的合適微陣列接觸,確定樣品中mRNA與微陣列上探針的雜交程度。這種微陣列也在本發(fā)明的范圍內(nèi)。產(chǎn)生寡核苷酸微陣列的方法的例子在例如WO 95/11995中描述。本領(lǐng)域易于獲知其它方法。測定或估定的基因表達值是得自可以測量基因表達水平的裝置的數(shù)值。所述數(shù)值是得自所述裝置的原始數(shù)值,或者是優(yōu)選經(jīng)過重定比例、過濾和/或標準化的數(shù)值。見例如實施例I所述。已經(jīng)進行特定嚴格條件處理的樣品的核酸(例如mRNA)與芯片上的探針雜交。分離進行分析的核酸(例如靶核酸)、擴增,在與陣列雜交之前用可檢測的標記物(例如32P或熒光標記物)進行標記。雜交后,將所述陣列插入可以檢測雜交模式的掃描儀中。 這些模式通過檢測與所述微陣列附著的標記的靶而進行檢測,例如如果所述靶是熒光標記的,則收集從標記的基團中發(fā)射的光作為雜交數(shù)據(jù)。由于標記的靶在本領(lǐng)域技術(shù)人員已知的合適的嚴格條件下與所述微陣列中包含的互補寡核苷酸特異性雜交,及由于已知所述陣列中每個寡核苷酸的序列和位置,因此可以確定應(yīng)用于所述探針的靶核酸的性質(zhì)。本發(fā)明還提供了一種通過監(jiān)測本發(fā)明的基因表達譜而監(jiān)測個體中治療方案的效果的方法,例如可以確定個體的基礎(chǔ)基因表達水平,并且可以在治療期間在不同時間點重復確定基因表達譜?;虮磉_譜從與不佳的治療結(jié)果相關(guān)的譜轉(zhuǎn)變?yōu)榕c改善的治療結(jié)果相關(guān)的譜是治療方案有效的指征,而重復的與不佳治療結(jié)果相關(guān)的表達譜表示無效的治療方案。在本發(fā)明的診斷性應(yīng)用中,對細胞或其集合例如組織以及包括所述細胞/組織的動物(對象、宿主等,例如哺乳動物如寵物、家畜和人等)進行分析,以確定發(fā)生NPC轉(zhuǎn)移的存在和/或可能性。如此,診斷性分析包括確定這種表型存在的方法。在某些實施方案中, 不僅確定了表型的存在,而且還確定了表型的嚴重性或階段。另外,診斷性方法還包括確定發(fā)生這種癌癥表型的傾向,由此可以確定這種癌癥表型不存在但可能發(fā)生。在進行所述診斷及其它方法中,對得自或衍生自要被診斷的細胞、組織或?qū)ο蟮暮怂針悠愤M行分析,以產(chǎn)生表達譜,然后進行本發(fā)明的方法。如上所述,進行分析以產(chǎn)生表達譜用于所述診斷方法中的樣品是核酸樣品。所述核酸樣品包括多個或一群不同的核酸,所述核酸包含進行診斷的感興趣的細胞或組織的 NPC相關(guān)基因的表達信息。所述核酸可包括RNA或DNA核酸,例如mRNA、cRNA、cDNA等,只要所述樣品保留其從中獲得的宿主細胞或組織的表達信息即可。所述樣品可以本領(lǐng)域已知的許多不同方式制備,例如通過從細胞中分離mRNA,其中分離的mRNA被擴增,用于制備cDNA、 cRNA等,如差異表達領(lǐng)域所已知的那樣進行。所述樣品通常是從待診斷的對象收集的細胞或組織中制備的,例如通過使用標準方案進行組織活檢而收集,其中從中可以產(chǎn)生這種核酸的細胞或組織包括其中存在待確定的NPC表型的表達譜的任何組織,包括但非限于單核細胞、內(nèi)皮、和/或平滑肌??梢允褂萌魏伪憷姆桨笍脑己怂針悠分挟a(chǎn)生所述表達譜。雖然已知各種不同的產(chǎn)生表達譜的方式,如用于基因差異表達分析領(lǐng)域中的那些方式,但是一種代表性的便利的產(chǎn)生基因表達譜的方案是基于陣列的基因表達譜產(chǎn)生方案。所述應(yīng)用是雜交分析, 其中采用這樣的核酸,所述核酸展示針對待產(chǎn)生的表達譜中的每個被分析的/描繪的基因的“探針”核酸。在這些分析中,首先從進行分析的原始核酸樣品中制備靶核酸樣品,其中制備可包括用標記物(例如信號產(chǎn)生系統(tǒng)的一個成員)標記所述靶核酸。在制備靶核酸樣品后,將樣品與所述陣列在雜交條件下接觸,從而與同所述陣列表面所附著探針序列互補的靶核酸形成復合物。然后定量或定性檢測雜交復合物的存在。可用于產(chǎn)生本發(fā)明方法中采用的表達譜的特殊雜交技術(shù)包括在如下并入本文作參考的文獻中描述的技術(shù)美國專利 No 5, 143,854,5, 288,644,5, 324,633,5, 432,049,5, 470,710,5, 492,806,5, 503,980、 5,510,270,5, 525,464,5, 547,839,5, 580,732,5, 661,028,5, 800,992,以及 WO 95/21265、 W096/31622、W097/10365、WO 97/27317、EP 373 203 和 EP 785 280 在這些方法中,將包括其表達被分析的每個NPC相關(guān)基因的探針的“探針”核酸陣列與上述靶核酸接觸。在雜交條件例如上述嚴格雜交條件下進行接觸,然后除去未結(jié)合的核酸。所得的雜交核酸模式提供了已經(jīng)探查的每個基因的表達信息,其中所述表達信息是關(guān)于所述基因表達與否以及表達的水平,并且通常表達數(shù)據(jù)即表達譜可為定量和定性的。在一些實施方案中,應(yīng)用上述獲得的關(guān)于所分析的細胞/組織的信息對宿主、對象或患者關(guān)于已經(jīng)發(fā)生的疾病的存在、階段或傾向加以診斷、對疾病過程和結(jié)果加以預測。 例如,在確定進行分析的細胞/組織具有NPC轉(zhuǎn)移表型的情況中,所述信息可用于診斷從中獲得所述細胞/組織的對象具有癌癥復發(fā)的可能性。除了監(jiān)測特定治療方法的效果之外,本發(fā)明可用于篩選潛在的候選藥物在治療 NPC轉(zhuǎn)移可能性中的效果。在這個實施方案中,將用所述候選藥物治療之前和之后的樣品表達譜進行比較,其中經(jīng)治療的樣品的基因表達譜從不佳治療結(jié)果相關(guān)的譜向改善的治療結(jié)果相關(guān)的譜的轉(zhuǎn)變表示藥物的效果??梢允褂贸R?guī)的方法在體外或者在動物模型中進行這種分析。本發(fā)明的NPC相關(guān)基因的集合的另一個應(yīng)用是用于監(jiān)測或評定給定的治療方案。 在這種方法中,使用本文描述的方法監(jiān)測經(jīng)歷治療的患者的細胞/組織樣品,其中將獲得的表達譜與一或多種參考表達譜進行比較,以確定給定的治療方案對治療的疾病是否具有希望的影響。例如,在治療期間從患者中定期獲得表達譜,將其與包括各種NPC轉(zhuǎn)移階段和正常表達譜的一系列參考/對照譜進行比較。在監(jiān)測的表達譜中觀測到的朝向正常表達譜的轉(zhuǎn)變表示給定的治療方案以希望的方式起作用。治療劑篩詵應(yīng)用本發(fā)明還涵蓋了鑒別具有調(diào)節(jié)(例如增強或消除)NPC轉(zhuǎn)移表型能力的物質(zhì)的方法,所述方法可用于鑒別治療劑。調(diào)節(jié)這種表型的化合物的鑒別可以使用任何藥物篩選技術(shù)實現(xiàn)。本發(fā)明的篩選分析通常基于所述物質(zhì)調(diào)節(jié)NPC轉(zhuǎn)移表型決定基因的表達譜的能力。如本文所用,術(shù)語“物質(zhì)(agent) ”是指具有調(diào)節(jié)差異表達的基因產(chǎn)物的生物學活性的能力的任何分子,例如蛋白質(zhì)、小分子或其它藥物。通常將具有不同物質(zhì)濃度的多種分析混合物平行運行,以獲得對不同濃度的反應(yīng)。通常,這些濃度之一作為陰性對照,即為零濃度或者低于檢測水平。候選物質(zhì)涵蓋了各種化學類別的物質(zhì),但其通常是有機分子,優(yōu)選分子量大于50 而小于大約2,500道爾頓的小的有機化合物。候選物質(zhì)通常包含為與蛋白質(zhì)在結(jié)構(gòu)上相互作用所必需的功能基團,特別是氫鍵,通常包括至少一個胺基團、羰基、羥基或羧基,優(yōu)選至少兩個所述化學功能基團。所述候選物質(zhì)通常包含環(huán)狀碳或雜環(huán)結(jié)構(gòu)和/或用一或多個上述功能基團取代的芳香結(jié)構(gòu)或芳香聚合結(jié)構(gòu)。還在生物分子中發(fā)現(xiàn)候選物質(zhì),包括但非限于肽、糖、脂肪酸、類固醇、嘌呤、嘧啶、衍生物、結(jié)構(gòu)類似物或其組合。候選物質(zhì)得自各種來源,包括得自合成或天然的化合物。例如,可利用多種方式隨機及直接地合成各種有機化合物和生物分子,包括隨機化的寡核苷酸和寡肽的表達?;蛘?, 細菌、真菌、植物和動物提取物(包括人體組織提取物,用以鑒別影響差異表達的基因產(chǎn)物的內(nèi)源因子)形式的天然化合物文庫是可利用或易于產(chǎn)生的。另外,天然或合成產(chǎn)生的文庫和化合物易于通過常規(guī)的化學、物理和生物化學方式加以修飾,可用于產(chǎn)生組合文庫。可以對已知的藥物制劑進行直接或隨機化學修飾,如酰化、烷化、酯化、酰胺化等,以產(chǎn)生結(jié)構(gòu)類似物。特別感興趣的候選物質(zhì)例如包括但非限于反義多核苷酸、抗體、可溶的受體等??贵w及可溶的受體是特別感興趣的候選物質(zhì),其中目標差異表達的基因產(chǎn)物在細胞表面分泌或是表面可及的(accessible)(例如與細胞外膜穩(wěn)定關(guān)聯(lián)的受體及其它分子)。篩選分析可以基于本領(lǐng)域技術(shù)人員可利用的及已知的各種技術(shù)。通常地,所述篩選分析包括將已知具有NPC轉(zhuǎn)移表型的細胞或組織與候選物質(zhì)接觸,基于由表型決定基因組成的基因表達譜分析評定對基因表達譜的影響??梢允褂萌魏伪憷姆椒z測所述作用結(jié)果,在許多實施方案中應(yīng)用上述診斷方案。這種分析通常在體外進行,但是對許多分析可以進行修改以適于體內(nèi)分析,例如在動物癌癥模型中進行分析。
藥物靶向篩選在另一個實施方案中,本發(fā)明涉及鑒別本文列出的基因及其產(chǎn)物作為治療靶。在一些方面,這與鑒別具有調(diào)節(jié)(例如降低或增加)NPC轉(zhuǎn)移表型的活性的物質(zhì)的上述分析相反,涉及鑒別特定表型決定基因或其表達產(chǎn)物,以作為治療靶。在這個實施方案中,治療靶是通過檢測可被證實或已經(jīng)被證實調(diào)節(jié)NPC表型(例如抑制或阻抑這種表型)的物質(zhì)的作用而鑒別的。例如,所述物質(zhì)可以是特異于所選擇的基因轉(zhuǎn)錄物的反義寡核苷酸。例如,所述反義寡核苷酸可以具有相應(yīng)于本文表中列出的基因序列的序列。鑒別治療靶的分析可以利用本領(lǐng)域技術(shù)人員熟知的各種方法以各種方式進行。例如,將表達或過表達候選基因例如本文表中列出的基因的測試細胞與已知的NPC藥劑接觸,評估候選基因產(chǎn)物對NPC表型的作用及生物學活性。所述候選基因的生物學活性可以通過檢測例如對編碼候選基因產(chǎn)物的基因表達的調(diào)節(jié)(例如通過轉(zhuǎn)錄物水平或多肽水平的增加或減少進行檢測)或者對及基因產(chǎn)物的酶學或其它活性的調(diào)節(jié)而分析。NPC轉(zhuǎn)移表型的抑制或阻抑表明所述候選基因產(chǎn)物是一種合適的治療靶??蓪Ρ疚闹忻枋龅暮?或本領(lǐng)域已知的分析進行修改以適于鑒別治療靶。通常地,這種分析是在體外進行的,但是可以對許多分析進行修改以適合體內(nèi)分析,例如在合適的本領(lǐng)域公認的動物模型中進行的分析。試劑與試劑盒本發(fā)明還提供了進行上述一或多種方法的試劑及其試劑盒。所述試劑及其試劑盒可以非常不同。感興趣的試劑包括特別設(shè)計用于產(chǎn)生上述NPC表型決定基因的表達譜的試劑。一種類型的這種試劑是核酸探針陣列,其中存在感興趣的NPC轉(zhuǎn)移表型決定基因。本領(lǐng)域已知各種不同的陣列形式,具有多種不同的探針結(jié)構(gòu)、基底成分和附著技術(shù)。感興趣的代表性陣列結(jié)構(gòu)包括如下并入作參考的文獻中所描述的那些陣列美國專利 No. 5,143,854,5, 288,644,5, 324,633,5, 432,049,5, 470,710,5, 492,806,5, 503,980、 5,510,270,5, 525,464,5, 547,839,5, 580,732,5, 661,028,5, 800,992,以及 WO 95/21265、 W096/31622.W0 97/10365,WO 97/27317,EP 373 203 和 EP 785280。在許多實施方案中,所述陣列包括本文列出的至少兩個基因的探針。在某些實施方案中,陣列上存在的基因數(shù)目為至少5、10、25、50或更多個,包括本文列出的所有基因。所述陣列可僅包括本文列出的那些基因,或者其還可包括本文未列出的其它基因。在某些實施方案中,當所述陣列包括這種其它基因的探針時,存在的其它基因數(shù)的百分比不超過大約50%,通常不超過大約25%。 在許多實施方案中,當包括這種其它基因時,所述集合中的大多數(shù)基因是NPC癌癥表型決定基因,大多數(shù)是指至少大約75%,通常為至少大約80%,有時為至少大約85、90、95%或更高,包括所述集合中100%的基因是NPC癌癥表型決定基因的實施方案。在許多實施方案中,所述陣列中代表的至少一種基因是其在功能上不易參與NPC癌癥表型的產(chǎn)生的基因。特別適合產(chǎn)生NPC癌癥表型決定基因的表達譜的另一種類型的試劑是設(shè)計為選擇性擴增這種基因的基因特異性引物的集合?;蛱禺愋砸锛捌涫褂梅椒ㄔ诿绹鴮@?No. 5,994,076中描述,所述專利在此并入作參考。特別感興趣的是具有本文列出的至少兩種基因的引物的基因特異性引物集合。在某些實施方案中,具有所述集合中的引物的這種基因的數(shù)目是至少5、10、25、50或更多種,包括本文列出的所有基因。所述基因特異性引物集合可僅包括本文列出的那些基因,或者可包括本文未列出的其他基因的引物。在所述基因特異性引物集合包括這種另外的基因的情況中,在某些實施方案中所述另外的基因的百分數(shù)不超過大約50 %,通常不超過大約25%。在許多實施方案中,在包括這種另外的基因的情況中,集合中的大多數(shù)基因是NPC表型決定基因,大多數(shù)是指至少大約75%,通常為至少大約80%,有時為至少大約85、90、95%或更高,包括其中集合中100%的基因是NPC表型決定基因的實施方案。在許多實施方案中,基因特異性引物集合中代表的至少一種基因是其在功能上不易于參與NPC癌癥表型產(chǎn)生的基因。本發(fā)明的試劑盒可包括上述陣列和/或基因特異性引物集合。所述試劑盒可進一步包括用于各種方法中的一或多種另外的試劑,如產(chǎn)生靶核酸、dNTP和/或rNTP的引物, 它們可以是預先混合的或單獨的,一或多種獨特標記的dNTP和/或rNTP,如生物素?;幕駽y3或Cy5標記的dNTP,具有不同的散射光譜的金或銀粒子,或者其他合成后標記試劑,如熒光染料的化學活性衍生物,酶如逆轉(zhuǎn)錄酶,DNA聚合酶,RNA聚合酶等,各種緩沖介質(zhì),例如雜交和洗滌緩沖液,預制的探針陣列,標記的探針純化試劑和成分,如離心柱(spin columns)等,信號產(chǎn)生和檢測試劑,例如鏈霉親和素-堿性磷酸酶結(jié)合物,化學熒光或化學發(fā)光物等。除了上述成分之外,所述試劑盒進一步包括實踐本發(fā)明方法的說明書。這些說明書可以各種形式存在于所述試劑盒中,其中一或多種可存在試劑盒中。這些說明書的一種形式是印刷于合適的介質(zhì)或基質(zhì)上,例如試劑盒包裝內(nèi)或者包裝插入頁等中的印有所述信息的一或多張紙等。另一種方式是計算機可讀介質(zhì),例如其上記錄了所述信息的磁盤、CD 等。另一種方式是用于通過因特網(wǎng)在遠程位置獲取所述信息的網(wǎng)址。治療NPC轉(zhuǎn)移的化合物和方法本發(fā)明還提供了可以減少NPC轉(zhuǎn)移可能性的方法和組合物。本發(fā)明提供了通過調(diào)節(jié)一或多種靶基因的表達或者其一或多種產(chǎn)物的活性而減輕例如治療這種疾病的方法,其中所述靶基因是一或多種本文列出的NPC表型決定基因。某些NPC疾病至少部分是由基因產(chǎn)物水平過多或者存在顯示異?;蜻^高活性的基因產(chǎn)物而引起的。如此,降低這種基因產(chǎn)物的水平和/或活性將使得疾病的復發(fā)得以減少。下文描述了降低靶基因表達水平或靶基因產(chǎn)物活性水平的技術(shù)?;蛘?,某些其他NPC疾病階段至少部分是由于缺乏基因表達或基因表達水平降低或者基因產(chǎn)物活性水平降低所致。如此,增加基因表達水平和/或所述基因產(chǎn)物的活性可以改善所述疾病。下文描述了增加靶基因表達水平或靶基因產(chǎn)物活性水平的技術(shù)。抑泡丨突變的靶基因的表達、合成或活+牛的化合物如上所述,參與NPC疾病的靶基因可以通過靶基因活性水平增加而導致所述疾病。在疾病條件下細胞/組織中的基因處于正調(diào)節(jié)的情況中,可以利用各種技術(shù)抑制這種靶基因和/或蛋白質(zhì)的表達、合成或活性。例如,根據(jù)本發(fā)明可應(yīng)用經(jīng)本發(fā)明所述方法鑒別的呈現(xiàn)抑制性活性的那些化合物以改善疾病癥狀。如上所述,所述分子可包括但非限于小的有機分子、肽、抗體等。抑制性抗體技術(shù)在下文描述。例如,可給予與內(nèi)源配體競爭靶基因產(chǎn)物的化合物,其中所述靶基因產(chǎn)物與內(nèi)源配體結(jié)合。所得配體結(jié)合的靶基因數(shù)目的減少將調(diào)節(jié)內(nèi)皮細胞生理學。特別用于這種目的的化合物包括例如可溶的蛋白質(zhì)或肽,如包含靶基因產(chǎn)物的一或多個胞外結(jié)構(gòu)域或其一部分和/或類似物的肽,包括例如可溶的融合蛋白如具有Ig-尾(Ig-tailed)的融合蛋白(關(guān)于產(chǎn)生具有Ig尾的融合蛋白的描述見例如美國專利No. 5,116,964.)。或者,結(jié)合靶基因產(chǎn)物受體位點但不激活所述蛋白質(zhì)的化合物如配體類似物或抗體(例如受體-配體拮抗劑) 可有效抑制靶基因產(chǎn)物活性。另外,根據(jù)本發(fā)明也可以應(yīng)用抑制靶基因表達的反義和核酶分子抑制異常的靶基因活性。這種技術(shù)在下文描述。另外,也如下文所描述,可利用三螺旋分子抑制異常的靶基因活性。抑制性反義物、核酶和三螺旋方案顯示降低NPC轉(zhuǎn)移能力的化合物是反義物、核酶和三螺旋分子。這種分子被設(shè)計為降低或抑制突變的靶基因活性。產(chǎn)生和應(yīng)用這種分子的技術(shù)為本領(lǐng)域技術(shù)人員所熟知。反義RNA和DNA分子通過與靶mRNA雜交及阻止蛋白質(zhì)翻譯而直接阻斷mRNA的翻譯。關(guān)于反義DNA,優(yōu)選衍生自翻譯起始位點、例如位于感興趣的靶基因核苷酸序列的-10 至+10區(qū)域之間的寡脫氧核糖核苷酸。核酶是能催化RNA特異性裂解的酶RNA分子。核酶的作用機制包括核酶分子與互補的靶RNA的序列特異性雜交,隨后經(jīng)內(nèi)切核酸酶切割。核酶分子的成分必須包括與靶基因mRNA互補的一或多個序列,以及必須包括mRNA切割所需的熟知的催化序列。為此參見以其全文并入作參考的美國專利No. 5,093,246所描述。由此在本發(fā)明范圍內(nèi)的是工程化錘頭狀基序核酶分子,其特異性地和有效地催化編碼靶基因蛋白質(zhì)的RNA序列的內(nèi)切核酸酶切割。任何潛在的RNA靶內(nèi)的特異性核酶切割位點最初是通過掃描包括GUA、GUU和GUC序列的感興趣的分子的核酶切割位點而鑒別。一旦鑒別,則可以評價相應(yīng)于包含所述切割位點的靶基因區(qū)域的15-20個核糖核苷酸的短RNA序列的預測的結(jié)構(gòu)特點,如可導致寡核苷酸序列不合適的二級結(jié)構(gòu)。候選序列的適合性也可以通過使用核糖核酸酶保護分析測試其與互補的寡核苷酸雜交的可能性而評價。在三螺旋構(gòu)成中用于抑制轉(zhuǎn)錄的核酸分子應(yīng)是單鏈的并由脫氧核糖核苷酸組成。這些寡核苷酸的基本成分必須設(shè)計為通過Hoogsteen堿基配對原則促進三螺旋形成,這通常需要雙鏈體的一個鏈中存在相當大的一段嘌呤或嘧啶的序列。核苷酸序列可以基于嘧啶,這樣將產(chǎn)生跨越(across) 所得三螺旋的三個相關(guān)聯(lián)鏈的TAT和CGC+三聯(lián)體。富含嘧啶的分子提供了與雙鏈體的一個鏈的富含嘌呤區(qū)域以與該鏈平行的方向的堿基互補。另外,可以選擇富含嘌呤的核酸分子,例如一段含有G殘基的序列。這些分子與富含GC堿基對的DNA雙鏈體形成三螺旋,其中大部分嘌呤堿基位于靶雙鏈體的一個鏈上,導致GGC三聯(lián)體跨越三螺旋中的三個鏈?;蛘?,可被靶向而用于三螺旋形成的潛在序列可通過產(chǎn)生所謂的“switctiback”核酸分子而增加。SwitctAack分子是以交替的5' -3'、3' -5'方式合成的,由此其首先與雙鏈體的一個鏈進行堿基配對,然后與另一個鏈進行堿基配對,從而無需在雙鏈體的一個鏈上存在一段相當大的嘌呤或嘧啶的序列。本文描述的反義物、核酶和/或三螺旋分子可降低或抑制正常及突變的靶基因等位基因產(chǎn)生的mRNA的轉(zhuǎn)錄(三螺旋)和/或翻譯(反義物、核酶)。 為了保證維持靶基因活性的正常水平,可以將編碼和表達呈現(xiàn)正?;钚缘陌谢蚨嚯牡暮怂岱肿油ㄟ^基因療法導入細胞中,所述基因療法如下文所述那些方法,不包含對應(yīng)用的反義物、核酶或三螺旋治療易感的序列。為了保證維持靶基因活性在基本正常的水平,可以將編碼和表達呈現(xiàn)正?;钚缘陌谢蚨嚯牡暮怂岱肿油ㄟ^如下文所述基因療法導入細胞中, 所述核酸分子不包含對應(yīng)用的反義物、核酶或三螺旋處理易感的序列?;蛘撸蓛?yōu)選將正常的靶基因蛋白質(zhì)共同給予所述細胞或組織中,以維持細胞或組織靶基因活性的必需水平。
可以根據(jù)本領(lǐng)域已知的合成DNA和RNA分子的任何方法制備本發(fā)明的反義RNA和 DNA、核酶及三螺旋分子。這些方法包括本領(lǐng)域熟知的化學合成寡脫氧核糖核苷酸和寡核糖核苷酸技術(shù),例如固相膦酰胺(phosphoramidite)化學合成方法?;蛘?,RNA分子可以通過編碼反義RNA分子的DNA序列的體外和體內(nèi)轉(zhuǎn)錄而產(chǎn)生。這種DNA序列可以摻入包含合適的RNA聚合酶啟動子如T7或SP6聚合酶啟動子的多種載體中?;蛘?,可以將根據(jù)所用啟動子而組成型或誘導型合成反義RNA的反義cDNA構(gòu)建體穩(wěn)定導入細胞系中??梢詫NA分子中進行各種熟知的修飾以提高胞內(nèi)穩(wěn)定性和半衰期??赡艿男揎棸ǖ窍抻谠谒龇肿拥?’和/或3’末端兩側(cè)加入核糖核苷酸或脫氧核糖核苷酸序列, 或者在寡脫氧核糖核苷酸主鏈中使用硫代磷酸或者2' 0-甲基鍵而不是磷酸二酯鍵。靶基因產(chǎn)物的抗體可以使用特異于靶基因蛋白質(zhì)并干擾其活性的抗體以抑制靶基因功能。這種抗體可以使用本領(lǐng)域已知的標準技術(shù)針對蛋白質(zhì)自身或者相應(yīng)于蛋白質(zhì)一部分的肽而產(chǎn)生。這種抗體包括但非限于多克隆抗體、單克隆抗體、Fab片段、單鏈抗體、嵌合抗體等。在靶基因蛋白質(zhì)是胞內(nèi)完整抗體的情況中,可優(yōu)選內(nèi)化型抗體(internalizing antibody)。然而,可以使用Iipofectin脂質(zhì)體將所述抗體或結(jié)合靶基因表位的Fab區(qū)域片段輸送至細胞中。在使用所述抗體的片段的情況中,優(yōu)選結(jié)合靶蛋白質(zhì)的結(jié)合結(jié)構(gòu)域的最小抑制片段。例如,可以使用這樣的肽,其具有相應(yīng)于結(jié)合靶基因蛋白質(zhì)的抗體可變區(qū)的結(jié)構(gòu)域的氨基酸序列。這種肽可以是利用本領(lǐng)域熟知的方法經(jīng)化學合成的或者通過重組 DNA技術(shù)產(chǎn)生的(例如見Creighton, 1983,如前;及Sambrook et al.,1989,如前所述)。 或者,也可以給予結(jié)合胞內(nèi)靶基因表位的單鏈中和抗體。這種單鏈抗體可例如通過在靶細胞群內(nèi)表達編碼單鏈抗體的核苷酸序列而給予,通過例如Marasco et al. (Marasco, W. et al.,1993,Proc. Natl. Acad. Sci. USA 90 :7889-7893)所述那些技術(shù)進行。在一些情況中,靶基因蛋白質(zhì)是胞外蛋白質(zhì)或者是跨膜蛋白質(zhì)。特異于基因產(chǎn)物的一或多個胞外結(jié)構(gòu)域并干擾其活性的抗體特別適用于治療乳腺癌。由于這種抗體可從血流中直接到達靶區(qū)域而特別有效。下文描述的適合給予肽的任何給予技術(shù)均可用于將抑制性靶基因抗體有效地給予至其作用部位。恢復靶基因活性的方法導致NPC轉(zhuǎn)移的靶基因在疾病狀態(tài)下可以被低表達。在基因在疾病狀態(tài)下被下調(diào)或者靶基因產(chǎn)物的活性被消除,導致疾病癥狀產(chǎn)生的情況中,可以應(yīng)用這樣的方法,其使得靶基因活性水平可以增加至其中NPC疾病癥狀得以改善的水平?;蚧钚运娇衫缤ㄟ^增加存在的靶基因產(chǎn)物的水平或者通過增加存在的活性靶基因產(chǎn)物的水平而增加。例如,可以給予呈現(xiàn)這種癥狀的患者足以降低NPC轉(zhuǎn)移的水平的靶基因蛋白質(zhì)。 可利用下文描述的任何技術(shù)進行給予。本領(lǐng)域技術(shù)人員已知怎樣利用下文描述的那些技術(shù)確定正常靶基因蛋白質(zhì)的有效非毒性劑量濃度。另外,可以將編碼靶基因蛋白質(zhì)的RNA序列直接給予顯示NPC轉(zhuǎn)移的患者,所述的 RNA序列以足以產(chǎn)生改善這種癥狀的靶基因蛋白質(zhì)的水平濃度給予??梢岳孟挛拿枋龅目蓪崿F(xiàn)胞內(nèi)給予化合物的任何技術(shù)如脂質(zhì)體給予法來給予這種RNA分子。所述RNA分子可以例如通過本領(lǐng)域已知的重組技術(shù)產(chǎn)生。另外,可以通過基因置換療法治療患者。使用載體可以將正常靶基因的一或多個拷貝或者指導具有靶基因功能的正常靶基因蛋白質(zhì)產(chǎn)生的基因部分插入細胞中,所述載體除了將DNA導入細胞中的其他微粒如脂質(zhì)體之外,還包括但非限于腺病毒載體、腺伴隨病毒載體和逆轉(zhuǎn)錄病毒載體。另外,可利用如上述那些技術(shù)將正常靶基因序列導入人體細胞中。然后將含有表達基因序列的正常靶基因的細胞、優(yōu)選自體細胞導入或者再導入患者一定部位中以改善癥狀。當例如靶基因產(chǎn)物是分泌的胞外基因產(chǎn)物時,優(yōu)選這種細胞置換技術(shù)。藥物制備與給藥方法經(jīng)鑒別抑制靶基因表達、合成和/或活性的化合物可以治療有效量給予患者,以治療或降低NPC轉(zhuǎn)移。治療有效量是指足以使得癥狀改善的化合物的量。有效量所述化合物的毒性和治療效果可以通過標準藥物學方法在細胞培養(yǎng)物或?qū)嶒瀯游镏写_定,例如確定LD50(50%致死量)和ED50(50%治療有效量)。毒性與治療作用之間的劑量比率為治療指數(shù),其可以LD50/ED50比率表示。顯示較高治療指數(shù)的化合物是優(yōu)選的。當使用呈現(xiàn)毒性副作用的化合物時,應(yīng)仔細設(shè)計輸送系統(tǒng)以將這種化合物靶向受影響組織部位,使得對未受影響的細胞的潛在損害最小化,從而降低副作用。得自細胞培養(yǎng)物分析和動物研究的數(shù)據(jù)可用于制定用于人體的劑量范圍。這種化合物的劑量優(yōu)選包括ED50的循環(huán)濃度范圍,在所述濃度范圍毒性很低或無毒性。所述劑量根據(jù)應(yīng)用的劑型和給藥途徑而可以在這個范圍內(nèi)變化。對于本發(fā)明方法中使用的任何化合物而言,治療有效量最初可以從細胞培養(yǎng)物分析中估算。可以在動物模型中配制藥劑以達到這樣的循環(huán)血漿濃度范圍,其中包括在細胞培養(yǎng)物中確定的IC50(即達到癥狀的半數(shù)最大抑制的測試化合物濃度)與相同水平的范圍。這個信息可用于更精確地確定在人體中的有效劑量。血漿中的水平可以例如通過高效液相層析技術(shù)測量。配制及應(yīng)用根據(jù)本發(fā)明應(yīng)用的藥物組合物可以使用一或多種生理學可接受的載體或賦形劑以常規(guī)方式配制。因此,可以配制所述化合物及其生理學可接受的鹽和溶劑化物,以通過吸入或吹入法(通過口或鼻)或者口服、含服、腸道外或直腸給藥方式給予。對于口服給予方式,藥物組合物可以是例如通過常規(guī)方式用藥物學可接受的賦形劑配制的片劑或膠囊,所述賦形劑如結(jié)合劑(例如預糊化的玉米淀粉、聚乙烯吡咯烷酮或羥丙基甲基纖維素)、充填劑(例如乳糖、微晶纖維素或磷酸氫鈣)、潤滑劑(例如硬脂酸鎂、滑石或硅石)、崩解劑(例如馬鈴薯淀粉或羧甲淀粉鈉(sodium starch glycolate)), 或者增濕劑(例如十二烷基硫酸鈉)。片劑可以通過本領(lǐng)域熟知的方法包被??诜囊后w制品可以是例如溶液、糖漿或懸浮液形式,或者可以是干品,在使用之前用水或其他合適載體組建。這種液體制品可以通過常規(guī)方式用藥物學合適的添加劑制備,所述添加劑如懸浮劑(例如山梨醇糖漿、纖維素衍生物或氫化可食用脂肪)、乳化劑(例如卵磷脂或阿拉伯樹膠)、非水溶液載體(例如杏仁油、油脂、乙醇或分餾的植物油),及防腐劑(例如甲基或丙基-P-對羥苯甲酸酯或山梨酸)。所述制品也可以適當?shù)睾芯彌_鹽、調(diào)味品、色素和甜味劑。
口服制品可以適當配制以控制活性化合物的釋放。對于含服方式給藥,組合物可以是以常規(guī)方式配制的片劑或錠劑形式。對于吸入方式給藥,本發(fā)明使用的化合物是從加壓包裝或噴霧器中以氣霧形式常規(guī)給予的,使用合適的推進劑如二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其他合適的氣體。在加壓氣霧劑情況中,劑量單位可以通過輸送計量數(shù)量的閥門控制而確定。用于吸入器或吹入器中的例如凝膠的藥囊(Capsules) 和藥筒(cartridges)可以配制為含有所述化合物及合適的粉末基質(zhì)如乳糖或淀粉的混合粉末的形式。化合物可以配制為用于通過注射經(jīng)腸道外給予,例如推注或持續(xù)輸注而給予。注射配制品可以單位劑量形式存在,例如存在于具有添加的防腐劑的安瓿或多劑量容器中。 組合物可以是油相或水相載體中的懸浮液、溶液或乳狀液形式,可以含有配制劑如懸浮劑、 穩(wěn)定劑和/或分散劑?;蛘?,活性成分可以是在使用之前用合適載體如無菌無熱原水組建的粉末形式。化合物也可以配制為經(jīng)直腸給藥形式,如栓劑或保留灌腸,例如含有常規(guī)的栓劑基質(zhì)如可可油或其他甘油酯。除了前述的配制品之外,化合物也可以配制為儲庫型(cbpot)制品。這種長效配制品可以通過植入(例如皮下或肌內(nèi))或者通過肌內(nèi)注射給予。因此,例如化合物可以用合適的聚合物或疏水材料或者離子交換樹脂配制,或者配制為難溶的衍生物,例如難溶的鹽。如果需要,則組合物可以存在于包含含活性成分的一或多個劑量形式的包裝或分配器中。所述包裝可例如包含金屬或塑料薄膜,如鋁塑包裝。所述包裝或分配器可以附帶給藥說明書。附圖簡述結(jié)合附圖可以更好地認識到本發(fā)明的各種特征及伴隨的優(yōu)勢,其中不同視圖中相同或相似的部分用類似參考特征標出
圖1示出了用于基于mRNA轉(zhuǎn)錄物譜數(shù)據(jù)產(chǎn)生和確認分子預測因子的策略概述。圖2示出了使用選自96個訓練組(training set)病例的798個基因進行的分層聚類分析(hierarchical cluster analysis) 0各個基因在左側(cè)和右側(cè)成排示出。各個病例在上方以柱示出。結(jié)果表明基因簇聚于6個組中,在左側(cè)以有色條柱示出。圖3示出對通過52個基因特征和k-最近鄰分類方法(k-nearest neighbors classifying method)預測為低遠處轉(zhuǎn)移風險和高遠處轉(zhuǎn)移風險病例進行的無轉(zhuǎn)移生存概率和總體生存概率的Kaplan-Meier分析。所示結(jié)果得自獨立的測試組病例。ρ值用 log-rank檢驗計算。圖4示出對通過12個基因特征和邏輯回歸模型預測為低遠處轉(zhuǎn)移風險和高遠處轉(zhuǎn)移風險病例進行的無轉(zhuǎn)移生存的概率和總體生存的概率的Kaplan-Meier分析。所示結(jié)果得自獨立的測試組病例。P值用log-rank檢驗計算。圖5示出根據(jù)52個基因和12個基因特征的組合預測結(jié)果對無轉(zhuǎn)移生存的概率和總體生存的概率的Kaplan-Meier分析。在兩種特征之間示出不一致結(jié)果的病例被認為是 “不確定病例”(表6)。示出一致結(jié)果的病例分類為低或高遠處轉(zhuǎn)移風險的類別。當對比低風險和高風險特征組的無轉(zhuǎn)移和總體生存期時,P值分別< 0. 0001和0. 002。不確定組與低風險或高風險組之間在無轉(zhuǎn)移生存期(P = 0. 09和0. 05)和總體生存期(p = 0. 31和0. 09)之間無顯著差異。ρ值用log-rank檢驗計算。圖6示出對有和無遠處轉(zhuǎn)移的III期或IVa/b期NPC患者之間總體生存期和無轉(zhuǎn)移生存期的概率的Kaplan-Meier分析。這項研究中包括的大多數(shù)患者在1997年至2002 年之間根據(jù)制定的方案開始接受治療,隨后定期進行。上面一組示出四組患者的總體生存期曲線。有106名III期患者不發(fā)生遠處轉(zhuǎn)移,27名III期患者發(fā)生遠處轉(zhuǎn)移。相似地,有 47名IV期患者不發(fā)生遠處轉(zhuǎn)移,35名IV期患者發(fā)生遠處轉(zhuǎn)移。發(fā)生和不發(fā)生遠處轉(zhuǎn)移的 III期或IVa/b期患者之間的總體生存期的差異均是顯著的,ρ值< 0. 0001。在發(fā)生(p = 0. 39)或不發(fā)生(ρ = 0. 35)遠處轉(zhuǎn)移的III期和IVa/b期患者之間無顯著差異。下面一組示出最后發(fā)生遠處轉(zhuǎn)移的III期和IVa/b期患者的無轉(zhuǎn)移生存期的概率。所有III期患者僅用同時的化療-放療和輔助化療治療,而對IVa/b期患者加上維持化療。圖7示出兩個不同操作者之間“存在(present),,的探針集的中位值強度相關(guān)性。 訓練組中所有NPC樣品均由兩個操作者隨機操作。操作者A操作訓練組中M個無轉(zhuǎn)移病例和14個陽性轉(zhuǎn)移病例。操作者B操作35個無轉(zhuǎn)移病例和18個陽性轉(zhuǎn)移病例。計算每個操作者操作的病例的每個探針集的標準化表達強度的中位值。結(jié)果示出完全的對角線性相關(guān),提示不存在與操作者相關(guān)的系統(tǒng)性偏差。圖8示出在探針水平校正實驗偏差的分位數(shù)校正(Quantile normalization)結(jié)果。來自6個(I-VI)不同NPC樣品的cRNA樣品分為兩部分,與兩種U133-A基因芯片在不同日期雜交。對于每個病例,在U133-A基因芯片上進行人基因的所有探針集的強度相關(guān)性分析,如圖所示。上面一組示出來自未標準化的chp文件的探針集強度的相關(guān)性。中間組示出在按比例換算切尾均值為500之后探針集強度的相關(guān)性。下面一組示出在將所有人探針集的表達強度經(jīng)分位數(shù)校正為預先確定的標準值之后探針集強度的相關(guān)性。結(jié)果示出在探針集水平分位數(shù)校正有效校正了實驗偏差。不用進一步詳細描述,據(jù)信本領(lǐng)域技術(shù)人員根據(jù)前文描述可以最大程度應(yīng)用本發(fā)明。如下優(yōu)選的特定實施方案僅是例證了本發(fā)明,而無以任何方式限制本發(fā)明之意。在前述及如下的實施例中,除非特別指出,則所有溫度均設(shè)定為攝氏度,所有部分和百分比均為重量比。在優(yōu)選的方面中,本發(fā)明提供了 1.評估鼻咽癌患者發(fā)生遠處轉(zhuǎn)移的風險的方法,所述方法包括評估得自所述患者的樣品中表4和5所列基因中的至少一個基因的表達譜。2.如1所述的方法,包括評估表4列出的52個基因中的兩或多個基因的表達譜。3.如1所述的方法,其包括評估表4列出的52個基因的表達譜。4.如3所述的方法,其中對表4所列52個基因的表達的評估是使用表4示出的9 個基因簇中的每一個基因簇的回歸模型進行的。5.如4所述的方法,其中洛基分數(shù)(logit score)是針對所述9個基因簇中的每一個基因簇使用表1所示的相應(yīng)的回歸模型公式產(chǎn)生的。6.如5所述的方法,其中遠處轉(zhuǎn)移風險的預測規(guī)則是通過應(yīng)用于所述9個基因簇的所述洛基分數(shù)的k-最近鄰分類方法而產(chǎn)生的。7.如1所述的方法,包括評估表5列出的12個基因中的兩或多個基因的表達譜。8.如1所述的方法,包括評估表5列出的12個基因的表達譜。
9.如8所述的方法,其中表5列出的12個基因的表達的評估是使用邏輯回歸模型進行的。10.如9所述的方法,其中洛基分數(shù)是使用表2的回歸模型公式基于所述12個基因的表達譜而產(chǎn)生,所述洛基分數(shù)與發(fā)生遠處轉(zhuǎn)移的風險相關(guān)聯(lián)。11.如10所述的方法,其中低遠處轉(zhuǎn)移風險的預測規(guī)則是= 1
I + e-(洛基分數(shù)).12.如6所述的方法,其中將得自所述預測規(guī)則的遠處轉(zhuǎn)移風險與得自第二獨立
預測規(guī)則的遠處轉(zhuǎn)移風險進行對比,所述第二預測規(guī)則是使用如下公式評估所述風險= 1
I + e_(洛基分數(shù))其中洛基分數(shù)是使用表2的回歸模型公式和表5列出的12個基因的表達譜產(chǎn)生的。13.如12所述的方法,當從這兩種方法中確定的遠處轉(zhuǎn)移風險均為低或高時,則分別將該風險記錄為低風險或高風險;當所述確定的風險不一致時,則將該風險記錄為不確定。14.如1所述的方法,其中所述表達譜在NPC腫瘤樣品中評估。15.如1所述的方法,其中所述表達譜從mRNA轉(zhuǎn)錄中產(chǎn)生。16.用于確定鼻咽癌患者中遠處轉(zhuǎn)移風險的核酸微陣列,其主要由確定下述基因的表達譜的探針組成(a)表4列出的52個基因,(b)表5列出的12個基因或者(c)所述 52個及12個基因。17.在介質(zhì)或試劑盒形式中的集合,其主要由表4列出的所有52個基因和/或表 5列出的所有12個基因;和/或所述52個基因的子集或所述12個基因的子集或前述兩個子集組成,在每種情況中所述子集均可有效預測鼻咽癌患者發(fā)生遠處轉(zhuǎn)移的風險。
實施例實施例1對在治療之前獲得的原發(fā)NPC的138個組織活檢樣品進行mRNA轉(zhuǎn)錄物譜分析。 所述樣品代表NPC患者的兩個相反臨床組在開始治療后三年內(nèi)發(fā)生遠處轉(zhuǎn)移組(高風險組,η = 47)、隨診三年以上的時間內(nèi)無遠處轉(zhuǎn)移組(低風險組,η = 91)。將138個樣品的 2/3隨機確定為訓練組,1/3隨機確定為測試組。進行監(jiān)督分析(Supervised analyses)以揭示訓練組(n = 96)中與發(fā)生遠處轉(zhuǎn)移相關(guān)的基因表達特征。所揭示的分子預測因子在單獨的42個樣品的測試組中確證?;颊哌x擇和腫瘤組織可利用在臺灣臺北辜公亮基金會和信治癌中心腫瘤庫(KF-SYSCC)于1992年至 2004年收集的375名NPC患者的原發(fā)腫瘤的新鮮冷凍的活檢組織樣品進行總RNA提取。獲得所有患者的書面知情同意書,并且這項研究獲得倫理委員會的許可。105名患者的RNA嚴重降解,將其從該研究中排除。在剩余的270個樣品中,僅138個樣品符合如下任一標準, 選擇用于該研究中。針對留待選用的患者的第一項選擇標準是其未發(fā)生遠處轉(zhuǎn)移及在開始治療的三年或更多年內(nèi)定期隨診。這組患者(n = 91)稱作遠處轉(zhuǎn)移臨床低風險組。針對留待選用的患者的第二個選擇標準是其在接受首次治療時已經(jīng)發(fā)生遠處轉(zhuǎn)移或者在開始治療的三年內(nèi)發(fā)生遠處轉(zhuǎn)移。遠處轉(zhuǎn)移是指NPC在肺、骨、肝、腎、腦及其他內(nèi)臟器官中的轉(zhuǎn)移。經(jīng)過細針穿刺活檢或者穿刺活檢經(jīng)組織學檢測證實轉(zhuǎn)移。這組患者(n = 47)稱作遠處轉(zhuǎn)移臨床高風險組。在1995年至2004年之間收集所有符合條件的患者的原發(fā)腫瘤組織活檢樣品,排除在1992年收集的一個樣品。大多數(shù)樣品(83%)在1998年至2001年收集?;颊吣挲g在診斷時為11至71歲,中值和平均值分別為44和45歲。在最初診斷和分期后,根據(jù)擬定方案對患者進行治療31。后續(xù)的治療時間的中值和平均值分別為3. 34和3. 年。在后續(xù)的治療期間,四名患者死亡,其中28名患者為臨床高風險組成員。根據(jù)1997AJCC規(guī)定對NPC 患者進行分期。mRNA轉(zhuǎn)錄物譜分析研究使用Trizol試劑(Invitrogen,Carlsbad, CA),根據(jù)廠商指導從于液氮中冷凍的組織中分離總RNA。使用RNAEasy Mini試劑盒(Qiagen,Valencia,CA)對分離的RNA進一步純化,在 Agilent 2100 生物分析儀(Agilent Technologies, ffaldbronn, Germany)中通過RNA 6000 Nano分析定性。用于基因表達譜研究的所有RNA樣品的RNA分子完整性指數(shù) (RNA Integrity Number, RIN)均在 6. 0 至 10. 0 之間(7. 8士 1. 1,平均值士SD)之間。根據(jù)Affymetrix方案從總RNA中制備雜交靶,并與Affymetrix U133A基因芯片雜交。所述 U133 A基因芯片含有大約13,000個人體基因的22,238個探針集。所述陣列的特征為常見那樣,例如在 Affymetrix 網(wǎng)站(www, affymetrix. com/products/arrays)詳細描述。簡而言之,從每個樣品的8 μ g總RNA中合成雙鏈cDNA。生物素標記的互補RNA(cRNA)通過從cDNA中體外轉(zhuǎn)錄而產(chǎn)生。在雜交之前純化所述cRNA并經(jīng)化學方式片段化。根據(jù)生產(chǎn)商的方案組合特定量的片段化cRNA、探針陣列對照、牛血清白蛋白和鯡精DNA以制備混合物。 將所述cRNA混合物與寡核苷酸探針在U133A基因芯片上在45°C雜交16小時。在雜交后, 使用EukGE WS2v4方案將雜交的探針陣列在Affymetrix基因芯片洗滌工作站400中進行自動洗滌和染色。之后在Affymetrix GeneArray掃描儀2500中掃描U133A基因芯片。微陣列數(shù)據(jù)的換算與標準化使用Affymetrix Microarray Analysis Suite (MAS) 5. 0 軟件,通過靶修正均值 500換算確定每個基因的表達強度。U133A基因芯片上經(jīng)換算的所有人體基因的表達強度以基數(shù)2進行對數(shù)轉(zhuǎn)換,使用分位數(shù)校正方法標準化32。分位數(shù)校正的參考標準預先在我們的實驗室中從164個原發(fā)NPC、15個正常鼻咽部組織及23個轉(zhuǎn)移的NPC的U133A基因芯片數(shù)據(jù)中確定。見2004年12月20日的USSN 11/015, 764及2004年3月28日的USSN 11/090,294所述,所述文獻在此以其全部內(nèi)容并入作參考。其他U133A基因芯片數(shù)據(jù)的定性測量數(shù)據(jù)包括作為“存在”而可察覺的基因的百分比(52. 1 士 5.8%,平均值士 SD),及 GAPDH 3’與5’的比率(0.96士0. 18,平均值士SD)。這兩個參數(shù)均支持樣品和分析的良好總體質(zhì)量。實施例II
數(shù)據(jù)的統(tǒng)計學分析應(yīng)用的統(tǒng)計學分析方法在圖1中概括示出。樣品分為訓練組和測試組在我們的研究所包括的138個NPC病例中,91個病例在開始首次治療后不發(fā)生任何遠處轉(zhuǎn)移并隨診超過三年。這91個病例分類為臨床低遠處轉(zhuǎn)移風險組。在剩余的47個病例中,在首次治療或者在開始首次治療后的三年內(nèi)均發(fā)生遠處轉(zhuǎn)移。將其分類為臨床高遠處轉(zhuǎn)移風險組。對于所有患者,首次診斷日期與首次治療日期之間的平均間隔為20士51 天(平均值士 SD)。使用SAS軟件(版本9. 1)將每個風險組2/3的患者隨機指定為訓練組 (SAS軟件可得自SAS Institute Inc.,Cary, NC.)。1/3的患者指定為測試組。對低風險組患者根據(jù)性別、年齡(彡和> 45歲)、1997AJCC Μ分期(I和II期對III和IV期)、后續(xù)治療時間(彡和>4. 5年)分出層次。對高風險組患者根據(jù)性別、年齡、 !分期及從首次治療至發(fā)生遠處轉(zhuǎn)移的時間( <和> 1. 5年)分級。在訓練組中有62個低風險病例和 34個高風險病例;在獨立的測試組中有四個低風險病例和13個高風險病例。所述獨立的測試組樣品不參與訓練過程。選擇用于分析的基因僅選擇通過Affymetrix MAS5. 0軟件在排除測試組樣品的所有NPC樣品中確定 “存在”其表達的探針進行分析。首先使用GeneLinker Platinum 4. 5軟件(Predictive Patterns Software, Inc. , Inverary, Canada),對每個基因經(jīng)標準化和對數(shù)轉(zhuǎn)換的表達數(shù)據(jù)在低風險組和高風險組之間進行Kruskal-Wallis檢驗分析。選擇ρ值< 0. 05的798個基因通過自組織映射(SOM)方法(GeneLinker Platinum 4. 5software)進行進一步研究。SOM 分析通過SOM分析所述798個基因。SOM分析的參數(shù)包括基因方向、距離的Pearson相關(guān)系數(shù)、及2(高度)X3(寬度)的一維映像(map dimension)。對于參考向量和算法性質(zhì), 使用默認值。2X3維數(shù)的選擇根據(jù)對訓練組病例798個基因的分層聚類分析進行(圖2)。 這種方法提供了選擇SOM分析映射范圍的客觀方式。將所有798基因分為六個不同SOM基因簇(I至VI)。使用SPSS 9. 0軟件(SPSS, Inc.,Chicago, Illinois)通過二元前進法邏輯回歸進一步選擇每個SOM基因簇中的基因。前進法邏輯回歸的入口(Entry)和去除(removaDp 值分別為<0.05和>0. 1。在邏輯回歸分析之后,選自SOM基因簇II、V和VI的基因數(shù)目分別為6、6和5。在邏輯回歸期間,SOM基因簇I、III和IV被完全分離。隨后,對SOM基因簇I、III和IV的基因單獨進行二維SOM分析。SOM基因簇la、lb、Ilia、Illb、Iva和IVb 中選擇的基因的所得數(shù)目分別為9、5、8、4、6和3。因此,在九個SOM基因簇中有52個基因。預測方法的確立確立鑒別發(fā)生高遠處轉(zhuǎn)移風險的NPC患者的兩種預測方法。第一種方法基于九個 SOM基因簇中的52個基因。針對每個基因簇的基因建立回歸模型。每個回歸模型的公式列于表1。針對每個樣品從每個公式中產(chǎn)生洛基分數(shù)(logit score) 0訓練組中每個樣品的九個洛基分數(shù)(logit score)用于產(chǎn)生預測規(guī)則,使用SAS 9.0軟件通過k_最近鄰(k_NN) 分類方法進行。使用訓練組獨立檢驗1、3、5、10和30的“k”值。進行Leave-one-out交叉驗證。根據(jù)leave-one-out交叉驗證,檢驗的k值為10時提供最佳結(jié)果,選擇其進行預測方法。第二種預測方法基于得自原始SOM基因簇I中197個基因的12個基因。如上所述,在使用前進法選擇分析進行邏輯回歸期間三個SOM基因簇示出完全分離。結(jié)果提示這三個SOM基因簇的潛在高度預測價值。為了鑒別哪個SOM基因簇的基因可以可靠地用于預測,使用訓練組病例通過二元前進法邏輯回歸(SPSS 9.0軟件)從每個SOM基因簇中選擇基因,基因的選擇在發(fā)生完全分離之前正確停止。從每個基因簇中選擇的基因用于產(chǎn)生洛基分數(shù)(logit score),將其用于估算概率。概率高于0. 5則指定為低遠處轉(zhuǎn)移風險,概率低于0. 5則指定為高遠處轉(zhuǎn)移風險。結(jié)果示出使用訓練組病例從SOM基因簇I中選擇的12 個基因產(chǎn)生最佳結(jié)果。基于SOM基因簇I中12個基因的回歸模型的公式示于表2。生存期分析使用SAS 9.0軟件通過Kaplan-Meier log rank檢驗進行無轉(zhuǎn)移生存期和總體生存期分析。生存期解釋為首次治療開始日期至最后一次隨診日期或死亡日期之間的期間。 無轉(zhuǎn)移生存期是指首次治療開始日期至首次診斷遠處轉(zhuǎn)移的日期之間的期間。實施例III結(jié)果概述正如所示出的,確定兩個預測因子鑒別處于發(fā)生高遠處轉(zhuǎn)移風險或低遠處轉(zhuǎn)移風險中的NPC患者。第一個預測因子基于在九個不同的自組織映射聚類數(shù)(self organizing maps clusters)中的52個基因和k_最近鄰分類方法。第二個預測因子基于12個基因和邏輯回歸模型。這兩種方法均可強烈預測獨立的測試組病例中短的遠處轉(zhuǎn)移間隔期和短的總體生存期。這兩種方法在獨立的測試組中估定的總精確率分別為81%和76%。當組合這兩種預測方法時,精確率增加至85%。高風險特征組與低風險特征組之間的估計的發(fā)生遠處轉(zhuǎn)移風險比為11. 1 (95%置信區(qū)間2. 4-52. 4,ρ = 0. 002)?;颊叩奶卣鳛榱髓b別預測處于發(fā)生高或低遠處轉(zhuǎn)移風險并具有不良或良好總體生存期的NPC 患者的基因特征,在兩組臨床充分確定的NPC患者之間進行監(jiān)督分析。已經(jīng)充分認識到在首次治療后三年內(nèi)不發(fā)生遠處轉(zhuǎn)移的NPC患者具有良好的長期無轉(zhuǎn)移生存期和總體生存期31’33。相反,在首次治療時或之后的三年內(nèi)發(fā)生遠處轉(zhuǎn)移的NPC患者通常死于該疾病及具有不良的生存期。在我們研究的138名患者中,91名患者屬于臨床低風險組,47名患者屬于臨床高風險組。隨機指定2/3的低風險患者和高風險患者為訓練組,1/3的患者為測試組。這些患者的特征示于表3。在低風險組和高風險組訓練組與測試組病例之間列出的臨床特征無顯著差異。另外,訓練組(n = 34)和測試組(n = 13)的遠處轉(zhuǎn)移部位的分布為 骨 50% vs 69% Jf 50% vs 54% J^ 38% vs 23%,其他部位 15% vs 23%。其他部位包括腦、腎、脾和盆腔器官。兩組之間分布相似。實施例IV通過52個基因的特征預測遠處轉(zhuǎn)移為了鑒別預測基因,進行高度監(jiān)督分析。這項研究中僅使用在排除測試組病例后所有NPC樣品中通過Affymetrix MAS 5. 0軟件可以確定為“存在”的基因0,814個探針集)。然后在訓練組的臨床低風險組和臨床高風險組之間進行Kruskal-Wallis檢驗。選擇示出其表達顯著差異(?<0.0幻的798個基因進一步研究。使用選擇的798個基因?qū)τ柧毥M病例進行無人監(jiān)督的分層聚類分析。結(jié)果示出六個主要基因簇(圖幻?;诜謱泳垲惙治鼋Y(jié)果,選擇2X3的一維映像進行SOM分析。每個SOM簇中的大多數(shù)基因聚集在一起, 與通過分層聚類分析產(chǎn)生的基因簇平行。所述六個SOM簇的每一基因簇中的基因通過邏輯回歸進一步分析,在訓練組中用前進法選擇低風險和高風險病例。三個SOM簇基因示出完全分離的問題。這三簇中每簇的基因通過SOM針對兩個亞簇進一步分析。從九個SOM基因簇中選擇共52個基因,用于產(chǎn)生針對遠處轉(zhuǎn)移的預測模型。這52個基因概括示于表4中。用于從每個SOM簇中基因中確定洛基分數(shù)(logit score)的公式示于表1。因此,從每個病例的所述52個基因的表達強度中產(chǎn)生9個洛基分數(shù)(logit score)。訓練組中每個病例的所述9個洛基分數(shù)(logit score)用于通過k_NN分類方法建立預測規(guī)則。針對預測規(guī)則的Leave-one-out交叉驗證示出預測訓練組病例遠處轉(zhuǎn)移為高風險的特異性和靈敏性分別為98% (61/6 和88% (30/34)??偩_率為95% (91/96)。當根據(jù)確定的預測規(guī)則分析獨立的測試組病例(11 = 4 時,特異性、靈敏性和總精確率分別為 86% (25/29),69% (9/13)和 81% (34/42)。針對相關(guān)性(association) 的Fisher’ s確切概率法(exact test) (ρ = 0. 0007)證實所述52個基因預測因子的穩(wěn)健性(robustness)。就遠處轉(zhuǎn)移和較短總體生存期而言,預測的高風險特征組與低風險特征組之間估計的危險性比(estimated hazard ratio)分別為7. 1 (ρ = 0. 002,95%置信區(qū)間 2. 2-23. 5)和 5. 4(p = 0. 001,95%置信區(qū)間 1. 5-19. 4)。當對比預測為低遠處轉(zhuǎn)移風險(n = 29)或高遠處轉(zhuǎn)移風險(n = 13)測試組中的患者的無轉(zhuǎn)移生存期和總體生存期時,預測為具有高遠處轉(zhuǎn)移風險的患者具有顯著較短的無轉(zhuǎn)移生存期(P = 0. 0001)和較短的總體生存期(P = 0. 003)(圖3)。實施例V通過12個基因特征預測遠處轉(zhuǎn)移第二種預測方法基于通過邏輯回歸分析中SOM簇I中的基因中選擇的12個基因。 用于計算低遠處轉(zhuǎn)移風險的概率的公式在表2中概述。所述12個基因列于表5中。當所述 12-基因預測規(guī)則應(yīng)用于所述獨立的測試組病例(11 = 4 時,預測高風險轉(zhuǎn)移的靈敏性、特異性和總精確性分別為85% (11/13),72% (21/29)和76% (32/42)。對于這12個基因預測因子,針對相關(guān)性的Fisher’ s確切概率法(p = 0. 0008)證實與所述52個基因預測因子的相似穩(wěn)健性。就遠處轉(zhuǎn)移和較短的總體生存期而言,預測的高風險和預測的低風險特征組之間估計的危險性比分別為8. 2 (p = 0. 006,95%置信區(qū)間1. 8-37. 4)和6. 3 (p = 0. 02, 95%置信區(qū)間 1. 3-29. 7)。當分析通過12個基因預測因子預測為低風險(n = 23)或高風險(n = 19)病例的無轉(zhuǎn)移生存期和總體生存期時,結(jié)果示出經(jīng)預測為高遠處轉(zhuǎn)移風險的患者具有顯著較短的無轉(zhuǎn)移生存期(P = 0. 0007)和總體生存期(P = 0. 007)(圖4)。實施例VI通過組合特征預測遠處轉(zhuǎn)移當分析實施例IV和V的兩種預測方法的結(jié)果在獨立測試組病例中的一致性時,有 22例(52% )由這兩種方法均預測為低風險病例及12例( % )預測為高風險病例(表 6)。有8例(19%)在這兩種方法之間不一致,認為是不確定病例。在一致的情況中(η =34),有5例是錯誤預測病例,3例是假陽性及2例是假陰性病例。因此,總精確率為85% (29/34)。就遠處轉(zhuǎn)移和較短的總體生存期而言,高風險與低風險特征組之間的估計的危險性比分別為11. l(p = 0. 002,95%置信區(qū)間2. 4-52. 4)和8. 5 (p = 0. 009,95%置信區(qū)間 1. 7-42. 8)。對經(jīng)預測為低風險、高風險和不確定的病例進行生存期分析表明高風險病例較經(jīng)預測為低風險的那些病例具有明顯較差的無轉(zhuǎn)移生存期和總體生存期(圖幻。低風險和不確定病例之間無轉(zhuǎn)移生存期與總體生存期之間的差異無統(tǒng)計學意義。實施例VIIIII期和IV期NPC患者之間生存期對比為了認識到確定的預測方法的潛在臨床效果,收集133個III期和82個Iva和 IVb(IVa/b)期NPC患者的臨床資料。在這些患者中,僅90例是上述mRNA轉(zhuǎn)錄物譜分析研究的一部分。所有患者均已經(jīng)根據(jù)擬定的方案31在1997年至2003年之間進行治療及后續(xù)的隨診。將 M III或IVa/b期患者根據(jù)隨后遠處轉(zhuǎn)移的發(fā)生而進一步分為兩組。對比這四組患者的總體生存期和無轉(zhuǎn)移生存期。結(jié)果示出隨后發(fā)生遠處轉(zhuǎn)移的III期NPC患者的總體生存期與無轉(zhuǎn)移生存期與也發(fā)生遠處轉(zhuǎn)移的IVa/b期患者(n = 35)的總體生存期和無轉(zhuǎn)移生存期相似(圖6)。相反,未發(fā)生遠處轉(zhuǎn)移的III期(n = 106)或IVa/b期(n = 47)患者較發(fā)生遠處轉(zhuǎn)移的那些患者具有較好的總體生存期(圖6)。結(jié)果表明在III期或IVa/b期患者中存在兩個不同組。一組呈現(xiàn)發(fā)生遠處轉(zhuǎn)移的低風險水平及良好的臨床結(jié)果。另一組在開始治療的三年內(nèi)發(fā)生遠處轉(zhuǎn)移并具有不良的生存結(jié)果(圖6)。這些發(fā)現(xiàn)支持了這樣的觀點,即對于處于發(fā)生高遠處轉(zhuǎn)移風險中的患者的精確預測不僅具有重要的預知意義,而且還提供了選擇合適患者測試新的治療形式以改善長期治療效果的方式。參考文獻1. Lo, W. K. , To, K. F. & Huang, D. P. Focus on nasopharyngeal carcinoma. Cancer Cell 5,423-428(2004).2. Altun, M. et al. Undifferentiated nasopharyngeal cancer (UCNT) current diagnostic and therapeutic aspects. Int. J. Radiat. Oncol. Biol. Phys. 32 859-877(1995).3.Young, L. S. & Riskinson, A.B. Epsein-Barr virus :40years on. Nature Rev Cancer 4 :757-768(2004).4. Cohen, J. I. Epstein-Barr virus infection. New Eng J Med 343, 481-492(2000).5. Yu, M. C. Nasopharyngeal carcinoma :Epidemiology and Dietary Factors pp. 39-47. Lyon :IARC, (1991)6. Ho, J. Nasopharyngel carcinoma. Adv. Cancer Res. 15 :59-72(1972)7.Yeh, S. & Cowdry, E.Incidence of malignant tumors in Chinese. Cancer7 425-436,1954.8. Yu, M. C. & Henderson, B. E. Nasopharyngeal cancer. In :Schottenfield D, Fraumeni JF,eds. Cancer epidemiology and prevention. 2nd ed. New York :Oxford Univ. Press 1996 :603-18.
9. Fandi, A. et al.Nasopharyngeal cancer :epidemiology,staging,and treatment. Semin. Oncol. 21 :382-397(1994).10· Vikram,B,et al. Patterns of failure in carcinoma of the nasopharynx failure at distant sites. Head Neck Surg. 8 :276-279 (1986).11. Hung, S. C. Nasopharyngeal cancer :a review of 1605 paatients treated radically with cobalt 60. Int. J. Radiat. Oncol. Biol. Phys. 6 :401-407 (1980).12. Geara,F. B. etal. Carcinoma of the nasopharynx treated by radiothera[y alone !determinants of distant metastasis and survival. Radiother.Oncol.43 53-61 (1997).13. Perez, C. A. et al. Carcinoma of the nasopharynx ;factors affecting prognosis. Int. J. Radiat. Oncol. Biol. Phys. 23 :271-280 (1992).14. Lee, A. W. M. et al. Retrospective analysis of 5037 patients with nasopharyngeal carcinoma treated during 1976-1985 :overal1 survival and patterns of failure. Int. J. Radiat. Oncol. Biol. Phys. 23 :261-270 (1992).15.Agulnik, M. & Siu,L L State-of-the-art management of nasopharyngeal carcinoma :current and future directions. Br. J. Cancer 92 :799-806 (2005).16.Langendijk JA, Leemans CR, Buter J,et a ;/The additional value of chemotherapy to radiotherapy in locally advanced nasopharyngeal carcinoma :a meta-analysis of he published literature. J Clin Oncol 2004 ;22 :4604-4612.17. Chang, J. T~C. et al. Nasopharyngeal carcinoma staging by 9180F-fluorodeoxyglucose positron emission tomography. Int. J. Radiat. Oncol. Biol. Phys. 62 :501-507(2005).18. Perou, C. M. et al. Molecular portraits of human breast tumours. Nature 406 :747-752(2000).19. Alizadeh AA, Eisen MB, Davis RE, et al. Distinct types of diffuse large B一cell lymphoma identified by genexpression profiling. Nature 2001 ;405 503-511.20. Khan J,Wei JS, Ringer M,et al. Classification and diagnostic prediction of cancers using gene expression profiling and artificial neural networks. Nature Med 2001 ;7 ;673-679.21.Dyrskjot L, Thykjaer T, Kruhoffer M, et al.Identifying distinct classes of bladder carcinoma using microarrays. Nature Gent 2003 ;33 :90-96.22. Bullinger L,Dohner K,Blair e,et al. Use of gene-expression profiling to identify prognostic subclasses in adult acute myeloid leukemia. New Eng J Med 2004 ;350 :1605-1615.23. van ' t Veer LJ, Dai H,van de Vijver MJ, et al :Gene expression profiling predicts clinical outcome of breast cancer. Nature 2002 ;415 :530-536.24.Pomeroy SLiTamayo PiGaasenbeek Μ, et al.Prediction of central nervous system embryonal tumour outcome based on gene expression. Nature2002 ;415
24436-442.25.Shipp MA, Ross KN, Tamayo P, et al. Diffuse large B-cell lymphoma outcome prediction by gene-expression profi1ing and supervised machine learning. Nature Med 2002 ;8 :68-74.26. Rosenwald A,Wright G,Chan WC, et al. The use of molecular profiling to predict survival after chemotherapy for diffuse large B-cell lymphoma. New Eng J Med 2002 ; 346 :1937-1947.27. Huang E,Cheng SH, Dressman H,et al. Gene expression predictors of breast cancer outcome. Lancet 2003 ;361 :1590-1596.28.Ayers M, Symmans WF, Stec J, et al.Gene expression profiles predictcomplete pathologic response to neoadjuvant pac1i taxe1 and fluorouracil, doxorubicin, and cyclophosphamide chemotherapy in breast cancer. J Clin Oncol 2004;22 :2284-2293.29. Mazzanti C,Zeiger MA, Costourpus N,et al. Using gene expression profiling to differentiate benign versus malignant thyroid tumors. Cancer Res2004 ;64 :2898-2903.30.Roepman P,Wessels LFA,Kettelarij N,et al. An expression profile for diagnosis of lymph node metastasis from primary head and neck squaamous cell carcinoma. Nature Genetics 2005 ;37 :182-186.31. Cheng SH, Tsai SYC,Yen KL, et al. Prognostic significance of parapharyngeal space venous plexus and marrow involvement ;potential landmarks of dissemination for satge I-III nasopharyngeal carcinoma. Int J Radiat Oncol Biol Phys 2005 ;61 :456-465.32. Bolstad BM,Irizarry RA,Astrand M,et al.A comparison of normalization methods for high density oligonucleotide array data based on variance and bias. Bioinformatics 2003 ;19 :185-193.33. Lee AWM, Sze WM, Au JSK, et al. Treatment results for nasopharyngeal crcinoma in the modern era :the hong Kong Experience. Int J Radiat Oncol Biol Phys 2005 ;61 :1107-1116.34.Yokota S,Yamamoto Y,Shimizu K,et al. Increased expression of cytosolic chaperonin CCT in human hepatocellular and colonic carcinoma. Cell Stress Chaperones 2001;6 :345-350.35. Liu H,Li J & Wong L Use of extreme patient samples for outcome prediction from gene expression data. Bioinformatics 2005 ;21 :3377-3384.36. Simon R, Radmacher MD, Dobbin K, et al. Pitfalls in the use of DNA microarray data for diagnostic and prognostic classification. JNCI2003 ;95 14-18.37. Chang Y,Lee TC,Li JC,Lai TL, Chua HH,Chen CL, Doong SL, Chou CK, Sheen TS, Tsai CH. Differential expression of osteoblast—specific factor 2andpolymeric immunoglobulin receptor genes in nasopharyngeal carcinoma. Head Nec k. 2005Aug 3138. Fang WY, Liu TF,Xie WB, Yang XY,Wang S,Ren CP,Deng X,Liu QZ,Huang ZX,Li X,Ding YQ,Yao KT. Reexploring the possible roles of some genes associated with nasopharyngeal carcinoma using microarray-based detection. Acta Biochim Biophys Sin(Shanghai). 2005Aug ;37 (8) :541-6.39. Lung HL,Bangarusamy DKiXie DiCheung AKiCheng Y,Kumaran MKiMiller L, Liu ETiGuan XY, Sham JSiFang Y,Li L,Wang N,Protopopov Al,Zabarovsky ER,Tsao SW, Stanbridge EJ,Lung ML. THYlis a candidate tumour suppressor gene with decreased expression in metastatic nasopharyngeal carcinoma. Oncogene. 2005Jun 20 ; [Epub ahead ofprint]40. Zhang B, Nie X, Xiao B, Xiang J, Shen S, Gong J, Zhou M, Zhu S, Zhou J,Qian J,Lu H,He X,Li X,Hu G,Li G. Identification of tissue-specific genes in nasopharyngeal epithelial tissue and differentially expressed genes in nasopharyngeal carcinoma by suppression subtractive hybridization and cDNA microarray. Genes Chromosomes Cancer. 2003 Sep ;38 (1) :80-90.41. Guo X, Lui WO, Qian CN, Chen JD, Gray SG, Rhodes D, Haab B, Stanbridge E,Wang H,Hong MH, Min HQ,Larsson C,Teh BT. Identifying cancer-related genes in nasopharyngeal carcinoma cell lines using DNA and mRNAexpression profiling analyses. Int J Oncol. 2002 Dec ;21 (6) :1197-204.42. Hui ABiLo KWiTeo PM,To KFiHuang DP.Genome wide detection of oncogene amplificatious in nasopharyngeal carcinoma by array based comparative genomic hybridization. Int J Oncol. 2002Mar ;20 (3) :467-73.43. Soo R,Putti T,Tao Q,Goh BC,Lee KH,Kwok-Seng L,Tan L,Hsieh WS. Overexpression of cyclooxygenase-2 in nasopharyngeal carcinoma and association with epidermal growth factor receptor expression. Arch Otolaryngol Head Neck Surg. 2005 Feb ;131 (2) :147-5244. Lee SW,Cho KJiPark JHiKim SY, Nam SY, Lee BJiKim SB,Choi SHiKim JH, Ahn SD, Shin SS, Choi EK, Yu E. Expressions of Ku70 and DNA-PKcs as prognostic indicators of local control in nasopharyngeal carcinoma. Int J Radiat Oncol Biol Phys. 2005 Aug 1 ;62(5) :1451-7.45. Ma BB,Poon TC,To KF,Zee B,Mo FK,Chan CM,Ho S,Teo PM,Johnson PJ, Chan AT. Prognostic significance of tumor angiogenesis,Ki 67,p53oncoprotein, epidermal growth factor receptor and HER2 receptor protein expression in undifferentiated nasopharyngeal carcinoma—a prospective study. Head Neck. 2003 Oct ;25 (10) :864-72.46. Farias TP,Dias FL,Lima RA,Kligerman J,de Sa GM,Barbosa MM, Goncalves FB Jr. Prognostic factors and outcome for nasopharyngeal carcinoma. Arch Otolaryngol Head Neck Surg. 2003 Jul ; 129 (7) :794-9.
47. Hsiao JRiJin YTiTsai STiShiau ALiWu CLiSu WC. Constitutive activation of STAT3 and STAT5 is present in the majority of nasopharyngeal carcinoma and correlates with better prognosis. Br J Cancer.2003 Jul 21 ;89 (2) :344-9.48. Chan AT,Lo YM,Zee B,Chan LY, Ma BB,Leung SF,Mo F,Lai M,Ho S, Huang DP,Johnson PJ. Plasma Epstein-Barr virus DNA and residual disease after radiotherapy for undifferentiated nasopharyngeal carcinoma. J Natl Cancer Inst. 2002 Nov 6 ;94(21) :1614-9.49. Ma J,Nicholas,Terry HA, Lin SX,Patel N,Mai HG,Hong MH,Lu TX,Cui NJ,Min HQ. Prognostic significance of DNA ploidy and proliferative indices in patients with nasopharyngeal carcinoma. Ai Zheng. 2002 Jun ;21 (6) :644-50.50. Rubio L,Burgos JS, Lopez-Guerrero JA, Morera C,Vera-Sempere FJ.Expression of p53 protein and tumor angiogenesis as prognostic factors in nasopharyngeal carcinoma patients. Pathol Res Pfact. 2002 ;198(2) :97-102.51. Fujii M,Yamashita T,Ishigufo R,Tashiro M,Kameyama K. Significance of epidermal growth factor receptor and tumor associated tissue eosinophilia in the prognosis of patients with nasopharyngeal carcinoma. Auris Nasus Larynx. 2002 Apr ;29 (2) :175-81.52. ο YM,Chan AT,Chan LY,Leung SF,Lam CW,Huang DP,Johnson PJ. Molecular prognostication of nasopharyngeal carcinoma by quantitative analysis of circulating Epstein-Barr virus DNA. Cancer Res. 2000 Decl5 ;60 (24) :6878-81.53. Heng DM,Wee J,F(xiàn)ong KW, Lian LG, Sethi VK, Chua ET,Yang TL, Khoo Tan HSiLee KSiLee KM,Tan T,Chua EJ. Prognostic factors in 677 patients in Singapore with nondisseminated nasopharyngeal carcinoma.Cancer. 1999Nov 15 ;86 (10) 1912-20.54. Guo X,Min HQ,Zeng MS,Qian CN,Huang XM,Shao JY,Hou JH. nm23_Hl expression in nasopharyngeal carcinoma !correlation with clinical outcome. Int J Cancer. 1998 Dec 18 ;79(6) :596-600.表1 用于九個SOM基因簇中選擇的基因的邏輯回歸模型的公式
權(quán)利要求
1. 一種評估鼻咽癌患者發(fā)生遠處轉(zhuǎn)移的風險的方法,所述方法包括在來自所述患者的樣品中評估表4列出的52個基因的表達譜,所述評估是使用通過應(yīng)用于洛基分數(shù)(logit score)的組的k-最近鄰分類方法而產(chǎn)生的預測規(guī)則來進行的,所述洛基分數(shù)的組是通過使用表1中相應(yīng)的回歸模型公式針對表4示出的9個基因簇中的每一個基因簇而產(chǎn)生的; 使用以下預測規(guī)則評估表5中列出的12個基因的表達譜,[低遠處轉(zhuǎn)移風險的概率]二 1J + (洛基分數(shù))’其中所述洛基分數(shù)(logit score)是使用表2所示回歸模型公式基于所述12個基因的表達譜而產(chǎn)生;對比得自所述兩個預測規(guī)則的遠處轉(zhuǎn)移風險值,由此當通過這兩種方法確定的遠處轉(zhuǎn)移風險均為低或高時,則分別記錄為低或高風險,當所述確定的風險不一致時, 則記錄為所述風險不確定。
全文摘要
mRNA轉(zhuǎn)錄物譜分析可用于闡明原發(fā)NPC遠處轉(zhuǎn)移的分子預測因子。所述預測結(jié)果與短的無轉(zhuǎn)移和總體生存期高度相關(guān)。使用基于52個基因和基于12個基因的預測因子(predictor)進行預測。本發(fā)明總體上涉及評估和/或預測鼻咽癌的狀態(tài)和結(jié)果的方法,包括測定與這種癌癥相關(guān)的基因的表達水平,由此使得可以對這些癌癥患者的結(jié)果進行個體化預測或評估。具體而言,本發(fā)明涉及用于鑒別鼻咽癌中的預后型亞類的基因表達譜。
文檔編號G06F19/20GK102346816SQ20111027663
公開日2012年2月8日 申請日期2006年9月22日 優(yōu)先權(quán)日2005年9月22日
發(fā)明者A·黃, K-j·高 申請人:中國合成橡膠股份有限公司