用于肺癌的分子診斷測試的制作方法
【專利摘要】提供鑒別用于肺癌的分子診斷測試的方法和組合物。該測試定義了新的DNA損傷修復缺陷分子亞型,并使得能夠在該亞型內對患者進行分類。本發(fā)明可用于在施用任何化療之前確定NSCLC患者在臨床上對治療方案有響應還是無響應。該測試可以與直接或間接影響DNA損傷或修復的不同藥物,例如許多目前正在使用的標準細胞毒性化療藥物,一起使用。特別地,本發(fā)明涉及預測標志物的特定組合,其中預測標志物的表達與對治療方案的響應性或無響應性相關聯(lián)。
【專利說明】用于肺癌的分子診斷測試 發(fā)明領域
[0001]本發(fā)明設及用于預測肺癌對特定治療的響應性的分子診斷測試,包括DNA損傷修 復缺陷亞型的使用。本發(fā)明包括各種分類器(classifiers)的產生和使用,所述分類器衍生 自NS化C中該亞型的鑒別,例如44-基因分類器模型的使用,用于鑒別該DNA損傷修復缺陷分 子亞型。一種應用是將對非小細胞肺癌(NSCLC)治療藥物類別的響應分層,并針對非小細胞 肺癌(NSCLC)治療藥物類別選擇患者,所述藥物類別包括引起DNA損傷的劑和DNA修復祀向 療法。本發(fā)明提供測試,其能指導傳統(tǒng)治療選擇并且在新型治療劑的臨床試驗評估過程中 選擇用于富集策略的患者群??蒞,例如,從新鮮/冷凍(f resh/froZen,F(xiàn)F)或福爾馬林固定 的石蠟包埋(formalin fixed paraffin embedded,FFPE)患者樣品鑒別DNA修復缺陷亞型。 [000^ 背景
[0003] 制藥行業(yè)一直在尋求比當前施用藥物更有效的、更具有特異性的或具有更少不良 副作用的新型藥物治療選擇。由于人類群體內的遺傳變異性使許多藥物的有效性產生了顯 著差異,一直在開發(fā)替代藥物療法。因此,雖然當前有多種多樣的藥物療法可供選擇,但是 在患者無法產生響應的情況下總是需要更多療法。
[0004] 傳統(tǒng)上,醫(yī)師所使用的治療模式一直是開出在治療疾病方面可能得到最高成功率 的一線藥物療法。如果一線療法無效,則開出替代性藥物療法。對于某些疾病來說,運種模 式明顯不是最佳的治療方法。例如,在例如癌癥的疾病中,第一次治療經常是最重要的并且 為成功治療提供了最佳機會,因此存在更高的需求選擇對于特定患者的疾病最有效的初始 藥物。
[0005] 肺癌是全球最普遍的癌癥,在2008年由于癌癥死亡的屯百六十萬人中有一百=十 屯萬人是由肺癌導致的(W冊資料簡報護297)。在2010年,在英國有42026人被診斷為肺癌, 有34859人死于肺癌,占英國所有死亡人數的6% (CRUK統(tǒng)計資料)。微陣列和分子基因組學 的出現(xiàn)有可能對疾病的診斷能力和預后分類產生顯著影響,它們可W幫助預測單個患者對 確定的治療方案的響應。微陣列提供了對大量遺傳信息的分析,從而提供個體的遺傳指紋。 更值得關注的是,運一技術最終將為定制藥物治療方案提供必要工具。
[0006] 當前,健康護理專業(yè)人員很少有途徑來幫助他們鑒別將受益于化療劑的癌癥患 者。最佳一線藥物的鑒別一直很難,因為沒有可用的方法來準確地預測哪種藥物治療對于 特定癌癥的生理學將是最有效的。運一不足導致相對較差的單一藥劑響應率W及增加的癌 癥發(fā)病率和死亡。而且,患者經常不必要地經受無效、有毒的藥物療法。
[0007] 分子標記已被用于選擇合適的治療,例如,在乳腺癌中。不表達雌激素和孕激素受 體W及皿R2生長因子受體的乳腺腫瘤,被稱為陰"("triple negative"),其表現(xiàn)出響應 PARP-I抑制劑療法化inn,S.C.,and 化n't Veer,L.J.Eur J Cancer 45 Suppl 1,11-26 (2009) ;0'Shau曲nessy,J.,et al.N 化gl J Med 364,205-214(2011)。近來的研究表明乳 腺腫瘤的S陰狀態(tài)可W指示對于包括PARP-I抑制劑在內的組合療法具有響應性,但是可能 不足W指示對于個體PARP-I抑制劑的響應性(O'Shaughnessy et日1.,2011)。
[000引而且,已有其它的研究嘗試鑒別與分子亞型有關的基因分類器,W指示對于化療 劑的響應性(F'armer et al.Nat Med 15,68-74(2009);Konstantinopoulos,P.A.,et al., J Clin Oncol 28,3555-3561(2010))0
[0009] WO 2012/037378描述了一種44-基因的DNA微陣列測定,DNA損傷修復缺陷(孤畑) 巧憶。該測定鑒別出喪失了 DNA損傷反應FA/服CA途徑的癌癥的分子亞組,導致對于DNA損傷 性化療劑的敏感性化ennedy&D'An化ea Journal of Clinical 0ncology(2006)24:3799, et al Na1:ure Reviews &nce;r(2004)4:814)。
[0010] 在乳腺癌中,DDRD測定已表明在203個乳腺癌患者中可W預測對于腫瘤輔助療法 DNA損傷性化療(5-氣脈喀晚、蔥環(huán)霉素和環(huán)憐酷胺)的響應(比值比4.01)(95%C1:1.69-9.54)。在191名用輔助劑5-氣脈喀晚、表柔比星和環(huán)憐酷胺治療進行治療的早期乳腺癌患 者群中,該測定5年無復發(fā)生存的風險比是0.37(95%Cl:0.15-0.88)。
[00川發(fā)明簡述
[0012] 非小細胞肺癌(NSCLC)在英國是男性中第二位最常見W及女性中第S位最常見的 惡性腫瘤。已報道在多達44%的NS化C中喪失了FA/BRCA途徑化ee et al Clinical Cancer ResearcK2007)26:2048) eNICE的治療早期-NSCLC的指南在2011年更新并在CG121指南中 進行了概述。目前的輔助的基于順銷/卡銷的療法(ACT)應當被提供給具有高風險早期 NSCLC的患者。但是,運僅僅獲得了 4-15%的5年生存率益處,運表明不是所有患者都受益。 而且,診斷為NS化C的患者對于化療來說可能是不良候選者,因為他們通常年齡較大,并且 許多都是吸煙者,具有顯著的屯、血管和腎共存疾病。因此,對于許多患者來說,ACT的嚴重毒 性的風險超過其益處,特別是當大部分人并沒有獲得生存率的益處時。確定哪些患者不會 從ACT受益的能力可W防止具有不必要毒性的過渡治療,并且可W指導使用替代性的、非 DNA損傷性療法,例如紫杉燒或vincavina-生物堿。
[0013] 本發(fā)明的基礎是運樣的方法的應用,該方法鑒別DNA損傷修復中的缺陷,W確定哪 些患者將會從特定的療法(例如ACT)中受益,W治療肺癌。本發(fā)明設及使用在肺癌中表達的 基因產物的集合的方法,W使得當一些或全部轉錄物過表達或低表達(over or under-e邱ressed)時,它們鑒別出在DNA損傷修復中有缺陷的肺癌亞型。本發(fā)明還提供指示對于 DNA損傷治療劑的響應性或抵抗的方法。在不同的方面,該基因或基因產物列表可W形成單 參數或多參數預測測試的基礎,所述單參數或多參數預測測試可W用本領域已知的方法, 例如微陣列、Q-PCR、免疫組化、ELISA或其它可W定量mRNA或蛋白質表達的技術來實現(xiàn)。
[0014] 因此,根據本發(fā)明的一個方面,提供預測患有肺癌例如(特別是)非小細胞肺癌 (NS化C)的個體對于用DNA損傷治療劑進行的治療的響應性的方法,包括:
[0015] a.測量從該個體獲得的測試樣品中的一個或多個生物標志物/基因的表達水平, 其中一個或多個生物標志物選自表14、18、1(:、24、28、34、38和/或3(:,例如選自由〔乂化10、 MXl、IDOl、IF1ML、CD2、GBP5、PRAME、ITGAULRP 巧 PAP0L3 組成的組;
[0016] b.得到記錄(cap化re)表達水平的測試得分;
[0017] C.提供闊值得分,該闊值得分包含將測試得分與響應性相關聯(lián)的信息;
[0018] d. W及將測試得分與闊值得分相比較;其中當測試得分超過闊值得分時,預測為 有響應性,和/或當測試得分未超過闊值得分時,預測為無響應性。
[0019] 該方法可W作為為個體選擇合適治療的方法或者作為測試或治療方法來實施。因 此,在特定的實施方案中,如果測試得分超過闊值得分(預測為有響應性),則用DNA損傷治 療劑治療個體。類似地,如果測試得分未超過闊值得分(預測無響應性),則不用DNA損傷治 療劑治療個體。在那些情況下,可W考慮替代的治療。對于NS化C,替代的治療可W包括施用 有絲分裂抑制劑,例如長春花生物堿或紫杉燒。長春花生物堿的實例包括長春瑞濱。紫杉燒 的實例包括紫杉醇或多西紫杉醇。或者,治療可W完全排除化療。在一些實施方案中,該方 法還可W包括被鑒別為有響應性的個體的后續(xù)治療。還設及相應的試劑盒。該方法典型地 在體外進行。因此,使用分離的,或預分離的樣品進行該方法。在一些實施方案中,該方法可 W包括從個體獲得測試樣品的步驟。在特定的實施方案中,該方法包括測量測試樣品中的 至少10個生物標志物的表達水平,所述生物標志物來自于表1A。更特別地,在一些實施方案 中,該方法可W包括測量表1A中所列的全部58個不同生物標志物的表達水平。在特定的實 施方案中,使用與沈Q ID ^:1-80(表14)、81-260(表34)、261-313(表38)、314-337(表18) 或338-363(表1C)所示的祀序列的至少一個結合的引物或探針測量表達水平。
[0020] 在一些實施方案中,該方法進一步包括測量測試樣品中的一個或多個生物標志物 的表達水平,其中所述一個或多個生物標志物選自由CDRl、FYB、TSPAN7、RAC2、KL皿C7B、 GRB14、AC138128.1、KIF26A、CD274、CD109、ETV7、MFAP5、0LFM4、PI15、F0SB、FAM19A5、MJ?C5、 PRICKLE1、EGR1、CLDN10、ADAMTS4、SP140L、ANXA1、RSAD2、ESR1、IKZF3、0R2I1P、EGFR、NAT1、 1^\152、〔¥?286、?1?亂、???11?14和41^37218.1組成的組。在特定的實施方案中,測試得分記 錄所有生物標志物(CX 化 10、MX1、ID01、IF1ML、CD2、GBP5、PRAMEJTGAL、LRP4、AP0L3、CDR1、 FYB、TSPAN7、RAC2、K1J1DC7B、GRB14、AC138128.1、KIF26A、CD274、CD109、ETV7、MFAP5、0LFM4、 PI15、F0SB、FM19A5、NLRC5、PRICKLE1、EGR1、CLDN10、ADAMTS4、SP140L、ANXA1、RSAD2、ESR1、 11(2尸3、01?211?、66尸1?、臟1'1、1^\152、〔¥口286、口1口亂、口口口11?14和41^37218.1;參見表28)的表達 水平。在一些實施方案中,當測試得分超過闊值得分時,可W預測為有響應性,所述闊值得 分的值在大約0.1到0.5之間,例如0.1、0.2、0.3、0.4或0.5,例如大約0.3681。
[0021] 肺癌典型地是非小細胞肺癌(NSCLC)并且可W是早期的?;蛘撸琋SCLC可W是晚期 的或轉移性疾病。NSCLC可W選自腺癌、大細胞肺癌和鱗狀細胞癌的一種或多種。
[0022] 被預測響應性的治療典型地是輔助治療。但是,它還可W額外地或者替代性地包 含腫瘤輔助治療。
[0023] 本文所述的本發(fā)明不限于任何一種DNA損傷治療劑;它可W用于鑒別對一些DNA損 傷治療劑中的任何一個的響應者和無響應者,所述DNA損傷治療劑例如是那些直接或間接 影響DNA損傷和/或DNA損傷修復的治療劑。在一些實施方案中,DNA損傷治療劑包含選自由 DNA損傷劑、DNA修復祀向療法、DNA損傷信號傳導抑制劑、DNA損傷誘導的細胞周期停滯的抑 制劑、組蛋白脫乙酷酶抑制劑、熱休克蛋白抑制劑和DNA合成抑制劑組成的組的一種或多種 物質。更具體地,DNA損傷治療劑可W選自含銷的劑、核巧類似物例如吉西他濱或5-氣脈喀 晚或其前藥例如卡培他濱、蔥環(huán)霉素例如表阿霉素或阿霉素、烷基化試劑例如環(huán)憐酷胺、電 離福射或福射和化療的組合(放化療)的一種或多種。在特定的實施方案中,DNA損傷治療劑 包含含銷的劑,例如選自順銷、卡銷和奧沙利銷的基于銷的劑。該方法可W預測對于用DNA 損傷治療劑與其它治療或藥物一起治療的響應性。因此,該方法可W預測對于組合療法的 響應性。例如,本文中通過實驗表明本發(fā)明的方法可W鑒別更有可能從輔助的基于順銷的 療法與長春瑞濱的組合療法中受益的NS化C患者的亞群。因此,在一些實施方案中,其它藥 物是有絲分裂抑制劑。有絲分裂抑制劑可W是長春花生物堿或紫杉燒。在具體的實施方案 中,長春花生物堿是長春瑞濱。在特定的實施方案中,鑒別對于下述治療的響應者:順銷/卡 銷和5-氣脈喀晚(5-FU) (CF),順銷/卡銷和卡培他濱(CX),表阿霉素/阿霉素、順銷/卡銷和 氣脈喀晚化CF),表阿霉素/阿霉素、奧沙利銷和卡培他濱化0X)、吉西他濱,環(huán)憐酷胺,放療 和放化療。在特定的方面,在NSCLC的治療中,本發(fā)明可用于評價NSCLC的治療中順銷/卡銷 (Paraplatin),順銷/卡銷和依托泊巧(CP),吉西他濱和順銷/卡銷(GemCarbo)環(huán)憐酷胺表 阿霉素/阿霉素和長春新堿(CEV/CAV),CEV/CAV加上依托泊巧(CEVE/CAVE),表阿霉素/阿霉 素,環(huán)憐酷胺和依托泊巧(ECE/ACE)DM損傷劑與拓撲替康的組合,或順銷或卡銷 (Paraplatin)與至少一種其它藥物例如長春瑞濱、吉西他濱、紫杉醇(Taxol)、多西紫杉醇 (化xotere)、表阿霉素/阿霉素、依托泊巧、培美曲塞或放療的組合。
[0024] 本發(fā)明設及使用不同的響應分類預測對藥物(DNA損傷治療劑)的響應,所述響應 分類例如總生存率,無進展生存率,無疾病生存率,放射響應,如RECIST所定義的,全響應, 部分響應,穩(wěn)定疾病和血清標志物例如,但不限于?54、〔64、〔4125、〔415-3和〔419-9。在特定 的實施方案中,本發(fā)明可用于評價NS化C中的標準胸片、計算機斷層掃描(CT)、灌注CT、動態(tài) 造影劑增強磁共振(MR)擴散加權(DW)MR或者使用葡萄糖類似物氣18氣脫氧葡萄糖師G)的 正電子發(fā)射斷層掃描(PET) (FDG-PET)響應,所述NS化C用DNA損傷治療劑,包括組合療法,單 獨地或在標準治療的環(huán)境中進行治療。
[0025] 本發(fā)明依賴于DNA損傷反應缺陷(DDRD)分子亞型,其最初是在乳腺癌和卵巢癌中 被鑒別的(W02012/037378;通過引用合并入本文)。在一些實施方案中,運種分子亞型可W 通過使用兩種不同的基因分類器進行檢測-一種長度為40個基因,一種長度為44個基因。 孤畑分類器首次在Almac Rreast Disease Specific Array(DSA?)上由53個探針集組成的 分類器定義。為了驗證該分類器在預測對含有DNA損傷的化療方案的響應的能力方面的功 能相關性,需要在基因水平上重新定義該分類器。運有助于利用來自獨立數據集的微陣列 數據評價DDRD分類器,所述獨立數據集是在Almac化east DSA?W外的微陣列平臺上給 出的。為了幫助在基因水平上定義分類器,需要確定Almac Breast DSA⑥探針集對應的 基因。運包括使用公眾可獲得的基因組瀏覽器數據庫例如Ensembl和NCBI Reference Sequence"44-基因 DDRD分類器模型取代了 40-基因 DDRD分類器模型。本文給出的結果證明 探針集可W對應到NS化C,并且可用于產生合適的分類器(參見表1A)。本文還給出結果證明 44個基因的分類器可在一系列NSC肺癌中有效預測對DNA損傷治療劑(順銷)的響應性(參見 實施例2)。44個和40個基因的分類器模型W及衍生自表1A的標志物的相關分類器模型在 NSCLC中對含有DNA損傷治療劑的化療方案的響應是有效的且重要的預測方案。
[0026] 使用從表1A的基因為基礎的分類器模型對DDRD亞型的鑒別,例如使用多達全部58 個基因的分類器模型進行的鑒別,W及還使用W表1B和表1C的基因為基礎的分類器模型對 DDRD亞型的鑒別,例如使用40個基因的分類器模型和44個基因的分類器模型二者進行的鑒 另IJ,可用于預測對標準NSCLC癌癥治療藥物類別的響應,或者選擇用于標準NSCLC癌癥治療 藥物類別的患者,所述標準治療藥物類別包括引起DNA損傷的劑和DNA修復祀向療法。
[0027] 在另一個方面,本發(fā)明設及用于W上所列的常規(guī)診斷應用的試劑盒,所述常規(guī)診 斷應用例如核酸擴增,包括PCR及其所有變形形式例如實時和終點方法W及qPCR,第二代測 序(NGS),微陣列和免疫測定例如免疫組化、ELISA、Western blot等。運種試劑盒包括合適 的試劑和說明書,W測定基因或基因產物的表達或者定量mRNA或蛋白表達。試劑盒可W包 括合適的引物和/或探針,W檢測表lA、IB和/或IC中的基因的至少一個的表達水平。試劑盒 可W含有與祀序列結合的引物和/或探針,所述祀序列包含SEQ ID NO: 1-80、SEQ ID NO: 81-260或沈Q ID N0:261-363(或沈Q ID N0:l-80(表lA)、81-260(表3A)、261-313(表3B)、 314-337(表lB)、338-363(表1C))、基本上由它們組成或者由它們組成。試劑盒可W含有引 物和/或探針,W確定本文所述的任何一個或更多個直至全部40、44或58個(分別地)基因的 分類器的表達水平。試劑盒可W包含引物和/或探針,所述引物和/或探針包含表3C中所示 的核巧酸序列(SEQ ID NOs 364-455)、基本上由它們組成或者由它們組成。
[0028] 在一些實施方案中,試劑盒還可W含有在該測試預測響應性的事件中要施用的特 定DNA損傷治療劑。提供的該試劑可W是特別為NS化C治療定制的方式,例如劑型。該試劑可 W同時提供適當的說明,用于根據NSCLC治療方案進行施用。
[0029] 本發(fā)明還提供鑒別DNA損傷反應缺陷(DD畑)人NS化C腫瘤的方法。有可能本發(fā)明可 用于鑒別對DNA損傷治療劑敏感并響應,或者對它抵抗并且無響應的患者,所述DNA損傷治 療劑例如是直接損傷DNA、間接損傷DNA或抑制正常DNA損傷信號傳導和/或修復過程的藥 物。
[0030] 本發(fā)明還設及指導患者的常規(guī)治療。本發(fā)明還設及選擇用于臨床試驗的患者,所 述臨床試驗中要特別測試新型DNA損傷治療劑,例如直接或間接影響DNA損傷和/或DNA損傷 修復的藥物。
[0031] 本發(fā)明和方法使用所保存的福爾馬林固定石蠟包埋(FFPE)的組織活檢材料,包括 細針抽吸(fine needle aspiration,F(xiàn)NA)W及新鮮/冷凍(FF)組織,進行本發(fā)明中所有轉 錄物的測定,因此與最廣泛可得的組織活檢材料類型是相容的。可W利用從FF陽組織、新鮮 冷凍組織或儲存于溶液例如RN Ala化r⑩中的新鮮組織獲得的RNA來確定表達水平。
[0032] 附圖簡述
[0033] 圖1提供了通過在DDRD發(fā)現(xiàn)數據集中定義的最可變基因進行的NS化樣品(列)的半 監(jiān)督分級聚類。樣品臨床信息由聚類上方的彩色條表示,并在圖例框中進行描述。右側的表 表示每一個聚類中基因的重疊,所述聚類具有來自乳腺DDRD發(fā)現(xiàn)數據集的DDRD基因。參見 實施例1。
[0034] 圖2是Kaplan Meier化M)曲線圖,顯示了DD畑群體中治療的(紅色)和未治療的(藍 色)患者的生存率。參見實施例1。
[0035] 圖3是Kaplan MeieHKM)曲線圖,顯示了非DD畑群體中治療的(紅色)和未治療的 (藍色)患者的生存率。參見實施例1。
[0036] 圖4是當44基因的DDRD標簽被應用于60例非小細胞肺癌樣品時,在進行了基于順 銷的輔助化療之后的總生存率的Kaplan Meier曲線圖。參見實施例2。
[0037] 發(fā)明詳述
[0038] 除非另有定義,本文所使用的技術和科學術語具有與本發(fā)明所屬領域的普通技術 人員的通常理解相同的意義。雖然在本發(fā)明的實施或測試中可W使用任何與本文描述的那 些類似或等同的方法、裝置和材料,現(xiàn)在描述優(yōu)選的方法、裝置和材料。
[0039] 本申請中所引用的所有出版物、公布的專利文獻、W及專利申請表明了本申請所 屬領域的技術水平。本文所引用的所有出版物、公布的專利文獻、W及專利申請通過引用的 方式合并入本文,其引用程度就如同明確且單獨表明每一個單個出版物、公布的專利文獻、 或專利申請W引用的方式合并入本文。
[0040] 本文中使用的冠詞"一 (a)"和"一 (an)"指一個或超過一個(即至少一個)該冠詞的 語法對象。例如,"要素"表示一個要素或超過一個要素,除非明確有相反說明。
[0041] 當前癌癥研究工作的主要目標是通過將分子參數結合到臨床治療決策中來增加 患者圍術期系統(tǒng)療法的效力。遺傳藥理學/基因組學是個體對外來化合物或藥物的反應中 所設及的遺傳/基因組因素的研究。對本發(fā)明的標志物的表達具有刺激或抑制作用的試劑 或調節(jié)劑可W被施用給個體W治療(預防性地或治療性地)患者的肺癌。理想的情況是,還 結合考慮個體的藥物基因組學與運種治療。治療劑代謝的差異有可能通過改變藥理學活性 藥物的劑量與血液濃度之間的關系而導致嚴重毒性或治療失效。因此,了解個體的藥物基 因組學允許選擇對預防性或治療性治療有效的試劑(例如藥物)。運種藥物基因組學可W進 一步用于確定合適的劑量和治療方案。相應地,可W確定本發(fā)明的標志物在個體中的表達 水平,W便由此選擇適合于個體的治療性或預防性治療的一種或多種試劑。
[0042] 本發(fā)明設及在特定肺癌組織中表達的基因或基因產物標志物(W下被稱為"生物 標志物")的集合的應用,用于預測對于使用DNA損傷治療劑進行的治療的響應性。在不同的 方面,該生物標志物列表可W形成單參數或多參數預測測試的基礎,所述單參數或多參數 預測測試可W用本領域已知的方法,例如微陣列、Q-PCR、NGS、免疫組化、ELISA或其它可W 定量mRNA或蛋白質表達的技術來實現(xiàn)。
[0043] 本發(fā)明還設及試劑盒和方法,其可用于肺癌(特別是NS化C)的細胞毒性化療之后 的預后或者具體治療的選擇。提供方法,W使得當一些或全部轉錄物過表達或低表達時,表 達譜表明對DNA損傷治療劑有響應性或抵抗。運些試劑盒和方法利用在NS化C患者的腫瘤中 差異表達的基因或基因產物標記物。在本發(fā)明的一個實施方案中,在統(tǒng)計學方法或關聯(lián)模 型下,將所保存的組織樣品中的運些生物標志物的表達譜與臨床結果(響應或生存率)相關 聯(lián),W產生將表達譜與對一種或多種DNA損傷治療劑的響應性相關聯(lián)的數據庫或模型。預測 模型然后可用于在對DNA損傷治療劑的響應性未知的患者中預測響應性。在許多其它的實 施方案中,可基于患者的臨床結果、預后或對DNA損傷治療劑的響應性將患者群分為至少兩 類,且生物標志物與運些類患者之間的類差異大體上相關聯(lián)。已表明本文所描述的生物途 徑可W預測對于用DNA損傷治療劑對NSCLC進行的治療的響應性。
[0044] 預測標志物套組/表達分類器
[0045] 提供了在肺癌/NSCLC組織中表達的作為基因分類器的生物標志物的獨特集合,它 可用于確定對用于治療肺癌/NSCLC的治療劑例如DNA損傷治療劑的響應性或抵抗。運種集 合可被稱為"標志物套組"、"表達分類器"或"分類器"。該集合在表1A中顯示。該集合是來自 于表1B和IC中所示的原始生物標志物集合(參見WO 2012/037378),所述原始生物標志物集 合然后被對應到NS化C平臺上(參見本文的實施例1)。分層聚類分析鑒別DDRD聚類,所述 DDRD聚類定義了那些可能對NS化C的特定治療有響應的個體。該生物標志物的聚類,或集合 構成表1A。運代表了 58個不同的基因和那58個基因中的80個不同的祀序列。本發(fā)明可W包 括確定運些基因或祀序列的任何一個或多個的表達水平。本文還提供證據(實施例2)表明 44個基因的分類器(表2B和3C)在各種NSC肺癌,包括腺癌、鱗狀細胞癌和大細胞癌中可有效 預測對DNA損傷治療劑(順銷)的響應性。
[0046] 因此鑒別了在本方法中有用的生物標志物,在本文的表格中列出,例如表1A、1B和 1C。運些生物標志物被鑒別為對于確定患者(患有NS化C)對治療劑有響應或無響應具有預 測價值。它們的表達與對試劑,更具體地,對DNA損傷治療劑的響應相關。通過在肺腫瘤,特 別是腺癌、大細胞肺癌或或鱗狀細胞癌中檢查所鑒別生物標志物的集合的表達,能夠確定 哪種治療劑或試劑的組合最有可能降低癌癥的生長速度,在一些實施方案中,所述癌癥為 NSCLC細胞。通過檢查所鑒別的轉錄基因或基因產物標志物的集合,能夠確定哪種治療劑或 試劑的組合最不可能降低癌癥的生長速度。通過檢查生物標志物的集合的表達,從而能夠 排除無效的或不合適的治療劑。重要的是,在特定的實施方案中,可W逐個患者地或逐個劑 地進行運種確定。因此,可W確定特定的治療方案是否可能使特定的患者或患者類型受益, 和/或特定的方案是否應當繼續(xù)。
[0047]表1A-NS化C患者中的基因(生物標志物)W及其中與定義孤畑狀態(tài)相關的祀序列
[0化引
[0059]表1A、1B和/或IC中所列的全部或部分生物標志物都可W用在預測生物標志物套 組中。例如,可W使用本文提供的方法產生生物標志物套組,所述生物標志物套組選自表 1A、IB和/或IC中的生物標志物,其可W包含表1A、IB和/或IC中所示的一個至全部生物標志 物,W及它們之間的每一個和所有的組合(例如四個選定的生物標志物、16個選定的生物標 志物、74個選定的生物標志物等)。在一些實施方案中,預測生物標志物集包含至少5、10、 20、40、60、100、150、200或300或更多個生物標志物。在其它實施方案中,預測生物標志物集 包含不超過 5、10、20、40、60、100、150、200、300、400、500、600 或 700個生物標志物。在一些實 施方案中,預測生物標志物集包括表1A、1B和/或IC中所列的多個生物標志物。在一些實施 方案中,預測生物標志物集包括表1A、1B和/或IC中所列的生物標志物的至少約1%、約5%、 約 10%、約 20%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、約95%、約96%、 約97%、約98%或約99%。選定的預測生物標志物集可利用本文所述的方法和本領域中已 知的類似方法由所提供的預測生物標志物匯集。在一個實施方案中,生物標志物套組含有 表1B和/或IC中的全部203個生物標志物。在另一個實施方案中,生物標志物套組含有表1A 中的58個不同的基因/生物標志物或80個不同的祀序列。在另一個實施方案中,生物標志物 套組相應于表2A或2B中的40或44個生物標志物。
[0060] 可結合不同量度的實際標度上的相應的標量權重來確定預測生物標志物集,通過 線性或非線性的、代數的、=角學的或相關的方法經由代數算法、統(tǒng)計學習算法、貝葉斯算 法、回歸算法或相似的算法將其進一步組合為單一標量值,連同標量值的數學推導的決策 函數一起提供預測模型,來自樣品的表達譜通過所述預測模型可被解析為對于特定藥物或 藥物類別響應者或無響應者、抵抗或不抵抗的不連續(xù)的類。運種預測模型,包括生物標志物 成員,是在交叉驗證、自助法或類似的取樣技術下,由來自具有已知藥物響應和/或抵抗或 者具有已知分子亞型(即孤RD)分類的既往患者樣品的一組代表性表達譜,通過學習權重和 決策闊值而開發(fā)的,并對靈敏度、特異性、陰性和陽性預測值、風險比或它們的任何組合進 行優(yōu)化。
[0061] 在一個實施方案中,生物標志物用于形成它們的信號的加權和,其中單個的權重 可W是正的或負的。將所得的和("決策函數")與預定的參考點或值相比較。與參考點或值 的比較可用于診斷或預測臨床病況或結果。
[0062] 如上所述的,本領域普通技術人員將理解,表1AUB和/或IC中提供的分類器中包 括的生物標志物在治療劑的響應性或抵抗分類器中具有不同的權重。因此,雖然可僅用一 個序列來診斷或預測結果例如對于治療劑的響應性,利用更多序列可提高特異性和靈敏度 或診斷或預測準確度。
[0063] 如本文所用的,術語"權重"指統(tǒng)計計算中項目的相對重要性。每個生物標志物在 基因表達分類器中的權重可利用本領域已知的分析方法根據患者樣品的數據集來確定???W應用基因特定偏差值(Gene specific bias values)??赡苄枰蛱囟ㄆ钪祦肀硎?分類器中每一個基因相對于訓練數據集的中屯、,如本領域技術人員所能理解的。
[0064] 在一個實施方案中,生物標志物套組設及表2A中詳列的40個生物標志物,相應的 排序和權重詳列于表中,或者可供選擇的排序和權重取決于,例如,疾病情況。在另一個實 施方案中,生物標志物套組設及表2B中詳列的44個生物標志物,相應的排序和權重詳列于 表中,或者可供選擇的排序和權重取決于,例如,疾病情況。表2A和2B將生物標志物W在分 類器中權重降低的順序進行排序,確定為在交叉驗證下測量的綜合決策得分函數中的平均 權重的排序。
[00化]表2A
[0066] 具有相關排序和權重的40-基因孤畑分類器模型的基因 ID和化trezGene ID
[006引
[0069] 表2B
[0070] 具有相關排序和權重的44-基因孤畑分類器模型的基因 ID和化trezGene ID
[0072]
[0073] 表3顯示了來自Xcel Array(Almac)的探針集,其代表了表2A和2B中的基因,并給 出了它們的序列ID編號。表3B顯示了來自人基因組U133A陣列(Affymetrix)的探針集,其代 表了表2A和2B中的基因,并給出了它們的序列ID編號。表3C顯示了來自人基因組U133A+2.0 陣列(Affymetrix)的探針集,其代表了表2A和2B中的基因。
[0074] 表3A-對應到Xcel平臺的44-基因標簽中含有的基因的祀序列的探針集IDs和SEQ 號
[0075]
[0080]
[0081 ] 表3B-對應到U133A平臺的44-基因標簽中含有的基因的祀序列的探針集I化和SEQ 號
r0083I
[0084] 表3C-對應至IjAffyme化ixGeneOlip愈人基因組U133巧.0陣列的44-基因標簽中 含有的基因的祀序列的探針集IDs和SEQ號,加上響應的基因符號和探針序列的SEQ ID NOs
[0087]
[0088] 在不同的實施方案中,表1A、1B和/或1C、表2A和/或表2B和/或表3A和/或3B和/或 3C中所列的生物標志物的子集可用于本文所述的方法中。運些子集包括但不限于在表2A或 表 2B 中排序為 1-2、1-3、1-4、1-5、1-10、1-20、1-30、1-40、1-44、6-10、11-15、16-20、21-25、 26-30、31-35、36-40、36-44、11-20、21-30、31-40和31-44的生物標志物。一方面,通過在來 自個體的測試(生物)樣品上進行測定并檢測生物標志物值,在個體中預測治療響應性,所 述生物標志物值的每一個對應于來自表1A的生物標志物的至少一個W及選自表1A中的生 物標志物列表的至少N個另外的生物標志物,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、 39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56或57。
[0089] 在一方面,通過在來自個體的測試(生物)樣品上進行測定并檢測生物標志物值, 在個體中預測治療響應性,所述生物標志物值的每一個對應于生物標志物GBP5XXCL10、 IDOl和MXl中的至少一個,W及選自表2B中的生物標志物的列表的至少N個另外的生物標志 物,其中 N 等于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、 26、27、28、29、30、31、32、33、34、35或36。如本文所使用的,術語"生物標志物"可指基因、 mRNA、cDNA、反義轉錄物、miRNA、多膚、蛋白、蛋白片段或指示基因表達水平或蛋白產生水平 的任何其他核酸序列或多膚序列。在一些實施方案中,當提到生物標志物CX化10、IDOl、 CD2、GBP5、PRAME、ITGAL、LRP4、AP0L3、CDRl、FYB、TSPAN7、RAC2、KLHDC7B、GRBl4、 AC138128.1、KIF26A、CD274、ETV7、MFAP5、0LFM4、PI15、F0SB、FAM19A5、r^LRC5、PRICKLEl、 EGR1、CLDN10、ADAMTS4、SP140L、ANXA1、RSAD2、ESR1、IKZF3、0R2I1P、EGFR、NAT1、LATS2、 CYP2B6、PTPRC、PPP1R1A 或 AL137218.1時,所述生物標志物分別包含 CX 化 10、ID01、CD2、 GBP5、PRAME、ITGAL、LRP4、AP0L3、CDRl、FYB、TSPAN7、RAC2、KLHDC7B、GRB14、AC138128.1、 KIF26A、CD274、ETV7、MFAP5、0LFM4、P115、FOSB、FAMl9A5、NLRC5、PRICKLE1、EGRl、CLDNl0、 ADAMTS4、SP140L、ANXA1、RSAD2、ESRl、IKZF3、0R211P、EGFR、MT1、LATS2、CYP2B6、PTPRC、 PPP1R1A或AL137218.1的mRNA。在進一步的或其它的實施方案中,當提到生物標志物MXl、 GBP5、IFI4化、BIRC3、IGJ、IQGAP3、L0C100294459、SIX1、SLC9A3R1、STAT1、T0B1、U抓、C1QC、 C2orfl4、EPSTI、GALNT6、HISTlH4H、HIST2H4B、KIAA1244、L0C100287927、L0C100291682或 L0C100293679時,所述生物標志物分別包含MX1、IFIML、GBP5、BIRC3、IGJ、IQGAP3、 L0C100294459、SIXl、aX9A3Rl、STATl、T0Bl、UBD、ClQC、C2orfl4、EPSTI、GALNT6、HISTlH4H、 陽512擬8、1(1441244、11)(:100287927、11)(:100291682或11)(:100293679的反義轉錄物。
[0090]在另一方面,通過在來自個體的測試(生物)樣品上進行測定并檢測生物標志物 值,在個體中預測治療響應性或指示癌癥診斷,所述生物標志物值的每一個對應于生物標 志物GBP5、CX化10、ID(n和MX1,和選自表2B中的生物標志物的列表的至少N個另外的生物標 志物其中之一,其中 N 等于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35或36。在進一步的方面,通過在來自個體的測 試(生物)樣品上進行測定并檢測生物標志物值,在個體中預測治療響應性或指示癌癥診 斷,所述生物標志物值的每一個對應于生物標志物GBP5和選自表2B中的生物標志物的列表 的至少N個另外的生物標志物其中之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、29、20、21、22、23、24、25、26、27、28、29、30、31、32、33、:34、35、36、37、38 或 39。在進 一步的方面,通過在來自個體的測試(生物)樣品上進行測定并檢測生物標志物值,在個體 中預測治療響應性或指示癌癥診斷,所述生物標志物值的每一個對應于生物標志物CX化10 和選自表2B中的生物標志物的列表的至少N個另外的生物標志物其中之一,其中N等于2、3、 4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29、20、21、22、23、24、25、26、27、28、29、30、 31、32、33、34、35、36、37、38或39。在進一步的方面,通過在來自個體的測試(生物)樣品上進 行測定并檢測生物標志物值,在個體中預測治療響應性或指示癌癥診斷,所述生物標志物 值的每一個對應于生物標志物IDOl和選自表2B中的生物標志物的列表的至少N個另外的生 物標志物其中之一,其中 N 等于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29、20、 21、22、23、24、25、26、27、28、29、30、31、32、33、:34、35、36、37、38 或 39。在進一步的方面,通過 在來自個體的測試(生物)樣品上進行測定并檢測生物標志物值,在個體中預測治療響應性 或指示癌癥診斷,所述生物標志物值的每一個對應于生物標志物MX-I和選自表2B中的生物 標志物的列表的至少N個另外的生物標志物其中之一,其中N等于2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、29、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38或39。
[0091] 在進一步的方面,通過在來自個體的測試(生物)樣品上進行測定并檢測生物標志 物值,在個體中預測治療響應性或指示癌癥診斷,所述生物標志物值的每一個對應于生物 標志物CX化10、1乂1、100巧日^14化中的至少兩個和選自表28中的生物標志物的列表的至少 N 個另外的生物標志物,其中 N 等于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、 21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39 或 40。在進一步的方 面,通過在來自個體的測試(生物)樣品上進行測定并檢測生物標志物值,在個體中預測治 療響應性或指示癌癥診斷,所述生物標志物值的每一個對應于生物標志物CX化10、MX1、 IDOl和IFI4化和選自表2B中的生物標志物的列表的至少N個另外的生物標志物其中之一, 其中 N 等于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30、31、32、33、34、35、36、37、38、39或40。在進一步的方面,通過在來自個體的測 試(生物)樣品上進行測定并檢測生物標志物值,在個體中預測治療響應性或指示癌癥診 斷,所述生物標志物值的每一個對應于生物標志物CX化10和選自表2B中的生物標志物的列 表的至少N個另外的生物標志物其中之一,其中N等于2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、29、20、21、22、23、24、25、26、27、28、29、30、31、32、33、:34、35、36、37、38、39、 40、41、42或43。在進一步的方面,通過在來自個體的測試(生物)樣品上進行測定并檢測生 物標志物值,在個體中預測治療響應性或指示癌癥診斷,所述生物標志物值的每一個對應 于生物標志物MXl和選自表2B中的生物標志物的列表的至少N個另外的生物標志物其中之 一,其中 N 等于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29、20、21、22、23、24、25、 26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42或43。在進一步的方面,通過在 來自個體的測試(生物)樣品上進行測定并檢測生物標志物值,在個體中預測治療響應性或 指示癌癥診斷,所述生物標志物值的每一個對應于生物標志物IDOl和選自表2B中的生物標 志物的列表的至少N個另外的生物標志物其中之一,其中N等于2、3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、29、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38、39、40、41、42或43。在進一步的方面,通過在來自個體的測試(生物)樣品上進行測定 并檢測生物標志物值,在個體中預測治療響應性或指示癌癥診斷,所述生物標志物值的每 一個對應于生物標志物IFI4化和選自表2B中的生物標志物的列表的至少N個另外的生物標 志物其中之一,其中 N 等于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、29、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、:34、35、36、37、38、39、40、41、42或43。
[0092] 在其它的實施方案中,表1A、3A、3B和/或3C中所列的祀序列/探針,或其子集,可用 于本文所述的方法中??蒞為設計與祀序列雜交的引物和/或探針的目的使用運些祀序列。 一旦鑒別了祀序列,合適的引物和/或探針的設計在本領域技術人員的能力之內。可W自由 獲得各種引物設計工具W幫助進行該過程,例如NCBI Primer-BLAST工具;參見化et al, BMC Bioinformatics. 13:134(2012)??蒞設計引物和/或探針W使得它們在嚴謹條件(如 本文所定義的)下與祀序列雜交。引物和/或探針的長度可W是至少15、16、17、18、19、20、 21、 22、23、24或25(或更多)個核巧酸。應當理解,每一個子集可^包括針對相同生物標志物 的多個引物和/或探針。運些表顯示在某些情況下,在同一個完整基因內存在多個祀序列。 運些引物和/或探針可W被包括在用于實施本發(fā)明方法的試劑盒中。試劑盒可W是例如基 于陣列或PCR的試劑盒,并且可W包括另外的試劑,例如聚合酶和/或dNTPs。
[009引利用分類器模型測量基因表達
[0094]已使用多種方法試圖鑒別生物標志物和診斷疾病。對于基于蛋白的標志物,運些 方法包括雙向電泳、質譜測定法和免疫測定方法。對于核酸標志物,運些方法包括mRNA表達 譜、微小RNA譜、測序、FISH、基因表達系列分析(SAGE)、甲基化譜和大型基因表達陣列。 [00%]當生物標志物在個體中指示異常過程、疾病或其它病況或作為它們的標志時,與 在個體中指示正常過程、無疾病或其它病況或作為它們的標志的生物標志物的表達水平或 值相比較,該生物標志物通常被描述為通常被描述為過表達的或低表達的。"上調"、"上調 的"、"過表達"、"過表達的"和它們的任何變化形式可互換使用,指高于在健康或正常個體 的類似生物樣品中通常檢測到的生物標志物的值或水平(或值或水平的范圍)的生物樣品 中的生物標志物的值或水平。該術語還可指高于在特定疾病的不同階段可檢測到的生物標 志物的值或水平(或值或水平的范圍)的生物樣品中的生物標志物的值或水平。
[0096] "下調"、"下調的"、"低表達"、"低表達的"和它們的任何變化形式可互換使用,指 低于在健康或正常個體的類似生物樣品中通常檢測到的生物標志物的值或水平(或值或水 平的范圍)的生物樣品中的生物標志物的值或水平。該術語還可指低于在特定疾病的不同 階段可檢測到的生物標志物的值或水平(或值或水平的范圍)的生物樣品中的生物標志物 的值或水平。
[0097] 進一步,與在個體中指示正常過程或無疾病或其它病況或作為它們的標志的生物 標志物的"正常"表達水平或值相比較,過表達的或低表達的生物標志物還可被稱作"差異 表達的"或被稱作具有"差異水平"或"差異值"。因此,生物標志物的"差異表達"還可稱作生 物標志物的"正常"表達水平的變化形式。
[009引術語"差異生物標志物表達"和"差異表達"可互換使用,指運樣的生物標志物,相 對于它在正常受試者中的表達,或相對于它在對特定治療具有不同響應的患者或在具有不 同預后的患者中的表達,在患有特定疾病的對象中它的表達被激活至較高或較低水平。該 術語還包括其表達在相同的疾病的不同的階段被激活至較高或較低水平的生物標志物。還 應當理解的是,差異表達生物標志物可在核酸水平或蛋白質水平上被激活或被抑制,或可 經受可變剪接W產生不同的多膚產物。運種差異可通過多種改變,包括mRNA水平、miRNA水 平、反義轉錄物水平或蛋白表面表達、分泌或多膚的其他劃分來證實。差異生物標志物表達 可包括兩個或更多個基因或它們的基因產物之間的表達的比較;或兩個或更多個基因之間 或它們基因產物之間的表達比率的比較;或甚至相同基因的兩個不同加工產物的比較,其 在正常受試者和患病受試者之間是不同的;或在相同疾病的不同階段是不同的。差異表達 包括例如在正常細胞和病態(tài)細胞中或在經歷不同的疾病事件或疾病階段的細胞中的生物 標志物中的瞬時表達模式或細胞表達模式中的定量和定性的差異。
[0099]在特定的實施方案中,所獲得的表達譜是基因組或核酸表達譜,其中樣品中的一 種或多種核酸的量或水平被確定。在運些實施方案中,被測定W產生診斷或預后方法中所 用的表達譜(即測量樣品中一個或多個生物標志物的表達水平)的樣品包含核酸樣品。核酸 樣品包括核酸群體,所述核酸群體包括被分析的細胞或組織的表型決定生物標志物的表達 信息。在一些實施方案中,核酸可W包括RNA或DNA核酸,例如,mRNA、cRNA、cDNA等,只要該樣 品保留了獲得它的宿主細胞或組織的表達信息。樣品可W本領域中已知的多種不同的方法 來制備,例如,通過從細胞分離mRNA,其中分離的mRNA被分離的、擴增,或用來制備CDNA、 cRNA等,如差異基因表達領域已知的。相應地,確定樣品中mRNA的水平包括從mRNA制備cDNA 或cRNA,然后測量CDNA或cRNA。通常從由需要治療的受試者中收獲的細胞或組織來制備樣 品,例如通過組織活檢,使用標準方案,其中可W產生運種核酸的細胞類型或組織包括其中 存在待確定表型的表達模式的任何組織,包括,但不限于,病態(tài)的細胞或組織、體液等。
[0100] 可利用任何常規(guī)方案從初始核酸樣品中產生表達譜,該表達譜代表了測試樣品中 一個或多個生物標志物的測量的表達水平。雖然已知多種不同的產生表達譜的方式,例如 在差異基因表達/生物標志物分析領域中所使用的那些,產生表達譜的一個代表性的和方 便類型的方案是基于陣列的基因表達譜產生方案。運種應用是雜交測定,其中使用表面例 如(玻璃)忍片,針對數千基因的每一個的幾個探針被固定在其上。在運些表面上通常在每 一個待分析的基因中存在多個祀區(qū)域,并且每個祀區(qū)域存在多個探針(通常是從11到100 個)。運樣,通過與該表面上的多個(數十個)探針的雜交評價每一個基因的表達。在運些測 定中,首先從被測定的初始核酸樣品中制備祀核酸的樣品,其中制備可W包括用標記物標 記祀核酸,所述標記物例如是信號產生系統(tǒng)的成員。制備祀核酸樣品后,在雜交條件下使樣 品與陣列相接觸,從而在與附著于陣列表面的探針序列互補的祀核酸之間形成復合物。然 后定性地或定量地檢測雜交復合物的存在。可被實施W產生主題方法中所使用的表達譜的 特定的雜交技術包括在下述文獻中描述的技術:美國專利Nos.5143854、5288644、5324633、 5432049、5470710、5492806、5503980、5510270、5525464、5547839、5580732、5661028、 5800992;通過引用將其公開內容合并入本文;W及WO 95/21265、W0 96/31622、W0 97/ 10365、W0 97/27317、EP 373203和EP 785280。在運些方法中,使"探針"核酸陣列與上述的 祀核酸接觸,所述"探針"核酸陣列包括其表達待測定的每一個生物標志物的探針的一個或 幾個探針。接觸在雜交條件,例如上述的嚴謹雜交條件下進行,然后除去未結合的核酸。所 得的雜交核酸的模式提供了有關已被探針雜交的每一個生物標志物的表達的信息,其中表 達的信息是基因是否被表達,W及,且通常W何種水平表達,其中表達數據,即表達譜,可W 同時是定性的和定量的。該方法可W包括相對于該陣列中所有其它探針子集標準化該雜交 模式。
[0101] 產生生物標志物表達分類器
[0102] 在一個實施方案中,測量癌癥組織中的生物標志物的相對表達水平,W形成基因 表達譜。W綜合決策得分(或測試得分)的形式,總結來自患者組織樣品的生物標志物的集 合的基因表達譜,并與從患者數據的訓練集中數學推導的得分闊值相比較。得分闊值根據 不同的特征將患者組分開,所述特征例如但不限于,對治療的響應性/非響應性?;颊哂柧?集數據優(yōu)選地來源于已由預后、復發(fā)可能性、長期存活、臨床結果、治療響應、診斷、癌癥分 類或個體化的基因組譜表征的NS化C組織樣品。或者,它可W代表來自分子亞型(DDRD)已得 到良好定義和表征的患者群體的數據集。來自患者樣品的表達譜和相應的決策得分(測試 得分)可W與位于數學推導的得分決策闊值的同側的訓練集中的患者樣品的特征相關聯(lián)。 可W優(yōu)化線性分類器標量輸出的闊值W使如在訓練數據集中所觀察到的交叉驗證下的靈 敏度與特異性的和最大化?;蛘?,可W在減損特異性和陰性預測值的情況下提高測定的靈 敏度和陽性預測值,或者反之亦然,運取決于在不同疾病適應癥中所提出的測試的臨床應 用。
[0103] 利用本領域技術人員已知的方法對給定樣品的整體表達數據進行標準化,W校正 起始物質的不同量、提取和擴增反應的不同效率等。利用基于標準化數據的線性分類器來 有效地形成診斷或預后描述(例如,對于治療劑的響應性或抵抗)意味著通過分離超平面的 方式將數據空間,即分類器中全部基因的表達值的所有可能的組合,分割為分開的兩半。該 分割可W基于一大組訓練實例憑經驗來獲得,所述訓練實例例如來自對治療劑表現(xiàn)出響應 性或抵抗的患者。不失一般性地,對于除一個生物標志物W外的全部生物標志物可假定某 一固定組的值,其將自動定義關于該其余生物標志物的闊值,其中決策由,例如,對治療劑 的響應性或抵抗而改變。然后,高于該動態(tài)闊值的表達值將指示抵抗(對于具有負權重的生 物標志物)或響應性(對于具有正權重的生物標志物)。該闊值的精確值取決于分類器中所 有其它生物標志物的實際測量表達譜,但某些生物標志物的通用指示仍然是固定的,即,高 的值或"相對過表達"通常有助于響應性(具有正權重的基因)或抵抗(具有負權重的基因)。 因此,在整體基因表達分類器中,相對表達可W指示特定生物標志物的上調或下調是否代 表對治療劑的響應性或抵抗。
[0104] 在一個實施方案中,通過線性分類器評價測試樣品,例如患者組織樣品的生物標 志物表達譜。如本文所使用的,線性分類器指單獨的生物標志物強度的加權和形成綜合決 策得分("決策函數")。然后將該決策得分與預定的截斷得分闊值相比較,所述預定的截斷 得分闊值對應于按靈敏度和特異性方式的特定設定點,該設定點指示是否樣品高于得分闊 值(決策函數為正)或低于得分闊值(決策函數為負)。
[0105] 實際上,運意味著數據空間,即,生物標志物表達值的所有可能的組合的集,被分 割為對應于不同的臨床分類或預測的互斥的兩半,例如,一個對應于對治療劑的響應性,另 一個對應于抵抗。在整體分類器中,某些生物標志物的相對過表達可提高決策得分(正權 重)或降低決策得分(負權重),且因此有助于整體決策,例如,對治療劑的響應性或抵抗的 整體決策。
[0106] 術語"曲線下面積"或"AUC'指受試者工作特征(ROC)曲線的曲線下面積,運二者都 是本領域中熟知的。AUC測量對于在全部數據范圍上比較分類器的準確度是有用的。具有較 高AUC的分類器具有更大的能力在兩個目標組(例如,NSCLC癌癥樣品和正常樣品或對照樣 品)對未知項進行正確的分類。ROC曲線對于在兩個群體(例如,對治療劑響應和無響應的個 體)之間進行區(qū)別時描繪特定特征(例如,本文所述的任何生物標志物和/或另外的生物醫(yī) 學信息的任何條目)的性能是有用的。通常,W單個特征的值為基礎W升序順序對整個群體 (例如,病例和對照)特征數據進行排序。然后,對于該特征的每個值,計算數據的真陽性和 假陽性率。通過對高于該特征的值的病例的數量進行計數并除W病例總數來確定真陽性 率。通過對高于該特征的值的對照的數量進行計數并除W對照總數來確定假陽性率。雖然 該定義指與對照相比較在病例中特征是升高的情況,該定義還應用于與對照相比較在病例 中特征較低的情況(在該情況中,將對低于該特征的值的樣品進行計數)??蒞對單一特征 W及對其它單一輸出產生ROC曲線,例如,兩個或更多個特征的組合可用數學方法結合(例 如,相加、相減、相乘等)W提供單一的總和值,并且該單一的總和值可繪制于ROC曲線中。此 夕h多個特征的任意組合,其中該組合源自于單一的輸出值,可繪制于ROC曲線中。特征的運 些組合可包括測試。ROC曲線是測試的真陽性率(靈敏度)相對于測試的假陽性率(1-特異 性)的圖。
[0107] 對于該量,即,對治療劑的截斷闊值響應性或抵抗的解釋,是在發(fā)展階段("訓練") 源自于具有已知結果的患者的集。決策得分的相應權重和響應性/抵抗截斷闊值通過本領 域技術人員已知的方法由訓練集先驗地固定。在本方法的優(yōu)選實施方案中,使用偏最小二 乘法判別分析(PLS-DA)來確定權重。(L.紛潘hle,S. Wo 1 d,J.畑emom. 1 (1987) 185-196 ; D.V.Nguyen,D.M.Rocke ,Bioinformatics 18(2002)39-50)。本領域技術人員已知的用于進 行分類的其他方法也可與本文所述的方法一起使用,例如當應用于肺癌分類器的轉錄物 時。
[0108] 可使用不同的方法將在運些生物標志物基礎上測量的定量數據轉換為預后或其 他預測用途。運些方法包括,但不限于來自模式識別(D U d a e t a 1 . P a 11 e r n Classification,2nd ed.,John Wiley,New York 2001),機器學習(Sch別kopf et al.Learning with Kernels,MIT Press,Cambridge 2002,Bishop,Neural Networks for Pattern Recognition, Clarendon Press , Oxford 1995),統(tǒng)計學(Hastie et al. The Elements of Statistical Learning,Springer,New York 2001),生物信息學(Dudoit et al. ,2002,J.Am.Statist.Assoc.97:77-87,Tibshirani et al.,2002, Proc.化tl.Acad.Sci.USA 99:6567-6572)或化學計量學(Vandeginste,et al. Jan^ook of Chemometrics and Qualimetrics ,Part B,Elsevier ,Amsterdam 1998)領域的方法。
[0109] 在訓練步驟中,對于響應性/抵抗病例二者測量一組患者樣品,并利用來自該訓練 數據的固有信息優(yōu)化預測方法,W最佳地預測訓練集或未來的樣品集。在該訓練步驟中,所 用方法被訓練或被參數化,W從特定強度類型預測特定預測描述。在其被用于預后方法或 算法之前,可用測量的數據進行適當的轉化或預處理步驟。
[0110] 在本發(fā)明的優(yōu)選實施方案中,對于每個轉錄物形成預處理強度值的加權和,并將 其與基于訓練集優(yōu)化的闊值相比較(Duda et al.Pattern Classification,ed.,John Wiley,化W York 2001)??蒞通過多種線性分類方法獲得權重,包括但不限于偏最小二乘 法(PLS, (Nguyen et al.,2002,Bioinformatics 18(2002)39-50))或支持向量機(SVM,( Scholkopf et al ?Learning with Kernels,MIT Press,Cambridge 2002))。
[0111] 在本發(fā)明的另一個實施方案中,在應用于上述的加權和之前將數據轉化為非線性 的。該非線性轉化可W包括增加數據的維數。該非線性轉化和加權和可W隱式地進行,例如 通過使用核函數(SchiHkopf et al.Learning with Kernels,MIT Press , Cambridge 2002)O
[0112] 在本發(fā)明的另一個實施方案中,將新數據樣品與作為真實測量的訓練樣品或人工 產生的原型的兩種或更多種原型相比較。該比較利用適當的相似方式來進行,例如,但不限 于,歐幾里德距離(Duda et al.Pattern Classification,2nd ed.,John Wiley,化W York 2001),相關系數(化n't Veer,et al.2002,化化re 415:530)等。然后將新樣品分配到具有 最接近的原型或在附近具有最高數量原型的預后組。
[0113] 在本發(fā)明的另一個實施方案中,使用決策樹(化Stie et al. ,The Elements of Statistical Learning, Springer, New York 2001)或隨機森林(Breiman ,Random 化rests,Machine Learning 45:5 2001)從轉錄物集或它們的產物的測量強度數據生成預 后描述。
[0114] 在本發(fā)明的另一個實施方案中,使用神經網絡(Bishop ,Neural Networks for Pattern Reco即ition,Clarendon Press,Oxford 1995)從轉錄物集或它們的產物的測量 強度數據生成預后描述。
[0115]在本發(fā)明的另一個實施方案中,使用判別分析(Duda et al . ,Pattern Classification,2nd ed.,John Wiley,New York 2001),其包括但不限于線性分析、對角線 性分析、二次判別分析和邏輯判別分析,從轉錄物集或它們的產物的測量強度數據生成預 后描述。
[0116]在本發(fā)明的另一個實施方案中,使用微陣列預測分析(PAM, (TibsMrani et al., 2002 ,Proc.化tl. Acad. Sci .USA 99:6567-6572))從轉錄物集或它們的產物的測量強度數 據生成預后描述。
[0117] 在本發(fā)明的另一個實施方案中,使用類比軟獨立建模分類法(SIMCA,(Wold, 1976, 化ttern Recogn.8:127-139))從轉錄物集或它們的產物的測量強度數據生成預后描述。
[0118] 在本發(fā)明的另一個實施方案中,使用C-指數對預測能力進行定量。該指數使用針 對可檢查的連續(xù)響應變量的生物標志物。C指數是所有的受試者對的比例,所述受試者的生 存時間可W進行排序,W使得具有較高預測生存率的受試者是生存時間較長的受試者。如 果兩個受試者都被檢查或者如果一個受試者失敗而另一個受試者的隨訪時間少于第一個 受試者的失敗事件,則兩個受試者的生存時間不能被排序。C指數是預測的和觀察的生存率 之間的吻合概率,對于隨機預測來說C = O. 5,對于完美判別模型來說C = I。(Frank E.Harrell,Jr.Regression Modeling Strategies,2001)
[0119] 治療劑
[0120] 如上所述,本文所述的方法允許將患有NS化C,包括早期NS化C的患者分類為對治 療劑(下文稱作"DNA損傷治療劑")響應或無響應,所述治療劑祀向具有異常DNA修復的腫 瘤。如本文所使用的,"DNA損傷治療劑"包括已知直接損傷DNA的試劑,阻止DNA損傷修復的 試劑,抑制DNA損傷信號傳導的試劑,抑制DNA損傷誘導的細胞周期停滯的試劑和抑制間接 導致DNA損傷的過程的試劑。目前一些用來治療NS化C的運種治療劑包括,但不限于,下述 DNA損傷治療劑。
[01別]1)DNA損傷劑:
[0122] a.烷基化試劑(含銷的劑,例如順銷、卡銷和奧沙利銷;環(huán)憐酷胺;白消安)。
[012;3 ] b.拓撲異構酶I抑制劑(伊立替康;托泊替康)
[0124] C.拓撲異構酶II抑制劑(依托泊巧;蔥環(huán)類例如阿霉素和表阿霉素)
[0125] d.電離福射
[0126] 2)DNA修復祀向療法
[0127] a.非同源末端連接抑制劑(DNA-PK抑制劑、Nu7 441、NU7 0 26)
[0128] b.同源重組抑制劑
[0129] C.核巧酸切除修復抑制劑
[0130] d.堿基切除修復抑制劑(PARP 抑制劑、46014699、4202281、481'-888、]\?4827、851-201、INO-IOOl、TRC-102、APEX 1抑制劑、APEX 2抑制劑、連接酶HI抑制劑
[0131] e.范可尼貧血途徑抑制劑
[0132] 3)DNA損傷信號傳導的抑制劑
[0133] 3.4了]\1抑制劑化?466722)
[0134] b.C服l抑制劑(Xレ844,UCN-01、AZD7762、PF00477736)
[0135] 〇.(:服2抑制劑村心844、4207762、?。00477736)
[0136] d.ATR 抑制劑(AZ20)
[0137] 4)DNA損傷誘導的細胞周期停滯的抑制劑 [013引 a.Weel激酶抑制劑
[0139] b.CDC25a、b或 C抑制劑
[0140] 5)對間接導致DNA損傷的過程的抑制
[0141] a.組蛋白脫乙酷酶抑制劑
[0142] b.熱休克蛋白抑制劑(格爾德霉素、AUY922),
[0143] 6) DNA合成的抑制劑:
[0144] a.喀晚類似物(5-FU、吉西他濱)
[0145] b.前藥(卡培他濱)
[0146] 如上所述,其響應性被預測的治療劑可用于輔助療法中。但是,它們在腫瘤輔助療 法中可W另外地或替代性地使用。
[0147] 本文所述的本發(fā)明不限于任何一種DNA損傷治療劑,它可用于鑒別對多種DNA損傷 治療劑的任一種的響應或無響應者,所述DNA損傷治療劑例如那些直接或間接影響DNA損傷 和/或DNA損傷修復的。在一些實施方案中,DNA損傷治療劑包含一種或多種選自由W下各項 組成的組的物質:DNA損傷劑、DAN修復祀向療法、DNA損傷信號傳導的抑制劑、DNA損傷誘導 的細胞周期停滯的抑制劑、組蛋白脫乙酷酶抑制劑、熱休克蛋白抑制劑和DNA合成抑制劑。 更特別地,DNA損傷治療劑可W選自一種或多種含銷試劑、核巧類似物例如吉西他濱或5-氣 脈喀晚或其前藥例如卡培他濱、蔥環(huán)類例如表阿霉素或阿霉素、烷基化試劑例如環(huán)憐酷胺、 電離福射或(電離)福射和化療的組合(放化療)。在特定的實施方案中,DNA損傷治療劑包括 含銷試劑,例如選自順銷、卡銷、奧沙利銷的基于銷的試劑。該方法和試劑盒可W預測對于 用DNA損傷劑與其它藥物一起進行的治療的響應性。因此,該方法和試劑盒可W預測對于組 合療法的響應性。例如,本文中通過實驗表明本發(fā)明的方法可W鑒別更有可能從輔助的基 于順銷的療法與長春瑞濱的組合療法中受益的NS化C患者的亞群。因此,在一些實施方案 中,其它藥物是有絲分裂抑制劑。有絲分裂抑制劑可W是長春花生物堿或紫杉燒。在具體的 實施方案中,長春花生物堿是長春瑞濱。在特定的實施方案中,鑒別對于下述治療的響應 者:順銷/卡銷和5-氣脈喀晚巧-FUKCF),順銷/卡銷和卡培他濱(CX),表阿霉素/阿霉素 J員 銷/卡銷和氣脈喀晚化CF),表阿霉素/阿霉素、奧沙利銷和卡培他濱化0X)、吉西他濱,環(huán)憐 酷胺,放療和放化療。在特定的方面,本發(fā)明可用于評價NSCLC的治療中順銷/卡銷 (Paraplatin),順銷/卡銷和依托泊巧(CP),吉西他濱和順銷/卡銷(GemCarbo)環(huán)憐酷胺表 阿霉素/阿霉素和長春新堿(CEV/CAV),CEV/CAV加上依托泊巧(CEVE/CAVE),表阿霉素/阿霉 素,環(huán)憐酷胺和依托泊巧(ECE/ACE)DM損傷劑與拓撲替康的組合,或順銷或卡銷 (Paraplatin)與至少一種其它藥物例如長春瑞濱、吉西他濱、紫杉醇(Taxol)、多西紫杉醇 (化xotere)、表阿霉素/阿霉素、依托泊巧、培美曲塞或放療的組合。
[014引疾病和組織來源
[0149]本文所述的預測分類器對于確定對治療肺癌,特別是NS化C的治療劑的響應性或 抵抗是有用的。
[0150] 肺癌典型地是非小細胞肺癌(NSCLC)并且可W是早期的。NSCLC可W選自腺癌、大 細胞肺癌和鱗狀細胞癌的一種或多種。
[0151] 在一個實施方案中,本文所述的方法指用下列種類的化療劑治療的NS化Cs = DNA損 傷性制劑、DNA修復祀向療法、DNA損傷信號傳導的抑制劑、DNA損傷誘導的細胞周期停滯的 抑制劑和間接導致DNA損傷的過程的抑制,但不限于運些種類。運些化療劑中的每一種被認 為是如本文所用的術語"DNA損傷治療劑"。
[0152] "生物樣品"、"樣品"和"測試樣品"在本文中可W互換使用,指從個體獲得或用其 他方式取得的任何物質、生物流體、組織或細胞。其包括血液(包括全血、白血球、外周血單 核細胞、血沉棟黃層、血漿和血清)、疲液、淚液、粘液、鼻洗液、鼻抽吸物、呼吸樣、尿液、精 液、唾液、腦膜液、羊水、腺液、淋己液、乳頭抽吸物、支氣管抽吸物、滑膜液、關節(jié)抽吸物、腹 水、細胞、細胞提取物和腦脊液。其還包括上述全部的實驗分離的級分。例如,血液樣品可分 級為血清或含特定類型的血細胞的級分,例如紅細胞或白細胞(白血球)。如果需要,樣品可 W是來自個體的樣品的組合,例如組織和流體樣品的組合。術語"生物樣品"還包括含均質 固體物質的物質,例如來自糞便樣品、組織樣品或組織活檢的物質。術語"生物樣品"還包括 來源于組織培養(yǎng)或細胞培養(yǎng)的物質??蒞使用用于獲得生物樣品的任何適當的方法;示例 性的方法包括,例如,靜脈切開術、擦拭(例如,口腔擦拭),和細針穿刺活檢過程。在一些實 施方案中,還可通過內窺鏡檢查獲得樣品。從個體獲得或來源于個體的"生物樣品"包括在 從個體獲得之后已W任何適當的方式處理的任何運樣的樣品。
[0153] 在運種的情況下,祀細胞可W是腫瘤細胞,例如NS化C細胞。祀細胞來源于任何組 織來源,包括人和動物組織,例如但不限于,新獲得的樣品、冷凍樣品、活檢樣品、體液樣品、 血樣、保存的組織例如石蠟包埋固定的組織樣品(即組織塊)或細胞培養(yǎng)物。
[0154] 在一些特定的實施方案中,樣品可W包含或可W不包含小泡。
[01巧]方法和試劑盒
[0156] 用于基因表達分析的試劑盒
[0157] 用于進行本文所述的方法的試劑、工具和/或說明書可在試劑盒中提供。例如,試 劑盒可W含有用于確定食道癌癌癥患者的適合療法的試劑、工具和說明書。運種試劑盒可 W包括用于從患者收集,例如通過活檢收集組織樣品的試劑,和用于處理該組織的試劑。試 劑盒還可包括用于進行生物標志物表達分析的一種或多種試劑,例如用于進行核酸擴增, 包括RT-PCR和qPCR,NGS,RNA印跡,蛋白質組分析或免疫組化W確定患者的樣品中的生物標 志物的表達水平的試劑。例如,運種試劑盒中可W包括用于進行RT-PCR的引物,用于進行 RNA印跡分析的探針,和/或用于進行蛋白質組分析例如Western印跡、免疫組化和ELISA分 析的抗體。還可包括用于測定的適合的緩沖液。還可包括運些測定中的任何一種所需的檢 測試劑。W下詳細描述了適合的試劑和方法。
[0158] 在特定的實施方案中,表1A、3A、3B和3C(在一些實施方案中,還包括IB和1C)中所 列的祀序列,或它們的子集,可用在本文所述的方法和試劑盒中(例如SEQ ID NO: 1-80 (表 1八)、81-260(表34)、261-313(表38)、314-337(表18)、338-363(表1〇、364-455(表3〇)???W為設計與祀序列雜交的引物和/或探針的目的使用祀序列。一旦鑒別了祀序列,適合的引 物和/或探針的設計在本領域技術人員的能力之內??蒞自由獲得各種引物設計工具,W幫 助進行該過程,例如NCBI Primer-BLAST工具??蒞設計引物和/或探針,W使它們在嚴謹條 件下與祀序列雜交。引物和/或探針可W是長度為至少15、16、17、18、19、20、21、22、23、24或 25個(或更多個)核巧酸。應當理解,每一個子集可W包括針對同一個生物標志物的多個引 物和/或探針。運些表顯示在某些情況下,在同一個完整基因中存在多個祀序列。運些引物 和/或探針可W被包括在用于實施本發(fā)明方法的試劑盒中。該試劑盒可W是例如基于陣列 或PCR的試劑盒,并且可W包括其它試劑,例如聚合酶和/或dNTPs。本文所述的試劑盒還可 W包括描述如何進行用于測量生物標志物表達的測定的說明書。說明書還可包括有關如何 確定參考組群的說明,包括如何確定參考組群中生物標志物的表達水平和如何組合表達數 據W建立用于與測試患者相比較的參考。說明書還可包括用于測定測試患者中的生物標志 物表達和用于將該表達水平與參考組群中的表達相比較從而確定用于測試患者的合適化 療的說明。W上描述了用于確定合適的方法,且該方法可在說明書中詳細描述。
[0159] 試劑盒中包括的信息材料可W是與本文所述的方法和/或用于本文所述的方法的 試劑的用途相關的描述的、指導的、銷售的或其它的材料。例如,試劑盒的信息材料可W含 有聯(lián)系信息,例如,物理地址、電子郵件地址、網站或電話號碼,其中試劑盒的使用者可獲得 有關進行基因表達分析和解析結果的大量信息,特別是當應用于可能對特定治療劑具有響 應的人時。
[0160] 本文所述的試劑盒還可W含有從生物標志物表達推斷可能對特定的治療劑具有 陽性響應的患者所需的軟件。
[0161] 在一些實施方案中,該試劑盒可W另外含有在個體被預測為響應的情況下施用的 DNA損傷治療劑。本文所述的治療NS化C的任何特定試劑或試劑的組合都可W被加入到試劑 盒中??蒞 W特別為NS化C治療定制的形式,例如劑量形式提供試劑或試劑的組合。試劑盒 可W配有適當的用于根據NSCLC治療方案進行施用,例如在輔助治療和/或腫瘤輔助治療中 使用的說明。
[0162] a)基因表達譜分析方法
[0163] 在生物樣品中測量mRNA可W被用作生物樣品中的相應蛋白質水平檢測的替代。因 此,本文所述的任何生物標志物或生物標志物套組還可通過檢測合適的RNA來檢測?;虮?達譜分析的方法包括,但不限于,微陣列、RT-PCT、qPCR、NGS、RNA印跡、SAGE、質譜測定法。
[0164] mRNA表達水平可W通過反轉錄定量聚合酶鏈式反應(RT-PCR,然后進行qPCR)來測 量。RT-PCR被用來從mRNA產生cDNAdcDNA可用于qPCR測定W隨著DNA擴增過程的進行而產生 巧光。通過與標準曲線的比較,qPCR可產生絕對測量,例如每個細胞的mRNA拷貝數。與毛細 管電泳結合的RNA印跡、微陣列、侵入測定和RT-PCR均已用于測量樣品中的mRNA的表達水 平。參見Gene Expression Prof ilin邑:Methods and Protocols ,Richard A. Shimkets ,Hi 者,Humana Press,2004。
[0165] miRNA分子是非編碼但可調芐基因表達的小RNA。適合測量mRNA表達水平的任何方 法也可用于相應的miRNA。最近許多實驗室已研究了 miRNA作為疾病的生物標志物的用途。 許多疾病設及廣泛的轉錄調節(jié),miRNA可能具有生物標志物的作用并不令人驚訝。miRNA濃 度和疾病之間的關聯(lián)常常不如蛋白質水平和疾病之間的關聯(lián)那么清楚,然而,miRNA生物標 志物的價值可能是重要的。當然,與疾病過程中差異表達的任何RNA-樣,開發(fā)體外診斷產 品面臨的問題將包括W下要求:miRNA存在于病態(tài)細胞中且易于提取W進行分析,或miRNAs 被釋放到血液或其他基質中,它們在那里存在的時間必須足夠久W被測量。蛋白質生物標 志物有相似的要求,雖然許多潛在的蛋白質生物標志物在病理位點被有意地分泌,并在疾 病過程中W旁分泌的方式發(fā)揮作用。許多潛在的蛋白質生物標志物被設計為在合成那些蛋 白的細胞外發(fā)揮作用。
[0166] 基因表達還可利用質譜測定法來評價。多種配置的質譜儀可用于檢測生物標志物 的值??蒞獲得幾種類型的質譜儀或者可W用不同的配置來產生幾種類型的質譜儀。通常, 質譜儀具有W下主要組件:進樣口、離子源、質量分析器、檢測器、真空系統(tǒng)和儀器控制系統(tǒng) 和數據系統(tǒng)。進樣口、離子源和質量分析器的差異通常決定了儀器的類型及其性能。例如, 進口可W是毛細管柱液相色譜來源,或可W是直接進樣探頭或平臺,例如基質輔助激光解 吸中所用的。常見的離子源為,例如,電噴霧,包括納噴霧和微噴霧或基質輔助激光解吸。常 見的質譜儀包括四極濾質器、離子阱質量分析器和飛行時間質量分析器。其它質譜測定法 是本領域中熟知的(參見BurIingame et al. ,Anal.化em. 70 :647R-716R( 1998);Kinter and Sherman,化W York(2000))。
[0167] 蛋白質生物標志物和生物標志物值可通過任何W下方法來檢測和測量:電噴霧電 離質譜法化SI-MS)、ESI-MS/MS、ESI-MS/(MS)n、基質輔助激光解吸離子化飛行時間質譜測 定法(MALDI-T0F-MS )、表面增強激光解吸/電離飛行時間質譜測定法(沈LDI-TOF-MS )、娃上 的激光解吸/電離(DIOS)、次級離子質譜法(SIMS)、四極飛行時間(Q-TOF)、串聯(lián)飛行時間 (T0F/T0F)技術,稱為uUraflex III T0F/T0F,大氣壓化學電離質譜法(4?(:1-]\15)、4?(:1-MS/MS、APCI-(MS) .S叩.N、大氣壓光離子質譜法(APPI-MS)、APPI-MS/MS和APPI-(MS) .sup.N、四極質譜測定法、傅立葉變換質譜測定法(FTMS)、定量質譜測定法和離子阱質譜測 定法。
[0168] 在對蛋白值生物標志物進行質譜表征和確定生物標志物值之前使用樣品制備策 略來標記和富集樣品。標記方法包括但不限于用于相對和絕對定量的等量異位標簽 (iTRAQ)和細胞培養(yǎng)中用氨基酸進行的穩(wěn)定同位素標記(SILAC)。在質譜分析之前用來針對 候選生物標志物蛋白質選擇性富集樣品的捕捉試劑包括但不限于適體、抗體、核酸探針、嵌 合體、小分子、F(ab')2片段、單鏈抗體片段、Fv片段、單鏈Fv片段、核酸、凝集素、配體結合受 體、親和體(af f ybodieS)、納米抗體、錯蛋白、域抗體、可選的抗體支架(例如雙體抗體等)印 跡聚合物、高親和性多聚體(avimer)、模擬膚、類膚、膚核酸、蘇糖核酸、激素受體、細胞因子 受體和合成受體,W及運些的修飾形式和片段。
[0169] 前述測定能夠檢測生物標志物的值,所述生物標志物的值在用于預測對癌癥治療 劑的響應性的方法中是有用的,其中所述方法包括在來自患NS化C的個體的生物樣品中檢 測至少N個生物標志物值,其中每個生物標志物值對應于選自由表1至3中提供的生物標志 物組成的組,其中使用生物標志物值進行的分類,如W下所詳細描述的,指示個體對治療劑 是否具有響應性。雖然所描述的預測性生物標志物中的某些僅對于預測對治療劑的響應性 是有用的,本文還描述了生物標志物的多個子集的分組,所述每個子集可用作兩個或更多 個生物標志物的套組。因此,本申請的各個實施方案提供了包含N個生物標志物的組合,其 中N為至少3個生物標志物。應當理解N可W被選擇為W上所描述的范圍,W及相似的但更高 級別范圍中的任何范圍中的任何數目。根據本文所述的任何方法,生物標志物值可W被單 獨檢測并分類,或可W共同檢測并分類,例如W多重測定的形式。
[0170] b)微陣列方法
[0171] 在一個實施方案中,本發(fā)明利用了"寡核巧酸陣列"(在本文中也被稱作"微陣 列")。微陣列可用來分析細胞中生物標志物的表達,特別是用來測量癌癥組織的生物標志 物的表達。
[0172] 在一個實施方案中,生物標志物陣列通過將代表細胞中存在的mRNA轉錄物的可檢 巧時示記的多核巧酸(例如,從總細胞mRNA或標記的CRNA合成的巧光標記的cDNA)與微陣列雜 交而產生。微陣列是表面,該表面具有細胞或生物體基因組中許多基因的產物的結合(例如 雜交)位點的有序陣列,所述許多基因優(yōu)選為大多數基因或幾乎全部的基因??蒞用本領域 中已知的多種方法來制備微陣列。不管如何產生,微陣列都具有某些共同特征。陣列是可復 制的,運允許產生給定陣列的多個拷貝并易于相互比較。優(yōu)選地,微陣列是小的,通常小于 5cm 2,而且它們由在結合(例如核酸雜交)條件下穩(wěn)定的材料制成。微陣列中給定的結合位 點或結合位點的獨特的集合將特異性地結合細胞中的單個基因的產物。在特定的實施方案 中,使用在每個位置處含有附著的已知序列的核酸的位置可尋址陣列。
[0173] 應當理解,當制備與細胞的RNA互補的CDNA并在適合的雜交條件下將其與微陣列 雜交時,與陣列中對應于任何特定基因的位點的雜交水平將反映出由該基因/生物標志物 轉錄的mRNA在細胞中的發(fā)生率。例如,當與總細胞mRNA互補的可檢測標記(例如利用巧光素 標記)的CDNA或CRNA與微陣列雜交時,陣列上對應于未在細胞中轉錄的基因(即能夠特異性 結合基因的產物)的位點將具有很少的信號或沒有信號(例如巧光信號),而編碼mRNA普遍 存在的基因將具有相對強的信號。選擇核酸雜交和洗涂條件W便探針與特定的陣列位點 "特異性結合"或"特異性雜交",即,探針與具有互補核酸序列的序列陣列位點雜交、形成雙 鏈體或結合,而不與具有非互補核酸序列的位點雜交。如本文所使用的,如果多核巧酸的較 短部分少于或等于25個堿基,利用標準堿基配對法則無錯配,或者,如果多核巧酸的較短部 分長于25個堿基,不存在5% W上的錯配,運時則認為一個多核巧酸序列與另一個互補。優(yōu) 選地,多核巧酸完全互補(無錯配)。通過利用常規(guī)實驗通過進行包括陰性對照的雜交測定 可W證明,特定雜交條件導致特異性雜交。
[0174] 最佳雜交條件將取決于標記的探針和固定的多核巧酸或寡核巧酸的長度(例如, 寡聚體相對于超過200個堿基的多核巧酸)和類型(例如,RNA、DNA、PNA)。核酸的特定(即,嚴 謹)雜交條件的一般參數在Sambrook et al S叩ra和Ausubel et al "Current Protocols in Molecular Biology",Greene Publishing and Wiley-interscience,NY (1987)中描述,為所有目的,將其全文合并入本文。當使用cDNA微陣列時,典型的雜交條件 是在65它在5xSS如日0.2 % SDS中雜交4小時,然后在25它在化嚴謹洗嫌緩沖液(IxSSC加 0.2%SDS)中洗嫌,然后在25它在高嚴謹洗嫌緩沖液(0.1SS幼日0.2%SDS)中洗嫌10分鐘(參 見Shena et al ? ,Proc .Natl .Acad. Sci .USA, Vol .93,p ? 10614(1996)) D在例如Ti jessen. Hybridization With Nucleic Acid Probes",Elsevier Science Publishers B.V. (1993)和Kricka,"Nonisotopic DNA Probe Techniques",Academic Press,San Diego, 化lif. (1992)中也提供了可用的雜交條件。
[0175] 微陣列平臺包括由例如Affymetrix, IIlumina和Agilent的公司制造的那些。由 Affymetrix制造的微陣列平臺的實例包括U133 Plus2陣列、Almac proprietary Xcel?陣 列和Almac proprietary Cancer USAs?,包括Breast Cancer DSA? and Lung Csocer DSA?。
[0176] c)免疫測定方法
[0177] 免疫測定方法基于抗體與其相應祀標或分析物的反應,且可根據特定的測定形式 檢測樣品中的分析物。為了提高基于免疫響應性的測定方法的特異性和靈敏度,單克隆抗 體由于其特異性表位識別而經常被使用。在許多免疫測定中也已成功地使用了多克隆抗 體,原因是它們與單克隆抗體相比對于祀標的親和力提高。已設計了免疫測定用于寬范圍 生物樣品基質。已設計了免疫測定形式提供定性、半定量和定量的結果。
[0178] 可通過利用待檢測的特定分析物的已知濃度產生的標準曲線的應用來產生定量 結果?;跇藴是€繪制來自未知樣品的反應或信號的圖,且建立對應于未知樣品中的祀 標的量或值。
[0179] 已設計了多種免疫測定形式。ELISA或EIA可W定量地檢測分析物/生物標志物。該 方法基于標記物與分析物或抗體的連接,且標記物組分直接地或間接地包括酶??稍O計 ELISA測試的形式可W是對分析物進行直接、間接、競爭性或夾屯、法檢測。其它方法基于標 記物例如,放射性同位素 Qi25)或巧光。另外的技術包括,例如,凝集法、濁度法、比濁法、 Western blot、免疫沉淀、免疫細胞化學、免疫組化、流式細胞術、Luminex測定和其他技術 (參見ImmunoAssay = A Practical Guide,edited by Brian Law,published by Taylor & Francis,Ltd.,2005 edition)。
[0180] 示例性的測定形式包括酶聯(lián)免疫測定化LISA)、放射免疫測定、巧光測定、化學發(fā) 光測定和巧光共振能量轉移(FRET)或時間分辨-FRET(TR-FRET)免疫測定。用于檢測生物標 志物的程序的實例包括生物標志物免疫沉淀,然后進行允許區(qū)分大小和膚水平的定量方 法,例如凝膠電泳、毛細管電泳、平面電色譜等。
[0181] 檢測和/或定量可檢測的標記或信號產生物質的方法取決于標記物的性質。由適 當的酶催化的反應產物(其中可檢測的標記物是酶;見上文)可W是,但不限于,巧光產物、 發(fā)光產物或放射活性產物,或者它們可W吸收可見光或紫外光。適用于檢測運種可檢測標 記物的檢測物的實例包括,但不限于,X-射線薄膜、放射性計數器、閃爍計數器、分光光度 計、比色計、巧光光度計、光度計和光密度計。
[0182] 可W W允許進行任何適合反應制備、處理和分析的任何形式來進行任何用于檢測 的方法。運可W是,例如,在多孔測定板(例如,96孔或384孔)中進行或利用任何適合的陣列 或微陣列進行。用于不同的試劑的膽液可W人工地或由機器配制,并且所有隨后的吸取、稀 釋、混合、分配、洗涂、解育、樣品讀數、數據采集和分析可W利用能夠檢測可檢測標記物的 商業(yè)上可獲得的分析軟件、機器和檢測設備在機器上進行。
[018引臨床應用
[0184]在一些實施方案中,提供了用于鑒別和/或選擇對于治療方案有響應的NS化癌癥 患者的方法。特別地,該方法設及鑒別或選擇對于治療方案有響應的癌癥患者,所述治療方 案包括施用直接或間接損傷DNA的試劑。還提供了用于鑒別對于治療方案無響應的患者的 方法。運些方法通常包括確定患者腫瘤(原發(fā)性、轉移性腫瘤或來自腫瘤的其他衍生物,例 如,但不限于,血液或血液中的組分、尿液、唾液和其他體液)中一系列預測標志物的表達水 平,將表達水平與參考表達水平相比較,并鑒別樣品中的表達是否包括所選的預測標志物 或標志物集合的表達模式或表達譜,所述表達模式或表達譜對應于對治療劑有響應或無響 應。
[0185] 在一些實施方案中,預測患非小細胞肺癌(NSCLC)的個體對用DNA損傷治療劑進行 的治療的響應性的方法包括:
[0186] a.測量由個體獲得的測試樣品中的一個或多個生物標志物的表達水平,其中所述 一個或多個生物標志物選自表14、18、1(:、24、28、34、38或3。
[0187] b.得到記錄表達水平的測試得分;
[0188] C.提供闊值得分,其包含將測試得分與響應性相關聯(lián)的信息;
[0189] d. W及將測試得分與闊值得分相比較;其中當測試得分超過闊值得分時預測為有 響應性。
[0190] 在特定的實施方案中,預測患非小細胞肺癌(NSCLC)的個體對DNA損傷治療劑的響 應性的方法包括下述步驟:從個體獲得測試樣品;測量測試樣品中一個或多個生物標志物 的表達水平,其中一個或多個生物標志物選自由CX化10、MX1、ID01、IF1ML、CD2、GBP5、 FRAME、ITGAL、LRP4和AP化3組成的組;獲得記錄表達水平的測試得分;提供闊值得分,其包 含將測試得分與響應性相關聯(lián)的信息;W及將測試得分與闊值得分相比較;其中當測試得 分超過闊值得分時預測為有響應性。本領域普通技術人員利用本文提供的教導,包括實施 例1的教導,可W確定合適的闊值得分,和合適的生物標志物權重。
[0191] 在其它實施方案中,預測患非小細胞肺癌(NSCLC)的個體對DNA損傷治療劑的響應 性的方法包括測量測試樣品中一個或多個生物標志物的表達水平,其中一個或多個生物標 志物選自由 CXCL10、MX1、ID01、IF1ML、CD2、GBP5、PRAME、ITGAL、LRP4、AP0L3、CDR1、FYB、 TSPAN7、RAC2、KLHDC7B、GRB14、AC138128.1、KIF26A、CD274、CD109、ETV7、MFAP5、0LFM4、 PI15、F0SB、FM19A5、NLRC5、PRICKLE1、EGR1、CLDN10、ADAMTS4、SP140L、ANXA1、RSAD2、ESR1、 11(2尸3、01?211口、66尸1?、魁1'1、1^\152、〔¥口286、口1口肪、口口口11?14和41^37218.1組成的組。表2八和 2B提供了示例性的基因標簽(或基因分類器),其中生物標志物分別由其中所列的40或44個 基因產物組成,并且其中闊值得分來源于其中所列的單個基因產物權重。在運些實施方案 中的一個中,其中生物標志物由表2B所列出的44個基因產物組成,并且該生物標志物與表 2B中所提供的權重相關聯(lián),超出闊值得分,例如0.3681的闊值得分的測試得分指示了個體 可能對DNA損傷治療劑有響應性。
[0192] 如果與在不接觸治療劑情況下的生長相比較,癌癥與治療劑接觸的結果是生長速 率被抑制時,則癌癥對于治療劑是"有響應的"。癌癥的生長可W用多種方法來測量,例如, 可測量腫瘤的尺寸或適用于該腫瘤類型的腫瘤標志物的表達。
[0193] 如果與在不接觸治療劑情況下的生長相比較,癌癥與治療劑接觸的結果是癌癥的 生長速率沒有被抑制,或被抑制的程度非常低,則癌癥對于治療劑是"無響應的"。如上所 述,癌癥的生長可用多種方法來測量,例如,可測量腫瘤的尺寸或適用于該腫瘤類型的腫瘤 標志物的表達。對治療劑無響應的性質是高度可變的,在不同的條件下,不同的癌癥對于給 定的治療劑表現(xiàn)出不同水平的"無響應性"。更進一步地,除了腫瘤的生長大小之外,利用其 它標準,包括患者的生活質量、轉移的程度等,可W評估無響應性的測量。
[0194] 該測試的可預測終點,包括但不限于,總生存率,無進展生存率,放射響應,如 RECIST所定義的,完全響應,部分響應,穩(wěn)定病情和血清學標志物,例如但不限于,PSA、CEA、 CA125、CA15-3和CA19-9。在特定的實施方案中,本發(fā)明評價NS化C中的標準胸片、計算機斷 層掃描(CT)、灌注CT、動態(tài)造影劑增強磁共振(MR)擴散加權(DW)MR或者使用葡萄糖模擬物 氣18氣脫氧葡萄糖(抑G)的正電子發(fā)射斷層掃描(PET) (FDG-PET)響應,所述NS化C用DNA損 傷治療劑,包括組合療法,單獨地或在標準治療的環(huán)境中進行治療。
[01M]可W使用在一種或多種核酸或它們的生物學衍生物例如編碼蛋白的樣品中用于 檢測、定量和定性RNA、DNA或蛋白的基于陣列或非陣列的方法,包括定量PCR(QPCR)、酶聯(lián)免 疫吸附測定化LISA)或免疫組化(MC)等。
[0196] 從被測定的樣品獲得表達譜之后,將表達譜與參考或對照譜相比較W對細胞或組 織的治療響應表型進行診斷,并由此對獲得樣品的宿主的治療響應表型進行診斷。本文所 使用的關于表達譜的術語"參考"和"對照"表示基因或基因產物表達或特定生物標志物的 表達水平的標準化模式,其是用于解釋給定患者的表達分類器并歸類于預后或預測類別 的。參考或對照表達譜可W是從已知具有所需表型的樣品獲得的譜,所述所需表型例如,響 應表型,且因此可W是陽性參考或對照譜。此外,參考譜可W來自已知不具有所需表型的樣 品,且因此是陰性參考譜。
[0197] 如果使用定量PCR作為定量一種或多種核酸的水平的方法,該方法可W通過測量 由雙重標記的巧光探針(例如TaqMan⑩探針或分子信標或FRET/Li曲t切Cler探針)釋 放的巧光來定量PCR產物積累。一些方法可能不需要單獨的探針,例如Scorpion和 Ampliflyor系統(tǒng),其中探針被構建到引物中。
[0198] 在特定的實施方案中,將獲得的表達譜與單一參考譜相比較W獲得關于被測定的 樣品的表型的信息。在其它的實施方案中,將獲得的表達譜與兩種或更多種不同的參考譜 相比較W獲得關于測定的樣品的表型的更深入的信息。例如,可將獲得的表達譜與陽性和 陰性參考譜相比較W獲得關于樣品是否具有感興趣的表型的確定的信息。
[0199] 可利用任何方便的方法進行所獲得的表達譜與一種或多種參考譜的比較,其中多 種方法是陣列領域的技術人員已知的,例如,通過比較表達譜的數字圖像、通過比較表達數 據的數據庫等。描述表達譜比較的方法的專利包括,但不限于,美國專利Nos. 6308170和 6228575,通過引用將其公開內容合并入本文。比較表達譜的方法也在上面描述。
[0200] 比較步驟產生了有關所獲得的表達譜與一種或多種參考譜的相似或相異程度的 信息,該相似信息被用來確定被測定的樣品的表型。例如,與陽性對照的相似性表明測定的 樣品具有與響應性參考樣品相似的響應性表型。相似地,與陰性對照的相似性表明測定的 樣品具有與無響應性參考樣品相似的無響應性表型。
[0201] 可進一步將生物標志物的表達水平與不同的參考表達水平相比較。例如,參考表 達水平可W是預定的標準表達參考水平,W評價生物標志物或生物標志物集合的表達是否 提供信息,并作出評價確定患者是有響應還是無響應。此外,確定生物標志物的表達水平可 W與同生物標志物同時測量的表達的內部參考標志物水平相比較,W作出評價確定患者是 有響應還是無響應。例如,并非由本發(fā)明的生物標志物組成但已知證明為恒定表達水平的 不同的標志物套組的表達可作為內部參考標志物水平被評估,并與該參考相比較而確定生 物標志物的表達水平。在一個可選的實例中,非腫瘤樣品的組織樣品中的選定生物標志物 的表達可W作為內部參考標志物水平被評估。在某些方面,生物標志物的表達水平可被確 定為具有提高的表達。在其它方面,生物標志物的表達水平可被確定為具有降低的表達。表 達水平可被確定為與參考水平相比較在表達上提供的信息無變化。在其它方面,相對于由 本文所提供的方法確定的預定的標準表達水平來確定表達水平。
[0202] 本發(fā)明還設及指導患者的常規(guī)治療。診斷測試顯示其為對于直接或間接影響DNA 損傷和/或DNA損傷修復種類的藥物的響應者的患者,可被施用該療法,并且該患者和腫瘤 學家都能有信屯、認為患者將會受益。由診斷測試確定無響應者的患者可被鑒別為使用更可 能為他們提供益處的替代療法。
[0203] 本發(fā)明還設及選擇用于臨床試驗的患者,其中新型藥物的種類直接或間接影響 DNA損傷和/或DNA損傷修復W治療NS化C。具有潛在的響應者的試驗群體的富集將有助于在 相關標準下對該藥物進行更徹底的評價。
[0204] 本發(fā)明還進一步設及將患者診斷為患有或者易于發(fā)展為與DNA損傷響應缺陷 (DDRD)有關的NS化C的方法。孤RD在本文中被定義為其中患者的一個或多個細胞具有降低 的修復DNA損傷的能力的任何病況。DDRD診斷可W與范可尼貧血/BRCA途徑中的突變相關 聯(lián)。DDRD診斷還可W與腺癌相關聯(lián)。診斷患有非小細胞肺癌(NSCLC)的個體的方法可W包 括:
[0205] a.測量從個體獲得的測試樣品中的一個或多個生物標志物的表達水平,其中一個 或多個生物標志物選自表14、18、1(:、24、28、34、38或3。
[0206] b.得到記錄表達水平的測試得分;
[0207] C.提供闊值得分,其包含將測試得分與NS化C的診斷相關聯(lián)的信息;
[0208] d. W及將測試得分與闊值得分相比較;其中當測試得分超過闊值得分時,確定個 體患有NS化C或易于發(fā)展為NS化C。
[0209] 診斷方法可W包括W下步驟:從個體獲得測試樣品;測量測試樣品中一個或多個 生物標志物的表達水平,其中一個或多個生物標志物選自由CX化10、MX1、IDOl、IFlMU CD2、GBP5、PRAME、ITGAL、LRP4和AP化3組成的組;得到記錄表達水平的測試得分;提供闊值 得分,其包含將測試得分與NS化C的診斷相關聯(lián)的信息;W及將測試得分與闊值得分相比 較;其中當測試得分超過闊值得分時,確定個體患有該癌癥或易于發(fā)展為該癌癥。利用本文 提供的教導,包括實施例1的教導,本領域普通技術人員可W確定合適的闊值得分和合適的 生物標志物權重。
[0210] 在其它實施方案中,將患者診斷為患有或者易于發(fā)展為與DDRD有關的NS化C的方 法包括測量測試樣品中一個或多個生物標志物的表達水平,其中一個或多個生物標志物選 自由 CXCL10、MX1、IDO1、IF144L、CD2、GBP5、PRAME、ITGAL、LRP4、AP0L3、CDR1、FYB、TSPAN7、 RAC2、KLHDC7B、GRB14、AC138128.1、KIF26A、CD274、CD109、ETV7、MFAP5、0LFM4、PI15、F0SB、 FAM19A5、NLRC5、PRICKLE1、EGR1、CLDN10、ADAMTS4、SP140L、ANXAl、RSAD2、ESR1、IKZF3、 0尺211?、66。3、魁1'1、1^^152、〔¥?286、?1?亂、???11?14和41^37218.1組成的組。表24和28提供 了示例性的基因標簽(或基因分類器),其中生物標志物分別由其中所列的40個基因產物或 44個基因產物所組成,且其中闊值得分來源于其中所列的單個基因產物權重。在運些實施 方案中的一個中,其中生物標志物由表2B所列的44個基因產物所組成,并且生物標志物與 表2B中提供的權重相關聯(lián),超過闊值得分,例如0.3681的闊值得分的測試得分指示著NS化C 或易于發(fā)展為NS化C的診斷。
[0211] W舉例的方式,而非限制的方式提供下述實施例。 實施例
[0212]實施例1
[0別;3] 孤畑測定對NS化癌癥的應用和驗證
[0別4] 方法
[0215] 腫瘤材料
[0216] 在已公開的來自GEO的90個非小細胞肺癌(NSCL)冷凍腫瘤組織樣品群(GSE14814) 上進行基因表達分析。在進行進一步分析之前,將由主成分分析(Principal Component Analysis)鑒別為異常值的一個樣品移除。該樣品群可W進一步如下描述:
[0217] 參39個樣品未進行治療,而50個樣品接受了輔助的基于銷的療法(順銷,與有絲分 裂抑制劑,長春瑞濱一起)進行治療
[021 引參年齡:63.2[46.3-80.1]
[0219] 參性別:66名男性和23名女性
[0220] 參分期:45個I期,44個II期
[0221] 數據準備
[0222] 所有樣品通過RMA(穩(wěn)健多陣列平均)預處理進行處理。
[0223] 分層聚類分析
[0224] 來自原始平臺(Breast DSA?)的探針集被重新對應到NS化平臺(Affymetrix人 基因組U133A陣列)上的探針集上,W完成平臺之間信息的轉換。對NS化預處理數據矩陣進 行進一步過濾,W除去所有非信息性的探針集(PS)并保留在原始DDRD分析中鑒別的最可變 基因。該基因集包括在DDRD樣品中定義的基因和與其它功能在生物學上相關的其它基因。 使用歐氏距離化UClidean)作為距離度量,并使用離差平方和作為連鎖方法進行分層凝聚 聚類分析。
[02巧]基因簇分析
[0226] 如果基因屬于定義DDRD樣品的基因簇,或者說屬于富集DDRD和免疫響應功能的聚 類,則它們被分類為DDRD。其它基因被定義為非DDRD。
[0227] DDRD基因中每個基因簇的組成被計算為每個簇(DDRD基因的數目/簇中基因的數 目)尺寸的百分比。
[022引 DDRD基因的高表達表示DDRD陽性表型,而運些基因的低表達代表DDRD陰性表型, 運允許將樣品分類為DDRD陽性或DDRD陰性。
[0229] 生存率分析
[0230] 在每一個DD畑樣品組中進行單變量生存率分析,比較經治療的樣品和未經治療的 樣品。使用COX比例風險比模型計算P-值和風險比。
[0231] 結果
[0232] 孤畑亞型的鑒別
[0233] 聚類分析結果在圖1中顯示。
[0234] 基因簇#4顯示與DDRD基因的高度重疊,運證明DD畑機制在肺中起作用。運些基因 在表1A中列出。它由65%的原始孤畑基因(參見WO 2012/037378)組成,而其它包括較大簇 的聚類僅含有最多12%的DDRD基因。對于不同的樣品簇可W觀察到運些基因的強表達模 式,其中對于樣品簇2,運些基因明顯上調。該表達模式與在DDRD發(fā)現(xiàn)集中觀察到的原始表 達模式類似;即下調樣品組、上調樣品組和混合表達樣品組。所有運些觀察結果表明在肺中 存在孤畑亞組。
[0235] 樣品簇2顯示孤畑基因簇強烈上調,因此將其標記為"孤畑陽性",而其它兩個樣品 簇(#1和#3)被標記為"孤RD陰性",與乳腺中的DDRD的發(fā)現(xiàn)分析相一致。
[0236] 生存率分析結果
[0237] 在DDRD樣品組和非DDRD樣品組之間觀察到治療患者與未治療患者生存率上的差 異。在DDRD組中,在治療患者和未治療患者之間發(fā)現(xiàn)生存率有顯著差異:HR = 5.099 [0.9783-26.57],p-值= 0.032,圖2。相比而言,在非孤畑組中觀察到在治療患者和未治療 患者之間生存率沒有有顯著差異:HR是1.428 [ 0.6048-3.372 ],P-值=0.414,圖3。
[023引運些觀察表明我們的DDRD組能夠鑒別更可能從輔助的基于銷(基于順銷)的療法 中受益的患者亞群。
[0239] 結論
[0240] 提供證據證明在大約30 %的NS化C中發(fā)現(xiàn)DDRD亞型。與該組(DDRD-)之外的患者 (風險比1.4化=0.414)相比,運些患者在進行了輔助的基于銷的療法之后獲得生存率益處 (風險比5. Olp = 0.0 32)。因此,孤畑測定可W預測NS化患者中化療的益處。
[0241] 實施例2
[0242] 孤畑44基因標簽對NS化癌癥的應用
[0243] 方法
[0244] 腫瘤材料
[0245] 在已公開的來自GEO的60個非小細胞肺癌(NSCL)冷凍腫瘤組織樣品群化-MTAB-923和GSE37745)上進行基因表達分析。該樣品群可W進一步如下描述:
[0246] ?所有樣品接受輔助的基于銷的療法(順銷,與有絲分裂抑制劑,長春瑞濱一起) 的治療
[0247] ?組織學:46個腺癌,8個鱗狀癌和6個大細胞癌 [024引參分期:22個I期,14個II期,23個HI期和1個IV期
[0249] 數據準備
[0250] 所有樣品通過RMA(穩(wěn)健多陣列平均)預處理進行處理。
[0巧1 ] 孤畑分類
[0巧2] 對每一個樣品,使用對應到Affymetrix GeneOlip⑩人基因組U133+2.0陣列的 探針集的中位數值計算44個標簽基因的每一個的強度(表3C)"DDRD得分被計算為該標簽中 基因強度的加權和,使用0.65的闊值將樣品分類為DDRD陽性和DDRD陰性,其中DDRD得分大 于闊值的樣品被分類為DDRD陽性,孤RD得分小于或等于闊值的樣品被分類為DDRD陰性。
[0253] 生存率分析
[0254] 進行單變量生存率分析,W確定DDRD狀態(tài)對于輔助化療之后的總生存率的影響。 使用COX比例風險比模型計算P-值和風險比。
[0城]結果 [0巧6] 孤畑分類
[0巧7] 對該NS化癌癥群的應用孤畑標簽的結果是30個樣品(50%)被預測為孤畑陽性,30 個樣品(50%)被預測為DDRD陰性。
[0258]生存率分析結果
[0巧9] 觀察到在DD畑陽性患者和DD畑陰性患者之間存在生存率的顯著差異:皿= 0.4445 [0.2397-0.8241],p-值=0.0098,圖4。
[0260] 運些觀察結果表明我們的DDRD組能夠鑒別將會從輔助的基于銷(基于順銷)的療 法中受益的患者亞群。
[0261] 本發(fā)明的各個實施方案的范圍不受到本文所述的特定實施方案的限制。事實上, 除了本文所述的那些之外,根據前述的描述和所附的附圖,各個實施方案的不同修改對于 本領域技術人員來說將會變得顯而易見。運種修改落在所附的權利要求的范圍內。而且,在 適當的情況下,本文所述的所有實施方案被認為廣泛地應用于并結合任何和所有其它相容 的實施方案。
[0262] 本文所應用的各個出版物,通過引用其全文將其公開內容合并入本文。
【主權項】
1. 預測患有非小細胞肺癌(NSCLC)的個體對用DNA損傷治療劑進行的治療的響應性的 方法,其包括: a. 測量由所述個體獲得的測試樣品中的一個或多個生物標志物的表達水平,其中所述 一個或多個生物標志物選自表2B、1A、1B、1C、2A、3A、3B和/或3C; b. 得到記錄表達水平的測試得分; c. 提供閾值得分,其包含將測試得分與響應性相關聯(lián)的信息; d. 以及將測試得分與閾值得分相比較;其中當測試得分超過閾值得分時預測為有響應 性,和/或當測試得分未超過閾值得分時,預測為無響應性。2. 權利要求1的方法,其中所述一個或多個生物標志物選自由CXCL10、MX1、ID01、 正14禮、〇)2、68?5、?1^1^、叮6厶1^、1^?4和厶?01^3組成的組,和/或由〇)1?1小¥8、了5?厶階、1^〇2、 KLHDC7B、GRB14、AC138128.1、KIF26A、CD274、CD109、ETV7、MFAP5、0LFM4、PI15、F0SB、 FAM19A5、NLRC5、PRICKLE1、EGR1、CLDN10、ADAMTS4、SP140L、ANXA1、RSAD2、ESR1、IKZF3、 01?211?』6卩1?、嫩1'1、1^^52、〇¥?286、?了?1?(:、???11?1厶和厶1^137218.1組成的組。3. 權利要求2的方法,包括測量全部生物標志物的表達水平。4. 權利要求1的方法,包括測量下列生物標志物的表達水平: a. 測試樣品中來自表1A的生物標志物的至少10個;和/或 b. CD2、FYB、ITGAL和RAC2的至少一個或更多個直至全部。5. 權利要求4的方法,包括測量表1A中所列的全部58個不同生物標志物的表達水平。6. 權利要求1-5任一項的方法,其中使用引物或探針測量表達水平,所述引物或探針與 SEQ ID NO:1-80(表1A)、81-260(表3A)、261-313(表3B)、314-337(表1B)、338-363(表1C)所 示的靶序列的至少之一結合或包含SEQ ID NOs 364-455(表3C)的任一個的至少15個連續(xù) 核苷酸。7. 權利要求1-6任一項的方法,其中NSCLC是早期、晚期或轉移性疾病。8. 權利要求1-7任一項的方法,其中NSCLC選自腺癌、大細胞肺癌和鱗狀細胞癌的一種 或多種。9. 權利要求1-8任一項的方法,其中DNA損傷治療劑包含選自由DNA損傷劑、DNA修復靶 向療法、DNA損傷信號傳導抑制劑、DNA損傷誘導的細胞周期停滯的抑制劑、組蛋白脫乙酰酶 抑制劑、熱休克蛋白抑制劑和DNA合成抑制劑組成的組的一種或多種物質。10. 權利要求9的方法,其中DNA損傷治療劑包含含鉑試劑、核苷類似物例如吉西他濱或 5_氟脲嘧啶或其前藥例如卡培他濱、蒽環(huán)霉素例如表阿霉素或阿霉素、烷基化試劑例如環(huán) 磷酰胺、電離輻射或輻射和化療的組合(放化療)的一種或多種。11. 權利要求1-10任一項的方法,其中DNA損傷治療劑包含含鉑試劑。12. 權利要求11的方法,其中基于鉑的試劑選自順鉑、卡鉑和奧沙利鉑。13. 權利要求1-12任一項的方法,其預測對于用DNA損傷治療劑和其它療法一起進行的 治療的響應性。14. 權利要求13的方法,其中其它療法是有絲分裂抑制劑(的治療)。15. 權利要求14的方法,其中有絲分裂抑制劑是長春花生物堿。16. 權利要求15的方法,其中長春花生物堿是長春瑞濱。17. 權利要求1-13任一項的方法,其預測對包含DNA損傷治療劑的組合療法的響應性, 其中所述組合療法選自: a. 順鉑/卡鉑和5-氟脲嘧啶 b. 順鉬/卡鉬和卡培他濱 c. 表阿霉素/阿霉素、順鉑/卡鉑和氟脲嘧啶 d. 表阿霉素/阿霉素、奧沙利鉑和卡培他濱 e. 順鉑/卡鉑和依托泊苷 f. 吉西他濱和順鉑/卡鉑 g. 環(huán)磷酰胺、表阿霉素/阿霉素和長春新堿 h. 環(huán)磷酰胺、表阿霉素/阿霉素、長春新堿和依托泊苷 i .表阿霉素/阿霉素、環(huán)磷酰胺和依托泊苷。18. 權利要求1-17任一項的方法,其中所述治療是輔助治療和/或腫瘤輔助治療。19. 權利要求1-18任一項的方法,其中如果預測為有響應性,則用DNA損傷治療劑治療 所述個體。20. 權利要求1-18任一項的方法,其中如果預測為無響應性,則不用DNA損傷治療劑治 療所述個體。21. 權利要求1-20任一項的方法,其中所述治療是輔助的順鉑/長春瑞濱治療。22. 權利要求20的方法,其中如果預測為無響應性,則用有絲分裂抑制劑治療所述個 體。23. 權利要求1-22任一項的方法,其中有響應性包含或是提高的總生存率、無進展生存 率和/或無疾病生存率。24. (a)治療NSCLC的方法,包括給受試者施用DNA損傷治療劑,其中所述受試者基于測 試得分被預測為對DNA損傷治療劑有響應,所述測試得分衍生自從個體獲得的測試樣品中 的一個或多個生物標志物的表達水平,其中所述一個或多個生物標志物選自表2B、1A、1B、 1(:、2六、3六、38和/或3(:中所列出的那些 ;或者 (b)DNA損傷治療劑在治療NSCLC的方法中的應用,其中所述受試者基于測試得分被預 測為對DNA損傷治療劑有響應,所述測試得分衍生自從個體獲得的測試樣品中的一個或多 個生物標志物的表達水平,其中所述一個或多個生物標志物選自表2B、1A、1B、1C、2A、3A、3B 和/或3C中所列出的那些。25. (a)治療NSCLC的方法,包括給受試者施用有絲分裂抑制劑,其中所述受試者基于測 試得分被預測為對DNA損傷治療劑無響應,所述測試得分衍生自從個體獲得的測試樣品中 的一個或多個生物標志物的表達水平,其中所述一個或多個生物標志物選自表2B、1A、1B、 1(:、2六、3六、38和/或3(:中所列出的那些 ;或者 (b)有絲分裂抑制劑在治療NSCLC的方法中的應用,其中所述受試者基于測試得分被預 測為對DNA損傷治療劑無響應,所述測試得分衍生自從個體獲得的測試樣品中的一個或多 個生物標志物的表達水平,其中所述一個或多個生物標志物選自表2B、1A、1B、1C、2A、3A、3B 和/或3C中所列出的那些。26. 權利要求24或25的方法或應用,其中已經根據權利要求1-23任一項請求保護的方 法獲得測試得分。27. 用于預測患有非小細胞肺癌(NSCLC)的個體對用DNA損傷治療劑進行的治療的響應 性的試劑盒,包含引物或探針,所述引物或探針與SEQ ID勵:1-80(表1六)、81-260(表3八)、 261-313(表3B)、314-337(表1Β)、338-363(表1C)所示的靶序列的至少一個雜交或包含SEQ ID N0s364-455(表3C)的任一個的至少15個連續(xù)核苷酸。28. 權利要求27的試劑盒,其中所述引物或探針與靶序列的至少10個雜交。29. 權利要求27或28的試劑盒,還包含DNA損傷治療劑。30. 權利要求29的試劑盒,其中所述DNA損傷治療劑以特別用于治療NSCLC的劑型提供。31. 權利要求30的試劑盒,其中所述治療是腫瘤輔助治療或輔助治療。32. 權利要求27-31任一項的試劑盒,其中所述DNA損傷治療劑包括基于鉑的劑。
【文檔編號】C12Q1/68GK105874079SQ201480058968
【公開日】2016年8月17日
【申請日】2014年9月9日
【發(fā)明人】K·基廷, L·希爾, S·德哈羅, E·奧布萊恩, T·達維森, P·哈金, R·肯尼迪, J·奧唐奈
【申請人】阿爾瑪克診斷有限公司