使用序列標簽的序列確定方法
【專利摘要】本發(fā)明涉及使用序列標簽以改善相關(guān)序列的擴增子特別是大的和復(fù)雜的擴增子,例如包含編碼免疫受體分子的重組核酸的擴增子的序列確定。在一個方面,比對具有相同序列標簽的序列讀段(read),然后,由在每個位置的序列讀段堿基響應(yīng)(base call)的(可能加權(quán)的)平均堿基響應(yīng)確定最終堿基響應(yīng)。相似地,在另一個方面,通過共同序列標簽比對包括一系列的摻入信號的序列讀段,并且均聚物區(qū)域中的堿基響應(yīng)被作為在每個“流”位置的功能摻入信號值。
【專利說明】使用序列標簽的序列確定方法
[0001] 交叉引用
[0002] 本申請要求2013年3月15日申請的美國專利申請序列號13/835,093的優(yōu)先權(quán), 美國專利申請序列號13/835, 093要求以下美國臨時專利申請的優(yōu)先權(quán):2012年6月11日 申請的序列號61/658, 317、2012年12月17日申請的序列號61/738, 277以及2013年3月 11日申請的序列號61/776, 647,它們每個的全文通過引用并入本文。本申請還要求全文通 過引用并入本文的2013年5月30日申請的美國臨時專利申請序列號61/829,054的優(yōu)先 權(quán)。
[0003] 發(fā)明背景
[0004] 生物或醫(yī)學(xué)樣品的分析通常需要確定DNA和/或RNA的大的和復(fù)雜的群體 的核酸序列,例如 Gloor 等,PLoS ONE 5(10) :el5406 (2010) ;Petrosino 等,Clinical Chemistry, 55(5):856-866 (2009) ;Arstila 等,Science, 286:958-961(1999)。尤其 地,編碼免疫分子,例如T細胞或B細胞受體或它們的組分的核酸譜包含大量的關(guān)于有 機體的健康或疾病狀態(tài)的信息,使得已經(jīng)提出使用這樣的譜作為許多健康狀況的診斷 或預(yù)后指標,例如Faham和Willis,美國專利公開2010/0151471 ;Freeman等,Genome Research, 19 :1817-1824 (2009) ;Boyd 等,Sci. Transl. Med.,1 (12) : 12ra23 (2009) ;He 等, 0ncotarget(2011年3月8日)。這樣的基于序列的譜能夠比基于擴增的革E核酸的大小分 布、通過微陣列的序列取樣、來自PCR擴增子的雜交動力曲線的方法或其它方法靈敏得多, 例如Morley等,美國專利5, 418, 134 ;van Dongen等,Leukemia, 17:2257-2317(2003) ;0gle 等,Nucleic Acids Research, 31: el39 (2003) ;Wang 等,BMC Genomics, 8:329 (2007) ;Baum 等,Nature Methods, 3(11) :895-901(2006)。然而,因為待分析的群體的大小、這樣的群體 中序列的相似性、序列之間天然變異的有限可預(yù)測性以及由許多樣品制備和測量步驟引入 數(shù)據(jù)的噪音,從序列數(shù)據(jù)有效確定克隆型(clonotype)和克隆型譜(clonotype profile) 構(gòu)成挑戰(zhàn),例如 Warren 等,Genome Research, 21 (5) : 790-797 (2011) 〇
[0005] 序列標簽或條形碼已經(jīng)以多種方式用于輔助核酸群體的分析,包括標記、 污染監(jiān)測、罕見突變檢測、物理排序、分子計數(shù)等,例如Kinde等,Proc. Natl. Acad. Sci. ,108 (23) :9530-9535 (2011) ;Casbon 等,美國專利公開 2012/0071331 出renner,美國 專利 5, 635, 400 ;Brenner 和 Macevicz,美國專利 7, 537, 897 ;Brenner 等,Proc. Natl. Acad. Sci. ,97:1665-1670(2000) ;Church 等,歐洲專利公開 0 303 459 ;Shoemaker 等,Nature Genetics, 14:450-456(1996) ;Morris 等,歐洲專利公開 0799897A1 ;Wallace,美國專利 5, 981,179。最近,Kinde等(以上引用)顯示了序列標簽如何能用于區(qū)分測序和擴增錯誤 與參照序列中的罕見突變。
[0006] 考慮到用于醫(yī)療和診斷應(yīng)用的準確測序的重要性,如果序列標簽的使用可以就提 高序列確定的效率和準確性而在這類應(yīng)用中擴展,那么它將高度有益。
[0007] 發(fā)明概述
[0008] 本發(fā)明涉及用于產(chǎn)生復(fù)雜的核酸群體的基于序列的譜的方法,所述復(fù)雜的核酸群 體特別是編碼免疫分子或其部分的組庫(repertoire)的重組核酸群體。在許多實施方式 和應(yīng)用中示例了本發(fā)明,它們的一些總結(jié)于以下并遍及說明書中。
[0009] 在一個方面,本發(fā)明涉及確定免疫組庫的克隆型的方法,所述方法包括步驟:(a) 從個體獲得包含T細胞和/或B細胞的樣品;(b)將序列標簽附接到T細胞受體基因或者T 細胞和/或B細胞的免疫球蛋白基因的重組核酸的分子,以形成標簽-分子軛合物,其中所 述標簽-分子軛合物的基本上每個分子具有獨特的序列標簽;(c)擴增所述標簽_分子軛 合物;(d)測序所述標簽_分子軛合物;以及(e)比對相似序列標簽的序列讀段(read)以 確定相應(yīng)于所述組庫的相同克隆型的序列讀段。
[0010] 在另一方面,本發(fā)明涉及在正被監(jiān)測微小殘留?。╩inimal residual disease)的 患者中檢測克隆型殘留污染(carry over contamination)的方法,包括步驟:(a)通過根 據(jù)權(quán)利要求A1的方法定期地測量患者的克隆型譜而監(jiān)測患者的微小殘留?。?b)記錄克隆 型譜的每個測量的所述序列標簽;以及(c)如果在后面的克隆型譜中檢測到任何先前的克 隆型譜的序列標簽,則檢測到克隆型殘留污染。
[0011] 在另一個方面,本發(fā)明涉及確定樣品中淋巴細胞的數(shù)目的方法,包括下述步驟: (a)從個體獲得包含淋巴細胞的樣品;(b)將序列標簽附接到所述淋巴細胞的T細胞受體基 因或免疫球蛋白基因的重組核酸的分子,以形成標簽-分子軛合物,其中所述標簽-分子軛 合物的基本上每個分子具有獨特的序列標簽;(c)擴增所述標簽_分子軛合物;(d)測序所 述標簽-分子軛合物;(e)計數(shù)不同的序列標簽的數(shù)目,以確定樣品中淋巴細胞的數(shù)目。
[0012] 在另一方面,本發(fā)明涉及在一個或更多個合成測序反應(yīng)中確定一個或更多個多核 苷酸的核苷酸序列的方法,包括步驟:(a)將序列標簽附接到所述一個或更多個多核苷酸 的每個,以形成標簽-多核苷酸軛合物,其中所述標簽-多核苷酸軛合物的基本上每個多 核苷酸具有獨特的序列標簽;(b)擴增所述標簽-多核苷酸軛合物;(c)合成測序擴增的標 簽-多核苷酸軛合物,其中合成測序包括至少一個dNTP流;以及(d)對于具有相同序列標 簽的每個標簽-多核苷酸,確定每個dNTP流的核苷酸摻入的數(shù)目,該數(shù)目作為每個這樣的 dNTP流的測量的摻入信號的函數(shù)。
[0013] 本發(fā)明提供了從通過高通量測序編碼免疫分子的體細胞重組的核酸獲得的序列 數(shù)據(jù)的大的集合確定克隆型和克隆型譜的方法。在一個方面,本發(fā)明通過用獨特的序列標 簽標記樣品中的每個體細胞重組的核酸分子而實施上述方法,所述獨特的序列標簽用于將 來自樣品的包含相同克隆型序列的拷貝的序列讀段分組。
[0014] 以上表征的本發(fā)明的這些方面以及其它方面,在所說明的許多實施方式和應(yīng)用中 例示,其中一些在附圖中示出,并在隨后的權(quán)利要求書部分進行表征。然而上述概述并非旨 在描述所說明的本發(fā)明的每個實施方案或每個實施方式。
[0015] 附圖簡述
[0016] 本發(fā)明的新穎特征在隨附的權(quán)利要求中具體闡述。通過參考以下闡述其中利用本 發(fā)明原理的示例性實施方案的詳述和附圖,獲得對本發(fā)明的特征及優(yōu)點的更好的理解,在 附圖中:
[0017] 圖1A-1B圖示了通過取樣而標記以將獨特的序列標簽附接到核酸分子的實例。
[0018] 圖1C圖示了IgH轉(zhuǎn)錄本,以及其內(nèi)的天然變異的來源。
[0019] 圖2A-2C顯示了用于擴增重組的核酸分子的兩階段PCR(a two-staged PCR)方 案。
[0020] 圖3圖示了從與相同序列標簽締合的序列讀段確定克隆型的序列的步驟的一個 實施方式。
[0021] 圖4A-4D圖示了本發(fā)明的涉及在合成測序操作中確定均聚物區(qū)域的實施方案。
[0022] 發(fā)明詳述
[0023] 除非另外表明,本發(fā)明的實施可使用分子生物學(xué)(包括重組技術(shù))、生物信息學(xué)、 細胞生物學(xué)和生物化學(xué)的常規(guī)技術(shù)和說明,它們在本領(lǐng)域的技術(shù)范圍內(nèi)。這樣的常規(guī)技術(shù) 包括但不限于血細胞的取樣和分析、核酸測序和分析等。合適的技術(shù)的具體說明還可參 考本文以下實例。然而,當(dāng)然可使用其它等同的常規(guī)方法??稍跇藴实膶嶒炇沂謨岳?Genome Analysis:A Laboratory Manual Series(Vols. I-IV)、PCR primier:A Laboratory Manual、和Molecular Cloning:A Laboratory Manual (全部來自冷泉港實驗室出版社)等 中找到這樣的常規(guī)技術(shù)和說明。
[0024] 在一個方面,本發(fā)明涉及從免疫分子的組庫獲得并分析序列數(shù)據(jù)以快速并有效地 確定克隆型譜的方法,所述免疫分子例如T細胞受體(TCR)或B細胞受體(BCR)或其限定的 片段。序列數(shù)據(jù)通常包括來自用于分析免疫分子的DNA測序儀的序列讀段的大的集合,所 述序列讀段即堿基響應(yīng)(base call)的序列和相關(guān)的質(zhì)量分數(shù)(quality score)。構(gòu)建克 隆型譜的一個主要挑戰(zhàn)為快速地和準確地區(qū)分包含真的差異的序列讀段與包含來自非生 物來源例如提取步驟、測序化學(xué)、擴增化學(xué)等的錯誤的那些。本發(fā)明的一個方面包括將獨特 的序列標簽附接到樣品中的每個克隆型,以輔助確定這樣的軛合物的序列讀段是否源自相 同來源的克隆型。根據(jù)本發(fā)明的一個方面,序列標簽被附接到體細胞重組的核酸分子,以形 成標簽_分子軛合物,其中這樣的軛合物的每個重組核酸具有獨特的序列標簽。通常,在從 包含T細胞和/或B細胞的樣品提取核酸分子后進行這樣的附接。優(yōu)選地,如通過用于序 列的常規(guī)距離測量如Hamming距離等確定的,此類獨特的序列標簽彼此的差異盡可能大。 通過使標簽-分子軛合物中序列標簽之間的距離最大化,甚至具有高比率的測序錯誤和擴 增錯誤,相比不同的軛合物的任何其它標簽序列,軛合物的序列標簽保持遠接近于其原始 的(ancestoral)標簽序列。例如,如果使用16-mer的序列標簽,并且克隆型集合上的每個 這樣的標簽與克隆型上每個其他序列標簽具有至少50%或8個核苷酸的Hamming距離,則 必需至少8個測序錯誤或擴增錯誤,以將一個這樣的標簽轉(zhuǎn)變?yōu)榱硪粋€用于序列標簽的錯 誤讀段(以及具有錯的序列標簽的克隆型的序列讀段的不正確的分組)。在一個實施方案 中,選擇序列標簽使得在附接至重組核酸分子以形成標簽-分子軛合物之后,標簽-分子軛 合物的標簽之間的Hamming距離為這樣的序列標簽的總長度的至少25%的數(shù)目(即,每個 序列標簽與每個其他的這樣的標簽在序列上至少具有其核苷酸的至少25%的差異);在另 一個實施方案中,這樣的序列標簽之間的Hamming距離為這樣的序列標簽的總長度的至少 50%的數(shù)目。
[0025] 在一個方面,通過以下步驟實施本發(fā)明:(a)從個體獲得包括T細胞和/或B細 胞的樣品;(b)將序列標簽附接到T細胞受體基因或T細胞和/或B細胞的免疫球蛋白基 因的重組核酸分子,以形成標簽-分子軛合物,其中所述標簽-分子軛合物的基本上每個 分子具有獨特的序列標簽;(c)擴增所述標簽-分子軛合物;(d)測序所述標簽-分子軛 合物;以及(e)比對相似序列標簽的序列讀段,以確定相應(yīng)于組庫的相同克隆型的序列讀 段。如以下更全面地描述的,使用常規(guī)技術(shù)獲得包含B細胞或T細胞的樣品。在附接序列 標簽的步驟中,優(yōu)選地,序列標簽不僅獨特,而且彼此的差別足夠大,使得甚至大量測序錯 誤或擴增錯誤轉(zhuǎn)變一個序列標簽成另一個序列標簽的可能性接近零。在附接序列標簽后, 大多數(shù)測序技術(shù)必需擴增標簽-分子軛合物;然而,在使用單分子測序技術(shù)時,擴增步驟是 任選的。單分子測序包括但不限于單分子實時(SMRT)測序、納米孔測序等,例如美國專利 7, 313, 308、8, 153, 375、7, 907, 800、7, 960, 116、8, 137, 569 ;Manrao 等,Nature Biotechnolo gy, 4 (8): 2685-2693 (2012)等。
[0026]在另一方面,本發(fā)明包括通過計數(shù)獨特的序列標簽而確定樣品中淋巴細胞的數(shù)目 的方法。甚至沒有序列標簽的情況下,TCR0或IgH基因的克隆型,特別是包括V(D)J區(qū)的 那些,給淋巴細胞及其克隆提供獨特的標記。在重組核酸是從基因組DNA獲得時,可通過測 序后計數(shù)的獨特的克隆型的數(shù)目而估計樣品中淋巴細胞的計數(shù)。當(dāng)存在與相同克隆型相關(guān) 的相同的淋巴細胞的顯著的克隆群體時(或者當(dāng)重組的核酸是從其個體序列的量可反映、 或依賴于表達率及細胞數(shù)目的樣品mRNA獲得時),該方法失效。序列標簽的使用克服了該 缺點,并且特別地可用于在患許多淋巴紊亂(例如淋巴瘤或白血?。┑幕颊咧刑峁┝馨图?胞計數(shù)。根據(jù)本發(fā)明的一個方面,序列標簽可用于獲得樣品中淋巴細胞的絕對計數(shù),無論是 否存在大的顯性克隆,例如白血病??捎孟率霾襟E實施這樣的方法:(a)從個體獲得包含淋 巴細胞的樣品;(b)將序列標簽附接到所述淋巴細胞的T細胞受體基因或免疫球蛋白基因 的重組核酸的分子,以形成標簽-分子軛合物,其中所述標簽-分子軛合物的基本上每個分 子具有獨特的序列標簽;(c)擴增所述標簽-分子軛合物;(d)測序所述標簽-分子軛合物; 以及(e)計數(shù)不同的序列標簽的數(shù)目,以確定所述樣品中淋巴細胞的數(shù)目。在一些實施方 案中,重組核酸分子來自基因組DNA。
[0027]在本發(fā)明的一個實施方案中,序列標簽通過取樣標記而附接到樣品的重組核酸分 子上,例如 Brenner 等,美國專利 5, 846, 719 ;Brenner 等,美國專利 7, 537, 897 ;Macevicz, 國際專利公開W0 2005/111242等中公開的,它們通過引用并入本文。在通過取樣標記中, 將被標記(或獨特地標記)的群體的多核苷酸用于(通過附接、連接等)取樣大得多的群 體的序列標簽。即,如果多核苷酸群體具有K個成員(包括相同多核苷酸的重復(fù)),并且序 列標簽的群體具有N個成員,則N?K。在一個實施方案中,本發(fā)明使用的序列標簽群體的大 小為樣品中克隆型群體大小的至少10倍;在另一個實施方案中,本發(fā)明使用的序列標簽群 體的大小為樣品中克隆型群體大小的至少100倍;并且在另一個實施方案中,本發(fā)明使用 的序列標簽群體的大小為樣品中克隆型群體大小的至少1000倍。在其它實施方案中,選擇 序列標簽群體的大小,使得當(dāng)這樣的克隆型與這樣的序列標簽群體在例如附接反應(yīng)(諸如 連接反應(yīng)、擴增反應(yīng)等)中組合時,樣品中基本上每個克隆型將具有獨特的序列標簽。在一 些實施方案中,基本上每個克隆型意指至少90%的這樣的克隆型將具有獨特的序列標簽; 在其它實施方案中,基本上每個克隆型意指至少99%的這樣的克隆型將具有獨特的序列標 簽;在其它實施方案中,基本上每個克隆型意指至少99. 9%的這樣的克隆型將具有獨特的 序列標簽。在許多組織樣品或活體組織切片中,T細胞或B細胞的數(shù)目可達到或為約1百萬 細胞;因此,在本發(fā)明的一些實施方案中使用這樣的樣品,在通過取樣標記中使用的獨特序 列標簽的數(shù)目為至少1〇 8,或者在其它實施方案中為至少1〇9。
[0028]在其中達1百萬的克隆型被通過取樣標記的實施方案中,可通過在合成反應(yīng)的每 個添加步驟使全部四種核苷酸前體的混合物反應(yīng)的組合合成有效地生產(chǎn)序列標簽的大的 集合,例如,如在通過引用并入本文的Church的美國專利5, 149, 625中公開的。結(jié)果為具 有"NA. . . Nk"結(jié)構(gòu)的序列標簽的大的集合,其中,每種隊=A、C、G或T,并且k為標簽中核 苷酸的數(shù)目。這樣的組合合成產(chǎn)生的序列標簽的集合中序列標簽的數(shù)目為4 k。因此,具有 至少14的k或約14至18的范圍內(nèi)的k的這樣的序列標簽的集合適于通過取樣標記而將 序列標簽附接到1〇 6個成員的分子群體。具有上述結(jié)構(gòu)的序列標簽的集合包括許多在實施 本發(fā)明的方法時可引入差異或錯誤的序列。例如,上述組合合成的序列標簽的集合包括許 多具有均聚物片段的成員標簽,一些測序方法例如合成測序方法難于準確地確定上述均聚 物片段的確定長度。因此,本發(fā)明包括具有對于特定的方法步驟例如測序有效的結(jié)構(gòu)的組 合合成的序列標簽。例如,可通過將四種天然的核苷酸分成在組合合成中交錯地使用的不 相交的子集而產(chǎn)生對于合成測序有效的數(shù)個序列標簽結(jié)構(gòu),從而防止均聚物分割成上述指 定的長度。例如,使z為A或C,并且x為G或T,以產(chǎn)生如下結(jié)構(gòu)的序列標簽:
[0029] [ (z)! (z) 2. ? ? (z) J [ (x)! (y) 2... (x)』]…
[0030] 其中,i和j相同或不同,選擇i和j以限制任何均聚物片段的大小。在一個實施 方案中,i和j在1至6的范圍內(nèi)。在這樣的實施方案中,序列標簽可具有12至36個核苷 酸范圍內(nèi)的長度;并且在其它實施方案中,這樣的序列標簽可具有12至24個核苷酸范圍內(nèi) 的長度。在其它實施方案中,可使用其它核苷酸配對,例如,z為A或T,并且x為G或C;或 者,z為A或G,并且x為T或C??蛇x地,使z'為四種天然核苷酸的三種的任意組合,并且 使x'為不是z'的任何核苷酸(例如,z'為A、C或G,并且X'為T)。這產(chǎn)生了如下的序列 標簽:
[0031] [(z'Mz'h... (2,)上,[(z'Mz'h... (z'^x,…
[0032] 其中如上選擇i,并且x'的出現(xiàn)作為插入以終止任何非期望的均聚物。
[0033] 其災(zāi)的序列標答
[0034] 本發(fā)明使用了在擴增和測序前用獨特的序列標簽標記核酸例如基因組DNA片段 的方法,所述獨特的序列標簽可包括"嵌合標簽(mosaic tag)"。這樣的序列標簽可用于識 別擴增和測序錯誤。嵌合標簽使現(xiàn)有技術(shù)的完全隨機的序列標簽可能出現(xiàn)的由于不適當(dāng)?shù)?退火、引發(fā)(priming)、發(fā)卡形成等所致的測序和擴增人工產(chǎn)物最小化。在一個方面,嵌合標 簽為包括交錯的恒定區(qū)和可變區(qū)的序列標簽,其中,每個恒定區(qū)在嵌合標簽中具有位置,并 包括預(yù)定序列的核苷酸,并且每個可變區(qū)在嵌合標簽中具有位置,并包括預(yù)定數(shù)目的隨機 選擇的核苷酸。通過圖示的方式,22-mer的嵌合標簽(SEQ ID N0:4)可具有下述形式:
[0035] 核苷酸位置:
[0036]
【權(quán)利要求】
1. 一種確定免疫組庫的克隆型的方法,所述方法包括步驟: (a) 從個體獲得包含T細胞和/或B細胞的樣品; (b) 將序列標簽附接到T細胞受體基因或者T細胞和/或B細胞的免疫球蛋白基因的 重組核酸的分子,以形成標簽-分子軛合物,其中所述標簽-分子軛合物的基本上每個分子 具有獨特的序列標簽; (c) 擴增所述標簽-分子軛合物; (d) 測序所述標簽-分子軛合物;以及 (e) 比對相似序列標簽的序列讀段以確定相應(yīng)于所述組庫的相同克隆型的序列讀段。
2. 根據(jù)權(quán)利要求1所述的方法,其中所述比對的步驟還包括通過在所述相似序列標簽 的所述克隆型的每個核苷酸位置確定大多數(shù)核苷酸而確定每個所述標簽-分子軛合物的 每個所述克隆型的核苷酸序列。
3. 根據(jù)權(quán)利要求1所述的方法,其中所述附接的步驟包括通過取樣標記所述重組核酸 的分子。
4. 根據(jù)權(quán)利要求3所述的方法,其中所述附接的步驟在反應(yīng)混合物中實施,使得所述 序列標簽以所述重組核酸的分子的濃度的至少100倍的濃度存在于所述反應(yīng)混合物中。
5. 根據(jù)權(quán)利要求4所述的方法,其中所述序列標簽被摻入對于所述重組核酸的分子特 異的引物中。
6. 根據(jù)權(quán)利要求5所述的方法,其中所述序列標簽為嵌合標簽。
7. -種確定樣品中淋巴細胞的數(shù)目的方法,所述方法包括步驟: (a) 從個體獲得包含淋巴細胞的樣品; (b) 將序列標簽附接到所述淋巴細胞的T細胞受體基因或免疫球蛋白基因的重組核酸 的分子,以形成標簽-分子軛合物,其中所述標簽-分子軛合物的基本上每個分子具有獨特 的序列標簽; (c) 擴增所述標簽-分子軛合物; (d) 測序所述標簽-分子軛合物; (e) 計數(shù)不同的序列標簽的數(shù)目,以確定所述樣品中淋巴細胞的數(shù)目。
8. 根據(jù)權(quán)利要求7所述的方法,其中所述重組核酸為DNA。
9. 根據(jù)權(quán)利要求7所述的方法,其中所述淋巴細胞為T細胞,并且所述重組核酸為T細 胞受體基因或其片段。
10. 根據(jù)權(quán)利要求7所述的方法,其中所述淋巴細胞為B細胞,并且所述重組核酸為免 疫球蛋白基因或其片段。
11. 一種確定免疫組庫的克隆型的方法,所述方法包括步驟: (a) 從個體獲得包含T細胞和/或B細胞的樣品; (b) 通過取樣標記來自所述T細胞和/或B細胞的分子以形成標簽-分子軛合物,其中 每個標簽具有序列并且每個分子包含來自T細胞受體基因或免疫球蛋白基因的重組核酸; (c) 測序所述標簽-分子軛合物;并且 (d) 比對相似標簽的序列讀段以確定相似的克隆型。
12. 根據(jù)權(quán)利要求11所述的方法,其中所述比對的步驟還包括通過在所述相似序列標 簽的所述克隆型的每個核苷酸位置確定大多數(shù)核苷酸而確定每個所述標簽-分子軛合物 的每個所述克隆型的核苷酸序列。
13. 根據(jù)權(quán)利要求11所述的方法,其中所述附接的步驟在反應(yīng)混合物中實施,使得所 述序列標簽以所述重組核酸的分子的濃度的至少100倍的濃度存在于所述反應(yīng)混合物中。
14. 一種在正被監(jiān)測微小殘留病的患者中檢測克隆型殘留污染的方法,所述方法包括 步驟: (a) 通過根據(jù)權(quán)利要求1所述的方法定期地測量所述患者的克隆型譜而監(jiān)測患者的微 小殘留病;和 (b) 記錄克隆型譜的每個測量的每個所述序列標簽的所述序列;以及 (c) 如果在后面的克隆型譜中檢測到任何先前的克隆型譜的序列標簽,則檢測到克隆 型殘留污染。
15. -種在一個或更多個合成測序反應(yīng)中確定一個或更多個多核苷酸的核苷酸序列的 方法,所述方法包括步驟: (a) 將序列標簽附接到所述一個或更多個多核苷酸的每個,以形成標簽-多核苷酸軛 合物,其中所述標簽-多核苷酸軛合物的基本上每個多核苷酸具有獨特的序列標簽; (b) 擴增所述標簽-多核苷酸軛合物; (c) 合成測序擴增的標簽-多核苷酸軛合物,其中合成測序包括至少一個dNTP流;以 及 (d) 對于具有相同序列標簽的每個標簽-多核苷酸,確定每個dNTP流的核苷酸摻入的 數(shù)目,該數(shù)目作為每個這樣的dNTP流的測量的摻入信號的函數(shù)。
16. 根據(jù)權(quán)利要求15所述的方法,其中所述一個或更多個多核苷酸為多個多核苷酸。
17. 根據(jù)權(quán)利要求15所述的方法,其中所述多個為至少104。
18. 根據(jù)權(quán)利要求15所述的方法,其中每個所述dNTP流的核苷酸摻入的所述數(shù)目為最 接近于所述測量的摻入信號的平均數(shù)的整數(shù)。
19. 根據(jù)權(quán)利要求15所述的方法,其中所述合成測序的步驟包括步驟: (a) 對于每個所述標簽-多核苷酸軛合物,在允許測序引物退火到這樣的標簽-多核苷 酸軛合物以及在核苷三磷酸的存在下通過核酸聚合酶沿所述標簽-多核苷酸軛合物延伸 這樣的測序引物的條件下形成復(fù)合體,所述復(fù)合體包括所述測序引物、所述核酸聚合酶,以 及所述標簽-多核苷酸軛合物; (b) 通過dNTP流將dNTP引入所述復(fù)合體; (c) 測量摻入信號; (d) 洗滌所述復(fù)合體;和 (e) 重復(fù)步驟(b)至(d)。
20. 根據(jù)權(quán)利要求19所述的方法,其中所述dNTP為延伸阻斷的dNTP,并且其中所述洗 滌的步驟還包括去阻斷摻入的延伸阻斷的dNTP的步驟,使得在后面的引入步驟中可摻入 其它延伸阻斷的dNTP。
21. 根據(jù)權(quán)利要求15所述的方法,其中每個不同的標簽-多核苷酸軛合物在不同的反 應(yīng)限制區(qū)中。
22. 根據(jù)權(quán)利要求15所述的方法,其中所述附接的步驟包括通過取樣標記所述一個或 更多個多核苷酸以形成所述標簽-多核苷酸軛合物。
23. 根據(jù)權(quán)利要求15所述的方法,其中所述序列標簽為具有在1至5個核苷酸范圍內(nèi) 的長度的可變區(qū)的嵌合標簽。
24. 根據(jù)權(quán)利要求15所述的方法,其中所述序列標簽包括交錯區(qū)域,所述交錯區(qū)域包 括選自A、C、G和T的不相交子集的核苷酸,使所述每個交錯區(qū)域具有1至5個核苷酸范圍 內(nèi)的長度。
25. 根據(jù)權(quán)利要求15所述的方法,其中所述測序的步驟包括測序所述擴增的標簽-多 核苷酸軛合物的樣品。
26. 根據(jù)權(quán)利要求15所述的方法,其中所述一個或更多個多核苷酸為T細胞受體基因 或免疫球蛋白基因的重組核酸的分子。
【文檔編號】C12Q1/68GK104520443SQ201380042163
【公開日】2015年4月15日 申請日期:2013年6月11日 優(yōu)先權(quán)日:2012年6月11日
【發(fā)明者】馬利克·法哈姆, 馬丁·穆爾黑德, 托馬斯·威利斯, 建標·鄭 申請人:賽昆塔公司