用于鑒定基因的等位基因的方法和探針的制作方法
【專利摘要】本發(fā)明涉及一種高多態(tài)性核酸的基因分型方法。特別是,本公開涉及使用高通量測序技術對高多態(tài)性等位基因(如HLA等位基因)進行基因分型的方法。更特別的是,本發(fā)明涉及一種捕獲探針方法,其適合于通過將捕獲探針靶向到到非編碼序列來鑒定高多態(tài)性基因中的等位基因。
【專利說明】
用于鑒定基因的等位基因的方法和探針
技術領域
[0001] 本發(fā)明涉及一種高多態(tài)性核酸的基因分型方法。特別是,本公開涉及使用高通量 測序技術對高多態(tài)性等位基因(例如HLA等位基因)進行基因分型的方法。
[0002] 發(fā)明背景
[0003] 所謂的下一代測序(NGS)技術加速了遺傳研究并使得先前未確診的遺傳缺陷能夠 得到快速表征,從而產生早期疾病診斷和改善的健康結果。下一代測序技術的關鍵特征是 能夠同時對數百萬個單個DNA分子序列進行測序。該測序的并行性和速度使得現在可以在 短短幾天內對完整的人類基因組進行測序。除了通過NGS能夠對整個復雜的基因組進行測 序外,許多應用還關注NGS的臨床潛力及對特定靶區(qū)域中的遺傳變異的檢測。
[0004] -種靶向型基因測序方法涉及使用結合靶區(qū)域的帶標記的探針,然后其可以從基 因組DNA中提取出。
[0005] 使用的探針可以是天然的RNA或DNA,且通常長度為大約100個核苷酸。
[0006] 捕獲探針的使用對于在健康個體中多態(tài)性不會很高的遺傳區(qū)域是有用的。即,健 康個體間遺傳序列的差異大約〈1 %。使用高冗余度的重疊探針以確保當探針和靶標DNA之 間的序列差異阻止探針與靶標序列復性結合時,在與該基因差異相鄰之處會有其它探針使 得能夠對變異的DNA片段進行提取和測序。
[0007] 雖然捕獲探針的使用已經具有廣泛的應用,但其使用并不是通用的,且認為其不 適合于高度多態(tài)性基因(例如HLA系統的基因)的基因分型。HLA對我們對病原體的免疫應答 非常重要。HLA分子位于細胞的表面且向免疫系統提呈片段化的病原體肽。大多數個體具有 使物種能夠抵御幾乎任何病原攻擊的獨特HLA型。
[0008] 雖然HLA多態(tài)性對我們物種的優(yōu)勢明顯,但另一方面移植器官(包括造血干細胞 (HSC))上的HLA抗原被受體的免疫系統視為"外來的",從而導致器官排斥。在HSC移植的情 況下,移植的干細胞靶向新的宿主,從而導致移植物抗宿主病(GvHD),其為HSC移植的潛在 致命的后果。
[0009] 因此,要求進行HLA的基因分型以確保HSC供體與患者之間的相容性。有數個HLA基 因,其全部位于人類6號染色體的短臂上的被稱為主要組織相容性復合體(MHC)的大約4Mb 的區(qū)域內。這些基因可被分為2組。I類基因包括HLA-A、HLA-B和HLA-C,2類基因包括HLA-DRBUHLA-DQB1和HLA-DTO1。這些基因正是通常用于移植目的而被分型的基因,但MHC還包 含額外的I類HLA基因,其多態(tài)性不是很高,并且其功能并非是提呈病原體衍生肽。這種基因 包括HLA-E、HLA-F和HLA-G。此外,有很多類似I類和2類的假基因和基因片段。
[0010]經典的I類基因在序列上類似。它們全部為大約3,200個堿基對的相對小的基因, 以7-8個外顯子和小內含子為特征。2類基因具有更大的內含子,且某些為大約20,000個堿 基對。
[0011] 高水平的HLA多態(tài)性是通過來自相同和不同基因座的等位基因的序列基序的"共 享"產生。獨特的多態(tài)性和SNP是相對較少的。換句話說,新鑒定的等位基因會包含基序的獨 特組合,這些基序見于相同基因座的其它等位基因中或來自其他相關基因座的等位基因。 基序共享是多態(tài)性快速進化的有效機制并且當遭遇病原體時良好地服務物種。等位基因和 基因座之間共享的基序的大小是變化的。在一些情況下,所述基序可能小于20bp,但另一些 等位基因可包含整個基因的一半。高水平多態(tài)性的結果是在一些情況下不可能鑒別HLA匹 配的HSC供體。
[0012]用于HLA的NGS與基于傳統Sanger的測序技術相比提供了顯著益處。傳統HLA測序 技術要求對通過聚合酶鏈式反應擴增的DNA進行測序。擴增的DNA作為多個序列分子被測 序,其中不能確定相鄰核苷酸是來自相同還是不同(母本或父本)的染色體。這種無法進行 相位定序的能力缺乏常常導致不準確的分型,且要求隨后的實驗來解析不明確的類型。 [0013] NGS產生單分子序列數據,使用可用序列分析軟件(例如Assign MPS)編譯的相位 信息來完成,以潛在地產生明確的HLA類型。然而,當對PCR產物進行測序時,PCR所包含的錯 誤和嵌合分子也被測序,造成序列分析困難。
[0014]然而,傳統的基于外顯子的探針捕獲技術可能是不可靠的,因為HLA類型主要是通 過基序重排產生,且一個等位基因與下一個的序列差異程度可以是巨大的。
[0015] 因此,仍需要能夠對高多態(tài)性基因(例如HLA基因)進行高通量測序的方法。
【發(fā)明內容】
[0016] 本發(fā)明的發(fā)明人描述了一種捕獲探針方法,其適合于通過使捕獲探針靶向到非編 碼序列上來鑒定高多態(tài)性基因中的等位基因。通常分型的HLA I類和II類分子的非編碼區(qū) 與多態(tài)性外顯子相比多態(tài)性較低,而且除了因正常變異產生過程而出現的隨機SNP之外,在 不同HLA類型中的可能的替代序列的數量似乎是相對有限的。因此,可以在單區(qū)域設計出能 夠捕獲全部等位基因(包括可能在未來描述的那些)的少量探針。所述捕獲探針將會捕獲包 括多態(tài)性外顯子的DNA片段,且對捕獲的DNA片段的測序將會產生多態(tài)性片段的序列,這使 得能夠推導出HLA類型。
[0017]因此,一方面,本發(fā)明提供一種鑒定受試對象中的基因的等位基因的方法,所述方 法包括:
[0018] a)使來自受試對象的核酸樣品接觸寡核苷酸探針,其中,所述寡核苷酸探針與所 述核酸樣品中的基因靶序列雜交;
[0019] b)通過將雜交到寡核苷酸探針的核酸與未結合寡核苷酸探針的核酸分離,富集雜 交到寡核苷酸探針的核酸;及
[0020] c)對核酸進行測序以鑒定基因的一種或多種等位基因;
[0021 ]其中,所述基因靶序列在所述基因的非編碼區(qū)域內。
[0022] 本發(fā)明的方法對于鑒定高多態(tài)性基因中的等位基因是特別有用的。因此,在一個 實施方式中,所述基因是高多態(tài)性基因。在一個特定實施方式中,所述基因是HLA基因。
[0023] 技術人員將會理解在制備用于測序的被捕獲的核酸時,擴增被捕獲的核酸可能是 期望的。因此,在一個實施方式中,所述方法包括:擴增結合到寡核苷酸探針的核酸。
[0024]在一個實施方式中,所述方法包括對HLA基因外顯子進行測序。
[0025] 在另一個實施方式中,所述方法包括對整個HLA基因進行測序。
[0026] 為了促進所感興趣的核酸的富集,在一個實施方式中,寡核苷酸探針包含捕獲標 簽。
[0027] 在一個實施方式中,捕獲標簽為雜交標簽。
[0028] 在另一個實施方式中,捕獲標簽為生物素或抗生蛋白鏈菌素。
[0029] 在另一個實施方式中,所述方法包括用結合試劑接觸所述捕獲標簽。
[0030] 在一個實施方式中,所述結合試劑為生物素或抗生蛋白鏈菌素。
[0031]在另一個實施方式中,所述結合試劑與基體偶聯。在一個特殊的實施方式中,所述 結合試劑與諸如磁珠等磁性基體偶聯。
[0032] 在一個實施方式中,與寡核苷酸探針接觸的核酸樣品包含單鏈核酸。
[0033] 在另一個實施方式中,所述核酸樣品在與寡核苷酸探針接觸之前被片段化。
[0034] 在一個實施方式中,所述方法包括使寡核苷酸探針接觸平均長度大于約100bp的 核酸片段。
[0035] 在另一個實施方式中,所述方法包括使寡核苷酸探針接觸平均長度大于約2kb的 核酸片段。
[0036] 作為另一選擇,所述核酸樣品在與寡核苷酸探針接觸之后被片段化。
[0037] 所述寡核苷酸探針靶向基因的非編碼區(qū),例如內含子和基因間隔區(qū)。在一個實施 方式中,諸如HLA基因等基因的非編碼區(qū)為內含子。
[0038] 在另一個實施方式中,所述方法進一步包括檢測非HLA基因的一種或多種等位基 因。
[0039] 在另一個實施方式中,所述測序為高通量測序。
[0040] 在一個實施方式中,所述高通量測序為下一代測序技術。
[0041] 第二方面,本發(fā)明提供一種鑒定受試對象中的基因的等位基因的方法,所述方法 包括:
[0042] a)從受試對象中獲得核酸樣品;
[0043] b)片段化所述核酸樣品以獲得長度為至少約2kb的核酸片段;
[0044] c)使單鏈核酸與包含捕獲標簽的寡核苷酸探針接觸,其中,所述寡核苷酸探針與 所述核酸樣品中的HLA靶序列雜交;
[0045] d)通過使結合試劑接觸捕獲標簽,富集雜交到寡核苷酸探針的核酸;及
[0046] e)對核酸進行測序以鑒定一種或多種等位基因;
[0047] 其中,所述HLA靶序列在所述基因的非編碼區(qū)內。
[0048] 雖然本發(fā)明方法中使用的核酸可來自預先獲得的樣品,但在一個實施方式中,所 述方法包括從獲自受試對象的生物樣品中分離出核酸。
[0049] 在一個實施方式中,所述核酸樣品在與寡核苷酸探針接觸之前被片段化。
[0050] 在另一個實施方式中,所述核酸樣品在與寡核苷酸探針接觸之后被片段化。
[0051] 在另一個實施方式中,所述基因的等位基因是HLA基因的等位基因。
[0052]在第一或第二方面的一個實施方式中,一種或多種寡核苷酸探針包含與SEQ ID No: 1至8或10至71中的任意一個具有至少95%同一性的核酸序列。
[0053] 在另一個實施方式中,一種或多種寡核苷酸探針包含與SEQ ID No: 1至8或10至71 中的任意一個具有至少98 %同一性的核酸序列。
[0054]在一個特殊的實施方式中,一種或多種寡核苷酸探針包含與SEQ ID No: 1至8或10 至71中的任意一個相同的核酸序列。
[0055] 第三方面,本發(fā)明提供一種為需要移植的受體鑒定移植供體的方法,所述方法包 括:
[0056] a)進行本發(fā)明的方法以在需要移植的受體中鑒定一種或多種HLA基因等位基因; 及
[0057] b)基于同時在移植供體和移植受體的HLA基因中一種或多種等位基因的存在,鑒 定移植供體。
[0058] 本發(fā)明進一步提供降低移植受體發(fā)展移植物抗宿主病的可能性的方法,所述方法 包括:
[0059] a)進行本發(fā)明的方法以在需要移植的受體中鑒定一種或多種HLA基因等位基因; 及
[0060] b)基于同時在移植供體和移植受體中一種或多種HLA基因等位基因的存在,鑒定 移植供體;
[0061] 其中,同時在移植供體和移植受體中一種或多種HLA基因等位基因的存在表明所 述移植受體在從所述移植供體移植了移植物后發(fā)展移植物抗宿主病的可能性降低。
[0062]在一個實施方式中,所述方法包括在所述移植供體中鑒定一種或多種HLA基因等 位基因。
[0063]第四方面,本發(fā)明提供一種將同種異基因移植物移植到受體中的方法,所述方法 包括:
[0064] a)進行本發(fā)明的方法;及
[0065] b)從所述移植供體中移出供體移植物;及
[0066] c)將所述移植物移植到受體中。
[0067]第五方面,本發(fā)明提供一種用于鑒定受試對象中的基因的等位基因的試劑盒,所 述試劑盒包含與所述基因的非編碼區(qū)中的基因靶序列雜交的寡核苷酸探針。
[0068] 在一個實施方式中,所述基因是高多態(tài)性基因。
[0069] 在一個特定實施方式中,所述基因是HLA基因。
[0070] 在另一個實施方式中,HLA基因的非編碼區(qū)為內含子。
[0071 ]在一個實施方式中,所述寡核苷酸探針包含捕獲標簽。
[0072] 在一個實施方式中,所述捕獲標簽為生物素或抗生蛋白鏈菌素。
[0073] 在另一個實施方式中,所述試劑盒包含結合試劑。
[0074] 在一個特定實施方式中,所述結合試劑為生物素或抗生蛋白鏈菌素。
[0075] 在另一個實施方式中,所述結合試劑與基體偶聯。在一個特定實施方式中,所述基 體為磁性基體。在一個特定實施方式中,所述基體為磁珠。
[0076] 在另一個實施方式中,一種或多種寡核苷酸探針包含與SEQ ID No: 1至8或10至71 中的任意一個具有至少98 %同一性的核酸序列。
[0077] 在另一個實施方式中,一種或多種寡核苷酸探針包含與SEQ ID No: 1至8或10至71 中的任意一個具有至少98 %同一性的核酸序列。
[0078] 在一個特定實施方式中,一種或多種寡核苷酸探針包含與SEQ ID No: 1至8或10至 71中的任意一個相同的核酸。
[0079]可明顯看出本發(fā)明一個方面的優(yōu)選特征或特點可應用于本發(fā)明的許多其它方面。
[0080] 整個說明書中的詞語"包括"或其變化形式應被理解為意味著包含所描述的要素、 整體或步驟、或要素、整體或步驟的組,但不排除任何其它要素、整體或步驟或要素、整體或 步驟的組。
[0081] 下文通過下面的非限制性實施例并參考附圖對本發(fā)明進行描述。
【附圖說明】
[0082] 圖1.HLA-A內含子1的序列比對,表明了不同的HLA等位基因具有相同的可預測的 HLA序列。HLA等位基因的命名使用了至多4個用冒號分開的字段(例如細01:01 :01:01)。第 一字段表示可通過抗體檢測到的一般氨基酸序列差異。第二字段表示導致氨基酸變化但可 能用抗體無法檢測到的核苷酸差異。第三字段表示同義變化,第四字段表示非編碼區(qū)中的 變化。字母代碼后綴(例如A*01:01:01:02N中的N)的使用表明該等位基因是表達變異基因。 例如,N =零或不表達??梢钥闯觯伺cA*30等位基因共享核苷酸的2個(A*01:02和A*01: 20)外,所有的A*01等位基因具有相同的序列,并且A*03和A*ll等位基因也與大多數A*01等 位基因相同。由于探針會平等地捕獲具有單堿基對錯配的DNA,單探針應該捕獲所有的A* 01、A03、A*11 和A*30等位基因。
[0083] 圖2.對低多態(tài)性非編碼區(qū)使用捕獲探針以對多態(tài)性編碼區(qū)進行捕獲和測序。
[0084]圖3.HLA-A基因結構,顯示了在原理實驗的證據中外顯子和捕獲探針的位置。
[0085]圖4.對使用靶向型捕獲測序方案產生的序列數據的分析(顏色未顯示)。
[0086] 1:顯示了在白色至紅色漸變色調區(qū)之上的HLA基因結構,其總結了跨基因的序列 深度。白色區(qū)域表明序列讀出深度〈50,而且距離紅色色調越近,序列讀出深度越小。黑塊表 明沒有序列文件跨越此區(qū)。
[0087] 2:其顯示了樣品名稱(樣品01)和被分析的基因座(HLA_A = gA)
[0088] 3:該區(qū)總結了數據。每個灰色垂直條表示在此位置處序列的量。此比例尺顯示的 最大覆蓋度為100。彩塊的水平線為共有序列,其中紅色=T,黑色=G,藍色=C且綠色=A。 下方的彩塊表示在此位置處看到的其它序列,并且它們位于垂直灰色條上的地點表明以此 位置上的該堿基讀出的百分比。這些序列通常表示堿基識別(call)錯誤,但能夠表明雜合 序列。黑色水平線表明堿基識別結果的百分比,所以在第一水平線上的藍色塊表明在此位 點上1%的堿基識別結果為C。比例尺是對數的,因此第二水平線表明10%的讀出結果。
[0089] 4:軟件界面內的該區(qū)表明在共有序列和HLA-A文庫之間的最佳匹配的基因型。前2 列表明基因型。第3列表明與HLA-A編碼序列錯配的序列數量。下一列表明與HLA-A非編碼序 列錯配的數量,第5列和第6列表明在序列數據的相位確定時的序列錯配。正確的基因型在 第3至6列會具有0個錯配。在此情況下,最佳匹配的基因型是具有HLA-A*02 :01:01:01+A* 02:01:01:01。
[0090]圖5.在3個樣品的捕獲探針富集后的下一代測序結果,也進行了 Sanger測序。
[0091] 序列表注釋
[0092] SEQ ID NO: 1至8-寡核苷酸捕獲探針
[0093] SEQ ID N0:9-HLA A內含子 1
[0094] SEQ ID從):10至71-見^捕獲探針序列
【具體實施方式】 _5] 一般技術與定義
[0096] 除非另外特別限定,本文使用的所有技術與科學術語應該認為與本領域(例如,在 分子遺傳學、生物化學和免疫學領域)普通技術人員通常理解的具有相同含義。
[0097] 除非另外指出,本發(fā)明使用的分子遺傳學、生物化學和免疫學技術為本領域技術 人員熟知的標準程序。這些技術在以下來源的文獻中有所描述和解釋:例如J,Perbal,A Practical Guide to Molecular Cloning,John Wiley和Sons(1984),J?Sambrook和 Russell. ,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring Harbour Laboratory Press(2001),R.Scopes,Protein Purification-Principals and Practice, 第三版,Springer(1994),T.A.Brown(編),Essential Molecular Biology:A Practical Approach,第1和2卷,IRL Press(1991),D .M.Glover和B ? D ? Hames(編),DNA Cloning: A Practical Approach,第1-4卷,IRL Press(1995和1996),及F.M.Ausubel等(編),Current Protocols in Molecular Biology,Greene Pub.Associates and ffiley-Interscience ( 1988,包括直至目前的所有更新),Ed Harlow和David Lane(編)Antibodies:A Laboratory Manual,Cold Spring Harbour Laboratory,(1988),及J.E.Coligan等(編) Current Protocols in Immunology,John Wiley&Sons(包括直至目前的所有更新)。
[0098] 術語"核酸"或"核酸序列"或"核酸分子"指單鏈或雙鏈形式的脫氧核糖核苷酸或 核糖核苷酸及它們的聚合物。術語核酸與基因、互補DNA(cDNA)、信使RNA(mRNA)、寡核苷酸 及多核苷酸可互換使用。
[0099] "分離的核酸分子"指總體已從其在天然狀態(tài)下(如果其以任何形式存在于自然 中)所結合或連接的核苷酸序列中分離出的核酸分子。優(yōu)選地,所述分離的核酸至少60%脫 離、更優(yōu)選至少75%脫離、更優(yōu)選至少90%脫離其通常所結合的其它組分。核酸可以使用任 何適合的已知技術從生物樣品中分離。例如,總基因組DNA可以使用本領域已知的方法和/ 或商業(yè)可得的試劑盒來從細胞中提取,例如,通過使用QIAGEN提供的QIAamp DNA血液Mini 試劑盒或DNeasy Blood&Tissue試劑盒,或通過使用諸如酸/氯仿提取和乙醇沉淀等方法。
[0100] 除非另有說明,本文使用的術語"約"指指定值的+/-20%,更優(yōu)選+/-10%,或更優(yōu) 選+/_5 % 〇
[0101] 鑒定基因的等位基因的方法
[0102] 本發(fā)明的發(fā)明人目前開發(fā)出了一種鑒定基因的等位基因的方法,其特別適合于靶 向捕獲和高通量測序技術。本發(fā)明的方法包括用寡核苷酸探針接觸來自受試對象的核酸樣 品,以從所述DNA樣品中分離出感興趣的基因組區(qū)域。由于靶向捕獲的現有技術方法依賴于 捕獲感興趣的基因的編碼區(qū)的寡核苷酸,這些方法不適合對高多態(tài)性基因的基因分型,因 為設計出能夠鑒定所有目前描述的等位基因并鑒定新等位基因的基于外顯子的捕獲探針 是困難的。與此相反,本發(fā)明使用與位于非編碼區(qū)的基因靶序列雜交的寡核苷酸捕獲探針, 因此能夠進行高多態(tài)性基因等位基因的高通量測序。
[0103] 圖1顯示了HLA-A內含子1的序列比對,其表明不同的HLA等位基因具有相同的和可 預見的HLA內含子序列。可以看出,除了與A*30等位基因共享核苷酸的2個(A*01:02和A*01: 20)外,所有的A*01等位基因具有相同的序列,并且A*03和A*ll等位基因也與大多數A*01等 位基因相同。由于探針會平等地捕獲具有單堿基對錯配的DNA,單探針應該捕獲所有的A* 01、A03、A*11 和A*30等位基因。
[0104] 圖2提供了顯示與所述捕獲探針互補的序列的捕獲DNA片段的位置及其相對于多 態(tài)性外顯子的相對位置的圖。圖3顯示了如何設計捕獲探針和設定捕獲探針的位置以捕獲 用于測序的多態(tài)性外顯子。
[0105] 此處使用的術語"非編碼序列"或"非編碼區(qū)"指不屬于包含所要鑒定的等位基因 的基因的蛋白編碼序列的核酸序列。因此,此術語包括內含子、和3'非翻譯區(qū)、啟動子、轉 錄調控元件和/或基因間DNA。因此,所述非編碼區(qū)可以在感興趣的基因內部,或在感興趣的 基因外部,例如,在基因間區(qū)域。在一個實施方式中,所述寡核苷酸探針與感興趣的基因的 內含子內的基因靶序列雜交。
[0106] 核酸的制備
[0107]本發(fā)明的方法可以對已使用本領域已知的任何適合的技術從受試對象獲得的核 酸樣品進行。作為另一選擇,在一個實施方式中,所述方法包括從獲自受試對象的生物樣品 中獲得核酸樣品。此處使用的"生物樣品"可以是例如淋巴細胞、全血、頰粘膜拭子、活檢樣 本或冷凍組織或包含基因組DNA的任何其它樣品。盡管對于分子基因分型而言可以使用幾 乎任何組織來源,但最常使用的是例如來自外周血的淋巴細胞。也可以使用通過非侵入性 方法獲得的樣品,例如通過基于臉頰拭子或唾液的DNA收集。從這些來源提取DNA的多種適 合的方法是本領域已知的。這些方法的范圍從有機溶劑提取到二氧化硅包覆的珠及陽離子 交換柱的吸附。DNA自動提取系統也是商業(yè)可得的且可提供高品質、高純度的DNA。
[0108] 本發(fā)明方法中使用的核酸可以是單鏈和/或雙鏈基因組DNA。在某些實施方式中, 核酸可包括長度為至少約lkb、至少約2kb、至少約5kb、至少約10kb或至少約20kb或更長的 長核酸。長核酸可以用本領域眾所周知的多種方法從來源制備。保持核酸分子完整性(即斷 裂和剪切最小化)的獲得生物樣品及隨后從所述樣品中分離核酸的方法是優(yōu)選的。示例性 方法包括但不限于:不進行進一步純化的裂解方法(例如,使用去垢劑、有機溶劑、堿和/或 蛋白酶的化學或酶裂解方法),進行或不進行進一步核酸純化的核酸分離,使用沉淀步驟的 分離方法,使用固體基質的核酸分離方法(例如娃類膜、珠或結合核酸分子的修飾表面),凝 膠狀基質(例如,瓊脂糖)或粘性溶液,及用密度梯度富集核酸分子的方法。
[0109] 在一個實施方式中,為了獲得所需的平均片段大小,將本發(fā)明方法中使用的核酸 片段化。技術人員會理解,核酸片段的所需長度將依賴于所使用的測序技術。例如,離子激 流(Ion Torrent)和MisSeq平臺使用長度大約為100bp_200bp的片段,而Pacific Biosciences NGS平臺可以使用長度至多為20kb的片段。核酸可以通過物理剪切、超聲處 理、限制性酶切或本領域已知的其它適合的技術來片段化??梢赃M行核酸片段化,以產生具 有所需平均長度的核酸片段。核酸片段的長度或平均長度例如可以為至少約l〇〇bp、至少約 200bp、至少約300bp、至少約400&口、至少約500&口、至少約600&口、至少約700&口、至少約 800bp、至少約900bp、至少約lkb、至少約2kb、至少約3kb、至少約4kb、至少約5kb、至少約 61<:13、至少約71<:13、至少約81<:13、至少約91<:13、至少約101<:13、至少約111<:13、至少約121<:13、至少約151^3 或至少約20kb。
[0110] 在一個實施方式中,在用寡核苷酸探針接觸樣品前,為了產生單鏈核酸或產生包 含單鏈區(qū)域的核酸而處理核酸樣品??梢允褂帽绢I域已知的技術產生單鏈核酸,例如,包括 已知的雜交技術和諸如ReadyAmp?基因組DNA純化系統(Promega)的商購可得的試劑盒。作 為另一選擇,可以使用適合的切口酶與核酸外切酶結合將單鏈區(qū)域引入核酸。
[0111] 寡核苷酸探針
[0112] 本發(fā)明的術語"探針"或"寡核苷酸探針"指被設計為與感興趣的核酸特異性地雜 交的寡核苷酸。優(yōu)選地,探針適合用于制備使用靶標捕獲技術的高通量(下一代)測序所用 的核酸。因此,在一個實施方式中,探針可適合于靶標捕獲,并且長度為約60-120個核苷酸。 作為另一選擇,探針可以為約10-25個核苷酸。在某些實施方式中,探針長度為10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24或25個核苷酸。用于本發(fā)明的核苷酸可以是核糖 核苷酸、脫氧核糖核苷酸及修飾的核苷酸(例如肌苷)或包含基本不改變其雜交特性的經修 飾的基團的核苷酸。
[0113] 作為另一選擇,所述寡核苷酸探針可包含核苷酸類似物。術語"核苷酸類似物"指 具有經修飾的核苷酸堿基部分、經修飾的戊糖部分和/或經修飾的磷酸酯部分的合成類似 物,并且在多核苷酸的情況下,還具有經修飾的核苷酸間連接,如在別處概述的(例如, Scheit,Nucleotide Analogs,John Wiley,New York,(1980);Agarwal,Protocols for Polynucleotides and Analogs,Humana Press,(1994))。通常,修飾的磷酸酯部分包括磷 酸酯類似物,其中磷原子在+5氧化態(tài),且一個或多個氧原子被非氧部分替換,例如,硫。示例 性磷酸酯類似物包括但不限于硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯、二硒代磷酸酯、苯 胺硫代磷酸酯(phosphoroani lothioate)、苯胺磷酸酯(phosphorani 1 idate)、氨基磷酸酯、 硼磷酸酯(1301'011(^1108口1^丨6),包括相關的平衡離子,如11+、順4 +、似+(如果所述平衡離子存 在)。示例性的修飾的核苷酸堿基部分包括但不限于:5-甲基胞嘧啶(5mC); C-5-丙炔類似物 (包括但不限于C-5丙炔基-C和C-5丙炔基-U);2,6-二氨基嘌呤(也被稱為2-氨基腺嘌呤或 2_氨基-dA);次黃嘌呤、假尿苷、2-巰基嘧啶、異胞嘧啶(is 〇C)、5-甲基異胞嘧啶及異鳥嘌呤 (i s〇G;例如參見美國專利5,432,272)。示例性修飾的戊糖部分包括但不限于,鎖核酸 (1 ocked nuc 1 eic acid,LNA)類似物(其包括但不限于Bz-A-LNA、5-Me-Bz-C-LNA、dmf-G-LNA及T-LNA),及2'-或3'-修飾,其中2'-或3'-位置為氫、羥基、烷氧基(如甲氧基、乙氧基、 稀丙氧基、異丙氧基、丁氧基、異丁氧基和苯氧基)、置氣基、氣基、烷基氣基、氣、氣或漠。修 飾的核苷酸間連接包括磷酸酯類似物,具有手性的和不帶電的亞基間連接的類似物,及具 有手性亞基間連接的不帶電的嗎啉類聚合物(例如參見美國專利5,034,506)。一些核苷酸 間連接的類似物包括嗎啉基、縮醛及聚酰胺連接的雜環(huán)。在被稱為肽核酸的一類核苷酸類 似物中(其中包括偽互補肽核酸("PNA")),其用2-氨基乙基甘氨酸酰胺骨架聚合物替換了 常規(guī)的糖和核苷酸間連接。
[0114] 雜交
[0115] 本文使用的術語"雜交"指寡核苷酸探針與靶核酸非共價結合以形成穩(wěn)定的雙鏈 多核苷酸的過程。雜交條件通常包括低于約1M的鹽濃度,更通常的為低于約500mM且可能為 低于約200mM的鹽濃度。雜交緩沖液包括諸如5 % SSPE等緩沖鹽溶液,或本領域已知的其它 這種緩沖液。雜交溫度可以是低至5°C,但其通常高于22°C,更通常的為高于約30°C,且通常 超過37°C。通常在嚴格的條件下進行雜交,即在探針會雜交到與其互補的靶序列但不會雜 交到其它非互補序列的條件下。
[0116] 本文使用的術語"互補"及其語法等價形式指一條核酸與另一條核酸(包括修飾的 核酸和核酸類似物)的核苷酸堿基配對相互作用,其導致雙螺旋、三螺旋或其它更高級的有 序結構的形成。主要的相互作用通常因胃3丨8011-〇;[01^和110088丨6611型氫鍵結合而是核苷酸 堿基特異性的,例如A:T、A:U和G:C。使寡核苷酸探針與靶核酸的互補或基本互補區(qū)復性結 合的條件是本領域眾所周知的。
[0117]如本領域中所理解的,嚴格雜交條件是序列依賴性的,且在不同的場合下是有區(qū) 別的。例如,對于特異性雜交,更長的片段可能比短片段要求更高的雜交溫度。因為其他因 素可能影響雜交的嚴格性(其包括堿基組成和互補鏈的長度,有機溶劑的存在,及堿基錯配 的程度),參數的組合比單獨任意一個參數的絕對測量值更重要。一般來說,對于在限定的 離子強度和pH下的特定序列,將嚴格條件選擇為低于1?約5°(:。嚴格條件的實例包括:在pH 為約7.0至約8.3及約至少25°C的溫度下鹽濃度為至少0.01M至不超過1M的鈉離子濃度(或 其它鹽)。例如,條件為5XSSPE(750mM NaCl,50mM磷酸鈉,5mM EDTA,pH 7.4)和30°C的溫度 適合于等位基因特異性探針雜交。
[0118] 捕獲標簽和結合試劑
[0119] 在一個實施方式中,本發(fā)明方法中使用的寡核苷酸探針包含捕獲標簽,從而便于 從樣品中的其他核酸序列中富集出結合到寡核苷酸探針上的所感興趣的核酸。為了從其它 核酸序列中富集出感興趣的核酸,將捕獲標簽結合到適合的結合試劑上。如本領域所理解 的,短語"核酸的富集"指相對于未結合到寡核苷酸探針的核酸在樣品中增加靶核酸序列的 量。因此,增加了樣品中靶序列相對于相應的非靶核酸的比率。
[0120] 在一個實施方式中,捕獲標簽為"雜交標簽"。本文使用的術語"雜交標簽"及其語 法等價形式可以指包含與作為結合試劑(即,"結合標簽")的另一核酸序列的至少一部分互 補的序列的核酸。雜交標簽和相應的結合標簽序列之間的互補程度可根據應用而變化。在 某些實施方式中,雜交標簽可以與結合標簽或其部分互補或基本互補。例如,雜交標簽可包 含具有與相應的結合標簽至少約50%、至少約60%、至少約70%、至少約80%、至少約90 % 及至少約99%互補的序列。在某些實施方式中,雜交標簽可包含與相應的結合標簽100%互 補的序列。
[0121] 在某些實施方式中,捕獲探針可包括多個雜交標簽,其相應的結合標簽位于相同 的核酸或不同的核酸中。在某些實施方式中,包含RNA的雜交標簽可能對有效移除過量水平 的該標簽是有利的。
[0122] 在某些實施方式中,雜交標簽可包含至少約5個核苷酸、至少約10個核苷酸、至少 約15個核苷酸、至少約20個核苷酸、至少約25個核苷酸、至少約30個核苷酸、至少約35個核 苷酸、至少約40個核苷酸、至少約45個核苷酸、至少約50個核苷酸、至少約55個核苷酸、至少 約60個核苷酸、至少約65個核苷酸、至少約70個核苷酸、至少約75個核苷酸、至少約80個核 苷酸、至少約85個核苷酸、至少約90個核苷酸、至少約95個核苷酸和至少約100個核苷酸。
[0123] 在另一個實施方式中,所述捕獲標簽可包含"親和標簽"。本文使用的術語"親和標 簽"及其語法等價形式可指多組分復合體的組分,其中所述多組分復合體的各組分彼此特 異性相互作用或相互結合。例如,親和標簽可包括可結合抗生蛋白鏈菌素的生物素。多組分 親和標簽復合物的其他實例包括:配體及其受體,例如抗生物素蛋白_生物素,抗生蛋白鏈 菌素-生物素,生物素的衍生物,抗生蛋白鏈菌素,或抗生物素蛋白,其包括但不限于2-亞氨 基生物素、脫硫生物素、NeutrAvidin(分子探針,Eugene,0reg.)、0&卩丨4¥丨(1;[11(分子探針) 等;結合蛋白/肽,包括麥芽糖-麥芽糖結合蛋白(MBP)、鈣-鈣結合蛋白/肽(CBP));抗原-抗 體,包括表位標簽(包括c-MYC、HA和FLAG Tag?)及其相應的抗表位抗體;半抗原,例如二硝 基苯基和異羥基洋地黃毒苷,及其相應的抗體;適體及其相應的靶標;熒光基團及抗熒光基 團抗體;等等。在一個實施方式中,親和標簽用于將包含雜交標簽的靶核酸整體分離。
[0124] 因此,本發(fā)明的方法中使用的結合試劑能夠結合本文描述的親和標簽以便于從樣 品中的其它核酸序列中分離出感興趣的核酸。例如,在一個實施方式中,親和標簽包含生物 素且結合試劑包含抗生蛋白鏈菌素。結合試劑通常在基體上?;w的實例包括珠、微球、平 面表面、柱、孔等。術語"微球"或"珠"或"顆粒"或其語法等價形式是本領域所了解的,并指 小的離散顆粒。基體的組成會根據應用而變化。適合的組成包括用于肽、核酸和有機部分合 成的那些,其包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸系聚合物、順磁 材料、氧化釷溶膠、碳石墨、二氧化鈦、乳膠或交聯葡聚糖(如瓊脂糖)、纖維素、尼龍、交聯膠 束和特氟龍,其全部可以使用,來自Fishers Ind.的Bangs實驗室的"微球檢測指南"是有用 的指南。珠不是必須為球形;可以使用不規(guī)則的顆粒。在某些實施方式中,基體可包含金屬 組成,例如含鐵的,也可能包含磁性。使用磁珠的示例性實施方式包括包含抗生蛋白鏈菌素 包覆的磁珠的捕獲探針。此外,珠可以為多孔的,從而增加可用于與捕獲探針相連的珠的表 面積。珠的大小在納米(即l〇〇nm)至毫米(即1mm)范圍內,珠為約0? 2mi至約200M1,或為0 ? 5y m至約5wii,但在某些實施方式中可以使用更小的珠。
[0125] 高通量測序
[0126] 本發(fā)明的方法特別適合于制備使用高通量測序技術(例如下一代測序技術)進行 測序所用的核酸。下一代測序(NGS)技術包括能夠在每次儀器運行中對超過10 14個堿基對 (kbp)的DNA進行測序的儀器。通常,測序產生大量的獨立讀出序列,每個代表核酸的10至 1000個堿基之間的任何位置。通常為了置信度而對核酸進行冗余測序,將每單位區(qū)域的復 制稱為覆蓋度(即,"10 X覆蓋度"或"100 X覆蓋度")。下一代測序方法是本領域已知的,并 且描述于例如Metzker(2010)中。
[0127] 因此,本文使用的術語"下一代測序"或"NGS"或"NG測序"指以高通量模式確定個 體核酸分子(例如,在單個分子測序中)或克隆擴增的個體核酸分子的代替物(例如,同時測 序多于10 3、104、105或更多分子)的核苷酸序列的任何測序方法。
[0128] 用于下一代測序的平臺包括但不限于Roche/454基因組測序儀(GS)FLX系統、 Illumina/Solexa基因組分析儀(GA)、Life/APG的支持寡核苷酸連接檢測(SOLiD)系統、 Polonator的G? 007系統、Helicos BioSciences的He 1 iScope基因測序系統及Pacific Biosciences的PacBio RS系統。
[0129] 高多態(tài)性基因和HLA分型
[0130]本發(fā)明的方法特別適合于鑒定高多態(tài)性基因中的等位基因。本文使用的術語"高 多態(tài)性基因"包括指在基因的編碼區(qū)中具有比非編碼區(qū)中更高水平的多態(tài)性的基因。例如, 與基因的非編碼序列的每kb的多態(tài)性的數量相比,高多態(tài)性基因的編碼序列的每kb可具有 更多數量的多態(tài)性。高多態(tài)性基因的眾所周知的實例為人白細胞抗原(HLA)基因。
[0131]因此,本發(fā)明的方法適合于HLA基因等位基因的鑒定和HLA分型。HLA分子的編碼區(qū) 是高多態(tài)性的,因為認為其處在進化的正向選擇壓力下以響應于病原威脅。HLA的非編碼區(qū) 不在此選擇壓力下,且不共享相同程度的多態(tài)性。雖然I類HLA的非編碼區(qū)是多態(tài)性的,但該 多態(tài)性在這些區(qū)域上不是隨機分布的,而且是緊密相關的,通過編碼序列相似性而具有相 同的非編碼序列。
[0132] I類HLA的非編碼區(qū)的序列比對分析揭示出了有限的一組獨特序列。本發(fā)明的發(fā)明 人確定了可以對該組獨特序列中的每一個都設計出探針以捕獲DNA片段,而后可用于下一 代測序測定。
[0133] 因此,代替使用來自外顯子組的重疊探針(即在外顯子區(qū)設計的探針)的方法,本 發(fā)明的發(fā)明人描述了明確針對HLA的非編碼區(qū)而設計的探針的應用。圖1顯示了 HLA-A內含 子1的序列比對,其示出了具有相同的可預測的HLA序列的不同HLA等位基因。HLA等位基因 的命名使用了至多4個用冒號分開的字段(例如A*01 :01:01:01)。第一字段表示可通過抗體 檢測到的一般氨基酸序列差異。第二字段表示導致氨基酸變化但可能用抗體無法檢測到的 核苷酸差異。第三字段表示同義變化,第四字段表示非編碼區(qū)中的變化。字母代碼后綴(例 如八*01 :01:01:021^中的《的使用表明該等位基因是表達變異基因。例如~=零或不表達。可 以看出,除了與A*30等位基因共享核苷酸的2個(A*01:02和A*01:20)外,所有的A*01等位基 因具有相同的序列,并且A*03和A*ll等位基因也與大多數A*01等位基因相同。由于探針會 平等地捕獲具有單堿基對錯配的DNA,單探針應該捕獲所有的A*01、A03、A*11和A*30等位基 因。
[0134] 在一個實施方式中,本發(fā)明的方法 DPB1、HLA-DQA1、HLA-DQB1、HLA-DRA和/或HLA-DRB1基因中的一個或多個中鑒定等位基因。
[0135] 在某些實施方式中,本發(fā)明的方法可用于通過同時在移植供體和受體中匹配基因 的等位基因(例如HLA基因的等位基因)來確定移植受體的合適供體和/或確定患者發(fā)展移 植物抗宿主病(GVHD)或急性GVHD(aGVHD)的可能性。
[0136] 另外,確定移植候選者發(fā)展aGVHD的可能性可影響確定是否移植確實是治療他們 的病情最適合的形式。在某些情況下,可能有替代形式的治療,其提供給患者更好的預后。 同時,aGVHD可能性的預測將指示治療方案的必要性,或者指示可能比推薦方案更具侵襲性 (aggressive)的治療方案。這種侵襲性療法通常具有不期望的副作用,因此優(yōu)選不使用,除 非預后表明需要。例如,用中和性抗TNF-a單克隆抗體治療患者可導致aGVHD的改善,但是可 增加感染風險。也可使用多種侵襲性抗炎療法。
[0137] 本文使用的術語"移植"指將獲自一個個體(供體)的組織或細胞移植或引入到另 一個個體(受體)的身體中或身體上。從供體移除并移植到受體中的細胞或組織稱為"移植 物(graft)"。通常移植的組織的實例為骨髓、造血干細胞、器官(例如肝臟、心臟、皮膚、膀 胱、肺、腎、角膜、胰腺、胰島、腦組織、骨和腸)。
[0138] 本領域技術人員將會理解,術語"單倍型"指在染色體上位置靠近或位于相鄰基因 座的一起遺傳的等位基因的組合,或是在染色體對的單個染色體上的統計學相關聯的一組 單核苷酸多態(tài)性。
[0139] 試劑盒
[0140] 本發(fā)明進一步提供用于根據本發(fā)明的方法鑒定基因的等位基因的試劑盒。所述試 劑盒包含寡核苷酸探針,其能夠與感興趣的基因的非編碼區(qū)中的基因靶序列雜交。在一個 實施方式中,所述寡核苷酸探針包含捕獲標簽,例如生物素或抗生蛋白鏈菌素。所述試劑盒 可進一步包含能夠結合捕獲標簽的結合試劑。所述結合試劑可以被涂覆在或連接到適合的 基體上,所述基體為例如微球或珠。在某些實施方式中,所述基體可以是磁性的以便于富集 所感興趣的靶核酸。
[0141] 實施例
[0142] 實施例1.DNA文庫的制備
[0143] 使用Illumina TruSeq DNA Nano操作規(guī)程,從200ng基因組DNA中制備Illumina文 庫,以選擇大小為550bp的靶標插入序列。
[0144] 實施例2.使用內含子特異性探針捕獲HLA
[0145] 作為概念驗證,將靶向內含子序列的定制寡核苷酸探針池(SEQ ID NO: 1至8)稀釋 到1.5pmolAU的濃度。對于第一雜交過程,將人Cot DNA、擴增的文庫(如上制備)、通用阻斷 寡TS-p7(6nt)及通用阻斷寡TS-p7(8nt)添加至管中,并在設為60°C的真空濃縮器中干燥大 約1小時。然后在Nimblegen 2X雜交緩沖液、Nimblegen雜交組分A和無核酶水中重懸干燥的 樣品。然后渦旋所述重懸樣品并在95°C變性10分鐘。變性后,添加2yl探針(3pmol)至樣品中 并且在72°C溫育4小時。
[0146] 為了清洗和回收探針雜交的DNA,根據制造商的操作規(guī)程稀釋來自Nimblegen清洗 試劑盒的清洗溶液。將雜交的樣品與抗生蛋白鏈菌素珠合并,渦旋混合,并在72 °C溫育45分 鐘。溫育后,在72°C用洗液I和嚴格洗液清洗結合的DNA,隨后在室溫下使用洗液II和III清 洗。然后將結合到抗生蛋白鏈菌素珠上的雜交樣品放置到磁鐵上,并使用〇. 125N NaOH洗脫 結合的DNA。然后使用Ampure XP珠純化雜交的樣品,而后用KAPA HiFi HotStart ReadyMix 進行12個循環(huán)的擴增。PCR中使用的引物與連接的DNA中的Illumina接頭序列和條碼序列 (Illumina P5和P7)互補。使用Ampure XP珠純化樣品。
[0147] 實施例3.雜交的DNA的測序
[0148] 經擴增的雜交樣品使用Illumina 2x300bp測序操作規(guī)程在MiSeq或HiSeq上進行 測序。
[0149] 實施例4 ?結果
[0150]所產生的序列數據使用Assign MPS vl. 0序列分析軟件進行分析(Conexio Genomics,Fremantle,澳大利亞)。對使用祀標捕獲測序操作規(guī)程產生的序列數據的分析顯 示在圖4中。使用Assign MPS v 1.0軟件,確定樣品的最佳匹配基因型為HLA-A*02:01:01: 01+A*02:01:01:01。
[0151]實施例5.在3個樣品的捕獲探針富集后的下一代測序結果,還進行了 Sanger測序
[0152] Sanger測定擴增了擴增子中的HLA-A、HLA-B和HLA-C序列,對于HLA-A和HLA-B其跨 度為非翻譯區(qū)至內含子4的末端,對于HLA-C其跨度為5'非翻譯區(qū)至至3'非翻譯區(qū)。使用 等位基因特異性測序引物,解決了所有的雜合性歧義。
[0153] 使用圖3描述的作為SEQ ID N0:10至71提供的探針并使用上文描述的操作規(guī)程來 進行捕獲探針測定。對于所述3個樣品,與報告的基因型完全一致。測定結果顯示在圖5中。
[0154] 樣品1的HLA-B包含一種等位基因,其參考序列未被報道過。與B*15:01:01:01的序 列比較,此等位基因在位于內含子1的堿基444處具有單個錯配。通過使用Sanger進行基因 座特異性擴增,此樣品要求使用B*08:01:01和15:01:01等位基因特異性測序引物的額外 實驗來確定該新等位基因為15:01:01:01等位基因的未描述過的B*08:01:01等位基因。 NGS能夠對整個基因的多態(tài)性進行相位確定,并能夠迅速鑒定該新等位基因為B*15:01:01 亞型。此樣品也包含新的004:01:01等位基因。此多態(tài)性位于內含子5中。使用等位基因特 異性測序引物在此區(qū)域是不常用的,且通過Sanger測序進行表征會要求通過PCR分離等位 基因,而后進行Sanger測序。然而,NGS正確地鑒定了該新等位基因為004:01:01亞型。
[0155] 此數據表明使用捕獲探針能夠鑒定新等位基因,也表明NGS能夠確定序列多態(tài)性 的相位關系,因此能夠對新等位基因進行精確表征。
[0156] 本領域技術人員會知曉,在不脫離廣泛描述的本發(fā)明的范圍的情況下,可以對具 體實施方式中所顯示的發(fā)明進行多種修改和/或變化。因此,本發(fā)明的實施方式僅是說明性 的且非限制性的。
[0157] 本文討論和/或參考的所有出版物都以其整體并入本文。
[0158] 本申請要求AU 2013904801的優(yōu)先權,將其全部內容作為參考并入本文。
[0159] 對本說明書中所包括的文件、法案、材料、設備、物品等的任意討論僅是為了為本 發(fā)明提供語境。不應認為這是承認它們中的任何一個或全部因存在于本申請每個權利要求 的優(yōu)先權日之前而構成部分現有技術基礎或本發(fā)明相關領域的公知常識。
[0160] 參考文獻
[0161] Metzker(2010)Nat Rev Genet,11(1):31~46
【主權項】
1. 一種鑒定受試對象中的基因的等位基因的方法,所述方法包括: a) 使來自受試對象的核酸樣品接觸寡核苷酸探針,其中,所述寡核苷酸探針與所述核 酸樣品中的基因靶序列雜交; b) 通過將雜交到寡核苷酸探針上的核酸與未結合寡核苷酸探針的核酸分離,富集雜交 到寡核苷酸探針上的核酸;及 c) 對富集的核酸進行測序以鑒定基因的一種或多種等位基因; 其中,所述基因靶序列在所述基因的非編碼區(qū)內。2. 如權利要求1所述的方法,其中,所述基因是高多態(tài)性基因。3. 如權利要求2所述的方法,其中,所述基因是HLA基因。4. 如權利要求1~3中任一項所述的方法,其中,所述方法包括擴增結合到所述寡核苷 酸探針上的核酸。5. 如權利要求3或4所述的方法,其中,所述方法包括對HLA基因外顯子進行測序。6. 如權利要求5所述的方法,其中,所述方法包括對整個HLA基因進行測序。7. 如權利要求1~6中任一項所述的方法,其中,所述寡核苷酸探針包含捕獲標簽。8. 如權利要求7所述的方法,其中,所述捕獲標簽為生物素或抗生蛋白鏈菌素。9. 如權利要求7或8所述的方法,其中,所述方法包括使所述捕獲標簽與結合試劑接觸。10. 如權利要求9所述的方法,其中,所述結合試劑為生物素或抗生蛋白鏈菌素。11. 如前述任一項權利要求所述的方法,其中,與所述寡核苷酸探針接觸的核酸樣品包 含單鏈核酸。12. 如權利要求1~11中任一項所述的方法,其中,在使所述核酸樣品與所述寡核苷酸 探針接觸之前將所述核酸樣品片段化。13. 如權利要求12所述的方法,其中,所述方法包括使平均長度大于約100bp的核酸片 段與所述寡核苷酸探針接觸。14. 如權利要求1~11中任一項所述的方法,其中,在所述核酸樣品與所述寡核苷酸探 針接觸之后將所述核酸樣品片段化。15. 如權利要求3~14中任一項所述的方法,其中,所述HLA基因的非編碼區(qū)為內含子。16. 如權利要求3~15中任一項所述的方法,其中,所述方法進一步包括檢測非HLA基因 的一種或多種等位基因。17. 如權利要求1~16中任一項所述的方法,其中,所述測序為高通量測序。18. 如權利要求17所述的方法,其中,所述高通量測序為下一代測序技術。19. 一種鑒定受試對象中的基因的等位基因的方法,所述方法包括: a) 從受試對象中獲得核酸樣品; b) 將所述核酸樣品片段化以獲得長度為至少約2kb的核酸片段; c) 使所述核酸樣品與包含捕獲標簽的寡核苷酸探針接觸,其中,所述寡核苷酸探針與 所述核酸樣品中的基因靶序列雜交; d) 使所述捕獲標簽與結合試劑接觸,富集雜交到寡核苷酸的核酸;及 e) 對核酸進行測序以鑒定基因的一種或多種等位基因; 其中,所述基因靶序列在所述基因的非編碼區(qū)內。20. 如權利要求19所述的方法,其中,在使所述核酸樣品與所述寡核苷酸探針接觸之前 將所述核酸樣品片段化。21. 如權利要求19所述的方法,其中,在使所述核酸樣品與所述寡核苷酸探針接觸之后 將所述核酸樣品片段化。22. 如權利要求19~21中任一項所述的方法,其中,所述基因的等位基因是HLA基因的 等位基因。23. 如權利要求3~33中任一項所述的方法,其中,一種或多種所述寡核苷酸探針包含 與SEQ ID No: 1至8或10至71中的任意一個具有至少95%同一性的核酸序列。24. -種為需要移植的受體鑒定移植供體的方法,所述方法包括: a) 進行權利要求3~23中任一項所述的方法,以在需要移植的受體中鑒定一種或多種 HLA基因等位基因;及 b) 基于同時在移植供體和移植受體的HLA基因中一種或多種等位基因的存在,鑒定移 植供體。25. -種降低移植受體發(fā)展移植物抗宿主病的可能性的方法,所述方法包括: a) 進行權利要求3~24中任一項所述的方法,以在需要移植的受體中鑒定一種或多種 HLA基因等位基因;及 b) 基于同時在移植供體和移植受體中一種或多種HLA基因等位基因的存在,鑒定移植 供體; 其中,同時在移植供體和移植受體中一種或多種HLA基因等位基因的存在表明所述移 植受體在從所述移植供體移植了移植物后發(fā)展移植物抗宿主病的可能性降低。26. 如權利要求24或25所述的方法,其中,所述方法包括鑒定所述移植供體中的一種或 多種HLA基因等位基因。27. -種將同種異基因移植物移植到受體中的方法,所述方法包括: a) 進行權利要求24~26中任一項所述的方法;及 b) 從所述移植供體中移出供體移植物;及 c) 將所述移植物移植到所述受體中。28. -種用于鑒定受試對象中的基因的等位基因的試劑盒,所述試劑盒包含與所述基 因的非編碼區(qū)中的基因靶序列雜交的寡核苷酸探針。29. 如權利要求28所述的試劑盒,其中,所述基因是高多態(tài)性基因。30. 如權利要求29所述的試劑盒,其中,所述基因是HLA基因。31. 如權利要求30所述的試劑盒,其中,所述HLA基因的非編碼區(qū)為內含子。32. 如權利要求28~31中任一項所述的試劑盒,其中,所述寡核苷酸探針包含捕獲標 簽。33. 如權利要求32所述的試劑盒,其中,所述捕獲標簽為生物素或抗生蛋白鏈菌素。34. 如權利要求33所述的試劑盒,其中,所述試劑盒包含結合試劑。35. 如權利要求34所述的試劑盒,其中,所述結合試劑與基體偶聯。36. 如權利要求35所述的試劑盒,其中,所述基體為磁性基體。37. 如權利要求28~36中任一項所述的試劑盒,其中,一種或多種所述寡核苷酸探針包 含與SEQ ID No: 1至8或10至71中的任意一個具有至少95%同一性的核酸序列。
【文檔編號】C12Q1/68GK106029903SQ201480072955
【公開日】2016年10月12日
【申請日】2014年12月10日
【發(fā)明人】D·C·塞伊爾, D·德桑蒂斯
【申請人】康內西奧基因組學私人有限公司