本發(fā)明涉及生物技術(shù)領(lǐng)域,特別涉及一種水稻微衛(wèi)星標記位點開發(fā)方法與微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度檢測方法。
背景技術(shù):
微衛(wèi)星標記又稱短串聯(lián)重復(fù)序列(short tandem repeats,STR)或簡單重復(fù)序列(simple sequence repeats,SSR),指由2個以上核苷酸為重復(fù)單元串聯(lián)重復(fù)構(gòu)成。微衛(wèi)星標記位點指的是在基因組上含有微衛(wèi)星標記的座位,微衛(wèi)星標記位點在基因組上數(shù)量豐富且均勻分布,微衛(wèi)星標記位點的開發(fā)指的是尋找基因組上的微衛(wèi)星標記位點的過程。不同樣本中,同一個微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的重復(fù)單元的重復(fù)次數(shù)可能不同,在樣本間存在長度變異,因此微衛(wèi)星標記位點的多態(tài)性主要指同一個微衛(wèi)星標記位點的不同微衛(wèi)星標記的長度多態(tài)性。微衛(wèi)星標記檢測技術(shù)指的是檢測微衛(wèi)星標記位點中的微衛(wèi)星標記的長度的技術(shù)。不同樣本的微衛(wèi)星標記的長度多態(tài)性可以用來對樣本的身份進行鑒定,因此,微衛(wèi)星標記技術(shù)的應(yīng)用十分廣泛,包括生物多樣性鑒定、動植物品種指紋身份證鑒定等等。
傳統(tǒng)的水稻微衛(wèi)星標記位點的開發(fā)與檢測包括以下步驟:基因組提取、基因組片段化、連接接頭、擴增、與簡單重復(fù)序列雜交、純化雜交產(chǎn)物、雜交產(chǎn)物克隆、克隆產(chǎn)物大腸桿菌轉(zhuǎn)化、挑取單克隆、對每一個單克隆的目標位點進行一代測序、分析測序結(jié)果獲得微衛(wèi)星標記位點、在多個水稻樣本中檢驗微衛(wèi)星標記位點的多態(tài)性、開發(fā)出多態(tài)性高的微衛(wèi)星標記位點、逐一擴增并電泳檢測每一個待檢測的樣品中的每一個待檢測的微衛(wèi)星標記位點中的微衛(wèi)星標記。
在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:
水稻微衛(wèi)星標記位點的開發(fā)與檢測流程復(fù)雜、通量低、極其耗時費力;其次,微衛(wèi)星標記位點的電泳檢測的分辨率低,檢測結(jié)果不準確,準確的結(jié)果需要參考樣本等進行校正。由此派生的問題包括:開發(fā)出來的微衛(wèi)星標記位點少,通常200個以內(nèi),占基因組上所有微衛(wèi)星標記位點的1%左右;用于檢驗微衛(wèi)星標記位點多態(tài)性的水稻樣本也少,通常在數(shù)十個左右,因此多態(tài)性檢證結(jié)果不準確;微衛(wèi)星標記位點的側(cè)翼序列保守性未知,影響擴增微衛(wèi)星標記位點的引物的通用性;檢測的微衛(wèi)星標記位點的數(shù)量有限,一般在一個待檢測的樣品中檢測數(shù)十個微衛(wèi)星標記位點,導(dǎo)致建立的樣本的DNA身份證信息不完整、不準確。
技術(shù)實現(xiàn)要素:
為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實施例提供了一種水稻微衛(wèi)星標記位點開發(fā)方法與微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度檢測方法。所述技術(shù)方案如下:
一方面,本發(fā)明實施例提供了一種水稻微衛(wèi)星標記位點開發(fā)方法,所述方法包括:
將n個具有多態(tài)性的水稻樣本等質(zhì)量混合,獲得混合樣本,其中n>1;
提取所述混合樣本的基因組;
將所述混合樣本的基因組片段化,獲得基因組片段;
將多個具有簡單重復(fù)序列的探針作為探針組,利用所述探針組中的每個探針分別與所述基因組片段進行雜交,獲得多個雜交溶液,對多個所述雜交溶液中成功雜交的基因組片段分別進行純化,得到多個純化的雜交基因組片段;
將多個所述純化的雜交基因組片段等質(zhì)量混合后,利用高通量測序檢測混合后的所述純化的雜交基因組片段,獲得第一高通量測序片段;
從所述第一高通量測序片段中,篩選有效的所述高通量測序片段,所述有效的高通量測序片段包括微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記;
根據(jù)所述有效的高通量測序片段中的微衛(wèi)星標記的兩側(cè)序列的同源性對所述有效的高通量測序片段進行分類,同一類的所述有效的高通量測序片段為同一個微衛(wèi)星標記位點的所述有效的高通量測序片段,若同一個所述微衛(wèi)星標記位點的所述有效的高通量測序片段的條數(shù)≥α1,則成功開發(fā)一個所述微衛(wèi)星標記位點,其中,α1為第一判定閾值且α1≥(高通測序深度×有效的高通量測序片段的比例/基因組上能檢測到的微衛(wèi)星標記位點數(shù))×概率保證。
通常,為了便于純化所述雜交溶液中成功雜交的基因組片段,可以對探針進行功能化標記,例如可以
利用生物素標記的具有簡單重復(fù)序列的探針與所述基因組片段進行雜交,獲得雜交溶液;
利用鏈霉親和素磁珠純化所述雜交溶液中成功雜交的基因組片段,獲得純化的基因組片段。
在上述步驟中由于探針具有生物素標記,使得成功雜交的基因組片段也被生物素標記,從而可以利用鏈霉親和素磁珠從所述雜交溶液中純化出來。所述利用生物素標記和鏈霉親和素磁珠純化的技術(shù)為公知技術(shù)。
具體地,α1≥20。
具體地,所述微衛(wèi)星標記指由≥2個堿基組成的重復(fù)單元串聯(lián)重復(fù)構(gòu)成的序列。
具體地,所述有效的高通量測序片段中的所述微衛(wèi)星標記的兩側(cè)序列的堿基數(shù)均≥1個,且所述有效的高通量測序片段中的所述微衛(wèi)星標記中至少有一側(cè)的序列的堿基數(shù)≥10個。
具體地,選擇所述n個具有多態(tài)性的樣本的方法包括:選擇外部形態(tài)不同的水稻樣本、生物分類不同的水稻樣本、標記互不相同的水稻樣本或不同生態(tài)區(qū)域的野生資源的水稻樣本。
具體地,所述探針的數(shù)量為12個,每個所述探針的簡單重復(fù)序列中的重復(fù)單元為CT、GA、TG、AC、TA、TGT、CCA、ATC、CCT、AGA、ATG或CAA,每個所述探針的簡單重復(fù)序列的重復(fù)次數(shù)為6~20,優(yōu)選為6~15,例如重復(fù)次數(shù)為8或12。
具體地,所述探針的序列如序列表中SEQ IN NO:1-SEQ IN NO:12所示。
另一方面,本發(fā)明實施例提供了一種上述開發(fā)方法成功開發(fā)的微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度檢測方法,所述檢測方法包括:
從成功開發(fā)的所述微衛(wèi)星標記位點中,選擇待檢測的微衛(wèi)星標記位點;
利用多重擴增引物擴增所述待檢測的微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記,得到擴增產(chǎn)物,將所述擴增產(chǎn)物進行高通量測序,得到第二高通量測序片段,通過分析所述第二高通量測序片段,獲得所述微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度。
具體地,所述從成功開發(fā)的所述微衛(wèi)星標記位點中,選擇所述待檢測的微衛(wèi)星標記位點的方法包括:
選擇所述待檢測的微衛(wèi)星標記位點的標準為H值最大的所述微衛(wèi)星標記位點,其中,H值為所述微衛(wèi)星標記位點的多態(tài)性指數(shù),其中,i為按所述微衛(wèi)星標記位點的所述有效的高通量測序片段中的微衛(wèi)星標記的長度進行分類時,第i個類別,i為自然數(shù);ai為第i個類別的有效的所述高通量測序片段的數(shù)目占總的有效的所述高通量測序片段的數(shù)目的比例。
具體地,制備所述多重擴增引物的方法包括:
從選擇的所述待檢測的微衛(wèi)星標記位點的所有所述有效的高通量測序片段中,提取所述微衛(wèi)星標記并挑選出最長的所述微衛(wèi)星標記作為多重擴增引物的模版序列的微衛(wèi)星標記;
從選擇的所述待檢測的微衛(wèi)星標記位點的所有所述有效的高通量測序片段中,提取所述微衛(wèi)星標記的左側(cè)序列并挑出長度大于α2個堿基的所有序列,從挑選出的所述所有序列中,挑選出頻率最高的序列,以所述頻率最高的序列作為參考序列,將所述參考序列與所有的所述微衛(wèi)星標記的左側(cè)序列進行比對,在所述頻率最高的序列中獲得每一個堿基的覆蓋倍數(shù)和變異頻率;在所述頻率最高的序列中,將所述覆蓋倍數(shù)≤1/α3或所述變異頻率≥α3的堿基變?yōu)镹后作為所述多重擴增引物的模板序列的左側(cè)序列,其中,N為A、T、C和G四種堿基中任意一種及以上的堿基;α2為第二判定閾值,α2=(所述第一高通量測序片段的平均長度-所述多重擴增引物的微衛(wèi)星標記位點的長度)÷2;α3為第三判定閾值,α3≥5×(1-所述第一高通量測序片段的準確度);
按照與所述多重擴增引物的模板序列的左側(cè)序列相同的方法,獲得多重擴增引物序列的模板序列的右側(cè)序列;
將所述多重擴增引物的模板序列的左側(cè)序列、所述多重擴增引物的模板序列的微衛(wèi)星標記和所述多重擴增引物的模板序列的右側(cè)序列依次連接,得到所述微衛(wèi)星標記位點的多重擴增引物的模板序列,利用所述微衛(wèi)星標記位點的多重擴增引物的模板序列,獲得所述多重擴增引物。
具體地,獲得所述微衛(wèi)星標記位點內(nèi)的所述微衛(wèi)星標記的長度的方法為:去除所述第二高通量測序片段中的所述微衛(wèi)星標記后,獲得所述第二高通量測序片段的左邊界序列和所述第二高通量測序片段的右邊界序列;利用所述左邊界序列和所述右邊界序列將所述第二高通量測序片段中的每個片段比對到所述待檢測的微衛(wèi)星標記位點上;截取每一個所述待檢測的微衛(wèi)星標記位點的所述第二高通量測序片段中的所述微衛(wèi)星標記;將獲得的所述微衛(wèi)星標記按長度進行分類,并計算第i個類別的真實度Ri=Ni/Nmax,其中,i為按所述微衛(wèi)星標記位點的所述有效的高通量測序片段中的微衛(wèi)星標記的長度進行分類時,第i個類別,Ni為所述第i個類別的所述第二高通量測序片段的數(shù)量,Nmax為所有類別的所述第二高通量測序片段的數(shù)量的最大值;若所述真實度Ri≥α4,則所述第i個類別的所述微衛(wèi)星標記的長度為所述微衛(wèi)星標記位點內(nèi)的所述微衛(wèi)星標記的長度,若所述真實度Ri<α4,則所述第i個類別的微衛(wèi)星標記的長度不為所述微衛(wèi)星標記位點內(nèi)的所述微衛(wèi)星標記的長度,其中,α4為第四判定閾值且α4=0.3。
具體地,將所述混合樣本的基因組片段化的方法為機械打斷或酶切。
本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:本發(fā)明提供的水稻微衛(wèi)星標記位點的開發(fā)與檢測技術(shù)簡單、快捷、高通量、全面且準確。時間消耗由1~2年縮短到1~2天;開發(fā)出的微衛(wèi)星標記位點數(shù)量由基因組中所有微衛(wèi)星標記位點的1%左右提高到接近100%;檢驗微衛(wèi)星標記位點的多態(tài)性的水稻樣本的數(shù)量由數(shù)十個提升到不受限制,多態(tài)性結(jié)果檢驗的準確性大為提高;可獲得微衛(wèi)星標記位點的側(cè)翼序列的保守性,確保了擴增微衛(wèi)星標記位點的引物的通用性;將多個微衛(wèi)星標記位點作為一個位點檢測,而不是逐一檢測,多個待檢測的水稻樣本只進行一次檢測,而不是多次檢測,極大地減少了微衛(wèi)星標記位點檢測的工作量,因此,檢測的微衛(wèi)星標記位點的數(shù)量幾乎不受限制。微衛(wèi)星標記位點檢測的結(jié)果為堿基,正確率接近100%;微衛(wèi)星標記位點檢測分辨率提升至最高分率:單堿基;不再需要參照品種對檢測結(jié)果進行校正。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將對本發(fā)明實施方式作進一步地詳細描述。
本發(fā)明實施例中未注明或詳細描述的操作流程或操作規(guī)范均為普通分子生物學(xué)技術(shù)人員所熟知的操作。本發(fā)明實施例中未注明的試劑或生物材料均為市場上銷售的常用試劑或生物材料,均為普通分子生物學(xué)技術(shù)人員所熟知的,且可以在市場上購買到。
實施例
水稻微衛(wèi)星標記位點的開發(fā)方法:
將n個具有多態(tài)性的水稻樣本等量混合,獲得混合樣本,其中n>1。
具有多態(tài)性的樣本包括:外部形態(tài)不同的水稻樣本(形態(tài)多態(tài)性)、生物分類(如不同變種或品種)不同的水稻樣本、標記(如蛋白質(zhì)標記)互不相同的水稻樣本或不同生態(tài)區(qū)域的野生資源水稻樣本,其中,所選擇的水稻樣本越多(n值越大),多態(tài)性越豐富,所開發(fā)出的微衛(wèi)星標記位點的適用性越廣。本實施例中,待開發(fā)的微衛(wèi)星標記位點的物種為水稻,選擇分類和類型上不同的21個不同的水稻品種的葉片等質(zhì)量混合,即n=21,獲得混合樣本。該21個水稻品種均為彭海等2014年發(fā)表于《中國科學(xué):生命科學(xué)》第44卷第1期的第45到53頁的論文《中國雜交秈稻DNA甲基化多樣性與遺傳穩(wěn)定性》的表1中所列的品種代碼為1-21的水稻品種,這些水稻品種是中國水稻育種中廣泛使用的親本,公開且公知,最初由不同的單位選育或保存,贈與江漢大學(xué)后,最終由江漢大學(xué)保存、繁殖并用于本實施例。其中,微衛(wèi)星標記指由≥2個堿基組成的重復(fù)單元串聯(lián)重復(fù)構(gòu)成的序列。
提取混合樣本的基因組。這些水稻品種的種植、幼苗培養(yǎng)、葉片采集與混合樣本的基因組的提取方法與上述論文1.2中所記載的種植、幼苗培養(yǎng)、葉片采集與DNA提取方法相同。
將混合樣本的基因組片段化,獲得基因組片段。具體地,將混合樣本的基因組片段化的方法包括:機械打斷或酶切?;蚪M片段化的長度控制在高通量測序時可檢測的片段長度范圍內(nèi)。本實施例中,高通量測序采用PROTON高通量測序儀的PI芯片,其檢測長度約為200bp,因此,獲取的基因組片段的長度的峰值也盡量控制在200bp附近。本實施例采用自動聲波聚焦破碎儀Covaris S220(美國Covaris生產(chǎn),型號為S220)破碎混合樣本的基因組,破碎方法按該儀器的操作手冊《DNA Shearing with S220/E220 Focused-ultrasonicator》(版本號:010308Rev G)中所記載的獲取200bp(峰值)目標片段的方法進行,破碎后即獲得混合樣本的基因組片段,采用美國Quawell公司生產(chǎn)的Q5000分光光度計按其雙鏈DNA的程序?qū)蚪M片段進行檢測后,將濃度稀釋或濃縮到100ng/μL,獲得基因組片段。
將多個生物素標記的具有簡單重復(fù)序列的探針作為探針組,利用探針組與基因組片段進行雜交,獲得雜交溶液。具有簡單重復(fù)序列的探針中的重復(fù)單元的堿基數(shù)≥2個。具體地,探針的簡單重復(fù)序列中的重復(fù)單元為CT、GA、TG、AC、TA、TGT、CCA、ATC、CCT、AGA、ATG或CAA,這12個探針可以與所有可能的2堿基和3堿基為重復(fù)單元的微衛(wèi)星標記進行雜交,因此,可以用于所有物種中的基因組片段中的微衛(wèi)星標記的釣取。前期實驗中,我們檢測了不同探針長度鉤取微衛(wèi)星標記的效率,發(fā)現(xiàn)探針的簡單重復(fù)序列的重復(fù)次數(shù)為6~20時,效率較高,優(yōu)選的重復(fù)次數(shù)為6~15,例如8或12。在本實施例中,該探針組包括12個探針,這12個探針的序列分別如序列表中SEQ IN NO:1-SEQ IN NO:12所示。以上探針均由北京擎科新業(yè)生物技術(shù)有限公司合成并進行5’端生物素標記。前期的實驗表明,將不同探針分別釣取基因組片段中的微衛(wèi)星標記的效率優(yōu)于將所有探針混合后釣取基因組片段中的微衛(wèi)星標記的效率,因此,在本實施例中利用不同探針分別釣取基因組片段中的微衛(wèi)星標記,具體地,將以上每個探針分別用無酶水溶解為等摩爾濃度(10pM/μL)的溶液,取以上探針組中的12個探針各1μL分別與5μg混合樣本的基因組片段混勻后雜交,分別獲得12種雜交溶液。雜交的程序為:95℃10分鐘,65℃10分鐘,37℃10分鐘。
利用鏈霉親和素磁珠純化雜交溶液中成功雜交的基因組片段,獲得純化的基因組片段。具體地,利用鏈霉親和素磁珠分別純化12種雜交溶液,其純化過程為:將獲得的12種中的1種雜交溶液置于磁力架(美國Invitrogen公司生產(chǎn))上,至雜交溶液澄清后,吸去溶液,用無酶水清洗磁珠2次,取10μL無酶水與鏈霉親和素磁珠混合,于PCR儀中95℃加熱5分鐘,迅速置于磁力架上,獲得的溶液即為第一個探針的純化的雜交基因組片段。按與獲取的第一個探針的純化的雜交基因組片段相同的方法,依次獲取所有12個純化的雜交基因組片段,將它們混合在一起,即最終獲得所有探針的純化的雜交基因組片段。為了能夠成功純化雜交基因組片段,在本實施例中,采用生物素標記的具有簡單重復(fù)序列的探針配合鏈霉親和素磁珠的方式,在其它實施例中,也可以采用其它的方式進行基因組片段的雜交和純化。
利用二代高通量測序檢測純化的雜交基因組片段,獲得第一高通量測序片段。利用DNA文庫制備試劑盒(由英國NEB公司生產(chǎn),貨號為E6270L)并按該試劑盒的操作手冊構(gòu)建二代高通量測序文庫,利用獲得的二代高通量測序文庫和試劑盒Ion PI Template OT2 200Kit v2(美國invirtrigen公司生產(chǎn),貨號為4485146)進行測序前的ePCR(Emulsion PCR,乳化聚合酶鏈反應(yīng))擴增,操作方法按該試劑盒的操作手冊進行,獲得ePCR擴增產(chǎn)物。利用ePCR擴增產(chǎn)物和試劑盒Ion PI Sequencing 200Kit v2(美國invirtrigen公司生產(chǎn),貨號為4485149)在Proton二代高通量測序儀上進行高通量測序,操作方法按該試劑盒的操作手冊進行。在本實施例中,高通量測序量設(shè)置為10M測序片段(1M=100萬),測序長度設(shè)置為500cycle(循環(huán)),測序結(jié)束后,獲得第一高通量測序片段。
從第一高通量測序片段中,篩選有效的高通量測序片段。其中,有效的高通量測序片段包括微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記,有效的高通量測序片段中的微衛(wèi)星標記的兩側(cè)序列的堿基數(shù)均≥1個,且有效的高通量測序片段中的微衛(wèi)星標記中至少有一側(cè)的序列的堿基數(shù)≥10個。分析第一高通量測序片段中的每一條片段是否含有微衛(wèi)星標記,去掉不含有微衛(wèi)星標記的第一高通量測序片段。在保留下來的第一高通量測序片段中,分析微衛(wèi)星標記的兩側(cè)序列的堿基數(shù)是否均≥1個,如果是,則表明微衛(wèi)星標記在第一高通量測序片段中是完整的,這一點是必要的,因為微衛(wèi)星標記的多態(tài)性是指微衛(wèi)星標記的長度多態(tài)性,只有確保微衛(wèi)星標記是完整的,才能正確獲得微衛(wèi)星標記的長度多態(tài)性,以便正確地進行后續(xù)分析。微衛(wèi)星標記的兩側(cè)序列均小于10個堿基的第一高通量測序片段無法準確地進行后續(xù)的同源性分析,會因為序列過短而引入誤差,因此,進一步去掉微衛(wèi)星標記的兩側(cè)序列均小于10個堿基的第一高通量測序片段。經(jīng)過以上流程,最終保留下來的第一高通測序片段即為有效的高通量測序片段。
其中,在分析第一高通量測序片段中的每一條片段是否含有微衛(wèi)星標記時,可以采用現(xiàn)有技術(shù)中常用的分析軟件進行分子,也可以簡單的通過人工對每個第一高通量測序片段進行判斷。
根據(jù)有效的高通量測序片段中的微衛(wèi)星標記的兩側(cè)序列的同源性對有效的高通量測序片段進行分類,同一類的有效的高通量測序片段為同一個微衛(wèi)星標記位點的有效的高通量測序片段,若同一個微衛(wèi)星標記位點的有效的高通量測序片段的條數(shù)≥α1,則成功開發(fā)一個微衛(wèi)星標記位點,其中,α1為第一判定閾值且α1≥(高通測序深度×有效的高通量測序片段的比例/基因組上能檢測到的微衛(wèi)星標記位點數(shù))×概率保證。α1的具體取值可根據(jù)高通量測序的深度進行調(diào)整。將有效的高通量測序片段中的微衛(wèi)星標記去掉,將剩余的兩側(cè)序列合并成一條完整的序列,采用軟件Megablast(版本2.2.26)在合并后的完整的序列間進行成對的比對分析,比對的各參數(shù)設(shè)置為:參數(shù)-e設(shè)置為1e-5;參數(shù)-p設(shè)置為0;參數(shù)–v設(shè)置為5000;參數(shù)-m設(shè)置為1。將具有同源性(同源性指在DNA序列上相似)的有效的高通量測序片段歸為同一類,同時計算類別內(nèi)包含的有效的高通量測序片段的數(shù)量,若包含的有效的高通量測序片段的數(shù)量≥α1條時,則該類別的有效的高通量測序片段為一個成功開發(fā)的微衛(wèi)星標記位點的高通量測序片段。其具體原理如下:基因組上同一個微衛(wèi)星標記位點在高通量測序過程中,可能被檢測到多次,由于高通量測序的對象為包含了多個具有多態(tài)性的樣本的混合樣本,因此,同一個微衛(wèi)星標記位點中的微衛(wèi)星標記的長度存在多態(tài)性變異,微衛(wèi)星標記位點的兩側(cè)序列也存在變異,因此,不能要求同一個微衛(wèi)星標記位點的所有有效的高通量測序片段的序列完全相同,只能根據(jù)高通量測序片段的同源性來判定是否為同一微衛(wèi)星標記位點,其中,高通量測序片段包括微衛(wèi)星標記與微衛(wèi)星標記的兩側(cè)序列,因此,高通量測序片段的同源性可以是微衛(wèi)星標記的同源性或者微衛(wèi)星標記的兩側(cè)序列的同源性。不同的微衛(wèi)星標記位點中的微衛(wèi)星標記可能相同,因此,不能根據(jù)微衛(wèi)星標記的同源性判定有效的高通量測序片段是否屬于同一微衛(wèi)星標記位點,只能根據(jù)微衛(wèi)星標記位點的兩側(cè)序列的同源性判定有效的高通量測序片段是否屬于同一微衛(wèi)星標記位點。之所以要求同一個微衛(wèi)星標記位點的有效的高通量測序片段的數(shù)量≥α1是為了防止諸如樣本被污染等難以控制的因素造成的假陽性。α1≥3是生物信息學(xué)中確認一個片段真實存在時,一般采用的閾值,α1的具體取值可根據(jù)高通量測序的深度進行調(diào)整,可按以下公式計算:α1≥(高通測序深度×有效的高通量測序片段的比例/基因組上的能檢測到的微衛(wèi)星標記位點數(shù))×概率保證,其中,在統(tǒng)計上,概率保證一般取值為5%或1%。本實施例中,高通量測序的深度為1000萬條,有效的高通量測序片段的比例一般為40%左右,一般基因組上的能檢測到的微衛(wèi)星標記位點為1萬個左右,因此,平均每個微衛(wèi)星標記位點包含的有效的高通量測序片段為400條,實際的微衛(wèi)星標記位點的測序深度呈現(xiàn)正態(tài)分布,所以,一般低于平均有效的高通量測序片段數(shù)1/20(5%)的分布較少。因此,本實施例中,α1取值為20條。按以上流程和標準,本實施例中,共成功開發(fā)出12322個微衛(wèi)星標記位點。
選擇待檢測的微衛(wèi)星標記位點的標準為H值最大的微衛(wèi)星標記位點,其中,H值為微衛(wèi)星標記位點的多態(tài)性指數(shù),其中,i為按微衛(wèi)星標記位點的有效的高通量測序片段中的微衛(wèi)星標記的長度進行分類時,第i個類別,i為自然數(shù);ai為第i個類別的有效的高通量測序片段的數(shù)目占總的有效的高通量測序片段的數(shù)目的比例。如表1的假定的微衛(wèi)星標記位點按有效的高通量測序片段中的微衛(wèi)星標記的長度進行分類,共有3種:(TG)20、(TG)21和(TG)22,因此S=3;該微衛(wèi)星標記位點的總的有效的高通量測序片段的數(shù)目為40,其中,第1種微衛(wèi)星標記(TG)20的數(shù)目為3條,因此a1=3/40=7.50%,同樣計算a2=32/40=80%,a3=5/40=12.50%。將以上值代入H的計算公式獲得該微衛(wèi)星標記位點的H值為0.98。
按與表1的假定的微衛(wèi)星標記位點相同的計算方法,計算本實施例中所有成功開發(fā)出的所有微衛(wèi)星標記位點的H值,所有獲得的微衛(wèi)星標記位點的H值由大到小排列,選擇排序前50位的微衛(wèi)星標記位點為本實施中待檢測的樣本中需要檢測的微衛(wèi)星標記位點。參數(shù)50根據(jù)實際需要定,例如,在水稻純度鑒定時,1個微衛(wèi)星標記位點即可,在水稻指紋圖譜構(gòu)建時,一般選擇50個左右的微衛(wèi)星標記位點,在品種間實質(zhì)性派生關(guān)系分析時,則要求選擇大概300個微衛(wèi)星標記位點才能滿足要求。之所以選擇H值最大的微衛(wèi)星標記位點,是因為它們的區(qū)分能力最強,用最少的微衛(wèi)星標記位點可以盡可能區(qū)分更多的樣本并提供盡可能多的信息,而區(qū)分樣本是微衛(wèi)星標記技術(shù)最核心的任務(wù)。
提取微衛(wèi)星標記位點的所有有效的高通量測序片段中的微衛(wèi)星標記,如表1所列的假定的微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記為3條(TG)20、32條(TG)21和5條(TG)22的集合。提取微衛(wèi)星標記位點的所有有效高通量測序片段中的微衛(wèi)星標記的左側(cè)序列組成微衛(wèi)星標記位點的左側(cè)序列,如表1的假定的微衛(wèi)星標記位點的左側(cè)序列為3條(A)2G(A)2、5條(A)87G(A)3、27條(A)86G(A)3和5條(A)81G(A)4的集合。同樣的方法,獲得微衛(wèi)星標記位點的右側(cè)序列,如表1的假定的微衛(wèi)星標記的右側(cè)序列為3條(A)4G(A)80、5條(A)3G(A)2、27條(A)3G(A)81和5條2G(A)85的集合。
水稻微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度的檢測方法:
從成功開發(fā)的微衛(wèi)星標記位點中,選擇待檢測的微衛(wèi)星標記位點,設(shè)計擴增待檢測的微衛(wèi)星標記位點的多重擴增引物。下面以表1中的假定的微衛(wèi)星標記位點為例,介紹如何選擇微衛(wèi)星標記位點并設(shè)計多重擴增引物。
設(shè)計擴增選擇的微衛(wèi)星標記位點的多重擴增引物的方法包括:從選擇的微衛(wèi)星標記位點的所有有效的高通量測序片段中,提取微衛(wèi)星標記,從中挑選出最長的微衛(wèi)星標記,作為多重擴增引物設(shè)計的微衛(wèi)星標記;如表1的假定的微衛(wèi)星標記位點中,(TG)22為最長的微衛(wèi)星標記,因此,(TG)22為該微衛(wèi)星標記位點的多重擴增引物設(shè)計的模板序列的微衛(wèi)星標記。之所以選擇最長的微衛(wèi)星標記是保證所設(shè)計的多重擴增引物所擴增的微衛(wèi)星位點的長度不會超過多重PCR的擴增能力,從而減少微衛(wèi)星檢測時的數(shù)據(jù)缺失。
從選擇的微衛(wèi)星標記位點的所有有效的高通量測序片段中,提取微衛(wèi)星標記的左側(cè)序列,從中挑出長度大于α2個堿基的所有序列,α2為第二判定閾值,α2=(二代高通量測序技術(shù)所能檢測的第一高通量測序片段的平均長度-多重擴增引物的微衛(wèi)星標記位點的長度)÷2。本實施例中,第一高通量測序片段的平均長度為200bp,多重擴增引物設(shè)計的微衛(wèi)星標記的長度為44(TG重復(fù)22次,長度為44),因此α2=78bp。因此,微衛(wèi)星標記的左側(cè)序列中,挑出的長度大于α2的所有序列為5條(A)87G(A)3、27條(A)86G(A)3和5條(A)81G(A)4的集合。從挑選出的所有序列中,挑選出頻率最高的序列,例如上述挑出的長度大于α2的所有序列中,頻率最高的序列為(A)86G(A)3。以頻率最高的序列作為參考序列與所有的微衛(wèi)星標記的左側(cè)序列進行比對,獲得頻率最高的序列中每一個堿基的覆蓋倍數(shù)和變異頻率。例如,表1的假定的微衛(wèi)星標記位點中,應(yīng)該以(A)86G(A)3為參考序列與所有的左側(cè)序列進行比對,比對時,參考序列(A)86G(A)3的5’端的第1個堿基為A,其被覆蓋了5+27=32倍,由于該位置全是A,因此,變異頻率為0,(A)86G(A)3的5’端的第87個堿基為G,其同樣被覆蓋了5+27=32倍,其中,不為G的堿基有5個(在5條(A)81G(A)4中),因此變異頻率為5÷(5+27+5)=0.175,按以上方法,計算獲得(A)86G(A)3中每一個堿基的覆蓋倍數(shù)和變異頻率。將頻率最高的序列中的覆蓋倍數(shù)≤1/α3或變異頻率≥α3的堿基變?yōu)镹后作為多重擴增引物設(shè)計的左側(cè)序列,其中,N為A、T、C和G中任意一種及以上的堿基;α3為第三判定閾值,α3≥5×(1-第一高通量測序片段的準確度),α3的具體值根據(jù)多重擴增引物的通用性的要求的嚴格程度和高通量測序的深度進行調(diào)整,要求通用性越強或高通量測序深度越深,則α3的值越小。在本實施例中,高通量測序的準確度為99%,因此α3≥5×(1-99%)=5%,本實施例要求所設(shè)計的多重擴增引物的通用性強,因此,α3取值為5%。因此,在表1的假定的微衛(wèi)星標記位點中,將出頻率最高的序列((A)86G(A)3)中的覆蓋倍數(shù)≤1/5%=20或變異頻率≥0.05的堿基記為變?yōu)镹后作為多重擴增引物的模板序列的左側(cè)序列。對于(A)86G(A)3第1個堿基,其被覆蓋了32倍且變異頻率為0,因此,不改變?yōu)镹,對于(A)86G(A)3第86個堿基,其覆蓋倍數(shù)32倍但變異頻率為0.175≥0.05,因此,將該堿基變?yōu)镹,按此規(guī)則,在表1的假定的微衛(wèi)星標記位點中,多重擴增引物的模板序列的左側(cè)序列為(A)85NNN(A)2。變異頻率高的堿基混合樣本中變異度大,因此,所設(shè)計的多重擴增引物通用性差,覆蓋倍數(shù)低的堿基誤差大,把它們都變成N后,在后續(xù)的多重引物設(shè)計流程中,就可以避開這些堿基位點,以確保設(shè)計出來的多重擴增引物可以在不同樣本間通用。傳統(tǒng)的微衛(wèi)星標記開發(fā)由于工作量的限制,一個微衛(wèi)星標記的邊界序列往往只能被檢測到一次或少數(shù)幾次,不能獲得并避開引物設(shè)計區(qū)的變異堿基,難以保障擴增引物的通用性,易造成數(shù)據(jù)缺失。
按與多重擴增引物的模板序列的左側(cè)序列完全相同的方法,獲得多重擴增引物的模板序列的右側(cè)序列。在表1的假定的微衛(wèi)星標記位點中,多重擴增引物的模板序列的右側(cè)序列為(A)2NNN(A)80。將多重擴增引物的模板序列的左側(cè)序列、多重擴增引物的模板序列的微衛(wèi)星標記和多重擴增引物的模板序列的右側(cè)序列依次連接,得到微衛(wèi)星標記位點的多重擴增引物的模板序列,利用微衛(wèi)星標記位點的多重擴增引物的模板序列,獲得多重擴增引物。表1中的假定的微衛(wèi)星標記位點的多重擴增引物的模板序列為(A)85NNN(A)2(TG)22(A)2NNN(A)80。
按與上述相同的方法與參數(shù),獲得本實施中最終選擇的50個微衛(wèi)星標記位點的多重擴增引物的模板序列。
表1一個假定的微衛(wèi)星標記位點的第一高通量測序片段
表1所示的第一高通量測序片段類型中,帶下劃線的部分代表微衛(wèi)星標記,括號內(nèi)的字母表示微衛(wèi)星標記的重復(fù)單元,括號后的數(shù)字代表重復(fù)單元的重復(fù)次數(shù)。
利用所有微衛(wèi)星標記位點的多重擴增引物的模板序列設(shè)計擴增選擇的微衛(wèi)星標記位點的多重擴增引物。具體方法如下:將獲得的50個微衛(wèi)星標記位點的多重擴增引物的模板序列用100個N連接起來,構(gòu)建成一個人工參考基因組。登錄多重PCR引物在線設(shè)計網(wǎng)頁https://ampliseq.com/,在“Application type”選項選擇“DNA Hotspot designs(single-pool)”。并在“Select the genome you wish to use”選項中選擇“Custom”后,上傳構(gòu)建人工參考基因組。“DNA Type”選項選擇“Standard DNA”。在“Add Hotspot”選項中,填入構(gòu)建的人工參考基因組中每一個微衛(wèi)星標記的起始位置與終止位置,最后點擊“Submit targets”按鈕提交并獲得多重擴增引物的序列。本實施例中,所選擇的50個微衛(wèi)星標記位點中,成功設(shè)計了多重擴增引物的微衛(wèi)星標記位點為48個,這個48個微衛(wèi)星標記位點即為待檢測的微衛(wèi)星標記位點。本實施例采用美國賽默飛世爾公司提供的多重PCR技術(shù),其能夠同時擴增多至12000個測試區(qū)域,因此,本發(fā)明有能力一次性檢測12000個微衛(wèi)星標記位點,這是傳統(tǒng)的微衛(wèi)星標記位點檢測能力的12000倍。
通過多重擴增引物擴增待檢測的微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記,得到擴增產(chǎn)物,將擴增產(chǎn)物進行高通量測序,得到第二高通量測序片段。本實施例中,待檢測的樣本為武漢開發(fā)區(qū)水稻田中取的100株水稻葉片,將100株水稻葉片等量混合后獲得混合樣本,利用植物基因組DNA提取試劑盒(貨號:DP305,生產(chǎn)公司:天根生化科技(北京)有限公司)按其操作手冊提供的方法提取獲得混合樣本的基因組DNA。采用所設(shè)計的48對多重擴增引物和文庫構(gòu)建試劑盒2.0(由美國LifeTechnology公司生產(chǎn),貨號為4475345)并按該試劑盒的操作手冊對混合樣本的基因組DNA進行擴增,構(gòu)建高通量測序文庫,利用獲得的高通量測序文庫和試劑盒Ion PI Template OT2 200Kit v2(美國invirtrigen公司生產(chǎn),貨號為4485146)進行測序前的ePCR(Emulsion PCR,乳化聚合酶鏈反應(yīng))擴增,操作方法按該試劑盒的操作手冊進行,獲得ePCR產(chǎn)物。利用ePCR產(chǎn)物和試劑盒Ion PI Sequencing 200Kit v2(美國invirtrigen公司生產(chǎn),貨號為4485149)在Proton二代高通量測序儀上進行高通量測序,操作方法按該試劑盒的操作手冊進行。在本實施例中,高通量測序量設(shè)置為1M測序片段(1M=100萬),高通量測序長度設(shè)置為500cycle(循環(huán)),測序結(jié)束后,獲得第二高通量測序產(chǎn)物。
通過分析第二高通量測序產(chǎn)物,獲得微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度。具體方法為:去除第二高通量測序片段中的微衛(wèi)星標記后,獲得第二高通量測序片段的左邊界序列和第二高通量測序片段的右邊界序列;利用左邊界序列和右邊界序列將第二高通量測序片段中的每個片段比對到待檢測的微衛(wèi)星標記位點上;截取每一個待檢測的微衛(wèi)星標記位點的第二高通量測序片段中的微衛(wèi)星標記;將獲得的微衛(wèi)星標記按長度進行分類,并計算第i個類別的真實度Ri=Ni/Nmax,其中,Ni為第i個類別的第二高通量測序片段的數(shù)量,Nmax為所有類別的第二高通量測序片段的數(shù)量的最大值;若真實度Ri≥α4,則第i個類別的微衛(wèi)星標記的長度為微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度,若真實度Ri<α4,則第i個類別的微衛(wèi)星標記的長度不為微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度,其中,α4為第四判定閾值。微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的多態(tài)性是由于微衛(wèi)星標記中的簡單重復(fù)序列的重復(fù)次數(shù)不一致造成的長度多態(tài)性,因此,微衛(wèi)星標記位點的檢測主要是指檢測微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度。一般的物種為二倍體,如果樣本是純合的,那么,同一個微衛(wèi)星標記位點內(nèi)應(yīng)該只包含一種微衛(wèi)星標記的等位位點,如果樣本是雜合的,則同一個微衛(wèi)星標記位點有2個不同微衛(wèi)星標記的等位位點。如果樣本是多倍體,如小麥和棉花,則判定標準也應(yīng)該做相應(yīng)調(diào)整。微衛(wèi)星標記位點在進行多重擴增時,微衛(wèi)星標記擴增可能會產(chǎn)生滑動,因此,在第二高通量測序片段中,部分由于滑動產(chǎn)生的微衛(wèi)星標記的長度與混合樣本中的真實的微衛(wèi)星標記的長度不相同,從而形成干擾噪音,真實度Ri可以反應(yīng)了干擾噪音的強弱,Ri值越大,則干擾越小。因此,需要設(shè)定一個真實度的判定閾值α4以確定第i種類別中的微衛(wèi)星標記是否真實存在。在缺乏已有參考資料的情況下且為純合體(一個位點只可能有一種基因型)時,α4一般取值為0.6;若為雜合體時,則可利用0.6/X作為α4的值,其中,X為待檢測物種的倍性水平,例如若為4倍體,則α4的值為0.6/4=0.15。若已知的滑動產(chǎn)生的微衛(wèi)星標記干擾的大小,則可以制定更具體的標準。例如,當已知某個微衛(wèi)星標記位點在100次檢測中,有95次以上的滑動產(chǎn)生的干擾微衛(wèi)星標記的比例均小于0.3,那么,我們可以將α4的取值確定為0.3,那么,我們有95%的置信度保障我們獲得的第i個類別的微衛(wèi)星標記的基因型是真實存在的。值得一提的是,若α4取值較大,則判定微衛(wèi)星標記真實存在時犯錯的概率就較低,但可能將部分真實存在的微衛(wèi)星標記誤判為不存在;相反,若α4取值較小,則更多真實存在的微衛(wèi)星標記將被判斷出來,但判定微衛(wèi)星標記真實存在時犯錯的概率就較高。因此,本實施例中α4的取值只是其中一種方式,需要根據(jù)實際需要或者已有的研究結(jié)果進行調(diào)整。在本實施例子中,因為缺乏參考資料確定α4的值且待測樣本為二倍體,為雜合體,所以,α4取值為0.6/2=0.3。由于滑動產(chǎn)生的虛假的微衛(wèi)星標記與真實的微衛(wèi)星標記的擴增產(chǎn)物長度差異不大,而且傳統(tǒng)的微衛(wèi)星標記的檢測方法多為電泳,無法區(qū)分較小的長度差異,即使能夠區(qū)分,也無法準確定量,因此,傳統(tǒng)的微衛(wèi)星標記檢測時,無法計算或無法準確計算Ri的值,造成大量的不準確甚至錯誤的結(jié)論。
下面再次假定表1為一個檢測到的微衛(wèi)星標記位點,說明如何檢測混合樣本中待檢測的微衛(wèi)星標記位點。在表1中假定的微衛(wèi)星標記位點的第二高通量測序片段中,截取的微衛(wèi)星標記為3條(TG)20、32條(TG)21和5條(TG)22的集合,將截取的微衛(wèi)星標記按重復(fù)單元分類,均為TG,保留出現(xiàn)頻率最高的重復(fù)單元的微衛(wèi)星標記,它們?yōu)?條(TG)20、32條(TG)21和5條(TG)22的集合;將保留下來的微衛(wèi)星標記進一步按長度進行分類,共獲得3個類別,分別為(TG)20、(TG)21和(TG)22。在這3個類別中,占有最多的第二高通量測序片段的數(shù)量的類別為第2個類別(TG)21,即Nmax=N2=32。第1個類別(TG)20占有的第二高通量測序片段的數(shù)量為3條,即N1=3,那么,R1=3/32<α4=0.3,因此,判定第1個類別(TG)20并不是真實存在的,是由滑動引起的。同樣,計算R2=1,R3=5/32,根據(jù)同樣的標準,判定,第2個類別是真實存在的,第3個類別不是真實存在的。因此,混合樣本中待檢測的微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度為類別2的微衛(wèi)星標記的長度,即表1中假定的待檢測的微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度為42bp(TG重復(fù)21次,因此其長度為21×2bp=42bp)。
按與上述假定的實施例中相同的方法和參數(shù)再次進行檢測,成功檢測了本實施例中,48個待檢測的微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度。
本發(fā)明實施例提供的微衛(wèi)星標記位點的開發(fā)方法與檢測方法快捷、簡單、全面、準確。傳統(tǒng)的微衛(wèi)星標記位點的開發(fā)方法,由于工作量大,只能發(fā)現(xiàn)基因組中大約1%左右的微衛(wèi)星標記位點,也只能在小于100個樣本中驗證微衛(wèi)星標記位點的多態(tài)性。對于本發(fā)明來說,理論上可以發(fā)現(xiàn)基因組上所有微衛(wèi)星標記位點,針對水稻的微衛(wèi)星開發(fā)的實施例中,發(fā)現(xiàn)了1萬多個微衛(wèi)星標記位點,大致為水稻所有微衛(wèi)星標記位點的50%,因此,在微衛(wèi)星標記位點的發(fā)現(xiàn)能力上,提高了50倍,如果增加高通量的測序量(這是很容易辦到的),則可以將微衛(wèi)星標記位點的發(fā)現(xiàn)能力提高到80倍甚至接近100倍,都是比較容易實現(xiàn)的。本發(fā)明實施例是將微衛(wèi)星標記位點的開發(fā)(發(fā)現(xiàn))與多態(tài)性檢測合二為一,并沒有付出額外的工作,但對于傳統(tǒng)的微衛(wèi)星標記位點的多態(tài)性檢測工作來說,是耗時且難以實現(xiàn)的,如在21個水稻品種中檢測12322個微衛(wèi)星標記位點的多態(tài)性,相當于傳統(tǒng)的檢測中做了21*12322=258762次PCR擴增與電泳,這個工作量是不可想象的。除此之外,傳統(tǒng)的微衛(wèi)星標記位點的開發(fā)技術(shù)由于工作量大,沒有能力檢測同一個微衛(wèi)星標記位點的多個序列,所以,不能分析多重擴增引物的保守性,導(dǎo)致開發(fā)出來的微衛(wèi)星標記的多重擴增引物的通用性差,而本發(fā)明實施例解決了這一問題。以本發(fā)明的水稻微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度的檢測方法中一次檢測了48個微衛(wèi)星標記位點為例,對于傳統(tǒng)的檢測方法來說,則需要48次PCR擴增和電泳。對于本發(fā)明來說,即使是檢測1萬個微衛(wèi)星標記位點,其工作量也不會增加,但對于傳統(tǒng)的檢測方法來說,工作量則增加了1萬倍。傳統(tǒng)的檢測方法是通過電泳判定微衛(wèi)星標記的長度,但電泳是存在誤差的,因此,需要參照品種進行對比,從而增加了檢測的工作量,而且,很少有實驗室能夠有一套完整的參照品種,而本發(fā)明實施例采用的是高通量測序,獲得的是堿基序列,由于所得結(jié)果是絕對值,所以沒有誤差,因此,不再需要參照品種。此外,電泳檢測無法分辨不同單株,比如,本發(fā)明在水稻檢測中的樣本是100個單株的混合,在電泳結(jié)果中,無法準確計算同一個微衛(wèi)星標記位點的不同微衛(wèi)星標記的比例,因此,無法分辨單株,從而無法計算雜株率等重要指標。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
序列表
<110> 江漢大學(xué)
<120> 水稻微衛(wèi)星標記位點開發(fā)方法與微衛(wèi)星標記位點內(nèi)的微衛(wèi)星標記的長度檢測方法
<160>12
<170>PatentIn version 3.4
<210> 1
<211>24
<212>DNA
<213>人工序列
<400> 1
ctctctctct ctctctctct ctct 24
<210> 2
<211>24
<212>DNA
<213>人工序列
<400> 2
gagagagaga gagagagaga gaga 24
<210> 3
<211>24
<212>DNA
<213>人工序列
<400> 3
tgtgtgtgtg tgtgtgtgtg tgtg 24
<210> 4
<211>24
<212>DNA
<213>人工序列
<400> 4
acacacacac acacacacac acac 24
<210> 5
<211>24
<212>DNA
<213>人工序列
<400> 5
tatatatata tatatatata tata 24
<210> 6
<211>24
<212>DNA
<213>人工序列
<400> 6
tgttgttgtt gttgttgttg ttgt 24
<210> 7
<211>24
<212>DNA
<213>人工序列
<400> 7
ccaccaccac caccaccacc acca 24
<210> 8
<211>24
<212>DNA
<213>人工序列
<400> 8
atcatcatca tcatcatcat catc 24
<210> 9
<211>24
<212>DNA
<213>人工序列
<400> 9
cctcctcctc ctcctcctcc tcct 24
<210> 10
<211>24
<212>DNA
<213>人工序列
<400> 10
agaagaagaa gaagaagaag aaga 24
<210> 11
<211>24
<212>DNA
<213>人工序列
<400> 11
atgatgatga tgatgatgat gatg 24
<210> 12
<211>24
<212>DNA
<213>人工序列
<400> 12
caacaacaac aacaacaaca acaa 24