專利名稱:一種與玉米gpat基因連鎖的snp位點(diǎn)及其應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種玉米油份含量相關(guān)的SNP位點(diǎn)的應(yīng)用,屬于玉米育種和分子生物學(xué)領(lǐng)域。
背景技術(shù):
玉米油份的品質(zhì)育種主要包括含油量的選擇和油品質(zhì)的改良。通常,玉米油主要以三酰甘油(TAG)的形式儲(chǔ)存于玉米籽粒的油體中。普通玉米的脂肪酸成分一般為11%的軟脂酸(16:0)、2%的硬脂酸(18:0)、24. 1%的油酸(18:1)、61. 9 %的亞油酸(18:2)、
O.7%的亞麻酸以及含量不到I %的月桂酸(12:1)、豆蘧酸(14:1)、棕櫚油酸(16:1)、花生酸(20:1)、三崳酸(22:1)、芥子酸(22:2)、甘四烷酸(24:1)(周洪生,2002 ;Lambert,2001)。玉米油中最具有商品價(jià)值的飽和脂肪酸和不飽和脂肪酸分別為軟脂酸(16:0)、硬 脂酸(18:0)和油酸(18:1)、亞油酸(18:2)和亞麻酸(18:3),而決定玉米油質(zhì)量的因素主要為亞油酸的含量以及油酸與亞油酸的比值。玉米含油量是由多基因控制的數(shù)量性狀,具有較高的遺傳力。玉米含油量的廣義遺傳力一般為O. 74 O. 98,而軟脂酸、硬脂酸、油酸、亞油酸、亞麻酸的廣義遺傳力分別為O. 39,0. 72,0. 85,0. 83,0. 67 (Alrefai et al,1995)。在玉米含油量的遺傳方差中,加性方差是主要方差(劉仁東,1992 ;Miller et al,1981;Moreno-Gonzalez etal,1975)。與玉米含油量相關(guān)的基因有大胚面基因、含油量基因、不同脂肪酸含量基因等。最早的研究表明玉米籽粒含油量由20 40個(gè)基因控制(Winter,1929 ;Student, 1933,1934 ;Sprague et al, 1948) oDudley和Lambert (1992)利用 IHO不同世代的品系,估計(jì)在選擇28輪、76輪、90輪,控制含油量的位點(diǎn)分別為33、20 40、60個(gè)。而最近的玉米含油量QTL研究表明控制玉米含油量大約有50個(gè)座位(Laurie et al,2004 ;Clark etal, 2006)。Poneleit和Alexander (1965)認(rèn)為高油玉米的亞油酸和油酸的比率由Iinoleicacidl (Inl)基因控制,并于1976年利用常規(guī)的方法將此基因定位在第6染色體的長臂上。Alrefai等(1995)用QTL的方法驗(yàn)證了這個(gè)結(jié)果。但de la Roche等(1971)認(rèn)為控制油酸與亞油酸含量的基因座位多于2個(gè)位點(diǎn)。Plewa (1975),Shadley (1980),Widstrom和Jullum(1984)將與油酸/亞油酸有關(guān)的基因分別定位在2L、4L、1S、5L。脂肪酸的生物合成途徑是乙酰輔酶A—月桂酸一十四酸一軟脂酸一硬脂酸一油酸一亞油酸(Ohlrogge, 1995,1997 ;Buchanan, 2002)。由此可見,在油酸和亞油酸之間、飽和和不飽和脂肪酸之間存在著相互轉(zhuǎn)化關(guān)系。Poneleit和Alexander (1965)的研究表明,軟脂酸、油酸和亞油酸的轉(zhuǎn)化是由高亞油酸單基因控制的。Widstrom等(1975)證明,油酸和軟脂酸含量的不同是由單基因控制的,而決定亞油酸含量的基因?yàn)閮蓚€(gè)或多個(gè),一個(gè)呈部分顯性,另一個(gè)為隱性。Wright等(1995)把EMS誘變B73得到的高油單隱性突變體Olcl定位在第一染色體的長臂上。近年來,隨著模式植物全基因組測序的完成,植物基因組學(xué)的研究已經(jīng)呈現(xiàn)出由簡單質(zhì)量性狀向復(fù)雜的數(shù)量性狀轉(zhuǎn)移的趨勢,特別是大量SNP標(biāo)記的開發(fā)以及生物信息學(xué)的迅猛發(fā)展,應(yīng)用關(guān)聯(lián)分析方法發(fā)掘植物數(shù)量性狀基因已成為目前國際植物基因組學(xué)研究的熱點(diǎn)之一。關(guān)聯(lián)分析(Association Analysis),又稱連鎖不平衡作圖(LDMapping)或關(guān)聯(lián)作圖(Association Mapping),是一種以連鎖不平衡為基礎(chǔ)鑒定某一群體內(nèi)目標(biāo)性狀與遺傳標(biāo)記或候選基因關(guān)系的分析方法(Flint-Garcia et al,2003)。跟連鎖分析相比,關(guān)聯(lián)分析具有以下優(yōu)點(diǎn)(I)連鎖分析需要構(gòu)建基于兩親本雜交的Fl衍生群體(F2、BC、RIL等),關(guān)聯(lián)分析可用現(xiàn)有的群體,大大縮短研究年限;(2)連鎖分析每次只能分析同一位點(diǎn)的2個(gè)等位基因,關(guān)聯(lián)分析可以同時(shí)分析同一位點(diǎn)的多個(gè)等位基因;(3)連鎖分析所用的群體小,加上群體來自兩親本,在群體內(nèi)發(fā)生的重組次數(shù)少,這樣往往導(dǎo)致連鎖作圖的精度低,例如玉米的作圖精度一般為10 30cM(Salvi,2005 ;Flint_Garcia,2005,而關(guān)聯(lián)分析的精度可大大提高,例如玉米自交系的精度為1500bp,達(dá)到單基因水平(Remington,2001)??傊P(guān)聯(lián)分析數(shù)量性狀的剖分在精度和研究時(shí)間上是優(yōu)于連鎖分析的
發(fā)明內(nèi)容
本發(fā)明的目的之一是通過以下技術(shù)方案來實(shí)現(xiàn)的AM508群體由473個(gè)普通玉米自交系和35個(gè)高油玉米自交系組成(所述的群體材料,均為常見的玉米市售材料,可通過常規(guī)商業(yè)渠道購買得到)。候選基因重測序材料155份我國骨干自交系材料。從授粉15天后的AM508份自交系中隨機(jī)選擇368份自交系,構(gòu)建200bp大小插入片段文庫,采用90bp末端配對的RNA測序技術(shù)進(jìn)行轉(zhuǎn)錄組測序。每個(gè)個(gè)體的reads數(shù)為73. 8±0. 7百萬堿基,共產(chǎn)生了 2445. 9Gb的原始數(shù)據(jù)。全基因關(guān)聯(lián)分析以AM508群體為材料,利用IlluminaMaizeSNP50BeadChip對56,110個(gè)位點(diǎn)進(jìn)行了基因型檢測。從授粉15天后的508份材料中隨機(jī)選擇的368份材料則構(gòu)建200bp大小插入片段文庫,采用90bp末端配對的RNA測序技術(shù)進(jìn)行轉(zhuǎn)錄組測序,每個(gè)個(gè)體的reads數(shù)為73. 8±0. 7百萬堿基,共產(chǎn)生了 2445. 9Gb的原始序列。使用高質(zhì)量的SNP,分別對這兩個(gè)群體采用線性混合模型校正群體層化效應(yīng)和親緣關(guān)系后與油脂相關(guān)性狀進(jìn)行了高密度標(biāo)記的全基因組關(guān)聯(lián)分析。為了綜合這兩個(gè)群體的結(jié)果,本研究研究使用了統(tǒng)一的閾值篩選顯著性的位點(diǎn)(建議水平顯著性閾值為1/N =
I.78X10-6以及5%基因組顯著性閾值為0. 05/N = 8. 94X10-8)。為了在較多的顯著關(guān)聯(lián)信號中鑒定到唯一可能的因果突變基因,計(jì)算同一染色體上的顯著性信號位點(diǎn)間兩兩的連鎖不平衡,過濾掉r2小于0. 02的標(biāo)記。在定位到的單一的顯著性信號中。利用368份材料關(guān)聯(lián)分析結(jié)果發(fā)現(xiàn),位于玉米基因組chr3. S_178136002的SNP位點(diǎn),突變?yōu)镚/C,其中G為主要等位基因,C為最小等位基因,最小等位基因頻率為0. 06,該位點(diǎn)與玉米油分含量顯著關(guān)聯(lián)該位點(diǎn)與玉米功能候選基因(GPAT)緊密連鎖。
具體實(shí)施例方式AM508群體由473個(gè)普通玉米自交系和35個(gè)高油玉米自交系組成,已在參考文獻(xiàn) Yang, X. H. et al. Characterization of a global germplasmcoI lection and itspotential utilization for analysis of complex quantitativetraits in maize. Mol.Breeding 121,417-431 公開過。 候選基因重測序材料155份我國骨干自交系材料,已在參考文獻(xiàn)Yang,X. H. et al.Genetic analysis and characterization of a new maizeassociationmapping panel for quantitative trait loci dissection. Theor. Appl. Genet. 121,417-431 (2010a).公開過。轉(zhuǎn)錄組測序材料從授粉15天后的AM508份自交系中隨機(jī)選擇368份自交系,構(gòu)建200bp大小插入片段文庫,采用90bp末端配對的RNA測序技術(shù)進(jìn)行轉(zhuǎn)錄組測序。每個(gè)個(gè)體的reads數(shù)為73. 8±0. 7百萬堿基,共產(chǎn)生了 2445. 9Gb的原始數(shù)據(jù)。表型變異AM508群體包含508個(gè)自交系(其中包括35個(gè)高油品系)油含量相關(guān)的變異豐富,軟脂肪酸含量差異2. 3倍,硬脂肪酸含量差異達(dá)8倍。軟脂肪酸(16: 0,15. 7% )、硬脂肪酸(18:0,2. 1%)、油酸(18:1,28.0%)、亞麻油酸(18:2,51. 2% )和亞麻酸(18:3,1.4%)這五種脂肪酸占98. 4%的油含量。4個(gè)環(huán)境聯(lián)合檢測發(fā)現(xiàn)十個(gè)油份相關(guān)性狀的遺傳力均在90%以上。全基因關(guān)聯(lián)分析 以AM508 群體為材料,利用 Illumina MaizeSNP50BeadChip 對 56,110 個(gè)位點(diǎn)進(jìn)行了基因型檢測。從授粉15天后的508份材料中隨機(jī)選擇的368份材料則構(gòu)建200bp大小插入片段文庫,采用90bp末端配對的RNA測序技術(shù)進(jìn)行轉(zhuǎn)錄組測序,每個(gè)個(gè)體的reads數(shù)為73. 8±0. 7百萬堿基,共產(chǎn)生了 2445. 9Gb的原始序列。研究使用了 106萬個(gè)高質(zhì)量的SNP,分別對這兩個(gè)群體采用線性混合模型校正群體層化效應(yīng)和親緣關(guān)系后與油脂相關(guān)性狀進(jìn)行了高密度標(biāo)記的全基因組關(guān)聯(lián)分析。為了綜合這兩個(gè)群體的結(jié)果,本研究研究使用了統(tǒng)一的閾值篩選顯著性的位點(diǎn)(建議水平顯著性閾值為1/N= I. 78X10-6以及5%基因組顯著性閾值為0. 05/N = 8. 94Χ1(Γ8)。為了在較多的顯著關(guān)聯(lián)信號中鑒定到唯一可能的因果突變基因,計(jì)算同一染色體上的顯著性信號位點(diǎn)間兩兩的連鎖不平衡,過濾掉r2小于O. 02的標(biāo)記。在定位到的單一的顯著性信號中,有若干個(gè)位點(diǎn)位于或者臨近于(50Kb)被前人證實(shí)報(bào)道過的已知基因內(nèi),它們在本研究中再次得到了驗(yàn)證。與已知的油脂代謝相關(guān)基因較遠(yuǎn)的關(guān)聯(lián)位點(diǎn)很可能是與油脂代謝相關(guān)基因緊密連鎖,則距離最近的油脂代謝基因很可能就是本研究的候選基因。利用368份材料關(guān)聯(lián)分析結(jié)果發(fā)現(xiàn),位于玉米基因組chr3. S_178136002的SNP位點(diǎn),突變?yōu)镚/C,其中G為主要等位基因,C為最小等位基因,最小等位基因頻率為O. 06,該SNP位點(diǎn)解釋了 7. 08%的表型變異,該位點(diǎn)與玉米油分含量顯著關(guān)聯(lián)該位點(diǎn)與玉米功能候選基因(GPAT)緊密連鎖。連鎖分析群體利用3個(gè)群體進(jìn)行連鎖分析,高油玉米自交系By804與普通玉米自交系B73衍生的重組自交系,可參考文獻(xiàn)Yang, X. H. et al. Major and minor QTLand epistasis contribute to fatty aci(!compositions and oil concentration inhigh-oil maize. Theor. Appl. Genet. 120,665-678 (2010c) ;K22 與單 340 及 K22 與 C17 組配的F2群體于2009年在北京種植,自交獲得F3群體。分別獲得包含237個(gè)家系的K22/單340F2:3群體和218個(gè)家系的K22/C17F2:3群體,進(jìn)行表型鑒定。這兩個(gè)F2:3群體種植于海南的三亞和湖北的武漢獲得F2:4群體。利用包含1536個(gè)SNP標(biāo)記的GoldenGate芯片(Illumina,San Diego, CA,USA)對家系及其親本進(jìn)行基因型鑒定??蓞⒖嘉墨I(xiàn)Yan,J.B.et al. High-throughput SNP genotyping with the GoldenGate assay in maize. Molbreeding 25,441-451 (2010)。利用Mapmaker3. 0軟件構(gòu)建連鎖圖,米用復(fù)合區(qū)間作圖法進(jìn)行QTL定位。表型變異AM508群體包含508個(gè)自交系(其中包括35個(gè)高油品系)油含量相關(guān)的變異豐富,軟脂肪酸含量差異2. 3倍,硬脂肪酸含量差異達(dá)8倍。軟脂肪酸(16: 0,15. 7% )、硬脂肪酸(18:0,2. 1%)、油酸(18:1,28.0%)、亞麻油酸(18:2,51. 2% )和亞麻酸(18:3,1.4%)這五種脂肪酸占98. 4%的油含量。關(guān)聯(lián)分析結(jié)果與連鎖分析結(jié)果具有高度一致性。連鎖分析結(jié)果如下
.表型貢
一T 群體.性加性效顯性效二 i·
候選基因色置信區(qū)間(Mb)a^ dk F-Fr獻(xiàn)率
__ (%)
I油-__
GRMZM2G08312 份
3 169.2-176.4-187.9A -0.01 0.22 9.20
95(BJ)含
3 量
176.3-176.4-196.4/176.3-10.20/0. 0.09/0. 5.16/4.
(BJ,
76.4-187.01018 54
_WH)_a候選基因所在的QTL的置信區(qū)間在B73參考基因組(V2 5b. 60)上的物理位置。b 群體 1、2、3 代表 By804/B73 的 RIL 群體,k22/ 單 340 群體和 C17/K22 群體。
權(quán)利要求
1.一種與玉米GPAT基因連鎖的SNP位點(diǎn),其特征在于,所述的SNP位點(diǎn)與玉米油份含量相關(guān),與玉米甘油-3-磷酸酰基轉(zhuǎn)移酶(GPAT)基因緊密連鎖,位于玉米參考基因組(ymimaizesequence. org, 5a. 60 版)chr3. S_178136002 上,該位點(diǎn)突變?yōu)?G/C。
2.如權(quán)利要求所述的SNP位點(diǎn)的應(yīng)用,包括以下步驟 a)由473個(gè)普通玉米自交系和35個(gè)高油玉米自交系組成AM508群體; b)從授粉15天后的AM508份自交系中隨機(jī)選擇368份自交系,構(gòu)建200bp大小插入片段文庫,采用90bp末端配對的RNA測序技術(shù)進(jìn)行轉(zhuǎn)錄組測序; c)利用3個(gè)群體進(jìn)行連鎖分析高油玉米自交系By804與普通玉米自交系B73衍生的重組自交系,利用包含1536個(gè)SNP標(biāo)記的GoldenGate芯片對家系及其親本進(jìn)行基因型鑒定,利用Mapmaker3. O軟件構(gòu)建連鎖圖,采用復(fù)合區(qū)間作圖法進(jìn)行QTL定位; d)結(jié)合F2、F2:3兩個(gè)世代群體油份含量的測定結(jié)果,利用軟件QTLcartographer V2. 5,采用復(fù)合區(qū)間作圖法篩選與油份含量緊密連鎖的QTL位點(diǎn);篩選到在F2和F2:3兩個(gè)世代均能穩(wěn)定表達(dá)的油份含量主效QTL。
3.如權(quán)利要求I或2所述的玉米油份含量相關(guān)的SNP位點(diǎn)在玉米育種的應(yīng)用。
全文摘要
本發(fā)明涉及一種與玉米GPAT基因連鎖的SNP位點(diǎn)及其應(yīng)用,屬于植物分子育種領(lǐng)域,該SNP位點(diǎn)位于玉米參考基因組(www.maizesequence.org,5a.60版)chr3.S_178136002,該位點(diǎn)與玉米GPAT基因(GRMZM2G083195)緊密連鎖,并且與玉米油份含量顯著相關(guān)。可將該分子標(biāo)記用于玉米品種或品系的基因型檢測,以判斷該品種或品系油份含量的大小。本發(fā)明分子標(biāo)記,可以應(yīng)用于不同遺傳背景下的高油玉米育種,可以用于玉米遺傳改良;該方法和標(biāo)記在玉米育種領(lǐng)域具有廣闊的應(yīng)用前景。
文檔編號A01H1/04GK102899324SQ20121044468
公開日2013年1月30日 申請日期2012年11月9日 優(yōu)先權(quán)日2012年11月9日
發(fā)明者嚴(yán)建兵, 楊小紅, 李建生, 李慧 申請人:華中農(nóng)業(yè)大學(xué)