橫軸為SNP標(biāo)記數(shù)目,縱軸為抽樣值與標(biāo)準(zhǔn)值的差異均值,線條為趨勢線。
[0036]圖2為利用137份代表性品種重測序數(shù)據(jù)評價(jià)不同DNA身份鑒定方法的效果。上方 三角形深灰色點(diǎn)為以約5000SNP為數(shù)據(jù)集,按區(qū)段差異計(jì)算兩兩之前的遺傳距離;中間圓形 淺灰色點(diǎn)為以約5000SNP為數(shù)據(jù)集,按差異SNP數(shù)目計(jì)算兩兩品種之間的遺傳距離;下方深 灰色菱形點(diǎn)為以測序所得所有SNP為數(shù)據(jù)集,按SNP數(shù)目差異計(jì)算兩兩品種之間的遺傳距 離;直線和公式為線性模擬的結(jié)果。
[0037]圖3為利用5000份水稻品種SNP標(biāo)記計(jì)算LD均值衰減曲線。橫軸為染色體上物理距 離,縱軸為R2值,灰色線條為模擬曲線。
[0038]圖4為利用不同方法鑒定水稻品種"龍粳31"和"空育131"DNA身份比較圖。其中A為 利用常規(guī)遺傳相似度進(jìn)行鑒定,黑色線條表示兩品種差異SNP標(biāo)記位置;B為利用本申請基 因組相似度進(jìn)行鑒定,黑色區(qū)域表示兩品種差異區(qū)段。圖中方框依次表示水稻12條染色體, 縱坐標(biāo)數(shù)字為水稻基因組上的物理位置。
[0039]圖5為水稻品種"93-11"和"安選6號"種子表型差異比對圖。A為有芒品種"93-11", B為無芒品種"安選6號"。
[0040] 圖6為水稻品種"93-11"和"安選6號"標(biāo)準(zhǔn)基因指紋差異圖。黑色區(qū)域表示"9311" 和"安選6號"差異區(qū)段;方框依次表示水稻12條染色體,縱坐標(biāo)數(shù)字為水稻基因組上的物理 位置。
【具體實(shí)施方式】
[0041] 提供以下定義和方法用以更好地界定本申請以及在本申請實(shí)踐中指導(dǎo)本領(lǐng)域普 通技術(shù)人員。除非另作說明,術(shù)語按照相關(guān)領(lǐng)域普通技術(shù)人員的常規(guī)用法理解。本文所引用 的所有專利文獻(xiàn)、學(xué)術(shù)論文、行業(yè)標(biāo)準(zhǔn)及其他公開出版物等,其中的全部內(nèi)容整體并入本文 作為參考。
[0042] 如本文所用"遺傳多態(tài)性分子標(biāo)記",是指可遺傳且可檢測的能反映生物個(gè)體或種 群間基因組中某種差異的特異性DNA片段。在本申請的方法中,優(yōu)選使用SNP分子標(biāo)記。
[0043] 如本文所用"標(biāo)準(zhǔn)基因指紋數(shù)據(jù)",是指利用篩選出的能夠充分反映品種間基因組 變異(水稻品種遺傳多樣性)并且均勻分布于全基因組的一組代表性分子標(biāo)記,檢測水稻品 種的全基因組中這些分子標(biāo)記的基因型,由此獲得該水稻品種的標(biāo)準(zhǔn)基因指紋數(shù)據(jù),其能 夠代表該水稻品種的整體特性。
[0044] 可將這些不同水稻品種的標(biāo)準(zhǔn)基因指紋數(shù)據(jù)構(gòu)建成水稻品種標(biāo)準(zhǔn)基因指紋數(shù)據(jù) 庫。例如,水稻品種標(biāo)準(zhǔn)基因指紋數(shù)據(jù)庫的構(gòu)建包括以下步驟:
[0045] (1)水稻遺傳多樣性標(biāo)記初步篩選。利用公共數(shù)據(jù)庫的水稻品種重測序數(shù)據(jù)或自 行收集水稻品種進(jìn)行重測序,利用這些數(shù)據(jù)篩選一組能夠反映水稻品種遺傳多樣性的分布 于全基因組的一組標(biāo)記。水稻基因組大小約400Mb,如果平均每Mb 10個(gè)標(biāo)記,大約需要4000 個(gè)標(biāo)記,實(shí)際操作時(shí)推薦3000-6000個(gè)標(biāo)記,優(yōu)選4000-5000個(gè)標(biāo)記。
[0046] (2)水稻遺傳多樣性標(biāo)記確定。篩選出來的遺傳多樣性標(biāo)記需要經(jīng)過測試以確定 標(biāo)記質(zhì)量和代表性,經(jīng)過測試之后確定一組高質(zhì)量標(biāo)記作為標(biāo)準(zhǔn)基因指紋構(gòu)建的標(biāo)記。由 于標(biāo)記數(shù)目較多,整體測試時(shí)選擇芯片或測序等高通量檢測平臺。由于測序具有隨機(jī)性,推 薦使用標(biāo)記相對穩(wěn)定的SNP芯片檢測平臺。
[0047] (3)水稻品種標(biāo)準(zhǔn)基因指紋的獲取。利用選定的檢測平臺對水稻品種進(jìn)行檢測以 獲得遺傳多樣性標(biāo)記的基因型,所有標(biāo)記的基因型組合構(gòu)成了該品種的標(biāo)準(zhǔn)基因指紋。
[0048] (4)水稻品種標(biāo)準(zhǔn)基因指紋數(shù)據(jù)庫的構(gòu)建。將水稻品種的標(biāo)準(zhǔn)基因指紋數(shù)據(jù)存儲 構(gòu)建數(shù)據(jù)庫。將數(shù)據(jù)導(dǎo)入至MySQL/Oracle或其他類型關(guān)系型數(shù)據(jù)庫。該數(shù)據(jù)庫具有查詢、比 對等基本功能。
[0049]如本文所用"特征基因指紋數(shù)據(jù)",是指利用篩選出的能夠反映品種特征特性的一 組或多組特征分子標(biāo)記,檢測特定水稻品種中這些分子標(biāo)記的基因型,由此獲得該水稻品 種的特征基因指紋數(shù)據(jù)。品種特征基因指紋是標(biāo)準(zhǔn)基因指紋的補(bǔ)充,僅針對特定的品種和 特定的需求。
[0050] 構(gòu)建品種特征基因指紋關(guān)鍵是要獲得品種特征分子標(biāo)記,其有以下兩個(gè)來源:
[0051] (1)基于標(biāo)準(zhǔn)指紋中的特征區(qū)段。利用標(biāo)準(zhǔn)基因指紋進(jìn)行檢測和判斷時(shí),如果發(fā)現(xiàn) 待測樣品與已知品種的基因組相似度介于95~100%之間,但通過表型鑒定(如DUS測試)明 顯為不同品種的,可以在標(biāo)準(zhǔn)基因指紋的差異區(qū)段內(nèi)開發(fā)特征標(biāo)記,或者直接選擇差異區(qū) 段內(nèi)的多態(tài)性標(biāo)記作為特征分子標(biāo)記。
[0052] (2)由育種家、品種持有者或者經(jīng)資質(zhì)認(rèn)證的機(jī)構(gòu)提供。為了將待測品種與已知近 似品種區(qū)分,或者為了更好地保護(hù)某特定品種,可以由育種家或者代理機(jī)構(gòu)提供特征分子 標(biāo)記,但所提供的特征分子標(biāo)記獲得的特征基因指紋不能與其他已知近似品種相同。
[0053]以下幾類標(biāo)記可以作為品種特征分子標(biāo)記,但不限于以下幾類:
[0054] (1)基因功能分子標(biāo)記
[0055] 基因功能標(biāo)記來源于功能基因內(nèi)部直接引起表型性狀變異的多態(tài)性基因序列,它 與目標(biāo)基因共分離。實(shí)際上,水稻全基因組育種芯片Rice6K上已經(jīng)包含有基因功能標(biāo)記,如 株高基因 Sd-Ι、粒長基因 GS3、粒寬基因 GW5、香味基因 fgr等等。
[0056] 同樣也可以針對單個(gè)基因功能標(biāo)記開發(fā)單位點(diǎn)檢測平臺標(biāo)記,如KASP標(biāo)記。例如, 根據(jù)文獻(xiàn)報(bào)道,溫敏核不育基因 tms5是目前兩系雜交稻親本不育系中的主效不育基因,而 產(chǎn)生溫敏雄性不育的原因是該基因71位堿基發(fā)生了由C到A的突變,造成提前終止(Zhou等, RNase Z(S1)processes UbL40mRNAs and controls thermosensitive genic male sterility in rice.Nat Commun.2014,5:4884·);針對該功能位點(diǎn)設(shè)計(jì)KASP標(biāo)記,檢測該 基因就能判斷是否是兩系雜交稻或兩系不育系。
[0057] (2)基因單倍型標(biāo)記
[0058]水稻中很多重要農(nóng)藝性狀相關(guān)基因都并非單拷貝,例如絕大多數(shù)抗稻瘟病基因都 屬于NBS-LRR類基因家族。對于這類基因,難以特異性擴(kuò)增或設(shè)計(jì)DNA探針雜交。對于此類基 因區(qū)段,可提供基因上下游一定范圍(如:上下游各200kb)內(nèi)申請品種與疑似品種的多態(tài)性 標(biāo)記,組合成基因區(qū)段單倍型標(biāo)記,以此證明申請品種與疑似品種確實(shí)有差異。
[0059] (3)基因區(qū)段重組標(biāo)記
[0060] 雜交育種本身就是基因重組和選擇的過程,而基因重組是隨機(jī)的,利用基因組區(qū) 段重組標(biāo)記作為特征分子標(biāo)記有明顯優(yōu)勢。在利用分子標(biāo)記輔助育種導(dǎo)入特定目標(biāo)基因 時(shí),在基因兩側(cè)供體親本和受體親本基因組會產(chǎn)生重組,在重組斷點(diǎn)附近可以開發(fā)重組標(biāo) 記。由于基因重組是隨機(jī)的,所以理論上講任何一個(gè)重組斷點(diǎn)都是不同的,即特異性很高。 [0061 ] (4)親本特異遺傳標(biāo)記
[0062]親本特異遺傳標(biāo)記是指從品種標(biāo)準(zhǔn)基因指紋檢測的一組遺傳多樣標(biāo)記中篩選出 來的反映該親本特異性的一組標(biāo)記,或者在標(biāo)準(zhǔn)基因指紋檢測出的差異區(qū)段內(nèi)開發(fā)的一組 特異標(biāo)記,例如實(shí)施例5。
[0063] (5)其他標(biāo)記
[0064] 其他能夠反映品種特殊性的標(biāo)記,如轉(zhuǎn)基因品種的插入位點(diǎn)附近標(biāo)記和轉(zhuǎn)入的目 標(biāo)基因上的標(biāo)記,利用輻射誘變品種與突變表型對應(yīng)的突變位點(diǎn)上的標(biāo)記等。
[0065] 《水稻品種鑒定技術(shù)規(guī)程SSR標(biāo)記法》(標(biāo)準(zhǔn)號NY/T 1433-2014)利用差異SSR標(biāo)記 數(shù)目來判斷品種間一致性,《水稻品種鑒定SNP標(biāo)記法》(標(biāo)準(zhǔn)號NY/T 2745-2015)利用遺傳 相似度來判斷品種間一致性,其計(jì)算公示反映的是相同等位基因數(shù)占總的等位基因數(shù)的比 例。而本申請用"基因組相似度"代替現(xiàn)有的以相同標(biāo)記數(shù)目或比例來判斷品種的身份差 異。
[0066] 如本文所用"基因組相似度",是指相同基因型區(qū)段數(shù)占全基因組總區(qū)段數(shù)的百分 比,利用公式(1)計(jì)算基因組相似度:
[0067] GI = (l-x/n)X100% 公式(1)
[0068] 其中GI為基因組相似度(Genome Identify),x為差異基因組區(qū)段數(shù)目,η為全基因 組總區(qū)段數(shù)目。
[0069]如本文所用"遺傳多樣性分子標(biāo)記的基因型檢出存在差異",指經(jīng)過實(shí)驗(yàn)測試驗(yàn)證 具有基因分型效果好的遺傳多樣性分子標(biāo)記(即高質(zhì)量位點(diǎn))能夠檢測出差異。在本申請的 方法中,每個(gè)區(qū)段內(nèi)至少一個(gè)(即2 1個(gè))高質(zhì)量位點(diǎn)差異檢出,則認(rèn)為該區(qū)段間存在差異。
[0070] 如本文所用"水稻全基因組育種芯片Rice6K",是本申請人在中國專利申請 CN102747138A中公開的水稻全基因組育種芯片,其是目前應(yīng)用最為廣泛的水稻全基因組育 種芯片,具有檢測速度快、精度高、通量大、價(jià)格低的特點(diǎn),目前已大規(guī)模用于水稻種質(zhì)資源 分子標(biāo)記指紋分析、種子真實(shí)性檢測、種子純合度檢測、雜交后代基因分型等方向。
[0071] 如本文所用"水稻全基因組育種芯片Rice60K"是本申請人在PCT申請W0/2014/ 121419中公開的水稻全基因組育種芯片。
[0072] 以下實(shí)施例僅用于說明而非限制本申請范圍的目的。若未特別指明,實(shí)施例均按 照常規(guī)實(shí)驗(yàn)條件,如Sambrook等分子克隆實(shí)驗(yàn)手冊(Sambrook J&Russe 11 DW,Molecular cloning:a laboratory manual ,2001),或按照制造廠商說明書建議的條件。
[0073] 本申請中所使用的水稻品種材料信息均可參見中國水稻品種及其系譜數(shù)據(jù)庫 (http://www.ricedata.cn/variety/index.htm)。
[0074] 本申請中所提到的水稻基因組物理位置均參照水稻日本晴基因組MSU/TIGR注釋 第6.1版(http:// rice.plantbiology.msu.edu/)〇
[0075] 實(shí)施例1水稻品種標(biāo)準(zhǔn)基因指紋檢測參數(shù)確定
[0076] 1.SNP標(biāo)記數(shù)目
[0077] 一方面,SNP標(biāo)記數(shù)目越多,區(qū)分品種間DNA差異的分辨率越高;另一方面,SNP標(biāo)記 數(shù)目越多,檢測和分析成本越高。
[0078]為了確定能滿足品種間的DNA差異鑒定的最適標(biāo)記數(shù)目,在本實(shí)施例中,利用來自 于全球195份微核心種質(zhì)資源的水稻全基因組育種芯片Rice60K檢測數(shù)據(jù)進(jìn)行分析(Chen 等,A high-density SNP genotyping array for rice biology and molecular breeding.Mol Plant.2014,7:541-553)〇
[0079] 水稻全基因組育種芯片Rice60K芯片上共有高質(zhì)量SNP位點(diǎn)約4.4萬個(gè),從中隨機(jī) 抽樣1000~30000位點(diǎn)進(jìn)行檢測,計(jì)算兩兩品種的遺傳距離,為抽樣值;以4.4萬SNP標(biāo)記檢 測結(jié)果計(jì)算兩兩品種的遺傳距離為標(biāo)準(zhǔn)值。比較抽樣值與標(biāo)準(zhǔn)值,以"(抽樣值-標(biāo)準(zhǔn)值)/標(biāo) 準(zhǔn)值"表示兩者間的差異。
[0080] 結(jié)果見圖1,圖中橫軸為SNP標(biāo)記數(shù)目,縱軸為抽樣值與標(biāo)準(zhǔn)值的差異均值。結(jié)果顯 示隨著SNP標(biāo)記數(shù)目的增加抽樣結(jié)果與標(biāo)準(zhǔn)值之間的差異縮小,當(dāng)SNP標(biāo)記數(shù)目在4000~ 5000時(shí)與標(biāo)準(zhǔn)