專利名稱::大豆多態(tài)性與基因分型方法
技術(shù)領(lǐng)域:
:本文公開(kāi)了大豆多態(tài)性、與這些多態(tài)性相關(guān)的核酸分子及使用這些多態(tài)性和分子作為標(biāo)記分子(例如在基因分型中)的方法。相關(guān)技術(shù)多態(tài)性可用作分子標(biāo)記,也稱為遺傳標(biāo)記,在農(nóng)業(yè)領(lǐng)域中,例如,在植物遺傳研究和商業(yè)育種中,用于與基因分型有關(guān)的應(yīng)用。多態(tài)性的這些應(yīng)用在美國(guó)專利5,385,835、5,437,697,5,385,835,5,492,547,5,746,023,5,962,764,5,981,832和6,100,030中有描述。特別地,與只是基于表型數(shù)據(jù)所獲得的結(jié)果相比,在育種程序中使用分子標(biāo)記加速了有價(jià)值的性狀在種質(zhì)中的遺傳積累。本文中,“種質(zhì)”包括育種種質(zhì)、育種群體、優(yōu)良近交系的收集、隨機(jī)交配個(gè)體的群體和雙親雜交。分子標(biāo)記等位基因(“等位基因”是基因座處的替代序列)用于鑒定在多個(gè)基因座處包含所需的基因型并且預(yù)期向其后代轉(zhuǎn)移所需的基因型以及需要的表型的植物。分子標(biāo)記等位基因可以用于鑒定在一個(gè)標(biāo)記基因座、幾個(gè)基因座或單元型處包含所需的基因型并且預(yù)期向其后代轉(zhuǎn)移所需的基因型以及所需的表型的植物。DNA的高度保守性,與穩(wěn)定的多態(tài)性罕見(jiàn)的出現(xiàn)率相結(jié)合,提供了既是可預(yù)測(cè)性的又可以辨別不同的基因型的分子標(biāo)記。在現(xiàn)有的分子標(biāo)記的種類(lèi)中有多種指示遺傳變異的多態(tài)性,包括限制性片段長(zhǎng)度多態(tài)性(RFLP)、擴(kuò)增片段長(zhǎng)度多態(tài)性(AFLP)、簡(jiǎn)單序列重復(fù)(SSR)、單特征多態(tài)性(SFP)、單核苷酸多態(tài)性(SNP)和插入/缺失多態(tài)性(Indel)。分子標(biāo)記在穩(wěn)定性和基因組豐度方面不同。SNP作為分子標(biāo)記是特別有用的,因?yàn)樗鼈儽绕渌鄳B(tài)性更穩(wěn)定,且在植物基因組是豐富的(Bi等人CropSci.4612-21(2006),Romberg,DNAIteplication,W.H.Freeman&Co.,SanFrancisco(1980))。因?yàn)橹参镂锓N的分子標(biāo)記的數(shù)量是有限的,發(fā)現(xiàn)另外的分子標(biāo)志對(duì)于基因分型應(yīng)用來(lái)說(shuō)是至關(guān)重要的,包括標(biāo)記性狀關(guān)聯(lián)研究、基因作圖、基因發(fā)現(xiàn)、標(biāo)記輔助選擇和標(biāo)記輔助育種。用作分子標(biāo)記的多態(tài)性的發(fā)現(xiàn)和鑒定需要大量的測(cè)序和生物信息學(xué)工作,需要對(duì)兩個(gè)或更多的進(jìn)化分支系或群體進(jìn)行大規(guī)模的測(cè)序。不斷發(fā)展的技術(shù)使得某些分子標(biāo)記更適合于快速、大規(guī)模地使用。具體地,如用于SNP檢測(cè)的高通量篩選的技術(shù)表明,SNP是優(yōu)選的分子標(biāo)記。發(fā)明概述正是鑒于上述問(wèn)題,發(fā)展了本發(fā)明。本發(fā)明提供了一系列用于大豆的分子標(biāo)記。這些分子標(biāo)記包括通過(guò)對(duì)大豆基因組DNA進(jìn)行直接序列分析確定多態(tài)性而發(fā)現(xiàn)的大豆DNA基因座。這些分子標(biāo)記可用于多種基因分型應(yīng)用。本發(fā)明的多態(tài)性大豆基因座包括至少12個(gè)連續(xù)核苷酸,該核苷酸包括或鄰近本文中確定的多態(tài)性,例如在表1或表3中確定的多態(tài)性。如表1所示,SEQIDNO:1至SEQIDNO7800的核酸序列包括一種或多種多態(tài)性,例如,單核苷酸多態(tài)性(SNP)和插入/缺失多態(tài)性(Indel)。如表3所示,本文確定的某些多態(tài)性也已定位于某些大豆染色體上。本發(fā)明首先提供核酸分子文庫(kù),其包括至少兩組不同的核酸分子,其中,所述不同組核酸分子中的每一組允許對(duì)表1或表3中確定的相應(yīng)的大豆基因組DNA多態(tài)性進(jìn)行分型。在本發(fā)明此方面的某些實(shí)施方案中,文庫(kù)包括兩組或多組不同的核酸分子,它們排列在至少一個(gè)固體載體上或至少一個(gè)微量滴定板上。不同組的核酸分子可以位于微量滴定板的單獨(dú)的和不同的孔中。不同組的核酸也可以位于固體載體上的不同的探詢位置。也涉及其中核酸分子組合在單一混合物中的文庫(kù)。在本發(fā)明的其它實(shí)施方案中,文庫(kù)可以包含至少8、至少24、至少96或至少384組不同的核酸分子,其中,每組核酸分子允許對(duì)表1或表3中確定的相應(yīng)的大豆基因組DNA多態(tài)性進(jìn)行分型。也涉及包含允許對(duì)表3中確定的大豆基因組DNA多態(tài)性進(jìn)行分型的幾組核酸分子的文庫(kù),所述多態(tài)性選自SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142、80、88、980、538、1925、3669、2270、1397、3747、888、365、2132、1972、459、762和1094。文庫(kù)中的不同組核酸分子可以包括至少12個(gè)連續(xù)核苷酸的核酸分子,所述核苷酸包括或直接鄰近表1中確定的相應(yīng)的多態(tài)性,并且其中至少12個(gè)連續(xù)核苷酸的序列與包括或直接鄰近所述多態(tài)性的大豆DNA片段任一鏈中的相同數(shù)目核苷酸的序列至少90%相同。在其它實(shí)施方案中,核酸分子是至少15個(gè)連續(xù)核苷酸或至少18個(gè)連續(xù)核苷酸的核酸分子。核酸分子可以進(jìn)一步包含可檢測(cè)的標(biāo)記或提供可檢測(cè)的標(biāo)記的摻入。這種可檢測(cè)的標(biāo)記可以選自同位素、熒光團(tuán)、氧化劑、還原劑、核苷酸和半抗原??蓹z測(cè)的標(biāo)記可以通過(guò)化學(xué)反應(yīng)添加到核酸上,或通過(guò)酶促反應(yīng)摻入。不同組的核酸分子還可以包括(a)—對(duì)寡核苷酸引物,其中,所述寡核苷酸引物中的每一個(gè)包含至少15個(gè)核苷酸堿基,并且允許PCR擴(kuò)增包含表1或表3中確定的所述相應(yīng)多態(tài)性之一的DNA片段,和(b)至少一種檢測(cè)核酸分子,其允許檢測(cè)(a)的所述擴(kuò)增片段中的多態(tài)性。在這些不同組的核酸中,檢測(cè)核酸包含至少12個(gè)核苷酸堿基,或者包含至少12個(gè)核苷酸堿基和可檢測(cè)的標(biāo)記,并且其中所述檢測(cè)核酸分子的序列與包含所述多態(tài)性的權(quán)利要求1之基因座中的大豆DNA片段任一鏈中相同數(shù)目核苷酸的序列至少95%相同。本發(fā)明還提供計(jì)算機(jī)可讀介質(zhì),在其上記錄有表1或表3中確定的至少兩種大豆基因組DNA多態(tài)性。在其它實(shí)施方案中,至少8種表1或表3中確定的大豆基因組DNA多態(tài)性記錄在計(jì)算機(jī)可讀介質(zhì)上。也提供在其上記錄有表1和表3中確定的至少兩種大豆基因組DNA多態(tài)性和所述大豆基因組DNA多態(tài)性中每一種的相應(yīng)遺傳圖譜位置的計(jì)算機(jī)可讀介質(zhì)。在其它實(shí)施方案中,至少8種大豆基因組DNA多態(tài)性和相應(yīng)的遺傳圖譜位置記錄在計(jì)算機(jī)可讀介質(zhì)上。本發(fā)明還提供用于讀取、分類(lèi)或分析大豆基因型數(shù)據(jù)的基于計(jì)算機(jī)的系統(tǒng),該系統(tǒng)包括以下構(gòu)件(a)數(shù)據(jù)存儲(chǔ)裝置,包括計(jì)算機(jī)可讀介質(zhì),其上記錄有至少2種表1或表3中確定的大豆基因組DNA多態(tài)性;(b)搜索裝置,用于將來(lái)自至少一種測(cè)試大豆植物的大豆基因組DNA序列與步驟(a)的數(shù)據(jù)存儲(chǔ)裝置的所述多態(tài)性序列進(jìn)行比較,以鑒定同源或非同源序列;和(c)檢索裝置,用于鑒定步驟(b)的所述測(cè)試大豆基因組序列的所述同源或非同源序列。在其它實(shí)施方案中,至少96種表1或表3中確定的大豆基因組DNA多態(tài)性記錄在基于計(jì)算機(jī)的系統(tǒng)的計(jì)算機(jī)可讀介質(zhì)上。在另外其它實(shí)施方案中,數(shù)據(jù)存儲(chǔ)裝置可以進(jìn)一步包括計(jì)算機(jī)可讀介質(zhì),其上記錄有來(lái)自所述測(cè)試大豆植物中的至少一個(gè)的表型性狀數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)裝置還可以進(jìn)一步包括計(jì)算機(jī)可讀介質(zhì),其上記錄有等位基因狀態(tài)與親本、后代或測(cè)試大豆植物的關(guān)聯(lián)數(shù)據(jù)。還涉及基于計(jì)算機(jī)的系統(tǒng),其中,多種表3中確定的定位的大豆基因組DNA多態(tài)性記錄在計(jì)算機(jī)可讀介質(zhì)上,并且其中,計(jì)算機(jī)可讀介質(zhì)進(jìn)一步包括所述定位的多態(tài)性中的每一種的遺傳圖譜位置數(shù)據(jù)。也提供了用于檢測(cè)表1和表3中確定的大豆基因組DNA中的多態(tài)性的分離的核酸分子。涉及用于檢測(cè)分子標(biāo)記的分離的核酸分子,該分子標(biāo)記代表在表1或表3中確定的大豆DNA中的多態(tài)性,所述核酸分子包含至少15個(gè)核苷酸,所述核苷酸包括或直接鄰近多態(tài)性,并且與包括或直接鄰近所述多態(tài)性的DNA任一鏈中的相同數(shù)目連續(xù)核苷酸的序列至少90%相同。本發(fā)明的分離核酸可以進(jìn)一步包含可檢測(cè)的標(biāo)記或提供可檢測(cè)的標(biāo)記的摻入??蓹z測(cè)的標(biāo)記可以選自同位素、熒光團(tuán)、氧化劑、還原劑、核苷酸和半抗原??蓹z測(cè)的標(biāo)記可以通過(guò)化學(xué)反應(yīng)添加到核酸上,或者通過(guò)酶促反應(yīng)摻入。分離的核酸可以檢測(cè)選自下組的表3中的多態(tài)性:SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142、80、88、980、538、1925、3669、2270、1397、3747、888、365、2132、1972、459、762和1094。包括一種以上的分離核酸的其它分離寡核苷酸組合物可用于對(duì)表1或表3的大豆多態(tài)性進(jìn)行分型。這樣的分離寡核苷酸組合物可以用于通過(guò)Taqman試驗(yàn)或瓣核酸內(nèi)切酶(FlapEndonuclease)介導(dǎo)的(Invader)試驗(yàn)對(duì)SNP多態(tài)性進(jìn)行分型。在一個(gè)實(shí)施方案中,分離核酸組合物是一組寡核苷酸,包括(a.)—對(duì)寡核苷酸引物,其中,所述引物中的每一個(gè)包含至少12個(gè)連續(xù)核苷酸,并且其中,所述引物對(duì)允許PCR擴(kuò)增包含表1或表3中確定的大豆基因組DNA多態(tài)性基因座的DNA片段;和(b)至少一種檢測(cè)寡核苷酸,其允許檢測(cè)所述擴(kuò)增片段中的多態(tài)性,其中,所述檢測(cè)寡核苷酸的序列與包括或直接鄰近步驟(a)的所述多態(tài)性的大豆DNA片段任一鏈中相同數(shù)目連續(xù)核苷酸的序列至少95%相同。在這組寡核苷酸中,檢測(cè)核酸包含至少12個(gè)核苷酸,并且提供可檢測(cè)標(biāo)記的摻入或進(jìn)一步包含可檢測(cè)的標(biāo)記??蓹z測(cè)的標(biāo)記可以選自同位素、熒光團(tuán)、氧化劑、還原劑、核苷酸和半抗原。還提供了用于用瓣核酸內(nèi)切酶介導(dǎo)的(Invader)試驗(yàn)對(duì)公開(kāi)的多態(tài)性進(jìn)行分型的分離多核苷酸組合物。這種用于瓣核酸內(nèi)切酶介導(dǎo)的試驗(yàn)的組合物包含至少兩種用于檢測(cè)代表大豆DNA中的多態(tài)性的分子標(biāo)記的分離核酸分子,其中,該組合物的第一核酸分子包括包含多態(tài)性核苷酸殘基和至少8個(gè)直接鄰近所述多態(tài)性核苷酸殘基3'端的核苷酸的寡核苷酸,其中,該組合物的第二核酸分子包括包含多態(tài)性核苷酸殘基和至少8個(gè)直接鄰近所述多態(tài)性核苷酸殘基5'端的核苷酸的寡核苷酸,并且其中,所述多態(tài)性在表1或表3中確定。也提供了對(duì)大豆植物進(jìn)行基因分型以選擇用于育種的親本植物、后代植物或測(cè)試植物的各種方法。在一個(gè)實(shí)施方案中,對(duì)大豆植物進(jìn)行基因分型以選擇用于育種的親本植物、后代植物或測(cè)試植物的方法包括以下步驟a.從至少一個(gè)大豆植物的組織獲得DNA或RNA樣品;b.對(duì)于來(lái)自步驟(a)的所述樣品,確定表1或表3中確定的至少一種大豆基因組DNA多態(tài)性的等位基因狀態(tài);和c.利用步驟(b)的所述等位基因狀態(tài)確定情況,來(lái)選擇用于育種的親本植物、后代植物或測(cè)試植物??梢赃M(jìn)行這種基因分型方法,以對(duì)表3中確定的定位的多態(tài)性進(jìn)行分型。在這種基因分型方法中,通過(guò)允許鑒定單核苷酸多態(tài)性的試驗(yàn)可以確定多態(tài)性的等位基因狀態(tài)。這種方法中使用的單核苷酸多態(tài)性試驗(yàn)可以選自單堿基延伸(SBE)、等位基因特異性引物延伸測(cè)序(ASPE)、DNA測(cè)序、RNA測(cè)序、基于微陣列的分析、通用PCR、等位基因特異性延伸、雜交、質(zhì)譜法、連接、延伸-連接和瓣核酸內(nèi)切酶介導(dǎo)的試驗(yàn)。在這種方法的某些實(shí)施方案中,確定在表1或表3中確定的至少8、至少48、至少96或至少384種不同多態(tài)性的等位基因狀態(tài)?;蚍中头椒ㄟ€可以進(jìn)一步包括在計(jì)算機(jī)可讀介質(zhì)上存儲(chǔ)所述一種或多種等位狀態(tài)基因狀態(tài)確定情況產(chǎn)生的基因型數(shù)據(jù)的步驟,和/或進(jìn)一步包括比較一個(gè)大豆植物與另一個(gè)大豆植物的基因型數(shù)據(jù)的步驟。在包括這些其它步驟的方法的某些實(shí)施方案中,也可以比較至少一種所述大豆植物的基因型數(shù)據(jù)與表型性狀數(shù)據(jù)或表型性狀指數(shù)數(shù)據(jù)。在包括這些其它步驟的方法的某些實(shí)施方案中,也可以比較至少兩種所述大豆植物的基因型數(shù)據(jù)與表型性狀數(shù)據(jù)或表型性狀指數(shù)數(shù)據(jù),并確定所述基因型數(shù)據(jù)與所述表型性狀數(shù)據(jù)之間的一種或多種關(guān)聯(lián)。在其中確定所述表型性狀數(shù)據(jù)或表型性狀指數(shù)數(shù)據(jù)與所述基因型性狀數(shù)據(jù)之間的關(guān)聯(lián)的這些方法的其它實(shí)施方案中,基因型性狀數(shù)據(jù)包括確定至少10種定位的表3中確定的多態(tài)性的等位基因狀態(tài)。也涉及培育大豆植物的方法。培育大豆植物的方法包括以下步驟(a)對(duì)于至少兩個(gè)大豆植物的育種群體,確定與至少兩個(gè)最多10厘摩的基因組窗口中的至少兩個(gè)單元型相關(guān)的至少一種性狀的性狀值;(b)在所述育種群體中,培育兩個(gè)大豆植物,以產(chǎn)生后代種子群體;(C)在所述后代種子中,確定至少一種表1或表3中確定的多態(tài)性在每個(gè)所述窗口中的等位基因狀態(tài),以確定所述單元型的存在;和(d)在所述后代種子中選擇對(duì)于至少一種與確定的單元型相關(guān)的性狀而言具有較高性狀值的后代種子,從而培育大豆植物。在這些育種方法的某些實(shí)施方案中,對(duì)與基本上每條染色體整體上的每個(gè)相鄰基因組窗口中的至少兩個(gè)單元型相關(guān)的至少一種性狀,確定其性狀值。這種性狀值可以確定選自以下的性狀除草劑耐受性、抗病性、昆蟲(chóng)或蟲(chóng)害抗性、改變的脂肪酸、蛋白質(zhì)或碳水化合物代謝、增加的谷物產(chǎn)量、增加的油、增加的營(yíng)養(yǎng)成分含量、提高的生長(zhǎng)速度、提高的應(yīng)激耐受性、優(yōu)選的成熟度、增強(qiáng)的感官特性、改變的形態(tài)特征、其它農(nóng)藝學(xué)性狀、用于工業(yè)應(yīng)用的性狀、或?qū)οM(fèi)者有提高的吸引力的性狀、或作為多性狀指數(shù)的性狀組合。在這些育種方法的其它實(shí)施方案中,對(duì)于每條染色體中最多10厘摩的基因組窗口中的單元型,選擇具有較高的產(chǎn)量性狀值的后代種子。在性狀值是產(chǎn)量性狀值并且對(duì)每個(gè)窗口中的單元型的性狀值進(jìn)行排序的方法中,可以選擇窗口中的產(chǎn)量性狀值高于所述窗口中的平均產(chǎn)量性狀值的后代種子。在該方法的其它實(shí)施方案中,單元型中的多態(tài)性在包括SEQIDNO:1至SEQIDNO7800的全部DNA序列的DNA序列組中。也提供了選擇用于育種的親本、后代或測(cè)試植物的方法。這些選擇用于植物育種的親本、后代或測(cè)試植物的方法包括以下步驟a)在至少第一和第二大豆近交系中,確定表1或表3中確定的多種多態(tài)性與多種性狀之間的關(guān)聯(lián);b)確定親本、后代或測(cè)試植物中的一種或多種多態(tài)性的等位基因狀態(tài);c)選擇具有更有利的相關(guān)性狀組合的親本、后代或測(cè)試植物。在某些實(shí)施方案中,親本、后代或測(cè)試植物是大豆近交系。在親本、后代或測(cè)試植物中選擇的相關(guān)性狀的有利組合可以是提供改進(jìn)的雜種優(yōu)勢(shì)的親本、后代或測(cè)試植物。也提供提高雜種優(yōu)勢(shì)的方法。提高雜種優(yōu)勢(shì)的方法包括以下步驟(a)在兩個(gè)以上的大豆近交系中,確定表1或表3中確定的多種多態(tài)性與多種性狀之間的關(guān)聯(lián);(b)將選自步驟(a)的近交系的兩個(gè)近交系分配至雜種優(yōu)勢(shì)群;(c)在來(lái)自步驟(b)的至少兩個(gè)近交系之間進(jìn)行至少一次雜交,其中,每個(gè)近交系來(lái)自不同的和互補(bǔ)的雜種優(yōu)勢(shì)群,并且其中對(duì)于提高雜種優(yōu)勢(shì)的遺傳特征,優(yōu)化所述互補(bǔ)雜種優(yōu)勢(shì)群;和(d)通過(guò)步驟(C)的所述雜交獲得雜種后代植物,其中,相對(duì)于與未經(jīng)選擇的近交系雜交產(chǎn)生的后代,所述雜種后代植物顯示提高的雜種優(yōu)勢(shì)。也提供了對(duì)大豆進(jìn)行基因分型以選擇用于育種的親本植物、后代植物或測(cè)試植物的方法,其中,利用多組不同的核酸對(duì)定位于多個(gè)基因組基因座上的多種不同的多態(tài)性進(jìn)行分型。這些對(duì)大豆植物進(jìn)行基因分型以選擇用于育種的親本植物、后代植物或測(cè)試植物的方法包括以下步驟(a)從至少一個(gè)大豆植物的組織獲得DNA或RNA樣品;(b)對(duì)于所述步驟(a)的樣品,確定一組包含表1或表3中確定的至少兩種多態(tài)性的大豆基因組DNA多態(tài)性的等位基因狀態(tài),其中,用一組提供對(duì)所述大豆基因組DNA多態(tài)性進(jìn)行分型的核酸分子確定所述等位基因狀態(tài);和c.利用步驟(b)的所述等位基因狀態(tài)確定情況,來(lái)選擇用于育種的親本植物、后代植物或測(cè)試植物。但是,本方法的其它實(shí)施方案提供確定至少5、至少10或至少20種在表1或表3中確定的多態(tài)性的等位基因狀態(tài)。大豆基因組DNA多態(tài)性組可以包括至少2種選自以下的多態(tài)性=SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142、80、88、980、538、1925、3669、2270、1397、3747、888、365、2132、1972、459、762和SEQIDN0:1094。大豆基因組DNA多態(tài)性組也可以包括至少2種選自以下的多態(tài)性SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142和80?;蛘撸蠖够蚪MDNA多態(tài)性組也可以包括選自至少2種以下的多態(tài)性=SEQIDNO:3122、2914、3984、3608和1448。在一個(gè)實(shí)施方案中,大豆基因組多態(tài)性組包括多態(tài)性SEQIDN0:3122和SEQIDNO:2914。在這種方法中,大豆基因組DNA多態(tài)性組可以與對(duì)產(chǎn)量、倒伏、成熟度、株高、耐旱性和冷發(fā)芽中的至少一種確定的性狀值相關(guān)聯(lián)。特別涉及其中大豆基因組DNA多態(tài)性組與產(chǎn)量性狀值相關(guān)聯(lián)的基因分型方法。在一個(gè)實(shí)施方案中,與性狀值相關(guān)的多態(tài)性選自SEQIDNO3122、2914、3984、3608、1448、69、1261、3436、1142、80、88、980、538、1925、3669、2270、1397、3747、888、365、2132、1972、459、762和SEQIDNO1094。選自SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142、80、88、980、538、1925、3669、2270、1397、3747、888、365、2132、1972、459、762和SEQIDNO1094的多態(tài)性與產(chǎn)量性狀值相關(guān)。也提供了對(duì)大豆植物進(jìn)行基因分型以選擇用于育種的親本植物、后代植物或測(cè)試植物的方法,其中,利用多組不同的核酸對(duì)定位于大豆基因組上分布的多個(gè)基因組基因座上的多種不同的多態(tài)性進(jìn)行分型。在這些方法中,一組至少20種大豆基因組DNA多態(tài)性鑒定分布于大豆基因組中的多態(tài)性。在這種方法的某些實(shí)施方案中,對(duì)其進(jìn)行分型的至少20種大豆基因組DNA多態(tài)性的組鑒定分布于大豆的一條染色體或分布于大豆的至少兩條染色體中的多態(tài)性。在這種方法的其它實(shí)施方案中,至少20種大豆基因組DNA多態(tài)性的組鑒定分布于大豆的全部染色體中的多態(tài)性。當(dāng)20種大豆基因組DNA多態(tài)性分布于大豆的全部染色體中時(shí),它們可以分布為使得這組中的至少1種所述多態(tài)性定位于每條染色體上,從而使得所述組中的至少1種所述多態(tài)性定位于每條染色體上。但是,該方法也可以采用更多的多態(tài)性,使得該組中的至少10種大豆基因組DNA多態(tài)性定位于每條染色體上。在其它實(shí)施方案中,該組中至少20種或至少50種大豆基因組DNA多態(tài)性定位于每條染色體上。在該方法的某些實(shí)施方案中,至少一種多態(tài)性定位于染色體1上,且可以選自SEQIDNO:4093、3168、1993、4808、5176、3705、2968、6401、7154、7741、177、4251、584、4672、4078、3248、2471、1728、4140、4169、4258、1466、5899、4203、3624、6068、6303、6309、3363、6057、2579、6431、2744、3018、6670、3133、4591、4656、3127、4306、2161、6021、3623、6504、1612、516、4296、2702、4124、1076、967、3885、800、2153、5915、7766、6672、5391、2645、382、1550、5564、1763、566、1722、3327、3724、6359、1499、6680、1147、345、1832、608、7548、4553、5482、7055、2157、3270、6896、7347、1502、1765、4173、6150、5085、2607、6686、448、2355、2639、4850和1897。在該方法的其它實(shí)施方案中,定位于染色體2上的至少一種多態(tài)性選自SEQIDNO:2484、3849、6346、6230、336、2253、4062、5763、6118、1450、4299、4268、7480、7774、3664、261、4018、2265、5833、933、7547、1519、3271、4754、7691、1349、5587、6852、6500、7429、4261、3359、6845、1560、4977、1626、4440、2019、2164、690、2491、3242、5314、7053、3747、6728、389、3986、1485、1988、5472、6494、4023、221、5566、4602、6519、2042、1181、2514、3199、1462、904、7515、329、1377、6130和2194。在該方法的其它實(shí)施方案中,定位于染色體3上的至少一種多態(tài)性選自SEQIDNO:2222、1105、4825、1773、5419、3275、3562、4148、6154、3488、3349、7710、3721、4423、1313、3801、3103、4222、2910、2504、3730、3834、6625、355、5025、4164、2260、6368、2022、3567、2957、3362、359、6180、2070、5380、917、6320、5213、1186、1616、6539、7191、5055、7378、1269、7380、1986、2274、5838、6098、3758、1280、6022、6977、6783、3060、6560、5330、1630、2966、2166、5858、7297、2650、6467、1075和6910。在該方法的其它實(shí)施方案中,定位于染色體4上的至少一種多態(tài)性選自SEQIDNO:5919、631、6047、6592、283、6474、4015、1740、3995、3756、5255、2341、2933、292、3984、5538、3157、6439、368、1082、7360、2108、2629、362、4489、4980、5522、463、163、5923、6020、1995、6388、1151、3463、5658、443、5236、2637、3238、1950、2824、3674、5762、3210、7511、2842、2319、4531、2883、2225、4816、892、7386、4509、5846、823、3797、3024、3746、7637、4171、4257、2622、6249、950、4156、3339、3717、976、1161、5885、1099、1533、1827、4787、360和4221。在該方法的其它實(shí)施方案中,定位于染色體5上的至少一種多態(tài)性選自SEQIDNO:5225、5448、6261、1464、753、5766、6067、4519、4809、6745、6451、3594、7734、2884、4032、88、5977、1880、4394、517、1611、2963、1582、7292、7181、4255、2659、3217、2736、2638、2437、2912、1197、6684、2810、5175、7009、1623、6510、4346、6239、2320、3905、5458、4072、4318、6367、4001、2079、1319、3691、6632、3315、3391、4117、6191、5002、1223、1261、4146、2417、3963、1090、6295、6793、2878、5198、3512、2407、3533、1448、7152、69、3539、5172、5468、5602、3273、3692、6691、6121、2743、4289、4044、1837、486、1465、2050、4125、5105、3481、4281、1257、2307、739、5372、1513、4652、7200、1589、2188、1951、2292、6241、6516、4185、202、1748、4580、1183、5642、6955、4986、6848、98、2099、7112、3402、3530、5384、3827、1420、311,817和5169。在該方法的其它實(shí)施方案中,定位于染色體6上的至少一種多態(tài)性選自SEQIDNO1920、2270、2334、811、3328、5137、1590、1286、1918、5009、5108、4798、2032、2186、2803、5141、2954、805、750、1037、7529、1310、5854、771、244、2733、5634、6488、4812、5101、7767、7206、7539、6432、4861、3470、3454、3653、6314、1427、4232、4100、4757、278、1969、4604、1813、4436、5239、7454、4998、2325、6203、4077、1829、4069、6655、2657、3593、7455、6、10、199、6264、4050、6189、7383、2123、5288、5305、89、149、6194、4849、1963、3839、5573、1493、824、3645、704、1404、980、7371、3709、5459、6413、3784、1309、5882、1379、3547、3903、1646、973、2176、2515、2762、900、1027、3872、5916、6311、3180、7535、4696、7492、514、4360、860、1917,3392和3433。在該方法的其它實(shí)施方案中,定位于染色體7上的至少一種多態(tài)性選自SEQIDNO:7333、7600、481、4994、2982、1106、7136、4949、1998、5755、2429、3471、2155、4852、5661、7516、5406、5539、5266、5320、4418、3619、172、4614、780、5951、1410、4348、5572、5708、6304、4215、912、6548、1883、469、4202、1996、602、5656、144、2221、79、7271、6351、3879、504、2731、1191、2377、2333、3040、3023、255、1258、2858、5021、4500、2761、5737、7012、2445、873、6300、332、2241、1509、592、1571、4076、6360、6398、2569、154、5723、3389、161、153、398、1558、3056、3714、3775、6023、1542、2741、6746、7785、5509、1312、3941、7247、6148、1625、4210、7192、3929、2886和4944。在該方法的其它實(shí)施方案中,定位于染色體8上的至少一種多態(tài)性選自SEQIDNO:3125、4896、5102、2536、1028、1642、5457、2386、5357、4147、6035、2644、3013、6491、4142、5787、1819、7259、4128、612、215、6681、2786、6766、6483、5795、2734、4727、115、654、1551、1038、1414、2353、2330、47、1816、1231、2915、2143、972、2698、4029、4597、1575、5161、2466、3358、2173、5192、832、2354、2008、6639、6110、3410、5729、6995、2214、585、7509、1878、4822、1237、3813、3829、5555、3962、840、6215、4705、1884、218、809、7033、2282、5929、168、6006、429、2509、424、7408、3817、3002、3259、7134、1069、6428、2990、7180、3497、5792、1706、6032、3432、3431和4823。在該方法的其它實(shí)施方案中,定位于染色體9上的至少一種多態(tài)性選自SEQIDNO:6190、174、2779、5185、5698、6454、2531、50、5080、4964、2739、4668、2588、849、7087、3975、3977、6717、7375、2804、4448、2525、1546、1834、6863、4971、1129、6095、6287、5961、6931、6935、3461、2424、2409、1972、2974、1906、553、661、792、4842、5817、150、4492、2231、2956、4231、2851、4160、1598、3767、6721、6370、7316、3787、3156、1033、2821、6980、3656、3269、4797、6269、4275、7185、6034、4538、7096、3377、3409、1620、487、6615、4941、7419、6685、7504、6281、6734、4847、7127、4663、1520、1905、3129、1296、4014、2312、4935、1239、3151、5149、6908、5431、3161和6589。在該方法的其它實(shí)施方案中,定位于染色體10上的至少一種多態(tài)性選自SEQIDNO:2434、2678、920、6861、6464、6950、1786、1567、2899、5920、3251、3049、1112、6008、7346、611、3203、1992、6335、587、3093、459、909、4437、2506、4920、4786、6518、6927、4751、1138、3263、3311、4226、3719、3865、4948、2894、6174、6659、3371、3089、5513、4646、4381、2055、2217、2939、2717、5744、3262、7681、7411、5215、7761、2713、2061、4298、6244、1149、4046、4701、5243、4784、3140、7173、407、4081、6478、509、1389、3590、2508、835、7224、1785、1757、3464、6202、6700、4857、3167、5146、7615、7790和5439。在該方法的其它實(shí)施方案中,定位于染色體11上的至少一種多態(tài)性選自SEQIDNO1531、4150、4186、5997、6107、5692、1032、6449、1432、12、600、1067、353、5549、3757、2136、7341、5727、3491、55、449、6936、5191、538、3372、3694、5665、5754、3755、7295、3572、2237、7794、1624、2800、3876、337、7203、4953、300、1326、5480、4024、3898、507、3939、6045、5364、4039、3820、53、7315、7340、1172、2530、6395、4821、6009、2843、3037、5297、4562、4096、3828、2533、6658和7084。在該方法的其它實(shí)施方案中,定位于染色體12上的至少一種多態(tài)性選自SEQIDNO:4218、4178、4434、5076、1436、216、7176、4295、7085、5299、3663、2121、1329、5659、3420、2057、4011、1085、3255、3062、6668、2559、852、3809、135、5694、182、4127、2944、6902、206、4287、4569、2610、2699、2685、3738、7293、5709、2697、7155、1351、5531、3733、5663、6001、7470、7486、1196、4405、755、5608、7092、2281、2608、6358、6787、6005、70、2680、14、5154、5639、4600、7195、6688、3780、3892、4428、6120、5415、322、1820和326。在該方法的其它實(shí)施方案中,定位于染色體13上的至少一種多態(tài)性選自SEQIDNO:2647、7207、1605、2888、6147、1956、3979、4715、7262、5461、3524、948、6557、5346、6342、5847、73、1268、4278、4385、4259、4968、1898、7731、3710、5434、5508、1944、7448、5031、7614、6568、583、7246、762、3390、6069、5142、269、1203、1591、1946、1442、126、1925、3696、4198、370、1169、1780、5336、1142、2489、5443、5626、7153、1363、1476、3183、893、7526、5826、3920、3114、7321、7339、493、1059、4745、5515、6339、3011、4796、6622、4175、4240、2801、267、2565、3522、6169、1079、4802、885、910、2970、5745、2980、7472、5491、598、2494、5561、6750、6198、7184、86、2695、721、773、508、7487、879、3030、3408、348、7559、1463、991、7253、184、2877、72、4315、5033、2327、7304、107、3659、2413、6073、3110、7072、4552、5976、4441、6475、2519、3174、4576、6716、3333、5619、6458、123、1396和4130。在該方法的其它實(shí)施方案中,定位于染色體14上的至少一種多態(tài)性選自SEQIDNO:2240、2749、1847、2950、5924、6509、1246、4790、5893、5855、4608、2485、5127、1599、4990、2790、4615、6767、7714、7659、543、1267、2560、6858、350、3187、3330、6588、1684、395、6081、6809、726、297、1071、1749、6730、1811、2724、3435、4993、5074、3436、6792、2297、489、4535、3897、3608、908、1835、4249、4685、5895、1855、4、8、5059、7105、4269、7556、3101、1525、3367、6143、6084和5147。在該方法的其它實(shí)施方案中,定位于染色體15上的至少一種多態(tài)性選自SEQIDNO:868、7416、3126、3298、5695、3227、1182、4568、1697、2703、6786、80、7387、4742、3597、6593、6197、6666、1093、2708、3844、7066、3574、944、4560、1730、5743、2020、601、3646、5610、795、1566、3919、5666、7049、7690、6421、7349、3355、1431、51、2021、3303、3144、1094、5277、3800、120、139、2864、6899、4659、6983、7056、2920、201、1087、5056、446、6077、4507、4276、712、441、2718、4153、2385、3117、7723、5908、3123、3016、4262、1999、2601、2555、1324、5257、6830、3459、4293、4458、6673、4277和3184。在該方法的其它實(shí)施方案中,定位于染色體16上的至少一種多態(tài)性選自SEQIDNO:6550、826、1298、2636、7555、7284、7278、2051、2860、723、7324、1205、3200、1581、2403、5094、3039、5261、4426、4703、3906、25、4598、1282、5802、6687、1885、4570、3917、3185、4115、5957、6268、250、1225、3393、1644、3846、4380、1708、650、1260、3348、3606、5011、7641、5436、4392、5836、7661、452、7015、4522、1498、1473、929、4040、6294、2777、2387、1675、1361、3034、1482、3193、7330、3283、7450、1515、5254、4074、3218、622、6055、808、916、2367、6489、6591、4245、253、7572、2029、5462和5421。在該方法的其它實(shí)施方案中,定位于染色體17上的至少一種多態(tài)性選自SEQIDNO:1394、2246、2662、3716、2458、4814、1863、2289、5952、2905、4952、396、7078、4188、5442、4163、4871、317、5321、6094、7656、4831、3、5985、3261、273、4005、1511、6172、7394、4463、1158、1354、1769、2118、2191、3076、4880、5015、5881、6391、7400、720、1100、915、7051、118、4135、7109、2914、2975、3249、3352、1288、1405、5637、7290、5914、7631、3669、2001、3899、1761、5677、5680、992、3806、4158、3540、2675、3122、7301、7303、7797、6959、7343、1359、6165、1018、6562、2881、4303、6537、416、5424、249、3864、955、2859、1900、6653、841、7129、542、2400、5664、4965、638、7327和3368。在該方法的其它實(shí)施方案中,定位于染色體18上的至少一種多態(tài)性選自SEQIDNO:2595、2802、3882、1872、7029、1141、7208、6619、6803、7175、7183、3928、5774、5890、7228、6046、2523、3350、2535、7244、3519、7099、259、6981、1561、2052、3163、1226、3228、6541、4667、425、6052、5742、2623、7167、1425、3059、888、6301、365、502、4355、3991、2958、5167、2299、7131、7613、7257、6748、2856、4384、550、1658、4216、7665、3356、6389、4386、414、3149、1572、7361、7279、7296、205、3947、162、3508和734。在該方法的其它實(shí)施方案中,定位于染色體19上的至少一種多態(tài)性選自SEQIDNO:3545、1664、6958、3499、7622、2562、3361、191、2084、1472、1140、5208、3690、7735、6455、3830、7323、848、2890、5913、1413、2953、2017、1335、7226、3722、1887、3398、313、1136、7064、7490、4182、4133、1933、3788、1340、2025、4378、3625、2456、3650、1484、7232、4179、4236、5401、7094、7635、6850、7471、6507、6514、4710、4497、1369、4327、2846、5685、197、1146、2189、7017、1378、4792、1047、1397、5939、2291、4151、613、488、7080、5481、1017、1529、2012、5832、2132、2976、3910、2538、5416、2380、6138、4872、2065、1628、7157、6481、3299,6242和4960。在該方法的其它實(shí)施方案中,定位于染色體20上的至少一種多態(tài)性選自SEQIDNO:3967、845、3229、5398、2348、3671、3592、5747、5987、3742、1164、6754、1364、6380、3785、6667、4242、175、1979、116、3950、166、3026、3859、3682、1784、3869、1062、3837、499、7023、539、6232、192、4057、1922、2371、5361、1219、5786、7190、3208、1544、3321、3306、2104、4490、6026、2149、4730、4746、4105、1991、3058、2895、5331、6581、2651、4954、4273、4045、1297、231、1044、1249、1908、1128、2516、6135、3414、6709、6708、1725、7196、3266、1202、1576,6290,7201和3665。下面參考附圖,詳述了本發(fā)明的進(jìn)一步的特征和優(yōu)點(diǎn),以及本發(fā)明的各個(gè)實(shí)施方案的結(jié)構(gòu)和操作。附圖簡(jiǎn)述并入并構(gòu)成說(shuō)明書(shū)一部分的附圖,說(shuō)明了本發(fā)明的實(shí)施方案,并與說(shuō)明書(shū)一起,用來(lái)解釋本發(fā)明的原理。在附圖中圖IA和圖IB是顯示定位的本發(fā)明多態(tài)性的密度的大豆遺傳圖譜。圖2是說(shuō)明基因分型試驗(yàn)結(jié)果的等位圖(allelogram)。定義如下定義本文使用的一些術(shù)語(yǔ)和短語(yǔ)。“等位基因”指特定的基因座處的替代序列;等位基因的長(zhǎng)度可以小到1個(gè)核苷酸堿基,但通常較大。等位基因序列可以是氨基酸序列或核酸序列?!盎蜃笔且环N短序列,其通常是獨(dú)特的,且通常在參照點(diǎn)附近在基因組中的一個(gè)特定位置處被發(fā)現(xiàn);例如,作為基因或基因部分或基因間區(qū)域的短DNA序列。本發(fā)明的基因座可以是在基因組上特定位置處的獨(dú)特PCR產(chǎn)物。本發(fā)明的基因座包含一種或多種多態(tài)性;即,在一些個(gè)體中存在的替代的等位基因?!暗任换驙顟B(tài)”指存在于包含基因組多態(tài)性的核酸分子中的核酸序列。例如,包含單核苷酸多態(tài)性的DNA分子的核酸序列可以在多態(tài)性位置處包括A、C、G或T殘基,使得通過(guò)該多態(tài)性位置處存在哪個(gè)殘基來(lái)定義等位基因狀態(tài)。例如,包含單核苷酸多態(tài)性的RNA分子的核酸序列可以在多態(tài)性位置處包括A、C、G或U殘基,使得通過(guò)該多態(tài)性位置處存在哪個(gè)殘基來(lái)定義等位基因狀態(tài)。同樣地,包含Indel的核酸分子的核酸序列可以在多態(tài)性位置處包括核酸序列的插入或缺失,使得通過(guò)在該多態(tài)性位置處是否存在插入或缺失來(lái)定義等位基因狀態(tài)?!瓣P(guān)聯(lián)”,在用于多態(tài)性和表型性狀或性狀指數(shù)時(shí),指在多態(tài)性基因座的給定等位基因的存在與表型性狀或性狀指數(shù)值之間的任何統(tǒng)計(jì)顯著性的相關(guān),其中,該值可以是定性的或定量的。“不同組的核酸分子”指一個(gè)或多個(gè)與包括、直接鄰近或在給定大豆基因組多態(tài)性的5'或3'端的大約1000個(gè)堿基對(duì)之內(nèi)的DNA序列雜交的核酸分子。在某些實(shí)施方案中,不同組的核酸分子包括一個(gè)核酸序列,該核酸序列包括或直接鄰近于給定的多態(tài)性。在其它實(shí)施方案中,不同組的核酸分子包括一個(gè)或多個(gè)包括或直接鄰近于多態(tài)性的核酸序列,以及在多態(tài)性的5'或3'端的大約1000個(gè)堿基對(duì)之內(nèi)的其它核酸序列?!盎蛐汀敝冈趥€(gè)體生物內(nèi)在一個(gè)或多個(gè)基因座處的等位基因組合。在二倍體生物的情況下,在每個(gè)基因座處有兩個(gè)等位基因;當(dāng)?shù)任换蛳嗤瑫r(shí),二倍體基因被稱為是純合的,而當(dāng)?shù)任换虿煌瑫r(shí),二倍體基因被稱為是雜合的。“單元型”指往往是作為單元遺傳的基因組DNA的等位基因片段;這種單元型可以用一個(gè)或多個(gè)多態(tài)性分子標(biāo)記來(lái)表征,且可以限定為不大于10厘摩的大小。通過(guò)用更高的多態(tài)性密度提供更高的精度,單元型可以用基因組窗口來(lái)表征,例如,在1-5厘摩的范圍內(nèi)。短語(yǔ)“直接鄰近”,當(dāng)用來(lái)描述與包含多態(tài)性的DNA雜交的核酸分子時(shí),指與直接鄰接多態(tài)性核苷酸堿基位置的DNA序列雜交的核酸。例如,可用于單堿基延伸試驗(yàn)的核酸分子與多態(tài)性“直接鄰近”?!疤皆兾恢谩笔侵腹腆w載體上的物理位置,可以對(duì)其進(jìn)行查詢以獲取一個(gè)或多個(gè)預(yù)定的基因組多態(tài)性的基因分型數(shù)據(jù)。“共有序列”是指構(gòu)建的DNA序列,其確定基因座處等位基因的SNP和Indel多態(tài)性。共有序列可以基于基因座處DNA的任一鏈,并且表示基因座中的每個(gè)SNP的任一個(gè)的核苷酸堿基及基因座中的所有Indel的核苷酸堿基。因此,雖然共有序列可能不是一個(gè)實(shí)際的DNA序列的拷貝,但共有序列可用于精確設(shè)計(jì)用于基因座中的實(shí)際多態(tài)性的引物和探針?!氨硇汀敝缸鳛榛虮磉_(dá)的表現(xiàn)的細(xì)胞或生物體的可檢測(cè)的特征?!氨硇托誀钪笖?shù)”指至少兩個(gè)表型性狀的復(fù)合值,其中可以給每個(gè)表型性狀賦予權(quán)重,以反映對(duì)選擇而言的相對(duì)重要性。本文中所用的“標(biāo)記”或“分子標(biāo)記”,是顯示同一物種的兩個(gè)或多個(gè)植物之間的多態(tài)性的DNA序列(例如,基因或基因的部分),其可以通過(guò)簡(jiǎn)單的試驗(yàn)鑒定或分型。有用的多態(tài)性包括單核苷酸多態(tài)性(SNP)、DNA序列中的插入或缺失(Indel)、單特征多態(tài)性(SFP)和DNA序列的簡(jiǎn)單序列重復(fù)(SSR)?!皹?biāo)記試驗(yàn)”指使用特定方法檢測(cè)特定基因座處的多態(tài)性的方法。檢測(cè)多態(tài)性的方法包括但不限于限制性片段長(zhǎng)度多態(tài)性(RFLP)、單堿基延伸、電泳、序列比對(duì)、等位基因特異性寡核苷酸雜交(ASO)、RAPD、等位基因特異性引物延伸測(cè)序(ASPE)、DNA測(cè)序、RNA測(cè)序、基于微陣列的分析、通用PCR、等位基因特異性延伸、雜交、質(zhì)譜法、連接、延伸-連接、核酸內(nèi)切酶介導(dǎo)的染料釋放試驗(yàn)和瓣核酸內(nèi)切酶介導(dǎo)的試驗(yàn)。美國(guó)專利6,013,431公開(kāi)了示例性的單堿基延伸試驗(yàn)。美國(guó)專利5,538,848公開(kāi)了示例性的用于確定SNP的等位基因狀態(tài)的核酸內(nèi)切酶介導(dǎo)的染料釋放試驗(yàn),其中,核酸內(nèi)切酶活性從雜交探針上釋放報(bào)告染料?!斑B鎖”是指雜交產(chǎn)生配子類(lèi)型的相對(duì)頻率。例如,如果基因座A具有基因“A”或“a”,基因座B具有基因“B”或“b”,具有AABB的親本I與具有aabb的親本B之間的雜交將產(chǎn)生4種可能的配子,其中基因分離為AB、Ab、aB和ab??疹A(yù)期是會(huì)獨(dú)立相等地分離成4個(gè)可能的基因型中的每一個(gè),即,如果沒(méi)有連鎖,每個(gè)基因型將會(huì)有1/4的配子。配子向基因型的分離不同于1/4是由于連鎖?!斑B鎖不平衡”定義為在一代的許多個(gè)體的群體中配子類(lèi)型的相對(duì)頻率。如果等位基因A的頻率是p,a是ρ',B是q,b是q',那么基因型AB的預(yù)期頻率(沒(méi)有連鎖不平衡)是pq,Ab是pq’,aB是p’q,ab是p’q’。相對(duì)于預(yù)期頻率的任何偏差被稱為連鎖不平衡。當(dāng)兩個(gè)基因座處于連鎖不平衡時(shí),它們被稱為是“遺傳連鎖的”。“數(shù)量性狀基因座(QTL)”指在一定程度上控制通常連續(xù)分布的并且可定量表示的性狀的基因座。如本文所用,“序列同一性”指兩個(gè)最佳比對(duì)的多核苷酸或肽序列在例如核苷酸或氨基酸的元件的整個(gè)比對(duì)窗口中不變的程度。測(cè)試序列和參考序列的比對(duì)區(qū)段的“同一性分?jǐn)?shù)”是兩個(gè)比對(duì)序列共有的相同元件數(shù)目除以參考序列區(qū)段中的元件總數(shù),即整個(gè)參考序列或參考序列的較小的確定部分?!巴恍园俜直取笔峭恍苑?jǐn)?shù)乘以100。如本文所用,“分型”(“typing”)指確定給定的大豆基因組多態(tài)性的特定等位基因形式的任何方法。例如,通過(guò)確定存在哪種核苷酸(即,A、G、T或C),對(duì)單核苷酸多態(tài)性(SNP)進(jìn)行分型。通過(guò)確定是否存在Indel來(lái)確定插入/缺失(Indel)。通過(guò)包括但不限于標(biāo)記分析的多種試驗(yàn)可以對(duì)Indel分型。優(yōu)選實(shí)施方案詳述下面的詳細(xì)說(shuō)明涉及用于大豆植物基因分型的分離的核酸組合物及相關(guān)方法。一般來(lái)說(shuō),這些組合物和方法可用于對(duì)大豆屬的大豆植物進(jìn)行基因分型。更具體地說(shuō),使用這些組合物和方法可以對(duì)大豆(Glycinemax)種和亞種GlycinemaxL.ssp.Max或Glycinemaxssp.formosana的大豆植物進(jìn)行基因分型。在另外的一方面,大豆植物來(lái)自野大豆(Glycinesoja)種,也被稱為野生大豆,可以使用這些組合物和方法對(duì)其進(jìn)行基因分型?;蛘撸梢允褂帽疚奶峁┑慕M合物和方法對(duì)來(lái)自大豆、GlycinemaxLssp.Max、Glycinemaxssp.Formosana和/或野大豆中任一種的大豆種質(zhì)進(jìn)行基因分型。分離的核酸分子-基因座、引物和探針本發(fā)明的大豆基因座包括一系列分子標(biāo)記,其包括至少20個(gè)連續(xù)核苷酸,并包括或鄰近于表1或表3中確定的一種或多種多態(tài)性。這些大豆基因座的核酸序列與包括或鄰近多態(tài)性的大豆DNA片段任一鏈中相同核苷酸數(shù)的序列有至少90%的序列同一性,更優(yōu)選至少95%,或甚至更優(yōu)選對(duì)于某些等位基因至少為98%,在許多情況下至少為99%的序列同一性??梢栽赟EQIDNO:1至SEQIDNO:7800的序列中找到這樣的大豆DNA片段的一條鏈的核苷酸序列。根據(jù)多態(tài)性的性質(zhì)可以理解,對(duì)于至少某些等位基因,與公開(kāi)的多態(tài)性本身沒(méi)有同一性。因此,對(duì)于除公開(kāi)的多態(tài)性序列外的序列,可以確定序列同一性。換句話說(shuō),預(yù)計(jì)對(duì)于本文公開(kāi)的多態(tài)性的其它等位基因可能存在,可以容易地通過(guò)測(cè)序方法表征,且可以用于基因分型。例如,本領(lǐng)域的技術(shù)人員可以理解,對(duì)于其中僅僅公開(kāi)了兩個(gè)多態(tài)性殘基(例如,“A”或“G”)的單核苷酸多態(tài)性也可以包括其它多態(tài)性殘基(例如,“T”和/或“G,,)。每個(gè)基因座中的多態(tài)性更具體地在表1或表3中確定。SNP特別可以用作遺傳標(biāo)記,因?yàn)樗鼈儽绕渌N類(lèi)的多態(tài)性更穩(wěn)定,且在大豆基因組中是豐富的。SNP可以由插入、缺失和點(diǎn)突變產(chǎn)生。在本發(fā)明中,SNP可以代表一個(gè)可能由一個(gè)或多個(gè)堿基對(duì)組成的插入與缺失(indel)事件,或單核苷酸多態(tài)性。兩個(gè)或多個(gè)個(gè)體共有的多態(tài)性可能產(chǎn)生于源自共同祖先的個(gè)體。這種“來(lái)源同一性”(IBD)表征由兩個(gè)或多個(gè)個(gè)體攜帶且全部來(lái)自同一祖先的兩個(gè)DNA基因座/片段?!盃顟B(tài)同一性”(IBS)表征由兩個(gè)或多個(gè)個(gè)體攜帶并且在那些基因座處具有可檢測(cè)到的相同等位基因的兩個(gè)DNA基因座/片段。當(dāng)考慮一大組作物系,并且多個(gè)系在標(biāo)記基因座處具有相同的等位基因時(shí),有必要確定標(biāo)記基因座處的IBS是否是標(biāo)記基因座周?chē)娜旧w區(qū)域處的IBD的可靠預(yù)測(cè)。一個(gè)片段中的大量標(biāo)記基因座足以表征該片段的IBD的一個(gè)指示是,它們能夠預(yù)測(cè)該片段內(nèi)其它標(biāo)記基因座處存在的等位基因。除了它們很少獨(dú)立出現(xiàn)這一事實(shí)外,SNP的穩(wěn)定性和豐富性使它們可以用于確定IBD。對(duì)于許多基因分型應(yīng)用,采用來(lái)自一個(gè)以上的基因座的多態(tài)性作為標(biāo)記是有用的。因此,本發(fā)明的一方面提供了核酸分子的集合,其允許對(duì)不同基因座的多態(tài)性進(jìn)行分型。在這樣的集合中的基因座的數(shù)目可以不同,但將是有限的數(shù)值,例如,少至2或5或10或25個(gè)基因座或更多,例如最多達(dá)40或75或100個(gè)或更多的基因座。本發(fā)明的另一方面提供能夠與本發(fā)明的多態(tài)性大豆基因座雜交的分離的核酸分子。在本發(fā)明的某些實(shí)施方案中,例如,提供PCR引物的實(shí)施方案中,這樣的分子包括至少15個(gè)核苷酸堿基??捎米饕锏姆肿涌梢栽诟邍?yán)格條件下與本發(fā)明的多態(tài)性基因座中的DNA片段的一條鏈雜交。用于擴(kuò)增DNA的引物成對(duì)提供,即正向引物和反向引物。一條引物與基因座中的DNA的一條鏈互補(bǔ),而另一條引物與基因座中的DNA的另一條鏈互補(bǔ),即引物序列與一條鏈中相同核苷酸數(shù)目的序列優(yōu)選地至少90%相同,更優(yōu)選地至少95%相同。可以理解,這樣的引物可以與遠(yuǎn)離多態(tài)性(例如,距多態(tài)性至少5、10、20、50、100、200、500或最多大約1000個(gè)核苷酸堿基)的基因座中的序列雜交。本發(fā)明的引物的設(shè)計(jì)取決于本領(lǐng)域內(nèi)熟知的因素,例如,避免或重復(fù)序列。本發(fā)明的分離的核酸分子的另一方面是用于多態(tài)性試驗(yàn)的雜交探針。在本發(fā)明的一方面,這樣的探針是包含至少12個(gè)核苷酸堿基和可檢測(cè)的標(biāo)記的寡核苷酸。這種分子的目的是,例如在高嚴(yán)格條件下,與包括或鄰近于多態(tài)性基因座擴(kuò)增部分中的目標(biāo)多態(tài)性的核苷酸堿基片段中的DNA—條鏈雜交。這樣的寡核苷酸與多態(tài)性基因座中大豆DNA—條鏈中相同核苷酸數(shù)目的片段的序列優(yōu)選地至少90%相同,更優(yōu)選地至少95%相同。該可檢測(cè)的標(biāo)記可以是放射性元素或染料。在本發(fā)明的優(yōu)選方面,雜交探針進(jìn)一步包括熒光標(biāo)記和猝滅劑,例如,用于可從ABBiosystems獲得的被稱為T(mén)aqman試驗(yàn)的類(lèi)型的雜交探針試驗(yàn)。本發(fā)明的分離的核酸分子在一定條件下能夠與包括但不限于大豆基因組DNA、克隆的大豆基因組DNA和擴(kuò)增的大豆基因組DNA的其它核酸分子雜交。如本文所用,如果兩個(gè)核酸分子能夠形成反平行雙鏈核酸結(jié)構(gòu),那么這兩個(gè)分子被稱為能夠彼此雜交。如果兩個(gè)核酸分子表現(xiàn)出“完全的互補(bǔ)性”,即,一個(gè)序列中的每個(gè)核苷酸都與另一序列中的堿基配對(duì)核苷酸互補(bǔ),則稱一個(gè)核酸分子與另一核酸分子“互補(bǔ)”。如果兩個(gè)分子在至少常規(guī)的“低嚴(yán)格”的條件下能互相雜交,并且具有足夠的穩(wěn)定性,從而允許它們保持彼此退火,則稱這兩個(gè)分子是“最低限度互補(bǔ)的”。類(lèi)似地,如果兩個(gè)分子在常規(guī)的“高嚴(yán)格”的條件下能互相雜交,并且具有足夠的穩(wěn)定性,從而允許它們保持彼此退火,則稱這兩個(gè)分子是“互補(bǔ)的”。例如至少在低嚴(yán)格條件下與其它核酸分子雜交的核酸分子被稱為該其它核酸分子的“可同L,,。Sambrook入,MolecularCloning,ALaboratoryManual,2ndEd.,ColdSpringHarborPress,ColdSpringHarbor,NewYork(1989)禾口Haymes等人,NucleicAcidHybridization^PracticalApproach,IRLPress,Washington,DC(1985)描述了常規(guī)的嚴(yán)格條件,本文引入以上文獻(xiàn)作為參考。因而偏離完全互補(bǔ)性是允許的,只要這種偏離沒(méi)有完全消除該分子形成雙鏈結(jié)構(gòu)的能力。因此,為了使核酸分子用作引物或探針,只需要在序列上充分互補(bǔ),以在所采用的特定的溶劑和鹽濃度下能夠形成穩(wěn)定的雙鏈結(jié)構(gòu)。促進(jìn)DNA雜交的合適的嚴(yán)格條件,例如,大約45°C、6.Ox氯化鈉/檸檬酸鈉(SSC),接著50°C、2.OxSSC洗滌,是本領(lǐng)域的技術(shù)人員已知的,或可以在CurrentProtocolsinMolecularBiology,Johnffiley&Sons,N.Y.,1989,6.3.1-6.3.6(本文引入作為參考)中找至IJ。例如,洗滌步驟中的鹽濃度可以選自從大約2.OxSSC、50°C的低嚴(yán)格條件到大約0.2xSSC、50°C的高嚴(yán)格條件。另外,洗滌步驟中的溫度可以從低嚴(yán)格條件的室溫大約22°C增加到高嚴(yán)格條件的大約65°C。溫度和鹽都可以變化,或者,溫度或鹽濃度可以保持不變,而另一個(gè)變量發(fā)生變化。在一個(gè)優(yōu)選的實(shí)施方案中,在中度嚴(yán)格條件下,例如,大約2.OXSSC和大約65°C,更優(yōu)選地在高嚴(yán)格條件下,例如0.2XSSC和大約65°C,本發(fā)明的核酸分子與具有SEQIDNO:1至SEQIDNO7800所示核酸序列的大豆DNA片段的一條鏈特異性雜交。對(duì)于其中分子被設(shè)計(jì)為與通過(guò)如標(biāo)記的雙脫氧核苷酸的單堿基延伸檢測(cè)的多態(tài)性鄰近地雜交的試驗(yàn),這些分子在序列中可以包含至少15個(gè)、更優(yōu)選至少16或17個(gè)核苷酸堿基,所述序列與多態(tài)性大豆DNA片段的任一鏈中相同數(shù)目連續(xù)核苷酸的序列至少90%相同,優(yōu)選地至少95%相同。用于單堿基延伸試驗(yàn)的寡核苷酸可以從OrchidBiosystems獲得??勺鳛殡s交探針用于檢測(cè)大豆DNA中的多態(tài)性的分離的核酸分子可設(shè)計(jì)用于不同的試驗(yàn)。對(duì)于其中探針用于雜交包括多態(tài)性的片段的試驗(yàn),這些分子可以包含至少12個(gè)核苷酸堿基和可檢測(cè)的標(biāo)記。核苷酸堿基序列與本發(fā)明的多態(tài)性基因座中的大豆DNA片段任一鏈中的相同數(shù)目連續(xù)核苷酸的序列優(yōu)選地至少90%相同,更優(yōu)選地至少95%相同。該可檢測(cè)的標(biāo)記是位于分子一端的染料。在優(yōu)選的方面,分離的核酸分子在其末端包括染料和染料猝滅劑。對(duì)于SNP檢測(cè)試驗(yàn),成對(duì)提供這樣的染料和染料猝滅劑是有用的,例如,其中每個(gè)分子在5'端具有不同的熒光染料,并且具有除單核苷酸多態(tài)性之外的相同的核苷酸序列。本領(lǐng)域公知如何為了報(bào)告的目的設(shè)計(jì)與DNA靶片段退火的寡核苷酸PCR探針對(duì),其中,靶標(biāo)的序列是已知的,如本發(fā)明提供的多態(tài)性標(biāo)記序列。對(duì)于其中分離的核酸分子被設(shè)計(jì)為與通過(guò)單堿基延伸檢測(cè)的多態(tài)性鄰近地雜交的試驗(yàn),這些分子在序列中可以包含至少15個(gè)、更優(yōu)選至少16或17個(gè)核苷酸堿基,所述序列與多態(tài)性大豆DNA片段任一鏈中的相同數(shù)目連續(xù)核苷酸的序列至少90%相同,優(yōu)選地至少95%相同。在這種情況下,分離的核苷酸提供可檢測(cè)的標(biāo)記的摻入。這種可檢測(cè)的標(biāo)記可以是同位素、熒光團(tuán)、氧化劑、還原劑、核苷酸和半抗原。對(duì)于涉及使用瓣核酸內(nèi)切酶的試驗(yàn)(即,Invader試驗(yàn))。在某些實(shí)施方案中,組合物包含至少兩種用于檢測(cè)代表大豆DNA多態(tài)性的分子標(biāo)記的分離的核酸分子,其中,組合物的第一核酸分子包括寡核苷酸,該寡核苷酸包括多態(tài)性核苷酸殘基和至少8個(gè)直接鄰近所述多態(tài)性核苷酸殘基的3'端的核苷酸,其中,組合物的第二核酸分子包括寡核苷酸,該寡核苷酸包括多態(tài)性核苷酸殘基和至少8個(gè)直接鄰近所述多態(tài)性核苷酸殘基的5'端的核苷酸,并且其中,所述多態(tài)性在表1或表3中確定。在某些實(shí)施方案中,適于用瓣核酸內(nèi)切酶對(duì)表1或表3的多態(tài)性進(jìn)行分型的分離的核酸分子組合物包括至少一個(gè)具有“通用”5’瓣序列的第一探針、至少一個(gè)第二或“Invader”探針和至少一個(gè)包含標(biāo)記的堿基和猝滅堿基的“FRET”盒(cassettes),該盒包含與一經(jīng)裂解即從第一探針上釋放的“通用瓣序列”互補(bǔ)的序列。鑒定多態(tài)性SNP是序列變異的結(jié)果,新的多態(tài)性可以通過(guò)對(duì)隨機(jī)基因組或cDNA分子進(jìn)行測(cè)序而檢測(cè)。在一方面,可以通過(guò)比較不同系的cDNA序列來(lái)確定基因組中的多態(tài)性。盡管通過(guò)比較cDNA序列檢測(cè)多態(tài)性相對(duì)方便,但是cDNA序列的評(píng)估無(wú)法獲得關(guān)于相應(yīng)基因組DNA中的內(nèi)含子位置的信息。此外,不能從cDNA確定非編碼序列中的多態(tài)性。這是一個(gè)缺點(diǎn),例如,當(dāng)使用源自cDNA的多態(tài)性作為對(duì)基因組DNA進(jìn)行基因分型的標(biāo)記時(shí)。如果多態(tài)性的范圍內(nèi)包括那些存在于非編碼獨(dú)特序列中的多態(tài)性,則可以設(shè)計(jì)更有效的基因分型試驗(yàn)?;蚪MDNA序列在鑒定和檢測(cè)多態(tài)性方面比cDNA更有用??梢酝ㄟ^(guò)比較不同系的基因組DNA序列來(lái)確定基因組中的多態(tài)性。然而,高等真核生物的基因組DNA—般包含高比例的重復(fù)序列和轉(zhuǎn)座子。如果通過(guò)減去或消除重復(fù)序列來(lái)富集編碼/獨(dú)特部分,則可以更有效地對(duì)基因組DNA測(cè)序。有許多本領(lǐng)域熟知的可以用來(lái)富集編碼/獨(dú)特序列的策略。這方面的例子包括使用對(duì)胞嘧啶甲基化敏感的酶,使用McrBC核酸內(nèi)切酶以切割重復(fù)序列,以及印刷基因組文庫(kù)的微陣列,其然后與重復(fù)序列探針雜交。在優(yōu)選的實(shí)施方案中,通過(guò)利用甲基化模式的差別來(lái)富集編碼DNA;高等真核生物的DNA往往非常高度甲基化,但它不是均一地甲基化。事實(shí)上,重復(fù)序列比編碼序列更高度甲基化。關(guān)于對(duì)CG島(CGislands)中的DNA甲基化模式進(jìn)行作圖和評(píng)價(jià)的方法,參見(jiàn)美國(guó)專利6,017,704。簡(jiǎn)單地說(shuō),一些限制性核酸內(nèi)切酶在其識(shí)別位點(diǎn)對(duì)甲基化的胞嘧啶殘基的存在敏感。如果在重疊的5’-CG-3’或重疊的5’-CNG-3’中的胞嘧啶殘基被甲基化,那么這些甲基化敏感性限制性核酸內(nèi)切酶不可能在其識(shí)別位點(diǎn)處切開(kāi)。為了富集編碼/獨(dú)特序列,可以由用Pst1(或其它甲基化敏感性酶)消化的基因組DNA構(gòu)建大豆文庫(kù),并通過(guò)瓊脂糖凝膠電泳進(jìn)行大小分級(jí)分離。一種用于減少重復(fù)DNA的方法包括通過(guò)以下步驟構(gòu)建簡(jiǎn)化的代表文庫(kù)分離重復(fù)序列與物種的至少兩個(gè)變種的基因組DNA片段,基于核苷酸序列的大小對(duì)分離的基因組DNA片段進(jìn)行分級(jí)分離,并比較級(jí)分中的片段的序列以確定多態(tài)性。更具體地,這些鑒定基因組DNA中的多態(tài)性的方法包括用甲基化敏感性核酸內(nèi)切酶消化來(lái)自真核物種的至少兩個(gè)變種的總基因組DNA,以提供消化的DNA片段的集合。對(duì)于特征為較低的5-甲基化胞嘧啶的DNA區(qū)域,片段的平均核苷酸長(zhǎng)度較小。這些片段是基于核苷酸長(zhǎng)度可分開(kāi)的,例如通過(guò)凝膠電泳分開(kāi)。從消化的DNA的集合中分離具有小于平均核苷酸長(zhǎng)度的DNA級(jí)分。比較級(jí)分中的DNA序列,以鑒定多態(tài)性。與編碼序列相比,重復(fù)序列更可能包含5-甲基化的胞嘧啶,例如,在-CG-和-CNG-序列片段中。在該方法的一個(gè)實(shí)施方案中,用選自AciI.ApaI、AgeI、BsrFI>BssHII>EagI、EaeI、HhaI>HinPlI>HpaII>MspI>MspMII>NarI、NotI、PstI、PvuI、SacII、SmaI、StuI和XhoI的甲基化敏感性核酸內(nèi)切酶消化來(lái)自一種作物植物的至少兩個(gè)不同近交品種的基因組DNA,以提供消化的DNA的集合,該集合可以通過(guò)如凝膠電泳物理分離。從所述每個(gè)品種的消化的DNA獲得大小相當(dāng)?shù)腄NA級(jí)分。將來(lái)自相當(dāng)?shù)募?jí)分的DNA分子插入載體,以構(gòu)建簡(jiǎn)化的基因組DNA克隆的代表性文庫(kù),對(duì)其測(cè)序并比較以鑒定多態(tài)性。一種用于富集編碼區(qū)DNA序列的替代方法使用McrBC限制性核酸內(nèi)切酶,其切開(kāi)含有甲基化胞嘧啶的DNA。可以使用基因組DNA片段構(gòu)建簡(jiǎn)化的代表文庫(kù),該基因組DNA片段通過(guò)物理剪切或用任何限制性酶消化來(lái)切開(kāi)。另一種富集編碼/獨(dú)特序列的方法包括構(gòu)建簡(jiǎn)化的代表文庫(kù)(使用甲基化敏感性的或非甲基化敏感性的酶),在尼龍膜上印刷文庫(kù)的微陣列,接著與由已知存在于文庫(kù)中的重復(fù)元件制成的探針雜交。鑒定重復(fù)序列元件,并通過(guò)只挑選陰性克隆重新排列文庫(kù)。這種方法提供了來(lái)自植物的簡(jiǎn)化代表性基因組DNA的片段,所述植物具有包括有相對(duì)較高水平的甲基化胞嘧啶的DNA區(qū)域和具有相對(duì)較低水平的甲基化胞嘧啶的DNA區(qū)域的基因組DNA。本發(fā)明的簡(jiǎn)化的代表性片段包括來(lái)自具有相對(duì)較低水平的甲基化胞嘧啶的DNA區(qū)域的基因組DNA,并且在特征為所述片段的核苷酸大小在例如500-3000bp范圍內(nèi)的級(jí)分中提供。對(duì)大豆基因組DNA樣品中的多態(tài)性的分型通過(guò)本領(lǐng)域熟知的多種有效方法可以檢測(cè)DNA序列中的多態(tài)性或?qū)ζ溥M(jìn)行分型,這些方法包括但不限于那些在美國(guó)專利5,468,613和5,217,863,5,210,015,5,876,930、6,030,787,6,004,744,6,013,431,5,595,890,5,762,876,5,945,283,5,468,613,6,090,558,5,800,944^P5,616,464中公開(kāi)的方法,本文完整引入這些專利作為參考。然而,本發(fā)明的組合物和方法可以與任一種多態(tài)性分型方法結(jié)合使用,以對(duì)大豆基因組DNA樣品中的多態(tài)性進(jìn)行分型。所用的這些大豆基因組DNA樣品包括但不限于直接從大豆植物中分離出的大豆基因組DNA、克隆的大豆基因組DNA或擴(kuò)增的大豆基因組DNA。例如,如美國(guó)專利5,468,613和5,217,863所公開(kāi)的,通過(guò)與等位基因特異性的寡核苷酸(ASO)探針雜交可以檢測(cè)DNA序列中的多態(tài)性。美國(guó)專利5,468,613公開(kāi)了等位基因特異性的寡核苷酸的雜交,其中,通過(guò)以下程序可以對(duì)核酸檢測(cè)核酸序列中的一個(gè)或多個(gè)核苷酸變異,在該程序中,擴(kuò)增含有核苷酸變異的序列,點(diǎn)樣到膜上,并用標(biāo)記的序列特異性寡核苷酸探針進(jìn)行處理。也可以通過(guò)美國(guó)專利5,800,944公開(kāi)的探針連接方法檢測(cè)靶核酸序列,其中,擴(kuò)增目標(biāo)序列,并將其與探針雜交,接著進(jìn)行連接以檢測(cè)該探針的標(biāo)記的部分。微陣列也可用于多態(tài)性檢測(cè),其中,以重疊的方式組裝寡核苷酸探針組以代表一種序列,這樣,靶序列在一個(gè)點(diǎn)的差異會(huì)導(dǎo)致部分探針雜交(Borevitz等人,GenomeRes.13513-523(2003);Cui等人,Bioinformatics21:3852_3858(2005))。在任何一個(gè)微陣列上,預(yù)計(jì)會(huì)有多個(gè)靶序列,它們可以代表基因和/或非編碼區(qū),其中每個(gè)靶序列由一系列重疊的寡核苷酸,而不是由一個(gè)探針?biāo)?。該平臺(tái)允許高通量篩選多種多態(tài)性。單特征多態(tài)性(SFP)是通過(guò)寡核苷酸陣列中的單探針檢測(cè)的多態(tài)性,其中,特征是陣列中的探針。美國(guó)專利6,799,122,6,913,879和6,996,476公開(kāi)了通過(guò)基于微陣列的方法對(duì)靶序列的分型。也可以通過(guò)美國(guó)專利5,616,464公開(kāi)的探針連接方法檢測(cè)靶核酸序列,該方法采用至少一對(duì)探針,該探針具有與靶核酸序列的相鄰部分同源的序列且具有側(cè)鏈,所述側(cè)鏈在所述探針與所述靶核酸序列堿基配對(duì)時(shí)非共價(jià)結(jié)合以形成莖。至少一個(gè)側(cè)鏈具有光可活化的基團(tuán),該基團(tuán)可以與莖的其它側(cè)鏈成員形成共價(jià)交聯(lián)。檢測(cè)SNP和Indel的其它方法包括單堿基延伸(SBE)方法。SBE方法的例子包括但不限于在美國(guó)專利6,004,744,6,013,431,5,595,890,5,762,876和5,945,283中公開(kāi)的方法。SBE方法基于直接鄰近多態(tài)性的核苷酸引物的延伸,以在引物延伸后摻入可檢測(cè)的核苷酸殘基。在某些實(shí)施方案中,SBE方法使用三種合成寡核苷酸。其中兩種寡核苷酸作為PCR引物,且與位于含有待測(cè)多態(tài)性的區(qū)域側(cè)翼的大豆基因組DNA的基因座序列互補(bǔ)。在對(duì)含有多態(tài)性的大豆基因組區(qū)域擴(kuò)增后,PCR產(chǎn)物與第三寡核苷酸(稱為延伸引物)混合,所述第三寡核苷酸設(shè)計(jì)為在DNA聚合酶和兩種差異標(biāo)記的雙脫氧核苷三磷酸的存在下,與直接鄰近多態(tài)性的擴(kuò)增的DNA雜交。如果模板上存在多態(tài)性,則可以在單堿基鏈延伸中將一個(gè)標(biāo)記的雙脫氧核苷三磷酸添加到引物中。然后通過(guò)確定兩個(gè)差別標(biāo)記中的哪一個(gè)被添加到延伸引物中來(lái)推斷存在的等位基因。純合的樣品將導(dǎo)致兩個(gè)標(biāo)記的堿基中只有一個(gè)被摻入,因此兩個(gè)標(biāo)記中只有一個(gè)被檢測(cè)到。雜合的樣品存在兩個(gè)等位基因,因此直接摻入兩個(gè)標(biāo)記(進(jìn)入延伸引物的不同的分子中),因此這兩個(gè)標(biāo)記都被檢測(cè)到。在一種優(yōu)選的檢測(cè)多態(tài)性的方法中,可以通過(guò)美國(guó)專利5,210,015,5,876,930和6,030,787中公開(kāi)的方法檢測(cè)SNP和Indel,其中,具有5'熒光報(bào)告染料和3'猝滅染料的寡核苷酸探針與探針的5'和3'端共價(jià)連接。當(dāng)探針完整時(shí),報(bào)告染料接近猝滅染料導(dǎo)致報(bào)告染料熒光被抑制,例如通過(guò)福斯特型能量轉(zhuǎn)移(Forster-typeenergytransfer)0在PCR正向和反向引物與位于多態(tài)性側(cè)翼的靶DNA的特定序列雜交過(guò)程中,雜交探針與位于擴(kuò)增的PCR產(chǎn)物中的含有多態(tài)性的序列雜交。在隨后的PCR循環(huán)中,具有5’一3’核酸外切酶活性的DNA聚合酶切割探針,并分離報(bào)告染料與猝滅染料,導(dǎo)致報(bào)告染料的熒光增強(qiáng)。一種有用的試驗(yàn)是可從ABBiosystems獲得的Taqman試驗(yàn),其在一個(gè)反應(yīng)中采用4種合成寡核苷酸,其同時(shí)擴(kuò)增大豆基因組DNA,區(qū)別存在的等位基因,并直接提供用于區(qū)別和檢測(cè)的信號(hào)。4種寡核苷酸中的2種作為PCR引物,并產(chǎn)生包含待檢測(cè)的多態(tài)性的PCR產(chǎn)物。另外兩個(gè)是等位基因特異性的熒光共振能量轉(zhuǎn)移(FRET)探針。在這種試驗(yàn)中,使用兩種攜帶不同的熒光報(bào)告染料的FRET探針,其中,將獨(dú)特的染料摻入可以與兩個(gè)等位基因中的僅僅一個(gè)高特異性退火的寡核苷酸中。有用的報(bào)告染料包括但不限于6-羧基-4,7,2,,7,_四氯熒光素(TET)、2'-氯-7'-苯基_1,4-二氯-6-羧基熒光素(VIC)和6-羧基熒光素亞磷酰胺(FAM)。一種有用的猝滅劑是6-羧基-N,N,N’,N’-四甲基羅丹明(TAMRA)。此外,化學(xué)封閉每個(gè)FRET探針的3'末端,使得它不能作為PCR引物發(fā)揮作用。也存在用作被動(dòng)參比的第三熒光團(tuán),例如羅丹明X(ROX),以幫助有關(guān)的熒光值在隨后的標(biāo)準(zhǔn)化(校正反應(yīng)裝配中的空間誤差)。啟動(dòng)基因組DNA的擴(kuò)增。在每一個(gè)PCR循環(huán)中,F(xiàn)RET探針以等位基因特異性的方式與模板DNA分子退火。當(dāng)酶遇到退火探針的5'端時(shí),退火的(不是非退火的)FRET探針被TAQDNA聚合酶降解,從而從猝滅劑附近釋放出熒光團(tuán)。PCR之后,使用熒光計(jì)確定兩個(gè)熒光團(tuán)各自的熒光,以及被動(dòng)參比的熒光。兩種染料各自的熒光的標(biāo)準(zhǔn)化強(qiáng)度與樣本中最初存在的每種等位基因的量成比例,因此,可以推斷出樣本的基因型。為了設(shè)計(jì)用于該試驗(yàn)的引物和探針,首先掩蔽基因座序列,以防止這三個(gè)引物中的任何一個(gè)被設(shè)計(jì)到匹配已知的大豆重復(fù)元件(例如,轉(zhuǎn)座子)或者具有非常低的序列復(fù)雜性(二-或三-核苷酸重復(fù)序列)的位點(diǎn)。引物向這些重復(fù)元件的設(shè)計(jì),通過(guò)多個(gè)基因座的擴(kuò)增或FRET探針與多個(gè)位點(diǎn)的退火,導(dǎo)致低特異性的試驗(yàn)。PCR引物設(shè)計(jì)為(a)在多態(tài)性基因座中具有15_25個(gè)堿基大小的長(zhǎng)度和匹配序列,(b)具有57-60°C的計(jì)算解鏈溫度,例如,對(duì)應(yīng)于52-55°C的最佳PCR退火溫度,(c)產(chǎn)生包含多態(tài)性位點(diǎn)并且通常具有75-250個(gè)堿基對(duì)大小的長(zhǎng)度的產(chǎn)物。但是,在美國(guó)專利6,410,277中也公開(kāi)了允許擴(kuò)增長(zhǎng)度高達(dá)1000個(gè)或更多堿基對(duì)的片段的PCR技術(shù)。PCR引物優(yōu)選位于基因座上,使得多態(tài)性位點(diǎn)離開(kāi)每個(gè)PCR引物的3'端至少一個(gè)堿基。但是,應(yīng)當(dāng)理解,PCR引物可以遠(yuǎn)離多態(tài)性多達(dá)1000個(gè)堿基對(duì),并仍然提供1000個(gè)或更多堿基對(duì)的相應(yīng)DNA片段的擴(kuò)增,所述DNA片段包含多態(tài)性,并可以用于分型試驗(yàn)。PCR引物不能包含廣泛地自身或相互互補(bǔ)的區(qū)域。設(shè)計(jì)FRET探針以跨越多態(tài)性位點(diǎn)的序列,優(yōu)選地多態(tài)性位于寡核苷酸的3'的2/3處。在優(yōu)選的實(shí)施方案中,F(xiàn)RET探針在其3'末端摻入化學(xué)部分,當(dāng)探針與模板DNA退火時(shí),所述化學(xué)部分與DNA的小溝結(jié)合,從而提高探針_模板復(fù)合物的穩(wěn)定性。探針應(yīng)該具有12-17個(gè)堿基的長(zhǎng)度,并具有3'MGB,具有比PCR引物高5-7°C的計(jì)算解鏈溫度。美國(guó)專利5,538,848,6,084,102和6,127,121公開(kāi)了探針設(shè)計(jì)。也涉及通過(guò)使用瓣核酸內(nèi)切酶介導(dǎo)的試驗(yàn)(Invader,ThirdffaveTechnologies,MadisonWisconsin)對(duì)單核苷酸多態(tài)性進(jìn)行分型的寡核苷酸探針。在這些試驗(yàn)中,瓣核酸內(nèi)切酶(裂解酶)切開(kāi)由兩個(gè)重疊的寡核苷酸與分型的序列雜交產(chǎn)生的三股螺旋(Lyamichev等人,Nat.Biotechnol.,17,292-296,1999)。該分型的序列可以是大豆基因組DNA、克隆的大豆基因組DNA或擴(kuò)增的大豆基因組DNA。切割一個(gè)與待分型的序列雜交的寡核苷酸釋放瓣(flap),所述瓣又與“FRET盒”寡核苷酸形成三股螺旋,導(dǎo)致釋放熒光共振能量轉(zhuǎn)移(FRET)標(biāo)記的第二切割反應(yīng)。已描述了使用一種FRET標(biāo)記對(duì)多態(tài)性的一個(gè)等位基因進(jìn)行分型的實(shí)施方案(MeinC.A.,等人GenomeRes.,10,330-343,2000)。在這種方法的其它實(shí)施方案中,可以通過(guò)使用不同類(lèi)型的FRET標(biāo)記同時(shí)對(duì)多態(tài)性的兩個(gè)等位基因進(jìn)行分型(Lyamichev等人,同上)。也描述了瓣核酸內(nèi)切酶介導(dǎo)的高通量試驗(yàn),其適于產(chǎn)生用于對(duì)多種多態(tài)性進(jìn)行分型的核苷酸組(Olivier,等人,NucleicAcidsRes.30(12)e53,2002)。適于用裂解酶對(duì)表1或表3的多態(tài)性進(jìn)行分型的分離的核酸分子可以包括至少一個(gè)具有“通用”5’瓣序列的第一探針、至少一個(gè)第二或“Invader’’探針和至少一個(gè)包含標(biāo)記堿基和猝滅堿基的“FRET”盒,該盒包含與一經(jīng)裂解即從第一探針上釋放的“通用瓣核酸序列”互補(bǔ)的序列。當(dāng)擴(kuò)增分型的大豆基因組DNA序列時(shí),也可以使用類(lèi)似于上文所述的側(cè)翼PCR引物。這些探針的設(shè)計(jì)只需要在表1或表3中指出的多態(tài)性堿基的任一側(cè)提供@40-50^h—gl。$“SingleNucleotidePolymorphisms"(MethodsandProtocols)Volume212,Chapter16,V.LyamichevandB.Neripp.229—240HumanaPress.2002中描述了設(shè)計(jì)用于瓣核酸內(nèi)切酶試驗(yàn)的探針的一般方面。應(yīng)用多態(tài)性建立標(biāo)記/性狀關(guān)聯(lián)本發(fā)明的基因座中的多態(tài)性可用于標(biāo)記/性狀關(guān)聯(lián)的鑒定,這種關(guān)聯(lián)是從群體成員的基因型和表型的統(tǒng)計(jì)分析推斷出的。這些成員可以是單個(gè)生物體,例如大豆,密切相關(guān)的個(gè)體的家族、近交系、密切相關(guān)的個(gè)體的加倍的單倍體或其它群體。這樣的大豆群體被稱為“系”,表示起源系。群體可以起源于兩個(gè)個(gè)體或兩個(gè)系(例如,定位的群體)之間的單個(gè)雜交,或者,它可以由具有多個(gè)起源系的個(gè)體組成。每個(gè)個(gè)體或系的特征在于單個(gè)或平均的性狀表型和在一個(gè)或多個(gè)標(biāo)記基因座處的基因型。可以利用幾種類(lèi)型的統(tǒng)計(jì)學(xué)分析從表型/基因型數(shù)據(jù)推斷標(biāo)記/性狀的關(guān)聯(lián),但一個(gè)基本的想法是檢測(cè)分子標(biāo)記,即多態(tài)性,對(duì)于多態(tài)性,可替代的基因型具有顯著不同的平均表型。例如,如果給定的標(biāo)記基因座A具有3個(gè)可替代的基因型(AA、Aa和aa),且如果那3類(lèi)個(gè)體具有顯著不同的表型,那么可以推斷基因座A與該性狀相關(guān)??梢酝ㄟ^(guò)幾種類(lèi)型的標(biāo)準(zhǔn)統(tǒng)計(jì)學(xué)檢驗(yàn)測(cè)試表型的差異的顯著性,如分子標(biāo)記基因型對(duì)表型的線性回歸或方差分析(ANOVA)。通常用來(lái)進(jìn)行這種類(lèi)型的分析的市售統(tǒng)計(jì)軟件包包括SASEnterpriseMiner(SASInstituteInc.,Cary,NC)禾口Splus(InsightfulCorporation.Cambridge,MA)。當(dāng)同時(shí)測(cè)試許多分子標(biāo)記時(shí),在宣布關(guān)聯(lián)所需的顯著性水平上進(jìn)行如Bonferormi修正的調(diào)整。為了QTL作圖,包括的標(biāo)記應(yīng)當(dāng)是來(lái)源特征性的,以對(duì)隨后的群體作出推斷。基于SNP的分子標(biāo)記對(duì)于作圖是理想的,因?yàn)樘囟ǖ腟NP等位基因源自特定物種的現(xiàn)存群體中的獨(dú)立來(lái)源的可能性極低。因此,SNP標(biāo)記可用于示蹤和協(xié)助QTL的滲入,特別是在單元型的情況下。通常,關(guān)聯(lián)研究的目標(biāo)不只是檢測(cè)標(biāo)記/性狀關(guān)聯(lián),而且評(píng)估直接影響性狀的基因(即,QTL)相對(duì)于標(biāo)記位置的位置。在實(shí)現(xiàn)該目標(biāo)的一個(gè)簡(jiǎn)單的方法中,在標(biāo)記基因座之間比較替代基因型之間的差異大小或差異顯著性的水平。推斷性狀基因位于最接近具有最大相關(guān)的基因型差異的標(biāo)記處。可以通過(guò)基因作圖模型建立另外的標(biāo)記分子的遺傳連鎖,所述基因作圖模型例如,但不限于,Lander等人(Lander等人,Genetics,121:185-199(1989))報(bào)道的側(cè)翼標(biāo)記模型,和區(qū)間作圖(intervalmapping),其基于其中所述的最大似然法,并用軟件包MAPMAKER/QTL執(zhí)行(Lincoln和Lander,MappingGenesControllingQuantitativeTraitsUsingMAPMAKER/QTL,WhiteheadInstituteforBiomedicalResearch,Massachusetts,(1990))。另夕卜的軟件包括Qgene,Version2.23(1996),DepartmentofPlantBreedingandBiometry,266EmersonHall,CornellUniversity,Ithaca,NY。使用Qgene軟件是一種特別優(yōu)選的方法。對(duì)于標(biāo)記的存在,計(jì)算最大似然估計(jì)值(MLE),以及假設(shè)沒(méi)有QTL效應(yīng)的MLE,以避免假陽(yáng)性。然后計(jì)算優(yōu)勢(shì)率的log1(l(L0D):L0D=log1Q(假定沒(méi)有相關(guān)的QTL,對(duì)于QTL/MLE的存在的MLE)。L0D得分基本上指示,假定存在QTL,相對(duì)于不存在QTL,獲得數(shù)據(jù)的可能性增大多少。為了避免比如95%的給定置信度時(shí)的假陽(yáng)性的L0D閾值取決于標(biāo)記的數(shù)量和基因組的長(zhǎng)度。Lander等人(1989)說(shuō)明了顯示L0D閾值的曲線圖,且Arts禾口Moreno-Gonzdlez,PlantBreeding,Hayward,Bosemark,Romagosa(編)Chapman&Hall,London,第314-331頁(yè)(1993)進(jìn)一步對(duì)其描述??梢允褂昧硗獾哪P?。已經(jīng)報(bào)導(dǎo)了對(duì)于區(qū)間作圖的許多修改和可供選擇的方法,包括使用非參數(shù)法(Kruglyak等人,Genetics,1391421-1428(1995))。也可以使用多元回歸方法或模型,其中,在大量標(biāo)記上對(duì)性狀進(jìn)行回歸(Jansen,BiometricsinPlantBreed,vanOijen,Jansen(^m)ProceedingsoftheNinthMeetingoftheEucarpiaSectionBiometricsinPlantBreeding,TheNetherlands,第116-124頁(yè)(1994);Weber禾口Wricke,AdvancesinPlantBreeding,Blackwell,Berlin,16(1994))。Jansen等人(Jansen等人,Genetics,1361447—1455(1994))禾口Zeng(Zeng,Genetics1361457-1468(1994))報(bào)道了組合了區(qū)間作圖與回歸分析的程序,由此將表型回歸到給定的標(biāo)記區(qū)間的單個(gè)假定的QTL上,且同時(shí)回歸到作為'輔助因素'的許多標(biāo)記上。一般來(lái)說(shuō),輔助因素的使用減少了估計(jì)的QTL位置的偏差和抽樣誤差(Utz和Melchinger,BiometricsinPlantBreeding,vanOijen,Jansen(^m)ProceedingsoftheNinthMeetingoftheEucarpiaSectionBiometricsinPlantBreeding,TheNetherlands,第195-204頁(yè)(1994)),從而提高QTL作圖的精度和效率(Zeng1994)。這些模型可以擴(kuò)展到多環(huán)境實(shí)驗(yàn),以分析基因型_環(huán)境的相互作用(Jansen等人,Theor.Appl.Genet.9133-3(1995))。傳統(tǒng)的QTL作圖的替代方法包括通過(guò)相對(duì)于各個(gè)標(biāo)記對(duì)單元型作圖以實(shí)現(xiàn)更高的分辨率(Fan等人2006Genetics172:663_686),因?yàn)閭鹘y(tǒng)的QTL作圖研究的一種局限性是推斷僅限于作圖群體的特定親本和這些親本變種的基因或基因組合的事實(shí)。這種方法跟蹤被稱為單元型的DNA模塊,該DNA模塊由多態(tài)性標(biāo)記所定義,假定它們?cè)谧鲌D群體中來(lái)源相同。長(zhǎng)期以來(lái)一直認(rèn)為,基因和基因組序列可以是狀態(tài)同一的(即,獨(dú)立起源相同)或來(lái)源同一的(即,通過(guò)來(lái)自共同祖先的歷史遺傳),這對(duì)于連鎖不平衡研究、且最終對(duì)作圖研究具有巨大的意義(Nordberg等人2002TrendsGen.)。從歷史上看,遺傳標(biāo)記不適合區(qū)分狀態(tài)同一或來(lái)源同一。然而,標(biāo)記的新類(lèi)型,如SNP(單核苷酸多態(tài)性),更能說(shuō)明起源。特定SNP等位基因源自特定物種的現(xiàn)存群體中的獨(dú)立來(lái)源的可能性非常低。連鎖基因中出現(xiàn)的多態(tài)性以緩慢但可預(yù)測(cè)的速度隨機(jī)分類(lèi),由連鎖不平衡的衰減或連鎖平衡的方法描述。這種良好建立的科學(xué)發(fā)現(xiàn)的后果是由多態(tài)性的特定組合確定的一長(zhǎng)段編碼DNA是非常獨(dú)特的,并且除了通過(guò)連鎖不平衡以外,非常不可能重復(fù)存在,這指示來(lái)自共同祖先的最近的共祖先。由一些等位基因組合定義的特定基因組區(qū)域表示整個(gè)間插遺傳序列的絕對(duì)同一性的可能性取決于該基因組區(qū)域中的連鎖的多態(tài)性的數(shù)量,除非在該區(qū)間中最近發(fā)生了突變。在此,這樣的基因組區(qū)域被稱為單元型窗口。該窗口內(nèi)的每個(gè)單元型由等位基因的特定組合定義;等位基因的數(shù)量越大,潛在的單元型的數(shù)目就越大,而且該區(qū)域中狀態(tài)同一性是來(lái)源同一性的結(jié)果的確定性就越大。在新系的開(kāi)發(fā)過(guò)程中,祖先單元型通過(guò)這一過(guò)程保留,并且一般被認(rèn)為是作為單元通過(guò)譜系遺傳的‘連鎖塊’。此外,如果特定的單元型具有已知的效應(yīng),或者表型,可以推斷它在具有相同單元型的其它系中的效應(yīng),這可以使用對(duì)于該單元型窗口的一個(gè)或多個(gè)診斷標(biāo)記來(lái)確定。這一假設(shè)導(dǎo)致較大的有效樣本量,提供更大的QTL分辨率。用于確定表型和基因型(在這種情況下為單元型)之間相關(guān)性的統(tǒng)計(jì)學(xué)顯著性的方法可以通過(guò)本領(lǐng)域已知的并且具有任何公認(rèn)的所需統(tǒng)計(jì)學(xué)顯著性閾值的任何統(tǒng)計(jì)學(xué)檢驗(yàn)來(lái)確定。特定的方法和顯著性閾值的應(yīng)用是本領(lǐng)域的普通技術(shù)人員所熟知的。遺傳圖譜的構(gòu)建在本發(fā)明的另一方面,本發(fā)明的基因座中的多態(tài)性定位于大豆基因組上,例如,作為大豆基因組的遺傳圖譜,其包括如表1所示的、更優(yōu)選地如表3所示的兩種或多種多態(tài)性的圖譜位置。這種遺傳圖譜如圖1所示。遺傳圖譜數(shù)據(jù)也可以記錄在計(jì)算機(jī)可讀介質(zhì)上。本發(fā)明的優(yōu)選實(shí)施方案提供高密度的(例如在大豆基因組圖譜上有至少150種或更多,例如至少500或1000種多態(tài)性)多態(tài)性遺傳圖譜。特別有用的遺傳圖譜包括在連鎖群上的平均距離不超過(guò)10厘摩(cM)的多態(tài)性。連鎖不平衡作圖和關(guān)聯(lián)研究另一種確定性狀基因位置的方法是分析其中個(gè)體的性狀和標(biāo)記基因座都不同的群體中的標(biāo)記/性狀關(guān)聯(lián)。在該群體中,由于群體的遺傳過(guò)程,如突變的獨(dú)特起源、建立者事件(founderevents)、隨機(jī)漂變和群體結(jié)構(gòu),某些標(biāo)記等位基因可能與某些性狀基因座等位基因相關(guān)聯(lián)。這種關(guān)聯(lián)被稱為連鎖不平衡。在植物育種群體中,連鎖不平衡(LD)是離開(kāi)群體中兩個(gè)或多個(gè)基因座之間的隨機(jī)關(guān)聯(lián)的水平,且LD往往存在于大的染色體片段上。雖然有可能關(guān)注該片段中每個(gè)基因的單獨(dú)效應(yīng),但是對(duì)于實(shí)際的植物育種來(lái)說(shuō),一般強(qiáng)調(diào)當(dāng)區(qū)域存在于系、雜種或變種中時(shí)對(duì)目標(biāo)性狀的平均影響。在連鎖不平衡作圖中,比較在標(biāo)記基因座處具有不同基因型的個(gè)體的性狀值。通常,顯著的性狀差別表明標(biāo)記基因座與一個(gè)或多個(gè)性狀基因座之間非常接近。如果標(biāo)記密度適當(dāng)?shù)馗撸疫B鎖不平衡只在染色體上非常緊密連鎖的位點(diǎn)之間發(fā)生,那么性31狀基因座的位置可以非常精確。標(biāo)記輔助的育種和標(biāo)記輔助的選擇當(dāng)數(shù)量性狀基因座(QTL)已被定位于分子標(biāo)記的附近時(shí),這些標(biāo)記可以用來(lái)針對(duì)提高的性狀值進(jìn)行選擇,而無(wú)需在每個(gè)選擇循環(huán)時(shí)進(jìn)行表型分析。在標(biāo)記輔助的育種和標(biāo)記輔助的選擇中,首先通過(guò)遺傳作圖分析建立QTL與標(biāo)記之間的關(guān)聯(lián)(如在A.1或A.2中)。在同樣的過(guò)程中,確定哪些分子標(biāo)記等位基因與有利的QTL等位基因連鎖。隨后,在群體中選擇與有利的QTL等位基因相關(guān)聯(lián)的標(biāo)記等位基因。如果在標(biāo)記與QTL之間有足夠緊密的連鎖,此過(guò)程將提高性狀值。所需的連鎖程度取決于選擇的代數(shù),因?yàn)樵诿恳淮?,有機(jī)會(huì)通過(guò)重組打破關(guān)聯(lián)。特定標(biāo)記等位基因與有利的QTL等位基因之間的關(guān)聯(lián)還可以用于預(yù)測(cè)哪些類(lèi)型的后代可以從給定的雜交中分離。這種預(yù)測(cè)可以允許選擇適合于產(chǎn)生群體的親本,從該群體中裝配有利的QTL等位基因的新組合以產(chǎn)生新的近交系。例如,如果系A(chǔ)在基因座1、20和31處具有以前已知與有利的QTL等位基因相關(guān)聯(lián)的標(biāo)記等位基因,而系B在基因座15、27和29處具有與有利的效應(yīng)相關(guān)聯(lián)的標(biāo)記等位基因,那么可以通過(guò)雜交AxB并選擇在全部6個(gè)QTL處具有有利的等位基因的后代來(lái)開(kāi)發(fā)新系。分子標(biāo)記用于加速轉(zhuǎn)基因向新的遺傳背景中的滲入(即,進(jìn)入不同范圍的種質(zhì)中)。簡(jiǎn)單的基因滲入包括使轉(zhuǎn)基因系與優(yōu)良近交系雜交,然后使該雜種與優(yōu)良(輪回)親本反復(fù)回交,同時(shí)針對(duì)轉(zhuǎn)基因的保持進(jìn)行選擇。經(jīng)過(guò)多代回交,通過(guò)重組和分離,初始轉(zhuǎn)基因系的遺傳背景逐漸被優(yōu)良近交系的遺傳背景所取代。通過(guò)根據(jù)源自回交親本的分子標(biāo)記等位基因進(jìn)行選擇,可以加速這個(gè)過(guò)程。此外,近交系的指紋是在一組兩個(gè)或多個(gè)標(biāo)記基因座處等位基因的組合。高密度指紋可以用來(lái)建立和追蹤種質(zhì)的身份,種質(zhì)身份可用于建立標(biāo)記-性狀關(guān)聯(lián)的數(shù)據(jù)庫(kù),以益于整個(gè)作物育種程序,以及種質(zhì)所有權(quán)的保護(hù)。選擇用于植物育種的親本親本、后代或測(cè)試植物的方法也想到本文提供的多態(tài)性可以用于為植物育種選擇親本、后代或測(cè)試植物。從表型上無(wú)法區(qū)分的植物的群體中選擇這些植物的能力可以加速植物育種并減少因進(jìn)行表型性狀分析而導(dǎo)致的費(fèi)用。選擇用于育種的植物的方法包括以下步驟a)確定表1或表3中確定的多種多態(tài)性與至少第一和第二大豆近交系中的多種性狀之間的關(guān)聯(lián);b)確定親本、后代或測(cè)試植物中的一種或多種多態(tài)性的等位基因狀態(tài);和c)選擇具有更有利的相關(guān)性狀組合的親本、后代或測(cè)試植物。在某些應(yīng)用中,通過(guò)這種方法選擇的親本、后代或測(cè)試植物是大豆近交系。在其它實(shí)施方案中,相關(guān)性狀的有利組合提供了改善的雜種優(yōu)勢(shì)。在一個(gè)實(shí)施方案中,確定至少兩種多態(tài)性的基因型有助于選擇用于育種雜交的親本。這種確定給育種者提供了產(chǎn)生雜交的優(yōu)勢(shì),其中針對(duì)至少兩個(gè)優(yōu)選的基因組區(qū)域,以產(chǎn)生具有至少兩個(gè)優(yōu)選的基因組區(qū)域的后代。在另一方面,確定至少兩種多態(tài)性的基因型可以為在后代中作出選擇決定提供基礎(chǔ),其中,那些包含優(yōu)選的基因組區(qū)域的后代在育種計(jì)劃中被選出。在另外一方面,可以選擇用于評(píng)估近交系在雜種組合中的組合能力的測(cè)試系,納入基于存在或不存在至少兩個(gè)基因組區(qū)域的近交測(cè)試計(jì)劃中,以確保在不同的種質(zhì)庫(kù)(即不同的雜種優(yōu)勢(shì)群)之間進(jìn)行雜交。雜種預(yù)測(cè)通過(guò)在兩個(gè)屬于不同的“雜種優(yōu)勢(shì)群”的優(yōu)良近交系之間進(jìn)行雜交而產(chǎn)生商品大豆種子。這些群在遺傳學(xué)上足夠不同,使得它們之間的雜種顯示高水平的雜種優(yōu)勢(shì)(即,相對(duì)于親本系性能提高)。通過(guò)分析優(yōu)良雜種的標(biāo)記組成,可以鑒定在良好組合產(chǎn)生雜種優(yōu)勢(shì)的雄系和雌系中的不同基因座處的等位基因組。認(rèn)識(shí)這些模式并了解不同近交系的標(biāo)記組成,可以預(yù)測(cè)不同對(duì)品系之間的雜種優(yōu)勢(shì)的水平。這些預(yù)測(cè)可以減少應(yīng)使用相反雜種優(yōu)勢(shì)群的哪些品系測(cè)試新近交系的性能的可能性。本發(fā)明提供了用于提高雜交大豆的雜種優(yōu)勢(shì)的方法。在這些方法中,在與本發(fā)明多態(tài)性基因座連鎖的多種多態(tài)性與兩個(gè)以上的大豆近交系中的性狀之間建立關(guān)聯(lián)。選擇兩個(gè)這樣的具有預(yù)測(cè)可提高雜種優(yōu)勢(shì)的互補(bǔ)性雜種優(yōu)勢(shì)群的近交系用于育種。提高雜種優(yōu)勢(shì)的方法包括以下步驟(a)確定表1或表3中確定的多種多態(tài)性與兩個(gè)以上的大豆近交系中的多種性狀之間的關(guān)聯(lián);(b)將選自步驟(a)的近交系的兩個(gè)近交系分配至雜種優(yōu)勢(shì)群;(c)在步驟(b)的至少兩個(gè)近交系之間進(jìn)行至少一次雜交,其中,每個(gè)近交系來(lái)自不同的和互補(bǔ)的雜種優(yōu)勢(shì)群,并且其中,對(duì)于提高雜種優(yōu)勢(shì)的遺傳特征優(yōu)化互補(bǔ)雜種優(yōu)勢(shì)群;和(d)通過(guò)步驟(c)的所述雜交獲得雜種后代植物,其中,相對(duì)于與未經(jīng)選擇的近交系雜交產(chǎn)生的后代,所述雜種后代植物顯示提高的雜種優(yōu)勢(shì)。這些方法還可以在步驟(c)中包括傳統(tǒng)的單雜交(即,兩個(gè)近交系之間,理想地來(lái)自不同的雜種優(yōu)勢(shì)群)、三元雜交(單雜交后,與第三近交系雜交)和雙雜交(也稱為四元雜交,即兩個(gè)單雜交的后代雜交)。可以通過(guò)在選擇的雄性能育親本之間進(jìn)行手工雜交或通過(guò)使用雄性不育雜交系統(tǒng)實(shí)現(xiàn)雜交。在Bernardo,BreedingforQuantitativeTraitsinPlants,StemmaPress,Woodbury,MN,2002中描述了優(yōu)良近交系的開(kāi)發(fā)和選擇、這些系的雜交和選擇優(yōu)良雜種雜交鑒定新的優(yōu)良大豆雜種。遺傳來(lái)源同一性雜種優(yōu)勢(shì)的一種理論預(yù)測(cè),在用于產(chǎn)生雜種的雄性和雌性系之間的遺傳來(lái)源同一性(IBD)區(qū)域會(huì)降低雜種性能??梢詮牟煌抵械臉?biāo)記等位基因的模式推斷遺傳來(lái)源同一性。如果在一系列鄰近的基因座處的一串相同標(biāo)記不可能偶然地獨(dú)立發(fā)生,則可以認(rèn)為它們是遺傳來(lái)源同一的。雄性和雌性系中的標(biāo)記指紋分析可以鑒定IBD區(qū)域。對(duì)這些區(qū)域的知識(shí)有助于選擇雜種親本,因?yàn)樵陔s種中避免IBD可能提高性能。這種知識(shí)也有助于育種計(jì)劃,其中可以設(shè)計(jì)雜交以產(chǎn)生顯示很少或沒(méi)有IBD的近交系對(duì)(一雄一雌)。用于基因分型的核酸分子文庫(kù)本發(fā)明提供的核酸文庫(kù)可用于與大豆種質(zhì)改良相關(guān)的活動(dòng),包括但不限于使用植物進(jìn)行育種雜交,對(duì)植物的進(jìn)一步的遺傳或表型測(cè)試,植物通過(guò)自體受精的改進(jìn),使用植物或其部分進(jìn)行轉(zhuǎn)化,以及使用植物或其部分進(jìn)行誘變??梢詫?duì)文庫(kù)中的不同組核酸采樣,訪問(wèn),或者對(duì)其任何組、亞組或組合單獨(dú)進(jìn)行查詢,以對(duì)本文表1或3中提供的任何大豆基因組DNA進(jìn)行分型。一般來(lái)說(shuō),文庫(kù)包括至少兩組不同的核酸分子,其中所述不同核酸分子組中的每一個(gè)允許對(duì)表1或表3中確定的相應(yīng)的大豆基因組DNA多態(tài)性進(jìn)行分型。在一個(gè)實(shí)施方案中,允許對(duì)表1或表3中確定的相應(yīng)的大豆基因組DNA多態(tài)性進(jìn)行分型的不同組核酸分子分布于微量滴定板的各個(gè)孔中。在某些實(shí)施方案中,微量滴定板的每個(gè)孔中包含一種或多種允許對(duì)表1或表3中確定的僅一種大豆多態(tài)性進(jìn)行分型的核酸分子。但是,也涉及其它實(shí)施方案,其中,微量滴定板的每個(gè)孔中包含一種或多種允許對(duì)表1或表3中確定的一種以上的大豆多態(tài)性進(jìn)行分型的核酸分子。微量滴定板可以具有少至8個(gè)孔,或多達(dá)24、96、384、1536或3456個(gè)孔。微量滴定板可以由以下材料制造,包括但不限于,聚苯乙烯、聚丙烯或環(huán)-烯烴塑料。每個(gè)孔中的核酸分子可以在溶液中或是干燥的(即,凍干形式)。通常,核酸分配到微量滴定板的孔中,使得微量滴定板每孔中的核酸是已知的。但是,在核酸分子與獨(dú)特的標(biāo)識(shí)物(如獨(dú)特的染料或其它獨(dú)特的識(shí)別標(biāo)記)相關(guān)聯(lián)的其它實(shí)施方案中,核酸可以隨機(jī)地分配到微量滴定板的孔中。從本說(shuō)明書(shū)中可以清楚地看出,也涉及包括分配在微量滴定板孔中的、固定于固體載體(如珠子)上的核酸的文庫(kù)。在其它實(shí)施方案中,允許對(duì)表1或表3中確定的大豆基因組多態(tài)性進(jìn)行分型的核酸固定(即,共價(jià)連接)于固體載體上。固體載體包括但不限于珠子、芯片、陣列或過(guò)濾器。用作固體載體的珠子可以是磁珠,以幫助雜交復(fù)合物的純化?;蛘撸樽涌梢园?dú)特的識(shí)別標(biāo)記。特別地,用可以根據(jù)其分光光度或熒光性質(zhì)進(jìn)行區(qū)分的熒光染料染色的珠子,可以偶聯(lián)到用于對(duì)多態(tài)性進(jìn)行分型的核酸分子上。這些用于對(duì)多態(tài)性進(jìn)行分型的基于珠子的系統(tǒng)已有描述(美國(guó)專利5,736,330)。染料標(biāo)記的珠子、分析試劑和用于對(duì)多態(tài)性進(jìn)行分型的裝置也已有描述(美國(guó)專利6,649,414,6,599,331和6,592,822),并且可從LuminexCorporation(Austin,Texas,USA)獲得。如上所述,與珠子連接的文庫(kù)核酸分子也可以是芯片、陣列或過(guò)濾器還可以用于固定對(duì)表1或表3的多態(tài)性進(jìn)行分型的核酸分子。在某些實(shí)施方案中,用于對(duì)給定的多態(tài)性進(jìn)行分型的核酸標(biāo)記將固定于陣列上規(guī)定的物理位置,使得可以產(chǎn)生并記錄來(lái)自對(duì)應(yīng)于給定多態(tài)性的位置的分型數(shù)據(jù),用于隨后的分析。制造及使用用于對(duì)多態(tài)性進(jìn)行分型的陣列的方法包括但不限于在美國(guó)專利5,858,659(基于雜交的方法)和美國(guó)專利6,294,336(單堿基延伸方法)中所描述的方法。應(yīng)用多態(tài)性分析對(duì)DNA克隆文庫(kù)進(jìn)行作圖由本發(fā)明的分子標(biāo)記代表的多態(tài)性和基因座可用于鑒定和定位與分子標(biāo)記連鎖的QTL和基因的DNA序列。例如,可以使用與性狀連鎖的分子標(biāo)記查詢BAC或YAC克隆庫(kù),以找到包含與性狀相關(guān)的特定QTL和基因的克隆。例如,多種(如數(shù)百種或數(shù)千種)大的多基因序列中的QTL和基因可以通過(guò)與寡核苷酸探針雜交來(lái)鑒定,所述寡核苷酸探針能夠與定位的和/或連鎖的分子標(biāo)記雜交,其中,可以檢測(cè)一個(gè)或多個(gè)分子標(biāo)記。通過(guò)在高密度陣列中提供克隆序列可以改進(jìn)這種雜交篩選。該篩選方法更優(yōu)選地通過(guò)采用匯集策略來(lái)改進(jìn),以明顯減少鑒別包含分子標(biāo)記的克隆所需要的雜交數(shù)。當(dāng)對(duì)分子標(biāo)記作圖時(shí),篩選能夠有效地將克隆作圖。例如,在數(shù)千個(gè)克隆排列于規(guī)定的陣列中例如在96孔板中的情況下,這些板可以任意地排列,形成三維排列的孔的堆疊,每個(gè)孔包括獨(dú)特的DNA克隆。每個(gè)堆疊中的孔可以表示為行、列和板的三維陣列中的獨(dú)立要素。在發(fā)明的一方面,堆疊數(shù)目和每個(gè)堆疊中板的數(shù)目大致相等,以使試驗(yàn)次數(shù)減至最少。板的堆疊允許構(gòu)建克隆DNA池。對(duì)于三維排列的堆疊,可以為以下要素創(chuàng)建克隆DNA池(a)每一行的所有要素,(b)每一列的所有要素,和(c)每塊板的所有要素。用可與針對(duì)一個(gè)克隆獨(dú)特的分子標(biāo)記雜交的寡核苷酸探針雜交篩選該池將為一個(gè)列的池、一個(gè)行的池和一塊板的池提供陽(yáng)性指示,從而指示包含目標(biāo)克隆的孔單元(要素)。在多堆疊的情況下,每個(gè)堆疊中所有克隆DNA的其它池允許指示具有目標(biāo)克隆的行-列-板坐標(biāo)的堆疊。例如,4608個(gè)克隆的組可以排列于48塊96孔板中。48塊板可以安排在8組各6塊板的堆疊中,提供6X12X8三維陣列的要素,即每個(gè)堆疊包括8行和12列的6個(gè)堆疊。對(duì)于整個(gè)克隆組,有36個(gè)池,即6個(gè)堆疊的池、8個(gè)行的池、12個(gè)列的池和8個(gè)堆疊的池。因此,需要最多36個(gè)雜交反應(yīng)以找到包含與每個(gè)作圖分子標(biāo)記相關(guān)或連鎖的QTL或基因的克隆。一旦鑒定了克隆,從分子標(biāo)記的基因座設(shè)計(jì)的寡核苷酸引物就可以用于連鎖QTL和/或基因的定位克隆。計(jì)算機(jī)可讀介質(zhì)和數(shù)據(jù)庫(kù)本發(fā)明的核酸分子的序列可以在多種介質(zhì)中“提供”,以方便使用,例如,數(shù)據(jù)庫(kù)或計(jì)算機(jī)可讀介質(zhì),它們也可以以允許熟練技術(shù)人員檢查或查詢序列并獲取有用信息的形式包含描述性注釋。在本發(fā)明的一個(gè)實(shí)施方案中,可以準(zhǔn)備包含核酸序列的計(jì)算機(jī)可讀介質(zhì),這些核酸序列中至少10%或以上,如至少25%或甚至至少50%或以上的基因座和核酸分子的序列代表本發(fā)明的分子標(biāo)記。例如,這樣的數(shù)據(jù)庫(kù)或計(jì)算機(jī)可讀介質(zhì)可以包括本發(fā)明的基因座組或用于檢測(cè)本發(fā)明分子標(biāo)記的引物和探針組。此外,這樣的數(shù)據(jù)庫(kù)或計(jì)算機(jī)可讀介質(zhì)可以包括本發(fā)明的作圖或未作圖的分子標(biāo)記的圖或表和遺傳圖譜。本文所用的“數(shù)據(jù)庫(kù)”是指任何可檢索的所收集數(shù)據(jù)的任何表現(xiàn)形式,包括計(jì)算機(jī)文件,如文本文件、數(shù)據(jù)庫(kù)文件、電子表格文件和圖像文件、印刷表格和圖形表示及數(shù)字和圖像數(shù)據(jù)集合的組合。在本發(fā)明的一個(gè)優(yōu)選方面,“數(shù)據(jù)庫(kù)”是指可以存儲(chǔ)計(jì)算機(jī)可搜索的信息的存儲(chǔ)系統(tǒng)。目前,優(yōu)選的數(shù)據(jù)庫(kù)應(yīng)用程序包括由DB2、Sybase和Oracle提供的數(shù)據(jù)庫(kù)應(yīng)用程序。本文所用的“計(jì)算機(jī)可讀介質(zhì)”是指任何可以由計(jì)算機(jī)直接讀取并訪問(wèn)的介質(zhì)。這樣的介質(zhì)包括但不限于磁性存儲(chǔ)介質(zhì),如軟盤(pán)、硬盤(pán)、存儲(chǔ)介質(zhì)和磁帶;光存儲(chǔ)介質(zhì),如CD-ROM;電子存儲(chǔ)介質(zhì),如RAM、DRAM、SRAM、SDRAM和ROM;和ra0M(Era0M、EEPROM,FlashEPROM),以及這些類(lèi)別的雜合體,例如磁/光存儲(chǔ)介質(zhì)。熟練技術(shù)人員可以容易地了解如何使用任何目前已知的計(jì)算機(jī)可讀介質(zhì)創(chuàng)建包括在其上記錄有本發(fā)明核苷酸序列的計(jì)算機(jī)可讀介質(zhì)的產(chǎn)品。本文所用的“記錄”是指在可檢索的數(shù)據(jù)庫(kù)或計(jì)算機(jī)可讀介質(zhì)中存儲(chǔ)信息的過(guò)程的結(jié)果。例如,熟練技術(shù)人員可以容易地采用目前已知的任何一種方法在計(jì)算機(jī)可讀介質(zhì)上記錄信息,以產(chǎn)生包含本發(fā)明的作圖的多態(tài)性和其它核苷酸序列信息的介質(zhì)。熟練技術(shù)人員可以獲得多種數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)用于創(chuàng)建計(jì)算機(jī)可讀介質(zhì),其中,數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的選擇一般基于所選擇的訪問(wèn)存儲(chǔ)信息的手段。此外,多種數(shù)據(jù)處理程序和格式可用于在計(jì)算機(jī)可讀介質(zhì)上存儲(chǔ)本發(fā)明的多態(tài)性和核苷酸序列信息。計(jì)算機(jī)軟件可以公開(kāi)獲得,其允許熟練技術(shù)人員獲得計(jì)算機(jī)可讀介質(zhì)提供的序列信息。下面的例子證明了如何利用在Sybase系統(tǒng)上執(zhí)行搜索算法如BLAST算法(Altschul等人,J.Mol.Biol.215:403-410(1990),本文引入作為參考)和BLAZE算法(Brutlag等人,Comp.Chem.17:203_207(1993),本文引入作為參考)的軟件鑒別與具有高水平同一性的本發(fā)明基因座序列同源的DNA序列。可以對(duì)高同一性的序列進(jìn)行比較,以找到對(duì)于大豆品種有用的多態(tài)性標(biāo)記。本發(fā)明還提供了包含本文所述的序列信息的系統(tǒng),特別是基于計(jì)算機(jī)的系統(tǒng)。這些系統(tǒng)設(shè)計(jì)為用來(lái)鑒定商業(yè)上重要的本發(fā)明核酸分子的序列片段。本文所用的“基于計(jì)算機(jī)的系統(tǒng)”是指用于分析核苷酸序列信息的硬件、軟件和存儲(chǔ)器。熟練技術(shù)人員可以容易地了解,任何一種現(xiàn)有的基于計(jì)算機(jī)的系統(tǒng)適用于本發(fā)明。如上所述,本發(fā)明的基于計(jì)算機(jī)的系統(tǒng)包括存儲(chǔ)有本發(fā)明的多態(tài)性標(biāo)記、遺傳圖譜和/或核酸分子序列的數(shù)據(jù)庫(kù)和必要的支持和實(shí)現(xiàn)基因分型應(yīng)用的硬件和軟件,這樣的基于計(jì)算機(jī)的系統(tǒng)可以用于讀取、分類(lèi)或分析大豆基因型數(shù)據(jù)?;谟?jì)算機(jī)的系統(tǒng)的關(guān)鍵部件包括(a)數(shù)據(jù)存儲(chǔ)裝置,包括計(jì)算機(jī)可讀介質(zhì),其上記錄有至少2種表1或表3中確定的大豆基因組DNA多態(tài)性;(b)搜索裝置,用于將來(lái)自至少一種測(cè)試大豆植物的大豆基因組DNA序列與步驟(a)的數(shù)據(jù)存儲(chǔ)裝置的多態(tài)性序列進(jìn)行比較,以鑒定同源或非同源序列;和(c)檢索裝置,用于鑒定步驟(b)的測(cè)試大豆基因組序列的同源或非同源序列。用于進(jìn)行DNA數(shù)據(jù)庫(kù)查詢的基于計(jì)算機(jī)的方法和系統(tǒng)(如裝置)在美國(guó)專利6,691,109中描述。在本發(fā)明一個(gè)有用的方面,來(lái)自表1或表3的多態(tài)性大豆基因座的數(shù)據(jù)集記錄在計(jì)算機(jī)可讀介質(zhì)上。在本發(fā)明的一方面,大豆基因組多態(tài)性在一個(gè)或多個(gè)DNA序列數(shù)據(jù)集中提供,即,數(shù)據(jù)集包括多達(dá)有限數(shù)目的記錄在計(jì)算機(jī)可讀介質(zhì)上的多態(tài)性基因座的不同序列。在記錄的數(shù)據(jù)集中的有限數(shù)目的多態(tài)性基因座可少至2種或多達(dá)1000種或更多,例如5、8、10、25、40、75、96、100、384或500種表1或表3的大豆基因組多態(tài)性。這些數(shù)據(jù)集可以用于基因分型應(yīng)用,其中,1)查詢確定分布于大豆基因組上的多態(tài)性的多種多態(tài)性;2)查詢聚類(lèi)于區(qū)間內(nèi)的多種多態(tài)性;和/或當(dāng)在大量植物中查詢多種多態(tài)性時(shí)。記錄在計(jì)算機(jī)可讀介質(zhì)上的數(shù)據(jù)集也可包括對(duì)于記錄在其上的每種大豆基因組DNA多態(tài)性的相應(yīng)的圖譜位置。在其它實(shí)施方案中,表型性狀或表型性狀指數(shù)數(shù)據(jù)記錄在計(jì)算機(jī)可讀介質(zhì)上。在另外其它實(shí)施方案中,等位基因狀態(tài)與親本、后代或測(cè)試大豆植物相關(guān)聯(lián)的數(shù)據(jù)記錄在計(jì)算機(jī)可讀介質(zhì)上。育種方法也涉及培育大豆植物的方法。培育大豆植物的方法包括以下步驟(a)對(duì)于至少兩個(gè)大豆植物的育種群體,確定至少兩個(gè)最多10厘摩的基因組窗口中的至少兩個(gè)單元型的性狀值;(b)在所述育種群體中,培育兩個(gè)大豆植物,以產(chǎn)生后代種子群體;(c)在所述后代種子中,確定至少一種表1或表3中確定的多態(tài)性在每個(gè)所述窗口中的等位基因狀態(tài),以確定所述單元型的存在;和(d)在所述后代種子中選擇對(duì)于確定的單元型而言具有較高性狀值的后代種子,從而培育大豆植物。在這些育種方法的某些實(shí)施方案中,確定基本上每條染色體整體上的每個(gè)相鄰基因組窗口中的至少兩個(gè)單元型的性狀值??梢岳斫?,單元型區(qū)域是在多代育種中保持并且由一個(gè)或多個(gè)育種系攜帶的染色體片段。這些片段可以用包含在該片段中的多個(gè)連鎖的標(biāo)記基因座鑒定,并且兩個(gè)系中這些基因座處的共同的單元型同一性給出了這些種系攜帶的整個(gè)相應(yīng)染色體片段的遺傳來(lái)源同一性的高置信度。這些育種方法需要使用分布于大豆基因組中的多種大豆基因組多態(tài)性。在這種育種方法的各方面,確定基本上每條染色體的整體上每個(gè)相鄰基因組窗口中的至少兩個(gè)單元型的性狀值。在本方法的另一個(gè)有用的方面,在每條染色體中高達(dá)10厘摩的基因組窗口中,針對(duì)單元型產(chǎn)量的較高的性狀值,選擇后代種子。在本發(fā)明的另一方面,培育方法涉及提高產(chǎn)量,其中,性狀值是產(chǎn)量性狀的值,其中,對(duì)每個(gè)窗口中的單元型的性狀值進(jìn)行排序;并且選擇在窗口中的產(chǎn)量性狀值高于所述窗口中的平均產(chǎn)量性狀值的后代種子。在育種方法的某些方面,單元型使用表1中確定的多態(tài)性定義,或定義為在包括SEQIDNO:1至SEQIDNO:7800的所有DNA序列的分子標(biāo)記組中,或定義為與那些多態(tài)性之一連鎖不平衡。為了利用這種方法促進(jìn)育種,計(jì)算每種性狀的值或性狀組合的值(例如多性狀指數(shù))是有用的。在多性狀指數(shù)中分配給各種性狀的權(quán)重可以根據(jù)育種目標(biāo)而變化。例如,如果產(chǎn)量是關(guān)鍵目標(biāo),則在多性狀指數(shù)中,產(chǎn)量值可以50-80%加權(quán),成熟、倒伏、株高或抗病性可以以較低的百分比加權(quán)。大豆植物(GlycinemaxL.)可以通過(guò)自然技術(shù)或機(jī)械技術(shù)雜交。自然授粉在大豆中通過(guò)自花授粉或自然的異花授粉發(fā)生,授粉生物通常幫助這種授粉。在自然或人工雜交中,開(kāi)花和開(kāi)花時(shí)間是重要的考慮因素。大豆是短日照植物,但是對(duì)光周期的敏感性有顯著的遺傳變異。開(kāi)花的臨界日長(zhǎng)是從適應(yīng)熱帶緯度的基因型的大約13小時(shí)到生長(zhǎng)于較高緯度的光周期不敏感性基因型的24小時(shí)不等。出苗后大豆似乎有9天對(duì)日長(zhǎng)不敏感。需要7至26天的短于臨界日長(zhǎng)的光周期來(lái)完成開(kāi)花誘導(dǎo)。大豆花通常在花冠開(kāi)放的當(dāng)天自身授粉。如果花瓣沒(méi)有脫落,柱頭在開(kāi)花前大約1天接受花粉,并在開(kāi)花后2天繼續(xù)保持接受花粉狀態(tài)。9個(gè)雄蕊的花絲融合,而最接近旗瓣的一個(gè)獨(dú)立。雄蕊在柱頭下形成環(huán),直到開(kāi)花前大約1天,然后它們的花絲開(kāi)始迅速伸長(zhǎng),并提升柱頭周?chē)幕ǚ勰摇;ǚ勰以陂_(kāi)花當(dāng)天裂開(kāi),花粉粒落在柱頭上,并在10小時(shí)內(nèi)花粉管到達(dá)子房,完成受精。自花授粉在大豆中自然發(fā)生,無(wú)需對(duì)花進(jìn)行處理。但是對(duì)于兩個(gè)大豆植株的雜交,通常優(yōu)選地采用人工雜交,盡管這不是必需的。在人工雜交中,在來(lái)自花的花粉成熟之前,對(duì)雜交中用作雌性的花進(jìn)行人工交叉授粉,從而防止自體受精,或者可選擇地,使用本領(lǐng)域已知的技術(shù)去除花的雄性部分。用于去除大豆花的雄性部分的技術(shù)包括,例如,物理除去雄性部分,使用賦予雄性不育性的遺傳因素,以及對(duì)雄性部分應(yīng)用化學(xué)殺配子劑。在雌花去雄或未去雄的情況下,可以通過(guò)使用鑷子從父本的花中除去雄蕊和雌蕊,并抵靠著雌花的柱頭輕輕地刷花粉囊,進(jìn)行人工授粉。可以通過(guò)除去前萼和龍骨瓣花瓣,或者用閉合的鑷子刺破龍骨瓣,并使其打開(kāi)以推開(kāi)花瓣,來(lái)實(shí)現(xiàn)對(duì)雄蕊的接近。在柱頭上刷花粉囊導(dǎo)致它們破裂,并且,當(dāng)花粉在柱頭上清晰可見(jiàn)時(shí),獲得最高的成功雜交百分比??梢酝ㄟ^(guò)在刷柱頭之前輕拍花粉囊來(lái)檢查花粉散播。當(dāng)條件不利時(shí),可能必須使用幾個(gè)雄花來(lái)獲得合適的花粉散播,或者,可以使用同一雄花對(duì)幾個(gè)花授粉,而具有良好的花粉散播。遺傳雄性不育性在大豆中可以獲得,并且可能有利于促進(jìn)本發(fā)明中的雜交,尤其是用于回交選擇程序。雜交區(qū)組(crossingblock)完全分離所需的距離尚不清楚;但當(dāng)雄性不育植株距離外來(lái)花粉源12米或更遠(yuǎn)時(shí),遠(yuǎn)交小于0.5%(Boerma和Moradshahi,CropSci.,15:858-861,1975)。雜交區(qū)組的邊界上的植物很可能保持與外來(lái)花粉最多地遠(yuǎn)交,并且可以在收獲時(shí)除去以使污染減至最小。一旦收獲,豆莢一般在不超過(guò)38°C的溫度下風(fēng)干,直到種子含有13%或更少的水分,然后手工取出種子。如果相對(duì)濕度為50%或更低,種子可以在大約25°C令人滿意地存儲(chǔ)長(zhǎng)達(dá)一年。在潮濕的氣候中,發(fā)芽率迅速下降,除非種子被干燥至7%的含水量并在氣密性容器中在室溫下儲(chǔ)存。通過(guò)將種子干燥至7%的含水量,并在10°C或更低溫度下在維持50%相對(duì)濕度的空間中儲(chǔ)存或在氣密性容器中儲(chǔ)存,可以最佳地實(shí)現(xiàn)在任何氣候條件下的長(zhǎng)期儲(chǔ)存。下文闡述用于培育本發(fā)明植物的選擇的、非限制性的方法。對(duì)任何雜交后代使用標(biāo)記輔助的選擇(MAS)可以加強(qiáng)育種計(jì)劃??梢岳斫獗景l(fā)明核酸標(biāo)記可以用于MAS(育種)計(jì)劃。進(jìn)一步可以理解可以在育種計(jì)劃中使用任何商業(yè)和非商業(yè)的栽培種。例如,如發(fā)芽活力、植物生長(zhǎng)活力、應(yīng)激抗性、抗病性、分枝、開(kāi)花、結(jié)實(shí)、種子的大小、種子密度、直立性(standability)和脫粒性(threshability)等因素通常指導(dǎo)選擇。對(duì)于高度可遺傳的性狀,選擇在一個(gè)位置評(píng)估的優(yōu)良單株植物是有效的,而對(duì)于具有低遺傳性的性狀,選擇應(yīng)該基于從相關(guān)植物的家族的重復(fù)評(píng)估獲得的平均值。流行的選擇方法通常包括譜系選擇、改良的譜系選擇、混合選擇(massselection)和輪回選擇。在一個(gè)優(yōu)選的方面,采用回交或輪回育種計(jì)劃。遺傳的復(fù)雜性影響育種方法的選擇。回交育種可以用來(lái)將對(duì)于高度可遺傳性狀的一個(gè)或幾個(gè)有利的基因轉(zhuǎn)移到理想的栽培種中。這種方法已被廣泛用于培育抗病栽培種。各種輪回選擇技術(shù)用于改善受許多基因控制的數(shù)量遺傳性狀。育種系可以在代表商業(yè)目標(biāo)地區(qū)的環(huán)境中測(cè)試并與適當(dāng)?shù)臉?biāo)準(zhǔn)比較兩代或更多代。最好的株系是新的商業(yè)栽培種的候選株系;那些仍缺乏性狀的株系可用作親本,以產(chǎn)生新的群體用于進(jìn)一步選擇。譜系育種和輪回選擇育種方法可用于從育種群體中開(kāi)發(fā)栽培種。育種計(jì)劃將來(lái)自兩個(gè)或多個(gè)栽培種或各種廣泛來(lái)源的理想性狀組合為育種池,由該育種池通過(guò)自交和選擇所需的表型來(lái)開(kāi)發(fā)栽培種??梢栽u(píng)價(jià)新栽培種以確定哪些具有商業(yè)潛力?;亟挥N已被用來(lái)將簡(jiǎn)單遺傳的、高度可遺傳的性狀的基因轉(zhuǎn)移到作為輪回親本的理想的純合栽培種或近交系中。待轉(zhuǎn)移的性狀的來(lái)源稱為供體親本。在初始雜交后,選擇具有供體親本的表型的個(gè)體,并與輪回親本反復(fù)雜交(回交)。產(chǎn)生的植物預(yù)計(jì)具有輪回親本(例如,栽培種)的大部分屬性,此外,還具有從供體親本轉(zhuǎn)移來(lái)的理想的性狀。嚴(yán)格意義上來(lái)說(shuō),單種子遺傳程序指種植分離群體,每株植物收獲一個(gè)種子的樣品,并使用一個(gè)種子樣品種植下一代。當(dāng)群體已從F2發(fā)展到理想的近交水平時(shí),產(chǎn)生該株系的植物均回溯到不同的F2個(gè)體。由于一些種子不能發(fā)芽或者一些植物不能產(chǎn)生至少一個(gè)種子,群體中的植物數(shù)量每一代都在下降。結(jié)果,當(dāng)完成了世代進(jìn)步時(shí),并非全部原先在群體中取樣的F2植物都有后代代表。加倍單倍體(DH)方法在較短的時(shí)間內(nèi)獲得等基因植物。DH植物為植物育種員提供了寶貴的工具,特別是對(duì)于產(chǎn)生近交系和數(shù)量遺傳研究而言。對(duì)于育種員,DH群體特別可以用于QTL作圖、細(xì)胞質(zhì)轉(zhuǎn)換和性狀滲入。此外,在測(cè)試和評(píng)價(jià)用于植物育種計(jì)劃的純合系方面具有價(jià)值。所有的遺傳變異都在育種雜交的后代中,這提高了選擇增益。大多數(shù)研究和育種應(yīng)用依賴于人工DH生產(chǎn)方法。最初的步驟包括植物的單倍化,這導(dǎo)致包括單倍體種子的群體的產(chǎn)生。用誘導(dǎo)親本與非純合系雜交,導(dǎo)致單倍體種子的產(chǎn)生。具有單倍體胚、但具有正常三倍體胚乳的種子進(jìn)展到第二階段。即,單倍體種子和植物是任何具有單倍體胚的植物,與胚乳的倍性水平無(wú)關(guān)。在從群體中選擇單倍體種子后,選定的種子進(jìn)行染色體加倍以產(chǎn)生加倍的單倍體種子。細(xì)胞譜系中自發(fā)的染色體加倍會(huì)導(dǎo)致正常配子產(chǎn)生或從單倍體細(xì)胞譜系產(chǎn)生未減少的配子。使用化學(xué)化合物,如秋水仙堿,可以用來(lái)增加二倍化率。秋水仙堿結(jié)合微管蛋白并阻止其聚合為微管,從而在中期停止有絲分裂,可以用來(lái)增加二倍化率,即加倍染色體數(shù)目。這些嵌合植物是自花授粉以產(chǎn)生二倍體(加倍的單倍體)種子。種植此DH種子,隨后評(píng)價(jià)并用于雜種測(cè)交生產(chǎn)。常用于不同性狀和作物的其它育種方法的描述可在以下幾本參考書(shū)之一中找到(Allard,“PrinciplesofPlantBreeding,"Johnffiley&Sons,NY,U.ofCA,Davis,CA,50-98,1960;Simmonds,"Principlesofcropimprovement,"Longman,Inc.,NY,369-399,1979;Sneep禾口Hendriksen,"Plantbreedingperspectives,"Wageningen(編),CenterforAgriculturalPublishingandDocumentation,1979;Fehr,In:Soybeans:Improvement,ProductionandUses,第2版,Monograph.,16:249,1987;Fehr,"Principlesofvarietydevelopment,"TheoryandTechnique,(卷1)與CropSpeciesSoybean(卷2),IowaStateUniv.,MacmillanPub.Co.,NY,360—376,1987)。用單分子標(biāo)記進(jìn)行基因分型的方法用單分子標(biāo)記(例如,大豆基因組多態(tài)性)進(jìn)行基因分型的方法也可以用于將大豆植物的表型性狀與基因型相關(guān)聯(lián)。檢測(cè)來(lái)自至少兩個(gè)具有等位基因DNA的大豆植物的組織中的DNA或mRNA,以確定是否存在本發(fā)明提供的作為分子標(biāo)記的多態(tài)性。鑒定分子標(biāo)記與表型性狀之間的關(guān)聯(lián),其中所述標(biāo)記是在表1或表3中確定的。在另一方面,在染色體的特定基因座中具有等位基因DNA的大豆植物分離群體中,將性狀與基因型相關(guān)聯(lián),所述基因座對(duì)目標(biāo)性狀具有表型效應(yīng),并且其中分子標(biāo)記定位于該基因座之中或附近。用單分子標(biāo)記(例如,大豆基因組多態(tài)性)進(jìn)行基因分型的方法也可以用來(lái)選擇用于育種的親本植物、后代植物或測(cè)試植物。在這種情況下,多態(tài)性與賦予一種或多種理想的表型特狀的染色體區(qū)域遺傳連鎖。選擇包含與表型性狀相關(guān)聯(lián)的特定等位基因狀態(tài)的親本、后代或測(cè)試大豆植物提供了加速的和較低成本的育種。預(yù)期本文在表1或表3中公開(kāi)的某些大豆基因組多態(tài)性可以與給定的表型性狀直接相關(guān),因?yàn)樗鼈儼承└淖冑x予性狀或有助于性狀表達(dá)的基因的調(diào)控或編碼序列的等位基因狀態(tài)。這些性狀包括產(chǎn)量、倒伏、成熟、株高、真菌病抗性,例如對(duì)以下病害的抗MyjflicMlflii(SlMM^M(Phakopsorapachyrhizi)>illMfflif(Phakopsorameibomiae))、大豆炭疽病(平頭刺盤(pán)孢(Colletotrichumtruncatum)、束狀刺盤(pán)孢截短變禾中(Colletotrichumdematiumvar.truncatum)、大豆刺盤(pán)抱(Glomerellaglycines))>疫霉根莖腐病(疫霉屬的種(Phytophthorasp.))、白霉菌(核盤(pán)菌屬的種(Sclerotiniasp·))、核盤(pán)菌莖腐病(Sclerotiniasclerotiorum)、猝死綜合征(腐皮鐮刀菌(Fusariumsolani))、鐮刀菌根腐病(鐮刀菌屬的種(Fusariumspp·))、炭腐病(菜豆殼球孢(Macrophominaphaseolina))>IigE^f(XsLjtt^M(Septoriaglycines))、冑β禾中冑病(瓜果腐霉(Pythiumaphanidermatum)、德巴利腐霉(Pythiumdebaryanum)、畸雌腐霉(Pythiumirregulare)、終極腐霉(Pythiumultimum)、結(jié)群腐霉(Pythiummyriotylum)、簇囊腐霉(Pythiumtorulosum))、豆莢疫病(Podblight)(菜豆間座殼大豆變種(Diaporthephaseolorumvar.sojae))、蓮疫病(Phomopsislongicola)、擬蓮點(diǎn)霉禾中腐病(擬蓮點(diǎn)霉屬的種(Phomopsisspp.))、霜霉病(東北霜霉(Peronosporamanshurica))、絲核菌根莖腐病、絲核菌空氣枯萎病(立枯絲核菌(Rhizoctoniasolani))、褐莖腐病(Phialophoragregata)、蓮饋蕩病(Diaporthephaseolorumvar.caulivora)、紫斑病(菊池尾抱(Cercosporakikuchii))、革巴斑病(TargetSpot)(鏈格孢屬的種(Alternariasp·))、灰斑病(FrogeyeLeafspot)(大豆尾抱(Cercosporasojina))、白絹病(Southernblight)(齊整小核菌(Sclerotiumrolfsii))、黑葉枯病(Arkoolanigra)、黑根腐病(Thielaviopsisbasicola)、胃胃卩十才古_(tái)(斗胃β(Choanephorainfundibulifera)>Hife^e(Choanephoratrispora))>(Leptosphaerulina)BfgE^f(HBf^/Jn光殼(Leptosphaerulinatrifolii))、Mycoleptodiscus根腐病(Mycoleptodiscusterrestris)、新赤殼菌蓮腐病(侵菅新赤殼菌(Neocosmosporavasinfecta))、葉點(diǎn)霉(Phyllosticta)BfgE^f(Phyllostictasojicola)>(Pyrenochaeta)BfgE^f(大Li^i包(Pyrenochaetaglycines))^tI.M1M'M(Cylindrocladiumcrotalariae)>^X^BfSE(Dactuliochaetaglycines)、β0_(Scab)(Spacelomaglycines)、口十枯病(Stemphyliumbotryosum)、革巴斑病(山扁豆生棒抱(Corynesporacassiicola))、Nematosporacoryli(酵母斑)和多主瘤梗孢(Phymatotrichumomnivorum)(棉根腐病)禾口其他腐爛、枯萎、銹病、細(xì)菌性病害,如桿菌種腐病(枯草芽孢桿菌(Bacillussubtilis))、iffl^^^l(HsKfijP-Ifi^icSfji^l^ft(Pseudomonassavastonoipv.glycinea))>細(xì)菌性皺葉病(丁香假單胞菌丁香亞種(Pseudomonassyringaesubsp.syringae))、細(xì)菌性膿皰(Xanthomonasaxonopodispv.glycines)、細(xì)菌性褐斑病(萎蔫棒桿菌萎至亞禾中(Curtobacteriumflaccumfacienspv·flaccumfaciens))、細(xì)胃f生,_亞禾中(Curtobacteriumflaccumfacienspv.flaccumfaciens)、青枯雷爾氏菌(Ralstoniasolanacearum))和野火病(丁香假單胞菌煙草致病變種(Pseudomonassyringaepv.tabaci)),病毒病抗性,例如,對(duì)以下病毒的抗性苜?;ㄈ~病毒AMV(紫花苜蓿鑲嵌病毒(Alfamovirus))、菜豆莢斑駁病毒BPMV(豇豆花葉病毒(Comovirus))、菜豆黃色花葉病毒BYMV(馬鈴薯Y病毒(Potyvirus))、豇豆褪綠斑駁病毒CCMV(雀麥花葉病毒(Bromovirus))、綠豆黃色花葉病毒MYMV(菜豆金黃花葉病毒(Begomovirus))、花生斑駁病毒(馬鈴薯Y病毒)、花生條紋病毒PStV(馬鈴薯Y病毒)、花生矮化病毒PSV(黃瓜花葉病毒(Cucumovirus))、大豆褪綠斑駁病毒SbCMV(花椰菜花葉病毒(Caulimovirus))、大豆皺葉病毒SCLV(菜豆金黃花葉病毒)、大豆矮花病毒SbDV(黃矮病毒(Luteovirus))、大豆花葉病毒SMV(馬鈴薯Y病毒)、大豆重度矮化病毒SSSV(蠕傳多角體病毒(Nepovirus))和煙草環(huán)斑病毒TRSV(蠕傳多角體病毒),昆蟲(chóng)病害抗性,如大豆蚜蟲(chóng)抗性(大豆蚜(Aphisglycines)),寄生蟲(chóng)病抗性,例如對(duì)以下線蟲(chóng)的抗性大豆胞囊線蟲(chóng)(Heteroderaglycines)、根結(jié)線蟲(chóng)(南方根結(jié)線蟲(chóng)(Meloidogyneincognita)>^IH^n^^(Meloidogynearenaria)禾PJTl口圭tilg_&(Meloidogynejavanica))、紐帶線蟲(chóng)(Lancenematode)(矛狀線蟲(chóng)(HoplolaimusColumbus)、帽狀紐帶線蟲(chóng)(Hoplolaimusgaleatus)、大針紐帶線蟲(chóng)(Hoplolaimusmagnistylus))、損害線蟲(chóng)(短體線蟲(chóng)屬的禾中(Pratylenchusspp·))、針線蟲(chóng)(突出針線蟲(chóng)(Paratylenchusprojectus)、Paratylenchustenuicaudatus、腎形線蟲(chóng)(Rotylenchulusreniformis)、環(huán)線蟲(chóng)(裝飾小環(huán)線蟲(chóng)(Criconemellaornata))、鞘線蟲(chóng)(鞘線蟲(chóng)屬的種(Hemicycliophoraspp.))、螺旋線蟲(chóng)屬的種(Heliocotylenchusspp·)、針刺線蟲(chóng)(細(xì)刺線蟲(chóng)(Belonolainusgracilis)、Belonolainuslongicaudatus)、■化線蟲(chóng)(Quinisulciusacutus、■化線蟲(chóng)屬的禾中(Tylenchorhynchusspp.))和粗短根線蟲(chóng)(Stubbyrootnematode)(微小擬毛刺線蟲(chóng)(Paratrichodorusminor))等,非生物應(yīng)激耐受性,例如,耐旱性、耐寒性、耐熱性、耐風(fēng)暴性、營(yíng)養(yǎng)缺乏等,和質(zhì)量性狀,例如,低亞麻酸含量、提高的淀粉含量、提高的油含量、減少的飽和脂肪酸含量、提高的蛋白質(zhì)含量、增加的賴氨酸含量等。當(dāng)大豆基因組多態(tài)性以這種方式與性狀直接關(guān)聯(lián)時(shí),它在旨在將該性狀引入許多不同的大豆遺傳背景內(nèi)的大豆育種計(jì)劃中是非常有用的。在此特別涉及使用與產(chǎn)量單元型特別相關(guān)的分子標(biāo)記。可以使用的與產(chǎn)量單元型相關(guān)的大豆基因組DNA多態(tài)性來(lái)自SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142、80、88、980、538、1925、3669、2270、1397、3747、888、365、2132、1972、459、762和SEQIDNO:1094。與產(chǎn)量單元型更密切相關(guān)的大豆基因組DNA多態(tài)性選自SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142和80。與產(chǎn)量單元型具有更大關(guān)聯(lián)度的大豆基因組DNA多態(tài)性選自SEQIDNO:3122、2914、3984、3608和1448。與產(chǎn)量單元型最密切相關(guān)的大豆基因組多態(tài)性包括SEQIDN0:3122的多態(tài)性??梢酝ㄟ^(guò)使用多個(gè)標(biāo)記以使與可能不提供農(nóng)藝學(xué)優(yōu)良性質(zhì)的基因組區(qū)域相關(guān)的連鎖阻力減至最小,來(lái)加速與此單標(biāo)記相關(guān)的基因組區(qū)域的滲入??梢酝ㄟ^(guò)使用多個(gè)直接位于單標(biāo)記側(cè)翼的標(biāo)記,以使可能與密切相關(guān)的基因組區(qū)域相關(guān)的連鎖阻力減至最小,來(lái)加速與此單標(biāo)記密切關(guān)聯(lián)的基因組區(qū)域的滲入。因此,使用聚類(lèi)的一組2、5、10或20個(gè)位于單標(biāo)記近端和遠(yuǎn)端10、5、2或Icm的標(biāo)記,可以提供所需要的與單標(biāo)記相關(guān)的基因組區(qū)域的滲入,同時(shí)不需要的直接側(cè)翼區(qū)域的滲入減至最少。也可以通過(guò)使用分布于基因組中的多個(gè)標(biāo)記以使可能與位于同一染色體遠(yuǎn)端區(qū)域上和其它染色體上的基因組區(qū)域密切關(guān)聯(lián)的任何連鎖阻力減至最小,來(lái)加速與此單標(biāo)記密切相關(guān)的基因組區(qū)域的滲入。這組多個(gè)標(biāo)記可以包括另外20個(gè)標(biāo)記,每個(gè)染色體有至少一個(gè)標(biāo)記。然而,在優(yōu)選的實(shí)施方案中,標(biāo)記密度是每個(gè)染色體至少大約10個(gè)標(biāo)記,優(yōu)選地每個(gè)染色體大約20個(gè)標(biāo)記,更優(yōu)選地每個(gè)染色體至少大約100個(gè)標(biāo)記,以有效地區(qū)分來(lái)自供體和接受體親本的基因組區(qū)域。因而,使用與單標(biāo)記直接連鎖或分布于基因組上的多個(gè)側(cè)翼標(biāo)記可以提供在選擇的雜交后代中最大回收接受體親本。用大豆基因組DNA多態(tài)性組進(jìn)行基因分型的方法本發(fā)明尤其涉及采用可以對(duì)多種不同的多態(tài)性進(jìn)行分型的核酸分子組的基因分型方法。在這樣的方法中,對(duì)有限數(shù)量的至少兩種大豆基因組多態(tài)性進(jìn)行分型。查詢的這種有限數(shù)量的大豆基因組多態(tài)性可以包含至少2、5、10或20種不同的基因型,它們?cè)诒?或3中表示為2、5、10或20種不同的SEQIDNO。這些基因分型方法必然需要使用可以對(duì)大豆基因組多態(tài)性組進(jìn)行分型的核酸分子組。在某些應(yīng)用中,這些基因分型方法使用在給定染色體區(qū)間集中的多個(gè)分子標(biāo)記(即大豆基因組多態(tài)性)。用于建立和追蹤種質(zhì)身份的高密度指紋可以通過(guò)進(jìn)行基因分型方法來(lái)獲得,所述方法利用在特定染色體區(qū)間和/或賦予某些性狀的某些基因座周?chē)谢蛉杭亩鄠€(gè)分子標(biāo)記。高密度指紋信息可以用于評(píng)估種質(zhì)多樣性,行使遺傳質(zhì)量保證功能,開(kāi)發(fā)罕見(jiàn)的等位基因,評(píng)估外來(lái)種質(zhì)庫(kù)和評(píng)估遺傳純度。這些高密度指紋可以用來(lái)建立標(biāo)記-性狀關(guān)聯(lián)數(shù)據(jù)庫(kù),有益于整個(gè)作物育種計(jì)劃。高密度指紋也可以用來(lái)建立和保護(hù)種質(zhì)所有權(quán)??梢詮谋?提供的定位的大豆多態(tài)性中選擇聚集在需要的染色體區(qū)間或遺傳性狀周?chē)臉?biāo)記組。這些用多個(gè)分子標(biāo)記進(jìn)行基因分型的方法也可用于將大豆植物的表型性狀與基因型相關(guān)聯(lián)。檢測(cè)來(lái)自至少兩個(gè)具有等位基因DNA的大豆植物的組織中的DNA或mRNA,以確定是否存在本發(fā)明提供的作為分子標(biāo)記的一組有限系列的多態(tài)性。確定這組分子標(biāo)記與這組表型性狀之間的關(guān)聯(lián),其中,這組分子標(biāo)記至少包括2種、至少5種、或至少10種與本發(fā)明的多態(tài)性基因座連鎖的分子標(biāo)記,例如至少10種與定位的多態(tài)性連鎖的分子標(biāo)記,例如,如表3中確定的那些。在一個(gè)更優(yōu)選的方面,在對(duì)目標(biāo)性狀賦予表型效應(yīng)的染色體基因座中具有等位基因DNA的大豆植物分離群體中,性狀與基因型相關(guān)聯(lián),其中分子標(biāo)記之間和多態(tài)性與性狀之間的關(guān)聯(lián)程度允許確定多態(tài)性和性狀基因座的線性次序。在這樣的方法中,至少5個(gè)分子標(biāo)記與允許基因座不平衡作圖的基因座連鎖。在其它應(yīng)用中,這些基因分型方法使用分布于大豆基因組中的分子標(biāo)記。在這些方法中,分子標(biāo)記可以分散在一個(gè)染色體上、位于多條染色體上、位于所有染色體上或位于每條染色體的每個(gè)臂上。在一個(gè)具體的實(shí)施方案中,在使用多個(gè)標(biāo)記的基因分型方法中使用的至少1種分子標(biāo)記定位于所有20條大豆染色體的每條染色體上,因此必須對(duì)至少20種大豆基因組DNA多態(tài)性進(jìn)行分型。但是,也涉及該方法的其它實(shí)施方案,其中至少10種大豆基因組DNA多態(tài)性定位于每條染色體上,因此必須對(duì)至少200種大豆基因組DNA多態(tài)性進(jìn)行分型。同樣,也涉及其它實(shí)施方案,必須對(duì)每條染色體上的至少20種大豆基因組DNA多態(tài)性進(jìn)行分型(需要對(duì)至少400種多態(tài)性進(jìn)行分型),或?qū)γ織l染色體上的至少50種大豆基因組DNA多態(tài)性進(jìn)行分型(需要對(duì)至少1,000種多態(tài)性進(jìn)行分型)。也涉及需要對(duì)每條染色體上至少100種大豆基因組DNA多態(tài)性進(jìn)行分型的實(shí)施方案(需要對(duì)至少2000種多態(tài)性進(jìn)行分型)。分布于大豆基因組上的標(biāo)記組可以選自用于這些方法的表3提供的定位的大豆多態(tài)性。使用分布于大豆基因組上的分子標(biāo)記的基因分型方法可以用于多種應(yīng)用。在一種應(yīng)用中,基因分型方法用于選擇用于育種的親本植物、后代植物或測(cè)試植物。涉及這些基因分型方法在大豆育種計(jì)劃中的多種應(yīng)用。這些基因分型方法可用于促進(jìn)一種或多種性狀、基因組基因座的滲入和/或轉(zhuǎn)基因從一個(gè)遺傳背景向不同的遺傳背景中的插入。一般來(lái)說(shuō),查詢來(lái)自遠(yuǎn)交(out-crossed)群體的后代植物中選擇的標(biāo)記組,以鑒定并選擇包含所需的性狀、基因組基因座和/或轉(zhuǎn)基因插入、而仍包含盡可能多的來(lái)自遠(yuǎn)交的不同遺傳背景的等位基因的個(gè)體后代。這些方法可以通過(guò)幾代加速所需的性狀、基因組基因座的滲入和/或轉(zhuǎn)基因向新遺傳背景中的插入。這些方法還通過(guò)探詢大豆遺傳圖譜上平均密度小于大約IOcM的分子標(biāo)記如SNP的集合提供性狀篩選??梢栽谝环N或多種表型性狀的范圍內(nèi),分析與表1或表3的多態(tài)性基因座連鎖的分子標(biāo)記的存在與否,以鑒定在與一種或多種所述性狀相關(guān)的一個(gè)或多個(gè)基因組區(qū)域處的一種或多種特定分子標(biāo)記等位基因。在本發(fā)明的另一方面,利用分子標(biāo)記鑒定單元型,該單元型是基因組DNA的等位基因片段,其特征在于處于連鎖不平衡的至少兩種多態(tài)性,并且所述多態(tài)性在不超過(guò)10厘摩長(zhǎng)度的基因組窗口中,例如,不超過(guò)大約8厘摩或更小的窗口中,例如,在1-5厘摩的范圍內(nèi)。在這些方法的某些實(shí)施方案中,這樣的分子標(biāo)記的組在每個(gè)大豆染色體中的一系列相鄰的基因組窗口中鑒定多種單元型,例如,用這些窗口提供基本上完全的基因組覆蓋。使用足夠大的和多樣性的大豆育種群體,可以在每個(gè)窗口中鑒定大量的單元型,從而提供可與一種或多種性狀相關(guān)的等位基因DNA,以允許聚焦的標(biāo)記輔助的育種。因此,本發(fā)明的大豆分析的一方面進(jìn)一步包括以下步驟對(duì)所述大豆植物群體表征一種或多種性狀,并將所述性狀與所述等位基因SNP或Indel多態(tài)性進(jìn)行關(guān)聯(lián),優(yōu)選地進(jìn)行組織以定義單元型。這些性狀包括產(chǎn)量、倒伏、成熟、株高、真菌病抗性,例如對(duì)以下病害的抗性亞洲大豆銹菌(豆薯層銹菌(Phakopsorapachyrhizi)、山馬幢層銹菌(Phakopsorameibomiae))、大豆炭疽病(平頭刺盤(pán)孢(Colletotrichumtruncatum)、束狀刺盤(pán)孢截短變種(Colletotrichumdematiumvar.truncatum)>i;S^lJ(Glomerellaglycines))>(霉屬的種(Phytophthorasp.))、白霉菌(核盤(pán)菌屬的種(Sclerotiniasp.))、核盤(pán)菌莖腐病(Sclerotiniasclerotiorum)>(j^j^HZ)胃(Fusariumsolani))>H刀菌根腐病(鐮刀菌屬的種(Fusariumspp.))、炭腐病(菜豆殼球孢(Macrophominaphaseolina))、褐斑病(大豆殼針孢(S印toriaglycines))、腐霉種腐病(瓜果腐霉(Pythiumaphanidermatum)、德巴禾0腐霉(Pythiumdebaryanum)、畸雌腐霉(Pythiumirregulare)、終極腐霉(Pythiumultimum)、結(jié)群腐霉(Pythiummyriotylum)、簇囊腐β(Pythiumtorulosum))、胃貞_(Podblight)(|1]帛冑禾中(Diaporthephaseolorumvar.sojae))、蓮疫病(Phomopsislongicola)、擬蓮點(diǎn)霉禾中腐病(擬蓮點(diǎn)霉屬的種(Phomopsisspp·))、霜霉病(東北霜霉(Peronosporamanshurica))、絲核菌根莖腐病、絲核菌空氣枯萎病(立枯絲核菌(Rhizoctoniasolani))、褐莖腐病(Phialophoragregata)、蓮饋蕩病(Diaporthephaseolorumvar.caulivora)、紫斑病(菊池尾抱(Cercosporakikuchii))、革巴斑病(TargetSpot)(鏈格孢屬的種(Alternariasp·))、灰斑病(FrogeyeLeafspot)(大豆尾抱(Cercosporasojina))、白絹病(Southernblight)(齊整小核菌(Sclerotiumrolfsii))、黑葉枯病(Arkoolanigra)、黑根腐病(Thielaviopsisbasicola)、胃胃卩十才古_(tái)(斗胃β(Choanephorainfundibulifera)>Hife^e(Choanephoratrispora))>(Leptosphaerulina)BfgE^f(HBf^/Jn光殼(Leptosphaerulinatrifolii))、Mycoleptodiscus根腐病(Mycoleptodiscusterrestris)、新赤殼菌蓮腐病(侵菅新赤殼菌(Neocosmosporavasinfecta))、葉點(diǎn)霉(Phyllosticta)BfgE^f(Phyllostictasojicola)>(Pyrenochaeta)BfgE^f(大Li^i包(Pyrenochaetaglycines))^tI.M1M'M(Cylindrocladiumcrotalariae)>^X^BfSE(Dactuliochaetaglycines)、β0_(Scab)(Spacelomaglycines)、口十枯病(Stemphyliumbotryosum)、革巴斑病(山扁豆生棒抱(Corynesporacassiicola))、Nematosporacoryli(酵母斑)和多主瘤梗孢(Phymatotrichumomnivorum)(棉根腐病)禾口其他腐爛、枯萎、銹病、細(xì)菌性病害,如桿菌種腐病(枯草芽孢桿菌(Bacillussubtilis))、iffl^^^l(HsKfijP-Ifi^icSfji^l^ft(Pseudomonassavastonoipv.glycinea))>細(xì)菌性自皮葉病(丁香假單胞菌丁香亞種(Pseudomonassyringaesubsp.syringae))、細(xì)菌性膿皰(Xanthomonasaxonopodispv.glycines)、細(xì)菌性褐斑病(萎蔫棒桿菌萎至亞禾中(Curtobacteriumflaccumfacienspv·flaccumfaciens))、細(xì)胃f生,_亞禾中(Curtobacteriumflaccumfacienspv.flaccumfaciens)、青枯雷爾氏菌(Ralstoniasolanacearum))和野火病(丁香假單胞菌煙草致病變種(Pseudomonassyringaepv.tabaci)),病毒病抗性,例如,對(duì)以下病毒的抗性苜?;ㄈ~病毒AMV(紫花苜蓿鑲嵌病毒(Alfamovirus))、菜豆莢斑駁病毒BPMV(豇豆花葉病毒(Comovirus))、菜豆黃色花葉病毒BYMV(馬鈴薯Y病毒(Potyvirus))、豇豆褪綠斑駁病毒CCMV(雀麥花葉病毒(Bromovirus))、綠豆黃色花葉病毒MYMV(菜豆金黃花葉病毒(Begomovirus))、花生斑駁病毒(馬鈴薯Y病毒)、花生條紋病毒PStV(馬鈴薯Y病毒)、花生矮化病毒PSV(黃瓜花葉病毒(Cucumovirus))、大豆褪綠斑駁病毒SbCMV(花椰菜花葉病毒(Caulimovirus))、大豆皺葉病毒SCLV(菜豆金黃花葉病毒)、大豆矮花病毒SbDV(黃矮病毒(Luteovirus))、大豆花葉病毒SMV(馬鈴薯Y病毒)、大豆重度矮化病毒SSSV(蠕傳多角體病毒(Nepovirus))和煙草環(huán)斑病毒TRSV(蠕傳多角體病毒),昆蟲(chóng)病害抗性,如大豆蚜蟲(chóng)抗性(大豆蚜(Aphisglycines)),寄生蟲(chóng)病抗性,例如對(duì)以下線蟲(chóng)的抗性大豆胞囊線蟲(chóng)(Heteroderaglycines)、根結(jié)線蟲(chóng)(南方根結(jié)線蟲(chóng)(Meloidogyneincognita)>^IH^n^^(Meloidogynearenaria)禾PJTl口圭tilg_&(Meloidogynejavanica))、紐帶線蟲(chóng)(Lancenematode)(矛狀線蟲(chóng)(HoplolaimusColumbus)、帽狀紐帶線蟲(chóng)(Hoplolaimusgaleatus)、大針紐帶線蟲(chóng)(Hoplolaimusmagnistylus))、損害線蟲(chóng)(短體線蟲(chóng)屬的禾中(Pratylenchusspp·))、針線蟲(chóng)(突出針線蟲(chóng)(Paratylenchusprojectus)、Paratylenchustenuicaudatus、腎形線蟲(chóng)(Rotylenchulusreniformis)、環(huán)線蟲(chóng)(裝飾小環(huán)線蟲(chóng)(Criconemellaornata))、鞘線蟲(chóng)(鞘線蟲(chóng)屬的種(Hemicycliophoraspp.))、螺旋線蟲(chóng)屬的種(Heliocotylenchusspp·)、針刺線蟲(chóng)(細(xì)刺線蟲(chóng)(Belonolainusgracilis)、Belonolainuslongicaudatus)、■化線蟲(chóng)(Quinisulciusacutus、■化線蟲(chóng)屬的禾中(Tylenchorhynchusspp.))和粗短根線蟲(chóng)(Stubbyrootnematode)(微小擬毛刺線蟲(chóng)(Paratrichodorusminor))等,非生物應(yīng)激耐受性,例如,耐旱性、耐寒性、耐熱性、耐風(fēng)暴性、營(yíng)養(yǎng)缺乏等,和質(zhì)量性狀,例如,低亞麻酸含量、提高的淀粉含量、提高的油含量、減少的飽和脂肪酸含量、提高的蛋白質(zhì)含量、增加的賴氨酸含量等。實(shí)施例本文包括下面的實(shí)施例來(lái)證明本發(fā)明的優(yōu)選的實(shí)施方案。本領(lǐng)域的技術(shù)人員應(yīng)該理解,實(shí)施例中公開(kāi)的技術(shù)代表了本發(fā)明人發(fā)現(xiàn)的在實(shí)施本發(fā)明中運(yùn)用良好的技術(shù),因此可被認(rèn)為構(gòu)成了實(shí)施本發(fā)明的優(yōu)選方式。然而,本領(lǐng)域的技術(shù)人員根據(jù)本公開(kāi)內(nèi)容應(yīng)該理解,在不背離本發(fā)明的概念、精神和范圍的情況下,可以對(duì)公開(kāi)的具體實(shí)施方案進(jìn)行許多改變,而仍然獲得相同或類(lèi)似的結(jié)果。更具體地說(shuō),顯然某些化學(xué)和生理學(xué)相關(guān)的試劑可以代替本文中所述的試劑,而將獲得相同或相似的結(jié)果。所有這些對(duì)于本領(lǐng)域技術(shù)人員明顯的類(lèi)似的代替和修改被認(rèn)為是在所附的權(quán)利要求書(shū)限定的本發(fā)明的精神、范圍和概念之內(nèi)。實(shí)施例1本實(shí)施例說(shuō)明為了富集獨(dú)特/編碼序列基因組DNA,使用對(duì)甲基化胞嘧啶殘基敏感的酶制備簡(jiǎn)化形式的文庫(kù)?;蚪MDNA提取方法是本領(lǐng)域眾所周知的。一種使產(chǎn)量和方便性都達(dá)到最佳的優(yōu)選的方法是用來(lái)自LifeTechnologies(GrandIsland,NY)的“植物DNAzol試劑”提取DNA。簡(jiǎn)單地說(shuō),用研缽和研杵在液氮中研磨冷凍的葉組織。然后用DNAzol試劑提取磨碎的組織。這除去了細(xì)胞蛋白質(zhì)、細(xì)胞壁物質(zhì)和其它碎片。用該試劑提取后,DNA經(jīng)沉淀,洗滌,再懸浮,并用RNA酶處理以除去RNA。再次沉淀DNA,并再懸浮于適當(dāng)體積的TE中(使?jié)舛葹閕yg/μ1)。該基因組DNA備用于文庫(kù)構(gòu)建。分別用PstI限制性內(nèi)切核酸酶消化來(lái)自為了檢測(cè)多態(tài)性而比較的兩個(gè)大豆系的基因組DNA,PstI限制性內(nèi)切核酸酶為DNA片段的末端提供粘性末端,該粘性末端可以連接到具有相同限制性位點(diǎn)的質(zhì)粒中。舉例來(lái)說(shuō),將100單位PstI添加到20微克的DNA中,并在37°C溫育8小時(shí)。在的低熔點(diǎn)瓊脂糖凝膠上通過(guò)電泳分離消化的DNA產(chǎn)物,以按大小分離DNA片段。將來(lái)自兩個(gè)大豆系的消化的DNA并排加樣到凝膠上(之間用一個(gè)電泳泳道作為間隔)。將I-KBDNA階梯分子量標(biāo)準(zhǔn)和100-bpDNA階梯分子量標(biāo)準(zhǔn)加樣到兩個(gè)大豆DNA泳道的各一側(cè)。這些分子量標(biāo)準(zhǔn)作為消化的大豆DNA的大小分級(jí)分離的指導(dǎo)。依照500-600bp、600-700bp、700-800bp、800-900bp、900-1100bp、1100-1500bp、1500-2000bp、2000-2500bp和2500-3000bp的大小部分,從凝膠上逐步切下500_3000bp范圍的片段。使用β-瓊脂糖酶純化每個(gè)部分中的DNA,并連接到pUC18的PstI克隆位點(diǎn)中。質(zhì)粒連接產(chǎn)物通過(guò)電穿孔轉(zhuǎn)化到DHlOB大腸桿菌細(xì)菌宿主中,以產(chǎn)生簡(jiǎn)化形式的文庫(kù)。例如,大約500ng大小選擇的DNA與50ng去磷酸化的pUC18載體連接。通過(guò)電穿孔進(jìn)行轉(zhuǎn)化,簡(jiǎn)化形式的PstI文庫(kù)的轉(zhuǎn)化效率是1微升連接產(chǎn)物大約50,000-300,000個(gè)轉(zhuǎn)化體,或1000-6000個(gè)轉(zhuǎn)化體/ngDNA。評(píng)價(jià)質(zhì)量的基本試驗(yàn)包括平均插入大小、葉綠體/線粒體DNA含量以及重復(fù)序列的分?jǐn)?shù)。在文庫(kù)構(gòu)建過(guò)程中評(píng)估該文庫(kù)的平均插入大小。通過(guò)每個(gè)連接測(cè)定10-20個(gè)克隆檢測(cè)每個(gè)連接,以確定平均插入大小。使用標(biāo)準(zhǔn)的微量制備方案從重組克隆中分離DNA,用PstI消化,以使插入片段從載體上釋放出來(lái),然后使用的瓊脂糖凝膠電泳進(jìn)行大小分離(Maule,MolecularBiotechnology9107-126(1998),本文引入其全文作為參考)。通過(guò)對(duì)克隆(400)小樣本進(jìn)行測(cè)序,并相對(duì)各種序列數(shù)據(jù)庫(kù)交互核對(duì)獲得的序列,評(píng)估葉綠體/線粒體DNA含量和重復(fù)序列在文庫(kù)中的百分比。一些重復(fù)元件不存于數(shù)據(jù)庫(kù)中,但通??梢酝ㄟ^(guò)相同序列的大量拷貝來(lái)鑒定。例如,在對(duì)一組400個(gè)克隆進(jìn)行測(cè)序之后,沒(méi)有通過(guò)重復(fù)元件數(shù)據(jù)庫(kù)過(guò)濾但在樣品中以超過(guò)10倍存在的任何序列被認(rèn)為是重復(fù)元件。通過(guò)插入從以下大豆系獲得的富含編碼區(qū)的DNA構(gòu)建本發(fā)明的大豆簡(jiǎn)化形式文庫(kù)A2869、A3244、CX400、AG2403、AG2801、DKB31-51、AG3602、CMA5901C0C、A5427、N94-552、Hutchison、Essex、Accomac、Lee74、AG4201、AG5501、AG5605、AG4403、HSl、PIC、Minsoy、Noir和M017Williams82。實(shí)施例2本實(shí)施例說(shuō)明從實(shí)施例1制備的簡(jiǎn)化形式文庫(kù)中的克隆確定大豆基因組DNA序列。兩種基本方法可以用于DNA測(cè)序Sanger等人,Proc.Natl.Acad.Sci.USA74:5463-5467(1977)的鏈終止法,以及Maxam和Gilbert,Proc.Natl.Acad.Sci.USA74560-564(1977)的化學(xué)降解法。技術(shù)的自動(dòng)化和進(jìn)步,例如用基于熒光的測(cè)序代替放射性同位素,減少了DNA測(cè)序所需的工作(Craxton,Methods,2:20-26(1991),Ju等人,Proc.Natl.Acad.Sci.USA92:4347_4351(1995)及Tabor禾ΠRichardson,Proc.Natl.Acad.Sci.USA92:6339-6343(1995))。自動(dòng)化測(cè)序儀可以獲自,例如,AppliedBiosystems,FosterCity,California(ABIPrismsystems);PharmaciaBiotech,Inc.,Piscataway,NewJersey(PharmaciaALF),LI—C0R,Inc.,Lincoln,Nebraska(LI—COR4,000)禾口Millipore,Bedford,Massachusetts(MilliporeBaseStation)。通過(guò)可從CodonCodeCorporation,Dedham,MA獲得的PHRED分配來(lái)自跟蹤文件(tracefiles)的序列堿基識(shí)別(basecalling)和質(zhì)量得分,BrentEwing,等人"Base-callingofautomatedsequencertracesusingphred,,,1998,GenomeResearch,第8卷,第175-185和186-194頁(yè)描述了該P(yáng)HRED,本文引入該文獻(xiàn)作為參考。堿基識(shí)別完成后,通過(guò)切去質(zhì)量較差的末端序列提高序列質(zhì)量。如果產(chǎn)生的序列小于50bp,則將它刪除。刪除整體質(zhì)量小于12.5的序列。而且,除去污染序列,例如大腸桿菌BAC和載體序列和亞克隆載體。使用可從DoubleTwistInc.,Oakland,CA獲得的PangeaClusteringandAlignmentTools,通過(guò)比較序列對(duì)的重疊堿基,裝配疊連群。使用下列高嚴(yán)格性參數(shù)確定重疊字長(zhǎng)=8;窗口大小=60;同一性為93%。使用可從CodonCodeCorporation獲得的PHRAP片段裝配程序,使用0.5或更低的“重復(fù)嚴(yán)格性”參數(shù),重新裝配群簇(clusters)。最終的裝配輸出包含序列的集合,其中包括代表重疊聚類(lèi)序列(疊連群)的共有序列的疊連群序列,和不存在于相關(guān)序列(單拷貝序列)的任何群簇中的單拷貝序列(singleton)??偲饋?lái)說(shuō),由DNA裝配產(chǎn)生的疊連群和單拷貝序列被稱為島(islands)。實(shí)施例3本實(shí)施例說(shuō)明通過(guò)比較來(lái)自如實(shí)施例2制備的至少2個(gè)單獨(dú)大豆系的疊連群和單拷貝序列的序列對(duì)比,來(lái)鑒定SNP和Indel多態(tài)性。將來(lái)自多個(gè)大豆系的序列裝配成具有一種或多種多態(tài)性、即SNP和/或Indel的基因座。合格的候選多態(tài)性具有以下參數(shù)用于共有比對(duì)的疊連群或單拷貝序列的最小長(zhǎng)度是200個(gè)堿基。在候選SNP每一側(cè)上的15個(gè)堿基的區(qū)域中,觀測(cè)到的堿基的同一性百分比是75%。在多態(tài)性位點(diǎn)處的每個(gè)疊連群中的最小BLAST質(zhì)量是35。在多態(tài)性位點(diǎn)每一側(cè)的15個(gè)堿基的區(qū)域中,最小BLAST質(zhì)量是20。多個(gè)具有合格的多態(tài)性的基因座被確定為具有如SEQIDN0:1至SEQIDNO7800報(bào)告的共有序列。表1中確定了每個(gè)基因座中的合格的SNP和Indel多態(tài)性。更具體地,表1如下確定了多態(tài)性的類(lèi)型和位置SEQ_NUM指多態(tài)性大豆DNA基因座的SEQIDNO.(序列ID號(hào))。C0NSSEQ_ID指多態(tài)性大豆DNA基因座的任意確定的名稱。MUTATI0N_ID指每種多態(tài)性的任意確定的名稱。START_P0S指在多態(tài)性大豆DNA基因座的核苷酸序列中多態(tài)性開(kāi)始的位置。END_P0S指在多態(tài)性大豆DNA基因座的核苷酸序列中多態(tài)性結(jié)束的位置;對(duì)于SNP,START_P0S和END_P0S是共同的。TYPE指確定多態(tài)性為SNP或IND(Indel)。ALLELE和STRAIN指特定等位基因大豆品種中的多態(tài)性的核苷酸序列。實(shí)施例4本實(shí)施例說(shuō)明利用引物堿基延伸檢測(cè)SNP多態(tài)性。使用正向和反向PCR引物擴(kuò)增少量的大豆基因組DNA(如大約10ng),該引物設(shè)計(jì)為具有55°C的與模板的退火溫度,S卩,在特定分子標(biāo)記的多態(tài)性的周?chē)?。將PCR產(chǎn)物加到新板中,其中延伸引物與GBA板中的反應(yīng)孔表面共價(jià)結(jié)合。加入含有DNA聚合酶、2種差異標(biāo)記的ddNTP和延伸緩沖液的延伸混合物。GBA板在42°C下溫育15分鐘,以允許延伸。通過(guò)用合適的緩沖液洗滌,從孔中除去反應(yīng)混合物。對(duì)于每種標(biāo)記,通過(guò)相繼與第一和第二檢測(cè)試劑溫育來(lái)檢測(cè)這兩種標(biāo)記。通過(guò)以下步驟測(cè)定特定ddNTP-FITC的摻入與HRP-抗-FITC溫育,接著洗滌孔,接著在含有HRP的發(fā)色底物的緩沖液中溫育。在適于HRP反應(yīng)產(chǎn)物的波長(zhǎng)處,用分光光度法測(cè)量每個(gè)孔的反應(yīng)程度。再次洗滌該孔,用AP-鏈霉抗生物素蛋白重復(fù)該程序,接著在含有AP的發(fā)色底物的緩沖液中溫育,并在適于AP反應(yīng)產(chǎn)物的波長(zhǎng)處進(jìn)行分光光度法測(cè)量。結(jié)果分析從對(duì)檢測(cè)步驟特異性標(biāo)記的反應(yīng)產(chǎn)物測(cè)量的吸光度推斷每種標(biāo)記ddNTP的摻入程度,并從這些吸光度相對(duì)于已知基因型的標(biāo)準(zhǔn)和無(wú)模板對(duì)照反應(yīng)的比例推斷樣品的基因型。在最常見(jiàn)的做法中,觀察到的每個(gè)數(shù)據(jù)點(diǎn)的吸光度相對(duì)于彼此在散點(diǎn)圖中繪圖,產(chǎn)生“等位圖”。利用該實(shí)施例的單堿基延伸試驗(yàn)的一個(gè)成功的基因分型試驗(yàn)提供了如圖2所示的等位圖,其中數(shù)據(jù)點(diǎn)分為四個(gè)群簇純合子1(例如,A等位基因)、純合子2(例如,G等位基因)、雜合子(每個(gè)樣品含有兩個(gè)等位基因)和由無(wú)模板對(duì)照或失敗的擴(kuò)增或檢測(cè)產(chǎn)生的“無(wú)信號(hào)”簇。實(shí)施例5本實(shí)施例說(shuō)明利用標(biāo)記探針降解試驗(yàn)檢測(cè)SNP多態(tài)性。在5iU的總體積中,一定量的大豆基因組模板DNA(如大約2-20ng)與如表2所述的4種寡核苷酸(即正向引物、反向引物、具有附著在5'端的VIC報(bào)道分子的雜交探針和具有附著在5'端的FAM報(bào)道分子的雜交探針)以及含有被動(dòng)參比染料R0X的PCR反應(yīng)緩沖液相混合。使用60°C的退火-延伸溫度,進(jìn)行PCR反應(yīng)35個(gè)循環(huán)。反應(yīng)后,使用熒光計(jì)確定每個(gè)熒光團(tuán)的熒光,以及被動(dòng)參比的熒光。每個(gè)熒光團(tuán)的熒光值相對(duì)于被動(dòng)參比的熒光值標(biāo)準(zhǔn)化。每一個(gè)樣品的標(biāo)準(zhǔn)化的值相對(duì)于彼此繪圖,以產(chǎn)生等位圖。使用本實(shí)施例的引物和雜交探針的一個(gè)成功的基因分型試驗(yàn)提供了如圖2所示的在可清楚分開(kāi)的群簇中具有數(shù)據(jù)點(diǎn)的等位圖。表2.使用SNP多態(tài)性的標(biāo)記探針降解檢測(cè)的分子標(biāo)記試驗(yàn)的例子。每個(gè)試驗(yàn)提供兩個(gè)用于擴(kuò)增橫跨多態(tài)性的區(qū)域的寡核苷酸引物,和兩個(gè)附著有用于SNP等位基因檢測(cè)的熒光報(bào)告分子的寡核苷酸探針。有用的報(bào)告染料包括但不限于6-羧基_4,7,2’,7’-四氯熒光素(TET)、2'-氯-7'-苯基-1,4-二氯-6-羧基熒光素(VIC)和6-羧基熒光素亞磷酰胺(FAM)。一種有用的猝滅劑是6-羧基-N,N,N’,N’-四甲基羅丹明(TAMRA)。<table>tableseeoriginaldocumentpage48</column></row><table>為證實(shí)試S乏產(chǎn)生精確的結(jié)果,對(duì)代表三種可能的基因型(即兩種純合子等位基因和一種雜合子樣品)中的每一種的已知基因型身份的多個(gè)重復(fù)樣品進(jìn)行每個(gè)新的試驗(yàn)。為了成為有效的和有用的試驗(yàn),它必須產(chǎn)生可清楚分開(kāi)的數(shù)據(jù)點(diǎn)簇,使得可以為至少90%的數(shù)據(jù)點(diǎn)分配三種基因型中的一種,并且觀察到這種分配對(duì)于至少98%的數(shù)據(jù)點(diǎn)是正確的。在此驗(yàn)證步驟后,對(duì)兩個(gè)高度近交的個(gè)體之間的雜交后代進(jìn)行試驗(yàn),以獲得分離數(shù)據(jù),然后利用該分離數(shù)據(jù)計(jì)算多態(tài)性基因座的基因圖譜位置。實(shí)施例6本實(shí)施例說(shuō)明,對(duì)于大豆系A(chǔ)3244和AG5501雜交產(chǎn)生的476個(gè)F2植物,基于超過(guò)2000個(gè)SNP的基因型,本發(fā)明基因座中的分子標(biāo)記的遺傳作圖。作圖之前,除去任何顯示扭曲的分離的基因型(對(duì)于分離比為11的卡方檢驗(yàn),P<le-5)。低a水平用來(lái)說(shuō)明多重檢驗(yàn)的問(wèn)題。一方面,可以使用由Stam,P."ConstructionofintegratedgeneticlinkagemapsbymeansofanewcomputerpackageJoinMap,ThePlantJournal,3739-744(1993);Stam,P.禾口vanOoijen,J.ff."JoinMapversion2.0:Softwareforthecalculationofgeneticlinkagemaps(1995)CPR0-DL0,ffageningen.描述的JoinMap2.0版軟件構(gòu)建圖譜。JoinMap實(shí)現(xiàn)對(duì)于多點(diǎn)作圖的加權(quán)最小二乘方法,圖中加入來(lái)自所有連鎖基因座對(duì)(相鄰或不相鄰)的信息。使用5.0的L0D閾值形成連鎖群。利用SSR和RFLP公共標(biāo)記將連鎖群分配到染色體上。在構(gòu)建圖譜之前,連鎖群合并入染色體內(nèi)。其它高密度標(biāo)記作圖方法是本領(lǐng)域內(nèi)已知的;關(guān)于IRI在較高分辨率作圖中的應(yīng)用,參見(jiàn),例如,Winkler等人(Genetics164:741-745(2003))。另外參見(jiàn),Jansen等人(TheorApplGenet1021113-1122(2001))在許多條件下,Jansen等人的方法導(dǎo)致非常近似于最大似然圖。此外,由這種方法評(píng)估的圖譜與使用JoinMap2.0獲得的圖譜非常一致。此外,上述的和本文作為參考引入的方法的組合可以用于在一定范圍的群體結(jié)構(gòu)以及計(jì)算限制下最有效地調(diào)節(jié)(leverage)標(biāo)記數(shù)據(jù)。本發(fā)明的另一方面,利用Kosambi作圖函數(shù)將重組部分轉(zhuǎn)化為圖譜距離。定位的SNP分子標(biāo)記在表3中確定,其中,“LG”確定連鎖群或染色體,“位置”確定對(duì)于根據(jù)“ConsseqJD”確定的SNP,以cM為單位測(cè)量的距大豆染色體5'端的距離。對(duì)于表3中所列的某些定位的多態(tài)性標(biāo)記,多次列出突變ID,其表明基于多重基因分型試驗(yàn)進(jìn)行作圖。多重基因分型試驗(yàn)的圖譜位置一般用于證實(shí)圖譜位置,除了在圖譜位置分歧的情況下以外,例如,由于試驗(yàn)設(shè)計(jì)或?qū)嵺`的誤差。作圖的分子標(biāo)記的密度和分布如圖1所示。實(shí)施例7本實(shí)施例說(shuō)明使用表1中和SEQIDNO1-7800的DNA序列中公開(kāi)的分子標(biāo)記的本發(fā)明的方法。使用基于SEQIDNO1-7800的序列,如實(shí)施例5中所述制備的用于表1中確定的每種分子標(biāo)記的引物對(duì)和探針對(duì),分析具有不同的遺傳的大豆育種群體。密切連鎖的分子標(biāo)記被確定為大豆基因組中大約10厘摩的相鄰基因組窗口之內(nèi)的特征性單元型。代表群體的至少4%的單元型與對(duì)于大豆群體的每個(gè)成員確定的性狀值相關(guān),包括產(chǎn)量、成熟度、倒伏、株高、銹病抗性、耐旱性和冷發(fā)芽的性狀值。每個(gè)單元型的性狀值在各為10厘摩的窗口內(nèi)排序。分析來(lái)自群體的隨機(jī)交配成員的后代種子在每個(gè)窗口中的單元型的身份?;谠谒龇N子中確定的單元型的高性狀值,選擇后代種子進(jìn)行種植。實(shí)施例8本實(shí)施例說(shuō)明可用于獲得用于育種的、具有優(yōu)選性狀的親本植物、后代植物或測(cè)試植物的多態(tài)性的鑒定。在這個(gè)具體的實(shí)施例中,為了說(shuō)明性的目的,已選擇多態(tài)性用于鑒定具有優(yōu)選產(chǎn)量性狀的植物。但是,也預(yù)計(jì)可以以類(lèi)似的方式鑒定可用于鑒定其它優(yōu)選性狀的其它標(biāo)記(即,通過(guò)指出多態(tài)性的遺傳圖譜位置在單元型窗口內(nèi)的定位)。進(jìn)一步預(yù)期,本實(shí)施例中披露的具體標(biāo)記除了作為產(chǎn)量性狀的標(biāo)記以外也可以發(fā)現(xiàn)其它用途。首先,如美國(guó)專利申請(qǐng)60/837864所公開(kāi)的那樣確定與產(chǎn)量相關(guān)的單元型窗口。利用表3中公開(kāi)的圖譜位置確定本發(fā)明的標(biāo)記,該標(biāo)記位于包括優(yōu)選的產(chǎn)量單元型的單元型窗口中,并且可以用作這些區(qū)域的標(biāo)記。選擇與25個(gè)單元型窗口一致的25種多態(tài)性,這些窗口包括在孟山都(Monsanto)的大豆種質(zhì)中與產(chǎn)量?jī)?yōu)勢(shì)相關(guān)的25種單元型。因而對(duì)于這些產(chǎn)量單元型窗口的大多數(shù)提供兩(2)種標(biāo)記??捎糜阼b定具有優(yōu)選產(chǎn)量性狀的用于育種的植物的具體標(biāo)記可以選自SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142、80、88、980、538、1925、3669、2270、1397、3747、888、365、2132、1972、459、762*SEQIDNO:1094。從以上描述中可以看出,可以實(shí)現(xiàn)并獲得本發(fā)明的幾個(gè)優(yōu)勢(shì)。選擇并描述實(shí)施方案,以便最好地解釋本發(fā)明的原理及其實(shí)際應(yīng)用,從而使本領(lǐng)域的其它技術(shù)人員能夠在各種實(shí)施方案中最好地利用本發(fā)明,并且進(jìn)行各種修改以適于預(yù)期的特定應(yīng)用。本文引用了多篇專利和非專利出版物,它們的公開(kāi)內(nèi)容均完整引入本文作為參考。由于在不背離本發(fā)明的范圍的情況下,可以在本文描述的和說(shuō)明的結(jié)構(gòu)和方法中進(jìn)行各種修改,上述說(shuō)明書(shū)包含的或附圖顯示的所有內(nèi)容應(yīng)當(dāng)解釋為示例性的,而非限制性的。本發(fā)明的廣度和范圍不應(yīng)由上述任何示例性的實(shí)施方案限制,而應(yīng)該只根據(jù)下面的權(quán)利要求書(shū)及其等同物加以限定。權(quán)利要求一種核酸分子文庫(kù),所述文庫(kù)包括至少兩組不同的核酸分子,其中,所述不同組核酸分子中的每一組允許對(duì)表1或表3中確定的相應(yīng)的大豆基因組DNA多態(tài)性進(jìn)行分型。2.如權(quán)利要求1所述的文庫(kù),其中,所述不同組的核酸分子排列在至少一個(gè)固體載體上或至少一個(gè)微量滴定板上。3.如權(quán)利要求2所述的文庫(kù),其中,所述不同組核酸分子中的每一組位于所述微量滴定板的單獨(dú)的和不同的孔中。4.如權(quán)利要求2所述的文庫(kù),其中,所述不同組核酸分子中的每一組位于所述固體載體上的不同的探詢位置處。5.如權(quán)利要求1所述的文庫(kù),其中,所述核酸分子組合在單一混合物中。6.如權(quán)利要求1所述的文庫(kù),其中,所述不同組核酸分子中的每一組包括至少12個(gè)連續(xù)核苷酸的核酸分子,該核苷酸包括或直接鄰近表1中確定的相應(yīng)的多態(tài)性,并且其中至少12個(gè)連續(xù)核苷酸的該序列與包括或直接鄰近所述多態(tài)性的大豆DNA片段任一鏈中相同數(shù)目核苷酸的序列至少90%相同。7.如權(quán)利要求6所述的文庫(kù),其中,所述核酸分子是至少15個(gè)連續(xù)核苷酸的核酸分子。8.如權(quán)利要求7所述的文庫(kù),其中,所述核酸分子是至少18個(gè)連續(xù)核苷酸的核酸分子。9.如權(quán)利要求1所述的文庫(kù),其中,所述核酸分子進(jìn)一步包括可檢測(cè)的標(biāo)記或提供可檢測(cè)的標(biāo)記的摻入。10.如權(quán)利要求9所述的文庫(kù),其中,所述可檢測(cè)的標(biāo)記選自同位素、熒光團(tuán)、氧化劑、還原劑、核苷酸和半抗原。11.如權(quán)利要求10所述的文庫(kù),其中,所述可檢測(cè)的標(biāo)記通過(guò)化學(xué)反應(yīng)添加到核酸上,或通過(guò)酶促反應(yīng)摻入。12.如權(quán)利要求1所述的文庫(kù),其中,所述每個(gè)不同組的核酸分子包括a.一對(duì)寡核苷酸引物,其中,所述寡核苷酸引物中的每一個(gè)包括至少15個(gè)核苷酸堿基,并允許PCR擴(kuò)增包含表1或表3中確定的所述相應(yīng)多態(tài)性之一的DNA片段,和b.至少一種檢測(cè)核酸分子,其允許檢測(cè)(a)中所述擴(kuò)增片段中的多態(tài)性。13.如權(quán)利要求12所述的文庫(kù),其中,所述檢測(cè)核酸包含至少12個(gè)核苷酸堿基,或包含至少12個(gè)核苷酸堿基和可檢測(cè)的標(biāo)記,并且其中,所述檢測(cè)核酸分子的序列與包括所述多態(tài)性的權(quán)利要求1的基因座中大豆DNA片段任一鏈中相同數(shù)目連續(xù)核苷酸的序列至少95%相同。14.如權(quán)利要求1所述的文庫(kù),其中,所述文庫(kù)包括至少8組不同的核酸分子,其中,所述每組分子允許對(duì)表1或表3中確定的相應(yīng)的不同大豆基因組DNA多態(tài)性進(jìn)行分型。15.如權(quán)利要求14所述的文庫(kù),其中,所述文庫(kù)包括至少24組不同的核酸分子,其中,所述每組分子允許對(duì)表1或表3中確定的相應(yīng)的不同大豆基因組DNA多態(tài)性進(jìn)行分型。16.如權(quán)利要求15所述的文庫(kù),其中,所述文庫(kù)包括至少96組不同的核酸分子,其中,所述每組分子允許對(duì)表1或表3中確定的相應(yīng)的不同大豆基因組DNA多態(tài)性進(jìn)行分型。17.如權(quán)利要求16所述的文庫(kù),其中,所述文庫(kù)包括至少384組不同的核酸分子,其中,所述每組分子允許對(duì)表1或表3中確定的相應(yīng)的不同大豆基因組DNA多態(tài)性進(jìn)行分型。18.如權(quán)利要求1所述的文庫(kù),其中,表3中確定的所述相應(yīng)的不同大豆基因組DNA多態(tài)性選自SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142、80、88、980、538、(1925、3669、2270、1397、3747、888、365、2132、1972、459、762和1094。19.如權(quán)利要求1所述的文庫(kù),其中,選擇所述不同組的核酸分子,用于鑒定在待基因分型的群體中預(yù)測(cè)為多態(tài)性的相應(yīng)的不同大豆基因組DNA多態(tài)性。20.一種計(jì)算機(jī)可讀介質(zhì),在其上記錄有至少兩種表1或表3中確定的大豆基因組DNA多態(tài)性。21.如權(quán)利要求20所述的計(jì)算機(jī)可讀介質(zhì),其中,其上記錄有至少8種表1或表3中確定的大豆基因組DNA多態(tài)性。22.—種計(jì)算機(jī)可讀介質(zhì),在其上記錄有至少兩種表3中確定的大豆基因組DNA多態(tài)性和每種所述大豆基因組DNA多態(tài)性的相應(yīng)的遺傳圖譜位置。23.如權(quán)利要求22所述的計(jì)算機(jī)可讀介質(zhì),其中,其上記錄有至少8種大豆基因組DNA多態(tài)性和相應(yīng)的遺傳圖譜位置。24.一種用于讀取、分類(lèi)或分析大豆基因型數(shù)據(jù)的基于計(jì)算機(jī)的系統(tǒng),其包括以下構(gòu)件(a)數(shù)據(jù)存儲(chǔ)裝置,包括計(jì)算機(jī)可讀介質(zhì),其中,其上記錄有至少2種表1或表3中確定的大豆基因組DNA多態(tài)性;(b)搜索裝置,用于比較來(lái)自至少一種測(cè)試大豆植物的大豆基因組DNA序列與步驟(a)的數(shù)據(jù)存儲(chǔ)裝置的所述多態(tài)性序列,以鑒定同源或非同源序列;和(c)檢索裝置,用于鑒定步驟(b)的所述測(cè)試大豆基因組序列的所述同源或非同源序列。25.如權(quán)利要求24所述的基于計(jì)算機(jī)的系統(tǒng),其中,至少96種表1或表3中確定的大豆基因組DNA多態(tài)性記錄在所述計(jì)算機(jī)可讀介質(zhì)上。26.如權(quán)利要求24所述的基于計(jì)算機(jī)的系統(tǒng),其中,所述數(shù)據(jù)存儲(chǔ)裝置進(jìn)一步包括計(jì)算機(jī)可讀介質(zhì),其中,其上記錄有來(lái)自至少一種所述測(cè)試大豆植物的表型性狀數(shù)據(jù)。27.如權(quán)利要求24所述的基于計(jì)算機(jī)的系統(tǒng),其中,所述數(shù)據(jù)存儲(chǔ)裝置進(jìn)一步包括計(jì)算機(jī)可讀介質(zhì),其中,其上記錄有等位基因狀態(tài)與親本、后代或測(cè)試大豆植物的關(guān)聯(lián)數(shù)據(jù)。28.如權(quán)利要求24所述的基于計(jì)算機(jī)的系統(tǒng),其中,所述多種定位的表3中確定的大豆基因組DNA多態(tài)性記錄在所述計(jì)算機(jī)可讀介質(zhì)上,并且其中,所述計(jì)算機(jī)可讀介質(zhì)進(jìn)一步包括每種所述定位的多態(tài)性的遺傳圖譜位置數(shù)據(jù)。29.一種分離的核酸分子,其用于檢測(cè)代表大豆DNA中的多態(tài)性的分子標(biāo)記,其中,所述核酸分子包含至少15個(gè)核苷酸,所述核苷酸包括或直接鄰近所述多態(tài)性,并且其中,所述核酸分子與包括或直接鄰近所述多態(tài)性的DNA任一鏈中相同數(shù)目連續(xù)核苷酸的序列至少90%相同,并且其中,所述多態(tài)性是在表1或表3中所確定的。30.如權(quán)利要求29所述的分離的核酸,其中,所述核酸進(jìn)一步包含可檢測(cè)的標(biāo)記或提供可檢測(cè)的標(biāo)記的摻入。31.如權(quán)利要求30所述的分離的核酸,其中,所述可檢測(cè)的標(biāo)記選自同位素、熒光團(tuán)、氧化劑、還原劑、核苷酸和半抗原。32.如權(quán)利要求31所述的分離的核酸,其中,所述可檢測(cè)的標(biāo)記通過(guò)化學(xué)反應(yīng)添加到核酸上,或者通過(guò)酶促反應(yīng)摻入。33.如權(quán)利要求29所述的分離的核酸,其中,所述表3中的多態(tài)性選自SEQIDNO3122、2914、3984、3608、1448、69、1261、3436、1142、80、88、980、538、1925、3669、2270、1397、3747、888、365、2132、1972、459、762和1094。34.一組寡核苷酸,其包含a.一對(duì)寡核苷酸引物,其中,所述引物中的每一個(gè)包含至少12個(gè)連續(xù)核苷酸,并且其中,所述引物對(duì)允許PCR擴(kuò)增包含表1或表3中確定的大豆基因組DNA多態(tài)性的DNA片段;禾口b.至少一種檢測(cè)寡核苷酸,其允許檢測(cè)所述擴(kuò)增片段中的多態(tài)性,其中,所述檢測(cè)寡核苷酸的序列與包括或直接鄰近步驟(a)的所述多態(tài)性的大豆DNA片段任一鏈中相同數(shù)目連續(xù)核苷酸的序列至少95%相同。35.如權(quán)利要求34所述的一組寡核苷酸,其中,所述檢測(cè)核酸包含至少12個(gè)核苷酸,并且提供可檢測(cè)標(biāo)記的摻入或進(jìn)一步包含可檢測(cè)的標(biāo)記。36.如權(quán)利要求35所述的一組寡核苷酸,其中,所述可檢測(cè)的標(biāo)記選自同位素、熒光團(tuán)、氧化劑、還原劑、核苷酸和半抗原。37.一種對(duì)大豆植物進(jìn)行基因分型以選擇用于育種的親本植物、后代植物或測(cè)試植物的方法,所述方法包括以下步驟a.從至少一個(gè)大豆植物的組織獲得DNA或RNA樣品;b.對(duì)于來(lái)自步驟(a)的所述樣品,確定表1或表3中確定的至少一種大豆基因組DNA多態(tài)性的等位基因狀態(tài);和c.利用步驟(b)的所述等位基因狀態(tài)確定情況選擇用于育種的親本植物、后代植物或測(cè)試植物。38.如權(quán)利要求37所述的基因分型方法,其中,所述多態(tài)性是表3中確定的定位的多態(tài)性。39.如權(quán)利要求37所述的方法,其中,通過(guò)允許鑒定單核苷酸多態(tài)性的試驗(yàn)確定所述多態(tài)性的所述等位基因狀態(tài)。40.如權(quán)利要求39所述的方法,其中,所述試驗(yàn)選自單堿基延伸(SBE)、等位基因特異性引物延伸測(cè)序(ASPE)、DNA測(cè)序、RNA測(cè)序、基于微陣列的分析、通用PCR、等位基因特異性延伸、雜交、質(zhì)譜法、連接、延伸-連接和瓣核酸內(nèi)切酶介導(dǎo)的試驗(yàn)。41.如權(quán)利要求37所述的方法,其中,確定表1或表3中確定的至少8種不同的多態(tài)性的等位基因狀態(tài)。42.如權(quán)利要求41所述的方法,其中,確定表1或表3中確定的至少48種不同的多態(tài)性的等位基因狀態(tài)。43.如權(quán)利要求42所述的方法,其中,確定表1或表3中確定的至少96種不同的多態(tài)性的等位基因狀態(tài)。44.如權(quán)利要求43所述的方法,其中,確定表1或表3中確定的至少384種不同的多態(tài)性的等位基因狀態(tài)。45.如權(quán)利要求44所述的方法,進(jìn)一步包括利用步驟(b)的所述等位基因狀態(tài)確定情況來(lái)選擇用于育種的親本植物、后代植物或測(cè)試植物的步驟。46.如權(quán)利要求37所述的方法,進(jìn)一步包括在計(jì)算機(jī)可讀介質(zhì)上存儲(chǔ)所述一種或多種等位基因狀態(tài)確定情況產(chǎn)生的基因型數(shù)據(jù)的步驟。47.如權(quán)利要求46所述的方法,進(jìn)一步包括將一個(gè)大豆植物與另一個(gè)大豆植物的所述基因型數(shù)據(jù)進(jìn)行比較的步驟。48.如權(quán)利要求46所述的方法,進(jìn)一步包括將至少一種所述大豆植物的所述基因型數(shù)據(jù)與表型性狀數(shù)據(jù)或表型性狀指數(shù)數(shù)據(jù)進(jìn)行比較的步驟。49.如權(quán)利要求46所述的方法,進(jìn)一步包括將至少兩種所述大豆植物的基因型數(shù)據(jù)與表型性狀數(shù)據(jù)或表型性狀指數(shù)數(shù)據(jù)進(jìn)行比較,并確定所述基因型數(shù)據(jù)和所述表型性狀數(shù)據(jù)之間的一種或多種關(guān)聯(lián)的步驟。50.如權(quán)利要求49所述的方法,其中,確定所述表型性狀數(shù)據(jù)或表型性狀指數(shù)數(shù)據(jù)與所述基因型性狀數(shù)據(jù)之間的關(guān)聯(lián),并且其中,所述基因型性狀數(shù)據(jù)包括至少10種定位的表3中確定的多態(tài)性的等位基因狀態(tài)確定情況。51.一種培育大豆植物的方法,包括以下步驟(a)對(duì)于至少兩個(gè)大豆植物的育種群體,確定與至少兩個(gè)最多10厘摩的基因組窗口中的至少兩個(gè)單元型相關(guān)的至少一種性狀的性狀值;(b)培育所述育種群體中的兩個(gè)大豆植物,以產(chǎn)生后代種子群體;(c)在所述后代種子中,確定至少一種表1或表3中確定的多態(tài)性在每個(gè)所述窗口中的等位基因狀態(tài),以確定所述單元型的存在;和(d)在所述后代種子中選擇對(duì)于至少一種與確定的單元型相關(guān)的性狀而言具有較高性狀值的后代種子,從而培育大豆植物。52.如權(quán)利要求51所述的方法,其中,對(duì)與基本上每條染色體整體上的每個(gè)相鄰基因組窗口中的至少兩個(gè)單元型相關(guān)的至少一種性狀,確定其性狀值。53.如權(quán)利要求52所述的方法,其中,所述性狀值鑒定選自以下的性狀除草劑耐受性、抗病性、昆蟲(chóng)或害蟲(chóng)抗性、改變的脂肪酸、蛋白質(zhì)或碳水化合物代謝、增加的谷物產(chǎn)量、增加的油、增加的營(yíng)養(yǎng)成分含量、提高的生長(zhǎng)速度、提高的應(yīng)激耐受性、優(yōu)選的成熟度、增強(qiáng)的感官特性、改變的形態(tài)特征、其它農(nóng)藝學(xué)性狀、用于工業(yè)應(yīng)用的性狀、或?qū)οM(fèi)者有提高的吸引力的性狀、或作為多性狀指數(shù)的性狀組合。54.如權(quán)利要求53所述的方法,其中,對(duì)于每條染色體中最多10厘摩的基因組窗口中的單元型,選擇具有較高產(chǎn)量性狀值的后代種子。55.如權(quán)利要求54所述的方法,其中,所述性狀值是產(chǎn)量性狀的性狀值,且對(duì)每個(gè)窗口中的單元型的性狀值進(jìn)行排序;并且其中,選擇窗口中的產(chǎn)量性狀值高于所述窗口中的平均產(chǎn)量性狀值的后代種子。56.如權(quán)利要求55所述的方法,其中,所述單元型中的所述多態(tài)性位于包括SEQIDNO:1至SEQIDNO7800的全部DNA序列的DNA序列組中。57.一種選擇用于植物育種的親本、后代或測(cè)試植物的方法,包括以下步驟a)在至少第一和第二大豆近交系中,確定多種表1或表3中確定的多態(tài)性與多種性狀之間的關(guān)聯(lián);b)確定親本、后代或測(cè)試植物中的一種或多種多態(tài)性的等位基因狀態(tài);c)選擇具有更有利的相關(guān)性狀組合的親本、后代或測(cè)試植物。58.如權(quán)利要求57所述的方法,其中,所述親本、后代或測(cè)試植物是大豆近交系。59.如權(quán)利要求57所述的方法,其中,所述有利的相關(guān)性狀組合提供提高的雜種優(yōu)勢(shì)。60.一種提高雜種大豆植物的雜種優(yōu)勢(shì)的方法,包括以下步驟(a)在兩個(gè)以上的大豆近交系中,確定表1或表3中確定的多種多態(tài)性與多種性狀之間的關(guān)聯(lián);(b)將選自步驟(a)的所述近交系的兩個(gè)近交系分配至雜種優(yōu)勢(shì)群;(c)在步驟(b)的至少兩個(gè)近交系之間進(jìn)行至少一次雜交,其中,每個(gè)近交系來(lái)自不同的和互補(bǔ)的雜種優(yōu)勢(shì)群,并且其中,對(duì)于提高雜種優(yōu)勢(shì)的遺傳特征,優(yōu)化所述互補(bǔ)雜種優(yōu)勢(shì)群;和(d)通過(guò)步驟(c)的所述雜交獲得雜種后代植物,其中,相對(duì)于與未經(jīng)選擇的近交系雜交產(chǎn)生的后代,所述雜種后代植物顯示提高的雜種優(yōu)勢(shì),從而提高雜種大豆植物中的雜種優(yōu)勢(shì)。61.一種對(duì)大豆植物進(jìn)行基因分型以選擇用于育種的親本植物、后代植物或測(cè)試植物的方法,包括以下步驟a.從至少一個(gè)大豆植物的組織獲得DNA或RNA樣品;b.對(duì)于步驟(a)的所述樣品,確定一組包含表1或表3中確定的至少兩種多態(tài)性的大豆基因組DNA多態(tài)性的等位基因狀態(tài),其中,用一組提供對(duì)所述大豆基因組DNA多態(tài)性進(jìn)行分型的核酸分子確定所述等位基因狀態(tài);和c.利用步驟(b)的所述等位基因狀態(tài)確定情況,來(lái)選擇用于育種的親本植物、后代植物或測(cè)試植物。62.如權(quán)利要求61所述的大豆植物基因分型方法,其中,所述大豆基因組DNA多態(tài)性組包括至少5種在表1或表3中確定的多態(tài)性。63.如權(quán)利要求61所述的大豆植物基因分型方法,其中,所述大豆基因組DNA多態(tài)性組包括至少10種在表1或表3中確定的多態(tài)性。64.如權(quán)利要求61所述的大豆植物基因分型方法,其中,所述大豆基因組DNA多態(tài)性組包括至少20種在表1或表3中確定的多態(tài)性。65.如權(quán)利要求61所述的大豆植物基因分型方法,其中,所述大豆基因組DNA多態(tài)性組包括至少2種選自下組的多態(tài)性:SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142、80、88、980、538、1925、3669、2270、1397、3747、888、365、2132、1972、459、762和1094。66.如權(quán)利要求65所述的大豆植物基因分型方法,其中,所述大豆基因組DNA多態(tài)性組包括至少2種選自下組的多態(tài)性:SEQIDNO:3122、2914、3984、3608、1448、69、1261、3436、1142和80。67.如權(quán)利要求66所述的大豆植物基因分型方法,其中,所述大豆基因組DNA多態(tài)性組包括至少2種選自下組的多態(tài)性=SEQIDNO:3122、2914、3984、3608和1448。68.如權(quán)利要求67所述的大豆植物基因分型方法,其中,所述大豆基因組DNA多態(tài)性組包括SEQIDNO3122和SEQIDNO2914的多態(tài)性。69.如權(quán)利要求61所述的大豆植物基因分型方法,其中,所述大豆基因組DNA多態(tài)性組與對(duì)于產(chǎn)量、倒伏、成熟度、株高、耐旱性和冷發(fā)芽中的至少一種確定的性狀值相關(guān)。70.如權(quán)利要求69所述的大豆植物基因分型方法,其中,所述大豆基因組DNA多態(tài)性組與產(chǎn)量的性狀值相關(guān)。71.如權(quán)利要求65所述的大豆植物基因分型方法,其中,所述大豆基因組DNA多態(tài)性組與產(chǎn)量的性狀值相關(guān)。72.如權(quán)利要求64所述的方法,其中,所述至少20種大豆基因組DNA多態(tài)性的組鑒定分布于大豆基因組中的多態(tài)性。73.如權(quán)利要求72所述的方法,其中,所述至少20種大豆基因組DNA多態(tài)性的組鑒定分布于大豆的一條染色體上的多態(tài)性。74.如權(quán)利要求72所述的方法,其中,所述至少20種大豆基因組DNA多態(tài)性的組鑒定分布于大豆的至少兩條染色體上的多態(tài)性。75.如權(quán)利要求72所述的方法,其中,所述至少20種大豆基因組DNA多態(tài)性的組鑒定分布于大豆的全部染色體上的多態(tài)性。76.如權(quán)利要求75所述的方法,其中,所述至少20種大豆基因組DNA多態(tài)性的組鑒定分布于大豆的全部染色體上的多態(tài)性,使得所述組中的至少1種所述多態(tài)性定位于每條染色體上。77.如權(quán)利要求76所述的方法,其中,所述組中的至少10種所述大豆基因組DNA多態(tài)性定位于每條染色體上。78.如權(quán)利要求76所述的方法,其中,所述組中的至少20種所述大豆基因組DNA多態(tài)性定位于每條染色體上。79.如權(quán)利要求76所述的方法,其中,至少50種所述大豆基因組DNA多態(tài)性定位于每條染色體上。80.如權(quán)利要求75所述的方法,其中,定位于染色體1上的至少一種多態(tài)性選自SEQIDNO:4093、3168、1993、4808、5176、3705、2968、6401、7154、7741、177、4251、584、4672、4078、3248、2471、1728、4140、4169、4258、1466、5899、4203、3624、6068、6303、6309、3363、6057、2579、6431、2744、3018、6670、3133、4591、4656、3127、4306、2161、6021、3623、6504、1612、516、4296、2702、4124、1076、967、3885、800、2153、5915、7766、6672、5391、2645、382、1550、5564、1763、7566、1722、3327、3724、6359、1499、6680、1147、345、1832、608、7548、4553、5482、7055、2157、3270、6896、7347、1502、1765、4173、6150、5085、2607、6686、448、2355、2639,4850和1897。81.如權(quán)利要求75所述的方法,其中,定位于染色體2上的至少一種多態(tài)性選自SEQIDNO:2484、3849、6346、6230、336、2253、4062、5763、6118、1450、4299、4268、7480、7774、3664、261、4018、2265、5833、933、7547、1519、3271、4754、7691、1349、5587、6852、6500、7429、4261、3359、6845、1560、4977、1626、4440、2019、2164、690、2491、3242、5314、7053、3747、6728、389、3986、1485、1988、5472、6494、4023、221、5566、4602、6519、2042、1181、2514、3199、1462、904、7515、329、1377、6130和2194。82.如權(quán)利要求75所述的方法,其中,定位于染色體3上的至少一種多態(tài)性選自SEQIDNO:2222、1105、4825、1773、5419、3275、3562、4148、6154、3488、3349、7710、3721、4423、1313、3801、3103、4222、2910、2504、3730、3834、6625、355、5025、4164、2260、6368、2022、3567、2957、3362、359、6180、2070、5380、917、6320、5213、1186、1616、6539、7191、5055、7378、1269、7380、1986、2274、5838、6098、3758、1280、6022、6977、6783、3060、6560、5330、1630、2966、2166、5858、7297、2650、6467、1075和6910。83.如權(quán)利要求75所述的方法,其中,定位于染色體4上的至少一種多態(tài)性選自SEQIDNO:5919、631、6047、6592、283、6474、4015、1740、3995、3756、5255、2341、2933、292、3984、5538、3157、6439、368、1082、7360、2108、2629、362、4489、4980、5522、463、163、5923、6020、1995、6388、1151、3463、5658、443、5236、2637、3238、1950、2824、3674、5762、3210、7512842、2319、4531、2883、2225、4816、892、7386、4509、5846、823、3797、3024、3746、7637、4171、4257、2622、6249、950、4153339、3717、976、1161、5885、1099、1533、1827、4787、360和4221。84.如權(quán)利要求75所述的方法,其中,定位于染色體5上的至少一種多態(tài)性選自SEQIDNO:5225、5448、6261、1464、753、5766、6067、4519、4809、6745、6451、3594、7734、2884、4032、88、5977、1880、4394、517、1611、2963、1582、7292、7181、4255、2659、3217、2736、2638、2437、2912、1197、6684、2810、5175、7009、1623、6510、4346、6239、2320、3905、5458、4072、4318、6367、4001、2079、1319、3691、6632、3315、3391、4117、6191、5002、1223、1261、4146、2417、3963、1090、6295、6793、2878、5198、3512、2407、3533、1448、7152、69、3539、5172、5468、5602、3273、3692、6691、6121、2743、4289、4044、1837、486、1465、2050、4125、5105、3481、4281、1257、2307、739、5372、1513、4652、7200、1589、2188、1951、2292、6241、6516、4185、202、1748、4580、1183、5642、6955、4986、6848、98、2099、7112、3402、3530、5384、3827、1420、311,817和5169。85.如權(quán)利要求75所述的方法,其中,定位于染色體6上的至少一種多態(tài)性選自SEQIDNO1920、2270、2334、811、3328、5137、1590、1286、1918、5009、5108、4798、2032、2186、2803、5141、2954、805、750、1037、7529、1310、5854、771、244、2733、5634、6488、4812、5101、7767、7206、7539、6432、4861、3470、3454、3653、6314、1427、4232、4100、4757、278、1969、4604、1813、4436、5239、7454、4998、2325、6203、4077、1829、4069、6655、2657、3593、7455、6、10、199、6264、4050、6189、7383、2123、5288、5305、89、149、6194、4849、1963、3839、5573、1493、824、3645、704、1404、980、7371、3709、5459、6413、3784、1309、5882、1379、3547、3903、1646、973、2176、2515、2762、900、1027、3872、5916、6311、3180、7535、4696、7492、514、4360、860、1917,3392和3433。86.如權(quán)利要求75所述的方法,其中,定位于染色體7上的至少一種多態(tài)性選自SEQIDNO:7333、7600、481、4994、2982、1106、7136、4949、1998、5755、2429、3471、2155、4852、5661、7516、5406、5539、5266、5320、4418、3619、172、4614、780、5951、1410、4348、5572、5708、6304、4215、912、6548、1883、469、4202、1996、602、5656、144、2221、79、7271、6351、3879、504、2731、1191、2377、2333、3040、3023、255、1258、2858、5021、4500、2761、5737、7012、2445、873、6300、332、2241、1509、592、1571、4076、6360、6398、2569、154、5723、3389、161、153、398、1558、3056、3714、3775、6023、1542、2741、6746、7785、5509、1312、3941、7247、6148、1625、4210、7192、3929、2886和4944。87.如權(quán)利要求75所述的方法,其中,定位于染色體8上的至少一種多態(tài)性選自SEQIDNO:3125、4896、5102、2536、1028、1642、5457、2386、5357、4147、6035、2644、3013、6491、4142、5787、1819、7259、4128、612、215、6681、2786、6766、6483、5795、2734、4727、115、654、1551、1038、1414、2353、2330、47、1816、1231、2915、2143、972、2698、4029、4597、1575、5161、2466、3358、2173、5192、832、2354、2008、6639、6110、3410、5729、6995、2214、585、7509、1878、4822、1237、3813、3829、5555、3962、840、6215、4705、1884、218、809、7033、2282、5929、168、6006、429、2509、424、7408、3817、3002、3259、7134、1069、6428、2990、7180、3497、5792、1706、6032、3432、3431和4823。88.如權(quán)利要求75所述的方法,其中,定位于染色體9上的至少一種多態(tài)性選自SEQIDNO:6190、174、2779、5185、5698、6454、2531、50、5080、4964、2739、4668、2588、849、7087、3975、3977、6717、7375、2804、4448、2525、1546、1834、6863、4971、1129、6095、6287、5961、6931、6935、3461、2424、2409、1972、2974、1906、553、661、792、4842、5817、150、4492、2231、2956、4231、2851、4160、1598、3767、6721、6370、7316、3787、3156、1033、2821、6980、3656、3269、4797、6269、4275、7185、6034、4538、7096、3377、3409、1620、487、6615、4941、7419、6685、7504、6281、6734、4847、7127、4663、1520、1905、3129、1296、4014、2312、4935、1239、3151、5149、6908、5431、3161和6589。89.如權(quán)利要求75所述的方法,其中,定位于染色體IO上的至少一種多態(tài)性選自SEQIDNO:2434、2678、920、6861、6464、6950、1786、1567、2899、5920、3251、3049、1112、6008、7346、611、3203、1992、6335、587、3093、459、909、4437、2506、4920、4786、6518、6927、4751、1138、3263、3311、4226、3719、3865、4948、2894、6174、6659、3371、3089、5513、4646、4381、2055、2217、2939、2717、5744、3262、7681、7411、5215、7761、2713、2061、4298、6244、1149、4046、4701、5243、4784、3140、7173、407、4081、6478、509、1389、3590、2508、835、7224、1785、1757、3464、6202、6700、4857、3167、5146、7615、7790和5439。90.如權(quán)利要求75所述的方法,其中,定位于染色體11上的至少一種多態(tài)性選自SEQIDNO:1531、4150、4186、5997、6107、5692、1032、6449、1432、12、600、1067、353、5549、3757、2136、7341、5727、3491、55、449、6936、5191、538、3372、3694、5665、5754、3755、7295、3572、2237、7794、1624、2800、3876、337、7203、4953、300、1326、5480、4024、3898、507、3939、6045、5364、4039、3820、53、7315、7340、1172、2530、6395、4821、6009、2843、3037、5297、4562、4096、3828、2533、6658和7084。91.如權(quán)利要求75所述的方法,其中,定位于染色體12上的至少一種多態(tài)性選自SEQIDNO:4218、4178、4434、5076、1436、216、7176、4295、7085、5299、3663、2121、1329、5659、3420、2057、4011、1085、3255、3062、6668、2559、852、3809、135、5694、182、4127、2944、6902、206、4287、4569、2610、2699、2685、3738、7293、5709、2697、7155、1351、5531、3733、5663、6001、7470、7486、1196、4405、755、5608、7092、2281、2608、6358、6787、6005、70、2680、14、5154、5639、4600、7195、6688、3780、3892、4428、6120、5415、322、1820和326。92.如權(quán)利要求75所述的方法,其中,定位于染色體13上的至少一種多態(tài)性選自SEQIDNO:2647、7207、1605、2888、6147、1956、3979、4715、7262、5461、3524、948、6557、5346、6342、5847、73、1268、4278、4385、4259、4968、1898、7731、3710、5434、5508、1944、7448、5031、7614、6568、583、7246、762、3390、6069、5142、269、1203、1591、1946、1442、126、1925、3696、4198、370、1169、1780、5336、1142、2489、5443、5626、7153、1363、1476、3183、893、7526、5826、3920、3114、7321、7339、493、1059、4745、5515、6339、3011、4796、6622、4175、4240、2801、267、2565、3522、6169、1079、4802、885、910、2970、5745、2980、7472、5491、598、2494、5561、6750、6198、7184、86、2695、721、773、508、7487、879、3030、3408、348、7559、1463、991、7253、184、2877、72、4315、5033、2327、7304、107、3659、2413、6073、3110、7072、4552、5976、4441、6475、2519、3174、4576、6716、3333、5619、6458、123、1396和4130。93.如權(quán)利要求75所述的方法,其中,定位于染色體14上的至少一種多態(tài)性選自SEQIDNO:2240、2749、1847、2950、5924、6509、1246、4790、5893、5855、4608、2485、5127、1599、4990、2790、4615、6767、7714、7659、543、1267、2560、6858、350、3187、3330、6588、1684、395、·6081、6809、726、297、1071、1749、6730、1811、2724、3435、4993、5074、3436、6792、2297、489、4535、3897、3608、908、1835、4249、4685、5895、1855、4、8、5059、7105、·4269、7556、3101、1525、3367、6143、6084和5147。94.如權(quán)利要求75所述的方法,其中,定位于染色體15上的至少一種多態(tài)性選自SEQIDNO:868、7416、3126、3298、5695、3227、1182、4568、1697、2703、6786、80、7387、4742、·3597、6593、6197、6666、1093、2708、3844、7066、3574、944、4560、1730、5743、2020、601、3646、5610、795、1566、3919、5666、7049、7690、6421、7349、3355、1431、51、·2021、3303、3144、1094、5277、3800、120、139、2864、6899、4659、6983、7056、2920、201、1087、5056、446、6077、4507、4276、712、441、2718、4153、2385、3117、7723、·5908、3123、3016、4262、1999、2601、2555、1324、5257、6830、3459、4293、4458、6673、4277和3184。95.如權(quán)利要求75所述的方法,其中,定位于染色體16上的至少一種多態(tài)性選自SEQIDNO:6550、826、1298、2636、7555、7284、7278、2051、2860、723、7324、1205、3200、1581、·2403、5094、3039、5261、4426、4703、3906、25、4598、1282、5802、6687、1885、4570、3917、3185、4115、5957、6268、250、1225、3393、1644、3846、4380、1708、650、1260、·3348、3606、5011、7641、5436、4392、5836、7661、452、7015、4522、1498、1473、929、4040、6294、2777、2387、1675、1361、3034、1482、3193、7330、3283、7450、1515、·5254、4074、3218、622、6055、808、916、2367、6489、6591、4245、253、7572、2029、5462和5421。96.如權(quán)利要求75所述的方法,其中,定位于染色體17上的至少一種多態(tài)性選自SEQIDNO:1394、2246、2662、3716、2458、4814、1863、2289、5952、2905、4952、396、7078、4188、·5442、4163、4871、317、5321、6094、7656、4831、3、5985、3261、273、4005、1511、6172、7394、4463、1158、1354、1769、2118、2191、3076、4880、5015、5881、6391、7400、·720、1100、915、7051、118、4135、7109、2914、2975、3249、3352、1288、1405、5637、7290、5914、7631、3669、2001、3899、1761、5677、5680、992、3806、4158、3540、2675、·3122、7301、7303、7797、6959、7343、1359、6165、1018、6562、2881、4303、6537、416、5424、249、3864、955、2859、1900、6653、841、7129、542、2400、5664、4965、638、·7327和3368。97.如權(quán)利要求75所述的方法,其中,定位于染色體18上的至少一種多態(tài)性選自SEQIDNO:2595、2802、3882、1872、7029、1141、7208、6619、6803、7175、7183、3928、5774、5890、·7228、6046、2523、3350、2535、7244、3519、7099、259、6981、1561、2052、3163、1226、3228、6541、4667、425、6052、5742、2623、7167、1425、3059、888、6301、365、502、·4355、3991、2958、5167、2299、7131、7613、7257、6748、2856、4384、550、1658、4216、7665、3356、6389、4386、414、3149、1572、7361、7279、7296、205、3947、162、3508和734。98.如權(quán)利要求75所述的方法,其中,定位于染色體19上的至少一種多態(tài)性選自SEQIDNO:3545、1664、6958、3499、7622、2562、3361、191、2084、1472、1140、5208、3690、7735、·6455、3830、7323、848、2890、5913、1413、2953、2017、1335、7226、3722、1887、3398、313、1136、7064、7490、4182、4133、1933、3788、1340、2025、4378、3625、2456、·3650、1484、7232、4179、4236、5401、7094、7635、6850、7471、6507、6514、4710、4497、1369、4327、2846、5685、197、1146、2189、7017、1378、4792、1047、1397、5939、·2291、4151、613、488、7080、5481、1017、1529、2012、5832、2132、2976、3910、2538、5416、2380、6138、4872、2065、1628、7157、6481、3299,6242和4960。99.如權(quán)利要求75所述的方法,其中,定位于染色體20上的至少一種多態(tài)性選自SEQIDNO:3967、845、3229、5398、2348、3671、3592、5747、5987、3742、1164、6754、1364、6380、3785、6667、4242、175、1979、116、3950、166、3026、3859、3682、1784、3869、1062、3837、499、7023、539、6232、192、4057、1922、2371、5361、1219、5786、7190、3208、1544、3321、3306、2104、4490、6026、2149、4730、4746、4105、1991、3058、2895、5331、6581、2651、4954、4273、4045、1297、231、1044、1249、1908、1128、2516、6135、3414、6709、6708、1725、7196、3266、1202、1576、6290、7201和3665。100.一種組合物,其包含用于檢測(cè)代表大豆DNA中的多態(tài)性的分子標(biāo)記的至少兩種分離的核酸分子,其中,所述組合物的第一核酸分子包括包含多態(tài)性核苷酸殘基和至少8個(gè)直接鄰近所述多態(tài)性核苷酸殘基3'端的核苷酸的寡核苷酸,其中,所述組合物的第二核酸分子包括包含多態(tài)性核苷酸殘基和至少8個(gè)直接鄰近所述多態(tài)性核苷酸殘基5'端的核苷酸的寡核苷酸,并且其中所述多態(tài)性是在表1或表3中所確定的。全文摘要本發(fā)明提供用于至少兩個(gè)大豆品種之間基因分型的多態(tài)性大豆DNA基因座。該基因座的序列可用于為設(shè)計(jì)用于檢測(cè)大豆DNA多態(tài)性的引物和探針寡核苷酸提供基礎(chǔ)。多態(tài)性可用于大豆中的基因分型應(yīng)用。多態(tài)性標(biāo)記可用于建立標(biāo)記/性狀關(guān)聯(lián),例如,在連鎖不平衡作圖和關(guān)聯(lián)研究、定位克隆和轉(zhuǎn)基因應(yīng)用、標(biāo)記輔助的育種和標(biāo)記輔助的選擇、雜種預(yù)測(cè)和血源一致性研究中。多態(tài)性標(biāo)記也可用于DNA克隆文庫(kù)的作圖,例如,用于與多態(tài)性連鎖的大豆QTLs和基因。文檔編號(hào)C07H21/04GK101801992SQ200880022605公開(kāi)日2010年8月11日申請(qǐng)日期2008年5月29日優(yōu)先權(quán)日2007年5月31日發(fā)明者A·格普塔,D·巴特魯伊爾,J·布爾,J·萊德奧克斯,M·愛(ài)德華茲,P·麥克萊爾德,R·約翰森,S·伊汀頓,吳坤生申請(qǐng)人:孟山都技術(shù)公司