用于篩選基因特異雜交多態(tài)性(gshp)的方法及其在遺傳作圖和標記開發(fā)中的用途的制作方法

文檔序號：432230閱讀：935來源：國知局

專利名稱：用于篩選基因特異雜交多態(tài)性(gshp)的方法及其在遺傳作圖和標記開發(fā)中的用途的制作方法
技術領域：
本發(fā)明涉及生物技術領域。更具體地，本發(fā)明涉及用于篩選基因特異雜交多態(tài)性的方法，以用于發(fā)現(xiàn)各種類型的這類多態(tài)性，并且涉及所發(fā)現(xiàn)的多態(tài)性及其在標記開發(fā)中的用途，以用于遺傳作圖和標記輔助選擇/育種和遺傳鑒別。
背景技術：
分子遺傳標記的開發(fā)有利于作物植物的重要農(nóng)藝性狀的基因定位和篩選，并且有利于與疾病狀態(tài)相關的基因的鑒定或人類的個人識別。與基因密切相關的標記在基于基因型的植物系或人類個體的快速鑒定方面以及在利用標記輔助選擇(MAS)的植物育種方面是有用的。也可以通過使用合適的DNA標記來促進將特定基因滲入目標作物系或栽培種中。#子#"記和標記裙磁逸舉遺傳圖譜是基因組(或者部分基因組，例如單個染色體)的圖示，其中染色體上界標之間的距離是通過界標間的重組頻率測量。遺傳界標可以是許多已知多態(tài)標記的任一個，例如但不限于如SSR標記、RFLP 標記或SNP標記等的分子標記。而且，SSR標記可以從基因組或表達的核酸(如EST)中獲得。雖然這些物理界標的本質(zhì)以及檢測它們的方法是可變的，但是基于多核苷酸的長度和/或序列，所有這些標記彼此之間(以及與任何一個特定標記的多個等位基因間)本身是可區(qū)分的。雖然在一個物種中編碼蛋白的特定的DNA序列通常十分保守，但是DNA的其他區(qū)域(通常如非編碼區(qū)域)傾向于積累多態(tài)性，并且因此在同一個物種的不同個體間可以變化。這樣的區(qū)域提供了大量的分子遺傳標記的基礎。通常，在子代中分離的任何差異遺傳的多態(tài)性性狀(包括核酸多態(tài)性)都是潛在標記。基因組變異性可以有任何來源，例如插入、缺失、重復、重復單元、點突變、重組事件或轉座因子的存在和序列。許多物種中與大量基因相關的分子標記，是本領域中已知的，并且這些標記是公開的或者可以通過各種來源(例如大豆標記S0YBASE網(wǎng)絡資源)獲得。類似地，已經(jīng)確立了大量的檢測分子標記的方法。根據(jù)植物育種人員的觀點，開發(fā)分子標記技術的最初動機是通過標記輔助選擇(MAS)可能提高育種的效率。用一種期望表型性狀(例如一個數(shù)量性狀座位或QTL，例如對特定疾病的抗性)來證明連鎖不平衡的分子標記等位基因可以提供一種用于選擇植物種群中的期望性狀的有用的工具。應用這種方法的關鍵部分是(i)建立分子標記的高密度遺傳圖譜，(H)基于標記和表型變異之間的統(tǒng)計關聯(lián)來檢測 QTL, ( iii )基于QTL分析的結果來定義一組期望的標記等位基因，和 (iv)將這些信息應用和/或外推至現(xiàn)在的育種種質(zhì)上以能夠作出基于標記選擇的決定。有兩種類型的標記經(jīng)常被應用于標記輔助選擇方案中，它們即為簡單序列重復(SSR，也稱作微衛(wèi)星)標記和單核苷酸多態(tài)性(SNP) 標記。依賴于單核苷酸多態(tài)性(SNP)的分子標記是本領域熟知的。已經(jīng) 開發(fā)了多種檢測SNP的技術，包括等位基因特異性的雜交(ASH;參見例如Coryell et al. ， (1999) "Allele specific hybridization markers for soybean," Theor， Appl. Genet. ， 98:690-696 )。其他類型的分子標記也被廣泛地應用，包括但不限于表達序列標簽(EST ) 和SSR標記、限制性片段長度多態(tài)性(RFLP)、擴增片段長度多態(tài)性 (AFLP)、隨才幾擴增多態(tài)性DNA (RAPD)和同工酶標記。本領域4支術人員已知許多方案可以用于檢測此變異性，并且這些方案常常對它們所要檢測的多態(tài)性類型是特異的。例如，PCR擴增、單鏈構象多態(tài)性(SSCP ) 和自主序列復制(3SR;參見Chan and Fox, "NASBA and other transcription-based amplification methods for research and diagnostic microbiology, " Reviews in Medical Microbiology 10: 185—196 [1999])。
測定一個分子標記與另一個分子標記的連鎖以作為重組頻率。通常，兩個座位(例如兩個SSR標記)在遺傳圖鐠上越近，它們在物理圖譜上也越近。相對遺傳距離(通過交換頻率確定，計為厘摩；cM)通常與兩個連鎖座位在染色體上相互分開的物理距離(計為堿基對，例如千堿基對[kb]或兆堿基對[Mbp])成比例。在cM和物理距離之間缺乏精確的比例是不同染色體區(qū)域的重組頻率變化的結果，例如一些染色體區(qū)域是重組的"熱點"，而其他區(qū)域沒有表現(xiàn)出任何的重組或僅顯示很少的重組事件。通常，不論是按照重組還是按照物理距離衡量，一個標記與另一個標記越近它們的連鎖越強。在某些方面，不論是按照重組還是按照物理距離衡量，一個分子標記與編碼傳遞一種特定表型(例如耐旱性)的多肽的基因越近，這個標記可以越好地標記該期望表型性狀。在同種類作物的不同種群間也可以觀察到遺傳作圖的差異。雖然在遺傳圖譜中的該差異可能在各種群中出現(xiàn)，但是來自一個種群的遺傳圖譜和標記信息通常仍然可以用于多個種群的具有期望性狀植物的鑒定、具有非期望性狀植物的反選和MAS指導中。,糊植物育種者的目標是篩選和富集具有期望的性狀(如熱應激耐受性)的植物種群個體，最終導致農(nóng)業(yè)生產(chǎn)力的提高。很久以前就認識到特定的基因組座位(或間隔)可以在一個與特定量化表型相關的生物基因組上進行定位。這類座位被稱為數(shù)量性狀座位，或QTL。植物育種者可以方便地利用分子標記通過鑒定標記等位基因來鑒定期望的個體，所述標記等位基因顯示出與期望表型(如致病感染抗性)的共分離具有統(tǒng)計學上的顯著概率，被證明為連鎖不平衡。通過鑒定與一種數(shù)量性狀共分離的分子標記或分子標記簇，因此育種者可以鑒定一個 QTL。通過鑒定并選擇與期望表型相關的標記等位基因(或者多個標記的期望等位基因)，植物育種者可以通過選擇合適的分子標記等位基因(這個過程稱作標記輔助選擇或MAS)快速選擇出所期望的表型。在該遺傳圖譜上存在的分子標記越多，該圖譜對于進行MAS的越可能有用。已經(jīng)開發(fā)了多個實驗范例用于鑒定和分析QTL (參見例如Jansen
(1996) Trends Plant Sci 1:89)。關于作物物種中QTL作圖的大部分公開的報道都是基于應用雙親雜交的(Lynch and Walsh (1997) Genetics and Analysis of Quantitative Traits, Sinauer Associates, Sunderland)。通常，這些范例涉及一個或多個親本對交林或系的多;相關i無關親本,每種所述;同近交林i系都24出與目標的表型性狀相關的不同的特征。通常，這個實驗方案涉及來自兩個有差異的近交系(例如，選擇系之間表型和分子標記差異最大的近交系)單交的100到300個分離的子代。對親代和分離的子代的多標記座位進行基因型分析，并且對一到多個數(shù)量性狀(如抗病能力、耐旱性、果實顏色等等)進行評估。然后，將QTL鑒定為分離子代中的基因型值和表型變異性之間的顯著地統(tǒng)計關聯(lián)。這個實驗方案長處在于近交繁殖的應用，因為產(chǎn)生的F1親代都具有相同的連鎖相。因此，在 Fl植林自交之后，所有分離子代(F2)都是有信息的并且將連鎖不平衡最大化、連鎖相是已知的，只有兩個QTL等位基因，并且除了回交子代之外，每個QTL等位基因的頻率是O. 5。本領域技術人員已經(jīng)知道大量用于確定標記是否與QTL遺傳連鎖的統(tǒng)計方法，包括例如標準線性模型，例如ANOVA或回歸作圖(Haley and Knott (1992) Heredity 69: 315)、最大似然法，例如期望最大化算法(例如Lander and Botstein (1989) "Mapping Mendelian factors underlying quantitative traits using RFLP linkage maps," Genetics 121 : 185-199; Jansen (1992) "A general mixture model for mapping quantitative trait loci by using molecular markers," Theor. Appl. Genet., 85:252-260; Jansen (1993) "Maximum likelihood in a generalized linear finite mixture model by using the EM algorithm, " Biometrics 49: 227-231; Jansen (1994) "Mapping of quantitative trait loci by using genetic markers: an overview of biometrical models, " In J. W. vanOoijen and J. Jansen (eds.)， Biometrics in Plant breeding: applications of molecular markers, pp. 116—124， CPR0-DL0 Netherlands; Jansen (1996) "A general Monte Carlo method for mapping multiple quantitative trait loci," Genetics142:305-311;和Ja謹n and Stam (1994) "High Resolution of quantitative trait into multiple loci via interval mapping," Genetics 136:1447-1455 )。示例性的統(tǒng)計方法包括單點標記分析、區(qū)間作圖(Lander and Botstein (1989) Genetics 121: 185 )、復合區(qū)間作圖、罰分回歸分析、復雜系譜分析、MCMC分析、MQM分析(J a n s en(1994) Genetics 138:871 ) 、 HAPL0-IM+分析、HAPLO-MQM分析和 HAPL0-MQM+分析、Bayesian MCMC、呤回歸、后裔同一性(identity-by-descent )分析、Haseman-Elston回歸，其中的任何方法均適合于本發(fā)明的內(nèi)容。另外，Beavis et al. ， U.S. Ser. No. 09/216,089 ，"QTL MAPPING IN PLANT BREEDING POPULATIONS"和 Jansen et al.， PCT/US00/34971, "MQM MAPPING USING HAPL0TYPED PUTATIVE QTLS ALLELES: A SIMPLE APPROACH FOR MAPPING QTLS IN PLANT BREEDING POPULATIONS "記載了關于適合復雜育種群(可以被應用于鑒定和定位QTL )使用的替代的統(tǒng)計方法的其他具體內(nèi)容。所有這些方法都是計算密集型的，并且通常由基于計算機的系統(tǒng)和專門軟件來協(xié)助完成。合適的統(tǒng)計軟件包可以通過各種公共途徑和商業(yè)途徑獲得，并且是本領域技術人員已知的。發(fā)明內(nèi)容已經(jīng)開發(fā)了用于在任何基因組中(包括并且特別是在復雜的基因組中)篩選基因特異雜交多態(tài)性的高通量的方法?；蛱禺愲s交多態(tài) 性是在目標基因的編碼區(qū)域中發(fā)現(xiàn)的不明多態(tài)性。本發(fā)明方法可以檢測單核苦酸多態(tài)性(SNP)，并且同時可檢測相關的限制性片段長度多態(tài)性(RFLP )、擴增片段長度多態(tài)性(AFLP )和二級結構多態(tài)性(圖1 )。檢測到的多態(tài)性可以被直接用作高通量篩選中的雜交標記或被轉換成 SNP，并開發(fā)成功能性多態(tài)性標記或用作使用基于非雜交的讀數(shù)技術的標記。這些標記可以在植物育種中用于標記輔助選擇/育種，或者在植物或動物/人中用于基因型鑒定、數(shù)量性狀座位鑒定和/或用于基因作圖應用。本方法包括總的以下部分1)用微陣列通過比較基因組雜交進行雜交多態(tài)性的全基因組篩選；2)酶介導的基因組復雜性的降低；3) 酶介導的差異信號放大和噪聲降低；4)數(shù)據(jù)提取和GSHP鑒定；和5)
在高通量篩選中應用GSHP。在這些部分中，酶介導的基因組復雜性的降低和酶介導的差異信號放大和噪聲降低對復雜基因組物種的基因組篩選特別有用。對于具有簡單基因組的物種，這些部分可以是任選的，并且可以被使用如隨機六聚物標記等方法的熒光標記的直接摻入所取代。本發(fā)明提供一種用于檢測基因組DNA的多核苷酸序列中的基因特異雜交多態(tài)性的方法，所述方法包括a. 選擇與基因組多核苷酸序利互補的短寡核苷酸序列，所述短寡核香酸序列被直接合成到微陣列表面上或者合成之后被置于微陣列表面上；b. 從兩個遺傳來源制備基因組DNA并且用使用一種或多種限制酶對所述基因組DNA進行位點特異性限制性酶切，從而產(chǎn)生限制性片段長度多態(tài)性(RFLP);c. 選擇性地擴增選定長度范圍的RFLP，建立擴增的多態(tài)性靶標；d. 將擴增的靶標隨機斷裂成從大約50到大約200個堿基的片段并且無選擇性地對所述片段進行末端標記；e. 將末端標記的片段雜交到微陣列表面的短寡核苷酸序列上；并f. 量化雜交信號并且檢測多態(tài)性。本發(fā)明的方法可以被進一步用于檢測系統(tǒng)發(fā)生學上密切相關的物種A和B中的GSHP，其中用到使用了來自模型物種B的探針的微陣列。為了實現(xiàn)這個目的，物種A和B之間的序列相似性應該通過計算和/ 或實驗進行評估。如果使用的是計算的方法，則應該對A和B的代表性序列進行BLAST比對。如果使用的是實驗的方法，則應該提取物種 A的基因組DNA、對其標記并且與具有根據(jù)物種B設計的探針的微陣列進行相互雜交。如果相似序列的數(shù)量高于可接受的閾值，則將物種A 的基因組DNA可以以與天然基因組DNA B類似的方式用于在同源序列中進行GSHP檢測。本發(fā)明提供一種具有成本效益的、用于在全基因組水平進行基因多態(tài)性掃描的檢測法，并且具有許多優(yōu)勢，概括如下。和常規(guī)作圖方法相比，本發(fā)明提供*覆蓋全基因組一雖然它們僅代表基因組序列的0.7-1%,但是探針序列通常包含基因組中基因的60-80%。
，產(chǎn)生大量用于超高密度基因組作圖的標記的能力。據(jù)估計，玉米的編碼序列中的平均多態(tài)性率是124個堿基中有1個。一次實驗可以篩選最多3. 25xl()5個多態(tài)性。即使探針的25個堿基中僅有一個堿基被認為對檢測敏感，它也至少可以鑒定1. 3x 104個多態(tài)性。這些潛在的標記可以被應用于標記輔助選擇，并且可用于產(chǎn)生超高密度遺傳圖譜。*所有標記都是基因標記一基因標記可影響或造成復雜的性狀。基于基因或EST序列設計GeneChip微陣列。因此，鑒定的多態(tài)性將會與基因相關聯(lián)。與作圖中使用的隨機標記相比，基因標記可以有生物學功能，并因此可以有助于對性狀分離的功能分析。可轉換成高通量兼容形式一包含多態(tài)性標記的寡核苷酸探針可以通過測序轉換成SNP標記，因為80-90%的SFP (單特征多態(tài)性)是 SNP。也可以直接利用SFP標記，因為可以容易地將它們從常規(guī)的 GeneChip遷移到低成本的小標記GeneChip上。這使得可以使用這些標記進行低花費、高產(chǎn)出的篩選。*快速——次GeneChip實驗可以檢查玉米的堿基最多達3. 25 x 107個和西紅柿的堿基最多達5. 75 x 106個，并且它僅需要兩天的時間。一個完整的作圖項目可以在4-6個月內(nèi)完成。*成本效益一它具有成本效益?；?500的芯片和試劑成本，據(jù) 估計在玉米中每個標記的發(fā)現(xiàn)成本是0. 25美分。與其他基于微陣列的作圖方法比較標記發(fā)現(xiàn)的成本低一其他基于微陣列的方法，例如嵌合 (tilling) GeneChip陣列花費很高*適用于具有高復雜度基因組的物種，包括大部分的高等生物，例如作物物種、動物和生態(tài)模型系統(tǒng)像精確和精密一它使非特異性結合的干擾減到最小*聚焦于基因標記一曱基化過濾可富集被標記的靶標中的基因片段*它通過降低靶標庫的復雜度來增加標記的效率 *它通過優(yōu)先擴增靶標來增加信號強度和差異信號 *它僅僅檢測遺傳變異，而不檢測轉錄變異，環(huán)境和實驗條件對轉錄變異的影響很大。本發(fā)明的方法可用于如下的非限制性應用中，這些應用已經(jīng);陂廣泛地應用于農(nóng)業(yè)和醫(yī)學科學和實踐中l(wèi))構建超高密度基因圖譜；2) 通過混合分組分析(bulk segregant analysis, BSA)和類似方法鑒定用于單基因性狀或QTL的標記；3 )通過全基因組連鎖分析或相關研究將QTL和候選基因關聯(lián)；和4)用診斷標記進行高通量篩選。

圖1.用靶探針雜交檢測序列多態(tài)性。暗線和明線代表來自不同遺傳種類(variety)的與檢測探針同源的靶序列。圓圏表示不同種類間的序列多態(tài)性。圖2.減少基因組復雜性的實驗步驟圖3.用大豆的GeneChip陣列比較大豆(自身檢測)和菜豆(異源檢測)的不同信號強度的探針的頻率。很明顯，大量的大豆探針可以與菜豆靶標雜交。
具體實施方式
定義在對本發(fā)明進行詳細的描述之前，應當理解的是本發(fā)明并不局限于具體的實施方案，它也可以有所變化。還應理解的是，本文所用術語只是出于描述具體實施方案的目的，而非意在限制。除非上下文中另外明確指出，在本說明書和所附權利要求書中使用的單數(shù)形式的"一"、 "一種，，和"該"包括復數(shù)指代對象。因此，例如提及"植物"、"該植物"或"一種植物"也包括多種植物；而且，根據(jù)上下文，使用術語 "植物"也可以包括該植物的遺傳上相似的或相同的子代；使用術語 "一種核酸"，事實上，任選地包括該核酸分子的許多拷貝；類似地，術語"探針"任選地(并且通常)包括許多相似或相同的探針分子。除非另外指明，核酸是按從5，到3，的方向從左到右書寫的。在本說明書中使用的數(shù)值范圍包括定義該范圍的數(shù)值并包括所定義的范圍內(nèi)的每個整數(shù)或任何非整數(shù)部分。除非另有定義，否則本文中使用的技術術語和科學術語的含義都與本發(fā)明所屬技術領域的技術人員通常理解的含義相同。雖然在實施檢測本發(fā)明時可以使用與本文所述相似或等同的任何方法和材料，，但是本文描述的是優(yōu)選的材料和方法。
在描述本發(fā)明和主張本發(fā)明的權利時，下文中的術語是根據(jù)下列的定義來使用的。"植物"可以是整個植林、植林任何部分或來自植物的一個細胞或組織培養(yǎng)物。因此，術語"植物，，可以指任何的整個植林、植物的部分或器官(例如葉、莖、根等等)、植物組織、種子、植物細胞和 /或其子代。植物細胞是從植物取得的植物的細胞，或者是取自植物細胞的培養(yǎng)物。因此，術語"谷物植物"包括整個谷物植林、谷物植物細胞、谷物植物原生質(zhì)體、谷物植物細胞或谷物組織培養(yǎng)物(谷物植林可以從中再生)、谷物植物愈傷組織、谷物植物塊(corn plant clump ) 或谷物植林或部分谷物植株中完整的細胞(如谷物種子、谷物莢、谷物花、谷物子葉、谷物葉、谷物莖、谷物芽、谷物根、谷物根尖等等)。 "種質(zhì)"指個體(如一個植林)、個體組(如一個植物系、品種或科)或者源自一個系、品種、物種或培養(yǎng)物的克隆的遺傳物質(zhì)或源自它們的遺傳物質(zhì)。種質(zhì)可以是生物體或細胞的一部分，或者可以分離自生物體或細胞中。通常，種質(zhì)提供具有特異分子組成的遺傳物質(zhì)，該特異分子組成為生物體或細胞培養(yǎng)物的部分或全部的遺傳特性提供物質(zhì)基礎。本文所用的種質(zhì)包括細胞、種子或組織(可以由它們長出新植林)或可以培養(yǎng)出整個植林的植物的部分，例如葉、莖、花粉或細胞。術語"等位基因"指存在特定座位出現(xiàn)的兩個或多個不同核苷酸序列之一。例如，第一等位基因可以存在于一個染色體上，而第二等位基因存在于第二同源染色體上，例如存在于雜合子個體的不同染色體上或者在種群中的不同的純合子或雜合子個體之間。"有利等位基因"是在特定座位的等位基因，該等位基因賦予或有助于一種農(nóng)業(yè)上的期望表型，如抗蟲或抗旱，或者是能鑒定敏感植物的等位基因，所述敏感植物可以在育種程序或栽培中被去除。一個標記的有利等位基因是與有利表型分離的標記等位基因，或者是與敏感植物表型分離的標記等位基因，因此有助于鑒定喜干旱植物。染色體區(qū)段的有利等位基因形式是包括一段核苷酸序列的染色體區(qū)段，所述核苷酸序列有助于在本身位于該染色體區(qū)段上的一個或多個遺傳座位上的優(yōu)良的農(nóng)業(yè)表現(xiàn)。"等位基因頻率"指等位基因出現(xiàn)在個體、系或系種群中一個座位的頻率(比例或百分比)。例如，對于等位基因"A",基因型"AA"、"Aa"或"aa"的二倍體個體分別具有1. 0、 0. 5或0. 0的等位基因頻率。根據(jù)一個系中個體樣本的平均等位基因頻率，可以估計該系中的等位基因頻率。類似地，根據(jù)組成種群的系的平均等位基因頻率可以計算系種群中的等位基因頻率。對于有確定數(shù)目的個體或系的種群來說，等位基因頻率可以表示為包含該等位基因的個體或系(或任何其他具體分組)的計數(shù)。當一個等位基因與一種性狀連鎖并且當該等位基因的存在是指示該期望性狀或者性狀形式將在包括該等位基因的植物出現(xiàn)的指示物時，該等位基因與該性狀"正"相關。當一個等位基因與一種性狀連鎖并且當該等位基因的存在是指示該期望性狀或者性狀形式不會在包括該等位基因的植物出現(xiàn)的指示物時，該等位基因與該性狀負相關。如果一個個體在給定座位僅具有一種類型的等位基因(如，二倍體個體在兩條同源染色體的對應座位上具有相同等位基因的拷貝)，則該個體是"純合的"。如果在給定座位上存在不止一種等位基因類型 (如，二倍體個體具有兩種不同等位基因的各一個拷貝)，則該個體是"雜合的"。術語"同質(zhì)性"是指組中的成員在一個或多個特定座位具有相同的基因型。相反，術語"異質(zhì)性"用來指該組中的個體在一個或多個特定座位上的基因型不同。"座位"是染色體上多態(tài)性核酸、性狀決定子、基因或標記所處的區(qū)域。因此，例如"基因座位"是一個物種基因組中一個特定基因在染色體上存在的特定位置。術語"數(shù)量性狀座位"或"QTL"指一個具有至少兩種等位基因的多態(tài)性遺傳座位，所述等位基因在至少一種遺傳背景(例如，在至少一個繁殖種群或子代中)中分別影響表型性狀的表達。QTL通常用分子標記鑒定或"標記"。術語"標記"、"分子標記"、"標記核酸"和"標記座位"是指在鑒定連鎖座位時用作參考點的一個核苷酸序列或其編碼產(chǎn)物(如蛋白(如來自于剪接的RNA、 cDNA等)，或者來自于編碼的多肽。該術語也指與該標記序列互補的核酸序列或該標記序列的側翼序列，例如用作探針或引物對的能夠擴增標記序列的核酸。"標記探針"是可以被用來鑒定標記座位的存在的核酸序列或分子，例如與標記座位序列互補的
核酸探針?；蛘?，在某些方面，標記探針是指可以區(qū)分(即基因型) 存在于標記座位處的特定等位基因的任何類型的探針。當核酸在溶液中特異性雜交(如根據(jù)Watson-Crick堿基配對規(guī)則)的時候，它們是 "互補的"。"標記座位"是可以被用于跟蹤第二連鎖座位是否存在的位點，例如編碼或有助于表達一種基因型性狀的連鎖位點。例如，標記座位可以用于監(jiān)測在某個座位(例如QTL)上的等位基因的分離情況，所述座位與該標記座位遺傳上或物理上連鎖。因此，"標記等位基因"或"標記座位的等位基因"是存在于種群中的標記座位上的多個多態(tài)性核苷酸序列的其中一個，該種群在該標記座位上存在多態(tài)性。預計每一個鑒定的標記與遺傳成分(如QTL)在物理上和遺傳上的非常接近(產(chǎn)生物理上和/或遺傳上的連鎖)，所述遺傳成分有助于耐受性。"遺傳標記"是在種群中具有多態(tài)性的核酸，其中該標記的等位基因可以通過一種或多種分析方法(例如RFLP、 AFLP、同工酶、SNP、 SSR等等)檢測和區(qū)分。術語"遺傳標記"和"分子標記，，指在鑒定遺傳連鎖座位(如QTL)時可以被用作參考點的遺傳座位("標記座位")。這種標記也被稱為QTL標記。該術語也指與基因組序列互補的核酸序列，例如用作探針的核酸。與種群的成員之間的遺傳多態(tài)性對應的標記可以用本領域中已經(jīng) 確立的方法檢測。這些方法包括，例如基于PCR的序列特異性擴增方法、檢測限制性片段長度多態(tài)性(RFLP)、檢測同工酶標記、通過等位基因特異性雜交(ASH)檢測多核香酸多態(tài)性、檢測植物基因組的擴增的可變序列、檢測自主序列復制、檢測簡單序列重復(SSR)、檢測單核苷酸多態(tài)性(SNP)或檢測擴增片段長度多態(tài)性(AFLP)。也已知有成熟的方法用于表達序列標簽(EST)和來自于EST序列和隨機擴增多態(tài)性DNA ( RAPD )的SSR標記的檢測。"遺傳圖譜"是對在給定物種中的一個或多個染色體(或連鎖群) 上的座位中的遺傳連鎖關系的描述，通常以圖或表的形式表示。"遺傳作圖"是通過使用遺傳標記、標記分離的種群和標準的重組頻率的原理來定義座位間的連鎖關系的方法。"遺傳圖譜座位"是遺傳圖譜中在上同一連鎖群上相對于周圍遺傳標記的位置，在所述連鎖群中給定的物種中可以存在特定的標記。相反，基因組的物理圖譜指的是絕對距離(例如，用堿基對衡量或者用分離的和重疊的鄰近遺傳片段，如毗連群衡量)?；蚪M的物理圖譜并不考慮該物理圖譜上不同位點間的遺傳行為(如重組頻率)。"遺傳重組頻率"是兩個遺傳座位間交換事件(重組)的頻率。重組頻率可以在減數(shù)分裂后的標記和/或性狀的分離之后觀察到。遺傳重組頻率可以用厘摩(cM)表示，一個cM是具有l(wèi) %重組頻率(即這種兩個標記間的交換時間每100次細胞分裂發(fā)生一次)的兩個遺傳標記見的距離。本文所用的術語"連鎖"被用來描述一個標記座位與另一個標記座位或某個其他座位(例如耐受位點)的"關聯(lián)"的程度。本文所用的連鎖平衡是描述兩個標記獨立地分離的情況，即在子代中隨機分布。顯示連鎖平衡的標記被認為不連鎖(不管它們是否位于相同的染色體上)。況，即具有小于50%的、重組頻率(并且根據(jù)定i，在相同^鎖群上的分離小于50cM)。顯示連鎖不平衡的標記被認為是連鎖的。發(fā)現(xiàn)標記座位和連鎖座位在子代植林中在一起的頻率高于在子代植林中不在一起的頻率時發(fā)生連鎖。本文所用的連鎖可以在兩個標記間或者在標記和表型之間。標記座位可以與性狀相關(連鎖)，例如當一個標記座位與對植物病原體的耐受或耐受的提高連鎖不平衡時，該標記位點可能與該耐受性狀相關?？梢詫⒎肿訕擞浥c表型性狀(如QTL)的連鎖程度例如計量為分子標記與表型共分離的統(tǒng)計概率。本文所用的分子標記與表型之間的連鎖關系以"概率"或"調(diào)整概率"形式給出。該概率值是統(tǒng)計學的可能性，即一個表型與存在或不存在一個特定標記等位基因的具體組合是隨機的。因此，概率分越低，表型和特定標記共分離的可能性越大。在某些方面，概率分可以被認為是"顯著"或"不顯著"的。在一些實施方案中，概率分O. 05 的(p=0. 05或5%概率)的隨機分配被認為是共分離的顯著標識。然而，本發(fā)明并不局限于這個特定的標準，可接受的概率可以是小于50% (p=0. 5 )的任何概率。例如，顯著的概率可以是小于0. 25、小于0. 20、小于0. 15或小于0. 1。術語"連鎖不平衡"是指遺傳座位或性狀(或兩者)的非隨機分
離。在任一情況下，連鎖不平衡都表明相關的位點在沿染色體長度方向上有足夠近的物理距離，以至于他們共同分離的頻率比隨機頻率大 (即不隨機)(在共分離性狀的情況下，決定性狀的座位互相間足夠地鄰近)。連鎖座位共分離的時機多于50%，例如，共分離時機在大約51% 到大約100%之間。術語"物理連鎖"有時被用來表示兩個座位(例如兩個標記座位)在物理上存在于同一染色體上。有利地，兩個連鎖座位的位置非常鄰近，使得在減數(shù)分裂中兩個座位之間，同源染色體對之間的重組不會以高頻率發(fā)生，例如使得連鎖位點共分離的時機至少為大約90%，例如為91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、 99%、 99.5%、 99. 75%或更高的時機。在本申請中詞語"緊密連鎖"表示在兩個連鎖座位間的重組發(fā)生的頻率等于或小于大約10% (即在遺傳圖譜上的分離不超過10 cM)。換句話說，緊密連鎖的座位至少有90%的時機是共分離的。當它們顯示出與一個期望性狀(例如抗致病性)具有顯著的共分離概率(連鎖)時，標記座位在本發(fā)明中特別有用。例如，在某些方面，這些標記可以命名為連鎖QTL標記。在其他方面，特別有用的分子標記是那些與 QTL標記連鎖或緊密連鎖的標記。在某些方面，連鎖可以表示為任何期望的界限或范圍。例如，在某些實施方案中，兩個連鎖座位可以是分離小于50 cM圖譜單位的兩個座位。在其他的實施方案中，連鎖座位可以是分離小于40 cM的兩個座位。在其他的實施方案中，兩個連鎖座位可以是分離小于30 cM 的兩個座位。在其他的實施方案中，兩個連鎖座位可以是分離小于25 cM的兩個座位。在其他的實施方案中，兩個連鎖座位可以是分離小于 20 cM的兩個座位。在其他的實施方案中，兩個連鎖座位可以是分離小于15cM的兩個座位。在某些方面，定義連鎖的區(qū)間范圍是有利的，例如在10和20 cM之間或在10和30 cM之間或在10和40 cM之間。一個標記與第二座位連鎖越緊密，該標記就能越好地作為該第二座位的標識。因此，在一個實施方案中，緊密連鎖座位(例如一個標記座位和第二座位(例如QTL標記))顯示出10%或者更少的座位間重組頻率，優(yōu)選大約9%或更少、再更優(yōu)選大約8%或更少、也更優(yōu)選大約 7%或更少、再更優(yōu)選大約6%或更少、也更優(yōu)選大約5%或更少、再更優(yōu) 選大約4%或更少、也更優(yōu)選大約3%或更少以及再更優(yōu)選大約2%或更
少。在一個高度優(yōu)選的實施方案中，相關的座位(例如一個標記座位和一個QTL標記)顯示出大約1%或更少的重組頻率，例如大約0.75% 或更少，更優(yōu)選大約0. 5 / 或更少或者再更優(yōu)選大約0.25%或更少。位于相同染色體上并且具有使位于兩個座位間發(fā)生重組的頻率小于10% (例如大約9%、 8%、 7%、 6%、 5氛4 / 、 3%、 2%、 1%、 0.75%、 0.5%、 0.25% 或更少)的距離的兩個座位也被稱為互相"鄰近"。在某些情況下，兩個不同的標記可以具有相同的遺傳圖語坐標。在此情況下，兩個標記相互非常鄰近以至它們之間發(fā)生重組的頻率低到無法#皮檢測到。當涉及兩個遺傳成分(如有助于耐受的遺傳成分和鄰近的標記) 之間的關系的時候，"偶聯(lián)"相連鎖表明這樣一種狀態(tài)，在所述狀態(tài)中位于耐受座位的"有利"等位基因與對應的連鎖標記位點的"有利" 等位基因在同一個染色體鏈上物理關聯(lián)。在偶聯(lián)相中，兩個有利等位基因被繼承該染色體鏈的子代同時繼承。在"排斥"相連鎖中，在目標座位(例如耐受的QTL)的"有利"等位基因與在鄰近標記位點的 "非有利"等位基因物理上連鎖，并且這兩個"有利"等位基因并不同時凈皮遺傳(即兩個位點互相之間"異相"(out of phase))。本文所用的術語"染色體間隔(interval )，，或"染色體區(qū)段"表示位于單染色體的底部(planta)中的基因組DNA的連續(xù)線性區(qū)間 (span)。在單個染色體間隔上的遺傳成分或基因是物理上連鎖的。染色體間隔的大小沒有特別的限制。在某些方面，例如在本發(fā)明的上下文中，位于單染色體間隔內(nèi)的遺傳成分通常也是遺傳連鎖的，通常在例如小于或等于20厘摩(cM) 或者小于或等于10 cM的遺傳重組距離內(nèi)。也就是，位于單染色體間隔內(nèi)的兩個遺傳成分的重組頻率小于或等于20%或10%。在一方面，本發(fā)明的任何標記都與任何等于或小于50 cM距離的其他標記連鎖(遺傳上和物理上)。在另一方面，本發(fā)明的任何標記都與任何非常鄰近(例如等于或小于10 cM的距離)的其他標記緊密連鎖(遺傳上和物理上)。在相同染色體上的兩個緊密連鎖的標記相互之間可以3巨離9、 8、 7、 6、 5、 4、 3、 2、 1、 0.75、 0. 5或0. 25 cM或更小。一個植林對生物或非生物應激的"耐受"或"耐受提高"是指與低耐受或更"敏感"植林相比在受到應激時，就產(chǎn)率和/或存活率或其他相關農(nóng)學測量指標方面而言，該植抹受影響更小。耐受是個相對的概念，表示該受影響的植抹產(chǎn)生的產(chǎn)率比另外受相似影響的、更敏感的植林的產(chǎn)率高。也就是，當和敏感植林相比的時候，該應激引起的耐受植林存活和/或產(chǎn)率的下降變小。技術人員知道植物對各種應激的耐受的變化范圍很大，并且耐受也將根據(jù)應激的嚴重程度而變化。然而，通過簡單的觀察，技術人員可以確定不同植物、植物系或植物科對給定程度的應激的相對耐受或敏感性。本發(fā)明的上下文中的術語"雜交的"或"雜交"的意思是通過授粉使配子融合產(chǎn)生子代(例如細胞、種子或植林)。該術語包括有性雜交(一個植林對另一個植林授粉)和自交(自授粉，如花粉和胚珠都來自同一個植林)。術語"基因滲入"是指遺傳座位的期望等位基因從一個遺傳背景轉移至另一個。例如，在一個特定座位的期望等位基因的基因滲入可以通過同一物種的兩個親本間的有性雜交被傳遞到至少一個子代中，其中至少一個親本的基因組上帶有期望等位基因?；蛘?，例如，等位基因的傳遞可以通過兩個供體基因組之間的重組發(fā)生，例如在一個融合的原生質(zhì)體中，此時至少一個原生質(zhì)體的基因組上具有期望等位基因。期望等位基因可以是例如標記的選定等位基因、QTL、轉基因等等。在任何情況下，包含期望等位基因的后代可以重復與具有期望遺傳背景的系回交，并且針對期望等位基因進行篩選，使得該等位基因在選定的遺傳背景中固定下來。"系"或"林"是具有相同謙系的個體的群，所述語系通常是一定程度的近親交配并且通常是純合的并在大部分座位上同質(zhì)(同基因的或近乎同基因的)。"亞系"是指后代的近交亞群，所述后代與其他具有相同祖先的相似近交亞群在遺傳上不同。通常，"亞系，，是通過使從F3到F5代選出的個體大豆植林的種子近交，直到殘留分離座位"固定"或者大部分或所有座位純合。市售的大豆品種(或系)通常通過聚集("集合(bulking )")單個F3到F5的植林的自授粉子代產(chǎn)生的，所述F3到F5植林來自于兩個遺傳上不同的親本的受控雜交。雖然該品種通常似乎是均勾的，但是來自選定植林的自授粉品種最終(如F8 ) 變成純合植林的混合體，所述純合植抹的基因型變化可能出現(xiàn)在最初選定的F3到F5植抹中的任何雜合座位上。在本發(fā)明的上下文中，基
于標記的亞系彼此間基于在一個或多個特異標記座位的DNA水平的數(shù) 量多態(tài)性是不同的，所述基于標記的亞系是通過對選定的F3-F5植林的個體自授粉子代的種子樣本的基因分型獲得的。該種子樣本可以被直接基因分型為種子或者為從該種子樣本長成的植物組織。任選地，在特定座位(或多個座位)具有共同基因型的種子集合起來(bulked) 提供一個亞系，所述亞系在所鑒定的對于目標性狀(產(chǎn)率、耐受性等等)重要的座位上是遺傳同質(zhì)的。"祖系"是用作基因源的親本系，例如用于開發(fā)良種系。"祖種群" 是有助于大量產(chǎn)生用于開發(fā)良種系的遺傳變異的祖先的群。"后代"是祖先的子代，并且可以經(jīng)過多代繁殖從它們的祖先中分離出來。例如，良種系是它們祖先的后代。"系鐠結構"定義為后代和產(chǎn)生該后代的每個祖先之間的關系。系譜結構可以跨越一代或多代，描述后代和其親本、祖親本、祖祖親本(great-grand parent)等之間的關系。"良種系"或"良種林"是農(nóng)藝學上優(yōu)良的系，該系是經(jīng)多輪繁殖并針對優(yōu)良農(nóng)業(yè)表現(xiàn)進行篩選的結果。許多良種系是可以獲得的并且是植物育種領域的技術人員已知的。"良種群"是可用于代表給定作物物種(如谷物、大豆或西紅柿)的農(nóng)藝學優(yōu)良基因型方面的技術領域狀態(tài)的良種個體種類或系種類。類似地，"良種質(zhì)"或種質(zhì)的良種林是農(nóng)藝學上優(yōu)良的種質(zhì)，所述種質(zhì)通常來自于和/或能夠產(chǎn)生具有優(yōu)良農(nóng)藝表現(xiàn)的植物，例如存在或新開發(fā)的谷物、大豆或西紅柿的良種系。相反，"外來林"或"外來種質(zhì)"是來自于不屬于種質(zhì)的可獲得的良種系或良種林的植物的林或種質(zhì)。例如，在大豆種質(zhì)的兩個植林或林之間的雜交的情況下，外來種質(zhì)通過侵入與其雜交的良種種質(zhì)而不被緊密的關聯(lián)。最常見地，外來種質(zhì)并不來自于任何已知的大豆良種系，而是被選來向育種程序中引入新的遺傳成分(通常為新等位基因)。在擴增核酸的情況中，術語"擴增"是任何產(chǎn)生選定的核酸(或它的轉錄形式)的額外拷貝的過程。典型的擴增方法包括各種基于聚合酶的復制方法(包括聚合酶鏈式反應(PCR ))、連接酶介導的方法(如連接酶鏈反應(LCR ))和基于RNA聚合酶的擴增(如通過轉錄)方法。 "擴增子"是擴增的核酸，例如利用任何可獲得的擴增方法(如PCR、 LCR、轉錄等等)通過擴增模板核酸產(chǎn)生的核酸。"基因組核酸"是依次與細胞中可遺傳的核酸對應的核酸。常見
的實例包括核基因組DNA和它的擴增子。在某些情況下基因組核酸與剪接的RNA或相應的cDNA不同，其中所述剪接的RNA或cDNA是經(jīng)處理(如通過剪接機制)后除去了內(nèi)含子的?；蚪M核酸任選地包括非轉錄(如染色體結構序列、啟動子區(qū)域、增強子區(qū)域等)和/或非翻譯序列(如內(nèi)含子)，而剪接的RNA/cDNA通常不具有非轉錄序列或內(nèi)含子。"模板核酸"是在擴增反應(例如，如PCR等的基于聚合酶的擴增反應、如LCR等的連接酶介導的擴增反應或轉錄反應等等)中用作模板的核酸。模板核酸可以是來源于基因組，或者任選地可以來自于表達序列，如cDNA或EST。"外源核酸"是一個特定的系統(tǒng)(如種質(zhì)、植林、品種等)的非天然的核酸，涉及序列、基因組位置或者兩者。本文所用的術語"外源"或"異源"，當用于多核苷酸或多肽時，通常是指人工地提供給生物系統(tǒng)(如植物細胞、植物基因、特定的植物物種或變體或研究中的植物染色體)并且是非天然地存在于該特定生物系統(tǒng)的分子。該術語可以表示來自非天然存在的來源的相關物質(zhì)，或者可以指具有非天然的構型、遺傳座位或各部分的排列的分子。相反，例如"天然"或"內(nèi)源"基因是指不包含由天然含有該基因的染色體或其他遺傳成分之外的來源進行編碼的核酸成分的基因。內(nèi)源基因、轉錄物或多肽由其天然的染色體座位編碼，并且不是人工提供給細胞的。涉及核酸或多肽的術語"重組體"表示已經(jīng)通過人工介入改造過的物質(zhì)(例如重組體核酸、基因、多核苷酸、多肽等等)。通常，重組分子的各部分的排列不是天然的構型，或者重組多核普酸或多肽的一級序列在某個方面已經(jīng)被處理過。產(chǎn)生重組物質(zhì)的改變可以在其天然環(huán)境或狀態(tài)內(nèi)或者離開其天然環(huán)境或狀態(tài)的物質(zhì)上進行。例如，天然起源的細胞內(nèi)進^人為干涉的2徑改變的dm轉錄而來:則該天然4酸可以變成重組核酸。如果一個基因序列開放閱讀框的核苷酸序列被從其天然的環(huán)境中去除并且被克隆到任何類型的人工核酸載體中，則該基因序列開放閱讀框是重組體。產(chǎn)生重組體分子(特別是重組核酸) 的方案和試劑是本領域常見和常規(guī)的。術語重組體也可以指包含重組物質(zhì)的生物，如包含重組核酸的植物被認為是重組植物。在某些實施
方案中，重組生物是轉基因生物。當涉及到將異源的或外源的核酸轉移到細胞時，術語"引入，，是指使用任何方法將核酸引入細胞。該術語包括例如"轉染"、"轉化" 和"轉導，，等的核酸引入方法。本文所用的術語"載體"被用來指將一個或多個核酸片段轉移到細胞中的多核苷酸或其他分子。術語"運載體"有時可與"載體"互換使用。載體任選包括參與載體維持并能夠達到其預期用途的部分(如復制必需序列、傳遞藥物或抗生素抗性的基因、多克隆位點、能夠使克隆的基因表達的可操作連接的啟動子/增強子元件等等)。載體通常來自于質(zhì)粒、噬菌體或者植物或動物病毒。"克隆載體"或"穿梭載體" 或"亞克隆載體"包括促進亞克隆步驟的可操作連接的部分(如包含多限制酶位點的多克隆位點)。本文所用的術語"表達載體"指包括可操作連接的多核苷酸序列的載體，所述多核苷酸序列有助于特定宿主生物中的編碼序列的表達 (例如細菌表達載體或植物表達載體)。有助于原核生物表達的多核苷酸序列通常包括，例如啟動子、操縱基因(任選)和核糖體結合位點，它們常與其他序列在一塊出現(xiàn)。真核細胞可以使用啟動子、增強子、終止和多腺苦酸信號和通常與原核生物使用的序列不同的其他序列。術語"轉基因植物"指在其細胞中包含異源多核苷酸的植物。通常，異源多核苷酸被穩(wěn)定地整合到基因組中，使得該多核苷酸可以在連續(xù)世代中傳遞。異源多聚核苦酸可以被單獨或者作為重組表達盒的一部分被整合進基因組。本文所用的"轉基因"涉及任何的細胞、細胞系、愈傷組織、組織、植物部分或植抹，它們的基因型已經(jīng)通過存在的異源核酸而被改變，包括那些最初有這種改變的轉基因生物或細胞，也包括那些由初始轉基因生物或細胞通過雜交或無性繁殖產(chǎn)生的后代。本文所用的"轉基因"不包括(染色體的或染色體外的)基因組的改變，所述基因組的改變是通過常規(guī)的植物育種方法(如雜交) 或通過天然發(fā)生的事件，例如隨機雜交受精、非重組病毒感染、非重組細菌轉化、非重組轉座或自發(fā)突變。"定位克隆，，是一個克隆步驟，其中通過目標核酸基因組與標記核酸相鄰近來鑒定并分離該目標核酸。例如，基因組核酸克隆可以包含相互鄰近的兩個以上的染色體區(qū)域的部分或全部。如果一個標記可
以被用來從基因組文庫中鑒定基因組核酸克隆，例如亞克隆或測序等標準方法可以;故應用于鑒定和/或分離位于該標記附近的克隆的亞序列。當一個特定核酸是用給定的核酸序列構建的或者當該特定核酸是用該給定的核酸構建時，該特定核酸"來源于"該給定核酸。例如， cDNA或EST來源于表達的mRNA。術語"遺傳成分"或"基因"是指具有功能意義的可遺傳的DNA 序列，即基因組序列。術語"基因"也被用于指例如由基因組序列編碼的cDNA和/或mRNA,以及該基因組序列。術語"基因型"是個體(或個體組)在一個或多個遺傳座位的遺傳組成，所述遺傳座位與可觀測到的性狀(表型)相對應。基因型由個體從其親本繼承的一個或多個已知座位的等位基因定義。術語基因型可以被用來指個體在單個座位、在多位點的遺傳組成，或者更普遍地，術語基因型可以被用來指個體基因組上的所有基因的遺傳組成。"單倍型"是個體在多個遺傳座位的基因型。通常，單倍型表述的遺傳座位是物理上和遺傳上連鎖的，即在同一染色體區(qū)段上。術語"表型"或"表型性狀"或"性狀"是指生物的一個或多個性狀。表型可以通過肉眼或者本領域已知的任何其他評估方法，例如顯微鏡、生物化學分析、基因組分析、特定疾病抗性的測定法等等來觀察。在某些情況下，表型直接由單個基因或遺傳座位(即"單基因性狀")控制。在其他情況下，表型是幾個基因的結果。"數(shù)量性狀座位"(QTL)是多態(tài)性的遺傳區(qū)域并且產(chǎn)生可以被定量化描述的表型，例如高度、重量、含油量、萌發(fā)天數(shù)、疾病抗性等等，因此所述表型可以被指定一個對應于所述表型性狀的量化值的"表型值"。QTL可以通過單基因機制或多基因機制來作用。"分子表型"是可以在(一個或多個)分子群水平檢測到的表型。這些分子可以是核酸(如基因組DNA或RNA)、蛋白質(zhì)或代謝物。例如，分子表型可以是，例如在植物發(fā)育的特定階段中，對環(huán)境條件或應激等作出反應時的一個或多個基因產(chǎn)物的表達鐠。表達鐠通常在RNA或蛋白水平評估，例如在核酸陣列或"芯片"上或者使用抗體或其他結合蛋白。術語"產(chǎn)率，，是指具有商業(yè)價值的特定植物產(chǎn)品單位面積的生產(chǎn)
力。例如，大豆產(chǎn)率通常用每季度每英畝種子的蒲式耳或者每公項大豆的公噸數(shù)來計量。產(chǎn)率受遺傳和環(huán)境因素的共同影響。"農(nóng)藝學"、"農(nóng)學性狀"和"農(nóng)學表現(xiàn)"是指有助于在生長季度的過程中的產(chǎn)率的給定植物品種的性狀(和潛在的遺傳成分)。個體農(nóng)學性狀包括生長活力、營養(yǎng)勢、應激耐受、疾病抗性或耐受性、除草劑抗性、分枝、開花、結實(seed set )、種子大小、種子密度、直立性、脫粒能力等等。因此產(chǎn)率是所有農(nóng)業(yè)性狀的終極點。一 "組"標記或探針是指用于一般目的標記或探針的集合或群，或者由其衍生的數(shù)據(jù)，所述目的例如鑒定聚有期望性狀(如抗害蟲或耐旱)的大豆植林。經(jīng)常地，與標記或探針對應的數(shù)據(jù)，或由它們用途衍生的數(shù)據(jù)被存儲在電子媒介中。由于組中的每個成員擁有特定目的的用途，從該組中和亞組中選出的、包括某些但非全部標記的個體標記也對達到該指定目的有作用。"查找表"是將一種形式的數(shù)據(jù)與另一種形式的數(shù)據(jù)相關聯(lián)的表格，或者是其數(shù)據(jù)與預期結果相關的一種或多種數(shù)據(jù)形式。例如，查找表可以包括等位基因數(shù)據(jù)和所預計的包括給定等位基因的植物可能表現(xiàn)的性狀之間的關聯(lián)。這些表可以并且通常是多維的，例如同時考慮多個等位基因，并且任選地在進行性狀的預測時也考慮其他因素，例如遺傳背景。"計算機可讀介質(zhì)"是通過使用可用的或定制設計的界面的計算機訪問的信息儲存介質(zhì)。所述介質(zhì)的實例包括內(nèi)存(如ROM或RAM, 閃存等等)、光存儲介質(zhì)(如CD-ROM )、磁存儲介質(zhì)(計算機硬盤驅動器、軟盤等等)、穿孔卡片和許多其他市售的介質(zhì)。信息可以在目標系統(tǒng)和計算機之間傳遞，或者傳遞到或自計算機傳遞到或自計算機可讀介質(zhì)以用于存儲或訪問存儲的信息。這種傳遞可以是電子傳遞或者可以以其他可利用的方法進行，例如IR連接、無線連接等等。"系統(tǒng)指令"是系統(tǒng)能夠部分地或全部地執(zhí)行的指令系統(tǒng)。通常，指令系統(tǒng)以系統(tǒng)軟件形式存在。本發(fā)效^差本^在^森迷基于微陣列的雜交多態(tài)性的分析提供如下可能的方案(見圖1): 方案l:直接在探針區(qū)域內(nèi)檢測序列多態(tài)性。方案2:直接在探針區(qū)域內(nèi)檢測擴增的序列多態(tài)性。方案3:間接檢測在探針區(qū)域的鄰外側的序列多態(tài)性。序列多態(tài) 性可以形成可能影響雜交效率的不同的二級結構。方案4:間接檢測在探針區(qū)域外的序列多態(tài)性。序列多態(tài)性改變酶限制性位點，并因此產(chǎn)生RFLP。接著該RFLP被優(yōu)先擴增，這導致靶標豐度的差異。方案5:在探針區(qū)域內(nèi)間接檢測序列多態(tài)性。序列多態(tài)性改變酶限制性位點，并因此產(chǎn)生RFLP。接著該RFLP優(yōu)選地被擴增，并且這導致靶標豐度的差異。本方法使用具有結合的短寡核苷酸探針的微陣列通過讀取比較基因組DNA雜交實驗中的雜交信號的差異(雜交多態(tài)性)來間接地檢測序列多態(tài)性。它包括如下的主要步驟(圖2):A. 選擇寡核苷酸探針并設計用于檢測的微陣列1) 選擇與目標基因組序列互補的短寡核苷酸序列(該實例中為 25mer)。優(yōu)選地，該探針將與基因序列(編碼或調(diào)控序列)互補。2 )寡核苷酸分子將被直接合成至微陣列表面上或者是合成后再放置到微陣列表面上。3)制成的微陣列將確定所要測試序列的覆蓋率。B. 將序列變異轉換成雜交靶標的差異(參見圖2):1 )利用通過位點特異性限制酶選擇性限制所制備的基因組DNA的方法，由兩個遺傳變種制備基因組DNA。結果，將根據(jù)限制性位點的序列來片段化該基因組DNA。在該限制性位點的序列變異將產(chǎn)生不同長度的限制性片段(限制性片段長度多態(tài)性，或RFLP)。使用的限制酶將產(chǎn)生幾個突出堿基。這一步中使用的酶可以是單個限制酶或多個酶的組合。如果使用曱基化敏感性酶，則僅選擇性地限制性酶切低曱基化的區(qū)域。2) 此步驟將序列多態(tài)性轉換成RFLP。3) 具有獨特的Tm和堿基組成以及與限制性片段的突出堿基互補的部分序列的DNA寡核苷酸對可以與所有的限制性片段連鎖，而不受片段大小的影響。然后，一般地用于加入的寡核普酸(通用接頭)將被用作PCR擴增的PCR引物。4) 在所選的PCR擴增條件下，特定范圍(依賴于PCT擴增中使用的延伸時間)的限制性片段將被選擇性地擴增。大片段由于不能充分延伸而不被擴增。通過這個步驟，RFLP將被轉換成靶標(與探針雜交的分子)中的多態(tài)性，以豐度表示。C. 標記和雜交耙標1 )擴增的靶標將被DNA酶或其他方法以隨機方式片段化成50-200 個堿基的片段2 )通過末端轉移酶并通過選擇的具有熒光標簽的核苷酸來無選擇性地對每個短片段進行末端標記3 )根據(jù)序列互補，該標記的靶分子將被用來雜交微陣列上的短寡核苷酸探針4)所標記的靶標的熒光信號將由雜交過程中的雜交探針來捕獲。如果標記的分子沒有對應的探針，它將會被洗掉。如果標記分子是低豐度的，該信號將是微陣列探測不到的。這將提供消除沒有被限制酶片段化的大基因組DNA片段、擴增范圍之外的大基因組DNA片段和沒有對應探針的片段導致的噪聲的機會。D. 量化雜交信號和檢測多態(tài)性1 )雜交信號將通過激光掃描儀或CCD捕獲，并且通過計算算法量化。2) 從不同遺傳變種獲得的每個探針的信號(特征)將被比較。具有信號差異的探針將被記錄并且進行統(tǒng)計學分析。分析具有差異信號的探針的來源。3) 差異信號反映了導致不同結合親和力的單核苷酸多態(tài)性、導致不同靶標豐度的擴增的限制性片段多態(tài)性(RFLP和AFLP)、以及導致靶標的不同二級結構的序列多態(tài)性。這種檢測的一個實例是通過玉米中的GSHP檢測來闡明的。在這種情況中，有130萬不同寡核苷酸探針的GeneCh i p形式的微陣列被用于所述檢測中。這些探針的選擇基于基因編碼區(qū)域序列。提取Mo17和 B73的基因組DNA，用Pst I (曱基化敏感性酶)片段化、利用通用接頭對進行PCR擴增、用具有熒光標簽的核苷酸標記，并與玉米GeneChip 微陣列雜交。差異信號可被檢測、記錄，并通過統(tǒng)計方法分析。描述了兩種供選擇的用于標記復雜基因組的標記方法，這兩個方法可以應用于通常具有復雜的基因組經(jīng)濟物種中。靶標標記可以使用酶介導的末端標記方法( 一種基因組還原方法)，或者使用一種隨機標記方法來實現(xiàn)，在隨機標記方法中使用隨機的六聚寡核苷酸作為引物合成Klenow片段并且摻入具有熒光標簽的核苷酸。與隨機標記相比，檢測靈敏度和準確性顯著性地提高。在通過P-值和倍數(shù)差異選擇的多態(tài)性中，通過隨機標記方法檢出的多態(tài)性僅1°/。具有大于5倍的信號差異。相反，本發(fā)明的方法檢出多態(tài)性約60%具有超過5倍的信號差異。與以前描述的其他基因組還原方法(如High Cot DNA、 cDNA或曱基化過濾法)相比，本發(fā)明中描述的方法是獨特的并且具有優(yōu)勢，如表1所示。表l本發(fā)明的與以前公開的基因組還原方法的比較基因組片基因片段標記注釋段化的富集本發(fā)明甲基化敏耙標的優(yōu)常規(guī)依賴GC含量的高效的基因感性酶限先擴增標記基因組還原，組還原制性非曱基化敏感性酶限制性對谷類作物有利更低SNP轉換率甲基過甲基化敏靼標的凝常規(guī)j氐輩G 標回收感性酶限膠電泳分標記(recovery )和雜交制性離，無擴增信號不一致的靶標回收引入變異High隨機切割，Hap 色語常規(guī)不一致的乾標回收Cot變性/復性法標記引入變異cDNAcDM常規(guī) 標記由轉錄引入的變異AFLP非曱基化耙標的優(yōu)常規(guī)無基因富集敏感性酶先擴增標記限制性
實施例本發(fā)明的方法可以被用于(但不局限)如下已經(jīng)在農(nóng)業(yè)和醫(yī)學科學和實踐中被廣泛應用的當前用途中1)構建超高密度的基因圖譜； 2)通過混合分組分析(BSA)和類似方法鑒定用于單基因性狀或QTL 的標記；3 )通過全基因組連鎖分析或相關研究將QTL與候選基因關聯(lián)；和4)用i貪斷標記進行高通量篩選。實施例1^^存斧才法,縱^ CC力/p凝萍^y由Affymetrix制造的用戶定制*沒計的玉米GeneChip孩史陣列 (SYNG007 )被用于比較基因組雜交分析和玉米超高密度作圖。該玉米 GeneChip微陣列包括近130萬個寡核苷酸探針，該探針代表了 82, 000 個獨特基因或EST簇。在該陣列的設計中，僅包括完全匹配的探針。所描述的其他陣列包括用戶定制i殳計的西紅柿GeneChip陣列、用戶定制設計的擬南芥(arabidopsis )全基因組外顯子陣列、用戶定制 i殳i十的疫審(phytophthora )陣歹'J和市售的果繩(drosophila )GeneChip 陣列。差瘁ZWv4炎承從兩周齡的幼苗的葉子材料中收集組織樣品。用CTAB方法和 Qiagen DNeasy柱(Qiagen )提取基因組DNA( gDNA )。洗脫提取的gDNA 并重新懸浮于還原性的EDTA TE緩沖液中。通過凝膠電泳確定gDNA 的性質(zhì)。用UV分光光度計量化該gDNA并且調(diào)整為250 ng/p 1的終濃度。炎^艱浙齊^:^w f差必^遂用曱基化敏感性限制酶Pstl消化所制備的gDNA。簡言之，將2 H 1 gDNA ( 250 ng/ y 1 )與2 ja 1 NEB緩沖液3、 2 p 1 BSA、 2 p 1 Pstl 和12|u 1無核酸酶的水在冰上混合成20 |u 1的反應體系。渦旋混合該內(nèi)容物。使用熱循環(huán)儀在如下的條件下進行酶反應37C兩個小時， 85。C二十分鐘并放置于4'C。
遞^凝興^遽凝將共20jul Pstl消化的gDNA用于連接反應。兩個DNA寡核苷酸 (序列是CAC GAT GGA TCC AGT GCA和CTG GAT CCA TCG TGC A) #皮用作PstI接頭。在65。C下將4 ju 1的每種接頭在1 IOX退火緩沖液和10|a 1無核酸酶的水中預退火IO分鐘，并且在兩個小時的時間內(nèi)將溫度逐步降低到25°C。連接反應體系包括2. 5 ju 1 NEB T4 DNA連接酶緩沖液、1. 25 m 1 Pstl接頭和1. 25 ju 1 NEB T4 DNA連接酶。該反應體系在16。C下孵育兩個小時，通過在70。C下加熱二十分鐘來終止反應并置于4。C。反應后，通過加入75 ja 1無核酸的酶水來稀釋該25 ji 1 連接體系。使用Pstl接頭作為啟動位點，用聚合酶鏈式反應(PCR)擴增所連接的限制酶切片段。該PCR反應體系包含10 p 1稀釋的連接反應物、 10ju 1 PCR緩沖液、10yldNTP、 10plMgCl2、 7. 5 p 1 Pstl引物(GAT GGA TCC AGT GCA G )、 2. 5 ju 1 Ampl iTaq Gold聚合酶和50 ju 1無核酸酶水。通過使用熱循環(huán)儀按照以下程序進行擴增951C下3分鐘，95 。C下30秒25個循環(huán)、59°CT 30秒和72。C下30秒，之后72。C下7分鐘并且保持在4'C。擴增長度范圍在400-1000 bp的片段，并且用下述兩種方法中的一種依照廠商i兌明書進行純化Qiagen QIAquick PCR Purification Kit或者Qiagen MinElute 96UF PCR Purification Kit。 PCR產(chǎn)物的終濃度被調(diào)到最低為450 ng/pl。PCR產(chǎn)物在55 ju 1的反應體系中被進一步片段化成50-200bp的片段，該反應體系包含溶于EB緩沖液中的45 p 1純化的PCR產(chǎn)物(相當于20jug)、 5 ji 1 10x Affymetrix片段化緩沖液和5 ji 1稀釋的 Affymetrix片段化試劑(Dnase I 0.048 U/y 1 )。該反應體系在37 。C孵育30分鐘和5'C下孵育15分鐘，并維持在4'C。這些小片段在一個70|i 1的反應體系(包含50. 6|li 1的片段化樣品和19. 4 n 1的標記混合物)中在37。C下標記2小時，并且通過在95 。C下加熱15分鐘進行終止。該標記混合物由14 y 1 5X TdT緩沖液、2 pl GeneChip DNA標記試劑和3. 4 ja 1末端脫氧核苷酸轉移酶組成。g細^經(jīng)為標記
制備的gDNA在存在隨機八聚體的條件下被變性。筒言之，在冰上將4ial gDNA ( 500 ng/y 1)與20|ul 2. 5X的隨機引物溶液和20 p 1 無核酸酶的水混合成44ju 1的反應體系。渦旋混合該內(nèi)容物。4吏用熱循環(huán)儀在如下條件下進行反應99'C下5分鐘并維持在4t:。在冰上向所述44/il樣品中加入如下成分5jal生物素標記的 dNTP混合物和1 y 1的Klenow片段。渦旋混合該內(nèi)容物。使用熱循環(huán) 儀在如下條件下進行反應37t:下兩個小時并且維持在4'C。殺Jt、遂^、 ^g^^潛將標記的PCR片段(靶標)與GeneChip微陣列上的寡核苷酸探針雜交。簡言之，使用Affymetrix雜交爐以60 RPM在42。C下用200 IX 雜交緩沖液預雜交GeneChip微陣列IO分鐘。將250 ju 1的反應體系，在99'C下預孵育5分鐘和42'C下預孵育5分鐘，所述反應體系包含 70 |a 1標記的gDNA、 2. 5 p 1 B2對照oligo、 2. 5 p 1 100X RNA對照、 2.5pl緋精DNA、 2. 5 iu 1乙?；疊SA、 125 n 1 2X雜交緩沖液、18.75 y 1 DMS0、 22. 25 p 1 DEPC水和4 p 1 Affymetrix試劑X。然后將預處理的雜交混合液加入到GeneChip陣列上并且在雜交爐中以60 RPM在 42。C下雜交16小時。在雜交后，根據(jù)Affymetrix的說明書使用射流方案EukGE-WS2v4-450對GeneChip陣列進行洗滌和染色。陣列圖像用 Affymetrix GeneChip掃描儀-3000獲取。圖像數(shù)據(jù)用Affymetrix GCOS 程序處理。實施例2種《；^^超^痕凌遽^^ ,開發(fā)用戶定制設計的玉米GeneChip孩i陣列在基因組范圍的編碼序列內(nèi)進行單特征多態(tài)性(SFP)鑒定。該GeneChip微陣列有針對近 82， 000個基因和EST簇130萬個25mer寡核苷酸探針。在B73和M017 之間鑒定了近14400個SFP(代表總的篩選特征的1°/。)。利用這些雜交多態(tài)性作為標記，開發(fā)玉米超高密度圖鐠并用于B73和M017雜交的群(IBM)。用10997個SFP定位了 4368個基因標記。所研究的SFP的百分之九十三可通過相關已知的RFLP片段的分離模式得到驗證。對這些SFP的進一步的序列分析證實了在探針區(qū)域的相關單核苷酸多態(tài)性(SNP)。利用模式匹配的方法，我們進一步定位了 34,034個SFP，這
些SFP代表ll， 427個獨特基因或EST簇。定位的基因用序列分析驗證，并且用7jc稻和玉米間的宏同線性關系(macro synteny relation)提供支持。將這些基因標記與其他類型的遺傳和物理的標記整合將有助于標記輔助育種并且有助于鑒定控制復雜性狀的基因。詳細的方法參見附件。實施例3構建西紅柿的超高密度節(jié)點(bin)圖譜使用用戶定制設計的西紅柿GeneChip微陣列，通過比較基因組雜交對總共74個基因滲入系(IL)及其親本進行雜交多態(tài)性的篩選。因為它們是用代表基因片段的單DNA寡核苷酸探針(特征)檢測的，所以雜交信號差異被稱為單特征多態(tài)性(SFP)。將兩個親本系的DM雜交重復8次以保證檢測的統(tǒng)計顯著性。雖然大部分的IL的DNA雜交沒有經(jīng)過重復實驗，但是用于選擇與重要性狀相關的IL的雜交實驗被重復兩次，并且可以進行更多次重復以增加與這些性狀相關的標記的數(shù)量。數(shù)據(jù)質(zhì)量首先用Refiner評估，它是Express ionist (GeneData) 中的一個數(shù)據(jù)質(zhì)量模塊。所有數(shù)據(jù)符合中到高的質(zhì)量標準。檢查DM 雜交實驗的可重復性，并且在所有18個親本系數(shù)據(jù)組中的平均相關系數(shù)達到Q. 93。使用兩個獨立統(tǒng)計方法和一套高度嚴格的統(tǒng)計標準，在兩個親本系之間鑒定了近8364個SFP。這些SFP的錯誤發(fā)現(xiàn)率估計小于0.1%。交叉驗證方法驗證了所使用的統(tǒng)計方法?；谒b定的SFP，平均而言，一個測試者的基因型可有97%的時機被正確指定。所筌定的SFP經(jīng)過了分子的和遺傳的方法驗證。對共計131個包含SFP的基因片段進行PCR擴增并測序。其中，確證了 101個并且確證率為77%。通過將DNA寡核苷酸探針組的序列與標記序列比對，將用于檢測 SFP的探針與375個已知的遺傳標記關聯(lián)起來。發(fā)現(xiàn)82個標記與檢測 SFP的8364個探針有重疊。通過將IL中的每個座位的雜交信號(特征)與親本對照相對比，指定IL中的每個座位的等位基因。對比基于 SFP相關的標記的等位基因的指定與基于遺傳研究的等位基因的指定。所指定的6560個基因型的90"/ 與以前定位研究中的等位基因信息一致。從這8364個SFP中，鑒定了 1630個高可置信度基因標記并將其
定位到遺傳節(jié)點。選擇并驗證了近70-90個SFP標記。用計算的和分子的方法研究其他SFP以完善我們的方法并尋找其他的SFP標記。實施例4婆定^ ^'^炎^^記混合分離分組分析方法^皮應用于鑒定與Fusarium抗性位點座位 Frl的緊密連鎖的標記。從F2群體中制備兩個基因組DNA庫，一個來自于22個抗性等位基因的純合個體并且另外一個來自于21個敏感等位基因的純合個體。制備基因組DNA和親本系的基因組DNA的所述兩個庫、標記并且將每個庫都根據(jù)附件中描述的方法雜交到用戶定制設計的西紅柿GeneChip微陣列上。在兩個庫之間檢測到的差異雜交信號(p<0. 001，倍數(shù)差異M. 5 )的探針被選為候選標記。對該候選標記進一步進行測序以鑒定SNP，并且對其定位以確定與靶座位的連鎖。通過對組成抗性和敏感性BSA庫的43個個體系進行評分，本實驗中鑒定的17個候選標記中的16個被發(fā)現(xiàn)與耙座位在遺傳上連鎖。對抗性和敏感性經(jīng)良好表征的90個西紅柿品種的進一步測試也證實了該緊密連鎖，并且驗證了本方法的魯棒性。類似的方法已經(jīng)鑒定了匍柄霉(Stemphillium)抗性作為Sm和疫霉抗性座位的緊密連鎖遺傳標記。實施例5炎^^源檢刺婆;t近#參#哞#從不同品種的胡4權中提取基因組DNA,用隨機六聚體(heximer) 方法標記并且根據(jù)附件描述的方法雜交到用戶定制設計的西紅柿 GeneChip微陣列上。每個品種的實驗重復十次。兩個種類屬于茄科 (Solanaceae)并且其編碼序列在核普酸水平具有90%的相似性。在嚴格雜交條件下，近lf/。的西紅柿探針檢測到胡椒靶標信號。使用倍數(shù) 差異>1. 5和p<0. 01的標準，在C( chinense PI159234 )和F ( f rutescens ， BG2814-6)親本之間檢測到一共1248個推定的SFP。其中，137個SFP與胡椒序列一致(平均有5個堿基差異)，并且它們中有60個被選擇用來進行SNP的驗證。結果表明，40-60%的SFP 是由25 mer探針內(nèi)或接近該探針的SNP引起的。相似地，在蕓苔(brassica)和甜菜中用擬南芥GeneChip陣列、在潛葉蟲(Leafminer)中用果蠅GeneChip陣列、在葡萄霜霉病 (Plasmopara viticola )中用疫霉GeneChip陣列以及在菜豆中用大豆
陣列成功地檢測了 SFP (參見圖3)。實施例6^ ; 4 ^本A#07 7成不/^ ^遽傳,秀之57 六到十次重復的、均來自于B73和Mo17或其他物種的遺傳系的基因組雜交數(shù)據(jù)集被用于數(shù)據(jù)分析。開發(fā)自定義per 1腳本并用來鑒定這兩個親本間的SFP。筒言之，在每次雜交的強度信號載入到程序中以后，所述強度信號被標準化為芯片上所有特征的平均值。對標準化的強度值取自然對數(shù)，并且對親本間的每個特征的值差異進行t-檢驗。接著用倍數(shù)變化標準過濾顯著點(call )。為了產(chǎn)生在不同嚴格度下的輸出數(shù)據(jù)，使用不同的p-值和倍數(shù)變化截止點。在確定的標準下具有顯著性差異的預測候選物被選作并且用作單特征多態(tài)性(SFP)。通過測序對這些候選物進一步進行計算驗證和實驗驗證。實施例7摩#定W i7^ ^Jt叉發(fā)證通過交叉檢驗進一步檢查基于特征水平上的多重t-檢驗所預測的 SFP。在該分析中，從數(shù)據(jù)集中取出一個重復作為測試數(shù)據(jù)。基于t-檢驗用新的數(shù)據(jù)集在親本之間鑒定SFP。通過對比新產(chǎn)生的SFP數(shù)據(jù)，可以指定測試數(shù)據(jù)的身份(identity )。因為測試數(shù)據(jù)是從兩個親本系之一選出的，預計該指定的身份與原始的身份相符合。根據(jù)余下一個重復的不同組合，進行了共18次交叉驗證，并計算符合率的平均值。實施例8使用如下的算法對任何給定的SFP的所有9 3個子代系的基因型進行確定。對于每個鑒定的SFP，所有親本系重復物的強度信號被認為符合以下兩個正態(tài)分布，一個來自B73，另一個來自Mo17。對于親代系中給定的特征，每個分布曲線的形狀可以通過平均值和標準差值確定，所述平均值和標準差值是在SFP鑒定過程中生成的。因為這個相互交配群已經(jīng)經(jīng)過了 6-7代的自交，所以認為雜合基因型的頻率是很低的。因此，在計算過程中僅僅考慮純合基因型。為了基于定量的強度測量來指定基因型，強度值首先被標準化并且按照以上所述進行對數(shù)轉換。然后，該值被用于面積計算對于較小平均值(左)的分布，計算從負無窮至該分布覆蓋的該值的積分；而對于較大平均值(右)
的分布，計算從該分布覆蓋的該值至正無窮的積分，如下所述<formula>formula see original document page 33</formula>A左和A右是上述的面積；xg是標準化且經(jīng)對數(shù)轉換后的給定強度； ia 1和y 2是左分布和右分布的平均值；a 1和cj 2是左分布和右分布的標準差。然后比較這兩個面積，并且將具有較小計算面積的分布指定為給定強度。實施例9差萄^潛定W驗證IBM群中1343個以前公開的遺傳標記的分離模式被用作驗證指定的基因型的參照(Lee et al. 2002 )?；蛐托畔⑾螺d自 www. ma izegdb. org 。將這些遺傳標記的序列與玉米探4十組序列進4亍 blast比對以確立遺傳標記和SFP基因標記之間的聯(lián)系。將具有那些玉米探針組身份(id)的所有子代系中存在的SFP基因型從基因型指定數(shù)據(jù)集中取出，并且與對應的遺傳標記數(shù)據(jù)對比。然后，計算相符基因型的比例。實施例10標記求桌,^C57 i5/探奸遂赤記來自相同探針組的多個SFP被用于評估基因標記的置信水平。它是通過首先在探針組內(nèi)部尋找多個多態(tài)性特征，并且假定它們之間不會發(fā)生重組來實現(xiàn)的。在探針組內(nèi)比較這些SFP，頻率最高的基因型被選擇作為該探針組的代表。那些在特征水平具有相同數(shù)量的不同基因型的探針組由于是計算中缺失數(shù)據(jù)而被忽略。實施例11三種類型的基因型數(shù)據(jù)集被用在作圖分析中a)公共的RFLP和 SSR標記；b) Syngenta SSR標i己；和c)如上所述的探4十組水平的標記。原始MapMaker (Lander et al. 1987 ) 4皮改成一個UNIX命令4亍程SFP標記(Yiping Fan et al， Syngenta, 未發(fā)表)。用MapMaker500進行計算。1127個公共的標記一皮用作形成框架結構的錨。然后，基于框架結構中的錨的最優(yōu)勢對數(shù)評分(LOD score),將來自其他數(shù)據(jù)集的標記指定給適合的染色體。然后，用 "build"命令確定標記位置。為了使隨機效應的影響最小，進行了五次獨立的運行，并且將一般的順序選作遺傳順序。對于那些在某個給定的LOD差異截止點可以定位于多個位置的標記，使用最嚴格的LOD 截止點直到它定位于單一位置。在探針組標記中，基于SFP鑒定中使用的嚴格度和給定標記是否來自于多SFP，數(shù)據(jù)被分為不同的亞組。具有最嚴格條件的組中的標記最先被納入作圖計算中。然后所定位的標記以及錨形成新的錨框架，并且具有第二最嚴格條件的組中的標記被納入計算中。該過程被重復直到所有的組標記都被計算。實施例12化凝5T^差^^奢和"(W遽傳^ ,為了評價我們產(chǎn)生的圖譜的質(zhì)量，比較SFP基因圖譜和IBM2圖譜 (www.maizegdb.org)。這個圖譜組合了遺傳關聯(lián)圖語和物理圖語；因此圖譜上的標記可以有不同的來源。為了進行該比較，將公共圖鐠上的標記序列與玉米探針組序列進行blast比對，并且生成7>共標記身份和探針組身份之間的聯(lián)系。然后鑒定兩個圖鐠中的重疊的標記，并且對比各位置。實施例13對于每個定位的遺傳標記，檢索(retrieve)在所有作圖系中的基因型并且基于它們的基因型將對應的雜交.eel文件分成兩大部分。這個定位的標記被用作"釣斜"。在強度被標準化并經(jīng)對數(shù)轉換后的特征水平上，對這兩部分應用t-檢驗。然后，根據(jù)上述的倍數(shù)變化標準對顯著點進行過濾。輸出數(shù)據(jù)根據(jù)如下步驟進行分析。首先，將p-值轉換成使用以IO為底的負對數(shù)的"評分，，以便于計算。接著，對于每個顯著點，如果它不在本圖譜上，收集它在所有釣餌中的身份和評分。然后鑒定并選擇具有最大高評分的釣餌。下一步，加強顯著點以獲得上述的基因型數(shù)據(jù)，并且與最大高評分的釣何的基因型相比如果基因型具有更多的差異則刪除顯著該點。最后，對于那些具有多個顯著點
的探針集組，使用濃縮的集方法該探針集組的最佳位點置應該是具有大多數(shù)顯著特征所指定向的釣餅的區(qū)域。實施例14確定PstI RFLP,從玉米序列和SNP數(shù)據(jù)集中提取具有B7 3和Mo 17之間的SNP信息的序列。搜索所有的SNP和側翼序列的限制酶PstI識別序列CTGCAG。然后將具有PstI多態(tài)性的序列與玉米基因組進行blast比對以發(fā)現(xiàn)涵蓋多態(tài)性Pstl位點的更長序列。將那些更長的基因序列與玉米探針組和個體特征序列進行blast比對。對于那些發(fā)現(xiàn)位于多態(tài)性Pstl位點附近的探針組，從所有的特征行為數(shù)據(jù)集中提取它們的個體特征行為 (包括強度、倍數(shù)變化和t-檢驗中的p-值)。然后，對比并分析該序列和對應的特征行為以總結Pstl RFL是否能夠被確認。參者義說Lander ES, Green P， Abrahamscm J， Barlow A， Daty MJT， Lincoln SE, Newburg L. (1987). MAPMAKER:姐interactive computer package for constructing primarygenetic linkage maps of experimental and natural populations, Genomics. 1:174-181,Lee M5 Sharopova N, Beavis WD， Grant D， Katt M， Bkir Ds HaH肌汰A, (2002), Expanding the genetic map of maize with the mtermated B73 x MoTL7 (IBM) population. Plant Mol Biol. 48.453-461,
權利要求
1.一種用于篩選基因組核酸物質(zhì)的基因特異雜交多態(tài)性的方法，所述方法包括a)用微陣列總體篩選雜交多態(tài)性；b)酶介導的基因組復雜性的降低；c)酶介導的差異信號放大和噪聲降低；d)數(shù)據(jù)提取和GSHP鑒定；和e)在高通量篩選中應用GSHP。
2. —種用于篩選基因組核酸物質(zhì)的基因特異雜交多態(tài)性的方法，所述方法包括a. 選擇寡核苷酸探針并設計用于檢測序列變異的、包含所述探針的微陣列；b. 將序列變異轉換成雜交靶標的變異；c. 標記并雜交耙標；d. 檢測雜交信號；并e. 量化雜交信號并且檢測多態(tài)性。
3. —種用于檢測基因組DNA的多核苷酸序列中的基因特異雜交多態(tài)性的方法，所述方法包括a. 選擇與基因組多核苷酸序利互補的短寡核苷酸序列，所述短寡核苦酸序列被直接合成到微陣列表面上或者合成之后被置于微陣列表面上；b. 從兩個遺傳源制備基因組DNA并且使用一種或多種限制酶對所述基因組DNA進行位點特異性限制性酶切，從而產(chǎn)生限制性片段長度多態(tài)性(RFLP);c. 選擇性地擴增選定長度范圍的RFLP,建立擴增的多態(tài)性靶標；d. 將擴增的靶標隨機斷裂成從大約50到大約200個堿基的片段并且無選擇性地對所述片段進行末端標記；e. 將末端標記的片段雜交到微陣列表面的短寡核苷酸序列上；并f. 量化雜交信號并且檢測多態(tài)性。
4. 權利要求3的方法，其中所述步驟a中選出的短寡核苷酸從大約25mer到大約30mer。
5. 權利要求3的方法，其中所述步驟d中的擴增靶標的片段用具有熒光標簽的核苷酸和一種末端轉移酶進行末端標記。
6. 權利要求3的方法，其中所述步驟f的雜交信號用選自激光掃描儀和CCD的裝置捕獲。
7. 權利要求6的方法，其中所述捕獲的雜交信號用計算算法量化。
8. 權利要求3的方法，進一步包括g.比較來自不同遺傳背景或變種的信號的信號差異并且確定差異信號的來源。
9. 權利要求8的方法，進一步包括h.鑒定引起步驟g中差異信號的單核苷酸多態(tài)性。
10. 根據(jù)權利要求9的方法鑒定的單核苷酸多態(tài)性。
11. 一種遺傳圖譜，所述遺傳圖譜是利用根據(jù)權利要求3的方法產(chǎn)生的信息開發(fā)的。
12. —種遺傳圖譜，所述遺傳圖譜是利用根據(jù)權利要求8的方法產(chǎn)生的信息開發(fā)的。
13. 利用根據(jù)權利要求3的方法產(chǎn)生的信息開發(fā)的分子標記。
14. 利用根據(jù)權利要求8的方法產(chǎn)生的信息開發(fā)的分子標記。
15. —種數(shù)量性狀座位，所述數(shù)量性狀座位利用根據(jù)權利要求3 的方法產(chǎn)生的信息鑒定和定義。
16. 權利要求15的數(shù)量性狀座位，進一步用權利要求13的分子標記表征。
17. 權利要求15的數(shù)量性狀座位，進一步用權利要求14的分子標記表征。
全文摘要
提供一種用于鑒定基因特異雜交多態(tài)性(GSHP)的方法及其用途。所述方法包括以下步驟a)用微陣列總體篩選雜交多態(tài)性；b)酶介導的基因組復雜性的降低；c)酶介導的差異信號放大和噪聲降低；d)數(shù)據(jù)提取和GSHP鑒定；和e)在高通量篩選中應用GSHP。
文檔編號C12Q1/68GK101213312SQ200680024076
公開日2008年7月2日申請日期2006年6月22日優(yōu)先權日2005年6月30日
發(fā)明者J·薩蒙朗, 彤朱申請人:先正達參股股份有限公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：J.薩蒙朗;朱彤
技術所有人：先正達參股股份有限公司
我是此專利的發(fā)明人

上一篇：用于防治昆蟲和蜘蛛類動物的RNAi的制作方法
上一篇：抗il-6抗體、組合物、方法及應用的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.食品功能因子基因工程菌種的構建、智能高通量進化篩選 2.發(fā)酵工藝優(yōu)化
2、馬老師：1.酶工程與生物催化 2.釀造技術與風味分析 3.生物質(zhì)資源綜合利用
3、林老師：1.釀造微生物育種及關鍵釀造工藝開發(fā) 2. 真菌基因功能及調(diào)控網(wǎng)絡解析 3.精細化學品、蛋白真菌細胞底盤開發(fā)
4、張老師：1.發(fā)酵食品安全：危害物相關基因的篩選，危害物產(chǎn)生菌的快速檢測，危害物的預警和發(fā)酵過程控制 2.真菌次級代謝與調(diào)控 3.釀造酒相關研究
5、郭老師：1.現(xiàn)代釀造技術與食品安全 2. 酵母生物學 3.生物基化學品與合成生物學
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

基因多態(tài)性相關技術

基因多態(tài)性分析相關技術

cyp2c19基因多態(tài)性相關技術

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于篩選基因特異雜交多態(tài)性(gshp)的方法及其在遺傳作圖和標記開發(fā)中的用途的制作方法