專利名稱::用于植物改良的基因及其用途的制作方法
技術(shù)領(lǐng)域:
:本文公開的^括重組DNA的轉(zhuǎn)基因植物細胞、植物和種子以及制造和4OT所述植物細胞、植物和種子的方法。
背景技術(shù):
:農(nóng)民和消費者都希望具有改良性狀的轉(zhuǎn)基因植物,例如改良的產(chǎn)量、環(huán)境應力耐受性、抗蟲性、除草劑耐受性、改變的種子成分等等。雖然通過在植物育種上的大量努力,人們已經(jīng)在需求的性狀上獲得了顯著的進展,但是把特定的DNA引入植物基因組中肯,為繁育具有改良和/菊蟲特的性狀的植物提供進一步的機會。研究出具有改良性狀的轉(zhuǎn)基因植物的能力部分依賴于識別有用的重組DNA用于具有改良性質(zhì)的轉(zhuǎn)化植物的生產(chǎn),例如通31/人所述改良性質(zhì)的篩選中實際選擇轉(zhuǎn)基因植物。本發(fā)明提供具有重組體的植物細胞核,所述重組體能纟^在細胞中具有所述細胞核的轉(zhuǎn)基因植物增強的農(nóng)業(yè)性狀。本發(fā)明的重組DNA被提供于一個包含啟動子的構(gòu)建體中,所述的啟動子能在植物細胞中發(fā)揮作用并可操作地連接到DNA,所述DNA編碼在序列中至少具有一個氨基酸結(jié)構(gòu)域的蛋白質(zhì),所,列^31用于氨基酸序列對比的Pfam聚集界限(gatheringcutoff),所述氨基酸序列是用標識在表17中的Pfam結(jié)構(gòu)域名稱組中的一個Pfam名稱標識的蛋白質(zhì)結(jié)構(gòu)域族對比的。在本發(fā)明更具體的實施方案中,提供表達蛋白質(zhì)的植物細胞,所述蛋白質(zhì)的氨基酸序列與氨基酸共有序列組中的一個氨基酸共有序列具有至少90%同一性,所述氨基酸^W序列組由用于SEQE)NO:426和它的列于表2的同源體的構(gòu)造的氮基酸共有序列至用于SEQIDNO:850和它的列于表2的同源體的構(gòu)造的氨基酸共有序列組成。同源體的氨基酸序列是SEQIDNO:851至33634。在本發(fā)明更具體的實施方案中,植物細胞中表達的蛋白質(zhì)是選自在表l中M31在Genbank中的相關(guān)蛋白質(zhì)注釋標識的蛋白質(zhì),和在表16中通過蛋白質(zhì)結(jié)構(gòu)域族標識備itt也標識的蛋白質(zhì)。本發(fā)明的其他方面特指轉(zhuǎn)基因植物細胞,和包括多數(shù)具有所述核的植物細胞的轉(zhuǎn)基因植物,來自所述植物的子代轉(zhuǎn)基因種子、胚和轉(zhuǎn)基因的花粉。所述植物細胞核選自具有使用重組DNA轉(zhuǎn)化的核的植物細胞再生的轉(zhuǎn)基因植物的總體,所述重組DNA是M在轉(zhuǎn)基因植物的總體中篩選與在核中不具有重組DNA的對照植物相比具有增強性狀的轉(zhuǎn)基因植物得到的,其中增強的性狀是指增強的水利用率、增強的耐寒性、增強的耐熱性、增強的耐陰性、增強的鹽環(huán)境耐受性、產(chǎn)量的增加、增強的氮利用率、增強的種子蛋白和增強的種子油。在本發(fā)明的某些方面,重組DNA表達一個顯示增強性狀的蛋白質(zhì);在本發(fā)明的其他方面,重組DNA^ii用于抑制一種內(nèi)生蛋白水平的RNA。在本發(fā)明的另一個方面,植物、種子、胚和花粉中的植物細胞的核進一步包括表達一種蛋白質(zhì)的DNA,所述蛋白質(zhì)提供對暴露在j頓的除草劑的耐受性,所述除草劑4頓的水平對所述植物細胞的野生型^t命的。所述的耐受性特別有用,不但可以作為所述植物的有益性狀,而且也可以用于本發(fā)明方法中的選擇步驟。在本發(fā)明中,所述除草劑是鎮(zhèn)草寧(glyphosate)、麥草畏(dicamba)、或草銨膦Cglufosinate)化合物。此外,本發(fā)明的其他方面提供轉(zhuǎn)基因植物和本發(fā)明轉(zhuǎn)基因種子細胞的核,所述轉(zhuǎn)基因植物是用于重組DNA的純合子,所述轉(zhuǎn)基因種子來自玉米、大豆、棉花、蕓苔(canola)、苜蓿、小麥或稻類植物。在阿根廷,在其他用于實踐本發(fā)明的多個方面的重要的實案中,在核中的重組DNA提供于來源于玉米品系的植物細胞中,所述玉米品系具有并保持對病毒例如MaldeRioCuarto病毒或真菌例如銹病(Puccinasorghi)真菌或?qū)λ鼈儍烧叩目剐?。本發(fā)明還提供了用于制造非天然的、轉(zhuǎn)基因的種子的方法,所述種子可以用于生產(chǎn)許多具有增強性狀的轉(zhuǎn)基因植物,所述增強性狀是由于植物細胞核中的重組DNA及其穩(wěn)定整合的表達得到的。在本發(fā)明的某些方面中,重組DNA可以表達一種蛋白,所述蛋白在序列中具有至少一個氨基酸結(jié)構(gòu)域,所述序列皿用于氨基酸序列對比的Pfam聚集界限,所述氨基酸序列是用標識在表17中的Pfam結(jié)構(gòu)域名稱組中的一個Pfam名稱標識的蛋白質(zhì)結(jié)構(gòu)域族對比。在其他方面,重組DNA抑制所述蛋白的水平,更確切的說,所述方飽括(a)為了增強盼性狀和重組DNA,篩選植物總體,其中植物總體中的,植物的性狀可顯示出低于、基本相同或大于沒有表達重組DNA的對照組植物顯示的性狀水平;(b)選自總體的一個或多個植物所顯示的性狀水平大于對照植物顯示出的所述性狀的水平;(c)驗證重組DNA是否穩(wěn)定的齡至斷縱擇株中;(d)分析選賺的組織以測定蛋白質(zhì)的產(chǎn)量,所述蛋白質(zhì)具有序列SEQIDNO:1425中一個的核苷酸編碼的蛋白質(zhì)的功能;和(e),M擇株收集種子。在本發(fā)明的一個方面,植物總體中的植物進一步包含—個蛋白質(zhì)的DNA,所述蛋白質(zhì)提供暴皿對野生型植物細胞致命的水平使用除草齊啲耐受性,并且選擇受到處理總體的除草齊啲影響,例如鎮(zhèn)草寧、麥草畏或草銨駒七合物。在本發(fā)明的另一個方面,通過確認植物具有增強的性m擇植物。所述方法對生產(chǎn)玉米、大豆、棉花、苜蓿、小麥或稻的種刊寺別適用,所述種子具有一個如上所述的增強性狀則入選。9本發(fā)明的另一個方面,提供一種生產(chǎn)雜交玉米(hybridcom)種子的方法,包括從除草劑耐受的玉米植物中獲得雜交玉米種子,所述的玉米植物還具有本發(fā)明的穩(wěn)定整合的重組DNA的核。方法進一步包括/A^f述的雜交玉米種子生產(chǎn)玉米植物,其中部分生產(chǎn)自所述雜^5米種子的植物是所述重組DNA的純合子,部分生產(chǎn)自所述雜趕米種子的植物是所述重組DNA的半合子,部分生產(chǎn)自所述雜CT米種子的植物不具有所述重組DNA;使用除草劑處擇為所述重組DNA純合子和半合子的植物;從除草劑處理存活的玉米植物中收集種子,并種植所述的種子以進一步生產(chǎn)子代玉米植物;重復選擇和收集步驟至少一次以生產(chǎn)一個近交的玉米品系;雜交近^米品系和第二個玉米品系以生產(chǎn)雜交種子。本發(fā)明的另一個方面,提供一種M31使用免疫活性的抗傳^^測種子和植物組織中的重組DNA表達的蛋白質(zhì)的存在,擇植物的方法,所述植物在植物細胞中包括本發(fā)明的核。本發(fā)明的另一個方面,提供防偽造的磨碎種子,其具有本發(fā)明的獨特的重組DNA的核,可當作產(chǎn)地標記。本發(fā)明涉及在植物細胞中的具有用于抑制蛋白質(zhì)表達的重組DNA的核,被標識在表1和表16中。本發(fā)明更具體的方面,提供具有用于抑制蛋白質(zhì)表達的重組DNA的植物細胞,所述蛋白質(zhì)在植物中具備具有如下氨基歹啲蛋白質(zhì)的功能SEQIDNO:426、428、429、430、524、525、541、601、602、650、651、654、655、657、660、694、698、772、801或標識在表16中相應的Pfam,即分別是組蛋白(Histone)、WD40、NPH3、FHA、PB1、ADH—zinc—N、NAPRTase、ADK—lid、p450、B56、DUF231、C2、DUF568、WD40、F-box、Pkinase、T邵ene—syntli。所述抑制可以被本領(lǐng)域已知的任意若干方法影響,例如反義抑制、RNAi或突變敲除等等。本發(fā)明的另一個方面涉及種植具有增強水利用率和增強氮利用率的轉(zhuǎn)基因植物。例如,本發(fā)明提供不4頓灌溉7jC種植玉米、棉花或大豆作物的方法,包括種植具有本發(fā)明選擇的增強水利用率的植物細胞的種子。替代的方法包括使用M^、的灌溉用7K例如在玉米作物的生長期間提供至多300毫米的地下水。本發(fā)明還提供不增加miE種植玉米、棉花或大豆作物的方法,包括種植具有本發(fā)明選擇的增強氮利用率的植物細胞的種子。替代的方法包括在玉米作物生長期間使用與傳統(tǒng)的氮供給量相比減少的氮供給量。本發(fā)明的多個方面對種子和轉(zhuǎn)基因植物中的轉(zhuǎn)基因植物細胞特別有用,所述種子禾囀基因植物在農(nóng)作物中具有任意上述增強性狀,例如玉米(maize)、大豆、棉花、蕓苔(油菜)、小麥、向日葵、高粱、苜蓿、大麥、粟、稻、煙草、水果和蔬菜作物和草皮草。本發(fā)明還提供重組DNA構(gòu)建體,包括在植物細胞核中發(fā)揮作用的DNA,所述DNA用于給具有這種細胞的植物賦予增強的性狀。圖1是SEQIDNO:601和同源體的氨基酸共有序列。圖2和3是質(zhì)粒圖。
發(fā)明內(nèi)容在所附的序歹l該中SEQE)NO:1-425是用于在植物細胞中賦予增強性狀的重組DNA的"基因"的DNA編石職的核苷,列,即每個4樣一個蛋白質(zhì)的編碼序列;SEQIDNO:426-850是具有核苷酸編碼序列1-425的"基因"的關(guān)聯(lián)(cognate揮白質(zhì)的氨基,列;SEQIDNO:851-33634是同源(homologous)蛋白質(zhì)的氨基酸序列;SEQIDNO:33635是一個氨基酸共有序列。SEQIDNO:33636是一個可用于玉米轉(zhuǎn)化的質(zhì)?;A(chǔ)載體的核苷,列;和SEQIDNO:33637是一個可用于大豆轉(zhuǎn)化的質(zhì)?;A(chǔ)載體的DNA序列。本發(fā)明的核是ffi31篩選轉(zhuǎn)基因植物的一個或多個性狀確認的,所述性狀包括改良的干旱壓力耐受性、改良的熱壓力耐受性、改良的冷壓力耐受性、改良的高鹽壓力耐受性、改良的低有效氮壓力耐受性、改良的遮光壓力耐受性、在種子吸收至早期的無形期階段改良的植物生長和發(fā)育、和在植物抽葉、開花和種子成熟階段改良的植物生長和發(fā)育。"基因"指染色體DNA、質(zhì)粒DNA、cDNA、合成DNA或其他的DNA,編碼肽、多肽、蛋白質(zhì)或RNA分子和包含在毅規(guī)則中的編碼序列的側(cè)翼區(qū)域。在本發(fā)明S31蛋白質(zhì)的表達提供改良性狀的方面,"基因"至少指給出所述性狀的蛋白質(zhì)或蛋白質(zhì)的功能多肽碎片的編石馬核苷列。在本發(fā)明通過抑制內(nèi)生蛋白的表達提供改良性狀的方面,"基因"指可以用于抑制的耙基因的任意部分。"轉(zhuǎn)基因種子"意思是一個植物種子,其核己經(jīng)ilii插入重組DNA改變,例如,如本文描述的轉(zhuǎn)型。術(shù)語"轉(zhuǎn)基因植物"被用于指從原始的轉(zhuǎn)化結(jié)果得到的植物、或來自于后續(xù)代的子代或與轉(zhuǎn)化植物雜交的植物,只要子代包含具有重組DNA的基因組的核。"重組DNA"是一個具有遺傳工程傲布的核酸,Mil結(jié)合在轉(zhuǎn)錄單位內(nèi)的內(nèi)源性的和/或外源的元素、借助誘變的操作、限制性內(nèi)切酶等等或簡單i艦M入本身的轉(zhuǎn)錄單位的多個復本來弓l入的。重組DNA可以包括獲得自不同來源的DNA片段、或獲得自相同來源的DNA片段,但其已經(jīng)被操作連接到不是自然存在于連接條的DNA片段。一個重組核酸可以存在于細胞外,例如作為一個PCR片段,或齡到基因組中,例如一個植物基因組。"性狀"意思是植物或特定植物材料或細胞的生理學的、皿學的、生物化學的或物理的特征。在有些情況下,這些特征是可觀測到的,例如種子或植物大小,或可以用生物化學技術(shù)測定,例如檢測種子或葉的蛋白質(zhì)、淀粉或油含量,或是新陳代謝或生理過程的觀測,例如,艦測定二氧化碳的吸收量,或是一個或多個基因的^ii7jC平的觀測,例如,S31fOTNorthern分析、RT-PCR、微點陣基因表達分析、或指針基因表達系統(tǒng),或是農(nóng)業(yè)觀測例如壓力耐受性、產(chǎn)量、或病原體耐受性。"對照植物"是在核中沒有用于性狀改良的重組DNA的植物。對照植物被用于觀啶和比較轉(zhuǎn)基因植物的性狀的改善,所述轉(zhuǎn)基因植物具有所述的性狀改良重組DNA。一個適宜的對照植物可以是一個用于本文中產(chǎn)生轉(zhuǎn)基因植物的親本品系糊瞎基因植物。換句話說,對照植物可以是包括空的載體或標志基因、但不包含產(chǎn)生改良性狀的重組DNA的轉(zhuǎn)基因植物。對照植物也可以是半合子轉(zhuǎn)基因植物的負分離子子代。在特定的性狀改善驗證中,使用有限的對照植物可以導致對照數(shù)據(jù)集較寬范圍的變化。為使對照數(shù)據(jù)集內(nèi)的變化的影響最小化,使用一個"參考"。在本文中,"參考"是一個來自于生長于相同環(huán)境并處于相同發(fā)育階段的轉(zhuǎn)基因和對照植物兩者所有數(shù)據(jù)的修整均值。所述修整均值^M31從,集中刪除特定的百分率,即20%,的最小和最力見測均值,然后計算剩余觀測的均值得到的。"性狀改良"意思是相對于對照植物或參考在轉(zhuǎn)基因植物的特征中可檢測的和符合期望的差異。有時,性狀改良可以定量的測定。例如,性狀改良可以必然伴有i^見測的性狀上至少2X期望的差異、至少5%期望的差異、至少大約10%期望的差異、至少大約20%期望的差異、至少大約30%期望的差異、至少大約50%期望的差異、至少大約70%期望的差異、或至少大約100%差異、或甚至更大的期望的差異。在其它情況下,性狀改良僅定性的測定。眾所周知,性狀可以自然的變化。因此,與對照植物或參考所觀測到的性狀分布比較,在轉(zhuǎn)基因植物中觀測的性狀改變必然伴有性狀的正態(tài)分布的改變,其使用本文提供的統(tǒng)計學方法評價。性狀改良包括但不限于,產(chǎn)量增加,包括在非壓力狀態(tài)下的產(chǎn)量增加和環(huán)境壓力環(huán)境下的產(chǎn)量增加。壓力環(huán)境可以包括,例如,干旱、遮光、真菌病、病毒病、細菌病、蟲害、線蟲侵擾、受冷、受熱、滲透性的壓力、低有效氮營養(yǎng)、低有效磷營養(yǎng)和高植物密度。許多農(nóng)業(yè)性狀可以影響"產(chǎn)量",包括但不限于株高、莢數(shù)量、莢在植物上的位置、節(jié)間的數(shù)量、莢破損的發(fā)生率、粒度、根瘤形成和固氮的效率、營養(yǎng)吸收的效率、生物和非生物的壓力的抗性、碳同化作用、植物結(jié)構(gòu)、倒伏的抗性、種子發(fā)芽的百分率、秧苗的長勢和幼體性狀。其他可以影響產(chǎn)率的性狀包括,萌芽的效率(包括在壓力環(huán)境下的萌芽)、生長率(包括在壓力環(huán)境下的生長率)、穗的數(shù)量、旨穗的種子數(shù)量、種子大小、種子的成分(淀粉、油、蛋白質(zhì))和種子填充的特征。其他關(guān)心的問題是顯示期望的表現(xiàn)型性質(zhì)的轉(zhuǎn)基因植物的產(chǎn)生是否能帶來整術(shù)直物產(chǎn)量的增加。這樣的性質(zhì)包括增強的植物形態(tài)、植物生理或改良的從轉(zhuǎn)基因植物收獲的成辦中子的成分。"產(chǎn)劃艮制環(huán)境"意思是植物的產(chǎn)量將穀鵬制的環(huán)境,包括環(huán)境壓斜牛。"壓力環(huán)境"意思^t植物不適宜的環(huán)境,其不利的影響植物代謝、生長和/或發(fā)育。在壓力環(huán)境下的植物典型的表現(xiàn)為低發(fā)芽率、生長和發(fā)育緩慢、低光合作用率,最終導致減產(chǎn)。特別地,這里使用的"水分不足壓力"指天然植物正常生長需要的亞最優(yōu)條f牛的水和濕度。相對7K含量(RWC)可以用于植物水不足的生理學測量。當植物處于壓力環(huán)境時,其觀糧植物水分狀態(tài)的滲透性調(diào)整的影響??梢援a(chǎn)生水分不足壓力的環(huán)境包括、熱、干旱、高含鹽量和PEG誘發(fā)的滲透&E力。"冷壓力"意思是對于植物的特定品種或特定的品系來說,植物暴露于低于正常的i^M下(低2或3")。(低2。C或更多)"氮營養(yǎng)"意思是任何一種或任何混合的常用作植物劁巴柳肖麟,包括13但不限于,硝酸鉀、硝酸鈣、硝酸鈉、硝酸銨。用于此處的術(shù)語銨意思是任意一種或任意混合的常用作植物氮肥的銨鹽,例如,硝酸銨、氯化銨、硫酸銨等等。"低氮有效性壓力"意思是一種植物生長環(huán)境,所述的生長環(huán)境不包含充足的氮營養(yǎng)以維持植物的健康成長和/或不能使植物達到它的典型的在充足氮生長環(huán)境下的產(chǎn)量。例如,一個限制氮環(huán)境可以指具有50%或更少的常規(guī)氮供給的生長環(huán)境。"充足的氮生長環(huán)境"意思是一個生長環(huán)境,其中土壤或生長培養(yǎng)基包含或接受最佳數(shù)量的氮營養(yǎng)以保證植物健康成長和/或使植物達到對于特定植物品種或特定品系的典型的產(chǎn)量。本領(lǐng)域技術(shù)人員可以了解用于大多數(shù)植物品種的所赴壤、培養(yǎng)凝卩肥料的組成。"遮光壓力"意思是具有有限的可利用的光的生長環(huán)境,其會觸發(fā)植物的避陰反應。當植物位于植冠的中下部、或緊密臨近附近植被時植物就受到了遮光壓力。當植物密度徵一^#定植物品種的平均優(yōu)勢密度時,遮光壓力會加劇。在美國,2000年每英畝的平均優(yōu)勢密度的農(nóng)作物的幾個例子是小麥1,000,000-1,500,000;稻650,000-900,000;大豆150,000-200,000、蕓苔260,000曙350,000、向日葵17,000-23,000和棉花28,000-55,000個植株每英畝(Cheikh,例如,(2003)美國專利申請?zhí)?0030101479)。M51多種途徑可以證明和測定本發(fā)明轉(zhuǎn)基因植物的"增加產(chǎn)量",包括檢測重量、每植株的種子數(shù)量、種子重量、每單位面積的種子數(shù)量(即每英畝的種子數(shù)、藤巾子重量,)、每英畝的蒲式耳(bushel)數(shù)、每英畝的噸數(shù)、每公頃的公斤數(shù)。例如,玉米的產(chǎn)量可以通過測定每單位生產(chǎn)面積的玉米粒產(chǎn)量得到,例如,每英畝的蒲式耳量或每公頃的公制噸數(shù),通常在濕度調(diào)整的基礎(chǔ)上報道,例如,在濕度15.5%。增加產(chǎn)量可以是由于改良了關(guān)鍵生物化學化合物的利用率,例如氮、磷和碳水化合物,或由于改良了對環(huán)境壓力的耐受性,例如冷、熱、干旱、鹽和害蟲鋼原體的攻擊。性狀改良的重組DNA還可以用于提供具有改良的生長發(fā)育的轉(zhuǎn)基因植物,并最終增加產(chǎn)量,因為修改了植物生長調(diào)節(jié)齊啲表達或修改了細胞周期或光合作用il^各。意思是轉(zhuǎn)錄DNA以生產(chǎn)RNA。得到的RNA可以不局限于編碼蛋白質(zhì)的mRNA、反義RNA、或用于RNAi技術(shù)的雙鏈RNA。表皿可以指從mRNA生產(chǎn)編碼蛋白質(zhì)。"植物啟動子"是一個能在植物細胞中啟動轉(zhuǎn)錄的啟動子,不管其是否源自植物細胞。典型的植物啟動子包括,但不限于,獲得自植物的啟動子、植物病毒、和包含在植物細胞中表達的基因的細菌如土壤桿菌屬或根瘤菌。用于發(fā)育控制的啟動子的例T^括tt^在特定組織,例如葉、根或種子中啟動轉(zhuǎn)錄的啟動子。這樣的啟動子稱為"組織優(yōu)選的"。僅存在于特定組織中的啟動轉(zhuǎn)錄的啟動子被稱為"組織特異的"。"細胞類型"特異的啟動子主要驅(qū)動在一個或多個器官中的特定細胞類型內(nèi)的表達,例如,根或葉中的維管細胞。"可誘導的"或"可抑制的"啟動子是處于環(huán)境控制下的啟動子。通過可誘導的啟動子可以影響轉(zhuǎn)錄的環(huán)境狀態(tài)的例子包括缺氧狀態(tài)、或特定化學品、或光的存在。組織特異的、組織1,的、細胞類型特異的和可誘導的啟動子組成了"非基本"啟動子。"基本"啟動子是在大多數(shù)瞎況下都具有活性的啟動子。在這里使用的"反義方向"包括指在反義鏈被轉(zhuǎn)錄的方向可操作的連接到啟動子的核酸序列。反義鏈與內(nèi)生的轉(zhuǎn)錄產(chǎn)物充分的互補,因此內(nèi)生轉(zhuǎn)錄產(chǎn)物的轉(zhuǎn)譯通常被抑制。在這里使用的"可操作i&i接"指兩個或多個核酸片段在一個單獨的核酸碎片上關(guān)聯(lián)以致其中一個的功能受到另一個的影響。例如,當啟動子能夠影響編碼序列的表達時,它就是可操作的連接到編碼序列(即,編碼序列處于啟動子的轉(zhuǎn)錄控制下)。編碼序列可以在正義或反義方向被可操作i也連接到調(diào)控序"共有序歹U"指一個人工的、保存由同源基因編碼的蛋白質(zhì)部分的氨基酸序列,例如,通過CLUSTALW對比測定的同源蛋白質(zhì)氨基,列。同源基因是編碼與第二基因編碼的蛋白質(zhì)具有相同或類似生物功能的蛋白質(zhì)的基因。同源基因可以由物種形成的事件(見直系同源)或由基因復制的事件(見旁系同源)產(chǎn)生。"直系同源(o池olog)"指不同物禾中中iiil物種形成來自于共同祖先基因的一組同源基因。正常地,在進化的過程中直系同源保持相同的功能;"旁系同源(paralog)"指在相同的物禾中中作為遺傳復制的結(jié)果相互之間分化了的一組同源基因。因此,同源基因可以來自于相同或不同的生物體。在這里j頓的"同源體"意思是與第二蛋白質(zhì)一樣執(zhí)行相同生物功能的蛋白質(zhì),所述第二蛋白質(zhì)包括那些ffl51序列同一性調(diào)查確認的蛋白質(zhì)。百分比同一性指兩個最優(yōu)定位的DNA或蛋白質(zhì)片段的全部組分對比窗的不變程度,例如,核苷,列或氨基,列。用于測試序列和參考序列的對比片段的"同一性部分"是相同組分的數(shù)值,該數(shù)值是用全部測試序歹蜮全部參考序列較小的對比窗上的兩個對比片辦列的相同組分的數(shù)目除以參考片段序歹齟分的總數(shù)得到的。"百分比同一性"("%同一性")是同一性部分乘100。"氨基酸共有序歹啲%同一性"是100倍的在測試蛋白質(zhì)氨基,列最優(yōu)定位到本發(fā)明的氨基酸共有序列上的對比窗中的同一性部分。"擬南芥"意指植物Arabidopsisthaliana。"Pfam"指覆蓋許多常用蛋白質(zhì)家族的多重序歹鵬例和隱藏的Markov模型的大的集合,例如Pfam18.0版(2005年8月)包含7973個蛋白質(zhì)家族的排列和模型并基于Swissprot47.0和SP-TREMBL30.0蛋白質(zhì)序列麵庫。見S.R.Eddy,"ProfileHiddenMaikovModels",Bioinfoimatics14:755-763,1998。Pfam目前由PfamConsortium維護和更新。序列對比表現(xiàn)出進化下保存的蘊涵蛋白質(zhì)功能的一些結(jié)構(gòu)。構(gòu)建自Pfam序列對比的輪廓隱馬爾可夫模型(profileHMMs)用于自動識別新的蛋白質(zhì)屬于己經(jīng)存在的蛋白質(zhì)家族,即使序列對比的同源性較低。一旦一個DNA被確認為在轉(zhuǎn)基因植物內(nèi)表達時編碼一^合予增強性狀的蛋白質(zhì),其他相同蛋白質(zhì)家族的DNA編碼的蛋白質(zhì)被M:隱馬爾可夫模型查詢候選DNA編碼的蛋白質(zhì)的氨基,列來確認,所述的馬爾可夫過程使用HMMER軟件(HMMER軟件)表現(xiàn)Pfam域的特征,其目前的版本被提供于附加的計算機目錄中。滿足用于特定Pfam對比的聚集界限的Mi^蛋白是一個蛋白質(zhì)家族,并具有關(guān)聯(lián)DNA,所述關(guān)聯(lián)DNA對構(gòu)造用于本發(fā)明植物細胞的重組DNA是有用的。供HMMER軟件在識別DNA表達的蛋白質(zhì)中使用的隱馬爾可夫模型庫也被包括在計算機附錄中,所述識別DNA表達的蛋白質(zhì)是在用于本發(fā)明植物細胞中的重組DNA的常規(guī)Pfam中進行的。HMMER軟件和Pfam庫是18.0版,并用于識別蛋白質(zhì)內(nèi)的已知域,所述蛋白質(zhì)相應于氨基IW列SEQIDNO:426至SEQIDNO:850。所有i!31在這里公開的Pfam分tH十分高于公開于表17中的聚集界限的DNA編碼的蛋白質(zhì),可以用于本發(fā)明植物細胞的重組DNA,例如用于選擇具有增強農(nóng)業(yè)性狀的轉(zhuǎn)基因植物。用于本發(fā)明的相關(guān)Pfams,如下具體公開的是Mito_cair,6PGD,UB兀iPGM—N,WD40,Fer4,Enolase_C,DUF1639,PBP,PLAC8,Acyl-CoA—dh—1,異淀粉酶—N,Acyl-CoA一dh一2,PC4,Sugar—tr,UOiEnolase一N,HATPase—c,PRA-PIiPkinase,SBP56,PEP曙utilizers,SIS,PCI,DUF1644,Terpene_synth,Acyl-CoA—dh—IviAcyl-CoA_dh_N,Glutaminase,Lectin—legB,Dehydrii^MafE,Anl^2-Hacid一dh一C,Chal—sti—syntC,DUFl070,ATP-grasp—2,Argjnase,HABP4—PAI-RBPI,ABC2_membrane,DUF1723,Glyco—hydro—1^MFS—1,ARD,PDT,HMA^Pro—isomerase,Feiric一reduct^PRA-OiAajrans,ACT,LisH^PGM一P畫一n,Spermine—synth,zf-MYND,LRRNT—2,Ribul—P一3一epim^PGM一P固IV,NPH3,DapB—C,TPR—1,TPR—2,FAE1一CUT1—Rpp入K—trans,F-box^Cyclin_C,ADK,NUDKNIR一SRPEPCK—ATP,IaDapB_N,MtN3—slv,FMO國like,TEVI^FKBP—C,PMEI,Peptidase—C12,Cyclin—N,DUF568,Methyltransf—TIM—n,Methyltransf—12,DUF1677,DnaJ_C,BRAP2,IF2—N,Caiboxyl—trans,mTERF,Glyoxalase,TMEM14,Mo,Beta—elim一lyase,Pyr—redox—diii\Glyco—transf—8,Mcastrii^Flavodoxin—1,Epimerase,PTP夂Lipase—3,Pyr一redox一2,GSHPx^ELM2,PGI,Aminotran—1—2,ABC—1r叫GRP,PGKOleosin,Sulfotransfer一l,EXS,DUFl325,AMP-binding,Arrn^NTP一transferase,LSM^MetaJloenzyme,Molybdop一Fe4S4,MFAPl—C,Aminotran—3,PHD,B56,DUF588,PSI_PsaF,zf-CCOiHEAT,PALP,FH2,SapB_l,Ammonium—transp,MannoseP一isomer,NOP5NT,S邵B—2,Pyr—redox,Pollen—allerg—1,Asp,DUF662,F(xiàn)HA^YjeF—N,COX5C,GTP—EFTU—D2,Ion—trans—2,PK^DUF231,F(xiàn)AD—binding—1,HrQ,FAD_binding—4,FAD—binding6,FAD—binding—8,CBS,Smr,aPHC,DUF241,Brix,Ras,Acetyltransf一l,NAF,SPXNa_Ca—e&C2,p450,PP2C,組蛋白,2-Hacid—dh^SBF,CCT,BCNT,PK—C,Mro,PfkB,ACP—synin_C,Sterol一desatADH—zinc—N,CS,Cys—Met—MetaPP,Lactamase一B,Bromodomain^CDI,Linker—組蛋白,DAO,Dicty—C風Aldo一ket一re(izf-AM,Methyltransf一6,DUFl005,LEA—2,NIR—SIR—feir,DUF260,Oxidored—FMN,DUF26,Lectin一C,Pec一lyase一C"Nop,TB2—DP1一HVA22,ADH一N,YGGT,NAPRTase,NAD—bindingl,DUF914,PGM—PMM—^NAD—binding—2,AICARFTJMPCHas,Auxinjnducible,NAD—binding—6,Anti-silence,RuBisCO一large,Response—reg,FeThRed一A^Dil9,SNARE,PGM一P鹿一m,Molydop—binding,efhan4zf畫CCHC,GTPEFTU,ARID,adhshortyFibriUarin,RuBisCO—large—N,WWE,AA_permease,PABP,OMPdecase,RRM一l,U陽bc^OPT,TBC,MGS,DUF786,3Beta一HSD,zf-UBP,zf隱A20,DPBB—1,GDPD,PI孔C-X,SEP,PI孔C-Y,NOSIC,Glycolytic,SET,ADK—M,Alpha-am麵,EBl,PGAH17Abhydrolase一l,Glyco一hydro—14,Lung—7-TM一艮Abhydrolase一3,TCTP,GATase—2,Gln國synt一C,20G-FelI一Oxy,Pribosyltr叫MF,CoAtrans,RCC1,Pkinase—Tyr,MP,DnaJ,HSCB—C,Trehalose一PPase,LRR1,Cupin—2,LRR—2,Glyco—hydro—28,Yipl,Tip一syntA^Sedlin一N,SGS,Alded^CK一n一bet^zf-C3HC4,G戰(zhàn)PB1,旨DPiCarb一kinase,PmAMolybdopterii^Nodulin-like,Tirnl7,Xan—ur_permease,Hist—deacetyl,RNA_pol—Rpb8,AgenetMyb一DNA-bindmg,Glyoxal—oxidN,Ribophorin一I,和FAE—3-kCoA—synl。重組DNA構(gòu)建體本發(fā)明提供重組DNA構(gòu)建體,包括一個或多個這里公開的核酸,用于在合并入植物細胞核時給予轉(zhuǎn)基因植物一個或多個改良的性狀。所述的構(gòu)建體還典型的包括可操作的連接到所述核酸上的啟動子,以保證在植物細胞內(nèi)的表達。其他構(gòu)建體組分還可以包括附加的調(diào)節(jié)元素,例如5'或3'非轉(zhuǎn)譯區(qū)域(例如多腺苷酸化位點)、內(nèi)含子區(qū)域和傳輸肽或信號肽。,重組DNA構(gòu)建體可以使用本領(lǐng)域普通技術(shù)人員已知的方法裝配。在一個,實施方案中,在重組DNA構(gòu)建體中本發(fā)明的核酸可操作地連接到可在植物體內(nèi)發(fā)揮作用的啟動子上,以保證核酸在正義方向的表達,因此得到期望的蛋白質(zhì)或蛋白質(zhì)多肽片段。還提供了實施方案,其中核酸可操作的連接至脂g在植物內(nèi)發(fā)揮作用的啟動子,以保證基因抑制RNA的表達來抑制內(nèi)生蛋白的水平。按照本發(fā)明制備的重組構(gòu)建體艦常包括一個3'非翻譯DNA區(qū)(UTR),所述3'非翻譯DNA區(qū)緊隨核酸編碼區(qū)并典型的包含一個多腺苷酸化序列。有用的3'UTRs例子包括來自于根瘤土壤桿菌(Agrobacteriumtumefaciens)的胭月鎮(zhèn)酸合麟因(nos)、編碼核酮糖-l,5-二磷酸羧化酶小亞基基歐rbcS)和根瘤土壤桿菌的T7轉(zhuǎn)錄物。構(gòu)建體和載體還可以包括一個轉(zhuǎn)運織酸,用于把基因靶導向植物細胞器,特別是導向葉綠體、無色體或其他的質(zhì)粒細胞器。為了描述葉綠,ii^氨酸的4OT,請參見美國專利5,188,642和美國專利號5,728,925,在此引^f乍為參考。表1提供了一列用于重組DNA的基因,所述重組DNA被用于模型植物以發(fā)現(xiàn)相關(guān)的改良性狀,并可以與同源體一起定義氨基酸共有序列,所述氨基酸共有序列用于表征供本發(fā)明的核使用的重組DNA。i!51下^t標題的描述能更方便理解表l:"NUCSEQIDNO"指在序列表中特定DNA序列SEQIDNO.編號。"PEPSEQIDNO"指游列表中與特定DNA關(guān)聯(lián)的蛋白質(zhì)氨基,列的SEQIDNO.編號。"構(gòu)建體ID"指用于標志包括特定DNA的特定重組DNA構(gòu)造的任意數(shù)字。"基因ID"指用于標志特定DNA的任意名稱。"定向"指在重組DNA構(gòu)建體中相對于啟動子特定DNA的方向。表l<table>tableseeoriginaldocumentpage19</column></row><table><table>tableseeoriginaldocumentpage20</column></row><table><table>tableseeoriginaldocumentpage21</column></row><table><table>tableseeoriginaldocumentpage22</column></row><table><table>tableseeoriginaldocumentpage23</column></row><table><table>tableseeoriginaldocumentpage24</column></row><table><table>tableseeoriginaldocumentpage25</column></row><table><table>tableseeoriginaldocumentpage26</column></row><table>重組DNA在發(fā)明中用于在植物中改善性狀的DNA具有核苷酸序列SEQIDNO:1至SEQIDNO:425,及上述DNA分子的同源體。用于本發(fā)明基因抑制方面的DNA的子集包括由具有21個或更多連續(xù)核苷酸的低聚核苷酸組成的全部公開的核酸的片段。低聚核苷酸大^T具有選自SEQIDNO:1至SEQIDNO:425中的序列,這些序列可用作探針和引物檢觀體發(fā)明中使用的核酸。還可在本發(fā)明中用作DNA的變異體。,變異體可以是自然發(fā)生的,包括來自源于相同或不同物種的同源基因的DNA,或可以是非自然變體,例如4頓化學合成方法合成的、或使用重組DNA方法產(chǎn)生的DNA。遺傳編碼的退化提供了用不同M替代蛋白質(zhì)編碼序列基因的至少一個堿基而不導致基因產(chǎn)生的多肽的氨基酸序列改變的可能性。因此,對本發(fā)明有用的DNA可以具有任何il^序列,所述^^序列己經(jīng)按照Jt傳編碼的退化方式對這里提供的序列進行了替換改變。這里公開的證明在模型植物中對改善性狀有用的、提供DNA的基因同源體通常與這里公開的DNA具有顯著的同一性。當核,列被最優(yōu)對比時如果在比較窗上有約60%核酸相同,則DNA基本上與參考DNA相同;更優(yōu)選70%相同*,更優(yōu)選80%相同;更優(yōu)選85%相同;更優(yōu)選90%相同;更優(yōu)選95%相同;禾口/或更雌98%或99%相同。比較窗ifc^M少50—100個核苷酸,更雌的是這里提供核酸的全部長度。用于對比比較窗的序列的最優(yōu)對比可以通過算法建立;優(yōu)選通過計算機執(zhí)行這些算纟去(例如,WisconsinGeneticsSoftwarePackageRelease7.0-10.0GeneticsComputerGroup,575ScienceDr.,Madison,WI)。參考核酸可以是一個全長的分子離長舒的一部分。雌的,用于測定蛋白編碼序列的核酸同一性的比較窗是全部編碼區(qū)域。可用于給予改良性狀的蛋白質(zhì)是完全的蛋白或至少足夠部分的完全蛋白以給予蛋白質(zhì)相關(guān)的生物活性。蛋白質(zhì)可用于產(chǎn)生具有改良性狀的轉(zhuǎn)基因植物,包括具有這里提供的氨基,列的蛋白質(zhì),所述氨基,列如SEQIDNO:426至SEQIDNO:850,以及上述蛋白質(zhì)的同源體。可用于本發(fā)明的蛋白質(zhì)的同源體^I過比較蛋白質(zhì)的氨基酸序歹U與相同或不同植物來源的蛋白質(zhì)的氨基,列來鑒別的,例如,通過手工的過使用已知的同源基礎(chǔ)的檢索算法,例如通常已知并被稱為BLAST、FASTA和Smith-Watemian。這里使用的同源體是一個與其比較的多肽具有相同生物功能的來自相同或不同有機體的蛋白質(zhì)。在兩個有機體之間的直系同源關(guān)系不必表示為兩個基因之間的一一對應關(guān)系,因為在有機體系統(tǒng)發(fā)育分離時,例如物種形成,一個基因可以被復制或刪除。對于一個給定的蛋白質(zhì),這里可能沒有直系同源物或有多于一個直系同源物。其他更復雜的因素包括從相同基因的可選擇的拼接轉(zhuǎn)錄、限制基因的識別、相同基因具有不同序列長度或校正序歹啲多份副本。一個局部序列對比程序,例如,BLAST,可用于搜索序列娜庫以查找糊以序27列,并用于測量序歹贓對目似性的大概期望值(E-值)。當一個蛋白質(zhì)f給針對特定有機體的最好E值時,其不必超系同源物或唯一直系同源物,一個交互的BLAST檢索被用于本發(fā)明來篩自于直系同源物的識別具有顯著E值的符合的序列。交互的BLAST必然伴有對來自基礎(chǔ)有機體的氨基酸庫的顯著符合物的檢索,所述顯著符合物與查詢蛋白質(zhì)的序列對以。當交互的BLAST的最佳符合物是查詢蛋白質(zhì)本身或由物種形成后的復制基因編碼的蛋白質(zhì)時,符合物很可能是直系同源物。因此,在這里使用的同源體用來描述根據(jù)序列基本類似推理假定具有類似功能的蛋白質(zhì)。具有氨基,列SEQIDNO:851到SEQIDNO:33634的同源體與具有氨基,列SEQIDNO:426到SEQIDNO:850的蛋白質(zhì)的關(guān)系te:在表2的列表中。其他功能性的同源體蛋白質(zhì)與在這里公開的性狀改良蛋白質(zhì)具有一個或多個不同的氨基酸,這是由于一個或多個眾所周知的保守氨基酸替換的結(jié)果,例如,纈氨酸對丙氨酸的保守替換和蘇氨酸對絲氨酸的保守替換。在自然序列內(nèi)部的氨基酸保守性替換可以選自屬于天然產(chǎn)生的氨基酸類的其他成員。,在這些不同種類內(nèi)的有代表性的氨基酸包括但不限于(1)酸性(帶負電的)氨基酸例如天門冬氨酸和谷氨酸;(2)堿性(帶正電的)氨基酸例如精氨酸、組氮酸和賴氨酸;(3)中性的極性的氨基酸例如甘氨酸、絲氮酸、蘇氨酸、半胱氨酸、酪氨酸、天門冬醐安和谷氨酰胺;和(4)中性的非極性的(i^7K性)氨基酸例如丙氨酸、白氨酸、異亮氨酸、纈氨酸、脯氨酸、苯基丙氨酸、色氨酸和甲硫氨酸。在天然氨基酸序列內(nèi)部的氨基酸的保守替換可以選自屬于天然產(chǎn)生的氨基酸組的其他成員。例如,具剤旨肪族側(cè)鏈的氨基酸的組是甘氨酸、丙氨酸、纈氨酸、白氨酸和異亮氨酸;具有脂肪族羥基側(cè)鏈的氨基酸的組是絲氨酸和蘇氨酸;具有含有,安側(cè)鏈的氨基酸的組是天門冬翻安和谷氨醐安;具有芳香族側(cè)鏈的氨基酸的組是苯基丙氨酸、酪氨酸和色氨酸;具有堿性側(cè)鏈的氨基酸的組是賴氨酸、精氨酸和組氨酸;和具有含硫的側(cè)鏈的氨基酸的組是半胱氨酸和甲硫氮酸。自然的保守氨基酸替換組是纈氨酸-白氨酸、纈氨酸-異亮氨酸、苯基丙氨酸-酪氨酸、賴氮酸-精氨酸、丙氨^"纈氨酸、天門冬氨酸-谷氨酸和天門冬,安-谷氨翻安。本發(fā)明的另一個方面包括與所述蛋白質(zhì)序列具有一個或多個不同的氨基酸的蛋白質(zhì),這是由于在天然序列中一個或多個氨基酸的冊鵬或插入的結(jié)果。這里公開的性狀改良的蛋白質(zhì)同源體通常顯示顯著的序列同一性。特定目地的蛋白質(zhì)具有至少50%序歹胴一性,更^^少大約70%序列同一性或更高,例如,與氨基酸序列SEQEDNO:426到SEQIDNO:850具有至少大約80%序列同一性。當然有用的蛋白質(zhì)還可以包括具有更高同一性的序列,例如,90%到99%同一性。蛋白質(zhì)同源體的同一性的鑒別是通,優(yōu)對比推定蛋白質(zhì)同源體的氨基酸序列與確定的氨基酸序列,并計算同一性百分比和在比較窗上保守替換的氨基酸。用于測定同一性的比較窗可以是這里公開的全部氨基,列,例如,SEQIDNO:426至SEQIDNO:850中任意的全部序列。相互同源的基因可以被分組為家族,并包括多重序列對比。隨后可以推導出^群組的共有序列。這個分析使育嫩對保守的和具有重要功能的特定類(家族)的殘基或基序進行推導。如果可以的話,這些保守的殘基和基序可以進一步使用三維蛋白質(zhì)結(jié)構(gòu)驗證。共有序列可以被用于定義本發(fā)明的全部范圍,例如,用同源體關(guān)系去識別蛋白質(zhì)。因此,本發(fā)明考慮的是蛋白質(zhì)同源體,所說蛋白質(zhì)同源體包括與上述氨基酸M序列相比具有至少90%同一性氨基列的蛋白質(zhì)。啟動子在文獻中已經(jīng)描述了許多在植物細胞中有活性的啟動子。其包括存在于植物基因組中的啟動子以及其他來源的啟動子,包括攜帶在根癌土壤桿菌(Agrobacteriumtumefaciens)瘤誘導質(zhì)粒上胭月蔬酸合II(NOS)啟動子和章魚堿合歐OCS)啟動子,花椰菜花葉病毒組(caulimovirus)啟動子例如花椰菜花葉病毒(cauliflowermosaicvirus)或玄參花葉病毒(Figwortmosaicvirus)啟動子。例如,見公開了來源于花禍隊花葉病寧CaMV35S)的基本啟動子模型的美國專利5,858,742和5,322,938,公開了玄參花葉病^(FMV)35S啟動子的美國專利5,378,619,公開了玉米(maize)RS81啟動子的美國專利6,437,217,公開了稻肌動蛋白(riceactin)啟動子的美國專利5,641,876,公開了玉米RS324啟動子的齡專利6,426,446,公開了玉米PR-I啟動子的美國專利6,429,362,公開了玉米A3啟動子的美國專利6,232,526,公開了基本玉米啟動子的美國專利6,177,611,公開了玉米L3油質(zhì)蛋白(L3oleosin)啟動子的美國專利6,433,252,公開了稻L3肌動蛋白2啟動子和內(nèi)含子的美國專利6,429,357,公開了根特定啟動子的美國專利5,837,848,公開了冷可誘導啟動子的美國專利6,084,089,公開29了光可誘導啟動子的美國專利6^294,714,公開了鹽可誘導啟動子的美國專利6,140,078,公開了病原體可誘導啟動子的美國專利6,252,138,公開了缺磷病可誘導啟動子的美國專利6,175,060,公開了可用于有效的植物表達載體設(shè)計的5'、3'和內(nèi)含子元素的美國專利申請發(fā)明者B·S·戈德曼,B·達沃,E·斯拉藤,F·切爾夫,F·謝克,M·S·阿巴德,M·科芬,M·麥唐納,R·C·里奇,R·阿布拉申請人:孟山都技術(shù)有限公司