專利名稱:在單子葉植物中調(diào)控表達(dá)的表達(dá)盒的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及表達(dá)盒,包括至少一個(gè)可從如下單子葉植物基因中獲得的轉(zhuǎn)錄調(diào)控核苷酸序列咖啡酰-CoA-O-甲基轉(zhuǎn)移酶基因、C8,7-固醇異構(gòu)酶基因、富含羥脯氨酸的糖蛋白(HRGP)基因、乳酸脫氫酶基因以及葉綠體蛋白12樣基因。更優(yōu)選轉(zhuǎn)錄調(diào)控序列可從玉米(Zea mays)或稻(Oryza sativa)中獲得。所述轉(zhuǎn)錄調(diào)控序列對(duì)于根/仁偏好性表達(dá)、 葉/胚乳偏好性表達(dá)、根/穗絲/仁偏好性表達(dá)或者組成型表達(dá)尤其有用。
背景技術(shù):
操作植物以改變和/或改善表型特征(如生產(chǎn)力或品質(zhì))需要在植物組織中表達(dá)異源基因。這類基因操作依賴于用于驅(qū)動(dòng)和控制所需基因表達(dá)的方法的可用性。例如,基因操作依賴于在植物中有效并在轉(zhuǎn)基因植物中調(diào)控基因表達(dá)以產(chǎn)生期望效果的適當(dāng)啟動(dòng)子的可用性和使用。在需要在植物發(fā)育的所有(或大部分)時(shí)間在所有(或大部分)組織中表達(dá)的情況下優(yōu)選組成型啟動(dòng)子。在單子葉植物中有功能的組成型啟動(dòng)子的數(shù)量是有限的,并且包括稻肌動(dòng)蛋白 1 (Wang 1992 ;US 5,641,876)、CaMV35S(Odell 1985)、CaMV 19S(Lawton 1987)和玉米遍在蛋白啟動(dòng)子(Christensen 1996)。盡管以序列描述了雙子葉植物的幾種組成型和組織特異性啟動(dòng)子(例如,歐芹的咖啡酰-CoA-O-甲基轉(zhuǎn)移酶基因(Grimmig 1997)、楊樹(Chen 1998)和松樹(Li 1999)的啟動(dòng)子),但是在異源基因表達(dá)方面,僅表征了非常有限的啟動(dòng)子。與雙子葉啟動(dòng)子相比,單子葉植物的啟動(dòng)子仍然非常有限。最好可以選擇多種不同啟動(dòng)子,以便可以選擇對(duì)特定基因、構(gòu)建體、細(xì)胞、組織、植物或環(huán)境最適宜的啟動(dòng)子。此外,隨著對(duì)用多重植物轉(zhuǎn)錄單位(PTU)共轉(zhuǎn)化植物日益增長(zhǎng)的興趣,以及與用于這些目的的共有調(diào)控序列的使用有關(guān)的潛在問(wèn)題,我們應(yīng)該獲得多種啟動(dòng)子序列。根優(yōu)選的或根特異性的啟動(dòng)子有益于改變根組織的功能、改良生長(zhǎng)速度、改進(jìn)對(duì)根偏好性病原體、害蟲、除草劑或不利天氣條件的抗性,有益于土壤解毒以及擴(kuò)大植物可生長(zhǎng)的土壤或環(huán)境的范圍。根豐富的或根特異性基因表達(dá)將提供一種機(jī)制,據(jù)此可改變形態(tài)學(xué)和代謝,以改善產(chǎn)量并生產(chǎn)更大量的有用蛋白質(zhì)。特別是,根特異性啟動(dòng)子可有益于表達(dá)防御相關(guān)基因,包括賦予昆蟲抗性和脅迫耐性的那些基因,例如,鹽、寒冷或干旱耐性,以及用于改變養(yǎng)分?jǐn)z取的基因。在單子葉植物中有功能的根偏好性和根特異性啟動(dòng)子的數(shù)量非常有限。這些包括玉米MR7啟動(dòng)子(美國(guó)專利No. 5,837,848)、玉米ZRP2啟動(dòng)子(美國(guó)專利No. 5,633,363)和玉米MTL啟動(dòng)子(美國(guó)專利No. 5,466,785和6,018,099)。這些實(shí)例中的許多公開了表達(dá)模式限于有限數(shù)量根組織的啟動(dòng)子。其他的不能提供所選基因表達(dá)所需的根特異性。最好可以選擇多種不同的啟動(dòng)子,以便可選擇對(duì)特定基因、構(gòu)建體、細(xì)胞、組織、植物或環(huán)境最適宜的啟動(dòng)子。此外,隨著對(duì)用多重植物轉(zhuǎn)錄單位(PTU)共轉(zhuǎn)化植物日益
5增長(zhǎng)的興趣,以及與用于這些目的的共有調(diào)控序列的使用有關(guān)的潛在問(wèn)題,我們應(yīng)該獲得多種啟動(dòng)子序列。因此,本領(lǐng)域技術(shù)中非常需要鑒定新的序列,其可用于在經(jīng)濟(jì)上最重要的單子葉植物,尤其是在稻和玉米中表達(dá)所選的轉(zhuǎn)基因。因此本發(fā)明的目的是提供用于在單子葉植物中表達(dá)轉(zhuǎn)基因的新的和可選擇的表達(dá)盒,更優(yōu)選借此調(diào)節(jié)表達(dá)的組織特異性。附圖的簡(jiǎn)短說(shuō)明
圖10s. CCoAMTI啟動(dòng)子玉米遍在蛋白內(nèi)含子GUS(PIV2) CCoAMT 1終止子嵌合構(gòu)建體(PBPSMM325)圖。該質(zhì)粒包含表達(dá)構(gòu)建體,所述表達(dá)構(gòu)建體含有有效連接于玉米遍在蛋白內(nèi)含子的 Os. CCoAMTI啟動(dòng)子、β葡糖醛酸糖苷酶基因(⑶S,包括馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子)以及Os.CCoAMTl的非翻譯區(qū)和轉(zhuǎn)錄終止區(qū)。SM盒代表選擇標(biāo)記(ahas)盒。圖2玉米中受稻(Os)CCoAMTI啟動(dòng)子構(gòu)建體(pBPSMM325)控制的⑶S表達(dá)。上面一組(I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區(qū)域覆蓋的清楚地被染成藍(lán)色的區(qū)域。(A)葉+根5葉期⑶葉開花期(C)仁(授粉前)(D)仁授粉后 30 天(30DAP)照片代表15個(gè)T1單拷貝株系的可重復(fù)表達(dá)模式。圖3A :0s. CCoAMTI啟動(dòng)子玉米遍在蛋白內(nèi)含子⑶S(PIV2) NOS終止子融合構(gòu)建體(PBPSMM271)圖。該質(zhì)粒包含表達(dá)構(gòu)建體,所述表達(dá)構(gòu)建體含有有效連接于玉米遍在蛋白內(nèi)含子的 Os. CCoAMTI啟動(dòng)子、β葡糖醛酸糖苷酶基因(⑶S,包括馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子)以及胭脂堿合酶(N0Q終止子。SM盒代表選擇標(biāo)記(ahas)盒。B 玉米中受(os) CCoAMTI啟動(dòng)子構(gòu)建體(pBPSMM271)控制的GUS表達(dá)。上面一組 (I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區(qū)域覆蓋的清楚地被染成藍(lán)色的區(qū)域。(A)葉和根5葉期⑶葉開花期(C)仁(授粉后 30 天30DAP)照片代表15個(gè)T1單拷貝株系的可重復(fù)表達(dá)模式。圖4A :0s. Si:玉米遍在蛋白內(nèi)含子⑶S(PIV2) :N0S終止子融合構(gòu)建體 (pBPSMM331)圖。該質(zhì)粒包含表達(dá)構(gòu)建體,所述表達(dá)構(gòu)建體含有有效連接于玉米遍在蛋白內(nèi)含子的 Os. SI啟動(dòng)子、β葡糖醛酸糖苷酶基因(GUS,包括馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子)以及NOS 終止子的表達(dá)構(gòu)建體。SM盒代表選擇標(biāo)記盒。B 玉米中受Os. SI啟動(dòng)子構(gòu)建體(pBPSMM331)控制的⑶S表達(dá)。上面一組(I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區(qū)域覆蓋的清楚地被染成藍(lán)色的區(qū)域。
(A)葉和根5葉期(B)葉5葉期;葉開花期(C)仁(授粉后 30 天30DAP)照片代表15個(gè)T1單拷貝株系的可重復(fù)表達(dá)模式。圖5A =Zm. HRGP玉米遍在蛋白內(nèi)含子GUS (PIV2) :Zm. HRGP終止子融合構(gòu)建體(pBPSET003)圖。該質(zhì)粒包含表達(dá)構(gòu)建體,所述表達(dá)構(gòu)建體含有有效連接于玉米遍在蛋白內(nèi)含子的 Sii. HRGP啟動(dòng)子、β葡糖醛酸糖苷酶基因(GUS,包括馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子)以及 HRGP終止子。SM盒代表選擇標(biāo)記(ahas)盒。B 玉米中受玉米Sn. HRGP啟動(dòng)子構(gòu)建體(pBPSET003)控制的⑶S表達(dá)。上面一組 (I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區(qū)域覆蓋的清楚地被染成藍(lán)色的區(qū)域。(A)葉和根5葉期(B)葉5葉期;葉開花期(C)仁(授粉后 30 天30DAP)照片代表15個(gè)T1單拷貝株系的可重復(fù)表達(dá)模式。圖6A :Zm. LDH:玉米遍在蛋白內(nèi)含子⑶S(PIV2) :N0S終止子融合構(gòu)建體 (pBPSMM272)圖。該質(zhì)粒包含表達(dá)構(gòu)建體,所述表達(dá)構(gòu)建體含有有效連接于玉米遍在蛋白內(nèi)含子的 Sii. LDH啟動(dòng)子、β葡糖醛酸糖苷酶基因(GUS,包括馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子)以及NOS 終止子。SM盒代表選擇標(biāo)記(ahas)盒。B 玉米中受玉米Sn. LDH啟動(dòng)子構(gòu)建體(pBPSMM272)控制的⑶S表達(dá)。上面一組 (I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區(qū)域覆蓋的清楚地被染成藍(lán)色的區(qū)域。含有PBPSMM272或pBPSET007的轉(zhuǎn)基因植物顯示出同樣的表達(dá)模式。(A)葉和根5葉期(B)葉5葉期;葉開花期(C)仁(授粉后 30 天30DAP)照片代表8個(gè)T1單拷貝株系的可重復(fù)表達(dá)模式。圖7A =Zm. LDH:玉米遍在蛋白內(nèi)含子⑶S(PIV2) :Zm. LDH終止子融合構(gòu)建體 (pBPSET007)圖。該質(zhì)粒包含表達(dá)構(gòu)建體,所述表達(dá)構(gòu)建體含有有效連接于玉米遍在蛋白內(nèi)含子的 Sii. LDH啟動(dòng)子、β葡糖醛酸糖苷酶基因(GUS,包括馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子)以及LDH 終止子。SM盒代表選擇標(biāo)記(ahas)盒。B 玉米中受玉米Zm. LDH啟動(dòng)子構(gòu)建體(pBPSET007)控制的GUS表達(dá)。上面一組 (I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區(qū)域覆蓋的清楚地被染成藍(lán)色的區(qū)域。(A)葉和根5葉期(B)葉開花期(C)仁(授粉后 30 天30DAP)
7
照片代表15個(gè)T1單拷貝株系的可重復(fù)表達(dá)模式。圖8A :0s. CP12:玉米遍在蛋白內(nèi)含子⑶S(PIV2) :N0S終止子融合構(gòu)建體 (pBPSMM304)圖。該質(zhì)粒包含表達(dá)構(gòu)建體,所述表達(dá)構(gòu)建體含有有效連接于玉米遍在蛋白內(nèi)含子的 0S.CP12啟動(dòng)子、β葡糖醛酸糖苷酶基因(⑶S,包括馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子)以及NOS 終止子。SM盒代表選擇標(biāo)記盒。B 玉米中受玉米Os. CP12啟動(dòng)子構(gòu)建體(pBPSMM304)控制的GUS表達(dá)。上面一組 (I)代表用GUS染色的原始照片,而下面的一組(II)表示被陰影區(qū)域覆蓋的清楚地被染成藍(lán)色的區(qū)域。(A)葉和根5葉期(B)葉開花期(C)仁(授粉后 30 天30DAP)照片代表15個(gè)T1單拷貝株系的可重復(fù)表達(dá)模式。圖9干旱脅迫誘導(dǎo)的玉米中Sii. LDH啟動(dòng)子構(gòu)建體(pBPSMM272)的表達(dá)。將5葉期轉(zhuǎn)基因植物通過(guò)停止供水進(jìn)行干旱脅迫。在所示的時(shí)間點(diǎn)從葉上采集樣品。從葉樣品中分離RNA,并以定量RT-PCR進(jìn)行分析。將GUS表達(dá)對(duì)每個(gè)樣品中的內(nèi)對(duì)照基因進(jìn)行標(biāo)準(zhǔn)化。 將結(jié)果表示為與0時(shí)間點(diǎn)相比表達(dá)水平增加的倍數(shù),其中將0時(shí)間點(diǎn)的表達(dá)設(shè)定為1。圖10A-B稻乳酸脫氫酶(LDH)蛋白與玉米(1)、稻(2)、大麥(3)、稻(4)、擬南芥 (Arabidopsis) (5、6)、番茄(7)、馬鈴薯(8)LDH蛋白的蛋白質(zhì)序列比對(duì)。區(qū)分單子葉LDH蛋白和其他雙子葉LDH蛋白的序列基序加框表示(用“ + ”標(biāo)記相應(yīng)的不同氨基酸)。本領(lǐng)域技術(shù)人員基于本序列比對(duì)可以很容易地鑒定更多的這類序列基序。圖11稻C8,7固醇異構(gòu)酶(Si)蛋白與擬南芥(1-3)和稻(4)SI蛋白的蛋白質(zhì)序列比對(duì)。圖12稻咖啡酰-CoA-O-甲基轉(zhuǎn)移酶1 (CCoAMTl)與煙草(1)、桉樹⑵、楊樹(3)、 玉米G、5、6)和稻(7) CCoAMTl蛋白的蛋白質(zhì)序列比對(duì)。區(qū)分單子葉CCoAMT蛋白和其他雙子葉CCoAMT蛋白的序列基序加框表示(用“ + ” 標(biāo)記相應(yīng)的不同氨基酸)。本領(lǐng)域技術(shù)人員基于本序列比對(duì)可以很容易地鑒定更多的這類序列基序。發(fā)明_既述因此,本發(fā)明的第一個(gè)實(shí)施方案涉及用于在單子葉植物中調(diào)控表達(dá)的表達(dá)盒,包括i)至少一個(gè)單子葉植物基因的轉(zhuǎn)錄調(diào)控核苷酸序列,所述的單子葉植物基因選自咖啡酰-CoA-O-甲基轉(zhuǎn)移酶基因、C8,7-固醇異構(gòu)酶基因、富含羥脯氨酸的糖蛋白(HRGP)基因、乳酸脫氫酶基因以及葉綠體蛋白12樣基因,和與之功能性相連的ii)至少一個(gè)核苷酸序列,其與所述轉(zhuǎn)錄調(diào)控序列是異源的。優(yōu)選轉(zhuǎn)錄調(diào)控核苷酸序列可從多肽編碼基因的單子葉植物基因組DNA中獲得,其中所述多肽
al)包含單子葉植物乳酸脫氫酶蛋白的至少一個(gè)序列基序,所述序列基序選自如下氨基酸序列i)SLSELGFDA(SEQIDNO:76),
ii)VIGAGNVGMA(SEQIDNO:77),
iii)IVTAGARQI(SEQIDNO:78),
iv)L(F/Y)RKIVP(SEQIDNO:79),
ν)GFPASRV(SEQIDNO:80),
Vi)RF(L/I)AEHL(SEQIDNO:81),
vii)QAYMVGEH(SEQIDNO:82),
viii)ALEGIRRAV(SEQIDNO:83), ^P
ix)GYSVAS(L/I)A(SEQIDNO:84),或者bl)編碼單子葉植物乳酸脫氫酶蛋白,與選自SEQ ID NO :26、60和65所述的多肽具有至少90%的氨基酸序列同一性,或者a2)包含單子葉植物咖啡酰-CoA-O-甲基轉(zhuǎn)移酶蛋白的至少一個(gè)序列基序,所述序列基序選自如下氨基酸序列x) EQKTRHSE(SEQIDNO:85),
xi) L (I/L)KLIGAK(SEQIDNO:86),
xii) KTMEIGVY(SEQIDNO:87),
xiii)HERL(L/M)KLV(SEQIDNO:88),
xiv) CQLPV⑶G(SEQIDNO:89), ^P
xv) TLCRRVK(SEQIDNO:90),或者b2)編碼單子葉植物咖啡酰-CoA-O-甲基轉(zhuǎn)移酶蛋白,與選自SEQ IDNO :5和70所述的多肽具有至少90%的氨基酸序列同一性,或者b3)編碼單子葉植物富含羥脯氨酸的糖蛋白,與選自SEQ ID N0:18和75所述的多肽具有至少90%的氨基酸序列同一性,或者b4)編碼單子葉植物C8,7-固醇異構(gòu)酶蛋白,與SEQ ID NO 10所述的多肽具有至少90 %的氨基酸序列同一性,或者b5)編碼單子葉植物葉綠體蛋白12樣蛋白,與SEQ ID NO 31所述的多肽具有至少90%的氨基酸序列同一性。優(yōu)選轉(zhuǎn)錄調(diào)控核苷酸序列來(lái)自玉米或稻植物。甚至更優(yōu)選轉(zhuǎn)錄調(diào)控核苷酸序列是選自稻咖啡酰-CoA-O-甲基轉(zhuǎn)移酶基因、稻C8,7-固醇異構(gòu)酶基因、玉米富含羥脯氨酸的糖蛋白(HRGP)基因、玉米乳酸脫氫酶基因、稻葉綠體蛋白12樣基因的植物基因及其功能等同物。優(yōu)選功能等同物編碼的多肽與選自SEQ ID NO :5、10、18、26、31、60、65、70和75所述多肽具有至少90%的氨基酸序列同一性。在更優(yōu)選的實(shí)施方案中,轉(zhuǎn)錄調(diào)控核苷酸序列選自如下序列i)由 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、 29、56、57、58、61、62、63、66、67、68、71、72 和 73 所述的序列,和
ii) i)中序列的至少50個(gè)連續(xù)堿基的片段;和iii)與 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、 觀、29、56、57、58、61、62、63、66、67、68、71、72或73所述轉(zhuǎn)錄調(diào)控核苷酸序列基本上相似的
核苷酸序列(優(yōu)選具有至少60%的序列同一性;更優(yōu)選通過(guò)BLASTN程序以如下默認(rèn)參數(shù)測(cè)量字長(zhǎng)(W)為11、期望值(E)為10、截?cái)酁?00、M= 5、N = -4,并進(jìn)行兩條鏈的比較); 和iV)能與 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、 觀、29、56、57、58、61、62、63、66、67、68、71、72或73所述的轉(zhuǎn)錄調(diào)控核苷酸序列或其互補(bǔ)物
雜交的核苷酸序列;和ν)能與如下核酸雜交的核苷酸序列,其中所述核酸包含SEQ ID NO :1、2、3、6、7、8、 11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72 或73所述的轉(zhuǎn)錄調(diào)控核苷酸序列或其互補(bǔ)物的50-200個(gè)或更多連續(xù)核苷酸(優(yōu)選在 % 十二燒基硫酸鈉(SDS)、0· 5Μ NaPO4UmM EDTA 中于 50°C雜交,用 2X SSC、0. 1 % SDS 于 50°C 洗滌;更優(yōu)選在十二烷基硫酸鈉(SDS)、0. 5MNaP04、lmM EDTA中于50°C雜交,用1 X SSC、 0. SDS于50°C洗滌,還更優(yōu)選在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于 50°C雜交,用0. 5XSSC、0. 1% SDS于50°C洗滌,甚至更優(yōu)選在7%十二烷基硫酸鈉(SDS)、 0. 5M NaPO4UmM EDTA 中于 50°C雜交,用 0. 1 XSSC、0. 1 % SDS 于 50°C洗滌,最優(yōu)選在 7% 十二燒基硫酸鈉(SDS)、0· 5M NaPO4UmM EDTA 中于 50°C雜交,用 0. 1 XSSC、0. 1 % SDS 于 65°C洗滌);和vi)上述i)至ν)核苷酸序列中任一的互補(bǔ)物或反向互補(bǔ)物核苷酸序列。另一優(yōu)選的實(shí)施方案涉及用于在單子葉植物中調(diào)控表達(dá)的表達(dá)盒,其包括a)至少一個(gè)在單子葉植物中有功能的轉(zhuǎn)錄調(diào)控核苷酸序列,其包含選自如下序列的至少一個(gè)序列i)SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、 56、57、58、61、62、63、66、67、68、71、72 和 73 所述的序列,和ii) i)中序列的至少50個(gè)連續(xù)堿基的片段;和iii)與 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、 觀、29、56、57、58、61、62、63、66、67、68、71、72或73所述轉(zhuǎn)錄調(diào)控核苷酸序列基本上相似的
核苷酸序列(優(yōu)選具有至少60%的序列同一性;更優(yōu)選通過(guò)BLASTN程序以如下默認(rèn)參數(shù)測(cè)量字長(zhǎng)(W)為11、期望值(E)為10、截?cái)酁?00、M= 5、N = -4,并進(jìn)行兩條鏈的比較); 和iν)能與 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、 觀、29、56、57、58、61、62、63、66、67、68、71、72或73所述的轉(zhuǎn)錄調(diào)控核苷酸序列或其互補(bǔ)物雜交的核苷酸序列(優(yōu)選在十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用2XSSC、0. SDS于50°C洗滌;更優(yōu)選在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4, ImM EDTA中于50°C雜交,用1XSSC、0. SDS于50°C洗滌,還更優(yōu)選在7%十二烷基硫酸鈉(SDS) ,0. 5M 妝卩04、1111]\^01六中于501雜交,用0.5\55(、0.1%503于501洗滌,甚至更優(yōu)選在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用0. 1XSSC、0. 1% SDS于50°C洗滌,最優(yōu)選在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用 0. 1 X SSC、0. 1 % SDS T 65°c洗滌);禾口ν)能與如下核酸雜交的核苷酸序列,其中所述核酸包含SEQ ID NO :1、2、3、6、7、8、 11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72 或73所述的轉(zhuǎn)錄調(diào)控核苷酸序列或其互補(bǔ)物的50-200個(gè)或更多連續(xù)核苷酸;和Vi)上述i)至ν)核苷酸序列中任一的互補(bǔ)物或反向互補(bǔ)物核苷酸序列,禾口b)至少一個(gè)核苷酸序列,其與所述轉(zhuǎn)錄調(diào)控序列是異源的。優(yōu)選上段中ii)、iii)、iv)、ν)和vi)中定義的序列能夠在單子葉植物細(xì)胞或生物體中修飾轉(zhuǎn)錄。更優(yōu)選ii)、iii)、iv)、ν)和vi)中定義的所述序列與SEQID NO :1、2、 3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、 68、71、72或73所述的轉(zhuǎn)錄調(diào)控核苷酸序列基本上具有相同的轉(zhuǎn)錄調(diào)控活性。還優(yōu)選上述iii)中定義的序列與 SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、 16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、66、67、68、71、72 或 73 所述序列具有至少60 %、優(yōu)選70 %或80 %、更優(yōu)選90 %或95 %的序列同一性,其中同一性優(yōu)選通過(guò) BLASTN程序以如下默認(rèn)參數(shù)測(cè)量字長(zhǎng)(W)為11、期望值(E)為10、截?cái)酁?00、M = 5、N =_4,并進(jìn)行兩條鏈的比較。更優(yōu)選上述iv)或ν)中定義的序列在嚴(yán)謹(jǐn)條件下,優(yōu)選在中等嚴(yán)謹(jǐn)條件下,最優(yōu)選在高嚴(yán)謹(jǐn)條件下(如在十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交, 用0. 1 X SSC、0. 1 % SDS于65°C洗滌)與指定的靶序列雜交。在本發(fā)明表達(dá)盒的一個(gè)優(yōu)選的實(shí)施方案中,核酸序列的表達(dá)導(dǎo)致蛋白質(zhì)的表達(dá), 或者反義RNA、正義或雙鏈RNA的表達(dá)。本發(fā)明表達(dá)盒的表達(dá)譜可依靠轉(zhuǎn)錄調(diào)控核苷酸序列與增強(qiáng)表達(dá)的內(nèi)含子和/或轉(zhuǎn)錄終止序列的結(jié)合進(jìn)行調(diào)控。在本發(fā)明表達(dá)盒的優(yōu)選實(shí)施方案中,這包括至少一種選自如下的額外元件a) 5’非翻譯區(qū),和b)內(nèi)含子編碼序列,和c)轉(zhuǎn)錄終止序列。內(nèi)含子編碼序列優(yōu)選編碼單子葉植物的表達(dá)增強(qiáng)內(nèi)含子。更優(yōu)選內(nèi)含子序列是遍在蛋白、肌動(dòng)蛋白或醇脫氫酶基因的內(nèi)含子。優(yōu)選將內(nèi)含子插入到表達(dá)構(gòu)建體中欲表達(dá)核酸序列的5’非翻譯區(qū)(即,位于轉(zhuǎn)錄調(diào)控核苷酸序列與蛋白質(zhì)編碼序列(開放讀框)或欲表達(dá)核酸序列之間)。優(yōu)選5’非翻譯區(qū)來(lái)自與轉(zhuǎn)錄調(diào)控序列相同的基因。轉(zhuǎn)錄終止序列優(yōu)選也包括誘導(dǎo)多聚腺苷化作用的序列。轉(zhuǎn)錄終止序列可以異源于轉(zhuǎn)錄調(diào)控核苷酸序列和/或待表達(dá)核酸序列,但也可以是所述轉(zhuǎn)錄調(diào)控核苷酸序列和/或所述待表達(dá)的核酸序列基因的天然轉(zhuǎn)錄調(diào)控核苷酸序列。在本發(fā)明一個(gè)優(yōu)選的實(shí)施方案中,轉(zhuǎn)錄調(diào)控核苷酸序列是轉(zhuǎn)錄調(diào)控序列基因的天然轉(zhuǎn)錄調(diào)控核苷酸序列。優(yōu)選轉(zhuǎn)錄終止序列選自SEQ IDNO 32,34和35所述的序列。本發(fā)明的轉(zhuǎn)錄調(diào)控序列尤其可用于單子葉植物中組成型或根/仁偏好性表達(dá)或根/仁特異性表達(dá)。然而不排除在其他植物(例如,雙子葉或裸子植物)和其他組織中的應(yīng)用。已經(jīng)證明,本發(fā)明的轉(zhuǎn)錄調(diào)控序列的組織特異性能夠最好通過(guò)結(jié)合內(nèi)含子和/或轉(zhuǎn)錄終止序列進(jìn)行調(diào)控。表達(dá)盒可用于多種表達(dá)目的,例如用于蛋白質(zhì)的表達(dá),或者反義RNA、正義或雙鏈 RNA的表達(dá)。優(yōu)選核酸序列的表達(dá)賦予植物農(nóng)藝學(xué)上有價(jià)值的性狀。本發(fā)明有些轉(zhuǎn)錄調(diào)控序列甚至如所述的那樣是新的(即,如所分離的核苷酸序列)。因此,本發(fā)明的另一個(gè)實(shí)施方案涉及分離的核苷酸序列,其包含至少一個(gè)如SEQ ID NO :6、7、8、11、12、13、19、20或21所述的轉(zhuǎn)錄調(diào)控核苷酸序列。本發(fā)明的其他實(shí)施方案涉及含有本發(fā)明表達(dá)盒的載體,以及含有本發(fā)明表達(dá)盒或載體的轉(zhuǎn)基因宿主細(xì)胞或非人生物。優(yōu)選生物是植物,更優(yōu)選是單子葉植物,最優(yōu)選選自玉米、禾§、小麥(Triticum aestivum)、大麥(Hordeum vulgare)禾口燕麥(Avena sativa)。本發(fā)明的另一個(gè)實(shí)施方案涉及用于在單子葉植物中鑒定和/或分離轉(zhuǎn)錄調(diào)控核苷酸序列的方法,其特征在于所述鑒定和/或分離利用如SEQ IDN0:5、10、18、26、31、60、 65,70或75所述氨基酸序列的編碼核酸序列,或者至少15個(gè)堿基的所述核酸序列的部分。 優(yōu)選所使用的核酸序列為SEQ ID NO :4、9、17、25、30、59、64、69或74,或者至少15個(gè)堿基的所述核酸序列的部分。優(yōu)選所述鑒定和/或分離通過(guò)選自聚合酶鏈?zhǔn)椒磻?yīng)、雜交和數(shù)據(jù)庫(kù)篩選的方法實(shí)現(xiàn)。本發(fā)明的另一個(gè)實(shí)施方案涉及提供用于在單子葉植物中進(jìn)行異源表達(dá)的轉(zhuǎn)基因表達(dá)盒的方法,包括步驟I.利用至少一個(gè)核酸序列或其部分從單子葉植物中分離轉(zhuǎn)錄調(diào)控核苷酸序列,其中所述序列編碼SEQ ID NO :5、10、18、洸、31、60、65、70或75所述的多肽,或者至少15個(gè)堿基的所述核酸序列的部分,和II.將所述轉(zhuǎn)錄調(diào)控核苷酸序列功能性連接于其他目的核苷酸序列,后者與所述轉(zhuǎn)錄調(diào)控核苷酸序列異源。對(duì)于上述兩類方法,優(yōu)選分離所述轉(zhuǎn)錄調(diào)控核苷酸序列所采用的核苷酸序列編碼這樣的多肽,所述多肽包含al)單子葉植物乳酸脫氫酶蛋白的至少一個(gè)序列基序,其中序列基序選自如下氨基酸序列i)SLSELGFDA(SEQ ID NO76),
ii)VIGAGNVGMA(SEQ ID NO77),
iii)IVTAGARQI(SEQIDNO:78),
iv)L(F/Y)RKIVP(SEQIDNO:79),
ν)GFPASRV(SEQIDNO:80),
Vi)RF (L/1)AEHL(SEQIDNO:81),
vii)QAYMVGEH(SEQIDNO:82),
viii)ALEGIRRAV(SEQIDNO:83), ^P
ix)GYSVAS (L/Dk (SEQIDNO:84),
或者 a2)單子葉植物咖啡酰-CoA-O-甲基轉(zhuǎn)移酶蛋白的至少一個(gè)序列基序,其中序列基序選自如下氨基酸序列
χ)EQKTRHSE(SEQ ID NO85),
Xi)L(I/L)KLIGAK(SEQ ID NO86),
xii)KTMEIGVY(SEQ ID NO87),
xiii)HERL(L/M)KLV(SEQ ID NO88),
xiv)CQLPVGDG(SEQ ID NO:8 ,和
XV)TLCRRVK(SEQ ID NO90)。
定義
應(yīng)當(dāng)理解的是,本發(fā)明不限于所述的特定方法、方案、細(xì)胞系、植物物種或?qū)?、?gòu)建
體以及試劑身。也應(yīng)當(dāng)理解的是,這里所使用的術(shù)語(yǔ)僅用于描述特定實(shí)施方案的目的,而非旨在限制本發(fā)明的范圍,后者將僅通過(guò)所附的權(quán)利要求書進(jìn)行限定。必須注意到,如文中和所附權(quán)利要求書中所使用的,單數(shù)形式的“一個(gè)”、“一種”和“該”包括復(fù)數(shù),除非上下文清楚地另行指示。因此,例如,提及“載體”時(shí)是指一種或多種載體,包括本領(lǐng)域技術(shù)人員已知的其等同物,等等。文中所使用的術(shù)語(yǔ)“約”是指近似地、粗略地、左右或附近。當(dāng)術(shù)語(yǔ)“約”與數(shù)值范圍一起使用時(shí),其通過(guò)擴(kuò)展所示數(shù)值的上下邊界而修飾該范圍。通常,文中所使用的術(shù)語(yǔ) “約”以所示值上下20%的方差、優(yōu)選上下(高低)10%的方差修飾數(shù)值范圍。如這里所使用的,措辭“或”是指特定列單中的任何一個(gè)成員,也包括該列單中成員的任意組合。術(shù)語(yǔ)“基因”廣泛地指與生物功能有關(guān)的任何核酸節(jié)斷。因此,基因包括編碼序列和/或它們表達(dá)必需的調(diào)控序列。例如,基因指表達(dá)mRNA或功能性RNA,或者編碼特定蛋白質(zhì)的核酸片段,并且包括調(diào)控序列。基因也包括非表達(dá)的DNA節(jié)斷,例如,構(gòu)成其他蛋白質(zhì)的識(shí)別序列?;蚩蓮亩喾N來(lái)源獲得,包括從目的來(lái)源中克隆,或者根據(jù)已知的或預(yù)測(cè)的序列信息合成,并且可包括設(shè)計(jì)用于具有期望參數(shù)的序列。術(shù)語(yǔ)“內(nèi)含子”指基因內(nèi)的DNA區(qū)段(間插序列),其不編碼基因所產(chǎn)生的蛋白質(zhì)的部分,并且在從細(xì)胞核中輸出前,其在從基因中轉(zhuǎn)錄的mRNA中被剪接掉。內(nèi)含子序列指內(nèi)含子的核酸序列。因此,內(nèi)含子是DNA序列中那些隨編碼序列(外顯子)一起被轉(zhuǎn)錄, 但是在成熟mRNA的形成期間被除去的區(qū)域。內(nèi)含子可位于實(shí)際的編碼區(qū)內(nèi)或者位于前 mRNA(未剪接的mRNA)的5’或3’非翻譯前導(dǎo)區(qū)。將初級(jí)轉(zhuǎn)錄物中的內(nèi)含子切除,并將編碼序列同時(shí)精確地連接起來(lái),從而形成成熟mRNA。內(nèi)含子和外顯子的接點(diǎn)形成剪接位點(diǎn)。 內(nèi)含子的序列以GU開始并以AG結(jié)束。此外,在植物中,已經(jīng)描述了兩例AU-AC內(nèi)含子擬南芥(Arabidopsis thaliana)的RecA-樣蛋白基因的內(nèi)含子14和G5基因的內(nèi)含子7是 AU-AC內(nèi)含子,含有內(nèi)含子的前mRNA具有三個(gè)短序列,除了其他序列之外,這三個(gè)短序列是內(nèi)含子準(zhǔn)確剪接必需的。這些序列是5’剪接位點(diǎn)、3’剪接位點(diǎn)和分支點(diǎn)。mRNA剪接是除去初級(jí)mRNA轉(zhuǎn)錄物中存在的間插序列(內(nèi)含子)并結(jié)合或連接外顯子序列。這也被稱作順式剪接,其在除去間插序列(內(nèi)含子)的同一 RNA上連接兩個(gè)外顯子。內(nèi)含子的功能元件包括被剪接體的特異性蛋白組分識(shí)別并結(jié)合的序列(例如,內(nèi)含子末端的剪接共有序列)。 功能性元件與剪接體的相互作用導(dǎo)致從未成熟的mRNA中除去內(nèi)含子序列并將外顯子序列重新連接。內(nèi)含子具有三個(gè)短序列,是內(nèi)含子被準(zhǔn)確剪接所必要的,但并非充分條件。這些序列是5’剪接位點(diǎn)、3’剪接位點(diǎn)和分支點(diǎn)。分支點(diǎn)序列在植物的剪接和剪接位點(diǎn)選擇中很重要。分支點(diǎn)序列通常位于3’剪接位點(diǎn)上游10-60核苷酸處。植物序列就分支點(diǎn)而言顯示出序列偏差,共有序列是CURAY或YURAY。術(shù)語(yǔ)“天然的”或“野生型”基因指未轉(zhuǎn)化細(xì)胞的基因組中存在的基因,S卩,沒有已知突變的細(xì)胞?!皹?biāo)記基因”編碼可選擇的或可篩選的性狀。術(shù)語(yǔ)“嵌合基因”指任何基因,其包括1)DNA序列,包括并非在自然界中連在一起的調(diào)控和編碼序列,或者2)編碼非天然毗鄰的蛋白質(zhì)部分的序列,或者3)非天然毗鄰的啟動(dòng)子部分。因此,嵌合基因可包括源自不同來(lái)源的調(diào)控序列和編碼序列,或者包括源自同一來(lái)源的調(diào)控序列和編碼序列,但是以不同于天然發(fā)現(xiàn)的方式排列?!稗D(zhuǎn)基因”指已通過(guò)轉(zhuǎn)化引入到基因組內(nèi)并穩(wěn)定維持的基因。轉(zhuǎn)基因可包括,例如, 與待轉(zhuǎn)化的特定植物的基因異源或同源的基因。另外,轉(zhuǎn)基因可包括插2到非天然生物體內(nèi)的天然基因,或者嵌合基因。術(shù)語(yǔ)“內(nèi)源基因”指生物體基因組中其天然位置中的天然基因?!巴庠础被蛑竿ǔN丛谒拗魃矬w中發(fā)現(xiàn),但通過(guò)基因轉(zhuǎn)移被引入的基因。與本發(fā)明的核苷酸序列對(duì)應(yīng)的“寡核苷酸”,例如用于探測(cè)或擴(kuò)增反應(yīng),長(zhǎng)度可以是約30個(gè)或更少核苷酸(例如,9、12、15、18、20、21或?qū)Γ蛘呤?-30的任意數(shù))。通常, 特異性引物長(zhǎng)度超過(guò)14個(gè)核苷酸。對(duì)于最適特異性和成本效率來(lái)說(shuō),長(zhǎng)度為16-M個(gè)核苷酸的引物可能是優(yōu)選的。本領(lǐng)域技術(shù)人員通曉用于如PCR方法的引物設(shè)計(jì)。如果必需的話,可用這里所公開的基因的整套限制性片段進(jìn)行探測(cè),其長(zhǎng)度可以是100個(gè)或者甚至是 1,000個(gè)核苷酸。術(shù)語(yǔ)“蛋白質(zhì)”、“肽”和“多肽”這里可互換使用??蓪⒈景l(fā)明的核苷酸序列引入到任何植物中??稍诒磉_(dá)盒中方便地使用待引入的基因,用于任何目的植物中的引入和表達(dá)。這類表達(dá)盒將包括與目的核苷酸序列相連的本發(fā)明的轉(zhuǎn)錄起始區(qū)。優(yōu)選的啟動(dòng)子包括組成型、組織特異性、發(fā)育特異性、誘導(dǎo)型和/或病毒啟動(dòng)子。提供具有多個(gè)限制性位點(diǎn)的這類表達(dá)盒,用于將目的基因插入到調(diào)控區(qū)的轉(zhuǎn)錄調(diào)控下。表達(dá)盒可另外含有可選擇的標(biāo)記基因。該盒在5' -3'轉(zhuǎn)錄方向上將包括在植物中有功能的轉(zhuǎn)錄和翻譯起始區(qū)、目的DNA序列,以及轉(zhuǎn)錄和翻譯終止區(qū)。終止區(qū)可以是轉(zhuǎn)錄起始區(qū)的天然終止區(qū),可以是目的DNA序列的天然終止區(qū),或者可以來(lái)自其他來(lái)源。合適的終止區(qū)可從根癌農(nóng)桿菌(Agrobacterium tumefaciens)的Ti-質(zhì)粒中獲得,如,章魚堿合酶和胭脂堿合酶終止區(qū)(也見,Guerineau 1991 ;Proudfoot 1991 ;Sanfacon 1991 ;Mogen 1990 ;Munroe1990 ;Ballas 1989 Joshi 1987)?!熬幋a序列”指編碼特定氨基酸序列并排除非編碼序列的DNA或RNA序列。其可構(gòu)成“不間斷的編碼序列”,即,缺乏內(nèi)含子,如在cDNA中,或者其可包括由適當(dāng)?shù)募艚咏狱c(diǎn)為界限的一個(gè)或多個(gè)內(nèi)含子?!皟?nèi)含子”是RNA序列,初級(jí)轉(zhuǎn)錄物中含有該序列,但是在細(xì)胞內(nèi)通過(guò)RNA的裂解和再連接被除去以產(chǎn)生可被翻譯成蛋白質(zhì)的成熟mRNA。術(shù)語(yǔ)“開放讀框”和“0RF”指編碼序列的翻譯起始和終止密碼子之間所編碼的氨基酸序列。術(shù)語(yǔ)“起始密碼子”和“終止密碼子”指編碼序列中三個(gè)相鄰核苷酸單位(“密碼子”),其分別規(guī)定蛋白質(zhì)合成(mRNA翻譯)的起始和鏈終止。
“功能性RNA”指反義RNA、雙鏈RNA、核糖核酸酶,或不被翻譯的其他RNA。術(shù)語(yǔ)“RNA轉(zhuǎn)錄物”指由RNA聚合酶催化DNA序列的轉(zhuǎn)錄所產(chǎn)生的產(chǎn)物。當(dāng)RNA轉(zhuǎn)錄物是DNA序列的完全互補(bǔ)拷貝時(shí),其被稱作初級(jí)轉(zhuǎn)錄物,或者其可以是源于初級(jí)轉(zhuǎn)錄物的轉(zhuǎn)錄后加工的RNA序列并被稱作成熟RNA?!靶攀筊NA”(mRNA)指無(wú)內(nèi)含子并且可被細(xì)胞翻譯成蛋白質(zhì)的RNA?!癱DNA”指與mRNA互補(bǔ)并源于其的單鏈或雙鏈DNA?!稗D(zhuǎn)錄調(diào)控核苷酸序列”、“調(diào)控序列”,和“適當(dāng)?shù)恼{(diào)控序列”,每個(gè)都指影響轉(zhuǎn)錄、 RNA加工或穩(wěn)定性、或者相關(guān)(或功能性相連的)待轉(zhuǎn)錄核苷酸序列的翻譯的核苷酸序列。 相對(duì)于待轉(zhuǎn)錄的核苷酸序列,轉(zhuǎn)錄調(diào)控核苷酸序列的定位可有多處。轉(zhuǎn)錄調(diào)控核苷酸序列可位于待轉(zhuǎn)錄序列(例如,編碼序列)的上游(5'非編碼序列),之內(nèi)或下游(3‘非編碼序列)。轉(zhuǎn)錄調(diào)控序列可選自增強(qiáng)子、啟動(dòng)子、翻譯前導(dǎo)序列、內(nèi)含子、5'非翻譯序列、3'非翻譯序列以及多聚腺苷酸化信號(hào)序列。它們包括天然的和合成的序列,可以是合成的和天然序列的組合。如上所述,術(shù)語(yǔ)“轉(zhuǎn)錄調(diào)控序列”不限于啟動(dòng)子。然而,優(yōu)選本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列包括至少一個(gè)啟動(dòng)子序列(例如,位于基因的轉(zhuǎn)錄起點(diǎn)上游,能誘導(dǎo)下游序列的轉(zhuǎn)錄的序列)。在本發(fā)明的一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列包括相應(yīng)基因的啟動(dòng)子序列,任選且優(yōu)選所述基因的天然5'非翻譯區(qū)。此外,也可使用所述基因的;V非翻譯區(qū)和/或多聚腺苷酸化區(qū)。“5'非編碼序列”指位于編碼序列5'(上游)的核苷酸序列。其位于經(jīng)過(guò)充分加工的mRNA的起始密碼子的上游,并且可以影響初級(jí)轉(zhuǎn)錄物加工成mRNA、影響mRNA穩(wěn)定性或翻譯效率(Turner 1995)?!?'非編碼序列”指位于編碼序列3'(下游)的核苷酸序列,并且包括多聚腺苷酸化信號(hào)序列和編碼能影響mRNA加工或基因表達(dá)的調(diào)控信號(hào)的其他序列。通常,多聚腺苷酸化信號(hào)的特征是影響向mRNA前體的3'末端添加多聚腺苷酸束。Ingelbrecht等,1989 舉例說(shuō)明了不同3'非編碼序列的用途。術(shù)語(yǔ)“翻譯前導(dǎo)序列”指基因的啟動(dòng)子和編碼序列之間的DNA序列部分,其轉(zhuǎn)錄成 RNA并且位于經(jīng)過(guò)充分加工的mRNA的轉(zhuǎn)錄起始密碼子的上游(5')。翻譯前導(dǎo)序列可影響初級(jí)轉(zhuǎn)錄物加工成mRNA、影響mRNA穩(wěn)定性或翻譯效率?!靶盘?hào)肽”指多肽的氨基末端延伸,其與多肽一起翻譯,形成前體肽,并且對(duì)于其進(jìn)入分泌途徑是必需的。術(shù)語(yǔ)“信號(hào)序列”指編碼信號(hào)肽的核苷酸序列。如這里所使用的術(shù)語(yǔ)“轉(zhuǎn)運(yùn)肽”指所表達(dá)的多肽的一部分(優(yōu)選指多肽的氨基末端延伸),其與多肽一起翻譯, 形成前體肽,并且對(duì)于其進(jìn)入細(xì)胞器是必需的(如質(zhì)體(例如,葉綠體)或線粒體)。術(shù)語(yǔ) “轉(zhuǎn)運(yùn)序列”指編碼轉(zhuǎn)運(yùn)肽的核苷酸序列?!皢?dòng)子”指通常位于編碼序列上游(5')的核苷酸序列,通過(guò)提供對(duì)正確轉(zhuǎn)錄所必需的RNA聚合酶和其他因子的識(shí)別,控制編碼序列的表達(dá)?!皢?dòng)子”包括短DNA序列的最小啟動(dòng)子,其由TATA盒和用于指定轉(zhuǎn)錄起始位點(diǎn)的其他序列構(gòu)成,向其添加調(diào)控元件用于表達(dá)的控制。“啟動(dòng)子”也指包括最小啟動(dòng)子加上能用于控制編碼序列或功能性RNA表達(dá)的調(diào)控元件的核苷酸序列。該類型的啟動(dòng)子序列由近側(cè)和更遠(yuǎn)側(cè)的上游元件構(gòu)成,后者通常稱作增強(qiáng)子。因此,“增強(qiáng)子”是這樣的DNA序列,其可刺激啟動(dòng)子活性,并且可以是啟動(dòng)子的先天元件或者是插入的異源元件,以增強(qiáng)啟動(dòng)子的水平或組織特異性。其在兩個(gè)方向上都能發(fā)揮功能(正常的或翻轉(zhuǎn)的),并且甚至當(dāng)移動(dòng)到啟動(dòng)子的上游或下游時(shí)仍然有功
15能。增強(qiáng)子和其他上游啟動(dòng)子元件都與介導(dǎo)其效應(yīng)的序列特異性的DNA結(jié)合蛋白結(jié)合。啟動(dòng)子可整體源自天然基因,或者由不同元件構(gòu)成,源自天然所發(fā)現(xiàn)的完全不同的啟動(dòng)子,或者甚至由合成的DNA片段構(gòu)成。啟動(dòng)子也可含有參與蛋白因子結(jié)合的DNA序列,其控制響應(yīng)生理或發(fā)育條件的轉(zhuǎn)錄起始的效率?!捌鹗嘉稽c(diǎn)”是圍繞第一核苷酸的位置,是所轉(zhuǎn)錄序列的一部分,其也被定義為位置+1。相對(duì)于此位點(diǎn)對(duì)基因的所有其他序列和其控制區(qū)進(jìn)行編號(hào)。將下游序列(即,3'方向上其余蛋白質(zhì)編碼序列)命名為正,而將上游序列(5'方向上控制區(qū)的大部分)命名為負(fù)。將啟動(dòng)子元件,特別是TATA元件,在缺乏上游激活時(shí)無(wú)活性或者啟動(dòng)子活性極度降低,稱作“最小或核心啟動(dòng)子”。在存在適當(dāng)?shù)霓D(zhuǎn)錄因子時(shí),最小啟動(dòng)子起允許轉(zhuǎn)錄的功能?!白钚』蚝诵膯?dòng)子”因此僅由轉(zhuǎn)錄起始所必需的所有基本元件構(gòu)成,即,TATA盒和/ 或起始子?!敖M成型表達(dá)”指使用組成型或可調(diào)型啟動(dòng)子的表達(dá)。“組織非依賴性的”、“組織通用的”或“組成型”旨在指大部分時(shí)間在整個(gè)植物的細(xì)胞中和在大部分組織中的表達(dá)。與歸為“組成型”的其他啟動(dòng)子(例如,遍在蛋白)一樣, 可以在不同組織或階段的絕對(duì)表達(dá)水平存在一些變動(dòng)。然而,組成型啟動(dòng)子通常在大多數(shù)組織中,優(yōu)選在所有組織中,以及在大多數(shù)發(fā)育階段,優(yōu)選在所有發(fā)育階段都高水平或中等水平表達(dá)?!坝袟l件的”和“可調(diào)的表達(dá)”指受可調(diào)型啟動(dòng)子控制的表達(dá)?!敖M成型啟動(dòng)子”指這樣的啟動(dòng)子,其能在植物的所有或幾乎所有發(fā)育階段期間在所有或幾乎所有植物組織中表達(dá)受其控制的開放讀框(ORF)。各轉(zhuǎn)錄激活元件都不顯示絕對(duì)的組織特異性,但在大多數(shù)植物部分中介導(dǎo)的轉(zhuǎn)錄激活水平至少為在轉(zhuǎn)錄最活躍的植物部分中所達(dá)水平的1%?!翱烧{(diào)型啟動(dòng)子”指指導(dǎo)基因非組成型表達(dá),而以時(shí)間和/或空間調(diào)控的方式表達(dá)的啟動(dòng)子,并且包括組織特異性和誘導(dǎo)型啟動(dòng)子。其包括天然的和合成序列,可以是合成的和天然序列的組合。不同啟動(dòng)子可在不同組織或細(xì)胞類型中,或在不同的發(fā)育階段,或者響應(yīng)不同的環(huán)境條件指導(dǎo)基因的表達(dá)。在植物細(xì)胞中有用的多種類型的新啟動(dòng)子不斷地被發(fā)現(xiàn),眾多實(shí)例可見于Okamuro等(1989)的匯編出版物。在植物中有用的典型的可調(diào)型啟動(dòng)子包括但不限于安全劑誘導(dǎo)型啟動(dòng)子、源于四環(huán)素誘導(dǎo)型系統(tǒng)的啟動(dòng)子、源于水楊酸誘導(dǎo)型系統(tǒng)的啟動(dòng)子、源于醇誘導(dǎo)型系統(tǒng)的啟動(dòng)子、源于糖皮質(zhì)激素誘導(dǎo)型系統(tǒng)的啟動(dòng)子、源于病原體誘導(dǎo)型系統(tǒng)的啟動(dòng)子,以及源于蛻皮激素誘導(dǎo)型系統(tǒng)的啟動(dòng)子?!敖M織特異性啟動(dòng)子”指不在所有植物細(xì)胞中表達(dá),而僅在特定器官(如葉或種子)、特定組織(如胚或子葉)中的一種或多種細(xì)胞類型中表達(dá)、或僅在特定細(xì)胞類型(如葉實(shí)質(zhì)或種子儲(chǔ)藏細(xì)胞)中表達(dá)的可調(diào)型啟動(dòng)子。這些也包括時(shí)間調(diào)控的啟動(dòng)子,如在早期或晚期胚發(fā)生中,在發(fā)育種子或果實(shí)的果實(shí)成熟期間,在完全分化的葉中,或者在衰老開始發(fā)生時(shí)。在本發(fā)明上下文中,術(shù)語(yǔ)“根”是指通常為地下的植物器官,其缺乏芽或葉或節(jié),吸收水分和礦物鹽,并通常將植物固定在地面。植物根由許多細(xì)胞類型構(gòu)成,如表皮細(xì)胞、根冠、軸柱、皮層、中柱鞘、維管細(xì)胞和形成根毛的生毛細(xì)胞,組織起來(lái)形成根組織或根區(qū),例如,根尖、根表皮、分生組織區(qū)、初生根、側(cè)根、根毛和維管組織。分離為根特異性或根偏好的轉(zhuǎn)錄調(diào)控序列可在一種或幾種這些細(xì)胞類型中調(diào)控表達(dá)。該細(xì)胞特異性活性可用于特異性應(yīng)用,如僅在分生細(xì)胞區(qū)中調(diào)控分生組織活性,或者僅在線蟲害蟲接觸的細(xì)胞類型中調(diào)控殺線蟲基因的表達(dá)。在本發(fā)明上下文中,就某組織或組織群(例如,根和仁)而言的術(shù)語(yǔ)“組織特異性轉(zhuǎn)錄”是指轉(zhuǎn)錄調(diào)控元件如此轉(zhuǎn)錄核酸序列,從而在整個(gè)植物中在其發(fā)育的任何一個(gè)階段期間,所述核酸序列在所述組織或組織群中的轉(zhuǎn)錄占由所述核酸序列轉(zhuǎn)錄的全部RNA量的 90%以上,優(yōu)選95%以上,更優(yōu)選99%以上。在本發(fā)明上下文中,就某組織或組織群(例如,根和仁)而言的術(shù)語(yǔ)“組織偏好的轉(zhuǎn)錄”是指轉(zhuǎn)錄調(diào)控元件如此轉(zhuǎn)錄核酸序列,從而在整個(gè)植物中在其發(fā)育的任何一個(gè)階段期間,所述核酸序列在所述組織或組織群中的轉(zhuǎn)錄占由所述核酸序列轉(zhuǎn)錄的全部RNA量的 50%以上,優(yōu)選70%以上,更優(yōu)選80%以上。“誘導(dǎo)型啟動(dòng)子”指可在一種或多種細(xì)胞類型中被外部刺激,例如化學(xué)品、光、激素、脅迫或病原體開啟的那些可調(diào)型啟動(dòng)子?!坝行нB接”指單鏈核酸片段上核酸序列的結(jié)合,使得一個(gè)核酸序列的功能受另一個(gè)核酸序列的影響。例如,如果調(diào)控DNA序列與編碼RNA或多肽的DNA序列的排布使得調(diào)控 DNA序列影響編碼DNA序列的表達(dá)(即,編碼序列或功能性RNA在啟動(dòng)子的轉(zhuǎn)錄控制下), 則調(diào)控DNA序列被表述為“有效連接于”或“連于”編碼RNA或多肽的DNA序列??蓪⒕幋a序列以正義或反義方向有效連接到調(diào)控序列上?!氨磉_(dá)”指植物中內(nèi)源基因、ORF或其部分、或者轉(zhuǎn)基因的轉(zhuǎn)錄和/或翻譯。例如, 在反義構(gòu)建體的情況中,表達(dá)可以僅指反義DNA的轉(zhuǎn)錄。另外,表達(dá)還指正義(mRNA)或功能性RNA的轉(zhuǎn)錄和穩(wěn)定累積。表達(dá)也可指蛋白質(zhì)的產(chǎn)生?!疤禺愋员磉_(dá)”是基因產(chǎn)物的表達(dá)限于一種或幾種植物組織(空間限制)和/或限于植物的一個(gè)或幾個(gè)發(fā)育階段(時(shí)間限制)。普遍認(rèn)為幾乎不存在真正的特異性啟動(dòng)子似乎優(yōu)選在一些組織中開啟,而在其他組織中可能不開啟或者僅有很小的活性。這種現(xiàn)象被稱作滲漏表達(dá)。然而,在本發(fā)明中特異性表達(dá)意味著在一個(gè)或幾個(gè)植物組織中的偏好表達(dá)。啟動(dòng)子的“表達(dá)模式”(有或無(wú)增強(qiáng)子)是表達(dá)水平的模式,其表明在植物中何處、 在哪個(gè)發(fā)育階段,轉(zhuǎn)錄由所述啟動(dòng)子引發(fā)。當(dāng)一個(gè)啟動(dòng)子的表達(dá)模式顯示與其他啟動(dòng)子的表達(dá)模式幾乎不重疊時(shí),將這組啟動(dòng)子的表達(dá)模式稱作是互補(bǔ)的??赏ㄟ^(guò)測(cè)量標(biāo)準(zhǔn)的轉(zhuǎn)錄報(bào)道分子mRNA的“穩(wěn)態(tài)”濃度,確定啟動(dòng)子的表達(dá)水平。這種測(cè)量是間接的,因?yàn)閳?bào)道分子 mRNA的濃度不僅依賴于其合成速率,而且也依賴于mRNA被降解的速率。因此,穩(wěn)態(tài)水平是合成速率和降解速率的乘積。然而,當(dāng)所轉(zhuǎn)錄的序列相同時(shí),降解速率可視為以固定速率進(jìn)行,因此這個(gè)值可作為合成速率的衡量值。當(dāng)以這種方式比較啟動(dòng)子時(shí),本領(lǐng)域技術(shù)人員可利用的技術(shù)是雜交 Sl-RNAse分析、Northern印跡和競(jìng)爭(zhēng)性RT-PCR。該技術(shù)列表決不代表所有可利用的技術(shù), 而僅僅是說(shuō)明分析轉(zhuǎn)錄活性和mRNA的表達(dá)水平的常用方法。在幾乎所有啟動(dòng)子中,轉(zhuǎn)錄起點(diǎn)的分析已經(jīng)顯示轉(zhuǎn)錄起點(diǎn)通常不是單個(gè)堿基,而是一組或多或少簇集的起始位點(diǎn),其中的每一個(gè)都是mRNA的某些起點(diǎn)。由于該分布隨著啟動(dòng)子不同而變化,因此群體各個(gè)體中報(bào)道分子mRNA的序列相互之間也將不同。由于每種mRNA物質(zhì)或多或少易于降解,因此不能預(yù)測(cè)不同報(bào)道分子mRNA的單個(gè)降解速度。對(duì)于多種真核啟動(dòng)子序列來(lái)說(shuō),已證明圍繞起始位點(diǎn)(起始子)的序列在決定由該特定啟動(dòng)子所指導(dǎo)的RNA表達(dá)水平中起著重要的作用。這也包括部分轉(zhuǎn)錄序列。因此啟動(dòng)子與報(bào)道序列的直接融合將導(dǎo)致轉(zhuǎn)錄的亞適度水平。通常所使用的用于分析表達(dá)模式和水平的方法是通過(guò)測(cè)定細(xì)胞中蛋白質(zhì)累積的 “穩(wěn)態(tài)”水平。對(duì)于報(bào)告基因來(lái)說(shuō),本領(lǐng)域技術(shù)人員已知的通常使用的候選物是葡糖醛酸糖苷酶(⑶幻、氯霉素乙酰轉(zhuǎn)移酶(CAT)和具有熒光特性的蛋白質(zhì),如Aequora victoria 的綠色熒光蛋白(GFP)。然而,原則上,更多蛋白質(zhì)適于這個(gè)目的,只要所述蛋白質(zhì)不干擾基本的植物功能。許多工具適合定量和測(cè)定定位。例如,可很容易地創(chuàng)建或者獲得基于免疫化學(xué)、酶促、熒光檢測(cè)和定量的檢測(cè)系統(tǒng)。可使用蛋白質(zhì)表達(dá)的原位分析測(cè)定植物組織提取物中或完整組織中的蛋白質(zhì)水平。通常,具有嵌合啟動(dòng)子報(bào)道構(gòu)建體的單個(gè)轉(zhuǎn)化系的報(bào)道基因的表達(dá)水平將不同。 也常常觀察到這類轉(zhuǎn)化體不表達(dá)任何可檢測(cè)產(chǎn)物(RNA或蛋白質(zhì))的現(xiàn)象。盡管通常不清楚這種失活的分子機(jī)制基礎(chǔ),但是表達(dá)的變異性通常歸咎于“位置效應(yīng)”?!斑^(guò)表達(dá)”指轉(zhuǎn)基因細(xì)胞或生物體中表達(dá)的水平超過(guò)正?;蛘呶崔D(zhuǎn)化(非轉(zhuǎn)基因) 細(xì)胞或生物體中的表達(dá)水平。“反義抑制”指反義RNA轉(zhuǎn)錄物的產(chǎn)生能抑制內(nèi)源性基因或轉(zhuǎn)基因的蛋白質(zhì)表達(dá)?!盎虺聊敝覆《净?、轉(zhuǎn)基因,或內(nèi)源性核基因的依賴同源性的抑制?;虺聊梢允寝D(zhuǎn)錄水平的,此時(shí)的抑制是由于受影響基因的轉(zhuǎn)錄降低,或者是轉(zhuǎn)錄后水平的,此時(shí)的抑制是由于與受影響的基因同源的RNA物質(zhì)的周轉(zhuǎn)(降解)增加(English 1996)?;虺聊ú《菊T導(dǎo)的基因沉默(Ruiz等1998)。術(shù)語(yǔ)“異源DNA序列”、“外源DNA片段”或“異源核酸”,如這里所使用的,每一個(gè)都指源于與特定宿主細(xì)胞異源來(lái)源的序列,或者如果來(lái)自同一來(lái)源,那么是從其原來(lái)形式中經(jīng)過(guò)修飾的。因此,宿主細(xì)胞中的異源基因包括是特定宿主細(xì)胞的內(nèi)源性基因,但是已經(jīng)通過(guò)例如使用DNA改組進(jìn)行過(guò)修飾。該術(shù)語(yǔ)也包括天然存在的DNA序列的非天然發(fā)生的多個(gè)拷貝。因此,該術(shù)語(yǔ)指外源的或與細(xì)胞異源,或者與細(xì)胞同源但是元件不在平常發(fā)現(xiàn)的宿主細(xì)胞核酸內(nèi)的位置上的DNA片段。表達(dá)外源DNA片段以生產(chǎn)外源多肽?!巴础盌NA序列是與其所引入的宿主細(xì)胞天然相關(guān)的DNA序列。在核苷酸序列同一性的上下文中,“同源”指兩核酸分子的核苷酸序列或者兩蛋白質(zhì)分子的氨基酸序列之間的相似性。通過(guò)本領(lǐng)域技術(shù)人員充分理解的在嚴(yán)謹(jǐn)條件下的 DNA-DNA 或 DNA-RNA 雜交(如在 Haines 和 Higgins (編輯),Nucleic Acid Hybridization, IRL Press, Oxford, U. K.所描述的),或者通過(guò)兩核酸或蛋白質(zhì)之間的序列相似性的比較提供這種同源性的評(píng)估。術(shù)語(yǔ)“基本上相似”指代表這里所具體公開的玉米或稻的轉(zhuǎn)錄調(diào)控序列的功能和 /或結(jié)構(gòu)等同物的核苷酸和氨基酸序列。在其最廣泛的意思中,當(dāng)談到核苷酸序列時(shí),這里所使用的術(shù)語(yǔ)“基本上相似的” 是指核苷酸序列是基因的一部分,其編碼與由參照核苷酸序列的基因所編碼的多肽具有基本上相同結(jié)構(gòu)和功能的多肽,例如,核苷酸序列包括是與參照核苷酸序列相應(yīng)基因的直向同源物的基因的啟動(dòng)子,以及在結(jié)構(gòu)上與這里所舉例說(shuō)明的啟動(dòng)子序列相關(guān)的啟動(dòng)子序列,g卩,基本上相似的啟動(dòng)子序列與這里所舉例說(shuō)明的啟動(dòng)子序列的互補(bǔ)物在高或極高嚴(yán)謹(jǐn)條件下雜交。例如,僅僅反映遺傳密碼的簡(jiǎn)并性、但編碼與特定氨基酸序列相同氨基酸序列的改變了的核苷酸序列,與該特定序列基本上相似。術(shù)語(yǔ)“基本上相似”也包括序列已被修飾以例如優(yōu)化特定細(xì)胞內(nèi)的表達(dá)的核苷酸序列,以及相對(duì)于由參照序列所編碼的(未修飾的)多肽,編碼具有一個(gè)或多個(gè)氨基酸取代的變體多肽的核苷酸序列,其中,相對(duì)于未修飾的多肽,取代不改變變體多肽的活性。在其最廣泛的意思中,當(dāng)談到多肽時(shí),這里所使用的術(shù)語(yǔ)“基本上相似的”是指多肽與參照多肽具有基本上相同的結(jié)構(gòu)和功能。另外,與特定序列基本上相似的氨基酸序列是與本發(fā)明序列的全部氨基酸同一性至少為65%或者更高的那些。產(chǎn)生等同核苷酸或氨基酸序列的修飾在本領(lǐng)域的常規(guī)技術(shù)內(nèi)。基本上相似的多肽和參照多肽之間的氨基酸序列同一性百分比為至少 65%、66%、67%、68%、69%、70%,例如 71 % ,72 % ,73 % ,74 %, 75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%,甚至 90%或者更高,例如 91%、92%、93%、94%、95%、96%、97%、98%,直至至少 99%,其中參照多肽是由具有SEQ ID NO :1、2、3、6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、 28、29、56、57、58、61、62、63、66、67、68、71、72或73中任一序列的啟動(dòng)子的基因所編碼的多肽,包括具有SEQ IDNO :4、9、17、25、30、59、64、69或74中任一序列的開放讀框的核苷酸序列,其編碼SEQ ID NO :5、10、18、26、31、60、65、70或75中任一序列。除了具有基本上相同的功能之外,兩多肽相互之間基本上相似的一個(gè)指標(biāo)還在于特異性結(jié)合一條多肽的物質(zhì) (例如抗體),也特異性結(jié)合另一條。可使用Smith-Waterman 序列比對(duì)算法(見,例如,Waterman (1995)或者 http// www hto.usc.edu/software/seqaln/index.html)進(jìn)行序列比較。優(yōu)選使用具有如下參數(shù)的locals程序,1. 16版匹配1,錯(cuò)配罰分0. 33,開放缺口罰分2,延伸缺口罰分2。此外,將與參照核苷酸序列“基本上相似”的核苷酸序列稱作參照核苷酸序列的 “等同物”。技術(shù)人員能夠認(rèn)識(shí)到,本發(fā)明所包含的等同核苷酸序列也可通過(guò)它們?cè)诘汀⒅械群?或嚴(yán)謹(jǐn)條件下(例如,0. 1XSSC,0. 1% SDS, 65°C )與本發(fā)明權(quán)利要求的文字范圍內(nèi)的核苷酸序列雜交的能力來(lái)定義。當(dāng)談到多核苷酸或多肽片段使用時(shí),“基本上相同的活性”是指該片段具有全長(zhǎng)多核苷酸或者全長(zhǎng)多肽活性的至少65%、66%、67%、68%、69%、70%,例如71%、72%、 73%,74%,75%,76%,77%,78%,79%,80%,81 %,82%,83%,84%,85%,86%,87%, 88%、89%,甚至 90% 或更高,例如 91%、92%、93%、94%、95%、96%、97%、98%,直至至少 99%?!鞍谢颉敝笍?fù)制子上的基因,表達(dá)期望的靶編碼序列、功能性RNA或蛋白質(zhì)。靶基因不是復(fù)制子復(fù)制必需的。另外,靶基因可包括插入到非天然生物體內(nèi)的天然非病毒基因, 或者嵌合基因,并且將在適當(dāng)?shù)恼{(diào)控序列的控制下。因此,靶基因中的調(diào)控序列可來(lái)自任何來(lái)源,包括病毒。靶基因可包括與待轉(zhuǎn)化的特定植物的基因異源或同源的編碼序列。然而, 靶基因不包括天然病毒基因。典型的靶基因包括,但不限于結(jié)構(gòu)蛋白、種子儲(chǔ)藏蛋白、傳達(dá)除草劑抗性的蛋白,以及傳達(dá)昆蟲抗性的蛋白的編碼基因。由靶基因編碼的蛋白質(zhì)稱作“外源蛋白”。靶基因在植物中的表達(dá)一般地將產(chǎn)生改變的植物性狀。術(shù)語(yǔ)“改變的植物性狀”是指相對(duì)于野生型或非轉(zhuǎn)基因植物宿主,轉(zhuǎn)基因植物中的表型或基因型的改變?!皬?fù)制基因”指編碼病毒復(fù)制蛋白的基因。除了復(fù)制蛋白的ORF外,復(fù)制基因也可含有其他重疊或非重疊0RF,如自然界在病毒序列中所發(fā)現(xiàn)的。這些額外的ORF盡管不是復(fù)制必需的,卻可以增強(qiáng)復(fù)制和/或病毒DNA累積。這類額外ORF的實(shí)例分別是ACMV和TGMV 雙生病毒中的AC3和AL3?!扒逗戏词阶饔脧?fù)制基因”指不同于天然病毒復(fù)制基因的復(fù)制基因,其中復(fù)制蛋白的編碼序列在可調(diào)型植物啟動(dòng)子的控制下,或者修飾的天然病毒復(fù)雜基因,例如,其中在5’ 轉(zhuǎn)錄但不翻譯的區(qū)域中插入位點(diǎn)特異性序列。這種嵌合基因也包括在啟動(dòng)子和轉(zhuǎn)錄起始位點(diǎn)之間插入結(jié)合復(fù)制蛋白的已知位點(diǎn),削弱病毒復(fù)制蛋白基因的轉(zhuǎn)錄?!叭旧w整合的”指外源基因或DNA構(gòu)建體通過(guò)共價(jià)鍵整合到宿主DNA內(nèi)。如果基因不是“染色體整合的”,它們可以是“瞬時(shí)表達(dá)的”?;虻乃矔r(shí)表達(dá)指沒有被整合到宿主染色體組內(nèi)但獨(dú)立地起作用,例如,作為自主復(fù)制的質(zhì)?;虮磉_(dá)盒的一部分,或者作為另一個(gè)生物系統(tǒng)如病毒的一部分的基因的表達(dá)。術(shù)語(yǔ)“轉(zhuǎn)化”指核酸片段轉(zhuǎn)移到宿主細(xì)胞的基因組內(nèi),導(dǎo)致遺傳上的穩(wěn)定遺傳。將含有轉(zhuǎn)化核酸片段的宿主細(xì)胞稱作“轉(zhuǎn)基因”細(xì)胞,將包括轉(zhuǎn)基因細(xì)胞的生物體稱作“轉(zhuǎn)基因生物體”。轉(zhuǎn)化植物和植物細(xì)胞方法的實(shí)例包括農(nóng)桿菌(Agrobacterium)介導(dǎo)的轉(zhuǎn)化(De Blaere 1987)和粒子轟擊技術(shù)(US 4,945,050)。整個(gè)植物可通過(guò)技術(shù)人員公知的方法從轉(zhuǎn)基因細(xì)胞中再生(見,例如,F(xiàn)romm 1990)。“轉(zhuǎn)化的”、“轉(zhuǎn)基因的”和“重組的”指已引入異源核酸分子的宿主生物體,如細(xì)菌或植物??赏ㄟ^(guò)本領(lǐng)域技術(shù)中通常已知的和公開的方法(Sambrook 1989 ;Innis 1995 ; Gelfand 1995 ;Innis&Gelfand 1999)將核酸分子穩(wěn)定地整合到基因組內(nèi)。已知的PCR法包括,但不限于,使用成對(duì)引物、嵌套引物、單特異性引物、簡(jiǎn)并引物、基因特異性引物、載體特異性引物、部分錯(cuò)配引物等引物的方法。例如,“轉(zhuǎn)化的”、“重組的”和“轉(zhuǎn)基因的”植物或愈傷組織已經(jīng)歷轉(zhuǎn)化過(guò)程并含有整合到其染色體內(nèi)的外源基因。術(shù)語(yǔ)“未轉(zhuǎn)化的”指沒有經(jīng)歷轉(zhuǎn)化過(guò)程的正常植物?!八矔r(shí)轉(zhuǎn)化的”指已引入轉(zhuǎn)基因和外源DNA(例如,通過(guò)如農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化或生物射彈轟擊這樣的方法),但未經(jīng)穩(wěn)定維持選擇的細(xì)胞?!胺€(wěn)定轉(zhuǎn)化的”指已經(jīng)選擇并在轉(zhuǎn)化后在選擇培養(yǎng)基上再生的細(xì)胞?!八矔r(shí)表達(dá)”指在通過(guò)病毒感染或通過(guò)如農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化、電穿孔或生物射彈轟擊這樣的方法引入病毒或轉(zhuǎn)基因,但未經(jīng)穩(wěn)定維持選擇的細(xì)胞表達(dá)?!斑z傳上穩(wěn)定的”和“可遺傳的”指在植物中穩(wěn)定維持并由子代通過(guò)連續(xù)傳代而穩(wěn)定遺傳的染色體整合的遺傳元件?!俺跫?jí)轉(zhuǎn)化體”和“TO代”指與最初轉(zhuǎn)化的組織同一遺傳代的轉(zhuǎn)基因植物(即,自轉(zhuǎn)化后沒有經(jīng)歷減數(shù)分裂和受精)。“次級(jí)轉(zhuǎn)化體”和“T1、T2、T3代等”指初級(jí)轉(zhuǎn)化體通過(guò)一個(gè)或多個(gè)減數(shù)分裂和受精周期得到的轉(zhuǎn)基因植物。它們可來(lái)自初級(jí)或次級(jí)轉(zhuǎn)化體的自體受精或者初級(jí)或次級(jí)轉(zhuǎn)化體與其他轉(zhuǎn)化的或未轉(zhuǎn)化植物的雜交?!耙吧汀敝柑烊话l(fā)現(xiàn)的沒有任何已知突變的病毒或生物體?!盎蚪M”指生物體的全部遺傳物質(zhì)。
20
術(shù)語(yǔ)“核酸”指以單鏈或雙鏈形式的脫氧核糖核苷酸或核糖核苷酸及其多聚體,由含糖、磷酸鹽和堿基的單體(核苷酸)構(gòu)成,其中堿基是嘌呤或嘧啶。除非特別限定,該術(shù)語(yǔ)包括含有天然核苷酸的已知類似物的核酸,其具有與參照核酸類似結(jié)合特性,并且以與天然存在的核苷酸類似的方式代謝。除非有其他指示,特定核酸序列也包括其保守修飾的變體(例如,簡(jiǎn)并密碼子取代)和互補(bǔ)序列以及明確表示的序列。具體地,可通過(guò)用混合堿基和/或脫氧肌苷殘基取代所選的一個(gè)或多個(gè)(或者所有)密碼子的第三位所產(chǎn)生的序列來(lái)實(shí)現(xiàn)簡(jiǎn)并密碼子取代(Batzer 1991 ;Ohtsuka 1985 ;Rossolinil994)?!昂怂崞巍笔墙o定核酸分子的一部分。在高等植物中,脫氧核糖核酸(DNA)是遺傳物質(zhì),而核糖核酸(RNA) 參與將DNA內(nèi)所含的信息傳遞給蛋白質(zhì)。術(shù)語(yǔ)“核苷酸序列”指DNA或RNA的多聚體,其可以是單鏈或雙鏈,任選地含有能整合到DNA或RNA多聚體內(nèi)的合成的、非天然的或改變的核苷酸堿基。術(shù)語(yǔ)“核酸”或“核酸序列”也可與基因、cDNA、DNA和由基因所編碼的RNA交換使用。本發(fā)明包括分離的或基本上純的核酸或蛋白質(zhì)組合物。在本發(fā)明的上下文中,“分離的”或“純化的” DNA分子或者“分離的”或“純化的”多肽是通過(guò)人工方法獲得的,遠(yuǎn)離其天然環(huán)境存在的DNA分子或多肽,因此不是自然的產(chǎn)物。分離的DNA分子或多肽可以純化形式存在或者可存在于非天然環(huán)境如轉(zhuǎn)基因宿主細(xì)胞中。例如,“分離的”或“純化的”核酸分子或蛋白質(zhì)或其生物活性部分,當(dāng)通過(guò)重組技術(shù)生成時(shí),基本上無(wú)其他細(xì)胞材料或培養(yǎng)基, 或者當(dāng)通過(guò)化學(xué)方法合成時(shí),基本上無(wú)化學(xué)前體或其他化學(xué)品。優(yōu)選“分離的”核酸不含核酸來(lái)源生物體基因組DNA中天然位于該核酸兩側(cè)(S卩,位于核酸的5'和3'端的序列)的序列(優(yōu)選編碼蛋白質(zhì)的序列)。例如,在多個(gè)實(shí)施方案中,分離的核酸分子可含有小于約 5kb,4kb,3kb,2kbUkb,0. 5kb或0. Ikb的側(cè)接核苷酸序列,其中所述側(cè)接核苷酸序列在核酸所來(lái)源的細(xì)胞的基因組DNA中天然地位于核酸分子的兩側(cè)。基本上不含細(xì)胞材料的蛋白質(zhì)包括具有小于約30^^20^^10^5% (以干重計(jì))污染蛋白的蛋白質(zhì)或多肽制品。當(dāng)通過(guò)重組生成本發(fā)明的蛋白質(zhì)或其生物活性部分時(shí),優(yōu)選培養(yǎng)基代表小于約30<%、20%、10% 或5% (以干重計(jì))的化學(xué)前體或非蛋白目的化學(xué)品。本發(fā)明的核苷酸序列包括天然存在的序列以及突變體(變體)形式。這類變體將繼續(xù)具有期望的活性,即,啟動(dòng)子活性或者由非變體核苷酸序列的開放讀框所編碼的產(chǎn)物的活性。就序列(例如,多肽或核苷酸序列,例如本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列)而言,術(shù)語(yǔ)“變體”旨在表示基本上相似的序列。對(duì)于包括開放讀框的核苷酸序列,變體包括那些由于遺傳密碼子的簡(jiǎn)并性而存在的編碼天然蛋白質(zhì)的相同氨基酸序列的那些序列。天然發(fā)生的等位基因變體如可使用公知的分子生物學(xué)技術(shù),例如用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)和雜交技術(shù)鑒定的這些。變體核苷酸序列也包括合成來(lái)源的核苷酸序列,例如通過(guò)使用定點(diǎn)誘變所產(chǎn)生的那些;以及對(duì)于開放讀框而言,編碼天然蛋白質(zhì),以及相對(duì)于天然蛋白質(zhì),編碼具有氨基酸取代的多肽的那些。通常,本發(fā)明的核苷酸序列變體與天然(野生型或內(nèi)源)核苷酸序列相比,將具有至少40%、50%、60%,至70%,例如優(yōu)選71%、72%、73%、74%、75%、 76%、77%、78%,至 79%,通常至少 80%,例如 81% -84%,至少 85 %,例如,86 %、87 %、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%,至 98% 以及 99% 的核苷酸序列同一性。
特定核酸序列“保守修飾的變異”指編碼相同或基本上相同氨基酸序列的那些核酸序列,或者其中核酸序列不編碼氨基酸序列,指基本上相同的序列。由于遺傳密碼子的簡(jiǎn)并性,大量功能上相同的核酸編碼任何指定的多肽。例如,密碼子CGT、CGC、CGA、CGG、AGA 和AGG都編碼氨基酸精氨酸。因此,在精氨酸用密碼子表示的每個(gè)位置上,可將該密碼子變?yōu)樗鱿鄳?yīng)密碼子中的任何一個(gè),而不改變所編碼的蛋白質(zhì)。這種核酸變異是“沉默變異”, 其是“保守性修飾變異”中的一種。這里所述的每個(gè)編碼多肽的核酸序列,也記述了每種可能的沉默變異,除非有其他注釋。本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到可通過(guò)標(biāo)準(zhǔn)技術(shù)修飾核酸中的每個(gè)密碼子(除了 ATG,其平常僅是甲硫氨酸的密碼子)以產(chǎn)生功能相同的分子。因此, 編碼多肽的核酸的每個(gè)“沉默變異”是每個(gè)所述序列中固有的??伞皟?yōu)化”本發(fā)明的核酸分子以提高目的植物中的表達(dá)(見,例如,WO 91/16432 ; Perlak 1991 ;Murray 1989)。在該方式中,可利用植物偏好的密碼子合成基因的開放讀框或基因片段(見,例如,Campbell&GOwri,1990對(duì)宿主偏好密碼子使用的討論)。因此,可優(yōu)化核苷酸序列用于任何植物的表達(dá)。人們公認(rèn),可優(yōu)化或合成基因序列的全部或者任何一部分。換句話說(shuō),也可以使用合成的或部分優(yōu)化的序列。變體核苷酸序列和蛋白質(zhì)也包括,從誘變和重組方法如DNA改組中獲得的序列和蛋白質(zhì)??捎眠@類方法操作一個(gè)或多個(gè)不同的編碼序列,以產(chǎn)生具有期望特性的新多肽。在該方式中,從大量包括序列基本上相同并能在體外或在體內(nèi)同源重組的序列區(qū)域的相關(guān)序列多核苷酸群中產(chǎn)生重組多核苷酸文庫(kù)。這種DNA改組的策略在本領(lǐng)域技術(shù)中是公知的(見,例如,Stemmer 1994 ;Stemmer 1994 ;Crameri 1997 ;Moore 1997 ;Zhang 1997 ;Crameri 1998 ;以及 US 5,605,793 和 5,837,458)。“變體”多肽是指源自天然蛋白質(zhì)的多肽,通過(guò)在天然蛋白質(zhì)的N末端和/或C末端缺失(所謂的截短)或者添加一個(gè)或多個(gè)氨基酸;在天然蛋白質(zhì)的一個(gè)或多個(gè)位點(diǎn)上缺失或添加一個(gè)或多個(gè)氨基酸;或者在天然蛋白質(zhì)的一個(gè)或多個(gè)位點(diǎn)上取代一個(gè)或多個(gè)氨基酸。這種變體可以由于,例如,遺傳多態(tài)性或人為操作所產(chǎn)生。這類操作的方法通常是本領(lǐng)域已知的。因此,可以多種方式改變多肽,包括氨基酸取代、缺失、截短和插入。這種操作的方法通常是本領(lǐng)域已知的。例如,可通過(guò)DNA突變制備多肽的氨基酸序列變體。誘變和核苷酸序列改變的方法是本領(lǐng)域公知的(見,例如,Kunkel 1985 ;Kunkel 1987 ;US 4,873, 192 ; Walker&Gaastra,1983及其中所引用的參考文獻(xiàn))。可在Dayhof降(1978)的模型中發(fā)現(xiàn)對(duì)不影響目的蛋白質(zhì)的生物活性的適當(dāng)氨基酸取代的指導(dǎo)。優(yōu)選保守取代,如氨基酸與其他具有相似性質(zhì)的氨基酸的交換。在編碼序列中,改變、添加或缺失單個(gè)氨基酸或小百分比的氨基酸(一般小于 5%,更一般地小于)的個(gè)別取代、缺失或添加是“保守性修飾變異”,其中,該改變導(dǎo)致用化學(xué)上相似的氨基酸取代另一個(gè)氨基酸。提供功能相似氨基酸的保守取代表是本領(lǐng)域公知的。如下五組中,每組都含有彼此是保守性取代的氨基酸脂肪族氨基酸甘氨酸(G)、 丙氨酸(A)、纈氨酸(V)、亮氨酸(L)、異亮氨酸(I);芳香族氨基酸苯丙氨酸(F)、酪氨酸 (Y)、色氨酸(W);含硫氨基酸甲硫氨酸(M)、半胱氨酸(C);堿性氨基酸精氨酸(I )、賴氨酸(K)、組氨酸(H);酸性氨基酸天冬氨酸(D)、谷氨酸(E)、天冬酰胺(N)、谷胺酰胺⑴)。 也見,Creight0n,1984。另外,編碼序列中改變、添加或缺失單個(gè)氨基酸或小百分比氨基酸的個(gè)別取代、缺失或添加也是“保守性修飾變異”。這里所使用的“表達(dá)盒”是指能在適當(dāng)?shù)乃拗骷?xì)胞中指導(dǎo)特定核苷酸序列表達(dá)的 DNA序列,包括有效連接于目的核苷酸序列的啟動(dòng)子,其任選地有效連接于終止信號(hào)和/或其他調(diào)控元件。表達(dá)盒也可包括核苷酸序列的正確翻譯所必需的序列。編碼區(qū)通常編碼目的蛋白質(zhì),但也可編碼目的功能性RNA,例如正義或反義方向的反義RNA或非翻譯的RNA。包括目的核苷酸序列的表達(dá)盒可以是嵌合的,是指其至少一個(gè)組分對(duì)于其至少一個(gè)其他組分來(lái)說(shuō)是異源的。表達(dá)盒也可以是這樣的表達(dá)盒,其是天然存在的,但以用于異源表達(dá)的重組體形式獲得。表達(dá)盒可以完全在細(xì)胞外裝配(例如,通過(guò)重組體克隆技術(shù))。然而,表達(dá)盒也可以使用部分內(nèi)源組分進(jìn)行裝配。例如,表達(dá)盒可通過(guò)將啟動(dòng)子序列置于(插入)內(nèi)源序列上游獲得,其因此形成功能上相連的并通過(guò)所述啟動(dòng)子序列控制的表達(dá)盒。同樣地,可將待表達(dá)核酸序列置于(或插入)內(nèi)源性啟動(dòng)子序列的下游,由此形成表達(dá)盒。表達(dá)盒中核苷酸序列的表達(dá)可在保守性啟動(dòng)子的控制下,或者在僅在宿主細(xì)胞暴露于某些特定外部刺激時(shí)引起轉(zhuǎn)錄的誘導(dǎo)型啟動(dòng)子的控制下。在多細(xì)胞生物體的情況中,啟動(dòng)子也可以特異于特定的組織或器官或發(fā)育階段(例如,根/仁特異性或偏好性)?!拜d體”定義為包括,特別地,雙鏈或單鏈線性或環(huán)型的任何質(zhì)粒、粘粒、噬菌體或農(nóng)桿菌雙載體,其可以或者不能自我傳遞或移動(dòng),并且其可通過(guò)整合到細(xì)胞基因組內(nèi)或者在染色體外存在(例如,具有復(fù)制起點(diǎn)的自主復(fù)制質(zhì)粒)來(lái)轉(zhuǎn)化原核或真核宿主。特別包括穿梭載體,其意味著天然地或通過(guò)設(shè)計(jì),能在兩種不同宿主生物體中復(fù)制的DNA載體,其可選自放線菌屬(Actinomycetes)和相關(guān)物種、細(xì)菌和真核生物(例如, 高等植物、哺乳動(dòng)物、酵母或真菌細(xì)胞)。優(yōu)選載體中的核酸在適當(dāng)?shù)膯?dòng)子或其他調(diào)控元件的控制下,并與之有效連接, 用于在宿主細(xì)胞如微生物,例如細(xì)菌,或者植物細(xì)胞中進(jìn)行轉(zhuǎn)錄。載體可以是在多個(gè)宿主中起作用的雙功能表達(dá)載體。在基因組DNA的情況中,這可以包含其自己的啟動(dòng)子或者其他調(diào)控元件,在cDNA的情況中,這可以是在用于在宿主細(xì)胞中表達(dá)的適當(dāng)啟動(dòng)子或者其他調(diào)控元件的控制下。“克隆載體”一般含有一個(gè)或少量限制性核酸內(nèi)切酶識(shí)別位點(diǎn)以及適于在用克隆載體轉(zhuǎn)化的細(xì)胞的鑒定和選擇中使用的標(biāo)記基因,可在所述內(nèi)切酶識(shí)別位點(diǎn)上以可測(cè)定的方式插入外源DNA序列,而不喪失載體的基本生物功能。標(biāo)記基因一般包括提供四環(huán)素抗性、潮霉素抗性或氨芐青霉素抗性的基因。“轉(zhuǎn)基因植物”為具有含表達(dá)載體的一個(gè)或多個(gè)植物細(xì)胞的植物。“植物組織”包括分化的和未分化的組織或植物,包括但不限于,根、莖、葉、花粉、 種子、腫瘤組織以及多種形式細(xì)胞和培養(yǎng)物,如單細(xì)胞、原生質(zhì)體、胚以及愈傷組織。植物組織可以在植物或在器官中,可以是組織或細(xì)胞培養(yǎng)物。如下術(shù)語(yǔ)用于描述兩個(gè)或多個(gè)核酸或者多核苷酸之間的序列關(guān)系(a) “參照序列”,(b) “比較窗”,(c) “序列同一性”,(d) “序列同一性百分比”和(e) “基本相同”。(a)如這里所使用的,“參照序列”是用作序列對(duì)比基礎(chǔ)的定義序列。參照序列可為指定序列的子集或全部;例如,為全長(zhǎng)cDNA或基因序列的片段,或者全長(zhǎng)cDNA或基因序列。(b)如這里所使用的,“比較窗”涉及多核苷酸序列的連續(xù)指定片段,其中與用于兩序列最佳比對(duì)的參照序列(其不包括添加或缺失)相比,比較窗中的多核苷酸序列可包括添加或缺失(即,缺口)。通常,比較窗至少為20個(gè)連續(xù)的核苷酸,任選地可以是30、40、 50、100或者更長(zhǎng)。本領(lǐng)域技術(shù)人員理解,為了避免由于多核苷酸序列中包含缺口而與參照序列具有高相似性,一般地引入缺口罰分并從匹配數(shù)中減去。用于比較的序列比對(duì)的方法是本領(lǐng)域公知的。因此,可使用數(shù)學(xué)算法完成任何兩個(gè)序列之間同一性百分比的測(cè)定。優(yōu)選這類數(shù)學(xué)算法的非限制性實(shí)例是Myers和Miller, 1988的算法;Smith等1981的局部同源性算法;Needleman和^msch 1970的同源性比對(duì)算法;Pearson 和 Lipman 1988 的搜索相似性法;Karl in 和 Altschul,1990 的算法,在 Karlin 和Altschul, 1993中予以改進(jìn)??衫糜?jì)算機(jī)執(zhí)行這些數(shù)學(xué)算法用于序列的比較以確定序列同一性。這類執(zhí)行包括,但不限于PC/Gene 程序(可從 htelligenetics,Mountain View, Calif.獲得)中的 CLUSTAL ;ALIGN 程序(2. 0 版)以及 Wisconsin Genetics 軟件包,8 版(可從 Genetics Computer Group (GCG), 575 Science Drive,Madison,Wis.,USA 中獲得)中的GAP、BESTFIT、 BLAST、FASTA和TFASTA。可使用默認(rèn)參數(shù)進(jìn)行使用這些程序的比對(duì)。已充分描述了 CLUSTAL 程序(Higgins 1988,1989 ;Corpet 1988 ;Huang 1992 ;Pearsonl994)。ALIGN 程序是基于 Myers 和 Miller 的算法,同前。Altschul 等,1990 的 BLAST 程序是基于 Karlin 和 Altschul 的算法,同前。公眾可通過(guò)國(guó)立生物技術(shù)信息中心(National Center for Biotechnology Information) (http: //www. ncbi. nlm. nih. gov/)獲得進(jìn)行 BLAST 分析的軟件。該算法包括通過(guò)鑒定查詢序列中長(zhǎng)度為W的短字節(jié),首先鑒定高得分序列對(duì)(HSP),當(dāng)與數(shù)據(jù)庫(kù)序列中同樣長(zhǎng)度的字節(jié)比對(duì)時(shí),其匹配或滿足某些正數(shù)閾值得分T。將T稱作鄰近字節(jié)得分閾值 (Altschul 1990)。這些最初的鄰近字節(jié)命中事件作為種子起始搜索,以發(fā)現(xiàn)含有它們的更長(zhǎng)HSP。然后在兩個(gè)方向上沿著每個(gè)序列延伸字節(jié)命中,只要累積比對(duì)得分增加。使用參數(shù) M(匹配殘基對(duì)的獎(jiǎng)勵(lì)得分;總是>0)和N(錯(cuò)配殘基的罰分;總是<0)計(jì)算核苷酸序列的累積得分。對(duì)于氨基酸序列,使用評(píng)分矩陣計(jì)算累積得分。當(dāng)累積比對(duì)得分從其獲得的最大值下降量達(dá)X,累積得分由于一個(gè)或多個(gè)得負(fù)分的殘基比對(duì)的累積而變?yōu)榱慊蛘吡阋韵拢?或者到達(dá)序列的一端時(shí),停止每個(gè)方向上字節(jié)命中的延伸。除了計(jì)算序列同一性百分比,BLAST算法也進(jìn)行兩個(gè)序列之間相似性的統(tǒng)計(jì)學(xué)分析(見,例如Karlin&Altschul (1993)。由BLAST算法所提供的相似性的一個(gè)測(cè)量值是最小總概率(P (N)),為兩核苷酸或氨基酸序列之間將偶然發(fā)生匹配的概率指數(shù)。例如,如果在測(cè)試核酸序列與參照核酸序列的比較中最小總概率小于約0. 1,更優(yōu)選小于約0.01,且最優(yōu)選小于約0. 001,那么認(rèn)為測(cè)試核酸序列與參照序列相似。為了獲得用于比較目的的缺口比對(duì),可如Altschul等1997所述利用Gapped BLAST (BLAST 2.0)??蛇x地,可使用PSI-BLAST (BLAST 2.0)進(jìn)行檢測(cè)分子之間的遠(yuǎn)關(guān)系的重復(fù)搜索(見Altschul等,同前)。當(dāng)利用BLAST, Gapped BLAST、PSI-BLAST時(shí),可使用相應(yīng)程序的默認(rèn)參數(shù)(例如,用于核苷酸序列的BLASTN,用于蛋白質(zhì)的BLASTX)。BLASTN程序 (用于核苷酸序列)使用如下默認(rèn)值字長(zhǎng)(W)為11、期望值(E)為10、截?cái)酁?00、M = 5、 N = _4,并且比較兩條鏈。對(duì)于氨基酸序列,BLASTP程序使用字長(zhǎng)(W)為3、期望值(E)為 10 作為默認(rèn)值,以及 BL0SUM62 評(píng)分矩陣(見,Henikoff&Henikoff,1989)。見 http://www.
24ncbi. nlm. nih. gov。也可通過(guò)目測(cè)人工進(jìn)行比對(duì)。對(duì)于本發(fā)明的目的,優(yōu)選使用具有默認(rèn)參數(shù)的BlastN程序(1. 4. 7版或更新的版本)或者任何等同程序進(jìn)行核苷酸的比較,用于測(cè)定與這里所公開的啟動(dòng)子序列的序列同一性百分比?!暗韧绦颉笔侵溉魏涡蛄斜容^程序,當(dāng)與通過(guò)優(yōu)選程序所產(chǎn)生的相應(yīng)比對(duì)比較時(shí),其對(duì)于任何兩個(gè)所討論的序列都產(chǎn)生具有相同核苷酸或氨基酸殘基匹配和相同百分比序列同一性的比對(duì)。(c)如這里所使用的,在兩核酸或多肽序列的上下文中,“序列同一性”或“同一性” 是指在指定比較窗進(jìn)行比對(duì)以獲得最大對(duì)應(yīng)性時(shí),兩序列中相同的殘基。當(dāng)使用序列同一性百分比涉及蛋白質(zhì)時(shí),公認(rèn)不相同的殘基位置常常由于保守性氨基酸取代而不同,其中將氨基酸殘基用具有相似化學(xué)特性(例如,電荷或疏水性)的其他氨基酸殘基取代,因此不改變分子的功能特性。當(dāng)序列因保守性取代而不同時(shí),可上調(diào)序列同一性百分比以修正取代的保守性。將由于這種保守取代而不同的序列稱作具有“序列相似性”或“相似性”。進(jìn)行這種調(diào)整的方法是本領(lǐng)域技術(shù)人員公知的。一般這包括保守性取代作為部分而不是完全錯(cuò)配進(jìn)行評(píng)分,因此提高序列同一性百分比。因此,例如,對(duì)相同的氨基酸給1分,非保守性取代給0分,保守性取代給0和1之間的記分。計(jì)算保守性取代的得分,例如,如在程序PC/ GENEdntelligenetics, Mountain View, Calif.)中進(jìn)行的那樣。(d)如這里所使用的,“序列同一性百分比”是指通過(guò)將兩個(gè)最佳比對(duì)序列對(duì)比較窗進(jìn)行比較所測(cè)定的值,其中與用于兩個(gè)序列最佳比對(duì)的參照序列(其不包括添加或缺失)相比,比較窗中的多核苷酸序列中的部分可包括添加或缺失(即,缺口)。如下計(jì)算百分比測(cè)定兩個(gè)序列中出現(xiàn)相同核酸堿基或氨基酸殘基的位置數(shù)以產(chǎn)生匹配的位置數(shù),將匹配的位置數(shù)除以比較窗中的總的位置數(shù),并將結(jié)果乘以100以產(chǎn)生序列同一性百分比。(e)⑴術(shù)語(yǔ)“基本上相同”的多核苷酸序列是指與參照序列相比,多核苷酸包括具有至少 70%、71%、72%、73%、74%、75%、76%、77%、78%,或 79%,優(yōu)選至少 80%,81%, 82%、83%、84%、85%、86%、87%、88%,或 89%,更優(yōu)選至少 90 %、91 %、92 %、93 %,或 94 %,以及最優(yōu)選至少95 %、96 %、97 %、98 %,或99 %序列同一性的序列,用所述使用標(biāo)準(zhǔn)參數(shù)的比對(duì)程序之一。本領(lǐng)域技術(shù)人員將會(huì)意識(shí)到,通過(guò)考慮密碼子簡(jiǎn)并性、氨基酸相似性、閱讀框位置分布等因素,可將這些值適當(dāng)?shù)剡M(jìn)行調(diào)整以確定相應(yīng)的由兩個(gè)核苷酸序列所編碼的蛋白質(zhì)的同一性。用于這些目的的基本相同的氨基酸序列通常意味著至少70%的序列同一性,更優(yōu)選至少80 %、90 %,且最優(yōu)選至少95 %。核苷酸序列基本上相同的另一指標(biāo)是兩個(gè)分子是否在嚴(yán)謹(jǐn)條件下相互雜交(見下文)。通常,選擇嚴(yán)謹(jǐn)條件低于固定離子強(qiáng)度和PH時(shí)特定序列的熱解鏈溫度(Tm)約5°C。 然而,嚴(yán)謹(jǐn)條件包括約1°C到約20°C的溫度范圍,取決于期望的嚴(yán)謹(jǐn)度,如文中別處所限定的那樣。如果它們編碼的多肽基本上相同,那么嚴(yán)謹(jǐn)條件下不相互雜交的核酸仍然基本上相同。這可以發(fā)生,例如,當(dāng)使用遺傳密碼子所允許的最大密碼子簡(jiǎn)并性產(chǎn)生核酸的拷貝時(shí)。兩個(gè)核酸序列基本上相同的一個(gè)指標(biāo)是由第一個(gè)核酸所編碼的多肽與由第二個(gè)核酸所編碼的多肽在免疫學(xué)上發(fā)生交叉反應(yīng)。(ii)在肽的上下文中,術(shù)語(yǔ)“基本上相同”表示在所指定的比較窗上,肽包括與參照序列具有至少 70%、71%、72%、73%、74%、75%、76%、77%、78%,或 79%,優(yōu)選 80%、 81 %,82 %,83 %,84%,85 %,86 %,87 %,88 %,或 89 %,更優(yōu)選至少 90 %、91 %、92 %、CN 102277377 A
說(shuō)明書
22/102 頁(yè)
93 %,或94 %,或者甚至優(yōu)選95 %、96 %、97 %、98 %或99 %序列同一性的序列。優(yōu)選使用 Needleman和^msch (1970)的同源性比對(duì)算法進(jìn)行最佳比對(duì)。兩個(gè)多肽序列基本上相同的指標(biāo)是一個(gè)肽與針對(duì)第二個(gè)肽所產(chǎn)生的抗體在免疫學(xué)上發(fā)生反應(yīng)。因此,肽與第二個(gè)肽基本上相同,例如,其中兩個(gè)肽僅由于保守性取代而不同。對(duì)于序列比較,一般一個(gè)序列作為與測(cè)試序列比較的參照序列。當(dāng)使用序列比較算法時(shí),將測(cè)試和參照序列輸入到計(jì)算機(jī)中,如果必要的話,指定序列坐標(biāo),并指定序列算法程序參數(shù)。然后,基于指定的程序參數(shù),序列比較算法計(jì)算測(cè)試序列相對(duì)于參照序列的序列同一性百分比。如上所指出的,兩個(gè)核酸序列基本上相同的另一個(gè)指標(biāo)是兩個(gè)分子在嚴(yán)謹(jǐn)條件下相互雜交。當(dāng)序列以復(fù)雜混合物(例如,總細(xì)胞DNA或RNA)存在時(shí),術(shù)語(yǔ)“特異性雜交于” 指在嚴(yán)謹(jǐn)條件下分子僅與特定核苷酸序列結(jié)合、形成雙鏈體或雜交。“基本上結(jié)合”指探針核酸和靶核酸的互補(bǔ)雜交,并且包括可通過(guò)降低雜交介質(zhì)的嚴(yán)謹(jǐn)性提供較小的錯(cuò)配,以達(dá)到靶核酸序列的期望檢測(cè)。在核酸雜交試驗(yàn)如Southern和Northern雜交的上下文中,“嚴(yán)謹(jǐn)雜交條件”和“嚴(yán)謹(jǐn)雜交洗滌條件”是序列依賴性的,并且在不同環(huán)境參數(shù)下是不同的。Tm是50%的靶序列與完全匹配的探針雜交的溫度(在固定的離子強(qiáng)度和PH條件下)。特異性一般是雜交后洗滌的函數(shù),關(guān)鍵因素是離子強(qiáng)度和最后的洗滌溶液的溫度。對(duì)于DNA-DNA雜交,Tm可從 Meinkoth和Wahl,1984的等式中估計(jì)Tm = 81. 5"C +16. 6 (Iog10M) +0. 41(% GC)-0. 61 甲酰胺)-500/L其中,M是單價(jià)陽(yáng)離子的摩爾濃度,% GC是DNA中鳥苷和胞嘧啶核苷酸的百分比,%甲酰胺是雜交溶液中甲酰胺的百分比,L是雜合體的堿基對(duì)長(zhǎng)度。每發(fā)生錯(cuò)配, Tm減少約1°C ;因此,可調(diào)整Tm、雜交,和/或洗滌條件以與期望同一性的序列雜交。例如, 如果尋找具有>90%同一性的序列,那么可將Tm降低10°C。通常,選擇嚴(yán)謹(jǐn)條件低于固定離子強(qiáng)度和PH時(shí)阿到序列和其互補(bǔ)物的熱解鏈溫度I約5°C。然而,嚴(yán)格嚴(yán)謹(jǐn)條件可在比熱解鏈溫度I低1、2、3或4°C時(shí)進(jìn)行雜交和/或洗滌;中等嚴(yán)謹(jǐn)條件可在比熱解鏈溫度I 低6、7、8、9或10°C時(shí)進(jìn)行雜交和/或洗滌;低嚴(yán)謹(jǐn)條件可在比熱解鏈溫度I低11、12、13、 14,15或20°C時(shí)進(jìn)行雜交和/或洗滌。利用該等式、雜交和洗滌組合物以及期望的T,普通技術(shù)人員將會(huì)理解,雜交和/或洗滌溶液的嚴(yán)謹(jǐn)性的變動(dòng)已予以內(nèi)在地描述。如果期望的錯(cuò)配程度導(dǎo)致T小于45°C (水溶液)或32°C (甲酰胺溶液),那么優(yōu)選增加SSC濃度以便可使用更高的溫度。有關(guān)核酸雜交的詳盡指導(dǎo)可見Tijssen,1993。通常,選擇高嚴(yán)謹(jǐn)雜交和洗滌條件低于固定離子強(qiáng)度和PH時(shí)特定序列的熱解鏈溫度Tm約5°C。高嚴(yán)謹(jǐn)洗滌條件的實(shí)例是0. 15M NaCl,72°C約15分鐘。嚴(yán)謹(jǐn)洗滌條件的實(shí)例是于65°C用0. 2XSSC洗滌15分鐘(見,Sambrook,下文,對(duì)SSC緩沖液的描述)。常常,高嚴(yán)謹(jǐn)洗滌之前是低嚴(yán)謹(jǐn)洗滌,以除去背景探針信號(hào)。對(duì)于雙鏈體,例如100個(gè)以上核苷酸, 中等嚴(yán)謹(jǐn)洗滌的實(shí)例是在45°C用IX SSC洗滌15分鐘。對(duì)于雙鏈體,例如100個(gè)以上核苷酸,低嚴(yán)謹(jǐn)洗滌的實(shí)例是在40°C用6X SSC洗滌15分鐘。對(duì)于短探針(例如,約10-50個(gè)核苷酸),嚴(yán)謹(jǐn)條件一般包括小于約1. 5M的鹽濃度,優(yōu)選約0. 01-1. 0Μ,ρΗ 7. 0-8. 3的鈉離子濃度(或者其他鹽),溫度一般是至少約30°C,對(duì)于長(zhǎng)探針(例如,>50個(gè)核苷酸)至少約 60°C。也可通過(guò)添加去穩(wěn)定劑如甲酰胺獲得嚴(yán)謹(jǐn)條件。通常,在特定雜交測(cè)定中,信噪比為無(wú)關(guān)探針?biāo)^察到的2倍(或者更高),表示特異性雜交的檢測(cè)。如果它們編碼的蛋白質(zhì)基本上相同,那么嚴(yán)謹(jǐn)條件下不相互雜交的核酸仍然是基本上相同的。這發(fā)生在,例如,當(dāng)使用由遺傳密碼子所允許多最大密碼子簡(jiǎn)并性產(chǎn)生核酸拷貝時(shí)。選擇非常嚴(yán)謹(jǐn)?shù)臈l件是與特定探針的Tm相等。Southern或Northern印跡中濾膜上具有100個(gè)以上互補(bǔ)殘基的互補(bǔ)核酸的嚴(yán)謹(jǐn)雜交條件的實(shí)例是在50%甲酰胺,例如,在 50%甲酰胺,IM NaCl,l% SDS中于37°C雜交,以及在0. 1父55(中于60-651洗滌。示范性的低嚴(yán)謹(jǐn)條件包括在37°C用30-35%甲酰胺、IM NaCl, 1% SDS(十二烷基硫酸鈉)的緩沖液雜交,并在50_55°C,在IX至2XSSC(20XSSC = 3. OM NaCl/0. 3M檸檬酸三鈉)中洗滌。 示范性的中等嚴(yán)謹(jǐn)條件包括在37°C在40-45%甲酰胺、1. OM NaCl, 1% SDS(十二烷基硫酸鈉)中雜交,以及在55-60°C,在0. 5X至IXSSC中洗滌。如下是可用于克隆與本發(fā)明的參照核苷酸序列基本上相同的直向同源物核苷酸序列的雜交/洗滌條件設(shè)置的實(shí)例參照核苷酸序列優(yōu)選在7%十二烷基硫酸鈉(SDS)、 0. 5M NaPO4UmM EDTA中與參照核苷酸序列于50°C雜交,用2 X SSC、0. 1%SDS于50°C洗滌; 還更期望在十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用1 XSSC、 0. SDS于50°C洗滌;還更期望在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用0. 5XSSC、0. SDS于50°C洗滌;優(yōu)選在7%十二烷基硫酸鈉(SDS)、0. 5M NaPO4UmM EDTA中于50°C雜交,用0. 1XSSC、0. SDS于50°C洗滌;更優(yōu)選在7%十二烷基硫酸鈉(SDS) ,0. 5M NaPO4UmM EDTA 中于 50°C雜交,用 0. 1XSSC、0. 1 % SDS 于65°C洗滌。"DNA改組”是在DNA分子中引入突變或重排(優(yōu)選隨機(jī)),或者在兩個(gè)或多個(gè)DNA 分子之間發(fā)生DNA序列的交換(優(yōu)選隨機(jī))的方法。由DNA改組所得到的DNA分子是改組的DNA分子,是從至少一個(gè)模板DNA分子中獲得的非天然發(fā)生的DNA分子。改組的DNA優(yōu)選編碼對(duì)由模板DNA所編碼的多肽進(jìn)行修飾的變體多肽,并且相對(duì)于由模板DNA所編碼的多肽,可以具有改變的生物學(xué)活性?!爸亟MDNA分子”是使用重組DNA技術(shù)和用于將DNA序列連接在一起的方法連接在一起的DNA序列的組合,所述技術(shù)和方法如Sambrook等,1989所述。用語(yǔ)“植物”指任何植物,特別是農(nóng)藝上有用的植物(例如,種子植物),“植物細(xì)胞”是植物的結(jié)構(gòu)和生理單位,其包括細(xì)胞壁但也可指原生質(zhì)體。植物細(xì)胞可以為分離的單細(xì)胞或培養(yǎng)細(xì)胞的形式,或者作為高級(jí)的有組織的單元的一部分,例如,植物組織,或者分化成存在于植物發(fā)育的任何階段的結(jié)構(gòu)的植物器官。這類結(jié)構(gòu)包括一種或多種植物器官, 包括但不限于果實(shí)、枝條(shoot)、莖、葉、花瓣等。優(yōu)選術(shù)語(yǔ)“植物”包括整個(gè)植物、枝條營(yíng)養(yǎng)器官/結(jié)構(gòu)(例如,葉、莖和塊莖)、根、花和花器官/結(jié)構(gòu)(例如,苞、萼片、花瓣、雄蕊、心皮、花藥和胚珠)、種子(包括胚、胚乳和種皮)和果實(shí)(成熟子房)、植物組織(例如,維管組織、基本組織等)及細(xì)胞(例如,保衛(wèi)細(xì)胞、卵細(xì)胞、毛狀體等),及其子代。可在本發(fā)明中使用的植物的種類通常與適用于轉(zhuǎn)化技術(shù)的高等或低等植物的種類一樣寬,包括被子植物(單子葉和雙子葉植物)、裸子植物、蕨類以及多細(xì)胞藻類。其包括多種倍性水平的植物,包括非整倍體、多倍體、二倍體、單倍體和半合子。包括在本發(fā)明范圍內(nèi)的是植物界的高等和低等植物的所有屬和種。此外包括成熟植物、種子、枝條和幼苗,以及從其衍生的部分、繁殖材料(例如,種子和果實(shí))和培養(yǎng)物,例如細(xì)胞培養(yǎng)物。一年生、多年生的單子葉植物和雙子葉植物是用于產(chǎn)生轉(zhuǎn)基因植物的優(yōu)選的宿主生物體。此外,在所有觀賞植物、林業(yè)、果實(shí),或觀賞樹木、花、切花、灌木或草皮中使用重組系統(tǒng)或者根據(jù)本發(fā)明的方法是有利的。所述植物可包括但不限于苔蘚植物如苔綱Ofepaticae)(獐耳細(xì)辛屬(h印aticas))和蘚綱(Musci)(蘚類(mosses));蕨類植物 (pteridophyte)如蕨(fern)、馬尾(horsetail)和石松類(clubmosses);裸子植物如松柏綱(conifers)、蘇鐵綱(cycads)類植物、銀杏綱(ginkgo)以及買麻藤綱(Gnetaeae);藻類如綠藻綱(Chlorophyceae)、褐藻綱(Phaeophpyceae)、紅藻綱(Rhodophyceae)、粘藻綱 (Myxophyceae)、黃藻綱(Xanthophyceae)、娃藻綱(Bacillariophyceae)(娃藻(diatoms)) 禾口裸藻綱(Euglenophyceae)。用于本發(fā)明目的的植物可包括薔薇科(Rosaceae)家族如玫瑰,杜鵑花科(Ericaceae)如北美杜鵑花(rhododendrons)和杜鵑花(azaleas),大戟科 (Euphorbiaceae)如 M木(poinsettias)禾口巴豆(croton),石竹禾斗(Caryophyllaceae)如石竹花(pinks),茄科(Solanaceae)如矮牽?;?petunias),苦苣苔科(Gesneriaceae)如非洲紫羅蘭(African violet),鳳仙花科(Balsaminaceae)如鳳仙花(touch-me-not),蘭科(Orchidaceae)如蘭花(orchids),鳶尾科(Iridaceae)如唐菖蒲(gladioli)、鳶尾屬植物(iris)、小蒼蘭(freesia)、番紅花(crocus),菊禾斗(Compositae)如萬(wàn)壽菊(marigold), 牛兒苗禾斗(Geraniaceae)如天竺奏(geraniums),百合禾斗(Liliaceae)如Drachaena,桑禾斗 (Moraceae)如榕樹(ficus),天南星科(Araceae)如蔓綠絨(philodendron)和許多其他植物。此外,根據(jù)本發(fā)明的轉(zhuǎn)基因植物選自雙子葉農(nóng)作物植物,如,例如選自豆科 (Leguminosae)的植物如豌豆、苜蓿和大豆;傘形科(Umbelliferae),特別是胡蘿卜屬(Daucus)(非常特別地是胡蘿卜(D.carota))和芹屬(Apium)(非常特別地是旱芹 (A. graveolens var. dulce))以及許多其他植物;茄科,特別是番茄屬(Lycopersicon) 和茄屬(Solanum),非常特別地是番茄(L. esculentum)、馬鈴薯(S. tuberosum)和茄子 (S.melongena)、煙草和許多其他植物;辣椒屬(Capsicum),非常特別地是辣椒(C. annum) 和許多其他植物;豆科(Leguminosae),特別是大豆屬(Glycine),非常特別地是大豆(G max)和許多其他植物;十字花科(Cruciferae),特別是蕓苔屬(Brassica),非常特別地是甘藍(lán)型油菜(B. napus)(油料種子油菜)、白菜型油菜(B. campestris)(甜菜)、甘藍(lán) (B. oleracea cv Tastie)、花挪菜(B. oleracea cv Snowball Y)禾口挪菜(B. oleracea cv Emperor);擬南芥屬(Arabidopsis),非常特別地是擬南芥(A. thaliana)和許多其他植物; 菊科(Compositae),特別是萵苣屬(Lactuca),非常特別地是萵苣(L. sativa)和許多其他植物。另外優(yōu)選是樹木,如蘋果樹、梨樹、溫柏、李樹、櫻桃樹、桃樹、油桃樹、杏樹、番木瓜樹、 芒果樹以及包括針葉樹和落葉樹的其他木本物種,如楊樹、松樹、美洲杉、雪松、橡樹等。最優(yōu)選根據(jù)本發(fā)明的轉(zhuǎn)基因植物可選自單子葉作物植物。當(dāng)指根據(jù)本發(fā)明的轉(zhuǎn)基因植物或指本發(fā)明的轉(zhuǎn)錄調(diào)控序列的來(lái)源時(shí),術(shù)語(yǔ)“單子葉植物”旨在包括單子葉植物的所有科、屬和種。優(yōu)選是禾本科(Gramineae)植物如,例如,谷類如玉米、稻、小麥、大麥、高粱、 栗、黑麥、黑小麥,或燕麥,以及其他非谷類單子葉植物如甘蔗或香蕉。尤其優(yōu)選是谷物(玉米)、稻、大麥、小麥、黑麥和燕麥。最優(yōu)選是玉米和稻的所有品種?!帮@著增加”是大于測(cè)量技術(shù)固有誤差界限的增加,優(yōu)選增加約2倍或更多?!帮@著減少”是指大于測(cè)量技術(shù)固有誤差界限的減少,優(yōu)選減少約2倍或更多。
發(fā)明詳述本發(fā)明提供分離的核酸分子,其包括在植物細(xì)胞中優(yōu)選在單子葉植物中指導(dǎo)有效連接的核酸片段轉(zhuǎn)錄的植物核苷酸序列。具體地,本發(fā)明提供用于在單子葉植物中調(diào)控表達(dá)的表達(dá)盒,包括i)至少一個(gè)單子葉植物基因的轉(zhuǎn)錄調(diào)控核苷酸序列,所述的單子葉植物基因選自咖啡酰-CoA-O-甲基轉(zhuǎn)移酶基因、C8,7-固醇異構(gòu)酶基因、富含羥脯氨酸的糖蛋白(HRGP)基因、乳酸脫氫酶基因以及葉綠體蛋白12樣基因,和與之功能性相連的ii)至少一個(gè)核苷酸序列,其與所述轉(zhuǎn)錄調(diào)控序列是異源的。優(yōu)選本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列包括至少一個(gè)相應(yīng)基因的啟動(dòng)子序列(例如, 位于相應(yīng)基因的轉(zhuǎn)錄起點(diǎn)上游,能誘導(dǎo)下游序列轉(zhuǎn)錄的序列)。本發(fā)明的轉(zhuǎn)錄調(diào)控核苷酸序列可包括所述基因的啟動(dòng)子序列,但可進(jìn)一步包括其他元件如5’ -非翻譯序列、增強(qiáng)子、內(nèi)含子等。優(yōu)選所述啟動(dòng)子序列指導(dǎo)有效連接的核苷酸片段在植物或植物細(xì)胞中的轉(zhuǎn)錄,例如,連接的植物DNA包括結(jié)構(gòu)或調(diào)控基因的開放讀框。本發(fā)明的轉(zhuǎn)錄調(diào)控序列可與多種5’非翻譯區(qū)、內(nèi)含子(優(yōu)選表達(dá)增強(qiáng)內(nèi)含子)以及轉(zhuǎn)錄終止序列(在下文所更詳細(xì)地描述)組合。已證明,通過(guò)與內(nèi)含子和/或轉(zhuǎn)錄終止序列的組合,可有利地調(diào)控本發(fā)明的轉(zhuǎn)錄調(diào)控序列的組織特異性。在大多數(shù)組合中,所得的表達(dá)盒顯示在根和仁中偏好性或特異性表達(dá)。然而,可獲得其他表達(dá)特異性(例如,組成型表達(dá))。在根中具有表達(dá)活性的轉(zhuǎn)錄調(diào)控序列可用于改變根組織的功能,改進(jìn)生長(zhǎng)速度,改善對(duì)根偏好的病原體、害蟲、除草劑或不利天氣調(diào)控的抗性,用于土壤的解毒以及擴(kuò)大植物可生長(zhǎng)的土壤或環(huán)境的范圍。根豐富的或根特異性基因表達(dá)將提供一種機(jī)制,據(jù)此可改變形態(tài)學(xué)和代謝,以改善產(chǎn)量并生產(chǎn)更大量的有用蛋白質(zhì)。然而,在某些組合中,轉(zhuǎn)錄調(diào)控序列可顯示強(qiáng)組成型表達(dá)譜。在需要在植物發(fā)育的所有(或者大部分)時(shí)間在所有(或者大部分)組織中表達(dá)的情況下,優(yōu)選組成型啟動(dòng)子。 其他組織特異性可以取決于與本發(fā)明的轉(zhuǎn)錄調(diào)控序列組合使用的調(diào)控元件。下表1舉例說(shuō)明優(yōu)選從中分離本發(fā)明啟動(dòng)子的基因、所述基因的功能、所述基因編碼的cDNA,以及由所述基因編碼的蛋白質(zhì)(ORF)。表1 優(yōu)選從中分離本發(fā)明啟動(dòng)子的基因、所述基因的推定功能、由所述基因編碼的cDNA和蛋白質(zhì)
29
權(quán)利要求
1.在單子葉植物中調(diào)控表達(dá)的表達(dá)盒,包括i)至少一個(gè)單子葉植物基因的轉(zhuǎn)錄調(diào)控核苷酸序列,所述的單子葉植物基因選自C8, 7-固醇異構(gòu)酶基因、富含羥脯氨酸的糖蛋白(HRGP)基因、乳酸脫氫酶基因以及葉綠體蛋白 12樣基因,和與之功能性相連的 )至少一個(gè)核苷酸序列,其與所述轉(zhuǎn)錄調(diào)控序列是異源的。
2.權(quán)利要求1的表達(dá)盒,其中轉(zhuǎn)錄調(diào)控核苷酸序列可從多肽編碼基因的單子葉植物基因組DNA中獲得,其中所述多肽al)包含單子葉植物乳酸脫氫酶蛋白的至少一個(gè)序列基序,所述序列基序選自如下氨基酸序列i)SLSELGFDA(SEQ ID NO 76),ii)VIGAGNVGMA(SE Q ID NO 77),iii)IVTAGARQI(SE Q ID NO 78),iv)L(F/Y)RKIVP(SE Q ID NO 79),ν)GFPASRV(SEQ ID NO 80),Vi)RF(L/I)AEHL(SEQ ID NO 81),vii)QAYMVGEH(SE Q ID NO 82),viii)ALEGIRRAV(SEQ ID NO :83),和ix)GYSVAS(L/I)A(SE Q ID NO 84),或者bl)編碼單子葉植物乳酸脫氫酶蛋白,與選自SEQ ID NO 至少90%的氨基酸序列同一性,或者b2)編碼單子葉植物富含羥脯氨酸的糖蛋白,與選自SEQ 具有至少90%的氨基酸序列同一性,或者b3)編碼單子葉植物C8,7-固醇異構(gòu)酶蛋白,與SEQ ID 90 %的氨基酸序列同一性,或者b4)編碼單子葉植物葉綠體蛋白12樣蛋白,與SEQ ID NO :31所述的多肽具有至少90% 的氨基酸序列同一性,或者
3.權(quán)利要求1或2的表達(dá)盒,其中轉(zhuǎn)錄調(diào)控核苷酸序列來(lái)自玉米或稻植物。
4.權(quán)利要求1至3中任一項(xiàng)的表達(dá)盒,其中轉(zhuǎn)錄調(diào)控核苷酸序列來(lái)自選自稻C8,7-固醇異構(gòu)酶基因、玉米富含羥脯氨酸的糖蛋白(HRGP)基因、玉米乳酸脫氫酶基因、稻葉綠體蛋白12基因及其功能等同物的植物基因。
5.權(quán)利要求4的表達(dá)盒,其中功能等同物基因編碼與選自SEQID NO :10、18、26、31、 60,65和75所述多肽具有至少90%氨基酸序列同一性的多肽。
6.在單子葉植物中調(diào)控表達(dá)的表達(dá)盒,包括a)至少一個(gè)在單子葉植物中有功能的轉(zhuǎn)錄調(diào)控核苷酸序列,其包含選自如下序列的至少一個(gè)序列i)SEQ ID NO :6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、 61、62、63、71、72和73所述的序列,和2=26,60和65所述的多肽具有 ID NO: 18和75所述的多肽 NO: 10所述的多肽具有至少ii)i)中序列的至少50個(gè)連續(xù)堿基的片段;和iii)與SEQID NO :6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、29、56、57、 58、61、62、63、71、72或73所述轉(zhuǎn)錄調(diào)控核苷酸序列基本上相似、具有至少60%序列同一性的核苷酸序列;和iv)能與SEQ ID NO :6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、四、56、 57、58、61、62、63、71、72或73所述的轉(zhuǎn)錄調(diào)控核苷酸序列或其互補(bǔ)物在7%十二烷基硫酸鈉(SDS)、0. 5麗aP04、lmM EDTA 中于 50°C雜交,用 2XSSC、0. SDS 于 50°C洗滌的條件下雜交的核苷酸序列;和ν)能與如下核酸雜交的核苷酸序列,其中所述核酸包含SEQ ID N0:6、7、8、ll、12、13、 14、15、16、19、20、21、22、23、24、27、28、29、56、57、58、61、62、63、71、72 或 73 所述的轉(zhuǎn)錄調(diào)控核苷酸序列或其互補(bǔ)物的50至200個(gè)或更多個(gè)連續(xù)核苷酸;和vi)上述i)至ν)核苷酸序列中任一的互補(bǔ)物或反向互補(bǔ)物核苷酸序列, 禾口b)至少一個(gè)核酸序列,其與所述轉(zhuǎn)錄調(diào)控序列是異源的。
7.權(quán)利要求1至5中任一項(xiàng)的表達(dá)盒,其中轉(zhuǎn)錄調(diào)控核苷酸序列如權(quán)利要求6中所定義。
8.權(quán)利要求6或7的表達(dá)盒,其中權(quán)利要求6的ii)、iii)、iv)、v)和vi)中所定義的序列能夠在單子葉植物細(xì)胞或生物體中修飾轉(zhuǎn)錄。
9.權(quán)利要求6或7的表達(dá)盒,其中權(quán)利要求6的ii)、iii)、iv)、v)和vi)中所定義的序列與 SEQ ID NO :6、7、8、11、12、13、14、15、16、19、20、21、22、23、24、27、28、四、56、57、58、 61、62、63、71、72或73所述的轉(zhuǎn)錄調(diào)控核苷酸序列基本上具有相同的轉(zhuǎn)錄調(diào)控活性。
10.權(quán)利要求6的表達(dá)盒,其中權(quán)利要求6的iv)或ν)中所定義的序列在7%十二烷基硫酸鈉(SDS)、0· 5M NaPO4UmM EDTA 中于 50°C雜交,用 0. 1XSSC、0. 1%SDS 于 65°C洗滌的嚴(yán)謹(jǐn)條件下與所指定的靶序列雜交。
11.權(quán)利要求1至10中任一項(xiàng)的表達(dá)盒,其中核酸序列的表達(dá)導(dǎo)致蛋白質(zhì)的表達(dá),或者反義RNA、正義或雙鏈RNA的表達(dá)。
12.權(quán)利要求1至11中任一項(xiàng)的表達(dá)盒,其中表達(dá)盒還包括至少一種選自如下的元件a)植物表達(dá)基因的5’非翻譯區(qū),和b)植物表達(dá)基因的內(nèi)含子序列,和c)植物表達(dá)基因的轉(zhuǎn)錄終止序列。
13.權(quán)利要求12的表達(dá)盒,其中轉(zhuǎn)錄終止序列選自SEQID NO :32、34和35所述的序列。
14.權(quán)利要求12的表達(dá)盒,其中5’非翻譯區(qū)與轉(zhuǎn)錄調(diào)控序列來(lái)自相同的基因。
15.權(quán)利要求12的表達(dá)盒,其中內(nèi)含子序列具有增強(qiáng)表達(dá)的特性。
16.權(quán)利要求12或15的表達(dá)盒,其中內(nèi)含子序列是遍在蛋白、肌動(dòng)蛋白或醇脫氫酶基因的內(nèi)含子。
17.權(quán)利要求1至16中任一項(xiàng)的表達(dá)盒,其中核酸序列的表達(dá)賦予植物農(nóng)藝學(xué)上有價(jià)值的性狀。
18.分離的核酸序列,包含至少一個(gè)如SEQID NO :6、7、8、11、12、13、19、20或21所述的轉(zhuǎn)錄調(diào)控核苷酸序列。
19.載體,含有權(quán)利要求1至17中任一項(xiàng)所述的表達(dá)盒。
20.轉(zhuǎn)基因宿主細(xì)胞或者非人生物體,含有權(quán)利要求1至17中任一項(xiàng)所述的表達(dá)盒或者權(quán)利要求19所述的載體。
21.轉(zhuǎn)基因植物,含有權(quán)利要求1至17中任一項(xiàng)所述的表達(dá)盒或者權(quán)利要求19所述的載體。
22.用于在單子葉植物中鑒定和/或分離轉(zhuǎn)錄調(diào)控核苷酸序列的方法,其特征在于所述鑒定和/或分離利用如SEQ ID N0:10、18、26、31、60、65或75所述氨基酸序列的編碼核酸序列,或者至少15個(gè)堿基的所述核酸序列的部分。
23.權(quán)利要求22的方法,其中核酸序列如SEQID NO :9、17、25、30、59、64或74所述, 或其至少15個(gè)堿基的部分。
24.權(quán)利要求22或23的方法,其中所述鑒定和/或分離通過(guò)選自聚合酶鏈?zhǔn)椒磻?yīng)、雜交和數(shù)據(jù)庫(kù)篩選的方法實(shí)現(xiàn)。
25.提供用于在單子葉植物中進(jìn)行異源表達(dá)的轉(zhuǎn)基因表達(dá)盒的方法,包括步驟I.利用至少一個(gè)核酸序列或其部分從單子葉植物分離轉(zhuǎn)錄調(diào)控核苷酸序列,其中所述序列編碼SEQ ID N0:10、18、26、31、60、65或75所述的多肽,或者至少15個(gè)堿基的所述核酸序列的部分,和II.將所述轉(zhuǎn)錄調(diào)控核苷酸序列功能性連接于其他目的核苷酸序列,后者與所述轉(zhuǎn)錄調(diào)控核苷酸序列異源。
26.權(quán)利要求22至25中任一項(xiàng)的方法,其中分離所述轉(zhuǎn)錄調(diào)控核苷酸序列所采用的核苷酸序列編碼這樣的多肽,所述多肽包含 al)單子葉植物乳酸脫氫酶蛋白的至少一個(gè)序列基序,其中序列基序選自如下氨基酸序列i)SLSELGFDA(SEQIDNO:76)ii)VIGAGNVGMA(SEQIDNO:77)iii)IVTAGARQI(SEQIDNO:78)iv)L(F/Y)RKIVP(SEQIDNO:79)ν)GFPASRV(SEQIDNO:80)Vi)RF(L/I)AEHL(SEQIDNO:81)vii)QAYMVGEH(SEQIDNO:82)viii)ALEGIRRAV(SEQIDNO:83)ix)GYSVAS(L/I)A(SEQIDNO:84)
全文摘要
本發(fā)明涉及在單子葉植物中調(diào)控表達(dá)的表達(dá)盒,包括至少一個(gè)可從如下單子葉植物基因中獲得的轉(zhuǎn)錄調(diào)控核苷酸序列咖啡酰-CoA-O-甲基轉(zhuǎn)移酶基因、C8,7-固醇異構(gòu)酶基因、富含羥脯氨酸的糖蛋白(HRGP)基因、乳酸脫氫酶基因以及葉綠體蛋白12樣基因。更優(yōu)選轉(zhuǎn)錄調(diào)控序列可從玉米或稻中獲得。所述轉(zhuǎn)錄調(diào)控序列對(duì)于根/仁偏好性表達(dá)、葉/胚乳偏好性表達(dá)、根/穗絲/仁偏好性表達(dá)或組成型表達(dá)尤其有用。
文檔編號(hào)C12Q1/68GK102277377SQ20111023447
公開日2011年12月14日 申請(qǐng)日期2006年2月8日 優(yōu)先權(quán)日2005年2月9日
發(fā)明者A·多布森, C·E·羅赫, C·達(dá)曼, E·托倫, H-S·宋, M·莫拉 申請(qǐng)人:巴斯福植物科學(xué)有限公司