專(zhuān)利名稱(chēng):耐高溫酪氨酰tRNA合成酶基因及其編碼的多肽和制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及突變或遺傳工程,尤其涉及一種耐高溫酪氨酰tRNA合成酶基因及編碼的多肽和制備方法。
背景技術(shù):
酪氨酰tRNA合成酶(tyrosyl-tRNA synthetase)是一個(gè)典型的半位點(diǎn)激活蛋白酶(half-of-the-sites activity)。這個(gè)蛋白酶是一個(gè)對(duì)稱(chēng)的二聚物,它由可鑒別的亞基組成,每個(gè)都有一個(gè)完全的激活位點(diǎn)。酪氨酰tRNA合成酶的功能是將酪氨酸與相應(yīng)的tRNA連接活化成為酪氨酰tRNA。
酪氨酰tRNA的氨?;▋蓚€(gè)步驟首先,酪氨酸和ATP反應(yīng),在釋放焦磷酸鹽的同時(shí)生成一個(gè)中介蛋白酶--酪氨酰苷酸;然后,在酶的作用下,酪氨酰苷酸反應(yīng)生成酪氨酰tRNA以及一個(gè)AMP。
根據(jù)短信號(hào)序列的不同,tRNA合成酶可以分為兩個(gè)不同的類(lèi)型Class I以及Class II。CLASS I通常是單體酶,由20個(gè)基本氨基酸中的10個(gè)氨基酸組成。它們的alpha-羧基團(tuán)連結(jié)到tRNA分子中腺嘌呤的2′氫氧基上;CLASS II通常是二聚的或者四聚的蛋白酶,而且由20個(gè)氨基酸中的另外10個(gè)組成,它們把氨基酸連結(jié)到tRNA分子的3′氫氧基上。兩種類(lèi)型在氨基酸激活區(qū)域上也是不同的。CLASS I有一個(gè)平行的beta區(qū)域,CLASS II則相反。
酪氨酰tRNA合成酶屬于Class I而且是一個(gè)有47個(gè)亞基的二聚體。氨基末端有320個(gè)殘基用于活化反應(yīng)中,然而羧基末端,99個(gè)殘基用于tRNA的限定以及酪氨酰tRNA的形成。包括了限制性酪氨酸-AMP的合成酶晶體結(jié)構(gòu)已經(jīng)被精確測(cè)定。這個(gè)活性的中介蛋白酶在匹配tRNA的缺乏情況下仍穩(wěn)定,而且被12個(gè)氫鍵限定。
每個(gè)蛋白酶的單體有三個(gè)區(qū)域一個(gè)包含6個(gè)beta折疊的alphs/beta區(qū)域(殘基1-220);一個(gè)alpha-螺旋的區(qū)域(殘基248-318);一個(gè)不規(guī)則c′末端區(qū)域(殘基319-418)。這個(gè)n-末端的319殘基在激活反應(yīng)來(lái)具有首要的作用,而不規(guī)則c′末端區(qū)域則在tRNA限定中具有作用。酪氨酰tRNA合成酶的結(jié)構(gòu)決定于酪氨酸和酪氨酰苷酸的聯(lián)合體中。這個(gè)結(jié)構(gòu)包含了一個(gè)典型的RossmanFold核苷粘合物區(qū)域,這個(gè)區(qū)域包括了中軸的5-單鏈平行的beta-折疊,而且酪氨酰tRNA合成酶是這個(gè)折疊末端的粘合物。
細(xì)菌的酪氨酰tRNA合成酶,擁有一個(gè)靈活連接的C′末端區(qū)域,大約80個(gè)殘基,這些使蛋白酶的晶體結(jié)構(gòu)混亂。在2.0絕對(duì)條件下,已經(jīng)測(cè)定了晶體形態(tài)的嗜熱喜熱酪氨酰tRNA合成酶的結(jié)構(gòu),其中c-末端區(qū)域被排序而且發(fā)現(xiàn)50個(gè)殘基的折疊與核糖體蛋白S4的部分的c-末端區(qū)域是一樣的。也已經(jīng)鑒定了在2.8絕對(duì)條件下的嗜惹喜熱的酪氨酰tRNA合成酶以及轉(zhuǎn)運(yùn)酪氨酸的聯(lián)合物的晶體結(jié)構(gòu)。在這個(gè)結(jié)構(gòu)中,c-末端區(qū)域限定于反密碼子的長(zhǎng)臂和DNA的不穩(wěn)定長(zhǎng)臂。而且,tRNA交叉限定于二聚酶的兩個(gè)亞基,同時(shí)顯著限定了class I酪氨酰tRNA合成酶的識(shí)別模型于它的同類(lèi)tRNA相似物classII合成酶。
由1269個(gè)堿基對(duì)組成的大腸桿菌酪氨酰tRNA合成酶基因的結(jié)構(gòu),已經(jīng)完全測(cè)序。這個(gè)基因有一個(gè)密碼子轉(zhuǎn)運(yùn)模型,這個(gè)模型是典型的高度表達(dá)蛋白而且與其他大腸桿菌中氨基酸轉(zhuǎn)運(yùn)合成酶的基因相同??s氨酸的純化以及排列已經(jīng)應(yīng)用于定位N-末端和95%的轉(zhuǎn)運(yùn)蛋白序列的確定。后者產(chǎn)出47,403兆拉德(Mr of 47,403)的大腸桿菌酪氨酰tRNA合成酶,而且揭示出與來(lái)自于桿狀菌staerothermophilus的類(lèi)比蛋白酶的初級(jí)結(jié)構(gòu)有高度相似性。桿狀菌staerothermophilus中酪氨酰tRNA合成酶的基本結(jié)構(gòu)已經(jīng)從克隆基因的核苷序列,以及純化蛋白酶的氨基酸肽鏈序列中推斷出來(lái)。此酶有分子量為47316的分子以及與大腸桿菌中酪氨酰tRNA合成酶有56%的相同。酪氨酸酰苷的粘合區(qū)域,可以定位于部分多肽鏈的N-末端,而且可以在兩種蛋白酶中高度的保存。
騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis),是生活在我國(guó)云南省騰沖縣的熱泉中的一種微生物,是一種嗜熱的真細(xì)菌(eubacteria),最適生長(zhǎng)溫度為75攝氏度,厭氧生長(zhǎng),革蘭氏染色反應(yīng)呈陽(yáng)性。它由中國(guó)科學(xué)院微生物所首先發(fā)現(xiàn)并進(jìn)行了分類(lèi)學(xué)上的分析。菌種保存在中國(guó)微生物保存中心MB4T(Chinese collection of microorganisms AS l.2430T=JCM 11007T)。該嗜熱厭氧菌是我國(guó)特有的一個(gè)物種,其體內(nèi)所具有的耐高溫酪氨酰tRNA合成酶也具有自己特有的結(jié)構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的之一是提供一種分離的,編碼具有耐高溫酪氨酰tRNA合成酶活性的多肽的核苷酸序列。
本發(fā)明的目的之二是提供一種分離的具有耐高溫酪氨酰tRNA合成酶活性多肽。
本發(fā)明的另一目的還提供了嗜熱厭氧菌的酪氨酰tRNA合成酶重組載體、含有重組載體的宿主細(xì)胞,以及制備蛋白的方法。
本發(fā)明一方面提供一種能編碼具有耐高溫酪氨酰tRNA合成酶活性的多肽的核苷酸序列。所說(shuō)的核苷酸序列編碼具有SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與酪氨酰tRNA合成酶相關(guān)。核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類(lèi)型包括缺失、無(wú)義、插入、錯(cuò)義。
本發(fā)明另一方面提供了一種耐高溫酪氨酰tRNA合成酶活性的多肽。該多肽具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
本發(fā)明還提供了一種制備耐高溫酪氨酰tRNA合成酶的方法,它包括以下步驟1)分離出編碼耐高溫酪氨酰tRNA合成酶的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫酪氨酰tRNA合成酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫酪氨酰tRNA合成酶。
本發(fā)明涉及嗜熱厭氧菌的耐高溫酪氨酰tRNA合成酶基因的分離及表達(dá)。以騰沖嗜熱厭氧菌全基因組測(cè)序與分析為基礎(chǔ),克隆分離了耐高溫酪氨酰tRNA合成酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫酪氨酰tRNA合成酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫酪氨酰tRNA合成酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫酪氨酰tRNA合成酶活性的多肽的方法。
圖1是測(cè)序文庫(kù)構(gòu)建步驟流程圖;圖2是測(cè)序與數(shù)據(jù)分析流程圖。
具體實(shí)施例方式
本發(fā)明提供了分離的,編碼耐高溫酪氨酰tRNA合成酶活性的多肽的多聚核苷酸分子,該核苷酸分子是通過(guò)對(duì)騰沖嗜熱厭氧菌全基因組測(cè)序與分析而獲得的,具有SEQ.ID NO.1的核苷酸序列,它編碼具有406氨基酸的多肽,該多肽推測(cè)分子量為46684道爾頓。
本發(fā)明還提供了一種重組載體,該載體包含本發(fā)明的分離的核苷酸分子,以及包含有重組載體的宿主細(xì)胞。同時(shí),本發(fā)明包括構(gòu)建該重組載體和宿主細(xì)胞的方法,以及用重組工程技術(shù)生產(chǎn)耐高溫酪氨酰tRNA合成酶的方法。
本發(fā)明進(jìn)一步地提供了一種分離的耐高溫酪氨酰tRNA合成酶或多肽,它具有SEQ.ID NO.2氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本發(fā)明中,“分離的”DNA是指該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來(lái),還指該DNA或片段已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開(kāi),而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開(kāi)。
在本發(fā)明中,“耐高溫酪氨酰tRNA合成酶基因”指編碼具有耐高溫酪氨酰tRNA合成酶活性的多肽的核苷酸序列,如SEQ.ID NO.1的核苷酸序列及其簡(jiǎn)并序列。該簡(jiǎn)并序列是指該序列中有一個(gè)或多個(gè)密碼子被編碼相同氨基酸的簡(jiǎn)并密碼子所取代后而產(chǎn)生的序列。由于公知的密碼子的簡(jiǎn)并性,所以與SEQ IDNO.1核苷酸序列同源性低至約70%的簡(jiǎn)并序列也能編碼出SEQ ID NO.2所述的氨基酸序列。該術(shù)語(yǔ)還包括能在中度嚴(yán)謹(jǐn)條件下,更佳地在高度嚴(yán)謹(jǐn)條件下與SEQ ID NO.1的核苷酸序列雜交的核苷酸序列。該術(shù)語(yǔ)還包括與SEQ ID NO.1核苷酸序列同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本發(fā)明中,“分離的”蛋白的多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計(jì))。純度可以用任何合適的方法進(jìn)行測(cè)量,如用柱層析,PAGE或HPLC法測(cè)量多肽的純度。分離的多肽基本上不含天然狀態(tài)下的伴隨其的組份。
在本發(fā)明中,“耐高溫酪氨酰tRNA合成酶”指具有耐高溫酪氨酰tRNA合成酶活性的SEQ ID NO.2序列的多肽。該術(shù)語(yǔ)還包括SEQ ID NO.2序列的變異體,這些變異體具有與天然耐高溫酪氨酰tRNA合成酶相同的功能。這些變異體包括(但不限于)若干個(gè)氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸,也可以是不影響序列的修飾形式上的差異。例如,為本領(lǐng)域所公知的,用性能相近或相似的氨基酸進(jìn)行取代時(shí),通常不會(huì)改變蛋白質(zhì)的功能。又比如,在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸通常也不會(huì)改變蛋白質(zhì)的功能。該術(shù)語(yǔ)還包括耐高溫酪氨酰tRNA合成酶的活性片段和活性衍生物。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的各種質(zhì)粒,粘粒,噬菌體及反轉(zhuǎn)錄病毒等。在生產(chǎn)本發(fā)明的耐高溫酪氨酰tRNA合成酶時(shí),可以將耐高溫酪氨酰tRNA合成酶基因序列與表達(dá)調(diào)控序列相連,從而形成耐高溫酪氨酰tRNA合成酶表達(dá)載體。表達(dá)載體含有復(fù)制起始點(diǎn)和表達(dá)調(diào)控序列,啟動(dòng)子,增強(qiáng)子和必要的加工信息位點(diǎn)。表達(dá)載體還必須含有可供選擇的標(biāo)記基因,如a)提供對(duì)抗生素或其它毒性物質(zhì)(氨芐青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白質(zhì)或b)互補(bǔ)營(yíng)養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒(méi)有的必需營(yíng)養(yǎng)成分的蛋白質(zhì)。各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知或生產(chǎn)廠(chǎng)商說(shuō)明書(shū)注明的。這些表達(dá)載體可以用本領(lǐng)域技術(shù)人員公知的重組DNA技術(shù)制備,如可參考Sambrook等人,1989或Ausubel等人,1992。
重組表達(dá)載體可以用本領(lǐng)域熟知的方法引入宿主細(xì)胞,這些方法包括電轉(zhuǎn)化法,氯化鈣法,基因槍法等。將外源重組載體導(dǎo)入宿主細(xì)胞的過(guò)程稱(chēng)為“轉(zhuǎn)化”。通過(guò)培養(yǎng)宿主細(xì)胞,誘導(dǎo)所需蛋白的表達(dá),并通過(guò)本領(lǐng)域所熟知的蛋白分離技術(shù),如柱層析等得到所需的蛋白質(zhì)。也可采用固相技術(shù)等人工合成該蛋白質(zhì)。
在本發(fā)明中,術(shù)語(yǔ)“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核細(xì)胞如大腸桿菌,枯草桿菌等。常用的真核細(xì)胞如酵母細(xì)胞,或各種動(dòng)植物細(xì)胞。本發(fā)明的耐高溫酪氨酰tRNA合成酶基因全長(zhǎng)序列或其片段通??梢杂镁酆厦告?zhǔn)椒磻?yīng)(PCR)擴(kuò)增法,重組法,或人工合成的方法獲得。對(duì)于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開(kāi)的有關(guān)核苷酸序列來(lái)設(shè)計(jì)引物,用本領(lǐng)域技術(shù)人員已知的常規(guī)方法制備的嗜熱厭氧菌全基因組DNA為模板,擴(kuò)增而得到有關(guān)序列。一旦獲得了有關(guān)序列,就可以將其克隆入有關(guān)載體,再轉(zhuǎn)入宿主細(xì)胞,然后通過(guò)常規(guī)方法從增殖后的宿主細(xì)胞中分離得到大批量的有關(guān)序列。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠(chǎng)商所建議的條件。
實(shí)施例1構(gòu)建測(cè)序文庫(kù)測(cè)序文庫(kù)的構(gòu)建采用全基因組霰彈法(shotgun)進(jìn)行。首先培養(yǎng)騰沖嗜熱厭氧菌,培養(yǎng)方法按(Yanfen Xue,2000)改進(jìn)的MB培養(yǎng)基(Balch et al.,1979),按Marmur(1961)方法收集細(xì)菌,提取總DNA。為了保證測(cè)序文庫(kù)構(gòu)建的隨機(jī)性,最大程度地避免產(chǎn)生斷裂熱點(diǎn)的問(wèn)題,采用多種方法、不同條件的建庫(kù)原則。先采用物理剪切方法(包括超聲波法及用Hydroshear Machine進(jìn)行剪切),其次根據(jù)該菌基因組特征選用AluI進(jìn)行隨機(jī)部分酶切。物理剪切時(shí)采用不同強(qiáng)度處理樣品,酶切時(shí)通過(guò)設(shè)置酶量梯度處理樣品。處理后的樣品經(jīng)平末端處理后,采用電泳分部收集1.5-4kb DNA片段,與去磷酸化的經(jīng)SmaI酶切的pUC18進(jìn)行連接,連接產(chǎn)物通過(guò)電轉(zhuǎn)化E.coli DH5α構(gòu)建了隨機(jī)測(cè)序的文庫(kù)。同時(shí),為了便于以后重疊群(contig)的搭接還構(gòu)建了長(zhǎng)插入片段(10kb左右)的測(cè)序文庫(kù)(將基因組DNA以Sau3AI隨機(jī)部分酶切,電泳收集10kb左右的片段,與去磷酸化的經(jīng)BamHI酶切的pUC18進(jìn)行連接、構(gòu)建文庫(kù))。該文庫(kù)經(jīng)兩個(gè)末端的測(cè)序在完成圖(finishing)的過(guò)程中可以得到contig之間的關(guān)系,并可以解決較大的洞(gap)對(duì)補(bǔ)洞造成的困難。建庫(kù)流程如(見(jiàn)圖1)。
實(shí)施例2基因組測(cè)序在完成騰沖嗜熱厭氧菌基因組的測(cè)序時(shí),主要使用了兩種全自動(dòng)測(cè)序儀ABI377和MegaBACE 1000。這兩種測(cè)序儀都是利用電泳原理進(jìn)行測(cè)序(見(jiàn)圖2),每次可完成96個(gè)樣品。ABI377是PE公司的產(chǎn)品,是ABI系列的一種。它屬于平板凝膠電泳測(cè)序儀。MegaBACE 1000是法瑪西亞公司的產(chǎn)品,屬于毛細(xì)管凝膠電泳測(cè)序儀。
實(shí)施例3Basecalling和測(cè)序質(zhì)量監(jiān)控所謂Basecalling是指從測(cè)序儀上得到的原始數(shù)據(jù)文件中得到正確的堿基序列的過(guò)程。由于測(cè)序儀上得到的是A,T,G,C四種堿基對(duì)應(yīng)的不同波長(zhǎng)的光的強(qiáng)度變化軌跡(trace),需要用計(jì)算機(jī)采取一定的算法從中正確識(shí)別出不同的軌跡對(duì)應(yīng)的堿基。我們使用的是Phred軟件(Ewing B,Hillier L,1998),原因是其結(jié)果更可靠,并且其結(jié)果輸出更便于同一軟件包中的其他程序進(jìn)行進(jìn)一步的分析。
Phred進(jìn)行Basecalling的算法原理,是根據(jù)軌跡中各個(gè)峰的形狀,間距,以及信噪比等因素,判斷堿基類(lèi)型,同時(shí)對(duì)這個(gè)堿基給出可信度信息,即堿基的測(cè)序質(zhì)量。在大規(guī)模測(cè)序中,測(cè)序質(zhì)量的監(jiān)控是十分重要的,它直接影響對(duì)測(cè)序的決策,包括文庫(kù)的構(gòu)建,覆蓋率的大小。同時(shí)對(duì)測(cè)序?qū)嶒?yàn)中可能出現(xiàn)的失誤能及時(shí)反饋。
實(shí)施例4序列拼接所謂序列拼接,就是把全基因組霰彈法,又稱(chēng)鳥(niǎo)槍法隨機(jī)測(cè)序得到的樣品序列組裝成連續(xù)的重疊群(contig),主要利用它們之間的重疊序列作參考??紤]到測(cè)序中存在載體的影響,需要先對(duì)樣品序列進(jìn)行去載體處理。這里所用的軟件cross_match和后面拼接所用的軟件Phrap都是美國(guó)Washington大學(xué)的軟件(Gordon D,Abajian C,1998),其基本原理為Swith-Waterman算法(Waterman MS,1990)。這是一種動(dòng)態(tài)算法,在考慮了兩兩序列之間的比較之后,可以得到一組序列的公有序列(consensus sequence)。去除載體后的樣品序列再用Phrap進(jìn)行拼接。在拼接時(shí),堿基的測(cè)序質(zhì)量也被考慮了,所得到的公有序列各堿基的可信度,由組成該公有序列的樣品的測(cè)序質(zhì)量計(jì)算得到。
實(shí)施例5基因注釋在大體得到基因組的大部分序列(完成工作框架圖)后,就需要對(duì)基因組進(jìn)行注釋?zhuān)ㄟM(jìn)行開(kāi)讀框架(Open Reading Frame,ORF)的預(yù)測(cè),基因功能的預(yù)測(cè),以及特殊RNA片段的分析等。
第一步采用缺省參數(shù)的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)軟件預(yù)測(cè)基因編碼序列,然后所有預(yù)測(cè)的開(kāi)讀框和非編碼區(qū)(intergenic region)都用BLAST軟件(Altschul,S.F.et al.1997)與NCBI的無(wú)冗余蛋白數(shù)據(jù)庫(kù)(non-redundant protein database)比較來(lái)發(fā)現(xiàn)可能漏掉的基因。在判斷一個(gè)基因的起始點(diǎn)時(shí),將參考各種相關(guān)信息,如序列同源性,核糖體結(jié)合位點(diǎn),可能的信號(hào)肽序列和啟動(dòng)子序列等。如果在一個(gè)開(kāi)讀框內(nèi)出現(xiàn)多個(gè)啟動(dòng)子時(shí),一般采用第一個(gè)啟動(dòng)子作為基因的起始點(diǎn)。采用TransTerm軟件(Ermolaeva,M.D.2000)在非編碼區(qū)預(yù)測(cè)不依賴(lài)于Rho(ρ)因子的轉(zhuǎn)錄終止子。如果該終止子位于一個(gè)基因的下游區(qū)的太遠(yuǎn)處,則可能暗示一個(gè)小基因的丟失或測(cè)序錯(cuò)誤人為地縮短了該基因,可作為進(jìn)一步分析的參考。在確定移框突變和點(diǎn)突變時(shí),主要根據(jù)與數(shù)據(jù)庫(kù)中的蛋白質(zhì)的相似性來(lái)判斷。如果出現(xiàn)一個(gè)蛋白質(zhì)對(duì)應(yīng)于兩個(gè)彼此相鄰的編碼序列的情況,則被認(rèn)為是一個(gè)無(wú)活性基因(假基因pseudogenes),因?yàn)檫@說(shuō)明這兩個(gè)編碼序列之間由于突變而產(chǎn)生異常中止現(xiàn)象,進(jìn)而使基因失去活性。所有分析結(jié)果再用Artemis sequence viewer軟件(Rutherford,K.et al.2000)進(jìn)行手工分析。一些明顯與其它編碼序列有重疊的開(kāi)讀框,長(zhǎng)度小于150堿基對(duì)并且在已有數(shù)據(jù)庫(kù)中沒(méi)有同源性和其中沒(méi)有明顯的啟動(dòng)子或終止區(qū)域的開(kāi)讀框?qū)⒈蝗コ?br>
蛋白質(zhì)的功能片段(motif)和功能區(qū)域(domain)分別采用與Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫(kù)進(jìn)行比對(duì)分析,結(jié)果再用InterPro數(shù)據(jù)庫(kù)(Apweiler,R.et al.2001)進(jìn)行匯總分析。根據(jù)NCBI的COGs數(shù)據(jù)庫(kù)(Tatusov,R.L.et al.2001)并且參照其他數(shù)據(jù)庫(kù)的查詢(xún)結(jié)果來(lái)確定蛋白質(zhì)在COGs分類(lèi)中的功能分類(lèi)和可能的代謝途徑。用TMHMM軟件(Krogh,A.et al.2001)來(lái)確認(rèn)膜蛋白、ABC轉(zhuǎn)運(yùn)蛋白和跨膜功能域。采用革蘭氏陰性菌為參數(shù),用SIGNALP2.0軟件(Nielsen,H.et al.1999)分析信號(hào)肽區(qū)域。(4)補(bǔ)洞在完成基因組的工作框架圖之后,就要進(jìn)行更加困難的補(bǔ)洞工作,即完成整個(gè)基因組100%的測(cè)序,得到一個(gè)環(huán)形基因組。主要工作就是把前面得到的contig連接起來(lái)。主要方法包括A.利用測(cè)序中的正反向測(cè)序樣品信息在測(cè)序過(guò)程中,我們有意對(duì)某些樣品進(jìn)行了雙向測(cè)序,即同時(shí)測(cè)序某個(gè)插入片段的兩端,再將所得序列與其他序列一起進(jìn)行拼接。由于這一對(duì)序列在基因組上的關(guān)系一定,其之間的距離大致已知,根據(jù)這一信息,一可以確認(rèn)某段contig是否可靠,二是當(dāng)這一對(duì)序列分別位于不同的contig上時(shí),可以確定這兩個(gè)contig的方向關(guān)系和位置關(guān)系,為進(jìn)一步設(shè)計(jì)實(shí)驗(yàn)提供參考。
B.長(zhǎng)插入片段及Cosmid末端測(cè)序基于同樣的原理,我們可以構(gòu)建不同長(zhǎng)度的插入片段文庫(kù),只對(duì)其兩端測(cè)序,然后拼接,分析其具體位置。這些文庫(kù)包括長(zhǎng)度為9-12Kb的長(zhǎng)插入片段庫(kù)和20-40Kb左右的Cosmid文庫(kù)。具體分析方法同上所述。
C. PCR和末端延伸Walking實(shí)驗(yàn)根據(jù)A和B所提供的contig方向和位置關(guān)系,進(jìn)一步的生物化學(xué)實(shí)驗(yàn)就可以進(jìn)行了。如設(shè)計(jì)一對(duì)引物進(jìn)行PCR擴(kuò)增,或以某一contig末端序列合成引物進(jìn)行末端延伸(Walking)來(lái)補(bǔ)洞等。
實(shí)施例6酪氨酰tRNA合成酶的制備和提純根據(jù)實(shí)施例中基因注釋得到的酪氨酰tRNA合成酶全長(zhǎng)編碼序列(SEQ IDNO.1),設(shè)計(jì)能擴(kuò)增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性?xún)?nèi)切酶位點(diǎn),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的測(cè)序文庫(kù)的質(zhì)粒DNA為模板,經(jīng)PCR擴(kuò)增后,在保證閱讀框正確的前提下重組至pGEX-2T載體(Pharmacia,Piscataway,NJ)。再將重組載體轉(zhuǎn)化入大腸桿菌DH5α中(轉(zhuǎn)化方法為CaCL2法或電轉(zhuǎn)化法),篩選鑒定得到含有表達(dá)載體的工程菌DH5α-pGEX-2T-TyrS。
挑取單菌落的工程菌DH5α-pGEX-2T-TyrS于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)37℃過(guò)夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時(shí),至OD600達(dá)0.5后,加入IPTG至終濃度1mmol/L,繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時(shí)。取培養(yǎng)時(shí)間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀(guān)察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時(shí)間增加而增加的菌株即為表達(dá)所需蛋白的工程菌。
按上述方法誘導(dǎo)表達(dá)所需蛋白的工程菌后,將細(xì)菌離心沉淀,按每400ml菌加入20ml PBS飽和的50%谷胱甘肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了所需蛋白的谷胱甘肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl還原型谷胱甘肽洗脫液,室溫置10分鐘,上清即為洗脫的蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE電泳,檢測(cè)純化效果。在46684道爾頓處的蛋白質(zhì)條帶即為酪氨酰tRNA合成酶。
序列表1. SEQ ID NO.1(1)序列特征a.長(zhǎng)度1221堿基對(duì)b.類(lèi)型DNAc.鏈型雙鏈d.幾何結(jié)構(gòu)線(xiàn)性(2)分子類(lèi)型核苷酸(3)序列描述gtgtcggtgctagaggttttaaaagaaagaggatatatcgctcaaatgacccatgaagaagagatagagaagcttttagaaaaagaaaagataactttttacataggttttgaccccactgctgacagcctgcacgtaggtcatttgattcagataatgacaatggctcacatgcagagagccggccacaggccaattgtgcttttgggaggcggaactgcccttataggagatccgagcggtagaactgacatgagaaaaatgctcactaaagaggaaatagatagaaatgctgaagccttcaaaaagcagatggagagattcatcgatttttctgagggcaaagctataatggaaaacaatgctaaatggctccttggcttgaattacatagaatttttgagagatataggtgttcactttactgtaaatcgaatgcttgaggcggaagcttttaagactcgcatggaaagaggccttactttccttgagtttaattacatgctaatgcaggcttatgactttttagagctttacaggcgctatggctgtgtaatgcagatgggaggaaatgatcagtggtctaatataatcgctggagtagagcttatacgcaaaaaagaaggcaagcaggcttatggaatgacttttgtgctccttacaacaagcgaaggaaagaagatgggcaaaactgaaaaaggcgctatatggctggatcctaaaaagacttctccttatgaattttatcagtactggagaaatataggagacgcagatgtggaaaaggctttggctcttttgactttccttcctatggacgaagtgagaaggcttgggagactaagggataaggagataaacgaagctaaaaaggtactggcttttgaggttacaaagcttgtacacggtgaagaagaagccctaaaggctcagaaggcggccgaagctctgtttgaaggcggcggtgaaatggaacacgtgcccagcattgaagtctctcaggacataatcggaaggaaaatagttgatgtgctttttgaagctaaagtcataccttcaaagagcgagggaagaaggcttattcagcagggaggcctttacatcaacgacaagagggtagaaaacgtggatgaatgcataaaagaagagatggtaaaagaaaatgccattcttgtaagaaaagggaaaaaggaatatcacaggttattggtaaaggaatga2. SEQ ID NO.2(1)序列特征a.長(zhǎng)度406氨基酸b.類(lèi)型多肽c.鏈型單鏈d.幾何結(jié)構(gòu)立體(2)分子類(lèi)型蛋白質(zhì)(3)序列描述Val Ser Val Leu Glu Val Leu Lys Glu Arg Gly Tyr Ile Ala Gln Met1 5 10 15Thr His Glu Glu Glu Ile Glu Lys Leu Leu Glu Lys Glu Lys Ile Thr20 25 30Phe Tyr Ile Gly Phe Asp Pro Thr Ala Asp Ser Leu His Val Gly His35 40 45Leu Ile Gln Ile Met Thr Met Ala His Met Gln Arg Ala Gly His Arg50 55 60Pro Ile Val Leu Leu Gly Gly Gly Thr Ala Leu Ile Gly Asp Pro Ser65 70 75 80Gly Arg Thr Asp Met Arg Lys Met Leu Thr Lys Glu Glu Ile Asp Arg85 90 95Asn Ala Glu Ala Phe Lys Lys Gln Met Glu Arg Phe Ile Asp Phe Ser100 105 110Glu Gly Lys Ala Ile Met Glu Asn Asn Ala Lys Trp Leu Leu Gly Leu115 120 125Asn Tyr Ile Glu Phe Leu Arg Asp Ile Gly Val His Phe Thr Val Asn130 135 140Arg Met Leu Glu Ala Glu Ala Phe Lys Thr Arg Met Glu Arg Gly Leu145 150 155 160Thr Phe Leu Glu Phe Asn Tyr Met Leu Met Gln Ala Tyr Asp Phe Leu165 170 175Glu Leu Tyr Arg Arg Tyr Gly Cys Val Met Gln Met Gly Gly Asn Asp180 185 190Gln Trp Ser Asn Ile Ile Ala Gly Val Glu Leu Ile Arg Lys Lys Glu195 200 205Gly Lys Gln Ala Tyr Gly Met Thr Phe Val Leu Leu Thr Thr Ser Glu210 215 220Gly Lys Lys Met Gly Lys Thr Glu Lys Gly Ala Ile Trp Leu Asp Pro225 230 235 240Lys Lys Thr Ser Pro Tyr Glu Phe Tyr Gln Tyr Trp Arg Asn Ile Gly245 250 255Asp Ala Asp Val Glu Lys Ala Leu Ala Leu Leu Thr Phe Leu Pro Met260 265 270Asp Glu Val Arg Arg Leu Gly Arg Leu Arg Asp Lys Glu Ile Asn Glu275 280 285Ala Lys Lys Val Leu Ala Phe Glu Val Thr Lys Leu Val His Gly Glu290 295 300Glu Glu Ala Leu Lys Ala Gln Lys Ala Ala Glu Ala Leu Phe Glu Gly305 310 315 320Gly Gly Glu Met Glu His Val Pro Ser Ile Glu Val Ser Gln Asp Ile325 330335Ile Gly Arg Lys Ile Val Asp Val Leu Phe Glu Ala Lys Val Ile Pro340 345 350Ser Lys Ser Glu Gly Arg Arg Leu Ile Gln Gln Gly Gly Leu Tyr Ile355 360 365Asn Asp Lys Arg Val Glu Asn Val Asp Glu Cys Ile Lys Glu Glu Met370 375 380Val Lys Glu Asn Ala Ile Leu Val Arg Lys Gly Lys Lys Glu Tyr His385 390 395 400Arg Leu Leu Val Lys Glu40權(quán)利要求
1.一種分離的DNA分子,其特征在于它是編碼具有耐高溫酪氨酰tRNA合成酶蛋白活性的多肽的核苷酸序列。
2.如權(quán)利要求1所述的DNA分子,其特征在于所說(shuō)的核苷酸序列編碼具有SEQ.ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與耐高溫酪氨酰tRNA合成酶相關(guān)。
3.如權(quán)利要求1所述的DNA分子,其特征在于所說(shuō)的核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類(lèi)型包括缺失、無(wú)義、插入、錯(cuò)義。
4.一種分離出的多肽,其特征在于它具有耐高溫酪氨酰tRNA合成酶活性。
5.如權(quán)利要求4所述的多肽,其特征在于它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
6.一種載體,其特征在于它含有權(quán)利要求1中之DNA。
7.一種宿主細(xì)胞,其特征在于它是用權(quán)利要求6所述載體轉(zhuǎn)化的原核細(xì)胞或真核細(xì)胞。
8.一種制備耐高溫酪氨酰tRNA合成酶的方法,其特征在于該方法包括以下步驟1)分離出編碼耐高溫酪氨酰tRNA合成酶基因的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫酪氨酰tRNA合成酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫酪氨酰tRNA合成酶。
全文摘要
本發(fā)明公開(kāi)了一種耐高溫酪氨酰tRNA合成酶基因及編碼的多肽和制備方法。它涉及編碼具有活性或其功能等同變異體的分離的DNA和利用重組DNA技術(shù)以所述分離的DNA生產(chǎn)具有耐高溫酪氨酰tRNA合成酶活性的多肽或其功能等同變異體。以騰沖嗜熱厭氧菌全基因組測(cè)序與分析為基礎(chǔ),克隆分離了耐高溫酪氨酰tRNA合成酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫酪氨酰tRNA合成酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫酪氨酰tRNA合成酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫酪氨酰tRNA合成酶活性的多肽的方法。
文檔編號(hào)C12N15/63GK1379094SQ0211073
公開(kāi)日2002年11月13日 申請(qǐng)日期2002年2月1日 優(yōu)先權(quán)日2002年2月1日
發(fā)明者于軍, 李蔚, 張麗敏, 胡松年, 田宇清 申請(qǐng)人:杭州華大基因研發(fā)中心