專利名稱:哺乳動(dòng)物的特洛德樣基因和蛋白質(zhì)的制作方法
相互參照的相關(guān)申請(qǐng)本申請(qǐng)要求了1996年5月30日提交的臨時(shí)專利申請(qǐng)60/018,684的優(yōu)先權(quán)。
關(guān)于聯(lián)邦政府贊助的研究或開(kāi)發(fā)的聲明不適用。
背景技術(shù):
本發(fā)明涉及骨形態(tài)生成蛋白領(lǐng)域,更具體地涉及BMP-1/Tld基因家族中的基因。
哺乳動(dòng)物如小鼠和人骨骼的形成,是通過(guò)一系列骨形態(tài)生成蛋白(BMP)來(lái)控制的。在參與成骨的7種已知BMP中,6種(稱為BPM-2到BMP-7)屬于TGF-β超家族。第7種BMP(稱為BMP-1)并不類似于TGF-β,而是衍生自不同的基因家族。BMP-1基因家族成員通常有下列結(jié)構(gòu)域蝦紅素樣金屬蛋白酶結(jié)構(gòu)域,一個(gè)或多個(gè)在其它蛋白中被認(rèn)為與Ca++結(jié)合的EGF樣基序和許多CUB結(jié)構(gòu)域,CUB結(jié)構(gòu)域是介導(dǎo)補(bǔ)體成分Clr/Cls中蛋白之間相互作用的基序,也已明確它存在于各種參與發(fā)育過(guò)程的蛋白中。Wozney,J.M.等在Science 242:1528-1534(1988)中描述了BMP-1的核苷酸序列。
其它非哺乳類動(dòng)物中發(fā)現(xiàn)的蛋白質(zhì)中也存在哺乳動(dòng)物BMP-1結(jié)構(gòu)域的結(jié)構(gòu)。這些蛋白質(zhì)包括果蠅屬特洛德(tolloid)(Tld)(Shimell,M.J.,Cell 67:469-481(1991))、特洛德樣果蠅屬基因產(chǎn)物(Tlr-11或tolkin)(Nguyen,T.,Dev.Biol.166:569-586(1994)和Finelli,A.L.,等,Genetics 141:271-281(1995))、海膽B(tài)MP-1同系物(suBMP-1)(Hwang,S.-P.,等,Development 120:559-568(1994))、兩種相關(guān)的海膽發(fā)育基因產(chǎn)品SpAN和BP10(Reynolds,S.D.,等,Development 114:769-786(1992)和Lepage,T.,等,Development 114:147-164(1992))、Xenopus BMP-1(xBMP-1)(Maeno,M.等,Gene 134:257-261(1993)和哺乳動(dòng)物特洛德(mTld)(Takahara,K.等,J.Biol.Chem.269:32572-32578(1994))。在傳閱評(píng)述金屬蛋白酶蝦紅素家族的文章(Bond.J.S.和R.J.Benynon,Protein Science 4:1247-1261在1249頁(yè)(1995))中只是簡(jiǎn)單地提到了從非洲爪蟾屬(Xenopus)獲得的特洛德樣基因(xolloid),但沒(méi)有公開(kāi)關(guān)于基因本身的數(shù)據(jù)。編碼這些蛋白質(zhì)的基因的一些核酸序列是已知的。盡管靠?jī)蓚€(gè)不同的可變剪接的mRNA分子,哺乳動(dòng)物BMPl基因編碼了BMP-1蛋白和mTld蛋白。本段中提到的論文均結(jié)合入本文作參考。
發(fā)明概述本發(fā)明概括地描述了一種新的哺乳動(dòng)物特洛德樣基因產(chǎn)物(mTll)及其關(guān)聯(lián)基因,該基因與mTld以及其它已知的BMP-1相關(guān)蛋白和基因不同。并且報(bào)道了小鼠和人的基因版本。
本發(fā)明的一個(gè)目的是提供涉及脊椎動(dòng)物中胞外基質(zhì)沉積(如成骨)的基因和基因產(chǎn)物。
本發(fā)明的另一個(gè)目的是為合理開(kāi)發(fā)抑制特洛德樣基因活性治療纖維變性、結(jié)疤、瘢痕瘤、外科粘連等的藥物提供靶分子。
本發(fā)明還有一個(gè)目的是提供一種重組DNA構(gòu)建物、以及該構(gòu)建物所編碼的、用來(lái)加速傷口和骨折愈合的蛋白質(zhì)。
本發(fā)明還有一個(gè)目的是提供對(duì)小鼠染色體8中央部分作圖的標(biāo)記基因。
本發(fā)明另一個(gè)目的是提供對(duì)人染色體4的4q32-4q33區(qū)域作圖的標(biāo)記基因。
本發(fā)明還有一個(gè)目的是提供探測(cè)哺乳動(dòng)物細(xì)胞中非BMP-1骨形態(tài)生成蛋白基因的探針的核苷酸序列。
本發(fā)明的一個(gè)特征是所述小鼠基因的3'非翻譯區(qū)含有新的簡(jiǎn)單重復(fù)序列。
本發(fā)明的其它目的、特征和優(yōu)點(diǎn)在參照附圖進(jìn)行下列詳細(xì)敘述時(shí)將會(huì)更為清晰。
附圖簡(jiǎn)述
圖1提供了小鼠mTll cDNA的圖譜,包括5'和3'非翻譯部分。排列在mTllcDNA下方的行列是用來(lái)比較的一些相關(guān)基因的cDNA克隆的示意圖,它們按照與mTll相同的比例來(lái)繪制?;虍a(chǎn)物結(jié)構(gòu)域?qū)?yīng)的cDNA部分用高亮度表示。帶點(diǎn)方框、濃陰影方框、條紋方框、淡陰影方框以及黑色方框分別表示信號(hào)肽、前區(qū)(proregion)、金屬蛋白酶、CUB和EGF結(jié)構(gòu)域。白色方框表示不同蛋白質(zhì)獨(dú)有的結(jié)構(gòu)域。波浪線表示5'和3'非翻譯區(qū)??s寫含義是:mTld,哺乳動(dòng)物tolloid;mBMP-1哺乳動(dòng)物BMP-1;xBMP-1,非洲爪蟾屬BMP-1;suBMP-l,海膽B(tài)MP-1;Tld,果蠅屬tolloid;Tlr-1,果蠅屬tolloid相關(guān)基因;SpAN和BP10,相關(guān)的海膽發(fā)育基因。限制性酶包括Bg,BglⅡ;C,ClaⅠ;E,EcoRⅠ;H,HincⅡ;N,NcoⅠ;S,SmaⅠ;St,StuⅠ。
圖2將公開(kāi)的mTll基因的氨基酸序列與mTld基因的氨基酸序列進(jìn)行序列對(duì)比。圖中顯示了兩種蛋白質(zhì)共同的結(jié)構(gòu)域結(jié)構(gòu)。結(jié)構(gòu)域如圖1所示。采用GAP程序(Genetics Computer Group,Madison,Wisconsin)進(jìn)行序列對(duì)比,GAP重量為3.0、GAP長(zhǎng)度重量為0.1,并附帶推定信號(hào)肽序列的手工對(duì)比。半胱氨酸用方框框出,潛在的天冬酰胺(Asn)糖基化連接位點(diǎn)用下劃線表示,金屬肽內(nèi)切蛋白酶活性位點(diǎn)基序HEXXH用點(diǎn)線方框框出。
圖3顯示了小鼠染色體8中心部分的示意圖。圖譜管理程序(Map Manager)(Manly K.,"A Macintosh Program for Storage and Analysis of Experimental GeneticMapping Data,"Mammalian Genome 4:301-313(1993))比較了Tll與其它來(lái)自TJLBSS反交板(backcross panel)的基因座的分離數(shù)據(jù),進(jìn)行連接分析,產(chǎn)生了此圖譜。TJL BSS反交板數(shù)據(jù)從Jackson Laboratories Public DataBase(http://www.jax.org/Resources/documents/cmdata)獲得。
發(fā)明詳述這樣從小鼠分離獲得基本純的哺乳動(dòng)物特洛德樣(mTll)cDNA制品從小鼠系BMP-1tmlblh的胚胎成纖維細(xì)胞制備cDNA文庫(kù),用小鼠BMP-1基因中約330堿基對(duì)的AatⅡ-DrdⅠ限制性片段作探針,在低嚴(yán)格性條件下進(jìn)行篩選(如下文實(shí)施例所述)。BMP-1tmlblh是剔除了BMP-1基因(KO)的小鼠,它是缺失BMP-1基因的等位基因純合子小鼠。SEQ ID NO:1中所示的探針與BMP-1tmlblh基因剔除小鼠所缺失的BMP-1基因360堿基對(duì)片段對(duì)應(yīng)。由于cDNA文庫(kù)中沒(méi)有BMP-1,因此在DNA序列水平上篩選不能回收只與BMP-1相關(guān)的序列,回收的是與BMP-1不同的序列。
在篩選中,基因組只有一個(gè)區(qū)域未被回收(見(jiàn)圖1)。最初篩選中獲得的KO3和KO7-2的重疊性cDNA克隆視為基本純的制品,它包括了大多數(shù)但并非全部編碼序列。篩選用標(biāo)準(zhǔn)程序在低嚴(yán)格性條件下進(jìn)行(Ausubel,F.M.,等,CurrentProtocols in Molecular Biology,Wiley,New York(1987)CA)。其余編碼序列通過(guò)高嚴(yán)格性條件對(duì)胚胎成纖維細(xì)胞cDNA文庫(kù)進(jìn)行再次篩選獲得,從而揭示了另一個(gè)延伸至基因5'非翻譯部分的克隆(KO8-2)。獲得的KO8-2顆粒也視為基本純的制品。
本領(lǐng)域普通技術(shù)人員可以象發(fā)明者那樣將分開(kāi)的克隆序列連接在一起,產(chǎn)生SEQ ID NO:2中所示的全長(zhǎng)cDNA。本文提供的SEQ ID NO:2是一個(gè)有5'和3'側(cè)翼非翻譯序列的3039堿基對(duì)的開(kāi)放讀框。開(kāi)放讀框編碼哺乳動(dòng)物特洛德樣蛋白質(zhì)(稱為mTll)。這里所示的序列表示三個(gè)cDNA克隆(KO3,KO7-2和KO8-2)組合的核酸序列。在mTll基因的3'非翻譯區(qū)中,有一個(gè)是以前沒(méi)有報(bào)道過(guò)的簡(jiǎn)單重復(fù)序列(SSR)。SSR有如下序列(GT)20GC(GT)7GC(GT)7GCAT(GT)3GCAT(GT)3(SEQ ID NO:2中的核苷酸4148-4239).SEQ ID NO:2中的序列數(shù)據(jù)可從Genbank Accession Number U34042獲得。
如果DNA制品中已經(jīng)除去了90%以上任何有DNA的宿主細(xì)胞的細(xì)胞物質(zhì),則認(rèn)為任何來(lái)源的含有mTll基因序列的DNA分子制品是基本上純的。例如,細(xì)胞物質(zhì)可利用商品純化試劑盒(如購(gòu)自Qiagen的試劑盒(Chatsworth,CA))從核酸制劑中除去。較佳的是,核酸制品中超過(guò)10%的核酸分子含有全部或部分mTll基因或其部分。更佳的是,超過(guò)50%,甚至還要佳的是超過(guò)90%的核酸分子含有mTll基因全部或部分序列。
注意到其它與mTll有關(guān)的基因以及BMP-l家族的其它成員用可以比較的篩選方法從BMP-1/mTld和mTll均缺失的雙缺失胚胎cDNA文庫(kù)中分離獲得。這種雙缺失突變動(dòng)物可將擁有兩個(gè)基因座之一的雜合動(dòng)物交配而制得。
小鼠mTll基因圖示位于染色體8中心近D8Bir22處(1994年染色體8委員會(huì)報(bào)告中位于31號(hào)位置)(Ceci,J.D.,"Mouse Chromosome 8,"Mammalian Genome5:S124-S138(1994))。這同一個(gè)染色體大區(qū)是四個(gè)會(huì)導(dǎo)致明顯發(fā)育異常的基因缺損圖譜位點(diǎn),四種異常是Hook(Hk)、腎上皮質(zhì)素發(fā)育異常(Acd)、Quinky(Q)和成比例型侏儒(Proportional dwarf)(pdw)。相反,BMP-1圖示位于小鼠染色體14(Ceci,J.D.,等,"An interspecific backcross linkage map of the proximal half of mousechromosome 14,"Genomics 6:673-678(1990))。
圖2顯示所提到的鼠mTll蛋白質(zhì)結(jié)構(gòu)域結(jié)構(gòu),系從與小鼠特洛德蛋白質(zhì)產(chǎn)物的序列相似性預(yù)測(cè)而得。由于它與其它特洛德樣蛋白質(zhì)有相似性,預(yù)計(jì)公開(kāi)的mTll基因編碼的產(chǎn)物將是在發(fā)育和自身穩(wěn)定過(guò)程(如傷口愈合)中起關(guān)鍵作用的蛋白酶。此蛋白質(zhì)可能參與了胞外基質(zhì)前體變成大分子結(jié)構(gòu)的成熟過(guò)程。當(dāng)給予組織有效量的該蛋白質(zhì)時(shí),也許此蛋白質(zhì)在生長(zhǎng)因子體內(nèi)外的激活中起作用,也許會(huì)促進(jìn)發(fā)育和自身穩(wěn)定過(guò)程。另一方面,如果mTll蛋白質(zhì)的功能被抑制,則這些過(guò)程本身也會(huì)抑制,在輸送有效量抑制劑時(shí),可有利地利用該性質(zhì)以防止纖維變性和過(guò)度疤痕或其它傷口愈合異常。通過(guò)在選定的已知與人類在相同的生化或生理學(xué)上相似的家畜和模型動(dòng)物上,進(jìn)行此蛋白質(zhì)用量范圍的測(cè)試,可以容易地確定輸送至靶位點(diǎn)以激活發(fā)育和自身穩(wěn)定性所需該蛋白質(zhì)的有效量。例如,在皮膚傷口愈合的試驗(yàn)中,豬皮是人皮的合適模型。同樣,也可確定Tll蛋白質(zhì)抑制劑的有效量。有效量是指能比未處理傷口有效地減少纖維變性、結(jié)疤或瘢痕瘤發(fā)生的傷口給藥量,纖維變性、結(jié)疤或瘢痕瘤程度的評(píng)價(jià)根據(jù)臨床或獸醫(yī)上所接受的標(biāo)準(zhǔn)而定。這種測(cè)試最好在通常被視為與人皮膚有關(guān)的模型體系中進(jìn)行。
由于此蛋白質(zhì)在動(dòng)物組織中的含量通常非常少,因此BMP體系蛋白質(zhì)的工作能力受到抑制。本文證明了,以前未知的基因mTll可以克隆入含有(在合適宿主細(xì)胞內(nèi))有效轉(zhuǎn)錄啟動(dòng)子的合適的表達(dá)載體中,繼而導(dǎo)入合適的宿主細(xì)胞并在其中表達(dá),并以天然構(gòu)型純化,所有這些均采用常規(guī)方法(參見(jiàn)下文)。這樣表達(dá)的蛋白質(zhì)可保留在宿主細(xì)胞內(nèi),或可以分泌到胞外生長(zhǎng)培養(yǎng)基中(如果在構(gòu)建物上提供合適的信號(hào)序列的話)。蛋白質(zhì)可用常規(guī)的方法從細(xì)胞或生長(zhǎng)培養(yǎng)基中純化獲得。
合適的轉(zhuǎn)錄啟動(dòng)子是載體pFASTBacl(該載體可購(gòu)自Gibco-BRL)上發(fā)現(xiàn)的桿狀病毒極遲啟動(dòng)子。另一個(gè)合適的啟動(dòng)子是桿狀病毒立即早期啟動(dòng)子,如在pAcPIEl載體(Novagen,Madison,WⅠ)上發(fā)現(xiàn)的啟動(dòng)子。任何其它有利的表達(dá)元件如增強(qiáng)子、終止子等本領(lǐng)域已知的元件可包括在合適的表達(dá)載體中。合適的宿主可以是昆蟲組織培育細(xì)胞,如細(xì)胞系Sf21、Sf9、或High Five(Invitrogen,sanDiego,CA)。
含有小于全部編碼序列的該基因的合適部分也可有利地克隆入合適的載體中,以形成基因重組構(gòu)建物。應(yīng)當(dāng)理解,根據(jù)本發(fā)明制得的構(gòu)建物不必含有整個(gè)mTll基因座或編碼區(qū),但應(yīng)含有能編碼所需功能的一個(gè)或多個(gè)部分,或含有該基因其它有用性能(如與所需基因組序列互補(bǔ))的部分。本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)理解,mTll蛋白質(zhì)(以及編碼mTll蛋白質(zhì)的相應(yīng)的遺傳物質(zhì))在大小和序列上的某些變化不會(huì)干擾其功能。在構(gòu)建含有全部或部分mTll基因的基因構(gòu)建物以及其編碼的蛋白質(zhì)時(shí),這些經(jīng)修飾的形式可用已知的有利方法進(jìn)行工程化。
只要所產(chǎn)生的蛋白質(zhì)保留了與家族其它成員相關(guān)的所需功能,認(rèn)為這些改變、修飾、添加和缺失均在本發(fā)明的范圍內(nèi)。如果蛋白質(zhì)在層粘連蛋白-5斷裂標(biāo)準(zhǔn)試驗(yàn)中保留了切斷活性,則蛋白質(zhì)是感受態(tài)蛋白。也希望蛋白質(zhì)能保留對(duì)前膠原的C-蛋白酶活性(如Kessler,E.,等在Science 271:360-362(1996)中關(guān)于BMP-1所述,該內(nèi)容結(jié)合入本文作參考)。本領(lǐng)域技術(shù)人員對(duì)這些測(cè)定方法伴有的必要的控制是熟悉的。或者,希望蛋白質(zhì)由于這種變化而喪失某些功能,這類情況也包括在本發(fā)明的范圍內(nèi)。
這樣制得的基本純的蛋白質(zhì)制品被確定為制品,其中mTll蛋白質(zhì)的層粘連蛋白-5斷裂活性不受制品中存在的其它蛋白質(zhì)或分子的影響。根據(jù)蛋白質(zhì)打算采用的場(chǎng)合,mTll蛋白質(zhì)在基本純的蛋白質(zhì)制品中的量至少應(yīng)為10%,至少50%為佳,至少75%為更佳,至少95%為最佳。通過(guò)用親和標(biāo)記物對(duì)蛋白質(zhì)作標(biāo)記,并使制品通過(guò)對(duì)標(biāo)記物有親和性的柱,可增加此蛋白質(zhì)制品中感興趣的蛋白質(zhì)。也可采用一種加工標(biāo)記物,經(jīng)適當(dāng)加工形成的蛋白質(zhì)(缺少斷裂前區(qū))可從加載有粗品的柱中洗脫獲得。
以DNA序列預(yù)測(cè)的mTll翻譯產(chǎn)物(SEQ ID NO:3)預(yù)計(jì)分子量為114,532(pⅠ6.15)。如果翻譯產(chǎn)物在圖2所示的前區(qū)和蛋白酶結(jié)構(gòu)域邊界處斷裂,則成熟的蛋白酶的預(yù)測(cè)分子量為98,007(pⅠ6.18)。
當(dāng)將鼠mTll蛋白質(zhì)序列與其它特洛德樣基因進(jìn)行比較時(shí),兩個(gè)哺乳動(dòng)物蛋白質(zhì)(mTld和mTll)的前區(qū)與兩個(gè)果蠅屬蛋白質(zhì)(Tld或Tlr-1)的前區(qū)間沒(méi)有明顯的同源性。mTll的蛋白酶結(jié)構(gòu)域與Tld有66%相似(47%相同),與Tlr-1有69%相似(52%相同)。mTll與兩個(gè)果蠅屬蛋白質(zhì)的序列相似性比與mTld的相似性稍高,而兩個(gè)哺乳動(dòng)物蛋白質(zhì)中的一個(gè)與兩個(gè)果蠅屬蛋白質(zhì)中的一個(gè)無(wú)明顯關(guān)。通過(guò)采用Sehwartz和Dayhoff的劃痕系統(tǒng)(scoring system)(atlas of Protein Sequenceand Structure,Dayhoff,M.O.,ed.,National Biomedical Research Foundation,Washington,D.C.,p.353-358(1979)),如果排列的氨基酸對(duì)的相似性臨界值大于0.5,則表示氨基酸對(duì)是“相似的”。
mTll mRNA轉(zhuǎn)錄物看來(lái)不會(huì)是可變剪接而成的,因?yàn)橛迷摼幋a區(qū)內(nèi)部的克隆KO3片段(SEQ ID NO:2,核苷酸1113-2745)作為探針只檢測(cè)到有一個(gè)轉(zhuǎn)錄物,而且因?yàn)樵赾DNA文庫(kù)篩選時(shí)只分離得到單一的mTll cDNA。
在成年人的大腦和腎臟中發(fā)現(xiàn)有相當(dāng)強(qiáng)的mTll mRNA表達(dá),在肺和骨骼肌的RNA中表達(dá)水平稍低,在心臟和睪丸的RNA中表達(dá)水平非常低。對(duì)于脾臟或肝臟則沒(méi)有明顯的信號(hào)。在Northern印跡法暴光60小時(shí)后,肝臟測(cè)出非常微弱的信號(hào),但脾臟沒(méi)有檢測(cè)到信號(hào)。
mTll的mRNA表達(dá)方式與以前報(bào)道的BMP-1轉(zhuǎn)錄物和mTld轉(zhuǎn)錄物不同。在交配后7天發(fā)現(xiàn)胚胎總的RNA表達(dá)水平很低,發(fā)育11天時(shí)mRNA水平稍有增加,15天時(shí)有相當(dāng)高水平的峰值,然后在胚胎17天時(shí)降低。相反,發(fā)現(xiàn)BMP-1和mTld轉(zhuǎn)錄物在胚胎7天時(shí)的水平比胚胎11天時(shí)的高。用同一印跡法來(lái)檢測(cè)mTll、BMP-1和mTld轉(zhuǎn)錄水平。
在交配后9.5-11.5天期間胚胎發(fā)育中檢測(cè)到有mTll mRNA轉(zhuǎn)錄物。如以前mTld RNA觀察所見(jiàn),在整個(gè)間充質(zhì)內(nèi)觀察到mTll信號(hào),在未來(lái)骨和神經(jīng)管腹部上方區(qū)域的水平較高。在以前對(duì)mTld觀察時(shí)發(fā)現(xiàn)有信號(hào)的前側(cè)菱腦的相同部位上發(fā)現(xiàn)有強(qiáng)信號(hào),這與底板中的mTll表達(dá)一致。在發(fā)育的脊椎間結(jié)締組織上方發(fā)現(xiàn)有規(guī)律性強(qiáng)表達(dá)。在發(fā)育的肺的間充質(zhì)中發(fā)現(xiàn)有高的mTll信號(hào),相反,在肝臟中沒(méi)有表達(dá)或表達(dá)水平非常低,這反映了Northern印跡分析成年小鼠肺和肝臟中mTll mRNA的相對(duì)量。在交配13.5天后的胚胎旁矢截面中,發(fā)現(xiàn)在舌、鼻發(fā)育過(guò)程中的間充質(zhì)成中、頜骨和發(fā)育腸襻的粘膜下層中有表達(dá)。在發(fā)育的心臟房室瓣膜上方發(fā)現(xiàn)有mTll表達(dá)。
在發(fā)育的小鼠組織中mTll和mTld mRNA分布的主要區(qū)別是在發(fā)育大腦第四腦室底板前庭區(qū)域的神經(jīng)上皮上方所見(jiàn),在該處不同切面上始終發(fā)現(xiàn)有強(qiáng)的mTll表達(dá),而沒(méi)有發(fā)現(xiàn)mTld或BMP表達(dá)。在腦室和新生期大腦導(dǎo)水管的神經(jīng)上皮襯里上方的許多切片中發(fā)現(xiàn)有mTll RNA表達(dá)。在丘腦內(nèi)和側(cè)腦室神經(jīng)上皮襯里中的特殊核上也發(fā)現(xiàn)有mTll表達(dá)。在成年腦中,小腦顆粒層中發(fā)現(xiàn)有強(qiáng)的mTll表達(dá)。在新生期和成年小鼠腦的其它結(jié)構(gòu)上也發(fā)現(xiàn)有較弱的mTll表達(dá)。人腦各部位RNA的Northern印跡法分析也檢測(cè)到在人小腦中有相當(dāng)強(qiáng)的mTll信號(hào)。
注意到的mTll mRNA和先前報(bào)道的mTll分布之間的另一個(gè)區(qū)別是在發(fā)育的脊髓中,在該處mTll表達(dá)比先前報(bào)道的mTld更廣,它超越底板伸展至脊髓的更背側(cè)。在其它發(fā)育組織中,mTll和mTld轉(zhuǎn)錄物的分布是相互重疊的。
特別可以預(yù)計(jì)到的是,通過(guò)采用選擇的包括上述小鼠基因mTll-特異性部位的探針,來(lái)探測(cè)適當(dāng)動(dòng)物細(xì)胞的cDNA文庫(kù),可從其它動(dòng)物中分離獲得mTll基因的等價(jià)物。通過(guò)比較小鼠mTll編碼區(qū)與RMP-1/mTld編碼區(qū)的核酸序列,并選擇與BMP-1不等價(jià)的mTll基因部分,可獲得小鼠mTll基因的mTll特異性部分。作為有效的探針,所選的序列應(yīng)不含會(huì)與許多基因組位點(diǎn)交叉雜交的重復(fù)序列。探針長(zhǎng)度應(yīng)至少約200堿基。已經(jīng)認(rèn)識(shí)到,BMP-1家族該基因在編碼蛋白質(zhì)前區(qū)和C端17個(gè)氨基酸的區(qū)域中是最具可變性的,因此希望可以從mTll基因的這些區(qū)域分離獲得合適的探針。在SEQ ID NO:2中,此區(qū)域?qū)?yīng)于C端部分的大約堿基3599-3650,和前區(qū)的大約堿基701-1051之間的序列。這樣的片段可通過(guò)切口翻譯、末端標(biāo)記或其它本領(lǐng)域已知的合適方法來(lái)轉(zhuǎn)變成探針。也應(yīng)理解,可用分子生物學(xué)中熟知的技術(shù)來(lái)體外合成所需的片段(或?qū)嶋H上是整個(gè)基因)。
這已通過(guò)采用人源DNA來(lái)得以實(shí)現(xiàn)。為了獲得人源mTll序列,用長(zhǎng)度為677bp的小鼠mTll cDNA克隆KO3的NdeⅠ-Eco72Ⅰ片段(對(duì)應(yīng)于CUB4的一部分和CUB5全部以及羧基端)來(lái)篩選人胎盤基因組DNA文庫(kù)。分離獲得含有人TLL基因最后三個(gè)外顯子的基因組克隆151-2。然后用長(zhǎng)度為339bp的小鼠mTll cDNAKO7-2的TapⅠ片段(對(duì)應(yīng)于部分前區(qū))來(lái)篩選相同的人基因組DNA文庫(kù),從而分離得到基因組克隆5-2和8,這兩個(gè)克隆均含有TLL基因5'端的第一個(gè)外顯子。合成獲得對(duì)應(yīng)于5'和3'非翻譯區(qū)序列的寡核苷酸引物,和從人胎兒軟骨RNA合成的cDNA一起使用,對(duì)TLL編碼區(qū)的其余部分進(jìn)行長(zhǎng)距離PCR擴(kuò)增。正向引物為5'-TCTTG CAGTC AGTTG CTTTG CTGG-3'(SEQ ID NO:10)。反向引物為5'-TAGTG CGGCC GCACA TTCCT TTGTG TTC-3'(SEQ ID NO:11)。
人mTll的核酸序列見(jiàn)SEQ ID NO:4。該基因編碼的蛋白質(zhì)見(jiàn)SEQ ID NO:5?;?或其部分)可以小鼠基因的相同方式使用,但其它優(yōu)點(diǎn)是可用于基因治療和診斷等,因?yàn)樗槐叵笮∈髆Tll基因那樣需要使基因適用于人體使用。
因?yàn)閙Tll缺陷也許會(huì)導(dǎo)致人體遺傳異常,故需確定人TLL基因的染色體位置。將一個(gè)長(zhǎng)度為527bp的cDNA PCR產(chǎn)物(對(duì)應(yīng)于人TLL基因的最后3個(gè)外顯子)與EcoRⅠ-消化的基因組DNA(來(lái)自一組人-小鼠細(xì)胞雜交體)的Southern印跡雜交。發(fā)現(xiàn)在5.1和9.5kb人條帶呈強(qiáng)雜交,以及對(duì)來(lái)自30個(gè)雜交系(從17個(gè)不相關(guān)的人細(xì)胞系和4個(gè)小鼠細(xì)胞系衍生獲得)DNA進(jìn)行檢測(cè)(Takahara,K.,等,J.Biol.Chem.269:26280-26285(1994))表明,TLL的分離與人染色體4的分布有關(guān)。在檢測(cè)的細(xì)胞雜交體中,一個(gè)保留了人染色體4易位的雜交體進(jìn)一步將TLL定位在染色體4的長(zhǎng)臂上。細(xì)胞雜交體55R16沒(méi)有完整的染色體4,但是保留了1I/4易位11qter-11p13∷4q25-4qter。這些結(jié)果將TLL定位在4q25-4qter區(qū)。用Trask,B.,Methods Cell Biol.35:1-35(1992)的方法,在人細(xì)胞分裂中期染色體伸展體(spread)上進(jìn)行熒光原位雜交(FISH),對(duì)TLL基因獨(dú)立作圖。用洋地黃毒苷-11-dUTP(Boehringer Mannheim)隨機(jī)引導(dǎo)(Feinberg,A.P.和B.Vogelstein,B.Anal.Biochem.132:6-13(1983)),對(duì)含有TLL第一個(gè)外顯子和大小約為16kb插入片段的人基因組DNA克隆8作標(biāo)記,并將其用作FISH分析的探針。獲得圖象并如上所述(Takahara,K.,等,同上)進(jìn)行分析。在檢測(cè)的16/18(88.8%)的中期伸展體中只在4q32-4q33上發(fā)現(xiàn)有雙倍熒光信號(hào),在10/18的中期伸展體的染色體上發(fā)現(xiàn)有雙熒光信號(hào),而在其它染色體上沒(méi)有信號(hào),這將TLL定位在該區(qū)域中。
通過(guò)選擇預(yù)計(jì)能側(cè)接mTll基因(或基因任何部分)的特異性引物,也可用PCR來(lái)擴(kuò)增對(duì)應(yīng)于mTll區(qū)的基因組部分。該基因的兩個(gè)特異性部分可用作合適的探針。在基因編碼區(qū)外選擇引物是無(wú)效的,因?yàn)榉蔷幋a部分降低的選擇性壓力會(huì)導(dǎo)致小鼠和其它動(dòng)物在這些區(qū)域中發(fā)生更大的差異。特別應(yīng)注意的是,應(yīng)對(duì)人和模型動(dòng)物(如小鼠)BMP家族的此類基因進(jìn)行特別搜尋,以尋求它們與人畸形的關(guān)系(參見(jiàn)例如"The Chicken With a Duck's Feet:It's All in the Biochemical Signal,"TheNew York Times,National Edition,p.B6(1 996年5月21日))。
也可特別預(yù)計(jì)到,mTll基因編碼的大量蛋白質(zhì)可在宿主細(xì)胞中表達(dá)(或從宿主細(xì)胞中分泌出),純化至基本純的制品,并用于隨后的功能測(cè)定。在這樣的一個(gè)功能試驗(yàn)中,將描述表達(dá)蛋白質(zhì)的功能特征。預(yù)計(jì)蛋白質(zhì)的功能包括金屬蛋白酶活性、C-蛋白酶活性和層粘連蛋白-5加工活性,以及激活TGF-β樣蛋白的活性,鑒于其總體結(jié)構(gòu)在結(jié)構(gòu)域水平上與已知的蛋白質(zhì)相似,因此這些預(yù)計(jì)是合理的。
在另一個(gè)試驗(yàn)中,此蛋白質(zhì)可用來(lái)篩選抑制蛋白質(zhì)活性的推定試劑。如果mTll能救活BMP-1剔除小鼠,則它用類似修飾或消除BMP-1蛋白功能的方式,來(lái)改變mTll蛋白功能的任何治療系統(tǒng),將是重要的。因此,任何一組這樣的試劑都必需以mTll蛋白質(zhì)進(jìn)行篩選。在這樣的試驗(yàn)中,所有支持mTll功能的試驗(yàn)成分可在合適的鹽和pH條件下一同加入,并與一組蛋白質(zhì)功能推定抑制劑結(jié)合使用。采用已建立的蛋白質(zhì)功能測(cè)定方法(在結(jié)合人本文其它處作為參考的文獻(xiàn)中有所描述),將可以確定任何被測(cè)試劑是否能抑制蛋白質(zhì)活性,從而使其成為以治療劑量用于抑制纖維變性、減少結(jié)疤和減少瘢痕瘤的候選試劑。采用來(lái)自BMP-1基因家族的相關(guān)蛋白質(zhì)正在進(jìn)行這種篩選努力。參見(jiàn)Kessler,同上。
現(xiàn)在也有可能用所公開(kāi)的蛋白質(zhì)或其片段來(lái)進(jìn)行合理的藥物設(shè)計(jì)。在設(shè)計(jì)時(shí),對(duì)蛋白質(zhì)或片段進(jìn)行X-射線結(jié)晶圖分析,以確定它們的活性位點(diǎn)和可與推定治療劑相互作用的位點(diǎn)。
目前表明BMP-1編碼的蛋白質(zhì)可在C端附近斷裂前膠原。人們?cè)缇驼J(rèn)為這種膠原產(chǎn)生所必需的C端-蛋白酶活性存在于未知的蛋白質(zhì)中。因此利用C端蛋白酶活性作為膠原相關(guān)疾病的治療劑具有很高的商業(yè)價(jià)值。由于mTll是唯一的與BMP-1密切相關(guān)(根據(jù)cDNA文庫(kù)篩選的結(jié)果)的其它哺乳動(dòng)物基因,因此也特別期望,mTll編碼的蛋白質(zhì)是另一種C端蛋白酶,進(jìn)一步講,通過(guò)將基因?qū)胫亟M載體中進(jìn)行體外生產(chǎn)治療性蛋白,可用mTll基因來(lái)生產(chǎn)這種C端蛋白酶,并在遺傳疾病治療中直接給藥。人的基因特別適用于這些應(yīng)用。
在討論了下列非限制性實(shí)施例后可更好地理解本發(fā)明。
實(shí)施例BMP-1/mTld-無(wú)效小鼠胚胎cDNA文庫(kù)如Hogan等("Manipulatingthe Mouse Embryo:A Laboratory Manual,2nd Ed.,"pp.260-261,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1 994))所述的制備小鼠胚胎成纖維細(xì)胞(MEF)。從已制成與BMP-1/mTld基因的無(wú)效等位基因(即不表達(dá)BMP-1/mTld蛋白質(zhì))純合的胚胎制得10塊150mm的MEF平板,使MEF生長(zhǎng)至鋪滿(在DMEM中,10%胎牛血清),3天后用50μg/ml抗壞血酸鹽處理18小鼠,收集,并用FastTrack試劑盒(Invitrogen)分離獲得42μg聚腺苷酸化mRNA。然后用SuperScript Choice系統(tǒng)(Gibco-BRL),用5μg等份聚腺苷酸來(lái)合成有EcoRⅠ末端的雙鏈cDNA。然后將該cDNA與EcoRⅠ-切開(kāi)的λgt10臂連接,并用GigapakⅡGold包裝提取物(Stratagene)進(jìn)行包裝。5μg聚腺苷酸提供了約2.2×10-6PFU的未擴(kuò)增的文庫(kù)。隨機(jī)挑選的克隆的平均插入片段大小為2.9kb。
DNA序列分析將限制性片段亞克隆人pBluescriptⅡKS+,用雙脫氧鏈終止法從雙鏈模板獲得序列(如Lee S.-T.,等在"Construction of a full-length cDNA encoding human pro-alpha 2(Ⅰ)collagen and its expression in pro-alpha 2(Ⅰ)-deficient W8 rat cells,"J.Biol.Chem.263:13414-13418(1988)中描述的)。用T3和T7引物對(duì)亞克隆的末端進(jìn)行測(cè)序,通過(guò)引入缺失或采用與插入序列互補(bǔ)的引物使亞克隆固有部分得以測(cè)序。兩條鏈的測(cè)序證實(shí)了本文報(bào)道的mTll序列。
聚合酶鏈反應(yīng)(PCR)PCR反應(yīng)這樣進(jìn)行在480循環(huán)變溫加熱儀(Perkin-Elmer Corp.)中在94℃下使引物(每種引物為0.2μM)變性3分鐘,然后以94℃/1分鐘、57℃/1分鐘、72℃/1.5分鐘循環(huán)35次,最后在72℃下培育8分鐘。最終體積為100μl 10mMTris-HCl(pH8.3)、50mM KCl、1.5mMMgCl2、0.01%(w/v)明膠、dNTP各0.2mM和2.5單位的Tαq聚合酶(Perkin-Elmer Corp.)用于原位雜交的組織切片用于原位雜交的固定在載玻片上的組織切片由G.E.Lyons(Wisconsin-Madsion大學(xué))提供。如Lyons等在"The expression of myosin genes in developingskeletal muscle,"J.Cell Biol.111:1465-1476(1990)中所述的方法固定包埋小鼠組織。簡(jiǎn)言之,將組織固定在4%多聚甲醛磷酸鹽緩沖液中,脫水,并用石蠟油浸潤(rùn)。將一系列5-7μm厚的切片固定在明膠化載玻片上。1-3個(gè)切片固定在載玻片上,在二甲苯中去石蠟油、并且再水化。對(duì)切片用蛋白酶K消化,后固定,用三乙醇胺/7酸酐處理,清洗并脫水。
用于原位雜交的探針將mTll特異性探針(對(duì)應(yīng)于1104bp的mTll 3'非翻譯區(qū)的部分)用于原位雜交。由于3'非翻譯區(qū)與BMP-1或mTld序列沒(méi)有相似性,因此探針不會(huì)與BMP-1或mTld RNA交叉雜交。
為了保證探針不與其它有類似于長(zhǎng)SSR(這種長(zhǎng)SSR在mTll 3'非翻譯區(qū)中心部分(核苷酸4148-4239))的重復(fù)序列的RNA轉(zhuǎn)錄物雜交,根據(jù)生產(chǎn)商條件(Stratagene)制備兩個(gè)分離的核糖探針(對(duì)應(yīng)于SSR上游或下游的3′-UT序列),用35S-UTP(>1000Ci/mmol/Amersham Corp.)作標(biāo)記,并聯(lián)合以增強(qiáng)原位雜交信號(hào)。用堿將探針?biāo)獬善骄鶠?0堿基大小。
對(duì)于SSR下游的3'非翻譯序列,用正向引物5'-CCAGC TTAAC CTGTTCACAC-3'(SEQ ID NO:6)和反向引物5'-AACT CTAC TTCCA CTTCA TC-3′(SEQID NO:7)制備399bp的PCR產(chǎn)物(SEQ ID NO:2核苷酸4283-4681)。將PCR產(chǎn)物連接入pCRⅡT-A載體(Invitrogen)的克隆位點(diǎn)。使pCRⅡ多接頭中HindⅢ位點(diǎn)處的模板線形化,并用RNA聚合酶T7轉(zhuǎn)錄,制得均勻標(biāo)記的反義核糖探針。同時(shí)使pCRⅡ多接頭中XhoⅠ位點(diǎn)處線形化,并用RNA聚合酶SP6轉(zhuǎn)錄,制得有義對(duì)照核糖探針。
對(duì)于SSR上游的3'非翻譯序列,用正向引物5'-TCAGA ACAGA AAGGAATGTG-3′(SEQ ID NO:8)和反向引物5'-GACCA CTATT CCACA TCACC-3'(SEQID NO:9)制備420bp的PCR產(chǎn)物(SEQ ID NO:2核苷酸3666-4085),并連接入pCRⅡT-A的克隆位點(diǎn)。使pCRⅡ多接頭中XhoⅠ位點(diǎn)處線形化并用RNA聚合酶SP6轉(zhuǎn)錄,制得反義核糖探針,而使pCRⅡ多接頭中HindⅢ位點(diǎn)處線形化并用RNA聚合酶T7轉(zhuǎn)錄,制得有義對(duì)照核糖探針。
原位雜交和清洗步驟使切片在52℃50%去離子的甲酰胺、0.3M NaCl、20mM Tris-HCl、pH4.5、5mM EDTA、10mM NaPO4、10%硫酸葡聚糖、1份Denhardt's溶液、50μg/ml酵母總RNA、25μmol/ml硫代ATP(Boehringer-Mannheim)和50-75,000cpm/μl35S標(biāo)記的cRNA探針中雜交過(guò)夜。使組織在65℃的50%甲酰胺、2×SSC、10mM二硫蘇糖醇中嚴(yán)格清洗;在磷酸鹽緩沖鹽水中漂清;并用20μg/mlRNaseA37℃處理30分鐘。隨后在37℃2×SSC和0.1×SSC中清洗15分鐘后,使載玻片脫水,將其浸在KodakNTB-2核示蹤乳液中,并在4℃、有干燥劑的不透光箱子中暴光一周。照片顯影采用Kodak D-19。用Zeiss Axiophot顯微鏡的亮視野和暗視野鏡片分析載玻片。
Northern和Southern印跡分析純化獲得長(zhǎng)1633bp的EcoRⅠ片段(SEQ ID NO:2,核苷酸1113-2745)(對(duì)應(yīng)于cDNA克隆KO3的5'端)(圖1),并用作Northern印跡分析的探針。該片段含有對(duì)應(yīng)于大多數(shù)蛋白酶結(jié)構(gòu)域的序列;所有CUB1、CUB2和EGF1的結(jié)構(gòu)域;和CUB3結(jié)構(gòu)域的大部分。用凝膠純化上述用于原位雜交試驗(yàn)的339bp的PCR產(chǎn)物,并將其用作Southern印跡分析的探針。用隨機(jī)引導(dǎo)法(Feinberg和Vogelstein,"Atechnique for radiolabeling DNA restriction endonuclease fragments to high specificactivity:Addendum,"Anal.Biochem.137:266-267(1984))對(duì)兩個(gè)探針作放射性標(biāo)記至比活為4-6×109cpm/μg,并在Quichhyb(Stratagene)中68℃雜交成印跡1小時(shí)。使Northern印跡(從Clontech獲得)在68℃、2×SSC、0.1%SDS洗滌兩次10分鐘,然后在68℃、以0.1×SSC、0.1%SDS洗滌兩次15分鐘。Southern印跡在68℃、以2×SSC、0.1%SDS洗滌兩次10分鐘,然后在68℃、以0.1×SSC、0.1%SDS中洗滌兩次20分鐘。
mTll基因的亞克隆和表達(dá)BMP-1、mTld和mTll的成熟活性形式的氨基酸序列是相似的。只是每種蛋白質(zhì)的C端沒(méi)有同源性。C端序列的這種獨(dú)特性已經(jīng)被用來(lái)生產(chǎn)一系列可區(qū)別三種蛋白質(zhì)形式的多克隆抗體。在小鼠mTll中,使合成的肽Ac-CYIRYKSIRYPETMHAKN-OH(對(duì)應(yīng)于mTll最后的17個(gè)氨基酸)與蛋白質(zhì)載體鑰孔血蘭素連接,懸浮在鹽水中,與等體積弗氏佐劑混合乳化,注入兩只兔子每只背部皮下3-4處。在加強(qiáng)免疫后12周和16周,放血取血清。不象小鼠和人之間的BMP-1和mTld的C端氨基酸序列較為保守,小鼠和人mTll的C端氨基酸序列是不同的。也許這是由于動(dòng)物間的差異,小鼠mTllC端肽在兔子中產(chǎn)生的抗體滴度比BMP-1和mTldC端肽高出3倍。為了產(chǎn)生人mTllC端特異性抗體,將采用肽Ac-CHIRYKSIRYPDTTHTK K-OH。這些抗體有商業(yè)用途,可用于試驗(yàn)顯示細(xì)胞、組織和哺乳動(dòng)物有機(jī)體(包括但不局限于模型動(dòng)物體系如嚙齒類動(dòng)物和靈長(zhǎng)類動(dòng)物和人)中mTll蛋白質(zhì)的產(chǎn)生和定位。由于對(duì)骨形態(tài)生成蛋白的了解進(jìn)展迅速,因此區(qū)別各組分的能力不僅在研究方面重要,而且在監(jiān)測(cè)BMP體系疾病患者的BMP體系組分水平和分布上也很重要。這些疾病可能包括,例如小鼠和人體的纖維變性疾病。此外,由于TLL基因的缺陷,還可能會(huì)有遺傳性發(fā)育異常。采用本文所述的抗體和核酸探針就可確定mTll在這些遺傳異常中起的作用。顯然,mTll蛋白質(zhì)在BMP體系中是很重要的,因?yàn)樗黠@很好地取代了小鼠兩個(gè)染色體上均缺失的BMP-1等位基因BMP-1。這些小鼠在懷孕的全過(guò)程能夠存活,但是在臍區(qū)會(huì)發(fā)育形成持久的小腸疝。這些小鼠在出生后不久就會(huì)死亡,推測(cè)是由于缺失BMP-1/mTld基因。然而,它們不表現(xiàn)出肉眼可見(jiàn)的模式形成(pattern formation)紊亂、膠原纖維形成紊亂或總體發(fā)育紊亂。沒(méi)有某些BMP-1/mTld樣活性,就不可能有這樣清晰的發(fā)育順序或甚至是膠原纖維形成。我們已經(jīng)發(fā)現(xiàn),BMP-1缺失小鼠胚胎成纖維細(xì)胞中有這樣的C端蛋白酶形式的活性。這些活性看來(lái)是由mTll提供的,而且看來(lái)沒(méi)有其他密切相關(guān)的基因。
序列表(1)一般信息(ⅰ)申請(qǐng)人Greenspan.Daniel STakahara.KazuhikoHoffman.Guy G(ⅱ)發(fā)明名稱哺乳動(dòng)物的特洛德樣蛋白質(zhì)(ⅲ)序列數(shù)目13(ⅳ)通信地址(A)收件人Quarles & Brady(B)街道l South Pinckney Street(C)城市Madison(D)州WI(E)國(guó)家US(F)郵編53703(V)計(jì)算機(jī)可讀形式(A)記錄介質(zhì)類型軟盤(B)計(jì)算機(jī)IBM PC兼容型(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件PatentIn Release #1.0,Version#1.30(ⅵ)本申請(qǐng)資料(A)申請(qǐng)?zhí)?B)申請(qǐng)日(C)分類(ⅷ)律師/代理人信息(A)NAMEBerson,Bennett J(B)登記號(hào)37094(C)參考/案卷號(hào)960296.93839(ⅸ)通訊信息(A)電話608-251-5000(B)電傳608-251-9166(2)SEQ ID NO:1的信息(ⅰ)序列特征(A)長(zhǎng)度330堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸探針"(ⅹⅰ)序列描述SEQ ID NO:1:ACGTCCAGAC CGGAGCGGGT GTGGCCCGAT GGGGTCATCC CGTTTGTGAT TGGAGGGAAT 60TTCACAGGCA GCCAGAGGGC AGTCTTCCGG CAGGCCATGA GACACTGGGA GAAGCATACC 120TGTGTCACCT TCTTGGAGCG CACAGATGAG GACAGCTATA TTGTATTCAC CTACCGACCC 180TGCGGGTGCT GCTCCTACGT GGGTCGCCGA GGTGGGGGCC CCCAGGCCAT CTCCATCGGC 240AAGAACTGTG ACAAGTTTGG CATCGTGGTC CATGAGCTGG GCCATGTCAT TGGCTTCTGG 300CACGAGCACA CGCGGCCCGA CCGCGACCGC 330(2)SEQ ID NO:2的信息(ⅰ)序列特征(A)長(zhǎng)度4771堿基對(duì)(B)類型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型DNA(基因組)(ⅸ)特征(A)名稱/關(guān)鍵CDS(B)位置611..3652(D)其它信息/產(chǎn)物="小鼠mTll蛋白質(zhì)"(ⅹⅰ)序列描述SEQ ID NO:2:CACACCCCTT TGCTCTCCGG GCAGTCGGGA GCTTCCCTAG CTTCGGCAGG CTTTTAAGGT 60CTGGCGGCGT AGAAATGCCT ATCCCCCACC CCCTTCCTCG GTCTCCCCTT TCAGTTCAGA 120TGTGCTGATG TGCAGACCGG ATTCATCTTC CCCGAGCAGC GGCGGTGGCA GCGGCGGGCG 180CAGGCGGCTG CAGCTCGCTC TCGGCCGCGG GGTCCTGACA GCGGCGGGGG CGCGGCGCGG 240GAGCCGGAGC TCCGGTGGCA GCTGAGCCCG CCGTGCGCCT CTCGCCGCGG CCGGTCGTGA 300TCGCGGGAAG TTCGACCGCT GGAAGGACGA CCTAGACCGA GCCGGGTTGG CTGCGGCTGC 360CCTGCGCCGA GCTCCTCACC TGCCTTCCGC CCACCCGCGG GCCCCCGGCC AAGTTCCCCA 420GCATCCGGGG GAGACAGGGA GACATTTGCC CTCTCTAGCG TCCTGAAGAC ATCCGCATGT 480CTCCGGACAC CTGAACATTC AGGTCTTTCC GAGGAGCTTC CCAGTCGGGA TAAGAACACT 540GTCCCTAGAG CCCCGCATAT CCACGCGGCC CTCCGGGTCT GGTCCCCTCC TTTTCCTCTA 600GGGGAGGAGG ATG GGT TTG CAA GCG CTC TCC CCG AGG ATG CTC CTG TGG 649Met Gly Leu Gln Ala Leu Ser Pro Arg Met Leu Leu Trp1 5 10TTG GTG GTC TCG GGT ATT GTT TTC TCC CGG GTG CTG TGG GTC TGC GCT697Leu Val Val Ser Gly Ile Val Phe Ser Arg Val Leu Trp Val Cys Ala15 20 25GGC CTC GAT TAT GAT TAC ACT TTT GAT GGG AAC GAA GAG GAC AAA ACG745Gly Leu Asp Tyr Asp Tyr Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr30 35 40 45GAG CCT ATA GAT TAC AAG GAC CCG TGC AAA GCT GCT GTG TTT TGG GGT793Glu Pro Ile Asp Tyr Lys Asp Pro Cys Lys Ala Ala Val Phe Trp Gly50 55 60GAC ATC GCC TTA GAT GAT GAA GAC TTA AAT ATC TTC CAA ATA GAC AGG841Asp Ile Ala Leu Asp Asp Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg65 70 75ACA ATT GAC CTG ACC CAG AGC CCC TTT GGA AAA CTT GGA CAT ATT ACA889Thr Ile Asp Leu Thr Gln Ser Pro Phe Gly Lys Leu Gly His Ile Thr80 85 90GGT GGC TTT GGA GAC CAT GGC ATG CCA AAG AAG CGA GGG GCA CTC TAC937Gly Gly Phe Gly Asp His Gly Met Pro Lys Lys Arg Gly Ala Leu Tyr95 100 105CAA CTT ATA GAG AGG ATC AGA AGA ATT GGC TCT GGC TTG GAG CAA AAT985Gln Leu Ile Glu Arg Ile Arg Arg Ile Gly Ser Gly Leu Glu Gln Asn110 115 120 125AAC ACG ATG AAG GGA AAA GCA CCT CCA AAA TTG TCA GAG CAA AGT GAG 1033Asn Thr Met Lys Gly Lys Ala Pro Pro Lys Leu Ser Glu Gln Ser Glu130 135 140AAA AAT CGA GTT CCC AGA GCT GCT ACC TCA AGA ACG GAA AGG ATA TGG 1081Lys Asn Arg Val Pro Arg Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp145 150 155CCT GGG GGT GTC ATT CCT TAT GTC ATA GGA GGA AAC TTT ACT GGC AGC 1129Pro Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser160 165 170CAG AGA GCC ATG TTC AAG CAG GCC ATG AGA CAC TGG GAA AAG CAC ACC 1177Gln Arg Ala Met Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr175 180 185TGT GTG ACG TTC ACT GAG AGA AGT GAT GAA GAA AGT TAT ATT GTG TTC 1225Cys Val Thr Phe Thr Glu Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe190 195 200 205ACC TAC AGG CCT TGT GGA TGC TGC TCC TAT GTT GGT CGG CGG GGA AAT 1273Thr Tyr Arg Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn210 215 220GGC CCT CAG GCC ATC TCT ATT GGC AAG AAC TGT GAC AAG TTT GGA ATT 1321Gly Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile225 230 235GTT GTT CAT GAA CTG GGC CAC GTG ATA GGC TTC TGG CAT GAA CAT ACC 1369Val Val His Glu Leu Gly His Val Ile Gly Phe Trp His Glu His Thr240 245 250CGC CCA GAC CGA GAC AAC CAT GTC ACC ATC ATT AGA GAG AAC ATC CAG 1417Arg Pro Asp Arg Asp Asn His Val Thr Ile Ile Arg Glu Asn Ile Gln255 260 265CCA GGT CAA GAG TAC AAT TTT CTA AAG ATG GAG CCT GGA GAA GTG AAC 1465Pro Gly Gln Glu Tyr Asn Phe Leu Lys Met Glu Pro Gly Glu Val Asn270 275 280 285TCT CTT GGG GAA AGA TAT GAT TTT GAC AGT ATC ATG CAC TAC GCC AGG 1513Ser Leu Gly Glu Arg Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg290 295 300AAC ACC TTC TCA AGA GGG ATG TTT TTA GAC ACA ATA CTC CCC TCC CGT 1561Asn Thr Phe Ser Ar9 Gly Met Phe Leu Asp Thr Ile Leu Pro Ser Arg305 310 315GAT GAT AAT GGC ATT CGT CCT GCA ATT GGT CAA CGG ACC CGG TTA AGC 1609Asp Asp Asn Gly Ile Arg Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser320 325 330AAA GGA GAC ATT GCA CAA GCA AGA AAG CTG TAT CGA TGC CCA GCA TGT 1657Lys Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys335 340 345GGA GAA ACC CTG CAA GAA TCC AGT GGC AAC CTT TCT TCC CCA GGA TTC 1705Gly Glu Thr Leu Gln Glu Ser Ser Gly Asn Leu Ser Ser Pro Gly Phe350 355 360 365CCA AAT GGC TAC CCT TCC TAC ACA CAC TGC ATC TGG AGA GTG TCT GTG 1753Pro Asn Gly Tyr Pro Ser Tyr Thr His Cys Ile Trp Arg Val Ser Val370 375 380ACC CCG GGA GAA AAG ATT GTC TTG AAT TTT ACC ACA ATG GAC CTT TAC 1801Thr Pro Gly Glu Lys Ile Val Leu Asn Phe Thr Thr Met Asp Leu Tyr385390 395AAA AGT AGT TTG TGC TGG TAT GAT TAC ATT GAA GTA AGA GAT GGT TAC 1849Lys Ser Ser Leu Cys Trp Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr400 405 410TGG AGG AAG TCA CCT CTC CTT GGT AGA TTC TGT GGG GAC AAA GTG GCT 1897Trp Arg Lys Ser Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Val Ala415 420 425GGA GTT CTT ACA TCT ACG GAC AGC AGA ATG TGG ATT GAG TTT CGT AGC 1945Gly Val Leu Thr Ser Thr Asp Ser Arg Met Trp Ile Glu Phe Arg Ser430 435 440 445AGC AGT AAC TGG GTA GGA AAA GGG TTT GCA GCT GTC TAT GAA GCG ATT 1993Ser Ser Asn Trp Val Gly Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile450 455 460TGT GGA GGG GAG ATA AGG AAA AAC GAA GGG CAG ATT CAG TCT CCC AAT 2041Cys Gly Gly Glu Ile Arg Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn465 470 475TAC CCC GAT GAC TAC CGA CCA ATG AAG GAG TGT GTA TGG AAA ATA ATG 2089Tyr Pro Asp Asp Tyr Arg Pro Met Lys Glu Cys Val Trp Lys Ile Met480 485 490GTG TCC GAG GGC TAC CAT GTT GGA CTG ACC TTT CAG GCC TTT GAG ATC 2137Val Ser Glu Gly Tyr His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile495 500 505GAA AGA CAT GAC AGC TGT GCC TAT GAC CAC CTA GAA GTT CGA GAT GGA 2185Glu Arg His Asp Ser Cys Ala Tyr Asp His Leu Glu Val Arg Asp Gly510 515 520 525GCC AGT GAG AAC AGC CCT TTG ATA GGA CGG TTC TGT GGT TAT GAC AAA 2233Ala Ser Glu Asn Ser Pro Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys530 535 540CCT GAA GAT ATA AGG TCT ACT TCC AAC ACC CTG TGG ATG AAG TTT GTC 2281Pro Glu Asp Ile Arg Ser Thr Ser Asn Thr Leu Trp Met Lys Phe Val545 550 555TCT GAC GGG ACT GTG AAC AAG GCA GGG TTT GCT GCG AAC TTT TTT AAA 2329Ser Asp Gly Thr Val Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys560 565 570GAG GAA GAT GAG TGT GCC AAA CCT GAC CGA GGA GGC TGT GAA CAG AGG 2377Glu Glu Asp Glu Cys Ala Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg575 580 585TGT CTT AAC ACA CTA GGC AGC TAC CAG TGT GCC TGT GAG CCT GGC TAT 2425Cys Leu Asn Thr Leu Gly Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr590 595 600 605GAA CTG GGG CCA GAC AGA AGA AGC TGT GAA GCT GCT TGC GGA GGA CTT 2473Glu Leu Gly Pro Asp Arg Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu610 615 620CTG ACG AAG CTC AAT GGC ACC ATA ACC ACC CCC GGC TGG CCC AAA GAG 2521Leu Thr Lys Leu Asn Gly Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu625 630 635TAC CCT CCA AAC AAA AAC TGT GTG TGG CAA GTG ATC GCG CCA AGC CAG 2569Tyr Pro Pro Asn Lys Asn Cys Val Trp Gln Val Ile Ala Pro Ser Gln640 645 650TAC AGA ATC TCT GTG AAG TTT GAG TTT TTT GAA TTG GAA GGC AAT GAA 2617Tyr Arg Ile Ser Val Lys Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu655 660 665GTT TGC AAA TAC GAT TAC GTG GAG ATC TGG AGC GGC CCT TCC TCT GAG 2665Val Cys Lys Tyr Asp Tyr Val Glu Ile Trp Ser Gly Pro Ser Ser Glu670 675 680 685TCT AAA CTG CAT GGC AAG TTC TGT GGC GCT GAC ATA CCT GAA GTG ATG 2713Ser Lys Leu His Gly Lys Phe Cys Gly Ala Asp Ile Pro Glu Val Met690 695 700ACT TCC CAT TTC AAC AAC ATG AGG ATT GAA TTC AAG TCA GAC AAC ACT 2761Thr Ser His Phe Asn Asn Met Arg Ile Glu Phe Lys Ser Asp Asn Thr705 710 715GTA TCC AAG AAG GGC TTC AAA GCA CAT TTT TTC TCA GAT AAG GAT GAG 2809Val Ser Lys Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu720 725 730TGT TCA AAG GAT AAT GGT GGC TGT CAG CAT GAG TGT GTC AAC ACG ATG 2857Cys Ser Lys Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Met735 740 745GGA AGT TAC ACG TGT CAG TGC CGG AAT GGA TTC GTG TTG CAT GAG AAC 2905Gly Ser Tyr Thr Cys Gln Cys Arg Asn Gly Phe Val Leu His Glu Asn750 755 760 765AAG CAT GAT TGC AAG GAA GCC GAG TGT GAA CAG AAG ATA CAC AGC CCA 2953Lys His Asp Cys Lys Glu Ala Glu Cys Glu Gln Lys Ile His Ser Pro770 775 780AGT GGT CTC ATC ACC AGT CCC AAC TGG CCA GAC AAG TAT CCA AGC AGG 3001Ser Gly Leu Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg785 790 795AAA GAG TGC ACG TGG GTG ATC AGT GCC ATT CCT GGC CAC CGC ATC ACA 3049Lys Glu Cys Thr Trp Val Ile Ser Ala Ile Pro Gly His Arg Ile Thr800 805 810TTA GCC TTC AAT GAG TTT GAG GTT GAA CAA CAT CAA GAA TGT GCT TAT 3097Leu Ala Phe Asn Glu Phe Glu Val Glu Gln His Gln Glu Cys Ala Tyr815 820 825GAT CAC TTG GAA ATT TTT GAT GGA GAA ACG GAG AAG TCA CCA ATA CTT 3145Asp His Leu Glu Ile Phe Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu830 835 840 845GGC CGA CTA TGT GGC AGC AAG ATA CCA GAT CCC CTC ATG GCT ACT GGG 3193Gly Arg Leu Cys Gly Ser Lys Ile Pro Asp Pro Leu Met Ala Thr Gly850 855 860AAT GAA ATG TTT ATT CGG TTT ATT TCT GAT GCC TCT GTT CAA AGA AAA 3241Asn Glu Met Phe Ile Arg Phe Ile Ser Asp Ala Ser Val Gln Arg Lys865 870 875GGC TTT CAA GCT ACA CAT TCC ACA GAG TGT GGT GGT CGA TTG AAA GCA 3289Gly Phe Gln Ala Thr His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala880 885 890GAG TCA AAG CCT AGA GAC CTG TAC TCC CAT GCT CAG TTr GGT GAT AAT 3337Glu Ser Lys Pro Arg Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn895 900 905AAC TAC CCA GGA CAA CTG GAC TGT GAA TGG TTG TTG GTG TCA GAA CGA 3385ASh Tyr Pro Gly Gln Leu Asp Cys Glu Trp Leu Leu Val Ser Glu Arg910 915 920 925GGA TCT CGA CTT GAA TTG TCC TTC CAG ACA TTC GAA GTA GAA GAA GAA 3433Gly Ser Arg Leu Glu Leu Ser Phe Gln Thr Phe Glu Val Glu Glu Glu930 935 940GCT GAC TGT GGC TAT GAC TAT GTT GAA GTC TTT GAT GGT CTC AGT TCA 3481Ala Asp Cys Gly Tyr Asp Tyr Val Glu Val Phe Asp Gly Leu Ser Ser945 950 955AAA GCT GTG GGT CTT GGT AGA TTC TGT GGG TCA GGG CCA CCA GAA GAA 3529Lys Ala Val Gly Leu Gly Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu960 965 970ATC TAT TCA ATT GGA GAT GTG GCT TTG ATT CAT TTC CAC ACA GAT GAC 3577Ile Tyr Ser Ile Gly Asp Val Ala Leu Ile His Phe His Thr Asp Asp975 980 985ACT ATC AAC AAG AAA GGA TTT TAT ATA AGA TAT AAA AGT ATA AGA TAC 3625Thr Ile Asn Lys Lys Gly Phe Tyr Ile Arg Tyr Lys Ser Ile Arg Tyr990 995 10001005CCG GAA ACG ATG CAT GCC AAG AAC TAA TGCCGACCCT CCCTCAGAAC 3672Pro Glu Thr Met His Ala Lys Asn*1010AGAAAGGAAT GTGCATATGG AAAGAAGACA TTTTTAAAAT AGACAATATT AATACAATTG 3732TTTTATATAA TGAATTTGAG CAAAAGAAAC CTGCAAGATT AGAGTTATCT CTGAAGTGAA 3792AGAGAACTTT CCAGAAAACC TGATTGGCAT TGCAAGGATG TTTGAAAGTC ATGCTTGTTC 3852AAGGAAGATT AACAGCTTGA AATAGATGCT TCACATTTTG GACAGTTCAT TTAATGAGCT 3912GTGATTCTCT GGAGTGATTT CTTGACTACT TTTCCAAGAT CTGGGGACGT AGAAATGATG 3972GGACGGATCA TAGCTTGGAA ACCCACTTCT TGGGTCTTAG CATGTTTGCT TAGACTCTGT 4032AGGTCAGACA CAGTGTAAAC CAAATTCATG TAAGGTGATG TGGAATAGTG GTCTTTGGAA 4092GGTGGTTCAT CATTTAAATG TAGGTTTGTG CTTGTGTGTA TGTTCACATA TGCAAGTGTG 4152TGTGTGTGTG TGTGTGTGTG TGTGTGTGTG TGTGTGCGTG TGTGTGTGTG TGCGTGTGTG 4212TGTGTGTGCA TGTGTGTGCA TGTGTGTTTG GAAACTGGAA TATTTCATCT TCATTATTTT 4272CAAATGCAGG CCAGCTTAAC CTGTTCACAC AAATGATTTT GTGACCACTT CATTGTATCT 4332GTATCTTGAG AAGTTTGAAA TATCTATAGT GTCTACAATG CAGTTAATCC CTAGATATCG 4392GATAATACCC AGTTCACTAG TAAACTCATT TCTCTCTGGG GAAGTGCTGA ATAGTCTCCA 4452AATTCAAGAA ACTCACCATG TCTTATAAAC CTTTAAGATA AAATTCCAAC GAGGTGTGTG 4512CAGCCATCTT CCAAATGACT GCCTGGATGT TTCTTAGTCC AGTTACTACT GCTGCTGCTA 4572TTGGTCTTTC TTTTATTGTT AATGTGTTGA TATGTTGTTA TTATTATGGT TATTATTATT 4632GATGTTGTTA CTATATTTAA AAATGATGAG ATGAAGTGGA AGTAGAGTTT GGGAGAAATG 4692AAATCTCTCT TTTTTGTTCT CTTCTTGAAA TTCAGTTTCA AAAAATACAA TATTGGGTGG 4752CAAAAAAAAA AAAAAAAAA 4771(2)SEQ ID NO:3的信息(ⅰ)序列特征(A)長(zhǎng)度1014氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型蛋白質(zhì)(ⅹⅰ)序列描述:SEQ ID NO:3:Met Gly Leu Gln Ala Leu Ser Pro Arg Met Leu Leu Trp Leu Val Val1 5 10 15Ser Gly Ile Val Phe Ser Arg Val Leu Trp Val Cys Ala Gly Leu Asp20 25 30Tyr Asp Tyr Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr Glu Pro Ile35 40 45Asp Tyr Lys Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala50 55 60Leu Asp Asp Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg Thr Iie Asp65 70 75 80Leu Thr Gln Ser Pro Phe Gly Lys Leu Gly His Ile Thr Gly Gly Phe85 90 95Gly Asp His Gly Met Pro Lys Lys Arg Gly Ala Leu Tyr Gln Leu Ile100 105 110Glu Arg Ile Arg Arg Ile Gly Ser Gly Leu Glu Gln Asn Asn Thr Met115 120 125Lys Gly Lys Ala Pro Pro Lys Leu Ser Glu Gln Ser Glu Lys Asn Arg
130 135140Val Pro Arg Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly145 150 155 160Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg Ala165 170 175Met Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr180 185 190Phe Thr Glu Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe Thr Tyr Arg195 200 205Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn Gly Pro Gln210 215 220Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val His225 230 235 240Glu Leu Gly His Val Ile Gly Phe Trp His Glu His Thr Arg Pro Asp245 250 255Arg Asp Asn His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln260 265 270Glu Tyr Asn Phe Leu Lys Met Glu Pro Gly Glu Val Asn Ser Leu Gly275 280 285Glu Arg Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe290 295 300Ser Arg Gly Met Phe Leu Asp Thr Ile Leu Pro Ser Arg Asp Asp Asn305 310 315 320Gly Ile Arg Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly Asp325 330 325Ile Ala Gln Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys Gly Glu Thr240 345 350Leu Gln Glu Ser Ser Gly Asn Leu Ser Ser Pro Gly Phe Pro Asn Gly255 360 365Tyr Pro Ser Tyr Thr His Cys Ile Trp Arg Val Ser Val Thr Pro Gly370 375 380Glu Lys Ile Val Leu Asn Phe Thr Thr Met Asp Leu Tyr Lys Ser Ser385 390 395 400Leu Cys Trp Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr Trp Arg Lys405 410 415Ser Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Val Ala Gly Val Leu420 425 430Thr Ser Thr Asp Ser Arg Met Trp Ile Glu Phe Arg Ser Ser Ser Asn435 440 445Trp Val Gly Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile Cys Gly Gly450 455 460Glu Ile Arg Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp465 470 475 480Asp Tyr Arg Pro Met Lys Glu Cys Val Trp Lys Ile Met Val Ser Glu485 490 495Gly Tyr His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile Glu Arg His500 505 510Asp Ser Cys Ala Tyr Asp His Leu Glu Val Arg Asp Gly Ala Ser Glu515 520 525Asn Ser Pro Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys Pro Glu Asp530 535 540Ile Arg Ser Thr Ser Asn Thr Leu Trp Met Lys Phe Val Ser Asp Gly545 550 555 560Thr Val Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Glu Asp565 570 575Glu Cys Ala Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg Cys Leu Asn580 585 590Thr Leu Gly Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr Glu Leu Gly595 600 605Pro Asp Arg Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu Leu Thr Lys610 615 620Leu Asn Gly Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu Tyr Pro Pro625 630 635 640Asn Lys Asn Cys Val Trp Gln Val Ile Ala Pro Ser Gln Tyr Arg Ile645 650 655Ser Val Lys Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu Val Cys Lys660 665 670Tyr Asp Tyr Val Glu Ile Trp Ser Gly Pro Ser Ser Glu Ser Lys Leu675 680 685His Gly Lys Phe Cys Gly Ala Asp Ile Pro Glu Val Met Thr Ser His690 695 700Phe Asn Asn Met Arg Ile Glu Phe Lys Ser Asp Asn Thr Val Ser Lys705 710 715 720Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser Lys725 730 735Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Met Gly Ser Tyr740 745 750Thr Cys Gln Cys Arg Asn Gly Phe Val Leu His Glu Asn Lys His Asp755 760 765Cys Lys Glu Ala Glu Cys Glu Gln Lys Ile His Ser Pro Ser Gly Leu770 775 780Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys785 790 795 800Thr Trp Val Ile Ser Ala Ile Pro Giy His Arg Ile Thr Leu Ala Phe805 810 815Asn Glu Phe Glu Val Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu820 825 830Glu Ile Phe Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu Gly Arg Leu
835 840 845Cys Gly Ser Lys Ile Pro Asp Pro Leu Het Ala Thr Gly Asn Glu Het850 855 860Phe Ile Arg Phe Ile Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln865 870 875 880Ala Thr His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Ser Lys885 890 895Pro Arg Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro900 905 910Gly Gln Leu Asp Cys Glu Trp Leu Leu Val Ser Glu Arg Gly Ser Arg915 920 925Leu Glu Leu Ser Phe Gln Thr Phe Glu Val Glu Glu Glu Ala Asp Cys930 935 940Gly Tyr Asp Tyr Val Glu Val Phe Asp Gly Leu Ser Ser Lys Ala Val945 950 955 960Gly Leu Gly Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu Ile Tyr Ser965 970 975Ile Gly Asp Val Ala Leu Ile His Phe His Thr Asp Asp Thr Ile Asn980 985 990Lys Lys Gly Phe Tyr Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Glu Thr995 10001005Met His Ala Lys Asn*1010(2)SEQ ID NO:4的信息(ⅰ)序列特征(A)長(zhǎng)度3919堿基對(duì)(B)類型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型DNA(基因組)(ⅵ)來(lái)源(A)生物體Homo sapiens(ⅸ)特征(A)名稱/關(guān)鍵CDS(B)位置648..3689(D)其它信息/產(chǎn)物="人mTll蛋白質(zhì)"(ⅹⅰ)序列描述SEQ ID NO:4:CTCACACTTT TGCTCTCTTG CAGTCAGTTG CTTTGCTGGC TTCTGCAGGC TTTTAAGGTC 60TCGCGGCGTA GAAATGCCTG GCCCCCACCC CCTTCCTCGG TCTCCCCTTT CAATTCAGAT 120GTGCTGATGT GCAGACCGGA TTCATCTTCT CGGAGCTGCG GCGGCGGCTT TGGGCTCAGG 180CGGCGGCGGC TCGCGCTCGG CCGCGGAGTC CTGGCAGCAG CGGGGACGCG GCGCGGGAGT 240CCGAGCTCTG GTGGCAGCTG AGCCCGCGGG GCGCCGCTCG CCGAGCCGCG GCCGCGGGAA 300GTTCGGCAGC CAGAAGGACG ACCTGGCAGG CTGCGAGCGC CAGCGCCGCC AGAGCCGAGT 360TTGCCTGCGC CCTCCCCGCC TCCGAGTGCA GAGTTCCTTA CCTGCCCTCC GCCCACCCGT 420GGGCCCCTAG CCAACTTCTC CCTGCGACTG GGGGTAACAG GCAGTGCTTG CCCTCTCTAC 480TGTCCCGGCG GCATCCACAT GTTTCCGGAC ACCTGAGCAC CCCGGTCCCG CCGAGGAGCC 540TCCGGGTGGG GAGAAGAGCA CCGGTGCCCC TAGCCCCGCA CATCAGCGCG GACCGCGGCT 600GCCTAACCTC TGGGTCCCGT CCCCTCCTTT TCCTCCGGGG GAGGAGG ATG GGG TTG656Met Gly Leu1015GGA ACG CTT TCC CCG AGG ATG CTC GTG TGG CTG GTG GCC TCG GGG ATT704Gly Thr Leu Ser Pro Arg Met Leu Val Trp Leu Val Ala Ser Gly Ile102010251030GTT TTC TAC GGG GAG CTA TGG GTC TGC GCT GGC CTC GAT TAT GAT TAC752Val Phe Tyr Gly Glu Leu Trp Val Cys Ala Gly Leu Asp Tyr Asp Tyr103510401045ACT TTT GAT GGG AAC GAA GAG GAT AAA ACA GAG ACT ATA GAT TAC AAG800Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr Glu Thr Ile Asp Tyr Lys1050105510601065GAC CCG TGT AAA GCC GCT GTA TTT TGG GGC GAT ATT GCC TTA GAT GAT848Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala Leu Asp Asp107010751080GAA GAC TTA AAT ATC TTT CAA ATA GAT AGG ACA ATT GAC CTT ACG CAG896Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg Thr Ile Asp Leu Thr Gln108510901095AAC CCC TTT GGA AAC CTT GGA CAT ACC ACA GGT GGA CTT GGA GAC CAT 944Asn Pro Phe Gly Asn Leu Gly His Thr Thr Gly Gly Leu Gly Asp His110011051110GCT ATG TCA AAG AAG CGA GGG GCC CTC TAC CAA CTT ATA GAC AGG ATA992Ala Met Ser Lys Lys Arg Gly Ala Leu Tyr Gln Leu Ile Asp Arg Ile111511201125AGA AGA ATT GGC TTT GGC TTG GAG CAA AAC AAC ACA GTT AAG GGA AAA 1040Arg Arg Ile Gly Phe Gly Leu Glu Gln Asn Asn Thr Val Lys Gly Lys1130113511401145GTA CCT CTA CAA TTC TCA GGG CAA AAT GAG AAA AAT CGA GTT CCC AGA 1088Val Pro Leu Gln Phe Ser Gly Gln Asn Glu Lys Asn Arg Val Pro Arg115011551160GCC GCT ACA TCA AGA ACG GAA AGA ATA TGG CCT GGA GGC GTT ATT CCT 1136Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly Val Ile Pro116511701175TAT GTT ATA GGA GGA AAC TTC ACT GGC AGC CAG AGA GCC ATG TTC AAG 1184Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg Ala Met Phe Lys118011851190CAG GCC ATG AGG CAC TGG GAA AAG CAC ACA TGT GTG ACT TTC ATA GAA 1232Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr Phe Ile Glu119512001205AGA AGT GAT GAA GAG AGT TAC ATT GTA TTC ACC TAT AGG CCT TGT GGA 1280Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe Thr Tyr Arg Pro Cys Gly1210121512201225TGC TGC TCC TAT GTA GGT CGG CGA GGA AAT GGA CCT CAG GCA ATC TCT 1328Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn Gly Pro Gln Ala Ile Ser123012351240ATC GGC AAG AAC TGT GAT AAA TTT GGG ATT GTT GTT CAT GAA TTG GGT 1376Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val His Glu Leu Gly124512501255CAT GTG ATA GGC TTT TGG CAT GAA CAC ACA AGA CCA GAT CGA GAT AAC 1424His Val Ile Gly Phe Trp His Glu His Thr Arg Pro Asp Arg Asp Asn126012651270CAC GTA ACT ATC ATA AGA GAA AAC ATC CAG CCA GGT CAA GAG TAC AAT 1472His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln Glu Tyr Asn127512801285TTT CTG AAG ATG GAG CCT GGA GAA GTA AAC TCA CTT GGA GAA AGA TAT 1520Phe Leu Lys Met Glu Pro Gly Glu Val Asn Ser Leu Gly Glu Arg Tyr1290129513001305GAT TTC GAC AGT ATC ATG CAC TAT GCC AGG AAC ACC TTC TCA AGG GGG 1568Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe Ser Arg Gly131013151320ATG TTT CTG GAT ACC ATT CTC CCC TCC CGT GAT GAT AAT GGC ATA CGT 1616Met Phe Leu Asp Thr Ile Leu Pro Ser Arg Asp Asp Asn Gly Ile Arg132513301335CCT GCA ATT GGT CAG CGA ACC CGT CTA AGC AAA GGA GAT ATC GCA CAG 1664Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly Asp Ile Ala Gln134013451350GCA AGA AAG CTG TAT AGA TGT CCA GCA TGT GGA GAA ACT CTA CAA GAA 1712Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys Gly Glu Thr Leu Gln Glu135513601365TCC AAT GGC AAC CTT TCC TCT CCA GGA TTT CCC AAT GGC TAC CCT TCT 1760Ser Asn Gly Asn Leu Ser Ser Pro Gly Phe Pro Asn Gly Tyr Pro Ser1370137513801385TAC ACA CAC TGC ATC TGG AGA GTT TCT GTG ACC CCA GGG GAG AAG ATT 1808Tyr Thr His Cys Ile Trp Arg Val Ser Val Thr Pro Gly Glu Lys Ile139012951400GTT TTA AAT TTT ACA ACG ATG GAT CTA TAC AAG AGT AGT TTG TGC TGG 1856Val Leu Asn Phe Thr Thr Met Asp Leu Tyr Lys Ser Ser Leu Cys Trp140514101415TAT GAC TAT ATT GAA GTA AGA GAC GGG TAC TGG AGA AAA TCA CCT CTC 1904Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr Trp Arg Lys Ser Pro Leu142014251430CTT GGT AGA TTC TGT GGG GAC AAA TTG CCT GAA GTT CTT ACT TCT ACA 1952Leu Gly Arg Phe Cys Gly Asp Lys Leu Pro Glu Val Leu Thr Ser Thr143514401445GAC AGC AGA ATG TGG ATT GAG TTT CGT AGC AGC AGT AAT TGG GTA GGA 2000Asp Ser Arg Met Trp Ile Glu Phe Arg Ser Ser Ser Asn Trp Val Gly1450145514601465AAA GGC TTT GCA GCT GTC TAT GAA GCG ATC TGT GGA GGT GAG ATA CGT 2048Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile Cys Gly Gly Glu Ile Arg147014751480AAA AAT GAA GGA CAG ATT CAG TCT CCC AAT TAT CCT GAT GAC TAT CGC 2096Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp Asp Tyr Arg148514901495CCG ATG AAA GAA TGT GTG TGG AAA ATA ACA GTG TCT GAG AGC TAC CAC 2144Pro Met Lys Glu Cys Val Trp Lys Ile Thr Val Ser Glu Ser Tyr His150015051510GTC GGG CTG ACC TTT CAG TCC TTT GAG ATT GAA AGA CAT GAC AAT TGT 2192Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg His Asp Asn Cys151515201525GCT TAT GAC TAC CTG GAA GTT AGA GAT GGA ACC AGT GAA AAT AGC CCT 2240Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly Thr Ser Glu Asn Ser Pro1530153515401545TTG ATA GGG CGT TTC TGT GGT TAT GAC AAA CCT GAA GAC ATA AGA TCT 2288Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys Pro Glu Asp Ile Arg Ser155015551560ACC TCC AAT ACT TTG TGG ATG AAG TTT GTT TCT GAC GGA ACT GTG AAC 2336Thr Ser Asn Thr Leu Trp Met Lys Phe Val Ser Asp Gly Thr Val Asn156515701575AAA GCA GGG TTT GCT GCT AAC TTT TTT AAA GAG GAA GAT GAG TGT GCC 2384Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Glu Asp Glu Cys Ala158015851590AAA CCT GAC CGT GGA GGC TGT GAG CAG CGA TGT CTG AAC ACT CTG GGC 2432Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg Cys Leu Asn Thr Leu Gly159516001605AGT TAC CAG TGT GCC TGT GAG CCT GGC TAT GAG CTG GGC CCA GAC AGA 2480Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr Glu Leu Gly Pro Asp Arg1610161516201625AGG AGC TGT GAA GCT GCT TGT GGT GGA CTT CTT ACC AAA CTT AAC GGC 2528Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu Leu Thr Lys Leu Asn Gly163016351640ACC ATA ACC ACC CCT GGC TGG CCC AAG GAG TAC CCT CCT AAT AAG AAC 2576Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu Tyr Pro Pro Asn Lys Asn164516501655TGT GTG TGG CAA GTG GTT GCA CCA ACC CAG TAC AGA ATT TCT GTG AAG 2624Cys Val Trp Gln Val Val Ala Pro Thr Gln Tyr Arg Ile Ser Val Lys166016651670TTT GAG TTT TTT GAA TTG GAA GGC AAT GAA GTT TGC AAA TAT GAT TAT 2672Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu Val Cys Lys Tyr Asp Tyr167516801685GTG GAG ATC TGG AGT GGT CTT TCC TCT GAG TCT AAA CTG CAT GGC AAA 2720Val Glu Ile Trp Ser Gly Leu Ser Ser Glu Ser Lys Leu His Gly Lys1690169517001705TTC TGT GGC GCT GAA GTG CCT GAA GTG ATC ACA TCC CAG TTC AAC AAT 2768Phe Cys Gly Ala Glu Val Pro Glu Val Ile Thr Ser Gln Phe Asn Asn171017151720ATG AGA ATT GAA TTC AAA TCT GAC AAT ACT GTA TCC AAG AAG GGC TTC 2816Met Arg Ile Glu Phe Lys Ser Asp Asn Thr Val Ser Lys Lys Gly Phe172517301725AAA GCA CAT TTT TTC TCA GAC AAA GAT GAA TGC TCT AAG GAT AAT GGT 2864Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser Lys Asp Asn Gly174017451750GGA TGT CAG CAC GAA TGT GTC AAC ACG ATG GGG AGC TAC ATG TGT CAA 2912Gly Cys Gln His Glu Cys Val Asn Thr Met Gly Ser Tyr Met Cys Gln175517601765TGC CGT AAT GGA TTT GTG CTA CAT GAC AAT AAA CAT GAT TGC AAG GAA 2960Cys Arg Asn Gly Phe Val Leu His Asp Asn Lys His Asp Cys Lys Glu1770177517801785GCT GAG TGT GAA CAG AAG ATC CAC AGT CCA AGT GGC CTC ATC ACC AGT 3008Ala Glu Cys Glu Gln Lys Ile His Ser Pro Ser Gly Leu Ile Thr Ser179017951800CCC AAC TGG CCA GAC AAG TAC CCA AGC AGG AAA GAA TGC ACT TGG GAA 3056Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys Thr Trp Glu180518101815ATC AGC GCC ACT CCC GGC CAC CGA ATC AAA TTA GCC TTT AGT GAA TTT 3104Ile Ser Ala Thr Pro Gly His Arg Ile Lys Leu Ala Phe Ser Glu Phe182018251830GAG ATT GAG CAG CAT CAA GAA TGT GCT TAT GAC CAC TTA GAA GTA TTT 3152Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu Glu Val Phe183518401845GAT GGA GAA ACA GAA AAG TCA CCG ATT CTT GGA CGA CTA TGT GGC AAC 3200Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu Gly Arg Leu Cys Gly Asn1850185518601865AAG ATA CCA GAT CCC CTT GTG GCT ACT GGA AAT AAA ATG TTT GTT CGG 3248Lys Ile Pro Asp Pro Leu Val Ala Thr Gly Asn Lys Met Phe Val Arg187018751880TTT GTT TCT GAT GCA TCT GTT CAA AGA AAA GGC TTT CAA GCC ACA CAT 3296Phe Val Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln Ala Thr His188518901895TCT ACA GAG TGT GGC GGA CGA TTG AAA GCA GAA TCA AAA CCA AGA GAT 3344Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Ser Lys Pro Arg Asp190019051910CTG TAC TCA CAT GCT CAG TTT GGT GAT AAC AAC TAC CCA GGA CAG GTT 3392Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro Gly Gln Val191519201925GAC TGT GAA TGG CTA TTA GTA TCA GAA CGG GGC TCT CGA CTT GAA TTA 3440Asp Cys Glu Trp Leu Leu Val Ser Glu Arg Gly Ser Arg Leu Glu Leu1930193519401945TCC TTC CAG ACA TTT GAA GTG GAG GAA GAA GCA GAC TGT GGC TAT GAC 3488Ser Phe Gln Thr Phe Glu Val Glu Glu Glu Ala Asp Cys Gly Tyr Asp195019551960TAT GTG GAG CTC TTT GAT GGT CTT GAT TCA ACA GCT GTG GGG CTT GGT 3536Tyr Val Glu Leu Phe Asp Gly Leu Asp Ser Thr Ala Val Gly Leu Gly196519701975CGA TTC TGT GGA TCC GGG CCA CCA GAA GAG ATT TAT TCA ATT GGA GAT 3584Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu Ile Tyr Ser Ile Gly Asp198019851990TCA GTT TTA ATT CAT TTC CAC ACT GAT GAC ACA ATC AAC AAG AAG GGA 3632Ser Val Leu Ile His Phe His Thr Asp Asp Thr Ile Asn Lys Lys Gly199520002005TTT CAT ATA AGA TAC AAA AGC ATA AGA TAT CCA GAT ACC ACA CAT ACC 3680Phe His Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Asp Thr Thr His Thr2010201520202025AAA AAA TAA CACCAAAACC TCTGTCAGAA CACAAAGGAA TGTGCATAAT 3729Lys Lys *GGAGAGAAGACATATTTTTT TTAAAACTGA AGATATTGGC ACAAATGTTT TATACAAAGA 3789GTTTGAACAAAAAATCCCTG TAAGACCAGA ATTATCTTTG TACTAAAAGA GAAGTTTCCA 3849GCAAAACCCTCATCAGCATT ACAAGGATAT TTGAACTCCA TGCTTGATGG TATTAATAAA 3909GCTGGTGAAA3919(2)SEQ ID NO:5的信息(ⅰ)序列特征(A)長(zhǎng)度1014氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型蛋白質(zhì)(ⅹⅰ)序列描述SEQ ID NO:5:Met Gly Leu Gly Thr Leu Ser Pro Arg Met Leu Val Trp Leu Val Ala1 5 10 15Ser Gly Ile Val Phe Tyr Gly Glu Leu Trp Val Cys Ala Gly Leu Asp20 25 30Tyr Asp Tyr Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr Glu Thr Ile35 40 45Asp Tyr Lys Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala50 55 60Leu Asp Asp Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg Thr Ile Asp65 70 75 80Leu Thr Gln Asn Pro Phe Gly Asn Leu Gly His Thr Thr Gly Gly Leu85 90 95Gly Asp His Ala Met Ser Lys Lys Arg Gly Ala Leu Tyr Gln Leu Ile100 105 110Asp Arg Ile Arg Arg Ile Gly Phe Gly Leu Glu Gln Asn Asn Thr Val115 120 125Lys Gly Lys Val Pro Leu Gln Phe Ser Gly Gln Asn Glu Lys Asn Arg130 135 140Val Pro Arg Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly145 150 155 160Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg Ala165 170 175Met Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr180 185 190Phe Ile Glu Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe Thr Tyr Arg195 200 205Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn Gly Pro Gln
210 215 220Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val His225 230 235 240Glu Leu Gly His Val Ile Gly Phe Trp His Glu His Thr Arg Pro Asp245 250 255Arg Asp Asn His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln260 265 270Glu Tyr Asn Phe Leu Lys Met Glu Pro Gly Glu Val Asn Ser Leu Gly275 280 285Glu Arg Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe290 295 300Ser Arg Gly Met Phe Leu Asp Thr Ile Leu Pro Ser Arg Asp Asp Asn305 310 315 320Gly Ile Arg Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly Asp325 330 335Ile Ala Gln Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys Gly Glu Thr340 345 350Leu Gln Glu Ser Asn Gly Asn Leu Ser Ser Pro Gly Phe Pro Asn Gly355 360 365Tyr Pro Ser Tyr Thr His Cys Ile Trp Arg Val Ser Val Thr Pro Gly370 375 380Glu Lys Ile Val Leu Asn Phe Thr Thr Met Asp Leu Tyr Lys Ser Ser385 390 395 400Leu Cys Trp Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr Trp Arg Lys405 410 415Ser Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Leu Pro Glu Val Leu420 425 430Thr Ser Thr Asp Ser Arg Met Trp Ile Glu Phe Arg Ser Ser Ser Ash435 440 445Trp Val Gly Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile Cys Gly Gly450 455 460Glu Ile Arg Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp465 470 475 480Asp Tyr Arg Pro Met Lys Glu Cys Val Trp Lys Ile Thr Val Ser Glu485 490 495Ser Tyr His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg His500 505 510Asp Asn Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly Thr Ser Glu515 520 525Asn Ser Pro Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys Pro Glu Asp530 535 540Ile Arg Ser Thr Ser Asn Thr Leu Trp Met Lys Phe Val Ser Asp Gly545 550 555 560Thr Val Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Glu Asp565 570 575Glu Cys Ala Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg Cys Leu Asn580 585 590Thr Leu Gly Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr Glu Leu Gly595 600 605Pro Asp Arg Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu Leu Thr Lys610 615 620Leu Asn Gly Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu Tyr Pro Pro625 630 635 640Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Thr Gln Tyr Arg Ile645 650 655Ser Val Lys Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu Val Cys Lys660 665 670Tyr Asp Tyr Val Glu Ile Trp Ser Gly Leu Ser Ser Glu Ser Lys Leu675 680 685His Gly Lys Phe Cys Gly Ala Glu Val Pro Glu Val Ile Thr Ser Gln690 695 700Phe Asn Asn Met Arg Ile Glu Phe Lys Ser Asp Asn Thr Val Ser Lys705 710 715 720Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser Lys725 730 735Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Met Gly Ser Tyr740 745 750Met Cys Gln Cys Arg Asn Gly Phe Val Leu His Asp Asn Lys His Asp755 760 765Cys Lys Glu Ala Glu Cys Glu Gln Lys Ile His Ser Pro Ser Gly Leu770 775 780Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys785 790 795 800Thr Trp Glu Ile Ser Ala Thr Pro Gly His Arg Ile Lys Leu Ala Phe805 810 815Ser Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu820 825 830Glu Val Phe Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu Gly Arg Leu835 840 845Cys Gly Asn Lys Ile Pro Asp Pro Leu Val Ala Thr Gly Asn Lys Met850 855 860Phe Val Arg Phe Val Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln865 870 875 880Ala Thr His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Ser Lys885 890 895Pro Arg Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro900 905 910Gly Gln Val Asp Cys Glu Trp Leu Leu Val Ser Glu Arg Gly Ser Arg
915 920 925Leu Glu Leu Ser Phe Gln Thr Phe Glu Val Glu Glu Glu Ala Asp Cys930 935 940Gly Tyr Asp Tyr Val Glu Leu Phe Asp Gly Leu Asp Ser Thr Ala Val945 950 955 960Gly Leu Gly Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu Ile Tyr Ser965 970 975Ile Gly Asp Ser Val Leu Ile His Phe His Thr Asp Asp Thr Ile Asn980 985 990Lys Lys Gly Phe His Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Asp Thr995 10001005Thr His Thr Lys Lys *1010(2)SEQ ID NO:6的信息(ⅰ)序列特征(A)長(zhǎng)度20堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述SEQ ID NO:6:CCAGCTTAAC CTGTTCACAC 20(2)SEQ ID NO:7的信息(ⅰ)序列特征(A)長(zhǎng)度20堿基對(duì)(B)類型核酸(C)鏈型單鏈
(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述SEQ ID NO:7:AACTCTACTT CCACTTCATC 20(2)SEQ ID NO:8的信息(ⅰ)序列特征(A)長(zhǎng)度20堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述SEQ ID NO:8:TCAGAACAGA AAGGAATGTG 20(2)SEQ ID NO:9的信息(ⅰ)序列特征(A)長(zhǎng)度20堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述SEQ ID NO:9:GACCACTATT CCACATCACC 20(2)SEQ ID NO:10的信息(ⅰ)序列特征(A)長(zhǎng)度24堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述SEQ ID NO:10:TCTTGCAGTC AGTTGCTTTG CTGG 24(2)SEQ ID NO:11的信息(ⅰ)序列特征(A)長(zhǎng)度28堿基對(duì)(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述:SEQ ID NO:11TAGTGCGGCC GCACATTCCT TTGTGTTC 28(2)SEQ ID NO:12:的信息(ⅰ)序列特征(A)長(zhǎng)度18氨基酸
(B)類型氨基酸(C)鏈型(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型肽(ⅹⅰ)序列描述SEQ ID NO:12:Cys Tyr Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Glu Thr Met His Ala1 5 10 15Lys Asn(2)SEQ ID NO:13:的信息(ⅰ)序列特征(A)長(zhǎng)度18氨基酸(B)類型氨基酸(C)鏈型(D)拓?fù)浣Y(jié)構(gòu)線性(ⅱ)分子類型肽(ⅹⅰ)序列描述SEQ ID NO:13:Cys His Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Asp Thr Thr His Thr1 5 10 15Lys Lys
權(quán)利要求
1.一種基本純化的DNA分子制品,所述DNA分子包含SEQ ID NO:2核苷酸1052至3649之間的序列。
2.一種基因構(gòu)建物,所述構(gòu)建物按5'到3'順序包括一個(gè)在宿主細(xì)胞中有活性的轉(zhuǎn)錄啟動(dòng)子和一個(gè)包含SEQ ID NO:2核苷酸1052至3649之間核苷酸序列的DNA片段。
3.一種治療創(chuàng)口的方法,所述方法包括下列步驟在合適的宿主細(xì)胞中提供一個(gè)基因構(gòu)建物,所述構(gòu)建物包含一個(gè)在宿主細(xì)胞中有活性的轉(zhuǎn)錄啟動(dòng)子以及一個(gè)含有SEQ ID NO:2核苷酸1052至3649之間核苷酸序列的DNA片段,以使所述核苷酸序列編碼蛋白質(zhì)和以有效量對(duì)創(chuàng)口給藥,使該創(chuàng)口比未經(jīng)治療的創(chuàng)口更迅速地愈合。
4.一種基本純的蛋白質(zhì)制品,所述蛋白質(zhì)具有SEQ ID NO:3中氨基酸1至1013之間的氨基酸序列。
5.一種基本純化的DNA分子制品,所述DNA分子包含SEQ ID NO:4核苷酸1089至3686之間的核苷酸序列。
6.一種基因構(gòu)建物,所述基因構(gòu)建物按5'到3順序包括一個(gè)在宿主細(xì)胞中有活性的轉(zhuǎn)錄啟動(dòng)子和一個(gè)含有SEQ ID NO:4中核苷酸1089至3686之間的核苷酸序列的DNA片段。
7.一種治療傷口的方法,所述方法包括下列步驟在合適的宿主細(xì)胞中提供一個(gè)基因構(gòu)建物,所述構(gòu)建物包含一個(gè)在宿主細(xì)胞中有活性的轉(zhuǎn)錄啟動(dòng)子以及一個(gè)含有SEQ ID NO:4核苷酸1089至3686之間核苷酸序列的DNA片段,以使該核苷酸序列編碼蛋白質(zhì)并將該蛋白質(zhì)以有效量用于傷口,使該傷口比未經(jīng)治療的傷口更迅速地愈合。
8.一種基本純的蛋白質(zhì)制品,所述蛋白質(zhì)有SEQ ID NO:5氨基酸1至1013之間的氨基酸序列。
全文摘要
提出了一種編碼與人或小鼠BMP-1/mTld不同的特洛德樣蛋白質(zhì)的哺乳動(dòng)物基因,所述基因在結(jié)構(gòu)上與BMP-1基因家族的成員相似,但在不同的位置上,并編碼不同的蛋白質(zhì)。該基因編碼的蛋白質(zhì)可用以篩選推定的治療劑以抑制BMP-1基因家族的活性,防止結(jié)疤、纖維變性等。
文檔編號(hào)A61K48/00GK1220608SQ97195192
公開(kāi)日1999年6月23日 申請(qǐng)日期1997年5月30日 優(yōu)先權(quán)日1996年5月30日
發(fā)明者D·S·格林斯潘, 高原和彥, G·G·霍夫曼 申請(qǐng)人:威斯康星鋁研究基金會(huì)