專利名稱::使用甲酰-甘氨酸生成酶(fge)對多種硫酸酯酶缺乏癥和其它病癥進行診斷和治療的制作方法使用甲酰-甘氨酸生成酶(FGE)對多種硫酸酯酶缺乏癥和其它病癥進行診斷和治療本申請是申請?zhí)?00480006490.0,申請日2004年2月10日的同名專利的分案申請。發(fā)明領(lǐng)域此發(fā)明涉及診斷和治療多種硫酸酯酶缺乏癥(MSD)以及其它硫酸酯酶缺乏癥的方法和組合物。更特異地,本發(fā)明涉及被分離的調(diào)節(jié)硫酸酯酶翻譯后修飾的分子。這類修飾為硫酸酯酶的正確功能所必需。
背景技術(shù):
:硫酸酯酶是高度保守的基因家族的成員,共享廣泛的序列同源性(Franco,B.等,Ce",1995,81:15-25;Parenti,G.等,0;/".Ce幾"er.,1997,7:386-391),高度的結(jié)構(gòu)類似性(Bond,C.S.等,^n/"i/re,1997,5:277-289;Lukatela,G.等,5/oc/e邁/"ry,1998:37:3654-64),和獨特的為硫酸酯斷裂所必需的翻譯后修飾(Schmidt,B.等,6W/,1995,82:271-278;Selmer,T.等,/.S/oc/e瓜,1996,238:341-345)。翻譯后修飾包括對保守的半胱氨酸(在真核細(xì)胞中)或絲氨酸(在某些原核細(xì)胞中)殘基在Cp處的氧化,得到L-Ca-曱酰甘氨酸(也叫做w化2-扇差-j-處^;丙磁),其中醛基代替了側(cè)鏈的硫代甲基基團。醛基是硫酸酯酶催化位點的必需部分,很可能作為醛水合物起作用。成對的羥基之一在硫酸酯斷裂時接受硫酸基團,導(dǎo)致共價硫酸化的酶中間物的形成。其它羥基是隨后的硫酸基團消去和醛基再生所需要的。此修飾在初生硫酸酯酶多肽輸入期間或間隔很短時間之后發(fā)生于內(nèi)質(zhì)網(wǎng),并被圍繞著將被修飾的半胱氨酸(或絲氨酸)殘基的短線性序列所調(diào)控。此高度保守序列是六肽L/V-C(S)-X-P-S-R(SEQIDN0:32),出現(xiàn)在所有真核細(xì)胞硫酸酯酶的N末端區(qū)域,并最頻繁地在殘基X上攜帶羥基或硫羥基(Dierks,T.等,A"s〃.K&丄,1997,94:11963-11968)。迄今為止,已在人體中鑒別出13個硫酸酯酶基因。它們編碼具有不同底物專一性和亞細(xì)胞定位如溶酶體、高爾基體和內(nèi)質(zhì)網(wǎng)定位的酶。這些基因中的四種^M,MM,MM,和^^尸(分別編碼芳基硫酸酯酶C,D,E和F),位于相同的染色體區(qū)域(Xp22.3)內(nèi)。它們共享顯著的序列類似性和幾乎相同的基因組組織方式,說明它們來源于在進化中近來才發(fā)生的復(fù)制事件(FrancoB等,Ce/厶1995,81:15-25;MeroniG等,腸編Ge^,1996,5:423-31)。由單獨硫酸酯酶活性的缺乏所引起的至少八種人單基因疾病的鑒定,強調(diào)了硫酸酯酶在人體代謝中的重要性。這些病癥中的大部分是溶酶體存貯病,其中,表型結(jié)果源于被儲存物質(zhì)的類型和組織分布。在它們中,有五種不同類型的因硫酸酯酶對粘多糖分解代謝作用的缺乏而引起的粘多糖病(MPS類型II,IIIA,IIID,IVA和VI)(Neufeld和Muenzer,2001,Themucopolysaccharidoses,ZnT7eVe"6o"ca/tfM/ecu/ar"asesof//力erj7ef/"/sease,C.R.Scriver,A.L.Beaudet,W.S.Sly,D.Valle,B.Childs,K.W.Kinzler和B.Vogelstein編,NewYork:McGraw-Hill,pp.3421-3452),和以腦硫脂在中樞和外周神經(jīng)系統(tǒng)中儲存并引起嚴(yán)重和漸進性神經(jīng)退化為特征的異常染性腦白質(zhì)營養(yǎng)不良(MLD),兩種另外的人類疾病由非溶酶體硫酸酯酶缺乏引起。這些包括X-連鎖的魚鱗病,因類固醇硫酸酯酶(STS/ARSC)缺乏而引起的皮膚??;和點狀軟骨發(fā)育不全,由芳基硫酸酯酶E(ARSE)缺乏引起的影響骨和軟骨的疾病。硫酸酯酶也牽涉到藥物誘導(dǎo)的人畸形綜合癥,例如Warfarin胚胎病,由懷孕期間在宮內(nèi)暴露于殺鼠靈而抑制ARSE活性所引起。在引起人興趣的人類單基因疾病中,多種硫酸酯酶缺乏癥(MSD)是所有硫酸酯酶活性同時有缺陷。因此,此嚴(yán)重的多系統(tǒng)性疾病的表型結(jié)合了在單獨硫酸酯酶缺乏中所觀察到的特征。來自多種硫酸酯酶缺乏癥患者的細(xì)胞即使以編碼人硫酸酯酶的cDNAs轉(zhuǎn)染之后也缺乏硫酸酯酶活性,暗示所有硫酸酯酶活性所需要的普遍機制的存在(Ro咖erskirch和vonFigura,iVoc.Jcad.,,,1992,89:2561-2565)。硫酸酯酶的翻譯后修飾被發(fā)現(xiàn)在多種硫酸酯酶缺乏癥患者中有缺陷,暗示此疾病由基因的突變所引起,該基因牽涉到半胱氨酸至甲酰甘氨酸的轉(zhuǎn)化機制(Schmidt,B.等,Ce//,1995,82:271-278)。盡管存在強烈的生物學(xué)和醫(yī)學(xué)興趣,以鑒別此基因為目標(biāo)的努力卻被多種硫酸酯酶缺乏癥患者的稀有性和隨之帶來的缺乏合適的家族病例而無法完成遺傳圖鐠繪制所妨礙。發(fā)明概述本發(fā)明提供診斷和治療多種硫酸酯酶缺乏癥(MIM272200)及治療其它硫酸酯酶缺乏癥的方法和組合物。更特異地,已鑒別出編碼曱酰甘氨酸生成酶(FGE)的基因,此酶負(fù)責(zé)發(fā)生于硫酸酯酶的獨特的翻譯后修飾(形成L-Ca-甲酰甘氨酸;也叫做尸67/和/或2-我差-J-袞A丙凝),該翻譯后修飾為硫酸酯酶功能所必需。已發(fā)現(xiàn),出乎意料的是FGE基因中的突變導(dǎo)致受試者中的多種硫酸酯酶缺乏癥(MSD)的發(fā)展。也發(fā)現(xiàn),出乎意料的是FGE增強了硫酸酯酶的活性,包括但不限于,艾杜糖醛酸2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺6-硫酸酯酶,N-乙酰葡萄糖胺6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-1,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6。考慮到這些發(fā)現(xiàn),本發(fā)明的分子可用于診斷和治療多種硫酸酯酶缺乏癥以及其它硫酸酯酶缺乏癥。在多種硫酸酯酶缺乏癥的診斷中應(yīng)用本發(fā)明的分子的方法被提供。另夕卜,為調(diào)節(jié)硫酸酯酶上尸67/形成的目的而在體內(nèi)或體外應(yīng)用這些分子的方法,治療與這種修飾相關(guān)的病癥的方法,和對制備治療多種硫酸酯酶缺乏癥及其它硫酸酯酶缺乏癥的藥學(xué)制劑有用的組合物,也被提供。本發(fā)明因此在幾個方面包括調(diào)節(jié)硫酸酯酶上尸W/形成的多肽,分離的編碼那些多肽的核酸,它們的功能修飾物和變體,它們的有用的片段,以及與其相關(guān)的治療、診斷和研究的方法、組合物與工具。根據(jù)本發(fā)明的一個方面,選自下列的分離的核酸分子被提供(a)與SEQIDN0:1所示的核苷酸序列所組成的分子在嚴(yán)格條件下雜交的核酸分子,該核酸分子編碼具有Ca-曱酰甘氨酸生成活性的曱酰甘氨酸生成酶(FGE);(b)與(a)的核酸分子在密碼子序列上因遺傳密碼簡并性而有所區(qū)別的核酸分子;和(c)(a)或(b)的互補鏈。在一定的實施方案中,分離的核酸分子包括SEQIDNO:1所示的核苷酸序列。在某些實施方案中,分離的核酸分子由SEQIDN0:3所示的核苷酸序列或其片段組成。本發(fā)明的另一方面提供分離的選自下列的核酸分子(a)SEQIDN0:1所示的核苷酸序列的獨特(unique)片段,和(b)(a)的互補鏈,條件是(a)中的獨特片段包括了不與某些序列相同的連續(xù)核苷酸序列,所述某些序列選自(l)與SEQIDNO.4和/或SEQIDNO.4的核苷酸20-1141相同的序列,和(2)(1)中核酸分子的互補鏈。在任何前迷的實施方案中,互補鏈指全長互補鏈。在一個實施方案中,連續(xù)核苷酸序列選自(1)至少兩個不與序列組完全相同的連續(xù)核苷酸,(2)至少三個不與序列組完全相同的連續(xù)核苷酸,(3)至少四個不與序列組完全相同的連續(xù)核苷酸,(4)至少五個不與序列組完全相同的連續(xù)核苷酸,(5)至少六個不與序列組完全相同的連續(xù)核苷酸,和(6)至少七個不與序列組完全相同的連續(xù)核苷酸。在另一實施方案中,片段大小選自至少8個核苷酸,IO個核苷酸,12個核苷酸,14個核苷酸,16個核苷酸,18個核苷酸,20個核普酸,22個核苷酸,24個核苷酸,26個核苷酸,28個核苷酸,30個核苷酸,40個核苷酸,5Q個核苷酸,75個核苷酸,100個核苷酸,200個核苷酸,1000個核苷酸和其間的每一整數(shù)長度。根據(jù)又一方面,本發(fā)明提供包含上述核酸分子的表達載體和以該表達載體轉(zhuǎn)化或轉(zhuǎn)染的宿主細(xì)胞。根據(jù)又一方面,本發(fā)明提供表達內(nèi)源FGE基因的活化形式的細(xì)胞。在一個實施方案中,內(nèi)源FGE基因的活化通過同源重組發(fā)生。根據(jù)本發(fā)明又一方面,分離的多肽被提供。分離的多肽被前述的本發(fā)明核酸分子所編碼。在某些實施方案中,分離的多肽被SEQIDN0:1的核酸編碼,產(chǎn)生出具有SEQIDNO:2序列和Ca-曱酰甘氨酸生成活性的多肽,在其它的實施方案中,分離的多肽也許是前述的片段或變體,其長度足以代表人基因組中獨特序列并且是具有Ca-甲酰甘氨酸生成活性的多肽,條件是該片段包括不與任何被具有SEQIDNO.4的核酸序列所編碼的序列相同的連續(xù)氨基酸的序列。在另一實施方案中,上述多肽分子的免疫源性片段被提供。免疫源性片段也許具有也許不具有Ca-甲酰甘氨酸生成活性。根據(jù)本發(fā)明又一方面,分離的結(jié)合多肽被提供,其選擇性地與前述的本發(fā)明核酸分子所編碼的多肽結(jié)合。優(yōu)選分離的結(jié)合多肽選擇性地結(jié)合包含SEQIDNO:2序列的多肽、其片段或?qū)儆诜蛛x的具有Ca-甲酰甘氨酸生成活性的多肽家族而在本文其它部分所述的多肽。在優(yōu)選的實施方案中,分離的結(jié)合多肽包括抗體和抗體片段(如Fab,F(xiàn)(ab)2,F(xiàn)d和包括了與FGE多肽選擇性結(jié)合的CDR3區(qū)域的抗體片段)。在一定的實施方案中,抗體是人抗體。在某些實施方案中,抗體是單克隆抗體。在某一實施方案中,抗體是多克隆抗血清。在進一步的實施方案中,抗體是人源化的。在更進一步的實施方案中,抗體是嵌合的。根據(jù)本發(fā)明又一方面,具有Ca-甲酰甘氨酸生成活性的分離的多肽的家族被提供。每一所述多肽從氨基端到羧基端包含(a)氨基端亞結(jié)構(gòu)域l;亞結(jié)構(gòu)域2;包含35到45個氨基酸的羧基端亞結(jié)構(gòu)域3,而其中亞結(jié)構(gòu)域3與選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的多肽的亞結(jié)構(gòu)域3具有至少約75%的同源性和大致相同的長度。在重要的實施方案中,亞結(jié)構(gòu)域2含有120到140個氨基酸。在進一步的重要實施方案中,亞結(jié)構(gòu)域2中至少5%的氨基酸是色氨酸。在某些實施方案中,亞結(jié)構(gòu)域2與選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的多肽的結(jié)構(gòu)域2之間具有至少50%的同源性。在一定的實施方案中,每一多肽的亞結(jié)構(gòu)域3與選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的多肽的亞結(jié)構(gòu)域3具有介于約80%和約100。/。之間的同源性。根據(jù)本發(fā)明進一步的方面,用于測定某一受試者中的FGE表達水平的方法被提供。方法包括測量來自某一受試者的測試樣本中的FGE表達以確定FGE在受試者中的表達水平。在一定的實施方案中,測得的測試樣本中的FGE表達與對照樣本(含有已知FGE表達水平)中的FGE表達進行比較。表達被定義成FGEmRNA表達,F(xiàn)GE多肽表達,或如本文其它部分所定義的FGE的Ca-曱酰甘氨酸生成活性。多種方法能用于測量表達。本發(fā)明優(yōu)選的實施方案包括用于測量mRNA表達的PCR和RNA印跡,作為測量FGE多肽表達的試劑的FGE單克隆抗體或FGE多克隆抗血清,以及測量FGECa-曱酰甘氨酸生成活性的方法。在一定的實施方案中,測試樣本例如活檢樣本和生物液體如血液被用作測試樣本。FGE在某一受試者的測試樣本中的表達與對照樣本中的FGE表達比較。根據(jù)本發(fā)明另一方面,用于鑒別在調(diào)節(jié)分子的Ca-甲酰甘氨酸生成活性中有用的物質(zhì)的方法被提供。方法包括(a)將具有Ca-甲酰甘氨酸生成活性的分子與候選物質(zhì)接觸,(b)測量該分子的Ca-甲酰甘氨酸生成活性,和(C)將測得的該分子Ca-曱酰甘氨酸生成活性與對照進行比較以確定候選物質(zhì)是否調(diào)節(jié)分子的Cr甲酰甘氨酸生成活性,其中該分子是具有選自SEQIDNO:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的核苷酸序列的核酸分子,或其表達產(chǎn)物(例如,具有選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽)。在一定的實施方案中,對照是在缺乏候選物質(zhì)的條件下測得的該分子的Ca-甲酰甘氨酸生成活性。根據(jù)本發(fā)明又一方面,在受試者中診斷多種硫酸酯酶缺乏癥的方法被提供。方法包括將生物樣本與試劑接觸,所述生物樣本來自被懷疑具有多種硫酸酯酶缺乏癥的受試者,所述試劑特異結(jié)合選自下面的分子(i)具有SEQIDNO:1,3,或4核苷酸序列的FGE核酸分子,(ii)核酸分子(i)的表達產(chǎn)物,或(iii)(ii)的表達產(chǎn)物的片段;以及測量結(jié)合的試劑數(shù)量并由此確定所述核酸分子或其表達產(chǎn)物的表達是否異常,異常表達表明受試者患有多種硫酸酯酶缺乏癥。根據(jù)本發(fā)明又一方面,用于對特征為核酸分子或其表達產(chǎn)物的異常表達的病癥進行診斷的方法被提供。方法包括將來自受試者的生物樣本與試劑接觸,其中所述試劑特異結(jié)合所述核酸分子、其表達產(chǎn)物或其表達產(chǎn)物的片段;并測量結(jié)合的試劑數(shù)量并由此確定所述核酸分子或其表達產(chǎn)物的表達是否異常,異常表達表明具有所述病癥,其中所述核酸分子具有SEQIDNO:1核苷酸序列而所述病癥是多種硫酸酯酶缺乏癥。根據(jù)本發(fā)明又一方面,用于在受試者中測量特征為核酸分子或其表達產(chǎn)物的異常表達的多種硫酸酯酶缺乏癥的方法被提供。方法包括對來自患者的樣本監(jiān)測選自下面的參數(shù)(i)具有SEQIDNO:1,3,4的核苷酸序列的核酸分子或具有來源于FEG基因組位點的序列的核酸分子,(ii)所述核酸分子編碼的多肽,(iii)來源于所述多肽的肽,和(iv)選擇性結(jié)合所述多肽或肽的抗體,將它們作為對受試者中的多種硫酸酯酶缺乏癥的測定。在某些實施方案中,樣本是如前述實施方案任一項所描述的生物液體或組織。在一定的實施方案中,監(jiān)測步驟包括將樣本與選自下面的可檢測的試劑接觸(a)在嚴(yán)格條件下與(i)中的核酸分子選擇性雜交的分離的核酸分子,(b)選擇性結(jié)合(ii)中的多肽或(iii)中的肽的抗體,和(c)與(iv)中的抗體結(jié)合的多肽或肽??贵w、多肽、肽或核酸能用放射性標(biāo)記或酶進行標(biāo)記。在進一步的實施方案中,方法進一步包含檢驗樣品中的肽。根據(jù)本發(fā)明又一方面,試劑盒被提供。試劑盒包含包裝,包裝包含選擇性結(jié)合前述FGE的分離的核酸或其表達產(chǎn)物的任一種的試劑,和用于與測量值比較的對照,此測量值為所述試劑與前述FGE的分離的核酸或其表達產(chǎn)物的任一種結(jié)合的測量值。在某些實施方案中,對照是用于與測量值比較的預(yù)定值。在一定的實施方案中,對照包含前述FGE的分離的核酸的任一種的表達產(chǎn)物的表位。在一種實施方案中,試劑盒進一步包含選擇性結(jié)合選自下面的多肽的第二試劑艾杜糖醛酸2-硫酸酯酶,硫酸胺酶(sulfamidase),N-乙酰半乳糖胺6-硫酸酯酶,N-乙酰葡萄糖胺6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6,或其肽段,和用于與所迷第二試劑結(jié)合到所述多肽或其肽段的測量值進行比較的對照。根據(jù)本發(fā)明進一步的方面,治療多種硫酸酯酶缺乏癥的方法被提供。方法包括對需要這種治療的受試者施用調(diào)節(jié)Ca-甲酰甘氨酸生成活性的試劑,用量為治療受試者的多種疏酸酯酶缺乏癥的有效量。在某些實施方案中,方法進一步包含某一試劑的共施用,所述試劑選自編碼艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基疏酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基疏酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,或HSulf-6的核酸分子,該核酸分子的表達產(chǎn)物,和該核酸分子的表達產(chǎn)物的片段。在一定的實施方案中,調(diào)節(jié)Cer甲酰甘氨酸生成活性的試劑是本發(fā)明的分離的核酸分子(例如如權(quán)利要求1-8所要求的核酸分子或具有選自SEQIDN0:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸)。在重要的實施方案中,調(diào)節(jié)Cer甲酰甘氨酸生成活性的試劑是本發(fā)明的肽(例如,如權(quán)利要求11-15,19,20所要求的肽,或具有選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽)。調(diào)節(jié)Ca-甲酰甘氨酸生成活性的試劑可通過表達內(nèi)源和/或外源FGE核酸分子的細(xì)胞產(chǎn)生。在重要的實施方案中,內(nèi)源FGE核酸分子可被活化。根據(jù)本發(fā)明的一個方面,用于在受試者中增加Ca-甲酰甘氨酸生成活性的方法被提供。方法包括施用本發(fā)明的分離的FGE核酸分子(例如,權(quán)利要求1-8的核酸分子,或具有選自SEQIDNO:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸),和/或其表達產(chǎn)物到受試者中,用量為在受試者中增加Ca-甲酰甘氨酸生成活性的有效量。根據(jù)本發(fā)明的一個方面,用于治療患多種硫酸酯酶缺乏癥的受試者的方法被提供。方法包括對需要這種治療的受試者施用調(diào)節(jié)Ca-甲酰甘氨酸生成活性的試劑,用量為在受試者中增加Ca-曱酰甘氨酸生成活性的有效量。在某些實施方案中,調(diào)節(jié)Ca-曱酰甘氨酸生成活性的試劑是本發(fā)明的有義核酸(例如,權(quán)利要求1-8的核酸分子,或具有選自SEQIDNO:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸)。在一定的實施方案中,調(diào)節(jié)Ca-甲酰甘氨酸生成活性的試劑是本發(fā)明的分離的多肽(例如,權(quán)利要求11-15,19,20的多肽或具有選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽)。根據(jù)本發(fā)明又一方面,用于在細(xì)胞中增加Ca-甲酰甘氨酸生成活性的方法被提供。方法包括將細(xì)胞與本發(fā)明的分離的核酸分子接觸(例如,權(quán)利要求1-8的核酸分子,或具有選自SEQIDNO:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸),或其表達產(chǎn)物,用量為在細(xì)胞中增加Ca-甲酰甘氨酸生成活性的有效量。在重要的實施方案中,方法包括活化內(nèi)源FGE基因以在細(xì)胞中增加Ca-甲酰甘氨酸生成活性。根據(jù)本發(fā)明進一步的方面,藥物組合物被提供。組合物包含治療多種硫酸酯酶缺乏癥的藥學(xué)有效量的某種試劑,該試劑含有本發(fā)明的分離的核酸分子(例如,權(quán)利要求1-8中任一項的分離的核酸分子,具有選自SEQIDNO:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87序列的FGE核酸分子),或其表達產(chǎn)物,以及藥學(xué)上可接受的載體。根據(jù)本發(fā)明的一個方面,用于鑒別在治療多種硫酸酯酶缺乏癥中有用的候選物質(zhì)的方法被提供。方法包括測定一套核酸分子在細(xì)胞或組織中的表達,條件是缺乏候選物質(zhì)時,允許該套核酸分子的最初量的表達,其中該套核酸分子包含至少一種選自下面的核酸分子(a)嚴(yán)格條件下與由SEQIDN0:1所示核苷酸序列組成的分子雜交并編碼具有Ca-甲酰甘氨酸生成活性(FGE)的多肽的核酸分子,(b)遺傳密碼簡并性引起的在密碼子序列中與(a)或(b)中核酸分子不同的核酸分子,(c)具有選自SEQIDNO:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸分子,和(d)(a)或(b)或(c)的互補鏈,將細(xì)胞或組織與候選物質(zhì)接觸并探測該套核酸分子表達的測試量,其中在候選物質(zhì)存在的條件下表達的測試量相對于表達最初量的增加表明候選物質(zhì)在治療多種^fe酸酯酶缺乏癥中有用。根據(jù)本發(fā)明進一步的方面,制備在治療多種硫酸酯酶缺乏癥和/或其它硫酸酯酶缺乏癥中有用的藥劑的方法被提供。根據(jù)本發(fā)明又一方面,固相核酸分子陣列被提供。陣列基本上由固定于固相基質(zhì)的一套核酸分子、其表達產(chǎn)物或其片段(或是核酸的或是多肽分子的)組成,每一核酸分子編碼選自下面的多肽SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78,艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基疏酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,陽f-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6。在某些實施方案中,固相陣列進一步包含至少一種對照核酸分子。在一定的實施方案中,該套核酸分子包含至少一種、至少兩種、至少三種、至少四種或甚至至少五種核酸分子,每一種選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78,艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6。根據(jù)本發(fā)明進一步的方面,用于在受試者中治療硫酸酯酶缺乏癥的方法被提供。方法包括對需要這種治療的受試者施用已根據(jù)本發(fā)明生產(chǎn)出的硫酸酯酶,用量為在受試者中治療硫酸酯酶缺乏癥的有效量,而此硫酸酯酶缺乏癥不是多種硫酸酯酶缺乏癥。在重要的實施方案中,通過已與調(diào)節(jié)Ca-曱酰甘氨酸生成活性的試劑接觸的細(xì)胞產(chǎn)生硫酸酯酶。在一定的實施方案中,硫酸酯酶缺乏癥包括但不限于粘多糖病II(MPSII;Hunter綜合癥),粘多糖病IIIA(MPSIIIA;Sanfilippo綜合癥A),粘多糖病VIII(MPSVIII),粘多糖病IVA(MPSIVA;Morquio綜合癥A),粘多糖病VI(MPSVI;Maroteaux-Lamy綜合癥),異常染性腦白質(zhì)營養(yǎng)不良(MLD),X-連鎖的隱性點狀軟骨發(fā)育不全1,或X-連鎖的魚鱗病(類固醇硫酸酯酶缺乏癥)。在一定的實施方案中,調(diào)節(jié)Ca-甲酰甘氨酸生成活性的試劑可以是本發(fā)明的核酸分子或肽。在一種實施方案中,硫酸酯酶和調(diào)節(jié)Ca-甲酰甘氨酸生成活性的試劑在同一細(xì)胞中共表達。硫酸酯酶和/或調(diào)節(jié)Ca-曱酰甘氨酸生成活性的試劑可以是內(nèi)源性或外源性的來源。如果是內(nèi)源性來源,它可被活化(例如,通過在本領(lǐng)域中已知的合適的位置插入強啟動子和/或其它元件)。如果是外源性的,其表達可被表達載體上的元件所驅(qū)動,或它可靶向于細(xì)胞基因組中合適的位置以允許其被增強的表達(例如,強啟動子下游)。根據(jù)本發(fā)明又一方面,藥物組合物被提供。組合物包含治療疏酸酯酶缺乏癥的藥學(xué)有效量的某種試劑,該試劑含有本發(fā)明的分離的核酸分子或其表達產(chǎn)物,及藥學(xué)上可接受的載體。根據(jù)本發(fā)明更進一步的方面,用于在細(xì)胞中增加硫酸酯酶活性的方法被提供。方法包括將表達硫酸酯酶的細(xì)胞與本發(fā)明的分離的核酸分子(例如,權(quán)利要求l-8中任一項的分離的核酸分子,具有選自SEQIDNO:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的FGE核酸分子)或其表達產(chǎn)物(例如,權(quán)利要求11-15,19,20的多肽,或具有選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽)接觸,用量為在細(xì)胞中增加硫酸酯酶活性的有效量。細(xì)胞可表達內(nèi)源性和/或外源性的硫酸酯酶。在重要的實施方案中,內(nèi)源性的硫酸酯酶被活化。在一定的實施方案中,疏酸酯酶是艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和/或HSulf-6。在一定的實施方案中,細(xì)胞是哺乳動物細(xì)胞。根據(jù)本發(fā)明又一方面,藥物組合物被提供。組合物包含治療硫酸酯酶缺乏癥的藥學(xué)有效量的被細(xì)胞產(chǎn)生的硫酸酯酶,和藥學(xué)上可接受的栽體,其中所述細(xì)胞已與包含本發(fā)明的分離的核酸分子(例如,權(quán)利要求l-8中的,或具有選自SEQIDNO:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸分子),或其表達產(chǎn)物(例如,選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的肽)的試劑接觸。根據(jù)本發(fā)明又一方面,分離的人FGE基因的變體等位基因(其編碼變體FGE多肽)被提供。分離的變體等位基因包含某一氨基酸序列,該氨基酸序列在SEQIDNO:2中至少包含一個變異,其中這至少一個變異包含MetlArg;MetlVal;Leu20Phe;Serl55Pro;Alal77Pro;Cys218Tyr;Arg224Trp;Asn259Ile;Pro266Leu;Ala279Val;Arg327Stop;Cys336Arg;Arg345Cys;Ala348Pro;Arg349Gln;Arg349Trp;Arg349Trp;Ser359Stop;或其纟且合。根據(jù)本發(fā)明又一方面,分離的人類變體FGE多肽被提供。分離的人類變體FGE多肽包含某一氨基酸序列,該氨基酸序列在SEQIDNO:2中至少含有一個變異,其中這至少一個變異包含MetlArg;MetlVal;Leu20Phe;Serl55Pro;Alal77Pro;Cys218Tyr;Arg224Trp;Asn259Ile;Pro266Leu;Ala279Val;Arg327Stop;Cys336Arg;Arg345Cys;AU348Pro;Arg349Gln;Arg349Trp;Arg349Trp;Ser359Stop;或其組合。以前迷任何人類變體FGE多肽為免疫原的抗體也被提供。這類抗體包括多克隆抗體、單克隆、嵌合的抗體,也可被進行可探測性的標(biāo)記??商綔y性的標(biāo)記也許包含放射性元素,熒光化學(xué)物或酶。根據(jù)本發(fā)明又一方面,產(chǎn)生硫酸酯酶的細(xì)胞被提供,其中被細(xì)胞產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率得到增加。細(xì)胞包含(i)表達增強的硫酸酯酶,和(ii)表達增強的甲酰甘氨酸生成酶,其中被細(xì)胞產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率(即,硫酸酯酶的比活性)相對于由缺乏甲酰甘氨酸生成酶的細(xì)胞產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率至少增加5%。在一定的實施方案中,被細(xì)胞產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率相對于由缺乏曱酰甘氨酸生成酶的細(xì)胞產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率,增加了至少10%,15%,20%,50%,畫,200%,500%,1000%。根據(jù)本發(fā)明進一步的方面,在受試者中治療硫酸酯酶缺乏癥的改進方法被提供。方法包括以在受試者中治療硫酸酯酶缺乏癥的有效量對需要這種治療的受試者施用硫酸酯酶,其中硫酸酯酶與有效增加硫酸酯酶比活性的量的曱酰甘氨酸生成酶接觸。在重要的實施方案中,硫酸酯酶選自艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6。在一定的實施方案中,甲酰甘氨酸生成酶被權(quán)利要求l-8的核酸分子或具有選自SEQIDNO:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸所編碼。在某些實施方案中,甲酰甘氨酸生成酶是權(quán)利要求11-15,19,20的肽,或是具有選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽。本發(fā)明的這些和其它目標(biāo)將被進一步結(jié)合本發(fā)明詳細(xì)描述進行詳述。序列簡述SEQIDN0:1是人FGEcDNA的核苷酸序列。SEQIDNO:2是人FGEcDNA(SEQIDNO:1)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDN0:3是編碼SEQIDN0:2的多肽的人FGEcDNA的核苷酸序列(即,SEQIDNO:1的核苷酸20-1141)。SEQIDNO:4是GenBankAcc.No.AK075459的核苷酸序列。SEQIDNO:5是SEQIDNO:4翻譯產(chǎn)物的預(yù)期氨基酸序列,一未命名的具有GenBankAcc.No.BAC11634的蛋白產(chǎn)物。SEQIDNO:6是人艾杜糖醛酸-2-石危酸酯酶cDNA(GenBankAcc.No.M58342)的核苷酸序列。SEQIDNO:7是人艾杜糖醛酸-2-硫酸酯酶cDNA(SEQIDNO:6)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:8是人石克酸胺酶cDNA(GenBankAcc.No.U30894)的核苷酸序列。SEQIDNO:9是人石克酸胺酶cDM(SEQIDN0:8)的翻譯產(chǎn)物的預(yù)期氨基酸序列.SEQIDNO:10是人N-乙酰半乳糖胺-6-硫酸酯酶cDNA(GenBankAcc.No.U06088)的核普酸序列。SEQIDNO:11是人N-乙酰半乳糖胺-6-硫酸酯酶cDNA(SBQIDNO:10)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:12是人N-乙酰葡萄糖胺-6-硫酸酯酶cDM(GenBankAcc.No.Z12173)的核苷酸序列。SEQIDNO:13是人N-乙酰葡萄糖胺-6-硫酸酯酶cDNA(SEQIDNO:12)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:14是人芳基硫酸酯酶AcDNA(GenBankAcc.No.X52151)的核苷酸序列。SEQIDNO:15是人芳基硫酸酯酶AcDNA(SEQIDNO:14)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:16是人芳基石克酸酯酶BcDNA(GenBankAcc.No.J05225)的核苷酸序列。SEQIDNO:17是人芳基硫酸酯酶BcDNA(SEQIDNO:16)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:18是人芳基硫酸酯酶CcDM(GenBankAcc.No.J04964)的核苷酸序列。SEQIDNO:19是人芳基硫酸酯酶CcDM(SEQIDNO:18)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:20是人芳基硫酸酯酶DcDNA(GenBankAcc.No.X83572)的核苷酸序列。SEQIDNO:21是人芳基硫酸酯酶DcDNA(SEQIDNO:20)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:22是人芳基石克酸酯酶EcDNA(GenBankAcc.No.X83573)的核苷酸序列。SEQIDNO:23是人芳基硫酸酯酶EcDNA(SEQIDNO:22)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:24是人芳基硫酸酯酶FcDM(GenBankAcc.No.X97868)的核苷酸序列。SEQIDNO:25是人芳基硫酸酯酶FcDNA(SEQIDNO:24)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:26是人芳基硫酸酯酶GcDNA(GenBankAcc.No.BC012375)的核苷酸序列。SEQIDNO:27是人芳基硫酸酯酶G(SEQIDNO:26)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:28是HSulf-lcDNA(GenBankAcc.No.AY101175)的核苷酸序列。SEQIDNO:29是HSulf-1cDNA(SEQIDNO:28)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:30是HSulf-2cDNA(GenBankAcc.No.AY101176)的核苷酸序列。SEQIDNO:31是HSulf-2cDNA(SEQIDNO:30)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:32是出現(xiàn)于硫酸酯酶的高度保守的六肽L/V-FGly-X-P-S-R。SEQIDNO:33是合成的形成底物;其一級序列是來源于人芳基硫酸酯酶A。SEQIDNO:34是混雜寡肽PVSLPTRSCAALLTGR。SEQIDNO:35是Ser69寡肽PVSLSTPSRAALLTGR。SEQIDNO:36是人FGE-特異性引物1199nc。SEQIDNO:37是人FGE-特異性正向引物lc。SEQIDNO:38是人FGE-特異性反向引物1182c。SEQIDNO:39是包含EcoRI位點的人5,-FGE-特異性引物。SEQIDNO:40是HA-特異性引物。SEQIDNO:41是c-myc-特異性引物。SEQIDNO:42是RGS-His6-特異性引物。SEQIDNO:43是來自人FGE制備物的胰蛋白酶解寡肽SQNTPDSSASNLGFR。SEQIDNO:44是來自人FGE制備物的胰蛋白酶解寡肽MVPIPAGVFTMGTDDPQIK,SEQIDNO:45是人FGE2平行進化同源物(paralog)(GenBankGI:24308053)的核苷酸序列。SEQIDNO:46是人FGE2平行進化同源物(SEQIDNO:45)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:47是小鼠FGE平行進化同源物(GenBankGI:26344956)的核苷酸序列。SEQIDNO:48是小鼠FGE平行進化同源物(SEQIDNO:47)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:49是小鼠FGE定向進化同源物(ortholog)(GenBankGI:22122361)的核苷酸序列。SEQIDNO:50是小鼠FGE定向進化同源物(SEQIDNO:49)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:51是果蠅FGE定向進化同源物(GenBankGI:20130397)的核苷酸序列。SEQIDNO:52是果蠅FGE定向進化同源物(SEQIDNO:51)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:53是蚊子FGE定向進化同源物(GenBankGI:21289310)的核苷酸序列。SEQIDNO:54是蚊子FGE定向進化同源物(SEQIDNO:53)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:55是密切相關(guān)的S.coelicolorFGE定向進化同源物(GenBankGI:21225812)的核苷酸序列。SEQIDNO:56是S.coelicolorFGE定向進化同源物(SEQIDNO:55)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:57是密切相關(guān)的C.efficiensFGE定向進化同源物(GenBankGI:25028125)的核苷酸序列。SEQIDNO:58是C.efficiensFGE定向進化同源物(SEQIDNO:57)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:59是N.aromaticivoransFGE定向進訐匕同源物(GenBankGI:23108562)的核苷酸序列。SEQIDNO:60是N.aromaticivoransFGE定向進化同源物(SEQIDNO:59)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:61是M.lotiFGE定向進化同源物(GenBankGI:13474559)的核苷酸序列。SEQIDNO:62是M.lotiFGE定向進化同源物(SEQIDNO:61)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:63是B.fungorumFGE定向進化同源物(GenBankGI:22988809)的核苷酸序列。SEQIDNO:64是B.fungorumFGE定向進化同源物(SEQIDNO:63)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:65是S.melilotiFGE定向進化同源物(GenBankGI:16264068)的核苷酸序列。SEQIDNO:66是S.melilotiFGE定向進化同源物(SEQIDNO:65)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:67是微顫菌屬物種FGE定向進化同源物(GenBankGI:14518334)的核苷酸序列。SEQIDNO:68是微顫菌屬物種FGE定向進化同源物(SEQIDNO:67)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:69是P.putidaKT2440FGE定向進4匕同源物(GenBankGI:26990068)的核苷酸序列。SEQIDNO:70是P.putidaKT2440FGE定向進化同源物(SEQIDNO:69)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:71是R.metal1iduransFGE定向進化同源物(GenBankGI:22975289)的核苷酸序列。SEQIDNO:72是R.metal1iduransFGE定向進化同源物(SEQIDNO:71)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:73是P.marinusFGE定向進化同源物(GenBankGI:23132010)的核苷酸序列。SEQIDNO:74是P.marinusFGE定向進化同源物(SEQIDNO:73)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:75是C.crescentusCB15FGE定向進化同源物(GenBankGI:16125425)的核苷酸序列。SEQIDNO:76是C.crescentusCB15FGE定向進化同源物(SEQIDN0:75)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:77是M.tuberculosisHt37RvFGE定向進化同源物(GenBankGI:15607852)的核苷酸序列。SEQIDNO:78是M.tuberculosisHt37RvFGE定向進化同源物(SEQIDNO:77)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:79是出現(xiàn)在FGE定向進化同源物和平行進化同源物的亞結(jié)構(gòu)域3的高度保守六肽。SEQIDNO:80是具有GenBankAcc.No.:CA379852的FGE定向進化同源物EST片段的核苷酸序列。SEQIDNO:81是具有GenBankAcc.No.:AI721440的FGE定向進化同源物EST片段的核苷酸序列。SEQIDNO:82是具有GenBankAcc.No.:BJ505402的FGE定向進化同源物EST片段的核苷酸序列。SEQIDNO:83是具有GenBankAcc.No.:BJ054666的FGE定向進化同源物EST片段的核苷酸序列。SEQIDNO:84是具有GenBankAcc.No.:AL892419的FGE定向進化同源物EST片段的核苷酸序列。SEQIDNO:85是具有GenBankAcc.No.:CA064079的FGE定向進化同源物EST片段的核苷酸序列。SEQIDNO:86是具有GenBankAcc.No.:BF189614的FGE定向進化同源物EST片段的核苷酸序列。SEQIDNO:87是具有GenBankAcc.No.:AV609121的FGE定向進化同源物EST片段的核苷酸序列。SEQIDNO:88是HSulf-3cDNA核苷酸序列.SEQIDNO:89是HSulf-3cDNA(SEQIDNO:88)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:90是HSulf-4cDM核苷酸序列.SEQIDNO:91是HSulf-4cDNA(SEQIDNO:90)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:92是HSulf-5cDNA核苷酸序列.SEQIDNO:93是HSulf-5cDM(SEQIDNO:92)的翻譯產(chǎn)物的預(yù)期氨基酸序列。SEQIDNO:94是HSulf-6cDNA核苷酸序列.SEQIDNO:95是HSulf-6cDNA(SEQIDNO:94)的翻譯產(chǎn)物的預(yù)期氨基酸序列。附圖簡述圖1:在缺乏(A)或存在(B)來自牛睪丸微粒體的可溶性抽提物的條件下培育后的P23的MALDI-TOF質(zhì)譜圖示。圖2:來源于人FGE和PFAM-DUF323種子的21種蛋白的排列的系統(tǒng)發(fā)生樹。圖3:人和鼠FGE基因位點的組織。外顯子顯示為以盒子和亮盒子(鼠的位點)表示。內(nèi)含子線上的數(shù)字指出了以kb表示的內(nèi)含子大小。圖4:顯示FGE表達質(zhì)粒pXMG.1.3結(jié)構(gòu)圖的圖表。圖5:柱狀圖描述以FGE表達質(zhì)粒瞬時轉(zhuǎn)染的36F細(xì)胞中的N-乙酰半乳糖胺-6-硫酸酯酶活性。圖6:柱狀圖描述以FGE表達質(zhì)粒瞬時轉(zhuǎn)染的36F細(xì)胞中的N-乙酰半乳糖胺-6-硫酸酯酶比活性。圖7:柱狀圖描述以FGE表達質(zhì)粒瞬時轉(zhuǎn)染的36F細(xì)胞中的N-乙酰半乳糖胺-6-硫酸酯酶生產(chǎn)。圖8:描述以FGE表達質(zhì)粒瞬時轉(zhuǎn)染的30C6細(xì)胞中的艾杜糖醛酸-2-硫酸酯酶活性。圖9:描述了嚢括本發(fā)明的特征的試劑盒。發(fā)明詳述本發(fā)明包括對編碼甲酰甘氨酸生成酶(FGE)的基因的發(fā)現(xiàn),此酶負(fù)責(zé)發(fā)生在疏酸酯酶上的對硫酸酯酶功能必需的獨特翻譯后修飾形成L-Ca-甲酰甘氨酸(a.k.a.F67y和/或J-裒A丙虔)。已發(fā)現(xiàn),出人意料地,F(xiàn)GE基因中的突變引起受試者中的多種硫酸酯酶缺乏癥(MSD)的發(fā)展。也已發(fā)現(xiàn),出人意料地,F(xiàn)GE增強硫酸酯酶的活性,包括但不限于,艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6,及在申請?zhí)枮?0030073118,20030147875,20030148920,20030162279和20030166283的U.S.臨時申請中所述的硫酸酯酶(其內(nèi)容被清楚地整合在本文中)??紤]到這些發(fā)現(xiàn),本發(fā)明的分子可用于診斷和/或治療多種硫酸酯酶缺乏癥,以及其它硫酸酯酶缺乏癥的治療。在診斷多種硫酸酯酶缺乏癥中應(yīng)用本發(fā)明的分子的方法被提供。此外,為了對硫酸酯酶上,67/的形成進行調(diào)節(jié)的目的而在體內(nèi)或體外應(yīng)用這些分子的方法,治療與這種修飾相關(guān)的病癥的方法,及在制備用于治療多種硫酸酯酶缺乏癥及其它硫酸酯酶缺乏癥的治療性制劑中有用的組合物也被提供。本發(fā)明因此在幾個方面中包括調(diào)節(jié)硫酸酯酶上的尸^/的形成的多肽,編碼這些多肽的分離的核酸,前述的功能性修飾物和變體,前述的有用片段,以及治療、診斷和研究的方法、組合物和與其相關(guān)的工具。"Ca-甲酰甘氨酸生成活性"指分子在底物上形成FGly或增強尸67y形成的能力。底物也許是如本文其它部分所述的硫酸酯酶,或合成的寡肽(參見,例如SEQIDNO:33,和實施例)。底物優(yōu)選包含SEQIDNO:32的保守六肽[L/V-C(S)-X-P-S-R]。分析尸67/形成的方法如本領(lǐng)域中(參見,例如Dierks,T.等,戶roc.Ais〃.仄&丄,1997,94:11963-11968),和本文其它部分(參見,例如實施例)所描述。在本文中所用的"分子"包含"核酸"和"多肽"。FGE分子能在體內(nèi)和體外形成F67/,或增強/增加F67/的形成。在本文中所用的"增強(或"增加")"Ca-甲酰甘氨酸生成活性,典型地指增加FGE和/或它編碼的多肽表達。增加的表達指增加(即,到可探測的程度)本發(fā)明任意核酸(如本文其它部分所描述的FGE核酸)的復(fù)制、轉(zhuǎn)錄和/或翻譯,既然上調(diào)任何這些過程將導(dǎo)致基因(核酸)所編碼多肽的濃度/數(shù)量的增加。增強(或增加)Ca-曱酰甘氨酸生成活性也指防止或抑制FGE的降解(例如通過增加的泛素化作用)、下調(diào)等,所述降解和下調(diào)導(dǎo)致例如相對于對照被增加的或穩(wěn)定的FGE分子t1/2(半衰期)。下調(diào)或減少的表達指基因和/或它編碼的多肽減少的表達。通過使用本領(lǐng)域已知的任何適合的方法例如核酸雜交或抗體探測方法,分別探測基因(例如FGE)mRNA水平或基因所編碼的多肽的蛋白表達水平相對于對照的增加或是減少,可直接測定基因表達的上調(diào)或下調(diào)。FGE基因表達的上調(diào)或下調(diào)也能通過探測Ca-甲酰甘氨酸生成活性的變化而間接測定。在本文中所用的"表達"指核酸和/或多肽表達,以及多肽分子的活性(例如分子的C。-甲酰甘氨酸生成活性)。本發(fā)明的一個方面包括對編碼FGE的cDNA的克隆。根據(jù)本發(fā)明的FGE是包含SEQIDNO:1的核酸分子的分離的核酸分子,并編碼具有Ca-曱酰甘氨酸生成活性的多肽。人FGEcDNA的序列以SEQIDNO:1而出現(xiàn),此cDNA編碼的蛋白產(chǎn)物的預(yù)期氨基酸序列以SEQIDNO:2出現(xiàn)。在本文中所用的受試者是哺乳動物或非人類的哺乳動物。在所有實施方案中,人FGB和人受試者都是優(yōu)選。本發(fā)明因此在一個方面包括分離的FGE多肽,編碼此多肽的cDNA,前述的功能性修飾物和變體,前述的有用片段,以及與其相關(guān)的診斷和治療。在本文中所用的關(guān)于核酸的術(shù)語"分離的"表示(i)在體外通過例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)所擴增的;(ii)通過克隆所重組性地產(chǎn)生的;(iii)如通過切斷和凝膠分離所純化的;或(iv)通過例如化學(xué)合成所合成。分離的核酸是容易通過本領(lǐng)域眾所周知的重組DNA技術(shù)操作的類型。因此,包含在一定載體中的核苷酸序列被認(rèn)為是分離的,其中所述載體的5,和3,限制性位點已知或者其聚合酶鏈?zhǔn)椒磻?yīng)(PCR)引物序列已被公開,但在其天然宿主中以其天然狀態(tài)存在的核酸不是分離的。分離的核酸可被充分純化,但不必這樣。例如,在克隆或表達載體內(nèi)的分離的核酸不純,這在于它在其寄生的細(xì)胞中也許只包含很少百分比的物質(zhì)。然而,這種核酸是分離的,如本文中所月的術(shù)語一樣,因為它容易通過本領(lǐng)域中一般技術(shù)人員所知道的標(biāo)準(zhǔn)4支術(shù)被操作。在本文中所用的關(guān)于多肽的術(shù)語"分離的,,表示從其天然環(huán)境中被以充分純的形式分開以至于它可被操作于或用于本發(fā)明的任一目的。因此,"分離的"表示純度足以(i)用于生產(chǎn)和/或分離抗體,(ii)用作分析中的試劑,(iii)用于測序,(iv)用作治療等。根據(jù)本發(fā)明,編碼具有Ca-甲酰甘氨酸生成活性的FGE多肽的分離的核酸分子包括(a)核酸分子,其在嚴(yán)格條件下與SEQIDN0:1的核酸所組成的分子雜交并編碼具有Ca-甲酰甘氨酸生成活性的FGE多肽,(b)(a)的刪除、添加和置換物,其編碼各自的具有C。-曱酰甘氨酸生成活性的FGE多肽,(c)因為遺傳密碼簡并性而與(a)或(b)的核酸分子在密碼子序列中不同的核酸分子,和(d)(a),(b)或(c)的互補鏈。在本文中所用的"互補鏈"包括"(a),(b)或(c)的全長互補鏈或100%的互補鏈"。也具有Ca-甲酰甘氨酸生成活性的本發(fā)明的FGE核酸的同源物和等位基因也被本發(fā)明所包含。本文所述的同源物,包括本文其它部分所鑒別的分子(參見例如SEQIDN0s:4,5,45-78,和80-87)即定向進化同源物和平行進化同源物。進一步的,同源物能依照本發(fā)明的指導(dǎo)以及傳統(tǒng)技術(shù)所鑒別。既然本文所述的FGE同源物全都具有Ca-甲酰甘氨酸生成活性,它們能與人FGE分子在本發(fā)明的所有方面中互換性使用。因此,本發(fā)明的一個方面是那些編碼FGE多肽并在嚴(yán)格條件下與SEQIDN0:1的編碼區(qū)所組成的核酸分子雜交的核酸序列。在重要的實施方案中,如在此所用的術(shù)語"嚴(yán)格條件"指本領(lǐng)域所熟悉的參數(shù)。對核酸,被稱為嚴(yán)格的雜交條件典型的是在低離子強度和恰好低于DNA雜交復(fù)合物熔點(7;)(典型地,低于雜交物7L約3。C)的溫度下。更高的嚴(yán)格性限定了探針序列和靶之間更專一的相關(guān)性。核酸雜交中所用的嚴(yán)格條件在本領(lǐng)域中眾所周知,可在匯編這類方法的參考文獻中找到,例i口#o/ecz//<sr0/7/2^.'JZs6orafoiy#a/2i/a/,J.Sambrook等編,SecondEdition,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork,1989,或Curre/U戶rofocoh//2Wo/eci/hrS/0/c^7,F(xiàn).M.Ausubel等編,JohnWiley&Sons,Inc.,NewYork."嚴(yán)格條件"的實例是在6xSSC中于65°C下雜交。另一嚴(yán)格條件的實例是在雜交緩沖液中于65。C下雜交,雜交緩沖液由3.5xSSC,0.02%Ficoll,0.02%聚乙烯吡咯烷酮,0.02%牛血清白蛋白,2.5mMNaH2P04[pH7],0.5%SDS,2mMEDTA組成(SSC是0.15M氯化鈉/0.15M檸檬酸鈉,pH7;SDS是十二烷基硫酸鈉;而EDTA是乙二胺四乙酸)。雜交之后,轉(zhuǎn)上DNA的膜在2xSSC中于室溫下清洗,然后在最高68。C的溫度下于0.1xSSC/0.1xSDS中清洗。在進一步的實施例中,雜交水溶液的使用的替代是雜交甲酰胺溶液的使用。應(yīng)用例如50%甲酰胺溶液和42°C,嚴(yán)格的雜交條件能因此^f皮實現(xiàn)。有其它能被應(yīng)用的條件、試劑等,并將導(dǎo)致類似的嚴(yán)格程度。技術(shù)人員將熟悉這類條件,因此它們不在這里給出。然而,需要被理解的是,技術(shù)人員將能以允許清晰鑒別本發(fā)明FGE核酸的同源物和等位基因的方式操控條件。技術(shù)人員也將熟悉對于細(xì)胞和之后將被常規(guī)分離的這類分子的表達庫進行篩選,然后再分離相關(guān)的核酸分子和序列的方法。一般地,同源物和等位基因典型地將分別與SEQIDNO:1和SEQIDN0:2具有至少40%核苷酸同一性和/或至少50°/。氨基酸同一性,在某些情況下將具有至少50°/核苷酸同一性和/或至少65%氨基酸同一性,而在其它情況下將具有至少60%核苷酸同一性和/或至少75%氨基酸同一性。在進一步的情形中,同源物和等位基因典型地將分別與SEQIDN0:1和SEQIDNO:2具有至少90%,95%或甚至99%的核苷酸同一性和/或至少95%,98%或甚至99°/。的氨基酸同一性。同一性可應(yīng)用多種由NCBI(Bethesda,Maryland)開發(fā)的公開可得的軟件工具計算得到。示例的工具包括AltschulSF等的啟發(fā)式算法(/#o/》/o/,1990,215:403-410),也稱為BLAST,Pairwise和ClustalW比對(BLOSUM30矩陣設(shè)置)以及Kyte-Doolittle水療分析可應(yīng)用公開(EMBL,Heidelberg,Germany)和商業(yè)(例如來自O(shè)xfordMolecularGroup/GeneticsComputerGroup,Madison,WI的MacVector序歹'J分析軟件)的類型而獲得。前述核酸的Watson-Crick互補鏈也被本發(fā)明所包括。在對FGE相關(guān)基因如FGE的同源物和等位基因的篩選中,Southern印跡可應(yīng)用前述條件以放射性探針來完成。對DNA最終轉(zhuǎn)移上去的膜進行清洗之后,此膜可放置到X-射線膠片或磷成像平板(phosphoimagerplate)以探觀'J放射性信號。在此給定關(guān)于全長人FGEcDNA克隆的指導(dǎo),則對應(yīng)于人FGE基因的其它哺乳動物序列如小鼠cDNA克隆可應(yīng)用標(biāo)準(zhǔn)菌落雜交技術(shù)從c冊A庫中分離。本發(fā)明也包括含有天然物質(zhì)中出現(xiàn)的那些密碼子的替代物的簡并核酸。例如,絲氨酸殘基被密碼子TCA,AGT,TCC,TCG,TCT和AGC編碼。因此,本領(lǐng)域一般技術(shù)人員將很明白,任何絲氨酸編碼核苷酸三聯(lián)體可被用于在體內(nèi)或體外指導(dǎo)蛋白質(zhì)合成裝置,以將絲氨酸殘基整合進入正在延伸的FGE多肽。類似地,編碼其它氨基酸殘基的核苷酸序列三聯(lián)體包括但不限于CCA,CCC,CCG和CCT(脯氨酸密碼子);CGA,CGC,CGG,CGT,AGA和AGG(精氨酸密碼子);ACA,ACC,ACG和ACT(蘇氨酸密碼子);AAC和AAT(天冬酰胺密碼子);及ATA,ATC和ATT(異亮氨酸密碼子)。其它氨基酸殘基可類似地被若干核苷酸序列編碼。因此,本發(fā)明包括與生物學(xué)上分離的核酸在密碼子序列中因遺傳密碼簡并性而有所不同的簡并核酸。本發(fā)明也提供分離的SEQIDNO:1或SEQIDNO:3或其互補鏈的獨特片段。獨特片段是這樣的類型,它是更大的核酸的"標(biāo)志"。例如,獨特片段長度足以確保其精確序列無法在人基因組中位于上述FGE核酸(及人的等位基因)之外的分子中找到。那些本領(lǐng)域中的一是獨特的二;:r丄特片段排除完全由選^]SEQIDNO:;和/;其它如本申請的申請日以前發(fā)表過的序列的核苷酸序列所組成的片段。完全由前迷GenBank保藏庫描述的序列所組成的片段不包括任何對于本發(fā)明序列而言獨特的核苷酸。因此,根據(jù)本發(fā)明的獨特片段必須包含除那些GenBank保藏庫中的確切序列或其片段之外的核苷酸序列。區(qū)別可以是相對于GenBank序列的添加、刪除或置換,或可以是完全不同于GenBank序列的序列。獨特片段能在Southern和Northern印跡分析中用作探針以鑒別這類核酸,或能用于如那些釆用PCR的擴增分析。如本領(lǐng)域技術(shù)人員已知的,大探針如200,250,300或更多的核苷酸優(yōu)選用于一定的應(yīng)用如Southern和Northern印跡,而更小的片段將優(yōu)選用于例如PCR。獨特片段也能被用于產(chǎn)生融合蛋白,以產(chǎn)生抗體或測定如實施例中證明的多肽片段的結(jié)合或產(chǎn)生免疫分析組分。同樣地,獨特片段可被用于產(chǎn)生例如在抗體制備、免疫分析或治療應(yīng)用中有用的FGE多肽非融合片段。獨特片段進一步地可被用作反義分子以抑制FGE核酸和多肽各自的表達。如將被本領(lǐng)域技術(shù)人員所認(rèn)識到的一樣,獨特片段的大小將依賴于其遺傳密碼中的保守性。因此,SEQIDNO:1或SEQIDNO:3的部分區(qū)域和互補鏈將需要更長的節(jié)段來實現(xiàn)獨特,而其它的只需要短節(jié)段,典型的是長12和32個核苷酸之間(例如12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31和32堿基)或更長,長到公開序列的全長,如上述所提及的,此公開內(nèi)容傾向于包含每一序列的每一片段,起點在第一核苷酸、第二核苷酸等等,直到離末端剩下8個核苷酸,而終點在從第8、9、IO核苷酸等等開始直到恰好最后一個核苷酸的任何位置(前提為序列是如上述的獨特片段)。事實上SEQIDNO:1區(qū)域的以核苷酸1開始而在核苷酸1180終止或SEQIDNO:3區(qū)域的以核苷酸1開始而在核苷酸1122終止的任何節(jié)段或其互補鏈,長度為20或更多核苷酸都將是獨特的。本領(lǐng)域技術(shù)人員對選擇這類序列的方法(一般是基于獨特片段選擇性區(qū)分目的序列與人類基因組中其它序列的能力)很精通,雖然可以進行體外的證實性的雜交和序列分析。如上述所提及的,本發(fā)明包含選擇性結(jié)合編碼FGE多肽的核酸分子以減少FGE活性的反義寡核苷酸。在本文中所用的術(shù)語"反義寡核苷酸,,或"反義"描述一定的寡核苷酸,該寡核苷酸是在生理條件下與包含特定基因的DM或該基因的mRNA轉(zhuǎn)錄產(chǎn)物雜交,而因此抑制該基因的轉(zhuǎn)錄和/或該raRNA的翻譯的寡核糖核苷酸,寡脫氧核糖核苷酸,修飾后的寡核糖核苷酸,或修飾后的寡脫氧核糖核苷酸。反義分子被設(shè)計成與靶基因或轉(zhuǎn)錄物雜交以干擾靶基因的轉(zhuǎn)錄或翻譯。本領(lǐng)域技術(shù)人員將認(rèn)識到反義寡核苷酸的確切長度和它與其目標(biāo)互補的程度將依賴于所選的特異靶,包括靶的序列和構(gòu)成那一序列的特定堿基。優(yōu)選反義寡核苷酸被構(gòu)建和安排成在生理條件下選擇性地與靶結(jié)合,即相對于靶細(xì)胞中的任何其它序列在生理條件下更充分地與靶序列雜交?;赟EQIDN0:1或基于等位基因或同源基因組和/或cDNA序列,本領(lǐng)域中的技術(shù)人員能容易地挑選和合成出大量合適的反義分子中的任何類型以根據(jù)本發(fā)明而應(yīng)用。為了具有充分的選擇性和充分有能力進行抑制,這類反義寡核苷酸應(yīng)包含與靶互補的至少IO個和更多連續(xù)堿基,優(yōu)選至少15個,雖然在某些情形中長度短至7個堿基的修飾后的寡核苷酸被成功用作反義寡核苷酸(Wagner等,#e《1995,1(11):1116-1118;Wo^5c力.,1996,14:840-844)。最優(yōu)選的是,反義寡核苷酸包含20-30個堿基的互補序列。雖然對基因或mRNA轉(zhuǎn)錄物任何區(qū)段反義的寡核苷酸可被選出,在優(yōu)選實施方案中,反義寡核苷酸對應(yīng)于N端或5,上游位點例如翻譯起點、轉(zhuǎn)錄起點或啟動子位點。此外,3,-非翻譯區(qū)可被反義寡核苷酸所靶向。對mRNA拼接位點的靶向也在本領(lǐng)域中應(yīng)用,但如果替代性的mRNA拼接發(fā)生,則可能不是那么被優(yōu)選。此外,反義物優(yōu)選靶向于不希望出現(xiàn)mRNA二級結(jié)構(gòu)(參見,例如Sainio等,Ce〃W.#e"ro6/o/.14(5):439-457,1994)和不希望出現(xiàn)蛋白結(jié)合的位點。最后,雖然SEQIDNo:l公開了cDNA序列,本領(lǐng)域中的一般技術(shù)人員可容易地得到對應(yīng)于此序列的基因組DNA。因此,本發(fā)明也提供與對應(yīng)于SEQIDN0:1的基因組DNA互補的反義寡核苷酸。類似地,等位基因或同源FGEcDNAs和基因組DNAs的反義物也能應(yīng)用,而不需要過度的實驗。在一組實施方案中,本發(fā)明的反義寡核苷酸可由"天然"脫氧核糖核苷酸,核糖核苷酸,或它們的任意組合所組成。也就是,一種天然核苷酸的5,末端和另一天然核苷酸的3,末端可通過核苷間的磷酸二酯鍵共價連接,如在天然系統(tǒng)中的一樣。這些寡核苷酸可通過領(lǐng)域內(nèi)認(rèn)可的方法制備,所述方法可人工或通過自動合成儀而實施。它們也可通過載體被重組性地產(chǎn)生。然而,在優(yōu)選的實施方案沖,本發(fā)明的反義寡核苷酸也可包括"修飾后的"寡核苷酸。也就是,寡核苷酸可通過許多不會阻止它們雜交至其目標(biāo)但增強它們的穩(wěn)定性或靶向性或者增強它們的治療效力的方式被修飾。在本文中所用的術(shù)語"修飾后的寡核苷酸"描述這樣的寡核苷酸,其中(l)其核苷酸中的至少兩個通過合成性的核苷間連接而共價連接(即,一個核苷酸5,末端和另一核苷酸3,末端之間除磷酸二酯鍵之外的連接)和/或(2)通常不與核酸連接的化學(xué)基團已被共價附著到寡核苷酸。優(yōu)選的合成性核苷間連接是硫代磷酸酯,烷基膦酸酯,二硫代磷酸酯,磷酸酯,烷基;充代硫酸酯(alkylphosphonothioates),氨基磷酸酯,氨基曱酸酯,碳酸酯,磷酸三酯,acetamidates,羧曱基酯和肽。術(shù)語"修飾后的寡核苷酸"也包括具有被共價修飾的堿基和/或糖的寡核苷酸。例如,修飾后的寡核苷酸包括具有已在除3,位置羥基和5,位置磷酸基之外的位置共價附著到低分子量有機基團的糖骨架的寡核苷酸。因此修飾后的寡核苷酸可包括2,-O-烷基化核糖基團。此外,修飾后的寡核苷酸可包括糖,例如代替核糖的阿拉伯糖。本發(fā)明因此涉及含有修飾后的反義分子與藥學(xué)上可接受的載體的藥物制劑,所述反義分子與編碼FGE多肽的核酸互補并在生理條件下雜交。反義寡核苷酸可作為藥物組合物的一部分被施用。這類藥物組合物可包括與任何本領(lǐng)域中已知的生理性和/或藥學(xué)上可接受的標(biāo)準(zhǔn)載體組合的反義寡核苷酸。組合物應(yīng)是消毒過的,并以適合對患者施用的單位重量或體積而含有藥學(xué)有效量的反義寡核苷酸。術(shù)語"藥學(xué)上可接受的"表示不干擾活性成分的生物活性的效力的非毒性物質(zhì)。術(shù)語"生理上可接受的"指與生物系統(tǒng)如細(xì)胞、細(xì)胞培養(yǎng)物、組織或器官相容的非毒性物質(zhì)。載體的特征將依賴于施用途經(jīng)。生理上和藥學(xué)上可接受的栽體包括本領(lǐng)域眾所周知的稀釋劑、填充物、鹽、緩沖劑、穩(wěn)定物、增溶劑和其它物質(zhì)。本發(fā)明也包括在細(xì)胞中增加Ca-甲酰甘氨酸生成活性的方法。在重要的實施方案中,這通過應(yīng)用載體("表達栽體"和/或"靶向載體")而完成。在本文中所用的"栽體,,可以是多種某類核酸中的任何類型,所在宿主細(xì)胞中表達。載體典型地由DNA組成,雖然RNA載體也可用。載體包括但不限于質(zhì)粒、噬菌粒和病毒基因組。克隆載體是能在宿主細(xì)胞中復(fù)制,并進一步以一個或更多核酸內(nèi)切酶限制性位點為特征的類型,載體能以可測方式在所述核酸內(nèi)切酶限制性位點處被切斷,所需DM序列可連接進入所述位點處而使得新重組載體保持其在宿主細(xì)胞中復(fù)制的能力。在質(zhì)粒的情形中,所需序列的復(fù)制可因為質(zhì)粒在宿主菌內(nèi)增加拷貝數(shù)目而發(fā)生很多次,或在宿主通過有絲分裂而復(fù)制之前在每一宿主中恰好單獨一次。在噬菌體的情形中,復(fù)制可在裂解期期間主動發(fā)生或在溶原期被動發(fā)生。"表達載體"是這樣的類型,所需DNA序列(例如SEQIDNO:3的FGEcDNA)通過限制和連接插入其中而使得所需DM序列被可操作性地連接于調(diào)節(jié)序列并可表達為RNA轉(zhuǎn)錄物。載體可進一步包含一個或更多適合用于鑒別細(xì)胞已被或未被載體轉(zhuǎn)化或轉(zhuǎn)染的標(biāo)記序列。標(biāo)記包括,例如增加或減少對抗生素或其它化合物的抗性或敏感性的蛋白的編碼基因,其活性通過本領(lǐng)域中已知的標(biāo)準(zhǔn)分析可測的酶(例如P-半乳糖苷酶或堿性磷酸酶)的編碼基因,及可視性地影響轉(zhuǎn)化或轉(zhuǎn)染細(xì)胞、宿主、菌落或菌斑的表型(如綠色熒光蛋白)的基因。"靶向載體"是典型地含有一定靶向性結(jié)構(gòu)/序列的類型,所述耙向性結(jié)構(gòu)/序列用于例如在內(nèi)源性基因中(例如,在外顯子和/或內(nèi)含子序列內(nèi)),內(nèi)源性基因啟動子序列中,或內(nèi)源性基因啟動子序列上游插入調(diào)節(jié)序列。在另一實施例中,靶向栽體可包含目的基因(例如SEQIDNO:1的cDNA所編碼的)和對基因耙向于基因組中優(yōu)選位置所需的其它序列(例如,轉(zhuǎn)錄活躍位置如無關(guān)基因的內(nèi)源啟動子下游)。靶向性構(gòu)建體和載體的構(gòu)建在U.S.Patents5,641,670和6,270,989中詳細(xì)描述,其被清楚地整合在本文中作為參考。事實上,任何能被異源性DM或RNA轉(zhuǎn)化并能在培養(yǎng)基中生長或保存的細(xì)胞(原核或真核),可被用在本發(fā)明的實踐中。實施例包括細(xì)菌細(xì)胞如大腸桿菌,昆蟲細(xì)胞,和哺乳動物如人、小鼠、倉鼠、豬、山羊、靈長類等的細(xì)胞。它們可以是原代或次級細(xì)胞林(其在培養(yǎng)中顯示有限數(shù)目的平均群體倍增而不是永久的)和永久的細(xì)胞系(其在培養(yǎng)中顯示明顯的無限壽命)。原代和次級細(xì)胞包括,例如,成纖維細(xì)胞,角質(zhì)化細(xì)胞,上皮細(xì)胞(例如乳腺上皮細(xì)胞,腸上皮細(xì)胞),內(nèi)皮細(xì)胞,神經(jīng)膠質(zhì)細(xì)胞,神經(jīng)細(xì)胞,血液的組成成分(例如淋巴細(xì)胞,骨髓細(xì)胞),肌肉細(xì)胞和這些體細(xì)胞類型的前體包括胚胎千細(xì)胞。在細(xì)胞將被在基因治療中應(yīng)用時,原代細(xì)胞優(yōu)選從施予操作后的細(xì)胞的個體中獲得。然而,原代細(xì)胞能從相同物種的供體(而不是受體)獲得??膳c本發(fā)明的DNA構(gòu)建物和方法一起應(yīng)用的永久的人細(xì)胞系實例包括但不限于HT-1080細(xì)胞(ATCCCCL121),HeLa細(xì)胞和HeLa細(xì)胞衍生物(ATCCCCL2,2.1和2.2),MCF-7乳腺癌細(xì)胞(ATCCBTH22),K-562白血病細(xì)胞(ATCCCCL243),KB癌細(xì)胞(ATCCCCL17),2780AD卵巢癌細(xì)胞(VanderBlick,A.M.等,yes,48:5927—5932(1988),Raji細(xì)胞(ATCCCCL86),WiDr結(jié)腸腺癌細(xì)胞(ATCCCCL218),SW620結(jié)腸腺癌細(xì)胞(ATCCCCL227),Jurkat細(xì)胞(ATCCTIB152),Namalwa細(xì)胞(ATCCCRL1432),HL-60細(xì)胞(ATCCCCL240),Daudi細(xì)胞(ATCCCCL213),RPMI8226細(xì)胞(ATCCCCL155),U-937細(xì)胞(ATCCCRL1593),Bowes黑色素瘤細(xì)胞(ATCCCRL9607),WI-38VA13亞系2R4細(xì)胞(ATCCCLL75.1),和MOLT-4細(xì)胞(ATCCCRL1582),CHO細(xì)胞,和COS細(xì)胞,以及通過人細(xì)胞和另一物種細(xì)胞融合而產(chǎn)生的異雜交瘤細(xì)胞。次級人成纖維細(xì)胞林,如WI-38(ATCCCCL75)和MRC-5(ATCCCCL171)也可被應(yīng)用。對可在實踐本發(fā)明的方法中應(yīng)用的細(xì)胞類型的進一步討論,在U.S.Patents5,641,670和6,270,989中被描述。無細(xì)胞的轉(zhuǎn)錄系統(tǒng)也可代替細(xì)胞。本發(fā)明的細(xì)胞被保存在本領(lǐng)域已知的條件下,這將引起FGE蛋白或其功能性片段的表達。應(yīng)用所述方法,表達的蛋白可從細(xì)胞裂解物或細(xì)胞上清中純化。根據(jù)此方法制得的蛋白質(zhì)能被制成藥學(xué)上有用的配劑,并通過本領(lǐng)域中已知的傳統(tǒng)藥學(xué)途徑而遞送至人或非人的動物(例如口服,靜脈內(nèi),肌肉內(nèi),鼻內(nèi),氣管內(nèi)或皮下)。如本文其它部分所描述的,重組細(xì)胞可以是永生化的、原代的或次級的細(xì)胞,優(yōu)選人的細(xì)胞。來自其它物種的細(xì)胞的應(yīng)用可在一定的情形中是合意的,所述情形為非人細(xì)胞有利于在所產(chǎn)生的非人FGE在藥學(xué)上有用的情況下的蛋白產(chǎn)生的目的。在本文中所用的編碼序列和調(diào)控序列,當(dāng)它們以將編碼序列的表達或轉(zhuǎn)錄置于調(diào)控序列的影響或控制之下的方式而共價連接時,被表述成"可操作性地"連接。如果期望編碼序列被翻譯成功能性蛋白質(zhì),而假如5,調(diào)控序列中的啟動子的誘導(dǎo)導(dǎo)致編碼序列的轉(zhuǎn)錄,并且兩個DNA序列間的連接(l)不會導(dǎo)致移碼突變的引入,(2)不會干擾啟動子區(qū)域指導(dǎo)編碼序列轉(zhuǎn)錄的能力,或(3)不會干擾相應(yīng)的RM轉(zhuǎn)錄物被翻譯成為蛋白的能力,則兩個DNA序列被表述成"可操作性地"連接。因此,如果啟動子區(qū)域能影響那一DNA序列的轉(zhuǎn)錄從而所得的轉(zhuǎn)錄物可被翻譯成所期望的蛋白或多肽,則啟動子區(qū)域?qū)⒖刹僮餍缘剡B接編碼序列?;虮磉_所需的調(diào)控序列的精確本質(zhì)可在物種或細(xì)胞類型間變動,但將一般性地包括,如所必需的,于轉(zhuǎn)錄和翻譯各自啟動有關(guān)的5'非轉(zhuǎn)錄和5,非翻譯序列,如TATA盒,加帽序列,CAAT序列和類似物。尤其是,這類5,非轉(zhuǎn)錄調(diào)控序列將包括包含對可操控性連接的基因進行轉(zhuǎn)錄控制的啟動子序列的啟動子區(qū)域。調(diào)控序列也可包括所期望的增強子序列或上游激動子序列。本發(fā)明的載體可隨意包括5,前導(dǎo)或信號序列。對合適載體的選擇和設(shè)計是在本領(lǐng)域一般技術(shù)人員的能力和指導(dǎo)之內(nèi)。包含所有表達必需的元件的表達載體可商業(yè)性地獲得,并為本領(lǐng)域技術(shù)人員所知。參見,例如Sambrook等,#o/eci//arC/o"http://^,^Za6or"ory她冊a7,SecondEdition,ColdSpringHarborLaboratoryPress,1989。細(xì)胞通過編碼FGE多肽或其片段或變體的異源性DNA(RNA)被引入而基因工程化。那一DM(RM)被置于轉(zhuǎn)錄元件的可操作性控制之下,以允許異源DNA在宿主細(xì)胞中的表達。用于在哺乳動物細(xì)胞中表達mMA的優(yōu)選系統(tǒng)例如包含選擇標(biāo)記如給予G418抗性的基因(其促進對穩(wěn)定性轉(zhuǎn)染的細(xì)胞系的選擇)和人細(xì)胞巨化病毒(CMV)增強子-啟動子序列的pRc/CMV(可從Invitrogen,Carlsbad,CA得到)。此外,適合在靈長類和犬類細(xì)胞系中進行表達的類型有pCEP4載體(Invitrogen,Carlsbad,CA),其包含促進質(zhì)粒作為多拷貝的染色體外元件而保存的EB病毒(EBV)復(fù)制起點。另一表達載體是包含多肽延伸因子lct的啟動子的pEF-BOS質(zhì)粒,其有效刺激了體外的轉(zhuǎn)錄。質(zhì)粒被Mishizuma和Nagata(^/c.h/^Aes.18:5322,1990)描述,而其在轉(zhuǎn)染實驗中的應(yīng)用已得到公開,例如,DemoulinCe//.A/o/.16:4710-4716,1996)。又一優(yōu)選的表達載體是Stratford-Perricaudet所述的腺病毒,其El和E3蛋白有缺陷(/./i3re〃.90:626-630,1992)。腺病毒作為Adeno.PlA重組體的應(yīng)用4皮Warnier等所-&開,用于在小鼠皮內(nèi)注射以得到抗P1A的免疫化(/刀L/.Ca/cer,67:303-310,1996)。本發(fā)明也包括所謂的表達試劑盒,其允許技術(shù)人員制備所期望的表達載體或載體。這類表達試劑盒至少包括每一前面討論的編碼序列的單獨部分。其它成分可按需要添加,只要前面提到的所需的序列被包括在內(nèi)。也應(yīng)認(rèn)識到,本發(fā)明包含上述的包含表達FGEcDNA序列的載體轉(zhuǎn)染宿主細(xì)胞和細(xì)胞系的應(yīng)用,這些細(xì)胞是原核(例如大腸桿菌)或真核性(例如CH0細(xì)胞,COS細(xì)胞,酵母表達系統(tǒng)和在昆蟲細(xì)胞中表達的桿狀病毒)的。尤其有用的是哺乳動物細(xì)胞如人,小鼠,倉鼠,豬,山羊,靈長動物等的細(xì)胞。它們可以是多種組織類型,包括如本文其它部分所描述的原代細(xì)胞和永生化的細(xì)胞系。具體實例包括HT-1080細(xì)胞,CH0細(xì)胞,樹狀細(xì)胞,U293細(xì)胞,外周血白細(xì)胞,骨髓干細(xì)胞,胚胎干細(xì)胞,和昆蟲細(xì)胞。本發(fā)明也允許細(xì)胞和動物中的FGE基因"敲除"的構(gòu)建,為研究FGE活性的某些方面提供材料。本發(fā)明也提供被前述FGE核酸編碼的分離的多肽(包括完整蛋白和部分蛋白),也包括SEQIDN0:2的多肽和其獨特片段。這類多肽可用于,例如,單獨或作為融合蛋白的部分去產(chǎn)生作為免疫分析成分的抗體。多肽可以是從生物樣本包括組織或細(xì)胞勻漿中分離的,也可是在多種原核或真核表達系統(tǒng)中重組性表達的,所述重組性表達通過構(gòu)建適合于表達系統(tǒng)的表達載體,將表達載體引入表達系統(tǒng),及分離重組性表達的蛋白而完成。短多肽,包括抗原性肽(如被MHC分子呈遞在細(xì)胞表面以進行免疫識別的)也能應(yīng)用已良好建立的肽合成方法化學(xué)合成。一般而言,F(xiàn)GE多肽的獨特片段具有如上述討論的與核酸相關(guān)的獨特片段的特征和特性。如本領(lǐng)域技術(shù)人員將認(rèn)識到的,獨特片段的大小將依賴于一定的因素,例如片段是否組成了保守蛋白結(jié)構(gòu)域的一部分。因此,SEQIDN0:2的部分區(qū)域?qū)⑿枰L的片段以保證獨特,而其它的只需要短片段,典型的是在5和12個氨基酸之間(例如5,6,7,8,9,10,11和12氨基酸長或者更多,包括每一整數(shù)直到全長,287個氨基酸長)。多肽的獨特片段優(yōu)選保持明顯的多肽功能能力的那些片段??杀槐3衷诙嚯牡莫毺仄沃械墓δ苣芰Πㄅc抗體的相互作用、與其它多肽或其片段的相互作用,與其它分子的相互作用等。一種重要的活性是作為鑒別多肽的標(biāo)簽而起作用的能力。本領(lǐng)域技術(shù)人員很精通于選擇獨特氨基酸序列的方法,典型的是基于獨特片段從非家族成員中選擇性識別出目的序列的能力。片段的序列與那些數(shù)據(jù)庫中已知序列進行比較即是所需的。本發(fā)明包括上述FGE多肽的變體。在本文中所用的FGE多肽的"變體,,是包含一種或更多對FGE多肽一級氨基酸序列的修飾的多肽。創(chuàng)造FGE多肽變體的修飾,典型的是被施加給編碼FGE多肽的核酸,可包括刪除、點突變、截斷、氨基酸置換和氨基酸或非氨基酸部分的添加,以1)減少或消除FGE多肽的活性;2)增強FGE多肽的性質(zhì),如表達系統(tǒng)中的蛋白穩(wěn)定性或蛋白-配體結(jié)合的穩(wěn)定性;3)對FGE多肽提供新活性或性質(zhì),如抗原性表位的添加或可探測部分的添加;或4)提供與FGE多肽受體或其它分子的相等或更好的結(jié)合。替代性地,修飾可直接施加給多肽,如通過切斷,連接分子的添加,可探測部分如生物素的添加,脂肪酸的添加和類似的方式。修飾也包括包含全部或部分FGE氨基酸序列的融合蛋白。本領(lǐng)域技術(shù)人員將會熟悉預(yù)測蛋白序列變化對蛋白構(gòu)象的影響的方法,并能因此根據(jù)已知方法而"設(shè)計"FGE多肽的變體。這種方法的一個實例被Dahiyat和Mayo在Sc/ej2ce278:82-87,1997中描述,其中蛋白質(zhì)可被重新設(shè)計。此方法能被應(yīng)用于已知的蛋白,以僅改變多肽序列的一部分。通過應(yīng)用Dahiyat和Mayo的計算方法,具體的FGE多肽的變體可得到提議和被測試以測定變體是否保持了所期望的構(gòu)象。變體可包括被專一修飾的FGE多肽,所述修飾是為了改變多肽的與其生理活性無關(guān)的特征。例如,半胱氨酸殘基能被置換或刪除以防止不必要的二硫鍵連接。類似地,一定的氨基酸可被改變以通過消除表達系統(tǒng)中由蛋白酶作用的蛋白水解而增強FGE多肽的表達(例如存在KEX2蛋白酶活性的酵母表達系統(tǒng)中的雙堿性氨基酸殘基)。編碼FGE多肽的核酸的突變優(yōu)選保存編碼序列的氨基酸閱讀框,并優(yōu)選不在核酸中創(chuàng)造出很可能雜交以形成二級結(jié)構(gòu)的區(qū)域,二級結(jié)構(gòu)例如發(fā)卡或環(huán)結(jié)構(gòu)能對變體多肽的表達有害。突變可通過選擇氨基酸置換或多肽編碼核酸中選定位置的隨機突變而發(fā)生。變體多肽隨后得到表達,并進行對一種或更多活性的檢測,以測定哪個突變?yōu)樽凅w多肽提供了期望的性質(zhì)。進一步的對多肽的氨基酸序列而言沉默的突變可提供給變體(或非變體的FGE多肽),但其提供在特定宿主中優(yōu)選的翻譯密碼子,或改變mRNA的結(jié)構(gòu)以,例如,增強穩(wěn)定性和/或表達。優(yōu)選的在例如大腸桿菌、哺乳動物細(xì)胞等中的核酸翻譯密碼子,對本領(lǐng)域中的一般技術(shù)人員而言眾所周知。其它突變也可提供給FGE基因或cDNA克隆的非編碼序列以增強多肽的表達。技術(shù)人員將意識到保守氨基酸置換可發(fā)生在FGE多肽中以提供功能等同的前述多肽的變體,即,變體保持FGE多肽的功能能力。在本文中所用的"保守氨基酸置換"指不顯著改變?nèi)壗Y(jié)構(gòu)和/或多肽活性的氨基酸置換。變體可根據(jù)本領(lǐng)域一般技術(shù)人員已知的改變多肽序列的方法而制備,并包括那些在匯編這類方法的參考文獻中找到的類型,侈寸:i口#o7eci//<3rC7o/27力f爿Za6orafoiy#<2刀:/(37,J.Sambrook等編,SecondEdition,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork,1989,或C"rre/2f戶rofoco/s/;2#o/ecf//arA2'o/0^7,F(xiàn).M.Ausubel等編,JohnWiley&Sons,Inc.,NewYork。示例性的FGE多肽的功能等同性變體包括對SEQIDNO:2的保守氛基酸置換。保守氨基酸置換包括發(fā)生在下列組群內(nèi)部氨基酸中間的置換(a)M,I,L,V;(b)F,Y,W;(c)K,R,H;(d)A,G;(e)S,T;(f)Q,N;和(g)E,D.因此FGE多肽的功能等同的變體,即,保持天然FGE多肽功能的FGE多肽的變體被本發(fā)明所涉及。FGE多肽氨基酸序列中產(chǎn)生功能等同性變體的保守氨基酸置換,典型地是通過編碼FGE多肽的核酸(SEQIDN0s:l,3)的改變所提供。這類置換可通過多種本領(lǐng)域一般技術(shù)人員已知的方法而得到。例如,氨基酸置換可通過PCR導(dǎo)向突變,根據(jù)Kunkel的方法(Kunkel,Sc/.〃.&丄82:488-492,1985)的定點突變,或編碼FGE多肽的基因的化學(xué)合成而得到。FGE多肽的功能等同片段的活性能通過將編碼改變后的FGE多肽的基因克隆進細(xì)菌或哺乳動物表達載體,將載體引入合適的宿主細(xì)胞,表達改變后的FGE多肽,和測試在本文中公開的FGE多肽的功能能力(例如Ca-甲酰甘氨酸生成活性等),而得到測試。在本文中所述的發(fā)明具有許多應(yīng)用,其中的一部分在本文其它部分被描述。首先,本發(fā)明允許對FGE多肽的分離。技術(shù)從業(yè)人員眾所周知的多種方法能被用于得到分離的FGE分子。多肽可從天然產(chǎn)生多肽的細(xì)胞中通過層析方式或免疫識別而純化。替代性地,表達載體可被引入細(xì)胞以引起多肽的產(chǎn)生。在另一方法中,mRNA轉(zhuǎn)錄物可被微注射或另外地被引入細(xì)胞以引起被編碼的多肽的產(chǎn)生。FGEmRNA在無細(xì)胞抽提物如網(wǎng)織紅細(xì)胞降解系統(tǒng)中的翻譯也可被用于產(chǎn)生FGE多肽。本領(lǐng)域技術(shù)人員也可容易地遵循已知的分離FGE多肽的方法。這些包括但不限于免疫層析,HPLC,大小排阻層析,離子交換層析和免疫親和層析。在一定的實施方案中,本發(fā)明也提供來源于FGE多肽的"顯性失活"多肽。顯性失活多肽是蛋白質(zhì)的失活變體,其通過與細(xì)胞機制相互作用而從活性蛋白與細(xì)胞機制的相互作用中取代了活性蛋白,或與活性蛋白竟?fàn)?,而減小了活性蛋白的效應(yīng)。例如,與配體結(jié)合但不會轉(zhuǎn)導(dǎo)響應(yīng)于配體結(jié)合的信號的顯性失活受體能減小配體表達的生物學(xué)效應(yīng)。同樣地,與靶蛋白正常相互作用但不磷酸化靶蛋白的顯性失活催化惰性激酶,能減少靶蛋白響應(yīng)于細(xì)胞信號的磷酸化。類似地,結(jié)合到基因調(diào)控區(qū)域的啟動子位置但不增加基因轉(zhuǎn)錄的顯性失活轉(zhuǎn)錄因子能通過占據(jù)啟動子結(jié)合位置而不增加轉(zhuǎn)錄來減小正常轉(zhuǎn)錄因子的效應(yīng)。顯性失活多肽在細(xì)胞中表達的最終結(jié)果是活性蛋白質(zhì)的功能的減少。本領(lǐng)域一般技術(shù)人員能評估顯性失活蛋白變體的潛力,并用標(biāo)準(zhǔn)突變技術(shù)創(chuàng)造一種或更多顯性失活變體蛋白。參見,例如U.S.PatentNo.5,580,723和Sambrook等,#o/ecw/arC/0/7/wJZa6or"ory#a/zw<2/,SecondEdition,ColdSpringHarborLaboratoryPress,1989。技術(shù)人員隨后能測試經(jīng)誘變的蛋白群體的選定活性的減少和/或?qū)@種活性的保持力。其它類似的用于創(chuàng)造和測試蛋白的顯性失活變體的方法對本領(lǐng)域一般技術(shù)人員將是很顯然的。FGEcDNA的分離也使技術(shù)人員可能診斷以FGE異常表達為特征的疾病。這些方法包括測定FGE基因和/或源于其的FGE多肽的表達。在前者的情形下,這類測定能通過任何標(biāo)準(zhǔn)的核酸測定分析而進行,包括聚合酶鏈?zhǔn)椒磻?yīng),或如下面作為例子的采用標(biāo)記性雜交探針的分析。在后者的情形下,這類測定能通過任何標(biāo)準(zhǔn)的(應(yīng)用例如結(jié)合到分泌出的FGE蛋白的抗體的)免疫分析而進行。優(yōu)選的可根據(jù)本發(fā)明診斷的疾病是多種硫酸酯酶缺乏癥。本發(fā)明也包括分離的肽結(jié)合試劑,所述試劑,例如,可以是具有選擇性結(jié)合到FGE多肽的能力的抗體或抗體片段("結(jié)合性多肽")。抗體包括根據(jù)傳統(tǒng)方法制備的多克隆和單克隆抗體。在一定的實施方案中,本發(fā)明排除了與SEQIDNO:4的核酸所編碼的多肽結(jié)合的結(jié)合性試劑(例如抗體)。值得注意的是,如本領(lǐng)域中眾所周知的,只有抗體分子的一小部分,即抗原互補位,涉及抗體與其表位的結(jié)合(參見,一般地,Clark,W丄(1986)TheExperimentalFoundationsofModernImmunologyWiley&Sons,Inc.,NewYork;Roitt,I.(1991)EssentialImmunology,7thEd.,BlackwellScientificPublications,0xford)。例如,pFc,和Fc區(qū)域是補體級聯(lián)的效應(yīng)子但不涉及抗原結(jié)合。pFc,區(qū)域已被酶切掉的抗體或產(chǎn)生時不含pFc,區(qū)域的抗體,它們被稱為F(ab,)2片段,保持了完整抗體的兩個抗原結(jié)合位點。類似地,F(xiàn)c區(qū)域已被酶切掉的抗體或產(chǎn)生時不含F(xiàn)c區(qū)域的抗體,它們被稱為Fab片段,保持了完整抗體分子的一個抗原結(jié)合位點。進一步地,F(xiàn)ab片段由共價結(jié)合的抗體輕鏈和被表示為Fd的抗體重鏈的一部分所組成。Fd片段是抗體專一性的主要決定因素(單一Fd片段可與多達10條的不同輕鏈相連而不改變抗體專一性),并且Fd片段在分離后保持表位-結(jié)合能力。如本領(lǐng)域中眾所周知的,在抗體的抗原結(jié)合部分內(nèi)部有直接與抗原表位相互作用的互補性決定區(qū)域(CDRs),也有保持抗體結(jié)合部位三級結(jié)構(gòu)的構(gòu)架區(qū)域(FRs)(參見,一般地,Clark,1986;Roitt,1991)。在IgG免疫球蛋白重鏈Fd片段和輕鏈中,有通過三個互補決定區(qū)域(CDR1到CDR3)分別分開的四個構(gòu)架區(qū)域(FR1到FR4)。CDRs尤其是CDR3區(qū)域,更尤其是重鏈CDR3,很大程度上對抗體專一性負(fù)責(zé)?,F(xiàn)在在本領(lǐng)域中已很好地認(rèn)識到,哺乳動物抗體的非CDR區(qū)域可被同種或異種特異性抗體的類似區(qū)域所替代,而保持原始抗體的表位專一性。這在制備和應(yīng)用"人源化"抗體中表現(xiàn)得最清晰,其中非-人CDRs共價連接到人FR和/或Fc/pFc,區(qū)域以產(chǎn)生功能抗體。參見,例如U.S.patents4,816,567,5,225,539,5,585,089,5,693,762和5,859,205。因此,例如,PCT國際公開號W092/04381教授了人源化的鼠類RSV抗體的生產(chǎn)和應(yīng)用,其中至少鼠FR區(qū)域的一部分被人源性的FR區(qū)域所取代。這類抗體,包括具有抗原結(jié)合能力的完整抗體的片段,經(jīng)常被表示成"嵌合的"抗體。因此,正如對本領(lǐng)域一般技術(shù)人員而言是很明白的,本發(fā)明也提供F(ab,)2,F(xiàn)ab,F(xiàn)v和Fd片段;其中Fc和/或FR和/或CDR1和/或CDR2和/或輕鏈CDR3區(qū)域已被同源的人或非-人序列所取代的嵌合的抗體;其中FR和/或CDR1和/或CDR2和/或輕鏈CDR3區(qū)域已經(jīng)被同源的人或非序列所取代的嵌合F(ab,)2片段抗體;其中FR和/或CDR1和/或CDR2和/或輕鏈CDR3區(qū)域已被同源的人或非-人序列所取代的嵌合的Fab片段抗體;以及其中FR和/或CDR1和/或CDR2區(qū)域已被同源的人或非-人序列所取代的嵌合的Fd片段抗體。本發(fā)明也包括所謂的單鏈抗體,因此,本發(fā)明包括與FGE多肽專一結(jié)合的多種大小和類型的多肽,及FGE多肽與其結(jié)合伴倡的復(fù)合物。這些多肽也可由抗體技術(shù)之外的其它來源得來。例如,這類多肽結(jié)合試劑能由簡并肽庫而提供,所述簡并肽庫可很容易以溶液、以固定的形式作為細(xì)菌鞭毛肽展示庫或噬菌體展示庫而制備。也可制備含有一個或更多氨基酸的肽組合文庫。文庫能進一步由肽和非肽的合成部分合成。噬菌體展示能在鑒別根據(jù)本發(fā)明而有用的結(jié)合肽中特別有效。簡而言之,可應(yīng)用傳統(tǒng)程序制備顯示4到約80個氨基酸殘基插入物的噬菌體庫(應(yīng)用例如m13,fd,或?v噬菌體)。插入物可代表,例如,完全的降解物或有偏差的陣列。然后可挑選噬菌體承載性插入物,其結(jié)合到FGE多肽或FGE和結(jié)合伴倡的復(fù)合物。此過程可通過復(fù)選結(jié)合到FGE多肽或復(fù)合物的噬菌體的幾個循環(huán)而重復(fù)。重復(fù)的循環(huán)導(dǎo)致承載特定序列的噬菌體的富集。DNA序列分析可以進行,以鑒別所表達多肽的序列。結(jié)合FGE多肽或復(fù)合物的序列的最小線性部分可被測定。應(yīng)用含有插入物的偏差性的庫,可重復(fù)這些程序,所述插入物包含最小線性部分的一部分或全部外加一個或更多附加的其上游或下游的簡并殘基。酵母雙雜交篩選方法也可用于鑒別結(jié)合到FGE多肽的多肽。因此,本發(fā)明的FGE多肽或其片段或FGE與結(jié)合伴侶的復(fù)合物能被用于篩選肽庫,包括噬菌體展示庫,以鑒別和選擇本發(fā)明FGE多肽的肽結(jié)合伴侶。這類分子能用于,如所述的,篩選分析,純化方案,對FGE功能的直接干擾,及其它對本領(lǐng)域一般技術(shù)人員而言很顯然的目的。FGE多肽或其片段也能用于分離它們的天然結(jié)合伴侶。對結(jié)合伴侶的分離可根據(jù)眾所周知的方法完成。例如,分離的FGE多肽能被附著于某一基質(zhì),然后被懷疑含有FGE結(jié)合伴侶的溶液可應(yīng)用到基質(zhì)上。如果FGE多肽的結(jié)合伴倡在溶液中存在,那么它將結(jié)合到基質(zhì)固著的FGE多肽。之后結(jié)合伴侶可被分離出。充當(dāng)FGE結(jié)合伴侶的其它蛋白質(zhì)可通過類似方法分離出,而不需要過度的實驗。優(yōu)選的結(jié)合伴倡是硫酸酯酶。本發(fā)明也提供測量FGE在受試者中表達水平的方法。這可通過首先得到來自受試者的測試樣本而完成。測試樣本可以是組織或生物液體。組織包括腦,心臟,血清,乳房,結(jié)腸,膀胱,子宮,前列腺,胃,睪丸,卵巢,胰,垂體腺,腎上腺,甲狀腺,唾液腺,乳腺,腎,肝,腸,脾,胸腺,血管,骨髄,氣管,和肺。在一定的實施方案中,測試樣本源自心臟和血管組織,生物液體包括血液,唾液和尿。創(chuàng)傷性和非創(chuàng)傷性技術(shù)都能用于獲得這類樣本,并在本領(lǐng)域中被很好地記載。在分子水平上,應(yīng)用本發(fā)明在此所述的產(chǎn)物和可在匯編這類方法的參考文獻中找到的本領(lǐng)域眾所周知的方案,PCR和Northern印跡都能用于測定FGEmRNA的水平。在蛋白質(zhì)水平上,應(yīng)用多克隆或單克隆抗FGE血清結(jié)合標(biāo)準(zhǔn)免疫分析,F(xiàn)GE表達可被測定。優(yōu)選的方法將會把測得的測試樣本的FGE表達水平與對照進行比較。對照可包括已知量的核酸探針、FGE表位(如FGE表達產(chǎn)物),或來自具有對照或"正常"水平FGE表達的受試者的類似測試樣本。FGE多肽優(yōu)選重組性產(chǎn)生,雖然這類蛋白可從生物抽提物中分離出。重組性產(chǎn)生的FGE多肽包括含有FGE蛋白與另一多肽的融合物的嵌合的蛋白質(zhì),所述多肽例如能提供或增強蛋白-蛋白結(jié)合、序列專一性核酸結(jié)合(如GAL4),增強FGE多肽在分析條件下的穩(wěn)定性,或提供可探測性的部分例如綠色熒光蛋白。融合到FGE多肽或片段的多肽也可提供易于探測融合蛋白的手段,例如通過免疫識別或通過熒光才示卡己。本發(fā)明也在產(chǎn)生非人的轉(zhuǎn)基因動物中有用。在本文中所用的"非人的轉(zhuǎn)基因動物"包括具有整合在生殖系細(xì)胞和/或體細(xì)胞中的一種或更多的外生性核酸分子的非人的動物。因此轉(zhuǎn)基因動物包括通過同源重組而具有純合或雜合基因斷裂的"敲除的"動物,具有游離或染色體整合的表達載體的動物等。敲除動物能通過應(yīng)用本領(lǐng)域眾所周知的胚胎干細(xì)胞的同源重組而制得。重組可應(yīng)用例如本領(lǐng)域一般技術(shù)人員已知的cre/lox系統(tǒng)或其它重組酶系統(tǒng)而促進。在一定的實施方案中,重組酶系統(tǒng)本身是條件性地表達,例如在一定組織或細(xì)胞類型中,在一定胚胎或胚胎后發(fā)育階段,因增加或減弱表達的化合物或類似物質(zhì)的加入而被誘導(dǎo)。一般地,在這類系統(tǒng)中應(yīng)用的條件表達載體應(yīng)用多種可賦予所期望的基因表達模式(例如時間或空間性的)的啟動子。條件啟動子也能可操縱性地連接到FGE核酸分子以受調(diào)節(jié)或條件性的方式增加FGE的表達。FGE活性或表達的^式-作用負(fù)調(diào)節(jié)子也能可操縱性地連接到上述的條件啟動子。這類^4'-作用調(diào)節(jié)子包括反義FGE核酸分子,編碼顯性失活FGE分子的核酸分子,對FGE核酸專一的核酶分子,和類似物。非人的轉(zhuǎn)基因動物在用于對診斷或治療方法的生化或生理效應(yīng)進行測試的實驗中有用,所述診斷或治療方法針對以增加或減少FGE表達為特征的病癥。其它應(yīng)用對本領(lǐng)域一般技術(shù)人員而言是很顯然的。本發(fā)明也涉及基因治療。完成離體基因治療的程序在U.S.Patent5,399,346中概述,也顯示于該專利審查中所提交的文件,其所有內(nèi)容都是公開可得的文件。一般地,它包括在體外將基因的功能拷貝引入到包含基因缺陷性拷貝的受試者的細(xì)胞中,將基因工程化的細(xì)胞回置到受試者中?;虻墓δ芸截愂翘幱谠试S基因在基因工程化細(xì)胞中表達的調(diào)控元件的可操作性控制下。許多轉(zhuǎn)染和轉(zhuǎn)導(dǎo)技術(shù)以及適當(dāng)?shù)谋磉_載體為本領(lǐng)域一般技術(shù)人員所熟知,其中的一部分在PCT申請W095/00654中被描述。應(yīng)用例如腺病毒,逆轉(zhuǎn)錄病毒,皰滲病毒,和靶向的脂質(zhì)體之類載體的體內(nèi)基因治療也根據(jù)本發(fā)明而涉及。本發(fā)明進一步提供鑒別試劑或引導(dǎo)化合物以得到在FGE或FGE片段依賴性細(xì)胞功能的水平上有活性的試劑的有效方法。這類功能尤其包括與其它多肽或片段的相互作用。一般地,篩選方法包括對干擾FGE活性(如C。-甲酰甘氨酸生成活性)的化合物的分析,雖然增強FGECa-甲酰甘氨酸生成活性的化合物也能應(yīng)用該篩選方法而被分析。這類方法能被適應(yīng)于自動化的高產(chǎn)出的化合物篩選。靶指標(biāo)包括被FGE調(diào)節(jié)的細(xì)胞過程如Ca-甲酰甘氨酸生成活性。多種對備選(藥理上的)試劑的分析被提供,包括標(biāo)記的體外蛋白質(zhì)-配體結(jié)合分析,電泳遷移改變分析,免疫分析,基于細(xì)胞的分析例如雙雜交或三雜交篩選,表達分析等。轉(zhuǎn)染的核酸能編碼例如,組合肽庫或cDNA庫。便于這類分析的試劑例如GAL4融合蛋白在本領(lǐng)域中眾所周知??勺鳛榉独幕诩?xì)胞的分析包括,以編碼融合到GAL4DM結(jié)合結(jié)構(gòu)域的FGE多肽的核酸和編碼可操作性地連接到基因表達調(diào)節(jié)區(qū)(如一個或更多GAL4結(jié)合位點)的報告基因的核酸而轉(zhuǎn)染細(xì)胞。報告基因轉(zhuǎn)錄的活化發(fā)生在FGE和報告融合多肽結(jié)合以例如激活報告基因的轉(zhuǎn)錄時。之后,調(diào)節(jié)FGE多肽介導(dǎo)的細(xì)胞功能的試劑通過報告基因表達的變化而被探測。測定報告基因表達變化的方法在本領(lǐng)域中眾所周知。方法中所用的FGE片段當(dāng)不是由轉(zhuǎn)染的核酸所產(chǎn)生時,作為分離的多肽加入到分析混合物中。FGE多肽優(yōu)選重組產(chǎn)生,雖然此多肽可從生物抽提物中分離。重組產(chǎn)生的FGE多肽包括包含F(xiàn)GE蛋白與另一多肽的融合體的嵌合蛋白質(zhì),另一多肽例如能提供或增強蛋白質(zhì)-蛋白質(zhì)結(jié)合、序列專一性核酸結(jié)合(如GAL4)、增強FGE多肽在分析條件下的穩(wěn)定性或提供可探測部分例如綠色熒光蛋白或Flag表位。分析混合物包含能與FGE相互作用的天然的細(xì)胞內(nèi)FGE結(jié)合靶。當(dāng)天然FGE結(jié)合乾可用時,常常優(yōu)選應(yīng)用FGE結(jié)合靼的局部(例如肽-參見例如SEQIDNO:33的肽-或核酸片段)或類似物(即,為分析目的而模擬天然結(jié)合靶的FGE結(jié)合性質(zhì)的試劑),只要局部或類似物提供分析中可測量的對FGE片段的結(jié)合親合性和強烈結(jié)合傾向。分析混合物也包含候選物質(zhì)。典型地,多個分析混合物以不同試劑濃度平行進行,以得到對多種濃度的不同反應(yīng)。典型地,這些濃度中的某一個用作負(fù)對照,即,試劑的零濃度或在分析的探測極限之下的試劑濃度。候選物質(zhì)包括許多化學(xué)種類,雖然它們典型的是有機化合物。優(yōu)選地,候選物質(zhì)是小分子有機化合物,即那些具有大于50然而小于約2500的分子量的類型,優(yōu)選小于約1000,而更優(yōu)選小于約500。候選物質(zhì)包含與多肽和/或核酸的結(jié)構(gòu)性相互作用所必需的功能化學(xué)基團,并典型地包括至少一個氨基、羰基、羥基或羧基基團,優(yōu)選至少兩個功能化學(xué)基團,而更優(yōu)選至少三個功能化學(xué)基團。候選物質(zhì)可包含被一種或更多上述確定的功能基團所取代的環(huán)碳或雜環(huán)結(jié)構(gòu)和/或芳香或聚芳香結(jié)構(gòu)。候選物質(zhì)也可是生物分子例如肽,糖,脂肪酸,固醇,類異戊二烯,嘌呤,嘧啶,上述物質(zhì)的衍生物或結(jié)構(gòu)類似物,或者其組合,以及類似物質(zhì)。試劑是核酸的情形中,試劑典型地是DNA或RM分子,雖然在此所定義的修飾后的核酸也被涉及。候選物質(zhì)從多種來源包括合成或天然化合物的庫得到。例如,對于多種有機化合物和生物分子的隨機和定向合成,有許多方式可用,包括隨機寡核苷酸的表達、合成性的有機組合庫、隨機肽段的噬菌體展示庫和類似方式。替代性地,細(xì)菌、真菌、植物和動物抽提物形式的天然化合物的庫唾手可得或易于產(chǎn)生。此外,天然和合成性產(chǎn)生的庫和化合物能通過傳統(tǒng)化學(xué)、物理和生化方式被修飾。進一步地,已知的(藥理學(xué)上)試劑可進行定向或隨機化學(xué)修飾例如酰化,烷基化,酯化,amidification,等,以產(chǎn)生試劑的結(jié)構(gòu)類似物。多種其它試劑也能被包括在混合物中。這些包括試劑例如鹽,緩沖劑,中性蛋白質(zhì)(例如白蛋白),去污劑,等,其可被用于促進最佳的蛋白質(zhì)-蛋白質(zhì)和/或蛋白質(zhì)-核酸結(jié)合。這樣的試劑也可減少反應(yīng)成分的非專一性的或背景性的相互作用。其它改善分析效率的試劑如蛋白酶,抑制劑,核酸酶抑制劑,抗^:生物劑和類似物也可被應(yīng)用。前述分析材料的混合物在由此確定的條件下培育,但對于候選物質(zhì)存在的情形中,F(xiàn)GE多肽特異性地與細(xì)胞結(jié)合靶、其部分或其類似物結(jié)合。組分加入的順序,培育溫度,培育時間和分析的其它參數(shù)可容易地確定。這類實驗只包括分析參數(shù)的最優(yōu)化,而不涉及分析的基本組成。培育溫度典型地是在4x:和4or;之間。培育時間優(yōu)選最小化以促進快速、高產(chǎn)出的篩選,而典型的是在O.l和IO小時之間。培育之后,F(xiàn)GE多肽與一種或更多結(jié)合靶的專一性結(jié)合的存在與否通過使用者可用的任何方便的方法而探測。對于非細(xì)胞結(jié)合類型分析,分離步驟常被用于從未結(jié)合的組分中分離結(jié)合的組分。分離步驟可以多種方式完成。方便的是,組分中的至少一種在固相基質(zhì)上被固定,未結(jié)合組分可容易地從其中分離。固相基質(zhì)可由多種材料制成多種形式,例如微量滴定平板,微珠,計量棒(dipstick),樹脂顆粒,等。優(yōu)選基質(zhì)被選擇成最大的信噪比,主要是最小化背景結(jié)合,以及使分離程序和成本簡化。分離可被多種因素影響,例如從庫中除去珠子或計量棒,清空或稀釋庫如微量滴定平板孔,以清洗溶液或溶劑清洗珠子,顆粒,層析柱或過濾器。分離步驟優(yōu)選包括多次漂洗或清洗。例如,當(dāng)固相基質(zhì)是微量滴定平板時,孔可典型地被包括培育混合物的那些不參與特異性結(jié)合的組分的清洗溶液清洗數(shù)次,所述組分如鹽,緩沖劑,去污劑,非專一性蛋白質(zhì)等。在固相基質(zhì)是磁珠的情形中,珠子可用清洗溶液清洗一次或更多,并用磁體而分離出。探測可以任何方便的方式被影響,以進行基于細(xì)胞的分析例如雙雜交或三雜交篩選。與靶分子相互作用的FGE多肽的報告基因轉(zhuǎn)錄分析所得到的轉(zhuǎn)錄物典型地編碼直接或間接可測的產(chǎn)物,例如p-半乳糖苷酶活性,熒光素酶活性,和類似物。對于非細(xì)胞結(jié)合分析,組分的一種通常包含或被偶連到可探測的標(biāo)記。多種標(biāo)記都能用,例如那些提供直接探測的類型(例如放射性,發(fā)光,視覺或電子密度等),或提供間接探測的類型(例如,表位標(biāo)簽如FLAG表位、酶標(biāo)簽如辣根過氧化物酶等)。標(biāo)記可被固著于FGE結(jié)合伴倡,或整合進結(jié)合伴倡的結(jié)構(gòu)中。多種方法可被用于探測標(biāo)記,這取決于標(biāo)記的天性和其它的分析組分。例如,當(dāng)固著到固相基質(zhì)時或從固相基質(zhì)分離之后,標(biāo)記可被探測。標(biāo)記可通過視覺或電子密度,放射性輻射,非放射性能量轉(zhuǎn)移等直接探測,或以抗體綴合物、鏈霉抗生物素-生物素綴合物等間接探測。探測標(biāo)記的方法在本領(lǐng)域中眾所周知。本發(fā)明提供FGE專一結(jié)合試劑,鑒別和生產(chǎn)這類試劑的方法,及它們在診斷、治療和藥物開發(fā)中的應(yīng)用。例如,F(xiàn)GE專一性藥理試劑在多種診斷和治療性應(yīng)用中有用,尤其是在疾病或疾病預(yù)后與改變的FGE結(jié)合特征相關(guān)的情形例如多種硫酸酯酶缺乏癥中。新的FGE專一結(jié)合試劑包括FGE專一抗體,細(xì)胞表面受體,被例如雙雜交篩選的分析法所鑒別的其它天然細(xì)胞內(nèi)和細(xì)胞外結(jié)合試劑,及被對化學(xué)庫的篩選所鑒別的非天然細(xì)胞內(nèi)和細(xì)胞外結(jié)合試劑,和類似物。一般而言,F(xiàn)GE結(jié)合到特異分子的專一性通過結(jié)合平衡常數(shù)被測定。能選擇性結(jié)合FGE多肽的靶優(yōu)選具有至少約107M—'的結(jié)合常數(shù),更優(yōu)選至少約108M—、而最優(yōu)選至少約109M—、多種基于細(xì)胞的和非細(xì)胞的分析可被用于證明FGE專一結(jié)合?;诩?xì)胞的分析包括單、雙和三雜交篩選,其中FGE介導(dǎo)的轉(zhuǎn)錄得到抑制或增加等的分析。非細(xì)胞分析包括FGE蛋白結(jié)合分析、免疫分析等。其它對篩選結(jié)合FGE多肽的試劑有用的分析包括熒光共振能量轉(zhuǎn)移(FRET)和電泳遷移改變分析(EMSA)。根據(jù)本方面的另一方面,鑒別在調(diào)節(jié)本發(fā)明的分子的Ca-曱酰甘氨酸生成活性中有用的試劑的方法被提供。方法包括(a)將具有Ca-甲酰甘氨酸生成活性的分子與候選物質(zhì)相接觸,(b)測量該分子的Ca-甲酰甘氨酸生成活性,和(c)將測得的分子的Ca-甲酰甘氨酸生成活性與對照比較以確定是否候選物質(zhì)調(diào)節(jié)分子的Ca-曱酰甘氨酸生成活性,其中分子是本發(fā)明的FGE核酸分子或其表達產(chǎn)物。"接觸"指具有Ca-曱酰甘氨酸生成活性的分子與候選物質(zhì)的直接和間接的接觸。"間接"接觸表示候選物質(zhì)通過第三者試劑(例如信使分子,受體等)對分子的Ca-甲酰甘氨酸生成活性施加了其影響。在一定實施方案中,對照是在缺乏候選物質(zhì)時測得的分子Ca-甲酰甘氨酸生成活性。分析方法和候選物質(zhì)如前述有關(guān)FGE的實施方案中所述。根據(jù)本發(fā)明的另一方面,診斷以核酸分子、其表達產(chǎn)物或其表達產(chǎn)物片段的異常表達為特征的疾病的方法被提供。方法包括將從受試者中分離的生物樣本與專一結(jié)合到核酸分子、其表達產(chǎn)物或其表達產(chǎn)物片段的試劑接觸,并測定作為疾病判定依據(jù)的試劑和核酸分子或表達產(chǎn)物之間的相互作用,其中核酸分子是根據(jù)本發(fā)明的FGE分子。疾病是多種硫酸酯酶缺乏癥。導(dǎo)致FGE分子異常表達的FGE基因中的突變引起下面的SEQIDNO:2上的氨基酸改變MetlArg;MetlVal;Leu20Phe;Serl55Pro;Alal77Pro;Cys218Tyr;Arg224Trp;Asn259Ile;Pro266Leu;Ala279Val;Arg327Stop;Cys336Arg;Arg345Cys;Ala348Pro;Arg349Gln;Arg349Trp;Arg349Trp;Ser359Stop;或其組合。在分子是核酸分子的情形中,這類測定能通過任何標(biāo)準(zhǔn)的核酸測定分析進行,包括聚合酶鏈?zhǔn)椒磻?yīng)或在本文中作為例子的以標(biāo)記性雜交探針進行的分析。在分子是核酸分子表達產(chǎn)物或核酸分子表達產(chǎn)物片段的情形中,這類測定能通過應(yīng)用例如結(jié)合到任何多肽表達產(chǎn)物的抗體的任何標(biāo)準(zhǔn)的免疫分析而進行。"異常表達"指FGE分子(核酸和/或多肽)相對于對照(即,相同分子在健康或"正常"受試者中的表達)的減少的表達(表達不足)或增加的表達(過表達)。在本文中所用的"健康受試者",指根據(jù)標(biāo)準(zhǔn)的醫(yī)學(xué)標(biāo)準(zhǔn)沒有出現(xiàn)多種硫酸酯酶缺乏癥或具有發(fā)展多種硫酸酯酶缺乏癥的風(fēng)險的受試者。健康受試者也沒有另外顯現(xiàn)出病癥。換句話說,如果被醫(yī)學(xué)專業(yè)人員檢查,這類受試者將被表征為健康和不帶多種硫酸酯酶缺乏癥的癥狀。這些包括異常染性腦白質(zhì)營養(yǎng)不良和粘多糖病的特征,例如在幾種組織中的酸性粘多糖的量增加,輕微'脂肪軟骨營養(yǎng)不良,,快速神經(jīng)性衰退,尿中的腦硫脂和粘多糖的過量存在,增加的腦脊液蛋白和外周神經(jīng)中的髓磷脂的異染性退化。本發(fā)明也提供新的試劑盒,其將被用于測量本發(fā)明的核酸和本發(fā)明的表達產(chǎn)物的水平。在某一實施方案中,試劑盒包含包裝,該包裝包含下列物質(zhì)選擇性結(jié)合任何前述FGE的分離的核酸或其表達產(chǎn)物的試劑,及用于與所述試劑和任何前述FGE的分離的核酸或其表達產(chǎn)物結(jié)合的測得值進行比較的對照。在某些實施方案中,對照是用于與測得值比較的預(yù)先測定值。在一定實施方案中,對照包含任何前述FGE的分離的核酸的表達產(chǎn)物的表位。在某一實施方案中,試劑盒進一步包含選擇性結(jié)合選自下列的多肽的第二試劑艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6,或其肽段,和用于與所述第二試劑和所述多肽或其肽段的結(jié)合的測得值進行比較的對照。在核酸探測的情形中,用于擴增本發(fā)明的核酸分子的引物對可被包括進去。優(yōu)選的試劑盒將包括對照,例如已知量的核酸探針、表位(例如艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6,表達產(chǎn)物)或抗表位的抗體,以及指南或其它復(fù)印材料。在一定的實施方案中,復(fù)印材料能基于分析結(jié)果而表征發(fā)展硫酸酯酶缺乏狀態(tài)的風(fēng)險。試劑可按預(yù)先測定的量被包在容器中和/或被涂在小孔上,而試劑盒可包括標(biāo)準(zhǔn)物質(zhì),例如標(biāo)記好的免疫試劑(如標(biāo)記好的抗-IgG抗體)和類似物。一種試劑盒是包好的用FGE蛋白涂層的聚苯乙烯微量滴定平板和含有標(biāo)記好的抗人IgG抗體的容器。平板的小孔與例如生物液體接觸,清洗,然后與抗-IgG抗體接觸。之后探測標(biāo)記。體現(xiàn)本發(fā)明特征的試劑盒,通常以數(shù)字11指定,在圖25中顯示。試劑盒11包含下列主要元件包裝15,本發(fā)明的試劑17,對照試劑19和指南21。包裝15是用于盛含有本發(fā)明的試劑17的一個小瓶(或多個小瓶),含有對照試劑19的一個小瓶(或多個小瓶)和指南21的類似盒子的結(jié)構(gòu)。本領(lǐng)域技術(shù)人員可易于修飾包裝15以適合個體的需要。本發(fā)明也包含在受試者中治療多種硫酸酯酶缺乏癥的方法。方法包括對有這類治療需要的受試者施用調(diào)節(jié)Ca-甲酰甘氨酸生成活性的試劑,用量為在受試者中有效增加Ca-甲酰甘氨酸生成活性的量。在某些實施方案中,方法進一步包含一定試劑的共施用,所述試劑選自編碼下列蛋白的核酸分子艾杜糖醛酸-2-疏酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6;核酸分子的表達產(chǎn)物,和/或核酸分子的表達產(chǎn)物的片段。在本文中所用的"調(diào)節(jié)核酸或多肽的表達的試劑"在本領(lǐng)域中已知,指有義和反義核酸,顯性失活核酸,多肽的抗體和類似物。調(diào)節(jié)分子表達(和如本文中所述的,調(diào)節(jié)其活性)的任何試劑根據(jù)本發(fā)明有用。在一定實施方案中,調(diào)節(jié)Ca-曱酰甘氨酸生成活性的試劑是本發(fā)明的分離的核酸分子(例如SEQIDNO.3的核酸)。在重要的實施方案中,調(diào)節(jié)Ca-甲酰甘氨酸生成活性的試劑是本發(fā)明的肽(例如SEQIDN0.2的肽)。在某些實施方案中,調(diào)節(jié)Ca-曱酰甘氨酸生成活性的試劑是本發(fā)明的有義核酸。根據(jù)本發(fā)明的一個方面,在受試者中增加Ca-甲酰甘氨酸生成活性的方法被提供。方法包括對受試者施用本發(fā)明的分離的核酸分子和/或其表達產(chǎn)物,用量為在受試者中增加ca-甲酰甘氨酸生成活性的有效量。根據(jù)本發(fā)明的另一方面,增加細(xì)胞中的Ca-甲酰甘氨酸生成活性的方法被提供。方法包括將細(xì)胞與本發(fā)明的分離的核酸分子(例如SEQIDNO.1的核酸),或其表達產(chǎn)物(例如SEQIDNO.2的肽)接觸,用量為在細(xì)胞中有效增加Ca-曱酰甘氨酸生成活性的量。在重要的實施方案中,方法包括激活內(nèi)源性的FGE基因以增加細(xì)胞中的Ca-甲酰甘氨酸生成活性。在任何的前述實施方案中,核酸可被操作性地偶聯(lián)到指導(dǎo)真核細(xì)胞例如HT-1080細(xì)胞內(nèi)的核酸分子表達的基因表達序列。"基因表達序列"是任何調(diào)節(jié)性的核苷酸序列,例如啟動子序列或啟動子-增強子組合,其促進它所可操作性地連接的核酸的有效轉(zhuǎn)錄和翻譯?;虮磉_序列可以是,例如,哺乳動物或病毒的啟動子如組成型或可誘導(dǎo)型的啟動子。組成型的哺乳動物啟動子包括但不限于下列基因的啟動子次黃嘌呤磷酸核糖基轉(zhuǎn)移酶(HPTR),腺苷脫氨酶,丙酮酸激酶,a-肌動蛋白啟動子和其它組成型啟動子??勺鳛榉独脑谡婧思?xì)胞中組成性地發(fā)揮功能的病毒啟動子包括,例如,來自猿猴病毒,乳頭狀瘤病毒,腺病毒,人免疫缺陷病毒(HIV),勞斯肉瘤病毒,細(xì)胞巨化病毒,莫洛尼氏白血病毒的長末端重復(fù)序列(LTR)和其它逆轉(zhuǎn)錄病毒的啟動子,和單純皰滲病毒的胸苷激酶啟動子。其它組成型啟動子為本領(lǐng)域一般技術(shù)人員所知。作為本發(fā)明的基因表達序列而有用的啟動子也包括可誘導(dǎo)的啟動子。可誘導(dǎo)的啟動子在誘導(dǎo)劑存在時被活化。例如,金屬硫蛋白啟動子在一定的金屬離子存在時被激活而增加轉(zhuǎn)錄和翻譯。其它可誘導(dǎo)的啟動子為本領(lǐng)域一般技術(shù)人員所知。一般而言,基因表達序列將包括(如果必要)分別涉及轉(zhuǎn)錄和翻譯起始的5,非轉(zhuǎn)錄和5,非翻譯序列,例如TATA盒,加帽序列,CAAT序列和類似物。尤其是,這類5'非轉(zhuǎn)錄序列將包括啟動子區(qū)域,所述啟動子區(qū)域包括用于對可操作性連接的核酸進行轉(zhuǎn)錄控制的啟動子序列?;虮磉_序列可選性地包括所期望的增強子序列或上游激活子序列。優(yōu)選任何本發(fā)明的FGE核酸分子連接到允許核酸分子在特定細(xì)胞系的細(xì)胞如神經(jīng)細(xì)胞中表達的基因表達序列。允許核酸分子在細(xì)胞如神經(jīng)細(xì)胞中表達的序列,是在這類細(xì)胞類型中選擇性地有活性從而引起核酸分子在這些細(xì)胞中表達的類型。例如,突觸蛋白-1啟動子能被用于在神經(jīng)細(xì)胞中表達任何前述的本發(fā)明的核酸分子;而例如vonWillebrand因子基因啟動子能被用于在血管內(nèi)皮細(xì)胞中表達核酸分子。本領(lǐng)域中一般技術(shù)人員將能易于鑒別能在本發(fā)明的任何優(yōu)選細(xì)胞中表達核酸分子的替代性的啟動子。當(dāng)它們以將核酸編碼序列(例如,在FGE的情形中,SEQIDNO.3)的轉(zhuǎn)錄和/或翻譯置于基因表達序列的影響或控制下這樣的方式而被共價連接時,核酸序列和基因表達序列被表述為"可操作性地連接"。如果期望核酸序列被翻譯成為功能性蛋白,并且如果在5,基因表達序列中的啟動子的誘導(dǎo)導(dǎo)致核酸序列的轉(zhuǎn)錄,且如果在兩個DNA序列之間的連接的本性不會(1)導(dǎo)致移碼突變的引入,(2)干擾啟動子區(qū)域指導(dǎo)核酸序列轉(zhuǎn)錄的能力,和/或(3)干擾對應(yīng)的RNA轉(zhuǎn)錄產(chǎn)物翻譯成為蛋白質(zhì)的能力時,兩個DM序列被表述成可操作性地連接。因此,如果基因表達序列能影響核酸序列的轉(zhuǎn)錄以至于得到的轉(zhuǎn)錄產(chǎn)物可被翻譯成為所期望的蛋白質(zhì)或多肽,則基因表達序列將被認(rèn)為可操作性地連接到核酸序列。本發(fā)明的分子能單獨的或與載體(也見對于載體的更早的討論)一起被運送到本發(fā)明優(yōu)選細(xì)胞類型。按其最廣泛的含義(且與本文中其它部分對表達和靶向載體的描述一致),"載體"是能促進(1)分子到靶細(xì)胞的運送,和/或(2)分子被靶細(xì)胞的吸取,的任何載體。優(yōu)選運送載體以有所減少的降解運輸分子到靶細(xì)胞中,所述有所減少的降解相對于載體缺乏時所產(chǎn)生的降解的程度而言。可選地,"靶向配體"能被附著于載體以選擇性地將載體運送到其表面表達靶向配體的相關(guān)受體的細(xì)胞。以這種方式,載體(含有核酸或蛋白質(zhì))能被選擇性地運送到神經(jīng)細(xì)胞。耙向的方法包括綴合,例如那些在Priest的U.S.Patent5,391,723中所述的。另一眾所周知的靶向載體的實例是脂質(zhì)體。脂質(zhì)體從GibcoBRL可商業(yè)性地獲得。生產(chǎn)靶向脂質(zhì)體的多種方法被發(fā)表。一般而言,在本發(fā)明中有用的載體包括但不限于質(zhì)粒,噬菌粒,病毒,源于病毒或細(xì)菌來源的其它載體,所述其它載體已通過本發(fā)明核酸序列和能被附著到本發(fā)明的核酸序列的另外的核酸片段(例如增強子、啟動子)的插入或整合而被操作。病毒載體是載體的優(yōu)選類型,包括但不限于來自下列病毒的核酸序列腺病毒;腺伴隨病毒;逆轉(zhuǎn)錄病毒,例如鼠莫洛尼白血病毒;鼠哈維肉瘤病毒;鼠乳腺腫瘤病毒;勞斯肉瘤病毒;SV40-型病毒;多瘤病毒;EB病毒;乳頭狀瘤病毒;皰瘆病毒;牛痘病毒;脊髓灰質(zhì)炎病毒;和RM病毒例如逆轉(zhuǎn)錄病毒。也能容易地采用沒有指出但在本領(lǐng)域中已知的其它載體。對某些應(yīng)用特別優(yōu)選的病毒是腺伴隨病毒,一種雙鏈DNA病毒。腺伴隨病毒能感染廣泛的細(xì)胞類型和物種,且能被工程化為復(fù)制缺陷型。它進一步地具有優(yōu)點例如熱和脂溶劑穩(wěn)定性、在多種林系細(xì)胞包括造血細(xì)胞中的高轉(zhuǎn)導(dǎo)頻率,和缺乏超感染抑制因此而允許多重系列的轉(zhuǎn)導(dǎo)。經(jīng)報道,腺伴隨病毒能以位點特異的方式整合進人細(xì)胞DM,從而將插入性基因突變的可能性和插入基因的表達的可變性最小化。此外,野生型腺伴隨病毒感染已在組織培養(yǎng)物中于缺乏選擇壓力的條件下存在超過100代,意味著腺伴隨病毒基因組整合是相對穩(wěn)定的事件。腺伴隨病毒也能以染色體外方式發(fā)揮功能。一般而言,其它優(yōu)選的病毒載體基于非細(xì)胞病變性真核病毒,在這些病毒中非必需基因已被目的基因所替代。非細(xì)胞病變性病毒包括逆轉(zhuǎn)錄病毒,其生命周期包括基因組病毒RNA到DNA的逆轉(zhuǎn)錄及隨后的前病毒整合到宿主細(xì)胞DNA中。腺病毒和逆轉(zhuǎn)錄病毒已被許可用于人基因治療的試驗。一般而言,逆轉(zhuǎn)錄病毒是復(fù)制缺陷型(即,能指導(dǎo)所需蛋白的合成,但不能制造出感染性的顆粒)。這類基因改變的逆轉(zhuǎn)錄病毒表達載體具有對基因在體內(nèi)的高效轉(zhuǎn)導(dǎo)的一般性用途。產(chǎn)生復(fù)制缺陷型逆轉(zhuǎn)錄病毒的標(biāo)準(zhǔn)流程(包括步驟外源性遺傳物質(zhì)整合進質(zhì)粒,質(zhì)粒對包裝細(xì)胞系的轉(zhuǎn)染,重組性逆轉(zhuǎn)錄病毒通過包裝細(xì)胞系的產(chǎn)生,從組織培養(yǎng)基中收集病毒顆粒和病毒顆粒對靶細(xì)胞的感染)在Kriegler,M.,"GeneTransferandExpression,ALaboratoryManual,"W.H.FreemanC.0.,NewYork(1990)和Murry,E.J.Ed."MethodsinMolecularBiology,"巻7,HumanaPressInc.,Cliffton,NewJersey(1991)中被提供。另一優(yōu)選的逆轉(zhuǎn)錄病毒載體是源自鼠莫洛尼白血病毒的載體,如在Nabel,E.G.等,5We縱,1990,249:1285-1288中所述的。這些載體據(jù)報道對基因運送到動脈壁的所有三層(包括中間層)都有效。其它優(yōu)選載體在Flugelman等,C7rcw/a〃o/2,1992,85:1110-1117中公開。另外的對運送本發(fā)明的分子有用的載體在U.S.PatentNo.5,674,722中被Mulligan等描述。除前述載體外,其它傳送方法可被用于傳送本發(fā)明的分子到細(xì)胞例如神經(jīng)細(xì)胞,肝,成纖維細(xì)胞,和/或血管內(nèi)皮細(xì)胞,并促進在那里的吸收。本發(fā)明的優(yōu)選的這類運送方法是膠態(tài)分散體系統(tǒng)。膠態(tài)分散體系銃包括基于脂質(zhì)的系統(tǒng),包括水包油乳液,微嚢,混合微嚢,和脂質(zhì)體。本發(fā)明優(yōu)選的膠態(tài)系統(tǒng)是脂質(zhì)體。脂質(zhì)體是人造膜容器,其作為體內(nèi)或體外的運送載體而有用。已有顯示,大小范圍在0.2-4.0|iim的單層容器(LUV)能包裹進大的大分子。RNA,DNA和完整病毒粒子能被封裝在含水內(nèi)部,并以生物活性形式運送到細(xì)胞中(Fraley等,7>e/7&A/oc力e瓜,1981,6:77)。為了脂質(zhì)體是有效的基因轉(zhuǎn)運載體,一種或更多的下列特征應(yīng)具備(1)目的基因高效被封裝,而保持生活活性;(2)相對于非靶細(xì)胞的與靶細(xì)胞的優(yōu)選和牢固的結(jié)合;(3)嚢泡的水內(nèi)容物到靶細(xì)胞細(xì)胞質(zhì)的高效運送;和(4)遺傳信息的準(zhǔn)確和有效表達。脂質(zhì)體可通過脂質(zhì)體到特異配體例如單克隆抗體,糖,糖脂,或蛋白質(zhì)的偶聯(lián),而靶向于特定組織,例如心肌或血管細(xì)胞壁??蓪Π邢蛑|(zhì)體于血管壁有用的配體包括但不限于,仙臺病毒的病毒衣殼蛋白。此外,載體可偶聯(lián)到核靶向性肽上,其將定向核酸到宿主細(xì)胞核。脂質(zhì)體可從GibcoBRL商業(yè)性地獲得,例如由陽離子脂質(zhì)如N-[l-(2,3雙油氧基)-丙基]-N,N,N-三甲基氯化銨(DOTMA)和二甲基雙十八烷基溴化銨(DDAB)形成的LIPOFECTINTm和LIP0FECTACE。生產(chǎn)脂質(zhì)體的方法在本領(lǐng)域中眾所周知,也在許多出版物中被描述。脂質(zhì)體也已,皮Gregoriadis,G.在rre/7ds//3"/otecAi3o/o^7,巻3,235-241頁(1985)中所回顧。用于大分子包括核酸的細(xì)胞內(nèi)運送的新的脂質(zhì)體也在PCT國際申請PCT/US96/07572(公開號W096/40060,名稱為"IntracellularDeliveryofMacromolecules")中被描述。在一個特定的實施方案中,優(yōu)選的載體是適合植入哺乳動物受體的生物相容性的微顆粒或植入物。作為范例的根據(jù)此方法而有用的生物侵蝕性植入物在PCT國際申請PCT/US/03307(公開號WO95/24929,名稱為"PolymericGeneDeliverySystem",其要求1994年3月15日提交的美國專利申請系列號213,668的優(yōu)先權(quán))中被描述。PCT/US/0307描述了用于包含(受適當(dāng)?shù)膯幼诱{(diào)控的)外源性基因的生物相容性的聚合性基質(zhì),優(yōu)選生物降解性的聚合性基質(zhì)。聚合性基質(zhì)被用于實現(xiàn)外源性基因在患者中的持續(xù)性釋放。根據(jù)本發(fā)明,在此所述的核酸在PCT/US/03307中所公開的生物相容性優(yōu)選生物降解性的聚合性基質(zhì)中被封裝或分散。聚合性基質(zhì)優(yōu)選微顆粒形式例如微球體(其中核酸被分散到整個固體聚合性基質(zhì)中)或微嚢(其中核酸被儲存在聚合性殼的核心中)。包含本發(fā)明的核酸的聚合性基質(zhì)的其它形式包括膜,涂層,膠,植入物和支架。聚合性基質(zhì)裝置的大小和組成被選作引起基質(zhì)裝置被植入的組織中的良好的釋放動力學(xué)。進一步設(shè)計的聚合性基質(zhì)的大小根據(jù)將被應(yīng)用的運送方法而選擇,所述運送方法典型地是組織注射或懸浮液通過霧化施用到鼻部和/或肺部區(qū)域。聚合性基質(zhì)組合物能被選成同時具有良好的降解速率,及由生物粘附性物質(zhì)形成,以在設(shè)計物被施用到血管表面時進一步增加轉(zhuǎn)運的有效性?;|(zhì)組合物也能被選成不降解,但更適合通過持續(xù)相當(dāng)一段時間的擴散而釋放。非生物降解性和生物降解性的聚合性基質(zhì)都能被用作將本發(fā)明的核酸運送到受試者。優(yōu)選生物降解性基質(zhì)。這類聚合物可以是自然或合成性的聚合物。優(yōu)選合成性聚合物。根據(jù)釋放所需要的時間長度而選擇聚合物,一般是幾個小時到一年或更長時間的級別。典型地,范圍從幾個小時到三至十二個月的時間長度的釋放最合意。聚合物可選性地是能吸收高到其重量的約90%的水的水凝膠的形式,而進一步地,可選性地與多價離子或其它聚合物交聯(lián)。一般而言,本發(fā)明的核酸應(yīng)用生物侵蝕性植入物以擴散方式而被運送,或更優(yōu)選地,通過聚合性基質(zhì)的降解。作為范例的能被用于形成生物降解性運送系統(tǒng)的合成性聚合物包括聚酰胺,聚碳酸酯,聚亞烷基,聚亞烷基二醇,聚環(huán)氧烷,聚亞烷基對苯二酸酯,聚乙烯醇,聚乙烯醚,聚乙烯酯,聚-乙烯卣化物,聚乙烯吡咯烷酮,聚乙交酯,聚硅氧烷,聚氨基甲酸乙酯和其共聚物,烷基纖維素,羥基烷基纖維素,纖維素醚,纖維素酯,硝基纖維素,丙烯酸酯和甲基丙烯酸酯的聚合物,甲基纖維素,乙基纖維素,羥丙基纖維素,羥丙基甲基纖維素,羥丁基甲基纖維素,醋酸纖維素,丙酸纖維素,纖維素醋酸丁酸酯,纖維素醋酸鄰苯二甲酸酯,羧乙基纖維素,三醋酸纖維素,纖維素硫酸鈉鹽,聚(甲基異丁烯酸酯),聚(乙基異丁烯酸酯),聚(丁基異丁烯酸酯),聚(異丁基異丁烯酸酯),聚(己基異丁烯酸酯),聚(異癸基異丁烯酸酯),聚(十二烷基異丁烯酸酯),聚(苯基異丁烯酸酯),聚(曱基丙烯酸酯),聚(異丙基丙烯酸酯),聚(異丁基丙烯酸酯),聚(十八烷基丙烯酸酯),聚乙烯,聚丙烯,聚(乙二醇),聚(環(huán)氧乙烷),聚(對苯二甲酸乙二酯),聚(乙烯醇),聚乙烯醋酸,聚氯乙烯,聚苯乙烯和聚乙烯吡咯烷酮.非生物降解性聚合物的實例包括亞乙基乙烯醋酸,聚(曱)丙烯酸,聚酰胺,其共聚物和混合物。生物降解性聚合物的實例包括合成性聚合物例如乳酸和乙二酸的聚合物,聚酸酐,聚(原)酸酯,聚氨基甲酸乙酯,聚(丁酸),聚(戊酸),聚(丙交酯-共己內(nèi)酯),天然聚合物例如藻酸和其它多糖包括葡聚糖和纖維素,膠原,其化學(xué)衍生物(化學(xué)基團例如,烷基,亞烷基,羥化,氧化的取代和增加,和其它由本領(lǐng)域技術(shù)人員常規(guī)進行的修飾),白蛋白和其它親水蛋白質(zhì),玉米醇溶蛋白和其它醇溶谷蛋白及疏水蛋白質(zhì),其共聚物和混合物。一般而言,這些物質(zhì)或者通過酶水解或者在體內(nèi)暴露于水時通過表面或整體侵蝕而降解。特別受關(guān)注的生物粘附性聚合物包括H.S.Sawhney,C.P.Pathak和J.A.Hubell在Macromolecules,1993,26,581-587中所述的生物侵蝕性水凝膠,其教導(dǎo)在此被整合,聚透明質(zhì)酸,酪蛋白,明膠,谷膠酪蛋白,聚酸酐,聚丙烯酸,藻酸,脫乙酰殼多糖,聚(甲基異丁烯酸酯),聚(乙基異丁烯酸酯),聚(丁基異丁烯酸酯),聚(異丁基異丁烯酸酯),聚(己基異丁烯酸酯),聚(異癸基異丁烯酸酯),聚(十二烷基異丁烯酸酯),聚(苯基異丁烯酸酯),聚(甲基丙烯酸酯),聚(異丙基丙烯酸酯),聚(異丁基丙烯酸酯),和聚(十八烷基丙烯酸酯)。因此,本發(fā)明提供用作藥物的本發(fā)明的上述分子的組合物,制備此藥物的方法和在體內(nèi)用于持續(xù)釋放藥物的方法。壓縮試劑也能與本發(fā)明的載體結(jié)合應(yīng)用。在本文中所用的"壓縮試劑"指試劑例如組蛋白,它中和核酸上的負(fù)電荷從而允許核酸壓縮成細(xì)顆粒。核酸的壓縮促進了核酸被耙細(xì)胞的吸收。壓縮試劑能單獨使用,即以被細(xì)胞更有效地吸收的形式運送分離的本發(fā)明的核酸或,更優(yōu)選地,與一種或更多上述載體組合。合物包括磷酸鉀及細(xì)胞內(nèi)運輸、微注射組合物和電穿孔的其它化學(xué)調(diào)節(jié)物0本發(fā)明包含在細(xì)胞中增加硫酸酯酶活性的方法。這類方法包括以有效地在細(xì)胞中增加硫酸酯酶活性的量將分離的本發(fā)明的核酸分子(例如如權(quán)利要求1-8中任一項所要求的分離的核酸分子,具有選自SEQIDNO:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的FGE核酸分子)或其表達產(chǎn)物(例如如權(quán)利要求11-15,19,20中所要求的多肽或具有選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽)與表達硫酸酯酶的細(xì)胞接觸。在本文中所用的"增加,,硫酸酯酶活性,指增加的對硫酸酯酶的特異性底物的親合性和/或?qū)ζ涞霓D(zhuǎn)化,典型地導(dǎo)致硫酸酯酶分子上的尸67y的形成的增加。在某一實施方案中,細(xì)胞以比野生型細(xì)胞更高的水平表達硫酸酯酶。"在細(xì)胞中增加硫酸酯酶活性"也指增加細(xì)胞所分泌的硫酸酯酶的活性。細(xì)胞可表達內(nèi)源性和/或外源性的硫酸酯酶。與FGE分子的所述接觸也指激活細(xì)胞的內(nèi)源性FGE基因。在重要的實施方案中,內(nèi)源性硫酸酯酶被活化。在一定實施方案中,硫酸酯酶是艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-1,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和/或HSulf-6。在一定的實施方案中,細(xì)胞是哺乳動物細(xì)胞。根據(jù)本方面的另一方面,藥物組合物被提供。組合物以藥學(xué)上有效治療硫酸酯酶缺乏癥的量包含細(xì)胞產(chǎn)生的疏酸酯酶,也包含藥學(xué)上可接受的載體,其中所述細(xì)胞已與包含分離的本發(fā)明的核酸分子(例如如權(quán)利要求l-8所要求的分離的核酸分子或具有選自SEQIDN0:1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸分子)或其表達產(chǎn)物(例如選自SEQIDNO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的肽)的試劑接觸。在重要的實施方案中,硫酸酯酶以高于正常/對照細(xì)胞的水平表達。本發(fā)明也包含產(chǎn)生硫酸酯酶的細(xì)胞,其中細(xì)胞所產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率增加。細(xì)胞包含(i)相對于對照具有增加的活性的硫酸酯酶,和(ii)相對于對照具有增加的活性的甲酰甘氨酸生成酶,其中相對于甲酰甘氨酸生成酶缺乏的細(xì)胞所產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率,細(xì)胞所產(chǎn)生的活性疏酸酯酶對總硫酸酯酶的比率增加至少5%。在本領(lǐng)域中已知,硫酸酯酶的過表達能減少內(nèi)源性硫酸酯酶的活性(Anson等,"/oc力e瓜/.,1993,294:657-662)。此外,僅有重組硫酸酯酶的一部分有活性。出乎意料地,我們發(fā)現(xiàn)在具有硫酸酯酶的增加的表達/活性的細(xì)胞中,F(xiàn)GE增加的表達/活性導(dǎo)致更有活性的硫酸酯酶的產(chǎn)生。既然,67/在硫酸酯酶分子上的存在與硫酸酯酶活性相關(guān),則"有活性的硫酸酯酶"就能通過應(yīng)用MALDI-T0F質(zhì)i脊(如本文中其它部分所描述的)對在硫酸酯酶細(xì)胞產(chǎn)物上的存在的測定而定量。然后對總硫酸酯酶的比率能很容易測定。本發(fā)明也提供用于硫酸酯酶缺乏癥的診斷和治療的方法。這類疾病包括但不限于,多種硫酸酯酶缺乏癥,粘多糖病II(MPSII;Hunter綜合癥),粘多糖病IIIA(MPSIIIA;Sanfi1ippo綜合癥A),粘多糖病VIII(MPSVIII),粘多糖病IVA(MPSIVA;Morquio綜合癥A),粘多糖病VI(MPSVI;Maroteaux-Lamy綜合癥),異常染性腦白質(zhì)營養(yǎng)不良(MLD),X-連鎖的隱性點狀軟骨發(fā)育不全1,和X-連鎖的魚鱗病(類固醇硫酸酯酶缺乏癥)。本發(fā)明的方法在對任何前述病癥的急性或預(yù)防性治療中都有用。在此所用的急性治療指對具有特定病癥的受試者的治療。預(yù)防性治療指對可能具有此病癥但現(xiàn)在并沒有或并未經(jīng)歷此病癥的癥狀的受試者的治療。就其最廣泛的意義而言,術(shù)語"治療"表示急性和預(yù)防性治療兩者。如果需要治療的受試者正經(jīng)歷病癥(或具有或正具有特定病癥),那么治療病癥指改善、減弱或消除病癥或來自病癥的一種或更多的癥狀。在某些優(yōu)選的實施方案中,治療此病癥指改善、減弱或消除與病癥相關(guān)的特異的癥狀或特異亞型的癥狀。如果需要治療的受試者是可能具有此病癥的受試者,那么對受試者治療指減小受試者產(chǎn)生此病癥的風(fēng)險。本發(fā)明的治療劑的施用模式和劑量將隨著被治療的病癥的特定階段、被治療的受試者的年齡和生理狀態(tài)、同時進行的治療(如果有)的本性、施用的特定途徑和在醫(yī)學(xué)實踐者的知識和專業(yè)技術(shù)范圍內(nèi)的類似因素而變化。如本文中所述的,本發(fā)明的試劑以治療任何前述硫酸酯酶缺乏癥的有效量而被施用。一般而言,有效量是能引起受試者的所期望的組織中的有益變化的任何量。有效量優(yōu)選在特定病癥中足以引起良好表型變化例如癥狀或病癥的整體性減輕、緩和或消除的量。一般而言,有效量是藥學(xué)制劑單獨或與進一步的藥劑一起產(chǎn)生出所期望的反應(yīng)那樣的量。這可包括只短暫減慢病癥的進程,雖然更優(yōu)選它包括長期性地阻止病癥進程,或延緩病癥的發(fā)作,或防止病癥發(fā)生。這可通過常規(guī)方法監(jiān)測。一般地,活性化合物的劑量將從約0.01mg/kg每天到1000mg/kg每天。期望范圍在50pg-500mg/kg的劑量將是適合,優(yōu)選口服和每天施用一次或幾次。當(dāng)然,這類量將取決于被治療的特定病癥,病癥的嚴(yán)重程度,患者個體的參數(shù)包括年齡、生理狀況、身材尺寸和體重,治療的持續(xù)時間,同時進行的治療(如果有)的本性,施用的特異途徑和在醫(yī)學(xué)實踐者的知識和專業(yè)技術(shù)范圍內(nèi)的類似因素。低劑量將源自施用的一定形式,例如靜脈內(nèi)施用。在應(yīng)用初始劑量時受試者中的反應(yīng)不充分的情形中,更高的劑量(或通過不同的更局部化的運送途徑的有效更高劑量)可應(yīng)用到患者耐受力所允許的程度。每天多重劑量被預(yù)期能實現(xiàn)化合物的合適的系統(tǒng)水平。一般地,優(yōu)選應(yīng)用最大劑量,也就是,根據(jù)合理的醫(yī)學(xué)判斷的最高安全劑量。然而將被本領(lǐng)域中一般技術(shù)人員所理解的是,患者可出于醫(yī)學(xué)原因、心理原因或事實上的其它任何原因而堅持較低劑量或可耐受性劑量。本發(fā)明的試劑可選性地與藥學(xué)上可接受的載體組合以形成藥學(xué)制劑。在本文中所用的術(shù)語"藥學(xué)上可接受的載體,,表示適合對人施用的一種或更多相容性的固體或液體填充物、稀釋劑或封裝物質(zhì)。術(shù)語"栽體,,表示天然或合成性的有機或無機成分,活性成分與其組合以促進應(yīng)用。藥學(xué)組合物的成分也能被與本發(fā)明的分子共混合,及彼此混合,其方式是確保沒有實質(zhì)性破壞所期望的藥學(xué)效力的相互作用存在。在某些方面,藥學(xué)制劑以有效治療疾病的量包含本發(fā)明的試劑。藥學(xué)制劑可包含合適的緩沖劑,包括鹽形式的醋酸、鹽形式的檸檬酸、鹽形式的硼酸或鹽形式的磷酸。藥學(xué)組合物可選性地,也可包含合適的防腐劑例如苯扎氯;氯代丁醇;對羥基苯甲酸酯或乙基汞石;M、水楊酸鈉(thimerosal)。多種施藥途徑可用。當(dāng)然,選出的特定模式將取決于選定的特定藥物,被治療的病癥的嚴(yán)重程度和治療效力所需的劑量。本發(fā)明的方法,一般而言,可應(yīng)用醫(yī)學(xué)上可接受的任何施用模式,即產(chǎn)生活性化合物的有效水平而不引起臨床上無法接受的不利效應(yīng)的有意義的任何模式而實行。施用的這類模式包括口服,直腸,局部,鼻,皮內(nèi),經(jīng)皮,或非腸道途徑。術(shù)語"非腸道的"包括皮下,靜脈內(nèi),intraomental,肌肉內(nèi),或輸注。靜脈內(nèi)或肌肉內(nèi)途徑不是特別適合長期性治療和預(yù)防。作為實例,用于對具有偏頭痛的受試者的急性治療的藥學(xué)組合物可配制成多種不同的方式和多種施用模式,包括片劑,膠嚢,粉末,栓劑,注射液和鼻噴霧劑。藥學(xué)制劑可方便地以單位劑型存在,也可通過任何制藥領(lǐng)域中眾所周知的方法制備。所有方法包括將活性試劑與載體相連的步驟,所述載體組成了一種或更多附屬成分。一般而言,組合物通過統(tǒng)一地和密切地將活性化合物與液體載體、很好地分隔的固體載體或同時二者相連而制備,然后如果需要,將產(chǎn)物定形。適合口服施用的組合物可作為離散性單位存在,例如膠嚢,片劑,錠劑,每一個都包含預(yù)定量的活性化合物。其它組合物包括水性或非水性的懸浮液例如糖漿,酏劑或乳劑。適合非腸道施用的組合物方便地包含消毒過的本發(fā)明試劑的水制劑,其優(yōu)選與接受者的血液等滲。此水制劑可根據(jù)已知方法應(yīng)用合適的分散或潤濕劑和懸浮試劑進行配制。無菌的可注射性制劑也可是非毒性的注射用可接受的稀釋劑或溶劑中的無菌的注射溶液或懸浮液,例如在1,3-丁二醇中的溶液。可接受的可用載體和溶劑有水、Ringer's溶液和等滲氯化鈉溶液。此外,無菌的固定油傳統(tǒng)上被用作溶劑或懸浮介質(zhì)。為了這一目的,任何溫和的固定油可被應(yīng)用,包括合成性的甘油單酯或雙酯。此外,脂肪酸例如油酸可在可注射的制劑中應(yīng)用。適合口服,皮下,靜脈內(nèi),肌肉內(nèi)等施用的配方能在Remington'sPharmaceuticalSciences,MackPublishingCo.,Eastern,PA中找到。根據(jù)本發(fā)明的一個發(fā)明,用于在細(xì)胞中增加Ca-曱酰甘氨酸生成活性的方法被提供。方法包括將分離的本發(fā)明的核酸分子(例如SEQIDNO.1的核酸)或其表達產(chǎn)物(例如SEQIDNO.2的肽)以在細(xì)胞中增加Ca-甲酰甘氨酸生成活性的有效量與細(xì)胞接觸。在重要的實施方案中,方法包括激活內(nèi)源性FGE基因以在細(xì)胞中增加CoT甲酰甘氨酸生成活性。在某些實施方案中,接觸在允許本發(fā)明的分子進入細(xì)胞的條件下進行。根據(jù)本發(fā)明的術(shù)語"允許分子進入,,細(xì)胞具有下面基于分子本性的含義。對分離的核酸,它用于描述核酸通過細(xì)胞膜而進入細(xì)胞核,在其基礎(chǔ)上"核酸轉(zhuǎn)基因"能利用細(xì)胞機制產(chǎn)生核酸所編碼的功能多肽。"核酸轉(zhuǎn)基因"用于描述所有的有或沒有相連載體的本發(fā)明的核酸。對于多肽,它用于描述多肽通過細(xì)胞膜進入細(xì)胞質(zhì),及如果需要,對細(xì)胞的細(xì)胞質(zhì)機制的利用以功能性地修飾多肽(例如修飾成活性形式)。多種技術(shù)可被用于將本發(fā)明的核酸引入細(xì)胞,其依賴于核酸是在體外還是體內(nèi)而被引入宿主。這類技術(shù)包括核酸-CaP04沉淀的轉(zhuǎn)染,與DEAE相連的核酸的轉(zhuǎn)染,包括目的核酸的逆轉(zhuǎn)錄病毒的轉(zhuǎn)染,脂質(zhì)體介導(dǎo)的轉(zhuǎn)染和類似方法。對于一定的應(yīng)用,優(yōu)選將核酸靶向于特定細(xì)胞。在這類例子中,用于將本發(fā)明的核酸運送進細(xì)胞的載體(例如逆轉(zhuǎn)錄病毒或其它病毒;脂質(zhì)體)可以具有附著于其上的靶向分子。例如,分子例如對靶細(xì)胞上的表面膜蛋白專一的抗體或靶細(xì)胞上的受體的配體能被固定到核酸運送載體上或整合在其中。例如,脂質(zhì)體被用于運送本發(fā)明的核酸的情形中,結(jié)合到與內(nèi)吞作用相關(guān)的表面膜蛋白的蛋白質(zhì)可被整合進用于靶向和/或促進吸收的脂質(zhì)體的配劑。這類蛋白質(zhì)包括對特定細(xì)胞類型有親和力的衣殼蛋白或其片段,針對循環(huán)中經(jīng)歷內(nèi)化的蛋白質(zhì)的抗體,靶向細(xì)胞內(nèi)定位和增強細(xì)胞內(nèi)半衰期的蛋白質(zhì),和類似物。聚合性運送系統(tǒng)也已被成功用于運送核酸進入細(xì)胞,如本領(lǐng)域技術(shù)人員所已知的。這類系統(tǒng)甚至允許核酸的口服運送。其它運送系統(tǒng)能包括定時釋放性、延遲釋放性或持續(xù)釋放性運送系統(tǒng)。這類系統(tǒng)能避免本發(fā)明的試劑的重復(fù)施用,增加對受試者和醫(yī)生的方便性。多種類型的釋放運送系統(tǒng)可用,且為本領(lǐng)域一般技術(shù)人員所已知。它們包括以聚合物為基礎(chǔ)的系統(tǒng)例如聚(丙交酯-乙交酯),共聚草酸,聚己內(nèi)酯,聚酯酰胺,聚原酸酯,聚羥基丁酸和聚酸酐。包含藥物的前述聚合物的微嚢在例如U.S.Patent5,075,109中被描述。運送系統(tǒng)也包括非聚合物系統(tǒng)脂類,包括固醇例如膽固醇,膽固醇酯和脂肪酸或中性脂肪例如單-二-和三-甘油酯;水凝膠釋放系統(tǒng);sylastic系統(tǒng);以肽為基礎(chǔ)的系統(tǒng);蠟涂層;應(yīng)用傳統(tǒng)粘合劑和賦形劑的壓制成的藥片;部分融合的植入物;和類似物。具體的實例包括但不限于(a)本發(fā)明的試劑以某一形式被包含在基質(zhì)內(nèi)的侵蝕性系統(tǒng)例如U.S.PatentNos.4,452,775,4,675,189和5,736,152中所描述的那些類型,和(b)活性成分以受控的速率從聚合物中滲出的擴散系統(tǒng)例如U.S.PatentNos.3,854,480,5,133,974和5,407,686中所述的。此外,以泵為基礎(chǔ)的硬件運送系統(tǒng)能被應(yīng)用,其中部分適于植入。長期持續(xù)釋放性植入物的應(yīng)用可以是合乎期望。在本文中所用的長期釋放,表示植入物被構(gòu)建和計劃成至少30天運送治療水平的活性成分,優(yōu)選60天。長期持續(xù)釋放性植入物是本領(lǐng)域中一般技術(shù)人員眾所周知的,包括部分上述的釋放系統(tǒng)。具體的實例包括但不限于,在U.S.PatentNo.4,748,024和加拿大No.1330939中所述的長期持續(xù)釋放性植入物。本發(fā)明也包括本發(fā)明的FGE分子之外的試劑的施用,和在某些實施方案中的共施用,所述試劑當(dāng)以有效劑量施用時可與本發(fā)明的分子合作性地、加成性地或協(xié)同性地起作用,以(i)調(diào)節(jié)Ca-甲酰甘氨酸生成活性,和(ii)治療涉及本發(fā)明分子的Ca-甲酰甘氨酸生成活性的任何病癥(例如硫酸酯酶缺乏癥包括多種硫酸酯酶缺乏癥)。本發(fā)明的分子之外的試劑包括艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2HSulf-3,HSulf-4,HSulf-5,或HSulf-6,(核酸和多肽,和/或其片段),和/或其組合。在本文中所用的"共施用"指同時施用兩種或更多的本發(fā)明的化合物(例如已知在對例如硫酸酯酶缺乏癥的治療中有益的FGE核酸和/或多肽和試劑,——例如治療MPSII中的艾杜糖醛酸-2-硫酸酯酶),其作為單一組合物中的混合物,或以足夠的時間間隔順序施用以至于化合物可發(fā)揮出相加性或甚至協(xié)同性的效力。本發(fā)明也包含固相核酸分子陣列,陣列基本上由固定于固體基質(zhì)的一套核酸分子、其表達產(chǎn)物或其(或者核酸或者多肽分子的)片段組成,每一核酸分子選自FGE,艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6。在某些實施方案中,固相陣列進一步包含至少一種對照核酸分子。在一定實施方案中,這套核酸分子包含至少一種,至少兩種,至少三種,至少四種或甚至至少五種核酸分子,每一種選自FGE,艾杜糖趁酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6。在優(yōu)選的實施方案中,這套核酸分子包含最多IOO種不同核酸分子。在重要的實施方案中,這套核酸分子包含最多IO種不同核酸分子。根據(jù)此發(fā)明,標(biāo)準(zhǔn)的微陣列技術(shù)的雜交技術(shù)被用于評估核酸表達的模式和鑒別核酸表達。微陣列技術(shù),其也稱為其它名字,包括DNA芯片技術(shù),基因芯片技術(shù)和固相核酸陣列技術(shù),為本領(lǐng)域一般技術(shù)人員已知,并基于但不限于,獲得在固定的基質(zhì)上的已鑒別出的核酸探針的陣列(例如在本文中其它部分所述如FGE,艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-l,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和/或HSulf-6的分子),以報告分子(例如放射性的,化學(xué)發(fā)光的,或熒光性的標(biāo)記例如熒光素,Cye3-dUTP或Cye5-dUTP)標(biāo)記靶分子,將把核酸與探針雜交,和評估靶-探針的雜交。一般而言,具有與把序列完全匹配的核酸序列的探針,將比不完全匹配的探針檢測到更強的報告分子信號。在核酸微陣列技術(shù)中應(yīng)用的多種成分和技術(shù)在r力e(7力2尸oreca",NatureGenetics,巻21,Jan1999中呈現(xiàn),其全部內(nèi)容在本文中被整合作為參考。根據(jù)本發(fā)明,微陣列基質(zhì)可包括但不限于玻璃,硅土,鋁硅酸鹽,硼硅酸鹽,金屬氧化物例如氧化鋁和氧化鎳,多種粘土,硝基纖維素或尼龍。在所有實施方案中,優(yōu)選玻璃基質(zhì)。根據(jù)本發(fā)明,探針選自核酸,其包括但不限于DNA,基因組DNA,cDNA和寡核苷酸;且可以是天然的或合成的。寡核苷酸探針優(yōu)選20到25聚體寡核苷酸,而DNA/cDNA探針優(yōu)選長度為500到5000個堿基,雖然其它長度也可被應(yīng)用。合適的探針長度可被本領(lǐng)域一般技術(shù)人員通過本領(lǐng)域內(nèi)已知的程序而測定。在某一實施方案中,優(yōu)選的探針是以SEQIDN0s:1,3,4,6,8,10,和/或12給出的核酸分子中的兩種或更多的組合。探針可應(yīng)用本領(lǐng)域一般技術(shù)人員已知的標(biāo)準(zhǔn)方法例如凝膠過濾或沉淀純化,以除去污染物。在某一實施方案中,微陣列基質(zhì)可用化合物涂層以增強探針在基質(zhì)上的合成。這類化合物包括但不限于,寡聚乙二醇。在另一實施方案中,基質(zhì)上的偶聯(lián)試劑或基團能被用于共價連接第一核苷酸或寡核苷酸到基質(zhì)。這些試劑或基團可包括但不限于氨基,羥基,溴基和羧基。這些活性基團優(yōu)選通過烴基例如亞烷基或亞苯基二價基團附著于基質(zhì),一個化合價位置被鏈連接占據(jù)而余下的一個附著到活性基團。這些烴基基團可包含多至約IO個碳原子,優(yōu)選多至約6個碳原子。亞烷基通常優(yōu)選在主鏈中包含2到4個碳原子。本方法的這些和另外的細(xì)節(jié)在例如U.S.Patent4,458,066中被y〉開,其全部內(nèi)容被整合作為參考。在某一實施方案中,應(yīng)用方法例如光導(dǎo)向的化學(xué)合成、光化學(xué)去保護或核苷酸前體到基質(zhì)的運送及隨后的探針產(chǎn)生,探針以預(yù)先確定的柵格模式直接在基質(zhì)上被合成。在另一實施方案中,基質(zhì)可用化合物涂層以增強探針與基質(zhì)的結(jié)合。這類化合物包括但不限于聚賴氨酸,氨基硅烷,氨基-反應(yīng)性珪烷(ChippingForecast,1999)或鉻(Gwynne和Page,2000)。在此實施方案中,預(yù)合成的探針以精確的、預(yù)先確定體積的和柵格的模式被應(yīng)用于基質(zhì),利用了計算機控制的機器人將探針以接觸打印方式或非接觸方式例如噴墨或壓電運送而應(yīng)用于基質(zhì)。以包括但不限于uv照射的方法,探針可共價連接到基質(zhì)。在另一實施方案中,探針熱連接到基質(zhì)。靶標(biāo)是選自包括但不限于下列的核酸DM,基因組DNA,cDNA,RM,mRNA,且可以是天然的或合成性的。在所有實施方案中,優(yōu)選來自被懷疑為發(fā)展或具有疏酸酯酶缺乏癥的受試者的核酸分子。在本發(fā)明的一定的實施方案中,一種或更多對照核酸分子被附著于基質(zhì)。優(yōu)選地,對照核酸分子允許了對包括但不限于下列的因素的測定核酸質(zhì)量和結(jié)合特征;試劑質(zhì)量和有效性;雜交成功性;和分析閾值和成功性。對照核酸可包括但不限于,基因如管家基因的表達產(chǎn)物或其片段。為選擇一套硫酸酯酶缺乏疾病的標(biāo)記物,優(yōu)選分析由例如基因表達的微陣列分析產(chǎn)生的表達數(shù)據(jù),以確定在不同患者類別(每一患者類別是一種不同的硫酸酯酶缺乏疾病)中的哪個基因是顯著差異性地表達?;虮磉_的顯著性可應(yīng)用Permax計算機軟件被測定,雖然任何能區(qū)分表達的顯著差異的標(biāo)準(zhǔn)統(tǒng)計包也可被使用。Permax實現(xiàn)了對數(shù)據(jù)的大規(guī)模陣列的排列雙樣本t-檢驗。對于觀察中的高維度載體,Permax軟件計算了對每一屬性的t-統(tǒng)計,并應(yīng)用全部屬性的最大值與最小值的排列分布評估了顯著性。主要應(yīng)用是確定兩組之間差異最大的屬性(基因)(例如對照的健康受試者和具有特定硫酸酯酶缺乏癥的受試者),應(yīng)用t-統(tǒng)計的值測量"最大差異"和它們的顯著性水平。硫酸酯酶缺乏疾病相關(guān)性核酸分子的表達也能應(yīng)用蛋白測量方法測定,以測定SEQIDN0s:2的表達,例如通過測定SEQIDN0s:1和/或3編碼的多肽的表達。特異和定量測量蛋白質(zhì)的優(yōu)選方法包括但不限于基于質(zhì)譜的方法例如表面增強的激光解吸電離(SELDI;例如Ciphergen蛋白質(zhì)芯片系統(tǒng)),非基于質(zhì)鐠的方法,和基于免疫組織化學(xué)的方法例如二維凝膠電泳。通過本領(lǐng)域一般技術(shù)人員已知的程序,SELDI方法可被用于蒸發(fā)顯微量的蛋白,和創(chuàng)造個體蛋白質(zhì)的"指紋",從而允許對在單一樣本中的多種蛋白質(zhì)的含量的同時測量。優(yōu)選地,基于SELDI的分析可被用于鑒別多種硫酸酯酶缺乏癥的特征,以及這類病癥的階段。這類分析優(yōu)選包括,但不限于下列實例。RNA^:陣列所發(fā)現(xiàn)的基因產(chǎn)物可通過被專一(抗體介導(dǎo)的)捕獲到SELDI蛋白質(zhì)盤(例如選擇性SELDI)而被選擇性地測量。蛋白篩選(例如以2維凝膠)所發(fā)現(xiàn)的基因產(chǎn)物可通過最優(yōu)化的"總蛋白SELDI"解析以可視化那些來自SEQIDN0s:1,6,8,10,12,14,16,18,20,22,24,26,和/或28中的特定的目的標(biāo)記。來自SEQIDN0s:1,6,8,10,12,14,16,18,20,22,24,26,和/或28中的多種標(biāo)記物的SELDI測量的特定硫酸酯酶缺乏癥的預(yù)測模型可被用于SELDI策略。任何前述微陣列方法在測定硫酸酯酶缺乏疾病相關(guān)核酸的蛋白中的應(yīng)用,能以本領(lǐng)域一般技術(shù)人員已知的常規(guī)方法完成,而通過蛋白質(zhì)測量方法測定的表達可與標(biāo)記物的預(yù)測定水平相關(guān),用作對硫酸酯酶缺乏疾病患者治療策略進行選擇的預(yù)測性方法。本發(fā)明也包含硫酸酯酶產(chǎn)生性細(xì)胞,其中細(xì)胞產(chǎn)生的活性疏酸酯酶對總硫酸酯酶的比率(即比活性)被增加。細(xì)胞包含(i)具有增強的表達的硫酸酯酶,和(ii)具有增強的表達的甲酰甘氨酸生成酶,其中細(xì)胞產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率,相對于甲酰甘氨酸生成酶缺乏時細(xì)胞所產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率,增加至少5%。在本文中所用的"具有增強的表達的硫酸酯酶"典型地指硫酸酯酶和/或其編碼的多肽相對于對照的增加的表達。增加的表達指增加(即到可探測的程度)任何硫酸酯酶核酸(如本文中其它部分所描述的本發(fā)明的硫酸酯酶核酸)的復(fù)制、轉(zhuǎn)錄和/或翻譯,因為任何這些過程的上調(diào)會導(dǎo)致基因(核酸)所編碼的多肽的濃度/數(shù)量的增加。這能應(yīng)用大量本領(lǐng)域中已知也在本文中其它部分描述的方法而完成,例如以硫酸酯酶cDNA和/或包含硫酸酯酶位點的基因組DNA對細(xì)胞的轉(zhuǎn)染,通過應(yīng)用同源重組將例如強啟動子元件置于內(nèi)源性硫酸酯酶基因的基因組位點上游而激活內(nèi)源性硫酸酯酶基因(參見,例如U.S.PatentsNos.5,733,761、6,270,989和6,565,844中詳細(xì)描述的基因激活技術(shù),所有這些被整合在本文中作為參考)等。典型的對照將是載體質(zhì)粒所轉(zhuǎn)染的同樣的細(xì)胞。增強(或增加)硫酸酯酶活性也指防止或抑制硫酸酯酶的降解(例如通過增強的泛素化),下調(diào)等,其導(dǎo)致例如相對于對照的增加的或穩(wěn)定的硫酸酯酶分子U半衰期)。下調(diào)或降低的表達指基因和/或其編碼的多肽的降低的表達。基因表達的上調(diào)或下調(diào)能通過一定方式直接測定,所述方式為應(yīng)用任何本領(lǐng)域已知的適合的方式例如核酸雜交或抗體探測方法分別探測基因(例如,硫酸酯酶)的mRNA水平或基因所編碼多肽的蛋白質(zhì)表達水平的增加或降低,并與對照比較。硫酸酯酶基因表達的上調(diào)或下調(diào)也能通過探測硫酸酯酶活性的變化而間接測定。類似地,在本文中所用的"具有增強的表達的甲酰甘氨酸生成酶",典型地指本發(fā)明的FGE核酸和/或其編碼的多肽相對于對照的增加的表達。增加的表達指增加(即到可探測的程度)任何本發(fā)明的FGE核酸(如本文中其它部分所描述的)的復(fù)制、轉(zhuǎn)錄和/或翻譯,因為任何這些過程的上調(diào)會導(dǎo)致基因(核酸)所編碼的多肽的濃度/數(shù)量的增加。這能應(yīng)用上述的(對硫酸酯酶)和在本文中其它部分描述的方法而完成,在一定實施方案中,相對于甲酰甘氨酸生成酶缺乏的細(xì)胞所產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率,細(xì)胞所產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率增加至少10%,15%,20%,50%,100%,200%,500%,1000%。本發(fā)明進一步包含在受試者中治療硫酸酯酶缺乏癥的改進的方法。方法包括對需要這類治療的受試者以有效劑量施用硫酸酯酶以治療受試者中的硫酸酯酶缺乏癥,其中疏酸酯酶與一定量的甲酰甘氨酸生成酶接觸,所述量是增加硫酸酯酶比活性的有效量。如本文中其它部分所描述的,"比活性"指所產(chǎn)生的活性硫酸酯酶對總硫酸酯酶的比率。在此所用的"接觸"指如本文中其它部分所描述的FGE翻譯后修飾硫酸酯酶。將對一般技術(shù)人員顯然的是,如果編碼FGE和硫酸酯酶的核酸在細(xì)胞中共表達,或甚至如果分離的FGE多肽與分離的硫酸酯酶多肽在體內(nèi)或體外接觸,則FGE能接觸石克酸酯酶并對它進行修飾。即使分離的FGE多肽能與分離的硫酸酯酶多肽共施用于受試者,以治療受試者中的疏酸酯酶缺乏癥,在FGE和石克酸酯酶之間的接觸也優(yōu)選在硫酸酯酶施用于受試者之前在體外發(fā)生。既然更低量的硫酸酯酶需要被施用,和/或以更低頻率施用(因為硫酸酯酶具有更高的比活性),此改進的治療方法對受試者有益。參考下面的實施例,本發(fā)明將被更充分地理解。然而,這些實施例只傾向于舉例說明本發(fā)明的實施方案,而不應(yīng)被解釋為限制本發(fā)明的范圍。實施例實施例1:^神^j^游雜^乏癥^薦碼乂Cf瘋f肩凝J4麟仍W乂W差厲尹W^^摩f/名。實驗程序材料和方法FGE的體外分析為監(jiān)測FGE的活性,N-乙?;虲-酰胺化的23聚肽P23(MTDFYVPVSLCTPSRAALLTGRS)(SEQIDN0:33)被用作底物。位點ll的半胱氨酸殘基向,67/^f轉(zhuǎn)化通過MALDI-T0F質(zhì)鐠監(jiān)測。30%乙氰和0.1%三氯乙酸(TFA)中的6一的P23原液被制備。在標(biāo)準(zhǔn)條件下,6pmol的P23與高至10pl的酶一起在最終體積為30pl的50mMTris/HC1(pH9.0:含有67mMNaCl,15pMCaCl2,2mMDTT,和O.33mg/ml牛血清白蛋白)中于37X:培育。為停止酶反應(yīng),加入1.5pi10%TFA。然后P23被固著于ZipTipC18(Millipore),以O(shè).1%TFA清洗,并在3^1的50%乙氰和O.1%TFA中洗脫。0.5jil的洗脫液與O.5nl的基質(zhì)溶液(50%乙氰和0.1%TFA中的5mg/mla-氰基-4-羥基-肉桂酸(BrukerDaltonics,Billerica,MA))在不銹鋼的把上混合。MALDI-TOF質(zhì)語應(yīng)用反射模式和剛好高于解吸/電離閾值的激光能量以ReflexIII(BrukerDaltonics)完成。所有鐠線是來自耙標(biāo)上幾個點的200-300次射擊(shot)的平均值。質(zhì)量軸應(yīng)用分子質(zhì)量范圍在1000到3000Da的肽作為外部標(biāo)準(zhǔn)而校準(zhǔn)。P23的單同位素MH+是2526.28,而包含F(xiàn)Gly產(chǎn)物的是2508.29。活性(pmol產(chǎn)物/小時)根據(jù)產(chǎn)物的峰值高度除以P23和產(chǎn)物的峰值高度總和而計算。來自牛睪丸的FGE的純化牛睪丸得自當(dāng)?shù)赝涝讏?,冰上保存最?0小時。實質(zhì)(Parenchyme)從結(jié)締組織中釋放,并在韋林氏攪切器中和通過三輪次的馬達陶制(motorpottering)而勻漿。通過所得到的勻漿的細(xì)胞分級分離i粗微粒體(RM)的制備按(Meyer等,/."/o人C力e邁.,2t)00,275:14550-14557)所述并進行下面的修正而完成。三次差異離心步驟,每次4r下20分鐘,在500g(JA10轉(zhuǎn)子),3000g(JA10)和100Q0g(JA20)下完成。RM膜從最后一次的上清液中沉淀(125000g,Ti45轉(zhuǎn)子,45分鐘,4X:),通過馬達陶制勻漿并在蔗糖墊層上分層(50mMHepes,pH7.6,50mMKAc,6mMMgAc2,1mMEDTA,1.3M蔗糖,5mMp-巰基乙醇)。在Ti45轉(zhuǎn)子中以45000rpm4*C下離心210分鐘后,RM從沉淀中回收。通常100000-150000等價的RM,如Walter和Blobel(#e^o&^z/邁o/.,1983,96:84-93)所定義,從lkg睪丸組織中得到。reticuloplasm,即RM的腔內(nèi)容物通過^f氐濃度脫氧BigChap下的分級抽提而得到,如Fey等,/."/o厶C/復(fù),2001,276:47021-47028所述。對FGE的純化,95ml的reticuloplasm4X:下對20mMTris/HCl,pH8.0,2.5mMDTT透析20小時,而通過125000g下離心l小時澄清。32ml澄清reticuloplasm等份物室溫下被裝在MonoQHR10/10柱(AmershamBiosciences,Piscataway,NJ)上,清洗和用線性梯度的80mlTris緩沖液中的O到O.75MNaCl以2ml/min洗脫。三輪洗脫的包含F(xiàn)GE活性的級分(50-165mMNaCl洗脫)被收集(42ml),與2ml的伴刀豆球蛋白A-Sepharose(AmershamBiosciences,已用含有0.5MKC1,ImMMgCh,lmMMnCl2,1mMCaCl2,和2.5mMDTT的50mMHepes緩沖液,pH7.4清洗過)混合。41C下培育16小時后,伴刀豆球蛋白A-Sepharose在柱中被收集,并用6ml相同的Hepes緩沖液清洗。固著的物質(zhì)通過柱在室溫下與6ml0.5Ma-甲基甘露糖苷在50mMHepes,pH7.4,2.5mM中培育l小時而洗脫。洗脫用4ml的相同洗脫劑重復(fù)。來自伴刀豆球蛋白A-Sepharose的合并的洗脫液(lOml)以0.5MTris/HCl(pH9.O)調(diào)至pH8.0,并與用lOmg混雜肽(PVSLPTRSCAALLTGR)(SEQIDNO:34)衍生化的2ml的Affigel10(Bio-RadLaboratories,Hercules,CA)混合,以緩沖液A(50mMHepes,pH8.0,含有0.15M乙酸鉀,0.125M蔗糖,1mMMgCh,和2.5mMDTT)清洗。4。C下培育3小時后,親和基質(zhì)在柱中被收集。收集經(jīng)過的液體(flowthrough)和用4ml緩沖液A清洗的組分,合并,并與已用IOmg的Ser69肽(PVSLSTPSRAALLTGR)(SEQIDNO:35)取代的2mlAffigel10混合,用緩沖液A清洗。4'C下培育過夜,親和基質(zhì)在柱中被收集,用6ml的緩沖液B(含有2MNaCl和20種組成蛋白質(zhì)的氨基酸(每一濃度為50mg/ml)的混合物的緩沖液A)清洗3次。通過將Affigel與含有25mMSer69肽的6ml緩沖液B培育兩次,每次90min,而將固著的物質(zhì)從親和基質(zhì)洗脫。洗脫液的等分組分以lmg/ml牛血清白蛋白取代,對緩沖液A透析,并分析活性?;钚缘谋A舨糠?11.8ml)在Vivaspin500濃縮器(VivascienceAG,Hannover,Germany)中濃縮,并在95T下溶于LaemmliSDS樣品緩沖液。起始物質(zhì)和層析步驟后得到的制劑的多肽組成以SDS-PAGE(15%丙烯酰胺,0.16%雙丙烯酰胺)監(jiān)測,和以SYPR0Ruby(Bio-RadLaboratories)染色。通過質(zhì)鐠對FGE的鑒定對于肽質(zhì)量指紋分析,純化的多肽用胰蛋白酶在凝膠內(nèi)被消化(Shevchenko等,J加7.CAe邁.,1996,68:850-855),在C18ZipTip上脫鹽,并應(yīng)用二氫苯甲酸作為基質(zhì)和兩種來自胰蛋白酶的自降解肽(m/z842.51和2211.IO)作為內(nèi)標(biāo)準(zhǔn)而以MALDI-TOF質(zhì)鐠進行分析。對串聯(lián)質(zhì)譜分析,選出的肽通過MALDI-TOFpost-sourcedecay質(zhì)謙而被分析。它們對應(yīng)的帶雙電荷的離子被分離出,并被ofninenano-ESI離子阱質(zhì)鐠(EsquireLC,BrukerDaltonics)所片段化,質(zhì)語數(shù)據(jù)通過Mascot檢索算法用于NCBInr蛋白質(zhì)數(shù)據(jù)庫中和NCBIEST核苷酸數(shù)據(jù)庫中的蛋白質(zhì)鑒定。生物信息學(xué)信號肽和切斷的位置根據(jù)在EMBOSS(Rice等,7>6/7&Ce/7e〃",2000,16:276-277)中實行的vonHeijne(vonHeijne,腸7e/"c油to.,1986,14:4683-90)的方法被描述。N-糖基化位點應(yīng)用Brimak的算法(Gupta和Brunak,5>早A/oc卿uL,2002,310-22)被預(yù)測。功能結(jié)構(gòu)域通過搜索PFAM-Hidden-Markov-Models(version7.8)(Sonnhammer等,腸7e/dc油紋,1998,26:320-322)而被探測到。為搜索FGE同源物,NationalCenterforBiotechnologyInformation的數(shù)據(jù)庫(Wheeler等,腸/e/cJc油組,2002,20:13-16)用BLAST(Altschul等,A^c/e/cJc/&Wes.,1997,25:3389-3402)查詢。序列類似度應(yīng)用來自EMBOSS的標(biāo)準(zhǔn)工具而計算?;蚪M位點組織和同線性應(yīng)用NCBI的人和小鼠基因組資源及也來自NCBI,Bethesda,MD的人類-小鼠同源性圖譜而確定。人FGEcDNA的克隆從人成纖維細(xì)胞應(yīng)用RNEASYMini試劑盒(Qiagen,Inc.,Valencia,CA)制備的總RNA,應(yīng)用薩ISCRIPTRTM試劑盒(Qiagen,Inc.,Valencia,CA)以及寡(dT)引物或者FGE專一的引物1199nc(CCAATGTAGGTCAGACACG)(SEQIDNO:36)而被反轉(zhuǎn)錄。cDNA的第一鏈通過應(yīng)用正向引物lc(ACATGGCCCGCGGGAC)(SEQIDNO:37)和作為反向引物的1199nc或1182nc(CGACTGCTCCTTGGACTGG)(SEQIDNO:38)的PCR而擴增。PCR產(chǎn)物被直接克隆進pCR4-T0P0TM載體(InvitrogenCorporation,Carlsbad,CA)。通過對克隆PCR產(chǎn)物(其從不同的個體和獨立的RT-PCR反應(yīng)得到)的多種測序,F(xiàn)GEcDNA的編碼序列被確定(SEQIDNOs:l和3)。突變探測,基因組測序,定點誘變和RNA印跡分析此研究中采用的標(biāo)準(zhǔn)流程本質(zhì)上如Liibke等(iVa"fe/2.,2001,28:73-76)和Hansske等(/.,2002,109:725-733)所述。Northern點與覆蓋整個編碼區(qū)cDNA探針雜交,并與p-肌動蛋白cDNA探針雜交而作為RNA負(fù)載的對照。細(xì)胞系和細(xì)胞培養(yǎng)來自多種硫酸酯酶缺乏癥患者1-6的成纖維細(xì)胞分別從E.Christenson(RigshospitaletCopenhagen),M.Beck(UniversitatskinderklinikMainz),A.Kohlschtter(UniversitStskrankenhausEppendorf,Hamburg),E.Zammarchi(MeyerHospital,UniversityofFlorence),K.Harzer(InstitutfiirHirnforschung,UniversitatTiibingen),和A.Fensom(Guy,sHospital,London)得到。人皮膚成纖維細(xì)胞,HT-1080,BHK21和CHO細(xì)胞被以37t:和5。/。0)2下保存在含有10%胎牛血清的Dulbecco的修飾后的Eagle培養(yǎng)基中。轉(zhuǎn)染,間接免疫熒光,Western印跡分析和FGE活性的探測通過add-onPCR(其應(yīng)用了Pfu聚合酶(Stratagene,LaJolla,CA)和下列引物GGAATTCGGGACAACATGGCTGCG(EcoRI)(SEQIDNO:39),(HA)(SEQIDNO:40),CCCAAGCTTACAGGTCTTCTTCAGAAATCAGCTTTTGTTCGTCCATGGTGGGCAGGC(c-Myc)(SEQIDNO:41),CCCAAGCTTAGTGATGGTGATGGTGATGCGATCCTCTGTCCATGGTGGGCAGGC(RGS-His6)(SEQIDNO:42)),FGEcDNA被裝上5'EcoRI-位點以及3'HA-,c-Myc或者RGS-His廣標(biāo)記序列,及其后的終止密碼子和HindIII位點。得到的PCR產(chǎn)物作為EcoRI/HindlII片段被克隆進pMPSVEH(Artelt等,fe/e:1988,68:213-219)。應(yīng)用EFFECTENE(Qiagen)作為轉(zhuǎn)染試劑,得到的質(zhì)粒被瞬時轉(zhuǎn)染進生長在蓋玻片上的HT-1080,BHK21和CH0細(xì)胞。轉(zhuǎn)染48小時后,細(xì)胞通過如前面所述的間接免疫熒光(Liibke等,A^.,2001,28:73-76;Hansske等,/CV//./力re".,2002,109:725-733),應(yīng)用抗HA的單克隆IgGl抗體(Berkeley抗體Company,Richmond,CA),抗c-Myc的單克隆IgGl抗體(SantaCruzBiotechnology,Inc.,SantaCruz,CA)或抗RGS-His的單克隆IgGl抗體(Qiagen)作為第一抗體而被分析。內(nèi)質(zhì)網(wǎng)標(biāo)記蛋白即蛋白二硫鍵異構(gòu)酶(PDI)被用不同亞型的單克隆抗體(IgGM,StressgenBiotech.,VictoriaBC,Canada)所探測。第一抗體被用分別偶聯(lián)到CY2或CY3的同型-專一性的山羊第二抗體(MolecularProbes,Inc.,Eugene,0R)所探測。免疫熒光圖像在LeicaTCSSp2AOBS激光掃描顯微鏡上得到。對Western印跡分析,應(yīng)用相同的單克隆抗體,HRP-綴合的抗-小鼠IgG被用作第二抗體。對FGE活性的測定,胰蛋白酶化的細(xì)胞用含有2.5mMDTT、蛋白酶抑制劑和1%TritonX-100的10mMTris(pH8.Q)所溶解的磷酸緩沖鹽溶液清洗,其含有蛋白酶抑制劑的混合物(208jiM4-(2-氨基乙基)鹽酸苯磺?;?.16jiM抑酶肽,4.2juM亮抑酶肽,7.2nM苯丁抑制素,3jtM抑胃酶肽A,2.8^iME-64),并通過在125,000g離心l小時而澄清。上清液在MonoQPC1.6/5柱上應(yīng)用上述條件進行層析。在50-200mMNaCl中洗脫的組分被收集,冷凍干燥,并重構(gòu)成原始體積的十分之一,隨后用肽P23測定FGE活性。逆轉(zhuǎn)錄病毒轉(zhuǎn)導(dǎo)目的cDNAs被克隆進基于莫洛尼鼠白血病病毒的載體pLPCX和pLNCX2(BDBiosciencesClontech,PaloAlto,CA)。嗜親性的FNX-Eco細(xì)胞(ATCC,Manassas,VA)的轉(zhuǎn)染,及兼嗜性RETROPACK丁mPT67細(xì)胞(BDBiosciencesClontech)和人成纖維細(xì)胞的轉(zhuǎn)導(dǎo)按Liibke等,Ce/"2001,28:73-76;Thiel等,S/oc/e瓜/.,2002,376,195-201所述完成。對部分實驗,在測定硫酸酯酶活性前,用嘌呤霉素選擇pLPCX轉(zhuǎn)導(dǎo)的PT67細(xì)胞硫酸酯酶分析ASA,STS和GalNAc6S的活性按Rommerskirch和vonFigura,戶roc.Sc/.,i/^,1992,89:2561-2565;Gl6ssl和Kresse,W/幾Jc",1978,88:111-119中所述被測定。結(jié)果對FGE活性的基于肽的快速分析我們已發(fā)展出應(yīng)用體外合成的["S]ASA片段作為底物而用于在微粒體抽提物中測定FGE活性的分析法。片段被加入分析混合物而作為核糖體相連的初生鏈復(fù)合物。對產(chǎn)物的定量包括胰蛋白酶消化、肽通過RP-HPLC的分離,及通過化學(xué)衍生為腙、RP-HPLC分離和液閃計數(shù)的組合而對含有["S]-標(biāo)記的尸67/的胰蛋白酶降解肽的鑒別和定量(Fey等,/.C力e瓜,2001,276:47021-47028)。為監(jiān)測純化過程中的酶活性,此麻煩的程序需要被修正。對應(yīng)于ASA殘基65-80和含有尸67/形成所需的序列基序的合成性的16聚肽在體外分析中抑制了FGE活性。這暗示了肽例如ASA65-80可作為FGE的底物而起作用。我們合成了23聚肽P23(SEQIDNO:33),其對應(yīng)于ASA殘基60-80并附加了N-乙?;臅趿虬彼岷虲-酰胺化的絲氨酸殘基以分別保護N-和C-末端。含有半胱氨酸和FGly的P23形式能通過基質(zhì)輔助的激光解析/電離飛行時間(MALDI-TOF)質(zhì)鐠鑒別和定量。,67/殘基在P23位點11的存在通過MAU)I-TOFpostsourcedecay質(zhì)鐠證實(參見Peng等,/.胎s5^ec,2003,38:80-86)。P23和來自牛胰或牛睪丸微粒體的抽提物的培育將高至95。/。的肽轉(zhuǎn)化成為含有,67^衍生物(圖1)。在標(biāo)準(zhǔn)條件下,反應(yīng)與酶的數(shù)量和培育的時間成正比例,只要少于50%的底物被消耗和培育時間不超過24小時。P23的L是13nM。減少的和氧化的谷胱甘肽、Ca2+和pH的效應(yīng)與在應(yīng)用核糖體相連初生鏈復(fù)合物作為底物的分析中所見到的那些相當(dāng)(Fey等,/.A/o人C力e瓜,2001,276:47021-47028)。FGE的純化對FGE的純化,牛睪丸微粒體的可溶性的級分(reticuloplasm)作為起始物質(zhì)。FGE的比活性比那些來自牛胰微粒體的reticuloplasm中的類型高10-20倍(Fey等,/.,2001,276:47021-47028)。FGE的純化通過四個層析步驟的組合而完成。前兩個步驟是在MonoQ陰離子交換柱和伴刀豆球蛋白A-Sepharose柱上的層析。在pH8,FGE活性物被固著到MonoQ,并在50-165mMNaCl被洗脫,而具有60-90%的回收率。當(dāng)此級分與伴刀豆球蛋白A-Sepharose混合時,F(xiàn)GE被固著。起始活性的30-40°/。能用0.5Ma-曱基甘露糖苷洗脫。后面兩個純化步驟是以16聚肽衍生的親和基質(zhì)上的層析。第一親和基質(zhì)是ASA65-80肽的變體所取代的Affigel10,其中對,67/形成很關(guān)鍵的殘基Cys69,Pro71和Arg73被攪亂(混雜肽PVSLPTRSCAALLTGR-SEQIDNO:34)。當(dāng)以IOmM濃度加入體外的分析中時,此肽不會抑制FGE活性,且當(dāng)固定到AffigelIO時不會保持FGE活性。在混雜肽親和基質(zhì)上的層析除去了肽結(jié)合性蛋白,包括內(nèi)質(zhì)網(wǎng)的伴侶。第二親和基質(zhì)是ASA65-80肽的變體所取代的Affigel10,其中Cys69被絲氨酸取代(Ser69肽PVSLSTPSRAALLTGR-SEQIDNO:35)。Ser69肽親和基質(zhì)有效結(jié)合FGE。FGE活性物能用2MKSCN或者25mMSer69肽洗脫,而具有20-40°/。的回收率。在活性測定之前,KSCN或Ser69肽必須通過透析除去。Cys69被絲氨酸的取代對活性FGE的洗脫至關(guān)重要。被野生型ASA65-80肽所取代的Affigel10有效結(jié)合FGE。然而,幾乎沒有活性能在用離液鹽(KSCN,MgCh),肽(ASA65-80或Ser69肽),或者低或高pH值緩沖液洗脫的洗脫液中回收。在圖2中顯示了起始物質(zhì)和在經(jīng)歷了典型純化過程的四個層析步驟之后得到的活性組分的多肽模式。在最終級分中,5。/。的起始FGE活性和0.0006%的起始蛋白被回收(8333-倍純化)。純化的39.5和41.5kDa多肽被單個基因編碼在純化的FGE制劑中的39.5和41.5kDa多肽被進行肽質(zhì)量指紋分析。通過MALDI-TOF質(zhì)鐠得到的兩個多肽的胰蛋白酶肽的質(zhì)語很大程度地重疊,暗示著兩個蛋白質(zhì)源自相同基因。在兩個多肽的胰蛋白酶肽中,兩個富含肽(MH+1580.73,SQNTPDSSASNLGFR(SEQIDNO:43)和MIT2049.91,MVPIPAGVFTMGTDDPQIK-SEQIDN0:44外加兩處甲硫氨酸氧化)被發(fā)現(xiàn),其與具有GenBankAcc.No.AK075459(SEQIDNO:4)的cDNA所編碼的蛋白質(zhì)吻合。這兩個肽的氨基酸序列被MALDI-TOFpostsourcedecay謙和應(yīng)用offlinenano-electrosprayionisation(ESI)離子阱質(zhì)i普的MS/MS分析所確認(rèn)。人cDNA的牛定向進化同源物的EST序列,其覆蓋FGE的C端部分并與兩個肽的序列都吻合,提供了牛FGE的另外的序列信息。FGE的進化保守和結(jié)構(gòu)域結(jié)構(gòu)人FGE基因被SEQIDN0s:l和/或3的cDNA編碼,并位于染色體3p26。它跨度約為105kb,而編碼序列分散在9個外顯子中。人FGE基因的三個定向進化同源物在小鼠中(87°/。一致),黃果蠅(48%—致),和^^(47%—致)被發(fā)現(xiàn)。定向進化同源物的EST序列在更多的8個物種中被發(fā)現(xiàn),包括奶牛,豬,非洲爪蟾,&7""加"o/7J'ca7/s,斑馬魚,鮭魚和其它魚物種(對于細(xì)節(jié),參見實施例2)。外顯子-內(nèi)含子結(jié)構(gòu)在人與小鼠基因間保守,而在染色體6E2上的小鼠基因位于與人染色體3p26同線的區(qū)域內(nèi)。&cerer"2'ae和Ce/e卵/Ly的基因組缺乏FGE同源物。在原核生物中,12種人FGE的同源物被發(fā)現(xiàn)。人FGE的cDNA被預(yù)測編碼一個374殘基的蛋白(圖3和SEQIDNO:2)。此蛋白包含一個33殘基的可切斷的信號序列,其表明FGE到內(nèi)質(zhì)網(wǎng)中的遷移,此蛋白也包含了在Asnl41處的單一N-糖基化位點。FGE與伴刀豆球蛋白A的結(jié)合暗示著此N-糖基化位點被應(yīng)用。FGE的殘基87-367被列在PFAM蛋白質(zhì)基序數(shù)據(jù)庫中,作為未知功能的結(jié)構(gòu)域(PFAM:DUF323)。人FGE和其在數(shù)結(jié)構(gòu)域由三個不同的亞結(jié)構(gòu)域組成。在四種已知的真核生物FGE定向進化同源物中,N端亞結(jié)構(gòu)域(人FGE中的殘基91-154)具有46%的序列一致性和79%的相似性。在人FGE中,此結(jié)構(gòu)域在Asn141攜帶N-糖基化位點,這在其它定向進化同源物中保守。FGE的中間部分(人FGE中的殘基179-308)為富含色氨酸的亞結(jié)構(gòu)域(每129殘基中12個色氨酸)。真核生物定向進化同源物在此亞結(jié)構(gòu)域內(nèi)的一致性是57。/i,相似性是82。/。。C端亞結(jié)構(gòu)域(人FGE中的殘基327-366)是FGE家族內(nèi)最高度保守的序列。人C端亞結(jié)構(gòu)域與真核生物定向進化同源物(3個全長序列和8個EST)的序列一致性是85%,相似性是97%。在亞結(jié)構(gòu)域3的40個殘基內(nèi),四個半胱氨酸殘基完全保守。三個半胱氨酸也在原核生物FGE定向進化同源物中保守。FGE家族的12個原核生物成員(細(xì)節(jié)參見實施例2)與真核生物FGE共享亞結(jié)構(gòu)域結(jié)構(gòu)。三個亞結(jié)構(gòu)域之間的邊界在原核生物FGE家族中更加明顯,因為可變長度的非保守序列將亞結(jié)構(gòu)域彼此分開。人和小鼠基因組編碼兩個密切相關(guān)的FGE同源物(SEQIDNOs:43和44,GenBankAcc.No.醒—015411,在人中;和SEQIDN0s:45和46,GenBankAcc.No.AK076022,在小鼠中)。兩個平行進化同源物為86%—致。它們的基因位于同線染色體區(qū)域(在人中7q11,在小鼠中5G1)。兩個平行進化同源物都與FGE定向進化同源物分享亞結(jié)構(gòu)域結(jié)構(gòu),與人FGE有35。/。一致性和47%的相似性。在兩個同源物中都100%—致的第三亞結(jié)構(gòu)域中,含有半胱氨酸的亞結(jié)構(gòu)域3的十一體序列缺失。表達,亞細(xì)胞定位和分子形式2.1kb的單一轉(zhuǎn)錄子通過來自成纖維細(xì)胞的總RNA和來自心臟、腦、胎盤、肺、肝臟、骨骼肌、腎和胰的聚A+RNA的RNA印跡分析可被探測。相對于P-肌動蛋白RNA,含量有一個數(shù)量級的變化,而在胰和腎中最高,腦中最低。多種真核生物細(xì)胞系,其穩(wěn)定地或瞬時表達人FGE的cDNA或C端被HA-,Myc-或His6-tag所延長的FGE衍生物的cDNA,被用于對FGE活性和FGE亞細(xì)胞定位進行分析。標(biāo)記或非標(biāo)記的FGE的瞬時表達增加了1.6-3.9倍的FGE活性。FGE在PT67細(xì)胞中的穩(wěn)定表達增加了約100倍的FGE活性。在BHK21,CHO和HT1080細(xì)胞中通過間接免疫熒光對帶標(biāo)記的FGE形式的探測顯示多種帶標(biāo)記的FGE形式與蛋白質(zhì)二硫鍵異構(gòu)酶(一種內(nèi)質(zhì)網(wǎng)的腔蛋白)共定位。來自BHK21細(xì)胞(被編碼帶標(biāo)記的FGE形式的cDNA所瞬時轉(zhuǎn)染)的抽提物的Western印跡分析顯示單一的免疫活性條帶,其表觀大小在42到44kDa之間。FGE基因攜帶多種硫酸酯酶缺乏癥中的突變多種硫酸酯酶缺乏癥由硫酸酯酶中無法產(chǎn)生F67/殘基的缺陷所引起(Schmidt,B.等,6W/,1995,82:271-278)。FGE基因因此是多種硫酸酯酶缺乏癥的候選基因。我們對7位多種硫酸酯酶缺乏癥患者的FGE編碼性cDNA進行了擴增和測序,發(fā)現(xiàn)十個不同的突變,其被基因組DM測序所確證(表1)。表1:MSD患者中的突變<table>tableseeoriginaldocumentpage85</column></row><table>*患者1是在Schraidt,B.等,Ce//,1995,82:271-278和Rommerskirch和vonFigura,尸roc.組/.,咖,1992,89:2561-2565中的多種硫酸酯酶缺乏癥患者Mo.。**患者6是被Burk等,/.,ed/a".,1984,104:574-578報道的多種硫酸酯酶缺乏癥患者.其它患者代表未發(fā)表的病例。第一位患者是1076C〉A(chǔ)置換(將絲氨酸359的密碼子轉(zhuǎn)換成了終止密碼子)(S359X)和導(dǎo)致149-173的25個殘基(被外顯子3所編碼和將蛋白質(zhì)的第一與第二結(jié)構(gòu)域分開)的刪除的突變的雜合子?;蚪M測序顯示第三個內(nèi)含子的+5-8核苷酸的刪除(IVS3+5-8del),其從而破壞了內(nèi)含子3的剪切供體位點。第二位患者是引起外顯子3丟失(IVS3+5-8del)的突變和979C〉T置換(將精氨酸327的密碼子轉(zhuǎn)換成了終止密碼子)(R327X)的雜合子。由979C〉T等位基因編碼的截短的FGE缺乏了亞結(jié)構(gòu)域3的絕大部分。第三位患者是1045C〉T置換(亞結(jié)構(gòu)域3中的保守精氨酸349被色氨酸取代)(R349W)的純合子。笫四位患者是FGE結(jié)構(gòu)域中取代保守殘基的兩個錯義突變的雜合子1046〉T置換(精氨酸349被谷氨酰胺取代)(R349Q)和1006T>C置換(半胱氨酸336被精氨酸取代)(C336R)。第五位患者是836C〉T置換(保守丙氨酸279被纈氨酸取代)(A279V)的雜合子。第二突變是一種單一核苷酸刪除(243delC),其在脯氨酸81之后改變序列并導(dǎo)致殘基139之后的翻譯停止。第六位患者是單一核苷酸刪除(661delG)(其在殘基220之后改變氨基酸序列并在殘基266之后引入終止密碼子)的雜合子。第二突變是內(nèi)含子6的剪切受體位點突變(IVS6-1G〉A(chǔ)),其導(dǎo)致編碼殘基281-318的外顯子7的按讀碼框刪除。在笫七位患者中,與在第三位患者中相同的1045OT置換被發(fā)現(xiàn)。此外,我們探測到來自對照和多種硫酸酯酶缺乏癥患者的18FGE等位基因的編碼區(qū)中的兩種多態(tài)性。22%攜帶188G〉A(chǔ)置換(絲氨酸63被天冬酰胺取代)(S63N),而28%有沉默的11160T置換。多種硫酸酯酶缺乏癥成纖維細(xì)胞以野生型和突變體FGEcDNA的轉(zhuǎn)導(dǎo)為了確認(rèn)FGE缺陷是多種硫酸酯酶缺乏癥中合成的硫酸酯酶無活性的原因,我們在多種硫酸酯酶缺乏癥成纖維細(xì)胞中應(yīng)用逆轉(zhuǎn)錄病毒基因轉(zhuǎn)移來表達FGEcDM。作為對照,我們轉(zhuǎn)導(dǎo)了沒有cDNA插入物的逆轉(zhuǎn)錄病毒載體。為監(jiān)測代謝缺陷的補償(complementation),ASA、類固醇硫酸酯酶(STS)和N-乙酰半乳糖胺6-硫酸酯酶(GalNAc6S)的活性在選擇之前或之后在被轉(zhuǎn)導(dǎo)的成纖維細(xì)胞中測量。野生型FGE的轉(zhuǎn)導(dǎo)部分恢復(fù)了兩種多種硫酸酯酶缺乏癥-細(xì)胞系中的三種硫酸酯酶的催化活性(表2),而在笫三種多種硫酸酯酶缺乏癥細(xì)胞系中部分恢復(fù)了STS的活性。應(yīng)當(dāng)指出的是,對于ASA和GalNAc6S,恢復(fù)只是在對成纖維細(xì)胞選擇之后的部分恢復(fù),達到正?;钚缘?0到50%。對于STS,活性被發(fā)現(xiàn)在選擇后恢復(fù)到對照成纖維細(xì)胞的水平。選擇增加了ASA和STS的活性50到80、其與早些時候的觀察即15到50%的成纖維細(xì)胞被轉(zhuǎn)導(dǎo)(LUbke等,&/7.,2001,28:73-76)相一致。僅以逆轉(zhuǎn)錄病毒載體轉(zhuǎn)導(dǎo)的多種硫酸酯酶缺乏癥成纖維細(xì)胞中的硫酸酯酶活性(表2)與非轉(zhuǎn)導(dǎo)性多種硫酸酯酶缺乏癥成纖維細(xì)胞(未顯示)中的那些結(jié)果相當(dāng)。攜帶IVS3+5-8del突變的FGEcDNA的轉(zhuǎn)導(dǎo)無法恢復(fù)硫酸酯酶活性(表2).表2:多種硫酸酯酶缺乏癥成纖維細(xì)胞通過野生型或突變體FGEcDNA轉(zhuǎn)導(dǎo)的補償<table>tableseeoriginaldocumentpage88</column></row><table>'數(shù)值給出了ASA(mU/mg細(xì)胞蛋白質(zhì)),STS(pU/rag細(xì)胞蛋白質(zhì)),GalNAc6S(pU/mg細(xì)胞蛋白質(zhì))和p-己糖胺酶(U/mg細(xì)胞蛋白質(zhì))之間的比率.對于對照成纖維細(xì)胞,6-ll個細(xì)胞系的均值和方差被給出。指明了平行轉(zhuǎn)導(dǎo)的兩種培養(yǎng)物的范圍的情形針對多種硫酸酯酶缺乏癥成纖維細(xì)胞給出。。多種硫酸酯酶缺乏癥成纖維細(xì)胞的數(shù)目指表l中的患者的數(shù)目+選擇前活性測定++選擇后活性測定n.d.沒有測定討論FGE是內(nèi)質(zhì)網(wǎng)的高度保守的糖蛋白來自牛睪丸的FGE的純化得到了源自相同基因的39.5和41.5kDa的兩種多肽。三種FGE不同標(biāo)記形式在三種不同真核生物細(xì)胞系中作為單一形式的表達暗示,在從牛睪丸純化的FGE制劑中觀察到的兩種形式中的一種可能由純化過程中的有限蛋白水解所產(chǎn)生。ASA65-80肽中Cys69被絲氨酸的置換,對于FGE通過親和層析的純化至關(guān)重要。FGE具有可切斷的信號序列,其介導(dǎo)穿過內(nèi)質(zhì)網(wǎng)膜的移位。成熟蛋白的更多部分(340個殘基中的275個)定義了獨有的結(jié)構(gòu)域,其很可能由三個亞結(jié)構(gòu)域組成(參見實施例2),對于這三個亞結(jié)構(gòu)域,都沒有在具有已知功能的蛋白質(zhì)中找到同源物。對線性尸C77修飾基元在新合成的硫酸酯酶多肽中的識別(Dierks等,fyl仿0/.,1999,18:2084-2091)可能是FGE亞結(jié)構(gòu)域的功能。催化結(jié)構(gòu)域能以數(shù)種方式催化^7^F形成。已有建議提出,F(xiàn)GE從半胱氨酸的巰基吸取電子,并將它們轉(zhuǎn)移到受體。得到的硫醛將自發(fā)地水解成尸67/和H2S(Schmidt,B.等,Ce/7,1995,82:271-278)。替代性地,F(xiàn)GE能扮演混合功能的加氧酶(單加氧酶),在電子供體如FADH2的協(xié)助下將02的一個原子引入到半胱氨酸,而另一個引入H力。得到的半胱氨酸硫醛水合衍生物將自發(fā)地反應(yīng)成尸67/^H2S。部分純化的FGE制劑的初步實驗顯示F67j形成對分子氧的重要依賴性。這將暗示FGE扮演混合功能的加氧酶。亞結(jié)構(gòu)域3特別高的保守性和三個完全保守的半胱氨酸殘基在其中的存在使得此亞結(jié)構(gòu)域成為催化位點很可能的候選者。將會有趣的是研究,介導(dǎo)尸W/基元的識別和電子受體或電子供體的結(jié)合的結(jié)構(gòu)元件是否與FGE的結(jié)構(gòu)域結(jié)構(gòu)相關(guān)。重組FGE定位于內(nèi)質(zhì)網(wǎng),這與所建議的其行為位置一致。F67/殘基在新合成的硫酸酯酶中產(chǎn)生,這發(fā)生在它們移位到內(nèi)質(zhì)網(wǎng)的過程中或短時間之后(Dierks等,尸roc.Ais〃.Jcad.5"c/.KS.A,1997,94:11963-11968;Dierks等,,1998,423:61—65)。FGE本身不含有KDEL類型的ER-保留信號。因此它在內(nèi)質(zhì)網(wǎng)中的保留可被與其它ER蛋白的相互作用所介導(dǎo)。移位/N-糖基化機制的成分是這類相互作用的伴侶的有吸引力的候選者。導(dǎo)致多種硫酸酯酶缺乏癥的FGE中的突變我們已顯示,編碼FGE的基因中的突變導(dǎo)致多種硫酸酯酶缺乏癥。FGE也可與其它成分相互作用,而編碼后者的基因中的缺陷能同等有效地導(dǎo)致多種硫酸酯酶缺乏癥。在七位多種硫酸酯酶缺乏癥患者中,我們確實發(fā)現(xiàn)了FGE基因中的十種不同突變。通過在亞結(jié)構(gòu)域3(三個突變)或亞結(jié)構(gòu)域2(—個突變)中取代高度保守的殘基或C端不同長度的截短(四個突變)或大的按讀碼框刪除(兩個突變),所有突變對FGE蛋白有嚴(yán)重的影響。對于兩種多種硫酸酯酶缺乏癥-細(xì)胞系和一種多種硫酸酯酶缺乏癥的突變,已有顯示,野生型而不是突變體的FGEcDNA的轉(zhuǎn)導(dǎo)部分恢復(fù)硫酸酯酶的活性,這清晰地鑒定出FGE基因作為突變位點以及突變的致病本質(zhì)。多種硫酸酯酶缺乏癥是臨床和生化方面都異型。在出生時期存在而發(fā)展出腦積水的罕見的新生形式,起初象幼兒異染性腦白質(zhì)營養(yǎng)不良而后來發(fā)展出魚鱗癬和粘多糖癥類似特征的普遍形式,以及較少發(fā)生的溫和形式(在此形式中,粘多糖癥臨床特征流行),已被區(qū)分開。生化上其特征是硫酸酯酶的殘余活性能被測到,對于大多數(shù)病例而言,其在培養(yǎng)的皮膚成纖維細(xì)胞中低于對照的10%(Burch等,(7e刀".,1986,30:409-15;Basner等,戶ef/Z"r.ies.,1979,13:1316-1318)。然而,在某些多種硫酸酯酶缺乏癥細(xì)胞系中,選出的硫酸酯酶的活性能達到正常范圍(Yutaka等,^/".,1981,20:296-303)。此外,殘余活性已被報道經(jīng)歷了基于細(xì)胞培養(yǎng)條件和未知因素的變化。生化上,多種硫酸酯酶缺乏癥被分類為兩組。在組I中,硫酸酯酶的殘余活性低于15%,包括ASB的那些部分。在組II中,硫酸酯酶的殘余活性更高一些,特別是ASB的那些部分可達到高至對照的50-100%的值。所有在此報道的患者除了患者5都屬于組I,患者5屬于生化表型的組II(ASB活性在對照的范圍內(nèi))?;谂R床標(biāo)準(zhǔn),患者1和6是新生型病例,而患者2-4和7是普遍型,患者5是多種硫酸酯酶缺乏癥的類粘多糖癥形式。表型異質(zhì)性暗示多種硫酸酯酶缺乏癥患者中的不同突變與不同的FGE殘余活性相關(guān)。穩(wěn)定表達FGEIVS3+5-8del的PT67細(xì)胞上的初步數(shù)據(jù)表明外顯子3的按讀碼框刪除完全終止了FGE活性。應(yīng)用最近發(fā)展出的高敏感性質(zhì)譜方法對多種硫酸酯酶缺乏癥中的突變、變體FGE的生化性質(zhì)的特征鑒定,及對硫酸酯酶中的尸677的殘余含量的特征鑒定(Peng等,/.她"i";ec.,2003,38:80-86)將為多種硫酸酯酶缺乏癥中基因型-表型相關(guān)性提供更好的理解。實施例2:入凡w差萄定乂r發(fā)彿磁^凝雜時^u^凝i浙^^核i樹孝保伊?xí)r新差萄家族生物信息學(xué)信號肽和切斷位點以vonHeijne所述的方法(y^/c/e/c,1986,14:4683),該方法在EMBOSS中的實行(Rice等,7>e/&//Ge力e〃c^,2000,16:276-277),和Nielsen等的方法(資^^^^//eer/;^,1997,10:1-6)來描述。N-糖基化位點應(yīng)用Brunak的算法(Gupta和Brunak,Ac.萬2'oco邁/i/L,2002,310-22)預(yù)測。功能結(jié)構(gòu)域通過搜索PFAM-Hidden-Markov-Models(version7.8)而被探測(Sonnhammer等,腸/e/c爿c油Aes.,1998,26:320-322)。來自PFAMDUF323種子的序列從TrEMBL(Bairoch,A.和Apweiler,R.,iVuc/e/cJc/"Wes.,2000,28:45-48)得到。多重排列和系統(tǒng)發(fā)生樹的構(gòu)建用ClustalW(Thompson,J.等,iVwc/e/c1994,22:4673-4680)完成。對于系統(tǒng)發(fā)生樹的估計,缺口位置被排斥,而多重置換被修正。完成樹引導(dǎo)程序(Treebootstraping)以得到顯著的結(jié)果。樹應(yīng)用Njplot(Perriere,G.和Gouy,M.,5/oc力/邊/e,1996,78:364-369)而可見。比對應(yīng)用來自EMBOSS的pret-typlot命令而作出曲線。為搜索FGE同源物,NationalCenterforBiotechnologyInformation(NCBI)的數(shù)據(jù)庫NR,NT和EST(Wheeler等,Wi/c/e/ch油她,2002,20:13-16)被用BLAST(Altschul等,銣/e/cJc他組,1997,25:3389-3402)查詢。對于蛋白質(zhì)序列,對當(dāng)前版本NR數(shù)據(jù)庫應(yīng)用迭代收斂性Psi-Blast完成搜索,使用期望截止值10—"和默認(rèn)參數(shù)。收斂在5次迭代后實現(xiàn)。對于核苷酸序列,搜索以Psi-TBlastn完成應(yīng)用仰和人FGB的蛋白質(zhì)序列作為輸入值,用迭代收斂性Psi-Blast建立針對hFGE的分值矩陣,此矩陣被用作對blastall的輸入值,以查詢核普酸數(shù)據(jù)庫NT和EST。對于這兩個步驟,都用期望截止值1(T2。。蛋白質(zhì)二級結(jié)構(gòu)預(yù)測應(yīng)用Psipred(Jones,D.,/"/o人,1999,292:1950—202;McGuffin,L.等,"/o/;3尸oi"邁a〃cs,2000,16:404-405)完成。亞結(jié)構(gòu)域的相似性分?jǐn)?shù)應(yīng)用EMBOSS的cons算法以默認(rèn)參數(shù)從比對中計算。次比對(metaalignments)通過比對FGE家族亞類的共有序列而產(chǎn)生。基因組位點組織和同線性應(yīng)用在NCBI(Bethesda,MD)的NCBI人和小鼠基因組資源和Softberry,s(MountKisco,NY)Human—Mouse—RatSynteny而測定。細(xì)菌基因組序歹寸從NCBI—FTP—月艮務(wù)器下載。NCBI微生物基因組注解被用于獲得對細(xì)菌FGE基因的基因組位點的總覽。結(jié)果和討論人FGE與相關(guān)蛋白的基本特征和基元人FGE基因(SEQIDN0s:l,3)編碼預(yù)測具有374個殘基的FGE蛋白(SEQIDNO:2)。在殘基22-33之間的切斷信號(15.29的Heijne值)和在l.7和3.3之間的殘基17-29的親水值(Kyte,J.和Dooli11le,R.,/M/A/o厶,1982,157:105-132)表明,33個N端殘基在ER移位后被切下來。然而應(yīng)用Nielsen等人的算法(Profe//2^^7/7eer//^,1997,10:1-6),預(yù)測信號序列的切斷發(fā)生在殘基34之后。蛋白質(zhì)在Asn141處具有單一的潛在N-糖基化位點。以FGE蛋白序列對蛋白質(zhì)基元數(shù)據(jù)庫PFAM(Sonnhammer等人,A^/"e/c^c/",1998,26:320-322)的搜索顯示人FGE的殘基87-367能被分類成具有7:9*10—114的高顯著期望值的蛋白結(jié)構(gòu)域DUF323("未知功能的結(jié)構(gòu)域",PF03781)。確定DUF323的PFAM—種子由25個蛋白質(zhì)序列組成,其受試者是源自測序數(shù)據(jù)的假設(shè)性蛋白質(zhì)。為分析人FGE和DUF323間的關(guān)系,進行具有DUF323種子序列的FGE的多重比對?;诖?,構(gòu)建系統(tǒng)發(fā)生樹并進行自展分析。假設(shè)性序列中的四個(TrEMBL-IDsQ9CK12,Q9I761,094632和Q9Y4Q5)與種子的其它成員有如此強的差異以至于它們阻止成功的自展分析而不得不被從這套序列中除去。圖2顯示經(jīng)自展的樹,其顯示人FGE和余下的21種DUF323種子蛋白質(zhì)之間的關(guān)系。此樹可用于將這些種子成員亞分成兩個類別與人FGE密切相關(guān)的同源物,和余下的相關(guān)性較小的基因。最頂上的7個蛋白質(zhì)具有在0.41和0.73之間的對人FGE的系統(tǒng)發(fā)生距離。它們只含有單一結(jié)構(gòu)域,DUF323。在本組內(nèi)的同源性延伸到整個氨基酸序列,其較大部分由冊F323結(jié)構(gòu)域組成。DUF323結(jié)構(gòu)域在此組同源物內(nèi)非常保守,而種子的其它15個蛋白與人FGE的相關(guān)性較小(系統(tǒng)發(fā)生距離在l.14和1.93之間)。它們的DUF323結(jié)構(gòu)域與高度保守的第一組的DUF323-結(jié)構(gòu)域(參見"FGE亞結(jié)構(gòu)域和FGE基因中的突變"這一節(jié))有明顯的差異。這15個蛋白質(zhì)中的大多數(shù)是假設(shè)的,它們中的6個已被進一步研究。它們中的一個,來自C.trachomatis的絲氨酸/蘇氨酸激酶(TrEMBL:084147)包含除DUF323之外的其它結(jié)構(gòu)域:ATP-結(jié)合結(jié)構(gòu)域和激酶結(jié)構(gòu)域。來自R.sphaeroides(TrEMBL:Q9ALV8)和假單孢菌屬物種(TrEMBL:052577)的序列編碼蛋白質(zhì)NirV,它是與含銅的亞硝酸鹽還原酶nirK共轉(zhuǎn)錄的基因(Jain,R.和Shapleigh,J.,#/cro6/o/og/,2001,147:2505-2515)。CarC(TrEMBL:Q9XB56)是涉及來自E.carotovora的(3-內(nèi)酰胺抗生素的合成的力口氧酶(McGowan,S.等人,#/cro6/o/.,1996,22:415-426;KhaleeliN,T.C.,和BusbyRW,"/oc力e邁/"iy,2000,39:8666-8673)。XylR(TrEMBL:031397)和BH0900(TrEMBL:Q9KEF2)是在芽孢桿菌科(bacillaceae)和梭菌科(clostridiaceae)中涉及戊糖利用的調(diào)節(jié)的增強子結(jié)合蛋白質(zhì)(Rodionov,D.等人,Ze〃.,2001,205:305-314)。FGE和DUF323的比較導(dǎo)致建立區(qū)分FGE家族與具有不同功能的、疏遠(yuǎn)的、含有DUF323的同源物的同源性閣值。后者包和CarC(加氧酶)。如本文中其它部分所討論的,F(xiàn)GE也可作為加氧酶而發(fā)揮其半胱氨酸修飾功能,這暗示DUF323種子的FGE和非FGE成員可共享加氧酶功能。FGE的同源物人FGE的密切相關(guān)的同源物在DUF323種子中的存在引導(dǎo)我們在NCBI的NR數(shù)據(jù)庫中搜索人FGE的同源物(Wheeler等人,iVwc/e/cJc/^i".,2002,20:13-16)。搜索的閾值以這樣的方式選擇,即而沒有發(fā)現(xiàn)其它的種子成員。此搜索導(dǎo)致筌定出真核生物中的3種FGE定向進化同源物、原核生物中的12種定向進化同源物和人與小鼠中的2種平行進化同源物(表3)。表3:真核生物和原核生物中的FGE基因家族<table>tableseeoriginaldocumentpage94</column></row><table>Pl密切相關(guān)的原核生物定向進化同源物P2其它原核生物定向進化同源物f-GenBank中誤預(yù)測的蛋白質(zhì)序列注意小鼠序列GI22122361在GenBank中是被預(yù)測成編碼一種284個氨基酸的蛋白質(zhì),雖然cDNA序列NM145937編碼一種372個殘基的蛋白質(zhì)。此誤預(yù)測是由于忽略了鼠FGE基因第一外顯子。所有在NR數(shù)據(jù)庫中發(fā)現(xiàn)的序列都來自更高等的真核生物或原核生物。FGE-同源物沒有在古細(xì)菌或植物中被探測到。以甚至更低的閾值在被完全測序的秀麗線蟲(C.e/ega/7s)和哞酒糖酵母(&cerer"/se)基因組及相關(guān)的ORF數(shù)據(jù)庫中所進行的搜索沒有顯示出任何同源物。在NT和EST核苷酸數(shù)據(jù)庫的真核生物序列中的搜索導(dǎo)致鑒定出8種另外的FGE定向進化同源的EST,它們具有在蛋白質(zhì)水平上顯示高度保守性的3,-端cDNA序列片段,并且沒有在NR數(shù)據(jù)庫中列出。這些序列不包含mRNA的全部編碼部分,且全都來自更高等的真核生物(表4)。表4:真核生物中的FGE定向進化同源物EST片段<table>tableseeoriginaldocumentpage95</column></row><table>GB-GenBank登錄號;NA-核酸來自NR數(shù)據(jù)庫的編碼序列的多重比對和系統(tǒng)發(fā)生樹的構(gòu)建(應(yīng)用ClustalW)允許了對同源物四個亞組的定義真核生物定向進化同源物(人、小鼠、蚊子和果蠅FGE),真核生物平行進化同源物(人和小鼠FGE平行進化同源物),與FGE密切相關(guān)的原核生物定向進化同源物(鏈霉菌(Streptomyces)和棒狀菌(Corynebacteri認(rèn))),和其它原核生物定向進化同源物(柄細(xì)菌(Caulobacter),假單胞菌(Pseudomonas),分支桿菌(Mycobacterium),Prochlorococcus,Mesorhizobium,根瘤菌(Sinorhizobium),Novosphingobium,Ralstonia,伯克霍爾德氏菌(Burkholderia),和孩i顫菌(Microscilla))。真核生物定向進化同源物顯示對人FGE的87%(小鼠),48%(果蠅)和47%(癡蚊)的總體一致性。雖然FGE定向進化同源物在原核生物和更高等的真核生物中被發(fā)現(xiàn),但是它們在系統(tǒng)發(fā)生上位于哞酒糖酵母和黃果蠅之間的更低等真核生物的全測序基因組中不存在。此外,F(xiàn)GE同源物在大腸桿菌和thepufferfish的全測序基因組中也不存在。如本文其它部分所討論的,在人和小鼠中發(fā)現(xiàn)的FGE平行進化同源物可具有較小的產(chǎn)生F67/^活性,并對在多種硫酸酯酶缺乏癥患者中發(fā)現(xiàn)的殘余硫酸酯酶活性作出貢獻。FGE的亞結(jié)構(gòu)域FGE基因家族的成員具有三個高度保守的部分/結(jié)構(gòu)域(如本文其它部分所述)。除了分開前者的兩個非保守序列外,它們在N-和C-端還具有非保守的延伸。三個保守部分被認(rèn)為代表了DUF323結(jié)構(gòu)域的亞結(jié)構(gòu)域,因為它們被不同長度的非保守部分所間隔開。間隔開亞結(jié)構(gòu)域1和2的部分的長度在22和29個殘基之間變化,而間隔開亞結(jié)構(gòu)域2和3的部分的長度在7到38個氨基酸之間變化。N-和C-端非保守部分顯示甚至更強的長度變化(N-端0-90個氨基酸,C-端0-28個氨基酸)。來自Ralstoniametallidurans的FGE基因的序列很有可能不完整,因為它缺乏第一亞結(jié)構(gòu)域。為驗證對DUF323的亞結(jié)構(gòu)域的定義有道理,我們應(yīng)用Psipred完成了對人FGE蛋白的二級結(jié)構(gòu)預(yù)測。疏水性的ER-信號(殘基1-33)被預(yù)測為含有螺旋結(jié)構(gòu),確認(rèn)了von-Heijne算法的信號預(yù)測。N-端非保守區(qū)(氨基酸34-89)和亞結(jié)構(gòu)域2和3之間的分隔區(qū)(氨基酸308-327)包含巻繞部分。分隔亞結(jié)構(gòu)域1和2的區(qū)域包含巻繞。氨基酸65/66處的a-螺旋具有低的預(yù)測置信度,并且很可能是預(yù)測假象。亞結(jié)構(gòu)域邊界位于巻繞內(nèi),而不打斷a-螺旋或(3-鏈。第一亞結(jié)構(gòu)域由幾個p-鏈和一個a-螺旋組成,第二亞結(jié)構(gòu)域包含兩個p-鏈和四個a-螺旋。第三亞結(jié)構(gòu)域在亞結(jié)構(gòu)域的起點和終點具有側(cè)面與折疊片相接的a-螺旋。簡而言之,二級結(jié)構(gòu)與所提出的亞結(jié)構(gòu)域結(jié)構(gòu)一致,因為亞結(jié)構(gòu)域邊界位于巻繞內(nèi)且亞結(jié)構(gòu)域包含結(jié)構(gòu)性的元件a-螺旋和p-鏈。應(yīng)當(dāng)指出的是,沒有亞結(jié)構(gòu)域以數(shù)據(jù)庫所列出的序列中的單獨的模塊存在。在FGE家族的四個亞組的每一種內(nèi),亞結(jié)構(gòu)域高度保守,而第三亞結(jié)構(gòu)域顯示最高的同源性(表5)。此亞結(jié)構(gòu)域在亞組之間也顯示最強的同源性。表5:FGE家族亞結(jié)構(gòu)域的同源性(%相似性)<table>tableseeoriginaldocumentpage97</column></row><table>El-真核生物定向進化同源物;E2-真核生物平行進化同源物Pl密切相關(guān)的原核生物定向進化同源物;P2其它原核生物定向進化同源物FGE家族的第一亞結(jié)構(gòu)域在亞組間顯示出最弱的同源性。在真核生物定向進化同源物中,它攜帶N-糖基化位點人中的殘基Asn141,小氣中的Asn139和果蠅中的Asn120。在瘧蚊中,在與黃果蠅Asn120同源的殘基130處沒有發(fā)現(xiàn)天冬酰胺。然而,兩個核苷酸的改變將在瘧蚊中創(chuàng)造出一個N-糖基化位點Asn130。因此,包含殘基130的序列需要再次測序。笫二亞結(jié)構(gòu)域富含色氨酸,人FGE的129個殘基中有12個Trp。這些色氨酸中的十個在FGE家族中保守。亞結(jié)構(gòu)域3的高保守性真核生物定向進化同源物之間的亞結(jié)構(gòu)域3是100%類似和90%—致。第三亞結(jié)構(gòu)域?qū)Φ鞍踪|(zhì)功能的重要性被這樣的觀察結(jié)果所強調(diào),即此亞結(jié)構(gòu)域是多種硫酸酯酶缺乏癥患者中的致病性突變的熱點。實施例l中所述的在6位多種硫酸酯酶缺乏癥患者中鑒別的9個突變中的7個是位于編碼亞結(jié)構(gòu)域3的40個殘基的序列中。殘基包含4個半胱氨酸,其中3個在原核生物和真核生物定向進化同源物中保守。兩種真核生物平行進化同源物顯示出與FGE家族其它成員的最小同源性,例如它們?nèi)狈喗Y(jié)構(gòu)域3的3個保守半胱氨酸中的2個。在定向進化同源物'和平行進化同源物的亞結(jié)構(gòu)域3序列之間保守的特征是起始的RVXXGG(A)S基元(SEQIDNO:79),一種含有3個精氨酸的七肽(亞結(jié)構(gòu)域共有序列的殘基19-25),和末端的GFR基元。對15個不是FGE密切同源物的種子序列的DUF323結(jié)構(gòu)域進行比較,顯示出顯著的序列差異15個種子序列具有相對不保守的第一和第二亞結(jié)構(gòu)域,雖然整個亞結(jié)構(gòu)域結(jié)構(gòu)也可見到。當(dāng)與原核生物FGE家族成員(約60%的相似性)比較時,在FGE家族中非常保守的亞結(jié)構(gòu)域3更短,并具有對真核生物亞結(jié)構(gòu)域3的顯著更弱的同源性(約20%的相似性)。因此它們?nèi)狈λ械膩喗Y(jié)構(gòu)域3的保守半胱氨酸殘基。僅有的保守特征是起始的RVXXGG(A)S基元(SEQIDNO:79)和末端的GFR基元。人和鼠FGE基因的基因組組織人FGE基因位于染色體3p26。它含有105kb和9個用于翻譯序列的外顯子,鼠FGE基因長度為80Kb,位于染色體6E2。鼠FGE基因的9個外顯子具有幾乎與人外顯子同樣的大小(圖3)。人和小鼠基因之間的主要差異是外顯子9中的3'-UTR的更低的保守性和外顯子9的長度,在鼠基因中外顯子9的長度多了461bp。小鼠染色體6的區(qū)段6E2與人染色體區(qū)段3p26是高度同線性的。在朝著端粒的方向上,人和鼠FGE座位的側(cè)面都與編碼LMCD1、KIAA0212、ITPR1、AXCAM和IL5RA的基因相接。在著絲粒方向上,兩個FGE座位在側(cè)面都與CAV3和0XTR的座位相接。原核生物FGE基因的基因組組織在原核生物中,硫酸酯酶根據(jù)在它們的活性中心中轉(zhuǎn)換成,67/^1殘基而被分類為或者半胱氨酸型或者絲氨酸型的硫酸酯酶(Miech,C.等人,/"/o/C力e瓜,1998,273:4835-4837;Dierks,T.等人,C力e瓜,1998,273:25560-25564)。在肺炎克雷伯氏菌(Klebsiellapneumoniae)、大腸桿菌(E.coli)和鼠疫耶爾森氏菌(Yersiniapestis)中,絲氨酸型硫酸酯酶是具有AtsB的操縱子的一部分,其編碼含有鐵-硫族的基元的胞質(zhì)蛋白質(zhì),并對從絲氨酸殘基產(chǎn)生尸67/是至關(guān)重要的(Marquordt,C.等人,/5/o/C力e邁.,2003,278:2212-2218;Szameit,C.等人,/5/o/C/e瓜,1999,274:15375-15381)。因此有意思的是,檢測原核生物FGE基因是否位于作為FGE底物的半胱氨酸型硫酸酯酶的鄰近位置。在表3中所示的原核生物FGE基因中,7種具有已被完全測序的基因組,從而允許了對FGE座位的相鄰相關(guān)效應(yīng)的分析。實際上,在7個基因組的4個(C.efficiens:PID25028125,惡臭假單孢菌PID26990068,新月柄桿菌PID16125425和結(jié)核分枝桿菌PID15607852)中,發(fā)現(xiàn)半胱氨酸型硫酸酯酶直接與FGE相鄰,這與FGE和硫酸酯酶的共轉(zhuǎn)錄相一致。在它們中的兩種(C.efficiens和惡臭假單孢菌)中,F(xiàn)GE和硫酸酯酶甚至具有重疊的ORF,這強烈地指明了它們的共表達。此外,F(xiàn)GE和硫酸酯酶基因在四種原核生物中的基因組相鄰相關(guān)效應(yīng)為細(xì)菌FGE是功能性的定向進化同源物的假設(shè)提供了另外的證據(jù)。余下的三種生物含有半胱氨酸型硫酸酯酶(天藍(lán)色鏈霉菌PID24413927,根瘤菌PID13476324,苜蓿中華根瘤菌PIDs16262963,16263377,15964702),然而,在這些生物中鄰近FGE的基因既不含有規(guī)范的硫酸酯酶特征(Dierks,T.等人,/》/o/C力e邁.,1998,273:25560-25564)也不含有將會指明它們功能的結(jié)構(gòu)域。因此在這些生物中,F(xiàn)GE和半胱氨酸型硫酸酯酶的表達很可能被反式調(diào)節(jié)。結(jié)論對其缺乏可引起常染色體隱性傳遞的溶酶體儲存性疾病(多種硫酸酯酶缺乏癥)的人FGE進行鑒定使得能夠定義一個新的基因家族,所述基因家族包含來自原核生物和真核生物的FGE定向進化同源物以及小鼠和人中的FGE平行進化同源物。在全測序的大腸桿菌,啤酒糖酵母:秀麗線蟲和Fugurubripes的基因組中沒有發(fā)現(xiàn)FGE。此外,在原核生物和更高等的真核生物之間存在系統(tǒng)發(fā)生上的間隔,在系統(tǒng)發(fā)生上位于原核生物和黃果蠅之間的任何物種中沒有FGE。然而,這些更低等真核生物中的一部分,例如秀麗線蟲,具有半胱氨酸型硫酸酯酶基因。這指明了作用于半胱氨酸型硫酸酯酶的笫二產(chǎn)生尸^7^系統(tǒng)的存在。此假設(shè)被這樣的觀察結(jié)果支持,即沒有FGE的大腸桿菌能在半胱氨酸型硫酸酯酶中產(chǎn)生F67/(Dierks,T.等人,/"/o/CAe瓜,1998,273:25560-25564)。實施例3:F^4這《趟碗凝^獰過或這時勿^系尹時孩^凝躇活遂時^著增*我們想檢測FGE對表達/過表達硫酸酯酶的細(xì)胞的影響。為此目標(biāo),表達艾杜糖醛酸-2-硫酸酯酶(12S)或N-乙酰半乳糖胺6-硫酸酯酶(GALNS)這些人硫酸酯酶的HT-1080細(xì)胞用FGE表達構(gòu)建體pXMG.1.3(表7和圖4)或用對照質(zhì)粒pXMG.1.2(反義方向的FGE,不能產(chǎn)生功能性FGE,表7)進行兩次重復(fù)的轉(zhuǎn)染。在進行一次24小時電穿孔后的培養(yǎng)基改變之后24、48和72小時采集培養(yǎng)基樣本。培養(yǎng)基樣本通過活性分析來測試各自的硫酸酯酶活性,并通過對艾杜糖醛酸-2-硫酸酯酶或N-乙酰半乳糖胺6-硫酸酯酶專一的ELISA來評估總硫酸酯酶蛋白水平。表6.表達硫酸酯酶的轉(zhuǎn)染的細(xì)胞系,該硫酸酯酶用作轉(zhuǎn)染的底<table>tableseeoriginaldocumentpage101</column></row><table>表7.用于轉(zhuǎn)染表達艾杜糖醛酸2-硫酸酯酶和N-乙酰半乳糖胺6-硫酸酯酶的HT-1080細(xì)胞的FGE和對照質(zhì)粒<table>tableseeoriginaldocumentpage101</column></row><table>*>表示方向5,到3,實驗程序材料和方法對產(chǎn)生艾杜糖醛酸2-硫酸酯酶和N-乙酰半乳糖胺6-硫酸酯酶的HT-1080細(xì)胞的轉(zhuǎn)染采集HT-1080細(xì)胞,以得到對于每次電穿孔有9-12x106的細(xì)胞。用兩種質(zhì)粒重復(fù)轉(zhuǎn)染兩次一種是待測試(FGE)的,而另一種作對照;在此情形中對照質(zhì)粒包含相對于CMV啟動子以反向克隆的FGEcDNA。細(xì)胞以約1000RPM離心5分鐘。細(xì)胞以16x106個細(xì)胞/mL懸浮在IXPBS中。將100fig的質(zhì)粒DNA加到電穿孔小杯的底部,將750jiL的細(xì)胞懸浮液(12x106個細(xì)胞)加入小杯中的DNA溶液中。細(xì)胞和DNA用塑料移液管輕輕混合,小心不要產(chǎn)生泡沫。細(xì)胞以450V,250(BioRadGenePulser)進行電穿孔。記錄時間常數(shù)。讓電穿孔的細(xì)胞靜置10-30分鐘。然后加入1.25mL的DMEM/10%小牛血清到每一個小杯,混合,并將所有細(xì)胞轉(zhuǎn)移到含有20mLDMEM/10的新鮮的T75燒瓶。24小時后,燒瓶中再注入20mLDMEM/10以除去死亡的細(xì)胞。轉(zhuǎn)染后48-72小時,收集培養(yǎng)基樣本,從完全一樣的T75燒瓶采集細(xì)胞。培養(yǎng)基制備1LDMEM/10(含有23ml的2mML-谷氨酸,115mL小牛血清)細(xì)胞在不含氨曱蝶呤(MTX)的培養(yǎng)基中被轉(zhuǎn)染。24小時后,細(xì)胞用含有適量MTX(36F=1.0|iMMTX,30C6=0.1MMTX)的培養(yǎng)基再進行培養(yǎng)。再培養(yǎng)后24、48和72小時,收獲培養(yǎng)基和收集細(xì)胞?;钚苑治霭盘侨┧?2-石克酸酯酶(I2S)NAP5脫鹽柱(AmershamPharmaciaBiotechAB,Uppsala,Sweden)用透析緩沖液(5mM醋酸鈉,5mMtris,pH7.0)平衡。含有I2S的樣本被加到柱上,并讓其進入柱床。樣本以1mL的透析緩沖液洗脫。脫鹽的樣本用反應(yīng)緩沖液(5mM醋酸鈉,0.5rag/LBSA,0.1%TritonX-IOO,pH4.5)進一步稀釋到約100ng/mL12S。將10jiL的每一I2S才羊本力口入96—孑L的FluormetricPlate(PerkinElmer,Norwalk,CT)的頂上一排,并在37C預(yù)培育15分鐘。底物通過將4-甲基-維形基硫酸酯(Fluka,Buchs,Switzerland)溶解在底物緩沖液(5mM醋酸鈉,0.5mg/mLBSA,pH4.5)中至最終濃度為1.5mg/mL而制備。100jtL的底物被加至含有12S樣本的每一孔中,并將平板在37X:于黑暗中培育1小時。培育后,將190的終止緩沖液(332.5mM甘氨酸,207.5mM碳酸鈉,pH10.7)加至含有樣本的每一孔中。4-甲基傘形酮(4-MUF,Sigma,St.Louis,MO)儲液在試劑級水中制備成最終濃度為1pM以作為產(chǎn)物標(biāo)準(zhǔn)。150jtL的1jiM4-MUF儲液和150pL終止緩沖液加至平板中的頂上一排。150nL的終止緩沖液加至96孔平板中剩下的每一孔中。從平板的每一列的頂上一排至最后一排制備兩倍的系歹'J稀釋液。平板在FusionUniversalMicroplateAnalyzer(Packard,Meriden,CT)上以330nm的激發(fā)過濾波長和440nm的發(fā)射過濾波長進行閱讀。得到4-MUF儲液的微摩爾數(shù)量對熒光的標(biāo)準(zhǔn)曲線,而未知樣本具有由此曲線推斷的熒光。結(jié)果以"單位/mL"(—個單位的活性等于在37'C下每分鐘產(chǎn)生lfimole的4-MUF)顯示。N-乙酰半乳糖胺6-硫酸酯酶(GALNS)GALNS活性分析利用了熒光底物4-曱基維形基-P-D-吡喃半乳糖苷-6-石克酸酯(TorontoResearchChemicalsInc.,目錄號M33448)。分析包括兩個步驟。在笫一步驟中,75pL的在反應(yīng)緩沖液(0.IM醋酸鈉,0.1M氯化鈉,pH4.3)中制備的1.3mM底物與10pL的培養(yǎng)基/蛋白質(zhì)樣本或其相應(yīng)的稀釋液在37。C培育4小時。反應(yīng)通過加入5nL的2M磷酸二氬鈉以抑制GALNS活性而纟皮終止。加入約500U的來自米曲霉(Aspergillusoryzae)的P-半乳糖苷酶(Sigma,目錄號G5160)后,反應(yīng)混合物在37。C再培育1小時以釋放底物的熒光部分。第二反應(yīng)通過加入91QpL的終止溶液(1。/。甘氨酸,1%碳酸鈉,pH10.7)而被終止。所得混合物的熒光通過使用359nm的測量波長和445nm的參考波長,并以4-甲基傘形酮(鈉鹽,Sigma,目錄號M1S08)用作參考標(biāo)準(zhǔn)來測量。一個活性單位對應(yīng)每小時釋放的4-甲基傘形酮的nmole數(shù)量。免疫分析(ELISA)艾杜糖醛酸-2-;g危酸酯酶(I2S)96孔平底平板用在50nM碳酸氫鈉(pH9,6)中稀釋到10pg/mL的小鼠單克隆抗-I2S抗體于371C包被1小時,抗純化的、重組產(chǎn)生的全長人I2S多肽的小鼠單克隆抗-I2S抗體在與MaineBiotechnologyServices,Inc.(Portland,ME)的合同下應(yīng)用標(biāo)準(zhǔn)雜交瘤產(chǎn)生技術(shù)來制備。平板用含有0.1%Tween-20的IXPBS清洗3次和用清洗緩沖液中的2%BSA在37X:封閉1小時。含2%BSA的清洗緩沖液用于稀釋樣本和標(biāo)準(zhǔn)物。12S標(biāo)準(zhǔn)物被稀釋到100ng/mL至l.56ng/mL,并如此進行應(yīng)用。除去封閉緩沖液后,樣本和標(biāo)準(zhǔn)被施加到平板上,并在37'C培育1小時。將探測抗體,即綴合辣根過氧化物酶的小鼠抗-I2S抗體,在含2%BSA的清洗緩沖液中稀釋到0.15pg/mL。平板清洗3次,將探測抗體加至平板,并在37t:培育30分鐘。為使平板顯色,制備TMB底物(Bio-Rad,Hercules,CA)。平板清洗3次,將100jiL的底物加至每一孔中,并在37。C培育15分鐘。反應(yīng)用2N硫酸(100pL/孔)終止,和將平板在微量滴定平板讀取器上于450nm,并用655nm作為參考波長進行閱讀。N-乙酰半乳糖胺6-硫酸酯酶(GALNS)兩種小鼠單克隆抗-GALNS抗體提供了GALNSELISA的基礎(chǔ)??辜兓?、重組產(chǎn)生的全長人GALNS多肽的小鼠單克隆抗-GALNS抗體也在與MaineBiotechnologyServices,Inc.(Portland,ME)的合同下應(yīng)用標(biāo)準(zhǔn)雜交瘤產(chǎn)生技術(shù)來制備。為捕獲GALNS,第一抗體被用于在包被緩沖液(50mM碳酸氫鈉,pH9.6)中對F%MaxiSorpNunc-ImmunoPlate(NalgeNunc,目錄號442404)進行包被。在37r培育l小時和用清洗緩沖液清洗后,平板用封閉緩沖液(PBS,0.05%Tween-20,2%BSA)在37*€封閉1小時。然后將實驗和對照樣本與GALNS標(biāo)準(zhǔn)物一起裝載到平板上,并進一步在37C培育1小時。在用清洗緩沖液清洗后,抗體,即綴合HRP的探測抗體被加到封閉緩沖液中,之后在37X:培育30分鐘。再次清洗平板后,加入Bio-RadTMB底物試劑,并培育15分鐘。然后加入2N硫酸以終止反應(yīng),結(jié)果通過應(yīng)用MolecularDevice平板讀取器在450nm波長以分光光度測量法進行評分。討論FGE對硫酸酯酶活性的影響GALNS相對于對照水平觀察到大約50倍的總GALNS活性的增長(圖5)。此增長的活性的水平在全部三個培養(yǎng)基取樣時間點都被觀察到。此外,GALNS活性隨時間線性積累,在24和48小時之間具有4倍的增長,在48和72小時之間的時間點有2倍的增長,I2S雖然是更小的絕對數(shù)量級,但對于總I2S活性,也觀察到類似效應(yīng),其中相對于對照水平觀察到大約5倍的總I2S活性增長。此增長的活性的水平在實驗延續(xù)過程中維持不變。I2S活性在培養(yǎng)基中隨時間線性積累,類似于用GALNS所見到的結(jié)果(在24和48小時之間為2.3倍,在48和72小時之間為1.8倍).FGE對硫酸酯酶比活性的影響GALNSFGE在36F細(xì)胞中的表達以相對于對照水平的40-60倍增強了GALNS的表觀比活性(由ELISA測得的酶活性對總酶的比率)(圖6)。此比活性的增長在研究中的三個時間點都維持不變,并似乎在轉(zhuǎn)染后積累的三天中一直增長。I2S用12S見到類似效應(yīng),其中相對于對照值(O.5-0.7U/mg)觀察到比活性的6-7倍的增長(3-5U/mg)。GALNS(圖7)和I2S的ELISA值都沒有受到FGE的轉(zhuǎn)染的明顯影響。這表明FGE的表達沒有影響到參與硫酸酯酶產(chǎn)生的翻譯和分泌途徑??傊瑑煞N硫酸酯酶的所有這些結(jié)果表明,F(xiàn)GE表達在過表達GALNS和I2S的細(xì)胞系中顯著地增長了石克酸酯酶的比活性。FGE(SUMF1)和其它硫酸酯酶基因的共表達為測試FGE(SUMF1)在正常細(xì)胞中對另外的硫酸酯酶活性的效應(yīng),我們在共轉(zhuǎn)染或沒有共轉(zhuǎn)染FGE(SUMF1)cDNA的不同細(xì)胞系中過表達ARSA(SEQIDNO:14),ARSC(SEQIDNO:18)和ARSE(SEQIDNO:22)cDM,并測量硫酸酯酶活性。硫酸酯酶cDNA在Cos-7細(xì)胞中的過表達引起硫酸酯酶活性的適度增長,而當(dāng)硫酸酯酶基因和FGE(SUMF1)基因共表達時,觀察到驚人的協(xié)同性增長(20到50倍)。雖然更弱但類似的效應(yīng)在三種另外的細(xì)胞系即HepG2、LE293和U20S中被觀察到。多重硫酸酯酶cDNA的同時過表達引起每一種專一硫酸酯酶活性相對于單一硫酸酯酶過表達時更少的增長,表明存在不同硫酸酯酶對修飾機制的竟?fàn)?。為測試FGE(SUMF1)基因在進化過程中的功能保守性,我們在共轉(zhuǎn)染或沒有共轉(zhuǎn)染多種硫酸酯酶缺乏癥cDNA的多種細(xì)胞系中過表達ARSA、ARSC和ARSEcDNA,并測量硫酸酯酶活性。鼠和果蠅的FGE(SUMF1)基因?qū)θ咳N人硫酸酯酶都有活性,果蠅FGE(SUMF1)效率更低。這些數(shù)據(jù)證明FGE(SUMF1)在進化過程中的高度功能保守性,暗示了對細(xì)胞功能和生存的顯著的生物重要性。通過應(yīng)用FGE2(SUMF2)基因觀察到雖然弱得多但類似和一致的效應(yīng),暗示由此基因編碼的蛋白質(zhì)也具有硫酸酯酶修飾活性。這些數(shù)據(jù)證明FGE(SUMF1)所編碼的蛋白質(zhì)的數(shù)量是對硫酸酯酶活性的限制性因素,這是一個對于大規(guī)^t生產(chǎn)用于酶替代治療的活性硫酸酯酶具有重要暗示的發(fā)現(xiàn)。實施例4:遞過^^微勿應(yīng)介,時染g沐掙移時^雜i補4,定/神碗^凝雜凝乏癥詐炎^r時差西在應(yīng)用微細(xì)胞介導(dǎo)的染色體轉(zhuǎn)移以功能互補反式進行的單獨的實驗中,我們證實了多種硫酸酯酶缺乏癥中突變的基因是FGE。我們的發(fā)現(xiàn)提供了對于影響某一在關(guān)系較疏遠(yuǎn)的生物體中的整個蛋白質(zhì)家族的新生物機制的進一步見解。除了鑒別罕見遺傳病的分子基礎(chǔ)之外,我們的數(shù)據(jù)進一步證實了凡W基因產(chǎn)物對硫酸酯酶活性的有力的增強效應(yīng)。后一發(fā)現(xiàn)對于至少8種由硫酸酯酶缺乏引起的人類疾病的治療具有直接的臨床意義。染色體3p26的多種硫酸酯酶缺乏癥基因圖鐠為鑒別多種硫酸酯酶缺乏癥中突變的基因的染色體位置,我們嘗酶。含有單獨的用顯性可選擇標(biāo)記HyTK標(biāo)記的正常人染色體的一組人/小鼠雜交細(xì)胞系,被用作人染色體供體的來源,并與來自多種硫酸酯酶缺乏癥患者的永生化細(xì)胞系融合。所有22條人常染色體被一條條地轉(zhuǎn)移到患者細(xì)胞系,用潮霉素選出雜交體。在22個轉(zhuǎn)移實驗的每一個中,挑選出大約25個存活的克隆。這些克隆單獨生長,并進行采集以用于隨后的酶測試。對于大約440個(20x22)克隆的每一個,測試芳基硫酸酯酶A(ARSA)(SEQIDNO:15),芳基硫酸酯酶B(ARSB)(SEQIDNO:17)和芳基硫酸酯酶C(ARSC)(SEQIDNO:19)活性。此分析清晰地表明源自染色體3轉(zhuǎn)移的數(shù)個克隆的硫酸酯酶活性比其它所有克隆都顯著地高。當(dāng)分析源自染色體3轉(zhuǎn)移的每一單獨克隆的活性時,觀察到驚人的可變性。為核實是否每一克隆都具有來自供體細(xì)胞系的完整的人染色體3,我們應(yīng)用一組23個染色體3多態(tài)性遺傳標(biāo)記,它們沿染色體的長度均勻分布,并于先前基于在供體和患者細(xì)胞系之間具有不同等位基因而挑選出來。這允許我們檢測供體染色體的存在和鑒別由于偶然染色體斷裂而造成的特異區(qū)域可能的丟失。每一具有高酶活性的克隆保持了完整的來自供體細(xì)胞系的染色體3,然而根據(jù)來自供體細(xì)胞系的染色體3等位基因的缺失,低活性的克隆似乎已沒有了完整的染色體。后者的克隆很可能保持了含有可選擇標(biāo)記基因的供體染色體的小區(qū)域,這些標(biāo)記基因使得這些克隆能夠在含有潮霉素的培養(yǎng)基中存活。這些數(shù)據(jù)表明正常的人染色體3能對在多種硫酸酯酶缺乏癥患者細(xì)胞系中所觀察到的缺陷進行補充。為確定含有對于補充活性起著作用的基因的特異染色體區(qū)域,我們應(yīng)用被發(fā)現(xiàn)已丟失染色體的多個部分的Neo-標(biāo)記的染色體3雜交體。此外,我們進行了HyTK-標(biāo)記的人染色體3的經(jīng)輻射微細(xì)胞介導(dǎo)的染色體轉(zhuǎn)移。通過使用一組31個跨越整個染色體的多態(tài)性微衛(wèi)星標(biāo)記,對115個染色體3被輻射的雜交體進行硫酸酯酶活性測試和基因型的確定。顯示高酶活性的所有克隆似乎已保存了染色體3p26。應(yīng)用來自此區(qū)域的另外標(biāo)記的更高分辨率的分析繪制出了在標(biāo)記ZJ5^W0和/US7"7之間的補充基因的推定位置。多種硫酸酯酶缺乏癥中突變的基因的鑒別我們研究了來自涉及多種硫酸酯酶缺乏癥患者中的突變的3p26基因組區(qū)域的基因。每一包括拼接接點的外顯子進行PCR擴增,和通過直接測序進行分析。突變分析在12位不相關(guān)的被影響的個體中完成;5位是前述的MSD患者,而7位是未發(fā)表的病例。從我們的多種硫酸酯酶缺乏癥群體中,在已表達序列標(biāo)志(EST)AK075459(SEQIDNOs:4,5)中鑒定了數(shù)個突變,該已表達序列標(biāo)志對應(yīng)于未知功能的基因,這強烈暗示了這是涉及多種硫酸酯酶缺乏癥的基因。發(fā)現(xiàn)每一個突變在IOO個對照個體中不存在,因此排除了序列多態(tài)性的存在。另外的確證性突變分析是對于反轉(zhuǎn)錄的患者RNA來進行的,特別是在基因組DNA分析顯示突變存在于拼接位點或其附近而有可能影響拼接的那些情況下。移碼、無義、拼接和錯義突變也被鑒別,暗示此病由于功能機制的喪失而引起,正如對隱性疾病所預(yù)言的。這也與以下的觀察相一致,即幾乎所有的錯義突變影響在整個進化中高度保守的氨基酸(參見下面)。<table>tableseeoriginaldocumentpage109</column></row><table>在每一位被測試的多種石克酸酯酶缺乏癥患者中鑒定突變,因此排除了座位點異質(zhì)性。在所鑒定的突變的類型和患者中所報道的表型的嚴(yán)重程度之間沒有觀察到明顯的相關(guān)性,暗示臨床上的可變性不是由等位基因異質(zhì)性引起的。在三種情況下,發(fā)現(xiàn)不同患者(表6中的病例1和4,病例6和9,和病例11和12)攜帶相同突變。這些患者中的兩位(病例11和12)來自Sicily中的同一城鎮(zhèn),這暗示單元型分析(haplotypeanalysis)所真正確證的建立者效應(yīng)的存在。令人驚訝的是,發(fā)現(xiàn)大多數(shù)患者是雙重雜合子,攜帶不同的等位突變,而只有一小部分是純合子。雖然與父母所報告的不存在近親關(guān)系相一致,但這是關(guān)于非常罕見的隱性疾病例如多種硫酸酯酶缺乏癥的無法預(yù)料的發(fā)現(xiàn)。FGE基因和蛋白質(zhì)人FGE(也在本文中可互換性地用作SUMFl)cDM(SEQIDNO:1)的共有cDNA序列組裝自數(shù)個已表達序列標(biāo)志(EST)克隆,并部分組裝自對應(yīng)的基因組序列。此基因包含9個外顯子,并跨越大約105kb(參見實施例1)。序列比較也鑒別了位于人染色體7上的FGE基因平行進化同源物的存在,我們將其指定為FGE2(也在本文中可互換性地用作SUMF2)(SEQIDN0s:45,46)。硫酸酯酶缺乏的功能補充來自兩位多種硫酸酯酶缺乏癥患者(表8中的病例1和12,在他們中我們鑒別了FGE(SUMF1)基因的突變(細(xì)胞系BA426和BA920))的成纖維細(xì)胞用含有FGE(SUMF1)cDNA的野生型和兩個突變形式(R327X和Aex3)的HSV病毒感染。ARSA、ARSB和ARSC活性在感染后72小時進行測試。野生型FGE(SUMF1)cDM的表達導(dǎo)致全部三種活性的功能補充,而突變體FGE(SUMF1)cDNA則沒有(表9)。這些數(shù)據(jù)提供了對鑒別FGE(SUMF1)作為多種硫酸酯酶缺乏癥基因的決定性的證據(jù),且它們證明了患者中發(fā)現(xiàn)的突變的相關(guān)性。疾病相關(guān)的突變引起硫酸酯酶缺乏,因此證明FGE(SUMF1)是硫酸酯酶活性的必需因素。表9:硫酸酯酶缺乏的功能補充受體MSD細(xì)胞系構(gòu)建體ARSA(1)ARSB(1)ARSC(1)BA426HSV擴增子24.022.50.15SUMF1-Aex342.023.80.29SUMF1-R327X33.624.20.16SUMF1119.5(4.9x)37.8(1.7x)0.62(4.1x)BA920HSV擴增子16.611.30.15SUMF1-Aex317.214.40.07SUMF1-R327X36.013.50.13S函F166.5(4.0x)21.6(1.9x)0.42(2.8x)對照范圍123.7-394.650.6-60.71.80-1.58(1)所有酶活性均以釋放的4-曱基傘形酮的關(guān)ole數(shù)'mg蛋白質(zhì)—3hrs表示多種硫酸酯酶缺乏癥細(xì)胞系BA426和BA920單獨用HSV擴增子感染,和用攜帶突變體或野生型SUMF1cDNA的的構(gòu)建體感染,在用野生型SUMF1基因感染的成纖維細(xì)胞中的單一的芳基硫酸酯酶活性,相對于只用栽體感染的細(xì)胞的活性的增加在括號中指出。標(biāo)明了在未感染的對照成纖維細(xì)胞中測得的活性。多種硫酸酯酶缺乏癥的分子基礎(chǔ)基于這樣的假設(shè)即疾病基因應(yīng)能補償患者細(xì)胞系中的酶缺乏,我們完成了微細(xì)胞介導(dǎo)的染色體轉(zhuǎn)移,轉(zhuǎn)移到來自多種硫酸酯酶缺乏癥患者的永生化的細(xì)胞系。此技術(shù)已成功用于其預(yù)期功能能在細(xì)胞系中評估(例如通過測量酶活性或通過探測形態(tài)學(xué)特征)的基因的鑒別.為說明酶活性隨機變化性的問題,我們在互補分析中測量了三種不同硫酸酯酶(ARSA,ARSB和ARSC)的活性。染色體轉(zhuǎn)移的結(jié)果清晰地指明了補充性基因在染色體3上的位置。亞區(qū)域的圖譜繪制通過產(chǎn)生染色體3的放射雜合組而實現(xiàn)。單獨的雜交體克隆同時在基因組水平(通過在供體和受體細(xì)胞系之間顯示不同等位基因的31個微衛(wèi)星標(biāo)記的分型)和功能水平(通過測試硫酸酯酶活性)被表征。對130個這類雜交體的分析導(dǎo)致對染色體3p26補充區(qū)域的圖i脊繪制。一旦關(guān)鍵的基因組區(qū)域被確定,F(xiàn)GE(SUMF1)基因也通過患者DNA中的突變分析而鑒別。突變在所有測試患者中被發(fā)現(xiàn),顯示出單一基因涉及多種硫酸酯酶缺乏癥。所發(fā)現(xiàn)的突變是不同的類型,其中的主要部分(例如拼接位點,起始位點,無義,移碼)估計會導(dǎo)致所編碼蛋白質(zhì)的功能喪失,如對隱性疾病所預(yù)計的。大多數(shù)錯義突變影響對應(yīng)于進化過程中高度保守的氨基酸的密碼子,暗示這些突變也導(dǎo)致功能的喪失。在突變類型和表現(xiàn)型的嚴(yán)重程度之間沒有相關(guān)性,表明后者是由于不相關(guān)的因素造成的。對于罕見的遺傳疾病出乎意料的是,許多患者被發(fā)現(xiàn)是雜合子,攜帶兩種不同的突變。然而,對源自Sicily中的一個小城鎮(zhèn)的一個突變的奠基者效應(yīng)被鑒別。FGE(SUMF1)基因功能對FGE(SUMF1)基因作為"互補因子"的鑒別,通過插入病毒栽體中的外源性FGE(SUMF1)cDNA在兩種不同患者細(xì)胞系的表達挽救了四種不同硫酸酯酶的酶性缺乏這一點而肯定地被證明。在每一病例中,所有硫酸酯酶活性的一致的和部分的(相對于以空載體轉(zhuǎn)染的對照患者細(xì)胞系的)恢復(fù)被觀察到。平均地,酶活性的增加范圍在1.7到4.9倍之間,達到在正常細(xì)胞系中所觀察到的大約一半的水平。酶活性與在每一實驗中所用的病毒顆粒的數(shù)目相關(guān),也與(通過標(biāo)記蛋白質(zhì)(GFP)分析所測試的)感染效率相關(guān)。在相同實驗中,含有攜帶在患者中發(fā)現(xiàn)的兩種突變(R327X和Aex3)的FGE(SUMF1)cDNA的載體被應(yīng)用,而沒有顯著的酶活性增加被觀察到,因此證明這些突變的功能相關(guān)性。如本文中其它部分所提到的,Schmidt等首先發(fā)現(xiàn)硫酸酯酶經(jīng)歷高度保守的半胱氨酸到Ca-甲酰甘氨酸的翻譯后修飾,其被發(fā)現(xiàn)位于大多數(shù)硫酸酯酶的活性位點。它們也顯示出,此修飾在多種硫酸酯酶缺乏癥中有缺陷(Schmidt,B.等,CW/,1995,82:271-278)。我們的突變性和功能性的數(shù)據(jù)為以下這點提供了有力的證據(jù),即FGE(SUMF1)對此修飾負(fù)責(zé)。FGE(SUMF1)基因在所有被分析的遠(yuǎn)距離相關(guān)物種(從細(xì)菌到人)中顯示非常高程度的序列保守性。我們提供了證據(jù),即人FGE(UMF1)基因的果蠅同源物能激活過表達的人硫酸酯酶,證明所觀察的遠(yuǎn)距離相關(guān)物種的FGE(SUMF1)基因的高水平的序列類似性與驚人的功能保守性相關(guān)。值得注意的例外是酵母,其似乎缺失了FGE(SUMF1)基因以及任何的硫酸酯酶編碼基因,說明硫酸酯酶功能不為此生物所需,也暗示對FGE(SUMF1)和硫酸酯酶基因的進化的互惠性影響的存在。有趣的是,在所有被分析的脊推動物包括人的基因組中存在兩個同源性的基因FGE(SUMF1)和FGE2(SUMF2)。如系統(tǒng)發(fā)生樹上明顯的,F(xiàn)GE2(SUMF2)基因似乎已獨立地從FGE(SUMF1)基因進化。在我們的分析中,F(xiàn)GE2(SUMF2)基因也能激活硫酸酯酶,然而它以相對于FGE(SUMF1)基因效率低很多的方式完成。這可解釋在多種硫酸酯酶缺乏癥患者中發(fā)現(xiàn)的殘余硫酸酯酶活性,并暗示完全的硫酸酯酶缺乏將是致命的。此時,我們不能排除FGE2(SUMF2)基因具有另外而仍然未知的功能的可能性。在因硫酸酯酶缺乏導(dǎo)致的疾病的治療方面的影響相對于只過表達單一硫酸酯酶的細(xì)胞,硫酸酯酶活性的強增長(高至50倍)在FGE(SUMF1)cDM與ARSA,ARSC或者ARSEcDNAs—起過表達的細(xì)胞中被觀察到。在所有細(xì)胞系中,顯著的協(xié)同效應(yīng)被發(fā)現(xiàn),表明FGE(SUMF1)是硫酸酯酶活性的限制性因子。然而,可變性在不同硫酸酯酶中被觀察到,可能是由于FGE(SUMFl)-編碼蛋白質(zhì)與多種》琉酸酯酶的不同親和性??勺冃砸苍诳赡芫哂袃?nèi)源性曱酰甘氨酸生成酶的不同水平的不同細(xì)胞系之間觀察到。與這些觀察相一致,我們發(fā)現(xiàn)多種硫酸酯酶缺乏癥基因的表達在不同組織間變化,在腎和肝中具有顯著的高水平。這可具有重要的意義,因為具有FGE(SUMF1)基因低表達水平的組織不太能夠有效修飾外源性遞送的硫酸酯酶蛋白質(zhì)(參見下面)。這些數(shù)據(jù)合在一起暗示著FGE(SUMF1)基因的功能已進化到實現(xiàn)雙重調(diào)節(jié)系統(tǒng),每一硫酸酯酶被兩個機制同時控制,一個是負(fù)責(zé)每一結(jié)構(gòu)性硫酸酯酶基因的mRNA水平的單獨機制,一個是所有硫酸酯酶共享的普遍機制。此外,F(xiàn)GE2(SUMF2)提供了對硫酸酯酶修飾的部分冗余。這些數(shù)據(jù)對將在酶替換治療中應(yīng)用的活性硫酸酯酶的大量生產(chǎn)具有深遠(yuǎn)的意義。酶替換研究已在硫酸酯酶缺乏的動物模型上報道,例如,粘多糖病VI的貓科動物模型,并被證明是在防止和治愈數(shù)個癥狀中有效。針對兩種源于硫酸酯酶缺乏的先天疾病MPSII(Hunter綜合癥)和MPSVI(Maroteaux-Lamy綜合癥)的人的治療性試驗?zāi)壳罢谶M行,并將很快擴展到大量的患者。實施例5:以FM-激活^6^#^對#0/"^2'0病#/^時凝脊^^法Morquio患者中主要的骨病理學(xué)原因是硫酸角質(zhì)素(KS)在骺盤(生長平板)軟骨細(xì)胞中因缺乏溶酶體硫酸酯酶(GALNS)而積累。體內(nèi)研究的基本目標(biāo)是確定是否靜脈內(nèi)(IV)施用的凡W-教承^GALNS能滲透生長平板的軟骨細(xì)胞以及其它正常小鼠中的合適的細(xì)胞類型。盡管一般缺乏骨畸形,GALNS缺乏的小鼠模型(MorquioKnock-In-MKI,S.To歸tsu,St.LouisUniversity,MO)也被用于證明重復(fù)施用的激活的GALNS的體內(nèi)生化活性。小鼠模型中的骨病理的缺乏反映了這樣的事實,即骨KS在嚙齒動物中或劇烈減少或者缺乏(VennG,&MasonRM.,5/oc力e邁/.,1985,228:443-450)。然而,這些小鼠的確顯示了GAG和其它細(xì)胞異常在多種器官和組織中的可探測的積累。因此,研究的總體目標(biāo)是證明凡^-邀活時GALNS滲透進了生長平板(生物分布研究)和顯示涉及積累的GAG在受影響組織中的清除的功能性GALNS酶活性(藥物動力學(xué)研究)。這些研究的結(jié)果證明IV注射的尸C五-激活時GALNS被生長平板的軟骨細(xì)胞內(nèi)化,雖然相對于其它組織是相對較低的水平。此外,凡W-凝承^GALNS在MKI小鼠中持續(xù)16周的注射有效清除了積累的GAG,也減少了在所有被檢測的軟組織中溶酶體生物標(biāo)記染色??傊瑢嶒灣晒ψC明了GALNS到生長平板軟骨細(xì)胞的轉(zhuǎn)運,也證明了關(guān)于GAG在多種組織中的清除方面的生化活性。生物分布研究四周大的ICR(正常)小鼠被給予單次5mg/kg尸M-激承WGALNS的IV注射。肝,股骨,心臟,腎和脾在注射后兩小時被收集,并為組織學(xué)檢測作準(zhǔn)備。抗-人GALNS的單克隆抗體被用于探測注射的GALNS在多種組織中的存在。與載體對照相比,GALNS在所有被檢測的組織中被探測。此外,應(yīng)用辣根過氧化物酶報告系統(tǒng),GALNS很容易地在所有被檢測的組織中被觀察到,但骨例外。對GALNS在生長平板中吸收的證明需要更靈敏的熒光素-異硫氰酸酯(FITC)報告系統(tǒng)的應(yīng)用,說明了雖然GALNS滲透進生長平板,但相對于軟組織的細(xì)胞,它不那么容易滲透至生長平板軟骨細(xì)胞。盡管需要更靈敏的熒光探測方法,與栽體對照相比,GALNS到骨生長平板軟骨細(xì)胞的轉(zhuǎn)運在所有被檢測的生長平板切片中被觀察到。MKI小鼠中的藥物動力學(xué)研究四周大的MKI或野生型小鼠每周性地被給予IV注射(每組n=8)直到20周齡。每一次每周性的注射由2mg/kg尸M-淡承^GALNS或者載體對照(對野生型小鼠沒有注射)所組成。所有小鼠在20周齡時被殺死用于組織學(xué)檢測,并用下面的方法染色蘇木精和曙紅用于細(xì)胞形態(tài)學(xué),愛茜藍(lán)用于GAG的探測。積累的GAG的清除通過在所有被檢測的軟組織(肝、心臟、腎和脾)中減少的或缺乏的愛茜藍(lán)染色而證明。這只在GALNS注射的小鼠中被觀察到,雖然MKI小鼠中的生長平板如正常骨形態(tài)學(xué)所證實的是正常發(fā)揮功能,但存在被觀察到的更細(xì)微的細(xì)胞異常(包括沒有明顯病理效應(yīng)的軟骨細(xì)胞空泡化)。生長平板肥大和增生區(qū)域的空泡化的軟骨細(xì)胞沒有受GALNS施用影響。這與生長平板的鈣化區(qū)中的軟骨細(xì)胞相反,在那種情形中,空泡化的減弱在GALNS注射的小鼠中被觀察到。一般地,由于已知的KS在小鼠的生長平板中的缺乏,軟骨細(xì)胞的空泡化和推測的非-KSGAG在MKI小鼠的生長平板中的積累是令人驚訝和出乎意料的。這些特別的觀察結(jié)果很可能反映了這樣的事實,即在敲入(knock-in)小鼠中,存在突變體GALNS的高水平(與敲除小鼠相反,其中不存在殘余的突變體GALNS,不存在生長平板軟骨細(xì)胞空泡化,也不存在GAG積累--TomatsuS.等,〃咖a/3#o/eci//arCe/e〃c^,2003,12:3349-3358)。生長平板中的空泡化現(xiàn)象也許表明對表達突變體GALNS的細(xì)胞的亞類的第二效應(yīng)。但是,持續(xù)16周的酶注射有力證明了多種組織的凡W-激承時GALNS運送和體內(nèi)酶活性的事實。附圖詳述圖1:P23在來自牛睪丸微粒體的可溶性抽提物缺乏(A)或存在(B)條件下培育后的MALDI-TOF質(zhì)譜6pmol的P23在標(biāo)準(zhǔn)條件下37'C培育10分鐘,其中缺乏或存在ljtl的微粒體抽提物。按實驗程序所述為MALDI-TOF質(zhì)語制備樣本。P23(2526.28)和其FGly衍生物(2508.29)的單種同位素質(zhì)量MIT被指出。圖2:源自人FGE和PFAM-DUF323種子的21種蛋白質(zhì)的比對的系統(tǒng)發(fā)生樹分支處的數(shù)目指出了系統(tǒng)發(fā)生距離。蛋白質(zhì)通過它們的TrEMBLID數(shù)目和物種名稱被指定。hFGE-人FGE。右上部系統(tǒng)發(fā)生距離的標(biāo)尺。星號表示基因已進一步地被研究。頂部的7種基因是FGE基因家族的部圖3:人和鼠FGE基因位點的組織外顯子被顯示成以暗盒(人位點)和亮盒(鼠位點)來按比例表示。右下方角落的橫桿顯示標(biāo)尺。外顯子之間的線顯示內(nèi)含子(沒有按比例)。內(nèi)含子線上的數(shù)字表示以kb表示的內(nèi)含子的大小。圖4:顯示FGE表達質(zhì)粒pXMG.1.3圖鐠的圖圖5:描述在以FGE表達質(zhì)粒瞬時轉(zhuǎn)染的36F細(xì)胞中的N-乙酰半乳糖胺6-硫酸酯酶活性的柱狀圖在不含氨甲蝶呤(MTX)的培養(yǎng)基中以帶有反向的FGEcDNA的對照質(zhì)粒pXMG.1.2,或者FGE表達質(zhì)粒pXMG.1.3轉(zhuǎn)染細(xì)胞。24小時后,細(xì)胞被含有1.0pMMTX的培養(yǎng)基再培養(yǎng)。再培養(yǎng)24,48和72小時后,采集培養(yǎng)基并收集細(xì)胞。N-乙酰半乳糖胺6-硫酸酯酶活性通過活性分析被測定。顯示的每一值是兩次分別轉(zhuǎn)染的平均值,標(biāo)準(zhǔn)方差以誤差標(biāo)尺指出。圖6:描述在以FGE表達質(zhì)粒瞬時轉(zhuǎn)染的36F細(xì)胞中的N-乙酰半乳糖胺6-硫酸酯酶比活性的柱狀圖在不含氨甲蝶呤(MTX)的培養(yǎng)基中以帶有反向的FGEcDNA的對照質(zhì)粒pXMG.1.2,或者FGE表達質(zhì)粒pXMG.1.3轉(zhuǎn)染細(xì)胞。24小時后,細(xì)胞被含有1.0nMMTX的培養(yǎng)基再培養(yǎng)。再培養(yǎng)24,48和72小時后,采集培養(yǎng)基并收集細(xì)胞。N-乙酰半乳糖胺6-硫酸酯酶比活性通過活性分析和ELISA被測定,并以N-乙酰半乳糖胺6-硫酸酯酶活性/每亳克ELISA-反應(yīng)性的N-乙酰半乳糖胺6-硫酸酯酶的比率表示。每個顯示的值是兩次分別轉(zhuǎn)染的平均值。圖7:描述在以FGB表達質(zhì)粒瞬時轉(zhuǎn)染的36F細(xì)胞中的N-乙酰半乳糖胺6-硫酸酯酶的產(chǎn)生的柱狀圖在不含氨甲蝶呤(MTX)的培養(yǎng)基中以帶有反向的FGEcDNA的對照質(zhì)粒pXMG.1.2,或者FGE表達質(zhì)粒pXMG.1.3轉(zhuǎn)染細(xì)胞。24小時后,細(xì)胞被含有1.0MTX的培養(yǎng)基再培養(yǎng)。再培養(yǎng)24,48和72小時后,采集培養(yǎng)基并收集細(xì)胞。N-乙酰半乳糖胺6-硫酸酯酶總蛋白通過ELISA測定。顯示的每一值是兩次分別轉(zhuǎn)染的平均值,標(biāo)準(zhǔn)方差以誤差標(biāo)尺指出。圖8:描述在以FGE表達質(zhì)粒瞬時轉(zhuǎn)染的30C6細(xì)胞中的艾杜糖醛酸-2-硫酸酯酶活性在不含氨甲蝶呤(MTX)的培養(yǎng)基中以帶有反向的FGEcDNA的對照質(zhì)粒pXMG.1.2,或者FGE表達質(zhì)粒pXMG.1.3轉(zhuǎn)染細(xì)胞。24小時后,細(xì)胞被含有1.0jliMMTX的培養(yǎng)基再培養(yǎng)。再培養(yǎng)24,48和72小時后,采集培養(yǎng)基并收集細(xì)胞。艾杜糖醛酸-2-硫酸酯酶活性通過活性分析測定。顯示的每一值是兩次分別轉(zhuǎn)染的平均值。圖9:描述體現(xiàn)本發(fā)明特征的試劑盒本文中公開的所有參考文獻都以全文被整合而作為參考。權(quán)利要求出現(xiàn)在下面,并在其后給出序列表。序列表〈110〉TranskaryoticTherapies,Inc.vonFigura,KurtSchmidt,BernhardDierks,ThomasHeartlein,MichaelW.Cosma,MariaP.Ballabio,Andrea<120〉使用甲酰-甘氨酸生成酶(FGE)對多種硫酸酶缺乏癥和其它病癥進行診斷和治療<130>0403W0<150〉US60/447,747<151〉2003-02-11<160>95<170>Patentlnversion3.2<210>1<211〉1180<212〉DNA<213>智人<220〉<221〉CDS<222>(20)..(1141)<223〉FGEcDNA<400〉1acatggcccgcgggacaacatggetgcgcccgcaetagggctggtgtgtgga52MetAlaAlaProAlaUuGlyLeuValCysGly1510cgttgccctgagctgggtetcgtcetcUgctgctgctgetctegctg100ArgCysProGluLeuGlyLeuValLeuLeuLeuLeuLeuLeuSerLeu152025ctgtgtggagcggcagggagecaggaggecgggaccggtgcgggcgcg148LeuCysGlyAlaAlaGlySerGinGluAlaGlyThrGlyAlaGlyAla303540gggteccttgcgggttcttgcggctgcggcacgccccageggcctggc196GlySerLeuAlaGlySerCysGlyCysGlyThrProGinArgProGly455055gcccatggcagtteggcagccgetcaccgatactegegggaggetaac244AlaHisGlySerSerAlaAlaAlaHisArgTyrSerArgGluAlaAsn60657075getccgggccc.cgtacccggagageggcaaetcgcgcacteaaagatg292AlaProGlyProValProGlyGluArgGinLeuAlaHisSerLysMet808590gtccccatecctgetggagtatttacaatgggcacagatgatcctcag340ValProlieProAlaGlyValPheThrMetGlyThrAspAspProGin95100105ataaagcaggatggggaagcacctgcgaggagagttactattgatgcc388lieLysGinAspGlyGluAlaPro'AlaArgArgValThrlieAspAla110115120ttttacatggatgcctatgaagtcagtaatactgaatttgagaagttt436PheTyrMetAspAlaTyrGluValSerAsnThrGluPheGluLysPhe125130135gtgaacteaactggctatttgacagaggetgagaagtttggcgactec484ValAsnSerThrGlyTyrLeuThrGluAlaGluLysPheGlyAspSer140145150'155tttgtctttgaaggcatgttgagtgagcaagtgaagaccaatattcaa532PheValPheGluGlyMetLeuSerGluGinValLysThrAsnlieGin160165170caggcagttgcagetgetccctggtggUacctgtgaaaggcgetaac580GinAlaValAlaAlaAlaProTrpTrpLeuProValLysGlyAlaAsn175180185tggagacacccagaagggcctgactctactattctgcacaggccggat628TrpArgHisProGluGlyProAspSerThrlieLeuHisArgProAsp190195200catccagttetccatgtgtectggaatgatgcggttgcctactgcact676HisProValLeuHisValSerTrpAsnAspAlaValAlaTyrCysThr205210215tgggcagggaageggctgcccacggaagetgagtgggaatacagetgt724TrpAlaGlyLysArgLeuProThrGluAlaGluT卬GluTyrSerCys220225230235cgaggaggcctgcataatagacttttcccctggggcaacaaactgcag772ArgGlyGlyLeuHisAsnArgLeuPheProTrpGlyAsnLysGin240245250ccca犯ggccagcattatgccaacatttggcagggcgagtttccggtg820ProLysGlyGinHisTyrAlaAsnlieTrpGinGlyGluPheProVal255260265accaacactggtgaggatggcttccaaggaactgcgcctgttgatgcc868ThrAsnThrGlyGluAspGlyPheGinGlyThrAlaProValAspAla270275280ttccctcccaatggttatggcttatacaacatagtggggaacgcatgg916PheProProAsnGlyTyrGlyLeuTyrAsnlieValGlyAsnAlaTrp285290295gaatggactteagactggtggactgttcatcattctgttgaagaaacg964GluTrpThrSer*AspTrpTrpThrValHisHisSerValGluGluThr300305310315cttaacccaaaaggtcccccttctgggaaagaccgagtgaagaaaggt1012LeuAsnProLysGlyProProSerGlyLysAspArgValLysLysGly320325330ggatectacatgtgccataggtcttattgttacaggtatcgctgtget1060GlySerTyrMetCysHisArgSerTyrCysTyrArgTyrArgCysAla335340345geteggagecagaacacacctgatagetctgettegaatctgggattc1108AlaArgSerGinAsnThrProAspSerSerAlaSerAsnLeuGlyPhe350355360cgctgtgcagccgaccgcctgcccaccatggactgacaaccaag.ggtagtctt1161ArgCysAlaAlaAspArgLeuProThrMetAsp365370ccccagtccaaggagcagt1180<210>2<211>374<212>PKT〈213〉智人<400>2MetAlaAlaProAlaLeuGlyLeuValCysGlyArgCysProGluLeu151015GlyLeuValLeuLeuLeuLeuLeuLeuSerLeuLeuCysGlyAlaAla202530GlySerGinGluAlaGlyThrGlyAlaGlyAlaGlySerLeuAlaGly354045SerCysGlyCysGlyThrProGinArgProGlyAlaHisGlySerSer505560AlaAlaAlaHisArgTyrSerArgGluAlaAsnAlaProGlyProVal65707580ProGlyGluArgGinLeuAlaHisSerLysMetValProlieProAla859095GlyValPheThrMetGlyThrAspAspProGinlieLysGinAspGly100105110GluAlaProAlaArgArgValThrlieAspAlaPheTyrMetAspAla115120125TyrGluValSerAsnThrGluPheGluLysPheValAsnSerThrGly130135140TyrLeuThrGluAlaGluLysPheGlyAspSerPheValPheGluGly145150155160MetLeuSerGluGinValLysThrAsnlieGinGinAlaValAlaAla165170175AlaProTfpTrpLeuProValLysGlyAlaAsnTrpArgHisProGlu180185190GlyProAspSerThrlieLeuHisArgProAspHisProValLeuHis195200205ValSerT卬AsnAspAlaValAlaTyrCysThrTrpAlaGlyLysArg210215220LeuProThrGluAlaGluTrpGluTyrSerCysArgGlyGlyLeuHis225230235240AsnArgLeuPheProTrpGlyAsnLysLeuGinProLysGlyGinHis245250255TyrAlaAsnlieT卬GinGlyGluPheProValThrAsnThrGlyGlu260265270AspGlyPheGinGlyThrAlaProValAspAlaPheProProAsnGly275280285TyrGlyLeuTyrAsnlieValGlyAsnAlaTrpGluTrpThrSerAsp290295300TrpTrpThrValHisHisSerValGluGluThrLeuAsnProLysGly305310315320ProProSerGlyLysAspArgValLysLysGlyGlySerTyrMetCys<formula>formulaseeoriginaldocumentpage124</formula>giataigacttttcccctggggcaacaaactgcagccc犯3ggccagcattatgccaacatt780tggcagggcgagtttccggtgaccaacactggtgaggatggcttccaaggaactgcgcct840gttgatgccttccctcccaatggttatggcttatacaacatagtggggaacgcatgggaa900tggacttcagactggtggactgttcatcattctgttgaaga犯cgcttaacccaaaaggt960cccccttctgggaaagaccgagtgaagaaaggtggatcctacatgtgccataggtcttat1020tgttacaggtatcgctgtgctgctcggagccagaacacacctgatagctctgcttcgaat1080ctgggattccgctgtgcagccgaccgcctgcccaccatggac1122<210〉4<211>2130<212〉DNA<213〉智人<400〉4acatggcccgcgggacaacatggctgcgcccgcactagggctggtgtgtggacgttgccc60tgagctgggtctxgtcctcttgctgctgctgctctcgctgctgtgtggagcggcagggag120ccaggaggccgggaccggtgcgggcgcggggtcccttgcgggttcttgcggctgcggcac180gccccagcggcctggcgcccatggcagttcggcagccgctcaccgatactcgcgggaggc240taacgctccgggccccgtacccggagagcggcaactcgcgcactcaaagatggtccccat300ccctgctggagtatttacaatgggcac卿tgatcctcagataaagcaggatggggaagc360acctgcgaggagagttactaUgatgccctttacatggatgcctatgaagtcagt組ac420tg組ttgagaagtttgtgaactcaactggctatttgacagaggctg柳agtttggcga棚ctcctttgtctttgaaggcatgttgagtgagc卿tgaagaccaatattcaacaggcagt540tgcagctgctccctggtggttacctgtgaaaggcgctaactggagacacccagaagggcc600tgactctactattctgcaicaggccggatcatccagttctccatgtgtcctggaatgstgc,ggttgcctactgcacttgggcagggaagcggctgcccacggaagctgagtgggaatacag720ctgtcgaggaggcctgcataatagacttttcccctggggcaacaaactgcagcccaaagg780ccagcattatgcc幼catttggcagggcgattttccggtgacc犯cactggtgaggatgg840cttccaaggaactgcgcctgttgatgccttccctcccaatggttatggcttatacaacat900agtggggaacgcatgggaatggacttcagactggtggactgttcatcattctgttgaagei960aacgcttaacccaaaaggtcccccttctgggaaagaccgagtgaagaaaggtggatccta1020catgtgccataggtcttattgttacaggtatcgctgtgctgctcggagccagaacacacc1080tgatagctctgcttcgaatctgggattccgctgtgcagccgaccgcctgcccaccatgga1140ctgacaaccaagggtagtcttccccagtccaaggagcagtcgtgtctgacctacattggg1200ctttcctcagaactttgaacgatcccatgcaaagaattcccaccctgaggtgggttacat1260acctgcccaatggccaaaggaaccgccttgtgagaccaaattgctgacctgggtcagtgc1320atgtgctttatggtgtggtgcatctttggagatcatcaccatattttacttttg卿gtc1380tttaa卿ggaaggggagtggagggaaccctgagctaggcttcaggaggcccgcatccta1440cgcaggctctgccacaggggttagaccccaggtccgacgcttgaccttcctgggcctcaa1500gtgccctcccctatcaaatgaaggaatggacagcatgacctctgggtgtctctccaactc1560accagttctaaaaagggtatcagattctattgtgacttcatagaatttatgatagattat1620tttttagctattttttccatgtgtgaaccttgagtgatactaatcatgtaaagtaagagt1680tctcttatgtattatgttcggaagaggggtgtggtgactcctttatattcgtactgcact1740ttgtttttcc犯gg犯atcagtgtcttttacgttgttatgatgaatcccacatggggccg1800gtgatggtatgctgaagttcagccgttg犯cacatagg犯tgtctgtggggtgactctac1860tgtgctttatcttttaacattaagtgcctttggttcagaggggcagtcataagctctgtt1920tccccctctccccaaagccttcagcgaacgtgaaatgtgcgctaaacggggaaacctgtt1980taattctagatatagggaaaaaggaacgaggaccttgaatgagctatattcagggtatcc2040ggtattttgtaatagggaataggaaaccttgttggctgtggaatatccgatgctttgaat2100catgcactgtgttgaataaacgtatctgct2130<210>5<211>374<212〉PRT<213>智人<400>5MetAlaAlaProAlaLeuGlyLeuValCysGlyArgCysProGluLeu151015GlyLeuValLeuLeuLeuLeuLeuLeuSerLeuLeuCysGlyAlaAla202530GlySerGinGluAlaGlyThrGlyAlaGlyAlaGlySerLeuAlaGly354045SerCysGlyCysGlyThrProGinArgProGlyAlaHisGlySerSer505560AlaAlaAlaHisArgTyrSerArgGluAlaAsnAlaProGlyProVal65707580ProGlyGluArgGinLeuAlaHisSerLysMetValProlieProAla859095GlyValPheThrMetGlyThrAspAspProGinlieLysGinAspGly100105110GluAlaProAlaArgArgValThrlieAspAlaLeuTyrMetAspAla115120125TyrGluValSerAsnThrGluPheGluLysPheValAsnSerThrGly130135140TyrLeuThrGluAlaGluLysPheGlyAspSerPheValPheGluGly145150155160MetLeuSerGluGinValLysThrAsnlieGinGinAlaValAlaAla165170175AlaProTrpTrpLeuProValLysGlyAlaAsnT卬ArgHisProGlu.180185190GlyProAspSerThrlieLeuHisArgProAspHisProValLeuHis195200205ValSerT卬AsnAspAlaValAlaTyrCys.ThrT卬AlaGlyLysArg210215220LeuProThrGluAlaGluTrpGluTyrSerCysArgGlyGlyLeuHis225230235240AsnArgLeuPheProTrpGlyAsnLysLeuGinProLysGlyGinHis245250255TyrAlaAsnlieTrpGinGlyAspPheProValThrAsnThrGlyGlu260265270AspGlyPheGinGlyThrAlaProValAspAlaPheProProAsnGly275280285TyrGlyLeuTyrAsnlieValGlyAsnAlaTrpGluTrpThrSerAsp290295300TrpTrpThrValHisHisSerValGluGluThrLeuAsnProLysGly305310315320ProProSerGlyLysAspArgValLysLysGlyGlySerTyrMetCys325330335HisArgSerTyrCysTyrArgTyrArgCysAlaAlaArgSerGinAsn340345350ThrProAspSerSerAla'SerAsnLeuGlyPheArgCysAlaAlaAsp355360365ArgLeuProThrMetAsp370<210>6<211>2297<212〉畫<213>智人<400〉6cggctgtgttgcgcagtcttcatgggttcccgacgaggaggtctctgtggctgcggcggc60tgctaactgcgccacctgctgcagcctgtccccgccgctctga3gcggccgcgtcgaagc120cgaaatgccgccaccccggaccggccgaggccttctctggctgggtctggttctgagctc180cgtctgcgtcgccctcggatccgaaacgcaggccaactcgaccacagatgctctgaacgt240tcttctcatcatcgtggatgacctgcgcccctccctgggctgttatggggataagctggt300gaggtccccaaatattgaccaactggcatcccacagcctcctcttccagaatgcctttgc360gcagcaagcagtgtgcgccccgagccgcgtttctttcctcactggcaggagacctgacac420cacccgcctgtacgacttcaactcctactggagggtgcacgctggaaacttctccaccat柳cccccagtacttcaaggagaatggctatgtgaccatgtcggtgggaaaagtctttcaccc540tgggatatcttctaaccataccgatgattctccgtatagctggtcttttccaccttatca600tccttcctctgagaagtatgaaaacactaagacatgtcgagggccagatggagaactcca660tgccaacctgctttgccctgtggatgtgctggatgttcccgagggcaccttgcctgacaa720acagagcactgagcaagccatacagttgttggaaaagatgaaaacgtcagccagtccttt780cttcctggccgttgggtatcataagccacacatccccttcagataccccaagg幼tttca840gaagttgtatcccttggagaacatcaccctggcccccgatcccgaggtccctgatggcct900accccctgtggcctacaacccctggatggacatcaggcaacgggaagacgtccaagcctt960aaacatcagtgtgccgtatggtccaattcctgtggactttcagcggaaaatccgccagag1020ctactttgcctctgtgtcatatttggatacacaggtcggccgcctcttgagtgctttgga1080cgatcttcagctggccaacagcaccatcattgcatttacctcggatcatgggtgggctct1140aggtgaacatggagaatgggccaaatacagceiattttgatgttgctacccatgttcccct1200gatattctatgttcctggaaggacggcttcacttccggaggcaggcgagaagcttttccc.1260ttacctcgacccttttgattccgcctcacagttgatggagccaggcaggcaatccatgga1320ccttgtggaacttgtgtctctttttcccacgctggctggacttgcaggactgcaggttcc1380acctcgctgccccgttccttcatttcacgttgagctgtgcagagaaggcaagaaccttct1440gaagcattttcgattccgtgacttggaagaggatccgtacctccctggtaatccccgtga1500actgattgcctatagccagtatccccggccttcagacatccctcagtggaattctgacaa1560gccgagtttaaaagatataaagatcatgggctattccatacgcaccatagactataggta1620tactgtgtgggttggcttcaatcctgatgaatttctagctaacttttctgacatccatgc1680aggggaactgtattttgtggattctgacccattgcaggatcacaatatgtataatgattc1740ccaaggtggagatcttttccagttgttgatgccUgagttttgccaaccatggatggcaa1800atgtgatgtgctcccttccagctggtgagaggaggagttagagctggtcgttttgtgatt1860acccataatattggaagcagcctgagggctagttaatccaaacatgcatcaacaatttgg1920cctgagaatatgtaacagccaaaccttttcgtttagtctttattaaaatttataattggt1980aattggaccagttttttttttaatttccctctttttaaaacagttacggcttatttactg2040aataaatacaaagcaaacaaactcaagttatgtcatacctttggatacgaagaccataca2100t犯taaccaaacataacattatacacaaagaatactttcattatttgtggaatttagtgc2160atttcaaaaagtaatcatatatcaaactaggcaccacactaagttcctgattattttgtt2220tataatttaataatatatcttatgagccctatatattcaaaatattatgttaacatgtaa2280tccatgtttctttttcc2297<210〉7<211>550<212>PRT<213〉智人<400>7MetProProProArgThrGlyArgGlyLeuLeuTrpLeuGlyLeuVal151015LeuSerSerValCysValAlaLeuGlySerGluThrGinAlaAsnSer202530ThrThrAspAlaLeuAsnValLeuLeulielieValAspAspLeuArg354045ProSerLeuGlyCysTyrGlyAspLysLeuValArgSerProAsnlie505560AspGinLeuAlaSerHisSerLeuLeuPheGinAsnAlaPheAlaGin65707580GinAlaValCysAlaProSerArgValSerPheLeuThrGlyArgArg859095ProAspThrThrArgLeuTyrAspPheAsnSerTyrTrpArgValHis100105110AlaGlyAsnPheSerThrlieProGinTyrPheLysGluAsnGlyTyr115120125ValThrMetSerValGlyLysValPheHisProGlylieSerSerAsn130135140HisThrAspAspSerProTyrSer'TrpSerPheProProTyrHisPro145150155160SerSerGluLysTyrGluAsnThrLysThrCysArgGlyProAspGly165170175GluLeuHisAlaAsnLeuLeuCysPro'ValAspValLeuAspValPro180185190GluGlyThrLeuProA印LysGinSerThrGluGinAlalieGinLeu195200205LeuGluLysMetLysThrSerAlaSerProPhePheLeuAlaValGly210215220TyrHisLysProHislieProPheArgTyrProLysGluPheGinLys225230235240LeuTyrProLeuGluAsnlieThrLeuAlaProAspProGluValPro245250255AspGlyLeuProProValAlaTyrAsnProTrpMetAsplieArgGin260265270ArgGluAspValGinAlaLeuAsnlieSerValProTyrGlyProlie275280285ProValAspPheGinArgLyslieArgGinSerTyrPheAlaSerVal290295300SerTyrLeuAspThrGinValGlyArgLeuLeuSerAlaLeuAspAsp305310315320LeuGinLeuAlaAsnSerThrlie'lieAlaPheThrSerAspHisGly325330335TrpAlaLeuGlyGluHisGlyGluTrpAlaLysTyrSerAsnPheAsp340345350ValAlaThrHisValProLeuliePheTyrValProGlyArgThrAla355360365SerLeuProGluAlaGlyGluLysLeuPheProTyrLeuAspProPhe370375380AspSerAlaSerGinLeuMetGluProGlyArgGinSerMetAspLeu385390395400ValGluLeuValSerLeuPheProThrLeuAlaGlyLeuAlaGlyLeu405410415GinValProProArgCysProValProSerPheHisValGluLeuCys420425430ArgGluGlyLysAsnLeuLeuLysHisPheArgPheArgAspLeuGlu435440445GluAspProTyrLeuProGlyAsnProArgGluLeulieAlaTyrSer450455460GinTyrProArgProSerAsplieProGinTrpAsnSerAspLysPro465470475480SerLeuLysAsplieLys'lieMetGlyTyrSerlieArgThrlieAsp485490495TyrArgTyrThrValTrpValGlyPheAsnProAspGluPheLeuAla500505510AsnPheSerAsplieHisAlaGlyGluLeu.TyrPheValAspSerAsp515520525ProLeuGinAspHisAsnMetTyrAsnAspSerGinGlyGlyAspLeu530535540PheGinLeuLeuMetPro545550〈210>8〈211>2657<212>DNA<213>智人〈400>8gaattccgggccatgagctgccccgtgcccgcctgctgcgcgctgctgctagtcctgggg60ctctgccgggcgcgtccccggaacgcactgctgctcctcgcggatgacggaggctttgag120agtggcgcgtacaac犯cagcgccatcgccaccccgcacctggacgccttggcccgccgc180agcctcctctttcgcaatgccttcacctcggtcagcagctgctctcccagccgcgccagc240ctcctcactggcctgccccagcatcagaatgggatgtacgggctgcaccaggacgtgcac300cacttcaactccttcgacaaggtgcggagcctgccgctgctgctcagccaagctggtgtg360cgcacaggcatcatcgggaagaagcacgtggggccggagaccgtgtacccgtttgacttt420gcgtacacggaggagaatggctccgtcctccaggtggggcggaacatcactagaattaag480ctgctcgtccggaaattcctgcagactcaggatgaccggcctttcttcctctacgtcgcc540ttccacgacccccaccgctgtgggcactcccagccccagtacggaaccttctgtgagaag600tttggcaacggagagagcggcatgggtcgtatcccagactggaccccccaggcctacgac660ccactggacgtgctggtgccttacttcgtccccaacaccccggcagcccgagccgacctg720gccgctcagtacaccaccgtcggccgcatggaccaaggagttggactggtgctccaggag780ctgcgtgacgccggtgtcctgaacgacacactggtgatcttcacgtccgacaacgggatc840cccttccccagcggcaggaccaacctgtactggccgggcactgctgaacccttactggtg900tcatccccggagcacccaaaacgctggggccaagtcagcgaggcctacgtgagcctccta960gacctcacgcccaccatcttggattggttctcgatcccgtaccccagctacgccatcttt1020ggctcgaagaccatccacctcactggccggtccctcctgccggcgctggaggccgagccc1080ctctgggccaccgtctttggcagccagagccaccacgaggtcaccatgtcctaccccatg1140cgcitccgtgcagcaccggcacttccgcctcgtgcacaacctcaacttcaagatgcccttt1200cccatcgaccaggacttctacgtctcacccaccttccaggacctcctgaaccgcaccaca1260gctggtcagcccacgggctggtacaaggacctccgtcattactactaccgggcgcgctgg1320gagctctacgaccggagccgggacccccacgagacccagaacctggccaccgacccgcgc1380tttgctcagcttctggagatgcttcgggaccagctggccaagtggcagtgggagacccac1440gacccctgggtgtgcgcccccgacggcgtcctggaggagaagctctctccccagtgccag1500cccctccacaatgagctgtgaccatcccaggaggcctgtgcacacatcccaggcatgtcc1560cagacacatcccacacgtgtccgtgtggccggccagcctggggagtagtggcaacagccc1620ttccgtccacactcccatccaaggagggttcttccttcctgtggggtcactcttgccatt1680gcctggagggggaccagagcatgtgaccagagcatgtgcccagcccctccaccaccaggg1740gcactgccgtcatggcaggggacacagttgtccttgtgtctgaaccatgtcccagcacgg1800gaattctagacatacgtggtctgcggacagggcagcgcccccagcccatgacaagggagt1860cttgttttctggcttggtttggggacctgcaaatgggaggcctgaggccctcttcaggct1920ttggcagccacagatacttctgaacccttcacagagagcaggcaggggcttcggtgccgc1980gtgggcagtacgcaggtcccaccgacactcacctgggagcacggcgcctggctcttacca2040gcgtctggcctagaggaagcctttgagcgacctttgggcaggtttctgcttcttctgttt2100tgcccatggtcaagtccctgttccccaggcaggtttcagctgattggcagcaggctccct2160gagtgatgagcttgaacctgtggtgtttctgggcagaagcttatcttttttgagagtgtc2220cgaagatgaaggcatggcgatgcccgtcctctggcttgggttaattcttcggtgacactg2280gcattgctgggtggtgatgcccgtcctctggcttgggttaattcttcggtgacactggcg2340ttgctgggtggcaatgcccgtcctctggcttgggttaattcttcggtgacactggcgttg2400ctgggtggcgatgcccgtcctctggcttgggttaattcttggatgacgtcggcgttgctg2柳ggagaatgtgccgttcctgccctgcctccacccacctcgggagcagaagcccggcctgga2520cacccctcggcctggacacccctcgaaggagagggcgcttccttgagtaggtgggctccc2580cttgcccttccctccctatcactccatactggggtgggctggaggaggccacaggccagc2640tattgtaaaagcttttt〈210〉92657<formula>formulaseeoriginaldocumentpage137</formula>LysPheLeuGinThrGinAspAspArgProPhePheLeuTyrValAla165170175PheHisAspProHisArgCysGlyHisSerGinProGinTyrGlyThr180185190PheCysGluLysPheGlyAsnGlyGluSerGlyMetGlyArgliePro195200205AspTrpThrProGinAlaTyrAspProLeuAspValLeuValProTyr210215220PheValProAsnThrProAlaAlaArgAlaAspLeuAlaAlaGinTyr225230235240ThrThrValGlyArgMetAspGinGlyValGlyLeuValLeuGinGlu245250255LeuArgAspAlaGlyValLeuAsnAspThrLeuValliePheThrSer260265270AspAsnGlylieProPheProSerGlyArgThrAsnLeuTyrTrpPro275280285GlyThrAlaGluProLeuLeuValSerSerProGluHisProLysArg290295300TrpGlyGinValSerGluAlaTyrValSerLeuLeuAspLeuThrPro305310315320ThrlieLeuAspTrpPheSerlieProTyrProSerTyrAlaliePhe325330335GlySerLysThrlieHisLeuThrGlyArgSerLeuLeuProAlaLeu340345350GluAlaGluProLeuTrpAlaThrValPheGlySerGinSerHisHis355360365GluValThrMetSerTyrProMetArgSerValGinHisArgHisPhe370375380ArgLeuValHisAsnLeuAsnPheLysMetProPheProlieAspGin385390395400AspPheTyrValSerProThrPheGinAspLeuLeuAsnArgThrThr405410415AlaGlyGinProThrGlyTrpTyrLysAspLeuArgHisTyrTyrTyr420425430ArgAlaArgTrpGluLeuTyrAspArgSerArgAspProHisGluThr435440445GinAsnLeuAlaThrAspProArgPheAlaGinLeuLeuGluMetLeu450455460ArgAspGinLeuAlaLysTrpGinTrpGluThrHisAspProTrpVal465470475480CysAlaProAspGlyValLeuGluGluLysLeuSerProGinCysGin485490495ProLeuHisAsnGluLeu500<210>10〈2U>1014〈212〉DNA<213〉智人<400〉10cgtgcctgtaatcccagcagctactcactcaggaggctgaggcaggetgaatctcttgaac60ccggaaggcagaggttgcagtgagccaagatcgcgccactgaactccagcctgggtgaca120gagtgagactgtctcagaacagcaacaacaaaatgcccgctgctgctgggtccagaagag180cttgaataactgcatgttctttttctcaattttcatttcccagaactgggcacctccggg240ctgtga犯agttagggaagtgtctgacacctccagaatccattcccaagaagtgcctctg300gtcccactagcacctgcgcagactcaggccaggcctagaatctccagttggccctgcaag360tgcctggaggaaggatggctctggcctcggtcctcccccaaccctgcccaagccagacag420acagcacctgcagacgcagggggactgcacaattccacctgcccaggacctgaccctggc480gtgtgcttggccctcctcctcgcccacggcgcctcagatttcaggaccctcctcctcgcc540cacggcgcctcagacctcaggaccctgccgtctcacgcctttgtgaaccccaaatatctg600agaccagtctcagtttattttgccaaggttaaggatgcacctgtgacagcctcaggaggt660cctgacaacaggtgcccgaggtggctggggatacagtttgcctttatacatcttagggag720acacaagatcagtatgtgtatggcgtacattggttcagtcagccttccactgaatacacg780attgagtctggcccagtgaatccgcatttttatgtaaacagtaagggaacggggcaatca840tataagcgtttgtctcaggggagccccagagggatgacttccagttccgtctgtcctttg900tccacaaggaatttccctgggcgctaattatgagggaggcgtgtagcttcttatcattgt%0agctatgttatttagaaataaaacgggaggcaggtttgcctaattcccaggttg1014<210〉11<211>522<212〉PRT<213〉智人<400>11MetAlaAlaValValAlaAlaThrArgTrpTrpGinLeuLeuLeuVal151015LeuSerAlaAlaGlyMetGlyAlaSerGlyAlaProGinProProAsn202530lieLeuLeuLeuLeuMetAspAspMetGlyTrpGlyAspLeuGlyVal354045TyrGlyGluProSerArgGluThr'ProAsnLeuAspArgMetAlaAla505560GluGlyLeuLeuPheProAsnPheTyrSerAlaAsnProLeuCysSer65707580ProSerArgAlaAlaLeuLeuThrGlyArgLeuProlieArgAsnGly859095PheTyrThrThrAsnAlaHisAlaArgAsnAlaTyrThrProGinGlu100105110lieValGlyGlylieProAspSerGluGinLeuLeuProGluLeuLeu115120125LysLysAlaGlyTyrValSerLyslieValGlyLysTrpHisLeuGly130135140HisArgProGinPheHisProLeuLysHisGlyPheAspGluTrpPhe145150155160GlySerProAsnCysHisPheGlyProTyrAspAsnLysAlaArgPro165170175AsnlieProValTyrArgAspTrpGluMetValGlyArgTyrTyrGlu180185190GluPheProlieAsnLeuLys■ThrGlyGluAlaAsnLeuThrGinlie195200205TyrLeuGinGluAlaLeuAspPhelieLysArgGinAlaArgHisHis210215220ProPhePheLeuTyrTrpAlaValAspAlaThrHisAlaProValTyr225230235240AlaSerLysProPheLeuGlyThrSerGinArgGlyArgTyrGlyAsp245250255AlaValArg■GlulieAspAspSerlieGlyLyslieLeuGluLeuLeu260265270GinAspLeuHisValAlaAspAsnThrPheValPhePheThr.SerAsp275280285AsnGlyAlaAlaLeulieSerAlaProGluGinGlyGlySerAsnGly290295300ProPheLeuCysGlyLysGinThrThrPheGluGlyGlyMetArgGlu305310315320ProAlaLeuAlaTrpT卬ProGlyHisValThrAlaGlyGinValSer325330335HisGinLeuGlySerlieMetAspLeuPheThrThrSerLeuAlaLeu340345350AlaGlyLeuThrProProSerAspArgAlalieAspGlyLeuAsnLeu355360365LeuProThrLeuLeuGinGlyArgLeuMetAspArgProliePheTyr370375380TyrArgGlyAspThrLeuMetAlaAlaThrLeuGlyGinHisLysAla385390395400HisPheTrpThrTrpThrAsnSerTrpGluAsnPheArgGinGlylie405410415AspPheCysProGlyGinAsnValSerGlyValThrThrHisAsnLeu420425430GluAspHisThrLysLeuProLeuliePheHisLeuGlyArgAspPro435440445GlyGluArgPheProLeuSerPheAlaSerAlaGluTyrGinGluAla450455460LeuSerArglieThrSerValValGinGinHisGinGluAlaLeuVal465470475480ProAlaGinProGinLeuAsnValCysAsnTrpAlaValMetAsnTrp485490495AlaProProGlyCysGluLysLeuGlyLysCysLeuThrProProGlu500505510SerlieProLysLysCysLeuTrpSerHis515520<210>12<211>2379<212〉醒<213>智人<400〉12ggaattccggtcggcctctcgcccttcagctacctgtgcgtccctccgtcccgtcccgtc60ccggggtcaccccggagcctgtccgctatgcggctcctgcctctagccccaggtcggctc120cggcggggcagcccccgccacctgccctcctgcagcccagcgctgctactgctggtgctg180ggcggctgcctgggggtcttcggggtggctgcgggaacccggaggcccaacgtggtgctg240ctcctcacggacgaccaggacgaagtgctcggcggcatgacaccactaaagaaaaccaaa300gctctcatcggagagatggggatgactttttccagtgcttatgtgccaagtgctctctgc360tgccccagcagagccagtatcctgacaggaaagtacccacataatcatcacgttgtgaac420aacactctggaggggaactgcagtagtaagtcctggcagaagatccaagaaccaaatact480ttcccagcaattctcagatcaatgtgtggttatcagaccttttttgcagggaaatattta540aatgagtacggagccccagatgcaggtggactagaacacgttcctctgggttggagttac600tggtatgccttggaaaagaattctaagtattataattacaccctgtctatcaattggg肌g660gcacggaagcatggtgaaaactatagtgtggactacctgacagatgttttggctaatgtc720tccttggactttctggactacaagtccaactttgagcccttcttcatgatgatcgccact780ccagcgcctcattcgccttggacagctgcacctcagtaccagaaggctttccagaatgtc840tttgcaccaagaaacaagaacttcaacatccatggaacgaacaagcactggttaerttagg900caagccaagactccaatgactaattcttcaatacagtttttagataatgcatttagga肌960<formula>formulaseeoriginaldocumentpage145</formula>gataagtagagatacattttttatgatgttcatcacagtgtggtaaggttgcaaattcaa2340aacatgtcacccaagctctgttcatgtttttgtgaattc2379<210>13<211>552<212>PRT.<213>智人<400>13MetArgLeuLeuProLeuAlaProGlyArgLeuArgArgGlySerPro151015ArgHisLeuProSerCysSerProAlaLeuLeuLeuLeuValLeuGly202530GlyCysLeuGlyValPheGlyValAlaAlaGlyThrArgArgProAsn354045ValValLeuLeuLeuThrAspAspGinAspGluValLeuGlyGlyMet505560ThrProLeuLysLysThrLysAlaLeulieGlyGluMetGlyMetThr65707580PheSerSerAlaTyrValProSerAlaLeuCysCysProSerArg.Ala859095SerlieLeuThrGlyLysTyrProHisAsnHisHisValAsnAsn100105110ThrLeuGluGlyAsnCysSerSerLysSerTrpGinLyslieGinGlu115120125ProAsnThrPheProAlalieLeuArgSerMetCysGlyTyrGinThr130135140Phe'PheAlaGlyLysTyrLeuAsnGluTyrGlyAlaProAspAlaGly145150155160GlyLeuGluHisValProLeuGlyTrpSerTyrTrpTyrAlaLeuGlu165170175LysAsnSerLysTyr.TyrAsnTyrThrLeuSerlieAsnGlyLysAla180185190ArgLysHisGlyGluAsnTyrSerValAspTyrLeuThrAspValLeu195200205AlaAsnValSerLeuAspPheLeuAspTyrLysSerAsnPheGluPro210215220PhePheMetMetlieAlaThrProAlaProHisSerProTrpThrAla225230235240■AlaProGinTyrGinLysAlaPheGinAsnValPheAlaProArgAsn245250255LysAsnPheAsnlieHisGlyThrAsnLysHisTrpLeulieArgGin260265270AlaLys'ThrProMetThrAsnSerSerlieGinPheLeuAspAsnAla275280285PheArgLysArgTrpGinThrLeuLeuSerValAspAspLeuValGlu290295300147LysLeuValLysArgLeuGluPheThrGlyGluLeuAsnAsnThrTyr305310315320liePheTyrThrSerAspAsnGlyTyrHisThrGlyGinPheSerLeu325330335ProlieAsp'丄ysArgGinLeuTyrGluPheAsplieLysValProLeu340345350LeuValArgGlyProGlylieLysProAsnGinThrSerLysMetLeu355360365ValAlaAsnlieAspLeuGlyProThrlieLeuAsplieAlaGlyTyr370375380AspLeuAsnLysThrGinMetAspGlyMetSerLeuLeuProlieLeu385390395400ArgGlyAlaSerAsnLeuThrTrpArgSerAspValLeuValGluTyr405410415GinGlyGluGlyArgAsnValThrAspProThrCysProSerLeuSer420425430ProGlyValSerGinCysPheProAspCysValCysGluAspAlaTyr435440445AsnAsnThrTyrAlaCysVa:lArgThrMetSerAlaLeuTrpAsnLeu450455460GinTyrCysGluPheAspAspGinGluValPheValGluValTyrAsn465470475480LeuThrAlaAspProAspGinlieThrAsnlieAlaLysThrlieAsp485490495ProGluLeuLeuGlyLysMetAsnTyrArgLeuMetMetLeuGinSer500505510CysSerGlyProThrCysArgThrProGlyValPheAspProGlyTyr515520525ArgPheAspProArgLeuMetPheSerAsnArgGlySerValArgThr530535540ArgArgPheSerLysHisLeuLeu545550<210〉14〈211〉2022<212〉DNA〈213〉智人<400>14ccggtaccggctcctcctgggctccctctagcgccttccccccggcccgactgcctggtc60agcgccaagtgacttacgcccccgaccctgagcccggaccgctaggcgaggaggatcaga120tctccgctcgagaatctgaaggtgccctggtcctggaggagttccgtcccagccctgcgg180tctcccggtactgctcgccccggccctctggagcttcaggaggcggccgtcagggtcggg240gagtatttgggtccggggtctcagggaagggcggcgcctgggtctgcggtatcggaaaga300gcctgctggagccaagtagccctccctctcttgggacagacccctcggtcccatgtccat360gggggcaccgcggtccctcctcctggccctggctgctggcctggccgttgcccgtccgcc420caacatcgtgctgatctttgccgacgacctcggctatggggacctgggctgctatgggca480ccccagctctaccactcccaacctggaccagctggcggcgggagggctgcggttcac卿540cttctacgtgcctgtgtctctgtgcacaccctctagggccgccctcctgaccggccggct600cccggttcggatgggcatgtaccctggcgtcctggtgcccagctcccgggggggcctgcc660cctggaggaggtgaccgtggccgaagtcctggctgcccgaggctacctcacaggaatggc720cggcaagtggcaccttggggtggggcctgagggggccttcctgcccccccatcagggctt780ccatcgatttctaggcatcccgtactcccacgaccagggcccctgccagaacctgacctg840cttcccgccggccactccttgcgacggtggctgtgaccagggcctggtccccatcccact900gttggccaacctgtccgtggaggcgcagcccccctggctgcccggactagaggcccgcta960catggctttcgcccatgacctcatggccgacgcccagcgccaggatcgccccttcttcct1020gtactatgcctctcaccacacccactaccctcagttcagtgggcagagctttgcagagcg1080ttcaggccgcgggccatttggggactccctgatggagctggatgcagctgtggggaccct1140gatgacagccatetggggacctggggctgcttg犯gagacgctggtcatcttcactgcaga1200caatggacctgagaccatgcgtatgtcccgaggcggctgctccggtctcttgcggtgtgg1260aaagggaacgacctacgagggcggtgtccgagagcctgccttggccttctggccaggtca1320tatcgctcccggcgtgacccacgagctggccagctccctggacctgctgcctaccctggc1380agccctggctggggccccactgcccaatgtcaccttggatggctttgacctcagccccct1440gctgctgggcacaggcaagagccctcggcagtctctcttcttctacccgtcctacccaga1500cgaggtccgtggggtttttgctgtgcggactggaaagtacaaggctcacttcttcaccca1560gggctctgcccacagtgataccactgcagaccctgcctgccacgcctccagctctctgac1620tgctcatgagcccccgctgctctatgacctgtccaaggaccctggtgagaactacaacct1680gctggggggtgtggccggggccaccccagaggtgctgcaagccctgaaacagcttcagct1740gctcaaggcccagttagacgcagctgtgaccttcggccccagccaggtggcccggggcga1800ggaccccgccctgcagatctgctgtcatcctggctgcaccccccgcccagcttgctgcca1860ttgcccagatccccatgcctgagggcccctcggctggcctgggcatgtgatggctcctca1920ctgggagcctgtgggggaggctcaggtgtctggagggggtttgtgcctgat肌cgtaatal卿acaccagtggagacttgcacatctgaaaaaaaaaaaaaaaaa2022<210>15<211>507<212>PRT<213〉智人<400>15MetGlyAlaProArgSerLeuLeuLeuAlaLeuAlaAlaGlyLeuAla151015ValAlaArgProProAsnlieValLeuliePheAlaAspAspLeuGly202530TyrGlyAspLeuGlyCysTyrGlyHisProSerSerThrThrProAsn354045LeuAspGinLeuAlaAlaGlyGlyLeuArgPheThrAspPheTyrVal505560ProValSerLeuCysThrProSerArgAlaAlaLeuLeuThrGlyArg65707580LeuProValArgMetGlyMetTyrProGlyValLeuValProSerSer859095ArgGlyGlyLeuProLeuGluGluValThrValAlaGluValLeuAla100105110AlaArgGlyTyrLeuThrGlyMetAlaGlyLysTrpHisLeuGlyVal115120125GlyProGluGlyAlaPheLeuProProHisGinGlyPheHisArgPhe130135140LeuGlylieProTyrSerHisAspGinGlyProCysGinAsnLeuThr145150155160CysPheProProAlaThrProCysAspGlyGlyCysAspGinGlyLeu165170175ValProlieProLeuLeuAlaAsnLeuSerValGluAlaGinProPro180185190TrpLeuProGlyLeuGluAlaArg'TyrMetAlaPheAlaHisAspLeu195200205MetAlaAspAlaGinArgGinAspArgProPhePheLeuTyrTyrAla210215220SerHisHisThrHisTyrProGinPheSerGlyGinSerPheAlaGlu225230235240ArgSerGlyArgGlyProPheGlyAspSerLeuMetGluLeuAspAla245250255AlaValGlyThrLeuMetThrAlalieGlyAspLeuGlyLeuLeuGlu260265270GluThrLeuValliePheThrAlaAspAsnGlyProGluThrMetArg275280285MetSerArgGlyGlyCysSerG'lyLeuLeuArgCysGlyLysGlyThr290295300<formula>formulaseeoriginaldocumentpage153</formula>GluAspProAlaLeuGinlieCysCysHisProGlyCysThrProArg485490495ProAlaCysCysHisCysProAspProHisAla500505〈210〉16<211〉2228〈212〉DNA<213〉智人<400>16acaaggatgggtccgcgcggcgcggCgagcttgccccgaggccccggacctcggcggctg60ctcctccccgtcgtcctcccgctgctgctgctgctgttgttggcgccgccgggctcgggc120gccggggccagccggccgccccacctggtcttcttgctggcagacgacctaggctggaac180gacgtcggcttccacggctcccgcatccgcacgccgcacctggacgcgctggcggccggc240ggggtgctcctggacaactactacacgcagccgctgtgcacgccgtcgcggagccagctg300ctcactggccgctaccagatccgtacaggtttacagcaccaaataatctggccctgtcag360cccagctgtgttcctctggatgaaaaactcctgccccagctcctaaaagaagcaggttat420actacccatatggtcggaaaatggcacctgggaatgtaccgga犯gaatgccttcc犯cc480cgccgaggatttgatacctactttggatatctcctgggtagtgaagattattattcccat540gaacgctgtacattaattgacgctctgaatgtcacacgatgtgctcttgattttcgagat600ggcgaagaagttgcaacaggatataa犯atatgtattcaaca^icatatt;caccaa犯gg660gctatagccctcataactaaccatccaccagagaagcctctgtttctctaccttgctctc720cagtctgtgcatgagccccttcaggtccctgaggaatacttgaagccatatgactttatc780caagacaagaacaggcatcactatgcaggaatggtgtcccttatggatgaagcagtagga840aatgtcactgcagctttaaaaagcagtgggctctggaacaacacggtgttcatcttttct900acagataacggagggcagactttggcagggggtaataactggccccttcgaggaagaaaa960tggagcctgtgggaaggaggcgtccgaggggtgggctttgtggc卿ccccttgctg犯g1020cagaagggcgtgaagaaccgggagctcatccacatctctgactggctgccaacactcgtg1080aagctggccaggggacacaccaatggcacaaagcctctggatggcttcgacgtgtggaaa1140accatcagtgaaggaagcccatcccccagaattgagctgctgcataatattgacccaaac1200ttcgtggactcttcaccgtgtcccaggaacagcatggctccagcaaaggatgactcttct1260cttccagaatattcagcctttaacacatctgtccatgctgcaattagacatggaaattgg1320aaactcctcacgggctacccaggctgtggttactggttccctccaccgtctcaatacaat1380gtttctgagataccctcatcagacccaccaaccaagaccctctggctctttgatattgat1440cgggaccctgaagaaagacatgacctgtccagagaatatcctcacatcgtcacaaagctc1500ctgtcccgcctacagttctaccataaacactcagtccccgtgtacttccctgcacaggac1560ccccgctgtgatcccaaggccactggggtgtggggcccttggatgtaggatttcagggag1620gctagaaaacctttcaattggaagttggacctcaggccttttctcacgactcttgtctca1680tttgttatcccaacctgggttcacttggcccttctcttgctcttaaaccacaccgaggtg1740tctaatttcaacccctaatgcatttaagaagctgataaaatctgcaacactcctgctgtt1800ggctggagcatgtgtctagaggtgggggtggctgggtttatccccctttcctaagccttg1860ggacagctgggaacttaacttgaaataggaagttctcactgaatcctggaggctggaaca1920gctggctcttttagactcac犯gtcagacgttcgattcccctctgccaatagccagtttt1980attggagtgaatcacatttcttacgc犯atgaagggagcagacagtgattaatggttctg2040ttggccaaggcttctccctgtcggtgaaggatcatgttcaggcactccaagtgaaccacc2100cctcttggttcaccccttactcacttatctcatcacagagcataaggcccattttgttgt2160tcaggtcaacagcaaaatggcctgcaccatgactgtggcttttaaaataaagaaatgtgt2220ttttatcg2228<210>17〈211〉533<212>PRT<213〉智人<400>17MetGlyProArgGlyAlaAlaSerLeuProArgGlyProGlyProArg151015ArgLeuLeuLeuProValValLeuProLeuLeuLeuLeuLeuLeuLeu202530AlaProProGlySerGlyAlaGlyAlaSerArgProProHisLeuVal354045PheLeuLeuAlaAspAspLeuGlyTrpAsnAspValGlyPheHisGly505560SerArglieArgThrProHisLeuAspAlaLeuAlaAlaGlyGlyVal65707580LeuLeuAspAsnTyrTyrThrGinProLeuCysThrProSerArgSer859095GinLeuLeuThrGlyArgTyrGinlieArgThrGlyLeuGinHisGin100105110lielieTrpProCysGinProSerCysValProLeuAspGluLysLeu115120125LeuProGinLeuLeuLysGluAlaGlyTyrThrThrHisMetValGly130135140LysTrpHisLeuGlyMetTyrArgLysGluCysLeuProThrArgArg145150155160GlyPheAspThrTyrPheGlyTyrLeuLeuGlySerGluAspTyrTyr165170175SerHisGluArgCysThrUulieAspAlaLeuAsnValThrArgCys180185190AlaLeuAspPheArgAspGlyGluGluValAlaThrGlyTyrLysAsn195200205MetTyrSerThrAsnliePheThrLysArgAlalieAlaLeulieThr210215220AsnHisProProGluLysProLeuPheLeuTyrLeuAlaLeuGinSer225230235240ValHisGluProLeuGinValProGluGluTyrLeuLysProTyrAsp245250255PhelieGinAspLysAsnArgHisHisTyrAlaGlyMetValSerLeu260265270MetAspGluAlaValGlyAsnValThrAlaAlaLeuLysSerSerGly275280285LeuT卬AsnAsnThrValPheliePheSerThrAspAsnGlyGlyGin290295300ThrLeuAlaGlyGlyAsnAsnTrpProLeuArgGlyArgLysTrpSer305310315320LeuTrpGluGlyGlyValArgGlyValGlyPheValAlaSerProLeu325330335LeuLysGinLysGlyValLysAsnArgGluLeulieHislieSerAsp340345350TrpLeuProThrLeuValLysLeuAlaArgGlyHisThrAsnGlyThr355360365LysProUuAspGlyPheAspValTrpLysThrlieSerGluGlySer370375380ProSerProArglieGluLeuLeuHisAsnlieAspProAsnPheVal385390395400AspSerSerProCysProArgAsnSerMetAlaProAlaLysAspAsp405410415SerSerLeuProGluTyrSerAlaPheAsnThrSerValHisAlaAla420425430lieArgHisGlyAsnTrpLysLeuLeuThrGlyTyrProGlyCysGly435440445TyrTrpPheProProProSerGinTyrAsnValSerGlulieProSer450455460SerAspProProThrLysThrLeuTrpLeuPheAsplieAspArgAsp465470475480158ProGluGluArgHisAspLeuSerArgGluTyrProHislieValThr485490495LysLeuLeuSerArgLeuGinPheTyrHisLysHisSerValProVal500505510TyrPheProAlaGinAspProArgCysAspProLysAlaThrGlyVal515520525TrpGlyProTrpMet530〈210〉18<211〉2401<212>腿〈213〉智人<400〉18gcctccagcagctgacgggacccagctgtagtgaggttgcagtgattgagt鄉(xiāng)attggc60ctgcttcaaagcagaggtttctcatgggaatatgcttattaaactcccactggtgcagaa120accatgaacagaggatgaacaagtgaagttgcaatctcctccatcacagctcagttcccc180aacaacaggatcacaagctggagatgcctttaaggaagatgaagatccctttcctcctac240tgttctttctgtggg卿ccgagagccacgcagcatcaaggccgaacatcatcctggtga300tggctgacgacctcggcattgg卿tcctgggtgctatgggaac犯aactatcaggactc360ccaatatcgaccggttggccagtgggggagtgaaactcactcagcacctggcagcatcac420cgctgtgcacaccaagcagggcagccttcatgactggccggtaccctgtccgatcaggaa480tggcatcttggtcccgcactggagttttcctcttcacagcctcttcgggaggacttccca540ccgatgagattacctttgct犯gcttctgaaggatcaaggttattcaacagcactgatag600ggaaatggcaccttgggatgagctgtcacagcaagactgacttctgtcaccaccctttac660ctttgaccaatctgagagactgcaagcccg720gagagggcagtgtcttcaccacgggcttcaagaggctggtcttcctccccctgcagatcg780tcggggtcaccctccttacccttgctgcactcaattgtctggggctactccacgtgcctc840taggcgtttttttcagccttctcttcctagcagccctaatcctgacccttttcttgggct900tccttcattacttccggcccctgaactgcttcatgatgaggaactacgagatcattcagc960agcccatgtcctatgacaatctcacccagaggctaacggtggaggcggcccagttcatac1020agcggaacactgagactccgttcctgcttgtcttgtcctacctccacgtgcacacagccc1080tgttctccagcaaagactttgctggcaaaagtcaacacggagtctacggggatgctgttg1140aggaaatggactggagtgtggggcagatcttgaaccttctggatgagctgagattggcta1200atgataccctcatctacttcacatcggaccagggagcacatgtagaggaggtgtcttcca1260aaggagaaattcatggcggaagtaatgggatctataaaggaggaaaagcaaacaactggg1320aaggaggtatccgggttccaggcatccttcgttggcccagggtgatacaggctggccaga1380agattgatgagcccactagcaacatggacatatttcctacagtagccaagctggctgg兆1440ctcccttgcctgaggacaggatcattgatggacgtgatctgatgcccctgcttgaaggaa1500aaagccaacgctccgatcatgagtttctcttccattactgcaacgcctacttaaatgctg1560tgcgctggcaccctca扭acagcacatccatctggaaggcctttttcttcacccccaact1620tcaaccccgtgggttccaacggatgctttgccacacacgtgtgcttctgtttcgggagtt1680atgtcacccatcacgacccacctttactctttgatatttccaaagatcccagagagagaa1740acccactaactccagcatccgagccccggttttatga犯tcctcaaagtcatgcaggaag1800ctgcggacagacacacccagaccctgccagaggtgcccgatcagttttcatggaacaact1860ttctttggaagccctggcttcagctgtgctgtccttccaccggcctgtcttgccagtgtg1920atagagaaaaacaggataagagactgagccgctagcagcgcctggggaccagacagacgc1980160atgtggcaaagctcaccatcttcactacaaacacgcctgagagtggcactggggaaacat2040aactccatctacaccttggatttggactgattctccattttatcacctgaaggcttgggc2100cagagctcaacagctactcaactggaggggtgagggggataaggtctgtagtatacagac2160aggaagatggtaggtttatgccttctgtggccagagtcttggactcatggaaatagaatg2220aatagaggggcattcacaaggcacaccagtgcaagcagatgacaaaaaggtgcagaaggc2280aatcttaaaacagaaaggtgcaggaggtaccttaactcacccctcagcaaatacctatgt2340caacagtataagttaccatttactctataatctgcagtgatgcaataaccagcataataa2400a2401<210〉19<211〉583<212〉PRT<213〉智人<400>19MetProLeuArgLysMetLyslieProPheLeuLeuLeuPhePheLeu151015Trp'GluAlaGluSerHisAlaAlaSerArgProAsnlielieLeuVal202530MetAlaAspAspLeuGlylieGlyAspProGlyCysTyrGlyAsnLys354045ThrlieArgThrProAsnlieAspArgLeuAlaSerGlyGlyValLys505560LeuThrGinHisLeuAlaAlaSerProLeuCysThrProSerArgAla65707580AlaPheMetThrGlyArgTyrProValArgSerGlyMetAlaSerTrp859095SerArgThrGlyValPheLeuPheThrAlaSerSerGlyGlyLeuPro100105110ThrAspGlulieThrPheAlaLysLeuLeuLysAspGinGlyTyrSer115120125ThrAlaLeulieGlyLysTrpHisLeuGlyMetSerCysHisSerLys130135140ThrAspPheCysHisHisProLeuHisHisGlyPheAsnTyrPheTyr145150155160GlylieSerLeuThrAsnLeuArgAspCysLysProGlyGluGlySer165170175ValPheThrThrGlyPheLysArgLeuValPhe.LeuProLeuGinlie180185190ValGlyValThrLeuLeuThrLeuAlaAlaLeuAsnCysLeuGlyLeu195200205LeuHisValProLeuGlyValPhePheSerLeuLeuPheLeuAla.Ala210215220LeulieLeuThrLeuPheLeuGlyPheLeuHisTyrPheArgProLeu225230235240AsnCysPheMetMetArgAsnTyrGlulielieGinGinProMetSer245250255TyrAspAsnLeuThrGinArgLeuThrValGluAlaAlaGinPhelie260265270GinArgA'snThrGluThrProPheLeuLeuValLeuSerTyrLeuHis275280285ValHisThrAlaLeuPheSerSerLysAspPheAlaGlyLysSerGin290295300HisGlyValTyrGly.AspAlaValGluGluMetAspTrpSerValGly305310315320GinlieLeuAsnLeuLeuAsp'GluLeuArgLeuAlaAsnAspThrLeu325330335lieTyrPheThrSerAspGinGlyAlaHisValGluGluValSerSer340345350LysGlyGlulieHisGlyGlySerAsnGlylieTyrLysGlyGlyLys355360365AlaAsnAsnTrpGluGlyGlylieArgValProGlylieLeuArgTrp370375380ProArgVallieGinAlaGlyGinLyslieAspGluProThrSerAsn385390395400MetAspliePheProThrValAlaLysLeuAlaGlyAlaProLeuPro405410415GluAspArglielieAspGlyArgAspLeuMetProLeuLeuGluGly420425430LysSerGinArgSerAspHisGluPheLeuPheHisTyrCysAsnAla435440445TyrLeuAsnAlaValArgTrpHisProGinAsnSerThrSerlieTrp450455460LysAlaPhePhePheThrProAsnPheAsnProValGlySerAsnGly465470475480CysPheAlaThrHisValCysPheCysPheGlySerTyrValThrHis485490495HisAspProProLeuLeuPheAsplieSerLysAspProArgGluArg500505510AsnProLeuThrProAlaSerGluPro.ArgPheTyrGlulieLeuLys515520525ValMetGinGluAlaAlaAspArgHisThrGinThrLeuProGluVal530535540ProAspGinPheSerTrpAsnAsnPheLeuTrpLysProTrpLeuGin545550555560LeuCysCysProSerThrGlyLeuSerCysGinCysAspArgGluLys565570575GinAspLysArgLeuSerArg580<210><211><212><213>201945DNA智人<400>20gg卿ccttggcactagcggcgcccgggcgcggagtgcgcagggcaaggtcctgcgctct60gggccagcgctcggccatgcgatccgccgcgcggaggggacgcgccgcgcccgccgccag120ggactctttgccggtgctactgtttttatgcttgcttctgaagacgtgtgaacctaaaac180tgcaaatgcctttaaaccaaatatcctactgatcatggcggatgatctaggcactgggga240tctcggttgctacgggaacaatacactgagaacgccgaatattgaccagcttgcagagga300aggtgtgaggctcactcagcacctggcggccgccccgctctgcaccccaagccgagctgc360attcctcacagggagacattccttcagatcaggcatggacgccagcaatggataccgggc420ccttcagtggaacgcaggctcaggtggactccctgagaacg犯accacttttgcaagaat480cttgcagcagcatggctatgcaaccggcctcataggaaaatggcaccagggtgtgaattg540tgcatcccgcggggatcactgccaccaccccctgaaccacggatttgactatttctacgg600catgcccttcacgctcacaaacgactgtgacccaggcaggccccccgaagtggacgccgc660cctgagggcgcagctctggggttacacccagttcctggcgctggggattctcaccctggc720tgccggccagacctgcggtttcttctctgtctccgcgagagcagtcaccggcatggccgg780cgtgggctgcctgtttttcatctcttggtactcctccttcgggtttgtgcgacgctggaa840ctgtatcctgatgag犯accatgacgtcacggagcaacccatggttctggagaaaacagc900gagtcttatgctaaaggaagctgtttcctatattgaaagacacaagcatgggccatttct960cctcttcctttctttgctgcatgtgcacattccccttgtgaccacgagtgcattcctggg1020ga犯agtcagcatggcttateitggtga恤tgtggaggagatggactggctcataggtaa1080ggttcttaatgccatcgaagacaatggtttaaagaactcaacattcacgtatttcacctc1140tgaccat柳ggacatttagaggcaagagatggacacagccagttagggggatggaacgg1200犯tttacaaaggtgggaagggcatgggaggatggg卿gtgggatccgagtgcccgggat1260cttccactggccgggggtgctcccggccggccgagtgattggagagcccacgagcctgat1320ggacgtgttccctactgtggtccagctggtgggtggcgaggtgccccaggacagggtgat1380tgatggccacagcctggtacccttgctgcagggagctgaggcacgctcggcacatgagtt1440cctgtttcattactgtgggcagcatcttcacgceigcacgctggcaccagaaggacagtgg1500aagcgtctggaaggttcattacacgaccccgcagttccaccccgaggagcggggcctgct1560aacggccgaggcgtctgcccatgctgaatggggaggcgtgacccatcacagacccccttt1620gctctttgacctctccagggacccctccgaggcacggcccctgacccccgactccgagcc1680cctgtaccacgccgtgatagcaagggtaggtgccgcggtgtcggagcatcggcagaccct1740gagtcctgtgccccagcagttttccatgagcaacatcctgtggaagccgtggctgcagcc1800gtgctgcggacatttcccgttctgttcatgccacgaggatggggatggcaccccctgaat1860gccaggactgtgagagaggatccaggagagcctgactgcgttgcaaacaaaattctccaa1920gcttggttctatcttcagtccggaa1945<210〉21<211〉593<212〉PRT<213〉智人<400〉21MetArgSerAlaAlaArgArgGlyArgAlaAlaProAlaAlaArgAsp151015SerLeuProVslLeuLeuPheLeuCysLeuLeuLeuLysThrCysGlu202530ProLysThrAlaAsnAlaPheLysProAsnlieLeuLeulieMetAla354045166AspAspLeuGlyThrGlyAspLeuGlyCysTyrGlyAsnAsnThrLeu505560ArgThrProAsnlieAspGinLeuAlaGluGluGlyValArgLeuThr65707580GinHisLeuAlaAlaAlaProLeuCysThrProSerArgAlaAlaPhe859095LeuThrGlyArgHis.SerPheArgSerGlyMetAspAlaSerAsnGly100105110TyrArgAlaLeuGinTrpAsn'AlaGlySerGlyGlyLeuProGluAsn115120125GluThrThrPheAlaArglieLeuGlrvGlnHisGlyTyrAlaThrGly130135140LeulieGlyLysTrpHisGinGlyValAsnCysAlaSerArgGlyAsp145150155160HisCysHisHisProLeuAsnHisGlyPheAspTyrPheTyrGlyMet165170175ProPheThrLeuThrAsnAspCysAspProGlyArgProProGluVal180185190AspAlaAlaLeuArgAla'GinLeuTrpGlyTyrThrGinPheLeuAla195200205LeuGlylieLeuThrLeuAlaAlaGlyGinThrCysGlyPhePheSer210215220167<formula>formulaseeoriginaldocumentpage168</formula>ValLeuProAlaGlyArgVallieGlyGluProThrSerLeuMetAsp405410415ValPheProThrValValGinLeuValGlyGlyGluValProGin'Asp420425430ArgVallie'AspGlyHisSerLeuValProLeuLeuGinGlyAlaGlu435440445AlaArgSerAlaHisGluPheLeuPheHisTyrCysGlyGinHisLeu450455460HisAlaAlaArgT卬HisGinLysAspSerGlySerValTrpLysVal465470475480HisTyrThrThrProGinPheHisProGluGluArgGlyLeuLeuThr485490495AlaGluAlaSerAlaHisAlaGluTrpGlyGlyValThrHisHisArg500505510ProProLeuLeuPheAspLeuSerArgAspProSerGluAlaArgPro515520525LeuThrProAspSerGluProLeuTyrHisAlaVallieAlaArgVal530535540GlyAlaAlaValSerGluHisArgGinThrLeuSerProValProGin545550555560GinPheSerMetSerAsnlieLeuTrpLysProTrpLeuGinProCys565570575CysGlyHisPheProPheCysSerCysHisGluAspGlyAspGlyThr580585590Pro<210〉22<211〉1858〈212〉DNA〈213〉智人〈400〉22ccttcctcttcttgatcggggattcagg犯ggagcccaggagcagaggaagtagagagag60agacaacatgttacatctgcaccattcttgtttgtgtttcaggagctggctgccagcgat120gctcgctgtactgctaagtttggcaccatcagcttccagcgacatttccgcctcccgacc180gaacatccttcttctgatggcggacgaccttggcattggggacattggctgctatggcaa240caacaccatgaggactccgaatattgaccgccttgcagaggacggcgtgaagctgaccca300acacatctctgccgcatctttgtgcaccccaagcagagccgccttcctcacgggcagata360ccctgtgcgatcagggatggtttccagcattggttaccgtgttcttcagtggaccggagc420atctggaggtcttcc犯caaatgagacaacttttgcaaaaatactg犯agagaaaggcta480tgccactggactcattggaa組ggcatctgggtctcaactgtgagtcagccagtgatca540ttgccaccac.cctctccatcatggctttgagcatttctacggaatgcctttctccttgat600gggtgattgcgcccgctgggaactctcsLgagaagcgtgtcaacctggaacaaaaactc幼660cttcctcttccaagtcctggccttggttgccctcacactggtagcagggaagctcacaca720cctgatacccgtctcgtggatgccggtcatctggtcagccctttcggccgtcctcctcct780cgcaagctcctattttgtgggtgctctgattgtccatgccgattgctttctgatgagaaa840ccacaccatcacggagcagcccatgtgcttccaaagaacgacaccccttattctgcagga900ggttgcgtcctttctcaaaaggaataagcatgggcctttcctcctctttgtttcctttct960acacgttcacatccctcttatcactatggagaacttcctcgggaagagtctccacgggct1020gtatggggac犯cgtagaggagatggactggatggtaggacggatccttgacactttgga1080cgtggagggtttgagcaacagcaccctcatttattttacgtcggatcacggcggttccct1140agagaatcaacttggaaacacccagtatggtggctggaatggaatttataaaggtgggaa1200gggcatgggaggatgggaaggtg,tccgcgtgcccgggatcttccgctggcccggggt1260gctcccggccggccgagtgattggcgagcccacgagtctgatggacgtgttccccaccgt1320ggtccggctggcgggcggcgaggtgccccaggacagagtgattgacggccaagaccttct1380gcccttgctcctggggacagcccaacactcagaccacgagttcctgatgcattattgtga1440gaggtttctgcacgcagccaggtggcatcaacgggacagaggaacaatgtggaaagtcca1500ctttgtgacgcctgtgttccagccagagggagccggtgcctgctatggaagaaaggtctg1560cccgtgctttggggaaaaagtagtccaccacgatccacctttgctctttgacctctcaag1620agacccttctgagacccacatcctcacaccagcctcagagcccgtgttctatcaggtgat1680ggaacgagtccagcaggcggtgtgggaacaccagcggacactcagcccagttcctctgca1740gctggacaggctgggcaacatctggagaccgtggctgcagccctgctgtggcccgttccc1800cctctgctggtgccttagggaagatgacccacaataaatgtctgcagtga犯agctgg1858〈210〉23〈211〉589〈212>PRT〈213〉智人〈400〉23MetLeuHisLeuHisHisSerCysLeuCysPheArgSerTrpLeuPro151015AlaMetLeuAlaValLeuLeuSerLeuAlaProSerAlaSerSerAsp202530lieSerAlaSerArgProAsnlieLeuLeuLeuMetAlaAspAspLeu354045GlylieGlyAsplieGlyCysTyrGlyAsnAsnThrMetArgThrPro505560AsnlieAspArgLeuAlaGluAspGlyValLysLeuThrGinHislie65707580SerAlaAlaSerLeuCysThr'ProSerArgAlaAlaPheLeuThrGly859095ArgTyrProValArgSerGlyMetValSerSerlieGlyTyrArgVal100105110LeuGinTrpThrGlyAlaSerGlyGlyLeuProThrAsnGluThrThr115120125PheAlaLyslieLeuLysGluLysGlyTyrAlaThrGlyLeulieGly130135140LysTrpHisLeuGlyLeuAsnCysGluSerAlaSerAspHisCysHis145150155160HisProLeuHisHisGlyPheGluHisPheTyrGlyMetProPheSer165170175LeuMetGlyAspCysAlaArgTrpGluLeuSerGluLysArgValAsn180185190172LeuGluGinLysLeuAsnPheLeuPheGinValLeuAlaLeuValAla195200205LeuThrLeuValAlaGlyLysLeuThrHisLeulieProValSerTrp210215220MetProVallieTrpSerAlaLeuSerAlaValLeuLeuLeuAlaSer225230235240SerTyrPheValGlyAlaLeulieValHisAlaAspCysPheLeuMet245250255ArgAsnHisThrlieThrGlu'GinProMetCysPheGinArgThrThr260265270ProLeulieLeuGinGluValAlaSerPheLeuLysArgAsnLysHis275280285GlyProPheLeuLeuPheValSerPheLeuHisValHislieProLeu290295300lieThrMetGluAsnPheLeuGlyLysSerLeuHisGlyLeuTyrGly305310315320AspAsn.ValGluGluMetAspTrpMetValGlyArglieLeuAsp.Thr325330335LeuAspValGluGlyLeuSerAsnSerThrLeulieTyrPheThrSer340345350AspHisGlyGlySerLeuGluAsnGinLeuGlyAsnThrGinTyrGly355360365GlyTrpAsnGlylieTyrLysGlyGlyLysGlyMetGlyGlyTrpGlu370375380Gly■GlylieArgValProGlyliePheArgTrpProGlyValLeuPro385390395400AlaGlyArgVallieGlyGluProThrSerLeuMetAspValPhePro405410415ThrValValArgLeuAlaGlyGlyGluValProGinAspArgVallie420425430AspGlyGinAspLeuLeuProLeuLeuLeuGlyThrAlaGinHisSer435440445AspHisGluPheLeuMetHisTyrCysGluArgPheLeuHisAlaAla450455460ArgTrpHisGinArgAspArgGlyThrMetTrpLysValHisPheVal465470475480ThrProValPheGinProGluGlyAlaGlyAlaCysTyrGlyArgLys485490495ValCysProCysPheGlyGluLysValValHisHisAspProProLeu500505510LeuPheAspLeuSerArgAspProSerGluThrHislieLeuThrPro515520525AlaSerGluProValPheTyrGinValMetGluArgValGinGinAla530535540ValTrpGluHisGinArgThrLeuSerProValProLeuGinLeuAsp545550555560ArgLeuGlyAsnlieTrpArgProTrpLeuGinProCysCysGlyPro565570575PheProLeuCysTrpCysLeuArgGluAspAspProGin〈210〉24〈211〉1996〈212〉腿<213〉智人〈400〉24gggttctgctcctagacattagagagataatacggctgatagacaacaagaaggtattcc60肌gctgcacaatgaggcccaggagaccgttggtcttcatgtctttggtgtgtgcactctt120gaacacatggccagggcacacagggtgcatgacgacaaggcctaatattgtcctaatcat180ggttgatgacctgggtattggagatctgggctgctacggcaatgacaccatgaggacgcc240tcacatcgaccgccttgccagggaaggcgtgcgactgactcagcacatctctgccgcctc300cctctgcagccc卿ccggtccgcgttcttgacggga柳taccccatccgatcaggtat360ggtttctagtggtaatagacgtgtcatccaa犯tcttgcagtccccgcaggcctccctct420taatgagacaacacttgcagccttgctaaagaagcaaggatacagcacggggcttatagg480c犯atggcacc犯ggcttgaactgcgactcccgaagtgaccagtgccaccatccatat犯540ttatgggtttgactactactatggcatgccgttcactctcgttgacagctgctggccgga600cccctctcgtaacacgg犯ttagcctttgagagtcagctctggctctgtgtgcagctagt660tgccattgccatcctcaccctaacctttgggaagctgagcggctgggtctctgttccctg720gctcctgatcttctccatgattctgtttattttcctcttgggctatgcttggttctccag780ccacacgtcccctttatactgggactgcctcctcatgcgggggcacgagatcacggagca840gcccatgaaggctgaacgagctggatccattatggtgaaggaagcgatttcctttttaga900aaggcacagtaaggaaactttccttctctttttctcctttcttcacgtgcacacacctct960ccccaccacggacgatttcactggcaccagcaagcatggcttgtatggggataatgtgga1020agagatggactccatggtgggcaagattcttgatgctatcgatgattttggcctaaggaa1080caacacccttgtctactttacatcagatcacggagggcatttggaagctaggcgagggca1140tgcccaacttggtggatggaatggaatatacaaaggtggaaaaggcatggggggctggga1200aggtggaatccgcgtcccaggaattgtccgatggcctggaaaggtaccagctggacggtt1260gattaaggaacctacaagtttaatggatattttaccaactgtcgcatcagtgtcaggagg1320aagtctccctcaggacagggtcattgacggccgagacctcatgcccttgctgcagggcaa1380cgtcaggcactcggagcatgaatttcttttccactactgtggctcctacctgcacgccgt1440gcggtggatccccaaggacgacagtgggtcagtttggaaggctcactatgtgaccccggt1500attccagccaccagcttctggtggctgctatgtcacctcattatgcagatgtttcggaga1560acaggttacctaccacaacccccctctgctcttcgatctctccagggacccctcagagtc1620cacacccctgacacctgccacagagcccctctatgattttgtgattaaaaaggtggccaa1680cgccctg犯ggaacaccaggaaaccatcgtgcctgtgacctacc犯ctctcagaactg犯1740tc鄉(xiāng)gcaggacgtggctgaagccttgctgtggggtgttcccattttgtctgtgtgacaa1800ggaagaggaagtctctcagcctcggggtcct犯cgag犯gagat犯ttac犯tcaggcta1860ccagaggaagcctttggtcctaacgagaagagat犯ttacaatcaggctacc犯aggaag1920cactaactttggtgctttcaagttggcaaggagtgcatttaatagtcaataaattcatct1980accattccagattatt〈210〉251996<211〉591<212>PRT<213>智人<400〉25MetArgProArgArgProLeuValPheMetSerLeuValCysAlaLeu151015LeuAsnThrTrpProGlyHisThrGlyCysMetThrThrArgProAsn202530lieValLeulieMetValAspAspLeuGlylieGlyAspLeuGlyCys354045TyrGlyAsnAspThrMetArgThrProHislieAspArgLeuAlaArg505560GluGlyValArgLeuThrGinHislieSerAlaAlaSerLeuCysSer65707580ProSerArgSerAlaPheLeuThrGlyArgTyrProlieArgSerGly859095MetValSerSerGlyAsnArgArgVallieGinAsnUuAlaValPro100105110AlaGlyLeuProLeuAsnGluThrThrLeuAlaAlaLeuLeuLysLys115120125GinGlyTyrSerThrGlyLeulieGlyLysTrpHisGinGlyLeuAsn130135140CysAspSerArgSerAspGinCysHisHisProTyrAsnTyrGlyPhe145150155160AspTyrTyrTyrGlyMetProPheThrLeuValAspSerCysTrpPro165170175AspProSerArgAsnThrGluLeuAlaPheGluSerGinLeuTrpLeu180185190CysValGinLeuValAlalieAlalieLeuThrLeuThrPheGlyLys195200205LeuSerGlyTrpValSerValProTrpLeuLeuliePheSerMetlie210215220LeuPheliePheLeuLeuGlyTyrAlaTrpPheSerSerHisThrSer225230235240ProLeuTyrTrpAspCysLeuLeuMetArgGlyHisGlulieThrGlu245250255GinProMetLysAlaGluArgAlaGlySerlieMetValLysGluAla260265270lieSerPheLeuGluArgHisSerLysGluThrPheLeuLeuPhePhe275280285SerPheLeuHisValHisThrProLeuProThrThrAspAspPheThr290295300GlyThrSerLysHisGlyLeuTyrGlyAspAsnValGluGluMetAsp305310315320SerMetValGlyLyslieLeuAspAlalieAspAspPheGlyLeuArg325330335AsnAsnThrLeuValTyrPheThrSerAspHisGlyGlyHisLeuGlu340345350AlaArgArgGlyHisAlaGinLeuGlyGlyTrpAsnGlylieTyrLys355360365GlyGlyLysGlyMetGlyGlyTrpGluGlyGlylieArgValProGly370375380lieValArgTrpProGlyLysValProAlaGlyArgLeulieLysGlu385390395400ProThrSerLeuMetAsplieLeuProThrValAlaSerValSerGly405410415GlySerLeuProGinAspArgVallieAsp.GlyArgAspLeuMetPro420425430LeuLeuGinGlyAsnValArgHisSerGluHisGluPheLeuPheHis435440445TyrCysGlySerTyrLeuHisAlaValArgTrplieProLysAspAsp450455460SerGlySerValTrpLysAlaHisTyrValThrProValPheGinPro465470475480ProAlaSerGlyGlyCysTyrValThrSerLeuCysArgCysPheGly485490495GluGinVaiThrTyrHisAsnProProLeuLeuPheAspLeuSerArg500505510179AspProSerGluSerThrProLeuThrProAlaThrGluProLeuTyr515520525AspPheVallieLysLysValAlaAsnAlaLeuLysGluHisGinGlu530535540ThrlieValProValThrTyrGinLeuSerGluLeuAsnGinGlyArg545550555560ThrTrpLeuLysProCysCysGlyValPheProPheCysLeuCysAsp565570575LysGluGluGl,uValSerGinProArgGlyProAsnGluLysArg〈210〉26<211〉1578<212>腿〈213>智人〈400〉26atgggctggctttttctaaaggttttgttggcgggagtgagtttctcaggatttctttat60cctcttgtggatttttgcatcetgtgggaetaacaagaggacagaagccaaactttgtgat't120attttggccgatgacatggggtggggtgacctgggagcaaactgggcagaaacaaaggac180actgccaaccttgataagatggcttcggagggaatgaggtttgtggatttccatgcagct240gcctccacctgctcaccctcccgggcttccttgctcaccggccggcttggccttcgcaat300ggagtcacacgcaactttgcagtcacttctgtgggaggccttccgctcaacgagaccacc360ttggcagaggtgctgcagcaggcgggttacgtcactgggataataggcaaatggcatctt420ggacaccacggctcttatcaccccaacttccgtggttttgattactactttggaatccca480tatagccatgatatgggctgtgtccacagggtgatggaccctccctctttatgaaaacctttcctgctctatgtggctctgcagcgccacggggc卿agggccagatcaaggacaaagtggagacaatggcccgtgggcggattttggcaaactcgtcacaccgggtcccagcactggcgccttgttaagcgtgctggacctc犯ggacggcgctttgacctgggcacagggtgctgttcagactgtccgcctggagcggatgggagcacggggcctgagataccgcagaagctgtgccgaggtcagaaaggttcttgcgcagattacactcaggaccccgctgtcaagccgcataa〈210〉27<211〉525〈212〉PRT〈213〉智人tactgatactccaggctacaaccaccctccttgtccagcg540atcaaggaaccttcaaagagactgttacactgacgtggcc600caacattgtggagcagccggtgaacttgagcagccttgcc660aacccagttcatccagcgtgcaagcaccagcgggaggccc720ggcccacatgcacgtgcccttacctgtgactcagctacca780cctgtatggtgc鄉(xiāng)gctctgggagatggacagtctggtg840tgaccacacagtgaaggaaaacacattcctctggtttaca900tcagaagtgtgagctagcgggcagtgtgggtcccttcact960agggg,gtccagcc卿c柳cgacctgggaaggaggg1020ttactggcctggcagagttccagttaatgtcaccagcact1080catttttccaactgtggtagccctggcccaggccagctta1140tggtgtggacgtctccgaggtgctctttggccggtcacag1200ccaccccaacagcggggcagctggagagtttggagccctg1260ttacaaggccttctacattaccggtggagccagggcgtgt1320gctgcagcataagtttcctctgattttcaacctggaagac1380cctagaaagaggtggtgcggagtaccaggctgtgctgccc1440agacgtcctccaagacattgccaacgacaacatctccagc1500ttcagtaactccctgctgtaatccctaccaaattgcctgc15601578<400>27MetGlyTrpLeuPheLeuLysValLeuLeuAlaGlyValSerPheSer151015GlyPhe丄euTyrProLeuValAspPheCyslieSerGlyLysThrArg202530GlyGinLysProAsnPheVallielieLeuAlaAspAspMetGlyTrp354045GlyAspLeuGlyAlaAsnTrpAlaGluThrLysAspThrAlaAsnLeu505560AspLysMetAlaSerGluGlyMetArgPheValAspPheHisAlaAla65707580AlaSerThrCysSerProSerArgAlaSer丄euLeuThrGlyArgLeu859095GlyLeuArgAsnGlyValThrArgAsnPheAlaValThrSerValGly100105110GlyLeuProLeuAsnGluThrThrLeuAlaGluValLeuGinGinAla115120125GlyTyrValThrGlylielieGlyLysTrpHisLeuGlyHisHisGly130135140SerTyrHisProAsnPheArgGlyPheAspTyrTyrPheGlyliePro145150155160TyrSerHisAspMetGlyCysThrAspThrProGlyTyrAsnHisPro165170175ProCysProAlaCysProGinGlyAspGlyProSerArgAsnLeuGin180185190ArgAspCysTyrThrAspValAlaLeuProleuTyrGluAsnLeuAsn195200205lieValGluGin'ProValAsnUuSerSerLeuAlaGinLysTyrAla210215220GluLysAlaThrGinPhelieGinArgAlaSerThrSerGlyArgPro225230235240PheLeuLeuTyrValAlaLeuAla'HisMetHisValProLeuProVal245250255ThrGinLeuProAlaAlaProArgGlyArgSerLeuTyrGlyAlaGly260265270LeuTrpGluMetAspSerLeuValGlyGinlieLysAspLysValAsp275280285HisThrValLysGluAsnThrPheLeuT卬PheThrGlyAspAsnGly290295300ProTrpAlaGinLysCysGluLeuAlaGlySerValGlyProPheThr305310315320GlyPheTrpGinThrArgGinGlyGlySerProAlaLysGinThrThr325330335TrpGluGlyGlyHisArgValProAlaLeuAlaTyrTrpProGlyArg340345350ValProValAsnValThrSerThrAlaLeuLeuSerValLeuAsplie355360365PhePro"ThrValValAlaLeuAlaGinAlaSerLeuProGinGlyArg370375380ArgPheA印GlyValAspValSerGluValLeuPheGlyArgSerGin385390395400ProGlyHisArgValLeuPheHisProAsnSerGlyAlaAlaGlyGlu405410415PheGlyAlaLeuGinThrValArg'LeuGluArgTyrLysAlaPheTyr420425430lieThrGlyGlyAlaArgAlaCysAspGlySerThrGlyProGluLeu435440445GinHisLysPheProLeuliePheAsnLeuGluAspAspThrAlaGlu450455460AlaValProLeuGluArgGlyGlyAlaGluTyrGinAlaVal.LeuPro465470475480GluValArgLysValLeuAlaAspValLeuGinAsplieAlaAsnAsp485490495AsnlieSerSerAlaAspTyrThrGinAspProSerValThrProCys500505510CysAsnProTyrGinlieAlaCysArgCysGinAlaAla515520525<210〉28<211〉4669〈212〉DNA<213〉智人<400>28cgcagaccgtcgctaatgaactaggaaaccccaggcgcagtcccggctgccggcgctcctgg鄉(xiāng)柳aaggaagtcccgcagagctttttctctagagatcatctaaagaagataaactagetaaatcttcaaaggacccattattcaaccaggataccttcagttttgcaacattggactgtcctgggcacagaattgcaggacggatacagcaggaactgatca卿tgtggagctggacatgggggggccaccttcagtcctccatgctcaccgggactgctcttccccctcgtggccaacactggctacagaacagcatcccccctgggtggcgagcactgtttgtcgcaatggcatcttggggccggtgtcgggccggggcggcttgatcggcaa60aggccaggagcgagggcagcgaggatcagaggccaggcct120cggaggtcagggcagatgaggaacatgactctcccccttc180ctgccaccttatctctgctcctctgcctcctccctgttcc240agattttgaaggcggcttttgtgctgacggccacccacca300tggcaaatgacatgcaggttcttcaaggcagaataattgc360tatctgcagatgttctgaatacctctgagaatagagattg420aattcaagaactccagaaatcaggagacggagacattttg480caaatacaatgaagtattcttgctgtgctctggttttggc540tgggaagcctctgttcgactgtcagatccccgaggttcag600g犯犯aacatccgaccc犯cattattcttgtgcttaccga660ggtccctgcaagtcatgaacaaaacgagaaagattatgga720tcaatgcctttgtgactacacccatgtgctgcccgtcacg780agtatgtgcacaatcacaatgtctacaccaacaacgagaa840aggccatgcatgagcctcggacttttgctgtatatcttaa900ccttttttggaaaatacctcaatgaatataatggcagcta960aatggcttggatt組caagaattctcgcttctataatta1020tcaaagaaaagcatggatttgattatgcaaaggactactt1080cacagacttaatcactaacgetgagcattaattacttcaaaatgtctaagagaatgtatcc1140ccataggcccgttatgatggtgatcagccacgctgcgccccacggccccgaggactcagc1200cccacagttttctaaactgtaccccaatgcttcccaacacataactcctagttataacta1260tgcaccaaettatggataaacactggattatgcagtacacaggaccaatgctgcccatcca1320catggaatttacaaacattctacagcgcaaaaggctccagactttgatgtcagtggatga1380ttctgtggagaggctgtataacatgctcgtggagacg鵬gagctggagaatacttacat1440catttacaccgccgaccatggttaccatattgggcagtttggactggtcaagggg肌atc1500catgccatatgactttgatattcgtgtgcctttttttattcgtggtccaagtgtagaacc1560aggatcaatagtcccacagatcgttctcaacattgacttggcccccacgatcctggatat1620tgctgggctcgacacacctcctgatgtggacggcaagtctgtcctcaaacttctggaccc1680agaaaagccaggtaacaggtttxgaacaaacaagaaggccaaaatttggcgtgatacatt1740cctagtggaaagaggcaaatttctacgtaagaaggaagaatccagcaagaatatccaaca1800gtcaaatcacttgcccaaatatgaacgggtcaaagaactatgccagcaggccaggtacca1860gacagcctgtgaacaaccggggcag犯gtggcaatgcattgaggatacatctggcaagct1920tcgaattcacaagtgtaaaggacccagtgacctgctcacagtccggcagagcacgcgg犯1980cctctacgctcgcggcttccatgacaaagacaaagagtgcagttgtagggagtctggtta2040ccgtgccagcagaagccaaagaaagagtcaacggcaattcttgagaaaccaggggactcc2100aaagtacaagcccagatttgtccatactcggcagacacgttccttgtccgtcgaatttga2160aggtgaaeitatatgacataaatctggaagaag犯gaagaattgc犯gtgttgcaaccaag2220aaacattgctaagcgtcatgatgaaggccacaaggggccaagagatctccaggcttccag2280tggtggcaacaggggcaggatgctggcagatagcagcaacgccgtgggcccacctaccac2340tgtccgagtgacacacaagtgttttattcttcccaatgactctatccattgtgagagaga2400<formula>formulaseeoriginaldocumentpage187</formula>aagatcaactatatcttxctgtgcattccgatggaatttcagttcatcagatgttcacca3780tggccaccgcagaacaccgaagtaattccagcatagcggggaagatgttgaccaaggtgg3840agaagaatcacgaaaaggagaagtcacagcacctag犯ggcagcacctcctcttcactct3900cctctgattagatgaaactgttaccttaccctaaacacagtatttctttttaactttttt3960atttgtaaactaataaaggtaatcacagccaccaacattccaagctaccctgggtacctt4020tgtgcagtagaagctagtgagcatgtgagcaagcggtgtgcacacggagactcatcgtta4080taatttactatctgccaagagtagaaagaaaggctggggatatttgggttggcttggttt4140tgattttttgcttgtttgtttgttttgtactaaaacagtattatcttttgaatatcgtag4200ggacataagtatatacatgttatccaatcaagatggctagaatggtgcctttctgagtgt4260ctaaaacttgacacccctggtaaatctttcaacacacttccactgcctgcgtaatgaagt4320tttgattcatttttaaccactggaatttttcaatgccgtcattttcagttagatgatttt4380gcactttgagattaaaatgccatgtctatttgattagtcttatttttttatttttacagg4440cttatcagtctcactgttggctgtcattgtgacaaagtcaaataaacccccaaggacgac4500acacagtatggatcacatattgtttgacattaagcttttgccagaaaatgttgcatgtgt4560tttacctcgacttgctaaaatcgattagcagaaaggcatggctaataatgttggtggtga4620犯3t3aat犯at幼gt犯8tg犯肌犯犯3a犯犯犯犯ei犯犯aaaaa4669<210〉29<211>871〈212〉PRT<213〉智人〈400〉29MetLysTyrSerCysCysAlaLeuValLeuAlaValLeuGlyThrGlu151015LeuLeuGlySerLeuCysSerThrValArgSerProArgPheArgGly202530ArglieGinGinGluArgLysAsnlieArgProAsnlielieLeuVal354045LeuThrAspAspGinAspValGluLeuGlySerLeuGinValMetAsn505560LysThrArgLyslie.MetGluHisGlyGlyAlaThrPhelieAsnAla65707580PheValThrThrProMetCysCysProSerArgSerSerMetLeuThr859095GlyLysTyrValHisAsnHisAsnVal.TyrThrAsnAsnGluAsnCys100105110SerSerProSerT卬GinAlaMetHisGluProArgThrPheAlaVal115120125TyrLeuAsnAsnThrGlyTyrArgThrAlaPhePheGlyLysTyrLeu130135140AsnGluTyrAsnGlySerTyrlieProProGlyTrpArgGluTrp.Leu145150155160GlyLeulieLysAsnSerArgPheTyrAsnTyrThrValCysArgAsn165170175GlylieLysGluLysHisGlyPheAspTyrAlaLysAspTyrPheThr180185190AspLeulieThrAsnGluSerlieAsnTyrPheLysMetSerLysArg195200205MetTyrProHisArgProValMetMetVallieSerHisAlaAlaPro210215220HisGlyProGluAspSerAlaProGinPheSerLysLeuTyrProAsn225230235240AlaSerGinHislieThrProSerTyrAsnTyrAlaProAsnMetAsp245250255LysHisTrplieMetGinTyrThrGlyProMetLeuProlieHisMet260265270GluPheThrAsnlieLeuGinArgLysArgLeuGinThrLeuMetSer275280285ValAspAspSerValGluArgLeuTyrAsnMetLeuValGluThrGly290295300GluLeuGluAsnThrTyrlielieTyrThrAlaAspHisGlyTyrHis305310315320lieGlyGinPheGlyLeuValLysGlyLysSerMetProTyrAspPhe325330335AsplieArgValProPhePhelieArgGlyProSerValGluProGly340345350SerlieValProGinlieValLeuAsnlieAspLeuAlaProThrlie355360365LeuAsplieAlaGlyLeuAspThrProProAspValAspGlyLysSer370375380ValLeuLysLeuLeuAspProGluLysProGlyAsnArgPheArgThr385390395400AsnLysLysAlaLyslieTrpArgAspThrPheLeuValGluArgGly405410415LysPheLeuArgLysLysGluGluSerSerLysAsnlieGinGinSer420425430AsnHisLeuProLysTyrGluArgValLysGluLeuCysGinGinAla435440445ArgTyrGinThrAlaCysGluGinPro.GlyGinLysTrpGinCyslie450455460GluAspThrSerGlyLysLeuArglieHisLys.CysLysGlyProSer465470475480AspLeuLeuThrVaJArgGinSerThrArgAsnLeuTyrAlaArgGly485490495PheHisAspLysAspLysGluCysSerCysArgGluSerGlyTyrArg500505510AlaSerArgSerGinArgLysSerGinArgGinPheLeuArgAsnGin515520525GlyThrProLysTyrLysProArgPheValHisThrArgGinThrArg530535540<formula>formulaseeoriginaldocumentpage192</formula>ArgArgArgLysLysGluArgLysGluLysArgArgGinArgLysGly725730735GluGluCysSerLeuProGlyLeuThrCysPheThrHisAspAsnAsn740745750HisTrpGinThrAlaProPheTrpAsnLeuGlySerPheCysAlaCys755760765ThrSerSerAsnAsnAsnThrTyrTrpCysLeuArgThrValAsnGlu770775780ThrHisAsnPheLeuPheCysGluPheAlaThrGlyPheLeuGluTyr785790795800PheAspMetAsnThrAspProTyrGin.LeuThrAsnThrValHisThr805810815ValGluArgGlylieLeuAsnGinLeuHisValGinLeuMetGluLeu820825830ArgSerCysGinGlyTyrLysGin.CysAsnProArgProLysAsnLeu835840845AspValGlyAsnLysAspGlyGlySerTyrAspLeuHisArgGlyGin850855860LeuTrpAspGlyTrpGluGly865870<210〉30<211〉4279〈212〉腿<213〉智人<400〉30gggccatttctggacaacagctgctattttcacttgagcccaagttaatttctcggggag60ttctcgggcgcgcacaggcagctcggtttgccctgcgattgagctgcgggtcgcggccgg120cgccggcctctccaatggcaaatgtgtgtggctggaggcgagcgcgaggctttcggcaaa180ggcagtcgagtgtttgcagaccggggcgagtcctgtgaaagcagataaaagaaaacattt240attaacgtgtcattacgaggggagcgcccggccggggctgtcgcactccccgcggaacat300ttggctccctccagctcctagagaggagaagaagaaagcggaaaagaggcagattcacgt360cgtttccagccaagtggacctgatcgatggccctcctgaatttatcacgatatttgattt420attagcgatgccccctggtttgtgtgttacgcacacacacgtgcacacaaggctctggct480cgcttccctccctcgtttccagctcctgggcgaatcccacatctgtttcaactctccgcc540gagggcgagcaggagcg,gtgtgtcgaatctgcgagtg,agggacgagggaaa卿600aaca犯gccacagacgcaacttgagactcccgcatcccaaaagaagcaccagatcagcaa660aaaaagaagatgggccccccgagcctcgtgctgtgcttgctgtccgcaactgtgttctcc720ctgctgggtggaagctcggccttcctgtcgcaccaccgcctgaaaggcaggtttcagagg780gaccgcaggaacatccgccccaacatceitcctggtgctgacggacgaccaggatgtggag840ctgggttccatgceiggtgeitgaacaagacccggcgcatcatggagcagggcggggcgcac900ttcatcaacgccttcgtgaccacacccatgtgctgcccctcacgctcctccatcctcacc960ggcaagtacgtccacaaccacaacacctacaccaacaatgagaactgctcctcgccctcc1020tggcaggcacagcacgagagccgcacctttgccgtgtacctcaatagcactggctaccgg1080acagctttcttcgggaagtatcttaatgaatacaacggctcctacgtgccacccggctgg1140aaggagtgggtcggactccttaaaaactcccgcttttataactacacgctgtgtcggaac1200ggggtgaaagagaagcacggctccgactactccaaggattacctcacagacctcatcacc1260aatgacagcgtgagcttcttccgcacgtccaagaagatgtacccgcacaggccagtcctc1320atggtcatcagccatgcagccccccacggccctgaggattcagccccacaatattcacgc1380ctcttcccaaacgcatctcagcacatcacgccgagctacaactacgcgcccaacccggac1440aaacactggatcatgcgctacacggggcccatgaagcccatccacatggaattcaccaac1500atgctccagcggaagcgcttgcagaccctcatgtcggtggacgactccatggagacgatt1560tacaacatgctggttgagacgggcgagctggacaacacgtacatcgtatacaccgccgac1620cacggttaccacatcggccagtttggcctggtgaaagggaaatccatgccatatgagttt1680gacatcagggtcccgttctacgtgaggggccccaacgtggaagccggctgtctgaatccc1740cacatcgtcctcaacattgacctggcccccaccatcctggacattgcaggcctggacata1800cctgcggatatggacgggaaatccatcctcaagctgctggacacggagcggccggtgaat1860cggtttcacttgaaaaagaagatgagggtctggcgggactccttcttggtggagagaggc1920aagctgctacacaagagagacaatgacaaggtggacgcccaggaggagaactttctgccc1980aagtaccagcgtgtgaaggacctgtgtcagcgtgctgagtaccagacggcgtgtgagcag2040ctgggacagaagtggcagtgtgtggaggacgccacggggaagctg卿ctgca恤gtgc2100aagggccccatgcggctgggcggcagcagagccctctccaacctcgtgcccaagtactac2160gggcagggcagcgaggcctgcacctgtgacagcggggactacaagctcagcctggccgga2220cgccgg犯aa犯ctcttcaagaagaagtac犯ggccagcta/tgtccgcagtcgctccatc2280cgctcagtggccatcgaggtggacggc鄉(xiāng)gtgtaccacgtaggcctgggtgatgccgcc2340cagccccgaaacctcaccaagcggcactggccaggggcccctgaggaccaagatgacaag2400geitggtggggacttcELgtggcactgggiggccttcccgactactcagccgcc犯ccccatt2460a犯gtgacacatcggtgctacatcctagagaacgacacagtccagtgtgacctggacctg2520tacaagtccctgcaggcctggaaagaccacaagctgcacatcgaccacgagattgaaacc2580ctgcagaacaaaattaagaacctgagggaagtccgaggtcacctgaagaaaaagcggcca2640g犯gaatgtgactgtcac犯aatcagctaccacacccagcacaaaggccgcctcaagcac2700agaggctccagtctgcatcctttcaggaagggcctgcaagagaaggacaaggtgtggctg2760ttgcgggagcag犯gcgcaagaagaaactccgc犯gctgctcaagcgcctgcagaac肌c2820gacacgtgcagcatgccaggcctcacgtgcttcacccacgacaaccagcactggcagacg2880gcgcctttctggacactggggcctttctgtgcctgcaccagcgcc犯caat犯cacgtac2940tggtgcatgaggaccatcaatgagactcacaatttcctcttctgtgaatttgcaactggc3000ttcctagagtactttgatctcaacacagacccctaccagctgatgaatgcagtgaacaca3060ctggacagggatgtcctcaaccagctacacgtacagctcatggagctgaggagctgc犯g3120ggttacaagcagtgtaacccccggactcgaaacatggacctgggacttaaagatggagga3180agctatgagcaatacaggcagtttcagcgtcga卿tggccagaaat,gagaccttct3240tccaaatcactgggacaactgtgggaaggctgggaaggtt犯gaaacaacagaggtggac3300ctccaaaaacatagaggcatcacctgactgcacaggcaatgaaaaaccatgtgggtgatt3360tccagc卿cctgtgctattggccaggaggcctgaga犯gc犯gcacgcactctcagtca3420acatgacagattctggaggat犯ccagcaggagcagagataacttcaggaagtccatttt3480tgcccctgcttttgctttggattatacctcaccagctgcacaaaatgcattttttcgtat3540c肌aaagtcaccactaaccctcccccagaagctcacaEiagg犯aacggagagagcgaigcg3600agageigatttccttgg犯atttctcccaagggcg犯agtcattggaattttt犯atc由3660ggggaaaagcagtcctgttctaaatcctcttattcttttggtttgtcaca犯gaagg犯c3720taagaagcaggacagaggcaacgtggagaggctgaaaacagtgcagagacgtttgacaat3780gagtcagtagcacaaaagagatgacatttacctagcatataaaccctggttgcctctgaa3840gaaactgccttcattgtatatatgtgactatttacatgtaatcaacatggg犯cttttag3900gggaacctaataagaaatcccaattttcaggagtggtggtgtcaataaacgctctgtggc3960cagtgtaaaagaaaaaaaaaaaaaattgtggacatttctgttcctgtccagataccattt4020ctcctagtatttctttgttatgtcccagaactgatgttttttttttaaggtactgaaaag4080aaatgaagttgatgtatgtcccaagttttgatgaaactgtatttgtaaaaaaaattttgt4140agtttaagtattgtcatacagtgttcaaaaccccagccaatgaccagc.agttggtatgaa4200gaacctttgacattttgtaaaaggccatttcttggggaaaaaaaaetaaaaaaa犯肌a犯4260aaaaaaaaaaaaaaaaaaa4279<210〉31<211〉870<212〉PRT〈213〉智人〈400〉31MetGlyProProSerLeuValLeuCysLeuLeuSerAlaThrValPhe151015SerLeuLeuGlyGlySerSerAlaPheLeuSerHisHisArgLeuLys202530GlyArgPheGinArgAspArgArgAsnlieArgProAsnlielieLeu354045ValLeuThrAspAspGinAspValGluLeuGlySerMetGinValMet505560AsnLysThrArgArglieMetGluGinGlyGlyAlaHisPhelieAsn65707580AlaPheValThrThrProMetCysCysProSerArgSerSerlieLeu859095ThrGlyLysTyrValHisAsnHisAsnThrTyrThrAsnAsnGluAsn100105110CysSerSerProSerTrpGinAlaGinHisGluSerArgThrPheAla115120125ValTyrLeuAsnSerThrGlyTyrArgThrAlaPhePheGlyLysTyr130135140LeuAsnGluTyrAsnGlySerTyrValProProGlyTrpLysGluTrp145150155160ValGlyLeuLeuLysAsnSerArgPheTyrAsnTyrThrLeuCysArg165170175AsnGlyValLysGluLysHisGlySerAspTyrSerLysAspTyrLeu180185190ThrAspLeulieThrAsnAspSerValSerPhePheArgThrSerLys195200205LysMetTyrProHisArgProValLeuMetVallieSerHisAlaAla210215220ProHisGlyProGluAspSerAlaProGinTyrSerArgLeuPhePro225230235240AsnAlaSerGinHislieThrProSerTyrAsnTyrAlaProAsnPro245250255AspLysHisTrplieMetArgTyrThrGlyProMetLysProlieHis260265270MetGluPheThrAsnMetLeuGinArgLysArgLeuGinThrLeuMet275280285SerValAspAspSerMetGluThrlieTyrAsnMetLeuValGluThr290295300GlyGluLeuAspAsnThrTyrlieValTyrThrAlaAspHisGlyTyr305310315320HislieGlyGinPheGlyLeuValLysGlyLysSerMetProTyrGlu325330335PheAsplieArgValProPheTyrValArgGlyProAsnValGluAla340345350GlyCysLeuAsnProHislieValLeuAsnlieAspLeuAlaProThr355360365lieLeuAsplieAlaGlyLeuAsplieProAlaAspMetAspGlyLys370375380SerlieLeuLysLeuLeuAspThrGluArgProValAsnArgPheHis385390395400LeuLysLysLysMetArgValTrpArgAspSerPheLeuValGluArg405410415GlyLysLeuLeuHisLysArgAspAsnAspLysValAspAlaGinGlu420425430GluAsnPheLeuProLysTyrGinArgValLysAspLeuCysGinArg435440445<formula>formulaseeoriginaldocumentpage200</formula>LysAspHisLysLeuHislieAspHisGlulieGluThrLeuGinAsn625630635640LyslieLysAsnLeuArgGluValArgGlyHisLeuLysLysLysArg645650655ProGluGluCysAspCysHisLyslieSerTyrHisThrGinHisLys660665670GlyArgLeuLysHisArgGlySerSerLeuHisProPheArgLysGly675680685LeuGinGluLysAspLysValTrpLeuLeuArgGluGinLysArgLys690695700LysLysLeuArgLysLeuLeuLysArgLeuGinAsnAsnAspThrCys705710715720SerMetProGlyLeuThrCysPheThrHisAspAsnGinHisTrpGin725730735ThrAlaProPheTrpThrLeuGlyProPheCysAlaCysThrSerAla740745750AsnAsnAsnThrTyrTrpCysMetArgThrlieAsnGluThrHisAsn755760765PheLeuPheCysGluPheAlaThrGlyPheLeuGluTyrPheAspLeu770775780AsnThrAspProTyrGinLeuMetAsnAlaValAsnThrLeuAspArg785790795800AspValLeuAsnGinLeuHisValGinLeuMetGluLeuArgSerCys805810815LysGlyTyrLysGinCysAsnProArgThrArgAsnMetAspLeuGly820825830LeuLysAspGlyGlySerTyrGluGinTyrArgGinPheGinArgArg835840845LysTrpProGluMetLysArgProSerSerLysSerLeuGlyGinLeu850855860TrpGluGlyTrpGluGly865870<210>32<211>6<212>PRT<213〉智人<220〉<221>變體〈222〉(l)..(l)<223>Leu或Val<220〉<221〉misc—feature〈222〉(1)..(3)〈223>Xaa可以是任何天然氨基酸<220><221>變體<222〉(2)..(2)<223〉Cys或Ser<220〉<221〉變體<222>(3)..(3)<223〉任何氨基酸〈400〉32XaaXaaXaaProSerArg15<210〉33<211〉23<212〉PRT<213>人工的〈220〉<223〉來自人芳基硫酸酯酶A的序列<220〉<221>肽<222>(l)..咖<223〉合成的FGly形成底物;來自人芳基硫酸酯酶A的一級序列<400〉33MetThrAspPheTyrValProValSerLeuCysThrProSerArgAla151015AlaLeuLeuThrGlyArgSer20〈210〉34<211>16<212>PRT<213〉人工的<220〉<223〉A(chǔ)SA65-80肽的變體,其中對于FGly形成關(guān)鍵的殘基Cys69、Pro71和Arg73被混雜<220〉<221〉MISC_FEATURE<222〉(1)..(16)<223〉混雜寡肽<400〉34ProValSerLeuProThrArgSerCysAlaAlaLeuLeuThrGlyArg151015<210>35<211〉16<212〉PRT<213〉人工的<220><223〉A(chǔ)SA65-80肽的變體,其中Cys69被絲氨酸替換<220><221〉MISC—FEATURE<222〉(l)..(16)<223>Ser69寡肽<400〉35ProValSerLeuSerThrProSerArgAlaAlaLeuLeuThrGlyArg151015<210〉36<211〉19〈212〉醒<213〉人工的<220〉〈223〉人FGE特異性PCR引物<220〉<221〉tnisc—feature<222>(1)..(19)<223〉人FGE特異性PCR引物1199nc<400〉36ccaatgtaggtcagacacg19<210><211〉<212><213〉3716腿人工的<220〉<223〉人FGE特異性PCR引物〈220〉<221〉<222〉<223>misc_feature(1)…(16)人FGE特異性正向PCR引物lc<400>37acatggcccgcgggac16<210〉<211><212>〈213〉3819DNA人工的<220〉<223〉人FGE特異性PCR引物<220>〈221〉〈222〉<223>misc—feature(l)..(19)人FGE特異性反向PCR引物1182c〈400〉38cgactgctccttggactgg19〈210〉39<211〉24<212〉腿<213〉人工的<formula>formulaseeoriginaldocumentpage206</formula><223〉c-myc-特異性引物〈400〉41cccaagcttacaggtcttcttcagaaatcagcttttgttcgtccatggtgggcaggc57<210>42<211〉54<212〉腿<213〉人工的<220><223>RGS-His6-特異性引物<220><221〉misc_feature.<222〉(1)..(54)<223>RGS-His6-特異性引物〈400〉42cccaagcttagtgatggtgatggtgatgcgatcctctgtccatggtgggcaggc54<210〉43<211>15〈212〉PRT<213>人工的<220><223>人FGE制備物的胰蛋白酶寡肽<220〉<221>MISC—FEATURE<222〉(1)..(15)〈223>人FGE制備物的胰蛋白酶寡肽〈400〉43SerGinAsnThrProAspSerSerAlaSerAsnLeuGlyPheArg151015<210〉44<211〉19<212>PRT<213>人工的〈220>〈223〉人FGE制備物的胰蛋白酶寡肽〈220〉<221〉MISC—FEATURE<222〉(1)..(19)〈223〉人FGE制備物的胰蛋白酶寡肽<400〉44MetValProlieProAlaGlyValPheThrMetGlyThrAspAspPro151015GinlieLys<210〉45〈211〉906<212>腿〈213〉智人<400〉45atggcccggcatgggttaccgctgctgcccctgctgtxgctcctggtcggcgcgtggctc60aagctaggaaatggacaggctactagcatggtccaactgcagggtgggagattcctgatg120ggaacaaattctccagacagcag柳tggtgaagggcctgtgcgggaggcgacagtgaaa180ccctttgccatcgacatatttcctgtcaccaacaaagatttcagggattttgtcagggag240aaaaagtatcggacagaagctgagatgtttggatggagctttgtctttgaggactttgtc300tctgatgagctgagaaacaaagccacccagccaatgaagtctgtactctggtggcttcca360gtggaaaaggcattttggaggcagcctgcaggtcctggctctggcatccgagagagactg420gagcacccagtgttacacgtgagctggaatgacgcccgtgcctactgtgcttggcgggga480aaacgactgcccacggaggaagagtgggagtttgccgcccgagggggcttgaagggtcaa540gtttacccatgggggaactggttccagccaaaccgcaccaacctgtggcagggaaagttc600cccaagggagac犯agctgaggatggcttccatggagtctccccagtgaatgctttcccc660gcccagaacaactacgggctctatgacctcctggggaacgtgtgggagtggacagcatca720ccgtaccaggctgctgagcaggacatgcgcgtcctccggggggcatcctggatcgacaca780gctgatggctctgccaatcaccgggcccgggtcaccaccaggatgggcaacactccagat840tcagcctcagacaacctcggtttccgctgtgctgcagacgcaggccggccgccaggggag900ctgtaa906<210〉46〈211〉301<212>PRT<213〉智人〈400〉46MetAlaArgHisGlyLeuProLeuLeuProLeuLeuSerLeuLeuValGlyAlaTrpLeuLysLeuGlyAsnGlyGinAlaThrSerMetValGin202530LeuGinGlyGlyArgPheLeuMetGlyThrAsnSerProAspSerArg354045AspGlyGluGlyProValArgGluAlaThrValLysProPheAlalie505560AspliePheProValThrAsnLysAspPheArgAspPheValArgGlu65707580LysLysTyrArgThrGluAlaGluMetPheGlyT卬SerPheValPhe859095GluAspPheValSerAspGluLeuArgAsnLysAlaThrGinProMet100105110LysSerValLeuTrpTrpLeuProValGluLysAlaPheTrpArgGin115120125ProAlaGlyProGlySerGlylieArgGluArgLeuGluHisProVal130135140LeuHisValSerTrpAsnAspAlaArgAlaTyrCysAlaTrpArgGly145150155160LysArgLeuProThrGluGluGluTrpGluPheAlaAlaArgGlyGly165170175LeuLysGlyGinValTyrProTrpGlyAsnTrpPheGinProAsnArg180185190ThrAsnUuTrpGinGlyLysPheProLysGlyAspLysAlaGluAsp195200205GlyPheHisGlyValSerProValAsnAlaPheProAlaGinAsnAsn210215220TyrGlyLeuTyrAspLeuLeuGlyAsnValTrpGluTrpThrAlaSer225230235240ProTyrGinAlaAlaGluGinAspMetArgValLeuArgGlyAlaSer245250255TrplieAspThrAlaAspGlySerAlaAsnHisArgAlaArgValThr260265270ThrArgMetGlyAsnThrProAspSerAlaSerAspAsnLeuGlyPhe275280285ArgCysAlaAlaAspAlaGlyArgProProGlyGluLeu290295300<210〉47<211>927<212〉DNA〈213〉小家鼠<400〉47atgcgctctgagttctggttccccagcatgggttccttgctccctccggtgttgctgctg60aggctcctgtcctgccccaggcttcagctaggacatgcccaggatcctgccatggtgcat120ctgccaggtggccggtttctgatggggacagacgctccagatggcag卿cggtgaaggg180cctgcccgggaagtgacagtaaaaccctttgccatcgacatatttccagtcaccaataaa240gacttcagggagtttgtcagggagaagaagtaccagactgaagccgaggcattcgggtgg300agcttcgtctttgaggattttgtctcccctgagctcagaaagcaagaaaatctgatgccg360gctgttcactggtggcagccagtgccaaaggcattttggaggcagcctgcaggtcccggc420tctggcatccg卿get犯ctggagcttcccgtggtacacgtgagctgg犯cgacgctggt480gcttactgcgcatggcggggg柳cgcttgcccacagaagaggagtgggagtttgcagcc540cgagggggcttgaagggtcaggtttatccatgggggaaccggttccagccaaaccgcacc600aacttatggcagggaaagttccccaaaggtgacaaagctgaagatggttttcatggactg660tcaccagtgaacgctttccccccacagaacaactacggactgtatgacctcatgggc犯t720gtgtgggagtggacagcgtccacataccaacctgctggccaggacatgcgtgtcctccgg780ggggcatcatggatcgacaccgcagacggctctgctaatcacagggctcgggtcaccacc840aggatgggaaacactccagactcagcctcagacaacctgggcttccgctgcgcctccagt900gcaggccgaccgaaggaggacctgtga927<210>48<211>308<212>PRT〈213〉小家鼠<400〉48MetArgSerGluPheTrpPheProSerMetGlySerLeuLeuProPro151015ValLeuLeuLeuArgLeuLeuSerCysProArgLeuGinLeuGlyHis202530AlaGinAspProAlaMetValHisLeuProGlyGlyArgPheLeuMet354045GlyThrAspAlaProAspGlyArgAspGlyGluGlyProAlaArgGlu505560ValThrValLysProPheAlalieA印liePheProValThrAsnLys65707580AspPheArgGluPheValArgGluLysLysTyrGinThrGluAlaGlu859095AlaPheGlyTrpSerPheValPheGluAspPheValSerProGluLeu100105110ArgLysGinGluAsnLeuMetProAlaValHisTrpTrpGinProVal115120125ProLysAlaPheTrpArgGinProAlaGlyProGlySerGlylieArg130135140GluLysLeuGluLeuProValValHisValSerTrpAsnAspAlaGly145150155160AlaTyrCysAlaTrpArgGlyArgArgLeuProThrGluGluGluTrp165170175GluPheAlaAlaArgGlyGlyLeuLysGlyGinValTyrProTrpGly180185190AsnArgPheGinProAsnArgThrAsnLeuTrpGinGlyLysPhePro195200205LysGlyAspLysAlaGluAspGlyPheHisGlyLeuSerProValAsn210215220AlaPheProProGinAsnAsnTyrGlyLeuTyrAspLeuMetGlyAsn225230235240ValTrpGluTrpThrAlaSerThrTyrGinProAlaGlyGinAspMet245250255ArgValLeuArgGlyAlaSerTrplieAspThrAlaAspGlySerAla260265270AsnHisArgAlaArgValThrThrArgMetGlyAsnThrProAspSer275280285AlaSerAspAsnLeuGlyPheArgCysAlaSerSerAlaGlyArgPro290295300LysGluAspLeu305<210〉49〈211〉855<2〗.2〉DNA〈213〉小家鼠〈400〉49atggtccccattcctgctggagtattcacaatgggcactgatgatcctcagatcaggcag60gatggagaagcccctgccaggagagtcactgttgatggcttttacatggacgcctatgaa120gtcagcaatgcggattttgagaagtttgtgaactcgactggctatttgacagaggctgag180aagtttggagactctttcgtctttgaaggcatgttgagcgagcaagtgaaaacgcatatc240caccaggcagttgcagctgctccatggtggttgcctgtcaagggagctaattggagacac300ccagagggtccggactccagtattctgcacaggtcaaatcatccggttctccatgtttcc360tggaacgatgctgttgcctactgcacatgggcgggcaagaggttgcctactgaggcagag420tgggaatacagctgtagaggaggcctgcagaacaggcttttcccctggggcaacaaactg480cagcccaaaggacagcattatgccaacatctggcagggcaagtttcctgtgagcaacact540ggcgaggatggcttccaaggaactgcccccgttgatgcctttcctcccaatggctatggc600ttatacaacatagtggggaatgtgtgggagtggacctcagactggtggactgttcaccat660tctgttgaggaaacgttc犯ccca犯gggtcccacttctgggaaagaccgagtg犯gaag720ggtggatcctacatgtgccataagtcctattgctataggtaccgctgtgcagctcgaagc780cagaacacaccagatagctctgcatccaacctgggattccgatgtgcagccgaccacctg840cccaccgcagactga855<210〉50〈211〉284<212〉PRT<213>小家鼠<400〉50MetValProlieProAlaGlyValPheThrMetGlyThrAspAspPro151015GinlieArgGinAspGlyGluAlaProAlaArgArgValThrValAsp202530GlyPheTyrMetAspAlaTyrGluValSerAsnAlaAspPheGluLys354045PheValAsnSerThrGlyTyrLeuThrGluAlaGluLysPheGlyAsp505560SerPheValPheGluGlyMetLeuSerGluGinValLysThrHislie65707580HisGinAlaValAlaAlaAlaProTrpTrpLeuProValLysGlyAla85恥95AsnTrpArgHisProGluGlyProAspSerSerlieLeuHisArgSer100105110AsnHisProValUuHisValSerTrpAsnAspAlaValAlaTyrCys115120125ThrTrpAlaGlyLysArgLeuProThrGluAlaGluTrpGluTyrSer130135140<formula>formulaseeoriginaldocumentpage216</formula>gactgtggctgccaaaagctcgaccggaaggccccggatatgccgtccatttccggacaa120gtgtgccagc犯cgagcacagggtgcacacagccactaccgggattactatggcgaactg180gagccaaatattgcggacatgtcactgcttccgggaggcacggtttacatgggtactgac240aaaccgcactttccggccgaccgcgaggctccggaacggcaggtgaagctgaatgacttc300tacatcgacaagtatgaggtttccaacgaagcctttgcgaagtttgttctgcacactaac360tacaccacggaggctgagcgatatggcgacagttttctgtttaagagccttttgagccca420ttggagcagaagaacctagaggacttccgagtggcgagcgctgtctggtggtacaaagtg480gccggcgtgaactggcgacatccaaatggcgtggacagcgatatagaccacttaggccga540cacccggtagtgcacgtatcgtggcgcgacgctgtggagtactgtaagtgggccggcaag600cggttgcccagcgaggcggagtgggaggcggcttgc鄉(xiāng)ggcggcaaggagcgca犯ctg660tttccctggggcaacaagctgatgccaaggaatgaacattggctgaacatctggcaggga720gactttcccgatggcaacctggctgaagatgggtttgagtacaccagccccgtggatgcc780ttccgacagaatatttacgacctgcacaacatggtgggcaacgtctgggagtggacggca840gatctgtgggacgtaaatgacgttagcgat犯tccaaatcgggtcaagaagggcggttct900tatctgtgtcacaagtcctactgctacaggtacaggtgcgcggcacgctcgcag犯caca%0g卿acagttcagccggtaacctgggttttcggtgcgcca卿atgcgtga1011<210〉52〈211〉336<212〉PRT〈213〉黃果蠅〈400〉52MetThrThrlielieLeuValLeuPhelieTrplieValLeuPheAsn151015AspValSerSerAspCysGlyCysGinLysLeuAspArgLysAlaPro202530AspMetProSerlieSerGlyGinValCysGinGinArgAlaGinGly354045AlaHisSerHisTyrArgAspTyrTyrGlyGluLeuGluProAsnlie505560AlaAspMetSerLeuLeuProGlyGlyThrValTyrMetGlyThrAsp65707580LysProHisPheProAlaAspArgGluAlaProGluArgGinValLys859095LeuAsnAspPheTyrlieAspLysTyrGluValSerAsnGluAlaPhe100105110AlaLysPheValLeuHisThrAsnTyrThrThrGluAlaGluArgTyr115120125GlyAspSerPheLeuPheLysSerLeuLeuSerProLeuGluGinLys130135140AsnLeuGluAspPheArgValAlaSerAlaValTrpTrpTyrLysVal145150155160AlaGlyValAsnTrpArgHisProAsnGlyValAspSerAsplieAsp165170175HisLeuGlyArgHisProValValHisValSerTrpArgAspAlaVal180185190GluTyrCysLysT卬AlaGlyLysArgLeuProSerGluAlaGluTrp195200205GluAlaAlaCysArgGlyGlyLysGluArgLysLeuPheProTrpGly210215220AsnLysLeuMetProArgAsnGluHisTrpLeuAsnlieTrpGinGly225230235240AspPheProAspGlyAsnLeuAlaGluAspGlyPheGluTyrThrSer245250255ProValAspAlaPheArgGinAsnlieTyrAspLeuHisAsnMetVal260265270GlyAsnValT卬GluTrpThrAlaAspLeuTrpAspValAsnAspVal275280285SerAspAsnProAsnArgValLysLysGlyGlySerTyrLeuCysHis290295300LysSerTyrCysTyrArgTyrArgCysAlaAlaArgSerGinAsnThr305310315320GluAspSerSerAlaGlyAsnLeuGlyPheArgCysAlaLysAsnAla325330335<210>53〈211〉870<212〉■<213〉A(chǔ)nophelesgambiae<400〉53ccggagagcttgctcgatctggtggaacattccaagcggttcgaagacatgagccttatc60ccaggeiggtgaatatgtaatcggcacaaatgaacctatcttcgtcaaggatcgcgaatca120ccggcccggcccgcgacgatccgcgacttttacctcgaccagtacgaagtctccaacgca180cagttcaaggcattcgtcgaccagacgggctacgtcacggaggcggaaaagtttggcgac240agcttcgtcttccagcagctgctcagcgaaccggtgcgccagcagtacgaagatttccgc300gtggcggcggcgccctggtggtacaaggtacgtggagcctcctggcagcatccggaaggt360gatgtgtcacgtgatataagcgaccgattggaccatccggtggtgcacgtgtcctggaac420gatgcggtcgcgtactgcgcctgga卿ggaagcgcctgccgacggaagcggaatgggaa柳gcggcctgccggggcggtcgcaagcagaagctgttcccctggggtaacaagctgatgccg540aaggagcagcacatgatgaacatatggcagggcgagttcccggacELgcaatctgaaggag600gatggctacgagaccacctgcccggtgacgtccttccgccagaacccgttcgagctgtac660犯catcgttggcaacgtgtgggagtggacggcggatctttgggacgcgaaggatgcggcc720atcgagcgcaagccgggcagcgatccaccgaatcgggtgaaaaagggtggctcatacctg780tgtcacgaatcgtactgctatcgctatcgctgtgcggctcgatcgc柳acsccgaggac840agttcggcgggcaatctgggcttccggtgc870<210>54<211〉290<212〉PRT<213〉A(chǔ)nophelesgambiae<400〉54ProGluSerLeuLeuAspLeuValGluHisSerLysArgPheGluAspMetSerLeulieProGlyGlyGluTyrVallieGlyThrAsnGluPro202530liePheValLysAspArgGluSerProAlaArgProAlaThrlieArg354045AspPheTyrLeuAspGinTyrGluValSerAsnAlaGinPheLysAla505560PheValAspGinThrGlyTyrValThrGluAlaGluLysPheGlyAsp65707580SerPheValPheGinGinLeuLeuSerGluProValArgGinGinTyr859095GluAspPheArgValAlaAlaAlaProTrpTrpTyrLysValArgGly'100105110AlaSerTrpGinHisProGluGlyAspValSerArgAsplieSerAsp115120125ArgLeuAspHisProValValHisValSerTrpAsnAspAlaValAla130135140TyrCysAlaTrpLysGlyLysArgLeuProThrGluAlaGluTrpGlu145150155160AlaAlaCysArgGlyGlyArgLysGinLysLeuPheProTrpGlyAsn165170175LysLeuMetProLysGluGinHisMetMetAsnlieTrpGinGlyGlu180185190PheProAspSerAsnLeuLysGluAspGlyTyrGluThrThrCysPro195200205ValThrSerPheArgGinAsnProPheGluLeuTyrAsnlieValGly210215220AsnValTrpGluTrpThrAlaAspLeuTrpAspAlaLysAspAlaAla225230235240lieGluArgLysProGlySerAspProProAsnArgValLysLysGly245250255GlySerTyrLeuCysHisGluSerTyrCysTyrArgTyrArgCysAla260265270AlaArgSerGinAsnThrGluAspSerSerAlaGlyAsnUuGlyPhe275280285ArgCys290<210〉55〈211〉945<212〉DNA<213>天藍(lán)色鏈霉菌〈400〉55gtggccgtggccgccccgtcccccgcggccgccgcggagccggggcccgccgcccgtccg60cgctcgacccgcggacaggtgcgcctgccgggcggtgagttcgcgatgggggacgccttc120ggggagggatatccggccgacggcgagacacccgtgcacacggtgcgcctgcggcccttc180cacatcgacgagaccgccgtcaccaacgcccggttcgccgccttcgtcaaggcgaccggc240catgtgaccgacgccgaacgcttcggctcctcggccgtcttccacctggtcgtcgccgcc300ccggacgccgacgtcctcggcagcgccgccggcgccccctggtggatcaacgtgcggggc360gcccactggcgccgccccgagggcgcccgctccgacatcaccggccggccgaaccatccg420gtcgtccacgtctcctggaacgatgccaccgcctacgcgcggtgggccggcaagcgcctg480cccaccgaggccgaatgggagtacgccgcccgcgggggactggccggccgccgctacgcc540tggggcgacgagctgaccccgggcggccggtggcgctgcaacatctggcagggccgcttc600ccgcacgtcaacacggccgaggacgggcacctgagcaccgcaccggtcaagtcctaccgg660cccaacggccacggcctgtggaacaccgcgggcaacgtgtgggaatggtgctccgactgg720ttctcgcccacctactacgccgaatcacccaccgtcgacccgcacggccccgggaccggg780gcggcacgggtgctgcgcggcggctcctacctgtgccacgactcctactgcaaccgctac840cgggtcgccgcccgctcctccaacaccccggactcctcgtccggcaacctcggattccgc900tgcgccaacgacgcggacctcacgtccggatcagccgctgagtga945<210〉56<211〉314<212〉PRT<213〉天藍(lán)色鏈霉菌<400>56MetAlaValAlaAlaProSerProAlaAlaAlaAlaGluProGlyPro151015AlaAlaArgProArgSerThrArgGlyGinValArgUuProGlyGly202530GluPheAlaMetGlyAspAlaPheGlyGluGlyTyrProAlaAspGly354045GluThrProValHisThrValArgLeuArgProPheHislieAspGlu505560ThrAlaValThrAsnAlaArgPheAlaAlaPheValLysAlaThrGly65707580HisValThrAspAlaGluArgPheGlySerSerAlaValPheHisLeu859095ValValAlaAlaProAspAlaAspValLeuGlySerAlaMaGlyAla100105110ProTrpTrplieAsnValArgGlyAlaHisTrpArgArgProGluGly115120125AlaArgSerAsplieThrGlyArgProAsnHisProValValHisVal130135140SerTrpAsnAspAlaThrAlaTyrAlaArgTrpAlaGlyLysArgLeu145150155160ProThrGluAlaGluTrpGluTyrAlaAlaArgGlyGlyLeuAlaGly165170175ArgArgTyrAlaTrpGlyAspGluLeuThrProGlyGlyArgTrpArg180185190CysAsnlieTrpGinGlyArgPheProHisValAsnThrAlaGluAsp195200205GlyHisLeuSerThrAlaProValLysSerTyrArgProAsnGlyHis210215220GlyLeuTrpAsnThrAlaGlyAsnValTrpGluTrpCysSerAspTrp225230235240PheSerProThrTyrTyrAlaGluSerProThrValAspProHisGly245250255ProGlyThrGlyAlaAlaArg260ValLeuArgGly265GlySerTyrLeuCys270HisAspSer275TyrCysAsnArgTyrArgValAla280AlaArgSerSerAsn285ThrProAsp290SerSerSerGly295AsnLeuGlyPheArgCysAlaAsnAsp300AlaAspLeu305ThrSerGlySer310AlaAlaGlu〈210〉57〈211〉1005<212〉腿〈213〉Corynebacteriumefficiens〈400〉57gtggttcgccatcgactgggccaccggccctgcacactgaggattacgtccatgagtaacGOtgctgctccccgtcaagcgcacaatggcgtaccactacccgggatttatcagatcctgtc120aatcccaccactccatgcaacccggaacaatcccgcgatgctgtgacactgccgggtgga180gctttccacatgggcgatcatcacggggaggggtacccggcggacggggaggggccagta240catgaggttcacctcgcccccttcggcattaatgtcaccacggtcacgaatgccgagttc300ggacgatttattgaagccacagggtatecgacgacagcggaacgctacggtgtctcggct360gtattctacgcagcgttccaagggcaacgcgctgacattcttcgccaggttcccggcgtg420ccctggtggctggcggtcaagggtgcgaactggcagcgtcccaacggccccggatccacc480ctggacgggcttgaggaccaccccgtcgttcacgtttcctgggatgatgccgttgcctac540tgcacctgggctggcggtcgtctgcccaccgaagccgagtgggaatacgccgcccggggt600ggactgcagggcgcacgatatgcctggggggataacctcgccctagacgggaggtggaac660tgcaatatctggcaggggggcttccccatggagaacaccgccgcggatggttacctcacc720actgcaccggtgaagacctacacgcccaatggatacggtctgtggcagatggcagggaat780gtatgggaatggtgcc鄉(xiāng)actggtttgatgcggagtactactcccgtgcttcctccatc840aacccgcggggaccggataccggtgcgcgccgggtgatgcgcggaggctcgtatctctgc900catgattcctactgc肌c站ataccgggtggccgcccgcaattcgaacaccccggattcc960acctcggggaataccggtttccggtgcgttttcgatagtccttga1005<210>58<211>334<212〉PRT〈213>Corynebacteriumefficiens<400〉58MetValArgHisArgLeuGlyHisArgProCysThrLeuArglieThr151015SerMetSerAsnCysCysSerProSerSerAlaGinTrpArgThrThr202530ThrArgAspLeuSerAspProValAsnProThrThrProCysAsnPro354045GluGinSerArgAspAlaValThrLeuProGlyGlyAlaPheHisMet505560GlyAspHisHisGlyGluGlyTyrProAlaA印GlyGluGlyProVal65707580HisGluValHisLeuAlaProPheGlylieAsnValThrThrValThr859095AsnAlaGluPheGlyArgPhelieGluAlaThrGlyTyrThrThrThr100105110AlaGluArgTyrGlyValSerAlaValPheTyrAlaAlaPheGinGly115120125GinArgAlaAsplieLeuArgGinValProGlyValProTrpTrpLeu130135140AlaValLysGlyAlaAsnTrpGinArgProAsnGlyProGlySerThr145150155160LeuAspGlyLeuGluAspHisProValValHisValSerTrpAspAsp165170175AlaValAlaTyrCysThrTrpAlaGlyGlyArgLeuProThrGluAla180185190GluTrpGluTyrAlaAlaArgGlyGlyLeuGinGlyAlaArgTyrAla195200205TrpGlyAspAsnLeuAlaLeuAspGlyArgTrpAsnCysAsnlieTrp210215220GinGlyGlyPheProMetGluAsnThrAlaAlaAspGlyTyrLeuThr225230235240ThrAlaProValLysThrTyrThrProAsnGlyTyrGlyLeuTrpGin245250255MetAlaGlyAsnValTrpGluTrpCysGinAspTrpPheAspAlaGlu260265270TyrTyrSer275ArgAlaSerSerlieAsnProArg280GlyProAspThrGly285AlaArgArg290ValMetArgGlyGlySerTyrLeu295CysHisAspSerTyr300CysAsnArg305TyrArgVail310AlaAlaArgAsnSer315AsnThrProAspSer320ThrSerGlyAsnThrGly325PheArgCysValPhe330AspSerPro<210〉59〈211〉1017〈212〉DNA<213〉Novosphingobiumaromaticivorans〈400〉59atggcgcaacceittccgatcgacggcggccagtcgtacaagtattgaacgccatctcgaa60cccaattgcaggagcacgtcgcg犯tggtcgaacgccccggcatgcgcctgatcgaaggc120ggcactttcaccatgggctcgg犯gccttctacccgg鄉(xiāng)犯gcgccgcttcgccgggtg180aaggtagacagcttctggatcgatg犯gcgccggtgacgaacgcacagttcgccgcattc240gtggaggccacgggatacgtcactgtggccgagatcgagccggatcccaaggactacccc300ggcatgctcccgggcatggaccgcgcgggatcgctggtgttcca卿aacagcagggccg360gtcgacatggcggatgcgtccaactggtggcactttacctttggcgcctgctggaagcat420ccacttggaccgggcagttccatcgatgggatcgaggaccatcccgtcgttcacgtcgcc480tatgccgstgccg3ggcct3tgcc犯atgggcgggc朋ggatctgccg3Ccg犯gccgsg540ttcgaatatgctgcgcgcggcgggttggacggttccgaatUtcctggggagacgaactc600gcacctgaaggccggatgatggccaactactggcaaggcctgtttcccttcgccaaccag660tgcctcgatggctgggaacggacatcgcccgtccgcaacttcccgcccaacggctatggt720ctttacgacatgatcgggaacacgtgggagtggacctgcgattggtgggccgacaagccg780ctgactccgcaaaggaaatcggcatgctgcgcgatcagcaatccgcgcggcggcaagctc840aaggacagcttcgacccgtcgcaacccgcaatgcgcatcggccggaaggtcataaagggc900ggttcgcacctgtgtgcggccaattactgccagcgctatcgccccgcagcacgccatcct960gaaatggttgataccgcgacgacgcacatcggcttcaggtgtgtggtgcggccctga1017<210〉60<211>338<212〉PRT<213>Novosphingobi咖aromaticivorans<400〉60MetAlaGinProPheArgSerThrAlaAlaSerArgThrSerlieGlu151015ArgHisLeuGluProAsnCysArgSerThrSerArgMetValGluArg202530ProGlyMetArgLeulieGluGlyGlyThrPheThrMetGlySerGlu35'4045AlaPheTyrProGluGluAlaProLeuArgArgValLysValAspSer505560PheTrplieAspGluAlaProValThrAsnAlaGinPheAlaAlaPhe65707580ValGluAlaThrGlyTyrValThrValAlaGlulieGluProAspPro859095LysAspTyrProGlyMetLeuProGlyMetAspArgAlaGlySerLeu100105110ValPheGinLysThrAlaGlyProValAspMetAlaAspAlaSerAsn115120125TrpTrpHisPheThrPheGlyAlaCysTrpLysHisProLeuGlyPro130135140GlySerSerlieAspGlylieGluAspHisProValValHisValAla145150155160TyrAlaAspAlaGluAlaTyrAlaLysTrpAlaGlyLysAspLeuPro165170175ThrGluAlaGluPheGluTyrAlaAlaArgGlyGlyLeuAspGlySer180185190GluPheSerTrpGlyAspGluLeuAlaProGluGlyArgMetMetAla195200205AsnTyrTrpGinGlyLeuPheProPheAlaAsnGinCysLeuAspGly210215220TrpGluArgThrSerProValArgAsnPheProProAsnGlyTyrGly225230235240LeuTyrAspMetlieGlyAsnThrTrpGluTrpThrCysAspTrpTrp245250255AlaAspLysProLeuThrProGinArgLysSerAlaCysCysAlalie260265270SerAsnProArgGlyGlyLysLeuLysAspSerPheAspProSerGin275280285ProAlaMetArglieGlyArgLysVallieLysGlyGlySerHisLeu290295300CysAlaAlaAsnTyrCysGinArgTyrArgProAlaAlaArgHisPro305310315320GluMetValAspThrAlaThrThrHislieGlyPheArgCysValVal325330335ArgPro〈210〉61<211〉1119<212〉腿〈213〉Mesorhizobiumloti<400〉61atgggcccacgaggtcgaggtcaa犯accgcatgaaaggcgacgcggtcatgttcgacat60tgccgggaagttctagccgatagcgggtgggcggctgatggagatgagcacgccgtgtca120tttcgggatctttcgatgaacgcccctgccgaagtcttcgagcgcgctgcagccgaacgg180tcgtaccccggEiatggtctggatccccggcggtaccttcctgatgggctcagacaaccac240tatccggaggaggcaccggcccaccgggtcagggtcgacggcttctggatggacaaattc300accgtctccaaccgcgacttcgaacgcttcgttgcggcgacaggacatgtcactcttgcc360gagaaacccgccaatcccgacgactatcccggtgccttacccgatctgctggctccgtcc420tcgatgatgttcaggaagccggccggccctgtcgaccttggcaatcactacaattggtgg480gtctatgtccgcggcgccaactggcgccatccacgcgggccggcaagtacaatcaagaag540gttgcagatcatccggtcgtgcatgtggcctacgeiggatgtcgtggcctatgccaactgg600gcaggcaagg犯cttcccaccgaggccgagtgggaa/ttcgcggcgcgaggcggcctcgat660gccgccgaatacgtctggggcaacgagcttacgccggccgggaagcacatggccaacatc720tggcaaggagactttccctaccggaatactgtcgacgacggttacgaatatacggcccca780gtaggctcgttcccggccaacgactacggtctctacgacatggccggcaatgtctggcaa840tggacgaccgactggtaccaggaccacaaggcgatcgacagcccgtgctgcaccgctgtc900aatccgcgtggcggccatcgcgaagcgagctatgacacccggctacctgacgttaagatc960cctcgcaaggtcaccaagggtggctcccatctgtgcgcgccgaactactgtcggcgctac1020cggcccgcggcgcgaatggcgcaacccgtcgacactgcaatctcccatctcggctttcgc1080tgcatcgtgcgaaggaaaatggaattgaacgcgcagtaa1119〈210〉62〈211〉372〈212〉PRT<213〉Mesorhizobiumloti<400〉62MetGlyProArgGlyArgGlyGinLysProHisGluArgArgArgGlyHisValArgHisCysArgGluValLeuAlaAspSerGlyTrpAlaAla202530AspGlyAspGluHisAlaValSerPheArgAspLeuSerMetAsnAla354045ProAlaGluValPheGluArgAlaAlaAlaGluArgSerTyrProGly505560MetValTrplieProGlyGlyThrPheLeuMetGlySerAspAsnHis65707580TyrProGluGluAlaProAlaHisArgValArgValAspGlyPheTrp859095MetAspLysPheThrValSerAsnArgAspPheGluArgPheValAla100105110AlaThrGlyHisValThrLeuAlaGluLysProAlaAsnProAspAsp115120125TyrProGlyAlaLeuProAspLeuLeuAlaProSerSerMetMetPhe130135140ArgLysProAlaGlyProValAspLeuGlyAsnHisTyrAsnTrpTrp145150155160ValTyrValArgGlyAlaAsnTrpArgHisProArgGlyProAlaSer165170175ThrlieLysLysValAlaAspHisProValValHisValAlaTyrGlu180185190AspValValAlaTyrAlaAsnTrpAlaGlyLysGluLeuProThrGlu195200205AlaGluT卬GluPheAlaAlaArgGlyGlyLeuAspAlaAlaGluTyr210215220ValTrpGlyAsnGluLeuThrProAlaGlyLysHisMetAlaAsnlie225230235240TrpGinGlyAspPheProTyrArgAsnThrValAspAspGlyTyrGlu245250255TyrThrAlaProValGlySerPheProAlaAsnAspTyrGlyLeuTyr260265270AspMetAlaGlyAsnValTrpGinTrpThrThrAspTrpTyrGinAsp275280285HisLysAlalieAspSerProCysCysThrAlaValAsnProArgGly290295300GlyHisArgGluAlaSerTyrAspThrArgLeuProAspValLyslie305310315320ProArgLysValThrLysGlyGlySerHisLeuCysAlaProAsnTyr325330335CysArgArgTyr八rgProAlaAlaArgMetAlaGinProValAspThr340345350AlalieSerHisLeuGlyPheArgCyslieValArgArgLysMetGlu355360365LeuAsnAlaGlu370<210>63<211〉1251<212〉腿<213〉Burkholderiafungorum<400〉63atgaagagtgaaagagatcgagagcccgcaaagtcgtcccgctcgaacgggtcggtcgca60gcaacccaaacgcgcgccggtcgcgtgcgcaaactaatgttgtggggcgccctgctcgtc120atactgcccgcctgtgtcggcgccgcggtcagttgggccttcacgccgcacgcacccgct180cacccgcaaatcgttttcggcgacggcacgcatggtccgctcggcatggcgtgggtgccc240ggcggccagttcctcatgggcagcgacgccaaacaggcgcaaccgaacgaacgccccgcg300cacaaggtcaaggtgcacggcttctggatggaccgccatcacgtgaccaacgccgaattc360cgccgcttcgtcgaagcgaccggctacgtcaccacggccgagaagaaacccgactgggag420accctgaaagtccagttgccgcccggcacgccgcgcccgcccgagagcgcgatggtggcg480ggtgcaatggtgttcgtcggcaccagccgtcccgtgccgctagacgactattcgcagtgg540tggcgctatgtgcctggcgctaactggcgtcatccagccgggcctgagagcaacatcatc600ggtaaagatgatcaccccgtggttcaagtgtcctacgaagatgcgcaggcttatgcgaaa660tgggccggcaagcgtctgccgaccgaagccgaatgggaattcgccgcgcgcggcggcctc720gaacaggccacgtatgcgtggggcgatcagttctctcccaacggcaaacagatggccaac780gtctggcagggccagcagccgcagtctttccccgttgtcaacccgaaagcgggtggcgcg840ctcggtacaagtccggtgggtactttcccggccaacggctacggcctttccgacatgacc900ggcaacgcctggcagtgggttgccgactggtatcgcgcggatcagttcaggcgtgaggcg960gtaagcaccagcgcgatcgacaatccggtgggcccgagcgagtcgtgggaccccgcagac1020cagggcgtgcccgtcaacgcgcccaagcgtgtcacacgcggcggttcgttcctctgcaac1080gaaatctattgcctgagctaccggcccagcgcgagacgcggcaccgatccctacaacagc1140atgtcgcatctgggcttccggctggtgatggacgaagacacctgga犯gaagccggtgct1200cgccaggcttcggcgaaagctgccggcgcgcctggaacccctggcggctag1251<210〉64<formula>formulaseeoriginaldocumentpage236</formula>GlyAlaMetValPheValGlyThrSerArgProValProLeuAspAsp165170175TyrSerGinTrpTrpArgTyrValProGlyAlaAsnTrpArgHisPro180185190AlaGlyProGluSerAsnlielieGlyLysAspAspHisProValVal195200205GinValSerTyrGluAspAlaGinAlaTyrAlaLysTrpAlaGlyLys210215220ArgLeuProThrGluAlaGluTrpGluPheAlaAlaArgGlyGlyLeu225230235240GluGinAlaThrTyrAlaTrpGlyAspGinPheSerProAsnGlyLys245250255GinMetAlaAsnValTrpGinGlyGinGinProGinSerPheProVal260265270ValAsnProLysAlaGlyGlyAlaLeuGlyThrSerProValGlyThr275280285PheProAlaAsnGlyTyrGlyLeuSerAspMetThrGlyAsnAlaTrp290295300GinTrpValAlaAspTrpTyrArgAlaAspGinPheArgArgGluAla305310315320ValSerThrSerAlalieAspAsnProValGlyProSerGluSerTrp325330335AspProAlaAspGinGlyValProValAsnAlaProLysArgValThr340345350ArgGlyGlySerPheLeuCysAsnGlulieTyrCysLeuSerTyrArg355360365ProSerAlaArgArgGlyThrAspProTyrAsnSerMetSerHisLeu370375380GlyPheArgLeuValMetAspGluAspThrTrpLysGluAlaGlyAla385390395400ArgGinAlaSerAlaLysAlaAlaGlyAlaProGlyThrProGlyGly405410415〈210〉65<211〉912<212>DNA<213〉Sinorhizobiummeliloti<400〉65atggtctgggttcccggagcgaccttcatgatggggtcgaacgaccattacccggaggaa60gcgcccgtgcatccggtaaccgtcgacggattctggatcgatgtgacaccggtaacgaac120cgccEigtttctcgaattcgtaaatgcgacggggcatgtgaccttcgcggaaagaaagccg180cgcgccgaagactatccgggcgctccgccatccaatctaagggccggttcgctcgtcttc240acacccccgaagcgaccgctgcagggaacggatatatcgcagtggtggatattcacgctg300ggtgccaactggcggcacccgctcgggcgcaagagcagcatcggagcgattctggatcat360ccggtcgtccatgtcgcttacagcgacgcaaaggcctatgccgaatgggccggcaaggac420ctcccgaccgagaccgagtgggagctggcggcccgcggcggcctcgatggggctgaattt480tcctggggcggcgagcttgcgccgggcggaaatcacatggccaatacttggcagggaagt540tttccggtcgagaattctatggacgatggtttcgcgcgaacatcgccggtcagattttac600ccgccgaacggctacggcctctacgacatgatcggcaatgtgtgggagtggaccacggat660tactggtccgtgcgccacccggaagcggccgccaagccttgctgcattccgagcaatccc720cgcaatgccgatgccgatgcgagtatcgatccggcggcgagcgtgaaagttccgcgccgg780gtgctcaagggtgga/tcgcatctctgcgcgccgaactactgccggcggtaccgccctgcg840gcgaggcacgcccaggaaatcgacacgacgaccagccatgtcggtttccgatgtgtcagg900cgcgttcgataa<210〉66<211>303〈212〉PRT<213>Sinorhizobiummeliloti<400>66MetValTrpValProGlyAlaThrPheMetMetGlySerAsnAspHis151015TyrProGluGluAlaProValHisProValThrValAspGlyPheTrp202530lieAspValThrProValThrAsnArgGinPheLeuGluPheValAsn354045AlaThrGlyHisValThrPheAlaGluArgLysProArgAlaGluAsp505560TyrProGlyAlaProProSerAsnLeuArgAlaGlySerLeuValPhe65707580912ThrProProLysArgProLeuGinGlyThrAsplieSerGinTrpTrp859095liePheThrLeuGlyAlaAsnTrpArgHisProLeuGlyArgLysSer100105110SerlieGlyAlalieLeuAspHisProValValHisValAlaTyrSer115120125AspAlaLysAlaTyrAlaGluTrpAlaGlyLysAspLeuProThrGlu130135140ThrGluTrpGluLeuAlaAlaArgGlyGlyLeuAspGlyAlaGluPhe145150155160SerTrpGlyGlyGluLeuAlaProGlyGlyAsnHisMetAlaAsnThr165170175TrpGinGlySerPheProValGluAsnSerMetAspAspGlyPheAla180185190ArgThrSerProValArgPheTyrProProAsnGlyTyrGlyLeuTyr195200205AspMetlieGlyAsnValTrpGluTrpThrThrAspTyrTrpSerVal210215220ArgHisProGluAlaAlaAlaLysProCysCyslieProSerAsnPro225230235240ArgAsnAlaAspAlaAspAlaSerlieAspProAlaAlaSerValLys245250255ValProArgArgValUuLysGlyGlySerHisLeuCysAlaProAsn260265270TyrCysArgArgTyrArgProAlaAlaArgHisAlaGinGlulieAsp275280285ThrThrThrSerHisValGlyPheArgCysValArgArgValArg290295300〈210〉67〈211〉函〈212〉DNA<213〉微顫藍(lán)細(xì)菌屬物種<400〉67atgaaatacatttttttagttcttttcttatgggccttgacccgatgtaccggaaagtat60gaggacaagagagtggaaactgatacttccagaccaaaagccgaagcgtcagatataaaa120gttcccgaaggaatggcttatattcccgcgggccagtacatgatgggaggtaaatcagac180caggcttataaggatgaatatccccgccat肌cgtga鄉(xiāng)tttcggctttttatatggac240cttacagaagtgaccaatgcggagtttaagcggtttgtagacgaaacgggctacgtgacc300attgctgagaaagatattgactgggaagagtta犯gtctc鄉(xiāng)tgccacagggtaccccg360aagcctcctgattctgtgcttcaggcaggttxactggttttcaagcagacagatgaaccc420gtttctctccaggattattcacagtggtgggaatggactatcggagccaactggcgaaat480ccggagggtcc鄉(xiāng)tagtacgaittgaggatcgtatggatcatccggtggtacacgtttcc540tttgaagatgtccaagcgtatgcggattgggccggt卿cgcctgcctactgaggcagaa600tgggaatgggccgccatgggaggcc犯犯tgacgtgaaatatccatgggga組gaatcg660gtcg犯caagcatccgataaagcaaacttttggcaggggaattttccacatcaaaactat720gccctcgatggattcgaacgcaccgcccctgtacgctccttcccagcgaatgggtacggc780ctatatgatatggctggcaatgtgtgggaatggtgccaggataagtatgatgtcaatgct840tatgaaagctataagcaaaaaggactgacagaagaccccacgggttctgagcactacaac900gaccctagggaaccgtatactcctaagcatgtgatcagagggggttctttcctatgcaat960gacagctactgtagtgggtatcgtgtttcacgtcgtatgagttccagtagagattcaggt1020tttaatcatacgggattcaggtgtgtgaaagatgtaaatggatag1065<210>68<211>354<212>PRT<213〉微顫藍(lán)細(xì)菌屬物種<400〉68MetLysTyrliePheLeuValLeuPheLeuTrpAlaLeuThrArgCys151015ThrGlyLysTyrGluAspLysArgValGluThrAspThrSerArgPro202530LysAlaGluAlaSerAsplieLysValProGluGlyMetAlaTyrlie354045ProAlaGlyGinTyrMetMetGlyGlyLysSerAspGinAlaTyrLys505560AspGluTyrProArgHisAsnValLysValSerAlaPheTyrMetAsp65707580LeuThrGluValThrAsnAlaGluPheLysArgPheValAspGluThr859095GlyTyrValThrlieAlaGluLysAsplieAspTrpGluGluLeuLys100105110<formula>formulaseeoriginaldocumentpage243</formula>LeuThrGluAspProThrGlySerGluHisTyrAsnAspProArgGlu290295300ProTyrThrProLysHisVallieArgGlyGlySerPheLeuCysAsn305310315320AspSerTyrCysSerGlyTyrArgValSerArgArgMetSerSerSer325330335ArgAspSerGlyPheAsnHisThrGlyPheArgCysValLysAspVal340345350AsnGly<210〉69<211〉876<212>DNA<213〉惡臭假單胞菌KT2440<400>69atggtgcacgtgccgggcggcgagttcagctttggttcaagccgcttttacgacgaagaa60ggcccgcctcaccccgccaaggtgtccggcttctggattgacgtgcatccggtcaccaac120gcccagttcgcgcgcttcgtcaaggccacggggtatgtcacccatgccgagcgcggtacc180cgtgtcgaggacgaccctgccctgcccgacgcgctgcggataccgggtgcgatggtgttt240catcagggtgcggacgtgctcggccccggctggcagttcgtgcccggcgccaactggcga300cacccgcaagggccgggcagcagcctggccgggctggacaaccatccggtggtgcagatc360gccctggaagatgcccaggcctatgcccgctgggcaggccgcgaactgcccagcgaggcg420cagctggaatacgccatgcgcggcggcctgaccgatgccgacttcagctggggtaccacc480gagcagcccaagggcaagctcatggccaatacctggcagggtcagttcccttatcgcaat540gcggcgaaggatggttttaccggtacatcgcccgtgggttgcttcccggccaacggcttt600ggcctgttcgatgccggcggcaatgtctgggagctgactcgcacgggctatcggccaggc660catgacgcacagcgcgacgccaagctcgacccctcaggcccggccctgagtgacagcttc720gacccggcagaccccggcgtgccggtggcggtaatcaaaggcggctcgcacctgtgttcg780gcggaccgctgcatgcgctaccgcccctcggcacgccagccgcagccggtgttcatgacg840acctcgcacgtgggtttcagaacgattcggcaatga876〈210>70<211〉291<212>PRT〈213〉惡臭假單胞菌KT2440<400>70MetValHisValProGlyGlyGluPheSerPheGlySerSerArgPhe151015TyrAspGluGluGlyProProHisProAlaLysValSerGlyPheTrp202530lieAspValHisProValThrAsnAlaGinPheAlaArgPheValLys354045AlaThrGlyTyrValThrHisAlaGluArgGlyThrArgValGluAsp505560AspProAlaLeuProAspAlaLeuArglieProGlyAlaMetValPhe65707580HisGinGlyAlaAspValLeuGlyProGlyTrpGinPheValProGly859095AlaAsnTrpArgHisProGinGlyProGlySerSerLeuAlaGlyLeu100105110AspAsnHisProValValGinlieAlaLeuGluAspAlaGinAlaTyr115120125AlaArgTrpAlaGlyArgGluLeuProSerGluAlaGinLeuGluTyr130135140AlaMetArgGlyGlyLeuThrAspAlaAspPheSerTrpGlyThrThr145150155160GluGinProLysGlyLysLeuMetAlaAsnThrTrpGinGlyGinPhe165'170175ProTyrArgAsnAlaAlaLysAspGlyPheThrGlyThrSerProVal180185190GlyCysPheProAlaAsnGlyPheGlyLeuPheAspAlaGlyGlyAsn195200205ValTrpGluLeuThrArgThrGlyTyrArgProGlyHisAspAlaGin210215220ArgAspAlaLysLeuAspProSerGlyProAlaLeuSerAspSerPhe225230235240AspProAlaAspProGlyValProValAlaVallieLysGlyGlySer245250255HisLeuCysSerAlaAspArgCysMetArgTyrArgProSerAlaArg260265270GinProGinProValPheMetThrThrSerHis275280ValGlyPheArgThr285lieArgGin290<210>71<211>780〈212〉腿<213〉Ralstoniametallidurans〈400〉71atggtcgcgggcgggatggtgttcgtcggcaccaacagcccggtgccgctgcgcgaatac60tggcgctggtggcgcUcgtacctggcgcggactggcgtcacccgaccggcccgggcagt120tccatcgaaggcaaggacaatcatcccgtcgtgcaggtctcgtatgaagacgcgcaggcg180tacgccaagtgggccggcaagcgtctgcccaccgaggccgagtgggagtttgccgcccgt240ggcggcctggagcaggccacctacgcctggggtgacaagttcgcgccggatggccggcag300atggcgaatgtctggcagggccagcaggtgcagccgttcccggtggtcagcgccaaggcg360ggcggcgcggctggcaccagtgctgtcggcacgttcccgggcaatggctatgggctctat420gacatgaccggcaacgcctggcagtgggtggccgactggtatcgcgcggaccagttccgc480cgcgaagccacggtggcggcagtgctgcagaatccgaccggcccggccgattcgtgggac540ccgaccgaacctggcgtgccggtgtcggcgccc卿cgggtcacgcgcggtggctcgttc600ctctgcaacgaggacttctgcctcagctaccgcccgagtgcccggcgcggtaccgacccg660tacaccagcatgtcgcacctaggcttccggctcgtgatggatgacgcccgUgggcagaa720gttcgcaagcagccagccgtggc犯tggccgcgggcgggcagc柳eicgtgcagaaat犯780〈210〉72<211>259<212〉PRT<213〉Ralstoniametallidurans<400>72MetValAlaGlyGlyMetValPheValGlyThrAsnSerProValPro151015LeuArgGluTyrTrpArgTrpTrpArgPheValProGlyAlaAspTrp202530ArgHisProThrGlyProGlySerSerlieGluGlyLysAspAsnHis354045ProValValGinValSerTyrGluAspAlaGinAlaTyrAlaLysTrp505560AlaGlyLysArgLeuProThrGluAlaGluTrpGluPheAlaAlaArg65707580GlyGlyLeuGluGinAlaThrTyrAlaTrpGlyAspLysPheAlaPro859095AspGlyArgGinMetAlaAsnValTrpGinGlyGinGinValGinPro100105110PheProValValSerAlaLysAlaGlyGlyAlaAlaGlyThrSerAla115120125ValGlyThrPheProGlyAsnGlyTyrGlyLeuTyrAspMetThrGly130135140AsnAlaTrpGinTrpValAlaAspTrpTyrArgAlaAspGinPheArg145150155160ArgGluAlaThrValAlaAlaValLeuGinAsnProThrGlyProAla165170175AspSerTrpAspProThrGluProGlyValProValSerAlaProLys180185190ArgValThrArgGlyGlySerPheLeuCysAsnGluAspPheCysLeu195200205SerTyrArgProSerAlaArgArgGlyThrAspProTyrThrSerMet210215220SerHisLeuGlyPheArgLeuValMetAspAspAlaArgTrpAlaGlu225230235240ValArgLysGinProAlaValAlaMetAlaAlaGlyGlyGinGinAsn245250255ValGinLys<210〉73<211>876〈212〉DNA<213>Prochlorococcusmarinus<400〉73gtgaccacatctttgccagtagagatggtaaccatccccgcagggctctatcgagttggc60tgtgatcgctgctatccggatggttcagttcgctgctatccggagga犯cacccgcgcga120gaagtgcagcttgactcattccagatcgacgtagggccagtcaccaatgcccagttccga180gctttcgttagcgccacgcagcatctcacagtctcggagctaccacctgatccaacgctc240tatcccgatctagcgcccgaggaacgcatccctgaatcagttgtctttcaaccgcctcca300gcaacggtggatcgcagcaaacccttgagctggtggaccctcatggctggggctgattgg360cgtcatccccaaggacccgaaagcacgatcgatggccttgatgatcaccctgtcgtgcat420g"tcgcctatgccgacgccatcgcctatgcccattgggctggcaagcgtctcccctctgct480gaagagtgggaagtagccgcccgcgggggtcttgtcgatgcccaatacgcctgggggaat540gaactcactcccaataacegctggatggcgaacatctggcaaggtcctttcccttggcac600aacgaggagctagaeggctggttctggacctcgcccgttggcagctttcctgccaacggc660tatggactcttggatgtttgcggcaatgtgtgggaatggaccaactctgtttatcccgtg720gcgtcaggccaccaggaacggegaactateaaaggeggatcgtttctctgcgcagataat780tactgegtaegttatcgaccctctgcactacaaggecagacagtagacactgccacctgt840cacatgggctttcgctgtgcaaaaggagggccttga876〈210〉74〈211〉291<212〉PRT<213〉Prochlorococcusmarinus〈400〉74MetThrThrSerLeuProValGluMetValThrlieProAlaGlyLeuTyrArgValGlyCysAspArgCysTyrProAspGlySerValArgCys202530TyrProGluGluThrProAlaArgGluValGinLeuAspSerPheGin354045lieAspValGlyProValThrAsnAlaGinPheArgAlaPheValSer505560AlaThrGinHisLeuThrValSerGluLeuProProAspProThrLeu65707580TyrProAspLeuAlaProGluGluArglieProGluSerValValPhe859095GinProProProAlaThrValAspArgSerLysProLeuSerTrpTrp100105110ThrLeuMetAlaGlyAlaAspTrpArgHisProGinGlyProGluSer115120125ThrlieAspGlyLeuAspAspHisProValValHisValAlaTyrAla130135140AspAlalieAlaTyrAlaHisTrpAlaGlyLysArgLeuProSerAla145150155160GluGluTrpGluValAlaAlaArgGlyGlyLeuValAspAlaGinTyr165170175AlaTrpGlyAsnGluLeuThrProAsnAsnArgTrp'MetAlaAsnlie180185190TrpGinGlyProPheProTrpHisAsnGluGluLeuAspGlyT卬Phe195200205TrpThrSerProValGlySerPheProAlaAsnGlyTyrGlyLeuLeu210215220AspValCysGlyAsnValTrpGluTrpThrAsnSerValTyrProVal225230235240251AlaSerGlyHisGinGluArgArgThrlieLysGlyGlySerPheLeu245250255CysAlaAspAsnTyrCysValArgTyrArgProSerAlaLeuGinGly260265270GinThrValAsp'ThrAlaThrCysHisMetGlyPheArgCysAlaLys275280285GlyGlyPro290<210〉75<211>1017<212〉廳<213>新月柄桿菌CB15<400>75ttgggaaaactgacggcgcttcccgtcctgatgcttctggcgctggccggctgcggccag60ccggcgcccaaggcttgcctggcggacctgccggttccagatccccagaaccgcacggcg120ggtatggttcggctggcgggcggcgacttccagatgggcgctgcgccgctgcgtccggag180gagggaccgccccagacggtcacggtcccgccgttctggatcgatcagacagaggtcacc240aacgccgccttcgcgcggtt'cgtcgaggccacgggttatcgcaccgtggccgagcgaccg300ctcgaccccgcgcgctacgcccacgtaccggcggcgcagcggcgtccggcctcgctcgtc360ttcgtgggggcgaagggggcgaggtcggacgatccttcccaatggtggcaggtgatcccc420ggcgccgactggcggcatcccgaaggtcccggctcgaacatccggggcagggacgcctgg480ccggtggtgcatatcgcgtgggaggacgccatggcctacgcccgctggctgggccgtgac540ctgcccacagaggccgaatgggagtacgccgcgcgcggcgggctggttggcaagcgctac600acctggggcgaccaggctcaggatcctgca幼gccgcgcgccaatacttggcaaggcgtg660ttcccggcccaggaccttggcaatgacggcttcaaggccaagcccgcgccggtcggctgc720ttcccgcccaacggctatggcctgcgcgacatggccggcaatgtctgggagtggacccgc780gactggttcaagccgggcctggatccggtcagcgtcctcgaaaccggcgggccgcccgag840gcccgcgcgctggatcccgaggacccgaacacgcccaagcacgtcgtgaagggcggttcg900ttcctgtgcgccgacgactactgcttccgctatcgacctgcggcgcgaacgccggggccg960ccggacagcggcgcatcgcatgtcggtttccgcaccgtgctccgcgccgagcgctga1017<210>76<211〉338<212〉PRT<213〉新月柄桿菌CB15〈400〉76MetGlyLysLeuThrAlaLeuProValLeuMetLeuLeuAlaLeuAla151015GlyCysGlyGinProAlaProLysAlaCysLeuAlaAspLeuProVal202530ProAspProGinAsnArgThrAlaGlyMetValArgLeuAlaGlyGly354045AspPheGinMetGlyAlaAlaProLeuArgProGluGluGlyProPro505560GinThrValThrValProProPheTrplieAspGinThrGluValThr65707580AsnAlaAlaPheAlaArgPheValGluAlaThrGlyTyrArgThrVal859095AlaGluArgProLeuAspProAlaArgTyrAlaHisValProAlaAla100105110GinArgArgProAlaSerLeuValPheValGlyAlaLysGlyAlaArg115120125SerAspAspProSerGinTrpTrpGinVallieProGlyAlaAspTrp130135140ArgHisProGluGlyProGlySerAsnlieArgGlyArgAspAlaTrp145150155160ProValValHislieAlaTrpGluAspAlaMetAlaTyrAlaArgTrp165170175LeuGlyArgAspLeuProThrGluAlaGlu.TrpGluTyrAlaAlaArg180185190GlyGlyLeuValGlyLysArgTyrThrTrpGlyAspGinAlaGinAsp195200205ProAlaLysProArgAlaAsnThrTrpGinGlyValPheProAlaGin210215220AspLeuGly'AsnAspGlyPheLysAlaLysProAlaProValGlyCys225230235240PheProProAsnGlyTyrGlyLeuArgAspMetAlaGlyAsnValTrp245250255GluTrpThrArgAspTrpPheLysProGlyLeuAspProValSerVal260265270<formula>formulaseeoriginaldocumentpage255</formula>gcaacctatgcgtggggcgaccaggagaagccggggggcatgctcatggcgaacacctgg540cagggccggtttccttaccgcaacgacggtgcattgggctgggtgggaacctccccggtg600ggcaggtttccggccaacgggtttggcttgctcgacatgatcggaaacgtttgggagtgg660accaccaccgagttctatccacaccatcgcatcgatccaccctcgacggcctgctgcgca720ccggtcaagctcgctacagccgccgacccgacgatcagccagaccctcaagggcggctcg780cacctgtgcgcgccggagtactgccaccgctaccgcccggcggcgcgctcgccgcagtcg840caggacaccgcgaccacccatatcgggttccggtgcgtggccgacccggtgtccgggtag900<210〉78<211〉299<212>PRT<213>結(jié)核分枝桿菌H37Rv<400〉78MetLeuThrGluLeuValAspLeuProGlyGlySerPheArgMetGly151015SerThrArgPheTyrProGluGluAlaProlieHisThrValThrVal202530ArgAlaPheAlaValGluArgHisProValThrAsnAlaGinPheAla354045GluPheValSerAlaThrGlyTyrValThrValAlaGluGinProLeu505560AspProGlyLeuTyrProGlyValAspAlaAlaAspLeuCysProGly65707580AlaMetValPheCysProThrAlaGlyProValAspLeuArgAspTrp859095256ArgGinTrpTrpAspTrpValProGlyAlaCysTrpArgHisProPhe100105110GlyArgAspSerAsplieAlaAspArgAlaGlyHisProValValGin115120125ValAlaTyrProAspAlaValAlaTyrAlaArgTrpAlaGlyArgArg130135140LeuProThrGluAlaGluTrpGluTyrAlaAlaArgGlyGlyThrThr145150155160AlaThrTyrAlaTrpGlyAspGinGluLysProGlyGlyMetLeuMet165170175AlaAsnThrTrpGinGlyArgPheProTyrArgAsnAspGlyAlaLeu180185190GlyTrpValGlyThrSerProValGlyArgPheProAlaAsnGlyPhe195200205GlyLeuLeuA印MetlieGlyAsnValTrpGluTrpThrThrThrGlu210215220PheTyrProHisHisArglieAspProProSerThrAlaCysCysAla225230235240ProValLysLeuAlaThrAlaAlaAspProThrlieSerGinThrLeu245250255LysGlyGlySerHisLeuCysAlaProGluTyrCysHisArgTyrArg260265270ProAlaAlaArgSerProGinSerGinAspThrAlaThrThrHislie275280285GlyPhe'ArgCysValAlaAspProValSerGly290295<210〉79<211>7<212〉PRT<213>人工的〈220><223〉原核生物和原核生物中保守的結(jié)構(gòu)域<220><221〉DOMAIN<222〉(1)..(7)<223>保守結(jié)構(gòu)域<220〉<221>MISC—FEATURE<222>(3)..(4)〈223〉任何氨基酸<220><221>MISC—FEATURE<222〉(6)..(6)<223〉任何氨基酸<220〉<221〉MISC—FEATURE〈222〉(6).(6)<223>Gly或Ala<400〉79ArgValXaaXaaGlyXaaSer15〈212〉DNA<213>Oncorhynchusmykiss<400〉80tcaggtggctgctgccccctggtggttgcctgtcagaggagcagactggaggcaccctga60gggccccgactccagcatcacagacaggctggaccaccctgtgctgcatgtgtcatggca120ggacgctgtggcctactgctcctgggcctacaagagactacccacagaggctgagtggga180gtacgcctgcagagggggcctacaggagagactttacccgtgggggaacaaactgaaacc240taaaggacagcactacgccaacctctggcagggaaagttccccacacacaactcagaaga300ggacgggtacactaaaacctcaccagtgaagtcatttcctgca肪tggctatggcctgta360caacatggtagggaatgcatgggagtggacatctgactggtggactgtacaccacaccac420agatgaacagcacaacccggcaggtccaccatcaggcacagaccgagtgaagaaaggagg480ctcctacatgtgccataagtcatactgttacaggtacaggtgtgcagcacggagtcagaa540cacccctgacagctctgcctctaacctagggttccgctgtgtctcccaggagcagccgta600acctttcaccctcgaccctgacatgggtag630<210〉81〈211〉655<212>DNA〈213〉斑馬魚<220><221〉misc—feature〈222〉(590)..(590)<223〉n是a、c、g或t<220〉<221〉misc一feature<222〉(626)..(626)259<223〉n是a、c、g或t〈400〉81caaatggttttatttacataaaaaaatcctcttagtttgaagtgtaagacagtgagatta60gtgatgtttgaggttatggatcaacatcagaggcgcagcggaagcccaagttcgaggctg120aactgtccggtgtgttctgactgcgagcggcacacctgtatctgtagcagtaagacttgt180ggcacatgtaggatcctcctttcttgactctgtctgtccctgattctggtccctttgggt240taaacttgtcttctgcagtgtgatgcacagtccaccagtctgccgtccactcccacgcat300ttcccaccatgtcatacaggccaaagccattgggaggaaaagacatcaccggggatgtgt360tggcatagccgtcctctgcagtgttgtgattagggaaatctccctgccacaggttagcat420agtgctgccctcttggcattaatttatttccccatgggtacatcctgtcctgtagtcctc480ctctacaggccaactcccattcagcttctgtaggaagtctgcgtttggcccattgacagt540acgcccgtgcatcatcccatgaaacatgcagagcagggtgattcattctngtgtgtatgg600ttgaatctggtcctttctggtgtctncagtctgcacctttcactggtgaccaeca655<210〉82<211〉773<212〉DNA<213〉0ryziaslatipes〈220〉<221〉misc—feature〈222〉(690)..(690)〈223〉n是a、c、g或t〈220〉<221〉misc一feature<222〉(755)..(755)<223〉n是a、c、g或t〈400〉82tctccttttttccataaataacattagagtccttacattctgectttacatacattgtca60gagacagtacaaaaaatctgcctttgtaaaattagagttac幼aaatatattttagattt120g^cttcttcagaattgtcggtggcagca犯3g犯tcggattgatctcatgac幼gagcgt180gagccagaagttcttggatcaaactgatttggttctgtcatcgtttctgttcagcagcac240agcgaaaaccaagattggaagcggagctgtctggagtgttttggcttcgagcagcacatc300tgtacctgtaacaataagacttgtggcacatgtacgagcctcctttcttcaccttatctg360tgcctgacggaggacccgttgggttgtgctgatggtctgttgtgtggtgcacgctccacc420agtctgaggtccactcccatgcgttccccaccatgtcatacagaccaaaagcattgcctg480ggaaggacatcaccggggaggttttagtgtagccatcctctgcagagttgtgtgctggga540attccccctgccagaggttggcgtaatgctgtccctttgggtttagcttgtttccccagg600ggtagagtctgtccttcaggccgcccctgcaggcaacctcccactctgcctcagtgggaa660gtctcttgttgacccaggagcagtaagccnaggcatcattcccagaaacctgaacgacgg720atgatccatcctgtctgtgatgttggagtctggancttcagggtgcttccagt773<210〉83〈211〉566<212〉腿.〈213〉非洲爪蟾<220〉〈221〉misc一feature〈222〉(6)..(6)〈223〉n是a、c、g或t〈220〉<221〉misc—feature〈222〉(47),.(47)<223〉n是a、c、g或t〈220〉<221〉miscfeature<222〉(81).■(81)〈223〉n是a、c、g或t<400〉83atatgnaactaaaggtaatgattgctcctgcttgtcgtgtttgg鄉(xiāng)ccgagctgtcgggtaggactxatggcacatgtacctttcgggttgtgaacctctcccaagcatttcccaccatggtgaagtctgcacataaccacattcgcataatgttgtcctcaagtcccccgcggcaggccaggtgcaga犯gcagaagc〈210〉84〈211〉647〈212〉醒<213〉Siluranatropicalis<400〉84gccgctttttttttttttttttttttttttcatcacaaaaataattttattaataaaata60ggattttgtgttcattcttattatgaaggacaaggaatgtcattgaaatttttgttttca120caaggtcttgggagttccttcctgctcaggtcattttgcagtggtcacggagccgacgcc180acgcagcggaatcccaggttagaggccgagctgtcaggtgtattctgacttcgagcagca240cagcgatacctgtagcagtaggactcatggcacatgtatgagcctccttttttcaccttg300tcttttcccgtaaaaggacctttcgggttgtaagtctcatctgctgtatgatgagtgtcc360caccaatcggatgtccactcccaagcatttcccaccatgttatataggctataaccattg420taattggaatgatggatttcacaaggnctgagagttccct60nacaggtcacggagccggcgccacacagcgaaatcccagg120tgtattctgacttcgagcagcacagcgatacctgtagcaa180ggagcctcctttcttcactctatcatttcccgtagaaggt.240atctgctgtatgatgagtgtcccaccaatcagatgtccac300gttatatagaccataaccattggctgggaaagcagttaca360atcctctccagtgttttgggttggaaaatccccctgccag420ctttggttccagcttgttcccccatggaaaaatcctgttc480gtattcccactcagcttcagttggaaggcgtttacctgcc540atcatt566262gctgggaaagcggttacaggtgaagtctgcacatagccgtcctctccagtgttttgggtt480ggaaattccccctgccagacattcgcataatgttctccctttggttccagcttgttcccc540cacggaaaaagcctgttctcaagtcccccacgggaggcatattcccactcagcttctgtc600ggaaggcgcttacccgcccaggtgcagaaggcagaagcatcgttcca647<210〉85〈211〉636<212〉DNA<213〉加拿大鮭魚〈400〉85atagacattttttaaatattttacaacaaaatatattccataaatatccacatgtcatgc60ggtaatcctgcatttcatgaagaacactgacatcactggctgtatgaagaggtgcacttg120atttgtttcgcctggcgggcaagataggcagagttagcaccctagactagagccaatggc180gaatggtacaaaeLagggaaaagtcagactacccatgtcagggtcaagggtaaaaggttac240ggctgctcctgggagacacagcggaaccctaggttagaggcagagctgtcaggggtgttc300tgactccgtgctgcacacctgtacctgtaacagtatgacttatggcacatgtaggagcct360cctttcttcactcggtctgtgcctgatggtggacctgccgggttgtgccgttcatctgtg420gtgtggtgtacagtccaccagtcagatgtccactcccatgcattccctaccatgttgtac480aggcc6itagccatttgcagga犯tgacttcactggtgaggttttggtgtacccgtcctct540tctgagttgtgtgtggggaactttccctgccagaggttggcgtagtgctgtcctttaggt600ttcagtttgttcccccacgggtaaagtctgtcctgt636〈210〉86〈211〉415〈212〉DNA〈213〉野豬<400〉86agtttcctgtgaccaacaccttcctcccaatggttatggcactggtggaccattcaccatgcaccgaataacagagccgc3卿CCgggtg卿咖ggggctgtgctgctcgaagccaggtgcagctgaccaccagccc<210〉87<211〉595〈212〉DNA<213>黃?!?00〉87ccacgcgtccgggggcaacacaaggcgagtttcctgtgacgacgcctttxctcccaatgggacttcagactggtggactgcccttctggg犯卿ccgggctacaggtatcgctgtgctggggattccgttgtgcagctgcccg犯cccgagaagtcgtgtgctgtgaagaattcccacctatggcaagaccaaattgct〈210〉88ggagsiggatggcttccgagg犯ctgcgcctgttgatgcct60ctttacaatatagtagggaacgcctgggaatggacctcag120gctgctgaagaaac犯ttaacccatcaagttcttcctgct180cactacgtgatgaaagcagagaaaggccccccttctggga240ggatcctatatgtgccat犯gtcctactgctacaggtacc300aacacgccggacagctcggcttcaaatctggggttccgct360accacaggctgagtcaggaagagtcttcccgaatc415aactgcagccg犯aggccagcattatagccaacatcttgg60caacaccggggaggacggcttccgagggaccgcgcctgtt120ttattggcttatacaatatagtagggaacgcctgggagtg180ttcaccattctgctgaag犯3cgatt33ccc犯aaggccc240tgaag犯aggtggatcctacatgtgccata犯tcctattg300ctcgaagccagaacacacccgacagctctgcttcgaatct360accacctgcccaccacaggctaagagccaaaaagagcctt420tctactctgcacgcggcttccctcagaaggctgaacaacc480ccaaggtgggttacataccttgcccagtggccaaaggacc540gagctgatcagcatgtgcgcUtattgggggatgg595<211>1611<212〉DNA<213〉智人<220><221>CDS<222〉(l)..(薩)<223〉hSULF3<400>88atgctactgctgtgggtgtcggtggtcgcagccttggcgctggcggta48MetLeuLeuLeuTrpValSerValValAlaAlaLeuAlaLeuAlaVal151015ctggcccccggagcaggggagcagaggegg卿gcagccaaagcgccc96LeuAlaProGlyAlaGlyGluGinArgArgArgAlaAlaLysAlaPro202530aatgtggtgctggtcgtgagegactecttcgatggaaggttaacattt144AsnValValLeuValValSerAspSerPheAspGlyArgUuThrPhe354045catccaggaagtcaggtagtgaaacttccttttateaactttatgaag192HisProGlySerGinValValLysLeuProPhelieAsnPheMetLys505560acacgtgggacttectttctgaatgcctacacaaactctccaatttgt240ThrArgGlyThrSerPheUuAsnAlaTyrThrAsnSerProlieCys65707580tgcccateacgcgcagcaatgtggagtggcetcttcactcacttaaca288CysProSerArgAlaAlaMetTrpSerGlyLeuPheThrHisLeuThr859095gaatcttggaataattttaagggtctagatccaaattatacaacatgg336GluSerTrpAsnAsnPheLysGlyLeuAspProAsnTyrThrThrTrp100105110atggatgtcatggagaggcatggctaccgaacacagaaatttgggaaa384MetAspValMetGluArgHisGlyTyrArgThrGinLysPheGlyLys115120125ctggactatactteaggacatcactecattagtaatcgtgtgg幼gcg432LeuAspTyrThrSerGlyHisHisSerlieSerAsnArgValGluAla130135140tggacaagagatgttgetttcttaetcagacaagaaggcaggcccatg480TrpThrArgAspValAlaPheLeuLeuArgGinGluGlyArgProMet145150155160gttaatcttatecgtaacaggactaaagtcagagtgatggaaagggat528ValAsnLeulieArgAsnArgThrLysValArgValMetGluArgAsp165170175tggcagaatacagacaeiagcagtaaactggttaagaaaggaagcaatt576TrpGinAsnThrAspLysAlaValAsnTrpLeuArgLysGluAlalie180185190aattacactgaaccatttgttatttacttgggattaaatttaccacac624AsnTyrThrGluProPheVallieTyrLeuGlyLeuAsnLeuProHis195200205ccttaccctteaccatcttctggagaaaattttggatctteaacattt672ProTyrProSerProSerSerGlyGluAsnPheGlySerSerThrPhe210215220cacacatctctttattggcttgaaaaagtgtctcatgatgccateaaa720HisThrSerLeuTyrTrpLeuGluLysValSerHisAspAlalieLys225230235240ateccaaagtggteacctttgteagaaatgcaccctgtagattattac768lieProLysTrpSerProLeuSerGluMetHisProValAspTyrTyr245250255tcttcttatacaaaa犯ctgcactggaagatttacaaaaa犯gaaatt816SerSerTyrThrLysAsnCysThrGlyArgPheThrLysLysGlulie260265270aagaatattagagcattttattatgetatgtgtgetgagacagatgcc864LysAsnlieArgAlaPheTyrTyrAlaMetCysAlaGluThrAspAla275280285atgcttggtgaaattattttggcccttcatcaattagatcttcttcag912MetLeuGlyGlulielieLeuAlaLeuHisGinLeuAspLeuLeuGin290295300aaaactattgtcatatactecteagaccatggagagctggccatggaa960LysThrlieVallieTyrSerSerAspHisGlyGluLeuAlaMetGlu305310315320catcgacagttttataaaatgageatgtacgaggetagtgcacatgtt1008HisArgGinPheTyrLysMetSerMetTyrGluAlaSerAlaHisVal325330335ccgcttttgatgatgggaccaggaa/ttaaagccggcetacaagtatea1056ProLeuLeuMetMetGlyProGlylieLysAlaGlyLeuGinValSer340345350aatgtggtttctcttgtggatatttaccctaccatgcttgatattget1104AsnValValSerLeuValAsplieTyrProThrMetLeuAsplieAla355360365ggaattcctctgcctcagaacctgagtggatactctttgttgccgtta1152GlylieProLeuProGinAsnLeuSerGlyTyrSerLeuLeuProLeu370375380teateagaaacatttaagaatgaacataaagtcaaaaacctgcatcca1200SerSerGluThrPheLysAsnGluHisLysValLysAsnLeuHisPro385390395400ccctggattctgagtgaattccatggatgtaatgtgaatgcctecacc1248ProTrplieLeuSerGluPheHisGlyCysAsnValAsnAlaSerThr405410415tacatgcttcgaactaaccactggaaatatatagcctatteggatggt1296TyrMetLeuArgThrAsnHisTrpLysTyrlieAlaTyrSerAspGly420425430gcateaatattgcctcaaetctttgatctttecteggatccagatgaa1344AlaSerlieLeuProGinLeuPheAspLeuSerSerAspProAspGlu435440445ttaacaaatgttgetgtaaaatttccagaaattacttattctttggat1392LeuThrAsnValAlaValLysPheProGlulieThrTyrSerLeuAsp450455460cagaagcttcattecattataaactaccctaaagtttctgettctgtc1440GinLysLeuHisSerlielieAsnTyrProLysValSerAlaSerVal465'470475480caccagtataataaagagcagtttateaagtggaaacaaagtatagga1488HisGinTyrAsnLysGluGinPhelieLysTrpLysGinSerlieGlycagaatGinAsncag肪gGinLys3CCcatThrHis530485tatteaaacgttTyrSerAsnVal500gaaccaaggaagGluProArgLys5153tg33tCC33g3MetAsnProArgatalietatTyrgcaAla535490495gcaaatcttaggtggcaccaagactgg1536AlaAsnLeuArgTrpHisGinAspTrp505510gaaaatgcaattgatcagtggcttaaa1584GluAsnAlalieAspGinTrpLeuLys520525gtttgaVal<210>89〈211〉536<212〉PRT<213〉智人<400〉89MetLeuLeuLeuTrpValSerValValAlaAlaLeuAlaLeuAlaVal151015LeuAlaProGlyAlaGlyGluGinArgArgArgAlaAlaLysAlaPro202530AsnValValLeuValValSerAspSerPheAspGlyArgLeuThrPhe354045HisProGlySerGinValValLysLeuProPhelieAsnPheMetLys505560ThrArgGlyThrSerPheLeuAsnAlaTyrThrAsnSerProlieCys657075801611CysProSerArgAlaAlaMetTrpSerGlyLeuPheThrHisLeuThr268859095GluSerTrpAsnAsnPheLysGlyLeuAspProAsnTyrThrThrTrp100105110MetAspValMetGluArgHisGlyTyrArgThrGinLysPheGlyLys115120125LeuAspTyrThrSerGlyHisHisSerlieSerAsnArgValGluAla130135140TrpThrArgAspValAlaPheLeuLeuArgGinGluGlyArgProMet145150155160ValAsnLeulieArgAsnArgThrLysValArgValMetGluArgAsp165170175TrpGinAsnThrAspLysAlaValAsnTrpLeuArgLysGluAlalie180185190AsnTyrThrGluProPheVallieTyrLeuGlyLeuAsnLeuProHis195200205ProTyrProSerProSerSerGlyGluAsnPheGlySerSerThrPhe210215220HisThrSerLeuTyrTrpLeuGluLysValSerHisAspAlalieLys225230235240lieProLysTrpSerProLeuSerGluMetHisProValAspTyrTyr245250255SerSerTyrThrLysAsnCysThrGlyArgPheThrLysLysGlulie269<formula>formulaseeoriginaldocumentpage270</formula>435440445LeuThrAsnValAlaValLysPheProGlulieThrTyrSerLeuAsp450455460GinLysLeuHisSerlielieAsnTyrProLysValSerAlaSerVal465470475480HisGinTyrAsnLysGluGinPhelieLysTrpLysGinSerlieGly485490495GinAsnTyrSerAsnVallieAlaAsnLeuArgTrpHisGinAspTrp500505510GinLysGluProArgLysTyrGluAsnAlalieAspGinTrpLeuLys515520525ThrHisMetAsnProArgAlaVal530535〈210〉90<211〉1722<212>DNA<213〉智人〈220〉<221〉CDS<222>(1)..(1719)<223>hSULF4〈400〉90atgggggcgctggcaggattctggateetctgcetcetcacttatggtMetGlyAlaLeuAlaGlyPheTrplieLeuCysLeuLeuThrTyrGly151015tacctgtectggggccaggccttagaagaggaggaagaaggggcctta4896271TyrLeuSerTrpGlyGinAlaLeuGluGluGluGluGluGlyAlaLeu202530etagetcaagetggagagaaact.agagcccageacaacttecacctec144LeuAlaGinAlaGlyGluLysLeuGluProSerThrThrSerThrSer354045cagccccatetcattttcateetagcggatgatcagggatttagagat192GinProHisLeuliePhelieLeuAlaAspAspGinGlyPheArgAsp505560gtgggttaccacggatctgagattaaaacacctactcttgacaagetc240ValGlyTyrHisGlySerGlulieLysThrProThrLeuAspLysLeu65707580getgccgaaggagttaaactggagaactactatgtccagcctatttgc288AlaAlaGluGlyValLysLeuGluAsnTyrTyrValGinProlieCys859095acaccatecaggagtcagtttattactggaaagtatcagatacacacc336ThrProSerArgSerGinPhelieThrGlyLysTyrGinlieHisThr100105110ggacttcaacattctateataagacctacccaacccaactgtttacct384GlyLeuGinHisSerlielieArgProThrGinProAsnCysLeuPro115120125ctggacaatgccaccetacctcagaaactgaaggaggttggatattea432LeuAspAsnAlaThrLeuProGinLysLeuLysGluValGlyTyrSer130135140acgcatatggtcggaaaatggcacttgggtttttacaga犯agaatgc480ThrHisMetValGlyLysTrpHisLeuGlyPheTyrArgLysGluCys145150155160atgcccaccagaagaggatttgataccttttttggtteccttttggga528MetProThrArgArgGlyPheAspThrPhePheGlySerLeuLeuGly165170175agtggggattactatacacactacaaatgtgacagtcctgggatgtgt576SerGlyAspTyrTyrThrHisTyrLysCysAspSerProGlyMetCys180185190ggctatgacttgtatgaaaacgacaatgetgcctgggactatgacaat624GlyTyrAspLeuTyrGluAsnAspAsnAlaAlaTrpAspTyrAspAsn195200205ggcatatactecacacagatgtacactcagagagtacagcaaatetta672GlylieTyrSerThrGinMetTyrThrGinArgValGinGinlieLeu210215220getteccataaccccacaaagcctatatttttatatattgcctatcaa720AlaSerHisAsnProThrLysProliePheLeuTyrlieAlaTyrGin225230235240getgttcatteaccactgcaagetcctggcaggtatttcgaacactac768AlaValHisSerProLeuGinAlaProGlyArgTyrPheGluHisTyr245250255cgatecattateaacataaacaggaggagatatgetgccatgctttec816ArgSerlielieAsnlieAsnArgArgArgTyrAlaAlaMetLeuSer260265270tgcttagatgaagcaateaacaacgtgacattggetetaaagacttat864CysLeuAspGluAlalieAsnAsnValThrLeuAlaLeuLysThrTyr275280285ggtttctataacaacageattateatttactctteagataatggtggc912GlyPheTyrAsnAsnSerlielielieTyrSerSerAspAsnGlyGly290295300cagcctacggcaggagggagtaactggcctetcagaggtageaaagga960GinProThrAlaGlyGlySerAsnTrpProLeuArgGlySerLysGly305310315320acatattgggaaggagggateegggetgtaggctttgtgcatagecca1008ThrTyrTrpGluGlyGlylieArgAlaValGlyPheValHisSerPro325330335cttctgaaaaacaagggaacagtgtgtaaggaacttgtgcacateact1056LeuLeuLysAsnLysGlyThrValCysLysGluLeuValHislieThr340345350gactggtaccccactetcattteactggetgaaggacagattgatgag1104AspTrpTyrProThrLeulieSerLeuAlaGluGlyGinlieAspGlu355360365gacattcaaetagatggctatgatatetgggagaccataagtgagggt1152273AsplieGinLeuAspGlyTyrAsplieTrpGluThrlieSerGluGly370375380cttcgcteaccccgagtagatattttgcataacattgaccccatatac1200LeuArgSerProArgValAsplieLeuHisAsnlieAspProlieTyr385390395400accaaggcaaaaaatggctectgggcagcaggctatgggatetggaac1248ThrLysAlaLysAsnGlySerTrpAlaAlaGlyTyrGlylieTrpAsn405410415actgcaatecagteagccateagagtgcagcactggaaattgcttaca1296ThrAlalieGinSerAlalieArgValGinHisTrpLysLeuLeuThr420425430ggaaatcctggctacagegactgggtcccccctcagtctttcageaac1344GlyAsnProGlyTyrSerAspTrpValProProGinSerPheSerAsn435440445ctgggaccgaaceggtggcacaatgaaeggateaccttgteaactggc1392LeuGlyProAsnArgTrpHisAsnGluArglieThrLeuSerThrGly450455460aaaagtgtatggcttttcaacateacagccgacccatatgagagggtg1440LysSerValTrpLeuPheAsnlieThrAlaAspProTyrGluArgVal465470475480gacetatctaacaggtatccaggaategtgaagaagetcetaeggagg1488AspLeuSerAsnArgTyrProGlylieValLysLysLeuLeuArgArg485490495etcteacagttcaacaaaactgcagtgccggtcaggtatccccccaaa1536UuSerGinPheAsnLysThrAlaValProValArgTyrProProLys500505510gaccccagaagtaaccctaggetcaatggaggggtctggggaccatgg1584AspProArgSerAsnProArgLeuAsnGlyGlyValTrpGlyProTrp515520525tat£iaagsgg幼acc犯g幼3sag幼gccs3gc333朋tcaggetgag1632TyrLysGluGluThrLysLysLysLysProSerLysAsnGinAlaGlu530535540aaaaagcaaaagaaaageaaaaaaaagaagaagaaacagcagaaagca1680LysLysGinLysLysSerLysLysLysLysLysLysGinGinLysAla545550gtcteaggtteaacttgcC3tteaggtValSerGlySerThrCysHisSerGly565<210>91<211>573<212〉PRT<213〉智人<400>91555560gttacttgtggataa1722ValThrCysGly570MetGlyAlaLeuAlaGlyPheTrplieLeuCysLeuLeuThrTyrGly151015TyrLeuSerTrpGlyGinAlaLeuGluGluGluGluGluGlyAlaLeu202530LeuAlaGinAlaGlyGluLysLeuGluProSerThrThrSerThrSer354045GinProHisLeuliePhelieLeuAlaAspAspGinGlyPheArgAsp505560ValGlyTyrHisGlySerGlulieLysThrProThrLeuAspLysLeu65707580AlaAlaGluGlyValLysLeuGluAsnTyrTyrValGinProlieCys859095ThrProSerArgSerGinPhelieThrGlyLysTyrGinlieHisThr100105110GlyLeuGinHisSerlielieArgProThrGinProAsnCysLeuPro115120125LeuAspAsnAlaThrLeuProGinLysLeuLysGluValGlyTyrSer130135140ThrHisMetValGlyLysTrpHisLeuGlyPheTyrArgLysGluCys145150155160MetProThrArgArgGlyPheAspThrPhePheGlySerLeuLeuGly165170175SerGlyAspTyrTyrThrHisTyrLysCysAspSerProGlyMetCys180185190GlyTyrAspLeuTyrGluAsnAspAsnAlaAlaTrpAspTyrAspAsn195200205GlylieTyrSerThrGinMetTyrThrGinArgValGinGinlieLeu210215220AlaSerHisAsnProThrLysProliePheLeuTyrlieAlaTyrGin225230235240AlaValHisSerProLeuGinAlaProGlyArgTyrPheGluHisTyr245250255ArgSerlielieAsnlieAsnArgArgArgTyrAlaAlaMetLeuSer260265270CysLeuAspGluAlalieAsnAsnValThrLeuAlaLeuLysThrTyr275280285GlyPheTyrAsnAsnSerlielielieTyrSerSerAspAsnGlyGly276290295300GinProThrAlaGlyGlySerAsnTrpProLeuArgGlySerLysGly305310315320ThrTyrTrpGluGlyGlylieArgAlaValGlyPheValHisSerPro325330335LeuLeuLysAsnLysGlyThrValCysLysGluLeuValHislieThr340345350AspTrpTyrProThrLeulieSerLeuAlaGluGlyGinlieAspGlu355360365AsplieGinLeuAspGlyTyrAsplieTrpGluThrlieSerGluGly370375380LeuArgSerProArgValAsplieLeuHisAsnlieAspProlieTyr385390395400ThrLysAlaLysAsnGlySerTrpAlaAlaGlyTyrGlylieTrpAsn405410415ThrAlalieGinSerAlalieArgValGinHisTrpLysLeuLeuThr420425430GlyAsnProGlyTyrSerAspTrpValProProGinSerPheSerAsn435440445LeuGlyProAsnArgTrpHisAsnGluArglieThrLeuSerThrGly450455460LysSerValTrpLeuPheAsnlieThrAlaAspProTyrGluArgVal465470475480AspLeuSerAsnArgTyrProGlylieValLysLysLeuLeuArgArg485490495LeuSerGinPheAsnLysThrAlaValProValArgTyrProProLys500505510AspProArgSerAsnProArgLeuAsnGlyGlyValTrpGlyProTrp515520525TyrLysGluGluThrLysLysLysLysProSerLysAsnGinAlaGlu530535540LysLysGinLysLysSerLysLysLysLysLysLysGinGinLysAla545550555560ValSerGlySerThrCysHisSerGlyValThrCysGly565570<210>92〈211〉1710<212〉廳<213>智人〈220〉<221>CDS〈222〉(1)..(1707)〈223〉hSULF5<400>92atgcacaccetcactggcttctecctggtcagectgetcagettcggcMetHisThrLeuThrGlyPheSerLeuValSerLeuLeuSerPheGly151015tacctgtectgggactgggccaagccgagettcgtggccgacgggccc4896TyrLeuSerTrpAspTrpAlaLysProSerPheValAlaAspGlyPro202530gggGlygagGlugetggcAlaGly35gagGluC3gGincccProtegSer40gccAlagetAlaccgProcccProcagGin45cctProcccProC3CHis144atelieatelie50ttcPhe3tClieetcLeuacgThrgacAsp55gacAspc犯GinggcGlytacTyrC3CHis60g3CAspgtgValggcGlytacTyr192C3tHis65ggtGlyteaSergatAspateliegagGlu703CCThrcctProacgThrctgLeugacAsp75aggArgctgLeugcgAlagccAla肌gLys80240gggGlygtcVal犯gLysttgLeugagGlu85satAsntatTyrtacTyratelieC3gGin90cccProatelietgcCysacgThrcctPro95tegSer288eggArg3gCSercagGinetcLeu100etcLeuactThrggcGlyaggArgtacTyr105cagGinatelieC3CHisacaThrggaGly110etcLeuC3gGin336catHistecSera/tclie115ateliecgcArgCC3ProcagGincagGin120cccPro犯cAsntgcCysctgLeucccPro125ctgLeugacAspcagGin384gtgValThr130ctgLeuCC3ProC3gGin肌gLysctgLeu135C3gGingagGlugcaAlaggtGlytatTyr140tecSer3CCThrcatHisatgMet432gtgVal145ggcGly33gLystggTrpcacHisctgLeu150ggcGlyttcPhetacTyreggArgLys155gagGlutgtCysctgLeucccProaccThr160480cgtArgeggArgggcGlyttcPheg3CAsp1653CCThrttcPhectgLeuggcGlytegSer170etcLeuacgThrggcGlysatAsngtgVal175g3CAsp528tatTyrtacTyr3CCThrtatTyr180g3CAsp犯cAsntgtCysgeitAspggcGly185ccaProggcGlygtgValtgcCysggcGly190ttcPheg3CAsp576ctgcacgagggtgagaatgtggcctgggggetcageggccagtactec624LeuHisGluGlyGluAsnValAlaTrpGlyLeuSerGlyGinTyrSer195200205actatgctttacgcccagcgcgccagecatatectggccagecacage672ThrMetLeuTyrAlaGinArgAlaSerHislieLeuAlaSerHisSer210215220cctcagcgtcccetcttcetctatgtggccttccaggcagtacacaca720ProGinArgProLeuPheLeuTyrValAlaPheGinAlaValHisThr225230235240cccctgcagteccctcgtgagtacctgtaccgctaccgcaccatgggc768ProLeuGinSerProArgGluTyrLeuTyrArgTyrArgThrMetGly245250255aatgtggcceggeggaagtacgcggccatggtgacctgcatggatgag816AsnValAlaArgArgLysTyrAlaAlaMetValThrCysMetAspGlu260265270getgtgcgcaacateacctgggccetcaagcgctacggtttctacaac864AlaValArgAsnlieThrTrpAlaLeuLysArgTyrGlyPheTyrAsn275280285aacagtgtcateatettctecagtgacaatggtggccagactttcteg912AsnSerVallieliePheSerSerAspAsnGlyGlyGinThrPheSer290295300gggggcageaactggccgetccgaggacgcaagggcacttattgggaa960GlyGlySerAsnTrpProLeuArgGlyArgLysGlyThrTyrTrpGlu305310315320ggtggcgtgeggggcetaggctttgtccacagtcccctgetcaagcga1008GlyGlyValArgGlyLeuGlyPheValHisSerProLeuUuLysArg325330335aagcaaeggacaageegggcactgatgcacateactgactggtacccg1056LysGinArgThrSerArgAlaLeuMetHislieThrAspTrpTyrPro340345350accctggtgggtctggcaggtggtaccaccteagcagccgatgggeta1104ThrLeuValGlyLeuAlaGlyGlyThrThrSerAlaAlaAspGlyLeu355360365gatggctacgacgtgtggccggccateagegagggcegggccteacca1152AspGlyTyrAspValTrpProAlalieSerGluGlyArgAlaSerPro370375380cgcacggagatectgcacaacattgacccaetctacaaccatgcccag1200ArgThrGlulieLeuHisAsnlieAspProLeuTyrAsnHisAlaGin385390395400catggctecctggagggcggctttggcatetggaacaccgccgtgcag1248HisGlySerLeuGluGlyGlyPheGlylieTrpAsnThrAlaValGin405410415getgccatecgcgtgggtgagtggaagctgctgacaggagaccccggc1296AlaAlalieArgValGlyGluTrpLysLeuLeuThrGlyAspProGly420425430tatggcgattggateccaccgcagacactggccaccttcccgggtage1344TyrGlyAspTrplieProProGinThrLeuAlaThrPheProGlySer435440445tggtggaacctggaacgaatggccagtgtccgccaggccgtgtggetc1392TrpTrpAsnLeuGluArgMetAlaSerValArgGinAlaValTrpLeu450455460ttcaacateagtgetgacccttatgaaegggaggacctggetggccag1440PheAsnlieSerAlaAspProTyrGluArgGluAspLeuAlaGlyGin465470475480eggcctgatgtggtccgcaccctgctggetcgcctggccgaatataac1488ArgProAspValValArgThrLeuLeuAlaArgLeuAlaGluTyrAsn485490495cgcacagccateccggtacgctacccagetgagaaccccegggetcat1536ArgThrAlalieProValArgTyrProAla(huAsnProArgAlaHis500505510cctgactttaatgggggtgettgggggccctgggccagtgatgaggaa1584ProA印PheAsnGlyGlyAlaTrpGlyProTrpAlaSerAspGluGlu515520525gaggaggaagaggaagggagggetcgaagettcteceggggtcgtcgc1632GluGluGluGluGluGlyArgAlaArgSerPheSerArgGlyArgArg530535540aagaaaaaatgcaagatttgcaagcttcgatectttttccgt犯aetc1680281<formula>formulaseeoriginaldocumentpage282</formula>120125ValThrLeuProGinLysLeuGinGluAlaGlyTyrSerThrHisMet130135140ValGlyLysTrpHisLeuGlyPheTyrArgLysGluCysLeuProThr145150155160ArgArgGlyPheAspThrPheLeuGlySerLeuThrGlyAsnValAsp165170175TyrTyrThrTyrAspAsnCysAspGlyProGlyValCysGlyPheAsp180185190LeuHisGluGlyGluAsnValAlaTrpGlyLeuSerGlyGinTyrSer195200205ThrMetLeuTyrAlaGinArgAlaSerHislieLeuAlaSerHisSer210215220ProGinArgProLeuPheLeuTyrValAlaPheGinAlaValHisThr225230235240ProLeuGinSerProArgGluTyrLeuTyrArgTyrArgThrMetGly245250255AsnValAlaArgArgLysTyrAlaAlaMetValThrCysMetAspGlu260265270AlaValArgAsnlieThrTrpAlaLeuLysArgTyrGlyPheTyrAsn275280285AsnSerVallieliePheSerSerAspAsnGlyGlyGinThrPheSer283290295300GlyGlySerAsnTrpProLeuArgGlyArgLysGlyThrTyrTrpGlu305310315320GlyGlyValArgGlyLeuGlyPheValHisSerProLeuLeuLysArg325330335LysGinArgThrSerArgAlaLeuMetHislieThrAspTrpTyrPro340345350ThrLeuValGlyLeuAlaGlyGlyThrThrSerAlaAlaAspGlyLeu355360365AspGlyTyrAspValTrpProAlalieSerGluGlyArgAlaSerPro370375380ArgThrGlulieLeuHisAsnlieAspProLeuTyrAsnHisAlaGin385390395400HisGlySerLeuGluGlyGlyPheGlylieTrpAsnThrAlaValGin405410415AlaAlalieArgValGlyGluTrpLysLeuLeuThrGlyAspProGly420425430TyrGlyAspT卬lieProProGinThrLeuAlaThrPheProGlySer435440445TrpTrpAsnLeuGluArgMetAlaSerValArgGinAlaValTrpLeu450455460PheAsnlieSerAlaAspProTyrGluArgGluAspLeuAlaGlyGinArgProAspValValArgThrLeuLeuAlaArgLeuAlaGluTyrAsn4854卯495ArgThrAlalieProValArgTyrProAlaGluAsnProArgAlaHis500505510ProAspPheAsnGlyGlyAlaTrpGlyProTrpAlaSerAspGluGlu515520525GluGluGluGluGluGlyArgAlaArgSerPheSerArgGlyArgArg530535540LysLysHysCysLyslieCysLysLeuArgSerPhePheArgLysLeu555560545550AsnThrArgLeuMetSerGinArglie565〈210〉94<211〉2067<212〉DNA<213>智人〈220〉<221〉CDS<222>(1)..(2064)<223〉hSULF6<400〉94atgetaattteaggaagagaagagaaccaaatagacatatecaagaccMetLeulieSerGlyArgGluGluAsnGinlieAsplieSerLysThr151015acagaggtagattgttttgtggttgaattaggaagtetacacaatcct4896285ThrGluValAspCysPheValValGluLeuGlySerLeuHisAsnPro202530acaeggaacccacagcgaattttcaccaagcacgtggccaccaagtea144ThrArgAsnProGinArgliePheThrLysHisValAlaThrLysSer354045tecagetecaaatgtcagctggaccaaggtggaaaaagectggtccag192SerSerSerLysCysGinLeuAspGinGlyGlyLysSerLeuValGin505560tgcattttacccagatctteaaagetcetcteacccttgtgtetcccc240CyslieLeuProArgSerSerLysLeuLeuSerProLeuCysLeuPro65707580catccgtgtggagetttacttctgtatagatecteaggaategcctct288HisProCysGlyAlaLeuI>euLeuTyrArgSerSerGlylieAlaSer859095getcttgetgcctttacagactecetctctaggagetgctggctgtea336AlaLeuAlaAlaPheThrAspSerLeuSerArgSerCysTrpLeuSer100105110gtgtecctgtgctgtttgttttgcggtgttgatggcacatttatgaca384ValSerLeuCysCysLeuPheCysGlyValAspGlyThrPheMetThr115120125agaaacgccagacccaacattgtcctgctgatggcagatgaccttgga432ArgAsnAlaArgProAsnlieValLeuLeuMetAlaAspAspLeuGly130135140gtgggggatttgtgctgctacggtaataacteagtgageacacctaat480ValGlyAspLeuCysCysTyrGlyAsnAsnSerValSerThrProAsn145150155160attgaccgcctggcaagtgaaggagtgaggcttacccagcatetcgca528lieAspArgLeuAlaSerGluGlyValArgLeuThrGinHisLeuAla165170175getgettecatgtgcaccccaagtegggetgccttcctgaccggcegg576AlaAlaSerMetCysThrProSerArgAlaAlaPheLeuThrGlyArg180185190taccccateagateagggatggtgtctgcctacaacctgaaccgtgcc624SerAlaTyrAsnLeuAsnArgAla195200205ttcacgtggcttggtgggteaggtggtcttcccaccaatgaaacgact672PheThrTrpLeuGlyGlySerGlyGlyLeuProThrAsnGluThrThr210215220tttgccaagctgctgcagcaccgtggctaccgcacgggaetcataggc720PheAlaLysLeuLeuGinHisArgGlyTyrArgThrGlyLeulieGly225230235240aaatggcacctgggtttgagetgcgcctcteggaatgatcactgttac768LysTrpHisLeuGlyLeuSerCysAlaSerArgAsnAspHisCysTyr245250255cacccgetcaaccatggttttcactacttttacggggtgccttttgga816HisProLeuAsnHisGlyPheHisTyrPheTyrGlyValProPheGly260265270cttttaagegactgccaggcatecaagseaccag肌ctgcaccgctgg864LeuLeuSerAspCysGinAlaSerLysThrProGluLeuHisArgTrp275280285etcaggateaaactgtggatetecacggtagcccttgccctggttcct912LeuArglieLysLeuTrplieSerThrValAlaLeuAlaLeuValPro290295300tttctgcttetcattcccaagttcgcccgctggttcteagtgccatgg960PheLeuLeuLeulieProLysPheAlaArgTrpPheSerValProTrp305310315320aaggtcatetttgtctttgetetcetcgcctttctgtttttcacttec1008LysValliePheValPheAlaLeuLeuAlaPheLeuPhePheThrSer325330335tggtactctagttatggatttactcgacgttggaattgcatecttatg1056TrpTyrSerSerTyrGlyPheThrArgArgTrpAsnCyslieLeuMet340345350aggaaccatgaaattatecagcagccaatgaaagaggagaaagtaget1104ArgAsnHisGlulielieGinGinProMetLysGluGluLysValAla355360365tecetcatgctgaaggaggcacttgetttcattgaaaggtacaaaagg1152287AlaLeuAlaPhelieGluArgTyrLysArg370375380gaaccttttetcetctttttttecttcctgcacgtacatactccaetc1200GluProPheLeuLeuPhePheSerPheLeuHisValHisThrProLeu385390395400atetecaaaaagaagtttgttgggcgcagtaaatatggcaggtatggg1248lieSerLysLysLysPheValGlyArgSerLysTyrGlyArgTyrGly405410415gacaatgtagaagaaatggattggatggtgggtaaaatectggatgcc1296AspAsnValGluGluMetAspTrpMetValGlyLyslieLeuAspAla420425430ctggaccaggagcgcctggccaaccacaccttggtgtacttcacctct1344LeuAspGinGluArgLeuAlaAsnHisThrLeuValTyrPheThrSer435440445gacaacgggggccacctggagcccctggacggggetgttcagctgggt1392AspAsnGlyGlyHisLeuGluProLeuAspGlyAlaValGinLeuGly450455460ggctggaacgggatetacaaaggtggcaaaggaatgggaggatgggaa1440GlyTrpAsnGlylieTyrLysGlyGlyLysGlyMetGlyGlyTrpGlu465470475480ggaggtatecgtgtgccagggatattceggtggccgteagtcttggag1488GlyGlylieArgValProGlyliePheArgTrpProSerValLeuGlu485490495getgggagagtgateaatgagcccaccagettaatggacatetatccg1536AlaGlyArgVallieAsnGluProThrSerLeuMetAsplieTyrPro500505510acgctgtcttatataggcggagggatettgteccaggscagagtgatt1584ThrLeuSerTyrlieGlyGlyGlylieLeuSerGinAspArgVallie515520525gacggccagaacetaatgcccctgctggaaggaagggcgteccactec1632AspGlyGinAsnLeuMetProLeuLeuGluGlyArgAlaSerHisSer530535540gaccacgagttcetcttccactactgtggggtctatctgcacacggtc1680288AspHisGluPheLeuPheHisTyrCysGlyValTyrLeuHisThrVal545550555560aggtggcatcagaaggactgtgcaactgtgtggaaagetcattatgtg1728ArgTrpHisGinLysAspCysAlaThrValTrpLysAlaHisTyrVal565570575actcctaaattctaccctgaaggaacaggtgcctgctatgggagtgga1776ThrProLysPheTyrProGluGlyThrGlyAlaCysTyrGlySerGly580585590atatgtteatgttegggggatgtaacctaccacgacccaccaetcetc1824lieCysSerCysSerGlyAspValThrTyrHisAspProProLeuLeu595600605tttgacateteaagagaccctteagaagcccttccactgaaccctgac1872PheAsplieSerArgAspProSerGluAlaLeuProLeuAsnProAsp610615620aatgagccattatttgactecgtgateaaaaagatggaggcagccata1920AsnGluProUuPheAspSerVallieLysLysMetGluAlaAlalie625630635640agagagcatcgtaggacaetaacacctgtcccacagcagttctctgtg1968ArgGluHisArgArgThrLeuThrProValProGinGinPheSerVal645650655ttcaacacaatttggaaaccatggctgcagccttgctgtgggaccttc2016PheAsnThrlieTrpLysProTrpLeuGinProCysCysGlyThrPhe660665670cccttctgtgggtgtgacaaggaagatgacatecttcccatggetccc2064ProPheCysGlyCysAspLysGluAspAsplieLeuProMetAlaPro675680685tga2067<210〉95〈211〉688<212>PRT<213〉智人<400〉95MetLeulieSerGlyArgGluGluAsnGinlieAsplieSerLysThr151015ThrGluValAspCysPheValValGluLeuGlySerLeuHisAsnPro202530ThrArgAsnProGinArgliePheThrLysHisValAlaThrLysSer354045SerSerSerLysCysGinLeuAspGinGlyGlyLysSerLeuValGin505560CyslieLeuProArgSerSerLysLeuLeuSerProLeuCysLeuPro65707580HisProCysGlyAlaLeuLeuLeuTyrArgSerSerGlylieAlaSer859095AlaLeuAlaAlaPheThrAspSerLeuSerArgSerCysTrpLeuSer100105110ValSerLeuCysCysLeuPheCysGlyValAspGlyThrPheMetThr115120125ArgAsnAlaArgProAsnlieValLeuLeuMetAlaAspAspLeuGly130135140ValGlyAspLeuCysCysTyrGlyAsnAsnSerValSerThrProAsn145150155160lieAspArgLeuAlaSerGluGlyValArgLeuThrGinHisLeuAla165170175AlaAlaSerMetCysThrProSerArgAlaAlaPheLeuThrGlyArg180185190TyrProlieArgSerGlyMetValSerAlaTyrAsnLeuAsnArgAla195200205PheThrTrpLeuGlyGlySerGlyGlyLeuProThrAsnGluThrThr210215220PheAlaLysLeuLeuGinHisArgGlyTyrArgThrGlyLeulieGly225230235240LysTrpHisLeuGlyLeuSerCysAlaSerArgAsnAspHisCysTyr245250255HisProLeuAsnHisGlyPheHisTyrPheTyrGlyValProPheGly260265270LeuLeuSerAspCysGinAlaSerLysThrProGluLeuHisArgTrp275280285LeuArglieLysLeuTrplieSerThrValAlaLeuAlaUuValPro290295300PheLeuLeuLeulieProLysPheAlaArgTrpPheSerValProTrp305310315320LysValliePheValPheAlaLeuLeuAlaPheLeuPhePheThrSer325330335TrpTyrSerSerTyrGlyPheThrArgArgTrpAsnCyslieLeuMet340345350ArgAsnHisGlulielieGinGinProMetLysGluGluLysValAla355360365SerLeuMetLeuLysGluAlaLeuAlaPhelieGluArgTyrLysArg370375380GluProPheLeuLeuPhePheSerPheLeuHisValHisThrProLeu385390395400lieSerLysLysLysPheValGlyArgSerLysTyrGlyArgTyrGly405410415AspAsnValGluGluMetAspTrpMetValGlyLyslieLeuAspAla420425430LeuAspGinGluArgLeuAlaAsnHisThrLeuValTyrPheThrSer435440445AspAsnGlyGlyHisLeuGluProLeuAspGlyAlaValGinLeuGly450455460GlyT卬AsnGlylieTyrLysGlyGlyLysGlyMetGlyGlyTrpGlu465470475480GlyGlylieArgValProGlyliePheArgTrpProSerValLeuGlu485490495AlaGlyArgVallieAsnGluProThrSerLeuMetAsplieTyrPro500505510ThrLeuSerTyrlieGlyGlyGlylieLeuSerGinAspArgVallie515520525AspGlyGinAsnLeuMetProLeuLeuGluGlyArgAlaSerHisSer530535540AspHisGluPheLeuPheHisTyrCysGlyValTyrLeuHisThrVal545550555560ArgTrpHisGinLysAspCysAlaThrValTrpLysAlaHisTyrVal565570575ThrProLysPheTyrProGluGlyThrGlyAlaCysTyrGlySerGly580585590lieCysSerCysSerGlyAspValThrTyrHisAspProProLeuLeu595600'605PheAsplieSerArgAspProSerGluAlaLeuProLeuAsnProAsp610615620AsnGluProLeuPheAspSerVallieLysLysMetGluAlaAlalie625630635640Arg.GluHisArgArgThrLeuThrProValProGinGinPheSerVal645650655PheAsnThrlieTrpLysProTrpLeuGinProCysCysGlyThrPhe660665670ProPheCysGlyCysAspLysGluAspAsplieLeuProMetAlaPro67568068權(quán)利要求1、藥物組合物,包含由細(xì)胞產(chǎn)生的、用于治療硫酸酯酶缺乏癥的硫酸酯酶,和藥學(xué)上可接受的載體,其中所述細(xì)胞已與包含選自下列的分離的多肽的試劑接觸具有與SEQIDNO2序列具有至少95%一致性的、并且具有Cα-甲酰甘氨酸生成活性(FGE)的氨基酸序列的多肽;和包含選自SEQIDNO2、5、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76和78的序列的多肽。2、藥物組合物,包含由細(xì)胞產(chǎn)生的、用于治療硫酸酯酶缺乏癥的硫酸酯酶,和藥學(xué)上可接受的載體,其中所迷細(xì)胞已與包含選自下列的分離的核酸分子的試劑接觸(a)如SEQIDN0:1所示的核苷酸序列的獨特片段,其中所述SEQIDNO:1的核苷酸序列編碼SEQIDN0:2的多肽,和(b)(a)的互補序列。3、已與甲酰甘氨酸生成酶接觸的硫酸酯酶在制備用于在受試者中增加硫酸酯酶特異活性的藥物中的用途,其中甲酰甘氨酸生成酶由選自下列的核酸分子編碼(a)如SEQIDNO:1所示的核苷酸序列的獨特片段,其中所述SEQIDNO:1的核苷酸序列編碼SEQIDN0:2的多肽,和(b)(a)的互補序列。4、核酸分子在制備用于在細(xì)胞中增加Coc-甲酰甘氨酸生成活性的藥物中的用途,其中所述核酸分子選自(a)如SEQIDNO:l所示的核苷酸序列的獨特片段,其中所述SEQIDNO:1的核苷酸序列編碼SEQIDN0:2的多肽,和(b)(a)的互補序列。5、藥物組合物,包含包含治療多種硫酸酯酶缺乏癥的藥學(xué)有效量的分離的核酸分子的試劑和藥學(xué)上可接受的載體,所述分離的核酸分子選自(a)如SEQIDNO:l所示的核苷酸序列的獨特片段,其中所述SEQIDN0:1的核苷酸序列編碼SEQIDN0:2的多肽,和(b)(a)的互補序列。6、鑒別可用于調(diào)節(jié)Coc-曱酰甘氨酸生成活性的試劑的方法,包含(a)將具有Cot-甲酰甘氨酸生成活性的分子與候選試劑接觸,(b)測量所述分子的Ca-甲酰甘氨酸生成活性,和(c)將測得的所述分子的Cot-甲酰甘氨酸生成活性與對照比較以確定所述候選試劑是否調(diào)節(jié)所述分子的Coc-甲酰甘氨酸生成活性,其中所迷分子是包含選自SEQIDNO:2、5、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76和78的序列的多肽。7、選擇性結(jié)合包含SEQIDNO:2的多肽的試劑在制備用于在受試者中診斷多種^P危酸酯酶缺乏癥的藥物中的用途。8、選擇性結(jié)合包含SEQIDNO:2的多肽的試劑在制備用于診斷特征為核酸分子或其表達產(chǎn)物的異常表達的生理狀況的藥物中的用途,其中所述生理狀況是多種硫酸酯酶缺乏癥,9、包含SEQIDNO:2的多肽在制備用于在來自受試者的樣本中確定多種硫酸酯酶缺乏癥的藥物中的用途,其中所述多種硫酸酯酶缺乏癥以所述多肽的異常表達為特征。10、權(quán)利要求9的用途,其中所述樣本是生物液體或組織。11、權(quán)利要求9的用途,進一步包舍將所述樣本與選自下列的可檢測的試劑接觸(a)與所述多肽選擇性結(jié)合的抗體,和(c)與(iv)中的抗體結(jié)合的多肽。12、權(quán)利要求11的用途,其中所述抗體或多肽用放射性標(biāo)記或酶進行標(biāo)記。13、包含包裝的試劑盒,所述包裝包含(i)試劑選自具有與SEQIDN0:2序列具有至少95%—致性的、并且具有Ccc-甲酰甘氨酸生成活性(FGE)的氨基酸序列的多肽,和(ii)第二試劑其選擇性結(jié)合選自下列的多肽或其肽艾杜糖醛酸-2-硫酸酯酶、硫酸胺酶、N-乙酰半乳糖胺6-硫酸酯酶、N-乙酰葡萄糖胺6-硫酸酯酶、芳基硫酸酯酶A、芳基疏酸酯酶B、芳基硫酸酯酶C、芳基硫酸酯酶D、芳基硫酸酯酶E、芳基硫酸酯酶F、芳基硫酸酯酶G、HSulf-l、HSulf-2、HSulf-3、HSulf-4、HSulf-5和HSulf-6,和用于與所述第二試劑和所述多肽或其肽結(jié)合的測量值進行比較的對照。14、調(diào)節(jié)Cct-曱酰甘氨酸生成活性的試劑在制備用于在受試者中治療多種硫酸酯酶缺乏癥的藥物中的用途,其中所述調(diào)節(jié)Coc-甲酰甘氨酸生成活性的試劑是選自下列的多肽具有與SEQIDN0:2序列具有至少95%—致性的、并且具有Coc-曱酰甘氨酸生成活性(FGE)的氨基酸序列的多肽;和包含選自SEQIDNO:2、5、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76和78的序列的多肽。15、權(quán)利要求14的用途,其中所述藥物進一步包含選自下列的試劑編碼艾杜糖醛酸-2-硫酸酯酶、硫酸胺酶、N-乙酰半乳糖胺6-硫酸酯酶、N-乙酰葡萄糖胺6-硫酸酯酶、芳基硫酸酯酶A、芳基硫酸酯酶B、芳基疏酸酯酶C、芳基硫酸酯酶D、芳基硫酸酯酶E、芳基硫酸酯酶F、芳基硫酸酯酶G、HSulf-l、HSulf-2、HSulf誦3、HSulf-4、HSulf-5、HSulf-6的核酸分子和所述核酸分子的表達產(chǎn)物。16、分離的多肽在制備用于在受試者中增加Ccx-甲酰甘氨酸生成活性的藥物中的用途,所述分離的多肽選自具有與SEQIDN0:2序列具有至少95%—致性的、并且具有Coc-曱酰甘氨酸生成活性(FGE)的氨基酸序列的多肽;和包含選自SEQIDN0:2、5、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76和78的序列的多舦。17、多肽在制備用于在細(xì)胞中增加Ccc-甲酰甘氨酸生成活性的藥物中的用途,所述多肽選自具有與SEQIDN0:2序列具有至少9"/。一致性的、并且具有Coc-甲酰甘氨酸生成活性(FGE)的氨基酸序列的多肽;和包含選自SEQIDN0:2、5、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76和78的序列的多肽。18、藥物組合物,包含包含治療多種硫酸酯酶缺乏癥的藥學(xué)有效量的分離的多肽的試劑和藥學(xué)上可接受的載體,所述分離的多肽選自具有與SEQIDN0:2序列具有至少95%—致性的、并且具有Coc-甲酰甘氨酸生成活性(FGE)的氨基酸序列的多肽;和包含選自SEQIDN0:2、5、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76和78的序列的多肽。19、分離的多肽在制備用于在細(xì)胞中增加硫酸酯酶活性的藥物中的用途,所述分離的多肽選自具有與SEQIDN0:2序列具有至少95%—致性的、并且具有Cot-甲酰甘氨酸生成活性(FGE)的氨基酸序列的多肽;和包含選自SEQIDN0:2、5、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76和78的序列的多肽。20、權(quán)利要求19的用途,其中所述細(xì)胞表達內(nèi)源性硫酸酯酶。21、權(quán)利要求20的用途,其中所迷內(nèi)源性硫酸酯酶被激活。22、權(quán)利要求19的用途,其中所述細(xì)胞表達外源的硫酸酯酶。23、根據(jù)權(quán)利要求19-22中任一項的用途,其中硫酸酯酶選自艾杜糖酪酸-2-硫酸酯酶、硫酸胺酶、N-乙酰半乳糖胺6-硫酸酯酶、N-乙酰葡萄糖胺6-硫酸酯酶、芳基硫酸酯酶A、芳基疏酸酯酶B、芳基疏酸酯酶C、芳基硫酸酯酶D、芳基硫酸酯酶E、芳基硫酸酯酶F、芳基硫酸酯酶G、HSulf-l、HSulf-2、HSulf-3、HSulf-4、HSulf-5和HSulf-6。24、權(quán)利要求19的用途,其中所述細(xì)胞是哺乳動物細(xì)胞。25、包含包裝的試劑盒,所述包裝包含選擇性結(jié)合編碼FGE的核酸分子或其表達產(chǎn)物的試劑,和對照,其用于與所述試劑和選自下列的所述分離的核酸分子結(jié)合的測量值的比較:(a)如SEQIDN0:1所示的核苷酸序列的獨特片段,其中所述SEQIDNO:1的核苷酸序列編碼SEQIDNO:2的多肽序列,和(b),(a)的互補序列;和選擇性結(jié)合選自下列的多肽或其肽的第二試劑艾杜糖醛酸-2-硫酸酯酶、硫酸胺酶、N-乙酰半乳糖胺6-硫酸酯酶、N-乙酰葡萄糖胺6-硫酸酯酶、芳基硫酸酯酶A、芳基硫酸酯酶B、芳基硫酸酯酶C、芳基硫酸酯酶D、芳基硫酸酯酶E、芳基硫酸酯酶F、芳基硫酸酯酶G、HSulf-l、HSulf-2、HSulf-3、HSulf-4、HSulf-5和HSulf-6,和用于與所述第二試劑和所述多肽或其肽結(jié)合的測量值進行比較的對照,26、調(diào)節(jié)Ccx-甲酰甘氨酸生成活性的試劑在制備用于在受試者中治療多種硫酸酯酶缺乏癥的藥物中的用途,其中所述調(diào)節(jié)Ccc-甲酰甘氨酸生成活性的試劑是選自下列的核酸分子(a)如SEQIDNO:1所示的核苷酸序列的獨特片段,其中所述SEQIDNO:1的核苷酸序列編碼SEQIDN0:2的多肽,和(b)(a)的互補序列。27、調(diào)節(jié)Cct-甲酰甘氨酸生成活性的試劑在制備用于受試者中治療多種硫酸酯酶缺乏癥的藥劑中的用途,其中所述調(diào)節(jié)Ccx-甲酖甘氨酸生成活性的試劑是由選自下列的核酸分子編碼的肽(a)如SEQIDNO:1所示的核苷酸序列的獨特片段,其中所述SEQIDNO:1的核苷酸序列編碼SEQIDN0:2的多肽,和(b)(a)的互補序列。28、調(diào)節(jié)Coc-甲酰甘氨酸生成活性的試劑在制備用于受試者中治療多種硫酸酯酶缺乏癥的藥劑中的用途,其中所述調(diào)節(jié)Coc-甲酰甘氨酸生成活性的試劑是由表達選自下列的FGE核酸分子的細(xì)胞產(chǎn)生的(a)如SEQIDNO:1所示的核苷酸序列的獨特片段,其中所述SEQIDNO:1的核苷酸序列編碼SEQIDN0:2的多肽,和(b)(a)的互補序列。29、分離的核酸分子在制備用于細(xì)胞中增加硫酸酯酶活性的藥劑,所述分離的核酸分子選自(a)如SEQIDNO:1所示的核苷酸序列的獨特片段,其中所述SEQIDNO:1的核苷酸序列編碼SEQIDN0:2的多肽,和(b)(a)的互補序列。30、調(diào)節(jié)Coc-甲酰甘氨酸生成活性的、以有效量在受試者中增加Coc-甲酰甘氨酸生成活性的試劑在制備在受試者中治療多種硫酸酯酶缺乏癥的藥物中的用途,其中所述調(diào)節(jié)Cot-曱酰甘氨酸生成活性的試劑是選自下列的有義核酸分子(a)如SEQIDN0:1所示的核苷酸序列的獨特片段,其中所述SEQIDNO:1的核苷酸序列編碼SEQIDN0:2的多肽,和(b)(a)的互補序列。31、調(diào)節(jié)Ccc-曱酰甘氨酸生成活性的、以有效量在受試者中增加Ca-曱酰甘氨酸生成活性的試劑在制備用于在受試者中治療多種硫酸酯酶缺乏癥的藥物中的用途,其中所述調(diào)節(jié)Ccc-曱酰甘氨酸生成活性的試劑是由選自下列的核酸分子編碼的分離的多肽(a)如SEQIDN0:1所示的核苷酸序列的獨特片段,其中所述SBQIDN0:1的核苷酸序列編碼SEQIDN0:2的多肽,和(b)(a)的互補序列。全文摘要本發(fā)明涉及使用甲酰-甘氨酸生成酶(FGE)對多種硫酸酯酶缺乏癥和其它病癥進行診斷和治療,具體地涉及藥物組合物,包含由細(xì)胞產(chǎn)生的、用于治療硫酸酯酶缺乏癥的硫酸酯酶,和藥學(xué)上可接受的載體,其中所述細(xì)胞已與包含選自下列的分離的多肽的試劑接觸具有與SEQIDNO2序列具有至少95%一致性的、并且具有Cα-甲酰甘氨酸生成活性(FGE)的氨基酸序列的多肽;和包含選自SEQIDNO2、5、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76和78的序列的多肽。文檔編號A61K38/46GK101444621SQ20081021307公開日2009年6月3日申請日期2004年2月10日優(yōu)先權(quán)日2003年2月11日發(fā)明者A·巴拉比奧,B·施密特,菲古拉K·馮,M·P·考斯瑪,M·W·希爾特萊恩,T·蒂爾克斯申請人:夏爾人類遺傳性治療公司