專利名稱:用于增加骨礦化的組合物和方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及制藥學(xué)產(chǎn)品和方法;具體而言,本發(fā)明涉及適于增加骨礦物質(zhì)含量的方法和組合物。這些組合物和方法可用于治療多種狀況,包括例如骨質(zhì)減少、骨質(zhì)疏松、骨折以及以骨礦物質(zhì)密度低作為疾病標志的其它疾病。
背景技術(shù):
在人的一生中存在兩個或三個明顯的骨質(zhì)變化階段(參閱Riggs,West J.Med.15463-77,1991)。第一個階段男性和女性都有,發(fā)展達到骨質(zhì)峰值。這第一個階段是通過軟骨內(nèi)生長板的線性生長以及由于一定比率骨膜并置引起的徑向生長而實現(xiàn)的。第二個階段對于骨小梁(扁骨,諸如椎骨和骨盆)而言在大約30歲開始,而對于皮層骨(例如四肢中的長骨)而言在大約40歲開始,并持續(xù)至老年。這個階段的特點是骨緩慢流失,而且在男性和女性中都存在。在女性中還存在骨流失的第三個階段,最有可能是因為絕經(jīng)后雌激素缺乏所致。僅是在這個階段,女性可能額外由皮層骨流失10%骨質(zhì),而由小梁區(qū)室內(nèi)流失25%(參閱Riggs,見上文)。
在多種狀況中會引起骨礦物質(zhì)含量流失,而且可能導(dǎo)致重大的醫(yī)學(xué)問題。例如,骨質(zhì)疏松是使人衰弱的疾病,其特征是骨骼的骨質(zhì)和礦物質(zhì)密度顯著下降,骨結(jié)構(gòu)退化(包括骨顯微結(jié)構(gòu)退化),以及患病個體中骨易碎性和骨折易感性相應(yīng)增加。在美國,在大約2500萬人中發(fā)現(xiàn)了臨床骨質(zhì)減少(骨礦物質(zhì)密度比年輕成年人骨平均值低1-2.5個標準偏差),這種狀況是骨質(zhì)疏松在人體中的前期表現(xiàn)。在美國還另有700-800萬患者診斷患有臨床骨質(zhì)疏松(定義為骨礦物質(zhì)含量比成熟年輕成年人骨低2.5個標準偏差以上)。骨質(zhì)疏松對于保健系統(tǒng)而言是最費錢的疾病之一,在美國每年花費數(shù)百億美元。除了保健相關(guān)費用以外,長期居家護理和失業(yè)時間加重了這種疾病的財政和社會負擔(dān)。全世界大約有7500萬人有患上骨質(zhì)疏松的危險。
人群中骨質(zhì)疏松的頻率隨年齡而增加,而且在白人中主要女性中存在(在美國占骨質(zhì)疏松患者的80%)。老年人中骨骼易碎性和骨折易感性的增加會由于這個群體意外摔倒的風(fēng)險較大而加重。在美國每年報道超過150萬例骨質(zhì)疏松相關(guān)骨折。髖骨、腕骨、和椎骨骨折是與骨質(zhì)疏松有關(guān)的最常見損傷。特別是髖骨骨折對于患者而言極其不舒服且費用高昂,而且對于女性而言與高比率的死亡率和發(fā)病率有關(guān)。
盡管已經(jīng)注意到骨質(zhì)疏松會由于骨質(zhì)減少而增加骨折風(fēng)險,然而目前可用于骨骼疾病的治療都不能實質(zhì)性增加成年人的骨密度。所有醫(yī)生強烈感覺到需要能夠增加成年人骨密度的藥物,特別是在骨質(zhì)減少和骨質(zhì)疏松中有風(fēng)險的腕骨、脊柱和髖骨中增加骨密度的藥物。
目前用于預(yù)防骨質(zhì)疏松的策略可以為個體提供一些益處,但是不能確保解決該疾病。這些策略包括對老齡患者而言緩和身體活動(特別是承重活動),在飲食中添加適量鈣,且避免消費含有酒精或煙草的產(chǎn)品。對于出現(xiàn)了臨床骨質(zhì)減少或骨質(zhì)疏松的患者而言,所有現(xiàn)行治療藥物和策略均致力于通過抑制骨吸收過程來減少骨質(zhì)進一步流失,但骨吸收過程是組成性地存在的骨重建過程的天然成分。
例如,現(xiàn)在用雌激素處方阻止骨流失。然而,對患者是否有任何長期益處以及對75歲以上患者究竟是否有任何效果存在一些爭論。此外,一般認為使用雌激素會增加乳癌和子宮內(nèi)膜癌的風(fēng)險。
對絕經(jīng)后婦女還建議飲食添加大劑量鈣,無論是否添加維生素D。然而,大劑量的鈣常常具有不舒服的胃腸副作用,而且必須連續(xù)監(jiān)測血清和尿液鈣水平(參閱Khosla和Rigss,Mayo Clin.Proc.70978-982,1995)。
曾經(jīng)提議的其它治療劑包括降鈣素、二膦酸酯類、同化類固醇和氟化鈉。然而,這些治療劑所具有的不良副作用(例如,降鈣素和類固醇可能引起惡心并激發(fā)免疫反應(yīng),二膦酸酯類和氟化鈉可能抑制骨折修復(fù),盡管骨密度有適度增加)可能阻止其使用(參閱Khosla和Rigss,見上文)。
目前實行的治療策略尚未涉及刺激或增強新骨質(zhì)生長的藥物。本發(fā)明提供了可用于增加骨礦化、由此可用于治療期望增加骨質(zhì)的多種狀況的組合物和方法。另外,本發(fā)明還具有其它相關(guān)優(yōu)勢。
發(fā)明概述如上所述,本發(fā)明提供了TGF-β結(jié)合蛋白的新類別或家族,以及用于選擇增加骨礦物質(zhì)含量和骨礦物質(zhì)密度的化合物的測定法、增加骨礦物質(zhì)含量和骨礦物質(zhì)密度的化合物、以及在治療或預(yù)防多種疾病時利用這些化合物的方法。
本發(fā)明的一個方面提供了分離的核酸分子,其中所述核酸分子選自下組(a)包含SEQ ID NO1、5、7、9、11、13、或15或者其互補序列的分離核酸分子;(b)在高嚴謹條件下與(a)的核酸分子特異雜交的分離核酸分子;和(c)依照(a)或(b)且編碼TGF-β結(jié)合蛋白的分離核酸分子。本發(fā)明的相關(guān)方面提供了分離的核酸分子,所述核酸分子僅僅與上文定義序列之一的一部分雜交(例如,對于(a)而言,可以是與選自SEQ ID NO1第156位-第539位或第555位-第687位核苷酸的至少20、25、50、或100個核苷酸的探針發(fā)生雜交)。應(yīng)當(dāng)顯而易見的是,雜交所采取的必需嚴謹性可以根據(jù)探針長度而變化。例如,對于長度為25個核苷酸的探針而言,高嚴謹條件可以包括60mMTris pH8.0、2mM EDTA、5×Denhardt氏溶液、6×SSC、0.1%(w/v)N-月桂基肌氨酸、0.5%(w/v)NP-40(nonidet P-40)于45℃保溫過夜,隨后用0.2×SSC/0.1%SDS于45-50℃清洗兩次。對于低嚴謹條件下長度為100個核苷酸的探針而言,合適的條件可以包括5×SSPE、5×Denhardt氏溶液和0.5%SDS于42-50℃保溫過夜,隨后用2×SSPE(或2×SSC)/0.1%SDS于42-50℃清洗兩次。
本發(fā)明的相關(guān)方面提供了與SEQ ID NO1、5、7、9、11、13、或15具有同源性的分離核酸分子,使用Wilbur-Lipman算法測定同源性水平為50%、60%、75%、80%、90%、95%、或98%的核酸分子。這些分離分子的代表性實例包括例如編碼包含序列SEQ ID NO2、6、10、12、14或16或是與這些序列具有同源性的蛋白質(zhì)的核酸分子,使用Wilbur-Lipman算法測定其同源性水平為50%、60%、75%、80%、90%、95%、或98%。
分離的核酸分子的長度通常小于100kb,而且,在某些實施方案中,長度小于50kb、25kb、10kb、或甚至5kb。另外,在其它實施方案中,分離的核酸分子不是存在于其它無關(guān)核酸分子的“文庫”中(例如BAC亞克隆,諸如GenBank編號AC003098和EMB編號AQ171546中所述)。然而,分離的核酸分子可以在相關(guān)分子的文庫中找到(例如,對于改組而言,諸如美國專利號5,837,458、5,830,721、和5,811,238中所述)。最后,本文所述分離的核酸分子不包括編碼Dan、Cerberus、Gremlin、或SCGF(美國專利號5,780,263)的核酸分子。
本發(fā)明還提供了包含上文所述核酸分子的克隆載體以及包含與上文所述核酸分子之一可操作連接的啟動子(例如調(diào)控序列)的表達載體。合適啟動子的代表性實例包括組織特異性啟動子和基于病毒的啟動子(例如基于CMV的啟動子諸如CMV I-E、SV40早期啟動子、和MuLVLTR)。表達載體也可以基于或衍生自病毒(例如“病毒載體”)。病毒載體的代表性實例包括單純皰疹病毒載體、腺病毒載體、腺病毒伴隨病毒載體、和逆轉(zhuǎn)錄病毒載體。還提供了包含或含有任何上述載體的宿主細胞(包括例如人、猴、狗、大鼠、或小鼠起源的宿主細胞)。
本發(fā)明的其它方面提供了生成TGF-β結(jié)合蛋白的方法,包括如下步驟在一定條件下將上述包含載體的宿主細胞培養(yǎng)足夠時間以生成TGF-β結(jié)合蛋白。在其它實施方案中,可以進一步純化通過這種方法生成的蛋白質(zhì)(例如通過柱層析、親和純化、等等)。由此,基于本申請的公開內(nèi)容,可以容易的生成由上文所述核酸分子編碼的分離蛋白質(zhì)(例如SEQ ID NO2、4、6、8、10、12、14、或16)。
還應(yīng)當(dāng)注意,可以以融合蛋白的形式生成上述蛋白質(zhì)或其片段。例如,本發(fā)明的一個方面提供了含有第一多肽區(qū)段和第二多肽區(qū)段的融合蛋白,該第一多肽區(qū)段包含由上文所述核酸分子編碼的TGF-β結(jié)合蛋白或其長度為至少10、20、30、50、或100個氨基酸的部分,該第二多肽區(qū)段包含非TGF-β結(jié)合蛋白。在某些實施方案中,第二多肽可以是適于純化或識別的標簽(例如包含多個陰離子氨基酸殘基的多肽-參閱美國專利號4,851,341)、標記物(例如綠色熒光蛋白或堿性磷酸酶)或毒性分子(例如蓖麻毒素)。
本發(fā)明的另一個方面提供了能夠與上文所述TGF-β結(jié)合蛋白類別(例如人BEER)特異結(jié)合的抗體。在各種實施方案中,所述抗體可以是多克隆抗體或單克隆抗體(例如人或鼠起源的)。在其它實施方案中,該抗體是保留了完整抗體的結(jié)合特性的抗體片段(例如F(ab′)2、F(ab)2、Fab′、Fab、或Fv片段,或甚至是CDR)。還提供了能夠生成或表達上述抗體的雜交瘤和其它細胞。
本發(fā)明的相關(guān)方面提供了檢測TGF-β結(jié)合蛋白的方法,包括如下步驟在一定條件下將上文所述抗體保溫足夠時間以容許所述抗體與TGF-β結(jié)合蛋白結(jié)合,并檢測結(jié)合。在多種實施方案中,抗體可以結(jié)合于固相支持物上以便于清洗或分離,和/或是標記的(例如使用選自下組的標記物酶、熒光蛋白、和放射性同位素)。
本發(fā)明的其它方面提供了在高嚴謹條件下與依照SEQ ID NO1、3、5、7、9、11、13、15、17、或18或者其互補序列的核酸分子雜交的分離寡核苷酸。在另一些實施方案中,寡核苷酸可以存在于編碼SEQID NO2、4、6、8、10、12、14、或16的序列中。在某些實施方案中,寡核苷酸的長度是至少15、20、30、50、或100個核苷酸。在另一些實施方案中,寡核苷酸是用另一種分子(例如酶、熒光分子、或放射性同位素)標記的。還提供了能夠特異擴增編碼TGF-β結(jié)合蛋白的上文所述核酸分子的全部或部分的引物。在用于本文時,術(shù)語“特異擴增”應(yīng)當(dāng)理解為指擴增上述TGF-β結(jié)合蛋白而非其它TGF-β結(jié)合蛋白諸如Dan、Cerberus、Gremlin、或SCGF(美國專利號5,780,263)的引物。
本發(fā)明的相關(guān)方面提供了用于檢測編碼TGF-β結(jié)合蛋白的核酸分子的方法,包括如下步驟在高嚴謹條件下將上文所述寡核苷酸保溫,并檢測所述寡核苷酸的雜交。在某些實施方案中,寡核苷酸可以是標記的和/或結(jié)合于固相支持物上。
本發(fā)明的其它方面提供了能夠切割編碼上文所述TGF-β結(jié)合蛋白(例如SEQ ID NO2、6、8、10、12、14、或16)之一的RNA的核酶。這些核酶可以由DNA、RNA(包括2′-O-甲基核糖核酸)、核酸類似物(例如具有硫代磷酸酯鍵的核酸)或其混合物組成。還提供了編碼這些核酶的核酸分子(例如DNA或cDNA),以及能夠表達或生成核酶的載體。載體的代表性實例包括質(zhì)粒、逆轉(zhuǎn)座子、粘粒、和基于病毒的載體(例如至少部分由逆轉(zhuǎn)錄病毒、腺病毒、或腺伴隨病毒產(chǎn)生的病毒載體)。還提供了包含這些載體的宿主細胞(例如人、狗、大鼠、或小鼠細胞)。在某些實施方案中,宿主細胞可以是經(jīng)載體穩(wěn)定轉(zhuǎn)化的。
本發(fā)明的另一些方面提供了通過人工合成或是體外或體內(nèi)轉(zhuǎn)錄來生成核酶的方法。在另一些實施方案中,由此生成的核酶可以進一步純化和/或配制成藥物組合物(例如核酶或編碼核酶的核酸分子以及制藥學(xué)可接受載體或稀釋劑)。類似的,可以將本文所述反義寡核苷酸和抗體或是選擇的其它分子配制成藥物組合物。
本發(fā)明的其它方面提供了包含與依照SEQ ID NO1、3、5、7、9、11、13、或15或者其互補序列的核酸分子發(fā)生雜交的核酸分子的反義寡核苷酸,其中所述寡核苷酸抑制上文所述TGF-β結(jié)合蛋白(例如人BEER)的表達。在一些實施方案中,寡核苷酸的長度是15、20、25、30、35、40、或50個核苷酸。優(yōu)選的是,寡核苷酸的長度小于100、75、或60個核苷酸。應(yīng)當(dāng)顯而易見的是,寡核苷酸可以由一種或多種核酸類似物、核糖核酸、或脫氧核糖核酸組成。另外,寡核苷酸可以通過一種或多種鍵修飾,包括例如共價鍵,諸如硫代磷酸酯鍵、磷酸三酯鍵、膦酸甲酯鍵、亞甲基(甲基亞氨基)鍵、嗎啉基鍵、酰胺鍵、聚酰胺鍵、短鏈烷基糖間鍵、環(huán)烷基糖間鍵、短鏈雜原子糖間鍵、和雜環(huán)糖間鍵。美國專利號5,989,912提供了嵌合寡核苷酸的一個代表性實例。
本發(fā)明的另一個方面提供了用于增加骨礦化的方法,包括將有效量的上文所述核酶導(dǎo)入溫血動物。在相關(guān)方面,這些方法包括如下步驟在有助于核酸分子轉(zhuǎn)錄生成核酶的條件下,將有效量的上文所述能夠生成期望核酶的核酸分子或載體導(dǎo)入患者。
本發(fā)明的其它方面提供了轉(zhuǎn)基因非人動物。在一個實施方案中,提供了其生殖細胞和體細胞中含有編碼上文所述TGF-β結(jié)合蛋白的核酸分子的轉(zhuǎn)基因動物,所述核酸分子可操作連接了對被導(dǎo)入到該動物或處于胚胎階段的該動物祖先的基因表達有效的啟動子,條件是所述動物不包括人。在其它實施方案中,提供了轉(zhuǎn)基因敲除動物,包括其生殖細胞和體細胞在與編碼上文所述TGF-β結(jié)合蛋白的核酸分子發(fā)生雜交的內(nèi)源核酸分子的至少一個等位基因中包含破壞的動物,其中與不含該破壞的動物相比,所述破壞阻止由所述等位基因轉(zhuǎn)錄信使RNA,條件是所述動物不包括人。在各種實施方案中,所述破壞指核酸缺失、替代、或插入。在其它實施方案中,轉(zhuǎn)基因動物指小鼠、大鼠、綿羊、豬、或狗。
本發(fā)明的另一些方面提供了用于檢測TGF-β結(jié)合蛋白基因表達的試劑盒,包含裝有核酸分子的容器,其中所述核酸分子選自下組(a)包含SEQ ID NO1、3、5、7、9、11、13、15、100、或101的核苷酸序列的核酸分子;(b)包含(a)中核苷酸序列的互補序列的核酸分子;(c)作為(a)或(b)的片段、長度為至少15、20、30、50、75、或100個核苷酸的核酸分子。還提供了用于檢測TGF-β結(jié)合蛋白的試劑盒,其中包含裝有本文所述TGF-β結(jié)合蛋白抗體之一的容器。
例如,本發(fā)明的一個方面提供了用于測定選擇的分子是否能夠增加骨礦物質(zhì)含量的方法,包括下列步驟(a)將一種或多種候選分子與由依照權(quán)利要求1的核酸分子編碼的TGF-β結(jié)合蛋白和選定的TGF-β家族蛋白成員(例如BMP-5或6)混合;(b)測定候選分子是否改變TGF-β家族成員的信號傳導(dǎo),或是否改變TGF-β結(jié)合蛋白與TGF-β家族成員的結(jié)合。在某些實施方案中,所述分子可改變TGF-β作為間充質(zhì)細胞分化正調(diào)節(jié)物發(fā)揮功能的能力。在本發(fā)明的這個方面,候選分子可能通過例如減少(例如抑制)或增加(例如增強)信號傳導(dǎo)或結(jié)合而改變信號傳導(dǎo)或結(jié)合。
本發(fā)明的還有一個方面提供了用于測定選擇的分子是否能夠增加骨礦物質(zhì)含量的方法,包括如下步驟測定選擇的分子是否抑制TGF-β結(jié)合蛋白與骨或其類似物的結(jié)合。骨或其類似物的代表性實例包括羥磷灰石和通過活組織檢查得到的原代人骨樣品。
在上文所述方法的某些實施方案中,選擇的分子包含在分子混合物中,而且該方法還包括分離一種或多種在測定中有功能的分子的步驟。在還有一個實施方案中,將TGF-β家族的蛋白結(jié)合于固相支持物上并測量TGF-β結(jié)合蛋白的結(jié)合,或者將TGF-β結(jié)合蛋白結(jié)合于固相支持物上并測量TGF-β蛋白的結(jié)合。
利用諸如上文所述方法,可以對多種分子測定它們通過抑制TGF-β結(jié)合蛋白與TGF-β家族蛋白相結(jié)合來增加骨礦物質(zhì)含量的能力。這些分子的代表性實例包括蛋白質(zhì)或肽、有機分子、和核酸分子。
本發(fā)明的其它相關(guān)方面提供了用于在溫血動物中增加骨礦物質(zhì)含量的方法,包括如下步驟對溫血動物施用治療有效量的通過本文所述測定法鑒定的分子。本發(fā)明的另一個方面提供了用于在溫血動物中增加骨礦物質(zhì)含量的方法,包括如下步驟對溫血動物施用治療有效量的抑制TGF-β結(jié)合蛋白與包括骨形態(tài)發(fā)生蛋白(BMP)在內(nèi)的TGF-β超家族蛋白相結(jié)合的分子。合適分子的代表性實例包括反義分子、核酶、核酶基因、和特異識別TGF-β結(jié)合蛋白并改變其活性的抗體(例如人源化抗體)。
本發(fā)明的另一個方面提供了用于在溫血動物中增加骨礦物質(zhì)含量的方法,包括下列步驟(a)將指導(dǎo)如下分子表達的載體導(dǎo)入歸巢至骨的細胞,所述分子可抑制TGF-β結(jié)合蛋白與TGF-β家族蛋白和骨形態(tài)發(fā)生蛋白(BMP)相結(jié)合;并(b)對溫血動物施用含有該載體的細胞。在用于本文時,應(yīng)當(dāng)理解,若細胞在外周施用后定位于骨基質(zhì)內(nèi),則它們“歸巢至骨”。在一個實施方案中,這些方法還包括在導(dǎo)入步驟前由骨髓分離歸巢至骨的細胞。在另一個實施方案中,歸巢至骨的細胞選自CD34+細胞和成骨細胞。
本發(fā)明的其它方面提供了抑制TGF-β結(jié)合蛋白與TGF-β超家族蛋白相結(jié)合的(優(yōu)選分離的)分子。
在另一些實施方案中,可以以組合物的形式提供分子,而且還可以包括骨再吸收的抑制劑。這些抑制劑的代表性實例包括降鈣素、雌激素、二膦酸酯、具有抗再吸收活性的生長因子、和它莫西芬。
可以在上文所述治療性方案中使用的分子的代表性實例包括例如核酶、核酶基因、反義分子、和/或抗體(例如人源化抗體)。根據(jù)這些分子的選擇,它們可用于改變、拮抗、或刺激本文所述TGF-β結(jié)合蛋白家族成員的信號傳導(dǎo)或結(jié)合。
在本發(fā)明的多種實施方案中,上文所述分子以及治療或預(yù)防方法可用于諸如骨質(zhì)疏松、骨軟化、牙周病、壞血病、庫欣病、骨折等狀況以及由于四肢固定和使用類固醇引起的狀況。
本發(fā)明還提供了與TGF-β結(jié)合蛋白硬化素(SOST)特異結(jié)合的抗體,并提供了含有由硬化素(sclerostin)中與TGF-β超家族成員諸如骨形態(tài)發(fā)生蛋白相互作用的區(qū)域衍生的硬化素肽的免疫原。在一個實施方案中,本發(fā)明提供了與硬化素多肽特異結(jié)合的抗體或其抗原結(jié)合片段,所述硬化素多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述抗體競爭性抑制SOST多肽與(i)骨形態(tài)發(fā)生蛋白(BMP)I型受體結(jié)合位點和(ii)BMP II型受體結(jié)合位點中至少其一的結(jié)合,其中BMP I型受體結(jié)合位點能夠與包含GenBank編號NM_004329(SEQ ID NO102)、D89675(SEQ ID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ IDNO106)、D38082(SEQ ID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)、或AAB33865(SEQ ID NO110)所示氨基酸序列的BMP I型受體多肽結(jié)合,而且其中BMP II型受體結(jié)合位點能夠與包含GenBank編號U25110(SEQ ID NO111)、NM_033346(SEQ ID NO112)、Z48923(SEQ ID NO114)、CAA88759(SEQ ID NO115)、或NM_001204(SEQID NO113)所示氨基酸序列的BMP II型受體多肽結(jié)合。在另一個實施方案中,本發(fā)明提供了與硬化素多肽特異性結(jié)合并削弱硬化素均二聚體形成的抗體或其抗原結(jié)合片段,其中所述硬化素多肽包含SEQ IDNO2、6、8、14、46、或65所示氨基酸序列。
在本發(fā)明的某些特殊實施方案中,所述抗體是多克隆抗體。在其它實施方案中,所述抗體是單克隆抗體,例如小鼠、人、大鼠、或倉鼠單克隆抗體。本發(fā)明還提供了能夠生成該單克隆抗體的雜交瘤細胞或宿主細胞。在本發(fā)明的其它實施方案中,所述抗體是人源化抗體或嵌合抗體。本發(fā)明還提供了生成該人源化或嵌合抗體的宿主細胞。在某些實施方案中,所述抗體的抗原結(jié)合片段是F(ab′)2、Fab′、Fab、Fd或Fv片段。本發(fā)明還提供了作為單鏈抗體的抗體,并提供了能夠表達該單鏈抗體的宿主細胞。在另一個實施方案中,本發(fā)明提供了包含這些抗體和制藥學(xué)可接受載體的組合物。
在另一個實施方案中,本發(fā)明提供了包含SOST多肽中至少21個連續(xù)氨基酸且不超過50個連續(xù)氨基酸的肽的免疫原,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述肽能夠在非人動物中引發(fā)與該SOST多肽特異性結(jié)合并競爭性抑制SOST多肽與(i)骨形態(tài)發(fā)生蛋白(BMP)I型受體結(jié)合位點和(ii)BMP II型受體結(jié)合位點中至少其一的結(jié)合的抗體,其中BMP I型受體結(jié)合位點能夠與包含GenBank編號NM_004329(SEQ ID NO102)、D89675(SEQID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ ID NO106)、D38082(SEQ ID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)或AAB33865(SEQ ID NO110)所示氨基酸序列的BMP I型受體多肽結(jié)合,而且其中BMP II型受體結(jié)合位點能夠與包含GenBank編號U25110(SEQ IDNO111)、NM_033346(SEQ ID NO112)、Z48923(SEQ ID NO114)、CAA88759(SEQ ID NO115)或NM_001204(SEQ ID NO113)所示氨基酸序列的BMP II型受體多肽結(jié)合。本發(fā)明還提供了包含SOST多肽中至少21個連續(xù)氨基酸且不超過50個連續(xù)氨基酸的肽的免疫原,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述肽能夠在非人動物中引發(fā)與該SOST多肽特異結(jié)合并削弱硬化素均二聚體形成的抗體。
在某些特殊實施方案中,本發(fā)明的免疫原與載體分子相關(guān)聯(lián)。在某些實施方案中,載體分子是載體多肽,而且在特定實施方案中,載體多肽是匙孔_血藍蛋白。
本發(fā)明還提供了用于生成與SOST多肽特異結(jié)合的抗體的方法,包括用包含SOST多肽中至少21個連續(xù)氨基酸且不超過50個連續(xù)氨基酸的肽的免疫原免疫非人動物,其中(a)所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列;(b)所述抗體競爭性抑制SOST多肽與(i)骨形態(tài)發(fā)生蛋白(BMP)I型受體結(jié)合位點和(ii)BMP II型受體結(jié)合位點中至少其一結(jié)合;(c)BMP I型受體結(jié)合位點能夠與包含GenBank編號NM_004329(SEQ ID NO102)、D89675(SEQ ID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ ID NO106)、D38082(SEQ ID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)或AAB33865(SEQ IDNO110)所示氨基酸序列的BMP I型受體多肽結(jié)合;且(d)BMP II型受體結(jié)合位點能夠與包含GenBank編號U25110(SEQ ID NO111)、NM_033346(SEQ ID NO112)、Z48923(SEQ ID NO114)、CAA88759(SEQ ID NO115)或NM_001204(SEQ ID NO113)所示氨基酸序列的BMP II型受體多肽結(jié)合。
在另一個實施方案中,本發(fā)明提供了用于生成與SOST多肽特異結(jié)合的抗體的方法,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,該方法包括用包含SOST多肽中至少21個連續(xù)氨基酸且不超過50個連續(xù)氨基酸的肽的免疫原免疫非人動物,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述抗體削弱SOST均二聚體的形成。
在參考下文詳述和附圖后,本發(fā)明的這些和其它方面將變得清楚。另外,將包括本文所列的更加詳細描述某些流程或組合物(例如質(zhì)粒等)的各種參考文獻在內(nèi)的文件完整收錄作為參考。
附圖簡述
圖1是比較人Dan、人Gremlin、人Cerberus、和人Beer氨基酸序列的示意圖。箭頭指示半胱氨酸主鏈。
圖2概括了對多種人組織測量TGF-β結(jié)合蛋白基因、尤其是人Beer基因表達的結(jié)果。使用半定量逆轉(zhuǎn)錄-聚合酶鏈式反應(yīng)(RT-PCR)流程由自總RNA合成的第一鏈cDNA擴增該基因的一部分(實施例2A中有更詳細的描述)。
圖3A-3D概括了由小鼠胚胎切片的RNA原位雜交獲得的結(jié)果,其中使用與小鼠Beer轉(zhuǎn)錄本互補的cRNA探針(實施例2B中有更詳細的描述)。小圖3A是10.5dpc胚胎的橫切片。小圖3B是12.5dpc胚胎的縱切片。小圖3C和3D是15.5dpc胚胎的縱切片。
圖4A-4C通過western印跡分析例示了三種不同的多克隆抗體對它們各自抗原的特異性(實施例4中有更詳細的描述)。圖4A顯示了抗人Beer抗體對人Beer抗原有特異反應(yīng)性,對人Dan或人Gremlin卻沒有。圖4B顯示了抗人Gremlin抗體對人Gremlin抗原有反應(yīng)性,對人Beer或人Dan卻沒有。圖4C顯示了抗人Dan抗體對人Dan有反應(yīng)性,對人Beer或人Gremlin卻沒有。
圖5通過western印跡分析例示了TGF-β結(jié)合蛋白Beer對BMP-5和BMP-6而非BMP-4的選擇性(實施例5中有更詳細的描述)。
圖6證明了TGF-β結(jié)合蛋白Beer與BMP-5之間的離子相互作用的解離常數(shù)在15-30nM范圍內(nèi)。
圖7展示了SOST(硬化素)多肽及其最密切同源物中包含特征性胱氨酸結(jié)的區(qū)域的比對。形成胱氨酸結(jié)的三對二硫鍵以實線顯示。以虛線顯示的一對額外二硫鍵對這個家族而言是獨特的,它在3D結(jié)構(gòu)中連接兩個β發(fā)夾尖端。所述多肽是SOST硬化素(SEQ ID NO126);CGHB人絨毛膜促性腺激素β(SEQ ID NO127);FSHB促卵泡激素β亞基(SEQ ID NO128);TSHB促甲狀腺素β鏈前體(SEQ ID NO129);VWFVon Willebrand因子(SEQ ID NO130);MUC2人粘液素2前體(SEQ ID NO131);CER1Cerberus 1(Xenopus laevis同系物)(SEQ ID NO132);DRMgremlin(SEQ ID NO133);DAN(SEQ ID NO134);CTGF結(jié)締組織生長因子前體(SEQ ID NO135);NOVNovH(腎胚細胞瘤過度表達基因蛋白同系物)(SEQ ID NO136);CYR6(SEQ ID NO137)。
圖8例示了SOST核心區(qū)的3D模型(SOST_Core)。
圖9展示了SOST均二聚體的核心區(qū)的3D模型。
圖10A和10B提供了來自五種不同動物的頭蛋白氨基酸序列比對人(NOGG_HUMAN,SEQ ID NO138);雞(NOGG_CHICK,SEQ ID NO139);非洲爪蟾(NOGG_XENLA,SEQ ID NO140);NOGG_FUGRU,SEQID NO141;和斑馬魚(NOGG_ZEBRA,SEQ ID NO142);以及來自人(SOST_HUMAN,SEQ ID NO46)、大鼠(SOST_RAT,SEQ ID NO65)、和小鼠(SOST_Mouse,SEQ ID NO143)的SOST。
圖11例示了頭蛋白/BMP-7復(fù)合物結(jié)構(gòu)。BMP均二聚體以表面模式顯示在圖的底部。頭蛋白均二聚體以卡通模式顯示在BMP二聚體的頂部。圓圈描繪了N端結(jié)合區(qū)、核心區(qū)、和N端與核心區(qū)之間的接頭。
圖12描繪了位于SOST N端區(qū)的潛在BMP結(jié)合片段的3D模型。BMP二聚體以表面模式顯示,而潛在的BMP結(jié)合片段以棍模式顯示。指出了擬合到BMP表面上疏水口袋內(nèi)的苯丙氨酸殘基。
發(fā)明詳述定義在詳細闡述本發(fā)明前,先行闡明下文將用到的某些術(shù)語的定義、列出并定義縮寫可能有助于理解本發(fā)明。
“分子”應(yīng)當(dāng)理解為包括蛋白質(zhì)或肽(例如具有期望結(jié)合特性的抗體、重組結(jié)合伙伴、肽);核酸(例如DNA、RNA、嵌合核酸分子、和諸如PNA等核酸類似物);以及有機或無機化合物。
“TGF-β”應(yīng)當(dāng)理解為包括任何已知的或新的TGF-β超家族成員,它也包括骨形態(tài)發(fā)生蛋白(BMP)。
“TGF-β受體”應(yīng)當(dāng)理解為指對TGF-β超家族的特定成員(包括骨形態(tài)發(fā)生蛋白(BMP))特異的受體。
“TGF-β結(jié)合蛋白”應(yīng)當(dāng)理解為指具有針對TGF-β超家族特定成員或成員亞群(包括骨形態(tài)發(fā)生蛋白(BMP))的特異結(jié)合親和力的蛋白質(zhì)。TGF-β結(jié)合蛋白的具體實例包括由SEQ ID NO1、5、7、9、11、13、15、100、和101編碼的蛋白質(zhì)。
抑制“TGF-β結(jié)合蛋白與TGF-β家族蛋白和骨形態(tài)發(fā)生蛋白(BMP)結(jié)合”應(yīng)當(dāng)理解為指通過清除或阻止TGF-β與TGF-β結(jié)合蛋白結(jié)合,容許TGF-β或骨形態(tài)發(fā)生蛋白(BMP)的激活,或是容許包括骨形態(tài)發(fā)生蛋白(BMP)在內(nèi)的TGF-β家族成員與它們各自受體結(jié)合的分子。這種抑制可以通過例如抑制TGF-β結(jié)合蛋白與TGF-β超家族的特定成員相結(jié)合的分子來實現(xiàn)。
“載體”指能夠指導(dǎo)期望蛋白質(zhì)表達的裝配體。載體必需包含與目的基因可操作連接的轉(zhuǎn)錄啟動子元件。載體可以由脫氧核糖核酸(“DNA”)、核糖核酸(“RNA”)、或二者組合(例如DNA-RNA嵌合物)組成??蛇x的是,載體可以包含多聚腺苷酸化序列、一個或多個限制位點、以及一個或多個選擇標記,諸如新霉素磷酸轉(zhuǎn)移酶或潮霉素磷酸轉(zhuǎn)移酶。另外,根據(jù)選擇的宿主細胞和采用的載體,本文所述載體中還可以摻入了其它遺傳元件,諸如復(fù)制起點、額外的核酸限制位點、增強子、賦予轉(zhuǎn)錄以可誘導(dǎo)性的序列、和選擇標記。
“分離的核酸分子”指未整合到生物體的基因組DNA中的核酸分子。例如,已經(jīng)與真核細胞的基因組DNA分離開的編碼TGF-β結(jié)合蛋白的DNA分子就是分離的DNA分子。分離的核酸分子的另一個實例是未整合到生物體的基因組中的化學(xué)合成核酸分子。分離的核酸分子可以是基因組DNA、cDNA、RNA,或是至少部分由核酸類似物組成。
“分離的多肽”指本質(zhì)上不合在自然界中與該多肽相關(guān)聯(lián)的污染性細胞成分諸如碳水化合物、脂質(zhì)、或其它蛋白質(zhì)性雜質(zhì)的多肽。優(yōu)選的是,這些分離的多肽是至少大約90%純、更優(yōu)選至少大約95%純、最優(yōu)選至少大約99%純。在某些實施方案中,若特定蛋白質(zhì)制劑標稱在用考馬斯藍染色的SDS-PAGE凝膠上顯現(xiàn)單一條帶,則它包含分離的多肽。術(shù)語“分離的”在提及有機分子(例如有機小分子)時意味著根據(jù)本領(lǐng)域眾所周知的方法(例如NMR、熔點)的測定,該化合物超過90%純。
“硬化性骨化病”是Hansen(1967)(Hansen,H.G.,sklerosteose。Opitz,H.;Schmid,F(xiàn).,《Handbuch der Kinderheilkunde》,柏林,Springer出版社,61967,第351-355頁)用于命名在許多病例中與van Buchem彌漫性骨皮質(zhì)增生相似、但可能在骨變化的放射學(xué)表現(xiàn)和存在食指與中指的不對稱皮膚并指方面有所不同的疾病的術(shù)語。在這種狀況中,頜骨具有異常方正的外觀。
“人源化抗體”指其中單克隆抗體的鼠或其它非人動物互補決定區(qū)已經(jīng)由鼠或非人動物免疫球蛋白的重鏈和輕鏈可變區(qū)轉(zhuǎn)移至人可變區(qū)中的重組蛋白。
在用于本文時,“抗體片段”指抗體的一部分,諸如F(ab′)2、F(ab)2、Fab′、Fab等等。無論結(jié)構(gòu)如何,抗體片段都與完整抗體所識別的相同抗原結(jié)合。例如,抗TGF-β結(jié)合蛋白單克隆抗體片段與TGF-β結(jié)合蛋白的表位結(jié)合。
術(shù)語“抗體片段或抗原結(jié)合片段”還包括通過與特定抗原結(jié)合、形成復(fù)合物而像抗體那樣發(fā)揮作用的任何合成或基因工程化蛋白質(zhì)。例如,抗體片段包括由輕鏈可變區(qū)組成的分離片段、由重鏈和輕鏈可變區(qū)組成的“Fv”片段、其中輕鏈和重鏈可變區(qū)以肽接頭相連的重組單鏈多肽分子(“scFv蛋白”)、和由模擬高變區(qū)的氨基酸殘基組成的最小識別單位。
“可檢測標記物”指能夠與多肽部分諸如抗體部分或核酸部分綴合而產(chǎn)生可用于診斷的分子的分子或原子??蓹z測標記物的實例包括螯合劑、光敏劑、放射性同位素、熒光劑、順磁離子、酶、和其它標記物部分。
在用于本文時,“免疫綴合物”指包含抗TGF-β結(jié)合蛋白抗體或抗體片段以及可檢測標記物或效應(yīng)分子的分子。優(yōu)選的是,免疫綴合物在綴合后具有與綴合前大致相同或只是略微降低的與TGF-β結(jié)合蛋白相結(jié)合的能力。
縮寫TGF-β-“轉(zhuǎn)化生長因子-β”;TGF-βBP-“轉(zhuǎn)化生長因子-β結(jié)合蛋白”(一種代表性TGF-bBP命名為“H.Beer”);BMP-“骨形態(tài)發(fā)生蛋白”;PCR-“聚合酶鏈式反應(yīng)”;RT-PCR-其中首先使用逆轉(zhuǎn)錄酶(RT)將RNA轉(zhuǎn)錄成DNA的PCR程序;cDNA-通過將RNA序列復(fù)制成DNA形式而產(chǎn)生的任何DNA。
如上所述,本發(fā)明提供了TGF-β結(jié)合蛋白的新類別,以及用于在溫血動物中增加骨礦物質(zhì)含量的方法和組合物。簡而言之,本發(fā)明基于如下意外發(fā)現(xiàn)編碼TGF-β結(jié)合蛋白家族新成員的基因中的突變會導(dǎo)致特征為骨礦物質(zhì)含量比正常個體高1-4倍的罕見狀況(硬化性骨化病)。由此,正如下文將更為詳細的討論,這項發(fā)現(xiàn)導(dǎo)致了可用于選擇抑制TGF-β結(jié)合蛋白與TGF-β蛋白家族和骨形態(tài)發(fā)生蛋白(BMP)結(jié)合的分子的測定法以及利用這些分子來增加溫血動物(包括例如人)骨礦物質(zhì)含量的方法的開發(fā)。
稱為硬化性骨化病(sclerosteosis)的疾病的討論硬化性骨化病是人體中與異常骨礦物質(zhì)密度有關(guān)的疾病。硬化性骨化病是Hansen(1967)(Hansen,H.G.,Sklerosteose。Opitz,H.;Schmid,F(xiàn).,《Handbuch der Kinderheilkunde》,柏林,Springer出版社,61967,第351-355頁)用于命名在許多病例中與van Buchem彌漫性骨皮質(zhì)增多癥相似、但可能在骨變化的放射學(xué)表現(xiàn)和存在食指與中指的不對稱皮膚并指方面有所不同的疾病的術(shù)語。
現(xiàn)在知道硬化性骨化病是成年人中以廣泛散布的骨硬化損傷為特征的常染色體半顯性疾病。這種狀況是漸進的。硬化性骨化病還具有與并指(兩個或多個手指合并在一起)有關(guān)的發(fā)育狀態(tài)。硬化性骨化病綜合癥與身材高大有關(guān),許多患病個體的身高達到6英尺或更高。純合子的骨礦物質(zhì)含量可以比正常個體高1至6倍,而骨礦物質(zhì)密度可以比正常值(例如來自未患病的兄弟姐妹)高1至4倍。
硬化性骨化病綜合癥主要發(fā)生于荷蘭血統(tǒng)的南非白人。南非白人人群中每140個人有大約1人是突變型基因的攜帶者(雜合子)。突變顯示100%的外顯率。有雜合子中骨礦物質(zhì)密度增加而無相關(guān)病理(并指或頭骨過度生長)的有趣報道。
在硬化性骨化病患者中沒有觀察到垂體-下丘腦軸的異常。具體而言,看來不存在生長激素和皮質(zhì)素過度生成。另外,患病個體的性激素水平是正常的。然而,骨周轉(zhuǎn)標志物(成骨細胞特異性堿性磷酸酶、骨鈣蛋白、1型前膠原C′前肽(PICP)、和總堿性磷酸酶(參閱Comier,C.,Curr.Opin.Rheu.7243,1995))指示存在與疾病有關(guān)的過度成骨細胞活性,但是,根據(jù)骨再吸收標志物(吡啶啉、脫氧吡啶啉、N-端肽、尿液羥脯氨酸、血漿抗酒石酸酸性磷酸酶、和半乳糖基羥賴氨酸(參閱Comier,見上文))的測量,存在正常至略微降低的破骨細胞活性。
硬化性骨化病的特征是患病個體一生中全身骨骼內(nèi)骨的持續(xù)沉積。在純合子中,骨礦物質(zhì)的持續(xù)沉積導(dǎo)致缺乏機械刺激受體的骨骼部位(頭骨、頜骨、顱骨)過度生長。在患有硬化性骨化病的純合子中,頭骨的骨過度生長導(dǎo)致頭顱壓縮,最終由于對腦干的過度流體靜力壓而導(dǎo)致死亡。在骨骼的所有其它部分,存在普遍且彌散的硬化。長骨的皮層區(qū)域大大增厚,導(dǎo)致骨強度實質(zhì)性增加。小梁連接的厚度增加,繼而增加骨小梁的強度。硬化骨在x射線下顯示異常的不透明。
正如實施例1中更為詳細的描述,已經(jīng)將引起硬化性骨化病綜合癥的罕見基因突變定位于人17號染色體中編碼TGF-β結(jié)合蛋白家族(其代表性實例稱為“H.Beer”)新成員的區(qū)域。正如下文更為詳細的描述,根據(jù)這個發(fā)現(xiàn),骨礦化的機制得到更加充分的理解,從而能夠開發(fā)用于選擇增加骨礦化的分子的測定法,并且將這些分子用于增加骨礦物質(zhì)含量,并用于預(yù)防多種疾病。
TGF-β超家族轉(zhuǎn)化生長因子-β(TGF-β)超家族包括共享共同序列元件和結(jié)構(gòu)基元(在二級和三級兩種水平上)的多種生長因子。已知這個蛋白質(zhì)家族發(fā)揮影響多種細胞類型的廣譜生物學(xué)反應(yīng)。許多TGF-β家族成員在胚胎發(fā)育過程中在模式形成和組織特化中具有重要功能;在成年人中,TGF-β家族成員涉及例如傷口愈合、骨修復(fù)和骨重建、以及免疫系統(tǒng)的調(diào)控。除了TGF-β以外,該超家族還包括骨形態(tài)發(fā)生蛋白(BMP)、激活素、抑制素、生長和分化因子(GDF)、以及神經(jīng)膠質(zhì)衍生的神經(jīng)營養(yǎng)因子(GDNF)。初步分類是通過將特定蛋白質(zhì)歸入一般亞家族的一般序列特征而制定的。由于更小組成員之間更嚴格的序列保守性,有可能在亞家族內(nèi)進一步分層。在某些情況中,諸如BMP-5、BMP-6和BMP-7,更小組成員之間的氨基酸同一性可以高到75%。這個同一性水平使得一個代表性序列能夠說明亞組中將它與更大家族其它成員區(qū)分的關(guān)鍵生物化學(xué)元件。
已經(jīng)測定了TGF-β2的晶體結(jié)構(gòu)。TGF-β2單體的一般折疊包含通過三個二硫橋形成的穩(wěn)定的致密半胱氨酸結(jié)樣結(jié)構(gòu)。通過一個二硫橋穩(wěn)定化的二聚化是反向平行的。
TGF-β通過誘導(dǎo)I和II型受體的異型寡聚復(fù)合物的形成而進行信號傳導(dǎo)。TGF-β信號的轉(zhuǎn)導(dǎo)涉及跨膜絲氨酸/蘇氨酸激酶受體的這兩種不同的I型和II型亞家族。已經(jīng)鑒定了至少7種I型受體和5種II型受體(參閱Kawabata等,Cytokine Growth Factor Rev.949-61,1998;Miyazono等,Adv.Immunol.75115-57,2000)。TGF-β家族成員通過與具有絲氨酸/蘇氨酸激酶活性的受體結(jié)合來啟動它們的細胞作用。每個TGF-β家族成員與I型和II型受體的特征性組合相結(jié)合,二者都是信號傳導(dǎo)所需要的。在TGF-β受體激活的現(xiàn)行模型中,首先TGF-β配體與II型受體(TbR-II)結(jié)合,后者在細胞膜中以寡聚物形式與激活的激酶一起存在。此后,在缺乏TbR-II時不能與配體結(jié)合的I型受體(TbR-I)被募集到復(fù)合物中而形成配體/II型/I型三元復(fù)合物。然后,TbR-II主要在近膜區(qū)域中富含甘氨酸和絲氨酸殘基的結(jié)構(gòu)域(GS結(jié)構(gòu)域)內(nèi)磷酸化TbR-I,并由此激活TbR-I。然后,激活后的I型受體激酶磷酸化Smad蛋白家族的特定成員,后者轉(zhuǎn)位至細胞核,在那里它們將調(diào)控特定基因的轉(zhuǎn)錄。
骨形態(tài)發(fā)生蛋白(BMP)是決定人體骨礦物質(zhì)密度的關(guān)鍵調(diào)控蛋白對骨形成的認識方面的一項主要進展是骨形態(tài)發(fā)生蛋白(BMP)(也稱為生骨蛋白(OP))的鑒定,它在體內(nèi)調(diào)節(jié)軟骨和硬骨分化。BMP/OP通過一系列級聯(lián)事件誘導(dǎo)軟骨內(nèi)骨分化,包括軟骨形成、軟骨肥大和鈣化、血管入侵、成骨細胞分化、以及硬骨形成。如上所述,BMP/OP(BMP 2-14,以及生骨蛋白1和2即OP-1和OP-2)(參閱例如GenBankP12643(BMP-2)、GenBank P12645(BMP 3)、GenBank P55107(BMP-3b,生長/分化因子10(GDF-10))、GenBank P12644(BMP4)、GenBankP22003(BMP5)、GenBank P22004(BMP6)、GenBank P18075(BMP7)、GenBank P34820(BMP8)、GenBank Q9UK05(BMP9)、GenBank O95393(BM10)、GenBank O95390(BMP11,生長/分化因子11前體(GDF-11))、GenBank O95972(BM15))是TGF-β超家族的成員。BMP/OP亞家族成員之間驚人的進化保守性說明它們在動物的正常發(fā)育和功能方面至關(guān)重要。此外,多種形式BMP/OP的存在提出了關(guān)于這種明顯冗余的生物學(xué)相關(guān)性的重要問題。除了胎后軟骨發(fā)生和硬骨發(fā)生以外,BMP/OP在骨骼發(fā)生(包括顱面和牙齒組織的發(fā)育)中和在胚胎發(fā)育和包括腎在內(nèi)的實質(zhì)器官的器官發(fā)生中發(fā)揮多種作用?,F(xiàn)在認識到依賴改動共同(和少數(shù))分子機制以推動特化組織和器官出現(xiàn)的本質(zhì)。BMP/OP超家族是在調(diào)用高度保守羧基末端區(qū)域內(nèi)具有氨基酸基序微小變異的分子異構(gòu)體來編制多種特化功能時天性節(jié)約的精致實例。
BMP以大型前體蛋白的形式合成。二聚化后,BMP在細胞內(nèi)進行蛋白水解切割,產(chǎn)生羧基末端成熟蛋白,然后由細胞分泌出去。BMP像其它TGF-β家族成員一樣通過與I型和II型絲氨酸/蘇氨酸激酶受體二者協(xié)同結(jié)合來啟動信號轉(zhuǎn)導(dǎo)。可以以BMP作為配體的I型受體包括BMPR-IA(也稱為ALK-3)、BMPR-IB(也稱為ALK-6)、ALK-1、和ALK-2(也稱為ActR-I)。至于II型受體,BMP與BMP II型受體(BMPR-II)、II型激活素(ActR-II)、和IIB型激活素(ActR-IIB)結(jié)合。(參閱Balemans等,見上文,及其中引用的參考文獻)。GenBank數(shù)據(jù)庫中提供了BMP I型受體多肽的多核苷酸序列及所編碼的氨基酸序列,例如GenBank NM_004329(SEQ ID NO102,由SEQ ID NO116編碼)、D89675(SEQ ID NO103,由SEQ ID NO117編碼)、NM_001203(SEQID NO104,由SEQ ID NO118編碼)、S75359(SEQ ID NO105,由SEQ ID NO119編碼)、NM_030849(SEQ ID NO106,由SEQ ID NO120編碼)、和D38082(SEQ ID NO107,由SEQ ID NO121編碼)。GenBank數(shù)據(jù)庫中還提供了I型受體的其它多肽序列,例如NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)、和AAB33865(SEQID NO110)。GenBank數(shù)據(jù)庫中提供了BMP II型受體多肽的多核苷酸序列及所編碼的氨基酸序列,包括例如U25110(SEQ ID NO111,由SEQ ID NO122編碼)、NM_033346(SEQ ID NO112,由SEQ ID NO123編碼)、NM_001204(SEQ ID NO113,由SEQ ID NO124編碼)、和Z48923(SEQ ID NO114,由SEQ ID NO125編碼)。GenBank數(shù)據(jù)庫中還提供了II型受體的其它多肽序列,例如CAA88759(SEQ IDNO115)。
與其它胱氨酸結(jié)蛋白相似,BMP形成均二聚體結(jié)構(gòu)(Scheufler等,J.Mol.Biol.287103-15,1999)。根據(jù)對BMP/TGF-β家族進行的進化痕跡分析,BMP I型受體結(jié)合位點和II型受體結(jié)合位點定位于BMP結(jié)構(gòu)的表面(Innis等,Protein Eng.13839-47,2000)。I型受體結(jié)合位點在BMP上的定位后來通過BMP-2/BMP受體IA復(fù)合物的x射線結(jié)構(gòu)得到了確認(Nickel等,J.Joint Surg.Am.83A(增刊1(Pt1))S7-S14,2001)。預(yù)測的II型受體結(jié)合位點非常符合TGF-β3/TGF-βII型受體復(fù)合物的x射線結(jié)構(gòu)(Hart等,Nat.Struct.Biol.9203-208,2002),它與BMP/BMP受體IIA系統(tǒng)高度相似。
BMP拮抗作用BMP和激活素亞家族通過諸如TGF-β結(jié)合蛋白進行意義重大的翻譯后調(diào)控。存在精細的胞外控制系統(tǒng),由此合成并輸出高親和力的拮抗劑,隨后與BMP或激活素選擇性絡(luò)合而破壞它們的生物學(xué)活性(W.C.Smith,TIG 15(1)3-6,1999)。已經(jīng)鑒定了許多這樣的天然拮抗劑,而且根據(jù)序列差異,由于缺乏一級序列保守性,這些拮抗劑似乎已經(jīng)獨立進化。這些拮抗劑的早期研究凸現(xiàn)了與BMP-2和BMP-4相互作用并中和它的不同偏愛。在脊椎動物中,拮抗劑包括頭蛋白、chordin、chordin樣、卵泡抑素、FSRP、DAN/Cerberus蛋白家族和硬化素(SOST)(參閱Balemans等,見上文,及其引用的參考文獻)。拮抗或抑制作用的機制似乎對不同拮抗劑是不同的(Iemura等,Proc.Natl.Acad.Sci.USA 959337-9342,1998)。
BMP拮抗劑頭蛋白上的I型和II型受體結(jié)合位點也已定位。頭蛋白以高親和力與BMP結(jié)合(Zimmerman等,1996)。關(guān)于頭蛋白/BMP-7復(fù)合物結(jié)構(gòu)的一項研究揭示了這兩種蛋白質(zhì)之間的結(jié)合相互作用(Groppe等,Nature 420636-42,2002)。頭蛋白-BMP-7結(jié)構(gòu)在BMP信號傳導(dǎo)復(fù)合物模型上的疊加顯示,頭蛋白的結(jié)合有效地掩蔽了BMP-7上的兩對結(jié)合表位(即BMP I型和II型受體結(jié)合位點)。頭蛋白中富含半胱氨酸的支架序列的前面是稱為“夾子”的大約20個氨基酸殘基的N端區(qū)段(第28-48位殘基)。I型受體結(jié)合位點被頭蛋白夾子結(jié)構(gòu)域的N端部分占據(jù),而II型受體結(jié)合位點被該夾子結(jié)構(gòu)域的羧基末端部分占據(jù)。頭蛋白C端附近的核心區(qū)中兩條β鏈也與BMP-7在II型受體結(jié)合位點處接觸。這種結(jié)合模式使得頭蛋白二聚體能夠有效封閉BMP二聚體上的所有受體結(jié)合位點(兩個I型和兩個II型受體結(jié)合位點)。
新的TGF-β結(jié)合蛋白如上所述,本發(fā)明提供了與人DAN、人Gremlin和人Cerberus、以及SCGF(美國專利號5,780,263)相比具有幾乎相同的半胱氨酸(二硫化物)支架、但是在核苷酸水平幾乎沒有同源性的TGF-β結(jié)合蛋白新種類(背景資料通常參閱Hsu,D.R.,Economides,A.N.,Wang,X.,Eimon,P.M.,Harland,R.M.,“非洲爪蟾背化因子Gremlin鑒定為拮抗BMP活性的分泌型蛋白新家族”(The Xenopus Dorsalizing FactorGremlin Identifies a Novel Family of Secreted Proteins thatAntagonize BMP Activities),Molecular Cell1673-683,1998)。
編碼TGF-β結(jié)合蛋白的核酸分子新種類的代表性實例公開于SEQID NO1、5、7、9、11、13、15、100、和101。本文公開的多核苷酸編碼稱為Beer的多肽,在本文中也稱為硬化素或SOST。這類結(jié)合蛋白的代表性成員也應(yīng)當(dāng)理解為包括TGF-β結(jié)合蛋白的變體(例如SEQ ID NO5和7)。在用于本文時,“TGF-β結(jié)合蛋白變體基因”(例如編碼TGF-β結(jié)合蛋白變體的分離的核酸分子)指編碼具有屬SEQ ID NO2、10、12、14、16、46、或65修飾形式的氨基酸序列的多肽的核酸分子。這些變體包括TGF-β結(jié)合蛋白基因的天然存在的多態(tài)性或等位基因變體,以及包含這些氨基酸序列的保守氨基酸替代的合成基因。本領(lǐng)域技術(shù)人員知道有多種標準可指示肽或多肽中特定位置的氨基酸是否相似。例如,相似氨基酸或保守氨基酸替代即氨基酸殘基被具有相似側(cè)鏈的氨基酸殘基取代,包括具有堿性側(cè)鏈(例如賴氨酸、精氨酸、組氨酸)、酸性側(cè)鏈(例如天冬氨酸、谷氨酸)、不帶電荷的極性側(cè)鏈(例如甘氨酸、天冬酰胺、谷氨酰胺、絲氨酸、蘇氨酸、酪氨酸、半胱氨酸、組氨酸)、非極性側(cè)鏈(例如丙氨酸、纈氨酸、亮氨酸、異亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β分支側(cè)鏈(例如蘇氨酸、纈氨酸、異亮氨酸)、和芳香族側(cè)鏈(例如酪氨酸、苯丙氨酸、色氨酸)的氨基酸。被認為更難分類的脯氨酸與具有脂肪族側(cè)鏈的氨基酸(例如Leu、Val、Ile、和Ala)具有相同性質(zhì)。在某些情況中,用谷氨酰胺替代谷氨酸或是用天冬酰胺替代天冬氨酸被認為是相似替代,因為谷氨酰胺和天冬酰胺分別是谷氨酸和天冬氨酸的酰胺衍生物。
TGF-β結(jié)合蛋白基因的其它變體形式是包含本文所述核苷酸序列的插入或缺失的核酸分子??梢酝ㄟ^測定基因是否與具有核苷酸序列SEQ ID NO1、5、7、9、11、13、15、100、或101的核酸分子在嚴謹條件下發(fā)生雜交來鑒定TGF-β結(jié)合蛋白變體基因。另外,TGF-β結(jié)合蛋白變體基因應(yīng)當(dāng)編碼具有半胱氨酸主鏈的蛋白質(zhì)。
或者,可以通過序列比較來鑒定TGF-β結(jié)合蛋白變體基因。在用于本文時,若兩種氨基酸序列的氨基酸殘基在進行比對以尋求最大對應(yīng)性時相同,則這兩種氨基酸序列具有“100%氨基酸序列同一性”。類似的,若兩種核苷酸序列的核苷酸殘基在進行比對以尋求最大對應(yīng)性時相同,則這兩種核苷酸序列具有“100%核苷酸序列同一性”。序列比較可以使用標準軟件程序來進行,諸如由DNASTAR(麥迪遜,威斯康星)生產(chǎn)的LASERGENE生物信息學(xué)計算套裝中包含的程序。本領(lǐng)域技術(shù)人員眾所周知通過測定最佳比對來比較兩種核苷酸或氨基酸序列的其它方法(參閱例如Peruski和Peruski,《因特網(wǎng)和新生物學(xué)基因組和分子研究的工具》(The Internet and the New BiologyTools for Genomic and Molecular Research),ASM出版公司,1997年;Wu等編,“核酸和蛋白質(zhì)的信息超級高速公路和計算機數(shù)據(jù)庫”(Information Superhighway and Computer Databases of NucleicAcids and Proteins),《基因生物技術(shù)方法》(Methods in GeneBiotechnology),第123-151頁,CRC出版公司,1997年;和Bishop編,《人類基因組計算指南》(Guide to Human Genome Computing),第2版,Academic出版公司,1998年)。
TGF-β結(jié)合蛋白變體應(yīng)當(dāng)與SEQ ID NO2、6、10、12、14、16、46、或65具有至少50%、優(yōu)選超過60%、65%、70%、75%、80%、85%、90%、或95%的氨基酸序列同一性。或者,可以通過與SEQ ID NO1、5、9、11、13、15、100、或101具有至少70%的核苷酸序列同一性來鑒定TGF-β結(jié)合蛋白變體。此外,本發(fā)明涵蓋與SEQ ID NO1或SEQID NO100具有超過75%、80%、85%、90%、或95%同一性的TGF-β結(jié)合蛋白基因變體。不管用于鑒定TGF-β結(jié)合蛋白變體基因或TGF-β結(jié)合蛋白變體的具體方法如何,TGF-β結(jié)合蛋白變體或由TGF-β結(jié)合蛋白變體基因編碼的多肽可以在功能上由例如它與TGF-β蛋白家族選定成員結(jié)合和/或抑制其信號傳導(dǎo)的能力或者它與抗TGF-β結(jié)合蛋白抗體特異結(jié)合的能力來表征。
本發(fā)明包括TGF-β結(jié)合蛋白基因的功能片段。在本發(fā)明的內(nèi)容中,TGF-β結(jié)合蛋白基因的“功能片段”指編碼或是(1)具有上文所述功能活性或是(2)與抗TGF-β結(jié)合蛋白抗體特異結(jié)合的TGF-β結(jié)合蛋白多肽一部分的核酸分子。例如,本文所述TGF-β結(jié)合蛋白基因的功能片段包括核苷酸序列SEQ ID NO1、5、9、11、13、15、100、或101的一部分。
2.TGF-β結(jié)合蛋白基因的分離編碼TGF-β結(jié)合蛋白的DNA分子可以通過使用基于例如SEQ IDNO1的多核苷酸探針篩選人類cDNA或基因組文庫獲得。例如,制備cDNA文庫的第一步是使用本領(lǐng)域技術(shù)人員眾所周知的方法分離RNA。一般而言,RNA分離技術(shù)包括破碎細胞的方法,抑制由RNA酶指導(dǎo)的RNA降解的方法,以及由DNA、蛋白質(zhì)、和多糖污染物分離RNA的方法。例如,可以如下分離總RNA將組織在液氮中凍結(jié),用臼和杵將凍結(jié)的組織磨碎以裂解細胞,用酚/氯仿溶液抽提磨碎的組織以除去蛋白質(zhì),并通過用氯化鋰進行的選擇性沉淀由剩余污染物分離RNA(參閱例如Ausubel等編,《分子生物學(xué)簡略方案》(Short Protocols inMolecular Biology),第3版,第4-1至4-6頁,John Wiley & Sons,1995年[“Ausubel,1995”];Wu等,《基因生物技術(shù)方法》(Methodsin Gene Biotechnology),第33-41頁,CRC出版公司,1997年[“Wu,1997”])?;蛘?,可以如下分離總RNA用異硫氰酸胍抽提磨碎的組織,用有機溶劑抽提,并使用差速離心由污染物分離RNA(參閱例如Ausubel,1995,第4-1至4-6頁;Wu,1997,第33-41頁)。
為了構(gòu)建cDNA文庫,優(yōu)選由總RNA制劑分離poly(A)+RNA。可以使用oligo(dT)-纖維素層析的標準技術(shù)由總RNA分離Poly(A)+RNA(參閱例如Ausubel,1995,第4-11至4-12頁)??梢允褂帽绢I(lǐng)域眾所周知的技術(shù)由poly(A)+RNA合成雙鏈cDNA分子(參閱例如Wu,1997,第41-46頁)。此外,可以使用商品化試劑盒來合成雙鏈cDNA分子(例如Life Technologies公司,蓋瑟斯堡,馬里蘭;CLONTECHLaboratories公司,帕洛阿爾托,加利福尼亞;Promega公司,麥迪遜,成斯康星;和Stratagene Cloning Systems,拉霍亞,加利福尼亞)。
可以修改用于獲得TGF-β結(jié)合蛋白cDNA克隆的基本方法,構(gòu)建富含TGF結(jié)合蛋白特異性cDNA分子的扣除后cDNA文庫。用于構(gòu)建扣除文庫的技術(shù)對于本領(lǐng)域技術(shù)人員而言是眾所周知的(參閱例如Sargent,“差異表達基因的分離”(Isolation of DifferentiallyExpressed Genes),Meth.Enzymol.152423,1987;和Wu等編,“扣除和完整cDNA文庫的構(gòu)建和篩選”(Construction and Screeningof Subtracted and Complete Expression cDNA Libraries),《基因生物技術(shù)方法》(Methods in Gene Biotechnology),第29-65頁,CRC出版公司,1997年)。
多種克隆載體適于構(gòu)建cDNA文庫。例如,可以在衍生自噬菌體的載體中構(gòu)建cDNA文庫,諸如λgt10載體(參閱例如Huynh等,“在λgt10 and λgt11中構(gòu)建和篩選cDNA文庫”(Constructing andScreening cDNA Libraries in λgt10 and λgt11),《DNA克隆實用方法》(DNA CloningA Practical Approach),第1卷,Glover編,第49頁,IRL出版社,1985年;Wu,1997,第47-52頁)。或者,可以將雙鏈cDNA分子插入質(zhì)粒載體,諸如pBluescript載體(Stratagene Cloning Systems,拉霍亞,加利福尼亞)、LambdaGEM-4(Promega公司,麥迪遜,威斯康星)、或其它商品化載體。還可以由美國典型培養(yǎng)物收藏中心(羅克維爾,馬里蘭)獲得合適的克隆載體。
為了擴增克隆的cDNA分子,使用標準技術(shù)將cDNA文庫導(dǎo)入原核宿主。例如,可以將cDNA文庫導(dǎo)入可以由Life Technologies公司(蓋瑟斯堡,馬里蘭)獲得的感受態(tài)大腸桿菌DH5細胞。
可以通過本領(lǐng)域眾所周知的方法構(gòu)建人類基因組DNA文庫(參閱例如Ausubel,1995,第5-1至5-6頁;Wu,1997,第307-327頁)??梢匀缦路蛛x基因組DNA用去污劑Sarkosyl裂解組織,用蛋白酶K消化裂解物,通過離心由裂解物中清除不溶碎片,使用異丙醇由裂解物沉淀核酸,并在氯化銫密度梯度上純化重懸的DNA。
可以通過隨機剪切基因組DNA或是通過用限制性核酸內(nèi)切酶部分消化基因組DNA來獲得適于構(gòu)建基因組文庫的DNA片段??梢砸勒粘R?guī)技術(shù)將基因組DNA片段插入諸如噬菌體或粘粒等載體,諸如使用限制酶消化來提供合適末端,使用堿性磷酸酶處理來避免不合乎要求的DNA分子連接,并用合適連接酶進行連接。用于這些操作的技術(shù)在本領(lǐng)域是眾所周知的(參閱例如Ausubel,1995,第5-1至5-6頁;Wu,1997,第307-327頁)。
還可以通過聚合酶鏈式反應(yīng)(PCR)用具有基于本文所述人TGF-β結(jié)合蛋白基因核苷酸序列的核苷酸序列的寡核苷酸引物獲得編碼TGF-β結(jié)合蛋白的核酸分子。例如《分子生物學(xué)方法第15卷PCR方案通用方法和應(yīng)用》(Methods in Molecular Biology,Vol.15PCRProtocolsCurrent Methods and Applications)(White編,第211-215頁,Humana出版公司,1993年)中Yu等,“使用聚合酶鏈式反應(yīng)來篩選噬菌體文庫”(Use of the Polymerase Chain Reactionto Screen Phage Libraries)一文提供了用PCR篩選文庫的常規(guī)方法。此外,例如《分子生物學(xué)方法,第15卷,PCR方案通用方法和應(yīng)用》(Methods in Molecular Biology,Vol.15PCR ProtocolsCurrent Methods and Applications)(White編,第317-337頁,Humana出版公司,1993年)中Preston,“使用簡并寡核苷酸引物和聚合酶鏈式反應(yīng)來克隆基因家族成員”(Use of DegenerateOligonucleotide Primers and the Polymerase Chain Reaction toClone Gene Family Members)一文描述了使用PCR分離相關(guān)基因的技術(shù)。
或者,可以由商業(yè)來源獲得人基因組文庫,諸如ResearchGenetics(亨茨維爾,阿拉巴馬)和美國典型培養(yǎng)物保藏中心(羅克維爾,馬里蘭)??梢允褂帽疚乃龊捅绢I(lǐng)域知道的標準方法,用一種或多種基于SEQ ID NO1的多核苷酸探針篩選含有cDNA或基因組克隆的文庫(參閱例如Ausubel,1995,第6-1至6-11頁)。
如本文所述生成的抗TGF-β結(jié)合蛋白抗體也可用于由cDNA文庫分離編碼TGF-β結(jié)合蛋白的DNA序列。例如,可以用抗體篩選λgt11表達文庫,或者可以在雜合體選擇和翻譯后用抗體免疫篩選(參閱例如Ausubel,1995,第6-12至6-16頁;Margolis等,“用抗體和蛋白質(zhì)探針篩選λ表達文庫”(Screening λ expression libraries withantibody and protein probes),《DNA克隆2表達系統(tǒng)》(DNA Cloning2Expression Systems),第2版,Glover等編,第1-14頁,牛津大學(xué)出版社,1995年)。
可以使用標準方法測定TGF-β結(jié)合蛋白cDNA或TGF-β結(jié)合蛋白基因組片段的序列。此外,可以使用已充分確立的技術(shù)諸如缺失分析(通常參閱Ausubel,1995,見上文)來完成包含TGF-β結(jié)合蛋白啟動子或調(diào)控元件的基因組片段的鑒定。
或者,可以通過使用共同引發(fā)的長寡核苷酸和本文所述核苷酸序列合成DNA分子來獲得TGF-β結(jié)合蛋白基因(參閱例如Ausubel,1995,第8-8至8-9頁)。已確立的使用聚合酶鏈式反應(yīng)的技術(shù)提供了合成長度為至少2kb的DNA分子的能力(Adang等,Plant Mol.Biol.211131,1993;Bambot等,PCR Methods and Applications 2266,1993;Dillon等,“使用聚合酶鏈式反應(yīng)來快速構(gòu)建合成基因”(Useof the Polymerase Chain Reaction for the Rapid Construction ofSynthetic Genes),《分子生物學(xué)方法第15卷PCR方案通用方法和應(yīng)用》(Methods in Molecular Biology),Vol.15PCR ProtocolsCurrent Methods and Applications,White編,第263-268頁,Humana出版公司,1993年;Holowachuk等,PCR Methods Appl.4299,1995)。
3.TGF-β結(jié)合蛋白基因的生成可以使用本文所述流程,通過用具有基于SEQ ID NO1、5、9、11、13、15、100、或101的核苷酸序列的多核苷酸探針篩選各種cDNA或基因組文庫來獲得編碼TGF-β結(jié)合蛋白基因變體的核酸分子。還可以通過人工合成來構(gòu)建TGF-β結(jié)合蛋白基因變體。例如,可以設(shè)計這樣的核酸分子,其編碼與SEQ ID NO2、6、8、10、12、14、16、46、或65的氨基酸序列相比具有保守氨基酸變化的多肽。換言之,可以獲得這樣的變體,其包含SEQ ID NO2、6、8、10、12、14、16、46、或65中的一個或多個氨基酸替代,其中用烷基氨基酸替代TGF-β結(jié)合蛋白氨基酸序列中的烷基氨基酸、用芳香族氨基酸替代TGF-β結(jié)合蛋白氨基酸序列中的芳香族氨基酸、用含硫氨基酸替代TGF-β結(jié)合蛋白氨基酸序列中的含硫氨基酸、用含羥基的氨基酸替代TGF-β結(jié)合蛋白氨基酸序列中的含羥基氨基酸、用酸性氨基酸替代TGF-β結(jié)合蛋白氨基酸序列中的酸性氨基酸、用堿性氨基酸替代TGF-β結(jié)合蛋白氨基酸序列中的堿性氨基酸、或用二元單羧基氨基酸替代TGF-β結(jié)合蛋白氨基酸序列中的二元單羧基氨基酸。例如,在常見氨基酸中,“保守氨基酸替代”解釋為屬于下列同一分組的氨基酸之間的替代(1)甘氨酸、丙氨酸、纈氨酸、亮氨酸、和異亮氨酸;(2)苯丙氨酸、酪氨酸、和色氨酸;(3)絲氨酸和蘇氨酸;(4)天冬氨酸和谷氨酸;(5)谷氨酰胺和天冬酰胺;以及(6)賴氨酸、精氨酸、和組氨酸。在進行這些替代時,如果有可能的話,重要的是要維持圖1中描繪的半胱氨酸主鏈。
可以通過用核苷酸取代SEQ ID NO1、5、9、11、13、15、100、或101中所述的核苷酸而在TGF-β結(jié)合蛋白基因中導(dǎo)入保守氨基酸變化??梢酝ㄟ^例如寡核苷酸介導(dǎo)的誘變、接頭掃描誘變、使用聚合酶鏈式反應(yīng)的誘變、諸如此類來獲得這些“保守氨基酸”變體(參閱Ausubel,1995,第8-10至8-22頁;McPherson編,《定向誘變實用方法》(Directed MutagenesisA Practical Approach),IRL出版社,1991年)??梢允褂脴藴史椒y定這些變體的功能活性,諸如本文所述測定法?;蛘?,可以通過與抗TGF-β結(jié)合蛋白抗體特異結(jié)合的能力來鑒定TGF-β結(jié)合蛋白多肽變體。
可以進行核酸分子的常規(guī)缺失分析,以獲得編碼TGF-β結(jié)合蛋白多肽的核酸分子的“功能片段”。例如,可以用Bal31核酸酶消化具有核苷酸序列SEQ ID NO1的DNA分子以獲得一系列嵌套缺失體。然后將片段以正確讀碼框插入表達載體,分離表達的多肽,并測試其活性或與抗TGF-β結(jié)合蛋白抗體結(jié)合的能力。核酸外切酶消化的替代方法是使用寡核苷酸介導(dǎo)的誘變,以導(dǎo)入缺失或終止密碼子以確定產(chǎn)生期望片段?;蛘?,可以使用聚合酶鏈式反應(yīng)合成TGF-β結(jié)合蛋白基因的特定片段。
例如Treuter等,Mol.Gen.Genet.240113,1993;Content等,“由人干擾素誘導(dǎo)的42kDa 2-5A合成酶的表達和初步缺失分析”(Expression and preliminary deletion analysis of the 42kDa2-5A synthetase induced by human interferon),《生物學(xué)干擾素系統(tǒng),ISIR-TNO干擾素系統(tǒng)會議錄》(Biological InterferonSystems,Proceedings of ISIR-TNO Meeting on InterferonSystems),Cantell編,第65-72頁,Nijhoff,1987;Herschman,“EGF受體”(The EGF Receptor),《動物細胞增殖的控制》(Controlof Animal Cell Proliferation),第1卷,Boynton等編,第169-199頁,Academic出版社,1985年;Coumailleau等,J.Biol.Chem.27029270,1995;Fukunaga等,J.Biol.Chem.27025291,1995;Yamaguchi等,Biochem.Pharmacol.501295,1995;Meisel等,Plant Mol.Biol.301,1996描述了用于蛋白質(zhì)功能分析的標準技術(shù)。
本發(fā)明還涵蓋具有保守氨基酸變化的TGF-β結(jié)合蛋白基因功能片段。
通過測定與上文所述SEQ ID NO1、5、9、11、13、15、100、或101以及SEQ ID NO2、6、10、12、14、16、46、或65核苷酸和氨基酸序列的同一性水平,可以根據(jù)結(jié)構(gòu)來鑒定TGF-β結(jié)合蛋白變體基因。根據(jù)結(jié)構(gòu)來鑒定基因變體的候選方法是測定編碼潛在TGF-β結(jié)合蛋白基因變體的核酸分子是否能夠與具有SEQ ID NO1、5、9、11、13、15、100、或101的核苷酸序列或者其長度為至少15或20個核苷酸的部分的核酸分子在嚴謹條件下發(fā)生雜交。作為嚴謹雜交條件的實例,具有TGF-β結(jié)合蛋白序列變體的核酸分子能夠與具有來自SEQ IDNO1的序列的核酸分子的片段在含有例如5×SSPE(1×SSPE=180mM氯化鈉、10mM磷酸鈉、1mM EDTA(pH7.7)、5×Denhardt氏溶液(100×Denhardt氏溶液=2%(w/v)牛血清清蛋白、2%(w/v)菲科爾、2%(w/v)聚乙烯吡咯烷酮)和0.5%SDS的緩沖液中于55-60℃保溫過夜后相結(jié)合。高嚴謹度的雜交后清洗通常在0.5×SSC(1×SSC=150mM氯化鈉、15mM檸檬酸三鈉)中或在0.5×SSPE中于55-60℃進行。
不管TGF-β結(jié)合蛋白基因變體的具體核苷酸序列如何,該基因編碼可通過其功能活性或是它與抗TGF-β結(jié)合蛋白抗體特異結(jié)合的能力來表征的多肽。更具體的說,TGF-β結(jié)合蛋白基因變體編碼展示由本文所述人TGF-β結(jié)合蛋白基因編碼的多肽的至少50%、優(yōu)選超過60%、70%、80%、或90%活性的多肽。
4.TGF-β結(jié)合蛋白在培養(yǎng)細胞中的生成為了表達TGF-β結(jié)合蛋白基因,必須將編碼該多肽的核酸分子在表達載體中與控制轉(zhuǎn)錄表達的調(diào)控序列可操作連接,然后導(dǎo)入宿主細胞。除了轉(zhuǎn)錄調(diào)控序列諸如啟動子和增強子以外,表達載體還可以包含翻譯調(diào)控序列和適于選擇攜帶表達載體的細胞的標記基因。適于在真核細胞中生成外源蛋白的表達載體通常包含(1)編碼細菌復(fù)制起點和抗生素抗性標記的原核DNA元件,從而提供表達載體在細菌宿主中的生長和選擇;(2)控制轉(zhuǎn)錄起始的真核DNA元件,諸如啟動子;和(3)控制轉(zhuǎn)錄本加工的DNA元件,諸如轉(zhuǎn)錄終止/多聚腺苷酸化序列。
優(yōu)選在哺乳動物細胞中表達本發(fā)明的TGF-β結(jié)合蛋白。哺乳動物宿主細胞的實例包括非洲綠猴腎細胞(Vero;ATCC CRL 1587)、人胚胎腎細胞(293-HEK;ATCC CRL 1573)、幼倉鼠腎細胞(BHK-21;ATCCCRL 8544)、犬腎細胞(MDCK;ATCC CCL 34)、中國倉鼠卵巢細胞(CHO-K1;ATCC CCL61)、大鼠垂體細胞(GH1;ATCC CCL82)、HeLa S3細胞(ATCCCCL2.2)、大鼠肝癌細胞(H-4-II-E;ATCC CRL 1548)、SV40轉(zhuǎn)化的猴腎細胞(COS-1;ATCC CRL 1650)、和鼠胚胎細胞(NIH-3T3;ATCCCRL 1658)。
對于哺乳動物宿主而言,轉(zhuǎn)錄和翻譯調(diào)控信號可以衍生自病毒來源,諸如腺病毒、牛乳頭瘤病毒、猿猴病毒、諸如此類,其中調(diào)控信號與具有高表達水平的特定基因相關(guān)聯(lián)。合適的轉(zhuǎn)錄和翻譯調(diào)控序列還可以由哺乳動物基因獲得,諸如肌動蛋白、膠原蛋白、肌球蛋白和金屬硫蛋白基因。
轉(zhuǎn)錄調(diào)控序列包括足以指導(dǎo)RNA合成起始的啟動子區(qū)。合適的真核啟動子包括小鼠金屬硫蛋白I基因的啟動子(Hamer等,J.Mol.Appl.Genet.1273,1982)、皰疹病毒的TK啟動子(McKnight,Cell31355,1982)、SV40早期啟動子(Benoist等,Nature 290304,1981)、勞氏肉瘤病毒啟動子(Gorman等,Proc.Natl.Acad.Sci.USA 796777,1982)、巨細胞病毒啟動子(Foecking等,Gene 45101,1980)、和小鼠乳癌病毒啟動子(通常參閱Etcheverry,“基因工程蛋白質(zhì)在哺乳動物細胞培養(yǎng)物中的表達”(Expression of Engineered Proteinsin Mammalian Cell Culture),《蛋白質(zhì)工程原理和實踐》(ProteinEngineeringPrinciples and Practice),Cleland等編,第163-181頁,John Wiley & Sons公司,1996年)。
或者,如果原核啟動子受到真核啟動子的調(diào)控的話,可以使用原核啟動子諸如T3噬菌體RNA聚合酶啟動子來控制TGF-β結(jié)合蛋白基因在哺乳動物細胞中的表達(Zhou等,Mol.Cell.Biol.104529,1990;Kaufman等,Nucleic Acids Res.194485,1991)。
也可以在細菌、酵母、昆蟲、或植物細胞中表達TGF-β結(jié)合蛋白基因??捎糜谠谠怂拗髦斜磉_TGF-β結(jié)合蛋白多肽的合適啟動子對于本領(lǐng)域技術(shù)人員而言是眾所周知的,包括能夠識別T4、T3、Sp6、和T7聚合酶的啟動子、λ噬菌體的PR和PL啟動子、大腸桿菌的trp、recA、熱休克、lacUV5、tac、lpp-lacSpr、phoA、和lacZ啟動子、枯草芽孢桿菌的啟動子、芽孢桿菌噬菌體的啟動子、鏈霉菌的啟動子、λ噬菌體的int啟動子、pBR322的bla啟動子、和氯霉素乙?;D(zhuǎn)移酶基因的CAT啟動子。原核啟動子的綜述見Glick,J.Ind.Microbiol.1277,1987,Watson等,《基因的分子生物學(xué)》(Molecular Biologyof the Gene),第4版,Benjamin Cummins,1987年;和Ausubel等,1995。
優(yōu)選的原核宿主包括大腸桿菌和枯草芽孢桿菌。合適的大腸桿菌菌株包括BL21(DE3)、BL21(DE3)pLysS、BL21(DE3)pLysE、DH1、DH4I、DH5、DH5I、DH5IF′、DH5IMCR、DH10B、DH10B/p3、DH11S、C600、HB101、JM101、JM105、JM109、JM110、K38、RR1、Y1088、Y1089、CSH18、ER1451、和ER1647(參閱例如Brown編,《Molecular Biology Labfax》,Academic出版社,1991年)。枯草芽孢桿菌的合適菌株包括BR151、YB886、MI119、MI120、和B170(參閱例如Hardy,“芽孢桿菌克隆方法”(Bacillus Cloning Methods),《DNA克隆實用方法》(DNACloningA Practical Approach),Glover編,IRL出版社,1985年)。
用于在原核宿主中表達蛋白質(zhì)的方法對于本領(lǐng)域技術(shù)人員而言是眾所周知的(參閱例如Williams等,“使用質(zhì)粒載體在大腸桿菌中表達外源蛋白并純化特異多克隆抗體”(Expression of foreignproteins in E.coli using plasmid vectors and purification ofspecific polyclonal antibodies),《DNA克隆2表達系統(tǒng)》(DNACloning 2Expression Systems),第2版,Glover等編,第15頁,牛津大學(xué)出版社,1995年;Ward等,“抗體的基因操作和表達”(Genetic Manipulation and Expression of Antibodies),《單克隆抗體原理和應(yīng)用》(Monoclonal AntibodiesPrinciples andApplications),第137頁,Wiley-Liss公司,1995年;和Georgiou,“蛋白質(zhì)在芽孢桿菌中的表達”(Expression of Proteins inBacteria),《蛋白質(zhì)工程原理和實踐》(Protein EngineeringPrinciples and Practice),Cleland等編,第101頁,John Wiley& Sons公司,1996年)。
桿狀病毒系統(tǒng)為將克隆的TGF-p結(jié)合蛋白基因?qū)肜ハx細胞提供了有效手段。合適的表達載體基于苜蓿銀蚊夜蛾多核型多角體病毒(AcMNPV),而且包含眾所周知的啟動子,諸如果蠅熱休克蛋白(hsp)70的啟動子、苜蓿銀蚊夜蛾核型多角體病毒立即-早期基因啟動子(ie-1)和延遲早期39K啟動子、桿狀病毒p10啟動子、和果蠅金屬硫蛋白啟動子。合適的昆蟲宿主細胞包括衍生自IPLB-Sf-21即秋粘蟲pupal卵巢細胞系的細胞系,諸如Sf9(ATCC CRL 1711)、Sf21AE、和Sf21(Invitrogen公司,圣迭哥,加利福尼亞)、以及果蠅Schneider-2細胞。已確立的用于在桿狀病毒系統(tǒng)中生成重組蛋白的技術(shù)參閱Bailey等,“桿狀病毒載體的操作”(Manipulation ofBaculovirus Vectors),《分子生物學(xué)方法第7卷基因轉(zhuǎn)移和表達方案》(Methods in Molecular Biology),Volume 7Gene Transferand Expression Protocols,Murray編,第147-168頁,Humana出版公司,1991年;Patel等,“桿狀病毒表達系統(tǒng)”(The baculovirusexpression system),《DNA克隆2表達系統(tǒng)》(DNA Cloning 2Expression Systems),第2版,Glover等編,第205-244頁,牛津大學(xué)出版社,1995年;Ausubel,1995,第16-37至16-57頁;Richardson編,《桿狀病毒表達方案》(Baculovirus ExpressionProtocols),Humana出版公司,1995年;和Lucknow,“昆蟲細胞表達技術(shù)”(Insect Cell Expression Technology),《蛋白質(zhì)工程原理和實踐》(Protein EngineeringPrinciples and Practice),Cleland等編,第183-218頁,John Wiley & Sons公司,1996年。
用于在酵母中表達的啟動子包括來自GAL1(半乳糖)、PGK(磷酸甘油酸激酶)、ADH(乙醇脫氫酶)、AOX1(乙醇氧化酶)、HIS4(組氨醇脫氫酶)等等的啟動子。已經(jīng)設(shè)計了許多酵母克隆載體,而且易于獲得。這些載體包括基于YIp的載體諸如YIp5、YRp載體諸如YRp17、YEp載體諸如YEp13、和YCp載體諸如YCp19。本領(lǐng)域技術(shù)人員將認識到,有多種載體適于在酵母細胞中進行表達。
也可以將表達載體導(dǎo)入植物原生質(zhì)體、完整的植物組織、或分離的植物細胞。例如Miki等,“用于將外源DNA導(dǎo)入植物的流程”(Procedures for Introducing Foreign DNA into Plants),《植物分子生物學(xué)和生物技術(shù)方法》(Methods in Plant MolecularBiology and Biotechnology),Glick等編,第67-88頁(CRC出版社,1993年)中提供了培養(yǎng)植物組織的通用方法。
可以使用多種標準技術(shù)將表達載體導(dǎo)入宿主細胞,包括磷酸鈣轉(zhuǎn)染、脂質(zhì)體介導(dǎo)的轉(zhuǎn)染、微彈介導(dǎo)的投遞、電穿孔諸如此類。優(yōu)選的是,對轉(zhuǎn)染細胞進行選擇和增殖,以提供包含了穩(wěn)定整合到宿主細胞基因組中的表達載體的重組宿主細胞。例如Ausubel,1995和Murray編,《基因轉(zhuǎn)移和表達方案》(Gene Transfer and ExpressionProtocols),Humana出版社,1991年描述了用于將載體導(dǎo)入真核細胞和使用顯性選擇標記來選擇這些穩(wěn)定轉(zhuǎn)化體的技術(shù)。Ausubel,1995還提供了用于將表達載體導(dǎo)入細菌、酵母、昆蟲、和植物細胞的方法。
使用哺乳動物細胞系統(tǒng)表達和回收外源蛋白的通用方法參閱例如Etcheverry,“在哺乳動物細胞培養(yǎng)物中表達基因工程蛋白質(zhì)”(Expression of Engineered Proteins in Mammalian Cell Culture),《蛋白質(zhì)工程原理和實踐》(Protein EngineeringPrinciplesand Practice),Cleland等編,第163頁,Wiley-Liss公司,1996年。用于回收由細菌系統(tǒng)生產(chǎn)的蛋白質(zhì)的標準技術(shù)參閱例如Grisshammer等,“由大腸桿菌細胞純化過度生產(chǎn)的蛋白質(zhì)”(Purification of over-produced proteins from E.coli cells),《DNA克隆2表達系統(tǒng)》(DNA Cloning 2Expression Systems),第2版,Glover等編,第59-92頁,牛津大學(xué)出版社,1995年。已確立的用于由桿狀病毒系統(tǒng)分離重組蛋白的方法參閱Richardson編,《桿狀病毒表達方案》(Baculovirus Expression Protocols),Humana出版公司,1995年。
更普遍地,可以通過標準技術(shù)來分離TGF-β結(jié)合蛋白,諸如親和層析、大小排阻層析、離子交換層析、HPLC諸如此類。本領(lǐng)域技術(shù)人員可以設(shè)計TGF-β結(jié)合蛋白分離和純化的其它變化。例如,可以使用如下文所述獲得的抗TGF-β結(jié)合蛋白抗體通過免疫親和純化來分離大量蛋白質(zhì)。
5.針對TGF-β結(jié)合蛋白的抗體的生成本發(fā)明提供了與本文詳細描述的硬化素特異結(jié)合的抗體。例如,可以使用表達載體的產(chǎn)物作為抗原以獲得針對TGF-β結(jié)合蛋白的抗體。也可以使用由本文提供的任一硬化素多肽序列(SEQ ID NO2、6、8、10、12、14、16、46、和65)衍生的肽來制備與硬化素特異結(jié)合的抗體。特別有用的抗TGF-β結(jié)合蛋白抗體與SEQ ID NO2、6、8、10、12、14、16、46、或65的TGF-β結(jié)合蛋白“特異結(jié)合”,但不與其它TGF-β結(jié)合蛋白諸如Dan、Cerberus、SCGF、或Gremlin結(jié)合。本發(fā)明的抗體(包括其片段和衍生物)可以是多克隆抗體,或者尤其是單克隆抗體??贵w可以屬于任何免疫球蛋白類別,可以是例如IgG(包括IgG的同種型,對人而言本領(lǐng)域已知有IgG1、IgG2、IgG3、IgG4)、IgE、IgM、或IgA抗體。可以由禽類或哺乳動物獲得抗體,優(yōu)選例如從鼠、大鼠、人、或其它靈長類獲得。如果需要,抗體可以是內(nèi)在化抗體。
可以使用本領(lǐng)域技術(shù)人員眾所周知的方法來制備針對重組TGF-β結(jié)合蛋白的多克隆抗體(參閱例如Green等,“多克隆抗血清的生成”(Production of Polyclonal Antisera),《免疫化學(xué)方案》(Immunochemical Protocols),Manson編,第1-5頁,Humana出版社,1992年;Williams等,“使用質(zhì)粒載體在大腸桿菌中表達外源蛋白并純化特異多克隆抗體”(Expression of foreign proteins inE.coli using plasmid vectors and purification of specificpolyclonal antibodies),《DNA克隆2表達系統(tǒng)》(DNA Cloning2Expression systems),第2版,Glover等編,第15頁,牛津大學(xué)出版社,1995年)。雖然多克隆抗體通常是在諸如大鼠、小鼠、兔、山羊、或綿羊等動物中產(chǎn)生的,但是本發(fā)明的抗TGF-β結(jié)合蛋白抗體也可以衍生自低于人類的靈長類抗體。用于在狒狒中形成在診斷和治療上有用的抗體的通用技術(shù)參閱例如Goldenberg等,國際專利發(fā)表號WO 91/11465,1991年;和Losman等,Int.J.Cancer 46310,1990。
抗體應(yīng)當(dāng)包含至少一個可變區(qū)結(jié)構(gòu)域??勺儏^(qū)結(jié)構(gòu)域可以是任何大小或氨基酸組成,而且通常包含至少一個包埋在框架序列中、負責(zé)抗原結(jié)合的高變氨基酸序列。一般而言,術(shù)語可變區(qū)結(jié)構(gòu)域(V)可以是免疫球蛋白重鏈(VH)和/或輕鏈(VL)可變區(qū)的任何合適排列。因此,例如,V區(qū)結(jié)構(gòu)域可以是單體,而且是能夠以可接受的親和力與抗原獨立結(jié)合的VH或VL結(jié)構(gòu)域?;蛘?,V區(qū)結(jié)構(gòu)域可以是二聚體,而且包括VH-VH、VH-VL、或VL-VL二聚體,其中VH和VL鏈非共價相連(下文縮寫為Fv)。然而,如果需要,兩條鏈可以直接地(例如經(jīng)由兩個可變區(qū)之間的二硫鍵)或是通過接頭(例如肽接頭)而共價偶聯(lián),形成單鏈結(jié)構(gòu)域(下文縮寫為scFv)。
可變區(qū)結(jié)構(gòu)域可以是任何天然存在的可變結(jié)構(gòu)域或其改造形式。改造形式指使用重組DNA工程技術(shù)產(chǎn)生的可變區(qū)結(jié)構(gòu)域。這些改造形式包括例如通過在天然抗體的氨基酸序列中進行插入、缺失、或改變而由天然抗體可變區(qū)產(chǎn)生的形式。這個類別的具體實例包括包含來自一種抗體的至少一個CDR和可選地一個或多個框架氨基酸、而剩余可變區(qū)結(jié)構(gòu)域來自另一種抗體的改造后可變區(qū)結(jié)構(gòu)域。
可變區(qū)結(jié)構(gòu)域可以以C端氨基酸共價連接至少一個其它抗體結(jié)構(gòu)域或其片段。因此,例如,當(dāng)可變區(qū)結(jié)構(gòu)域中存在VH結(jié)構(gòu)域時,它可以與免疫球蛋白CH1結(jié)構(gòu)域或其片段相連。類似的,VL結(jié)構(gòu)域可以與CK結(jié)構(gòu)域或其片段相連。這樣的話,例如,抗體可以是Fab片段,其中抗原結(jié)合結(jié)構(gòu)域包含其C端分別與CH1和CK結(jié)構(gòu)域共價相連的關(guān)聯(lián)VH和VL結(jié)構(gòu)域。CH1結(jié)構(gòu)域可以用氨基酸進一步延伸,以便例如提供在Fab′片段中發(fā)現(xiàn)的鉸鏈區(qū)結(jié)構(gòu)域,或提供其它結(jié)構(gòu)域,諸如抗體CH2和CH3結(jié)構(gòu)域。
抗體片段的另一種形式是編碼單一互補決定區(qū)(CDR)的肽??梢酝ㄟ^構(gòu)建編碼目的抗體CDR的基因來獲得CDR肽(“最小識別單位”)。例如,通過使用聚合酶鏈式反應(yīng),由抗體生成細胞的RNA合成可變區(qū)來制備這些基因(參閱例如Larrick等,MethodsA Companion toMethods in Enzymology 2106,1991;Courtenay-Luck,“單克隆抗體的基因操作”(Genetic Manipulation of MonoclonalAntibodies),《單克隆抗體生產(chǎn)、改造、和臨床應(yīng)用》(MonoclonalAntibodiesProduction,Engineering and ClinicalApplication),Ritter等編,第166頁,劍橋大學(xué)出版社,1995年;和Ward等,“抗體的基因操作和表達”(Genetic Manipulation andExpression of Antibodies),《單克隆抗體原理和應(yīng)用》(MonoclonalAntibodiesPrinciples and Applications),Birch等編,第137頁,Wiley-Liss出版社,1995年)。
用于本發(fā)明的抗體通常是通過常規(guī)免疫和細胞融合流程制備的單克隆抗體,或是使用任何合適的標準化學(xué)技術(shù)諸如還原或酶促切割和/或消化技術(shù)(例如用胃蛋白酶處理)由其衍生的片段。更具體的說,可以采用多種技術(shù)來生成單克隆抗TGF-β結(jié)合蛋白抗體。可以通過本領(lǐng)域技術(shù)人員眾所周知的方法來獲得針對特定抗原的嚙齒類單克隆抗體(參閱例如Kohler等,Nature 256495,1975;和Coligan等編,《免疫學(xué)通用方案》(Current Protocols in Immunology),12.5.1-2.6.7,John Wiley & Sons,1991[“Coligan”];Picksley等,“針對大腸桿菌中表達的蛋白質(zhì)的單克隆抗體的生成”(Productionof monoclonal antibodies against proteins expressed in E.coli),《DNA克隆2表達系統(tǒng)》(DNA Cloning 2ExpressionSystems),第2版,Glover等編,第93頁,牛津大學(xué)出版社,1995)。
簡而言之,可以如下獲得單克隆抗體給小鼠注射包含TGF-β結(jié)合蛋白基因產(chǎn)物的組合物,通過采集血清樣品而確認抗體生成的存在,切除脾以獲得B淋巴細胞,融合B淋巴細胞與骨髓瘤細胞以生成雜交瘤,克隆雜交瘤,選擇生成針對該抗原的抗體的陽性克隆,培養(yǎng)生成針對該抗原的抗體的克隆,并由雜交瘤培養(yǎng)物分離所述抗體。
另外,本發(fā)明的抗TGF-β結(jié)合蛋白抗體可以衍生自人單克隆抗體。人單克隆抗體是由經(jīng)過加工而響應(yīng)于抗原激發(fā)生成特異人抗體的轉(zhuǎn)基因小鼠獲得的。在這種技術(shù)中,將人重鏈和輕鏈基因座元件導(dǎo)入由內(nèi)源重鏈和輕鏈基因組包含靶向破壞的胚胎干細胞系衍生的小鼠品系。轉(zhuǎn)基因小鼠能夠合成對人抗原特異的人抗體,而且小鼠可用于生成分泌人抗體的雜交瘤。用于由轉(zhuǎn)基因小鼠獲得人抗體的方法參閱例如Green等,Nature Genet.713,1994;Lonberg等,Nature 368856,1994;和Taylor等,Int.Immun.6579,1994。
可以通過多種完全確立的技術(shù)由雜交瘤培養(yǎng)物分離和純化單克隆抗體。這些分離技術(shù)包括使用蛋白A Sepharose的親和層析、大小排阻層析、和離子交換層析(參閱例如Coligan,第2.7.1-2.7.12頁和第2.9.1-2.9.3頁;Baines等,“免疫球蛋白G(IgG)的純化”(Purification of Immunoglobulin G(IgG)),《分子生物學(xué)方法》(Methods in Molecular Biology),第10卷,第79-104頁,Humana出版公司,1992)。
對于特殊用途,可能需要制備抗TGF-β結(jié)合蛋白抗體的片段??梢酝ㄟ^例如抗體的蛋白水解來獲得這些抗體片段。可以通過常規(guī)方法用胃蛋白酶或木瓜蛋白酶消化完整抗體來獲得抗體片段。例如,可以通過酶促切割來生成抗體片段,例如用胃蛋白酶酶促切割抗體而生成5S片段,稱為F(ab′)2。可以用硫醇還原劑進一步切割這個片段而生成3.5S Fab′單價片段??蛇x的是,可以使用由切割二硫鍵而生成的巰基的封閉基因進行切割反應(yīng)?;蛘?,使用胃蛋白酶的酶促切割直接產(chǎn)生兩個單價Fab片段和一個Fc片段。這些方法參閱例如Goldenberg,美國專利號4,331,647;Nisonoff等,Arch Biochem.Biophys.89230,1960;Porter,Biochem.J.73119,1959;Edelman等,Methods in Enzymology 1422,Academic出版社,1967;和Coligan,第2.8.1-2.8.10頁和2.10.-2.10.4。
還可以使用切割抗體的其它方法,諸如分離重鏈而形成單價輕鏈-重鏈片段,進一步切割片段,或者其它酶促、化學(xué)、或基因技術(shù),只要片段能夠與完整抗體所識別的抗原相結(jié)合即可。
或者,抗體可以是通過重組DNA技術(shù)獲得的重組或改造的抗體,該技術(shù)涉及編碼抗體可變區(qū)和/或恒定區(qū)的DNA的操作和再表達。這些DNA是已知的,和/或易于由DNA文庫獲得,包括例如噬菌體抗體庫(參閱Chiswell,D.J.和McCafferty,J.,Tibtech.1080-84,1992),或者需要的話,可以人工合成。標準分子生物學(xué)和/或化學(xué)流程可用于DNA的測序和操作,例如,用于導(dǎo)入密碼子以產(chǎn)生半胱氨酸殘基,或是用于根據(jù)需要修飾、添加、或缺失其它氨基酸或結(jié)構(gòu)域。
可以制備一種或多種包含編碼可變區(qū)和/或恒定區(qū)的DNA的可復(fù)制型表達載體,并用于轉(zhuǎn)化將在其中進行抗體生產(chǎn)的合適細胞系,例如非生產(chǎn)性骨髓瘤細胞系,諸如小鼠NSO系,或細菌,諸如大腸桿菌。為了獲得有效轉(zhuǎn)錄和翻譯,每個載體中的DNA序列應(yīng)當(dāng)包含合適的調(diào)控序列,特別是與可變結(jié)構(gòu)域序列可操作相連的啟動子和前導(dǎo)序列。用于以這種方式生成抗體的具體方法通常是眾所周知且常規(guī)使用的。例如,基本的分子生物學(xué)流程參閱Maniatis等,《分子克隆》,冷泉港實驗室,紐約,1989;DNA測序參閱Sanger等,Proc.Natl.Acad.Sci.USA 745463,1977;和Amersham國際上市公司測序手冊;定點誘變的方法參閱Kramer等,Nucleic Acids Res.129441,1984;Anglian Biotechnology公司手冊;Kunkel,Proc.Natl.Acad.Sci.USA 82488-92,1985;Kunkel等,Methods in Enzymol.154367-82,1987。另外,許多發(fā)表物詳述了適用于通過操作DNA、生成表達載體、并轉(zhuǎn)化合適細胞來制備抗體的技術(shù),綜述例如參閱Mountain,A.和Adair,J.R.,《生物技術(shù)和基因工程綜述》Biotechnology and Genetic Engineering Reviews,Tombs,M.P.編,10,第1章,1992,Intercept,Andover,英國;和國際專利說明書編號WO 91/09967。
在某些實施方案中,依照本發(fā)明的抗體可以附著了一個或多個效應(yīng)或報道分子,而且本發(fā)明延伸至這些經(jīng)修飾的蛋白質(zhì)。報道分子可以是可檢測部分或標記物,諸如酶、細胞毒性劑、或其它報道分子,包括染料、放射性核素、發(fā)光基團、熒光基團、或生物素、諸如此類??梢苑派湫詷擞汿GF-β結(jié)合蛋白特異性免疫球蛋白或其片段以用于診斷或治療應(yīng)用中。本領(lǐng)域知道用于放射性標記抗體的技術(shù)。參閱例如Adams,1998,In Vivo 1211-21;Hiltunen,1993,Acta Oncol.32831-9。下文更為詳細的描述了治療性應(yīng)用,而且可以包括與其它治療劑一起使用TGF-β結(jié)合蛋白特異性抗體(或其片段)。可以將效應(yīng)或報道分子通過任何可供利用的氨基酸側(cè)鏈、末端氨基酸、或抗體中存在的碳水化合物功能基團(如果有的話)附著于抗體上,條件是這種附著或附著過程不會對該分子的結(jié)合特性和效用產(chǎn)生不利影響。具體的功能基團包括例如任何游離氨基、亞氨基、硫醇基、羥基、羧基、或醛基??贵w與效應(yīng)和/或報道分子的附著可以經(jīng)由效應(yīng)或報道分子中的這些基團和合適功能基團來實現(xiàn)。連接可以是直接的,或者經(jīng)由間隔或架橋基團而間接連接。
效應(yīng)分子包括例如抗腫瘤劑、毒素(諸如細菌(諸如銅綠假單胞菌外毒素A)或植物來源的酶促活性毒素及其片段(例如蓖麻毒素及其片段;植物白樹毒素,來自Bryonia dioica的bryodin,諸如此類。參閱例如Thrush等,Annu.Rev.Immunol.1449-71,1996;Frankel等,Cancer Res.56926-32,1996);生物學(xué)活性蛋白,例如酶;核酸及其片段諸如DNA、RNA及其片段;天然存在的和合成的聚合物(例如多糖和聚烯烴聚合物諸如聚乙二醇及其衍生物);放射性核素,特別是放射性碘化物;和螯合金屬。合適的報道基團包括螯合金屬、熒光化合物、或者可以通過NMR或ESR光譜學(xué)檢測的化合物。特別有用的效應(yīng)基團是加利車霉素(calichaemicin)及其衍生物(參閱例如南非專利說明書編號85/8794、88/8127、和90/2839)。
熟悉本領(lǐng)域的人知道眾多其它毒素,包括化療劑、抗有絲分裂劑、抗生素、凋亡誘導(dǎo)物(或“凋亡原”,參閱例如Green和Reed,Science2811309-1312,1998)諸如此類,本文提供的實例意圖例示而非限制本發(fā)明的范圍和精神。具體的抗腫瘤劑包括毒害細胞和抑制細胞的試劑,例如烷化劑,諸如氮芥(例如苯丁酸氮芥、苯丙氨酸氮芥、二氯甲基二乙胺、環(huán)磷酰胺、或尿嘧啶氮芥)及其衍生物、三亞乙基磷酰胺、三亞乙基硫代磷酰胺、白消安、或順鉑;抗代謝物諸如氨甲蝶呤、氟尿嘧啶、氟尿苷、阿糖胞苷、巰基嘌呤、硫鳥嘌呤、氟乙酸或氟檸檬酸,抗生素諸如博來霉素(例如硫酸博來霉素)、阿霉素、道諾霉素、絲裂霉素(例如絲裂霉素C)、放線菌素(例如放線菌素D)、普卡霉素、加利車霉素(calichaemicin)及其衍生物、或埃斯波霉素(esperamicin)及其衍生物;有絲分裂抑制劑,諸如鬼臼亞乙苷、長春新堿、或長春堿及其衍生物;生物堿,諸如橢圓玫瑰樹堿;多元醇,諸如紫杉萜酯-I或紫杉萜酯-II;激素,諸如雄激素(例如屈他雄酮或睪內(nèi)酯)、孕激素(例如乙酸甲地孕酮或乙酸甲羥孕酮)、雌激素(例如二甲基己烯雌酚二磷酸、聚磷酸雌二醇、或雌氮芥磷酸)、或抗雌激素藥(例如它莫西芬);蒽醌,諸如米托蒽醌;脲,諸如羥基脲;肼,諸如丙卡巴肼;或咪唑,諸如達卡巴嗪。
螯合金屬包括配位數(shù)為2-8(含)的二價或三價金屬螯合物。這些金屬的具體實例包括锝(Tc)、錸(Re)、鈷(Co)、銅(Cu)、金(Au)、銀(Ag)、鉛(Pb)、鉍(Bi)、銦(In)、鎵(Ga)、釔(Y)、鋱(Tb)、釓(Gd)、和鈧(Sc)。一般而言,金屬優(yōu)選是放射性核素。具體的放射性核素包括99mTc、186Re、188Re、58Co、60Co、67Cu、195Au、199Au、110Ag、203Pb、206Bi、207Bi、111In、67Ga、68Ga、88Y、90Y、160Tb、153Gd、和47Sc。
螯合金屬可以是例如與任何合適多配位螯合劑螯合的上述金屬類別之一,螯合劑是例如無環(huán)或環(huán)狀多胺、聚醚(例如冠醚及其衍生物)、聚酰胺、卟啉、和碳環(huán)衍生物。一般而言,螯合劑的類型將取決于使用的金屬。然而,在依照本發(fā)明的綴合物中特別有用的一類螯合劑包括無環(huán)和環(huán)狀多胺,尤其是多氨基羧酸,例如二亞乙三胺五乙酸及其衍生物;大環(huán)胺,諸如環(huán)狀三氮雜和四氮雜衍生物(例如國際專利說明書編號WO 92/22583中所述);和聚酰胺,尤其是去鐵胺及其衍生物。
在將抗體中的硫醇基用作附著點時,這可以通過與效應(yīng)或報道分子中存在的硫醇反應(yīng)性基團的反應(yīng)來實現(xiàn)。這些基團的實例包括á-鹵代羧酸或酯諸如碘乙酰胺、酰亞胺諸如馬來酰亞胺、乙烯基砜、或二硫化物。國際專利說明書編號WO 93/06231、WO 92/22583、WO90/091195、和WO 89/01476概括和更具體描述了這些和其它合適連接流程。
用于選擇可增加骨密度的分子的測定法如上所述,本發(fā)明提供了用于選擇和/或分離能夠增加骨密度的化合物的方法。例如,在本發(fā)明的一個方面,提供了用于測定選擇的分子(例如候選試劑)是否能夠增加骨礦物質(zhì)含量的方法,包括下列步驟(a)將選擇的分子與TGF-β結(jié)合蛋白和選擇的TGF-β蛋白家族成員混合(或接觸),并(b)測定所選擇的分子是否刺激TGF-β蛋白家族的信號傳導(dǎo),或是否抑制TGF-β結(jié)合蛋白與至少一種TGF-β蛋白家族成員結(jié)合。在某些實施方案中,該分子可增強TGF-β作為間充質(zhì)細胞分化正調(diào)節(jié)物發(fā)揮功能的能力。
在本發(fā)明的其它方面,提供了用于測定選擇的分子(候選試劑)是否能夠增加骨礦物質(zhì)含量的方法,包括下列步驟(a)將選擇的分子暴露于(接觸、混合、聯(lián)合)表達TGF-β結(jié)合蛋白的細胞,并(b)測定暴露的細胞中TGF-β結(jié)合蛋白的表達(或活性)是否降低,或TGF-β結(jié)合蛋白的活性是否降低,并由此測定該化合物是否能夠增加骨礦物質(zhì)含量。在一個實施方案中,所述細胞選自來自骨活組織檢查標本的自發(fā)轉(zhuǎn)化或未轉(zhuǎn)化的正常人骨和大鼠頂骨成骨細胞。用于檢測TGF-β結(jié)合蛋白表達水平的方法可以以本領(lǐng)域已知的和本文描述的多種測定法形式來實現(xiàn)??梢允褂妹庖邷y定法來檢測并量化TGF-β結(jié)合蛋白的表達,包括例如逆向免疫電泳(CIEP)、放射免疫測定法、放射免疫沉淀、酶聯(lián)免疫吸附測定法(ELISA)、免疫印跡測定法諸如點印跡測定法和Western印跡、抑制或競爭測定法、以及三明治測定法(參閱美國專利號4,376,110和4,486,530;還可參閱《抗體實驗室指南》AntibodiesA Laboratory Manual,見上文)。這些免疫測定法可以使用對TGF-β結(jié)合蛋白特異的抗體,諸如本文所述的抗硬化素抗體,或者可以使用對附著于TGF-β結(jié)合蛋白上的報道分子特異的抗體。還可以通過量化與TGF-β結(jié)合蛋白配體相結(jié)合的TGF-β結(jié)合蛋白的量來測定多肽表達水平。例如,可以通過表面激元共振(SPR)來檢測樣品中硬化素與BMP的結(jié)合?;蛘?,可以量化編碼該特定TGF-β結(jié)合蛋白的mRNA的表達水平。
下文實施例5和6提供了這些測定法的代表性實施方案。簡而言之,首先將TGF-β超家族的家族成員或TGF-β結(jié)合蛋白結(jié)合在固相上,隨后添加候選分子。然后向測定反應(yīng)中添加經(jīng)過標記的TGF-β超家族家族成員或TGF-β結(jié)合蛋白(即無論將哪種多肽結(jié)合在固相上,經(jīng)過標記的多肽均是前者的配體),清洗固相,并測定固相支持物上結(jié)合的或標記的TGF-β超家族成員或TGF-β結(jié)合蛋白的量。適于如本文所述用于增加骨礦物質(zhì)含量的分子是以統(tǒng)計學(xué)顯著方式降低TGF-β結(jié)合蛋白與TGF-β超家族成員結(jié)合的那些分子。顯然,適于在本發(fā)明中使用的測定法不應(yīng)當(dāng)受限于實施例2和3中描述的實施方案。具體而言,可以改變眾多參數(shù),諸如通過將TGF-β結(jié)合到固相上,或是通過完全取消固相。
在本發(fā)明的其它方面,提供了用于測定所選擇的分子是否能夠增加骨礦物質(zhì)含量的方法,包括下列步驟(a)將選擇的分子(候選試劑)暴露于(接觸、混合、聯(lián)合)表達TGF-β的細胞,并(b)測定由所述暴露的細胞表達的TGF-β的活性是否改變,并由此測定該化合物是否能夠增加骨礦物質(zhì)含量。與本文所述方法類似,可以采用非常多種方法來評估由選擇的待測化合物引起的TGF-β結(jié)合蛋白表達的變化。在本發(fā)明的一個實施方案中,候選試劑是與本文所公開的TGF-β結(jié)合蛋白硬化素結(jié)合的抗體。
在本發(fā)明的一個優(yōu)選實施方案中,提供了用于鑒定調(diào)控TGF-β信號傳導(dǎo)途徑的抗體的方法,包括在足以容許抗體+SOST(抗體/SOST)復(fù)合物形成的條件和時間下將與SOST多肽特異結(jié)合的抗體接觸SOST肽,包括但不限于本文所公開的肽,然后測定SOST/抗體復(fù)合物的水平(例如對其量進行量化)以確定調(diào)控TGF-β信號傳導(dǎo)途徑的抗體的存在??梢允褂肧PR或本領(lǐng)域已知的和本文公開的任何不同免疫測定法來進行該方法,包括ELISA、免疫印跡、諸如此類。TGF-β信號傳導(dǎo)途徑包括這樣的信號傳導(dǎo)途徑,BMP借助該途徑與細胞上的I型和II型受體結(jié)合而刺激或誘導(dǎo)調(diào)控骨礦物質(zhì)含量的途徑。在本發(fā)明的某些優(yōu)選實施方案中,與SOST特異結(jié)合的抗體刺激或增強用于增加骨礦物質(zhì)含量的途徑??梢允褂帽疚乃_的用于檢測抗體與SOST特異性肽結(jié)合的方法來鑒定這樣的抗體。
本發(fā)明的方法還可以通過檢測抗體是否與位于SOST上BMP所結(jié)合的區(qū)域或其部分內(nèi)的SOST肽結(jié)合而用于鑒定削弱、抑制(包括競爭性抑制)、或阻止BMP與SOST多肽結(jié)合的抗體,所述SOST肽諸如是SOST氨基末端的肽和包含SOST氨基末端氨基酸殘基及部分核心區(qū)(停泊核心)的肽(例如SEQ ID NO47-64、66-73、和92-95)。本發(fā)明的方法還可用于鑒定削弱、阻止、或抑制SOST均二聚體形成的抗體。可以通過檢測抗體與衍生自SOST核心或羧基末端區(qū)的肽(例如SEQ IDNO74-91和96-99)的結(jié)合來鑒定與SOST特異結(jié)合的這種抗體。
在本發(fā)明的另一個實施方案中,提供了用于測定選擇的分子是否能夠增加骨礦物質(zhì)含量的方法,包括下列步驟(a)將選擇的分子(候選試劑)與TGF-β結(jié)合蛋白及選擇的TGF-β蛋白家族成員相混合或接觸,并(b)測定該選擇的分子是否上調(diào)TGF-β蛋白家族的信號傳導(dǎo),或是否抑制TGF-β結(jié)合蛋白與TGF-β蛋白家族結(jié)合。在某些實施方案中,該分子可增強TGF-β作為間充質(zhì)細胞分化正調(diào)節(jié)物發(fā)揮功能的能力。
與上文所述方法類似,可以采取非常多種方法來評估由選擇的待測化合物引起的TGF-β刺激。下文實施例6中提供了這樣的一種代表性方法(還可參閱Durham等,Endo.1361374-1380)。
在本發(fā)明的另一個方面,提供了用于測定選擇的分子(候選試劑)是否能夠增加骨礦物質(zhì)含量的方法,包括測定選擇的分子是否抑制TGF-β結(jié)合蛋白與骨或其類似物結(jié)合的步驟。在用于本文時,應(yīng)當(dāng)理解,骨或其類似物指羥磷灰石,或是由骨粉、碎骨、或完整骨組成的表面。與上文所述方法類似,可以采用非常多種方法來評估對TGF-β結(jié)合蛋白定位于骨基質(zhì)的抑制。下文實施例7中描述了這樣的一種代表性方法(還可參閱Nicolas等,Calcif.Tissue Int.47206-12,1995)。
在本發(fā)明的一個實施方案中,與硬化素多肽特異結(jié)合的抗體或其抗原結(jié)合片段能夠競爭性抑制TGF-β家族成員與硬化素多肽結(jié)合??梢砸勒毡疚乃鋈魏畏椒▉頊y定所述抗體或抗體片段削弱或阻斷TGF-β家族成員諸如BMP與硬化素結(jié)合的能力。與硬化素特異結(jié)合的抗體或其片段可能通過削弱硬化素均二聚體形成而削弱、阻斷、或阻止TGF-β家族成員與硬化素結(jié)合。與硬化素特異結(jié)合的抗體還可用于通過抑制或削弱硬化素與BMP結(jié)合來鑒定硬化素活性?;蛘?,可以將抗體或其片段摻入基于細胞的測定法中或其中硬化素具有確定活性的動物模型中,以測定該抗體是否改變(以統(tǒng)計學(xué)顯著方式增加或減少)該活性。與硬化素特異結(jié)合的抗體或其片段可用于檢驗這種抗體在信號轉(zhuǎn)導(dǎo)途徑中的作用以及由此調(diào)控(刺激或抑制)信號傳導(dǎo)途徑的作用。優(yōu)選的是,抗體與SOST的結(jié)合導(dǎo)致對信號傳導(dǎo)途徑的刺激或誘導(dǎo)。
雖然本文所述方法可以是對單個待測分子的分析,但是本發(fā)明不應(yīng)當(dāng)受限于此。具體而言,選擇的分子可以包含在化合物混合物中。因此,所述方法還可以包括分離抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的分子的步驟。
候選分子可以對非常多種分子測定它們抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的能力。下文更為詳細討論的代表性實例包括有機分子(例如有機小分子)、蛋白質(zhì)或肽、以及核酸分子。根據(jù)下文討論顯而易見的是,可以在本文所述測定法中采用本文所述候選分子,同樣顯而易見的是,還可以在多種診斷和治療背景中采用這些分子。
1.有機分子可以對眾多有機小分子測定它們抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的能力。例如,在本發(fā)明的一個實施方案中,合適的有機分子可以選自化學(xué)文庫(其中單獨測定化學(xué)藥品),或是選自組合化學(xué)文庫(其中一次測定多種化合物),然后拆分以確定并分離最有活性的化合物。
這些組合化學(xué)文庫的代表性實例參閱Agrafiotis等,“自動生成具有期望特性的化學(xué)藥品的系統(tǒng)和方法”(System and method ofautomatically generating chemical compounds with desiredproperties),美國專利號5,463,564;Armstrong,R.W.,“經(jīng)由多成分組合陣列合成的使用來合成有機化合物的組合陣列”(Synthesisof combinatorial arrays of organic compounds through the useof multiple component combinatorial array syntheses),WO95/02566;Baldwin,J.J.等,“磺胺藥物衍生物及其用途”(Sulfonamide derivatives and their use),WO 95/24186;Baldwin,J.J.等,“組合二氫苯并呲喃文庫”(Combinatorialdihydrobenzopyran library),WO 95/30642;Brenner,S.,“用于制備組合文庫的新試劑盒”(New kit for preparing combinatoriallibraries),WO 95/16918;Chenera,B.等,“與樹脂結(jié)合的芳香族碳環(huán)化合物文庫的制備”(Preparation of library of resin-boundaromatic carbocyclic compounds),WO 95/16712;Ellman,J.A.,“Solid phase and combinatorial synthesis of benzodiazepinecompounds on a solid support”,美國專利號5,288,514;Felder,E.等,“新型組合化合物文庫”(Novel combinatorial compoundlibraries),WO 95/16209;Lerner,R.等,“編碼的組合化學(xué)文庫”(Encoded combinatorial chemical libraries),WO 93/20242;Pavia,M.R.等,“用于由結(jié)構(gòu)多樣性全體文庫制備和選擇制藥學(xué)有用非肽化合物的方法”(A method for preparing and selectingpharmaceutically useful non-peptide compounds from astructurally diverse universal library),WO 95/04277;Summerton,J.E.和Weller,D.D.,“嗎啉亞基組合文庫和方法”(Morpholino-subunit combinatorial library and method),美國專利號5,506,337;Holmes,C.,“Methods for the Solid PhaseSynthesis of Thiazolidinones,Metathiazanones,and Derivativesthereof”,WO 96/00148;Phillips,G.B.和Wei,G.P.,“苯并咪唑的固相合成”(Solid-phase Synthesis of Benzimidazoles),Tet.Letters 374887-90,1996;Ruhland,B.等,“結(jié)構(gòu)多樣性β-內(nèi)酰胺固相支持的組合合成”(Solid-supported CombinatorialSynthesis of Structurally Diverse β-Lactams),J.Amer.Chem.Soc.111253-4,1996;Look,G.C.等,“The Indentification ofCyclooxygenase-1 Inhibitors from 4-ThiazolidinoneCombinatorial Libraries”,Bioorg.and Med.Chem.Letters 6707-12,1996。
2.蛋白質(zhì)和肽同樣可以采用廣泛的蛋白質(zhì)和肽作為TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的抑制劑的候選分子。
a.組合肽文庫可以通過篩選組合肽文庫獲得作為TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的推定抑制劑的肽分子。這些文庫或是可以由本領(lǐng)域技術(shù)人員制備(參閱例如美國專利號4,528,266和4,359,535,以及專利合作條約發(fā)布號WO 92/15679、WO 92/15677、WO 90/07862、WO90/02809),或是可以由商業(yè)途徑購買(例如New England Biolabs的Ph.D.TM噬菌體展示肽庫試劑盒)。
b.抗體本發(fā)明提供了與硬化素多肽特異結(jié)合的抗體和使用這些抗體的方法。本發(fā)明還提供了可用于生成和分析這些抗體的硬化素多肽免疫原。所述抗體可用于阻斷或削弱作為TGF-β結(jié)合蛋白的硬化素多肽與配體特別是骨形態(tài)發(fā)生蛋白的結(jié)合,而且還可阻斷或削弱該硬化素多肽與一種或多種其它配體的結(jié)合。
諸如抑制TGF-β結(jié)合蛋白與一種或多種TGF-β蛋白家族成員(包括一種或多種骨形態(tài)發(fā)生蛋白(BMP))結(jié)合的抗體這樣的分子應(yīng)當(dāng)理解為指例如通過消除或阻止TGF-β成員與TGF結(jié)合蛋白結(jié)合而使得激活TGF-β家族成員或BMP、或是使得TGF-β家族成員(包括一種或多種BMP)與它們各自的受體結(jié)合的分子。
本發(fā)明還提供了可用于生成和/或鑒定能夠抑制、阻止、或削弱TGF-β結(jié)合蛋白硬化素與一種或多種BMP結(jié)合的抗體或其片段的肽和多肽免疫原。本發(fā)明還提供了可用于生成和/或鑒定能夠抑制、阻止、或削弱(例如以統(tǒng)計學(xué)顯著方式降低)硬化素均二聚體形成的抗體或其片段的肽和多肽免疫原。本發(fā)明的抗體可用于增加骨的礦物質(zhì)含量和礦物質(zhì)密度,由此改善導(dǎo)致骨礦物質(zhì)含量流失的眾多狀況,包括例如疾病、遺傳素質(zhì)、導(dǎo)致骨使用缺乏的事故(例如由于骨折)、影響骨再吸收或殺死骨形成細胞的治療劑、和正常衰老。
還可以通過依照本領(lǐng)域技術(shù)人員知道的和本文描述的方法分析TGF-β結(jié)合蛋白的一級、二級、和三級結(jié)構(gòu)以確定更有可能在宿主動物中產(chǎn)生抗原性應(yīng)答的氨基酸序列來選擇可用于硬化素特異抗體的免疫和/或分析的多肽或肽。參閱例如Novotny,Mol.Immunol.28201-207,1991;Berzofsky,Science 229932-40,1985。建模和x射線晶體學(xué)數(shù)據(jù)也可用于預(yù)測和/或確定TGF-β結(jié)合蛋白的哪些部分或區(qū)域與TGF-β結(jié)合蛋白配體諸如BMP的哪些部分相互作用。可以設(shè)計并制備包含相互作用的那些部分或區(qū)域之內(nèi)或周圍的氨基酸序列的TGF-β結(jié)合蛋白肽免疫原。這些抗體可用于阻斷或削弱TGF-β結(jié)合蛋白與相同配體結(jié)合,還可阻斷或削弱TGF-β結(jié)合蛋白與一種或多種其它配體結(jié)合。
本發(fā)明所涵蓋的抗體或其抗原結(jié)合片段包括能夠與硬化素特異結(jié)合并競爭性抑制TGF-β多肽(諸如BMP)與硬化素結(jié)合的抗體。例如,本發(fā)明所涵蓋的抗體競爭性抑制硬化素多肽與BMP上的BMP I型受體位點或BMP II型受體結(jié)合位點結(jié)合,或者競爭性抑制硬化素與BMP上的I型和II型受體結(jié)合位點二者結(jié)合。不希望受限于理論,當(dāng)抗硬化素抗體競爭性抑制BMP多肽上的I型和/或II型結(jié)合位點與硬化素結(jié)合、由此阻斷硬化素的拮抗活性時,BMP上的受體結(jié)合位點即可用于結(jié)合I型和II型受體,由此增加骨礦化。當(dāng)該配體對的每一個配偶體都形成均二聚體時,通常存在TGF-β結(jié)合蛋白(諸如硬化素)與TGF-β多肽(諸如BMP)之間的結(jié)合相互作用。因此,除了使用硬化素特異抗體通過競爭性抑制硬化素與BMP結(jié)合來阻斷、削弱、或阻止硬化素與BMP結(jié)合以外,硬化素特異抗體(還)可用于阻斷或削弱硬化素均二聚體形成。
例如,在與人BMP-7的一個二聚體形成的復(fù)合物中分離到作為BMP拮抗劑、有能力以高親和力與BMP結(jié)合的人頭蛋白的一個二聚體(Zimmerman等,見上文),并通過多波長不規(guī)則衍射(MAD)進行了分析(Groppe等,Nature 420636-42,2002)。如上所述,這項研究揭示了頭蛋白二聚體可以有效阻斷BMP上的所有受體結(jié)合位點(兩個I型和兩個II型受體結(jié)合位點)。頭蛋白上與BMP-7接觸的氨基酸位置可用于其它TGF-β結(jié)合蛋白諸如硬化素(SOST)與BMP之間的相互作用的建模,由此有助于設(shè)計可以作為免疫原用于產(chǎn)生阻斷或削弱這種相互作用的抗體的肽。
在本發(fā)明的一個實施方案中,與SOST多肽特異結(jié)合的抗體或其抗原結(jié)合片段可競爭性抑制SOST多肽與位于骨形態(tài)發(fā)生蛋白(BMP)上的BMP I型受體結(jié)合位點和BMP II型受體結(jié)合位點中至少其一或二者的結(jié)合。SOST上這些抗體與之結(jié)合的表位可以包含或包含于位于SOST多肽N端的連續(xù)氨基酸序列(SEQ ID NO46大約第1-56位氨基酸)。該多肽還可以包含連接N端區(qū)域與核心區(qū)域的短接頭肽序列,例如SEQID NO92(人)和SEQ ID NO93(大鼠)中提供的多肽。人SOST(例如SEQ ID NO46)的較短的代表性N端肽序列包括SEQ ID NO47-51,而大鼠SOST(例如SEQ ID NO65)的較短的代表性N端肽序列包括SEQ ID NO57-60。
與SOST多肽特異結(jié)合并例如通過阻斷或抑制與BMP上與一個或多個I型和II型受體結(jié)合位點對應(yīng)的氨基酸結(jié)合而阻斷或競爭性抑制SOST多肽與BMP結(jié)合的抗體也可與包含對應(yīng)于SOST核心區(qū)域(SEQ IDNO46的大約第57-146位氨基酸)的氨基酸序列的肽特異結(jié)合。包含該核心區(qū)域的多肽還可包含在N端和C端之一或二者延伸的額外氨基酸,例如包含可用于將多肽與載體分子綴合的半胱氨酸殘基。例如,人和大鼠SOST的代表性核心多肽分別包含SEQ ID NO94和SEQ ID NO95所示氨基酸序列。這些抗體還可與較短多肽序列結(jié)合。代表性人SOST核心肽序列提供于SEQ ID NO66-69,而代表性大鼠SOST核心序列提供于SEQ ID NO70-73。
在另一個實施方案中,與SOST多肽特異結(jié)合的抗體削弱(抑制、阻止、或阻斷,例如以統(tǒng)計學(xué)顯著方式降低)SOST均二聚體形成。因為SOST與BMP之間的相互作用可能涉及SOST的均二聚體和BMP的均二聚體,所以阻止或削弱SOST均二聚體形成的抗體因而可改變骨礦物質(zhì)密度,優(yōu)選增加骨礦物質(zhì)密度。在一個實施方案中,與SOST核心區(qū)域結(jié)合的抗體可阻止均二聚體形成。這些抗體還可與包含對應(yīng)于核心區(qū)域的連續(xù)氨基酸序列(例如SEQ ID NO74、75、和98(人SOST)以及SEQ ID NO76和99(大鼠SOST))的肽結(jié)合。與位于SOST多肽C端區(qū)域的表位(SEQ ID NO46或65的大約第147-190位氨基酸)結(jié)合的抗體也可削弱均二聚體形成。例如,代表性的人和大鼠SOSTC端多肽分別包含SEQ ID NO96和SEQ ID NO97所示氨基酸序列。這些抗體還可與較短多肽序列結(jié)合。代表性的人SOST C端肽序列提供于SEQ ID NO78-81,而代表性的大鼠SOST C端序列提供于SEQ IDNO86-88。
抗體可與之特異結(jié)合的本文所公開的SOST多肽和肽可以用作免疫原。本發(fā)明的這些免疫原可用于免疫動物以產(chǎn)生體液免疫應(yīng)答,導(dǎo)致與位于BMP上的I型或II型受體結(jié)合位點或者二者(包括由SOST N端區(qū)域衍生的肽)特異結(jié)合或可阻止SOST均二聚體形成的抗體的生成。
可用作免疫原的這些SOST多肽和肽也可用于篩選包含抗體的樣品的方法中,例如純化抗體、抗血清、或細胞培養(yǎng)物上清液的樣品或是可能包含一種或多種對SOST特異的抗體的任何其它生物學(xué)樣品。這些肽還可用于從生物學(xué)樣品中鑒定和選擇一個或多個生成與SOST特異結(jié)合的抗體的B細胞的方法(例如噬斑形成測定法等等)中。然后可以將B細胞作為SOST特異抗體編碼多核苷酸的來源,通過本領(lǐng)域知道的和本文描述的重組分子生物學(xué)技術(shù)進行克隆和/或修飾。
“生物學(xué)樣品”在用于本文時在某些實施方案中指包含至少一種對SOST多肽特異的抗體的樣品,而且可以通過由受試者或生物學(xué)來源獲得血樣、活組織檢查樣本、組織外植體、器官培養(yǎng)物、或者任何其它組織或細胞制品來獲得生物學(xué)樣品。樣品還可以指其中形態(tài)學(xué)完整性或物理狀態(tài)已經(jīng)通過例如解剖、分解、溶解、分級、勻漿、生化或化學(xué)抽提、粉碎、凍干、超聲、或用于處理衍生自受試者或生物學(xué)來源的樣品的任何其它手段被破壞的組織或細胞制品。受試者或生物學(xué)來源可以是人或非人動物、原代細胞培養(yǎng)物(例如體外免疫的B細胞)、或適于培養(yǎng)的細胞系,包括但不限于包含染色體整合的或游離的重組核酸序列的遺傳工程化細胞系、永生化或可永生細胞系、體細胞雜交細胞系、已分化或可分化細胞系、經(jīng)轉(zhuǎn)化細胞系、諸如此類。
還可以通過合成總體代表SOST多肽的整個多肽序列、但每個只是與系列內(nèi)的另一種肽共有SOST氨基酸序列一部分的一系列肽來制備SOST肽免疫原。這種交疊部分將優(yōu)選至少4個氨基酸,更優(yōu)選5、6、7、8、9、或10個氨基酸。每種肽可用于免疫動物,由動物采集血清,并在測定法中進行測試以鑒定哪只動物生成削弱或阻斷SOST與TGF-β蛋白結(jié)合的抗體。然后依照本領(lǐng)域知道的和本文描述的方法由這些經(jīng)鑒定的免疫動物制備抗體。
根據(jù)本文提供的公開書可以容易的制備抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的抗體。特別有用的是與SEQ ID NO2、6、8、10、12、14、16、46、或65的TGF-β結(jié)合蛋白“特異結(jié)合”、但不與其它TGF-β結(jié)合蛋白(諸如Dan、Cerberus、SCGF、或Gremlin)結(jié)合的抗TGF-β結(jié)合蛋白抗體。在本發(fā)明的內(nèi)容中,抗體理解為包括單克隆抗體、多克隆抗體、單鏈的、嵌合的、CDR移植的免疫球蛋白、抗獨特型抗體、及其抗體片段(例如Fab、Fd、Fab′、和F(ab′)2、Fv可變區(qū)、和互補決定區(qū))。如上所述,若抗體以大于或等于107M-1、優(yōu)選大于或等于108M-1的Ka與TGF-β結(jié)合蛋白結(jié)合,且與其它TGF-β結(jié)合蛋白不結(jié)合或者以小于或等于106M-1的Ka結(jié)合,則理解為該抗體是對所述TGF-β結(jié)合蛋白特異的,或是對該特定TGF-β家族成員是特異的??贵w對其相關(guān)抗原的親和力還常常表述為解離常數(shù)KD,而且,若抗SOST抗體以小于或等于大約10-5M、更優(yōu)選小于或等于大約10-6M、仍然更優(yōu)選小于或等于大約10-7M、且仍然更優(yōu)選小于或等于大約10-8M的KD與TGF-β家族成員結(jié)合,則該抗SOST抗體與該TGF-β家族成員可特異結(jié)合。另外,本發(fā)明的抗體優(yōu)選阻斷、削弱、或抑制(例如以統(tǒng)計學(xué)顯著性降低)TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合。本領(lǐng)域普通技術(shù)人員可以容易的測定單克隆抗體或結(jié)合配偶體的親和力以及對結(jié)合的抑制(參閱Scatchard,Ann.N.Y.Acad.Sci.51660-672,1949)。還可以通過表面激元共振(SPR;BIAcore,Biosensor,皮斯卡塔韋,新澤西)來測定親和力。對于表面激元共振,可將靶分子固定在固相上,并暴露于沿流動槽流過的流動相中的配體。如果發(fā)生配體與固定化靶的結(jié)合,那么局部折射率發(fā)生變化,導(dǎo)致SPR角發(fā)生變化,這可以通過檢測折射光的強度變化來實時監(jiān)測??梢苑治鯯PR信號的變化速率以得到結(jié)合反應(yīng)的結(jié)合和解離相的表觀速率常數(shù)。這些數(shù)值的比率就是表觀平衡常數(shù)(親和力)(參閱例如Wolff等,Cancer Res.532560-65,1993)。
依照本發(fā)明的抗體可以屬于任何免疫球蛋白類別,例如IgG、IgE、IgM、IgD、或IgA,而且可以是構(gòu)成一個類別的不同同種型之任一(諸如人IgG類別的IgG1、IgG2、IgG3、和IgG4)。它可以由動物獲得或衍生,例如禽類(例如雞)和哺乳動物,包括但不限于小鼠、大鼠、倉鼠、兔、或其它嚙齒類、牛、馬、綿羊、山羊、駱駝、人、或其它靈長類??贵w可以是內(nèi)在化抗體。
可以使用本領(lǐng)域眾所周知的方法來生成對TGF-β結(jié)合蛋白(諸如SOST)特異的抗體、多克隆抗血清、或單克隆抗體。還可以生成這樣的抗體,即設(shè)計成具有期望特性的基因工程化免疫球蛋白(Ig)或Ig片段。例如,作為例示而非限制,抗體可以包括重組IgG,它是嵌合的融合蛋白,具有至少一個來自第一種哺乳動物物種的可變區(qū)(V)結(jié)構(gòu)域和至少一個來自第二種不同哺乳動物物種的恒定區(qū)結(jié)構(gòu)域。最常見的是,嵌合抗體具有鼠源可變區(qū)序列和人源恒定區(qū)序列。這樣的鼠/人嵌合免疫球蛋白可以是通過將賦予對抗原的結(jié)合特異性的由鼠抗體衍生的互補決定區(qū)(CDR)移植到由人衍生的V區(qū)框架區(qū)和由人衍生的恒定區(qū)中而“人源化”的??梢酝ㄟ^蛋白水解消化或可選地通過蛋白水解消化后繼以二硫鍵的溫和還原和烷化來生成這些分子的片段?;蛘撸€可以通過重組遺傳工程技術(shù)來生成這些片段。
某些優(yōu)選抗體是在本文所述體外測定法中抑制或阻斷TGF-β結(jié)合蛋白活性的那些抗體。通??梢允褂妹庖邫z測方法來測定抗體對TGF-β結(jié)合蛋白的結(jié)合特性,包括例如可以由本領(lǐng)域普通技術(shù)人員容易執(zhí)行的酶聯(lián)免疫吸附測定法(ELISA)、免疫沉淀、免疫印跡、逆向免疫電泳、放射免疫測定法、斑點印跡測定法、抑制或競爭測定法、諸如此類(參閱例如美國專利號4,376,110和4,486,530;Harlow等,《抗體實驗室指南》AntibodiesA Laboratory Manual,冷泉港實驗室,1988)。
免疫原可以包括表達TGF-β結(jié)合蛋白的細胞、純化或部分純化的TGF-β結(jié)合多肽、或者其變體或片段(即肽),或者由TGF-β結(jié)合蛋白衍生的肽??梢酝ㄟ^蛋白水解切割較大多肽,或者通過重組分子方法學(xué)來生成這些肽,或者可以化學(xué)合成。例如,本文提供了編碼TGF-β結(jié)合蛋白的核酸序列,由此本領(lǐng)域技術(shù)人員能夠常規(guī)制備TGF-β結(jié)合蛋白以用作免疫原??梢酝ㄟ^本文描述的和本領(lǐng)域知道的方法化學(xué)合成肽?;蛘?,可以通過蛋白水解切割TGF-β結(jié)合蛋白而生成肽,并通過本領(lǐng)域知道的方法分離單個肽,諸如聚丙烯酰胺凝膠電泳或任何數(shù)目的液相層析或其它分離方法??捎米髅庖咴碾耐ǔ?赡芫哂衼碜訲GF-β結(jié)合蛋白氨基酸序列(諸如本文所述)的至少4或5個連續(xù)氨基酸且優(yōu)選具有TGF-β結(jié)合蛋白的至少6、7、8、9、10、11、12、14、15、16、18、19、或20個連續(xù)氨基酸的氨基酸序列。某些其它優(yōu)選肽免疫原包含TGF-β結(jié)合蛋白序列的至少6個、但不超過12個或更多連續(xù)氨基酸,而其它優(yōu)選肽免疫原包含SOST多肽的至少21個但不超過50個連續(xù)氨基酸。其它優(yōu)選肽免疫原包含TGF-β結(jié)合蛋白序列的21-25個、26-30個、31-35個、36-40個、41-50個、或21與100之間(含)、100與190(含)之間任何整數(shù)數(shù)目的連續(xù)氨基酸。
正如本文所公開的,本領(lǐng)域普通技術(shù)人員可以容易的由多種溫血動物生成多克隆抗體,諸如馬、牛、多種禽類、兔、小鼠、綿羊、山羊、狒狒、或大鼠。通常,與佐劑諸如弗氏完全或不完全佐劑或是Ribi佐劑系統(tǒng)(Corixa公司,西雅圖,華盛頓)一起,通過腹膜內(nèi)、肌肉內(nèi)、眼內(nèi)、皮內(nèi)、或皮下注射,用TGF-β結(jié)合蛋白或其13-20個氨基酸或本文所述(優(yōu)選通過戊二醛的交聯(lián)與匙孔_血藍蛋白綴合)的獨特肽免疫動物。還可參閱例如Harlow等,見上文。一般而言,在第一次注射后,動物將依照可以根據(jù)抗原、佐劑(如果有的話)、和/或具體動物物種等而改變的優(yōu)選方案接受一次或多次加強免疫。可以通過對動物定期采血并在免疫測定法中制備和分析血清以測定特異抗體滴度來監(jiān)測免疫應(yīng)答,所述免疫測定法諸如ELISA或Ouchterlony擴散測定法等等。特別優(yōu)選的多克隆抗血清將在這些測定法之一(諸如ELISA)中給出可檢測信號,優(yōu)選比背景高至少3倍。一旦動物的滴度在其對所述蛋白質(zhì)的反應(yīng)性方面達到了穩(wěn)定狀態(tài),就可以通過每周采血或通過給動物放血而容易地獲得較大量的抗血清。
然后可以由這些血清純化與TGF-β結(jié)合蛋白或肽特異結(jié)合的多克隆抗體,例如通過使用蛋白A的親和層析?;蛘?,可以進行這樣的親和層析,其中將TGF-β結(jié)合蛋白或肽或是對特定經(jīng)免疫動物物種的Ig恒定區(qū)特異的抗體固定在合適的固相支持物上。
可用于本發(fā)明的抗體包括通過本文描述的和本領(lǐng)域知道的常規(guī)免疫和細胞融合流程制備的單克隆抗體。可以使用常規(guī)技術(shù)容易的生成單克隆抗體(參閱例如Kohler等,Nature 256495,1975;Coligan等編,《免疫學(xué)通用方案》(Current Protocols in Immunology),12.5.1-2.6.7,John Wiley & Sons,1991[“Coligan”];美國專利號RE 32,011、4,902,614、4,543,439、和4,411,993,將它們收入本文作為參考;還可參閱《單克隆抗體,雜交瘤生物學(xué)分析的新尺度》(Monoclonal Antibodies,HybridomasA New Dimension inBiological Analyses),Plenum出版社,Kennett、McKearn、和Bechtol編,1980;和《抗體實驗室指南》(AntibodiesA LaboratoryManual),Harlow和Lane編,冷泉港實驗室出版社,1988,也將它們收入本文作為參考;Picksley等,“針對在大腸桿菌中表達的蛋白質(zhì)的單克隆抗體的生成”(Production of monoclonal antibodiesagainst proteins expressed in E.coli),《DNA克隆2表達系統(tǒng)》(DNA Cloning 2Expression Systems),第2版,Glover等編,第93頁,牛津大學(xué)出版社,1995)。可以使用任何合適的標準技術(shù)由它們衍生抗體片段,諸如蛋白水解消化或可選地蛋白水解消化(例如使用木瓜蛋白酶或胃蛋白酶)后繼以二硫鍵的溫和還原和烷化。或者,還可以通過重組遺傳工程技術(shù)生成這些片段。
簡而言之,在一個實施方案中,如本文所述,用TGF-β結(jié)合蛋白或其一個部分或一個區(qū)域,包括一個區(qū)域內(nèi)的肽免疫受試者動物,諸如大鼠或小鼠或倉鼠??梢詫⒃摰鞍踪|(zhì)與佐劑諸如弗氏完全或不完全佐劑或Ribi佐劑混合,以增加由此產(chǎn)生的免疫應(yīng)答。初次免疫后1-3周,可以給動物再次免疫另一次加強免疫,并使用本文所述測定法測試與蛋白質(zhì)的反應(yīng)性。一旦動物在對所注射蛋白質(zhì)的反應(yīng)性方面達到了穩(wěn)定狀況,即處死動物,并收獲包含大量B細胞的器官,諸如脾和淋巴結(jié)。將收獲的脾和/或淋巴結(jié)細胞懸浮液與合適的藥物敏化骨髓瘤細胞融合,以產(chǎn)生分泌單克隆抗體的“雜交瘤”。合適的骨髓瘤系包括例如NS-0、SP20、NS-1(ATCC No.TIB 18)、和P3×63-Ag8.653(ATCC No.CRL 1580)。
可以將淋巴樣(例如脾)細胞和骨髓瘤細胞與膜融合促進劑諸如聚乙二醇或非離子去污劑一起混合數(shù)分鐘,然后以低密度涂布在支持雜交瘤細胞生長但不支持未融合的骨髓瘤細胞生長的選擇培養(yǎng)基上。融合后,可以將細胞置于裝有合適培養(yǎng)基(諸如RPMI 1640或DMEM(經(jīng)Dulbecco氏修改的Eagles氏培養(yǎng)基)(JRH Biosciences,列涅薩,堪薩斯)以及額外成分諸如胎牛血清(FBS,即購自Hyclone,洛根,猶他或JRH Biosciences))的培養(yǎng)皿中。另外,培養(yǎng)基應(yīng)當(dāng)含有選擇性容許融合的脾和骨髓瘤細胞生長的試劑,諸如HAT(次黃嘌呤、氨基蝶呤、和胸苷)(Sigma Chemical公司,圣路易斯,密蘇里)。大約7天后,可以篩選由此產(chǎn)生的融合細胞或雜交瘤,以確定與TGF-β結(jié)合蛋白(取決于使用的抗原)有反應(yīng)性、且阻斷、削弱、或抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的抗體的存在。優(yōu)選生成與硬化素或其變體特異結(jié)合的單克隆抗體的雜交瘤。
有多種測定法可用于測定與本發(fā)明蛋白質(zhì)有反應(yīng)性的抗體的存在,包括例如逆向免疫電泳、放射免疫測定法、放射免疫沉淀、酶聯(lián)免疫吸附測定法(ELISA)、斑點印跡測定法、western印跡、免疫沉淀、抑制或競爭測定法、和三明治測定法(參閱美國專利號4,376,110和4,486,530;還可參閱《抗體實驗室指南》AntibodiesALaboratory Manual,Harlow和Lane編,冷泉港實驗室出版社,1988)。通過例如有限稀釋克隆或通過軟瓊脂噬斑分離來克隆雜交瘤,并再次測定。由此,可以分離出生成與期望蛋白質(zhì)反應(yīng)的抗體的雜交瘤。
可以由雜交瘤培養(yǎng)物的上清液分離來自雜交瘤培養(yǎng)物的單克隆抗體。用于生產(chǎn)鼠單克隆抗體的候選方法是將雜交瘤細胞注射到同基因小鼠(例如經(jīng)過處理(例如降植烷引發(fā))小鼠)的腹腔內(nèi),以促進含有單克隆抗體的腹水的形成??梢酝ㄟ^多種完全確立的技術(shù)來分離和純化單克隆抗體。這些分離技術(shù)包括使用蛋白A Sepharose的親和層析、大小排阻層析、和離子交換層析(參閱例如Coligan,第2.7.1-2.7.12頁和第2.9.1-2.9.3頁;Baines等,“免疫球蛋白G(IgG)的純化”(Purification of Immunoglobulin G(IgG)),《分子生物學(xué)方法》(Methods in Molecular Biology),第10卷,第79-104頁,Humana出版公司,1992)。可以使用根據(jù)抗體的具體特性(例如重鏈或輕鏈同種型、結(jié)合特異性等)選擇的合適配體通過親和層析來純化單克隆抗體。固定在固相支持物上的合適配體的實例包括蛋白A、蛋白G、抗恒定區(qū)(輕鏈或重鏈)抗體、抗獨特型抗體、和TGF-β結(jié)合蛋白或者其片段或變體。
另外,本發(fā)明的抗TGF-β結(jié)合蛋白抗體可以是人單克隆抗體。可以通過本領(lǐng)域普通技術(shù)人員熟悉的多種技術(shù)來生成人單克隆抗體。這些方法包括但不限于埃波二氏病毒(EBV)轉(zhuǎn)化人外周血細胞(例如包含B淋巴細胞)、體外免疫人B細胞、融合來自經(jīng)過免疫的攜帶插入的人免疫球蛋白基因的轉(zhuǎn)基因小鼠的脾細胞、由人免疫球蛋白V區(qū)噬菌體文庫進行分離、或本領(lǐng)域知道的和基于本文公開書的其它流程。例如,可以由經(jīng)過改造而應(yīng)答抗原刺激生成特異人抗體的轉(zhuǎn)基因小鼠獲得人單克隆抗體。用于由轉(zhuǎn)基因小鼠獲得人抗體的方法參閱例如Green等,Nature Genet.713,1994;Lonberg等,Nature 368856,1994;Taylor等,Int.Immun.6579,1994;美國專利號5,877,397;Bruggemann等,Curr.Opin.Biotechnol.8455-58,1997;Jakobovits等,Ann.N.Y.Acad.Sci.764525-35,1995。在這種技術(shù)中,將人重鏈和輕鏈基因座的元件導(dǎo)入由包含內(nèi)源重鏈和輕鏈基因座靶向破壞的胚胎干細胞系衍生的小鼠品系(還可參閱Bruggemann等,Curr.Opin.Biotechnol.8455-58,1997)。例如,人免疫球蛋白轉(zhuǎn)基因可以是在小鼠淋巴組織中進行B細胞特異性DNA重排和超變的微型基因構(gòu)建體或酵母人工染色體上的轉(zhuǎn)基因座(transloci)??梢酝ㄟ^免疫轉(zhuǎn)基因小鼠來獲得人單克隆抗體,然后它們可能生成對該抗原特異的人抗體??梢砸勒毡疚乃龇椒▽⒔?jīng)免疫的轉(zhuǎn)基因小鼠的淋巴細胞用于生成分泌人抗體的雜交瘤。還可以由經(jīng)免疫動物的血液獲得含有人抗體的多克隆血清。
用于生成人TGF-β結(jié)合蛋白特異性單克隆抗體的另一種方法包括通過EBV轉(zhuǎn)化使人外周血細胞永生化。參閱例如美國專利號4,464,456。這樣的生成與TGF-β結(jié)合蛋白(或其變體或片段)特異結(jié)合的單克隆抗體的永生化B細胞系(或類淋巴母細胞細胞系)可以通過本文提供的免疫檢測方法進行鑒定,例如ELISA,然后通過標準克隆技術(shù)進行分離。生成抗TGF-β結(jié)合蛋白抗體的類淋巴母細胞細胞系的穩(wěn)定性可以依照本領(lǐng)域知道的方法通過將經(jīng)轉(zhuǎn)化細胞系與鼠骨髓瘤融合生成鼠-人雜交瘤細胞系而得到改進(參閱例如Glasky等,Hybridoma 8377-89,1989)。用于生成人單克隆抗體的還有一種方法是體外免疫,它包括用抗原引發(fā)人脾B細胞,隨后將經(jīng)引發(fā)的B細胞與異源雜合融合配偶體融合。參閱例如Boerner等,J.Immunol.14786-95,1991。
在某些實施方案中,依照本領(lǐng)域知道的(WO 92/02551;美國專利號5,627,052;Babcook等,Proc.Natl.Acad.Sci.USA 937843-48,1996)和本文描述的分子生物學(xué)技術(shù),選擇生成抗SOST抗體的B細胞并由該B細胞克隆輕鏈和重鏈可變區(qū)。優(yōu)選通過選擇生成與SOST特異結(jié)合的抗體的細胞而由脾、淋巴結(jié)、或外周血樣品分離來自經(jīng)免疫動物的B細胞。還可以由人分離B細胞,例如由外周血樣品。用于檢測生成具有期望特異性的抗體的單個B細胞的方法在本領(lǐng)域是眾所周知的,例如通過噬斑形成、熒光激活的細胞分揀術(shù)、體外刺激及隨后檢測特異性抗體、諸如此類。用于選擇生成特異抗體的B細胞的方法包括例如在含有SOST或其肽片段的軟瓊脂中制備B細胞的單細胞懸浮液。由B細胞生成的特異抗體與抗原的結(jié)合導(dǎo)致復(fù)合物的形成,它可以免疫沉淀物形式觀察到。選擇出生成特異抗體的B細胞后,可以依照本領(lǐng)域知道的和本文描述的方法通過分離并擴增DNA或mRNA來克隆該特異抗體基因。
對于特定用途,可能需要抗TGF-β結(jié)合蛋白抗體的片段??贵w片段F(ab′)2、Fab、Fab′、Fv、Fc、Fd保留了完整抗體的抗原結(jié)合位點,因而與同一表位結(jié)合。可以依照常規(guī)方法,通過例如抗體的蛋白水解例如胃蛋白酶或木瓜蛋白酶消化完整抗體,來獲得由抗體衍生的這些抗原結(jié)合片段。例如,可以通過用胃蛋白酶酶促切割抗體以提供稱為F(ab′)2的5S片段而生成抗體片段。還可以用硫醇還原劑進一步切割這個片段以生成3.5S Fab′單價片段??蛇x的是,可以使用針對由切割二硫鍵產(chǎn)生的巰基的封閉基團進行切割反應(yīng)?;蛘撸褂媚竟系鞍酌傅拿复偾懈钪苯由蓛蓚€單價Fab片段和一個Fc片段。這些方法參閱例如Goldenberg,美國專利號4,331,647;Nisonoff等,Arch.Biochem.Biophys.89230,1960;Porter,Biochem.J.73119,1959;Edelman等,《酶學(xué)方法》(Methods in Enzymology)1422,Academic出版社,1967;和Coligan,第2.8.1-2.8.10頁和第2.10.-2.10.4頁。可以采用用于切割抗體的其它方法,諸如分離重鏈以形成單價輕鏈-重鏈片段(Fd),進一步切割片段,或者其它酶促、化學(xué)、或基因工程技術(shù),只要片段與完整抗體所識別的抗原結(jié)合即可。
抗體片段還可以是像抗體那樣與特定抗原結(jié)合而形成復(fù)合物的任何合成的或基因工程化蛋白質(zhì)。例如,抗體片段包括由輕鏈可變區(qū)組成的分離片段、由重鏈和輕鏈可變區(qū)組成的“Fv”片段、其中輕鏈和重鏈可變區(qū)以肽接頭相連的重組單鏈多肽分子(scFv蛋白)、和由模擬高變區(qū)的氨基酸殘基組成的最小識別單位。本發(fā)明的抗體優(yōu)選包含至少一個可變區(qū)結(jié)構(gòu)域??勺儏^(qū)結(jié)構(gòu)域可以是任何大小或氨基酸組成,而且通常包含至少一個負責(zé)抗原結(jié)合且與一個或多個框架序列相鄰或處于同一讀碼框的高變氨基酸序列。在一般術(shù)語中,可變區(qū)(V)結(jié)構(gòu)域可以是免疫球蛋白重鏈(VH)和/或輕鏈(VL)可變結(jié)構(gòu)域的任何合適排列。因此,例如,V區(qū)結(jié)構(gòu)域可以是單體,而且可以是能夠以可接受的親和力與抗原獨立結(jié)合的VH或VL結(jié)構(gòu)域?;蛘?,V區(qū)結(jié)構(gòu)域可以是二聚體,包括VH-VH、VH-VL、或VL-VL二聚體。優(yōu)選的是,V區(qū)二聚體包含非共價相連的至少一個VH鏈和至少一個VL鏈(下文稱為Fv)。如果需要,兩條鏈可以共價偶聯(lián)而形成單鏈(scFv),這種連接或是直接的,例如經(jīng)由兩個可變結(jié)構(gòu)域之間的二硫鍵,或是通過接頭,例如肽接頭。
可變區(qū)結(jié)構(gòu)域可以是任何天然存在的可變結(jié)構(gòu)域或其加工形式。加工形式指使用重組DNA工程技術(shù)產(chǎn)生的可變區(qū)結(jié)構(gòu)域。這些加工形式包括例如通過特定抗體氨基酸序列中的插入、缺失、或改變而由特定抗體可變區(qū)產(chǎn)生的那些形式。具體實例包括包含來自第一種抗體的至少一個CDR和可選地一個或多個框架氨基酸、而剩余可變區(qū)結(jié)構(gòu)域來自第二種抗體的工程化可變區(qū)結(jié)構(gòu)域。
可變區(qū)結(jié)構(gòu)域可以在C端氨基酸共價連接至少一個其它抗體結(jié)構(gòu)域或其片段。因此,例如,當(dāng)可變區(qū)結(jié)構(gòu)域中存在VH結(jié)構(gòu)域時,它可以與免疫球蛋白CH1結(jié)構(gòu)域或其片段相連。類似的,VL結(jié)構(gòu)域可以與CK結(jié)構(gòu)域或其片段相連。這樣的話,例如,抗體可以是Fab片段,其中抗原結(jié)合結(jié)構(gòu)域包含其C端分別與CH1和CK結(jié)構(gòu)域共價相連的關(guān)聯(lián)VH和VL結(jié)構(gòu)域。CH1結(jié)構(gòu)域可以用氨基酸進一步延伸,例如為了提供在Fab′片段中存在的鉸鏈區(qū)或鉸鏈區(qū)結(jié)構(gòu)域的一部分,或是為了提供其它結(jié)構(gòu)域,諸如抗體CH2和CH3結(jié)構(gòu)域。
抗體片段的另一種形式是包含單個互補決定區(qū)(CDR)的肽??梢酝ㄟ^構(gòu)建編碼目的抗體的CDR的多核苷酸來獲得CDR肽(“最小識別單位”)。例如,通過使用聚合酶鏈式反應(yīng),以抗體生成細胞的mRNA作為模板合成可變區(qū),由此制備這些多核苷酸(參閱例如Larrick等,MethodsA Companion to Methods in Enzymology 2106,1991;Courtenay-Luck,“單克隆抗體的基因操作”(Genetic Manipulationof Monoclonal Antibodies),《單克隆抗體生產(chǎn)、改造、和臨床應(yīng)用》(Monoclonal AntibodiesProduction,Engineering andClinical Application),Ritter等編,第166頁,劍橋大學(xué)出版社,1995年;和Ward等,“抗體的基因操作和表達”(Genetic Manipulationand Expression of Antibodies),《單克隆抗體原理和應(yīng)用》(Monoclonal AntibodiesPrinciples and Applications),Birch等編,第137頁,Wiley-Liss出版社,1995年)。
或者,抗體可以是通過使用重組DNA技術(shù)獲得的重組或工程化抗體,該技術(shù)涉及編碼抗體可變區(qū)和/或恒定區(qū)的DNA的操作和再表達。這些DNA是已知的和/或易于由DNA文庫獲得的,包括例如噬菌體-抗體文庫(參閱Chiswell和McCafferty,Tibtech.1080-84,1992),或是需要的話,可以人工合成。標準分子生物學(xué)和/或化學(xué)流程可用于DNA的測序和操作,例如,用于導(dǎo)入密碼子以產(chǎn)生半胱氨酸殘基,或是用于根據(jù)需要修飾、添加、或缺失其它氨基酸或結(jié)構(gòu)域。
還可以依照本發(fā)明生成對TGF-β結(jié)合蛋白特異的嵌合抗體,包括人源化抗體。嵌合抗體具有至少一個衍生自第一種哺乳動物物種的恒定區(qū)結(jié)構(gòu)域和至少一個衍生自第二種不同哺乳動物物種的可變區(qū)結(jié)構(gòu)域(參閱例如Morrison等,Proc.Natl.Acad.Sci.USA,816851-55,1984)。在優(yōu)選實施方案中,可以通過將編碼至少一個衍生自非人單克隆抗體的可變區(qū)結(jié)構(gòu)域(諸如衍生自小鼠、大鼠、或倉鼠單克隆抗體的可變區(qū))的多核苷酸序列克隆到包含編碼至少一個人恒定區(qū)的核苷酸序列的載體中來構(gòu)建嵌合抗體(參閱例如Shin等,MethodsEnzymol.178459-76,1989;Walls等,Nucleic Acids Res.212921-29,1993)。例如,可以將編碼鼠單克隆抗體輕鏈可變區(qū)的多核苷酸序列插入包含編碼人κ輕鏈恒定區(qū)序列的核苷酸序列的載體中。在分開的載體中,可以在與編碼人IgG恒定區(qū)(例如人IgG1恒定區(qū))的序列相同的讀碼框中克隆編碼單克隆抗體重鏈可變區(qū)的多核苷酸序列??梢愿鶕?jù)對特定抗體所期望的效應(yīng)物功能(例如補體固定、與特定Fc受體結(jié)合、等)來選擇特定的人恒定區(qū)。優(yōu)選的是,構(gòu)建的載體將轉(zhuǎn)染到真核細胞中用于穩(wěn)定表達嵌合抗體。本領(lǐng)域知道的用于生成嵌合抗體的另一種方法是同源重組(例如美國專利號5,482,856)。
可以對非人/人嵌合抗體進行進一步的基因工程改造以生成“人源化”抗體。這樣的人源化抗體可以包含由非人哺乳動物物種的免疫球蛋白衍生的多個CDR、至少一個人可變框架區(qū)、和至少一個人免疫球蛋白恒定區(qū)??捎糜谠O(shè)計人源化抗體的策略可包括例如(作為例示而非限制)鑒定與嵌合抗體中的非人框架區(qū)最同源的人可變框架區(qū)。不希望受限于理論,這樣的策略可以增加人源化抗體保持對TGF-β結(jié)合蛋白的特異結(jié)合親和力的可能性,在有些優(yōu)選實施方案中,可以是對TGF-β結(jié)合蛋白或其變體或片段本質(zhì)上相同的親和力,而在某些其它優(yōu)選實施方案中,可以是對TGF-β結(jié)合蛋白更高的親和力。參閱例如Jones等,Nature 321522-25,1986;Riechmann等,Nature 332323-27,1988。因此,設(shè)計這樣的人源化抗體可能包括測定非人可變區(qū)的CDR環(huán)構(gòu)象和結(jié)構(gòu)決定簇,例如通過計算機建模,然后將CDR環(huán)和決定簇與已知的人CDR環(huán)結(jié)構(gòu)和決定簇進行比較。參閱例如Padlan等,F(xiàn)ASEB 9133,-39,1995;Chothia等,Nature 342377-383,1989。計算機建模還可用于比較通過與非人可變區(qū)的序列同源性選擇的人結(jié)構(gòu)模板。參閱例如Bajorath等,Ther.Immunol.295-103,1995;EP-0578515-A3。若非人CDR的人源化導(dǎo)致結(jié)合親和力降低,則計算機建??赡苡兄阼b定能夠通過定點或其它誘變技術(shù)改變以部分、完全、或超最佳(即提高到高于未人源化抗體的水平)恢復(fù)親和力的特定氨基酸殘基。本領(lǐng)域普通技術(shù)人員熟悉這些技術(shù),而且容易的領(lǐng)會對這些設(shè)計策略的眾多變化和修改。
用于制備人源化抗體的這樣一種方法稱為飾面(veneering)。在用于本文時,術(shù)語“飾面FR”和“重組飾面FR”指用人FR殘基選擇性取代例如嚙齒類重鏈或輕鏈V區(qū)的FR殘基,以提供包含本質(zhì)上保留了所有天然FR多肽折疊結(jié)構(gòu)的抗原結(jié)合位點的異種分子。飾面技術(shù)是基于這樣的理解,即抗原結(jié)合位點的配體結(jié)合特征主要由重鏈和輕鏈CDR對在抗原結(jié)合表面內(nèi)的結(jié)構(gòu)和相對定位決定。Davies等,Ann.Rev.Biochem.59439-73,1990。因此,只有在其中CDR結(jié)構(gòu)、它們彼此的相互作用、和它們與剩余V區(qū)結(jié)構(gòu)域的相互作用得到小心維持的情況下,才可以保持人源化抗體的抗原結(jié)合特異性。通過使用飾面技術(shù),可以用人殘基選擇性取代免疫系統(tǒng)易于遭遇的外部(例如溶劑可到達的)FR殘基,以提供具有微弱免疫原性或是基本上無免疫原性的經(jīng)飾面表面的雜合分子。
飾面方法利用了由Kabat等(《免疫學(xué)關(guān)心的蛋白質(zhì)的序列》(Sequences of Proteins of Immunological Interest),第4版,美國健康和公共事業(yè)部,美國政府印刷廠,1987)編制的人抗體可變結(jié)構(gòu)域、Kabat數(shù)據(jù)庫更新、和其它可得到的美國和外國數(shù)據(jù)庫(核酸和蛋白質(zhì)二者)中可以獲得的序列數(shù)據(jù)??梢杂梢阎娜撕褪罂贵w片段的三維結(jié)構(gòu)推導(dǎo)V區(qū)氨基酸的溶劑可及性。首先,將目的抗體分子可變結(jié)構(gòu)域的FR與由上述來源獲得的相應(yīng)的人可變結(jié)構(gòu)域FR序列進行比較。然后一個殘基一個殘基的比較最同源的人V區(qū)與相應(yīng)的鼠氨基酸。使用本領(lǐng)域眾所周知的重組技術(shù),用人模塊中存在的殘基取代鼠FR中與人對應(yīng)物不同的殘基。只對至少部分暴露(溶劑可及)的部分進行殘基轉(zhuǎn)換,而且要注意可能對V區(qū)結(jié)構(gòu)域三級結(jié)構(gòu)有顯著影響的氨基酸替代,諸如脯氨酸、甘氨酸和帶電荷氨基酸。
通過這種方式,由此產(chǎn)生的“經(jīng)飾面”抗原結(jié)合位點可被設(shè)計成保持嚙齒類CDR殘基、與CDR實質(zhì)相鄰的殘基、經(jīng)鑒定埋藏或大部埋藏(溶劑不可及)的殘基、被認為參與重鏈和輕鏈結(jié)構(gòu)域之間非共價(即靜電和疏水)接觸的殘基、和被認為影響CDR環(huán)“規(guī)范的”三級結(jié)構(gòu)的FR保守結(jié)構(gòu)區(qū)的殘基。然后將這些設(shè)計標準用于制備將抗原結(jié)合位點的重鏈和輕鏈二者的CDR聯(lián)合到人中出現(xiàn)的FR中的重組核苷酸序列,它可用于轉(zhuǎn)染哺乳動物細胞以表達展示嚙齒類抗體分子抗原特異性的重組人抗體。
用于選擇與TGF-β結(jié)合蛋白或其變體或片段特異結(jié)合的抗體的另一種方法是噬菌體展示。參閱例如Winter等,Annu.Rev.Immunol.12433-55,1994;Burton等,Adv.Immunol.57191-280,1994。可以在能夠進行篩選以選擇與TGF-β結(jié)合蛋白或其變體或片段特異結(jié)合的Ig片段(Fab、Fv、sFv、或其多聚體)的噬菌體載體中構(gòu)建人或鼠免疫球蛋白可變區(qū)基因組合文庫。參閱例如美國專利號5,223,409;William D.Huse等,“在噬菌體λ中生成免疫球蛋白集合的大型組合文庫”(Generation of a Large Combinational Libraryof the Immunoglobulin Repertoire in Phage Lambda),Science 2461275-1281,1989年12月;還可參閱L.Sastry等,“在大腸桿菌中克隆免疫學(xué)集合以生成單克隆催化性抗體重鏈可變區(qū)特異cDNA文庫的構(gòu)建”(Cloning of the Immunological Repertoire inEscherichia coli for Generation of Monoclonal CatalyticAntibodiesConstruction of a Heavy Chain VariableRegion-Specific cDNA Libra ry),Proc.Natl.Acad.Sci.USA 865728-5732,1989年8月;還可參閱Michelle Alting-Mees等,“單克隆抗體表達文庫雜交瘤的快速候選方法”(Monoclonal AntibodyExpression LibrariesA Rapid Alternative to Hybridomas),Strategies in Molecular Biology 31-9,1990年1月;Kang等,Proc.Natl.Acad.Sci.USA 884363-66,1991;Hoogenboom等,J.Mol.Biol.227381-388,1992;Schlebusch等,Hybridoma 1647-52,1997及其中引用的參考文獻??梢杂蒘tratagene(拉霍亞,加利福尼亞)獲得的一種商品化系統(tǒng)能夠通過重組技術(shù)生成抗體。簡而言之,由B細胞群分離mRNA,并用于在λImmunoZap(H)和λImmunoZap(L)載體中生成重鏈和輕鏈免疫球蛋白cDNA表達文庫。隨后將陽性噬斑轉(zhuǎn)變成能夠由大腸桿菌高水平表達單克隆抗體片段的非溶胞質(zhì)粒。或者,可以將包含多種編碼Ig可變區(qū)片段的多核苷酸序列的文庫插入絲狀噬菌體的基因組,諸如M13或其變體,其讀碼框與編碼噬菌體外殼蛋白的序列相同。融合蛋白可以是外殼蛋白與輕鏈可變區(qū)結(jié)構(gòu)域和/或與重鏈可變區(qū)結(jié)構(gòu)域的融合體。依照某些實施方案,還可在噬菌體顆粒上展示免疫球蛋白Fab片段(參閱例如美國專利號5,698,426)。可以單個篩選這些載體,或是共表達以形成Fab片段或抗體(參閱Huse等,見上文;還可參閱Sastry等,見上文)。
類似的,也可以采用常規(guī)酶促消化或摻入編碼特異結(jié)合抗體的基因的可變區(qū)的重組DNA技術(shù)來構(gòu)建抗體的部分或片段,諸如Fab和Fv片段。在一個實施方案中,使用針對可變區(qū)的核苷酸引物由生成目的單克隆抗體的雜交瘤擴增編碼可變區(qū)的基因。這些引物可以由本領(lǐng)域普通技術(shù)人員合成,或是由商業(yè)途徑購買。Stratagene(拉霍亞,加利福尼亞)出售針對小鼠和人可變區(qū)的引物,包括例如針對VHa、VHb、VHc、VHd、CHl、VL、和CL區(qū)的引物。這些引物可用于擴增重鏈或輕鏈可變區(qū),然后可以分別將它們插入載體,諸如ImmunoZAPTMH或ImmunoZAPTML(Stratagene)。然后可以將這些載體導(dǎo)入大腸桿菌、酵母、或基于哺乳動物的系統(tǒng)以進行表達??梢允褂眠@些技術(shù)生成大量的包含VH和VL結(jié)構(gòu)域融合體的單鏈蛋白質(zhì)(參閱Bird等,Science242423-426,1988)。另外,這些技術(shù)可用于將“鼠源”抗體變成“人”抗體,而不改變抗體的結(jié)合特異性。
在本發(fā)明的某些特定實施方案中,組合噬菌體文庫也可用于非人可變區(qū)的人源化。參閱例如Rosok等,J.Biol.Chem.27122611-18,1996;Rader等,Proc.Natl.Acad.Sci.USA 958910-15,1998??梢酝ㄟ^本領(lǐng)域知道的和本文描述的免疫檢測方法篩選噬菌體文庫,以選擇目的Ig可變區(qū)片段,并通過標準技術(shù)測定如此選擇的噬菌體中插入的免疫球蛋白基因的DNA序列。參閱Sambrook等,《分子克隆實驗室指南》(Molecular CloningA Laboratory Manual),冷泉港出版社,2001。然后可以將選擇的Ig編碼序列克隆到另一種合適載體中以表達Ig片段,或者可選地克隆到包含Ig恒定區(qū)的載體中以表達完整免疫球蛋白鏈。
在某些其它實施方案中,本發(fā)明涵蓋多聚體抗體片段形式的SOST特異性抗體。有用的方法學(xué)通常參閱例如Hayden等,Curr Opin.Immunol.9201-12,1997;Coloma等,Nat.Biotechnol.15159-63,1997。例如,可以通過噬菌體技術(shù)生成多聚體抗體片段,以形成微型抗體(miniantibodies)(美國專利號5,910,573)或diabodies(Holliger等,Cancer Immunol.Immuno ther.45128-130,1997)。
在本發(fā)明的某些實施方案中,對SOST特異的抗體可以是作為胞內(nèi)蛋白表達的抗體。這些胞內(nèi)抗體也可稱為intrabodies,而且包含F(xiàn)ab片段,或優(yōu)選包含scFv片段(參閱例如Lecerf等,Proc.Natl.Acad.Sci.USA 984764-49,2001)??梢孕揎桟DR區(qū)側(cè)翼的框架區(qū)以改進intrabody在胞內(nèi)還原環(huán)境中的表達水平和溶解度(參閱例如Worn等,J.Biol.Chem.2752795-803,2000)??梢詫ntrabody導(dǎo)向特定細胞定位或細胞器,例如通過構(gòu)建包含編碼introbody可變區(qū)的多核苷酸序列的載體,該多核苷酸序列可以與編碼細胞內(nèi)特定靶抗原的多核苷酸序列可操作融合(參閱例如Graus-Porta等,Mol.CellBiol.151182-91,1995;Lener等,Eur.J.Biochem.2671196-205,2000)??梢酝ㄟ^技術(shù)人員可用的多種技術(shù)將intrabody導(dǎo)入細胞,包括經(jīng)由基因治療載體、或脂質(zhì)混合物(例如ProvectinTM,Imgenex公司,圣迭哥,加利福尼亞)、或依照光化學(xué)內(nèi)在化方法。
將氨基酸突變導(dǎo)入對TGF-β結(jié)合蛋白特異的免疫球蛋白分子可用于提高對TGF-β結(jié)合蛋白的特異性或親和力,或是改變效應(yīng)物功能??梢酝ㄟ^針對特定殘基的定點誘變來生成對TGF-β結(jié)合蛋白具有更高親和力的免疫球蛋白。計算機輔助的三維分子建模可用于鑒定有待改變以改進對TGF-β結(jié)合蛋白的親和力的氨基酸殘基。參閱例如Mountain等,Biotechnol.Genet.Eng.Rev.101-142,1992?;蛘撸梢栽贛13噬菌體中構(gòu)建CDR組合文庫,并篩選具有改進親和力的免疫球蛋白片段。參閱例如Glaser等,J.Immunol.1493903-3913,1992;Barbas等,Proc.Natl.Acad.Sci.USA 913809-13,1994;美國專利號5,792,456。
還可以通過定點誘變來改變效應(yīng)物功能。參閱例如Duncan等,Nature 332563-64,1988;Morgan等,Immunology 86319-24,1995;Eghtedarzedeh-Kondri等,Biotechniques 23830-34,1997。例如,免疫球蛋白Fc部分上糖基化位點的突變可能改變免疫球蛋白固定補體的能力。參閱例如Wright等,Trends Biotechnol.1526-32,1997。恒定區(qū)結(jié)構(gòu)域中的其它突變可能改變免疫球蛋白固定補體或影響抗體依賴性細胞毒性的能力。參閱例如Duncan等,Nature 332563-64,1988;Morgan等,Immunology 86319-24,1995;Sensel等,Mol.Immunol.341019-29,1997。
依照某些實施方案,可以將本文所述任何Ig分子的非人、人、或人源化重鏈和輕鏈可變區(qū)構(gòu)建成單鏈Fv(scFv)多肽片段(單鏈抗體)。參閱例如Bird等,Science 242423-426,1988;Huston等,Proc.Natl.Acad Sci.USA 855879-5883,1988??梢酝ㄟ^將編碼scFv多肽的多核苷酸序列以相同讀碼框與編碼任何已知效應(yīng)物蛋白的至少一種多核苷酸序列相連來生成多功能scFv融合蛋白。這些方法在本領(lǐng)域是已知的,參閱例如EP-B1-0318554、美國專利號5,132,405、美國專利號5,091,513、和美國專利號5,476,786。例如,效應(yīng)物蛋白可以包括免疫球蛋白恒定區(qū)序列。參閱例如Hollenbaugh等,J.Immunol.Methods 1881-7,1995。效應(yīng)物蛋白的其它實例是酶。作為非限制性實例,這樣的酶可以提供治療目的的生物學(xué)活性(參閱例如Siemers等,Bioconjug.Chem.8510-19,1997),或者可以提供診斷用途的可檢測活性,諸如辣根過氧化物酶催化的多種眾所周知的底物轉(zhuǎn)變成可檢測產(chǎn)物。scFv融合蛋白的還有一些其它實例包括Ig-毒素融合體,或免疫毒素,其中scFv多肽與毒素相連。
在某些實施方案中,可以將scFv或本文所述任何抗體片段與容許檢測融合蛋白與抗原(例如TGF-β結(jié)合蛋白)之間的特異結(jié)合的肽或多肽結(jié)構(gòu)域融合。例如,融合多肽結(jié)構(gòu)域可以是用于通過本領(lǐng)域技術(shù)人員熟悉的多種技術(shù)來檢測scFv融合蛋白與TGF-β結(jié)合蛋白的結(jié)合的親和標簽多肽。肽標簽的實例包括親和素、鏈霉親和素、或His(例如多組氨酸)。檢測技術(shù)還可以包括例如親和素或鏈霉親和素融合蛋白與生物素或生物素模擬序列的結(jié)合(參閱例如Luo等,J.Biotechnol.65225,1998及其中引用的參考文獻)、用可檢測模塊(例如標記模塊)直接共價修飾融合蛋白、融合蛋白與特定的經(jīng)標記報道分子的非共價結(jié)合、包含具有酶活性的部分的融合蛋白對可檢測底物的酶促修飾、或融合蛋白在固相支持物上的(共價或非共價)固定??捎糜跇?gòu)建scFv融合蛋白的其它親和多肽可以包括鏈霉親和素融合蛋白(參閱例如WO 89/03422、美國專利號5,489,528、美國專利號5,672,691、WO 93/24631、美國專利號5,168,049、美國專利號5,272,254);親和素融合蛋白(參閱例如EP 511,747);酶,諸如谷胱甘肽-S-轉(zhuǎn)移酶;和金黃色葡萄球菌(Staphylococcus aureus)蛋白A多肽。
可以依照眾所周知的用于核酸切割、連接、轉(zhuǎn)化、和轉(zhuǎn)染的多種流程,使用多種表達載體來擴增并表達編碼與本文所述TGF-β結(jié)合蛋白特異結(jié)合的抗體或其片段的多核苷酸。由此,在某些實施方案中,優(yōu)選在原核宿主中表達抗體片段,諸如埃希氏大腸桿菌(Escherichiacoli)(參閱例如Pluckthun等,Methods Enzymol.178497-515,1989)。在某些其它實施方案中,優(yōu)選在真核宿主細胞中表達抗體或其片段,包括酵母(例如釀酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、和巴斯德畢赤酵母(Pichia pastoris))、動物細胞(包括哺乳動物細胞)、或植物細胞。合適的動物細胞的實例包括但不限于骨髓瘤(諸如小鼠NSO系)、COS、CHO或雜交瘤細胞。植物細胞的實例包括煙草、玉米、大豆和稻細胞。
一旦得到了合適的抗體,即可以通過本領(lǐng)域普通技術(shù)人員眾所周知的許多技術(shù)進行分離或純化(參閱《抗體實驗室指南》AntibodiesA Laboratory Manual,Har1ow和Lane編,冷泉港實驗室出版社,1988)。合適的技術(shù)包括肽或蛋白質(zhì)親和柱(包括使用附著于柱基質(zhì)上的抗恒定區(qū)抗體)、HPLC或RP-HPLC、蛋白A或蛋白G柱上的純化、或這些技術(shù)的任意組合。
c.突變的TGF-β結(jié)合蛋白正如此處和下文實施例(例如實施例8和9)中所述,與天然TGF-β結(jié)合蛋白競爭阻斷特定TGF-β家族成員活性的能力的改變形式的TGF-β結(jié)合蛋白應(yīng)當(dāng)會導(dǎo)致骨密度增加。由此,與TGF-β家族成員結(jié)合、但不抑制TGF-β家族成員功能的TGF-β結(jié)合蛋白突變體將符合這下標準。突變體必須有效競爭TGF-β結(jié)合蛋白的內(nèi)源抑制性功能。
d.蛋白質(zhì)的生成本文所述多肽包括TGF結(jié)合蛋白硬化素及其變體和與硬化素特異結(jié)合的抗體或其片段。編碼這些多肽的多核苷酸包括與所述基因和分離的核酸分子本質(zhì)上相似的基因衍生物,以及(如果合適的話)由這些基因及其衍生物編碼的蛋白質(zhì)(包括肽和多肽)。在用于本文時,若(a)核苷酸序列衍生自上文所述基因和核酸分子的編碼區(qū),而且包括例如上文所述序列的一部分或序列的等位基因變異,或者編碼抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的分子;(b)核苷酸序列能夠在中等、高、或很高嚴謹度下與本發(fā)明的核苷酸序列雜交(參閱Sambrook等,《分子克隆實驗室指南》Molecular CloningALaboratory Manual,第2版,冷泉港實驗室出版社,紐約,1989);和/或(c)DNA序列由于(a)或(b)中所定義的DNA序列的遺傳密碼而是簡并的,則認為該核苷酸序列是“本質(zhì)上相似的”。另外,本文公開的核酸分子包括互補和非互補序列二者,條件是所述序列在其它方面達到本文所列標準。在本發(fā)明的內(nèi)容中,高嚴謹度指標準雜交條件(例如5×SSPE、0.5%SDS,于65℃,或相當(dāng)?shù)臈l件)。
使用例如P/C Gene or Intelligenetics Suite(Intelligenetics,芒廷維尤,加利福尼亞)的疏水性繪圖功能,或者依照Kyte和Doolittle(J.Mol.Biol.157105-132,1982)描述的方法,可以由主要翻譯產(chǎn)物預(yù)測由本文所述核酸分子編碼的蛋白質(zhì)的結(jié)構(gòu)。
可以以酸性或堿性鹽或是中性形式制備本發(fā)明的蛋白質(zhì)。另外,可以通過氧化或還原修飾個別氨基酸殘基。此外,可以對氨基酸或核酸序列進行多種替代、缺失、或添加,其凈效應(yīng)是保持或者進一步增強或降低突變型或野生型蛋白質(zhì)的生物學(xué)活性。此外,例如由于遺傳密碼的簡并性,編碼相同氨基酸序列的核苷酸序列中可能存在可觀的變異。
本文公開的蛋白質(zhì)的其它衍生物包括該蛋白質(zhì)與其它蛋白質(zhì)或多肽的綴合物。這可以通過例如合成N端或C端融合蛋白來實現(xiàn),它們的添加有助于蛋白質(zhì)的純化或鑒定(參閱美國專利號4,851,341;還可參閱Hopp等,Bio/Technology 61204,1988)?;蛘撸梢詷?gòu)建融合蛋白,諸如Flag_/TGF-β結(jié)合蛋白,以幫助蛋白質(zhì)的鑒定、表達、和分析。
可以使用本文所述多種技術(shù)來構(gòu)建本發(fā)明的蛋白質(zhì)。另外,可以通過合成包含突變序列且側(cè)翼為限制位點從而能夠連接天然序列片段的寡核苷酸而在特定位置導(dǎo)入突變。連接后,由此產(chǎn)生的重建序列編碼具有期望氨基酸插入、替代、或缺失的衍生物。
或者,可以采用由寡核苷酸介導(dǎo)的位點特異(或區(qū)段特異)誘變流程來提供特定密碼子根據(jù)需要的替代、缺失、或插入遭到改變的改變后基因或核酸分子。上文所列用于產(chǎn)生改變的例示性方法描述于Walder等,Gene 42133,1986;Bauer等,Gene 3773,1985;Craik,BioTechniques,1985年1月,12-19;Smith等,《基因工程原理和方法》Genetic EngineeringPrinciples and Methods,Plenum出版社,1981;以及Sambrook等,見上文。還可以利用與所需缺失鄰近的便利限制性內(nèi)切酶位點來構(gòu)建蛋白質(zhì)的缺失或截短衍生物(例如可溶性胞外部分)。限制性消化后,可以補平粘端并重連DNA。上文所列用于產(chǎn)生改變的例示性方法公開于Sambrook等,《分子克隆實驗室指南》Molecular CloningA Laboratory Manual,第2版,冷泉港實驗室出版社,1989。
在本發(fā)明核酸分子中進行的突變優(yōu)選保持編碼序列的讀碼框。此外,突變將優(yōu)選不產(chǎn)生在轉(zhuǎn)錄后能夠雜交而生成二級mRNA結(jié)構(gòu)諸如將對mRNA翻譯產(chǎn)生不利影響的環(huán)或發(fā)夾的互補區(qū)。盡管可以預(yù)定突變位點,然而本質(zhì)上不必預(yù)定突變的性質(zhì)。例如,為了選擇指定位點處突變體的最佳特征,可以在目標密碼子處進行隨機誘變,并對表達的突變體篩選生物學(xué)活性的獲得或喪失或保持。或者,可以通過合成包含突變序列且其側(cè)翼為限制位點從而能夠連接天然序列片段的寡核苷酸而將突變導(dǎo)入特定位置。連接后,由此產(chǎn)生的重建序列編碼具有期望氨基酸插入、替代、或缺失的衍生物。
還可以采用諸如PCR誘變、化學(xué)誘變(Drinkwater和Klinedinst,PNAS833402-3406,1986)、通過強迫核苷酸錯摻(例如Liao和Wise,Gene 88107-111,1990)、或使用隨機誘變寡核苷酸(Horwitz等,Genomee 3112-117,1989)等技術(shù)來構(gòu)建編碼本發(fā)明蛋白質(zhì)的核酸分子。
本發(fā)明還提供了通過培養(yǎng)包含能夠表達上文所述基因的載體的宿主細胞而進行的對上文所述基因和核酸分子的操作和表達。這些載體或載體構(gòu)建體包括合成的或cDNA衍生的編碼期望蛋白質(zhì)的核酸分子,其可操作地連接合適的轉(zhuǎn)錄或翻譯調(diào)控元件。合適的調(diào)控元件可以衍生自多種來源,包括細菌、真菌、病毒、哺乳動物、昆蟲、或植物基因。合適調(diào)控元件的選擇取決于選擇的宿主細胞,而且可以由本領(lǐng)域普通技術(shù)人員容易的完成。調(diào)控元件的實例包括轉(zhuǎn)錄啟動子和增強子或RNA聚合酶結(jié)合序列、轉(zhuǎn)錄終止子、和核糖體結(jié)合序列,包括翻譯起始信號。
可以通過非常多種原核和真核宿主細胞容易的表達編碼本文所述任何蛋白質(zhì)的核酸分子,包括細菌、哺乳動物、酵母或其它真菌、病毒、昆蟲、或植物細胞。用于轉(zhuǎn)化或轉(zhuǎn)染這些細胞以表達外源DNA的方法在本領(lǐng)域是眾所周知的(參閱例如Itakura等,美國專利號4,704,362;Hinnen等,Proc.Natl.Acad.Sci.USA 751929-1933,1978;Murray等,美國專利號4,801,542;Upshall等,美國專利號4,935,349;Hagen等,美國專利號4,784,950;Axel等,美國專利號4,399,216;Goeddel等,美國專利號4,766,075;和Sambrook等,《分子克隆實驗室指南》Molecular CloningA Laboratory Manual,第2版,冷泉港實驗室出版社,1989;關(guān)于植物細胞參予Czako和Marton,Plant Physiol.1041067-1071,1994;和Paszkowski等,Biotech.24387-392,1992)。
適于執(zhí)行本發(fā)明的細菌宿主細胞包括大腸桿菌、枯草芽孢桿菌、傷寒沙門氏菌(Salmonella typhimurium)以及假單胞菌屬、鏈霉菌屬和葡萄球菌屬中的多個物種,以及本領(lǐng)域普通技術(shù)人員眾所周知的和本文描述的許多其它細菌物種。細菌宿主細胞的代表性實例包括大腸桿菌DH5α(Stratagene,拉霍亞,加利福尼亞)。
細菌表達載體優(yōu)選包含在宿主細胞中發(fā)揮功能的啟動子、一種或多種可選擇表型標記、和細菌復(fù)制起點。代表性啟動子包括β-內(nèi)酰胺酶(青霉素酶)和乳糖啟動子系統(tǒng)(參閱Chang等,Nature 275615,1978)、T7RNA聚合酶啟動子(Studier等,Meth.Enzymol.18560-89,1990)、λ啟動子(Elvin等,Gene 87123-126,1990)、trp啟動子(Nichols和Yanofsky,Meth.in Enzymology 101155,1983)、和tac啟動子(Russell等,Gene 20231,1982)。代表性選擇標記包括多種抗生素抗性標記,諸如卡那霉素或氨芐青霉素抗性基因。適于轉(zhuǎn)化宿主細胞的許多質(zhì)粒在本領(lǐng)域是眾所周知的,包括例如pBR322(參閱Bolivar等,Gene 295,1977)、pUC質(zhì)粒pUC18、pUC19、pUC118、pUC119(參閱Messing,Meth.in Enzymology 10120-77,1983;和Vieira和Messing,Gene 19259-268,1982)、以及pNH8A、pNH16a、pNH18a、和Bluescript M13(Stratagene,拉霍亞,加利福尼亞)。
適于執(zhí)行本發(fā)明的酵母和真菌宿主細胞包括例如粟酒裂殖酵母(Saccharomyces pombe)、釀酒酵母(Saccharomyces cerevisiae)、畢赤酵母屬(Pichia)或克魯維酵母屬(Kluyveromyces),以及曲霉屬(Aspergillus)的多個物種(McKnight等,美國專利號4,935,349)。適用于酵母和真菌的表達載體包括例如用于酵母的YCp50(ATCC No.37419),以及amdS克隆載體pV3(Turnbull,Bio/Technology 7169,1989)、YRp7(Struhl等,Proc.Natl.Acad.Sci.USA 761035-1039,1978)、YEp13(Broach等,Gene 8121-133,1979)、pJDB249、和pJDB219(Beggs,Nature 275104-108,1978)及其衍生物。
在酵母中使用的優(yōu)選啟動子包括來自酵母糖酵解基因(Hitzeman等,J.Biol.Chem.25512073-12080,1980;Alber和Kawasaki,J.Mol.Appl.Genet.1419-434,1982)或乙醇脫氫酶基因(Young等,《為了化學(xué)藥品的微生物基因工程》Genetic Engineering ofMicroorganisms for Chemicals,Hollaender等編,第355頁,Plenum出版社,紐約,1982;Ammerer,Meth.Enzymol.101192-201,1983)的啟動子。在真菌載體中有用的啟動子的實例包括衍生自構(gòu)巢曲霉(Aspergillus nidulans)糖酵解基因的啟動子,諸如adh3啟動子(McKnight等,EMBO J.42093-2099,1985)。表達單元還可以包含轉(zhuǎn)錄終止子。合適的終止子的實例是adh3終止子(McKnight等,見上文,1985)。
與細菌載體一樣,酵母載體通常將包含選擇標記,它可以是展示顯性表型的多種基因之一,針對所述顯性表型存在表型測定法能夠選擇轉(zhuǎn)化子。優(yōu)選的選擇標記是補足宿主細胞營養(yǎng)缺陷、提供抗生素抗性、或使得細胞能夠利用特定碳源的選擇標記,包括1eu2(Broach等,同上)、ura3(Botstein等,Gene817,1979)、或his3(Struhl等,同上)。另一種合適的選擇標記是cat基因,它賦予酵母細胞以氯霉素抗性。
用于轉(zhuǎn)化真菌的技術(shù)在文獻中是眾所周知的,描述于例如Beggs,同上;Hinnen等,Proc.Natl.Acad.Sci.USA 751929-1933,1978;Yelton等,Proc.Natl.Acad.Sci.USA 811740-1747,1984;和Russell,Nature 301167-169,1983。宿主細胞的基因型可以包含遺傳缺陷,其可通過表達載體上存在的選擇標記得到彌補。具體宿主和選擇標記的選擇完全屬于本領(lǐng)域普通技術(shù)人員的水平之內(nèi)。
用于轉(zhuǎn)化酵母的方案對于本領(lǐng)域普通技術(shù)人員而言是眾所周知的。例如,可以通過制備酵母球狀體(參閱Hinnen等,PNAS751929,1978)或者通過堿性鹽諸如LiCl處理(參閱Itoh等,J.Bacteriology153163,1983)而容易的用DNA進行轉(zhuǎn)化。還可以如Cullen等,Bio/Technology 5369,1987所述使用聚乙二醇來進行真菌轉(zhuǎn)化。
病毒載體包括包含指導(dǎo)編碼上文所述期望蛋白的分離核酸分子表達的啟動子的那些載體。非常多種啟動子可用于本發(fā)明的內(nèi)容,包括例如諸如MoMLV LTR、RSV LTR、Friend MuLV LTR、腺病毒啟動子(Ohno等,Science 265781-784,1994)、新霉素磷酸轉(zhuǎn)移酶啟動子/增強子、晚期細小病毒啟動子(Koering等,Hum.Gene Therap.5457-463,1994)、皰疹TK啟動子、SV40啟動子、金屬硫蛋白IIa基因增強子/啟動子、巨細胞病毒立即早期啟動子、和巨細胞病毒立即晚期啟動子等啟動子。在本發(fā)明的特別優(yōu)選實施方案中,啟動子是組織特異性啟動子(參閱例如WO 91/02805;EP 0,415,731;和WO 90/07936)。合適的組織特異性啟動子的代表性實例包括神經(jīng)特異性烯醇化酶啟動子、血小板衍生生長因子β啟動子、骨形態(tài)發(fā)生蛋白啟動子、人α-chimaerin啟動子、突觸蛋白I啟動子和突觸蛋白II啟動子。除了上述啟動子以外,可以使用其它病毒特異啟動子(例如逆轉(zhuǎn)錄病毒啟動子(包括上文所述啟動子以及諸如HIV啟動子等其它啟動子)、肝炎、皰疹(例如EBV)、和細菌、真菌、或寄生蟲(例如瘧疾)特異性啟動子,從而靶向受病毒、細菌、真菌、或寄生蟲感染的特定細胞或組織。
適于執(zhí)行本發(fā)明的哺乳動物細胞包括例如COS、CHO、SaOS、骨肉瘤、KS483、MG-63、原代成骨細胞、和人或哺乳動物骨髓基質(zhì)。用于執(zhí)行本發(fā)明的哺乳動物表達載體將包含能夠指導(dǎo)克隆的基因、核酸分子、或cDNA轉(zhuǎn)錄的啟動子。優(yōu)選的啟動子包括病毒啟動子和細胞啟動子。骨特異性啟動子包括骨唾液酸蛋白的啟動子和骨鈣蛋白的啟動子。病毒啟動子包括巨細胞病毒立即早期啟動子(Boshart等,Cell 41521-530,1985)、巨細胞病毒立即晚期啟動子、SV40啟動子(Subramani等,Mol.Cell.Biol.1854-864,1981)、MMTV LTR、RSV LTR、金屬硫蛋白-1、腺病毒Ela。細胞啟動子包括小鼠金屬硫蛋白-1啟動子(Palmiter等,美國專利號4,579,821)、小鼠Vκ啟動子(Bergman等,Proc.Natl.Acad.Sci.USA 817041-7045,1983;Grant等,Nucleic Acids Res.155496,1987)、和小鼠VH啟動子(Loh等,Cell 3385-93,1983)。啟動子的選擇將至少部分取決于期望的表達水平或待轉(zhuǎn)染的受體細胞系。
這些表達載體還可以在啟動子下游和編碼目的肽或蛋白質(zhì)的DNA序列上游包含一套RNA剪接位點。優(yōu)選的RNA剪接位點可以由腺病毒/或免疫球蛋白基因獲得。表達載體中還在目的編碼序列下游包含多聚腺苷酸化信號。合適的多聚腺苷酸化信號包括來自SV40的早期或晚期多聚腺苷酸化信號(Kaufman和Sharp,同上)、來自腺病毒5E1B區(qū)的多聚腺苷酸化信號、和人生長激素基因終止子(DeNoto等,Nucleic Acids Res.93719-3730,1981)。表達載體可以在啟動子與RNA剪接位點之間包含非編碼性病毒前導(dǎo)序列,諸如腺病毒2三元前導(dǎo)序列。優(yōu)選的載體還可以包含增強子序列,諸如SV40增強子。表達載體還可以包含編碼腺病毒VA RNA的序列。合適的表達載體可以由商業(yè)來源獲得(例如Stratagene,拉霍亞,加利福尼亞)。
可以通過例如磷酸鈣介導(dǎo)的轉(zhuǎn)染(Wigler等,Cell 14725,1978;Corsaro和Pearson,Somatic Cell Genetics 7603,1981;Graham和Van der Eb,Virology 52456,1973)、電穿孔(Neumann等,EMBO J.1841-845,1982)、或DEAE-葡聚糖介導(dǎo)的轉(zhuǎn)染(Ausubel等編,《分子生物學(xué)通用方案》Current Protocols in MolecularBiology,John Wiley and Sons公司,紐約,1987)將包含克隆的DNA的載體構(gòu)建體導(dǎo)入培養(yǎng)的哺乳動物細胞。為了鑒定穩(wěn)定轉(zhuǎn)染了載體或整合了克隆的DNA的細胞,通常將選擇標記與目的基因或cDNA一起導(dǎo)入細胞中。在培養(yǎng)的哺乳動物細胞中使用的優(yōu)選選擇標記包括賦予藥物(諸如新霉素、潮霉素、和氨甲蝶呤)抗性的基因。選擇標記可以是可擴增選擇標記。優(yōu)選的可擴增選擇標記是DHFR基因和新霉素抗性基因。選擇標記的綜述見Thilly,Mammalian Cell Technology,Butterworth出版社,斯托納姆,馬薩諸塞,將其收入本文作為參考。
將包含合適載體的哺乳動物細胞培養(yǎng)一段時間,通常是1-2天,從而開始表達目的DNA序列。然后進行藥物選擇以選擇出以穩(wěn)定方式表達該選擇標記的細胞的生長。對于用可擴增的選擇標記轉(zhuǎn)染的細胞而言,可以逐步提高藥物濃度以選擇克隆的序列的拷貝數(shù)增加,從而提高表達水平。對表達所導(dǎo)入序列的細胞選擇和篩選目的蛋白以期望形式或期望水平的生成。然后可以克隆滿足這些標準的細胞,并放大規(guī)模用于生產(chǎn)。
用于轉(zhuǎn)染哺乳動物細胞的方案對于本領(lǐng)域普通技術(shù)人員而言是眾所周知的。代表性方法包括磷酸鈣介導(dǎo)的轉(zhuǎn)染、電穿孔、脂轉(zhuǎn)染、逆轉(zhuǎn)錄病毒、腺病毒、和原生質(zhì)體融合介導(dǎo)的轉(zhuǎn)染(參閱Sambrook等,見上文)。還可以在注射到哺乳動物(或其它動物)的肌肉中后由肌肉細胞或其它合適細胞攝取裸露的載體構(gòu)建體。
使用昆蟲細胞和植物宿主細胞來生產(chǎn)多肽的方法在本領(lǐng)域是知道的,而且本文有所描述。本領(lǐng)域知道的眾多昆蟲宿主細胞也可用于本發(fā)明。例如,關(guān)于以桿狀病毒為載體在昆蟲細胞中表達異源DNA序列的綜述參閱Atkinson等,Pestic.Sci.28215-224,1990。本領(lǐng)域知道的眾多載體和植物宿主細胞也可用于本發(fā)明,例如以發(fā)根農(nóng)桿菌(Agrobacterium rhizogenes)為載體在植物細胞中表達基因和核酸分子(其綜述參閱Sinkar等,J.Biosci.Bangalore 1147-58,1987)。
在本發(fā)明的相關(guān)方面,可以在轉(zhuǎn)基因動物中表達本發(fā)明的蛋白質(zhì),所述轉(zhuǎn)基因動物的生殖細胞和體細胞中包含編碼期望蛋白質(zhì)的基因,其可操作連接有效表達該基因的啟動子。或者,可以以相似方式制備缺乏期望基因的轉(zhuǎn)基因動物(例如“敲除”小鼠)??梢栽诙喾N非人動物中制備這些轉(zhuǎn)基因動物,包括小鼠、大鼠、兔、綿羊、狗、山羊、和豬(參閱Hammer等,Nature 315680-683,1985;Palmiter等,Science 222809-814,1983;Brinster等,Proc.Natl.Acad.Sci.USA 824438-4442,1985;Palmiter和Brinster,Cell 41343-345,1985;和美國專利號5,175,383、5,087,571、4,736,866、5,387,742、5,347,075、5,221,778、和5,175,384)。簡而言之,將包含待表達核酸分子及位于適當(dāng)位置的表達控制序列的表達載體導(dǎo)入受精卵的原核,例如通過顯微注射。通過對組織樣品的DNA進行印跡分析來檢測所注射DNA的整合。優(yōu)選導(dǎo)入的DNA被摻入到動物的生殖系,使得它傳代給動物后代。可以通過組織特異啟動子或是通過能夠調(diào)控地表達轉(zhuǎn)基因的可誘導(dǎo)啟動子諸如金屬硫蛋白基因啟動子(Palmiter等,1983,見上文)來實現(xiàn)組織特異表達。
可以例如如下純化蛋白質(zhì)培養(yǎng)合適的宿主和載體系統(tǒng)以生成本文所述重組翻譯產(chǎn)物;然后通過多種純化流程處理來自這些細胞系的上清液、或蛋白質(zhì)包涵體、或不將蛋白質(zhì)分泌到上清液中的完整細胞,以分離期望的蛋白質(zhì)。例如,首先使用商品化蛋白質(zhì)濃縮濾器諸如Amicon或Millipore Pellicon超濾單元濃縮上清液。濃縮后,可以將濃縮液施加到合適的純化基質(zhì)上,諸如例如結(jié)合于合適支持物上的抗蛋白質(zhì)抗體(例如與待分離的多肽特異結(jié)合的抗體)。或者,可以采用陰離子或陽離子交換樹脂來純化蛋白質(zhì)。再或者,可以采用一次或多次反相高效液相層析(RP-HPLC)步驟來進一步純化蛋白質(zhì)。分離本發(fā)明蛋白質(zhì)的其它方法在本領(lǐng)域是眾所周知的。
可以通過本領(lǐng)域知道的和本文描述的技術(shù)來測定分離的多肽的純度,諸如凝膠電泳和層析方法。優(yōu)選的是,這些分離的多肽是至少大約90%純、更優(yōu)選至少大約95%純、且最優(yōu)選至少大約99%純。在某些特定實施方案中,若根據(jù)SDS-PAGE分析及隨后考馬斯藍染色沒有檢測到其它非期望蛋白質(zhì),則在本發(fā)明的內(nèi)容中認為蛋白質(zhì)是“分離的”。在其它實施方案中,可以分離期望的蛋白質(zhì),使得根據(jù)SDS-PAGE分析及隨后銀染不會檢測到其它非期望蛋白質(zhì)。
3.核酸分子在本發(fā)明的其它方面,提供了能夠抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的核酸分子。例如,在一個實施方案中,提供了特異抑制TGF-β結(jié)合蛋白核酸序列表達的反義寡核苷酸分子(通常參閱Hirashima等,《RNA分子生物學(xué)新觀點》(Molecular Biology ofRNANew Perspectives),M.Inouye和B.S.Dudock編,1987,Academic出版社,圣迭戈,第401頁;寡核苷酸基因表達的反義抑制物(OligonucleotidesAntisense Inhibitors of Gene Expression),J.S.Cohen編,1989,MacMillan出版社,倫敦;Stein和Cheng,Science2611004-1012,1993;WO 95/10607;美國專利號5,359,051;WO92/06693;和EP-A2-612844)。簡而言之,構(gòu)建這些分子,使得它們與轉(zhuǎn)錄的TGF-β結(jié)合蛋白mRNA序列的一個區(qū)域互補并能夠形成Watson-Crick堿基配對。由此產(chǎn)生的雙鏈核酸干擾mRNA的后續(xù)加工,從而阻止蛋白質(zhì)表達(見實施例10)。
在本發(fā)明的其它方面,提供了能夠抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的核酶。在用于本文時,“核酶”意欲包括包含用于特異識別的反義序列和RNA切割酶活性的RNA分子。催化鏈在較高化學(xué)計量濃度下切割靶RNA中的特定位點。非常多種核酶可用于本發(fā)明中,包括例如錘頭核酶(例如Forster和Symons,Cell 48211-220,1987;Haseloff和Gerlach,Nature 328596-600,1988;Walbot和Bruening,Nature 334196,1988;Haseloff和Gerlach,Nature334585,1988中所述);發(fā)夾核酶(例如Haseloff等,1993年10月19日發(fā)布的美國專利號5,254,678;和Hempel等,1990年3月26日發(fā)布的歐洲專利發(fā)布號0 360 257中所述);和基于四膜蟲核糖體RNA的核酶(參閱Cech等,美國專利號4,987,071)。本發(fā)明的核酶通常由RNA組成,但是也可以由DNA、核酸類似物(例如硫代磷酸酯)、或其嵌合體(例如DNA/RNA/RNA)組成。
4.標記物可以用多種化合物標記上文和下文所述基因產(chǎn)物或任何候選分子,包括例如熒光分子、毒素、和放射性核素。熒光分子的代表性實例包括熒光素、Phycobili蛋白質(zhì)諸如藻紅蛋白、羅丹明、Texas紅、和螢光素酶。毒素的代表性實例包括蓖麻毒素、相思豆毒素、白喉毒素、霍亂毒素、gelonin、美洲商陸抗病毒蛋白、tritin、志賀氏桿菌毒素、和假單胞菌外毒素A。放射性核素的代表性實例包括Cu-64、Ga-67、Ga-68、Zr-89、Ru-97、Tc-99m、Rh-105、Pd-109、In-111、I-123、I-125、I-131、Re-186、Re-188、Au-198、Au-199、Pb-203、At-211、Pb-212、和Bi-212。另外,上文所述抗體也可以標記或綴合配體結(jié)合對中的一種配偶體。代表性實例包括親和素-生物素、鏈霉親和素-生物素、和核黃素-核黃素結(jié)合蛋白。
本領(lǐng)域普通技術(shù)人員可以容易的完成用于用上文所列代表性標記物綴合或標記本文所述分子的方法(參閱單端孢霉烯抗體綴合物Trichothecene Antibody Conjugate,美國專利號4,744,981;抗體綴合物(Antibody Conjugate),美國專利號5,106,951;熒光物質(zhì)和標記技術(shù)(Fluorogenic Materials and Labeling Techniques),美國專利號4,018,884;用于診斷和治療的金屬放射性核素標記的蛋白質(zhì)(Metal Radionuclide Labeled Proteins for Diagnosis andTherapy),美國專利號4,897,255;和用于改進螯合動力學(xué)的金屬放射性核素螯合的化合物(Metal Radionuclide Chelating Compoundsfor Improved Chelation Kinetics),美國專利號4,988,496;還可參閱Inman,《酶學(xué)方法,第34卷,親和技術(shù)、酶純化第二部分》(Methods In Enzymology,Vol.34,Affinity Techniques,EnzymePurification)Part B,Jakoby和Wilchek編,Academic出版社,紐約,第30頁,1974;還可參閱Wilchek和Bayer,“生物分析應(yīng)用中的親和素-生物素復(fù)合物”(The Avidin-Biotin Complex inBioanalytical Applications),Anal.Biochem.1711-32,1988)。
藥物組合物如上所述,本發(fā)明還提供了包含上文所述抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的分子之一以及制藥學(xué)或生理學(xué)可接受載體、賦形劑、或稀釋劑的多種藥物組合物。一般而言,這些載體在所采用的劑量和濃度對受者而言應(yīng)當(dāng)是無毒的。通常,這些組合物的制備需要組合治療劑與緩沖劑、抗氧化劑諸如抗壞血酸、低分子量(小于大約10個殘基)多肽、蛋白質(zhì)、氨基酸、包括葡萄糖、麥芽糖、蔗糖、或糊精在內(nèi)的碳水化合物、螯合劑諸如EDTA、谷胱甘肽和其它穩(wěn)定劑、和賦形劑。合適稀釋劑的實例是與非特異血清清蛋白混合的中性緩沖鹽水或鹽水。
可以制備本發(fā)明的藥物組合物以用于提供多種不同路徑的施用。一般而言,根據(jù)施用模式來選擇載體的類型??梢耘渲扑幬锝M合物以用于任何合適的施用方式,包括例如局部、口服、鼻、鞘內(nèi)、直腸、陰道、舌下、或腸胃外施用,包括皮下、靜脈內(nèi)、肌肉內(nèi)、胸骨內(nèi)、海綿體內(nèi)、intrameatal、或尿道內(nèi)注射或輸液。藥物組合物(例如用于口服施用或通過注射來投遞)可以是液體的形式(例如酏劑、糖漿、溶液、乳狀液、或懸浮液)。液體藥物組合物可以包含例如一種或多種下列成分無菌稀釋劑諸如注射用水、鹽水溶液、優(yōu)選生理鹽水、Ringer氏溶液、等滲氯化鈉、可以擔(dān)當(dāng)溶劑或懸浮介質(zhì)的不揮發(fā)油、聚乙二醇、甘油、丙二醇、或其它溶劑;抗細菌劑;抗氧化劑;螯合劑;緩沖劑諸如乙酸鹽、檸檬酸鹽、或磷酸鹽;以及用于調(diào)節(jié)滲透壓的試劑,諸如氯化鈉或葡萄糖。腸胃外制劑可以封裝在安瓿、一次性注射器、或由玻璃或塑料制成的多劑量藥瓶內(nèi)。優(yōu)選使用生理鹽水,而且可注射的藥物組合物優(yōu)選是無菌的。
本文所述組合物可以配制成緩釋的(即諸如在施用后實行緩慢釋放化合物的膠囊或海綿體的配方)。通常可以使用眾所周知的技術(shù)來制備這些組合物,并通過例如口服、直腸、或皮下植入或是通過期望靶部位的植入來進行施用。緩釋配方可以包含散布在載體基質(zhì)中和/或包含在由速率控制膜包圍的儲庫中的試劑。用于這些配方的載體是生物相容的,而且可以是生物可降解的;優(yōu)選的是,配方提供了相對恒定水平的活性成分釋放。緩釋配方中所包含的活性成分的量取決于植入部位、釋放的速率和期望持續(xù)時間、以及待治療或預(yù)防的狀況的本質(zhì)。在這個方面有用的例示性載體包括聚(丙交酯-共-乙交酯)、聚丙烯酸酯、膠乳(latex)、淀粉、纖維素、葡聚糖、諸如此類的微粒。其它例示性延遲釋放載體包括包含非液體親水核(例如交聯(lián)多糖或寡糖)和可選地包含兩親化合物諸如磷脂的外層的超分子生物載體(參閱例如美國專利號5,151,254和PCT申請WO 94/20078、WO/94/23701、和WO 96/06638)。
在另一個例示性實施方案中,采用生物可降解微球體(例如聚乳酸聚乙醇酸酯)作為本發(fā)明組合物的載體。合適的生物可降解微球體公開于例如美國專利號4,897,268、5,075,109、5,928,647、5,811,128、5,820,883、5,853,763、5,814,344、5,407,609、和5,942,252。經(jīng)修飾的乙型肝炎核心蛋白載體系統(tǒng),諸如WO/9940934及其引用的參考文獻中所述的那些,也可用于許多應(yīng)用中。另一種例示性載體/投遞系統(tǒng)采用包含微粒-蛋白質(zhì)復(fù)合物的載體,諸如美國專利號5,928,647中所述的那些,它們能夠在宿主中誘導(dǎo)I類限制性細胞毒性T淋巴細胞應(yīng)答。
在另一個例示性實施方案中,采用磷酸鈣核心顆粒作為本發(fā)明組合物的載體或受控釋放基質(zhì)。例示性磷酸鈣顆粒公開于例如已發(fā)表專利申請?zhí)朩O/0046147。
對于包含編碼抗SOST抗體和/或調(diào)控劑的多核苷酸(從而原位生成該多肽和/或調(diào)控劑)的藥物組合物而言,多核苷酸可以存在于本領(lǐng)域普通技術(shù)人員知道的多種投遞系統(tǒng)中,包括核酸以及細菌、病毒、和哺乳動物表達系統(tǒng)。用于將DNA摻入這些表達系統(tǒng)的技術(shù)對于本領(lǐng)域普通技術(shù)人員而言是眾所周知的。如下列文獻中所述,DNA還可以是“裸露的”,例如Ulmer等,Science 2591745-1749,1993和綜述Cohen,Science 2591691-1692,1993??梢酝ㄟ^將DNA包被在能夠高效轉(zhuǎn)運到細胞中的生物可降解珠上來增加裸露DNA的攝取。
在包括例如口服、腸胃外、靜脈內(nèi)、鼻內(nèi)、和肌肉內(nèi)施用和配方在內(nèi)的多種治療方案中使用本文所述特定組合物的合適劑量和治療方案的發(fā)展在本領(lǐng)域是眾所周知的,出于例示的一般性目的,下文將對其中一些作簡要討論。
在某些應(yīng)用中,可以通過口服施用而對動物投遞本文公開的藥物組合物。如此,可以用惰性稀釋劑或可同化的可食用載體配制這些組合物,或者可以將它們包裹在硬殼或軟殼明膠膠囊中,或者可以將它們壓縮成片劑,或者可以將它們直接摻入膳食食品中。
在某些情況中,通過腸胃外、靜脈內(nèi)、肌肉內(nèi)、或甚至腹膜內(nèi)途徑投遞本文公開的藥物組合物將是合乎需要的。這些方法對于本領(lǐng)域技術(shù)人員而言是眾所周知的,下列專利對其中一些有進一步描述,例如美國專利號5,543,158、5,641,515、和5,399,363。在某些實施方案中,可以在與表面活性劑諸如羥丙基纖維素適當(dāng)混合的水中制備活性化合物作為游離基或制藥學(xué)可接受鹽的溶液。還可以在甘油、液體聚乙二醇、及其混合物和在油中制備分散體。在貯存和使用的常規(guī)條件下,這些制劑通常將包含防腐劑以預(yù)防微生物的生長。
適于注射用途的例示性制藥學(xué)形式包括無菌水溶液或分散體以及用于臨場制備無菌可注射溶液或分散體的無菌粉劑(例如參閱美國專利號5,466,468)。在所有情況中,該形式必須是無菌的,而且流動性必須達到易于注射的程度。它在制造和貯存條件下必須是穩(wěn)定的,而且必須預(yù)防微生物諸如細菌和真菌的污染作用。載體可以是溶劑或分散介質(zhì),包含例如水、乙醇、多元醇(例如甘油、丙二醇、液體聚乙二醇、諸如此類)、及其合適混合物和/或植物油。例如可以通過使用涂層諸如卵磷脂、在分散體的情況中通過維持所需顆粒大小、和/或通過使用表面活性劑來維持適當(dāng)?shù)牧鲃有?。對微生物作用的預(yù)防通過多種抗細菌和抗真菌試劑變得容易,例如對羥基苯甲酸酯類、氯丁醇、酚、山梨酸、硫柳汞、諸如此類。在許多情況中,優(yōu)選包含等滲劑,例如糖類或氯化鈉??梢酝ㄟ^在組合物中使用延遲吸收的試劑例如單硬脂酸鋁和明膠來實現(xiàn)可注射組合物的延遲吸收。
在一個實施方案中,對于水溶液的腸胃外施用,如果需要,溶液應(yīng)當(dāng)適當(dāng)緩沖,并首先用足夠的鹽或葡萄糖使得液體稀釋劑等滲。這些特定水溶液尤其適于靜脈內(nèi)、肌肉內(nèi)、皮下、和腹膜內(nèi)施用。在這方面,本領(lǐng)域技術(shù)人員根據(jù)本公開書將知道可以采用的無菌水性介質(zhì)。例如,可以將一個劑量溶于1ml等滲NaCl溶液,或是添加到1000ml皮下輸液中,或是注射到建議的輸液部位(參閱例如《雷明頓氏制藥科學(xué)》(Remington′s Pharmaceutical Sciences),第15版,第1035-1038頁和第1570-1580頁)。根據(jù)待治療患者的狀況,可能有必要對劑量進行一些改變。此外,對于人類施用,制劑當(dāng)然優(yōu)選達到FDA生物制劑標準辦公室要求的無菌、熱原性、以及一般安全性和純度標準。
在本發(fā)明的另一個實施方案中,本文公開的組合物可以配制成中性或鹽形式。例示性的制藥學(xué)可接受鹽包括(由蛋白質(zhì)的游離氨基形成的)酸加成鹽,以及用無機酸諸如例如鹽酸或磷酸或者有機酸諸如乙酸、草酸、酒石酸、扁桃酸等形成的鹽。由游離羧基形成的鹽也可以衍生自無機堿,諸如例如鈉、鉀、銨、鈣、或鐵的氫氧化物,和有機堿,諸如異丙胺、三甲胺、組氨酸、葡魯卡因等。配制后,將以與劑量形式相容的方式和諸如治療上有效的量施用溶液。
載體還可以包含任何和所有溶劑、分散介質(zhì)、媒介、涂層、稀釋劑、抗細菌和抗真菌劑、等滲和吸收延遲劑、緩沖劑、載體溶液、懸浮液、膠體、諸如此類。這些介質(zhì)和試劑對制藥學(xué)活性物質(zhì)的使用在本領(lǐng)域是眾所周知的。除非任何常規(guī)介質(zhì)或試劑與活性成分不相容,否則涵蓋它在藥物組合物中的使用。還可以將補充性活性成分摻入組合物中。術(shù)語“制藥學(xué)可接受的”指在施用于人后不產(chǎn)生過敏或相似的不利反應(yīng)的分子實體和組合物。
在某些實施方案中,使用脂質(zhì)體、納米膠囊、微粒、脂質(zhì)顆粒、囊泡、諸如此類將本發(fā)明的組合物導(dǎo)入合適的宿主細胞/生物體。具體而言,可以將本發(fā)明的組合物包裹到脂質(zhì)顆粒、脂質(zhì)體、囊泡、納米球體、或納米顆粒等中,如此配制用于投遞?;蛘?,可以將本發(fā)明的組合物共價或非共價結(jié)合到這些載體媒介的表面上。
脂質(zhì)體和脂質(zhì)體樣制劑作為潛在藥物載體的形成和使用在本領(lǐng)域技術(shù)人員中通常是知道的(參閱例如Lasic,Trends Biotechnol.16(7)307-21,1998;Takakura,Nippon Rinsho 56(3)691-95,1998;Chandran等,Indian J.Exp.Biol.35(8)801-09,1997;Margalit,Crit.Rev.Ther.Drug Carrier Syst.12(2-3)233-61,1995;美國專利號5,567,434;美國專利號5,552,157;美國專利號5,565,213;美國專利號5,738,868;和美國專利號5,795,587,明確將每一篇完整收入本文作為參考)。
脂質(zhì)體已經(jīng)成功用于其它方法通常難以轉(zhuǎn)染的多種細胞類型,包括T細胞懸浮液、原代肝細胞培養(yǎng)物和PC 12細胞(Renneisen等,J.Biol.chem.265(27)16337-42,1990;Muller等,DNA Cell Biol.9(3)221-29,1990)。另外,脂質(zhì)體沒有基于病毒的投遞系統(tǒng)通常所具有的DNA長度限制。脂質(zhì)體已經(jīng)有效用于將基因、多種藥物、放射性治療劑、酶、病毒、轉(zhuǎn)錄因子、變構(gòu)效應(yīng)物、諸如此類導(dǎo)入多種培養(yǎng)細胞系和動物。此外,脂質(zhì)體的使用似乎與全身投遞后的自身免疫應(yīng)答或不可接受的毒性無關(guān)。
在某些實施方案中,脂質(zhì)體是由分散在水性介質(zhì)中且自發(fā)形成多層同心雙層囊泡(也稱為多層囊泡(MLV))的磷脂形成的。
或者,在其它實施方案中,本發(fā)明提供了本發(fā)明組合物的制藥學(xué)可接受的納米膠囊配方。納米膠囊通常能夠以穩(wěn)定且可再生的方式包裹化合物(參閱例如Quintanar-Guerrero等,Drug Dev.Ind.Pharm.24(12)1113-28,1998)。為了避免由于細胞內(nèi)聚合物過載引起的副作用,可以使用能夠在體內(nèi)降解的聚合物來設(shè)計這些超細顆粒(大小為0.1μm左右)。可以如下列文獻中所述制作這些顆粒,例如Couvreur等,Crit.Rev.Ther.Drug Carrier Syst.5(1)1-20,1988;zur Muhlen等,Eur.J.Pharm.Biopharm.45(2)149-55,1998;Zambaux等,J.Controlled Release 50(1-3)31-40,1998;和美國專利號5,145,684。
另外,本發(fā)明的藥物組合物可以與包裝材料一起置于容器中,后者提供了關(guān)于這些藥物組合物的用法的說明書。一般而言,這些說明書將包括描述試劑濃度的確實表述,以及在某些實施方案中可能包括重建藥物組合物所必需的賦形劑成分或稀釋劑(例如水、鹽水、或PBS)的相對量。
治療方法本發(fā)明還提供了用于增加骨的礦物質(zhì)含量和礦物質(zhì)密度的方法。簡而言之,眾多狀況導(dǎo)致骨礦物質(zhì)含量流失,包括例如疾病、遺傳素質(zhì)、導(dǎo)致骨使用缺乏的事故(例如由于骨折)、影響骨再吸收或殺死骨形成細胞的治療劑、和正常衰老。通過使用本文所述抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的分子,可以治療或預(yù)防這些狀況。在用于本文時,應(yīng)當(dāng)理解,若在選擇的部位骨礦物質(zhì)含量以統(tǒng)計學(xué)顯著方式(例如大于標準偏差的一半)有所增加,則骨礦物質(zhì)含量增加了。
可以用本文所述分子來治療導(dǎo)致骨礦物質(zhì)含量流失的非常多種狀況??梢酝ㄟ^采用眾所周知的技術(shù)(參閱例如《哈里森氏內(nèi)科醫(yī)學(xué)原理》(Harrison′s Principles of Internal Medicine),McGraw-Hill公司)的臨床診斷來鑒定具有這些狀況的患者??梢灾委煹募膊〉拇硇詫嵗ㄆ渲泄堑纳L或發(fā)育異常的發(fā)育不良。這些狀況的代表性實例包括軟骨發(fā)育不全、顱骨鎖骨發(fā)育不良、內(nèi)生軟骨瘤病、纖維性發(fā)育不良、戈謝病、低磷酸鹽血癥性佝僂病、馬方綜合癥、多發(fā)性遺傳性外生骨疣、神經(jīng)纖維瘤病、成骨不全、骨硬化癥、脆弱性骨硬化、硬化損傷、骨折、牙周病、假關(guān)節(jié)病、和化膿性骨髓炎。
可以治療或預(yù)防的其它狀況包括骨質(zhì)減少(即引起骨礦物質(zhì)含量或密度低于年輕時峰值骨骼礦物質(zhì)含量超過1個標準偏差的狀況)的非常多種原因。這些狀況的代表性實例包括貧血狀態(tài)、由類固醇引起的狀況、由肝素引起的狀況、骨髓疾病、壞血病、營養(yǎng)不良、缺鈣、特發(fā)性骨質(zhì)疏松、先天性骨質(zhì)減少或骨質(zhì)疏松、酒精中毒、慢性肝病、衰老、絕經(jīng)后狀態(tài)、月經(jīng)過少、閉經(jīng)、懷孕、糖尿病、甲狀腺功能亢進、庫欣病、肢端肥大病、性腺功能減退、制動術(shù)或廢用、反射交感性營養(yǎng)不良綜合癥、暫時局部骨質(zhì)疏松、和骨軟化癥。
在本發(fā)明的一個方面,可以通過對溫血動物施用治療有效量的抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的分子來增加骨礦物質(zhì)含量或密度??梢灾委煹臏匮獎游锏膶嵗棺祫游锖筒溉閯游锒?,包括例如人、馬、牛、豬、綿羊、狗、貓、大鼠、和小鼠。治療性分子的代表性實例包括核酶、核酶基因、反義寡核苷酸、和抗體(例如人源化抗體或本文所述任何其它抗體)。
在本發(fā)明的其它方面,提供了用于增加骨密度的方法,包括下列步驟將指導(dǎo)抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的分子表達的載體導(dǎo)入歸巢至骨的細胞,并將包含載體的細胞施用于溫血動物。簡而言之,可以直接由患者的骨(例如由骨髓獲得的細胞,諸如CD34+、成骨細胞、骨細胞、諸如此類)、由外周血、或由培養(yǎng)物獲得歸巢至骨的細胞。
可以將指導(dǎo)抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的分子表達的載體導(dǎo)入細胞。合適載體的代表性實例包括病毒載體,諸如皰疹病毒載體(參閱美國專利號5,288,641)、腺病毒載體(例如WO94/26914、WO 93/9191;Kolls等,PNAS 91(1)215-219,1994;Kass-Eisler等,PNAS 90(24)11498-502,1993;Guzman等,Circulation88(6)2838-48,1993;Guzman等,Cir.Res.73(6)1202-1207,1993;Zabner等,Cell 75(2)207-216,1993;Li等,Hum.Gene Ther.4(4)403-409,1993;Caillaud等,Eur.J.Neurosci.5(10)1287-1291,1993;Vincen t等,Nat.Genet.5(2)130-134,1993;Jaffe等,Nat.Genet.1(5)372-378,1992;和Levrero等,Gene 101(2)195-202,1991)、腺伴隨病毒載體(WO 95/13365;Flotte等,PNAS 90(22)10613-10617,1993)、桿狀病毒載體、細小病毒載體(Koering等,Hum.Gene Therap.5457-463,1994)、痘病毒載體(Panicali和Paoletti,PNAS 794927-4931,1982;和Ozaki等,Biochem.Biophys.Res.Comm.193(2)653-660,1993)和逆轉(zhuǎn)錄病毒載體(例如EP 0,415,731、WO 90/07936、WO 91/0285、WO 94/03622、WO 93/25698、WO 93/25234、美國專利號5,219,740、WO 93/11230、和WO 93/10218)。同樣可以構(gòu)建包含來自不同病毒或非病毒來源的不同元件的混合物(例如啟動子、包膜序列、諸如此類)的病毒載體。在多種實施方案中,可以在下文所述方法和組合物中采用或是病毒載體自身或是包含病毒載體的病毒顆粒。
在本發(fā)明的其它實施方案中,可以通過多種技術(shù)施用編碼抑制TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的分子的核酸分子自身,包括例如與聚L-賴氨酸DNA復(fù)合物綴合的脫唾液酸血清類粘蛋白(ASOR)的施用(Cristano等,PNAS 92122-92126,1993)、與殺死的腺病毒相連的DNA(Curiel等,Hum.Gene Ther.3(2)147-154,1992)、由細胞轉(zhuǎn)染劑介導(dǎo)的導(dǎo)入(DMRIE-DOPE,Vical,加利福尼亞)、直接DNA注射(Acsadi等,Nature 352815-818,1991)、DNA配體(Wu等,J.Biol.Chem.26416985-16987,1989)、脂轉(zhuǎn)染(Felgner等,Proc.Natl.Acad.Sci.USA 847413-7417,1989)、脂質(zhì)體(Pickering等,Circ.89(1)13-21,1994;和Wang等,PNAS 847851-7855,1987);微彈轟擊(Williams等,PNAS 882726-2730,1991)、和編碼蛋白質(zhì)的核酸分子自身單獨的(Vile和Hart,CancerRes.533860-3864,1993)或采用PEG-核酸復(fù)合物的直接投遞。可以由本發(fā)明載體表達的分子的代表性實例包括核酶和反義分子,上文對二者都有更為詳細的討論。
骨礦物質(zhì)含量增加的確定可以使用X射線(例如雙重能量X射線吸收譜學(xué)或“DEXA”)來直接測定,或是通過骨周轉(zhuǎn)標志物(諸如成骨細胞特異性堿性磷酸酶、骨鈣蛋白、1型前膠原C′前肽(PICP)、和總堿性磷酸酶;參閱Comier,C.,Curr.Opin.Rheu.7243,1995)或骨再吸收標志物(吡啶啉、脫氧吡啶啉、N-端肽、尿液羥脯氨酸、血漿抗酒石酸酸性磷酸酶、和半乳糖基羥賴氨酸;參閱Comier,見上文)來推斷。還可以由體重計算骨質(zhì)的數(shù)量,或是通過本領(lǐng)域知道的其它方法(參閱Guinness-Hey,Metab.Bone Dis.and Relat.Res.5177-181,1984)。
對于本領(lǐng)域技術(shù)人員而言顯而易見的是,施用的數(shù)量和頻率當(dāng)然將取決于諸如正在治療的適應(yīng)證的本質(zhì)和嚴重程度、期望的響應(yīng)、患者的狀況、等等因素。通常,可以通過如上所述多種技術(shù)來施用組合物。
提供下列實施例作為示例而絕非限制。
實施例實施例1硬化性骨化病作圖到人第17號染色體長臂造成人硬化性骨化病的缺陷的遺傳作圖將造成此疾病的基因定位于人第17號染色體中編碼新TGF-β結(jié)合蛋白家族成員的區(qū)域。在硬化性骨化病人群中,骨骼的礦物質(zhì)密度相對于未患病人員而言展示出較大的增加。頭部的骨同樣呈現(xiàn)出生長過度。硬化性骨化病患者通常是健康的,盡管他們可能顯示出出生時不同程度的并指(趾)現(xiàn)象和不同程度的頭顱壓迫以及頭骨中的神經(jīng)壓迫。
與硬化性骨化病相關(guān)的基因缺陷的連鎖分析通過對采集自有此病史的24個南非Afrikaaner家族的DNA樣品進行純合性作圖來完成。(Sheffield等,1994,Human MolecularGenetics 31331-1335.“3號染色體上Bardet-Biedl綜合癥位點的鑒定以及有效同源性作圖方法的評估(Identification of a Bardet-Biedl syndrome locus onchromosome 3 and evaluation of an efficient a pproach tohomozygosity mapping)”)。南非Afrikaaner人群從遺傳上說是均一的;該人群是從幾個世紀前殖民于此地區(qū)的少數(shù)建立者繁衍而來的,并且,自從建立以來他們已由于地理和社會屏障而被隔離。在Afrikaaner群落之外的世界各地,硬化性骨化病都是罕見的,這顯示出該建立者群體中存在基因突變,且后來隨著人口的增多,突變的數(shù)目也有所增加。純合性作圖的應(yīng)用是以一定的假設(shè)為基礎(chǔ)的,即在來自同血緣家族和隔離人群的受影響個體中鄰近隱性突變的DNA作圖標記很可能是純合的。
選擇來自常染色體的一組371個微型衛(wèi)星標記(ResearchGenetics,Set 6)測定取自硬化性骨化病患者樣品的DNA集合的類型。用于此項分析的DNA樣品來自24個家庭的29名硬化性骨化病患者、59名未患病的家庭成員和同一種群的一組無關(guān)對照個體。所述集合由4-6個個體組成,他們或者是患病個體、來自血親家族的患病個體、父母和未患病的兄弟姐妹,或者是無關(guān)的對照。在無關(guān)個體組和大部分患病個體或家庭成員組中,所述標記的分析顯示各個標記有幾種等位基因大小。標記之一,即D17S 1299呈現(xiàn)出純合的跡象在數(shù)個患病個體集合中都是一條帶。
用D17S1299區(qū)(在17q12-q21)的總共19個標記對所有24個硬化性骨化病家族進行了分型。來自每個家族的患病個體顯示出在此區(qū)域是純合的,而29個個體中有25個對于核心單倍體是純合的;他們各自在D17S1787和D17S930之間具有相同的等位基因。其它四個個體具有匹配此單倍體的一條染色體和不匹配的另一條染色體??偠灾?,這些數(shù)據(jù)有力的顯示了此3 megabase區(qū)域包含了硬化性骨化病突變。對此3 megabase區(qū)域中大部分外顯子的序列分析識定出了新TGF-β結(jié)合蛋白編碼序列中的無義突變(在SEQ ID NO1的序列第117位C突變成T產(chǎn)生了終止密碼子)。此突變顯示出對于硬化性骨化病患者和Afrikaaner后代攜帶者而言是獨特的。此基因的特性通過鑒定其內(nèi)含子中的突變(內(nèi)含子+3位置處A突變成T)得到進一步的證實,所述突變導(dǎo)致已確診為硬化性骨化病的單個無關(guān)患者中mRNA加工不正確。
實施例2TGF-β結(jié)合蛋白基因表達的組織特異性A.利用RT-PCR進行人beer基因表達利用商品化的試劑盒(“用于第一條cDNA鏈合成的Superscript預(yù)擴增體系(Preamplification System for First-Strand cDNASynthesis)”,Life Technologies,Rockville,MD)從以下總RNA樣品中制備第一鏈cDNA人腦、人肝、人脾、人的胸腺、人的胎盤、人的骨骼肌、人的甲狀腺、人的垂體、人的成骨細胞(NHOst,來自Clonetics Corp.,San Diego,CA)、人骨肉瘤細胞系(Saos-2,ATCC#HTB-85)、人的硬骨、人的骨髓、人的軟骨、長尾黑顎猴(vervet monkey)的骨骼、釀酒酵母和人外周血單核細胞。除了以下種類是自己制備的之外,所有的RNA樣品均購買獲得(Clontech,Palo Alto,CA)人的成骨細胞、人的骨肉瘤細胞系、人的硬骨、人的軟骨和長尾黑顎猴的骨骼。這些自備的RNA樣品是使用商品化的試劑盒(“TRI試劑”,Molecular Research Center,Inc.,Cincinnati,OH)制備。
對這些樣品進行PCR,并另外用人基因組樣品進行PCR作為對照。有義Beer寡核苷酸引物的序列為5’-CCGGAGCTGGAGAACAACAAG-3’(SEQ ID NO19)。反義Beer寡核苷酸引物的序列為5’-GCACTGGCCGGAGCACACC-3’(SEQ ID NO20)。此外,用針對人β-肌動蛋白基因的引物進行PCR作為對照。有義β-肌動蛋白寡核苷酸引物的序列為5’-AGGCCAACCGCGAGAAGATGA CC-3’(SEQ ID NO21)。反義β-肌動蛋白寡核苷酸引物的序列為5’-GAAGTCCAGGGCGACGTAGCA-3’(SEQ ID NO22)。用標準條件在25μl反應(yīng)體系中進行PCR,退火溫度為61℃。用Beer引物進行32個循環(huán)的PCR,而用β-肌動蛋白引物則進行24個循環(huán)。
擴增后,將來自各次反應(yīng)的12μl樣品通過瓊脂糖凝膠電泳和溴化乙錠染色進行分析。參閱圖2A。
B.小鼠胚胎切片的RNA原位雜交用制造商的方案,以反義和有義方向?qū)⑷L小鼠Beer cDNA(Sequence ID No.11)克隆入pCR2.1載體(Invitrogen,Carlsbad,CA)中。用Ambion,Inc(Austin,TX)提供的體外轉(zhuǎn)錄試劑合成35S-α-GTP-標記的cRNA有義和反義轉(zhuǎn)錄產(chǎn)物。按照Lyons等的方案(J.CellBiol.1112427-2436,1990)進行原位雜交。
小鼠Beer cRNA探針檢測正在發(fā)育的小鼠胚胎的神經(jīng)管、肢芽、血管和硬化軟骨中表達的特異信息。圖3的模塊A顯示了肢(1)芽頂端外胚層脊背(apical ectodermal ridge,aer)、血管(bv)和神經(jīng)管(nt)中的表達。模塊B顯示了大腦第4腦室(4)中的表達。模塊C顯示了下顎(ma)頸椎骨(cv)中、枕骨(oc)、上顎(pa)和血管(bv)中的表達。模塊D顯示了肋骨(r)和心臟瓣膜(va)中的表達。模塊A是10.5dpc胚胎的橫切片。模塊B是12.5dpc胚胎的縱切片,而模塊C和D是15.5dpc胚胎的縱切片。
ba=鰓弓,h=心臟,te=端腦(前腦),b=腦,f=額鼻塊,g=腸,h=心臟,j=顎,li=肝,lu=肺,ot=耳泡(otic vesicle),ao=,sc=脊髓,skm=骨骼肌,ns=鼻竇,th=胸腺,to=舌,fl=前肢,di=橫膈膜實施例3重組Beer蛋白質(zhì)的表達和純化A.在COS-1細胞中的表達用以下PCR寡核苷酸引物擴增編碼全長人Beer蛋白的DNA序列5’寡核苷酸引物的序列為5’-AAGCTTGGTACCATGCAGCTCCCAC-3’(SEQ ID NO23),并且包含HindIII限制性酶切位點(粗體),之后是Beer基因的19個核苷酸,其在推測的氨基末端起始密碼子(ATG)之前6bp開始。3’寡核苷酸引物的序列為5’-AAGCTTCTACTTGTCATCGTCGTCCTTGTAGTCGTAGGCGTTCTCCAGCT-3’(SEQ ID NO24),并包含HindIII限制性酶切位點(粗體),之后是反向互補終止密碼子(CTA),其后是FLAG表位的反向互補序列(下劃線,Sigma-Aldrich Co.,St.Louis,MO),該互補序列側(cè)翼是Beer羧基末端5個氨基酸的編碼核苷酸的反向互補序列。經(jīng)TA克隆PCR產(chǎn)物(“原創(chuàng)的TA克隆試劑盒”,Invitrogen,Carlsbad,CA)并通過DNA測序篩選各個克隆。然后將序列已證實的克隆用HindIII消化,并用商品化的試劑(“QIAquick Gel Extraction Kit”,Qiagen Inc.,Valencia,CA)在1.5%瓊脂糖凝膠上進行純化。然后用T4DNA連接酶將此片段連接至經(jīng)HindIII消化、磷酸酶處理的pcDNA3.1質(zhì)粒(Invitrogen,Carlsbad,CA)上。轉(zhuǎn)化大腸桿菌DH10B,并鋪在含100μg/ml氨芐青霉素的LB平板上。通過基于PCR的篩選鑒定攜帶正確定向的預(yù)期重組子的菌落,所用5’引物相應(yīng)于pcDNA 3.1中的T7啟動子/啟動位點,而3’引物具有序列5’-GCACTGGCCGGAGCACACC-3’(SEQ ID NO25),其相應(yīng)于內(nèi)在Beer序列的反向互補序列。已克隆片段的序列通過DNA測序證實。
利用COS-1細胞(ATCC#CRL-1650)進行轉(zhuǎn)染。按制造商提供的方案,利用商品化的試劑盒(“DEAE-葡聚糖轉(zhuǎn)染試劑盒”,SigmaChemical Co.,St.Louis,MO)轉(zhuǎn)染50μg表達質(zhì)粒pcDNA-Beer-Flag。轉(zhuǎn)染后的最終培養(yǎng)基是含0.1%胎牛血清的DMEM(Life Technologies,Rockville,MD)。培養(yǎng)4天后,去掉培養(yǎng)基。利用抗-FLAG_M2單克隆抗體(Sigma-Aldrich Co.,St.Louis,MO)通過SDS-PAGE和Western印跡分析重組Beer的表達。用抗-FLAG M2親和柱(“哺乳動物瞬時表達體系”,Sigma-Aldrich Co.,St.Louis,MO)進行重組BEER蛋白質(zhì)的純化。用抗-FLAG M2單克隆抗體通過SDS-PAGE和Western印跡分析枉層析產(chǎn)物。
B.在SF9昆蟲細胞中的表達用標準條件和以下引物經(jīng)PCR擴增人Beer基因序列有義引物5’-GTCGTCGGATCCATGGGGTGGCAGGCGTTCAAGAATGAT-3’(SEQ ID NO26)反義引物5’-GTCGTCAAGCTTCTACTTGTCATCGTCCTTGTAGTCGTAGGCGTTCTCCAGCTCGGC-3’(SEQ ID NO27)產(chǎn)生的cDNA包含具有兩個修飾的Beer編碼區(qū)。N末端分泌信號被去除,并將FLAG表位標簽(Sigma)讀框一致地融合入插入片段C-末端。添加BamH1和HindIII克隆位點,并將基因亞克隆入pMelBac載體(Invitrogen)中,以便用標準方法轉(zhuǎn)移入桿狀病毒表達載體中。
用Bac-N-Blue轉(zhuǎn)染試劑盒(Invitrogen)制備表達Beer蛋白質(zhì)的重組桿狀病毒并按照制造商的說明書進行純化。
將SF9細胞(Invitrogen)保持在含10%胎牛血清的TNM_FH培養(yǎng)基(Invitrogen)中。為了進行蛋白質(zhì)表達,以大于10的MOI感染旋轉(zhuǎn)燒瓶中的SF9培養(yǎng)物。5天內(nèi)每天采集培養(yǎng)基和細胞樣品,用抗-FLAGM2單克隆抗體(Sigma)或抗-Beer兔多克隆抗血清通過蛋白質(zhì)印跡監(jiān)測Beer的表達。
5天后,離心收獲桿狀病毒感染的SF9細胞,并用高鹽抽提緩沖液(1.5M NaCl,50mM Tris pH7.5)從細胞沉淀中提取細胞相關(guān)蛋白質(zhì)。離心使提取物(每300ml培養(yǎng)物20ml)澄清,用4升Tris緩沖鹽(150mM NaCl,50mM Tris pH7.5)透析3次,并再次離心澄清。將此高鹽組分加到Hitrap Heparin(Pharmacia;床體積5ml)上,柱子用HEPES緩沖鹽水(25mM HEPES 7.5,150mM NaCl)粗洗,并用150mM NaCl至1200mM NaCl梯度洗脫被結(jié)合的蛋白質(zhì)。在大約800mMNaCl處觀察到Beer洗脫。在含Beer的組分中加入10%甘油和1mM DTT并凍存于-80℃。
實施例4抗Beer、Gremlin和Dan的多克隆抗體的制備和檢測A.抗原的制備用標準方法擴增人Beer、人Gremlin和人Dan的DNA序列,所用的寡核苷酸引物如下H.Beer有義5′-GACTTGGATCCCAGGGGTGGCAGGCGTTC-3′(SEQ ID NO28)反義5′-AGCATAAGCTTCTAGTAGGCGTTCTCCAG-3′(SEQ ID NO29)H.Gremlin有義5′-GACTTGGATCCGAAGGGAAAAAGAAAGGG-3′(SEQ ID NO30)30)反義5′-AGCATAAGCTTTTAATCCAAATCGATGGA-3′(SEQ ID NO31)H.Dan有義5′-ACTACGAGCTCGGCCCCACCACCCATCAACAAG-3′(SEQ ID NO32)反義5′-ACTTAGAAGCTTTCAGTCCTCAGCCCCCTCTTCC-3′(SEQ ID NO33)在各情況下,所列舉的引物擴增除了分泌信號序列之外的整個編碼區(qū)。其中,對于Beer和Gfemlin而言,包含在位點BamHI/HindIII處、對于Dan而言包含在位點sacI/HindIII亞克隆入細菌表達載體pQE-30(Qiagen Inc.,Valencia,CA)的限制性切點。pQE30在克隆區(qū)的5’末端包含了6×His標簽的編碼序列。將完成的構(gòu)建體轉(zhuǎn)化入大腸桿菌菌株M-15/pRep(Qiagen Inc)并測序查證各個克隆。在M-15/pRep中的蛋白質(zhì)表達和純化(與偶聯(lián)在瓊脂糖上的Ni-NTA結(jié)合的6×組氨酸親和標簽)依照制造商的說明書(Qiagen,TheQIAexpressionist)進行。
利用增溶作用在6M胍中大量回收大腸桿菌來源的Beer蛋白質(zhì),并透析至2-4M胍中,以防止在貯存期間沉淀。Gremlin和Dan蛋白質(zhì)則通過溶解于6M胍中得到更大量的回收,純化后的胍濃度達到0.5M。
B.多克隆抗體的產(chǎn)生和檢測按照標準方案(R & R抗體,Stanwood,WA;用于兔免疫和抗血清回收的標準方案(standard protocol for rabbit immunization andantisera recovery);分子生物學(xué)中的簡潔方法(Short Protocolsin Molecular Biology).第二版1992.11.37-11.41,投稿人HelenM.Cooper和Yvonne Paterson;用重要的生物溶液產(chǎn)生雞抗血清(chicken antisera was generated with Strategic Biosolutions),Ramona,CA)在兔子和雞宿主中產(chǎn)生針對三種抗原中每一種的多克隆抗體。
通過Western印跡法篩選兔抗血清和雞蛋Igy組分的活性。經(jīng)PAGE分離三種抗原中的每一種并轉(zhuǎn)染至0.45um的硝酸纖維素膜(Novex,San Diego,CA)上。將膜切成條,每條包含大約75ng抗原。將這些膜條用3%的Blotting Grade Block(Bio-Rad Laboratories,Hercules,CA)封閉并在1×Tris緩沖鹽水(TBS)/0.02%TWEEN緩沖液中洗3次。將這些膜條與一抗(免疫前放血,將兔抗血清或雞蛋IgY用封閉緩沖液稀釋,稀釋范圍為1∶100至1∶10,000)一起溫和搖動保溫1小時。再用1×TBS/0.02%TWEEN洗三次,然后與二抗(綴合了驢抗兔抗體的過氧化物酶,Amersham Life Science,Piscataway,NJ;或綴合了驢抗雞抗體的過氧化物酶,Jackson Immuno Research,WestGrove,PA)一起保溫1小時。最后再用1×TBS/0.02%TWEEN洗三次,并將膜條用Lumi-Light Western印跡底物顯色(Roche MolecularBiochemicals,Mannheim,Germany)。
C.抗體交叉反應(yīng)性檢測在完成以上章節(jié)所描述的流程之后,將Beer、Gremlin或Dan的硝酸纖維素膜條與它們各自的兔抗血清或雞蛋IgY稀釋液(1∶5000和1∶10,000)以及剩余兩種抗原的抗血清或雞蛋Igy(稀釋1∶1000和1∶5000倍)一起保溫。提高不匹配抗體的水平以檢測只有在提高濃度下才可能被觀察到的那些抗體的低親和力結(jié)合。按照上述流程,所用方案和呈色時間對于所有三種結(jié)合情況而言都是相同的。對于任一種被檢測抗原而言都未觀察到抗原交叉反應(yīng)性。
實施例5Beer與TGF-β超家族蛋白質(zhì)的相互反應(yīng)用免疫沉淀方法研究Beer與來自不同系統(tǒng)發(fā)生支的TGF-β超家族蛋白質(zhì)的相互作用。已純化的TGFβ-1、TGFβ-2、TGFβ-3、BMP-4、BMP-5、BMP-6和GDNF獲自商品化途徑(R&D systems;Minneapolis,MN)。代表性方案如下。將部分純化的Beer在HEPES緩沖鹽水(25mM HEPES 7.5,150mM NaCl)中透析。在300μl IP緩沖液(150mM NaCl,25mM TrispH7.5,1mM EDTA,1.4mM β-巰基乙醇,0.5% triton×100和10%甘油)中進行免疫沉淀。在存在或缺失500ng FLAG表位-標記Beer的條件下將30ng重組人BMP-5蛋白質(zhì)(R&D systems)加到15μl FLAG親和基質(zhì)(Sigma;St Louis MO)中。將蛋白質(zhì)在4℃保溫4小時,并隨后用IP緩沖液洗滌與親和基質(zhì)相聯(lián)的蛋白質(zhì)5次(每次1ml)。用60μl 1×SDS PAGE樣品緩沖液從親和基質(zhì)上洗脫被結(jié)合的蛋白質(zhì)。用SDS PAGE拆分蛋白質(zhì)并用抗-BMP-5抗血清(Research Diagnostics,Inc)通過western印跡檢測與Beer相連的BMP-5(見圖5)。
BEER配體結(jié)合試驗將FLAG-Beer蛋白質(zhì)(20ng)加入100μl PBS/0.2%BSA中,并吸附于預(yù)先用抗FLAG單克隆抗體(Sigma;St Louis MO)包被并用含10%BSA的PBS封閉的96孔微量滴定板的各個孔中。這一過程在室溫進行60分鐘。除去此蛋白質(zhì)溶液并漂洗各孔以去除未結(jié)合的蛋白質(zhì)。在各孔中加入濃度范圍從10pM至500nM的溶于PBS/0.2%BSA的BMP-5,并在室溫保溫2小時。去除結(jié)合溶液并用200μl體積的PBS/0.2%BSA漂洗平板三次。然后用BMP-5抗血清通過ELISA(F.M.Ausubel etal(1998)分子生物學(xué)通用方法(Current Protocols in Mol Biol.)卷211.2.1-11.2.22)檢測BMP-5的水平。通過從總的結(jié)合中扣除非特異性結(jié)合來計算特異性結(jié)合,并用LIGAND軟件(Munson和Podbard,Anal.Biochem.,107,p220-239,(1980)進行分析。
在此方法的修飾方案中,將Beer進行改造并表達為人Fc融合蛋白。同樣的,改造配體BMP并將其表達為小鼠Fc融合蛋白。將這些蛋白質(zhì)一起保溫并如Mellor等所述用均一時間解析熒光檢測法進行檢測(G.W.Mellor等,J of Biomol Screening,3(2)91-99,1998)。
實施例6有關(guān)TGF-β結(jié)合蛋白與TGF-β家族成員結(jié)合的抑制作用的篩選試驗重復(fù)上述試驗,其中有兩處不同。首先,BMP濃度固定為先前所確定的Kd。其次,拮抗劑候選物的集合以固定濃度加入(如果是小有機分子集合則為20μM,在抗體研究中則為1μM)。這些TGF-β結(jié)合蛋白結(jié)合的候選分子(拮抗劑)包括商品化來源的有機化合物或代表不同化學(xué)結(jié)構(gòu)的內(nèi)部合并物。用DMSO將這些化合物制備成貯液并在標準實驗條件下以小于1%的終體積加入檢測孔中。將它們與BMP和BEER一起室溫保溫2小時,去除溶液并如前所述對被結(jié)合的BMP進行定量。在缺乏化合物或抗體的條件下觀察到抑制了40%的BMP結(jié)合的試劑被認為是此相互作用的拮抗劑。這些試劑基于滴定試驗被進一步評估為潛在的抑制劑,所述的滴定試驗用于測定它們的抑制作用常數(shù)以及它們對TGF-β結(jié)合蛋白結(jié)合親和力的影響。還可進行可比較的特異性對照試驗以確定已經(jīng)鑒定的拮抗劑的選擇性特征,該研究使用了依賴于BMP配體作用的檢測法(例如,BMP/BMP受體競爭性試驗)。
實施例7對TGF-β結(jié)合蛋白定位于骨基質(zhì)的抑制作用對Nicolas的方法(Nicolas,V.Calcif Tissue Int 57206,1995)加以修改,用于評估對定位于骨基質(zhì)(羥磷灰石)的抑制作用。簡而言之,如Nicolas(同上文)所述制備125I-標記的TGF-β結(jié)合蛋白。將羥磷灰石加入裝備了聚丙烯濾膜(Polyfiltroninc,Weymouth MA)的96孔微量滴定板的各孔中。將TGF-β結(jié)合蛋白加入含0.2%白蛋白的PBS緩沖液中。用此緩沖液將含有基質(zhì)的孔漂洗3次。被吸附的TGF-β結(jié)合蛋白用0.3M NaOH洗脫并定量。
通過將TGF-β結(jié)合蛋白與待測分子一起保溫并如上所述將混合物施加到基質(zhì)上來進行抑制劑的鑒定。用含0.2%白蛋白的PBS緩沖液將基質(zhì)洗3次。被吸附的TGF-β結(jié)合蛋白用0.3M NaOH洗脫并定量。在無化合物或抗體的條件下觀察到抑制了40%TGF-β結(jié)合蛋白結(jié)合的試劑被認為是骨定位抑制劑。這些抑制劑通過劑量反應(yīng)試驗測定其抑制常數(shù)及其對TGF-B結(jié)合蛋白結(jié)合親和力的影響而被進一步定性。
實施例8TGF-β結(jié)合蛋白突變體的構(gòu)建A.誘變pBluescript SK中的全長TGF-β結(jié)合蛋白cDNA被用作誘變的模板。簡而言之,利用適當(dāng)?shù)囊?參閱上文討論部分)以及Vent DNA聚合酶(New England Biolabs,Beverly,MA)通過聚合酶鏈式反應(yīng)產(chǎn)生DNA片段。在57℃退火溫度下利用制造商提供的緩沖液進行聚合酶鏈式反應(yīng)23個循環(huán)。然后將產(chǎn)物暴露于兩種限制性酶中,并在用瓊脂糖凝膠電泳進行分離后,連接回其中的匹配序列已通過酶促消化去除的pRBP4-503中。通過DNA測序檢驗突變體的完整性。
B.突變體TGF-β結(jié)合蛋白的哺乳動物細胞表達和分離將突變體TGF-β結(jié)合蛋白cDNAs轉(zhuǎn)移入實施例3中所述的pcDNA3.1哺乳動物表達載體。在核實序列后,將產(chǎn)生的構(gòu)建體轉(zhuǎn)染入COS-1細胞,并如實施例3所述純化分泌的蛋白質(zhì)。
實施例9動物模型-I過表達BEER基因的轉(zhuǎn)基因小鼠的產(chǎn)生利用分離自CITB小鼠基因組DNA文庫(由Research Genetics,Huntsville,AL分裝)的大約200kb BAC克隆15G5測定小鼠Beer基因的全序列及其5′和3′側(cè)翼區(qū)。將包含完整基因體以及大約17kb的5′側(cè)翼區(qū)和大約20kb的3′側(cè)翼序列的41kb SalI片段亞克隆入SuperCosI粘粒載體(Stratagene,La Jolla,CA)的BamHI位點,并于大腸桿菌菌株DH10B中增殖。然后用常規(guī)方式分別凝膠純化來自此粘粒構(gòu)建體且包括完整小鼠Beer基因以及17kb和14kb的5′和3′側(cè)翼序列的35kb MluI-AviII限制性片段(Sequence No.6),并將它用于小鼠受精卵的顯微注射(DNX Transgenics;US Patent No.4,873,191)。以存活后代中有5-30%的頻率獲得其中所克隆的DNA片段隨機整合入基因組中的建立者動物。通過對提取自諸如尾端等小量小鼠組織的基因組DNA進行Southern印跡分析來確定轉(zhuǎn)基因的存在。用以下方案提取DNA在55℃用含200mM NaCl,100mM Tris pH8.5,5mM EDTA,0.2%SDS和0.5mg/ml蛋白酶K的裂解緩沖液消化組織過夜。次日,將DNA用酚/氯仿(50∶50)抽提一次,用氯仿/異戊醇(24∶1)抽提一次并用酒精沉淀。將各DNA樣品8-10μg重懸于TE(10mM TrispH7.5,1mM EDTA)中,用諸如EcoRI等限制性內(nèi)切酶消化,進行凝膠電泳并轉(zhuǎn)移至諸如HyBondN+(Amersham,Arlington Heights,IL)等帶電荷的尼龍膜上。然后將所產(chǎn)生的濾膜與來自小鼠Beer基因座的DNA的放射性標記片段雜交,所述片段能識別來自內(nèi)源基因座的片段和來自轉(zhuǎn)基因的不同大小的片段二者。將建立者動物與正常非轉(zhuǎn)基因小鼠交配產(chǎn)生足夠數(shù)目的轉(zhuǎn)基因和非轉(zhuǎn)基因后代,在其中測定Beer基因過表達的效應(yīng)。為了進行這些試驗,用各個年齡(例如,1天、3周、6周、4個月)的動物進行許多不同的試驗,所述試驗被設(shè)計成探知總的骨骼形成、骨礦物質(zhì)密度、骨礦物質(zhì)含量、破骨細胞和成骨細胞的活性、軟骨內(nèi)骨化的程度、軟骨形成等。轉(zhuǎn)基因的轉(zhuǎn)錄活性可通過從各種組織中提取RNA并借助RT-PCR檢測法進行測定,該RT-PCR檢測法利用了轉(zhuǎn)基因所來源的小鼠株系(129Sv/J)和用于DNA顯微注射的小鼠株系[(C57BL5/J×SJL/J)F2]之間單核苷酸多態(tài)性的優(yōu)勢。
動物模型-II通過同源重組破壞小鼠Beer基因可用胚胎干(ES)細胞同源重組滅活內(nèi)源小鼠Beer基因并隨后產(chǎn)生具有功能喪失的突變的動物。將諸如大腸桿菌β-半乳糖苷酶基因等報道基因插入打靶載體中,從而使其表達受內(nèi)源Beer基因啟動子和翻譯起始信號的調(diào)控。以此方式,可以測定攜帶目標等位基因的動物中Beer基因表達的空間和時間模式。
打靶載體的構(gòu)建首先是將來自pGT-N29(New England Biolabs,Beverly,MA)的藥物可篩選的由磷酸甘油酸激酶(PGK)啟動子驅(qū)動的新霉素抗性基因(neo)盒克隆入克隆載體pSP72(Promega,Madson,WI)中。利用PCR使PGKneo盒的兩側(cè)具有噬菌體P1 loxP位點,它是P1 Cre重組酶的識別位點(Hoess et al.,PNAS USA,793398,1982)。這使得后來可以去除打靶ES細胞或ES細胞來源動物中的neo-抗性標記(US Patent 4,959,317)。PCR引物包含34個核苷酸(ntd)的loxP序列、與PGKneo盒5′和3′末端互補的15-25 ntd以及用于克隆入pSP72的限制性酶識別位點(在有義引物中是BamHI,而在反義引物中是EcoRI)。有義引物是5′-AATCTGGATCCATAACTTCGTATAGCATACATTATACGAAGTTATCTGCAG GATTCGAGGGCCCCT-3′(SEQ ID NO34);反義引物是5′-AATCTGAATTCCACCGGTGTTAATTAAATAACTTCGTATAATGTATGCTATACGA AGTTATAGATCTAGAG TCAGCTTCTGA-3′(SEQ ID NO35)。
下一步是將含有大腸桿菌β-半乳糖苷酶基因和來自pSVβ(Clontech,Palo Alto,CA)的SV40聚腺苷酸化信號的3.6kbXhoI-HindIII片段克隆入pSP72-PGKneo質(zhì)粒。通過由BAC克隆15G5擴增2.4kb片段得到來自小鼠Beer基因座的同源物的“短臂”。該片段的3′末端與Beer基因的翻譯起始位點一致,且PCR中所用的反義引物還包括與β-半乳糖苷酶基因5’末端互補的30ntd,從而使其編碼區(qū)能與Beer起始位點讀框一致地融合。將“短臂”引入pSP72-βgal-PGKneo質(zhì)粒所采用的方法是在β-gal基因上游的位點線性化質(zhì)粒,然后將此片段與“短臂”PCR產(chǎn)物一起共轉(zhuǎn)化,并選擇其中PCR產(chǎn)物通過同源重組被整合了的質(zhì)粒。用于“短臂”擴增的有義引物包括與pSP72載體互補的30ntd,從而使得此重組得以進行。有義引物的序列是5′-ATTTAGGTGACACTATAGAACTCGAGCAGCTGAAGCTTAAC CACATGGTGGCTCACAACCAT-3′(SEQ ID NO36),而反義引物的序列是5′-AACGACGGCCAGTGAATCCGTAATCATGGTCATGCTGCCAGGTGGAGGAGGGCA-3′(SEQ ID NO37)。
通過由BAC克隆15G5擴增6.1kb片段而得到Beer基因座的“長臂”,所用引物中還引入了切點稀有的限制性酶位點SgrAI、FseI、AscI和PacI。具體而言,有義引物的序列是5′-ATTACCACCGGTGACACCCGCTTCCTGACAG-3′(SEQ ID NO38);反義引物的序列是5′-ATTACTTAATTAAACATGGCGCGCCATATGGCCGGCCCCTAATTGCGGCGCATCGTTAATT-3′(SEQ ID NO39)。將所產(chǎn)生的PCR產(chǎn)物克隆入TA載體(Invitrogen,Carlsbad,CA)中作為中間產(chǎn)物。
小鼠Beer基因打靶構(gòu)建體還包括第二個可選擇標記,即在勞氏肉瘤病毒長末端重復(fù)元件(RSV LTR)調(diào)控下的單純皰疹病毒胸苷激酶基因(HSVTK)。此基因的表達使得哺乳動物細胞對gancyclovir敏感(且不能生存);因此它是用于對抗選擇其中所述構(gòu)建體通過非重組活動發(fā)生整合的新霉素抗性細胞的便利方法(美國專利5,464,764)。使用使其隨后可克隆入“長臂”-TA載體質(zhì)粒的FseI和AscI位點內(nèi)的引物,自pPS1337擴增RSVLTR-HSVTK盒。對于此PCR而言,有義引物的序列是5′-ATTACGGCCGGCCGCAAA GGAATTCAAGA TCTGA-3′(SEQ ID NO40);反義引物的序列是5′-ATTACGGCGCGCCCCTCACAGGCCGCACCCAGCT-3′(SEQ ID NO41)。
打靶載體構(gòu)建中的最后步驟包括將含“長臂”和RSVLTR-HSVTK基因的8.8kb SgrAI-AscI片段克隆入pSP72-“短臂”-βgal-PGKneo質(zhì)粒的SgrAI和AscI位點。在電穿孔進入ES細胞之前用AscI或PacI消化將此打靶載體線性化。
實施例10反義鏈介導(dǎo)的Beer失活以重疊格式制備17-個核苷酸的反義寡核苷酸,以此方式,第一寡核苷酸的5′末端與Beer轉(zhuǎn)錄物的翻譯起始AUG重疊,接連著的寡核苷酸的5’末端相對于Beer AUG而言沿5’方向滾動增加的5個核苷酸處(最多在離其50個核苷酸處)。設(shè)計并制備對應(yīng)的對照寡核苷酸,所用的堿基組成相當(dāng),但在序列中重新分布以抑制其與編碼mRNA的任何顯著雜交。通過陽離子脂質(zhì)投遞而將試劑投遞至待測細胞體系(P.L.Felgner,Proc.Natl.Acad.Sci.USA 847413,1987)。將2μg反義寡核苷酸加入100μl簡化血清培養(yǎng)基(Opti-MEMI簡化血清培養(yǎng)基,Life Technologies,Gaithersburg MD)中,并在100μl簡化血清培養(yǎng)基中與Lipofectin試劑(6μl)(Life Technologies,Gaithersburg MD)混合。將這些試劑混合后,在室溫絡(luò)合30分鐘,并將混合物加入預(yù)先接種的MC3T3E21或KS483細胞中。培養(yǎng)這些細胞并回收mRNA。利用RT-PCR并結(jié)合Beer特異引物監(jiān)測Beer mRNA。此外,收集分開的實驗孔并如實施例4所述通過western印跡法鑒定蛋白質(zhì)水平。收獲細胞后,重懸于裂解緩沖液(50mM Tris pH7.5,20mM NaCl,1mM EDTA,1%SDS)中并收集可溶性蛋白。將此材料加至10-20%梯度變性SDS PAGE中。將被分開的蛋白質(zhì)轉(zhuǎn)移至硝酸纖維素濾膜上,并利用如上所述的抗體試劑進行western印跡分析。平行地,將對照寡核苷酸加入相同的培養(yǎng)物中并重復(fù)實驗操作。如果與對照混合的寡核苷酸相比,在各情況下用反義寡核苷酸處理導(dǎo)致50%的改變,則BeermRNA或蛋白質(zhì)水平的降低被認為是顯著的。此方法能使得選擇性失活基因并隨后對組織培養(yǎng)模型中的礦物化結(jié)節(jié)進行表型表征。
實施例11硬化素核心區(qū)的模型模擬同源性識別技術(shù)(例如,PSI-BLAST(Altschul等,Nucleic AcidsRes.253389-402(1997))、FUGUE(Shi等,J.Mol.Biol.310243-57(2001))暗示SOST(SOST_Core)的核心區(qū)采取了胱氨酸結(jié)折疊的形式。FUGUE是檢測序列與結(jié)構(gòu)之間同源性的靈敏方法。實驗測定的3D結(jié)構(gòu)已知的人絨毛膜促性腺激素β(hCG-β)通過FUGUE(Shi等,同上)被確定為SOST_Core最接近的同源物。因此,hCG-β被用作結(jié)構(gòu)模板來構(gòu)建SOST_Core的3D模型。
SOST_Core與其密切同源物的序列比對如圖7中所示。在序列比對所顯示的同源物中,只有hCG-β(CGHB)具有已知的3D結(jié)構(gòu)。SOST_Core和hCG-β之間的序列同一性大約為25%。在整個家族中有8個CYS殘基是保守的,加強了SOST_Core和hCG-β之間整體結(jié)構(gòu)的相似性。在“結(jié)”構(gòu)型中三對胱氨酸(1-5,3-7,4-8)形成二硫鍵(在圖7中以實心線表示),它是胱氨酸-結(jié)折疊的特征。在圖7中顯示為虛線的一個額外二硫鍵(2-6)對于此家族而言是獨特的,將此家族蛋白質(zhì)與其它胱氨酸-結(jié)家族蛋白質(zhì)(例如,TGF-β,BMP)區(qū)別開來。
用PDB(Berman等,Acta Crystallogr.D.Biol..Crystallogr.58(Pt 6 Pt1)899-907(2002))登錄號1HCN,以hCG-β的3D結(jié)構(gòu)(Wuet al.,Structure 2545-58(1994))作為結(jié)構(gòu)模板模擬SOST_Core。用MODELER(Sali & Blundell,J.Mol.Biol.234779-815(1993))對模型進行計算。最佳模型的快照如圖8中所示。
大部分胱氨酸-結(jié)蛋白質(zhì)形成二聚體,因為在單體中缺乏疏水核心(Scheufler等,同上;Schlunegger和Grutter,J.Mol.Biol.231445-58(1993));Wu等,同上)。SOST很可能遵循相似的規(guī)則并形成均二聚體以提高其穩(wěn)定性。構(gòu)建二聚體化SOST_Core區(qū)的模型有幾個難題,因為(1)SOST_Core和hCG-β之間的序列相似性較低(25%);(2)hCG-β不形成均二聚體,而是與hCG-α形成雜二聚體;且(3)在來自不同家族的二聚體化胱氨酸-結(jié)蛋白質(zhì)中觀察到許多相對構(gòu)象不同的單體(例如,PDGF,TGF-β,神經(jīng)營養(yǎng)蛋白,IL-17F,促性腺激素),這表明SOST的二聚體構(gòu)象可能明顯與hCG-α/β雜二聚體構(gòu)象不同。在構(gòu)建模型時,用結(jié)構(gòu)疊加技術(shù)與手工調(diào)整相結(jié)合,將hCG-α置換為來自雜二聚體結(jié)構(gòu)(1HCN)的hCG-β,然后按照假hCG-β均二聚體結(jié)構(gòu)建立SOST_Core均二聚體。最后的模型如圖9中所示。
實施例12模擬SOST-BMP相互作用此實施例描述了BMP上I型和II型受體的蛋白質(zhì)模擬,其中涉及BMP和SOST之間的相互作用。
競爭性研究證實了SOST與I型和II型受體競爭性結(jié)合BMP。在基于ELISA的競爭性試驗中,BMP-6與硬化素-包被的表面(300ng/孔)以高親和力(KD=3.4nM)選擇性地相互作用。提高量的BMP受體IA(FC融合構(gòu)建體)可與硬化素競爭結(jié)合BMP-6(11nM)(IC50=114nM)。10倍摩爾濃度過量的BMP受體足以使硬化素與BMP-6的結(jié)合減少大約50%。用BMP受體II-FC融合蛋白(IC50=36nM)和DAN(IC50=43nM)也觀察到此競爭作用。該檢測法的特異性表現(xiàn)為在硬化素和rActivinR1B-FC融合蛋白之間缺乏與BMP-6結(jié)合的競爭作用,所述的rActivinR1B-FC融合蛋白是不結(jié)合BMP的TGF-β受體家族成員。
BMP多肽上的I型和II型受體結(jié)合位點已被作圖,并且在空間上是分離的(Scheufler等,同上文;Innis等,同上文;Nickel等,同上文;Hart等,同上文)。頭蛋白是以高親和力與BMP結(jié)合的另一種BMP拮抗劑,它通過頭蛋白的N末端部分在I型和II型受體結(jié)合位點處都與BMP接觸(Groppe等,同上文)。在接近C末端的核心區(qū)內(nèi)的兩條β-鏈也在II型受體結(jié)合位點處接觸BMP。
手工調(diào)校的頭蛋白和SOST的序列比對顯示這兩種多肽在蛋白質(zhì)N末端部分之間和核心區(qū)之間共有序列相似性。氨基酸序列比對如圖10中所示。形成特征性cys-結(jié)的半胱氨酸殘基在頭蛋白和SOST之間是保守的??傮w序列同一性是24%,而N末端結(jié)合區(qū)(序列比對位置1-45)內(nèi)的序列同一性是33%。在頭蛋白N-末端結(jié)合區(qū)內(nèi)的兩個殘基,即在序列比對中第21位的Leu(L)和第23位的Glu(E),據(jù)報道在BMP結(jié)合中起重要作用(Groppe等,同上文)。這兩個殘基在SOST中也是保守的。核心區(qū)(序列比對的第131-228位)內(nèi)的序列相似性大約為20%,但cys-結(jié)骨架被保持,且足夠數(shù)目的關(guān)鍵殘基是保守的,這證實了頭蛋白和SOST之間的同源性。
此外還將頭蛋白結(jié)構(gòu)與SOST比較以了解兩個SOST單體是如何二聚體化的。正如圖11中所示的,頭蛋白結(jié)構(gòu)暗示N末端區(qū)和核心區(qū)之間的接頭不僅在連接這兩個區(qū)域之間起作用,還形成了兩頭蛋白單體之間二聚化界面的部分。頭蛋白和SOST之間的一個主要差異是N末端區(qū)和核心區(qū)之間的接頭在SOST中要低得多。
SOST的C末端區(qū)可能在SOST二聚化的過程中發(fā)揮作用。頭蛋白的序列結(jié)束于核心區(qū),而SOST則有一額外的C末端區(qū)。在頭蛋白結(jié)構(gòu)中,兩個頭蛋白單體的C末端以二硫鍵連接。因而,SOST的C末端區(qū)開始向兩個單體的界面靠近,并且可能有助于二聚化。此外,二級結(jié)構(gòu)預(yù)測顯示SOSR C末端區(qū)的某些部分有形成螺旋的趨勢。SOST中的該區(qū)域可能負責(zé)二聚化活性,有可能是通過螺旋-螺旋堆積實現(xiàn)的,這模擬了頭蛋白中較長接頭的功能。頭蛋白和SOST結(jié)構(gòu)之間的另一差異是在SOST核心區(qū)內(nèi)序列比對的第169-185位的氨基酸插入序列(見圖10)。此插入延長了β-發(fā)夾,它指向頭蛋白結(jié)構(gòu)中的二聚化界面(在圖11中顯示為在單體中間且在C末端半胱氨酸殘基上方的環(huán)形區(qū))。此延長的β-發(fā)夾還可能有助于SOST二聚化。
實施例13SOST肽免疫原的設(shè)計和制備此實施例描述了SOST肽免疫原的有關(guān)設(shè)計,所述免疫原用于免疫動物并產(chǎn)生阻斷BMP和SOST之間相互作用以及阻止SOST單體形成二聚體的抗體。
BMP結(jié)合片段SOST和頭蛋白之間的總體相似性以及這兩種多肽在N末端區(qū)之間的相似性顯示SOST可能以類似頭蛋白的方式與BMP相互作用。即,SOST的N末端區(qū)可能與BMP上I型和II型受體結(jié)合位點都相互作用,而核心區(qū)的部分(圖10中氨基酸序列比對的第190-220位)可能與II型受體結(jié)合位點相互作用,從而使得特異于這些SOST區(qū)的抗體可能阻斷或削弱BMP對SOST的結(jié)合。
大鼠和人SOST的這些SOST多肽片段的氨基酸序列提供如下。
SOST_N_接頭N末端區(qū)(包括與核心區(qū)連接的短接頭)人QGWQAFKNDATEIIPELGEYPEPPPELENNKTMNRAENGGRPPHHPFETKDVSEYS(SEQ ID NO92)大鼠QGWQAFKNDATEIIPGLREYPEPPQELENNQTMNRAENGGRPPHHPYDTKDVSEYS(SEQ ID NO93)SOST_核心_結(jié)合可能在其II型受體結(jié)合位點處接觸BMP的核心區(qū)部分(在兩個末端處都稍有延長以包含CYS殘基錨)人CIPDRYRAQRVQLLCPGGEAPRARKVRLVASC(SEQ ID NO94)大鼠CIPDRYRAQRVQLLCPGGAAPRSRKVRLVASC(SEQ ID NO95)
SOST二聚化片段SOST的C末端區(qū)域有可能涉及SOST均二聚體的形成(見實施例12)。延長的β-發(fā)夾也可能在均二聚體的形成中發(fā)揮作用。特異性地結(jié)合這些區(qū)域的抗體可阻止或削弱SOST單體的二聚化,這可能反過來干擾SOST和BMP之間的相互作用。在大鼠和人SOST中相應(yīng)于這些區(qū)域的多肽片段如下。
SOST_CC末端區(qū)域人LTRFHNQSELKDFGTEAARPQKGRKPRPRARSAKANQAELENAY(SEQ ID NO96)大鼠LTRFHNQSELKDFGPETARPQKGRKPRPRARGAKANQAELENAY(SEQ ID NO97)SOST_核心_二聚體SOST二聚化中可能涉及的核心區(qū)部分(在兩個末端處都稍有延長以包含CYS殘基錨)人CGPARLLPNAIGRGKWWRPSGPDFRC(SEQ ID NO98)大鼠CGPARLLPNAIGRVKWWRPNGPDFRC(SEQ ID NO99)SOST N-末端的BMP結(jié)合片段以頭蛋白/BMP-7復(fù)合物結(jié)構(gòu)(蛋白質(zhì)數(shù)據(jù)庫錄入號1M4U)和氨基酸序列比對(見圖10)為基礎(chǔ)模擬關(guān)鍵的SOSTN末端結(jié)合區(qū)(圖10中序列比對的第1-35位)以鑒定有可能與BMP相互作用的SOST N末端氨基酸殘基。SOST模型如圖12中所示。在比較模型中,SOST序列中序列比對第8位(見箭頭所指和附屬的文字說明)處的苯丙氨酸(Phe,F(xiàn))伸入BMP二聚體表面上的疏水性口袋內(nèi)。在BMP和I型受體復(fù)合物結(jié)構(gòu)中觀察到同樣的“結(jié)入孔”特征(Nickel等,同上文),其中受體的Phe85嵌入同一口袋中,這是針對TGF-β超家族成員的配體-I型受體識別中的關(guān)鍵特征(包括例如TGF-β家族、BMP家族,等等)。依照該模型,脯氨酸(Pro)介導(dǎo)的轉(zhuǎn)角也是保守的,它使N末端結(jié)合片段沿BMP二聚體表面延伸,從I型受體結(jié)合位點運動至復(fù)合物另一側(cè)的II型受體結(jié)合位點。接近結(jié)合片段羧基末端的另一Pro介導(dǎo)的轉(zhuǎn)角也是保守的,它與接頭區(qū)連接。在圖12中可明顯顯示了SOST和BMP之間的廣泛接觸。
肽免疫原將肽設(shè)計成包含預(yù)計與BMP蛋白質(zhì)相接觸的SOST N-末端區(qū)。肽序列如下所示。為了免疫動物,將肽序列設(shè)計成交迭的,并將一額外的半胱氨酸加至C末端以便于與KLH交聯(lián)。然后將所述肽用于免疫動物。免疫原的肽序列如下。
人SOSTQGWQAFKNDATEIIPELGEY(SEQ ID NO47)TEIIPELGEYPEPPPELENN(SEQ ID NO48)PEPPPELENNKTMNRAENGG(SEQ ID NO49)KTMNRAENGGRPPHHPFETK(SEQ ID NO50)RPPHHPFETKDVSEYS(SEQ ID NO51)具有額外半胱氨酸的人SOST肽QGWQAFKNDATEIIPELGEY-C(SEQ ID NO52)TEIIPELGEYPEPPPELENN-C(SEQ ID NO53)PEPPPELENNKTMNRAENGG-C(SEQ ID NO54)KTMNRAENGGRPPHHPFETK-C(SEQ ID NO55)RPPHHPFETKDVSEYS-C(SEQ ID NO56)大鼠SOSTQGWQAFKNDATEIIPGLREYPEPP(SEQ ID NO57)pEPPQELENNQTMNRAENGG(SEQ ID NO58)ENGGRPPHHPYDTKDVSEYS(SEQ ID NO59)TEIIPGLREYPEPPQELENN(SEQ ID NO60)具有額外半胱氨酸的大鼠SOST肽
QGWQAFKNDATEIIPGLREYPEPP-C(SEQ ID NO61)PEPPQELENNQTMNRAENGG-C(SEQ ID NO62)ENGGRPPHHPYDTKDVSEYS-C(SEQ ID NO63)TEIIPGLREYPEPPQELENN-C(SEQ ID NO64)以下肽被設(shè)計成包含預(yù)計與BMP蛋白質(zhì)接觸的核心區(qū)部分的氨基酸。將半胱氨酸加到各肽的C末端以便與KLH連接,并將連接后的肽用于免疫動物。在停泊性核心N末端肽中,內(nèi)部的半胱氨酸被改變成絲氨酸以避免與KLH的雙重連接。
針對人SOST未添加半胱氨酸殘基的氨基酸序列停泊_核心_N-末端_肽IPDRYRAQRVQLLCPGGEAP(SEQ ID NO66)停泊_核心_C末端_肽QLLCPGGEAPRARKVRLVAS(SEQ ID NO67)停泊_核心_N-末端_肽IPDRYRAQRVQLLCPGGEAP-C(SEQ IDNO68)停泊_核心_C末端_肽QLLCPGGEAPRARKVRLVAS-C(SEQ ID NO69)針對大鼠SOST無半胱氨酸殘基添加或取代的氨基酸序列停泊_核心_N-末端_肽IPDRYRAQRVQLLSPGG(SEQ ID NO70)停泊_核心_C末端_肽PGGAAPRSRKVRLVAS(SEQ ID NO71)有半胱氨酸加入和取代的肽免疫原停泊_核心_N-末端_肽IPDRYRAQRVQLLSPGG-C(SEQ ID NO72)停泊_核心_C末端_肽PGGAAPRSRKVRLVAS-C(SEQ ID NO73)SOST內(nèi)有可能相互作用而形成SOST均二聚體的兩個區(qū)域包括頭蛋白中不存在的SOST核心區(qū)域的氨基酸。被設(shè)計成包含此序列的人SOST肽具有與KLH綴合的C末端或N末端半胱氨酸。對于大鼠SOST肽而言,將一半胱氨酸加到序列(SEQ ID NO76)的羧基末端。用與KLH綴合的肽免疫動物。
對于人SOST
CGPARLLPNAIGRGKWWRPS(SEQ ID NO74)IGRGKWWRPSGPDFRC(SEQ ID NO75)對于大鼠SOSTPNAIGRVKWWRPNGPDFR(SEQ ID NO76)添加了半胱氨酸的大鼠SOST肽PNAIGRVKWWRPNGPDFR-C(SEQ ID NO77)SOST內(nèi)有可能相互作用而形成SOST均二聚體的第二個區(qū)域包括C末端區(qū)。將肽免疫原設(shè)計成包括此區(qū)域內(nèi)的氨基酸序列(見下文)。為了與KLH綴合,將一半胱氨酸殘基加至C末端,并用綴合后的肽免疫動物。
適于人SOSTKRLTRFHNQS ELKDFGTEAA(SEQ ID NO78)ELKDFGTEAA RPQKGRKPRP(SEQ ID NO79)RPQKGRKPRP RARSAKANQA(SEQ ID NO80)RARSAKANQA ELENAY(SEQ ID NO81)在C末端添加了半胱氨酸的肽免疫原KRLTRFHNQS ELKDFGTEAA-C(SEQ ID NO82)ELKDFGTEAA RPQKGRKPRP-C(SEQ ID NO83)RPQKGRKPRP RARSAKANQA-C(SEQ ID NO84)RARSAKANQA ELENAY-C(SEQ ID NO85)對于大鼠SOSTKRLTRFHNQSELKDFGPETARPQ(SEQ ID NO86)KGRKPRPRARGAKANQAELENAY(SEQ ID NO87)SELKDFGPETARPQKGRKPRPRAR(SEQ ID NO88)
在C末端添加了半胱氨酸的肽免疫原KRLTRFHNQSELKDFGPETARPQ-C(SEQ ID NO89)KGRKPRPRARGAKANQAELENAY-C(SEQ ID NO90)SELKDFGPETARPQKGRKPRPRAR-C(SEQ ID NO91)實施例14檢測抗體與TGF-β結(jié)合蛋白的結(jié)合的檢測法此實施例描述了用于檢測例如抗體或抗體片段等配體與硬化素的結(jié)合的檢測法。
依照制造商(Sigma Aldrich,St.Louis,MO)的方案并如美國專利6,395,511中所述制備FLAG_-硬化素融合蛋白。用抗FLAG_-單克隆抗體(Sigma Aldrich)包被96孔微量滴定板的各孔,然后用溶于PBS的10%BSA封閉。將融合蛋白(20ng)加入100μl PBS/0.2%BSA中并在室溫吸附于96孔板上60分鐘。去除此蛋白質(zhì)溶液,并漂洗各孔,以去除未結(jié)合的融合蛋白質(zhì)。將諸如BMP-4、BMP-5、BMP-6或BMP-7等BMP稀釋于PBS/0.2%BSA中,并以10pM至500nM范圍的濃度加入各孔中。室溫保溫2小時后,去除結(jié)合溶液,并用200μl體積的PBS/0.2%BSA漂洗平板三次。依照標準ELISA技術(shù)用特異于BMP的多克隆抗血清或單克隆抗體以及適當(dāng)酶綴合的第二步試劑檢測BMP與硬化素的結(jié)合(參閱,例如,Ausubel等,分子生物學(xué)通用方法(CurrentProtocols in Mol Biol.)Vol 2 11.2.1-11.2.22(1998))。通過從總結(jié)合量中扣除非特異性結(jié)合來計算特異性結(jié)合并用LIGAND軟件進行分析(Munson和Podbard,Anal.Biochem.107220-39(1980))。
此外還用均一時間解析熒光檢測法探測硬化素與BMP的結(jié)合(Mellor等,J Biomol.Screening,391-99(1998))。依照本領(lǐng)域已知及本文所述方法將編碼硬化素的多核苷酸序列與重組核酸構(gòu)建體中的人免疫球蛋白恒定區(qū)有效連接,并表達為人Fc-硬化素融合蛋白。同樣的,改造BMP配體并表達為BMP-小鼠Fc融合蛋白。將這兩個融合蛋白一起保溫并如Mellor等所述進行檢測。
實施例15針對抑制TGF-β家族成員與TGF-β結(jié)合蛋白相結(jié)合的抗體的篩選試驗此實施例描述了用于檢測抑制TGF-β家族成員與硬化素相結(jié)合的抗體的方法。基本上如實施例14中所述進行ELISA,不同之處在于BMP濃度固定為其Kd值(例如,通過BIAcore分析測定)。此外,將抗體或抗體文庫或集合以1μM的濃度加入孔中。將抗體與BMP和硬化素在室溫保溫2小時,去除溶液,如上文所述對結(jié)合的BMP進行定量(參閱實施例14)。抑制無抗體存在情況下所觀察到的BMP結(jié)合達40%的抗體被認為是此相互作用的拮抗物。通過進行滴定試驗測定其抑制常數(shù)以及它們對TGF-B結(jié)合蛋白結(jié)合親和力的作用,將這些抗體作為潛在的抑制劑進一步評估。還可用依賴于BMP配體作用的檢測法(例如,BMP/BMP受體競爭性試驗)進行可比較的特異性對照試驗,以確定已鑒定的拮抗物的選擇性曲線。
實施例16對TGF-β結(jié)合蛋白定位于骨基質(zhì)的抑制利用Nicolas(Calcif.Tissue Int.57206-12(1995))方法的修改版本進行骨基質(zhì)定位的抑制作用的評估。簡而言之,如Nicolas(同上文)所述制備125I-標記的TGF-β結(jié)合蛋白。將羥磷灰石加入配備了聚丙烯濾膜(Polyfiltroninc,Weymouth MA)的96孔微量滴定板的各孔中。將TGF-β結(jié)合蛋白稀釋于含0.2%白蛋白的PBS緩沖液中并隨后加入孔中。用含0.2%白蛋白的PBS緩沖液漂洗包含基質(zhì)的孔三次。用0.3M NaOH洗脫被吸附的TGF-β結(jié)合蛋白并隨后進行定量。
通過將TGF-β結(jié)合蛋白與抗體一起保溫并如上所述將此混合物施加到基質(zhì)中來鑒定抑制或削弱硬化素TGF-β結(jié)合蛋白與羥磷灰石結(jié)合的抗體。將所述基質(zhì)用含0.2%白蛋白的PBS緩沖液洗3次。用0.3M NaOH洗脫被吸附的硬化素并隨后進行定量。與無抗體存在條件下觀察到的結(jié)合水平相比,對硬化素與羥磷灰石的結(jié)合水平至少抑制40%的抗體被認為是骨定位的抑制劑。在劑量反應(yīng)試驗中對這種抗體進一步定性,以測定其抑制常數(shù)和它對TGF-B結(jié)合蛋白結(jié)合親和力的影響。
綜上所述,盡管為了便于說明的目的在此描述了本發(fā)明的特殊實施方案,但是可以對它們進行各種修改而并不偏離本發(fā)明的精神和范圍。因此,本發(fā)明并不只局限于所附的權(quán)利要求。
序列表<110>Brunkow,Mary E.
Galas,David J.
Kovacevich,BrianMulligan,John T.
Paaper,Bryan W.
Van Ness,JeffreyWinkler,David G.
<120>用于增加骨礦化的組合物和方法<130>60117-136<140>
<141>2004-06-15<150>US 10/463,190<151>2003-06-16<160>143<170>FastSEQ for Windows Version 3.0<210>1<211>2301<212>DNA<213>Homo sapien<400>1agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac60tggccctgtg tctcgtctgc ctgctggtac acacagcctt ccgtgtagtg gagggccagg120ggtggcaggc gttcaagaat gatgccacgg aaatcatccc cgagctcgga gagtaccccg180agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc240ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact300tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt360gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt420ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc480agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt540gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg600aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca660accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc720gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat780atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga840atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg900gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct960ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta1020agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc1080cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg1140caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac1200tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa1260taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg1320cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc1380caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa1440
caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac1500tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac1560ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt1620ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg1680acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg1740ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga1800caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc1860tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt1920gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa1980aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt2040tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc2100ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat2160atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt2220aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag2280acaatgaatc atgaccgaaa g 2301<210>2<211>213<212>PRT<213>Homo sapien<400>2Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr15 10 15Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser85 90 95Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser115 120 125Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val130 135 140Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg145 150 155 160Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly180 185 190Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu195 200 205Leu Glu Asn Ala Tyr210<210>3<211>2301<212>DNA<213>Homo sapien<400>3
agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac60tggccctgtg tctcgtctgc ctgctggtac acacagcctt ccgtgtagtg gagggctagg120ggtggcaggc gttcaagaat gatgccacgg aaatcatccc cgagctcgga gagtaccccg180agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc240ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact300tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt360gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt420ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc480agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt540gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg600aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca660accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc720gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat780atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga840atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg900gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct960ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta1020agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc1080cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg1140caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac1200tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa1260taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg1320cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc1380caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa1440caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac1500tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac1560ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt1620ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg1680acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg1740ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga1800caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc1860tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt1920gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa1980aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt2040tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc2100ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat2160atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt2220aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag2280acaatgaatc atgaccgaaa g 2301<210>4<211>23<212>PRT<213>Homo sapien<400>4Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr1 5 10 15Ala Phe Arg Val Val Glu Gly20<210>5<211>2301<212>DNA<213>Homo sapien<400>5
agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac60tggccctgtg tctcatctgc ctgctggtac acacagcctt ccgtgtagtg gagggccagg120ggtggcaggc gttcaagaat gatgccacgg aaatcatccg cgagctcgga gagtaccccg180agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc240ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact300tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt360gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt420ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc480agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt540gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg600aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca660accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc720gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat780atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga840atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg900gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct960ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta1020agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc1080cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg1140caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac1200tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa1260taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg1320cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc1380caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa1440caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac1500tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac1560ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt1620ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg1680acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg1740ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga1800caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc1860tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt1920gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa1980aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt2040tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc2100ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat2160atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt2220aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag2280acaatgaatc atgaccgaaa g 2301<210>6<211>213<212>PRT<213>Homo sapien<400>6Met Gln Leu Pro Leu Ala Leu Cys Leu Ile Cys Leu Leu Val His Thr1 5 10 15Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30Ala Thr Glu Ile Ile Arg Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser
85 90 95Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser115 120 125Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val130 135 140Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg145 150 155 160Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly180 185 190Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu195 200 205Leu Glu Asn Ala Tyr210<210>7<211>2301<212>DNA<213>Homo sapien<400>7agagcctgtg ctactggaag gtggcgtgcc ctcctctggc tggtaccatg cagctcccac60tggccctgtg tctcgtctgc ctgctggtac acacagcctt ccgtgtagtg gagggccagg120ggtggcaggc gttcaagaat gatgccacgg aaatcatccg cgagctcgga gagtaccccg180agcctccacc ggagctggag aacaacaaga ccatgaaccg ggcggagaac ggagggcggc240ctccccacca cccctttgag accaaagacg tgtccgagta cagctgccgc gagctgcact300tcacccgcta cgtgaccgat gggccgtgcc gcagcgccaa gccggtcacc gagctggtgt360gctccggcca gtgcggcccg gcgcgcctgc tgcccaacgc catcggccgc ggcaagtggt420ggcgacctag tgggcccgac ttccgctgca tccccgaccg ctaccgcgcg cagcgcgtgc480agctgctgtg tcccggtggt gaggcgccgc gcgcgcgcaa ggtgcgcctg gtggcctcgt540gcaagtgcaa gcgcctcacc cgcttccaca accagtcgga gctcaaggac ttcgggaccg600aggccgctcg gccgcagaag ggccggaagc cgcggccccg cgcccggagc gccaaagcca660accaggccga gctggagaac gcctactaga gcccgcccgc gcccctcccc accggcgggc720gccccggccc tgaacccgcg ccccacattt ctgtcctctg cgcgtggttt gattgtttat780atttcattgt aaatgcctgc aacccagggc agggggctga gaccttccag gccctgagga840atcccgggcg ccggcaaggc ccccctcagc ccgccagctg aggggtccca cggggcaggg900gagggaattg agagtcacag acactgagcc acgcagcccc gcctctgggg ccgcctacct960ttgctggtcc cacttcagag gaggcagaaa tggaagcatt ttcaccgccc tggggtttta1020agggagcggt gtgggagtgg gaaagtccag ggactggtta agaaagttgg ataagattcc1080cccttgcacc tcgctgccca tcagaaagcc tgaggcgtgc ccagagcaca agactggggg1140caactgtaga tgtggtttct agtcctggct ctgccactaa cttgctgtgt aaccttgaac1200tacacaattc tccttcggga cctcaatttc cactttgtaa aatgagggtg gaggtgggaa1260taggatctcg aggagactat tggcatatga ttccaaggac tccagtgcct tttgaatggg1320cagaggtgag agagagagag agaaagagag agaatgaatg cagttgcatt gattcagtgc1380caaggtcact tccagaattc agagttgtga tgctctcttc tgacagccaa agatgaaaaa1440caaacagaaa aaaaaaagta aagagtctat ttatggctga catatttacg gctgacaaac1500tcctggaaga agctatgctg cttcccagcc tggcttcccc ggatgtttgg ctacctccac1560ccctccatct caaagaaata acatcatcca ttggggtaga aaaggagagg gtccgagggt1620ggtgggaggg atagaaatca catccgcccc aacttcccaa agagcagcat ccctcccccg1680acccatagcc atgttttaaa gtcaccttcc gaagagaagt gaaaggttca aggacactgg1740ccttgcaggc ccgagggagc agccatcaca aactcacaga ccagcacatc ccttttgaga1800caccgccttc tgcccaccac tcacggacac atttctgcct agaaaacagc ttcttactgc1860tcttacatgt gatggcatat cttacactaa aagaatatta ttgggggaaa aactacaagt1920gctgtacata tgctgagaaa ctgcagagca taatagctgc cacccaaaaa tctttttgaa1980
aatcatttcc agacaacctc ttactttctg tgtagttttt aattgttaaa aaaaaaaagt2040tttaaacaga agcacatgac atatgaaagc ctgcaggact ggtcgttttt ttggcaattc2100ttccacgtgg gacttgtcca caagaatgaa agtagtggtt tttaaagagt taagttacat2160atttattttc tcacttaagt tatttatgca aaagtttttc ttgtagagaa tgacaatgtt2220aatattgctt tatgaattaa cagtctgttc ttccagagtc cagagacatt gttaataaag2280acaatgaatc atgaccgaaa g 230l<210>8<211>213<212>PRT<213>Homo sapien<400>8Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr1 5 10 15Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30Ala Thr Glu Ile Ile Arg Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser85 90 95Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser115 120 125Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val130 135 140Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg145 150 155 160Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly180 185 190Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu195 200 205Leu Glu Asn Ala Tyr210<210>9<211>642<212>DNA<213>Cercopithecus pygerythrus<400>9atgcagctcc cactggccct gtgtcttgtc tgcctgctgg tacacgcagc cttccgtgta60gtggagggcc aggggtggca ggccttcaag aatgatgcca cggaaatcat ccccgagctc120ggagagtacc ccgagcctcc accggagctg gagaacaaca agaccatgaa ccgggcggag180aatggagggc ggcctcccca ccaccccttt gagaccaaag acgtgtccga gtacagctgc240cgagagctgc acttcacccg ctacgtgacc gatgggccgt gccgcagcgc caagccagtc300accgagttgg tgtgctccgg ccagtgcggc ccggcacgcc tgctgcccaa cgccatcggc360cgcggcaagt ggtggcgccc gagtgggccc gacttccgct gcatccccga ccgctaccgc420gcgcagcgtg tgcagctgct gtgtcccggt ggtgccgcgc cgcgcgcgcg caaggtgcgc480ctggtggcct cgtgcaagtg caagcgcctc acccgcttcc acaaccagtc ggagctcaag540
gacttcggtc ccgaggccgc tcggccgcag aagggccgga agccgcggcc ccgcgcccgg600ggggccaaag ccaatcaggc cgagctggag aacgcctact ag 642<210>10<211>213<212>PRT<213>Cercopithecus pygerythrus<400>10Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Ala1 5 10 15Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser85 90 95Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser115 120 125Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val130 135 140Gln Leu Leu Cys Pro Gly Gly Ala Ala Pro Arg Ala Arg Lys Val Arg145 150 155 160Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175Ser Glu Leu Lys Asp Phe Gly Pro Glu Ala Ala Arg Pro Gln Lys Gly180 185 190Arg Lys Pro Arg Pro Arg Ala Arg Gly Ala Lys Ala Asn Gln Ala Glu195 200 205Leu Glu Asn Ala Tyr210<210>11<211>638<212>DNA<213>Mus musculus<400>11atgcagccct cactagcccc gtgcctcatc tgcctacttg tgcacgctgc cttctgtgct60gtggagggcc aggggtggca agccttcagg aatgatgcca cagaggtcat cccagggctt120ggagagtacc ccgagcctcc tcctgagaac aaccagacca tgaaccgggc ggagaatgga180ggcagacctc cccaccatcc ctatgacgcc aaaggtgtgt ccgagtacag ctgccgcgag240ctgcactaca cccgcttcct gacagacggc ccatgccgca gcgccaagcc ggtcaccgag300ttggtgtgct ccggccagtg cggccccgcg cggctgctgc ccaacgccat cgggcgcgtg360aagtggtggc gcccgaacgg accggatttc cgctgcatcc cggatcgcta ccgcgcgcag420cgggtgcagc tgctgtgccc cgggggcgcg gcgccgcgct cgcgcaaggt gcgtctggtg480gcctcgtgca agtgcaagcg cctcacccgc ttccacaacc agtcggagct caaggacttc540gggccggaga ccgcgcggcc gcagaagggt cgcaagccgc ggcccggcgc ccggggagcc600aaagccaacc aggcggagct ggagaacgcc tactagag638<210>12
<211>211<212>PRT<213>Mus musculus<400>12Met Gln Pro Ser Leu Ala Pro Cys Leu Ile Cys Leu Leu Val His Ala1 5 10 15Ala Phe Cys Ala Val Glu Gly Gln Gly Trp Gln Ala Phe Arg Asn Asp20 25 30Ala Thr Glu Val Ile Pro Gly Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45Glu Asn Asn Gln Thr Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro50 55 60His His Pro Tyr Asp Ala Lys Asp Val Ser Glu Tyr Ser Cys Arg Glu65 70 75 80Leu His Tyr Thr Arg Phe Leu Thr Asp Gly Pro Cys Arg Ser Ala Lys85 90 95Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala Arg Leu100 105 110Leu Pro Asn Ala Ile Gly Arg Val Lys Trp Trp Arg Pro Asn Gly Pro115 120 125Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu130 135 140Leu Cys Pro Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val145 150 155 160Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu165 170 175Leu Lys Asp Phe Gly Pro Glu Thr Ala Arg Pro Gln Lys Gly Arg Lys180 185 190Pro Arg Pro Gly Ala Arg Gly Ala Lys Ala Asn Gln Ala Glu Leu Glu195 200 205Asn Ala Tyr210<210>13<211>674<212>DNA<213>Rattus norvegicus<400>13gaggaccgag tgcccttcct ccttctggca ccatgcagct ctcactagcc ccttgccttg60cctgcctgct tgtacatgca gccttcgttg ctgtggagag ccaggggtgg caagccttca120agaatgatgc cacagaaatc atcccgggac tcagagagta cccagagcct cctcaggaac180tagagaacaa ccagaccatg aaccgggccg agaacggagg cagacccccc caccatcctt240atgacaccaa agacgtgtcc gagtacagct gccgcgagct gcactacacc cgcttcgtga300ccgacggccc gtgccgcagt gccaagccgg tcaccgagtt ggtgtgctcg ggccagtgcg360gccccgcgcg gctgctgccc aacgccatcg ggcgcgtgaa gtggtggcgc ccgaacggac420ccgacttccg ctgcatcccg gatcgctacc gcgcgcagcg ggtgcagctg ctgtgccccg480gcggcgcggc gccgcgctcg cgcaaggtgc gtctggtggc ctcgtgcaag tgcaagcgcc540tcacccgctt ccacaaccag tcggagctca aggacttcgg acctgagacc gcgcggccgc600agaagggtcg caagccgcgg ccccgcgccc ggggagccaa agccaaccag gcggagctgg660agaacgccta ctag 674<210>14<21l>213<212>PRT<213>Rattus norvegicus
<400>14Met Gln Leu Ser Leu Ala Pro Cys Leu Ala Cys Leu Leu Val His Ala1 5 10 15Ala Phe Val Ala Val Glu Ser Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30Ala Thr Glu Ile Ile Pro Gly Leu Arg Glu Tyr Pro Glu Pro Pro Gln35 40 45Glu Leu Glu Asn Asn Gln Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60Pro Pro His His Pro Tyr Asp Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80Arg Glu Leu His Tyr Thr Arg Phe Val Thr Asp Gly Pro Cys Arg Ser85 90 95Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110Arg Leu Leu Pro Asn Ala Ile Gly Arg Val Lys Trp Trp Arg Pro Asn115 120 125Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val130 135 140Gln Leu Leu Cys Pro Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg145 150 155 160Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175Ser Glu Leu Lys Asp Phe Gly Pro Glu Thr Ala Arg Pro Gln Lys Gly180 185 190Arg Lys Pro Arg Pro Arg Ala Arg Gly Ala Lys Ala Asn Gln Ala Glu195 200 205Leu Glu Asn Ala Tyr210<210>15<211>532<212>DNA<213>Bos torus<400>15agaatgatgc cacagaaatc atccccgagc tgggogagta ccccgagcct ctgccagagc60tgaacaacaa gaccatgaac cgggcggaga acggagggag acctccccac cacccctttg120agaccaaaga cgcctccgag tacagctgcc gggagctgca cttcacccgc tacgtgaccg180atgggccgtg ccgcagcgcc aagccggtca ccgagctggt gtgctcgggc cagtgcggcc240cggcgcgcct gctgcccaac gccatcggcc gcggcaagtg gtggcgccca agcgggcccg300acttccgctg catccccgac cgctaccgcg cgcagcgggt gcagctgttg tgtcctggcg360gcgcggcgcc gcgcgcgcgc aaggtgcgcc tggtggcctc gtgcaagtgc aagcgcctca420ctcgcttcca caaccagtcc gagctcaagg acttcgggcc cgaggccgcg cggccgcaaa480cgggccggaa gctgcggccc cgcgcccggg gcaccaaagc cagccgggcc ga532<210>16<211>176<212>PRT<213>Bos torus<400>16Asn Asp Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro1 5 10 15Leu Pro Glu Leu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly20 25 30
Arg Pro Pro His His Pro Phe Glu Thr Lys Asp Ala Ser Glu Tyr Ser35 40 45Cys Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg50 55 60Ser Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro65 70 75 80Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro85 90 95Ser Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg100 105 110Va1 Gln Leu Leu Cys Pro Gly Gly Ala Ala Pro Arg Ala Arg Lys Val115 120 125Arg Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn130 135 140Gln Ser Glu Leu Lys Asp Phe Gly Pro Glu Ala Ala Arg Pro Gln Thr145 150 155 160Gly Arg Lys Leu Arg Pro Arg Ala Arg Gly Thr Lys Ala Ser Arg Ala165 170 175<210>17<211>35828<212>DNA<213>Mus musculus<220>
<221>misc feature<222>(1)..(35828)<223>n=A,T,C或G<400>17cgcgttttgg tgagcagcaa tattgcgctt cgatgagcct tggcgttgag attgatacct60ctgctgcaca aaaggcaatc gaccgagctg gaccagcgca ttcgtgacac cgtctccttc120gaacttattc gcaatggagt gtcattcatc aaggachgcc tgatcgcaaa tggtgctatc180cacgcagcgg caatcgaaaa ccctcagccg gtgaccaata tctacaacat cagccttggt240atcctgcgtg atgagccagc gcagaacaag gtaaccgtca gtgccgataa gttcaaagtt300aaacctggtg ttgataccaa cattgaaacg ttgatcgaaa acgcgctgaa aaacgctgct360gaatgtgcgg cgctggatgt cacaaagcaa atggcagcag acaagaaagc gatggatgaa420ctggcttcct atgtccgcac ggccatcatg atggaatgtt tccccggtgg tgttatctgg480cagcagtgcc gtcgatagta tgcaattgat aattattatc atttgcgggt cctttccggc540gatccgcctt gttacggggc ggcgacctcg cgggttttcg ctatttatga aaattttccg600gtttaaggcg tttccgttct tcttcgtcat aacttaatgt ttttatttaa aataccctct660gaaaagaaag gaaacgacag gtgctgaaag cgagcttttt ggcctctgtc gtttcctttc720tctgtttttg tccgtggaat gaacaatgga agtcaacaaa aagcagagct tatcgatgat780aagcggtcaa acatgagaat tcgcggccgc ataatacgac tcactatagg gatcgacgcc840tactccccgc gcatgaagcg gaggagctgg actccgcatg cccagagacg ccccccaacc900cccaaagtgc ctgacctcag cctctaccag ctctggcttg ggcttgggcg gggtcaaggc960taccacgttc tcttaacagg tggctgggct gtctcttggc cgcgcgtcat gtgacagctg1020cctagttctg cagtgaggtc accgtggaat gtctgccttc gttgccatgg caacgggatg1080acgttacaat ctgggtgtgg agcttttcct gtccgtgtca ggaaatccaa ataccctaaa1140ataccctaga agaggaagta gctgagccaa ggctttcctg gcttctccag ataaagtttg1200acttagatgg aaaaaaacaa aatgataaag acccgagcca tctgaaaatt cctcctaatt1260gcaccactag gaaatgtgta tattattgag ctcgtatgtg ttcttatttt aaaaagaaaa1320ctttagtcat gttattaata agaatttctc agcagtggga gagaaccaat attaacacca1380agataaaagt tggcatgatc cacattgcag gaagatccac gttgggtttt catgaatgtg1440aagaccccat ttattaaagt cctaagctct gtttttgcac actaggaagc gatggccggg1500atggctgagg ggctgtaagg atctttcaat gtcttacatg tgtgtttcct gtcctgcacc1560taggacctgc tgcctagcct gcagcagagc cagaggggtt tcacatgatt agtctcagac1620
acttgggggc aggttgcatg tactgcatcg cttatttcca tacggagcac ctactatgtg1680tcaaacacca tatggtgttc actcttcaga acggtggtgg tcatcatggt gcatttgctg1740acggttggat tggtggtaga gagctgagat atatggacgc actcttcagc attctgtcaa1800cgtggctgtg cattcttgct cctgagcaag tggctaaaca gactcacagg gtcagcctcc1860agctcagtcg ctgcatagtc ttagggaacc tctcccagtc ctccctacct caactatcca1920agaagccagg gggcttggcg gtctcaggag cctgcttgct gggggacagg ttgttgagtt1980ttatctgcag taggttgcct aggcatagtg tcaggactga tggctgcctt ggagaacaca2040tcctttgccc tctatgcaaa tctgaccttg acatgggggc gctgctcagc tgggaggatc2100aactgcatac ctaaagccaa gcctaaagct tcttcgtcca cctgaaactc ctggaccaag2160gggcttccgg cacatcctct caggccagtg agggagtctg tgtgagctgc actttccaat2220ctcagggcgt gagaggcaga gggaggtggg ggcagagcct tgcagctctt tcctcccatc2280tggacagcgc tctggctcag cagcccatat gagcacaggc acatccccac cccaccccca2340cctttcctgt cctgcagaat ttaggctctg ttcacggggg gggggggggg ggggcagtcc2400tatcctctct taggtagaca ggactctgca ggagacactg ctttgtaaga tactgcagtt2460taaatttgga tgttgtgagg ggaaagcgaa gggcctcttt gaccattcag tcaaggtacc2520ttctaactcc catcgtattg gggggctact ctagtgctag acattgcaga gagcctcaga2580actgtagtta ccagtgtggt aggattgatc cttcagggag cctgacatgt gacagttcca2640ttcttcaccc agtcaccgaa catttattca gtacctaccc cgtaacaggc accgtagcag2700gtactgaggg acggaccact caaagaactg acagaccgaa gccttggaat ataaacacca2760aagcatcagg ctctgccaac agaacactct ttaacactca ggccctttaa cactcaggac2820ccccaccccc accccaagca gttggcactg ctatccacat tttacagaga ggaaaaacta2880ggcacaggac gatataagtg gcttgcttaa gcttgtctgc atggtaaatg gcagggctgg2940attgagaccc agacattcca actctagggt ctatttttct tttttctcgt tgttcgaatc3000tgggtcttac tgggtaaact caggctagcc tcacactcat atccttctcc catggcttac3060gagtgctagg attccaggtg tgtgctacca tgtctgactc cctgtagctt gtctatacca3120tcctcacaac ataggaattg tgatagcagc acacacaccg gaaggagctg gggaaatccc3180acagagggct ccgcaggatg acaggcgaat gcctacacag aaggtgggga agggaagcag3240agggaacagc atgggcgtgg gaccacaagt ctatttgggg aagctgccgg taaccgtata3300tggctggggt gaggggagag gtcatgagat gaggcaggaa gagccacagc aggcagcggg3360tacgggctcc ttattgccaa gaggctcgga tcttcctcct cttcctcctt ccggggctgc3420ctgttcattt tccaccactg cctcccatcc aggtctgtgg ctcaggacat cacccagctg3480cagaaactgg gcatcaccca cgtcctgaat gctgccgagg gcaggtcctt catgcacgtc3540aacaccagtg ctagcttcta cgaggattct ggcatcacct acttgggcat caaggccaat3600gatacgcagg agttcaacct cagtgcttac tttgaaaggg ccacagattt cattgaccag3660gcgctggccc ataaaaatgg taaggaacgt acattccggc acccatggag cgtaagccct3720ctgggacctg cttcctccaa agaggccccc acttgaaaaa ggttccagaa agatcccaaa3780atatgccacc aactagggat taagtgtcct acatgtgagc cgatgggggc cactgcatat3840agtctgtgcc atagacatga caatggataa taatatttca gacagagagc aggagttagg3900tagctgtgct cctttccctt taattgagtg tgcccatttt tttattcatg tatgtgtata3960catgtgtgtg cacacatgcc ataggttgat actgaacacc gtcttcaatc gttccccacc4020ccaccttatt ttttgaggca gggtctcttc cctgatcctg gggctcattg gtttatctag4080gctgctggcc agtgagctct ggagttctgc ttttctctac ctccctagcc ctgggactgc4140aggggcatgt gctgggccag gcttttatgt cgcgttgggg atctgaactt aggtccctag4200gcctgagcac cgtaaagact ctgccacatc cccagcctgt ttgagcaagt gaaccattcc4260ccagaattcc cccagtgggg ctttcctacc cttttattgg ctaggcattc atgagtggtc4320acctcgccag aggaatgagt ggccacgact ggctcagggt cagcagccta gagatactgg4380gttaagtctt cctgccgctc gctccctgca gccgcagaca gaaagtagga ctgaatgaga4440gctggctagt ggtcagacag gacagaaggc tgagagggtc acagggcaga tgtcagcaga4500gcagacaggt tctccctctg tgggggaggg gtggcccact gcaggtgtaa ttggccttct4560ttgtgctcca tagaggcttc ctgggtacac agcagcttcc ctgtcctggt gattcccaaa4620gagaactccc taccactgga cttacagaag ttctattgac tggtgtaacg gttcaacagc4680tttggctctt ggtggacggt gcatactgct gtatcagctc aagagctcat tcacgaatga4740acacacacac acacacacac acacacacac acacaagcta attttgatat gccttaacta4800gctcagtgac tgggcatttc tgaacatccc tgaagttagc acacatttcc ctctggtgtt4860cctggcttaa caccttctaa atctatattt tatctttgct gccctgttac cttctgagaa4920gcccctaggg ccacttccct tcgcacctac attgctggat ggtttctctc ctgcagctct4980taaatctgat ccctctgcct ctgagccatg ggaacagccc aataactgag ttagacataa5040
aaacgtctct agccaaaact tcagctaaat ttagacaata aatcttactg gttgtggaat5100ccttaagatt cttcatgacc tccttcacat ggcacgagta tgaagcttta ttacaattgt5160ttattgatca aactaactca taaaaagcca gttgtctttc acctgctcaa ggaaggaaca5220aaattcatcc ttaactgatc tgtgcacctt gcacaatcca tacgaatatc ttaagagtac5280taagattttg gttgtgagag tcacatgtta cagaatgtac agctttgaca aggtgcatcc5340ttgggatgcc gaagtgacct gctgttccag ccccctacct tctgaggctg ttttggaagc5400aatgctctgg aagcaacttt aggaggtagg atgctggaac agcgggtcac ttcagcatcc5460cgatgacgaa tcccgtcaaa gctgtacatt ctgtaacaga ctgggaaagc tgcagacttt5520aaggccaggg ccctatggtc cctcttaatc cctgtcacac ccaacccgag cccttctcct5580ccagccgttc tgtgcttctc actctggata gatggagaac acggccttgc tagttaaagg5640agtgaggctt cacccttctc acatggcagt ggttggtcat cctcattcag ggaactctgg5700ggcattctgc ctttacttcc tctttttgga ctacagggaa tatatgctga cttgttttga5760ccttgtgtat ggggagactg gatctttggt ctggaatgtt tcctgctagt ttttccccat5820cctttggcaa accctatcta tatcttacca ctaggcatag tggccctcgt tctggagcct5880gccttcaggc tggttctcgg ggaccatgtc cctggtttct ccccagcata tggtgttcac5940agtgttcact gcgggtggtt gctgaacaaa gcggggattg catcccagag ctccggtgcc6000ttgtgggtac actgctaaga taaaatggat actggcctct ctctgaccac ttgcagagct6060ctggtgcctt gtgggtacac tgctaagata aaatggatac tggcctctct ctatccactt6120gcaggactct agggaacagg aatccattac tgagaaaacc aggggctagg agcagggagg6180tagctgggca gctgaagtgc ttggcgacta accaatgaat accagagttt ggatctctag6240aatactctta aaatctgggt gggcagagtg gcctgcctgt aatcccagaa ctcgggaggc6300ggagacaggg aatcatcaga gcaaactggc taaccagaat agcaaaacac tgagctctgg6360gctctgtgag agatcctgcc ttaacatata agagagagaa taaaacattg aagaagacag6420tagatgccaa ttttaagccc ccacatgcac atggacaagt gtgcgtttga acacacatat6480gcactcatgt gaaccaggca tgcacactcg ggcttatcac acacataatt tgaaagagag6540agtgagagag gagagtgcac attagagttc acaggaaagt gtgagtgagc acacccatgc6600acacagacat gtgtgccagg gagtaggaaa ggagcctggg tttgtgtata agagggagcc6660atcatgtgtt tctaaggagg gcgtgtgaag gaggcgttgt gtgggctggg actggagcat6720ggttgtaact gagcatgctc cctgtgggaa acaggagggt ggccaccctg cagagggtcc6780cactgtccag cgggatcagt aaaagcccct gctgagaact ttaggtaata gccagagaga6840gaaaggtagg aaagtggggg gactcccatc tctgatgtag gaggatctgg gcaagtagag6900gtgcgtttga ggtagaaaga ggggtgcaga ggagatgctc ttaattctgg gtcagcagtt6960tctttccaaa taatgcctgt gaggaggtgt aggtggtggc cattcactca ctcagcagag7020ggatgatgat gcccggtgga tgctggaaat ggccgagcat caaccctggc tctggaagaa7080ctccatcttt cagaaggaga gtggatctgt gtatggccag cggggtcaca ggtgcttggg7140gcccctgggg gactcctagc actgggtgat gtttatcgag tgctcttgtg tgccaggcac7200tggcctgggg ctttgtttct gtctctgttt tgtttcgttt tttgagacag actcttgcta7260tgtatccgtg tcaatcttgg aatctcactg catagcccag gctgcggaga gaggggaggg7320caataggcct tgtaagcaag ccacacttca gagactagac tccaccctgc gaatgatgac7380aggtcagagc tgagttccgg aagatttttt ttccagctgc caggtggagt gtggagtggc7440agctagcggc aagggtagag ggcgagctcc ctgtgcagga gaaatgcaag caagagatgg7500caagccagtg agttaagcat tctgtgtggg gagcaggtgg atgaagagag aggctgggct7560ttcgcctctg gggggggggt gaggggtggg gatgaggtga gaggagggca gctccctgca7620gtgtgatgag atttttcctg acagtgacct ttggcctctc cctcccccac ttcccttctt7680tcctttcttc ccaccattgc tttccttgtc cttgagaaat tctgagtttc cacttcactg7740gtgatgcaga cggaaacaga agccgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt7800gtgtgtgtgt ttgtgtgtat gtgtgtgtgt gtgtttgtgt gtatgtgtgt cagtgggaat7860ggctcatagt ctgcaggaag gtgggcagga aggaataagc tgtaggctga ggcagtgtgg7920gatgcaggga gagaggagag gagggatacc agagaaggaa attaagggag ctacaagagg7980gcattgttgg ggtgtgtgtg tgtgtgtgtt gtttatattt gtattggaaa tacattcttt8040taaaaaatac ttatccattt atttattttt atgtgcacgt gtgtgtgcct gcatgagttc8100atgtgtgcca cgtgtgtgcg ggaacccttg gaggccacaa gggggcatct gatcccctgg8160aactggagtt ggaggaggtt gtgagtcccc tgacatgttt gctgggaact gaaccccggt8220cctatgcaag agcaggaagt gcagttatct gctgagccat ctctccagtc ctgaaatcca8280ttctcttaaa atacacgtgg cagagacatg atgggattta cgtatggatt taatgtggcg8340gtcattaagt tccggcacag gcaagcacct gtaaagccat caccacaacc gcaacagtga8400atgtgaccat cacccccatg ttcttcatgt cccctgtccc ctccatcctc cattctcaag8460
cacctcttgc tctgcctctg tcgctggaga acagtgtgca tctgcacact cttatgtcag8520tgaagtcaca cagcctgcac cccttcctgg tctgagtatt tgggttctga ctctgctatc8580acacactact gtactgcatt ctctcgctct ctttttttaa acatattttt atttgtttgt8640gtgtatgcac atgtgccaca tgtgtacaga tactatggag gccagaagag gccatggccg8700tccctggagc tggagttaca ggcagcgtgt gagctgcctg gtgtgggtgc tgggaaccaa8760acttgaatct aaagcaagca cttttaactg ctgaggcagc tctcagtacc cttcttcatt8820tctccgcctg ggttccattg tatggacaca tgtagctaga atatcttgct tatctaatta8880tgtacattgt tttgtgctaa gagagagtaa tgctctatag cctgagctgg cctcaacctt8940gccatcctcc tgcctcagcc tcctcctcct gagtgctagg atgacaggcg agtggtaact9000tacatggttt catgttttgt tcaagactga aggataacat tcatacagag aaggtctggg9060tcacaaagtg tgcagttcac tgaatggcac aacccgtgat caagaaacaa aactcagggg9120ctggagagat ggcactgact gctcttccag aggtccggag ttcaattccc agcaaccaca9180tggtggctca cagccatcta taacgagatc tgacgccctc ttctggtgtg tctgaagaca9240gctacagtgt actcacataa aataaataaa tctttaaaac acacacacac acacaattac9300caccccagaa agcccactcc atgttccctc ccacgtctct gcctacagta ctcccaggtt9360accactgttc aggcttctaa caacctggtt tacttgggcc tcttttctgc tctgtggagc9420cacacatttg tgtgcctcat acacgttctt tctagtaagt tgcatattac tctgcgtttt9480tacatgtatt tatttattgt agttgtgtgt gcgtgtgggc ccatgcatgg cacagtgtgt9540ggggatgtca gagtattgtg aacaggggac agttcttttc ttcaatcatg tgggttccag9600aggttgaact caggtcatca tgtgtggcag caaatgcctt tacccactga gacatctcca9660tattcttttt ttttcccctg aggtgggggc ttgttccata gcccaaactg gctttgcact9720tgcagttcaa agtgactccc tgtctccacc tcttagagta ttggaattac gatgtgtact9780accacacctg actggatcat taattctttg atgggggcgg ggaagcgcac atgctgcagg9840tgaagggatg actggactgg acatgagcgt ggaagccaga gaacagcttc agtctaatgc9900tctcccaact gagctatttc ggtttgccag agaacaactt acagaaagtt ctcagtgcca9960tgtggattcg gggttggagt tcaactcatc agcttgacat tggctcctct acccactgag10020ccttctcact actctctacc tagatcatta attctttttt aaaaagactt attagggggc10080tggagagatg gctcagccgt taagagcacc gaatgccctt ccagaggtcc tgagttcaat10140tcccagcatg ccattgctgg gcagtagggg gcgcaggtgt tcaacgtgag tagctgttgc10200cagttttccg cggtggagaa cctcttgaca ccctgctgtc cctggtcatt ctgggtgggt10260gcatggtgat atgcttgttg tatggaagac tttgactgtt acagtgaagt tgggcttcca10320cagttaccac gtctcccctg tttcttgcag gccgggtgct tgtccattgc cgcgagggct10380acagccgctc cccaacgcta gttatcgcct acctcatgat gcggcagaag atggacgtca10440agtctgctct gagtactgtg aggcagaatc gtgagatcgg ccccaacgat ggcttcctgg10500cccaactctg ccagctcaat gacagactag ccaaggaggg caaggtgaaa ctctagggtg10560cccacagcct cttttgcaga ggtctgactg ggagggccct ggcagccatg tttaggaaac10620acagtatacc cactccctgc accaccagac acgtgcccac atctgtccca ctctggtcct10680cgggggccac tccaccctta gggagcacat gaagaagctc cctaagaagt tctgctcctt10740agccatcctttcctgtaatt tatgtctctc cctgaggtga ggttcaggtt tatgtccctg10800tctgtggcat agatacatct cagtgaccca gggtgggagg gctatcaggg tgcatggccc10860gggacacggg cactcttcat gacccctccc ccacctgggt tcttcctgtg tggtccagaa10920ccacgagcct ggtaaaggaa ctatgcaaac acaggccctg acctccccat gtctgttcct10980ggtcctcaca gcccgacacg ccctgctgag gcagacgaat gacattaagt tctgaagcag11040agtggagata gattagtgac tagatttcca aaaagaagga aaaaaaaggc tgcattttaa11100aattatttcc ttagaattaa agatactaca taggggccct tgggtaagca aatccatttt11160tcccagaggc tatcttgatt ctttggaatg tttaaagtgt gccttgccag agagcttacg11220atctatatct gctgcttcag agccttccct gaggatggct ctgttccttt gcttgttaga11280agagcgatgc cttgggcagg gtttccccct tttcagaata cagggtgtaa agtccagcct11340attacaaaca aacaaacaaa caaacaaaca aaggacctcc atttggagaa ttgcaaggat11400tttatcctga attatagtgt tggtgagttc aagtcatcac gccaagtgct tgccatcctg11460gttgctattc taagaataat taggaggagg aacctagcca attgcagctc atgtccgtgg11520gtgtgtgcac gggtgcatat gttggaaggg gtgcctgtcc ccttggggac agaaggaaaa11580tgaaaggccc ctctgctcac cctggccatt tacgggaggc tctgctggtt ccacggtgtc11640tgtgcaggat cctgaaactg actcgctgga cagaaacgag acttggcggc accatgagaa11700tggagagaga gagagcaaag aaagaaacag cctttaaaag aactttctaa gggtggtttt11760tgaacctcgc tggaccttgt atgtgtgcac atttgccaga gattgaacat aatcctcttg11820ggacttcacg ttctcattat ttgtatgtct ccggggtcac gcagagccgt cagccaccac11880
cccagcaccc ggcacatagg cgtctcataa aagcccattt tatgagaacc agagctgttt11940gagtaccccg tgtatagaga gagttgttgt cgtggggcac ccggatccca gcagcctggt12000tgcctgcctg taggatgtct tacaggagtt tgcagagaaa ccttccttgg agggaaagaa12060atatcaggga tttttgttga atatttcaaa ttcagcttta agtgtaagac tcagcagtgt12120tcatggttaa ggtaaggaac atgccttttc cagagctgct gcaagaggca ggagaagcag12180acctgtctta ggatgtcact cccagggtaa agacctctga tcacagcagg agcagagctg12240tgcagcctgg atggtcattg tcccctattc tgtgtgacca cagcaaccct ggtcacatag12300ggctggtcat cctttttttt tttttttttt tttttttttg gcccagaatg aagtgaccat12360agccaagttg tgtacctcag tctttagttt ccaagcggct ctcttgctca atacaatgtg12420catttcaaaa taacactgta gagttgacag aactggttca tgtgttatga gagaggaaaa12480gagaggaaag aacaaaacaa aacaaaacac cacaaaccaa aaacatctgg gctagccagg12540catgattgca atgtctacag gcccagttca tgagaggcag agacaggaag accgccgaaa12600ggtcaaggat agcatggtct acgtatcgag actccagcca gggctacggt cccaagatcc12660taggttttgg attttgggct ttggtttttg agacagggtt tctctgtgta gccctggctg12720tcctggaact cgctctgtag accaggctgg cctcaaactt agagatctgc ctgactctgc12780ctttgagggc tgggacgaat gccaccactg cccaactaag attccattaa aaaaaaaaaa12840agttcaagat aattaagagt tgccagctcg ttaaagctaa gtagaagcag tctcaggcct12900gctgcttgag gctgttcttg gcttggacct gaaatctgcc cccaacagtg tccaagtgca12960catgactttg agccatctcc agagaaggaa gtgaaaattg tggctcccca gtcgattggg13020acacagtctc tctttgtcta ggtaacacat ggtgacacat agcattgaac tctccactct13080gagggtgggt ttccctcccc ctgcctcttc tgggttggtc accccatagg acagccacag13140gacagtcact agcacctact ggaaacctct ttgtgggaac atgaagaaag agcctttggg13200agattcctgg ctttccatta gggctgaaag tacaacggtt cttggttggc tttgcctcgt13260gtttataaaa ctagctacta ttcttcaggt aaaataccga tgttgtggaa aagccaaccc13320cgtggctgcc cgtgagtagg gggtggggtt gggaatcctg gatagtgttc tatccatgga13380aagtggtgga ataggaatta agggtgttcc cccccccccc aacctcttcc tcagacccag13440ccactttcta tgacttataa acatccaggt aaaaattaca aacataaaaa tggtttctct13500tctcaatctt ctaaagtctg cctgcctttt ccaggggtag gtctgtttct ttgctgttct13560attgtcttga gagcacagac taacacttac caaatgaggg aactcttggc ccatactaag13620gctcttctgg gctccagcac tcttaagtta ttttaagaat tctcacttgg cctttagcac13680acccgccacc cccaagtggg tgtggataat gccatggcca gcagggggca ctgttgaggc13740gggtgccttt ccaccttaag ttgcttatag tatttaagat gctaaatgtt ttaatcaaga13800gaagcactga tcttataata cgaggataag agattttctc acaggaaatt gtctttttca13860taattctttt acaggctttg tcctgatcgt agcatagaga gaatagctgg atatttaact13920tgtattccat tttcctctgc cagcgttagg ttaactccgt aaaaagtgat tcagtggacc13980gaagaggctc agagggcagg ggatggtggg gtgaggcaga gcactgtcac ctgccaggca14040tgggaggtcc tgccatccgg gaggaaaagg aaagtttagc ctctagtcta ccaccagtgt14100taacgcactc taaagttgta accaaaataa atgtcttaca ttacaaagac gtctgttttg14160tgtttccttt tgtgtgtttg ggctttttat gtgtgcttta taactgctgt ggtggtgctg14220ttgttagttt tgaggtagga tctcaggctg gccttgaact tctgatcgcc tgcccctgcc14280cctgcccctg cccctgtccc tgcctccaag tgctaggact aaaagcacat gccaccacac14340cagtacagca tttttctaac atttaaaaat aatcacctag gggctggaga gagggttcca14400gctaagagtg cacactgctc ttgggtagga cctgagttta gttcccagaa cctatactgg14460gtggctccag gtccagagga tccaggacct ctggcctcca tgggcatctg ctcttagcac14520atacccacat acagatacac acataaaaat aaaatgaagc ctttaaaaac ctcctaaaac14580ctagcccttg gaggtacgac tctggaaagc tggcatactg tgtaagtcca tctcatggtg14640ttctggctaa cgtaagactt acagagacag aaaagaactc agggtgtgct gggggttggg14700atggaggaag agggatgagt agggggagca cggggaactt gggcagtgaa aattctttgc14760aggacactag aggaggataa ataccagtca ttgcacccac tactggacaa ctccagggaa14820ttatgctggg tgaaaagaga aggccccagg tattggctgc attggctgca tttgcgtaac14880atttttttaa attgaaaaga aaaagatgta aatcaaggtt agatgagtgg ttgctgtgag14940ctgagagctg gggtgagtga gacatgtgga caactccatc aaaaagcgac agaaagaacg15000ggctgtggtg acagctacct ctaatctcca cctccgggag gtgatcaagg ttagccctca15060gctagcctgt ggtgcatgag accctgtttc aaaaacttta ataaagaaat aatgaaaaaa15120gacatcaggg cagatccttg gggccaaagg cggacaggcg agtctcgtgg taaggtcgtg15180tagaagcgga tgcatgagca cgtgccgcag gcatcatgag agagccctag gtaagtaagg15240atggatgtga gtgtgtcggc gtcggcgcac tgcacgtcct ggctgtggtg ctggactggc15300
atctttggtg agctgtggag gggaaatggg tagggagatc ataaaatccc tccgaattat15360ttcaagaact gtctattaca attatctcaa aatattaaaa aaaaagaaga attaaaaaac15420aaaaaaccta tccaggtgtg gtggtgtgca cctatagcca cgggcacttg gaaagctgga15480gcaagaggat ggcgagtttg aaggtatctg gggctgtaca gcaagaccgt cgtccccaaa15540ccaaaccaaa cagcaaaccc attatgtcac acaagagtgt ttatagtgag cggcctcgct15600gagagcatgg ggtgggggtg ggggtggggg acagaaatat ctaaactgca gtcaataggg15660atccactgag accctggggc ttgactgcag cttaaccttg ggaaatgata agggttttgt15720gttgagtaaa agcatcgatt actgacttaa cctcaaatga agaaaaagaa aaaaagaaaa15780caacaaaagc caaaccaagg ggctggtgag atggctcagt gggtaagagc acccgactgc15840tcttccgaag gtccagagtt caaatcccag caaccacatg gtggctcaca accatctgta15900acgagatatg atgccctctt ctggtgtgtc tgaagacagc tacagtgtac ttacatataa15960taaataaatc ttaaaaaaaa aaaaaaaaaa aaaagccaaa ccgagcaaac caggccccca16020aacagaaggc aggcacgacg gcaggcacca cgagccatcc tgtgaaaagg cagggctacc16080catgggccga ggagggtcca gagagatagg ctggtaagct cagtttctct gtataccctt16140tttcttgttg acactacttc aattacagat aaaataacaa ataaacaaaa tctagagcct16200ggccactctc tgctcgcttg atttttcctg ttacgtccag caggtggcgg aagtgttcca16260aggacagatc gcatcattaa ggtggccagc ataatctccc atcagcaggt ggtgctgtga16320gaaccattat ggtgctcaca gaatcccggg cccaggagct gccctctccc aagtctggag16380caataggaaa gctttctggc ccagacaggg ttaacagtcc acattccaga gcaggggaaa16440aggagactgg aggtcacaga caaaagggcc agcttctaac aacttcacag ctctggtagg16500agagatagat cacccccaac aatggccaca gctggttttg tctgccccga aggaaactga16560cttaggaagc aggtatcaga gtccccttcc tgaggggact tctgtctgcc ttgtaaagct16620gtcagagcag ctgcattgat gtgtgggtga cagaagatga aaaggaggac ccaggcagat16680cgccacagat ggaccggcca cttacaagtc gaggcaggtg gcagagcctt gcagaagctc16740tgcaggtgga cgacactgat tcattaccca gttagcatac cacagcgggc taggcggacc16800acagcctcct tcccagtctt cctccagggc tggggagtcc tccaaccttc tgtctcagtg16860cagcttccgc cagcccctcc tccttttgca cctcaggtgt gaaccctccc tcctctcctt16920ctccctgtgg catggccctc ctgctactgc aggctgagca ttggatttct ttgtgcttag16980atagacctga gatggctttc tgatttatat atatatatcc atcccttgga tcttacatct17040aggacccaga gctgtttgtg ataccataag aggctgggga gatgatatgg taagagtgct17100tgctgtacaa gcatgaagac atgagttcga atccccagca accatgtgga aaaataacct17160tctaacctca gagttgaggg gaaaggcagg tggattctgg gggcttactg gccagctagc17220cagcctaacc taaatgtctc agtcagagat cctgtctcag ggaataactt gggagaatga17280ctgagaaaga cacctcctca ggtctcccat gcacccacac agacacacgg ggggggggta17340atgtaataag ctaagaaata atgagggaaa tgattttttg ctaagaaatg aaattctgtg17400ttggccgcaa gaagcctggc cagggaagga actgcctttg gcacaccagc ctataagtca17460ccatgagttc cctggctaag aatcacatgt aatggagccc aggtccctct tgcctggtgg17520ttgcctctcc cactggtttt gaagagaaat tcaagagaga tctccttggt cagaattgta17580ggtgctgagc aatgtggagc tggggtcaat gggattcctt taaaggcatc cttcccaggg17640ctgggtcata cttcaatagt agggtgcttg cacagcaagc gtgagaccct aggttagagt17700ccccagaatc tgcccccaac cccccaaaaa ggcatccttc tgcctctggg tgggtggggg17760gagcaaacac ctttaactaa gaccattagc tggcaggggt aacaaatgac cttggctaga17820ggaatttggt caagctggat tccgccttct gtagaagccc cacttgtttc ctttgttaag17880ctggcccaca gtttgttttg agaatgcctg aggggcccag ggagccagac aattaaaagc17940caagctcatt ttgatatctg aaaaccacag cctgactgcc ctgcccgtgg gaggtactgg18000gagagctggc tgtgtccctg cctcaccaac gccccccccc ccaacacaca ctcctcgggt18060cacctgggag gtgccagcag caatttggaa gtttactgag cttgagaagt cttgggaggg18120ctgacgctaa gcacacccct tctccacccc cccccacccc acccccgtga ggaggagggt18180gaggaaacat gggaccagcc ctgctccagc ccgtccttat tggctggcat gaggcagagg18240gggctttaaa aaggcaaccg tatctaggct ggacactgga gcctgtgcta ccgagtgccc18300tcctccacct ggcagcatgc agccctcact agccccgtgc ctcatctgcc tacttgtgca18360cgctgccttc tgtgctgtgg agggccaggg gtggcaagcc ttcaggaatg atgccacaga18420ggtcatccca gggcttggag agtaccccga gcctcctcct gagaacaacc agaccatgaa18480ccgggcggag aatggaggca gacctcccca ccatccctat gacgccaaag gtacgggatg18540aagaagcaca ttagtggggg ggggggtcct gggaggtgac tggggtggtt ttagcatctt18600cttcagaggt ttgtgtgggt ggctagcctc tgctacatca gggcagggac acatttgcct18660ggaagaatac tagcacagca ttagaacctg gagggcagca ttggggggct ggtagagagc18720
acccaaggca gggtggaggc tgaggtcagc cgaagctggc attaacacgg gcatgggctt18780gtatgatggt ccagagaatc tcctcctaag gatgaggaca caggtcagat ctagctgctg18840accagtgggg aagtgatatg gtgaggctgg atgccagatg ccatccatgg ctgtactata18900tcccacatga ccaccacatg aggtaaagaa ggccccagct tgaagatgga gaaaccgaga18960ggctcctgag ataaagtcac ctgggagtaa gaagagctga gactggaagc tggtttgatc19020cagatgcaag gcaaccctag attgggtttg ggtgggaacc tgaagccagg aggaatccct19080ttagttcccc cttgcccagg gtctgctcaa tgagcccaga gggttagcat taaaagaaca19140gggtttgtag gtggcatgtg acatgagggg cagctgagtg aaatgtcccc tgtatgagca19200caggtggcac cacttgccct gagcttgcac cctgacccca gctttgcctc attcctgagg19260acagcagaaa ctgtggaggc agagccagca cagagagatg cctggggtgg gggtgggggt19320atcacgcacg gaactagcag caatgaatgg ggtggggtgg cagctggagg gacactccag19380agaaatgacc ttgctggtca ccatttgtgt gggaggagag ctcattttcc agcttgccac19440cacatgctgt ccctcctgtc tcctagccag taagggatgt ggaggaaagg gccaccccaa19500aggagcatgc aatgcagtca cgtttttgca gaggaagtgc ttgacctaag ggcactattc19560ttggaaagcc ccaaaactag tccttccctg ggcaaacagg cctcccccac ataccacctc19620tgcaggggtg agtaaattaa gccagccaca gaagggtggc aaggcctaca cctcccccct19680gttgtgcccc cccccccccc gtgaaggtgc atcctggcct ctgcccctct ggctttggta19740ctgggatttt ttttttcctt ttatgtcata ttgatcctga caccatggaa cttttggagg19800tagacaggac ccacacatgg attagttaaa agcctcccat ccatctaagc tcatggtagg19860agatagagca tgtccaagag aggagggcag gcatcagacc tagaagatat ggctgggcat19920ccaacccaat ctccttcccc ggagaacaga ctctaagtca gatccagcca cccttgagta19980accagctcaa ggtacacaga acaagagagt ctggtataca gcaggtgcta aacaaatgct20040tgtggtagca aaagctatag gttttgggtc agaactccga cccaagtcgc gagtgaagag20100cgaaaggccc tctactcgcc accgccccgc ccccacctgg ggtcctataa cagatcactt20160tcacccttgc gggagccaga gagccctggc atcctaggta gccccccccg cccccccccc20220gcaagcagcc cagccctgcc tttggggcaa gttcttttct cagcctggac ctgtgataat20280gagggggttg gacgcgccgc ctttggtcgc tttcaagtct aatgaattct tatccctacc20340acctgccctt ctaccccgct cctccacagc agctgtcctg atttattacc ttcaattaac20400ctccactcct ttctccatct cctgggatac cgcccctgtc ccagtggctg gtaaaggagc20460ttaggaagga ccagagccag gtgtggctag aggctaccag gcagggctgg ggatgaggag20520ctaaactgga agagtgtttg gttagtaggc acaaagcctt gggtgggatc cctagtaccg20580gagaagtgga gatgggcgct gagaagttca agaccatcca tccttaacta cacagccagt20640ttgaggccag cctgggctac ataaaaaccc aatctcaaaa gctgccaatt ctgattctgt20700gccacgtagt gcccgatgta atagtggatg aagtcgttga atcctggggc aacctatttt20760acagatgtgg ggaaaagcaa ctttaagtac cctgcccaca gatcacaaag aaagtaagtg20820acagagctcc agtgtttcat ccctgggttc caaggacagg gagagagaag ccagggtggg20880atctcactgc tccccggtgc ctccttccta taatccatac agattcgaaa gcgcagggca20940ggtttggaaa aagagagaag ggtggaagga gcagaccagt ctggcctagg ctgcagcccc21000tcacgcatcc ctctctccgc agatgtgtcc gagtacagct gccgcgagct gcactacacc21060cgcttcctga cagacggccc atgccgcagc gccaagccgg tcaccgagtt ggtgtgctcc21120ggccagtgcg gccccgcgcg gctgctgccc aacgccatcg ggcgcgtgaa gtggtggcgc21180ccgaacggac cggatttccg ctgcatcccg gatcgctacc gcgcgcagcg ggtgcagctg21240ctgtgccccg ggggcgcggc gccgcgctcg cgcaaggtgc gtctggtggc ctcgtgcaag21300tgcaagcgcc tcacccgctt ccacaaccag tcggagctca aggacttcgg gccggagacc21360gcgcggccgc agaagggtcg caagccgcgg cccggcgccc ggggagccaa agccaaccag21420gcggagctgg agaacgccta ctagagcgag cccgcgccta tgcagccccc gcgcgatccg21480attcgttttc agtgtaaagc ctgcagccca ggccaggggt gccaaacttt ccagaccgtg21540tggagttccc agcccagtag agaccgcagg tccttctgcc cgctgcgggg gatggggagg21600gggtggggtt cccgcgggcc aggagaggaa gcttgagtcc cagactctgc ctagccccgg21660gtgggatggg ggtctttcta ccctcgccgg acctatacag gacaaggcag tgtttccacc21720ttaaagggaa gggagtgtgg aacgaaagac ctgggactgg ttatggacgt acagtaagat21780ctactccttc cacccaaatg taaagcctgc gtgggctaga tagggtttct gaccctgacc21840tggccactga gtgtgatgtt gggctacgtg gttctctttt ggtacggtct tctttgtaaa21900atagggaccg gaactctgct gagattccaa ggattggggt accccgtgta gactggtgag21960agagaggaga acaggggagg ggttagggga gagattgtgg tgggcaaccg cctagaagaa22020gctgtttgtt ggctcccagc ctcgccgcct cagaggtttg gcttccccca ctccttcctc22080tcaaatctgc cttcaaatcc atatctggga tagggaaggc cagggtccga gagatggtgg22140
aagggccaga aatcacactc ctggcccccc gaagagcagt gtcccgcccc caactgcctt22200gtcatattgt aaagggattt tctacacaac agtttaaggt cgttggagga aactgggctt22260gccagtcacc tcccatcctt gtcccttgcc aggacaccac ctcctgcctg ccacccacgg22320acacatttct gtctagaaac agagcgtcgt cgtgctgtcc tctgagacag catatcttac22380attaaaaaga ataatacggg gggggggggc ggagggcgca agtgttatac atatgctgag22440aagctgtcag gcgccacagc accacccaca atctttttgt aaatcatttc cagacacctc22500ttactttctg tgtagatttt aattgttaaa aggggaggag agagagcgtt tgtaacagaa22560gcacatggag gggggggtag gggggttggg gctggtgagt ttggcgaact ttccatgtga22620gactcatcca caaagactga aagccgcgtt ttttttttta agagttcagt gacatattta22680ttttctcatt taagttattt atgccaacat ttttttcttg tagagaaagg cagtgttaat22740atcgctttgt gaagcacaag tgtgtgtggt tttttgtttt ttgttttttc cccgaccaga22800ggcattgtta ataaagacaa tgaatctcga gcaggaggct gtggtcttgt tttgtcaacc22860acacacaatg tctcgccact gtcatctcac tcccttccct tggtcacaag acccaaacct22920tgacaacacc tccgactgct ctctggtagc ccttgtggca atacgtgttt cctttgaaaa22980gtcacattca tcctttcctt tgcaaacctg gctctcattc cccagctggg tcatcgtcat23040accctcaccc cagcctccct ttagctgacc actctccaca ctgtcttcca aaagtgcacg23100tttcaccgag ccagttccct ggtccaggtc atcccattgc tcctccttgc tccagaccct23160tctcccacaa agatgttcat ctcccactcc atcaagcccc agtggccctg cggctatccc23220tgtctcttca gttagctgaa tctacttgct gacaccacat gaattccttc ccctgtctta23280aggttcatgg aactcttgcc tgcccctgaa ccttccagga ctgtcccagc gtctgatgtg23340tcctctctct tgtaaagccc caccccacta tttgattccc aattctagat cttcccttgt23400tcattccttc acgggatagt gtctcatctg gccaagtcct gcttgatatt gggataaatg23460caaagccaag tacaattgag gaccagttca tcattgggcc aagctttttc aaaatgtgaa23520ttttacacct atagaagtgt aaaagccttc caaagcagag gcaatgcctg gctcttcctt23580caacatcagg gctcctgctt tatgggtctg gtggggtagt acattcataa acccaacact23640aggggtgtga aagcaagatg attgggagtt cgaggccaat cttggctatg aggccctgtc23700tcaacctctc ctccctccct ccagggtttt gttttgtttt gtttttttga tttgaaactg23760caacacttta aatccagtca agtgcatctt tgcgtgaggg gaactctatc cctaatataa23820gcttccatct tgatttgtgt atgtgcacac tgggggttga acctgggcct ttgtacctgc23880cgggcaagct ctctactgct ctaaacccag ccctcactgg ctttctgttt caactcccaa23940tgaattcccc taaatgaatt atcaatatca tgtctttgaa aaataccatt gagtgctgct24000ggtgtccctg tggttccaga ttccaggaag gacttttcag ggaatccagg catcctgaag24060aatgtcttag agcaggaggc catggagacc ttggccagcc ccacaaggca gtgtggtgca24120gagggtgagg atggaggcag gcttgcaatt gaagctgaga oagggtactc aggattaaaa24180agcttccccc aaaacaattc caagatcagt tcctggtact tgcacctgtt cagctatgca24240gagcccagtg ggcataggtg aagacaccgg ttgtactgtc atgtactaac tgtgcttcag24300agccggcaga gacaaataat gttatggtga ccccagggga cagtgattcc agaaggaaca24360cagaagagag tgctgctaga ggctgcctga aggagaaggg gtcccagact ctctaagcaa24420agactccact cacataaaga cacaggctga gcagagctgg ccgtggatgc agggagccca24480tccaccatcc tttagcatgc ccttgtattc ccatcacatg ccagggatga ggggcatcag24540agagtccaag tgatgcccaa acccaaacac acctaggact tgctttctgg gacagacaga24600tgcaggagag actaggttgg gctgtgatcc cattaccaca aagagggaaa aaacaaaaaa24660caaacaaaca aacaaaaaaa aacaaaacaa aacaaaaaaa aacccaaggt ccaaattgta24720ggtcaggtta gagtttattt atggaaagtt atattctacc tccatggggt ctacaaggct24780ggcgcccatc agaaagaaca aacaacaggc tgatctggga ggggtggtac tctatggcag24840ggagcacgtg tgcttggggt acagccagac acggggcttg tattaatcac agggcttgta24900ttaataggct gagagtcaag cagacagaga gacagaagga aacacacaca cacacacaca24960cacacacaca cacacacaca catgcacaca ccactcactt ctcactcgaa gagcccctac25020ttacattcta agaacaaacc attcctcctc ataaaggaga caaagttgca gaaacccaaa25080agagccacag ggtccccact ctctttgaaa tgacttggac ttgttgcagg gaagacagag25140gggtctgcag aggcttcctg ggtgacccag agccacagac actgaaatct ggtgctgaga25200cctgtataaa ccctcttcca caggttccct gaaaggagcc cacattcccc aaccctgtct25260cctgaccact gaggatgaga gcacttgggc cttccccatt cttggagtgc accctggttt25320ccccatctga gggcacatga ggtctcaggt cttgggaaag ttccacaagt attgaaagtg25380ttcttgtttt gtttgtgatt taatttaggt gtatgagtgc ttttgcttga atatatgcct25440gtgtagcatt tacaagcctg gtgcctgagg agatcagaag atggcatcag ataccctgga25500actggacttg cagacagtta tgagccactg tgtgggtgct aggaacagaa cctggatcct25560
ccggaagagc agacagccag cgctcttagc cactaagcca tcactgaggt tctttctgtg25620gctaaagaga caggagacaa aggagagttt cttttagtca ataggaccat gaatgttcct25680cgtaacgtga gactagggca gggtgatccc ccagtgacac cgatggccct gtgtagttat25740tagcagctct agtcttattc cttaataagt cccagtttgg ggcaggagat atgtattccc25800tgctttgaag tggctgaggt ccagttatct acttccaagt acttgtttct ctttctggag25860ttggggaagc tccctgcctg cctgtaaatg tgtccattct tcaaccttag acaagatcac25920tttccctgag cagtcaggcc agtccaaagc ccttcaattt agctttcata aggaacaccc25980cttttgttgg gtggaggtag cacttgcctt gaatcccagc attaagaagg cagagacagt26040cggatctctg tgagttcaca gccagcctgg tctacggagt gagttccaag acagccaggc26100ctacacagag aaaccctgtc tcgaaaaaaa caaaaacaaa agaaataaag aaaaagaaaa26160caaaaacgaa caaacagaaa aacaagccag agtgtttgtc cccgtatttt attaatcata26220tttttgtccc tttgccattt tagactaaaa gactcgggaa agcaggtctc tctctgtttc26280tcatccggac acacccagaa ccagatgtat ggaagatggc taatgtgctg cagttgcaca26340tctggggctg ggtggattgg ttagatggca tgggctgggt gtggttacga tgactgcagg26400agcaaggagt atgtggtgca tagcaaacga ggaagtttgc acagaacaac actgtgtgta26460ctgatgtgca ggtatgggca catgcaagca gaagccaagg gacagcctta gggtagtgtt26520tccacagacc cctcccccct tttaacatgg gcatctctca ttggcctgga gcttgccaac26580tgggctgggc tggctagctt gtaggtccca gggatctgca tatctctgcc tccctagtgc26640tgggattaca gtcatatatg agcacacctg gcttttttat gtgggttctg ggctttgaac26700ccagatctga gtgcttgcaa ggcaatcggt tgaatgactg cttcatctcc ccagaccctg26760ggattctact ttctattaaa gtatttctat taaatcaatg agcccctgcc cctgcactca26820gcagttctta ggcctgctga gagtcaagtg gggagtgaga gcaagcctcg agaccccatc26880agcgaagcag aggacaaaga aatgaaaact tgggattcga ggctcgggat atggagatac26940agaaagggtc agggaaggaa atgaaccaga tgaatagagg caggaagggt agggccctgc27000atacatggaa cctggtgtac atgttatctg catggggttt gcattgcaat ggctcttcag27060caggttcacc acactgggaa acagaagcca aaaagaagag taggtggtgt tggagtcaga27120tactgtcagt catgcctgaa gaaatggaag caattaacga tgcgccgcaa ttaggatatt27180agctccctga agaaaggcaa gaagctgggc tgtgggcact gaagggagct ttgaatgatg27240tcacattctc tgtatgccta gcagggcagt attggagact gagacttgac ttgtgtgtcc27300atatgattcc tccttttcct acagtcatct ggggctcctg agcttcgtcc ttgtccaaga27360acctggagct ggcagtgggc agctgcagtg atagatgtct gcaagaaaga tctgaaaaga27420gggaggaaga tgaaggaccc agaggaccac cgacctctgc tgcctgacaa agctgcagga27480ccagtctctc ctacagatgg gagacagagg cgagagatga atggtcaggg gaggagtcag27540agaaaggaga gggtgaggca gagaccaaag gagggaaaca cttgtgctct acagctactg27600actgagtacc agctgcgtgg cagacagcca atgccaaggc tcggctgatc atggcacctc27660gtgggactcc tagcccagtg ctggcagagg ggagtgctga atggtgcatg gtttggatat27720gatctgaatg tggtccagcc ctagtttcct tccagttgct gggataaagc accctgacca27780aagctacttt tttgtttgtt tgttttggtt tggttttgtt tggtttttcg aggcagggtt27840tctctgtatc accctagctg tcctggaact cactctgtag accaggctgg cctcgaactc27900agaaatcccc ctgcctctgc ctcctaagtg ctggaattaa aggcctgcgc caccactgcc27960ggcccaaagc tactttaaga gagagagagg aatgtataag tattataatt ccaggttata28020gttcattgct gtagaattgg agtcttcata ttccaggtaa tctcccacag acatgccaca28080aaacaacctg ttctacgaaa tctctcatgg actcccttcc ccagtaattc taaactgtgt28140caaatctaca agaaatagtg acagtcacag tctctaacgt tttgggcatg agtctgaagt28200ctcattgcta agtactggga agatgaaaac tttacctagt gtcagcattt ggagcagagc28260ctttgggatt tgagatggtc ttttgcagag ctcctaatgg ctacatggag agagggggcc28320tgggagagac ccatacacct tttgctgcct tatgtcacct gacctgctcc ttgggaagct28380ctagcaagaa ggccttccct ggatcaccca ccaccttgca cctccagaac tcagagccaa28440attaaacttt cttgttactg tcgtcaaagc acagtcggtc tgggttgtat cactgtcaat28500gggaaacaga cttgcctgga tggataactt gtacattgca taatgtctag aaatgaaaag28560tcctatagag aaaaagaaaa ttagctggca cacagataga ggccctggag gaggctggct28620ttgtcctccc cgaggaggtg gcgagtaagg tgtaaatgtt catggatgta aatgggccca28680tatatgaggg tctggggtaa caagaaggcc tgtgaatata aagcactgaa ggtatgtcta28740gtctggagaa ggtcactaca gagagttctc caactcagtg cccatacaca cacacacaca28800cacacacaca cacacacaca cacacacaca ccacaaagaa aaaaaggaag aaaaatctga28860gagcaagtac agtacttaaa attgtgtgat tgtgtgtgtg actctgatgt cacatgctca28920tcttgcccta tgagttgaaa accaaatggc ccctgagagg cataacaacc acactgttgg28980
ctgtgtgctc acgtttttct taaagcgtct gtctggtttg ctgctagcat caggcagact29040tgcagcagac tacatatgct cagccctgaa gtccttctag ggtgcatgtc tcttcagaat29100ttcagaaagt catctgtggc tccaggaccg cctgcactct ccctctgccg cgaggctgca29160gactctaggc tggggtggaa gcaacgctta cctctgggac aagtataaca tgttggcttt29220tctttccctc tgtggctcca acctggacat aaaatagatg caagctgtgt aataaatatt29280tcctcccgtc cacttsgttc tcaacaataa ctactctgag agcacttatt aataggtggc29340ttagacataa gctttggctc attcccccac tagctcttac ttctttaact ctttcaaacc29400attctgtgtc ttccacatgg ttagttacct ctccttccat cctggttcgc ttcttccttc29460gagtcgccct cagtgtctct aggtgatgct tgtaagatat tctttctaca aagctgagag29520tggtggcact ctgggagttc aaagccagcc tgatctacac agcaagctcc aggatatcca29580gggcaatgtt gggaaaacct ttctcaaaca aaaagagggg ttcagttgtc aggaggagac29640ccatgggtta agaagtctag acgagccatg gtgatgcata cctttcatcc aagcacttag29700gaggcaaaga aaggtgaaac tctttgactt tgaggccagc taggttacat agtgataccc29760tgcttagtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtaatt taaaagtcta29820aaaatgcatt cttttaaaaa tatgtataag tatttgcctg cacatatgta tgtatgtatg29880tataccatgt gtgtgtctgg tgctgaagga ctaggcatag actccctaga actagagtca29940tagacagttg tgacactccc caacccccca ccatgtgggt gcttgaagct aaactcctgt30000cctttgtaaa gcagcaggtg tctatgaacc ctgaaccatc tctccagtct ccagatgtgc30060attctcaaag aggagtcctt catatttccc taaactgaac atccttatca gtgagcatcc30120tcgagtcacc aaagctactg caaaccctct tagggaacat tcactattca cttctacttg30180gctcatgaaa cttaagtaca cacacacaaa cacacacaca cacacagagt catgcactca30240caaaagcatg catgtacacc attcttatta gactatgctt tgctaaaaga ctttcctaga30300tactttaaaa catcacttct gccttttggt gggcaggttc caagattggt actggcgtac30360tggaaactga acaaggtaga gatctagaaa tcacagcagg tcagaagggc cagcctgtac30420aagagagagt tccacacctt ccaggaacac tgagcagggg gctgggacct tgcctctcag30480cccaagaaac tagtgcgttt cctgtatgca tgcctctcag agattccata agatctgcct30540tctgccataa gatctcctgc atccagacaa gcctagggga agttgagagg ctgcctgagt30600ctctcccaca ggccccttct tgcctggcag tattttttta tctggaggag aggaatcagg30660gtgggaatga tcaaatacaa ttatcaagga aaaagtaaaa aacatatata tatatatatt30720aactgatcta gggagctggc tcagcagtta agagttctgg ctgcccttgc ttcagatctt30780gctttgattc ccagcaccca catgatggct ttcaactgta tctctgcttc caggggatcc30840aacagcctct tctgacctcc atagacaaga cctagtcctc tgcaagagca ccaaatgctc30900ttatctgttg atccatctct ctagcctcat gccagatcat ttaaaactac tggacactgt30960cccattttac gaagatgtca ctgcccagtc atttgccatg agtggatatt tcgattcttt31020ctatgttctc acccttgcaa tttataagaa agatatctgc atttgtctcc tgagagaaca31080aagggtggag ggctactgag atggctctag gggtaaaggt gcttgccaca aaatctgaca31140acttaagttt ggtcttggaa tccacatggt ggagagagag aagagattcc cgtaagttgt31200cctcaaactt cccacacatg tgctgtggct tatgtgtaac cccaataagt aaagatagtt31260ttaaacacta cataaggtag ggtttcttca tgaccccaag gaatgatgcc cctgatagag31320cttatgctga aaccccatct ccattgtgcc atctggaaag agacaattgc atcccggaaa31380cagaatcttc atgaatggat taatgagcta ttaagaaagt ggcttggtta ttgcacatgc31440tggcggcgta atgacctcca ccatgatgtt atccagcatg aaggtcctca ccagaagtca31500tacaaatctt cttaggcttc cagagtcgtg agcaaaaaaa gcacacctct aaataaatta31560actagcctca ggtagttaac caccgaaaat gaaccaaggc agttctaata caaaaccact31620tcccttccct gttcaaacca cagtgcccta ttatctaaaa gataaacttc aagccaagct31680tttaggttgc cagtatttat gtaacaacaa ggcccgttga cacacatctg taactcctag31740tactgggcct caggggcaga gacaggtgga gccctggagt ttgaattcca ggttctgtga31800gaaactctgt ctgaaaagac aatatggtga gtgacccggg aggatatctg atattgactt31860ctggccaaca cacagccatc tctgcacatc tgtagttgca agccttttgc actaagtttg31920gccagagtca gagtttgcaa gtgtttgtgg actgaatgca cgtgttgctg gtgatctaca31980aagtcaccct ccttctcaag ctagcagcac tggcttcggc cagctgctca ttcaagcctc32040tttgcagagt catcacgggg atgggggagc agggcccctc cctagaacac caagcctgtg32100gttgtttatt caggacatta ttgagggcca agatgacaga taactctatc acttggccaa32160cagtcgggtg ttgcggtgtt aggttatttc tgtgtctgca gaaaacagtg caacctggac32220aaaagaaata aatgatatca tttttcattc aggcaactag attccgtggt acaaaaggct32280ccctggggaa cgaggccggg acagcgcggc tcctgagtcg ctatttccgt ctgtcaactt32340ctctaatctc ttgatttcct ccctctgtct gtttccttcc tcttgctggg gcccagtgga32400
gtctgtgtac tcacagggag gagggtggca aagccctggt cctctacggg ctgggggaag32460gggggaagct gtcggcccag tgactttttc ccctttctct ttttcttaga aaccagtctc32520aatttaagat aatgagtctc ctcattcacg tgtgctcact attcataggg acttatccac32580ccccgccctg tcaatctggc taagtaagac aagtcaaatt taaaagggaa cgtttttcta32640aaaatgtggc tggaccgtgt gccggcacga aaccagggat ggcggtctaa gttacatgct32700ctctgccagc cccggtgcct tttcctttcg gaaaggagac ccggaggtaa aacgaagttg32760ccaacttttg atgatggtgt gcgccgggtg actctttaaa atgtcatcca tacctgggat32820agggaaggct cttcagggag tcatctagcc ctcccttcag gaaaagattc cacttccggt32880ttagttagct tccacctggt cccttatccg ctgtctctgc ccactagtcc tcatccatcc32940ggtttccgcc ctcatccacc ttgccctttt agttcctaga aagcagcacc gtagtcttgg33000caggtgggcc attggtcact ccgctaccac tgttaccatg gccaccaagg tgtcatttaa33060atatgagctc actgagtcct gcgggatggc ttggttggta atatgcttgc tgcaaaatcg33120tgagaactgg agttcaattc ccagcacatg gatgtatttc cagcacctgg aaggcaggga33180gcagagatct taaagctcct ggccagacag cccagcctaa ttagtaatca gtgagagacc33240ctgtctcaag aaacaagatg gaacatcaaa ggtcaacctc ttgtctccac acacacaaat33300acacacatgc acatacatcc acacacaggc aaacacatgc acacacctga acaccctcca33360caaatacata cataaaaaaa taaatacata cacacataca tacatacacc aacattccct33420ctccttagtc tcctggctac gctcttgtca cccccactaa ggcttcaact tcttctattt33480cttcatcttg actcctctgt actttgcatg ccttttccag caaaggcttt tctttaaatc33540tccgtcattc ataaactccc tctaaatttc ttcccctgcc cttttctttc tctctaggga33600gataaagaca cacactacaa agtcaccgtg ggaccagttt attcacccac ccacccctgc33660ttctgttcat ccggccagct aagtagtcca acctctctgg tgctgtaccc tggaccctgg33720cttcaccaca gctcctccat gctacccagc cctgcaaacc ttcagcctag cctctggttc33780tccaaccagc acaggcccag tctggcttct atgtcctaga aatctccttc attctctcca33840tttccctcct gaatctacca ccttctttct cccttctcct gacctctaat gtcttggtca33900aacgattaca aggaagccaa tgaaattagc agtttggggt acctcagagt cagcagggga33960gctgggatga attcacattt ccaggccttt gctttgctcc ccggattctg acaggcagtt34020ccgaagctga gtccaggaag ctgaatttaa aatcacactc cagctgggtt ctgaggcagc34080cctaccacat cagctggccc tgactgagct gtgtctgggt ggcagtggtg ctggtggtgc34140tggtggtgct ggtggtggtg gtggtggtgg tggtggtggt ggtggtggtg tgtgtgtgtg34200ttttctgctt ttacaaaact tttctaattc ttatacaaag gacaaatctg cctcatatag34260gcagaaagat gacttatgcc tatataagat ataaagatga ctttatgcca cttattagca34320atagttactg tcaaaagtaa ttctatttat acacccttat acatggtatt gcttttgttg34380gagactctaa aatccagatt atgtatttaa aaaaaaattc cccagtcctt aaaaggtgaa34440gaatggaccc agatagaagg tcacggcaca agtatggagt cggagtgtgg agtcctgcca34500atggtctgga cagaagcatc cagagagggt ccaagacaaa tgcctcgcct cctaaggaac34560actggcagcc ctgatgaggt accagagatt gctaagtgga ggaatacagg atcagaccca34620tggaggggct taaagcgtga ctgtagcagc cctccgctga ggggctccag gtgggcgccc34680aaggtgctgc agtgggagcc acatgagagg tgatgtcttg gagtcacctc gggtaccatt34740gtttagggag gtggggattt gtggtgtgga gacaggcagc ctcaaggatg cttttcaaca34800atggttgatg agttggaact aaaacagggg ccatcacact ggctcccata gctctgggct34860tgccagcttc cacatctgcc ccccaccccc tgtctggcac cagctcaagc tctgtgattc34920tacacatcca aaagaggaag agtagcctac tgggcatgcc acctcttctg gaccatcagg34980tgagagtgtg gcaagcccta ggctcctgtc caggatgcag ggctgccaga taggatgctc35040agctatctcc tgagctggaa ctattttagg aataaggatt atgcccgccc ggggttggcc35100agcaccccag cagcctgtgc ttgcgtaaaa gcaagtgctg ttgatttatc taaaaacaga35160gccgtggacc cacccacagg acaagtatgt atgcatctgt ttcatgtatc tgaaaagcga35220cacaaccatt tttcacatca tggcatcttc ctaaccccca ttcttttttg ttttgttttt35280ttgagacagg gtttctctgt gtagtcctgg ctgtcctgga actcactttg tagaccaggc35340tggcctcgaa ctcagaaatc ctgggattaa aggtgtgtgc caccacgccc ggccctaacc35400cccattctta atggtgatcc agtggttgaa atttcgggcc acacacatgt ccattaggga35460ttagctgctg tcttctgagc tacctggtac aatctttatc ccctggggcc tgggctcctg35520atccctgact cgggcccgat caagtccagt tcctgggccc gatcaagtcc agttcctggg35580cccgaacaag tccagtccct agctcgatta gctcatcctg gctccctggc ctgttcttac35640ttacactctt ccccttgctc tggacttgtt gctttcttta ctcaagttgt ctgccacagt35700ccctaagcca cctctgtaag acaactaaga taatacttcc ctcaagcacg gaaagtcctg35760agtcaccaca ccctctggag gtgtgtggac acatgttcat gcgtgtggtt gcgcttacgt35820
acgtgtg 35828<210>18<211>9301<212>DNA<213>Homo sapien<400>18tagaggagaa gtctttgggg agggtttgct ctgagcacac ccctttccct ccctccgggg60ctgagggaaa catgggacca gccctgcccc agcctgtcct cattggctgg catgaagcag120agaggggctt taaaaaggcg accgtgtctc ggctggagac cagagcctgt gctactggaa180ggtggcgtgc cctcctctgg ctggtaccat gcagctccca ctggccctgt gtctcgtctg240cctgctggta cacacagcct tccgtgtagt ggagggccag gggtggcagg cgttcaagaa300tgatgccacg gaaatcatcc ccgagctcgg agagtacccc gagcctccac cggagctgga360gaacaacaag accatgaacc gggcggagaa cggagggcgg cctccccacc acccctttga420gaccaaaggt atggggtgga ggagagaatt cttagtaaaa gatcctgggg aggttttaga480aacttctctt tgggaggctt ggaagactgg ggtagaccca gtgaagattg ctggcctctg540ccagcactgg tcgaggaaca gtcttgcctg gaggtggggg aagaatggct cgctggtgca600gccttcaaat tcaggtgcag aggcatgagg caacagacgc tggtgagagc ccagggcagg660gaggacgctg gggtggtgag ggtatggcat cagggcatca gaacaggctc aggggctcag720aaaagaaaag gtttcaaaga atctcctcct gggaatatag gagccacgtc cagctgctgg780taccactggg aagggaacaa ggtaagggag cctcccatcc acagaacagc acctgtgggg840caccggacac tctatgctgg tggtggctgt ccccaccaca cagacccaca tcatggaatc900cccaggaggt gaacccccag ctcgaagggg aagaaacagg ttccaggcac tcagtaactt960ggtagtgaga agagctgagg tgtgaacctg gtttgatcca actgcaagat agccctggtg1020tgtggggggg tgtgggggac agatctccac aaagcagtgg ggaggaaggc cagagaggca1080cccctgcagt gtgcattgcc catggcctgc ccagggagct ggcacttgaa ggaatgggag1140ttttcggcac agttttagcc cctgacatgg gtgcagctga gtccaggccc tggaggggag1200agcagcatcc tctgtgcagg agtagggaca tctgtcctca gcagccaccc cagtcccaac1260cttgcctcat tccaggggag ggagaaggaa gaggaaccct gggttcctgg tcaggcctgc1320acagagaagc ccaggtgaca gtgtgcatct ggctctataa ttggcaggaa tcctgaggcc1380atgggggcgt ctgaaatgac acttcagact aagagcttcc ctgtcctctg gccattatcc1440aggtggcaga gaagtccact gcccaggctc ctggacccca gccctccccg cctcacaacc1500tgttgggact atggggtgct aaaaagggca actgcatggg aggccagcca ggaccctccg1560tcttcaaaat ggaggacaag ggcgcctccc cccacagctc cccttctagg caaggtcagc1620tgggctccag cgactgcctg aagggctgta aggaacccaa acacaaaatg tccaccttgc1680tggactccca cgagaggcca cagcccctga ggaagccaca tgctcaaaac aaagtcatga1740tctgcagagg aagtgcctgg cctaggggcg ctattctcga aaagccgcaa aatgccccct1800tccctgggca aatgcccccc tgaccacaca cacattccag ccctgcagag gtgaggatgc1860aaaccagccc acagaccaga aagcagcccc agacgatggc agtggccaca tctcccctgc1920tgtgcttgct cttcagagtg ggggtggggg gtggccttct ctgtcccctc tctggtttgg1980tcttaagact atttttcatt ctttcttgtc acattggaac tatccccatg aaacctttgg2040gggtggactg gtactcacac gacgaccagc tatttaaaaa gctcccaccc atctaagtcc2100accataggag acatggtcaa ggtgtgtgca ggggatcagg ccaggcctcg gagcccaatc2160tctgcctgcc cagggagtat caccatgagg cgcccattca gataacacag aacaagaaat2220gtgcccagca gagagccagg tcaatgtttg tggcagctga acctgtaggt tttgggtcag2280agctcagggc ccctatggta ggaaagtaac gacagtaaaa agcagccctc agctccatcc2340cccagcccag cctcccatgg atgctcgaac gcagagcctc cactcttgcc ggagccaaaa2400ggtgctggga ccccagggaa gtggagtccg gagatgcagc ccagcctttt gggcaagttc2460ttttctctgg ctgggcctca gtattctcat tgataatgag ggggttggac acactgcctt2520tgattccttt caagtctaat gaattcctgt cctgatcacc tccccttcag tccctcgcct2580ccacagcagc tgccctgatt tattaccttc aattaacctc tactcctttc tccatcccct2640gtccacccct cccaagtggc tggaaaagga atttgggaga agccagagcc aggcagaagg2700tgtgctgagt acttaccctg cccaggccag ggaccctgcg gcacaagtgt ggcttaaatc2760ataagaagac cccagaagag aaatgataat aataatacat aacagccgac gctttcagct2820atatgtgcca aatggtattt tctgcattgc gtgtgtaatg gattaactcg caatgcttgg2880ggcggcccat tttgcagaca ggaagaagag agaggttaag gaacttgccc aagatgacac2940
ctgcagtgag cgatggagcc ctggtgtttg aaccccagca gtcatttggc tccgagggga3000cagggtgcgc aggagagctt tccaccagct ctagagcatc tgggaccttc ctgcaataga3060tgttcagggg caaaagcctc tggagacagg cttggcaaaa gcagggctgg ggtggagaga3120gacgggccgg tccagggcag gggtggccag gcgggcggcc accctcacgc gcgcctctct3180ccacagacgt gtccgagtac agctgccgcg agctgcactt cacccgctac gtgaccgatg3240ggccgtgccg cagcgccaag ccggtcaccg agctggtgtg ctccggccag tgcggcccgg3300cgcgcctgct gcccaacgcc atcggccgcg gcaagtggtg gcgacctagt gggcccgact3360tccgctgcat ccccgaccgc taccgcgcgc agcgcgtgca gctgctgtgt cccggtggtg3420aggcgccgcg cgcgcgcaag gtgcgcctgg tggcctcgtg caagtgcaag cgcctcaccc3480gcttccacaa ccagtcggag ctcaaggact tcgggaccga ggccgctcgg ccgcagaagg3540gccggaagcc gcggccccgc gcccggagcg ccaaagccaa ccaggccgag ctggagaacg3600cctactagag cccgcccgcg cccctcccca ccggcgggcg ccccggccct gaacccgcgc3660cccacatttc tgtcctctgc gcgtggtttg attgtttata tttcattgta aatgcctgca3720acccagggca gggggctgag accttccagg ccctgaggaa tcccgggcgc cggcaaggcc3780cccctcagcc cgccagctga ggggtcccac ggggcagggg agggaattga gagtcacaga3840cactgagcca cgcagccccg cctctggggc cgcctacctt tgctggtccc acttcagagg3900aggcagaaat ggaagcattt tcaccgccct ggggttttaa gggagcggtg tgggagtggg3960aaagtccagg gactggttaa gaaagttgga taagattccc ccttgcacct cgctgcccat4020cagaaagcct gaggcgtgcc cagagcacaa gactgggggc aactgtagat gtggtttcta4080gtcctggctc tgccactaac ttgctgtgta accttgaact acacaattct ccttcgggac4140ctcaatttcc actttgtaaa atgagggtgg aggtgggaat aggatctcga ggagactatt4200ggcatatgat tccaaggact ccagtgcctt ttgaatgggc agaggtgaga gagagagaga4260gaaagagaga gaatgaatgc agttgcattg attcagtgcc aaggtcactt ccagaattca4320gagttgtgat gctctcttct gacagccaaa gatgaaaaac aaacagaaaa aaaaaagtaa4380agagtctatt tatggctgac atatttacgg ctgacaaact cctggaagaa gctatgctgc4440ttcccagcct ggcttccccg gatgtttggc tacctccacc cctccatctc aaagaaataa4500catcatccat tggggtagaa aaggagaggg tccgagggtg gtgggaggga tagaaatcac4560atccgcccca acttcccaaa gagcagcatc cctcccccga cccatagcca tgttttaaag4620tcaccttccg aagagaagtg aaaggttcaa ggacactggc cttgcaggcc cgagggagca4680gccatcacaa actcacagac cagcacatcc cttttgagac accgccttct gcccaccact4740cacggacaca tttctgccta gaaaacagct tcttactgct cttacatgtg atggcatatc4800ttacactaaa agaatattat tgggggaaaa actacaagtg ctgtacatat gctgagaaac4860tgcagagcat aatagctgcc acccaaaaat ctttttgaaa atcatttcca gacaacctct4920tactttctgt gtagttttta attgttaaaa aaaaaaagtt ttaaacagaa cacatgaca 4980tatgaaagcc tgcaggactg gtcgtttttt tggcaattct tccacgtggg acttgtccac5040aagaatgaaa gtagtggttt ttaaagagtt aagttacata tttattttct cacttaagtt5100atttatgcaa aagtttttct tgtagagaat gacaatgtta atattgcttt atgaattaac5160agtctgttct tccagagtcc agagacattg ttaataaaga caatgaatca tgaccgaaag5220gatgtggtct cattttgtca accacacatg acgtcatttc tgtcaaagtt gacacccttc5280tcttggtcac tagagctcca accttggaca cacctttgac tgctctctgg tggcccttgt5340ggcaattatg tcttcctttg aaaagtcatg tttatccctt cctttccaaa cccagaccgc5400atttcttcac ccagggcatg gtaataacct cagccttgta tccttttagc agcctcccct5460ccatgctggc ttccaaaatg ctgttctcat tctatcactc ccctgctcaa aagccttcca5520tagctccccc ttgcccagga tcaagtgcag tttccctatc tgacatggga ggccttctct5580gcttgactcc cacctcccac tccaccaagc ttcctactga ctccaaatgg tcatgcagat5640ccctgcttcc ttagtttgcc atccacactt agcaccccca ataactaatc ctctttcttt5700aggattcaca ttacttgtca tctcttcccc taaccttcca gagatgttcc aatctcccat5760gatccctctc tcctctgagg ttccagcccc ttttgtctac accactactt tggttcctaa5820ttctgttttc catttgacag tcattcatgg aggaccagcc tggccaagtc ctgcttagta5880ctggcataga caacacaaag ccaagtacaa ttcaggacca gctcacagga aacttcatct5940tcttcgaagt gtggatttga tgcctcctgg gtagaaatgt aggatcttca aaagtgggcc6000agcctcctgc acttctctca aagtctcgcc tccccaaggt gtcttaatag tgctggatgc6060tagctgagtt agcatcttca gatgaagagt aaccctaaag ttactcttca gttgccctaa6120ggtgggatgg tcaactggaa agctttaaat taagtccagc ctaccttggg ggaacccacc6180cccacaaaga aagctgaggt ccctcctgat gacttgtcag tttaactacc aataacccac6240ttgaattaat catcatcatc aagtctttga taggtgtgag tgggtatcag tggccggtcc6300cttcctgggg ctccagcccc cgaggaggcc tcagtgagcc cctgcagaaa atccatgcat6360
catgagtgtc tcagggccca gaatatgaga gcaggtagga aacagagaca tcttccatcc6420ctgagaggca gtgcggtcca gtgggtgggg acacgggctc tgggtcaggt ttgtgttgtt6480tgtttgtttg ttttgagaca gagtctcgct ctattgccca ggctggagtg cagtgtcaca6540atctcggctt actgcaactt ctgccttccc ggattcaagt gattctcctg cctcagcctc6600cagagtagct gggattacag gtgcgtgcca ccacgcctgg ctaatttttg tatttttgat6660agagacgggg tttcaccatg ttggccaggc tagtctcgaa ctcttgacct caagtgatct6720gcctgcctcg gcctcccaaa gtgctgggat tacaggcgtg agccaccaca cccagcccca6780ggttggtgtt tgaatctgag gagactgaag caccaagggg ttaaatgttt tgcccacagc6840catacttggg ctcagttcct tgccctaccc ctcacttgag ctgcttagaa cctggtgggc6900acatgggcaa taaccaggtc acactgtttt gtaccaagtg ttatgggaat ccaagatagg6960agtaatttgc tctgtggagg ggatgaggga tagtggttag ggaaagcttc acaaagtggg7020tgttgcttag agattttcca ggtggagaag ggggcttcta ggcagaaggc atagcccaag7080caaagactgc aagtgcatgg ctgctcatgg gtagaagaga atccaccatt cctcaacatg7140taccgagtcc ttgccatgtg caaggcaaca tgggggtacc aggaattcca agcaatgtcc7200aaacctaggg tctgctttct gggacctgaa gatacaggat ggatcagccc aggctgcaat7260cccattacca cgagggggaa aaaaacctga aggctaaatt gtaggtcggg ttagaggtta7320tttatggaaa gttatattct acctacatgg ggtctataag cctggcgcca atcagaaaag7380gaacaaacaa cagacctagc tgggaggggc agcattttgt tgtagggggc ggggcacatg7440ttctgggggt acagccagac tcagggcttg tattaatagt ctgagagtaa gacagacaga7500gggatagaag gaaataggtc cctttctctc tctctctctc tctctctctc actctctctc7560tctctcacac acacacacag acacacacac acgctctgta ggggtctact tatgctccaa7620gtacaaatca ggccacattt acacaaggag gtaaaggaaa agaacgttgg aggagccaca7680ggaccccaaa attccctgtt ttccttgaat caggcaggac ttacgcagct gggagggtgg7740agagcctgca gaagccacct gcgagtaagc caagttcaga gtcacagaca ccaaaagctg7800gtgccatgtc ccacacccgc ccacctccca cctgctcctt gacacagccc tgtgctccac7860aacccggctc ccagatcatt gattatagct ctggggcctg caccgtcctt cctgccacat7920ccccacccca ttcttggaac ctgccctctg tcttctccct tgtccaaggg caggcaaggg7980ctcagctatt gggcagcttt gaccaacagc tgaggctcct tttgtggctg gagatgcagg8040aggcagggga atattcctct tagtcaatgc gaccatgtgc ctggtttgcc cagggtggtc8100tcgtttacac ctgtaggcca agcgtaatta ttaacagctc ccacttctac tctaaaaaat8160gacccaatct gggcagtaaa ttatatggtg cccatgctat taagagctgc aacttgctgg8220gcgtggtggc tcacacctgt aatcccagta ctttgggacg tcaaggcggg tggatcacct8280gaggtcacga gttagagact ggcctggcca gcatggcaaa accccatctt tactaaaaat8340acaaaaacta gcaaggcatg gtggcatgca cctgtaatcc caggtactcg ggaggctgag8400acaggagaat ggcttgaacc caggaggcag aggttgcagt gagccaagat tgtgccactg8460ccctccagcc ctggcaacag agcaagactt catctcaaaa gaaaaaggat actgtcaatc8520actgcaggaa gaacccaggt aatgaatgag gagaagagag gggctgagtc accatagtgg8580cagcaccgac tcctgcagga aaggcgagac actgggtcat gggtactgaa gggtgccctg8640aatgacgttc tgctttagag accgaacctg agccctgaaa gtgcatgcct gttcatgggt8700gagagactaa attcatcatt ccttggcagg tactgaatcc tttcttacgg ctgccctcca8760atgcccaatt tccctacaat tgtctggggt gcctaagctt ctgcccacca agagggccag8820agctggcagc gagcagctgc aggtaggaga gataggtacc cataagggag gtgggaaaga8880gagatggaag gagaggggtg cagagcacac acctcccctg cctgacaact tcctgagggc8940tggtcatgcc agcagattta aggcggaggc aggggagatg gggcgggaga ggaagtgaaa9000aaggagaggg tggggatgga gaggaagaga gggtgatcat tcattcattc cattgctact9060gactggatgc cagctgtgag ccaggcacca ccctagctct gggcatgtgg ttgtaatctt9120ggagcctcat ggagctcaca gggagtgctg gcaaggagat ggataatgga cggataacaa9180ataaacattt agtacaatgt ccgggaatgg aaagttctcg aaagaaaaat aaagctggtg9240agcatataga cagccctgaa ggcggccagg ccaggcattt ctgaggaggt ggcatttgag9300c9301<210>19<211>21<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>19ccggagctgg agaacaacaa g 21<210>20<211>19<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>20gcactggccg gagcacacc 19<210>21<211>23<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>21aggccaaccg cgagaagatg acc 23<210>22<211>21<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>22gaagtccagg gcgacgtagc a 21<210>23<211>25<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>23aagcttggta ccatgcagct cccac 25<210>24<211>50<212>DNA<213>人工序列<220>
<223>用于PCR的引物
<400>24aagcttctac ttgtcatcgt cgtccttgta gtcgtaggcg ttctccagct50<210>25<211>19<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>25gcactggccg gagcacacc 19<210>26<211>39<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>26gtcgtcggat ccatggggtg gcaggcgttc aagaatgat39<210>27<211>57<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>27gtcgtcaagc ttctacttgt catcgtcctt gtagtcgtag gcgttctcca gctcggc57<210>28<211>29<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>28gacttggatc ccaggggtgg caggcgttc 29<210>29<211>29<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>29agcataagct tctagtaggc gttctccag 29
<210>30<211>29<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>30gacttggatc cgaagggaaa aagaaaggg 29<210>31<211>29<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>31agcataagct tttaatccaa atcgatgga 29<210>32<211>33<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>32actacgagct cggccccacc acccatcaac aag 33<210>33<211>34<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>33acttagaagc tttcagtcct cagccccctc ttcc 34<210>34<211>66<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>34aatctggatc cataacttcg tatagcatac attatacgaa gttatctgca ggattcgagg 60gcccct66
<210>35<211>82<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>35aatctgaatt ccaccggtgt taattaaata acttcgtata atgtatgcta tacgaagtta60tagatctaga gtcagcttct ga 82<210>36<211>62<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>36atttaggtga cactatagaa ctcgagcagc tgaagcttaa ccacatggtg gctcacaacc60at 62<210>37<211>54<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>37aacgacggcc agtgaatccg taatcatggt catgctgcca ggtggaggag ggca 54<210>38<211>31<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>38attaccaccg gtgacacccg cttcctgaca g 31<210>39<211>61<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>39attacttaat taaacatggc gcgccatatg gccggcccct aattgcggcg catcgttaat60t61
<210>40<211>34<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>40attacggccg gccgcaaagg aattcaagat ctga 34<210>41<211>34<212>DNA<213>人工序列<220>
<223>用于PCR的引物<400>41attacggcgc gcccctcaca ggccgcaccc agct 34<210>42<211>184<212>PRT<213>Homo sapiens<400>42Met Ser Arg Thr Ala Tyr Thr Val Gly Ala Leu Leu Leu Leu Leu Gly1 5 10 15Thr Leu Leu Pro Ala Ala Glu Gly Lys Lys Lys Gly Ser Gln Gly Ala20 25 30Ile Pro Pro Pro Asp Lys Ala Gln His Asn Asp Ser Glu Gln Thr Gln35 40 45Ser Pro Gln Gln Pro Gly Ser Arg Asn Arg Gly Arg Gly Gln Gly Arg50 55 60Gly Thr Ala Met Pro Gly Glu Glu Val Leu Glu Ser Ser Gln Glu Ala65 70 75 80Leu His Val Thr Glu Arg Lys Tyr Leu Lys Arg Asp Trp Cys Lys Thr85 90 95Gln Pro Leu Lys Gln Thr Ile His Glu Glu Gly Cys Asn Ser Arg Thr100 105 110Ile Ile Asn Arg Phe Cys Tyr Gly Gln Cys Asn Ser Phe Tyr Ile Pro115 120 125Arg His Ile Arg Lys Glu Glu Gly Ser Phe Gln Ser Cys Ser Phe Cys130 135 140Lys Pro Lys Lys Phe Thr Thr Met Met Val Thr Leu Asn Cys Pro Glu145 150 155 160Leu Gln Pro Pro Thr Lys Lys Lys Arg Val Thr Arg Val Lys Gln Cys165 170 175Arg Cys Ile Ser Ile Asp Leu Asp180<210>43<211>267
<212>PRT<213>Homo sapiens<400>43Met His Leu Leu Leu Phe Gln Leu Leu Val Leu Leu Pro Leu Gly Lys1 5 10 15Thr Thr Arg His Gln Asp Gly Arg Gln Asn Gln Ser Ser Leu Ser Pro20 25 30Val Leu Leu Pro Arg Asn Gln Arg Glu Leu Pro Thr Gly Asn His Glu35 40 45Glu Ala Glu Glu Lys Pro Asp Leu Phe Val Ala Val Pro His Leu Val50 55 60Ala Thr Ser Pro Ala Gly Glu Gly Gln Arg Gln Arg Glu Lys Met Leu65 70 75 80Ser Arg Phe Gly Arg Phe Trp Lys Lys Pro Glu Arg Glu Met His Pro85 90 95Ser Arg Asp Ser Asp Ser Glu Pro Phe Pro Pro Gly Thr Gln Ser Leu100 105 110Ile Gln Pro Ile Asp Gly Met Lys Met Glu Lys Ser Pro Leu Arg Glu115 120 125Glu Ala Lys Lys Phe Trp His His Phe Met Phe Arg Lys Thr Pro Ala130 135 140Ser Gln Gly Val Ile Leu Pro Ile Lys Ser His Glu Val His Trp Glu145 150 155 160Thr Cys Arg Thr Val Pro Phe Ser Gln Thr Ile Thr His Glu Gly Cys165 170 175Glu Lys Val Val Val Gln Asn Asn Leu Cys Phe Gly Lys Cys Gly Ser180 185 190Val His Phe Pro Gly Ala Ala Gln His Ser His Thr Ser Cys Ser His195 200 205Cys Leu Pro Ala Lys Phe Thr Thr Met His Leu Pro Leu Asn Cys Thr210 215 220Glu Leu Ser Ser Val Ile Lys Val Val Met Leu Val Glu Glu Cys Gln225 230 235 240Cys Lys Val Lys Thr Glu His Glu Asp Gly His Ile Leu His Ala Gly245 250 255Ser Gln Asp Ser Phe Ile Pro Gly Val Ser Ala260 265<210>44<211>180<212>PRT<213>Homo sapiens<400>44Met Leu Arg Val Leu Val Gly Ala Val Leu Pro Ala Met Leu Leu Ala1 5 10 15Ala Pro Pro Pro Ile Asn Lys Leu Ala Leu Phe Pro Asp Lys Ser Ala20 25 30Trp Cys Glu Ala Lys Asn Ile Thr Gln Ile Val Gly His Ser Gly Cys35 40 45Glu Ala Lys Ser Ile Gln Asn Arg Ala Cys Leu Gly Gln Cys Phe Ser50 55 60Tvr Ser Val Pro Asn Thr Phe Pro Gln Ser Thr Glu Ser Leu Val His65 70 75 80Cys Asp Ser Cys Met Pro Ala Gln Ser Met Trp Glu Ile Val Thr Leu85 90 95
Glu Cys Pro Gly His Glu Glu Val Pro Arg Val Asp Lys Leu Val Glu100 105 110Lys Ile Leu His Cys Ser Cys Gln Ala Cys Gly Lys Glu Pro Ser His115 120 125Glu Gly Leu Ser Val Tyr Val Gln Gly Glu Asp Gly Pro Gly Ser Gln130 135 140Pro Gly Thr His Pro His Pro His Pro His Pro His Pro Gly Gly Gln145 150 155 160Thr Pro Glu Pro Glu Asp Pro Pro Gly Ala Pro His Thr Glu Glu Glu165 170 175Gly Ala Glu Asp180<210>45<211>642<212>DNA<213>Homo sapiens<220>
<221>CDS<222>(1)..(639)<400>45atg cag ctc cca ctg gcc ctg tgt ctc gtc tgc ctg ctg gta cac aca48Met Gln Leu Pro Leu Ala Leu Cys Leu Val Cys Leu Leu Val His Thr1 5 10 15gcc ttc cgt gta gtg gag ggc cag ggg tgg cag gcg ttc aag aat gat96Ala Phe Arg Val Val Glu Gly Gln Gly Trp Gln Ala Phe Lys Asn Asp20 25 30gcc acg gaa atc atc ccc gag ctc gga gag tac ccc gag cct cca ccg144Ala Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro35 40 45gag ctg gag aac aac aag acc atg aac cgg gcg gag aac gga ggg cgg192Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg50 55 60cct ccc cac cac ccc ttt gag acc aaa gac gtg tcc gag tac agc tgc240Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser Cys65 70 75 80ogc gag ctg cac ttc acc cgc tac gtg acc gat ggg ccg tgc cgc agc288Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg Ser85 90 95gcc aag ccg gtc acc gag ctg gtg tgc tcc ggc cag tgc ggc ccg gcg336Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro Ala100 105 110cgc ctg ctg ccc aac gcc atc ggc cgc ggc aag tgg tgg cga cct agt384Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser115 120 125ggg ccc gac ttc cgc tgc atc ccc gac cgc tac cgc gcg cag cgc gtg432Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val
130 135 140cag ctg ctg tgt ccc ggt ggt gag gcg ccg cgc gcg cgc aag gtg cgc480Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg145 150 155 160ctg gtg gcc tcg tgc aag tgc aag cgc ctc acc cgc ttc cac aac cag528Leu Val Ala Ser Cys Lys Cys Lys Arg Leu Thr Arg Phe His Asn Gln165 170 175tcg gag ctc aag gac ttc ggg acc gag gcc gct cgg ccg cag aag ggc576Ser Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly180 185 190cgg aag ccg cgg ccc cgc gcc cgg agc gcc aaa gcc aac cag gcc gag624Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu195 200 205ctg gag aac gcc tac tag642Leu Glu Asn Ala Tyr210<210>46<211>190<212>PRT<213>Homo sapiens<400>46Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Glu1 5 10 15Leu Gly Glu Tyr Pro Glu Pro Pro Pro Glu Leu Glu Asn Asn Lys Thr20 25 30Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro Phe Glu35 40 45Thr Lys Asp Val Ser Glu Tyr Ser Cys Arg Glu Leu His Phe Thr Arg50 55 60Tyr Val Thr Asp Gly Pro Cys Arg Ser Ala Lys Pro Val Thr Glu Leu65 70 75 80Val Cys Ser Gly Gln Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile85 90 95Gly Arg Gly Lys Trp Trp Arg Pro Ser Gly Pro Asp Phe Arg Cys Ile100 105 110Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly Gly115 120 125Glu Ala Pro Arg Ala Arg Lys Val Arg Leu Val Ala Ser Cys Lys Cys130 135 140Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly145 150 155 160Thr Glu Ala Ala Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala165 170 175Arg Ser Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr180 185 190<210>47<211>20<212>PRT
<213>Homo sapiens<400>47Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Glu1 5 10 15Leu Gly Glu Tyr20<210>48<211>20<212>PRT<213>Homo sapiens<400>48Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro Glu1 5 10 15Leu Glu Asn Asn20<210>49<211>20<212>PRT<213>Homo sapiens<400>49Pro Glu Pro Pro Pro Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala1 5 10 15Glu Asn Gly Gly20<210>50<211>20<212>PRT<213>Homo sapiens<400>50Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro1 5 10 15Phe Glu Thr Lys20<210>51<211>16<212>PRT<213>Homo sapiens<400>51Arg Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser1 5 10 15<210>52<211>21
<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>52Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Glu1 5 10 15Leu Gly Glu Tyr Cys20<210>53<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>53Thr Glu Ile Ile Pro Glu Leu Gly Glu Tyr Pro Glu Pro Pro Pro Glu1 5 10 15Leu Glu Asn Asn Cys20<210>54<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>54Pro Glu Pro Pro Pro Glu Leu Glu Asn Asn Lys Thr Met Asn Arg Ala1 5 10 15Glu Asn Gly Gly Cys20<210>55<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>55Lys Thr Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro
341 5 10 15Phe Glu Thr Lys Cys20<210>56<211>17<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>56Arg Pro Pro His His Pro Phe Glu Thr Lys Asp Val Ser Glu Tyr Ser1 5 10 15Cys<210>57<211>24<212>PRT<213>Rattus norvegicus<400>57Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Gly1 5 10 15Leu Arg Glu Tyr Pro Glu Pro Pro20<210>58<211>20<212>PRT<213>Rattus morvegicus<400>58Pro Glu Pro Pro Gln Glu Leu Glu Asn Asn Gln Thr Met Asn Arg Ala1 5 10 15Glu Asn Gly Gly20<210>59<211>20<212>PRT<213>Rattus norvegicus<400>59Glu Asn Gly Gly Arg Pro Pro His His Pro Tyr Asp Thr Tys Asp Val1 5 10 15Ser Glu Tyr Ser20
<210>60<211>20<212>PRT<213>Rattus norvegicus<400>60Thr Glu Ile Ile Pro Gly Leu Arg Glu Tyr Pro Glu Pro Pro Gln Glu1 5 10 15Leu Glu Asn Asn20<210>61<211>25<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的大鼠SOST肽片段<400>61Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Gly1 5 10 15Leu Arg Glu Tyr Pro Glu Pro Pro Cys20 25<210>62<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的大鼠SOST肽片段<400>62Pro Glu Pro Pro Gln Glu Leu Glu Asn Asn Gln Thr Met Asn Arg Ala1 5 10 15Glu Asn Gly Gly Cys20<210>63<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的大鼠SOST肽片段<400>63Glu Asn Gly Gly Arg Pro Pro His His Pro Tyr Asp Thr Lys Asp Val1 5 10 15Ser Glu Tyr Ser Cys
20<210>64<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的大鼠SOST肽片段<400>64Thr Glu Ile Ile Pro Gly Leu Arg Glu Tyr Pro Glu Pro Pro Gln Glu1 5 10 15Leu Glu Asn Asn Cys20<210>65<211>190<212>PRT<213>Rattus norvegicus<400>65Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Gly1 5 10 15Leu Arg Glu Tyr Pro Glu Pro Pro Gln Glu Leu Glu Asn Asn Gln Thr20 25 30Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro Tyr Asp35 40 45Thr Lys Asp Val Ser Glu Tyr Ser Cys Arg Glu Leu His Tyr Thr Arg50 55 60Phe Val Thr Asp Gly Pro Cys Arg Ser Ala Lys Pro Val Thr Glu Leu65 70 75 80Val Cys Ser Gly Gln Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile85 90 95Gly Arg Val Lys Trp Trp Arg Pro Asn Gly Pro Asp Phe Arg Cys rle100 105 110Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly Gly115 120 125Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val Ala Ser Cys Lys Cys130 135 140Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly145 150 155 160Pro Glu Thr Ala Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala165 170 175Arg Gly Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr180 185 190<210>66<211>20<212>PRT<213>Homo sapiens<400>66
Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly1 5 10 15Gly Glu Ala Pro20<210>67<211>20<212>PRT<213>Homo sapiens<400>67Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg1 5 10 15Leu Val Ala Ser20<210>68<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>68Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly1 5 10 15Gly Glu Ala Pro Cys20<210>69<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>69Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg1 5 10 15Leu Val Ala Ser Cys20<210>70<211>17<212>PRT<213>Rattus Norvegicus<400>70Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly
1 5 10 15Glv<210>71<211>16<212>PRT<213>Rattus norvegicus<400>71Pro Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val Ala Ser1 5 10 15<210>72<211>18<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的大鼠SOST肽片段<400>72Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Ser Pro Gly1 5 10 15Gly Cys<210>73<211>17<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的大鼠SOST肽片段<400>73Pro Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val Ala Ser1 5 10 15Cys<210>74<211>20<212>PRT<213>Homo sapiens<400>74Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp1 5 10 15Trp Arg Pro Ser20
<210>75<211>16<212>PRT<213>Homo sapiens<400>75Ile Gly Arg Gly Lys Trp Trp Arg Pro Ser Gly Pro Asp Phe Arg Cys1 5 10 15<210>76<211>18<212>PRT<213>Rattus norvegicus<400>76Pro Asn Ala Ile Gly Arg Val Lys Trp Trp Arg Pro Asn Gly Pro Asp1 5 10 15Phe Arg<210>77<211>19<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的大鼠SOST肽片段<400>77Pro Asn Ala Ile Gly Arg Val Lys Trp Trp Arg Pro Asn Gly Pro Asp1 5 10 15Phe Arg Cys<210>78<211>20<212>PRT<213>Homo sapiens<400>78Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly1 5 10 15Thr Glu Ala Ala20<2l0>79<211>20<212>PRT<213>Homo sapiens
<400>79Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly Arg1 5 10 15Lys Pro Arg Pro20<210>80<211>20<212>PRT<213>Homo sapiens<400>80Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys1 5 10 15Ala Asn Gln Ala20<210>81<211>16<212>PRT<213>Homo sapiens<400>81Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr1 5 10 15<210>82<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>82Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly1 5 10 15Thr Glu Ala Ala Cys20<210>83<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>83Glu Leu Lys Asp Phe Gly Thr Glu Ala Ala Arg Pro Gln Lys Gly Arg1 5 10 15
Lys Pro Arg Pro Cys20<210>84<211>21<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>84Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Ser Ala Lys1 5 10 15Ala Asn Gln Ala Cys20<210>85<211>17<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的人SOST肽片段<400>85Arg Ala Arg Ser Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr1 5 10 15Cys<210>86<211>23<212>PRT<213>Rattus norvegicus<400>86Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly1 5 10 15Pro Glu Thr Ala Arg Pro Gln20<210>87<211>23<212>PRT<213>Rattus norvegicus<400>87Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Gly Ala Lys Ala Asn Gln1 5 10 15Ala Glu Leu Glu Asn Ala Tyr
20<210>88<211>24<212>PRT<213>Rattus norvegicus<400>88Ser Glu Leu Lys Asp Phe Gly Pro Glu Thr Ala Arg Pro Gln Lys Gly1 5 10 15Arg Lys Pro Arg Pro Arg Ala Arg20<210>89<211>24<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的大鼠SOST肽片段<400>89Lys Arg Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly1 5 10 15Pro Glu Thr Ala Arg Pro Gln Cys20<210>90<211>24<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的大鼠SOST肽片段<400>90Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Gly Ala Lys Ala Asn Gln1 5 10 15Ala Glu Leu Glu Asn Ala Tyr Cys20<210>91<211>25<212>PRT<213>人工序列<220>
<223>添加了額外半胱氨酸的大鼠SOST肽片段<400>91
Ser Glu Leu Lys Asp Phe Gly Pro Glu Thr Ala Arg Pro Gln Lys Gly1 5 10 15Arg Lys Pro Arg Pro Arg Ala Arg Cys20 25<210>92<211>56<212>PRT<213>Homos apiens<400>92Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro Glu1 5 10 15Leu Gly Glu Tyr Pro Glu Pro Pro Pro Glu Leu Glu Asn Asn Lys Thr20 25 30Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro Phe Glu35 40 45Thr Lys Asp Val Ser Glu Tyr Ser50 55<210>93<211>56<212>PRT<213>Rattus norvegicus<400>93Gln Gly Trp Gln Ala Phe Lys Asn Asp Ala Thr Glu Ile Ile Pro G1y1 5 10 15Leu Arg Glu Tyr Pro Glu Pro Pro Gln Glu Leu Glu Asn Asn Gln Thr20 25 30Met Asn Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro Tyr Asp35 40 45Thr Lys Asp Val Ser Glu Tyr Ser50 55<210>94<211>32<212>PRT<213>Homo sapiens<400>94Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro1 5 10 15Gly Gly Glu Ala Pro Arg Ala Arg Lys Val Arg Leu Val Ala Ser Cys20 25 30<210>95<211>32<212>PRT<213>Rattus norvegicus<400>95Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro
1 5 10 15Gly Gly Ala Ala Pro Arg Ser Arg Lys Val Arg Leu Val Ala Ser Cys20 25 30<210>96<211>44<212>PRT<213>Homo sapiens<400>96Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly Thr Glu1 5 10 15Ala Ala Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Ser20 25 30Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr35 40<210>97<211>44<212>PRT<213>Rattus norvegicus<400>97Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly Pro Glu1 5 10 15Thr Ala Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Arg Ala Arg Gly20 25 30Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr35 40<210>98<211>26<212>PRT<213>Homo sapiens<400>98Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp1 5 10 15Trp Arg Pro Ser Gly Pro Asp Phe Arg Cys20 25<210>99<211>26<212>PRT<213>Rattus norvegicus<400>99Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Val Lys Trp1 5 10 15Trp Arg Pro Asn Gly Pro Asp Phe Arg Cys20 25
<210>100<211>570<212>DNA<213>Homo sapiens<400>100caggggtggc aggcgttcaa gaatgatgcc acggaaatca tccccgagct cggagagtac 60cccgagcctc caccggagct ggagaacaac aagaccatga accgggcgga gaacggaggg 120cggcctcccc accacccctt tgagaccaaa gacgtgtccg agtacagctg ccgcgagctg 180cacttcaccc gctacgtgac cgatgggccg tgccgcagcg ccaagccggt caccgagctg 240gtgtgctccg gccagtgcgg cccggcgcgc ctgctgccca acgccatcgg ccgcggcaag 300tggtggcgac ctagtgggcc cgacttccgc tgcatccccg accgctaccg cgcgcagcgc 360gtgcagctgc tgtgtcccgg tggtgaggcg ccgcgcgcgc gcaaggtgcg cctggtggcc 420tcgtgcaagt gcaagcgcct cacccgcttc cacaaccagt cggagctcaa ggacttcggg 480accgaggccg ctcggccgca gaagggccgg aagccgcggc cccgcgcccg gagcgccaaa 540gccaaccagg ccgagctgga gaaogcctac 570<210>101<211>570<212>DNA<213>Rattus norvegicus<400>101caggggtggc aagccttcaa gaatgatgcc acagaaatca tcccgggact cagagagtac 60ccagagcctc ctcaggaact agagaacaac cagaccatga accgggccga gaacggaggc 120agaccccccc accatcctta tgacaccaaa gacgtgtccg agtacagctg ccgcgagctg 180cactacaccc gcttcgtgac cgacggcccg tgccgcagtg ccaagccggt caccgagttg 240gtgtgctcgg gccagtgcgg ccccgcgcgg ctgctgccca acgccatcgg gcgcgtgaag 300tggtggcgcc cgaacggacc cgacttccgc tgcatcccgg atcgctaccg ogcgcagcgg 360gtgcagctgc tgtgccccgg cggcgcggcg ccgcgctcgc gcaaggtgcg tctggtggcc 420tcgtgcaagt gcaagcgcct cacccgcttc cacaaccagt cggagctcaa ggacttcgga 480cctgagaccg cgcggccgca gaagggtcgc aagccgcggc cccgcgcccg gggagccaaa 540gccaaccagg cggagctgga gaacgcctac 570<210>102<211>532<212>PRT<213>Homo sapiens<400>102Met Thr Gln Leu Tyr Ile Tyr Ile Arg Leu Leu Gly Ala Tyr Leu Phe1 5 10 15Ile Ile Ser Arg Val Gln Gly Gln Asn Leu Asp Ser Met Leu His Gly20 25 30Thr Gly Met Lys Ser Asp Ser Asp Gln Lys Lys Ser Glu Asn Gly Val35 40 45Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser50 55 60Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly65 70 75 80His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu85 90 95Ala Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp100 105 110Ser Pro lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn115 120 125
Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly130 135 140Pro Phe Phe Asp Gly Ser Ile Arg Trp Leu Val Leu Leu Ile Ser Met145 150 155 160Ala Val Cys Ile Ile Ala Met Ile Ile Phe Ser Ser Cys Phe Cys Tyr165 170 175Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Arg Arg Tyr Asn Arg Asp180 185 190Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp195 200 205Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu210 215 220Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val225 230 235 240Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg Gly Glu245 250 255Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe260 265 270Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile275 280 285Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln290 295 300Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe305 310 315 320Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr325 330 335Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr340 345 350Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile355 360 365Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala370 375 380Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp Val Pro Leu Asn Thr385 390 395 400Arg Val Gly Thr Lys Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser405 410 415Leu Asn Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser420 425 430Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly435 440 445Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp450 455 460Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg465 470 475 480Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val485 490 495Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu500 505 510Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu Ser Gln515 520 525Asp Val Lys Ile530<210>103<211>502<212>PRT
<213>Homo sapiens<400>103Met Leu Leu Arg Ser Ala Gly Lys Leu Asn Val Gly Thr Lys Lys Glu1 5 10 15Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys20 25 30Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser35 40 45Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu50 55 60Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln65 70 75 80Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys85 90 95Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro100 105 110Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His Arg Ala Leu115 120 125Leu Ile Ser Val Thr Val Cys Ser Leu Leu Leu Val Leu Ile Ile Leu130 135 140Phe Cys Tyr Phe Arg Tyr Lys Arg Gln Glu Thr Arg Pro Arg Tyr Ser145 150 155 160Ile Gly Leu Glu Gln Asp Glu Thr Tyr Ile Pro Pro Gly Glu Ser Leu165 170 175Arg Asp Leu Ile Glu Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu180 185 190Pro Leu Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Lys195 200 205Gln Ile Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg210 215 220Gly Glu Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser225 230 235 240Trp Phe Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu245 250 255Asn Ile Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp260 265 270Thr Gln Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr275 280 285Asp Tyr Leu Lys Ser Thr Thr Leu Asp Ala Lys Ser Met Leu Lys Leu290 295 300Ala Tyr Ser Ser Val Ser Gly Leu Cys His Leu His Thr Glu Ile Phe305 310 315 320Ser Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys325 330 335Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly340 345 350Leu Ala Val Lys Phe Ile Ser Asp Thr Asn Glu Val Asp Ile Pro Pro355 360 365Asn Thr Arg Val Gly Thr Lys Arg Tyr Met Pro Pro Glu Val Leu Asp370 375 380Glu Ser Leu Asn Arg Asn His Phe Gln Ser Tyr Ile Met Ala Asp Met385 390 395 400Tyr Ser Phe Gly Leu Ile Leu Trp Glu Val Ala Arg Arg Cys Val Ser405 410 415Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr His Asp Leu Val Pro420 425 430
Ser Asp Pro Ser Tyr Glu Asp Met Arg Glu Ile Val Cys Ile Lys Lys435 440 445Leu Arg Pro Ser Phe Pro Asn Arg Trp Ser Ser Asp Glu Cys Leu Arg450 455 460Gln Met Gly Lys Leu Met Thr Glu Cys Trp Ala His Asn Pro Ala Ser465 470 475 480Arg Leu Thr Ala Leu Arg Val Lys Lys Thr Leu Ala Lys Met Ser Glu485 490 495Ser Gln Asp Ile Lys Leu500<210>104<211>502<212>PRT<213>Homo sapiens<400>104Met Leu Leu Arg Ser Ala Gly Lys Leu Asn Val Gly Thr Lys Lys Glu1 5 10 15Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys20 25 30Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser35 40 45Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu50 55 60Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln65 70 75 80Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys85 90 95Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro100 105 110Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His Arg Ala Leu115 120 125Leu Ile Ser Val Thr Val Cys Ser Leu Leu Leu Val Leu Ile Ile Leu130 135 140Phe Cys Tyr Phe Arg Tyr Lys Arg Gln Glu Thr Arg Pro Arg Tyr Ser145 150 155 160Ile Gly Leu Glu Gln Asp Glu Thr Tyr Ile Pro Pro Gly Glu Ser Leu165 170 175Arg Asp Leu Ile Glu Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu180 185 190Pro Leu Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Lys195 200 205Gln Ile Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg210 215 220Gly Glu Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser225 230 235 240Trp Phe Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu245 250 255Asn Ile Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp260 265 270Thr Gln Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr275 280 285Asp Tyr Leu Lys Ser Thr Thr Leu Asp Ala Lys Ser Met Leu Lys Leu290 295 300Ala Tyr Ser Ser Val Ser Gly Leu Cys His Leu His Thr Glu Ile Phe
305 310 315 320Ser Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys325 330 335Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly340 345 350Leu Ala Val Lys Phe Ile Ser Asp Thr Asn Glu Val Asp Ile Pro Pro355 360 365Asn Thr Arg Val Gly Thr Lys Arg Tyr Met Pro Pro Glu Val Leu Asp370 375 380Glu Ser Leu Asn Arg Asn His Phe Gln Ser Tyr Ile Met Ala Asp Met385 390 395 400Tyr Ser Phe Gly Leu Ile Leu Trp Glu Val Ala Arg Arg Cys Val Ser405 410 415Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr His Asp Leu Val Pro420 425 430Ser Asp Pro Ser Tyr Glu Asp Met Arg Glu Ile Val Cys Lle Lys Lys435 440 445Leu Arg Pro Ser Phe Pro Asn Arg Trp Ser Ser Asp Glu Cys Leu Arg450 455 460Gln Met Gly Lys Leu Met Thr Glu Cys Trp Ala His Asn Pro Ala Ser465 470 475 480Arg Leu Thr Ala Leu Arg Val Lys Lys Thr Leu Ala Lys Met Ser Glu485 490 495Ser Gln Asp Ile Lys Leu500<210>105<211>532<212>PRT<213>Rattus sp.
<400>105Met Thr Gln Leu Tyr Thr Tyr Ile Arg Leu Leu Gly Ala Cys Leu Phe1 5 10 15Ile Ile Ser His Val Gln Gly Gln Asn Leu Asp Ser Met Leu His Gly20 25 30Thr Gly Met Lys Ser Asp Val Asp Gln Lys Lys Pro Glu Asn Gly Val35 40 45Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser50 55 60Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly65 70 75 80His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu85 90 95Thr Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp100 105 110Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn115 120 125Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly130 135 140Pro Phe Phe Asp Gly Ser Val Arg Trp Leu Ala Val Leu Ile Ser Met145 150 155 160Ala Val Cys Ile Val Ala Met Ile Val Phe Ser Ser Cys Phe Cys Tyr165 170 175Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Gly Arg Tyr Asn Arg Asp180 185 190
Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp195 200 205Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu210 215 220Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val225 230 235 240Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg Gly Glu245 250 255Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe260 265 270Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile275 280 285Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln290 295 300Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe305 310 315 320Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr325 330 335Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr340 345 350Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile355 360 365Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala370 375 380Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp Ile Pro Leu Asn Thr385 390 395 400Arg Val Gly Thr Arg Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser405 410 415Leu Ser Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser420 425 430Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly435 440 445Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp450 455 460Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg465 470 475 480Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val485 490 495Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu500 505 510Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu Ser Gln515 520 525Asp Val Lys Ile530<210>106<211>532<212>PRT<213>Rattus norvegicus<400>106Met Thr Gln Leu Tyr Thr Tyr Ile Arg Leu Leu Gly Ala Cys Leu Phe1 5 10 15Ile Ile Ser His Val Gln Gly Gln Asn Leu Asp Ser Met Lau His Gly20 25 30Thr Gly Met Lys Ser Asp Val Asp Gln Lys Lys Pro Glu Asn Gly Val
35 40 45Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser50 55 60Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly65 70 75 80His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu85 90 95Thr Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp100 105 110Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn115 120 125Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly130 135 140Pro Phe Phe Asp Gly Ser Val Arg Trp Leu Ala Val Leu Ile Ser Met145 150 155 160Ala Val Cys Ile Val Ala Met Ile Val Phe Ser Ser Cys Phe Cys Tyr165 170 175Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Gly Arg Tyr Asn Arg Asp180 185 190Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp195 200 205Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu210 215 220Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val225 230 235 240Gly Lys Gly Arg Tyr Gly Glu Val TrP Met Gly Lys Trp Arg Gly Glu245 250 255Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe260 265 270Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile275 280 285Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln290 295 300Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe305 310 315 320Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr325 330 335Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr340 345 350Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile355 360 365Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala370 375 380Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp Ile Pro Leu Asn Thr385 390 395 400Arg Val Gly Thr Arg Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser405 410 415Leu Ser Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser420 425 430Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly435 440 445Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp450 455 460Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg465 470 475 480Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val485 490 495
Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu500 505 510Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu Ser Gln515 520 525Asp Val Lys Ile530<210>107<211>532<212>PRT<213>Rattus norvegicus<400>107Met Thr Gln Leu Tyr Thr Tyr Ile Arg Leu Leu Gly Ala Cys Leu Phe1 5 10 15Ile Ile Ser His Val Gln Gly Gln Asn Leu Asp Ser Met Leu His Gly20 25 30Thr Gly Met Lys Ser Asp Val Asp Gln Lys Lys Pro Glu Asn Gly Val35 40 45Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser50 55 60Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly65 70 75 80His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu85 90 95Thr Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp100 105 110Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn115 120 125Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly130 135 140Pro Phe Phe Asp Gly Ser Val Arg Trp Leu Ala Val Leu Ile Ser Met145 150 155 160Ala Val Cys Ile Val Ala Met Ile Val Phe Ser Ser Cys Phe Cys Tyr165 170 175Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Gly Arg Tyr Asn Arg Asp180 185 190Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp195 200 205Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu210 215 220Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val225 230 235 240Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg Gly Glu245 250 255Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe260 265 270Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile275 280 285Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln290 295 300Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe305 310 315 320Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr325 330 335Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr
340 345 350Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile355 360 365Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala370 375 380Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp Ile Pro Leu Asn Thr385 390 395 400Arg Val Gly Thr Arg Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser405 410 415Leu Ser Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser420 425 430Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly435 440 445Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp450 455 460Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg465 470 475 480Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val485 490 495Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu500 505 510Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu Ser Gln515 520 525Asp Val Lys Ile530<210>108<211>502<212>PRT<213>Homo sapiens<400>108Met Leu Leu Arg Ser Ala Gly Lys Leu Asn Val Gly Thr Lys Lys Glu1 5 10 15Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys20 25 30Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser35 40 45Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu50 55 60Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln65 70 75 80Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys85 90 95Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro100 105 110Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His Arg Ala Leu115 120 125Leu Ile Ser Val Thr Val Cys Ser Leu Leu Leu Val Leu Ile Ile Leu130 135 140Phe Cys Tyr Phe Arg Tyr Lys Arg Gln Glu Thr Arg Pro Arg Tyr Ser145 150 155 160Ile Gly Leu Glu Gln Asp Glu Thr Tyr Ile Pro Pro Gly Glu Ser Leu165 170 175Arg Asp Leu Ile Glu Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu180 185 190
Pro Leu Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Lys195 200 205Gln Ile Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg210 215 220Gly Glu Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser225 230 235 240Trp Phe Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu245 250 255Asn Ile Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp260 265 270Thr Gln Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr275 280 285Asp Tyr Leu Lys Ser Thr Thr Leu Asp Ala Lys Ser Met Leu Lys Leu290 295 300Ala Tyr Ser Ser Val Ser Gly Leu Cys His Leu His Thr Glu Ile Phe305 310 315 320Ser Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys325 330 335Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly340 345 350Leu Ala Val Lys Phe Ile Ser Asp Thr Asn Glu Val Asp Ile Pro Pro355 360 365Asn Thr Arg Val Gly Thr Lys Arg Tyr Met Pro Pro Glu Val Leu Asp370 375 380Glu Ser Leu Asn Arg Asn His Phe Gln Ser Tyr Ile Met Ala Asp Met385 390 395 400Tyr Ser Phe Gly Leu Ile Leu Trp Glu Val Ala Arg Arg Cys Val Ser405 410 415Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr His Asp Leu Val Pro420 425 430Ser Asp Pro Ser Tyr Glu Asp Met Arg Glu Ile Val Cys Ile Lys Lys435 440 445Leu Arg Pro Ser Phe Pro Asn Arg Trp Ser Ser Asp Glu Cys Leu Arg450 455 460Gln Met Gly Lys Leu Met Thr Glu Cys Trp Ala His Asn Pro Ala Ser465 470 475 480Arg Leu Thr Ala Leu Arg Val Lys Lys Thr Leu Ala Lys Met Ser Glu485 490 495Ser Gln Asp Ile Lys Leu500<210>109<21l>502<212>PRT<213>Homo sapiens<400>109Met Leu Leu Arg Ser Ala Gly Lys Leu Asn Val Gly Thr Lys Lys Glu1 5 10 15Asp Gly Glu Ser Thr Ala Pro Thr Pro Arg Pro Lys Val Leu Arg Cys20 25 30Lys Cys His His His Cys Pro Glu Asp Ser Val Asn Asn Ile Cys Ser35 40 45Thr Asp Gly Tyr Cys Phe Thr Met Ile Glu Glu Asp Asp Ser Gly Leu50 55 60Pro Val Val Thr Ser Gly Cys Leu Gly Leu Glu Gly Ser Asp Phe Gln
65 70 75 80Cys Arg Asp Thr Pro Ile Pro His Gln Arg Arg Ser Ile Glu Cys Cys85 90 95Thr Glu Arg Asn Glu Cys Asn Lys Asp Leu His Pro Thr Leu Pro Pro100 105 110Leu Lys Asn Arg Asp Phe Val Asp Gly Pro Ile His His Arg Ala Leu115 120 125Leu Ile Ser Val Thr Val Cys Ser Leu Leu Leu Val Leu Ile Ile Leu130 135 140Phe Cys Tyr Phe Arg Tyr Lys Arg Gln Glu Thr Arg Pro Arg Tyr Ser145 150 155 160Ile Gly Leu Glu Gln Asp Glu Thr Tyr Ile Pro Pro Gly Glu Ser Leu165 170 175Arg Asp Leu Ile Glu Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu180 185 190Pro Leu Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Lys195 200 205Gln Ile Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg210 215 220Gly Glu Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser225 230 235 240Trp Phe Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu245 250 255Asn Ile Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp260 265 270Thr Gln Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr275 280 285Asp Tyr Leu Lys Ser Thr Thr Leu Asp Ala Lys Ser Met Leu Lys Leu290 295 300Ala Tyr Ser Ser Val Ser Gly Leu Cys His Leu His Thr Glu Ile Phe305 310 315 320Ser Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys325 330 335Asn Ile Leu Val Lys Lys Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly340 345 350Leu Ala Val Lys Phe Ile Ser Asp Thr Asn Glu Val Asp Ile Pro Pro355 360 365Asn Thr Arg Val Gly Thr Lys Arg Tyr Met Pro Pro Glu Val Leu Asp370 375 380Glu Ser Leu Asn Arg Asn His Phe Gln Ser Tyr Ile Met Ala Asp Met385 390 395 400Tyr Ser Phe Gly Leu Ile Leu Trp Glu Val Ala Arg Arg Cys Val Ser405 410 415Gly Gly Ile Val Glu Glu Tyr Gln Leu Pro Tyr His Asp Leu Val Pro420 425 430Ser Asp Pro Ser Tyr Glu Asp Met Arg Glu Ile Val Cys Ile Lys Lys435 440 445Leu Arg Pro Ser Phe Pro Asn Arg Trp Ser Ser Asp Glu Cys Leu Arg450 455 460Gln Met Gly Lys Leu Met Thr Glu Cys Trp Ala His Asn Pro Ala Ser465 470 475 480Arg Leu Thr Ala Leu Arg Val Lys Lys Thr Leu Ala Lys Met Ser Glu485 490 495Ser Gln Asp Ile Lys Leu500
<210>110<211>532<212>PRT<213>Rattus sp.
<400>110Met Thr Gln Leu Tyr Thr Tyr Ile Arg Leu Leu Gly Ala Cys Leu Phe1 5 10 15Ile Ile Ser His Val Gln Gly Gln Asn Leu Asp Ser Met Leu His Gly20 25 30Thr Gly Met Lys Ser Asp Val Asp Gln Lys Lys Pro Glu Asn Gly Val35 40 45Thr Leu Ala Pro Glu Asp Thr Leu Pro Phe Leu Lys Cys Tyr Cys Ser50 55 60Gly His Cys Pro Asp Asp Ala Ile Asn Asn Thr Cys Ile Thr Asn Gly65 70 75 80His Cys Phe Ala Ile Ile Glu Glu Asp Asp Gln Gly Glu Thr Thr Leu85 90 95Thr Ser Gly Cys Met Lys Tyr Glu Gly Ser Asp Phe Gln Cys Lys Asp100 105 110Ser Pro Lys Ala Gln Leu Arg Arg Thr Ile Glu Cys Cys Arg Thr Asn115 120 125Leu Cys Asn Gln Tyr Leu Gln Pro Thr Leu Pro Pro Val Val Ile Gly130 135 140Pro Phe Phe Asp Gly Ser Val Arg Trp Leu Ala Val Leu Ile Ser Met145 150 155 160Ala Val Cys Ile Val Ala Met Ile Val Phe Ser Ser Cys Phe Cys Tyr165 170 175Lys His Tyr Cys Lys Ser Ile Ser Ser Arg Gly Arg Tyr Asn Arg Asp180 185 190Leu Glu Gln Asp Glu Ala Phe Ile Pro Val Gly Glu Ser Leu Lys Asp195 200 205Leu Ile Asp Gln Ser Gln Ser Ser Gly Ser Gly Ser Gly Leu Pro Leu210 215 220Leu Val Gln Arg Thr Ile Ala Lys Gln Ile Gln Met Val Arg Gln Val225 230 235 240Gly Lys Gly Arg Tyr Gly Glu Val Trp Met Gly Lys Trp Arg Gly Glu245 250 255Lys Val Ala Val Lys Val Phe Phe Thr Thr Glu Glu Ala Ser Trp Phe260 265 270Arg Glu Thr Glu Ile Tyr Gln Thr Val Leu Met Arg His Glu Asn Ile275 280 285Leu Gly Phe Ile Ala Ala Asp Ile Lys Gly Thr Gly Ser Trp Thr Gln290 295 300Leu Tyr Leu Ile Thr Asp Tyr His Glu Asn Gly Ser Leu Tyr Asp Phe305 310 315 320Leu Lys Cys Ala Thr Leu Asp Thr Arg Ala Leu Leu Lys Leu Ala Tyr325 330 335Ser Ala Ala Cys Gly Leu Cys His Leu His Thr Glu Ile Tyr Gly Thr340 345 350Gln Gly Lys Pro Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile355 360 365Leu Ile Lys Lys Asn Gly Ser Cys Cys Ile Ala Asp Leu Gly Leu Ala370 375 380Val Lys Phe Asn Ser Asp Thr Asn Glu Val Asp rle Pro Leu Asn Thr385 390 395 400Arg Val Gly Thr Arg Arg Tyr Met Ala Pro Glu Val Leu Asp Glu Ser
405 410 415Leu Ser Lys Asn His Phe Gln Pro Tyr Ile Met Ala Asp Ile Tyr Ser420 425 430Phe Gly Leu Ile Ile Trp Glu Met Ala Arg Arg Cys Ile Thr Gly Gly435 440 445Ile Val Glu Glu Tyr Gln Leu Pro Tyr Tyr Asn Met Val Pro Ser Asp450 455 460Pro Ser Tyr Glu Asp Met Arg Glu Val Val Cys Val Lys Arg Leu Arg465 470 475 480Pro Ile Val Ser Asn Arg Trp Asn Ser Asp Glu Cys Leu Arg Ala Val485 490 495Leu Lys Leu Met Ser Glu Cys Trp Ala His Asn Pro Ala Ser Arg Leu500 505 510Thr Ala Leu Arg Ile Lys Lys Thr Leu Ala Lys Met Val Glu ser Gln515 520 525Asp Val Lys Ile530<210>111<211>530<212>PRT<213>Homo sapiens<400>111Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp1 5 10 15Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg20 25 30Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu35 40 45Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser50 55 60Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val65 70 75 80Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr85 90 95Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr100 105 110Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr115 120 125Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser130 135 140Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val145 150 155 160Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr165 170 175Gly Arg Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala180 185 190Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu195 200 205Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu210 215 220Arg Pro Val Ala Val Lys Val Phe Ser Phe Ala Asn Arg Gln Asn Phe225 230 235 240Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn245 250 255
Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg260 265 270Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys275 280 285Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu290 295 300Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro305 310 315 320Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser325 330 335Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe340 345 350Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu355 360 365Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala370 375 380Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala385 390 395 400Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile405 410 415Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr420 425 430Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp435 440 445Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu450 455 460Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile465 470 475 480Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys485 490 495Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys500 505 510Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu515 520 525Arg Arg530<210>112<211>530<212>PRT<213>Homo sapiens<400>112Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp1 5 10 15Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg20 25 30Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu35 40 45Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser50 55 60Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val65 70 75 80Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr85 90 95Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr
100 105 110Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr115 120 125Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser130 135 140Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val145 150 155 160Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr165 170 175Gly Asp Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala180 185 190Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu195 200 205Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu210 215 220Arg Pro Val Ala Val Lys Val Phe Ser Phe Ala Asn Arg Gln Asn Phe225 230 235 240Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn245 250 255Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg260 265 270Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys275 280 285Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu290 295 300Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro305 310 315 320Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser325 330 335Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe340 345 350Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu355 360 365Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala370 375 380Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala385 390 395 400Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile405/410 415Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr420 425 430Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp435 440 445Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu450 455 460Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile465 470 475 480Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys485 490 495Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys500 505 510Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu515 520 525Arg Arg530
<210>113<211>1038<212>PRT<213>Homo sapiens<400>113Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp1 5 10 15Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg20 25 30Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu35 40 45Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser50 55 60Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val65 70 75 80Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr85 90 95Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr100 105 110Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr115 120 125Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser130 135 140Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val145 150 155 160Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr165 170 175Gly Asp Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala180 185 190Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu195 200 205Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu210 215 220Arg Pro Val Ala Val Lys Val phe Ser Phe Ala Asn Arg Gln Asn Phe225 230 235 240Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn245 250 255Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg260 265 270Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys275 280 285Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu290 295 300Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro305 310 315 320Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser325 330 335Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe340 345 350Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu355 360 365Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala370 375 380Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala385 390 395 400Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile
405 410 415Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr420 425 430Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp435 440 445Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu450 455 460Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile465 470 475 480Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys485 490 495Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys500 505 510Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu515 520 525Arg Asn Leu Ser His Asn Arg Arg Val Pro Lys Ile Gly Pro Tyr Pro530 535 540Asp Tyr Ser Ser Ser Ser Tyr Ile Glu Asp Ser Ile His His Thr Asp545 550 555 560Ser Ile Val Lys Asn Ile Ser Ser Glu His Ser Met Ser Ser Thr Pro565 570 575Leu Thr Ile Gly Glu Lys Asn Arg Asn Ser Ile Asn Tyr Glu Arg Gln580 585 590Gln Ala Gln Ala Arg Ile Pro Ser Pro Glu Thr Ser Val Thr Ser Leu595 600 605Ser Thr Asn Thr Thr Thr Thr Asn Thr Thr Gly Leu Thr Pro Ser Thr610 615 620Gly Met Thr Thr Ile Ser Glu Met Pro Tyr Pro Asp Glu Thr Asn Leu625 630 635 640His Thr Thr Asn Val Ala Gln Ser Ile Gly Pro Thr Pro Val Cys Leu645 650 655Gln Leu Thr Glu Glu Asp Leu Glu Thr Asn Lys Leu Asp Pro Lys Glu660 665 670Val Asp Lys Asn Leu Lys Glu Ser Ser Asp Glu Asn Leu Met Glu His675 680 685Ser Leu Lys Gln Phe Ser Gly Pro Asp Pro Leu Ser Ser Thr Ser Ser690 695 700Ser Leu Leu Tyr Pro Leu Ile Lys Leu Ala Val Glu Ala Thr Gly Gln705 710 715 720Gln Asp Phe Thr Gln Thr Ala Asn Gly Gln Ala Cys Leu Ile Pro Asp725 730 735Val Leu Pro Thr Gln Ile Tyr Pro Leu Pro Lys Gln Gln Asn Leu Pro740 745 750Lys Arg Pro Thr Ser Leu Pro Leu Asn Thr Lys Asn Ser Thr Lys Glu755 760 765Pro Arg Leu Lys Phe Gly Ser Lys His Lys Ser Asn Leu Lys Gln Val770 775 780Glu Thr Gly Val Ala Lys Met Asn Thr Ile Asn Ala Ala Glu Pro His785 790 795 800Val Val Thr Val Thr Met Asn Gly Val Ala Gly Arg Asn His Ser Val805 810 815Asn Ser His Ala Ala Thr Thr Gln Tyr Ala Asn Gly Thr Val Leu Ser820 825 830Gly Gln Thr Thr Asn Ile Val Thr His Arg Ala Gln Glu Met Leu Gln835 840 845Asn Gln Phe Ile Gly Glu Asp Thr Arg Leu Asn Ile Asn Ser Ser Pro850 855 860
Asp Glu His Glu Pro Leu Leu Arg Arg Glu Gln Gln Ala Gly His Asp865 870 875 880Glu Gly Val Leu Asp Arg Leu Val Asp Arg Arg Glu Arg Pro Leu Glu885 890 895Gly Gly Arg Thr Asn Ser Asn Asn Asn Asn Ser Asn Pro Cys Ser Glu900 905 910Gln Asp Val Leu Ala Gln Gly Val Pro Ser Thr Ala Ala Asp Pro Gly915 920 925Pro Ser Lys Pro Arg Arg Ala Gln Arg Pro Asn Ser Leu Asp Leu Ser930 935 940Ala Thr Asn Val Leu Asp Gly Ser Ser Ile Gln Ile Gly Glu Ser Thr945 950 955 960Gln Asp Gly Lys Ser Gly Ser Gly Glu Lys Ile Lys Lys Arg Val Lys965 970 975Thr Pro Tyr Ser Leu Lys Arg Trp Arg Pro Ser Thr Trp Val Ile Ser980 985 990Thr Glu Ser Leu Asp Cys Glu Val Asn Asn Asn Gly Ser Asn Arg Ala995 10001005Val His Ser Lys Ser Ser Thr Ala Val Tyr Leu Ala Glu Gly Gly Thr101010151020Ala Thr Thr Met Val Ser Lys Asp Ile Gly Met Asn Cys Leu102510301035<210>114<211>1038<212>PRT<213>Homo sapiens<400>114Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp1 5 10 15Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg20 25 30Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu35 40 45Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser50 55 60Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val65 70 75 80Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr85 90 95Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr100 105 110Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr115 120 125Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser130 135 140Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val145 150 155 160Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr165 170 175Gly Asp Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala180 185 190Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu195 200 205Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu
210 215 220Arg Pro Val Ala Val Lys Val Phe Ser Phe Ala Asn Arg Gln Asn Phe225 230 235 240Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn245 250 255Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg260 265 270Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys275 280 285Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu290 295 300Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro305 310 315 320Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser325 330 335Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe340 345 350Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu355 360 365Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala370 375 380Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala385 390 395 400Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile405 410 415Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr420 425 430Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp435 440 445Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu450 455 460Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile465 470 475 480Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys485 490 495Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys500 505 510Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu515 520 525Arg Asn Leu Ser His Asn Arg Arg Val Pro Lys Ile Gly Pro Tyr Pro530 535 540Asp Tyr Ser Ser Ser Ser Tyr Ile Glu Asp Ser Ile His His Thr Asp545 550 555 560Ser Ile Val Lys Asn Ile Ser Ser Glu His Ser Met Ser Ser Thr Pro565 570 575Leu Thr Ile Gly Glu Lys Asn Arg Asn Ser Ile Asn Tyr Glu Arg Gln580 585 590Gln Ala Gln Ala Arg Ile Pro Ser Pro Glu Thr Ser Val Thr Ser Leu595 600 605Ser Thr Asn Thr Thr Thr Thr Asn Thr Thr Gly Leu Thr Pro Ser Thr610 615 620Gly Met Thr Thr Ile Ser Glu Met Pro Tyr Pro Asp Glu Thr Asn Leu625 630 635 640His Thr Thr Asn Val Ala Gln Ser Ile Gly Pro Thr Pro Val Cys Leu645 650 655Gln Leu Thr Glu Glu Asp Leu Glu Thr Asn Lys Leu Asp Pro Lys Glu660 665 670
Val Asp Lys Asn Leu Lys Glu Ser Ser Asp Glu Asn Leu Met Glu His675 680 685Ser Leu Lys Gln Phe Ser Gly Pro Asp Pro Leu Ser Ser Thr Ser Ser690 695 700Ser Leu Leu Tyr Pro Leu Ile Lys Leu Ala Val Glu Ala Thr Gly Gln705 710 715 720Gln Asp Phe Thr Gln Thr Ala Asn Gly Gln Ala Cys Leu Ile Pro Asp725 730 735Val Leu Pro Thr Gln Ile Tyr Pro Leu Pro Lys Gln Gln Asn Leu Pro740 745 750Lys Arg Pro Thr Ser Leu Pro Leu Asn Thr Lys Asn Ser Thr Lys Glu755 760 765Pro Arg Leu Lys Phe Gly Ser Lys His Lys Ser Asn Leu Lys Gln Val770 775 780Glu Thr Gly Val Ala Lys Met Asn Thr Ile Asn Ala Ala Glu Pro His785 790 795 800Val Val Thr Val Thr Met Asn Gly Val Ala Gly Arg Asn His Ser Val805 810 815Asn Ser His Ala Ala Thr Thr Gln Tyr Ala Asn Arg Thr Val Leu Ser820 825 830Gly Gln Thr Thr Asn Ile Val Thr His Arg Ala Gln Glu Met Leu Gln835 840 845Asn Gln Phe Ile Gly Glu Asp Thr Arg Leu Asn Ile Asn Ser Ser Pro850 855 860Asp Glu His Glu Pro Leu Leu Arg Arg Glu Gln Gln Ala Gly His Asp865 870 875 880Glu Gly Val Leu Asp Arg Leu Val Asp Arg Arg Glu Arg Pro Leu Glu885 890 895Gly Gly Arg Thr Asn Ser Asn Asn Asn Asn Ser Asn Pro Cys Ser Glu900 905 910Gln Asp Val Leu Ala Gln Gly Val Pro Ser Thr Ala Ala Asp Pro Gly915 920 925Pro Ser Lys Pro Arg Arg Ala Gln Arg Pro Asn Ser Leu Asp Leu Ser930 935 940Ala Thr Asn Val Leu Asp Gly Ser Ser Ile Gln Ile Gly Glu Ser Thr945 950 955 960Gln Asp Gly Lys Ser Gly Ser Gly Glu Lys Ile Lys Lys Arg Val Lys965 970 975Thr Pro Tyr Ser Leu Lys Arg Trp Arg Pro Ser Thr Trp Val Ile Ser980 985 990Thr Glu Ser Leu Asp Cys Glu Val Asn Asn Asn Gly Ser Asn Arg Ala995 10001005Val His Ser Lys Ser Ser Thr Ala Val Tyr Leu Ala Glu Gly Gly Thr101010151020Ala Thr Thr Met Val Ser Lys Asp Ile Gly Met Asn Cys Leu102510301035<210>115<211>1038<212>PRT<213>Homo sapiens<400>115Met Thr Ser Ser Leu Gln Arg Pro Trp Arg Val Pro Trp Leu Pro Trp1 5 10 15Thr Ile Leu Leu Val Ser Thr Ala Ala Ala Ser Gln Asn Gln Glu Arg
20 25 30Leu Cys Ala Phe Lys Asp Pro Tyr Gln Gln Asp Leu Gly Ile Gly Glu35 40 45Ser Arg Ile Ser His Glu Asn Gly Thr Ile Leu Cys Ser Lys Gly Ser50 55 60Thr Cys Tyr Gly Leu Trp Glu Lys Ser Lys Gly Asp Ile Asn Leu Val65 70 75 80Lys Gln Gly Cys Trp Ser His Ile Gly Asp Pro Gln Glu Cys His Tyr85 90 95Glu Glu Cys Val Val Thr Thr Thr Pro Pro Ser Ile Gln Asn Gly Thr100 105 110Tyr Arg Phe Cys Cys Cys Ser Thr Asp Leu Cys Asn Val Asn Phe Thr115 120 125Glu Asn Phe Pro Pro Pro Asp Thr Thr Pro Leu Ser Pro Pro His Ser130 135 140Phe Asn Arg Asp Glu Thr Ile Ile Ile Ala Leu Ala Ser Val Ser Val145 150 155 160Leu Ala Val Leu Ile Val Ala Leu Cys Phe Gly Tyr Arg Met Leu Thr165 170 175Gly Asp Arg Lys Gln Gly Leu His Ser Met Asn Met Met Glu Ala Ala180 185 190Ala Ser Glu Pro Ser Leu Asp Leu Asp Asn Leu Lys Leu Leu Glu Leu195 200 205Ile Gly Arg Gly Arg Tyr Gly Ala Val Tyr Lys Gly Ser Leu Asp Glu210 215 220Arg Pro Val Ala Val Lys Val Phe Ser Phe Ala Asn Arg Gln Asn Phe225 230 235 240Ile Asn Glu Lys Asn Ile Tyr Arg Val Pro Leu Met Glu His Asp Asn245 250 255Ile Ala Arg Phe Ile Val Gly Asp Glu Arg Val Thr Ala Asp Gly Arg260 265 270Met Glu Tyr Leu Leu Val Met Glu Tyr Tyr Pro Asn Gly Ser Leu Cys275 280 285Lys Tyr Leu Ser Leu His Thr Ser Asp Trp Val Ser Ser Cys Arg Leu290 295 300Ala His Ser Val Thr Arg Gly Leu Ala Tyr Leu His Thr Glu Leu Pro305 310 315 320Arg Gly Asp His Tyr Lys Pro Ala Ile Ser His Arg Asp Leu Asn Ser325 330 335Arg Asn Val Leu Val Lys Asn Asp Gly Thr Cys Val Ile Ser Asp Phe340 345 350Gly Leu Ser Met Arg Leu Thr Gly Asn Arg Leu Val Arg Pro Gly Glu355 360 365Glu Asp Asn Ala Ala Ile Ser Glu Val Gly Thr Ile Arg Tyr Met Ala370 375 380Pro Glu Val Leu Glu Gly Ala Val Asn Leu Arg Asp Cys Glu Ser Ala385 390 395 400Leu Lys Gln Val Asp Met Tyr Ala Leu Gly Leu Ile Tyr Trp Glu Ile405 410 415Phe Met Arg Cys Thr Asp Leu Phe Pro Gly Glu Ser Val Pro Glu Tyr420 425 430Gln Met Ala Phe Gln Thr Glu Val Gly Asn His Pro Thr Phe Glu Asp435 440 445Met Gln Val Leu Val Ser Arg Glu Lys Gln Arg Pro Lys Phe Pro Glu450 455 460Ala Trp Lys Glu Asn Ser Leu Ala Val Arg Ser Leu Lys Glu Thr Ile465 470 475 480
Glu Asp Cys Trp Asp Gln Asp Ala Glu Ala Arg Leu Thr Ala Gln Cys485 490 495Ala Glu Glu Arg Met Ala Glu Leu Met Met Ile Trp Glu Arg Asn Lys500 505 510Ser Val Ser Pro Thr Val Asn Pro Met Ser Thr Ala Met Gln Asn Glu515 520 525Arg Asn Leu Ser His Asn Arg Arg Val Pro Lys Ile Gly Pro Tyr Pro530 535 540Asp Tyr Ser Ser Ser Ser Tyr Ile Glu Asp Ser Ile His His Thr Asp545 550 555 560Ser Ile Val Lys Asn Ile Ser Ser Glu His Ser Met Ser Ser Thr Pro565 570 575Leu Thr Ile Gly Glu Lys Asn Arg Asn Ser Ile Asn Tyr Glu Arg Gln580 585 590Gln Ala Gln Ala Arg Ile Pro Ser Pro Glu Thr Ser Val Thr Ser Leu595 600 605Ser Thr Asn Thr Thr Thr Thr Asn Thr Thr Gly Leu Thr Pro Ser Thr610 615 620Gly Met Thr Thr Ile Ser Glu Met Pro Tyr Pro Asp Glu Thr Asn Leu625 630 635 640His Thr Thr Asn Val Ala Gln Ser Ile Gly Pro Thr Pro Val Cys Leu645 650 655Gln Leu Thr Glu Glu Asp Leu Glu Thr Asn Lys Leu Asp Pro Lys Glu660 665 670Val Asp Lys Asn Leu Lys Glu Ser Ser Asp Glu Asn Leu Met Glu His675 680 685Ser Leu Lys Gln Phe Ser Gly Pro Asp Pro Leu Ser Ser Thr Ser Ser690 695 700Ser Leu Leu Tyr Pro Leu Ile Lys Leu Ala Val Glu Ala Thr Gly Gln705 710 715 720Gln Asp Phe Thr Gln Thr Ala Asn Gly Gln Ala Cys Leu Ile Pro Asp725 730 735Val Leu Pro Thr Gln Ile Tyr Pro Leu Pro Lys Gln Gln Asn Leu Pro740 745 750Lys Arg Pro Thr Ser Leu Pro Leu Asn Thr Lys Asn Ser Thr Lys Glu755 760 765Pro Arg Leu Lys Phe Gly Ser Lys His Lys Ser Asn Leu Lys Gln Val770 775 780Glu Thr Gly Val Ala Lys Met Asn Thr Ile Asn Ala Ala Glu Pro His785 790 795 800Val Val Thr Val Thr Met Asn Gly Val Ala Gly Arg Asn His Ser Val805 810 815Asn Ser His Ala Ala Thr Thr Gln Tyr Ala Asn Arg Thr Val Leu Ser820 825 830Gly Gln Thr Thr Asn Ile Val Thr His Arg Ala Gln Glu Met Leu Gln835 840 845Asn Gln Phe Ile Gly Glu Asp Thr Arg Leu Asn Ile Asn Ser Ser Pro850 855 860Asp Glu His Glu Pro Leu Leu Arg Arg Glu Gln Gln Ala Gly His Asp865 870 875 880Glu Gly Val Leu Asp Arg Leu Val Asp Arg Arg Glu Arg Pro Leu Glu885 890 895Gly Gly Arg Thr Asn Ser Asn Asn Asn Asn Ser Asn Pro Cys Ser Glu900 905 910Gln Asp Val Leu Ala Gln Gly Val Pro Ser Thr Ala Ala Asp Pro Gly915 920 925Pro Ser Lys Pro Arg Arg Ala Gln Arg Pro Asn Ser Leu Asp Leu Ser
930 935 940Ala Thr Asn Val Leu Asp Gly Ser Ser Ile Gln Ile Gly Glu Ser Thr945 950 955 960Gln Asp Gly Lys Ser Gly Ser Gly Glu Lys Ile Lys Lys Arg Val Lys965 970 975Thr Pro Tyr Ser Leu Lys Arg Trp Arg Pro Ser Thr Trp Val Ile Ser980 985 990Thr Glu Ser Leu Asp Cys Glu Val Asn Asn Asn Gly Ser Asn Arg Ala995 10001005Val His Ser Lys Ser Ser Thr Ala Val Tyr Leu Ala Glu Gly Gly Thr101010151020Ala Thr Thr Met Val Ser Lys Asp Ile Gly Met Asn Cys Leu102510301035<210>116<211>2932<212>DNA<213>Homo sapiens<400>116gctccgcgcc gagggctgga ggatgcgttc cctggggtcc ggacttatga aaatatgcat 60cagtttaata ctgtcttgga attcatgaga tggaagcata ggtcaaagct gtttggagaa 120aatcagaagt acagttttat ctagccacat cttggaggag tcgtaagaaa gcagtgggag 180ttgaagtcat tgtcaagtgc ttgcgatctt ttacaagaaa atctcactga atgatagtca 240tttaaattgg tgaagtagca agaccaatta ttaaaggtga cagtacacag gaaacattac 300aattgaacaa tgactcagct atacatttac atcagattat tgggagccta tttgttcatc 360atttctcgtg ttcaaggaca gaatctggat agtatgcttc atggcactgg gatgaaatca 420gactccgacc agaaaaagtc agaaaatgga gtaaccttag caccagagga taccttgcct 480tttttaaagt gctattgctc agggcactgt ccagatgatg ctattaataa cacatgcata 540actaatggac attgctttgc catcatagaa gaagatgacc agggagaaac cacattagct 600tcagggtgta tgaaatatga aggatctgat tttcagtgca aagattctcc aaaagcccag 660ctacgccgga caatagaatg ttgtcggacc aatttatgta accagtattt gcaacccaca 720ctgccccctg ttgtcatagg tccgtttttt gatggcagca ttcgatggct ggttttgctc 780atttctatgg ctgtctgcat aattgctatg atcatcttct ccagctgctt ttgttacaaa 840cattattgca agagcatctc aagcagacgt cgttacaatc gtgatttgga acaggatgaa 900gcatttattc cagttggaga atcactaaaa gaccttattg accagtcaca aagttctggt 960agtgggtctg gactaccttt attggttcag cgaactattg ccaaacagat tcagatggtc 1020cggcaagttg gtaaaggccg atatggagaa gtatggatgg gcaaatggcg tggcgaaaaa 1080gtggcggtga aagtattctt taccactgaa gaagccagct ggtttcgaga aacagaaatc 1140taccaaactg tgctaatgcg ccatgaaaac atacttggtt tcatagcggc agacattaaa 1200ggtacaggtt cctggactca gctctatttg attactgatt accatgaaaa tggatctctc 1260tatgacttcc tgaaatgtgc tacactggac accagagccc tgcttaaatt ggcttattca 1320gctgcctgtg gtctgtgcca cctgcacaca gaaatttatg gcacccaagg aaagcccgca 1380attgctcatc gagacctaaa gagcaaaaac atcctcatca agaaaaatgg gagttgctgc 1440attgctgacc tgggccttgc tgttaaattc aacagtgaca caaatgaagt tgatgtgccc 1500ttgaatacca gggtgggcac caaacgctac atggctcccg aagtgctgga cgaaagcctg 1560aacaaaaacc acttccagcc ctacatcatg gctgacatct acagcttcgg cctaatcatt 1620tgggagatgg ctcgtcgttg tatcacagga gggatcgtgg aagaatacca attgccatat 1680tacaacatgg taccgagtga tccgtcatac gaagatatgc gtgaggttgt gtgtgtcaaa 1740cgtttgcggc caattgtgtc taatcggtgg aacagtgatg aatgtctacg agcagttttg 1800aagctaatgt cagaatgctg ggcccacaat ccagcctcca gactcacagc attgagaatt 1860aagaagacgc ttgccaagat ggttgaatcc caagatgtaa aaatctgatg gttaaaccat 1920cggaggagaa actctagact gcaagaactg tttttaccca tggcatgggt ggaattagag 1980tggaataagg atgttaactt ggttctcaga ctctttcttc actacgtgtt cacaggctgc 2040taatattaaa cctttcagta ctcttattag gatacaagct gggaacttct aaacacttca 2100ttctttatat atggacagct ttattttaaa tgtggttttt gatgcctttt tttaagtggg 2160tttttatgaa ctgcatcaag acttcaatcc tgattagtgt ctccagtcaa gctctgggta 2220
ctgaattgcc tgttcataaa acggtgcttt ctgtgaaagc cttaagaaga taaatgagcg 2280cagcagagat ggagaaatag actttgcctt ttacctgaga cattcagttc gtttgtattc 2340tacctttgta aaacagccta tagatgatga tgtgtttggg atactgctta ttttatgata 2400gtttgtcctg tgtccttagt gatgtgtgtg tgtctccatg cacatgcacg ccgggattcc 2460tctgctgcca tttgaattag aagaaaataa tttatatgca tgcacaggaa gatattggtg 2520gccggtggtt ttgtgcttta aaaatgcaat atctgaccaa gattcgccaa tctcatacaa 2580gccatttact ttgcaagtga gatagcttcc ccaccagctt tattttttaa catgaaagct 2640gatgccaagg ccaaaagaag tttaaagcat ctgtaaattt ggactgtttt ccttcaacca 2700ccattttttt tgtggttatt atttttgtca cggaaagcat cctctccaaa gttggagctt 2760ctattgccat gaaccatgct tacaaagaaa gcacttctta ttgaagtgaa ttcctgcatt 2820tgatagcaat gtaagtgcct ataaccatgt tctatattct ttattctcag taacttttaa 2880aagggaagtt atttatattt tgtgtataat gtgctttatt tgcaaatcac cc 2932<210>117<211>1575<212>DNA<213>Homo sapiens<400>117gcaaacttcc ttgataacat gcttttgcga agtgcaggaa aattaaatgt gggcaccaag 60aaagaggatg gtgagagtac agcccccacc ccccgtccaa aggtcttgcg ttgtaaatgc 120caccaccatt gtccagaaga ctcagtcaac aatatttgca gcacagacgg atattgtttc 180acgatgatag aagaggatga ctctgggttg cctgtggtca cttctggttg cctaggacta 240gaaggctcag attttcagtg tcgggacact cccattcctc atcaaagaag atcaattgaa 300tgctgcacag aaaggaacga atgtaataaa gacctacacc ctacactgcc tccattgaaa 360aacagagatt ttgttgatgg acctatacac cacagggctt tacttatatc tgtgactgtc 420tgtagtttgc tcttggtcct tatcatatta ttttgttact tccggtataa aagacaagaa 480accagacctc gatacagcat tgggttagaa caggatgaaa cttacsttcc tcctggagaa 540tccctgagag acttaattga gcagtctcag agctcaggaa gtggatcagg cctccctctg 600ctggtccaaa ggactatagc taagcagatt cagatggtga aacagattgg aaaaggtcgc 660tatggggaag tttggatggg aaagtggcgt ggcgaaaagg tagctgtgaa agtgttcttc 720accacagagg aagccagctg gttcagagag acagaaatat atcagacagt gttgatgagg 780catgaaaaca ttttgggttt cattgctgca gatatcaaag ggacagggtc ctggacccag 840ttgtacctaa tcacagacta tcatgaaaat ggttcccttt atgattatct gaagtccacc 900accctagacg ctaaatcaat gctgaagtta gcctactctt ctgtcagtgg cttatgtcat 960ttacacacag aaatctttag tactcaaggc aaaccagcaa ttgcccatcg agatctgaaa 1020agtaaaaaca ttctggtgaa gaaaaatgga acttgctgta ttgctgacct gggcctggct 1080gttaaattta ttagtgatac aaatgaagtt gacataccac ctaacactcg agttggcacc 1140aaacgctata tgcctccaga agtgttggac gagagcttga acagaaatca cttccagtct 1200tacatcatgg ctgacatgta tagttttggc ctcatccttt gggaggttgc taggagatgt 1260gtatcaggag gtatagtgga agaataccag cttccttatc atgacctagt gcccagtgac 1320ccctcttatg aggacatgag ggagattgtg tgcatcaaga agttacgccc ctcattccca 1380aaccggtgga gcagtgatga gtgtctaagg cagatgggaa aactcatgac agaatgctgg 1440gctcacaatc ctgcatcaag gctgacagcc ctgcgggtta agaaaacact tgccaaaatg 1500tcagagtccc aggacattaa actctgatag gagaggaaaa gtaagcatct ctgcagaaag 1560ccaacaggta ccctt 1575<210>118<211>2032<212>DNA<213>Homo sapiens<400>118cgcggggcgc ggagtcggcg gggcctcgcg ggacgcgggc agtgcggaga ccgcggcgct 60gaggacgcgg gagccgggag cgcacgcgcg gggtggagtt cagcctactc tttcttagat 120gtgaaaggaa aggaagatca tttcatgcct tgttgataaa ggttcagact tctgctgatt 180cataaccatt tggctctgag ctatgacaag agaggaaaca aaaagttaaa cttacaagcc 240
tgccataagt gagaagcaaa cttccttgat aacatgcttt tgcgaagtgc aggaaaatta 300aatgtgggca ccaagaaaga ggatggtgag agtacagccc ccaccccccg tccaaaggtc 360ttgcgttgta aatgccacca ccattgtcca gaagactcag tcaacaatat ttgcagcaca 420gacggatatt gtttcacgat gatagaagag gatgactctg ggttgcctgt ggtcacttct 480ggttgcctag gactagaagg ctcagatttt cagtgtcggg acactcccat tcctcatcaa 540agaagatcaa ttgaatgctg cacagaaagg aacgaatgta ataaagacct acaccctaca 600ctgcctccat tgaaaaacag agattttgtt gatggaccta tacaccacag ggctttactt 660atatctgtga ctgtctgtag tttgctcttg gtccttatca tattattttg ttacttccgg 720tataaaagac aagaaaccag acctcgatac agcattgggt tagaacagga tgaaacttac 780attcctcctg gagaatccct gagagactta attgagcagt ctcagagctc aggaagtgga 840tcaggcctcc ctctgctggt ccaaaggact atagctaagc agattcagat ggtgaaacag 900attggaaaag gtcgctatgg ggaagtttgg atgggaaagt ggcgtggcga aaaggtagct 960gtgaaagtgt tcttcaccac agaggaagcc agctggttca gagagacaga aatatatcag 1020acagtgttga tgaggcatga aaacattttg ggtttcattg ctgcagatat caaagggaca 1080gggtcctgga cccagttgta cctaatcaca gactatcatg aaaatggttc cctttatgat 1140tatctgaagt ccaccaccct agacgctaaa tcaatgctga agttagccta ctcttctgtc 1200agtggcttat gtcatttaca cacagaaatc tttagtactc aaggcaaacc agcaattgcc 1260catcgagatc tgaaaagtaa aaacattctg gtgaagaaaa atggaacttg ctgtattgct 1320gacctgggcc tggctgttaa atttattagt gatacaaatg aagttgacat accacctaac 1380actcgagttg gcaccaaacg ctatatgcct ccagaagtgt tggacgagag cttgaacaga 1440aatcacttcc agtcttacat catggctgac atgtatagtt ttggcctcat cctttgggag 1500gttgctagga gatgtgtatc aggaggtata gtggaagaat accagcttcc ttatcatgac 1560ctagtgccca gtgacccctc ttatgaggac atgagggaga ttgtgtgcat caagaagtta 1620cgcccctcat tcccaaaccg gtggagcagt gatgagtgtc taaggcagat gggaaaactc 1680atgacagaat gctgggctca caatcctgca tcaaggctga cagccctgcg ggttaagaaa 1740acacttgcca aaatgtcaga gtcccaggac attaaactct gataggagag gaaaagtaag 1800catctctgca gaaagccaac aggtactctt ctgtttgtgg gcagagcaaa agacatcaaa 1860taagcatcca cagtacaagc cttgaacatc gtcctgcttc ccagtgggtt cagacctcac 1920ctttcaggga gcgacctggg caaagacaga gaagctccca gaaggagaga ttgatccgtg 1980tctgtttgta ggcggagaaa ccgttgggta acttgttcaa gatatgatgc at 2032<210>119<211>3167<212>DNA<213>Rattus sp.
<400>119gaattcatga gatggaaaca taggtcaaag ctgtttggag aaattggaac tacagtttta 60tctagccaca tctctgagaa gtctgaagaa agcagcaggt gaaagtcatt gtcaagtgat 120tttgttcttc tgtaaggaaa cctcgttcag taaggccgtt tacttcagtg aaacagcagg 180accagtaatc aaggtggccc ggacaggaca cgtgcgaatt ggacaatgac tcagctatac 240acttacatca gattactggg agcctgtctg ttcatcattt ctcatgttca acggcagaat 300ctagatagta tgctccatgg tactggtatg aaatcagacg tggaccagaa gaagccggaa 360aatggagtga cgttagcacc agaggacacc ttacctttct taaaatgcta ttgctcagga 420cactgcccag atgacgctat taataacaca tgcataacta atggccattg ctttgccatt 480atagaagaag atgatcaggg agaaaccacg ttaacttctg ggtgtatgaa gtatgaaggc 540tctgattttc aatgcaagga ttcaccaaaa gcccagctac gcaggacaat agaatgttgt 600cggaccaatt tgtgcaacca atatttgcag cctacactgc cccctgtcgt tataggccca 660ttctttgatg gcagcgtccg atggctggct gtgctcatct ctatggctgt ctgtattgtc 720gccatgatcg tcttctccag ctgcttctgt tacaaacatt actgtaagag tatctcaagc 780agaggtcgtt acaaccgtga cttggaacag gatgaagcat ttattccagt aggagaatca 840ctgaaagacc tgattgacca gtcacaaagc tctggtagtg gatctggatt acctttattg 900gttcagcgaa ctattgccaa acagattcag atggttcggc aggttggtaa aggccggtat 960ggagaagtat ggatgggtaa atggcgtggt gaaaaagtgg ctgtcaaagt attttttacc 1020actgaagaag ctagctggtt tagagaaaca gaaatctacc agacggtgtt aatgcgtcat 1080gaaaatatac ttggttttat agctgcagac attaaaggca ccggttcctg gactcagctg 1140tatttgatta ctgattacca tgagaatggg tctctctatg acttcctgaa atgtgccacc 1200
ctggacacca gagccctact caagttagct tattctgctg cctgtggtct gtgccacctc 1260cacacagaaa tttatggcac gcaaggcaag cctgcaattg ctcatcgaga cctgaagagc 1320aaaaacatcc ttattaagaa aaatggtagt tgctgtattg ctgacctggg cctagctgtt 1380aaattcaaca gtgacacaaa tgaagttgac atacccttga acaccagggt gggcaccagg 1440cggtacatgg ctccagaagt gctggacgag agcctgagta aaaaccattt ccagccctac 1500atcatggctg acatctacag ctttggtttg atcatttggg agatggcccg tcgctgtatt 1560acaggaggaa tcgtggagga atatcaatta ccatattaca acatggtgcc tagtgaccca 1620tcttatgaag acatgcgtga ggtcgtgtgt gtgaaacgct tgcggccaat cgtctctaac 1680cgctggaaca gtgatgaatg tcttcgagcc gttttgaagc tgatgtcaga atgctgggcc 1740cataatccag catccagact cacagctttg agaatcaaga agacgctcgc aaagatggtt 1800gaatcccagg atgtaaagat ttgacaaaca gttttgagaa agaatttaga ctgcaagaaa 1860ttcacccgag gaagggtgga gttagcatgg actaggatgt cggcttggtt tccagactct 1920ctcctctaca tcttcacagg ctgctaacag taaactttca ggactctgca gaatgcaggg 1980ttggagcttc agacatagga cttcagacat gctgttcttt gcgtatggac agctttgttt 2040taaatgtggg cttttgatgc ctttttggtt tttatgaatt gcatcaagac tccaatcctg 2100ataagaagtc tctggtcaaa ctctggttac tcactatcct gtccataaag tggtgctttc 2160tgtgaaagcc ttaaggaaat tagtgagctc agcagagatg gagaaaggca tatttgccct 2220ctacagagaa aatatctgtc tgtgttctgt ctctgtaaac agcctggact atgatctctt 2280tgggatgctg cctggttgat gatggtgcat catgcctctg atatgcatac cagacttcct 2340ctgctgccat gggcttacaa gacaagaatg tgaaggttgc acaggacggt atttgtggcc 2400agtggtttaa atatgcaata tctaatcgac attcgccaat ctcataaaag ccatctacct 2460tgtaactgaa gtaacttctc taccaacttt atttttagca taatagttgt aaaggccaaa 2520ctatgtataa agtgtccata gactcgaact gttttcctcc agtcaccatt ttgttttcct 2580tttggtaatt atttttgtta tataattcct cctatccaga attggcgctc actgtcttga 2640accatacttt gaaagaaatg cctcttcctg gagtctgcct tactgcatct gatcaccatg 2700tgcatacctc tgatcaaatt ctggagtctt tgttctcggt acctcttaaa aagggaaatt 2760gtgtatcatg tgtagtgtgc ttttattttc aaaatcttca tagcctttat tctagccatt 2820tttacctaca tactcattct gtacaaaaca gctcactcgg tctcacggct gatcctcagt 2880ggaaatgatt taaagtagag ctgtgtacga atttcagaat tcatgtattt aaaaacttca 2940cactaacact ttactaagat attgtctcat atcttttatg aggatgtcag ctgattttca 3000atgactataa atgtatctta gctatctaaa tcttttgaaa tttggtttta taatttctgg 3060tccctaactt gtgaagacaa agaggcagaa gtacccagtc taccacattt acactgtaca 3120ttattaaata aaaaaatgta tattttaaaa aaaaaaaaaa aaaaaaa 3167<210>120<211>3167<212>DNA<213>Rattus norvegicus<400>120gaattcatga gatggaaaca taggtcaaag ctgtttggag aaattggaac tacagtttta 60tctagccaca tctctgagaa gtctgaagaa agcagcaggt gaaagtcatt gtcaagtgat 120tttgttcttc tgtaaggaaa cctcgttcag taaggccgtt tacttcagtg aaacagcagg 180accagtaatc aaggtggccc ggacaggaca cgtgcgaatt ggacaatgac tcagctatac 240acttacatca gattactggg agcctgtctg ttcatcattt ctcatgttca agggcagaat 300ctagatagta tgctccatgg tactggtatg aaatcagacg tggaccagaa gaagccggaa 360aatggagtga cgttagcacc agaggacacc ttacctttct taaaatgcta ttgctcagga 420cactgcccag atgacgctat taataacaca tgcataacta atggccattg ctttgccatt 480atagaagaag atgatcaggg agaaaccacg ttaacttctg ggtgtatgaa gtatgaaggc 540tctgattttc aatgcaagga ttcaccaaaa gcccagctac gcaggacaat agaatgttgt 600cggaccaatt tgtgcaacca atatttgcag cctacactgc cccctgtcgt tataggccca 660ttctttgatg gcagcgtccg atggctggct gtgctcatct ctatggctgt ctgtattgtc 720gccatgatcg tcttctccag ctgcttctgt tacaaacatt actgtaagag tatctcaagc 780agaggtcgtt acaaccgtga cttggaacag gatgaagcat ttattccagt aggagaatca 840ctgaaagacc tgattgacca gtcacaaagc tctggtagtg gatctggatt acctttattg 900gttcagcgaa ctattgccaa acagattcag atggttcggc aggttggtaa aggccggtat 960ggagaagtat ggatgggtaa atggcgtggt gaaaaagtgg ctgtcaaagt attttttacc 1020
actgaagaag ctagctggtt tagagaaaca gaaatctacc agacggtgtt aatgcgtcat 1080gaaaatatac ttggttttat agctgcagac attaaaggca ccggttcctg gactcagctg 1140tatttgatta ctgattacca tgagaatggg tctctctatg acttcctgaa atgtgccacc 1200ctggacacca gagccctact caagttagct tattctgctg cctgtggtct gtgccacctc 1260cacacagaaa tttatggcac gcaaggcaag cctgcaattg ctcatcgaga cctgaagagc 1320aaaaacatcc ttattaagaa aaatggtagt tgctgtattg ctgacctggg cctagctgtt 1380aaattcaaca gtgacacaaa tgaagttgac atacccttga acaccagggt gggcaccagg 1440cggtacatgg ctccagaagt gctggacgag agcctgagta aaaaccattt ccagccctac 1500atcatggctg acatctacag ctttggtttg atcatttggg agatggcccg tcgctgtatt 1560acaggaggaa tcgtggagga atatcaatta ccatattaca acatggtgcc tagtgaccca 1620tcttatgaag acatgcgtga ggtcgtgtgt gtgaaacgct tgcggccaat cgtctctaac 1680cgctggaaca gtgatgaatg tcttcgagcc gttttgaagc tgatgtcaga atgctgggcc 1740cataatccag catccagact cacagctttg agaatcaaga agacgctcgc aaagatggtt 1800gaatcccagg atgtaaagat ttgacaaaca gttttgagaa agaatttaga ctgcaagaaa 1860ttcacccgag gaagggtgga gttagcatgg actaggatgt cggcttggtt tccagactct 1920ctcctctaca tcttcacagg ctgctaacag taaactttca ggactctgca gaatgcaggg 1980ttggagcttc agacatagga cttcagacat gctgttcttt gcgtatggac agctttgttt 2040taaatgtggg cttttgatgc ctttttggtt tttatgaatt gcatcaagac tccaatcctg 2100ataagaagtc tctggtcaaa ctctggttac tcactatcct gtccataaag tggtgctttc 2160tgtgaaagcc ttaaggaaat tagtgagctc agcagagatg gagaaaggca tatttgccct 2220ctacagagaa aatatctgtc tgtgttctgt ctctgtaaac agcctggact atgatctctt 2280tgggatgctg cctggttgat gatggtgcat catgcctctg atatgcatac cagacttcct 2340ctgctgccat gggcttacaa gacaagaatg tgaaggttgc acaggacggt atttgtggcc 2400agtggtttaa atatgcaata tctaatcgac attcgccaat ctcataaaag ccatctacct 2460tgtaactgaa gtaacttctc taccaacttt atttttagca taatagttgt aaaggccaaa 2520ctatgtataa agtgtccata gactcgaact gttttcctcc agtcaccatt ttgttttcct 2580tttggtaatt atttttgtta tataattcct cctatccaga attggcgctc actgtcttga 2640accatacttt gaaagaaatg cctcttcctg gagtctgcct tactgcatct gatcaccatg 2700tgcatacctc tgatcaaatt ctggagtctt tgttctcggt acctcttaaa aagggaaatt 2760gtgtatcatg tgtagtgtgc ttttattttc aaaatcttca tagcctttat tctagccatt 2820tttacctaca tactcattct gtacaaaaca gctcactcgg tctcacggct gatcctcagt 2880ggaaatgatt taaagtagag ctgtgtacga atttcagaat tcatgtattt aaaaacttca 2940cactaacact ttactaagat attgtctcat atcttttatg aggatgtcag ctgattttca 3000atgactataa atgtatctta gctatctaaa tcttttgaaa tttggtttta taatttctgg 3060tccctaactt gtgaagacaa agaggcagaa gtacccagtc taccacattt acactgtaca 3120ttattaaata aaaaaatgta tattttaaaa aaaaaaaaaa aaaaaaa 3167<210>121<211>3003<212>DNA<213>Rattus norvegicus<400>121cgttcagtaa ggccgtttac ttcagtgaaa cagcaggacc agtaatcaag gtggcccgga 60caggacacgt gcgaattgga caatgactca gctatacact tacatcagat tactgggagc 120ctgtctgttc atcatttctc atgttcaagg gcagaatcta gatagtatgc tccatggtac 180tggtatgaaa tcagacgtgg accagaagaa gccggaaaat ggagtgacgt tagcaccaga 240ggacacctta cctttcttaa aatgctattg ctcaggacac tgcccagatg acgctattaa 300taacacatgc ataactaatg gccattgctt tgccattata gaagaagatg atcagggaga 360aaccacgtta acttctgggt gtatgaagta tgaaggctct gattttcaat gcaaggattc 420accaaaagcc cagctacgca ggacaataga atgttgtcgg accaatttgt gcaaccaata 480tttgcagcct acactgcccc ctgtcgttat aggcccattc tttgatggca gcgtccgatg 540gctggctgtg ctcatctcta tggctgtctg tattgtcgcc atgatcgtct tctccagctg 600cttctgttac aaacattact gtaagagtat ctcaagcaga ggtcgttaca accgtgactt 660ggaacaggat gaagcattta ttccagtagg agaatcactg aaagacctga ttgaccagtc 720acaaagctct ggtagtggat ctggattacc tttattggtt cagcgaacta ttgccaaaca 780gattcagatg gttcggcagg ttggtaaagg ccggtatgga gaagtatgga tgggtaaatg 840
gcgtggtgaa aaagtggctg tcaaagtatt ttttaccact gaagaagcta gctggtttag 900agaaacagaa atctaccaga cggtgttaat gcgtcatgaa aatatacttg gttttatagc 960tgcagacatt aaaggcaccg gttcctggac tcagctgtat ttgattactg attaccatga 1020gaatgggtct ctctatgact tcctgaaatg tgccaccctg gacaccagag ccctactcaa 1080gttagcttat tctgctgcct gtggtctgtg ccacctccac acagaaattt atggcacgca 1140aggcaagcct gcaattgctc atcgagacct gaagagcaaa aacatcctta ttaagaaaaa 1200tggtagttgc tgtattgctg acctgggcct agctgttaaa ttcaacagtg acacaaatga 1260agttgacata cccttgaaca ccagggtggg caccaggcgg tacatggctc cagaagtgct 1320ggacgagagc ctgagtaaaa accatttcca gccctacatc atggctgaca tctacagctt 1380tggtttgatc atttgggaga tggcccgtcg ctgtattaca ggaggaatcg tggaggaata 1440tcaattacca tattacaaca tggtgcctag tgacccatct tatgaagaca tgcgtgaggt 1500cgtgtgtgtg aaacgcttgc ggccaatcgt ctctaaccgc tggaacagtg atgaatgtct 1560tcgagccgtt ttgaagctga tgtcagaatg ctgggcccat aatccagcat ccagactcac 1620agctttgaga atcaagaaga cgctcgcaaa gatggttgaa tcccaggatg taaagatttg 1680acaaacagtt ttgagaaaga atttagactg caagaaattc acccgaggaa gggtggagtt 1740agcatggact aggatgtcgg cttggtttcc agactctctc ctctacatct tcacaggctg 1800ctaacagtaa actttcagga ctctgcagaa tgcagggttg gagcttcaga cataggactt 1860cagacatgct gttctttgcg tatggacagc tttgttttaa atgtgggctt ttgatgcctt 1920tttggttttt atgaattgca tcaagactcc aatcctgata agaagtctct ggtcaaactc 1980tggttactca ctatcctgtc cataaagtgg tgctttctgt gaaagcctta aggaaattag 2040tgagctcagc agagatggag aaaggcatat ttgccctcta cagagaaaat atctgtctgt 2100gttctgtctc tgtaaacagc ctggactatg atctctttgg gatgctgcct ggttgatgat 2160ggtgcatcat gcctctgata tgcataccag acttcctctg ctgccatggg cttacaagac 2220aagaatgtga aggttgcaca ggacggtatt tgtggccagt ggtttaaata tgcaatatct 2280aatcgacatt cgccaatctc ataaaagcca tctaccttgt aactgaagta acttctctac 2340caactttatt tttagcataa tagttgtaaa ggccaaacta tgtataaagt gtccatagac 2400tcgaactgtt ttcctccagt caccattttg ttttcctttt ggtaattatt tttgttatat 2460aattcctcct atccagaatt ggcgctcact gtcttgaacc atactttgaa agaaatgcct 2520cttcctggag tctgccttac tgcatctgat caccatgtgc atacctctga tcaaattctg 2580gagtctttgt tctcggtacc tcttaaaaag ggaaattgtg tatcatgtgt agtgtgcttt 2640tattttcaaa atcttcatag cctttattct agccattttt acctacatac tcattctgta 2700caaaacagct cactcggtct cacggctgat cctcagtgga aatgatttaa agtagagctg 2760tgtacgaatt tcagaattca tgtatttaaa aacttcacac taacacttta ctaagatatt 2820gtctcatatc ttttatgagg atgtcagctg attttcaatg actataaatg tatcttagct 2880atctaaatct tttgaaattt ggttttataa tttctggtcc ctaacttgtg aagacaaaga 2940ggcagaagta cccagtctac cacatttaca ctgtacatta ttaaataaaa aaatgtatat 3000ttt 3003<210>122<211>2063<212>DNA<213>Homo sapiens<400>122gaattccggt gatgatgatg gtgatggtga tgatggtgat gaggatgatg gtgatgatga 60tgatggtgtt ggtgatggtt tttgcatctt ccattcatga actaagtact cttattagtg 120aatttctttt ctttgccctc ctgattcttg gctggcccag ggatgacttc ctcgctgcag 180cggccctggc gggtgccctg gctaccatgg accatcctgc tggtcagcac tgcggctgct 240tcgcagaatc aagaacggct atgtgcgttt aaagatccgt atcagcaaga ccttgggata 300ggtgagagta gaatctctca tgaaaatggg acaatattat gctcgaaagg tagcacctgc 360tatggccttt gggagaaatc aaaaggggac ataaatcttg taaaacaagg atgttggtct 420cacattggag atccccaaga gtgtcactat gaagaatgtg tagtaactac cactcctccc 480tcaattcaga atggaacata ccgtttctgc tgttgtagca cagatttatg taatgtcaac 540tttactgaga attttccacc tcctgacaca acaccactca gtccacctca ttcatttaac 600cgagatgaga caataatcat tgctttggca tcagtctctg tattagctgt tttgatagtt 660gccttatgct ttggatacag aatgttgaca ggagaccgta aacaaggtct tcacagtatg 720aacatgatgg aggcagcagc atccgaaccc tctcttgatc tagataatct gaaactgttg 780
gagctgattg gccgaggtcg atatggagca gtatataaag gctccttgga tgagcgtcca 840gttgctgtaa aagtgttttc ctttgcaaac cgtcagaatt ttatcaacga aaagaacatt 900tacagagtgc ctttgatgga acatgacaac attgcccgct ttatagttgg agatgagaga 960gtcactgcag atggacgcat ggaatatttg cttgtgatgg agtactatcc caatggatct 1020ttatgcaagt atttaagtct ccacacaagt gactgggtaa gctcttgccg tcttgctcat 1080tctgttacta gaggactggc ttatcttcac acagaattac cacgaggaga tcattataaa 1140cctgcaattt cccatcgaga tttaaacagc agaaatgtcc tagtgaaaaa tgatggaacc 1200tgtgttatta gtgactttgg actgtccatg aggctgactg gaaatagact ggtgcgccca 1260ggggaggaag ataatgcagc cataagcgag gttggcacta tcagatatat ggcaccagaa 1320gtgctagaag gagctgtgaa cttgagggac tgtgaatcag ctttgaaaca agtagacatg 1380tatgctcttg gactaatcta ttgggagata tttatgagat gtacagacct cttcccaggg 1440gaatccgtac cagagtacca gatggctttt cagacagagg ttggaaacca tcccactttt 1500gaggatatgc aggttctcgt gtctagggaa aaacagagac ccaagttccc agaagcctgg 1560aaagaaaata gcctggcagt gaggtcactc aaggagacaa tcgaagactg ttgggaccag 1620gatgcagagg ctcggcttac tgcacagtgt gctgaggaaa ggatggctga acttatgatg 1680atttgggaaa gaaacaaatc tgtgagccca acagtcaatc caatgtctac tgctatgcag 1740aatgaacgta ggtgagtcaa cacaagatgg caaatcagga tcaggtgaaa agatcaagaa 1800acgtgtgaaa actccctatt ctcttaagcg gtggcgcccc tccacctggg tcatctccac 1860tgaatcgctg gactgtgaag tcaacaataa tggcagtaac agggcagttc attccaaatc 1920cagcactgct gtttaccttg cagaaggagg cactgctaca accatggtgt ctaaagatat 1980aggaatgaac tgtctgtgaa atgttttcaa gcctatggag tgaaattatt ttttgcatca 2040tttaaacatg cagaagatgt tta 2063<210>123<211>1964<212>DNA<213>Homo sapiens<400>123atttcttttc tttgccctcc tgattcttgg ctggcccagg gatgacttcc tcgctgcagc 60ggccctggcg ggtgccctgg ctaccatgga ccatcctgct ggtcagcact gcggctgctt 120cgcagaatca agaacggcta tgtgcgttta aagatccgta tcagcaagac cttgggatag 180gtgagagtag aatctctcat gaaaatggga caatattatg ctcgaaaggt agcacctgct 240atggcctttg ggagaaatca aaaggggaca taaatcttgt aaaacaagga tgttggtctc 300acattggaga tccccaagag tgtcactatg aagaatgtgt agtaactacc actcctccct 360caattcagaa tggaacatac cgtttctgct gttgtagcac agatttatgt aatgtcaact 420ttactgagaa ttttccacct cctgacacaa caccactcag tccacctcat tcatttaacc 480gagatgagac aataatcatt gctttggcat cagtctctgt attagctgtt ttgatagttg 540ccttatgctt tggatacaga atgttgacag gagaccgtaa acaaggtctt cacagtatga 600acatgatgga ggcagcagca tccgaaccct ctcttgatct agataatctg aaactgttgg 660agctgattgg ccgaggtcga tatggagcag tatataaagg ctccttggat gagcgtccag 720ttgctgtaaa agtgttttcc tttgcaaacc gtcagaattt tatcaacgaa aagaacattt 780acagagtgcc tttgatggaa catgacaaca ttgcccgctt tatagttgga gatgagagag 840tcactgcaga tggacgcatg gaatatttgc ttgtgatgga gtactatccc aatggatctt 900tatgcaagta tttaagtctc cacacaagtg actgggtaag ctcttgccgt cttgctcatt 960ctgttactag aggactggct tatcttcaca cagaattacc acgaggagat cattataaac 1020ctgcaatttc ccatcgagat ttaaacagca gaaatgtcct agtgaaaaat gatggaacct 1080gtgttattag tgactttgga ctgtccatga ggctgactgg aaatagactg gtgcgcccag 1140gggaggaaga taatgcagcc ataagcgagg ttggcactat cagatatatg gcaccagaag 1200tgctagaagg agctgtgaac ttgagggact gtgaatcagc tttgaaacaa gtagacatgt 1260atgctcttgg actaatctat tgggagatat ttatgagatg tacagacctc ttcccagggg 1320aatccgtacc agagtaccag atggcttttc agacagaggt tggaaaccat cccacttttg 1380aggatatgca ggttctcgtg tctagggaaa aacagagacc caagttccca gaagcctgga 1440aagaaaatag cctggcagtg aggtcactca aggagacaat cgaagactgt tgggaccagg 1500atgcagaggc tcggcttact gcacagtgtg ctgaggaaag gatggctgaa cttatgatga 1560tttgggaaag aaacaaatct gtgagcccaa cagtcaatcc aatgtctact gctatgcaga 1620atgaacgtag gtgagtcaac acaagatggc aaatcaggat caggtgaaaa gatcaagaaa 1680
cgtgtgaaaa ctccctattc tcttaagcgg tggcgcccct ccacctgggt catctccact 1740gaatcgctgg actgtgaagt caacaataat ggcagtaaca gggcagttca ttccaaatcc 1800agcactgctg tttaccttgc agaaggaggc actgctacaa ccatggtgtc taaagatata 1860ggaatgaact gtctgtgaaa tgttttcaag cctatggagt gaaattattt tttgcatcat 1920ttaaacatgc agaagatgtt taaaaataaa aaaaaaactg cttt 1964<210>124<211>3611<212>DNA<213>Homo sapiens<400>124cgccccccga ccccggatcg aatccccgcc ctccgcaccc tggatatgtt ttctcccaga 60cctggatatt tttttgatat cgtgaaacta cgagggaaat aatttggggg atttcttctt 120ggctccctgc tttccccaca gacatgcctt ccgtttggag ggccgcggca ccccgtccga 180ggcgaaggaa cccccccagc cgcgagggag agaaatgaag ggaatttctg cagcggcatg 240aaagctctgc agctaggtcc tctcatcagc catttgtcct ttcaaactgt attgtgatac 300gggcaggatc agtccacggg agagaagacg agcctcccgg ctgtttctcc gccggtctac 360ttcccatatt tcttttcttt gccctcctga ttcttggctg gcccagggat gacttcctcg 420ctgcagcggc cctggcgggt gccctggcta ccatggacca tcctgctggt cagcactgcg 480gctgcttcgc agaatcaaga acggctatgt gcgtttaaag atccgtatca gcaagacctt 540gggataggtg agagtagaat ctctcatgaa aatgggacaa tattatgctc gaaaggtagc 600acctgctatg gcctttggga gaaatcaaaa ggggacataa atcttgtaaa acaaggatgt 660tggtctcaca ttggagatcc ccaagagtgt cactatgaag aatgtgtagt aactaccact 720cctccctcaa ttcagaatgg aacataccgt ttctgctgtt gtagcacaga tttatgtaat 780gtcaacttta ctgagaattt tccacctcct gacacaacac cactcagtcc acctcattca 840tttaaccgag atgagacaat aatcattgct ttggcatcag tctctgtatt agctgttttg 900atagttgcct tatgctttgg atacagaatg ttgacaggag accgtaaaca aggtcttcac 960agtatgaaca tgatggaggc agcagcatcc gaaccctctc ttgatctaga taatctgaaa 1020ctgttggagc tgattggccg aggtcgatat ggagcagtat ataaaggctc cttggatgag 1080cgtccagttg ctgtaaaagt gttttccttt gcaaaccgtc agaattttat caacgaaaag 1140aacatttaca gagtgccttt gatggaacat gacaacattg cccgctttat agttggagat 1200gagagagtca ctgcagatgg acgcatggaa tatttgcttg tgatggagta ctatcccaat 1260ggatctttat gcaagtattt aagtctccac acaagtgact gggtaagctc ttgccgtctt 1320gctcattctg ttactagagg actggcttat cttcacacag aattaccacg aggagatcat 1380tataaacctg caatttccca tcgagattta aacagcagaa atgtcctagt gaaaaatgat 1440ggaacctgtg ttattagtga ctttggactg tccatgaggc tgactggaaa tagactggtg 1500cgcccagggg aggaagataa tgcagccata agcgaggttg gcactatcag atatatggca 1560ccagaagtgc tagaaggagc tgtgaacttg agggactgtg aatcagcttt gaaacaagta 1620gacatgtatg ctcttggact aatctattgg gagatattta tgagatgtac agacctcttc 1680ccaggggaat ccgtaccaga gtaccagatg gcttttcaga cagaggttgg aaaccatccc 1740acttttgagg atatgcaggt tctcgtgtct agggaaaaac agagacccaa gttcccagaa 1800gcctggaaag aaaatagcct ggcagtgagg tcactcaagg agacaatcga agactgttgg 1860gaccaggatg cagaggctcg gcttactgca cagtgtgctg aggaaaggat ggctgaactt 1920atgatgattt gggaaagaaa caaatctgtg agcccaacag tcaatccaat gtctactgct 1980atgcagaatg aacgcaacct gtcacataat aggcgtgtgc caaaaattgg tccttatcca 2040gattattctt cctcctcata cattgaagac tctatccatc atactgacag catcgtgaag 2100aatatttcct ctgagcattc tatgtccagc acacctttga ctatagggga aaaaaaccga 2160aattcaatta actatgaacg acagcaagca caagctcgaa tccccagccc tgaaacaagt 2220gtcaccagcc tctccaccaa cacaacaacc acaaacacca caggactcac gccaagtact 2280ggcatgacta ctatatctga gatgccatac ccagatgaaa caaatctgca taccacaaat 2340gttgcacagt caattgggcc aacccctgtc tgcttacagc tgacagaaga agacttggaa 2400accaacaagc tagacccaaa agaagttgat aagaacctca aggaaagctc tgatgagaat 2460ctcatggagc actctcttaa acagttcagt ggcccagacc cactgagcag tactagttct 2520agcttgcttt acccactcat aaaacttgca gtagaagcaa ctggacagca ggacttcaca 2580cagactgcaa atggccaagc atgtttgatt cctgatgttc tgcctactca gatctatcct 2640ctccccaagc agcagaacct tcccaagaga cctactagtt tgcctttgaa caccaaaaat 2700
tcaacaaaag agccccggct aaaatttggc agcaagcaca aatcaaactt gaaacaagtc 2760gaaactggag ttgccaagat gaatacaatc aatgcagcag aacctcatgt ggtgacagtc 2820accatgaatg gtgtggcagg tagaaaccac agtgttaact cccatgctgc cacaacccaa 2880tatgccaatg ggacagtact atctggccaa acaaccaaca tagtgacaca tagggcccaa 2940gaaatgttgc agaatcagtt tattggtgag gacacccggc tgaatattaa ttccagtcct 3000gatgagcatg agcctttact gagacgagag caacaagctg gccatgatga aggtgttctg 3060gatcgtcttg tggacaggag ggaacggcca ctagaaggtg gccgaactaa ttccaataac 3120aacaacagca atccatgttc agaacaagat gttcttgcac agggtgttcc aagcacagca 3180gcagatcctg ggccatcaaa gcccagaaga gcacagaggc ctaattctct ggatctttca 3240gccacaaatg tcctggatgg cagcagtata cagataggtg agtcaacaca agatggcaaa 3300tcaggatcag gtgaaaagat caagaaacgt gtgaaaactc cctattctct taagcggtgg 3360cgcccctcca cctgggtcat ctccactgaa tcgctggact gtgaagtcaa caataatggc 3420agtaacaggg cagttcattc caaatccagc actgctgttt accttgcaga aggaggcact 3480gctacaacca tggtgtctaa agatatagga atgaactgtc tgtgaaatgt tttcaagcct 3540atggagtgaa attatttttt gcatcattta aacatgcaga agatgtttaa aaataaaaaa 3600aaaactgctt t 3611<210>125<211>3871<212>DNA<213>Homo sapiens<400>125ggcctccgca ccctggatat gttttctccc agacctggat atttttttga tatcgtgaaa 60ctacgaggga aataatttgg gggatttctt cttggctccc tgctttcccc acagacatac 120cttccgtttg gagggccgcg gcaccccgtc cgaggcgaag gaaccccccc atccgcgagg 180gagagaaatg aagggaattt ctgcagcggc atgaaagctc tgcagctagg tcctctcatc 240agccatttgt cctttcaaac tgtattgtga tacgggcagg atcagtccac gggagagaag 300acgagcctcc cggctgtttc tccgccggtc tacttcccat atttcttttc tttgccctcc 360tgattcttgg ctggcccagg gatgacttcc tcgctgcagc ggccctggcg ggtgccctgg 420ctaccatgga ccatcctgct ggtcagcact gcggctgctt cgcagaatca agaacggcta 480tgtgcgttta aagatccgta tcagcaagac cttgggatag gtgagagtag aatctctcat 540gaaaatggga caatattatg ctcgaaaggt agcacctgct atggcctttg ggagaaatca 600aaaggggaca taaatcttgt aaaacaagga tgttggtctc acattggaga tccccaagag 660tgtcactatg aagaatgtgt agtaactacc actcctccct caattcagaa tggaacatac 720cgtttctgct gttgtagcac agatttatgt aatgtcaact ttactgagaa ttttccacct 780cctgacacaa caccactcag tccacctcat tcatttaacc gagatgagac aataatcatt 840gctttggcat cagtctctgt attagctgtt ttgatagttg ccttatgctt tggatacaga 900atgttgacag gagaccgtaa acaaggtctt cacagtatga acatgatgga ggcagcagca 960tccgaaccct ctcttgatct agataatctg aaactgttgg agctgattgg ccgaggtcga 1020tatggagcag tatataaagg ctccttggat gagcgtccag ttgctgtaaa agtgttttcc 1080tttgcaaacc gtcagaattt tatcaacgaa aagaacattt acagagtgcc tttgatggaa 1140catgacaaca ttgcccgctt tatagttgga gatgagagag tcactgcaga tggacgcatg 1200gaatatttgc ttgtgatgga gtactatccc aatggatctt tatgcaagta tttaagtctc 1260cacacaagtg actgggtaag ctcttgccgt cttgctcatt ctgttactag aggactggct 1320tatcttcaca cagaattacc acgaggagat cattataaac ctgcaatttc ccatcgagat 1380ttaaacagca gaaatgtcct agtgaaaaat gatggaacct gtgttattag tgactttgga 1440ctgtccatga ggctgactgg aaatagactg gtgcgcccag gggaggaaga taatgcagcc 1500ataagcgagg ttggcactat cagatatatg gcaccagaag tgctagaagg agctgtgaac 1560ttgagggact gtgaatcagc tttgaaacaa gtagacatgt atgctcttgg actaatctat 1620tgggagatat ttatgagatg tacagacctc ttcccagggg aatccgtacc agagtaccag 1680atggcttttc agacagaggt tggaaaccat cccacttttg aggatatgca ggttctcgtg 1740tctagggaaa aacagagacc caagttccca gaagcctgga aagaaaatag cctggcagtg 1800aggtcactca aggagacaat cgaagactgt tgggaccagg atgcagaggc tcggcttact 1860gcacagtgtg ctgaggaaag gatggctgaa cttatgatga tttgggaaag aaacaaatct 1920gtgagcccaa cagtcaatcc aatgtctact gctatgcaga atgaacgcaa cctgtcacat 1980aataggcgtg tgccaaaaat tggtccttat ccagattatt cttcctcctc atacattgaa 2040
gactctatcc atcatactga cagcatcgtg aagaatattt cctctgagca ttctatgtcc 2100agcacacctt tgactatagg ggaaaaaaac cgaaattcaa ttaactatga acgacagcaa 2160gcacaagctc gaatccccag ccctgaaaca agtgtcacca gcctctccac caacacaaca 2220accacaaaca ccacaggact cacgccaagt actggcatga ctactatatc tgagatgcca 2280tacccagatg aaacaaatct gGataccaca aatgttgcac agtcaattgg gccaacccct 2340gtctgcttac agctgacaga agaagacttg gaaaccaaca agctagaccc aaaagaagtt 2400gataagaacc tcaaggaaag ctctgatgag aatctcatgg agcactctct taaacagttc 2460agtggcccag acccactgag cagtactagt tctagcttgc tttacccact cataaaactt 2520gcagtagaag caactggaca gcaggacttc acacagactg caaatggcca agcatgtttg 2580attcctgatg ttctgcctac tcagatctat cctctcccca agcagcagaa ccttcccaag 2640agacctacta gtttgccttt gaacaccaaa aattcaacaa aagagccccg gctaaaattt 2700ggcagcaagc acaaatcaaa cttgaaacaa gtcgaaactg gagttgccaa gatgaataca 2760atcaatgcag cagaacctca tgtggtgaca gtcaccatga atggtgtggc aggtagaaac 2820cacagtgtta actcccatgc tgccacaacc caatatgcca ataggacagt actatctggc 2880caaacaacca acatagtgac acatagggcc caagaaatgt tgcagaatca gtttattggt 2940gaggacaccc ggctgaatat taattccagt cctgatgagc atgagccttt actgagacga 3000gagcaacaag ctggccatga tgaaggtgtt ctggatcgtc ttgtggacag gagggaacgg 3060ccactagaag gtggccgaac taattccaat aacaacaaca gcaatccatg ttcagaacaa 3120gatgttcttg cacagggtgt tccaagcaca gcagcagatc ctgggccatc aaagcccaga 3180agagcacaga ggcctaattc tctggatctt tcagccacaa atgtcctgga tggcagcagt 3240atacagatag gtgagtcaac acaagatggc aaatcaggat caggtgaaaa gatcaagaaa 3300cgtgtgaaaa ctccctattc tcttaagcgg tggcgcccct ccacctgggt catctccact 3360gaatcgctgg actgtgaagt caacaataat gccagtaaca gggcagttca ttccaaatcc 3420agcactgctg tttaccttgc agaaggaggc actgctacaa ccatggtgtc taaagatata 3480ggaatgaact gtctgtgaaa tgttttcaag cctatggagt gaaattattt tttgcatcat 3540ttaaacatgc agaagatgtt taccgggcgg ggtgacagga gagagcgtca gcggcaagct 3600gtggaggatg gggctcagaa tgcagacctg ggctggccgc atggcctctc cctgagccct 3660gatttgtggt agggaagcag tatgggtgca gtcccctcct aggcctccct ctggggtccc 3720ccgatcctat cccacctctt cagggtgagc cagcctcacc tcttcctagt cctgagggtg 3780agggcaggct gaggcaacga gtgggaggtt caaacaagag tgggctggag ccaagggaaa 3840atagagatga tgtaatttct ttccggaatt c3871<210>126<211>88<212>PRT<213>Homo sapiens<400>126Cys Arg Glu Leu His Phe Thr Arg Tyr Val Thr Asp Gly Pro Cys Arg1 5 10 15Ser Ala Lys Pro Val Thr Glu Leu Val Cys Ser Gly Gln Cys Gly Pro20 25 30Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg Gly Lys Trp Trp Arg Pro35 40 45Ser Gly Pro Asp Phe Arg Cys Ile Pro Asp Arg Tyr Arg Ala Gln Arg50 55 60Val Gln Leu Leu Cys Pro Gly Gly Glu Ala Pro Arg Ala Arg Lys Val65 70 75 80Arg Leu Val Ala Ser Cys Lys Cys85<210>127<211>82<212>PRT<213>Homo sapiens
<400>127Cys Arg Pro Ile Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro1 5 10 15Val Cys Ile Thr Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr20 25 30Met Thr Arg Val Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val35 40 45Cys Asn Tyr Arg Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys50 55 60Pro Arg Gly Val Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys65 70 75 80Gln Cys<210>128<211>82<212>PRT<213>Homo sapiens<400>128Cys Glu Leu Thr Asn Ile Thr Ile Ala Ile Glu Lys Glu Glu Cys Arg1 5 10 15Phe Cys Ile Ser Ile Asn Thr Thr Trp Cys Ala Gly Tyr Cys Tyr Thr20 25 30Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys Ile Gln Lys Thr35 40 45Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg Val Pro Gly Cys50 55 60Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val Ala Thr Gln Cys65 70 75 80His Cys<210>129<211>84<212>PRT<213>Homo sapiens<400>129Cys Ile Pro Thr Glu Tyr Thr Met His Ile Glu Arg Arg Glu Cys Ala1 5 10 15Tyr Cys Leu Thr Ile Asn Thr Thr Ile Cys Ala Gly Tyr Cys Met Thr20 25 30Arg Asp Ile Asn Gly Lys Leu Phe Leu Pro Lys Tyr Ala Leu Ser Gln35 40 45Asp Val Cys Thr Tyr Arg Asp Phe Ile Tyr Arg Thr Val Glu Ile Pro50 55 60Gly Cys Pro Leu His Val Ala Pro Tyr Phe Ser Tyr Pro Val Ala Leu65 70 75 80Ser Cys Lys Cys<210>130<211>83
<212>PRT<213>Homo sapiens<400>130Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr Val Lys Val Gly Ser Cys1 5 10 15Lys Ser Glu Val Glu Val Asp Ile His Tyr Cys Gln Gly Lys Cys Ala20 25 30Ser Lys Ala Met Tyr Ser Ile Asp Ile Asn Asp Val Gln Asp Gln Cys35 40 45Ser Cys Cys Ser Pro Thr Arg Thr Glu Pro Met Gln Val Ala Leu His50 55 60Cys Thr Asn Gly Ser Val Val Tyr His Glu Val Leu Asn Ala Met Glu65 70 75 80Cys Lys Cys<210>131<211>80<212>PRT<213>Homo sapiens<400>131Cys Ser Thr Val Pro Val Thr Thr Glu Val Ser Tyr Ala Gly Cys Thr1 5 10 15Lys Thr Val Leu Met Asn His Cys Ser Gly Ser Cys Gly Thr Phe Val20 25 30Met Tyr Ser Ala Lys Ala Gln Ala Leu Asp His Ser Cys Ser Cys Cys35 40 45Lys Glu Glu Lys Thr Ser Gln Arg Glu Val Val Leu Ser Cys Pro Asn50 55 60Gly Gly Ser Leu Thr His Thr Tyr Thr His Ile Glu Ser Cys Gln Cys65 70 75 80<210>132<211>80<212>PRT<213>Homo sapiens<400>132Cys Arg Thr Val Pro Phe Ser Gln Thr Ile Thr His Glu Gly Cys Glu1 5 10 15Lys Val Val Val Gln Asn Asn Leu Cys Phe Gly Lys Cys Gly Ser Val20 25 30His Phe Pro Gly Ala Ala Gln His Ser His Thr Ser Cys Ser His Cys35 40 45Leu Pro Ala Lys Phe Thr Thr Met His Leu Pro Leu Asn Cys Thr Glu50 55 60Leu Ser Ser Val Ile Lys Val Val Met Leu Val Glu Glu Cys Gln Cys65 70 75 80<210>133<211>85<212>PRT
<213>Homo sapiens<400>133Cys Lys Thr Gln Pro Leu Lys Gln Thr Ile His Glu Glu Gly Cys Asn1 5 10 15Ser Arg Thr Ile Ile Asn Arg Phe Cys Tyr Gly Gln Cys Asn Ser Phe20 25 30Tyr Ile Pro Arg His Ile Arg Lys Glu Glu Gly Ser Phe Gln Ser Cys35 40 45Ser Phe Cys Lys Pro Lys Lys Phe Thr Thr Met Met Val Thr Leu Asn50 55 60Cys Pro Glu Leu Gln Pro Pro Thr Lys Lys Lys Arg Val Thr Arg Val65 70 75 80Lys Gln Cys Arg Cys85<210>134<211>86<212>PRT<213>Homo sapiens<400>134Cys Glu Ala Lys Asn Ile Thr Gln Ile Val Gly His Ser Gly Cys Glu1 5 10 15Ala Lys Ser Ile Gln Asn Arg Ala Cys Leu Gly Gln Cys Phe Ser Tyr20 25 30Ser Val Pro Asn Thr Phe Pro Gln Ser Thr Glu Ser Leu Val His Cys35 40 45Asp Ser Cys Met Pro Ala Gln Ser Met Trp Glu Ile Val Thr Leu Glu50 55 60Cys Pro Gly His Glu Glu Val Pro Arg Val Asp Lys Leu Val Glu Lys65 70 75 80Ile Leu His Cys Ser Cys85<210>135<211>70<212>PRT<213>Homo sapies<400>135Cys Ile Arg Thr Pro Lys Ile Ser Lys Pro Ile Lys Phe Glu Leu Ser1 5 10 15Gly Cys Thr Ser Met Lys Thr Tyr Arg Ala Lys Phe Cys Gly Val Cys20 25 30Thr Asp Gly Arg Cys Cys Thr Pro His Arg Thr Thr Thr Leu Pro Val35 40 45Glu Phe Lys Cys Pro Asp Gly Glu Val Met Lys Lys Asn Met Met Phe50 55 60Ile Lys Thr Cys Ala Cys65 70<210>136<211>70
<212>PRT<213>Homo sapiens<400>136Cys Leu Arg Thr Lys Lys Ser Leu Lys Ala Ile His Leu Gln Phe Lys1 5 10 15Asn Cys Thr Ser Leu His Thr Tyr Lys Pro Arg Phe Cys Gly Val Cys20 25 30Ser Asp Gly Arg Cys Cys Thr Pro His Asn Thr Lys Thr Ile Gln Ala35 40 45Glu Phe Gln Cys Ser Pro Gly Gln Ile Val Lys Lys Pro Val Met Val50 55 60Ile Gly Thr Cys Thr Cys65 70<210>137<211>70<212>PRT<213>Homo sapiens<400>137Cys Ser Lys Thr Lys Lys Ser Pro Glu Pro Val Arg Phe Thr Tyr Ala1 5 10 15Gly Cys Leu Ser Val Lys Lys Tyr Arg Pro Lys Tyr Cys Gly Ser Cys20 25 30Val Asp Gly Arg Cys Cys Thr Pro Gln Leu Thr Arg Thr Val Lys Met35 40 45Arg Phe Arg Cys Glu Asp Gly Glu Thr Phe Ser Lys Asn Val Met Met50 55 60Ile Gln Ser Cys Lys Cys65 70<210>138<211>205<212>PRT<213>Homo sapiens<400>138Gln His Tyr Leu His Ile Arg Pro Ala Pro Ser Asp Asn Leu Pro Leu1 5 10 15Val Asp Leu Ile Glu His Pro Asp Pro Ile Phe Asp Pro Lys Glu Lys20 25 30Asp Leu Asn Glu Thr Leu Leu Arg Ser Leu Leu Gly Gly His Tyr Asp35 40 45Pro Gly Phe Met Ala Thr Ser Pro Pro Glu Asp Arg Pro Gly Gly Gly50 55 60Gly Gly Ala Ala Gly Gly Ala Glu Asp Leu Ala Glu Leu Asp Gln Leu65 70 75 80Leu Arg Gln Arg Pro Ser Gly Ala Met Pro Ser Glu Ile Lys Gly Leu85 90 95Glu Phe Ser Glu Gly Leu Ala Gln Gly Lys Lys Gln Arg Leu Ser Lys100 105 110Lys Leu Arg Arg Lys Leu Gln Met Trp Leu Trp Ser Gln Thr Phe Cys115 120 125Pro Val Leu Tyr Ala Trp Asn Asp Leu Gly Ser Arg Phe Trp Pro Arg
130 135 140Tyr Val Lys Val Gly Ser Cys Phe Ser Lys Arg Ser Cys Ser Val Pro145 150 155 160Glu Gly Met Val Cys Lys Pro Ser Lys Ser Val His Leu Thr Val Leu165 170 175Arg Trp Arg Cys Gln Arg Arg Gly Gly Gln Arg Cys Gly Trp Ile Pro180 185 190Ile Gln Tyr Pro Ile Ile Ser Glu Cys Lys Cys Ser Cys195 200 205<210>139<211>197<212>PRT<213>Gallus gallus<400>139Gln His Tyr Leu His Ile Arg Pro Ala Pro Ser Asp Asn Leu Pro Leu1 5 10 15Val Asp Leu Ile Glu His Pro Asp Pro Ile Phe Asp Pro Lys Glu Lys20 25 30Asp Leu Asn Glu Thr Leu Leu Arg Ser Leu Met Gly Gly His Phe Asp35 40 45Pro Asn Phe Met Ala Met Ser Leu Pro Glu Asp Arg Leu Gly Val Asp50 55 60Asp Leu Ala Glu Leu Asp Leu Leu Leu Arg Gln Arg Pro Ser Gly Ala65 70 75 80Met Pro Gly Glu Ile Lys Gly Leu Glu Phe Tyr Asp Gly Leu Gln Pro85 90 95Gly Lys Lys His Arg Leu Ser Lys Lys Leu Arg Arg Lys Leu Gln Met100 105 110Trp Leu Trp Ser Gln Thr Phe Cys Pro Val Leu Tyr Thr Trp Asn Asp115 120 125Leu Gly Ser Arg Phe Trp Pro Arg Tyr Val Lys Val Gly Ser Cys Tyr130 135 140Ser Lys Arg Ser Cys Ser Val Pro Glu Gly Met Val Cys Lys Pro Ala145 150 155 160Lys Ser Val His Leu Thr Ile Leu Arg Trp Arg Cys Gln Arg Arg Gly165 170 175Gly Gln Arg Cys Thr Trp Ile Pro Ile Gln Tyr Pro IIe IIe AIa GIu180 185 190Cys Lys Cys Ser Cys195<210>140<211>196<212>PRT<213>Xenopus laeVis<400>140Gln His Tyr Leu His Ile Arg Pro Ala Pro Ser Glu Asn Leu Pro Leu1 5 10 15Val Asp Leu Ile Glu His Pro Asp Pro Ile Tyr Asp Pro Lys Glu Lys20 25 30Asp Leu Asn Glu Thr Leu Leu Arg Thr Leu Met Val Gly His Phe Asp35 40 45
Pro Asn Phe Met Ala Thr Ile Leu Pro Glu Glu Arg Leu Gly Val Glu50 55 60Asp Leu Gly Glu Leu Asp Leu Leu Leu Arg Gln Lys Pro Ser Gly Ala65 70 75 80Met Pro Ala Glu Ile Lys Gly Leu Glu Phe Tyr Glu Gly Leu Gln Ser85 90 95Lys Lys His Arg Leu Ser Lys Lys Leu Arg Arg Lys Leu Gln Met Trp100 105 110Leu Trp Ser Gln Thr Phe Cys Pro Val Leu Tyr Thr Trp Asn Asp Leu115 120 125Gly Thr Arg Phe Trp Pro Arg Tyr Val Lys Val Gly Ser Cys Tyr Ser130 135 140Lys Arg Ser Cys Ser Val Pro Glu Gly Met Val Cys Lys Ala Ala Lys145 150 155 160Ser Met His Leu Thr Ile Leu Arg Trp Arg Cys Gln Arg Arg Val Gln165 170 175Gln Lys Cys Ala Trp Ile Thr Ile Gln Tyr Pro Val Ile Ser Glu Cys180 185 190Lys Cys Ser Cys195<210>141<211>195<212>PRT<213>Takifugu rubripes<400>141Gln Pro Tyr Tyr Leu Leu Arg Pro Ile Pro Ser Asp Ser Leu Pro Ile1 5 10 15Val Glu Leu Lys Glu Asp Pro Gly Pro Val Phe Asp Pro Lys Glu Arg20 25 30Asp Leu Asn Glu Thr Glu Leu Lys Ser Val Leu Gly Asp Phe Asp Ser35 40 45Arg Phe Leu Ser Val Leu Pro Pro Ala Glu Asp Gly His Ala Gly Asn50 55 60Asp Glu Leu Asp Asp Phe Asp Ala Gln Arg Trp Gly Gly Ala Leu Pro65 70 75 80Lys Glu Ile Arg Ala Val Asp Phe Asp Ala Pro Gln Leu Gly Lys Lys85 90 95His Lys Pro Ser Lys Lys Leu Lys Arg Arg Leu Gln Gln Trp Leu Trp100 105 110Ala Tyr Ser Phe Cys Pro Leu Ala His Ala Trp Thr Asp Leu Gly Ser115 120 125Arg Phe Trp Pro Arg Phe Val Arg Ala Gly Ser Cys Leu Ser Lys Arg130 135 140Ser Cys Ser Val Pro Glu Gly Met Thr Cys Lys Pro Ala Thr Ser Thr145 150 155 160His Leu Thr Ile Leu Arg Trp Arg Cys Val Gln Arg Lys Val Gly Leu165 170 175Lys Cys Ala Trp Ile Pro Met Gln Tyr Pro Val Ile Thr Asp Cys Lys180 185 190Cys Ser Cys195<210>142
<211>196<212>PRT<213>Danio rerio<400>142Gln His Tyr Tyr Leu Leu Arg Pro Ile Pro Ser Asp Ser Leu Pro Ile1 5 10 15Val Glu Leu Lys Glu Asp Pro Asp Pro Val Leu Asp Pro Lys Glu Arg20 25 30Asp Leu Asn Glu Thr Glu Leu Arg Ala Ile Leu Gly Ser His Phe Glu35 40 45Gln Asn Phe Met Ser Ile Asn Pro Pro Glu Asp Lys His Ala Gly Gln50 55 60Asp Glu Leu Asn Glu Ser Glu Leu Met Lys Gln Arg Pro Asn Gly Ile65 70 75 80Met Pro Lys Glu Ile Lys Ala Met Glu Phe Asp Ile Gln His Gly Lys85 90 95Lys His Lys Pro Ser Lys Lys Leu Arg Arg Arg Leu Gln Leu Trp Leu100 105 110Trp Ser Tyr Thr Phe Cys Pro Val Val His Thr Trp Gln Asp Leu Gly115 120 125Asn Arg Phe Trp Pro Arg Tyr Leu Lys Val Gly Ser Cys Tyr Asn Lys130 135 140Arg Ser Cys Ser Val Pro Glu Gly Met Val Cys Lys Pro Pro Lys Ser145 150 155 160Ser His Leu Thr Val Leu Arg Trp Arg Cys Val Gln Arg Lys Gly Gly165 170 175Leu Lys Cys Ala Trp Ile Pro Val Gln Tyr Pro Val Ile Ser Glu Cys180 185 190Lys Cys Ser Cys195<210>143<211>188<212>PRT<213>Mus musculus<400>143Gln Gly Trp Gln Ala Phe Arg Asn Asp Ala Thr Glu Val Ile Pro Gly1 5 10 15Leu Gly Glu Tyr Pro Glu Pro Pro Pro Glu Asn Asn Gln Thr Met Asn20 25 30Arg Ala Glu Asn Gly Gly Arg Pro Pro His His Pro Tyr Asp Ala Lys35 40 45Gly Val Ser Glu Tyr Ser Cys Arg Glu Leu His Tyr Thr Arg Phe Leu50 55 60Thr Asp Gly Pro Cys Arg Ser Ala Lys Pro Val Thr Glu Leu Val Cys65 70 75 80Ser Gly Gln Cys Gly Pro Ala Arg Leu Leu Pro Asn Ala Ile Gly Arg85 90 95Val Lys Trp Trp Arg Pro Asn Gly Pro Asp Phe Arg Cys Ile Pro Asp100 105 110Arg Tyr Arg Ala Gln Arg Val Gln Leu Leu Cys Pro Gly Gly Ala Ala115 120 125Pro Arg Ser Arg Lys Val Arg Leu Val Ala Ser Cys Lys Cys Lys Arg130 135 140
Leu Thr Arg Phe His Asn Gln Ser Glu Leu Lys Asp Phe Gly Pro Glu145 150 155 160Thr Ala Arg Pro Gln Lys Gly Arg Lys Pro Arg Pro Gly Ala Arg Gly165 170 175Ala Lys Ala Asn Gln Ala Glu Leu Glu Asn Ala Tyr180 18權(quán)利要求
1.與硬化素多肽特異結(jié)合的抗體或其抗原結(jié)合片段,所述硬化素多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述抗體競爭性抑制該硬化素多肽與(i)骨形態(tài)發(fā)生蛋白(BMP)I型受體結(jié)合位點和(ii)BMP II型受體結(jié)合位點中至少其一的結(jié)合,其中BMP I型受體結(jié)合位點能夠與包含選自下組的序列中所示的氨基酸序列的BMP I型受體多肽結(jié)合GenBank編號NM_004329(SEQ ID NO102)、D89675(SEQ ID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ ID NO106)、D38082(SEQID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)、和AAB33865(SEQ ID NO110),而且其中BMP II型受體結(jié)合位點能夠與包含選自下組的序列中所示的氨基酸序列的BMP II型受體多肽結(jié)合GenBank編號U25110(SEQ ID NO111)、NM_033346(SEQID NO112)、Z48923(SEQ ID NO114)、CAA88759(SEQ ID NO115)、和NM_001204(SEQ ID NO113)。
2.與硬化素多肽特異性結(jié)合且削弱硬化素均二聚體形成的抗體或其抗原結(jié)合片段,其中所述硬化素多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列。
3.權(quán)利要求1或2的抗體,其中所述抗體是多克隆抗體。
4.權(quán)利要求1或2的抗體,其中所述抗體是單克隆抗體。
5.權(quán)利要求4的抗體,其中所述單克隆抗體選自下組小鼠單克隆抗體、人單克隆抗體、大鼠單克隆抗體、和倉鼠單克隆抗體。
6.生成權(quán)利要求4所述抗體的雜交瘤細胞。
7.能夠表達權(quán)利要求4所述抗體的宿主細胞。
8.權(quán)利要求1或2的抗體,其中所述抗體是人源化抗體或嵌合抗體。
9.能夠表達權(quán)利要求8抗體的宿主細胞。
10.權(quán)利要求1或2的抗體,其中所述抗原結(jié)合片段選自下組F(ab′)2、Fab′、Fab、Fd、和Fv。
11.權(quán)利要求1或2的抗體,其中包含單鏈抗體。
12.能夠表達權(quán)利要求11所述抗體的宿主細胞。
13.包含依照權(quán)利要求1或2的抗體或其抗原結(jié)合片段以及生理學(xué)可接受載體的組合物。
14.包含含有SOST多肽的至少21個連續(xù)氨基酸且不超過50個連續(xù)氨基酸的肽的免疫原,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述肽能夠在非人動物中引發(fā)與SOST多肽特異結(jié)合、并競爭性抑制SOST多肽與(i)骨形態(tài)發(fā)生蛋白(BMP)I型受體結(jié)合位點和(ii)BMP II型受體結(jié)合位點中至少其一的結(jié)合的抗體,其中BMP I型受體結(jié)合位點能夠與包含選自下組的序列中所示的氨基酸序列的BMP I型受體多肽結(jié)合GenBank編號NM_004329(SEQ ID NO102)、D89675(SEQ ID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ IDNO106)、D38082(SEQ ID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)、和AAB33865(SEQ ID NO110),而且其中BMP II型受體結(jié)合位點能夠與包含選自下組的序列中所示的氨基酸序列的BMP II型受體多肽結(jié)合GenBank編號U25110(SEQ ID NO111)、NM_033346(SEQ ID NO112)、Z48923(SEQ ID NO114)、CAA88759(SEQ ID NO115)、和NM_001204(SEQ ID NO113)。
15.包含含有SOST多肽的至少21個連續(xù)氨基酸且不超過50個連續(xù)氨基酸的肽的免疫原,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,其中所述肽能夠在非人動物中引發(fā)與SOST多肽特異結(jié)合并削弱硬化素均二聚體形成的抗體。
16.權(quán)利要求14或15的免疫原,其中所述肽與載體分子相連。
17.權(quán)利要求16的免疫原,其中所述載體分子是載體多肽。
18.權(quán)利要求17的免疫原,其中所述載體多肽是匙孔_血藍蛋白。
19.用于生成與SOST多肽特異結(jié)合的抗體的方法,包括用依照權(quán)利要求14的免疫原免疫非人動物,其中(a)所述SOST多肽包含SEQ IDNO2、6、8、14、46、或65所示氨基酸序列;(b)所述抗體競爭性抑制SOST多肽與(i)骨形態(tài)發(fā)生蛋白(BMP)I型受體結(jié)合位點和(ii)BMPII型受體結(jié)合位點中至少其一的結(jié)合;(c)BMP I型受體結(jié)合位點能夠與包含選自下組的序列中所示的氨基酸序列的BMP I型受體多肽結(jié)合GenBank編號NM_004329(SEQ ID NO102)、D89675(SEQ ID NO103)、NM_001203(SEQ ID NO104)、S75359(SEQ ID NO105)、NM_030849(SEQ ID NO106)、D38082(SEQ ID NO107)、NP_001194(SEQ ID NO108)、BAA19765(SEQ ID NO109)、和AAB33865(SEQID NO110);且(d)BMP II型受體結(jié)合位點能夠與包含選自下組的序列中所示的氨基酸序列的BMP II型受體多肽結(jié)合GenBank編號U25110(SEQ ID NO111)、NM_033346(SEQ ID NO112)、Z48923(SEQID NO114)、CAA88759(SEQ ID NO115)、和NM_001204(SEQ ID NO113)。
20.用于生成與SOST多肽特異結(jié)合的抗體的方法,所述SOST多肽包含SEQ ID NO2、6、8、14、46、或65所示氨基酸序列,該方法包括用依照權(quán)利要求15的免疫原免疫非人動物,其中所述抗體可削弱硬化素均二聚體的形成。
全文摘要
本發(fā)明公開了TGF-β結(jié)合蛋白的新類別或家族。本發(fā)明還公開了用于選擇可增加骨礦化的分子的測定法以及利用這些分子的方法。具體而言,本發(fā)明提供了涉及與TGF-β結(jié)合蛋白特異結(jié)合的抗體的組合物和方法。這些方法和組合物涉及通過干擾TGF-β結(jié)合蛋白硬化素與TGF-β超家族成員特別是骨形態(tài)發(fā)生蛋白之間的相互作用來改變骨礦物質(zhì)密度。增加骨礦物質(zhì)密度對于以骨礦物質(zhì)密度低為特征的疾病和狀況諸如骨質(zhì)減少、骨質(zhì)疏松和骨折而言是有用的。
文檔編號A61K48/00GK1835968SQ200480023326
公開日2006年9月20日 申請日期2004年6月15日 優(yōu)先權(quán)日2003年6月16日
發(fā)明者M·E·布倫考, D·J·加拉斯, B·科瓦切維奇, J·T·馬利根, B·W·佩珀, J·范內(nèi)斯, D·G·溫克勒 申請人:細胞技術(shù)研究與發(fā)展公司