專利名稱:金屬蛋白酶家族中的新型人酶的制作方法
技術領域:
本發(fā)明涉及最近鑒定的多肽和編碼這些多肽的多核苷酸,它們在治療中和在鑒定可能是潛在可用于治療的刺激物和/或抑制物的化合物中的用途,以及這些多肽和多核苷酸的生成。更具體的說,本發(fā)明的多肽和多核苷酸所涉及的酶是金屬蛋白酶多肽家族或結構和功能相關多肽的特定家族的成員。這些酶在下文中稱為IGS5。本發(fā)明還涉及抑制或刺激/激活這些多肽和多核苷酸的作用,包含所述多核苷酸的載體,以及包含所述載體的宿主細胞。本發(fā)明還涉及用于篩選能夠擔當所述IGS5酶的刺激物或抑制物的化合物的方法。
背景技術:
藥物開發(fā)過程目前正經歷基本變化,因為它采用了“功能基因組學”,即基于高通量基因組或基因的生物學。這種方法作為鑒定作為治療靶的基因和基因產物的手段,正迅速取代基于“位置克隆”的早期方法。首先鑒定表型,即生物學功能或遺傳學疾病,然后根據(jù)遺傳圖定位追蹤對此負有責任的基因。
功能基因組學非常依賴高通量DNA測序技術和用于由目前可利用的許多分子生物學數(shù)據(jù)庫鑒定潛在關注的基因序列的多種生物信息學工具。仍舊需要鑒定和表征作為藥物開發(fā)的靶的其它基因及其相關多肽/蛋白質。
在藥物開發(fā)所關注的多肽中,存在金屬蛋白酶及結構和功能相關酶的特定家族。已經鑒定了幾種疾病,其中金屬蛋白酶在該疾病的病理學中擔當關鍵角色。例如,現(xiàn)有技術中已經鑒定和表征了許多鋅金屬蛋白酶或結構和功能相關酶的特定家族,而且已經變得顯然的是,這些酶(如鋅金屬蛋白酶)的參與在涵蓋正常和疾病兩種狀況的生物學功能多樣性中擔當角色。鋅金屬蛋白酶是這些酶中催化功能嚴重依賴位于活性位點的鋅離子的子集。這組酶包括根據(jù)序列和結構信息分類的多個家族,而且據(jù)描述密切涉及諸如胚胎的發(fā)育、軟骨和骨的形成、肽激素的加工、生殖、心血管疾病、關節(jié)炎、癌癥等過程。針對有些鋅金屬蛋白酶的活性位點定向抑制物早已用于治療,如用作抗高血壓藥物。
根據(jù)鋅金屬蛋白酶中鋅結合位點周圍的序列和結構信息,可以將這些酶分成幾個家族,進而可以分成超家族,諸如“metzincin”(astacin、serratia、reprolysin、基質素)、“gluzincin”(嗜熱芽孢菌蛋白酶、neprilysin、血管緊張素轉化酶、氨肽酶)、或“zincin”(包含metzincin和gluzincin超家族)。這種分組不僅有助于闡明常見的催化和生物合成加工機制,而且在闡明最近鑒定的具有相似鋅結合基元的蛋白質的功能中是無價的。本領域早已鑒定的金屬蛋白酶(如鋅酶)的一些個別范例包括neprilysin、內皮素轉化酶、血管緊張素轉化酶、嗜熱芽孢菌蛋白酶、氨肽酶、astacin、serratia、reprolysin、基質素、胰島素酶、羧肽酶、和DD-羧肽酶。
根據(jù)本領域的上述證據(jù),顯然,金屬蛋白酶和特定結構和功能相關酶在健康和疾病中擔當關鍵角色。因而,仍然需要進一步揭開這組酶的重要功能和潛在治療應用以及對提供新型金屬蛋白酶和隨后開發(fā)的新型合成刺激物(激活物)或抑制物,它們有助于為多種社會經濟學重要疾病提供新型療法。
發(fā)明概述一方面,本發(fā)明涉及IGS5,特別是IGS5多肽和IGS5多核苷酸,優(yōu)選涉及人類物種的那些,以及用于生成它們的重組材料和方法。另一方面,本發(fā)明涉及使用這些多肽、多核苷酸、和重組材料的方法,包括治療疾病,其中多肽像金屬蛋白酶或結構和功能相關酶的特定家族在待治療的機能障礙、紊亂、或疾病(下文總稱為“疾病”)的病理學中擔當重要角色。認為本發(fā)明的多肽和多核苷酸在其中有用的疾病的范例包括CNS紊亂,包括精神分裂癥,發(fā)作性陣發(fā)性焦慮癥(EPA)紊亂諸如強迫癥(OCD)、創(chuàng)傷后精神緊張性障礙(PTSD)、恐怖癥、和恐慌,重型抑郁癥,雙相性精神障礙,帕金森癥,廣泛性焦慮癥,孤獨癥,譫妄,多發(fā)性硬化癥,阿爾茨海默癥/癡呆,和其它神經退化疾病,嚴重精神發(fā)育遲緩,和運動障礙,諸如亨廷頓病或圖雷特綜合癥,厭食癥,貪食癥,中風,上癮/依賴/渴望,睡眠障礙,癲癇,偏頭痛;注意力缺陷/多動癥(ADHD);心血管疾病,包括心力衰竭,心絞痛,心率失常,心肌梗死,心臟肥大,低血壓,高血壓(如原發(fā)性高血壓、腎性高血壓、或肺動脈高血壓),血栓形成,動脈硬化,腦血管痙攣,蛛網膜下出血,腦缺血,腦梗死,周圍血管疾病,雷諾病,腎病(如腎衰竭);異常脂血癥;肥胖癥;嘔吐;胃腸紊亂,包括腸易激惹綜合癥(IBS),炎癥性腸病(IBD),胃食道反流病(GERD),活動能力障礙,和胃排空延遲狀況,諸如手術后或糖尿病性胃輕癱,和糖尿病,潰瘍(如胃潰瘍);腹瀉;其它疾病,包括骨質疏松;炎癥;感染,諸如細菌、真菌、原生動物、和病毒感染,特別是由HIV-1或HIV-2引起的感染;疼痛;癌癥;由化療誘導的損傷;腫瘤侵入;免疫紊亂;尿潴留;哮喘;變態(tài)反應;關節(jié)炎;良性前列腺肥大;內毒素休克;膿毒病;糖尿病并發(fā)癥等。還有一個方面,本發(fā)明涉及使用本發(fā)明提供的材料來鑒定激動劑和拮抗劑或抑制劑的方法,以及使用經鑒定的化合物來治療與IGS5不平衡有關的狀況。還有另一個方面,本發(fā)明涉及用于檢測與不適當?shù)腎GS5活性或水平有關的疾病的診斷測定法。
本發(fā)明的多肽在心血管疾病領域特別受到關注。表1SEQ ID NO1的IGS5-DNA(“IGS5DNA”)
表2SEQ ID NO2的IGS5-蛋白質(“IGS5PROT”)
表3SEQ ID NO3的IGS5-DNA-1(“IGS5DNA1”)
表4SEQ ID NO4的IGS5-蛋白質-1(“IGS5PROT1”)
表5SEQ ID NO5的IGS5-DNA-2(“IGS5DNA2”)
表6SEQ ID NO6的IGS5-蛋白質-2(“IGS5PROT2”)
發(fā)明詳述定義提供下列定義以便于理解本文中頻繁使用的某些術語。
“IGS5”指包含SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6之一列出的氨基酸序列的多肽或其變體。因而,“IGS5”具體包括IGS5PROT、IGS5PROT1、和IGS5PROT2。
“酶活性”或“生物學活性”指所述IGS5的代謝或生理學功能,包括相似的活性、改進的活性、或非期望副作用降低的活性。還包括所述IGS5的抗原性和免疫原性。
“IGS5基因”指包含SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5之一列出的核苷酸序列的多核苷酸或其變體(如等位基因變體)和/或它們的互補物。
在用于本文時,“抗體”包括多克隆和單克隆抗體;嵌合的、單鏈的、和人源化的抗體;以及Fab片段,包括Fab或其它免疫球蛋白表達文庫的產物。
“分離的”指“人為的”由天然狀態(tài)改變和/或與天然環(huán)境分開。因而,若自然界中存在的組合物或物質成為“分離的”,則它發(fā)生了變化或與其最初環(huán)境分開,或者二者兼之。例如,存活動物中天然存在的多核苷酸或多肽不是“分離的”,但是與天然狀態(tài)的共存物質分開的相同多核苷酸或多肽是“分離的”,正如本文采用的術語。
“多核苷酸”一般指任何多核糖核苷酸或多脫氧核糖核苷酸,可以是未修飾的RNA或DNA,或者是經修飾的RNA或DNA?!岸嗪塑账帷卑ǖ幌抻趩捂満碗p鏈DNA、單鏈與雙鏈區(qū)混合的DNA、單鏈和雙鏈RNA、單鏈與雙鏈區(qū)混合的RNA、包含DNA與RNA的雜種分子(其中DNA和RNA可以是單鏈,通常是雙鏈,或者是單鏈與雙鏈區(qū)的混合)。另外,“多核苷酸”包括包含RNA或DNA或二者的三鏈區(qū)。術語“多核苷酸”還包括包含一種或多種經修飾堿基的DNA或RNA,以及為了穩(wěn)定或其它原因而修飾了主鏈的DNA或RNA?!敖浶揎棥眽A基包括例如三苯甲基化堿基和非常見堿基(諸如肌苷)??梢詫NA和RNA進行多種修飾;因而,“多核苷酸”涵蓋自然界中常常發(fā)現(xiàn)的多核苷酸的化學、酶促、或代謝修飾形式,以及病毒和細胞特征性的DNA和RNA化學形式。“多核苷酸”還涵蓋相對較短的多核苷酸,通常稱為寡核苷酸。
“多肽”指包含通過肽鍵或經修飾肽鍵(即peptide isosteres)彼此相連的兩個或多個氨基酸的任何肽或蛋白質。“多肽”既包括短鏈,常常稱為肽、寡肽、或寡聚物;又包括長鏈,一般稱為蛋白質。多肽可包含20種基因編碼氨基酸以外的氨基酸。“多肽”包括通過天然加工(諸如翻譯后加工)或通過本領域眾所周知的化學修飾技術而進行了修飾的氨基酸序列。這些修飾詳細描述于基礎教科書、更詳細的專論、以及龐大的研究文獻中。修飾可發(fā)生于多肽中的任何位置,包括肽主鏈、氨基酸側鏈、和氨基或羧基末端。應當領會,相同類型的修飾可以相同或不同程度存在于指定多肽中的幾個位點。同樣,指定多肽可包含許多類型的修飾。作為遍在蛋白化作用的結果,多肽可以是分支的,也可以是具有或不具有分支的環(huán)狀。環(huán)狀的、分支的、和分支環(huán)狀的多肽可來自翻譯后天然加工,或者由合成方法產生。修飾包括乙?;?、酰化、ADP-核糖基化、酰胺化、生物素化、黃素的共價吸附、血紅素部分的共價吸附、核苷酸或核苷酸衍生物的共價吸附、脂類或脂類衍生物的共價吸附、磷脂酰肌醇的共價吸附、交聯(lián)、環(huán)化、二硫鍵的形成、脫甲基、共價交聯(lián)的形成、胱氨酸的形成、焦谷氨酸的形成、甲酰化、γ-羧化、糖基化、GPI錨的形成、羥化、碘化、甲基化、肉豆蔻?;⒀趸?、蛋白水解加工、磷酸化、異戊二烯化、外消旋、硒化、硫化、由tRNA介導向蛋白質添加氨基酸(諸如精氨?;?、和遍在蛋白化作用。參閱例如《Proteins-Structure and MolecularProperties》(蛋白質-結構和分子特性),第2版,T.E.Creighton,W.H.Freeman and Company,紐約,1993;F.Wold,“翻譯后蛋白質修飾觀點和展望”(Posttranslational Protein ModificationsPerspectives and Prospects),在《Post-translational CovalentModification of Proteins》(蛋白質的翻譯后共價修飾)一書中,第1-12頁,B.C.Johnson編,Academic出版社,紐約,1983;Seifter等人,蛋白質修飾和非蛋白質輔助因子的分析”(Analysis for proteinmodifications and nonprotein cofactors),Meth.Enzymol.,182626-646,1990;和Rattan等人,“蛋白質合成翻譯后修飾和衰老”(Protein SynthesisPosttranslational Modifications andAging),Ann.NY Acad.Sci.,66348-62,1992。
“變體”指分別與參考多核苷酸或多肽不同但保留了本質特性的多核苷酸或多肽。典型的多核苷酸變體因核苷酸序列而不同于另一種參考多核苷酸。變體的核苷酸序列中的變化有可能改變或未改變參考多核苷酸所編碼的多肽的氨基酸序列。正如下文所述,核苷酸變化可在參考多核苷酸所編碼的多肽中導致氨基酸替代、添加、刪除、融合、和截短。典型的多肽變體因氨基酸序列而不同于另一種參考多肽。一般而言,差異是有限的,因此參考多肽與變體的序列在整體上密切相似,在許多區(qū)域相同。變體與參考多肽的氨基酸序列可能因一處或多處替代、添加、和刪除及其任意組合而不同。替代或插入的氨基酸殘基可以是或不是由遺傳密碼子編碼的。多核苷酸或多肽的變體可以是天然存在的(諸如等位基因變體),或者是非天然存在的??赏ㄟ^誘變技術或直接合成來生成多核苷酸和多肽的非天然存在變體。
作為本領域一種對同一性的度量,“同一性”指通過比較序列而測定的兩種或多種多肽序列或者兩種或多種多核苷酸序列之間的相關性。在本領域,“同一性”還指可以通過這些序列之間的匹配,例如總體上通過比對序列使得獲得最大程度匹配,由此而測定的多肽或多核苷酸之間的序列相關程度。因而,“同一性”和/或另一用詞“相似性”具有本領域認可的含義,而且可以通過已知方法容易的測定,包括但不限于《Computational Molecular Biology》(計算分子生物學),A.M.Lesk編,牛津大學出版社,紐約,1988;《BiocomputingInformatics of Genome Projects》(生物計算信息學和基因組計劃),D.W.Smith編,Academic出版社,紐約,1993;《Computer Analysisof Sequence Data》(序列數(shù)據(jù)的計算機分析),第1部分,A.M.Griffin和H.G.Griffin編,Humana出版社,新澤西,1994;《Sequence Analysisin Molecular Biology》(分子生物學中的序列分析),G.von Heinje,Academic出版社,1987;《Sequence Analysis Pprimer》(序列分析引物),M.Gribskov和J.Devereux編,M Stockton出版社,紐約,1991;和H.Carillo和D.Lipton,SIAM J.Applied Math.,481073,1988中所描述的方法。用于測定同一性的優(yōu)選方法設計用于給出待測序列之間的最大匹配。用于測定同一性和相似性的方法已編譯成公眾可獲得的計算機程序。用于測定兩種序列之間的同一性和相似性的優(yōu)選計算機程序方法包括但不限于GCG程序軟件包(J.Devereux等人,Nucleic Acids Research,12(1)387,1984)、BLASTP、BLASTN、FASTA(S.F.Atschul等人,J.Molec.Biol.,215403,1990)。公眾可以由NCBI和其它來源獲得BLAST X程序(BLAST手冊,S.Altschul等人,NCBI NLM NIH Bethesda,MD 20894;S.Altschul等人,J.Mol.Biol.,215403-410,1990)。眾所周知的Smith Waterman算法也可用于測定同一性。公眾可獲得的分別可用于測定多肽序列或多核苷酸序列的同一性或相似性的程序是來自Genetics Computer Group(Madison,WI)的“gap”(缺口)程序,常常以用于比較的缺省參數(shù)(而且末端缺口沒有罰分)運行該程序。用于多肽序列比較的優(yōu)選(即缺省)參數(shù)包括Needleman和Wunsch,J.Mol.Biol.,48443-453,1970描述的算法;Hentikoff和Hentikoff,Proc.Natl.Acad.Sci.USA,8910915-10919,1992的比較矩陣BLOSSUM62;缺口罰分=12;缺口長度罰分=14。用于多核苷酸序列比較的優(yōu)選(即缺省)參數(shù)包括Needleman和Wunsch,J.Mol.Biol.,48443-453,1970描述的算法;比較矩陣,匹配=+12,錯配=O;缺口罰分=50;缺口長度罰分=3。用詞“同源性”可替代用詞“同一性”。
例如,具有與參考核苷酸序列(例如選自SEQ ID NO1、SEQ ID NO3、和SEQ ID NO5的參考核苷酸序列)具有至少95%“同一性”的核苷酸序列的多核苷酸意指,多核苷酸的核苷酸序列與參考序列大致相同,只是在參考核苷酸序列的每100個核苷酸中多核苷酸序列可以包含多達5個點突變。換言之,為了獲得具有與參考核苷酸序列至少95%同一的核苷酸序列的多核苷酸,可以在參考序列中刪除或用其它核苷酸替代多達5%的核苷酸,或者可以在參考序列中插入多達參考序列核苷酸總數(shù)5%的任何數(shù)目核苷酸,或者參考序列中多達核苷酸總數(shù)5%的任何數(shù)目核苷酸可以是刪除、插入、或替代的組合。參考序列的這些突變可以發(fā)生于參考核苷酸序列的5’或3’末端位置或者這些末端位置之間的任何位置,它們或是以單個核苷酸散布于參考序列中,或是以一個或多個連續(xù)組散布于參考序列中。
相似的,例如,具有與參考氨基酸序列(例如選自SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6的參考氨基酸序列)具有至少95%“同一性”的氨基酸序列的多肽意指,多肽的氨基酸序列與參考序列大致相同,只是在參考氨基酸序列的每100個氨基酸中多肽氨基酸序列可以包含多達5個氨基酸改變。換言之,為了獲得具有與參考氨基酸序列至少95%同一的氨基酸序列的多肽,可以在參考序列中刪除或用其它氨基酸替代多達5%的氨基酸殘基,或者可以在參考序列中插入多達參考序列氨基酸殘基總數(shù)5%的任何數(shù)目氨基酸。參考序列的這些改變可以發(fā)生于參考氨基酸序列的氨基或羧基末端位置或者這些末端位置之間的任何位置,它們或是以單個殘基散布于參考序列中,或是以一個或多個連續(xù)組散布于參考序列中。
“同系物”是本領域用于指示與目的序列具有高度序列相關性的多核苷酸或多肽序列的一般術語。如本文所述,這種相關性可以通過測定待比較序列間的同一性和/或相似性程度來量化。這個一般術語包括術語“直向進化同源物(ortholog)”,指其它物種中功能與該多核苷酸或多肽等同的多核苷酸或多肽,以及“平行進化同源物(paralog)”,指相同物種中的功能相似序列。因此,例如在人類中,在內皮素轉化酶家族中,ECE-1是其它成員(如ECE-2)的平行進化同源物。
“融合蛋白”指由兩個(通常是無關的)基因或其片段融合在一起而編碼的蛋白質。該術語可以例示為包含免疫球蛋白分子恒定區(qū)各部分與另一種人類蛋白質或其部分的融合蛋白。在許多情況中,采用免疫球蛋白Fc區(qū)作為融合蛋白的一部分對于治療和診斷是有利的,例如可導致藥代動力學特性得到改進(參閱例如EP-A0232262)。另一方面,對于有些用途,將會希望能夠在表達、檢測、和純化融合蛋白之后刪除Fc部分。本發(fā)明的多肽本發(fā)明涉及IGS5多肽(或IGS5酶,如IGS5PROT、IGS5PROT1、或IGS5PROT2),特別是人類IGS5多肽(或人類IGS5酶),還涉及包含所述完整IGS5多肽實質性部分的IGS5多肽片段。因而,在第一個方面,本發(fā)明的IGS5多肽包括分離多肽,特別是分離的人類物種多肽,所述多肽所含氨基酸序列與選自SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6的氨基酸序列在其全長上具有至少70%同一性、優(yōu)選至少80%特別是至少85%同一性、更優(yōu)選至少90%同一性、仍更優(yōu)選至少95%同一性、最優(yōu)選至少97-99%同一性。這些多肽包括包含選自SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6的氨基酸序列的多肽。
在第二個方面,本發(fā)明的IGS5多肽包括分離多肽,特別是分離人類IGS5多肽,所述多肽所具有的氨基酸序列與選自SEQ ID NO2、SEQID NO4、和SEQ ID NO6的氨基酸序列在其全長上具有至少70%同一性、優(yōu)選至少80%特別是至少85%同一性、更優(yōu)選至少90%同一性、仍更優(yōu)選至少95%同一性、最優(yōu)選至少97-99%同一性。這些多肽包括SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6的IGS5多肽。
本發(fā)明的其它多肽包括分離IGS5多肽,特別是人類物種多肽,所述多肽包含SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6之一所含序列。
本發(fā)明的多肽是金屬蛋白酶多肽家族的成員。它們受到關注是因為已經鑒定了幾種機能障礙、紊亂、或疾病,其中金屬蛋白酶在疾病的病理學中擔當重要角色。認為本發(fā)明多肽和多核苷酸有用的疾病的范例包括CNS紊亂,包括精神分裂癥,發(fā)作性陣發(fā)性焦慮癥(EPA)紊亂諸如強迫癥(OCD)、創(chuàng)傷后精神緊張性障礙(PTSD)、恐怖癥、和恐慌,重型抑郁癥,雙相性精神障礙,帕金森癥,廣泛性焦慮癥,孤獨癥,譫妄,多發(fā)性硬化癥,阿爾茨海默癥/癡呆,和其它神經退化疾病,嚴重精神發(fā)育遲緩,和運動障礙,諸如亨廷頓病或圖雷特綜合癥,厭食癥,貪食癥,中風,上癮/依賴/渴望,睡眠障礙,癲癇,偏頭痛;注意力缺陷/多動癥(ADHD);心血管疾病,包括心力衰竭,心絞痛,心率失常,心肌梗死,心臟肥大,低血壓,高血壓(如原發(fā)性高血壓、腎性高血壓、或肺動脈高血壓),血栓形成,動脈硬化,腦血管痙攣,蛛網膜下出血,腦缺血,腦梗死,周圍血管疾病,雷諾病,腎病(如腎衰竭);異常脂血癥;肥胖癥;嘔吐;胃腸紊亂,包括腸易激惹綜合癥(IBS),炎癥性腸病(IBD),胃食道反流病(GERD),活動能力障礙,和胃排空延遲狀況,諸如手術后或糖尿病性胃輕癱,和糖尿病,潰瘍(如胃潰瘍);腹瀉;其它疾病,包括骨質疏松;炎癥;感染,諸如細菌、真菌、原生動物、和病毒感染,特別是由HIV-1或HIV-2引起的感染;疼痛;癌癥;由化療誘導的損傷;腫瘤侵入;免疫紊亂;尿潴留;哮喘;變態(tài)反應;關節(jié)炎;良性前列腺肥大;內毒素休克;膿毒?。惶悄虿〔l(fā)癥等。本發(fā)明的多肽在心血管疾病領域特別受到關注。此外,本發(fā)明的IGS5多肽在鑒定這些多肽的刺激物或移植物、提供用于檢測與不適當IGS5活性或水平有關的疾病的診斷測定法、和使用經鑒定為刺激物或抑制物的化合物來治療與IGS5不平衡有關的狀況方面受到關注。因此,本發(fā)明的IGS5多肽可用于設計或篩選選擇性刺激物或抑制物,并由此可導致新型藥物的開發(fā)。本發(fā)明的IGS5多肽(特別是人類物種IGS5多肽)的特性在下文中稱為“IGS5活性”、“IGS5多肽活性”、或“IGS5的生物學活性”。這些活性還包括所述IGS5多肽的抗原性和免疫原性,特別是選自SEQ ID NO2、SEQID NO4、和SEQ ID NO6的多肽的抗原性和免疫原性。優(yōu)選的是,本發(fā)明的多肽展示IGS5(優(yōu)選人類IGS5)的至少一種生物學活性。
本發(fā)明的IGS5多肽可以是“成熟”蛋白質的形式,或者是較大蛋白質(諸如前體或融合蛋白)的一部分。包含額外的氨基酸序列常常是有利的,這些額外氨基酸序列包括分泌序列或前導序列、原序列、有助于純化的序列(諸如多個組氨酸殘基)、或在重組生產過程中有助于穩(wěn)定的額外序列。
本發(fā)明還包括上述多肽的變體,即因保守氨基酸替代(用具有相似特征的殘基進行替代)而與參照物不同的多肽。典型的這類替代是Ala、Val、Leu、與Ile之間;Ser與Thr之間;酸性殘基Asp與Glu之間;Asn與Gln之間;和堿性殘基Lys與Arg之間;或芳香族殘基Phe與Tyr之間的替代。特別優(yōu)選的是以任意組合替代、刪除、或添加幾個、5-10、1-5、1-3、1-2或1個氨基酸的變體。
本發(fā)明還包括IGS5多肽的片段,特別是包含完整IGS5多肽的實質性部分的IGS5多肽片段。片段指具有與上述IGS5多肽氨基酸序列的一部分而非全部相同的氨基酸序列的多肽。與IGS5多肽一樣,片段可以是“獨立的”,或者包含于較大多肽中而形成一個部分或區(qū)域,最優(yōu)選作為單個連續(xù)區(qū)域。
優(yōu)選片段包括例如具有IGS5多肽的氨基酸序列但刪除了包含氨基末端的一系列連續(xù)殘基或包含羧基末端的一系列連續(xù)殘基或刪除了兩段連續(xù)殘基(一段包含氨基末端,另一段包含羧基末端)的截短型多肽。同樣優(yōu)選由結構或功能屬性表征的片段,諸如包含α-螺旋和α-螺旋形成區(qū)、β-折疊和β-折疊形成區(qū)、轉角和轉角形成區(qū)、卷曲和卷曲形成區(qū)、親水區(qū)、疏水區(qū)、α兩親區(qū)、β兩親區(qū)、柔性區(qū)、表面形成區(qū)、底物結合區(qū)、和高抗原指數(shù)區(qū)的片段。其它優(yōu)選片段是生物學活性片段。生物學活性片段是那些介導酶活性的片段,包括那些具有相似活性、改進活性、或非期望活性降低的片段。還包括那些在動物(尤其是人)中具有抗原性或免疫原性的片段。
關于本發(fā)明的變體,即包含SEQ ID NO2、SEQ ID NO4、SEQ IDNO6之一所示完整IGS5多肽的實質性部分的多肽片段,術語“實質性”指該IGS5多肽片段具體具有至少大約50個氨基酸的大小,優(yōu)選至少大約100個氨基酸的大小,更優(yōu)選至少大約200個氨基酸的大小,最優(yōu)選至少大約300個氨基酸的大小。在本文中,“大約”包括比具體敘述的數(shù)值多或少幾個、5、4、3、2、或1個氨基酸。本發(fā)明的IGS5多肽片段優(yōu)選至少在一定程度上展示IGS5多肽本身特征性特性的至少一種。
關于本發(fā)明的IGS5多肽,發(fā)現(xiàn)它們可能涉及生物學活性肽的代謝。具體而言,發(fā)現(xiàn)這些IGS5多肽是可能作用于多種血管活性肽的金屬蛋白酶類酶?,F(xiàn)有技術中已知的血管活性肽包括例如心房納尿肽(ANP)、緩激肽、大內皮素(大ET-1)、內皮素(ET-1)、物質P、和血管緊張素-1。在本發(fā)明的內容中,發(fā)現(xiàn)IGS5胞外結構域是一種新型人類金屬蛋白酶,例如它在體外水解多種上述血管活性肽,包括大ET-1、ET-1、ANP、和緩激肽。
此外,本發(fā)明的IGS5金屬蛋白酶類酶可能受到參考化合物的抑制,所述參考化合物用于測定對具有ECE/NEP特征的酶的抑制特性,例如受到諸如膦酰二肽等化合物的抑制。沒有觀察到特異性抑制NEP的參考化合物對IGS5具有抑制作用,例如IGS5不受諸如thiorphan等化合物的抑制。也沒有觀察到特異性抑制ECE的參考化合物對IGS5具有抑制作用,例如IGS5不受諸如選擇性ECE抑制劑CGS-35066等化合物的抑制(DeLombart等人,J.Med.Chem.,43(3)488-504,2000年2月10日)。這些參考化合物對本發(fā)明IGS5金屬蛋白酶類酶的抑制數(shù)據(jù)描述于下文實驗部分,特別是實施例7。
可以任何合適方式制備本發(fā)明的多肽。這些多肽包括分離的天然存在的多肽、重組生產的多肽、合成生產的多肽、或由這些方法聯(lián)合產生的多肽。用于制備這些多肽的方法在本領域是眾所周知的。本發(fā)明的多核苷酸另一方面,本發(fā)明涉及IGS5多核苷酸(如IGS5DNA、IGS5DNA1、或IGS5DNA2),特別是人類IGS5多核苷酸。這些多核苷酸包括分離多核苷酸,優(yōu)選分離人類物種多核苷酸,所述多核苷酸所含核苷酸序列所編碼的多肽與選自SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6的氨基酸序列在其全長上具有至少70%同一性、優(yōu)選至少80%特別是至少85%同一性、更優(yōu)選至少90%同一性、仍更優(yōu)選至少95%同一性。在這點上,高度優(yōu)選編碼的多肽具有至少97%同一性的多核苷酸,更高度優(yōu)選具有至少98-99%和至少99%同一性的多核苷酸,特別是最高度優(yōu)選具有99.9%同一性的多核苷酸。這些多核苷酸包括包含分別編碼多肽SEQ ID NO2、SEQ ID NO4、或SEQ ID NO6的SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5之一所含核苷酸序列的多核苷酸。
在這方面的變體中,本發(fā)明的多核苷酸包括分離多核苷酸,特別是分離人類多核苷酸,所述多核苷酸所含核苷酸序列與編碼選自SEQID NO2、SEQ ID NO4、和SEQ ID NO6的多肽的核苷酸序列在完整編碼區(qū)上具有至少70%同一性、優(yōu)選至少80%特別是至少85%同一性、更優(yōu)選至少90%同一性、仍更優(yōu)選至少95%同一性。在這點上,高度優(yōu)選具有至少97%同一性的多核苷酸,更高度優(yōu)選具有至少98-99%和至少99%同一性的多核苷酸,特別是最高度優(yōu)選具有99.9%同一性的多核苷酸。
本發(fā)明的其它多核苷酸包括分離多核苷酸,特別是分離人類多核苷酸,所述多核苷酸所含核苷酸序列與選自SEQ ID NO1、SEQ ID NO3、和SEQ ID NO5的核苷酸序列之一在其全長上具有至少70%同一性、優(yōu)選至少80%特別是至少85%同一性、更優(yōu)選至少90%同一性、仍更優(yōu)選至少95%同一性。具體而言,本發(fā)明的多核苷酸包括具有與參考多核苷酸序列在其全長上具有至少70%同一性、優(yōu)選至少80%特別是至少85%同一性、更優(yōu)選至少90%同一性、仍更優(yōu)選至少95%同一性的核苷酸序列的分離多核苷酸。在這點上,高度優(yōu)選包含或具有與選自SEQ ID NO1、SEQ ID NO3、和SEQ ID NO5的核苷酸序列之一具有至少97%同一性、更高度優(yōu)選具有至少98-99%和至少99%同一性、特別是最高度優(yōu)選具有99.9%同一性的核苷酸序列的多核苷酸。這些多核苷酸包括包含SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5的多核苷酸的多核苷酸,以及SEQ ID NO1、SEQ ID NO3、或SEQ IDNO5的多核苷酸自身,特別是人類物種多核苷酸。
本發(fā)明還提供了與所有上述多核苷酸互補的多核苷酸。
SEQ ID NO1的核苷酸序列(稱為“IGS5DNA”)是人類起源(Homosapiens)的cDNA序列,長度為2076個核苷酸,所含多肽編碼序列(第1-2073位核苷酸)編碼691個氨基酸的多肽,即SEQ ID NO2的多肽(稱為“IGS5PROT”)。編碼SEQ ID NO2多肽的核苷酸序列可以與SEQ ID NO1所含多肽編碼序列相同,或者可以是與SEQ ID NO1所含序列不同的序列,但是因為遺傳密碼的冗余(簡并性)也編碼SEQ IDNO2的多肽。
SEQ ID NO3的核苷酸序列(稱為“IGS5DNA1”)是人類起源(Homosapiens)的cDNA序列,長度為2340個核苷酸(包含終止密碼子標簽),所含多肽編碼序列(第1-2337位核苷酸)編碼779個氨基酸的多肽,即SEQ ID NO4的多肽(稱為“IGS5PROT1”)。編碼SEQ ID NO4多肽的核苷酸序列可以與SEQ ID NO3所含多肽編碼序列相同,或者可以是與SEQ ID NO3所含序列不同的序列,但是因為遺傳密碼的冗余(簡并性)也編碼SEQ ID NO4的多肽。
SEQ ID NO5的核苷酸序列(稱為“IGS5DNA2”)是人類起源(Homosapiens)的cDNA序列,長度為2262個核苷酸(包含終止密碼子標簽),所含多肽編碼序列(第1-2259位核苷酸)編碼753個氨基酸的多肽,即SEQ ID NO6的多肽(稱為“IGS5PROT2”)。編碼SEQ ID NO6多肽的核苷酸序列可以與SEQ ID NO5所含多肽編碼序列相同,或者可以是與SEQ ID NO5所含序列不同的序列,但是因為遺傳密碼的冗余(簡并性)也編碼SEQ ID NO6的多肽。
下文更詳細的描述了由本發(fā)明多核苷酸編碼的多肽種類的特征。金屬蛋白酶的生物學和藥物學特性本發(fā)明的多肽(特別是人類物種多肽)與金屬蛋白酶家族的其它蛋白質在結構和功能上相關,例如顯示與金屬蛋白酶或相關酶(諸如MMP、ACE、ECE、或NEP)具有同源性和/或結構相似性。因而,例如SEQID NO2的多肽與金屬蛋白酶家族的其它蛋白質在結構和功能上相關,具有與酶諸如NEP或ECE(如ECE-1)特別是NEP的同源性和/或結構相似性。因而,預計本發(fā)明的優(yōu)選多肽和多核苷酸特別具有與其同源多肽和多核苷酸相似的生物學功能/特性。此外,本發(fā)明的優(yōu)選多肽和多核苷酸具有至少一種IGS5活性。
特別是對本發(fā)明而言,上文早已描述了金屬蛋白酶的一般特性及活性。為了進一步理解本發(fā)明多肽和多核苷酸的本質和特征,特別是這些多肽和多核苷酸的功能,下文分別概述了每一種酶像MMP、ACE、ECE、或NEP的一些更具體特性。
基質金屬蛋白酶(MMP),也稱為基質素(matrixin),是在胞外基質成份的更新中發(fā)揮功能的鋅金屬蛋白酶家族。至今,在人中已經鑒定了基質素家族的幾個成員。許多細胞類型,諸如成纖維細胞、上皮細胞、巨噬細胞、淋巴細胞、和癌細胞,合成并分泌MMP。在所有生成細胞中(除了嗜中性粒細胞以外),MMP以前酶原的形式合成,并注定以酶原的形式分泌。在生理學條件下,這些酶在形態(tài)發(fā)生、組織重建、和吸收中擔當重要角色。在過量情況中,它們參與破壞與許多結締組織疾病諸如關節(jié)炎、牙周炎、腎小球腎炎、癌細胞侵入和轉移有關的胞外基質。因而,MMP在例如正常胚胎形成和組織重建中和在許多疾病諸如關節(jié)炎、癌癥、牙周炎、腎小球腎炎、腦脊髓炎、動脈粥樣硬化、和組織潰瘍中擔當重要角色。基質素在結締組織基質的生理學和病理學分解代謝中的重要性已經受到重視,因為在正常穩(wěn)態(tài)組織中很少能夠檢測到MMP活性,但是許多MMP的合成受到炎性細胞因子、激素、生長因子、和細胞轉化的轉錄調控。MMP的生物學活性還在無活性前體(MMP原)的激活步驟中以及通過與胞外基底和內源抑制物的相互作用受到胞外控制。MMP是涉及胞外基質降解和重建的一類重要鋅依賴性金屬蛋白酶。這些酶的抑制物在例如癌癥、關節(jié)炎、骨質疏松、和阿爾茨海默癥中具有治療潛能,而且這些抑制物中的幾種正在進行臨床評估。
血管緊張素-1轉化酶(ACE;肽基二肽酶A;EC 3.4.15.1)是鋅金屬蛋白酶中血管緊張素轉化酶家族的成員。ACE主要表達于內皮細胞、上皮細胞、和神經上皮細胞的表面(軀體ACE)作為胞外酶,即包括它的催化位點在內的大部分質量錨定在質膜上并面向胞外環(huán)境。在血管內皮細胞的質膜中發(fā)現(xiàn)了ACE,在肺部血管內皮細胞表面發(fā)現(xiàn)了高水平ACE,推測ACE的活性位點可代謝循環(huán)物質。除了內皮細胞定位以外,ACE還表達于小腸吸收性上皮細胞和腎近曲小管的刷狀緣中。ACE還發(fā)現(xiàn)于單核的細胞(諸如巨噬細胞分化后的單核細胞和T淋巴細胞)和成纖維細胞中。采用放射性標記的特異性ACE抑制物的體外放射自顯影和免疫組織化學研究已經將ACE的重要位置定位于腦。ACE主要發(fā)現(xiàn)于脈絡叢,它可能是腦脊液、室管膜、穹窿下器、基底神經節(jié)(尾狀核-豆狀核和蒼白球)、黑質、和垂體中ACE的來源。已經在許多生物學流體中檢測到可溶性形式的ACE,諸如血清、精液、羊水、和腦脊液??扇苄孕问降腁CE似乎衍生自內皮細胞中的膜結合形式的酶。ACE的主要生物學活性是由血管緊張素-1切除C端二肽而生成有效的血管加壓肽-血管緊張素-2,并通過隨后除去兩個C端二肽而滅活血管舒張肽-緩激肽。由于ACE涉及這兩種血管活性肽(血管緊張素-2和緩激肽)的新陳代謝,ACE已成為了高血壓和充血性心力衰竭治療的決定性分子靶。這導致了對高度有效且特異性的ACE抑制物的開發(fā),這些抑制物已經成為臨床上重要的且廣泛使用的口服活性藥物,用于控制這些高血壓和充血性心力衰竭狀況。代謝血管活性肽是對ACE了解得最透徹的生理學功能,然而,由于ACE的定位和/或對一系列生物學活性肽的體外切割,推測這種酶還涉及與血壓調控無關的一系列其它生理學過程,諸如免疫、生殖、和神經肽代謝。
中性內肽酶(NEP,neprilysin,EC 3.4.24.11)是一種鋅金屬蛋白酶,歸類為neprilysin家族的成員。NEP最初由兔腎刷狀緣膜分離。稍后,在大鼠腦中鑒定了涉及阿片類肽腦啡肽降解的NEP樣酶。胞外酶NEP的克隆及隨后的定點誘變實驗顯示,除了具有與嗜熱芽孢菌蛋白酶相似的特異性以外,它還具有相似的活性位點組織。對于切割肽中疏水性殘基的N端一側,NEP還顯示嗜熱芽孢菌蛋白酶樣特異性。關于NEP的一般分布,已經測定了腦和脊髓,而且損傷和電子顯微鏡研究總體上支持NEP的主要神經元定位現(xiàn)象,然而該酶能夠存在于條紋灰質和條紋黑質途徑的纖維周圍的少突膠質細胞上和周圍神經系統(tǒng)的施旺細胞上。NEP并未顯示集中在特定膜界面(諸如突觸)上,而是均一的分布于神經元核周質和樹突的表面。在周邊,NEP在腎和腸的刷狀緣膜、淋巴結、和胎盤中特別豐富,而且以更低濃度發(fā)現(xiàn)于許多其它組織中,包括主動脈血管壁。已發(fā)現(xiàn)常見急性成淋巴細胞白血病抗原就是NEP,現(xiàn)有技術還顯示酶瞬時存在于淋巴造血細胞表面,并在某些疾病狀態(tài)下在成熟淋巴細胞上以升高的水平存在。對NEP的臨床關注,特別是對NEP抑制物作為潛在臨床試劑的關注,起源于NEP與另一種鋅金屬蛋白酶氨肽酶N(APN,膜丙氨酰氨肽酶,EC 3.4.11.2)在腦啡肽降解中的作用和它在心房鈉尿肽(ANP)降解中的作用。例如,已知NEP和血管緊張素轉化酶(ACE)的雙重抑制物是有效的抗高血壓藥物,因為它同時升高心房鈉尿肽的循環(huán)水平(由于NEP抑制)和降低血管緊張素-2的信號水平(由于ACE抑制)。由于周邊酶顯示降解循環(huán)鈉尿肽和利尿肽(心房鈉尿肽),這引起了對NEP抑制物的臨床潛能的進一步關注。因此對NEP抑制物研究抗高血壓特性。由另一個范例知道,合成NEP抑制物thiorphan對腦啡肽代謝的抑制在小鼠中引起納洛酮(naloxone)可逆的抗疼痛應答。這說明有可能通過升高靶受體區(qū)域的內源阿片樣物質的水平來鎮(zhèn)痛,而相對沒有嗎啡或其它經典鴉片劑藥物的副作用?,F(xiàn)已認識到,為了實現(xiàn)任何顯著效果,還應當抑制其它腦啡肽代謝酶,特別是氨肽酶N(APN)。這些雙重NEP/APN抑制物完全阻斷腦啡肽代謝,而且具有強烈的抗疼痛特性。
內皮素轉化酶(ECE)催化有效血管收縮肽內皮素(ET)生物合成的最終步驟。這包括切割無活性中間物大內皮素的Trp-Val鍵。ECE-1是與中性內肽酶(NEP;neprilysin;EC 3.4.24.11,見上文)同源的一種鋅金屬蛋白酶。與NEP一樣,ECE-1受到化合物膦酰二肽的抑制,而且是II型整合膜蛋白。然而,與NEP不同的是,ECE-1以二硫鍵連接的二聚體形式存在,而且不受其它NEP抑制物諸如thiorphan的抑制。免疫細胞化學研究指示ECE-1主要定位于細胞表面,其中它作為胞外酶存在。ECE-1定位于內皮細胞和一些分泌細胞(如胰β細胞和平滑肌細胞)。有效且選擇性的ECE抑制物或ECE/NEP雙重抑制物可能在心血管和腎醫(yī)療中具有治療應用。內皮素(ET)是由21個氨基酸通過兩個分子內二硫鍵構成的雙環(huán)肽,它是至今鑒定的最有效的血管收縮肽之一,而且對動物的施用導致血壓持續(xù)升高,說明了它在心血管調控中的潛在角色。ET-1在人體中的內源生成有助于維持基礎血管張力。因此,內皮素系統(tǒng)和相關酶(像ECE)代表了新型制藥學試劑開發(fā)的可能候選者。因而,對ECE的臨床關注,特別是對ECE抑制物作為潛在臨床試劑的關注,起源于ECE的作用,特別是在ET生物合成方面。因此,顯示顯著內皮素轉化酶抑制活性的化合物可用于治療和預防由ET誘導或懷疑由它誘導的多種疾病,諸如心血管疾病,包括心力衰竭、心絞痛、心率失常、心肌梗死、心臟肥大、低血壓、高血壓(如原發(fā)性高血壓、腎性高血壓、或肺動脈高血壓)、血栓形成、動脈硬化、腦血管痙攣、蛛網膜下出血、腦缺血、腦梗死、周圍血管疾病、雷諾病、腎病(如腎衰竭)、哮喘、中風、阿爾茨海默癥;糖尿病并發(fā)癥;潰瘍,諸如胃潰瘍;癌癥,諸如肺癌;內毒素休克;膿毒病等。
本發(fā)明的多肽在心血管疾病領域特別受到關注。用于獲得本發(fā)明多核苷酸的流程可以通過標準克隆和篩選技術,使用表達序列標簽(EST)分析,由衍生自人睪丸組織細胞mRNA的cDNA文庫獲得本發(fā)明的多核苷酸(M.D.Adams等人,Science,2521651-1656,1991;M.D.Adams等人,Nature,355632-634,1992;M.D.Adams等人,Nature,增刊3773-174,1995)。還可以由天然來源諸如基因組DNA文庫獲得本發(fā)明的多核苷酸,或者可以使用眾所周知的商品化技術進行合成(如F.M.Ausubel等人,《Current Protocols in Molecular Biology》(分子生物學現(xiàn)行方案),2000)。
在將本發(fā)明多核苷酸用于本發(fā)明多肽的重組生產時,多核苷酸自身可包含成熟多肽的編碼區(qū);或者在相同讀碼框中包含成熟多肽的編碼區(qū)以及其它編碼序列,諸如編碼前導序列或分泌序列、蛋白原序列、前蛋白序列、前蛋白原序列、或其它融合肽部分的序列。例如,可編碼有助于純化融合多肽的標記序列。在本發(fā)明這方面的某些優(yōu)選實施方案中,標記序列是六組氨酸肽,如pQE載體(Qiagen公司)中提供的,且描述于Gentz等人,Proc.Natl.Acad.Sci.USA,86821-824,1989,或HA標簽。多核苷酸還可包含5’和3’非編碼序列,諸如轉錄但不翻譯的序列、剪接和聚腺苷酸化信號、核糖體結合位點、和穩(wěn)定mRNA的序列。
本發(fā)明的其它實施方案包括編碼包含選自SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6的氨基酸序列之一但其中幾個例如5-10、1-5、1-3、1-2、或1個氨基酸殘基以任意組合被替代、刪除、或添加的多肽變體的多核苷酸。
與SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5之一所含核苷酸序列同一或足夠同一的多核苷酸,可作為cDNA和基因組DNA的雜交探針或者作為核酸擴增反應(PCR)的引物,用于分離編碼本發(fā)明多肽的全長cDNA和基因組克隆,和用于分離與SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5之一具有高度序列相似性的其它基因(包括編碼來自人類來源的平行進化同源物的基因和來自非人物種的直向進化同源物和平行進化物的基因)的cDNA和基因組克隆。通常,這些核苷酸序列與參照物至少70%同一,優(yōu)選至少80%特別是至少85%同一,更優(yōu)選至少90%同一,最優(yōu)選至少95%同一。探針或引物通常將包含至少15個核苷酸,優(yōu)選至少30個核苷酸,而且可具有至少50個核苷酸。特別優(yōu)選的探針將具有30-50個核苷酸。特別優(yōu)選的引物將具有20-25個核苷酸。
可以通過包括下列步驟的方法來獲得編碼本發(fā)明多肽(包括同系物和來自非人物種的直向進化同源物)的多核苷酸在嚴謹雜交條件下用具有SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5之一的序列或其片段的經標記探針篩選合適文庫;并分離包含所述多核苷酸序列的全長cDNA和基因組克隆。這些雜交技術對熟練技術人員是眾所周知的。優(yōu)選的嚴謹雜交條件包括在含50%甲酰胺、5x SSC(150mM NaCl、15mM檸檬酸三鈉)、50mM磷酸鈉(pH7.6)、5x Denhardt氏液、10%硫酸葡聚糖(w/v)、和20μg/ml變性剪碎鮭魚精DNA的溶液中于42℃保溫過夜,隨后用0.1x SSC于大約65℃清洗濾膜。因而,本發(fā)明還包括可通過在嚴謹雜交條件下用具有SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5之一的序列或其片段的經標記探針篩選合適文庫而獲得的多核苷酸。
熟練技術人員將領會,在許多情況中,分離cDNA序列將是不完整的,即多肽編碼區(qū)在cDNA的5’端是切短的。這是逆轉錄酶具有固有低“持續(xù)合成能力”(對酶在聚合反應過程中保持附著在模板上的能力的量度),不能在第一條cDNA鏈合成過程中完成mRNA模板的DNA拷貝導致的。
本領域熟練技術人員眾所周知幾種商品化方法可用于獲得全長cDNA或延伸短cDNA,例如基于cDNA末端快速擴增(RACE)的方法(參閱例如Frohman等人,PNAS USA,858998-9002,1988)。這種技術的最新修改,例如MarathonTM技術(Clontech Laboratories公司),顯著簡化了對較長cDNA的搜索。在MarathonTM技術中,由提取自選定組織的mRNA制備cDNA,并將“銜接頭”序列連接到每個末端。然后使用基因特異的和銜接頭特異的寡核苷酸引物對進行核酸擴增反應(PCR)以擴增cDNA中“缺失的”5’末端。然后使用“嵌套”引物對重復PCR反應,其中“嵌套”引物即為設計成在擴增產物內退火的引物,通常是在銜接頭序列3’端退火的銜接頭特異引物,和在已知基因序列5’端退火的基因特異引物。然后通過DNA測序分析此反應的產物,并通過將產物直接連接現(xiàn)有cDNA以產生完整序列,或通過將新的序列信息用于設計5’端引物而進行另一次全長PCR,由此構建全長cDNA。載體、宿主細胞、表達可以通過本領域眾所周知的過程由經遺傳工程改造的包含表達系統(tǒng)的細胞制備本發(fā)明的重組多肽。因此,在另一個方面,本發(fā)明涉及包含本發(fā)明多核苷酸的表達系統(tǒng),用這些表達系統(tǒng)遺傳改造的宿主細胞,和通過重組技術生產本發(fā)明的多肽。使用由本發(fā)明DNA構建物衍生的RNA,無細胞翻譯系統(tǒng)也可用于生產這些蛋白質。
為了重組生產,可遺傳改造宿主細胞以摻入本發(fā)明多核苷酸的表達系統(tǒng)或其部分。可通過許多標準實驗室指南(諸如Davis等人,《BasicMethods in Molecular Biology》(分子生物學基本方法),1986;和Sambrook等人,《Molecular CloningA Laboratory Manual》(分子克隆實驗室指南),第2版,冷泉港實驗室出版社,冷泉港,紐約,1989)中描述的方法,將多核苷酸導入宿主細胞。優(yōu)選方法包括例如磷酸鈣轉染、由DEAE-葡聚糖介導的轉染、轉位、顯微注射、由陽離子脂類介導的轉染、電穿孔、轉導、刮擦裝載(scrape loading)、轟擊導入、或感染。
合適宿主的代表性范例包括細菌細胞,諸如鏈球菌、葡萄球菌、大腸桿菌、鏈霉菌、和枯草芽孢桿菌細胞;真菌細胞,諸如酵母細胞和曲霉細胞;昆蟲細胞,諸如果蠅S2和Spodoptera Sf9細胞;動物細胞,諸如CHO、COS、HeLa、C127、3T3、BHK、HEK293、和Bowes黑素瘤細胞;和植物細胞。
可使用很多種表達系統(tǒng),例如由染色體、游離體、和病毒衍生的系統(tǒng),如由細菌質粒,細菌噬菌體,轉座子,酵母游離體,插入元件,酵母染色體元件,病毒諸如桿狀病毒、乳多空病毒(諸如SV40)、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒、和逆轉錄病毒衍生的載體,以及由上述聯(lián)合衍生的載體,諸如由質粒和噬菌體遺傳元件衍生的載體,諸如粘粒和噬菌粒。表達系統(tǒng)可包含調控以及引起表達的控制區(qū)。一般而言,可使用能夠在宿主中維持、增殖、或表達多核苷酸產生多肽的任何系統(tǒng)或載體??赏ㄟ^多種眾所周知的常規(guī)技術,諸如Sambrook等人《Molecular CloningA Laboratory Manual》(見上文)中所述,將合適的核苷酸序列插入表達系統(tǒng)。為了使翻譯產生的蛋白質分泌進入內質網內腔、周質空間、或胞外環(huán)境,可將合適的分泌信號摻入目的多肽。這些信號對于多肽而言可以是內源的,或者是外源的(即衍生自不同物種)。
若要表達本發(fā)明多肽用于篩選實驗,通常有可能在細胞表面產生多肽或者是可溶性蛋白質的形式表達。若將多肽分泌進入培養(yǎng)基,則可回收培養(yǎng)基以回收并純化多肽。若生成于胞內,則在回收多肽前首先必須裂解細胞。若多肽結合于細胞表面(膜結合型多肽),則通常制備膜部分,以累積膜結合型多肽。
可通過眾所周知的方法由重組細胞培養(yǎng)物回收并純化本發(fā)明的多肽,包括硫酸銨或乙醇沉淀、酸提取、陰離子或陽離子交換層析、磷酸纖維素層析、疏水相互作用層析、親和層析、羥基磷灰石層析、和凝集素層析。最優(yōu)選的是,采用高效液相層析來進行純化。當多肽在胞內合成、分離、和/或純化過程中發(fā)生變性時,可采用眾所周知的用于蛋白質重新折疊的技術來重新產生有活性的構象。診斷實驗本發(fā)明還涉及本發(fā)明多核苷酸作為診斷劑的用途。與機能障礙有關且表征為選自SEQ ID NO1、SEQ ID NO3、和SEQ ID NO5的多核苷酸的基因突變型的檢測將提供診斷工具,從而增加或明確由基因表達的不足、過度、或時空改變引起的疾病或其易感性的診斷。通過多種技術,可以在DNA水平上檢測基因內攜帶突變的個體。
可由受試者的細胞,諸如由血液、尿液、唾液、組織切片、或尸解材料,獲得用于診斷的核酸?;蚪MDNA可直接用于檢測,或者可在分析前通過PCR或其它擴增技術進行酶促擴增。RNA或cDNA也可以相似方式使用??赏ㄟ^擴增產物與正?;蛐拖啾鹊拇笮∽兓瘉頇z測刪除和插入??赏ㄟ^將擴增后的DNA與經標記IGS5核苷酸序列進行雜交來鑒定點突變??赏ㄟ^RNA酶消化或熔解溫度的差異來區(qū)分完美匹配的序列與錯配的雙鏈體。還可通過DNA片段在含或不含變性劑的凝膠中的電泳遷移率的變化,或者通過直接的DNA測序來檢測DNA序列差異(參閱如Myers等人,Science,2301242,1985)。還可通過核酸酶保護實驗(諸如RNA酶和S1保護)或化學切割法來揭示特定位置的序列變化(參閱Cotton等人,Proc.Natl.Acad.Sci.USA,854397-4401,1985)。在另一個實施方案中,可構建包含IGS5核苷酸序列或其片段的寡核苷酸探針陣列來進行如遺傳突變的高效篩選。陣列技術的方法是眾所周知的,而且具有普遍適用性,可用于在分子遺傳學中解決多種問題,包括基因表達、遺傳連鎖、和遺傳可變性(參閱例如M.Chee等人,Science,274610-613,1996)。
診斷實驗提供了通過上述方法檢測IGS5基因中的突變來診斷或確定對疾病易感性的方法。另外,可通過包括由衍生自受試者的樣品測定多肽或mRNA水平的異常降低或升高的方法來診斷這些疾病。可使用任何本領域眾所周知的用于多核苷酸定量的技術在RNA水平測量表達的降低或升高,諸如PCR、RT-PCR、RNA酶保護、Northern印跡、和其它雜交方法??捎糜跍y定衍生自宿主的樣品中蛋白質(諸如本發(fā)明多肽)水平的實驗技術對本領域技術人員是眾所周知的。這些實驗方法包括放射性免疫實驗、競爭性結合實驗、Western印跡分析、和ELISA實驗。
因而,另一方面,本發(fā)明涉及診斷試劑盒,其中包含(a)本發(fā)明的多核苷酸,優(yōu)選SEQ ID NO1、SEQ ID NO3、或SEQ ID NO5之一的多核苷酸或其片段;(b)與(a)互補的核苷酸序列;(c)本發(fā)明的多肽,優(yōu)選SEQ ID NO2、SEQ ID NO4、或SEQ IDNO6之一的多肽或其片段;或(d)針對本發(fā)明多肽,優(yōu)選SEQ ID NO2、SEQ ID NO4、或SEQID NO6之一的多肽的抗體。
應當領會,在任何這些試劑盒中,(a)、(b)、(c)、或(d)可構成所述試劑盒的實質性成份。這樣的試劑盒將用于診斷疾病或對疾病的易感性,特別是上文(即本發(fā)明多肽的內容中)所述疾病等。染色體實驗本發(fā)明的核苷酸序列對于染色體定位也是有價值的。將序列特異靶向單個人染色體上的特定位置,并能夠與其發(fā)生雜交。依照本發(fā)明將相關序列對染色體進行作圖是將那些序列與基因相關疾病聯(lián)系起來的重要的第一步。一旦將序列定位于精確的染色體位置,可使序列在染色體上的物理位置與遺傳圖譜資料相關聯(lián)。這些資料可在例如V.McKusick的《Mendelian Inheritance in Man》(人類孟德爾遺傳)(可通過網絡由Johns Hopkins大學Welch醫(yī)學圖書館獲得)中找到。然后通過連鎖分析(物理上相鄰基因的共遺傳)鑒定基因與已定位于相同染色體區(qū)域的疾病之間的關系。
還可測定受影響與不受影響的個體之間的cDNA或基因組序列差異。若在有些或所有受影響的個體中觀察到突變,而在任何正常個體中沒有觀察到該突變,則它有可能是疾病的病因。組織定位本發(fā)明的核苷酸序列對于組織定位也是有價值的。這些技術能夠通過檢測編碼IGS5多肽的mRNA來測定它們在組織中的表達模式。這些技術包括原位雜交技術和核苷酸擴增技術(例如PCR)。這些技術在本領域是眾所周知的。來自這些研究的結果可指示多肽在生物體中的正常功能。另外,IGS5 mRNA正常表達模式與由IGS5基因編碼的mRNA的表達模式之間的比較性研究,可以對疾病中突變體IGS5多肽的作用或正常IGS5多肽不適當表達的作用提供有價值洞察。這種不適當表達可能是時間、空間、或僅僅是量的差異。
本發(fā)明的多肽或其片段或其類似物或者表達它們的細胞還可用作免疫原以生成針對本發(fā)明多肽的免疫特異性抗體。術語“免疫特異性”指抗體對本發(fā)明多肽的親和力顯著高于它們對現(xiàn)有技術其它相關多肽的親和力??贵w使用常規(guī)方案,通過對動物(優(yōu)選非人動物)施用多肽或者攜帶表位的片段、類似物、或細胞,可獲得針對本發(fā)明多肽而產生的抗體。對于單克隆抗體的制備,可使用能提供由連續(xù)細胞系培養(yǎng)物產生的抗體的任何技術。范例包括雜交瘤技術(G.Kohler和C.Milstein,Nature,256495-597,1975)、trioma技術、人B細胞雜交瘤技術(Kozbor等人,Immunology Today,472,1983)、和EBV-雜交瘤技術(Cole等人,《Monoclonal Antibodies and Cancer Therapy》(單克隆抗體和癌癥治療),第77-96頁,Alan R.Liss公司,1985)。也可采用用于生成單鏈抗體的技術(諸如美國專利號4,946,778中所述)來生成針對本發(fā)明多肽的單鏈抗體。同樣,轉基因小鼠或其它生物體(包括其它哺乳動物)可用于表達人源化抗體。
上述抗體可用于分離或鑒定表達多肽的克隆,或者用于通過親和層析純化多肽。
針對本發(fā)明多肽的抗體還可用于治療上文所述疾病等。融合蛋白另一方面,本發(fā)明涉及經遺傳工程改造的包含本發(fā)明多肽或其片段和各亞類免疫球蛋白(IgG、IgM、IgA、IgE)重鏈或輕鏈恒定區(qū)各種部分的可溶性融合蛋白。優(yōu)選的免疫球蛋白是人類IgG,特別是IgGl重鏈的恒定部分,其中融合發(fā)生于鉸鏈區(qū)。在具體的實施方案中,可以簡單的通過摻入可以被血液凝結因子Xa切割的序列來除去Fc部分。另外,本發(fā)明涉及通過遺傳工程來制備這些融合蛋白的方法,和這些融合蛋白在藥物篩選、診斷、和治療中的用途。本發(fā)明的另一個方面還涉及編碼這些融合蛋白的多核苷酸。融合蛋白技術的范例可以在國際專利申請?zhí)朩O94/29458和WO94/22914中找到。疫苗本發(fā)明的另一個方面涉及用于在哺乳動物中誘導免疫學應答的方法,包括對哺乳動物施用(例如通過接種)本發(fā)明的多肽,施用量足以生成抗體和/或T細胞免疫應答,從而保護所述動物免于上文提到的疾病。本發(fā)明的還有一個方面涉及用于在哺乳動物中誘導免疫應答的方法,包括借助在體內指導多核苷酸表達并編碼多肽的載體來投遞本發(fā)明的多肽,從而誘導這種免疫學應答以生成抗體,保護所述動物免于疾病。
本發(fā)明的另一個方面涉及免疫學/疫苗制劑(組合物),在導入哺乳動物宿主后,將在該哺乳動物中誘導針對本發(fā)明多肽的免疫學應答,其中所述組合物包含本發(fā)明的多肽或多核苷酸。這些免疫學/疫苗制劑(組合物)可以是治療性的免疫學/疫苗制劑,或者是預防性的免疫學/疫苗制劑。疫苗制劑還可以包含合適載體。由于多肽可能在胃中降解,因此優(yōu)選胃腸外施用(例如皮下、肌肉內、靜脈內、或皮內注射)。適用于胃腸外施用的制劑包括水性和非水性無菌注射液,可包含抗氧化劑、緩沖液、抑菌劑、和使得制劑與接受者血液等滲的溶質;以及水性和非水性無菌懸浮液,可包含懸浮劑或增稠劑。制劑可存在于單位劑量或多份劑量的容器中,例如,密封的安瓿瓶和藥水瓶,而且可以凍干狀態(tài)儲存,只需要在臨使用前加入無菌液體載體。疫苗制劑還可包含用于增強制劑免疫原性的佐劑系統(tǒng),諸如水包油系統(tǒng)和本領域知道的其它系統(tǒng)。劑量將取決于疫苗的比活性,而且易于通過常規(guī)實驗測定。篩選實驗本發(fā)明的多肽負責一種或多種生物學功能,包括一種或多種疾病狀況,特別是上文所述疾病。因此,渴望找到用于鑒定可刺激或抑制所述多肽功能的化合物的篩選方法。因此,另一方面,本發(fā)明提供了用于鑒定那些可刺激或抑制所述多肽功能的化合物的篩選方法??梢杂啥喾N來源鑒定化合物,例如細胞、無細胞制劑、化學文庫、和天然產物混合物。如此鑒定的這些刺激物或抑制物可以是天然的或經修飾的底物、配體、受體、酶、等(在多肽的情況中);或者是結構或功能模擬物(參閱Coligan等人,Current Protocols in Immunology,1(2)第5章,1991)。
篩選方法可以是只測量候選化合物對多肽活性或者對攜帶多肽的細胞或膜的影響。或者,篩選方法可包括競爭劑的競爭。另外,這些篩選方法可使用適用于多肽或者攜帶多肽的細胞或膜的活性的檢測系統(tǒng)來測試候選化合物是否導致由多肽的激活或抑制生成的信號。通常在存在已知底物的情況中測定對多肽活性的抑制,并通過活性改變來觀察候選化合物的效果,例如通過測試候選化合物是否導致對多肽的抑制或刺激。例如,篩選方法可只包括下列步驟混合候選化合物與含本發(fā)明多肽的溶液和合適底物以形成混合物,測量混合物的IGS5活性,并比較混合物的IGS5活性與不含候選化合物的標準。
本發(fā)明的多核苷酸、多肽、和針對多肽的抗體還可用于構成用于檢測加入的化合物對細胞中mRNA和多肽生成的影響的篩選方法。例如,可以建立ELISA測定法,通過本領域知道的標準方法,使用單克隆和多克隆抗體來測量多肽的分泌水平或細胞結合水平。這可用于發(fā)現(xiàn)可抑制或增強適當操作的細胞或組織中的多肽生成的試劑。
潛在多肽抑制物的范例包括抗體或(在有些情況中)與多肽的配體、底物、受體、酶、等密切相關的寡核苷酸或蛋白質,可以是例如如配體、底物、受體、酶、等的片段;或結合本發(fā)明多肽但不引發(fā)應答從而可預防多肽活性的小分子。
因而,另一方面,本發(fā)明涉及用于鑒定特別是抑制物、刺激物、配體、受體、底物、酶、等;本發(fā)明的多肽;或者降低或增強這些多肽生成的篩選試劑盒,其包含(a)本發(fā)明的多肽;(b)表達本發(fā)明多肽的重組細胞;(c)表達本發(fā)明多肽的細胞膜;或(d)針對本發(fā)明多肽的抗體,所述多肽優(yōu)選是SEQ ID NO2、SEQID NO4、或SEQ ID NO6之一的多肽。
應當領會,在任何這些試劑盒中,成份(a)、(b)、(c)、或(d)可構成所述試劑盒的實質性部分。
熟練技術人員易于領會的是,本發(fā)明的多肽也可用于基于結構來設計多肽的刺激物或抑制物的方法中,包括(a)在第一種情況中測定多肽的三維結構;(b)由三維結構推測刺激物或抑制物可能的反應或結合位點;(c)合成預測可與推測的結合或反應位點結合或反應的候選化合物;并(d)測試候選化合物是不是真正的刺激物或抑制物。
還應當領會,這通常是重復的過程。預防和治療方法另一方面,本發(fā)明提供了用于治療涉及IGS5多肽活性表達過度或不足的異常狀況的方法,諸如上文(在本發(fā)明的多肽內容中)一般稱為“疾病”的那些待治療機能障礙、紊亂、或疾病。
若該多肽的活性過度,則可使用幾種方法。一種方法是任選與制藥學可接受載體一起,以有效抑制該多肽功能(諸如通過阻斷結合底物、酶、等)的量,對有此需要的對象施用上文所述的抑制物化合物,由此減輕異常狀況。在另一種方法中,可以施用該多肽仍能與內源性多肽競爭結合底物、酶等的可溶性形式。
還有一種方法是使用表達阻斷技術來抑制編碼內源IGS5多肽的基因的表達。已知這種技術包括反義序列的使用,其或是內部生成或是分開施用的(參閱例如O’Connor,J Neurochem,56560,1991;《Oligodeoxynucleotides as Antisense Inhibitors of GeneExpression》(寡脫氧核苷酸作為基因表達的反義抑制劑),CRC出版社,Boca Raton,佛羅里達,美國,1988)?;蛘?,可使用與基因形成三股螺旋(三鏈體)的寡核苷酸(參閱例如Lee等人,Nucleic AcidsRes,63073,1979;Cooney等人,Science,241456,1988;Dervan等人,Science,2511360,1991)。可施用這些寡聚物本身,或者可在體內表達相關寡聚物。合成的反義或三鏈體寡核苷酸可包含經修飾堿基或經修飾主鏈。后者的范例包括甲基膦酸酯、硫代磷酸酯、或肽核酸主鏈。為了免受核酸酶的降解作用而提供保護,可以將這些主鏈摻入反義或三鏈體寡核苷酸,這在本領域是眾所周知的。用這些或其它經修飾主鏈合成的反義和三鏈體分子也構成本發(fā)明的一個部分。
另外,可使用對IGS5 mRNA序列特異的核酶來預防IGS5多肽的表達。核酶是具有催化活性的天然或合成的RNA(參閱例如N.Usman等人,Curr.Opin.Struct.Biol.,6(4)527-533,1996)。合成核酶可設計成在選定位置特異切割IGS5 mRNA,從而預防IGS5 mRNA翻譯成功能多肽??捎锰烊涣姿岷颂侵麈満吞烊粔A基合成核酶,正如RNA分子中常見的。或者,為了免受核糖核酸酶的降解作用而提供保護,可用非天然主鏈(例如2’-O-甲基RNA)合成核酶,而且可包含經修飾堿基。
對于涉及IGS5表達和活性不足的異常狀況的治療,也可使用幾種方法。一種方法是與制藥學可接受載體一起,對對象施用治療有效量的可刺激本發(fā)明多肽的化合物,由此減輕異常狀況?;蛘?,可采用基因療法來實現(xiàn)對象體內相關細胞內源生成IGS5。例如,如上所述,可改造本發(fā)明的多核苷酸,從而在復制缺陷型逆轉錄病毒載體中進行表達。然后可分離逆轉錄病毒表達構建物,并導入用包含編碼本發(fā)明多肽的RNA的逆轉錄質粒載體轉導的包裝細胞,使得包裝細胞產生包含目的基因的感染性病毒顆粒??蓪ο笫┯眠@些生產者細胞,從而在體內改造細胞和在體內表達多肽。基因療法的概述參閱《HumanMolecular Genetics》(人類分子遺傳學),第20章“基因療法和其它基于分子遺傳學的治療方法”(及其引用的參考文獻),T.Strachan和A.P.Read,BIOS Scientific Publishers有限公司,1996。另一種方法是與合適制藥學載體聯(lián)合施用治療量的本發(fā)明多肽。配方和施用另一方面,本發(fā)明提供了包含治療有效量的多肽(諸如本發(fā)明多肽的可溶性形式)、刺激或抑制肽、或小分子化合物與制藥學可接受載體或賦形劑聯(lián)合而成的制藥學組合物。合適載體包括但不限于鹽水、緩沖鹽水、右旋糖、水、甘油、乙醇、及其組合。本發(fā)明還涉及制藥學包裝和試劑盒,其中包含裝有一種或多種本發(fā)明上述組合物成份的一個或多個容器??梢詥为毥o與本發(fā)明的多肽和其它化合物,或者聯(lián)合其它化合物(諸如治療性化合物)。
組合物應適合于施用路徑,例如全身或口服路徑。全身施用的優(yōu)選路徑包括注射,通常是靜脈內注射。也可使用其它注射路徑,諸如皮下、肌肉內、或腹膜內。全身施用的其它方法包括使用滲透劑(諸如膽鹽或梭鏈孢酸或其它去污劑)的穿粘膜和穿皮施用。另外,若本發(fā)明的多肽或其它化合物能夠配制成腸配方或膠囊配方,則口服施用也是可能的。這些化合物的施用也可以是局部的和/或定位的,以藥膏、糊劑、凝膠等形式進行。
需要的劑量范圍取決于選擇的本發(fā)明肽或其它化合物、施用的路徑、配方的性質、對象狀況的本質、和主治醫(yī)生的判斷。然而,合適的劑量范圍是0.1-100μg/kg對象體重。然而,考慮到可利用化合物的多樣性和不同施用路徑的效率不同,預計所需劑量的變化很大。例如,預計口服施用要求的劑量比靜脈內注射要大。正如本領域完全領會的,可使用標準經驗性路徑來調整這些劑量水平的變化以進行優(yōu)化。
在治療中使用的多肽也可在對象體內內源生成,這就是上文所述的常常稱為“基因療法”的治療形式。因而,例如可使用多核苷酸(諸如DNA或RNA),例如通過使用逆轉錄病毒質粒載體,改造來自對象的細胞,從而離體編碼多肽。然后,將細胞導入對象體內。
多核苷酸和多肽序列構成了有價值的信息來源,借此有可能鑒定具有相似同源性的其它序列。最容易的便于該目的的方法是將序列保存于計算機可讀介質中,然后使用眾所周知的搜索工具(諸如GCC和Lasergene軟件包中的搜索工具)用保存的數(shù)據(jù)來搜索序列數(shù)據(jù)庫。因此,另一方面,本發(fā)明提供了計算機可讀介質,其中貯存了包含SEQID NO1、SEQ ID NO3、或SEQ ID NO5的序列的多核苷酸和/或由其編碼的多肽序列。
將本說明書中引用的所有發(fā)表物(包括但不限于專利和專利申請)收入本文作為參考,就像特異且個別的指定將個別發(fā)表物完整收入本文作為參考。
實施例下列實施例只是為了進一步更詳細的例示本發(fā)明,因此不應當認為這些實施例以任何方式限制本發(fā)明的范圍。實施例1編碼NEP/ECE金屬蛋白酶家族新成員的cDNA的克隆實施例1aNEP/ECE金屬蛋白酶家族新成員的cDNA片段的同源性PCR克隆在表達序列標簽(EST)的DNA數(shù)據(jù)庫中,檢測到4個交疊的EST序列(編號AA524283、AI088893、AI217369、和AI380811),它們所包含的小型開放讀碼框所編碼的蛋白質片段顯示與中性內肽酶24.11/內皮素轉化酶(NEP/ECE)金屬蛋白酶蛋白質家族成員C端部分具有相似性(A.J.Turner等人,F(xiàn)aseb J,11355-364,1997)。這些EST中的NEP/ECE樣小型開放讀碼框由終止密碼子終止(在AA524283的情況中),而且在所有4個EST中前面都有包含所有3種讀碼框形式的終止密碼子的序列。這種居先序列似乎與NEP/ECE金屬蛋白酶家族成員完全無關。盡管小型開放讀碼框的極性與衍生這些EST的mRNA的5’→3’取向相反,仍然決定將這些序列用作RT-PCR同源性克隆方法的基礎。并行的是,在公開的結構域數(shù)據(jù)庫中觀察到了顯示與上述4種EST相同結構的其它EST序列,例如編號AI825876、AI888306、AI422224、AI422225、AI469281、AA975272、AA494534、AW006103、AI827701、AI650385、AI827898、AI934499、和AA422157。使用在EST簇(顯示與NEP/ECE家族具有相似性的區(qū)域內)上設計的反向引物(IP11689;SEQ ID NO7)和集中在NEP/ECE家族保守肽基元[VNA(F,Y)Y]上的簡并正向引物(IP11685;SEQ ID NO8)進行RT-PCR反應。
為了合成cDNA,混合2μg人肺總RNA(Clontech #64023-1)、1μl oligo(dT)12-18(500μg/ml)、和9μl H2O(終體積12μl),加熱至70℃達10分鐘,然后在冰上冷卻。加入4μl 5x第一條鏈緩沖液(250mM Tris-HCl pH8.3、375mM KCl、15mM MgCl2)、2μl 0.1M DTT、1μl 10mM dNTP混合液、和1μl 200U SuperscriptTMII(LifeTechnologies)逆轉錄酶。將混合物于42℃保溫50分鐘,并通過于70℃加熱15分鐘來滅活反應。
在50μl終體積中進行PCR反應,其中包含1μl cDNA合成反應物、5μl GeneAmpTM10x PCR緩沖液(500mM KCl、100mM Tris pH8.3、15mMMgCl2、0.01%(w/v)明膠;Perkin Elmer)、2μl 10mM dNTP混合液、每種各10pmol的正向和反向引物、和5U AmpliTaqTM聚合酶(PerkinElmer)。在初次變性(95℃ 5min)后,將PCR反應進行40個循環(huán)變性(94℃ 1min)、退火(60℃ 1min)、和延伸(72℃,1min)。通過瓊脂糖凝膠電泳分析PCR反應產物。IP11685/IP11689 RT-PCR反應生成了大約600堿基對(bp)的擴增子。使用Qiaex-IITM純化試劑盒(Qiagen)由凝膠純化片段,并使用pGEM-T Easy系統(tǒng)(Promega)依照供應商推薦的流程將片段連接到pGEM-T Easy質粒中。然后將重組質粒用于轉化感受態(tài)大腸桿菌SURETM2細菌(Stratagene)。將經轉化細胞涂布在含100μg/l氨芐青霉素、0.5mM IPTG、和50μg/ml X-gal的LB瓊脂平板上。使用BioRobotTM9600核酸純化系統(tǒng)(Qiagen)由單個菌落的微量培養(yǎng)物純化質粒DNA。使用ABI PrismTMBigDyeTM終止物循環(huán)測序簡易反應試劑盒(PE-ABI),使用插入片段的側翼或內部(IGS5特異)引物,對經純化質粒DNA進行DNA測序反應。通過EtOH/NaOAc沉淀純化循環(huán)測序反應產物,并在ABI 373型自動化測序儀上進行分析。重組克隆YCE14、YCE15、和YCE16(衍生自IP11685/IP11689擴增子)所含插入片段的DNA序列在N端方向上延伸了最初EST簇的開放讀碼框,并進一步確認了這個開放讀碼框來源于NEP/ECE金屬蛋白酶蛋白質家族新成員(見
圖1)。因而,這種上游序列完全偏離EST序列中存在的上游序列。這種新序列在本發(fā)明的內容中一般稱為“IGS5”。實施例1b包含IGS5推定胞外結構域(ectodomain)的cDNA的克隆為了獲得其它IGS5 cDNA序列,使用對IGS5特異的反向引物IP12190(SEQ ID NO9)和集中在NEP/ECE家族保守肽基元[LXXLXWMD]上的簡并正向引物IP12433(SEQ ID NO10)在上文所述條件下對人肺RNA進行另一輪RT-PCR反應。IP12190/IP12433 RT-PCR反應生成了大約600bp的擴增子,將其克隆到pGEM-T Easy載體中而生成克隆YCE19、YCE22、和YCE23。將所有克隆完整測序,從而能夠進一步向上游延伸IGS5開放讀碼框(見圖1)。
為了獲得覆蓋IGS5轉錄本5’末端的cDNA克隆,使用與MarathonTMcDNA擴增試劑盒(Clontech K1802-1)一起提供的銜接頭引物1(AP1SEQID NO11)與IGS5特異引物IP12189(SEQ ID NO12)和IP12585(SEQ ID NO13)的組合,對人心臟Marathon-ReadyTMcDNA進行半嵌套5’-RACE PCR。依照由Clontech提供的Marathon-ReadyTMcDNA用戶手冊的指示進行PCR RACE反應。將RACE產物在瓊脂糖凝膠上分開,用溴化乙錠染色,并印跡到Hybond-N+膜上。將印跡在修改后的Church緩沖液(0.5M磷酸鹽、7%SDS、10mM EDTA)中于65℃預雜交2小時,然后在含2×106cpm/ml32P標記的克隆YCE23插入片段的相同緩沖液中于65℃雜交過夜。使用Prime-ItTMII試劑盒(Stratagene),依照供應商提供的指示,通過隨機引發(fā)摻入[α-32P]DCTP而將YCE23插入片段放射性標記至比活>109cpm/μg。在高嚴謹度(2x SSC/0.1%SDS,室溫,2×30min;隨后0.1x SSC/0.1%SDS,65℃,2×40min)清洗雜交印跡,并放射自顯影過夜。由凝膠純化雜交片段,克隆到pGEMTM-T Easy載體中(生成克隆YCE59、YCE64、和YCE65),并如上所述測序。
可以將所有分離克隆的DNA序列裝配成單個毗連序列群(IGS5CONS;見圖1),它將IGS5的開放讀碼框進一步向上游延伸,但是仍未遭遇翻譯起始密碼子ATG。根據(jù)EST AI380811設計了引物IP11689,它不包含經比對EST序列中存在的終止密碼子之前的最后4個核苷酸。為了生成在終止密碼子處終止的開放讀碼框,在IGS5CONS的整體裝配中包括經比對EST序列的最后(共有的)22個核苷酸。
同源性搜索顯示,(部分)編碼的蛋白質與中性內肽酶(NEP;見實施例2)最相似。然而,IGS5CONS開放讀碼框的最初20個氨基酸顯示與NEP不具有任何相似性。這有可能歸因于它們衍生自內含子的事實。事實上,人NEP外顯子4的起始位置大致對應于這20個氨基酸的下游位置(L.D’Adamio等人,Proc.Natl.Acad.Sci.USA,867103-7107,1989)。親水性分析(J.Kyte等人,J.Mol.Biol.,157105-132,1982;P.Klein等人,Biochim.Biophys.Acta,815468-476,1985)未指示在推測的IGS5CONS氨基酸序列中存在跨膜結構域,而預計在最初20個氨基酸中應存在這種跨膜結構域。由于這些原因,優(yōu)選排除IGS5毗連序列群的最初序列部分(圖1)。產生的DNA序列(IGS5DNA;SEQ IDNO1)長度為2076個核苷酸(包括終止密碼子),編碼691個殘基的蛋白質(IGS5PROT;SEQ ID NO2)。IGS5PROT與人NEP蛋白質序列的比對顯示,IGS5PROT序列對應于NEP的完整胞外結構域序列。因而,能夠預計IGS5PROT具有推定IGS5酶的全部酶活性,正如NEP胞外結構域所證明的(F.Fossiez等人,Biochem.J.,28453-59,1992)。
表7實施例1中所用寡聚引物的概述
實施例2IGS5與NEP/ECE金屬蛋白酶家族成員的蛋白質序列的比對對于實施例1a中克隆的IGS5序列,使用BLSAT算法(S.F.Altschul等人,Nucleic Acids Res.,253389-3402,1997)執(zhí)行對現(xiàn)有蛋白質數(shù)據(jù)庫和翻譯后DNA數(shù)據(jù)庫的同源性搜索。這些搜索顯示,該IGS5蛋白質與小鼠、大鼠、和人中性內肽酶(SWNEP_MOUSE,編號Q61391;SWNEP_RAT,編號P07861;和SWNEP_HUMAN,編號P08473)最相似(在大約700個比對殘基上具有54-55%同一性)。
因而,幾乎完整的IGS5蛋白質序列與其它NEP/ECE家族成員的這一比對顯示了IGS5與金屬蛋白酶(一般而言)和與NEP和/或ECE金屬蛋白酶家族(具體而言)的關系。由這種結構比對得出結論,IGS5具有金屬蛋白酶的功能性,因而它在動物和人的幾種機能障礙、紊亂、或疾病方面受到關注。實施例3編碼NEP/ECE金屬蛋白酶家族新成員的cDNA的克隆實施例3aNEP/ECE金屬蛋白酶家族新成員的cDNA片段的同源性PCR克隆在表達序列標簽(EST)的DNA數(shù)據(jù)庫中,檢測到4個交疊的EST序列(編號AA524283、AI088893、AI217369、和AI380811),它們所包含的小型開放讀碼框所編碼的蛋白質片段顯示與中性內肽酶24.11/內皮素轉化酶(NEP/ECE)金屬蛋白酶蛋白質家族成員C端部分有相似性(A.J.Turner等人,F(xiàn)aseb J,11355-364,1997)。這些EST中的NEP/ECE樣小型開放讀碼框由終止密碼子終止(在AA524283的情況中),而且在所有4個EST中前面都有包含所有3種讀碼框形式的終止密碼子的序列。這種居先序列似乎與NEP/ECE金屬蛋白酶家族成員完全無關。盡管該小型開放讀碼框的極性與衍生這些EST的mRNA的5’→3’取向相反,仍然決定將這些序列用作RT-PCR同源性克隆方法的基礎。并行的是,在公開的結構域數(shù)據(jù)庫中觀察到了顯示與上述4種EST相同結構的其它EST序列,例如編號AI825876、AI888306、AI422224、AI422225、AI469281、AA975272、AA494534、AW006103、AI827701、AI650385、AI827898、AI934499、和AA422157。使用在EST簇(顯示與NEP/ECE家族有相似性的區(qū)域內)上設計的反向引物(IP11689;SEQ ID NO7)和集中在NEP/ECE家族保守肽基元[VNA(F,Y)Y]上的簡并正向引物(IP11685;SEQ ID NO8)進行RT-PCR反應。
為了合成cDNA,混合2μg人肺總RNA(Clontech #64023-1)、1μl oligo(dT)12-18(500μg/ml)、和9μl H2O(終體積12μl),加熱至70℃達10分鐘,然后在冰上冷卻。加入4μl 5x第一條鏈緩沖液(250mM Tris-HCl pH8.3、375mM KCl、15mM MgCl2)、2μl 0.1M DTT、1μl 10mM dNTP混合液、和1μl 200U SuperscriptTMII(LifeTechnologies)逆轉錄酶。將混合物于42℃保溫50分鐘,并通過于70℃加熱15分鐘來滅活反應。
在50μl終體積中進行PCR反應,其中包含1μl cDNA合成反應物、5μl GeneAmpTM10x PCR緩沖液(500mM KCl、100mM Tris pH8.3、15mMMgCl2、0.01%(w/v)明膠;PE Biosystems)、2μl 10mM dNTP混合液、每種各10pmol的正向和反向引物、和5U AmpliTaqTM聚合酶(PEBiosystems)。在初次變性(95℃ 5min)后,將PCR反應進行40個循環(huán)變性(94℃ 1min)、退火(60℃ 1min)、和延伸(72℃,1min)。通過瓊脂糖凝膠電泳分析PCR反應產物。IP11685/IP11689 RT-PCR反應生成了大約600堿基對(bp)的擴增子。使用Qiaex-IITM純化試劑盒(Qiagen)由凝膠純化片段,并使用pGEMTM-T Easy系統(tǒng)(Promega)依照供應商推薦的流程將片段連接到pGEMTM-T Easy質粒中。然后將重組質粒用于轉化感受態(tài)大腸桿菌SURETM2細菌(Stratagene)。將經轉化細胞涂布在含100μg/ml氨芐青霉素、0.5mM IPTG、和50μg/mlX-gal的LB瓊脂平板上。使用BioRobotTM9600核酸純化系統(tǒng)(Qiagen)由單個菌落的微量培養(yǎng)物純化質粒DNA。使用ABI PrismTMBigDyeTM終止物循環(huán)測序簡易反應試劑盒(PE Biosystems),使用插入片段的側翼或內部引物,對經純化質粒DNA進行DNA測序反應。對質粒的兩條鏈完整測序。通過EtOH/NaOAc沉淀純化循環(huán)測序反應產物,并在ABI 373型自動化測序儀上進行分析。重組克隆YCE14、YCE15、和YCE16(衍生自IP11685/IP11689擴增子)所含插入片段的DNA序列在N端方向上延伸了最初EST簇的開放讀碼框,并進一步支持這個開放讀碼框衍生自NEP/ECE金屬蛋白酶蛋白質家族新成員的假設(見圖2)。因而,這種上游序列完全偏離EST序列中存在的上游序列。這種新序列在本發(fā)明的內容中一般稱為“IGS5”。實施例3b包含IGS5全長編碼序列的cDNA片段的克隆為了獲得其它IGS5 cDNA序列,使用對IGS5特異的反向引物IP12190(SEQ ID NO9)和集中在NEP/ECE家族保守肽基元[LXXLXWMD]上的簡并正向引物IP12433(SEQ ID NO10)在上文所述條件下對人肺RNA進行另一輪RT-PCR反應。IP12190/IP12433 RT-PCR反應生成了大約600bp的擴增子,將其克隆到pGEMTM-T Easy載體中而生成克隆YCE19、YCE22、和YCE23。將所有克隆完整測序,從而能夠進一步向上游延伸IGS5開放讀碼框(見圖2)。
為了獲得覆蓋IGS5轉錄本5’末端的cDNA克隆,使用與MarathonTMcDNA擴增試劑盒(Clontech K1802-1)一起提供的銜接頭引物1(AP1SEQ ID NO11)與IGS5特異引物IP12189(SEQ ID NO12)和IP12585(SEQ ID NO13)的組合對人心臟Marathon-ReadyTMcDNA進行半嵌套5’-RACE PCR。依照由Clontech提供的Marathon-ReadyTMcDNA用戶手冊的指示進行PCR RACE反應。將RACE產物在瓊脂糖凝膠上分開,用溴化乙錠染色,并轉移到HybondTM-N+膜(Amersham)上。將印跡在修改后的Church緩沖液(0.5M磷酸鹽、7%SDS、10mM EDTA)中于65℃預雜交2小時,然后在含2×106cpm/ml32P標記的克隆YCE23插入片段的相同緩沖液中于65℃雜交過夜。使用Prime-ItTMII試劑盒(Stratagene),依照供應商提供的指示,通過隨機引發(fā)摻入[α-32P]dCTP將YCE23插入片段放射性標記至比活>109cpm/μg。在高嚴謹度(2x SSC/0.1%SDS,室溫,2×30min;隨后0.1x SSC/0.1%SDS,65℃,2×40min)清洗雜交印跡,并放射自顯影過夜。由凝膠純化雜交片段,克隆到pGEMTM-T Easy載體中(生成克隆YCE59、YCE64、和YCE65),并如上所述測序。
可以將所有分離克隆的DNA序列裝配成單個毗連序列群,它將IGS5的開放讀碼框進一步向上游延伸,然而仍未遭遇翻譯起始密碼子。根據(jù)EST AI380811設計了引物IP11689,其中未摻入經比對EST序列中存在的終止密碼子之前的最后4個核苷酸。為了生成在終止密碼子處終止的開放讀碼框,在毗連序列群中包括經比對EST序列的最后(共有的)22個核苷酸。
通過5’RACE PCR延伸或通過篩選cDNA文庫來克隆IGS5編碼序列中仍然缺失的氨基末端部分的幾次嘗試都失敗了。因此,現(xiàn)試圖獲得初步IGS5毗鄰序列群5’末端附近和上游的基因組序列信息。將在λEMBL3噬菌體載體中構建的人基因組DNA文庫(Clontech HL1067j)的大約550,000個噬斑復制到HybondTM-N+膜上。將膜復制物在修改后的Church緩沖液中于65℃預雜交2小時,然后在含2×106cpm/ml32P標記的位于克隆YCE59 5’末端的大約150bp EcoRI/EcoRII片段的相同緩沖液中于65℃雜交過夜。使用Prime-ItTMII試劑盒(Stratagene),依照供應商提供的指示,通過隨機引發(fā)摻入[α-32P]dCTP將cDNA探針放射性標記至比活>109cpm/μg。在高嚴謹度(2x SSC/0.1%SDS,室溫,2×30min;隨后0.1x SSC/0.1%SDS,65℃,1×40min)清洗雜交印跡,并放射自顯影。將雜交噬斑進行第二輪篩選,并獲得純的單個噬斑。使用QiagenTMλMidi試劑盒(Qiagen)由受感染液體培養(yǎng)物純化重組噬菌體DNA,并使用側翼EMBL3載體引物和IGS5內部引物如上所述進行測序。由克隆IGS5/S1的插入片段測得了初步IGS5毗鄰序列群上游大約5000個核苷酸的序列。對翻譯后DNA數(shù)據(jù)庫的同源性搜索顯示,這5000bp片段所含一個78bp片段編碼的肽與小鼠SEP序列(GenBank編號AF157105)中其它方式剪接的69bp片段最相似(在25個經比對殘基上15個相同),而后者是最近描述的NEP/ECE家族新成員(Ikeda等人,JBC,27432469-32477,1999)。這一78bp人片段的前后分別是推定的共有剪接受體和供體位點,但是不含翻譯起始密碼子ATG。
為了獲得包含IGS5編碼序列氨基末端部分的cDNA克隆,使用與MarathonTMcDNA擴增試劑盒(Clontech K1802-1)一起提供的銜接頭引物1(AP1SEQ ID NO11)與在上文所述78bp基因組片段內設計的IGS5特異性反義引物IP14241(SEQ ID NO14)和IP14242(SEQ ID NO15)的組合對人睪丸Marathon-ReadyTMcDNA(Clontech 7414-1)進行半嵌套5’-RACE PCR。依照由Clontech提供的Marathon-ReadyTMcDNA用戶手冊的指示進行PCR RACE反應(反應體積=25μl)。將RACE產物在瓊脂糖凝膠上分開,用溴化乙錠染色,并通過Southern印跡分析。
為了生成用于印跡RACE產物的特異性雜交探針,使用反向寡核苷酸引物IP14241(SEQ ID NO14)和集中在小鼠SEP蛋白質跨膜結構域中的肽基元[GLMVLLLL]上的簡并正向引物IP13798(SEQ ID NO16)對上文獲得的嵌套RACE產物進行半同源PCR反應。在25μl終體積中進行PCR反應,其中包含1μl半嵌套5’RACE PCR反應產物、2.5μlGeneAmpTM10x PCR緩沖液(500mM KCl、100mM Tris pH8.3、15mM MgCl2、0.01%(w/v)明膠;PE Systems)、1μl 10mM dNTP混合液、每種各10pmol的正向和反向引物、和2.5U AmpliTaq-GoldTM聚合酶(PEBiosystems)。在初次變性(95℃ 10min)后,將PCR反應進行35個循環(huán)變性(95℃ 1min)、退火(50℃ 30sec)、和延伸(72℃,30sec)。通過瓊脂糖凝膠電泳分析PCR反應產物。半同源性PCR反應生成了大約110個堿基對的擴增子。使用Qiaex-IITM純化試劑盒(Qiagen)由凝膠純化片段,并使用pGEMTM-T系統(tǒng)(Promega)依照供應商推薦的流程將片段連接到pGEMTM-T質粒中。然后將重組質粒用于轉化感受態(tài)大腸桿菌SURETM2細菌(Stratagene)。將經轉化細胞涂布在含100μg/ml氨芐青霉素、0.5mM IPTG、和50μg/ml X-gal的LB瓊脂平板上。使用BioRobotTM9600核酸純化系統(tǒng)(Qiagen)由單個菌落的微量培養(yǎng)物純化質粒DNA,并如上所述測序。重組克隆YCE207、YCE212、YCE216、YCE217、YCE218、和YCE219所含插入片段的DNA序列能夠與上文所述78bp基因組片段一起裝配成單個毗鄰序列群(見圖2)。
將半嵌套5’RACE PCR反應產物的Southern印跡在修改后的Church緩沖液中于65℃預雜交1小時,然后在含2×106cpm/ml32P標記的克隆YCE207插入片段的相同緩沖液中于65℃雜交過夜。在高嚴謹度清洗雜交印跡,并放射自顯影。由凝膠純化雜交片段,克隆到pGEMTM-T載體中(生成克隆YCE223、YCE224、和YCE226),并如上所述測序。這些克隆的DNA序列能夠與78bp基因組片段以及克隆YCE207、YCE212、YCE216、YCE217、YCE218、和YCE219裝配成單個毗鄰序列群(圖2)。產生的毗鄰序列群包含一個起始于ATG起始密碼子的開放讀碼框,編碼的蛋白質顯示與小鼠SEP蛋白質N端序列有高度相似性。
為了獲得覆蓋IGS5編碼序列的氨基末端部分且與克隆YCE59交疊的cDNA克隆,使用基于IGS5 5’UTR序列的特異正向引物(IP14535;SEQID NO17)與位于YCE59內的特異反向引物(IP14537;SEQ ID NO18),對人睪丸Marathon-ReadyTMcDNA(Clontech 7414-1)進行PCR反應。在25μl體積中進行PCR反應,其中包含2.5μl人睪丸Marathon-ReadyTMcDNA、2.5μl GeneAmpTM10x PCR緩沖液(500mM KCl、100mM Tris pH8.3、15mM MgCl2、0.01%(w/v)明膠;PE Biosystems)、1μl 10mM dNTP混合液、每種各10pmol的正向和反向引物、和2.5UAmpliTaq-GoldTM聚合酶(PE Biosystems)。在初次變性(95℃ 10min)后,將PCR反應進行41個循環(huán)變性(95℃ 1min)、退火(53℃ 1min)、和延伸(72℃,1min)。通過瓊脂糖凝膠電泳分析PCR反應產物。PCR反應生成了分別為大約300和380堿基對的兩種擴增子。由凝膠純化該300bp和380bp片段,克隆到pGEMTM-T載體中,并如上所述測序。這生成了克隆YCE231、YCE233、和YCE235(300bp片段)以及YCE229(380bp片段)。
將所有分離克隆的DNA序列裝配起來顯示存在因最初在基因組克隆IGS5/S1中鑒定的78bp片段的存在與否而不同的兩種cDNA序列。這兩種序列有可能起源于不同剪接的RNA分子。最長的轉錄本包含2337個核苷酸(編碼779個殘基的蛋白質)的開放讀碼框,而較短的轉錄本包含2259個核苷酸(編碼753個殘基的蛋白質)的開放讀碼框。我們將長型的編碼序列和蛋白質序列分別稱為IGS5DNA1(SEQ ID NO3,2340bp,包括終止密碼子標簽)和IGS5PROT1(SEQ ID NO4),而將短型的編碼序列和蛋白質序列分別稱為IGS5DNA2(SEQ ID NO5,2262bp,包括終止密碼子標簽)和IGS5PROT2(SEQ ID NO6)。在IGS5DNA1和IGS5DNA2中假定甲硫氨酸起始密碼子的下游,在第10位密碼子處存在另一個符合讀碼框的甲硫氨酸密碼子。盡管我們已經采用了第一個甲硫氨酸密碼子作為起始密碼子,由于兩個甲硫氨酸似乎處于同等有利的翻譯“Kozak”起始范圍內,因而不能排除翻譯有時(或甚至完全的)由第10位密碼子起始(M.Kozak,Gene,234187-208,1999)。IGS5PROT1和IGS5PROT2序列的親水性分析(J.Kyte等人,J.Mol.Biol.,157105-132,1982;P.Klein等人,Biochim.Biophys.Acta,815468-476,1985)顯示,在第22-50位殘基間存在單個跨膜結構域。這指示IGS5PROT1和IGS5PROT2是II型整合膜蛋白,因而具有與NEP/ECE蛋白質家族其它成員相似的膜拓撲學。
表8實施例3中所用寡核苷酸引物的概述
實施例4IGS5與NEP/ECE金屬蛋白酶家族成員的蛋白質序列的比對對于實施例3中克隆的IGS5序列,使用BLSAT算法(S.F.Altschul等人,Nucleic Acids Res.,253389-3402,1997)執(zhí)行對現(xiàn)有蛋白質數(shù)據(jù)庫和翻譯后DNA數(shù)據(jù)庫的同源性搜索。這些搜索顯示,IGS5PROT1與小鼠SEP(GenBank編號AF157105)最相似(在778個比對殘基上具有76%同一性),還在696個比對殘基上顯示與小鼠、大鼠、和人中性內肽酶(SWNEP_MOUSE,編號Q61391;SWNEP_RAT,編號P07861;和SWNEP_HUMAN,編號P08473)有54-55%同一性。IGS5PROT2的同源性搜索顯示,這種序列與小鼠SEP(GenBank編號AF157106)最相似(在752個比對殘基上具有78%同一性)。在與小鼠SEP和SEP蛋白質的類比中,預計IGS5PROT1和IGS5PROT2分別代表IGS5蛋白質的膜結合形式和可溶性形式。這通過可變剪接的78bp外顯子3’端編碼的二堿性殘基(KRK)的存在得到了確證。
因而,完整IGS5蛋白質序列與其它NEP/ECE家族成員的比對顯示了IGS5與NEP/ECE金屬蛋白酶(一般而言)和與SEP和NEP家族成員(具體而言)的關系。由這種結構比對得出結論,IGS5蛋白具有金屬蛋白酶的功能性,因而在動物和人的幾種機能障礙、紊亂、或疾病方面受到關注。實施例5IGS5的RNA表達分析對人RNA Master印跡TM的IGS5表達分析如下制備Express-HybTM(Clontech#8015-1)和剪碎鮭魚睪丸DNA的溶液于50-60℃預熱15ml Express-HybTM。將1.5mg剪碎鮭魚睪丸DNA于95℃加熱5分鐘,然后在冰上迅速冷卻。將熱變性的剪碎鮭魚睪丸DNA與預熱的Express-HybTM混合。將人RNA Master印跡TM(Clontech#7770-1)在上文制備的10ml溶液中于65℃預雜交30分鐘,連續(xù)攪動。將使用Prime-ItTMII試劑盒(Stratagene)32P標記的YCE15探針加熱變性,并加到剩余的5ml Express-HybTM溶液中。于65℃雜交過夜。在2xSSC/1%SDS中于65℃清洗100分鐘(5×20min)。在200ml 0.1x SSC/0.5%SDS中于55℃再清洗2×20分鐘。最后使用X射線膠片使Master印跡放射自顯影。
IGS5探針在Master印跡TM上的雜交顯示在廣泛組織中表達,特別是睪丸、小腸、前列腺、和胃中表達(圖3)。對人腦多種組織Northern印跡II和IV(分別為#7755-1和#7769-1)的IGS5表達分析于68℃預熱Express-HybTM溶液(Clontech#8015-1)。將印跡于68℃預雜交1小時。將100μg剪碎鮭魚睪丸DNA加到使用Prime-ItTMII試劑盒(Stratagene)32P標記的YCE15探針中,并于95℃加熱變性10分鐘。將探針加到剩余的5ml Express-HybTM溶液中,并于68℃雜交2小時。在2x SSC/0.05%SDS中于室溫清洗40分鐘(2×20min)。在200ml0.1x SSC/0.1% SDS中于55℃再清洗2×20分鐘。使用X射線膠片使印跡放射自顯影。
此次Northern印跡分析顯示,在所研究的所有組織中存在大約3kb的主要雜交條帶和大約5.5-6kb的次要條帶。實施例6His標記的人IGS5胞外結構域的表達和純化本實驗目的是使用桿狀病毒表達系統(tǒng)生成可溶性IGS5蛋白質。構建在感染Sf9細胞系后表達His6標記的IGS5胞外結構域的重組桿狀病毒。然后在包括扁豆凝集素和Zn-IMAC層析的兩步流程中由培養(yǎng)物上清液純化可溶性IGS5蛋白質。
我們將阿黑皮素原(POMC)前體的信號肽融合His標記的IGS5胞外結構域部分的編碼序列。由于該蛋白質的酶活性位點(金屬蛋白酶)位于C末端,我們優(yōu)選將His純化標簽加到蛋白質N端。此外,將Gly-Ser接頭插在POMC信號肽與IGS5胞外結構域之間。表達的IGS5蛋白質由IGS5PROT2的第60位殘基起始(SEVC...),因而包含幾乎整個IGS5胞外結構域。克隆策略包括合成寡核苷酸裝配、交疊PCR、和3點連接。這導致由POMC信號(分泌時切除)、Gly-Ser接頭、His6肽、和IGS5胞外結構域構成的蛋白質的表達。實施例6apAcSG2SOLhuIGS5His6桿狀病毒轉移載體的構建為了構建pAcSG2SOLhuIGS5桿狀病毒轉移載體,生成下列DNA片段1.用StuI/NotI消化pAcSG2載體(BD PharMingen)。使用Qiaex-IITM提取試劑盒(Westburg)由瓊脂糖凝膠提取5527bp片段,并溶于30μl10mM Tris-HCl pH8.5。
2.通過PCR與限制性消化/連接的聯(lián)合由克隆YCE15、YCE22、YCE64、和YCE65裝配pGEMTM-T克隆YCE174。將與IP11689相反而確實包含IGS5編碼序列的最后4個核苷酸和終止密碼子的引物IP13541用于該流程(表9)。因此YCE174包含huIGS5胞外結構域直至(且包括)終止密碼子的幾乎整個編碼區(qū)(圖2)。用XhoI/NotI消化YCE174,如瓊脂糖凝膠電泳所示,產生3025bp、1723bp、和448bp片段。由凝膠提取(Qiaex-IITM,Qiagen)包含huIGS5胞外結構域編碼區(qū)的1723bp片段,并溶于20μl 10mM Tris-HCl pH8.5。
3.通過聯(lián)合寡核苷酸IP14165、IP14114、IP14115、IP14116、IP14117、IP14118、IP14119、和IP14120,及隨后使用引物IP14166和IP14110的交疊PCR,裝配5’端含StuI識別位點、隨后是POMC信號序列、Gly-Ser接頭、His6標簽、和IGS5胞外結構域編碼序列5’末端65bp的合成核酸片段(180bp)(表9;也可見圖4)。通過在第57位核苷酸處導入沉默突變來除去天然POMC信號肽編碼序列中存在的StuI位點(IP14115,第30位核苷酸G→A)。
表9實施例6中所用寡核苷酸引物的概述
使用引物IP14111和IP14112由克隆YCE174模板擴增第二種PCR片段(495bp)。該第一種和第二種PCR產物共享長度為65bp的交疊區(qū)。使用兩種PCR產物作為模板,使用引物IP14166和IP14112,進行交疊PCR,生成最終的610bp PCR片段。將該片段在QiaQuick旋轉柱(Qiagen)上純化,StuI/XhoI消化,并由瓊脂糖凝膠提取(Qiaex-IITM)產生的496bp片段。
在連接反應中將如上所述生成的3種DNA片段(5527、1723、和496bp)聯(lián)合起來。將連接混合物于16℃保溫過夜,并用于轉化感受態(tài)DH5αF’細胞。將經轉化細菌涂布在含100μg/ml氨芐青霉素的LB瓊脂平板上。將平板于37℃保溫過夜。在添加100μg/ml氨芐青霉素的5mlLB培養(yǎng)基中培養(yǎng)30個隨機菌落。使用BioRobotTM9600核酸純化系統(tǒng)(Qiagen)制備質粒DNA,并通過BamHI消化進行篩選。對展示正確限制性模式的7個克隆,通過XhoI、StuI、AlwNI、HindIII、和HincII消化和插入片段序列分析進行進一步分析。最后選擇一個具有正確限制性模式和預期插入片段序列的克隆,并作為ICCG4502保藏于培養(yǎng)物收藏中心(菌株表)(該克隆在轉移載體的第878位包含沉默突變G→A)。
由保藏的克隆進行無菌Qiagen Midi DNA制備(Westburg),生成110μg DNA。XhoI、AlwNI、StuI、HIndIII、和HincII消化的限制性分析揭示了正確的限制性模式,如瓊脂糖凝膠電泳所示。序列分析確認了預期序列。圖5顯示了pAcSG2SOLhuIGS5His6桿狀病毒轉移載體的圖譜。實施例6b用于表達可溶性huIGS5His6的重組桿狀病毒的生成通過pAcSG2SOLhuIGS5His6轉移載體DNA(ICCG4502)與野生型桿狀病毒基因組修改版的線性化基因組DNA(BaculoGold;Pharmingen目錄編號21100D)在宿主昆蟲細胞(Spodoptera frugiperda Sf9細胞)中共轉染(磷酸鈣轉染法),生成表達N端His標記的人IGS5胞外結構域(減去一些氨基酸)的重組桿狀病毒。BaculoGold DNA包含致死刪除,而且不編碼可存活病毒。BaculoGold DNA與互補桿狀病毒轉移載體的共轉染通過同源重組挽救了該致死刪除。使用這種方法,噬斑純化了3個候選重組體。擴增所有候選重組體。實施例6c真核表達動力學表達分析通過低速離心收集在旋轉燒瓶中在添加10%滅活胎牛血清(GibcoBRL目錄編號10084168)的TC100培養(yǎng)基(JRH Biosciences目錄編號56941)中于27℃指數(shù)懸浮生長的Sf9細胞(IGCL 83.0),并以5×105細胞/瓶(25cm2)接種在無血清TC100培養(yǎng)基中。以感染復數(shù)(MOI)3pfu/細胞加入候選重組病毒克隆,隨后將細胞/病毒培養(yǎng)物于27℃保溫。在感染后24、48、和72小時,通過兩次連續(xù)低速離心收集條件培養(yǎng)基(CM)。通過SDS-PAGE凝膠電泳和Western印跡分析樣品。
Western印跡揭示了所有候選克隆的CM中都有大約81kDa的清晰條帶,符合該成熟蛋白質的理論Mr(81.2kDa)(未顯示)。所有3個克隆的表達水平在感染后48-72小時達到峰值。選擇2號克隆進一步擴增,并作為IGBV73保藏。最佳收獲時間設定為感染后72小時。脫糖基研究可溶性人IGS5蛋白質序列包含8個潛在N-糖基化位點(圖6)。既然純化方案包括在扁豆凝集素柱上結合糖基,那么將感染后72小時收集的所有候選重組病毒克隆的CM樣品用于N-糖苷酶F的脫糖基化研究,以檢查重組體可溶性His6IGS5蛋白質是否確實作為糖基化蛋白質表達。
向樣品中加入SDS至終濃度1%,并于95℃保溫5分鐘。加入1倍體積的2x保溫緩沖液(250mM磷酸鹽緩沖液、50mM EDTA、5%N-辛基糖苷、1% 2-巰基乙醇)并于95℃再次保溫5分鐘后,將樣品冷卻至37℃。加入1U N-糖苷酶F(Boehringer Mannheim目錄編號1365177),并在于37℃保溫過夜后用100mM DTT(終濃度)還原樣品。
經N-糖苷酶F處理的CM樣品和未處理對照的Western印跡分析顯示,樣品脫糖基化后Mr發(fā)生變化(圖7),證明可溶性人His標簽IGS5是作為糖基化蛋白質表達的。實施例6d純化制備性生產和樣品處理通過低速離心收集在旋轉燒瓶中在添加10%滅活胎牛血清(GibcoBRL目錄編號10084168)的TC100培養(yǎng)基(JRH Biosciences目錄編號56941)中于27℃指數(shù)懸浮生長的Sf9細胞(IGCL 83-2),并以2×106細胞/ml的密度重懸于添加0.013TIU/ml抑酶肽(Pentex)的TC100培養(yǎng)基中。以感染復數(shù)(MOI)2.25pfu/細胞,將重組病毒IGBV73加到細胞中。隨后將細胞/病毒懸浮物在玻璃滾瓶(3×500ml/1260cm2)中于27℃保溫72小時。然后通過兩次連續(xù)低速離心將CM(1.5L)與細胞和細胞碎片分開。向300ml澄清桿狀病毒CM中加入1片無EDTA的完全EFC(Roche Biochemicals目錄編號1873580)。分別加入HEPES、甘油、和吐溫20至終濃度20mM、5%(v/v)、和0.005%(w/v)。將CM的pH調至7.4,并將樣品過濾(Durapore膜濾器0.2μ GV)。所有純化步驟都于4℃進行。扁豆凝集素層析將桿狀病毒樣品以0.3ml/min上樣至裝在C10/10柱(Pharmacia)中用添加1片EFC/500ml的緩沖液A(20mM Hepes pH7.4、150mM NaCl、5%甘油、0.005%吐溫20)平衡的5ml扁豆凝集素Sepharose樹脂上過夜。用平衡緩沖液清洗層析柱直至280nm吸光值達到基線水平,并用含0.5M α-甲基吡喃糖苷的緩沖液A以1ml/min洗脫結合的蛋白質。通過應用100mM醋酸、500mM NaCl(pH5.0)再生柱。手工收集洗脫液和再生液,并通過12.5%Phast凝膠(Pharmacia)的SDS-PAGE和銀染分析合并液。包括有預染標準(Gibco)作為相對分子量(Mr)標準。在流出物中回收蛋白質的主要量,而且在1-3號洗脫合并液中觀察到Mr大約85,000的IGS5候選條帶(圖8)??笻is標簽mAb對扁豆層析的Western印跡分析顯示,可溶性hIGS5蛋白質(Mr大約85,000)定量結合于扁豆凝集素樹脂,而且His標記的蛋白質整個洗脫峰中回收,但是主要在1號和2號合并液中(圖9)。在Zn-IMAC柱上進一步加工1號和2號扁豆凝集素洗脫合并液(運行A和B)。固定化金屬親和層析(IMAC)和透析如制造商所述將鋅離子上樣至1ml螯合HiTrap(Pharmacia)上,并用緩沖液B(20mM Hepes、100mM NaCl、5%甘油、0.005%(w/v)吐溫20,pH7.2)平衡。將1號和2號扁豆洗脫合并液以0.5ml/min分別上樣至HiTrap柱中(IMAC運行A和IMAC運行B)。包括空白運行以比較層析吸光值圖譜。用緩沖液B清洗層析柱直至基線水平,并用溶于緩沖液B的咪唑分級梯度(20、50、100、和200mM)洗脫結合的蛋白質。手工收集各級分。用20mM Hepes、50mM EDTA、500mM NaCl pH7.2再生IMAC柱。通過SDS-PAGE(12.5%Phast凝膠,Pharmacia)和銀染分析洗脫和再生合并液。將200mM咪唑合并液轉移至slide alyzer盒(MWCO10,000,Pierce)并在緩沖液B(130倍過量,不更換緩沖液)中透析過夜。使用micro-BCA法(Pierce)測定透析后合并液中可溶性IGS5的量。包括BSA作為參照物。通過(1)還原和非還原條件下的SDS-PAGE和(2)使用抗His標簽的mAb(21E1B4,Innogenetics)的Western印跡,隨后與堿性磷酸酶標記的兔抗小鼠Ig(Dako)一起保溫,并通過NBT/BCIP染色進行檢測,由此在生物化學上表征透析后桿狀病毒IGS5。通過PGN酶F處理(Biorad)確認了可溶性IGS5的糖基化狀態(tài)。
SDS-PAGE分析和銀染顯示,20mM和50mM咪唑梯度洗脫了大量雜質蛋白質(圖10)。在100mM和200mM咪唑洗脫梯度中回收到hIGS5蛋白質。200mM咪唑合并液中的85kDa條帶在SDS-PAGE上是單一條帶,它與抗His標簽mAb發(fā)生反應(圖9)。銀染未揭示由IMAC運行A和運行B獲得的hIGS5材料之間有任何純度差異。由300ml桿狀病毒CM開始,通過兩步純化流程獲得了340μg超過95%純的含His標簽hIGS5胞外結構域(即產量為大約1mg/L)。
SDS-PAGE后,將200mM咪唑Zn-IMAC合并液轉印跡至PVDF膜,并通過酰胺黑染色使蛋白質顯影。先后用20%乙腈和20%甲醇清洗PVDF條帶,并干燥。使用ProciseTM492A(Applied Biosystems)依照制造商的說明書通過Edman降解進行氨基末端測序。氨基末端測序確認了在桿狀病毒IGS5回收在85kDa蛋白質條帶中。實施例7酶抑制實驗針對生物學活性肽的代謝測試本發(fā)明IGS5多肽的酶活性。具體而言,測試這些IGS5多肽是否作用于本領域現(xiàn)階段知道的多種血管活性肽,諸如心房鈉尿肽(ANP)、緩激肽、大內皮素(大ET-1)、內皮素(ET-1)、物質P、和血管緊張素-1。在本發(fā)明的內容中,具體而言,測試IGS5胞外結構域(新型人金屬蛋白酶)是否水解上述血管活性肽。為了比較,還對早先描述成可溶性分泌型內肽酶(SEP)(Emoto等人,J.Biol.Chem.,27432469-32477,1999)的金屬蛋白酶家族已知成員進行測定。此外,測試了IGS5轉化大ET-1類似物(所謂的17個氨基酸的大ET)的活性是否受到參考化合物的抑制,所述參考化合物用于測定對具有ECE和/或NEP特征的酶的抑制特性。用于測試IGS5對大ET-1類似物的活性的抑制作用的化合物是抑制內肽酶像NEP和ECE的化合物膦酰二肽、特異抑制NEP的化合物thiorphan、和作為選擇性ECE抑制劑的化合物CGS-35066。實施例7a材料酶IGS5(sol hu)(his6);或His6標記的IGS5胞外結構域;儲存液53mg/ml,溶于20mM HEPES pH7.2、5%甘油、0.005%吐溫20、100mM NaCl,純度>99%;保存于4℃。
工作液用測定緩沖液將儲存液稀釋至10mg/ml。底物Mca-Asp-Ile-Ala-Trp-Phe-Dpa-Thr-Pro-Glu-His-Val-Val-Pro-Tyr-Gly-Leu-Gly-COOH;熒光淬滅的大ET-1類似物;Mca=(7-甲氧基香豆素-4-基);Dpa=(3-[2,4-二硝基苯基]-L-2,3-二氨基丙酰基);儲存液100μM,溶于測定緩沖液;保存于-20℃??梢杂晒蘌olypeptide Laboratories(Wolfenbüttel,德國)處購買。
測定緩沖液100mM Tris pH7.0,250mM NaCl。
將所有待測化合物以10mM溶于DMSO,并用測定緩沖液進一步稀釋。實施例7b實驗流程將70μl測定緩沖液、10μl酶工作液、和10μl待測化合物溶液在Eppendorf管中混合,并于37℃預先保溫15分鐘。然后,加入10μl底物儲存液,并將反應化合物于37℃保溫60分鐘,從而能夠進行酶促水解。隨后,通過于95℃加熱5分鐘來終止酶促反應。離心(HeraeusBiofuge B,3min)后,對上清液進行HPLC分析。實施例7cHPLC流程為了將剩余底物與切割產物分開,使用CC 125/4 Nucleosil 300/5C18RP柱和CC 8/4 Nucleosil 100/5 C18預柱(可以由Macherey-Nagel(Düren,德國)處購買)進行反相HPLC技術。因而,將60μl在實施例7b中獲得的反應樣品注射到HPLC中,并以1ml/min的流速用下列梯度和溶液洗脫層析柱溶液A100% H2O+0.5M H3PO4,pH2.0溶液B100% 乙腈+0.5M H3PO40-2min 20% B2-6min 20-60%B6-8min 60% B8-10min60-90%B10-13min 90% B13-15min 90-100% B通過214nm的吸光值和通過激發(fā)波長328nm和發(fā)射波長393nm的熒光來檢測肽。實施例7d計算將水解后含未淬滅Mca熒光團肽的HPLC峰的熒光信號增值作為任何計算的基礎。
對含和不含抑制物的樣品比較該信號,并根據(jù)各自的峰面積計算%抑制。
%抑制=100×(1-A抑制/A對照)所有樣品運行雙份,并使用平均值。
在每次測定運行中加入標準抑制物(10nM和100nM膦酰二肽)和溶劑對照(0.1%)。實施例7e結果關于本發(fā)明的IGS5多肽,實施例7的結果顯示這些IGS5金屬蛋白酶多肽在體外水解本領域現(xiàn)階段已知的多種血管活性肽,諸如大ET-1、ET-1、ANP、和緩激肽。表10顯示了與SEP活性相比的水解測定的結果。由這些結果得出結論,IGS5可能特別涉及所述生物學活性肽的代謝。
* 500μg IGS5多肽** 10μg IGS5多肽*** 檢測到活性,但是因HPLC檢測的問題而不能量化此外,參考化合物抑制ECE和/或NEP活性的實驗結果顯示,本發(fā)明IGS5金屬蛋白酶多肽轉化大ET-1類似物即17個氨基酸的大ET的活性受到膦酰二肽(抑制ECE/NEP的參考化合物)的抑制,但是IGS5未受到NEP抑制物thiorphan的有效抑制。表11顯示了這些結果。IGS5多肽也不受選擇性ECE抑制物CGS-35066的抑制,后者是內皮素轉化酶-1的有效且選擇性的非肽抑制物,而且具有持久的作用時間(De Lombart等人,J.Med.Chem.,43(3)488-504,2000年2月10日)。
圖的簡述圖1分離并完整測序以生成部分IGS5共有cDNA序列的不同cDNA克隆相對位置的示意圖。圖中指示了用于5’RACE和半同源性PCR克隆的PCR引物,而且在本文件中也有所描述(分別以IP#表示)。IGS5CONS指合并所有獲得的序列后獲得的共有毗鄰序列群。假定包含IGS5酶(IGS5DNA,IGS5PROT)胞外結構域的IGS5毗鄰序列群中存在的長度為691個氨基酸的長型開放讀碼框以空心方框(“□□”)表示。經比對EST序列(編號AA524283、AI088893、AI217369、和AI380811)中與NEP/ECE家族成員具有同源性的部分以“+==+”表示?!癰p”=堿基對。
圖2分離并完整測序以生成IGS5DNA1和IGS5DNA2 cDNA序列的不同cDNA克隆相對位置的示意圖。圖中指示了用于PCR、5’RACE、和半同源性PCR克隆的PCR引物,而且在本文件中也有所描述(分別以IP#表示)。IGS5CONS1和IGS5CONS2指合并所有獲得的序列后獲得的兩種不同的共有毗鄰序列群。IGS5DNA1和IGS5DNA2分別指在IGS5CONS1和IGS5CONS2中存在的開放讀碼框(“**”)。經比對EST序列(編號AA524283、AI088893、AI217369、和AI380811)中與NEP/ECE家族成員具有同源性的部分以“+==+”表示(IGS5EST)。“bp”=堿基對。在基因組克隆IGS5/S1中鑒定的78bp片段以“IGS5/S1/78bp”表述。78bp可變外顯子序列在克隆YCE231、YCE233、和YCE235中和在IGS5CONS2和IGS5DNA2中的缺乏以缺口表示。
圖3IGS5基因的RNA MasterTM印跡分析。
圖4使用不同寡核苷酸通過交疊PCR裝配而成的180bp片段的序列,其編碼POMC信號序列、Gly-Ser接頭、His6標簽、和IGS5胞外結構域序列的起始。(*沉默突變,POMC信號序列的第57bp)。
圖5載體pAcSG2SOLhuIGS5His6的質粒圖。
圖6在用重組桿狀病毒IGBV73感染Sf9細胞后表達的成熟重組體可溶性His標記的人IGS5的預測蛋白質序列(切除長度為26個氨基酸的POMC信號序列后)。潛在的N-糖基化位點標有下劃線。
圖7脫糖基研究-Western印跡分析。用3種重組體可溶性His6IGS5克隆(克隆1泳道1-3,克隆2泳道4-6,克隆3泳道7-9)感染后72小時收獲CM,并如文中所述加入和不加N-糖苷酶F進行處理。將10μl CM等同物上樣至凝膠,20μl未處理CM作為對照。使用抗His抗體(21E1B4EPR300,Innogenetics,1μg/ml終濃度)進行檢測。二抗是綴合堿性磷酸酶的兔抗小鼠抗體(Sigma A-1902)。用NBT-BCIP使條帶顯影。Mr標準是Biolabs寬范圍MW標準(目錄編號7707S)。
圖8在還原條件下(+DTT)在12.5%PHAST凝膠(Pharmacia;4μl/加樣孔)上進行的對扁豆層析步驟的SDS-PAGE分析。通過銀染使蛋白質顯影。
圖9純化流程中不同階段的IGS5的Western印跡分析。將樣品在7.5%Minigel(Biorad MINI-Protean II)上分開,并通過Western印跡進行分析,其中使用抗His6一抗21E1B4,綴合堿性磷酸酶的兔抗小鼠Ig作為二抗,并通過NBT/BCIP檢測。+/-DTT分別表示用或未用DTT還原蛋白質。
圖10在還原條件下(+DTT)在12.5%PHAST凝膠(Pharmacia;4μl/加樣孔)上進行的對扁豆層析洗脫液1號合并液進行Zn-IMAC層析的不同咪唑洗脫合并液的SDS-PAGE分析。通過銀染使蛋白質顯影。
序列表<110>SOLVAY PHARMACEUTICALS B.V.<120>金屬蛋白酶家族中的新型人酶<130>SPW 99.09/H 99.26-WO<140><141><160>31<170>PatentIn Ver.2.1<210>1<211>2076<212>DNA<213>人類(Homo sapiens)<220><221>CDS<222>(1)..(2073)<400>1tgc acc acc cct ggc tgc gtg ata gca gct gcc agg atc ctc cag aac48Cys Thr Thr Pro Gly Cys Val Ile Ala Ala Ala Arg Ile Leu Gln Asn1 5 10 15atg gac ccg acc acg gaa ccg tgt gac gac ttc tac cag ttt gca tgc96Met Asp Pro Thr Thr Glu Pro Cys Asp Asp Phe Tyr Gln Phe Ala Cys20 25 30gga ggc tgg ctg cgg cgc cac gtg atc cct gag acc aac tca aga tac144Gly Gly Trp Leu Arg Arg His Val Ile Pro Glu Thr Asn Ser Arg Tyr35 40 45agc atc ttt gac gtc ctc cgc gac gag ctg gag gtc atc ctc aaa gcg192Ser Ile Phe Asp Val Leu Arg Asp Glu Leu Glu Val Ile Leu Lys Ala50 55 60gtg ctg gag aat tcg act gcc aag gac cgg ccg gct gtg gag aag gcc240Val Leu Glu Asn Ser Thr Ala Lys Asp Arg Pro Ala Val Glu Lys Ala65 70 75 80agg acg ctg tac cgc tcc tgc atg aac cag agt gtg ata gag aag cga288Arg Thr Leu Tyr Arg Ser Cys Met Asn Gln Ser Val Ile Glu Lys Arg85 90 95ggc tct cag ccc ctg ctg gac atc ttg gag gtg gtg gga ggc tgg ccg336Gly Ser Gln Pro Leu Leu Asp Ile Leu Glu Val Val Gly Gly Trp Pro100 105 110gtg gcg atg gac agg tgg aac gag acc gta gga ctc gag tgg gag ctg384Val Ala Met Asp Arg Trp Asn Glu Thr Val Gly Leu Glu Trp Glu Leu115 120 125gag cgg cag ctg gcg ctg atg aac tca cag ttc aac agg cgc gtc ctc432Glu Arg Gln Leu Ala Leu Met Asn Ser Gln Phe Asn Arg Arg Val Leu130 135 140atc gac ctc ttc atc tgg aac gac gac cag aac tcc agc cgg cac atc480Ile Asp Leu Phe Ile Trp Asn Asp Asp Gln Asn Ser Ser Arg His Ile145 150 155 160atc tac ata gac cag ccc acc ttg ggc atg ccc tcc cga gag tac tac528Ile Tyr Ile Asp Gln Pro Thr Leu Gly Met Pro Ser Arg Glu Tyr Tyr165 170 175ttc aac ggc ggc agc aac cgg aag gtg cgg gaa gcc tac ctg cag ttc576Phe Asn Gly Gly Ser Asn Arg Lys Val Arg Glu Ala Tyr Leu Gln Phe180 185 190atg gtg tca gtg gcc acg ttg ctg cgg gag gat gca aac ctg ccc agg624Met Val Ser Val Ala Thr Leu Leu Arg Glu Asp Ala Asn Leu Pro Arg195 200 205gac agc tgc ctg gtg cag gag gac atg atg cag gtg ctg gag ctg gag672Asp Ser Cys Leu Val Gln Glu Asp Met Met Gln Val Leu Glu Leu Glu210 215 220aca cag ctg gcc aag gcc acg gta ccc cag gag gag aga cac gac gtc720Thr Gln Leu Ala Lys Ala Thr Val Pro Gln Glu Glu Arg His Asp Val225 230 235 240atc gcc ttg tac cac cgg atg gga ctg gag gag ctg caa agc cag ttt768Ile Ala Leu Tyr His Arg Met Gly Leu Glu Glu Leu Gln Ser Gln Phe245 250 255ggc ctg aag gga ttt aac tgg act ctg ttc ata caa act gtg cta tcc816Gly Leu Lys Gly Phe Asn Trp Thr Leu Phe Ile Gln Thr Val Leu Ser260 265 270tct gtc aaa atc aag ctg ctg cca gat gag gaa gtg gtg gtc tat ggc864Ser Val Lys Ile Lys Leu Leu Pro Asp Glu Glu Val Val Val Tyr Gly275 280 285atc ccc tac ctg cag aac ctt gaa aac atc atc gac acc tac tca gcc912Ile Pro Tyr Leu Gln Asn Leu Glu Asn Ile Ile Asp Thr Tyr Ser Ala290 295 300agg acc ata cag aac tac ctg gtc tgg cgc ctg gtg ctg gac cgc att960Arg Thr Ile Gln Asn Tyr Leu Val Trp Arg Leu Val Leu Asp Arg Ile305 310 315 320ggt agc cta agc cag aga ttc aag gac aca cga gtg aac tac cgc aag1008Gly Ser Leu Ser Gln Arg Phe Lys Asp Thr Arg Val Asn Tyr Arg Lys325 330 335gcg ctg ttt ggc aca atg gtg gag gag gtg cgc tgg cgt gaa tgt gtg1056Ala Leu Phe Gly Thr Met Val Glu Glu Val Arg Trp Arg Glu Cys Val340 345 350ggc tac gtc aac agc aac atg gag aac gcc gtg ggc tcc ctc tac gtc1104Gly Tyr Val Asn Ser Asn Met Glu Asn Ala Val Gly Ser Leu Tyr Val355 360 365agg gag gcg ttc cct gga gac agc aag agc atg gtc aga gaa ctc att1152Arg Glu Ala Phe Pro Gly Asp Ser Lys Ser Met Val Arg Glu Leu Ile370 375 380gac aag gtg cgg aca gtg ttt gtg gag acg ctg gac gag ctg ggc tgg1200Asp Lys Val Arg Thr Val Phe Val Glu Thr Leu Asp Glu Leu Gly Trp385 390 395 400atg gac gag gag tcc aag aag aag gcg cag gag aag gcc atg agc atc1248Met Asp Glu Glu Ser Lys Lys Lys Ala Gln Glu Lys Ala Met Ser Ile405 410 415cgg gag cag atc ggg cac cct gac tac atc ctg gag gag atg aac agg1296Arg Glu Gln Ile Gly His Pro Asp Tyr Ile Leu Glu Glu Met Asn Arg420 425 430cgc ctg gac gag gag tac tcc aat ctg aac ttc tca gag gac ctg tac1344Arg Leu Asp Glu Glu Tyr Ser Asn Leu Asn Phe Ser Glu Asp Leu Tyr435 440 445ttt gag aac agt ctg cag aac ctc aag gtg ggc gcc cag cgg agc ctc1392Phe Glu Asn Ser Leu Gln Asn Leu Lys Val Gly Ala Gln Arg Ser Leu450 455 460agg aag ctt cgg gaa aag gtg gac cca aat ctc tgg atc atc ggg gcg1440Arg Lys Leu Arg Glu Lys Val Asp Pro Asn Leu Trp Ile Ile Gly Ala465 470 475 480gcg gtg gtc aat gcg ttc tac tcc cca aac cga aac cag att gta ttc1488Ala Val Val Asn Ala Phe Tyr Ser Pro Asn Arg Asn Gln Ile Val Phe485 490 495cct gcc ggg atc ctc cag ccc ccc ttc ttc agc aag gag cag cca cag1536Pro Ala Gly Ile Leu Gln Pro Pro Phe Phe Ser Lys Glu Gln Pro Gln500 505 510gcc ttg aac ttt gga ggc att ggg atg gtg atc ggg cac gag atc acg1584Ala Leu Asn Phe Gly Gly Ile Gly Met Val Ile Gly His Glu Ile Thr515 520 525cac ggc ttt gac gac aat ggc cgg aac ttc gac aag aat ggc aac atg1632His Gly Phe Asp Asp Asn Gly Arg Asn Phe Asp Lys Asn Gly Asn Met530 535 540atg gat tgg tgg agt aac ttc tcc acc cag cac ttc cgg gag cag tca1680Met Asp Trp Trp Ser Asn Phe Ser Thr Gln His Phe Arg Glu Gln Ser545 550 555 560gag tgc atg atc tac cag tac ggc aac tac tcc tgg gac ctg gca gac1728Glu Cys Met Ile Tyr Gln Tyr Gly Asn Tyr Ser Trp Asp Leu Ala Asp565 570 575gaa cag aac gtg aac gga ttc aac acc ctt ggg gaa aac att gct gac1776Glu Gln Asn Val Asn Gly Phe Asn Thr Leu Gly Glu Asn Ile Ala Asp580 585 590aac gga ggg gtg cgg caa gcc tat aag gcc tac ctc aag tgg atg gca1824Asn Gly Gly Val Arg Gln Ala Tyr Lys Ala Tyr Leu Lys Trp Met Ala595 600 605gag ggt ggc aag gac cag cag ctg ccc ggc ctg gat ctc acc cat gag1872Glu Gly Gly Lys Asp Gln Gln Leu Pro Gly Leu Asp Leu Thr His Glu610 615 620cag ctc ttc ttc arc aac tac gcc cag gtg tgg tgc ggg tcc tac cgg1920Gln Leu Phe Phe Ile Asn Tyr Ala Gln Val Trp Cys Glv Ser Tyr Arg625 630 635 640ccc gag ttc gcc atc caa tcc atc aag aca gac gtc cac agt ccc ctg1968Pro Glu Phe Ala Ile Gln Ser Ile Lys Thr Asp Val His Ser Pro Leu645 650 655aag tac agg gta ctg ggg tcg ctg cag aac ctg gcc gcc ttc gca gac2016Lys Tyr Arg Val Leu Gly Ser Leu Gln Asn Leu Ala Ala Phe Ala Asp660 665 670acg ttc cac tgt gcc cgg ggc acc ccc atg cac ccc aag gag cga tgc2064Thr Phe His Cys Ala Arg Gly Thr Pro Met His Pro Lys Glu Arg Cys675 680 685cgc gtg tgg tag2076Arg Val Trp690<210>2<211>691<212>PRT<213>人類(Homo sapiens)<400>2Cys Thr Thr Pro Gly Cys Val Ile Ala Ala Ala Arg Ile Leu Gln Asn1 5 10 15Met Asp Pro Thr Thr Glu Pro Cys Asp Asp Phe Tyr Gln Phe Ala Cys20 25 30Gly Gly Trp Leu Arg Arg His Val Ile Pro Glu Thr Asn Ser Arg Tyr35 40 45Ser Ile Phe Asp Val Leu Arg Asp Glu Leu Glu Val Ile Leu Lys Ala50 55 60Val Leu Glu Asn Ser Thr Ala Lys Asp Arg Pro Ala Val Glu Lys Ala65 70 75 80Arg Thr Leu Tyr Arg Ser Cys Met Asn Gln Ser Val Ile Glu Lys Arg85 90 95Gly Ser Gln Pro Leu Leu Asp Ile Leu Glu Val Val Gly Gly Trp Pro100 105 110Val Ala Met Asp Arg Trp Asn Glu Thr Val Gly Leu Glu Trp Glu Leu115 120 125Glu Arg Gln Leu Ala Leu Met Asn Ser Gln Phe Asn Arg Arg Val Leu130 135 140Ile Asp Leu Phe Ile Trp Asn Asp Asp Gln Asn Ser Ser Arg His Ile145 150 155 160Ile Tyr Ile Asp Gln Pro Thr Leu Gly Met Pro Ser Arg Glu Tyr Tyr165 170 175Phe Asn Gly Gly Ser Asn Arg Lys Val Arg Glu Ala Tyr Leu Gln Phe180 185 190Met Val Ser Val Ala Thr Leu Leu Arg Glu Asp Ala Asn Leu Pro Arg195 200 205Asp Ser Cys Leu Val Gln Glu Asp Met Met Gln Val Leu Glu Leu Glu210 215 220Thr Gln Leu Ala Lys Ala Thr Val Pro Gln Glu Glu Arg His Asp Val225 230 235 240Ile Ala Leu Tyr His Arg Met Gly Leu Glu Glu Leu Gln Ser Gln Phe245 250 255Gly Leu Lys Gly Phe Asn Trp Thr Leu Phe Ile Gln Thr Val Leu Ser260 265 270Ser Val Lys Ile Lys Leu Leu Pro Asp Glu Glu Val Val Val Tyr Gly275 280 285Ile Pro Tyr Leu Gln Asn Leu Glu Asn Ile Ile Asp Thr Tyr Ser Ala290 295 300Arg Thr Ile Gln Asn Tyr Leu Val Trp Arg Leu Val Leu Asp Arg Ile305 310 315 320Gly Ser Leu Ser Gln Arg Phe Lys Asp Thr Arg Val Asn Tyr Arg Lys325 330 335Ala Leu Phe Gly Thr Met Val Glu Glu Val Arg Trp Arg Glu Cys Val340 345 350Gly Tyr Val Asn Ser Asn Met Glu Asn Ala Val Gly Ser Leu Tyr Val355 360 365Arg Glu Ala Phe Pro Gly Asp Ser Lys Ser Met Val Arg Glu Leu Ile370 375 380Asp Lys Val Arg Thr Val Phe Val Glu Thr Leu Asp Glu Leu Gly Trp385 390 395 400Met Asp Glu Glu Ser Lys Lys Lys Ala Gln Glu Lys Ala Met Ser Ile405 410 415Arg Glu Gln Ile Gly His Pro Asp Tyr Ile Leu Glu Glu Met Asn Arg420 425 430Arg Leu Asp Glu Glu Tyr Ser Asn Leu Asn Phe Ser Glu Asp Leu Tyr435 440 445Phe Glu Asn Ser Leu Gln Asn Leu Lys Val Gly Ala Gln Arg Ser Leu450 455 460Arg Lys Leu Arg Glu Lys Val Asp Pro Asn Leu Trp Ile Ile Gly Ala465 470 475 480Ala Val Val Asn Ala Phe Tyr Ser Pro Asn Arg Asn Gln Ile Val Phe485 490 495Pro Ala Gly Ile Leu Gln Pro Pro Phe Phe Ser Lys Glu Gln Pro Gln500 505 510Ala Leu Asn Phe Gly Gly Ile Gly Met Val Ile Gly His Glu Ile Thr
515 520 525His Gly Phe Asp Asp Asn Gly Arg Asn Phe Asp Lys Asn Gly Asn Met530 535 540Met Asp Trp Trp Ser Asn Phe Ser Thr Gln His Phe Arg Glu Gln Ser545 550 555 560Glu Cys Met Ile Tyr Gln Tyr Gly Asn Tyr Ser Trp Asp Leu Ala Asp565 570 575Glu Gln Asn Val Asn Gly Phe Asn Thr Leu Gly Glu Asn Ile Ala Asp580 585 590Asn Gly Gly Val Arg Gln Ala Tyr Lys Ala Tyr Leu Lys Trp Met Ala595 600 605Glu Gly Gly Lys Asp Gln Gln Leu Pro Gly Leu Asp Leu Thr His Glu610 615 620Gln Leu Phe Phe Ile Asn Tyr Ala Gln Val Trp Cys Gly Ser Tyr Arg625 630 635 640Pro Glu Phe Ala Ile Gln Ser Ile Lys Thr Asp Val His Ser Pro Leu645 650 655Lys Tyr Arg Val Leu Gly Ser Leu Gln Asn Leu Ala Ala Phe Ala Asp660 665 670Thr Phe His Cys Ala Arg Gly Thr Pro Met His Pro Lys Glu Arg Cys675 680 685Arg Val Trp690<210>3<211>2340<212>DNA<213>人類(Homo sapiens)<220><221>CDS<222>(1)..(2337)<400>3atg ggg aag tcc gaa ggc ccc gtg ggg atg gtg gag agc gct ggc cgt 48Met Gly Lys Ser Glu Gly Pro Val Gly Met Val Glu Ser Ala Gly Arg1 5 10 15gca ggg cag aag cgc ccg ggg ttc ctg gag ggg ggg ctg ctg ctg ctg 96Ala Gly Gln Lys Arg Pro Gly Phe Leu Glu Gly Gly Leu Leu Leu Leu20 25 30ctg ctg ctg gtg acc gct gcc ctg gtg gcc ttg ggt gtc ctc tac gcc 144Leu Leu Leu Val Thr Ala Ala Leu Val Ala Leu Gly Val Leu Tyr Ala35 40 45gac cgc aga ggg aag cag ctg cca cgc ctt gct agc cgg ctg tgc ttc 192Asp Arg Arg Gly Lys Gln Leu Pro Arg Leu Ala Ser Arg Leu Cys Phe
50 55 60tta cag gag gag agg acc ttt gta aaa cga aaa ccc cga ggg atc cca240Leu Gln Glu Glu Arg Thr Phe Val Lys Arg Lys Pro Arg Gly Ile Pro65 70 75 80gag gcc caa gag gtg agc gag gtc tgc acc acc cct ggc tgc gtg ata288Glu Ala Gln Glu Val Ser Glu Val Cys Thr Thr Pro Gly Cys Val Ile85 90 95gca gct gcc agg atc ctc cag aac atg gac ccg acc acg gaa ccg tgt336Ala Ala Ala Arg Ile Leu Gln Asn Met Asp Pro Thr Thr Glu Pro Cys100 105 110gac gac ttc tac cag ttt gca tgc gga ggc tgg ctg cgg cgc cac gtg384Asp Asp Phe Tyr Gln Phe Ala Cys Gly Gly Trp Leu Arg Arg His Val115 120 125atc cct gag acc aac tca aga tac agc atc ttt gac gtc ctc cgc gac432Ile Pro Glu Thr Asn Ser Arg Tyr Ser Ile Phe Asp Val Leu Arg Asp130 135 140gag ctg gag gtc atc ctc aaa gcg gtg ctg gag aat tcg act gcc aag480Glu Leu Glu Val Ile Leu Lys Ala Val Leu Glu Asn Ser Thr Ala Lys145 150 155 160gac cgg ccg gct gtg gag aag gcc agg acg ctg tac cgc tcc tgc atg528Asp Arg Pro Ala Val Glu Lys Ala Arg Thr Leu Tyr Arg Ser Cys Met165 170 175aac cag agt gtg ata gag aag cga ggc tct cag ccc ctg ctg gac atc576Asn Gln Ser Val Ile Glu Lys Arg Gly Ser Gln Pro Leu Leu Asp Ile180 185 190ttg gag gtg gtg gga ggc tgg ccg gtg gcg atg gac agg tgg aac gag624Leu Glu Val Val Gly Gly Trp Pro Val Ala Met Asp Arg Trp Asn Glu195 200 205acc gta gga ctc gag tgg gag ctg gag cgg cag ctg gcg ctg atg aac672Thr Val Gly Leu Glu Trp Glu Leu Glu Arg Gln Leu Ala Leu Met Asn210 215 220tca cag ttc aac agg cgc gtc ctc atc gac ctc ttc atc tgg aac gac720Ser Gln Phe Asn Arg Arg Val Leu Ile Asp Leu Phe Ile Trp Asn Asp225 230 235 240gac cag aac tcc agc cgg cac atc atc tac ata gac cag ccc acc ttg768Asp Gln Asn Ser Ser Arg His Ile Ile Tyr Ile Asp Gln Pro Thr Leu245 250 255ggc atg ccc tcc cga gag tac tac ttc aac ggc ggc agc aac cgg aag816Gly Met Pro Ser Arg Glu Tyr Tyr Phe Asn Gly Gly Ser Asn Arg Lys260 265 270gtg cgg gaa gcc tac ctg cag ttc atg gtg tca gtg gcc acg ttg ctg864Val Arg Glu Ala Tyr Leu Gln Phe Met Val Ser Val Ala Thr Leu Leu275 280 285cgg gag gat gca aac ctg ccc agg gac agc tgc ctg gtg cag gag gac912Arg Glu Asp Ala Asn Leu Pro Arg Asp Ser Cys Leu Val Gln Glu Asp290 295 300atg atg cag gtg ctg gag ctg gag aca cag ctg gcc aag gcc acg gta960Met Met Gln Val Leu Glu Leu Glu Thr Gln Leu Ala Lys Ala Thr Val305 310 315 320ccc cag gag gag aga cac gac gtc atc gcc ttg tac cac cgg atg gga1008Pro Gln Glu Glu Arg His Asp Val Ile Ala Leu Tyr His Arg Met Gly325 330 335ctg gag gag ctg caa agc cag ttt ggc ctg aag gga ttt aac tgg act1056Leu Glu Glu Leu Gln Ser Gln Phe Gly Leu Lys Gly Phe Asn Trp Thr340 345 350ctg ttc ata caa act gtg cta tcc tct gtc aaa atc aag ctg ctg cca1104Leu Phe Ile Gln Thr Val Leu Ser Ser Val Lys Ile Lys Leu Leu Pro355 360 365gat gag gaa gtg gtg gtc tat ggc atc ccc tac ctg cag aac ctt gaa1152Asp Glu Glu Val Val Val Tyr Gly Ile Pro Tyr Leu Gln Asn Leu Glu370 375 380aac atc atc gac acc tac tca gcc agg acc ata cag aac tac ctg gtc1200Asn Ile Ile Asp Thr Tyr Ser Ala Arg Thr Ile Gln Asn Tyr Leu Val385 390 395 400tgg cgc ctg gtg ctg gac cgc att ggt agc cta agc cag aga ttc aag1248Trp Arg Leu Val Leu Asp Arg Ile Gly Ser Leu Ser Gln Arg Phe Lys405 410 415gac aca cga gtg aac tac cgc aag gcg ctg ttt ggc aca atg gtg gag1296Asp Thr Arg Val Asn Tyr Arg Lys Ala Leu Phe Gly Thr Met Val Glu420 425 430gag gtg cgc tgg cgt gaa tgt gtg ggc tac gtc aac agc aac atg gag1344Glu Val Arg Trp Arg Glu Cys Val Gly Tyr Val Asn Ser Asn Met Glu435 440 445aac gcc gtg ggc tcc ctc tac gtc agg gag gcg ttc cct gga gac agc1392Asn Ala Val Gly Ser Leu Tyr Val Arg Glu Ala Phe Pro Gly Asp Ser450 455 460aag agc atg gtc aga gaa ctc att gac aag gtg cgg aca gtg ttt gtg1440Lys Ser Met Val Arg Glu Leu Ile Asp Lys Val Arg Thr Val Phe Val465 470 475 480gag acg ctg gac gag ctg ggc tgg atg gac gag gag tcc aag aag aag1488Glu Thr Leu Asp Glu Leu Gly Trp Met Asp Glu Glu Ser Lys Lys Lys485 490 495gcg cag gag aag gcc atg agc atc cgg gag cag atc ggg cac cct gac1536Ala Gln Glu Lys Ala Met Ser Ile Arg Glu Gln Ile Gly His Pro Asp500 505 510tac atc ctg gag gag atg aac agg cgc ctg gac gag gag tac tcc aat1584Tyr Ile Leu Glu Glu Met Asn Arg Arg Leu Asp Glu Glu Tyr Ser Asn515 520 525ctg aac ttc tca gag gac ctg tac ttt gag aac agt ctg cag aac ctc1632Leu Asn Phe Ser Glu Asp Leu Tyr Phe Glu Asn Ser Leu Gln Asn Leu530 535 540aag gtg ggc gcc cag cgg agc ctc agg aag ctt cgg gaa aag gtg gac1680Lys Val Gly Ala Gln Arg Ser Leu Arg Lys Leu Arg Glu Lys Val Asp545 550 555 560cca aat ctc tgg atc atc ggg gcg gcg gtg gtc aat gcg ttc tac tcc1728Pro Asn Leu Trp Ile Ile Gly Ala Ala Val Val Asn Ala Phe Tyr Ser565 570 575cca aac cga aac cag att gta ttc cct gcc ggg atc ctc cag ccc ccc1776Pro Asn Arg Asn Gln Ile Val Phe Pro Ala Gly Ile Leu Gln Pro Pro580 585 590ttc ttc agc aag gag cag cca cag gcc ttg aac ttt gga ggc att ggg1824Phe Phe Ser Lys Glu Gln Pro Gln Ala Leu Asn Phe Gly Gly Ile Gly595 600 605atg gtg atc ggg cac gag atc acg cac ggc ttt gac gac aat ggc cgg1872Met Val Ile Gly His Glu Ile Thr His Gly Phe Asp Asp Asn Gly Arg610 615 620aac ttc gac aag aat ggc aac atg atg gat tgg tgg agt aac ttc tcc1920Asn Phe Asp Lys Asn Gly Asn Met Met Asp Trp Trp Ser Asn Phe Ser625 630 635 640acc cag cac ttc cgg gag cag tca gag tgc atg atc tac cag tac ggc1968Thr Gln His Phe Arg Glu Gln Ser Glu Cys Met Ile Tyr Gln Tyr Gly645 650 655aac tac tcc tgg gac ctg gca gac gaa cag aac gtg aac gga ttc aac2016Asn Tyr Ser Trp Asp Leu Ala Asp Glu Gln Asn Val Asn Gly Phe Asn660 665 670acc ctt ggg gaa aac att gct gac aac gga ggg gtg cgg caa gcc tat2064Thr Leu Gly Glu Asn Ile Ala Asp Asn Gly Gly Val Arg Gln Ala Tyr675 680 685aag gcc tac ctc aag tgg atg gca gag ggt ggc aag gac cag cag ctg2112Lys Ala Tyr Leu Lys Trp Met Ala Glu Gly Gly Lys Asp Gln Gln Leu690 695 700ccc ggc ctg gat ctc acc cat gag cag ctc ttc ttc atc aac tac gcc2160Pro Gly Leu Asp Leu Thr His Glu Gln Leu Phe Phe Ile Asn Tyr Ala705 710 715 720cag gtg tgg tgc ggg tcc tac cgg ccc gag ttc gcc atc caa tcc atc2208Gln Val Trp Cys Gly Ser Tyr Arg Pro Glu Phe Ala Ile Gln Ser Ile725 730 735aag aca gac gtc cac agt ccc ctg aag tac agg gta ctg ggg tcg ctg2256Lys Thr Asp Val His Ser Pro Leu Lys Tyr Arg Val Leu Gly Ser Leu740 745 750cag aac ctg gcc gcc ttc gca gac acg ttc cac tgt gcc cgg ggc acc2304Gln Asn Leu Ala Ala Phe Ala Asp Thr Phe His Cys Ala Arg Gly Thr755 760 765ccc atg cac ccc aag gag cga tgc cgc gtg tgg tag2340Pro Met His Pro Lys Glu Arg Cys Arg Val Trp770 775<210>4<211>779<212>PRT<213>人類(Homo sapiens)<400>4Met Gly Lys Ser Glu Gly Pro Val Gly Met Val Glu Ser Ala Gly Arg1 5 10 15Ala Gly Gln Lys Arg Pro Gly Phe Leu Glu Gly Gly Leu Leu Leu Leu20 25 30Leu Leu Leu Val Thr Ala Ala Leu Val Ala Leu Gly Val Leu Tyr Ala35 40 45Asp Arg Arg Gly Lys Gln Leu Pro Arg Leu Ala Ser Arg Leu Cys Phe50 55 60Leu Gln Glu Glu Arg Thr Phe Val Lys Arg Lys Pro Arg Gly Ile Pro65 70 75 80Glu Ala Gln Glu Val Ser Glu Val Cys Thr Thr Pro Gly Cys Val Ile85 90 95Ala Ala Ala Arg Ile Leu Gln Asn Met Asp Pro Thr Thr Glu Pro Cys100 105 110Asp Asp Phe Tyr Gln Phe Ala Cys Gly Gly Trp Leu Arg Arg His Val115 120 125Ile Pro Glu Thr Asn Ser Arg Tyr Ser Ile Phe Asp Val Leu Arg Asp130 135 140Glu Leu Glu Val Ile Leu Lys Ala Val Leu Glu Asn Ser Thr Ala Lys145 150 155 160Asp Arg Pro Ala Val Glu Lys Ala Arg Thr Leu Tyr Arg Ser Cys Met165 170 175Asn Gln Ser Val Ile Glu Lys Arg Gly Ser Gln Pro Leu Leu Asp Ile180 185 190Leu Glu Val Val Gly Gly Trp Pro Val Ala Met Asp Arg Trp Asn Glu195 200 205Thr Val Gly Leu Glu Trp Glu Leu Glu Arg Gln Leu Ala Leu Met Asn210 215 220Ser Gln Phe Asn Arg Arg Val Leu Ile Asp Leu Phe Ile Trp Asn Asp225 230 235 240Asp Gln Asn Ser Ser Arg His Ile Ile Tyr Ile Asp Gln Pro Thr Leu245 250 255Gly Met Pro Ser Arg Glu Tyr Tyr Phe Asn Gly Gly Ser Asn Arg Lys260 265 270Val Arg Glu Ala Tyr Leu Gln Phe Met Val Ser Val Ala Thr Leu Leu275 280 285Arg Glu Asp Ala Asn Leu Pro Arg Asp Ser Cys Leu Val Gln Glu Asp
290 295 300Met Met Gln Val Leu Glu Leu Glu Thr Gln Leu Ala Lys Ala Thr Val305 310 315 320Pro Gln Glu Glu Arg His Asp Val Ile Ala Leu Tyr His Arg Met Gly325 330 335Leu Glu Glu Leu Gln Ser Gln Phe Gly Leu Lys Gly Phe Asn Trp Thr340 345 350Leu Phe Ile Gln Thr Val Leu Ser Ser Val Lys Ile Lys Leu Leu Pro355 360 365Asp Glu Glu Val Val Val Tyr Gly Ile Pro Tyr Leu Gln Asn Leu Glu370 375 380Asn Ile Ile Asp Thr Tyr Ser Ala Arg Thr Ile Gln Asn Tyr Leu Val385 390 395 400Trp Arg Leu Val Leu Asp Arg Ile Gly Ser Leu Ser Gln Arg Phe Lys405 410 415Asp Thr Arg Val Asn Tyr Arg Lys Ala Leu Phe Gly Thr Met Val Glu420 425 430Glu Val Arg Trp Arg Glu Cys Val Gly Tyr Val Asn Ser Asn Met Glu435 440 445Asn Ala Val Gly Ser Leu Tyr Val Arg Glu Ala Phe Pro Gly Asp Ser450 455 460Lys Ser Met Val Arg Glu Leu Ile Asp Lys Val Arg Thr Val Phe Val465 470 475 480Glu Thr Leu Asp Glu Leu Gly Trp Met Asp Glu Glu Ser Lys Lys Lys485 490 495Ala Gln Glu Lys Ala Met Ser Ile Arg Glu Gln Ile Gly His Pro Asp500 505 510Tyr Ile Leu Glu Glu Met Asn Arg Arg Leu Asp Glu Glu Tyr Ser Asn515 520 525Leu Asn Phe Ser Glu Asp Leu Tyr Phe Glu Asn Ser Leu Gln Asn Leu530 535 540Lys Val Gly Ala Gln Arg Ser Leu Arg Lys Leu Arg Glu Lys Val Asp545 550 555 560Pro Asn Leu Trp Ile Ile Gly Ala Ala Val Val Asn Ala Phe Tyr Ser565 570 575Pro Asn Arg Asn Gln Ile Val Phe Pro Ala Gly Ile Leu Gln Pro Pro580 585 590Phe Phe Ser Lys Glu Gln Pro Gln Ala Leu Asn Phe Gly Gly Ile Gly595 600 605Met Val Ile Gly His Glu Ile Thr His Gly Phe Asp Asp Asn Gly Arg610 615 620Asn Phe Asp Lys Asn Gly Asn Met Met Asp Trp Trp Ser Asn Phe Ser625 630 635 640Thr Gln His Phe Arg Glu Gln Ser Glu Cys Met Ile Tyr Gln Tyr Gly645 650 655Asn Tyr Ser Trp Asp Leu Ala Asp Glu Gln Asn Val Asn Gly Phe Asn660 665 670Thr Leu Gly Glu Asn Ile Ala Asp Asn Gly Gly Val Arg Gln Ala Tyr675 680 685Lys Ala Tyr Leu Lys Trp Met Ala Glu Gly Gly Lys Asp Gln Gln Leu690 695 700Pro Gly Leu Asp Leu Thr His Glu Gln Leu Phe Phe Ile Asn Tyr Ala705 710 715 720Gln Val Trp Cys Gly Ser Tyr Arg Pro Glu Phe Ala Ile Gln Ser Ile725 730 735Lys Thr Asp Val His Ser Pro Leu Lys Tyr Arg Val Leu Gly Ser Leu740 745 750Gln Asn Leu Ala Ala Phe Ala Asp Thr Phe His Cys Ala Arg Gly Thr755 760 765Pro Met His Pro Lys Glu Arg Cys Arg Val Trp770 775<210>5<211>2262<212>DNA<213>人類(Homo sapiens)<220><221>CDS<222>(1)..(2259)<400>5atg ggg aag tcc gaa ggc cca gtg ggg atg gtg gag agc gcc ggc cgt48Met Gly Lys Ser Glu Gly Pro Val Gly Met Val Glu Ser Ala Gly Arg1 5 10 15gca ggg cag aag cgc ccg ggg ttc ctg gag ggg ggg ctg ctg ctg ctg96Ala Gly Gln Lys Arg Pro Gly Phe Leu Glu Gly Gly Leu Leu Leu Leu20 25 30ctg ctg ctg gtg acc gct gcc ctg gtg gcc ttg ggt gtc ctc tac gcc144Leu Leu Leu Val Thr Ala Ala Leu Val Ala Leu Gly Val Leu Tyr Ala35 40 45gac cgc aga ggg atc cca gag gcc caa gag gtg agc gag gtc tgc acc192Asp Arg Arg Gly Ile Pro Glu Ala Gln Glu Val Ser Glu Val Cys Thr50 55 60acc cct ggc tgc gtg ata gca gct gcc agg atc ctc cag aac atg gac240Thr Pro Gly Cys Val Ile Ala Ala Ala Arg Ile Leu Gln Asn Met Asp65 70 75 80ccg acc acg gaa ccg tgt gac gac ttc tac cag ttt gca tgc gga ggc288Pro Thr Thr Glu Pro Cys Asp Asp Phe Tyr Gln Phe Ala Cys Gly Gly85 90 95tgg ctg cgg cgc cac gtg atc cct gag acc aac tca aga tac agc atc336Trp Leu Arg Arg His Val Ile Pro Glu Thr Asn Ser Arg Tyr Ser Ile100 105 110ttt gac gtc ctc cgc gac gag ctg gag gtc atc ctc aaa gcg gtg ctg384Phe Asp Val Leu Arg Asp Glu Leu Glu Val Ile Leu Lys Ala Val Leu115 120 125gag aat tcg act gcc aag gac cgg ccg gct gtg gag aag gcc agg acg432Glu Asn Ser Thr Ala Lys Asp Arg Pro Ala Val Glu Lys Ala Arg Thr130 135 140ctg tac cgc tcc tgc atg aac cag agt gtg ata gag aag cga ggc tct480Leu Tyr Arg Ser Cys Met Asn Gln Ser Val Ile Glu Lys Arg Gly Ser145 150 155 160cag ccc ctg ctg gac atc ttg gag gtg gtg gga ggc tgg ccg gtg gcg528Gln Pro Leu Leu Asp Ile Leu Glu Val Val Gly Gly Trp Pro Val Ala165 170 175atg gac agg tgg aac gag acc gta gga ctc gag tgg gag ctg gag cgg576Met Asp Arg Trp Asn Glu Thr Val Gly Leu Glu Trp Glu Leu Glu Arg180 185 190cag ctg gcg ctg atg aac tca cag ttc aac agg cgc gtc ctc atc gac624Gln Leu Ala Leu Met Asn Ser Gln Phe Asn Arg Arg Val Leu Ile Asp195 200 205ctc ttc atc tgg aac gac gac cag aac tcc agc cgg cac atc atc tac672Leu Phe Ile Trp Asn Asp Asp Gln Asn Ser Ser Arg His Ile Ile Tyr210 215 220ata gac cag ccc acc ttg ggc atg ccc tcc cga gag tac tac ttc aac720Ile Asp Gln Pro Thr Leu Gly Met Pro Ser Arg Glu Tyr Tyr Phe Asn225 230 235 240ggc ggc agc aac cgg aag gtg cgg gaa gcc tac ctg cag ttc atg gtg768Gly Gly Ser Asn Arg Lys Val Arg Glu Ala Tyr Leu Gln Phe Met Val245 250 255tca gtg gcc acg ttg ctg cgg gag gat gca aac ctg ccc agg gac agc816Ser Val Ala Thr Leu Leu Arg Glu Asp Ala Asn Leu Pro Arg Asp Ser260 265 270tgc ctg gtg cag gag gac atg atg cag gtg ctg gag ctg gag aca cag864Cys Leu Val Gln Glu Asp Met Met Gln Val Leu Glu Leu Glu Thr Gln275 280 285ctg gcc aag gcc acg gta ccc cag gag gag aga cac gac gtc atc gcc912Leu Ala Lys Ala Thr Val Pro Gln Glu Glu Arg His Asp Val Ile Ala290 295 300ttg tac cac cgg atg gga ctg gag gag ctg caa agc cag ttt ggc ctg960Leu Tyr His Arg Met Gly Leu Glu Glu Leu Gln Ser Gln Phe Gly Leu305 310 315 320aag gga ttt aac tgg act ctg ttc ata caa act gtg cta tcc tct gtc1008Lys Gly Phe Asn Trp Thr Leu Phe Ile Gln Thr Val Leu Ser Ser Val325 330 335aaa atc aag ctg ctg cca gat gag gaa gtg gtg gtc tat ggc atc ccc1056Lys Ile Lys Leu Leu Pro Asp Glu Glu Val Val Val Tyr Gly Ile Pro340 345 350tac ctg cag aac ctt gaa aac atc atc gac acc tac tca gcc agg acc1104Tyr Leu Gln Asn Leu Glu Asn Ile Ile Asp Thr Tyr Ser Ala Arg Thr355 360 365ata cag aac tac ctg gtc tgg cgc ctg gtg ctg gac cgc att ggt agc1152Ile Gln Asn Tyr Leu Val Trp Arg Leu Val Leu Asp Arg Ile Gly Ser370 375 380cta agc cag aga ttc aag gac aca cga gtg aac tac cgc aag gcg ctg1200Leu Ser Gln Arg Phe Lys Asp Thr Arg Val Asn Tyr Arg Lys Ala Leu385 390 395 400ttt ggc aca atg gtg gag gag gtg cgc tgg cgt gaa tgt gtg ggc tac1248Phe Gly Thr Met Val Glu Glu Val Arg Trp Arg Glu Cys Val Gly Tyr405 410 415gtc aac agc aac atg gag aac gcc gtg ggc tcc ctc tac gtc agg gag1296Val Asn Ser Asn Met Glu Asn Ala Val Gly Ser Leu Tyr Val Arg Glu420 425 430gcg ttc cct gga gac agc aag agc atg gtc aga gaa ctc att gac aag1344Ala Phe Pro Gly Asp Ser Lys Ser Met Val Arg Glu Leu Ile Asp Lys435 440 445gtg cgg aca gtg ttt gtg gag acg ctg gac gag ctg ggc tgg atg gac1392Val Arg Thr Val Phe Val Glu Thr Leu Asp Glu Leu Gly Trp Met Asp450 455 460gag gag tcc aag aag aag gcg cag gag aag gcc atg agc atc cgg gag1440Glu Glu Ser Lys Lys Lys Ala Gln Glu Lys Ala Met Ser Ile Arg Glu465 470 475 480cag atc ggg cac cct gac tac atc ctg gag gag atg aac agg cgc ctg1488Gln Ile Gly His Pro Asp Tyr Ile Leu Glu Glu Met Asn Arg Arg Leu485 490 495gac gag gag tac tcc aat ctg aac ttc tca gag gac ctg tac ttt gag1536Asp Glu Glu Tyr Ser Asn Leu Asn Phe Ser Glu Asp Leu Tyr Phe Glu500 505 510aac agt ctg cag aac ctc aag gtg ggc gcc cag cgg agc ctc agg aag1584Asn Ser Leu Gln Asn Leu Lys Val Gly Ala Gln Arg Ser Leu Arg Lys515 520 525ctt cgg gaa aag gtg gac cca aat ctc tgg atc atc ggg gcg gcg gtg1632Leu Arg Glu Lys Val Asp Pro Asn Leu Trp Ile Ile Gly Ala Ala Val530 535 540gtc aat gcg ttc tac tcc cca aac cga aac cag att gta ttc cct gcc1680Val Asn Ala Phe Tyr Ser Pro Asn Arg Asn Gln Ile Val Phe Pro Ala545 550 555 560ggg atc ctc cag ccc ccc ttc ttc agc aag gag cag cca cag gcc ttg1728Gly Ile Leu Gln Pro Pro Phe Phe Ser Lys Glu Gln Pro Gln Ala Leu565 570 575aac ttt gga ggc att ggg atg gtg atc ggg cac gag atc acg cac ggc1776Asn Phe Gly Gly Ile Gly Met Val Ile Gly His Glu Ile Thr His Gly580 585 590ttt gac gac aat ggc cgg aac ttc gac aag aat ggc aac atg atg gat1824Phe Asp Asp Asn Gly Arg Asn Phe Asp Lys Asn Gly Asn Met Met Asp595 600 605tgg tgg agt aac ttc tcc acc cag cac ttc cgg gag cag tca gag tgc1872Trp Trp Ser Asn Phe Ser Thr Gln His Phe Arg Glu Gln Ser Glu Cys610 615 620atg atc tac cag tac ggc aac tac tcc tgg gac ctg gca gac gaa cag1920Met Ile Tyr Gln Tyr Gly Asn Tyr Ser Trp Asp Leu Ala Asp Glu Gln625 630 635 640aac gtg aac gga ttc aac acc ctt ggg gaa aac att gct gac aac gga1968Asn Val Asn Gly Phe Asn Thr Leu Gly Glu Asn Ile Ala Asp Asn Gly645 650 655ggg gtg cgg caa gcc tat aag gcc tac ctc aag tgg atg gca gag ggt2016Gly Val Arg Gln Ala Tyr Lys Ala Tyr Leu Lys Trp Met Ala Glu Gly660 665 670ggc aag gac cag cag ctg ccc ggc ctg gat ctc acc cat gag cag ctc2064Gly Lys Asp Gln Gln Leu Pro Gly Leu Asp Leu Thr His Glu Gln Leu675 680 685ttc ttc atc aac tac gcc cag gtg tgg tgc ggg tcc tac cgg ccc gag2112Phe Phe Ile Asn Tyr Ala Gln Val Trp Cys Gly Ser Tyr Arg Pro Glu690 695 700ttc gcc atc caa tcc atc aag aca gac gtc cac agt ccc ctg aag tac2160Phe Ala Ile Gln Ser Ile Lys Thr Asp Val His Ser Pro Leu Lys Tyr705 710 715 720agg gta ctg ggg tcg ctg cag aac ctg gcc gcc ttc gca gac acg ttc2208Arg Val Leu Gly Ser Leu Gln Asn Leu Ala Ala Phe Ala Asp Thr Phe725 730 735cac tgt gcc cgg ggc acc ccc atg cac ccc aag gag cga tgc cgc gtg2256His Cys Ala Arg Gly Thr Pro Met His Pro Lys Glu Arg Cys Arg Val740 745 750tgg tag2262Trp<210>6<211>753<212>PRT<213>人類(Homo sapiens)<400>6Met Gly Lys Ser Glu Gly Pro Val Gly Met Val Glu Ser Ala Gly Arg1 5 10 15Ala Gly Gln Lys Arg Pro Gly Phe Leu Glu Gly Gly Leu Leu Leu Leu20 25 30Leu Leu Leu Val Thr Ala Ala Leu Val Ala Leu Gly Val Leu Tyr Ala35 40 45Asp Arg Arg Gly Ile Pro Glu Ala Gln Glu Val Ser Glu Val Cys Thr50 55 60Thr Pro Gly Cys Val Ile Ala Ala Ala Arg Ile Leu Gln Asn Met Asp65 70 75 80Pro Thr Thr Glu Pro Cys Asp Asp Phe Tyr Gln Phe Ala Cys Gly Gly85 90 95Trp Leu Arg Arg His Val Ile Pro Glu Thr Asn Ser Arg Tyr Ser Ile100 105 110Phe Asp Val Leu Arg Asp Glu Leu Glu Val Ile Leu Lys Ala Val Leu115 120 125Glu Asn Ser Thr Ala Lys Asp Arg Pro Ala Val Glu Lys Ala Arg Thr130 135 140Leu Tyr Arg Ser Cys Met Asn Gln Ser Val Ile Glu Lys Arg Gly Ser145 150 155 160Gln Pro Leu Leu Asp Ile Leu Glu Val Val Gly Gly Trp Pro Val Ala165 170 175Met Asp Arg Trp Asn Glu Thr Val Gly Leu Glu Trp Glu Leu Glu Arg180 185 190Gln Leu Ala Leu Met Asn Ser Gln Phe Asn Arg Arg Val Leu Ile Asp195 200 205Leu Phe Ile Trp Asn Asp Asp Gln Asn Ser Ser Arg His Ile Ile Tyr210 215 220Ile Asp Gln Pro Thr Leu Gly Met Pro Ser Arg Glu Tyr Tyr Phe Asn225 230 235 240Gly Gly Ser Asn Arg Lys Val Arg Glu Ala Tyr Leu Gln Phe Met Val245 250 255Ser Val Ala Thr Leu Leu Arg Glu Asp Ala Asn Leu Pro Arg Asp Ser260 265 270Cys Leu Val Gln Glu Asp Met Met Gln Val Leu Glu Leu Glu Thr Gln275 280 285Leu Ala Lys Ala Thr Val Pro Gln Glu Glu Arg His Asp Val Ile Ala290 295 300Leu Tyr His Arg Met Gly Leu Glu Glu Leu Gln Ser Gln Phe Gly Leu305 310 315 320Lys Gly Phe Asn Trp Thr Leu Phe Ile Gln Thr Val Leu Ser Sar Val325 330 335Lys Ile Lys Leu Leu Pro Asp Glu Glu Val Val Val Tyr Gly Ile Pro
340 345 350Tyr Leu Gln Asn Leu Glu Asn Ile Ile Asp Thr Tyr Ser Ala Arg Thr355 360 365Ile Gln Asn Tyr Leu Val Trp Arg Leu Val Leu Asp Arg Ile Gly Ser370 375 380Leu Ser Gln Arg Phe Lys Asp Thr Arg Val Asn Tyr Arg Lys Ala Leu385 390 395 400Phe Gly Thr Met Val Glu Glu Val Arg Trp Arg Glu Cys Val Gly Tyr405 410 415Val Asn Ser Asn Met Glu Asn Ala Val Gly Ser Leu Tyr Val Arg Glu420 425 430Ala Phe Pro Gly Asp Ser Lys Ser Met Val Arg Glu Leu Ile Asp Lys435 440 445Val Arg Thr Val Phe Val Glu Thr Leu Asp Glu Leu Gly Trp Met Asp450 455 460Glu Glu Ser Lys Lys Lys Ala Gln Glu Lys Ala Met Ser Ile Arg Glu465 470 475 480Gln Ile Gly His Pro Asp Tyr Ile Leu Glu Glu Met Asn Arg Arg Leu485 490 495Asp Glu Glu Tyr Ser Asn Leu Asn Phe Ser Glu Asp Leu Tyr Phe Glu500 505 510Asn Ser Leu Gln Asn Leu Lys Val Gly Ala Gln Arg Ser Leu Arg Lys515 520 525Leu Arg Glu Lys Val Asp Pro Asn Leu Trp Ile Ile Gly Ala Ala Val530 535 540Val Asn Ala Phe Tyr Ser Pro Asn Arg Asn Gln Ile Val Phe Pro Ala545 550 555 560Gly Ile Leu Gln Pro Pro Phe Phe Ser Lys Glu Gln Pro Gln Ala Leu565 570 575Asn Phe Gly Gly Ile Gly Met Val Ile Gly His Glu Ile Thr His Gly580 585 590Phe Asp Asp Asn Gly Arg Asn Phe Asp Lys Asn Gly Asn Met Met Asp595 600 605Trp Trp Ser Asn Phe Ser Thr Gln His Phe Arg Glu Gln Ser Glu Cys610 615 620Met Ile Tyr Gln Tyr Gly Asn Tyr Ser Trp Asp Leu Ala Asp Glu Gln625 630 635 640Asn Val Asn Gly Phe Asn Thr Leu Gly Glu Asn Ile Ala Asp Asn Gly645 650 655Gly Val Arg Gln Ala Tyr Lys Ala Tyr Leu Lys Trp Met Ala Glu Gly660 665 670Gly Lys Asp Gln Gln Leu Pro Gly Leu Asp Leu Thr His Glu Gln Leu675 680 685Phe Phe Ile Asn Tyr Ala Gln Val Trp Cys Gly Ser Tyr Arg Pro Glu690 695 700Phe Ala Ile Gln Ser Ile Lys Thr Asp Val His Ser Pro Leu Lys Tyr705 710 715 720Arg Val Leu Gly Ser Leu Gln Asn Leu Ala Ala Phe Ala Asp Thr Phe725 730 735His Cys Ala Arg Gly Thr Pro Met His Pro Lys Glu Arg Cys Arg Val740 745 750Trp<210>7<211>18<212>DNA<213>人工序列<220><223>人工序列的描述反向引物<400>7acacggcatc gctccttg 18<210>8<211>25<212>DNA<213>人工序列<220><223>人工序列的描述簡并正向引物<400>8ccccctggac ggtgaaygcn twyta 25<210>9<211>27<212>DNA<213>人工序列<220><223>人工序列的描述反向引物<400>9aatccgttca cgttctgttc gtctgcc 27<210>10<211>24<212>DNA<213>人工序列<220><223>人工序列的描述簡并正向引物<400>10cctggaggag ctgvhntgga tgra24<210>11<211>27<212>DNA<213>人工序列<220><223>人工序列的描述銜接頭引物<400>11ccatcctaat acgactcact atagggc 27<210>12<211>23<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>12gtccttgcca ccctctgcca tcc 23<210>13<211>26<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>13accacccccg ccccgatgat ccagag 26<210>14<211>28<212>DNA<213>人工序列<220><223>人工序列的描述特異反義引物/反向寡核苷酸引物<400>14acagccggct agcaaggcgt ggcagctg28<210>15<211>28<212>DNA<213>人工序列<220><223>人工序列的描述特異反義引物<400>15acgacagccg gctagcaagg cgtggcag 28<210>16<211>24<212>DNA<213>人工序列<220><223>人工序列的描述簡并正向引物<400>16ggnctsatgg tnctsctsct scts24<210>17<211>22<212>DNA<213>人工序列<220><223>人工序列的描述特異正向引物<400>17ctcctgagtg agcaaaggtt cc 22<210>18<211>24<212>DNA<213>人工序列<220><223>人工序列的描述特異反向引物<400>18gcaaactggt agaagtcgtc acac24<210>19<211>40<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>19gacaaggcct attatgccga gatcgtgctg cagccgctcg 40<210>20<211>40<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>20aaggccagca acagggcccc cgagcggctg cagcacgatc 40<210>21<211>40<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>21ggggccctgt tgctggcctt gctgcttcaa gcctccatgg 40<210>22<211>40<212>DNA<213>人工序列<220><223>人工序列的描述簡并引物<400>22gtgagaaccg ccacgcactt ccatggaggc ttgaagcagc 40<210>23<211>40<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>23aagtgcgtgg cggttctcac catcaccacc atcacagcga 40<210>24<211>40<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>24agccaggggt ggtgcagacc tcgctgtgat ggtggtgatg 40<210>25<211>40<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>25ggtctgcacc acccctggct gcgtgatagc agctgccagg 40<210>26<211>40<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>26gggtccatgt tctggaggat cctggcagct gctatcacgc 40<210>27<211>16<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>27gacaaggcct attatg 16<210>28<211>14<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>28gggtccatgt tctg 14<210>29<211>14<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>29agcgaggtct gcac 14<210>30<211>15<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>30gtagatgatg tgccg 15<210>31<211>38<212>DNA<213>人工序列<220><223>人工序列的描述引物<400>31gcactagtct tggctaccac acgcggcatc gctccttg 38
權利要求
1.包含與選自SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6的氨基酸序列之一在其全長上具有至少70%同一性的氨基酸序列的分離多肽。
2.權利要求1的分離多肽,其中氨基酸序列與選自SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6之一的氨基酸序列在其全長上具有至少95%同一性。
3.權利要求1的分離多肽,其包含選自SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6之一的氨基酸序列。
4.SEQ ID NO2、SEQ ID NO4、或SEQ ID NO6之一的分離多肽或其片段。
5.權利要求1-4任一項的任何分離多肽的分離片段,其顯示金屬蛋白酶或者結構或功能相關酶的至少一種特征性活性。
6.權利要求1-4任一項的分離多肽或者權利要求5的分離片段,其是人類多肽或人類多肽片段。
7.分離多核苷酸,其包含的一段核苷酸序列編碼的多肽與選自SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6之一的氨基酸序列在其全長上具有至少70%同一性,或包含與所述分離多核苷酸互補的核苷酸序列。
8.分離多核苷酸,其包含的一段核苷酸序列與編碼選自SEQ IDNO2、SEQ ID NO4、和SEQ ID NO6的多肽的核苷酸序列在其全長編碼區(qū)上具有至少70%同一性,或包含與所述分離多核苷酸互補的核苷酸序列。
9.分離多核苷酸,其包含與選自SEQ ID NO1、SEQ ID NO3、和SEQ ID NO5的核苷酸序列在其全長上具有至少70%同一性的核苷酸序列,或與所述分離多核苷酸互補的核苷酸序列。
10.權利要求7-9任一項的分離多核苷酸,其中同一性是至少95%。
11.選自下組的分離多核苷酸(a)包含編碼選自SEQ ID NO2、SEQ ID NO4、和SEQ ID NO6之一的多肽的核苷酸序列的多核苷酸;(b)選自SEQ ID NO1、SEQ ID NO3、和SEQ ID NO5的多核苷酸;和(c)可通過在嚴謹雜交條件下用具有選自SEQ ID NO1、SEQ IDNO3、和SEQ ID NO5的序列或其片段的經標記探針篩選合適文庫獲得的多核苷酸;或包含與所述分離多核苷酸互補的核苷酸序列。
12.編碼權利要求5的多肽片段的分離多核苷酸片段,或與所述分離多核苷酸片段互補的核苷酸序列。
13.權利要求7-12任一項的多核苷酸,其是DNA或RNA。
14.權利要求7-13任一項的多核苷酸,其是人類多核苷酸。
15.包含多核苷酸的表達系統(tǒng),當所述表達系統(tǒng)存在于相容宿主細胞中時,所述多核苷酸能夠生成權利要求1-6任一項的多肽。
16.包含權利要求1 5的表達系統(tǒng)的宿主細胞或其表達權利要求1-6任一項的多肽的膜。
17.用于生產權利要求1-6任一項的多肽的方法,包括在足以生成所述多肽的條件下培養(yǎng)權利要求16的宿主細胞并由培養(yǎng)物培養(yǎng)基回收多肽。
18.針對權利要求1-4任一項的多肽、權利要求5的多肽片段、或權利要求6的多肽的免疫特異性抗體。
19.用于鑒定可影響權利要求1-4任一項的多肽、權利要求5的多肽片段、或權利要求6的多肽的活性的化合物的篩選方法,包括(a)使攜帶權利要求1-6任一項的多肽的權利要求1 6的細胞或膜、權利要求1-4的多肽、權利要求5的多肽片段、或權利要求6的多肽接觸候選化合物;并(b)評估所述候選化合物是否導致對所述多肽活性的刺激或抑制。
20.用于鑒定可刺激或抑制權利要求1-4的多肽、或權利要求5的多肽片段、或權利要求6的多肽的功能的化合物的篩選方法,包括選自下組的方法(a)在存在所述多肽的合適底物的情況下,測量候選化合物對該多肽、攜帶該多肽的細胞或膜、或者其融合蛋白的活性的影響;(b)在存在所述多肽的競爭物的情況下,測量候選化合物對該多肽、攜帶該多肽的細胞或膜、或者其融合蛋白的活性的影響;(c)使用適用于該多肽活性或者攜帶多肽的細胞或膜的檢測系統(tǒng),測試候選化合物是否導致由所述多肽的激活或抑制生成的信號;(d)混合候選化合物與含權利要求1的多肽的溶液和合適底物以形成混合物,測量混合物中該多肽的活性,并比較混合物的活性與不含候選化合物的標準;或(e)使用例如ELISA測定法,檢測候選化合物對細胞中編碼所述多肽的mRNA和所述多肽的生成的影響。
21.權利要求19或20的方法,其中篩選用于鑒定適用于治療和/或預防心血管疾病的化合物。
22.通過權利要求19-21任一項的任何方法鑒定的針對權利要求1-4的多肽、權利要求5的多肽片段、或權利要求6的多肽的刺激物或抑制物。
23.用于治療的化合物,其選自下組(a)通過權利要求19-21任一項的任何方法鑒定的針對權利要求1-4和6的多肽的刺激物或抑制物;(b)通過權利要求19-21任一項的任何方法鑒定的針對權利要求5或6的多肽片段的刺激物或抑制物;(c)權利要求7-14的分離多核苷酸;或(d)調控編碼權利要求1的多肽的核苷酸序列表達的核酸分子。
24.用于診斷受試者體內的疾病或疾病易感性的方法,所述疾病與受試者體內權利要求1的多肽的表達或活性有關,該方法包括(a)測定所述受試者基因組中編碼所述多肽的核苷酸序列中是否存在突變;和/或(b)分析由所述受試者衍生的樣品中所述多肽表達的存在或數(shù)量。
25.用于治療需要增強IGS5活性的受試者的方法,包括(a)對該受試者施用治療有效量的所述IGS5的刺激物;和/或(b)以某種形式向受試者提供IGS5多核苷酸從而實現(xiàn)體內生成所述IGS5活性。
26.用于治療需要降低IGS5活性的受試者的方法,包括(a)對該受試者施用治療有效量的所述IGS5的抑制物,該抑制物是經過權利要求19-21任一項的任何方法鑒定的;和/或(b)對受試者施用抑制編碼所述IGS5的核苷酸序列表達的核酸分子;和/或(c)對受試者施用治療有效量的與所述IGS5競爭其底物的多肽;和/或(d)對受試者施用治療有效量的可降解所述IGS5的多肽;和/或(e)對受試者施用能增強編碼可降解所述IGS5的多肽的核苷酸序列表達的核酸分子。
27.依照權利要求22的刺激物或抑制物或者依照權利要求23用于治療的化合物,用于治療和/或預防心血管疾病的用途。
28.依照權利要求24的診斷方法或者依照權利要求25或26的治療方法,其中疾病或IGS5活性的增強或降低與心血管疾病有聯(lián)系。
全文摘要
本發(fā)明涉及最近鑒定的下文稱為IGS5的多肽和編碼這些多肽的多核苷酸,它們在治療中和在鑒定可能是潛在可用于治療的刺激物和/或抑制物的化合物中的用途,以及這些多肽和多核苷酸的生成。所述多肽和多核苷酸涉及金屬蛋白酶家族,優(yōu)選人型。本發(fā)明還涉及抑制或刺激/激活這些多肽和多核苷酸的作用,包含所述多核苷酸的載體,以及包含所述載體的宿主細胞。本發(fā)明還涉及用于篩選能夠擔當所述IGS5酶的刺激物或抑制物的化合物的方法。本發(fā)明的多肽在幾種機能障礙、紊亂、和疾病方面受到關注。本發(fā)明的多肽在心血管疾病中特別受到關注。
文檔編號A61P25/00GK1399678SQ00815837
公開日2003年2月26日 申請日期2000年11月17日 優(yōu)先權日1999年11月19日
發(fā)明者W·德利爾斯奈德, R·韋格斯, M·韋斯克 申請人:索爾瓦藥物有限公司