專利名稱:一種新的多肽——鋅指蛋白79和編碼這種多肽的多核苷酸的制作方法
技術領域:
本發(fā)明屬于生物技術領域,具體地說,本發(fā)明描述了一種新的多肽--鋅指蛋白79,以及編碼此多肽的多核苷酸序列。本發(fā)明還涉及此多核苷酸和多肽的制備方法和應用。
真核基因的轉(zhuǎn)錄調(diào)控對于基因的正常表達及發(fā)揮生物學功能是十分重要的,通常由轉(zhuǎn)錄調(diào)控因子來完成這一過程。轉(zhuǎn)錄調(diào)控因子在生物體內(nèi)參與決定基因在何種組織及何種發(fā)育階段開始轉(zhuǎn)錄,編碼這類蛋白的基因如發(fā)生突變,不但該基因自身不能正常表達,而且受其調(diào)節(jié)的許多基因也不能正常的進行轉(zhuǎn)錄與表達。轉(zhuǎn)錄因子對基因表達的調(diào)控主要通過轉(zhuǎn)錄因子與特定的DNA序列結合、轉(zhuǎn)錄因子間的相互作用及轉(zhuǎn)錄因子與常規(guī)轉(zhuǎn)錄機構的相互作用在完成。根據(jù)結構基序的不同,已知的DNA結合蛋白可主要分為兩類含有螺旋-轉(zhuǎn)角-螺旋基序的蛋白及鋅指蛋白[Kamal Chowdhury,Heidi Rohdewohld et al.,Nucleic AcidsResearch,1988,169995-10011]。
鋅指蛋白為編碼鋅離子介導的核苷酸結合蛋白多基因家族中的成員,鋅指蛋白按其結構特征又可分為各種不同的家族。人們已從酵母、果蠅、鼠及人等多種生物體中分離得到了各種類型的鋅指蛋白。果蠅Kruppel基因類似的鋅指蛋白分布最為廣泛,且在生物體內(nèi)有著重要的生物學功能。這些基因均含有鋅指蛋白的特征性連續(xù)重復的C2-H2鋅指蛋白結構域。研究發(fā)現(xiàn),這些蛋白與基因的轉(zhuǎn)錄活化及抑制有關,這些蛋白的表達異常將引發(fā)各種發(fā)育紊亂性疾病、各種腫瘤的發(fā)生、各種遺傳性疾病及免疫系統(tǒng)疾病[Kamal Chowdhury,Heidi Rohdewohld etal.,Nucleic Acids Research,1988,169995-10011]。
所有的鋅指蛋白Kruppel家族的成員均含有28-30個氨基酸長的保守的指重復序列(F/Y)XCXXCXXXFXXXXXLXXHXXXHTGEKP,其中一些特定的氨基酸殘基位點為高度保守的。這一序列在很多不同的鋅指蛋白中均含有多個拷貝,其拷貝數(shù)不同(鋅指個數(shù)不同)則功能也不同。鋅指蛋白與不同長度的DNA的結合依賴于指結構的數(shù)量,多指結構可能與復合物的結合穩(wěn)定性有關,而復合物是RNA聚合酶轉(zhuǎn)錄的作用位點。研究發(fā)現(xiàn),許多鋅指蛋白的鋅指結構域相互連接區(qū)域也是高度保守的,這一區(qū)域通常含有下列序列His-Thr-Gly-Gly-Lys-Pro-(Tyr,Phe)-X-Cys,其中組氨酸與半胱氨酸為金屬離子的結合位點,而X為可變氨基酸殘基。這一區(qū)域?qū)τ阡\指結構的形成是必需的,指結構的數(shù)量將直接影響鋅指蛋白與不同長度的DNA結合,且多指結構與復合物的結合穩(wěn)定性有關[Jeremy M.Berg,Annu.Rev.Biophys.Chem,1990,19405-421]。
人類T細胞白血病病毒Ⅰ(HTLV-1)是成熟T細胞白血病的病原體,它能導致典型的痙攣性截癱[Hinuma,Y.etal.,Proc.Natl.Acad.Sci.USA,1981,786476-6480][Poiesz,B.etal.,Nature,1981,294,268-271][Osame,M.et al.,Lancer,1985,1031]。HTLV-1是通過寄主的核因子調(diào)節(jié)其5端長重復序列(LTR)表達的。LTR包含三個區(qū)域,其中一個叫U5RE區(qū)域。該區(qū)域能結合一個蛋白叫HUB1,它能在轉(zhuǎn)錄水平上抑制LTR的表達[Koichi,O.et al.,Nucleic Acids Res,1997,25(24)5025-5032]。
HUB1有671個氨基酸殘基,包含5個鋅指蛋白的指結構域,以及1個Kruppel類盒(KRAB)結構域。HUB1的鋅指結構位于C末端的第518氨基酸和657氨基酸之間,該鋅指蛋白屬于上文所訴的Kruppel家族類型中的抑制蛋白,是Kruppel家族的新成員。HUB1的KRAN結構域位于196氨基酸和261氨基酸之間,富含帶電核的氨基酸,大部分位于靠近Kruppel鋅指結構和調(diào)節(jié)轉(zhuǎn)錄抑制的起始位點附近的N末端[Bellefroid,E.J.et al.,DNA,1989,8377-387]。HUB1的Kruppel類盒結構域?qū)儆贙RAB中的A類型32-75和403-443之間富含脯氨酸,98-185之間富含亮氨酸,470-503之間富含甘氨酸。
HUB1與U5RE的結合核心基序序列是TCCACCCC。對于整個HUB1而言,1-75的N末端的氨基酸是它執(zhí)行抑制功能所必須的,而74-184氨基酸是HUB1的抑制結構域。抑制結構域中的亮氨酸富含區(qū)對蛋白質(zhì)之間的相互作用起著至關重要的作用。
本發(fā)明人的多肽與HUB1在蛋白質(zhì)水平上有60%的一致性和75%的同源性,并具有相似的結構域,故命名為鋅指蛋白79,并推測其有相似的生物學功能。
由于如上所述鋅指蛋白79蛋白在機體重要功能中起重要作用,而且相信這些調(diào)節(jié)過程中涉及大量的蛋白,因而本領域中一直需要鑒定更多參與這些過程的鋅指蛋白79蛋白,特別是鑒定這種蛋白的氨基酸序列。新鋅指蛋白79蛋白編碼基因的分離也為研究確定該蛋白在健康和疾病狀態(tài)下的作用提供了基礎。這種蛋白可能構成開發(fā)疾病診斷和/或治療藥的基礎,因此分離其編碼DNA是非常重要的。
本發(fā)明的一個目的是提供分離的新的多肽--鋅指蛋白79以及其片段、類似物和衍生物。
本發(fā)明的另一個目的是提供編碼該多肽的多核苷酸。
本發(fā)明的另一個目的是提供含有編碼鋅指蛋白79的多核苷酸的重組載體。
本發(fā)明的另一個目的是提供含有編碼鋅指蛋白79的多核苷酸的基因工程化宿主細胞。
本發(fā)明的另一個目的是提供生產(chǎn)鋅指蛋白79的方法。
本發(fā)明的另一個目的是提供針對本發(fā)明的多肽--鋅指蛋白79的抗體。
本發(fā)明的另一個目的是提供了針對本發(fā)明多肽--鋅指蛋白79的模擬化合物、拮抗劑、激動劑、抑制劑。
本發(fā)明的另一個目的是提供診斷治療與鋅指蛋白79異常相關的疾病的方法。
本發(fā)明涉及一種分離的多肽,該多肽是人源的,它包含具有SEQ ID No.2氨基酸序列的多肽、或其保守性變體、生物活性片段或衍生物。較佳地,該多肽是具有SEQ ID NO2氨基酸序列的多肽。
本發(fā)明還涉及一種分離的多核苷酸,它包含選自下組的一種核苷酸序列或其變體(a)編碼具有SEQ ID No.2氨基酸序列的多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸;(c)與(a)或(b)的多核苷酸序列具有至少70%相同性的多核苷酸。
更佳地,該多核苷酸的序列是選自下組的一種(a)具有SEQ ID NO1中176-1591位的序列;和(b)具有SEQ ID NO1中1-2039位的序列。
本發(fā)明另外涉及一種含有本發(fā)明多核苷酸的載體,特別是表達載體;一種用該載體遺傳工程化的宿主細胞,包括轉(zhuǎn)化、轉(zhuǎn)導或轉(zhuǎn)染的宿主細胞;一種包括培養(yǎng)所述宿主細胞和回收表達產(chǎn)物的制備本發(fā)明多肽的方法。
本發(fā)明還涉及一種能與本發(fā)明多肽特異性結合的抗體。
本發(fā)明還涉及一種篩選的模擬、激活、拮抗或抑制鋅指蛋白79蛋白活性的化合物的方法,其包括利用本發(fā)明的多肽。本發(fā)明還涉及用該方法獲得的化合物。
本發(fā)明還涉及一種體外檢測與鋅指蛋白79蛋白異常表達相關的疾病或疾病易感性的方法,包括檢測生物樣品中所述多肽或其編碼多核苷酸序列中的突變,或者檢測生物樣品中本發(fā)明多肽的量或生物活性。
本發(fā)明也涉及一種藥物組合物,它含有本發(fā)明多肽或其模擬物、激活劑、拮抗劑或抑制劑以及藥學上可接受的載體。
本發(fā)明還涉及本發(fā)明的多肽和/或多核苷酸在制備用于治療癌癥、發(fā)育性疾病或免疫性疾病或其它由于鋅指蛋白79表達異常所引起疾病的藥物的用途。
本發(fā)明的其它方面由于本文的技術的公開,對本領域的技術人員而言是顯而易見的。
本說明書和權利要求書中使用的下列術語除非特別說明具有如下的含義“核酸序列”是指寡核苷酸、核苷酸或多核苷酸及其片段或部分,也可以指基因組或合成的DNA或RNA,它們可以是單鏈或雙鏈的,代表有義鏈或反義鏈。類似地,術語“氨基酸序列”是指寡肽、肽、多肽或蛋白質(zhì)序列及其片段或部分。當本發(fā)明中的“氨基酸序列”涉及一種天然存在的蛋白質(zhì)分子的氨基酸序列時,這種“多肽”或“蛋白質(zhì)”不意味著將氨基酸序列限制為與所述蛋白質(zhì)分子相關的完整的天然氨基酸。
蛋白質(zhì)或多核苷酸“變體”是指一種具有一個或多個氨基酸或核苷酸改變的氨基酸序列或編碼它的多核苷酸序列。所述改變可包括氨基酸序列或核苷酸序列中氨基酸或核苷酸的缺失、插入或替換。變體可具有“保守性”改變,其中替換的氨基酸具有與原氨基酸相類似的結構或化學性質(zhì),如用亮氨酸替換異亮氨酸。變體也可具有非保守性改變,如用色氨酸替換甘氨酸。
“缺失”是指在氨基酸序列或核苷酸序列中一個或多個氨基酸或核苷酸的缺失。
“插入”或“添加”是指在氨基酸序列或核苷酸序列中的改變導致與天然存在的分子相比,一個或多個氨基酸或核苷酸的增加?!疤鎿Q”是指由不同的氨基酸或核苷酸替換一個或多個氨基酸或核苷酸。
“生物活性”是指具有天然分子的結構、調(diào)控或生物化學功能的蛋白質(zhì)。類似地,術語“免疫學活性”是指天然的、重組的或合成蛋白質(zhì)及其片段在合適的動物或細胞中誘導特定免疫反應以及與特異性抗體結合的能力。
“激動劑”是指當與鋅指蛋白79結合時,一種可引起該蛋白質(zhì)改變從而調(diào)節(jié)該蛋白質(zhì)活性的分子。激動劑可以包括蛋白質(zhì)、核酸、碳水化合物或任何其它可結合鋅指蛋白79的分子。
“拮抗劑”或“抑制物”是指當與鋅指蛋白79結合時,一種可封閉或調(diào)節(jié)鋅指蛋白79的生物學活性或免疫學活性的分子。拮抗劑和抑制物可以包括蛋白質(zhì)、核酸、碳水化合物或任何其它可結合鋅指蛋白79的分子。
“調(diào)節(jié)”是指鋅指蛋白79的功能發(fā)生改變,包括蛋白質(zhì)活性的升高或降低、結合特性的改變及鋅指蛋白79的任何其它生物學性質(zhì)、功能或免疫性質(zhì)的改變。
″基本上純″是指基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質(zhì)。本領域的技術人員能用標準的蛋白質(zhì)純化技術純化鋅指蛋白79?;旧霞兊匿\指蛋白79在非還原性聚丙烯酰胺凝膠上能產(chǎn)生單一的主帶。鋅指蛋白79多肽的純度可用氨基酸序列分析。
“互補的”或“互補”是指在允許的鹽濃度和溫度條件下通過堿基配對的多核苷酸天然結合。例如,序列“C-T-G-A”可與互補的序列“G-A-C-T”結合。兩個單鏈分子之間的互補可以是部分的或全部的。核酸鏈之間的互補程度對于核酸鏈之間雜交的效率及強度有明顯影響。
“同源性”是指互補的程度,可以是部分同源或完全同源?!安糠滞础笔侵敢环N部分互補的序列,其至少可部分抑制完全互補的序列與靶核酸的雜交。這種雜交的抑制可通過在嚴格性程度降低的條件下進行雜交(Southern印跡或Northern印跡等)來檢測?;旧贤吹男蛄谢螂s交探針可競爭和抑制完全同源的序列與靶序列在的嚴格性程度降低的條件下的結合。這并不意味嚴格性程度降低的條件允許非特異性結合,因為嚴格性程度降低的條件要求兩條序列相互的結合為特異性或選擇性相互作用。
“相同性百分率”是指在兩種或多種氨基酸或核酸序列比較中序列相同或相似的百分率。可用電子方法測定相同性百分率,如通過MEGALIGN程序(Lasergenesoftware package,DNASTAR,Inc.,Madison Wis.)。MEGALIGN程序可根據(jù)不同的方法如Cluster法比較兩種或多種序列(Higgins,D.G.和P.M.Sharp(1988)Gene 73237-244)。Cluster法通過檢查所有配對之間的距離將各組序列排列成簇。然后將各簇以成對或成組分配。兩個氨基酸序列如序列A和序列B之間的相同性百分率通過下式計算序列A與序列B之間匹配的殘基個數(shù)100序列A的殘基數(shù)-序列A中間隔殘基數(shù)-序列B中間隔殘基數(shù)也可以通過Cluster法或用本領域周知的方法如Jotun Hein測定核酸序列之間的相同性百分率(Hein J.,(1990)Methods in emzumology 183625-645)。
“相似性”是指氨基酸序列之間排列對比時相應位置氨基酸殘基的相同或保守性取代的程度。用于保守性取代的氨基酸例如,帶負電荷的氨基酸可包括天冬氨酸和谷氨酸;帶正電荷的氨基酸可包括賴氨酸和精氨酸;具有不帶電荷的頭部基團有相似親水性的氨基酸可包括亮氨酸、異亮氨酸和纈氨酸;甘氨酸和丙氨酸;天冬酰胺和谷氨酰胺;絲氨酸和蘇氨酸;苯丙氨酸和酪氨酸。
“反義”是指與特定的DNA或RNA序列互補的核苷酸序列?!胺戳x鏈”是指與“有義鏈”互補的核酸鏈。
“衍生物”是指HFP或編碼其的核酸的化學修飾物。這種化學修飾物可以是用烷基、?;虬被鎿Q氫原子。核酸衍生物可編碼保留天然分子的主要生物學特性的多肽。
“抗體”是指完整的抗體分子及其片段,如Fa、F(ab’)2及Fv,其能特異性結合鋅指蛋白79的抗原決定簇。
“人源化抗體”是指非抗原結合區(qū)域的氨基酸序列被替換變得與人抗體更為相似,但仍保留原始結合活性的抗體。
“分離的”一詞指將物質(zhì)從它原來的環(huán)境(例如,若是自然產(chǎn)生的就指其天然環(huán)境)之中移出。比如說,一個自然產(chǎn)生的多核苷酸或多肽存在于活動物中就是沒有被分離出來,但同樣的多核苷酸或多肽同一些或全部在自然系統(tǒng)中與之共存的物質(zhì)分開就是分離的。這樣的多核苷酸可能是某一載體的一部分,也可能這樣的多核苷酸或多肽是某一組合物的一部分。既然載體或組合物不是它天然環(huán)境的成分,它們?nèi)匀皇欠蛛x的。
如本發(fā)明所用,“分離的”是指物質(zhì)從其原始環(huán)境中分離出來(如果是天然的物質(zhì),原始環(huán)境即是天然環(huán)境)。如活體細胞內(nèi)的天然狀態(tài)下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態(tài)中同存在的其他物質(zhì)中分開,則為分離純化的。
如本文所用,“分離的鋅指蛋白79”是指鋅指蛋白79基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質(zhì)。本領域的技術人員能用標準的蛋白質(zhì)純化技術純化鋅指蛋白79?;旧霞兊亩嚯脑诜沁€原聚丙烯酰胺凝膠上能產(chǎn)生單一的主帶。鋅指蛋白79多肽的純度能用氨基酸序列分析。
本發(fā)明提供了一種新的多肽--鋅指蛋白79,其基本上是由SEQ ID NO2所示的氨基酸序列組成的。本發(fā)明的多肽可以是重組多肽、天然多肽、合成多肽,優(yōu)選重組多肽。本發(fā)明的多肽可以是天然純化的產(chǎn)物,或是化學合成的產(chǎn)物,或使用重組技術從原核或真核宿主(例如,細菌、酵母、高等植物、昆蟲和哺乳動物細胞)中產(chǎn)生。根據(jù)重組生產(chǎn)方案所用的宿主,本發(fā)明的多肽可以是糖基化的,或可以是非糖基化的。本發(fā)明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發(fā)明還包括鋅指蛋白79的片段、衍生物和類似物。如本發(fā)明所用,術語“片段”、“衍生物”和“類似物”是指基本上保持本發(fā)明的鋅指蛋白79相同的生物學功能或活性的多肽。本發(fā)明多肽的片段、衍生物或類似物可以是(Ⅰ)這樣一種,其中一個或多個氨基酸殘基被保守或非保守氨基酸殘基(優(yōu)選的是保守氨基酸殘基)取代,并且取代的氨基酸可以是也可以不是由遺傳密碼子編碼的;或者(Ⅱ)這樣一種,其中一個或多個氨基酸殘基上的某個基團被其它基團取代包含取代基;或者(Ⅲ)這樣一種,其中成熟多肽與另一種化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合;或者(Ⅳ)這樣一種,其中附加的氨基酸序列融合進成熟多肽而形成的多肽序列(如前導序列或分泌序列或用來純化此多肽的序列或蛋白原序列)通過本文的闡述,這樣的片段、衍生物和類似物被認為在本領域技術人員的知識范圍之內(nèi)。
本發(fā)明提供了分離的核酸(多核苷酸),基本由編碼具有SEQ ID NO2氨基酸序列的多肽的多核苷酸組成。本發(fā)明的多核苷酸序列包括SEQ ID NO1的核苷酸序列。本發(fā)明的多核苷酸是從人胎腦組織的cDNA文庫中發(fā)現(xiàn)的。它包含的多核苷酸序列全長為2039個堿基,其開放讀框(176-1591)編碼了471個氨基酸。根據(jù)氨基酸序列同源比較發(fā)現(xiàn),此多肽與HUB1有60%的同源性,可推斷出該鋅指蛋白79具有HUB1相似的結構和功能。
本發(fā)明的多核苷酸可以是DNA形式或是RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO1所示的編碼區(qū)序列相同或者是簡并的變異體。如本發(fā)明所用,“簡并的變異體”在本發(fā)明中是指編碼具有SEQ ID NO2的蛋白質(zhì)或多肽,但與SEQ ID NO1所示的編碼區(qū)序列有差別的核酸序列。
編碼SEQ ID NO2的成熟多肽的多核苷酸包括只有成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術語“編碼多肽的多核苷酸”是指包括編碼此多肽的多核苷酸和包括附加編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述描述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的多肽或多肽的片斷、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領域所知的,等位變異體是一個多核苷酸的替換形式,它可能是一個或多個核苷酸的取代、缺失或插入,但不會從實質(zhì)上改變其編碼的多肽的功能。
本發(fā)明還涉及與以上所描述的序列雜交的多核苷酸(兩個序列之間具有至少50%,優(yōu)選具有70%的相同性)。本發(fā)明特別涉及在嚴格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中,“嚴格條件”是指(1)在較低離子強度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時加用變性劑,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時才發(fā)生雜交。并且,可雜交的多核苷酸編碼的多肽與SEQ ID NO2所示的成熟多肽有相同的生物學功能和活性。
本發(fā)明還涉及與以上所描述的序列雜交的核酸片段。如本發(fā)明所用,”核酸片段”的長度至少含10個核苷酸,較好是至少20-30個核苷酸,更好是至少50-60個核苷酸,最好是至少100個核苷酸以上。核酸片段也可用于核酸的擴增技術(如PCR)以確定和/或分離編碼鋅指蛋白79的多核苷酸。
本發(fā)明中的多肽和多核苷酸優(yōu)選以分離的形式提供,更佳地被純化至均質(zhì)。
本發(fā)明的編碼鋅指蛋白79的特異的多核苷酸序列能用多種方法獲得。例如,用本領域熟知的雜交技術分離多核苷酸。這些技術包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源的多核苷酸序列,和2)表達文庫的抗體篩選以檢出具有共同結構特征的克隆的多核苷酸片段。
本發(fā)明的DNA片段序列也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學合成DNA序列以獲得所述多肽的雙鏈DNA。
上述提到的方法中,分離基因組DNA最不常用。DNA序列的直接化學合成是經(jīng)常選用的方法。更經(jīng)常選用的方法是cDNA序列的分離。分離感興趣的cDNA的標準方法是從高表達該基因的供體細胞分離mRNA并進行逆轉(zhuǎn)錄,形成質(zhì)?;蚴删wcDNA文庫。提取mRNA的方法已有多種成熟的技術,試劑盒也可從商業(yè)途徑獲得(Qiagene)。而構建cDNA文庫也是通常的方法(Sambrook,et al.,MolecularCloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。還可得到商業(yè)供應的cDNA文庫,如Clontech公司的不同cDNA文庫。當結合使用聚合酶反應技術時,即使極少的表達產(chǎn)物也能克隆。
可用常規(guī)方法從這些cDNA文庫中篩選本發(fā)明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交;(2)標志基因功能的出現(xiàn)或喪失;(3)測定鋅指蛋白79的轉(zhuǎn)錄本的水平;(4)通過免疫學技術或測定生物學活性,來檢測基因表達的蛋白產(chǎn)物。上述方法可單用,也可多種方法聯(lián)合應用。
在第(1)種方法中,雜交所用的探針是與本發(fā)明的多核苷酸的任何一部分同源,其長度至少10個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸。此外,探針的長度通常在2000個核苷酸之內(nèi),較佳的為1000個核苷酸之內(nèi)。此處所用的探針通常是在本發(fā)明的基因序列信息的基礎上化學合成的DNA序列。本發(fā)明的基因本身或者片段當然可以用作探針。DNA探針的標記可用放射性同位素,熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中,檢測鋅指蛋白79基因表達的蛋白產(chǎn)物可用免疫學技術如Western印跡法,放射免疫沉淀法,酶聯(lián)免疫吸附法(ELISA)等。
應用PCR技術擴增DNA/RNA的方法(Saiki,et al.Science1985;2301350-1354)被優(yōu)選用于獲得本發(fā)明的基因。特別是很難從文庫中得到全長的cDNA時,可優(yōu)選使用RACE法(RACE-cDNA末端快速擴增法),用于PCR的引物可根據(jù)本文所公開的本發(fā)明的多核苷酸序列信息適當?shù)剡x擇,并可用常規(guī)方法合成。可用常規(guī)方法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
如上所述得到的本發(fā)明的基因,或者各種DNA片段等的多核苷酸序列可用常規(guī)方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,745463-5467)測定。這類多核苷酸序列測定也可用商業(yè)測序試劑盒等。為了獲得全長的cDNA序列,測序需反復進行。有時需要測定多個克隆的cDNA序列,才能拼接成全長的cDNA序列。
本發(fā)明也涉及包含本發(fā)明的多核苷酸的載體,以及用本發(fā)明的載體或直接用鋅指蛋白79編碼序列經(jīng)基因工程產(chǎn)生的宿主細胞,以及經(jīng)重組技術產(chǎn)生本發(fā)明所述多肽的方法。
本發(fā)明中,編碼鋅指蛋白79的多核苷酸序列可插入到載體中,以構成含有本發(fā)明所述多核苷酸的重組載體。術語“載體”指本領域熟知的細菌質(zhì)粒、噬菌體、酵母質(zhì)粒、植物細胞病毒、哺乳動物細胞病毒如腺病毒、逆轉(zhuǎn)錄病毒或其它載體。在本發(fā)明中適用的載體包括但不限于在細菌中表達的基于T7啟動子的表達載體(Rosenberg,et al.Gene,1987,56125);在哺乳動物細胞中表達的pMSXND表達載體(Lee and Nathans,J Bio Chem.2633521,1988)和在昆蟲細胞中表達的來源于桿狀病毒的載體??傊灰茉谒拗黧w內(nèi)復制和穩(wěn)定,任何質(zhì)粒和載體都可以用于構建重組表達載體。表達載體的一個重要特征是通常含有復制起始點、啟動子、標記基因和翻譯調(diào)控元件。
本領域的技術人員熟知的方法能用于構建含編碼鋅指蛋白79的DNA序列和合適的轉(zhuǎn)錄/翻譯調(diào)控元件的表達載體。這些方法包括體外重組DNA技術、DNA合成技術、體內(nèi)重組技術等(Sambroook,et al.Molecular Cloning,a LaboratoryManual,cold Spring Harbor Laboratory.New York,1989)。所述的DNA序列可有效連接到表達載體中的適當啟動子上,以指導mRNA合成。這些啟動子的代表性例子有大腸桿菌的lac或trp啟動子;λ噬菌體的PL啟動子;真核啟動子包括CMV立即早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、反轉(zhuǎn)錄病毒的LTRs和其它一些已知的可控制基因在原核細胞或真核細胞或其病毒中表達的啟動子。表達載體還包括翻譯起始用的核糖體結合位點和轉(zhuǎn)錄終止子等。在載體中插入增強子序列將會使其在高等真核細胞中的轉(zhuǎn)錄得到增強。增強子是DNA表達的順式作用因子,通常大約有10到300個堿基對,作用于啟動子以增強基因的轉(zhuǎn)錄??膳e的例子包括在復制起始點晚期一側(cè)的100到270個堿基對的SV40增強子、在復制起始點晚期一側(cè)的多瘤增強子以及腺病毒增強子等。
此外,表達載體優(yōu)選地包含一個或多個選擇性標記基因,以提供用于選擇轉(zhuǎn)化的宿主細胞的表型性狀,如真核細胞培養(yǎng)用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP),或用于大腸桿菌的四環(huán)素或氨芐青霉素抗性等。
本領域一般技術人員都清楚如何選擇適當?shù)妮d體/轉(zhuǎn)錄調(diào)控元件(如啟動子、增強子等)和選擇性標記基因。
本發(fā)明中,編碼鋅指蛋白79的多核苷酸或含有該多核苷酸的重組載體可轉(zhuǎn)化或轉(zhuǎn)導入宿主細胞,以構成含有該多核苷酸或重組載體的基因工程化宿主細胞。術語“宿主細胞”指原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高等真核細胞,如哺乳動物細胞。代表性例子有大腸桿菌,鏈霉菌屬;細菌細胞如鼠傷寒沙門氏菌;真菌細胞如酵母;植物細胞;昆蟲細胞如果蠅S2或Sf9;動物細胞如CHO、COS或Bowes黑素瘤細胞等。
用本發(fā)明所述的DNA序列或含有所述DNA序列的重組載體轉(zhuǎn)化宿主細胞可用本領域技術人員熟知的常規(guī)技術進行。當宿主為原核生物如大腸桿菌時,能吸收DNA的感受態(tài)細胞可在指數(shù)生長期后收獲,用CaCl2法處理,所用的步驟在本領域眾所周知??晒┻x擇的是用MgCl2。如果需要,轉(zhuǎn)化也可用電穿孔的方法進行。
當宿主是真核生物,可選用如下的DNA轉(zhuǎn)染方法磷酸鈣共沉淀法,或者常規(guī)機械方法如顯微注射、電穿孔、脂質(zhì)體包裝等。
通過常規(guī)的重組DNA技術,利用本發(fā)明的多核苷酸序列可用來表達或生產(chǎn)重組的鋅指蛋白79(Science,1984;2241431)。一般來說有以下步驟(1).用本發(fā)明的編碼人鋅指蛋白79的多核苷酸(或變異體),或用含有該多核苷酸的重組表達載體轉(zhuǎn)化或轉(zhuǎn)導合適的宿主細胞;(2).在合適的培養(yǎng)基中培養(yǎng)宿主細胞;(3).從培養(yǎng)基或細胞中分離、純化蛋白質(zhì)。
在步驟(2)中,根據(jù)所用的宿主細胞,培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細胞生長的條件下進行培養(yǎng)。當宿主細胞生長到適當?shù)募毎芏群?,用合適的方法(如溫度轉(zhuǎn)換或化學誘導)誘導選擇的啟動子,將細胞再培養(yǎng)一段時間。
在步驟(3)中,重組多肽可包被于細胞內(nèi)、或在細胞膜上表達、或分泌到細胞外。如果需要,可利用其物理的、化學的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領域技術人員所熟知的。這些方法包括但并不限于常規(guī)的復性處理、蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超聲波處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術及這些方法的結合。
本發(fā)明的多肽以及該多肽的拮抗劑、激動劑和抑制劑可直接用于疾病治療,例如,可治療惡性腫瘤、腎上腺缺乏癥、皮膚病、各類炎癥、HIV感染和免疫性疾病等。
本發(fā)明的多肽以及該多肽的拮抗劑、激動劑和抑制劑可直接用于疾病治療,例如,可治療各種惡性腫瘤及癌癥;發(fā)育紊亂、免疫系統(tǒng)代謝紊亂所引發(fā)的各種疾病等。
鋅指蛋白家族的成員數(shù)量繁多,在生物體內(nèi)的分布非常廣泛,其中大多數(shù)為真核轉(zhuǎn)錄調(diào)節(jié)因子,在真核生物體內(nèi)負責激活或抑制各種基因的表達。研究發(fā)現(xiàn),該家族的成員在人的各種組織中均有表達,這些組織包括造血細胞、腦、神經(jīng)系統(tǒng)、表皮組織、各種與分泌吸收相關的組織及與腫瘤和無限增殖細胞系相關的組織等。因而,該家族的成員對生物體內(nèi)各種組織的分化及發(fā)育都起著十分重要的作用。它們在生物體內(nèi)可有效地控制各種基因的轉(zhuǎn)錄水平,其表達異常可能會導致細胞的異常分化及增殖,從而引發(fā)各種疾病,如癌癥及各種免疫系統(tǒng)疾病。
具體就鋅指蛋白79而言,本發(fā)明的多肽或其片段或其衍生物可以用來預防及治療各種因細胞表達、分化及增殖異常所引發(fā)的疾病。這些疾病包括但不限于以下種類各種細胞及組織的癌癥,包括急性白血病,慢性粒性白血病,慢性淋巴細胞性白血病,慢性單核細胞性白血病、淋巴瘤、淋巴肉瘤、骨髓瘤、神經(jīng)瘤、神經(jīng)膠質(zhì)瘤、腦膜瘤、神經(jīng)纖維瘤及星形細胞瘤等;及各種組織及器官的疾病,包括腎上腺、甲狀腺、肺、胰、肝、前列腺、子宮、膀胱、腎、睪丸及胃腸道(小腸、結腸、直腸和胃);還包括一些與代謝紊亂相關的疾病,包括甲狀腺功能亢進、甲狀腺功能減退、胃炎、結腸息肉、胃十二指腸潰瘍等疾病。
鋅指蛋白79表達異常還可能會引發(fā)各種獲得性及遺傳性疾病和免疫系統(tǒng)代謝紊亂所引發(fā)的疾病,如裂手、先天性生殖道畸形、貝魏二氏綜合癥等疾病。
本發(fā)明也提供了篩選化合物以鑒定提高(激動劑)或阻遏(拮抗劑)鋅指蛋白79的藥劑的方法。激動劑提高鋅指蛋白79刺激細胞增殖等生物功能,而拮抗劑阻止和治療與細胞過度增殖有關的紊亂如各種癌癥。例如,能在藥物的存在下,將哺乳動物細胞或表達鋅指蛋白79的膜制劑與標記的鋅指蛋白79一起培養(yǎng)。然后測定藥物提高或阻遏此相互作用的能力。
鋅指蛋白79的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。鋅指蛋白79的拮抗劑可以與鋅指蛋白79結合并消除其功能,或是抑制該多肽的產(chǎn)生,或是與該多肽的活性位點結合使該多肽不能發(fā)揮生物學功能。
在篩選作為拮抗劑的化合物時,可以將鋅指蛋白79加入生物分析測定中,通過測定化合物對鋅指蛋白79和其受體之間相互作用的影響來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。能與鋅指蛋白79結合的多肽分子可通過篩選由各種可能組合的氨基酸結合于固相物組成的隨機多肽庫而獲得。篩選時,一般應對鋅指蛋白79分子進行標記。
本發(fā)明提供了用多肽,及其片段、衍生物、類似物或它們的細胞作為抗原以生產(chǎn)抗體的方法。這些抗體可以是多克隆抗體或單克隆抗體。本發(fā)明還提供了針對鋅指蛋白79抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達文庫產(chǎn)生的片段。
多克隆抗體的生產(chǎn)可用鋅指蛋白79直接注射免疫動物(如家兔,小鼠,大鼠等)的方法得到,多種佐劑可用于增強免疫反應,包括但不限于弗氏佐劑等。制備鋅指蛋白79的單克隆抗體的技術包括但不限于雜交瘤技術(Kohler andMilstein.Nature,1975,256495-497),三瘤技術,人B-細胞雜交瘤技術,EBV-雜交瘤技術等。將人恒定區(qū)和非人源的可變區(qū)結合的嵌合抗體可用已有的技術生產(chǎn)(Morrison et al,PNAS,1985,816851)。而已有的生產(chǎn)單鏈抗體的技術(U.S.Pat No.4946778)也可用于生產(chǎn)抗鋅指蛋白79的單鏈抗體。
抗鋅指蛋白79的抗體可用于免疫組織化學技術中,檢測活檢標本中的鋅指蛋白79。
與鋅指蛋白79結合的單克隆抗體也可用放射性同位素標記,注入體內(nèi)可跟蹤其位置和分布。這種放射性標記的抗體可作為一種非創(chuàng)傷性診斷方法用于腫瘤細胞的定位和判斷是否有轉(zhuǎn)移。
抗體還可用于設計針對體內(nèi)某一特殊部位的免疫毒素。如鋅指蛋白79高親和性的單克隆抗體可與細菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價結合。一種通常的方法是用巰基交聯(lián)劑如SPDP,攻擊抗體的氨基,通過二硫鍵的交換,將毒素結合于抗體上,這種雜交抗體可用于殺滅鋅指蛋白79陽性的細胞。
本發(fā)明中的抗體可用于治療或預防與鋅指蛋白79相關的疾病。給予適當劑量的抗體可以刺激或阻斷鋅指蛋白79的產(chǎn)生或活性。
本發(fā)明還涉及定量和定位檢測鋅指蛋白79水平的診斷試驗方法。這些試驗是本領域所熟知的,且包括FISH測定和放射免疫測定。試驗中所檢測的鋅指蛋白79水平,可以用作解釋鋅指蛋白79在各種疾病中的重要性和用于診斷鋅指蛋白79起作用的疾病。
本發(fā)明的多肽還可用作肽譜分析,例如,多肽可用物理的、化學或酶進行特異性切割,并進行一維或二維或三維的凝膠電泳分析,更好的是進行質(zhì)譜分析。
編碼鋅指蛋白79的多核苷酸也可用于多種治療目的?;蛑委熂夹g可用于治療由于鋅指蛋白79的無表達或異常/無活性表達所致的細胞增殖、發(fā)育或代謝異常。重組的基因治療載體(如病毒載體)可設計用于表達變異的鋅指蛋白79,以抑制內(nèi)源性的鋅指蛋白79活性。例如,一種變異的鋅指蛋白79可以是縮短的、缺失了信號傳導功能域的鋅指蛋白79,雖可與下游的底物結合,但缺乏信號傳導活性。因此重組的基因治療載體可用于治療鋅指蛋白79表達或活性異常所致的疾病。來源于病毒的表達載體如逆轉(zhuǎn)錄病毒、腺病毒、腺病毒相關病毒、單純皰疹病毒、細小病毒等可用于將編碼鋅指蛋白79的多核苷酸轉(zhuǎn)移至細胞內(nèi)。構建攜帶編碼鋅指蛋白79的多核苷酸的重組病毒載體的方法可見于已有文獻(Sambrook,et al.)。另外重組編碼鋅指蛋白79的多核苷酸可包裝到脂質(zhì)體中轉(zhuǎn)移至細胞內(nèi)。
多核苷酸導入組織或細胞內(nèi)的方法包括將多核苷酸直接注入到體內(nèi)組織中;或在體外通過載體(如病毒、噬菌體或質(zhì)粒等)先將多核苷酸導入細胞中,再將細胞移植到體內(nèi)等。
抑制鋅指蛋白79 mRNA的寡核苷酸(包括反義RNA和DNA)以及核酶也在本發(fā)明的范圍之內(nèi)。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機制是核酶分子與互補的靶RNA特異性雜交后進行核酸內(nèi)切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術獲得,如固相磷酸酰胺化學合成法合成寡核苷酸的技術已廣泛應用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內(nèi)轉(zhuǎn)錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動子的下游。為了增加核酸分子的穩(wěn)定性,可用多種方法對其進行修飾,如增加兩側(cè)的序列長度,核糖核苷之間的連接應用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
編碼鋅指蛋白79的多核苷酸可用于與鋅指蛋白79的相關疾病的診斷。編碼鋅指蛋白79的多核苷酸可用于檢測鋅指蛋白79的表達與否或在疾病狀態(tài)下鋅指蛋白79的異常表達。如編碼鋅指蛋白79的DNA序列可用于對活檢標本進行雜交以判斷鋅指蛋白79的表達狀況。雜交技術包括Southern印跡法,Northern印跡法、原位雜交等。這些技術方法都是公開的成熟技術,相關的試劑盒都可從商業(yè)途徑得到。本發(fā)明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為“基因芯片”)上,用于分析組織中基因的差異表達分析和基因診斷。用鋅指蛋白79特異的引物進行RNA-聚合酶鏈反應(RT-PCR)體外擴增也可檢測鋅指蛋白79的轉(zhuǎn)錄產(chǎn)物。
檢測鋅指蛋白79基因的突變也可用于診斷鋅指蛋白79相關的疾病。鋅指蛋白79突變的形式包括與正常野生型鋅指蛋白79 DNA序列相比的點突變、易位、缺失、重組和其它任何異常等。可用已有的技術如Southern印跡法、DNA序列分析、PCR和原位雜交檢測突變。另外,突變有可能影響蛋白的表達,因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發(fā)明的序列對染色體鑒定也是有價值的。該序列會特異性地針對某條人染色體具體位置且并可以與其雜交。目前,需要鑒定染色體上的各基因的具體位點?,F(xiàn)在,只有很少的基于實際序列數(shù)據(jù)(重復多態(tài)性)的染色體標記物可用于標記染色體位置。根據(jù)本發(fā)明,為了將這些序列與疾病相關基因相關聯(lián),其重要的第一步就是將這些DNA序列定位于染色體上。
簡而言之,根據(jù)cDNA制備PCR引物(優(yōu)選15-35bp),可以將序列定位于染色體上。然后,將這些引物用于PCR篩選含各條人染色體的體細胞雜合細胞。只有那些含有相應于引物的人基因的雜合細胞會產(chǎn)生擴增的片段。
體細胞雜合細胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發(fā)明的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實現(xiàn)亞定位??捎糜谌旧w定位的其它類似策略包括原位雜交、用標記的流式分選的染色體預篩選和雜交預選,從而構建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進行熒光原位雜交(FISH),可以在一個步驟中精確地進行染色體定位。此技術的綜述,參見Verma等,Human Chromosomesa Manualof Basic Techniques,Pergamon Press,New York(1988)。
一旦序列被定位到準確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數(shù)據(jù)相關聯(lián)。這些數(shù)據(jù)可見于例如,V.Mckusick,Mendelian Inheritancein Man(可通過與Johns Hopkins University Welch Medical Library聯(lián)機獲得)。然后可通過連鎖分析,確定基因與業(yè)已定位到染色體區(qū)域上的疾病之間的關系。
接著,需要測定患病和未患病個體間的cDNA或基因組序列差異。如果在一些或所有的患病個體中觀察到某突變,而該突變在任何正常個體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個體,通常涉及首先尋找染色體中結構的變化,如從染色體水平可見的或用基于cDNA序列的PCR可檢測的缺失或易位。根據(jù)目前的物理作圖和基因定位技術的分辨能力,被精確定位至與疾病有關的染色體區(qū)域的cDNA,可以是50至500個潛在致病基因間之一種(假定1兆堿基作圖分辨能力和每20kb對應于一個基因)。
可以將本發(fā)明的多肽、多核苷酸及其模擬物、激動劑、拮抗劑和抑制劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發(fā)明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發(fā)明的藥用組合物成分。與這些容器一起,可以有由制造、使用或銷售藥品或生物制品的政府管理機構所給出的指示性提示,該提示反映出生產(chǎn)、使用或銷售的政府管理機構許可其在人體上施用。此外,本發(fā)明的多肽可以與其它的治療化合物結合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內(nèi)、腹膜內(nèi)、肌內(nèi)、皮下、鼻內(nèi)或皮內(nèi)的給藥途徑。鋅指蛋白79以有效地治療和/或預防具體的適應癥的量來給藥。施用于患者的鋅指蛋白79的量和劑量范圍將取決于許多因素,如給藥方式、待治療者的健康條件和診斷醫(yī)生的判斷。
下列附圖用于說明本發(fā)明的具體實施方案,而不用于限定由權利要求書所界定的本發(fā)明范圍。
圖1是本發(fā)明鋅指蛋白79和HUB1的氨基酸序列同源性比較圖。上方序列是鋅指蛋白79,下方序列是HUB1。相同氨基酸在兩個序列間用單字符氨基酸表示,相似氨基酸用“+”表示。
圖2為分離的鋅指蛋白79的聚丙烯酰胺凝膠電泳圖(SDS-PAGE)。79kDa為蛋白質(zhì)的分子量。箭頭所指為分離出的蛋白條帶。
下面結合具體實施例,進一步闡述本發(fā)明。應理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(New YorkColdSpring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1鋅指蛋白79的克隆用異硫氰酸胍/酚/氯仿一步法提取人胎腦總RNA。用Quik mRNA Isolation Kit(Qiegene公司產(chǎn)品)從總RNA中分離poly(A)mRNA。2ug poly(A)mRNA經(jīng)逆轉(zhuǎn)錄形成cDNA。用Smart cDNA克隆試劑盒(購自Clontech)將cDNA片段定向插入到pBSK(+)載體(Clontech公司產(chǎn)品)的多克隆位點上,轉(zhuǎn)化DH5α,細菌形成cDNA文庫。用Dyeterminate cycle reaction sequencing kit(Perkin-Elmer公司產(chǎn)品)和ABI 377自動測序儀(Perkin-Elmer公司)測定所有克隆的5'和3'末端的序列。將測定的cDNA序列與已有的公共DNA序列數(shù)據(jù)庫(Genebank)進行比較,結果發(fā)現(xiàn)其中一個克隆0847h09的cDNA序列為新的DNA。通過合成一系列引物對該克隆所含的插入cDNA片段進行雙向測定。結果表明,0847h09克隆所含的全長cDNA為2039bp(如Seq ID NO1所示),從第176bp至1591bp有一個1415bp的開放閱讀框架(ORF),編碼一個新的蛋白質(zhì)(如Seq ID NO2所示)。我們將此克隆命名為pBS-0847h09,編碼的蛋白質(zhì)命名為鋅指蛋白79。
實施例2cDNA克隆的同源檢索將本發(fā)明的鋅指蛋白79的序列及其編碼的蛋白序列,用Blast程序(BasiclocalAlignment search tool)[Altschul,SF et al.J.Mol.Biol.1990;215403-10],在Genbank、Swissport等數(shù)據(jù)庫進行同源檢索。與本發(fā)明的鋅指蛋白79同源性最高的基因是一種已知的HUB1,其編碼的蛋白在Genbank的準入號為D30612。蛋白質(zhì)同源結果示于圖1,兩者高度同源,其相同性為60%;相似性為75%。
實施例3用RT-PCR方法克隆編碼鋅指蛋白79的基因用胎腦細胞總RNA為模板,以oligo-dT為引物進行逆轉(zhuǎn)錄反應合成cDNA,用Qiagene的試劑盒純化后,用下列引物進行PCR擴增Primer15’-GGAGAACTTGGAGAACCTGCTGCG-3’(SEQ ID NO3)Primer25’-TATCAAAGAACTAATAAAAGGCTT-3’(SEQ ID NO4)Primer1為位于SEQ ID NO1的5’端的第1bp開始的正向序列;Primer2為SEQ ID NO1的中的3’端反向序列。
擴增反應的條件在50μl的反應體積中含有50mmol/L KCl,10mmol/LTris-Cl,(pH8.5),1.5mmol/L MgCl2,200μmol/L dNTP,10pmol引物,1U的Taq DNA聚合酶(Clontech公司產(chǎn)品)。在PE9600型DNA熱循環(huán)儀(Perkin-Elmer公司)上按下列條件反應25個周期94℃ 30sec;55℃ 30sec;72℃ 2min。在RT-PCR時同時設β-actin為陽性對照和模板空白為陰性對照。擴增產(chǎn)物用QIAGEN公司的試劑盒純化,用TA克隆試劑盒連接到pCR載體上(Invitrogen公司產(chǎn)品)。DNA序列分析結果表明PCR產(chǎn)物的DNA序列與SEQ ID NO1所示的1-2039bp完全相同。
實施例4Northern印跡法分析鋅指蛋白79基因的表達用一步法提取總RNA[Anal.Biochem 1987,162,156-159]。該法包括酸性硫氰酸胍苯酚-氯仿抽提。即用4M異硫氰酸胍-25mM檸檬酸鈉,0.2M乙酸鈉(pH4.0)對組織進行勻漿,加入1倍體積的苯酚和1/5體積的氯仿-異戊醇(49∶1),混合后離心。吸出水相層,加入異丙醇(0.8體積)并將混合物離心得到RNA沉淀。將得到的RNA沉淀用70%乙醇洗滌,干燥并溶于水中。用20μg RNA,在含20mM 3-(N-嗎啉代)丙磺酸(pH7.0)-5mM乙酸鈉-1mM EDTA-2.2M甲醛的1.2%瓊脂糖凝膠上進行電泳。然后轉(zhuǎn)移至硝酸纖維素膜上。用α-32P dATP通過隨機引物法制備32P-標記的DNA探針。所用的DNA探針為圖1所示的PCR擴增的鋅指蛋白79編碼區(qū)序列(176bp至1591bp)。將32P-標記的探針(約2×106cpm/ml)與轉(zhuǎn)移了RNA的硝酸纖維素膜在一溶液中于42℃雜交過夜,該溶液包含50%甲酰胺-25mM KH2PO4(pH7.4)-5×SSC-5×Denhardt’s溶液和200μg/ml鮭精DNA。雜交之后,將濾膜在1×SSC-0.1%SDS中于55℃洗30min。然后,用Phosphor Imager進行分析和定量。
實施例5重組鋅指蛋白79的體外表達、分離和純化根據(jù)SEQ ID NO1和圖1所示的編碼區(qū)序列,設計出一對特異性擴增引物,序列如下Primer35’-CCCCATATGATGAAGGGCAACTACGAGTCTCTC-3’(Seq ID No5)Primer45’-CCCGAATTCTTACAAAACTCCCCCTCCACTCCC-3’(Seq ID No6)此兩段引物的5’端分別含有NdeI和EcoRI酶切位點,其后分別為目的基因5’端和3’端的編碼序列,NdeI和EcoRI酶切位點相應于表達載體質(zhì)粒pET-28b(+)(Novagen公司產(chǎn)品,Cat.No.69865.3)上的選擇性內(nèi)切酶位點。以含有全長目的基因的pBS-0847h09質(zhì)粒為模板,進行PCR反應。PCR反應條件為總體積50μl中含pBS-0847h09質(zhì)粒10pg、引物Primer-3和Primer-4分別為10pmol、Advantage polymerase Mix(Clontech公司產(chǎn)品)1μl。循環(huán)參數(shù)94℃ 20s,60℃ 30s,68℃ 2min,共25個循環(huán)。用NdeI和EcoRI分別對擴增產(chǎn)物和質(zhì)粒pET-28(+)進行雙酶切,分別回收大片段,并用T4連接酶連接。連接產(chǎn)物轉(zhuǎn)化用氯化鈣法大腸桿細菌DH5α,在含卡那霉素(終濃度30μg/ml)的LB平板培養(yǎng)過夜后,用菌落PCR方法篩選陽性克隆,并進行測序。挑選序列正確的陽性克隆(pET-0847h09)用氯化鈣法將重組質(zhì)粒轉(zhuǎn)化大腸桿菌BL21(DE3)plySs(Novagen公司產(chǎn)品)。在含卡那霉素(終濃度30μg/ml)的LB液體培養(yǎng)基中,宿主菌BL21(pET-0847h09)在37℃培養(yǎng)至對數(shù)生長期,加入IPTG至終濃度1mmol/L,繼續(xù)培養(yǎng)5小時。離心收集菌體,經(jīng)超聲波破菌,離心收集上清,用能與6個組氨酸(6His-Tag)結合的親和層析柱His.Bind Quick Cartridge(Novagen公司產(chǎn)品)進行層析,得到了純化的目的蛋白鋅指蛋白79。經(jīng)SDS-PAGE電泳,在79kDa處得到一單一的條帶(圖2)。將該條帶轉(zhuǎn)移至PVDF膜上用Edams水解法進行N-端氨基酸序列分析,結果N-端15個氨基酸與SEQ ID NO2所示的N-端15個氨基酸殘基完全相同。
實施例6抗鋅指蛋白79抗體的產(chǎn)生用多肽合成儀(PE公司產(chǎn)品)合成下述鋅指蛋白79特異性的多肽NH2-Met-Lys-Gly-Asn-Tyr-Glu-Ser-Leu-Ile-Ser-Met-Asp-Tyr-Ala-Ile-COOH(SEQ ID NO7)。將該多肽分別與血藍蛋白和牛血清白蛋白耦合形成復合,方法參見Avrameas,et al.Immunochemi stry,1969;643。用4mg上述血藍蛋白多肽復合物加上完全弗氏佐劑免疫家兔,15天后再用血藍蛋白多肽復合物加不完全弗氏佐劑加強免疫一次。采用經(jīng)15μg/ml牛血清白蛋白多肽復合物包被的滴定板做ELISA測定兔血清中抗體的滴度。用蛋白A-Sepharose從抗體陽性的家兔血清中分離總IgG。將多肽結合于溴化氰活化的Sepharose4B柱上,用親和層析法從總IgG中分離抗多肽抗體。免疫沉淀法證明純化的抗體可特異性地與鋅指蛋白79結合。
實施例7本發(fā)明的多核苷酸片段用作雜交探針的應用從本發(fā)明的多核苷酸中挑選出合適的寡核苷酸片段用作雜交探針有多方面的用途,如用該探針可與不同來源的正常組織或病理組織的基因組或cDNA文庫雜交以鑒定其是否含有本發(fā)明的多核苷酸序列和檢出同源的多核苷酸序列,進一步還可用該探針檢測本發(fā)明的多核苷酸序列或其同源的多核苷酸序列在正常組織或病理組織細胞中的表達是否異常。
本實施例的目的是從本發(fā)明的多核苷酸SEQ ID NO1中挑選出合適的寡核苷酸片段用作雜交探針,并用濾膜雜交方法鑒定一些組織中是否含有本發(fā)明的多核苷酸序列或其同源的多核苷酸序列。濾膜雜交方法包括斑點印跡法、Southern印跡法、Northern印跡法和復印方法等,它們都是將待測的多核苷酸樣品固定在濾膜上后使用基本相同的步驟雜交。這些相同的步驟是固定了樣品的濾膜首先用不含探針的雜交緩沖液進行預雜交,以使濾膜上樣品的非特異性的結合部位被載體和合成的多聚物所飽和。然后預雜交液被含有標記探針的雜交緩沖液替換,并保溫使探針與靶核酸雜交。雜交步驟之后,未雜交上的探針被一系列洗膜步驟除掉。本實施例利用較高強度的洗膜條件(如較低鹽濃度和較高的溫度),以使雜交背景降低且只保留特異性強的信號。本實施例選用的探針包括兩類第一類探針是完全與本發(fā)明的多核苷酸SEQ ID NO1相同或互補的寡核苷酸片段;第二類探針是部分與本發(fā)明的多核苷酸SEQ ID NO1相同或互補的寡核苷酸片段。本實施例選用斑點印跡法將樣品固定在濾膜上,在較高強度的的洗膜條件下,第一類探針與樣品的雜交特異性最強而得以保留。
一、探針的選用從本發(fā)明的多核苷酸SEQ ID NO1中選擇寡核苷酸片段用作雜交探針,應遵循以下原則和需要考慮的幾個方面1,探針大小優(yōu)選范圍為18-50個核苷酸;2,GC含量為30%-70%,超過則非特異性雜交增加;3,探針內(nèi)部應無互補區(qū)域;4,符合以上條件的可作為初選探針,然后進一步作計算機序列分析,包括將該初選探針分別與其來源序列區(qū)域(即SEQ ID NO1)和其它已知的基因組序列及其互補區(qū)進行同源性比較,若與非靶分子區(qū)域的同源性大于85%或者有超過15個連續(xù)堿基完全相同,則該初選探針一般就不應該使用;5,初選探針是否最終選定為有實際應用價值的探針還應進一步由實驗確定。
完成以上各方面的分析后挑選并合成以下二個探針探針1(probe1),屬于第一類探針,與SEQ ID NO1的基因片段完全同源或互補(41Nt)5'-GGGCAACTACGAGTCTCTCATCTCCATGGATTATGCTATAA-3'{SEQ ID NO8]探針2(probe2),屬于第二類探針,相當于SEQ ID NO1的基因片段或其互補片段的替換突變序列(41Nt)5'-GGGATCGACGAGTCTCTCATATCGATGGATTAGTATCGTAA-3'{SEQ ID NO9]與以下具體實驗步驟有關的其它未列出的常用試劑及其配制方法請參考文獻DNA PROBES G.H.Keller;M.M.Manak;Stockton Press,1989(USA)以及更常用的分子克隆實驗手冊書籍如《分子克隆實驗指南》(1998年第二版)[美]薩姆布魯克等著,科學出版社。
樣品制備1,從新鮮或冰凍組織中提取DNA步驟1)將新鮮或新鮮解凍的正常肝組織放入浸在冰上并盛有磷酸鹽緩沖液(PBS)的平皿中。用剪刀或手術刀將組織切成小塊。操作中應保持組織濕潤。2)以1000g離心切碎組織10分鐘。3)用冷勻漿緩沖液(0.25mol/L蔗糖;25mmol/LTris-HCl,pH7.5;25mmol/LnaCl;25mmol/L MgCl2)懸浮沉淀(大約10ml/g)。4)在4℃用電動勻漿器以全速勻漿組織懸液,直至組織被完全破碎。5)1000g離心10分鐘。6)用重懸細胞沉淀(每0.1g最初組織樣品加1-5ml),再以1000g離心10分鐘。7)用裂解緩沖液重懸沉淀(每0.1g最初組織樣品加1ml),然后接以下的苯酚抽提法。
2,DNA的苯酚抽提法步驟1)用1-10ml冷PBS洗細胞,1000g離心10分鐘。2)用冷細胞裂解液重懸浮沉淀的細胞(1×108細胞/ml)最少應用100ul裂解緩沖液。3)加SDS至終濃度為1%,如果在重懸細胞之前將SDS直接加入到細胞沉淀中,細胞可能會形成大的團塊而難以破碎,并降低的總產(chǎn)率。這一點在抽提>107細胞時特別嚴重。4)加蛋白酶K至終濃度200ug/ml。5)50℃保溫反應1小時或在37℃輕輕振搖過夜。6)用等體積苯酚∶氯仿∶異戊醇(25∶24∶1)抽提,在小離心機管中離心10分鐘。兩相應清楚分離,否則重新進行離心。7)將水相轉(zhuǎn)移至新管。8)用等體積氯仿∶異戊醇(24∶1)抽提,離心10分鐘。9)將含DNA的水相轉(zhuǎn)移至新管。然后進行DNA的純化和乙醇沉淀。
3,DNA的純化和乙醇沉淀步驟1)將1/10體積2mol/L醋酸鈉和2倍體積冷100%乙醇加到DNA溶液中,混勻。在-20℃放置1小時或至過夜。2)離心10分鐘。3)小心吸出或倒出乙醇。4)用70%冷乙醇500ul洗滌沉淀,離心5分鐘。5)小心吸出或倒出乙醇。用500ul冷乙醇洗滌沉淀,離心5分鐘。6)小心吸出或倒出乙醇,然后在吸水紙上倒置使殘余乙醇流盡。空氣干燥10-15分鐘,以使表面乙醇揮發(fā)。注意不要使沉淀完全干燥,否則較難重新溶解。7)以小體積TE或水重懸DNA沉淀。低速渦旋振蕩或用滴管吹吸,同時逐漸增加TE,混合至DNA充分溶解,每1-5×106細胞所提取的大約加1ul。
以下第8-13步驟僅用于必須除去污染時,否則可直接進行第14步驟。
8)將RNA酶A加到DNA溶液中,終濃度為100ug/ml,37℃保溫30分鐘。9)加入SDS和蛋白酶K,終濃度分別為0.5%和100ug/ml。37℃保溫30分鐘。10)用等體積的苯酚∶氯仿∶異戊醇(25∶24∶1)抽提反應液,離心10分鐘。11)小心移出水相,用等體積的氯仿∶異戊醇(24∶1)重新抽提,離心10分鐘。12)小心移出水相,加1/10體積2mol/L醋酸鈉和2.5體積冷乙醇,混勻置-20℃ 1小時。13)用70%乙醇及100%乙醇洗滌沉淀,空氣干燥,重懸核酸,過程同第3-6步驟。14)測定A260和A280以檢測DNA的純度及產(chǎn)率。15)分裝后存放于-20℃。
樣膜的制備1)取4×2張適當大小的硝酸纖維素膜(NC膜),用鉛筆在其上輕輕標出點樣位置及樣號,每一探針需兩張NC膜,以便在后面的實驗步驟中分別用高強度條件和強度條件洗膜。
2)吸取及對照各15微升,點于樣膜上,在室溫中晾干。
3)置于浸潤有0.1mol/L NaOH,1.5mol/L NaCl的濾紙上5分鐘(兩次),晾干置于浸潤有0.5mol/L Tris-HCl(pH7.0),3mol/L NaCl的濾紙上5分鐘(兩次),晾干。
4)夾于干凈濾紙中,以鋁箔包好,60-80℃真空干燥2小時。
探針的標記1)3μl Probe(0.1OD/10μl),加入2μl Kinase緩沖液,8-10uCiγ-32P-dATP+2UKinase,以補加至終體積20μl。
2)37℃保溫2小時。
3)加1/5體積的溴酚藍指示劑(BPB)。
4)過Sephadex G-50柱。
5)至有32P-Probe洗出前開始收集第一峰(可用Monitor監(jiān)測)。
6)5滴/管,收集10-15管。
7)用液體閃爍儀監(jiān)測同位素量8)合并第一峰的收集液后即為所需制備的32P-Probe(第二峰為游離γ-32P-dATP)。
預雜交將樣膜置于塑料袋中,加入3-10mg預雜交液(10×Denhardt’s;6×SSC,0.1mg/ml CT DNA(小牛胸腺DNA)。),封好袋口后,68℃水浴搖2小時。
雜交將塑料袋剪去一角,加入制備好的探針,封好袋口后,42℃水浴搖過夜。
洗膜高強度洗膜1)取出已雜交好的樣膜。
2)2×SSC,0.1%SDS中,40℃洗15分鐘(2次)。
3)0.1×SSC,0.1%SDS中,40℃洗15分鐘(2次)。
4)0.1×SSC,0.1%SDS中,55℃洗30分鐘(2次),室溫晾干。
低強度洗膜1)取出已雜交好的樣膜。
2)2×SSC,0.1%SDS中,37℃洗15分鐘(2次)。
3)0.1×SSC,0.1%SDS中,37℃洗15分鐘(2次)。
4)0.1×SSC,0.1%SDS中,40℃洗15分鐘(2次),室溫晾干。
X-光自顯影-70℃,X-光自顯影(壓片時間根據(jù)雜交斑放射性強弱而定)。
實驗結果采用低強度洗膜條件所進行的雜交實驗,以上四個探針雜交斑放射性強弱沒有明顯區(qū)別;而采用低強度洗膜條件所進行的雜交實驗,探針1的雜交斑放射性強度明顯強于其它三個探針雜交斑的放射性強度。因而可用探針1定性和定量地分析本發(fā)明的多核苷酸在不同組織中的存在和差異表達。
實施例8 DNA Microarray基因芯片或基因微矩陣(DNA Microarray)是目前許多國家實驗室和大制藥公司都在著手研制和開發(fā)的新技術,它是指將大量的靶基因片段有序地、高密度地排列在玻璃、硅等載體上,然后用熒光檢測和計算機軟件進行數(shù)據(jù)的比較和分析,以達到快速、高效、高通量地分析生物信息的目的。本發(fā)明的多核苷酸可作為靶DNA用于基因芯片技術用于高通量研究新基因功能;尋找和篩選組織特異性新基因特別是腫瘤等疾病相關新基因;疾病的診斷,如遺傳性疾病。其具體方法步驟在文獻中已有多種報道,如可參閱文獻DeRisi,J.L.,Lyer,V.&Brown,P.O.
(1997)Science278,680-686.及文獻Helle,R.A.,Schema,M.,Chai,A.,Shalom,D.,(1997)PNAS 942150-2155.
(一)點樣各種不同的全長cDNA共計4000條多核苷酸序列作為靶DNA,其中包括本發(fā)明的多核苷酸。將它們分別通過(如實施例_所敘述的方法)PCR進行擴增,純化所得擴增產(chǎn)物后將其濃度調(diào)到500ng/ul左右,用Cartesian 7500點樣儀(購自美國Cartesian公司)點于玻璃介質(zhì)上,點與點之間的距離為280μm。將點樣后的玻片進行水合、干燥、置于紫外交聯(lián)儀中交聯(lián),洗脫后干燥使DNA固定在玻璃片上制備成芯片。其具體方法步驟在文獻中已有多種報道,其具體方法步驟在文獻中已有多種報道,本實施例的點樣后處理步驟是1.潮濕環(huán)境中水合4小時;2.0.2%SDS洗滌1分鐘;3.ddH2O洗滌兩次,每次1分鐘;4.NaBH4封閉5分鐘;5.95℃水中2分鐘;6.0.2%SDS洗滌1分鐘;7.ddH2O沖洗兩次;8.涼干,25℃儲存于暗處備用。
(二)探針標記用一步法分別從(根據(jù)功能定位,選兩種不同的組織正常腦與腦膠質(zhì)瘤;正常喉與喉癌;正常肝與肝癌;正常肺與肺癌;胎肝與成人肝)中抽提總mRNA,并用Oligotex mRNA Midi Kit(購自QiaGen公司)純化mRNA,通過反轉(zhuǎn)錄分別將熒光試劑Cy3dUTP(5-Amino-propargyl-2’-deoxyuridine 5’-t riphate coupled to Cy3fluorescent dye,購自Amersham Phamacia Biotech公司)標記正常_組織的mRNA,用熒光試劑Cy5dUTP(5-Amino-propargyl-2’-deoxyuridine 5’-triphate coupled toCy5 fluorescent dye,購自Amersham Phamacia Biotech公司)標記(異常)_組織mRNA,經(jīng)純化后制備出探針。具體步驟參照及方法Schena,M.,Shalon,D.,Heller,R.(1996)Proc.Natl.Acad.Sci.USA.Vol.9310614-10619.Schena,M.,Shalon,Dari.,Davis,R.W.(1995)Science.270.(20)467-480.
(三)雜交分別將來自以上兩種組織的探針與芯片一起在UniHybTMHybridizationSolution(購自TeleChem公司)雜交液中進行雜交16小時,室溫用洗滌液(1×SSC,0.2%SDS)洗滌后用ScanArray 3000掃描儀(購自美國General Scanning公司)進行掃描,掃描的圖象用Imagene軟件(美國Biodiscovery公司)進行數(shù)據(jù)分析處理,算出每個點的Cy3/Cy5比值,該比值小于0.5大于2的點被認為是表達有差異的基因。
實驗結果表明,Cy3 signal=_(取四次實驗的平均值),Cy5signal=_(取四次實驗的平均值),Cy3/Cy5=_,本發(fā)明的多核苷酸在以上兩種組織中的表達(有或無)明顯差異,表明本發(fā)明的多核苷酸(相應功能定位)。
序列表(1)一般信息(ⅱ)發(fā)明名稱鋅指蛋白79及其編碼序列(ⅲ)序列數(shù)目9(2)SEQ ID NO1的信息(ⅰ)序列特征(A)長度2039bp(B)類型核酸(C)鏈性雙鏈(D)拓撲結構線性(ⅱ)分子類型cDNA(ⅹⅰ)序列描述SEQ ID NO11 GGAGAACTTGGAGAACCTGCTGCGCAACAGGAACTTCTGGATCCTGCGGCTCCCTCCAGG61 TATTAAGGGAGATATCCCAAAGGTGCCTGTGGCATTTGATGATGTCTCCATCTACTTTTC121 CACTCCAGAGTGGGAAAAATTAGAAGAATGGCAAAAGGAACTTTACAAGAATATCATGAA181 GGGCAACTACGAGTCTCTCATCTCCATGGATTATGCTATAAATCAACCTGATGTCTTATC241 TCAGATTCAACCAGAAGGGGAACATAATACAGAGGACCAGGCAGGGCCAGAGGAAAGTGA301 GATTCCCACAGACCCCAGTGAAGAGCCTGGTATTTCAACATCAGATATTCTGTCTTGGAT361 TAAACAAGAAGAAGAGCCTCAGGTTGGGGCCCCACCGGAGTCCAAGGAGAGTGACGTGTA421 CAAAAGCACTTATGCTGATGAAGAGCTTGTCATCAAAGCTGAAGGCCTTGCTAGATCCTC481 GTTGTGCCCTGAGGTTCCAGTCCCTTTCTCTTCTCCACCAGCAGCAGCAAAGGATGCTTT541 TTCAGATGTGGCTTTCAAAAGCCAGCAGTCTACATCCATGACACCTTTTGGACGTCCAGC601 CACTGACCTGCCTGAAGCCTCTGAGGGACAAGTGACTTTTACTCAGTTGGGTAGCTATCC661 CCTCCCACCTCCAGTTGGCGAGCAGGTGTTCTCATGCCACCACTGTGGCAAGAATCTCAG721 CCAAGACATGTTGCTGACCCACCAATGTAGCCATGCTACTGAGCACCCCTTACCCTGTGC781 CCAGTGCCCTAAGCACTTTACTCCACAGGCGGACCTCAGCAGCACCTCCCAGGACCATGC841 CAGCGAGACACCCCCCACCTGCCCACACTGTGCCAGGACTTTTACTCACCCATCAAGACT901 TACCTACCATCTTCGGGTCCATAACAGCACTGAGCGTCCTTTCCCCTGTCCTGATTGCCC961 CAAGCGCTTTGCTGACCAGGCTCGACTCACCAGCCACCGGAGAGCTCATGCAAGCGAAAG1021 GCCCTTCCGCTGTGCCCAGTGCGGCAGGAGCTTCAGCTTGAAAATCAGCCTCCTGCTCCA1081 CCAGCGGGGTCATGCACAAGAGCGCCCTTTCTCCTGCCCTCAGTGTGGCATTGACTTCAA1141 CGGCCACTCGGCCCTGATCCGCCACCAGATGATCCACACAGGCGAGCGTCCTTACCCCTG1201 CACTGACTGCAGTAAGAGCTTCATGCGCAAGGAGCACCTGCTGAACCACCGGCGGCTGCA1261 CACAGGCGAGCGGCCCTTCAGTTGTCCTCACTGTGGCAAGAGCTTCATCCGCAAGCACCA1321 CCTAATGAAACACCAGCGCATCCACACCGGGGAGCGGCCCTACCCCTGCTCCTACTGTGG1381 CAGGAGCTTCCGCTACAAACAGACACTCAAGGACCACCTCCGTTCAGGCCACAATGGAGG1441 CTGTGGGGGTGATAGTGACCCATCAGGTCAGCCACCCAACCCACCAGGTCCCCTCATAAC1501 TGGGCTTGAAACTTCTGGCCTGGGTGTCAACACTGAAGGTCTAGAGACCAACCAGTGGTA1561 TGGGGAAGGGAGTGGAGGGGGAGTTTTGTAAATCCAAATCTCTGTGGCTTCATGCTTGTA1621 TATGCTCACAGCAGGGCACAAAATCCAAGAGAAGGTCTGTGAGCCCCTTCCAACACCCAC1681 AGTAATTATTATCTGGCACATCAATGAATTTGGGGTCCTATACACTTGAGACATGCTTGT1741 GTTTTGGAATTTCACACCCTTACAAGAATACCACATTTTGAAACCCAGAAAGACCTGGAA1801 AGGAGCCCAGCATGTCCATCTTTTCAAAGATACAACAAAAGCAGAAGTTACAAGAATATT1861 GCGGAGAGGTTGGAAAGCAGGATTTAACCTCTAGTTCTCTTGTTCTCAGAGAACAGCAGG1921 TTGATAGTAGATTATGTCTCTAGGTAGAGACAGATACATGAGAAGAGCCTCCAAAACTGG1981 AAGCCCATCATAAGGCATGAGAATGTTTAACTATAAAGCCTTTTATTAGTTCTTTGATA(3)SEQ ID NO2的信息(ⅰ)序列特征(A)長度471個氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型多肽(ⅹⅰ)序列描述SEQ ID NO21 Met Lys Gly Asn Tyr Glu Ser Leu Ile Ser Met Asp Tyr Ala Ile16 Asn Gln Pro Asp Val Leu Ser Gln Ile Gln Pro Glu Gly Glu His31 Asn Thr Glu Asp Gln Ala Gly Pro Glu Glu Ser Glu Ile Pro Thr46 Asp Pro Ser Glu Glu Pro Gly Ile Ser Thr Ser Asp Ile Leu Ser61 Trp Ile Lys Gln Glu Glu Glu Pro Gln Val Gly Ala Pro Pro Glu76 Ser Lys Glu Ser Asp Val Tyr Lys Ser Thr Tyr Ala Asp Glu Glu91 Leu Val Ile Lys Ala Glu Gly Leu Ala Arg Ser Ser Leu Cys Pro106 Glu Val Pro Val Pro Phe Ser Ser Pro Pro Ala Ala Ala Lys Asp121 Ala Phe Ser Asp Val Ala Phe Lys Ser Gln Gln Ser Thr Ser Met136 Thr Pro Phe Gly Arg Pro Ala Thr Asp Leu Pro Glu Ala Ser Glu151 Gly Gln Val Thr Phe Thr Gln Leu Gly Ser Tyr Pro Leu Pro Pro166 Pro Val Gly Glu Gln Val Phe Ser Cys His His Cys Gly Lys Asn181 Leu Ser Gln Asp Met Leu Leu Thr His Gln Cys Ser His Ala Thr196 Glu His Pro Leu Pro Cys Ala Gln Cys Pro Lys His Phe Thr Pro211 Gln Ala Asp Leu Ser Ser Thr Ser Gln Asp His Ala Ser Glu Thr226 Pro Pro Thr Cys Pro His Cys Ala Arg Thr Phe Thr His Pro Ser241 Arg Leu Thr Tyr His Leu Arg Val His Asn Ser Thr Glu Arg Pro256 Phe Pro Cys Pro Asp Cys Pro Lys Arg Phe Ala Asp Gln Ala Arg271 Leu Thr Ser His Arg Arg Ala His Ala Ser Glu Arg Pro Phe Arg286 Cys Ala Gln Cys Gly Arg Ser Phe Ser Leu Lys Ile Ser Leu Leu301 Leu His Gln Arg Gly His Ala Gln Glu Arg Pro Phe Ser Cys Pro316 Gln Cys Gly Ile Asp Phe Asn Gly His Ser Ala Leu Ile Arg His331 Gln Met Ile His Thr Gly Glu Arg Pro Tyr Pro Cys Thr Asp Cys346 Ser Lys Ser Phe Met Arg Lys Glu His Leu Leu Asn His Arg Arg361 Leu His Thr Gly Glu Arg Pro Phe Ser Cys Pro His Cys Gly Lys376 Ser Phe Ile Arg Lys His His Leu Met Lys His Gln Arg Ile His391 Thr Gly Glu Arg Pro Tyr Pro Cys Ser Tyr Cys Gly Arg Ser Phe406 Arg Tyr Lys Gln Thr Leu Lys Asp His Leu Arg Ser Gly His Asn421 Gly Gly Cys Gly Gly Asp Ser Asp Pro Ser Gly Gln Pro Pro Asn436 Pro Pro Gly Pro Leu Ile Thr Gly Leu Glu Thr Ser Gly Leu Gly451 Val Asn Thr Glu Gly Leu Glu Thr Asn Gln Trp Tyr Gly Glu Gly466 Ser Gly Gly Gly Val Leu(4)SEQ ID NO3的信息(ⅰ)序列特征(A)長度24堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性
(ⅱ)分子類型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO3GGAGAACTTGGAGAACCTGCTGCG24(5)SEQ ID NO4的信息(ⅰ)序列特征(A)長度24堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO4TATCAAAGAACTAATAAAAGGCTT 24(6)SEQ ID NO5的信息(ⅰ)序列特征(A)長度32堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO5CAGCCATGGCGGGGAAGAAGAATGTTCTGTCG 32(7)SEQ ID NO6的信息(ⅰ)序列特征(A)長度29堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO6CCCGGATCCCGCTGCTTGGCCTTCTTCAC 29(8)SEQ ID NO7的信息(ⅰ)序列特征(A)長度15個氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型多肽(ⅹⅰ)序列描述SEQ ID NO7Met-Ala-Gly-Lys-Lys-Asn-Val-Leu-Ser-Ser-Leu-Ala-Val-Tyr-Ala 15(9)SEQ ID NO8的信息(ⅰ)序列特征(A)長度41堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO4GGGCAACTACGAGTCTCTCATCTCCATGGATTATGCTATAA 41(10)SEQ ID NO9的信息(ⅰ)序列特征(A)長度41堿基(B)類型核酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅹⅰ)序列描述SEQ ID NO9GGGATCGACGAGTCTCTCATATCGATGGATTAGTATCGTAA 4權利要求
1.一種分離的多肽-鋅指蛋白79,其特征在于它包含有SEQ ID NO2所示的氨基酸序列的多肽、或其多肽的活性片段、類似物或衍生物。
2.如權利要求1所述的多肽,其特征在于所述多肽、類似物或衍生物的氨基酸序列具有與SEQ ID NO2所示的氨基酸序列至少95%的相同性。
3.如權利要求2所述的多肽,其特征在于它包含具有SEQ ID NO2所示的氨基酸序列的多肽。
4.一種分離的多核苷酸,其特征在于所述多核苷酸包含選自下組中的一種(a)編碼具有SEQ ID NO2所示氨基酸序列的多肽或其片段、類似物、衍生物的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸;或(c)與(a)或(b)有至少70%相同性的多核苷酸。
5.如權利要求4所述的多核苷酸,其特征在于所述多核苷酸包含編碼具有SEQ ID NO2所示氨基酸序列的多核苷酸。
6.如權利要求4所述的多核苷酸,其特征在于所述多核苷酸的序列包含有SEQ ID NO1中176-1591位的序列或SEQ ID NO1中1-2039位的序列。
7.一種含有外源多核苷酸的重組載體,其特征在于它是由權利要求4-6中的任一權利要求所述多核苷酸與質(zhì)粒、病毒或運載體表達載體構建而成的重組載體。
8.一種含有外源多核苷酸的遺傳工程化宿主細胞,其特征在于它是選自于下列一種宿主細胞(a)用權利要求7所述的重組載體轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞;或(b)用權利要求4-6中的任一權利要求所述多核苷酸轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞。
9.一種具有鋅指蛋白79活性的多肽的制備方法,其特征在于所述方法包括(a)在表達鋅指蛋白79條件下,培養(yǎng)權利要求8所述的工程化宿主細胞;(b)從培養(yǎng)物中分離出具有鋅指蛋白79活性的多肽。
10.一種能與多肽結合的抗體,其特征在于所述抗體是能與鋅指蛋白79特異性結合的抗體。
11.一類模擬或調(diào)節(jié)多肽活性或表達的化合物,其特征在于它們是模擬、促進、拮抗或抑制鋅指蛋白79的活性的化合物。
12.如權利要求11所述的化合物,其特征在于它是SEQ ID NO1所示的多核苷酸序列或其片段的反義序列。
13.一種權利要求11所述化合物的應用,其特征在于所述化合物用于調(diào)節(jié)鋅指蛋白79在體內(nèi)、體外活性的方法。
14.一種檢測與權利要求1-3中的任一權利要求所述多肽相關的疾病或疾病易感性的方法,其特征在于其包括檢測所述多肽的表達量,或者檢測所述多肽的活性,或者檢測多核苷酸中引起所述多肽表達量或活性異常的核苷酸變異。
15.如權利要求1-3中的任一權利要求所述多肽的應用,其特征在于它應用于篩選鋅指蛋白79的模擬物、激動劑,拮抗劑或抑制劑;或者用于肽指紋圖譜鑒定。
16.如權利要求4-6中的任一權利要求所述的核酸分子的應用,其特征在于它作為引物用于核酸擴增反應,或者作為探針用于雜交反應,或者用于制造基因芯片或微陣列。
17.如權利要求1-6及11中的任一權利要求所述的多肽、多核苷酸或化合物的應用,其特征在于用所述多肽、多核苷酸或其模擬物、激動劑、拮抗劑或抑制劑以安全有效劑量與藥學上可接受的載體組成作為診斷或治療與鋅指蛋白79異常相關的疾病的藥物組合物。
18.權利要求1-6及11中的任一權利要求所述的多肽、多核苷酸或化合物的應用,其特征在于用所述多肽、多核苷酸或化合物制備用于治療如惡性腫瘤,血液病,HIV感染和免疫性疾病和各類炎癥的藥物。
全文摘要
本發(fā)明公開了一種新的多肽——鋅指蛋白79,編碼此多肽的多核苷酸和經(jīng)DNA重組技術產(chǎn)生這種多肽的方法。本發(fā)明還公開了此多肽用于治療多種疾病的方法,如惡性腫瘤,血液病,HIV感染和免疫性疾病和各類炎癥等。本發(fā)明還公開了抗此多肽的拮抗劑及其治療作用。本發(fā)明還公開了編碼這種新的鋅指蛋白79的多核苷酸的用途。
文檔編號C07K14/435GK1296962SQ9912405
公開日2001年5月30日 申請日期1999年11月22日 優(yōu)先權日1999年11月22日
發(fā)明者毛裕民, 謝毅 申請人:上海博容基因開發(fā)有限公司