專利名稱:一種新的人核糖體亞基蛋白及其編碼序列的制作方法
技術領域:
本發(fā)明涉及分子生物學、酶學、病理學以及基因工程等領域。具體地,本發(fā)明涉及一種在人類骨髓中表達的h50sRPL1蛋白及其核酸序列。本發(fā)明還涉及該蛋白和核酸序列的制備方法和用途。
核糖體是生物合成蛋白質的場所,由大小兩個亞基組成。真核生物的核糖體亞基分別為60s與40s(s為高速離心時大分子物質的沉降系數(shù)單位,在一定程度上反映大分子的分子量和形狀,常用來表示大分子物質的大小);而原核生物的分別為50s與30s。核糖體亞基由幾種rRNA以及若干種核糖體亞基蛋白(ribosomal subunitprotein,RP)組成,各種核糖體亞基蛋白在蛋白質生物合成的過程中起著各自的作用。
本發(fā)明中,我們在人類骨髓中克隆到Thermus thermophilus 50sRPL1基因的同源基因h50sRPL1。
在本發(fā)明被公布之前,尚未有任何公開或報道過本專利申請中提及的人類h50sRPL1蛋白序列及其核酸序列。
本發(fā)明的第一目的就是提供一種新的人基因h50sRPL1(Genbank AccessionNo.AF212225),該基因是一個人h50sRPL1蛋白基因。
本發(fā)明的第二目的是提供一種新的人蛋白h50sRPL1。
本發(fā)明的第三目的是提供一種利用重組技術生產上述的新的人h50sRPL1蛋白和核酸序列的方法。
本發(fā)明還提供了這種人h50sRPL1蛋白多肽和編碼序列的應用。
在本發(fā)明的一個方面,提供了一種分離出的DNA分子,該分子包括編碼具有人h50sRPL1蛋白質活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.6中從核苷酸第100-1014位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.6中從核苷酸第100-1014位的核苷酸序列雜交。較佳地,所述的序列編碼具有SEQ ID NO.7所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.6中從核苷酸第100-1014位的核苷酸序列。
在本發(fā)明的另一方面,提供了一種分離出的人h50sRPL1蛋白質多肽,它包括具有SEQ ID NO.7氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQ ID NO.7序列的多肽。
在本發(fā)明的另一方面,還提供了一種載體,它包含上述的DNA分子。
在本發(fā)明的另一方面,還提供了一種用上述載體轉化的宿主細胞。在一個實例中該宿主細胞是大腸桿菌;在另一實例中,該宿主細胞是真核細胞。
在本發(fā)明的另一方面,還提供了一種產生具有人h50sRPL1蛋白質活性的多肽的方法,其步驟如下(1)將編碼具有人h50sRPL1蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成人h50sRPL1蛋白表達載體,所述的核苷酸序列與SEQ ID NO.6中從核苷酸第100-1014位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達載體轉入宿主細胞,形成人h50sRPL1蛋白的重組細胞;(3)在適合表達人h50sRPL1蛋白多肽的條件下,培養(yǎng)步驟(2)中的重組細胞;(4)分離出具有人h50sRPL1蛋白活性的多肽。
較佳地,在該方法中使用的核酸序列具有SEQ ID NO.6中第100-1014位的序列。
本發(fā)明還提供了與h50sRPL1蛋白多肽特異性結合的抗體。
在本發(fā)明中,“分離的”、“純化的”或“基本純的”DNA是指,該DNA或片段已從天然狀態(tài)下位于其兩側的序列中分離出來,還指該DNA或片段已經與天然狀態(tài)下伴隨核酸的組份分開,而且已經與在細胞中伴隨其的蛋白質分開。
在本發(fā)明中,術語“人h50sRPL1蛋白(或多肽)編碼序列”指編碼具有人h50sRPL1蛋白活性的多肽的核苷酸序列,如SEQ ID NO.6中第100-1014位核苷酸序列及其簡并序列。該簡并序列是指,位于SEQ ID NO.6序列的編碼框第100-1014位核苷酸中,有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產生的序列。由于密碼子的簡并性,所以與SEQ ID NO.6中第100-1014位核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.7所述的序列。該術語還包括能在中度嚴緊條件下,更佳的在高度嚴緊條件下與SEQ ID NO.6中從核苷酸第100-1014位的核苷酸序列雜交的核苷酸序列。該術語還包括與SEQ ID NO.6中從核苷酸第100-1014位的核苷酸序列的同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
該術語還包括能編碼具有與天然的人h50sRPL1相同功能的蛋白的、SEQ ID NO.6中開放閱讀框序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-90個,較佳地1-60個,更佳地1-20個,最佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數(shù)個(通常為60個以內,較佳地為30個以內,更佳地為10個以內,最佳地為5個以內)核苷酸。
在本發(fā)明中,“基本純的”蛋白質或多肽是指其至少占樣品總物質的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進行測量,如用柱層析、PAGE或HPLC法測量多肽的純度?;炯兊亩嚯幕旧喜缓烊粻顟B(tài)下的伴隨其的組分。
在本發(fā)明中,術語“人h50sRPL1蛋白或多肽”指具有人h50sRPL1蛋白活性的SEQ ID NO.7序列的多肽。該術語還包括具有與天然人h50sRPL1相同功能的、SEQ IDNO.7序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數(shù)個(通常為20個以內,較佳地為10個以內,更佳地為5個以內)氨基酸。例如,在本領域中,用性能相近或相似的氨基酸進行取代時,通常不會改變蛋白質的功能。又比如,在C末端和/或N末端添加一個或數(shù)個氨基酸通常也不會改變蛋白質的功能。該術語還包括人h50sRPL1蛋白的活性片段和活性衍生物。
本發(fā)明的人h50sRPL1多肽的變異形式包括同源序列、保守性變異體、等位變異體、天然突變體、誘導突變體、在高或低的嚴緊條件下能與人h50sRPL1 DNA雜交的DNA所編碼的蛋白、以及利用抗人h50sRPL1多肽的抗血清獲得的多肽或蛋白。本發(fā)明還提供了其他多肽,如包含人h50sRPL1多肽或其片段的融合蛋白。除了幾乎全長的多肽外,本發(fā)明還包括人h50sRPL1多肽的可溶性片段。通常,該片段具有人h50sRPL1多肽序列的至少約10個連續(xù)氨基酸,通常至少約30個連續(xù)氨基酸,較佳地至少約50個連續(xù)氨基酸,更佳地至少約80個連續(xù)氨基酸,最佳地至少約100個連續(xù)氨基酸。
在本發(fā)明中,“人h50sRPL1保守性變異多肽”指與SEQ ID NO.7的氨基酸序列相比,有至多10個,較佳地至多8個,更佳地至多5個氨基酸被性質相似或相近的氨基酸所替換而形成多肽。這些保守性變異多肽最好根據(jù)表1進行替換而產生。表1<
發(fā)明還包括人h50sRPL1蛋白或多肽的類似物。這些類似物與天然人h50sRPL1多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導的遺傳變異體。誘導變異體可以通過各種技術得到,如通過輻射或暴露于誘變劑而產生隨機誘變,還可通過定點誘變法或其他已知分子生物學的技術。類似物還包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的類似物。應理解,本發(fā)明的多肽并不限于上述例舉的代表性的多肽。
修飾(通常不改變一級結構)形式包括體內或體外的多肽的化學衍生形式如乙?;螋然?。修飾還包括糖基化,如那些在多肽的合成和加工中或進一步加工步驟中進行糖基化修飾而產生的多肽。這種修飾可以通過將多肽暴露于進行糖基化的酶(如哺乳動物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優(yōu)化了溶解性能的多肽。
在本發(fā)明中,可選用本領域已知的各種載體,如市售的載體,包括質粒,粘粒等。在生產本發(fā)明的人h50sRPL1多肽時,可以將人h50sRPL1編碼序列可操作地連于表達調控序列,從而形成人h50sRPL1蛋白表達載體。
如本文所用,“可操作地連于”指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號肽DNA作為前體表達并參與多肽的分泌,那么信號肽(分泌前導序列)DNA就是可操作地連于多肽DNA;如果啟動子控制序列的轉錄,那么它是可操作地連于編碼序列;如果核糖體結合位點被置于能使其翻譯的位置時,那么它是可操作地連于編碼序列。一般,“可操作地連于”意味著相鄰,而對于分泌前導序列則意味著在閱讀框中相鄰。
在本發(fā)明中,術語“宿主細胞”包括原核細胞和真核細胞。常用的原核宿主細胞的例子包括大腸桿菌、枯草桿菌等。常用的真核宿主細胞包括酵母細胞、昆蟲細胞和哺乳動物細胞。較佳地,該宿主細胞是真核細胞,如CHO細胞、COS細胞等。
本發(fā)明還提供了對人h50sRPL1特異性結合的抗體,包括多克隆抗體和單克隆抗體。
在本發(fā)明中,可以使用一系列本領域已知的方法來制備針對人h50sRPL1特異的抗體。例如,將提純的人h50sRPL1基因產物或它的抗原片段注射入動物體內以產生多克隆抗體。同樣,表達人h50sRPL1或它的抗原片段的細胞也可以用來對動物致免疫而產生抗體。根據(jù)本發(fā)明制備的抗體也可以是單克隆抗體,這些單克隆抗體可以用雜交瘤技術制備(例如,Kohler et al.,Nature 256495,1975;Kohler et al.,Eur.J.Immunol.6511,1976;Kohler et al.,Eur.J.Immunol.6292,1976)。本發(fā)明的抗體包括可以阻抑人h50sRPL1功能的抗體,也可以是不影響人h50sRPL1功能的抗體。每一類抗體都可以通過對人h50sRPL1基因產物的片段或功能域致免疫而產生,而人h50sRPL1基因產物及其片段可以用重組方法產生或用多肽合成儀進行合成。與非修飾形式的人h50sRPL1基因產物結合的抗體,可以通過用在原核細胞例如E.coli中產生的基因產物來免疫動物而得到。與翻譯后修飾形式如糖基化或磷酸化蛋白或多肽結合的抗體,可以通過用在真核細胞如酵母或昆蟲細胞中產生的基因產物的來免疫動物而得到。
本發(fā)明的人h50sRPL1抗體可以用來鑒定表達人h50sRPL1蛋白或多肽的細胞,如Jurkat T細胞。例如,可以用一種可檢測的分子例如熒光素異硫氰酸(FITC)來標記人h50sRPL1特異抗體,然后讓人h50sRPL1特異抗體與細胞樣品接觸,再用熒光顯微鏡或流式細胞儀檢測出與人h50sRPL1特異抗體結合的細胞。
除了在細胞表面檢測人h50sRPL1外,還可以用Western印跡技術分析該蛋白質。細胞裂解液可以從培養(yǎng)細胞或取自病人的組織標本如骨髓中提取,并溶解在含有去污劑的裂解緩沖液中。然后用SDS聚丙烯酰胺凝膠電泳分離細胞提取物(同時將提純的人h50sRPL1多肽作為陽性對照),接著通過電泳雜交將其轉移到硝酸纖維素上。為了用Western印跡免疫探測人h50sRPL1多肽,可以使用典型的抗體結合檢測方法,例如放射自顯影或堿性磷酸酶檢測方法。并可使用免疫接種血清或不相關的單克隆抗體作為非特異反應的對照。
還可用Nothern印跡法技術分析人h50sRPL1基因產物的表達,即分析人h50sRPL1的RNA轉錄物在細胞中的存在與否和數(shù)量。
人h50sRPL1 DNA的Nothern印跡分析和人h50sRPL1特異抗體的Western印跡分析可以聯(lián)合使用,以證實人h50sRPL1在生物樣本中的表達。人h50sRPL1 DNA還可以用于Southern印跡分析或原位雜交分析,以將該基因定位于染色體上,并可進行遺傳連鎖分析以找出其它可能的疾病相關基因。
此外,本發(fā)明還提供了一種可用作探針的核酸分子,該分子通常具有人h50sRPL1核苷酸編碼序列的8-100個連續(xù)核苷酸,較佳地具有15-50個連續(xù)核苷酸。該探針可用于檢測樣品中是否存在編碼人h50sRPL1的核酸分子。
本發(fā)明還提供了檢測樣品中是否存在人h50sRPL1核苷酸序列的方法,它包括用上述的探針與樣品進行雜交,然后檢測探針是否發(fā)生了結合。較佳地,該樣品是PCR擴增后的產物,其中PCR擴增引物對應于人h50sRPL1核苷酸編碼序列,并可位于該編碼序列的兩側或中間。引物長度一般為15-50個核苷酸。
此外,根據(jù)本發(fā)明的人h50sRPL1核苷酸序列和氨基酸序列,可以在核酸同源性或表達蛋白質的同源性基礎上,篩選人h50sRPL1同源基因或同源蛋白。
為了得到與人h50sRPL1基因相關的人cDNAs或基因組DNAs的點陣,可以用DNA探針篩選人cDNA或基因組DNA文庫,這些探針是在低嚴緊條件下,用32P對人h50sRPL1的全部或部分做放射活性標記而得的。最適合于篩選的cDNA文庫是來自人骨髓的文庫。來自參與內分泌的其它人體組織或特定人體細胞株的cDNA文庫也可用于篩選目的。構建來自感興趣的細胞或者組織的cDNA文庫的方法是分子生物學領域眾所周知的。另外,許多這樣的cDNA文庫也可以購買到,例如購自Clontech,Palo Alto,Cal.。這種篩選方法可以識別與人h50sRPL1相關的基因家族的核苷酸序列。
根據(jù)核苷酸相似性篩選人h50sRPL1同源物可以按如下方法完成。人體骨髓cDNA文庫,例如Clontech Cat.#74XX(Clontech,Palo Alto,Cal.)可以使用一段包含人h50sRPL1基因序列的全部或部分的隨機引物化DNA探針篩選。要完成對與人h50sRPL1序列至少有70%同源性的DNA插入序列的克隆的鑒定,可以使用雜交溫度為55℃的雜交液,然后用0.5×SSC和0.1%SDS清洗。用這種方法識別的克隆的DNA插入序列可以進一步用DNA限制性內切酶分析和DNA測序來評價它與人h50sRPL1基因的相似性。組織表達的分布可以用上述的Northern印跡法技術分析。
人h50sRPL1同源物也可以用針對人h50sRPL1蛋白或多肽的抗體來識別。例如,可以用標準的方法對商品化的或者用已知方法構建的,來自細胞或者組織例如骨髓的表達文庫進行篩選。將文庫倒入平皿,菌落轉移到一張硝化纖維素膜上,使表達的重組蛋白結合到膜上。然后就可以用特異性的人h50sRPL1抗體進行典型的抗體結合和檢測。用這種方法所識別出克隆中的DNA插入序列,可以進一步用DNA限制性內切酶分析和DNA測序進行分析以評價它與人h50sRPL1基因的相似性。新識別的基因的組織表達分布可以同樣地按上述方法進行分析。
本發(fā)明的人h50sRPL1核苷酸全長序列或其片段通??梢杂肞CR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據(jù)本發(fā)明所公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按本領域技術人員已知的常規(guī)方法所制備的cDNA庫作為模板,擴增而得有關序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉入細胞,然后通過常規(guī)方法從增殖后的宿主細胞中分離得到有關序列。
此外,還可用人工化學合成的方法來合成有關序列。在本申請之前,現(xiàn)有技術已完全可以通過先合成多個多核苷酸小片段,然后再進行連接而獲得編碼本發(fā)明人h50sRPL1蛋白的核酸序列。然后,可將該核酸序列引入本領域中各種現(xiàn)有的DNA分子(如載體)和細胞中。此外,還可通過化學合成將突變引入本發(fā)明蛋白序列中。
除了用重組法產生之外,本發(fā)明蛋白的片段還可用固相技術,通過直接合成肽而加以生產(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH FreemanCo.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 852149-2154)。在體外合成蛋白質可以用手工或自動進行。例如,可以用Applied Biosystems的431A型肽合成儀(Foster City,CA)來自動合成肽。可以分別化學合成本發(fā)明蛋白的各片段,然后用化學方法加以連接以產生全長的分子。
本發(fā)明蛋白的編碼序列可用于基因定位。例如,通過熒光原位雜交技術(FISH),將cDNA克隆與分裂中期的染色體進行雜交,可以準確地進行染色體定位。該技術可以使用短至約500bp的cDNA;也可以使用長至約2000bp或者更長的cDNA。對于該技術,可參見Verma等人,Human ChromosomesA Manual of Basic Techniques,Pergamon Press,New York(1988)。
一旦序列被定位于染色體上的某個精確位置,將可以將序列在染色體上的物理位置與遺傳圖譜數(shù)據(jù)相關聯(lián)。這些遺傳圖譜數(shù)據(jù)是可以獲得的,例如通過孟德爾(Mendelian)人遺傳數(shù)據(jù)庫(可通過Johns Hopkins University Welch Medical Library在網上獲得)。然后,通過連鎖分析來鑒定基因與已定位于同一染色體區(qū)域的疾病之間的相關性。
接著,有必要確定患病個體和健康個體之間的cDNA或基因組序列方面的差異。如果某一突變存在于部分或全部患病個體但不存在于正常個體,那么該突變可能就是該疾病的致病因素。
利用本發(fā)明的人h50sRPL1蛋白,通過各種常規(guī)篩選方法,可篩選出與人h50sRPL1發(fā)生相互作用的物質,或者受體、抑制劑或拮抗劑等。
本發(fā)明人h50sRPL1蛋白及其抗體、抑制劑、拮抗劑或受體等,當在治療上進行施用(給藥)時,可提供不同的效果。通常,可將這些物質配制于無毒的、惰性的和藥學上可接受的水性載體介質中,其中pH通常為約5-8,較佳地pH約為6-8,盡管pH值可隨被配制物質的性質以及待治療的病癥而有所變化。配制好的藥物組合物可以通過常規(guī)途徑進行給藥,其中包括(但并不限于)肌內、腹膜內、皮下、皮內、或局部給藥。
以本發(fā)明的人h50sRPL1蛋白為例,可以將其與合適的藥學上可接受的載體聯(lián)用。這類藥物組合物含有治療有效量的蛋白質和藥學上可接受的載體或賦形劑。這類載體包括(但并不限于)鹽水、緩沖液、葡萄糖、水、甘油、乙醇、及其組合。藥物制劑應與給藥方式相匹配。本發(fā)明的人h50sRPL1蛋白可以被制成針劑形式,例如用生理鹽水或含有葡萄糖和其他輔劑的水溶液通過常規(guī)方法進行制備。諸如片劑和膠囊之類的藥物組合物,可通過常規(guī)方法進行制備。藥物組合物如針劑、溶液、片劑和膠囊宜在無菌條件下制造。活性成分的給藥量是治療有效量,例如每天約1微克/千克體重-約5毫克/千克體重。此外,本發(fā)明的多肽還可與其他治療劑一起使用。
當本發(fā)明的人h50sRPL1蛋白多肽被用作藥物時,可將治療有效劑量的該多肽施用于哺乳動物,其中該治療有效劑量通常至少約10微克/千克體重,而且在大多數(shù)情況下不超過約8毫克/千克體重,較佳地該劑量是約10微克/千克體重-約1毫克/千克體重。當然,具體劑量還應考慮給藥途徑、病人健康狀況等因素,這些都是熟練醫(yī)師技能范圍之內的。
表2為本發(fā)明的人h50sRPL1蛋白與Thermus thermophilus50sRPL1蛋白的氨基酸序列(GenPept Accession No.P27150)的同源比較(FASTA)表。其中,相同的氨基酸在兩個序列之間用氨基酸單字符標出,相似的氨基酸用“+”標出。
下面結合具體實施例,進一步闡述本發(fā)明。應理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實驗室手冊(New YorkCold SpringHarbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1人h50sRPL1基因的克隆1.組織分離(骨髓isolation)骨髓來源于5個正常成年男性供體,在死后四小時內取出骨髓,立即置于液氮中冷凍保存。
2.mRNA的分離(mRNA isolation)取出組織,用研缽研碎,加入盛有裂解液的50ml管,充分振蕩后,再移入玻璃勻漿器內。勻漿后移至50ml新管,抽提總RNA(TRIzol Reagents,Gibco,NY,USA)。用甲醛變性膠電泳鑒定總RNA質量。用帶Oligod(T)的纖維素柱分離總RNA中的mRNA,定量。
3.cDNA文庫的構建(Construction of cDNA library)以mRNA為模板,合成雙鏈cDNA,反轉錄引物見SEQ ID NO.1。補平末端后,加含EcoRI切點的接頭,接頭序列分別見SEQ ID NO.2和3。磷酸化EcoRI末端后,用XhoI限制性內切酶消化1.5小時,再進行片段分離。過柱篩選長度>500bp的片段,用酚-氯仿抽提,乙醇沉淀,無菌水溶解,連接至Uni-ZAP XR載體(Stratagene,CA9203,USA),以Zap-cDNA Gigapack III Gold Cloning Kit(Stratagene,CA9203,USA)進行包裝,宿主菌使用XL 1-Blue MRF(Stratagene,CA9203,USA)細菌。涂板并測定滴度。
4.測序及數(shù)據(jù)庫建立(Seqencing and Database Constructing)挑選文庫中有外源片段插入的克隆,擴增后抽提質粒(Qiagen,Germany),用T3和T7作為3’端和5’端的通用引物,采用終止物熒光標記(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377測序儀(Perkin-Elmer,USA)上進行EST大規(guī)模測序。測序結果用FACTURA軟件去除載體序列,傳輸?shù)絊UN Ultra 450 Server上進行下一步的處理。所有的序列信息再用GCG軟件包(Wisconsin group,USA)中的BLAST和FASTA軟件搜索已有的數(shù)據(jù)庫(Genebank+EMBL),將無同源性或同源性低于95%的序列視為新基因建立數(shù)據(jù)庫。
5.基因的全長克隆(Cloning of Full-length cDNA)在得到的新基因片段序列信息基礎上,進行cDNA全長克隆,分兩階段進行(1)“電子克隆”(Electronic Cloning)以新基因片段序列作為探針搜尋dbEST數(shù)據(jù)庫,將重疊序列>50bp,同源性在98%以上的表達序列標簽(Expressed Sequence Tag,簡稱“EST”)序列認為同一序列(consensus sequence),取出并用AUTOASSEMBLER軟件進行拼接,部分EST可以延伸探針序列。再用STRIDER軟件分析被延伸的序列是否具有完整的開放閱讀框架(Open Reading Frame,ORF),用BLAST搜尋Genbank或SwissProt以確定該序列在核苷酸和氨基酸水平上是否與其他物種有同源性,以幫助判別所得到的基因全長完整性如何。通過電子克隆的方法,通??色@取人h50sRPL1基因的全長序列。
(2)cDNA末端快速擴增(Rapid Amplification of cDNA Ends,RACE)如果通過“電子克隆”方法仍未得到完整的cDNA全長,則在已有序列的5’或3’端設計引物,在人類骨髓Marathon-Ready cDNA文庫(Clontech Lab,Inc,USA)中進行長距離PCR反應。然后對PCR產物克隆、測序。用AUTOASSEMBLER及STRIDER軟件分析被延長的序列有無完整的ORF,如無,重復上述過程直至獲得全長。
(3)RT-PCR對于5’和3’端已知的序列,如果中間尚有一段間隙(gap)無法從已有的公共數(shù)據(jù)庫或自身數(shù)據(jù)庫獲得,可考慮采用RT-PCR的方法。在序列5’端設計引物,3’端引物采用Oligo-dT,在骨髓總RNA庫中進行擴增。然后對產物進行克隆、測序。最后拼接并獲得全長。
通過組合使用上述3種方法,獲得了候選的人h50sRPL1蛋白的全長編碼序列。在拼接得到全長(至少包含完整的開放讀框)的基礎上,進一步設計引物R15’-GGAACAATTTCGTGAACGC-3’(SEQ ID NO.4)為正向引物,寡核苷酸R25’-TTCACCACATTTAGGCATCTTC-3’(SEQ ID NO.5)為反向引物,以骨髓的總RNA為模板,進行RT-PCR擴增,R1/R2的PCR條件為94℃5分鐘,隨之以94℃30秒、55℃30秒和72℃1分鐘進行35個循環(huán),最后以72℃延伸5分鐘。電泳檢測PCR擴增產物,獲得擴增片段長度為1024bp。然后按常規(guī)方法以PCR擴增產物進行克隆、測序,獲得SEQ ID NO.6所示的序列。
實施例2人h50sRPL1基因的序列信息與同源性分析本發(fā)明新的人h50sRPL1全長cDNA(GenBank Accession No.AF212225。在本申請之前未公開過)的長度為1024bp,詳細序列見SEQ ID NO.6,其中開放讀框位于100-1014位核苷酸。根據(jù)全長cDNA推導出人h50sRPL1的氨基酸序列,共304個氨基酸殘基,分子量34514.71,pI為8.14。詳細序列見SEQ ID NO.7。
將人h50sRPL1的全長蛋白質用BLAST程序在Non-redundant GenBank CDStranslations+PDB+SwissProt+Superdate+PIR數(shù)據(jù)庫中進行蛋白質同源性檢索,結果發(fā)現(xiàn)它與Thermus thermophilus50sRPL1基因存在一定的同源性。在氨基酸水平上,它與Thermus thermophilus50sRPL1蛋白(GenPept Accession No.P27150)的第1-228位氨基酸殘基有24.6%的相同性和61.9%的相似性(見表2)。由上可見,人h50sRPL1基因與Thermus thermophilus50sRPL1基因在蛋白水平上存在較高的同源性,屬于同一家族并且兩者在功能上也有很高相似性。
本發(fā)明的人h50sRPL1除了可作為該家族一員用于進一步的功能研究,還可用于與其他蛋白一起產生融合蛋白,比如與免疫球蛋白一起產生融合蛋白。此外,本發(fā)明的人h50sRPL1還可以與該家族的其他成員進行融合或交換片段,以產生新的蛋白。例如將本發(fā)明的人h50sRPL1蛋白的N端與Thermus thermophilus50sRPL1蛋白的N端進行交換,以產生新的活性更高或具有新特性的蛋白。
針對本發(fā)明人h50sRPL1的抗體,用于篩選該家族的其他成員,或者用于親和純化相關蛋白(如該家族的其他成員)。
此外,本發(fā)明人h50sRPL1核酸(編碼序列或反義序列)可以被引入細胞,以提高人h50sRPL1的表達水平或者抑制人h50sRPL1的過度表達。本發(fā)明的人h50sRPL1蛋白或其活性多肽片段可以施用于病人,以治療或減輕因人h50sRPL1缺失、無功能或異常而導致的有關病癥。此外,還可以用基于本發(fā)明的核酸序列或抗體進行有關的診斷或預后判斷。
由于本發(fā)明的人h50sRPL1蛋白具有源自人的天然氨基酸序列,因此,與來源于其他物種(如Thermus thermophilus)的同族蛋白相比,預計在施用于人時將具有更高的活性和/或更低的副作用(例如在人體內的免疫原性更低或沒有)。
實施例3人h50sRPL1基因的組織表達譜電子Northern表達譜。按Ton C.等人的方法(Ton C et al.,Biochem BiophysRes Commun 1997 Dec 18;241(2)589-594;Hwang DM,et al.,Circulation 1997Dec 16;96(12)4146-4203),將人h50sRPL1 cDNA序列在GCG軟件包中的humanEST數(shù)據(jù)庫中做BLAST檢索,在得到的人類EST中,概率值<10e-10、相同性>95%的EST有上百個,可視為該基因在組織中的轉錄表達本,由此得出表達該基因的組織譜,發(fā)現(xiàn)其在胎盤、嬰兒心臟、T細胞淋巴腺瘤、睪丸、胎腦、甲狀旁腺腫瘤等等組織中有表達,表明它在人體這些組織器官中發(fā)揮著重要作用。
實施例4人h50sRPL1多肽的制備和提純在該實施例中,將全長的人h50sRPL1編碼序列或片段構建入商品化的蛋白質融合表達載體之中,以表達和提純重組蛋白。
將人h50sRPL1多肽以GST融合蛋白的形式在大腸桿菌中進行原核表達。
原核表達載體的構建,以及轉化大腸桿菌根據(jù)人h50sRPL1的全長編碼序列(SEQ ID NO.6),設計擴增出完整編碼閱讀框的引物(分別對應于編碼序列5’和3’端的約20個以上核苷酸),并在正反引物上分別引入限制性內切酶位點(這根據(jù)選用的pGEX-2T載體而定),以便構建表達載體。以實施例1中獲得的擴增產物為模板,經PCR擴增后,將人h50sRPL1基因在保證閱讀框正確的前提下克隆至pGEX-2T載體(Pharmacia,Piscataway,NJ)。鑒定好的表達載體利用CaCl2方法轉入大腸桿菌DH5α,篩選鑒定得到含有pGEX-2T-h50sRPL1表達載體的工程菌DH5α-pGEX-2T-h50sRPL1。
表達GST-h50sRPL1重組蛋白的工程菌的分離鑒定挑取單菌落的DH5α-pGEX-2T-h50sRPL1工程菌于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)過夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時,至OD600達0.5后,加入IPTG至終濃度1mmol/L繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時。取培養(yǎng)時間不同的1ml菌液離心,在細菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預期分子量大小的蛋白量隨IPTG誘導時間增加而增加的菌株即為表達GST-h50sRPL1融合蛋白的工程菌。
GST-h50sRPL1融合蛋白的提取純化按上述方法誘導表達GST-h50sRPL1融合表達蛋白的工程菌DH5α-pGEX-2T-h50sRPL1。誘導后的細菌離心沉淀,按每400ml菌加入20ml PBS重懸細菌,超聲破碎細菌。破菌完全的超聲液按每毫升加入20微升的量加入PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結合30分鐘,10000rpm離心10分鐘沉淀結合了GST-h50sRPL1的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μlPBS的量清洗兩次,而后按每毫升超聲液所得沉淀加入10μl還原型谷胱苷肽洗脫液,室溫置10分鐘,10000rpm離心10分鐘,上清即為洗脫的融合蛋白。重復洗脫兩次。洗脫的上清保存于-80℃,并進行SDS-PAGE電泳,檢測純化效果。在35kDa處的蛋白質條帶即為人h50sRPL1蛋白。
實施例5人h50sRPL1蛋白或多肽在昆蟲細胞中進行真核細胞表達1.人h50sRPL1桿狀病毒表達載體的構建及轉染Sf9昆蟲細胞株根據(jù)人h50sRPL1的全長編碼序列(SEQ ID NO.6),設計擴增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內切酶位點(這可視選用的載體而定),以便構建表達載體。以實施例1中獲得的擴增產物為模板,經PCR擴增后,將人h50sRPL1 cDNA在保證閱讀框架的前提下克隆至pVL1392載體(Invitrogen,Carlsbad,CA)。鑒定好的表達載體3μg,野生型線性桿狀病毒DNA(BaculoGoldTMACMNPV DNA,Pharmingen,San Diego,CA)1μg和Lipofection(Gibco-BRL,NY)25μl,加入1ml無血清的昆蟲培養(yǎng)基中,振蕩15秒混勻,室溫孵育15分鐘備用。取1ml(2×106)Sf9昆蟲細胞懸液于60mm組織培養(yǎng)板中,貼壁1小時后換轉染培養(yǎng)基,室溫孵育15分鐘后棄培養(yǎng)基,加入前面制備好的DNA載體轉染混合物,Parafilm密封培養(yǎng)板,于室溫27℃振搖培養(yǎng)4小時,而后換完全培養(yǎng)基培養(yǎng)3天,收集上清備用。
2.轉入重組表達載體的昆蟲細胞株的篩選鑒定轉染3天后的昆蟲細胞用新鮮培養(yǎng)基制成細胞懸液(2×106/1ml),取1ml細胞懸液置于60mm組織培養(yǎng)皿中,加入3ml培養(yǎng)基,100μl收集的培養(yǎng)上清,貼壁1小時,棄2ml培養(yǎng)基,繼續(xù)室溫培養(yǎng)1小時,棄去所有的培養(yǎng)基,加入預熱的含20μl4%X-gal的3ml半固體培養(yǎng)基,培養(yǎng)5-7天后挑取白色細胞克隆于96孔培養(yǎng)板中培養(yǎng)3-5天,而后吸取上清感染Sf9昆蟲細胞。
收集感染的細胞進行Western鑒定。將細胞裂解后進行SDS-PAGE電泳,電泳后的膠于Pharmacia的Multiphor II半干電轉移儀中將蛋白質轉印到硝酸纖維膜上,將硝酸纖維膜置于封閉液中封閉1小時,而后于抗人h50sRPL1的抗體溶液中封閉1小時,TBS液振搖清洗5分鐘共2次,而后將膜置于生物素標記的抗人h50sRPL1一抗的第二抗體溶液中振搖1小時,TBS清洗,加入親和素-堿性磷酸酶復合物反應30分鐘,TBS清洗2次,加入新鮮配制的顯色液顯色觀察蛋白條帶。
挑取高表達人h50sRPL1的Sf9細胞克隆。
3.人h50sRPL1蛋白的提取純化用高表達人h50sRPL1的Sf9細胞克隆的上清大量感染Sf9細胞,感染48小時后收集細胞,PBS洗滌。每2×108細胞加入20ml細胞裂解液(0.5%Triton X-100,20mM Na3PO4(磷酸鈉,pH7.8),500mM NaCl,1mM Na3VO4(釩酸鈉),1mM Pefabloc,1μg/ml胃蛋白酶抑制劑,亮抑蛋白酶肽和抑蛋白酶肽)破細胞,12000×g離心20min去除細胞碎片,上清按每2×108的細胞加入2ml NTA-瓊脂糖(Qiagen,Germany),4℃吸附1小時。而后用含100nM咪唑的His緩沖液洗滌兩次,用含20mM N,N’-二哌嗪,500mM NaCl,300mM咪唑的緩沖液洗脫以得到純化的蛋白。洗脫液保存于4℃,并進行SDS-PAGE電泳檢測提取的人h50sRPL1蛋白的純度。在35kDa處的蛋白質條帶即為人h50sRPL1蛋白。
實施例6抗人h50sRPL1抗體的制備1.免疫小鼠和脾細胞的制備將實施例5和實施例6中獲得的人h50sRPL1蛋白用層析法進行分離后備用,也可以用SDS-PAGE凝膠電泳法進行分離,將電泳條帶從凝膠中割下,并用等體積的完全Freund’s佐劑乳化。取6-8周齡Balb/C雌鼠,用50-100μg/0.2ml乳化過的蛋白,對小鼠進行腹膜內注射。14天后,用非完全Freund’s佐劑乳化的同樣抗原對小鼠以50-100μg/0.2ml的劑量再加強免疫一次,3-5天后用于融合。其中,脾細胞制備見鄂征主編,《組織培養(yǎng)和分子細胞學技術》,北京出版社,第210頁。
2.按《組織培養(yǎng)和分子細胞學技術》(同上),第371頁中的方法,制備飼養(yǎng)細胞。
3.按《組織培養(yǎng)和分子細胞學技術》(同上),第213頁中的方法,進行細胞融合。
4.抗體的檢測在細胞融合10-15天后,需逐孔進行檢查,一旦發(fā)現(xiàn)旺盛的雜交細胞集落生長,就應用人h50sRPL1蛋白做抗體活性的初步篩選,常用的方法有免疫熒光試驗、發(fā)射免疫試驗(RIA)、酶聯(lián)免疫吸附試驗(ELISA)。檢查出抗體活性的孔后,立刻進行克隆培養(yǎng),并分離出抗體。
本發(fā)明涉及的序列及記號分列如下(1)SEQ ID NO.1的信息(i)序列特征(A)長度50bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(ix)序列描述SEQ ID NO.1GAGAGAGAGAGAGAGAGAGAACTAGTCTCGAGTTTTTTTTTTTTTTTTTT 50(2)SEQ ID NO.2的信息(i)序列特征(A)長度13bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(ix)序列描述SEQ ID NO.2AATTCGGCAC GA G13(3)SEQ ID NO.3的信息(i)序列特征(A)長度9bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型寡核苷酸(ix)序列描述SEQ ID NO.3GCCGTGCTC 9(4)SEQ ID NO.4的信息(i).序列特征(A)長度19bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ii).分子類型寡核苷酸(ix).序列描述SEQ ID NO.4GGAACAATTTCGTGAACGC19(5)SEQ ID NO.5的信息(i).序列特征(A)長度22bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ii).分子類型寡核苷酸(ix).序列描述SEQ ID NO.5TTCACCACATTTAGGCATCTTC 22(6)SEQ ID NO.6的信息(i)序列特征(A)長度1024bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型核苷酸(ix)序列描述SEQ ID NO.61GGAACAATTT CGTGAACGCA ATCCGGAGTG CCCAACATGG CGGCGGCGTA51AGTGCATGGG TAGAGCCTTG ATACATCATC AAAGGCATAG CTTTCCAAGA101TGGTTTATCA GACATCACTT TGTTCTTGTT CTGTAAACAT CCGAGTGCCC151AACAGACATT TTGCTGCTGC TACAAAGTCT GCAAAGAAAA CAAAAAAAGG201 TGCTAAAGAA AAAACACCAG ATGAGAAAAA AGATGAAATA GAAAAAATAA251 AAGCATATCC CTATATGGAA GGCGAACCTG AGGATGATGT CTATTTAAAA301 CGCTTATACC CGAGACAGAT ATATGAGGTG GAGAAAGCTG TTCACTTACT351 TAAGAAATTT CAAATTCTTG ACTTTACTAG TCCAAAGCAA AGTGTTTATC401 TTGGATTTGA CACTGGATAT GGCACTGGGA AAGAAGAAAA ACGTGGAGCC451 CATTTACCAG TGTTCTTAGT TTGCCCATAC CCATTTGCTT CCGAAATCAA501 TAAAGTTGCT GTATTTACAG AGAATGCATC AGAGGTCAAA ATAGCGGAAG551 AAAATGGAGC TGCATTTGCA GGAGGCACTA GTCTGATACA GAAGATTTGG601 GATGATGAAA TTGTTGCAGA CTTTTACGTA GCTGTTCCAG AAATAATGCC651 TGAACTTAAT CGATTAAGGA AGAAACTGAA TAAAAAATAT CCAAAGCTTT701 CTCGAAATTC CATTGGCCGT GACATCCCCA AAATGCTTGA ATTATTTAAA751 AATGGACATG AAATTAAGGT AGATGAAGAA AGGGAGAACT TTCTCCAGAC801 CAAAATAGCA ACATTGGATA TGTCAAGTGA CCAGATAGCT GCCAATCTGC851 AAGCAGTTAT TAATGAAGTT TGTAGGCACA GACCGCTGAA TTTGGGTCCC901 TTTGTGGTAC GTGCTTTCCT TCGTAGTTCA ACAAGTGAAG GTTTATTACT951 GAAGATTGAT CCATTGTTGC CTAAAGAAGT AAAAAATGAA GAAAGTGAAA1001 AAGAAGATGC CTAAATGTGG TGAA(7)SEQ ID NO.7的信息(i)序列特征(A)長度304氨基酸(B)類型氨基酸(C)鏈性單鏈(D)拓撲結構線性(ii)分子類型多肽(ix)序列描述SEQ ID NO.71MVYQTSLCSC SVNIRVPNRH FAAATKSAKK TKKGAKEKTP DEKKDEIEKI51KAYPYMEGEP EDDVYLKRLY PRQIYEVEKA VHLLKKFQIL DFTSPKQSVY101LGFDTGYGTG KEEKRGAHLP VFLVCPYPFA SEINKVAVFT ENASEVKIAE151ENGAAFAGGT SLIQKIWDDE IVADFYVAVP EIMPELNRLR KKLNKKYPKL201SRNSIGRDIP KMLELFKNGH EIKVDEEREN FLQTKIATLD MSSDQIAANL251QAVINEVCRH RPLNLGPFVV RAFLRSSTSE GLLLKIDPLL PKEVKNEESE
301 KEDA表224.6%identity in 228 aa overlap,61.9%similarity in 228 overlap405060708090h.pepKEKTPDEKKDEIEKIKAYPYMEGEPEDDVYLKRLYPRQIYEVEKAVHLLKKFQILDFT-S|+++ | +|| +++|+||+|++| +t.pep MPKHGKRYRALLEKVDPNKIYTIDEAAHLVKELATAKFDET10203040100 110 120 130 140 150h.pepPKQSVYLGFDTGYGTGKEEKRGAHLPVFLVCPYPFASEINKVAVFTENASEVKIAEENGA+ + ||+| + ++ ||+ | | |+ +++++ +|+ ++ ++| ||| ||t.pepVEVHAKLGIDPRRSD--QNVRGT---VSL--PHGLGKQVRVLAI--AKGEKIKEAEEAGA50 60 70 8090160 170 180190 200 210h.pepAFAGGTSLIQKIWDDEIVADFYVAVPEIMPEL-NRLRKKLNKK--YPKLSRNSIGRDIPK++|| +|||| | + | ||+|++| + ++| + |+ + |+ + +++| +| +t.pepDYVGGEEIIQKILDGWMDFDAVVATPDVMGAVGSKLGRILGPRGLLPNPKAGTVGFNIGE100 110 120 130 140 150220 230 240 250 260270h.pepMLELFKNGHEIKVDEERENFLQTKIATLDMSSDQIAANLQAVINEVCRHRPLNL-GPFVV+++ +| |+ |+ +++ + +++ ++ ++ +++| |++| | + |+| + | |+t.pepIIREIKAGR-IEFRNDKTGAIHAPVGKASFPPEKLADNIRAFIRALEAHKPEGAKGTFLR160170 180 190 200 210280 290 300h.pepRAFLRSSTSEGLLLKIDPLLPKEVKNEESEKEDA+++ +|+ | ++|+|t.pepSVYV--TTTMGPSVRINPHS220h.pep人h5OsRPL1蛋白序列c.pepT.thermophilus50sRPL1蛋白序列(GenPept Accession numberP27150)
權利要求
1.一種分離出的DNA分子,其特征在于,它包括編碼具有人h50sRPL1蛋白質活性的多肽的核苷酸序列,而且所述的核苷酸序列與SEQ ID NO.6中從核苷酸第100-1014位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.6中從核苷酸第100-1014位的核苷酸序列雜交。
2.如權利要求1所述的DNA分子,其特征在于,所述的序列編碼具有SEQ ID NO.7所示的氨基酸序列的多肽。
3.如權利要求1所述的DNA分子,其特征在于,該序列具有SEQ ID NO.6中從核苷酸第100-1014位的核苷酸序列。
4.一種分離出的人h50sRPL1蛋白多肽,其特征在于,它包括具有SEQ ID NO.7氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。
5.如權利要求4所述的多肽,其特征在于,該多肽是具有SEQ ID NO.7序列的多肽。
6.一種載體,其特征在于,它包含權利要求1所述的DNA。
7.一種用權利要求6所述載體轉化的宿主細胞,其特征在于它包括原核細胞和真核細胞。
8.一種產生具有人h50sRPL1蛋白質活性的多肽的方法,特征在于其步驟如下(1)將編碼具有人h50sRPL1蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成人h50sRPL1蛋白表達載體,所述的核苷酸序列與SEQ ID NO.6中從核苷酸第100-1014位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達載體轉入宿主細胞,形成人h50sRPL1蛋白的重組細胞;(3)在適合表達人h50sRPL1蛋白多肽的條件下,培養(yǎng)步驟(2)中的重組細胞;(4)分離出具有人h50sRPL1蛋白活性的多肽。
9.一種能與權利要求7所述的人h50sRPL1蛋白多肽特異性結合的抗體,其特征在于它包括多克隆抗體和單克隆抗體。
10.一種核酸分子,其特征在于,它包含權利要求1所述的DNA分子中8-100個連續(xù)核苷酸。
11.一種用于檢測樣品中是否存在人h50sRPL1核苷酸序列的方法,其特征在于它包括用權利要求10所述探針與樣品進行雜交,然后檢測探針是否發(fā)生了結合,該樣品是PCR擴增后的產物,其中PCR擴增引物對應于人h50sRPL1核苷酸編碼序列,并可位于該編碼序列的兩側或中間,引物長度為15~50個核苷酸。
全文摘要
本發(fā)明提供了一種在人體正常骨髓中表達的新的人h50sRPL1蛋白及其編碼序列,本發(fā)明還提供了該蛋白和核酸序列的制備方法,以及在樣品中檢測人h50sRPL1核酸序列和多肽的方法。
文檔編號C07H21/00GK1269407SQ00111779
公開日2000年10月11日 申請日期2000年3月2日 優(yōu)先權日2000年3月2日
發(fā)明者李能干, 錢斌治, 李月彬, 肖華勝, 陳竺, 韓澤廣 申請人:國家人類基因組南方研究中心