專利名稱:一種人異質核核糖核蛋白異構體及其編碼序列的制作方法
技術領域:
本發(fā)明涉及分子生物學、酶學、生理學以及基因工程等領域。具體地,本發(fā)明涉及一種在人類樹突狀細胞中表達的hHNRPD-iso蛋白及其核酸序列。本發(fā)明還涉及該蛋白和核酸序列的制備方法和用途。
異質核核糖核蛋白(heterogeneous nuclear ribonucleoprotein D,HNRPD)與別的RNA結合蛋白一樣,同樣含有RNA結合區(qū)、或者叫RNA識別區(qū)(RNA-bindingdomain,RBD;RNA recognition motif,RRM)。HNRPD結合到RNA上影響RNA的生理作用。(Genomics 1998 May 1;49(3)378-84)。
本發(fā)明中,我們在人類樹突狀細胞中克隆到人hHNRPD基因的同源基因hHNRPD-iso。
在本發(fā)明被公布之前,尚未有任何公開或報道過本專利申請中提及的人類hHNRPD-iso蛋白序列及其核酸序列。
本發(fā)明的第一目的就是提供一種新的人基因hHNRPD-iso(Genbank AccessionNo.AF271779),該基因是一個人hHNRPD-iso蛋白基因。
本發(fā)明的第二目的是提供一種新的人蛋白hHNRPD-iso。
本發(fā)明的第三目的是提供一種利用重組技術生產上述的新的人hHNRPD-iso蛋白和核酸序列的方法。
本發(fā)明還提供了這種人hHNRPD-iso蛋白多肽和編碼序列的應用。
在本發(fā)明的一個方面,提供了一種分離出的DNA分子,該分子包括編碼具有人hHNRPD-iso蛋白質活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.6中從核苷酸第66-395位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.6中從核苷酸第66-395位的核苷酸序列雜交。較佳地,所述的序列編碼具有SEQ ID NO.7所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.6中從核苷酸第66-395位的核苷酸序列。
在本發(fā)明的另一方面,提供了一種分離出的人hHNRPD-iso蛋白質多肽,它包括具有SEQ ID NO.7氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQ ID NO.7序列的多肽。
在本發(fā)明的另一方面,還提供了一種載體,它包含上述的DNA分子。
在本發(fā)明的另一方面,還提供了一種用上述載體轉化的宿主細胞。在一個實例中該宿主細胞是大腸桿菌;在另一實例中,該宿主細胞是真核細胞。
在本發(fā)明的另一方面,還提供了一種產生具有人hHNRPD-iso蛋白質活性的多肽的方法,其步驟如下(1)將編碼具有人hHNRPD-iso蛋白活性的多肽的核苷酸序列可操地連于表達調控序列,形成人hHNRPD-iso蛋白表達載體,所述的核苷酸序列與SEQ ID NO.6中從核苷酸第66-395位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達載體轉入宿主細胞,形成人hHNRPD-iso蛋白的重組細胞;(3)在適合表達人hHNRPD-iso蛋白多肽的條件下,培養(yǎng)步驟(2)中的重組細胞;(4)分離出具有人hHNRPD-iso蛋白活性的多肽。
較佳地,在該方法中使用的核酸序列具有SEQ ID NO.6中第66-395位的序列。
本發(fā)明還提供了與hHNRPD-iso蛋白多肽特異性結合的抗體。
在本發(fā)明中,“分離的”、“純化的”或“基本純的”DNA是指,該DNA或片段已從天然狀態(tài)下位于其兩側的序列中分離出來,還指該DNA或片段已經與天然狀態(tài)下伴隨核酸的組份分開,而且已經與在細胞中伴隨其的蛋白質分開。
在本發(fā)明中,術語“人hHNRPD-iso蛋白(或多肽)編碼序列”指編碼具有人hHNRPD-iso蛋白活性的多肽的核苷酸序列,如SEQ ID NO.6中第66-395位核苷酸序列及其簡并序列。該簡并序列是指,位于SEQ ID NO.6序列的編碼框第66-395位核苷酸中,有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產生的序列。由于密碼子的簡并性,所以與SEQ ID NO.6中第66-395位核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.7所述的序列。該術語還包括能在中度嚴緊條件下,更佳的在高度嚴緊條件下與SEQ ID NO.6中從核苷酸第66-395位的核苷酸序列雜交的核苷酸序列。該術語還包括與SEQ ID NO.6中從核苷酸第66-395位的核苷酸序列的同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
該術語還包括能編碼具有與天然的人hHNRPD-iso相同功能的蛋白的、SEQ ID NO.6中開放閱讀框序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-90個,較佳地1-60個,更佳地1-20個,最佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數個(通常為60個以內,較佳地為30個以內,更佳地為10個以內,最佳地為5個以內)核苷酸。
在本發(fā)明中,“基本純的”蛋白質或多肽是指其至少占樣品總物質的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計)。純度可以用任何合適的方法進行測量,如用柱層析、PAGE或HPLC法測量多肽的純度?;炯兊亩嚯幕旧喜缓烊粻顟B(tài)下的伴隨其的組分。
在本發(fā)明中,術語“人hHNRPD-iso蛋白或多肽”指具有人hHNRPD-iso蛋白活性的SEQ ID NO.7序列的多肽。該術語還包括具有與天然人hHNRPD-iso相同功能的、SEQ ID NO.7序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數個(通常為20個以內,較佳地為10個以內,更佳地為5個以內)氨基酸。例如,在本領域中,用性能相近或相似的氨基酸進行取代時,通常不會改變蛋白質的功能。又比如,在C末端和/或N末端添加一個或數個氨基酸通常也不會改變蛋白質的功能。該術語還包括人hHNRPD-iso蛋白的活性片段和活性衍生物。
本發(fā)明的人hHNRPD-iso多肽的變異形式包括同源序列、保守性變異體、等位變異體、天然突變體、誘導突變體、在高或低的嚴緊條件下能與人hHNRPD-iso DNA雜交的DNA所編碼的蛋白、以及利用抗人hHNRPD-iso多肽的抗血清獲得的多肽或蛋白。本發(fā)明還提供了其他多肽,如包含人hHNRPD-iso多肽或其片段的融合蛋白。除了幾乎全長的多肽外,本發(fā)明還包括人hHNRPD-iso多肽的可溶性片段。通常,該片段具有人hHNRPD-iso多肽序列的至少約10個連續(xù)氨基酸,通常至少約30個連續(xù)氨基酸,較佳地至少約50個連續(xù)氨基酸,更佳地至少約80個連續(xù)氨基酸,最佳地至少約100個連續(xù)氨基酸。
在本發(fā)明中,“人hHNRPD-iso保守性變異多肽”指與SEQ ID NO.7的氨基酸序列相比,有至多10個,較佳地至多8個,更佳地至多5個氨基酸被性質相似或相近的氨基酸所替換而形成多肽。這些保守性變異多肽最好根據表1進行替換而產生。
表1
發(fā)明還包括人hHNRPD-iso蛋白或多肽的類似物。這些類似物與天然人hHNRPD-iso多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導的遺傳變異體。誘導變異體可以通過各種技術得到,如通過輻射或暴露于誘變劑而產生隨機誘變,還可通過定點誘變法或其他已知分子生物學的技術。類似物還包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的類似物。應理解,本發(fā)明的多肽并不限于上述例舉的代表性的多肽。
修飾(通常不改變一級結構)形式包括體內或體外的多肽的化學衍生形式如乙?;螋然?。修飾還包括糖基化,如那些在多肽的合成和加工中或進一步加工步驟中進行糖基化修飾而產生的多肽。這種修飾可以通過將多肽暴露于進行糖基化的酶(如哺乳動物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優(yōu)化了溶解性能的多肽。
在本發(fā)明中,可選用本領域已知的各種載體,如市售的載體,包括質粒,粘粒等。在生產本發(fā)明的人hHNRPD-iso多肽時,可以將人hHNRPD-iso編碼序列可操作地連于表達調控序列,從而形成人hHNRPD-iso蛋白表達載體。
如本文所用,“可操作地連于”指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號肽DNA作為前體表達并參與多肽的分泌,那么信號肽(分泌前導序列)DNA就是可操作地連于多肽DNA;如果啟動子控制序列的轉錄,那么它是可操作地連于編碼序列;如果核糖體結合位點被置于能使其翻譯的位置時,那么它是可操作地連于編碼序列。一般,“可操作地連于”意味著相鄰,而對于分泌前導序列則意味著在閱讀框中相鄰。
在本發(fā)明中,術語“宿主細胞”包括原核細胞和真核細胞。常用的原核宿主細胞的例子包括大腸桿菌、枯草桿菌等。常用的真核宿主細胞包括酵母細胞、昆蟲細胞和哺乳動物細胞。較佳地,該宿主細胞是真核細胞,如CHO細胞、COS細胞等。
本發(fā)明還提供了對人hHNRPD-iso特異性結合的抗體,包括多克隆抗體和單克隆抗體。
在本發(fā)明中,可以使用一系列本領域已知的方法來制備針對人hHNRPD-iso特異的抗體。例如,將提純的人hHNRPD-iso基因產物或它的抗原片段注射入動物體內以產生多克隆抗體。同樣,表達人hHNRPD-iso或它的抗原片段的細胞也可以用來對動物致免疫而產生抗體。根據本發(fā)明制備的抗體也可以是單克隆抗體,這些單克隆抗體可以用雜交瘤技術制備(例如,Kohler et al.,Nature 256495,1975;Kohleret al.,Eur.J.Immunol.6511,1976;Kohler et al.,Eur.J.Immunol.6292,1976)。本發(fā)明的抗體包括可以阻抑人hHNRPD-iso功能的抗體,也可以是不影響人hHNRPD-iso功能的抗體。每一類抗體都可以通過對人hHNRPD-iso基因產物的片段或功能域致免疫而產生,而人hHNRPD-iso基因產物及其片段可以用重組方法產生或用多肽合成儀進行合成。與非修飾形式的人hHNRPD-iso基因產物結合的抗體,可以通過用在原核細胞例如E.coli中產生的基因產物來免疫動物而得到。與翻譯后修飾形式如糖基化或磷酸化蛋白或多肽結合的抗體,可以通過用在真核細胞如酵母或昆蟲細胞中產生的基因產物的來免疫動物而得到。
本發(fā)明的人hHNRPD-iso抗體可以用來鑒定表達人hHNRPD-iso蛋白或多肽的細胞,如Jurkat T細胞。例如,可以用一種可檢測的分子例如熒光素異硫氰酸(FITC)來標記人hHNRPD-iso特異抗體,然后讓人hHNRPD-iso特異抗體與細胞樣品接觸,再用熒光顯微鏡或流式細胞儀檢測出與人hHNRPD-iso特異抗體結合的細胞。
除了在細胞表面檢測人hHNRPD-iso外,還可以用Western印跡技術分析該蛋白質。細胞裂解液可以從培養(yǎng)細胞或取自病人的組織標本如樹突狀細胞中提取,并溶解在含有去污劑的裂解緩沖液中。然后用SDS聚丙烯酰胺凝膠電泳分離細胞提取物(同時將提純的人hHNRPD-iso多肽作為陽性對照),接著通過電泳雜交將其轉移到硝酸纖維素上。為了用Western印跡免疫探測人hHNRPD-iso多肽,可以使用典型的抗體結合檢測方法,例如放射自顯影或堿性磷酸酶檢測方法。并可使用免疫接種血清或不相關的單克隆抗體作為非特異反應的對照。
還可用Nothern印跡法技術分析人hHNRPD-iso基因產物的表達,即分析人hHNRPD-iso的RNA轉錄物在細胞中的存在與否和數量。
人hHNRPD-iso DNA的Nothern印跡分析和人hHNRPD-iso特異抗體的Western印跡分析可以聯合使用,以證實人hHNRPD-iso在生物樣本中的表達。人hHNRPD-isoDNA還可以用于Southern印跡分析或原位雜交分析,以將該基因定位于染色體上,并可進行遺傳連鎖分析以找出其它可能的疾病相關基因。
此外,本發(fā)明還提供了一種可用作探針的核酸分子,該分子通常具有人hHNRPD-iso核苷酸編碼序列的8-100個連續(xù)核苷酸,較佳地具有15-50個連續(xù)核苷酸。該探針可用于檢測樣品中是否存在編碼人hHNRPD-iso的核酸分子。
本發(fā)明還提供了檢測樣品中是否存在人hHNRPD-iso核苷酸序列的方法,它包括用上述的探針與樣品進行雜交,然后檢測探針是否發(fā)生了結合。較佳地,該樣品是PCR擴增后的產物,其中PGR擴增引物對應于人hHNRPD-iso核苷酸編碼序列,并可位于該編碼序列的兩側或中間。引物長度一般為15-50個核苷酸。
此外,根據本發(fā)明的人hHNRPD-iso核苷酸序列和氨基酸序列,可以在核酸同源性或表達蛋白質的同源性基礎上,篩選人hHNRPD-iso同源基因或同源蛋白。
為了得到與人hHNRPD-iso基因相關的人cDNAs或基因組DNAs的點陣,可以用DNA探針篩選人cDNA或基因組DNA文庫,這些探針是在低嚴緊條件下,用32P對人hHNRPD-iso的全部或部分做放射活性標記而得的。最適合于篩選的cDNA文庫是來自人樹突狀細胞的文庫。來自參與內分泌的其它人體組織或特定人體細胞株的cDNA文庫也可用于篩選目的。構建來自感興趣的細胞或者組織的cDNA文庫的方法是分子生物學領域眾所周知的。另外,許多這樣的cDNA文庫也可以購買到,例如購自Clontech,Palo Alto,Cal.。這種篩選方法可以識別與人hHNRPD-iso相關的基因家族的核苷酸序列。
根據核苷酸相似性篩選人hHNRPD-iso同源物可以按如下方法完成。人體樹突狀細胞cDNA文庫,例如Clontech Cat.#74XX(Clontech,Palo Alto,Cal.)可以使用一段包含人hHNRPD-iso基因序列的全部或部分的隨機引物化DNA探針篩選。要完成對與人hHNRPD-iso序列至少有70%同源性的DNA插入序列的克隆的鑒定,可以使用雜交溫度為55℃的雜交液,然后用0.5×SSC和0.1%SDS清洗。用這種方法識別的克隆的DNA插入序列可以進一步用DNA限制性內切酶分析和DNA測序來評價它與人hHNRPD-iso基因的相似性。組織表達的分布可以用上述的Northern印跡法技術分析。
人hHNRPD-iso同源物也可以用針對人hHNRPD-iso蛋白或多肽的抗體來識別。例如,可以用標準的方法對商品化的或者用已知方法構建的,來自細胞或者組織例如樹突狀細胞的表達文庫進行篩選。將文庫倒入平皿,菌落轉移到一張硝化纖維素膜上,使表達的重組蛋白結合到膜上。然后就可以用特異性的人hHNRPD-iso抗體進行典型的抗體結合和檢測。用這種方法所識別出克隆中的DNA插入序列,可以進一步用DNA限制性內切酶分析和DNA測序進行分析以評價它與人hHNRPD-iso基因的相似性。新識別的基因的組織表達分布可以同樣地按上述方法進行分析。
本發(fā)明的人hHNRPD-iso核苷酸全長序列或其片段通??梢杂肞CR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據本發(fā)明所公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按本領域技術人員已知的常規(guī)方法所制備的cDNA庫作為模板,擴增而得有關序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉入細胞,然后通過常規(guī)方法從增殖后的宿主細胞中分離得到有關序列。
此外,還可用人工化學合成的方法來合成有關序列。在本申請之前,現有技術已完全可以通過先合成多個多核苷酸小片段,然后再進行連接而獲得編碼本發(fā)明人hHNRPD-iso蛋白的核酸序列。然后,可將該核酸序列引入本領域中各種現有的DNA分子(如載體)和細胞中。此外,還可通過化學合成將突變引入本發(fā)明蛋白序列中。
除了用重組法產生之外,本發(fā)明蛋白的片段還可用固相技術,通過直接合成肽而加以生產(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH FreemanCo.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 852149-2154)。在體外合成蛋白質可以用手工或自動進行。例如,可以用Applied Biosystems的431A型肽合成儀(Foster City,CA)來自動合成肽??梢苑謩e化學合成本發(fā)明蛋白的各片段,然后用化學方法加以連接以產生全長的分子。
本發(fā)明蛋白的編碼序列可用于基因定位。例如,通過熒光原位雜交技術(FISH),將cDNA克隆與分裂中期的染色體進行雜交,可以準確地進行染色體定位。該技術可以使用短至約500bp的cDNA;也可以使用長至約2000bp或者更長的cDNA。對于該技術,可參見Verma等人,Human ChromosomesA Manual of Basic Techniques,Pergamon Press,New York(1988)。
一旦序列被定位于染色體上的某個精確位置,將可以將序列在染色體上的物理位置與遺傳圖譜數據相關聯。這些遺傳圖譜數據是可以獲得的,例如通過孟德爾(Mendelian)人遺傳數據庫(可通過Johns Hopkins University Welch Medical Library在網上獲得)。然后,通過連鎖分析來鑒定基因與已定位于同一染色體區(qū)域的疾病之間的相關性。
接著,有必要確定患病個體和健康個體之間的cDNA或基因組序列方面的差異。如果某一突變存在于部分或全部患病個體但不存在于正常個體,那么該突變可能就是該疾病的致病因素。
利用本發(fā)明的人hHNRPD-iso蛋白,通過各種常規(guī)篩選方法,可篩選出與人hHNRPD-iso發(fā)生相互作用的物質,或者受體、抑制劑或拮抗劑等。
本發(fā)明人hHNRPD-iso蛋白及其抗體、抑制劑、拮抗劑或受體等,當在治療上進行施用(給藥)時,可提供不同的效果。通常,可將這些物質配制于無毒的、惰性的和藥學上可接受的水性載體介質中,其中pH通常為約5-8,較佳地pH約為6-8,盡管pH值可隨被配制物質的性質以及待治療的病癥而有所變化。配制好的藥物組合物可以通過常規(guī)途徑進行給藥,其中包括(但并不限于)肌內、腹膜內、皮下、皮內、或局部給藥。
以本發(fā)明的人hHNRPD-iso蛋白為例,可以將其與合適的藥學上可接受的載體聯用。這類藥物組合物含有治療有效量的蛋白質和藥學上可接受的載體或賦形劑。這類載體包括(但并不限于)鹽水、緩沖液、葡萄糖、水、甘油、乙醇、及其組合。藥物制劑應與給藥方式相匹配。本發(fā)明的人hHNRPD-iso蛋白可以被制成針劑形式,例如用生理鹽水或含有葡萄糖和其他輔劑的水溶液通過常規(guī)方法進行制備。諸如片劑和膠囊之類的藥物組合物,可通過常規(guī)方法進行制備。藥物組合物如針劑、溶液、片劑和膠囊宜在無菌條件下制造。活性成分的給藥量是治療有效量,例如每天約1微克/千克體重-約5毫克/千克體重。此外,本發(fā)明的多肽還可與其他治療劑一起使用。
當本發(fā)明的人hHNRPD-iso蛋白多肽被用作藥物時,可將治療有效劑量的該多肽施用于哺乳動物,其中該治療有效劑量通常至少約10微克/千克體重,而且在大多數情況下不超過約8毫克/千克體重,較佳地該劑量是約10微克/千克體重-約1毫克/千克體重。當然,具體劑量還應考慮給藥途徑、病人健康狀況等因素,這些都是熟練醫(yī)師技能范圍之內的。
表2為本發(fā)明的人hHNRPD-iso蛋白與人hHNRPD蛋白的氨基酸序列(GenPeptAccession No.AAC23476)的同源比較(FASTA)。其中,相同的氨基酸在兩個序列之間用氨基酸單字符標出,相似的氨基酸用“+”標出。
下面結合具體實施例,進一步闡述本發(fā)明。應理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實驗室手冊(New YorkCold SpringHarbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
2.mRNA的分離(mRNA isolation)取出組織,用研缽研碎,加入盛有裂解液的50ml管,充分振蕩后,再移入玻璃勻漿器內。勻漿后移至50ml新管,抽提總RNA(TRIzol Reagents,Gibco,NY,USA)。用甲醛變性膠電泳鑒定總RNA質量。用帶Oligo d(T)的纖維素柱分離總RNA中的mRNA,定量。
3.cDNA文庫的構建(Construction of cDNA library)以mRNA為模板,合成雙鏈cDNA,反轉錄引物見SEQ ID NO.1。補平末端后,加含EcoRI切點的接頭,接頭序列分別見SEQ ID NO.2和3。磷酸化EcoRI末端后,用XhoI限制性內切酶消化1.5小時,再進行片段分離。過柱篩選長度>500bp的片段,用酚-氯仿抽提,乙醇沉淀,無菌水溶解,連接至Uni-ZAP XR載體(Stratagene,CA9203,USA),以Zap-cDNA Gigapack Ⅲ Gold Cloning Kit(Stratagene,CA9203,USA)進行包裝,宿主菌使用XL 1-Blue MRF`(Stratagene,CA9203,USA)細菌。涂板并測定滴度。
4.測序及數據庫建立(Seqencing and Database Constructing)挑選文庫中有外源片段插入的克隆,擴增后抽提質粒(Qiagen,Germany),用T3和T7作為3’端和5’端的通用引物,采用終止物熒光標記(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377測序儀(Perkin-Elmer,USA)上進行EST大規(guī)模測序。測序結果用FACTURA軟件去除載體序列,傳輸到SUN Ultra 450 Server上進行下一步的處理。所有的序列信息再用GCG軟件包(Wisconsin group,USA)中的BLAST和FASTA軟件搜索已有的數據庫(Genebank+EMBL),將無同源性或同源性低于95%的序列視為新基因建立數據庫。
5.基因的全長克隆(Cloning of Full-length cDNA)在得到的新基因片段序列信息基礎上,進行cDNA全長克隆,分兩階段進行(1)“電子克隆”(Electronic Cloning)以新基因片段序列作為探針搜尋dbEST數據庫,將重疊序列>50bp,同源性在98%以上的表達序列標簽(Expressed Sequence Tag,簡稱“EST”)序列認為同一序列(consensus sequence),取出并用AUTOASSEMBLER軟件進行拼接,部分EST可以延伸探針序列。再用STRIDER軟件分析被延伸的序列是否具有完整的開放閱讀框架(Open Reading Frame,ORF),用BLAST搜尋Genbank或SwissProt以確定該序列在核苷酸和氨基酸水平上是否與其他物種有同源性,以幫助判別所得到的基因全長完整性如何。通過電子克隆的方法,通??色@取人hHNRPD-iso基因的全長序列。
(2)cDNA末端快速擴增(Rapid Amplification of cDNA Ends,RACE)如果通過“電子克隆”方法仍未得到完整的cDNA全長,則在已有序列的5’或3’端設計引物,在人類樹突狀細胞Marathon-Ready cDNA文庫(Clontech Lab,Inc,USA)中進行長距離PCR反應。然后對PCR產物克隆、測序。用AUTOASSEMBLER及STRIDER軟件分析被延長的序列有無完整的ORF,如無,重復上述過程直至獲得全長。
(3)RT-PCR對于5’和3’端已知的序列,如果中間尚有一段間隙(gap)無法從已有的公共數據庫或自身數據庫獲得,可考慮采用RT-PCR的方法。在序列5’端設計引物,3’端引物采用Oligo-dT,在樹突狀細胞總RNA庫中進行擴增。然后對產物進行克隆、測序。最后拼接并獲得全長。
通過組合使用上述3種方法,獲得了候選的人hHNRPD-iso蛋白的全長編碼序列。在拼接得到全長(至少包含完整的開放讀框)的基礎上,進一步設計引物R15’-CGCGCCATTGTGTTGGTA-3’(SEQ ID NO.4)為正向引物,寡核苷酸R25’-AGGCTGCAGTCTCAAAAATCT-3’(SEQ ID NO.5)為反向引物,以樹突狀細胞的總RNA為模板,進行RT-PCR擴增,R1/R2的PCR條件為94℃5分鐘,隨之以94℃30秒、60℃30秒和72℃1分鐘進行35個循環(huán),最后以72℃延伸5分鐘。電泳檢測PCR擴增產物,獲得擴增片段長度為406bp。然后按常規(guī)方法以PCR擴增產物進行克隆、測序,獲得SEQ ID NO.6所示的序列。
實施例2人hHNRPD-iso基因的序列信息與同源性分析本發(fā)明新的人hHNRPD-iso全長cDNA(GenBank Accession No.AF271779。在本申請之前未公開過)的長度為406bp,詳細序列見SEQ ID NO.6,其中開放讀框位于66-395位核苷酸。根據全長eDNA推導出人hHNRPD-iso的氨基酸序列,共109個氨基酸殘基,分子量12349.02,pI為10.26。詳細序列見SEQ ID NO.7。
將hHNRPD-iso的全長蛋白質序列用BLAST程序在Non-redundant GenBank CDStranslations+PDB+SwissProt+Superdate+PIR數據庫中進行蛋白質同源性檢索,結果發(fā)現它與人的hHNRPD基因存在一定的同源性。在氨基酸水平上,它與人hHNRPD蛋白(GenPept Accession No.AAC23476)的第1-88位氨基酸殘基有72.7%的相同性和92.0%的相似性(附表2)。由上可見,hHNRPD-iso基因與人hHNRPD基因在蛋白水平上存在較高的同源性,可以認為兩者在功能上也有很高相似性。
本發(fā)明的人hHNRPD-iso除了可作為該家族一員用于進一步的功能研究,還可用于與其他蛋白一起產生融合蛋白,比如與免疫球蛋白一起產生融合蛋白。此外,本發(fā)明的人hHNRPD-iso還可以與該家族的其他成員進行融合或交換片段,以產生新的蛋白。例如將本發(fā)明的人hHNRPD-iso蛋白的N端與人hHNRPD蛋白的N端進行交換,以產生新的活性更高或具有新特性的蛋白。
針對本發(fā)明人hHNRPD-iso的抗體,用于篩選該家族的其他成員,或者用于親和純化相關蛋白(如該家族的其他成員)。
此外,本發(fā)明人hHNRPD-iso核酸(編碼序列或反義序列)可以被引入細胞,以提高人hHNRPD-iso的表達水平或者抑制人hHNRPD-iso的過度表達。本發(fā)明的人hHNRPD-iso蛋白或其活性多肽片段可以施用于病人,以治療或減輕因人hHNRPD-iso缺失、無功能或異常而導致的有關病癥。此外,還可以用基于本發(fā)明的核酸序列或抗體進行有關的診斷或預后判斷。
與其同源基因一樣,在該基因氨基酸序列中也存在RNA結合區(qū)、識別區(qū)蛋白功能模塊(RNA-binding region RNP-1,RNA recognition motif),證明其也具有相應生理功能。
實施例4人hHNRPD-iso基因的組織表達譜電子Northern表達譜。按Ton C.等人的方法(Ton C et al.,Biochem BiophysRes Commun 1997 Dec 18;241(2)589-594;Hwang DM,et al.,Circulation 1997Dec 16;96(12)4146-4203),將人hHNRPD-iso cDNA序列在GCG軟件包中的humanEST數據庫中做BLAST檢索,在得到的人類EST中,概率值<10e-10、相同性>95%的EST有上百個,可視為該基因在組織中的轉錄表達本,由此得出表達該基因的組織譜,發(fā)現其在卵巢、成纖維細胞瘤、胎兒脾臟、垂體、視網膜、黑色素細胞、甲狀旁腺腫瘤、胸酰、胎盤、嬰兒心臟、胎兒肝臟、睪丸、胎腦等等組織中有表達,表明它在人體這些組織器官中發(fā)揮著重要作用。
實施例5人hHNRPD-iso多肽的制備和提純在該實施例中,將全長的人hHNRPD-iso編碼序列或片段構建入商品化的蛋白質融合表達載體之中,以表達和提純重組蛋白。
將人hHNRPD-iso多肽以GST融合蛋白的形式在大腸桿菌中進行原核表達。
原核表達載體的構建,以及轉化大腸桿菌根據人hHNRPD-iso的全長編碼序列(SEQ ID NO.6),設計擴增出完整編碼閱讀框的引物(分別對應于編碼序列5’和3’端的約20個以上核苷酸),并在正反引物上分別引入限制性內切酶位點(這根據選用的pGEX-2T載體而定),以便構建表達載體。以實施例1中獲得的擴增產物為模板,經PCR擴增后,將人hHNRPD-iso基因在保證閱讀框正確的前提下克隆至pGEX-2T載體(Pharmacia,Piscataway,NJ)。鑒定好的表達載體利用CaCl2方法轉入大腸桿菌DH5α,篩選鑒定得到含有pGEX-2T-hHNRPD-iso表達載體的工程菌DH5α-pGEX-2T-hHNRPD-iso。
表達GST-hHNRPD-iso重組蛋白的工程菌的分離鑒定挑取單菌落的DH5α-pGEX-2T-hHNRPD-iso工程菌于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)過夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時,至OD600達0.5后,加入IPTG至終濃度1mmol/L繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時。取培養(yǎng)時間不同的1ml菌液離心,在細菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預期分子量大小的蛋白量隨IPTG誘導時間增加而增加的菌株即為表達GST-hHNRPD-iso融合蛋白的工程菌。
GST-hHNRPD-iso融合蛋白的提取純化按上述方法誘導表達GST-hHNRPD-iso融合表達蛋白的工程菌DH5α-pGEX-2T-hHNRPD-iso。誘導后的細菌離心沉淀,按每400ml菌加入20ml PBS重懸細菌,超聲破碎細菌。破菌完全的超聲液按每毫升加入20微升的量加入PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結合30分鐘,10000rpm離心10分鐘沉淀結合了GST-hHNRPD-iso的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl PBS的量清洗兩次,而后按每毫升超聲液所得沉淀加入10μl還原型谷胱苷肽洗脫液,室溫置10分鐘,10000rpm離心10分鐘,上清即為洗脫的融合蛋白。重復洗脫兩次。洗脫的上清保存于-80℃,并進行SDS-PAGE電泳,檢測純化效果。在12kDa處的蛋白質條帶即為人hHNRPD-iso蛋白。
實施例6人hHNRPD-iso蛋白或多肽在昆蟲細胞中進行真核細胞表達1.人hHNRPD-iso桿狀病毒表達載體的構建及轉染Sf9昆蟲細胞株根據人hHNRPD-iso的全長編碼序列(SEQ ID NO.6),設計擴增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內切酶位點(這可視選用的載體而定),以便構建表達載體。以實施例1中獲得的擴增產物為模板,經PCR擴增后,將人hHNRPD-iso cDNA在保證閱讀框架的前提下克隆至pVL1392載體(Invitrogen,Carlsbad,CA)。鑒定好的表達載體3μg,野生型線性桿狀病毒DNA(BaculoGoldTMACMNPV DNA,Pharmingen,San Diego,CA)1μg和Lipofection(Gibco-BRL,NY)25μl,加入1ml無血清的昆蟲培養(yǎng)基中,振蕩15秒混勻,室溫孵育15分鐘備用。取1ml(2×106)Sf9昆蟲細胞懸液于60mm組織培養(yǎng)板中,貼壁1小時后換轉染培養(yǎng)基,室溫孵育15分鐘后棄培養(yǎng)基,加入前面制備好的DNA載體轉染混合物,Parafilm密封培養(yǎng)板,于室溫27℃振搖培養(yǎng)4小時,而后換完全培養(yǎng)基培養(yǎng)3天,收集上清備用。
2.轉入重組表達載體的昆蟲細胞株的篩選鑒定轉染3天后的昆蟲細胞用新鮮培養(yǎng)基制成細胞懸液(2×106/1ml),取1ml細胞懸液置于60mm組織培養(yǎng)皿中,加入3ml培養(yǎng)基,100μl收集的培養(yǎng)上清,貼壁1小時,棄2ml培養(yǎng)基,繼續(xù)室溫培養(yǎng)1小時,棄去所有的培養(yǎng)基,加入預熱的含20 μl4%X-gal的3ml半固體培養(yǎng)基,培養(yǎng)5-7天后挑取白色細胞克隆于96孔培養(yǎng)板中培養(yǎng)3-5天,而后吸取上清感染Sf9昆蟲細胞。
收集感染的細胞進行Western鑒定。將細胞裂解后進行SDS-PAGE電泳,電泳后的膠于Pharmacia的Multiphor Ⅱ半干電轉移儀中將蛋白質轉印到硝酸纖維膜上,將硝酸纖維膜置于封閉液中封閉1小時,而后于抗人hHNRPD-iso的抗體溶液中封閉1小時,TBS液振搖清洗5分鐘共2次,而后將膜置于生物素標記的抗人hHNRPD-iso一抗的第二抗體溶液中振搖1小時,TBS清洗,加入親和素-堿性磷酸酶復合物反應30分鐘,TBS清洗2次,加入新鮮配制的顯色液顯色觀察蛋白條帶。
挑取高表達人hHNRPD-iso的Sf9細胞克隆。
3.人hHNRPD-iso蛋白的提取純化用高表達人hHNRPD-iso的Sf9細胞克隆的上清大量感染Sf9細胞,感染48小時后收集細胞,PBS洗滌。每2×108細胞加入20ml細胞裂解液(0.5%Triton X-100,20mM Na3PO4(磷酸鈉,pH7.8),500mM NaCl,1mM Na3VO4(釩酸鈉),1mM Pefabloc,1μg/ml胃蛋白酶抑制劑,亮抑蛋白酶肽和抑蛋白酶肽)破細胞,12000×g離心20min去除細胞碎片,上清按每2×108的細胞加入2ml NTA-瓊脂糖(Qiagen,Germany),4℃吸附1小時。而后用含100nM咪唑的His緩沖液洗滌兩次,用含20mM N,N’-二哌嗪,500mM NaCl,300mM咪唑的緩沖液洗脫以得到純化的蛋白。洗脫液保存于4℃,并進行SDS-PAGE電泳檢測提取的人hHNRPD-iso蛋白的純度。在12kDa處的蛋白質條帶即為人hHNRPD-iso蛋白。
2.按《組織培養(yǎng)和分子細胞學技術》(同上),第371頁中的方法,制備飼養(yǎng)細胞。
3.按《組織培養(yǎng)和分子細胞學技術》(同上),第213頁中的方法,進行細胞融合。
4.抗體的檢測在細胞融合10-15天后,需逐孔進行檢查,一旦發(fā)現旺盛的雜交細胞集落生長,就應用人hHNRPD-iso蛋白做抗體活性的初步篩選,常用的方法有免疫熒光試驗、發(fā)射免疫試驗(RIA)、酶聯免疫吸附試驗(ELISA)。檢查出抗體活性的孔后,立刻進行克隆培養(yǎng),并分離出抗體。
本發(fā)明涉及的序列及記號分列如下(1)SEQ ID NO.1的信息(ⅰ)序列特征(A)長度50bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅲ)序列描述SEQ ID NO.1GAGAGAGAGAGAGAGAGAGAACTAGTCTCGAGTTTTTTTTTTTTTTTTTT 50(2)SEQ ID NO.2的信息(ⅰ)序列特征(A)長度13bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅲ)序列描述SEQ ID NO.2AATTCGGCAC GA G 13(3)SEQ ID NO.3的信息(ⅰ)序列特征(A)長度9bp(B)類型核苷酸(C)鏈性單鏈
(D)拓撲結構線性(ⅱ)分子類型寡核苷酸(ⅲ)序列描述SEQ ID NO.3GCCGTGCTC 9(4)SEQ ID NO.4的信息(ⅰ).序列特征(A)長度18bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ).分子類型寡核苷酸(ⅲ).序列描述SEQ ID NO.4CGCGCCATTGTGTTGGTA 18(5)SEQ ID NO.5的信息(ⅰ).序列特征(A)長度21bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ).分子類型寡核苷酸(ⅲ).序列描述SEQ ID NO.5AGGCTGCAGTCTCAAAAATCT 21(6)SEQ ID NO.6的信息(ⅰ)序列特征(A)長度406bp(B)類型核苷酸(C)鏈性單鏈(D)拓撲結構線性(ⅱ)分子類型核苷酸(ⅲ)序列描述SEQ ID NO.61 CGCGCCATTG TGTTGGTACC CGGGAATTCG GCCATTATGG CCGGGGAAGG51 TGCTTTAGTC TGAAGATGGC GGCCTCAGCA GCGCGAGGTG CTGCGGCGCT101 GCGTAGAAGT ATCAATCAGC CGGTTGCTTT TGTGAGAAGA ATTCCTTGGA151 CTGCGGCGTC GAGTCAGCTG AAAGAACACT TTGCACAGTT CGGCCATGTC201 AGAAGGTGCA TTTTACCTTT TGACAAGGAG ACTGGCTTTC ACAGAGGTTT251 GGGTTGGGTT CAGTTTTCTT CAGAAGAAGG ACTTCGGAAT GCACTACAAC301 AGGAAAATCA TATTATAGAT GGAGTAAAGG TCCAGGTTCA CACTAGAAGG351 CCAAAACTTC CGCAAACATC TGATGATGAA AAGAAAGATT TTTGAGACTG401 CAGCCT(7)SEQ ID NO.7的信息(ⅰ)序列特征(A)長度109氨基酸(B)類型氨基酸(C)鏈性單鏈(D)拓撲結構線性(ⅰ)分子類型多肽(ⅲ)序列描述SEQ ID NO.71 MAASAARGAA ALRRSINQPV AFVRRIPWTA ASSQLKEHFA QFGHVRRCIL51 PFDKETGFHR GLGWVQFSSE EGLRNALQQE NHIIDGVKVQ VHTRRPKLPQ101 TSDDEKKDF
權利要求
1.一種分離出的DNA分子,其特征在于,它包括編碼具有人hHNRPD-iso蛋白質活性的多肽的核苷酸序列,而且所述的核苷酸序列與SEQ ID NO.6中從核苷酸第66-395位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.6中從核苷酸第66-395位的核苷酸序列雜交。
2.如權利要求1所述的DNA分子,其特征在于,所述的序列編碼具有SEQ ID NO.7所示的氨基酸序列的多肽。
3.如權利要求1所述的DNA分子,其特征在于,該序列具有SEQ ID NO.6中從核苷酸第66-395位的核苷酸序列。
4.一種分離出的人hHNRPD-iso蛋白多肽,其特征在于,它包括具有SEQ ID NO.7氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。
5.如權利要求4所述的多肽,其特征在于,該多肽是具有SEQ ID NO.7序列的多肽。
6.一種載體,其特征在于,它包含權利要求1所述的DNA。
7.一種用權利要求6所述載體轉化的宿主細胞,其特征在于它包括原核細胞和真核細胞。
8.一種產生具有人hHNRPD-iso蛋白質活性的多肽的方法,特征在于其步驟如下(1)將編碼具有人hHNRPD-iso蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成人hHNRPD-iso蛋白表達載體,所述的核苷酸序列與SEQ ID NO.6中從核苷酸第66-395位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達載體轉入宿主細胞,形成人hHNRPD-iso蛋白的重組細胞;(3)在適合表達人hHNRPD-iso蛋白多肽的條件下,培養(yǎng)步驟(2)中的重組細胞;(4)分離出具有人hHNRPD-iso蛋白活性的多肽。
9.一種能與權利要求7所述的人hHNRPD-iso蛋白多肽特異性結合的抗體,其特征在于它包括多克隆抗體和單克隆抗體。
10.一種核酸分子,其特征在于,它包含權利要求1所述的DNA分子中8-100個連續(xù)核苷酸。
11.一種用于檢測樣品中是否存在人hHNRPD-iso核苷酸序列的方法,其特征在于它包括用權利要求10所述探針與樣品進行雜交,然后檢測探針是否發(fā)生了結合,該樣品是PCR擴增后的產物,其中PCR擴增引物對應于人hHNRPD-iso核苷酸編碼序列,并可位于該編碼序列的兩側或中間,引物長度為15~50個核苷酸。
全文摘要
本發(fā)明提供了一種在人體樹突狀細胞中表達的新的人hHNRPD-iso蛋白及其編碼序列,本發(fā)明還提供了該蛋白和核酸序列的制備方法,以及在樣品中檢測人hHNRPD-iso核酸序列和多肽的方法。
文檔編號C12N15/12GK1289847SQ00125388
公開日2001年4月4日 申請日期2000年9月26日 優(yōu)先權日2000年9月26日
發(fā)明者李能干, 許相儒, 肖華勝, 楊義生, 陳竺, 韓澤廣 申請人:國家人類基因組南方研究中心