專利名稱:形成粘蛋白糖鏈的肽序列和修飾蛋白質(zhì)使與粘蛋白糖鏈相連的方法
背景技術(shù):
發(fā)明領(lǐng)域本發(fā)明涉及可將粘蛋白型糖鏈導入蛋白質(zhì)或肽的氨基酸序列,還涉及利用該序列將粘蛋白型糖鏈導入蛋白質(zhì)或肽的技術(shù)。
背景技術(shù):
在動物,植物和昆蟲等生物中發(fā)現(xiàn)的許多蛋白質(zhì)是糖蛋白。最近幾年已揭示了糖蛋白鏈的各種作用。例如,已知糖鏈在細胞粘著和細胞識別中具有作為配體的生理作用以及具有增強蛋白質(zhì)的穩(wěn)定性和/可溶性的物理化學作用。另外,盡管諸如促紅細胞生成素和干擾素的糖蛋白最近幾年已制成藥品,人們已認識到糖蛋白上糖鏈的結(jié)構(gòu)對藥品在體內(nèi)的藥物動力學和穩(wěn)定性有極大的影向。盡管已充分認識到糖蛋白的糖鏈的意義,但目前對于以簡單的方式將糖鏈導入蛋白質(zhì)的特定位置尚未形成確定的技術(shù)。
對于一些原來是糖蛋白的藥品,典型地用大腸桿菌成批生產(chǎn)僅是它們的蛋白質(zhì)部分。當這種蛋白質(zhì)作為藥品施用時,由于缺少糖鏈該蛋白質(zhì)的體內(nèi)動力學,穩(wěn)定性和抗原性有時與天然糖蛋白不同。從而這些差異可能產(chǎn)生包括大劑量損害和副作用的問題。
即使用動物的培養(yǎng)細胞生產(chǎn)的蛋白質(zhì),雖然可以產(chǎn)生具有糖鏈的糖蛋白,但它也可能不同于天然糖蛋白。因此,這些蛋白質(zhì)也可能遺留有上述問題。
使用將糖鏈導入蛋白質(zhì)分子特定位置的技術(shù)可解決上述問題及其它有關(guān)問題。而且,用這一技術(shù)可將糖鏈的各種功能特征導入蛋白質(zhì)。此外,該技術(shù)在制藥工業(yè)和其它工業(yè)上顯示出廣泛的各種用途。
已知糖鏈結(jié)合蛋白質(zhì)的兩種主要模式天冬酰胺結(jié)合型糖鏈和粘蛋白型糖鏈。
根據(jù)此前的各種報道,天冬酰胺結(jié)合型糖鏈在與糖鏈的結(jié)合位點上顯示有共有序列-Asn-Xaa-Ser-/Thr-(Xaa≠Pro)。然而,也了解到在蛋白質(zhì)上并非所有具有共有序列的位點都有一個天冬酰胺結(jié)合型糖鏈。另一方面,對于粘蛋白型糖鏈,有報道指出靠近結(jié)合位點經(jīng)常觀察到諸如Ser,Thr和Pro的氨基酸。然而尚無報道描述過結(jié)合位點序列的完全特征。
天冬酰胺結(jié)合型糖鏈在糖鏈形成上不同于粘蛋白型糖鏈。具體地說,天冬酰胺結(jié)合型糖鏈與蛋白質(zhì)的翻譯同時發(fā)生,然后接著進行糖蛋白的折疊。而粘蛋白型糖鏈則在糖蛋白的翻譯和折疊后導入。另外,對于天冬酰胺結(jié)合型糖鏈,已報道具有14個單糖的大型糖鏈一次性地結(jié)合到蛋白質(zhì)分子上,此糖鏈被稱為carnexine的分子伴侶識別并調(diào)控而形成正確的蛋白質(zhì)結(jié)構(gòu)。然而到現(xiàn)在為止對于粘蛋白型糖鏈這樣的分子伴侶還未發(fā)現(xiàn)。
因此,如前所述,雖然天冬酰胺結(jié)合型糖鏈的糖鏈結(jié)合部位已經(jīng)明確,但找到導入糖鏈的確切位點卻并非容易。另外,即使將糖鏈導入蛋白質(zhì)后,也不能保證該蛋白質(zhì)顯示出與模式蛋白相同的構(gòu)象和活性。
另一方面,粘蛋白類型糖鏈,對于蛋白質(zhì)分子結(jié)構(gòu)的影響很小,因為糖鏈是在蛋白質(zhì)分子折疊后導入的。因此,將粘蛋白型糖鏈導入蛋白質(zhì)的技術(shù)對于提供具有功能特征的糖鏈的蛋白質(zhì)而保持該蛋白質(zhì)的結(jié)構(gòu)和活性不變是非常有前途的。然而,尚未發(fā)現(xiàn)對粘蛋白類型糖鏈結(jié)合位點具有高度特異性的結(jié)構(gòu)特征。因此,到目前為止,將糖鏈特異性地導入蛋白質(zhì)分子的某一部位是不可能的。
正如下文所要描述的,了解了肽序列結(jié)合糖鏈的一些特征方面,同時還了解了用于將GalNAc(N-乙酰半乳糖胺)作為粘蛋白型糖鏈導入蛋白質(zhì)中的一種酶。該酶稱為UDP-GalNAc多肽α1,O-GalNAc轉(zhuǎn)移酶(O-GalNAc T)。另外,在奶牛初乳中發(fā)現(xiàn)了O-GalNAc T,它催化如下的反應(yīng),其中GalNAc被轉(zhuǎn)移到蛋白質(zhì)或肽的絲氨酸或蘇氨酸殘基上UDP-GalNAc+蛋白質(zhì)→蛋白質(zhì)-GalNAc+UDP其中UDP代表尿核苷5′-二磷酸,GalNAc代表N-乙酰半乳糖胺。
這種酶在各種物質(zhì)中均有發(fā)現(xiàn)。例如,發(fā)現(xiàn)它存在于奶牛初乳中[A.Elhamer et al.J,Biol.Chem.,Vol.261,pp.5249-5255,(1986)],大鼠腹水肝癌細胞AH99中[M.Sagiura et al.J.Biol.Chem.,Vol.257,PP.9,501-9,507(1982)],豬下頜腺中[Y.Wang et al.J.Biol.Chem.,Vol.267,pp.12709-12716],豬氣管中[J.M.Cottrell et al.Biochem.J.,Vol,283,pp.299-305(1991)]。另外,已報道成功地進行了該酶的基因克隆[F.L.Homa et al.J.Biol.Chem.,Vol.268,pp.12609-12616(1982)]。還報道了借助于遺傳工程技術(shù)在昆蟲細胞和動物細胞中獲得了大量的該酶[F.L.Homa et al.,Protein Expr.Purif.,Vol.6,pp.141-148(1995)和S.Wragg et al.,J.Biol.Chem.,Vol.270,pp.16947-1695411995)]。
盡管已報道了有關(guān)結(jié)合粘蛋白類型糖鏈的肽序列特征方面的一些研究,但幾乎已知的粘蛋白型糖鏈的結(jié)合部位周圍的氨基酸序列都是用統(tǒng)計學處理的。只是很少一部分使用O-GalNAc T進行了實際反應(yīng)的分析。
I.B.H.Wilson等比較了結(jié)合粘蛋白型糖鏈的位點和那些不結(jié)合該糖鏈的位點。由此他們報道了在每個結(jié)合位點-3和+3之間的位置上經(jīng)常發(fā)現(xiàn)脯氨酸,絲氨酚和蘇氨酸。丙氨酸也時常出現(xiàn)。(下文對于肽序列中氨基酸的位置、轉(zhuǎn)移糖鏈的位置稱為位置0,靠近位置0側(cè)依次接近N端的位置分別按順序稱為位置-1,-2和-3,而靠近位置0并依次接近C端的位置分別按順序稱為位置+1,+2和+3)。另外,在位置-1和+3處發(fā)現(xiàn)脯氨酸的頻率相當高。然而,他們的結(jié)論是難以明確粘蛋白型糖鏈的結(jié)合位點的特征,因為他們發(fā)現(xiàn)這些序列的特征并不只在結(jié)合位點處出現(xiàn)。另外,他們也沒有對肽進行實際的實驗以證實他們的統(tǒng)計結(jié)果[Biochme.J.,Vol.275,pp.529-534(1991)]。
A.A Gooley等用Edman降解法分析了稱為CD8α的大鼠粘蛋白型糖蛋白的糖鏈結(jié)合位點。因此,他們建議Xaa-Pro-Xaa-Xaa(其中至少一個Xaa代表結(jié)合粘蛋白型糖鏈的蘇氨酸)基序(motif)可用作結(jié)合粘蛋的型糖鏈的共有序列。然而,該基序(motif)對于廣泛應(yīng)用是不可行的,因為它不能充分解釋其它粘蛋白型糖蛋白的糖鏈結(jié)合位點[Biochem.Biophys.Res.Commun.,Vol.178,pp.1194-1201(1991)]。后來,他們又以相同的方式分析了人血型糖蛋白A[Glycobiology,Vol.4,pp.413-417(1994)]和牛K-酪蛋白[Glycobiology,Vol.4,PP.837-844(1994)](它們也是粘蛋白型糖蛋白)。并以下面4種基序為前面方法的擴展。下面Thr(GalNAc)代表結(jié)合粘蛋白型糖鏈的蘇氨酸殘基。1.Xaa-Pro-Xaa-Xaa其中至少一個Xaa代表Thr(GalNAc),2.Thr(GalNAc)-Xaa-Xaa-Xaa
其中至少一個Xaa代表蘇氨酸3.Xaa-Xaa-Thr(GalNAc)-Xaa其中至少一個Xaa代表賴氨酸或精氨酸,4.Ser(GalNAc)-Xaa-Xaa-Xaa其中至少一個Xaa代表絲氨酸。
然而,這些擴展的基序(motif)也不能滿意地限定其它粘蛋白型糖蛋白的糖鏈結(jié)合位點。而且,上述基序(motif)可能覆蓋了無糖鏈的肽序列,因此對Xaa必須定義一些限制。另外,他們沒有對肽實際運用這些基序來證實該基序。
J.D.Young等報道了使用豬下頜腺制作的O-GalNAc T合成肽作底物,可體外測量GalNAc受體的活性[Biochemistry,Vol.18,pp.4,444-4,448(1979)]。他們的報道指出來自牛髓磷脂堿性蛋白質(zhì)的TPPP,RTPPP,PRTPPP,TPRTPPP和VTRTPPP具有GalNAc的受體活性VTRTPPP在它們中的活性最大。然而,這些序列作為具有GalNAc受體活性的肽序列一般特征是不可行的,因為正研究的類似肽是少的。另外,因為所有位置+1到+3都是脯氨酸,可以推斷,為了將粘蛋白型糖鏈導入蛋白質(zhì)或肽,其可用性將受到很大限制。
B.O′Connell等對結(jié)合粘蛋白型糖鏈進行了統(tǒng)計學分析并推測在-6,-1和+3位的氨基酸是重要的。事實上他們經(jīng)過修飾具有12個氨基酸殘基PHMAQVTVGPGL(位置-6到+5)(在人Von Wiuebrand因子糖鏈結(jié)合位點和附近發(fā)現(xiàn))的肽合成了該肽,經(jīng)過將-6,-1和+3位的氨基酸替換成3種不同的氨基酸(精氨酸,谷氨酸,脯氨酸或異亮氨酸)以便證實他們對GalNAc受體活性的影響然而,他們未能揭示出為結(jié)合粘蛋白型糖鏈所必需的肽序列的特征,只是得出了取代任一位置的氨基酸,都明顯影響GalNAc受體活性的結(jié)論。[Biochim.Biophys.Res.Commun.,Vol.180,pp.1024-1031(1991)]后來,B.O′Connell等經(jīng)過用5種氨基酸(精氨酸,谷氨酸,脯氨酸,異亮氨酸和丙氨酸)取代相同肽的-6位到+5位氨基酸制備了該肽并研究了其對GalNAc受體活性的影響。結(jié)果,他們報道了以不同氨基酸取代+3,-3和-2位的氨基酸或用帶電氨基酸取代-1位氨基酸時活性受到有害影響,而其它位置對GalNAc受體活性影響很小。這些結(jié)果與以前的報道不一致。這表明統(tǒng)計分析對粘蛋白型糖鏈的實際結(jié)合反應(yīng)性用處不大。他們還通過氨基酸的替換來分析使反應(yīng)低下的位置。然而,他們未能分析出什么氨基酸最適合。因為他們僅使用了有限的氨基酸。因此,對于與蛋白型糖鏈相結(jié)合的肽序列的一般特征他們還不能得出結(jié)論[J,Biol.Chem.,Vol.267,pp.25,010-25,018(1992)]。
AKe P.Elhammer等從統(tǒng)計學上分析了肽的-4位到+4,并建立了支持一套理論的規(guī)則系統(tǒng),該理論認為只要結(jié)合位點和其鄰近位置包含絲氨酸,蘇氨酸,脯氨酸,丙氨酸和/或甘氨酸,那么肽序列對于結(jié)合粘蛋白的型糖鏈的位置并不重要。另外,他們建議PPASTSAPG作為導入粘蛋白型糖鏈的可能的理想肽序列。與包括RTPPP的其它四種肽序列相比,他們建議的肽具有最高程度的GalNAc受體活性。然而,由于比較僅局限于4類含相同序列的肽序列,因此對于建議的序列是否真正理想還存在疑問。另外,表明GalNAc不能導入具有大量位點的蛋白質(zhì),其中該位點根據(jù)他們的規(guī)則系統(tǒng)是結(jié)合位點。因此,建議的序列不可能用于將粘蛋白型糖鏈導入各種蛋白質(zhì)中[J.Biol.Chem.,Vol.268,pp.10029-10038(1993)]。
糖蛋白“粘蛋白”(從它產(chǎn)生了粘蛋白型糖鏈一詞)包含具有20到30個殘基的氨基酸串聯(lián)重復的區(qū)域。還已知大量粘蛋白型糖鏈結(jié)合在該區(qū)域。I.Nishimori等制備了與人粘蛋白MUCI重復區(qū)相似的各種肽并使用從人乳腺癌細胞MCF7提取的O-GalNAc的粗制酶溶液研究了GalNAc受體活性[J.Biol.Chem.,Vol.269,pp.16123-16130(1994)]。他們報道了其研究結(jié)果為GalNAc受體所必需的肽區(qū)域包括-1位到+4位,而且在+3位的脯氨酸可加速GalNAc的轉(zhuǎn)移。另一方面,他們強調(diào)位于+3位的脯氨酸不能單獨提供GalNAc受體活性,因為在PDTRPAPGS,PDTRPPAGS和PDTRAPPGS中觀察不到GalNAc的轉(zhuǎn)移。盡管他們假定位于-1位和+1位的天冬氨酸和精氨酸是阻止轉(zhuǎn)移的主要因素,但他們沒有進行任何實驗來證實其理論。因此,從他們的結(jié)論難以完整地認識提供GalNAc受體活性的肽序列的特征。
關(guān)于用遺傳工程經(jīng)過將用于結(jié)合粘蛋白型糖鏈的序列導入蛋白質(zhì)來制備粘蛋白型糖蛋白的例子,E.Gravenhorst等報道了他們將粘蛋白型糖鏈導入白細胞介素2(IL-2)[Eur.J,Biochem,Vol.215,pp.189-197(1993)]。開始,他們試圖將GGKAPTSSSTKGG,導入IL-2第80和第81個氨基酸之間并在昆蟲細胞中表達該序列,其中GGKAPTSSSTKGG包括在IL-2中結(jié)合粘蛋白型糖鏈位點周圍發(fā)現(xiàn)的序列,但他們失敗了。隨后,他們使用GGKAPTPPPKGG,成功地導入了糖鏈,其中上面序列的全部絲氨酸殘基用脯氨酸殘基替換,然而,該序列可能是作為試錯法的結(jié)果偶然獲得的。另外,考慮到該肽序列較長且含12個殘基之多,其中4個是能極大地影響蛋白質(zhì)構(gòu)象的脯氨酸殘基這一事實,該肽序列可含有廣泛的可用性。
如上所述,根據(jù)選擇的群體和用于涉及統(tǒng)計分析的統(tǒng)計處理的技術(shù)結(jié)合粘蛋白型糖鏈的肽序列特征可有很大的變化。這可能是因為確切了解天然蛋白質(zhì)中的粘蛋白型糖鏈結(jié)合位點在技術(shù)上非常困難,因此迄今鑒定的糖鏈結(jié)合位點數(shù)目十分有限。在很多情況下,對某個肽序獲得的特征可能不同于在具有GalNAc受體活性的天然蛋白質(zhì)中發(fā)現(xiàn)的序列,因而很難正確在掌握肽序列的特征。
一方面,已知關(guān)于合成肽GalNAc受體活性的少量報道。迄今已分析的肽類型數(shù)有限,僅僅是因為肽合成本身較困難。已研究的大多數(shù)肽序列是具有10個或更多殘基的相當長的序列,可適用于結(jié)合糖鏈的短肽序列特征有待于揭示。
因此,根據(jù)以前描述的已報道的肽序列特征有目的地將粘蛋白型糖鏈導入蛋白質(zhì)非常困難。而且,由于與粘蛋白型糖鏈相結(jié)合的肽序列比較長,簡單地輕微地改變蛋白質(zhì)或肽則不能導入粘蛋白型糖鏈。因此,利用該肽序列的范圍非常有限。
同時化學合成結(jié)合糖鏈的蛋白質(zhì)也許是可能的。然而,正如觀察天然粘蛋白型糖蛋白可以了解的,在蛋白質(zhì)的大量絲氨酸或蘇氨酸殘基中使糖鏈僅結(jié)合特定的殘基。因此借助于有機合成的任何已知技術(shù)選擇性并有效地將糖鏈導入蛋白質(zhì)或肽大量絲氨酸和蘇氨酸殘基中的特定位點是極其困難的。
發(fā)明概述由于對作為適于結(jié)合粘蛋白型糖鏈位點的肽序列的研究努力,現(xiàn)在我們發(fā)現(xiàn)了可有效地將粘蛋白型糖鏈導入其中的短肽序列,本發(fā)明以這一發(fā)現(xiàn)為基礎(chǔ)。
因此,本發(fā)明的一個目的是提供作為可將粘蛋白型糖鏈導入其中的結(jié)合位點的肽序列。
本發(fā)明的另一目的是提供可借助于O-GalNAc T的催化活性將粘蛋白型糖鏈導入其中的肽序列。
本發(fā)明還有一個目的是提供能經(jīng)過最小程度修飾蛋白質(zhì)而不損傷其功能特征將粘蛋白型糖鏈導入蛋白質(zhì)的技術(shù)。
本發(fā)明的蛋白質(zhì)或肽包含下面通式(I)代表的序列X(-1)-X(O)-X(1)-X(2)-X(3)(1)其中X(-1)和X(2)代表獨立的任何氨基酸,X(O)代表蘇氨酸(T)或絲氨酸(S),X(1)和(3)代表獨立的任何氨基酸,其前提是X(1)和X(3)中至少一個代表脯氨酸(P)。
上面通式代表的蛋白質(zhì)或肽可作為UDP-GalNAc多肽α1,O-GalNAc轉(zhuǎn)移酶(O-GalNAc T)的底物發(fā)揮功能并且能用于將GalNAc導入蛋白質(zhì)或肽。
根據(jù)本發(fā)明,還提供了將GalNAc導入蛋白質(zhì)或肽的方法,包括提供包括通式(I)代表的序列的蛋白質(zhì)或肽且在UDP-GalNAc多肽α1,O-GalNAc轉(zhuǎn)移酶(O-GalNAc T)存在的條件下將作為底物的該蛋白質(zhì)或肽鏈與UDP-GalNAc(其中UDP代表尿核苷5′-二磷酸,GalNAc代表N-乙酰半乳糖胺)反應(yīng)。
根據(jù)本發(fā)明,還提供了制備結(jié)合粘蛋白型糖鏈的糖蛋白的方法,包含提供編碼含通式(I)代表的序列的蛋白質(zhì)或肽的DNA并在真核細胞中分泌表達該DNA的步驟。
附圖簡述
圖1顯示了各種肽的GalNAc受體活性。
圖2顯示了在GalNAc轉(zhuǎn)移中哪一個氨基酸,T還是S適合于作為結(jié)合糖鏈的位點。
圖3顯示了具有單個脯氨酸殘基的各種肽的GalNAc受體活性。
圖4顯示了具有2個脯氨酸殘基的各種肽的GalNAc受體活性。
圖5顯示了具有3個脯氨酸殘基的各種肽的GalNAc受體活性。
圖6顯示了具有不同數(shù)目的T末端氨基酸殘基的各種肽之GalNAc受體活性。
圖7顯示了各種肽的GalNAc受體活性,其中X(2)用各種氨基酸取代。
圖8顯示了各種肽的GalNAc受體活性,其中X(2)用L-或D-旋光異構(gòu)體取代。
圖9顯示了各種肽的GalNAc受體活性,其中X(-1)用各種氨基酸取代。
圖10顯示了各種肽的GalNAc受體活性,其中在+4位加入各種氨基酸。
圖11顯示質(zhì)粒PGEX-3X Muc C1的構(gòu)造,該質(zhì)粒用于生產(chǎn)包括在蛋白質(zhì)GST C-末端一側(cè)具有GalNAc受體活性之肽序列的蛋白質(zhì)GST-3X Muc C1。
圖12顯示了將GalNAc轉(zhuǎn)移給包括在蛋白質(zhì)GST C末端一側(cè)具有GalNAc受體活性的肽序列的GST-3X Muc C1和不具有該肽序列的蛋白質(zhì)對照的量。
圖13表示表達質(zhì)粒PGEY-3X2A Muc N1的構(gòu)造,該質(zhì)粒用于將具有GalNAc受體活性之肽序列的蛋白質(zhì)GST-32A Muc N1的生產(chǎn)。
圖14表示表達質(zhì)粒PGEY-3X2A Muc N1的構(gòu)造,該質(zhì)粒用于生產(chǎn)具有在蛋白質(zhì)GST N末端一側(cè)有GalNAc受體活性之肽序列的蛋白質(zhì)GST-3X2A Muc N1。
圖15顯示轉(zhuǎn)移給包括在蛋白質(zhì)GST N端側(cè)具有GalNAc受體活性的肽序列的GST-3X2A及不具有該肽序列的對照蛋白質(zhì)的GalNAc的轉(zhuǎn)移量。
圖16顯示表示質(zhì)粒PGEY-3XS的構(gòu)建,該質(zhì)粒用于生產(chǎn)包括在蛋白質(zhì)GST C端一側(cè)導入具有GalNAc受體活性的肽序列的GST變異體。
圖17A,17B和17C顯示了分別用于表達蛋白質(zhì)GST-3X MucC2,GST-3X Muc C3和GST-3X Muc C4的質(zhì)粒PGEX-3XS MucC2,PGEX-3XS Muc C3和PGEX-3XS Muc C4的結(jié)構(gòu)。
圖18顯示了轉(zhuǎn)移給蛋白質(zhì)GST-3X,GST-3X Muc C1,GST-3X Muc C2,GST-3X Muc C3,GST-3X Muc C4和GST-3X2A Muc N1的GalNAc的轉(zhuǎn)移量。
圖19A和19B顯示了用于在COS7細胞中分泌表達EGST-3X和EGST-3X Muc C1的質(zhì)粒PSEGST-3X和PSEGST-3X Muc C1的結(jié)構(gòu)。
圖20顯示了用糖苷酶處理在COS7細胞中分泌表達獲得的蛋白質(zhì)EGST-3X和EGST-3X Muc C1的分析結(jié)果。
圖21顯示了在COS7細胞中分泌表達獲得的蛋白質(zhì)EGST-3X和EGST-3X Muc C1的植物凝血素印跡分析結(jié)果。
圖22顯示了分別用于生產(chǎn)蛋白質(zhì)EGST-3X,EGST-3X MucC1,EGST-3X Muc C2,EGST-3X Muc C3,EGST-3X Muc C4和EGST-3X Muc C5的質(zhì)粒PEEGST-3X,PEEGST-3X MucC1,PEEGST-3X Muc C2和PEEGST-3X Muc C3,PEEGST-3X Muc C4和PEEGST-3X Muc C5的結(jié)構(gòu)。
圖23顯示了經(jīng)過在COS7細胞中分泌表達的蛋白質(zhì)EGST-3X,EGST-3X Muc C1,EGST-3X Muc C2,EGST-3X Muc C3,EGST-3X Muc C4和EGST-3X Muc C5的SDS-PAGE分析結(jié)果。
發(fā)明詳述本文前面加有“+”或“-”的阿拉伯數(shù)字代表肽中氨基酸的位置。糖鏈轉(zhuǎn)移的氨基酸位置稱為位置O,由此N端側(cè)氨基酸的位置和C端側(cè)氨基酸的位置依次稱為位置-1,-2,和-3及位置+1,+2和+3。
本文用已知的如下所示的各自的單字母代碼表示氨基酸。
G甘氨酸A丙氨酸V纈氨酸L亮氨酸I異亮氨酸S絲氨酸T蘇氨酸D天冬氨酸E谷氨酸N天冬酰胺Q谷氨酰胺K賴氨酸R精氨酸C半胱氨酸M甲硫氨酸
F苯丙氨酸Y酪氨酸W色氨酸H組氨酸P脯氨酸本發(fā)明首先,提供了以式(I)代表的肽。具有以式(I)代表的序列的肽作為酶O-GalNAc T的底物有效發(fā)揮功能。換句話說,它顯示出具有很高的GalNAc受體活性。因此,在O-GalNAc T存在的條件下使肽與UDP-GalNAc反應(yīng),可有效地將GalNAc導入該肽中。此時的GalNAc被導入X(O)位的T或S中。
O-GalNAc T存在的條件下,使肽與UDP-GalNAc進行反應(yīng)也能有效地將GalNAc導入蛋白質(zhì)中。其中該蛋白質(zhì)包括式(I)提供的肽序列。因此,根據(jù)本發(fā)明,還提供了包括由式(I)代表的肽序列的蛋白質(zhì)。
經(jīng)過在真核細胞中分泌表達包括由式(I)代表的肽序列之蛋白質(zhì),可有效地生產(chǎn)結(jié)合粘蛋白型糖鏈的糖蛋白。
根據(jù)本發(fā)明優(yōu)選的實施方案,提供了具有高度GalNAc受體活性的式(I)的蛋白質(zhì)或肽,其中X(1)和(3)代表P或A和它們中的任何一個是P。
根據(jù)本發(fā)明的另一優(yōu)選的實施方案,提供了具有高度GalNAc受體活性的由下式(Ia)代表的序列X(-1)-X(0)-P-X(2)-P(Ia)其中,X(-1),X(0)和X(2)定義如上。
在該實施方案中,X(-1)代表選自Y,A,W,S,G,V,F(xiàn),T和I的氨基酸,X(2)優(yōu)選代表選自A,P,C,K,R,H,S,M,T,Q,V,I,L,和E的氨基酸。
根據(jù)本發(fā)明的另一優(yōu)選的實施方案,提供了以下式(Ib)代表的具有高度GalNAc受體活性的序列X(-1)-X(0)-X(1)-X(2)-P(Ib)其中X(-1),X(0),X(1)和X(2)定義如上。
在該實施方案中,X(-1)優(yōu)選代表選自Y,A,P,W,S,G,V,F(xiàn),T,和I的氨基酸,X(2)優(yōu)選代表選自A,P,C,K,R,H,S,M,T,Q,V,I,L和E的氨基酸。更優(yōu)選的是,X(-1)代表A或P,X(1)和X(2)代表A。
根據(jù)本發(fā)明的另一實施方案,提供了表現(xiàn)出高度GalNAc受體活性,由下式(Ic)代表的序列X(-1)-X(0)-P-X(2)-X(3) (Ic)其中X(-1),X(0),X(2)和X(3)定義如上。
在該實施方案中,X(-1)優(yōu)選代表選自Y,A,P,W,S,G,V,F(xiàn),T,和I的氨基酸,X(2)優(yōu)選代表選自A,P,C,K,R,H,S,M,T,Q,V,I,L和E的氨基酸。更優(yōu)選的是,X(-1)代表A或P,X(2)和X(3)代表A。
由式(Ia)和(Ib)代表的蛋白質(zhì)是優(yōu)選的。
根據(jù)本發(fā)明另一優(yōu)選的實施,X(0)代表T。在有些情況下,當X(0)是T時,GalNAc受體活性比當X(0)是S時其對應(yīng)物高出約50多倍。
根據(jù)本發(fā)明的另一優(yōu)選的實施例,當在N端一側(cè)從X(-1)起還存在1個或2個氨基酸時,每個氨基酸優(yōu)選是A,P,G,E,Q,T,R或D。當從X(3)起在C端一側(cè)存在一個或多個氨基酸時,它們可以是任何氨基酸。
盡管根據(jù)本發(fā)明的肽或氨基酸可以是L-或D-型異構(gòu)體,但優(yōu)選L型異構(gòu)體。具體地說,X(2)的氨基酸的優(yōu)選是L型異構(gòu)體。
由式(I)代表的肽序列的具體例子如下所示。根據(jù)本發(fā)明的蛋白質(zhì)優(yōu)選含有選自下列序列的肽。
ATPAPAATPAPAAATPAAAAATAAPPAATAAPAPATAAPAAPTAAPAAATAPPPAATPAPAPATPAPAAXaTPXbP其中Xa和Xb代表任意氨基酸,其前提是Xa或Xb代表A,和AAATPAPXc其中Xc代表任意氨基酸。
根據(jù)本發(fā)明的蛋白質(zhì)或肽可以借助于遺傳工程技術(shù)或以化學合成法來合成。
本發(fā)明還提供了將粘蛋白型糖鏈導入蛋白質(zhì)或肽的方法。
根據(jù)本發(fā)明將糖或糖鏈導入蛋白質(zhì)或肽是以下面所述的方式進行的。當進行體外導入時,制備根據(jù)本發(fā)明的蛋白質(zhì)或肽,并在O-GalNAc T存在的條件下,與作為糖供體的UDP-GalNAc反應(yīng)時,優(yōu)選在含MnCl2或Triton X-100的緩沖液中進行。使用的糖供體和糖受體濃度沒有限制,可高達飽和狀態(tài)。盡管酶O-GalNAc也可無限制的使用,但優(yōu)選使用以大約10mU到10U每ml反應(yīng)液的速率。緩沖液的pH優(yōu)選大約7。優(yōu)選使用具有大約7.2之pH值的鹽酸咪唑緩沖溶液。反應(yīng)一般在25至37下進行并根據(jù)反應(yīng)條件在幾分鐘到幾十小時內(nèi)完成。
根據(jù)本發(fā)明,可借助于具有O-GalNAc T酶的真核細胞的生物合成途徑將糖鏈導入蛋白質(zhì)或肽。更具體地說,在具有O-GalNAc T酶的真核細胞中分泌表達根據(jù)本發(fā)明的蛋白質(zhì)或肽可獲得結(jié)合粘蛋白型糖鏈的蛋白質(zhì)或肽。它可確保糖鏈導入的位置是式(I)代表的序列的氨基酸X(0)上。具有O-GalNAc T的真核細胞優(yōu)選的例子包括動物細胞(如COS7,COS1,BHK,C127和CHO)和昆蟲細胞(如SF9和SF21)。
在本發(fā)明中,當糖鏈借助于真核細胞的生物合成途徑導入時,蛋白質(zhì)必須從細胞中分泌出來。因此,當導入糖鏈的蛋白質(zhì)或肽不容易從真核細胞中分泌出來時,優(yōu)選以在其上加有信號肽的前體形式表達該肽。經(jīng)過從細胞中分泌該肽,可導入糖鏈并以成熟蛋白質(zhì)的形式獲得目的蛋白質(zhì)。
已知的可用的遺傳工程技術(shù)可用于分泌表達本發(fā)明的蛋白質(zhì)或肽。具有式(I)代表的序列的蛋白質(zhì)或肽可在上面所述的細胞中表達,這對本領(lǐng)域的技術(shù)人員而言是顯而易見。式(I)代表的序列可插入或加到蛋白質(zhì)或肽的所需位置或可用式(I)代表的序列取代蛋白質(zhì)或肽的所需位置。
更具體地說,根據(jù)本發(fā)明,提供了制備結(jié)合粘蛋白型糖鏈的蛋白質(zhì)或肽的方法,包括下面步驟用編碼根據(jù)本發(fā)明的蛋白質(zhì)或肽的DNA轉(zhuǎn)化真核細胞;以及在轉(zhuǎn)化的細胞中表達該蛋白質(zhì)或肽并從真核細胞中分泌該蛋白質(zhì)或肽。
本發(fā)明還提供了將粘蛋白型糖鏈導入感興趣的蛋白質(zhì)或肽的所需位置的方法,包含下面步驟將編碼式(I)代表的序列的DNA插入或加入編碼所感興趣的蛋白質(zhì)或肽的DNA中的并與所要導入粘蛋白型糖鏈的位置相對應(yīng)的位置中,或用編碼式(I)代表的序列的DNA取代包括該位置的部分DNA片段,從而獲得含有編碼式(I)代表的序列的DNA的編碼蛋白質(zhì)或肽的DNA;用上面步驟中,獲得的DNA轉(zhuǎn)化真核細胞;在轉(zhuǎn)化的細胞中表達該蛋白質(zhì)或肽并從該細胞中分泌結(jié)合粘蛋白型糖鏈的蛋白質(zhì)或肽。
優(yōu)選的是,含有對式(I)代表的序列的DNA的編碼蛋白質(zhì)或肽的DNA優(yōu)選以載體的形式。更優(yōu)選的是,以包括各種用于啟動或調(diào)節(jié)表達的序列的表達載體形式。不需過多的實驗,本領(lǐng)域的技術(shù)人員可從遺傳工程領(lǐng)域中所用的一組載體中選擇適用于本發(fā)明的載體,也能構(gòu)建在本發(fā)明中有用的表達載體。如上所述,用于本發(fā)明的真核細胞可以是具有O-GalNAc T的細胞。另外,可用于這類細胞并適用于本發(fā)明的載體是已知的。(見Molecular Cloning[J.Sambrook et a1.,Cold SpringHarbor Laboratory Press(1989)]和Baculovirus Expression VECTORSalaboratory manual[D.R.O′Reilly et al.,W.H.Freeman and Company(1992)]。
因此,根據(jù)本發(fā)明,提供了編碼式(I)所代表序列的DNA序列以及編碼包括式(I)代表的序列的蛋白質(zhì)或肽的DNA序列。
以根據(jù)本發(fā)明的方法生產(chǎn)的糖蛋白或糖肽可使用已知的合適技術(shù)從反應(yīng)后的溶液中分離和純化。該技術(shù)包括親和柱層析,凝膠過濾柱層析和反相柱層析。經(jīng)濃縮和/或冷凍于燥可收集反應(yīng)產(chǎn)品。
以根據(jù)本發(fā)明的導入糖鏈的方法,可將粘蛋白型糖鏈導入結(jié)構(gòu)已知的蛋白質(zhì)或肽的所需位置。而且,由式(I)代表的序列僅由5個氨基酸組成。只要這一序列存在,就可將糖鏈高機率地導入具蛋白質(zhì)或肽中。因此,根據(jù)本發(fā)明,有利于將蛋白質(zhì)或肽與粘蛋白型糖鏈連接而不影響已知結(jié)構(gòu)的蛋白質(zhì)或肽的結(jié)構(gòu)。并且本發(fā)明的技術(shù)在制藥工業(yè)和其它工業(yè)上都將有各種廣泛應(yīng)用。
另外,根據(jù)本發(fā)明制備的糖蛋白或糖肽可用作各種糖酵解酶和糖基轉(zhuǎn)移酶的底物。因此,該蛋白質(zhì)可用于檢測有用的酶。例如,它可有利地用于制備能參與粘蛋白型糖鏈形成的酶的底物。更具體地說,使用AAATPAP可獲得AAAT(α-GalNAc)PAP可用于檢測和測量可能來自于包括微生物,昆蟲、動物,植物的生物及其細胞培養(yǎng)溶液的樣品中的c-N-乙酰半乳糖胺酶或UDP-GaGalNAc-多肽β1,3-半乳糖轉(zhuǎn)移酶。
而且,經(jīng)過提供根據(jù)本發(fā)明的肽并隨后結(jié)合到活化的羧基瓊脂糖或溴化氰活化的瓊脂糖上可制備具有肽的載體。這種具有肽的載體可有利地用于純化粘蛋白型糖基轉(zhuǎn)移酶如O-GalNAc T。
實施例本發(fā)明以實施例的方式進行了詳細描述,但實施例并不限制本發(fā)明的范圍。
在下面實施例中,O-GalNAc T的純化,肽的合成及合成肽的GalNAc受體活性的測量可按下面所述方式進行。O-GalNAc T的純化來自奶牛初乳的O-GalNAc T以A.Elhammer等[J.Biol.Chem.,Vol.261,pp.5249-5255(1986)]報道的方法進行純化。
更具體地說,離心大約4.8升奶牛初乳以去掉奶油成份,然后進行超速離心。往獲得的3.2升溶液中加入800毫升甘油來生產(chǎn)粗制酶溶液,隨后對它進行包括DEAE-Sephacel柱層析,超濾和脫粘蛋白-Sepharose 4B柱層析I和II的4步純化過程,就可以得到高度純化的樣品。肽的合成以Fmoc固相方示[Nobuo Izumiya et al.,Bases and Experiments onPeptide Synthesis,Maruzen,1985]用Protein Technologies公司制造的PS3(Automatic Peptide Synthesizer)合成肽。分析合成肽的結(jié)構(gòu)并以質(zhì)譜法(Mass Analyzer API111可以Parkin Elmer獲得)進行定量以及進行氨基酸組成分析(Amino Acid Composition Analyzer JLC-300可從Nippon-Denshi獲得)。肽的GalNAc受體活性測量以J.M.Cottrell等[Biochem.J.,Vol.283,pp.299-305(1992)]和A.P.Elhammer et al.等[J.Biol.Chem.,Vol.268,pp.10029-10038(1993)]建議的方法測定肽的GalNAc受體活性。
更具體地說,制備含100nmol的合成肽和0.5至500mU來自奶牛初乳的部分純化的O-GalNAc T的50μm反應(yīng)溶液(50mM咪唑-HCl(pH7.2),10mM MnCl2,0.5%Triton X-100,150μm UDP-[3H]GalNAc)并在37℃保溫30分鐘至5小時。加入100mM EDTA終止反應(yīng),隨后上樣到1ml離子交換柱(AG1-X8,Cl-型,可從Biolad獲得)上并用2.5ml水洗脫反應(yīng)產(chǎn)物。將用于液閃計數(shù)(Atomlight可從Dupont獲得)的10ml混合溶液加到洗脫級分中并以液閃計數(shù)觀察2分鐘。
GalNAc受體活性以PPASTSAPG(等于100%)的起始反應(yīng)速度的相對值來表示。實施例1將GalNAc轉(zhuǎn)移進各種肽中測量的在圖1中列出的每個肽的GalNAc受體活性。
這些肽序列是來自粘蛋白型糖蛋白的肽序列或已知由于O-GalNAc T使GalNAc轉(zhuǎn)移了的肽序列。更具體地說,PGGSATPQ,SGGSGTPG,GEPTSTP,PDAASAAP和ALQPTQGA分別來自豬下頜腺粘蛋白,綿羊下頜腺粘蛋白,牛κ-酪蛋白,人促紅細胞生成素和人粒細胞集落刺激因子。RTPPP和VTRTPPP來自牛髓磷脂,J.D.Young等報道了將GalNAc轉(zhuǎn)移到這些肽上[J.Biol.Chem,;Vol.268,pp.10029-10038(1993)]。
這些結(jié)果在圖1中顯示。以圖1可見,PPASTSAPG(根據(jù)A.P.Elhammer等它具有一個理想的肽序列)在所有序列中顯示出最高活性,接著是RTPPP和VTRTPPP。另一方面,來自天然粘蛋白型蛋白質(zhì)的所有肽序列均顯示出低活性。實際上,實驗用的下頜腺的肽序列中也幾乎觀察不到GalNAc的轉(zhuǎn)移。實施例2在結(jié)合糖鏈的位點上氨基酸,蘇氨酸和絲氨酸的影響將粘蛋白型糖鏈結(jié)合到肽上的蘇氨酸或絲氨酸上。由此試驗每個氨基酸對GalNAc轉(zhuǎn)移的可行性進行比較。
在實施例中列出的肽中,使用來自促紅細胞生成素和髓磷脂,并僅含一個絲氨酸或蘇氨酸殘基的肽。它們清楚地顯示出比實施例1中所用的任何其它肽更多的GalNAc轉(zhuǎn)移。然后,制備了來自促紅細胞生成素的PDAATAAP和PDAASAAP及來自髓磷脂的RSPPP。
圖2顯示了該結(jié)果。從圖2可看出,在每種情況下。蘇氨酸比絲氨酸活躍40到50倍。PDAATAAP顯示的活性水平比在實施例1中顯示出最高活性水平的PPASTSAPG的活性水平還大約高出4倍。實施例3含單個脯氨酸殘基的肽的GalNAc的轉(zhuǎn)移然后檢查了GalNAc轉(zhuǎn)移反應(yīng)中肽上脯氨酸殘基的影響,因為在結(jié)合粘蛋白型糖鏈的氨基酸的周圍序列中觀察到脯氨酸的頻率相當大且因為在實施例1和2中顯示出高GalNAc受體活性的每個肽都含有一些脯氨酸殘基。作為第一步AAATAAA中丙氨酸殘基以制備改變的肽并比較肽的GalNAc受體活性。制備的肽是AAATAAA,PAATAAA,APATAAA,AAPTAAA,AAATPAA,AAATAPA和AAATAAP。
每個肽的GalNAc受體活性在圖3中顯示。盡管AAATAAA幾乎不顯示出任何活性,但AAATPAA和AAATAAP顯示出明顯較高的活性水平。由此推斷在+1和+3位,特別是在+3位存在的脯氨酸對GalNAc受體活性是重要的。AAATAAP顯示的活性水平比PPASTSAPG大約高1倍。實施例4將GalNAc轉(zhuǎn)移給含2個脯氨酸殘基的肽實施例3的結(jié)果表明,經(jīng)過將單個脯氨酸殘基導入特定位點可產(chǎn)生有意義的效果。因此,在本實施例中,將第二個脯氨酸殘基導入在實施例3中顯示出最高活性水平的AAATAAP的每個丙氨酸位置中以便弄清第二個脯氨酸殘基的效應(yīng)。制備的用于比較GalNAc受體活性的肽是AAATAAA,AAATAAP,PAATAAP,APATAAP,AAPTAAP,AAATPAP和AAATAPP。
圖4顯示了結(jié)果。從圖4可看出,AAATPAP顯示的受體活性水平比AAATAAP大約高3倍。這證明當分別在+1和+3位提供2個脯氨酸殘基時轉(zhuǎn)移給肽的GalNAc協(xié)同增加。AAATPAP顯示的活性水平比PPASTSAPG大約高6倍。即使當-3,-2,-1和+2位的丙氨酸殘基轉(zhuǎn)換成脯氨酸,+3位的脯氨酸的效應(yīng)仍保守穩(wěn)定。實施例5將GalNAc轉(zhuǎn)移給含3個脯氨酸殘基的肽正如實施例4所證實的,在肽序列+1和+3位的2個脯氨酸殘基極大地提高了GalNAc受體活性。因此,在本實施例中,將第三個脯氨酸殘基導入AAATPAP的各個丙氨酸位置以便了解第三個脯氨酸殘基的效應(yīng)。制備的用于比較GalNAc受體活性的肽是AAATAAP,AAATPAP,AATPAP,APATPAP,AAPTPAP,和AAATPPP。
結(jié)果如圖5所示。從圖5中可看出,當在不同于+1和+3的位置導入脯氨酸殘基時,GalNAc受體活性水平并不明顯增加。這清楚地表明在+1和+3位的兩個脯氨酸對GalNAc受體活性是重要的。盡管在-3,-2和+2位的任何一個中導入第三個脯氨酸時在活性上沒有顯示出明顯的改變,但當導入-1位時水平顯著下降。從這些結(jié)果可以相信,+1和+3位2個脯氨酸殘基的效應(yīng)基本上不受剩余位置氨基酸的影響。并且當是一個氨基酸的脯氨酸殘基位于轉(zhuǎn)移GalNAc的蘇氨酸兩側(cè)(-1和+1)時,可產(chǎn)生異常的肽結(jié)構(gòu)而減小活性。
考慮到實施例3到5的結(jié)果,很清楚肽接受GalNAc所需要的不是隨機存在的一個或多個脯氨酸殘基,而是它們應(yīng)位于特定位置上。而且,肽有更高GalNAc受體活性所需要的不僅僅是位于轉(zhuǎn)移GalNAc的絲氨酸或蘇氨酸周圍的脯氨酸殘基數(shù)目增加,而是它們應(yīng)位于特定的有限的位置上。實施例6將GalNAc轉(zhuǎn)移到在結(jié)合位點N端一側(cè)具有不同數(shù)目的氨基酸的肽上總結(jié)實施例3至5的結(jié)果,還清楚了位于N端一側(cè)從-3至-1位的氨基酸并不明顯影響GalNAc受體活性,不管它們是丙氨酸還是脯氨酸。因此,制備了在N端一側(cè)具有不同氨基酸殘基數(shù)目的肽并試驗了GalNAc受體活性以了解位于從-3到-1位的氨基酸殘基是否確實為GalNAc受體活性所必需。制備的肽是AAATPAP,AATPAP,ATPAP和TPAP。
結(jié)果如圖6所示。從圖6可以看出,盡管ATPAP顯示出高GalNAc受體活性,但TPAP的活性顯著下降。因此,這證明了獲得高GalNAc受體活性,在轉(zhuǎn)移GalNAc蘇氨酸或絲氨酸N端一側(cè)需要至少一個氨基酸殘基。同時,還發(fā)現(xiàn)從蘇氨酸到N端一側(cè)存在2個或多個氨基酸是優(yōu)選的但并不是必需的。因為GalNAc受體活性的增加取決于從蘇氨酸到N端一側(cè)3個以上氨基酸殘基或更多的氨基酸數(shù)目。實施例7將GalNAc轉(zhuǎn)移給+2位具有不同氨基酸的肽實施例6的結(jié)果表明,具有ATPAP的肽序列一般顯示出高GalNAc受體活性水平。該肽具有2個脯氨酸殘基。由于脯氨酸在各種氨基酸中具有特殊的結(jié)構(gòu),很可能位于兩個脯氨酸殘基之間的氨基酸(+2位)可明顯影響肽的結(jié)構(gòu)。因此,制備了在+2位具有不同氨基酸的20個肽并比較了GalNAc受體活性。制備的肽是AAATPAP,AAATPPP,AAATPCP,AAATPKP,AAATPRP,AAATPHP,AAATPSP,AAATPMP,AAATPTP,AAATPQP,AAATPV,AAATPIP,AAATPLP,AAATPEP,AAATPGP,AAATPYP,AAATPWP,AAATPFP,AAATPNP和AAATPDP。
結(jié)果如圖7所示。從圖7可看出,如果在+1和+3位存在脯氨酸,則肽顯示出高GalNAc受體活性,不管在+2位的氨基酸側(cè)鏈是什么。另一方面,活性隨+2位氨基酸的側(cè)鏈的變化而變化。具體地說,具有丙氨酸、脯氨酸、半胱氨酸、賴氨酸、精氨酸、組氨酸、絲氨酸、甲硫氨酸、蘇氨酸、谷氨酰胺、纈氨酸、異亮氨酸、亮氨酸或谷氨酸的肽比具有甘氨酸、酪氨酸、色氨酸、苯丙氨酸、天冬酰胺或天冬氨酸的肽顯示出更高的GalNAc受體活性。結(jié)果證明+2位的氨基酸應(yīng)優(yōu)選具有相對小的側(cè)鏈和帶有陽性電荷。實施例8將GalNAc轉(zhuǎn)移給具有+2位氨基酸光學異構(gòu)體的肽實施例7的結(jié)果表明基礎(chǔ)肽序列(ATPAP,具有高GalNAc受體活性)+2位氨基酸的側(cè)鏈可能影響其活性。因此,對于+2位的丙氨酸,制備了D-和L-光學異構(gòu)體并比較了GalNAc受體活性。制備的肽是PAATAAP,APATAAP,AAPTAAP和AAATPAP,其中丙氨酸的D-和L-旋光異構(gòu)體在+2位形成。
結(jié)果如圖8所示。從圖8可看出,L-異構(gòu)體一般比D-異構(gòu)體顯示出更高活性,盡管后者也提供了高水平的活性。因此,證實+2位氨基酸可以是D型異構(gòu)體(它與其天然對應(yīng)物光學對稱)而+2位的氨基酸殘基側(cè)鏈對GalNAc受體活性意義不大。實施例9將GalNAc轉(zhuǎn)移給-1位具有不同氨基酸的肽實施例6的結(jié)果表明-1位的氨基酸對GalNAc受體活性較重要。因此,制備了-1位具有不同氨基酸的20個肽并比較了GalNAc受體活性。制備的肽是AAYTPAP,AAATPAP,AAWTPAP,AASTPAP,AAGTPAP,AAVTPAP,AAFTPAP,AATTPAP,AAITPAP,AAHTPAP。AAMTPAP,AAQTPAP,AACTPAP,AANTPAP,AAPTPAP,AALTPAP。AARTPAP,AAETPAP,AADTPAP和AAKTPAP。
結(jié)果如圖9所示。從圖9可以看出,如果在+1和+3位存在脯氨酸,則肽顯示出高GalNAc受體活性水平而不管-1位的氨基酸側(cè)鏈是什么。然而,根據(jù)-1位氨基酸的側(cè)鏈,活性水平可相對有意義地進行改變。具體地說,具有酪氨酸、丙氨酸、色氨酸、絲氨酸、甘氨酸、纈氨酸、苯丙氨酸、蘇氨酸或異亮氨酸的肽比具有組氨酸、甲硫氨酸、谷氨酰胺、半胱氨酸、天冬酰胺、脯氨酸、亮氨酸、精氨酸、谷氨酸、天冬氨酸或賴氨酸的肽具有更高的GalNAc受體活性。這些結(jié)果表明-1位的氨基酸應(yīng)優(yōu)選不帶電荷且無芳香環(huán),盡管側(cè)鏈的大小則對GalNAc受體活性影響較小。實施例10將GalNAc轉(zhuǎn)移給在+4位具有不同氨基酸的肽實施例1到9的結(jié)果表明,具有高GalNAc受體活性水平的肽序列的基序(motif)是X(-1)-T-P-X(2)-P,其中X(1)和X(2)代表任意氨基酸。在該基序(motif)中,+3位的脯氨酸較重要,且C端一側(cè)不應(yīng)比該基序(motif)更短。另一方面,+4位氨基酸的意義仍不清楚。因此,制備了在-4位具有不同氨基酸的20個肽并比較了GalNAc受體活性。制備的肽是AAATPAP,AAATPAPG,AAATPAPQ,AAATPAPE,AAATPAPA,AAATPAPN,AAATPAPD,AAATPAPR,AAATPAPC,AAATPAPI,AAATPAPV,AAATPAPS,AAATPAPK,AAATPAPY,AAATPAPL,AAATPAPT,AAATPAPW,AAATAM,AAATPAPP,AAATPAPF和AAATPAPH。
結(jié)果如圖10所示。從圖10可看出,+4位添加氨基酸對GalNAc受體活性影響幾乎沒有,其側(cè)鏈影響比-1或-2位的側(cè)鏈影響更小。因此,可以認為+4位的氨基酸既無意義也非必需。然而,在某些情況下可能有一定程度的影響,因為對甘氨酸、谷氨酰胺、谷氨酸、丙氨酸、天冬酰胺、天冬氨酸、精氨酸、半胱氨酸和異亮氨酸而言提供略高的活性水平。實施例11經(jīng)過插入具有GalNAc受體活性的肽序列將肽修飾成粘蛋白型糖鏈結(jié)合的蛋白質(zhì)將具有GalNAc受體活性的肽序列導入蛋白質(zhì)中以證實該蛋白質(zhì)可被修飾成能結(jié)合粘蛋白型糖鏈。
至于蛋白質(zhì),使用來自日本血吸蟲的谷胱甘肽-S-轉(zhuǎn)移酶(GST)。GST的變異體(GST-3X)可利用商業(yè)化的質(zhì)粒PGEX-3X(PharmaciaBiotech)從大腸桿菌中批量生產(chǎn)來制備。GST變異體在天然GST C-末端加有一個肽序列SDLIEGRGIPGNSS。使用包含在質(zhì)粒PGEX-3X中的該質(zhì)白質(zhì)的基因。
構(gòu)建編碼變異蛋白質(zhì)的修飾的基因,在該變異蛋白質(zhì)中有一個具有GalNAc受體活性的肽序列插入到GST-3X的下游區(qū)。該基因的構(gòu)建如圖11所示?;虿僮鞣椒ㄊ歉鶕?jù)在Molecular Cloning[J.Sambrook etal.,Cold Spring Harbor Laboratory Press(1989)]中描述的方法,除非另有說明。
含具有高活性水平之AAATPAP的序列MAAATPAPM用作具有GalNAc受體活性的序列。以下面方式制備編碼肽序列MAAATPAPM的DNA。用可從Applied Biosystems獲得的394DNA/RNA合成儀制備下面2個單鏈DNA。
5′ -AAGGATCCCCATGGCAGCAGCAACGCCGGCACCCATGGGGAATTCAA-3′(合成的DNAl)5′ -TTGAATTCCCCATGGGTGCCGGCGTTGCTGCTGCCATGGGGATCCTT-3′(合成的DNA 2)隨后,制備50μl,10mM Tris-HCl(pH8.0),5mM MgCl2,100mM NaCl,1mM 2-疏基乙醇和上面合成的DNA各1nmol的溶液。然后將溶液在75℃保溫10分鐘,隨后移到室溫進行退火以產(chǎn)生雙鏈DNA,它就是所需的DNA。取5μl由此獲得的溶液并用EcoRI和BamHI剪切雙鏈DNA,根據(jù)常規(guī)方法插入到pGEX-3X的相同限制性酶位點之間以形成質(zhì)粒PGEX-3X Muc C1。該質(zhì)粒含有編碼變異體GST-3X Muc C1的DNA,其中MAAATPAPM插入到GST-3X的第228位脯氨酸和第229位甘氨酸之間。以373 A DNA測序儀(AppliedBiosystems),用5′pGEX測序引物(Pharmacia Biotech)和PRISM,DyeTerminator Cycle Sequencing Kit(Applied Biosystems)證實插入?yún)^(qū)的序列。
含有在GST-3X C端區(qū)域插入的MAAATPAPM肽序列的變異體蛋白質(zhì)以下面方式用大腸桿菌制備。以CaCl2法用pGEX-3X Muc C1轉(zhuǎn)化大腸桿菌BL21(Pharmacia Biotech),然后在5ml含100μg/ml氨芐青霉素的2×YTG培養(yǎng)基(16g/l胰蛋白胨,10g/l酵母提取物,5g/lNaCl,pH7.0)中37℃,振蕩過夜進行預培養(yǎng)。接著,將它轉(zhuǎn)移到500ml相似培養(yǎng)基中并在37℃振蕩培養(yǎng)2.5小時(O.D.=0.5-1.0)。向培養(yǎng)溶液中加入100mM的異丙基-β-D-硫代半乳糖苷(IPTG)溶液使終濃度為0.5mM。然后在4℃下以5,000rpm(4,470×g)將溶液離心10分鐘以收集微生物,然后用50ml 20mM Tris-HCl(pH7.5)和140mMNaCl洗滌菌體并在相同條件下進行另一次離心再進行收集。將微生物懸浮于50ml 20mM Tris-Hcl(pH 7.5)和140mM NaCl中,用超聲破碎儀破碎。產(chǎn)物在4℃下以15,000rpm(27,700×g)離心30分鐘,上清液用孔徑為0.22μm的膜過濾,加入10%Triton X-100使終濃度為0.1%。獲得的溶液用作粗制酶溶液。
將粗制酶溶液上樣到1ml預先用20mM Tris-HCl(pH7.5),140mM NaCl和0.1%Tripton X-100平衡的谷胱甘肽Sepharose 4B柱(Pharmacia Biotech)上,然后用20mM Tris-HCl(pH7.5),140mM NaCl0.1%Tripton X-100洗滌。撞著將1ml含50mM Tris-HCl(pH8.0),140mM NaCl,0.1%Tripton X-100,5mM二硫蘇糖醇和10mM谷胱甘肽(還原型)的溶液加到柱上,室溫下靜置10分鐘,然后用9ml相同的緩沖溶液洗脫以獲得1ml的級分。用Protein Assay Kit(JapanBiolaboratory)分析洗脫級分的蛋白質(zhì)質(zhì)量并用GST Detection Module(Pharmacia Biotech)觀察GST活性。使用分離的13%凝膠和U.K.Laemmli[Nature(London),Vol.227.pp680-685(1970)]建議的方法分析蛋白質(zhì)的凝膠電泳(SDS-PAGE)。在洗脫級分中檢測的GSX-3X MuxC1顯示出與GST-3X相似的GST活性。以SDS-PAGE檢測到分子量大約為28k的單條帶。
以與上述相似的方式也制備了作為對照GST-3X的樣品。
除了用5mmol的變異體GST-3X代替100nmol的肽外根據(jù)用于檢測肽的GalNAc受體活性所述的方法分析了將GalNAc轉(zhuǎn)移到GST-3X和GST-3X Muc C1上的情況。
結(jié)果如圖12所示。以圖12中可看出,基本上觀察不到GalNAc轉(zhuǎn)移到GST-3X上,而轉(zhuǎn)移到GST-3X Muc C1上的GalNAc隨時間越來越多地增加。這一事實表明,通過將具有GalNAc受體活性的肽序列插入到蛋白質(zhì)中,可將蛋白質(zhì)修飾成能接合粘蛋白型糖鏈的蛋白質(zhì)。實施例12經(jīng)過加入具有GalNAc受體活性的肽序列將蛋白質(zhì)修飾成粘蛋白型糖鏈結(jié)合蛋白質(zhì)在本實施例中,使用如實施例11中模型蛋白質(zhì)GST-3X。然而,在本實施例中,具有GalNAc受體活性的肽序列加到蛋白質(zhì)的N端一側(cè)以比它可修飾該蛋白質(zhì)使之顯示出結(jié)合粘蛋白型糖鏈的能力。
根據(jù)圖13和14所示的方法進行變異體基因的構(gòu)建。
在pGEX-3X中的GST-3X基因在N端區(qū)域不具有用于插入具有GalNAc受體活性的肽序列的任何限制性酶切位點。因此,以聚合酶鏈式反應(yīng)(PCR)制備具有NcoI限制性酶位點的GST-3X 2A基因。具體地說,用可以從Applied Biosystems獲得的394 DNA/RNA合成儀合成下列引物。
5′-GTATCCATGGCCCCTATACTAGGTTATTGG-3′(合成的DNA 3)5′-TACTGCAGTCAGTCAGTCACGATGAATTCC-3′(合成的DNA 4)用含有2.5ng模板DNA,pGEX-3X,0.5μM合成的DNA3,0.5μM合成的DNA4,8μIdNTP混合物(Takara Shuzo),10μl10×Ampli Taq DNA聚合酶緩沖液(Takara Shuzo)和2.5單位Ampli TaqDNA聚合酶(Perkin-Elmer)并加有2滴礦物油(Takara Shuzo)的反應(yīng)溶液和DNA熱循環(huán)儀(商品名Perkin-Elmer)進行PCR反應(yīng)。以94℃1分鐘55℃2分鐘和72℃2分鐘循環(huán)35次進行PCR擴增,接著在72℃下單次處理10分鐘并將溫度冷卻到4℃。反應(yīng)后,加入鏈霉蛋白酶K(Behlinger Mannheim),乙二胺四乙酸二鈉鹽(EDTA)和十二烷基磺酸鈉(SDS)分別為12 mg/ml,10mM和0.8%?;旌衔镌?7℃保溫30分鐘,然后在65℃保溫10分鐘。隨后,以酚提取PCR反應(yīng)產(chǎn)物,以乙醇沉淀純化并用限制性酶NcoI和PstI剪切以產(chǎn)生所需的DNA。然后根據(jù)常規(guī)方法將DNA插入到PSL1190(Pharmacia Biotech)相同的限制性酶切位點之間。以Applied Biosystems的373A DNA測序儀和PRISM,Dye Primer Cycle Sequencing Kit(Applied Biosystems)分析插入DNA的序列。獲得的GST-3X 2A的DNA其特征在于經(jīng)過導入NcoI位點將從GST-3XN端的第二個氨基酸(絲氨酸)替換成丙氨酸。
然且,用限制酶NcoI和PstI從pSL1190中切下GST-3X2A DNA并插入pTrc99A(Pharmacia Biotech)相同的限制性酶位點之間以獲得pGEY-3X2A。質(zhì)粒pGEY-3X2A與pGEX-3X非常相似,除了它含有具有可插入DNA的N端的NcoI位點之GST-3X2A基因且啟動子從tac切換到trc。
最后,按下面所述方式制備含GST-3X2A Muc C1基因(在N端具有MAAATPAP肽序列)的pGEY-3X2A Muc N1的質(zhì)粒。經(jīng)過合成與實施例11相同的單鏈合成DNA1和合成DNA2并在50μl含50mMTris-HCl(pH7.5),10mM MgCl2,100mM NaCl和1mM 2-巰基乙醇的溶液中退火來制備編碼肽序列MAAATPAP的基因。在5μl由此獲得的溶液中,用限制酶NcoI剪切雙鏈DNA并插入pGEY-3X2A的NcoI位點以制備質(zhì)粒pGEY-3X2A Muc Nl。該質(zhì)粒在GST-3XN端甲硫氨酸上游被加入MAAATPAP并含有編碼變異體DNA,GST-3X2A Muc N1的DNA,其中第二位的絲氨酸替換成丙氨酸。以373ADNA測序儀(Applied Biosystems)用5′-GTTGACAATTAATCATCCGGCTCGT-3′(由Kurasidi-Bouseki合成和用HPLC純化)和PRISM,Dye Terminator Cycle Sequencing Kit(Applied Biosystems)證實插入?yún)^(qū)的序列。
經(jīng)過使用大腸桿菌制備變異體蛋白質(zhì)GST-3X2A Muc N1并按在實施例11中對GST-3X Muc C1的描述進行分析。在GlutathioneSepharose 4B柱洗脫的級分中檢測的GST-3X2A Muc N1顯示出與GST-3X相等的GST活性。而且,以SDS-PAGE檢測出分子量為大約28K的單條帶。
以與用于測量GalNAc受體活性的方法相同的方式分析GalNAc向GST-3X2A Muc N1和GST-3X的轉(zhuǎn)移,除了用5nmol變異體GST代替100nmol肽。
結(jié)果如圖15所示。從圖15可看出,對GST-3X基本上觀察不到GalNAc轉(zhuǎn)移,而轉(zhuǎn)移給GST-3X Muc C1的GalNAc隨時間越來越多地增加。這表明經(jīng)過將具有GalNAc受體活性的肽序列加進蛋白質(zhì)可將蛋白修飾成能結(jié)合粘蛋白型糖鏈的蛋白質(zhì)。
上面的結(jié)果和實施例11的結(jié)果表明,當將具有GalNAc受體活性的肽序列導入蛋白質(zhì)時,在蛋白質(zhì)中導入肽序列的位置是特別有限的。實施例13將具有GalNAc受體活性的各種肽序列導入蛋白質(zhì)中以制備粘蛋白型糖鏈結(jié)合蛋白質(zhì)經(jīng)過結(jié)合SDS-PAGE和熒光X線照像的方法證實實施例11中GalNAc向GST-3X Muc C1的轉(zhuǎn)移和實施例12中GalNAc向GST-3X2A Muc N1的轉(zhuǎn)移。
另外,經(jīng)過使用實施例11中所用的GST-3X模型蛋白質(zhì),但將顯示出GalNAc受體活性且不同于GST-3X Muc C1的肽序列,導入C端一側(cè),來制備GST-3X Muc C2,GST-3X Muc C3 T GST-3XMuc C4。對這些肽,按前面兩個實施例的情況檢查GalNAc轉(zhuǎn)移活性。
質(zhì)粒pGEX-3X中的限制性酶位點對于在模型蛋白質(zhì)C端區(qū)域修飾肽序列有一些限制。因此,以PCR制備質(zhì)粒pGEX-3XS以制備模型蛋白質(zhì)的各種修飾的形式。以圖16所示的方式構(gòu)建質(zhì)粒。
用可以Applied Biosystems獲得的394DNA/RNA合成儀合成下列引物DNA。
5′-ATGGTACCATGCGCGCCATTACCGAGT-3′(合成的DNA 5)5′-CCGAGCTCTGTTTCCTGTGTGAAATTGT-3′(合成的DNA 6)5′-CAGAGCTCATGTCCCCTATACTAGGTTA-3′(合成的DNA 7)5′-GGACTAGTCATGTTGTGCTTGTCAGCTA-3′(合成的DNA 8)用pGEX-3X作模板DNA用合成的DNA5和6或合成的DNA7和8的組合按實施例12所述進行PCR過程,前提是10×Ampli Taq DNA聚合酶緩沖液和Ampli Taq DNA聚合酶分別被PCR緩沖液(10倍濃縮含MgSO4)(Behlinger Mannheim)和Pwo DNA聚合酶(Behinger Mannheim)代替。對利用合成的DNA7和8的組合的反應(yīng)產(chǎn)物進行瓊脂糖膠電泳分離后收集大約0.2kb的DNA片段,然后用酚抽提并經(jīng)乙醇沉淀純化。以限制性酶SacI和SphI剪切DNA片段并根據(jù)常規(guī)方法插入到pSL1190(Pharmacia Bioteeh)的相同限制性酶位,最之間以產(chǎn)生pPGST91。用373A DNA測序儀(Applied Biosystem)和PRISM,Dye Primer CycleSequencing Kit(Applied Biosystems)分析插入的DNA序列。對利用合成的DNA5和6的組合的反應(yīng)產(chǎn)物進行相似的處理,分離并純化大約1.2kb DNA片段,接著用限制性酶SacI和KpnI剪切。根據(jù)常規(guī)方法將此片段插入pPGST91的相同限制性酶位點之間以產(chǎn)生pPGST92。然后,用限制性酶EcoRV和BalI剪切pPGST92。根據(jù)常規(guī)方法將所得的1.3kb的片段插入PGEX-3X的相同限制性酶位點之間以產(chǎn)生pGEX-3XS。
圖17A,17B和17C分別顯示了用于表達GST-3X Muc C2,GST-3X Muc C3和GST-3X Muc C4的質(zhì)粒pGEX-3XS Muc C2,pGEX-3XS Muc C3和pGEX-3XS Muc C4的限制性酶切圖譜。
這些質(zhì)粒以下面所述的方式構(gòu)建。
首先合成下列引物DNA5′-CGTCTAGACCGTCAGTCAGTCACGATGAAGGCGCGGGGGTCCCAC-3′(合成的DNA9)5′-CGTCTAGACCGTCAGTCAGTCACTATTAAGGCTCGGGGGTCCCAC-3′(合成的DNA10)5′-CGTCTAGACCGTCAGTCAGTCACGATGAAGGCCCGGGGGTCCCAC-3′(合成的DNA11)按上面所述,以pGEX-3X作模板DNA,用合成DNA 7和9,合成DNA7和10及合成DNA7和11的組合進行PCR過程。反應(yīng)后,按實施例12的方法純化每種PC]R反應(yīng)產(chǎn)物,用限制性酶SacI和XbaI剪切并插入pBluescript IIks+(Stratagene)的相同限制性酶位點之間。形成的質(zhì)粒分別命名為用合成DNA7和9的組合形成pBGSTC2,用合成DNA7和10的組合形成pBGSTC3和用合成DNA7和l0的組合形成pBGSTC4。用373A DNA測序儀(Applied Biosystem)和PRISM,DyePrimer Cycle測序試劑盒(-211M13)或(M13 Rev)(Applied Biosystems)證實各插入DNA的序列。最后,用限制性酶SacI和EcoRI剪切pBGSTC2 pBGSTC3和pBGSTC4以獲得大約0.7kb的片段。將各片段插入pGEX-3XS的相同限制性酶位點之間以完成pGEX-3XS MucC2,pGEX-3XS Muc C3或pGEX-3XS Muc C4的制造。
利用大腸桿菌制備變異蛋白質(zhì)GST-3X Muc C2,GST-3X MucC3和GST-3X Muc C4并以實施11中對GST-3X Muc C1所述的方式進行分析。在谷胱甘肽Sepharose 4B柱洗脫級分中檢測的各GST-3X Muc C2,GST-3X Muc C3和GST-3X Muc C4都顯示出與GST-3X相似的特異性GST活性。而且用SDS-PAGE檢測出了分子量大約為27k的單一帶。
以下面方式分析GalNAc向各種變異GST的轉(zhuǎn)移,其中采用SDS-PAGE和熒光X射線照像相結(jié)合的方法。制備50μl含5nmol變異GST-3X和50mU來自奶牛初乳的部分純化的O-GalNAc T的溶液(50mM咪唑-HCl(pH7.2),10mM MnCl2,0.5%Triton X-100和150μM UDP-[3H]GalNAc)并在28℃靜置20小時。然后,向其中加入50μl 2×SDS/樣品緩沖液(125mM Tris-HCl(pH6.8),4%SDS,4%2-巰基乙醇,20%甘油和0.004%溴酚藍)并在煮沸的水中放置5分鐘。隨后,對30μl反應(yīng)溶液進行12.5%SDS-PAGE。然后,將凝膠浸入固定液(2-丙醇/水/乙酸(26∶65∶10))中30分鐘,然后再放入Amprify(Amsham)中。接著,凝膠在80℃真空干燥后,在-80℃附著于X-射線膜上曝光15天。
圖18顯示了結(jié)果。盡管觀察不到GalNAc轉(zhuǎn)移到GST-3X上,但GalNAc明顯地轉(zhuǎn)移到了GST-3X Muc C1,GST-3X Muc C2,GST-3X Muc C3,GST-3X Muc C4和GST-3X 2A Muc N1上。這表明由通式X(-1)-T-P-X(2)-P(其中X(-1)和X(-2)代表任意氨基酸)代表的序列在蛋白質(zhì)中發(fā)揮功能使蛋白質(zhì)能結(jié)合粘蛋白型糖鏈。還發(fā)現(xiàn)導入肽序列時,對區(qū)域沒有特別限制。另外,對肽序列的導入類型沒有限制,即,插入,添加和取代都可適用于導入肽序列。從GST-3X Muc C2和GST-3X Muc C4的例子可清楚地看出,能結(jié)合粘蛋白型糖鏈的蛋白質(zhì)可易于經(jīng)僅取代2個或3個氨基酸殘基獲得。這表明該技術(shù)對于修飾蛋白質(zhì)使與粘蛋白型糖鏈結(jié)合相當有用。實施例14將具有GalNAc受體活性的肽序列導入蛋白質(zhì)并在真核細胞中表達變異蛋白質(zhì)以結(jié)合粘蛋白型糖鏈實施例11至13證實了經(jīng)過導入一個合適的具有GalNAc受體活性的肽序列可將蛋白質(zhì)修飾成能在體外發(fā)揮用于GalNAc轉(zhuǎn)移的取代的功能。由于大腸桿菌缺乏粘蛋白型糖鏈的生物合成途徑,因此,應(yīng)將GalNAc體外轉(zhuǎn)移到大腸桿菌產(chǎn)生的重組蛋白質(zhì)。相反,由于真核細胞具有該途徑,它們可用于直接生產(chǎn)結(jié)合糖鏈的糖蛋白。因此,在本實施例中,制備包括編碼具有GalNAc受體活性的肽序列的DNA的堿基序列并在COS7細胞中表達以證實可生產(chǎn)結(jié)合粘蛋白型糖鏈的修飾蛋白質(zhì)。
與前面的實施例一樣,GST用作模型蛋白質(zhì)。在COS7細胞中表達已證明的GSF 3X Muc C1為有GalNAc轉(zhuǎn)移的而變異體蛋白質(zhì)GSTX為無轉(zhuǎn)移的GalNAc。
由于GST是細胞內(nèi)蛋白質(zhì),可經(jīng)過2步PCR過程制備向N端加有用于分泌的信號序列的GST-3X和GST-3X Muc C1基因。以下面所述的方式使用人促紅細胞生成素(hEPO)的信號序列[K.Jacobs et al.,Nature,Vol.313,pp.806-810(1985)]。
用Applied Biosystem的394 DNA/RNA合成儀制備下面4種不同的引物DNA。5′-AACTCGAGAATTCATGGGGGTGCACGAATG-3′(合成的DNA12)5′-CAATAACCTAGTATAGGGGAGCCCAGGACTGGGAGGCCCA-3′(合成的DNA13)5′-TGGGCCTCCCAGTCCTGGGCTCCCCTATACTAGGTTATTG-3′(合成的DNA14)5′-CCTCTAGATCGTCAGTCAGTCAGATGAAT-3′(合成的DNA15)在PCR過程的第一階段,使用含有作為模板DNA的hEPO cDNA的質(zhì)粒[H.Ohashi et al.,Biosci,Biotech,Vol.58,pp.758-759(1994)]以及合成的DNA12和13作為引物。用在58℃退火進行實施例13所述的PCR反應(yīng),用pGEX-3X作模板DNA,用合成的DNA14和15作引物也進行相似的PCR反應(yīng)。用氯仿抽提各反應(yīng)產(chǎn)物一次,并用乙醇沉淀兩次后,接著溶于50μl TE緩沖液中。經(jīng)過將1μl信號肽區(qū)域與1μl GST的PCR反應(yīng)產(chǎn)物混合作為制備模板DNA。用制備的模板DNA以及合成的DNA12和15作引物進行PCR過程的第二步驟。反應(yīng)與反應(yīng)產(chǎn)物的純化完全與實施例13所述相同。用限制性酶XhoI和SbaI剪切產(chǎn)物后,根據(jù)常規(guī)方法將由此獲得的片段插入pBluescript IIKS+的相同限制性酶位點之間。獲得的質(zhì)粒稱為pBEGST-3X。用PRISM,DYe Primer Cycle Sequencing Kit(-21 M31)或(M13 Rev)(AppliedBiosystems)以與實施例13所述相同的方式證實質(zhì)粒插入?yún)^(qū)的序列。
以與上面所述相同的方式制備GST-3X Muc C1的分泌型蛋白質(zhì)的基因,并用pGEX-3X Muc C1代替pGEX-3X。由此獲得pBEGST-3X Muc C1。
用限制性酶XhoI和XbaI切下pBEGST-3X和pBEGST-3X MucC1的插入序列并收集。隨后,根據(jù)常規(guī)方法將它們插入用于動物細胞的質(zhì)粒載體pSVL(Pharmacia Biotech)相同的限制酶位點之間以產(chǎn)生pSEGST-3X和pSEGST-3X Muc C1。圖19A和19B顯示了這些質(zhì)粒的限制性圖譜。可預期當質(zhì)粒導入動物細胞時,作為從天然GST N端第二個絲氨酸開始的變異GST的EGST-3X和EGST-3X Muc C1將被分泌進培養(yǎng)基中。
經(jīng)電穿孔將pSEGST-3X和pSEGST-3X Muc C1中的每一種導入COS7細胞(Riken Ceu Bank)。更具體地說,將10μg質(zhì)粒加入0.8mlPBS(-)中的大約5×106個細胞(Nissui Pharmaceutical)中,在1600V和25μF的條件下,在室溫下用Gene Pulser(Japan Biolaboratory)導入DNA。將細胞放在90mm實驗平皿上,在含10ml 10%胎牛血清(BaseCatalogue No.12,430)(Gibco BRL)的Dulbecco改良的Eagle培養(yǎng)基中37℃培養(yǎng)24小時,隨后轉(zhuǎn)移到10ml Dulbecco改良的Eagle培養(yǎng)基(BaseCatalogue No.26,063)(Gibco BRL)中37℃培養(yǎng)3天。
用1/2規(guī)模的實施例11描述的方法,用0.15ml谷胱甘肽Sepharose4B柱和來自大腸桿菌的粗制酶溶液純化培養(yǎng)上清液中分泌的變異體GST。用Centricon-10(Grace Japan)濃縮洗脫的級分并轉(zhuǎn)移到10mM磷酸鉀緩沖液(pH6.2)中。
由此獲得的EGST-3X和EGST-3X Muc C1顯示出的GST活性比與大腸桿菌中產(chǎn)生的GST-3X的相類似。然后對它們以下述方式進行包括糖苷酶處理和植物血凝集素印跡分析的分析。
在糖苷酶處理中,使用來自產(chǎn)脲節(jié)桿菌(Behlinger Mannheim)的神經(jīng)氨酸苷酶和來自肺炎雙球菌的O-葡聚糖酶(Genzyme)。向溶于40μl20mM磷酸鉀緩沖液(pH6.2)的大約300ng變異GST中加入40mU的神經(jīng)氨酸苷酶進行處理,接著將溶液在37℃靜置13小時。在使用神經(jīng)氨酸苷酶和O-葡聚糖酶的處理中,將上述神經(jīng)氨酸苷酶的反應(yīng)溶液在37℃加熱1小時,然后向其中加入2mU的O-葡聚糖酶,接著使其反應(yīng)12小時。作為對照制備一個在37℃靜置13小時的樣品及一個未處理的樣品。經(jīng)過加入相同量的2×SDS/樣品緩沖液將各樣品與SDS反應(yīng),并對15μl反應(yīng)產(chǎn)物進行SDS-PAGE。電泳后,用2D-銀染試劑II“DaiTchi”(Daiichi Pharmaceutical)染色凝膠檢測蛋白質(zhì)帶。
用DIC Glycan Differentiation Kit(Behlinger Mannheim)進行植物凝血素印跡分析。在這一分析中,一直到SDS-PAGE分析的程序都是與糖苷酶處理分析一樣進行的。隨后,將蛋白質(zhì)印跡到PVDF膜[MidoriOgasawara et al.,Protein Experiment Methods for the Study of MolecularBiology,Yodasha.,1994]上并用DIG標記植物血凝集素PNA分析半乳糖(β1-3)N-乙酰半乳糖胺(Galβ1-3 GalNAc)。
糖苷酶處理的結(jié)果如圖20所示,獲得的EGST-3X顯示為具有分子量大約為27k的基本上單一的帶,用任意糖苷酶處理,它的分子量都不發(fā)生變化。另一方面,EGST-3X Muc C1檢測為單條帶,它從其蛋白質(zhì)部分的預期的28k的分子量遷移到高分子量一側(cè)。然而,經(jīng)過用神經(jīng)氨酸苷酶或用神經(jīng)氨酸苷酶與O-葡聚糖酶結(jié)合處理時,該帶遷移到低分子量一側(cè)。這些事實表明典型的粘帶遷移到低分子量一側(cè)。這些帶表明典型的粘蛋白的型糖鏈結(jié)合到EGST-3X Muc C1上。糖蛋白質(zhì)的結(jié)構(gòu)推斷為具有結(jié)合唾液酸的Galβ1-3GalNAc。
圖21顯示了植物血凝素印跡分析的結(jié)果。不管是否用糖苷酶處理,對EGST-3X檢測不到與植物血凝集素PNA反應(yīng)的帶。然而,在用神經(jīng)氨酸苷酶處理的EGST-3X Muc C1樣品中,大約28k的帶發(fā)生反應(yīng)。而且,在用神經(jīng)氨酸苷酸和O-葡聚糖酶處理的樣品中帶全部消失。因此,很清楚EGST-3X Muc C1蛋白質(zhì)部分具有Galβ-3GalNAc,Galβ-1-3GalNAc是典型的粘蛋白型糖鏈且唾液酸連接到糖鏈上。
從上面發(fā)現(xiàn),可經(jīng)過導入具有GalNAc受體活性肽序列和在真核細胞中分泌表達該蛋白質(zhì)將蛋白質(zhì)修飾成結(jié)合有包含3種或多種不同類型糖的典型粘蛋白糖鏈的糖蛋白。實施例15將具有GalNAc受體活性的各種肽序列導入蛋白并在真核細胞中分泌表達結(jié)合粘蛋白型糖鏈的修飾的蛋白質(zhì)實施例14顯示了經(jīng)過插入MAAATPAPM肽序列獲得的變異GST在COS7細胞中的分泌表達,產(chǎn)生的EGST-3X Muc C1具有典型的粘蛋白型糖鏈。因此,在本實施例中,證實為與實施例13中為體外轉(zhuǎn)移GalNAc而進行取代的GST-3X Muc C1一樣發(fā)揮功能的GST-3XMuc C2,GST-3X Muc C3和GST-3X Muc C4分別與信號肽融合,并在COS7細胞中分泌表達以證實粘蛋白型糖鏈可結(jié)合到表達的蛋白質(zhì)EGST-3X Muc C2,EGST-3X Muc C3和EGST-3X Muc C4上。
另外,還制備了在EGST-3X C端區(qū)+1位氨基酸是脯氨酸的具有GSPGNSS序列的GST-3X Muc C5。
為了分泌表達EGST-3X,EGST-3X Muc C1,EGST-3XMuc C2,EGST-3X Muc C3,EGST-3X Muc C4和EGST-3XMuc C5,按下面所述制備質(zhì)粒pEEGST-3X,pEEGST-3X MucC1,pEEGST-3X Muc C2,pEEGST-3X Muc C3,pEEGST-3X Muc C4和pEEGST-3X Muc C5。圖22顯示了它們的限制性圖譜和具有變異區(qū)的氨基酸序列。
用限制性酶XbaI剪切實施例14中所記載的pBEEGST-3X后,用限制性酶EcoRI部分消化以產(chǎn)生含有EGST-3X全長結(jié)構(gòu)基因的大約0.19kb的DNA片段。然后根據(jù)常規(guī)方法將該片段插入pEF18S[T.Kato et al.,J,Biochem,Vol,118,pp.229-236(1995)和S.Mizushima etal.,Nucleic Acid Res,Vol.18,5322(1990)]以產(chǎn)生pEEGST-3X。使用pEF18是期望實現(xiàn)高水平的表達,因為在實施例14中使用質(zhì)粒載體pSVL的變異GST表達程度不太高。
經(jīng)過使用pEBGST-3X Muc C1代替pBEGST-3X以上述相同的方式構(gòu)建pEEGST-3X Muc C1。
經(jīng)過用限制性酶BalI和Xba I剪切實施例13的pBGST C2來構(gòu)建pEEGST-3X Muc C2以產(chǎn)生大約0.15kb的DNA片段并用該片段代替pEEGST-3X中具有相同限制性酶位點的區(qū)域,還以實施例13的pBGST C3和pBGST C4分別構(gòu)建了pEEGST-3X Muc C3和pEEGST-3X Muc C4。
以下面所述相同的方式構(gòu)建pEEGST-3X Muc C5。合成下列引物DNA。5′-CGTCTAGACCGTCAGTCAGTCACGATGAATTGCCGGGGGTCCAC-3′(合成的DNA16)按實施例13所述進行PCR過程,并使用PEX-3X作為模板DNA,實施例13的合成的DNA7與合成的DNA16組合作為引物。反應(yīng)后,以實施例12所述的方法純化PCR反應(yīng)產(chǎn)物并用限制性酶SacI和XabI剪切。將該片段插入pBluescript II KS+(stratagene)的相同限制性酶位點之間。由此獲得的質(zhì)粒稱為pBGST C5。以373A DNA Sequencer(可以Applied Biosystem)和PRISM,Dye Primer Cycle Sequencing Kit(-21M13)或PRISM,Dye Primer CyCle Sequencing Kit(M13 Rev.)(AppliedBiosystems)證實插入片段的序列。經(jīng)過用限制性酶BalI和XbaI剪切pBGST C5獲得大約0.5kb的DNA片段并用pEEGST-3X的具有相同限制性酶位點的區(qū)域取代以產(chǎn)生pEEGST-3X的具有相同限性酶位點的區(qū)域取代以產(chǎn)生pEEGST-3X Muc C5。
將制備的質(zhì)粒pEEGST-3X,pEEGST-3X Muc C1,pEEGST-3X Muc C2,pEEGST-3X Muc C3,pEEGST-3X Muc C4和pEEGST-3X Muc C5分別導入COS7細胞中,純化從細胞分泌進培養(yǎng)基的變異GST并以實施例14所述的方式濃縮。獲得的EEGST-3X,EEGST-3X Muc C1,EGST-3X Muc C2,EGST-3X Muc C3,EGST-3X Muc C4和EGST-3X Muc C5顯示出的特異性活性水平與大腸桿菌產(chǎn)生的GST-3X相類似。經(jīng)13%SDS-PAGE和銀檢測蛋白質(zhì)帶來分析部分樣品。
圖23顯示了其結(jié)果。在實施例14中證明為沒有糖鏈結(jié)合其上的EGST-3X,顯示為大約27k的單一帶型。另一方面,在EGST-3XMuc C1的例子中,發(fā)現(xiàn)了在實施例14中證實結(jié)合粘蛋白型糖鏈的位置上的主要信號。發(fā)現(xiàn)相應(yīng)于無糖蛋白質(zhì)的大約28k的次要信號。同樣地,所有EEGST-3X Muc C2,PEEGST-3X Muc C3和PEEGST-3X Muc C1產(chǎn)生與EGST-3X Muc C1的情況相似的與結(jié)合粘蛋白型糖鏈的蛋白質(zhì)相對應(yīng)的一條帶。相反,EGST-3X Muc C5產(chǎn)生相應(yīng)于無糖鏈蛋白質(zhì)的主帶和相應(yīng)于結(jié)合粘蛋白型糖鏈的蛋白質(zhì)的次要帶。上述結(jié)果證明經(jīng)過將具有GalNAc受體活性的各種肽序列中的任意一種導入蛋白質(zhì)并在真核細胞中表達該蛋白質(zhì)可將蛋白質(zhì)修飾成典型的結(jié)合粘蛋白型糖鏈的糖蛋白。更具體地說,這些結(jié)果澄清了實施例1至10所述的具有GalNAc受體活性的各種肽序列可在真核細胞與粘蛋白型糖鏈相關(guān)的體內(nèi)生物合成途徑中較好地充當受體。另外,肽序列導入的結(jié)果證明該技術(shù)相當有用,因為粘蛋白型糖鏈的導入僅需要對包括蛋白質(zhì)中糖鏈結(jié)合位點氨基酸在內(nèi)的1至3個殘基進行修飾。而且,比較僅在+1位具有脯氨酸的EGST-3X Muc C5和在+l和+3位都具有脯氨酸的EGST-3X Muc C4表明后者具有更強的GalNAc受體活性,用于有效地在體內(nèi)生產(chǎn)結(jié)合粘蛋白型糖鏈的蛋白質(zhì)更有優(yōu)勢。
權(quán)利要求
1.含有由式(I)X(-1)-X(O)-X(1)-X(2)-X(3)(I)代表的序列的一種蛋白質(zhì)或肽,其中X(-1)和X(2)獨立地代表任何氨基酸,X(O)代表蘇氨酸(T)或絲氨酸(S),X(1)和(3)獨立地代表任何氨基酸,其前提是X(1)和X(3)中至少有一個代表脯氨酸(P)。
2.根據(jù)權(quán)利要求1的蛋白質(zhì)或肽,其中X(1)或(3)代表P或A且其中至少一個代表P。
3.根據(jù)權(quán)利要求1或2的蛋白質(zhì)或肽,其中X(1)代表P。
4.根據(jù)權(quán)利要求1或2的蛋白質(zhì)或肽,其中X(3)代表P。
5.根據(jù)權(quán)利要求1或2的蛋白質(zhì)或肽,其中X(1)或(3)代表P。
6.根據(jù)權(quán)利要求1至5中任意一項的蛋白質(zhì)或肽其中X(-1)代表Y,A,W,S,G,V,F(xiàn),T或I,X(2)代表A,P,C,K,R,H,S,M,T,Q,V,I,L或E。
7.根據(jù)權(quán)利要求1至6中任意一項的蛋白質(zhì)或肽其中X(0)代表T。
8.根據(jù)權(quán)利要求1至7中任意一項的蛋白質(zhì)或肽序列,其中X(-1)的N端一側(cè)另外存在一個或2個氨基酸,該氨基酸可以是A,P,G,E,Q,T,R或D。
9.根據(jù)權(quán)利要求1的肽,它選自如下序列ATPAPAATPAPAAATPAAAAATAAPPAATAAPAPATAAPAAPTAAPAAATAPPPAATPAPAPATPAPAAXaTPXbP其中Xa和Xb代表任何氨基酸,但Xa或Xb中有一個代表A,以及;AAATPAPXc其中Xc代表任何氨基酸。
10.根據(jù)權(quán)利要求1的蛋白質(zhì)或肽,其中蛋白質(zhì)或肽包含根據(jù)權(quán)利要求9的任一序列。
11.根據(jù)權(quán)利要求1至10中任意一項的蛋白質(zhì)或肽在制備作為UDP-GalNAc多肽α1,O-GalNAc轉(zhuǎn)移酶(O-GalNAc T)的底物的蛋白質(zhì)或肽及包含導入其中的GalNAc的應(yīng)用。
12.一種將粘蛋白型糖鏈導入蛋白質(zhì)或肽的方法,包含下列步驟提供根據(jù)權(quán)利要求1至10中任意一項的蛋白質(zhì)或肽;以及將作為底物的該蛋白質(zhì)或肽與粘蛋白型糖鏈反應(yīng),從而將粘蛋白型糖導入蛋白質(zhì)中。
13.將GalNAc導入蛋白質(zhì)或肽的方法,包含下列步驟提供根據(jù)權(quán)利要求1至10中任意一項的蛋白質(zhì)或肽;以及在UDP-GalNAc多肽α1,O-GalNAc轉(zhuǎn)移酶(O-GalNAc T)存在的條件下將作為底物的該蛋白質(zhì)或肽與UDP-GalNAc(其中UDP代表尿核苷5′-二磷酸,GalNAc代表N-乙酰半乳糖胺)反應(yīng)。
14.根據(jù)權(quán)利要求12或13的方法,其中根據(jù)權(quán)利要求1至10中任意一項的蛋白質(zhì)或肽是經(jīng)DNA重組或化學合成制備。
15.由根據(jù)權(quán)利要求12至14中任意一項的方法獲得的結(jié)合粘蛋白型糖鏈的蛋白質(zhì)或肽。
16.制備結(jié)合粘蛋白型糖鏈的蛋白質(zhì)或肽的方法,包含下列步驟用編碼根據(jù)權(quán)利要求1至10中任意一項的蛋白質(zhì)或肽的DNA轉(zhuǎn)化真核細胞;以及在轉(zhuǎn)化的細胞中表達蛋白質(zhì)或肽并從該種細胞中分泌蛋白質(zhì)或肽。
17.將粘蛋白型糖鏈導入感興趣的蛋白質(zhì)或肽之位置的方法,包含下列步驟將編碼由權(quán)利要求1限定的式(I)代表的序列的DNA插入或添加到在編碼感興趣的蛋白質(zhì)或肽的DNA中并且是與試圖導入粘蛋白型糖鏈的位點相對應(yīng)的位置中,或用編碼權(quán)利要求1限定的由式(I)代表的序列的DNA取代包括該位置的部分DNA片段,從而獲得含有編碼式(I)代表的序列的DNA的編碼蛋白質(zhì)或肽的DNA;用上面步驟獲得的DNA轉(zhuǎn)化真核細胞;以及在該種轉(zhuǎn)化的細胞中表達蛋白質(zhì)或肽并從該種細胞中分泌結(jié)合粘蛋白型糖鏈的蛋白質(zhì)或肽。
18.根據(jù)權(quán)利要求16或17的方法,其中真核細胞是動物細胞。
19.根據(jù)權(quán)利要求16或17的方法,其中含有編碼式(I)代表的序列的DNA的編碼蛋白質(zhì)或肽的DNA以載體的形式存在。
20.由根據(jù)權(quán)利要求16或17的方法獲得的結(jié)合粘蛋白型糖鏈的蛋白質(zhì)或肽。
21.編碼權(quán)利要求1限定的式(I)代表的序列的DNA序列。
22.編碼根據(jù)權(quán)利要求1至10中任意一項的蛋白質(zhì)或肽的DNA序列。
23.根據(jù)權(quán)利要求21或22的且插入載體中的DNA序列。
全文摘要
本發(fā)明公開了一種能特異性地將粘蛋白型糖鏈導入蛋白質(zhì)或肽的氨基酸序列以及利用該序列將粘蛋白型糖鏈導入蛋白質(zhì)或肽的技術(shù)。在UDP-GalNAc;多肽α1,O-GalNAc轉(zhuǎn)移酶(O-GalNAcT)存在的條件下將UDP-GalNAc(其中UDP代表尿核苷5′二磷酸、GalNAc)代表N-乙酰半乳糖胺)的GalNAc部分導入氨基酸X(0)X(-1)-X(O)-X(1)-X(2)-X(3) (I)其中X(-1)和X(2)獨立地代表任意氨基酸,X(O)代表T或S,X(1)和(3)獨立地代表任意氨基酸,前提是X(1)和(3)中至少有一個代表P。
文檔編號C07K14/435GK1142229SQ9519189
公開日1997年2月5日 申請日期1995年11月1日 優(yōu)先權(quán)日1994年11月1日
發(fā)明者吉田有人, 竹內(nèi)誠 申請人:麒麟麥酒株式會社