專利名稱:工程再造mRNA一級結(jié)構(gòu)以增強蛋白質(zhì)產(chǎn)生的制作方法
工程再造mRNA —級結(jié)構(gòu)以增強蛋白質(zhì)產(chǎn)生優(yōu)先權(quán)文件引用本申請依據(jù):35U. S. C. § 119(e)主張2009年2月M日申請的題為“Reengineering mRNA Primary Structure for Enhanced Protein Production,,的美國臨時申請第 61/155,049號的優(yōu)先權(quán)權(quán)益。上述申請的主題以全文引用的方式并入本文。
背景技術(shù):
真核生物中的翻譯起始包括通過mRNA在5'帽結(jié)構(gòu)或內(nèi)部核糖體進入位點 (IRES)上募集40S核糖體亞基和翻譯機構(gòu)的其它組分。40S亞基在被募集后移動到起始密碼子處。關(guān)于翻譯起始的一個被廣泛接受的觀點假設(shè),40S亞基從募集位點移動到起始密碼子,所述亞基以5'至3'方向掃描通過5'前導(dǎo)序列,直到遇到存在于良好核苷酸背景中的第一個 AUG 密碼子為止(Kozak “The Scanning Model for Translation :An Update"J. Cell Biol. 108 =229-241 (1989))。最近,已經(jīng)假設(shè)翻譯起始不包含掃描,但可能包含核糖體亞基束縛于帽結(jié)構(gòu)或IERS上,或核糖體亞基群集于內(nèi)部位點上(Chappell等人"Ribosomal shunting mediated by a translational enhancer element that base pairs to 18S rRNA”PNAS USA 103(25) :9488-9493(2006) ;Chappell 等人,“Ribosomal tethering and clustering as mechanisms for translation initiation,,PNAS USA 103 (48) 18077-82 (2006))。40S亞基移動到可到達的AUG密碼子處,所述AUG密碼子未必是mRNA中的第一個AUG密碼子。一旦亞基通過任何機制到達起始密碼子處,與亞基結(jié)合的起始物甲硫氨酸-tRNA則和起始密碼子進行堿基配對,大(60 核糖體亞基進行連接,且肽合成開始發(fā)生。因為一般認(rèn)為翻譯是由掃描機制起始,所以已經(jīng)考慮了 5'前導(dǎo)序列內(nèi)所含的 AUG密碼子(稱為上游AUG密碼子)對翻譯的影響,且已知5 ‘前導(dǎo)序列內(nèi)的AUG密碼子可對蛋白質(zhì)合成具有正面或負(fù)面影響,這取決于基因、核苷酸背景和細胞條件。舉例來說,上游AUG密碼子可通過使核糖體從真正起始密碼子轉(zhuǎn)移來抑制翻譯起始。然而,翻譯是由掃描機制起始的觀點沒有考慮編碼序列中的潛在起始密碼子對蛋白質(zhì)合成的影響。與此相反,翻譯起始的束縛/群集機制表明,編碼序列中的推定起始密碼子(其包括AUG密碼子和非規(guī)范密碼子)可被利用,從而通過與真正起始密碼子競爭核糖體來降低蛋白質(zhì)合成速率。微RNA(miRNA)介導(dǎo)的下調(diào)作用也可對翻譯效率造成負(fù)面影響。miRNA的長度一般介于21至23個核苷酸之間,并且是核糖核蛋白復(fù)合物的組分。已經(jīng)表明miRNA可通過與 mRNA進行堿基配對并降低mRNA穩(wěn)定性、新生肽穩(wěn)定性和翻譯效率而對蛋白質(zhì)含量造成負(fù)面影響(Eulalio 等人“Getting to the Root of miRNA—Mediated Gene Silencing”Cell 132 :9-14(1998))。雖然miRNA —般通過和mRNA的3'非翻譯區(qū)(UTR)中的結(jié)合位點進行堿基配對來介導(dǎo)其作用,但已經(jīng)顯示所述miRNA從編碼序列和5'前導(dǎo)序列內(nèi)所含的結(jié)合位點也具有類似的阻抑作用。堿基配對是通過所謂的“種子序列”來發(fā)生,所述種子序列包括miRNA的核苷酸2至8。在人類中存在超過1,000種不同的miRNA。
mRNA編碼序列和mRNA中的miRNA結(jié)合位點中的推定起始密碼子的負(fù)面影響對醫(yī)藥工業(yè)帶來挑戰(zhàn)。舉例來說,用于抗原生產(chǎn)、常規(guī)研究目的和基因療法應(yīng)用的蛋白質(zhì)藥物、 DNA疫苗的工業(yè)生產(chǎn)都受到蛋白質(zhì)合成的未達最佳速率或序列穩(wěn)定性影響。蛋白質(zhì)產(chǎn)量增加和蛋白質(zhì)濃度提高可減少與工業(yè)規(guī)模培養(yǎng)有關(guān)的成本,降低生產(chǎn)藥物的成本,且可促進蛋白質(zhì)純化。不佳的蛋白質(zhì)表達會限制某些技術(shù)的大規(guī)模應(yīng)用,例如在從DNA疫苗表達足夠的抗原方面有問題,從而無法產(chǎn)生免疫應(yīng)答以用于進行3期臨床試驗。
發(fā)明內(nèi)容
在本領(lǐng)域中需要提高蛋白質(zhì)翻譯的效率和穩(wěn)定性并提高蛋白質(zhì)產(chǎn)量和濃度,例如在蛋白質(zhì)藥物的工業(yè)生產(chǎn)中。公開了一種提高全長蛋白質(zhì)表達效率的方法。所述方法包括提供多核苷酸,其具有蛋白質(zhì)的編碼序列;在編碼序列上游的一級起始密碼子;和位于編碼序列內(nèi)的一個或多個二級起始密碼子。所述方法還包括使一個或多個二級起始密碼子發(fā)生突變,導(dǎo)致在所述一個或多個二級起始密碼子處的蛋白質(zhì)合成的起始發(fā)生減少,導(dǎo)致偏離一級起始密碼子的核糖體轉(zhuǎn)移(ribosomal diversion)減少,從而提高全長蛋白質(zhì)表達效率。所述方法還可包括使一個或多個核苷酸發(fā)生突變,使得氨基酸序列保持不變。一個或多個二級起始密碼子可與編碼序列處在相同的閱讀框內(nèi),或與編碼序列不同框。一個或多個二級起始密碼子可位于核糖體募集位點上游或下游一個或多個核苷酸的位置。核糖體募集位點可包含帽或IRES。一個或多個二級起始密碼子可選自AUG、ACG、GUG、UUG、CUG、 AUA、AUC和AUU。所述方法可包括使編碼序列內(nèi)的超過一個二級起始密碼子發(fā)生突變。所述方法可包括使編碼序列內(nèi)的所有二級起始密碼子發(fā)生突變。側(cè)翼核苷酸可突變成較不利的核苷酸背景。一個或多個二級起始密碼子發(fā)生突變可避免引入新的起始密碼子。一個或多個二級起始密碼子發(fā)生突變可避免引入miRNA種子序列。一個或多個二級起始密碼子發(fā)生突變可避免改變所突變密碼子的使用偏好。除全長被編碼蛋白質(zhì)以外的截短蛋白質(zhì)、多肽或肽的產(chǎn)生可得到減少。一個或多個二級起始密碼子發(fā)生突變可避免引入miRNA種子序列、剪接供體或受體位點或mRNA去穩(wěn)定元件。還公開了一種提高全長蛋白質(zhì)表達效率的方法。所述方法包括提供多核苷酸序列,其具有蛋白質(zhì)的編碼序列和位于編碼序列內(nèi)的一個或多個miRNA結(jié)合位點;和使一個或多個miRNA結(jié)合位點發(fā)生突變。突變導(dǎo)致一個或多個miRNA結(jié)合位點處的miRNA結(jié)合發(fā)生減少,導(dǎo)致由miRNA介導(dǎo)的蛋白質(zhì)翻譯下調(diào)作用發(fā)生減少,從而提高全長蛋白質(zhì)表達效率。所述方法還可包括使一個或多個核苷酸發(fā)生突變,使得氨基酸序列保持不變。所述方法可包括使miRNA種子序列中的一個或多個核苷酸發(fā)生突變。所述方法可包括使一個或多個核苷酸發(fā)生突變,使得起始密碼子不被引入多核苷酸序列中。所述方法可包括使一個或多個核苷酸發(fā)生突變,使得稀有密碼子不被引入多核苷酸序列中。所述方法可包括使一個或多個核苷酸發(fā)生突變,使得額外的miRNA種子序列不被引入多核苷酸序列中。一個或多個miRNA結(jié)合位點可位于編碼序列內(nèi)。一個或多個miRNA結(jié)合位點可位于3 ‘非翻譯區(qū)內(nèi)。一個或多個miRNA結(jié)合位點可位于5'前導(dǎo)序列內(nèi)。參照說明書的剩余部分和權(quán)利要求書,可對本公開書的本質(zhì)和優(yōu)點有進一步了解。
圖1A-1B顯示用CAT(菱形)或mCAT表達構(gòu)建體(正方形)轉(zhuǎn)化的大腸桿菌 (E. coli)DH5a細胞培養(yǎng)物的生長曲線;圖2顯示從用CAT (C)或mCAT (mC)表達構(gòu)建體轉(zhuǎn)化的大腸桿菌DH5 α細胞收集的溶菌物的蛋白質(zhì)印跡分析(Western blot analysis);圖3顯示用野生型CAT或經(jīng)修飾的CAT表達構(gòu)建體轉(zhuǎn)化的DG44細胞的提取物的蛋白質(zhì)印跡分析;圖4顯示用野生型⑶5 (cd5-l)或經(jīng)修飾的⑶5信號肽α -甲狀腺球蛋白輕鏈表達構(gòu)建體(cd5-2至cd5-5)轉(zhuǎn)化的DG44細胞的上清液的蛋白質(zhì)印跡分析。
具體實施例方式I.綜沭本文描述用于修飾天然mRNA或工程改造合成mRNA以提高被編碼蛋白質(zhì)的含量的方法。這些規(guī)則描述對mRNA編碼序列和3' UTR序列的修飾,旨在通過以下途徑增強蛋白質(zhì)合成1)通過編碼序列中的AUG或非規(guī)范(non-canonical)起始密碼子來減少核糖體轉(zhuǎn)移,和/或2)通過消除編碼序列中的miRNA結(jié)合位點來規(guī)避miRNA介導(dǎo)的下調(diào)作用。還描述了工程再造mRNA—級結(jié)構(gòu)的方法,其可用于提高特定蛋白質(zhì)在真核細胞和細菌細胞中的產(chǎn)量。本文所述的方法可應(yīng)用于蛋白質(zhì)藥物的工業(yè)生產(chǎn),以及研究目的、基因療法應(yīng)用和DNA疫苗以用于增加抗原生產(chǎn)。蛋白質(zhì)產(chǎn)量增加會最小化與工業(yè)規(guī)模培養(yǎng)有關(guān)的成本并降低藥物成本。此外,較高的蛋白質(zhì)濃度有利于蛋白質(zhì)純化。此外,使用本文所述的方法,先前因為較差的蛋白質(zhì)表達而無法實施的過程(例如在3期臨床試驗的實施中, 或在從DNA疫苗表達足夠抗原以產(chǎn)生免疫反應(yīng)中)可變得可能。II.定義本說明書不限于所描述的特定方法、實驗方案和試劑,它們可以變化。還應(yīng)了解本文所用的方法僅用于描述特定實施方案的目的,而不打算限制本發(fā)明方法的范圍,所述范圍將由隨附權(quán)利要求書描述。除非上下文明確指示,否則如本文所用的單數(shù)形式“一”和“所述”包括復(fù)數(shù)個指代物。因此,舉例來說,提及“一細胞”時包括多個所述細胞,且提及“一蛋白質(zhì)”時包括一種或多種本領(lǐng)域技術(shù)人員已知的蛋白質(zhì)和等同物,諸如此類。除非另外定義,否則本文所用的所有科學(xué)技術(shù)術(shù)語的含義與本公開書所屬領(lǐng)域的一般技術(shù)人員通常所了解的含義相同。以下參考文獻為所屬領(lǐng)域技術(shù)人員提供了本公開書中所用的許多術(shù)語的一般定義Academic Press Dictionary of Science and Technology, Morris (編),Academic Press (第 1 片反,1992) ;Oxford Dictionary of Biochemistry and Molecular Biology, Smith 等人(編),Oxford University Press (修訂版,2000) ;Encyclopaedic Dictionary of Chemistry, Kumar (編),Anmol Publications Pvt.Ltd. (2002) ;Dictionary of Microbiology and Molecular Biology, Singleton 等人(編),John Wiley & Sons (第 3 版,2002) ;Dictionary of Chemistry,Hunt(編),Routledge(第 1 片反,1999) ;Dictionary of Pharmaceutical Medicine, Nahler (編),Springer-Verlag Telos (1994) ;Dictionary of Organic Chemistry,Kumar 禾口 Anandand(編),Anmol Publications Pvt. Ltd. (2002);禾口 A Dictionary of Biology (Oxford Paperback Reference),Martin 禾口 Hine (編),Oxford University Press (第 4 版,2000)。這些術(shù)語中的部分術(shù)語在其具體地應(yīng)用于本公開書時得到進一步解釋。術(shù)語“試劑”包括任何物質(zhì)、分子、元件、化合物、實體或其組合。其包括(但不限于)例如蛋白質(zhì)、多肽、小有機分子、多糖、多核苷酸等。其可以是天然產(chǎn)物、合成化合物 (synthetic compound)、或化學(xué)化合物(chemical coumpound),或兩種或更多種物質(zhì)的組合。除非另外說明,否則術(shù)語“試劑”、“物質(zhì)”和“化合物”在本文中可互換使用。術(shù)語“順反子”意思是編碼單一多肽或蛋白質(zhì)的DNA單元。術(shù)語“轉(zhuǎn)錄單元”是指在其中發(fā)生RNA合成的DNA片段。術(shù)語“DNA疫苗”是指可引入宿主細胞或組織中并在其中由細胞表達以產(chǎn)生信使核糖核酸(mRNA)分子的DNA,mRNA然后被翻譯以產(chǎn)生由所述DNA編碼的疫苗抗原。術(shù)語“目的基因”旨在包括順反子、開放閱讀框(ORF)或編碼其產(chǎn)生將被調(diào)節(jié)的蛋白質(zhì)產(chǎn)物(目的蛋白質(zhì))的多核苷酸序列。目的基因的實例包括編碼治療蛋白質(zhì)、營養(yǎng)蛋白質(zhì)和工業(yè)用途蛋白質(zhì)的基因。目的基因還可包括報告基因或選擇標(biāo)記基因,例如增強型綠色熒光蛋白(EGFP)、熒光素酶基因(海腎(Renilla)或螢火蟲(Photinus))。表達是從DNA產(chǎn)生多肽的過程。所述過程涉及基因轉(zhuǎn)錄為mRNA和mRNA隨后翻譯為多肽。如本文所用的術(shù)語“內(nèi)源”是指通常在野生型宿主中發(fā)現(xiàn)的基因,而術(shù)語“外源”則是指通常不在野生型宿主中發(fā)現(xiàn)的基因?!八拗骷毎笔侵笖M引入或已經(jīng)引入異源多核苷酸序列的活細胞?;罴毎ㄅ囵B(yǎng)的細胞和活生物體內(nèi)的細胞。將異源多核苷酸序列引入細胞中的方式眾所周知,例如轉(zhuǎn)染、電穿孔、磷酸鈣沉淀、顯微注射、轉(zhuǎn)化、病毒感染等。擬引入細胞中的異源多核苷酸序列通常是復(fù)制表達載體或克隆載體。在一些實施方案中,宿主細胞可被工程改造成在其染色體上或在其基因組內(nèi)并入期望基因。可用于實施本發(fā)明方法的許多宿主細胞(例如CHO細胞)是用作此項技術(shù)中眾所周知的宿主。參看例如Sambrook等人,Molecular Cloning =A Laboratory Manual, Cold Spring Harbor Press (第 3 片反,2001);禾口 Brent 等人,Current Protocols in Molecular Biology,John Wiley & Sons,Inc. (Ringbou 編,2003)。在一些實施方案中,宿主細胞是真核細胞。術(shù)語“誘導(dǎo)劑”用于表示可實現(xiàn)從誘導(dǎo)型翻譯調(diào)節(jié)元件進行翻譯的化學(xué)、生物或物理試劑。暴露于誘導(dǎo)劑之后作出反應(yīng),從元件的翻譯一般從頭開始或增加至大于基礎(chǔ)表達或組成型表達水平的程度。誘導(dǎo)劑可以是例如細胞所暴露的壓力條件,例如熱激或冷激;毒性劑,例如重金屬離子;或營養(yǎng)物、激素、生長因子等的缺乏;或者可以是影響細胞生長或分化狀態(tài)的化合物,例如激素或生長因子。短語“分離或純化的多核苷酸”旨在包括一段多核苷酸序列(例如DNA),其已經(jīng)在兩端與其在生物體天然存在的基因組中直接鄰近的序列相分離。純化的多核苷酸可以是雙鏈或單鏈寡核苷酸;并入載體中的多核苷酸片段;插入真核或原核生物體的基因組中的片段;或用作探針的片段。短語“基本上純”當(dāng)涉及多核苷酸時意謂分子已經(jīng)與其它伴隨生物組分分離,因此典型地其具有樣品的至少85%或更高百分比。術(shù)語“核苷酸序列”、“核酸序列”、“核酸”或“多核苷酸序列”是指單鏈或雙鏈形式的脫氧核糖核苷酸或核糖核苷酸,且除非另外限制,否則涵蓋以與天然存在的核苷酸類似的方式和核酸雜交的天然核苷酸的已知類似物。核酸序列可以是例如原核生物序列、真核生物mRNA序列、來自真核生物mRNA的cDNA序列、來自真核生物DNA(例如哺乳動物DNA) 的基因組DNA序列、和合成DNA或RNA序列,但不限于此。術(shù)語“啟動子”意謂能引導(dǎo)轉(zhuǎn)錄并自其開始轉(zhuǎn)錄的核酸序列。在本領(lǐng)域中已知許多啟動子序列。舉例來說,所述元件可包括(但不限于)TATA盒、CCAAT盒、噬菌體RNA聚合酶特異性啟動子(例如T7、SP6和T3啟動子)、SP1位點和環(huán)AMP反應(yīng)元件。如果啟動子是誘導(dǎo)型,那么其活性會對誘導(dǎo)劑作出反應(yīng)而增加。5' (five prime)前導(dǎo)序列或非翻譯區(qū)(5'前導(dǎo)、5'前導(dǎo)序列或5' UTR)是信使RNA (mRNA)和編碼其的DNA的特定片段。其始于+1位置(轉(zhuǎn)錄在此處開始)且結(jié)束于編碼區(qū)的起始密碼子(典型地是AUG)之前。在細菌中,其可含有被稱為aiine-Delgarno 序列的核糖體結(jié)合位點(RBQ。5'前導(dǎo)序列的長度可在零核苷酸(在罕見的無前導(dǎo)序列信使中)至> 1,000個核苷酸的范圍內(nèi)。3' UTR往往更長(長達幾千堿基)。術(shù)語“可操作地連接”或“可操作地結(jié)合”是指遺傳元件之間的功能性連接,所述元件以允許其執(zhí)行正常功能的方式接合。舉例來說,如果基因的轉(zhuǎn)錄處于啟動子的控制下且所產(chǎn)生的轉(zhuǎn)錄物被正確地翻譯成通常由所述基因編碼的蛋白質(zhì),那么所述基因可操作地連接于啟動子。類似地,如果翻譯增強子元件允許從基因轉(zhuǎn)錄的mRNA的翻譯被上調(diào),那么所述翻譯增強子元件與所述基因可操作地結(jié)合。適用于定向連接的核苷酸序列(例如多聚接頭)是表達載體中可為多核苷酸序列定向連接至載體中而提供位點或手段的區(qū)域。典型地,定向多聚接頭是定義兩個或兩個以上限制性核酸內(nèi)切酶識別序列或限制位點的核苷酸序列。在限制性切割之后,所述兩個位點產(chǎn)生粘性末端,多核苷酸序列可通過所述粘性末端連接于表達載體。在一實施方案中,所述兩個限制性位點在限制性切割之后提供非互補且從而允許多核苷酸序列定向插入序列盒中的粘性末端。舉例來說,適用于定向連接的核苷酸序列可含有定義多個定向克隆手段的核苷酸序列。當(dāng)適用于定向連接的核苷酸序列定義多個限制性位點時,其被稱為多克隆位點。用于治療目的的術(shù)語“受試對象”是指分類為哺乳動物(例如人)和非人哺乳動物的任何動物。非人動物的實例包括狗、貓、牛、馬、綿羊、豬、山羊、兔等。除非另有說明,否則術(shù)語“患者”或“受試對象”在本文中可互換使用。在一實施方案中,受試對象是人。轉(zhuǎn)錄因子是指開始或調(diào)控轉(zhuǎn)錄所必需的任何多肽。舉例來說,所述因子包括(但不限于)c-Myc、c-Fos、c_Jun、CREB、cEts、GATA、GAL4、GAL4/Vpl6、c_Myb、MyoD、NF- κ B、 噬菌體特異性RNA聚合酶、Hif-I和TRE。編碼所述因子的序列的實例包括(但不限于)GenBank 登記號 K02276 (c-Myc)、K00650 (c-fos)、BC002981 (c-jun)、M27691 (CREB)、 X14798 (cEts)、M77810 (GATA)、K01486 (GAL4)、AY136632 (GAL4/Vpl6)、M95584 (c-Myb)、 M84918 (MyoD)、2006293A (NF-κ B)、NP 853568 (SP6RNA 聚合酶)、AAB28111 (T7RNA 聚合酶)、 NP 523301 (T3RNA 聚合酶)、AF364604 (HIF-I)和 XMM7 (TRE)?!盎旧贤坏摹焙怂峄虬被嵝蛄惺侵溉缤ㄟ^本文所述的眾所周知的程序(例如BLAST)之一、使用標(biāo)準(zhǔn)參數(shù)所測量,包含與參考序列具有至少90%序列同一性的序列的核酸或氨基酸序列。序列同一性可為至少95%、至少98%和至少99%。在一些實施方案中, 目標(biāo)序列的長度與參考序列相比大致相同,即它們由大致相同數(shù)目的連續(xù)氨基酸殘基(對于多肽序列來說)或核苷酸殘基(對于多核苷酸序列來說)組成。序列同一性可通過所屬領(lǐng)域中已知的各種方法來容易地確定。舉例來說,BLASTN 程序(用于核苷酸序列)使用以下默認(rèn)值字長(W)為11,期望值(E)為10,M= 5,N = -4, 和兩條鏈都比較。對于氨基酸序列,BLASTP程序使用以下默認(rèn)值字長(W)為3,期望值(E) 為 10,和 BL0SUM62 得分矩陣(參看 Henikoff & Henikoff,Proc. Natl. Acad. Sci. USA 89 10915(1989))。序列同一性百分比是通過在比較窗口上比較兩個最佳聯(lián)配的序列來確定, 其中與參考序列(其不包含添加或缺失)相比,多核苷酸序列在比較窗口中的部分可包含添加或缺失(即空位),以進行這兩個序列的最佳聯(lián)配。百分比是如下計算確定在兩個序列中存在相同核酸堿基或氨基酸殘基的位置的數(shù)目以得到匹配位置數(shù)目,將匹配位置數(shù)目除以比較窗口中的總位置數(shù)目,并將結(jié)果乘以100以得到序列同一性百分比。術(shù)語“治療”或“減輕”包括對受試對象施用化合物或試劑以預(yù)防或延遲疾病(例如心臟功能障礙)的癥狀、并發(fā)癥或生化指標(biāo)的開始,減輕癥狀,或阻止或抑制疾病、病癥或紊亂的進一步發(fā)展。需要治療的受試對象包括已經(jīng)罹患疾病或病癥的患者,以及容易患上病癥的受試對象或待預(yù)防病癥的受試對象。治療可以是預(yù)防性的(用于預(yù)防或延遲疾病的開始,或用于預(yù)防其臨床或臨床前癥狀的表現(xiàn)),或疾病表現(xiàn)后的癥狀的治療性抑制或減輕。在心臟重構(gòu)和/或心臟衰竭的治療中,治療劑可直接減輕疾病的病理,或使疾病更容易被其它治療劑所治療。術(shù)語“載體”或“構(gòu)建體”是指多核苷酸序列元件,其以確定的組織模式排列,以便可操作地連接于這些元件的基因/基因產(chǎn)物的表達可預(yù)測地受到控制。典型地,它們是可傳遞的多核苷酸序列(例如質(zhì)?;虿《?,外來DNA的片段可被剪接入其中,以便將外來 DNA引入宿主細胞以促進所述片段的復(fù)制和/或轉(zhuǎn)錄??寺≥d體是DNA序列(典型地是質(zhì)?;蚴删w),其可在宿主細胞中自主復(fù)制,且特征是具有一個或少量的限制性核酸內(nèi)切酶識別位點。外來DNA片段可在這些位點上剪接入載體中,以便實現(xiàn)片段的復(fù)制和克隆。載體可含有一個或多個適用于鑒別被轉(zhuǎn)化細胞的標(biāo)志物。舉例來說,標(biāo)志物可提供四環(huán)素或氨芐西林抗性。表達載體類似于克隆載體,但能誘導(dǎo)已經(jīng)克隆入其中的DNA在轉(zhuǎn)化入宿主中之后進行表達??寺〉腄NA通常處于特定調(diào)控序列(例如啟動子或增強子)的控制下(即可操作地連接于所述調(diào)控序列)。啟動子序列可以是組成型、誘導(dǎo)型或阻抑型的?!捌鹗济艽a子”或“起始三聯(lián)體”是順反子內(nèi)開始蛋白質(zhì)合成的位置。其一般位于編碼序列的5'端。在真核生物mRNA中,起始密碼子典型地由編碼氨基酸甲硫氨酸(Met) 的三個核苷酸(腺嘌呤、尿嘧啶和鳥嘌呤(AUG)核苷酸)組成。在細菌中,起始密碼子典型地也是AUG,但此密碼子編碼經(jīng)修飾的甲硫氨酸(N-甲?;琢虬彼?fMet))。在真核生物和細菌中,除AUG以外的核苷酸三聯(lián)體有時也用作起始密碼子?!跋掠纹鹗济艽a子”是指位于真正起始密碼子下游的起始密碼子,典型地在基因的編碼區(qū)中?!吧嫌纹鹗济艽a子”是指在5'前導(dǎo)區(qū)中位于真正起始密碼子上游的起始密碼子。如本文所用,“上游”和“下游”是指相對于真正起始密碼子的位置。舉例來說,mRNA序列上的上游密碼子是相對于序列中的另一個位置(例如真正起始密碼子)朝向mRNA序列5'端的密碼子,且下游密碼子是指相對于序列中的另一個位置朝向mRNA序列3'端的密碼子。如本文所用,“真正起始密碼子”或“一級起始密碼子”是指順反子中的起始密碼子,其編碼產(chǎn)生待被調(diào)節(jié)的被編碼目的蛋白質(zhì)的編碼序列的第一個氨基酸?!岸壠鹗济艽a子”是指除一級或真正起始密碼子以外的用于被編碼目的蛋白質(zhì)的起始密碼子。二級起始密碼子一般處在一級或真正起始密碼子的下游且位于編碼序列內(nèi)。如本文所用,“增加的蛋白質(zhì)表達”是指其中一個或多個二級起始密碼子被突變的被修飾mRNA的翻譯所產(chǎn)生的多肽濃度比從其中一個或多個二級起始密碼子未被突變的野生型mRNA獲得的多肽濃度高至少約5%、10%、20%、30%、40%、50%或以上。增加的蛋白質(zhì)表達也可以指被突變mRNA的蛋白質(zhì)表達是野生型mRNA的1. 5倍、2倍、3倍、5倍、10倍或以上。如本文所用,“核糖體募集位點”是指mRNA內(nèi)的位點,在被編碼蛋白質(zhì)的翻譯起始之前,核糖體亞基與所述位點結(jié)合。核糖體募集位點可包括帽結(jié)構(gòu)(一種在mRNA的5' 端發(fā)現(xiàn)的經(jīng)修飾核苷酸(m7G帽-結(jié)構(gòu))),和包含在mRNA中的被稱為內(nèi)部核糖體進入位點 (IRES)的序列。其它核糖體募集位點可包括Gtx同源異型域mRNA的9核苷酸序列。核糖體募集位點通常在真正起始密碼子的上游,但也可在真正起始密碼子的下游。如本文所用,“使用偏好”是指生物體對編碼相同氨基酸的幾種密碼子中的一種顯示特定偏好。改變使用偏好是指進行突變,導(dǎo)致對于相同氨基酸以高于或低于原始密碼子的優(yōu)先性使用不同的密碼子。如本文所用,“全長蛋白質(zhì)”是指涵蓋編碼蛋白質(zhì)的基因所編碼的基本上每一個氨基酸的蛋白質(zhì)。所屬領(lǐng)域技術(shù)人員已知在活細胞中一些蛋白質(zhì)存在細微修飾,因此蛋白質(zhì)實際上是一組具有細微變化的緊密相關(guān)的蛋白質(zhì)。舉例來說,一些但并非所有蛋白質(zhì)a)在氨基端去除氨基酸,和/或b)添加有可增加分子量的化學(xué)基團。所編碼的大多數(shù)細菌蛋白質(zhì)在蛋白質(zhì)的氨基端含有甲硫氨酸和丙氨酸殘基;在細菌細胞中,這些殘基中的一個或兩個經(jīng)常從蛋白質(zhì)的活性形式去除。這些類型的修飾典型地是異源的,因此并非所有修飾都對每個分子發(fā)生。因此,天然“全長”分子實際上是始于相同氨基酸序列但修飾方式有細微差別的分子家族。術(shù)語“全長蛋白質(zhì)”涵蓋這樣的分子家族。如本文所用,“拯救”或“修飾”是指從編碼區(qū)去除大部分至所有二級起始密碼子的核苷酸變化。“部分修飾”是指從編碼區(qū)去除二級起始密碼子的所有可能突變的子集的核苷
酸變化。III.經(jīng)由下游起始密碼子減少核糖體轉(zhuǎn)移如上所述,眾所周知包含于5 ‘前導(dǎo)序列內(nèi)的特征可影響翻譯效率。舉例來說,5 ‘ 前導(dǎo)序列內(nèi)的AUG密碼子(稱為上游AUG密碼子)對蛋白質(zhì)合成可具有正面或負(fù)面影響, 這取決于基因、核苷酸背景和細胞條件。上游AUG密碼子可通過使核糖體從真正起始密碼子轉(zhuǎn)移來抑制翻譯起始(Meijer 等人,“Translational Control of the Xenopus laevis Connexin-41 5' -Untranslated Region by Three Upstream Open Reading Frames,,J. Biol. Chem. 275(40) :30787-30793 (2000)) 舉例來說,Meijer 等人的圖 6 和圖 8 顯示 5' 前導(dǎo)序列內(nèi)的上游AUG密碼子的核糖體轉(zhuǎn)移效應(yīng)。
雖然AUG/ATG是許多物種中常用的翻譯起始密碼子,但是已知翻譯在體內(nèi)有時候也可在其它上游密碼子處起始,包括ACG、GUG/GTG、UUG/TTG、CUG/CTG、AUA/ATA、AUC/ATC 和AUU/ATT。舉例來說,已經(jīng)顯示,當(dāng)小鼠二氫葉酸還原酶(dhfr)的起始密碼子被突變?yōu)锳CG時,哺乳動物核糖體可在非AUG三聯(lián)體處開始翻譯(Peabody,D. S. (1987) J.Biol. Chem. 262,11847-11851) ο Peabody所進行的進一步研究顯示,dhfr的突變型起始密碼子AUG(GUG、UUG、CUG、AUA、AUC和AUU)都能夠引導(dǎo)表面上正常的dhfr的合成(Peabody, D. S. (1989) J. Biol. Chem. 264,5031-5035)。翻譯起始的束縛和群集模型假設(shè)翻譯可在易得到的起始密碼子處起始,且研究已經(jīng)顯示起始密碼子可在核糖體募集位點(帽或IREQ下游以距離依賴性方式使用 (Chappell 等人"Ribosomal tethering and clustering as mechanisms for translation initiation”PNAS USA 103(48) : 18077-822006)。這表明也可使用編碼序列中的推定起始密碼子。在下游起始密碼子或二級起始位點處的翻譯起始可與真正起始密碼子或一級起始位點競爭核糖體,且降低被編碼蛋白質(zhì)的表達。降低這些二級起始位點的可用性(例如通過使其突變成非起始密碼子)可提高一級起始位點對于核糖體的可用性并得到更有效的被編碼蛋白質(zhì)的表達。本發(fā)明方法允許改良且更有效的蛋白質(zhì)表達,且降低各種起始密碼子之間對于翻譯機構(gòu)的競爭。通過消除編碼序列中與被編碼蛋白質(zhì)處于相同閱讀框中的下游起始密碼子,功能可能改變的截短蛋白質(zhì)的產(chǎn)生也會被消除。此外,通過消除與編碼序列不同框的下游起始密碼子,各種肽的產(chǎn)生也會被消除,其中一些可能對細胞生理學(xué)或蛋白質(zhì)制造具有負(fù)面影響。這種優(yōu)勢對于DNA疫苗或基因療法中的應(yīng)用可能尤其重要。下游起始密碼子可發(fā)生直接突變,使得被編碼氨基酸序列保持不變。因為遺傳密碼是簡并的且大多數(shù)氨基酸是由兩種或兩種以上密碼子編碼,所以這在許多情況下是可能的。唯一的例外是甲硫氨酸和色氨酸,它們分別僅由一種密碼子AUG和UGG編碼。同樣也會考慮改變氨基酸序列的下游起始密碼子突變。在這些情況下,可評估改變氨基酸序列的影響?;蛘撸绻被嵝蛄写蛩惚3植蛔?,那么推定起始密碼子的側(cè)翼核苷酸有時候可經(jīng)突變以降低起始密碼子的效率。對于AUG密碼子來說,這可根據(jù)由Marilyn Kozak(Kozak, Μ. (1984)Nature 308,241-246)制定的核苷酸背景規(guī)則(nucleotide context rule)來進行,所述文獻描述,在優(yōu)異背景中的AUG在位置-3含有嘌呤且在+4含有G,其中AUG被編號成+1、+2、+3。對于非AUG密碼子,類似規(guī)則似乎適用于來自位置+5和+6的核苷酸的其它決定子。在設(shè)計突變時,密碼子使用偏好在許多情況下可保持相對不變,例如通過引入與野生型密碼子具有類似密碼子偏好的突變密碼子。因為不同的生物體具有不同的密碼子使用頻率,所以針對不同生物體的細胞中的表達的特定突變也會相應(yīng)改變。應(yīng)了解本文所公開的方法不限于真核細胞,同樣適用于細菌。雖然細菌翻譯起始被認(rèn)為與真核生物不同,但是核糖體募集仍然是通過mRNA中的順式元件發(fā)生,所述元件包括所謂的Siine-Delgarno序列。細菌中的非AUG起始密碼子包括ACG、GUG、UUG、CUG、AUA、 AUC 禾口 AUU0在一實施方案中,公開了對編碼序列的修飾,其通過經(jīng)由下游起始密碼子減少核糖體轉(zhuǎn)移來促進蛋白質(zhì)合成。這些密碼子可包括AUG/ATG和其它已知在細胞中用作起始密
11碼子的核苷酸三聯(lián)體密碼子,包括(但不限于)ACG、GUG/GTG、UUG/TTG、CUG/CTG、AUA/ATA、 AUC/ATC和AUU/ATT。在一個實施方案中,下游起始密碼子被突變。工程再造mRNA編碼序列以增加蛋白質(zhì)產(chǎn)生可包括使所有下游起始密碼子突變,或可包括僅使一些下游起始密碼子突變。在另一個實施方案中,側(cè)翼核苷酸被突變成較不利的核苷酸背景。在一實施方案中,信號肽中的ATG密碼子可突變成ATC密碼子,導(dǎo)致甲硫氨酸被異亮氨酸取代。在另一個實施方案中,信號肽中的CTG密碼子可突變成CTC。在另一個實施方案中,ATG密碼子可突變成ATC密碼子,導(dǎo)致從甲硫氨酸(M)到異亮氨酸(I)的氨基酸取代,且CTG密碼子可突變成CTC。在另一個實施方案中,ATG密碼子可突變成ATC密碼子,CTG密碼子可突變成CTC 密碼子,且起始物AUG的背景可通過將起始物的3 ‘密碼子由CCC改變?yōu)镚CT從而導(dǎo)致脯氨酸(P)到精氨酸(R)的氨基酸取代而獲得改善。在其它實施方案中,可對信號肽進行修飾, 其中可去除一個或多個AUG和CUG密碼子。進行的修飾可包括通過去除大部分潛在起始密碼子來修飾信號肽;去除信號肽的ATG和CTG ;去除ATG、CTG和ACG密碼子,導(dǎo)致谷氨酸 (E)到谷氨酰胺(Q)的氨基酸取代或組氨酸(H)到精氨酸00的氨基酸取代。可使用標(biāo)準(zhǔn)分子生物學(xué)技術(shù)來產(chǎn)生突變的核酸序列。所述技術(shù)包括各種核酸操作技術(shù)、核酸轉(zhuǎn)移實驗方案、核酸擴增實驗方案和所屬領(lǐng)域中已知的其它分子生物學(xué)技術(shù)。 舉例來說,可通過使用寡核苷酸介導(dǎo)的定點誘變將點突變引入目的基因中。也可通過使用所合成的具有期望突變的寡核苷酸,以合成方法產(chǎn)生被修飾的序列。這些方法可用于在一個位點或在整個編碼區(qū)中引入突變。或者,可使用同源重組將突變或外來序列引入目的靶序列中。核酸轉(zhuǎn)移實驗方案包括氯化鈣轉(zhuǎn)化/轉(zhuǎn)染、電穿孔、脂質(zhì)體介導(dǎo)的核酸轉(zhuǎn)移、 N-[l-(2,3-二油氧基)丙基]-N,N,N-三甲銨甲基硫酸鹽介導(dǎo)的轉(zhuǎn)化等。在一替代性誘變實驗方案中,也可使用正選擇壓力來選擇特定基因的點突變。參看例如Current Techniques in Molecular Biology (Ausubel等人編)。核酸擴增實驗方案包括(但不限于)聚合酶鏈?zhǔn)椒磻?yīng)(PCR)。所屬領(lǐng)域中眾所周知,對于各種各樣的病毒和細胞生物體可使用核酸工具, 例如質(zhì)粒、載體、啟動子和其它調(diào)控序列。此外,許多核酸工具可從多種不同來源獲得,包括 ATCC和各種商業(yè)來源。所屬領(lǐng)域技術(shù)人員根據(jù)所屬領(lǐng)域中的知識和設(shè)計選擇,可容易地選擇適當(dāng)工具和方法用于任何特定病毒或細胞生物體的遺傳修飾。也可使用各種標(biāo)準(zhǔn)方法測量蛋白質(zhì)表達。這些方法包括(但不限于)蛋白質(zhì)印跡分析、ELISA、代謝標(biāo)記和酶活性測量法。IV.規(guī)避miRNA介導(dǎo)的下調(diào)作用微RNA是一類含量豐富的非編碼小RNA,其一般用作負(fù)基因調(diào)節(jié)劑。在一實施方案中,可對包括5'前導(dǎo)序列、編碼序列和3' UTR在內(nèi)的mRNA序列進行修飾,以規(guī)避miRNA 介導(dǎo)的下調(diào)作用。所述修飾因此可改變mRNA或新生肽穩(wěn)定性,并增強蛋白質(zhì)合成和翻譯效率。miRNA可以是一般介于21至23個核苷酸之間的RNA,其是核糖核蛋白復(fù)合物的組分。miRNA可通過與mRNA的堿基配對來影響mRNA穩(wěn)定性或蛋白質(zhì)合成。miRNA—般通過與mRNA的3' UTR中的結(jié)合位點的堿基配對來介導(dǎo)其作用。然而,已經(jīng)顯示其對編碼序列和5'前導(dǎo)序列內(nèi)的結(jié)合位點具有類似的阻抑作用。堿基配對是通過所謂的“種子序列” 來發(fā)生,所述種子序列由miRNA的核苷酸2至8組成。在人類中存在超過1,000種不同的 miRNA。
工程再造mRNA以規(guī)避miRNA介導(dǎo)的阻抑作用可包括使mRNA內(nèi)的所有種子序列突變。如同上文所述的起始密碼子突變一樣,這些突變可確保所編碼的氨基酸序列保持不變, 且不會引入起始密碼子、稀有密碼子或其它miRNA種子序列??墒褂糜嬎銠C程序根據(jù)目的細胞類型(例如用于在中國倉鼠卵巢細胞中表達的嚙齒動物細胞,或用于在人細胞系中表達或用于在DNA疫苗中應(yīng)用的人細胞)來工程再造 mRNA序列。此程序可重新編碼mRNA以消除除所述起始密碼子以外的潛在起始密碼子。在編碼序列中的同框AUG密碼子的情況下,如有可能,這些下游起始密碼子的背景可被弱化。突變可根據(jù)目的細胞系的密碼子偏好來進行,例如對于人細胞系可使用人密碼子偏好信息, 對于釀酒酵母(Saccharomyces cerevisiae)可使用釀酒酵母密碼子偏好信息,且對于大腸桿菌(E.coli)可使用大腸桿菌密碼子偏好信息。在高等真核生物mRNA中,則可在重新編碼的mRNA中搜索目的生物體中的所有已知種子序列,例如用于人細胞系的人種子序列。種子序列可基于以下考慮因素突變1)不破壞氨基酸序列,幻不顯著改變被突變密碼子的使用偏好,幻不引入新的推定起始密碼子。雖然本說明書含有許多細節(jié)且已參考其優(yōu)選實施方案而被描述,但是這些實施方案不應(yīng)視為限制所要求保護的方法或可能要求保護的主題的范圍,而是描述特定實施方案所特有的特征。所屬領(lǐng)域技術(shù)人員應(yīng)了解,在不偏離所描述的標(biāo)的物的含義的情況下,可在本發(fā)明中進行形式和細節(jié)上的各種變化。在本說明書中于單獨實施方案的情形下描述的某些特征也可在單一實施方案中組合實施。相反,在單一實施方案的情形下描述的各種特征也可在多個實施方案中分開實施或以任何合適的子組合實施。此外,雖然特征被上文描述為以特定組合且甚至如最初所主張的那樣起作用,但是所主張組合中的一個或多個特征在有些情況下可以從所述組合中去除,且所主張組合可針對子組合或子組合的變體。所述主題的范圍是由以下權(quán)利要求書限定。本說明書中引用的所有出版物、數(shù)據(jù)庫、GenBank序列、專利和專利申請以引用的方式并入本文中,其引用程度就如同各自具體地且個別地以引用的方式并入一般。實施例以下實施例用于進一步說明,而不是限制范圍。其它變體對于所屬領(lǐng)域的普通技術(shù)人員具有顯而易見性,且被隨附權(quán)利要求書所涵蓋。實施例1 修飾mRNA轉(zhuǎn)錄物內(nèi)的多個翻譯起始位點mRNA轉(zhuǎn)錄物的5’ -UTR和編碼區(qū)內(nèi)存在多個翻譯起始位點可降低翻譯效率,例如通過使核糖體從真正或已被證實的翻譯起始密碼子轉(zhuǎn)移?;蛘呋蛄硗猓谡嬲蛞驯蛔C實的翻譯起始密碼子下游存在多個翻譯起始位點可誘導(dǎo)一種或多種降低全長蛋白質(zhì)翻譯效率的蛋白質(zhì)同種型的翻譯。為了提高編碼有商業(yè)價值的人蛋白質(zhì)的mRNA轉(zhuǎn)錄物的翻譯效率,真正或已被證實的翻譯起始密碼子上游和下游的所有閱讀框內(nèi)的潛在翻譯起始位點被突變以消除這些位點。在此方法的優(yōu)選方面中,mRNA序列被改變,但編碼的所得氨基酸保持相同?;蛘?,誘導(dǎo)保守性變化,其取代具有類似物理性質(zhì)的氨基酸。規(guī)范翻譯起始密碼子是AUG/ATG。其它被鑒別的起始密碼子包括(但不限于)ACG、 ⑶G/GTG、UUG/TTG、CUG/CTG、AUA/ATA、AUC/ATC 和 AUU/ATT。細胞內(nèi)蛋白質(zhì)氯霉素乙酰轉(zhuǎn)移酶(CAT)氯霉素是一種通過結(jié)合50S核糖體亞基并防止肽鍵形成來干擾細菌蛋白質(zhì)合成的抗生素。抗性基因(cat)編碼乙酰轉(zhuǎn)移酶,所述酶通過乙酰化氯霉素的一個或兩個羥基來乙?;撍幬锊亩蛊涫Щ?。CAT的未經(jīng)修飾的開放閱讀框含有113個潛在起始密碼子(20個ATG (包括真正起始密碼子)、8個ATC、8個ACG、12個GTG、8個TTG、11個CTG、6 個 AGG、10 個 AAG、16 個 ATA 和 14 個 ATT 密碼子)(SEQ ID NO :120)。SEQ ID NO :121 是經(jīng)完全修飾的CAT 0RF,且SEQ ID NO 122是經(jīng)部分修飾的CAT 0RF,其中只進行部分潛在修飾。圖1A-1B顯示產(chǎn)生了細菌表達構(gòu)建體,其含有CAT順反子(CAT)和經(jīng)部分修飾的 CAT順反子(mCAT),且所述構(gòu)建體在大腸桿菌菌株DH5ci進行測試。DH5 α細胞用CAT和 mCAT表達構(gòu)建體轉(zhuǎn)化,并鋪板于LB/氨芐西林培養(yǎng)板上。從單一菌落獲得培養(yǎng)物,并在LB/ 氨芐西林( 50yg/ml)中在37°C于220rpm下振蕩培養(yǎng),直到通過測量培養(yǎng)物的A6tltl而確定了達到對數(shù)生長為止。培養(yǎng)物然后用LB/氨芐西林稀釋以獲得相當(dāng)?shù)摹。從用CAT表達構(gòu)建體轉(zhuǎn)化的DH5 α細胞獲得的培養(yǎng)物的Α_是0. 3,而從用mCAT表達構(gòu)建體轉(zhuǎn)化的DH5 α 細胞獲得的培養(yǎng)物是0.25。通過引入異丙基β-D-I-硫代半乳糖吡喃糖苷(IPTG, 最終濃度為0. 4mM),通過CAT和mCAT質(zhì)粒內(nèi)所含的Iac操縱子來誘導(dǎo)氯霉素乙酰轉(zhuǎn)移酶表達。將3毫升的每種培養(yǎng)物轉(zhuǎn)移到含有氯霉素的新鮮試管中,導(dǎo)致最終濃度為20、40、80、 160、320、640、1280和2560μ g/ml。培養(yǎng)物在37°C在220rpm下振蕩培養(yǎng),并以1小時的間隔測量每種培養(yǎng)物的A_。圖1A-1B顯示用CAT (菱形)和mCAT (正方形)表達構(gòu)建體轉(zhuǎn)化的DH5 α細胞培養(yǎng)物的生長曲線。通過加入IPTG(0.4mM終濃度)來誘導(dǎo)氯霉素乙酰轉(zhuǎn)移酶表達。將3毫升的含IPTG的培養(yǎng)物加入含有氯霉素的新鮮試管中,導(dǎo)致最終濃度為0、40、80、160、320、 640、1280和2560 μ g/ml。培養(yǎng)物在37°C在220rpm下振蕩培養(yǎng),并隨著時間測量每種培養(yǎng)物的A·。顯示了在320和640 μ g/ml氯霉素存在下生長的培養(yǎng)物的結(jié)果。X軸代表時間 (小時),Y軸代表經(jīng)歸一化(normalized)的A6tltl (相對于起始A6J。結(jié)果顯示在所有濃度下,用mCAT表達構(gòu)建體轉(zhuǎn)化的細菌的生長都要好于用CAT表達構(gòu)建體轉(zhuǎn)化的細菌。如圖1A-1B所示,在高濃度的氯霉素(320和640 μ g/ml)下,具有被修飾CAT的細胞仍然生長,而具有野生型CAT的細胞則不生長。這些結(jié)果表明,從mCAT構(gòu)建體表達了更多的功能性氯霉素乙酰轉(zhuǎn)移酶,從而允許用此種表達構(gòu)建體轉(zhuǎn)化的細菌在此種抗生素存在下更好地生長。為了確定從用CAT和mCAT表達構(gòu)建體轉(zhuǎn)化的DH5 α細胞合成的氯霉素乙酰轉(zhuǎn)移酶的相對量,在IPTG誘導(dǎo)后5、30、60和90分鐘時對細胞提取物進行蛋白質(zhì)印跡分析。離心每個時間點的50 μ 1培養(yǎng)物,并將細菌顆粒再懸浮于30 μ 1的TE緩沖液和10 μ 1的4Χ SDS 凝膠上樣緩沖液中。樣品在95°C下加熱3分鐘,并上樣于10% Bis-Tris/SDS聚酰胺凝膠上。蛋白質(zhì)轉(zhuǎn)移到PVDF膜上并用抗CAT抗體探測。圖2是在IPTG誘導(dǎo)后各個時間點,從用CAT(C)和mCAT(mCAT)表達構(gòu)建體轉(zhuǎn)化的DH5 α細胞獲得的溶菌物的蛋白質(zhì)印跡分析。 結(jié)果顯示,在測試的所有時間點,在用mCAT表達構(gòu)建體(mC)轉(zhuǎn)化的DH5 α細胞中,氯霉素乙酰轉(zhuǎn)移酶蛋白(19kDa標(biāo)志物之上)的量有明顯增加。在哺乳動物細胞中進行氯霉素乙酰轉(zhuǎn)移酶ORF的分析。將CAT ORF和經(jīng)部分修飾的CAT ORF克隆到含有CMV啟動子的哺乳動物表達構(gòu)建體中,并通過瞬時轉(zhuǎn)染到中國倉鼠卵巢(DG44)細胞中來進行測試。簡言之,使用Fugene 6 (Roche)轉(zhuǎn)染試劑,根據(jù)制造商的說
14明書,將0. 5 μ g每種表達構(gòu)建體和20ng表達β -半乳糖苷酶報告蛋白的共轉(zhuǎn)染對照質(zhì)粒 (pCMV β,Clontech)轉(zhuǎn)染到100,000個DG44細胞中。在轉(zhuǎn)染后24小時,使用250 μ 1裂解緩沖液裂解細胞。執(zhí)行Lac Z報告基因分析以確保樣品之間的轉(zhuǎn)染效率相等。將30μ1溶菌物加入10μ 1的4XSDS凝膠上樣緩沖液中。樣品在72°C下加熱10分鐘,并上樣于10% Bis-Tris/SDS聚酰胺凝膠上。蛋白質(zhì)轉(zhuǎn)移到PVDF膜上并用抗α-CAT抗體探測。圖3顯示用野生型CAT和經(jīng)修飾的CAT表達構(gòu)建體轉(zhuǎn)化的DG44細胞的提取物的蛋白質(zhì)印跡分析。細胞提取物于1XM0PS/SDS中在10% Bis-Tris凝膠上分級分離,轉(zhuǎn)移到 PVDF膜上并用抗CAT抗體探測。使用從細胞獲得的提取物一式三份地進行實驗,其中轉(zhuǎn)染效率相同。對使用野生型CAT的3個轉(zhuǎn)染和使用經(jīng)修飾CAT的3個轉(zhuǎn)染進行比較。CAT蛋白 (19kDa標(biāo)志物之上)的量在用經(jīng)修飾構(gòu)建體轉(zhuǎn)染的細胞中有明顯增加。結(jié)果顯示,CAT蛋白(19kDa標(biāo)志物之上)的量在用mCAT構(gòu)建體轉(zhuǎn)染的DG44細胞中有明顯增加。通過消除所得mRNA轉(zhuǎn)錄物內(nèi)的多個翻譯起始位點而對CAT ORF的修飾證明,這種技術(shù)可在除哺乳動物和細菌細胞以外的多種生物體中具有實際應(yīng)用。分泌蛋白質(zhì)這種技術(shù)的有用性也用分泌蛋白質(zhì)來研究。針對在智人⑶5分子(⑶QmRNA內(nèi)編碼的信號肽產(chǎn)生哺乳動物表達構(gòu)建體。產(chǎn)生哺乳動物表達構(gòu)建體,其中轉(zhuǎn)錄由CMV啟動子驅(qū)動,且其中cd5信號肽位于編碼針對甲狀腺球蛋白的抗體的輕鏈的ORF的5'端(cd5-l, SEQ ID NO :123)。⑶5信號肽序列含有7個潛在起始密碼子,包括3個ATG、1個TTG和3 個CTG密碼子。產(chǎn)生一系列表達構(gòu)建體。在一種變體中,cd5信號肽中的ATG密碼子改變?yōu)锳TC密碼子,導(dǎo)致甲硫氨酸被異亮氨酸取代(cd5-2,SEQ ID N0:124)o在另一種變體中, cd5信號肽中的CTG密碼子改變?yōu)镃TC(cd5-3,SEQ ID NO :125)。在另一種變體中,ATG密碼子突變成ATC密碼子,導(dǎo)致甲硫氨酸(M)到異亮氨酸(I)的氨基酸取代,且CTG密碼子改變?yōu)镃TC(cd5-4,SEQ ID NO 126)0在另一種變體中,ATG密碼子改變?yōu)锳TC密碼子,導(dǎo)致氨基酸甲硫氨酸(M)被異亮氨酸(I)取代,CTG密碼子改變?yōu)镃TC密碼子,且起始物AUG的背景通過將其3'端的密碼子由CCC改變?yōu)镚CT從而導(dǎo)致氨基酸脯氨酸(P)被精氨酸(R) 取代而得到改善(cd5-5,SEQ ID NO :127)。這些構(gòu)建體然后通過瞬時轉(zhuǎn)染到中國倉鼠卵巢(DG44)細胞中來測試。簡言之,使用Fugene 6 (Roche)轉(zhuǎn)染試劑,根據(jù)制造商的說明書,將0. 5 μ g每種表達構(gòu)建體和20ng表達β -半乳糖苷酶報告蛋白的共轉(zhuǎn)染對照質(zhì)粒(pCMVii ,Clontech)轉(zhuǎn)染到100,000個DG44 細胞中。在轉(zhuǎn)染后M小時,使用250 μ 1裂解緩沖液裂解細胞。執(zhí)行Lac Z報告基因分析以確保樣品之間的轉(zhuǎn)染效率相等。將30μ1上清液加入10μ1的4XSDS凝膠上樣緩沖液中。樣品在72°C下加熱10分鐘,并上樣于lO^Bis-Tris/SDS聚酰胺凝膠上。蛋白質(zhì)轉(zhuǎn)移到PVDF膜上并用α - κ輕鏈抗體探測。圖4顯示用野生型(cd5_l)和經(jīng)修飾的cd5信號肽α -甲狀腺球蛋白輕鏈表達構(gòu)建體(cd5-2至cd5-5)轉(zhuǎn)化的DG44細胞的上清液的蛋白質(zhì)印跡分析。細胞提取物于 1XM0PS/SDS中在10% Bis-Tris凝膠上分級分離,轉(zhuǎn)移到PVDF膜上并用α - κ輕鏈抗體探測。使用細胞上清液進行實驗,其中轉(zhuǎn)染效率相同。結(jié)果顯示,在信號肽中缺少CTG密碼子的表達構(gòu)建體(cd5-;3)的情況下,細胞上清液中分泌抗體輕鏈產(chǎn)物QSkDa之上)的含量有明顯增加。在信號肽中缺乏CTG、ATG密碼子且在真正起始密碼子周圍具有改善的核苷酸背景的表達構(gòu)建體(完全拯救)在上清液中也具有明顯增加的蛋白質(zhì)產(chǎn)物含量。含有輕鏈信號肽1的Thy-I可變輕鏈ORF (SEQ ID NO 128)含有104個潛在起始密碼子,包括8個ATG (包括真正起始密碼子)、15個ATC、6個ACG、14個GTG、4個TTG J6 個CTG、16個AGG、10個AAG、3個ATA和2個ATT密碼子。在信號肽中進行修飾,其中去除 AUG和CUG密碼子(SEQ ID NO 129) 含有輕鏈信號肽2的Thy-I可變輕鏈ORF (SEQ ID NO 130)含有104個潛在起始密碼子,包括7個ATG (包括真正起始密碼子)、16個ATC、6個 ACG、13 個 GTG,4 個 TTG, 27 個 CTG、15 個 AGG、10 個 AAG,4 個 ATA 和 2 個 ATT 密碼子。含有重鏈信號肽1的Thy-I可變重鏈ORF含有225個潛在起始密碼子,包括18個ATG (包括真正起始密碼子)、14 個 ATC、18 個 ACG、42 個 GTG,7 個 TTG,43 個 CTG、43 個 AGG、33 個 AAG、 5個ATA和2個ATT密碼子(SEQ ID NO :131)。通過去除AUG和CUG密碼子(SEQ ID NO: 132)而在信號肽中進行修飾。含有重鏈信號肽2的Thy-I可變重鏈ORF含有227個潛在起始密碼子,包括18個ATG (包括真正起始密碼子)、14個ATC、18個ACG、43個GTG、9個TTG、 41 個 CTG、43 個 AGG、33 個 AAG、5 個 ATA 和 3 個 ATT 密碼子(SEQ ID NO :133)。其中信號肽被CD5信號肽置換的Thy-I可變輕鏈ORF (SEQ ID NO 137)含有104 個潛在起始密碼子,包括8個ATG (包括真正起始密碼子)、15個ATC、6個ACG、13個GTG、5 個TTG、27個CTG、14個AGG、10個AAG、3個ATA和2個ATT密碼子。進行其中ATG密碼子改變?yōu)锳TC密碼子的修飾,導(dǎo)致氨基酸甲硫氨酸(M)被異亮氨酸(I)取代(SEQ ID NO :138)。 也進行其中CTG密碼子改變?yōu)镃TC密碼子的修飾(SEQ ID NO :139)。進行另一種修飾,ATG 密碼子突變成ATC密碼子,導(dǎo)致氨基酸甲硫氨酸(M)被異亮氨酸(I)取代,且CTG密碼子改變?yōu)镃TC密碼子(SEQ ID NO :140)。進行另一種修飾,其中ATG密碼子改變?yōu)锳TC密碼子,導(dǎo)致氨基酸甲硫氨酸(M)被異亮氨酸(I)取代,CTG密碼子改變?yōu)镃TC密碼子,且起始物AUG的背景通過將其3'端的密碼子由CCC改變?yōu)镚CT從而導(dǎo)致氨基酸脯氨酸(P)被精氨酸(R)取代而得到改善(SEQ ID NO :141)。來自其它生物體的信號肽同樣也被突變(參看表1)。分析在酵母和哺乳動物細胞中起作用的信號肽的DNA序列,并使其突變以產(chǎn)生突變版本(SEQ ID NO :145-156)。應(yīng)理解,在從蛋白質(zhì)切割下來的信號肽中,同框ATG密碼子可被例如突變成ATT或ATC,以編碼異亮氨酸,它是另一種疏水氨基酸。可產(chǎn)生DNA構(gòu)建體,其含有與人單克隆抗體的輕鏈同框融合的這些信號序列。在不同生物體(例如畢赤酵母(Pichia pastoris)和哺乳動物細胞系)中表達時,可使用蛋白凝膠和Western分析來檢查人輕鏈抗體的表達水平。表1 在酵母和哺乳動物細胞中起作用的信號肽的DNA序列
權(quán)利要求
1.一種提高全長蛋白質(zhì)表達效率的方法,其包括a)提供多核苷酸,其包含i)所述蛋白質(zhì)的編碼序列; ) 一級起始密碼子,其位于所述編碼序列上游;和iii) 一個或多個二級起始密碼子,其位于所述編碼序列內(nèi);和b)使一個或多個二級起始密碼子突變,其中所述突變導(dǎo)致在所述一個或多個二級起始密碼子處蛋白質(zhì)合成的起始發(fā)生減少,所述蛋白質(zhì)合成的起始發(fā)生減少導(dǎo)致偏離所述一級起始密碼子的核糖體轉(zhuǎn)移減少,從而提高全長蛋白質(zhì)表達效率。
2.根據(jù)權(quán)利要求1所述的方法,其中使所述一個或多個二級起始密碼子突變包括使一個或多個核苷酸突變,使得氨基酸序列保持不變。
3.根據(jù)權(quán)利要求1所述的方法,其中所述一個或多個二級起始密碼子與所述編碼序列位于相同閱讀框內(nèi)。
4.根據(jù)權(quán)利要求1所述的方法,其中所述一個或多個二級起始密碼子與所述編碼序列不同框。
5.根據(jù)權(quán)利要求1所述的方法,其中所述一個或多個二級起始密碼子位于核糖體募集位點上游或下游一個或多個核苷酸的位置。
6.根據(jù)權(quán)利要求5所述的方法,其中所述核糖體募集位點包括帽或IRES。
7.根據(jù)權(quán)利要求1所述的方法,其中所述一個或多個二級起始密碼子選自AUG、ACG、 GUG、UUG、CUG、AUA、AUC 禾P AUU0
8.根據(jù)權(quán)利要求1所述的方法,其中所述編碼序列內(nèi)超過一個二級起始密碼子被突變。
9.根據(jù)權(quán)利要求1所述的方法,其中所述編碼序列內(nèi)所有二級起始密碼子被突變。
10.根據(jù)權(quán)利要求1所述的方法,其中使所述一個或多個二級起始密碼子突變包括使側(cè)翼核苷酸突變成較不利的核苷酸背景。
11.根據(jù)權(quán)利要求1所述的方法,其中使所述一個或多個二級起始密碼子突變并不引入新的起始密碼子。
12.根據(jù)權(quán)利要求1所述的方法,其中使所述一個或多個二級起始密碼子突變并不改變被突變密碼子的使用偏好。
13.根據(jù)權(quán)利要求1所述的方法,其進一步包括減少除該全長被編碼蛋白質(zhì)以外的截短蛋白質(zhì)、多肽或肽的產(chǎn)生。
14.根據(jù)權(quán)利要求1所述的方法,其中使一個或多個二級起始密碼子突變并不引入 miRNA種子序列、剪接供體位點、剪接受體位點或mRNA去穩(wěn)定元件。
15.一種提高全長蛋白質(zhì)表達效率的方法,其包括a)提供多核苷酸序列,其包含所述蛋白質(zhì)的編碼序列,和位于所述編碼序列內(nèi)的一個或多個miRNA結(jié)合位點;和b)使所述一個或多個miRNA結(jié)合位點突變,其中所述突變導(dǎo)致在所述一個或多個 miRNA結(jié)合位點處miRNA結(jié)合發(fā)生減少,所述miRNA結(jié)合發(fā)生減少導(dǎo)致由miRNA介導(dǎo)的蛋白質(zhì)翻譯的下調(diào)作用發(fā)生減少,從而提高全長蛋白質(zhì)表達效率。
16.根據(jù)權(quán)利要求15所述的方法,其中使所述一個或多個miRNA結(jié)合位點突變包括使一個或多個核苷酸突變,使得氨基酸序列保持不變。
17.根據(jù)權(quán)利要求15所述的方法,其中使所述一個或多個miRNA結(jié)合位點突變包括使 miRNA種子序列中的一個或多個核苷酸突變。
18.根據(jù)權(quán)利要求15所述的方法,其中使所述一個或多個miRNA結(jié)合位點突變包括使一個或多個核苷酸突變,使得起始密碼子不被引入所述多核苷酸序列中。
19.根據(jù)權(quán)利要求15所述的方法,其中使所述一個或多個miRNA結(jié)合位點突變包括使一個或多個核苷酸突變,使得稀有密碼子不被引入所述多核苷酸序列中。
20.根據(jù)權(quán)利要求15所述的方法,其中使所述一個或多個miRNA結(jié)合位點突變包括使一個或多個核苷酸突變,使得額外的miRNA種子序列不被引入所述多核苷酸序列中。
21.根據(jù)權(quán)利要求15所述的方法,其中所述一個或多個miRNA結(jié)合位點位于所述編碼序列內(nèi)。
22.根據(jù)權(quán)利要求15所述的方法,其中所述一個或多個miRNA結(jié)合位點位于3'非翻譯區(qū)內(nèi)。
23.根據(jù)權(quán)利要求15所述的方法,其中所述一個或多個miRNA結(jié)合位點位于5'前導(dǎo)序列內(nèi)。
全文摘要
本發(fā)明公開用于修飾天然mRNA或工程改造合成mRNA以提高其翻譯效率的規(guī)則。這些規(guī)則描述對mRNA編碼序列和3′UTR序列的修飾,旨在通過以下途徑增強蛋白質(zhì)合成1)通過編碼序列中的AUG或非規(guī)范起始密碼子來減少核糖體轉(zhuǎn)移,和/或2)通過消除編碼序列中的一個或多個miRNA結(jié)合位點來規(guī)避miRNA介導(dǎo)的下調(diào)作用。
文檔編號C12N5/10GK102428174SQ201080018081
公開日2012年4月25日 申請日期2010年2月24日 優(yōu)先權(quán)日2009年2月24日
發(fā)明者G·M·伊德爾曼, S·A·查佩爾, V·P·莫羅, 周偉 申請人:斯克利普斯研究所