專利名稱:優(yōu)化的sars冠狀病毒刺突蛋白基因的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及病毒學(xué)、基因工程學(xué)及疫苗學(xué),更具體地涉及優(yōu)化的SARS冠狀病毒刺突蛋白基因。此基因可運(yùn)用于在哺乳類動(dòng)物尤其是人類細(xì)胞環(huán)境中高效表達(dá)產(chǎn)生刺突蛋白。本發(fā)明還涉及含有該基因的載體及疫苗。
背景技術(shù):
非典型肺炎,簡(jiǎn)稱非典,又稱嚴(yán)重急性呼吸綜合癥(SARS)已蔓延到全球三十多個(gè)國(guó)家和地區(qū),尤為嚴(yán)重的包括中國(guó)、中國(guó)香港、新加坡、加拿大、越南、中國(guó)臺(tái)灣和美國(guó),短期內(nèi)已導(dǎo)致嚴(yán)重的生命財(cái)產(chǎn)損失。最近的流行病學(xué)研究估計(jì)在60歲以上患者,死亡率可高達(dá)近半數(shù)。
一種新的SARS冠狀病毒(SARS Coronavirus)已經(jīng)被確認(rèn)為是非典的致病誘因,該病毒的基因組已被測(cè)序并公布。SARS冠狀病毒為ssRNA(+)病毒,復(fù)制不經(jīng)過(guò)DNA中間體,使用標(biāo)準(zhǔn)密碼子。在電鏡下,病毒顆粒呈不規(guī)則形,直徑約為60-220nm,其表面有梅花形的膜粒,狀如皇冠。顆粒中心在負(fù)染電鏡下呈不定形態(tài),核殼體呈疏松狀態(tài)。包膜上有兩種糖蛋白S蛋白和M蛋白。S蛋白為刺突糖蛋白,是主要的抗原,與受體結(jié)合,使細(xì)胞融合。M蛋白為跨膜蛋白,參與包膜形成。此外,N蛋白也具有免疫原性。
發(fā)展疫苗為預(yù)防病毒感染的最有效的方法,并被證實(shí)已成功地運(yùn)用于多種致命的病毒感染,如天花、脊髓灰質(zhì)炎、麻疹、腮腺炎、甲型肝炎、乙型肝炎。為了有效地控制和預(yù)防SARS,人們正在開發(fā)各種SARS疫苗,其中主要有五種類型滅活疫苗、減毒活疫苗、重組亞單位疫苗、DNA疫苗和減毒病毒載體疫苗。
然而,迄今為止尚沒(méi)有真正有效的SARS疫苗問(wèn)世。因此,本領(lǐng)域迫切需要開發(fā)有效的SARS疫苗,尤其是能夠在宿主體內(nèi)大量引入或產(chǎn)生免疫原性SARS多肽的疫苗。
發(fā)明內(nèi)容
本發(fā)明的目的就是提供一種能夠在宿主體內(nèi)大量產(chǎn)生免疫原性SARS多肽的優(yōu)化的SARS冠狀病毒刺突蛋白基因,含有該基因的載體及疫苗。
在本發(fā)明的第一方面,提供了一種分離的核酸分子,它編碼SARS冠狀病毒的S蛋白或免疫原性片段,且其與天然的SARS冠狀病毒的S蛋白編碼序列的相同性為77±3%。
在另一優(yōu)選例中,所述的核酸分子編碼SEQ ID NO2所示的SARS冠狀病毒S蛋白。
在另一優(yōu)選例中,所述的核酸分子含有SEQ ID NO1所示的核苷酸序列。
在另一優(yōu)選例中,所述的核酸分子選自下組(a)SEQ ID NO1所示的核苷酸序列;(b)與SEQ ID NO1所示的核苷酸序列相同性大于95%,且編碼相同氨基酸序列的核苷酸序列。
在另一優(yōu)選例中,與天然的SARS病毒的S蛋白編碼序列相比,在哺乳動(dòng)物細(xì)胞中,所述核酸分子編碼的S蛋白的表達(dá)量提高至少100%。
在本發(fā)明的第二方面,提供了一種載體,它含有本發(fā)明上述的核酸分子。
在另一優(yōu)選例中,所述的載體是質(zhì)粒或病毒載體,更佳地所述的病毒載體是腺病毒。
在本發(fā)明的第三方面,提供了一種宿主細(xì)胞,它含有本發(fā)明上述的載體,或者被本發(fā)明上述的核酸分子所轉(zhuǎn)化。
在本發(fā)明的第四方面,提供了了一種組合物,它含有本發(fā)明上述的載體或核酸分子以及藥學(xué)上可接受的賦型劑或稀釋劑。
具體實(shí)施例方式
本發(fā)明人經(jīng)過(guò)深入而廣泛的研究,對(duì)SARS冠狀病毒的刺突蛋白的編碼序列進(jìn)行了一系列優(yōu)化。優(yōu)化后的編碼序列更適合于在哺乳動(dòng)物例如人類以及其他哺乳類動(dòng)物的細(xì)胞或組織環(huán)境中表達(dá),從而不僅更適合在哺乳動(dòng)物細(xì)胞系統(tǒng)大規(guī)模高效表達(dá)生產(chǎn)刺突蛋白,而且也更適合作為DNA疫苗。
本發(fā)明一種優(yōu)化的核苷酸序列如SEQ ID NO1所示,含3768bp,編碼與原始冠狀病毒刺突蛋白相同的氨基酸序列以保持其免疫抗原性質(zhì)。然而,此優(yōu)化合成的基因只與原始冠狀病毒刺突蛋白基因有77.6%相同性(或22.4%不同)。其1256個(gè)密碼子中的795個(gè)密碼子(或63%密碼子)已被改變,但保留了與原刺突蛋白相相同的氨基酸序列以優(yōu)化在哺乳類細(xì)胞中的表達(dá),以及用于疫苗的用途。
SEQ ID NO1所示的核苷酸序列被稱為“COSO”,意為優(yōu)化的冠狀病毒刺突蛋白基因(CoronavirusSpike proteinoptimized gene)。
應(yīng)理解,由于SARS病毒也會(huì)象其他病毒一樣發(fā)生變異,因此,對(duì)于氨基酸序列不同于SEQ ID NO2的變異的S蛋白,可以在SEQ ID NO1的基礎(chǔ)上,在相應(yīng)位置用相應(yīng)的哺乳動(dòng)物細(xì)胞優(yōu)選的密碼子替換相應(yīng)的SARS病毒的密碼子,從而獲得優(yōu)化的、編碼突變S蛋白的核苷酸序列。
如本文所用,術(shù)語(yǔ)“優(yōu)化的S蛋白編碼序列”是指SEQ ID NO1所示的核苷酸序列,以及與SEQ ID NO1相同性大于95%,較佳地大于96%,更佳地大于98%的核苷酸序列。與原SARS病毒的S蛋白核苷酸序列相比,在哺乳動(dòng)物細(xì)胞(如CHO細(xì)胞等)中,優(yōu)化的S蛋白編碼序列的表達(dá)量提高至少100%,更佳地提高至少200%或更高。
此外,本發(fā)明除了包括全長(zhǎng)的優(yōu)化的S蛋白編碼序列之外,還包括其片段,例如基于SEQ ID NO1所示序列且編碼免疫原性S蛋白片段的核苷酸序列。
本發(fā)明優(yōu)化的S蛋白編碼序列,可通過(guò)DNA重組技術(shù)導(dǎo)入脊椎類動(dòng)物,尤其是哺乳動(dòng)物例如人類以及其他哺乳類動(dòng)物的細(xì)胞或組織環(huán)境中,從而高效地表達(dá)刺突蛋白、免疫原性片段或其衍生產(chǎn)物。
本發(fā)明還提供了含有全部或部分優(yōu)化的S蛋白編碼序列的質(zhì)?;虿《据d體,以及因被所述質(zhì)粒轉(zhuǎn)入或病毒載體轉(zhuǎn)染入從而含有本發(fā)明優(yōu)選的S蛋白編碼序列的哺乳動(dòng)物宿主細(xì)胞。
一種優(yōu)選的病毒載體是腺病毒載體,例如目前已用于臨床疫苗試驗(yàn)的復(fù)制缺陷腺病毒載體,包括E1區(qū)域缺失型、E3區(qū)域或缺失或保留的5型或2型或其他亞型腺病毒。在某些情況下,腺病毒載體也可包括E1區(qū)域,但在其他區(qū)域被缺失。其他腺病毒載體可包括多區(qū)域缺失的載體,例如助手依賴型或全缺失型腺病毒載體。
在腺病毒基因組的E1區(qū)域或者E3區(qū)域或其他合適區(qū)域,可插入一個(gè)SARS病毒的S蛋白表達(dá)盒。該表達(dá)盒從5′→3′依次含有1)表達(dá)啟動(dòng)子(promoter);2)與所述啟動(dòng)子操作性相連的優(yōu)化的冠狀病毒S蛋白編碼序列(包括其變異體或衍生片段);3)與該優(yōu)化的編碼序列相連的多腺苷酸化信號(hào)序列。
除了腺病毒載體之外,其他的其他病毒載體包括但不局限于腺病毒相關(guān)病毒(AAV,adem-assocated virus)、痘病毒(vaccinia virus)等。
另一種優(yōu)選的載體是質(zhì)粒載體。在該質(zhì)粒載體中同樣插入SARS病毒的S蛋白表達(dá)盒。
通過(guò)培養(yǎng)導(dǎo)入本發(fā)明優(yōu)化的S蛋白編碼序列的哺乳動(dòng)物細(xì)胞,可以大規(guī)模高效率地生產(chǎn)S蛋白,然后用常規(guī)的分離和純化方法獲得純化的S蛋白。純化的S蛋白可用于生產(chǎn)抗體、SARS診斷試劑盒、和其他用途。
疫苗組合物本發(fā)明還提供了一種疫苗組合物,它包括攜帶全部或部分優(yōu)化的S蛋白編碼序列的質(zhì)?;虿《据d體,以及藥學(xué)上可接受的載體。當(dāng)本發(fā)明的疫苗組合物被施用于哺乳動(dòng)物(如人)時(shí),這些質(zhì)粒或病毒載體會(huì)在體內(nèi)高效表達(dá)刺突蛋白、免疫原性片段或其衍生產(chǎn)物,從而誘導(dǎo)機(jī)體產(chǎn)生體液免疫及細(xì)胞免疫以防治SARS冠狀病毒的感染。
可將藥用組合物制備成各種劑型,如粒劑、片劑、膠囊、懸浮液、噴霧、栓劑、透皮藥物(如貼片等)、油膏、洗劑等。
另外,本發(fā)明的疫苗組合物的配制還可含有其它成分,包括如佐劑、穩(wěn)定劑、pH調(diào)節(jié)劑、防腐劑等。這些成分是疫苗領(lǐng)域技術(shù)人員所熟知的。
給藥途徑和劑量當(dāng)用作疫苗時(shí),可用已知的方法將本發(fā)明的重組病毒載體施用于個(gè)體。通常采用與常規(guī)疫苗相同的施用途徑和/或模擬病原體感染路徑施用這些疫苗。給藥的常規(guī)和藥學(xué)上可接受的途徑包括鼻內(nèi)、肌內(nèi)、氣管內(nèi)、皮下、皮內(nèi)、肺內(nèi)、靜脈內(nèi)、經(jīng)鼻、經(jīng)口服或其它腸胃外給藥途徑。如果需要可以組合給藥途徑,或按抗原肽或疾病情況進(jìn)行調(diào)節(jié)。
疫苗組合物可以單劑量或多劑量給予,且可以包括給予加強(qiáng)劑量以引發(fā)和/或維持免疫力。
應(yīng)以“免疫有效量”給予本發(fā)明的疫苗,即重組病毒載體的量在所選用的給藥路徑中足以引發(fā)免疫應(yīng)答,能有效地促使保護(hù)宿主抵抗SARS病毒感染或SARS癥狀。
在各疫苗劑份中所選用的病毒載體的量,是按可引發(fā)免疫保護(hù)性應(yīng)答而無(wú)明顯的副作用的量而定。通常,在感染宿主細(xì)胞后,各劑份的疫苗足以產(chǎn)生約1-1000μg,較佳地為1-200μg,更佳地10-100μg蛋白質(zhì)。以病毒載體核酸為基礎(chǔ)計(jì)算的疫苗有效劑量,通常包括給予約1ug-100mg核酸。另外,病毒載體疫苗的有效劑量的一般范圍為約102-107,103-106或104-105空斑形成單位(PFU)。對(duì)于以腺病毒載體為例的非致病病毒疫苗載體,通常引入106-1012個(gè)腺病毒顆粒/每人,較佳地107-1011個(gè)腺病毒顆粒/每人??捎冒ㄓ^察對(duì)象中的抗體滴定度和其它反應(yīng)的標(biāo)準(zhǔn)研究方法來(lái)確定具體疫苗的最佳用量??赏ㄟ^(guò)監(jiān)控疫苗提供的免疫力水平來(lái)確定是否需要增強(qiáng)劑量。在評(píng)估了血清中的抗體滴定度后,可能需要選用增強(qiáng)劑量免疫接種。施用佐劑和/或免疫刺激劑可提高對(duì)SARS病毒的免疫應(yīng)答。
通過(guò)引介106至1012基因拷貝的非致病病毒疫苗載體腺病毒顆粒以攜帶此多核苷酸進(jìn)入脊椎類動(dòng)物尤以哺乳動(dòng)物例如人類以及其他哺乳類動(dòng)物的體內(nèi)以誘導(dǎo)抗SARS冠狀病毒的免疫反應(yīng)。
本發(fā)明的主要優(yōu)點(diǎn)在于(1)優(yōu)化的S蛋白編碼序列在哺乳動(dòng)物中的表達(dá)效率更高,因此生產(chǎn)S蛋白的效率高。
(2)優(yōu)化的S蛋白編碼序列在哺乳動(dòng)物中的表達(dá)效率更高,因此在接種的哺乳動(dòng)物體內(nèi)可產(chǎn)生更多的免疫原性S蛋白,從而有效地激發(fā)機(jī)體的免疫應(yīng)答。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說(shuō)明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按常規(guī)條件如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(New YorkCold SpringHarbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1優(yōu)化的S蛋白編碼序列的合成在本實(shí)施例中,根據(jù)公布的SARS冠狀病毒S蛋白的氨基酸序列SEQ ID NO2,以及哺乳動(dòng)物的優(yōu)選密碼子,并根據(jù)以下原則對(duì)編碼序列進(jìn)行優(yōu)化,(a)在不同物種之間密碼子的選用有偏好性;(b)密碼子選用的差異與翻譯速度相關(guān);(c)密碼子的上下文(context)及某一特定密碼子在某一特定位置的存在可嚴(yán)重影響翻譯速度;尤其是對(duì)某些特別影響翻譯速度的密碼子進(jìn)行了替換,設(shè)計(jì)出SEQ ID NO1所示序列。
然后用DNA合成儀(Mclab公司),通過(guò)常規(guī)方法,即先獲得寡核苷酸片段,然后將各片段退火,并PCR延伸,從而合成得到SEQ ID NO1的DNA序列。
SEQ ID NO1所示的優(yōu)化合成的基因只與原始冠狀病毒刺突蛋白基因有77.6%相同性(或22.4%不同)。其1256個(gè)密碼子中的795個(gè)密碼子(或63%密碼子)已被改變,但編碼與原刺突蛋白相相同的氨基酸序列以優(yōu)化在哺乳類細(xì)胞中的表達(dá)。
在本發(fā)明提及的所有文獻(xiàn)都在本申請(qǐng)中引用作為參考,就如同每一篇文獻(xiàn)被單獨(dú)引用作為參考那樣。此外應(yīng)理解,在閱讀了本發(fā)明的上述講授內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對(duì)本發(fā)明作各種改動(dòng)或修改,這些等價(jià)形式同樣落于本申請(qǐng)所附權(quán)利要求書所限定的范圍。
序列表<110>陳,凌陳,克勤<120>優(yōu)化的SARS冠狀病毒刺突蛋白基因<130>033945<160>2<170>PatentIn version 3.1<210>1<211>3768<212>DNA<213>人工序列<220>
<22 1>misc_feature<222>(1)..(3768)<223>優(yōu)化的SARS冠狀病毒S蛋白編碼序列<400>1atgttcatct tcctgctgtt cctgaccctg acctctggct ctgacctgga caggtgcacc 60acctttgatg atgtgcaggc ccccaactac acccagcaca cctcctccat gaggggcgtc 120tactaccctg atgagatctt caggtctgac accctgtacc tgacccagga cctgttcctg 180ccattctact ccaatgtgac aggcttccac accatcaacc acacctttgg caaccctgtg 240atcccattca aggatggcat ctactttgct gccacagaga agtccaatgt ggtgaggggc 300tgggtctttg gctccaccat gaacaacaag tcccagtctg tgatcatcat caacaactcc 360accaatgtgg tgatcagggc ctgcaacttt gagctgtgtg acaacccatt ctttgctgtc 420tccaagccca tgggcaccca gacccacacc atgatctttg acaatgcctt caactgcacc 480tttgagtaca tctctgatgc cttctccctg gatgtctctg agaagtctgg caacttcaag 540catctgaggg agtttgtctt caagaacaag gatggcttcc tgtatgtcta caagggctac 600cagcccattg atgtggtgag ggacctgcca tctggcttca acaccctgaa gcccatcttc 660aagctgcccc tgggcatcaa catcaccaac ttcagggcca tcctgacagc cttctcccct 720gcccaggaca tctggggcac ctctgctgct gcctactttg tgggctacct gaagcccacc 780accttcatgc tgaagtatga tgagaatggc accatcacag atgctgtgga ctgctcccag 840aaccccctgg ctgagctgaa gtgctctgtg aagtcctttg agattgacaa gggcatctac 900cagacctcca acttcagggt ggtgccctct ggcgatgtgg tgaggttccc caacatcacc 960aacctgtgcc catttggcga ggtcttcaat gccaccaagt tcccatctgt ctatgcctgg 1020gagaggaaga agatctccaa ctgtgtggct gactactctg tgctgtacaa ctccaccttc 1080ttctccacct tcaagtgcta tggcgtctct gccaccaagc tgaatgacct gtgcttctcc 1140aatgtctatg ctgactcctt tgtggtgaag ggcgatgatg tgaggcagat tgcccctggc 1200cagacaggcg tgattgctga ctacaactac aagctgcctg atgacttcat gggctgtgtg 1260ctggcctgga acaccaggaa cattgatgcc acctccacag gcaactacaa ctacaagtac 1320aggtacctga ggcatggcaa gctgaggcca tttgagaggg acatctccaa tgtgccattc 1380tcccctgatg gcaagccatg caccccccct gccctgaact gctactggcc cctgaatgac 1440
tatggcttct acaccaccac aggcattggc taccagccat acagggtggt ggtgctgtcc 1500tttgagctgc tgaatgcccc tgccacagtc tgtggcccca agctgtccac agacctgatc 1560aagaaccagt gtgtgaactt caacttcaat ggcctgacag gcacaggcgt gctgacccca 1620tcctccaaga ggttccagcc attccagcag tttggcaggg atgtctctga cttcacagac 1680tctgtgaggg accccaagac ctctgagatc ctggacatct ccccatgtgc ctttggcggc 1740gtctctgtga tcacccctgg caccaatgcc tcctctgagg tggctgtgct gtaccaggat 1800gtgaactgca cagatgtctc cacagccatc catgctgacc agctgacccc tgcctggagg 1860atctactcca caggcaacaa tgtcttccag acacaggctg gctgcctgat tggcgctgag 1920catgtggaca cctcctatga gtgtgacatc cccattggcg ctggcatctg tgcctcctac 1980cacacagtct ccctgctgag gtccacctcc cagaagtcca ttgtggccta caccatgtcc 2040ctgggcgctg actcctccat tgcctactcc aacaacacca ttgccatc1c caccaacttc 2100tccatctcca tcaccacaga ggtgatgcct gtctccatgg ccaagacctc tgtggactgc 2160aacatgtaca tctgtggcga ctccacagag tgtgccaacc tgctgctgca gtatggctcc 2220ttctgcaccc agctgaacag ggccctgtct ggcattgctg ctgagcagga taggaacacc 2280agggaggtct ttgcccaggt gaagcagatg tacaagaccc ccaccctgaa gtactttggc 2340ggcttcaact tctcccagat cctgcctgac cccctgaagc ccaccaagag gtccttcatt 2400gaggacctgc tgttcaacaa ggtgaccctg gctgatgctg gcttcatgaa gcagtatggc 2460gagtgcctgg gcgacatcaa tgccagggac ctgatctgtg cccagaagtt caatggcctg 2520acagtgctgc cccccctgct gacagatgac atgattgctg cctacacagc tgccctggtc 2580tctggcacag ccacagctgg ctggaccttt ggcgctggcg ctgccctgca gatcccattt 2640gccatgcaga tggcctacag gttcaatggc attggcgtga cccagaatgt gctgtatgag 2700aaccagaagc agattgccaa ccagttcaac aaggccatct cccagatcca ggagtccctg 2760accaccacct ccacagccct gggcaagctg caggatgtgg tgaaccagaa tgcccaggcc 2820ctgaacaccc tggtgaagca gctgtcctcc aactttggcg ccatctcctc tgtgctgaat 2880gacatcctgt ccaggctgga caaggtggag gctgaggtgc agattgacag gctgatcaca 2940ggcaggctgc agtccctgca gacctatgtg acccagcagc tgatcagggc tgctgagatc 3000agggcctctg ccaacctggc tgccaccaag atgtctgagt gtgtgctggg ccagtccaag 3060agggtggact tctgtggcaa gggctaccat ctgatgtcct tcccccaggc tgccccccat 3120ggcgtggtct tcctgcatgt gacctatgtg ccatcccagg agaggaactt caccacagcc 3180cctgccatct gccatgaggg caaggcctac ttccccaggg agggcgtctt tgtcttcaat 3240ggcacctcct ggttcatcac ccagaggaac ttcttctccc cccagatcat caccacagac 3300aacacctttg tctctggcaa ctgtgatgtg gtgattggca tcatcaacaa cacagtctat 3360gaccccctgc agcctgagct ggactccttc aaggaggagc tggacaagta cttcaagaac 3420cacacctccc ctgatgtgga cctgggcgac atctctggca tcaatgcctc tgtggtgaac 3480atccagaagg agattgacag gctgaatgag gtggccaaga acctgaatga gtccctgatt 3540gacctgcagg agctgggcaa gtatgagcag tacatcaagt ggccatggta tgtctggctg 3600ggcttcattg ctggcctgat tgccattgtg atggtgacca tcctgctgtg ctgcatgacc 3660tcctgctgct cctgcctgaa gggcgcctgc tcctgtggct cctgctgcaa gtttgatgag 3720gatgactctg agcctgtgct gaagggcgtg aagctgcact acacctaa3768<210>2<211>1255<212>PRT<213>SARS冠狀病毒(SARS Coronavirus)<400>2Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
1 5 10 15Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln20 25 30His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg35 40 45Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser50 55 60Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val65 70 75 80Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn85 90 95Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln100 105 110Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys115 120 125Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met130 135 140Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr145 150 155 160Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser165 170 175Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly180 185 190Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp195 200 205Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu210 215 220Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro225 230 235 240Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr245 250 255Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile260 265 270Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys275 280 285Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn290 295 300Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr305 310 315 320Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser325 330 335Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr340 345 350Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly355 360 365Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala370 375 380Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly385 390 395 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe405 410 415Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser420 425 430Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu435 440 445Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly450 455 460Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp465 470 475 480Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val485 490 495Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly500 505 510Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn515 520 525Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg530 535 540Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp545 550 555 560Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys565 570 575Ala Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser580 585 590Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr595 600 605Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr610 615 620Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu625 630 635 640His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile645 650 655Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys660 665 670Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala675 680 685Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile690 695 700Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys705 710 715 720Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu725 730 735Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile740 745 750Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys755 760 765Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe770 775 780Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile
785 790 795 800Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met805 810 815Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile820 825 830Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr835 840 845Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala850 855 860Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe865 870 875 880Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn885 890 895Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala900 905 910Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly915 920 925Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu930 935 940Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn945 950 955 960Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp965 970 975Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln980 985 990Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala995 10001005Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp101010151020Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala102510301035Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln104010451050Glu Arg Asn Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys105510601065Ala Tyr Phe Pro Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser107010751080Trp Phe Ile Thr Gln Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr108510901095Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly110011051110Ile Ile Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp111511201125Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser113011351140Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val114511501155Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys116011651170
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr117511801185Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile119011951200Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu Cys Cys120512101215Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly122012251230Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys123512401245Gly Val Lys Leu His Tyr Thr1250125權(quán)利要求
1.一種分離的核酸分子,其特征在于,它編碼SARS冠狀病毒的S蛋白或免疫原性片段,且其與天然的SARS冠狀病毒的S蛋白編碼序列的相同性為77±3%。
2.如權(quán)利要求1所述的核酸分子,其特征在于,它編碼SEQ ID NO2所示的SARS冠狀病毒S蛋白。
3.如權(quán)利要求1所述的核酸分子,其特征在于,它含有SEQ ID NO1所示的核苷酸序列。
4.如權(quán)利要求1所述的核酸分子,其特征在于,它選自下組(a)SEQ ID NO1所示的核苷酸序列;(b)與SEQ ID NO1所示的核苷酸序列相同性大于95%,且編碼相同氨基酸序列的核苷酸序列。
5.如權(quán)利要求1所述的核酸分子,其特征在于,與天然的SARS病毒的S蛋白編碼序列相比,在哺乳動(dòng)物細(xì)胞中,所述核酸分子編碼的S蛋白的表達(dá)量提高至少100%。
6.一種載體,其特征在于,它含有權(quán)利要求1所述的核酸分子。
7.如權(quán)利要求6所述的載體,其特征在于,它是質(zhì)粒。
8.如權(quán)利要求6所述的載體,其特征在于,它是病毒載體。
9.一種宿主細(xì)胞,其特征在于,它含有權(quán)利要求6所述的載體。
10.一種組合物,其特征在于,它含有權(quán)利要求6所述的載體和藥學(xué)上可接受的賦型劑或稀釋劑。
全文摘要
本發(fā)明公開了優(yōu)化的SARS冠狀病毒刺突蛋白基因,它編碼SARS冠狀病毒的S蛋白或免疫原性片段,且其與天然的SARS冠狀病毒的S蛋白編碼序列的相同性為77±3%(如SEQ ID NO1)。還提供了含有優(yōu)化的S蛋白編碼序列的載體、宿主細(xì)胞和疫苗組合物。經(jīng)優(yōu)化的S蛋白編碼序列在哺乳動(dòng)物細(xì)胞中的表達(dá)效率更高,因此生產(chǎn)S蛋白的效率更高,也能更有效地激發(fā)哺乳動(dòng)物產(chǎn)生抗SARS的免疫應(yīng)答。
文檔編號(hào)C12N15/50GK1570115SQ03141619
公開日2005年1月26日 申請(qǐng)日期2003年7月16日 優(yōu)先權(quán)日2003年7月16日
發(fā)明者陳凌, 陳克勤 申請(qǐng)人:陳克勤, 陳凌