国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株的全長基因序列的制作方法

      文檔序號:453129閱讀:493來源:國知局
      專利名稱:馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株的全長基因序列的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于病毒學(xué)和分子生物學(xué)專業(yè)領(lǐng)域,涉及對一種慢病毒疫苗株的全長基因序列的發(fā)現(xiàn),確切地說是闡明我國成功研制的用于控制馬傳染性貧血病的減毒活疫苗毒株的全基因結(jié)構(gòu)和序列、其編碼蛋白質(zhì)的序列以及它們的應(yīng)用范圍。
      馬傳染性貧血病毒(Equine Infectious Anemia Virus,EIAV)是引起馬屬動物發(fā)生傳染性貧血癥病原體,對畜牧業(yè)具有巨大危害,是獸醫(yī)界頗受重視的病原體之一。EIAV屬逆轉(zhuǎn)錄病毒科慢病毒屬(lentivirus),與同屬于慢病毒屬的人類免疫缺陷病毒(Human ImmunodificiencvVirus,HIV)在基因組結(jié)構(gòu),基因編碼蛋白以及基因調(diào)控方式等方面有許多相似之處(J.M.Coffin,The Structure And Classification of Retroviruses,inTheRetroviridae,Vol.1,p19,edited by J.A.Levy,Plenum press)。由于EIAV是最早發(fā)現(xiàn)的動物病毒之一和最先發(fā)現(xiàn)的慢病毒,其基因高度變異引起慢性遷延性的疾病和自身免疫性病理,從而成為研究慢病毒感染、免疫病理、病毒酶功能以及免疫保護(hù)機(jī)理的重要動物模型(R.C.Montelaro et,al Equine Retroviruses,Invol.2,P.257)。
      我國自六十年代起投入巨資對該病毒的生物學(xué)性狀進(jìn)行了研究,分離并培育出與國外EIAV毒株有明顯生物學(xué)差異的強(qiáng)毒株并進(jìn)行了體外驢白細(xì)胞傳代。經(jīng)過多年努力,逐步馴化了該病毒并使之成為無致病力,但可以使動物在接種之后產(chǎn)生免疫保護(hù)的疫苗株。該疫苗株自1976年開始生產(chǎn),1978年在全國大規(guī)模應(yīng)用(沈榮顯等,馬傳染性貧血免疫的研究。中國農(nóng)業(yè)科學(xué),第4期P1-15,1979)。至今已接種7000萬匹次的馬、騾、驢,完全控制了該病在我國的流行。
      對病毒基因組的研究是在70年代分子生物學(xué)技術(shù)發(fā)展并得到廣泛應(yīng)用之后才興起的?,F(xiàn)在GenBank中已發(fā)表的馬傳染性貧血病毒的基因組序列均來源于美國強(qiáng)毒株(Wyoming株)和日本強(qiáng)毒株(Goshun株),以及由它們衍生得到的細(xì)胞培養(yǎng)適應(yīng)株的基因序列。然而這些毒株均不是疫苗毒株。我國研制成功的EIAV弱毒疫苗至今還是目前世界上唯一經(jīng)過大規(guī)模應(yīng)用、長時間檢驗而被證明是安全和有效的慢病毒疫苗(R.C.Montelaro,et al.inVaccines against Retroviruses,Vol.4,P605,R.C.Montelaro et,al Equine Retroviruses,invol.2,P.257)。由于我國的馬傳染性貧血疫苗毒株是由經(jīng)典路線制造出的,其基因組序列尚未被闡明。這一方面不能從基因水平上保護(hù)我國的EIAV疫苗的知識產(chǎn)權(quán),另一方面也限制了該疫苗模型對其他慢病毒疫苗研制的指導(dǎo)作用。
      本發(fā)明的任務(wù)在于闡明一種能有效保護(hù)馬屬動物免于患馬傳染性貧血病的EIAV弱毒活疫苗株的全基因的結(jié)構(gòu)和核苷酸序列及由其編碼蛋白的結(jié)構(gòu)和氨基酸序列,保護(hù)我國自主知識產(chǎn)權(quán)。同時經(jīng)過將EIAV弱毒疫苗基因序列和蛋白結(jié)構(gòu)與EIAV強(qiáng)毒株進(jìn)行對比,揭示該疫苗毒株在傳代過程中毒力減弱的分子機(jī)理和其誘導(dǎo)保護(hù)性免疫的組分和機(jī)理,從而為至今尚未突破的包括HIV在內(nèi)的其他慢病毒疫苗的研究提供重要的參考。該發(fā)明可直接指導(dǎo)艾滋病疫苗和其它慢病毒疫苗的研制,進(jìn)一步研究該疫苗毒株及其各主要基因和所編碼的蛋白質(zhì)可分別用于EIAV疫苗株和EIAV強(qiáng)毒株的核酸鑒別診斷和血清學(xué)鑒別診斷試劑的研制,并且用其構(gòu)建的載體還可用于基因治療。
      本發(fā)明是通過以下技術(shù)手段實現(xiàn)的首先用PCR方法擴(kuò)增EIAV疫苗株的基因,分別克隆到質(zhì)粒載體中再進(jìn)行DNA序列的分析,得到該病毒的全長基因序列。
      經(jīng)傳統(tǒng)生物學(xué)手段研制的EIAV驢白細(xì)胞弱毒疫苗毒株(第125代),來源于農(nóng)業(yè)部授權(quán)該毒種保存單位中國農(nóng)業(yè)科學(xué)院哈爾濱獸醫(yī)研究所馬傳染性貧血研究室。該疫苗毒株在體外驢白細(xì)胞復(fù)制過程中以前病毒DNA的形式整合到驢白細(xì)胞的染色體上,本發(fā)明取此前病毒DNA作為擴(kuò)增病毒基因的材料。本發(fā)明首先利用基因組DNA提取試劑盒從病毒感染的驢白細(xì)胞中提取染色體DNA,并以此為模板用PCR方法擴(kuò)增EIAV疫苗毒株的前病毒DNA。擴(kuò)增引物的設(shè)計是根據(jù)國際EIAV強(qiáng)毒株序列,先用其各區(qū)段EIAV基因進(jìn)行預(yù)擴(kuò)增。經(jīng)過多次摸索,并根據(jù)對得到的擴(kuò)增片段進(jìn)行測序中獲得的EIAV疫苗株的部分序列資料,設(shè)計出EIAV疫苗弱毒株特異性引物,分段擴(kuò)增病毒基因并克隆到質(zhì)粒載體上,進(jìn)而對全部基因進(jìn)行克隆和序列測定,獲得了病毒基因組全長序列(見說明書附

      圖1)和其主要結(jié)構(gòu)基因(gag基因,pol基因和env基因)及主要調(diào)控基因(5’LTR,3’LTR,rev基因,S2基因,tat基因等)的序列(分別見說明書附圖4,6,8,2,3,12,14,10)。
      利用GCG軟件對全長基因序列的開放讀碼框架進(jìn)行分析,得到各個結(jié)構(gòu)基因及調(diào)控基因所編碼的蛋白質(zhì)的氨基酸序列(詳細(xì)序列分別見說明書附圖5,7,9,11,13,15)。各基因在全長基因序列中的組合方式以及它們的相對位置見說明書附圖1,各基因在全長基因序列中的具體位置見說明書附圖17。
      將得到的疫苗株序列與GenBank所發(fā)表的國際標(biāo)準(zhǔn)株序列(Wyoming株,GeneBankAccession NumberAF028232)進(jìn)行核苷酸和氨基酸同源性的比較,結(jié)果發(fā)現(xiàn),各基因與國外標(biāo)準(zhǔn)野毒株的核苷酸同源性在73.46-90.06%之間,其中env基因、rev基因和S2基因與國際標(biāo)準(zhǔn)株的差異較大,同源性分別為73.46%,73.54%和75.76%。氨基酸序列與國際標(biāo)準(zhǔn)株相應(yīng)序列的同源性比較結(jié)果發(fā)現(xiàn),外膜蛋白(Env蛋白)及Rev蛋白和S2蛋白的變異均較大,氨基酸同源性分別為67.41%,64.85%和54.54%(詳見說明書附圖18)。
      另外,還利用GCG軟件對該疫苗株各結(jié)構(gòu)基因和調(diào)控基因所編碼蛋白質(zhì)的二級結(jié)構(gòu)進(jìn)行預(yù)測,分析結(jié)果見說明附圖19,20,21,22,22,23,24。疫苗株Env和Tat蛋白二級結(jié)構(gòu)與國外標(biāo)準(zhǔn)株的相應(yīng)蛋白的二級結(jié)構(gòu)的比較發(fā)現(xiàn)有顯著差異(見說明書附圖25,26)。馬傳貧驢白細(xì)胞疫苗株的Env蛋白與國外標(biāo)準(zhǔn)強(qiáng)毒株(AF028232)的Env蛋白在多個區(qū)域的α螺旋、β片層和轉(zhuǎn)角等結(jié)構(gòu)都有不同,其中轉(zhuǎn)角結(jié)構(gòu)的數(shù)量和位置的不同,可能是導(dǎo)致了兩者間二級結(jié)構(gòu)有明顯差異的主要原因。馬傳貧驢白細(xì)胞疫苗株的Tat蛋白的二級結(jié)構(gòu)圖羧基端有一明顯的疏水基團(tuán)(菱形框所示),其臨近區(qū)域為β片層結(jié)構(gòu)并形成較集中的親水基團(tuán),其氨基端有四個轉(zhuǎn)角結(jié)構(gòu);國外標(biāo)準(zhǔn)強(qiáng)毒株(AF028232)的Tat蛋白的二級結(jié)構(gòu)圖的羧基端無疏水基團(tuán),其臨近區(qū)域為松散的無規(guī)則卷曲結(jié)構(gòu),并有兩個獨立的親水基團(tuán),其氨基端有豐富的轉(zhuǎn)角結(jié)構(gòu)。
      通過對氨基酸序列分析發(fā)現(xiàn),馬傳貧疫苗株的Env蛋白包含19個潛在的糖基化位點,國外標(biāo)準(zhǔn)強(qiáng)毒株(AF028232)的Env蛋白包含23個潛在的糖基化位點,各個位點的位置見見說明書附圖27。
      通過對各個基因編碼的蛋白組成及等電點(PI)進(jìn)行分析,得到各個蛋白的分子量和等電點,具體數(shù)據(jù)見說明書附圖28。
      本發(fā)明是在國內(nèi)外首次闡明我國研制的EIAV弱毒疫苗株的全基因序列,將從基因水平上提供對我國自主研制的該疫苗的知識產(chǎn)權(quán)保護(hù)。鑒于我國的EIAV弱毒疫苗是目前世界上唯一經(jīng)受過長時間和大規(guī)?,F(xiàn)場應(yīng)用驗證的安全而有效的慢病毒疫苗,本發(fā)明闡明的該疫苗弱毒株全基因序列和結(jié)構(gòu)的特征、各結(jié)構(gòu)基因和調(diào)控基因的特征及其編碼的蛋白質(zhì)的特征和功能將為其他慢病毒疫苗的研制提供重要的指導(dǎo),并將大大推動這些疫苗研究的進(jìn)程。當(dāng)前艾滋病毒(HIV)疫苗的研究正處于進(jìn)退兩難之中,一方面現(xiàn)有各類基因工程HIV疫苗均未顯示明顯有效的跡象,而另一方面顯示出一定保護(hù)作用的HIV弱毒活疫苗又因不安全而無法推進(jìn)(邵一鳴,艾滋病疫苗研究現(xiàn)狀及其發(fā)展方向,中國科學(xué)發(fā)展報告,1999,94-101,科學(xué)出版社)。歷史上在人及動物最有效的疫苗都是弱毒活疫苗(R.C.Montelaro,eta1.inVaccines against Retroviruses,Vol.4,P605,)。由于HIV和EIAV均屬慢病毒,其基因結(jié)構(gòu)和編碼蛋白的功能均很相似,因而EIAV弱毒疫苗的成功經(jīng)驗為艾滋病毒弱毒疫苗的研制提供了很好的借鑒。本發(fā)明使得這種對HIV疫苗具有重要意義的借鑒由可能變?yōu)楝F(xiàn)實。該發(fā)明除可直接指導(dǎo)艾滋病疫苗和其它慢病毒疫苗的研制外,通過進(jìn)一步研究該疫苗毒株及其各主要基因和所編碼的蛋白質(zhì)可分別用于對EIAV疫苗株和強(qiáng)毒株的核酸診斷和血清學(xué)診斷。使用EIAV弱毒疫苗株構(gòu)建攜帶外源基因的載體還有望用于基因治療。
      以下實施例對于本發(fā)明馬傳染性貧血病毒(EIAV)驢白細(xì)胞弱毒疫苗全長基因序列的應(yīng)用進(jìn)行詳細(xì)的說明,但不意味著限制本發(fā)明的內(nèi)容。
      實施例1馬傳染性貧血病毒(EIAV)驢白細(xì)胞弱毒疫苗全長基因結(jié)構(gòu)及序列分析可用于闡明該疫苗毒株的致弱機(jī)制和誘導(dǎo)保護(hù)性免疫的機(jī)理將EIAV弱毒疫苗全長基因序列與國外EIAV強(qiáng)毒株、中國EIAV強(qiáng)毒株及部分致弱株的序列進(jìn)行比較,從基因和蛋白水平來闡明強(qiáng)弱毒株之間在結(jié)構(gòu)和功能上的差異,從中確定與EIAV的致病性和免疫原性相關(guān)的基因及其蛋白的組分或基因及蛋白的調(diào)控機(jī)制,最終闡明EIAV驢白細(xì)胞弱毒疫苗毒力致弱和誘導(dǎo)保護(hù)性免疫的基因和蛋白結(jié)構(gòu)及其調(diào)控的機(jī)理,還可為研究逆轉(zhuǎn)錄病毒的基因調(diào)控和基因功能提供重要的理論基礎(chǔ)。實施例2馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗全長基因結(jié)構(gòu)和序列可用于艾滋病毒(HIV)及其他慢病毒減毒活疫苗的構(gòu)建。
      根據(jù)實施例1的設(shè)計方案,參照馬傳染性貧血病毒弱毒疫苗的致弱和免疫保護(hù)機(jī)制對艾滋病毒(HIV)及其它已發(fā)現(xiàn)的動物慢病毒,包括猴免疫缺損病毒(Simian ImmunodeficiencyVirus,SIV)、貓免疫缺損病毒(Feline Immunodeficiency Virus,F(xiàn)IV)、牛免疫缺損病毒(BovineImmunodeficiency Virus,BIV)、維斯納慢病毒(Visna Lentivirus)、和山羊關(guān)節(jié)炎腦炎病毒(Caprine Arthritis-Encephalitis Virus,CAEV)進(jìn)行基因改造,從而構(gòu)建相應(yīng)的減毒活疫苗,進(jìn)行實驗室和臨床研究。實施例3馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗全長基因結(jié)構(gòu)及序列和其編碼蛋白的氨基酸及其二、三級結(jié)構(gòu)分析可用于艾滋病毒(HIV)及其他慢病毒基因工程疫苗的構(gòu)建。
      根據(jù)實施例1的設(shè)計方案,將艾滋病毒(HIV)及其他慢病毒(SIV、FIV、BIV、Visna和CAEV等)的基因組避免或去除與毒力有關(guān)的基因,或根據(jù)基因序列及蛋白二級結(jié)構(gòu)分析結(jié)果(圖25、26、27)對有關(guān)蛋白進(jìn)行結(jié)構(gòu)改造,將能誘導(dǎo)保護(hù)性免疫的蛋白的基因分別克隆到各類表達(dá)載體中,構(gòu)建成各種形式(多肽、亞單位、病毒樣顆粒和活載體等)的基因工程疫苗,進(jìn)行實驗室和臨床研究。實施例4馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗全長基因序列及其編碼的蛋白質(zhì)的氨基酸序列可用于構(gòu)建基因重組抗原,用于馬傳染性貧血病毒感染的血清學(xué)診斷。
      根據(jù)馬傳染性貧血病毒疫苗株全基因序列及其編碼的氨基酸序列分析的研究結(jié)果,可以分別選取包含主要抗原表位的基因,構(gòu)建原核和真核表達(dá)載體,在大腸桿菌或真核細(xì)胞中表達(dá)EIAV蛋白,經(jīng)層析方法純化后可用于血清學(xué)診斷和制備診斷試劑。實施例5馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗全長基因序列可用于馬傳染性貧血病毒疫苗株和野毒株感染的PCR鑒別診斷。
      根據(jù)實施例2的研究結(jié)果,選擇EIAV野毒株和疫苗株的基因序列差異最大的區(qū)域設(shè)計PCR引物,根據(jù)PCR擴(kuò)增產(chǎn)物的差異來對強(qiáng)弱毒株的感染進(jìn)行鑒別診斷。實施例6馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗全長基因序列可用于構(gòu)建進(jìn)行基因治療的基因轉(zhuǎn)移載體。
      利用中國株馬傳染性貧血病毒疫苗株構(gòu)建用于基因治療的基因轉(zhuǎn)移載體。馬傳染性貧血病毒不能引起人類發(fā)病,采用文獻(xiàn)報道的方法構(gòu)建源于該疫苗株的基因轉(zhuǎn)移載體,不但可以克服以往所用的鼠白血病病毒來源的基因轉(zhuǎn)移載體的基因轉(zhuǎn)移效率較低和不能轉(zhuǎn)染未分裂細(xì)胞等缺陷,而且有較好的安全保障。實施例8利用GCG軟件包對馬傳染性貧血病毒驢白細(xì)胞疫苗株(chb101)的Env、Tat蛋白的二級結(jié)構(gòu)進(jìn)行預(yù)測分析,并與國外強(qiáng)毒株(GenBank Accession NumberAF028232)的Env、Tat蛋白的二級結(jié)構(gòu)進(jìn)行比較(如圖25、圖26所示),可以發(fā)現(xiàn)EIAV強(qiáng)毒株與疫苗毒株的蛋白在二級結(jié)構(gòu)水平上有顯著差異,其中α螺旋、β片層和轉(zhuǎn)角結(jié)構(gòu)的數(shù)量和位置均有不同。強(qiáng)烈提示這種蛋白質(zhì)高級結(jié)構(gòu)的差異可能是它們功能差異的基礎(chǔ),是基因工程、疫苗的重要候選抗原。根據(jù)此原理,也可對艾滋病毒和其他慢病毒的相應(yīng)蛋白基因進(jìn)行改造,以研究將其作為疫苗抗原的可能性。
      以下為說明書附圖的簡要說明圖1為馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株全長基因序列(8258個核苷酸),5’-3’方向。圖2為5’LTR(位于全長基因的第1-325位核苷酸)的全部DNA序列(5’-3’),包括U3區(qū)(核苷酸1-207位)、R區(qū)(核苷酸208-285位)和U5區(qū)(核苷酸286-325位),全長325個核苷酸。圖3為3’LTR(位于全長基因的第7922-8258位核苷酸)的DNA序列(5’-3’),包括U3區(qū)(核苷酸7922-8140位)、R區(qū)(核苷酸8141-8218位)和U5區(qū)(核苷酸8219-8258位),全長337個核苷酸。圖4為gag基因(位于全長基因的第466-1926位核苷酸)的全部DNA序列(5’-3’),全長1461個核苷酸。圖5為gag基因編碼的氨基酸序列,全長486個核苷酸。圖6為pol基因(位于全長基因的第1689-5120位核苷酸)的全部DNA序列(5’-3’)。圖7為pol基因編碼的氨基酸序列,全長1143個核苷酸。圖8為Env基因(位于全長基因的第5313-7904位核苷酸)的全部DNA序列(5’-3’)。圖9為env基因編碼的氨基酸序列,全長863個核苷酸。圖10為tat基因(包括第一外顯子位于全長基因的第365-462位核苷酸,第二外顯子位于全長基因的第5138-5276位核苷酸)的全部DNA序列(5’-3’),全長237個核苷酸。圖11為tat基因編碼的氨基酸序列,全長78個核苷酸。圖12為rev基因(包括第一外顯子位于全長基因的第5454-5546位核苷酸,第二外顯子位于全長基因的第7250-7651位核苷酸)的全部DNA序列(5’-3’),全長495個核苷酸。圖13為rev基因編碼的氨基酸序列,全長164個核苷酸。圖14為S2基因(位于全長基因的第5287-5493位核苷酸)的全部DNA序列(5’-3’)。圖15為S2基因編碼的氨基酸序列,全長68個核苷酸。圖16為EIAV驢白細(xì)胞弱毒疫苗株的基因結(jié)構(gòu)圖,圖中可見5’LTR,3’LTR,gag,pol,env,S2,rev,tat基因的相對位置和長度。圖17為馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株各功能基因在全長基因序列中的位置。圖18為馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株各功能基因的核苷酸序列及其編碼的氨基酸序列與國際標(biāo)準(zhǔn)株(Wyoming株,GeneBank Accession NumberAF028232)相應(yīng)序列的同源性比較結(jié)果圖19為馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株env基因編碼蛋白的二級結(jié)構(gòu)示意圖,圖標(biāo)1所指多邊形框代表親水基因,圖標(biāo)2所指菱形框代表疏水基因。圖20為馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株gag基因編碼蛋白的二級結(jié)構(gòu)示意圖,圖標(biāo)1所指多邊形框代表親水基因,圖標(biāo)2所指菱形框代表疏水基因。圖21為馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株pol基因編碼蛋白的二級結(jié)構(gòu)示意圖,圖標(biāo)1所指多邊形框代表親水基因,圖標(biāo)2所指菱形框代表疏水基因。圖22為馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株rev基因編碼蛋白的二級結(jié)構(gòu)示意圖,圖標(biāo)1所指多邊形框代表親水基因,圖標(biāo)2所指菱形框代表疏水基因。圖23為馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株tat基因編碼蛋白的二級結(jié)構(gòu)示意圖,圖標(biāo)1所指多邊形框代表親水基因,圖標(biāo)2所指菱形框代表疏水基因。圖24為馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株S2基因編碼蛋白的二級結(jié)構(gòu)示意圖,圖標(biāo)1所指多邊形框代表親水基因,圖標(biāo)2所指菱形框代表疏水基因。圖25為馬傳貧驢白細(xì)胞疫苗株的Env蛋白與國外強(qiáng)毒株(GenBank Accession NumberAF028232)的Env蛋白的二級結(jié)構(gòu)的比較示意圖。圖中chb101為疫苗株Env蛋白的二級結(jié)構(gòu)圖,af028232為國外強(qiáng)毒Env蛋白的二級結(jié)構(gòu)圖。圖標(biāo)1所指多邊形框代表親水基因,圖標(biāo)2所指菱形框代表疏水基因。比較可見二者在多個區(qū)域的α螺旋、β片層和轉(zhuǎn)角等結(jié)構(gòu)都有不同,其中轉(zhuǎn)角結(jié)構(gòu)的數(shù)量和位置的不同,可能是導(dǎo)致了兩者間二級結(jié)構(gòu)有明顯差異的主要原因。圖26為馬傳貧驢白細(xì)胞疫苗株的Tat蛋白與國外強(qiáng)毒株(GenBank Accession NumberAF028232)的Tat蛋白的二級結(jié)構(gòu)的比較示意圖。圖中chb101為疫苗株Tat蛋白的二級結(jié)構(gòu)圖,af028232為國外強(qiáng)毒株Tat蛋白的二級結(jié)構(gòu)圖。二者比較可見chb101的羧基端有一明顯的疏水基團(tuán)(菱形框所示),其臨近區(qū)域為β片層結(jié)構(gòu)并形成較集中的親水基團(tuán),其氨基端有四個轉(zhuǎn)角結(jié)構(gòu);af028232的羧基端無疏水基團(tuán),其臨近區(qū)域為松散的無規(guī)則卷曲結(jié)構(gòu),并有兩個獨立的親水基團(tuán),其氨基端有豐富的轉(zhuǎn)角結(jié)構(gòu)。圖27為馬傳貧弱毒疫苗株Env蛋白與國外強(qiáng)毒株Env蛋白潛在的糖基化位點圖。圖中chb101-env為為馬傳貧弱毒疫苗株Env蛋白的氨基酸序列,28232-env為國外強(qiáng)毒株Env蛋白的氨基酸序列,方框內(nèi)為潛在的糖基化位點的序列。圖28為馬傳貧弱毒疫苗株各功能蛋白的分子量及等電點的理論值,其中env基因編碼的前體蛋白包含19個糖基化位點,完全糖化后分子量視糖基化程度而定,表中所列為未經(jīng)糖基化的蛋白分子量。
      權(quán)利要求
      1.馬傳染性貧血病毒(Equine Infectious Anemia Virus,EIAV)驢白細(xì)胞弱毒疫苗株的全長基因序列,其特征在于該基因由8258個核苷酸組成,5’-3’的序列為1 TGTGGGGTTT TTATGAGGGG TTTTATAAAT GATTATAAGA GTAAAAAGAA GGGGGCTGAT GCTCTCATAA CCTTGTATAA CCCAAAGGAC TAGCTCATGT 100101 TGCTAGGCAA CTAAACCGCA ATATCCTGTA GTTCCTCTTG CGTTCCGCAT TTGTGACGTT TTAAGTTCCT GTTTTTACAG TATATAAGTG CTTGTATTCT 200201 GACAATTGGG CACTCAGATT CTGCGGTCTG AGTCCCTTCT CTGCTGGGCT AGACTAGCCT TTGTAATAAA TATAATTCTC TGCTAAGTCC CTGTCTCTAG 300301 TTTGTCTTGT TTTCAAGATC TAACAGCTGG CGCCCGAACA GGGACCTGAG GGCGCAGACC CTGCCTGCTG AACCTGGCTG ATCATAGGAT CCCTAGGACA 400401 GCAGAGGAGA ACTTACAGAA GTCTTCTGGA GGTGTTCCTG GCCACAACAC AGGAAGACAG GTAAGATGGG AGACTCTTTG ACATGGAGCA AAGCGCTCAA 500501 GAAGTTAGAG AAGGTGACGG TACAAGGGTC TCAAAAGCTA ACTACTGGTA ACTGTAATTG GGCGCTGAAT TTGGTGGACT TATTCCATGA CACCAATTTT 600601 GGTAAAGAAA AAGACTGGCA ATTAAGGGAC GTCATTCCAT TGTTAGAGGA CGTTTCCCAG ACGTTGTCAG GACAAGAGAG AGAGGCATTT GAAAAAACTT 700701 GGTGGGCAAT AGCTGCCGTT AAGATGGGCT TACAAATTAA TACTGTGAAT GATGCAAAAA CAACATTTTC TATATTAAAA GCCAAGTTTG AAAGAAAGAC 800801 TGCAAATAAT ACCAAAAAGC AGTCTGAGCC CGAGGAAGAA TACCCAATAA TGATTGATGG GGCTGGAAAC AGAAACTTTC GGCCATTAAC ACCCAGAGGA 900901 TATACTACCT GGGTAAATAC TATACAGCAA AACAATCTCT TAAATGAAGC TAGTGTGAAT TTATTTGGTA TTTTATCAGT AGACTGTACT TCTGAGGAAA 10001001TGAATGCATT TTTGGATGTA GTACCAGGAC AAGCAGGACA AAAACAAGTA CTATTGGATA ATCTTGATAA GATTGCAGAA GAATGGGATC GTAGGCACCC 11001101GTTGCCAAAT CCTCCATTAG TGGCACCACC ACAAGGGCCT ATTCCCATGA CAGCAAGGTT CATTAGGGGA TTGGGAGTTC CTAGAGAAAG ACAGATGAAA 12001201CCTGCTTTTG ATCAGTTTAG ACAAACTTAT AGACAATGGA TAATAGAAGC AATGACAGAA GGGATAAAAA TAATGATTGG GAAACCCAAA GCGCAAAATA 13001301TTAGGCAAGG ACCCAAAGAA CCCTATCCAG AGTTTATAGA CAGATTGCTG TCTCAGATAA AAAGTGAGGG ACATCCGGCT GATATAACTA AATTCCTGAC 14001401AGACACTTTA ACTATTCAGA ATGCTAATGA TGAATGCAAA AATGCTATGA GACATTTGAG GCCAGAAGAT ACTTTAGAAG AGAAAATGTA TGCATGTAGA 15001501GATATTGGCA CTATGAGACA AAAAATGGCA TTATTAGCCA AGGCACTTCA AGCAGGATTA GCTGGTCCTA TGAAGGGAGG AATATTTAAA GGGGGACCCT 16001601TAGGGGCGAA GCAGACATGT TATAATTGTG GAAAACCAGG ACATTTTTCT AGTCAATGTA AAGCACCTAA AATATGTTTT AAGTGCAAAC AGCCAGGACA 17001701TTTCTCAAAA CAATGTATAA ATGCTCCAAA AAACGGGAAA CAAGGGGCTC AGGGGAGGCC CCAGAAACAA ACTTTCCCTG TGCAGAAGGA GTCAATGAAC 18001801AAAACACAAA AAGAGGAGAA ACAGCAAGGG ACCTTATATC CAGATTTAAG TCAGATGAAA CAGGAATACA AGATCAAGGA AGAGGAAAAT CAAGAGGATC 19001901TCAATCTGAA CAGTTTGTGG GAGTAACTTA TAATTTAGAA AAGAGACCAA CTACAATAGT CTTGATTAAT GACACACCCT TAAATGTATT GTTGGACACA 20002001GGAGCAGACA CATCAGTACT AACTATTGCA CATTGTAATA GGTTAAAGTA TGGAGGAAGA AAATATCAAG GTACAGGTAT TGTTGGGGTT GGAGGTAATG 21002101TAGAAACATT TTCCACTCCT GTTACAGTGA AAAAGAAAGG AAAACAAATT AAAACTAGAA TGTTAGTAGC AGATATCCCA GTTACTATTT TGGGGCGAGA 22002201TATTCTTCAA GAATTAGGCG CACAATTACT AATGGCTCAA CTTTCAAAAG AAATAACCCC AAGAGAAATT AAATTAAAAA CAGGCACAGT AGGGCCTAAG 23002301GTTCCCCAAT GGCCACTTAC TAAAGAGAAG TTGTTAGGTG CTAAAGAAAT AGTCAAAAAA TTGTTGGATG AAGGTAAAAT ATCAGAAGCC AGTGATGATA 24002401ATCCTTATAA TTCTCCTATA TTTGTAATAA AAAAGAAATC TGGAAAGTGG AGATTATTGC AAGATTTAAG AGAGTTAATT AAGGGTGGTA CAAGTAGAAC 25002501TGAAATATCC AGAGGATTAC CTCATCCAGG GGGATTAATT AAATGTAATC ATATGACAGT ATTAGATATT GGAGATGCAT ATTTCACTAT ACCATTAGAT 26002601CCAAAGTTTA GACAATATAC AGCATTTACT GTGCCATCCA TTAATCATCA GGAACCAGAT AAAAGATATG TGTGGAATTG CTTGCCACAA GGTTTTGTGT 27002701TAAGTCCATA CATATATCAA AAAACATTAC AGGACATATT ACAAGCTTTT AGAGAAAGGC ATCCAGATGT ACAATTATAT CAATATATGG ATGATTTATT 28002801CATTGGGAGT AATGAATCTA AAAGACAACA TAAGGAACTA GTAGAAGAAT TAAGAGCTAT TCTTTTAGAA AAGGGCTTTG AGACGCCTGG GGATAAATTG 29002901CAGGAAGAAG CACCCTATAA TTGGCTGGGA TATCAACTTA GTCCAGGCAA TTGGAAAGTA CAAAAGATGC AATTAGAATT GGTAAAAGAG CCAACATTAA 30003001ATGATGTGCA AAAATCAAAG GGAAATATAA CATGGATGAG CTCAGGGGTT CCTGGATTAA CAGTGAAGCA AATAGCTGCT ACCACTAAAG GTTGCTTAGA 31003101TTTAAATCAT AAAGGTAGTA GGACCAGAGA AGCCCAAAAA GACTTAGAGG AAATTATTAA AAGTTTCAGA AGCTCAGGAT TCCCATATTA TAACCCAGAA 32003201GAAGAAGTAA TCTGTGAGAT TGAAATTACT AAAAATTATG AGGCTACTTA TATAATAAAA CAGTCTCAAG GAATAT1GTG GGCAGGAAAG AAAATTATGA 33003301GGGCTAATAA AGGATGGTCC GCAGCAAAAA ATCTAATGTT ATTGTTACAA CATGTAGCCA CAGAAAGTAT TGTTAGAATT GGAACATGTC CAAAATTTAA 34003401AGTACCTTTT ACTAAAGAAC AAGTCAAATG GGAAATGGAA AAGGGATGGT ATTATTCATG GCTACCAGAC ATGGTATATT CACATCAAGT TGTTCATGAT 35003501GATTGGAGAC TGAAATTAGT AGAGCAACCA ACATCTGGTA TAACAATTTA TACTGATGGG GGTAAACAGA ATGAAGAAGG AGTTGCAGCT TATGTGACTA 36003601 GTAATGGGAA AACTAAACAA AAAAGGTTAG GGCCTGTTAC TCATCAAACT GCTGAGAGGA TAGCAATACA AATGGCATTA GAAGATACTG AAGAGACATT 37003701 GGTAAATATA GTAACTGATA GTTACTACTG TTGGAAAAAT ATTACAGAAG GATTAGGGTT AGAAGGACCA GACAGCCCCT GGTGGCCAAT AATTCAAAAT 38003801 ATTAGGGCTA AAGAAATGGT TTATTTTGCT TGGGTACCAG GTCACAAAGG AATATATGGC AATCAATTGG CAGATGAGGC TACTAAAATA ACAGAGGAAA 39003901 TTATGTTAGC ATATCAAGGC ACACAGATTA GGGAAAAAAG AGATGAAGAT GCAGGGTATG ATTTGTGTAT TCCTTATGAC ATAATGATAC CTGTCTCTGA 40004001 GACAAAAGTT ATACCCACAG ATGTAAAAAT ACAGGTACCT CACAAATGTT TTGGATGGGT AACTGGTAAG TCATCAATGG CTAAGCAAGG ATTATTAATC 41004101 AATGGGGGAA TAATTGATGA AGGATACACA GGTGAAATAC AGGTAATTTG TACTAATATT GGAAAGAGTA ACATGAAACT CAGGGAAGGA CAAAAGTTTG 42004201 CACAATTAAT CATATTACAG CATCGATCAA ATGATAAACA AATCTGGGAT GAAAATAAAA CATCTCAAAG GGGAGATAAA GGGTTTGGAA GCACAGGTAT 43004301 ATTTTGGGTA GAGAATATCC AAGAGGCGCA AGATGAACAT GAAAATTGGC ATACATCTCC AAAGATATTG GCAAAAAGAT ATGGGTTACC ATTGACTGTA 44004401 GCTAAACAGA TAACTCAAGA ATGCCCTCAT TGTACTAAAC AAGGATCTGG ACCAGCAGGT TGTGTAATGA GATCTCCTAA TCATTGGCAG GCTGATTGTA 45004501 CACATTTAGA AAACAGGGTA ATAATGACAT TTGTAGAGTC TAATTCAGGA TACATTCATG CTACTCTATT GTCCAAAGAA AATGCCTTGT GTCCTTCATT 46004601 GGCTATTTTG GAATGGGTGA GGTTATTTTC TCCTAAATCT TTACATACAG ACAATGGTAC TAATTTTGTG GCAGAGTCAG TAGCAAATCT GTTGAAATTC 47004701 CTGAAGGTGA CACATACTAC AGGAATACCT TATCACCCAG AGAGCCAAGG CATTGTGGAA AGAGCAAACA GGACATTAAA AGAAAGAATT AAAAGTCATA 48004801 GAGGAAATAC TCAGACACTT GAAGCAGCAT TACAACTTGC TCTCATTACT TGTAACAAAG GGAGGGAAAG TATGGGAGGA CAAACTCCAT GGGAAGTATT 49004901 TATTACTAAT CAGGCTCAAA CAATACATGA AGAACTTTTA TTACAACAAG CACAATCTTC TAAAAAATTT TGTTTTTATA AAATTCCTGG TGAGCATAAT 50005001 TGGAAGGGGC CCACCAGAGT GTTGTGGAAA GGTGATGGAG CAGTAGTGGT CAATGATGAG GAAAAAGGAA TAATTGCTGT GCCTTTAACC AGGACTAAAT 51005101 TATTAATAAG ACCAAATTGA GCATTGTTTC AGGAATCACC ACCAGTCAGC TATCATTGTC AACTGTGTTT CCTGAGATCA TTGGGAATTG ACTACCTTGA 52005201 CAGCTCGCTG AAGAAGAAGA ACAAACAAAG ACAGAAGGCC ATCAGGGAGG AAGACAACCT CAGTATCTTG TTATAAGGTT TGGTGTATGG GATTATTTGG 53005301 TAAAGGGGTA ACATGGTCAG CATTACATTC TATGGGGGTA TCCCAGGGGG AATATCAACC CCTATCACCC AACAAACAGA ATCAACAGAC ACACAGAAAG 54005401 GGGATCATAT GGTATATCAA CCCTATTGTT ATAATGATAG CCATAAAGAA GAAATGGCAG AGACAAGAGA CACAAGATAC CAAGAAGAAA TGAACCGGAA 55005501 AGAAGATAAA GAAGATAAAA GAAAGAATAA CTGGTGGAAG ATAGGTATGT TCTTATTGTG TCTGTTAGAG ATCACTGGAG GATTCCTCTG GTGGTATGAG 56005601 AGGCAACAAC ATTCATATTA TATAAGATTG GTTACAATAG GAGGTAGACT GAATGGTTCA GGAATGACTA GTGCCATAAA ATGTTGGGGT TCATTTCCTG 57005701 GGTGTAGGCC ATTTACTAAC TATTTCAGTT ATGAGACTAA TAGGACTGTT AGTAGAGATA ATAATACTGC TACTCTGTTA GATACTTATC AAAGAGAAAT 58005801 AACAAACATA TACAGGACAT CTTGTGTGGA TAGTGATCAC TGTCAAGAAT ATAAATGTAA GCAAGTACAG TTGAAAAAGA ACAGCAATAA CATTATAATG 59005901 AATAATTGTA GTAACAATAG GTGTGAAGAG TTTTGGGGGT TTAGCTGGTT AGAATGTAAT CAGACAGAAA ATGCAATAAC TATATTGGTC CCAGAAATAG 60006001 AAATACAGCA AAGAAAGAAC ACTTGGATTC CAAAAAGGTG TGAGAAAACT TGGGCTAAGG TAAAACATTG TCCAATGGAT TTATTATATG GTATAAATAA 61006101 AATAAGAATG TGTGTCCAAC CTCCATTCTT TTTGTTTAAA CAGAATGATA CTTCTAATAA TACTAATATT CTCAGTAATT GTGGACCTTT AGTATTTCTT 62006201 GGAATATTTG AGGACAATAA GGCAGCAATC CAGAATGGGA GTTGCACTCT TCACAGGACA AATATTAACA GGCCAGATTA TAGTGGATTT TACCAAGTGC 63006301 CTATATTTTA TATATGCACC TTGACAGGAT TTCAAAGTTG TAATAATGGA TCAATAATTA GTATAATTAT GTATGAGTCT AATAATGTTC AATACTTGTT 64006401 ATGCAATACT AGTAATACTA ATAGTACCAA TAATGCTAAT GTCTCTTGTG TGGTACAAAG TTTTGGAGTG ATAGGACAGG CACATGTGGC ATTGCCCAGA 65006501 AAAAATAAGA GGTTACAATC TCCAAAGTTT GCTCACTATA ATTGCACCAT AAATAATAAA ACAGAGTTAA GGCGATGGCA ATTGGTAAAA ACATCAGGCA 66006601 TCACTCCTTT ACCCATTTCC TCTACAGCTA ATACTGGATT AGTCAGACAC AAGAGAGACT TTGGTATATC TGCTATAATA GCTGCCATTG TAGCTGCTAG 67006701 TGCTATTGCT GCTAGTGCTA CTATGTCTTA TATCGCTTTG ACAGAAGTCA ACAAATTAGA TAGTGTACAA AATCATACTT TTGAAGTAGA GAACAATACT 68006801 ATCAATAACA TAGAGTTAAC AGAAGAGCAA ATTCATATAT TATATGCTAT GGTTCTCCAA ACACATGCAG ATGTTCAATT GTTAAAAGAA CAACAAAAGA 69006901 TTGAGGAAAC ATTTAATTTA ATTGGATGTA TAGAAAGATC ACATACATTT TGTCATACTG GACATCCCTG GAATGAATCA TGGGGTCAGT TAAATGATTC 70007001 TACACAGTGG GATGACTGGG TAGATAAGAT GGAAAATTTA AATCATGATA TATTAACAAC ACTTCATACT GCTAGAAATA ATCTAGAACA ATCTATGATA 71007101 ACTTTCAATA CACCTGACAG TGTAGCACAA TTTGGAAAAA ATATTTGGAG TCATATTGCA AATTGGATTC CTAGATTAGG AGCTTCCATA ATTAAATATA 72007201 TAGTGTTGAT ATTACTTATA TATGTGTTAC TAACCTCTGC ACCTAAGATC CTCAGAGGCC TCTTGACAAC GATGAGTGGT GCAGGATCCT CCGCCAGTCG 73007301 CTACCTGAAG AAAAGATACC ATCACAAACA TGCATCGCGA GGAGACATCT GGGCCCAGGT CCAATATCAT GCGTACCTGG CAGACGAGAC TCATGGCTCA 74007401 GGGGACAAGT CCAACATGCG GAAGCTCTCC AGGAACAACT GGAATGGCGA ATCAGAGGAG TACAACAGAC GACAAAAAAA TTGGAAAAAG TTATTAAAGA 75007501 GATCTGGAGA GAATTACAAT ACACACGAAG ACAACATGGG GACTATGGGT CGTTTGGTGA CTACCGCCGC CGAGAAGAAG AACGTCGGGG TGAATCCTCA 76007601 CCAAGGGTCC TTAACCCTGG AGATTCAAAG CAAAGGAGGA AACATCTATG ACTGTTGCAT TAAGGCTCAA GAAGGAACTC TTGCTATTCC TTGCTGTGGC 77007701 TTCCCACTAT GGCCGTTTTG GGGACTTATA ATCATATTAG AACGCTTGTT GGGATATGGG CTTCGGGAAA TTGCAAAAAT TATAATGATT CTAGGGAAAG 78007801 GACTAAGTAT AATAATTACA GGATTAAGAA AATTATGTGA TTATATTGGG AAAATGCTAA ATCCAGCTAC ATCTCATGTA ACAATGCCTC AATATGATGT 79007901 TTAGAAAAAC AAGGGGGGAA CTGTGGGATT AATATAAGAT TCTTATAAGT GAATATGAAA GTTGCTGATG CTCTCAAGTT GCTGATGCTC TCATAACCTT 80008001 ATGACTAGCT CATGTTGCCA GGCAACTGAA CTGTGATAAC CTTTTGTTCC TCATTATAGT TCCGCTTTTG TATAGTTCCG CTTTTGTGAC GCGTTAAGTT 81008101 CCTGTTTTTA CAGTATATAA GTGCTTATAT TCTGACATTT GGTCACTCAG ATTCTGCGGT CTGAGTCCCT TCTCTGCTGG GCTAGACTAG CCTTTGTAAT 82008201 AAATATAATT CTCTGCTAAG TCCCTGTCTC TAGTTTGTCT TGTTTTCAAG ATCTAACA8258
      2.馬傳染貧血性病毒(EIAV)驢白細(xì)胞弱毒疫苗株的全長基因序列,共包括8個功能基因,分別是5’-LTR、gag、pol、env、tat、rev、S2和3’LTR,其特征在于(1)5’LTR由325個核苷酸組成,位于全長基因的第1位至第325位,5’-3’的序列為1 TGTGGGGTTT TTATGAGGGG TTTTATAAAT GATTATAAGA GTAAAAAGAA GGGGGCTGAT GCTCTCATAA CCTTGTATAA CCCAAAGGAC TAGCTCATGT 100101 TGCTAGGCAA CTAAACCGCA ATATCCTGTA GTTCCTCTTG CGTTCCGCAT TTGTGACGTT TTAAGTTCCT GTTTTTACAG TATATAAGTG CTTGTATTCT 200201 GACAATTGGG CACTCAGATT CTGCGGTCTG AGTCCCTTCT CTGCTGGGCT AGACTAGCCT TTGTAATAAA TATAATTCTC TGCTAAGTCC CTGTCTCTAG 300301 TTTGTCTTGT TTTCAAGATC TAACA 325(2)3’LTR由337個核苷酸組成,位于全長基因的第7922位至第8258位,5’-3’的序列為1 TGTGGGATTA ATATAAGATT CTTATAAGTG AATATGAAAG TTGCTGATGC TCTCAAGTTG CTGATGCTCT CATAACCTTA TGACTAGCTC ATGTTGCCAG 100101 GCAACTGAAC TGTGATAACC TTTTGTTCCT GATTATAGTT CCGCTTTTGT ATAGTTCCGC TTTTGTGACG CGTTAAGTTC CTGTTTTTAC AGTATATAAG 200201 TGCTTATATT CTGACATTTG GTCACTCAGA TTCTGCGGTC TGAGTCCCTT CTCTGCTGGG CTAGACTAGC CTTTGTAATA AATATAATTC TCTGCTAAGT 300301 CCCTGTCTCT AGTTTGTCTT GTTTTCAAGA TCTAACA 337(3)gag基因由1461個核苷酸組成,位于全長基因的第466位至第1926位,5’-3’的序列為1 ATGGGAGACT CTTTGACATG GAGCAAAGCG CTCAAGAAGT TAGAGAAGGT GACGGTACAA GGGTCTCAAA AGCTAACTAG TGGTAACTGT AATTGGGCGC 100101 TGAATTTGGT GGACTTATTC CATGACACCA ATTTTGGTAA AGAAAAAGAC TGGCAATTAA GGGACGTCAT TCCATTGTTA GAGGACGTTT CCCAGACGTT 200201 GTCAGGACAA GAGAGAGAGG CATTTGAAAA AACTTGGTGG GCAATAGCTG CCGTTAAGAT GGGCTTACAA ATTAATACTG TGAATGATGC AAAAACAACA 300301 TTTTCTATAT TAAAAGCCAA GTTTGAAAGA AAGACTGCAA ATAATACCAA AAAGCAGTCT GAGCCCGAGG AAGAATACCC AATAATGATT GATGGGGCTG 400401 GAAACAGAAA CTTTCGGCCA TTAACACCCA GAGGATATAC TACCTGGGTA AATACTATAC AGCAAAACAA TCTCTTAAAT GAAGCTAGTG TGAATTTATT 500501 TGGTATTTTA TCAGTAGACT GTACTTCTGA GGAAATGAAT GCATTTTTGG ATGTAGTACC AGGACAAGCA GGACAAAAAC AAGTACTATT GGATAATCTT 600601 GATAAGATTG CAGAAGAATG GGATCGTAGG CACCCGTTGC CAAATCCTCC ATTAGTGGCA CCACCACAAG GGCCTATTCC CATGACAGCA AGGTTCATTA 700701 GGGGATTGGG AGTTCCTAGA GAAAGACAGA TGAAACCTGC TTTTGATCAG TTTAGACAAA CTTATAGACA ATGGATAATA GAAGCAATGA CAGAAGGGAT 800801 AAAAATAATG ATTGGGAAAC CCAAAGCGCA AAATATTAGG CAAGGACCCA AAGAACCCTA TCCAGAGTTT ATAGACAGAT TGCTGTCTCA GATAAAAAGT 900901 GAGGGACATC CGGCTGATAT AACTAAATTC CTGACAGACA CTTTAACTAT TCAGAATGCT AATGATGAAT GCAAAAATGC TATGAGACAT TTGAGGCCAG 10001001 AAGATACTTT AGAAGAGAAA ATGTATGCAT GTAGAGATAT TGGCACTATG AGACAAAAAA TGGCATTATT AGCCAAGGCA CTTCAAGCAG GATTAGCTGG 11001101 TCCTATGAAG GGAGGAATAT TTAAAGGGGG ACCCTTAGGG GCGAAGCAGA CATGTTATAA TTGTGGAAAA CCAGGACATT TTTCTAGTCA ATGTAAAGCA 12001201 CCTAAAATAT GTTTTAAGTG CAAACAGCCA GGACATTTCT CAAAACAATG TAGAAATGCT CCAAAAAACG GGAAACAAGG GGCTCAGGGG AGGCCCCAGA 13001301 AACAAACTTT CCCTGTGCAG AAGGAGTCAA TGAACAAAAC ACAAAAAGAG GAGAAACAGC AAGGGACCTT ATATCCAGAT TTAAGTCAGA TGAAACAGGA 14001401 ATACAAGATC AAGGAAGAGG AAAATCAAGA GGATCTCAAT CTGAACAGTT TGTGGGAGTA A 1461(4)pol基因由3432個核苷酸組成,位于全長基因的第1689位至第5120位,5’-3’的序列為1 ACAGCCAGGA CATTTCTCAA AACAATGTAT AAATGCTCCA AAAAACGGGA AACAAGGGGC TCAGGGGAGG CCCCAGAAAC AAACTTTCCC TGTGCAGAAG 100101 GAGTCAATGA ACAAAACACA AAAAGAGGAG AAACAGCAAG GGACCTTATA TCCAGATTTA AGTCAGATGA AACAGGAATA CAAGATCAAG GAAGAGGAAA 200201 ATCAAGAGGA TCTCAATCTG AACAGTTTGT GGGAGTAACT TATAATTTAG AAAAGAGACC AACTACAATA GTCTTGATTA ATGACACACC CTTAAATGTA 300301 TTGTTGGACA CAGGAGCAGA CACATCAGTA CTAACTATTG CACATTGTAA TAGGTTAAAG TATGGAGGAA GAAAATATCA AGGTACAGGT ATTGTTGGGG 400401 TTGGAGGTAA TGTAGAAACA TTTTCCACTC CTGTTACAGT GAAAAAGAAA GGAAAACAAA TTAAAACTAG AATGTTAGTA GCAGATATCC CAGTTACTAT 500501 TTTGGGGCGA GATATTCTTC AAGAATTAGG CGCACAATTA CTAATGGCTC AACTTTCAAA AGAAATAACC CCAAGAGAAA TTAAATTAAA AACAGGCACA 600601 GTAGGGCCTA AGGTTCCCCA ATGGCCACTT ACTAAAGAGA AGTTGTTAGG TGCTAAAGAA ATAGTCAAAA AATTGTTGGA TGAAGGTAAA ATATCAGAAG 700701 CCAGTGATGA TAATCCTTAT AATTCTCCTA TATTTGTAAT AAAAAAGAAA TCTGGAAAGT GGAGATTATT GCAAGATTTA AGAGAGTTAA TTAAGGGTGG 800801 TACAAGTAGA ACTGAAATAT CCAGAGGATT ACCTCATCCA GGGGGATTAA TTAAATGTAA TCATATGACA GTATTAGATA TTGGAGATGC ATATTTCACT 900901 ATACCATTAG ATCCAAAGTT TAGACAATAT ACAGCATTTA CTGTGCCATC CATTAATCAT CAGGAACCAG ATAAAAGATA TGTGTGGAAT TGCTTGCCAC 10001001 AAGGTTTTGT GTTAAGTCCA TACATATATC AAAAAACATT ACAGGACATA TTACAAGCTT TTAGAGAAAG GCATCCAGAT GTACAATTAT ATCAATATAT 11001101 GGATGATTTA TTCATTGGGA GTAATGAATC TAAAAGACAA CATAAGGAAC TAGTAGAAGA ATTAAGAGCT ATTCTTTTAG AAAAGGGCTT TGAGACGCCT 12001201 GGGGATAAAT TGCAGGAAGA AGCACCCTAT AATTGGCTGG GATATCAACT TAGTCCAGGC AATTGGAAAG TACAAAAGAT GCAATTAGAA TTGGTAAAAG 13001301 AGCCAACATT AAATGATGTG CAAAAATCAA AGGGAAATAT AACATGGATG AGCTCAGGGG TTCCTGGATT AACAGTGAAG CAAATAGCTG CTACCACTAA 14001401 AGGTTGCTTA GATTTAAATC ATAAAGGTAG TAGGACCAGA GAAGCCCAAA AAGACTTAGA GGAAATTATT AAAAGTTTCA GAAGCTCAGG ATTCCCATAT 15001501 TATAACCCAG AAGAAGAAGT AATCTGTGAG ATTGAAATTA CTAAAAATTA TGAGGCTACT TATATAATAA AACAGTCTCA AGGAATATTG TGGGCAGGAA 16001601 AGAAAATTAT GAGGGCTAAT AAAGGATGGT CCGCAGCAAA AAATCTAATG TTATTGTTAC AACATGTAGC CACAGAAAGT ATTGTTAGAA TTGGAACATG 17001701 TCCAAAATTT AAAGTACCTT TTACTAAAGA ACAAGTCAAA TGGGAAATGG AAAAGGGATG GTATTATTCA TGGCTACCAG ACATGGTATA TTCACATCAA 18001801 GTTGTTCATG ATGATTGGAG ACTGAAATTA GTAGAGCAAC CAACATCTGG TATAACAATT TATACTGATG GGGGTAAACA GAATGAAGAA GGAGTTGCAG 19001901 CTTATGTGAC TAGTAATGGG AAAACTAAAC AAAAAAGGTT AGGGCCTGTT ACTCATCAAA CTGCTGAGAG GATAGCAATA CAAATGGCAT TAGAAGATAC 20002001 TGAAGAGACA TTGGTAAATA TAGTAACTGA TAGTTACTAC TGTTGGAAAA ATATTACAGA AGGATTAGGG TTAGAAGGAC CAGACAGCCC CTGGTGGCCA 21002101 ATAATTCAAA ATATTAGGGC TAAAGAAATG GTTTATTTTG CTTGGGTACC AGGTCACAAA GGAATATATG GCAATCAATT GGCAGATGAG GCTACTAAAA 22002201 TAACAGAGGA AATTATGTTA GCATATCAAG GCACACAGAT TAGGGAAAAA AGAGATGAAG ATGCAGGGTA TGATTTGTGT ATTCCTTATG ACATAATGAT 23002301 ACCTGTCTCT GAGACAAAAG TTATACCCAC AGATGTAAAA ATACAGGTAC CTCACAAATG TTTTGGATGG GTAACTGGTA AGTCATCAAT GGCTAAGCAA 24002401 GGATTATTAA TCAATGGGGG AATAATTGAT GAAGGATACA CAGGTGAAAT ACAGGTAATT TGTACTAATA TTGGAAAGAG TAACATGAAA CTCAGGGAAG 25002501 GACAAAAGTT TGCACAATTA ATCATATTAC AGCATCGATC AAATGATAAA CAAATCTGGG ATGAAAATAA AACATCTCAA AGGGGAGATA AAGGGTTTGG 26002601 AAGCACAGGT ATATTTTGGG TAGAGAATAT CCAAGAGGCG CAAGATGAAC ATGAAAATTG GCATACATCT CCAAAGATAT TGGCAAAAAG ATATGGGTTA 27002701 CCATTGACTG TAGCTAAACA GATAACTCAA GAATGCCCTC ATTGTACTAA ACAAGGATCT GGACCAGCAG GTTGTGTAAT GAGATCTCCT AATCATTGGC 28002801 AGGCTGATTG TACACATTTA GAAAACAGGG TAATAATGAC ATTTGTAGAG TCTAATTCAG GATACATTCA TGCTACTCTA TTGTCCAAAG AAAATGCCTT 29002901 GTGTCCTTCA TTGGCTATTT TGGAATGGGT GAGGTTATTT TCTCCTAAAT CTTTACATAC AGACAATGGT ACTAATTTTG TGGCAGAGTC AGTAGCAAAT 30003001 CTGTTGAAAT TCCTGAAGGT GACACATACT ACAGGAATAC CTTATCACCC AGAGAGCCAA GGGATTGTGG AAAGAGCAAA CAGGACATTA AAAGAAAGAA 31003101 TTAAAAGTCA TAGAGGAAAT ACTCAGACAC TTGAAGCAGC ATTACAACTT GCTCTCATTA CTTGTAACAA AGGGAGGGAA AGTATGGGAG GACAAACTCC 32003201 ATGGGAAGTA TTTATTACTA ATCAGGCTCA AACAATACAT GAAGAACTTT TATTACAACA AGCACAATCT TCTAAAAAAT TTTGTTTTTA TAAAATTCCT 33003301 GGTGAGCATA ATTGGAAGGG GCCCACCAGA GTGTTGTGGA AAGGTGATGG AGCAGTAGTG GTCAATGATG AGGAAAAAGG AATAATTGCT GTGCCTTTAA 3400401CCAGGACTAA ATTATTAATA AGACCAAATT GA3432(5)env基因由2592個核苷酸組成,位于全長基因的第5313位至第7904位,5’-3’的序列為1 ATGGTCAGCA TTACATTCTA TGGGGGTATC CCAGGGGGAA TATCAACCCC TATCACCCAA CAAACAGAAT CAACAGACAC ACAGAAAGGG GATCATATGG 100101TATATCAACC CTATTGTTAT AATGATAGCC ATAAAGAAGA AATGGCAGAG ACAAGAGACA CAAGATACCA AGAAGAAATG AACCGGAAAG AAGATAAAGA 200201AGATAAAAGA AAGAATAACT GGTGGAAGAT AGGTATGTTC TTATTGTGTC TGTTAGAGAT CACTGGAGGA TTCCTCTGGT GGTATGAGAG GCAACAACAT 300301TCATATTATA TAAGATTGGT TACAATAGGA GGTAGACTGA ATGGTTCAGG AATGACTAGT GCCATAAAAT GTTGGGGTTC ATTTCCTGGG TGTAGGCCAT 400401 TTACTAACTA TTTCAGTTAT GAGACTAATA CGACTGTTAG TAGAGATAAT AATACTGCTA CTCTGTTAGA TACTTATCAA AGAGAAATAA CAAACATATA 500501 CAGGACATCT TGTGTGGATA GTGATCACTG TCAAGAATAT AAATGTAAGC AAGTACAGTT GAAAAAGAAC AGCAATAACA TTATAATGAA TAATTGTAGT 600601 AACAATAGGT GTGAAGAGTT TTGGGGGTTT AGCTGGTTAG AATGTAATCA GACAGAAAAT GCAATAACTA TATTGGTCCC AGAAATAGAA ATACAGCAAA 700701 GAAAGAACAC TTGGATTCCA AAAAGGTGTG AGAAAACTTG GGCTAAGGTA AAACATTGTC CAATGGATTT ATTATATGGT ATAAATAAAA TAAGAATGTG 800801 TGTCCAACCT CCATTCTTTT TGTTTAAACA GAATGATACT TCTAATAATA CTAATATTCT CAGTAATTGT GGACCTTTAG TATTTCTTGG AATATTTGAG 900901 GACAATAAGG CAGCAATCCA GAATGGGAGT TGCACTCTTC ACAGGACAAA TATTAACAGG CCAGATTATA GTGGATTTTA CCAAGTGCCT ATATTTTATA 10001001 TATGCACCTT GACAGGATTT CAAAGTTGTA ATAATGGATC AATAATTAGT ATAATTATGT ATGAGTCTAA TAATGTTCAA TACTTGTTAT GCAATACTAG 11001101 TAATACTAAT AGTACCAATA ATGCTAATGT CTCTTGTGTG GTACAAAGTT TTGGAGTGAT AGGACAGGCA CATGTGGCAT TGCCCAGAAA AAATAAGAGG 12001201 TTACAATCTC CAAAGTTTGC TCACTATAAT TGCACCATAA ATAATAAAAC AGAGTTAAGG CGATGGCAAT TGGTAAAAAC ATCAGGCATC ACTCCTTTAC 13001301 CCATTTCCTC TACAGCTAAT ACTGGATTAG TCAGACACAA GAGAGACTTT GGTATATCTG CTATAATAGC TGCCATTGTA GCTGCTAGTG CTATTGCTGC 14001401 TAGTGCTACT ATGTCTTATA TCGCTTTGAC AGAAGTCAAC AAATTAGATA GTGTACAAAA TCATACTTTT GAAGTAGAGA ACAATACTAT CAATAACATA 15001501 GAGTTAACAG AAGAGCAAAT TCATATATTA TATGCTATGG TTCTCCAAAC ACATGCAGAT GTTCAATTGT TAAAAGAACA ACAAAAGATT GAGGAAACAT 16001601 TTAATTTAAT TGGATGTATA GAAAGATCAC ATACATTTTG TCATACTGGA CATCCCTGGA ATGAATCATG GGGTCAGTTA AATGATTCTA CACAGTGGGA 17001701 TGACTGGGTA GATAAGATGG AAAATTTAAA TCATGATATA TTAACAACAC TTCATACTGC TAGAAATAAT CTAGAACAAT CTATGATAAC TTTCAATACA 18001801 CCTGACAGTG TAGCACAATT TGGAAAAAAT ATTTGGAGTC ATATTGCAAA TTGGATTCCT AGATTAGGAG CTTCCATAAT TAAATATATA GTGTTGATAT 19001901 TACTTATATA TGTGTTACTA ACCTCTGCAC CTAAGATCCT CAGAGGCCTC TTGACAACGA TGAGTGGTGC AGGATCCTCC GCCAGTCGCT ACCTGAAGAA 20002001 AAGATACCAT CACAAACATG CATCGCGAGG AGACATCTGG GCCCAGGTCC AATATCATGC GTACCTGGCA GACGAGACTC ATGGCTCAGG GGACAAGTCC 21002101 AACATGCGGA AGCTCTCCAG GAACAACTGG AATGGCGAAT CAGAGGAGTA CAACAGACGA CAAAAAAATT GGAAAAAGTT ATTAAAGAGA TCTGGAGAGA 22002201 ATTACAATAC ACACGAAGAC AACATGGGGA CTATGGGTCG TTTGGTGACT ACCGCCGCCG AGAAGAAGAA CGTCGGGGTG AATCCTCACC AAGGGTCCTT 23002301 AACCCTGGAG ATTCAAAGCA AAGGAGGAAA CATCTATGAC TGTTGCATTA AGGCTCAAGA AGGAACTCTT GCTATTCCTT GCTGTGGCTT CCCACTATGG 24002401 CCGTTTTGGG GACTTATAAT CATATTAGAA CGCTTGTTGG GATATGGGCT TCGGGAAATT GCAAAAATTA TAATGATTCT AGGGAAAGGA CTAAGTATAA 2500501 TAATTACAGG ATTAAGAAAA TTATGTGATT ATATTGGGAA AATGCTAAAT CCAGCTACAT CTCATGTAAC AATGCCTCAA TATGATGTTT AG 2592(6)tat基因由237個核苷酸組成,第一外顯子位于全長基因的第365位至第462位,第二外顯子位于全長基因的第5138位至第5276位,tat基因5’-3’的完整序列為1 CTGCTGAACC TGGCTGATCA TAGGATCCCT AGGACAGCAG AGGAGAACTT ACAGAAGTCT TCTGGAGGTG TTCCTGGCCA CAACACAGGA AGACAGGTAC 100101 CACCAGTCAG CTATCATTGT CAACTGTGTT TCCTGAGATC ATTGGGAATT GACTACCTTG ACAGCTCGCT GAAGAAGAAG AACAAACAAA GACAGAAGGC 200TAA 237(7)rev基因由495個核苷酸組成,第一外顯子位于全長基因的第5454位至第5546位,第二外顯子位于全長基因的第7250位至第7651位,tat基因5’-3’的完整序列為1 ATGGCAGAGA CAAGAGACAC AAGATACCAA GAAGAAATGA ACCGGAAAGA AGATAAAGAA GATAAAAGAA AGAATAACTG GTGGAAGATA GGTCCTCAGA 100101 GGCCTCTTGA CAACGATGAG TGGTGCAGGA TCCTCCGCCA GTCGCTACCT GAAGAAAAGA TACCATCACA AACATGCATC GCGAGGAGAC ATCTGGGCCC 200201 AGGTCCAATA TCATGCGTAC CTGGCAGACG AGACTCATGG CTCAGGGGAC AAGTCCAACA TGCGGAAGCT CTCCAGGAAC AACTGGAATG GCGAATCAGA 200301 CGAGTACAAC AGACGACAAA AAAATTGGAA AAAGTTATTA AAGAGATCTG GAGAGAATTA CAATACACAC GAAGACAACA TGGGGACTAT GGGTCGTTTG 40001GTGACTACCG CCGCCGAGAA GAAGAACGTC GGGGTGAATC CTCACCAAGG GTCCTTAACC CTGGAGATTC AAAGCAAAGG AGGAAACATC TATGA495(8)S2基因由207個核苷酸組成,位于全長基因的第5287位至第5493位,5’-3’的序列為1 ATGGGATTAT TTGGTAAAGG GGTAACATGG TCAGCATTAC ATTCTATGGG GGTATCCCAG GGGGAATATC AACCCCTATC ACCCAACAAA CAGAATCAAC 100101 AGACACACAG AAAGGGGATC ATATGGTATA TCAACCCTAT TGTTATAATG ATAGCCATAA AGAAGAAATG GCAGAGACAA GAGACACAAG ATACCAAGAA 200201 GAAATGA 207(9)上述所有基因的結(jié)構(gòu)與功能。
      3.根據(jù)權(quán)利要求1,馬傳染性貧血病毒驢白細(xì)胞弱毒疫苗株的全長基因包括gag、pol、env、tat、rev和S2等6個功能基因,分別編碼相應(yīng)的蛋白質(zhì),其特征在于(1)gag基因編碼的前體蛋白質(zhì)由486個氨基酸組成,分子量為55.032千道爾頓,等電點為8.90,氨基酸序列從N端到C端為MGDSLTWSKALKKLEKVTVQGSQKLTSGNCNWALNLVDLFHDTNFGKEKDWQLRDVIPLLEDVSQTLSGQEREAFEKTWWAIAAVKMGLQINTVNDAKTTFSILKAKFERKTANNTKKQSEPEEEYPIMIDGAGNRNFRPLTPRGYTTWVNTIQQNNLLNEASVNLFGILSVDCTSEEMNAFLDVVPGQAGQKQVLLDNLDKIAEEWDRRHPLPNPPLVAPPQGPIPMTARFIRGLGVPRERQMKPAFDQFRQTYRQWIIEAMTEGIKIMIGKPKAQNIRQGPKEPYPEFIDRLLSQIKSEGHPADITKFLTDTLTIQNANDECKNAMRHLRPEDTLEEKMYACRDIGTMRQKMALLAKALQAGLAGPMKGGIFKGGPLGAKQTCYNCGKPGHFSSQCKAPKICFKCKQPGHFSKQCRNAPKNGKQGAQGRPQKQTFPVQKESMNKTQKEEKQQGTLYPDLSQMKQEYKIKEEENQEDLNLNSLWE(2)pol基因編碼的前體蛋白質(zhì)由1143個氨基酸組成,分子量為128.742千道爾頓,等電點為8.64,氨基酸序列從N端到C端為TARTFLKTMYKCSKKRETRGSGEAPETNFPCAEGVNEQNTKRGETARDLISRFKSDETGIQDQGRGKSRGSQSEQFVGVTYNLEKRPTTIVLINDTPLNVLLDTGADTSVLTIAHCNRLKYGGRKYQGTGIVGVGGNVETFSTPVTVKKKGKQIKTRMLVADIPVTILGRDILQELGAQLLMAQLSKEITPREIKLKTGTVGPKVPQWPLTKEKLLGAKEIVKKLLDEGKISEASDDNPYNSPIFVIKKKSGKWRLLQDLRELIKGGTSRTEISRGLPHPGGLIKCNHMTVLDIGDAYFTIPLDPKFRQYTAFTVPSINHQEPDKRYVWNCLPQGFVLSPYIYQKTLQDILQAFRERHPDVQLYQYMDDLFIGSNESKRQHKELVEELRAILLEKGFETPGDKLQEEAPYNWLGYQLSPGNWKVQKMQLELVKEPTLNDVQKSKGNITWMSSGVPGLTVKQIAATTKGCLDLNHKGSRTREAQKDLEEIIKSFRSSGFPYYNPEEEVICEIEITKNYEATYIIKQSQGILWAGKKIMRANKGWSAAKNLMLLLQHVATESIVRIGTCPKFKVPFTKEQVKWEMEKGWYYSWLPDMVYSHQVVHDDWRLKLVEQPTSGITIYTDGGKQNEEGVAAYVTSNGKTKQKRLGPVTHQTAERIAIQMALEDTEETLVNIVTDSYYCWKNITEGLGLEGPDSPWWPIIQNIRAKEMVYFAWVPGHKGIYGNQLADEATKITEEIMLAYQGTQIREKRDEDAGYDLCIPYDIMIPVSETKVIPTDVKIQVPHKCFGWVTGKSSMAKQGLLINGGIIDEGYTGEIQVICTNIGKSNMKLREGQKFAQLIILQHRSNDKQIWDENKTSQRGDKGFGSTGIFWVENIQEAQDEHENWHTSPKILAKRYGLPLTVAKQITQECPHCTKQGSGPAGCVMRSPNHWQADCTHLENRVIMTFVESNSGYIHATLLSKENALCPSLAILEWVRLFSPKSLHTDNGTNFVAESVANLLKFLKVTHTTGIPYHPESQGIVERANRTLKERIKSHRGNTQTLEAALQLALITCNKGRESMGGQTPWEVFITNQAQTIHEELLLQQAQSSKKFCFYKIPGEHNWKGPTRVLWKGDGAVVVNDEEKGIIAVPLTRTKLLIRPN(3)env基因編碼的前體蛋白質(zhì)由863個氨基酸組成,分子量為98.454千道爾頓,含有19個糖基化位點,等電點為8.33,氨基酸序列從N端到C端為MVSITFYGGIPGGISTPITQQTESTDTQKGDHMVYQPYCYNDSHKEEMAETRDTRYQEEMNRKEDKEDKRKNNWWKIGMFLLCLLEITGGFLWWYERQQHSYYIRLVTIGGRLNGSGMTSAIKCWGSFPGCRPFTNYFSYETNRTVSRDNNTATLLDTYQREITNIYRTSCVDSDHCQEYKCKQVQLKKNSNNIIMNNCSNNRCEEFWGFSWLECNQTENAITILVPEIEIQQRKNTWIPKRCEKTWAKVKHCPMDLLYGINKIRMCVQPPFFLFKQNDTSNNTNILSNCGPLVFLGIFEDNKAAIQNGSCTLHRTNINRPDYSGFYQVPIFYICTLTGFQSCNNGSIISIIMYESNNVQYLLCNTSNTNSTNNANVSCVVQSFGVIGQAHVALPRKNKRLQSPKFAHYNCTINNKTELRRWQLVKTSGITPLPISSTANTGLVRHKRDFGISAIIAAIVAASAIAASATMSYIALTEVNKLDSVQNHTFEVENNTINNIELTEEQIHILYAMVLQTHADVQLLKEQQKIEETFNLIGCIERSHTFCHTGHPWNESWGQLNDSTQWDDWVDKMENLNHDILTTLHTARNNLEQSMITFNTPDSVAQFGKNIWSHIANWIPRLGASIIKYIVLILLIYVLLTSAPKILRGLLTTMSGAGSSASRYLKKRYHHKHASRGDIWAQVQYHAYLADETHGSGDKSNMRKLSRNNWNGESEEYNRRQKNWKKLLKRSGENYNTHEDNMGTMGRLVTTAAEKKNVGVNPHQGSLTLEIQSKGGNIYDCCIKAQEGTLAIPCCGFPLWPFWGLIIILERLLGYGLREIAKIIMILGKGLSIIITGLRKLCDYIGKMLNPATSHVTMPQYDV(4)rev基因編碼的蛋白質(zhì)由164個氨基酸組成,分子量為19.831千道爾頓,等電點為9.81,氨基酸序列從N端到C端為MAETRDTRYQEEMNRKEDKEDKRKNNWWKIGPQRPLDNDEWCRILRQSLPEEKIPSQTCIARRHLGPGPISCVPGRRDSWLRGQVQHAEALQEQLEWRIRGVQQTTKKLEKVIKEIWRELQYTRRQHGDYGSFGDYRRREEERRGESSPRVLNPGDSKQRRKHL(5)tat基因編碼的蛋白質(zhì)由78個氨基酸組成,分子量為8.811千道爾頓,等電點為9.31,氨基酸序列從N端到C端為LLNLADHRIPRTAEENLQKSSGGVPGHNTGRQVPPVSYHCQLCFLRSLGIDYLDSSLKKKNKQRQKAIREEDNLSILL(6)S2基因編碼的蛋白質(zhì)由68個氨基酸組成,分子量為7.883千道爾頓,等電點為10.26,氨基酸序列從N端到C端為MGLFGKGVTWSALHSMGVSQGEYQPLSPNKQNQQTHRKGIIWYINPIVIMIAIKKKWQRQETQDTKKK(7)上述所有基因編碼的蛋白質(zhì)的結(jié)構(gòu)和功能。
      4.根據(jù)權(quán)利要求1和2所述特征,馬傳染性貧血病毒(EIAV)驢白細(xì)胞弱毒疫苗株的全長基因序列及其各基因的結(jié)構(gòu)和序列及其與EIAV野毒株的比較分析,可用于設(shè)計和構(gòu)建艾滋病毒(HIV)及其它慢病毒疫苗。
      5.根據(jù)權(quán)利要求1和3所述特征,比較馬傳染性貧血病毒(EIAV)驢白細(xì)胞弱毒疫苗株與野毒株之間基因序列和蛋白氨基酸序列的差異可用于建立EIAV感染的診斷方法,包括(1)分子生物學(xué)方法,其特征在于針對EIAV疫苗株的基因序列及其與野毒株的基因序列差異區(qū)設(shè)計相應(yīng)的PCR引物及基因探針,用于EIAV的核酸診斷和進(jìn)行鑒別診斷;(2)血清學(xué)方法,其特征在于針對EIAV疫苗毒株蛋白的抗原表位和免疫原性,設(shè)計相應(yīng)的實驗方法來檢測EIAV感染動物血清的抗EIAV抗體和EIAV抗原的方法,以及根據(jù)EIAV疫苗株與野毒株蛋白的抗原表位的差異以及相應(yīng)抗體反應(yīng)的差異而進(jìn)行血清學(xué)鑒別診斷。
      6.根據(jù)權(quán)利要求1和2和3所述特征,由馬傳染貧血性病毒(EIAV)驢白細(xì)胞弱毒疫苗株的全長基因序列確定的各基因、各蛋白分別具有獨特的不同于EIAV野毒株一級結(jié)構(gòu)和高級結(jié)構(gòu),可用于設(shè)計和構(gòu)建艾滋病毒(HIV)及其它慢病毒的多肽疫苗、基因工程亞單位疫苗、基因缺失疫苗、DNA疫苗、活載體疫苗和診斷試劑等。
      7.根據(jù)權(quán)利要求1,馬傳染貧血性病毒驢白細(xì)胞弱毒疫苗株的全長基因,其特征在于可用來構(gòu)建基因轉(zhuǎn)移的載體,用于疾病的基因治療;其特征還在于用于構(gòu)建感染性分子克隆及其在疫苗研究方面的應(yīng)用。
      全文摘要
      本發(fā)明提供了馬傳染性貧血病毒(EIAV)驢白細(xì)胞弱毒疫苗株含有8258個堿基的前病毒DNA全長基因序列及其結(jié)構(gòu),其所編碼的全部蛋白質(zhì)的基因序列和氨基酸序列和蛋白質(zhì)的二級結(jié)構(gòu),以及該疫苗毒株的調(diào)控序列和非必需區(qū)序列。這些序列和結(jié)構(gòu)的數(shù)據(jù)可應(yīng)用于包括艾滋病毒在內(nèi)的所有慢病毒屬病毒的疫苗研制和使用該屬病毒作為載體進(jìn)行的基因治療,還可應(yīng)用于對EIAV的血清學(xué)及分子生物學(xué)診斷方法及其所需試劑的研制。
      文檔編號C12N15/49GK1271015SQ9910585
      公開日2000年10月25日 申請日期1999年4月21日 優(yōu)先權(quán)日1999年4月21日
      發(fā)明者邵一鳴, 沈榮顯, 陳剛, 于康震, 潘品良, 賈斌, 馮毅, 薛飛, 相文華, 范秀娟, 呂曉玲 申請人:衛(wèi)生部艾滋病預(yù)防與控制中心, 中國農(nóng)業(yè)科學(xué)院哈爾濱獸醫(yī)研究所
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1