專利名稱:對大腸桿菌085型的0-抗原特異的核苷酸的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及大腸桿菌O85型(Escherichia coli O85)中控制O-抗原合成的基因簇的核苷酸全序列,特別是涉及大腸桿菌O85型中控制O-抗原合成的基因簇中的寡核苷酸,可利用這些對O-抗原特異的寡核苷酸快速、準(zhǔn)確地檢測人體及環(huán)境中的大腸桿菌O85型并鑒定這些致病菌中的O-抗原。
背景技術(shù):
O-抗原是革蘭氏陰性細菌脂多糖中的O特異性多糖成分,它由許多重復(fù)的寡糖單位組成。O-抗原的合成過程研究得較清楚先由糖基轉(zhuǎn)移酶將核苷二磷酸單糖轉(zhuǎn)移到一個固定在細胞內(nèi)膜的脂分子上,然后在內(nèi)膜的內(nèi)側(cè)合成寡糖單位,O-抗原的寡糖單位再通過轉(zhuǎn)運酶被轉(zhuǎn)移到內(nèi)膜外側(cè),而后通過聚合酶聚合成多糖,再被連接到一個糖脂分子上形成脂多糖分子[Whitfield,C.(1995)“Biosynthesis of lipopolysaccharide O antigens”.Trends inMicrobiology.3178-185;Schnaitman,C.A.and J.D.Klena.(1993)“Genetics oflipopolysaccharide biosynthesis in entericbacteria”.MicrobiologicalReviews,57(3)655-682]。編碼負責(zé)O-抗原合成的所有酶分子的基因一般在染色體上相鄰排列,形成一個基因簇[Reeves,P.R.,et al.(1996)“Bacterial polysaccharidesynthesis and gene nomenclature”Trends in Microbiology,4495-503]。在志賀氏菌、大腸桿菌和沙門氏菌中,O-抗原基因簇位于galF和gnd基因之間[Lei Wang.etal(2001)“Sequence analysis of four Shigella boydii O-antigen lociimplicationfor Escherichia coli and Shigella relationships”.Infection andImmunity,116923-6930;Lei Wang and Peter Reeves(2000)“The Escherichia coli O111and Sallmonella enterica O35 gene clustersgene clusters encoding the samecolitose-containing O antigen are highly conserved”.Journal ofBacteriology.1825256-5261]。O-抗原基因簇含有三類基因糖合成路徑基因,糖基轉(zhuǎn)移酶基因,寡糖單位處理基因,其中糖合成路徑基因編碼的酶合成O-抗原所需的核苷二磷酸單糖;糖基轉(zhuǎn)移酶基因編碼的酶將核苷二磷酸單糖及其它分子轉(zhuǎn)到單糖上從而使單糖聚合成寡糖單位;寡糖單位處理基因包括轉(zhuǎn)運酶基因和聚合酶基因,它們將寡糖單位轉(zhuǎn)移到細菌內(nèi)膜外側(cè),再聚合成多糖。糖基轉(zhuǎn)移酶基因和寡糖單位處理基因只存在于攜帶這些基因的基因簇里。O-抗原中單糖的不同,單糖間聯(lián)結(jié)鍵的不同和寡糖單位之間聯(lián)結(jié)鍵的不同構(gòu)成了O-抗原的多樣性,而單糖的組成、單糖間的聯(lián)結(jié)鍵及寡糖單位之間的聯(lián)結(jié)鍵是由O-抗原基因簇中的基因控制著,所以O(shè)-抗原基因簇決定了O-抗原的合成,也決定了O-抗原的多樣性。
因為O-抗原是極強的抗原,是大腸桿菌重要的致病因素之一,同時它又具有極強的多樣性,這啟示我們能研究一種快速、準(zhǔn)確地檢測大腸桿菌及其O-抗原的特異性好、靈敏度高的方法。以表面多糖為目標(biāo)的血清學(xué)免疫反應(yīng)自上世紀(jì)30年代以來一直被用于對細菌的分型和鑒定,是鑒定致病菌的唯一的手段。這種診斷方法需要大量的抗血清,而抗血清一般種類不全,數(shù)量不足,大量的抗血清在制備和儲存中也存在一些困難。另一方面此法耗時長、靈敏度低、漏檢率高、準(zhǔn)確性差,所以,現(xiàn)在普遍認(rèn)為這種傳統(tǒng)的血清學(xué)檢測方法將為現(xiàn)代分子生物學(xué)方法取代。1993年,Luk,J.M.C et.al用沙門氏菌(S.enterica)O-抗原基因簇的特異核苷酸序列通過PCR方法鑒定了沙門氏菌的O-抗原[Luk,J.M.C.et.al.(1993)“Sclcctive amplification of abequose andparatose synthase genes(rfb)by polymerase chain reaction for identification ofS.enterica major serogroups(A,B,C2,andD)”,J.Clin.Microbiol.312118-2123]。Luk,et.al的方法是將相應(yīng)于沙門氏菌血清型E1,D1,A,B和C2的O-抗原內(nèi)的CDP-阿比可糖和CDP-泰威糖的合成基因的核苷酸序列排列后得到對不同血清型的沙門氏菌特異的寡核苷酸。1996年,Paton,A.W et.al用對E.coli O111的O-抗原特異的源于wbdI基因的寡核苷酸鑒定了一株產(chǎn)毒素的E.coli O111的血清型[“Molecular microbiological investigation of an outbreak of Hemolytic-UremicSyndrome caused by dry fermented sausage contaminated with Shiga-like toxinproducing Escherichia coli”.J.Clin.Microbiol.341622-1627],但是后來的研究表明Paton,A.W et.al的用源于wbdI基因的寡核苷酸鑒定E.coli O111的血清型的方法有假陽性結(jié)果出現(xiàn)。Bastin D.A.and Reeves,P.R.認(rèn)為,這是由于wbdI基因是一個推測的糖合成路徑基因[Bastin D.A.and Reeves,P.R.(1995)Sequenceand analysis of the O antigen gene(rfb)c luster of Escherichia coli O111.Gene16417-23],而在其它細菌的O-抗原的結(jié)構(gòu)中也可能有這個糖,所以糖合成路徑基因?qū)τ贠-抗原并不是高度特異的志賀氏菌有46種血清型,但只有33種不同的O-抗原,大腸桿菌有166種不同的O-抗原[Reeves,P.R(1992)“Variationin O antigens,niche specific selection and bacterial populations”.FEMSMicrobiol.Lett,100509-516],二者親緣關(guān)系非常近,并且有12種是大腸桿菌和志賀氏菌共有的[Ewing,W.H.(1986)“Edwards and Ewing’sidentification of theEnterobacteriaceae”.Elsevier Science Publishers,Amsterdam,TheNetherlands;T.cheasty,et al.(1983)“Antigenic relationships between theenteroinvasive Escherichia coli antigensO28ac,O112ac,O124,O136,O143,O144,O152and and Shigella O antigens”J.clin Microbiol,17(4)681-684]
發(fā)明內(nèi)容
本發(fā)明的目的是提供了一種對大腸桿菌O85型的O-抗原特異的核苷酸,它是大腸桿菌O85型的O-抗原基因簇中的核苷酸,是源于糖基轉(zhuǎn)移酶基因和轉(zhuǎn)運酶基因及聚合酶基因的特異的核苷酸。
本發(fā)明的次一目的是提供了大腸桿菌O85型的O-抗原基因簇的全長核苷酸序列。
本發(fā)明的另一目的是提供了構(gòu)成大腸桿菌O85型的O-抗原基因簇的基因轉(zhuǎn)運酶的基因即wzx基因或與wzx有相似功能的基因;聚合酶基因即wzy基因或與wzy有相似功能的基因;糖基轉(zhuǎn)移酶基因,包括orf3、orf5、orf6、orf8基因。
本發(fā)明的又一目的是提供了寡核苷酸,它們分別源于大腸桿菌O85型的O-抗原基因簇中編碼糖基轉(zhuǎn)移酶的基因包括orf3、orf5、orf6、orf8基因;源于編碼轉(zhuǎn)運酶的基因即wzx基因或與wzx有相似功能的基因;源于編碼聚合酶的基因即wzy基因或與wzy有相似功能的基因;它們是上述基因內(nèi)的寡核苷酸,長度在10-20nt;它們對大腸桿菌O85型的O-抗原是特異的;尤其是表1中列出的寡核苷酸,它們對大腸桿菌O85型的O-抗原是高度特異的,而且這些寡核苷酸還可重新組合,組合后的寡核苷酸對大腸桿菌O85型的O-抗原也是高度特異的。
本發(fā)明的再一目的是提供的上述寡核苷酸可作為引物用于核酸擴增反應(yīng),或作為探針用于雜交反應(yīng),或者用于制造基因芯片或微陣列,從而通過這些方法檢測和鑒定大腸桿菌O85型的O-抗原及檢測和鑒定大腸桿菌O85型。
本發(fā)明的還一目的是提供了分離大腸桿菌O85型的O-抗原基因簇的全序列的方法。按照本方法操作可以獲得其他細菌的O-抗原基因簇的全序列,也可以獲得編碼其他多糖抗原的細菌的基因簇的全序列。
本發(fā)明的目的是由以下技術(shù)方案實現(xiàn)的。
本發(fā)明對大腸桿菌O85型的O-抗原特異的核苷酸,其特征在于其是如SEQ ID NO1所示的分離的核苷酸,全長11203個堿基;或者所述具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
前述的對大腸桿菌O85型的O-抗原特異的核苷酸,其中包括命名為orf1,wzy,orf3,wzx,orf5,orf6,glf,orf8的8個基因組成,都位于galF基因和gnd基因之間。
前述的對大腸桿菌O85型的O-抗原特異的核苷酸,其中所述基因中具有高度特異性的基因是轉(zhuǎn)運酶基因,其包括wzx基因;聚合酶基因,其包括wzy基因;糖基轉(zhuǎn)移酶基因,其包括orf3、orf5、orf6、orf8基因;其中所述的基因wzx是SEQ ID NO1中的4420至5640堿基的核苷酸;wzy是SEQ ID NO1中的2266至3384堿基的核苷酸;orf3是SEQ ID NO1中的3359至4411堿基的核苷酸;orf5是SEQ ID NO1中的5630至6796堿基的核苷酸;orf6是SEQ ID NO1中的6793至7908堿基的核苷酸;orf8是SEQ ID NO1中的9005至9919堿基的核苷酸。
前述的對大腸桿菌O85型的O-抗原特異的核苷酸,其中還包括源于所述的wzx基因、wzy基因或糖基轉(zhuǎn)移酶基因orf3、orf5、orf6、orf8基因以及它們的混合或它們的重組。
前述的對大腸桿菌O85型的O-抗原特異的核苷酸,其特征在于,其中源于wzx基因的寡核苷酸對是SEQ ID NO1中的4589至4606堿基的核苷酸和5332至5347堿基的核苷酸;SEQ ID NO1中的4452至4468堿基的核苷酸和5104至5120堿基的核苷酸;源于wzy基因的寡核苷酸對是SEQ ID NO1中的2711至2726堿基的核苷酸和3048至3063堿基的核苷酸;SEQ ID NO1中的2749至2765堿基的核苷酸和3346至3363堿基的核苷酸。
前述的對大腸桿菌O85型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、鑒定細菌的O-抗原和細菌的其它多糖抗原中的應(yīng)用。
前述的對大腸桿菌O85型的O-抗原特異的核苷酸的重組分子,在通過插入表達而提供表達大腸桿菌O85型的O-抗原,以及制備細菌疫苗中的應(yīng)用。
前述的對大腸桿菌O85型的O-抗原特異的核苷酸的應(yīng)用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,供檢測細菌的應(yīng)用。
前述的對大腸桿菌O85型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在培養(yǎng)基中培養(yǎng)大腸桿菌O85型,離心收集細胞;得到的基因組DNA通過瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O85型中的O-抗原基因簇以大腸桿菌O85型的基因組為模板通過Long PCR擴增其O-抗原基因簇,將得到的PCR產(chǎn)物,用瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性,合并該long PCR產(chǎn)物,并用DNA純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫將Long PCR純化產(chǎn)物應(yīng)用鳥槍法構(gòu)建O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的克隆用實驗室常用的DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析應(yīng)用生物信息學(xué)軟件拼接和編輯所有的序列,從而得到大腸桿菌O85型的O-抗原基因簇的核苷酸全長序列;(6)特異基因的篩選針對大腸桿菌O85型的O-抗原基因簇中的wzx、wzy基因設(shè)計引物;在每個基因內(nèi)各設(shè)計了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,確定wzx、wzy基因?qū)Υ竽c桿菌O85型的O-抗原的高度特異性;(7)引物靈敏度的檢測培養(yǎng)大腸桿菌O85,細菌計數(shù)后分別將5×103,5×102,5×101,5個和0個活菌加入到一定量的某種待檢測物中,混入細菌的待檢測物作為檢測用樣品,將樣品加入LB培養(yǎng)基,取一些與樣品混合過的LB培養(yǎng)基過濾,將過濾液進行培養(yǎng),從培養(yǎng)好的菌液中取數(shù)毫升處理后作為PCR模板用寡核苷酸進行PCR反應(yīng),檢測其對大腸桿菌O85的靈敏度。
前述的對大腸桿菌O85型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O85型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul10mg/ml的RNase,65℃溫育30分鐘,加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚。上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30ul TE中;基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O85型中的O-抗原基因簇以大腸桿菌O85型的基因組為模板通過Long PCR擴增其O-抗原基因簇,首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動子區(qū)的galF序列設(shè)計上游引物(#1523-ATT GTG GCT GCAGGG ATC AAA GAA AT),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計下游引物(#1524-TAG TCG CGT GNG CCT GGA TTA AGT TCG C);用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進行30個循環(huán),最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性,合并5管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫,反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進行,酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中,隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產(chǎn)物補成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴大為80ul,70℃反應(yīng)20分鐘,使DNA的3’端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶,最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用BiO-Rad公司的電轉(zhuǎn)化感受態(tài)細胞的制備方法制備感受態(tài)大腸桿菌DH5α細胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到BiO-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上,在37℃過夜培養(yǎng),次日得到藍白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質(zhì)粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O85型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的96個克隆用本實驗室ABI3730型DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC(Medical ResearchCouncil)分子生物學(xué)實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O85型的O-抗原基因簇的核苷酸全長序列;序列的質(zhì)量主要由兩個方面來保證1)對大腸桿菌O85型的基因組作5個Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫,2)對每個堿基,保證3個以上高質(zhì)量的覆蓋率,在得到大腸桿菌O85型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center forBiotechnology Informat ion,NCBI)的orffinder發(fā)現(xiàn)基因,找到8個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O85型的O-抗原基因簇的結(jié)構(gòu);(6)特異基因篩選針對痢大腸桿菌O85型的O-抗原基因簇中的wzx、wzy基因設(shè)計引物;在每個基因內(nèi)各設(shè)計了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,除在含大腸桿菌O85組中得到了預(yù)期大小的一條帶外,在其他組中都沒有擴增到預(yù)期片段大小的正確產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O85型的O-抗原都是高度特異的。
(7)引物靈敏度的檢測購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O85的凍存菌液接種到有20ml LB培養(yǎng)基的三角瓶中,于37℃,200轉(zhuǎn)/分,培養(yǎng)12小時至飽和,取少量培養(yǎng)好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養(yǎng)12h,對所涂平板計數(shù),計算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入200ml LB培養(yǎng)基,經(jīng)6層紗布過濾,過濾液于37℃,200轉(zhuǎn)/分,培養(yǎng)12h。從培養(yǎng)好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取lμ上清做為PCR模板。用4對寡核苷酸對,SEQ ID NO1中的4589至4606堿基的核苷酸和5332至5347堿基的核苷酸;SEQ ID NO1中的4452至4468堿基的核苷酸和5104至5120堿基的核苷酸;SEQ ID NO1中的2711至2726堿基的核苷酸和3048至3063堿基的核苷酸;SEQ ID NO1中的2749至2765堿基的核苷酸和3346至3363堿基的核苷酸,進行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環(huán)。反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴增帶,則結(jié)果為陽性,若沒有,則結(jié)果為陰性。參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應(yīng)中得到陽性結(jié)果。參入0個活菌的豬肉餡在4對引物的PCR反應(yīng)中得到陰性結(jié)果。說明使用上述方法時,這4對引物對豬肉餡中的大腸桿菌O85的檢測靈敏度均為0.25個菌/g。
也就是,本發(fā)明的第一個方面,提供了大腸桿菌O85型的O-抗原基因簇的全長核苷酸序列,它的全序列如SEQ ID NO1所示,全長11203個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。通過本發(fā)明的方法得到了大腸桿菌O85型的O-抗原基因簇的結(jié)構(gòu),如表3所示,它包括命名為orf1,wzy,orf3,wzx,orf5,orf6,glf,orf8的8個基因組成,都位于galF基因和gnd基因之間。
本發(fā)明的第二個方面,提供了大腸桿菌O85型的O-抗原基因簇中的基因,即轉(zhuǎn)運酶基因(wzx基因或與wzx有相似功能的基因);聚合酶基因(wzy基因或與wzy有相似功能的基因);糖基轉(zhuǎn)移酶基因(orf3、orf5、orf6、orf8基因)。它們在O-抗原基因簇中的起始位置和終止位置及核苷酸序列都列在表4中;本發(fā)明尤其涉及到糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運酶基因和聚合酶基因,因為糖合成路徑基因即合成核苷二磷酸單糖的基因現(xiàn)在被預(yù)示對較多胞外多糖是常見的、共同的,對細菌的O-抗原并不是很特異的,而本發(fā)明涉及的糖基轉(zhuǎn)移酶基因、轉(zhuǎn)運酶基因和聚合酶基因?qū)Υ竽c桿菌O85型的O-抗原是高度特異的。
本發(fā)明的第三個方面,提供了源于大腸桿菌O85型的O-抗原基因簇中的wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因和糖基轉(zhuǎn)移酶基因,包括orf3、orf5、orf6、orf8基因的寡核苷酸,它們是這些基因中的任何一段寡核苷酸。但是,優(yōu)先被用的是列于表1中的寡核苷酸對,在表1中也列出了這些寡核苷酸對在O-抗原基因簇中的位置及以這些寡核苷酸對為引物所做的PCR反應(yīng)的產(chǎn)物的大小,這些PCR反應(yīng)可用表中的退火溫度進行。這些引物除在第13組中得到了預(yù)期大小的一條帶外,在其他組中都沒有擴增到任何產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O85型的O-抗原都是高度特異的。
所述的對大腸桿菌O85型的O-抗原特異的核苷酸的分離方法包括下述步驟1)基因組的提取;2)PCR擴增大腸桿菌O85型中的O-抗原基因簇;3)構(gòu)建O-抗原基因簇文庫;4)對文庫中的克隆測序;5)核苷酸序列的拼接及分析;6)特異基因的篩選;7)引物靈敏度的檢測。
本發(fā)明的其他方面由于本文的技術(shù)的公開,對本領(lǐng)域的技術(shù)人員而言是顯而易見的。
如本發(fā)明所用,“寡核苷酸”主要指來源于O-抗原基因簇中的編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運酶的基因和編碼聚合酶的基因內(nèi)的一段核苷酸分子,它們在長度上可改變,一般在10到20個核苷酸范圍內(nèi)改變;更確切說這些寡核苷酸是源于wzx基因(核苷酸位置是從SEQ ID NO1中的4420至5640堿基的核苷酸);wzy基因(核苷酸位置是從SEQ ID NO1中的2266至3384堿基的核苷酸);源于以上基因內(nèi)的寡核苷酸對大腸桿菌O85型是高度特異的。
此外,有時兩個遺傳相似的編碼不同O-抗原的基因簇通過基因重組或突變產(chǎn)生新的O-抗原,從而產(chǎn)生新的細菌類型,新的突變株。在這種環(huán)境中,需要篩選出多對寡核苷酸同重組基因雜交以提高檢測的特異性。因此,本發(fā)明提供了一整套多對寡核苷酸的混合物,它們源于糖基轉(zhuǎn)移酶基因;源于轉(zhuǎn)運酶和聚合酶基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。這些基因的混合物對一個特殊的細菌多糖抗原來說是特異的,從而使這套寡核苷酸對這個細菌的多糖抗原是特異的。更具體地說,這些寡核苷酸的混合物是源于糖基轉(zhuǎn)移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因中的寡核苷酸的組合。
在另一方面,本發(fā)明涉及寡核苷酸的鑒定,它們可以用于檢測表達O-抗原的細菌和在診斷中鑒定細菌的O-抗原。
本發(fā)明涉及到一種檢測食品中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是大腸桿菌O85型??捎肞CR方法檢測,更可以將本發(fā)明方法中的核苷酸標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
本發(fā)明設(shè)計者考慮到以下情況當(dāng)單個的特異的寡核苷酸檢測無效時,寡核苷酸的混合物能與靶區(qū)域特異性雜交以檢測樣品。因此本發(fā)明提供了一套寡核苷酸用于本發(fā)明所述的檢測方法。這里所說的寡核苷酸是指源于編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運酶的基因和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的寡核苷酸。這套寡核苷酸對一個特殊的細菌的O-抗原來說是特異的,這一特殊的細菌O-抗原是由大腸桿菌O85型表達的。
另一方面,本發(fā)明涉及到一種檢測排泄物中的一個或多個細菌多糖抗原的方法,這些抗原可以使樣品能與以下至少一個基因的寡核苷酸特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交。這些細菌是大腸桿菌O85型??捎帽景l(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸分子標(biāo)記后作為探針通過雜交反應(yīng)如southern-blot或熒光檢測,或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
一般一對寡核苷酸可能與同樣的基因雜交也可與不同的基因雜交,但它們中必須有一個寡核苷酸能特異性雜交到特殊抗原型的特異序列上,另一個寡核苷酸可雜交于非特異性區(qū)域。因此,當(dāng)特殊的多糖抗原基因簇中的寡核苷酸被重新組合時,至少能選出一對寡核苷酸與多糖抗原基因簇中特異基因混合物雜交,或者選出多對寡核苷酸與特異基因的混合物雜交。甚至即使當(dāng)一個特殊的基因簇中所有基因都獨一無二時,此方法也能應(yīng)用于識別此基因簇內(nèi)的基因混合物的核苷酸分子。因此本發(fā)明提供了一整套用于檢測本發(fā)明方法的多對寡核苷酸,在這里多對寡核苷酸是源于編碼糖基轉(zhuǎn)移酶的基因、編碼轉(zhuǎn)運酶和聚合酶的基因包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因,這套寡核苷酸對一個特殊的細菌多糖來說是特異的,這套寡核苷酸可能是糖合成中必須基因的核苷酸。
另一方面,本發(fā)明也涉及到一種檢測源于病人的樣品中的一個或多個細菌多糖抗原的方法。樣品中的一個或多個細菌多糖抗原可以使樣品能與以下至少一個基因中的一對寡核苷酸中的一個特異性雜交,這些基因是(i)編碼糖基轉(zhuǎn)移酶的基因(ii)編碼轉(zhuǎn)運酶和聚合酶的基因,包括wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因。在條件許可的情況下至少一個寡核苷酸能與樣品中的至少一個表達特殊的O-抗原的細菌的一個以上的那樣的基因特異性雜交,這些細菌是大腸桿菌O85型。可用本發(fā)明中的寡核苷酸作引物通過PCR的方法檢測樣品,也可將本發(fā)明中的寡核苷酸標(biāo)記后作為探針通過雜交反應(yīng),或者通過基因芯片或微陣列檢測樣品中的抗原及細菌。
更詳細地說,以上描述的方法可以理解為當(dāng)寡核苷酸對被使用時,其中的一個寡核苷酸分子能雜交到一個并不是來源于糖基轉(zhuǎn)移酶基因、wzx基因或與wzx有相似功能的基因、wzy基因或與wzy有相似功能的基因的序列上。此外,當(dāng)兩個寡核苷酸都能雜交上時,它們可能雜交于同一基因也可能雜交到不同基因上。也即,當(dāng)交叉反應(yīng)出現(xiàn)問題時,可選擇寡核苷酸的混合物來檢測混合的基因以提供檢測的特異性。
本發(fā)明者相信本發(fā)明不必限于以上所提的核苷酸序列編碼的特定的O-抗原,而且廣泛應(yīng)用于檢測所有表達O-抗原和鑒定O-抗原的細菌。而且,由于O-抗原合成和其他多糖抗原(如細菌胞外抗原)合成之間的相似性,本發(fā)明的方法和分子也應(yīng)用于這些其他的多糖抗原。
本發(fā)明首次公開了大腸桿菌O85型的O-抗原基因簇的全長序列,而且可從這個未被克隆的全長基因簇的序列中產(chǎn)生重組分子,通過插入表達可產(chǎn)生表達大腸桿菌O85型的O-抗原,并成為有用的疫苗。
具體實施例方式
下面結(jié)合具體實施例,進一步闡述本發(fā)明。應(yīng)理解這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件。
實施例1基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O85型,離心收集細胞。用500ul 50mM Tris-HCl(pH8.0)和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘。之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘。加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇抽(25∶24∶1)混合溶液提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚,上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,最后將DNA重懸于30ul TE中?;蚪MDNA通過0.4%的瓊脂糖凝膠電泳檢測。
實施例2通過PCR擴增大腸桿菌O85型中的O-抗原基因簇以大腸桿菌O85型的基因組為模板通過Long PCR擴增其O-抗原基因簇。首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動子區(qū)的galF序列設(shè)計上游引物(#1523-ATT GTG GCT GCA GGG ATC AAA GAA AT),再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計下游引物(#1524-TAG TCG CGT GNG CCT GGA TTA AGT TCGC);用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進行30個循環(huán)。最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性。合并5管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物。
實施例3構(gòu)建O-抗原基因簇文庫首先是連接產(chǎn)物的獲得用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫。反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進行。酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng)。合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇(25∶24∶1)混合溶液抽提一次,再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中。隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產(chǎn)物補成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴大為80ul,70℃反應(yīng)20分鐘,使DNA的3’端加dA尾。此混合物經(jīng)等體積氯仿∶異戊醇(24∶1)混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時,總體積為90ul。其中有9ul的10×buffer和25單位的T4DNA連接酶。最后用1/10體積的3M NaAc(pH5.2)和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物。
其次是感受態(tài)細胞的制備參照Bio-Rad公司提供的方法制備感受態(tài)細胞大腸桿菌DH5α。取一環(huán)大腸桿菌DH5α單菌落于5ml的LB培養(yǎng)基中,180rpm培養(yǎng)10小時后,取2ml培養(yǎng)物轉(zhuǎn)接到200ml的LB培養(yǎng)基中,37℃250rpm劇烈振蕩培養(yǎng)到OD600 0.5左右,然后冰浴冷卻20分鐘,于4℃4000rpm離心15分鐘。傾盡上清,用冷的冰預(yù)冷的去離子滅菌水200ml吹散菌體,于4℃4000rpm離心15分鐘。再用冷的冰預(yù)冷的去離子滅菌水100ml吹散菌體,于4℃4000rpm離心15分鐘。用冷的冰預(yù)冷的10%的甘油懸浮細胞,4℃6000rpm離心10分鐘,棄上清,最后沉淀用1ml冰預(yù)冷的10%的甘油懸浮細胞,即為感受態(tài)細胞。將制得的感受態(tài)細胞分裝為50ul一管,-70℃保存。
最后是電轉(zhuǎn)化感受態(tài)細胞取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到Bio-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒-6.0毫秒。電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇。然后立即將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上37℃倒置過夜培養(yǎng),次日得到藍白菌落。將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質(zhì)粒并用EcoRI酶切鑒定其中的插入片段的大小,得到白色克隆群構(gòu)成了大腸桿菌O85型的O-抗原基因簇文庫。
實施例4對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的96個克隆用本實驗室ABI3730型DNA自動測序儀對克隆中的插入片段單向進行測序,使序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列。
實施例5核苷酸序列的拼接及分析用英國劍橋MRC(Medical Research Council)分子生物學(xué)實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O85型的O-抗原基因簇的核苷酸全長序列(見序列列表)。序列的質(zhì)量主要由兩個方面來保證1)對大腸桿菌O85型的基因組作5個LongPCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫。2)對每個堿基,保證3個以上高質(zhì)量的覆蓋率。在得到大腸桿菌O85型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心(The National Center for BiotechnologyInformation,NCBI)的orffinder發(fā)現(xiàn)基因,找到8個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O85型的O-抗原基因簇的結(jié)構(gòu),如表3所示。
通過檢索和比較,發(fā)現(xiàn)orf1編碼的蛋白與Salmonella typhimurium LT2中編碼的UDP-N-acetyl glucosamine-2-epimerase有63%的氨基酸序列一致性和79%的相似性,通過對Pfam蛋白基序數(shù)據(jù)庫的搜索,發(fā)現(xiàn)orf1編碼的蛋白與已知的UDP-N-acetylglucosamine 2-epimerase的共有序列的同源性預(yù)期值為1.9e-166。由于這個基因的確切功能還不能確定,因此我們將這個基因暫命名為orf1。Orf7編碼的蛋白與大腸桿菌K120-抗原基因簇中編碼的UDP-galactopyranose mutase有63%的氨基酸序列一致性和78%的相似性,通過對Pfam蛋白基序數(shù)據(jù)庫的搜索,發(fā)現(xiàn)orf7編碼的蛋白與已知的UDP-galactopyranose mutase的共有序列的同源性預(yù)期值為1.7e-125。UDP-galactopyranose mutase由glf基因編碼,因此我們將這個基因命名為glf。
Orf2和orf4是大腸桿菌O85中僅有的兩個編碼存在跨膜片段的蛋白的基因。Orf4編碼的蛋白與Bacteroides fragilis(AAK68914)的O-抗原轉(zhuǎn)移酶有32%的序列一致性,53%的相似性,通過HMMTOP2.0程序分析蛋白的拓撲結(jié)構(gòu)發(fā)現(xiàn)其含有12個均勻的跨膜片段,這是Wzx蛋白的典型特征。所以命名orf4為wzx。Orf2編碼的蛋白與Bacillus anthracis str.Ames(AAP25548)的O-抗原聚合酶有44%的一致性,46%的相似性,通過HMMTOP2.0程序分析蛋白的拓撲結(jié)構(gòu)發(fā)現(xiàn)其含有8個跨膜片段,并且有一個大的胞質(zhì)內(nèi)親水環(huán)(loop),這是Wzy蛋白的典型特征。所以命名orf9為wzy。
orf3、orf5、orf6、orf8四個基因編碼的蛋白與其他已知的糖基轉(zhuǎn)移酶有24-33%的序列一致性和45-52%的序列相似性。通過對Pfam中糖基轉(zhuǎn)移酶基序數(shù)據(jù)庫的搜索,這四個基因編碼的蛋白與已知的糖基轉(zhuǎn)移酶家族1和2的共有序列的同源性預(yù)期值為3e-37,1.1e-28,0.0735,1e-29,因此我們推測這四個基因編碼糖基轉(zhuǎn)移酶,而且由于每個糖基轉(zhuǎn)移酶特異性催化形成一種二糖鍵,因此我們推測大腸桿菌O85的O-抗原的寡糖單位可能由五個單糖組成。由于這四個基因的確切功能還不能確定,因此我們將這四個基因暫命名為orf3、orf5、orf6、orf8。
實施例6特異基因的篩選。
針對大腸桿菌O85型的O-抗原基因簇中的wzx、wzy基因設(shè)計引物,在每個基因內(nèi)各設(shè)計了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,除在含大腸桿菌O85組中得到了預(yù)期大小的一條帶外,在其他組中都沒有擴增到預(yù)期片段大小的正確產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O85型的O-抗原都是高度特異的;這些基因在核苷酸序列中的位置見表1。
實施例7引物靈敏度的檢測。
購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用。將10μl大腸桿菌O85的凍存菌液接種到有20ml LB培養(yǎng)基的三角瓶中,于37℃,200轉(zhuǎn)/分,培養(yǎng)12小時至飽和,取少量培養(yǎng)好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養(yǎng)12h,對所涂平板計數(shù),計算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入200ml LB培養(yǎng)基,經(jīng)6層紗布過濾,過濾液于37℃,200轉(zhuǎn)/分,培養(yǎng)12h。從培養(yǎng)好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取lμ上清做為PCR模板。用4對寡核苷酸對,SEQ ID NO1中的4589至4606堿基的核苷酸和5332至5347堿基的核苷酸;SEQ ID NO1中的4452至4468堿基的核苷酸和5104至5120堿基的核苷酸;SEQ ID NO1中的2711至2726堿基的核苷酸和3048至3063堿基的核苷酸;SEQ ID NO1中的2749至2765堿基的核苷酸和3346至3363堿基的核苷酸,進行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環(huán)。反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴增帶,則結(jié)果為陽性,若沒有,則結(jié)果為陰性。參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應(yīng)中得到陽性結(jié)果。參入0個活菌的豬肉餡在4對引物的PCR反應(yīng)中得到陰性結(jié)果。說明使用上述方法時,這4對引物對豬肉餡中的大腸桿菌O85的檢測靈敏度均為0.25個菌/g。
通過對O抗原基因簇的克隆和在減毒的疫苗菌株中的表達,可以組建重組疫苗。O抗原為最主要的革蘭氏陰性菌的表面抗原,可以引起強烈的免疫反應(yīng),是制造重組疫苗的最好的靶分子之一。在1993年Viret實驗室成功的將志賀氏菌Sonnei的O抗原基因簇在一株沙門氏菌Tyziai疫苗菌中表達,動物實驗證明可以引起兔子的免疫反應(yīng)(Molecular Microbiology1993,7239-252)。中國軍事醫(yī)學(xué)科學(xué)院的小組也在從事與Viret實驗室類似的工作。王磊實驗室在1999年成功的將大腸桿菌O111的O抗原基因簇在沙門氏菌疫苗STM-1中表達,并證明組建成的菌株可以引起小鼠的血液和體液反應(yīng)(Microbial Pathogenesis 1999,2755-59)。所以本發(fā)明O85的O抗原特異基因序列可以應(yīng)用于組建重組疫苗。
當(dāng)分子探針核苷酸序列與靶DNA序列同源性大于85%時,可以準(zhǔn)確的將目的序列雜交出來。在低嚴(yán)謹(jǐn)性的Southern雜交中要求兩者的同源性大于65%(《分子克隆實驗指南》第三版,第509頁,低嚴(yán)謹(jǐn)性雜交)。本發(fā)明中的特異核苷酸序列在Genebank中的同源性搜索顯示沒有同源性大于65%的其他基因存在。所以在雜交實驗中,本發(fā)明中的特異核苷酸序列作為分子探針將只能對目的細菌得出陽性結(jié)果。Southern雜交法對于分子探針的長度并沒有嚴(yán)格要求,本發(fā)明中的特異核苷酸序列中從20bp或以上的寡核苷酸到整個序列都可以在雜交中應(yīng)用。在一項Southern實驗中,利用沙門氏菌的相關(guān)特異基因(1000bp以上)做分子探針,成功的分辨出該細菌(Liu D,Verma NK,RomanaLK,Reeves PR.,1991 Relationships among the rfb regions of Salmonellaserovars A,B,and D.J Bacteriol.173(15)4814-4819.),很多本領(lǐng)域的實驗都表明1000-2000bp左右的基因序列可以用做分子探針?;蛐酒cSouthern雜交法的原理一樣,在選用分子探針的要求上也相似,所以本發(fā)明中的特異核苷酸序列以及其中的寡核苷酸片段都可以在雜交反應(yīng)中作為分子探針檢測該目的細菌,包括Southern、基因芯片等多種雜交的常規(guī)方法。
根據(jù)本發(fā)明的對大腸桿菌O85型的O-抗原特異的核苷酸序列(SEQ ID NO1所示),構(gòu)造特異核酸探針,將其固定到芯片的載體上制成生物芯片,將要檢測的樣品適當(dāng)處理后,與生物芯片進行雜交反應(yīng),然后利用生物芯片信號分析設(shè)備就可以得到樣品中相應(yīng)的細菌情況。這種大腸桿菌O抗原鑒定的DNA芯片將可以直接用于臨床和其它檢驗場所(如食品加工和生產(chǎn)行業(yè),畜牧獸醫(yī)行業(yè)海關(guān)檢疫等的微生物檢驗)。這種芯片只需要擴大產(chǎn)量,在完全相同的條件下就可以產(chǎn)業(yè)化。
表1列出了大腸桿菌O85型的O抗原基因簇中寡糖單位處理基因及基因內(nèi)的引物及PCR數(shù)據(jù)。在表中列出了大腸桿菌O85型的O抗原基因簇的轉(zhuǎn)運酶基因和聚合酶基因及它們的相應(yīng)的功能和大小。在每個基因內(nèi),我們各設(shè)計了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方以確保其特異性。在表中還列出了每個引物在SEQ ID NO1中的位置和大小。以每對引物用表中所列的相應(yīng)的退火溫度以表2中的所有菌的基因組為模板進行PCR,得到了相應(yīng)的PCR產(chǎn)物,其大小也列于表中。
表2是用于篩選特異基因的166株大腸桿菌和43株志賀氏菌及它們的來源,為了檢測的方便,我們將它們每12-19個菌分為一組,總共12組,它們的來源都列于表中。
在第13組中含有大腸桿菌O85型的基因組DNA作為陽性對照。以每組菌做模板,用表1中的每對引物按如下條件做PCR在95℃預(yù)變性5分鐘后,95℃變性30秒,退火時間是30秒,溫度見表1,72℃延伸2分鐘,這樣進行25個循環(huán)。最后在72℃繼續(xù)延伸5分鐘,反應(yīng)體系是25ul。模板為1∶20稀釋,取1μl。反應(yīng)完畢后,取10ulPCR產(chǎn)物通過0.8%瓊脂糖凝膠電泳檢測擴增出的片段。
對于wzx、wzy基因,每個基因都有兩對引物被檢測,每對引物除了在第13組中做PCR后得到了預(yù)期大小的正確的一條帶外,在其他組中都沒有擴增到任何大小正確的帶,也就是說,在大多數(shù)組中沒有得到任何PCR產(chǎn)物帶,所以wzx、wzy基因?qū)Υ竽c桿菌O85型及其O-抗原是高度特異的。
最后,通過PCR從大腸桿菌O85型中篩選到對大腸桿菌O85型的O-抗原高度特異的基因轉(zhuǎn)移酶基因(wzx基因)和轉(zhuǎn)運酶基因(wzy基因)。而這些基因內(nèi)的任何一段10-20nt的寡核苷酸對大腸桿菌O85型的O-抗原是特異的,尤其是上述每個基因中的引物即寡核苷酸對經(jīng)PCR檢測后證實對大腸桿菌O85型是高度特異的。所有的這些寡核苷酸都可用于快速準(zhǔn)確地檢測人體和環(huán)境中的大腸桿菌O85型,并能鑒定它們的O-抗原。
表3是大腸桿菌O85型的O-抗原基因簇的結(jié)構(gòu)表,在表中列出了大腸桿菌O85型的O-抗原基因簇的結(jié)構(gòu),共由12個基因組成,每個基因用方框表示,并在方框內(nèi)寫入基因的名稱,數(shù)字表示的是O-抗原基因簇中的開放閱讀框(orf)的順序。在O-抗原基因簇的兩端是galF基因和gnd基因,它們不屬于O-抗原基因簇,我們只是用它們的一段序列設(shè)計引物來擴增O-抗原基因簇的全長序列。
表4是大腸桿菌O85型的O-抗原基因簇中的基因的位置圖,在圖中列出了大腸桿菌O85型的O-抗原基因簇中的所有開放閱讀框在全序列中的準(zhǔn)確位置,在每個開放閱讀框的起始密碼子和終止密碼子的下面劃線。在大腸桿菌中開放閱讀框的起始密碼子有兩個ATG和GTG。
SEQ ID NO1序列(SEQUENCE LISTING)<110>天津生物芯片技術(shù)有限責(zé)任公司<120>對大腸桿菌O85型的O抗原特異的核苷酸<130>對大腸桿菌O85型的O抗原特異的核苷酸<160>1<170>PatentIn version 3.2<210>1
<211>11203<212>DNA<213>Escherichia coli<400>1attgtggctg cagggatcaa agaaatcctc ctggtaactc acgcgtccaa gaacgcggtc60gaaaaccact tcgacacctc ttatgaatta gaatctcttc ttgagcagcg cgtgaagcgt120caactgcttg cggaagtgca gtccatctgt ccgccgggcg tgaccattat gaacgtgcgt180cagggcgaac ctttaggttt aggccactcc attttgtgtg cacgacccgc cattggtgac240aacccatttg tcgtggtgct gccagacgtt gtgatcgacg acgcgagtgc cgatccgctg300cgttacaacc ttgctgccat gattgcgcgc ttcaacgaaa cgggccgcag tcaggtgctg360gcaaaacgta tgccgggtga cctctctgaa tactccgtta ttcagaccaa agaaccactg420gatcgtgaag gtaaagtcag tcgcatcgtc gaatttatcg aaaaaccgga tcagccgcag480acgctggact cagatatcat ggccgttggt cgctatgtgc tttctgccga tatttggccg540gaacttgaac gcactcagcc tggtgcatgg gggcgtattc agctgactga tgccattgcc600gaactggcga aaaaacagtc cgttgatgcc atgctgatga ccggcgacag ctacgactgc660ggtaaaaaaa tgggctatat gcaggcgttt gtgaagtatg gactacgcaa cctgaaagaa720ggggcgaagt tccgcaaagg tattgagacg ctgttaagcg aataatgaaa atctgaccga780atgtaacggt tgataagaaa attataacgg cagtgaagat tcgtggcgaa agtaatttgt840tgcgaatatt cctgccgttg ttttatataa acaatcagaa taacaaagag ttagcaatag900gattttcgtc aaagttttca ggattttcct tgtttccaga gcggattggt aagacaatta960gcgtttgaa tttttcggatt tagcgcgagt ggttaacgct cgtcacatcg taggcatgca1020tgcagtgctc tggtagctga aaagccaggg gcggtagcgt gtcgtttttt gtaaacataa1080tttttacatt gctgagagat atatgaaccg aaagatactg gtagtatttg gaacgcggcc1140agaagctatt aaaatgattc ctgttgttca ggaattgaaa aaggaaaaag actttattgt1200gaaagtctgt atcactgctc aacatagaca aatgcttgat caggtattga acatttttaa1260tattcagcct gactatgact taaatgtgat ggaaagtggg caaacattag acgatataac1320attaaaggtt ctcaaagggg tatcgtcagt attgaaagat ttctcgccag acttagtatt1380agtccatgga gataccacaa ctacttttgc tagtagcttg gcgtgttatt atcaaaaaat1440tgatgtcggg catgttgaag ctggtttacg tactggcgat atttattcac catggccaga1500agaaggtaat agaaggttaa ctgccgtatt agctaaatat cacttctcgc caacaaaaga1560tgcgtcgttt aatttaaaac gagaggggta caatcccgat tgcatatttg taacaggaaa1620tactgttatt gattctttaa tgagagccaa ggatataatc aaagataatg aaagtttgca1680gaaggaattt tctaataagt ttggttttat tggtaatgac aaaaaactga tattggtaac1740aggtcataga agagaaaatt tcggattggg atttgaaaat gtttgtaaat cgttagccga1800ggtggcatat aaatatacta acgtaaacat tgtataccct gttcatctta atccaaatgt1860tcaggaacct gtaaaaagga tattgggtga tatacctaat attttcttga tagaaccgca1920agaatatctt ccatttgttt atctaatgaa tagggcttac ctgattctta cagactcagg1980aggaattcag gaagaagcac cgtcgctagg cgtaccagta ttggttacaa gggaggtaac2040agaaaggcca gaggctgtta aagcagggac ggttaaatta gtcggtacaa cccccataaa2100aatagtatct gctattgatg aattactcct tgatgataat aaatataaaa aaatgtcacg2160agcgcataat ccatacggag atggtttagc atctgttaga atatgtgata tattaactaa2220agtattaact gcaatataaa gaatgttaac taagtgactt atattatggt ggttctttat2280tttagtatta tattgctgt catctcttttt tttacaacaa gttttagctt ttatggattg2340tcattttatg gctggctggc agcatttatt cttttacttc catttgttag gagagtaaag2400aaagggaaag tatttataat aatattacct gcaatatcaa taatgtcttt tttcttatca2460aaaggccatg agcttgatgg attaataaac aatgtgaaat taaatggtat aattttgata2520
acagtaggcg caatgtatct tattattacc tctgatatca tgaaaaaaat accacctaaa2580ataatgagta acattattgc tgtagtaatg attactcatg ttttgattgc atttttccaa2640tttgtttatt ggtatgcttt cggaggagat ctcgatgtca gttcgatttt tggaggaagt2700ggtcatcgct cattttacta tggcatttat agaataactg gagtgtttga cgagccagct2760atttattcaa catttatcat gtctttctgt tttttacgtt tttatttaat ggggagaaat2820gactgggtga attatgttgg tgttgtcagt ataatattat cattgtcgtt tgcgggtatt2880gttatagtat ttctttattt gcttgtttct gaaacttggg ataaaaaaat tatttttata2940agtataatga tttttgtggt ttgcttattt gtagcttctt tttatcctga aatatatggt3000tcagtattaa ctcgtttaga aaccttacaa gctgggaatg atggaagcag taacttaaag3060tttcagtacg ttaacttttg gttgagtgat gaacaacgta ttttatttgg caatggaatg3120gttgggtatt atgatggaaa gcctaagttt tttgagtctg catttgattt gacttttatt3180tttacaacca ttacaactta tggtgttgtg ttatcaattc ctctattttt agttttatat3240tattacttat ttaaaggaca gaagagaaaa aatcaattat tgcttctaat tataagtttg3300aaaatgacat ctataatatt tccatttttt tgggtcttca gtggtatcat aatagcatat3360gaaaaaaata aatatagtag ttgatgatct atctactaaa gggggagtgg aatcagtagt3420aacttcacta gccaatgggt tcattaaaaa aggagtaaaa gtaaacttta tatgtgtaaa3480aaaatgtaaa cctaattttg aaattcataa agatataaat ataatatatt tgcttgataa3540atggagtaaa ttacggaagt atagagtgtt aataagattt ttcagggaaa aattaaatac3600cgaggacata ttatatacta actctgtaat taatacatta ctggctatcc tttttgctcc3660gaaaaaaaca gctaaatatg catgtgatca taatcagtat aatgcagtaa atagactatg3720ggcttttttc cgatttttgc tatataaaag gttggaagga gtaattgttc taactcaaca3780tgatctgatt aaatatagaa aaataaactc taactgcaaa ctgtttgata atcctgttag3840ttcttccttc ttttatacag ataaaaaatc ttcggctact gttaagaaat atatattaaa3900tattggcagg ttggaaaaac agaagggaca ggatctactg ttagccgcat ggaatttggt3960gaataaaaaa ggatatgaac tatggatttg cggagatggt agtcagaagc aaacactcga4020acaacagaca aaactctatg gattaacgac atcagttaaa tttcttggaa atagagatga4080tattgatatc ctactaagag gtgcatattg taatgtatta tcctctcgat ttgaaggaaa4140gccagtgagt ctaattgagt caaaagttgt agggtgtcct aacatttcct ttaattgcaa4200aactggtcca gctgagataa ttaatcataa atatgatgga ttattaattg atgcggggaa4260tattgaggcg ttagccaaag gaatacagtt gttaatagac aatcctatta ttagagatga4320gtatgcgaaa aatgcatgta tgaacaatga gagatatatg ctagaaaata tctgtgaaga4380atatcttagc ttctttaata ttaaagcata aattatatta tgaatctaaa aagaaatggg4440attttatttt acgctctaac tattttaaat ggtttggtgc ctcttataac aatatcgttt4500atgtcaagaa tattaacaag tgatcaactt ggtaattatt tgctttcatt tacaatcatg4560aatgtattag gcatggttgt agatttcggg atatcgattt caggtgttag aacattaaaa4620aaaaataatc tcaatttaac acttgatgaa tttatttgtt cctccttttt attaaaattt4680tttgtttttt tcttagtgtc aatatgctac ttggtatttt ttacttatac cgctactgag4740gaggagatgt tttttatagt tactctatta ggagtattca ttacaggcat ggatagttta4800tggatactgc aggtgagtgg tgatttatat aaaatactaa cgaaaaacat tatcgcaaat4860atattatatg taatgatggt aatgttagtt gcatatataa ctaaagatta tttgagtaca4920cttattttat ttgtaattta taagctttac atattattat taacaataaa cgaggttcgc4980aaattatacg tcttatcaag aaataacttt agtataataa attttatttc tgtattcaag5040agtacagctg gaatagctat gtttcgcttt tttgctcttt catatacctc ggcaaatggt5100atcttattga attaccttac aaataaatat caggttgcgc tgtacttagc atttgaaaaa5160ctaaataaag ctatactttt tatagcgacg cctcttacgc aagcattatt accattattt5220gttgggggaa agaataataa caagttaata aaatacataa tatctatcat tattatttct5280
gtattcatat tagttattgg caacttatta tcaaaagaaa tcgtcggtct gtttataggt5340acgagatatt taaatgatga tacatcagag ttcttttttt acatgacaat tgtttcgcca5400ctaatacttt taagcaatgc gattggtatg ctttatttta ttccatgtaa acttgataga5460tttcttaatt gtataatatg tagcgcagca tttataaata ttatttgtgt tttatatttt5520gttcattcag atgtaaacgg agctttacag atggctcgtg ttgttgcatt tagtgaatta5580tgggtaacgc tattcatggc ggtcgtggcg attatacatg ggagaaaata tggaaggtaa5640aattttatat atatgctcgg atttttatcc gatgagtact ggttattcga atgcgttcag5700taattttctg gatgcaattg gaaattatca agtagatata ttaacaacaa caaaagatgc5760ctcattaaaa aaaagtgcta ttaatagagc aatttttaaa tctaaagtta tttatgggtg5820tggtgcgttg gattatattg ttaactcttt aattttatat ggaaattaca ggaggttaat5880tagaaaatat aattatgatc tcatattcat tgaaacattt gatgatgcat tatttttatc5940attaataccc gagtcagaat acaaaacaat tattgttagg attcattcaa cttcagaaac6000agaatataca tatttttttc caggtaaaaa atataaactc aacagattct tacaaagaaa6060gataatagca ccgaagatta aaaatatatg ctctactagt gcatttcata atgggtttat6120caaaaaaaat atgttttatg ataatcttta tgatatatgc cagaagaatt tttttgtgtt6180gcctaataca atgcccgatg taaaaaattt tttttgtaaa gataaaaata atgaagaaaa6240agttaagcta tttagcttag gtcgattgaa tagagaaggg atgtgtcaaa aaggtcaaca6300tgatttaatt atggccatat ctttactagg taaaagcttt tcggatattg cttcatgtac6360aattgtaggt gatggagaat attatgaata tctagagtca ttaatttaca aattaggact6420tagcgaatgt atcaaactga ttcgtaagat gtctcatgat gaaataatta gtcacttaag6480tttgtctgac attgtggtgt tgccatctcg ttttgaggga atgcctatgt ttgcccttga6540agcattatat actcaaaatt tatgtctatt cagcaacaca ggtggtttaa gtgatatgat6600agttaacgaa gattacagct accccccgca agatattgat gcattggcca aagcgattga6660tcgggcaata cacttaaaca aaagcgattt gtataatgaa aagatgaatt catatgaaaa6720ggcgctatct ttttcttatg aaaatgttaa aaataaattt gataaaatat ttaaaatggt6780agtatcagga atatgattat ttttttacgt agttactcta tctccaaaga tagtcggctc6840ttaaagtata tatctatatg caaagaaaat aatatacgtt ataagattat cggttgggat6900aaagatcata acgaacaata tagagatgat gcctattatt ttaaaggtgg ctttaaactt6960ggaaaaaaat ggctgaacgt gatggctatt tttaaatggt ggatctttat tttttatctg7020attattttca ggataaaaaa taatattacc gccattcatt ctgtagatct tgattgtgga7080attgttggtc taattataag taaattactt agagcaaaac atatatatga catatatgat7140gtttattcgg ctaaccgtaa tatgagaggc cttattaagg cattgattga ttcacttgag7200cggtttgtgt gtcggaagtc cacatatttt attatgcctg agtcattccg ttttgagcag7260ttaggtatag accaagataa tatcaattat aataatttta ttgaaattga aaatgttcct7320caaattgata ggaatattga attaagatac atatctcccg gtcagtatga tttttatctg7380gcttatgctg gttcattaga accaagacac agaggattag agaacttatt gaaagctgta7440tcaatttgtc ctaatgtatt cctcgacata gctggtgttg gaccattaac tgctttgtgt7500aaaaaatact ctcagcaatt taataatatt tgttttcatg gtggtttaac acctcaacaa7560gtctatgaat tagaggctaa cgcccaaatt attatcggta tgtactataa aacaagagat7620aatcatcttt ttgcatctcc gaataaatat tatgagcact tggcacttgg taaagtcatg7680ttgacaacca gcggcacccc tcctggaatg aaagttgaaa agtataaaac tggatttgca7740attggtgaaa gtttacaaga cattatagat tttttacaat ctcttaatgg aaaagaggat7800ataatagata atttttcaat aaatgcatat aggatctggg tagacaaata ttcggattac7860aatgaaagat atttatctaa acaatacatg aaaatggtgg gtaagtgatg tacgattatt7920taatagttgg ttcaggtctt tttggttcgg tatttgcata tgaaatgaaa aaaaaaggat7980actcgataaa agtaatagaa aaaagagcgc acattggagg gaatatttat tgtgaggaaa8040
ttgaaggtat taatgtacat aaatatggtg ctcatatttt tcacactaat gaaaaagaaa8100tctgggaata tgtgaattct tttgttgaat ttaatcgatt cactaattct ccggtagctt8160tatctaaagg tgagatttat aacttaccat ttaatatgaa tacatttaat aaaatgtggg8220gggtgacgtc tccctcagca gcaaaaaata aaattgaaca acagagaaaa gaaattggta8280acaaagagcc agccaatttg gaagaacaag caatatcatt agttggtcga gatatttttg8340aaactttaat aaaagaatat acagaaaaac aatgggggcg tgaatgcaaa aacttacctg8400cattcattat taaacgtctt cctgttagat ttacctatga caataattat tttaatgatc8460gatatcaagg aataccgatc ggtggatata atagaataat tgagaagatg ttagagggtg8520tagacgttca attaaataca gacttttttg ataataaaga ttactggatt agtagcgcac8580gaaaaattgt ttatacaggc cctattgatc gcttttttaa ttatgagttt ggtgagttgg8640attaccgtac attatcatct gagcatgaga ttaagaatga aagtaatttt caaggaaatg8700ctgtagttaa ttatattgat tcaagctatg aatttactcg aattattgag cataaacatt8760ttgaatttgg agagcaggat aaaacagtta ttacgaaaga gtttcccaaa gagtatgtaa8820atggagatga accgtactat ccggttaatg actctgaaaa taatagaaaa tatgccaaat8880ataagttgaa aacaagccaa ttcgataacg ttatttttgg tggaagacta gcagaatata8940agtattatga tatgcaccaa gtaattgcat ctgcattgaa agccgtaagt aaagaggttt9000ctcaatgaaa atgcctagag ttatatgtat aattgtcact tttaatcgcg agcatttact9060gcaacaaaca cttgatgcag tattaaatca aacattcccc ctacaaaata taattgttat9120agataataat agcttcgata atacacgcag tttagtttct aaattgagcg aaaataatcc9180caaaatagaa tatcataata ctggagcgaa tattggaggc gctggcgggt ttcatagagg9240ttttgctgtt gcctcaaaat ataaatatga ttatttatgg cttatggatg atgatctaaa9300gcctgaaata gaatgtcttt ataacctgat atcctctgca actgaacatg gtatctatca9360acctataaga ataaatgtag atggctcatg tgcagaactt tcccctgttg tttatgattt9420aaaaaatcct ttttttatga atccgaagcg attatctgtc atcaacctct ataaacgtat9480gaacaatgct gtatatagtc cttttgatat tcatggagtt cctttcgagg ggccattaat9540atctagagat gtaattcaat gtattggtta tcccaatcct aatttcttta ttttttatga9600cgatcttgac tactccttga gggcaagaaa agcagggttt gaaatcaaat gtattccaag9660tgccagagcg gttagactac taaaaaataa tcagcgtagt gatttgacat cttggaaagg9720atattttatg tttcgtaatc ttttctatat tcatcgtacc tatggcgaaa atatattcgt9780taggttaaaa ccatttctgc tggttctggg gtatcttgtg tttttaatct ttagatttaa9840gtttaatcaa gttcctacta ttttatctgc atttaaagat tcacgaaaac ttgataattc9900tgaattacat aaaccataaa agggttttat aattgccaat gttaactgta attaaaccat9960aatgctaaca aacccaaaca tggtgtatca taaaatgatt ttattagtta ataaaaagta10020agttttttac atgacgtagc ttatttgcac atatgagatg tgcctagaat ataatatact10080catttctgtg tgaatataaa atttatacct acgcttactt agtttgtata attatcttga10140tgagctaaga gataatataa tttgcaaaat taatttattg tgaattaatt tgataatgct10200aatgcataga cataacttgt aaaattaaac atcagtttgt tttttttatt aatctacatc10260attaagaata aggatttggc attgtgggtt taataacatc atagtattat tcactcttac10320tatttatagg ttggcatata acgaaaaatg ttaattgata gactgatatg tagatattca10380tttctcatgt taatgagatt ggaataatgt gttgttaatt tgtcttgttt ataaatttac10440ttactgatat ttgtgattat tcatcatata acttcttgta aatgagcatc ctctagcaat10500taatgttgtc cttcataagc aagctgcatc ttcgcggcat tttccgaaag gagtaaacaa10560tgtcaaagca acagattggc gtagtcggta tggcagtgat ggggcgcaat cttgcgctta10620acatcgaaag ccgtggttat accgtctcta ttttcaaccg ttcacgtgag aaaacggaag10680aagtgattgc cgaaaatcca ggcaaaaaac tggttcctta ctatacggtg aaagagtttg10740ttcaatctct ggaaacgcct cgtcgtatcc tgttaatggt gaaagcaggt gcaggcacgg10800
atgctgctat tgattccctc aagccatacc tcgataaagg tgacatcatc attgatggtg10860gtaacacctt cttccaggac actattcgtc gtaaccgtga gctttctgca gaaggcttta10920acttcatcgg taccggtgtt tccggtggtg aagaaggtgc gctgaaaggt ccttccatta10980tgccaggtgg acagaaagaa gcctatgaac tggttgcgcc gattctgacc aaaatcgccg11040cagtggctga agacggtgag ccatgcgtta cctatattgg tgccgatggc gcaggtcact11100atgtgaagat ggttcacaac ggtattgaat acggcgatat gcaactgatt gctgaagcct11160attctctgct taaaggtggc ctgaaccttt ccaacgaaga act 11203表1大腸桿菌O85型的O抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因及其中的引物及PCR數(shù)據(jù)
*只在大腸桿菌O85型中得到正確的一條帶表2 166株大腸桿菌和43株志賀氏菌及它們的來源
為了檢測的方便,每12-19個菌分為一組,總共12組,第13組作為陽性對照a.Institude of Medical and Veterinary Science,Anelaide,Australiab.Statens Serum Institut,Copenhagen,Denmarkc.O172和O173來自于Statens Serum Institut,Copenhagen,Denmark,其余來自于IMVSd.中國預(yù)防醫(yī)學(xué)科學(xué)院流行病學(xué)研究所表3大腸桿菌O85型O抗原基因結(jié)構(gòu)E.coli O85 gene cluster orf#galForf1wzyorf3 wzx orf5 orf6 glf orf8 gndG+C% 35.729.3 30.8 38.6 29.1 31.4 31.332.6Content表4大腸桿菌O85型O抗原基因簇基因位置ATTGTGGCTG CAGGGATCAA AGAAATCCTC CTGGTAACTC ACGCGTCCAA GAACGCGGTC60GAAAACCACT TCGACACCTC TTATGAATTA GAATCTCTTC TTGAGCAGCG CGTGAAGCGT120CAACTGCTTG CGGAAGTGCA GTCCATCTGT CCGCCGGGCG TGACCATTAT GAACGTGCGT180CAGGGCGAAC CTTTAGGTTT AGGCCACTCC ATTTTGTGTG CACGACCCGC CATTGGTGAC240AACCCATTTG TCGTGGTGCT GCCAGACGTT GTGATCGACG ACGCGAGTGC CGATCCGCTG300CGTTACAACC TTGCTGCCAT GATTGCGCGC TTCAACGAAA CGGGCCGCAG TCAGGTGCTG360GCAAAACGTA TGCCGGGTGA CCTCTCTGAA TACTCCGTTA TTCAGACCAA AGAACCACTG420GATCGTGAAG GTAAAGTCAG TCGCATCGTC GAATTTATCG AAAAACCGGA TCAGCCGCAG480ACGCTGGACT CAGATATCAT GGCCGTTGGT CGCTATGTGC TTTCTGCCGA TATTTGGCCG540GAACTTGAAC GCACTCAGCC TGGTGCATGG GGGCGTATTC AGCTGACTGA TGCCATTGCC600GAACTGGCGA AAAAACAGTC CGTTGATGCC ATGCTGATGA CCGGCGACAG CTACGACTGC660GGTAAAAAAA TGGGCTATAT GCAGGCGTTT GTGAAGTATG GACTACGCAA CCTGAAAGAA720GGGGCGAAGT TCCGCAAAGG TATTGAGACG CTGTTAAGCG AATAATGAAA ATCTGACCGA780ATGTAACGGT TGATAAGAAA ATTATAACGG CAGTGAAGAT TCGTGGCGAA AGTAATTTGT840TGCGAATATT CCTGCCGTTG TTTTATATAA ACAATCAGAA TAACAAAGAG TTAGCAATAG900GATTTTCGTC AAAGTTTTCA GGATTTTCCT TGTTTCCAGA GCGGATTGGT AAGACAATTA960GCGTTTGAAT TTTTCGGATT TAGCGCGAGT GGTTAACGCT CGTCACATCG TAGGCATGCA1020TGCAGTGCTC TGGTAGCTGA AAAGCCAGGG GCGGTAGCGT GTCGTTTTTT GTAAACATAA1080Orf1的起始TTTTTACATT GCTGAGAGAT ATATGAACCG AAAGATACTG GTAGTATTTG GAACGCGGCC 1140AGAAGCTATT AAAATGATTC CTGTTGTTCA GGAATTGAAA AAGGAAAAAG ACTTTATTGT1200GAAAGTCTGT ATCACTGCTC AACATAGACA AATGCTTGAT CAGGTATTGA ACATTTTTAA1260TATTCAGCCT GACTATGACT TAAATGTGAT GGAAAGTGGG CAAACATTAG ACGATATAAC1320ATTAAAGGTT CTCAAAGGGG TATCGTCAGT ATTGAAAGAT TTCTCGCCAG ACTTAGTATT1380AGTCCATGGA GATACCACAA CTACTTTTGC TAGTAGCTTG GCGTGTTATT ATCAAAAAAT1440
TGATGTCGGG CATGTTGAAG CTGGTTTACG TACTGGCGAT ATTTATTCAC CATGGCCAGA1500AGAAGGTAAT AGAAGGTTAA CTGCCGTATT AGCTAAATAT CACTTCTCGC CAACAAAAGA1560TGCGTCGTTT AATTTAAAAC GAGAGGGGTA CAATCCCGAT TGCATATTTG TAACAGGAAA1620TACTGTTATT GATTCTTTAA TGAGAGCCAA GGATATAATC AAAGATAATG AAAGTTTGCA1680GAAGGAATTT TCTAATAAGT TTGGTTTTAT TGGTAATGAC AAAAAACTGA TATTGGTAAC1740AGGTCATAGA AGAGAAAATT TCGGATTGGG ATTTGAAAAT GTTTGTAAAT CGTTAGCCGA1800GGTGGCATAT AAATATACTA ACGTAAACAT TGTATACCCT GTTCATCTTA ATCCAAATGT1860TCAGGAACCT GTAAAAAGGA TATTGGGTGA TATACCTAAT ATTTTCTTGA TAGAACCGCA1920AGAATATCTT CCATTTGTTT ATCTAATGAA TAGGGCTTAC CTGATTCTTA CAGACTCAGG1980AGGAATTCAG GAAGAAGCAC CGTCGCTAGG CGTACCAGTA TTGGTTACAA GGGAGGTAAC2040AGAAAGGCCA GAGGCTGTTA AAGCAGGGAC GGTTAAATTA GTCGGTACAA CCCCCATAAA2100AATAGTATCT GCTATTGATG AATTACTCCT TGATGATAAT AAATATAAAA AAATGTCACG2160AGCGCATAAT CCATACGGAG ATGGTTTAGC ATCTGTTAGA ATATGTGATA TATTAACTAA2220Orf1的終止orf2的起始AGTATTAACT GCAATATAAA GAATGTTAAC TAAGTGACTT ATATTATGGT GGTTCTTTAT2280TTTAGTATTA TATTGCTGTC ATCTCTTTTT TTTACAACAA GTTTTAGCTT TTATGGATTG2340TCATTTTATG GCTGGCTGGC AGCATTTATT CTTTTACTTC CATTTGTTAG GAGAGTAAAG2400AAAGGGAAAG TATTTATAAT AATATTACCT GCAATATCAA TAATGTCTTT TTTCTTATCA2460AAAGGCCATG AGCTTGATGG ATTAATAAAC AATGTGAAAT TAAATGGTAT AATTTTGATA2520ACAGTAGGCG CAATGTATCT TATTATTACC TCTGATATCA TGAAAAAAAT ACCACCTAAA2580ATAATGAGTA ACATTATTGC TGTAGTAATG ATTACTCATG TTTTGATTGC ATTTTTCCAA2640TTTGTTTATT GGTATGCTTT CGGAGGAGAT CTCGATGTCA GTTCGATTTT TGGAGGAAGT2700GGTCATCGCT CATTTTACTA TGGCATTTAT AGAATAACTG GAGTGTTTGA CGAGCCAGCT2760ATTTATTCAA CATTTATCAT GTCTTTCTGT TTTTTACGTT TTTATTTAAT GGGGAGAAAT2820GACTGGGTGA ATTATGTTGG TGTTGTCAGT ATAATATTAT CATTGTCGTT TGCGGGTATT2880GTTATAGTAT TTCTTTATTT GCTTGTTTCT GAAACTTGGG ATAAAAAAAT TATTTTTATA2940AGTATAATGA TTTTTGTGGT TTGCTTATTT GTAGCTTCTT TTTATCCTGA AATATATGGT3000TCAGTATTAA CTCGTTTAGA AACCTTACAA GCTGGGAATG ATGGAAGCAG TAACTTAAAG3060TTTCAGTACG TTAACTTTTG GTTGAGTGAT GAACAACGTA TTTTATTTGG CAATGGAATG3120GTTGGGTATT ATGATGGAAA GCCTAAGTTT TTTGAGTCTG CATTTGATTT GACTTTTATT3180TTTACAACCA TTACAACTTA TGGTGTTGTG TTATCAATTC CTCTATTTTT AGTTTTATAT3240TATTACTTAT TTAAAGGACA GAAGAGAAAA AATCAATTAT TGCTTCTAAT TATAAGTTTG3300Orf3的起始AAAATGACAT CTATAATATT TCCATTTTTT TGGGTCTTCA GTGGTATCAT AATAGCATAT3360Orf2的終止GAAAAAAATA AATATAGTAG TTGATGATCT ATCTACTAAA GGGGGAGTGG AATCAGTAGT3420AACTTCACTA GCCAATGGGT TCATTAAAAA AGGAGTAAAA GTAAACTTTA TATGTGTAAA3480AAAATGTAAA CCTAATTTTG AAATTCATAA AGATATAAAT ATAATATATT TGCTTGATAA3540ATGGAGTAAA TTACGGAAGT ATAGAGTGTT AATAAGATTT TTCAGGGAAA AATTAAATAC3600CGAGGACATA TTATATACTA ACTCTGTAAT TAATACATTA CTGGCTATCC TTTTTGCTCC3660GAAAAAAACA GCTAAATATG CATGTGATCA TAATCAGTAT AATGCAGTAA ATAGACTATG3720GGCTTTTTTC CGATTTTTGC TATATAAAAG GTTGGAAGGA GTAATTGTTC TAACTCAACA3780TGATCTGATT AAATATAGAA AAATAAACTC TAACTGCAAA CTGTTTGATA ATCCTGTTAG3840TTCTTCCTTC TTTTATACAG ATAAAAAATC TTCGGCTACT GTTAAGAAAT ATATATTAAA3900TATTGGCAGG TTGGAAAAAC AGAAGGGACA GGATCTACTG TTAGCCGCAT GGAATTTGGT3960GAATAAAAAA GGATATGAAC TATGGATTTG CGGAGATGGT AGTCAGAAGC AAACACTCGA4020
ACAACAGACA AAACTCTATG GATTAACGAC ATCAGTTAAA TTTCTTGGAA ATAGAGATGA4080TATTGATATC CTACTAAGAG GTGCATATTG TAATGTATTA TCCTCTCGAT TTGAAGGAAA4140GCCAGTGAGT CTAATTGAGT CAAAAGTTGT AGGGTGTCCT AACATTTCCT TTAATTGCAA4200AACTGGTCCA GCTGAGATAA TTAATCATAA ATATGATGGA TTATTAATTG ATGCGGGGAA4260TATTGAGGCG TTAGCCAAAG GAATACAGTT GTTAATAGAC AATCCTATTA TTAGAGATGA4320GTATGCGAAA AATGCATGTA TGAACAATGA GAGATATATG CTAGAAAATA TCTGTGAAGA4380Orf3的終止 orf4的起始ATATCTTAGC TTCTTTAATA TTAAAGCATA AATTATATTA TGAATCTAAA AAGAAATGGG4440ATTTTATTTT ACGCTCTAAC TATTTTAAAT GGTTTGGTGC CTCTTATAAC AATATCGTTT4500ATGTCAAGAA TATTAACAAG TGATCAACTT GGTAATTATT TGCTTTCATT TACAATCATG4560AATGTATTAG GCATGGTTGT AGATTTCGGG ATATCGATTT CAGGTGTTAG AACATTAAAA4620AAAAATAATC TCAATTTAAC ACTTGATGAA TTTATTTGTT CCTCCTTTTT ATTAAAATTT4680TTTGTTTTTT TCTTAGTGTC AATATGCTAC TTGGTATTTT TTACTTATAC CGCTACTGAG4740GAGGAGATGT TTTTTATAGT TACTCTATTA GGAGTATTCA TTACAGGCAT GGATAGTTTA4800TGGATACTGC AGGTGAGTGG TGATTTATAT AAAATACTAA CGAAAAACAT TATCGCAAAT4860ATATTATATG TAATGATGGT AATGTTAGTT GCATATATAA CTAAAGATTA TTTGAGTACA4920CTTATTTTAT TTGTAATTTA TAAGCTTTAC ATATTATTAT TAACAATAAA CGAGGTTCGC4980AAATTATACG TCTTATCAAG AAATAACTTT AGTATAATAA ATTTTATTTC TGTATTCAAG5040AGTACAGCTG GAATAGCTAT GTTTCGCTTT TTTGCTCTTT CATATACCTC GGCAAATGGT5100ATCTTATTGA ATTACCTTAC AAATAAATAT CAGGTTGCGC TGTACTTAGC ATTTGAAAAA5160CTAAATAAAG CTATACTTTT TATAGCGACG CCTCTTACGC AAGCATTATT ACCATTATTT5220GTTGGGGGAA AGAATAATAA CAAGTTAATA AAATACATAA TATCTATCAT TATTATTTCT5280GTATTCATAT TAGTTATTGG CAACTTATTA TCAAAAGAAA TCGTCGGTCT GTTTATAGGT5340ACGAGATATT TAAATGATGA TACATCAGAG TTCTTTTTTT ACATGACAAT TGTTTCGCCA5400CTAATACTTT TAAGCAATGC GATTGGTATG CTTTATTTTA TTCCATGTAA ACTTGATAGA5460TTTCTTAATT GTATAATATG TAGCGCAGCA TTTATAAATA TTATTTGTGT TTTATATTTT5520GTTCATTCAG ATGTAAACGG AGCTTTACAG ATGGCTCGTG TTGTTGCATT TAGTGAATTA5580Orf5的起始Orf4的終止TGGGTAACGC TATTCATGGC GGTCGTGGCG ATTATACATG GGAGAAAATA TGGAAGGTAA5640AATTTTATAT ATATGCTCGG ATTTTTATCC GATGAGTACT GGTTATTCGA ATGCGTTCAG5700TAATTTTCTG GATGCAATTG GAAATTATCA AGTAGATATA TTAACAACAA CAAAAGATGC5760CTCATTAAAA AAAAGTGCTA TTAATAGAGC AATTTTTAAA TCTAAAGTTA TTTATGGGTG5820TGGTGCGTTG GATTATATTG TTAACTCTTT AATTTTATAT GGAAATTACA GGAGGTTAAT5880TAGAAAATAT AATTATGATC TCATATTCAT TGAAACATTT GATGATGCAT TATTTTTATC5940ATTAATACCC GAGTCAGAAT ACAAAACAAT TATTGTTAGG ATTCATTCAA CTTCAGAAAC6000AGAATATACA TATTTTTTTC CAGGTAAAAA ATATAAACTC AACAGATTCT TACAAAGAAA6060GATAATAGCA CCGAAGATTA AAAATATATG CTCTACTAGT GCATTTCATA ATGGGTTTAT6120CAAAAAAAAT ATGTTTTATG ATAATCTTTA TGATATATGC CAGAAGAATT TTTTTGTGTT6180GCCTAATACA ATGCCCGATG TAAAAAATTT TTTTTGTAAA GATAAAAATA ATGAAGAAAA6240AGTTAAGCTA TTTAGCTTAG GTCGATTGAA TAGAGAAGGG ATGTGTCAAA AAGGTCAACA6300TGATTTAATT ATGGCCATAT CTTTACTAGG TAAAAGCTTT TCGGATATTG CTTCATGTAC6360AATTGTAGGT GATGGAGAAT ATTATGAATA TCTAGAGTCA TTAATTTACA AATTAGGACT6420TAGCGAATGT ATCAAACTGA TTCGTAAGAT GTCTCATGAT GAAATAATTA GTCACTTAAG6480TTTGTCTGAC ATTGTGGTGT TGCCATCTCG TTTTGAGGGA ATGCCTATGT TTGCCCTTGA6540AGCATTATAT ACTCAAAATT TATGTCTATT CAGCAACACA GGTGGTTTAA GTGATATGAT6600
AGTTAACGAA GATTACAGCT ACCCCCCGCA AGATATTGAT GCATTGGCCA AAGCGATTGA6660TCGGGCAATA CACTTAAACA AAAGCGATTT GTATAATGAA AAGATGAATT CATATGAAAA6720GGCGCTATCT TTTTCTTATG AAAATGTTAA AAATAAATTT GATAAAATAT TTAAAATGGT6780Orf6的起始Orf5的終止AGTATCAGGA ATATGATTAT TTTTTTACGT AGTTACTCTA TCTCCAAAGA TAGTCGGCTC 6840TTAAAGTATA TATCTATATG CAAAGAAAAT AATATACGTT ATAAGATTAT CGGTTGGGAT6900AAAGATCATA ACGAACAATA TAGAGATGAT GCCTATTATT TTAAAGGTGG CTTTAAACTT6960GGAAAAAAAT GGCTGAACGT GATGGCTATT TTTAAATGGT GGATCTTTAT TTTTTATCTG7020ATTATTTTCA GGATAAAAAA TAATATTACC GCCATTCATT CTGTAGATCT TGATTGTGGA7080ATTGTTGGTC TAATTATAAG TAAATTACTT AGAGCAAAAC ATATATATGA CATATATGAT7140GTTTATTCGG CTAACCGTAA TATGAGAGGC CTTATTAAGG CATTGATTGA TTCACTTGAG7200CGGTTTGTGT GTCGGAAGTC CACATATTTT ATTATGCCTG AGTCATTCCG TTTTGAGCAG7260TTAGGTATAG ACCAAGATAA TATCAATTAT AATAATTTTA TTGAAATTGA AAATGTTCCT7320CAAATTGATA GGAATATTGA ATTAAGATAC ATATCTCCCG GTCAGTATGA TTTTTATCTG7380GCTTATGCTG GTTCATTAGA ACCAAGACAC AGAGGATTAG AGAACTTATT GAAAGCTGTA7440TCAATTTGTC CTAATGTATT CCTCGACATA GCTGGTGTTG GACCATTAAC TGCTTTGTGT7500AAAAAATACT CTCAGCAATT TAATAATATT TGTTTTCATG GTGGTTTAAC ACCTCAACAA7560GTCTATGAAT TAGAGGCTAA CGCCCAAATT ATTATCGGTA TGTACTATAA AACAAGAGAT7620AATCATCTTT TTGCATCTCC GAATAAATAT TATGAGCACT TGGCACTTGG TAAAGTCATG7680TTGACAACCA GCGGCACCCC TCCTGGAATG AAAGTTGAAA AGTATAAAAC TGGATTTGCA7740ATTGGTGAAA GTTTACAAGA CATTATAGAT TTTTTACAAT CTCTTAATGG AAAAGAGGAT7800ATAATAGATA ATTTTTCAAT AAATGCATAT AGGATCTGGG TAGACAAATA TTCGGATTAC7860Orf6的終止orf7的起始AATGAAAGAT ATTTATCTAA ACAATACATG AAAATGGTGG GTAAGTGATGTACGATTATT 7920TAATAGTTGG TTCAGGTCTT TTTGGTTCGG TATTTGCATA TGAAATGAAA AAAAAAGGAT7980ACTCGATAAA AGTAATAGAA AAAAGAGCGC ACATTGGAGG GAATATTTAT TGTGAGGAAA8040TTGAAGGTAT TAATGTACAT AAATATGGTG CTCATATTTT TCACACTAAT GAAAAAGAAA8100TCTGGGAATA TGTGAATTCT TTTGTTGAAT TTAATCGATT CACTAATTCT CCGGTAGCTT8160TATCTAAAGG TGAGATTTAT AACTTACCAT TTAATATGAA TACATTTAAT AAAATGTGGG8220GGGTGACGTC TCCCTCAGCA GCAAAAAATA AAATTGAACA ACAGAGAAAA GAAATTGGTA8280ACAAAGAGCC AGCCAATTTG GAAGAACAAG CAATATCATT AGTTGGTCGA GATATTTTTG8340AAACTTTAAT AAAAGAATAT ACAGAAAAAC AATGGGGGCG TGAATGCAAA AACTTACCTG8400CATTCATTAT TAAACGTCTT CCTGTTAGAT TTACCTATGA CAATAATTAT TTTAATGATC8460GATATCAAGG AATACCGATC GGTGGATATA ATAGAATAAT TGAGAAGATG TTAGAGGGTG8520TAGACGTTCA ATTAAATACA GACTTTTTTG ATAATAAAGA TTACTGGATT AGTAGCGCAC8580GAAAAATTGT TTATACAGGC CCTATTGATC GCTTTTTTAA TTATGAGTTT GGTGAGTTGG8640ATTACCGTAC ATTATCATCT GAGCATGAGA TTAAGAATGA AAGTAATTTT CAAGGAAATG8700CTGTAGTTAA TTATATTGAT TCAAGCTATG AATTTACTCG AATTATTGAG CATAAACATT8760TTGAATTTGG AGAGCAGGAT AAAACAGTTA TTACGAAAGA GTTTCCCAAA GAGTATGTAA8820ATGGAGATGA ACCGTACTAT CCGGTTAATG ACTCTGAAAA TAATAGAAAA TATGCCAAAT8880ATAAGTTGAA AACAAGCCAA TTCGATAACG TTATTTTTGG TGGAAGACTA GCAGAATATA8940AGTATTATGA TATGCACCAA GTAATTGCAT CTGCATTGAA AGCCGTAAGT AAAGAGGTTT90000rf8的起始0rf7的終止CTCAATGAAA ATGCCTAGAG TTATATGTAT AATTGTCACT TTTAATCGCG AGCATTTACT 9060GCAACAAACA CTTGATGCAG TATTAAATCA AACATTCCCC CTACAAAATA TAATTGTTAT9120AGATAATAAT AGCTTCGATA ATACACGCAG TTTAGTTTCT AAATTGAGCG AAAATAATCC9180
CAAAATAGAA TATCATAATA CTGGAGCGAA TATTGGAGGC GCTGGCGGGT TTCATAGAGG9240TTTTGCTGTT GCCTCAAAAT ATAAATATGA TTATTTATGG CTTATGGATG ATGATCTAAA9300GCCTGAAATA GAATGTCTTT ATAACCTGAT ATCCTCTGCA ACTGAACATG GTATCTATCA9360ACCTATAAGA ATAAATGTAG ATGGCTCATG TGCAGAACTT TCCCCTGTTG TTTATGATTT9420AAAAAATCCT TTTTTTATGA ATCCGAAGCG ATTATCTGTC ATCAACCTCT ATAAACGTAT9480GAACAATGCT GTATATAGTC CTTTTGATAT TCATGGAGTT CCTTTCGAGG GGCCATTAAT9540ATCTAGAGAT GTAATTCAAT GTATTGGTTA TCCCAATCCT AATTTCTTTA TTTTTTATGA9600CGATCTTGAC TACTCCTTGA GGGCAAGAAA AGCAGGGTTT GAAATCAAAT GTATTCCAAG9660TGCCAGAGCG GTTAGACTAC TAAAAAATAA TCAGCGTAGT GATTTGACAT CTTGGAAAGG9720ATATTTTATG TTTCGTAATC TTTTCTATAT TCATCGTACC TATGGCGAAA ATATATTCGT9780TAGGTTAAAA CCATTTCTGC TGGTTCTGGG GTATCTTGTG TTTTTAATCT TTAGATTTAA9840GTTTAATCAA GTTCCTACTA TTTTATCTGC ATTTAAAGAT TCACGAAAAC TTGATAATTC9900Orf8的終止TGAATTACAT AAACCATAAA AGGGTTTTAT AATTGCCAAT GTTAACTGTA ATTAAACCAT 9960AATGCTAACA AACCCAAACA TGGTGTATCA TAAAATGATT TTATTAGTTA ATAAAAAGTA10020AGTTTTTTAC ATGACGTAGC TTATTTGCAC ATATGAGATG TGCCTAGAAT ATAATATACT10080CATTTCTGTG TGAATATAAA ATTTATACCT ACGCTTACTT AGTTTGTATA ATTATCTTGA10140TGAGCTAAGA GATAATATAA TTTGCAAAAT TAATTTATTG TGAATTAATT TGATAATGCT10200AATGCATAGA CATAACTTGT AAAATTAAAC ATCAGTTTGT TTTTTTTATT AATCTACATC10260ATTAAGAATA AGGATTTGGC ATTGTGGGTT TAATAACATC ATAGTATTAT TCACTCTTAC10320TATTTATAGG TTGGCATATA ACGAAAAATG TTAATTGATA GACTGATATG TAGATATTCA10380TTTCTCATGT TAATGAGATT GGAATAATGT GTTGTTAATT TGTCTTGTTT ATAAATTTAC10440TTACTGATAT TTGTGATTAT TCATCATATA ACTTCTTGTA AATGAGCATC CTCTAGCAAT10500TAATGTTGTC CTTCATAAGC AAGCTGCATC TTCGCGGCAT TTTCCGAAAG GAGTAAACAA10560TGTCAAAGCA ACAGATTGGC GTAGTCGGTA TGGCAGTGAT GGGGCGCAAT CTTGCGCTTA10620ACATCGAAAG CCGTGGTTAT ACCGTCTCTA TTTTCAACCG TTCACGTGAG AAAACGGAAG10680AAGTGATTGC CGAAAATCCA GGCAAAAAAC TGGTTCCTTA CTATACGGTG AAAGAGTTTG107 40TTCAATCTCT GGAAACGCCT CGTCGTATCC TGTTAATGGT GAAAGCAGGT GCAGGCACGG10800ATGCTGCTAT TGATTCCCTC AAGCCATACC TCGATAAAGG TGACATCATC ATTGATGGTG10860GTAACACCTT CTTCCAGGAC ACTATTCGTC GTAACCGTGA GCTTTCTGCA GAAGGCTTTA10920ACTTCATCGG TACCGGTGTT TCCGGTGGTG AAGAAGGTGC GCTGAAAGGT CCTTCCATTA10980TGCCAGGTGG ACAGAAAGAA GCCTATGAAC TGGTTGCGCC GATTCTGACC AAAATCGCCG11040CAGTGGCTGA AGACGGTGAG CCATGCGTTA CCTATATTGG TGCCGATGGC GCAGGTCACT11100ATGTGAAGAT GGTTCACAAC GGTATTGAAT ACGGCGATAT GCAACTGATT GCTGAAGCCT11160ATTCTCTGCT TAAAGGTGGC CTGAACCTTT CCAACGAAGA ACT 11203本發(fā)明的目的是尋找并應(yīng)用該細菌的特異分子標(biāo)識物(分子探針),即特異核苷酸序列,因此本發(fā)明的技術(shù)方案具有獨特性,其與常規(guī)研究方法的不同之處是,尋找到具有特異性的核苷酸序列,并通過可靠的實驗數(shù)據(jù)確保分子標(biāo)識物的特異性,即可利用本領(lǐng)域技術(shù)人員公知的成熟技術(shù)(如PCR或基因芯片等),應(yīng)用該標(biāo)識物檢測細菌的技術(shù),使所有本領(lǐng)域技術(shù)人員都可以根據(jù)本發(fā)明提供的技術(shù)內(nèi)容,很容易的實現(xiàn)本發(fā)明的目的并取得預(yù)期的使用效果。本發(fā)明中已經(jīng)提供的實驗數(shù)據(jù),充分證明了該核苷酸序列的特異性,并可以應(yīng)用于該細菌的檢測,應(yīng)用本發(fā)明的現(xiàn)代分子生物學(xué)細菌鑒定方法相對于傳統(tǒng)的血清學(xué)免疫反應(yīng),具有快速、準(zhǔn)確、低成本的優(yōu)勢。本發(fā)明測序并用生物信息學(xué)軟件推測各個基因的功能,是為了尋找特異性核苷酸,細菌中有一些特定功能的基因是高度特異的,利用以上方法推測出這些特定功能的基因以及它們的位置,然后利用實驗進行證明,將推測出的這些基因的功能,作為一種路標(biāo)去更好更快的尋找到特異性核苷酸,這樣,可以減少研究實驗的盲目性,加快實驗的進度,降低實驗經(jīng)費。
以上所述,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,凡是依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.一種對大腸桿菌O85型的O-抗原特異的核苷酸,其特征在于其是如SEQ ID NO1所示的分離的核苷酸,全長11203個堿基;或者所述具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸。
2.按照權(quán)利要求1所述的對大腸桿菌O85型的O-抗原特異的核苷酸,其特征在于其包括命名為orf1,wzy,orf3,wzx,orf5,orf6,glf,orf8的8個基因組成,都位于galF基因和gnd基因之間。
3.按照權(quán)利要求2所述的對大腸桿菌O85型的O-抗原特異的核苷酸,其特征在于,所述基因中具有高度特異性的基因是轉(zhuǎn)運酶基因,其包括wzx基因;聚合酶基因,其包括wzy基因;糖基轉(zhuǎn)移酶基因,其包括orf3、orf5、orf6、orf8基因;其中所述的基因wzx是SEQ ID NO1中的4420至5640堿基的核苷酸;wzy是SEQ ID NO1中的2266至3384堿基的核苷酸;orf3是SEQ ID NO1中的3359至4411堿基的核苷酸;orf5是SEQ ID NO1中的5630至6796堿基的核苷酸;orf6是SEQ ID NO1中的6793至7908堿基的核苷酸;orf8是SEQ ID NO1中的9005至9919堿基的核苷酸。
4.按照權(quán)利要求1或2所述的對大腸桿菌O85型的O-抗原特異的核苷酸,其特征在于其還包括源于所述的wzx基因、wzy基因或糖基轉(zhuǎn)移酶基因orf3、orf5、orf6、orf8基因以及它們的混合或它們的重組。
5.按照權(quán)利要求4所述的對大腸桿菌O85型的O-抗原特異的核苷酸,其特征在于,其中源于wzx基因的寡核苷酸對是SEQ ID NO1中的4589至4606堿基的核苷酸和5332至5347堿基的核苷酸;SEQ ID NO1中的4452至4468堿基的核苷酸和5104至5120堿基的核苷酸;源于wzy基因的寡核苷酸對是SEQ ID NO1中的2711至2726堿基的核苷酸和3048至3063堿基的核苷酸;SEQ ID NO1中的2749至2765堿基的核苷酸和3346至3363堿基的核苷酸。
6.權(quán)利要求1所述的對大腸桿菌O85型的O-抗原特異的核苷酸在檢測表達O-抗原的細菌、鑒定細菌的O-抗原和細菌的其它多糖抗原中的應(yīng)用。
7.權(quán)利要求1所述的對大腸桿菌O85型的O-抗原特異的核苷酸的重組分子,在通過插入表達而提供表達大腸桿菌O85型的O-抗原,以及制備細菌疫苗中的應(yīng)用。
8.按照權(quán)利要求1所述的對大腸桿菌O85型的O-抗原特異的核苷酸的應(yīng)用,其特征在于,它作為引物用于PCR、作為探針用于雜交反應(yīng)與熒光檢測、或者用于制造基因芯片或微陣列,供檢測細菌的應(yīng)用。
9.權(quán)利要求1所述的對大腸桿菌O85型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在培養(yǎng)基中培養(yǎng)大腸桿菌O85型,離心收集細胞;得到的基因組DNA通過瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O85型中的O-抗原基因簇以大腸桿菌O85型的基因組為模板通過Long PCR擴增其O-抗原基因簇,將得到的PCR產(chǎn)物,用瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性,合并該long PCR產(chǎn)物,并用DNA純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫將Long PCR純化產(chǎn)物應(yīng)用鳥槍法構(gòu)建O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的克隆用實驗室常用的DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析應(yīng)用生物信息學(xué)軟件拼接和編輯所有的序列,從而得到大腸桿菌O85型的O-抗原基因簇的核苷酸全長序列;(6)特異基因的篩選針對大腸桿菌O85型的O-抗原基因簇中的wzx、wzy基因設(shè)計引物;在每個基因內(nèi)各設(shè)計了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,確定wzx、wzy基因?qū)Υ竽c桿菌O85型的O-抗原的高度特異性;(7)引物靈敏度的檢測培養(yǎng)大腸桿菌O85,細菌計數(shù)后分別將5×103,5×102,5×101,5個和0個活菌加入到一定量的某種待檢測物中,混入細菌的待檢測物作為檢測用樣品,將樣品加入LB培養(yǎng)基,取一些與樣品混合過的LB培養(yǎng)基過濾,將過濾液進行培養(yǎng),從培養(yǎng)好的菌液中取數(shù)毫升處理后作為PCR模板用寡核苷酸進行PCR反應(yīng),檢測其對大腸桿菌O85的靈敏度。
10.根據(jù)權(quán)利要求9所述的對大腸桿菌O85型的O-抗原特異的核苷酸的分離方法,其特征在于,其包括下述步驟(1)基因組的提取在5mL的LB培養(yǎng)基中37℃過夜培養(yǎng)大腸桿菌O85型,離心收集細胞;用pH值為8.0的500ul 50mM Tris-HCl和10ul 0.4M EDTA重懸細胞,37℃溫育20分鐘,然后加入10ul 10mg/ml的溶菌酶繼續(xù)保溫20分鐘;之后加入3ul 20mg/ml的蛋白酶K、15ul 10%SDS,50℃溫育2小時,再加入3ul 10mg/ml的RNase,65℃溫育30分鐘,加等體積酚抽提混合物,取上清再用等體積的酚∶氯仿∶異戊醇混合溶液抽提兩次,取上清再用等體積的乙醚抽提以除去殘余的酚,酚∶氯仿∶異戊醇的混合體積比例為25∶24∶1;上清用2倍體積乙醇沉淀DNA,用玻璃絲卷出DNA并用70%乙醇洗DNA,將DNA重懸于30ul TE中;基因組DNA通過0.4%的瓊脂糖凝膠電泳檢測;(2)通過PCR擴增大腸桿菌O85型中的O-抗原基因簇以大腸桿菌O85型的基因組為模板通過Long PCR擴增其O-抗原基因簇,首先根據(jù)經(jīng)常發(fā)現(xiàn)于O-抗原基因簇啟動子區(qū)的galF序列設(shè)計上游引物為#1523-ATT GTG GCT GCAGGG ATC AAA GAA AT,再根據(jù)O-抗原基因簇下游的gnd基因設(shè)計下游引物為#1524-TAG TCG CGT GNG CCT GGA TTA AGT TCG C;用Boehringer Mannheim公司的Expand Long Template PCR方法擴增O-抗原基因簇,PCR反應(yīng)程序如下在94℃預(yù)變性2分鐘;然后94℃變性10秒,60℃退火15秒,68℃延伸15分鐘,這樣進行30個循環(huán),最后,在68℃繼續(xù)延伸7分鐘,得到PCR產(chǎn)物,用0.8%的瓊脂糖凝膠電泳檢測PCR產(chǎn)物的大小及其特異性,合并5管long PCR產(chǎn)物,并用Promega公司的Wizard PCR Preps純化試劑盒純化PCR產(chǎn)物;(3)構(gòu)建O-抗原基因簇文庫用被修改的Novagen DNaseI shot gun法構(gòu)建O-抗原基因簇文庫,反應(yīng)體系是300ng PCR純化產(chǎn)物,0.9ul 0.1M MnCl2,1ul 1∶2000稀釋的1mg/ml的DNaseI,反應(yīng)在室溫中進行,酶切10分鐘使DNA片段大小集中在1.5kb-3kb之間,而后加入2ul 0.1M EDTA終止反應(yīng);合并4管同樣的反應(yīng)體系,用等體積的酚抽提一次,用等體積的酚∶氯仿∶異戊醇的混合溶液抽提一次,酚∶氯仿∶異戊醇的混合體積比例為25∶24∶1再用等體積的乙醚抽提一次后,用2.5倍體積的無水乙醇沉淀DNA,并用70%乙醇洗沉淀,最后重懸于18ul水中,隨后在此混合物中加入2.5ul dNTP(1mMdCTP,1mMdGTP,1mMdTTP,10mMdATP),1.25ul 100mM DTT和5單位的T4DNA聚合酶,11℃30分鐘,將酶切產(chǎn)物補成平端,75℃終止反應(yīng)后,加入5單位的Tth DNA聚合酶及其相應(yīng)的緩沖液并將體系擴大為80ul,70℃反應(yīng)20分鐘,使DNA的3’端加dA尾;此混合物經(jīng)等體積氯仿∶異戊醇的混合溶液抽提和等體積乙醚抽提后與Promega公司的3×10-3的pGEM-T-Easy載體于16℃連接10小時,總體積為90ul,氯仿∶異戊醇的混合體積比例為24∶1;其中有9ul的10×buffer和25單位的T4DNA連接酶,最后用1/10體積的pH值為5.2的3M NaAc和2倍體積的無水乙醇沉淀連接混合物,再用70%乙醇洗沉淀,干燥后溶于30ul水中得到連接產(chǎn)物;用BiO-Rad公司的電轉(zhuǎn)化感受態(tài)細胞的制備方法制備感受態(tài)大腸桿菌DH5α細胞,取2-3ul連接產(chǎn)物與50ul感受態(tài)大腸桿菌DH5α混合后,轉(zhuǎn)到BiO-Rad公司的0.2cm的電擊杯中電擊,電壓為2.5千伏,時間為5.0毫秒至6.0毫秒,電擊后立即在杯中加入1ml的SOC培養(yǎng)基使菌復(fù)蘇,然后將菌涂在含有氨芐青霉素、X-Gal和IPTG的LB固體培養(yǎng)基上,在37℃過夜培養(yǎng),次日得到藍白菌落,將得到的白色菌落即白色克隆轉(zhuǎn)到含有氨芐青霉素的LB固體培養(yǎng)基上培養(yǎng),同時從每個克隆中提取質(zhì)粒,并用EcoRI酶切鑒定其中的插入片段的大小,得到的白色克隆群構(gòu)成了大腸桿菌O85型的O-抗原基因簇文庫;(4)對文庫中的克隆測序從文庫中挑選插入片段在1kb以上的96個克隆用本實驗室ABI3730型DNA自動測序儀對克隆中的插入片段進行測序,序列達到100%的覆蓋率,從而獲得O-抗原基因簇的所有序列;(5)核苷酸序列的拼接及分析用英國劍橋MRC分子生物學(xué)實驗室出版的Staden package軟件包的Pregap4和Gap4軟件拼接和編輯所有的序列,從而得到大腸桿菌O85型的O-抗原基因簇的核苷酸全長序列;序列的質(zhì)量主要由兩個方面來保證1)對大腸桿菌O85型的基因組作5個Long PCR反應(yīng),然后混合這些產(chǎn)物以產(chǎn)生文庫,2)對每個堿基,保證3個以上高質(zhì)量的覆蓋率,在得到大腸桿菌O85型O-抗原基因簇的核苷酸序列后,用美國國家生物技術(shù)信息學(xué)中心的orffinder發(fā)現(xiàn)基因,找到8個開放的閱讀框,用blast系列軟件與GenBank中的基因比較以發(fā)現(xiàn)這些開放的閱讀框的功能并確定它們是什么基因,再用英國sanger中心的Artemis軟件完成基因注釋,用Clustral W軟件做DNA和蛋白質(zhì)序列間的精確比對,最后得到大腸桿菌O85型的O-抗原基因簇的結(jié)構(gòu);(6)特異基因篩選針對大腸桿菌O85型的O-抗原基因簇中的wzx、wzy基因設(shè)計引物;在每個基因內(nèi)各設(shè)計了兩對引物,每對引物分布在相應(yīng)基因內(nèi)的不同地方,以確保其特異性;用這些引物以166株大腸桿菌和43株志賀氏菌的基因組為模板進行PCR,除在含大腸桿菌O85組中得到了預(yù)期大小的一條帶外,在其他組中都沒有擴增到預(yù)期片段大小的正確產(chǎn)物,所以wzx、wzy基因?qū)Υ竽c桿菌O85型的O-抗原都是高度特異的。(7)引物靈敏度的檢測購買市場上的生豬肉餡,攪拌均勻,分成20g一份,存在-40℃冰箱中備用;將10μl大腸桿菌O85的凍存菌液接種到有20ml LB培養(yǎng)基的三角瓶中,于37℃,200轉(zhuǎn)/分,培養(yǎng)12小時至飽和,取少量培養(yǎng)好的菌液作106和107倍的稀釋,其余的菌液放于4℃的冰箱中備用,取50μl稀釋菌液涂布LB瓊脂平板,37度,培養(yǎng)12h,對所涂平板計數(shù),計算原液中活菌濃度。在5份生豬肉餡中分別摻入5×103,5×102,5×101,5個和0個活菌,攪拌均勻,加入200ml LB培養(yǎng)基,經(jīng)6層紗布過濾,過濾液于37℃,200轉(zhuǎn)/分,培養(yǎng)12h。從培養(yǎng)好的菌液中取3ml菌液于6,000g離心5分鐘,去上清,加100μl MQ超純水吹開沉淀并混勻,放入100度沸水中煮15分鐘,裂解液于12,000g離心8分鐘,取1μ上清做為PCR模板;用4對寡核苷酸對,SEQ ID NO1中的4589至4606堿基的核苷酸和5332至5347堿基的核苷酸;SEQ ID NO1中的4452至4468堿基的核苷酸和5104至5120堿基的核苷酸;SEQ ID NO1中的2711至2726堿基的核苷酸和3048至3063堿基的核苷酸;SEQ ID NO1中的2749至2765堿基的核苷酸和3346至3363堿基的核苷酸,進行PCR反應(yīng),PCR反應(yīng)體系如下MQ15.7μl,Mg2+2.5μl,Buffer2.5μl,dNTP1μl,Taq酶0.3μl,P11μl,P21μl,模板DNA1μl。PCR反應(yīng)條件為95℃5′,95℃30″,56℃45″,72℃1′,72℃5′,共30個循環(huán);反應(yīng)結(jié)束后,取10μl反應(yīng)產(chǎn)物電泳,若有與預(yù)期大小相符的擴增帶,則結(jié)果為陽性,若沒有,則結(jié)果為陰性;參入了5×103,5×102,5×101,和5個活菌的每份豬肉餡均在4對引物的PCR反應(yīng)中得到陽性結(jié)果;參入0個活菌的豬肉餡在4對引物的PCR反應(yīng)中得到陰性結(jié)果;說明使用上述方法時,這4對引物對豬肉餡中的大腸桿菌O85的檢測靈敏度均為0.25個菌/g。
全文摘要
本發(fā)明提供一種對大腸桿菌O85型(Escherichiacoli O85)的O-抗原特異的核苷酸,它是大腸桿菌型中控制O-抗原合成的基因簇的核苷酸全序列,如SEQ ID NO1所示的分離的核苷酸,全長11203個堿基;或者具有一個或多個插入、缺失或取代的堿基,同時保持所述分離的核苷酸功能的SEQ ID NO1的核苷酸;還包括源于大腸桿菌O85型的O-抗原基因簇中的糖基轉(zhuǎn)移酶基因和寡糖單位處理基因的寡核苷酸;本發(fā)明通過PCR證實寡核苷酸對大腸桿菌O85型的O-抗原都有高度的特異性;本發(fā)明還公開了用本發(fā)明的寡核苷酸檢測和鑒定大腸桿菌O85型的方法。
文檔編號C07H21/00GK1702082SQ20041009411
公開日2005年11月30日 申請日期2004年12月30日 優(yōu)先權(quán)日2004年12月30日
發(fā)明者王磊, 王威, 馮露 申請人:天津生物芯片技術(shù)有限責(zé)任公司