国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種利用水稻bt-雄性不育細胞質(zhì)的育性恢復(fù)基因來賦予或控制育性的方法及鑒定育性...的制作方法

      文檔序號:3552234閱讀:593來源:國知局
      專利名稱:一種利用水稻bt-雄性不育細胞質(zhì)的育性恢復(fù)基因來賦予或控制育性的方法及鑒定育性 ...的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種利用水稻BT型細胞質(zhì)雄性不育的恢復(fù)基因來獲得或抑制水稻育性及其鑒定水稻恢復(fù)基因的方法。
      本申請要求以2001年9月19日提交的日本專利申請No.2001-285247,2001年10月4日提出的日本專利申請No.2001-309135以及2002年6月26日提出的日本專利申請No.2002-185709的優(yōu)先權(quán)。這三個專利申請的完全公開內(nèi)容在此并入本文背景技術(shù)水稻是自花授粉植物,在水稻品種之間進行雜交時,首先必須在水稻開花前將穎花內(nèi)的全部雄蕊去除以避免自花受粉,然后用來自親本品種的花粉使欲進行雜交的品種獲得育性。然而,這種人工雜交的方法完全不適合商業(yè)目的來生產(chǎn)大量的雜交種子。
      因此,通常利用細胞質(zhì)雄性不育的三系法來生產(chǎn)雜交水稻。所述三系法利用了三個品系即細胞質(zhì)雄性不育的不育系、具有Rf-1基因的恢復(fù)系以及與不育系具同樣核基因而不具有細胞質(zhì)雄性不育的保持系。利用這三個品系,(i)用恢復(fù)系的花粉對不育系進行授粉而獲得雜交種子;而(ii)用保持系的花粉對不育系進行授粉而使不育系得以保存下去。
      利用BT型細胞質(zhì)雄性不育的三系法中,繁殖恢復(fù)系水稻是非常重要的,為此,必需在育種的各個階段中確保水稻中保持有Rf-1基因,并且確保在最后培育階段中Rf-1基因是純合的。在三系法中需要核實以確保用于恢復(fù)系的品種具有Rf-1基因,或者核實Rf-1基因的存在以確保所得到的雜交種子已恢復(fù)了育性。
      為了確定植物體中的Rf-1基因基因座的基因型,首先需要將要確定其基因型的植物與標準系雜交產(chǎn)生雜交種子,以獲得F1代植株,然后進行自花授粉,繼而調(diào)查能超過一定水平(如70-80%或更高)的頻率產(chǎn)生種子的植株個體的出現(xiàn)機率。所述標準系是指保持系、不育系或這兩個品系形成的一套品系,并且應(yīng)根據(jù)待測個體的細胞質(zhì)是否屬于BT型、正常型還是未知的來作出合適的選擇。如果標準系為不育系,則雜交時以待測個體作為母本,如果標準系是保持系,則作為父本與待測個體雜交。
      但是,實施這些技術(shù)需要花費大量的勞動力和時間。進一步的問題是,為生產(chǎn)種子而進行的授粉易受環(huán)境因素的影響,當在惡劣的環(huán)境下,如低溫或日照不足,造成的不育可能與基因型構(gòu)成無關(guān),導(dǎo)致不能準確地確定Rf-1基因基因座的基因型。
      為了解決這些問題,最近有人提出用分子生物學(xué)的方法來判斷Rf-1基因是否存在。該方法基于檢測與Rf-1基因連鎖的堿基序列(這些序列以下稱作DNA標記)來確定Rf-1基因存在或缺失。值得指出的是目前還沒弄清Rf-1基因的DNA序列,所以不可能直接檢測Rf-1基因。
      例如,已有報道,水稻Rf-1基因位點位于第10號染色體上,并且存在于限制性片段長度多態(tài)性(RFLP)的DNA標記(RFLP標記)G291位點和G127位點之間(Fukuta et al.1992,Jpn.Breed.42(supl.1)164-165)。通過研究與Rf-1基因連鎖的DNA標記G291位點和G127位點的基因型可推知Rf-1基因位點的基因型,這是一種已知的方法。
      但是,以往的常規(guī)分子生物學(xué)方法存在著以下若干問題。首先,利用RFLP標記需要通過Southern印跡分析來進行檢測。為了進行Southern雜交,還必需從待測個體中制備純化微克級重量的DNA,而且還要進行限制性內(nèi)切酶處理、電泳、印跡、與探針之間進行雜交以及信號的檢測等一系列操作過程;除了需要相當量的勞動外,還需花費約1周的時間才能獲得檢測結(jié)果。
      第二個問題是,由于RFLP標記G291位點和G127位點之間的基因圖距長約30cM(在水稻DNA中相當于約9000kbp),考慮在該區(qū)域中出現(xiàn)雙重重組的機率達到百分之幾,因而不能完全保證通過這些標記來正確的確定Rf-1基因位點的基因型。
      第三個問題是,如果通過檢測RFLP標記G291位點和G127位點來推測Rf-1基因是否存在,則不僅Rf-1基因而且還有這些基因座之間的基因區(qū)域被引入到篩選出的育性恢復(fù)系中。結(jié)果是從RF-1基因供體親本中引入的DNA序列將含有至少30cM或更長的染色體區(qū),即存在著引入了在該區(qū)域的潛在有害基因的風險。
      為了解決上述問題,現(xiàn)已研究出與Rf-1基因位點連鎖的顯性DNA標記(日本專利公開No.222588/1995)和共顯性DNA標記(日本專利公開No.313187/1997)。這些標記與Rf-1基因位點連鎖,遺傳距離分別為1.6±0.7cM(相當于水稻DNA約480kbp)以及3.7±1.1cM(相當于水稻DNA約1110kbp),這些基因位點存在于Rf-1基因位點兩側(cè)。因此,通過檢測顯性PCR標記位點和共顯性PCR標記位點的存在來估計Rf-1基因的存在。通過檢測共顯性PCR標記也可以估計出Rf-1基因位點是純合還是雜合的。
      但是,即使使用這些PCR標記,仍然存在著幾個問題。所述共顯性標記與Rf-1基因位點具有3.7±1.1cM的遺傳距離,所以還沒有真正解決與Rf-1基因位點之間重組頻率很高的問題。其結(jié)果是,就共顯性標記本身來說,雖能夠準確地檢測出是純合型還是雜合型。但如果共顯性標記位點和Rf-1基因位點之間發(fā)生了重組,則不能準確地確定Rf-1基因位點的基因型,尤其不能確定其是純合型還是雜合型。另一方面,當用顯性標記確定Rf-1基因位點的基因型時,則不管個體是Rf-1基因純合體(Rf-1/Rf-1)還是雜合體(Rf-1/rf-1)都能檢測到顯性標記。因此,即使利用共顯性標記和顯性標記的結(jié)合來確定Rf-1基因位點的基因型,也不能正確地鑒別植株個體是Rf-1基因純合型還是雜合型。還有,用顯性標記進行PCR反應(yīng)而沒有得到PCR產(chǎn)物,也不能排除可能是由于實驗程序問題導(dǎo)致的。進一步的,由于這些共顯性標記和顯性標記之間的遺傳距離長達約5.3cM(約1590kbp),由Rf-1基因供體親本引入的染色體區(qū)域的長度不能限定在足夠小的數(shù)值,還不能排除該區(qū)域中可能含有的有害基因被引入。
      另外,在日本專利公開No.139465/2000描述了一種共顯性標記,其根據(jù)位于水稻第10號染色體上Rf-1基因附近的RFLP標記的堿基序列而建立的。然而,這些PCR標記大多數(shù)與Rf-1基因之間的遺傳距離都大于約1cM。
      發(fā)明概述本發(fā)明目的之一是提供一種恢復(fù)水稻育性的方法。本發(fā)明的方法包括將核酸導(dǎo)入到水稻中,所述核酸具有恢復(fù)育性的功能,并具有SEQ ID NO.27的堿基序列或與SEQ ID NO.27的堿基序列有至少70%同一性。本發(fā)明的另一方法包括將核酸導(dǎo)入到水稻中,所述核酸具有恢復(fù)育性的功能,并具有SEQ ID NO.27的第38538至54123位的堿基序列或與SEQ ID NO.27的第38538至54123位的堿基序列有至少70%同一性。本發(fā)明的再一方法包括將核酸導(dǎo)入到水稻中,所述核酸具有恢復(fù)育性的功能,并具有SEQ ID NO.27的第42357-53743位的堿基序列,更優(yōu)選的具有第42132-48883位堿基序列,或與SEQ ID NO.27的第42357-53743位的堿基序列,優(yōu)選的第42132-48883位堿基序列有至少70%的同一性。本發(fā)明方法的一個優(yōu)選實施方式是,具有與SEQ ID NO.27或SEQ ID NO.27的第38538至54123位堿基序列有至少70%同一性的堿基序列至少滿足下面兩個要求1)與SEQ ID NO.27的第45461位堿基相應(yīng)的堿基是A;和2)與SEQ ID NO.27的第49609位堿基相應(yīng)的堿基是A。
      本發(fā)明的另一個目的是提供一種鑒定被測個體或其種子是否具有Rf-1基因的方法。本發(fā)明的鑒定方法利用了可以確定水稻恢復(fù)基因(Rf-1基因)功能存在的序列,其位于在水稻第10號染色體上的多態(tài)性檢測標記P4497MboI和B56691 XabI之間。
      在本發(fā)明的優(yōu)選實施方式中,檢測水稻個體或其種子是否具有Rf-1基因所用堿基序列具有與SEQ ID NO.27或SEQ ID NO.27的第38538至54123位堿基序列有至少70%同一性,并且至少滿足下面兩個要求1)與SEQ ID NO.27的第45461位堿基相應(yīng)的堿基是A;和2)與SEQ ID NO.27的第49609位堿基相應(yīng)的堿基是A。
      本發(fā)明另一個目的是提供一種抑制Rf-1基因的功能以恢復(fù)育性的方法。本發(fā)明抑制方法的一個實施方式包括導(dǎo)入如下的反義序列,即其具有序列互補于有恢復(fù)育性功能的SEQ ID NO.27或互補于與SEQ ID NO.27的堿基序列有至少70%同一性的堿基序列,其長度至少為100個連續(xù)堿基。另一個實施方式,本發(fā)明的抑制方法包括導(dǎo)入的反義序列具有互補于有恢復(fù)育性功能的SEQ ID NO.27第38538-54123位或互補于與SEQ ID NO.27第38538-54123位的堿基序列有至少70%同一性的堿基序列,其長度至少100個連續(xù)堿基。
      本發(fā)明另一目的是提供具有恢復(fù)育性功能的具有SEQ ID NO.27或與SEQ ID NO.27的堿基序列有至少70%同一性的核酸。本發(fā)明也提供一種核酸,其具有恢復(fù)育性功能并具有SEQ ID NO.27的第38538-54123位或與SEQID NO.27的第38538-54123位堿基序列有至少70%同一性的堿基序列。本發(fā)明也提供一種核酸,具有恢復(fù)育性功能并具有SEQ ID NO.27第42357-53743位,更優(yōu)選SEQ ID NO.27第42132-48883位的堿基序列或者具有與SEQ IDNO.27第42357-53743位,更優(yōu)選SEQ ID NO.27第42132-48883位的堿基序列有至少70%同一性的堿基序列。


      圖1表示從RFLP標記位點S12564開始的染色體步行實驗結(jié)果。
      圖2表示與BAC克隆AC068923相關(guān)的lambda克隆重疊區(qū)的排列。
      圖3表示重組體花粉(全部有育性)的Rf-1位點附近的染色體組織結(jié)構(gòu),是基于在由該在粉產(chǎn)生的10個體(RS1,RS2,RC1-8)標記位點的基因型之最靠近Rf-1位點進行作圖的結(jié)果??瞻讞l代表粳稻(japonica)區(qū),黑條代表秈稻(indica)區(qū)。
      圖4是基因圖譜,用相關(guān)的各種標記對水稻第10號染色體上的Rf-1基因位點進行定位;圖距值是以1042個F1代個體的分離數(shù)據(jù)計算出來的。
      圖5顯示用于互補分析檢測Rf-1區(qū)域的10個基因組克隆的片段。通過染色體步行(細線)獲得的Lambda克隆被用于對以粗線表示的染色體區(qū)域進行互補分析。XSF18被發(fā)現(xiàn)存在缺失,其缺失區(qū)用點線表示。
      圖6表示用XSG16的15.7kb片段(例10)和XSF18的16.2kb片段(例8)進行互補分析的結(jié)果。抽穗(ear bowing)結(jié)果表明用XSG16的15.7kb片段轉(zhuǎn)化的植株恢復(fù)了育性。
      本發(fā)明的最佳實施方式我們首先將Rf-1基因位點定位在水稻第10號染色體上極小的區(qū)域內(nèi)。以此為基礎(chǔ),我們建立了位于Rf-1基因位點附近的PCR標記,并找到一種利用與Rf-1基因位點連鎖的PCR標記來檢測Rf-1基因的方法。具體地說,通過確定與Rf-1位點接近的新PCR標記位點的基因型來檢測Rf-1基因的存在和選擇Rf-1基因純合的個體,其中新標記是基于Rf-1位點被定位于水稻第10號染色體上的PCR標記位點S12564 Tsp509I和C1361 MwoI之間而建立的。我們先前于2000年8月17日提出的日本專利申請No.2000-247204描述了一種檢測Rf-1基因的方法。該專利申請的全部公開內(nèi)容在此引入本申請作為參考。
      I.日本專利申請No.2000-247204描述的鑒定Rf-1位點的基因型的方法日本專利申請No.2000-247204描述的方法是基于Rf-1位點被定位于水稻第10號染色體上的PCR標記位點S12564 Tsp509I和C1361 MwoI之間,進而確定待測水稻個體或其種子是否具有Rf-1基因。
      標記針對Rf-1基因位點附近的特定區(qū)域設(shè)計用于PCR反應(yīng)的引物對,其擴增產(chǎn)物用特定的限制性內(nèi)切酶消化,經(jīng)電泳,在有些秈稻(indica)系中,呈現(xiàn)可觀察條帶的大小與粳稻系的不同。在秈稻系中呈現(xiàn)的特有條帶在此稱為Rf-1連鎖帶。目前本發(fā)明的發(fā)明人已證實了Rf-1基因位點位于水稻第10號染色體上的PCR標記位點S12564 Tsp509I和C1361 MwoI之間,因此本領(lǐng)域的普通技術(shù)人員可以建立和利用Rf-1基因位點附近的PCR標記。
      例如,根據(jù)本發(fā)明,測定待測水稻個體基因組中是否含有下述PCR標記中的至少一個,進而確定被測個體是否具有與這些PCR標記連鎖的Rf-1基因(1)標記1即PCR標記R1877 EcoRI用SEQ ID NO1和SEQ ID NO2所示序列的DNA作為引物進行水稻基因組PCR反應(yīng),根據(jù)擴增產(chǎn)物中是否存在限制酶EcoRI識別位點,來檢測粳稻品系和秈稻品系個體之間的多態(tài)性;(2)標記2即PCR標記G4003 HindIII(SEQ ID NO19)用SEQ ID NO3和SEQ ID NO4所示序列的DNA作為引物對進行水稻基因組PCR反應(yīng),根據(jù)擴增產(chǎn)物中是否存在限制酶HindIII識別位點,來檢測粳稻品系和秈稻品系個體之間的多態(tài)性;(3)標記3即PCR標記C1361 MwoI(SEQ ID NO20)用SEQ ID NO5和SEQ ID NO6所示序列的DNA作為引物對進行水稻基因組PCR反應(yīng),根據(jù)擴增產(chǎn)物中是否存在限制酶MwoI識別位點,來檢測粳稻品系和秈稻品系個體之間的多態(tài)性;(4)標記4即PCR標記G2155 MwoI(SEQ ID NO21)用SEQ ID NO7和SEQ ID NO8所示序列的DNA作為引物對進行水稻基因組PCR反應(yīng),根據(jù)擴增產(chǎn)物中是否存在限制酶MwoI識別位點,來檢測粳稻品系和秈稻品系個體之間的多態(tài)性;(5)標記5即PCR標記G291 MspI(SEQ ID NO22)用SEQ ID NO9和SEQ ID NO10所示序列的DNA作為引物對進行水稻基因組PCR反應(yīng),根據(jù)擴增產(chǎn)物中是否存在限制酶MspI識別位點,來檢測粳稻和秈稻品系個體之間的多態(tài)性;(6)標記6即PCR標記R2303 BslI(SEQ ID NO23)用SEQ ID NO11和SEQ ID NO12所示序列的DNA作為引物對進行水稻基因組PCR反應(yīng),根據(jù)擴增產(chǎn)物中是否存在限制酶BslI識別位點,來檢測粳稻品系和秈稻品系個體之間的多態(tài)性;(7)標記7即PCR標記S10019 BstUI(SEQ ID NO24)用SEQ ID NO13和SEQ ID NO14所示序列的DNA作為引物對進行水稻基因組PCR反應(yīng),根據(jù)擴增產(chǎn)物中是否存在限制酶BstUI識別位點,來檢測粳稻品系和秈稻品系個體之間的多態(tài)性;(8)標記8即PCR標記S10602 KpnI(SEQ ID NO25)用SEQ ID NO15和SEQ ID NO16所示序列的DNA作為引物對進行水稻基因組PCR反應(yīng),根據(jù)擴增產(chǎn)物中是否存在限制酶KpnI識別位點,來檢測粳稻品系和秈稻品系個體之間的多態(tài)性;和(9)標記9即PCR標記S12564 Tsp509I(SEQ ID NO26)用SEQ ID NO17和SEQ ID NO18所示序列的DNA作為引物對進行水稻基因組PCR反應(yīng),根據(jù)擴增產(chǎn)物中是否存在限制酶Tsp509I識別位點,來檢測粳稻品系和秈稻品系個體之間的多態(tài)性。
      Rf-1基因位點最大可能位于水稻第10號染色體上的RFLP標記區(qū)R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602以及G2155的附近(請參照Fukuta et al.1992,Jpn.Breed.42(supl.1)164-165的RFLP連鎖分析結(jié)果以及Harushima et al.1998,Genetics 148 479-494的水稻RFLP連鎖圖),如下文描述的參考實施例1,本發(fā)明人將這些RFLP標記轉(zhuǎn)變?yōu)楣诧@性PCR標記如CAPS標記或dCAPS標記(Michaels and Amasino 1998,The PlantJournal 14(3)381-385;Neff et al.1998,The Plant Journal 14(3)387-392)。通過這種轉(zhuǎn)變得到了上述PCR標記。
      在這些PCR標記中,由PCR標記R1877 EcoRI、G291 MspI(SEQ IDNO22)、R2303 BslI(SEQ ID NO23)以及S12564 Tsp509I(SEQ ID NO26)形成一組,由C1361 MwoI(SEQ ID NO20)、S10019 BstUI(SEQ ID NO24)、G4003 HindIII(SEQ ID NO19)、S10602 KpnI(SEQ ID NO25)以及G2155MwoI(SEQ ID NO21)形成另一組,這兩組分別位于第10號染色體上Rf-1基因位點的兩側(cè)位置。
      因此,作為本發(fā)明最佳的實施方式之一,(a)在PCR標記R1877 EcoRI、G291 MspI、R2303 BslI以及S12564 Tsp509I中至少選出一個PCR標記,和(b)在C1361 MwoI、S10019 BstUI、G4003 HindIII、S10602 KpnI以及G2155MwoI中至少選出一個PCR標記以檢測出Rf-1連鎖帶,進而確定Rf-1基因是否存在。在該種情況下,在(a)組中至少優(yōu)選使用PCR標記S12564 Tsp509I,以及在(b)組中至少優(yōu)選使用C1361 MwoI作為最接近Rf-1基因的標記。在被測水稻的基因組中,如果用(a)和(b)中的PCR標記檢測出Rf-1連鎖帶,則可以認為該水稻很可能具有Rf-1基因。
      在另一個實施方式中,可以通過(a)組中至少2個PCR標記和(b)組中至少2個PCR標記而檢測Rf-1連鎖帶。例如,在(a)和(b)兩組標記中,如圖1所示的基因圖譜,用距離Rf-1基因很近的標記可檢測到Rf-1連鎖帶,而用距離Rf-1基因遠一些的標記則不能檢測到Rf-1連鎖帶,通過篩選這樣的水稻個體可以選出含有不需要基因區(qū)最小的具有Rf-1基因的水稻個體。同樣,優(yōu)選的,(a)組中的至少一個PCR標記是S12564 Tsp509I和(b)組中的至少一個PCR標記是C1361 MwoI。因而,S12564 Tsp509I和C1361 MwoI兩個PCR標記位點之間的遺傳距離為0.3cM。利用這種特性,可以從Rf-1基因供體親本引入的染色體區(qū)限定至1cM左右區(qū)域。這有助于將供體親本Rf-1基因附近可能存在的有害基因被引入至恢復(fù)系中的可能性降至最小。
      Rf-1基因的檢測為了檢測水稻基因組中的Rf-1基因,利用上述SEQ ID NO1-18作為引物進行PCR反應(yīng)可以自水稻基因組擴增出上述任何一個PCR標記,然后用聚合酶鏈式反應(yīng)-限制性片段長度多態(tài)方法(PCR-RFLP)進行檢測。PCR-RFLP是一種適用于下述情形,即PCR擴增DNA片段中的限制性酶的識別位點在不同品種之間存在多態(tài)性,并且能從那些限制性的切割模式而方便的鑒定出特異的多態(tài)性(D.E.Harry et al.,Theor.Appl.Genet.(1998),97327-336)。
      根據(jù)所用引物而在凝膠上觀察到的條帶所反映出的限制性內(nèi)切酶切割模式,列于下述表1中。
      表1檢測條帶的大致大小(bp)由引物對1檢測標記1(R1877 EcoRI)當待測水稻基因組中純合的含有Rf-1基因時 1500及1700當待測水稻基因組中雜合的含有Rf-1基因時 1500、1700及3200當待測水稻基因組不含有Rf-1基因的情況下 3200由引物對2檢測標記2(G4003 HindIII)當待測水稻基因組中純合的含有Rf-1基因時 362當待測水稻基因組中雜合的含有Rf-1基因時 95、267及362當待測水稻基因組不含有Rf-1基因的情況下 95及267由引物對3測標記3(C1361 MwoI)當待測水稻基因組中純合的含有Rf-1基因時 50及107當待測水稻基因組中雜合的含有Rf-1基因時 25、50、79及107當待測水稻基因組不含有Rf-1基因的情況下 25、50及79由引物對4檢測標記4(G2155 MwoI)當待測水稻基因組中純合的含有Rf-1基因時 25、27及78當待測水稻基因組中雜合的含有Rf-1基因時 25、27、78及105當待測水稻基因組不含有Rf-1基因的情況下 25及105由引物對5檢測標記5(G291 MspI)當待測水稻基因組中純合的含有Rf-1基因時 25、49及55當待測水稻基因組中雜合的含有Rf-1基因時 25、49、55及104當待測水稻基因組不含有Rf-1基因的情況下 25和104由引物對6檢測標記6(R2303 BslI)當待測水稻基因組中純合的含有Rf-1基因時 238、655及679當待測水稻基因組中雜合的含有Rf-1基因時 238、655、679及1334當待測水稻基因組不含有Rf-1基因的情況下 238及1334
      由引物對檢測標記7(S10019 BstUI)當待測水稻基因組中純合的含有Rf-1基因時 130、218及244當待測水稻基因組中雜合的含有Rf-1基因時 130、218、244及462當待測水稻基因組不含有Rf-1基因的情況下 130及462由引物對8檢測標記8(S10602 KpnI)當待測水稻基因組中純合的含有Rf-1基因時 724當待測水稻基因組中雜合的含有Rf-1基因時 117、607及724當待測水稻基因組不含有Rf-1基因的情況下 117及607由引物對9檢測標記9(S12564 Tsp509I)當待測水稻基因組中純合的含有Rf-1基因時 41及117當待測水稻基因組中雜合的含有Rf-1基因時 26、41、91及117當待測水稻基因組不含有Rf-1基因的情況下 26、41及91II.Rf-1位點的鑒定如上所述,日本專利申請No.2000-247204所公開RFLP-PCR標記,是基于我們發(fā)現(xiàn)Rf-1位點定位于DNA標記位點S12564 Tsp509I和C1361 MwoI之間。通過回交將Rf-1基因引入不含有Rf-1基因的粳稻品系中建立育性恢復(fù)品系。如果在這個過程中使用日本專利申請No.2000-247204描述的鑒定Rf-1位點的方法,不僅可以有效的建立恢復(fù)系(2-3年內(nèi)),而且插入的片段長度也能得到控制。
      然而,通過雜交不可避免的將Rf-1附近的區(qū)域也同時引入受體親本中。日本專利申請No.2000-247204表明Rf-1位點定位于DNA標記位點S12564Tsp509I和C1361 MwoI之間,但這兩個位點的圖距約為0.3cM,即約90kbp。如果在Rf-1附近存在有害基因,將不可否認該有害基因也可能與Rf-1基因一起被插入。
      因此,基于Rf-1位點和DNA標記位點S12564 Tsp509I有密切的連鎖,我們通過染色體步行和遺傳分析尋找在DNA標記位點S12564 Tsp509I和C1361 MwoI之間的與Rf-1基因連鎖的區(qū)域。結(jié)果,我們成功的鑒定出了包含Rf-1基因的約76kb的區(qū)域,并測定了所述區(qū)域的全部堿基序列。根據(jù)本發(fā)明,通過遺傳工程的方法而有可能將育性恢復(fù)基因的功能導(dǎo)入到BT型雄性不育細胞質(zhì)。
      具體地說,在日本專利申請No.2000-247204中,用FR Koshihikari(在Rf-1位點是雜合的)對MS Koshihikari進行授粉而獲得1042個個體群,進行連鎖分析發(fā)現(xiàn)1個在Rf-1和S12564 Tsp509I位點之間發(fā)生重組的重組體和2個在Rf-1和C1361 MwoI位點之間發(fā)生重組的重組體(本申請中為參考實施例1-2)。在本發(fā)明中,增加了4103個個體而使群體中分析共有5145個個體。結(jié)果,新發(fā)現(xiàn)1個在Rf-1和S12564 Tsp509I位點之間發(fā)生重組的重組體和6個在Rf-1和C1361 MwoI位點之間發(fā)生重組的重組體,總數(shù)分別為2和8個重組體。通過本發(fā)明的高精度分離分析對這10個個體進行檢測以獲得在Rf-1位點最近處發(fā)生重組的重組體(實施例1)。
      在Rf-1和C1361 MwoI位點之間的8個重組體和在Rf-1和S12564Tsp509I位點之間的2個重組體,從其頻率比較上看可知S12564 Tsp509I位點比C1361 MwoI位點與Rf-1位點的遺傳距離要近。遺傳距離(用重組頻率表示cM)和物理距離(用堿基對數(shù)量來表示bp)并不總是成比例的,但通??烧J為遺傳距離的減少,其物理距離也隨著減少。
      因此,我們試圖從S12564 Tsp509I位點開始進行染色體步行來分離Rf-1位點(實施例2)。利用秈稻品種IR24和粳稻品種Asominori的基因組DNA以λDASH II為載體制備基因組文庫以用于染色體步行。IR24是攜帶Rf-1的品種,而Asominori未攜帶Rf-1。染色體步行結(jié)果,從IR24基因克隆中獲得覆蓋了約76kp染色體區(qū)域的重疊區(qū)(在染色體上的重疊克隆按序設(shè)定(ordered sets)),進而測定了整個序列(76363bp)。
      然后,基于獲得的堿基序列信息等而新發(fā)現(xiàn)了12個標記,并對上述提到的與Rf-1位點最接近的10個重組體進行高精度分離分析(實施例3)。結(jié)果,包含于上述約76kb中的65kb序列被發(fā)現(xiàn)包含了可以用于確定Rf-1基因功能存在的序列。這個區(qū)域由8個基因組克隆組成的重疊區(qū)所覆蓋。每一個克隆長約12-22kb并且至少有4.7kb的重疊區(qū)域。水稻中不同基因的長度差別跨越非常大(從短到長),但大部分基因的長度為數(shù)kb或更短。因此,在這8個基因組克隆中至少有一個被預(yù)期包含了全長Rf-1基因。
      我們進一步在上述約76kb的染色體區(qū)域中的Rf-1基因區(qū)域進行定位,以用于進行互補分析以直接闡明是否存在育性恢復(fù)能力。
      具體而言,通過遺傳工程技術(shù)將上述76kb區(qū)域中的10個部分片段(每一個長10-21kb)分別導(dǎo)入雄性不育系MS Koshihikari的未成熟種子中(圖5)。在所利用的10個部分片段中,有8個片段來自于先前通過染色體步行而得到的(圖1中的XSE1、XSE7、XSF4、XSF20、XSG22、XSG16、XSG8和XSH18,并描述在實施例3中)。此外,從XSF18和XSX1兩個克隆中獲得片段也進行了互補分析。XSF18在5′和3′端分別與XSF20的相同(分別是SEQID NO27中的第20328位和41921位堿基),但缺乏中間的第33947至38591位堿基。這是因為在克隆XSF18最初被分離時就發(fā)現(xiàn)在克隆分離后的擴增中包含上述缺失,因此重新進行擴增步驟而得到了完整克隆,稱為XSF20(實施例8)。XSX1是從克隆XSG8和XSH18通過限制性內(nèi)切酶處理并連接以包含足夠的重疊區(qū)而重新獲得的克隆,因為兩克隆的重疊區(qū)相對比較小(約7kb)(實施例13)。
      由于Rf-1是顯性基因,如果插入片段完全包含Rf-1基因,則轉(zhuǎn)化個體在當代即顯示出恢復(fù)育性。在互補分析中,評價了用每一個片段轉(zhuǎn)化的植株種子育性以找到那些用15.6kb片段轉(zhuǎn)化的其種子育性已恢復(fù)的植株,其中15.6kb片段包括SEQ ID NO27的第38538-54123位堿基,它來源于λ噬菌體克隆XSG16(實施例10)。用其它片段轉(zhuǎn)化的植株全都是不育的。這些結(jié)果表明上述15.6kb片段完全包含了Rf-1基因。況且,本發(fā)明提供了通過遺傳工程技術(shù)導(dǎo)入Rf-1基因的方法,且證明是有效的。
      為了進一步弄清λ噬菌體克隆XSG16中的確含有Rf-1基因的區(qū)域,我們通過互補分析,評價了比15.6kb片段(包含SEQ ID NO27的第38538-54123位堿基)更短片段的種子育性。結(jié)果表明,來自XSG16的11.4kb片段(包含SEQ ID NO27的第42357-53743位堿基)具有恢復(fù)種子育性的功能(實施例10(2))。用進一步短的6.8kb片段(包含SEQ ID NO27的第42132-48883位堿基)進行轉(zhuǎn)化得到的植株也具有恢復(fù)的種子育性(實施例10(3))。這些結(jié)果表明上述6.8kb片段包含Rf-1基因。
      III.包含Rf-1位點的核酸本發(fā)明提供包含育性恢復(fù)基因位點(Rf-1)的核酸。本發(fā)明所述包含育性恢復(fù)基因位點(Rf-1)的核酸包括有恢復(fù)育性功能的具有SEQ ID NO.27或與SEQ ID NO.27的堿基序列有至少70%同一性的堿基序列。
      如實施例10中所描述的,證實了Rf-1基因尤其完全包含于SEQ IDNO.27的第38538至54123位的堿基序列中。相應(yīng)的,本發(fā)明尤其提供有恢復(fù)育性的功能并具有SEQ ID NO.27的第38538至54123位或與SEQ IDNO.27的第38538至54123位的堿基序列有至少70%同一性的堿基序列。在這里,術(shù)語“SEQ ID NO.27的堿基序列”是指SEQ ID NO.27的全部堿基序列或其對育性恢復(fù)功能起作用的部分序列,特別是第38538至54123位堿基。更優(yōu)選的,它指第42357至53743位堿基,還優(yōu)選第42132至48883位堿基。
      在下面的實施例中,從攜帶Rf-1基因的秈稻水稻IR24基因組文庫中分離了包含育性恢復(fù)基因(Rf-1)的核酸,并且被確定具有SEQ ID NO27的堿基序列。然而,本發(fā)明的包含育性恢復(fù)基因(Rf-1)的核酸可以從任何攜帶RF-1基因的秈稻品種中衍生而來。攜帶Rf-1基因的秈稻品種包括,但不局限于,例如IR24、IR8、IR36、IR64、Chinsurah和BoroII。已知的不攜帶Rf-1基因的粳稻品種包括,但不局限于,例如Asominori、Koshihikari、Kirara 397、Akihikari、Akitakomachi、Sasanishiki、Kinuhikari、Nipponbare、Hatsuboshi、Koganebare、Hinohikari、Mineasahi、Aichinokaori、Hatsushimo、Akebono、Fujihikari、Minenoyukimochi、Kokonoemochi、Fukuhibiki、Dontokoi、Gohyakumangoku、Hanaechizen、Todorokiwase、Haenuki、Domannaka、Yamakikari等等?!岸i稻”和“粳稻”品種對本領(lǐng)域技術(shù)人員而言非常熟知的,并且本發(fā)明所包括的水稻品種對本領(lǐng)域技術(shù)人員而言也是容易確定的。
      本發(fā)明的核酸可以是單鏈和雙鏈形式的DNA,及其相應(yīng)的互補RNA。DNA包括舉例來說如基因組DNA(包括相應(yīng)的cDNA)、化學(xué)合成的DNA、PCR擴增得到的DNA和它們的組合。
      本發(fā)明的包含Rf-1基因的核酸優(yōu)選具有SEQ ID NO27的堿基序列。同一個氨基酸可由不只一個密碼子編碼,這稱為遺傳密碼的簡并性。因此,與SEQ ID NO27的堿基序列不完全相同的DNA序列可能與SEQ ID NO27所示堿基序列編碼了完全相同的氨基酸序列的蛋白。這種變體DNA序列可能由于沉默突變導(dǎo)致的(例如在PCR擴增過程中產(chǎn)生),或也可能由于天然序列的變異(deliberate mutagenesis)所導(dǎo)致。
      本領(lǐng)域技術(shù)人員非常熟知,甚至來自不同品種的具有不同氨基酸序列的蛋白質(zhì),仍然具有同樣的功能。本發(fā)明的Rf-1基因包括SEQ ID NO27所示堿基序列的同系物和變體,只要它們具有恢復(fù)育性功能。術(shù)語“具有恢復(fù)育性功能”意指當這樣的DNA片段導(dǎo)入后可使水稻植株個體或其種子獲得育性。育性恢復(fù)可能由于通過Rf-1基因的蛋白表達或可賦予育性的Rf-1基因核酸(DNA或RNA)本身的功能所導(dǎo)致。
      Rf-1基因同系物或變體是否具有育性恢復(fù)功能可通過下面列舉的方法來檢測,但并不局限于這些方法。待測核酸片段根據(jù)Hiei等(PlantJournal(1994),6(2),p272-282)的方法導(dǎo)入到用MS-FR Koshihikari對MSKoshihikari(不育系)進行授粉而獲得的未成熟種子中。所獲得的轉(zhuǎn)化體在正常條件下進行培養(yǎng),只有被測核酸片段具有育性恢復(fù)功能時才能獲得成熟的種子。
      衍生自不攜帶Rf-1基因的粳稻Asominori相應(yīng)區(qū)的核酸具有如SEQ IDNO28所示的堿基序列。SEQ ID NO28和SEQ ID NO27的相應(yīng)部分大體上有約98%的同一性。因此,本發(fā)明中包含育性恢復(fù)基因(Rf-1)位點的核酸與SEQ ID NO27有至少70%,優(yōu)選約80%或更高,更優(yōu)選約90%或更高,還更優(yōu)選95%或更高,最優(yōu)選98%或更高的同一性。
      同一性的百分率可通過目測和數(shù)學(xué)計算來確定。任選地,兩個核酸之間的同一性可通過利用GAP計算機程序,version 6.0的序列比較信息來確定。所述程序描述于Devereux等,Nucl.Acids Res.,12387(1984),并可從theUniversity of Wisconsin Genetics Computer Group(UWGCG)獲得。GAP程序優(yōu)選的默認參數(shù)包括(1)堿基的一元比較矩陣(包含值為1時表示相同,為0時表示不相同),和Gribskov和Burgess,Nucl.Acids Res.,146745(1986)的加權(quán)比較矩陣,描述于Schwartz和Dayhoff編的Atlas of Protein Sequence andStructure,National Biomedical Research Foundation,pp.353-358;(2)每一個缺口(gap)罰分值3.0,對每一個缺口中的每一個堿基(symbol)額外罰分值0.10;和(3)末端缺口不罰分。也可以采用其它本領(lǐng)域技術(shù)人員使用的序列比較程序。
      本發(fā)明的核酸也包括在中等嚴謹條件下能與SEQ ID NO27序列進行雜交并具有育性恢復(fù)功能的核酸,以及高度嚴謹條件下能與SEQ ID NO27序列進行雜交并具有育性恢復(fù)功能的核酸。
      在此處,本領(lǐng)域技術(shù)人員可根據(jù)如DNA的長度來確定所述中等嚴謹條件。基本條件描述于Sambrook等Molecular CloningA Laboratory Manual,2nd,Vo.1,pp.1.101-104,Cold Spring Harbor Laboratory Press,(1989),包括用對硝化纖維膜進行預(yù)洗的預(yù)洗液即5×SSC,0.5%SDS,1.0mM EDTA(pH8.0),雜交是在約1×SSC至6×SSC于約40到60℃下進行(或其它類似雜交液,如Stark’s溶液,即約50%甲酰胺于約42℃),以及洗滌在約60℃,0.5×SSC,0.1%SDS下進行。在雜交液包含約50%甲酰胺時雜交溫度可低約15-20℃。本領(lǐng)域技術(shù)人員也可根據(jù)如DNA的長度來確定高度嚴謹條件。通常,高度嚴謹條件包括相對于上述中等嚴謹條件而言,其雜交和/或洗滌在更高溫度和/或更低鹽濃度條件下進行。例如,這些條件包括雜交條件是0.1×SSC到0.2×SSC,在約60-65℃和/或洗滌條件是0.2×SSC,0.1%SDS在約65-68℃。本領(lǐng)域技術(shù)人員知曉可根據(jù)各種因素如探針長度來對溫度和洗液鹽濃度進行必要的調(diào)整。
      本發(fā)明的DNA也包括由于缺失、插入或取代一或多個堿基而不同于SEQ ID NO.27所示的序列,但仍然具有育性恢復(fù)功能的核酸。只要保持了育性恢復(fù)功能,缺失、插入或取代堿基的數(shù)目沒有特別的限制,但優(yōu)選為1至數(shù)千個,更優(yōu)選1-1000,更優(yōu)選1-500,更優(yōu)選1-200,最優(yōu)選1-100個堿基。
      基于本申請的描述,一旦Rf-1基因得到進一步弄清,本領(lǐng)域技術(shù)人員可以在去除例如Rf-1基因之外的區(qū)域或其內(nèi)含子區(qū)后而利用Rf-1基因。特定氨基酸的取代可通過例如具有類似理化特性的殘基進行取代。這種保守性取代的例子包括用另一個脂肪族氨基酸取代脂肪族氨基酸,例如Ile、Val、Leu或Ala中的一個取代其中的另一個;用極性殘基取代極性殘基,例如在Lys和Arg、Glu和Asp、或Gln和Asn之間進行改變;或者用芳香族殘基之間的取代,例如用Phe、Trp或Tyr中的一個取代其中的另一個。其它熟知的保守性取代包括,例如在具有類似疏水特性的整個區(qū)域之間的變化。為了引入合適的缺失、插入或取代時,本領(lǐng)域技術(shù)人員可利用熟知的遺傳工程技術(shù)例如位點特異性突變,其描述于Sambrook等Molecular CloningALaboratoryManual,2nd,Cold Spring Harbor Laboratory Press,(1989)。
      我們對攜帶Rf-1基因(SEQ ID NO27)的秈稻品種IR24與沒有攜帶的粳稻品種如Asominori(SEQ ID NO28)和Nipponbare BAC克隆(GanBankAccession No.AC068923)之間進行了比較。結(jié)果,我們發(fā)現(xiàn)攜帶Rf-1基因的秈稻品種中Rf-1區(qū)域至少具有下述單堿基多態(tài)性(SNP)。
      1)與SEQ ID NO27的第1239位堿基對應(yīng)的堿基是A;2)與SEQ ID NO27的第6227位堿基對應(yīng)的堿基是A;3)與SEQ ID NO27的第20680位堿基對應(yīng)的堿基是G;4)與SEQ ID NO27的第45461位堿基對應(yīng)的堿基是A;
      5)與SEQ ID NO27的第49609位堿基對應(yīng)的堿基是A;6)與SEQ ID NO27的第56368位堿基對應(yīng)的堿基是T;7)與SEQ ID NO27的第57629位堿基對應(yīng)的堿基是C;和8)與SEQ ID NO27的第66267位堿基對應(yīng)的堿基是G。
      因此,本發(fā)明包含Rf-1區(qū)域的核酸優(yōu)選地滿足上述1)-8)中一個到全部的要求。
      在下面的實施例3,對Rf-1區(qū)域中與Rf-1基因距離最靠近的重組體(RS1-RS2,Rc1-RC8)的染色體組織結(jié)構(gòu)進行了研究。結(jié)果顯示可以確定Rf-1基因功能存在的序列包含于SEQ ID NO27的第1239-66267位堿基,即以最大可能性來估計應(yīng)包含于位點P4497 MboI和B56691 XbaI位點之間(約65kb)(圖3)。然而,存在這樣一種可能,即對于Rf-1基因遺傳功能的表達非常重要的是,Rf-1基因只是秈稻基因型的一部分,而不管其余區(qū)域是粳稻還是秈稻基因型,其遺傳功能可能沒有明顯變化??赡苓€存在一個極端的例子,在粳稻與秈稻基因型之間,編碼區(qū)相互之間完全相同而只有啟動子區(qū)之間存在區(qū)別;啟動子區(qū)和編碼區(qū)只部分的包含于位點P4497 MboI和B56691 XbaI位點之間(約65kb)區(qū)域內(nèi)。因此,還不能得出結(jié)論認為上述的共同秈稻區(qū)域(SEQ ID NO27的第1239-66267位堿基之間)完全包含了完整的Rf-1基因。然而,基于以下考慮,可以確定至少SEQ ID NO27完全包含了完整的Rf-1基因1)基因通常的大小為數(shù)kb而很小超過10kb;2)本發(fā)明鑒定出的IR24基因組堿基序列(SEQ ID NO27)完全包含上述共同秈稻區(qū)域;3)SEQ ID NO27的5′端位于上述共同秈稻區(qū)域的上游1238bp處,且構(gòu)成另一個基因的一部分(S12564);和4)SEQ ID NO27的3′末端位于上述共同秈稻區(qū)域3′末端的下游10096bp處。
      如此,我們第一次成功的將Rf-1基因的區(qū)域限定到76kb范圍內(nèi)。因此,相對于現(xiàn)有技術(shù)例如日本專利公開No.2000-139465中描述的與Rf-1基因相距約1cM(約300kb)遺傳距離的共顯性標記所選擇出來的那些核酸,本發(fā)明包含Rf-1基因區(qū)域的核酸含有與Rf-1基因接近的其它基因的可能性大大減少。而且,相對于我們要求的優(yōu)先權(quán)即日本專利申請No.2000-247204中描述的用DNA標記位點S12564 Tsp509I和C1361 MwoI(之間的遺傳距離為0.3cM)所選擇出來的核酸,本發(fā)明上述核酸含有與Rf-1基因接近的其它基因的可能性也減少。
      我們進而對Rf-1基因是否完全包含于尤其SEQ ID NO27的第38538-54123位堿基序列中作了互補分析。因而,在本發(fā)明的一個實施方案中,與SEQ ID NO.27或SEQ ID NO.27第38538至54123位的堿基序列有至少70%同一性的堿基序列至少滿足下面兩個要求1)與SEQ ID NO.27的第45461位堿基相應(yīng)的堿基是A;2)與SEQ ID NO.27的第49609位堿基相應(yīng)的堿基是A。
      IV.恢復(fù)水稻育性的方法本發(fā)明提供一種恢復(fù)水稻育性的方法,包括將核酸導(dǎo)入到水稻中,所述核酸具有恢復(fù)育性的功能,其堿基序列如SEQ ID NO.27所示或與SEQ IDNO.27的堿基序列有至少70%同一性。本發(fā)明的方法可能包括將核酸導(dǎo)入到水稻中,所述核酸具有恢復(fù)育性的功能,并具有SEQ ID NO.27的部分序列,尤其是第38538至54123位,優(yōu)選第42357至53743位堿基序列,更優(yōu)選42132-48883位堿基序列,或具有與SEQ ID NO.27的第38538至54123位,優(yōu)選第42357至53743位,更優(yōu)選42132-48883位的堿基序列有至少70%同一性。
      在本發(fā)明中,導(dǎo)入到水稻中的包含育性恢復(fù)基因(Rf-1)位點的核酸,可以是上述描述于“III.包含Rf-1位點的核酸”中的任何一個核酸??梢杂靡阎姆椒▉韺⒑怂釋?dǎo)入到水稻中,而沒有特別的限制。本發(fā)明的核酸可通過已知的遺傳工程技術(shù)或雜交而導(dǎo)入到水稻中。由于可以防止包含其它鄰近基因的導(dǎo)入,并能縮短了建立品系的周期,因而遺傳工程技術(shù)優(yōu)先選用。
      可以使用遺傳工程技術(shù)中的任何適合于轉(zhuǎn)導(dǎo)的表達系統(tǒng)。重組表達載體包括含有本發(fā)明的育性恢復(fù)基因(Rf-1)的核酸,其可被導(dǎo)入水稻,可操作連接于合適的轉(zhuǎn)錄或翻譯調(diào)節(jié)序列,其中的轉(zhuǎn)錄或翻譯調(diào)節(jié)序列可源自例如哺乳動物、微生物、病毒或昆蟲基因。
      調(diào)節(jié)序列的例子包括轉(zhuǎn)錄啟動子、操縱子或增強子、mRNA核糖體結(jié)合位點和可以控制轉(zhuǎn)錄和翻譯起始和終止的合適序列。在調(diào)節(jié)序列功能性地與DNA序列聯(lián)系時堿基序列可操作地連接于調(diào)控序列。因此,啟動子堿基序列可操作連接于DNA序列,是指啟動子堿基序列能夠控制該DNA的轉(zhuǎn)錄。復(fù)制起始位點使DNA在水稻中能夠復(fù)制,和用于鑒定轉(zhuǎn)化體的選擇基因通常也整合在表達載體中??捎脗鹘y(tǒng)方法的可選擇標記基因的例子,如對抗生素如四環(huán)素、氨芐青霉素、卡那霉素、新霉素、潮霉素或壯觀霉素的抗性基因。
      此外,編碼合適的信號肽(水稻本身的或異源的)也可以整合到表達載體中。信號肽的DNA序列(分泌肽)以與本發(fā)明核酸序列的閱讀框適合的方式進行融合,以便DNA經(jīng)過轉(zhuǎn)錄起始和mRNA翻譯而得到含有信號肽的融合蛋白。
      本發(fā)明也提供包含本發(fā)明基因的重組載體。將本發(fā)明基因的DNA片段整合到載體如質(zhì)粒中,可用方法描述于Sambrook等Molecular CloningALaboratory Manual,2nd,Cold Spring Harbor Laboratory Press,(1989)。商業(yè)化的連接試劑盒(例如從TAKARA獲得)使用非常方便。進而將獲得的重組載體(如重組質(zhì)粒)導(dǎo)入到宿主水稻細胞中。
      通過標準方法在現(xiàn)有載體(如質(zhì)粒DNA)中插入目的基因而方便的制備到重組載體。植物轉(zhuǎn)化載體尤其適合于利用本發(fā)明的核酸片段來使水稻具備育性。對植物轉(zhuǎn)化載體沒有特別的限制,只要它們在植物中能夠表達預(yù)期基因而產(chǎn)生蛋白質(zhì)即可,但優(yōu)選地包括pBI221、pBI121(Clontech)、和它們衍生的載體。尤其是,用于轉(zhuǎn)化屬于單子葉植物水稻的載體包括pIG121Hm和pTOK233(Hiei et al.,Plant J.,6,271-282(1994)),和pSB424(Komari et al.,PlantJ.,10,165-174(1996))。
      用本發(fā)明的核酸片段取代上述載體中β-葡糖苷酸酶(GUS)基因而構(gòu)建成植物轉(zhuǎn)化載體,對植物進行轉(zhuǎn)染而獲得轉(zhuǎn)基因植物。植物轉(zhuǎn)化載體優(yōu)選包括至少啟動子、起始密碼子、目的基因(本發(fā)明的核酸序列或其一部分)、終止密碼子和終止子。根據(jù)需要也可以包含編碼信號肽的DNA、增強子序列、目的基因的5′和3′非翻譯區(qū)、選擇標記區(qū)等。只要能在植物中發(fā)揮作用,對啟動子和終止子的選擇也沒有特別的限制,其中包括組成型表達啟動子如最初已存在于上述載體中的35S啟動子、激動蛋白和泛素(ubiquitin)基因的啟動子。
      將質(zhì)粒導(dǎo)入宿主細胞的合適方法包括利用磷酸鈣或氧化鈣/氯化銣、電激(electroporation)、電注射、用PEG或類似物的化學(xué)處理、以及使用基因槍等,這些方法可見于Sambrook等Molecular CloningA Laboratory Manual,2nd,Cold Spring Harbor Laboratory Press,(1989)。對植物細胞的轉(zhuǎn)化可用如葉盤法[Science,227,129(1985)]或電激法[Nature,319,791(1986)]。
      將基因?qū)氲街参镏械姆椒òɡ棉r(nóng)桿菌介導(dǎo)(Horsch et al.,Science,227,129(1985);Hiei et al.,Plant J.,6,271-282(1994))、電激法(Fromm et al.,Nature,319,791(1986))、PEG(Pazkowski et al.,EMBO J.,3,2717(1984))、微注射(Crossway et al.,Mol.Gen.Genet.,202,179(1986))、粒子轟擊(McCabe et al.,Bio/Technology,6,923(1988))。對這些方法沒有特別的限制,只要它們適合于將核酸導(dǎo)入到靶植物中即可。
      通過雜交發(fā)生轉(zhuǎn)導(dǎo)可按如下例子進行。首先,Rf-1供體親本與粳稻品種雜交獲得F1,然后與粳稻品種進行回交。從得到的植株個體中選出在位點S12564 Tsp509I是純合體、在位點P4497 MboI和B53627 BstZ17I是雜合體的個體,進一步用于回交。再從得到的植株個體中選出在位點P4497 MboI和B56691 XbaI是雜合體、而對于粳稻(japonica)在位點B53627 BstZ17I是雜合體的個體,進一步用于回交。如此,對每一次回交后代個體中篩選在位點P4497 MboI和B56691 XbaI屬于雜合體的個體以用于進一步的回交,重復(fù)進行約10個循環(huán)。最終,在位點P4497 MboI和B56691 XbaI為雜合體的個體進行自交,在獲得的后代中篩選出在這兩個位點都是純合的個體,這樣就獲得了含有從Rf-1供體親本導(dǎo)入的在位點P4497 MboI和B56691 XbaI之間的有限染色體區(qū)域的恢復(fù)系。
      根據(jù)本發(fā)明,分離了包含育性恢復(fù)基因(Rf-1)的核酸,進而Rf-1基因可通過遺傳工程方法而被導(dǎo)入到水稻品種中以建立恢復(fù)系。本發(fā)明成功地將Rf-1區(qū)域定位在76kb或更窄的區(qū)域內(nèi)。因此本發(fā)明的包含Rf-1位點的核酸,相對現(xiàn)有技術(shù)而言,極大的減少了含有與Rf-1基因鄰近的其它基因的可能性。而且,在本發(fā)明中對包含Rf-1基因區(qū)域的整個堿基序列進行了測定。根據(jù)本申請的說明書,本領(lǐng)域技術(shù)人員可對Rf-1基因本身作進一步的研究。因而,可以只導(dǎo)入Rf-1基因,而沒有同時導(dǎo)入其它任何鄰近基因。這對于鄰近基因有害時是非常重要的。進一步的,建立恢復(fù)系可以在更短的時間內(nèi)完成,如比通過雜交方式縮短了1-2年。
      在實施例4-13中描述的互補分析中,通過農(nóng)桿菌介導(dǎo)法用圖5中描述的10個克隆片段轉(zhuǎn)化了MS Koshihikari(具有BT型細胞質(zhì)且其中的一個核心基因(core gene)在基本上與Koshihikari的相同)。結(jié)果表明,用包含SEQ IDNO27的第38538-54123位,優(yōu)選第42357-53743位,更優(yōu)選第42132-48883位堿基序列的核酸轉(zhuǎn)化而能建立育性恢復(fù)系。
      用于建立水稻恢復(fù)系的農(nóng)桿菌介導(dǎo)法如Hiei et al.,Plant J.,6,271-282(1994)、Komari et al.,Plant J.,10,p.165-174(1996)、Ditta et al.,PNAS77pp.7347-7351(1980)等描述的方法,但并不局限于這些。
      首先,制備要插入目的核酸片段的質(zhì)粒載體。合適的質(zhì)粒載體包括如pSB11、pSB22等具有如Komari et al.,Plant J.,10,p.165-174(1996)(同上)所描述質(zhì)粒圖的載體。或者,本領(lǐng)域技術(shù)人員自己也可根據(jù)諸如上述pSB11、pSB22來構(gòu)建出適合的載體。在下面的例子中,利用了中間載體pSB200,它是以pSB11為基礎(chǔ)而制備的含有潮霉素抗性基因的載體。具體地說,胭脂堿合成酶終止子(Tnos)首先與泛素啟動子和泛素內(nèi)含子進行融合(Pubi-ubiI)。再將潮霉素抗性基因插入到所得Pubi-ubiI-Tnos復(fù)合體上的ubiI和Tnos之間得到Pubi-ubiI-HYG(R)-Tnos組裝。再將其與pSB11(Komari et al.,如上)的HindIII/EcoRI片段整合得到pKY205。用來添加限制性內(nèi)切酶位點如NotI、NspV、EcoRV、KpnI、SacI、EcoRI的接頭序列插入到該pKY205中Pubi的上游HindIII位點,獲得含有潮霉素抗性基因表達盒的pSB200。
      然后,用包含了插入核酸的重組載體轉(zhuǎn)化大腸桿菌細胞(如DH5α、JM109、MV1184,均可由商業(yè)購買得到如從TAKARA獲得)。
      進而,轉(zhuǎn)化的大腸桿菌細胞與農(nóng)桿菌菌株,優(yōu)選同時與輔助(helper)大腸桿菌(攜帶幫助質(zhì)粒)進行三親雜配,可根據(jù)例如Ditta等(1980)的方法進行。合適的農(nóng)桿菌菌株包括根癌農(nóng)桿菌菌株如LBA4404/pSB1、LBA4404/pNB1、LBA4404/pSB3等。它們均具有Komari et al.,Plant J.,10,p.165-174(1996)(同上)中描述的質(zhì)粒圖譜,且本領(lǐng)域技術(shù)人員也可利用它們來構(gòu)建載體。合適的輔助大腸桿菌菌株包括但不限于如HB101/pRK2013(可從Clontech獲得)。有報道顯示攜帶pRK2073的大腸桿菌有pRK2073也可用作輔助大腸桿菌,雖然它們并不常用(Lemas et al.,Plasmid 1992,27,pp.161-163)。
      然后,根據(jù)Hiei等(1994)的方法用期望交配的農(nóng)桿菌細胞對雄性不育水稻進行轉(zhuǎn)化。通過用粳稻品種花粉對雄性不育水稻進行授粉來獲得所需用于轉(zhuǎn)化的未成熟種子。
      評估轉(zhuǎn)化植物中育性恢復(fù),例如可通過評估直立(standing)植株抽穗(heading)后約1個月的種子育性來進行。對直立植株的評估意指對生長在田間的植株等進行觀察??蛇x方法是對穗的成熟(ripening)種子百分率進行實驗室研究來進行。
      V.鑒定Rf-1基因存在的方法根據(jù)本發(fā)明,表明可以確定Rf-1基因功能存在的序列位于水稻第10號染色體上的多態(tài)性檢測標記P4497 MboI和B56691 XabI之間。而且,互補分析確證Rf-1基因完全包含于尤其是SEQ ID NO.27的第38538至54123位堿基序列之中。
      對攜帶Rf-1基因(SEQ ID NO27)的秈稻品種IR24與沒有攜帶所述基因的(Asominori(SEQ ID NO28)和Nipponbare BAC克隆AC068923)粳稻品種之間進行比較,發(fā)現(xiàn)兩品種之間存在多態(tài)性。那么,基于在Rf-1基因附近區(qū)域中堿基序列的多態(tài)性,我們可以方便、快速和準確地鑒定待測水稻植株或其種子是否攜帶Rf-1基因。
      因此,本發(fā)明也提供一種鑒定被測水稻個體或其種子是否具有水稻Rf-1基因的方法,其中利用了可以確定水稻Rf-1基因功能存在的序列,該序列位于在水稻第10號染色體上的多態(tài)性檢測標記P4497 MboI和B56691 XabI之間。
      可用任何已知的方法來檢測多態(tài)性。例如,已知方法包括限制性片段長度多態(tài)(RFLP)、通過測序直接確定、用識別8個堿基序列的限制性內(nèi)切酶對基因組DNA進行切割后進行末端放射性標記,進而用識別4或6個堿基序列的限制性內(nèi)切酶作進一步切割,繼而對消化產(chǎn)物進行雙向電泳(RLGS,Restriction Landmark Genome Scanning)等。AFLP分析(擴增片段長度多態(tài),P.Vos et al.,Nucleic Acids Res.Vol.23,pp.4407-4414(1995))也已經(jīng)被開發(fā),其中通過PCR來擴增/檢測RFLP。
      例如,涉及通過PCR擴增來檢測RFLP(將RFLP標記轉(zhuǎn)化成PCR標記)或通過PCR擴增來檢測微衛(wèi)星中的多態(tài)性(微衛(wèi)星標記)的常規(guī)方法將在下面闡述。
      將RFLP標記轉(zhuǎn)化成PCR標記A.基于與RFLP探針相應(yīng)的基因組區(qū)域中多態(tài)性的PCR標記(D.E.Harry,B.Temesgen,D.B.Neale;Codominant PCR-based markers for Pinus taedadeveloped from mapped cDNA clones,Theor.Appl.Genet.(1998)97pp.327-336)?!癛FLP”是一種用DNA片段作為探針經(jīng)Southern分析而觀察到的多態(tài)性。用作探針的DNA片段的堿基序列稱為“RFLP標記探針序列”。根據(jù)RFLP標記探針序列設(shè)計PCR引物,進行基因組PCR反應(yīng)后,可通過如下兩種方式獲得PCR標記。第一種方式涉及用一系列的限制性內(nèi)切酶處理產(chǎn)物以找到能引起片段長度多態(tài)的限制酶,第二種方式涉及找出通過比較品種之間產(chǎn)物的堿基序列得到的多態(tài)性,基于該多態(tài)性制備PCR標記。
      B.基于引起RFLP位點的PCR標記。通過鑒定在PCR探針內(nèi)或附近(通常在數(shù)kb范圍內(nèi))的引起RFLP位點來獲得PCR標記(只在兩個比較品種中的一個品種攜帶該內(nèi)切酶識別位點)。
      微衛(wèi)星標記微衛(wèi)星是在基因組中大量存在的以約2-4個堿基如(CA)n的重復(fù)序列。如果品種間多態(tài)性是由于重復(fù)數(shù)(repetition)引起的,則可根據(jù)鄰近區(qū)域中設(shè)計引物進行PCR擴增,觀察其擴增產(chǎn)物的長度來確定多態(tài)性,因而可以檢測到這種DNA多態(tài)性。利用微衛(wèi)星檢測多態(tài)性的標記被稱微衛(wèi)星標記(O.Parnaud,X.Chen,S.R.McCouch,Mol.Gen.Genet.(1996)252pp.597-607)。
      在本發(fā)明中使用的檢測多態(tài)性的方法也沒有特別限制。從效率和方便角度考慮,優(yōu)選PCR-RFLP,它是將PCR和RFLP結(jié)合來鑒定限制性內(nèi)切酶切割模式所造成的多態(tài)性,在不同品種間的PCR擴增DNA片段序列中,由于內(nèi)切酶識別位點的差異形成PCR-RFLP。PCR-RFLP也稱為CAPS(切割擴增多態(tài)性序列)。如不存在任何適合的限制性內(nèi)切酶識別位點以體現(xiàn)多態(tài)性的區(qū)域時,也可利用改進的CAPS稱為dCAPS(衍生的切割擴增多態(tài)性序列),其中限制性內(nèi)切酶識別位點通過PCR引入(Michaels,S.D.and Amasino,R.M.(1998),The Plant Journal 14(3)381-385;A.Konieczny et al.,(1993),Plant J.4(2)pp.403-410;Neff,M.M.,Neff,J.D.,Chory,J.and Pepper,A.E.(1998),ThePlant Journal 14(3)387-392)。這些方法在下面還要詳細介紹。
      CAPS,dCAPS本發(fā)明的鑒定方法包括,但不局限于i)制備引物對其根據(jù)在秈稻和粳稻品種之間的在Rf-1位點和其鄰近區(qū)域的堿基序列中體現(xiàn)多態(tài)性位點的堿基序列來設(shè)計的,用于擴增所述堿基序列;ii)進行核酸擴增反應(yīng),用被測水稻個體或其種子的基因組DNA作為模板;和iii)基于在核酸擴增產(chǎn)物中的多態(tài)性以鑒定被測水稻(rice)個體或其種子是否具有Rf-1基因。
      制備第i)中引物對優(yōu)選包括下述任何一種方式a)在核酸擴增產(chǎn)物的多態(tài)性中存在缺失區(qū)的變化時,則根據(jù)缺失區(qū)的側(cè)翼序列來設(shè)計核酸擴增的引物對,以形成可檢測多態(tài)性的標記;b)在核酸擴增產(chǎn)物的多態(tài)性中存在引起限制性內(nèi)切酶識別差異的堿基變化時,則根據(jù)堿基改變位點的側(cè)翼序列來設(shè)計核酸擴增的引物對,以形成可檢測多態(tài)性的標記;或c)在核酸擴增產(chǎn)物的多態(tài)性中存在不引起限制性內(nèi)切酶識別差異的堿基變化時,制備引物對以引入錯配堿基,其中引物對中包含堿基改變位點并且將包含堿基改變位點的區(qū)域改變成可導(dǎo)致在核酸擴增產(chǎn)物中限制性內(nèi)切酶識別差異的堿基序列,以形成可檢測多態(tài)性的標記。
      在本發(fā)明中,可合理的選擇出鑒定Rf-1基因存在的合適多態(tài)性位點,以便多態(tài)性檢測標記可按下面的描述來制備。即基于攜帶Rf-1基因秈稻品種(IR24)的堿基序列(SEQ ID NO27)與不攜帶Rf-1基因粳稻品種的相應(yīng)序列(Asominori(SEQ ID NO28)和Nipponbare BAC克隆AC068923)之間的比較,但可不局限于這兩個品種之間的比較。
      如果發(fā)現(xiàn)多態(tài)性導(dǎo)致了限制性內(nèi)切酶識別的差異,舉例而言,制備核酸擴增用的引物對以側(cè)接多態(tài)性位點并用于檢測該多態(tài)性。優(yōu)選的,引物不針對特異于高度重復(fù)序列來設(shè)計,以避免產(chǎn)生非預(yù)期產(chǎn)物。如果發(fā)現(xiàn)多態(tài)性沒有引起限制性內(nèi)切酶識別的差異,標記的制備則適用于上面描述的dCAPS方法。針對dCAPS標記的引物優(yōu)選不針對特異于重復(fù)序列來設(shè)計,并使產(chǎn)物優(yōu)選在50-300個堿基,更優(yōu)選約100個堿基的長度以使多態(tài)性檢測容易。
      如果發(fā)現(xiàn)多態(tài)性涉及微衛(wèi)星,核酸擴增引物可按微衛(wèi)星的側(cè)翼序列來設(shè)計以側(cè)接該微衛(wèi)星,并用于檢測該多態(tài)性。同樣,也不要將引物設(shè)計成特異于重復(fù)序列。
      1)核酸擴增在本發(fā)明中,根據(jù)在被測水稻個體或種子中測定的Rf-1位點的堿基序列來制備引物對,優(yōu)選被設(shè)計成可擴增包含多態(tài)性的鄰近區(qū)域。引物對用于核酸擴增反應(yīng),以被測水稻個體或種子的基因組DNA為模板。核酸擴增反應(yīng)優(yōu)選為聚合酶鏈式反應(yīng)(PCR)(Saiki et al.,1985,Science 230,pp.1350-1354)。
      用于核酸擴增反應(yīng)的引物對,其是根據(jù)多態(tài)性位點和其鄰近區(qū)域的堿基序列來設(shè)計的,可按任何已知的方法制備。具體地說,制備根據(jù)多態(tài)性位點和其鄰近區(qū)域的堿基序列來設(shè)計的引物對時,通過下面的方式,其包括產(chǎn)生與多態(tài)性位點和其鄰近區(qū)域的堿基序列具有相同序列的單鏈DNA或與該區(qū)域互補的堿基序列,如果需要,制備成包含修飾但不影響對多態(tài)性位點和其鄰近區(qū)域堿基序列特異結(jié)合的單鏈DNA,但滿足以下條件1)每條引物的長度為15-30個堿基;2)每條引物的堿基中G+C比率在30-70%;3)每條引物的堿基序列中的A、T、G和C不存在局部的嚴重不平衡分布。
      4)通過引物對而擴增出的核酸長度約為50-3000個堿基,優(yōu)選為50-300個堿基;和5)在每條引物或引物堿基序列之間不存在任何互補序列片段。
      在這里,多態(tài)性位點的“鄰近區(qū)域”意指包含多態(tài)性位點及其鄰近的在核酸擴增,尤其對于PCR,合適范圍內(nèi)的區(qū)域。被擴增的鄰近區(qū)域優(yōu)選但不局限于具有約50-3000個堿基,更優(yōu)選約50-約2000個堿基。為了便于鑒定多態(tài)性,產(chǎn)物長度優(yōu)選在50-300個堿基,更優(yōu)選為約100個堿基。鄰近區(qū)域在多態(tài)性位點的5′和3′側(cè)優(yōu)選,但不局限于具有約0至約3000個堿基,更優(yōu)選約0至約2000個堿基,還優(yōu)選為約0至約1000個堿基。
      核酸擴增反應(yīng)的程序和條件沒有特別的限制,對于本領(lǐng)域技術(shù)人員而言是非常熟練的。本領(lǐng)域技術(shù)人員可根據(jù)各種因素如多態(tài)性位點及其鄰近區(qū)域的堿基序列、引物對的堿基序列和長度等來確定合適的條件。通常,當引物越長或G+C含量越高或者A、T、G和C的分布更均勻,則核酸擴增反應(yīng)可在更嚴謹?shù)臈l件下進行(退火和核酸延長反應(yīng)在更高的溫度下進行,并采用較少的循環(huán)次數(shù))。采用越嚴謹?shù)臈l件可使擴增反應(yīng)具有更高的特異性。
      擴增反應(yīng)可按照如下條件進行,但不局限于它們94℃2分鐘1個循環(huán),于94℃1分鐘、58℃1分鐘和72℃2分鐘進行30個循環(huán),最后是1個循環(huán)72℃2分鐘,用50ng基因組DNA作模板,每種dNTP 200μm和ExTaqTM(TAKARA)5U。反應(yīng)也可用如下條件94℃2分鐘1個循環(huán),于94℃1分鐘、58℃1分鐘和72℃1分鐘進行30個循環(huán),最后是72℃2分鐘1個循環(huán)。另一個具體例子,反應(yīng)在如下條件進行94℃2分鐘1個循環(huán),于94℃30秒、58℃30秒和72℃30秒進行35個循環(huán),最后是72℃2分鐘1個循環(huán)。
      作為PCR模板的被測水稻(檢測水稻)基因組DNA可以用Edwards等(Nucleic Acids Res.8(6)1349,1991)的方法而容易的從植株個體或種子中提取出來。更優(yōu)選的,可用標準方法對DNA進行純化。一個尤其優(yōu)選的提取方法是CATB法(Murray,M.G.et al.,Nucleic Acids Res.8(19)4321-4325,1980)。用作PCR模板的DNA量優(yōu)選為最終濃度0.5ng/μL。
      2)制備檢測多態(tài)性的標記通過用引物對進行核酸擴增反應(yīng)而獲得擴增產(chǎn)物,檢測其中是否存在多態(tài)性。之后,可以基于發(fā)現(xiàn)的多態(tài)性來建立檢測該多態(tài)性的標記。下面提供可檢測擴增產(chǎn)物中的多態(tài)性的例子,但并不局限于這些例子。
      a)在核酸擴增反應(yīng)產(chǎn)物的多態(tài)性中存在包含缺失區(qū)的改變(change)。
      在這種情況下,制備用于核酸擴增的引物對側(cè)接缺失區(qū)以形成檢測多態(tài)性的標記。如果缺失區(qū)達到足夠的大小,多態(tài)性可通過如瓊脂糖或丙烯酰胺凝膠電泳時擴增產(chǎn)物的泳動的差異來檢測。舉例來說,當堿基對數(shù)差別在約5%或更大的情況下,可用瓊脂糖凝膠電泳檢測多態(tài)性,或當長度差別約為1個堿基或更多時,可用測序用的丙烯酰胺凝膠電泳檢測多態(tài)性。任選地,也可通過用寡核苷酸或DNA片段作為分析探針與核酸擴增產(chǎn)物進行雜交來檢測多態(tài)性,其中所用的寡核苷酸或DNA片段具有與不包括缺失區(qū)的堿基序列互補的序列不包括缺失區(qū)。任選地,如果需要,可測定擴增產(chǎn)物的堿基序列來進一步確證多態(tài)性。本領(lǐng)域技術(shù)人員可采用合適的關(guān)于核酸電泳、雜交、測序及相關(guān)的已知實驗技術(shù)。在這種情況下,擴增產(chǎn)物的長度差別直接反應(yīng)多態(tài)性,以此為基礎(chǔ)的用于檢測多態(tài)性的標記被稱為ALP(擴增子(amplicon)長度多態(tài))標記。
      b)在核酸擴增產(chǎn)物的多態(tài)性中存在引起限制性內(nèi)切酶識別差異的堿基改變。
      在這種情況下,根據(jù)堿基改變位點的側(cè)翼序列來設(shè)計核酸擴增的引物對以形成可檢測多態(tài)性的標記。此時,在核酸擴增產(chǎn)物的多態(tài)性中存在引起限制性內(nèi)切酶識別差異的堿基改變,即造成一個或多個特定的限制性內(nèi)切酶可以切割或不能切割核酸擴增產(chǎn)物。因此,擴增產(chǎn)物可用限制性內(nèi)切酶和在例如瓊脂糖凝膠上進行電泳時的泳動的差異來檢測多態(tài)性。如果需要,測定擴增產(chǎn)物的堿基序列來進一步確證多態(tài)性。
      在這種情況下,通過PCR等方法的擴增產(chǎn)物的限制性片段的長度差異可反應(yīng)出多態(tài)性,基于此而用于檢測多態(tài)性的標記被稱為CAPS標記或PCR-RFLP標記(A.Konieczny等,如上)。
      這種標記的例子如下面實施例1中的引物對P4497 MboI、P23945 MboI、P41030 TaqI、P45177 BstUI、B59066 BsaJI、B56691 XbaI。甚至如果多態(tài)性可通過如上面a)描述的通過擴增產(chǎn)物的核酸長度來進行檢測,也可通過與限制性內(nèi)切酶處理相結(jié)合而更容易的進行檢測。
      c)在核酸擴增產(chǎn)物的多態(tài)性中存在不引起限制性內(nèi)切酶識別差異的堿基改變此時,制備用于引入錯配堿基的引物對,其包含堿基改變位點并且將包含堿基改變位點的區(qū)域改變成可導(dǎo)致擴增產(chǎn)物中的限制性內(nèi)切酶識別差異的堿基序列,以形成可檢測多態(tài)性的標記。
      具體的說,基于天然靠近Rf-1基因區(qū)域的序列來設(shè)計引物對,可在核酸擴增產(chǎn)物中產(chǎn)生多態(tài)性但沒有導(dǎo)致限制性內(nèi)切酶識別的差異。因此,在一條或兩條引物中引入錯配堿基以將包含堿基改變位點(多態(tài)性)的區(qū)域改變成可導(dǎo)致在擴增產(chǎn)物中的限制性內(nèi)切酶識別有差異的堿基序列。例如,在Mikaelian等Nucl.Acids.Res.20376.1992中描述的方法可以作為通過PCR介導(dǎo)的位點特異性突變來對特定堿基進行取代、缺失或增加的標準方法。用錯配引入引物得到的擴增產(chǎn)物作為檢測多態(tài)性的標記可能被一個或多個特定限制性內(nèi)切酶切割或不被切割,因為在錯配引入位點存在限制性內(nèi)切酶識別差異。因此,擴增產(chǎn)物用這些限制性內(nèi)切酶處理并在例如瓊脂糖凝膠上電泳,通過如上述b)描述的觀察泳動差別來檢測出多態(tài)性。
      引入錯配堿基既不能影響引物與靶標植物基因組的結(jié)合,也不能影響多態(tài)性堿基的改變。多態(tài)性堿基的改變用于在其附近引入錯配,以通過堿基的改變和錯配相結(jié)合產(chǎn)生限制性內(nèi)切酶識別的差異。引入這種錯配的方法為本領(lǐng)域技術(shù)人員所熟知,例如可詳見于Michaels,S.D.andAmasino,R.M.(1998),Neff,M.M.,Neff,J.D.,Chory,J.and Pepper,A.E.(1998)。
      這種情況下的標記是對上述b)描述的CAPS標記的改進,并稱為dCAPS(衍生CAPS)標記。這種標記的例子如下面實施例3中的P9493 BslI。
      在上述第b)或c)種情況下,如果存在額外的與品種多態(tài)性無關(guān)的限制性酶切位點,則很難鑒定基于限制性內(nèi)切酶識別差異的多態(tài)性。在這種情況下,可以引入合適的錯配堿基到引物中以消除不必要的限制性酶切位點。例如,在實施例3中引入了合適的錯配堿基到R-引物來消除在B60304 MspI中的與多態(tài)性無關(guān)的MspI位點。
      雖然本發(fā)明并不局限于任何特定方法,CAPS或dCAPS方法相對于其它RFLP方法具有幾個優(yōu)點。具體的說,例如進行分析時比RFLP需要更小量的樣品。另一個優(yōu)點是大大減小了分析所需要的人力和時間。用PCR標記檢測的多態(tài)性可通過凝膠電泳來觀察,這比用微衛(wèi)星標記的丙烯酰胺凝膠電泳要容易操作一些。
      本發(fā)明的鑒定方法的優(yōu)選實施方式鑒定被測水稻是否具有Rf-1基因的方法之優(yōu)選方式通過下面的示例描述來闡明。在此處的例子中,發(fā)現(xiàn)秈稻品種IR24所攜帶的Rf-1基因(SEQ IDNO27)的堿基序列與粳稻品種的相應(yīng)區(qū)域相比至少具有下述1)-8)的多態(tài)性1)與SEQ ID NO27的第1239位堿基對應(yīng)的堿基是A;2)與SEQ ID NO27的第6227位堿基對應(yīng)的堿基是A;3)與SEQ ID NO27的第20680位堿基對應(yīng)的堿基是G;4)與SEQ ID NO27的第45461位堿基對應(yīng)的堿基是A;5)與SEQ ID NO27的第49609位堿基對應(yīng)的堿基是A;6)與SEQ ID NO27的第56368位堿基對應(yīng)的堿基是T;7)與SEQ ID NO27的第57629位堿基對應(yīng)的堿基是C;和8)與SEQ ID NO27的第66267位堿基對應(yīng)的堿基是G。
      因此在本發(fā)明的一個優(yōu)選實施方式中,當被測水稻個體或種子滿足一個到全部上述1)-8)的條件時可以判斷攜帶有Rf-1基因。
      我們進一步核實了Rf-1基因的功能表達所必需的區(qū)域包含于尤其是SEQ ID NO27的第38538-54123位,優(yōu)選第42357-53743位,更優(yōu)選第42132-48883位堿基中。因此在本發(fā)明的一個優(yōu)選實施方式中,當具有與SEQID NO27或SEQ ID NO27的第38538-54123位堿基序列有至少70%的同一性,并至少滿足下述1)和2)中的一個條件,則被測水稻個體或種子可被鑒定為具有Rf-1基因1)與SEQ ID NO.27的第45461位堿基相應(yīng)的堿基是A;2)與SEQ ID NO.27的第49609位堿基相應(yīng)的堿基是A。
      利用已知多態(tài)性檢測方法可以確定是否滿足了上述條件。也可以直接測定包含所述序列的鄰近區(qū)域的堿基序列。然而,上面描述的CAPS或dCAPS方法由于具有快速和方便的特性而優(yōu)選使用。CAPS或dCAPS方法例如可以通過包括下面步驟來進行i)基于包括下述任何一個堿基的鄰近區(qū)域堿基序列制備引物對;1)相應(yīng)于SEQ ID NO27的第1239位堿基的堿基;2)相應(yīng)于SEQ ID NO27的第6227位堿基的堿基;3)相應(yīng)于SEQ ID NO27的第20680位堿基的堿基;4)相應(yīng)于SEQ ID NO27的第45461位堿基的堿基;5)相應(yīng)于SEQ ID NO27的第49609位堿基的堿基;6)相應(yīng)于SEQ ID NO27的第56368位堿基的堿基;7)相應(yīng)于SEQ ID NO27的第57629位堿基的堿基;和8)相應(yīng)于SEQ ID NO27的第66267位堿基是G。
      以擴增出上述堿基及其鄰近區(qū)域。
      ii)利用被測水稻個體或其種子的基因組作為模板進行核酸擴增反應(yīng)。
      iii)根據(jù)所得到的核酸擴增產(chǎn)物的多態(tài)性來鑒定被測水稻個體或其種子中是否存在Rf-1。
      在檢測核酸擴增產(chǎn)物的多態(tài)性中發(fā)現(xiàn)滿足,但不局限于,下面一個到全部1)-8)的要求時,可確定被測水稻個體或其種子中存在Rf-11)包括了相應(yīng)于SEQ ID NO27的第1239位堿基的區(qū)域但不具有任何MboI識別序列;2)包括了相應(yīng)于SEQ ID NO27的第6227位堿基的區(qū)域但不具有任何BslI識別序列;3)包括了相應(yīng)于SEQ ID NO27的第20680位堿基的區(qū)域但不具有任何MboI識別序列;4)包括了相應(yīng)于SEQ ID NO27的第45461位堿基的區(qū)域但不具有任何TaqI識別序列;5)包括了相應(yīng)于SEQ ID NO27的第49609位堿基的區(qū)域但不具有任何BstUI識別序列;6)包括了相應(yīng)于SEQ ID NO27的第56368位堿基的區(qū)域但不具有任何MspI識別序列;7)包括了相應(yīng)于SEQ ID NO27的第57629位堿基的區(qū)域但不具有任何BsaJI識別序列;和8)包括了相應(yīng)于SEQ ID NO27的第66267位堿基的區(qū)域但不具有任何XbaI識別序列。
      然而,只要能夠檢測出上述1)-8)的特異區(qū)域,則本發(fā)明不局限于上述限制性內(nèi)切酶。
      優(yōu)選地,本發(fā)明的鑒定方法包括i)以包含下述任何一堿基的鄰近區(qū)域堿基序列為基礎(chǔ),制備引物對;1)與第45461位堿基相應(yīng)的堿基;或2)與第49609位堿基相應(yīng)的堿基;ii)利用被檢水稻個體或其種子的基因作為模板進行核酸擴增反應(yīng)。
      iii)根據(jù)所述核酸擴增產(chǎn)物中發(fā)現(xiàn)的多態(tài)性來鑒定被測水稻個體或其種子中Rf-1的存在。在步聚iii)中,當發(fā)現(xiàn)滿足下述,雖然不局限于,條件1)和2)中的至少一個時,可以確定被測水稻個體或其種子中具有Rf-1基因1)包括了相應(yīng)于SEQ ID NO27的第45461位堿基但不具有任何TaqI識別序列的區(qū)域;2)包括了相應(yīng)于SEQ ID NO27的第49609位堿基但不具有任何BstUI識別序列的區(qū)域。
      以SEQ ID NO27的堿基序列為基礎(chǔ),并優(yōu)選滿足上述條件的情況下選擇出合適的用于核酸擴增反應(yīng)的引物對。優(yōu)選地,使用具有選自SEQ IDNO39和40、SEQ ID NO41和42、SEQ ID NO43和44、SEQ ID NO45和46、SEQ ID NO47和48、SEQ ID NO49和50、SEQ ID NO51和52、SEQID NO53和54組成的引物對。更優(yōu)選地,選擇SEQ ID NO45和46、SEQ IDNO47和48組成的引物對。如果需要,上述引物對的序列中可包含取代、缺失或插入突變,但仍保持對多態(tài)性位點及其鄰近區(qū)域的堿基序列的特異性結(jié)合,其也可以用作引物。
      為了檢驗可產(chǎn)生限制性片段長度多態(tài)性的PCR產(chǎn)物,可用與PCR標記中識別位點相應(yīng)的限制性內(nèi)切酶進行切割。根據(jù)所使用限制性內(nèi)切酶,可在合適的反應(yīng)溫度下溫育數(shù)小時到1天來進行切割反應(yīng)。用限制酶切割后的PCR擴增樣品通過在約0.7%-2%瓊脂糖凝膠或約3%MetaPhorTM瓊脂糖凝膠上電泳來進行分析。進而例如通過溴化乙錠染色后于紫外光下進行觀察。
      本發(fā)明最優(yōu)選的實施方式中,根據(jù)所使用的引物對,在表2中列出了凝膠上帶型所反映的限制性內(nèi)切酶切割模式。
      表2被檢測出的條帶大致大小(bp)用P4497 MobI擴增(SEQ ID NO39和40)限制性酶MboI被測水稻基因組具有Rf-1基因(純合) 730沒有 385,345用P9493 BslI擴增(SEQ ID NO41和42)限制性酶BslI被測水稻基因組具有Rf-1基因(純合) 126沒有 100,26用P23945 MobI擴增(SEQ ID NO43和44)限制性酶MboI被測水稻基因組具有Rf-1基因(純合) 160,100沒有 260用P41030 TaqI擴增(SEQ ID NO45和46)限制性酶TaqI被測水稻基因組具有Rf-1基因(純合) 280沒有 90,190用P45177 BstUI擴增(SEQ ID NO47和48)限制性酶BstUI被測水稻基因組具有Rf-1基因(純合) 20,65,730沒有 20,65,175,555
      用B60304 MspI擴增(SEQ ID NO49和50)限制性酶MspI被測水稻基因組具有Rf-1基因(純合) 330沒有 220,110用B59066 BsaJI擴增(SEQ ID NO51和52)限制性酶BsaJI被測水稻基因組具有Rf-1基因(純合) 420沒有 65,355用B56691 XbaI擴增(SEQ ID NO53和54)限制性酶XbaI被測水稻基因組具有Rf-1基因(純合) 670沒有 140,530在下面的實施例3中,對于具有花粉育性的存在于Rf-1基因附近的重組體(RS1-RS2,RC1-RC8),利用14個多態(tài)性標記(包括上面描述的8對引物)檢測了它們的Rf-1區(qū)域的染色體組織結(jié)構(gòu)。結(jié)果,證實這些植株中均攜帶了來自秈稻品種的P9493 BslI和59066 BsaJI之間的Rf-1基因。這種結(jié)果表明具有如圖3所示的染色體組織結(jié)構(gòu)的重組體花粉具備育性,即Rf-1基因在這些花粉中發(fā)揮了功能作用。這表明在秈稻區(qū)域中的可確定Rf-1基因功能存在的序列包括在秈稻區(qū)域中,該區(qū)域在這些重組體花粉中是共同,即根據(jù)最大可能性來估計,包括在位點P4497 MboI和B56691 XbaI之間的區(qū)域(約65kb)中。
      在本發(fā)明中,染色體步行是基于假設(shè)位點S12564 Tsp509I應(yīng)當與Rf-1位點非常靠近,這可通過雜交產(chǎn)生的個體表現(xiàn)型頻率來判斷。事實上,根據(jù)本發(fā)明的高精度分離分析結(jié)果表明這兩個位點的遺傳距離約為0.04cM。在日本專利公開No.2000-139465中描述了被認為與Rf-1位點最緊密連鎖的標記之一,離Rf-1位點約1cM。考慮到在水稻中,1cM平均相當于約300kb,如果從日本專利公開No.2000-139465中描述的標記開始進行染色體步行還需要相當長的時間來進一步定位Rf-1基因區(qū)域。
      VI.通過抑制Rf-1基因的功能以恢復(fù)育性的方法根據(jù)本發(fā)明,分離了具有育性恢復(fù)功能的包括了含有育性恢復(fù)基因(Rf-1)位點的核酸。測定了該核酸的全部堿基序列,因而可以通過遺傳工程方法來控制Rf-1基因的育性恢復(fù)功能。因此,本發(fā)明進一步提供一種抑制Rf-1基因的功能以恢復(fù)育性的方法。
      根據(jù)本發(fā)明的一個具體實施方式
      ,抑制Rf-1基因的功能以恢復(fù)育性的方法包括通過導(dǎo)入長度至少100個連續(xù)堿基的反義序列,其序列互補于具有恢復(fù)育性功能的SEQ ID NO.27或與SEQ ID NO.27的堿基序列有至少70%同一性。
      在一個具體實施例中,根據(jù)本發(fā)明的抑制Rf-1基因的功能以恢復(fù)育性的方法包括通過導(dǎo)入長度至少100個連續(xù)堿基的反義序列,且其序列選自互補于具有恢復(fù)育性功能的SEQ ID NO.27第38538-54123位,優(yōu)選第42357-53743位,更優(yōu)選第42132-48883位的堿基序列,或互補于與SEQ IDNO.27第38538-54123位,優(yōu)選第42357-53743位,更優(yōu)選第42132-48883位的堿基序列有至少70%同一性的堿基序列。
      反義序列具有至少100個堿基或更長,更優(yōu)選為500個堿基或更長,最優(yōu)選為1000個堿基或更長。從導(dǎo)入方法的技術(shù)方便性來考慮,優(yōu)選具有10000個堿基或更短,更優(yōu)選為5000個堿基或更短??捎靡阎椒▉砗铣煞戳x序列??衫靡阎姆椒▽⒎戳x序列導(dǎo)入到水稻中,如Terada等(Plant CellPhysical.2000 Jul,41(7),pp.881-888)所描述的方法。
      也可以預(yù)期,Rf-1斷裂(disrupt)系可從包含轉(zhuǎn)座元件(例如,但不局限于,Tos17(Hirochika H.et al.1996,Proc.Natl.Acad.Sci.USA 93,pp.7783-7788))的不同變體系中篩選出在SEQ ID NO27中具有轉(zhuǎn)座元件的品系來獲得。在植物中,對以同源重組來進行基因斷裂已有研究。利用具有恢復(fù)育性功能的SEQ ID NO.27或與SEQ ID NO.27的堿基序列有至少70%同一性的核酸,可建立用Rf-1基因變體取代了Rf-1基因的品系,這樣也可能以達到抑制育性恢復(fù)功能的目的。
      參考文獻1.Fukuta et al.1992,Jpn J.Breed.42(supl.1)p.164-165.
      2.Japanese Patent Public Disclosure No.HEI7(1995)-222588.
      3.Japanese Patent Public Disclosure No.HEI9(1997)-313187.
      4.Japanese Patent Public Disclosure No.2000-139465.
      5.Harushima et al.1998,Genetics 148 p.479-494.
      6.Michaels and Amasino 1998,The Plant Journal 14(3)p.381-385.
      7.Neff et al.1998,The Plant Journal 14(3)p.387-392.
      8.D.E.Harry,et al.,Theor Appl Genet(1998)97p.327-336.
      9.Hiei et al.,Plant Journal(1994),6(2),p.272-282.
      10.Komari et al.,(1996)10,p.165-174.
      11.Ditta et al.,Proc.Natl.Acad.Sci.USA(1980),77p.7347-7351.
      12.P.Vos et al.,Nucleic Acids Res.Vol.23,p.407-4414(1995).
      13.O.Parnaud,X.et al,Mol.Gen.Genet.(1996)252p.597-607.
      14.A.Konieczny et al.,(1993),Plant J.4(2)p.403-410.
      15.Edwards et al.,Nucleic Acids Res.8(6)1349,1991.
      16.Murray M.G.et al.,Nucleic Acids Res.8(19)4321-4325,1980.
      17.Terada et al.,Plant Cell Physiol.2000 Jul,41(7),p.881-888.
      18.Hirochika H.et al.1996,Proc.Natl.Acad.Sci.USA,p.7783-7788.
      實施例下面通過實施例來進一步闡明本發(fā)明,但并不意欲限定本發(fā)明的范圍。本領(lǐng)域技術(shù)人員可以容易地根據(jù)說明書的描述來對本發(fā)明進行改變或變化,但仍然包含在本發(fā)明技術(shù)范圍內(nèi)。
      參考實施例下面的參考實施例是根據(jù)我們先前的申請(日本專利申請No.2000-247204)中描述的方法而進行的。
      參考實施例1 將Rf-1基因位點附近的RFLP標記轉(zhuǎn)換為PCR標記在這些參考例中,將Rf-1基因位點附近9個RFLP標記(R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602、G1255)轉(zhuǎn)換成了PCR標記。
      (1)材料和方法Rf-1基因位點附近9個RFLP標記即R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602、G1255,購自于日本農(nóng)林漁水產(chǎn)省農(nóng)業(yè)生物資源研究所(the National Institute of Agrobiological Sciences,the Ministry ofAgriculture,F(xiàn)orestry and Fisheries of Japan)。確定載體中的插入堿基序列之后,按照以下步驟進行實驗。此處所述的水稻品種,其中Asominori為粳稻品種,而IR24為秈稻品種。
      (2)Asominori基因組文庫的制備按照CTAB法從Asominori的綠色葉子中提取總DNA。用MboI部分消化后,用NaCl密度梯度離心(6-20%線性梯度、20℃、37000rpm、4小時、總體積為12ml)對DNA進行分級。用每個級分部分(約0.5ml)進行電泳,收集和純化含有15-20kb DNA的級分。以Lambda DASH II(Stratagene)為載體,按照產(chǎn)品所附方案來制備基因組文庫。包裝采用Giga Pack IIIGold(Stratagene)。包裝后,添加500μl的SM緩沖液和20μl氯仿。離心并在上清液里加入20μl氯仿,作為文庫溶液。
      用已稀釋50倍的文庫溶液5μl,感染XL-1 Blue MRA(P2),結(jié)果得到83個噬菌斑。這相當于每個文庫達到4.15×105pfu,假定平均插入片段的長度為20kb來計算,則這些噬菌斑共覆蓋了8.3×109bp。因此可以認為這個文庫相對于水稻基因組(4×108bp)而言包含了足夠大小的片段。
      (3)含有R1877-、C1361-和G4003-標記區(qū)的基因組克隆的分離就C1361及G4003而言,分離含有RFLP標記探針的質(zhì)粒,進行限制酶處理和電泳,以分離RFLP標記探針的部分;用DNA回收過濾器(TakaraSUPERC-01)回收所述目的DNA。對于R1877,需要設(shè)計特異于標記探針兩末端的引物,用Asominori總DNA為模板進行PCR反應(yīng),電泳并用上述方法回收擴增產(chǎn)物。然后用Rediprime DNA標記系統(tǒng)(Amersham Pharmacia)標記回收的DNA,制備成用于文庫篩選的探針。PCR反應(yīng)可按常規(guī)方法進行(這也適合于下面的描述)。
      將噬菌斑印跡到Hybond-N+(Amersham Pharmacia)上,再按照常規(guī)方法進行文庫篩選。初步篩選后,分別挑取各個陽性噬菌斑區(qū),并懸浮于SM緩沖液中,用于第二輪篩選。第二輪篩選后,挑取陽性噬菌斑區(qū),進行第三輪篩選,分離單個噬菌斑。
      將分離得到的目標噬菌斑懸浮于SM緩沖液后,噬菌體的初級增殖按照平板裂解法。通過震蕩培養(yǎng)法對該噬菌體增殖液進行次級增殖,然后用Lambda starter試劑盒(QIAGEN)純化噬菌體DNA。
      對于每個標記,初篩時用8個平板進行,每個平板使用10μl文庫溶液等分。經(jīng)過初篩、第二次和第三次篩選,分離出與R1877、C1361及G4003相關(guān)的基因組克隆,分別得到4、3和3個克隆。
      (4)將R1877轉(zhuǎn)化成PCR標記對分離到的基因組克隆進行分析,以鑒定出引起RFLP的位點,或EcoRI位點,其存在于IR24(秈稻)中而不存在Asominori(粳稻)中。將其轉(zhuǎn)化成PCR標記。
      具體來說,對分離到的4個克隆進行如下分析。首先,用T3和T7引物驗證每個克隆中的插入片段兩末端的堿基序列。接著,設(shè)計在標記探針的兩末端向外延伸的引物。并與T3和T7引物組合而形成總共為4個引物的組合,以每個克隆為模板進行PCR反應(yīng)。
      作為一個獨立的步驟,用NotI和EcoRI消化每個克隆,電泳后判斷插入片段的大小和每個克隆中的EcoRI片段長度。
      通過這些分析可以揭示每個克隆的相對位置。在RFLP分析中,已報道標記探針R1877在Nipponbare(粳稻)中可檢測出20kb的EcoRI片段,在Kasalath(秈稻)中可檢測出6.4kb的EcoRI片段(ftp//ftp.staff.or.jp/pub/geneticmap98/parentsouthen/chr10/R1877.JPG)。將該報道與上述分析結(jié)果總和起來分析,可以推定EcoRI位點存在于IR24中而不存在于Asominori中。因此,設(shè)計一種用以擴增鄰近區(qū)域的引物組合(SEQ IDNO1×SEQ ID NO2),以進行基因組PCR,其參數(shù)是94℃1分鐘,58℃1分鐘,72℃2分鐘為1個循環(huán),共30個循環(huán)以上。將所得PCR產(chǎn)物用EcoRI處理,并以0.7%瓊脂糖凝膠進行電泳。
      結(jié)果,在Asominori和IR24之間觀察到了預(yù)期的多態(tài)性。對于IR24品種,用EcoRI處理PCR產(chǎn)物(約3200bp),得到1500bp和1700bp片段,但對于Asominori品種卻不存在這種切割模式。利用Asominori-IR24的RIL(重組體近交系(Recombinant inbreed line))進行PCR標記作圖,結(jié)果表明PCR標記與RFLP標記位點R1877處于相同的區(qū)域,因而確認了RFLP標記R1877已被轉(zhuǎn)換成PCR標記,在本發(fā)明中稱為R1877 EcoRI。
      (5)將G4003轉(zhuǎn)化成PCR標記對分離到的基因組克隆進行分析,以鑒定出引起RFLP的位點,或HindIII位點,其存在于Asominori中而不存在IR24中。以將G4003轉(zhuǎn)化成PCR標記。
      與對R1877的分析方法相似,揭示分離到的3個克隆的相對位置。在RFLP分析中,已報道標記探針G4003在Nipponbare(粳稻)中可檢測出3kb的HindIII片段,在Kasalath(秈稻水稻)中檢測出的片段為10kb(ftp//ftp.staff.or.jp/pub/geneticmap98/parentsouthen/chr10/R1877.JPG)。將該報道與上述分析結(jié)果總和起來分析,可以暫時推測,Asominori中存在而IR24中不存在的HindIII位點應(yīng)位于2個候選位置中的一個。設(shè)計一種可擴增鄰近區(qū)域的引物組合(SEQ ID NO3×SEQ ID NO4),以進行基因組PCR,其參數(shù)是94℃30秒,58℃30秒,72℃30秒為1個循環(huán),共35個循環(huán)以上。將所得PCR產(chǎn)物用HindIII處理,并以2%瓊脂糖凝膠進行電泳。結(jié)果發(fā)現(xiàn)在標記探針內(nèi)部的HindIII位點顯示出多態(tài)性。對于Asominori而言,用HindIII消化PCR產(chǎn)物(362bp)可得到95bp和267bp片段,但對于IR24而言沒有這種切割模式。作圖結(jié)果表明,RFLP標記G4003被轉(zhuǎn)換成了PCR標記,本發(fā)明將其命名為G4003 HindIII(SEQ ID NO19)。
      (6)將C1361轉(zhuǎn)化成PCR標記依據(jù)分離到的基因組克隆的堿基序列信息來設(shè)計引物。并以Asominori和IR24的總DNA為模板進行PCR反應(yīng),電泳后,用已知的方法回收PCR產(chǎn)物。以回收的DNA作模板,用ABI Model 310分析了各個水稻品種的堿基序列,以找出可引起多態(tài)性的變異。
      與分析R1877一樣,建立了分離到的3個克隆大致的相對位置。但發(fā)現(xiàn),很難在C1361標記附近區(qū)域進行PCR擴增或確定其堿基序列,因而很難鑒定出引起RFLP的位點。因此,發(fā)明人注意到能夠產(chǎn)生相對較長的PCR產(chǎn)物(2.7kb)的區(qū)域,并嘗試創(chuàng)建dCAPS標記。
      具體來說,采用Asominori和Koshihikari(都是粳稻水稻)以及Kasalath和IR24(均為秈稻水稻),比較了所述區(qū)域的基因組PCR產(chǎn)物的堿基序列,在粳稻品種和秈稻品種之間發(fā)現(xiàn)了6個位點顯示有多態(tài)性。其中的一個位點用于創(chuàng)建dCAPS標記。為此,用SEQ ID NO5和SEQ ID NO6作引物進行PCR,即以94℃30秒,58℃30秒,72℃30秒為1個循環(huán),共35個循環(huán)以上為參數(shù)。將所得PCR產(chǎn)物用MwoI處理,再用3%MetaPhorTM瓊脂糖凝膠電泳進行分析。結(jié)果發(fā)現(xiàn),對于Asominori而言,在2位點處被切割,得到約25bp、50bp、79bp的三個電泳條帶,但對于IR24,只在1位點處進行了切割,得到約50bp、107bp的兩個電泳條帶。作圖分析表明,RFLP標記C1361被轉(zhuǎn)換成了PCR標記,在本發(fā)明中命名為C1361 MwoI(SEQ ID NO20)。
      (7)將G2155轉(zhuǎn)化為PCR標記根據(jù)標記探針的兩末端設(shè)計特異引物,并以Asominori、Koshihikari、IR24或IL216(該品系是通過回交而將Rf-1基因引入到Koshihikari中而建立的;其基因型為Rf-1/Rf-1)的總DNA為模板進行PCR。根據(jù)上面已經(jīng)描述的方法,純化所得到的PCR產(chǎn)物并找出對于限制性片段長度多態(tài)性有用的突變。
      具體來說,比較被測品種之間相應(yīng)區(qū)域的堿基序列,在具有Rf-1基因的品種/品系(IR24及IL216)和沒有Rf-1基因的品種(Asominori及Koshihikari)之間發(fā)現(xiàn)3位點突變。其中的1處突變被用于創(chuàng)建dCAPS標記。為此,用SEQ ID NO7和SEQ ID NO8作引物,以94℃30秒,58℃30秒,72℃30秒為1循環(huán),共35個循環(huán)以上為參數(shù)進行PCR反應(yīng)。將所得PCR產(chǎn)物用MwoI處理,再用3%MetaPhorTM瓊脂糖凝膠電泳進行分析。對于Asominori,有1個切割位點,得到約25bp、105bp的兩個觀察到電泳條帶;對于IR24,有2個切割位點,得到約25bp、27bp、78bp的三個可觀察電泳條帶。圖譜分析表明,RFLP標記G2155被轉(zhuǎn)換成了PCR標記,在本發(fā)明中命名為G2155MwoI(SEQ ID NO21)。
      (8)將G291轉(zhuǎn)換成PCR標記設(shè)計特異于標記探針內(nèi)部序列的引物,并將各種引物組合起來進行PCR反應(yīng),以找到一種引物組合而能夠產(chǎn)生預(yù)期大小的擴增產(chǎn)物。利用該選擇出的引物組合,以Asominori、Koshihikari、IR24及IL216的總DNA為模板進行PCR反應(yīng)。按前面已描述的方法純化所得到的PCR產(chǎn)物并找出對于限制性片段長度多態(tài)性有用的變異。
      具體而言,用特異于標記探針序列的引物,本發(fā)明人對被測的每一個品種進行了基因組PCR反應(yīng),并比較擴增產(chǎn)物的堿基序列。結(jié)果發(fā)現(xiàn),具有Rf-1基因的品種/品系(IR24及IL216)和沒有Rf-1基因的品種(Asominori及Koshihikari)之間發(fā)現(xiàn)4處位點的突變。其中的1處突變被用于創(chuàng)建dCAPS標記。為此,用SEQ ID NO9和SEQ ID NO10作引物,以94℃30秒,58℃30秒,72℃30秒為1循環(huán),共35個循環(huán)以上為參數(shù)進行PCR反應(yīng)。將所得PCR產(chǎn)物用MspI處理,再以3%MetaPhorTM瓊脂糖凝膠電泳進行分析。對于具有Rf-1基因的品種/品系,有2個切割位點,得到約25bp、49bp、55bp的三個可觀察的電泳條帶;但對于不具有Rf-1基因的品種,只有1個切割位點,得到約25bp、104bp的兩個可觀察的電泳條帶。圖譜分析表明,RFLP標記G2155被轉(zhuǎn)換成了PCR標記,在本發(fā)明中命名為G291 MspI(SEQ IDNO22)。
      (9)將R2303轉(zhuǎn)化成PCR標記設(shè)計特異于標記探針內(nèi)部序列的引物,以Asominori(粳稻)、IR24及Kasalath(秈稻)的總DNA為模板進行PCR反應(yīng)。按前面已描述的方法純化所得到的PCR產(chǎn)物并找出對于限制性片段長度多態(tài)性有用的突變。
      比較被測品種之間相應(yīng)區(qū)域的堿基序列,結(jié)果發(fā)現(xiàn)在粳稻品種和秈稻品種之間存在突變。由于該突變出現(xiàn)在BslI識別位點,因而直接用作產(chǎn)生CAPS標記。為此,用SEQ ID NO11和SEQ ID NO12作引物,以94℃1分鐘,58℃1分鐘,72℃2分鐘為1循環(huán),共30個循環(huán)以上為參數(shù)進行PCR反應(yīng)。將所得PCR產(chǎn)物用BslI處理,以2%瓊脂糖凝膠電泳進行分析。在粳稻品種中有1個切割位點,可觀察到約238bp、1334bp的兩個電泳條帶,而在秈稻品種中有2個切割位點,可觀察到約238bp、655bp、679bp的三個電泳條帶。圖譜分析證明,RFLP標記G2303已被轉(zhuǎn)換成PCR標記,在本發(fā)明中命名為G2303 BslI(SEQ ID NO23)。
      (10)將S10019轉(zhuǎn)化成PCR標記按照第(9)中的將R2302轉(zhuǎn)換成PCR標記的方法來將S10019轉(zhuǎn)化成PCR標記。
      比較被測品種之間相應(yīng)區(qū)域的堿基序列,結(jié)果發(fā)現(xiàn)在粳稻品種和秈稻品種之間存在突變。由于該突變出現(xiàn)在BstUI識別位點,因而直接用作產(chǎn)生CAPS標記。為此,用SEQ ID NO13和SEQ ID NO14作引物,以94℃1分鐘,58℃1分鐘,72℃1分鐘為1循環(huán),共30個循環(huán)以上為參數(shù)進行PCR反應(yīng)。將所得PCR產(chǎn)物用BstUI處理,以2%瓊脂糖凝膠電泳進行分析。在粳稻品種中有1個切割位點,可觀察到約130bp、462bp的兩個電泳條帶,而在秈稻品種中有2個切割位點,可觀察到約130bp、218bp、244bp的三個電泳條帶。圖譜分析證明,RFLP標記S10019已被轉(zhuǎn)換成PCR標記,在本發(fā)明中命名為S10019 BstUI(SEQ ID NO24)。
      (11)將S10602轉(zhuǎn)化成為PCR標記按照第(9)中的將R2302轉(zhuǎn)換成PCR標記的方法來將S10602轉(zhuǎn)換成PCR標記。
      比較被測品種之間相應(yīng)區(qū)域的堿基序列,結(jié)果發(fā)現(xiàn)在粳稻品種和秈稻品種之間存在突變。該突變用作創(chuàng)建CAPS標記。為此,用SEQ ID NO15和SEQ ID NO16作引物,以94℃1分鐘,58℃1分鐘,72℃1分鐘為1循環(huán),共33個循環(huán)以上為參數(shù)進行PCR反應(yīng)。將所得PCR產(chǎn)物用KpnI處理,以2%瓊脂糖凝膠電泳進行分析。在粳稻品種中有1個切割位點,可觀察到約117bp、607bp的兩個電泳條帶,而在秈稻品種中沒有切割位點,只可觀察到724bp的電泳條帶。圖譜分析證明,RFLP標記S10602已被轉(zhuǎn)換成PCR標記,在本發(fā)明中命名為S10602 KpnI(SEQ ID NO25)。
      (12)將S12564轉(zhuǎn)化成PCR標記按照第(9)中的將R2302轉(zhuǎn)換成PCR標記的方法來將S12564轉(zhuǎn)換成PCR標記。
      具體地,比較被測品種之間相應(yīng)區(qū)域的堿基序列,結(jié)果發(fā)現(xiàn)在粳稻品種和秈稻品種之間存在突變。由于該突變出現(xiàn)在BstUI識別位點,因而直接用作創(chuàng)建dCAPS標記。為此,用SEQ ID NO17和SEQ ID NO18作引物,以94℃30秒,58℃30秒,72℃30秒為1循環(huán),共35個循環(huán)以上為參數(shù)進行PCR反應(yīng)。將所得PCR產(chǎn)物用Tsp509I處理,以3%瓊脂糖凝膠電泳進行分析。在粳稻品種中有2個切割位點,可觀察到約26bp、41bp、91bp的三個電泳條帶,而在秈稻品種中有1個切割位點,可觀察到約41bp、117bp的兩個電泳條帶。圖譜分析證明,RFLP標記S12564已被轉(zhuǎn)換成PCR標記,在本發(fā)明中命名為S12564 Tsp509I(SEQ ID NO26)。
      參考實施例2 Rf-1基因位點的基因圖譜用BT型雄性不育細胞質(zhì)取代Koshihikari的細胞質(zhì)而制備得到MSKoshihikari(BC10F1代)。MS-FR Koshihikari是由此而創(chuàng)建的品系,將源于IR8(由National Institute of Agrobiological Sciences提供)的Rf-1基因?qū)氲組S Koshihikari(Rf-1基因位點是雜合的)。用MS-FR Koshihikari的花粉對MS Koshihikari授粉產(chǎn)生的F1代群體,從F1代的1042株幼苗中提取DNA,以供試驗分析之用。
      首先,分析每一個體中被認為位于參考實施例1中所述2個標記位點即R1877 EcoRI和G2155 MwoI(其推測位于Rf-1基因座的相對側(cè))之間的Rf-1基因的基因型。在R1877 EcoRI位點或G2155 MwoI位點上,粳稻為純合體則被認為在這兩個標記位點之間是重組體。接著,對每個重組體,研究其在G291 MspI、R2303 BslI、S12564 Tsp509I、C1361 MwoI、S10019 BstUI、G4003HindIII、S10602 KpnI位點的基因型,并鑒定發(fā)生重組的位置。
      對R1877 EcoRI和G2155 MwoI位點的基因型的研究結(jié)果表明,46個個體在Rf-1基因位點附近發(fā)生重組。分析在Rf-1基因位點附近的標記基因位點的基因型,結(jié)果如表3所示。
      表3 Rf-1基因位點附近的重組體個體中的標記位點基因型基因座 12345678910 11 12 13 14 15 16 17 18 19 20 21 22 23R1877 EcoRI JJJJJJJJHHHHHHHHHHHHHHHG291 MspI HJJJJJJJHHHHHHHHHHHHHHHR2303 BslI HHJJJJJJHHHHHHHHHHHHHHHS12564 Tsp509I HHHHHHHJHHHHHHHHHHHHHHHC1361 MwoI HHHHHHHHJJHHHHHHHHHHHHHS10019 BstUIHHHHHHHHJJJJJJJJHHHHHHHG4003 HindIII HHHHHHHHJJJJJJJJJJJJJJJS10602 KpnI HHHHHHHHJJJJJJJJJJJJJJJG2155 MwoI HHHHHHHHJJJJJJJJJJJJJJJ2425 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHJJJJJJJJJHHHHHHHHHHHHHHJJJJJJJJJJJJJJJJJJJJJHHJJJJJJJJJJJJJJJJJJJJJJJJ純合Koshihikari型H雜合Koshihikari型/MS-FR Koshihikari型如表3中所示,獲得的重組體8在S12564 Tsp509I標記位點、重組體9和10在C1361 MwoI標記位點對于粳稻是純合。所有這些重組體均恢復(fù)了育性,前者可認為重組位于Rf-1和S12564 Tsp509I位點之間而后者則認為重組是在Rf-1和C1361 MwoI位點之間,這表明Rf-1基因位于S12564Tsp509I和C1361 MwoI之間。有報告指出,在上述雜交中的具有BT型胞質(zhì)雄性不育的個體中,只有攜帶了Rf-1基因的花粉是可育的(C.Shinjyo,JAPAN.J.GENETICS Vol.44,No.3149-156(1969)),根據(jù)該報道Rf-1基因位點可在更詳細的連鎖圖譜上進行定位(圖4)。
      實施例1獲得靠近Rf-1位點的重組體(材料和方法)用MS-FR Koshihikari(BC9F1代,在Rf-1基因位點是雜合的)的花粉對MS Koshihikari(BC10F1代)進行授粉產(chǎn)生了由4103個個體組成的BC10F1群體,在S12564 Tsp509I和C1361 MwoI位點的基因型與參考實施例2中描述的相同。其中,在S12564 Tsp509I位點純合的Koshihikari個體,被認為是由于在Rf-1和S12564 Tsp509I之間發(fā)生重組所致,而在C1361 MwoI位點基因純合的Koshihikari個體,被認為是由于在Rf-1和C1361 MwoI之間發(fā)生重組所致。從這4103個個體的每一個體中提取DNA。
      (結(jié)果和討論)在這4103個個體中,發(fā)現(xiàn)了1個在Rf-1和S12564 Tsp509I之間發(fā)生重組的重組體和6個在Rf-1和C1361 MwoI之間發(fā)生重組的重組體。在上述參考實施例2中,如表3所示,已從1042個個體中獲得了1個在Rf-1和S12564Tsp509I之間發(fā)生重組的重組體和2個在Rf-1和C1361 MwoI之間發(fā)生重組的重組個體。
      因此從總數(shù)為5145個個體中總共獲得了2個在Rf-1和S12564 Tsp509I之間發(fā)生重組的重組體和8個在Rf-1和C1361 MwoI之間發(fā)生重組的重組體。在下面的實施例中對這10個個體進行高精度分離分析。
      實施例2染色體步行(1)第一次染色體步行(材料和方法)按照參考實施例1所述方法,用Lambda DASH II載體構(gòu)建了Asominori粳稻(不攜帶Rf-1)的基因組DNA的基因組文庫,并用染色體步行進行檢測。
      按常規(guī)方法,利用Asominori的總DNA為模板,及下述引物對進行PCR反應(yīng)5′-atcaggagccttcaaattgggaac-3′(SEQ ID NO29)和5′-ctcgcaaattgcttaattttgacc-3′(SEQ ID NO30)其中這兩條引物是按照RFLP探針S12564的部分堿基序列(AccessionNo.D47284)設(shè)計的。瓊脂糖凝膠電泳顯示擴增產(chǎn)物約1200bp,用QIAEXII(QIAGEN)進行純化。用Rediprime DNA標記系統(tǒng)(Amersham Pharmacia)對純化DNA進行標記,而形成了文庫篩選探針(探針A,圖1)。
      在噬菌斑印跡到Hybond-M+(Amersham Pharmacia)上之后對文庫進行常規(guī)篩選。通過平板裂解法用Lambda Midi試劑盒(QIAGEN)純化噬菌體DNA,分離單個的噬菌斑。
      (結(jié)果和討論)末端堿基序列分析和限制酶片斷長度分析結(jié)果表明篩選得到的4個克隆中的兩個克隆(WSA1和WSA3)具有如圖1所示的相對位置關(guān)系。通過引物步行(DNA Sequencer377,ABI)測定與WSA1和WSA3相應(yīng)的Asominori基因組堿基序列。
      (2)第二次染色體步行除了上述的Asominori基因組文庫外,還類似地自秈稻品種IR24(攜帶Rf-1)基因組DNA構(gòu)建了IR24基因組文庫,用染色體步行進行分析。
      按常規(guī)方法,利用WSA3的DNA為模板,及下述引物對進行PCR反應(yīng)5′-tgaaggagttatgggtgcgtgacg-3′(SEQ ID NO31)和5′-ttgccgagcacacttgccatgtgc-3′(SEQ ID NO32)其中這兩條引物是按照(1)中確定的Asominori基因組堿基序列來設(shè)計的。將所得524bp擴增產(chǎn)物進行純化,并用上面描述的方法對其進行標記,而形成了文庫篩選探針(探針E,圖1)。
      文庫篩選和噬菌體DNA的純化按上面描述的方法進行。
      (結(jié)果和討論)末端堿基序列分析和限制酶片斷長度分析結(jié)果表明通過篩選Asominori基因組文庫而得到的15個克隆中的1個克隆(WSE8)具有如圖1所示的相對位置關(guān)系。與WSE8相應(yīng)的Asominori基因組堿基序列通過引物步行進行測定。
      末端堿基序列分析和限制酶片斷長度分析結(jié)果表明通過篩選IR24基因組文庫而得到的7個克隆中的2個克隆(XSE1和XSE7)具有如圖1所示的相對位置關(guān)系。與XSE1和XSE7相應(yīng)的IR24基因組堿基序列通過引物步行進行測定。
      (3)第三次染色體步行(材料和方法)上述的Asominori基因組文庫和IR24基因組文庫用染色體步行進行分析。
      按常規(guī)方法,利用WSE8的DNA為模板,及下述引物對進行PCR反應(yīng)5′-gcgacgcaatggacatagtgctcc-3′(SEQ ID NO33)和5′-ttacctgccaagcaatatccatcg-3′(SEQ ID NO34)其中這兩條引物是按照(2)中確定的Asominori基因組堿基序列來設(shè)計的。純化獲得的擴增產(chǎn)物約1159bp,并用上面描述的方法對其進行標記,而形成了文庫篩選探針(探針F,圖1)。
      文庫篩選和噬菌體DNA的純化按上面描述的方法進行。
      (結(jié)果和討論)末端堿基序列分析和RFLP分析結(jié)果表明篩選Asominori基因組文庫而得到的8個克隆中的2個克隆(WSF5和WSF7)具有如圖1所示的相對位置關(guān)系。與WSF5和WSF7相應(yīng)的Asominori基因組堿基序列通過引物步行進行測定。
      末端堿基序列分析和RFLP分析結(jié)果表明通過篩選IR24基因組文庫而得到的13個克隆中的2個克隆(XSF4和XSF20)具有如圖1所示的相對位置關(guān)系。與XSF4和XSF20相應(yīng)的IR24基因組堿基序列通過引物步行進行測定。
      (4)第四次染色體步行上述的Asominori基因組文庫和IR24基因組文庫用染色體步行進行分析。
      按常規(guī)方法,利用WSF7的DNA為模板,及下述引物對進行PCR反應(yīng)5′-aaggcatactcagtggagggcaag-3′(SEQ ID NO35)和5′-ttaacctgaccgcaagcacctgtc-3′(SEQ ID NO36)其中這兩條引物是按照(3)中確定的Asominori基因組堿基序列來設(shè)計的。純化獲得的擴增產(chǎn)物約456bp,并用上面描述的方法對其進行標記,而形成了文庫篩選探針(探針G,圖1)。
      文庫篩選和噬菌體DNA的純化按上面描述的方法進行。
      (結(jié)果和討論)末端堿基序列分析和RFLP分析結(jié)果表明通過篩選Asominori基因組文庫而得到的6個克隆中的2個克隆(WSG2和WSG6)具有如圖1所示的相對位置關(guān)系。與WSG2和WSG6相應(yīng)的Asominori基因組堿基序列通過引物步行進行測定。
      末端堿基序列分析和RFLP分析結(jié)果表明通過篩選IR24基因組文庫而得到的14個克隆中的3個克隆(XSG8、XSG16和XSG22)具有如圖1所示的相對位置關(guān)系。與XSG8、XSG16和XSG22相應(yīng)的IR24基因組堿基序列通過引物步行進行測定。
      (5)第五次染色體步行上述的IR24基因組文庫用染色體步行進行分析。
      我們詳細瀏覽了TIGR(The Institute for Genomic Research)公共網(wǎng)址,發(fā)現(xiàn)在GenBank中已經(jīng)登記保藏包含RFLP標記S12564的BAC克隆(細菌人工染色體)(Accession NO.AC068923)。該BAC克隆包含Nipponbare粳稻的基因組DNA,經(jīng)序列比較顯示完全包括了在(1)-(4)中制備得到的Asominori和IR24的重疊區(qū)域(contig regions)。
      因此,按常規(guī)方法,利用IR24的總DNA為模板,及下述引物對進行PCR反應(yīng)5′-tggatggactatgtggggtcagtc-3′(SEQ ID NO37)和5′-agtggaagtggagagagtagggag-3′(SEQ ID NO38)其中這兩條引物被設(shè)計用于擴增該BAC克隆的部分序列。純化獲得的擴增產(chǎn)物約600bp,并用上面描述的方法對其進行標記,而形成了文庫篩選探針(探針H,圖1)。
      文庫篩選和噬菌體DNA的純化按上面描述的方法進行。
      (結(jié)果和討論)末端堿基序列分析和RFLP分析結(jié)果表明在篩選Asominori基因組文庫而得到的15個克隆中的1個(XSH18)具有如圖1所示的相對位置關(guān)系。與XSH18相應(yīng)的IR24基因組堿基序列通過引物步行進行測定。
      實施例3高精度分離分析(1)PCR標記P4497 MboI的確立將實施例2中所確定的IR24重疊區(qū)(SEQ ID NO27)相應(yīng)的基因組堿基序列與Asominori重疊區(qū)(SEQ ID NO28)相應(yīng)的基因組堿基序列進行比較,發(fā)現(xiàn)SEQ ID NO27的第1239位堿基是A,而相應(yīng)該位置的SEQ ID NO28的第12631位堿基是G。
      為了檢測該堿基的變化,首先利用下述引物通過PCR反應(yīng)擴增所述堿基位置的附近區(qū)域,得到片段約730bpP4497 MboI F5′-ccctccaacacataaatggttgag-3′(SEQ ID NO39)(相應(yīng)于SEQ ID NO27的第853-876位堿基)(相應(yīng)于SEQ ID NO28的第12247-12270位堿基)P4497 MboI R
      5′-tttctgccaggaaactgttagatg-3′(SEQ ID NO40)(相應(yīng)于SEQ ID NO27的第1583-1560位堿基)(相應(yīng)于SEQ ID NO28的第12975-12952位堿基)用MboI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從Asominori DNA擴增到的擴增產(chǎn)物中具有MboI識別位點(GATC)而能被MboI所切割,而從IR24 DNA擴增到的產(chǎn)物不具有MboI識別位點而不能被切割,這就導(dǎo)致了用MboI消化后的DNA片段長度存在差異。
      (2)PCR標記P9493 BslI的確立將實施例2中所確定的IR24重疊區(qū)(SEQ ID NO27)相應(yīng)的基因組堿基序列與Asominori重疊區(qū)(SEQ ID NO28)相應(yīng)的基因組堿基序列進行比較,發(fā)現(xiàn)SEQ ID NO27的第6227位堿基是A,而相應(yīng)位置的SEQ ID NO28的第17627位堿基是C。
      為了檢測該堿基的變化,首先利用下述引物通過PCR反應(yīng)擴增所述堿基位置的附近區(qū)域,得到片段約126bpP9493 BslI F5′-gcgatcttatacgcatactatgcg-3′(SEQ ID NO41)(相應(yīng)于SEQ ID NO27的第6129-6152位堿基)(相應(yīng)于SEQ ID NO28的第17529-17552位堿基)P9493 BslI R5′-aaagtctttgttccttcaccaagg-3′(SEQ ID NO42)(相應(yīng)于SEQ ID NO27的第6254-6231位堿基)(相應(yīng)于SEQ ID NO28的第17654-17631位堿基)用BslI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從Asominori DNA擴增到的擴增產(chǎn)物中具有BslI識別位點(CCNNNNNNNGG)而能被BslI所切割,而從IR24 DNA擴增到的產(chǎn)物不具有BslI識別位點而不能被切割,這就導(dǎo)致了用BslI消化后的DNA片段長度存在差異。
      該標記的建立適用于dCAPS方法(Michaels and Amasino 1998,Neff etal.,1998)。具體地說,通過利用上述P9493 BslI R引物而在SEQ ID NO27的第6236位和SEQ ID NO28的第17636位堿基處,用g取代a。因此,Asominori DNA中的片段在SEQ ID NO28的第17626-17636位堿基序列變成CCtttccttGG,而可以被BslI所切割。
      (3)PCR標記P23945 MboI的建立將實施例2中所確定的IR24重疊區(qū)(SEQ ID NO27)相應(yīng)的基因組堿基序列與Asominori重疊區(qū)(SEQ ID NO28)相應(yīng)的基因組堿基序列進行比較,發(fā)現(xiàn)SEQ ID NO27的第20680位堿基是G,而相應(yīng)位置的SEQ ID NO28的第32079位堿基是A。
      為了檢測該堿基的變化,首先利用下述引物通過PCR反應(yīng)擴增所述堿基位置的附近區(qū)域,得到片段約260bpP23945 MboI F5′-gaggatttatcaaaacaggatggacg-3′(SEQ ID NO43)(相應(yīng)于SEQ ID NO27的第20519-20544位堿基)(相應(yīng)于SEQ ID NO28的第31918-31943位堿基)P23945 MboI R5′-tgggcggcagcagtggaggataga-3′(SEQ ID NO44)(相應(yīng)于SEQ ID NO27的第20778-20755位堿基)(相應(yīng)于SEQ ID NO28的第32177-32154位堿基)用MboI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從IR24 DNA擴增到的擴增產(chǎn)物中具有MboI識別位點(GATC)而能被MboI所切割,而從Asominori DNA擴增到的產(chǎn)物不具有MboI識別位點而不能被切割,這就導(dǎo)致了用MboI處理后的DNA片段長度存在差異。
      (4)PCR標記P41030 TaqI的確立將實施例2中所確定的IR24重疊區(qū)(SEQ ID NO27)相應(yīng)的基因組堿基序列與Asominori重疊區(qū)(SEQ ID NO28)相應(yīng)的基因組堿基序列進行比較,發(fā)現(xiàn)SEQ ID NO27的第45461位堿基是A,而相應(yīng)的SEQ ID NO28的第49164位堿基是G。
      為了檢測該堿基的變化,首先利用下述引物通過PCR反應(yīng)擴增所述堿基位置的附近區(qū)域,得到片段約280bpP41030 TaqI F5′-aagaagggagggttatagaatctg-3′(SEQ ID NO45)
      (相應(yīng)于SEQ ID NO27的第45369-45392位堿基)(相應(yīng)于SEQ ID NO28的第49072-49095位堿基)P41030 TaqI R5′-atatcaggactaacaccactgctc-3′(SEQ ID NO46)(相應(yīng)于SEQ ID NO27的第45468-45625位堿基)(相應(yīng)于SEQ ID NO28的第49351-49328位堿基)用TaqI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從Asominori DNA擴增到的擴增產(chǎn)物中具有TaqI識別位點(TCGA)而能被TaqI所切割,而從IR24 DNA擴增到的產(chǎn)物不具有TaqI識別位點而不能被切割,這就導(dǎo)致了用TaqI消化后的DNA片段長度存在差異。
      (5)PCR標記P45177 BstUI的建立將實施例2中所確定的IR24重疊區(qū)(SEQ ID NO27)相應(yīng)的基因組堿基序列與Asominori重疊區(qū)(SEQ ID NO28)相應(yīng)的基因組堿基序列進行比較,發(fā)現(xiàn)SEQ ID NO27的第49609位堿基是A,而相應(yīng)的SEQ ID NO28的第53311位堿基是G。
      為了檢測該堿基的變化,首先利用下述引物通過PCR反應(yīng)擴增所述堿基位置的附近區(qū)域,得到片段約812bpP45177 BstUI F5′-acgagtagtagcgatcttccagcg-3′(SEQ ID NO47)(相應(yīng)于SEQ ID NO27的第49355-49378位堿基)(相應(yīng)于SEQ ID NO28的第53057-53080位堿基)P45177 BstUI R5′-cagcgtgaaactaaaaacggaggc-3′(SEQ ID NO48)(相應(yīng)于SEQ ID NO27的第50166-50143位堿基)(相應(yīng)于SEQ ID NO28的第53868-53845位堿基)用BstUI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從IR24 DNA擴增到的擴增產(chǎn)物中具有2個BstUI識別位點(CGCG)而被BstUI切割成3個片段,而從Asominori DNA擴增到的產(chǎn)物具有3個BstUI識別位點而被切割成4個片段,這就導(dǎo)致了用BstUI消化后的DNA片段長度存在差異。
      (6)PCR標記B60304 MspI的建立將實施例2中所確定的IR24重疊區(qū)(SEQ ID NO27)相應(yīng)的基因組堿基序列與上述的BAC克隆堿基序列(Accession No.AC068923)進行比較,發(fā)現(xiàn)SEQ ID NO27的第56368位堿基是T,而在AC068923中相應(yīng)位置的堿基是C。
      為了檢測該堿基的變化,首先利用下述引物通過PCR反應(yīng)擴增所述堿基位置的附近區(qū)域,得到片段約330bpB60304 MspI F5′-atcccacatcatcataatccgacc-3′(SEQ ID NO49)(相應(yīng)于SEQ ID NO27的第56149-56172位堿基)B60304 MspI R5′-agcttctcccttggatacggtggcg-3′(SEQ ID NO50)(相應(yīng)于SEQ ID NO27的第56479-56455位堿基)用MspI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從Nipponbare DNA擴增到的擴增產(chǎn)物中具有MspI識別位點(CCGG)而能被MspI所切割,而從IR24 DNA擴增到的產(chǎn)物不具有MspI識別位點而不能被切割,這就導(dǎo)致了用MspI消化后的DNA片段長度存在差異。
      該標記的建立適用于dCAPS方法(Michaels and Amasino 1998,Neff etal.,1998)。具體地說,通過利用上述的B60304 MspI R引物在SEQ ID NO27的第56460位用t取代g。結(jié)果,SEQ ID NO27的第56460-56463位的MspI識別序列CCGG變成了ccgt,而不能被MspI所切割。這樣,由于IR24的片段不具有MspI識別序列,而Nipponbare的DNA中與SEQ IDNO27的第56367-56370位堿基相應(yīng)的區(qū)域中具有一個MspI識別序列。
      (7)PCR標記B59066 BsaJI的建立將實施例2中所確定的IR24重疊區(qū)(SEQ ID NO27)相應(yīng)的基因組堿基序列與上述的BAC克隆堿基序列(Accession No.AC068923)進行比較,發(fā)現(xiàn)SEQ ID NO27的第57629位堿基是C,而在AC068923中相應(yīng)位置的堿基是CC。
      為了檢測該堿基的變化,首先利用下述引物通過PCR反應(yīng)擴增所述堿基位置的附近區(qū)域,得到片段約420bp
      B59066 BsaJI F5′-atttgttggttagttgcggctgag-3′(SEQ ID NO51)(相應(yīng)于SEQ ID NO27的第57563-57586位堿基)B59066 BsaJI R5′-gcccaaactcaaaaggagagaacc-3′(SEQ ID NO52)(相應(yīng)于SEQ ID NO27的第57983-57960位堿基)用BsaJI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從Nipponbare DNA擴增到的擴增產(chǎn)物中具有BsaJI識別位點(CCNNGG)而能被BsaJI所切割,而從IR24 DNA擴增到的產(chǎn)物不具有BsaJI識別位點而不能被切割,這就導(dǎo)致了用BsaJI消化后的DNA片段長度存在差異。
      (8)PCR標記B56691 XbaI的建立將實施例2中所確定的IR24重疊區(qū)(SEQ ID NO27)相應(yīng)的基因組堿基序列與上述的BAC克隆堿基序列(Accession No.AC068923)進行比較,發(fā)現(xiàn)SEQ ID NO27的第66267位堿基是G,而在AC068923中相應(yīng)位置的堿基是C。
      為了檢測該堿基的變化,首先利用下述引物通過PCR反應(yīng)擴增所述堿基位置的附近區(qū)域,得到片段約670bpB56691 XbaI F5′-cctcaagtctcccctaaagccact-3′(SEQ ID NO53)(相應(yīng)于SEQ ID NO27的第66129-66152位堿基)B56691 XbaI R5′-gctctactgctgataaaccgtgag-3′(SEQ ID NO54)(相應(yīng)于SEQ ID NO27的第66799-66776位堿基)用XbaI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從Nipponbare DNA擴增到的擴增產(chǎn)物中具有XbaI識別位點(TCTAGA)而能被XbaI所切割,而從IR24 DNA擴增到的產(chǎn)物不具有XbaI識別位點而不能被切割,這就導(dǎo)致了用XbaI消化后的DNA片段長度存在差異。
      (9)PCR標記B53627 BstZ17I的建立將實施例2中所確定的IR24重疊區(qū)(SEQ ID NO27)相應(yīng)的基因組堿基序列與上述的BAC克隆堿基序列(Accession No.AC068923)進行比較,發(fā)現(xiàn)SEQ ID NO27的第69331位堿基是T,而在AC068923中相應(yīng)位置的堿基是C。
      為了檢測該堿基的變化,首先利用下述引物通過PCR反應(yīng)擴增所述堿基位置的附近區(qū)域,得到片段約620bpB53627 BstZ17I F5′-tggatggactatgtggggtcagtc-3′(SEQ ID NO55)(相應(yīng)于SEQ ID NO27的第68965-68988位堿基)B53627 BstZ17I R5′-agtggaagtggagagagtagggag-3′(SEQ ID NO56)(相應(yīng)于SEQ ID NO27的第69582-69559位堿基)用BstZ17I處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從IR24 DNA擴增到的擴增產(chǎn)物中具有BstZ17I識別位點(TCTAGA)而能被BstZ17I所切割,而從Nipponbare DNA擴增到的產(chǎn)物不具有BstZ17I識別位點而不能被切割,這就導(dǎo)致了用BstZ17I消化后的DNA片段長度存在差異。
      (10)PCR標記B40936 MseI的建立下述PCR標記(10)-(12)的建立需要分析相應(yīng)于SEQ ID NO27 3′末端第76363位堿基的進一步下游區(qū)(3′)的堿基序列。
      下述引物對是按上述BAC克隆(Accession No.AC068923)的堿基序列來設(shè)計的。
      5′-tacgacgccatttcactccattgc-3′(SEQ ID NO57)和5′-catttctctatgggcgttgctctg-3′(SEQ ID NO58)利用這對引物以MS-FR Koshihikari(在Rf-1位點的基因型Rf-1 Rf-1)和Koshihikari的總DNA為模板以常規(guī)方法進行PCR反應(yīng)。所得到的擴增產(chǎn)物經(jīng)瓊脂糖電泳表明大小約1300bp,并用QIAEXII(QIAGEN)進行純化。用DNA測序儀377(ABI)對純化DNA的堿基序列進行測序,顯示出數(shù)個多態(tài)性位點。
      通過對所述位置周圍進行PCR擴增可以檢測到其中一個多態(tài)性位點,所用引物B40936 MseI F
      5′-acctgtaggtatggcaccttcaacac-3′(SEQ ID NO59)和B40936 MseI R5′-ccaaggaacgaagttcaaatgtatgg-3′(SEQ ID NO60)用MseI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動距離的差別來顯示,這是因為從MS-FRKoshihikari(Rf-1 Rf-1)的DNA擴增到的擴增產(chǎn)物中具有MseI識別位點(TTAA)而能被MseI所切割,而從Koshihikari的DNA擴增到的產(chǎn)物不具有MseI識別位點而不能被切割,這就導(dǎo)致了用MseI消化后的DNA片段長度存在差異。
      該標記通過利用dCAPs方法得以確立。
      (11)PCR標記B19839 MwoI的建立下述引物對是按上述BAC克隆(Accession No.AC068923)的堿基序列來設(shè)計的。
      5′-tgatgtgtttgggcatccctttcg-3′(SEQ ID NO61)和5′-gagataggggacgacagacacgac-3′(SEQ ID NO62)利用這對引物以MS-FR Koshihikari(在Rf-1位點的基因型Rf-1 Rf-1)和Koshihikari總DNA為模板以常規(guī)方法進行PCR反應(yīng)。所得到的擴增產(chǎn)物經(jīng)瓊脂糖電泳表明大小約1200bp,并用QIAEXII(QIAGEN)進行純化。用DNA測序儀377(ABI)對純化DNA的堿基序列進行測序,顯示出數(shù)個多態(tài)性位點。
      通過對所述位置附近進行PCR擴增,可以檢測到其中一個多態(tài)性位點,所用引物B19839 MwoI F5′-tcctaggctgtttagaaactgcaca-3′(SEQ ID NO63)和B19839 MwoI R5′-caagttcaaacataactggcgttg-3′(SEQ ID NO64)用MwoI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從的KoshihikariDNA擴增到的擴增產(chǎn)物中具有MwoI識別位點(GCNNNNNNNGC)而能被MwoI所切割,而從MS-FR Koshihikari(Rf-1 Rf-1)的DNA擴增到的產(chǎn)物不具有MwoI識別位點而不能被切割,這就導(dǎo)致了用MwoI消化后的DNA片段長度存在差異。
      該標記通過dCAPS方法來創(chuàng)建。
      (12)PCR標記B2387 BfaI的建立下述引物對是按上述BAC克隆(Accession No.AC068923)的堿基序列來設(shè)計的。
      5′-cactgtcctgtaagtgtgctgtgc-3′(SEQ ID NO65)和5′-caagcgtgtgataaaatgtgacgc-3′(SEQ ID NO66)利用這對引物以MS-FR Koshihikari(在Rf-1位點的基因型Rf-1 Rf-1)和Koshihikari的總DNA為模板以常規(guī)方法進行PCR反應(yīng)。所得到的擴增產(chǎn)物經(jīng)瓊脂糖電泳表明大小約1300bp,并用QIAEXII(QIAGEN)進行純化。用DNA測序儀377(ABI)對純化DNA的堿基序列進行測序,顯示出數(shù)個多態(tài)性位點。
      通過對所述位置附近進行PCR擴增,可以檢測到其中一個多態(tài)性位點,所用引物B2387 BfaI F5′-tgcctactgccattactatgtgac-3′(SEQ ID NO67)和B2387 BfaI R5′-acatactaccgtaaatggtctctg-3′(SEQ ID NO68)用BfaI處理擴增產(chǎn)物,通過瓊脂糖凝膠電泳進行觀察。這樣,所述變化通過在瓊脂糖凝膠電泳中泳動的差別來顯示,這是因為從的Koshihikari DNA擴增到的擴增產(chǎn)物中具有BfaI識別位點(CTAG)而能被BfaI所切割,而從MS-FR Koshihikari(Rf-1 Rf-1)的DNA擴增到的產(chǎn)物不具有BfaI識別位點而不能被切割,這就導(dǎo)致了用BfaI消化后的DNA片段長度存在差異。
      (13)分離分析在實施例1中獲得了在Rf-1和S12564 Tsp509I位點之間的2個重組體(RS1和RS2)和在Rf-1和C1361 MwoI位點之間的8個重組體(RSC1到RSC8),通過對上述(1)到(12)中創(chuàng)建的12個DNA標記位點的檢測來確定這些重組體的基因型。結(jié)果列于表4,其中顯示了在S12564 Tsp509I和C1361MwoI位點的每一個重組體的基因型。
      表4在Rf-1位點附近的重組體中不同標記位點的基因型基因座 RS1 RS2 RC1 RC2 RC3 RC4 RC5 RC6 RC7 RC8S12564 Tsp509I JJHHHHHHHHP4497 MboI JJHHHHHHHHP9493 BslI HHHHHHHHHHP23945 MboI HHHHHHHHHHP41030 TaqI HHHHHHHHHHP45177 BstUIHHHHHHHHHHB60304 MspI HHHHHHHHHHB59066 BsaJIHHHHHHHHHHB56691 XbaI HHHHHHHJHHB53627 BslZ17I HHHHHHHJHHB40936 MseI HHHHHHHJHHB19839 MwoI HHHHHJHJHHB2387 BfaI HHHHHJHJHJC1361 MwoI HHJJJJJJJJJ純合Koshihikari型H雜合Koshihikari型/MS-FR Koshihikari型表4顯示所有重組體具有來自秈稻中在P9493 BslI和B59066 BsaJI之間的Rf-1染色體區(qū)。結(jié)果表明重組體花粉具有如圖3所示的染色體組織結(jié)構(gòu),為可育性花粉,即Rf-1基因的功能在這些花粉中發(fā)揮著作用。這意味著可確定Rf-1基因功能存在的序列被包括在這些重組體花粉共同具有的秈稻區(qū)域中,即按最大可能性來估計它被包括在位點P4497 MboI和B56691 XbaI之間(約65kb)的區(qū)域內(nèi)。
      然而,存在這種可能,即對于Rf-1基因遺傳功能的表達非常重要的是,Rf-1基因只是秈稻基因型的一部分,而不管其余區(qū)域是粳稻還是秈稻基因型,其遺傳功能可能沒有明顯變化。因此,還不能得出結(jié)論認為上述的共同秈稻區(qū)域(SEQ ID NO27的第1239-66267位堿基之間)完全包含了完整的Rf-1基因。然而,基于以下分析,可以確定至少SEQ ID NO27完全包含了完整的Rf-1基因1)基因通常的大小為數(shù)kb而很小超過10kb;2)本發(fā)明鑒定的IR24的基因組堿基序列(SEQ ID NO27)完全包含上述共同秈稻區(qū)域;3)SEQ ID NO27的5′端位于上述共同秈稻區(qū)域的上游1238bp處,且構(gòu)成另一個基因的一部分(S12564);和4)SEQ ID NO27的3′端位于上述共同秈稻區(qū)域的下游10096bp處。
      實施例4來自XSE1的9.7kb片段的互補分析
      (材料和方法)用NotI對λ噬菌體克隆XSE1(圖1和圖5)進行完全消化,以瓊脂糖凝膠進行電泳。分離出的9.7kb片段(包括SEQ ID NO27的第1-9657位堿基)用QIAEXII(QIANGEN)進行純化。
      另一方面,以pSB11(Komari et al.,如上)為基礎(chǔ)制備具有潮霉素抗性基因表達盒的中間載體pSB200。具體地說,胭脂堿合酶終止子(Tnos)首先與泛素啟動子和泛素內(nèi)含子(Pubi-ubiI)進行融合。在獲得的Pubi-ubiI-Tnos復(fù)合體中ubiI和Tnos之間插入潮霉素抗性基因(HGY(R)),而構(gòu)建成了Pubi-ubiI-HYG(R)-Tnos。再將其與pSB11的HindIII/EcoRI片段進行整合得到pKY205。帶有限制性內(nèi)切酶如NotI、NspV、EcoRV、KpnI、SacI、EcoRI識別位點的接頭序列插入到該pKY205中Pubi的上游HindIII位點,獲得含有潮霉素抗性基因表達盒的pSB200。
      用NotI對質(zhì)粒載體pSB200進行完全消化,再用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上純化回收載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的兩個片段即來自XSE1的9.7kb和載體片段進行連接反應(yīng)。反應(yīng)后,用乙醇沉淀法回收DNA?;厥盏腄NA溶于純凈水(用Millipore系統(tǒng)制備),然后與E.coli DH5α細胞混合,進行電激。電激后的細胞與LB培養(yǎng)基一起在37℃下溫育1hr,涂布于含有壯觀霉素(spectinomycin)的LB平板上,并于37℃溫育16hr。從獲得的24個克隆中分離出質(zhì)粒。對質(zhì)粒的限制性內(nèi)切酶片段的長度模式及其邊界堿基序列進行分析,以選擇出轉(zhuǎn)化有預(yù)期重組質(zhì)粒的E.coli。
      上述選擇出的E.coli用于與根癌農(nóng)桿菌菌株LBA4404/pSB1(Komari etal.,1996)和輔助(helper)E.coli HB101/pRK2013(Ditta et al.,1980)進行三親雜配。在含有壯觀霉素的AB平板上形成6個克隆,從其中分離出質(zhì)粒,并分析其限制性內(nèi)切酶片段的長度模式分析以選擇出預(yù)期的農(nóng)桿菌細胞。
      根據(jù)Hiei等(1994)的方法,用上述選擇出的農(nóng)桿菌細胞轉(zhuǎn)化MSKoshihikari(具有BT細胞質(zhì)且在核心基因上與Koshihikari基本上是相同的)。用Koshihikari對MS Koshihikari進行授粉來獲得所需用于轉(zhuǎn)化的未成熟種子。
      適應(yīng)性培養(yǎng)之后,將轉(zhuǎn)化植物轉(zhuǎn)移到長日照條件的溫室中。將生長到適合移植的48株個體移植到1/5000a Wagner罐中(4株/罐),并轉(zhuǎn)移到短日照條件的溫室中繼續(xù)生長3-4周。抽穗后約1個月,對直立植株的種子進行育性檢測。
      (結(jié)果和討論)所有48個轉(zhuǎn)化植株個體都是不育的。這表明9.7kb插入片段至少沒有包含全長的Rf-1基因。
      實施例5對來自XSE7的14.7kb片段的互補分析(材料和方法)用EcoRI對λ噬菌體克隆XSE7(圖1和圖5)進行完全消化,用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,然后用DNA鈍化試劑盒(TAKARA)進行鈍化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收14.7kb片段(SEQ ID NO27中第2618-17261位堿基)。
      另一方面,用SacI對質(zhì)粒載體pSB200進行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化,并用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,用DNA鈍化試劑盒(TAKARA)進行鈍化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的兩個片段即來自XSE7的14.7kb和載體片段進行連接反應(yīng)。然后,根據(jù)實施例4中描述的方法制備轉(zhuǎn)化植物和進一步的研究。
      (結(jié)果和討論)所有48個轉(zhuǎn)化植株個體都是不育的。這表明14.7kb插入片段至少沒有包含全長的Rf-1基因。
      實施例6對來自XSF4的21.3kb片段的互補分析(材料和方法)用NotI對λ噬菌體克隆XSF4(圖1和圖5)進行部分消化,以瓊脂糖凝膠進行電泳。分離出的21.3kb片段(包括SEQ ID NO27的第12478-33750位堿基)用QIAEXII(QIANGEN)進行純化。
      另一方面,用NotI對質(zhì)粒載體pSB200進行完全消化,再用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收純化載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的兩個片段即來自XSF4的21.3kb和載體片段進行連接反應(yīng)。然后,根據(jù)實施例4中描述的方法制備轉(zhuǎn)化植物和進一步的研究。
      (結(jié)果和討論)所有48個轉(zhuǎn)化植株個體都是不育的。這表明21.3kb插入片段至少沒有包含全長的Rf-1基因。
      實施例7對來自XSF20的13.2kb片段的互補分析(材料和方法)用SalI對λ噬菌體克隆XSF20(圖1和圖5)進行完全消化,回收的DNA溶于TE溶液中,然后用DNA鈍化試劑盒(TAKARA)進行鈍化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上分離13.2kb片段(包含SEQ ID NO27中第26809-40055位堿基)另一方面,用EcoRV對質(zhì)粒載體pSB200進行完全消化,再用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收純化載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的兩個片段即來自XSF20的13.2kb和載體片段進行連接反應(yīng)。然后,根據(jù)實施例4中描述的方法制備轉(zhuǎn)化植物和進一步的研究。
      (結(jié)果和討論)所有44個轉(zhuǎn)化植株個體都是不育的。這表明13.2kb插入片段至少沒有包含全長的Rf-1基因。
      實施例8對來自XSF18的16.2kb片段的互補分析(材料和方法)λ噬菌體克隆XSF18與λ噬菌體克隆XSF20在5′和3′端(分別是SEQ IDNO27中第20328和41921位堿基)是相同的,但缺乏內(nèi)部第33947-38591位堿基。因此,它包含了SEQ ID NO27中第20328-33946位堿基和第38592-41921位堿基。這是因為XSF18克隆最初被分離時,分離后在擴增期間就發(fā)現(xiàn)包含上述缺失,因此重新進行了擴增步驟而克隆到了完整克隆,稱為XSF20。
      用NotI對λ噬菌體克隆XSF18(圖5)進行完全消化。在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收16.2kb片段(包含SEQ IDNO27中第38592-41921位堿基)另一方面,用NotI對質(zhì)粒載體pSB200進行完全消化,再用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收純化載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的兩個片段即來自XSF18的16.2kb和載體片段進行連接反應(yīng)。然后,根據(jù)實施例4中描述的方法制備轉(zhuǎn)化植物和進一步的研究。
      (結(jié)果和討論)所有48個轉(zhuǎn)化植株個體都是不育的(圖6)。這表明16.2kb插入片段至少沒有包含全長的Rf-1基因。
      實施例9對來自XSG22的12.6kb片段的互補分析(材料和方法)用NotI對λ噬菌體克隆XSG22(圖1和5)進行部分消化。在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收分離12.6kb片段(包含SEQ ID NO27中第31684-44109位堿基)另一方面,用NotI對質(zhì)粒載體pSB200進行完全消化,再用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收純化載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的兩個片段即來自XSG22的12.6kb和載體片段進行連接反應(yīng)。然后,根據(jù)實施例4中描述的方法制備轉(zhuǎn)化植物和進一步的研究。
      (結(jié)果和討論)所有48個轉(zhuǎn)化植株個體都是不育的。這表明12.6kb插入片段至少沒有包含全長的Rf-1基因。
      實施例10(1)對來自XSG16的15.7kb片段的互補分析
      (材料和方法)用NotI對λ噬菌體克隆XSG16(圖1和5)進行部分消化。在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收純化15.7kb片段(包含SEQ ID NO27中第38538-54123位堿基)。
      另一方面,用NotI對質(zhì)粒載體pSB200進行完全消化,再用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收純化載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的兩個片段即來自XSG16的15.7kb和載體片段進行連接反應(yīng)。然后,根據(jù)實施例4中描述的方法制備轉(zhuǎn)化植物和進一步的研究。
      (結(jié)果和討論)在47個轉(zhuǎn)化植株個體中,至少有37株個體明顯的恢復(fù)了育性(圖6)。這表明在來自水稻(IR24)的15586個堿基(包含SEQ ID NO27中第38538-54123位堿基)的15.7kb插入片段包括了全長的Rf-1基因。
      (2)對來自XSG16的內(nèi)部序列11.4kb片段的互補分析(材料和方法)用AlwNI和BsiWI對λ噬菌體克隆XSG16(圖1和5)進行完全消化,再用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,然后用DNA鈍化試劑劑盒(TAKARA)進行鈍化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳分離11.4kb片段,用QIAEXII(QIAGEN)進行純化。
      用SmaI對質(zhì)粒載體pSB11(Komari et al.Plant Journal,1996)進行完全消化,再用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收純化載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的兩個片段進行連接反應(yīng)?;厥盏腄NA溶于純凈水(用Millipore系統(tǒng)制備),然后與E.coliDH5α細胞混合,將混合物進行電激。之后,溶液在LB培養(yǎng)基一起在37℃下振蕩培養(yǎng)1hr,涂布于含有壯觀霉素的LB平板上,并于37℃溫育16hr。從獲得的克隆14個中分離質(zhì)粒。對質(zhì)粒的限制性內(nèi)切酶片段的長度模式及其邊界堿基序列進行分析,以選擇出預(yù)期E.coli。
      上述選擇出的E.coli與根癌農(nóng)桿菌菌株LBA4404/pSB4U(Takakura et al.,日本專利申請No.2001-269982(WO02/019803))和輔助E.coliHB101/pRK2013(Ditta et al.,1980)進行三親雜配。在含有壯觀霉素的AB平板上形成克隆中的12個,從中分離出質(zhì)粒,并分析其限制性內(nèi)切酶片段的長度模式以選擇出預(yù)期的農(nóng)桿菌細胞。
      根據(jù)Hiei等(1994)的方法,用上述選擇出的農(nóng)桿菌細胞轉(zhuǎn)化MSKoshihikari(具有BT細胞質(zhì)且在核心(nucleus)基因上與Koshihikari基本上是相同的)。用Koshihikari對MS Koshihikari進行授粉來獲得所需用于轉(zhuǎn)化的未成熟種子。
      適應(yīng)性培養(yǎng)之后,將轉(zhuǎn)化植物轉(zhuǎn)移到長日照條件的溫室中。將生長到適合移植的120株個體移植到1/5000a Wagner罐中(4株/罐),并轉(zhuǎn)移到短日照條件的溫室中繼續(xù)生長約1月。抽穗后約1個月,從每一植株中取一典型穗作為樣品用于評價種子育性(可育的谷粒數(shù)在總谷粒數(shù)中所占的百分比)。
      (結(jié)果和討論)在120個轉(zhuǎn)化植株個體中,有59株個體顯示了10%或更高的種子育性,其中有19株個體顯示了70%或更高的種子育性。這表明11.4kb插入片段(包含SEQ ID NO27中第42357-53743位堿基)包含了表達育性恢復(fù)功能所必需的Rf-1基因。
      (3)對來自XSG16的內(nèi)部序列6.8kb片段的互補分析(材料和方法)用HpaI和AlwNI對λ噬菌體克隆XSG16進行完全消化。用QIAEXII(QIAGEN)純化分離的6.8kb片段。
      后面的步驟包括質(zhì)粒載體pSB11的制備按在上述第(2)中所描述的方法進行。
      (結(jié)果和討論)在120個轉(zhuǎn)化植株個體中,有67株個體顯示了10%或更高的種子育性,其中有26株個體顯示了70%或更高的種子育性。這表明在6.8kb插入片段(包含SEQ ID NO27中第42132-48883位堿基)包含了表達育性恢復(fù)功能所必需的Rf-1基因。
      實施例11對來自XSG8的16.9kb片段的互補分析(材料和方法)
      用NotI對λ噬菌體克隆XSG8(圖1和5)進行完全消化。在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收16.9kb片段(包含SEQ IDNO27中第46558-63364位堿基)另一方面,用NotI對質(zhì)粒載體pSB200進行完全消化,再用乙醇沉淀法回收DNA?;厥盏腄NA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收純化載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的兩個片段即來自XSG8的16.9kb和載體片段進行連接反應(yīng)。然后,根據(jù)實施例4中描述的方法制備轉(zhuǎn)化植物和進一步的研究。
      (結(jié)果和討論)所有48個轉(zhuǎn)化植株個體都是不育的(圖6)。這表明16.9kb插入片段至少沒有包含全長的Rf-1基因。
      實施例12對來自XSH18的20.0kb片段的互補分析(材料和方法)用NotI對λ噬菌體克隆XSH18(圖1和5)進行部分消化。在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收20.0kb片段(包含SEQ IDNO27中第56409-76363位堿基)另一方面,用NotI對質(zhì)粒載體pSB200進行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收純化載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的兩個片段即來自XSH18的20.0kb和載體片段進行連接反應(yīng)。然后,根據(jù)實施例4中描述的方法制備轉(zhuǎn)化植物,并進行研究。
      (結(jié)果和討論)所有44個轉(zhuǎn)化植株個體都是不育的(圖6)。這表明20.0kb插入片段至少沒有包含全長的Rf-1基因。
      實施例13對來自XSG8和XSH18重疊區(qū)的19.7kb片段的互補分析(材料和方法)在實施例11中通過連接獲得的質(zhì)粒(XSG8SB200F),可從預(yù)期E.coli中分離該質(zhì)粒,用SalI和StuI進行完全消化。在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收12.8kb片段(包含SEQ ID NO27中第50430-63197位堿基)另一方面,在實施例12中通過連接獲得的質(zhì)粒(XSH18SB200R),可從預(yù)期的E.coli中分離該質(zhì)粒,用SalI、StuI和XhoI進行完全消化。在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠中分離6.9kb片段(包含SEQID NO27中第63194-70116位堿基)。
      進一步,用EcoRV對質(zhì)粒載體pSB200進行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)進行去磷酸化。反應(yīng)后的溶液在瓊脂糖凝膠上進行電泳,再用QIAEXII(QIAGEN)從凝膠上回收載體片段。
      用DNA Ligation試劑盒Ver.1(TAKARA)對上述所獲得的三個片段即來自XSG8的12.8kb、來自XSH18的6.9kb和載體片段進行連接反應(yīng)。連接產(chǎn)物包含19.7kb片段,其來自XSG8和XSH18的重疊區(qū)(包含SEQ ID NO27中第50430-70116位堿基)(圖5中的XSX1)。然后,根據(jù)實施例4中描述的方法制備轉(zhuǎn)化植株個體和進一步的研究。
      (結(jié)果和討論)所有40個轉(zhuǎn)化植株個體都是不育的(圖6)。這表明19.7kb插入片段至少沒有包含全長的Rf-1基因。
      序列表&lt;110&gt;日本煙草產(chǎn)業(yè)株式會社(JAPAN TOBACCO INC.)欣根塔有限公司(Syngenta Limited)&lt;120&gt;一種利用水稻BT-雄性不育細胞質(zhì)的育性恢復(fù)基因來賦予或控制育性的方法及鑒定育性恢復(fù)基因存在的方法&lt;130&gt;YCT739&lt;150&gt;JP 2001-285247&lt;151&gt;2001-09-19&lt;150&gt;JP 2001-309135&lt;151&gt;2001-10-04&lt;150&gt;JP 2002-185709&lt;151&gt;2002-06-26&lt;160&gt;68&lt;210&gt;1&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增R1877 EcoRI標記序列的寡核苷酸引物&lt;400&gt;1cattcctgct tccatggaaa cgtc24&lt;210&gt;2&lt;211&gt;33&lt;212&gt;DNA&lt;213&gt;人工序列
      &lt;220&gt;
      &lt;223&gt;用于擴增R1877 EcoRI標記序列的寡核苷酸引物&lt;400&gt;2ctctttctgt atacttgagc tttgacatct gac 33&lt;210&gt;3&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增G4003 HindIII標記序列的寡核苷酸引物&lt;400&gt;3gatcgacgag tacctgaacg 20&lt;210&gt;4&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增G4003 HindIII標記序列的寡核苷酸引物&lt;400&gt;4aatagttgga ttgtcctcaa aggg 24&lt;210&gt;5&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增C1361 MwoI標記序列的寡核苷酸引物
      &lt;400&gt;5aaagcaaccg acttcagtgg catcacc 27&lt;210&gt;6&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增C1361 MwoI標記序列的寡核苷酸引物&lt;400&gt;6ctggacttca tttccctgca gagc 24&lt;210&gt;7&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增G2155 MwoI標記序列的寡核苷酸引物&lt;400&gt;7gaccaccaat taactgatta agctggc 27&lt;210&gt;8&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增G2155 MwoI標記序列的寡核苷酸引物&lt;400&gt;8
      tttctggctc caataatcag ctgtagc 27&lt;210&gt;9&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增G291 MspI標記序列的寡核苷酸引物&lt;400&gt;9ctgctgcagc aagctgcacc gaaccgg 27&lt;210&gt;10&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增G291 MspI標記序列的寡核苷酸引物&lt;400&gt;10acattttttc ttccgaaact tccg 24&lt;210&gt;11&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增R2303 BslI標記序列的寡核苷酸引物&lt;400&gt;11
      atggaaagat acactagaat gagc 24&lt;210&gt;12&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增R2303 BslI標記序列的寡核苷酸引物&lt;400&gt;12atcttatata gtggcaggaa agcc 24&lt;210&gt;13&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增S10019 BstUI標記序列的寡核苷酸引物&lt;400&gt;13aacaatctta tcctgcacag actg 24&lt;210&gt;14&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增S10019 BstUI標記序列的寡核苷酸引物&lt;400&gt;14gtcacataga agcagatggg ttcc 24
      &lt;210&gt;15&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增S10602 KpnI標記序列的寡核苷酸引物&lt;400&gt;15agctgttgag agttctatgc cacc 24&lt;210&gt;16&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增S10602 KpnI標記序列的寡核苷酸引物&lt;400&gt;16tagccatgca acaagatgtc atac 24&lt;210&gt;17&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增S12564 Tsp509I標記序列的寡核苷酸引物&lt;400&gt;17ctagttagac cgaataactg aggttc 26&lt;210&gt;18&lt;211&gt;27
      &lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增S12564 Tsp509I標記序列的寡核苷酸引物&lt;400&gt;18tttgtgggtt tgtggcattg agaaaat 27&lt;210&gt;19&lt;211&gt;2240&lt;212&gt;DNA&lt;213&gt;稻(Oryza sativa L.)&lt;223&gt;PCR標記物G4003 HindIII&lt;400&gt;19gcggccgctc cgggaagtcg agcgagtaga cgcccctgac gccgtacgcg tcggcgagcc 60gcagcggcgt ctctggcggt gtgaaggaca gcccgttcag cgtcgcgcgg cgccgcccgt 120tgatcgtcac cggcgccgtg ctccgcagca ggtacgcctg cgtcacgttg atcgacgagt 180acctgaacga tccctgtggg ttcggcctcg ccgctccggc actcaggttc cacctgccca 240atgcaaaaaa ccaaaaccca aaagcttaat gcgaataata catcattcca cgtatttaaa 300aaaataattt ataggtaaaa tttttataat gtattttagc gacgtaaatg tcaatgctga 360gaaataaacg ataatacttt aaatgaagtt ctaaaattta aattttggca tcggttgatg 420ttggataaag aaaacgatgg aggctagtaa tttttcttct tttttaagta tctagattgt 480catatattga atttttcagt ttttcatccc tttgaggaca atccaactat tattttcctt 540ttcttatgta aaaggttgaa caacatattc aaacataaaa aaataaaatt aaatgaaata 600aatttacaat tcataaaatt tacagaattt atgttaagaa aatattcaaa cttagataat 660aataaagcaa caaaatcgta ctaaaaagaa gtataattgt acattgtata ctactactcc 720tacaatttta gacttagaat ttttaatttc ctgaaatcta gtaatgccat ttttttcttt 780ctagttgaac cagacagtaa gtttaactcg aaacttataa gctaatgagc gaagtcgggc 840aattcactcg tacctgacgg agcgagcttg gttcatggag aaggacttgt cgaactggtc 900ctggggaggg tcggggagcg ggccggaggc ccgcccccgg gagttggagt agcggaggac 960
      ggcgacgccg gcgacgcggc gccacacggt gtcgttcacc atgcgcgcgc tggcgacgac 1020gtagtagtcg gagctcgcgt tctggtcggt ggtgacgagg aaggagtagg actggccgac 1080gtggacgtcc aggttggtgt agttctgctg cgtcgtgtag gagccctccg tctccaccag 1140caccatgttg tgcccctgga tcctgaagtt gaggctcgtc gacgtcccca cgttgtgcac 1200tcggatcctg tacgtcttgc ctgtgtcccc acaccgacgt cgccgacaca cgcgcaaaag 1260ataatagact cattgtaagt aggtagtaac cttctccgtt tcatattata aatcgtttga 1320ttatattttt gttagttaaa cttctttaag ttttttttct ataaacttaa ttaaatctaa 1380agaattttaa taaaaaaaat caaacgactt ataatataaa atggatggag tagttgcatc 1440aatttgtgga tgaagcaaac aagattatat ccttttcatg agggtgaaag tattcagtga 1500acaattcgtc agtttcaagt ttcatgaaat cggacagggt ctctgaaagt ctgtattttt 1560ggtactgttg gattgactac tctggcttct gttgtcacat cttttgtatc ctagtttcgg 1620taaaaaaaat tttggcattt ttactcctat cgttgatctg tttaactgaa accattgcat 1680gatatactac tagcagacaa aactggtgaa aattcacgag aatgaacttt ttgtcagtta 1740agcattagcg gacagcttca gtaagcagag caggctgcct taaggcttaa agcactatct 1800tccacaacac tttgtcctac aatcaaattc caaatttact atcacaaaaa gcgaaggaac 1860taactaaacc ttactcctac tagtactact gctatgacta tgaaacaaga ttccaatcca 1920aagaaaacac agtgctcgat cagcatgata aaagcaacga aacctgctca tccagctgcc 1980aaaatgccac cccactgact ctacgtacgt actacgtatt gacgctgtaa aaaactagcc 2040gtagtacaga gaagaggacc caaagtttcg tcaaaaattt tattttaccc ggatccacat 2100tgatggtctc gtactcgatg ccggccggga caaggctgtc gttgtacctg tacgggccct 2160tgccgttaat cagcacgccg tccggcatcc cgaggtcctt gccactgtcc agcatcttcc 2220tcagatcctg caacgaattc 2240&lt;210&gt;20&lt;211&gt;2601&lt;212&gt;DNA&lt;213&gt;稻(Oryza sativa L.)&lt;223&gt;PCR標記物C1361 MwoI&lt;400&gt;20
      tcttgctgag atccaagttg cggtaacttt gcccttttct ttttttcttc tcttctgaat 60tttttcatgg tttttgggag agattttcgt aacttgatta cagttctagg aaaaggccac 120cttgttcaaa cagggctttc ttgaaaggga tcaatttgct aggagtacat gattctaaaa 180gcgatttcga aataaaacac agttctcgat ctcatacctg aaaacaaaag gcccatactg 240tgtaaactgt gattatgctt ctgttaaatg ggatatttgt acaaaattga cgccaaccac 300ctataaacag attgtgagct tttatcttag taaaataaaa tgtgacattc tactcagtgt 360tcagtgatcc gatgtcgtct cttctgcgta caacttctaa cagccgtttt cggtagtaca 420aactagcgaa acaccaaaaa cgcagcattt gagttctgga atacgctgaa attgttagaa 480tcaaccacga aaccaaaatc attgttcaga aacgttgcaa cgagataaaa cacaagaact 540tgttttaaca aagcatacgg acagtacata tacggttaca acacccagtc tttatacagt 600tctgctggag ttccatctac tggctgtcat tgtatctcag gacagacagg ttaacatagg 660tacaacacaa ttacaggcta aaccgaagcg aactacactg tcagcatctc taacagtatc 720gtcaagcaag cttatttaca gctgctctag taaatttaca acgtccctgg cagaatccct 780ctcgtttctg gcagcgacga ggcacggtcc atggccttag caggacatct cacccgtcag 840ctgcatagaa agcaaccgac ttcagtggaa tcacctcctg ctcctgcaaa aaagttggtt 900cgatcaatca cgcgtttaat ccaaaacaaa atgggtatta attatgctag cctatgaagc 960tacctcagag ttctctattt gctctgcagg gaaatgaagt ccagtggaac agttctcaag 1020cacctcaggg ctcttcatcc atgctttgtg tgcttcaatg gctttcagct tatagcgaaa 1080catctgcgat acggatctaa aattaaggat gtcgacaatt acttaacaca acaaataatt 1140gaagcaggtc cagttaaaga aaagtagcag cgaagaatag cactctgaag tctgaacctc 1200agataaagaa atggttggtt tttccagttc atctccctca acatggattc cagtaccctg 1260gcattctggg caaaggatgg atgttatttt cttaggtgca ttttttgcct ttcttcctcg 1320attgcttttt cccttgcttg caattttgtc tgctagcatc tcatattggc ataaaatagt 1380ccagtgcaca aggcaagaag tgtgaaacaa atgaaatgcc tgcaaaatta gccgtacaaa 1440gtcattggag gttgcagcag aatactacaa atttttaaag aagaaactat acactgtcta 1500tgttttgctt gaaatgaatt caaccacttt gcattatacg gtttggaatc cctggtttgt 1560gagaactgta attccattac aacagtgaag aagttaccat aactaatgaa tggaaattag 1620tcaaatgcct aattttttag gtttgcttta atttatttat ctgtgagaaa tgctaagcat 1680gtcatgcgtt gctatcttca agaaatacta agaaactgca aaggcaaaga atgtttgaaa 1740
      taacttaccc cgcttgagtt tctactgctg caggctagat ttcctgtctt gcagttgagc 1800aaggtagcta catccttttc aagaagcatt ggtcgcccac aaatatcaca agctttctca 1860gcagcaaggc gcttctgctt acgcaactcc ctcctcatag atttggtgga taagaggcca 1920acttgaagat tgtgtgaagt acctgtcggg gaacctgtta tgatagcttg gctattgtca 1980tgggcggagc tgctttgctc attcgactcc tctgaagatg cttcttgatc tgaaaatgac 2040ttctttcttc tctttccacg gtgtccagca tcatcaatca cgaagaaaga tccagcagag 2100ataggaaggt cctgatcatc agaagaccac ttcctgccca actcaattgt ataagagaag 2160ttgacaatgg caaagtcaga ttgctcatag gtgtcacact catccaagcc atgggagcca 2220tcctgtccta cccaagcaca ccagatcttg ctaatctttt tacttccttt gctagcttcc 2280cataacctgt atgcaatatt tccatatccc aaaagatgca caggcaaatc cgaaacaaca 2340tcctttagca atacactagg aataacgaga ggaccgtcag ttccactttg gtttgacagc 2400acatgatctt cagatacaga agcagttcta ccattaccat gcgcatttgc accacggcgt 2460gtgccttttg cgccattgcg agagctagaa tcatctctca acctcgaagt cacttcagtg 2520tcgttcgctg gaaccagagc cagctctctg gtgttctgcg agctcgagtc cagcaagagc 2580gggtccttct cgcgcgagtt g 2601&lt;210&gt;21&lt;211&gt;1333&lt;212&gt;DNA&lt;213&gt;稻(Oryza sativa L.)&lt;223&gt;PCR標記物G2155 MwoI&lt;400&gt;21ccctctgctt gatccagtgt acatccatgg gttaggacag attagttact cagttaatta 60agtgtgagac tggaaaaaaa tatctgacgg cagttttata agttgagtga ttgaactagt 120gaaagttcag ttaactgtca acggctgtag atttgggatg gcagactgtt ctgagtcaaa 180atgaagcttt tactgtgcgt ggttaccagg tgcagtaaaa taatttcaga tctaatcgca 240gtaaaaaaat gtagtactat atgttaagac gagattggtc ggtcaaaatc tatctggccc 300tttacatctc ccaaatgtta cctcagttgc aggtggtaaa aaaaaatcac tcgtttcacg 360tgatgtcggc agatcatgga ccatgtctca aatgctgaaa ctctgaacaa tcaacaaaaa 420
      aatccaacca gatgagctgt gcaactgata attgatcatc acactatttg caactcatct 480ttcatgtaga tggaacttca atcccgaaga aataatgaca gcaaaatgct gcgatcctga 540agaaaggatg gcggcaaaat ggcagcgata aaaaaaaaat ggttggttac tgaagaatta 600tttgtgcagc agttgagaca gtagcaagat aagagctagc taagctagct aggtagagtt 660ggatggaaga gtagtagtat gagatagagc atggagcgcg acaactcaag tggatgctaa 720agtaaaaggc attctcttct cttgtttgga atcagaaaag aaaagaaaag acttgagctg 780cttggctgga atgtttggtt ggatcatgcg cgctctcctt agcttagctc gccaagaaat 840cctcgcttca tctctctcaa taattcaaag ccacgagctc tctgctcata tccagtgcga 900cgattcccgt taatgcaaat gcattatatc cagttcgaaa tgttacaatt cttgcgtttg 960cagcaagcca gcaagtggtg tgaattgttt aatccctcgt gcatttcaac gaaattctct 1020cacaaattcg cattgacttc tttcttagca caattagtaa gcagtgacaa ataaagaatt 1080tttgaacagg atgtctttcc aaggaaggtg agatttttta tgtggatagc aaggatcgcc 1140tttccttagc atgaagagaa tgtgatcaac tttacacctt gcttacgatt atggccttaa 1200tttttgatac cctaaacagg agcacatcac atgcatgtcg acctgagacc accaattaac 1260tgattaagtt ggcatttcag atgcatccgt cagttacatg atcaggtgat cgatggatca 1320actgtaggtt tca1333&lt;210&gt;22&lt;211&gt;863&lt;212&gt;DNA&lt;213&gt;稻(Oryza sativa L.)&lt;223&gt;PCR標記物G291 MspI&lt;400&gt;22cgaacaggat caaaagtaga cgacgagggc atttagaagg agaggaattg tatttgttcc 60cggtatttaa tttttaaatt tgtggtcgga agtttcggaa gaaaaaatgt gctcatgagt 120gattattggc tctgaacacc aacctctctt ttcgttgatt ccttctgagg tgttgggtgt 180tgggacacga tgctgccgcc gacacgacac cgggttccac aatacactaa tctactcgcg 240acaccttcat tgaactgcat ataattattt agaaagtcca ttaacacatc ttataaaacc 300ttgttgaatc atataatcat tctataaagt ctatttgaac atcttatgaa aaaataagat 360
      ctgacctagt cgttacactc tcttacattt tccattagcc taactaattc cgtgcaggaa 420acgcccaaaa ataatagtac caatagtcca ctaatcccgt gccagaggcc gccaatgatt 480agtgattaac ccaaaaaaca taatcatcat cacacgccgc taatgaccag ctctcgctta 540gctcatccca caggcggccc ccacacgcca ctcctgccat gtgggcccac ctttcacacc 600ccccaccaac cagaaaaaaa actcccccaa aaaaaaaact tttaatgctt atctcgcggc 660agtataaaag gcgaccccac cacccacaca caatcacagt cagcgaccca acccaacccg 720agccgaggag tcgagtcgtg tgaaaattac gaaattgccc ttcgactcca ccaccaccac 780ccaccggcga ggcgaggaga ggagaaaaat tgggaggaaa aaaaaaggga aaaagaaaaa 840gggtggagga gatttttgcg aag 863&lt;210&gt;23&lt;211&gt;1510&lt;212&gt;DNA&lt;213&gt;稻(Oryza sativa L.)&lt;223&gt;PCR標記物R2303 BslI&lt;400&gt;23tgccatgaag acctatggaa agaatatctt cttctcactc tgtgaatggt gagtttactc 60tctgtaacat ttagggctag gtcgaaggaa catgaagcat tgctgattca ctccactgtg 120tttttttttt ctgtataggg ggaaagaaaa tcctgctaca tgggcaggcc gcatgggtaa 180cagctggaga acaactggcg acatcgccga caactggggc aggttctact catcctctct 240ttaaccctgt ttacatagtt cttgagtttt tcagtactga tcgtaattgc cctgttattt 300cagtatgaca tctcgtgcag acgaaaatga ccaatgggct gcctatgctg gacctggtgg 360atggaatggt aagaacttga gatgtatctg ttcctaggtt gcttaaccat ttgagagctt 420caaaatgatc aacatatgtt tctgctgtgc aatatcagat cctgacatgc ttgaagtggg 480aaatggtggg atgtctgaag ctgagtaccg gtcacacttc agtatctggg cactagcaaa 540ggtaccatag catgttctat gtactaataa ttttgctgca atgttgaact tctttgcatt 600tcctcactgc aagttttgct tgaattgttc aggctcctct tttgatcgga tgcgatgtgc 660gctcaatgag ccagcagacg aagaacatac tcagcaactc ggaggtgatc gctgtcaacc 720aaggcaagcc ttctcagttt cacatgctta gatttagcca tacctcttgg atatttcacc 780
      atactcataa tgtaactctc tgaacagata gtctaggtgt ccaaggaaag aaagtacaat 840ctgacaacgg attggaggta tcccttcaat ggcttccaaa tttgcagttt ctcattgtcc 900cataagcctt ggcatgatca tgactaactc tgaagctgac aatactttgt gtaaatttgt 960cggtaggttt gggccgggcc actcagcaac aacaggaagg ctgtggtgct ctggaacagg 1020cagtcatacc aggcaaccat cactgcacat tggtcgaaca tcgggctcgc tggatcggtc 1080gcggtcactg ctcgtgatct atgggcggta aagcctttgc tttcttcaga gctcaaagta 1140gaacatcttc tcttcagaat tcagagttca taacaaattt ctgtcaattg tgcagcactc 1200ttcgttcgcg gctcagggac agatatcagc atcggtggcg cctcatgact gcaagatgta 1260tgtcttgaca ccaaactagt cagcaaagaa aagcagcaca ggttagtacg tgtccggcga 1320atacagctaa attgatcagg attcaggaag aaggtttgca atttgcaagg attggtagag 1380ctggaaatgg gatgccattt ggttatgtat gtagaaataa gctgtaagcc tgtaagcgta 1440tatgtaatca gccgtcaaat gctggcgagt gtatttctga agtttgcaac gaaagttgca 1500gcaataaaaa1510&lt;210&gt;24&lt;211&gt;1016&lt;212&gt;DNA&lt;213&gt;稻(Oryza sativa L.)&lt;223&gt;PCR標記物BstUI&lt;400&gt;24tggggattct tttctttaag caatttaaca ttattgtcct aacaatatac acaatattgg 60tttttctttc agtatcaaat aattctttta cttttgaaaa cacatttgca atgtgttgga 120aacacaatta tatcttgcac ttccttttgg aaatttaatc atttgaaaac tgattcgcgt 180ttcatggctg taatcttctc ttgcgaacat cgctctttct ttgatggttc tctgttgaga 240agaagagcaa ccaagtaaat tttcgaaatg tttttttgtt ctttctattc accattgcag 300gttgtcaaag ccatcgagaa ggccataccg attccgagag cgcaacccat tgccttggat 360ggcccagcaa gggaagagct gaaggccatg gaggcgcaga aggtcgagat cgaccgcacc 420gcggcgctcc aggtgcgccg tgagctttgg ctggggctgg catacctcgt cgtccagact 480gccggcttca tgaggctcac attctgggag ctctcatggg atgtcatgga acccatctgc 540
      ttctatgtga cctccatgta cttcatggcc ggctacacct tcttcctccg gaccaagaag 600gagccctcct tcgagggctt cttcgagagc cggttcgcgg cgaagcagaa gcggttgatg 660cacgcccggg atttcgatct ccgccggtat gacgagctcc ggcgagcctg tggcctgccg 720gtggttcgga ctccgacgag cccctgcaga ccgtcgtcgt cgtcgtcgtc gtcttcgacg 780caggagagcc attgccattc ttactgccat tgccaatgat ctttgtgctg ttctgttctg 840ttgtcagaat tttttcatgc ccagtttatg ggggttaagc tagcttctcc attgtaccgt 900tctgatgtgc ggatgatgcg atgcaaagca tagtttgttg aagagatgac aaggcagatt 960ttagcttgaa aacctggagg tgagaaaaaa aaatcctgat gtgtttgtgt gtgtga 1016&lt;210&gt;25&lt;211&gt;676&lt;212&gt;DNA&lt;213&gt;稻(Oryza sativa L.)&lt;223&gt;PCR標記物S10602 KpnI&lt;400&gt;25accaccttca tatgaagaaa ttaacggtgt tttcatgagg aatccaacag tcgctgaatt 60ggtggaaact gtggaattct tcttggctga ggtaaccaat catcacttca ccacaatgca 120caagtttgta gcttactact acagtacttc taataagttt tgtctgttga gattttattg 180ctgatttcta tgcatggtca tctttttgac aggccatcca gtcttatcgt gctgagagtg 240aaactgagct caacctggca gctggtgact atatagttgt ccggaaggta cggccctatc 300ttcccattgg acatgtttct aaccataaac atatctttgc tggacttttg tgggcaaagt 360tggctacact aaacttgtgt tcattaacct gctcaatcag gtgtcaaaca atggatgggc 420agaaggtgaa tgcagaggga aagctggctg gttcccttac gactacatcg agaaaaggga 480ccgtgtgctt gcaagtaaag tcgcccaggt cttctaggcg ttcaatgagc catacataca 540taaccctggt gttgtacact gtattatgat cgttcgtgat cttcaaagac cctctgatca 600gagaaatcac aaatattctt ttgttctatt attgtcatta tcactacccc ttttgtcaaa 660accagtgcag cctttt 676&lt;210&gt;26
      &lt;211&gt;1059&lt;212&gt;DNA&lt;213&gt;稻(Oryza sativa L.)&lt;223&gt;PCR標記物Tsp509I&lt;400&gt;26gcgagatcat gaacttgatt ttctggttgc catattgggc ttgcttgtta accttgtaga 60gaaggatagc cttaataggt aagtccctca catgcttcct tccatttgct caattcatat 120cagtgttact gttctggcag ttccttgggg tcaggactca gaaacatcca attaatgttc 180atgttctctt aacgactcag aaatacttta taacctctcc acagggtacg gctttcatct 240gcccgtgttc ctgttgatct atctcagaat ccacagagtg aagagacaca gagagatgtc 300atagcactcc tctgttctgt attcttagca agtcaaggtg ctagtgaagc ttctggaact 360atatcaccgg taattcaaaa ttcttcaagt tccttttgta tgtagattat atctttgtaa 420aactcggcat ttattacctg ctctttgttt caaaaagcag tattttattt tgctccttag 480cataggtcag cagaacagtt gatcttattc agaaaacaat attttgcatg taacatactg 540ttatctatga gatgaaaatt aatgcatgtg taataatgtc aatgataaat atttgctatc 600tgaatccagt ctaccaactc tagttagacc gaattactga ggttctattt caaagaataa 660tttagtgcac catttgttca actactatga agtaaaatgg tattcccttc tattgacatc 720gggttagaag tgaaaggcca tcttaatgcg atgttctcaa tgccacaaac ccacaaattt 780cattaacaca tacagattat tattaacata gctataaatt ggatttccag aagcttgagt 840tgaatttatt ttgttacaat tgaaagcact gggaacatta gcattttttt ttagttcttg 900gttattgcaa tttataatgt tatacagaac tgtgtacctc acaatgcatt cattatgaca 960ttctatgaac catttgattg actgttgctt gtaaacaaca ggatgatgag gagtctttga 1020tgcaaggagc acgggaagct gaaatgatga tcgtagagg 1059&lt;210&gt;27&lt;211&gt;76363&lt;212&gt;DNA&lt;213&gt;稻(Orza sativa)IR24&lt;400&gt;27
      gatcaactaa caacctcttt gcagcaaaaa agcatacaca caagtgtttg tcttggcctg 60gggctctgca gatggactga tactctgacc tgcagtgggc ttgggagcta acaatggttt 120cattcttttt ttttttatgt tttcccctgt tgtttttgct catgttttgt gtaatttttt 180cttctcatct agcgatgtta tttttcttag catgatggga gtagccctcc tttttttttc 240tctaattaag tgtaaagtag caacagcata gggatgaatg ttcagtgtag tgtgtggtgt 300ttcagttatt cagagacgtc catacagttt gtaccttgtg accacacgtc ttaatctgat 360gaagcttaga ataaatcaca tgttagcaat gcaatatcat ctgcgtcttc tctcactttg 420gtggccatca aattctgtgt agaagtgtat ggttggtgtg ctgttgcaaa tgccgtattc 480cgctctgttt tgtggaagtt aagaagtccc tagttgaaat accgattttt catgatctcg 540gagattgatg caactctgat tgcagcattt ctttttatta gaatgtacac tccatgctat 600catgatgttt attgtttagt actacaagat ttggttaacc attattttaa tatcataata 660attttataaa atcttggagt aacaagttca taatacatga tagcataact ttttgaggct 720agtctatgta tattgtctcc tttgttttta aactaagcac tcaataaatt attgatggct 780gtaattttct gaaggtttca ccggtttcgg cccgtgcttt ataaatagct tcggcacaaa 840agacaaaacg gtccctccaa cacataaatg gttgagttta cgttttcatt atctttggta 900aaatcaagtc caccacgtag acactcataa caaaagtttg aatatcctca gaaattttga 960cttgagtcta tcttaccttt gatatcggac atccaaccct ccctccctcc ctgaacttta 1020tattattcat attacacctg aactttatat tattcatatt acaccctgaa gtggttttca 1080tttaattgca tacatgctga aatagtttga caacgtgaga tgcactaaaa atctacacgt 1140tcgtcttaag ttgcaattca ttttatccct tttctttttc tctcttacat aggaatatca 1200atagtactaa ttcacattac aatatagtat aaattggtaa tcgattattg gcaatatact 1260atattaaata ttcaaaacta gtcatttaag ctgccaaata agtaaaccac tatcgaaaac 1320cacaatataa atggcattac aaaacttagg gggttgaata tccaatttta aagttcatga 1380tgctagagga atttctatca aaagtttatg ggtacatatg gactttttcc tttttaaaag 1440aagctattct tgtcgtaaac gttaaatatt ttttgtactt tattttttat gattgaaaaa 1500aaaacttagt tttcaaaatg attggtctgt atacaagcat caattagact taataaattc 1560atctaacagt ttcctggcag aaactgtaat ttgtttttgt tattagacta cgtttattat 1620ttcaaatatg tgtacgtata tctgatgtga caaccaaacc caaaaatttt ccctaactcc 1680atgaggcctt acagatatat ttgatgggtg taaagttttt taagttcttt gggtgcaaag 1740
      tttttaaagt atacggacac acatttgaag tattaaatat agacaaataa caaaacatat 1800tacatattct gcctgtaaac aacgagacaa atttattaag cctaattaat ctgtcattag 1860caaacgttta ctgcagcatc acattgtcaa atcatagcgt aattaggctc aaaaatattc 1920gtctcgtaat ttacatgcaa actgtgtaat tggttttttt ttcgtcaaca tttaatactc 1980catgcatgtc caaatatttg atgcgatctt tttggccaaa ttttgttgga atctaaacaa 2040ggatcaaatt tgctgaattt ttccagacgt cacggcttgt tcatccatcg ttcgcatcgc 2100gattcgccac cgacgccttg gtttccaacg aattttatca tccgcttaaa tacatccaaa 2160gctctccatc gccatcggcg gccaacggcg accgctccgc tctacccaat ccacccatcc 2220actcgccgcc gccccctgat ccaaagcctc cgccgcgccg ccgtcgagag gaggaggagg 2280aggaggagga ggaggcgtga gcccctatgg ggaccctcct ccggccgcgt ccgcttgccc 2340acgccgccgg cgccggcgac gccacgccgt cgaccgcgca cggtagccac gcgcctctcg 2400agaggccccc cccccccgcc gctcgctgat ctctcttctc atcctgtttg ggtttgggtt 2460tgtgatttgg gtgttttttt tttttccgca gcggtggtgg tgagcggtgg ccgcggccgt 2520ggcgtggagt gccagccgca tcgggtgcgc cgccgcccgg gtccgcaggt tgcggtggcg 2580acggcgagct ggaggaggcg gagggagacc gtggtgagat cggatttcgc cgctggtggt 2640gccgctacca tgggggattc gccgcaggcg ctctcaggtt tgcagcctcc tccactctct 2700tctcgcaaaa tgtgttgcta tgttcctctc gctgggctgg cctcatagcc attaatgtag 2760tttgctggaa cattacattc ggaacgttgt tggcaattgc ttgacaaaat gtggaattgt 2820ggaggggaga aaaatcgttt gaacctgcag tgacaaaatt gccatctata attttaaaac 2880tgaaggtgtg gaaatcaaac ataatcattg ccagcacatc attcttgtta accaccttga 2940catattgttg gcttataaca gttagctcca caccaacttg gaaggtgtca atggaatgta 3000agtataaatt gaggataact ggcagttgtt aagactttct acagaacttg tagcagctaa 3060aactagctat tgtgcattta tgtttcatgg aatttgagcg gcaatggata tttcttacta 3120agacgtataa tgcaaaaaaa aaaaaaaaac tatgtctatg cagtttacat gtaatgtgcg 3180gatgcaaata aaatcatgtt catggacaaa ctaatgggat tcataccaaa ttccagaatt 3240gcatttctta tgtggttact tttgtttgtt gatttggtta ccagacatcg atgtggtttc 3300aagggtcaga ggggtttgct tctacgcggt gactgcagtt gcagcaatct ttttgtttgt 3360cgccatggtt gtggttcatc cacttgtgct cctatttgac cgataccgga ggagagctca 3420gcactacatt gcaaagattt gggcaactct gacaatttcc atgttctaca agcttgacgt 3480
      cgagggaatg gagaacctgc caccgaatag tagccctgct gtctatgttg cgaaccatca 3540gagtttcttg gatatctata cccttctaac tctaggaagg tgtttcaagt ttataagcaa 3600gacaagtata tttatgttcc caattattgg atgggcaatg tatctcttag gagtaattcc 3660tttgcggcgt atggacagca ggagccagct ggtatggctg tagtctcatc cctgctttct 3720taagtagaca tatatacatt tacagtattt ggtaaataaa caagatttta tgaatcatat 3780atgattttgg ggaaaacaca aaactctctt tgttggctgc cttgaacata gttctgttca 3840cacagttata gcaccttctt taaaatgaag aactttgttg catacacata aggccaaacc 3900acataatgaa ttttgtttat ttctatcttt gaatgttagc atcgtttttg tttaatgcat 3960gatcgccttc ctatatattt gtagtatgtc aacattgtat tccatgctga gcataacaaa 4020tggtttgtta aaattcagga ctgtcttaaa cggtgtgtgg atttggtgaa aaaaggagca 4080tctgtatttt tctttccaga ggggactaga agcaaagatg gaaagctagg tgcatttaag 4140gttcagtaac caaacttagg ttacattaca tctaatgaga tttttatatt cagtatataa 4200tgttaacctt ctcatggtgt actgacgtgg ttataaatgt ccccagagag gtgcattcag 4260tgtggctaca aagaccggtg ctcctgtgat acctattact cttctcggga cagggaaact 4320gatgccttct ggaatggaag gcatccttaa ttcaggttca gtaaagctca ttattcacca 4380tccaattgaa gggaatgatg ctgagaaatt atgttctgaa gcaaggaagg tgatagctga 4440cactcttatt ctaaacggtt atggagtgca ctaaagaaag atggtgtttt tttttattat 4500atggaaccta ttcaaaggca cagacaggct ttcaaggcta agcttgttac aggtactgat 4560actagttact aattactttc gtaatcagta taaataagct tgtgtagtgt aatggcattg 4620tacatttctg cacttggtaa atttacagaa gaggcaagta atattttaga ggattgagtt 4680tattcaccca gtcatatagt tgaagaggca agtaacctgt aagagaggac tgaacattaa 4740cacctcttgt tcgattaaaa atgaccaaag agcatcaaac atgtattcga ggctgttact 4800ttagatatgg cccattaatt tgtttagttg tctatgtaca tcctagttgg tgtaaatgcc 4860agttaccatt tctatgatct aaaacaatca actcttttag tatattttca aaaacgaaat 4920tcagtacaca tgtatgaatc ttaatattct tctctagctc gttacaaaag caacaaaggc 4980accgtgtcag ctggttcaca ttagctagtt tgtacttagc attatccact agcaccttat 5040tttcatgcat atcatgctaa tttgcttgcc cacgttgagt gggaattttt ttcatgtttt 5100ataatttata tatgttttag acttctagtc cacaatttat gtacttcatg ttcctgagcc 5160tctagtatgg ctgatagcag actaggtgct gagtgctgtc cttttttgca gactgaagag 5220
      agaagaaata caagactgtc cattgttagt cagatttgta aaaatagact ctgatgtagt 5280ttacttttgc ccctatttta tttttaacaa tacaaatata taacagatcc taagaactta 5340tcttaattta ggagaagttg ctcgtttcat taaattaaat tgtgaagtaa aaatgtgtgc 5400tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg gcaggccagg 5460attgaacact gaatggtaag actgcttctg ccttcagacg ttattgctaa atttttagct 5520acttgcagtt agtgctgcca cgccgattaa gcagtagaac aaagtagttt tgtcgtgcac 5580aaatgagtta tatttcattg gaaatcgaag cgaaaacgaa tcaaaagtta gaagaaaagg 5640ggaaacttgg taattactcc ataaagagag tgcattttat tggtaagatg gtatccggaa 5700gctgtgagct ccgggctgta tgtattctgg caaatttgat atgagatgct cgattattgg 5760cttaagttag cgatatcaaa tttggggaag caccaaagga attattgtga aggagttatg 5820ggtgcgtgac gttatctgct aggttcaaat ccttgtggct atgaatattt atctgctagg 5880ttcaaatcct agtgactatg aatattaatg ggtaaggtaa gggatttatt gttaatttta 5940gtttctttaa gattgtgcca tcggacgcca ttcggtaact gtaataatgc tttgtattgg 6000attcacttgt gttacatgca cgcactaaac atgtgcttta ccttttcatc tgtttttgcg 6060ttctgggcta gaaactcaaa cgttgaattt tccatggtct gctcaacttg acaattactg 6120cgtgtcaagc gatcttatac gcatactatg cgcacaagtg attgtatacg gatatgatga 6180cagtataacg tgtgatattg atttttttaa taaaaaaatg atgttcattt ccttgatgaa 6240ggaacaaaga ctttttttaa aagaagggta ttactaaaaa caaaaatgac aaaaacaaaa 6300tatcagtgca catggcaagt gtgctcggca attttttctc tgtactttaa acaaaaatac 6360ttctatatgt tcttttttat aagggtggca caaatctttt aaatgagcca aatatctaca 6420ttggatttat taaaaactgt ataaattata atttatactc tgaaaggttg tgtgcatctc 6480tcttggagaa aatgtataag ttgcaaacaa acattaatcc acgttatgta actttttttc 6540gccggaaagg ccgaaggagg cctgacggag cgtggggctc ctcaccggga gaccgcgcag 6600gccccccttt gccggttcgg ccggggactc agggtgaaat tctaagctct ctgtatgtgg 6660aaggttcgcg accgtcgaaa gagcataaga cacgggcgat gtatacaggt tcgggccgct 6720gagaagcgta ataccctact cctgtgtttt gggggatctg tgtatgaagg agctacaaag 6780tatgagccag cctctccctt gttctgggtt ccgaatctgg aaaagtccag tccagtcccc 6840ccctctaagt gggcaaggtc ctccttttat atcttaaggg gataccacat gcaccatctc 6900cctcctttct gtggagactt accctacctt ttcataaatg gacggagatt tgtatagttg 6960
      ccgtccgaat gaccttctga taggacggcc catacctacc tccacttccg ccgaaagcag 7020gtgcgacgtg ggattatggc tgtctgctga cgacatgacc agtgtcagac tggtcacaaa 7080ttgctcattc ctgtccacca cgcgtcagtt tagcaatcta catgttggcc cttcttcaca 7140caacatcttg cctgtaatgg ttaggatgaa gcctggcata tatctaacca ggactaacgt 7200gccatctcta ggaggtaaca cgctagctcc agctggggac gagcgcctag aagccctcgt 7260cctgacggga tggggcgagg cgtgcgtcag atcgcctgtc gccacctaac ctgcgatctg 7320accggtctgt gactggtcac agaccggata aacgagtgca ctgcacttcg ttacatgcag 7380cgtgacacgc tcagccaaac cgcaataaat gtggttaggt gagccccgct gtgctcacct 7440aacccataca cgcggagcaa aaacccacga ggggtcgggg cgcctcggcc ctcggggccg 7500aggcgggtgc ggtccgaccc cctcgggggg actaagagga gggcgaacac atcaccctcg 7560ggcccgacgt cccccgaggg tgccaggcca cgtgggcgat tgtgtctgcc tcaaacctct 7620agtcatgata ctcctgatcc catgtcaccg acagtagccc ccggcgttat gccagggcga 7680tcgccctctt taagggaagc ggtcgggcgt gacgccactc ctaaggcctg gtgacaggtg 7740ggaccggtct ccacaattgg gcagaaaccc aacggtcaca aatcacgcac atcggcaatg 7800gtaactctac tatcaataat gagcggtctc ttcaagactg ccacattact cgagtagcac 7860acgaatctgg acatggcgat tcgtttcgtc tggagatatg gtaacgtcgc tttggtcggc 7920gagcgtaatt aacgcgcgca cgatatgatc tatctcgact gccacaaccg catatccacc 7980tcatgcgccg caagcgggcg aatgggatta gtggaagcgt gggcgcgaga aacgaggggg 8040cgaaatagtg ggcgcgagaa gcgaggagcc gggcacagcg ttggcaagag tataaaggca 8100ctgaggaaag gatctgtttc cttcctttcg ccatcatttc ccttgtcttc gccgcttgcg 8160ccctaactcc ttctttcctg tgctctactt tcgccacacg cgctcgctct caatcttctc 8220ttcctccggc gccatggcac ggggctccgc tctgctcgat ggtagcgtgc tgccgccttc 8280ccgcatcgtg agcgagaggc aggctgggct gccgcgccgc ttcatgccgg aatctgccac 8340cggccgggag atagtcacgc tgggcgaggg acgcccggcg ccagactacc cggggcggtc 8400cgtcttcttt ctcccctttg caatggcagg gctggttccg ccattttctt ctttcttcat 8460ggatgttctg aagttctacg atctccagat ggcgcacctc acccccaacg cggtgatgac 8520attggccatc ttcgcgcatc tgtgcgagat gttcattggg gtgcgcccat ctcttcggct 8580gttccggtgg ttcttcaccg tgcagtcggt gtcgccgcca tcggtagttg gtggctgcta 8640cttccagcca cgggggccgg tgctgaatcg ctacatcccc tgcgccctcc gcaagaagtg 8700
      ggacgactgg aagagcgact ggttctacac ccccctcgcc gacgaagcgc gcctccgact 8760tccgagccag cccccggcgc aggcctccag ctggcgggcg ccggtagatc tgggggatgg 8820ctatgacgcc gtcctcgacc gcctggcggg cctacgatcc caggggctca cagggaccat 8880ggtgtacggc gactacctcc gtcgtcggat tgcgccgctc cagcggcgcg ctcggggcgc 8940ctgggagtac accgggtccg aagactacat gaggacccac cagggagtca gatgggactg 9000ggctcctgag gatttcaaga tagtggtcca acgggtgctg aatctcaact ccatggaggc 9060gtccctcatt ccccaaggaa tcctccctct ctgcagcgat ccagaccgcg cctccatcct 9120gaccattatg acggcggtcg gggcctcaga ggagtgagct ccaaagggcc acgacggcgc 9180aggcgggagc cgtagggggg atcaatctac ccggggaggg ggtcgtgctt ctgggtctcg 9240cgacggaggc ccgaggagca gccgccctgc cgacgcccgg gggaagagga agcagggagg 9300aacacctccc ccatctcctc cccgaggggg cggggcggtg cgtgccagca gcaggcgccc 9360ggagggggcc gcgccgacat cgcagcccga gggggagcgc aagaagaagc ggctccgcaa 9420gatgggggag acagaaccat ctcagggaaa ccttatttcc cctctaaagt ggtcgtttaa 9480ccgaccccct cgcaggttcg tctctcaccc atcgtggctg tattcattct ctcaacgcga 9540gttttcactc acccatcttg ttcgtcttct ggtcttttct tctgtttcag cgagatcccg 9600tcgcgtccct cccgccattc caagtccggc cagtctgagg ccgaggatcc ggcggccgca 9660gaggcccgga ggcgggaatc tgaccggcga gaggccgcgg atcgcctacg ggaagccgag 9720gaggccgccc aggaggccgc ccgggctcgc caggtcgagg aaaccgctcg ggaggaggcc 9780gcccgggccc gccaggccga ggaagccgct cgggaggagg ccgcccgagc ccaccaggcc 9840gaggaagccg ctcgggagaa agccggattt cgccaggacg aggcaatggc gacttccgag 9900gcagctcgcg atgaggtcgc gggcgcgtcg cttgagccca cttcctcggg cgacgctcag 9960gcgacaactt ccggggcagc tggcgacgag gctgcgggcg cgtcgcttgg gcccactccc 10020tcaggcgacg cccaggacca accaggtccg agggacatcc ctgagtccgg cacttccatc 10080ggcggcccga gccgcgtggc atcctctcca aggcggctct tccccacgcc ttctatcgcc 10140ccactgagcg cagagcccct tctgcaggcc ttggccgccg caaacaccgc ggtgttggac 10200gggcttagtg cccaggtgga ggccctgcaa gcagagtggg cggagctcga cgccgcgtgg 10260gcgcatgtcg aggaggggcg gcgctcagtg gaggccatgg tggaggtggg ccgcaaggca 10320caccgccggc atgtctcgga gcttgaagcc cgtaagaagg tgttggcgga aatcgccaag 10380gaagtggagg aggagcgggg ggctgccctc attgccacca gcgtgatgaa cgaggcgcag 10440
      gacaccctcc gccttcaata cgggagctgg gaggcggagc tagggaaaaa gctcgacacc 10500gcccaggggg tgcttgacgc tgccgctgcc cgagaacagc gggcggggga gaccgaagcg 10560gcgtcccgac ggcgcgaaga gacccttgag gcgcgcgcca tggcgctgga agagcgcgcc 10620tgcgtcgtgg agagggatct ggcggaccgc gaggccgccg tcactatccg ggaggcaaca 10680ctggcggcgc acgagtccgc ctgtgccgaa gaggagtccg cactccgcct ccacgaggac 10740gcgctcaccg agcgggagcg agctctcgag gaggccgagg ccgcggcgca acggctggcg 10800gacagcctgt ccctccgcga ggcagcgcag gaggagcagg cgcgccgcac tctggaatgt 10860gtccgcgccg agaggaccgc actgaaccag caggccgctg acctcgaggc gcgggagaag 10920gagctggacg cgagggcgcg cagcgacggg gcggctgcgg gcgaaaacga cttagccgcc 10980cgcctcgctg ctgccgaaca taccatcgcc gatctgcagg gcgcgctaaa ctcgtccgcc 11040ggggaggtcg aggccctccg cttggcaggc gaggtagggc ccggcatgct ttgggacgcc 11100gtctcccgcc tagatcgcgc cggtcggcag gtgggcctct ggagagggcg gaccgtaaag 11160tacgccgcca accatggagg cctcgcccag cgcctctcga agatggccag ggctctccaa 11220cggctccccg aggagctcga gaagacaatt aagtcatcct cgagggacct cgcccaagga 11280gcggtggagc tcgtactggc gagttaccag gccagggacc ccaatttctc tccatggatg 11340gcgctggatg agttccctcc tgggaccgag gacagcgcgc gcgcaggtcc gggatgccgc 11400cgaccatatc gtccacagct tcgagggctc agcccctcgg ctcgcgttcg cccccaactc 11460cgacgaggag gacaatgccg gtggtgcaga cgacagtgac gatgaggccg gcgacccggg 11520cgtatcggat tgatccccca agcccccgcc attctttagt tttttcttct tttccttctt 11580ctaaggcctt cgggcctctt ttttgtatag atcaacttaa tctgtaatca aaaatgaaga 11640aatttttgtg tcaatttcat cttgctgtgt gtatgagatg aggatgatct gtgacgtggt 11700ccttttgcgt cttagcttga ttaagggctc gtgcccaggt cccagtcctc aaaaggcgtg 11760ggtcggggct agtgcctggg gagatccaca tgtcgagact ggccaggccg ggaacgtggt 11820gaccgagggt tatgggtgac ccgattgtgg gtttttgccg attccccccc ggagttcacc 11880acgccccggg gcacggctcg gttctgggcc ccgtttggcg attttagccg acccgagccc 11940ccgagggcag gattgagcac gagtgaccta tttcaagtca agattcttca aaaggaaaaa 12000aaaacacaga tacagccttt aggaaattga aactgctttt attgaaatac tgaaataaga 12060gaaataagaa tgtgcatgtg tggcagcccc cggccaacgc tgcacgcccg agggggtgcg 12120gggttggccc gagcccgaaa cctgacaccc gacccccccc tcaggggtag aagcgacgaa 12180
      ggtgttcgat gttccacggg ttaggcagct caatgccgtc gcccgtggcc agccgtatgg 12240agcccggccg ggggacgccg accactcgat acggaccctc ccacattggt gagagcttgc 12300tcaatccagc acgcgtttgg acgcggcgta ggacgaggtc gtcgacgcag agtgatcggg 12360cccggacgtg acgctgatgg tagcgccgca ggctctgctg gtagcgcgcg gctctgaggg 12420ccgcgcgccg ccttcgctct tccaagtagt cgaggtcatc tctgcgaagt tgatcttgat 12480cagcctcgca gtacatggtg gcccgaggag acctcagggt gagctcggat gggagaaccg 12540cttccgcgcc gtagacgagg aagaaaggcg tttccccggt tgctcggctt ggtgtagttc 12600ggtttgccca gagcaccgct agcaactcct cgatccatga atcgtcgtgc ttcttgagta 12660tgttgaaggt cttggtttta aggcctttga ggatttctga attggcgcgc tccacttggc 12720cattgcttct ggggtgggca ggtgaggcga agcagagctt gatgcccatg tcttcgcagt 12780agtcgccgaa gagttcacta gtgaattggg tgccattatc cgtaataata cggttaggca 12840ctccaaaccg ggccgtgatg cccttaatga atttaagtgc ggagtgctta tcgatcttga 12900cgaccggata agcctcgggc cacttagtga acttgtcgat cgcgacatac agatactcaa 12960acccgcccgg ggcccgccta aacggtccca ggatatcgag cccctagaca gcaaatggcc 13020acgaaagtgg tatggtctgc agggcctggg ccggctgatg gatttgcttg gcgtggaatt 13080gacacgctct acatcgccgg accaggtcga ccgcatcatt gagagctgtc ggccaataga 13140aaccctggcg aaaagcttta ccaaccaagg tgcgcgaggc ggagtgggct ccgcattcgc 13200cttcatggat atcggcaaga agcacaacgc cttgttcccg aggaatgcac ttcaggagga 13260ttccattagc cgcgcgccga tagagggtcc cttctaccag cacgtagcgt ttggagatgc 13320gatggacgcg ttcactccct tcgcggtcct cgggtaaagt cttatctgtg aggtatgctt 13380ggatctcggc aatccaagca atcaatctaa gggagctggg agcgctcccc tcgggtcccg 13440aggcctggac ttcgacgggc ctcgggggcc ggtcaggcgc gtccgtctcc cctaaggggt 13500cgggtcgcgc cgacggctgg gcaagccttt cttcaaaggc gcccggtggg gtctgggctc 13560gcgtggacgc gagccgtgag agttcgtcgg caatcatgtt atcccgtctg ggcacatgcc 13620gaagctcaat cccgtcaaaa tggcgctcca tacgccgtac ttggcgcacg taggcgtcca 13680tctgcgggtc agagcaccgg tactccttac agacttggtt aacgaccagc tgggagtcgc 13740ctaacaccag gaggcggcgg atccccagtc cagctgccac tctgagtccg gcaaggagtc 13800cctcgtactc tgccatattg ttagtcgctc gaaagtcgag gcggaccaag tatctgagga 13860cgtctccgct cggagaggtc aacgtgaccc ccgcaccggc gccctgaaga gacagggagc 13920
      cgtcgaactg cattacccag tgggcggtgt gaggcagctg cgaggggtcc gtgctggcct 13980cggggattga gacgggctcg ggagccgggg tccactctgc cacaaaatcg gcgagagcct 14040ggctcttgat agcgtgacgt ggttcaaagt gcaaatcgaa ctcagaaagt tcgattgccc 14100atttcaccac ccgtcctgta ccctctcgat tatgcaagat ttgaccgagg gggtaagacg 14160taaccacagt gacccgatgc gcctggaaat aatggcgcag tttcctcgag gccatcagaa 14220tagcgtaaag catcttctgg gcctgagggt atcgggtttt ggcgtcccgg agggcctcac 14280taacaaagta gacgggccgc tgcacctttc ggtggggccg atcctcttcg ctaggggccg 14340catccctggg gcactcttcg tccaagcagc ctcgcggggc gcacttgtct tctgtgctga 14400tgacctcggg gtcggaggat aacaggggcg gccttcccac agtggctttg gggccgtcct 14460gggggtcagg ggctcctggc gtcgtcggac aagcgggcaa agggccaact ccggtcgtca 14520ggggccttag gcctccgttc ggctcggggg cctcttctcc ctgctctttc ccgggtcgag 14580tcagcacagg gttagcctcg gggtcaaagg gcgataggtg cggccttccc acagtggcct 14640cagggccttc ctgggggtcg ggggctccta gcaccgtctg acaagcgggc agagggccaa 14700ctccggtcgt cgggggcctc aggccaccgt tcggctcggg ggcctctcct ccctgctctc 14760tcccgggcca agtcggcaca gggtggggaa gcgcgaaatg agaattatcc tcatcgcgct 14820ccacaaccaa tgccgcacta actacttgcg gggtcgccgc taagtagagt agcaagggct 14880cgtctggctc cggggcgacc ataactgggg gagagcttag atacgccttc aactgggtga 14940gggcattttc agcttccttc gtccaggtaa acggtccgga gcgtttgaga agcttaaata 15000agggtaacgc cttctctccc agcctcgata tgaaccgact tagggcggcc atgcaaccgg 15060tgacgtattg cacatcccta agtttgctgg ggggcgcatc cgctctatag cccgtatctt 15120ctcggggttg gcctcaatgc cccgggcaga gaccaagaac ccgagaagct tgcccgcagg 15180tacaccgaac acacacttat cggggtttaa ttttatgcgg gcggagcgga gactctcaaa 15240agtttccgct agatctatga gtaacgtttc ctggttgcgc gtctttacaa ccaagtcatc 15300gacataagcc tcaatattac gtcctaattg gctaccgaaa gaaattcgag tagtacgttg 15360aaaagtagga cctgcattct ttaacccgaa gggcattgtc gtataacaat aggttcctat 15420gggggtaatg aacgcagttt tttcctcatc ctccctagcc atgcgaatct gatggtaacc 15480agagtatgca tctagaaaac acaaaaggtc gcaccccgca gtggagtcga caatctgatc 15540tatgcgaggc agggggtaag gatccttagg acatgccttg ttaaggtcgg tgtagtcgat 15600gcacatccga agcttgccgt tcgccttggg aacgaccacc gggttcgcca gccactcggc 15660
      ggggttgacg ctgccatcat atttttcggc gatggtgggc cggaaccttg ggggccaacg 15720gacattccga agactcgcca caaaggctct acagccgaca ccaccaaccg ggggcacgga 15780gggctgattc ccgcgtccgt gttgaggtga cactctggac gaggaagcgc cctccgttgc 15840gtgggcagca cttcggtcat tacgccggcg ctcgatgctg gtgcgggcgt ccggcccccc 15900acgcagatct ttctgggtcg aaggagtcga cgaaggagtg gcggccgaat ggcgaacagc 15960ggctgccgct cgtcgtgccc tccgtcttga cgacgcggag ccggtggtag cagcaccaga 16020ggccttggtg gcggaggacc gcccaccagc atctaggcgc tgccgtgccg tcatgactaa 16080tttggccacg tcgtccagcc atcgttgggc tggagactcc gggtcaggga cgacaggcgg 16140gtgacgtaag agcgcgcccg cagcttggag cgcgccctgg ggcgtgctgc cgtcgccgta 16200gacgaggagg cgacgctccc catctcgccg ttcttctcca tcgcccgcga tcggtgaagt 16260cgcggatctt tcgaccctct cgagcgcctc cccccgctta ggactttggc atggagggag 16320cggtggagta cgagctcgac ggcgtgggtt cggctccccg tcgtcgccac tcacactcgg 16380agagaggtcg tgcgcctttg cttgctcggc catcaggctg aacaggaaaa gcttggcgca 16440cacggaagag tacgagagct cagaaaaaca cacactgagt cccctacctg gcgcgccaga 16500tgacggagcg tggggctcct caccgggaga ccgcgcaggc ccccctttgc cggttcggcc 16560ggggactcaa ggtgaaattc taagctctct gtatgtggaa ggtttgcgac cgtcgaaaga 16620gcataagaca cgggcgatgt atacaggttc gggccgctga gaagcgtaat accctactcc 16680tgtgttttgg gggatctgtg tatgaaggag ctacaaagta tgagccagcc tctcccttgt 16740tctgggttcc gaatctggaa aagtccagtc cagtccagtc cccccctcta agtgggcaag 16800gtcctccttt tatatcttaa ggggatacca catgcaccat ctccctcctt tctgtggaga 16860cttaccctat cttttcataa atggacggag atttgtatag ttgccgtccg aatgaccttc 16920tgataggacg gcccatacct acctccactt ccgccgaaag caggtgcgac gtgggattat 16980ggctgtctgc tgacgacatg accagtgtca gactggtcac aaattgctca ttcctgtcca 17040ccacgcgtca gtttagcaat ctacatgttg gcccttcttc acacaacatc ttgcctgtaa 17100tggttaggat gaagcctggc atatatctaa ccaggactaa cgtgccatct ctaggaggta 17160acacgctagc tccagctggg gacgagcgcc tagaaaccct cgtcctgacg ggatggggcg 17220aggcgtgcgt cagatcgcct gtcgccacct aacccgcgat ctgaccggtc tgtgactggt 17280cacagaccgg ataaacgagt gcactgcact tcgttacatg cggcgtgaca cgctcagcca 17340aaccacaata aatgtggtta ggtgagcccc gctgtgctca cctaacccat acacgcggag 17400
      caaaaaccca cgaggggtcg gggcgcctcg gccctcgggg ccgaggcggg tgcggtccga 17460ccccctcggg gggactaaga ggagggcgaa cacatcaccc tcgggcccga cgtcccccga 17520gggtgccagg ccacgtgggc gattgtgtct gcctcaaacc tctagtcatg atactcctga 17580tcccatgtca ccgacaaggc catccgaatg tattaaggag taaaagttac aagaaaaaac 17640accataatgc accaatgtgc atgaccacac accatacact acccccaagc acaaaccact 17700gagggtgaag cctagcacca aacgaccgcc actaagtgtg accaaacgcc gctaggccta 17760cggcagcaac acatagatga gacttcgaaa acgatgccac caaggtggtc acgacatcta 17820ggatgctgcc atcgtccatc taaaaagatg tggttttcac ccagagaaac tcatcaagaa 17880ggggagaggg taacccttga cagcgcccca aggaggttac gacgcccgaa ggcgtagccg 17940ctgccggtcc ggtgaaccac cggactaggc ttccgcctag gaccctatag ccttgatcgc 18000agatcaccgt ccaccactca gaaccaccac acagacaaaa ggtagcacgt agcttccacc 18060acaccgcacc gacgcccctt cgtcggccga ctccatcgaa ccaccatccc tgagagctgg 18120cccaggaccc ctccgttcca ccacccgccg gccgccttgc cagttttggc caaaggagaa 18180cccgggactg ggtgacattg cttcggcagc ctgagcttcc cccgctggcg agctgctgtc 18240tcaatccaac ctagaaactc cccgcaaaag aaggggatga gctctaggaa gggcgagggt 18300gccgaccggc aacgaggaag acaacccatc gactccagct ccctttgcac taccatctgg 18360ccctgcgcca atgccggata cgctgtcgct ccggctccgg cgccacccac ctgcaccccc 18420tttgcctggt ctccgcgccc ctcctggctg cgtcgcgccg cccagctggc cgctaagggc 18480accgcgacgg ccgcccggct accgaggcct ggccgcgcca tgggacagct cgcgctggca 18540ccagcgagcc acggccgtcg cgctgttgcc ggcgccagcg agcacaaccg ccagctccaa 18600gggccgagca tgccactgag ccgccgccgc tgccgcccgg gccggctgca cgtcaccggc 18660gcacacgacc gcacgccgcc acgctccgcc tccgcgcccg aggcagcccc atgccattgc 18720cgcgcacctc gcccgcccgc tgccgagccg ccaccgcgca ccttgctgag ccgccaccgc 18780cgtccctagc cgcctcgtgc cgccgccacg ccagatccag gcgcgggatg gccggatccg 18840gccttggggg cgccggatcc accgcctccc cacaccgcca cggcgtcacc acctccgacc 18900gcagtgaggg cttcgtcgtt tgccccatcc tcatcgcgtc gaggaggaag acgccaagaa 18960aaaagggcct cgccgctgcc ttccttgctc gctgccggct tcgccgccgg cgagctccgg 19020cggcggcgag gtgggggaga agaagtgggg agtgggcagc tagggttttt tcgcccccca 19080agccgcccgt gcgagagcga cggtgggggg gggggggact ttccaacctc ttccagtgtt 19140
      ctagttctcc acgttatgta actcaatttg tttaaccata gaaagtaaga aacctaccag 19200cgtgttaagc tctctttcat tccctttctt cttcctggtt ttgcttccat cacatgtcaa 19260gtgaagggtt cttaactacc attactccta cacatctaat ttttttctca gatctttcgc 19320aggtatatat tgatgctaca ttttatgatc ttaagataat ctccttcaca ttaccctctg 19380ctgaaacttt agcttgaacc gtcatcttca ccacaatttg agcccaattt gcacagagca 19440caacgagcaa tagcttgccc ttacgttcat tatttagcat gaactactac taactaccca 19500agaatcaata caccggttta ataacgccat tttatcacgt taatatatgt ttcattcaac 19560acaccggttt tggcacagtt gcaaacttgc aataaattct ttcctacttc tccatcccat 19620aatataacaa attggtatgt ctcgtctggt actaagttac tatattatga gatggaggga 19680gcacttcttt tcttccaaaa tataagaata tagtattgga ttagatatta tctagattca 19740cgaattcgat taggttgtct agatttatag ttgtatgtaa tgtataattc ggtaataggt 19800tattacctct caggatggag ggagtagttt tgactttttt tttcttataa atcgctttga 19860tttttatatt agtcaaattt tatcgagttt aactaagttt atagaaaaaa attagcaaca 19920tttaagcacc acactagttt cattaaattt agcatggaat atattttgat aatatatttg 19980ttctgtgtta aaaatgctgc tatatttttc tataaacgta gtcaaattta aataagttag 20040actaaaaaaa atcaaaacga cttataatat gaaatggagg aagtagtaga ctataacaaa 20100tttaaaccgt gctttgattt tagagcatca ctaatatgtt agcaataatc tatccctaaa 20160atttattttt tttcctaaac tgaaaatagg aagtggaaat actcctccat ctaagagaga 20220gcctaaattc aataaaaaac taaaaaacta aaggtggatc cctctattaa actaccgcaa 20280aaaatttatg ttttttttct cttccacgcg cgcagaacag atatctcgat caagttagca 20340tgtaaaattt ttaaagagat accttatacg actccttccg tatttccaaa agcaaacgga 20400tttaaaatct gactcaaata aagatctata tatccaattt acatgacaca tgtttcgccg 20460aatttttata ttaataataa ttaatatttt taaaattaaa ttattagcaa tttgtttgga 20520ggatttatca aaacaggatg gacgttgttt ataacagcgt ctagacctag acgcgcttgc 20580aaactgcggc caccctttta tcacacaaat ttttgacaat ttgacacttt ccaaaaatta 20640attttataaa ttaaccgtga ccaaaactta tttaaaaatg atctttttgt tgagcgcaaa 20700atcgtatact tcagcgccaa atagcacggc gccgacctcc cccttcccct cccctctatc 20760ctccactgct gccgcccacc tctccgtatc agctgcgtcg cgttggtttc cgccggcgct 20820gctgctgctg caccagtccg ctagggcggg cgggcatggc gcgccgcgcc gcttcccgcg 20880
      tccgcgccgg cgctgttggc gcccttcgct cggagggctc gacccaaggg cgagggggcc 20940gcacgggggg cagtggcgcc gaggacgcac gccacgtgtt cgacgaattg ctccggcgtg 21000gcaggggcgc ctcgatctac ggcttgaact gcgccctcgc cgacgtcgcg cgtcacagcc 21060ccgcggccgc cgtgtcccgc tacaaccgca tggcccgagc cggcgccgac gaggtaactc 21120ccaacttgtg cacctacggc attctcatcg gttcctgctg ctgcgcgggc cgcttggacc 21180tcggtttcgc ggccttgggc aatgtcatta agaagggatt tagagtggat gccatcgcct 21240tcactcctct gctcaagggc ctctgtgctg acaagaggac gagcgacgca atggacatag 21300tgctccgcag aatgacccag cttggctgca taccaaatgt cttctcctac aatattcttc 21360tcaaggggct gtgtgatgag aacagaagcc aagaagctct cgagctgctc caaatgatgc 21420ctgatgatgg aggtgactgc ccacctgatg tggtgtcgta taccactgtc atcaatggct 21480tcttcaagga gggggatctg gacaaagctt acggtacata ccatgaaatg ctggaccggg 21540ggattttacc aaatgttgtt acctacaact ctattattgc tgcgttatgc aaggctcaag 21600ctatggacaa agccatggag gtacttacca gcatggttaa gaatggtgtc atgcctaatt 21660gcaggacgta taatagtatc gtgcatgggt attgctcttc agggcagccg aaagaggcta 21720ttggatttct caaaaagatg cacagtgatg gtgtcgaacc agatgttgtt acttataact 21780cgctcatgga ttatctttgc aagaacggaa gatgcacgga agctagaaag atgttcgatt 21840ctatgaccaa gaggggccta aagcctgaaa ttactaccta tggtaccctg cttcaggggt 21900atgctaccaa aggagccctt gttgagatgc atggtctctt ggatttgatg gtacgaaacg 21960gtatccaccc taatcattat gttttcagca ttctaatatg tgcatacgct aaacaaggga 22020aagtagatca ggcaatgctt gtgttcagca aaatgaggca gcaaggattg aatccggata 22080cagtgaccta tggaacagtt ataggcatac tttgcaagtc aggcagagta gaagatgcta 22140tgcgttattt tgagcagatg atcgatgaaa gactaagccc tggcaacatt gtttataact 22200ccctaattca tagtctctgt atctttgaca aatgggacaa ggctaaagag ttaattcttg 22260aaatgttgga tcgaggcatc tgtctggaca ctattttctt taattcaata attgacagtc 22320attgcaaaga agggagggtt atagaatctg aaaaactctt tgacctgatg gtacgtattg 22380gtgtgaagcc caatatcatt acgtacagta ctctcatcga tggatattgc ttggcaggta 22440agatggatga agcaacgaag ttacttgcca gcatggtctc agttggaatg aaacctgatt 22500gtgttacata taatactttg attaatggct actgtaaaat tagcaggatg gaagatgcgt 22560tagttctttt tagggagatg gagagcagtg gtgttagtcc tgatattatt acgtataata 22620
      taattctgca aggtttattt caaaccagaa gaactgctgc tgcaaaagaa ctctatgtcg 22680ggattaccga aagtggaacg cagcttgaac ttagcacata caacataatc cttcatgggc 22740tttgcaaaaa caatctcact gacgaggcac ttcgaatgtt tcagaaccta tgtttgacgg 22800atttacagct ggagactagg acttttaaca ttatgattgg tgcattgctt aaagttggca 22860gaaatgatga agccaaggat ttgtttgcag ctctctcggc taacggttta gtgccagatg 22920ttaggaccta cagtttaatg gcagaaaatc ttatagagca ggggttgcta gaagaattgg 22980atgatctatt tctttcaatg gaggagaatg gctgtactgc caactcccgc atgctaaatt 23040ccattgttag gaaactgtta cagaggggtg atataaccag ggctggcact tacctgttca 23100tgattgatga gaagcacttc tccctcgaag catccactgc ttccttgttt ttagatcttt 23160tgtctggggg aaaatatcaa gaatatcata ggtttctccc tgaaaaatat aagtccttta 23220tagaatcttt gagctgctga agccttttgc agctttgaaa ttctgtgttg gagttctttt 23280ctcctacagt cgtattagag gagggatctt ctctttatgt gtaaatagcg aggtatgtat 23340gtcacctctc cgaattattt ttactctggt tcctagacgg taaacaagca attatgttct 23400gcctttgatg ccagaaaaaa cacaaaagtt tgtcgttatc tctactaacg gatcataaag 23460gaatttgtaa ctggagtttc aaacttaatt tgtctaggca gtagttttgg cattagatcc 23520aacattgtgt aggattcatt tgtgtgtatc aatctatagg gtttcattaa atttcgttta 23580tgtgtactgt ttaggtgttg aatagtttga cttgtttttt aactgaacaa aagatactga 23640aatcgttcca ttcaacaaac acatgttccg ttaatgaaat tattgtacgt taccttttgt 23700tttcttactc acaagtgtcc tcttttctta tatcctatag attggtacaa caaattattg 23760attcaatttt ggttttgaac attgatgatc ctccctgcac tattggtgca gctgctcttc 23820tattcatttt gtgaagtgat gtgagtacct ctcaatccca tccttatgct tctgtgcatg 23880cttcattcca attttttacg catatcgatt gttttctttt atataacagt ccataaagat 23940aatcacatca tgacaaagtt atttatttct acagtatagt tatataagta ttcaccagtt 24000ttccatgaat attttggcat gtgattacaa agaagattat ttgagaaaat ccatgctttt 24060atttcatcat tttgtttgaa gttgaacttt aatttatggt gtaaatttca gttattattg 24120ctagcagctc gtactcttta atggtataac ttcacttgtg cttattctcc aatatctccc 24180ttcttgttgt tcaggttcaa gaaaatcatt tgttggattc agaatctggt gtccattttc 24240ttcttaaatt attaaatcct ccagtgaatc ttgttgattc caaagcacca tcgataggtt 24300ccaaacttct tggaatcagt aaagttcaaa tgcttaatgg atcaaataag gattctgact 24360
      gcatttcaga ggaaatcctt tcaaaagttg aagagattct cttaagctgt caagtgatca 24420agtcgctcga caaagatgac aagaaaacaa caaggccaga actgtgtcca aagtggcttg 24480ctttgttgac aatggaaaat gcatgcttgt ctgctgtttc agtagagggt aagttttaat 24540caaatttctt ggtcatgatt tccctttatg accattatat ttatttatat gagccaaata 24600agcagttgtc aacttgtcat aagttacata gcacctattt gcaatattca tgggtggttt 24660gcttagccct tttcttcacc tgcttttgat tgatgacttc catctgtgtt gcagaattga 24720attggagtag tggactgcac tagaagcacc tatggccatt gtcatactag gaaggttttc 24780ccttatcaaa tatttgattg ttacagagac ttctgacaca gtgtccagag ttggaggaaa 24840ttttaaagag acattaaggg agatgggagg tcttgatagt atttttgacg ttatggtgga 24900ttttcattca acattggaga tgagatctcg ctaacatcgc atattttaca tttcctttgt 24960tcaactctaa tagattgtgc aggcttgttc cttttcgcca ttttagcttt aatgcgcttg 25020aagccacatg aaagtaatgc ttgtccagat acatagccaa aggttgttat attttggggc 25080atggaaaatg cttgaggtag taactatttt catcaggaca tggaaaattg gctgcaacac 25140aaattatgtt gttttatgtt gcaaaaatag ttttttaata cttttttatt ctgcatgtgg 25200tgttagtatc ttacagttcc tctgatgatt atatccccca cgataataac acttgaaacg 25260ataataacac ttgacatatc tacaccaagt gaacattatt catttggatg ttacttttcc 25320agctatactt gctgttcttg catgtgtaag caagtttgga gtaaattgcg cattaattta 25380aatgcttggt gttcctatct gtgtactttt tattccccaa ctaataatgc aatcatatta 25440cgctgataaa ctgaataaat aaattaacaa tatacttctg gtggcaaacc ttgtgtatca 25500gaatctcata aaggatacat ccacttcagc tttggaccga aatgaaggaa catctttgca 25560aagtgctgct ctcctcttga aatgtttgaa aatattggaa aatgccatat ttctaagcga 25620tgataacaag gtaatgctcc ttatatgttc tgtttcagtt tagtacccat ttccttcttc 25680tgtactatct tctctcctga tttgttctgt gcaaaatgtg caaacagtgc gactttgtat 25740gtctgcttaa caattttctt ttcttcctga aaaagcaata tgaactctta cattcatttt 25800gcttcttgca gacccatttg cttaatatga gtagaaaatt gaacccgaaa cgctccttgc 25860tttcttttgt tggtgtcatt atcaatacta ttgagttatt atcaggtatt tttcttaata 25920atacaatgtg ttcgctaaca caataaaatg ttttaaacat ccagtatgtt aaagttgcag 25980tctgacgcct attttgtttt gctgcagctc tttcaatact tcagaattct tctgttgttt 26040ccagctctac atatccgaaa tcgtctaaag tctctcaaca gagttactct ggtaataaca 26100
      aacaccaatt ttgtttgatc agttgatctc gttggctttt ctatgcactg tctcaatata 26160gtttggtcgc cattcaagtc tcactacaga tgttgaactt ggcctgacac caaatattta 26220taaaatgcta cctgatattt ttaatatttc atgtttcctg acccagatta tcttgttggt 26280tcctcgtata agtttaatta gtgacattct tgaagctttg ttatgcagca gatgtcatgg 26340ggggaacttc atttaatgat ggaaagagca agaactcgaa aaaaaaaaac ttttgtcgaa 26400ccagacacgt cattgttgct tatcttcaaa atcagaagtt tctcatatta ctatatcttc 26460tggtagtgat gctggtctgt cacagaaggc attcaattgt tctccattta tatcaagcaa 26520tggggcatca agtggttcat taggcgagag gcacagcaat ggtagtggtt tgaagttgaa 26580tataaaaaag gatcgtggca atgcaaatcc aattagaggc tcaactggat ggatttcaat 26640aagagcgcac agttctgatg ggaactccag agaaatggca aaaagactcc gtctatctta 26700aaatgtaatc accgacagtg gtggtggtga tgaccctttt gcatttgacc gccgcgtcgg 26760cgtcgccacc acgtaatcgc ccacgtcgct gcccccgctg ccacgtcgtc gaccgcgcac 26820ggtaatcaca cgcatctcga ggccgccgct agctgatatc ttctcatccg gttgatttgt 26880gattttggcg tttttgcagt ggtgatggcg gggggcgacc gtggccgagg cgtggagtgc 26940catccgcatc agggtgtatc ggccgcgctg ctccgccctg gtccgcaggc tttggcggcg 27000agctggcggc ggagggagac tgtggtgaga tcggatttcg ccgctggtgg tgtcgctacc 27060atgggggatt cgccgcaggc gctctcaggt ttgcagcctc ctccactctc ttcccttttt 27120tatttttttt tctcgcaaaa tgtgttgtga tgttcgtctc gctgggctgg cctcatagcc 27180attaatgtag tttgctggaa catttacatt tggaacgttg ttggcaattg ctttacaaaa 27240tgtggaattg tggaggggag aaaaatcatt tgaacctgca gtgacaaaat tgccatctct 27300aattttaaaa ctgaaggtgt ggaaatcaaa cataatcatt gccagcgcat cattcttgtt 27360aaccaccatg atatattgtt ggttataaca gttagctcca caccaacctt gaaggtgtca 27420atagaatgtt tagtataaat tgaggagaac aggcagttgt taagactttc taaagaactt 27480gtagcagcta atactagcta ttgtgcattt gtgtttcatg gaatttgagc agcaatggat 27540atttcttact aagatgtatg atgcaaaaca aaaaactatg tctatacagt ttacatgtaa 27600tgtgcggatg caaataaaat catgtacatg gacaaactca tgggattcat accgaattcc 27660agaattgcat ttcttatgtg gttacttttg ttgttgattt ggttaccaga catcgatgtg 27720atttcaaggg tcagaggggt ttgcttctac gcggtggctg cagttgcagc aatctttttg 27780tttgtcgcca tggttgtggt tcatccactt gtgctcctat ttgaccgata ccggaggaga 27840
      gttcaggaaa aaaatttgaa aatacccatt ttttgaaaaa gatttacgtt tatatacact 27900agtatgaaga atttgcgaaa atataactaa tccgcagatc ggttatgcgg gagcgcaaca 27960aaagtatggc gtggcggcgc ggagtggacg gccgaggcgt tcgcgcggaa tggggctgcg 28020ggaccgagcc agtctcgctt gccggtaacg cggaaccggt acgctcccgc agcgccagtg 28080tgcggaaccg cggcgccaac atttttttac tgcatggcac tgtgtttaat actgtttgac 28140actgtttctg gtactgtttt acacagttcc cgggtcagtt ccgcacaatg gaggcgcggc 28200accgaccatg aacaatgtgt gaacagtgct gcacagggtt aaaacagtgt ataaactgcg 28260ctgcacagtg ctggagtcgc tggccactgc ggttccgcgt tttggaaccg cgggaccgtc 28320gcgattccgc gttttggagc tgccggacca tgacggttcc gcgcaggatc gtcggtcccg 28380tattttgaat ctgcggaacc gtcgctgtcc cgcgtttcca tttcgcggga tgcgtatatt 28440tttataaaac ctctccatgc atgtatataa acataaatta ttgaaaaaat aagtatattt 28500gcaaattttt ttcgagagct cagcactaca ttgcaaagat ttgggcaact ctgacaattt 28560ccatgttcta caagcttgac gtcgagggaa tggagaacct gccaccgaat agtagccctg 28620ctatctatgt tgcgaaccat cagagttttt tggatatcta tacccttcta actctaggaa 28680ggtgtttcaa gtttataagc aagacaagta tatttatgtt ccgaattatt tgatgggcaa 28740tgtatctctt aggagtaatt cctttgcggc gtatggacag caggagccag ctggtatggc 28800tgtagtctca tccctgcttt cttaagtaga catatatgca attacagaat ttggtaaaca 28860aacaagattt tatgaatcat atatgatttt ggggaaaaca ccaaactctc tttggtggct 28920gccttgaaca tagttctatt cacacagtta tagcaccttc tttaaaatga agaactttgt 28980tgcatacaca tatggccaaa ccacataatg aattttgttt atttctatct ttgaatgtta 29040gcaccttatt ttcatgcata tcatgctaat ttgcttgccc acgttgagtg ggaatttttt 29100tccatgtttt ataatttata tatgttctag acttctagtc cacaatttat ctacttcatg 29160ttcctgagcc tctagtatgg ctggtagcag actaggtgct gagtgctgtc catttttgca 29220gactgaagag aggagaaata caggactgtc cgttgttagt cagatttgta aaaatagact 29280ctgatgtagt ttattttagc ccctatttta tatttaacaa tacaaatata taacgtatcc 29340taagaactta tcgtaattta ggagaagttg ctcgtttcat taaattaaac tgtgaagtaa 29400aaatgtgtgc tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg 29460gcaggctagg atcgaacact gaatggtaag actgcttctg ccttcatttg tgcacttggt 29520gctgccacgc cgattaagca gtagaacaaa gtaattttgt cgtgcacaaa tgagttatat 29580
      ttcattgaaa atcgaagtga aaatgaacca aaagatagaa gaaaagggga aacttggtaa 29640ttatatactc cacaaattta ttggtaagat ttgatattag acgctcgatt acttggctta 29700agttaaggat atcaaatttg gggaagcacc aaaggaatta ttgtgaagga gttgtgggtg 29760cataacgtta tctactagtt caaatcctag tgactatgaa tattaatgag taaggtaagg 29820gatttattgt taattttagt ttctttaaga ttgtgtccga gtacaccatt cggtaagtgt 29880aataatgttt tgtattggat tcacttgtgt tacgtgcatg tgcttttacc ttttcatttg 29940tttctgcgtt ctgggtatga atttgacgag attccatggt cagctcaaca tatcagttac 30000tgcgtgtcaa gcgatcttat atggtatgcg cacaagcgat tgtatacgga tatgacagta 30060taatgtgtga tattgatacg atgttccttt cctttataaa ggaacaaaga ctttttttaa 30120aaaaagaagg ggtattacta aaaaccaaaa tgtcaaaaac aaaatatcag tgcacatggc 30180aagtgtgcac gagcaatagc ttgcccttac gttcattatt tagcatgtac tactactaac 30240tacgcaaaaa tcaattcacc gattattaaa ctgttaacat cattttagca cgttaacata 30300tgtttcattc aacacaccgg ttttggcaca tttacaaact tgcaaagttg caatactccc 30360ttcgttacat agcataagag attttaggtg aatgtgacac atctatccaa attcattata 30420ctagaatgta tcaccgcctc cacgccggga gggagagcgc cgccggtgga gaaaggggga 30480gggagtggtc gaggggaacc agtagggtgc cctccccgtc gccgcctccc cgtggccgcg 30540ccggcgagac aggaggaaga gggggagatg gagcggcgcc gccggtgagg gcgcgcgtgc 30600gcgggggggg ggggggggga gcggcgacgc cggtgaggaa gggaagggga gtggtggctt 30660tgagagagat aggggagagg gaaaatgatt ttagagttag ggtttgggct gctgagtttt 30720tatatagatc gggatcaatc aggaccgtcc atcagatcgg acaactacgg tttctcccgc 30780gttgggccgg gtgccactcc taggttgccc acactattgg gccacatgta cgctccgcgt 30840gaaataagtt cactttaggt cctttaagtt gcctctgaat tgttcccagg ccggccgcac 30900tattgggcca ccccataggc catgtgtacg ctccgcacag aataatttcg ctttagctcc 30960cttaatttgt cccctcaaac ttctaaaacc agtgcaaatc tttaattttt agttcaccca 31020ttgcaactca cgggcatatt tgctagtgac atataatatg aaacgaagga tgtagcagac 31080tatagaattt aaactgtgct ttcattttag agcatcacta actgttattt agatttttat 31140ttaaataaat gcagaaatga tgtttttatt atgaaaatta gcaataaagc tcccaaaatt 31200tcaaaaaaaa attaaaagag atttattaat catggttaat ttaattaaaa attaaatcta 31260accatatcat attatttcac ggtccgtgat gaggaaatgg cagctgctat cacttatggt 31320
      gggagagaag gggcattgtt tatttttata actatctctt ataactccca tgaaactata 31380aaataaatat aatcattatc ataacattag tttttttcca ttgcaacgca agggtaattt 31440ttcagtacaa taaaaaaata aaagtgggcc attctgaacg gaaatttctg gttttttttc 31500ccaagagcgc cgcacacaac tgcgcaagag atcgatcgcg atcaccctgc tcgtcgccga 31560tctcctacac catccctgcc atctccttcc cctccactgg ctgctgctgc acctgtcagc 31620tagggcgggc atggcgcgcc gcgccgcttc ccgcgctgct ggcgcccttc gctcggaggg 31680ctcgatccaa gggcgagggg gccgcgcggg gggcagtggc ggtggcgcgg aggacgcacg 31740ccacgtgttc gacgaattgc tccgtcgtgg cataccagat gtcttctcct acaatattct 31800tctcaacggg ctgtgtgatg agaacagaag ccaagaagct ctcgagctac tgcacataat 31860ggctgatgat ggaggtgact gcccacctga tgtggtgtcg tacagcaccg tcatcaatgg 31920cttcttcaag gagggggatc tggacaaaac ttacagtaca tacaatgaaa tgcttgacca 31980gaggatttcg ccaaatgttg tgacctacaa ctctattatt gctgcgctat gcaaggctca 32040aactgtggac aaggccatgg aggtacttac caccatggtt aagagtggtg tcatgcctga 32100ttgcatgaca tataatagta ttgtgcatgg gttttgctct tcagggcagc cgaaagaggc 32160tattgtattt ctcaaaaaga tgcgcagtga tggtgtcgaa ccagatgttg ttacttataa 32220ctcgctcatg gattatcttt gcaagaacgg aagatgcacg gaagcaagaa agatttttga 32280ttctatgacc aagaggggcc taaagcctga aattactacc tatggtaccc tgcttcaggg 32340gtatgctacc aaaggagccc ttgttgagat gcatggtctc ttggatttga tggtacgaaa 32400cggtatccac cctaatcatt atgttttcag cattctagta tgtgcatacg ctaaacaaga 32460gaaagtagaa gaggcaatgc ttgtgttcag caaaatgagg cagcaaggat tgaatccgaa 32520tgcagtgacg tatggagcag ttataggcat actttgcaag tcaggcagag tagaagatgc 32580tatgctttat tttgagcaga tgatcgatga aggactaagc cctggcaaca ttgtttataa 32640ctccctaatt catggtttgt gcacctgtaa caaatgggag agagctgaag agttaattct 32700tgaaatgttg gatcgaggca tctgtctgaa cactattttc tttaattcaa taattgacag 32760tcattgcaaa gaagggaggg ttatagaatc tgaaaaactc tttgacctga tggtacgtat 32820tggtgtgaag cccgatatca ttacgtacag tactctcatc gatggatatt gcttggcagg 32880taagatggat gaagcaacga agttacttgc cagcatggtc tcagttggaa tgaaacctga 32940ttgtgttaca tatagtactt tgattaatgg ctactgtaaa attagcagga tgaaagatgc 33000gttagttctt tttagggaga tggagagcag tggtgttagt cctgatatta ttacgtataa 33060
      tataattctg caaggtttat ttcaaaccag aagaactgct gctgcaaaag aactctatgt 33120cgggattacc aaaagtggaa ggcagcttga acttagcaca tacaacataa tccttcatgg 33180actttgcaaa aacaaactca ctgatgatgc acttcggatg tttcagaacc tatgtttgat 33240ggatttgaag cttgaggcta ggactttcaa cattatgatt gatgcattgc ttaaagttgg 33300cagaaatgat gaagccaagg atttgtttgt tgctttctcg tctaacggtt tagtgccgaa 33360ttattggacg tacaggttga tggctgaaaa tattatagga caggggttgc tagaagaatt 33420ggatcaactc tttctttcaa tggaggacaa tggctgtact gttgactctg gcatgctaaa 33480tttcattgtt agggaactgt tgcagagagg tgagataacc agggctggca cttacctttc 33540catgattgat gagaagcact tttccctcga agcatccact gcttccttgt ttatagatct 33600tttgtctggg ggaaaatatc aagaatatca tagatttctc cctgaaaaat acaagtcctt 33660tatagaatct ttgagctgct gaagcatttt gcagctttga aattctgtgt tggaattctt 33720ttctcctaca gtccgattag aggagggatc ttctctgtat gtgtaaatag cgaggtatgt 33780atgtcacctc tccgaattat tttgactgtg gttcctggac tgtaaacaag ctattatctt 33840ctggtgttga tgccagaaaa aacacaaaag tttgtcgtta tctctactaa cggatcataa 33900aggggtttgt aactggagtt tcaaacttaa ggtatctagg cagtaggtat atattgatcc 33960tacatcttat gatcttaaga tgatatcctt ctcattatcc tctgctgaaa ctttagcttg 34020aaccgtcatc tacaccacaa tttgagcccc ttagcacaga gcacaacgag caatagcttg 34080cccttacgtt cattatttag catgcactac tactaactac ccaataatca atacatcggt 34140tattaaactg tttgtacagt ttaataatgt cattttatca cgttaacata tgtttcattc 34200aacaccacac cggttttggc acagttgcaa acttgcaata acatttttac tacttctccg 34260ccccataata taacaatctc gttccatact atattgctat attacaggat ggatgaagta 34320cttcttttct tccaaaatat aagaatctag tactagatta gatattattt ggattcacga 34380atttgattag gctgtctaga tttgtagtcg tatgtaatgt ctaattcggt aataggttat 34440tacctctttg gatggaggga gtagttttta tttcgtactc cctccgtttc atattataag 34500ttgttttgac ttttttctta gtcaaatttt attgagtttg attaaattta tagaaaaaaa 34560ttagcaacat ttaagcacca cattagtttc attaaatgta gcatggaata tatttttata 34620atatgtttgt tttttattaa aatgctacta tatttttcta taaatgtagt caaatttaaa 34680gaagtttgat tatgaaaaaa tcaaaatgac atataatatg aaactgagga tgtagcagac 34740tatagcaaat ttaaactatg cttttatttt agagcatcac caaaagatta gcaataattt 34800
      atccctaaaa ttcaagtttt gggtttctta aactgaaaat aggaagtgaa aaatcttttc 34860cgtccaagag atagcctaaa tcttatctta actaattaaa atattcataa ttttcctttc 34920gtcacattaa attttcgtcc gtaaatctga ttgaaatcca attggacaat ccaaaaaata 34980gagaaaaaga acagaaaaaa taataaaaag cacacaaatc ttatctcaat cccgcgggaa 35040gctgccgacg ccgccgaatc cgctcgagcg ccgccgccgc cgctcacggg gaacgatgtc 35100gctgctgtcg cacgcggtat gggagggcgc cgctgccact gcttgggaga taggatatgg 35160agagagaagg aaatgtgagg gttagggtta ggtttttccc cgtccgtatc ttcagcgaca 35220cggaggcgat ccaagctgtc catcagatcg gacggctcag aatgcctcca tcgtcgggcc 35280gcgcatgctt gatgggccga gggaaggccg gagggtcgaa caaacgcaat caaaggagga 35340gttggaggag gtaaattaga atttatttgc gggctgagat agtaaatgga ctgaaaatgg 35400cccatagaga aattgggaat tttatttaaa taaatgttga aaaggtgttt atattatcaa 35460aattaaaaat taagctccga aaattctaaa aaatattcaa agagcattat taatcatggt 35520taatttaata aaaattaaat ccaaccatat catattattt cacggcgcgc ggtaggaaaa 35580tgcgcagctg ttgtcgttta cggtgggaga gaagggacat tgtttatttc cagaactatc 35640ttttataact cccatggaac tttaaaataa atataatcat tattatagca ttagtttttt 35700tctgtctttt ttttccccaa gagcgccgcg cagaagagat cgatcgcgat ctccctgccc 35760cgacgtcgcc ggccgatctc tcattctctc cacgccctgc tcgtcgccga tctcctacac 35820catccctgcc atctcctcct tcccctcccc tctatcctcc actggtgccg cccacctctc 35880cgtataagac aaactgcgtt gcggcgttgg tttccgccgg cgctgctgct gcacctgtca 35940gctagggcag gcatggcgcg ccgcgccgct tcccgcgctg ttggcgccct tcgctcggac 36000ggctcgatcc aagggcgagg aggccgcgcg gggggcagtg gcgccgagga cgcacgccac 36060gtgttcgagg aattgctccg gcgtggcagg ggcgcctcga tctacggctt gaaccgcgcc 36120ctcgccgacg tcgcgcgtca cagccccgcg gccgccgtgt cccgctacaa ccgcatggcc 36180cgagccggcg ccggcaaggt aactcccacc gtgcacacct atggcattct catcggttgc 36240tgctgccgcg cgggccgctt ggacctcggt ttcgcggcct tgggcaatgt cgtcaagaag 36300ggatttagag tggaagccat caccttcact cctctgctca agggcctctg tgccgacaag 36360aggacgagcg acgcaatgga catagtgctc cgcagaatga ccgagctcag ctgcatgcca 36420gatgttttct cctgcaccat tcttctcaag ggtctgtgtg atgagaacag aagccaagaa 36480gctctcgagc tgctgcacat gatggctgat gatcgaggag gaggtagcgc acctgatgtg 36540
      gtgtcgtata ccactgtcat caatggcttc ttcaaagagg gggattcaga caaagcttac 36600agtacatacc atgaaatgct tgatcggagg atttcaccag atgttgtgac ttacagctct 36660attattgctg cgttatgcaa gggtcaagct atggacaaag ccatggaggt acttaccacg 36720atggttaaga atggtgtcat gcctaattgc atgacatata atagtattct gcatggatat 36780tgctcttcag agcagccgaa agaggctatt ggatttctca aaaagatgcg cagtgatggt 36840gtcgaaccag atgttgttac ttataactcg ctcatggatt atctttgcaa gaacggaaga 36900tccaccgaag ctagaaagat ttttgattct atgaccaaga ggggcctaga gcctgatatt 36960gctacctatt gtaccctgct tcaggggtat gctaccaaag gagcccttgt tgagatgcat 37020gctctcttgg atttgatggt acgaaacggc atccaccctg atcatcatgt attcaacatt 37080ctaatatgtg catacgctaa acaagagaaa gtagatgagg caatgcttgt attcagcaaa 37140atgaggcagc atggattgaa tccgaatgta gtgacgtatg gagcagttat aggcatactt 37200tgcaagtcag gcagtgtaga cgatgctatg ctttattttg agcagatgat cgatgaagga 37260ctaaccccta acattattgt gtatacctcc ctaattcata gtctctgtat ctttgacaaa 37320tgggacaagg ctgaagagtt aattcttgaa atgttggatc gaggcatctg tctgaacact 37380attttcttta attcaataat tcacagtcat tgcaaagaag ggagggttat agaatctgaa 37440aaactctttg acctgatggt acgtattggt gtgaagccca atgtcattac gtacagtact 37500ctcatcgatg gatattgctt ggcaggtaag atggatgaag caacgaagtt actctccagc 37560atgttctcag ttggaatgaa acctgattgt gttacatata atactttgat taatggctac 37620tgtagagtta gcaggatgga tgacgcatta gctcttttca aagagatggt gagcagtggt 37680gttagtccta atattattac gtataacata attctgcaag gtttatttca taccagaaga 37740actgctgctg caaaagaact ctatgtcggg attaccaaaa gtggaacgca gcttgaactt 37800agcacataca acataatcct tcatgggctt tgcaaaaaca atctcactga cgaggcactt 37860cgaatgtttc agaacctatg tttgacggat ttacagctgg agactaggac ttttaacatt 37920atgattggtg cattgcttaa agttggcaga aatgatgaag ccaaggattt gtttgcagct 37980ctctcggcta acggtttagt gccagatgtt aggacctaca gtttaatggc agaaaatctt 38040atagagcagg ggttgctaga agaattggat gatctatttc tttcaatgga ggagaatggc 38100tgtactgcca actcccgcat gctaaattcc attgttagga aactgttaca gaggggtgat 38160ataaccaggg ctggcactta cctttccatg attgatgaga agcacttttc cctcgaagca 38220tccactgctt ccttgttata gatcttttgt ctgggggaaa atatcaagaa tatcatagat 38280
      ttctccctga aaaatacaag tcctttatag aatctttgag ctgctgaagc attttgcagc 38340tttgaaattc tgtgttggaa ttcttttctc ctacagtccg attagaggag ggatcttctc 38400tgtatgtgta aatagcgagg tatgtatgtc acctctccga attattttga ctgtggttcc 38460tggactgtaa acaagctatt atcttctggt gttgatgcca gaaaaaacac aaaagtttgt 38520cgttatctct actaacggat cataaagggg tttgtaactg gagtttcaaa cttaaggtat 38580ctaggcagta gttttgacat tagatccaac attgtgtagt attcatttgt gtgtatcaat 38640ctatagggtt tcattaaatt tcatttgtgt actgtttagg tgttgaatat attgttttac 38700ttgtttttta actgaacaaa agatagctga agctttgttc tttaccaaat gcagtagtga 38760tcatcacaat atattttttt acggaacagg agattgtata aaatggtttc catcggcggc 38820caacggcgac cgctctgctc tgacccacca cccaatccat ccatccactc gccgccgccc 38880ctgatccaag cctccgccgc gcgacagcga cgcaccgccg tcgagaggag gaggcgtgag 38940ccccatgggg accctcctcc ggccgcgtaa tgccgctgca cggtaaccac gcgcctctcg 39000aggcctccgc cgctagctga tctcttctca tcctgtttgg gtttgggttt gtgatttggg 39060tgttttttcc gcagcggtgg tggtggtggt ggttgcggcg ggagggggcg gtggccgcgg 39120ccgtggcgtg gagtgccagc tgcatcgggt gcaccgccgc cggggtccgc aggttgtggt 39180ggcgacggcg agctgaggag gcggagggag actggtgagg gacacaggca ggcaggctct 39240caaggctaag cttgttacag gtactgagac tagttactaa ttactttgat aatcagtata 39300aataagcttg tgtagtgtaa tggcattgtg catttctgca cttgtaaatt ttacagaaga 39360tggtcattca atttgaacct gcatctaata ttttagtggt ttgagtttat tctcccagtc 39420acagagttga agaggcaagt aacctgtaag agaggactga acattaacac ctcttgttcg 39480attaaaaatg accaaagagc atcaaacatg tattcgaggc tgttacttta atatggccca 39540ttaatttgtt tagttggcta tgtacatcct agttggtgca gtgttgtgga aaacggaata 39600cgggtgtcgg atggacgagg tgccgtcaag cgattaatcg taatacggat gattaaacgg 39660aattatatgg atttttggcg ttcgcactaa gatgtacata attgatgtta atggcaatgg 39720tggagacaaa atgcatcatc ttaataaaaa atatttgtat aaatctctaa ctatattatg 39780aaaatgccat ttattagttc aatagatatc aacactgatg gttagtagcg caatagcatt 39840gggcttgtta gtcaaaatag tgcagctggg ctgcaagttg caagtttatg ttagtttcat 39900aaacagacat ctgatttgtc gataaataac cgactaatcg tgccatacaa ctgtataatt 39960actctgaaat agtaatgttg ctccgacttg atgatacggt acggtctggc taccgtttcc 40020
      gttttgacag acgattaaac ggctgtgccg gtcgacttcc acaacactga gttggtgtaa 40080atgccagtta ccatttctat gatctaaaat aatcaactct tttagtatat tttcaaaaac 40140gaaaattcag tacacatgca tgaatcttaa tcttcatatc tagctcgtta caaaatcaac 40200aaaggcaccg tgtcagctgg tgcacattag ctagttcgta cttagcatta tccactagca 40260ccttattttc atgcatatca tgctaatttg cttgcccacg ttgagtggga atttttttcc 40320atgttttata atttatatat gttctagact tctacttcat gttcctgagc ctctagtatg 40380gctggtagca gactaggtgc tgaatgctgt ccttttttgc agactgaaga gaggagaaat 40440acaagactgt ccgttgttag tcagatttgt aaaaatagac actgatgtag tttatttttg 40500cccctatttt atatttaaca atacaaatat ataacgtatc ctaagaattt atcgtaattt 40560aggagaagtt gctcgtttca ttaaattaaa ttgggaagta aaaatgtgtg ctcgagtatg 40620tcaatgcaat cctgtgttct tgtttgaaga tatggtgtag ggcaggccag gattgaacac 40680tgaatggtaa gactgcttct gctttcagac gttattgcta aatttttagc tagttgcaat 40740tagtgctgtc acgccgatta agcagtagaa caaagtaatt ttgtcgtgac aaatgagtta 40800tatttctttg aaaatcgaag cgaaaacgaa ccaaaagata gaagaaaagg gaaacttggt 40860aattactcca caaagagaac aaatttattg gtaagatttg atatgagatg ctcgattact 40920tggcttaagt taacaatatc aaatttgggg aagcaccaaa agaattattg tgacttaagt 40980taaagatatc aaatttgggg aagcaccaaa ggaattattg tgatggagtt gtgggtgcat 41040aacgttattt gctttgttca aatcctagtg actatgaata tgaatattaa tgcgtaaggt 41100aaggaattta ttgttaattt taggttcttt acgattgtgt ccggggacgc cattcggtaa 41160ctgtaataat gttttgtatt ggattcactt gtgttacatg cacgcactaa acatgtgctt 41220taccttttca tttgtttgtg cgttctgcgt ttgaatttga cgagattcca tggtcagctc 41280aacatgtcag ttactgcgtg tcaagcagtt actgcgtgtc aagcgatctt atatggtatg 41340cgcacaagcg attgtatacg gatatgacag tataacgtgt gatattgatt tttttatata 41400aaaaaatacg atgttacttt ccttcataaa ggaacaaaga cttttttttt aaaaaaaaga 41460aggggtatta ctaaaaacaa aaatgtcaaa aacaaaatat cagtgcacat ggcaagtgtg 41520ctcggcaatt ttttgtctgt actttaaaca aaaatatttc tatatggtat tttttacaag 41580ggtgtcacaa atattttaaa ttagccaaac atctgcattt tattaaaaac tgtataaatt 41640ataatttata ctctaaaagg ttgtgtacat ctctcttgga gaaaatgtat aagttgcgaa 41700caaacattaa tccacgttat ataagtcaat ctgttattta accatagaaa gtaagaaacc 41760
      tactagcgtg ttaagctaag ctctctttca ttctctttct tcttcctggt tttgcttcaa 41820tcacttgtca agtgaagggt tcttaactac cattactcct actcaccaaa tttttttctc 41880agatctttcg taggtatata ttgatcctac atcttatgat cttaagatga tatccttctc 41940attatcctct gctgaaactt tagcttgaac cgtcatctac accacaattt gagcccctta 42000gcacagagca caacgagcaa tagcttgccc ttacgttcat tatttagcat gcactactac 42060taactaccca ataatcaata catcggttat taaactgttt gtacagttta ataatgtcat 42120tttatcacgt taacatatgt ttcattcaac accacaccgg ttttggcaca gttgcaaact 42180tgcaataaca tttttactac ttctccaccc cataatataa caatctcgtt ccatactaga 42240ttgctatatt acgggacgga tgaagtactt ctttccttcc aaaatataag aatatagtac 42300tagattagat attatttgga ttcacgaatt tgattaggct atctagattt gtagtcgtac 42360gtaatgtcta attcggtaat aggttattac ctctttggat ggagggagta gtttttattt 42420cgtactccct ccgtttcata ttataagttg ttttgacttt tttcttagtc aaattttatt 42480gagtttgact aaatttatag aaaaaaatta gcaacattta agcaccacat tagtttcatt 42540aaatgtagca tggaatatat ttttataata tgtttgtttt tttattaaaa tgctactata 42600tttttctata aatgtagcca aatttaaaga agtttgatta cgaaaaaaaa tcaaaatgac 42660atataatatg aaactgagga tgtagcagac tatagcaaat ttaaactatg cttttatttt 42720agagcatcac caaaagatta gcaataattt atccctaaaa ttcaagtttt gggtttctta 42780aactgaaaat aggaagtgaa aaatcttttc cgtccaagag atagcctaaa tcttatctta 42840actaattaaa atattcataa ttttcctttc gtcacattaa attttcgtcc gtaaatccga 42900ttgaaatcca attggacaat ccaaaaaata gagaaaaaga acagaaaaaa taataaaaag 42960cacacaaatc ttatctcaat cccgcgggaa gctgccgacg ccgccgaatc cgctcgagcg 43020ccgccgccgc cgccgccgct cacggggaac gatgtcgctg ctgtcgcacg cggtatggga 43080gggcgccgcc gccgctgctt gggagatagg atatggagag agaaggaaat gtgagggagg 43140gttaggtttt tccccatccg tatcttcagc gacacggagg cgatccaagc tgtccatcag 43200atcggacggc tcagaacgcc tccatcgtca ggccgcgcat gcttgatggg ccgagggaag 43260gccggagggt cgaacaaacg cagtcagagg aggagttgga ggaggtaaag tagaatttat 43320ttgcgggctg agatagtaaa tggactgaaa atggcccata gagaaattgg gaattttatt 43380taaataaatg ttgaaaaggt gtttatatta tcaaaattag aaattaagct ccgaaaattt 43440taaaaaatat tcaaagagca ttattaatca tgattaattt aataaaaatt aaatccaacc 43500
      atatcatatt atttcacggc gcacggtagg aaaatgcgca gctgttgtcg ctgacggtgg 43560gagagaaggg acattgttta tttccagaac tatcttttat aactcccatg gaactttaaa 43620ataaatataa tcattattat agcattagtt tttttctgtc ttttttttcc ccaagagcgc 43680cgcgcagaag agatcgatcg cgatctccct gccccgacgt cgccggccga tctctcattc 43740tctccacgcc ctgctcgtcg ccgatctcct acaccatccc tgccatctcc tccttcccct 43800cccctctatc ctccactggt gccgcccacc tctccgtata agacaaactg cgttgcggcg 43860ttggtttccg ccggcgctgc tgctgcacct gtcagctagg gcgggcatgg cgcgccgcgc 43920cgcttcccgc gctgttggcg cccttcgctc ggacggctcg atccaagggc gaggaggccg 43980cgcggggggc agtggcgccg aggacgcacg ccacgtgttc gacgaattgc tccgccgtgg 44040caggggcgcc tcgatctacg gcttgaaccg cgccctcgcc gacgtcgcgc gtgacagccc 44100cgcggccgcc gtgtcccgct acaaccgcat ggcccgagcc ggcgccgacg aggtaactcc 44160cgacttgtgc acctacggca ttctcatcgg ttgctgctgc cgcgcgggcc gcttggacct 44220cggtttcgcg gccttgggca atgtcattaa gaagggattt agagtggacg ccatcgcctt 44280cactcctctg ctcaagggcc tctgtgccga caagaggacg agcgacgcaa tggacatagt 44340gctccgcaga atgaccgagc tcggctgcat accaaatgtc ttctcctaca atattcttct 44400caaggggctg tgtgatgaga acagaagcca agaagctctc gagctgctgc acatgatggc 44460tgatgatcga ggaggaggta gcccacctga tgtggtgtcg tataccactg tcatcaatgg 44520cttcttcaaa gagggggatt cagacaaagc ttacagtaca taccatgaaa tgctggaccg 44580ggggatttta cctgatgttg tgacctacaa ctctattatt gctgcgttat gcaaggctca 44640agctatggac aaagccatgg aggtacttaa caccatggtt aagaatggtg tcatgcctga 44700ttgcatgaca tataatagta ttctgcatgg atattgctct tcagggcagc cgaaagaggc 44760tattggattt ctcaaaaaga tgcgcagtga tggtgtcgaa ccagatgttg ttacttatag 44820cttgctcatg gattatcttt gcaagaacgg aagatgcatg gaagctagaa agattttcga 44880ttctatgacc aagaggggcc taaagcctga aattactacc tatggtaccc tgcttcaggg 44940gtatgctacc aaaggagccc ttgttgagat gcatggtctc ttggatttga tggtacgaaa 45000cggtatccac cctgatcatt atgttttcag cattctaata tgtgcatacg ctaaacaagg 45060gaaagtagat caggcaatgc ttgtgttcag caaaatgagg cagcaaggat tgaatccgaa 45120tgcagtgacg tatggagcag ttataggcat actttgcaag tcaggcagag tagaagatgc 45180tatgctttat tttgagcaga tgatcgatga aggactaagc cctggcaaca ttgtttataa 45240
      ctccctaatt catggtttgt gcacctgtaa caaatgggag agggctgaag agttaattct 45300tgaaatgttg gatcgaggca tctgtctgaa cactattttc tttaattcaa taattgacag 45360tcattgcaaa gaagggaggg ttatagaatc tgaaaaactc tttgagctga tggtacgtat 45420tggtgtgaag cccaatgtca ttacctacaa tactcttatc aatggatatt gcttggcagg 45480taagatggat gaagcaatga agttactttc tggcatggtc tcagttgggt tgaaacctaa 45540tactgttact tatagcactt tgattaatgg ctactgcaaa attagtagga tggaagacgc 45600gttagttctt tttaaggaga tggagagcag tggtgttagt cctgatatta ttacgtataa 45660cataattctg caaggtttat ttcaaaccag aagaactgct gctgcaaaag aactctatgt 45720taggattacc gaaagtggaa cgcagattga acttagcaca tacaacataa tccttcatgg 45780actttgcaaa aacaaactca ctgatgatgc acttcagatg tttcagaacc tatgtttgat 45840ggatttgaag cttgaggcta ggactttcaa cattatgatt gatgcattgc ttaaagttgg 45900cagaaatgat gaagccaagg atttgtttgt tgctttctcg tctaacggtt tagtgccgaa 45960ttattggacg tacaggttga tggctgaaaa tattatagga caggggttgc tagaagaatt 46020ggatcaactc tttctttcaa tggaggacaa tggctgtact gttgactctg gcatgctaaa 46080tttcattgtt agggaactgt tgcagagagg tgagataacc agggctggca cttacctttc 46140catgattgat gagaagcact tttccctcga agcatccact gcttccttgt ttatagatct 46200tttgtctggg ggaaaatatc aagaatatta taggtttctc cctgaaaaat acaagtcctt 46260tatagaatct ttgagctgct gaagcatttt gcagctttga aattctgtgt tggaattctt 46320ttctcctaca gtcctattag aggagggatc ttctctgtat gtgtaaatag cgaggtatgt 46380atgccacctc tccgaattat ttttactgtg gttcctagac tgtaaacaag caattatgtt 46440atgctgttga tgccagaaaa aacataaaag tttgtcgtta tctctactaa cggatcataa 46500agggatttgt gactggagtt tcaaacttaa tgtgtctagg cagtaatttt gacattagat 46560ccaaaacaat ttatagggtt tcattaaatt tcatctatgt gtactgttta ggtgttgaat 46620agtttgactt gttttttaac tgaacaaaag atatgtctga agctttgttc tttaccaaat 46680gcagtactga tcatcacaat atatttttta tggaacaaga ttggattgta tagaatggtt 46740tctgatctga ttatcttatc tcaacgtatt attatgcaca tgtactaatc atgaaatatc 46800tgatggaatg atgtttctat ttacctgtgt gaggcagcaa ggagtgagat ggataacacc 46860acatactccc tctgtcccag aatataagaa gttttagagt tggacacgat tattaagaaa 46920gtaggtagaa gtgagtagtg gagggttgtg attgcatgag tagtggaggt aggtgggaaa 46980
      agtgaatggt ggagggttgt gattggttgg gaagagaatg ttggtagaga agttgttata 47040ttttggggag tacattatta ttctagaaca atactgttgt gctcaagaag cgttccaaag 47100atgtttcaca acctgtgctc gatgggtttt gagcttaatc ctgggacatt cagtatcatg 47160atctgtctca ttcttaaaca tggaataaag gatgacagca tgatttcttt gtctctataa 47220tcttttggct acccacagat aatagctgta aatctatact actttaaaag gagtagtggt 47280ggtggtgagt ggtgaatctg ccaccacccc accaccaact ctcaaaattc tgacatgtgg 47340gatcactgtc aatcccttct ccaagacatg tgggatcact gtcaatccct tctccaaacc 47400aattgtatga tagaacagtg gaaatcacgg acagaccatg gagctctcaa ccataatcat 47460ccttgcgagt taataacaaa tggagcgtaa acttggcaag caaaaaactc aaattaattc 47520taaaattaag ctctaggatt caaaatagat ttcctctctg cattgtgctg ttatgatttt 47580taattccgta acaacgcaaa tgcattttgc tagtcttata aagaagggtt aatgcaaata 47640ttctgattaa atgattgtat ctatgaagtt tgaatgctag tggaagctcc tttgaccatg 47700ttttgttgtg cgagcattta agagagtgaa gagaatgctt ctttggtgct gttctggtat 47760ggaaggatcc acagataaaa ttcaggttct actgcttctc tgcttgtaat tttcatgaag 47820ctgcagtgaa taccttgttg accacttgat ctgttgcttt gaaggagaat atagtagtgg 47880ccaaggttgg tgacggtgat ggtggcatgt gatcccccag atcttcagtg acccagagag 47940gaggggacgg cgcgtggtga gctacaaggc atactcagtg gagggcaaga tcaaggcctc 48000ccgtccgtag gggactccgc tgcatcaagg ccaactgctc cgaactgatc aatttctggt 48060acggatcact tctcctttcc tttttttttt caccttaagc actctcttga ttcttcgctg 48120ctacctccct taatttcttt caatatattg tggcacttga tcatggcgga gacccacctt 48180ccagtgtgaa tggattttgt caaagaacta aatttattcc attagcttat tttccgatta 48240catggaagac attcttttct ggaataaata cagaactaaa tcctgtttcc tgaataaaag 48300ttgttagtgt gtggcatggt gcatttccgc gcttctaaat tttataaaac ctgttcattc 48360aatttgaacc tgcatccaat ccaatatttt aggtgcagac aggtgcttgc ggtcaggtta 48420aagaagttgg caaaaatgct tctgaagaaa ggttaattgt tgtttcatct caggaggtaa 48480tatgcagatg attattccaa ttggcattgc cttgccattt ttatcacgag tctttacaat 48540tttatatcct cctacatatt ctttccagat tccagatgat ccagtgtctc caacaattga 48600ggcgcttatt ttgctccata gtaaagtaag tacacttgct gagaaccacc agttgacaac 48660acggcttgtt gtaccatcaa acaaagttgg ttgtattctt ggggaaggtg gaaaggtaat 48720
      tactgaaatg agaagacgga ctggggctga aatccgagtc tactcaaaag cagataaacc 48780taagtacctg tcttttgatg aggagcttgt gcaggtaatt tatttggcca tacctacacc 48840agagatccat atattacttt tataactgca gtttttactt gttaacattt cattgtgctt 48900ttacatttgt tccaagcttt caggttgctg ggcttccagc tattgaaaga ggagccctga 48960cagagattgc ttcgaggctt tgaactagga cactcagaga tggaagttct tccaataatc 49020cgacaccttt tgcccctgtt gatggtcctc ctgttgatat cttgcctaac aaggaattca 49080tgctatatgg acgatctgct aatagtcccc catatggagg gcctgctaat gatccaccat 49140atggaagacc tgccattgat ccaccatatg gaagaccaat atccacaata tggaagacct 49200gccaatgatc caccatatag aagacctgtc aatgatacat catattgagg gttgaacaat 49260gatgggcctc gtgatcaggc ccggtcctga ggggggtcga atggggcgat cgctccgggc 49320cccccgattc ccagggcccc cacctatctg tgcaacgagt agtagcgatc ttccagcgcg 49380caacgtgagg cgatgtttct ccgtgatttc gccggcctgc aactgcgaga tcgcgagtat 49440aacgatcagc cgatcgatct catctgccga ctgccatgct gatgccacac gcaagcgcag 49500catatcagcc ttatcttggt tgatcggcat gctggacgag cacatctgtt gtcgcatcaa 49560ctgctgactg ctatatatgt gctggtgctg aatcgatcga ttgtcgtcac ggaagtgaag 49620aacaaccacg gcactgctgc ctgctgggct ctagccgcca tcagtaagta cgctatactg 49680cctatctaga tctagatcga gattacatag tggaattatc tgtttataac aaaattacaa 49740ggtatcaatt gataatttaa ggttataacc gtacaaactt cagtgatttg ctggtttcac 49800attggttaga tttgtttcaa ctaatttggt acttctgtag ccttgtaatt tacgaatcta 49860gtattaatat tttcttaagt attagcctgt tccttgatat tatgctgttg agaaagtatg 49920caatagataa caaaaacaag taggtgtgtt gaggatgctc aagagtaata caggcacttc 49980aataattctg atattatcag gacatcatca ataattctgc gcctacaaat cttcaaagaa 50040aattttaata taatgcgtat gattttttaa atacgaatat tgattgctat ttaaagatat 50100ttatattata tggtaattat tatttgaagg tttataataa aggcctccgt ttttagtttc 50160acgctgggcc ttcagaatct caggaccggc cctgctcatg atccttacac cgtgtatcct 50220gtagagtact tctctaaaag agagtaccct agtggaagta gcaaagttgc accatctgct 50280tcatacgaaa gatatgcagc aactactcgc ttgcctaata gagaactgcc ctcatctatt 50340agtcctggtg ccgattatat gtcctgccgt tcttatcttg accaagtacc tactgatagg 50400tactctaata gggttacact acaattaggc ctcttgagag ccgggaatag taatgtgcaa 50460
      caattaggaa tcaccagagc tggaaattcc aatgcttatg attatactga ggtacatttc 50520caatgcgtta gcttgcctct tctttgcaaa tggccctcgc ctgatatgtt tccattagaa 50580acatgaaacc atatatttga ctgttgcatt atgtctattt tcttccatga tggttcagac 50640gtctgaaaaa aggacaaaaa tattctagaa tatgtcatgg tgatccaaat atatccttct 50700gtcttgtgcc cactctaata tctatcgttg gtaacactat tcaattgtta ccatgttgtt 50760gcaaacccta gattcagtta ttcagctgtt ctctgctgct gttgcttacc agttttctta 50820gttgggtgtt gatcttttct cattttttat ttccttgttt cctggttcac ctgctgcctc 50880tctgatgcat ctgaatgtat atttttgttc tcttcagtgc ttaatagatt taaatttcat 50940tcttttcagg ctgcggagct gatccatgga cgtgaggatt accgaagact gtcaggtctc 51000actgggtatg gcttacgcag actgaatttt tacaggacac aaacatgaat tttgtcctca 51060taatcattga gtgatgatct ctttgcaggt atccaggtgg ctctgtcgaa ttgtggattc 51120caaatagtta actggagtct gtcattggtg ttggtggtgt caatctagct gagatccgtc 51180tggtatagcg taagagaaac atcatgcact atccccagtc ataaccatgc cccaatggcc 51240accaatagtt ttcctcgtga aaatctcccc ttgatcccag atctctggtg cgagagtgaa 51300gttgcacgaa gcccatcctg gttcttccga gtccattgtg gagatccagg gcattccgga 51360tcaagtgaaa gccgcacaga gccttctgca aggcttcatc ggcgcaagca gcaacagcag 51420gcaggcgccc cagtcctctc gcatggccca ttatttttag taagctggag gacattcgca 51480acaggggggt cagtggtcac tgcaaagctg agtttgttct tcagttcaac tgcagaaaat 51540tgcagatcgg ttgccgtagt tgctagaacg gtacatagtt gccacctaac tgtagcgagt 51600ggcataactt attgtgtgtt actgcccaat gttgtctctc cttgtgttca tggattcaga 51660cttgtgattg tagtatttct ggatcagact ggagtaaaag aaaaaaaaaa aggaagacat 51720gggtttaaca gtaagctcaa aacgttgaca gtagtaaaat aaaaggggtt tgttcacttt 51780atttccaata tcaaccttac caacatttgg cgttgaatca tttataccac atcgcttgtg 51840cagctgaatt tggggctgtt taaaagatgg tctcttggat tgctaattgc ctcgcggcaa 51900gcgtggtacc ttgtacaata taaatataat tataactatt taatttcata attaaacatg 51960ttgttacaaa tctctactat tataaaaatt gaagatgttt tttgccggta ttttggtacg 52020tcatctgtgt atgaatccgt ttttaagttc gtttgctttt ggaaatacat atctgtattt 52080gattcagttt ataagatcgt tcacttttgg taatacagaa ggaatcatat aagaattctg 52140tttaaaaaca ctcgtatagt aacttgagac gatcagacgc ctaactacag ctcatgattt 52200
      tctaaatata tatatatata tatatatata tactagaaaa aatatatgtg tgttaaaagc 52260tatcttaatc ttattattgt tatatatttt agttaacaag aaatctattg tgggaacttg 52320tttggatata tattttttta aaaaaaatca tgagctgcaa ttaggaatcc aatcgtctca 52380agttagcagg agggcgagtt tttttaaaga gatttcttat acgatttctt ctatatttct 52440aaaagcaaac gaacttaaaa accgactcaa acatggatct gtatttccaa aaacgaataa 52500acttaaaaac cgactcatgc acagatgatt aatttttata atagtagaga taaacgaact 52560cccacagtga attttatttt aactgaacca tataacaata ataagattaa aatagacttc 52620acccgttgca atgcacgggc attttttcta gttaaagaag aaataaaaaa acacaaaaat 52680ttataaaatg taaaaaagaa aaatattata attttgttag aattattatt ataatataga 52740aaaatagttg ccaaaatttc tcaacgaatg tcgaataaac tcagcaatgt catatattta 52800aatatgatgg taatatttgt tcgcaaaact ttaatcttca atccttcaac aacatagata 52860tacaacgtcg taatcgccaa caagcccgag tgaccataca ggatagccga gcggtggatc 52920tgtactgttc ttgggtgaaa taaatctagt acattgtata tcttatctta atatctacta 52980ttataaaaat tgaagatatt tcttcaaaga tttccatacg ttctctactc cgttacaata 53040tcggttctac tccgttacaa tatcggtttt gtacaccccg cgcacgcgtt gtgtgttctc 53100ccgttccaat acatgaagct agagtcttgc ttctccctgg tctggcaggc cctttttcca 53160ccatccccac cagggccagc gggttacatt gaccgatcac ggcccacatt agtggatgca 53220gccagccacg ctcttcacaa atcatgtgat gaacattagc tgagttaaaa tttatccttt 53280gatgattgtt agaaatgttt ttttctccac atcttctctt tcaattttgg aaaaatagat 53340ttcttgattt ttgtgctcgt acatcactaa taaatcagtt gttacccttc cacacattgt 53400caatttacca tgtctatttc agctcttacc ttgtatagtc ttgactcttg agtcctcgct 53460attgactaag ttgctacatg cctcctacaa atcaatagac tgccataaca atattttcta 53520cgacatgatc catattagtc catgcaatgc aagtacacac acactactgc acgaaaaaac 53580tatgcaccat aacttcaaaa ctaacatgtt agaatgacgt taatttttca ttacaattat 53640attcatcgac cgttaattta ctaggcatcc tgtttaaaaa aaatattcac cgaccatacc 53700cacatgttcc gtagttcatt aggtgatgga tcggtagtta cagcagctgg atttttatat 53760tttggtcatt ttgaaaaatt tatttcgcaa atagactcct gaaaaaactt atcccagaaa 53820tagtcccttt tggagcgtca gagtggctgg cgccgtggtc caacgggaca gcgccaacct 53880ctctggcgcc gccccccgcc tctattcttg tttctctata tagagttgca aactttttat 53940
      ttttgtttta tttttttgga tgttttttca ctcttagaat cacgatacaa ccaactacaa 54000aaaaaattaa actcgaacgg aatatatcac ttagctagaa gtctgaaaat atagcatacc 54060acttatctac tttgcacctt caccaaaatt agaccataac ttctttagta aaatcctttg 54120atcagcatat taaacataat gcactctatc actaggtgaa attacttaat ctaattcaaa 54180atataactac atgtagcctt gaaaaattct acatgccaca tatttcgtcc gtttgagttt 54240attattttta tggttcgttc atgtgagttc ccaagtgtga aaaaaaaata aaataaaaat 54300aaaaaagttg cacatcctct cctctgcatt agagaggaga ggagaggaaa aattctacag 54360gtcacatatt tcgtccattt gagttcattt tttctatggt tggttcttgt gtgttcctaa 54420gcgtgaaaaa aatatcaaaa aaataataat aaataaaaaa attcgggggg ggggggcgcc 54480agccactctt aggggtgaaa acgatcggat aatatccgat ccaatctgct ccgaatccat 54540ccgaaataag gatatggtat gggtttttag aaatctggcg gatatggatg cggatgagga 54600tatggtatct ccgaaatacg acggattatc cgacattttt gtcggattat ccgataggcc 54660ctttaccgga taatccgaaa ttatgaacac atgtaaccac tctatctatt gcatataaca 54720taagttggtc catccaatga cctaattcat caattaccct agatttctta ctatgtggtt 54780ttcaccattt catgtcacac ttgcgtagct gtatttttat aaaatggaca tcatgtattt 54840atgttgttta gcacttaagc acataattat tacaatgggt cgtttattga cattgtgtta 54900tttttacttg cattgctaac tcaatgttgt attgattgca tacacacgta acatctgata 54960aaatttaatc cgtttctgaa ccgattccgc accatttccg acatctgcat ccgtacacta 55020tccacaccca ctccgaatcc gcttaaaaat atggtttagg atatggtatg accactatcc 55080gtccgaatcc gctttatttt cacccctagc cactctggcg cgcttcccct gccacctcag 55140catcgtccca ccacgtcggc agaaggacgg cggctccagc cactctggcg ccacaaaaaa 55200ggaccatttc tagcataagt ttttttaggg gtctatttac gaaataagtt tttaaaagga 55260ccaaaatgtg aaaaatccag gttacagcag actgtgataa gcaatagcta tattgcctat 55320atatacacgt atatgcattg ctaatccttc aattttgtcc aattctttta aattgtcttc 55380acctgttgca acgcatgatt ttttttctag tcttaacctt aactaatctt aataactaac 55440taaaagattc gtatctttcc gatcgtcacc ttgtccatac gctaattttt cgtccgtccc 55500ccctccccct caaaaaaaaa gggaaaaatc cattttacac cctcgaactc ttatgcttgt 55560ctaaaataca cccccgaact ataaaaccgg gtataataca ccctcgagct atcaataccg 55620gacagttcaa gggtgtatta tacctggttt tgtagtttgg gggtgtattt tagataagca 55680
      taagagttca agggcgtaaa tggacttttc cccaaaaaaa atcccagtcg ttactttcca 55740tcctgagaat cggagacagg gaaaactgaa gcatacacgc aaatagaatc aaagataggg 55800aaaactaagc atatacacac aaatatatcc aaaaattccc atgcagctag atcgggtgcc 55860accgttgttg ccaaaccacc acattgcaat gtaaatctaa gactaaagcc taaatcctat 55920gctaagtcat caaattagac tcggttctac caatttggta atatatcaaa ttagacttga 55980tttttactga tttgaggttc tcgaggtgtc acactatgaa acggaagttt ttcccgttgc 56040aacgcacggg cactatgcaa tatcttaact aattaaaaga ttcatatttt tcctttcgtc 56100acaccgatct ttcgtccgtc tgtaacatca cgtgcacctc ctctccaaat cccacatcat 56160cataatccga cccaaaaaca aaatctcaat ctcaatccaa tcagaatcat cacaaaatca 56220tccaaaatat caagagatga ttataggaga tggaggggtg agcaggagca acatcatcat 56280cgcataaaaa ccccaaaatc aatcacaaca acgacatcat tatcacataa gaaaaacaat 56340acaaacaaca tacacaatca acaacactgg cggatccagc cgaggggaca acggcgtggc 56400agcgggcaga tcctctcggt cagatccgcc cacgggtgcc actgacgtcg ccgccgccac 56460cggatccaag ggagaagctt cggacagagg gagagggggg tagaggaccg ctaaatccgc 56520ccaccggaaa tgccgccgcc accacctccg tcggatttgc ccgagggagc gccgatgccg 56580ccaccgccat cgcgggagaa gcttgggcac ggagggtgag gaggaggggg ggtagagaat 56640cgccggatcc atccgctgga aaagcctccg ccggatccgc ctgccggaaa caccggtgtc 56700gccgcctccg ccggattcgg tagcgggagc cgccgatgcc accaccgccg ccggatccgg 56760tcggtgggag ccactgacac catcgccgcc gcctcctctg ctaccgacaa gggagagacg 56820agaggggcgg gggcgagggc gggggacgag agggttagag ggagggaccg agtgggagag 56880agagggacga gtgagaggag ggggacgagt gaataaggat gcgtgacctt atccactcgc 56940gcggtcgcac cccggctctt tctctcgctc agctgttgcg cttgtggaga ggatgcgaga 57000tttttttttg agtaaaatgc acgggcggtc cttaaacttg tagcggtctg tcatctaggt 57060tcccaaactc tcaaaatgca tatccaggtc ctagaatttg tcaaagtgta tcatctagat 57120cccaaaccga cacatcctct cttggatcct acatggcgct aatgtgactt gtcacatgga 57180cgtgacacgt cttttttttt cttcttttct ttttcttttc cgttttcttc tcattcttct 57240ttttttccat cttctgctcg ggtcacatag aaaggaaaag aaaggaaaat acaagagaag 57300aaaaaaagaa aaaagaaaat ttttaaatgg gtctcattcg tcagtcaaaa ttatgccaca 57360tcatgtccct gcgacatgcc acatcagcac cacgtagcat cctgaagggg ttgtggcgat 57420
      ttgggaccta aatgacacac tatgacaagt tctaggactt ggatatgtat tttgagagtt 57480taaggattta tatgacacac tactataagt ttaaggaccg cccatgccct ttactttttt 57540tttttacacg gagagaatgc gaatttgttg gttagttgcg gctgagggtt tctcgcacgg 57600agaaatttgc ggtgggagaa ttttttttcg aggttctttc tattgggaga agacgggatt 57660atagggatta ttactggtgt ggtggcccct gttttctttc tttttcgagc ttctttccgt 57720taaattcact tttctctctt caaggagcgt aggacatgac tgaatgcagc tgctgtaaat 57780tagaaataaa aaagaaacat attctgtttt tcattttttt caataggtaa atataaagat 57840ttttaagtaa tatttaaaaa tatatagtgc tgatcaacga cattgttaag tgagattttg 57900ctgttactat cacttttttt tccattgggc tcacgtacgg cattaaaagt tttagttttg 57960gttctctcct tttgagtttg ggcatatacc aatattgaga taggtatact aaagttcatt 58020tggattttat tcgattcaac ttttttgggt tttgttcagt tcttttttac atgtttctca 58080tctgaaatta ggaaattagg tttggtaaag tcttgaatag ataacgctgt tgacgtttga 58140acatatattt atctatttat ttatttaaaa atatatgaat aatttttatt ttgttatgac 58200ttttgtcggt gacatgggac cgggagtatc atgactagag gcttgggcag gagcgatcac 58260ccacgtggcc tgatgtaaca tcctgaaaat tcccaacaat aaaaatcact aaaattttga 58320actttttaaa acttttgcat catgctggtt gttatgattg ctattgcttg ccaaaccgta 58380aatgatcaca aagaaagtaa agtaaggatc taaaatttaa gtaatagata aatttacgag 58440aatataatat ttaattgcta accctacaaa taattacgca caagaaaaca aagccagaca 58500aacggaaggt taattactaa tttaaattat ggattaatta ttaaatactt gaaccatgtg 58560ttgcgtgcca tggcatctaa atacacatga aataatggtc atataattaa attaagcttt 58620ataaaattat gtgaggtttt aattaagcaa ttagcttaat gttgtaccga gtcttaatat 58680actatttata gaataaataa attcaaccta tccgtgtaaa atatattgct ataagttcat 58740tcaatgtact attgtaataa taatggccac attaggatat tttaattaat tttggaaccc 58800tcaaagcctc caaaattatc taggttaatt ttgaaattat acctcattta agtaatgcaa 58860tagaaaaata tacataaaaa taaaatatgg gtaatattag aaattgagta aattttcatc 58920taaattaaaa catatattgg gtaaacctcc tttatgtaaa aattaagatt tatagaatga 58980aatttgtaca agggataaac taaaatcggg ttaaatagaa aatggcactg ttcattgcac 59040tctaggtgct cgacgtggtc cctggcccta ttttccccct cagccgcgcg cgcctggctg 59100cctcgcgccc cgcgccacgc cacccgcgtc gcgtcgccgc tgccgcgccg tcgccgtcgg 59160
      ccgttccgcg ccgctcgtcc gtcgctccgc cgcctcgcgc cccgcgccgc gtcgtcatcg 59220cgtcgccgtc gccatcaccg cgcctggccg cccctgaccc cgcgccgcgc cgcgccgtcc 59280cgtagccgcg tgcgcgttcc atcgccgctg ccgcgccgcg cgccgtcacc gcgcgccgct 59340cgtccgccgc gcatagcccc gcgccgccgc gccatcgtgt cgccgcgccg tcgcgtcgct 59400ctcgagcccc gcatccctct cgagccccgc acgtcgcgtc ttgtcgccgt tgctgccgcg 59460tcgtcgtcgc cgatgctgtc gcgtcgccgc tgccgcccgt cgcgtcgcct tgcgccccgt 59520gccgccgctg ccgcgttgtc gctgtcacct tcgcgtcccg cctcgtgccg cgcgccaccg 59580ctgccgcccc gtcatcgccc gctcgtcgcg cgcgccgccg ccgctgccgc gccgtcaccg 59640tcgtgtcgcc gtcggcctcg cgccttgagc cgccgcgcgc ccgtcccctc gcgcctgcgc 59700cccgccgcac ggccgtcccc tcgccgtcgc cctgcgccac tgccgcgccg cccgtcccat 59760cgcgccgagc cccgtgccgc cgcgcgcgtc gcgtcgcccc gcctgtcacg ccgctcgccg 59820cctcgagcca cacgcgtcgc gccgtcgcgt cgccattagg gccggccacc cctttccccg 59880cgccctataa aaccccccgg ccacccccct ttcaccccac accatcccca cccattcccc 59940tcttcctctc ctccttcccc tcttcgtccc ctccaccgcg ccgcgccgcc gccttcgtgc 60000cgccgcgccg tgcgccgtcg tcgcgccgcc ctcgcgccgc cgcaccgccg ccttcgtgcc 60060gccgcgccgt gcgccgacgt cgtgccgccg tcgccgtcgc cgtcgtcgtg ccgccgtcgc 60120cgtcgccgtc gtcggtaagc cgccgtccct tccctcgttc cgacgccgtc gccgcccggg 60180tgggaaggag ccgagagaga gagggaggaa ggagccggga gtaggaagaa agaaaagaaa 60240agagagagag agaaaagaaa agagaagaaa agagaaaaga gagaaaagaa aagaaaagag 60300attagagaag ggagggaaga gtgggcccca cctgtcatta gccccatcca attcccctta 60360gaaaaataat tctgtagaaa agaaaatcaa gatcttgacc ccacctgtca gtcactatag 60420cgtgtggata aggttgtatt aaaaataaat gaattaggaa cagtactatt tcgcaactat 60480tagaattaat tcaaatttga atctttacac tagcataact aattcatttt agctccgatt 60540tgagtggaac ttgaacctaa attcatctaa attcataagc tttccaatgg tatataattt 60600actattaaat aaaatatatt tataattatt aagtaattaa tatcatatga ttaggttatg 60660gtcaacttaa aaatatgcta ataaataaaa ttagtattgt ggatgtaata atatttgtct 60720ctaacatgtc ttgccactgt aacaaccaca caaactaata ttaagtgatg tctgaaatga 60780atgaatgaat aggaaaatac tagtacttgt ttaatattcg atagccatat aattaaaccc 60840atggcttata ggttatttaa atcaaatgta gccttgtgat tatgcaacta aaatataaac 60900
      acatatagat gaatctttag cttgattagg aggaataata acagagctag tgtgactagt 60960tatgatatag cttgttgtcg gttgcctata tttagtaaat ggttcaatgt taatacactg 61020atgcacacac ataccctttt tgataaccta ctagttgcat atattaaact tggtaataaa 61080tgaagaacca atatattagc taaatactgg tgctagttat aaatcttgac cacacataat 61140tttagttcaa accacacctg aggattgttc gttataaagt tataaagtta taaagttata 61200caaaagataa tatgtaacta taatagtatt aaaccacaaa tctaaaatac agggcgcata 61260attgtcaacc ttttatgcaa acggataata tccatatata tacatcatgt ggataattcg 61320aataatagct ccattggtaa aataataatg taggcgaatc atggtgatga gatggtttat 61380cctaaacctc cccatcgaca tagccatgct atagggacct gaccatttta ccttcataac 61440agatctcttc cataagccaa tagctagact aaaccacaga ttagcaaatg tgtacatcat 61500atattgtgct agttagtacc aatagaacca tcaggacaat ataaatacta aggaatctta 61560gctcttagct tgattagaat ccaatagcaa acacgagtag tatgagcagc cttaggttcg 61620acctcaataa ttatattttg cttgtgcata attgcttctt gttgaatatt ggtttttctc 61680gcatattata gaaattgtat atcggttagt cgtgaggcaa cgtatgcagc tttcaggagg 61740tgaaggttga tcaagattgt atcaagaata atgactattc taagcaggca agtcatcact 61800attccttgaa catgttgatc ctaattgcga aattattttg tttacaaata aaattgcatg 61860caatgatgaa catcctactt gtgattatgc catgccttga ttattgttta cccttaaaat 61920ccttgtaacc atgattacgt atgagtccct agtcaattat gacaattgct tagagatgct 61980attctagaat catgcatact catatttatc aaatgctata tgcttgggca attacctttg 62040ggaaggtaat tgagatgcgg catgtggaga catgaacgcc acattgccat gatattaatg 62100acatgatttg tgaaaggaga aataaaatta aacaactgtt ttcgactggg gcggacggag 62160gatttgggtg gtatctggaa aaggctagta ccgtccccgg tcaattaagg accgagccat 62220gaagttaagc atgaaacgac ccccgtacaa ccgcacttct cgtatgggta tagacctagc 62280ggagtagata gctgagcgga ggcagtatcc atgcatagtg gtttcttgat gtgtgaggca 62340ggggctctac ggtggggcag ccattggtag gaccgcaagg cgggtatcta cagtggtgtc 62400gccatcggta ggactgccat gtgagaatct aaaacataat tataacttaa tgcatgtgtg 62460agtcttccct tcccgggtgc gccagaactc ctctcactgc tagaaaccgt gtacgcctag 62520agtgcatgag gatgaaaagt tcatggagcg ggtactgcca atgcgaggtt atcgaaaagc 62580tctgccgtga cgcatctcat gtgttgggac gaggctcatg tgttgggcag tcgcggagtg 62640
      cgggtaaagt gtacatccac tgcagtgtga gtaaaccaaa tctattcgaa tagccgtgct 62700cgcggttatt gagcaccggg acatgtatta cacttggcta gactctaaat tcttaacttg 62760tggggaatgg gatattgcat gatgaatttt atgctgatgg agccacatcc cgagaggagg 62820gaaggtggac atcctcagaa aaccatgacg attcaatggc gggaagctat ccttgggatc 62880acaatggatg gtggacagaa ccgtcgttgt ttaaagtgaa cactggtact aaaatttgat 62940cgatctatgc taggttttag gcttgtgaaa agaattgtaa aattagcttt atgcaaaagg 63000acctgaagcc attccttgaa ataccctcta tcatatgcat tgttattatg gtggcttgct 63060gagtacggtt ggtactcacc cttgctattt atatatcttt taggagagtg ttgaagagaa 63120gcccttgtcg gtacgcttgc gtatcccaca agatgatcgg agtgcggtct tgttctaggt 63180ctcgtttccc cagtcgactg cctgtggcat gttaaccggg cccttatatt attttgtctt 63240tcgctgttgt tctctgatag ttgttggcct acctggccct aatgtaagta tttaactctt 63300ttagcctaaa ttcattcgtg atatgttgtg atccaactat gtatgtgtgt accaactact 63360gatccaggga ttggtacgga taaacacaga agatttccga tttccaaaat cgggggtcta 63420cacctgaccc cctcaggggg ggggggtcgg gcccgagggt gatgtggccg cccccctctt 63480tgtctccccg aggggtcgga ccgctcccgt ttctgccccg agggctgagg cgccccgacc 63540ccttgtgggt tttgcgccgc gtgtatgggt taggtgagca caacggggct cacctaaccg 63600tatttattgt ggtttggacg agcgcgtcac gccgcatgta gcgcagtgca gcgcgctcgt 63660ttatccggtc tgtgaccagt cacagaccgg tcagatcgtg ggttaggtgg caacaggcgg 63720tctgacacac gcctcgcccc atcccgtcag gataagagcc tccaggcact tgtccctagc 63780ccggagccag catgctaact cctggagatg acacgttggt cccggtcaga tatatgccag 63840gcttcatccc aaccattaca agcaagatat tgtatgaaga agggcgaaca tgcagattgc 63900tggactgaca cgtggtggac aagaatgacc gatttgtgac cggtctgaca ctggtcatgt 63960cgtcggcaga caaccatgtt cccacgttgc acctgctttc ggcggagtgg aggtaggtat 64020gggccatccc atcagaaggt cgttcggaca gcagccattg caagtctccg cccatttatg 64080aagagatgac agggtgatcc cctggagaga aaaaaaggag gaccttgccc acttaggagg 64140tgaggacgac tggaagggga gaggatctgg agagtagatc ccacgagagg aaaaaaggga 64200gaagagggtt tctagagtaa gagctctctg actctccagc tctttgtagc ttcttcgtac 64260acagatccac cagaaaatag gagtagggta ttacgcttct cagcggcccg aacctgtata 64320catcgcccgt gtcttgtgct tttttcattc tcgcgaactt tccacagact aggagcttag 64380
      aatctcgccc agggcccccg gccgaaccgg caaagggggg cctgcgcggt ctcccggtga 64440ggagccccac gctccgtcaa ctttggctta taattaaaaa tactctaagg atattttttt 64500atattttatt ttcttatgtc tatatgaaat tttaaataag atagatggtt aaacatatat 64560tggaaaaaca tatatccaaa agtccactat cacaagcgta gcatagatac gattacaata 64620cgtttccgcg aagactgttt atacctactc tattccctgt tccttgtgcg gttgtgccat 64680ttggggctgt tttttcatct cggattaact cgcgtggaaa ccgcgagacg aatgttttga 64740gcctaattaa tccgtcatta gcatatatgg gttattatag cacttatggc taatcatggc 64800ctaattagac ttaaaagatt cgtctcatga tttacatgca aactatgcaa ttagtttttc 64860tttttatcta tatttaatgc ttcatatatg tgtccaaaga tttgatgcga tgttctggga 64920aaatcttttt ttaactaaac atgcccaagg tgtttctcca attaagttga cccaaaatca 64980ttcggcgtca cctttgtctt tcactttcct tccactacaa ggtgatgaca ctgacaaaag 65040gtccaaaagc tacaggatct gatttttgtt catccatctg tgatgtgtcg gcaagccatc 65100catggagttc atccactcaa ctcctctctc tcagagagag agagagagag agagacagac 65160agacacatgc atgatagatt gtgctagtac ggtagtaaca ttttattgcc tccttttcta 65220aaattctagg ttgtttggaa aacaaaaatt ctagattgtt caataaatta ataatattag 65280gtatttattt taagtcactt taggtgttaa tttttgaatt ttaaactgct taaactctct 65340ttcgacgcat ctgagagcag gtacaatagc agactataag ccagctataa atatatttta 65400agtagataaa agaggaaaaa taagagtagc gggctataga tttgtagaca gctgcagcgc 65460gagctccaag atacatatgt gtatgacatg tgagaccaaa cattaattat gtagtatatg 65520tttatatgta tctattgtat gaattggcta ttaaattgac tatgggtgtg ttcggaggtg 65580ggtgttggga accatctccc aagcacggaa aacggagcgg tccattatgg cgtgattaat 65640taagtattag ctatttttta aaaaaataaa tcaatatgat ttttttaaac aacttttgta 65700tagaaacttt ttgcaaaaac tcaccgttta gtagtttgaa aagcgtgcgc gcggaatatg 65760agggagaggg gttgggaacc tcctcatccg aacgcagcct atacatgatt tggagccaat 65820agttggctat aatattaaac ttgctctgag tggctcttga atcatcgaag tgatagaaat 65880catatgcaga aatgtttata tttgtgatgt aaaatttgaa tctaaaatta tttatatttt 65940gaaatggagg aagtactacc taaaacaagt atgagaaaga gacatgaaaa acacaaaatc 66000tagacttaaa aataattgga attactagca ggaggtcgaa gtcaatcaag acggcgaaga 66060aaagcacagg ggacagcaga cacgttaaca cgtaagtaaa caaacaagtg gttaattaat 66120
      tagggggccc tcaagtctcc cctaaagcca ctaaacatga caggtttgtg taccatggaa 66180aaaagggtga agcaaaactt tattctctct ctcattagat taccagttgg aaagcaatcc 66240tgggacctct agctaatctc attattgtag aacaacgttt tcttagagag agagagagag 66300agaaataagt caataaaaat tactactaat ccacttgaac cagttctgtc ggtgtcggat 66360gatttaccac atttgacgaa acggactatt tattcgacgt ttcgaaaaac acactttttt 66420agaaaaaaaa aactttcctc tattagccac tcgttttagt tatataccta tccgagtatc 66480tgttaagttt atttatcaaa atatttaatt tatctctata attaaatata caatccgtaa 66540aaacaatcac gcagtaattc gtttcaaact gagcctcagc tagaaaatca aaatggaaat 66600gaataacaat agcaacagta gagttagttt ttcggcttat catccgcaac ccaaatgcga 66660attttaaact tagccttaga gttaattttt aaggcttgtt taccatactt cattttccca 66720gcattagttt cttttgtcac taaaaattgt ttttttaagt tgtttcgttc attttctcac 66780ggtttatcag cagtagagcg aagccattct tggagcctgt ttggcacagc tctagctcca 66840gctctagctc cactctttct ggagctggag ctcagcccaa cagttttagg tgcaccaaaa 66900ttaggagtgt agttgggtgg aactctctca caaaaaattg tggagctgga tttagacagc 66960tccacaactt cactccaaac ccaactcctg aagttaaatt gataagttga agctctatct 67020atcaagccct ttttcttgat catgcttcta cctactccat ttttgtttct tggccctcac 67080aggaattgga aaggaaaggc gtatatgcat caatgcatgc atgcgcacat caacctcgtc 67140catcaaccat cataatcatc atcatctcgc cagctgacga aaatgacctg catccatcca 67200tcacggacaa tccaagcgaa caccgctacc aacatcacag ccaacctgtt tatcactagc 67260tcttgatacc actcctacat aaacactacg cgcaggttaa ttaattaagc gtgattactg 67320aagtaacatc taatcacgtc ctggttagcc tttaataaga caacagttag agcaggtaca 67380atagcagcag gatataagcc agctataaaa aaagagagaa aagagcaacg ggctacagat 67440ctatagccag ctgtagcatg gacttcaaga cacaacgtgt gtataacagg tgggaccaga 67500taataatagt gtagtatagt aagtaactat tatatatatt gactatagat gatttggagc 67560tattagtgtg ctatagtatt aaacttgctc atagagcagg tacaatagta ggatattagc 67620cagctataaa catattataa tgagataaac attgatagag aagagcagcg ggctacagat 67680ctgtagccag ctacaacacg gactccaaga cacaacgagt gtatgacaga tgggaccaga 67740tattagtagt atagtaagca actattatat aaattaacta ttacattggc tatagatgat 67800ttggagttag tagtgggcta tactattaaa ctttttctct tagcaaaaat caagcgccta 67860
      atcacattag aggagtagct ttgagacaaa ccaattagcg gcgaatcaag cgatctgcgt 67920ggtcgtacag tgatgggccg ggccgggccc acagcccgac agtgacaggg ggcctgacgc 67980atgtcagcct cagccctgga cgggagctag ccgttgtgtc cccgggggag gggagggggg 68040cattcccatc atttcgcccc tcctccgggc ccacatctca gtgggggtaa aggtgtaaat 68100tactgcgacc gcgagtccag cgagcctaga tttggacctt gtgtccgttt gactgaaccg 68160gagctactcc ccaatacggg gggattgcgt tgtgtgcatg ccatgtgggc ccgagcgccc 68220tttgttcgtg gctttgggtt ggaaaggtga ccgtgtgagc tgtgcggtgt tgtactacgt 68280attagtataa atcatttttg ggtactactc cctccgtcca aagcttattt ataatttgtt 68340gtactccaac cgtccgtctt atttaaaaaa aatataaaaa aaattaaaaa aataagtcac 68400acataaaata ttaatcatgt tttatcatct aacaataaaa aatactaatt ataaaaaaat 68460ttcatataaa acggacagtc aaacattgtc acgaaaatct aatgtttgcc ttttttttta 68520agaccaaggg agtatctacg aacaaagata atacatgtta taatcatgaa gcccatgatg 68580tgattagccc ggccgtttga ctaacctcac gagctacgtg gctgacaagt ttaacttgtt 68640aactccatca tttcggatac ttagagcatg tacaatagca gactattagc cagctataaa 68700catattttaa tgggataaaa gatgagagag aagagcagcg ggctacagat ttatagccag 68760ctgcagcacg gactccaaga cgcaatatgt gtatgacagg taagaccata tgttaatagt 68820atagtaagca actattttat aaactggcta ttagatcggc tatagataaa ttggagctag 68880tagtggacta tactattcaa cttgctctta tatgatataa atattgatat aactatatga 68940ttttgttaat gacatgtttg tttatggatg gactatgtgg ggtcggtcgc ctccgtagct 69000gaccaaaata caaacttaaa acccctatct ataaaaatct aacttttgtt tataaatata 69060gatataaaag ttcataatta gagcctcatc ttttaaacga aaagagtact atgaaaacaa 69120ctcgtaatac aaagactaat tacgacgaaa agaaaatagt actgacaaga ggaaagcagt 69180gaacttgcat actccctccg taaaaaaaac caacctagac acggatataa cactatatat 69240ctagattcgt tcgttgtaat gaagtgtcac ctccgtatct aggttggttt tttcgtacga 69300aagaagtatg agtaaatcta aagctatgta tacccttcgt caaaaaaaaa aagtaaacct 69360tgtactggtg cgtgtcacat cctaatataa tattgttttt tatggagggt gtacagttga 69420aaaaaattga tgtgttttaa ggatgaaaaa tattggtaat gttggctatg taactctaga 69480aaaaaaaatg cagtaataat aaaatgctaa tttgctggag tactagatta tagacaatcc 69540agtccaggac acgacaccct ccctactctc tccacttcca ctctcaccgg ccaccgcgcg 69600
      ctctctctct ctctctcccc cttctcccgc aagattcttc ccccaaatcc cacccgatcc 69660accgccgccg cccgctcgcc ggagtcccat cgctgccacc gccgccggag ccgcggcccg 69720acgcccgccg ggcctgcttg ctgtgtgtgt gaggaggtgg agttgctcgc gctcgttccc 69780gcggccacct ccgcctgctg ctgcttctgc ttccgctggc attgcgggga ggtcgtgtgc 69840cgggggacgt gggggctcgt gttggagcgc ggctgccggt gaggtggggg gtgcggcgcg 69900gcgcggctcg cgctcgtgcg ccggtggcgc gggcgcgggg ggaagcgtac gggggagggg 69960gagtgtggcg gcggcggcgc gcggggtagg gacgggcgcc gccaccacca ccggctcgtt 70020cgctggcagg cgctacgcgt ccagatccgt acgccggtat gcttcgtctc gccgcaactc 70080tctccatttg attagtatcc cctcgccgaa acgaggcctg tgaggcgccc gctttctggc 70140tggcttccct gtactcgctg cttgctcctg cctgttgggt taacccgttt ccatcgaatt 70200tgggtaagcg aaacatcgcc tcatatgggc atttggggtt ctggcagcct taggctcgcc 70260atccgtcgcc gagcttccaa gtgaccggcg cttgttggta tatttgcttg cttgttcctg 70320tttggtggct gcgctaaatc ttttgtgctg cattgaattt atgccaccca tatacagcaa 70380attactgagc tgaaataatt cggctaatta ggtccagcaa tatgacatct cgtggattga 70440atgctaagct gacattgtat cactgatgct ggcttatata taggttgttg agaagtgaag 70500atgtcgacag gtgaaaccct gcgtgcagag ctatcatcca ggacgccgcc tttcggtttg 70560aggctatgga ttgtgattgg aatcagtatt tgggtggtga tcttctttat actaggtttc 70620atgtgcctct ggtccatata ccgaaggaag ccgaagaagt cctttgataa gattccagta 70680tctcaaatcc cggatgtttc caaggagatt gcagtagatg aagttcgtga gcatgctgtt 70740gtcgaaaact tccgtgtgca agaaagccac gcgatatcgg tgcaggagaa acattacgag 70800aaagattcag ggaaaatgct ggcacacttg gttaggagta aatcgagtga tgccgataat 70860ttgagccaat gcagctcggt gtaccaatgt gatagggctg gtagctcgta ttctggtgat 70920gaaggcagct cgggcaatgc taggaggcac ttttctcaat atgcaactgt ctcagcatcc 70980cctctggttg gtctcccaga attctctcat ctgggctggg gtcattggtt tactctgaga 71040gatttggagc atgcaacaaa tcggttttcc aaggagaatg tcattggaga gggtggatat 71100ggggtagttt accgtggtcg actcataaat ggaactgacg tcgcaataaa gaagcttctt 71160aataatatgt aagagatcct gaaatctatt ctgcgtttta cagaacttgt gactccttct 71220gatgccatca tattaatttt cttttgatat ggtgctgcag gggccaggca gaaaaggagt 71280tcagggttga agttgaggct attggccacg tcaggcataa gaatcttgtc cgccttctag 71340
      gatattgtgt tgagggaatc cacaggtaaa gctatttatc aatcaccttt gctgatggat 71400ggctagcttt tgtttctact ggcacattat ttacttgcat agggatgtag gattgctctt 71460ggtctatgtc cacctactca ccagattatc tcaagggata ggttattcct gactgcactc 71520cttatgctat cgattttttc ccttccaaat ctgatggtgg gattcagcat gcccagtgac 71580agattatgct cagtccacag aaaccttctt tggaccacca ttcttttacc atgaaaatgt 71640ggccatagct ccgaaagcta ggattcacta gaagcgcaca actgcttatt ggtttgttag 71700ttggctataa caaggtctta ctgaaatgta cttccatagt tcattacttt gtgaatgcct 71760gttcttgttc ttcacgtttc ttctcatgca tgttcaattc taaatttgta ttcatgatat 71820gtccaagcta ctgtattctc caaagaaaat cagaagtcca ttcacctatg tattttccag 71880ttttccgcca ttttggatac tgctctagaa acaagttaat aatatagata tttatatggt 71940ttggccagtg ctgcttaagt gaccatcgag atagaaattg cttaagaaat atactaagat 72000gttgagtgtc aggtgttttc ggataatctt gttaccaaca aataggtcct atgaatataa 72060tggtgtctgc ttcacgtaat tcaaaatcca cactcagcca aaataatctg caatagggtg 72120ttgaaaatat gattatgttt ctcccttgtt ttcatcatga ctacagaaat gaacaatgtt 72180gctacatctt gtaataattt gtggttttca attgaacaaa acatccatca aatgatatct 72240acagcaatat attttgcact tctgagcaca caataggttt gagtgtattc gagtcatggt 72300cattgattta agctttttat ttcactacat aaccattgat ttgagtgtat ctaaggagtt 72360ctgtttccac aagtacttta tgttaatggt gtctccttat gctttggcca tccaaactca 72420ttactgttgt ttaatatttt tagtggttag tggtgtccaa atctttcttt gtgtacatca 72480tactatgttt ttgtagtcta ttaaacttcc atcctatcat ctgacttgtt atattccagg 72540atgcttgtat acgaatatgt gaataacggg aacttagaac agtggcttca tggtgccatg 72600cgccaacatg gtgttcttac ctgggaagcc cgaatgaaag ttgttcttgg aattgctaaa 72660gcgtaagaaa caaaccatcg tccccgtcaa aaagaaaaga attgttcttc actttagctc 72720ttttatatgt atatgtttag ttgcataacc cattttccat aactgaattg gtatacaggc 72780ttgcttattt acatgaagca atagagccaa aagttgtaca ccgggatatc aaatcaagca 72840acatactaat cgatgaagaa ttcaatggca aactttctga ttttggcttg gctaagatgc 72900tgggtgcagg gaagagccat atcacaactc gagttatggg aacttttggg tatgttgata 72960tttttttgga gttagtatta atctttccta tgcttagctt ttactgttgg aatgtgcagt 73020acttcgctta ttcatacagt ataaaatttt acatgctgcg aactttgtcc ttcgtatatt 73080
      ataacaggta gctttctcat tgctatcatt gattcatttc aggtatgtgg cccctgagta 73140tgccaacaca ggtctgttaa acgagaagag tgatgtctac agttttggtg tgctattact 73200ggaagcagtg actggtagag atccagttga ttatggccgg cctgctaatg aggtgagcat 73260atatcctaca atctcatgcg tattatgtat gttacaaaag tccgtactat tggaaattat 73320tttacggcaa aataacgtct atactaggag agacgaattt gcttcaggtg tatggctgtc 73380tggcagttgt ctactgtcta gttacccttg tctcactttt acagtctatt gttttatttt 73440tcaggagctg actagctgta taccttgtca tatataacaa cactgtaacg tggatgcctt 73500gcaggtgcat ctagtggagt ggctcaaaat gatggttggc acaagaagag ctgaagaggt 73560agttgaccct gacatggagg tcaaaccgac cattcgggct cttaagcgtg ctctcctagt 73620ggcactgagg tgcgtcgacc cagactctga gaaaagacct actatgggtc atgttgttcg 73680gatgctcgag gcagaagatg tcccatcccg tgaggtggta acgctttctc ctttcctgca 73740ataacattca tcatattata tcattgcaat aaatctgaag cttttgctgt aatcctactg 73800aaggaccgga ggagccggag gggcaacact gccaatgcag ataccgagtc caagacaagc 73860tcaagcgaat tcgagataag tggcgataga agggactcag ggccatcagc aaggtttcaa 73920ctctaagaag acggtgatca tagtcaagaa caatggcttc aaaactctat gcagtaacat 73980ggtggttggc agagaaaaag gggtatttct ggagggcatt gcattttgta ttgtaggtct 74040gcatggcggt agagactgga gagagcacag tgtctgatga tggatacccg gagacctgta 74100attcccattc agtattctgt ttgttagtca agcagcttgt acagatcgtt gtctgttcca 74160ttttttcatt cttctggttt ttttgtttag gaggctcttg gattaccagt acgaaccgct 74220gtctcttttc tagaatcacc aacatggaac ctatcaatat ttactactag tactacgact 74280tgctttcttc ttgctgagat ctatcatgta ctgtacataa ctgacgtgtt cagctgcact 74340tggacaagta gatgctcgtt ctgtatgtcg aatttacttg atgaggtcga gcattaagta 74400ccatggctgc agccggcttc tgtttagttg tgctgacatg cggcggcgac ctcacgctgt 74460gtggcccatt cttgatcttg ggccgaaact gtagcaacgg gcgtacggcc catctatatc 74520gggattgttc ggcccgttgt agatgggccg gatcgggatt gcgacttacg tgcgacccat 74580ttcggttggg ccggtggtcc gctacttcat ctagcagtgg tcggcggcag ggttcacaat 74640tccaatagaa tccaaacatt attggattga gttaaaaaca caaaccaatc ggctttttgt 74700caggttcaga aaattttaaa ctgaatttta attttttgac aaaaatctat ttagatttcg 74760tctgtttttt taggtttgtc aacggattca gcgaaatccg atgatatcgc tcgtgagtgg 74820
      atttttgatc cggtatcgag attgtgaacc cttgtcgcgc attgcctgac aaagacaacc 74880agtgaagcgc cgtgcgcgcc gcgtgcgcgc cgcgtgacgc gaagatgcgc aggaaggaac 74940aagctggcaa gcggcgcgcc catgacggcg gcggcgacga cgacccgcgc gcgtgcgtgc 75000gtcaacgcac gcgaccggcc gagatccgtc agtggccgcg gctatatata atacatcgtc 75060gcctcacacc ccccacacac cgagtcatcg ctcgccggag ttagagttcg tagcggcgaa 75120ggatatagcc atatattata gatggcgatt ggtgttggtg gctgctgcgc cgtgctgctc 75180gcggcggcgc tgctcttctc ctctccggcc accacatgta agcacgccca tcttcttctt 75240cttcttcttt ttttctttct tttttttttt tttttggaaa tgagccgcag ctgacaaaaa 75300gatcactcac acatggatac actgtcgtga cactaaccaa tgcctaagcc attttgtttt 75360cttgttttgg atttttcttt ttatgtgtat cacttttgct tgttgctctt gcagatgctt 75420atgattccct ggatccaaac ggcaacatca cgataaaatg ggatgtgatg caatggactc 75480ctgatggcta tgctgtaagt agcggtggca gtacaccaac atctctacct ttattttcgt 75540ctcaacctgt acatttacac tatcttgttc tactacctct aataaaaaaa tatatttgat 75600gttttaaaat ctattaagtt ctagagatta ggaaagctac acatggtttt atgttttgat 75660actattaagt agtatatttt ataagttata ttgaaggctg gggtttcaaa agtttgacta 75720cactagatct tattcaaagc gtctaatgat tactgaacgg aggaagtatg aacttataga 75780cttgaagtta aacagcatag ccacatctct tcatgtatac ttcatccgtt tcatattata 75840agattttcta gcattatcca tattcatata tgtgcgtcta gattcattaa tatctatatg 75900aattgggcaa tgctataaaa tcttataacc tgagaaacgg agggagtatg tcgcaaacaa 75960caacaacaat aacaacgagc aaaatctgta tcgaatccgg tttccctctt gtaactgtat 76020caaagatctg tcctctgaaa cgtcccctgt tcatcaggcc gttgtcacac tgtccaacta 76080ccagcaattc cggcacatcc agccaccggg gtggcagctg gggtggacat ggcagcagaa 76140ggaggtgatc tggtccatgt acggcgcgca ggccatcgag cagggcgact gctccatgtc 76200caaggagggc agcaatgtcc cccacagctg caagaagcat cccaccgtcg tcgacctcct 76260cccgggcacc ccaatcgacc tgcagatcgc caactgctgc aaggctggat cactgagcgc 76320attcagccag gacccggcaa attctgccgc gtcgtttcag atc 76363&lt;210&gt;28&lt;211&gt;53905
      &lt;212&gt;DNA&lt;213&gt;稻(Orza sativa)Asominori&lt;400&gt;28gatcagtgag tgagagtgat gtgctattga ttttcgtcta ggattttgct gtgctcttct 60tcttcttctc ctctctacca agaaagatcg atggaggaga atttgtagga cgcgtttctc 120acgaattact tagctgttaa tgatcagctt gatgtgtacg atatgatggt gcagagtgaa 180agttgtgttg ttcactggtg gatcatggga tgggaatatg ggattgttgt aagatgtaac 240tcaagtgttt tcttttttgg gattactttt ggtaataaga gcttgggtga tcgaaaacta 300cagatggttt ttcttttaag ttgtatgatc tctgtagagt ttttgagtaa tttgtagttt 360tgtaccctat caaagatcat ctctagctgc ctctgagctc tccaactcta tatgtccatc 420tctagtatat atgtcccata tttctgactg aaaattttca agtcggttgg ttccctccgc 480ctggatattc tttcagctaa ttagattttt tttaaatgat aaatttgcta aaagcttgtt 540caaattcagc taagatctat tcaaacttca atttctctat cgaaattccc ggaaatttca 600attcaatcat tccccaatac atgccgattt ccgtaatatt gaaccatgac atgtaaacaa 660cgaaggaatc aagggcatat ttagtttcat ctcacatcga atatacggac acacatttga 720agtattaaat gcactctaat aacaaaacaa attacagatt ccgccagaaa actacgagac 780gaatctatta agcctaatta atacatcatt agcaaatgtt tactatagca ccacattgtc 840aactcatgac gcaattaggc ttaaaagatt cgtctcgcag tttcctgacg aaccgtgtaa 900ttattatttt ttctacgttt aatactttat gtatgtgccc aaatattcaa tgtgacaacg 960tgaaaatttt tatttggaac taaataggcc ctaatattct ttcaagatat tagaatagtt 1020atccctctcc acctccctgc acaaacagtg aacttctttc tccttgggca caggagtagt 1080agcagctccc ggaaacagaa agcaatcaag caaagtcctg aacctgaagc atcctgaaac 1140cagcagacgg cagaaaccag tgggcgcagg cgatagcagt ttttcgtggt ccggcgtaca 1200gccaaaatac tggccatcgg gtgcctacat agaatgagtc cactggacgc agctaccacc 1260gtgtgtgcta cactgaccgc cgctgctcgt cgaccagttg tacggggctg acttattctg 1320aatttctaat ggtttatttg ggggtttaga acactgaggg gtgctttaga tccaaagatg 1380tgaagtttgg gcgtgtcaca tcgggtatta tatatagtgt cgcacagggt gtttgggcac 1440taataaaaat actaattatt gatcctatac gataagctat ataatactcg atgtgacacg 1500ccaaaacttt acatccctga atctaaacac ccttttaaat agagtatttg gtgtgaaata 1560
      taattttgat ttgggaagaa ggtgagtgag atttggaaaa aaaaagcatt tcaattaaaa 1620aatttgccag cagtaaataa agaaactact cggttttgta attaaagtga ggttttggca 1680cttctttgcc ctaaactggc ctccatttta taaagtgaga accgtgcagc aaaagcctga 1740aaaggcaaaa agaaagaaat tgtagaggtt tttcaggagg atacaactag gtgggtctct 1800aactctctat gcagctgtgg tctgtggagc aaaacgatga aatggaagac gggacgttga 1860cgagggtgaa gaaaacgagc gtttgaccag cgtcaaccat ggcgtgaaca gtagcaccac 1920taacctgacc gagaggttga agaagatgca atcaacgggg tactatagtt cccacgaatt 1980tcccagcaac aacgggttgg ttctcactac tcacgaattc cctgtggctc aacaactact 2040agtacatcct tttgtccatt atgataaaag ttctatctta atttttattt acacgttttt 2100caaactgttt tttaattttc tatataaaaa atacttaaaa tatcaaataa aatctatttt 2160tggagtttta aaaaactcaa ttaatcatat atattattga cttattttat tttacgtgga 2220ctaaaatatc ttcatcttca tttaggttat gttcttttct catcaagata catgatacat 2280tagcatgttt ttcaaactgt tttttaattt tgtatataaa cttactctaa aatatcaaat 2340aaaatttact tttagggttt ataaaagtaa aactcaatta atcattacta acttgtttca 2400ttttacgtgg actaaaatat cttcatcttc atctaaggtg gtgtttggat ccaaggacta 2460aattttaatc cctatcacat cggatatttg acactaatta gaagtattaa acatagatta 2520atgatgaaac ccattccata accctggact aattcgcgag acgaatatat tgagcataat 2580taatccatga ttagcctatg tgatgctgta gtaaacatgt actaattacg gattaattaa 2640gcttaaaaaa tttatcttac gaattagctc tcatttatac aattaatttt attgttagtt 2700tacgtttaat acttttaatt agtatacatc cgacgtaaca ctgatcgata caaacaccaa 2760ctaaatcgaa aatcaccgaa tggctcgtca tcctcccaca tgagatgcca agatggaaca 2820ccaacaatcc aacggctagg aagcgcccca tcccacccac cgcctaaccg ccttcctatg 2880caagtgggtc ccaccccttc cttccttttt tttttctttt tacaaatccc cttccctttc 2940ttggctagct agctagcttg gcccaacgcc acgagccgag ccgagcacat ccggagccaa 3000gccgagctca gcgcctcagc tccccctcct cctcgtccca ttcccggttt cctcctccga 3060tttcccccaa atccgcacgc ctctcccctc cgcctccatt tttcccgatt cccaattccc 3120aaatccggat cagccgcagc cgcagcagca aaaaatttcg aaatccaaat ccaaacccat 3180cccccccacg acgacgtcac ccacatcccc acccccgcga gacgagacga gacgactccc 3240aaatctctct ctcctctctc ctatgcgcgc cgccgccgcc gccgcagcag cagcagctag 3300
      gaggcggagc agcagcagca gcagcagctg agatgatcgt gcgcacctac ggccgcagat 3360cccgctcctt ctccgacggg ggaggagggg agcgcggcgg cggcggtggg ttctcgtcgt 3420cgcaagacgc gttcgaattc gacggggagg aggaggacga cctcgtcctg ctggggtcgt 3480cgtcgcagtc gtcgcacccg cccgcgccgt cgcaggagtc gtcgtcgatg tgggacttcg 3540acgaggaccc gccgccgccg ccccggcggc ggcgggggag gggtgggggt ggggactacg 3600cggagcccgc cacggcggcg gcggcggcgg cggcggccac ctcgctcatg gaggcggagg 3660agtacggcga gatgatggag agcgtggacg aggcgaactt cgcgctcgac gggctgcgcg 3720ccaccgcgcc gaggcgggtg cgccgggcca gcttcctcgc gctgctcggg atctgcgcct 3780ccgcgccgcg ccgccgcgtc ctccgggccc aggggtcggt acaccaaaga accctccttt 3840tttttttctt acttgtctgc gctgtaagta aagaataaca attcgcgttc ttgctcttgc 3900ttcgcgggca atcttggtga ggaatcttgt tagggttatg aaattgggca gccagttctt 3960gtttcttctg cgtaatcttg gcggaaacag tgggattttg tacgattatg gctccgtaat 4020cggcatttct gtgggaaatg aaccaccttt agggcatttg accttcgaac agcatgcttg 4080gtgttgcaat ccgtagctat tgccttcatc ttaggcacaa gaacttgttc tgaattatga 4140tttaccaact tgtgtttgtt ttcttgttct gagttttctt gcttggttag ggttagggtt 4200atcaccgtgg tggtgcagaa ttagatgttc gctacttgtc ttaacctctg ccttgcccaa 4260tttggtaccg agtgttacag ctgggtttag gaagtgtgat ctttgagcat ttctagcatg 4320ttggtctctt tattttgcta atctcacatg gttgtagagg aaggaagcat agtgactgat 4380gatgaatgcc tagatactag aaatacatct ttattaactg aattaggatt gcttgggtat 4440ctatgtagat atgactgtag aatgttactg ctggaaatgc tatccaatat ccattgatct 4500ctagcctaat atatctctcg aggccaagag atcagtcaat tttgaacttt caggagagtt 4560tctatttggt acttaatctc ttttatttgt tacttttggt gcctggctct cttttcatga 4620ttgctaagta gacaggtaaa gttctaccta aaattattct taaaagttca aaatcgcttt 4680agattaagga gtgccagcca gagccttagg cagagtctta taaaccaaaa gcacaatgct 4740acaatgttca caaaactttt gtggaatttc cacttgagct gtataaacat cgcaatctac 4800tgtgaataaa agaagcactt gatggaagtt catgttagca aatgacatgt tttctgtgag 4860gaggttgatt gcttgaactg ttatggactc ttgcaacttt ttattttact tcgtacccat 4920ttatgctaat gtgcacaaat aaaattgctg agagtaaaaa tgtacaactt gttacgcacc 4980agcacacttc ctatttgtat ccattttcct gttgaatttc aaatgtattc aattgctgaa 5040
      attgttccat tcaacaaaca catattccgt taatgaaatt attatacatt gcgttttgtt 5100ttcttactca caagtgtcct cttttcttat atcctataga ttggtgcaac aaattattga 5160tgcaattttg gttttgaaca ttgatgatcc tccctgcact attggtgcag ctgctcttct 5220attcgttttg gcaagtgatg tgagtacctc tcaatcccat ccttgtgctt ctgtgcatgc 5280ttcattctat tttttacgca tatcgattgt tttcttttat ataacagccc ataaaaataa 5340tcacatcatg gcaaagttat ttatttctcc agtacagtta tataagtatt caccactttt 5400ccatgaatat cttggcatgt gattacaaag aagattattt aagaaagtcc atgcttttat 5460ttcatcattt tgtttgaagt tgaactttaa tttatggtgt aaatttcagt taatattgct 5520agcagctcgt attctttaat ggcataactt cacttgtgct tattctccaa tatctccctt 5580cttgttgttc aggttcaaga aaatcatttg ttggattcag aatcttgtgt ccattttctt 5640cttaaattat taaatcctcc agtgaatctt gttgattcca aagcaccatc gataggttcc 5700aaacttcttg gaatcagtaa agttcaaatg cttaatggat caaataagga ttctgactgc 5760atttcagagg aaatcctttc aaaagttgaa gagattctct taagctgtca agagatcaag 5820tcgctcgaca aagatgacaa gaaaacaaca aggccagaac tgtgtccaaa gtggcttgct 5880ttgttgacaa tggaaaaggc atgcttgtct gctgtttcag tggagggtaa gttttaatca 5940aatttcttgg tcatgatttc cctttatgac cattataatt atttttatga gccaaataag 6000cagttgccat aagttacata gcacctgttt acaatattca tgggtggttt gcttagccct 6060ttgcttcacc tgcctttgat tgatgacttc catccgtgtt gcacaactga attggagtaa 6120ttgactgcac tagaagcacc tatggccatt gtcatactag gaaggttttc ccttatcaaa 6180tatttgattg ttacagagac ttctgacact gtgtccagag tcggaggaaa ttttaaagag 6240acattaaggg agttgggcgg tcttgatagt atttttgacg ttatgatgga ttgccattca 6300acattggagg tgagatctcg ctaacatcgc atattttaca cttcctttgt tcaactctaa 6360aggatggtgc aagttttgtt cctttttgcc attttagctt taatgtgctt gaagccacat 6420gaaagcaatg cttgtccaga tacatagcca aaggttgtta tattttggga catggaaaat 6480gcttgaggta gtaactattt tcatcaggac atggaaaatt ggctgcatca caaattatgt 6540tgtttcatgt tgcaaaatag ttttttaata cttttttatt ctgcatgtgg tgttagtgtc 6600ttacagtgat tcctctgatg attatatccc ccacgataat aatacttgac atatctacac 6660caagtggaca ttattcattt ggatgttact tttccagcta tacttgctgt tcttgcataa 6720actttggagt aaattgcgta tccctttaag agataaactg cttggtgctc ctatctgtgt 6780
      actttttatg cccccaacta ataatgcaat catattacgc tgataaactg aataaataaa 6840ttaacaatat acttctggtg gaaaccttgt gtatcagaat ctcataaagg atacctcaac 6900ttcagctttg gacctaaatg aaggaacatc tttgcaaagt gccgctctcc tcttgaaatg 6960tttgaaaata ttggaaaatg ccacatttct aagcgatgat aacaaggtaa tgttccttat 7020atattctgtt tcagtttagt acccattttc ttcttctgta ccatcttctc ccctcatttg 7080ttctgtgcaa aatgtgcaaa cagtgtgact ttgtatttct gcttaacatt tttctttttt 7140tcctgaaaag cagtataaac tcttacactc attttgcttc ttgcagaccc atttgcttaa 7200tatgagtaga aaattgtacc cgaaacgctc ctcgctttct tttgttggtg tcattatcag 7260tattattgag ttattatcag gtatttttct taataataca atatgtccgc taacacaata 7320aaatgtttta aacatccagt atgttaaagt tgcagtctga cgcctatttt gttttgctgc 7380agctctttca atactgcaga attcttctgt tgtttccagc tctacatatc cgaaatcgtc 7440taaagtctct caacagagtt gctctggtaa taacaaacac caaatttgtt tgatcaactc 7500gttggctttt ctgtgcactg tttcaatata gtttggtcgc cattcaagtc tcactacaga 7560tgttgaactt gacctgacac ggtggcacca atatttataa aacgctacct gatattttta 7620atatttcatg tttcctgacc cagattatct tgttggttcc tcatataagt ttaattagtg 7680tcgttcttga aactttgtta tgcagcagat gtcatggggg gaacttcatt taatgatgga 7740aagcgcaaga actcgaagaa aaaaaacctt ttgtcgaacc agacacgcca tagttgctta 7800tcttcaaaat cagaagtttc tcatattact atatcttctg gtagtgatgc tggtctgtca 7860cagaaggcat tcaattgttc tccatctata tcaagcaatg gggcatcaag tggttcatta 7920ggcgagagac atagcaatgg tggtgctttg aagttgaata taaaaaagga tcgtggcaat 7980gcaaatccaa ttagaggctc aagtgggtgg atttcaataa gagcgcacag ttctgatggg 8040aactccagag aaatggcaaa aagacgccgt ctatctgaaa atgtaatcac cgacagtggt 8100ggcggtgatg acccttttgc ttttgatgat gttgatcagg agccttcaaa ttgggaactg 8160cttggtccaa aaaagaaatc gcctcagaaa catcaagaca aatcaggaaa tggagtgcta 8220gttgcaagtc atgaaccaga ccaacctgaa gatcttaatc agtcgggtac aacatctctt 8280tttagtgcta aagatgaatc cagtcttttg gaagactgcc tcttggcatc agttaaggta 8340attaaatatg tttccttctg atctttcttg tttcttcttc aagagaatat acattcttgg 8400gtcacagttt ctcggtttgt ctttgtgact ttgttgagtg acatattttg aattcacaaa 8460atttcctttt caatatggct cctcaatcta tagcatctgt cgtgtatgta ttctgtacaa 8520
      aatagtattg taacatctcc tagaagaaat tggcaccatc catatcatac agtagcaatt 8580tatgagacgt gatcctgatt ggaggtttag gacagagcct cgagctaaat tgctattgta 8640ttgtatctac tatcttttag tacatgatat gtgctgggca ctctgtgtct gagtgtagtg 8700agtgcttaag tttacatagt tcagctaaca tgcatatgta agacagttta tgattaaatt 8760taagtgtaga aagaaggtac tttcaaaaga tttttaagga caatataatt gtttcaccgg 8820gactcatgct tgttctgact gtgagcctaa tgttaccttt acatgccctt acattgtcta 8880ttttttatcg ttttatgaga tcttccaaac aacttgatct gtcttaatgt ttttttgcta 8940gctcctttct tggatatctg gtaaatggtt aggccgaagt atgaactttg ccttattgtt 9000tcaaagaaaa tgtaacaact cctggaaaag tctaattttg gttgcccttt attttgctga 9060ccgtattggc acacatctaa ttctgctgtt cctttctggc aggttcttat gaacttagca 9120aatgacaacc catctggttg tgaattgatt gcgtcatgtg gtggacttaa caccatggcc 9180tccttgatca tgaagcattt cccctcattt tgttttgtcg tggacaacaa ctataacacg 9240agagatgtca atcttgatca tgagttatca tcttctcaaa acagcaaggc acaccaggtc 9300aaaattaagc aattgcgaga tcatgaactt gattttctgg ttgccatatt gggcttgctt 9360gttaaccttg tagagaagga tagccttaat aggtaagtcc ctcacatgct tccttccatt 9420tgctcaattc atatcagtgt tactgttctg gcagttcctt ggggtcagga ctcagaaaca 9480tccaattaat gttcatgttc tcttaacgac tcagaaatac tttataacct ctccacaggg 9540tacggctttc atctgcccgt gttcctgttg atctatctca gaatccacag agtgaagaga 9600cacagagaga tgtcatagca ctcctctgtt ctgtattctt agcaagtcaa ggtgctagtg 9660aagcttctgg aactatatca ccggtaattc aaaattcttc aagttccttt tgtatgtaga 9720ttatatcttt gtaaaactcg gcatttatta cctgctcttt gtttcaaaaa gcagtatttt 9780attttgctcc ttagcatagg tcagcagaac agttgatctt attcagaaaa caatattttg 9840catgtaacat actgttatct atgagatgaa aattaatgca tgtgtaataa tgtcaatgat 9900aaatatttgc tatctgaatc cagtctacca actctagtta gaccgaaatt actgaggttc 9960tatttcaaag aataatttag tgcaccattt gttcaactac tatgaagtaa aatggtattc 10020ccttctattg acatcgggtt agaagtgaaa ggccatctta atgcaatgtt ctcaatgcca 10080caaacccaca aatttcatta acacatacag attattatta acatagctat aaattggatt 10140tccagaagct tgagttgaat ttattttgtt acaattgaaa gcactgggaa cattagcatt 10200tttttttagt tcttggttat tgcaatttat aatgttatac agaactgtgt acctcacaat 10260
      gcattcatta tgacattcta tgaaccattt gattgactgt tgcttgtaaa caacaggatg 10320atgaggagtc tttgatgcaa ggagcacggg aagctgaaat gatgatcgta gaggcctatg 10380cagcccttct tcttgcgttt ctttcaactg aaaggtttgc aatctgtagt tgatggattg 10440ttttattaat gtctaactac ttgcataatg tcagcactat ggcatttaac ttatactgtc 10500tgttaactgc aacagcatga aggttcgtgg agccatttcc agctgccttc caaataacag 10560cttaaaaatc cttgtgcctg cgctagagaa atttgtggta tgtctccata attcttgaac 10620tactgtttgt ataaaaaagt atggatgatc tttgaattta ctccattttg gaaatcatta 10680atttttcatg tctgaggtgt gaggtgtcac cataattgta cttcccatcc aggaagcctg 10740tttgcaaaat ttcacataaa taaggaaaat ttgaacttgt ttcaagtttg aatagtaaca 10800ggatgtttta tttctcaact ggagaaaaca ttccggctgg gacttttaac ccttaaaatg 10860ctagtgtgct cccactgtaa gattgtctgc tgtcacattt gaaactttgt gtaatacctt 10920tatcactacc cttgagatga gagacacaat ctggtaccga gttaagttat tgataactcc 10980cagttgaagt acagcaccaa atcaagccaa catgttggct acgtaattaa atgttctctt 11040acaacagata gaggtaaaaa gggagtttct aagtatctaa cctcttaccc tcttggctta 11100gcactccagg cacaactctt tcttaacttg cgatttagga cttgactctg agaatattgt 11160gtgcccacac tggttgagtg catgcctatc taagctgcta gtttttgttc attttgatta 11220actctgaagc tgcctgagct tattctgctt ccatcattta ttaatccatc atgtttctct 11280ttcagtcgtt ccatctgcag ctcaatatga tcacagagga aacgcactca gctgtcacag 11340aagttatcga gaaatgcaaa ctttcataga aagagtgaag aggggcctgt acagatcaac 11400taacaacctc tttgcagcaa aaaagcatac acacaagtgt ttgtcttggc ctggggctct 11460gcagatggac tgatactctg acctgcagtg ggcttgggag ctaacaatgg tttcattctt 11520ttttttttta tgttttcccc tgttgttttt gctcatgttt tgtgtaattt tttcttctca 11580tctagcgatg ttatttttct tagcatgatg ggagtagccc tccttttttt tttctctaat 11640taagtgtaaa gtagcaacag catagggatg aatgttcagt gtagtgtgtg gtgtttcagt 11700tattcagaga cgtccataca gtttgtacct tgtgaccaca cgtcttaatc tgatgaagct 11760tagaataaat cacatgttag caatgcaata tcatctgcgt cttctctcac tttggtggcc 11820atcaaattct gtgtagaagt gtatggttgg tgtgctgttg caaatgccgt attccgctct 11880gttttgtgga agttaagaag tccctagttg aaataccgat ttttcatgat ctcggagatt 11940gatgcaactc tgattgcagc atttcttttt attagaatgt acactccatg ctatcatgat 12000
      gtttattgtt tagtactaca agatttggtt aaccattatt ttaatatcat aataatttta 12060taaaatcttg gagtaacaag ttcataatac atgatagcat aactttttga ggctagtcta 12120tgtatattgt ctcctttgtt tttaaactaa gcactcaata aattattgat ggctgtaatt 12180ttctgaaggt ttcaccggtt tcggcccgtg ctttataaat agcttcggca caaaagacaa 12240aacggtccct ccaacacata aatggttgag tttacgtttt cattatcttt ggtaaaatca 12300agtccaccac gtagacactc ataacaaaag tttgaatatc ctcagaaatt ttgacttgag 12360tctatcttac ctttgatatc ggacatccaa ccctccctcc ctccctgaac tttatattat 12420tcatattaca cctgaacttt atattattca tattacaccc tgaagtggtt ttcatttaat 12480tgcatacatg ctgaaatagt ttgacaacgt gagatgcaca aaatctacac gttcgtctta 12540agttgcaatt cattttatcc cttttctttt tctctcttac ataggaatat caatagtact 12600aattcacatt acaatatagt ataaattggt gatcgattat tggcaatata ctatattaaa 12660tattcaaaac tagtcattta agctgccaaa taagtaaacc actatcgaaa accacaatat 12720aaatggcatt acaaaactta gggggttgaa tatccaattt taaagttcat gatgctagag 12780gaatttctat caaaagttta tgggtacata tggacttttt cctttttaaa agaagctatt 12840cttatcgtaa acgttaaata ttttttgtac tttatttttt atgattgaaa aaaaaactta 12900gttttcaaaa tgattggtct gtatacaagc atcaattaga cttaataaat tcatctaaca 12960gtttcctggc agaaactgta atttgttttt gttattagac tacgtttatt atttcaaatg 13020tgtgtacgta tatccgatgt gacaaccaaa cccaaaaatt ttccctaact ccatgaggcc 13080ttacagatat atttgatggg tgtaaagttt tttaagttct ttgggtgcaa agtttttaaa 13140gtatacggac acacatttga agtattaaat atagacaaat aacaaaacat attacatatt 13200ctgcctgtaa acaacgagac aaatttatta agcctaatta atctgtcatt agcaaacgtt 13260tactgcagca tcacattgtc aaatcatagc gtaattaggc tcaaaaatat tcgtctcgta 13320atttacatgc aaactgtgta attggttttt tttttcgtca acatttaata ctccatgcat 13380gtccaaatat ttgatgcgat ctttttggcc aaattttgtt ggaatctaaa caaggatcaa 13440atttgctgaa tttttccaga cgtcacggct tgttcatcca tcgttcgcat cgcgattcgc 13500caccgacgcc ttggtttcca acgaatttta tcatccgctt aaatacatcc aaagctctcc 13560atcgccatcg gcggccaacg gcgaccgctc cgctctaccc aatccaccca tccactcgcc 13620gccgccccct gatccaaagc ctccgccgcg ccgccgtcga gaggaggagg aggaggagga 13680ggaggaggag gaggcgtgag cccctatggg gaccctcctc cggccgcgtc cgctcgccca 13740
      cgccgccggc gccggcgacg ccacgccgtc gaccgcgcac ggtagccacg cgcctctcga 13800gaggcccccc ccccgccgct cgctgatctc tcttctcatc ctgtttgggt ttgggtttgt 13860gatttgggtg tttttttttt tccgcagcgg tggtggtgag cggtggccgc ggccgtggcg 13920tggagtgcca gccgcatcgg gtgcgccgcc gcccgggtcc gcaggttgcg gtggcgacgg 13980cgagctggag gaggcggagg gagaccgtgg tgagatcgga tttcgccgct ggtggtgccg 14040ctaccatggg ggattcgccg caggcgctct caggtttgca gcctcctcca ctctcttctc 14100gcaaaatgtg ttgctatgtt cctctcgctg ggctggcctc atagccatta atgtagtttg 14160ctggaacatt acattcggaa cgttgttggc aattgcttga caaaatgtgg aattgtggag 14220gggagaaaaa tcgtttgaac ctgcagtgac aaaattgcca tctataattt taaaactgaa 14280ggtgtggaaa tcaaacataa tcattgccag cacatcattc ttgttaacca ccttgacata 14340ttgttggctt ataacagtta gctccacacc aacttggaag gtgtcaatgg aatgtaagta 14400taaattgagg ataactggca gttgttaaga ctttctacag aacttgtagc agctaaaact 14460agctattgtg catttatgtt tcatggaatt tgagcggcaa tggatatttc ttactaagac 14520gtataatgca aaacaaaaaa aaaaaaaact atgtctatgc agtttacatg taatgtgcgg 14580atgcaaataa aatcatgttc atggacaaac taatgggatt cataccaaat tccagaattg 14640catttcttat gtggttactt ttgtttgttg atttggttac cagacatcga tgtggtttca 14700agggtcagag gggtttgctt ctacgcggtg actgcagttg cagcaatctt tttgtttgtc 14760gccatggttg tggttcatcc acttgtgctc ctatttgacc gataccggag gagagctcag 14820cactacattg caaagatttg ggcaactctg acaatttcca tgttctacaa gcttgacgtc 14880gagggaatgg agaacctgcc accgaatagt agccctgctg tctatgttgc gaaccatcag 14940agtttcttgg atatctatac ccttctaact ctaggaaggt gtttcaagtt tataagcaag 15000acaagtatat ttatgttccc aattattgga tgggcaatgt atctcttagg agtaattcct 15060ttgcggcgta tggacagcag gagccagctg gtatggctgt agtctcatcc ctgctttctt 15120aagtagacat atatacattt acagtatttg gtaaataaac aagattttat gaatcatata 15180tgattttggg gaaaacacaa aactctcttt gttggctgcc ttgaacatag ttctgttcac 15240acagttatag caccttcttt aaaatgaaga actttgttgc atacacataa ggccaaacca 15300cataatgaat tttgtttatt tctatctttg aatgttagca tcgtttttgt ttaatgcatg 15360atcgccttcc tatatatttg tagtatgtca acattgtatt ccatgctgag cataacaaat 15420ggtttgttaa aattcaggac tgtcttaaac ggtgtgtgga tttggtgaaa aaaggagcat 15480
      ctgtattttt ctttccagag gggactagaa gcaaagatgg aaagctaggt gcatttaagg 15540ttcagtaacc aaacttaggt tacattacat ctaatgagat ttttatattc agtatataat 15600gttaaccttc tcatggtgta ctgacgtggt tataaatgtc cccagagagg tgcattcagt 15660gtggctacaa agaccggtgc tcctgtgata cctattactc ttctcgggac agggaaactg 15720atgccttctg gaatggaagg catccttaat tcaggttcag taaagctcat tattcaccat 15780ccaattgaag ggaatgatgc tgagaaatta tgttctgaag caaggaaggt gatagctgac 15840actcttattc taaacggtta tggagtgcac taaagaaaga tggtgttttt ttttattata 15900tggaacctat tcaaaggcac agacaggctt tcaaggctaa gcttgttaca ggtactgata 15960ctagttacta attactttcg taatcagtat aaataagctt gtgtagtgta atggcattgt 16020acatttctgc acttggtaaa tttacagaag aggcaagtaa tattttagag gattgagttt 16080attcacccag tcatatagtt gaagaggcaa gtaacctgta agagaggact gaacattaac 16140acctcttgtt cgattaaaaa tgaccaaaga gcatcaaaca tgtattcgag gctgttactt 16200tagatatggc ccattaattt gtttagttgt ctatgtacat cctagttggt gtaaatgcca 16260gttaccattt ctatgatcta aaacaatcaa ctcttttagt atattttcaa aaacgaaaat 16320tcagtacaca tgtatgaatc ttaatattct tctctagctc gttacaaaag caacaaaggc 16380accgtgtcag ctggttcaca ttagctagtt tgtacttagc attatccact agcaccttat 16440tttcatgcat atcatgctaa tttgcttgcc cacgttgagt gggaattttt ttcatgtttt 16500ataatttata tatgttttag acttctagtc cacaatttat gtacttcatg ttcctgagcc 16560tctagtatgg ctgatagcag actaggtgct gagtgctgtc cttttttgca gactgaagag 16620agaagaaata caagactgtc cattgttagt cagatttgta aaaatagact ctgatgtagt 16680ttacttttgc ccctatttta tttttaacaa tacaaatata taacagatcc taagaactta 16740tcttaattta ggagaagttg ctcgtttcat taaattaaat tgtgaagtaa aaatgtgtgc 16800tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg gcaggccagg 16860attgaacact gaatggtaag actgcttctg ccttcagacg ttattgctaa atttttagct 16920acttgcagtt agtgctgcca cgccgattaa gcagtagaac aaagtagttt tgtcgtgcac 16980aaatgagtta tatttcattg gaaatcgaag cgaaaacgaa tcaaaagtta gaagaaaagg 17040ggaaacttgg taattactcc ataaagagag tgcattttat tggtaagatg gtatccggaa 17100gctgtgagct ccgggctgta tgtattctgg caaatttgat atgagatgct cgattattgg 17160cttaagttag cgatatcaaa tttggggaag caccaaagga attattgtga aggagttatg 17220
      ggtgcgtgac gttatctgct aggttcaaat ccttgtggct atgaatattt atctgctagg 17280ttcaaatcct agtgactatg aatattaatg ggtaaggtaa gggatttatt gttaatttta 17340gtttctttaa gattgtgcca tcggacgcca ttcggtaact gtaataatgc tttgtattgg 17400attcacttgt gttacatgca cgcactaaac atgtgcttta ccttttcatc tgtttttgcg 17460ttctgggcta gaaactcaaa cgttgaattt tccatggtct gctcaacttg acaattactg 17520cgtgtcaagc gatcttatac gcatactatg cgcacaagtg attgtatacg gatatgatga 17580cagtataacg tgtgatattg atttttttaa taaaaaaatg atgttccttt ccttgatgaa 17640ggaacaaaga ctttttttaa aagaagggta ttactaaaaa caaaaatgac aaaaacaaaa 17700tatcagtgca catggcaagt gtgctcggca attttttctc tgtactttaa acaaaaatac 17760ttctatatgt tcttttttat aagggtggca caaatctttt aaatgagcca aatatctaca 17820ttggatttat taaaaactgt ataaattata atttatactc tgaaaggttg tgtgcatctc 17880tcttggagaa aatgtataag ttgcaaacaa acattaatcc acgttatgta actttttttc 17940gccggaaagg ccgaaggagg cctgacggag cgtggggctc ctcaccggga gaccgcgcag 18000gccccccttt gccggttcgg ccggggactc agggtgaaat tctaagctct ctgtatgtgg 18060aaggttcgcg accgtcgaaa gagcataaga cacgggcgat gtatacaggt tcgggccgct 18120gagaagcgta ataccctact cctgtgtttt ggggggatct gtgtatgaag gagctacaaa 18180gtatgagcca gcctctccct tgttctgggt tccgaatctg gaaaagtcca gtccagtccc 18240cccctctaag tgggcaaggt cctcctttta tatcttaagg ggataccaca tgcaccatct 18300ccctcctttc tgtggggact taccctacct tttcataaat ggacggagat ttgtatagtt 18360gccgtccgaa tgaccttctg ataggacggc ccatacctac ctccacttcc gccgaaagca 18420ggtgcgacgt gggattatgg ctgtctgctg acgacatgac cagtgtcaga ctggtcacaa 18480attgctcatt cctgtccacc acgcgtcagt ttagcaatct acatgttggc ccttcttcac 18540acaacatctt gcctgtaatg gttaggatga agcctggcat atatctaacc aggactaacg 18600tgccatctct aggaggtaac acgctagctc cagctgggga cgagcgccta gaagccctcg 18660tcctgacggg atggggcgag gcgtgcgtca gatcgcctgt cgccacctaa cccgcgatct 18720gaccggtctg tgactggtca cagaccggat aaacgagtgc actgcacttc gttacatgcc 18780gcgtgacacg ctcagccaaa ccgcaataaa tgtggttagg tgagccccgc tgtgctcacc 18840taacccatac acgcggagca aaaacccacg aggggtcggg gcgcctcggc cctcggggcc 18900gaggcgggtg cggtccgacc ccctcggggg gactaagagg agggcgaaca catcaccctc 18960
      gggcccgacg tcccccgagg gtgccaggcc acgtgggcga ttgtgtctgc ctcaaacctc 19020tagtcatgat actcctgatc ccatgtcacc gacagtagcc cccggcgtta tgccagggcg 19080atcgccctct ttaagggaag cggtcgggcg tgacgccact cctaaggcct ggtgacaggt 19140gggaccggtc tccacaattg ggcagaaacc caacggtcac aaatcacgca catcggcaat 19200ggtaactcta ctatcaataa tgagcggtct cttcaagact gccacattac tcgagtagca 19260cacgaatctg gacatggcga ttcgtttcgt ctggagatat ggtaacgtcg ctttggtcgg 19320cgagcgtaat taacgcgcgc acgatatgat ctatctcgac tgccacaacc gcatatccac 19380ctcatgcgcc gcaagcgggc gaatgggatt agtggaagcg tgggcgcgag aaacgagggg 19440gcgaaatagt gggcgcgaga agcgaggagc cgggcacagc gttggcaaga gtataaaggc 19500actgaggaaa ggatctgttt ccttcctttc gccatcattt cccttgtctt cgccgcttgc 19560gccctaactc cttctttcct gtgctctact ttcgccacac gcgctcgctc tcaatcttct 19620cttcctccgg cgccatggca cggggctccg ctctgctcga tggtagcgtg ctgccgcctt 19680cccgcatcgt gagcgagagg caggctgggc tgccgcgccg cttcatgccg gaatctgcca 19740ccggccggga gatagtcacg ctgggtgagg gacgcccggc gccagactac ccggggcggt 19800ccgtcttctt tctccccttt gcaatggcag ggctggttcc gccattttct tctttcttca 19860tggatgttct gaagttctac gatctccaga tggcgcacct cacccccaac gcggtgatga 19920cattggccat cttcgcgcat ctgtgcgaga tgttcattgg ggtgcgccca tctcttcggc 19980tgttccggtg gttcttcacc gtgcagtcgg tgtcgccgcc atcggtagtt ggtggctgct 20040acttccagcc atgggggccg gtgctgaatc gctacatccc ctgcgccctc cgcaagaagt 20100gggacgactg gaagagcgac tggttctaca cccccctcgc cgacgaagcg cgcctctgac 20160ttccgagcca gcccccggcg caggcctcca gctggcgggc gccggtagat ctgggggatg 20220gctatgacgc cgtcctcgac cgcctggcgg gcctacgatc ccaggggctc acaggggcca 20280tggtgtacgg cgactacctc cgtcgtcgga ttgcgccgct ccagcggcgc gctcggggcg 20340cctgggagta caccgggtcc gaagactaca tgaggaccca ccagggagtc agatgggact 20400gggctcctga ggatttcaag atagtggtcc aacgggtgct gaatctcaac tccatggagg 20460cgtccctcat tccccaagga atcctccctc tctgcagcga tccagaccgc gcctccatcc 20520tgaccattat gacggcggtc ggggcctcag aggagtgagc tccaaagggc cacgacggcg 20580caggcgggag ccgtaggggg gatcaatcta ccccgggagg gggtcgtgct tctgggtctc 20640gcgacggagg cccgaggagc agccgccctg ccgacgcccg ggggaagagg aagcagggag 20700
      gaacacctcc cccatctcct ccccgagggg gcggggcggt gcgtgccaac agcaggcgcc 20760cggagggggc cgcgccgaca tcgcagcccg agggggagcg caagaagaag cggctccgca 20820agatggggga gacagaacca tctcggggaa accttatttc ccctccaaag tggtcgttta 20880accgaccccc tcgcaggttc gtctctcacc catcgtggct gtattcattc tctcaacgcg 20940agttttcact cacccatctt gttcgtcttc tggtcttttc ttctgtttca gcgagatccc 21000gtcgcgtccc tcccgccatt ccaagtccgg ccagtctgag gccgaggatc cggcggccgc 21060agaggcccgg aggcgggaat ctgaccggcg agaggccgcg gatcgcctac gggaagccga 21120ggaggccgcc caggaggccg cccgggctcg ccagggcgag gaaaccgctc gggaggaggc 21180cgcccgggcc cgccaggccg aggaagccgc tcgggaggag gccgcccgag cccaccaggc 21240cgaggaagcc gctcgggaga aagccggatt tcgccaggac gaggcaatgg cgacttccga 21300ggcagctcgc gatgaggtcg cgggcgcgtc gcttgagccc gcttcctcgg gcgacgctca 21360ggcgacaact tccggggcag ctggcgacga ggctgcgggc gcgtcgcttg ggcccactcc 21420ctcaggcgac gcccaggacc aaccaggtct gagggacatc cccgagtccg gcacttccat 21480cggcggcccg agccgcgtgg catcctctcc aaggcggctc ttccccacgc cttctatcgc 21540cccgctgagc gcagagcccc ttctgcaggc cttggccgcc gcaaacatcg cggtgttgga 21600cgggcttagt gcccaggtgg aggccctgca agcagagtgg gcggagctcg acgccgcgtg 21660ggcgcgtgtc gaggaggggc ggcgctcagt ggaggccatg gtggaggtgg gccgcaaggc 21720acaccgccgg catgtctcgg agcttgaagc ccgtaagaag gtgttggcgg aaatcgccaa 21780ggaagtggag gaggagcggg gggctgccct cattgccacc agcgtgatga acgaggcgca 21840ggacaccctc cgccttcaat acgggagctg ggaggcggag ctagggaaaa agctcgacgc 21900cgcccagggg gtgcttgacg ttgccgctgc ccgagaacag cgggcggggg agaccgaagc 21960ggcgtcccga cggcgcgaag agacccttga ggcgcgcgcc atggcgctgg aagagcgcgc 22020ctgcgtcgtg gagagggatc tggcggaccg cgaggccgcc gtcactatcc gggaggcaac 22080actggcggcg cacgagtccg cctgtgccga agaggagtcc gcactccgcc tccacgagga 22140cgcgctcacc gagcgggagc gagctctcga ggaggccgag gccgcggcgc aacggctggc 22200ggacagcctg tccctccgcg aggcagcgca ggaggagcag gcgcgccgca ctctggaatg 22260tgtccgcgcc gagaggaccg cactaaacca gcgggccgct gacctcgagg cgcgggagaa 22320ggagctggac gcgagggcgc gcagcggcgg ggcggctgcg ggcgaaaacg acttagccgc 22380ccgcctcgct gctgccgaac ataccatcgc cgatctgcag ggcacgctaa actcgtccgc 22440
      cggggaggtc gaggccctcc gcttggcagg cgaggtaggg cccggcatgc tttgggacgc 22500cgtctcccgc ctagatcgcg ccggtcggca ggtgggcctc tggagagggc ggaccgtaaa 22560gtacgccgcc aaccatggag gcctcgccca gcgcctctcg aagatggccg gggctctcca 22620acggctcccc gaggagctcg agaagacaat taagtcatcc tcgagggacc tcgcccaagg 22680agcggtggag ctcgtactgg cgagttacca ggccagggac cccaatttct ctccatggat 22740ggcgctggat gagttccctc ctgggaccga ggacagcgcg cgcgcaggtc cgggatgccg 22800ccgaccatat cgtccacagc ttcgagggct cagcccctcg gctcgcgttc gcccccaact 22860ccgacgagga ggacaatgcc ggtggtgcag acgacagtga cgatgaggcc ggcgacccgg 22920gcgtatcgga ttgatccccc aagcccccgc cattcttcag ttttttcttc ttttccttct 22980tctaaggcct tcgggcctct tttttgtata gatcaactta atctgtaatc aaaaatgaag 23040aaatttttgt gtcaatttca tcttgctgtg tgtatgagat gaggatgatc tgtgacgtgg 23100tccttttgcg tcttagcttg attaagggct cgtgcccagg tcccagtcct caaaaggcgt 23160gggtcggggc tagtgcctgg ggagatccac atgtcgagac tggccaggcc gggaacgtgg 23220tgaccgaggg ttatgggtga cccgattgtg ggtttttgcc gattcccccc cggagttcac 23280cacgccccgg ggcacggctc ggttctgggc cccgtttggc gattttagcc gacccgagcc 23340cccgagggca ggattgagca cgagtgacct atttcaagtc aagattcttc aaaaggaaaa 23400aaaaacacag atacagcctt taggaaattg aaactgcttt tattgaaata ctgaaataag 23460agaaataaga atgtgcatgt gtggcagccc ccggccaacc ctgcacgccc gagggggtgc 23520ggggttggcc cgagcccgaa acctgacacc cgaccccccc cctcaggggt agaagcgacg 23580aaggtgttcg atgttccacg ggttaggcag ctcaatgccg tcgcccgtgg ccagccgtat 23640ggagcccggc cgggggacgc cgaccactcg atacggaccc tcccacattg gtgagagctt 23700gctcaatcca gcacgcgttt ggacgcggcg taggacgagg tcgtcgacgc agagtgatcg 23760ggcccggacg tgacgctgat ggtagcgccg caggctctgc tggtagcgcg cggctctgag 23820ggccgcgcgt cgccttcgct cttccaagta gtcgaggtca tctctgcgaa gctgatcttg 23880atcagcctcg cagtacatgg tggcccgagg agacctcagg gtgagctcgg atgggagaac 23940cgcttccgcg ccgtagacga ggaagaaagg cgtttccccg gttgctcggc ttggtgtagt 24000tcggtttgcc cagagcaccg ctggcaactc ctcgatccat gaatcgccgt gcttcttgag 24060tatgttgaag gtcttggttt taaggccttt gaggatttct gaattggcgc gctccacttg 24120gccattgctt ctggggtggg caggtgaggc gaagcagagc ttgatgccca tgtcttcgca 24180
      gtagtcgccg aagagttcac tagtgaattg ggtgccatta tccgtaataa tacggttagg 24240cactccaaac cgggccgtga tgcccttaat gaatttaagt gcggagtgct tatcgatctt 24300gacgaccgga taagcctcgg gccacttagt gaacttgtcg atcgcgacat acagatactc 24360aaacccgccc ggggcccgcc taaacggtcc caggatatcg agcccccaga cagcaaatgg 24420ccacgaaagt ggtatggtct gcagggcctg ggccggctga tggatttgct tggcgtggaa 24480ttgacacgct ctacatcgcc ggaccaggtc gaccgcatca ttgagagctg tcggccaata 24540gaaaccctgg cgaaaagctt taccaaccaa ggtgcgcgag gcggagtggg ctccgcattc 24600gccttcatgg atatcggcaa gaagcacaac gccttgttcc cgaggaatgc acttcaggag 24660gattccatta gccgcgcgcc gatagagggt cccttctacc agcacgtagc gtttggagat 24720gcgatggacg cgttcactcc cttcgcggtc ctcgggtaaa gtcttatctg tgaggtatgc 24780ttggatctcg gcaatccaag caatcaatct aagggagctg ggagcgctcc cctcgggtcc 24840cgaggcctgg acttcaacgg gcctcggggg ccggtcaggc gcgtccgtct cccctaaggg 24900gtcgggtcgc gccgacggct gggcaagcct ttcttcaaag gcgcccggtg gggtctgggc 24960tcgcgtggac gcgagccgtg agagttcgtc ggcaatcatg ttatcccgtc tgggcacatg 25020ccgaagctca atcccgtcaa aatggcgctc catacgccgt acttggcgca cgtaggcgtc 25080catctgcggg tcagagcacc ggtactcctt acagacttgg ttaacgacca gctgggagtc 25140gcctaacacc aggaggcggc ggatccccag tccagctgcc actctgagtc cggcaaggag 25200tccctcgtac tctgccatat tgttggtcgc tcgaaagtcg aggcggacca agtatctgag 25260gacgtctccg ctcggagagg tcaacgtgac ccccgcaccg gcgccctgaa gagacaggga 25320gccgtcgaac tgcattaccc agtgggcggt gtgaggcagc tgcgaggggt ccgtgctggc 25380ctcggggatt gagacgggct cgggagccgg ggtccactct gccacaaaat cggcgagagc 25440ctggctcttg atagcgtggc gtggttcaaa gtgcaaatcg aactcagaaa gttcgattgc 25500ccatttcacc acccgtcctg taccgtctcg attatgcaag atttgaccga gggggtaaga 25560cgtaaccaca gtgacccgat gcgcctggaa ataatggcgc agtttcctcg aggccatcag 25620aatagcgtaa agcatcttct gggcctgagg gtatcgggtt ttggcgtccc ggagggcctc 25680actaacaaag tagacgggcc gctgcacctt tcggtggggc cgatcctctt cgctaggggc 25740cgcatccctg gggcactctt cgtccaagca gcctcgcggg gcgcacttgt cttctgtgct 25800gatgacctcg gggtcggagg ataacagggg cggccttccc acagtggctt tggggccgtc 25860ctgggggtca ggggctcctg gcgtcgtcgg acaagcgggc aaagggccaa ctccggtcgt 25920
      caggggcctt aggcctccgt tcggctcggg ggcctcttct ccctgctctt tcccgggtcg 25980agtcagcaca gggttagcct cggggtcaaa gggcgatagg tgcggccttc ccacagtggc 26040ctcagggcct tcctgggggt cgggggctcc tagcaccgtc tgacaagcgg gcagagggcc 26100aactccggtc gtcgggggcc tcgggccacc gttcggctcg ggggcctctc ctccctgctc 26160tctcccgggc caagtcggca cagggtgggg aagcgcgaaa tgagaattgt cctcatcgcg 26220ctccacaacc aatgccgcac taactacttg cggggtcgcc gctaagtaga gtagcaaggg 26280ctcgtctggc tccggggcga ccagaactgg gggagagctt agatacgcct tcaactgggt 26340gagggcattt tcagcttcct tcgtccaggt aaacggtccg gagcgtttga gaagcttaaa 26400taagggtaac gccttctctc ccagcctcga tatgaaccga cttagggcgg ccatgcaacc 26460ggtgacgtat tgcacatccc taagtttgct gggggggcgc atccgctcta tagcccgtat 26520cttctcgggg ttggcctcaa tgccccgggc agagaccaag aacccgagaa gcttgcccgc 26580aggtacaccg aacacacact tatcggggtt taattttatg cgggcggagc ggagactctc 26640aaaagtttcc gctagatcta tgagtaacgt ttcctggttg cgcgtcttta caaccaagtc 26700atcgacataa gcttcaatat tacgtcctaa ttggctaccc aaagaaattc gagtagtacg 26760ttgaaaagta ggacctgcat tctttaaccc gaagggcatt gtcgtataac aataggttcc 26820tatgggggta atgaacgcag ttttttcctc atcctcccta gccatgcgaa tctgatggta 26880accagagtat gcatctagaa aacacaaaag gtcgcacccc gcagtggagt cgacaatctg 26940atctatgcga ggcagggggt aaggatcctt aggacatgcc ttgttaaggt cggtgtagtc 27000gatgcacatc cgaagcttgc cgttcgcctt gggaacgacc accgggttcg ctagccactc 27060ggcggggttg acgctgccat catatttttc ggcgatggtg ggccggaacc ttgggggcca 27120acggacattc cgaagactcg ccacaaaggc tctacagccg acaccaccaa ccgggggcac 27180ggagggctga ttcccgcgtc cgtgttgagg tgacactctg gacgaggaag cgccctccgt 27240tgcgtgggca gcacttcggt cattacgccg gcgctcgatg ctggtgcggg cgtccggccc 27300cccacgcaga tctttctggg tcgaaggagt cgacgaagga gtggcggccg aatggcgaac 27360agcggctgcc gctcgtcgtg ccctccgtct tgacgacgcg gagccggtgg tagcagcacc 27420agaggccttg gtggcggagg accgcccacc agcatctagg cgctgccgta ccgtcatgac 27480taatttggcc acgtcgtcca gccatcgttg ggctggagac tccgggtcag ggacgacagg 27540cgggtgacgt aagagcgcgc ccgcagcttg gagcgcgccc tggggcgtgc tgccgtcgcc 27600gtagacgagg aggcgacgct ccccatctcg ccgttcttct ccatcgcccg cgatcggtga 27660
      agtcgcggat ctttcgaccc tctcgagcgc ctccccccgc ttaggacttt ggcgtggagg 27720gagcggtgga gtacgagctc gacggcgtgg gttcggctcc ccgtcgtcgc cactcacact 27780cggagagagg tcgtgcgcct ttgcttgctc ggccatcagg ctgaacagga aaagcttggc 27840gcacacggaa gagtacgaga gctcagaaaa acacacactg agtcccctac ctggcgcgcc 27900agatgacgga gcgtggggct cctcaccggg agaccgcgca ggcccccctt tgccggttcg 27960gccggggact cagggtgaaa ttctaagctc tctgtatgtg gaaggttcgc gaccgtcgaa 28020agagcataag acacgggcga tgtatacagg ttcgggccgc tgagaagcgt aataccctac 28080tcctgtgttt tggggggatc tgtgtatgaa ggagctacaa agtatgagcc agcctctccc 28140ttgttctggg ttccgaatct ggaaaagtcc agtccagtcc ccccctctaa gtgggcaagg 28200tcctcctttt atatcttaag gggataccac atgcaccatc tccctccttt ctgtggggac 28260ttaccctacc ttttcataaa tggacggaga tttgtatagt tgccgtccga atgaccttct 28320gataggacgg cccataccta cctccacttc cgccgaaagc aggtgcgacg tgggattatg 28380gctgtctgct gacgacatga ccagtgtcag actggtcaca aattgctcat tcctgtccac 28440cacgcgtcag tttagcaatc tacatgttgg cccttcttca cacaacatct tgcctgtaat 28500ggttaggatg aagcctggca tatatctaac caggactaac gtgccatctc taggaggtaa 28560cacgctagct ccagctgggg acgagcgcct agaagccctc gtcctgacgg gatggggcga 28620ggcgtgcgtc agatcgcctg tcgccaccta acccgcgatc tgaccggtct gtgactggtc 28680acagaccgga taaacgagtg cactgcactt cgttacatgc ggcgtgacac gctcagccaa 28740accgcaataa atgtggttag gtgagccccg ctgtgctcac ctaacccata cacgcggagc 28800aaaaacccac gaggggtcgg ggcgcctcgg ccctcggggc cgaggcgggt gcggtccgac 28860cccctcgggg ggactaagag gagggcgaac acatcaccct cgggcccgac gtcccccgag 28920ggtgccaggc cacgtgggcg attgtgtctg cctcaaacct ctagtcatga tactcctgat 28980cccatgtcat cgacaaggcc atccgaatgt attaaggagt aaaagttaca agaaaaaaca 29040ccacaatgca ccaaggtgca tgaccacaca ccatacacta cccccaagca caaaccactg 29100agggtgaagc ctagcaccaa acgaccgcca ctaagtgtga ccaaacgccg ctaggcctac 29160ggcagcaaca catagatgag acttcgaaaa cgatgccacc aaggtggtca cgacatgtag 29220gatgctgcca tcgtccatct aaaaagatgt ggttttcacc cagagaaact catcaagaag 29280gggagagggt aacccttgac agcgccccaa ggaggttacg acgcccgaag gcgtagccgc 29340tgccggtccg gtgaaccacc ggactaggct tccgcctagg accctatagc cttgatcgca 29400
      gatcaccgtc caccactcag aaccaccaca cagacaaaag gtagcacgta gcttccaccg 29460caccgcaccg acgccccttc gtcggccgac tccatcgaac caccatccct gagagctggc 29520ccaggacccc tccgttccac cacccgccgg ccgccttgcc agttttggcc aaaggagaac 29580ccgggactgg gtgacattgc ttcggcagcc tgagcttccc ccgctggcga gctgctgtct 29640caatccaacc tagaaactcc ccgcaaaaga aggggatgag ctctaggaag ggcgagggtg 29700ccgaccggca acgaggaaga caacccatcg actccagctc cctttgcact accatctggg 29760cctgcgccaa tgccggatac gctgtcgctc cggctccggc gccacccacc tgcaccccct 29820ttgcctggtc tccgcgcccc tcctggctgc gtcgcgccgc ccagctggcc gctaagggca 29880ccacgacggc cgcccggcta ccgaggcctg gccgcgccat gggacagctc gcgctggcac 29940cagcgagcca cggccgtcgc gctgttgccg gcgccagcga gcacaaccgc cagctccaag 30000ggccgagcat gccactgagc cgccgccgct gccgcccggg ccggctgcac gtcaccggcg 30060cacacgaccg cacgccgcca cgctccgcct ccgcgcccga ggcagcccca tgccattgcc 30120gcgcacctcg cccgcccgct gccgagccgc caccgcgcac cttgctgagc cgccaccgcc 30180gtccctagcc gcctcgtgcc gccgccacgc cagatccagg cgcgggatgg ccggatccgg 30240ccttgggggc gccggatccg ccgcctcccc acaccgccac ggcgtcacca cctccgaccg 30300cagtgagggc ttcgtcgttt gccccatcct catcgcgtcg aggaggaaga cgccaagaaa 30360aaagggcctc gccgctgcct tccttgctcg ctgccggctt cgccgccggc gagctccggc 30420ggcggcgagg tgggggagaa gaagtgggga gtgggcagct agggtttttt cgccccccaa 30480gccgcccgtg cgagagcgac ggtggggggg gggggacttt ccaacctctt ccagtgttct 30540agttctccac gttatgtaac tcaatttgtt taaccataga aagtaagaaa cctaccagcg 30600tgttaagctc tctttcattc cctttcttct tcctggtttt gcttccatca catgtcaagt 30660gaagggttct taactaccat tactcctaca catctaattt ttttctcaga tctttcgcag 30720gtatatattg atgctacatt ttatgatctt aagataatct ccttcacatt accctctgct 30780gaaactttag cttgaaccgt catcttcacc acaatttgag cccaatttgc acagagcaca 30840acgagcaata gcttgccctt acgttcatta tttagcatga actactacta actacccaag 30900aatcaataca ccggtttaat aacgccattt tatcacgtta atatatgttt cattcaacac 30960accggttttg gcacagttgc aaacttgcaa taaattcttt cctacttctc catcccataa 31020tataacaaat tggtatgtct cgtctggtac taagttgcta tattatgaga tggagggagc 31080acttcttttc ttccaaaata taagaatata gtattggatt agatattatc tagattcacg 31140
      aattcgatta ggttgtctag atttatagtt gtatgtaatg tataattcgg taataggtta 31200ttacctctcg ggatggaggg agtagttttg actttttttt ttcttataaa tcgctttgat 31260ttttatatta gtcaaatttt atcgagttta actaagttta tagaaaaaaa ttagcaacat 31320ttaagcacca cactagtttc attaaattta gcatggaata tattttgata atatatttgt 31380tctgtgttaa aaatgctgct atatttttct ataaacgtag tcaaatttaa ataagttaga 31440ctaaaaaaaa tcaaaacgac ttataatatg aaatggagga agtagtagac tataacaaat 31500ttaaaccgtg ctttgatttt agagcatcac taatatgtta gcaataatct atccctaaaa 31560tttatttttt ttcctaaact gaaaatagga agtggaaata ctcctccatc taagagagag 31620cctaaattca ataaaaaact aaaaaactaa aggtggatcc ctctattaaa ctaccgcaaa 31680aaatttatgt tttttttctc ttccacgcgc gcagaacaga tatctcgatc aagttagcat 31740gtaaaatttt taaagagata ccttatacga ctccttccgt atttccaaaa gcaaacggat 31800ttaaaatctg actcaaataa agatctatat atccaattta catgacacat gtttcgccga 31860atttttatat taataataat taatattttt aaaattaaat tattagcaat ttgtttggag 31920gatttatcaa aacaggatgg acgttgttta taacagcgtc tagacctaga cgcgcttgca 31980aactgcggcc acccttttat cacacaaatt tttgacaatt tgacactttc caaaaattaa 32040ttttataaat taaccgtgac caaaacttat ttaaaaataa tctttttgtt gagcgcaaaa 32100tcgtatactt cagcgccaaa tagcacggcg ccgacctccc ccttcccctc ccctctatcc 32160tccactgctg ccgcccacct ctccgtatca gctgcgtcgc gttggtttcc gccggcgctg 32220ctgctgctgc accagtccgc tagggcgggc gggcatggcg cgccgcgccg cttcccgcgt 32280ccgcgccggc gctgttggcg cccttcgctc ggagggctcg acccaagggc gagggggccg 32340cacggggggc agtggcgccg aggacgcacg ccacgtgttc gacgaattgc tccggcgtgg 32400caggggcgcc tcgatctacg gcttgaactg cgccctcgcc gacgtcgcgc gtcacagccc 32460cgcggccgcc gtgtcccgct acaaccgcat ggcccgagcc ggcgccgacg aggtaactcc 32520caacttgtgc acctacggca ttctcatcgg ttcctgctgc tgcgcgggcc gcttggacct 32580cggtttcgcg gccttgggca atgtcattaa gaagggattt agagtggacg ccatcgcctt 32640cactcctctg ctcaagggcc tctgtgctga caagaggacg agcgacgcaa tggacatagt 32700gctccgcaga atgacccagc ttggctgcat accaaatgtc ttctcctaca atattcttct 32760caaggggctg tgtgatgaga acagaagcca agaagctctc gagctgctcc aaatgatgcc 32820tgatgatgga ggtgactgcc cacctgatgt ggtgtcgtat accactgtca tcaatggctt 32880
      cttcaaggag ggggatctgg acaaagctta cggtacatac catgaaatgc tggaccgggg 32940gattttacca aatgttgtta cctacagctc tattattgct gcgttatgca aggctcaagc 33000tatggacaaa gccatggagg tacttaccag catggttaag aatggtgtca tgcctaattg 33060caggacgtat aatagtatcg tgcatgggta ttgctcttca gggcagccga aagaggctat 33120tggatttctc aaaaagatgc acagtgatgg tgtcgaacca gatgttgtta cttataactc 33180gctcatggat tatctttgca agaacggaag atgcacggaa gctagaaaga tgttcgattc 33240tatgaccaag aggggcctaa agcctgaaat tactacctat ggtaccctgc ttcaggggta 33300tgctaccaaa ggagcccttg ttgagatgca tggtctcttg gatttgatgg tacgaaacgg 33360tatccaccct aatcattatg ttttcagcat tctaatatgt gcatacgcta aacaagggaa 33420agtagatcag gcaatgcttg tgttcagcaa aatgaggcag caaggattga atccggatac 33480agtgacctat ggaacagtta taggcatact ttgcaagtca ggcagagtag aagatgctat 33540gcgttatttt gagcagatga tcgatgaaag actaagccct ggcaacattg tttataactc 33600cctaattcat agtctctgta tctttgacaa atgggacaag gctaaagagt taattcttga 33660aatgttggat cgaggcatct gtctggacac tattttcttt aattcaataa ttgacagtca 33720ttgcaaagaa gggagggtta tagaatctga aaaactcttt gacctgatgg tacgtattgg 33780tgtgaagccc gatatcatta cgtacagtac tctcatcgat ggatattgct tggcaggtaa 33840gatggatgaa gcaacgaagt tacttgccag catggtctca gttggaatga aacctgattg 33900tgttacatat aatactttga ttaatggcta ctgtaaaatt agcaggatgg aagatgcgtt 33960agttcttttt agggagatgg agagcagtgg tgttagtcct gatattatta cgtataatat 34020aattctgcaa ggtttatttc aaaccagaag aactgctgct gcaaaagaac tctatgtcgg 34080gattaccgaa agtggaacgc agcttgaact tagcacatac aacataatcc ttcatgggct 34140ttgcaaaaac aatctcactg acgaggcact tcgaatgttt cagaacctat gtttgacgga 34200tttacagctg gagactagga cttttaacat tatgattggt gcattgctta aagttggcag 34260aaatgatgaa gccaaggatt tgtttgcagc tctctcggct aacggtttag tgccagatgt 34320taggacctac agtttaatgg cagaaaatct tatagagcag gggttgctag aagaattgga 34380tgatctattt ctttcaatgg aggagaatgg ctgtactgcc aactcccgca tgctaaattc 34440cattgttagg aaactgttac agaggggtga tataaccagg gctggcactt acctgttcat 34500gattgatgag aagcacttct ccctcgaagc atccactgct tccttgtttt tagatctttt 34560gtctggggga aaatatcaag aatatcatag gtttctccct gaaaaatata agtcctttat 34620
      agaatctttg agctgctgaa gccttttgca gctttgaaat tctgtgttgg agttcttttc 34680tcctacagtt gtattagagg agggatcttc tctttatgtg taaatagcga ggtatgtatg 34740tcacctctcc gaattatttt tactctggtt cctagacggt aaacaagcaa ttatgttctg 34800cctttgatgc cagaaaaaac acaaaagttt gtcgttatct ctactaacgg atcataaagg 34860aatttgtaac tggagtttca aacttaattt gtctaggcag tagttttggc attagatcca 34920acattgtgta ggattcattt gtgtgtatca atctataggg tttcattaaa tttcgttaat 34980gtgtactgtt taggtgttga atagtttgac ttgtttttta actgaacaaa agatactgaa 35040atcgttccat tcaacaaaca catgttccgt taatgaaatt attgtacgtt accttttgtt 35100ttcttactca caagtgtcct cttttcttat atcctataga ttggtacaac aaattattga 35160ttcaattttg gttttgaaca ttgatgatcc tccctgcact attggtgcag ctgctcttct 35220attcattttg tgaagtgatg tgagtacctc tcaatcccat ccttatgctt ctgtgcatgc 35280ttcattccaa ttttttacgc atatcgattg ttttctttta tataacagtc cataaagata 35340atcacatcat gacaaagtta tttatttcta cagtatagtt atataagtat tcaccagttt 35400tccatgaata ttttggcatg tgattacaaa gaagattatt tgagaaaatc catgctttta 35460tttcatcttt ttgtttgaag ttgaacttta atttatggtg taaatttcag ttattattgc 35520tagcagctcg tactctttaa tggtataact tcacttgtgc ttattctcca atatctccct 35580tcttgttgtt caggttcaag aaaatcattt gttggattca gaatctggtg tccattttct 35640tcttaaatta ttaaatcctc cagtgaatct tgttgattcc aaagcaccat cgataggttc 35700caaacttctt ggaatcagta aagttcaaat gcttaatgga tcaaataagg attctgactg 35760catttcagag gaaatccttt caaaagttga agagattctc ttaagctgtc aagtgatcaa 35820gtcgctcgac aaagatgaca agaaaacaac aaggccagaa ctgtgtccaa agtggcttgc 35880tttgttgaca atggaaaatg catgcttgtc tgctgtttca gtagagggta agttttaatc 35940aaatttcttg gtcatgattt ccctttatga ccattatatt tatttatatg agccaaataa 36000gcagttgtca acttgtcata agttacatag cacctatttg caatattcat gggtggtttg 36060cttagccctt ttcttcacct gcttttgatt gatgacttcc atctgtgttg cagaattgaa 36120ttggagtagt ggactgcact agaagcacct atggccattg tcatactagg aaggttttcc 36180cttatcaaat atttgattgt tacagagact tctgacacag tgtccagagt tggaggaaat 36240tttaaagaga cattaaggga gatgggaggt cttgatagta tttttgacgt tatggtggat 36300tttcattcaa cattggaggt gagatctcgc taacatcgca tattttacat ttcctttgtt 36360
      caactctaat ggattgtgca ggcttgttcc ttttcgccat tttagcttta atgtgcttga 36420agccacatga aagtaatgct tgtccagata catagccaaa ggttgttata ttttggggca 36480tggaaaatgc ttgaggtagt aactattttc atcaggacat ggaaaattgg ctgcaacaca 36540aattatgttg ttttatgttg caaaaatagt tttttaatac ttttttattc tgcatgtggt 36600gttagtatct tacagttcct ctgatgatta tatcccccac gataataaca cttgaaacga 36660taataacact tgacatatct acaccaagtg aacattattc atttggatgt tacttttcca 36720gctatacttg ctgttcttgc atgtgtaagc aagtttggag taaattgcgc attaatttaa 36780atgcttggtg ttcctatctg tgtacttttt attccccaac taataatgca atcatattac 36840gctgataaac tgaataaata aattaacaat atacttctgg tggcaaacct tgtgtatcag 36900aatctcataa aggatacatc cacttcagct ttggaccgaa atgaaggaac atctttgcaa 36960agtgctgctc tcctcttgaa atgtttgaaa atattggaaa atgccatatt tctaagcgat 37020gataacaagg taatgctcct tatatgttct gtttcagttt agtacccatt tccttcttct 37080gtactatctt ctctcctgat ttgttctgtg caaaatgtgc aaacagtgcg actttgtatg 37140tctgcttaac aattttcttt tcttcctgaa aaagcaatat gaactcttac attcattttg 37200cttcttgcag acccatttgc ttaatatgag tagaaaattg aacccgaaac gctccttgct 37260ttcttttgtt ggtgtcatta tcaatactat tgagttatta tcaggtattt ttcttaataa 37320tacaatgtgt tcgctaacac aataaaatgt tttaaacatc cagtatgtta aagttgcagt 37380ctgacgccta ttttgttttg ctgcagctct ttcaatactt cagaattctt ctgttgtttc 37440cagctctaca tatccgaaat cgtctaaagt ctctcaacag agttactctg gtaataacaa 37500acaccaattt tgtttgatca gttgatctcg ttggcttttc tatgcactgt ctcaatatag 37560tttggtcgcc attcaagtct cactacagat gttgaacttg gcctgacacc aaatatttat 37620aaaatgctac ctgatatttt taatatttca tgtttcctga cccagattat cttgttggtt 37680cctcgtataa gtttaattag tgacattctt gaagctttgt tatgcagcag atgtcatggg 37740gggaacttca tttaatgatg gaaagagcaa gaactcgaaa aaaaaaaact tttgtcgaac 37800cagacacgtc attgttgctt atcttcaaaa tcagaagttt ctcatattac tatatcttct 37860ggtagtgatg ctggtctgtc acagaaggca ttcaattgtt ctccatttat atcaagcaat 37920ggggcatcaa gtggttcatt aggcgagagg cacagcaatg gtagtggttt gaagttgaat 37980ataaaaaagg atcgtggcaa tgcaaatcca attagaggct caactggatg gatttcaata 38040agagcgcaca gttctgatgg gaactccaga gaaatggcaa aaagactccg tctatcttaa 38100
      aatgtaatca ccgacagtgg tggtggtgat gacccttttg catttgaccg ccgcgtcggc 38160gtcgccacca cgtaatcgcc cacgtcgctg cccccgctgc cacgtcgtcg accgcgcacg 38220gtaatcacac gcatctcgag gccgccgcta gctgatatct tctcatccgg ttgatttgtg 38280attttggcgt ttttgcagtg gtgatggcgg ggggcgaccg tggccgaggc gtggagtgcc 38340atccgcatca gggtgtatcg gccgcgctgc tccgccctgg tccgcaggct ttggcggcga 38400gctggcggcg gagggagact gtggtgagat cggatttcgc cgctggtggt gtcgctacca 38460tgggggattc gccgcaggcg ctctcaggtt tgcagcctcc tccactctct tccctttttt 38520attttttttt ctcgcaaaat gtgttgtgat gttcgtctcg ctgggcaggc ctcatagcca 38580ttaatgtagt ttgctggaac atttacattt ggaacgttgt tggcaattgc ttgacaaaat 38640gtggaattgt ggaggggaga aaaatcattt gaacctgcag tgacaaaatt gccatctcta 38700attttaaaac tgaaggtgtg gaaatcaaac ataatcattg ccagcgcatc attcttgtta 38760accaccatga tatattgttg gttataacag ttagctccac accaaccttg aaggtgtcaa 38820tagaatgttt agtataaatt gaggagaaca ggcagttgtt aagactttct aaagaacttg 38880tagcagctaa tactagctat tgtgcatttg tgtttcatgg aatttgagca gcaatggata 38940tttcttacta agatgtatga tgcaaaacaa aaaactatgt ctatacagtt tacatgtaat 39000gtgcggatgc aaataaaatc atgtacatgg acaaactcat gggattcata ccgaattcca 39060gaattgcatt tcttatgtgg ttacttttgt tgttgatttg gttaccagac atcgatgtga 39120tttcaagggt cagaggggtt tgcttctacg cggtggctgc agttgcagca atctttttgt 39180ttgtcgccat ggttgtggtt catccacttg tgctcctatt tgaccgatac cggaggagag 39240ttcaggaaaa aaatttgaaa atacccattt tttgaaaaag atttacgttt atatacacta 39300gtatgaagaa tttgcgaaaa tataactaat ccgcagatcg gttatgcggg agcgcaacaa 39360aagtatggcg tggcggcgcg gagtggacgg ccgaggcgtt cgcgcggaat ggggctgcgg 39420gaccgagcca gtctcgcttg ccggtaacgc ggaaccggta cgctcccgca gcgccagtgt 39480gcggaaccgc ggcgccaaca tttttttact gcatggcact gtgtttaata ctgtttgaca 39540ctgtttctgg tactgtttta cacagttccc gggtcagttc cgcacaatgg aggcgcggca 39600ccgaccatga acaatgtgtg aacagtgctg cacagggtta aaacagtgta taaactgcgc 39660tgcacagtgc tggagtcgct ggccactgcg gttccgcgtt ttggaaccgc gggaccgtcg 39720cgattccgcg ttttggagct gccggaccat gacggttccg cgcaggatcg tcggtcccgt 39780attttgaatc tgcggaaccg tcgctgtccc gcgtttccgt ttcgcgggat gcgtatattt 39840
      ttataaaacc tctccatgca tgtatataaa cataaattat tgaaaaaata agtatatttg 39900caaatttttt tcgagagctc agcactacat tgcaaagatt tgggcaactc tgacaatttc 39960catgttctac aagcttgacg tcgagggaat ggagaacctg ccaccgaata gtagccctgc 40020tatctatgtt gcgaaccatc agagtttttt ggatatctat acccttctaa ctctaggaag 40080gtgtttcaag tttataagca agacaagtat atttatgttc cgaattattt gatgggcaat 40140gtatctctta ggagtaattc ctttgcggcg tatggacagc aggagccagc tggtatggct 40200gtagtctcat ccctgctttc ttaagtagac atatatgcaa ttacagaatt tggtaaacaa 40260acaagatttt atgaatcata tatgattttg gggaaaacac caaactctct ttggtggctg 40320ccttgaacat agttctattc acacagttat agcaccttct ttaaaatgaa gaactttgtt 40380gcatacacat atggccaaac cacataatga attttgttta tttctatctt tgaatgttag 40440caccttattt tcatgcatat catgctaatt tgcttgccca cgttgagtgg gaattttttt 40500ccatgtttta taatttatat atgttctaga cttctagtcc acaatttatc tacttcatgt 40560tcctgagcct ctagtatggc tggtagcaga ctaggtgctg agtgctgtcc atttttgcag 40620actgaagaga ggagaaatac aggactgtcc gttgttagtc agatttgtaa aaatagactc 40680tgatgtagtt tattttagcc cctattttat atttaacaat acaaatatat aacgtatcct 40740aagaacttat cgtaatttag gagaagttgc tcgtttcatt aaattaaact gtgaagtaaa 40800aatgtgtgct cgagtctgtc aatgcaatcc tgtgttcttg tttgaagata tggtgtaggg 40860caggctagga tcgaacactg aatggtaaga ctgcttctgc cttcatttgt gcacttggtg 40920ctgccacgcc gattaagcag tagaacaaag taattttgtc gtgcacaaat gagttatatt 40980tcattgaaaa tcgaagtgaa aatgaaccaa aagatagaag aaaaggggaa acttggtaat 41040tatatactcc acaaatttat tggtaagatt tgatattaga cgctcgatta cttggcttaa 41100gttaaggata tcaaatttgg ggaagcacca aaggaattat tgtgaaggag ttgtgggtgc 41160ataacgttat ctactaggtt caaatcctag tgactatgaa tattaatgag taaggtaagg 41220gatttattgt taattttagt ttctttaaga ttgtgtccgg gtacaccatt cggtaagtgt 41280aataatgttt tgtattggat tcacttgtgt tacgtgcatg tgatttacct tttcatttgt 41340ttctgcgttc tgggtatgaa tttgacgaga ttccatggtc agctcaacat atcagttact 41400gcgtgtcaag cgatcttata tggtatgcgc acaagcgatt gtatacggat atgacagtat 41460aacgtgtgat attgatacga tgttcctttc ctttataaag gaacaaagac ttttttaaaa 41520aaaagaaggg gtattactaa aaaccaaaat gtcaaaaaca aaatatcagt gcacatggca 41580
      agtgtgcacg agcaatagct tgcccttacg ttcattattt agcatgtact actactaact 41640acgcaaaaat caattcaccg attattaaac tgttaacatc attttagcac gttaacatat 41700gtttcattca acacaccggt tttggcacat ttacaaactt gcaaagttgc aatactccct 41760tcgttacata gcataagaga ttttaggtga atgtgacaca tctatccaaa ttcattatac 41820tagaatgtat caccgcctcc acgccgggag ggagagcgcc gccggtggag aaagggggag 41880ggagtggtcg aggggaacca gtagggtgcc ctccccgtcg ccgcctcccc gtggccgcgc 41940cggcgagaca ggaggaagag ggggatatgg agcggcgccg ccggtgaggg cgcgcgcgcg 42000ggggggagcg gcgacgccgg tgaggaaggg aaggggagtg gtggctttga gagagatagg 42060ggggaggaaa aatgatttta gagttagggt ttgggctgct gagtttttat atagatcggg 42120atcaatcagg accgtccatc agatcggaca actacggctt ctcccgcgtt gggccgggtg 42180ccactcctag gttgcccaca ctattgggcc acatgtacgc tccgcgtgaa ataagttcac 42240tttaggtcct ttaagttgcc tctgaattgt tcccaggccg gccgcactat tgggccaccc 42300cataggccat gtgtacgctc cgcacagaat aatttcgctt tagctccctt aatttgtccc 42360ctcaaactcc taaaaccagt gcaaatcttt aatttttagt tcacccattg caactcacgg 42420gcatatttgc tagtgacata taatatgaaa cgaaggatgt agcagactat agaatttaaa 42480ctgtgctttc attttagagc atcactaact gttatttaga tttttattta aataaatgct 42540gaaatgatgt ttttattatg aaaattagca ataaagctcc caaaatttca aaaaaaaatt 42600aaaagagatt tattaatcat ggttaattta attaaaaatt aaatctaacc atatcatatt 42660atttcacggt ccgtgatgag gaaatggcag ctgctatcac ttacggtggg agagaagggg 42720cattgtttat ttttataact atctcttata actcccatga aactataaaa taaatataat 42780cattatcata acattagttt tttttccatt gcaacgcaag ggtaattttt cagtacaata 42840aaaaaaataa aagtgggcca ttctgaacgg aaatttctgg ttttttttcc caagagcgcc 42900gcacacaact gcgcaagaga tcgatcgcga tcaccctgct cgtcgccgat ctcctacacc 42960atccctgcca tctccttccc ctccactggc tgctgctgca cctgtcagct agggcgggca 43020tggcgcgccg cgccgcttcc cgcgctgctg gcgcccttcg ctcggagggc tcgatccaag 43080ggcgaggggg ccgcgcgggg ggcagtggcg gtggcgcgga ggacgcacgc cacgtgttcg 43140acgaattgct ccgtcgtggc ataccagatg tcttctccta caatattctt ctcaacgggc 43200tgtgtgatga gaacagaagc caagaagctc tcgagttact gcacataatg gctgatgatg 43260gaggtgactg cccacctgat gtggtgtcgt acagcaccgt catcaatggc ttcttcaagg 43320
      agggggatct ggacaaaatg cttgaccaga ggatttcgcc aaatgttgtg acctacaact 43380ctattattgc tgcgctatgc aaggctcaaa ctgtggacaa ggccatggag gtacttacca 43440ccatggttaa gagtggtgtc atgcctgatt gcatgacata taatagtatt gtgcatgggt 43500tttgctcttc agggcagccg aaagaggcta ttgtatttct caaaaagatg cgcagtgatg 43560gtgtcgaacc agatgttgtt acttataact cgctcatgga ttatctttgc aagaacggaa 43620gatgcacgga agcaagaaag atttttgatt ctatgaccaa gaggggccta aagcctgata 43680ttactaccta tggtaccctg cttcaggggt atgctaccaa aggagccctt gttgagatgc 43740atggtctctt ggatttgatg gtacgaaacg gtatccaccc taatcattat gttttcagca 43800ttctagtatg tgcatacgct aaacaagaga aagtagaaga ggcaatgctt gtattcagca 43860aaatgaggca gcaaggattg aatccgaatg cagtgaccta tggaacagtt atagatgtac 43920tttgcaagtc aggtagagta gaagatgcta tgctttattt tgagcagatg atcgatgaag 43980gactaagacc tgacagcatt gtttataact ccctaattca tagtctctgt atctttgaca 44040aatgggagaa ggctgaagag ttatttcttg aaatgttgga tcgaggcatc tgtcttagca 44100ctattttctt taattcaata attgacagtc attgcaaaga agggagggtt atagaatctg 44160gaaaactctt tgacttgatg gtacgaattg gtgtgaagcc cgatatcatt acccttggca 44220ggtaagatgg atgaagcaat gaagttactt tctggcatgg tctcagttgg gttgaaacct 44280aatactgtta cttatagcac tttgattaat ggctactgca aaattagtag gatggaagac 44340gcgttagttc tttttaagga gatggagagc agtggtgtta gtcctgatat tattacgtat 44400aacataattc tgcaaggttt atttcaaacc agaagaactg ctgctgcaaa agaactctat 44460gtcaggatta ccgaaagtgg aatgcagatt gaactttgtt agatttaatt ggataattaa 44520tccatttaaa tcaattaaat caaataaatt ccaaggctca ttatgctagg aattcatgtg 44580aattcattct tctatgggat atcaatggga tgaagagttt tgagaattaa tccatttgat 44640taaggaattg gtaacttata tcaattaatc ctaattgatg gatggttgat ggttgtgtag 44700tggaggatgg ttcatggcta gttgatgaca attagttgct ctattcctct tcctattcca 44760ttggtaactt acatcaatta ctcttaattg attgttggtt gatggttgtg tagtggagga 44820tggttcatgg ctagttgatg acaattagtt gctccattcc tcttcctatt ccatgactct 44880tactcttcat cttccattcc tcttataaaa tgagaatgga tttgatctcc cgcgagaaga 44940agaagacaca ctttcatcca ttttcaaaag ctgttgctgc tacggtaatc ccatcccgac 45000gagtgtgtgc acacgcgttg ggagagtagg cctccgaaac cacgcgttgc tgcgacgttt 45060
      gcacagacgg gcgggcgatc aggtttttgg ggagcgcaag gcgcgactac tcactgttcg 45120tcaacatcta cttcatcttc accaacatgt cgaacactgg agacaaggag aaggagactc 45180ccgtcaacac caacggaggc aatactgcct caaactccag cggaggacca ttcttggggt 45240ataaccttat tacattattt caattagaag ttttactgtt aatgttcatc gcaatgtcaa 45300cattgtgtca ttatgtgatt gttgatgctt attcaacgtt aagcatgctc atgttgatta 45360cattcaccac tatcactgga tcaaatccta ttgtaaatat catgtttatt atcttgttat 45420tttggattaa aatatgccga attatgacca aatttccaac aaacttagca catacaacat 45480aatccttcat ggactttgca aaaacaaact cactgatgat gcacttcgaa tgtttcagaa 45540cctatgtttg atggatttga agcttgaggc taggactttc aacattatga ttgatgcatt 45600gcttaaagtt ggcagaaatg atgaagccaa ggatttgttt gttgctttct cgtctaacgg 45660tttagtgccg aattattgga cgtacagatt gatggctgaa aatattatag gacaggggtt 45720gctagaagaa ttggatcaac tctttctttc aatggaggac aatggctgta ctgttgactc 45780tggcatgcta aatttcattg ttagggaact gttgcagaga ggtgagataa ccagggctgg 45840cacttacctt tccatgattg atgagaagca cttttccctc gaagcatcca ctgcttcctt 45900gtttatagat cttttgtctg ggggaaaata tcaagaatat catatatttc tccctgaaaa 45960atacaagtcc tttatagaat ctttgagctg ctgaagcatt ttgcagcttt gaaattctgt 46020gttggaattc ttttctccta cagtccgatt agaggaggga tcttctctgt atgtgtaaat 46080agcgaggtat gtatgtcacc tctccgaatt attttgactg tggttcctgg actgtaaaca 46140agctattatc ttctggtgtt gatgccagaa aaaacacaaa agtttgtcgt tatctctact 46200aacggatcat aaaggggttt gtaactggag tttcaaactt aaggtatcta ggcagtaggt 46260atatattgat cctacatctt atgatcttaa gatgatatcc ttctcattat cctctgctga 46320aactttagct tgaaccgtca tctacaccac aatttgagcc ccttagcaca gagcacaacg 46380agcaatagct tgcccttacg ttcattattt agcatgcact actactaact acccaataat 46440caatacatcg gttattaaac tgtttgtaca gtttaataat gtcattttat cacgttaaca 46500tatgtttcat tcaacaccac accggttttg gcacagttgc aaacttgcaa taacattttt 46560actacttctc cgccccataa tataacaatc tcgttccata ctatattgct atattacggg 46620acggatgaag tacttctttc cttccaaaat ataagaatct agtcctagat tagatattat 46680ttggattcac gaatttgatt aggctatcta gatttgtagt cgtatgtaat gtctaattcg 46740gtaataggtt attacctctt tggatggagg gagtagtttt tatttcgtac tccctctgtt 46800
      tcatattata agttgttttg acttttttct tagtcaaatt ttattgagtt tgactaaatt 46860tatagaaaaa aaattagcaa catttaagca ccacattagt ttcattaaat gtagcatgga 46920atatattttt ataatatgtt tgttttttta ttaaaatgct actatatttt tctataaatg 46980tagccaaatt taaagaagtt tgattacgaa aaaaaatcaa aatgacatat aatatgaaac 47040tgaggatgta gcagactata gcaaatttaa actatgcttt tattttagag catcaccaaa 47100agagatagcc taaatcttat cttaactaat taaaatattc ataattttcc tttcgtcaca 47160ttaaattttc gtccgtaaat ccgattgaaa tccaactaga caatccaaaa aatagagaaa 47220aagaacagaa aaaataataa aaagcacaca aatcttatct caatcccgcg ggaagctgcc 47280gatgccgccg aatccgctcg agcgccgccg ccgccgctca cggggaacga tgtcgctgct 47340atcgcacgtg gtatgggagg gcgccgccgc cgctgcttgg gagataggat atggagagag 47400aaggaaatgt gagggagggt taggtttttc cccattcgta tcttcagcga cacggaggcg 47460atccaagctg tccatcagat cagacggctc agaacgcctc catcttcagg ccgcgcatgc 47520ttgatgggcc gagggaaggc cggagggtcg aacaaacgta gtcagaggag gagttggagg 47580aggtaaagta gaatttattt gcgggctgag atagtaaatg gactgaaaat ggcccataga 47640gaaattggga attttattta aataaatgtt gaaaaggtgt ttatattatc aaaattagaa 47700attaagctcc gaaaatttta aaaaatattc aaagagcatt attaatcatg attaatttaa 47760taaaaattaa atccaaccat atcatattat ttcacggcgc gcagtaggaa aatgcgcagc 47820tgttgtcgct tacggtggga gagaagggac attgtttatt ttcagaacta tcttttataa 47880ctcccatgga actttaaaat aaatataatc attattatag cattagtttt tttctgtctt 47940ttttttcccc aagagcgccg cgcagaagag atcgatcgcg atctccctgc cccgacgtcg 48000ccggccgatc tctcattctc tccacgccct gctcgtcgcc gatctcctac accatccctg 48060ccatctcctc cttcccctcc cctctatcct ccactggtgc cgcccacctc tccgtataag 48120acaaactgcg ttgcggcgtt ggtttccgcc ggcgctgctg ctgcacctgt cagctagggc 48180gggcatggcg cgccgcgccg cttcccgcgc tgttggcgcc cttcgctcgg acggctcgat 48240ccaagggcga ggaggccgcg cggggggcag tggcgccgag gacgcacgcc acgtgttcga 48300cgaattgctc cggcgtggca ggggcgcctc gatctacggc ttgaaccgcg ccctcgccga 48360cgtcgcgcgt cacagccccg cggccgccgt gtcccgctac aaccgcatgg cccgagctgg 48420cgccgacgag gtaactcccg acttgtgcac ctacggcatt ctcatcggtt gctgctgccg 48480cgcgggccgc ttggacctcg gtttcgcggc cttgggcaat gtcattaaga agggatttag 48540
      agtggaagcc atcaccttca ctcctctgct caagggcctc tgtgccgaca agaggacgag 48600cgacgcaatg gacatagtgc tccgcagaat gaccgagctc ggttgcatac caaatgtctt 48660ctcctacaat aatcttctca acgggctgtg tgatgagaac agaagccaag aagctctcga 48720gttgctgcac atgatggctg atgatcgagg aggaggtagc ccacctgatg tggtgtcgta 48780taccactgtc atcaatggct tcttcaaaga gggggattca gacaaagctt acagtacata 48840ccatgaaatg ctggaccggg ggattttacc tgatgttgtg acctacagct ctattattgc 48900tgcgttatgc aagggtcaag ctatggacaa gccatggagg tacttaccac gatggttaag 48960aatggtgtca tgcctgattg catgacatat aatagttatt tcttgaaatg ttggatcgag 49020gcatttgtct ggacactatt ttctttaatt caataattga cagtcattgc aaagaaggga 49080gggttataga atctgaaaaa ctctttgacc tgatggtacg tattggtgtg aagcctgata 49140tcattacata cagtacactc atcgatggat attgcttggc aggtaagatg gatgaagcaa 49200tgaagttact ttctggcatg gtctcagttg ggttgaaacc taatactgtt acttatagca 49260ctttgattaa tggctactgc aaaattagta ggatggaaga cgcgttagtt ctttttaagg 49320agatggagag cagtggtgtt agtcctgata ttattacgta taacataatt ctgcaaggtt 49380tatttcaaac cagaagaact gctgctgcaa aagaactcta tgtcaggatt accgaaagtg 49440gaacgcagat tgaacttagc acatacaaca taatccttca tggactttgc aaaaacaaac 49500tcactgatga tgcacttcag atgtttcaga acctatgttt gatggatttg aagcttgagg 49560ctaggacttt caacattatg attgatgcat tgcttaaagt tggcagaaat gatgaagcca 49620aggatttgtt tgttgctttc tcgtctaacg gtttagtgcc gaattattgg acgtacaggt 49680tgatggctga aaatattata ggacaggggt tgctagaaga attggatcaa ctctttcttt 49740caatggagga caatggctgt actgttgact ctggcatgct aaatttcatt gttagggaac 49800tgttgcagag aggtgagata accagggctg gcacttacct ttccatgatt gatgagaagc 49860acttttccct cgaagcatcc actgcttcct tgtttataga tcttttgtct gggggaaaat 49920atcaagaata ttataggttt ctccctgaaa aatacaagtc ctttatagaa tctttgagct 49980gctgaagcat tttgcagctt tgaaattctg tgttggaatt cttttctcct acagtcctat 50040tagaggaggg atcttctctg tatgtgtaaa tagcgaggta tgtatgccac ctctccgaat 50100tatttttact gtggttccta gactgtaaac aagcaattat gttatgctgt tgatgccaga 50160aaaaacataa aagtttgtcg ttatctctac taacggatca taaagggatt tgtgactgga 50220gtttcaaact taatgtgtct aggcagtaat tttgacatta gatccaaaac aatttatagg 50280
      gtttcattaa atttcatcta tgtgtactgt ttaggtgttg aatagtttga cttgtttttt 50340aactgaacaa aagatatgtc tgaagctttg ttctttacca aatgcagtac tgatcatcac 50400aatatatttt ttatggaaca agattggatt gtatagaatg gtttccgatc tgattatctt 50460atctcaacgt attattatgc acatgtacta atcatgaaat atctgatgga atgatgtttc 50520tatttacctg tgtgaggcag caaggagtga gatggataac accacatact ccctctatcc 50580cagaatataa gaagttttag agttggacac gattattaag aaagtaggta gaagtgagta 50640gtggagggtt gtgattgcat gagtagtgga ggtaggtggg aaaagtgaat ggtggagggt 50700tgtgattggt tgggaagaga atgttggtag agaagttgtt atattttggg gagtacatta 50760ttattctaga acaatactgt tgtgctcaag aagcgttcca aagatgtttc acaacctgtg 50820ctcgatgggt tttgagctta atcctgggac attcagtatc atgatctgtc tcattcttaa 50880acatggaata aaggatgaca gcatgatttc tttgtctcta taatcttttg gctacccaca 50940gataatagct gtaaatctat actactttaa aaggagtagt ggtggtggtg agtggtgaat 51000ctgccaccac cccaccacca actctcaaaa ttctgacatg tgggatcact gtcaatccct 51060tctccaagac atgtgggatc actgtcaatc ccttctccaa accaattgta tgatagaaca 51120gtggaaatca cggacagacc atggagctct caaccataat catccttgcg agttaataac 51180aaatggagcg taaacttggc aagcaaaaaa ctcaaattaa ttctaaaatt aagctctagg 51240attcaaaata gatttcctct ctgcattgtg ctgttatgat ttttaattcc gtaacaacgc 51300aaatgcattt tgctagtctt ataaagaagg gttaatgcaa atattctgat taaatgattg 51360tatctatgaa gtttgaatgc tagtggaagc tcctttgacc atgttttgtt gtgcgagcat 51420ttaagagagt gaagagaatg cttctttggt gctgttctgg tatggaagga tccacagata 51480aaattcaggt tctactgctt ctctgcttgt aattttcatg aagctgcagt gaataccttg 51540ttgaccactt gatctgttgc tttgaaggag aatatagtag tggccaaggt tggtgacggt 51600gatggtggca tgtgatcccc cagatcttca gtgacccaga gaggagggga cggcgcgtgg 51660tgagctacaa ggcatactca gtggagggca agatcaaggc ctcccgtccg taggggactc 51720cgctgcatca aggccaactg ctccgaactg atcaatttct ggtacggatc acttctcctt 51780tccttttttt tttcacctta agcactctct tgattcttcg ctgctacctc ccttaatttc 51840tttcaatata ttgtggcact tgatcatggc ggagacccac cttccagtgt gaatggattt 51900tgtcaaagaa ctaaatttat tccattagct tattttctga ttacatggaa gacattcttt 51960tctggaataa atacagaact aaatcctgtt tcctgaataa aagttgttag tgtgtggcat 52020
      ggtgcatttc cgcgcttcta aattttataa aacctgttca ttcaatttga acctgcatcc 52080aatccaatat tttaggtgca gacaggtgct tgcggtcagg ttaaagaagt tggcaaaaat 52140gcttctgaag aaaggttaat tgttgtttca tctcaggagg taatatgcag atgattattc 52200caattggcat tgccttgcca tttttatcac gagtctttac aattttatat cctcctacat 52260attctttcca gattccagat gatccagtgt ctccaacaat tgaggcgctt attttgctcc 52320atagtaaagc aagtacactt gctgagaacc accagttgac aacacggctt gttgtaccat 52380caaacaaagt tggttgtatt cttggggaag gtggaaaggt aattactgaa atgagaagac 52440ggactggggc tgaaatccga gtctactcaa aagcagataa acctaagtac ctgtcttttg 52500atgaggagct tgtgcaggta atttatttgg ccatacctac accagagatc catatattac 52560ttttataact gcagttttta cttgttaaca tttcattgtg cttttacatt tgttccaagc 52620tttcaggttg ctgggcttcc agctattgaa agaggagccc tgacagagat tgcttcgagg 52680ctttgaacta ggacactcag agatggaagt tcttccaata atccgacacc ttttgcccct 52740gttgatggtc ctcctgttga tatcttgcct aacaaggaat tcatgctata tggacgatct 52800gctaatagtc ccccatatgg agggcctgct aatgatccac catatggaag acctgccatt 52860gatccaccat atggaagacc aatatccaca atatggaaga cctgccaatg atccaccata 52920tagaagacct gtcaatgata catcatattg agggttggac aatgatgggc ctcgtgatca 52980ggcccggtcc tgaggggggt cgaatggggc gatcgctccg ggcccccgat tcccagggcc 53040cccacctatc tgtgcaacga gtagtagcga tcttccagcg cgcaacgtga ggcgatgttt 53100ctccgtgatt tcgccggcct gcaactgcga gatcgcgagt ataacgatca gccgatcgat 53160ctcatctgcc gactgccatg ctgatgccac acgcaagcgc agcatatcag ccttatcttg 53220gttgatcggc atgctggacg agcacatctg ttgtcgcatc aactgctgac tgctatatat 53280gtgctggtgc tgaatcgatc gattgtcgtc gcggaagtga agaacaacca cggcactgct 53340gcctgctggg ctctagccgc catcagtaag tacgctatac tgcctatcta gatctagatc 53400gagattacat agtggaatta tctgtttata acaaaattac aaggtatcaa ttgataattt 53460aaggttataa ccgtacaaac ttcagtgatt tgctggtttc acattggtta gatttgtttc 53520aactaatttg gtacttctgt agccttgtaa tttacgaatc tagtattaat attttcttaa 53580gtattagcct gttccttgat attatgctgt tgagaaagta tgcaatagat aacaaaaaca 53640agtaggtgtg ttgaggatgc tcaagagtaa tacagccact tcaataattc tgatattatc 53700aggacatcat caataattct gcgcctacaa atcttcaaag aaaattttaa tataatgcgt 53760
      atgatttttt aaatacgaat attgattgct atttaaagat atttatatta tatggtaatt 53820attatttgaa ggtttataat aaaggcctcc gtttttagtt tcacgctggg ccttcagaat 53880ctcaggaccg gccctgctca tgatc 53905&lt;210&gt;29&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;29atcaggagcc ttcaaattgg gaac 24&lt;210&gt;30&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;30ctcgcaaatt gcttaatttt gacc 24&lt;210&gt;31&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;31
      tgaaggagtt atgggtgcgt gacg 24&lt;210&gt;32&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;32ttgccgagca cacttgccat gtgc 24&lt;210&gt;33&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;33gcgacgcaat ggacatagtg ctcc 24&lt;210&gt;34&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;34ttacctgcca agcaatatcc atcg 24
      &lt;210&gt;35&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;35aaggcatact cagtggaggg caag 24&lt;210&gt;36&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;36ttaacctgac cgcaagcacc tgtc 24&lt;210&gt;37&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;37tggatggact atgtggggtc agtc 24&lt;210&gt;38&lt;211&gt;24
      &lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;38agtggaagtg gagagagtag ggag 24&lt;210&gt;39&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;39ccctccaaca cataaatggt tgag 24&lt;210&gt;40&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;40tttctgccag gaaactgtta gatg 24&lt;210&gt;41&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列
      &lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;41gcgatcttat acgcatacta tgcg24&lt;210&gt;42&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;42aaagtctttg ttccttcacc aagg24&lt;210&gt;43&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;43gaggatt tat caaaacagga tggacg 26&lt;210&gt;44&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物
      &lt;400&gt;44tgggcggcag cagtggagga taga 24&lt;210&gt;45&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;45aagaagggag ggttatagaa tctg 24&lt;210&gt;46&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;46atatcaggac taacaccact gctc 24&lt;210&gt;47&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;47acgagtagta gcgatcttcc agcg 24
      &lt;210&gt;48&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;48cagcgtgaaa ctaaaaacgg aggc 24&lt;210&gt;49&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;49atcccacatc atcataatcc gacc 24&lt;210&gt;50&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;50agcttctccc ttggatacgg tggcg 25&lt;210&gt;51
      &lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;51atttgttggt tagttgcggc tgag 24&lt;210&gt;52&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;52gcccaaactc aaaaggagag aacc 24&lt;210&gt;53&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;53cctcaagtct cccctaaagc cact 24&lt;210&gt;54&lt;211&gt;24&lt;212&gt;DNA
      &lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;54gctctactgc tgataaaccg tgag 24&lt;210&gt;55&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;55tggatggact atgtggggtc agtc 24&lt;210&gt;56&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;56agtggaagtg gagagagtag ggag 24&lt;210&gt;57&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;57tacgacgcca tttcactcca ttgc 24&lt;210&gt;58&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;58catttctcta tgggcgttgc tctg 24&lt;210&gt;59&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;59acctgtaggt atggcacctt caacac 26&lt;210&gt;60&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;60
      ccaaggaacg aagttcaaat gtatgg 26&lt;210&gt;61&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;61tgatgtgttt gggcatccct ttcg24&lt;210&gt;62&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;62gagatagggg acgacagaca cgac24&lt;210&gt;63&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;63tcctatggct gtttagaaac tgcaca 26
      &lt;210&gt;64&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;64caagttcaaa cataactggc gttg 24&lt;210&gt;65&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;65cactgtcctg taagtgtgct gtgc 24&lt;210&gt;66&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;66caagcgtgtg ataaaatgtg acgc 24&lt;210&gt;67&lt;211&gt;24
      &lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;67tgcctactgc cattactatg tgac 24&lt;210&gt;68&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;用于擴增的寡核苷酸引物&lt;400&gt;68acatactacc gtaaatggtc tctg 2權(quán)利要求
      1.一種恢復(fù)水稻育性的方法,包括將核酸導(dǎo)入到水稻中,其中所述核酸具有恢復(fù)育性的功能,并具有SEQ ID NO.27所示堿基序列或具有與SEQ IDNO.27所示堿基序列有至少70%同一性的堿基序列。
      2.一種恢復(fù)水稻育性的方法,包括將核酸導(dǎo)入到水稻中,其中所述核酸具有恢復(fù)育性的功能,并具有SEQ ID NO.27的第38538至54123位的堿基序列或具有與SEQ ID NO.27的第38538至54123位的堿基序列有至少70%同一性的堿基序列。
      3.一種恢復(fù)水稻育性的方法,包括將核酸導(dǎo)入到水稻中,其中所述核酸具有恢復(fù)育性的功能,并具有SEQ ID NO.27的第42132-48883位的堿基序列或具有與SEQ ID NO.27的第42132-48883位堿基序列有至少70%的同一性的堿基序列。
      4.根據(jù)權(quán)利要求1-3中任意之一項的方法,其中所述核酸具有與SEQ IDNO.27或與SEQ ID NO.27的第38538至54123位的堿基序列有至少70%同一性的堿基序列,并滿足以下1)和2)中至少一個條件1)與SEQ ID NO.27的第45461位堿基相應(yīng)的堿基是A;和2)與SEQ ID NO.27的第49609位堿基相應(yīng)的堿基是A。
      5.根據(jù)權(quán)利要求1-4中任意一項的方法,其中將包含水稻恢復(fù)基因基因座的核酸導(dǎo)入到水稻中,且除水稻恢復(fù)基因之外不包含任何結(jié)構(gòu)基因。
      6.一種鑒定被測個體或其種子是否具有水稻恢復(fù)基因(Rf-1基因)的方法,其中利用了可確定Rf-1基因功能存在的序列,該序列位于水稻第10號染色體上的多態(tài)性檢測標記位點P4497 MboI和B56691 XbaI之間。
      7.根據(jù)權(quán)利要求6的方法,其中Rf-1基因存在于具有SEQ ID NO.27堿基序列的核酸,或具有與SEQ ID NO.27的堿基序列有至少70%同一性的堿基序列的核酸中。
      8.根據(jù)權(quán)利要求6的方法,其中Rf-1基因存在于具有SEQ ID NO.27第38538至54123位堿基序列的核酸,或具有與SEQ ID NO.27第38538至54123位的堿基序列有至少70%同一性的堿基序列的核酸中。
      9.根據(jù)權(quán)利要求6的方法,其中Rf-1基因存在于具有SEQ ID NO.27第42132至48883位堿基序列的核酸,或具有與SEQ ID NO.27第42132至48883位的堿基序列有至少70%同一性堿基序列的核酸中。
      10.根據(jù)權(quán)利要求7-9中任一項的方法,其中在所述核酸具有與SEQ IDNO.27或與SEQ ID NO.27的第38538至54123位堿基序列有至少70%同一性的堿基序列,并滿足以下1)和2)中至少一個條件時,可確定被測水稻個體或其種子具有Rf-1基因1)與SEQ ID NO.27的第45461位堿基相應(yīng)的堿基是A;和2)與SEQ ID NO.27的第49609位堿基相應(yīng)的堿基是A。
      11.根據(jù)權(quán)利要求7-10中任一項的方法,其中包括i)根據(jù)包括了下述任何一個堿基鄰近區(qū)域的堿基序列制備引物對1)與第45461位堿基相應(yīng)的堿基;或2)與第49609位堿基相應(yīng)的堿基;以擴增上述的堿基及其附近的區(qū)域;ii)用被測水稻個體或其種子的基因組DNA作為模板進行核酸擴增反應(yīng);和iii)根據(jù)所述的核酸擴增產(chǎn)物中發(fā)現(xiàn)的多態(tài)性來確定被測水稻個體或其種子中是否存在Rf-1。
      12.根據(jù)權(quán)利要求11的方法,其中當步驟iii)滿足下面的1)和2)中至少一個條件時,可確定被測水稻個體或其種子中存在Rf-1基因1)包含與SEQ ID NO.27的第45461位相應(yīng)堿基的區(qū)域不存在任何TaqI識別序列;和2)包含與SEQ ID NO.27的第49609位相應(yīng)堿基的區(qū)域不存在任何BstU識別序列。
      13.根據(jù)權(quán)利要求11或12的方法,其中利用的引物對具有選自SEQ IDNO45和46,及SEQ ID NO47和48的堿基序列。
      14.一種抑制Rf-1基因的功能以恢復(fù)育性的方法,通過導(dǎo)入長度至少100個連續(xù)堿基的反義序列,其具有的堿基序列互補于具有SEQ ID NO.27或與SEQ ID NO.27的堿基序列有至少70%同一性堿基序列的核酸,并且有恢復(fù)育性的功能。
      15.一種抑制Rf-1基因的功能以恢復(fù)育性的方法,通過導(dǎo)入長度至少100個連續(xù)堿基的反義序列,且其序列選自互補于具有SEQ ID NO.27第38538-54123位或與SEQ ID NO.27第38538-54123位的堿基序列有至少70%同一性的堿基序列的核酸來達到的,其具有恢復(fù)育性的功能。
      16.一種核酸,具有恢復(fù)育性功能,并具有SEQ ID NO.27或與SEQ IDNO.27的堿基序列有至少70%同一性的堿基序列。
      17.一種核酸,具有恢復(fù)育性功能,并具有SEQ ID NO.27第38538-54123位或與SEQ ID NO.27第38538-54123位的堿基序列有至少70%同一性的堿基序列。
      18.一種核酸,具有恢復(fù)育性功能,并具有SEQ ID NO.27第42132-48883位的堿基序列或者具有與SEQ ID NO.27第42132-48883位的堿基序列有至少70%同一性的堿基序列。
      全文摘要
      本發(fā)明提供一種利用BT型雄性不育細胞質(zhì)來使水稻具備育性或控制其育性的方法,以及鑒定恢復(fù)基因是否存在的方法。本發(fā)明利用了具有SEQ IDNO.27所示堿基序列的核酸或與SEQ ID NO.27所示堿基序列有至少70%同一性的核酸,其具有恢復(fù)育性的功能?;蛘?,可以利用具有SEQ ID NO.27的第38538至54123位堿基序列的核酸,或與SEQ ID NO.27的第38538至54123位堿基序列有至少70%同一性的核酸,它們也具有恢復(fù)育性的功能。
      文檔編號C07K14/415GK1589325SQ02823020
      公開日2005年3月2日 申請日期2002年9月13日 優(yōu)先權(quán)日2001年9月19日
      發(fā)明者小森俊之, 太田象三, 村井宣彥, 樋江井佑弘 申請人:日本煙草產(chǎn)業(yè)株式會社, 欣根塔有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1