切割來自著色性干皮病基因的dna靶序列的大范圍核酸酶變體及其應(yīng)用的制作方法

文檔序號：1219602閱讀：210來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>醫(yī)藥醫(yī)療技術(shù)的改進;醫(yī)療器械制造及應(yīng)用技術(shù)

專利名稱：切割來自著色性干皮病基因的dna靶序列的大范圍核酸酶變體及其應(yīng)用的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種切割來自著色性干皮病基因(XP基因)的DNA靶序列的大范圍核酸酶變體，涉及一種編碼所述變體的載體，涉及一種被所述載體改造的細胞、動物或植物，并且涉及所述大范圍核酸酶變體及其衍生產(chǎn)物用于體內(nèi)和體外基因組療法(基因細胞療法)、以及基因組工程的應(yīng)用。

背景技術(shù)：
著色性干皮病(XP)是一種罕見的常染色體隱性遺傳疾病，其特征表現(xiàn)為對暴露于紫外線(UV)下的高敏感性，對于日光曝曬區(qū)域罹患皮膚癌有高度傾向性，并且有時會神經(jīng)錯亂(Hengge，U.R.and W.Bardenheuer，Am.J.Med.Genet.C.Semin.Med.Genet.，2004，13193-100；Magnaldo，T.and A.Sarasin，Cells Tissues Organs，2004，177189-198；Cleaver，J.E.，Nat.Rev.Cancer，2005，5564-573；Hengge U.R.，Clin.Dermatol.，2005，23107-114)。XP病人的細胞消除紫外線誘導(dǎo)的DNA病變的能力較低(Cordonnier，A.M.and R.P Fuchs，Mutat.Res.，1999，435，111-119)。這樣的異常結(jié)果是由核苷酸切除修復(fù)(NER)工序中的缺損引起的，該NER是一種在真核生物中保存、并且涉及因受損核苷酸的切除而導(dǎo)致的受損DNA的修正以及再合成的可變機制。該工序的缺損導(dǎo)致DNA中的紫外線損傷的持續(xù)，進而導(dǎo)致曝光于紫外線的皮膚區(qū)域誘發(fā)突變和腫瘤發(fā)展。三種主要類型的皮膚癌，即鱗狀細胞癌、基底細胞癌和惡性黑色素瘤在孩童時期就已經(jīng)出現(xiàn)。通過細胞融合實驗，將XP突變病人分成7組互補群(XP-A至XP-G)，并且各個互補群是根據(jù)獨特的NER基因突變產(chǎn)生的。人類基因、以及被編碼的蛋白質(zhì)往往以互補群命名。例如，在XP-C互補群中突變的XPC基因(圖1A)編碼DNA損傷結(jié)合蛋白。
直到現(xiàn)在，僅有的可以用于XP病人的治療手段是完全避免日光照射(以及避免某些產(chǎn)生長波紫外線的普通燈光照射)，或者是反復(fù)進行外科手術(shù)以除去出現(xiàn)的皮膚癌。人們已經(jīng)嘗試了數(shù)種自體移植技術(shù)，以用病人身體上未曝光部分的皮膚替換這樣的癌變區(qū)域。然而，因為移植的細胞還是對太陽敏感，故對于病人的益處最多限于幾年光景，并且大多數(shù)病人在成年之前會因為癌細胞轉(zhuǎn)移而死亡。皮膚移入可以局部進行，但是就免疫耐受性而言，其具有移植的一般限制。
因此，基因療法和細胞療法代表了人們對于這種疾病的巨大希冀。因為來自皮膚譜系的細胞可以容易地進行體外操作，在將病人細胞返回移植在腫瘤位置之前，操縱病人細胞并且修正它們的遺傳缺陷將具有可能性。相比其他的XP互補群，XP-C似乎是用于修正性基因轉(zhuǎn)移的最佳候選。在歐洲和北非，XP-C涉及超過一半的XP病人，并且雖然XPC表達是普遍存在的，但XP-C病人沒有在其他XP群中觀察到的神經(jīng)學(xué)上的問題。針對XP病人組織療法的初步研究表明，來自多種互補群(XP-A、XP-B、XP-C、XP-D)的XP成纖維細胞、以及具有XP克隆基因的XP-C初級角化細胞的體外反轉(zhuǎn)錄病毒轉(zhuǎn)導(dǎo)導(dǎo)致恢復(fù)完全DNA的修復(fù)能力(Arnaudeau-Begard et al.，Hum.Gene Ther.，2003，14，983-996；Armelini et al.，Cancer GeneTher.，2005，12，389-396)。另外，來自皮膚譜系的細胞可以容易地操縱，然后用于重建功能性的皮膚(Arnaudeau-Begard et al.，Hum.Gene Ther.，2003，14，983-996；Armelini et al.，CancerGene Ther.，2005，12，389-396)。于是，長期組織療法的基本原理和可選的前途將存在于在將重建的皮膚返回移植給病人以前，對角化細胞中XP-C基因座進行體外基因修正。
同源重組是精確地改造給定基因座的最好方法。同源基因靶向策略已被用于敲除內(nèi)源基因(Capecchi，M.R.，Science，1989，2441288-1292；Smithies O.，Nat.Med.，2001，71083-1086)，或者在染色體中敲入外源序列。同源基因靶向策略也可以用于基因修正，并且原則上，用于修正與單基因性疾病比如XP相聯(lián)系的突變。然而，由于處理的低效率(占轉(zhuǎn)染細胞的10-6至10-9)，這種應(yīng)用實際上是較困難的。在過去的十年中，人們已開發(fā)幾種方法來提高該產(chǎn)率。例如，嵌合修復(fù)術(shù)(De Semir et al.J.Gene Med.，2003，5625-639)和小片段同源置換術(shù)(Gonczetal.，Gene Ther，2001，8961-965；Bruscia et al.，Gene Ther.，2002，9683-685；Sangiuolo et al.，BMC Med.Genet.，2002，38-；De Semir and Aran，Oligonucleotides，2003，13261-269；USPatent 6,010,908)，兩者都被人們試著用于修正CFTR突變，取得了不同水平的成就。
另一個提高重組效率的策略是通過使用大范圍核酸酶，釋放出靶基因座中斷裂的DNA雙鏈。大范圍核酸酶被定義為是識別大序列(12至45bp)的特定序列的內(nèi)切核酸酶。它們可以在活細胞內(nèi)切割獨特的位點，從而在切割位點附近將基因靶向性提高1000倍以上(Puchtaet al.，Nucleic Acids Res.，1993，215034-5040；Rouet et al.，Mol.Cell.Biol.，1994，14，8096-8106；Choulika et al.，Mol.Cell.Biol.，1995，15，1968-1973；Puchta et al.，Proc.Natl.Acad.Sci.USA，1996，93，5055-5060；Sargent et al.，Mol.Cell.Biol.，1997，17，267-277；Donoho et al.，Mol.Cell.Biol，1998，18，4070-4078；Elliottetal.，Mol.Cell.Biol.，1998，18，93-101；Cohen-Tannoudji et al.，Mol.Cell.Biol.，1998，18，1444-1448)。最近，I-SceI被用于促進在老鼠肝細胞中的體內(nèi)靶向重組。研究發(fā)現(xiàn)，在高達1％的肝細胞中發(fā)生了重組(Gouble etal.，J.Gene Med.，2006，8，616-622)。
然而，該技術(shù)的應(yīng)用受限于天然大范圍核酸酶的指令系統(tǒng)。例如，在人類XP基因中的已知的天然大范圍核酸酶中沒有切割位點。因此，人們深入研究了具有裁剪專一性的大范圍核酸酶的制造，并且有幾個實驗室已經(jīng)試著去改變天然大范圍核酸酶的專一性，或試著去構(gòu)造人工內(nèi)切核酸酶。
最近，人們將具有IIS FokI內(nèi)切核酸酶型催化結(jié)構(gòu)域的Cys2-His2型鋅指蛋白質(zhì)(ZFP)的融合技術(shù)用于構(gòu)造功能性特定序列的人工內(nèi)切核酸酶(Smith et al.，Nucleic Acids Res.，1999，27674-681；Bibikova et al.，Science，2003，300764；Porteus M.H.and D.Baltimore，Science，2003，300763)。ZFP的結(jié)合專一性相對容易操縱，并且能夠結(jié)合許多(g/a)nn(g/a)nn(g/a)nn序列的新穎的人工ZFP的指令系統(tǒng)現(xiàn)在是可用的(Pabo et al.，Annu.Rev.Biochem.，2001，70，313-340；Segal，D.J.and C.F.Barbas，Curr.Opin.Biotechnol.，2001，12，632-637；Isalan et al.，Nat.Biotechnol.，2001，19，656-660)。該最新的策略最近允許人們將其用于體外改造IL2RG基因(Umov等，Nature，2005，435，646-651)。不過，對于基因組工程應(yīng)用，保留非常狹窄的專一性是主要論點之一，并且目前仍不清楚ZFP是否可以滿足治療應(yīng)用的非常嚴格的要求。
尋靶歸航內(nèi)切核酸酶(HEs)是分布較廣的天然大范圍核酸酶家族，其包括數(shù)百種蛋白質(zhì)(Chevalier，B.S.and B.L.Stoddard，Nucleic Acids Res.，2001，29，3757-3774)。這些蛋白質(zhì)通過稱為＂尋靶＂的工藝而增殖的可動遺傳因子編碼內(nèi)切核酸酶切割缺乏可動因子的同源等位基因，從而促進將可動DNA復(fù)制進入受體基因座的同源重組發(fā)生(Kostriken et al.，Cell；1983，35，167-174；Jacquier，A.and B.Dujon，Cell，1985，41，383-394)?？紤]到效力和專一性設(shè)定它們的固有功能和它們的特殊切割性能，那么HEs可以提供理想的支架以衍生用于基因組工程的新穎的內(nèi)切核酸酶。在過去的十年內(nèi)，人們已經(jīng)積累了許多資料來表征LAGLIDADG家族，該家族是四個HE家族中最大的家族(Chevalier和Stoddard，參見前述)。其中LAGLIDADG指的是全部家族實際上都保留有的僅有的序列，并且被發(fā)現(xiàn)在蛋白質(zhì)中是一個(往往更多)或者兩個拷貝。具有單一基元的蛋白質(zhì)比如I-CreI，可以形成同型二聚體并切割回文或假回文DNA序列，而較大的雙基元蛋白質(zhì)比如I-SceI是單體并且可以切割非回文標(biāo)靶。已經(jīng)結(jié)晶出七種不同的LAGLIDADG蛋白質(zhì)，并且它們顯示出非常顯著的核心結(jié)構(gòu)保持性，這與初級序列水平處相似性的缺乏形成對照(Jurica et al.，Mol.Cell.，1998，2，469-476；Chevalier et al.，Nat.Struct.Biol.，2001，8，312-316；Chevalier et al.，J.Mol.Biol.，2003，329，253-269；Moure etal.，J.Mol.Biol，2003，334，685-695；Moure et al.，Nat.Struct.Biol.，2002，9，764-770；Ichiyanagiet al.，J.Mol.Biol.，2000，300，889-901；Duan et al.，Cell，1997，89，555-564；Bolduc et al.，GenesDev.，2003，17，2875-2888；Silva et al.，J.Mol.Biol.，1999，286，1123-1136)。在該核心結(jié)構(gòu)中，兩個也稱為LAGLIDADG尋靶內(nèi)切核酸酶核心結(jié)構(gòu)域的特征αββαββα折疊彼此相對，并具有雙重對稱性，該特征αββαββα折疊由兩個單體構(gòu)成，或者由在雙重LAGLIDAG蛋白質(zhì)中的兩個結(jié)構(gòu)域構(gòu)成。DNA結(jié)合取決于四個來自各個結(jié)構(gòu)域的β鏈，該β鏈被折疊成反向平行的β-折疊，并且形成DNA螺旋大溝上的鞍(圖2)。對結(jié)合于其天然標(biāo)靶的I-CreI結(jié)構(gòu)的分析顯示，在各個單體中，有八個殘基(Y33，Q38，N30，K28，Q26，Q44，R68和R70)與七個堿基在位置±3、4、5、6、7、9和10處建立起直接的交互作用(Jurica等，1998，參見前述；圖3)。另外，一些殘基與幾個堿基建立起水介導(dǎo)的接觸；例如S40和N30與堿基對在位置+8和-8處相接觸(Chevalier等，2003，參見前述)。催化核心是中心部的核心，具有兩個對稱的單體/結(jié)構(gòu)域。除了該核心結(jié)構(gòu)之外，可以發(fā)現(xiàn)其他域例如，內(nèi)含肽PI-SceI具有蛋白質(zhì)剪接結(jié)構(gòu)域和附加的DNA結(jié)合結(jié)構(gòu)域(Moure等，2002，參見前述；Grindl等，NucleicAcidsRes.，1998，26，1857-1862)。
有兩個方法已被用于從尋靶內(nèi)切核酸酶中衍生出具有新的專一性的新穎的內(nèi)切核酸酶 -蛋白質(zhì)變體 Seligman和其同事使用推理的方法來取代I-CreI的αββαββα折疊中特定的個別殘基(Sussman等，J.Mol.Biol.，2004，342，31-41；Seligman等，Genetics，1997，147，1653-64)；研究發(fā)現(xiàn)，極少數(shù)I-CreI變體發(fā)生了實質(zhì)性切割(Y33C，Y33H，Y33R，Y33L，Y33S，Y33T，S32K，S32R)，并且僅在位置±10處經(jīng)修飾的標(biāo)靶中觀察到實質(zhì)性切割。
類似地，Gimble等修飾了PI-SceI的附加DNA結(jié)合結(jié)構(gòu)域(J.Mol.Biol.，2003，334，993-1008)；他們得到了結(jié)合專一性改變、但是專一性沒有改變的的蛋白質(zhì)變體，并且大多數(shù)變體仍保持大量對于野生型靶序列的親合力。
用于這些研究的半推理方法允許識別專一性改變的內(nèi)切核酸酶；然而，該方法不允許直接產(chǎn)生具有預(yù)期專一性的內(nèi)切核酸酶。
-雜交或嵌合的單鏈蛋白質(zhì) 通過替換不同單體的LAGLIDADG尋靶內(nèi)切核酸酶核心結(jié)構(gòu)域，可以得到新的大范圍核酸酶(Epinat et al.，Nucleic Acids Res.，2003，31，2952-62；Chevalier et al.，Mol.Cell.，2002，10，895-905；Steuer et al.，Chembiochem.，2004，5，206-13；PCT申請WO 03/078619和WO2004/031346)。這些單鏈嵌合的大范圍核酸酶能夠切割相當(dāng)于兩個半親代DNA靶序列的融合體的雜交標(biāo)靶，其中兩個來自不同的大范圍核酸酶的LAGLIDADG尋靶內(nèi)切核酸酶核心結(jié)構(gòu)域通過間隔區(qū)連接。
嵌合的單鏈人工HEs的構(gòu)造已經(jīng)被建議，一種組合方法可以被用于得到新穎的可切割新穎(非回文)靶序列的大范圍核酸酶將不同的單體或核心結(jié)構(gòu)域融合于單個蛋白質(zhì)中，從而獲得新穎的專一性。這些結(jié)果意味著I-CreI二聚體的兩個DNA結(jié)合結(jié)構(gòu)域可獨立地工作；各個DNA結(jié)合結(jié)構(gòu)域可結(jié)合DNA靶位點的不同的一半(圖2A)。最近，兩步策略被用于裁剪天然HEs比如I-CreI的專一性(Arnould等，J.Mol.Biol.，2006，355443-458)。第一步，對殘基Q44、R68和R70進行誘變處理，并且通過篩選來識別在位置±3至5(5NNN DNA標(biāo)靶)處專一性改變的變體庫。第二步，將兩個不同的變體結(jié)合并裝配在功能性異二聚體內(nèi)切核酸酸上，該異二聚體內(nèi)切核酸酶能夠切割由各個變體DNA靶序列的不同一半融合而得到的嵌合標(biāo)靶。
新穎的大范圍核酸酶庫的產(chǎn)生、以及通過裝配兩個不同的單體/核心結(jié)構(gòu)域來對新穎大范圍核酸酶進行組合的能力可以大大富集DNA序列的數(shù)目，這些DNA序列可以是標(biāo)靶(圖4A)，但仍不會使所有的潛在序列飽和。
為了得到大量的序列，能夠識別可以被組合的單獨的較小亞結(jié)構(gòu)域(圖2B)將極有價值。
然而，與在單體之間應(yīng)用組合方法相比，在單體或結(jié)構(gòu)域內(nèi)部應(yīng)用組合方法要難得多，因為結(jié)合界面的結(jié)構(gòu)非常緊密，并且這兩個不同的ββ發(fā)夾結(jié)構(gòu)不會組成單獨的亞結(jié)構(gòu)域，而是單個折疊的一部分，其中ββ發(fā)夾結(jié)構(gòu)是造成實質(zhì)上所有特定堿基的交互作用的原因。例如，在I-CreI的DNA結(jié)合區(qū)域的內(nèi)部一部分中，gtc三聯(lián)體通過一個來自第一發(fā)夾結(jié)構(gòu)(Q44)的殘基和兩個來自第二發(fā)夾結(jié)構(gòu)(R68和R70；文獻中圖1B(參見Chevalier等，2003，參見前述))殘基而被結(jié)合。
通過酵母高流通量篩選法協(xié)助的半推理設(shè)計，允許發(fā)明人識別并分離出數(shù)千個在位置28、30、33、38和40中的I-CreI變體，這些I-CreI變體在位置±8至10(10NNN DNA標(biāo)靶)中具有被改變的專一性。設(shè)計出這些新的蛋白質(zhì)，以便切割在I-CreI原始靶位點的核苷酸±10、±9、±8(10NNN DNA標(biāo)靶)處簡并的64個標(biāo)靶之一(圖3)。另外，盡管在結(jié)構(gòu)層面缺乏表觀調(diào)制性，I-CreI位點上結(jié)合于位置±8至10的殘基28～40和結(jié)合于位置±3～5的殘基44至77被顯示出形成了兩個可分離的功能性亞結(jié)構(gòu)域，其中該亞結(jié)構(gòu)域能結(jié)合I-CreI尋靶內(nèi)切核酸酶半位點的不同部分(圖3和圖4B)。通過在同一單體內(nèi)部組裝兩個來自不同單體或核心結(jié)構(gòu)域的亞結(jié)構(gòu)域，本發(fā)明人已經(jīng)構(gòu)造出功能性尋靶內(nèi)切核酸酶(同型二聚體)的變體，其能夠切割在各個親代單體/核心結(jié)構(gòu)域的位置±3～5和±8～10上具有核苷酸的回文嵌合標(biāo)靶(圖4B)。另外，一種較大的組合方法允許通過組裝四個不同的亞結(jié)構(gòu)域(圖4C頂部右側(cè)，中間左側(cè)和右側(cè)，底部左側(cè))來形成新的異二聚體分子，其能夠切割非回文嵌合標(biāo)靶(底部右側(cè))?？梢元毩⒌匦揎棽煌膩喗Y(jié)構(gòu)域，并且將其組合于一個能夠切割來自所研究基因的標(biāo)靶的大范圍核酸酶變體(異二聚體或單鏈分子)上。改造的變體可以用于經(jīng)由被雙鏈斷裂誘導(dǎo)的重組而進行基因修正(圖1B和1C)。
組合四個亞結(jié)構(gòu)域的容量會大大提高可以作為標(biāo)靶(圖4C)的DNA序列的數(shù)量。然而，仍然難以完全地評價使用該組合方法可以得到的序列的范圍。大多數(shù)難以捉摸的因素之一是，I-CreI靶位點的四個中心部核苷酸(在回文I-CreI位點C1221上的gtac，圖3)的影響。盡管堿基對±1和±2不會展示任何與蛋白質(zhì)的接觸，但研究表明這些位置是不缺少內(nèi)容信息的(Chevalier等，J.Mol.Biol.，2003，329，253-269)，尤其對于堿基對±1而言，并且可能是附加的底物專一性的來源(Argast et al.，J.Mol.Biol.，1998，280，345-353；Jurica etal.，Mol.Cell.，1998，2，469-476；Chevalier，B.S.and B.L.Stoddard，Nucleic Acids Res.，2001，29，3757-3774)。通過隨機誘變體外篩選可切割的I-CreI標(biāo)靶(Argast等，參見前述)，顯示出這四個堿基對在蛋白質(zhì)結(jié)合和切割活性上的重要性。已經(jīng)建議在活性部位發(fā)現(xiàn)的有序水分子網(wǎng)絡(luò)對于定位DNA標(biāo)靶而言是很重要的(Chevalier等，Biochemistry，2004，43，14015-14026)。另外，在I-CreI結(jié)合的區(qū)域內(nèi)出現(xiàn)的廣泛構(gòu)象變化建議，四個中心部核苷酸可能通過依賴序列的構(gòu)造偏愛而對基質(zhì)專一性做出貢獻(Chevalier等，2003，參見前述)。
因此，尚不清楚如果在10NNN和5NNN DNA標(biāo)靶上被識別為可切割具有這四個中心部核苷酸gtac的回文序列的同型二聚體的突變株，是否會允許設(shè)計出可以切割在四個中心部核苷酸上包含變化的標(biāo)靶的新的內(nèi)切核酸酶。
本發(fā)明人已經(jīng)識別出數(shù)百個能被I-CreI變體切割的XP基因中的DNA標(biāo)靶。圖4所述的組合策略被用于大范圍地重新設(shè)計I-CreI蛋白質(zhì)中的DNA結(jié)合結(jié)構(gòu)域，并且因此設(shè)計出專一性被完全改造的新穎的大范圍核酸酶，從而從XPC基因(Xa.1和Xc.1)中切割兩個DNA標(biāo)靶。通過包括在位置±1～2中的四個中心部核苷酸的17個核苷酸(Xa.1，圖3、9和23)、或者包括四個中心部核苷酸中兩個(位置-1和-2)的11個核苷酸(Xc.1，圖23)，這兩個DNA標(biāo)靶區(qū)別于I-CreI C1221 22 bp回文位點。
即使組合的變體最初被識別分別朝向核苷酸10NNN和5NNN，并且觀察到標(biāo)靶中的四個中心部核苷酸對于改造的大范圍核酸酶活性具有較強的影響，也可挑選出標(biāo)靶的其他堿基對的專一性變化極大的功能性大范圍核酸酶。另外，通過連續(xù)兩輪隨機突變和篩選，與I-CreI蛋白質(zhì)的活性相比，改造的蛋白質(zhì)的活性可能會有顯著提高。最后，當(dāng)新穎的內(nèi)切核酸酶保持非常狹窄的可切割同源標(biāo)靶數(shù)目時，在不犧牲專一性水平的前提下，可不進行DNA結(jié)合結(jié)構(gòu)域的廣泛再設(shè)計。
這些能夠切割來自XP基因的DNA靶序列的I-CreI變體可以用于修復(fù)與著色性干皮病有關(guān)的變異。其他潛在的應(yīng)用包括在XP基因的基因座處進行的基因組工程。

發(fā)明內(nèi)容
本發(fā)明涉及一種具有至少兩種置換的I-CreI變體，其中兩種置換分別位于被定位于I-CreI上位置26～40和44～77處的LAGLIDADG核心結(jié)構(gòu)域的兩個功能性亞結(jié)構(gòu)域中，該變體能夠切割來自著色性干皮病(XP)基因的DNA靶序列。
根據(jù)本發(fā)明的變體的切割活性可以通過任何眾所周知的體外或體內(nèi)切割分析方法進行測量，該分析方法比如是PCT申請WO 2004/067736或者文獻(Arnould等，J.Mol.Biol.，2006，355443-458)所述的方法。例如，本發(fā)明的變體的切割活性可以通過使用報告載體，在酵母或哺乳動物細胞中的同向重復(fù)序列重組試驗進行測量。該報告載體包含兩個截斷的、無功能的報告基因拷貝(同向重復(fù)序列)和在酵母或哺乳動物表達載體上克隆的在間插序列內(nèi)部的基因組DNA靶序列。變體的表達得到能夠切割該基因組DNA靶序列的功能性的內(nèi)切核酸酶。該切割誘導(dǎo)在同向重復(fù)序列之間的同源重組，得到其表達能通過適當(dāng)?shù)姆治鲞M行監(jiān)控的功能性的報告基因。
術(shù)語含義 -多肽序列上的氨基酸殘基在這里根據(jù)其一個字母的代碼予以標(biāo)明，其中，例如，Q是指Gln或谷氨酰胺殘基，R是指Arg或精氨酸殘基，并且D是指Asp或天冬氨酸殘基。
-核苷酸標(biāo)示如下一個字母的代碼用于標(biāo)明核苷堿基a是腺嘌呤，t是胸腺嘧啶，c是胞嘧啶，并且g是鳥嘌呤。對于簡并核苷酸，r代表g或a(嘌呤核苷酸)，k代表g或t，s代表g或c，w代表a或t，m代表a或c，y代表t或c(嘧啶核苷酸)，d代表g、a或t，v代表g、a或c，b代表g、t或c，h代表a、t或c，并且n代表g、a、t或c。
-“I-CreI”是指具有序列SWISSPROT P05725序列的野生型I-CreI，對應(yīng)于序列表中的SEQ ID NO217，或者pdb入藏登記代碼1g9y。
-“I-CreI變體”或者“變體”是指通過用不同氨基酸置換I-CreI的至少一個氨基酸而得到的蛋白質(zhì)。
-“功能性I-CreI變體”是指能夠切割DNA標(biāo)靶、優(yōu)選能夠切割不能被I-CreI切割的DNA標(biāo)靶的I-CreI變體。例如，這樣的變體在某些位置處發(fā)生氨基酸變化，在所述位置處，變體接觸DNA靶序列或者與所述DNA標(biāo)靶直接或間接地互相作用。
-“具有新穎專一性的I-CreI變體”是指具有不同于親代大范圍核酸酶的切割標(biāo)靶模式的變體。術(shù)語“新穎的專一性”、“改造的專一性”、“新穎的切割專一性”、“新穎的底物專一性”都是同意義的和無關(guān)緊要地使用的，指的是變體針對DNA靶序列的核苷酸的專一性。
-“I-CreI位點”是指可被I-CreI切割的22～24bp的雙鏈DNA序列。I-CreI位點包括野生型(天然的)非回文I-CreI尋靶位點；和派生的回文序列比如序列5’-t-12c-11a-10a-9a-8a-7c-6g-5t-4c-3g-2t-1a+1c+2g+3a+4c+5g+6t+7t+8t+9t+10g+11a+12(SEQ ID NO25)，也稱為C1221(圖3和圖9)。
-“結(jié)構(gòu)域”或“核心結(jié)構(gòu)域”是指“LAGLIDADG尋靶內(nèi)切核酸酶核心結(jié)構(gòu)域”，其為LAGLIDADG家族的尋靶內(nèi)切核酸酶的特征α1β1β2α2β3β4α3折疊，相當(dāng)于大約一百個氨基酸殘基的序列。所述結(jié)構(gòu)域包含在反向平行的β折疊中的四個β鏈(β1，β2，β3，β4)折疊，該β折疊與DNA標(biāo)靶的一半互相作用。該結(jié)構(gòu)域能夠與另一個與DNA標(biāo)靶的另一半互相作用的LAGLIDADG尋靶內(nèi)切核酸酶核心結(jié)構(gòu)域相聯(lián)系，從而形成能夠切割所述DNA標(biāo)靶的功能性內(nèi)切核酸酶。例如，就二聚體尋靶內(nèi)切核酸酶I-CreI(163個氨基酸)而言，LAGLIDADG尋靶內(nèi)切核酸酶核心結(jié)構(gòu)域?qū)?yīng)于第6～94位殘基。
-“亞結(jié)構(gòu)域”是指LAGLIDADG尋靶內(nèi)切核酸酶核心結(jié)構(gòu)域的區(qū)域，其與尋靶內(nèi)切核酸酶DNA標(biāo)靶半位點的特定部分互相作用。兩個不同的亞結(jié)構(gòu)域獨立地工作，并且在一個亞結(jié)構(gòu)域的變異不會改變另一亞結(jié)構(gòu)域的結(jié)合性和切割性能。因此，兩個亞結(jié)構(gòu)域可以結(jié)合尋靶內(nèi)切核酸酶DNA標(biāo)靶半位點的不同部分。
-“β-發(fā)夾(結(jié)構(gòu))”是指LAGLIDADG尋靶內(nèi)切核酸酶核心結(jié)構(gòu)域上反向平行β折疊的兩個連續(xù)的β-鏈(β1β2或β3β4)，它們通過環(huán)或轉(zhuǎn)角相連接。
-“單鏈大范圍核酸酶”、“單鏈嵌合大范圍核酸酶”、“單鏈大范圍核酸酶衍生物”、“單鏈嵌合大范圍核酸酶衍生物”或“單鏈衍生物”是指一種大范圍核酸酶，其包含通過肽間隔區(qū)連接的兩個LAGLIDADG尋靶內(nèi)切核酸酶結(jié)構(gòu)域或核心結(jié)構(gòu)域。該單鏈大范圍核酸酶能夠切割包含一個各親代大范圍核酸酶靶序列上不同一半的嵌合DNA靶序列。
-“DNA標(biāo)靶”、“DNA靶序列”、“靶序列”、“靶位點”、“靶”、“位點”；“所研究的位點”；“識別位點”、“識別序列”、“尋靶識別位點”、“尋靶位點”、“切割位點”是指可以被LAGLIDADG尋靶內(nèi)切核酸酶識別和切割的20～24bp的雙鏈回文、部分回文(假回文)或非回文多核苷酸序列。這些術(shù)語指的是不同的DNA特定區(qū)域，優(yōu)選是一種基因組位置，在該位置處，雙鏈斷裂(切割)將被內(nèi)切核酸酶誘導(dǎo)。該DNA標(biāo)靶被定義為雙鏈多核苷酸的一條鏈的5′至3′序列，如同上述的C1221。對正義鏈和反義鏈而言，DNA標(biāo)靶的切割分別發(fā)生在位置+2和-2的核苷酸處。除非另有聲明，I-CreI大范圍核酸酶變體切割DNA標(biāo)靶的位置，對應(yīng)于在DNA標(biāo)靶正義鏈上的切割位點。
-“DNA標(biāo)靶半位點″、“半切割位點”、或者“半位點″是指DNA標(biāo)靶上被各個LAGLIDADG尋靶內(nèi)切核酸酶核心結(jié)構(gòu)域結(jié)合的部分。
-“嵌合DNA標(biāo)靶”或“雜交DNA標(biāo)靶”是指兩個親代大范圍核酸酶靶序列上不同的一半的融合體。另外，所述標(biāo)靶的至少一個一半可以包含被至少兩個分離的亞結(jié)構(gòu)域結(jié)合的核苷酸的組合(組合DNA標(biāo)靶)。
-“XP基因”是指哺乳動物著色性干皮病的一個互補群(XP-A、XP-B、XP-C、XP-D、XP-E、XP-F)的基因。例如，人類XP基因可在NCBI數(shù)據(jù)庫中查到，標(biāo)明有下述登記號碼XPAGeneID7507，ACCESSION NC_000009，REGIONcomplemenl(97516747..97539194)；XPBGeneID2071，ACCESSION NC_000002，REGIONcomplement(127731096..127767982)；XPCGeneID7508，ACCESSION NC_000003，REGIONcomplement(14161651..14195087)；XPDGeneID2068，ACCESSIONNC_000019，REGIONcomplement(50546686..50565669)；XPEGeneID1642，ACCESSION NC_000011，REGIONcomplement(60823502..60857125)；XPFGeneID2072，ACCESSION NC_000016，REGION13921524..13949705；XPGGeneID2073，ACCES SION NC_000013，REGION102296421..102326346。
-“來自XP基因的DNA靶序列”、“基因組DNA標(biāo)靶序列”、“基因組DNA切割位點”、“基因組DNA標(biāo)靶”或“基因組標(biāo)靶”是指哺乳動物XP基因上的20～24bp的序列，其可以被大范圍核酸酶變體或單鏈嵌合大范圍核酸酶衍生物識別和切割。
-“載體”是指能夠通過連接而轉(zhuǎn)運另一個核酸的核酸分子。
-“同源”是指一個序列與另一個序列具有足夠的一致性，從而導(dǎo)致在這兩個序列之間的同源重組，尤其是指具有至少95％的一致性，優(yōu)選97％的一致性，更優(yōu)選99％的一致性。
-“一致性”指的是在兩個核酸分子或多肽之間的序列一致性。一致性能通過比較各個序列上的位置而確定，為了比較起見可以對所述序列進行排列。當(dāng)比較序列上的位置被相同的堿基占據(jù)時，那么這些分子在該位置處是一致的。核酸或氨基酸序列之間的相似度或一致性是在核酸序列共用位置處相同核苷酸或者配對核苷酸的數(shù)量的函數(shù)?？梢允褂枚喾N調(diào)準(zhǔn)算法和/或程序來計算兩個序列之間的一致性，包括可作為GCG序列分析程序包的一部分而利用的FASTA或BLAST(威斯康星大學(xué)，Madison，威斯康星州)，并且可以與例如默認設(shè)置一起使用。
-“個體”包括哺乳動物、以及其他脊椎動物(例如，鳥、魚和爬行動物)。在此使用的術(shù)語“哺乳類動物”和“哺乳動物”，指的是任何脊椎動物，包括對其幼仔哺乳并且產(chǎn)仔(真哺乳亞綱或有胎盤哺乳類)或者產(chǎn)卵(后哺乳亞綱或者沒有胎盤的哺乳動物)的單穴類動物、有袋動物和有胎盤哺乳動物。哺乳動物的例子包括人類及其他靈長類動物(例如，猴子、黑猩猩)，嚙齒動物(例如，大鼠，小鼠，豚鼠)，和反芻動物(例如，牛，豬，馬)。
-“突變(變異)”是指在多核苷酸(cDNA、基因)或多肽序列中一個以上核苷酸/氨基酸的取代、缺失、添加。所述突變可以影響基因或其調(diào)控序列的編碼序列。也可以影響基因組序列的結(jié)構(gòu)或被編碼的mRNA的結(jié)構(gòu)/穩(wěn)定性。
根據(jù)本發(fā)明，突變的位置通過參考I-CreI氨基酸序列SEQ ID NO217而顯示出來。
在所述變體的優(yōu)選實施方式中，位于I-CreI的位置44～77的亞結(jié)構(gòu)域中的所述置換是在位置44、68、70、75和/或77處。
在所述變體的另一個優(yōu)選實施方式中，位于I-CreI的位置26～40處的亞結(jié)構(gòu)域中的所述置換是在位置28、30、32、33、38和/或40處。
在所述變體的另一個優(yōu)選實施方式中，位于I-CreI的位置28～40和44～70處的亞結(jié)構(gòu)域中的所述置換優(yōu)選在位置28、30、32、33、38、44、68和/或70處。
在所述變體的另一個優(yōu)選實施方式中，所述變體包含在位置75處的天冬氨酸被中性氨基酸的置換，該中性氨基酸優(yōu)選是天門冬酰胺(D75N)或纈氨酸(D75V)。
在所述變體的另一個優(yōu)選實施方式中，所述變體在添加位置處包含一個以上置換，該添加位置接觸DNA靶序列或者與所述DNA標(biāo)靶直接或間接地互相作用。該I-CreI的反應(yīng)性殘基在本技術(shù)領(lǐng)域是眾所周知的。發(fā)生突變的殘基可以直接地或者經(jīng)由水分子與DNA骨架或核苷酸堿基互相作用。
在所述變體的另一個優(yōu)選實施方式中，所述變體包含一個以上添加型突變，該突變可以提高變體對于XP基因的DNA靶序列的結(jié)合和/或切割性能。發(fā)生突變的該添加的殘基可以位于整個I-CreI序列上。這些突變可以是在位置19、24、42、69、80、85、87、87、109、133和161處的置換。這些突變可以影響活性部位(位置19)、蛋白質(zhì)-DNA界面(例如，位置69)、疏水核心(例如，位置85、87或109)或者C末端部分(例如，位置161)。
在所述變體又一個優(yōu)選的實施方式中，所述置換是初始氨基酸用選自下組的氨基酸取代A、D、E、G、H、K、N、P、Q、R、S、T、Y、C、W、L和V。
根據(jù)本發(fā)明的變體可以是同型二聚體，其能夠切割回文或假回文DNA靶序列。作為另一種選擇，所述變體是異二聚體，其由第一和第二單體相聯(lián)接而得到，所述單體在I-CreI的位置26～40和44～77處、優(yōu)選在位置28～40和44～70處具有不同的突變，所述異二聚體能夠切割來自XP基因的非回文DNA靶序列。
被所述變體切割的DNA靶序列可以是在XP基因的外顯子或內(nèi)含子上。優(yōu)選位于突變附近，優(yōu)選在500bp的突變點內(nèi)部；或者位于突變的上游，優(yōu)選在所述XP基因的所有突變點上游。
在所述變體的另一個優(yōu)選實施方式中，所述DNA靶序列來自人類XP基因(XPA～XPG基因)。
來自各個人類XP基因的DNA標(biāo)靶顯示在表IX～XV和圖16～22中。
例如，該序列SEQ ID NO1～24是來自XPC基因的DNA標(biāo)靶；SEQ ID NO1～23位于或者接近外顯子之一，并且這些序列覆蓋了XP基因的所有外顯子(表XI和圖18)。靶序列SEQ ID NO24(Xa.1)位于第三內(nèi)含子內(nèi)，突變點上游(圖1A)。靶序列SEQ ID NO12(Xc.1)位于外顯子9內(nèi)，在缺失位點1132AA和插入位點insVAL580(圖1A)附近。
可切割各個DNA標(biāo)靶的異二聚體變體顯示在表I～VIII和圖16～22中。
各個變體的序列被指示位置處的其氨基酸殘基所限定。例如，表I中的第一異二聚體變體由第一單體和第二單體組成，其中，第一單體分別在位置28、33、38、40、44、68、70和75處具有K、S、R、D、K、R、G和N，而第二單體分別在位置28、30、38、44、68、70、75和77處具有R、D、R、K、A、S、N和I。指示位置可參考I-CreI序列SWISSPROT P05725，SEQ ID NO217或者pdb入藏登記代碼1g9y；I-CreI分別在位置19、24、26、28、30、32、33、38、40、42、44、68、69、70、75、77、80、85、87、109、133和161處具有G、I、Q、K、N、S、Y、Q、S、A、Q、R、D、R、D、I、E、H、F、I、A和S。該變體可以由顯示在表中的具有氨基酸殘基的I-CreI序列組成。該情況下，未顯示的位置未發(fā)生突變，因此對應(yīng)于野生型I-CreI序列。作為另一種選擇，該變體可以包含顯示在表中的具有氨基酸殘基的I-CreI序列。在后一種情形中，未被顯示的位置可以包含如上所述的突變，或者可以不發(fā)生突變。例如，該變體可以是來源于被SEQ ID NO26編碼的I-CreI支架蛋白質(zhì)(SEQ ID NO218)，所述I-CreI支架蛋白質(zhì)在位置2處具有丙氨酸插入、在C端具有A42T、D75N、W110E和R111Q置換以及三個添加的氨基酸(A，A和D)。另外，來源于野生型I-CreI或I-CreI支架蛋白質(zhì)的所述變體，可以包含如上所述的添加型突變。
被各個異二聚體變體切割的標(biāo)靶顯示在表的最后一欄中。
表I在XPA基因的一個外顯子中或者在接近XPA基因的一個外顯子處具有DNA靶位點的異二聚體I-CreI變體的序列表II在XPB基因的一個外顯子中或者在接近XPB基因的一個外顯子處具有DNA靶位點的異二聚體I-CreI變體的序列表III在XPC基因的一個外顯子中或者在接近XPC基因的一個外顯子處具有DNA靶位點的異二聚體I-CreI變體的序列表IV在XPD基因的一個外顯子中或者在接近XPD基因的一個外顯子處具有DNA靶位點的異二聚體I-CreI變體的序列表V在XPE基因的一個外顯子中或者在接近XPE基因的一個外顯子處具有DNA靶位點的異二聚體I-CreI變體的序列表VI在XPF基因的一個外顯子中或者在接近XPF基因的一個外顯子處具有DNA靶位點的異二聚體I-CreI變體的序列表VII在XPG基因的一個外顯子中或者在接近XPG基因的一個外顯子處具有DNA靶位點的異二聚體I-CreI變體的序列表VIII具有位于XPC基因的第三內(nèi)含子中的DNA靶位點(SEQ ID NO24)的異二聚體I-CreI變體的序列
另外，本發(fā)明的變體可以包括在該序列的NH2基末端和/或COOH基末端插入的一個以上殘基。例如，將tag(表位或聚組氨酸序列)導(dǎo)入NH2基末端和/或COOH基末端；所述tag可用于所述變體的檢測和/或純化。
本發(fā)明的目的還在于提供一種來源于如上所述的I-CreI變體的單鏈嵌合大范圍核酸酶。該單鏈嵌合大范圍核酸酶是一種融合蛋白，包含兩個I-CreI單體、兩個I-CreI核心結(jié)構(gòu)域(I-CreI的位置6～94)、或兩者的組合。優(yōu)選兩個單體/核心結(jié)構(gòu)域或兩者的組合通過肽連接體連接。
本發(fā)明的目的還在于提供一種編碼如上所述的變體或單鏈嵌合大范圍核酸酶的多核苷酸片段；所述多核苷酸可以編碼同型二聚體或異二聚體變體的一個單體、或者編碼單鏈嵌合大范圍核酸酶的兩個結(jié)構(gòu)域/單體。
本發(fā)明的目的還在于提供一種重組載體，用于表達根據(jù)本發(fā)明的變體或單鏈大范圍核酸酶。該重組載體包含至少一個編碼如上所述的變體或單鏈大范圍核酸酶的多核苷酸片段。在一種優(yōu)選實施方式中，所述載體包含兩個不同的多核苷酸片段，各自編碼異二聚體變體的單體之一。
可以用于本發(fā)明的載體包括但不限于，病毒載體、質(zhì)粒、可以由染色體DNA、非染色體DNA、半合成或合成DNA組成的RNA載體、或者線性或環(huán)狀DNA或RNA分子。優(yōu)選載體是那些能自主復(fù)制的載體(附加型載體)和/或能表達連接于其上的核苷酸的載體(表達載體)。許多合適的載體已為本領(lǐng)域的技術(shù)人員所熟知并且可在市場上買到。
病毒載體包括反向病毒、腺病毒、細小病毒(例如腺病毒相關(guān)病毒)、冠狀病毒、負鏈核糖核酸(RNA)病毒比如正黏病毒(例如，流感病毒)、彈狀病毒(例如，狂犬病和泡狀口腔炎病毒)、副黏病毒(例如，囊蟲副黏病毒和仙臺副黏病毒)、正鏈核糖核酸病毒比如小核糖核酸病毒和甲病毒；以及雙鏈DNA病毒，包括腺病毒、皰疹病毒(例如，單純皰疹病毒1和2型、埃-巴二氏病毒、細胞巨化病毒)、以及痘病毒(例如，牛痘、傳染性上皮瘤和金絲雀痘)。其他病毒例如包括諾沃克病毒、外衣病毒、黃病毒、呼腸孤病毒、乳多空病毒、嗜肝DNA病毒、和肝炎病毒。反向病毒的例子包括雞白血病肉瘤、哺乳動物病毒C型、B型、D型、HTLV-BLV群、慢病毒、泡沫病毒(Coffin，J.M.，RetroviridaeThe viruses and theirreplication，In Fundamental Virology，Third Edition，B.N.Fields，et al.，Eds.，Lippincott-RavenPublishers，Philadelphia，1996)。
載體可以包含選擇性標(biāo)記，例如用于真核細胞培養(yǎng)的新霉素磷酸轉(zhuǎn)移酶、組氨醇脫氫酶、二氫葉酸還原酶、潮霉素磷酸轉(zhuǎn)移酶、單純皰疹病毒胸苷激酶、腺苷脫氨酶、谷氨酰胺合成酶、以及次黃嘌呤-鳥嘌呤轉(zhuǎn)磷酸核糖基酶；用于釀酒酵母S.cerevisiae的TRP1；四環(huán)素、利福平或者大腸桿菌E.coli抗性的氨芐青霉素。
優(yōu)選所述載體是表達載體，其中編碼本發(fā)明的變體/單鏈大范圍核酸酶的序列被置于適當(dāng)?shù)霓D(zhuǎn)錄和翻譯控制元件的控制之下，從而允許生產(chǎn)或合成所述變體。因此、所述多核苷酸包含在表達盒中。更具體地說，該載體包含復(fù)制源、有效地連接于所述編碼多核苷酸的啟動子、核糖體結(jié)合位點、RNA剪接位點(當(dāng)使用基因組DNA時)、聚腺苷酸化位點和轉(zhuǎn)錄末端位點。還可以包含增強子。啟動子的選擇將取決于在其中表達多肽的細胞。優(yōu)選當(dāng)所述變體是異二聚體時，編碼每一個單體的兩個多核苷酸被包含于一個載體中，該載體能夠同時驅(qū)動兩種多核苷酸的表達。合適的啟動子包括組織特異性啟動子和/或誘導(dǎo)性啟動子。誘導(dǎo)性啟動子的例子有通過提高重金屬水平而誘導(dǎo)的真核金屬硫蛋白啟動子、響應(yīng)異丙基-β-D-硫代半乳糖苷(IPTG)的原核lacZ啟動子、以及通過提高溫度誘導(dǎo)的真核熱激發(fā)啟動子。組織特異性啟動子的例子有骨骼肌肌酸激酶基因、前列腺特異的抗原基因(PSA)、α-抗胰蛋白酶基因、人表面活性劑(SP)A和B蛋白基因、β-酪蛋白基因以及酸性乳清蛋白基因。
根據(jù)所述載體的另一個優(yōu)選實施方式，所述載體包括靶向構(gòu)造，該構(gòu)造包含與如上所述的基因組DNA標(biāo)靶切割位點周圍區(qū)域共享同源性的序列。
可選地，用于編碼I-CreI變體的載體和包含該靶向構(gòu)造的載體是不同的載體。
在兩種情況下，該靶向構(gòu)造包含將被導(dǎo)入的序列，所述序列側(cè)翼為與如下所述變體的基因組DNA切割位點周圍區(qū)域共享同源性的序列。
更優(yōu)選所述靶向DNA構(gòu)造包含 a)與如上所述的基因組DNA切割位點周圍區(qū)域共享同源性的序列，以及 b)將被導(dǎo)入的序列，其側(cè)翼為a)中所述的序列。
優(yōu)選使用至少50bp、優(yōu)選超過100bp、更優(yōu)選超過200bp的同源序列。實際上，共享的同源性DNA位于作為斷裂位點上游和下游側(cè)翼的區(qū)域，并且待導(dǎo)入的DNA序列應(yīng)位于兩個臂之間。為基因組療法目的，待導(dǎo)入的序列優(yōu)選是一種修復(fù)所研究基因中的突變(基因修正或者功能基因恢復(fù))的序列。作為另一種選擇，其可以是任何其他的用于以一些特定方式改變?nèi)旧wDNA的序列，包括用于修飾特定序列的序列、用于削弱或者激活所研究的內(nèi)源性基因的序列、用于鈍化或者刪除所研究的內(nèi)源性基因或其部分的序列、用于將突變導(dǎo)入所研究位點的序列、或者用于導(dǎo)入外源基因或其部分的序列。這樣的染色體DNA變化被用于基因組改造(動物模型)。
為了修正XP基因，該基因的切割發(fā)生在突變點附近，優(yōu)選在500bp的突變點內(nèi)部(圖1B)。該靶向構(gòu)造包含具有作為靶位點(最小修復(fù)基體)側(cè)翼的至少200bp的同源序列、用于修復(fù)切割的XP基因片段，并且包括用于修復(fù)突變點的XP基因修正序列(圖1B)。因此，用于基因修正的靶向構(gòu)造包含或者由最小修復(fù)基體組成；優(yōu)選是200pb至6000pb、更優(yōu)選1000pb至2000pb。
例如，被每一變體(表I～VIII)切割的標(biāo)靶和用于用各個變體修復(fù)該切割的最小基體如表IX～XV和圖16～22所示。
表IX被I-CreI變體切割的XPA基因標(biāo)靶
表X被I-CreI變體切割的XPB基因標(biāo)靶
表XI被I-CreI變體切割的XPC基因標(biāo)靶
表XII被I-CreI變體切割的XPD基因標(biāo)靶
表XIII被I-CreI變體切割的XPE基因標(biāo)靶
表XIV被I-CreI變體切割的XPF基因標(biāo)靶
表XV被I-CreI變體切割的XPG基因標(biāo)靶
例如，為了修正如圖1A所示的在著色性干皮病(XP)中發(fā)現(xiàn)的XPC基因上的一些突變，可以使用下述變體/靶向構(gòu)造的組合 -ARG579TER(外顯子4；未成熟的終止密碼子) *變體28Q，33S，38R，40K，44Q，68Y，70S，75N，77Y(第一單體)/28T，33T，38Q，40R，44T，68E，70S，75R，77R(第二單體)、和靶向構(gòu)造，其包含XPC基因的至少第9887～10086位，用于有效修復(fù)DNA雙鏈斷裂、和在大范圍核酸酶切割位點和該突變位點之間的所有序列，用于有效修復(fù)突變。
*變體30D，33R，38T，44N，68R，70S，75Q，77R(第一單體)/28R，33A，38Y，40Q，44D，68Y，70S，75S，77R(第二單體)和靶向構(gòu)造，其包含XPC基因的至少第10173～10372位，用于有效修復(fù)DNA雙鏈斷裂、和在大范圍核酸酶切割位點和突變位點之間的所有序列，用于有效修復(fù)突變。
-外顯子6置換PRO218HIS *變體28K，33N，38Q，40Q，44R，68Y，70S，75E，77I(第一單體)/28K，33T，38A，40Q，44K，68Q，70S，75N，77R(第二單體)，和靶向構(gòu)造，其包含XPC基因的至少第13051～13250位，用于有效修復(fù)DNA雙鏈斷裂、和在大范圍核酸酶切割位點和突變位點之間的所有序列，用于有效修復(fù)突變。
-外顯子9缺失DEL1132AA或插入insVAL580 *變體28K，30N，38Q，44Q，68R，70S，75R，77T，80K(第一單體)/28T，33T，38Q，40R，44T，68Y，70S，75R，77V(第二單體)和靶向構(gòu)造，其包含XPC基因的至少第19580～19779位，用于有效修復(fù)DNA雙鏈斷裂、和在大范圍核酸酶切割位點和突變位點之間的所有序列，用于有效修復(fù)突變。
*變體28K，30N，38Q，44A，68Y，70S，75Y，77K(第一單體)/28K，33R，38E，40R，44T，68R，70S，75Y，77T，133V(第二單體)和靶向構(gòu)造，其包含XPC基因的至少第20303～20502位，用于有效修復(fù)DNA雙鏈斷裂、和在大范圍核酸酶切割位點和突變位點之間的所有序列，用于有效修復(fù)突變。
*變體28K，33R，38Q，40A，44Q，68R，70N，75N(第一單體)/28K，33R，38A，40Q，44Q，68R，70S，75N，77K(第二單體)、或者33H，75N(第一單體)和33R，38A，40Q，44K，70N，75N(第二單體)、和靶向構(gòu)造，其包含XPC基因的至少第20349～20548位，用于有效修復(fù)DNA雙鏈斷裂、和在大范圍核酸酶切割位點和突變位點之間的所有序列，用于有效修復(fù)突變。
*變體30N，33H，38Q，44K，68A，70S，75N，77I(第一單體)/28K，33N，38Q，40Q，44R，68Y，70S，75E，77V(第二單體)、和靶向構(gòu)造，其包含XPC基因的至少第20389～20588位，用于有效修復(fù)DNA雙鏈斷裂、和在大范圍核酸酶切割位點和突變位點之間的所有序列，用于有效修復(fù)突變。
-外顯子14置換LYS822GLN *變體28Q，33S，38R，40K，42T，44K，70S，75N，77Y(第一單體)/28R，33A，38Y，40Q，44A，68R，70S，75E，77R(第二單體)、和靶向構(gòu)造，其包含XPC基因的至少第30416～30615位，用于有效修復(fù)DNA雙鏈斷裂、和在大范圍核酸酶切割位點和突變位點之間的所有序列，用于有效修復(fù)突變。
可選地，為了修復(fù)功能基因(圖1C)，基因的切割發(fā)生在突變點上游，例如在位置9119處(標(biāo)靶SEQ ID NO24)。優(yōu)選所述突變點是在基因序列中的第一個已知突變點，以使得該基因的所有下游突變點可以同時地被修正。該靶向構(gòu)造包含融合在構(gòu)架內(nèi)(例如在cDNA內(nèi))的切割位點下游的外顯子，并且具有聚腺苷酸化位點以終止在3′端的轉(zhuǎn)錄。切割位點周圍的內(nèi)含子或外顯子序列形成該待導(dǎo)入的序列(外顯子敲入構(gòu)造)的側(cè)翼，因此允許將改造的基因(外顯子敲入基因)轉(zhuǎn)錄入能用于編碼功能蛋白的mRNA(圖1C)。例如，當(dāng)切割發(fā)生在來自如上所述的最小修復(fù)基體的外顯子時，切割位點上游和下游的序列形成該外顯子敲入構(gòu)造的側(cè)翼。
本發(fā)明的目的還在于提供一種組合物，其特征在于該組合物包含至少一個變體、一個單鏈嵌合內(nèi)切核酸酶和/或至少一個如上所述的編碼所述變體/單鏈分子的表達載體。
在所述組合物的優(yōu)選實施方式中，所述組合物包含靶向DNA構(gòu)造，該靶向DNA構(gòu)造包括可修復(fù)XP基因上的突變、并且用如上所述的與所述變體的基因組DNA切割位點共享同源性的序列作為其側(cè)翼的序列。該可修復(fù)突變的序列是具有修正序列的基因片段，或是如上所述的外顯子敲入構(gòu)造。
優(yōu)選所述靶向DNA構(gòu)造被包含于重組載體內(nèi)，或者被包含于表達載體中，所述表達載體包含編碼根據(jù)本發(fā)明的變體/單鏈嵌合內(nèi)切核酸酶的多核苷酸。
在可以使用兩種載體的情況下，本發(fā)明的目的還在于提供產(chǎn)物，該產(chǎn)物包含如上所述的I-CreI變體或單鏈嵌合大范圍核酸酶表達載體和一種包括如上所述靶向構(gòu)造的載體，所述產(chǎn)物作為組合制劑而同時地、單獨地或者連續(xù)地使用于著色性干皮病。
本發(fā)明的目的還在于提供如上所述的至少一種大范圍核酸酶變體/單鏈嵌合大范圍核酸酶和/或一種表達載體的應(yīng)用，用于制備用于預(yù)防、改善或者治愈罹患著色性干皮病的個體所需的藥物，可以以任何方法將所述藥物給藥于所述個體。
在該情況下，大范圍核酸酶(變體/單鏈衍生物)的應(yīng)用至少包括下述步驟(a)在個體的體細胞組織內(nèi)，通過用所述切割位點接觸所述大范圍核酸酶，在所研究位點處誘導(dǎo)雙鏈切割，其中所研究位點包含所述大范圍核酸酶的至少一個識別切割位點；以及(b)將標(biāo)靶DNA導(dǎo)入該個體，其中所述標(biāo)靶DNA包含(1)與切割位點周圍區(qū)域共享同源性的DNA和(2)在標(biāo)靶DNA和染色體DNA之間剛一重組就可修復(fù)所研究位點的DNA。在適合于將該標(biāo)靶DNA導(dǎo)入所研究位點的情況下，將該標(biāo)靶DNA導(dǎo)入個體體內(nèi)。
根據(jù)本發(fā)明，全部通過將所述大范圍核酸酶給藥于個體、或者通過將所述大范圍核酸酶體外導(dǎo)入從個體身上取出并且在修飾后再送回該個體體內(nèi)的體細胞(皮膚細胞)，來誘導(dǎo)所述雙鏈切割。
本發(fā)明的目的還在于提供一種方法，用于預(yù)防、改善或治愈需要該方法的個體所罹患的著色性干皮病，所述方法至少包括通過任何方法將如上所述組合物給藥于所述個體的步驟。
該大范圍核酸酶(變體/單鏈衍生物)可以用作多肽或者用作編碼所述多肽的多核苷酸構(gòu)造。可以通過本領(lǐng)域技術(shù)人員所熟知的任何方便的手段，將大范圍核酸酶導(dǎo)入個體的體細胞，所述手段適于特別的細胞類型。大范圍核酸酶可以單獨導(dǎo)入，也可以與至少適當(dāng)?shù)拿浇槲锘蜉d體和/或相結(jié)合和/或與標(biāo)靶DNA相結(jié)合。
根據(jù)本發(fā)明的應(yīng)用的優(yōu)選實施方式，該大范圍核酸酶(多肽)與下述物質(zhì)相聯(lián)接 -脂質(zhì)體、聚乙烯亞胺(PEI)；在這種情況下，給藥所述聯(lián)接物并且將其導(dǎo)入靶體細胞。
-細胞膜轉(zhuǎn)位肽(Bonetta，2002，The Scientist，16，38；Ford et al.，Gene Ther，2001，8，1-4；Wadia & Dowdy，2002，Curr Opin Biotechnol，13，52-56)；在這種情況下，該變體/單鏈衍生物的序列與細胞膜轉(zhuǎn)位肽的序列相融合(融合蛋白)。
根據(jù)本發(fā)明的應(yīng)用的另一個優(yōu)選實施方式，將該大范圍核酸酶(編碼所述大范圍核酸酶的多核苷酸)和/或標(biāo)靶DNA插入載體。可以通過多種方法(例如，注射、直接攝取、發(fā)射體轟擊、脂質(zhì)體)，將包含標(biāo)靶DNA和/或編碼大范圍核酸酶的核酸的載體導(dǎo)入細胞。大范圍核酸酶可以是穩(wěn)定地或者瞬時地表達進入使用表達載體的細胞。在真核細胞內(nèi)的表達技術(shù)為本領(lǐng)域技術(shù)人員所熟知(參見人類遺傳學(xué)當(dāng)前的方案第12章“用于基因治療的載體”和第13章“用于基因治療的釋放體系”)。任選地，可以優(yōu)選將核內(nèi)定位信號合并入重組蛋白中，以用于確定該重組蛋白在細胞核內(nèi)被表達。
一旦在細胞內(nèi)存在大范圍核酸酶，就通過該細胞將包含標(biāo)靶DNA和/或編碼大范圍核酸酶的核酸的載體從細胞質(zhì)輸入或者轉(zhuǎn)位到該細胞核內(nèi)的作用位點。
為了治療目的，以治療有效量給藥該大范圍核酸酶和藥學(xué)可接受的賦形劑。如果給藥量是生理學(xué)顯著的，那么這樣的組合就以“治療有效量”給藥。如果藥劑的存在導(dǎo)致可檢測到受體在生理學(xué)方面的變化，那么藥劑是生理學(xué)顯著的。在本文中，如果藥劑的存在導(dǎo)致靶疾病一個以上癥狀的嚴重程度下降，并且導(dǎo)致該病變或異變的基因組修正，那么該藥劑是生理學(xué)顯著的。
在根據(jù)本發(fā)明的應(yīng)用的一種實施方式中，該大范圍核酸酶基本上是非免疫原性的，即，很少或者不產(chǎn)生有害的免疫應(yīng)答。根據(jù)本發(fā)明，可以使用許多用于改善或者消除這類有害的免疫反應(yīng)的方法。在一種優(yōu)選實施方式中，該大范圍核酸酶基本上不含N-甲酰蛋氨酸。避免不希望有的免疫反應(yīng)的另一個途徑是，將大范圍核酸酶結(jié)合到聚乙二醇(“PEG”)或者聚丙二醇(“PPG”)(優(yōu)選平均分子量500～20,000道爾頓(MW))上。例如，按照Davis等(US 4,179,337)描述的與PEG或PPG的結(jié)合的方法，可以提供非免疫原性的、生理學(xué)活性的、水溶性的內(nèi)切核酸酶結(jié)合體，其具有抗病毒活性。Saifer等(US 5,006,333)還描述了使用聚乙烯-聚丙烯乙二醇共聚物的類似方法。
本發(fā)明還涉及被如上所述的多核苷酸或載體、優(yōu)選表達載體修飾的原核或真核寄主細胞。
本發(fā)明還涉及一種非人類的轉(zhuǎn)基因動物或轉(zhuǎn)基因植物，其特征在于它們的細胞的全部或一部分被如上所述的多核苷酸或載體修飾。
在此使用的細胞，是指原核細胞比如細菌細胞、或者真核細胞比如動物細胞、植物細胞或酵母細胞。
本發(fā)明的目的進一步涉及如上所述的大范圍核酸酶(變體或單鏈衍生物)、一種或兩種優(yōu)選包括在表達載體中的多核苷酸的應(yīng)用，、用于基因組工程(動物模型增殖敲入或者敲除)，用于非治療目的。
根據(jù)所述應(yīng)用的優(yōu)選實施方式，其被用于誘導(dǎo)在所研究基因上的雙鏈斷裂，從而誘導(dǎo)DNA重組的發(fā)生、DNA損失或細胞死亡。
根據(jù)本發(fā)明，所述雙鏈斷裂是用于修補特定序列，修飾特定序列，修復(fù)功能基因以代替突變基因，減弱或者激活所研究的內(nèi)源基因，將突變導(dǎo)入所研究位點，導(dǎo)入外源基因或其部分，鈍化或刪除內(nèi)源基因或其部分，轉(zhuǎn)位染色體臂，或者脫離未修補和退化的DNA。
根據(jù)所述應(yīng)用的另一個優(yōu)選實施方式，將所述變體、多核苷酸、載體與如上所述的靶向DNA構(gòu)造相聯(lián)接。
在根據(jù)本發(fā)明的大范圍核酸酶(變體/單鏈衍生物)的應(yīng)用的第一種實施方式中，至少包括如下步驟1)通過使所述切割位點接觸所述大范圍核酸酶，在基因組基因座處導(dǎo)入雙鏈斷裂，所述基因座包含所述大范圍核酸酶的至少一個識別和切割位點；2)提供包含待導(dǎo)入序列的靶向DNA構(gòu)造，所述待導(dǎo)入序列的側(cè)翼為與該靶基因座共享同源性的序列?？蓪⑺龃蠓秶怂崦缸凅w直接提供至細胞，或者通過表達載體提供至細胞，所述表達載體包含編碼所述大范圍核酸酶的多核苷酸序列并且適合于在所用細胞中表達。該策略用于在靶位點處導(dǎo)入DNA序列，例如用于產(chǎn)生可以用于藥物檢驗的敲入或敲除動物模型或細胞系。
本發(fā)明的目的還在于提供如上所述至少一種大范圍核酸酶變體的應(yīng)用，所述大范圍核酸酶變體作為支架用于構(gòu)造其他大范圍核酸酶。例如，為了構(gòu)造新穎的第三代尋靶內(nèi)切核酸酶，突變和挑選/篩選的第三輪可以在所述變體上進行。
根據(jù)本發(fā)明的I-CreI變體的不同用途和使用所述I-CreI變體的方法，還包括如上所述單鏈嵌合大范圍核酸酶的應(yīng)用，該單鏈嵌合大范圍核酸酶來源于所述變體、多核苷酸、載體、細胞、編碼所述變體或單鏈嵌合核酸內(nèi)切酶的轉(zhuǎn)基因植物或非人類轉(zhuǎn)基因哺乳動物。
通過一種用于改造能夠切割來自所研究基因、例如哺乳動物基因的基因組DNA靶序列的I-CreI變體的方法，可以得到根據(jù)本發(fā)明的I-CreI變體，該方法至少包括下述步驟 (a)構(gòu)造第一系列的I-CreI變體，該I-CreI變體在LAGLIDADG核心結(jié)構(gòu)域的第一功能性亞結(jié)構(gòu)域上具有至少一種置換，所述核心結(jié)構(gòu)域處于I-CreI的第26～40位，優(yōu)選處于I-CreI的第28～40位， (b)構(gòu)造第二系列的I-CreI變體，該I-CreI變體在LAGLIDADG核心結(jié)構(gòu)域的第二功能性亞結(jié)構(gòu)域上具有至少一種置換，所述核心結(jié)構(gòu)域處于I-CreI的第44～77位，優(yōu)選處于I-CreI的第44～70位， (c)挑選和/或篩選來自步驟(a)的第一系列變體，其能夠切割突變體I-CreI位點，其中(i)在該I-CreI位點第-10～-8位的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第-10～-8位的核苷酸三聯(lián)體，并且(ii)在+8～+10位置處的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第-10～-8位的核苷酸三聯(lián)體反向互補序列， (d)挑選和/或篩選來自步驟(b)的第二系列變體，其能夠切割突變體I-CreI位點，其中(i)在該I-CreI位點第-5～-3位的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第-5～-3位的核苷酸三聯(lián)體，并且(ii)在+3～+5位置處的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第-5～-3位的核苷酸三聯(lián)體反向互補序列， (e)挑選和/或篩選來自步驟(a)的第一系列變體，其能夠切割突變體I-CreI位點，其中(i)I-CreI位點第+8～+10位的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第+8～+10位的核苷酸三聯(lián)體，并且(ii)在-10～-8位置處的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第+8～+10位的核苷酸三聯(lián)體反向互補序列， (f)挑選和/或篩選來自步驟(b)的第二系列變體，其能夠切割突變體I-CreI位點，其中(i)I-CreI位點第+3～+5位的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第+3～+5位的核苷酸三聯(lián)體，并且(ii)在-5～-3位置處的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第+3～+5位的核苷酸三聯(lián)體反向互補序列， (g)在單個變體中組合來自步驟(c)和步驟(d)的兩個變體的第28～40位和第44～70位的突變，以得到一種新穎的可切割序列的同型二聚體I-CreI變體，其中(i)在-10～-8位置處的核苷酸三聯(lián)體與存在于所述基因組標(biāo)靶中第-10～-8位的核苷酸三聯(lián)體相同，(ii)在+8～+10位置處的核苷酸三聯(lián)體與存在于所述基因組標(biāo)靶中第-10～-8位的核苷酸三聯(lián)體反向互補序列相同，(iii)在位置-5～-3處的核苷酸三聯(lián)體與存在于所述基因組標(biāo)靶中第-5～-3位的核苷酸三聯(lián)體相同，并且(iv)在+3～+5位置處的核苷酸三聯(lián)體與存在于所述基因組標(biāo)靶中第-5～-3位的核苷酸三聯(lián)體反向互補序列相同， (h)在單個變體中組合來自步驟(e)和步驟(f)的兩個變體的第28～40位和第44～70位的突變，以得到一種新穎的可切割序列的同型二聚體I-CreI變體，其中(i)在+3～+5位置處的核苷酸三聯(lián)體與存在于所述基因組標(biāo)靶中第+3～+5位的核苷酸三聯(lián)體相同，(ii)在位置-5～-3處的核苷酸三聯(lián)體與存在于所述基因組標(biāo)靶中第+3～+5位的核苷酸三聯(lián)體的反向互補序列相同，(iii)I-CreI位點第+8～+10位的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第+8～+10位的核苷酸三聯(lián)體，并且(iv)在-10～-8位置處的核苷酸三聯(lián)體與所述基因組標(biāo)靶中第+8～+10位的核苷酸三聯(lián)體反向互補序列相同， (i)組合步驟(g)和(h)中得到的變體，形成異二聚體。
(j)挑選和/或篩選來自步驟(i)、能夠切割位于哺乳動物基因上的所述基因組DNA標(biāo)靶的異二聚體。
為了提高突變體的結(jié)合和/或切割性能，步驟(a)、(b)、(g)、(h)和(i)可以進一步包括導(dǎo)入附加突變的步驟。可以在接觸DNA靶序列或者直接或間接地與所述DNA標(biāo)靶相互作用的其他位置處導(dǎo)入附加突變。如該PCT申請WO2004/067736中所述，該附加步驟可以通過產(chǎn)生變體文庫進行。
用于改造本發(fā)明的I-CreI變體的方法優(yōu)選包括在整個變體上或者在變體的一部分上、尤其在變體的C末端一半(第80～163位)上導(dǎo)入隨機突變，以提高該突變體對于來自所研究基因的DNA標(biāo)靶的結(jié)合和/或切割性能。該突變可以根據(jù)本技術(shù)領(lǐng)域眾所周知和商業(yè)化的標(biāo)準(zhǔn)的突變方法，通過在變體池(pool of variants)上產(chǎn)生隨機突變文庫進行。優(yōu)選該突變在步驟(i)中形成或者在步驟(j)中得到的異二聚體的一個單體的整個序列上進行，優(yōu)選在單體池上進行，優(yōu)選在步驟(i)或(j)的異二聚體的兩個單體上進行。
優(yōu)選根據(jù)圖25所示工藝進行兩輪篩選/篩選。在第一輪中，對異二聚體中的一個單體(圖25中的單體4)進行突變，并使其與其他單體(圖25中單體3)一起被共表達以形成異二聚體，然后挑選出針對來自所研究基因的標(biāo)靶的改良單體4。在第二輪中，對其他的單體(單體3)進行突變，并使其與改良單體4一起被共表達以形成異二聚體，然后針對來自所研究基因的標(biāo)靶選擇，以得到活性提高的大范圍核酸酶。
根據(jù)眾所周知的重疊PCR技術(shù)，通過擴增包含兩個亞結(jié)構(gòu)域中每一個的重疊片段，可以進行步驟(g)和(h)中突變的組合。
通過將來自步驟(g)的一個變體與來自步驟(h)的一個變體共表達，來進行步驟(i)中變體的組合，以便允許形成異二聚體。例如，寄主細胞可以被編碼所述變體的一種或兩種重組表達載體修飾。然后在允許變體表達的條件下培養(yǎng)細胞，從而在寄主細胞中形成異二聚體。
通過使用體外或體內(nèi)的切割分析方法，可以進行步驟(c)、(d)、(e)、(f)和/或(j)中的挑選和/或篩選，這在PCT申請WO 2004/067736或Arnould等的文獻(J.Mol.Biol.，2006，355(3)443-58)中有描述。
根據(jù)所述方法的另一個優(yōu)選實施方式，在由所述變體產(chǎn)生的突變的DNA靶序列中雙鏈斷裂導(dǎo)致陽性選擇性標(biāo)記或報告基因活化、陰性選擇性標(biāo)記或報告基因鈍化的情況下，通過所述DNA雙鏈斷裂的重組修復(fù)，在體內(nèi)進行步驟(c)、(d)、(e)、(f)和/或(j)。
編碼在本發(fā)明中限定的變體的多核苷酸序列可以通過本領(lǐng)域技術(shù)人員所熟知的方法制備。例如，用特定的引物通過聚合酶鏈反應(yīng)，由cDNA模板擴增它們。優(yōu)選對所述cDNA的密碼子進行選擇以便有助于在期望的表達系統(tǒng)中表達所述蛋白質(zhì)。
通過眾所周知的重組DNA和基因工程技術(shù)，可以得到包含所述多核苷酸的重組載體，并將其導(dǎo)入寄主細胞。
通過表達如上所述的多肽，產(chǎn)生本發(fā)明的變體；優(yōu)選在適合表達或共表達該多肽的條件下，在被一種或兩種表達載體修飾的寄主細胞中表達或者共表達所述多肽，并且從寄主細胞培養(yǎng)基中回收變體。
能夠切割來自所研究基因的DNA標(biāo)靶的單鏈嵌合大范圍核酸酶源自于根據(jù)本發(fā)明的變體，通過本技術(shù)領(lǐng)域眾所周知的方法得到(Epinat et al.，Nucleic Acids Res.，2003，31，2952-62；Chevalier et al.，Mol.Cell.，2002，10，895-905；Steuer et al.，Chembiochem.，2004，5，206-13；International PCT Applications WO 03/078619 and WO2004/031346)。任何這樣的方法，可以應(yīng)用于構(gòu)造從本發(fā)明中限定的變體衍生來的單鏈嵌合大范圍核酸酶。

除前述特征外，本發(fā)明還包括其他的特征，下面參照I-CreI大范圍核酸酶變體實施例和根據(jù)本發(fā)明的應(yīng)用、以及附后的附圖，將對這些特征進行描述 -圖1所示為人類XPC基因，以及兩個不同的用于通過大范圍核酸酶誘導(dǎo)的重組來修復(fù)功能基因的策略。圖1A顯示了XPC基因CDS接合；在XP-C互補群中發(fā)現(xiàn)的突變通過箭頭表示出來。在內(nèi)含子序列中發(fā)現(xiàn)了Xa.1序列(第9119位，SEQ ID NO24)。在外顯子9中發(fā)現(xiàn)了Xc.1序列(第20438位，SEQ ID NO12)。圖1B所示為基因修正。突變發(fā)生在已知基因內(nèi)部。一旦被大范圍核酸酶切割并且與修復(fù)基體重組，有害的突變就得到修正。圖1C所示為外顯子序列敲入。突變發(fā)生在已知基因內(nèi)部。突變的mRNA轉(zhuǎn)錄產(chǎn)物標(biāo)示在該基因下面。在修復(fù)基體中，位于切割位點下游的外顯子與聚腺苷酸化位點融合在構(gòu)架內(nèi)(例如在cDNA內(nèi))，以終止在3′端的轉(zhuǎn)錄。內(nèi)含子和外顯子序列可以用作同源區(qū)域。外顯子序列敲入導(dǎo)致進入改造的基因，轉(zhuǎn)錄成能用于編碼功能蛋白的mRNA。
-圖2所示為本發(fā)明的原理。其中，圖A所示為與其標(biāo)靶結(jié)合起來的I-CreI結(jié)構(gòu)。實驗數(shù)據(jù)顯示，兩個單獨的亞結(jié)構(gòu)域(方塊)可以在DNA結(jié)合結(jié)構(gòu)域中被識別；核心結(jié)構(gòu)域的各個亞結(jié)構(gòu)域結(jié)合該DNA標(biāo)靶的不同一半。圖B，一種意欲識別較小的單獨亞結(jié)構(gòu)域(方塊)的I-CreI結(jié)構(gòu)，各個亞結(jié)構(gòu)域結(jié)合DNA標(biāo)靶的不同的一半部分。然而，尚沒有結(jié)構(gòu)數(shù)據(jù)或?qū)嶒灁?shù)據(jù)來支持這種假設(shè)。
-圖3所示為I-CreI與其DNA標(biāo)靶C1221(SEQ ID NO25)的堿基特異性交互作用圖(Chevalier and Stoddard，Nucleic Acids Res.，2001，29，3757-74；Chevalier et al.J.Mol.Biol.，2003，329，253-69)。發(fā)明人已經(jīng)識別出新穎的能結(jié)合在區(qū)域-10～-8和+8～+10、或-5～-3和+3～+5中被修飾的DNA標(biāo)靶的I-CreI衍生內(nèi)切核酸酶。這些DNA區(qū)域被顯示在灰盒中。
-圖4所示為組合方法的基本原理。在圖4A中，兩個DNA結(jié)合亞結(jié)構(gòu)域(頂部左側(cè))具有可分性，一個DNA結(jié)合亞結(jié)構(gòu)域可以組合不同的可結(jié)合I-CreI標(biāo)靶序列衍生的不同序列的I-CreI單體(頂部右側(cè)和底部左側(cè))，以得到異二聚體或可切割非回文嵌合標(biāo)靶的單鏈融合分子(底部右側(cè))。在圖4B中，較小的單獨的亞基、即在單個單體或αββαββα折疊內(nèi)部的亞基(頂部右側(cè)和底部左側(cè))的識別情況，將允許通過在同一單體內(nèi)部突變的組合來設(shè)計新穎的嵌合分子(底部右側(cè))。在圖4C中，兩個前述步驟的組合將允許較大的組合方法，涉及到四個不同的可以在新的分子(底部右側(cè))中被組合的亞結(jié)構(gòu)域(頂部右側(cè)，中間左側(cè)和右側(cè)，底部左側(cè))。這樣，少量用于各個亞結(jié)構(gòu)域的新的切割酶的識別將允許設(shè)計出非常多的新穎的內(nèi)切核酸酶。
-圖5顯示了編碼I-CreI N75支架蛋白質(zhì)的cDNA序列和用于該Ulib4和Ulib5文庫構(gòu)造的簡并引物。在圖A中，支架(SEQ ID NO26)編碼I-CreI ORF(SEQ ID NO218)，該I-CreI ORF包括在位置2處丙氨酸密碼子的插入、在3′末端處的A42T、D75N、W110E和R111Q密碼子置換和三個添加密碼子(AAD)。圖B所示為引物(SEQ ID NO27、28、29)， -圖6顯示了I-CreI變體在位置28、30、33、38和/或40處的切割模式。對于每一個在篩選以后得到的并且被在位置28、30、33、38、40、70和75處的殘基限定的141I-CreI變體，通過在位置±8～10處的核苷酸置換來監(jiān)控具有64個來源于被I-CreI切割的C1221回文標(biāo)靶的標(biāo)靶的酵母中的切割。這些標(biāo)靶通過三個字母標(biāo)明，對應(yīng)于在位置-10、-9和-8處的核苷酸。例如GGG對應(yīng)于tcgggacgtcgtacgacgtcccga標(biāo)靶(SEQ ID NO30)。數(shù)值對應(yīng)于進行在濾光器掃描之后通過適當(dāng)?shù)能浖u價的切割強度。對于各個蛋白質(zhì)，顯示64個標(biāo)靶的每一個中觀察到的切割(黑盒)或者未觀察的切割(0)。全部變體在位置75D75N處發(fā)生了突變。
-圖7顯示了I-CreI變體在位置44、68和/或70處的切割模式。對于每一個在篩選以后得到的并且被在位置44、68和70處的殘基(頭三欄)限定的292 I-CreI變體，通過在位置±3～5處的核苷酸置換來監(jiān)控具有64個來源于被I-CreI切割的C1221回文標(biāo)靶的標(biāo)靶的酵母中的切割。這些標(biāo)靶通過三個字母標(biāo)明，對應(yīng)于在位置-5、-4和-3處的核苷酸。對于各個蛋白質(zhì)，顯示這64個標(biāo)靶的每一個中觀察到的切割(1)或未觀察到的切割(0)。全部變體在位置75D75N處發(fā)生了突變。
-圖8顯示了在蛋白質(zhì)和DNA標(biāo)靶中的突變在被結(jié)合于其標(biāo)靶上的I-CreI同型二聚體上的位置。兩組突變(殘基44、68和70；殘基28、30、33、38和40)用黑色顯示在左邊的單體上。該兩組突變清楚地明顯間隔開來。然而，對于不同的亞結(jié)構(gòu)域，沒有結(jié)構(gòu)證據(jù)。DNA靶位點上的結(jié)合體區(qū)域(區(qū)域-5～-3；區(qū)域-10～-8)用灰色顯示在一個半位點上。
-圖9顯示了Xa系列標(biāo)靶和接近的衍生物。C1221(SEQ ID NO25)是I-CreI回文靶序列之一。10TGC_P、10AGG_P、5CCT_P和5TTT(SEQ ID NO31、32、33、34)是被發(fā)現(xiàn)將被I-CreI突變體切割的接近的衍生物。它們通過盒的移動與C1221區(qū)別。C1221、10TGC_P、10AGG_P、5CCT_P和5TTT被首次描述為24bp序列，但是結(jié)構(gòu)數(shù)據(jù)顯示，僅該22bp與蛋白質(zhì)/DNA交互作用有關(guān)。然而、第±12位被顯示在括號中。Xa.1(SEQ ID NO24)是位于人類XPC基因第9119位的DNA序列。在Xa.2標(biāo)靶(SEQ ID NO35)中，標(biāo)靶當(dāng)中的TTGA序列被替換為在C1221中被發(fā)現(xiàn)的堿基GTAC。Xa.3(SEQ ID NO36)是來源于Xa.2左部的回文序列，而Xa.4(SEQ ID NO37)是來源于Xa.2右部的回文序列。在Xa系列標(biāo)靶中發(fā)現(xiàn)了從10TGC_P、10AGG_P、5CCT_P和5TTT的盒移動。
-圖10顯示了pCLS1055質(zhì)粒載體的示圖。
-圖11顯示了pCLS10542質(zhì)粒載體的示圖。
-圖12顯示了Xa.3標(biāo)靶的切割。該圖顯示了用Xa.1、Xa.2、Xa.3和Xa.4標(biāo)靶(SEQ IDNO24、35、36、37)對I-CreI K28、N30、S33、R38、S40、S70、N75(KNSRSSN)突變體和I-CreI A28、N30、S33、R38、K40、S70、N75(ANSRKSN)突變體的第二次篩選。
-圖13顯示了Xa.4標(biāo)靶的切割。該圖顯示了用Xa.1、Xa.2、Xa.3和Xa.4標(biāo)靶(SEQ IDNO24、35、36、37)對表XVI中所述一系列組合突變體的第二次篩選。
-圖14顯示了pCLS1107載體的示圖。
-圖15顯示了Xa.1和Xa.2標(biāo)靶的切割。切割Xa.4的一系列I-CreI N75突變體與KNSRSS(a)或ANSRKS(b)一起被共表達。用Xa.1、Xa.2、Xa.3和Xa.4標(biāo)靶(SEQ ID NO24、35、36、37)測試切割。切割Xa.1的突變體被圈起來。
-圖16至22顯示了在人類XP基因各個外顯子中發(fā)現(xiàn)的DNA靶序列(XPA～XPG基因)和能夠切割所述DNA標(biāo)靶的相應(yīng)I-CreI變體。顯示出最接近靶序列的外顯子、以及該外顯子的接合情況(第1和第2欄)，顯示出該DNA標(biāo)靶的序列(第3欄)連同其位置(第4欄)。通過其第一個核苷酸(起始，第7欄)和最后的核苷酸(結(jié)束，第8欄)顯示出用于在靶位點處修復(fù)切割的最小修復(fù)基體。各個變體的序列被在指示位置處的其氨基酸殘基所限定。例如，圖16中的第一異二聚體變體由第一單體和第二單體組成，其中，第一單體分別在位置28、33、38、40、44、68、70和75處具有K、S、R、D、K、R、G和N，而第二單體分別在位置28、30、38、44、68、70、75和77處具有R、D、R、K、A、S、N和I。指示位置可參考I-CreI序列SWISSPROT P05725或者pdb入藏登記代碼1g9y；I-CreI在位置24、26、28、30、32、33、38、40、42、44、68、70、75、77、80和133處分別具有I、Q、K、N、S、Y、Q、S、A、Q、R、R、D、I、E和A。未顯示的位置可以是突變或者未突變位置。在后一情況中，未顯示的位置對應(yīng)于野生型I-CreI序列。
-圖23顯示了三個標(biāo)靶，其源自在人類XPC基因中被識別出來的C1221Xa.1、Xb.1和Xc.1(SEQ ID NO24、8、12)。各個初始標(biāo)靶被轉(zhuǎn)化在更有利于I-CreI切割的Xx.2標(biāo)靶(SEQ ID NO35、219、222)中，然后轉(zhuǎn)化入兩個回文標(biāo)靶Xx.3(SEQ ID NO36、220、223)和Xx.4(SEQ ID NO37、221、224)。星號代表在基因中發(fā)現(xiàn)的潛在標(biāo)靶。黑色方塊或者豎線代表XPC外顯子。
-圖24顯示了用于構(gòu)造并篩選專門設(shè)計的尋靶內(nèi)切核酸酶的策略。圖A所示為初級篩選的總策略。在數(shù)據(jù)庫中識別特異性局部改變的適當(dāng)?shù)腎-CreI衍生物。然后，通過體內(nèi)克隆，將組合方法用于組裝這些突變體。用酵母篩選分析法，在Xx.3或Xx.4標(biāo)靶上將活性組合突變體識別為同型二聚體。通過針對兩種非回文標(biāo)靶Xx.2和Xx.1的共表達，篩選異二聚體。圖B所示為異二聚體篩選實施例。在兩種非回文標(biāo)靶Xx.2和Xx.1上篩選每一個新的內(nèi)切核酸酶，在位置±2和±1處有差別。如前所述進行篩選(PCT申請WO 2004/067736；Arnould etal.，J.Mol.Biol.，2006，355，443-458)；藍色染色顯示切割。
-圖25顯示了用于提高專門設(shè)計的尋靶內(nèi)切核酸酶的活性的策略。通過易錯PCR，將針對Xx.4具有活性的4個單體的池進行誘變處理，其中其對應(yīng)物(針對Xx.3具有活性的單體)被用于產(chǎn)生包含標(biāo)靶Xx.1的酵母表達菌株。該誘變處理文庫被轉(zhuǎn)化入第二酵母菌株并且通過體內(nèi)克隆而被克隆。通過兩種酵母菌株的配對而進行異二聚體活性的篩選。然后在對Xx.3標(biāo)靶有活性的I-CreI變體上重復(fù)相同的程序。
-圖26顯示了可切割Xb.1標(biāo)靶的改良異二聚體的篩選和特性。圖A所示為異二聚體從初始到改良變體的最后篩選。兩種形式的I-SceI尋靶內(nèi)切核酸酶弱活性的I-SceI*、I-SceI變體；強活性的I-SceI、初始I-SceI ORF被用作對照。
用空載體轉(zhuǎn)化的酵母菌株。初始在改良之前的代表性突變體活性。將包含針對Xa.3或者針對Xa.4有活性的改良突變體的酵母菌株與包含改良突變體和Xa.1標(biāo)靶的酵母菌株配對。圖B所示為大多數(shù)活性I-CreI變體的蛋白質(zhì)序列。I活性提高之前的蛋白質(zhì)序列。M通過易錯PCR隨機突變后的蛋白質(zhì)序列。
-圖27顯示了在哺乳動物細胞中的異二聚體活性。通過在材料和方法部分中所述的共表達分析法對異二聚體活性進行了定量。

用空載體轉(zhuǎn)染的CHO。I-SceI用I-SceI表達載體轉(zhuǎn)染的CHO。I活性提高之前的突變體。M活性提高后的突變體。所有標(biāo)靶載體皆載有切割效率較弱的額外的最佳以下18bp的I-SceI位點。其被用作對照實驗。I-SceI活性代表了由全部標(biāo)靶載體得到的平均數(shù)。
-圖28顯示了組合同型二聚體突變體的序型。在圖A中，I-CreI C1221回文標(biāo)靶的半位點被顯示在各個盒的底線之上。在各個位置處默認的個別核苷酸變化被顯示出來。字母的大小與酶I-CreI D75N和野生型的活性成正比。在圖B中，Xa.3和Xa.4回文標(biāo)靶的半位點被顯示在底線之上。對于突變體3和突變體4，在各個位置處默認的個別核苷酸變化分別被顯示出來。字母的大小與突變體的活性成正比。

具體實施例方式 實施例1在位置±8～±10處特異性改變的I-CreI變體改造用于產(chǎn)生大范圍核酸酶變體的方法，以及基于在哺乳動物或者酵母細胞中誘導(dǎo)切割的重組的分析方法，被用于篩選特異性改變的變體，這已在文獻中進行了描述(PCT申請WO2004/067736；Arnould et al.，J.Mol.Biol.，2006，355，443-458.Epinat et al.，N.A.R.，2003，31，2952-2962 and Chames et al.，Nucleic Acids Res.，2005，33，e178)。這些分析得到了可以通過標(biāo)準(zhǔn)方法監(jiān)控的功能性的lacZ報告基因。
A)材料和方法 a)文庫Ulib4、Ulib5和Lib4的構(gòu)造按在先描述的那樣(Epinat et al.，2003，31，2952-2962)，合成I-Cre Iwt和I-CreI D75N開放閱讀框。通過更換具有aac的密碼子75，導(dǎo)入突變D75N。通過對I-CreI D75N蛋白質(zhì)更換三種不同的殘基組合，衍生得到三個組合文庫(Ulib4、Ulib5和Lib4)，該替換潛在地涉及到與一種DNA標(biāo)靶半位點的第±8～10位堿基的交互作用。在每個挑選的位置處，使用包埋有獨特的簡并密碼子(編碼10或12種不同氨基酸)的簡并引物，通過PCR產(chǎn)生了大范圍核酸酶文庫的多樣性。
在位置N30、Y33和Q38(Ulib4文庫)或者K28、N30和Q38(Ulib5文庫)處的三個密碼子被編碼12個不同氨基酸(A、D、E、G、H、K、N、P、Q、R、S、T)的簡并密碼子VVK(18密碼子)替代。在序列中，這些蛋白質(zhì)文庫最大的(理論的)多樣性是123或1728。然而，就核酸而言，多樣性是183或5832。使用一對簡并引物(Ulib456for和Ulib4rev；Ulib456for和Ulib5rev、圖5B)并作為DNA模板、D75N開放閱讀框(ORF)，通過PCR得到了載有預(yù)期突變的組合的片段，(圖5A)。相應(yīng)的PCR產(chǎn)物被反向克隆進入酵母復(fù)制型表達載體pCLS0542(Epinat et al.，參見前述)上的載有LEU2營養(yǎng)缺陷型標(biāo)志基因的I-CreI N75 ORF。在基于2MICRON的復(fù)制型載體中，I-CreI變體處于半乳糖誘導(dǎo)性啟動子控制之下。
在Lib4中，依BIOMETHODES順序，第70位精氨酸首先被替換為絲氨酸(R70S)。然后第28、33、38和40位被隨機取代。規(guī)則的氨基酸(K28、Y33、Q38和S40)被10種氨基酸(A、D、E、K、N、Q、R、S、T、Y)中的一種氨基酸取代。就蛋白質(zhì)而言，得到的文庫具有理論上10000個的復(fù)雜度。
b)標(biāo)靶克隆的構(gòu)造該C1221的二十四個bp的回文(tcaaaacgtcgtacgacgttttga，(SEQ ID NO25)幾乎是回文天然I-CreI標(biāo)靶(tcaaaacgtcgtgagacagtttgg，SEQ ID NO38)半位點的重復(fù)。在酵母和哺乳動物細胞中，C1221都可與I-CreI天然標(biāo)靶一樣有效地進行體內(nèi)和體外切割。
這64個回文標(biāo)靶按如下方式從C1221衍生得到從Sigma公司定購64對低聚核苷酸((ggcatacaagtttcnnnacgtcgtacgacgtnnngacaatcgtctgtca(SEQ ID NO39)和反向互補序列)、經(jīng)退火并且沿相同的方向克隆入pGEM-T Easy(PROMEGA公司)。接著，將400bp的PvuII片段切除并且克隆入也稱為pCLS0042的酵母載體pFL39-ADH-LACURAZ、以及哺乳動物載體pcDNA3衍生物(pcDNA3.1-LAACZ)，兩者在先已有描述(Epinat et al.，2003。參見前述)，得到64種酵母報告載體(標(biāo)靶質(zhì)粒)。
可選地，使用網(wǎng)間連接協(xié)議(INVITROGEN公司)，將通過單鏈低聚核苷酸的PCR擴增產(chǎn)生的雙鏈標(biāo)靶DNA克隆入酵母和哺乳動物報告載體。
c)酵母菌株將大范圍核酸酶表達變體文庫轉(zhuǎn)化進入leu2突變體單倍體酵母菌株FYC2-6Aα、trp1Δ63、leu2Δ1、his3Δ200。通常地每μg的DNA給我們帶來106個單獨的轉(zhuǎn)化體的經(jīng)典的化學(xué)/熱休克方案(來源于Gietz and Woods，Methods Enzymol.，2002，350，87-96)被用于轉(zhuǎn)化。單獨的轉(zhuǎn)化體(Leu+)克隆被分別挑入96個孔板中，使用菌落挑取器(QpixII，GENETIX)挑取了13824個菌落，并且在144個微量滴定板上培養(yǎng)。
使用相同的方案，將這64個標(biāo)靶質(zhì)粒轉(zhuǎn)化入單倍體酵母菌株FYBL2-7Ba、ura3Δ851、trp1Δ63、leu2Δ1、lys2Δ202，得到64個測交品系。
d)大范圍核酸酶表達克隆的配對和在酵母中的篩選將大范圍核酸酶表達克隆與64個標(biāo)靶菌株中的每一個配對，并且通過使用Arnould等的文獻中圖2示意的篩選分析法(Arnould et al.，2006。參見前述)，測試二倍體的β-半乳糖苷酶活性。將I-CreI變體克隆以及酵母報告菌株儲存在甘油(20％)中，并且在新的微孔板上復(fù)制。使用菌落網(wǎng)格器(QpixII、GENETIX)進行配對。使用高網(wǎng)格密度(約20個斑點/cm2)，將突變體網(wǎng)格在覆蓋有YPD平板的尼龍濾紙上。在相同的濾紙上進行第二次網(wǎng)格工藝，標(biāo)出由64種不同的各個變體的報告包埋酵母菌株組成的第二層。薄膜被放置在固體瓊脂YPD富集培養(yǎng)基上，并且在30℃下培養(yǎng)一個晚上，以允許配對。接著，用半乳糖(2％)作為碳源(以及用于共表達試驗的G418)將濾紙轉(zhuǎn)印至缺乏白氨酸和色氨酸的合成培養(yǎng)基上，并且在37℃下孵育五天，以便挑選載有表達載體和標(biāo)靶載體的二倍體。在5天后，將濾紙置于具有溶于pH7.0的0.5M磷酸鈉緩沖液中的0.02％X-Gal、0.1％的SDS、6％二甲基甲酰胺(DMF)、7mM的β-巰基乙醇、1％瓊脂糖的固體瓊脂糖培養(yǎng)基上，并且在37℃下培養(yǎng)、以監(jiān)測β-半乳糖苷酶活性。在孵育兩天后，通過掃描識別陽性克隆。使用適當(dāng)?shù)能浖寺≈甑摩?半乳糖苷酶進行定量。
分離出針對至少一種標(biāo)靶顯示活性的克隆株(第一次篩選)。然后將斑點密度減少至4個斑點/cm2，并且一式四份地測試各個針對該64個報告菌株的陽性克隆，從而產(chǎn)生完全的序型(第二次篩選)。
e)測序使用購自PROLIGO公司的下述引物PCR-Gal10-F(gcaactttagtgctgacacatacagg，SEQ IDNO40) 和PCR-Gal10-R(acaaccttgattgcagacttgacc、SEQ ID NO41)或者 5’-ggggacaagtttgtacaaaaaagcaggcttcgaaggagatagaaccatggccaataccaaatataacaaagagttcc-3′(SEQID NO225)和 5’-ggggaccactttgtacaagaaagctgggtttagtcggccgccggggaggatttcttcttctcgc-3′(SEQ IDNO226)，通過PCR，在酵母菌落上擴增在酵母內(nèi)第一次和/或第二次篩選期間被識別的陽性克隆的開放閱讀框(ORF)。簡言之，挑取酵母菌落，并將其再懸浮于100μl的LGlu液體培養(yǎng)基中，并且培養(yǎng)過夜。離心后，將酵母團粒再懸浮于10μl的無菌水中，并且將其用于在包含1.5μl各個特定引物(100pmol/μl)的50μl的最終容積中進行PCR反應(yīng)。該PCR條件是在94℃下進行一個循環(huán)的變性10分鐘、在94℃下進行35個循環(huán)的變性30s、在55℃下退火1分鐘，在72℃下延伸1.5分鐘，并且最后延伸5分鐘。然后對得到的PCR產(chǎn)物測序。
f)初級采樣的再克隆使用網(wǎng)間連接協(xié)議(Invitrogen公司)，對在初級篩選期間識別的陽性克隆的開放閱讀框(ORFs)進行再克隆。按步驟e)中的描述，通過PCR在酵母菌落上擴增ORFs。然后將PCR產(chǎn)物克隆入下述物質(zhì)(i)包埋有半乳糖誘導(dǎo)性啟動子、作為選擇性標(biāo)記的LEU2或KanR、和復(fù)制型載體的2MICRON起始點的酵母通路表達載體；(ii)購自NOVAGEN公司的pET 24d(+)載體；以及(iii)購自INVITROGEN公司的CHO通路表達載體pcDNA6.2。通過測序(MILLEGEN)檢驗得到的克隆。
B)結(jié)果 I-CreI是可切割22bp假回文標(biāo)靶的二聚體尋靶內(nèi)切核酸酶。對被結(jié)合到天然標(biāo)靶上的I-CreI結(jié)構(gòu)的分析表明，在各個單體中，八個殘基與七個堿基建立了直接的交互作用(Jurica etal.，1998。參見前述)。根據(jù)這些結(jié)構(gòu)數(shù)據(jù)，第±8～10位核苷酸的堿基與I-CreI的氨基酸N30、Y33和Q38建立了特定的聯(lián)系(圖3)。這樣，第30、33和38位具有突變的新穎蛋白質(zhì)可以顯示新穎的具有64個標(biāo)靶的切割序型，該64個標(biāo)靶產(chǎn)生于被I-CreI切割的回文標(biāo)靶上第±8、±9和±10位的置換。另外，突變可能改變了涉及與DNA堿基直接接觸的殘基數(shù)目和位置。更具體地講，不位于第30、33、38位、而是位于在折疊蛋白上接近的附近位置可能涉及與相同堿基對的相互作用。
消耗性蛋白質(zhì)文庫對照標(biāo)靶文庫的方法被使用以局部地改造DNA結(jié)合界面的該部分。首先，將I-CreI支架從D75突變?yōu)镹。該D75N突變不會影響蛋白質(zhì)結(jié)構(gòu)，而是在過量表達實驗中降低了I-CreI的毒性。
接著，構(gòu)造Ulib4文庫第30、33和38位殘基被隨機化，并且規(guī)則的氨基酸(N30、Y33和Q38)用12種氨基酸(A、D、E、G、H、K、N、P、Q、R、S、T)中的一種氨基酸取代。就蛋白質(zhì)而言，得到的文庫具有1728的復(fù)雜度(就核酸而言為5832)。
然后，構(gòu)造兩個其他文庫Ulib5和Lib4。在Ulib5文庫中，第28、33和38位殘基被隨機化，并且規(guī)則的氨基酸(K28、N30和Q38)用12種氨基酸(A、D、E、G、H、K、N、P、Q、R、S、T)中的一種氨基酸取代。就蛋白質(zhì)而言，得到的文庫具有1728的復(fù)雜度(就核酸而言為5832)。在Lib4文庫中，第70位精氨酸首先被絲氨酸取代。然后，第28、33、38和40位被隨機化，并且規(guī)則的氨基酸(K28、Y33、Q38和S40)用10種氨基酸(A、D、E、K、N、Q、R、S、T、Y)中的一種氨基酸取代。就蛋白質(zhì)而言，得到的文庫具有10000的復(fù)雜度。
在初級篩選實驗中，將來自Ulib4的20000個克隆、來自Ulib5的10000個克隆和來自Lib4的20000個克隆與該64個測交品系的每一個配對，并且測試二倍體的β-半乳糖苷酶活性。在第二輪針對64個標(biāo)靶的篩選中，對所有顯示切割活性的克隆與該64個標(biāo)靶中的至少一種進行一式四份地測試，并且建立各個切割序型。然后，通過PCR擴增來自各個菌株的大范圍核酸酶ORF，測序，并且識別出141種不同的大范圍核酸酶變體。
這141種確認的克隆顯示出變化非常多的模式。某些新的序型與野生型支架共享一些相似性，反之許多其他序型完全不同。結(jié)果總結(jié)于圖6中。尋靶內(nèi)切核酸酶通?？梢栽谒鼈兊陌行蛄兄腥菁{一些簡并性，并且I-CreI N75支架蛋白質(zhì)本身可以切割一系列的4個標(biāo)靶，對應(yīng)于第±10～±8位的aaa、aac、aag、aat三聯(lián)體。研究觀察到，對于aaa、aag、aat具有較強的切割活性，而對于aac僅微弱地切割(有時未觀察到)。在其他的蛋白質(zhì)比如I-CreI K28 N30 D33Q38 S40 R70 N75、I-CreI K28 N30 Y33 Q38 S40 R70 N75中也發(fā)現(xiàn)有類似的模式。對于幾種蛋白質(zhì)，比如I-CreI R28 N30 N33 Q38 D40 S70 N75和I-CreI K28 N30 N33 Q38 S40 R70 N75，aac不再被切割。
然而，許多蛋白質(zhì)顯示出非常不同的模式。在少量變體中，觀察到單一序列的切割。例如，蛋白質(zhì)I-CreI K28 R30 G33 T38 S40 R70 N75對不被野生型蛋白質(zhì)切割的＂ggg＂標(biāo)靶有活性；而I-CreI Q28 N30 Y33 Q38 R40 S70 N75可切割能被I-CreI N75切割的標(biāo)靶之一的aat。其他的蛋白質(zhì)可有效地切割一系列不同的標(biāo)靶例如，I-CreI N28 N30 S33 R38 K40 S70 N75切割ggg、tgg和tgt；CreI K28 N30 H33 Q38 S40 R70 N75切割aag、aat、gac、gag、gat、gga、ggc、ggg和ggt。被切割的序列數(shù)量范圍為1～10個。總而言之，有37個新穎的標(biāo)靶被突變體切割，包括34個不被I-CreI切割的標(biāo)靶和3個被I-CreI切割的標(biāo)靶(aag、aat和aac，圖6)。
實施例2用于構(gòu)造切割來自XPC基因的標(biāo)靶的新穎大范圍核酸酶的策略在I-CreI第44、68和/或70位上具有至少一種置換、并能夠切割在第±3～5位有變化的突變體I-CreI位點的第一系列I-CreI變體預(yù)先被識別(Arnould et al.，J.Mol.Biol.，2006，355，443-458)。變體的切割模式顯示在圖7中。
按照在實施例1中描述的方法，識別出在I-CreI第28、30、33或28、33、38和40位具有至少一種置換、并能夠切割在第±8～10位有變化的突變體I-CreI位點的第二系列I-CreI變體。變體的切割模式顯示在圖6中。
在相同的DNA結(jié)合折疊上，第28、30、33、38和40位在一側(cè)，并且第44、68和70位在另一側(cè)，并且沒有結(jié)構(gòu)證據(jù)證明它們獨立地工作。然而，兩組突變是清楚地發(fā)生在該折疊(圖8)中的兩個空間不同的區(qū)域，該折疊位于DNA標(biāo)靶的周圍不同區(qū)域。這些數(shù)據(jù)表明，I-CreI包含兩個單獨的功能性亞基，其可以被組合以切割新的嵌合標(biāo)靶。該嵌合標(biāo)靶包含通過各個亞結(jié)構(gòu)域結(jié)合的第±3～5和±8～10位核苷酸。
通過使用位于所研究基因即XPC基因上的標(biāo)靶，該假設(shè)得到證實。被I-CreI變體切割的標(biāo)靶是被I-CreI切割的回文序列C1221的24bp衍生物。然而，被結(jié)合于其DNA標(biāo)靶上的I-CreI結(jié)構(gòu)表明，這些標(biāo)靶的兩個外部堿基對(第-12和12位)對于結(jié)合和切割沒有影響(Chevalieret al.，Nat.Struct.Biol.，2001，8，312-316；Chevalier，B.S.and B.L.Stoddard，Nucleic Acids Res.，2001，29，3757-3774；Chevalier et al.，2003，J.Mol.Biol.，329，253-269)，并且在該研究中，僅考慮了第-11～11位。因此，在XPC基因上被識別的一系列標(biāo)靶被限定為22bp序列而不是24bp序列。
Xa.1、Xb.1和Xc.1是分別位于人類XPC基因第9119、13521和20438位的22bp(非回文)標(biāo)靶(圖1A、9和23)。可切割Xa.1、Xb.1或Xc.1的大范圍核酸酶可以被用于修正切割位點附近的突變(圖1B)。因為當(dāng)離DSB的距離增加時，基因修正的效率會下降(Elliott etal.，Mol Cell Biol，1998，18，93-101)，故對于位于在500bp的切割位點內(nèi)部的突變，這種策略將最為有效。例如，切割Xc.1的大范圍核酸酶可以被用于修正外顯子9中的突變(缺失DEL1132AA或者插入insVAL580，圖1A)。作為另一種選擇，相同的大范圍核酸酶可以被用于敲入將在XPC基因座處修復(fù)功能性XPC基因的外顯子序列(圖1C)。該策略可以用于切割位點下游的任何突變。
Xa.1部分地是10TGC_P、10AGG_P、5TTT_P和5CCT_P標(biāo)靶的補丁(圖9和23)，其被預(yù)先識別的大范圍核酸酶切割(圖6和7)。這樣，Xa.1可以被產(chǎn)生于這些預(yù)先被識別的大范圍核酸酶的組合突變體切割。
Xb.1部分地是10GGG_P、10TGT_P、5GGG_P和5TAC_P標(biāo)靶的補丁(圖23)，其被預(yù)先識別的大范圍核酸酶切割(圖6和7)。這樣，Xb.1可以被產(chǎn)生于這些預(yù)先被識別的大范圍核酸酶的組合突變體切割。
Xc.1部分地是10GAG_P、10GTA_P和5TCT_P標(biāo)靶和5GTC_P的補丁(圖23)，10GAG_P、10GTA_P和5TCT_P標(biāo)靶被預(yù)先識別的大范圍核酸酶切割(圖6和7)，而5GTC_P是被I-CreI切割的C1221序列。這樣，Xc.1可以被產(chǎn)生于這些預(yù)先被識別的大范圍核酸酶的組合突變體切割。
因此，為證實這種假設(shè)，對應(yīng)于被識別標(biāo)靶(Xx.1)左側(cè)(Xx.3)一半和右側(cè)一半(Xx.4)序列的兩個回文標(biāo)靶被產(chǎn)生(圖9和23)。這兩個衍生的回文標(biāo)靶保持了來自C1221回文I-CreI標(biāo)靶第-2～+2位的GTAC序列(圖9和23)。因為Xx.3和Xx.4是回文序列，故它們應(yīng)可被同型二聚體蛋白質(zhì)切割。在第一步，能夠切割Xx.3和Xx.4序列作為同型二聚體的蛋白質(zhì)被設(shè)計出來(實施例3和4)，如圖24A所示。在第二步，共表達在實施例3和4中得到的蛋白質(zhì)，以得到可切割Xx.2和Xx.1的異二聚體，用于一些異二聚體(實施例5)，如圖24A所示。
實施例3制備切割Xx.3的大范圍核酸酶該實施例顯示，I-CreI突變體可以以回文形式切割Xx.2標(biāo)靶的左部衍生來的Xx.3DNA靶序列(圖9和23)。該實施例描述的標(biāo)靶序列是22bp回文序列。因此，僅僅描述它們的頭11個核苷酸，其后面有后綴_P；例如，標(biāo)靶Xa.3將被標(biāo)注為ctgccttttgt_P。
Xa.3類似于5TTT_P第±1、±2、±3、±4、±5和±11位，并且類似于10TGC_P第±1、±2、±8、±9、±10和±11位。
Xb.3類似于5GGG_P第±1、±2、±3、±4、±5和±11位，并且類似于10GGG_P第±1、±2、±8、±9、±10和±11位。
Xc.3類似于C1221第±1、±2、±3、±4、±5、±7和±11位，并且類似于10GAG_P第±1、±2、±7、±8、±9、±10和±11位。
已知野生型I-CreI容許第±11、±7和±6位的核苷酸置換(Chevalieretal.，J.Mol.Biol.，2003，329，253-269；Jurica et al.，Mol.Cell.，1998，2，469-476)。這樣，可以假定，第±6和±7位將對結(jié)合和切割活性幾乎沒有影響。
如Arnould等所述(Arnould et al.，J.Mol.Biol.，2006，355，443-458)，通過在I-CreI N75第44、68和70位或者I-CreI S70第44、68、75和77位突變，預(yù)先得到了能夠切割5TTT_P和5GGG_P標(biāo)靶的突變體(圖7)。通過在I-CreI N75第28、30、38或者30、33、38位突變，在I-CreI S70 N75第28、33、38和40及70位突變，或者在I-CreI D75或N75上選自28、30、32、33、38和40的兩個位置突變，得到了能夠切割10TGC_P、10GGG_P、和10TGA_P標(biāo)靶的突變體(實施例1和圖6)。如此，組合這樣一對突變體將可以用于切割Xx.3標(biāo)靶。
一些組的蛋白質(zhì)兩個都在第70位突變。然而，可以假定，兩個可分離的功能性亞結(jié)構(gòu)域存在于I-CreI。這就暗示，該位置對標(biāo)靶第10至8位堿基的特異性沒有多少影響。
因此，為核對組合突變體是否可以切割Xa.3和Xb.3標(biāo)靶，將可切割標(biāo)靶(5TTT_P和5GGG_P標(biāo)靶)的5NNN區(qū)域的蛋白質(zhì)第44、68、70和/或75位的突變與可切割標(biāo)靶(10TGC_P和10GGG_P標(biāo)靶)的10NNN區(qū)域的蛋白質(zhì)第28、30、32、33、38和/或40位的突變結(jié)合起來，如圖24A所示。
與C1221第±3～5位相同的Xc.3應(yīng)當(dāng)可以被預(yù)先識別出的可切割10GAG_P標(biāo)靶的突變體切割(沒有突變組合)。
A)材料和方法 a)標(biāo)靶載體的構(gòu)造按如下方法克隆C1221衍生標(biāo)靶相當(dāng)于通路克隆序列作為其側(cè)翼的靶序列的低聚核苷酸購自Proligo公司(如同實施例 5’-tggcatacaagtttctgccttttgtacaaaaggcagacaatcgtctgtca-3′(SEQ ID NO42，對應(yīng)于Xa.3標(biāo)靶)。使用網(wǎng)間連接協(xié)議(INVITROGEN公司)，將通過單鏈低聚核苷酸的PCR擴增產(chǎn)生的雙鏈標(biāo)靶DNA克隆入酵母報告載體(pCLS1055，圖10)。將酵母報告載體轉(zhuǎn)化進入釀酒酵母菌株FYBL2-7B(MATα，ura3Δ851，trp1Δ63，leu2Δ1，lys2Δ202)。
b)組合突變體的構(gòu)造如實施例1、圖6、Arnould等(Arnould et al.，J.Mol.Biol.，2006，355，443-458，圖7)所述，分別用于10TGC_P、10GGG_P和5TTT_P、5GGG_P標(biāo)靶的可切割10TGC_P、10GGG_P、5TTT_P或5GGG_P的I-CreI突變體被識別出。為了產(chǎn)生包含兩個系列突變的I-CreI衍生編碼序列，進行單獨的重疊PCR反應(yīng)，其擴增I-CreI編碼序列的5′末端(第1-43位氨基酸)或者該3′末端(第39-167位)。對于兩個末端5′和3′端，使用對載體Gal10F或Gal10R特異的引物(pCLS0542，圖11)、以及對編碼第39-43位氨基酸的I-CreI編碼序列特異的引物(assF5’-ctannnttgaccttt-3’(SEQ ID NO43)或者assR5’-aaaggtcaannntag-3’(SEQ ID NO44))，進行PCR擴增，其中nnn編碼第40位殘基。得到的PCR產(chǎn)物包含彼此同源的15bp的、與基于2MICRON的復(fù)制型載體同源的近似的100-200bp、用LEU2基因標(biāo)記的pCLS0542、包含卡那霉素抗性基因的pCLS1107。
這樣，為在酵母內(nèi)通過體內(nèi)同源重組產(chǎn)生完整的編碼序列，使用高效LiAc轉(zhuǎn)化方案(Gietz、R.D.和R.A.Woods，Methods Enzymol.，2002，350，87-96)，將大約25ng兩種重疊PCR片段的每一個、25ng通過NcoI和EagI消化而線性化的pCLS0542載體DNA或者25ng通過用DraIII和NgoMIV消化而線性化的pCLS1107載體DNA，用于轉(zhuǎn)化酵母--釀酒酵母菌株FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)。優(yōu)選組合突變體可以作為文庫產(chǎn)生以克分子含量蓄積PCR反應(yīng)產(chǎn)物，并且與線性化質(zhì)粒一起轉(zhuǎn)化進入酵母。在缺乏亮氨酸的合成培養(yǎng)基(pCLS0542)上，或在包含G418的富集培養(yǎng)基(pCLS1107)上挑選轉(zhuǎn)化體。使用菌落挑取器(QpixII，Genetix)挑取菌落，并且在96個孔板上培養(yǎng)。
c)大范圍核酸酶表達克隆的配對和在酵母中的篩選按照在實施例1中描述的方法進行該實驗，不同的是使用低網(wǎng)格密度(約4個斑點/cm2)。
c)突變體的測序為了回收突變體表達質(zhì)粒，使用標(biāo)準(zhǔn)方案提取酵母DNA并用于轉(zhuǎn)化大腸桿菌。然后由MILLEGEN SA在質(zhì)粒上進行突變體ORF的測序。作為另一種選擇，使用購自PROLIGO公司的引物5’-ggggacaagtttgtacaaaaaagcaggcttcgaaggagatagaaccatggccaataccaaatataacaaagagttcc-3′(SEQ ID NO225) 和5’-ggggaccactttgtacaagaaagctgggtttagtcggccgccggggaggatttcttcttctcgc-3′(SEQ IDNO226)，在菌落的酵母DNA提取物上，通過PCR擴增在酵母內(nèi)初級篩選期間識別出的陽性克隆ORFs(Akada et al，Biotechniques，2000，28(4)668-70，672，674)，并且通過MILLEGEN在PCR產(chǎn)物上直接進行測序。然后將PCR產(chǎn)物克隆入(i)包埋有半乳糖誘導(dǎo)性啟動子、作為選擇性標(biāo)記的LEU2或KanR、和復(fù)制型載體的2MICRON起始點的酵母通路表達載體；或者克隆入(ii)購自INVITROGEN公司的CHO通路表達載體pcDNA6.2。通過測序(MILLEGEN)檢驗得到的克隆。
B)結(jié)果對切割10TGC_P(ctgcacgtcgt_P)標(biāo)靶的I-CreI N75突變體和切割5TTT_P(caaaactttgt_P)標(biāo)靶的I-CreI N75(Q44，R68，R70)突變體進行組合，最終篩選出針對Xa.3標(biāo)靶(ctgccttttgt_P)的組合突變體。
對切割10GGG_P標(biāo)靶的I-CreI N75突變體和切割5GGG_P標(biāo)靶的I-CreI N75突變體進行組合，最終篩選出針對Xb.3標(biāo)靶的組合突變體。
篩選出各個文庫的至少兩倍多樣性。沒有觀察到在被識別的活性突變體數(shù)量和測試的組合數(shù)之間的相關(guān)性。
Xc.3靶序列包含在第±5、±4和±3位為GTC的野生型序列；因此對于產(chǎn)生對該標(biāo)靶特異的變體，組合方法并非是必需的。直接篩選出針對Xc.3DNA標(biāo)靶的預(yù)先識別出對堿基±10、±9和±8具有改變的底物特異性的I-CreI變體。
表XVI針對回文標(biāo)靶Xx.3的用于組合構(gòu)造的突變體
na沒有可用的 *僅篩選對第±10、±9和±8位核苷酸具有改變的特異性的I-CreI變體。
發(fā)現(xiàn)有八個組合突變體可切割Xa.3標(biāo)靶(表XVI)。切割Xa.3標(biāo)靶的兩個突變體具有下述序列 -I-CreI K28，N30，S33，R38，S40，S70和N75(稱為KNSRSSN)，其通過I-CreI K28，N30，S33，R38，S40和I-CreI S70，N75的組合而得到，以及 -I-CreI A28，N30，S33，R38，K40，S70和N75(稱為ANSRKSN)，其通過I-CreI K28，N30，S33，R38，K40和I-CreI S70，N75的組合而得到。
發(fā)現(xiàn)有三十個組合突變體可切割Xb.3標(biāo)靶(表XVI)。
在被測試的切割10GAG_P標(biāo)靶的突變體中，發(fā)現(xiàn)有二十一個可切割Xc.3標(biāo)靶(表XVI)。
在二級篩選中證實了該結(jié)果(圖12)，并且通過測序證實了預(yù)計的氨基酸一級結(jié)構(gòu)。
實施例4制備切割Xx.4的大范圍核酸酶該實施例顯示，I-CreI變體可以以回文形式切割Xx.2標(biāo)靶的右側(cè)部衍生來的Xx.4DNA靶序列(圖9和23)。該實施例描述的所有靶序列皆是22bp回文序列。因此，僅僅描述它們的頭11個核苷酸，其后面有后綴_P；例如，Xa.4將被稱為taggatcctgt_P(SEQ ID NO37)。
Xa.4類似于5CCT_P在位置±1、±2、±3、±4、±5和±7處的5CCT_P，并且類似于在位置±1、±2、±7、±8、±9和±10處的10AGG_P?？梢约俣?，第±6和±11位對結(jié)合性和切割活性幾乎沒有影響。
Xb.4類似于在位置±1、±2、±3、±4、±5、±6和±11處的5TAC_P，并且類似于在位置±1、±2、±6、±8、±9、±10和±11處的10TGT_P。可以假定，第±7位對結(jié)合和切割活性幾乎沒有影響。
Xc.4類似于在位置±1、±2、±3、±4、±5、±7和±11處的5TCT_P，并且類似于在位置±1、±2、±7、±8、±9、±10和±11處的10GTA_P?？梢约俣?，第±6位對結(jié)合性和切割活性幾乎沒有影響。
按Arnould等所述(Arnould et al.，J.Mol.Biol.，2006，355，443-458，(圖7))，通過在I-CreI N75第44、68和70位或者I-CreI S70第44、68、75和77位突變，預(yù)先得到了能夠切割5CCT_P、5TAC_P和5TCT_P標(biāo)靶的突變體。通過在I-CreI N75第28、30、38或者30、33、38位突變，在I-CreI S70 N75第28、33、38和40及70位突變，或者在I-CreI D75或N75上選自28、30、32、33、38和40的兩個位置突變，得到了能夠切割10AGG_P、10TGT_P、和10GTA_P標(biāo)靶的突變體(實施例1和圖6)。如此，組合這樣一對突變體將使得可以用于切割Xx.4標(biāo)靶。
一些組的蛋白質(zhì)兩個都在第70位突變。然而，可以假定，I-CreI包含兩個可分離的功能性亞結(jié)構(gòu)域。這就暗示，該位置對標(biāo)靶第10至8位堿基的特異性幾乎沒有影響。
因此，為核對組合突變體是否可以切割Xx.4標(biāo)靶，將可切割5CCT_P、5TAC_P和5TCT_P標(biāo)靶的蛋白質(zhì)第44、68、70和/或75位的突變與可切割10AGG_P、10TGT_P和10GTA_P標(biāo)靶的蛋白質(zhì)第28、30、32、33、38和/或40位的突變結(jié)合起來，如圖24A所示。
A)材料和方法參見實施例3。
B)結(jié)果通過在I-CreI N75支架上第44、68和70位突變與第28、30、33、38和40位突變相結(jié)合，構(gòu)造出I-CreI組合突變體。篩選針對該Xx.4DNA標(biāo)靶的組合突變體。篩選出各個文庫的至少兩倍多樣性。沒有觀察到在被識別的活性突變體數(shù)量和測試的組合數(shù)之間的相關(guān)性。百分之二的雜交突變體表現(xiàn)出對于Xb.4 DNA標(biāo)靶的功能性，同時多達55％具有針對Xa.4的活性。在二級篩選并測序后，對于Xa.4、Xb.4和Xc.4標(biāo)靶，分別識別出104個、8個和4個不同的切割酶(表XVII)。
表XVII針對回文標(biāo)靶Xx.4的用于組合構(gòu)造的突變體
na沒有可用的 *僅篩選出對第10、9和8位核苷酸具有改變的特異性的I-CreI變體。
可切割10AGG_P(caggacgtcgt_P；SEQ ID NO32)標(biāo)靶的I-CreI N75突變體(顯示了在第28、30、33、38和40位的氨基酸)和可切割5CCT_P(caaaaccctgt_P；SEQ ID NO34)標(biāo)靶的I-CreI N75突變體(顯示了在第44、68和70位的氨基酸)被列舉在表XVIII中。在圖13和表XVIII中顯示了104個陽性中的39個。
XVIII通過組合變體切割Xa.4標(biāo)靶＊
+功能性組合。
* 所有的蛋白質(zhì)還具有D75N突變。
實施例5切割Xx.2和Xx.1.1的大范圍核酸酶的制備在實施例3和4中識別出能夠切割每一個回文Xx.2衍生的標(biāo)靶Xx.3和Xx.4的I-CreI突變體。在酵母中共表達了這樣一對突變體(一個切割Xx.3，而一個切割Xx.4)的子集。進行共表達時，將有三個活性分子種類、兩個同型二聚體、和一個異二聚體。分析了將要形成的異二聚體是否能夠切割圖24A中描述的Xx.1和Xx.2標(biāo)靶。
A)材料和方法 a)在卡那霉素抗性載體中的突變體克隆為了在酵母中共表達兩種I-CreI突變體，將切割Xx.3序列的突變體亞克隆于卡那霉素抗性酵母表達載體(pCLS1107，圖14)內(nèi)。
使用通常用于亮氨酸載體(pCLS0542)和卡那霉素載體(pCLS1107)的引物(Gal10F和Gal10R)，通過PCR反應(yīng)擴增突變體。使用高效LiAc轉(zhuǎn)化方案，將大約25ng的PCR片段和25ng通過用DraIII和NgoMIV消化而線性化的載體DNA(pCLS1107)用于轉(zhuǎn)化酵母菌株Saccharomyces cerevisiae FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)。通過在酵母中體內(nèi)同源重組，產(chǎn)生用于I-CreI突變體的完整編碼序列。
b)突變體共表達用位于pCLS1107表達載體上編碼可切割Xx.3標(biāo)靶的突變體的DNA來轉(zhuǎn)化用于表達可切割Xx.4標(biāo)靶的突變體的酵母菌株。在-L Glu+G418培養(yǎng)基上挑選轉(zhuǎn)化體。
c)大范圍核酸酶共表達克隆的配對和在酵母中的篩選按照在實施例1中描述的方法進行該實驗，不同的是使用低網(wǎng)格密度(約4個斑點/cm2)。
B)結(jié)果表XIX總結(jié)了總數(shù)和在酵母中共表達的針對標(biāo)靶Xx.2和Xx.1的被測活性異二聚體。
表XIX針對各個XPC標(biāo)靶的用于異二聚體分析的突變體
在所有情況下，識別出對標(biāo)靶2具有切割活性的異二聚體(圖15a、15b和24B)。所有受測的異二聚體具有針對Xc.2的活性，同時分別有75％和45％能夠切割Xa.2和Xb.2標(biāo)靶。另一方面，雖然分別在Xa.1、Xb.1和Xc.1標(biāo)靶中發(fā)現(xiàn)的4種中心部核苷酸序列TTGA、GAAA和ACAC在被插入I-CreI C1221回文標(biāo)靶時不會影響I-CreI切割活性，但僅有針對Xa.2和Xc.2的活性異二聚體的子部分能夠分別切割Xa.1和Xc.1標(biāo)靶，同時沒有發(fā)現(xiàn)切割Xb.1標(biāo)靶的切割酶(圖15a，15b和24B)。通過其特別的拓撲學(xué)，已經(jīng)解釋了中心部序列的影響。結(jié)構(gòu)分析顯示，該標(biāo)靶的DNA區(qū)域是一個最大的DNA彎曲區(qū)域，其彎曲率約為50°，導(dǎo)致堿基扭轉(zhuǎn)和在易切斷磷酸基附近無堆積(Chevalier et a.，J.Mol.Biol.，2003，329，253-269)。然而，用于解釋為什么在四個中心位置處某些序列與切割活性及其它一些序列是相容的精確機制仍未見描述。
在表XX和XXI中顯示了對Xa.1標(biāo)靶的功能性組合的實施例。作為一般規(guī)則，當(dāng)兩個表達的蛋白質(zhì)作為同型二聚體發(fā)出強信號時，總是得到可切割Xx.1序列的功能性異二聚體。另外，雖然許多突變體仍然具有非常強的針對Xc.1的活性，但能夠切割Xa.1標(biāo)靶的突變體顯示出弱活性。
表XX當(dāng)用KNSRSS表達時導(dǎo)致Xa.2標(biāo)靶(+)或Xa.2和Xa.1(++)標(biāo)靶的切割的組合
表XXI當(dāng)用ANSRKS表達時導(dǎo)致Xa.2標(biāo)靶(+)或Xa.2和Xa.1(++)標(biāo)靶的切割的組合
實施例6大范圍核酸酶切割活性的優(yōu)化 A)材料和方法活性提高將易錯PCR用于在含4種被選突變體的池中導(dǎo)入隨機突變。通過使用Mn2+的PCR、或者按照來自耶拿生物科學(xué)有限公司(JENA BIOSCIENCE GmbH)的JBS dNTP突變誘發(fā)試劑盒方案的描述而通過使用dNTPs衍生物8-氧代-dGTP和dPTP的兩步處理法，來產(chǎn)生篩選文庫。使用的引物是preATGCreFor(5′-gcataaattactatacttctatagacacgcaaacacaaatacacagcggccttgccacc-3′，SEQ ID NO227)和ICreIpostRev(5′-ggctcgaggagctcgtctagaggatcgctcgagttatcagtcggccgc-3′，SEQ ID NO228)。對于第一輪的活性提高，在酵母中將新的文庫在體內(nèi)克隆入線性化卡那霉素載體(pCLS1107，圖14)，所述載體包埋有半乳糖誘導(dǎo)性啟動子、作為選擇性標(biāo)記的KanR和復(fù)制型載體的2MICRON起始點。對于第二輪的提高活性，使用被LEU2基因標(biāo)記的基于2MICRON的復(fù)制型載體。通過測序(MILLEGEN)檢驗得到的陽性克隆。
B)結(jié)果因為，在該標(biāo)靶2和標(biāo)靶1之間切割活性的下降(圖24B)可能是偏向在構(gòu)造大范圍核酸酶的加工期間導(dǎo)入的4個中心部核苷酸gtac的結(jié)果，故可以假設(shè)隨后可以通過代償性突變提高較弱的活性。圖25描繪了該策略的一般工作流程，其用于改進蛋白質(zhì)活性。切割活性的優(yōu)化工藝分兩個步驟進行。首先，在識別對于靶序列Xa.1的功能性異二聚體后，通過易錯PCR，對通過針對Xa.4標(biāo)靶(突變體4)的篩選而最初識別的2～4個單體的池進行誘變處理，同時其對應(yīng)物(例如通過針對Xa.3標(biāo)靶的篩選而識別的突變體)保持未改性。然后在酵母中轉(zhuǎn)化誘變的文庫，并且通過與包含標(biāo)靶Xa.1和未誘變的突變體(在該情況下對Xa.3有活性)的酵母菌株配對來進行篩選。通常測試大約2300個克隆，因為這一數(shù)量的克隆足夠發(fā)現(xiàn)活性提高的突變體。一旦識別出提高活性的組合，就重復(fù)相同的工序，從而優(yōu)化與Xa.3標(biāo)靶互相作用的突變體(突變體3)。在易錯PCR后，通過與包含標(biāo)靶和預(yù)先識別的改良突變體的酵母配對，篩選針對Xa.1標(biāo)靶的文庫。在工序的末尾，得到了蛋白質(zhì)異二聚體，其中已經(jīng)優(yōu)化了兩個單體，用于針對一個靶序列的被限定的蛋白質(zhì)組合。最后，在如圖26A所示的交叉實驗(在單體改良后得到的針對標(biāo)靶Xa.1的異二聚體子集在酵母中的切割活性實施例)中，確認了該改良的變體。針對Xa.1標(biāo)靶，將五個切割Xa.4的改良突變體和6個切割Xa.3的改良突變體與2個和8個分別切割Xa.3和Xa.4的改良突變體相結(jié)合進行了測試。將用于易錯PCR的初始突變體并入本實驗作為對照。如在對包含僅切割Xa.3或Xa.4的突變體的酵母克隆配對后得到的白色菌落所示，沒有檢測到單獨的同型二聚體針對標(biāo)靶Xa.1的活性。相反，當(dāng)在包含其切割活性產(chǎn)生于異二聚體構(gòu)造兩種突變種的酵母克隆之間發(fā)生配對時，可以顯現(xiàn)出較強的切割活性。另外，同僅一個單體活性已經(jīng)提高的異二聚體所獲得的活性相比，當(dāng)兩個單體已經(jīng)優(yōu)化時，獲得最強的活性。
挑選出產(chǎn)生最強切割活性的6個組合，并且對ORFs測序。有趣的是，6種最具活性的異二聚體由3種單獨的切割Xa.3的突變體與2種不同的切割Xa.4的突變體的6種不同的組合產(chǎn)生。圖26B顯示了用于改良工藝的初始蛋白質(zhì)序列(I1-I4)和它們各自優(yōu)化的蛋白質(zhì)(M1-M5)。通過共表達分析，圖26B中I5和I6序列是對Xc.1標(biāo)靶產(chǎn)生最佳活性的2種單體的蛋白質(zhì)序列。因為可以高效率切割標(biāo)靶，故并非必須進一步改善活性。
最好的切割酶的蛋白質(zhì)序列分析未顯示任何受突變過程影響的特別的蛋白質(zhì)結(jié)構(gòu)域。和原始序列相比，易錯PCR在切割Xa.3標(biāo)靶的活性突變體的ORF第19、69和87位導(dǎo)入了突變，并且在切割Xa.4標(biāo)靶的突變體編碼序列第32、85和109位導(dǎo)入了突變。在M2和M5蛋白質(zhì)的蛋白質(zhì)序列中，第33和38位還被還原。有趣的是，在所有對Xa.3標(biāo)靶具有活性的蛋白質(zhì)中，第19位氨基酸都發(fā)生了突變。該位置是催化部位(Chevalier et al.，Biochemistry，2004，43，14015-14026)并且具有鄰接的Asp20，與金屬陽離子結(jié)合有關(guān)。這就是僅有的可以直接與催化機理的改進相聯(lián)系的突變。在位置32和69處的突變影響到蛋白質(zhì)-DNA界面，并且在位置85和87處的突變影響疏水核心。其他的突變主要影響核心蛋白質(zhì)，該核心蛋白質(zhì)顯示了擴展的構(gòu)造變化機制導(dǎo)致活性提高。例如，該長遠影響可以提高突變體的結(jié)合親合力，并且因此提高其切割活性。
這些結(jié)果表明，與隨機突變相關(guān)的組合方法使得專門設(shè)計的對DNA底物特異的內(nèi)切核酸酶可以快速并有效率地產(chǎn)生。
實施例7異二聚體大范圍核酸酶在哺乳動物細胞中具有功能 A)材料和方法哺乳動物細胞分析根據(jù)供應(yīng)商(QIAGEN公司)的方案，用

轉(zhuǎn)染試劑轉(zhuǎn)染CHO細胞。在轉(zhuǎn)染72小時后，除去培養(yǎng)基，并且添加150mL的溶菌液/顯色緩沖液，用于β-半乳糖苷酶液體分析(1升的緩沖液包含100mL的溶菌緩沖液(Tris-HCl 10mM，pH7.5，NaCl 150mM，Tritonx 1000.1％，BSA 0.1mg/ml，蛋白酶抑制劑)，10mL的Mg 100x緩沖液(MgCl2 100mM，β-巰基乙醇35％)，110m LONPG(8mg/ml)，和780mL的pH7.5的磷酸鈉0.1M)。在37℃下孵育后，于420nm處測量OD。整個過程在自動Velocityll BioCel平臺上進行。
B)結(jié)果通過瞬時共轉(zhuǎn)染具有標(biāo)靶載體和大范圍核酸酶表達載體的CHO細胞，在哺乳動物細胞中測試了酵母中的雜交大范圍核酸酶活性。為此目的，將突變體子集和它們的相應(yīng)標(biāo)靶(Xa.1和Xc.1)克隆入如在實施例1中描述的適當(dāng)?shù)妮d體，并且通過標(biāo)準(zhǔn)的在先描述的監(jiān)測功能性的β-半乳糖苷酶基因恢復(fù)的定量ONPG分析法(International PCT Application WO 2006/097853；Arnould et al.，J.Mol.Biol.，2006，355，443-458；Smithetal.，Nucleic Acids Res.，Epub 27november 2006)，測量大范圍核酸酶誘導(dǎo)的重組效率。圖27顯示了在CHO-K1細胞中的對酵母中識別的主要活性雜化蛋白的切割活性。所有標(biāo)靶質(zhì)粒皆攜帶有18bp作為內(nèi)部對照的最小I-SceI位點；因此所有突變體可以與在相同實驗條件下的I-SceI活性相比較。該18bp的I-SceI位點被I-SceI蛋白質(zhì)較弱地切割，并且被挑選以便避免在CHO細胞中該信號的飽和。當(dāng)表達單一蛋白質(zhì)時，根據(jù)它們的背景活性水平判斷，檢測不到切割活性，(圖27；

至

和

至

)，這表明該活性取決于異二聚體構(gòu)造。另外，初始組合突變體的共表達(I1，I3)具有非常弱的幾乎不能與背景水平區(qū)別開來的活性。一旦蛋白質(zhì)對之一得到提高，該切割活性就增加。最后，通過共表達2種改進的蛋白質(zhì)，取得了對于Xa.1標(biāo)靶最有效率的切割活性，并且達到類似于突變體識別Xc.1標(biāo)靶活性的活性水平。這些結(jié)果證實了在酵母中得到的數(shù)據(jù)，其中初始組合突變體的共表達會導(dǎo)致不需要提高活性就可有效切割Xc.1標(biāo)靶，雖然突變體針對Xa.1具有很弱的活性。然而在導(dǎo)入代償性突變以后，可以產(chǎn)生對于Xa.1標(biāo)靶的高活性。如圖27所示，當(dāng)單體自身被表達時，可以檢測到既無毒性也不切割，表明針對Xa和Xc而設(shè)計的突變體保持了I-CreI尋靶內(nèi)切核酸酶的初始特異性或者至少與殘存細胞相容的特異性。
實施例8個別突變的標(biāo)靶切割模式的分析使用體外位點選擇，已經(jīng)預(yù)先對I-CreI標(biāo)靶個別位置的簡并性進行了分析，其中可被wtI-CreI分割的變體DNA標(biāo)靶可被回收(Argast et al.，J.Mol.Biol.，1998，280，345-353)。研究表明，在該位點的大部分核苷酸位置可以被突變而不損失結(jié)合性或切割性。然而尚未做窮盡的研究。為了將針對Xa.1標(biāo)靶改進的突變體與I-CreI尋靶內(nèi)切核酸酶進行比較，我們已經(jīng)生產(chǎn)了所有可能的攜帶有針對Xa.3、Xa.4和回文I-CreI標(biāo)靶C1221產(chǎn)生的個別突變的標(biāo)靶。用于產(chǎn)生所有突變體的蛋白質(zhì)支架在位置75處攜帶有D至N的突變。該突變被導(dǎo)入，以便減少因文庫中在第68和70位基本殘基的置換而導(dǎo)致的有活力的菌株。在前研究顯示，D75N突變降低了體外表達的I-CreI蛋白質(zhì)的毒性，并且不影響該蛋白質(zhì)基本的折疊性能和活性(Arnould et al.，J.Mol.Biol.，2006，355，443-458)。通過測量它們在酵母中對它們各自的攜帶個別位點突變的回文標(biāo)靶(C1221、Xa.3和Xa.4)的切割效率，對野生型I-CreI(wtI-CreI)、初始蛋白質(zhì)支架I-CreI(N75)和組合突變體的識別堿基對簡并性的程度進行了分析。
I-CreI D75(wt)和I-CreIN75 如圖28A所示，野生型蛋白質(zhì)(I-CreI-D75)在其回文標(biāo)靶上可以容納許多個別的突變(各個核苷酸字體大小與切割效率成正比)。該第±11、±8、±2和±1位是最有容納性的位置，因為在這些位置的4種核苷酸不影響切割效率。相反，在位置±9和±3處只允許非常少的變化。在比較中，用于產(chǎn)生突變體的I-CreI支架(I-CreI-N75)顯示出的不同模式并且似乎是較少能容忍在其標(biāo)靶上的點突變。最嚴格的差異可在位置±1、±3、±10和±11處看出。允許標(biāo)靶切割的僅有堿基是±1T、+9A和±10A，而在位置±11處，G和A通過I-CreI(N75)蛋白質(zhì)抑制了標(biāo)靶的切割。對于wtI-CreI和I-CreI(N75)二者，分別在位置±7和±6處的C或A以及T或C允許最大的切割效率?？傊瑆tI-CreI和I-CreI(N75)分別切割26個和14個攜帶單一突變的標(biāo)靶?；谠摂?shù)據(jù)，并且如果假定各一半標(biāo)靶可以對全部切割效率具有單獨的影響，那么wtI-CreI將能切割具有個別突變的1156(34×34)種非回文標(biāo)靶中的最大量676(26×26)種，而I-CreI N75僅切割196(14×14)種?？赡艿?，在研究中觀察到的I-CreI(N75)受限模式可以解釋為何這種I-CreI變體沒有毒性。如早期研究所揭示的(Chevalier et al.，J.Mol.Biol.，2003，329，253-269；Seligman et al.，Genetics，1997，147，1353-1664)，個別核苷酸多形性的寬容性允許I-CreI(D75)識別限定的標(biāo)靶群體，并且促進在進化過程中內(nèi)含子的重復(fù)水平傳遞。
切割Xa.3和Xa.4標(biāo)靶的組合突變體圖28B顯示了用最好的組合突變體切割Xa.3和Xa.4標(biāo)靶所得到的結(jié)果。與切割Xa.3標(biāo)靶的突變體相比，切割Xa.4標(biāo)靶的突變體對它們各自的標(biāo)靶上的個別突變，更具寬容性。組合的Xa.4突變體能夠切割24種回文標(biāo)靶，其中20種被強烈切割。Xa.4突變體容許的單堿基置換的模式非常類似于wtI-CreI對于其自己的標(biāo)靶默認的置換。相反，針對Xa.3標(biāo)靶專門設(shè)計的變體顯示出對個別突變具有最高的限制，僅有3種回文標(biāo)靶可被很好地切割。該突變體僅能夠切割34種回文標(biāo)靶中的8種(其中4種被有效地切割)。除可以容許G和T的第±5位之外，僅對已經(jīng)選出的標(biāo)靶可實現(xiàn)有效的切割。因為被測試的突變體都未顯示出比wtI-CreI天然蛋白質(zhì)更大的簡并性，故這些數(shù)據(jù)證明，該用于產(chǎn)生突變體的組合方法導(dǎo)致底物特異性的變化，而不是簡單的使蛋白質(zhì)對其標(biāo)靶的特異性衰減。另外，組合突變體已經(jīng)對照親本序列及初始I-CreI標(biāo)靶序列進行核對，并且被測試的蛋白質(zhì)都不切割這些標(biāo)靶?？傊?，設(shè)計得切割Xa.1標(biāo)靶的異二聚體將能切割1156種具有個別突變的非回文標(biāo)靶中的最大量的192種(8×24)。
序列表
<110>賽萊提斯
西爾萬.阿爾努
克里斯托夫.佩雷.米紹
朱莉安娜.斯米特
<120>切割來自著色性干皮病基因的DNA靶序列的大范圍核酸酶變體及其應(yīng)用
<130>HLPcp1546/11
<160>228
<170>PatentIn version 3.3
<210>1
<211>22
<212>DNA
<213>人工序列
<220>
<223>22pb靶序列
<400>1
<210>2
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>2
<210>3
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>3
<210>4
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>4
<210>5
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>5
<210>6
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>6
<210>7
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>7
<210>8
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>8
<210>9
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>9
<210>10
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>10
<210>11
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>11
<210>12
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>12
<210>13
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>13
<210>14
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>14
<210>15
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>15
<210>16
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>16
<210>17
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>17
<210>18
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>18
<210>19
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>19
<210>20
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>20
<210>21
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>21
<210>22
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>22
<210>23
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>23
<210>24
<211>22
<212>DNA
<213>人工序列
<220>
<223>Xa.1標(biāo)靶
<400>24
<210>25
<211>24
<212>DNA
<213>人工序列
<220>
<223>C1221 I-CreI位點
<400>25
<210>26
<211>501
<212>DNA
<213>人工序列
<220>
<223>ADNc I-CreI N75支架蛋白
<400>26
<210>27
<211>68
<212>DNA
<213>人工序列
<220>
<223>引物Ulib4rev
<400>27
<210>28
<211>68
<212>DNA
<213>人工序列
<220>
<223>引物U1ib5rev
<400>28
<210>29
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物U1ib456for
<400>29
<210>30
<211>24
<212>DNA
<213>人工序列
<220>
<223>DNA標(biāo)靶
<400>30
<210>31
<211>24
<212>DNA
<213>人工序列
<220>
<223>10TGC_P標(biāo)靶
<400>31
<210>32
<211>24
<212>DNA
<213>人工序列
<220>
<223>10AGC_P標(biāo)靶
<400>32
<210>33
<211>24
<212>DNA
<213>人工序列
<220>
<223>5TTT_P標(biāo)靶
<400>33
<210>34
<211>24
<212>DNA
<213>人工序列
<220>
<223>5CCT_P標(biāo)靶
<400>34
<210>35
<211>22
<212>DNA
<213>人工序列
<220>
<223>Xa.2標(biāo)靶
<400>35
<210>36
<211>22
<212>DNA
<213>人工序列
<220>
<223>Xa.3標(biāo)靶
<400>36
<210>37
<211>22
<212>DNA
<213>人工序列
<220>
<223>Xa.4標(biāo)靶
<400>37
<210>38
<211>24
<212>DNA
<213>人工序列
<220>
<223>Natural I-CreI位點
<400>38
<210>39
<211>49
<212>DNA
<213>人工序列
<220>
<223>Oligonucleotide
<220>
<221>misc_feature
<222>(15)..(17)
<223>n＝a，g，c or t
<220>
<221>misc_feature
<222>(32)..(34)
<223>n＝a，g，c or t
<400>39
<210>40
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物Gal10F
<400>40
<210>41
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物Gal10R
<400>41
<210>42
<211>50
<212>DNA
<213>人工序列
<220>
<223>Oligo
<400>42
<210>43
<211>15
<212>DNA
<213>人工序列
<220>
<223>引物assF
<220>
<221>misc_feature
<222>(4)..(6)
<223>nnn code for residue 40 of the I-CreIcoding sequence
<400>43
<210>44
<211>15
<212>DNA
<213>人工序列
<220>
<223>引物assR
<220>
<221>misc_feature
<222>(10)..(12)
<223>nnn code for the residue 40 of the I-CreI coding sequence
<400>44
<210>45
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>45
<210>46
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>46
<210>47
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>47
<210>48
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>48
<210>49
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>49
<210>50
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>50
<210>51
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>51
<210>52
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>52
<210>53
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>53
<210>54
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>54
<210>55
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>55
<210>56
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>56
<210>57
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>57
<210>58
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>58
<210>59
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>59
<210>60
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>60
<210>61
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>61
<210>62
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>62
<210>63
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>63
<210>64
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>64
<210>65
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>65
<210>66
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>66
<210>67
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>67
<210>68
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>68
<210>69
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>69
<210>70
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>70
<210>71
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>71
<210>72
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>72
<210>73
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>73
<210>74
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>74
<210>75
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>75
<210>76
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>76
<210>77
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>77
<210>78
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>78
<210>79
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>79
<210>80
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>80
<210>81
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>81
<210>82
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>82
<210>83
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>83
<210>84
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>84
<210>85
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>85
<210>86
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>86
<210>87
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>87
<210>88
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>88
<210>89
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>89
<210>90
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>90
<210>91
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>91
<210>92
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>92
<210>93
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>93
<210>94
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>94
<210>95
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>95
<210>96
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>96
<210>97
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>97
<210>98
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>98
<210>99
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>99
<210>100
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>100
<210>101
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>101
<210>102
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>102
<210>103
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>103
<210>104
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>104
<210>105
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>105
<210>106
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>106
<210>107
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>107
<210>108
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>108
<210>109
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>109
<210>110
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>110
<210>111
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>111
<210>112
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>112
<210>113
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>113
<210>114
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>114
<210>115
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>115
<210>116
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>116
<210>117
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>117
<210>118
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>118
<210>119
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>119
<210>120
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>120
<210>121
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>121
<210>122
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>122
<210>123
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>123
<210>124
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>124
<210>125
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>125
<210>126
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>126
<210>127
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>127
<210>128
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>128
<210>129
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>129
<210>130
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>130
<210>131
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>131
<210>132
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>132
<210>133
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>133
<210>134
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>134
<210>135
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>135
<210>136
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>136
<210>137
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>137
<210>138
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>138
<210>139
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>139
<210>140
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>140
<210>141
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>141
<210>142
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>142
<210>143
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>143
<210>144
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>144
<210>145
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>145
<210>146
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>146
<210>147
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>147
<210>148
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>148
<210>149
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>149
<210>150
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>150
<210>151
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>151
<210>152
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>152
<210>153
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>153
<210>154
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>154
<210>155
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>155
<210>156
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>156
<210>157
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>157
<210>158
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>158
<210>159
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>159
<210>160
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>160
<210>161
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>161
<210>162
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>162
<210>163
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>163
<210>164
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>164
<210>165
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>165
<210>166
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>166
<210>167
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>167
<210>168
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>168
<210>169
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>169
<210>170
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>170
<210>171
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>171
<210>172
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>172
<210>173
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>173
<210>174
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>174
<210>175
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>175
<210>176
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>176
<210>177
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>177
<210>178
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>178
<210>179
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>179
<210>180
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>180
<210>181
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>181
<210>182
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>182
<210>183
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>183
<210>184
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>184
<210>185
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>185
<210>186
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>186
<210>187
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>187
<210>188
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>188
<210>189
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>189
<210>190
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>190
<210>191
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>191
<210>192
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>192
<210>193
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>193
<210>194
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>194
<210>195
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>195
<210>196
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>196
<210>197
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>197
<210>198
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>198
<210>199
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>199
<210>200
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>200
<210>201
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>201
<210>202
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>202
<210>203
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>203
<210>204
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>204
<210>205
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>205
<210>206
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>206
<210>207
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>207
<210>208
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>208
<210>209
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>209
<210>210
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>210
<210>211
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>211
<210>212
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>212
<210>213
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>213
<210>214
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>214
<210>215
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>215
<210>216
<211>22
<212>DNA
<213>人工序列
<220>
<223>22 pb靶序列
<400>216
<210>217
<211>163
<212>PRT
<213>Chlamydomonas reinhardtii
<400>217
<210>218
<211>167
<212>PRT
<213>人工序列
<220>
<223>I-CreI N75支架蛋白
<400>218
<210>219
<211>22
<212>DNA
<213>人工序列
<220>
<223>Xb.2標(biāo)靶
<400>219
<210>220
<211>22
<212>DNA
<213>人工序列
<220>
<223>Xb.3標(biāo)靶
<400>220
<210>221
<211>22
<212>DNA
<213>人工序列
<220>
<223>Xb.4標(biāo)靶
<400>221
<210>222
<211>22
<212>DNA
<213>人工序列
<220>
<223>Xc.2標(biāo)靶
<400>222
<210>223
<211>22
<212>DNA
<213>人工序列
<220>
<223>Xc.3標(biāo)靶
<400>223
<210>224
<211>22
<212>DNA
<213>人工序列
<220>
<223>Xc.4標(biāo)靶
<400>224
<210>225
<211>77
<212>DNA
<213>人工序列
<220>
<223>引物
<400>225
<210>226
<211>64
<212>DNA
<213>人工序列
<220>
<223>引物
<400>226
<210>227
<211>59
<212>DNA
<213>人工序列
<220>
<223>引物
<400>227
<210>228
<211>48
<212>DNA
<213>人工序列
<220>
<223>引物
<400>228
權(quán)利要求
1.一種I-CreI變體，其特征在于，其具有至少兩種置換，分別位于I-CreI第26～40位和第44～77位的LAGLIDADG核心結(jié)構(gòu)域的兩個功能性亞結(jié)構(gòu)域中，所述變體能夠切割來自著色性干皮病基因的DNA靶序列，并且可通過至少包含下述步驟的方法獲得
(a)構(gòu)造第一系列的I-CreI變體，該第一系列具有至少一種位于I-CreI第26～40位的LAGLIDADG核心結(jié)構(gòu)域的第一功能性亞結(jié)構(gòu)域中的置換，
(b)構(gòu)造第二系列的I-CreI變體，該第二系列具有至少一種位于I-CreI第44～77位的LAGLIDADG核心結(jié)構(gòu)域的第二功能性亞結(jié)構(gòu)域中的置換，
(c)挑選和/或篩選來自步驟(a)的第一系列變體，其能夠切割突變體I-CreI位點，其中(i)在所述I-CreI位點中第-10～-8位的核苷酸三聯(lián)體已經(jīng)替換為存在于著色性干皮病基因上的基因組DNA標(biāo)靶第-10～-8位的核苷酸三聯(lián)體，并且(ii)第+8～+10位的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第-10～-8位的核苷酸三聯(lián)體反向互補序列，
(d)挑選和/或篩選來自步驟(b)的第二系列變體，其能夠切割突變體I-CreI位點，其中(i)在所述I-CreI位點第-5～-3位的核苷酸三聯(lián)體已經(jīng)替換為存在于步驟(c)中的所述基因組標(biāo)靶中第-5～-3位的核苷酸三聯(lián)體，并且(ii)第+3～+5位的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第-5～-3位的核苷酸三聯(lián)體反向互補序列，
(e)挑選和/或篩選來自步驟(a)的第一系列變體，其能夠切割突變體I-CreI位點，其中(i)所述I-CreI位點第+8～+10位的核苷酸三聯(lián)體已經(jīng)替換為存在于步驟(c)中的所述基因組標(biāo)靶中第+8～+10位的核苷酸三聯(lián)體，并且(ii)第-10～-8位的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第+8～+10位的核苷酸三聯(lián)體反向互補序列，
(f)挑選和/或篩選來自步驟(b)的第二系列變體，其能夠切割突變體I-CreI位點，其中(i)所述I-CreI位點第+3～+5位的核苷酸三聯(lián)體已經(jīng)替換為存在于步驟(c)中的所述基因組標(biāo)靶中第+3～+5位的核苷酸三聯(lián)體，并且(ii)第-5～-3位的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第+3～+5位的核苷酸三聯(lián)體反向互補序列，
(g)在單個變體中組合來自步驟(c)和步驟(d)的兩個變體的第28～40位和第44～70位的突變，以得到一種新穎的可切割序列的同型二聚體I-CreI變體，其中(i)在第-10～-8位的核苷酸三聯(lián)體與存在于步驟(c)中的所述基因組標(biāo)靶中第-10～-8位的核苷酸三聯(lián)體相同，(ii)第+8～+10位的核苷酸三聯(lián)體與存在于所述基因組標(biāo)靶中第-10～-8位的核苷酸三聯(lián)體的反向互補序列相同，(iii)第-5～-3位的核苷酸三聯(lián)體與存在于所述基因組標(biāo)靶中第-5～-3位的核苷酸三聯(lián)體相同，并且(iv)第+3～+5位的核苷酸三聯(lián)體與存在于所述基因組標(biāo)靶中第-5～-3位的核苷酸三聯(lián)體的反向互補序列相同，
(h)在單個變體中組合來自步驟(e)和步驟(f)的兩個變體的第28～40位和第44～70位的突變，以得到一種新穎的可切割序列的同型二聚體I-CreI變體，其中(i)在第+3～+5位的核苷酸三聯(lián)體與存在于步驟(c)中的所述基因組標(biāo)靶中第+3～+5位的核苷酸三聯(lián)體相同，(ii)在第-5～-3位的核苷酸三聯(lián)體與存在于所述基因組標(biāo)靶中第+3～+5位的核苷酸三聯(lián)體的反向互補序列相同，(iii)所述I-CreI位點的第+8～+10位的核苷酸三聯(lián)體已經(jīng)替換為存在于所述基因組標(biāo)靶中第+8～+10位的核苷酸三聯(lián)體，并且(iv)在第-10～-8位的核苷酸三聯(lián)體與所述基因組標(biāo)靶中第+8～+10位的核苷酸三聯(lián)體的反向互補序列相同，
(i)組合所述步驟(g)和(h)中得到的變體，形成異二聚體，以及
(j)挑選和/或篩選來自步驟(i)、能夠切割所述來自著色性干皮病基因的DNA靶序列的異二聚體。
2.如權(quán)利要求1所述的變體，其特征在于，位于I-CreI第44～77位的所述亞結(jié)構(gòu)域中的所述置換是在位置44、68、70、75和/或77處。
3.如權(quán)利要求1或2所述的變體，其特征在于，位于I-CreI第44～77位的所述亞結(jié)構(gòu)域中的所述置換是在第44～70位處。
4.如權(quán)利要求1所述的變體，其特征在于，位于I-CreI第26～40位的所述亞結(jié)構(gòu)域中的所述置換是在位置28、30、32、33、38和/或40處。
5.如權(quán)利要求1或4所述的變體，其特征在于，位于I-CreI第26～40位的所述亞結(jié)構(gòu)域中的所述置換是在第28～40位處。
6.如權(quán)利要求1至5中任一項所述的變體，其特征在于，所述置換是初始氨基酸用選自下組的氨基酸取代A、D、E、G、H、K、N、P、Q、R、S、T、Y、C、W、L和V。
7.如權(quán)利要求1至6中任一項所述的變體，其特征在于，所述變體包含在I-CreI的下述位置處的一種以上置換19、24、42、69、80、85、87、109、133和161。
8.根據(jù)如權(quán)利要求1至7中任一項所述的變體，其特征在于，所述變體包括第75位的天冬氨酸用中性氨基酸置換。
9.如權(quán)利要求8所述的變體，其特征在于，所述中性氨基酸是天門冬酰胺或纈氨酸殘基。
10.如權(quán)利要求1至9中任一項所述的變體，其特征在于，所述變體通過包含如權(quán)利要求1中所述的步驟a)～j)以及下述附加的步驟的方法獲得對在步驟(i)中形成或者在步驟(j)中得到的異二聚體中的至少一種單體進行隨機突變；以及挑選和/或篩選針對來自著色性干皮病基因的DNA標(biāo)靶具有提高的活性的異二聚體。
11.如權(quán)利要求1至10中任一項所述的變體，其特征在于，所述變體是能夠切割來自著色性干皮病基因的回文或假回文DNA靶序列的同型二聚體。
12.如權(quán)利要求1至10中任一項所述的變體，其特征在于，所述變體是由在I-CreI第26～40位和第44～77位具有不同突變的第一單體和第二單體相聯(lián)接而得到的異二聚體，所述異二聚體能夠切割來自著色性干皮病基因的非回文DNA靶序列。
13.如權(quán)利要求1至12中任一項所述的變體，其特征在于，所述DNA靶序列來自人類著色性干皮病基因。
14.如權(quán)利要求12或13所述的變體，其特征在于，所述DNA標(biāo)靶是來自人類XPA基因的序列，選自由序列SEQ ID NO45～57所構(gòu)成的組。
15.如權(quán)利要求12或13所述的變體，其特征在于，所述DNA標(biāo)靶是來自人類XPB基因的序列，選自由序列SEQ ID NO58～86所構(gòu)成的組。
16.如權(quán)利要求12或13所述的變體，其特征在于，所述DNA標(biāo)靶是來自人類XPC基因的序列，選自由序列SEQ ID NO1SEQ ID NO1～24所構(gòu)成的組。
17.如權(quán)利要求12或13所述的變體，其特征在于，所述DNA標(biāo)靶是來自人類XPD基因的序列，選自由序列SEQ ID NO87～119所構(gòu)成的組。
18.如權(quán)利要求12或13所述的變體，其特征在于，所述DNA標(biāo)靶是來自人類XPE基因的序列，選自由序列SEQ ID NO120～166所構(gòu)成的組。
19.如權(quán)利要求12或13所述的變體，其特征在于，所述DNA標(biāo)靶是來自人類XPF基因的序列，選自由序列SEQ ID NO167～188所構(gòu)成的組。
20.如權(quán)利要求12或13所述的變體，其特征在于，所述DNA標(biāo)靶是來自人類XPG基因的序列，選自由序列SEQ ID NO189～216所構(gòu)成的組。
21.如權(quán)利要求14所述的變體，其特征在于，所述變體是異二聚體，其中所述第一單體和第二單體在I-CreI的第24、26、28、30、33、38、40、42、44、68、70、75、77和/或80位具有氨基酸，如下表XXII所述。
22.如權(quán)利要求15所述的變體，其特征在于，所述變體是異二聚體，其中所述第一單體和第二單體在I-CreI的第24、26、28、30、33、38、40、42、44、68、70、75、77和/或80位具有氨基酸，如下表XXIII所示。
23.如權(quán)利要求16所述的變體，其特征在于，所述變體是異二聚體，其中所述第一單體和第二單體在I-CreI的第28、30、33、38、40、42、44、68、70、75、77、80和/或133位具有氨基酸，如下表XXIV所示。
24.如權(quán)利要求17所述的變體，其特征在于，所述變體是異二聚體，其中所述第一單體和第二單體在I-CreI的第28、30、33、38、40、44、68、70、75、77和/或80位具有氨基酸，如下表XXV所示。
25.如權(quán)利要求18所述的變體，其特征在于，所述變體是異二聚體，其中所述第一單體和第二單體在I-CreI的第28、30、33、38、40、44、68、70、75、77、80和/或133位具有氨基酸，如下表XXVI所示。
26.如權(quán)利要求19所述的變體，其特征在于，所述變體是異二聚體，其中所述第一單體和第二單體在I-CreI的第28、30、33、38、40、44、68、70、75、77和/或80位具有氨基酸，如下表XXVII所示。
27.如權(quán)利要求20所述的變體，其特征在于，所述變體是異二聚體，其中所述第一單體和第二單體在I-CreI的第28、30、33、38、40、42、44、68、70、75、77、80和/或133位具有氨基酸，如下表XXVIII所示。
28.如權(quán)利要求12、13、16中任一項所述的變體，其特征在于，所述第一單體在I-CreI的第19、28、30、33、38、40、69、70、75和/或87位具有氨基酸，所述第一單體選自下組28K30N33S38R40S70S75N、28A30N33S38R40K70S75N、19A28A30N33S38R40K70S75N、19A28A30N33Y38R40K70S75N87L和19A28A30N33S38R40K69G70S75N；
并且所述第二單體在I-CreI的第28、30、33、38、40、44、68、70、75、85、109和/或161位具有氨基酸，所述第二單體選自下組
28E30N33Y38R40K44K68S70S75N，28K30G33Y38R40S44K68R70E75N，
28E30N33Y38R40K44K68R70E75N85R109T，
28E30N33Y38R40K44K68R70E75N85R109T161F，
28E30N32R33Y38Q40K44K68R70E75N85R109T，
28S30N33Y38R40K44K68S70S75N，28S30N33Y38R40K44K68R70D75N，
28S30N33Y38R40K44K68A70S75N，28K30G33Y38H40S44K68R70E75N，
28K30G33Y38H40S44K68A70G75N，28K30G33Y38R40S44K68R70E75N，
28K30G33Y38R40S44K68T70H75N，28K30G33Y38R40S44K68S70S75N和
28K30G33Y38R40S44K68T70S75N。
29.一種單鏈嵌合大范圍核酸酶，其包含如權(quán)利要求1至28中任一項所述的兩種單體或者一種或兩種I-CreI變體的核心結(jié)構(gòu)域，或者包含兩者的組合。
30.一種多核苷酸片段，其編碼如權(quán)利要求1至28中任一項所述的變體或如權(quán)利要求29所述的單鏈嵌合大范圍核酸酶。
31.一種表達載體，其包含至少一種如權(quán)利要求30所述的多核苷酸片段。
32.如權(quán)利要求31所述的表達載體，其特征在于，所述表達載體包含兩個不同的多核苷酸片段，各自編碼如權(quán)利要求12和21～28中任一項中所述的異二聚體變體的單體之一。
33.一種載體，其包括含有待導(dǎo)入的序列的靶向構(gòu)造，所述序列側(cè)翼為與如權(quán)利要求1和11～20中任一項中所述變體的基因組DNA切割位點周圍區(qū)域共享同源性的序列。
34.如權(quán)利要求31或32所述的載體，其特征在于，所述載體包括含有待導(dǎo)入的序列的靶向構(gòu)造，所述序列的側(cè)翼為與如權(quán)利要求1和11～20中任一項中所述變體的基因組DNA切割位點周圍區(qū)域共享同源性的序列。
35.如權(quán)利要求33或34所述的載體，其特征在于，所述待導(dǎo)入的序列是可修復(fù)著色性干皮病基因中突變的序列。
36.如權(quán)利要求35所述的載體，其特征在于，所述可修復(fù)所述突變的序列是所述著色性干皮病基因的修正序列。
37.如權(quán)利要求35所述的載體，其特征在于，所述可修復(fù)所述突變的序列包含所述變體的基因組切割位點下游的所述著色性干皮病基因中的融合在構(gòu)架中的外顯子、和聚腺苷酸化位點以終止在3′端的轉(zhuǎn)錄。
38.如權(quán)利要求33～36中任一項所述的載體，其特征在于，所述靶向構(gòu)造包含XPA基因序列，所述序列能夠修復(fù)在所述XPA基因的外顯子1～6中的切割并且選自下述位置組34-233、201-400、3493-3692、7627-7826、9994-10193、10151-10350、12513-12712、12531-12730、21679-21878、21844-22043、21955-22154、22228-22427和22234-22433。
39.如權(quán)利要求33～36中任一項所述的載體，其特征在于，所述靶向構(gòu)造包含所述XPB基因的序列，所述序列能夠修復(fù)在所述XPB基因的外顯子1～15中的切割并且選自下述位置組-40-159、357-556、1335-1534、1336-1535、1457-1656、3624-3823、4108-4307、5015-5214、5148-5347、5284-5483、5420-5619、7377-7576、13517-13716、13552-13751、13633-13832、14697-14896、14760-14959、14881-15080、21139-21338、21207-21406、22796-22995、32378-32577、33003-33202、34481-34680、34869-35068、34891-35090、36584-36783、36634-36833和36639-36838。
40.如權(quán)利要求33～36中任一項所述的載體，其特征在于，所述靶向構(gòu)造包含所述XPC基因的序列，所述序列能夠修復(fù)在所述XPC基因的外顯子1～16中的切割并且選自下述位置組105-304、5704-5903、7973-8172、9887-10086、10173-10372、11263-11462、13051-13250、13432-13631、18619-18818、19580-19779、20303-20502、20349-20548、20389-20588、21985-22184、21990-22189、22028-22227、22102-22301、26017-26216、29566-29765、29726-29925、30416-30615、31166-31365和32317-32516。
41.如權(quán)利要求33～36中任一項所述的載體、其特征在于，所述靶向構(gòu)造包含所述XPD基因的序列，所述序列能夠修復(fù)在所述XPD基因的外顯子1～23中的切割并且選自下述位置組-87-112、812-1011、1319-1518、1324-1523、1426-1625、1717-1916、1867-2066、5473-5672、5585-5784、5637-5836、5920-6119、6050-6249、6290-6489、6392-6591、6472-6671、6581-6780、8830-9029、8943-9142、12661-12860、12991-13190、13084-13283、14614-14813、14817-15016、15528-15727、15878-16077、15936-16135、17023-17222、17350-17549、17365-17564、17572-17771、18347-18546、18370-18569和18641-18840。
42.如權(quán)利要求33～36中任一項所述的載體，其特征在于，所述靶向構(gòu)造包含所述XPE基因的序列，所述序列能夠修復(fù)在所述XPE基因的外顯子1～27中的切割并且選自下述位置組10-209、1295-1494、2899-3098、3488-3687、3616-3815、6093-6292、6194-6393、7034-7233、7653-7852、8753-8952、9781-9980、9966-10165、10511-10710、10665-10864、11534-11733、16439-16638、16667-16866、18268-18647、18757-18956、18863-19062、19179-19378、19266-19465、19596-19795、20714-20913、20938-21137、21099-21298、22568-22767、22732-22931、23173-23372、23181-23380、23954-24153、24000-24199、29205-29404、29651-29850、30280-30479、30355-30554、30661-30860、30685-30884、32150-32349、32753-32592、32770-32969、32811-33010、32836-33035、32841-33040、33230-33429、33369-33568和33512-33711。
43.如權(quán)利要求33～36中任一項所述的載體，其特征在于，所述靶向構(gòu)造包含所述XPF基因的序列，所述序列能夠修復(fù)在所述XPF基因的外顯子1～21中的切割并且選自下述位置組244-443、1731-1930、6429-6628、6486-6685、7918-8117、10500-10699、10676-10875、11`885-12084、11886-12085、12176-12375、14073-14272、14110-14309、15336-15535、15431-15630、15574-15773、17673-17872、17677-17876、24486、24685、27496-27695、27822-28021、27827-28026和27963-28162。
44.如權(quán)利要求33～36中任一項所述的載體，其特征在于，所述靶向構(gòu)造包含所述XPG基因的序列，所述序列能夠修復(fù)在所述XPG基因的外顯子1～15中的切割并且選自下述位置組158-357、5956-6155、7961-7890、8044-8243、9977-10176、12201-12400、12289-12488、15230-15429、15803-16002、16041-16240、16146-16345、16174-16373、16174-16373、16394-16593、16553-16732、16887-17086、19487-19686、19727-19926、19782-19981、20207-20406、20500-20699、21890-22089、22117-22316、25876-26075、26450-26649、26832-27031、27258-27457、29180-29379和29456-29655。
45.如權(quán)利要求33、34和37中任一項所述的載體，其特征在于，可修復(fù)所述突變的所述序列的側(cè)翼為如權(quán)利要求38～44中任一項中所述的序列。
46.一種組合物，其包含至少一種如權(quán)利要求1至28中任一項所述的變體、一種如權(quán)利要求29所述的單鏈嵌合大范圍核酸酶、和/或至少一種如權(quán)利要求32和34～45中任一項所述的表達載體。
47.如權(quán)利要求46所述的組合物，其特征在于，所述組合物包含靶向DNA構(gòu)造，所述DNA構(gòu)造包含可修復(fù)所述XP基因中突變的序列，所述序列側(cè)翼為與如權(quán)利要求34～45中任一項中所述變體的基因組DNA標(biāo)靶切割位點周圍區(qū)域共享同源性的序列。
48.如權(quán)利要求47所述的組合物，其特征在于，所述靶向DNA構(gòu)造被包含于重組載體中。
49.包含如權(quán)利要求31或32所述的載體、以及包含含有如權(quán)利要求32～44中任一項所述靶向構(gòu)造的載體的產(chǎn)物，其作為組合制劑而同時地、單獨地或者連續(xù)地使用于著色性干皮病。
50.至少一種如權(quán)利要求1至28中任一項所述變體、如權(quán)利要求29所述的一種單鏈嵌合大范圍核酸酶、和/或一種根據(jù)如權(quán)利要求31、32和34～45中任一項所述的表達載體在制備用于預(yù)防、改善或治療與個體罹患的著色性干皮病相關(guān)的疾病所需藥物的應(yīng)用。
51.一種寄主細胞，其被如權(quán)利要求30所述的多核苷酸或如權(quán)利要求31～45中任一項所述的載體改造。
52.一種非人類的轉(zhuǎn)基因動物，其包含一種或兩種如權(quán)利要求30或32中所述的多核苷酸片段。
53.一種轉(zhuǎn)基因植物，其包含一種或兩種如權(quán)利要求30或32中所述的多核苷酸片段。
54.至少一種如權(quán)利要求1至28中任一項所述的變體、一種如權(quán)利要求29所述的單鏈嵌合大范圍核酸酶、一種如權(quán)利要求31～45中任一項所述的載體用于基因組工程、非治療目的的應(yīng)用。
55.如權(quán)利要求54所述的應(yīng)用，其特征在于，所述變體、單鏈嵌合大范圍核酸酶、載體與如權(quán)利要求33～45中任一項中所述的靶向DNA構(gòu)造相聯(lián)接。
全文摘要
一種I-CreI變體，其具有至少兩種置換，所述兩種置換各自位于I-CreI上第26～40和44～77位的LAGLIDADG核心結(jié)構(gòu)域的兩個功能性亞結(jié)構(gòu)域中，所述變體能夠切割來自著色性干皮病基因的DNA靶序列。所述變體和衍生產(chǎn)物用于預(yù)防和治療所述著色性干皮病的用途。
文檔編號A61K48/00GK101384712SQ200780005170
公開日2009年3月11日申請日期2007年2月13日優(yōu)先權(quán)日2006年2月13日
發(fā)明者西爾萬·阿爾努, 克里斯托夫·佩雷-米紹, 朱莉安娜·斯米特申請人:賽萊提斯

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：西爾萬.阿爾努;克里斯托夫.佩雷-米紹;朱莉安娜.斯米特
技術(shù)所有人：賽萊提斯
我是此專利的發(fā)明人

上一篇：帶有另外的可與地板接觸的可選擇驅(qū)動的附加輪的病床的制作方法
上一篇：新的病毒載體的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、司老師：1.制漿造紙 2.植物資源精細化工與化學(xué) 3.生物質(zhì)精煉 4.天然產(chǎn)物化學(xué)
2、薛老師：1.CRISPR-Cas系統(tǒng) 2.基因編輯 3.基因修復(fù) 4.天然產(chǎn)物合成 5.單分子技術(shù)開發(fā)與應(yīng)用
3、戴老師：1.天然藥物（中藥）合成生物學(xué)研究 2.酵母生物學(xué)與工程化研究
4、孟老師：1. 基于糖類的抗腫瘤藥物的合成和活性評價及糖類疫苗的研制 2.功能糖類的化學(xué)酶法合成及構(gòu)效關(guān)系研究 3.多糖及仿生材料功能的開發(fā)及應(yīng)用
5、滿老師：1.天然產(chǎn)品的提取分離與活性研究 2.天然產(chǎn)物活性與安全性評價 3.中藥組方配伍機制研究
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

糖皮質(zhì)激素受體基因相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

切割來自著色性干皮病基因的dna靶序列的大范圍核酸酶變體及其應(yīng)用的制作方法