專利名稱::具有獨(dú)特特異性的多個(gè)重組位點(diǎn)在重組克隆中的用途的制作方法
背景技術(shù):
:發(fā)明領(lǐng)域本發(fā)明涉及生物技術(shù)和分子生物學(xué)領(lǐng)域。具體地,本發(fā)明涉及優(yōu)選通過(guò)使用具有獨(dú)特特異性的重組位點(diǎn),將多個(gè)含有重組位點(diǎn)的核酸分子接合起來(lái)。本發(fā)明還涉及使用重組克隆方法克隆這些接合的核酸分子。本發(fā)明還涉及通過(guò)使用重組位點(diǎn)將多個(gè)肽、和肽與核酸分子的組合接合在一起。根據(jù)本發(fā)明,其它分子和化合物或分子和化合物的組合也可以通過(guò)重組位點(diǎn)結(jié)合在一起。根據(jù)本發(fā)明,這些肽、核酸和其它分子和/或化合物(或其組合)還可以通過(guò)重組與一或多個(gè)支持物或結(jié)構(gòu)接合或結(jié)合。相關(guān)領(lǐng)域位點(diǎn)特異性重組酶位點(diǎn)特異性重組酶是許多生物(例如病毒和細(xì)菌)中存在的蛋白質(zhì),其特征在于具有內(nèi)切核酸酶和連接酶性質(zhì)。這些重組酶(在某些情況下與相關(guān)的蛋白質(zhì)一起)識(shí)別核酸分子中的堿基特異序列并使位于那些序列側(cè)翼的核酸區(qū)段發(fā)生交換。重組酶和相關(guān)蛋白質(zhì)共同被稱作“重組蛋白質(zhì)”(見(jiàn)例如,Landy,A.,CurrentOpinioninBiotechnology3699-707(1993))。不同生物的許多重組系統(tǒng)已有描述。見(jiàn)例如,Hoess等,NucleicAcidsResearch14(6)2287(1986);Abremski等,J.Biol.Chem.261(1)391(1986);Campbell,J.Bacteriol.174(23)7495(1992);Qian等,J.Biol.Chem.267(11)7794(1992);Araki等,J.Mol.Biol.225(1)25(1992);Maeser和Kahnmann,Mol.Gen.Genet.230170-176(1991)Esposito等,Nucl.AcidsRes.25(18)3605(1997)。這些中的許多屬于重組酶的整合酶家族(Argos等,EMBOJ.5433-440(1986);Vaziyanov等,Nucl.AcidsRes.27930(1990))。其中研究得最好的可能是λ噬菌體的整合酶/att系統(tǒng)(Landy,A.CurrentOpinionsinGeneticsandDevel.3699-707(1993))、P1噬菌體的Cre/loxP系統(tǒng)(Hoess和Abremski(1990),NucleicAcidsandMolecularBiology,第4卷,編Eckstein和Lilley,Berlin-HeidelbergSperinger-Verlag;第90-109頁(yè))、和釀酒酵母(Saccaromycescerevisiae)2μ環(huán)狀質(zhì)粒的FLP/FRT系統(tǒng)(Broach等,Cell29227-234(1982))。轉(zhuǎn)座子轉(zhuǎn)座子是可動(dòng)遺傳因子。轉(zhuǎn)座子在結(jié)構(gòu)上是可變的,被描述為簡(jiǎn)單型或復(fù)合型,但典型地編碼一個(gè)轉(zhuǎn)座催化酶,術(shù)語(yǔ)稱作轉(zhuǎn)座酶,兩側(cè)為反向組織的DNA序列。對(duì)于轉(zhuǎn)座子特性的更為完全的討論,可以參考MobileGeneticElements,D.J.Sherratt編,OxfordUniversity出版(1995)和MobileDNA,D.E.Berg和M.M.Howe編,AmericanSoceityfotMicrobiology(1989),Washington,DC,兩本書(shū)均特此并入本文作為參考。轉(zhuǎn)座子已被用于將DNA插入靶DNA序列中。作為一般原則,轉(zhuǎn)座子在靶DNA中的插入是隨機(jī)事件。該原則的一個(gè)例外是轉(zhuǎn)座子Tn7的插入。作為生命周期的一個(gè)部分,轉(zhuǎn)座子Tn7可以將自身整合到大腸桿菌(E.coli)基因組的特異位點(diǎn)中(Stellwagen,A.E.和Craig,N.L.TrendsinBiochemicalSciences23,486-490,1998,特此并入本文作為參考)。該位點(diǎn)特異性插入已被用于體內(nèi)操作桿狀病毒的基因組(Lucklow等,J.Virol.674566-4579(1993),特此并入本文作為參考)。對(duì)于其特點(diǎn)為向受體DNA分子中的隨機(jī)位置移動(dòng)的可轉(zhuǎn)座元件而言,Tn7的位點(diǎn)特異性是非典型的。為了本申請(qǐng)的目的,除非另行指出,轉(zhuǎn)座將用于指隨機(jī)或半隨機(jī)的移動(dòng),而重組將用于指位點(diǎn)特異性重組事件。因此,Tn7在attTn7位點(diǎn)中的位點(diǎn)特異性插入將被稱作重組事件,而Tn7的隨機(jī)插入將被稱作轉(zhuǎn)座事件。York等(NucleicAcidsResearch,26(8)1927-1933,(1998))公開(kāi)了基于使用Tn5在質(zhì)粒分子內(nèi)的轉(zhuǎn)座事件制備嵌套缺失的體外方法。在存在純化的轉(zhuǎn)座酶蛋白質(zhì)的情況下,體外孵育含有側(cè)翼有兩個(gè)19堿基對(duì)的Tn5轉(zhuǎn)座酶識(shí)別序列的卡那霉素抗性基因及靶DNA序列的載體。在使用低DNA濃度的條件下,有利于分子內(nèi)轉(zhuǎn)座反應(yīng)發(fā)生,該反應(yīng)被成功用于在靶DNA中制備一套嵌套缺失。這些作者提出,通過(guò)將終止信號(hào)包括在識(shí)別序列相鄰的所有三種閱讀框中,該系統(tǒng)可以用于在靶DNA編碼的蛋白質(zhì)中產(chǎn)生C端截短。此外,這些作者提出,將His標(biāo)簽和激酶區(qū)域包含在內(nèi)可以用于制備N端缺失蛋白質(zhì)以便作進(jìn)一步分析。Devine等(NucleicAcidsResearch,223765-3772(1994)和美國(guó)專利5,677,170和5,843,772,所有均特此并入本文作為參考)公開(kāi)了用于體外將DNA區(qū)段插入受體DNA分子中的人工轉(zhuǎn)座子的構(gòu)建。該系統(tǒng)利用酵母YT1病毒樣顆粒的插入催化酶作為轉(zhuǎn)座酶活性的來(lái)源。使用標(biāo)準(zhǔn)方法,將目的DNA區(qū)段克隆在轉(zhuǎn)座子樣元件TY1兩末端之間。當(dāng)存在TY1插入催化酶時(shí),所獲元件將隨機(jī)整合至第二靶DNA分子中。另一類可動(dòng)遺傳因子是整合子。整合子一般由位于一個(gè)可變序列側(cè)翼的5’和3’保守序列組成。典型地,該5’保守序列含有整合酶蛋白質(zhì)的編碼信息。該整合酶蛋白質(zhì)可以催化在多種重組位點(diǎn)(包括attI、attC)以及其它類型的位點(diǎn)處發(fā)生位點(diǎn)特異性重組(見(jiàn)Francia等,J.Bacteriology181(2)6844-6849,1999,和其中的引用文獻(xiàn))。重組位點(diǎn)無(wú)論以上討論的反應(yīng)被稱作重組、轉(zhuǎn)座或整合以及它們是由重組酶或整合酶催化的,它們均具有一個(gè)關(guān)鍵特征,即核酸分子上參與這些反應(yīng)的常被稱作“重組位點(diǎn)”的特異識(shí)別序列。這些重組位點(diǎn)是參加反應(yīng)的核酸分子上被重組蛋白質(zhì)在整合或重組的初期識(shí)別和結(jié)合的核酸部分或區(qū)段。例如,Cre重組酶的重組位點(diǎn)是34個(gè)堿基對(duì)序列的loxP,該序列由位于8堿基對(duì)核心序列側(cè)翼的兩個(gè)13堿基對(duì)反向重復(fù)(充當(dāng)重組酶結(jié)合位點(diǎn))組成。見(jiàn)Sauer,B.,Curr.Opin.Biotech.5521-527(1994)的圖1。識(shí)別序列的其它例子包括重組蛋白λInt所識(shí)別的attB、attP、attL、和attR序列。attB為含有兩個(gè)9堿基對(duì)核心型Int結(jié)合位點(diǎn)和一個(gè)7堿基對(duì)重疊區(qū)的約25堿基對(duì)序列,而attP為含有核心型Int結(jié)合位點(diǎn)和臂型Int結(jié)合位點(diǎn)以及輔助蛋白質(zhì)整合宿主因子(IHF)、FIS和外切酶(Xis)的位點(diǎn)的約240個(gè)堿基對(duì)序列。見(jiàn)Landy,Curr.Opin.Biotech.3699-707(1993)。終止密碼子和抑制型tRNA真核和原核生物均使用三種密碼子作為基因終止的信號(hào)。當(dāng)轉(zhuǎn)錄為mRNA后,這些密碼子具有以下序列UAG(琥珀)、UGA(乳白)和UAA(赭石)。在大多數(shù)情況下,細(xì)胞不含有識(shí)別這些密碼子的任何tRNA分子。因此,當(dāng)翻譯mRNA的核糖體到達(dá)這些密碼子之一時(shí),核糖體停止并從該RNA上落下,終止該mRNA的翻譯。核糖體自mRNA上的釋放是由特異因子介導(dǎo)的(見(jiàn)S.Mottagui-Tabar,NAR26(11),2789,1998)。具有一個(gè)符合讀框的終止密碼子(TAA,TAG或TGA)的基因通常將編碼具有天然羧基端的蛋白質(zhì)。然而,抑制型tRNA可以導(dǎo)致在終止密碼子后插入氨基酸和持續(xù)翻譯。識(shí)別通常的終止密碼子的突變tRNA分子可以抑制mRNA分子的翻譯終止,并被稱作抑制型tRNA。已經(jīng)發(fā)現(xiàn)了許多這樣的抑制型tRNA。例子包括,但不限于,抑制琥珀終止密碼子的翻譯終止的supE、supP、supD、supF和supZ抑制基因,抑制赭石終止密碼子的功能的supB、glT、supL、supN、supC和supM抑制基因,和抑制乳白終止密碼子的功能的glyT、trpT和Su-9。一般,抑制型tRNA在tRNA的反密碼子環(huán)中含有一或多個(gè)突變,這使得該tRNA可以和通常發(fā)揮終止密碼子功能的密碼子發(fā)生堿基配對(duì)。該突變tRNA荷載其關(guān)聯(lián)氨基酸殘基,并在遇到終止密碼子時(shí)將該關(guān)聯(lián)氨基酸殘基插入正在翻譯的多肽中。對(duì)于抑制型tRNA的更為詳細(xì)討論,讀者可以參考Eggertsson等(1988)MicrobiologicalReview52(3)354-374,和Engleerg-Kukla等,(1996),《EscherichiacoliandSalmonellaCellularandMolecularBiology》,第60章,第909-921頁(yè),Neidhardt等(編),ASMPress,Washington,DC。已經(jīng)鑒定出增加終止抑制基因的效率的突變,即增強(qiáng)終止密碼子通讀的突變。這些包括,但不限于,uar基因(又稱作prfA基因)中的突變,ups基因中的突變,sueA、sueB和sueC基因中的突變,rpsD(ramA)和rpsE(spcA)基因中的突變,和rplL基因中的突變。在普通情況下,如果終止密碼子的抑制效率過(guò)高,預(yù)期宿主細(xì)胞將是不健康的。這是由于基因組的數(shù)千或幾萬(wàn)個(gè)基因中相當(dāng)大部分天然具有這三個(gè)密碼子中的一個(gè);這些密碼子的完全通讀將導(dǎo)致大量在其羧基端含有額外氨基酸的異常蛋白質(zhì)。如果存在一定水平的抑制型tRNA,則在氨基酸的摻入和核糖體的釋放之間就存在一個(gè)競(jìng)爭(zhēng)。盡管其它因素例如密碼子前后序列可以影響抑制的效率,但較高水平的tRNA可以導(dǎo)致更多的通讀。生物體通常具有多個(gè)編碼tRNA的基因。與遺傳密碼的冗余性(許多氨基酸可以由多個(gè)密碼子編碼)組合,一個(gè)tRNA基因突變?yōu)橐种菩蛅RNA狀態(tài)并不導(dǎo)致高水平的抑制。TAA終止密碼子是最強(qiáng)的,也最難于抑制。TGA是最弱的,并天然(在大腸桿菌中)造成3%程度的滲漏。TAG(琥珀)密碼子相對(duì)嚴(yán)緊,在無(wú)抑制時(shí)有約1%的通讀。此外,天然存在的抑制突變體可以以大約50%的效率抑制琥珀密碼子。抑制已在細(xì)菌和噬菌體中研究了數(shù)十年。此外,已知在酵母、蠅、植物和其它真核細(xì)胞(包括哺乳動(dòng)物細(xì)胞)中也存在抑制。例如,Capone等(MolecularandCellularBiology6(9)3059-3067,1986)證明,來(lái)源于哺乳動(dòng)物tRNA的抑制型tRNA可以用于抑制哺乳動(dòng)物細(xì)胞中的終止密碼子。將以終止密碼子替代第27位絲氨酸密碼子的大腸桿菌氯霉素乙酰轉(zhuǎn)移酶(cat)基因的拷貝、以及經(jīng)突變形成琥珀、赭石、或乳白抑制衍生物的編碼人絲氨酸t(yī)RNA的基因,一起轉(zhuǎn)染至哺乳動(dòng)物細(xì)胞中。觀察到cat基因的成功表達(dá)??烧T導(dǎo)的哺乳動(dòng)物琥珀抑制基因已被用于抑制脊髓灰質(zhì)炎病毒的復(fù)制酶基因中的突變,并且表達(dá)該抑制基因的細(xì)胞系成功地被用于增殖此突變病毒(Sedivy等,(1987)Cell50379-389)。已經(jīng)顯示,與大腸桿菌相比,抑制型tRNA前后序列對(duì)終止密碼子抑制效率的影響在哺乳動(dòng)物細(xì)胞中是不同的(Philips-Jones等,(1995)MolecularandCellularBiology15(12)6593-6600;Martin等(1993)BiochemicalSocietyTransactions21)。由于一些人類疾病是由必需基因中的無(wú)義突變引起的,人們?cè)缫颜J(rèn)識(shí)到抑制在基因治療中的潛力(見(jiàn)Temple等(1982)Nature296(5857)537-40)。對(duì)導(dǎo)入白喉毒素A基因中的單個(gè)和兩個(gè)無(wú)義突變進(jìn)行抑制,已被用作毒性基因治療的二元系統(tǒng)的基礎(chǔ)(Robinson等(1995)HumanGeneTherapy6137-143)。常規(guī)核酸克隆目前核酸區(qū)段的克隆是許多研究型實(shí)驗(yàn)室的日常工作并是許多遺傳分析的先決步驟。這些克隆的目的是多樣的,然而,可以認(rèn)為有兩個(gè)一般的目的(1)從大DNA或RNA區(qū)段(染色體、YAC、PCR片段、mRNA等)將核酸初始克隆至相對(duì)少數(shù)的已知載體如pUC、pGem、pBlueScript中,和(2)將這些核酸區(qū)段亞克隆至用于功能分析的特化載體中。大量的時(shí)間和努力被花在將核酸區(qū)段從初始的克隆載體上轉(zhuǎn)移至更特化的載體上。此轉(zhuǎn)移被稱作亞克隆??寺〉幕痉椒ㄒ岩阎嗽S多年,而且在此期間幾乎沒(méi)有改變。典型的克隆方案如下(1)用一或兩種限制性酶消化目的核酸;(2)當(dāng)已知時(shí),凝膠純化目的核酸區(qū)段;(3)適當(dāng)?shù)兀ㄟ^(guò)用適當(dāng)?shù)南拗菩悦盖懈?、用堿性磷酸酶處理、凝膠純化等,以預(yù)備載體;(4)將核酸區(qū)段與載體連接,并使用適當(dāng)?shù)目刂埔韵晌辞懈畹暮妥赃B的載體構(gòu)成的背景;(5)將所獲載體導(dǎo)入大腸桿菌宿主細(xì)胞中;(6)挑取所選的菌落并過(guò)夜培養(yǎng)小量培養(yǎng)物;(7)小量制備核酸;并(8)在瓊脂糖凝膠上(通常在診斷性限制性酶消化后)或通過(guò)PCR分析此分離的質(zhì)粒。用于亞克隆核酸區(qū)段的特化載體在功能上是多樣的。這些包括但不限于用于在各種生物體中表達(dá)核酸分子的載體;用于調(diào)節(jié)核酸分子表達(dá)的載體;用于提供標(biāo)簽以幫助蛋白質(zhì)純化或以允許在細(xì)胞中跟蹤蛋白質(zhì)的載體;用于修飾該克隆核酸區(qū)段(如產(chǎn)生缺失)的載體;用于合成探針(例如核糖核酸探針)的載體;用于制備核酸測(cè)序模板的載體;用于鑒定蛋白編碼區(qū)域的載體;用于融合各種蛋白編碼區(qū)的載體;用于提供大量目的核酸的載體等。一般,一項(xiàng)特定的研究會(huì)涉及到將目的核酸區(qū)段插入各種不同的特化載體中。正如本領(lǐng)域已知的,簡(jiǎn)單的亞克隆可以在一天完成(例如核酸區(qū)段不大而且限制性位點(diǎn)與亞克隆載體的限制性位點(diǎn)相容)。然而,許多其它的亞克隆可能要花幾周的時(shí)間,尤其是涉及到未知序列、長(zhǎng)片段、毒性基因、未適當(dāng)放置的限制性位點(diǎn)、高背景、酶不純等的那些亞克隆。最繁瑣和耗時(shí)的一種亞克隆類型涉及將幾個(gè)核酸區(qū)段連續(xù)地加入載體中以便構(gòu)建期望克隆。此類克隆的一個(gè)例子是在構(gòu)建基因靶向載體中的克隆?;虬邢蜉d體典型地包括兩個(gè)核酸區(qū)段,它們每個(gè)均與靶基因的一個(gè)部分一致,并位于選擇標(biāo)記的側(cè)翼。為了構(gòu)建這樣的載體,可能必需連續(xù)地克隆每個(gè)區(qū)段,即在載體中首先插入一個(gè)基因片段、然后插入選擇標(biāo)記、再然后插入靶基因的第二個(gè)區(qū)段。對(duì)于每個(gè)片段的克隆,這都可能要求多次的消化、純化、連接和分離步驟。因此亞克隆核酸片段常被看作應(yīng)盡可能少做的緊瑣之事。幾種促進(jìn)核酸片段克隆的方法已有描述,例如以下文獻(xiàn)中所述。Ferguson,J.等,Gene16191(1981),公開(kāi)了用于亞克隆酵母核酸片段的一個(gè)載體家族。這些載體編碼卡那霉素抗性??梢詫⑤^長(zhǎng)酵母核酸區(qū)段的克隆部分消化并連接入這些亞克隆載體中。如果最初的克隆載體賦予了氨芐青霉素抗性,由于卡那霉素的選擇,則在轉(zhuǎn)化前都沒(méi)有必要進(jìn)行純化。Hashimoto-Gotoh,T.等,Gene41125(1986),公開(kāi)了在鏈霉素敏感基因內(nèi)具有獨(dú)特克隆位點(diǎn)的亞克隆載體;在鏈霉素抗性宿主中,只有在此顯性敏感基因中具有插入或缺失的質(zhì)粒才可在鏈霉素的選擇下存活。盡管有這些方法提供的改進(jìn),但使用限制和連接酶系統(tǒng)進(jìn)行傳統(tǒng)亞克隆仍是費(fèi)時(shí)的而且相對(duì)不可靠。相當(dāng)多的勞力被耗費(fèi),而且如果兩或多天后在這些候選質(zhì)粒中不能發(fā)現(xiàn)期望的亞克隆,則必需嘗試另外的條件來(lái)重復(fù)整個(gè)過(guò)程。重組克隆利用在規(guī)定的重組位點(diǎn)處進(jìn)行重組的克隆系統(tǒng)先前已在下列相關(guān)申請(qǐng)中作過(guò)描述1998年10月23日提交的美國(guó)申請(qǐng)09/177,387;2000年3月2日提交的美國(guó)申請(qǐng)09/517,466;和美國(guó)專利5,888,732和6,143,557,所有這些均特此并入本文作為參考。簡(jiǎn)而言之,本申請(qǐng)和相關(guān)申請(qǐng)部分中提及的申請(qǐng)所描述的GATEWATTM克隆系統(tǒng),利用含有至少一個(gè)重組位點(diǎn)的載體在體內(nèi)或體外克隆期望的核酸分子。更具體地,該系統(tǒng)利用了含有從野生型位點(diǎn)(att0)突變而來(lái)的至少兩個(gè)不同位點(diǎn)特異性的重組位點(diǎn)(例如att1和att2)的載體,這些重組位點(diǎn)的基礎(chǔ)是λ噬菌體系統(tǒng)。每個(gè)突變位點(diǎn)對(duì)其關(guān)連伙伴(cognatepartner)的相同類型(例如attP1和attB1、或attR1和attL)att位點(diǎn)(即其結(jié)合伙伴的重組位點(diǎn))具有獨(dú)特的特異性,并且不會(huì)與其它突變類型的重組位點(diǎn)或與野生型att0位點(diǎn)有交叉反應(yīng)。不同的位點(diǎn)特異性允許定向克隆或連接期望分子,由此提供具有期望取向的克隆分子。使用GATEWAYTM系統(tǒng),通過(guò)替換受體質(zhì)粒分子(有時(shí)稱作目的載體(Destinationvector))上側(cè)翼有att位點(diǎn)的選擇標(biāo)記(例如ccdB),可以克隆和亞克隆側(cè)翼有重組位點(diǎn)的核酸片段。然后通過(guò)轉(zhuǎn)化ccdB敏感宿主株和對(duì)受體分子上的標(biāo)記作正篩選,選擇期望的克隆。在其它生物體中可以使用類似的策略進(jìn)行負(fù)篩選(例如使用毒性基因),例如在哺乳動(dòng)物和昆蟲(chóng)中使用胸苷激酶(TK)。對(duì)att位點(diǎn)核心區(qū)中的特定殘基進(jìn)行突變可以產(chǎn)生大量不同的att位點(diǎn)。與GATEWAYTM中利用的att1和att2位點(diǎn)一樣,每個(gè)額外的突變均潛在地產(chǎn)生一個(gè)新的具有獨(dú)特特異性的att位點(diǎn),該位點(diǎn)將僅與其攜帶相同突變的關(guān)連伙伴att位點(diǎn)重組,而不會(huì)與任何其它的突變或野生型att位點(diǎn)發(fā)生交叉反應(yīng)。2000年3月2日提交的先前專利申請(qǐng)系列號(hào)09/517,466中描述了新的突變att位點(diǎn)(例如attB1-10、attP1-10、attR1-10、和attL1-10),該文獻(xiàn)特此并入本文作為參考。具有獨(dú)特特異性的其它重組位點(diǎn)(即,第一位點(diǎn)將與其相應(yīng)位點(diǎn)重組,并且不會(huì)或基本上不會(huì)與具有不同特異性的第二位點(diǎn)重組)可以用于實(shí)施本發(fā)明。適當(dāng)?shù)闹亟M位點(diǎn)的例子包括,但不限于,loxP位點(diǎn);loxP位點(diǎn)突變體、變體或衍生物如loxP511(見(jiàn)美國(guó)專利5,851,808);frt位點(diǎn);frt位點(diǎn)突變體、變體或衍生物;dif位點(diǎn);dif位點(diǎn)突變體、變體或衍生物;psi位點(diǎn);psi位點(diǎn)突變體、變體或衍生物;cer位點(diǎn);和cer位點(diǎn)突變體、變體或衍生物。本發(fā)明提供使用這些重組位點(diǎn)將多個(gè)核酸分子或區(qū)段接合或連接在一起的新方法,更具體的是將該多個(gè)(例如2、3、4、5、7、10、12、15、20、30、50、75、100、200等)區(qū)段克隆至含有一或多個(gè)(例如2、3、4、5、7、10、12、15、20、30、50、75、100、200等)重組位點(diǎn)的一或多個(gè)載體(例如2、3、4、5、7、10、12等)中,例如包括目的載體在內(nèi)的任何GATEWAYTM載體。發(fā)明簡(jiǎn)述一般地,本發(fā)明提供通過(guò)重組位點(diǎn)(每個(gè)分子或區(qū)段上存在至少一個(gè)的重組位點(diǎn))間的重組反應(yīng)用于將兩個(gè)或多個(gè)(例如2、3、4、5、7、10、12、15、20、30、50、75、100、200等)核酸區(qū)段或分子接合或聯(lián)合在一起的材料和方法。根據(jù)本發(fā)明將多個(gè)核酸分子接合起來(lái)的這些重組反應(yīng)可以在體內(nèi)(例如細(xì)胞、組織、器官或組織內(nèi))或在體外(例如無(wú)細(xì)胞系統(tǒng))中進(jìn)行。因此,本發(fā)明涉及用于產(chǎn)生新的或獨(dú)特的核酸分子組合的方法、并涉及通過(guò)這些方法產(chǎn)生的核酸分子。本發(fā)明還涉及包含本發(fā)明核酸分子的宿主和宿主細(xì)胞。本發(fā)明還涉及用于實(shí)施本發(fā)明方法的試劑盒、和用于實(shí)施本發(fā)明方法的組合物、以及實(shí)施本發(fā)明時(shí)產(chǎn)生的組合物。通過(guò)本發(fā)明方法產(chǎn)生的核酸分子可以用于本領(lǐng)域技術(shù)人員已知的任何目的。例如,本發(fā)明核酸分子可以用于表達(dá)該核酸分子所編碼的蛋白質(zhì)或肽并可以通過(guò)表達(dá)本發(fā)明方法連接在一起的不同序列用于制備新的融合蛋白。這些表達(dá)可以在細(xì)胞中或通過(guò)使用熟知的體外表達(dá)/翻譯系統(tǒng)來(lái)實(shí)現(xiàn)。一方面,有待通過(guò)本發(fā)明方法接合在一起的核酸分子或區(qū)段中的每個(gè)分子均可以包含多個(gè)重組位點(diǎn)(例如2、3、4、5、7、10、12、15、20、30、50等),但其中的至少一個(gè)(優(yōu)選兩個(gè)或多個(gè))包含至少兩個(gè)重組位點(diǎn)。這些重組位點(diǎn)(可以相同或不同)可以位于每個(gè)核酸分子或區(qū)段的不同位置,而且本發(fā)明所用核酸可以具有不同的大小和不同的形式包括環(huán)狀、超螺旋、線性等。用于本發(fā)明中的核酸分子還可以包含使得該分子可以在宿主細(xì)胞中發(fā)揮載體功能的一或多個(gè)載體或一或多個(gè)序列(例如復(fù)制起點(diǎn))。本發(fā)明核酸分子還可以包含發(fā)揮結(jié)構(gòu)功能或其它非表達(dá)功能的非編碼區(qū)段(例如,內(nèi)含的、非翻譯的、或其它區(qū)段)。在一個(gè)優(yōu)選方面,用于本發(fā)明中的核酸分子或區(qū)段是在核酸的至少一個(gè)末端或近末端具有至少一個(gè)重組位點(diǎn)的線性分子,并優(yōu)選在該分子的兩個(gè)末端或近末端包含至少一個(gè)重組位點(diǎn)。在另一優(yōu)選方面,當(dāng)有多個(gè)重組位點(diǎn)位于目的核酸分子上時(shí),這些位點(diǎn)基本上不或不在該分子上發(fā)生相互重組。在該實(shí)施方案中,相應(yīng)的結(jié)合配偶重組位點(diǎn)優(yōu)選位于有待通過(guò)本發(fā)明方法連接或接合的其它一個(gè)或多個(gè)核酸分子上。例如,本發(fā)明所用第一核酸分子可以包含至少第一和第二重組位點(diǎn),而第二核酸分子可以包含至少第三和第四重組位點(diǎn),其中該第一和第二位點(diǎn)不能相互重組,而第三和第四位點(diǎn)不能相互重組,但該第一和第三和/或該第二和第四位點(diǎn)可以重組??梢允褂糜写ㄟ^(guò)本發(fā)明方法接合在一起的核酸分子(即“起始分子”)制備一或多個(gè)(例如2、3、4、5、7、10、12、15、20、30、50、75、100、200等)含有所有或部分起始分子的雜合分子(例如“核酸分子產(chǎn)物”)。起始分子可以是來(lái)源于任何來(lái)源或通過(guò)任何方法產(chǎn)生的任何核酸分子。這些分子可以來(lái)源于天然來(lái)源(例如細(xì)胞(如原核細(xì)胞如細(xì)菌細(xì)胞、真核細(xì)胞如真菌細(xì)胞(如酵母細(xì)胞)、植物細(xì)胞、動(dòng)物細(xì)胞(如哺乳動(dòng)物細(xì)胞如人類細(xì)胞)等)、病毒、組織、來(lái)源于任何動(dòng)物或非動(dòng)物來(lái)源的器官、和生物體)或可以是非天然的(例如衍生的核酸)或通過(guò)合成來(lái)源的。這些分子還可以包括原核和真核載體、質(zhì)粒、整合序列(例如轉(zhuǎn)座子)、噬菌體或病毒載體、噬菌粒、粘粒等。用于本發(fā)明中的區(qū)段或分子可以通過(guò)本領(lǐng)域技術(shù)人員已知的任何手段來(lái)制備,這些手段包括但不限于,例如通過(guò)PCR擴(kuò)增、從天然來(lái)源中分離、化學(xué)合成、剪切或限制性消化較大的核酸分子(例如基因組或cDNA)、轉(zhuǎn)錄、逆轉(zhuǎn)錄等,并可以本領(lǐng)域技術(shù)人員的任何手段向這些分子添加重組位點(diǎn),這些手段包括連接含有重組位點(diǎn)的銜接子、使用拓?fù)洚悩?gòu)酶與含有重組位點(diǎn)的銜接子附著、使用拓?fù)洚悩?gòu)酶與含有重組位點(diǎn)的銜接子引物附著、使用含有重組位點(diǎn)的引物擴(kuò)增或合成核酸、插入或整合含有重組位點(diǎn)的核酸分子(例如轉(zhuǎn)座子或整合序列)等。在一個(gè)優(yōu)選方面,用于本發(fā)明中的核酸分子是分子群體例如核酸文庫(kù)或cDNA文庫(kù)。本發(fā)明所用的重組位點(diǎn)可以是核酸分子上參與由一或多個(gè)重組蛋白介導(dǎo)或催化的重組反應(yīng)的任何識(shí)別序列。在本發(fā)明利用一個(gè)以上(例如2、3、4、5、7、10、12、15、20、30、50等)重組位點(diǎn)的實(shí)施方案中,這些重組位點(diǎn)可以相同或不同,并可以彼此重組或不可以或基本上不可以彼此重組。本發(fā)明所考慮的重組位點(diǎn)還包括野生型或天然存在的重組位點(diǎn)的突變體、衍生物或變體。優(yōu)選的重組位點(diǎn)修飾包括增強(qiáng)重組的那些修飾,該增強(qiáng)基本上選自(i)促進(jìn)整合重組;(ii)促進(jìn)切除重組;(iii)降低對(duì)宿主因子的需要;(iv)增加共合體(co-integrate)或產(chǎn)物形成的效率;和(v)增加共合體和/或產(chǎn)物形成的特異性。對(duì)重組位點(diǎn)的優(yōu)選修飾包括可以增加重組特異性、去除一或多個(gè)終止密碼子、和/或避免發(fā)夾形成的修飾。還可以對(duì)重組位點(diǎn)進(jìn)行期望的修飾,以便當(dāng)翻譯或轉(zhuǎn)錄跨過(guò)該修飾的重組位點(diǎn)發(fā)生時(shí),將期望的氨基酸改變包括在轉(zhuǎn)錄或翻譯產(chǎn)物(如mRNA或蛋白質(zhì))中。根據(jù)本發(fā)明使用的優(yōu)選重組位點(diǎn)包括att位點(diǎn)、frt位點(diǎn)、dif位點(diǎn)、psi位點(diǎn)、cer位點(diǎn)、和lox位點(diǎn)、或它們的突變體、衍生物和變體(或它們的組合)。本發(fā)明考慮的重組位點(diǎn)還包括這些重組位點(diǎn)的部分。根據(jù)所用的重組位點(diǎn)的特異性,本發(fā)明允許定性連接核酸分子以便提供具有期望取向的連接分子,或非定性連接以便產(chǎn)生具有隨機(jī)取向的連接分子。在特定的實(shí)施方案中,本發(fā)明方法和組合物中所用的彼此重組的重組位點(diǎn)包含具有一致的7堿基對(duì)重疊區(qū)的att位點(diǎn)。在本發(fā)明特定實(shí)施方案中,這些7堿基對(duì)重疊區(qū)的頭三個(gè)核苷酸包含選自以下組的核苷酸序列AAA,AAC,AAG,AAT,ACA,ACC,ACG,ACT,AGA,AGC,AGG,AGT,ATA,ATC,ATG;ATT,CAA,CAC,CAG,CAT,CCA,CCC,CCG,CCT,CGA,CGC,CGG,CGT,CTA,CTC,CTGCTT,GAA,GAC,GAG,GAT,GCA,GCC,GCG,GCT,GGA,GGC,GGG,GGT,GTA,GTC,GTG,GTT,TAA,TAC,TAG,TAT,TCA,TCC,TCG,TCT,TGA,TGC,TGG,TGT,TTA,TTC,TTG,和TTT.除了一或多個(gè)重組位點(diǎn)(例如2、3、4、5、7、10、12、15、20、30、50等),每個(gè)起始核酸分子均還可以包含各種序列(或它們的組合),這些序列包括但限于,適于用作引物位點(diǎn)的序列(例如可以和引物例如測(cè)序引物或擴(kuò)增引物雜交以起始核酸合成、擴(kuò)增或測(cè)序的序列),轉(zhuǎn)錄或翻譯信號(hào)或調(diào)節(jié)序列如啟動(dòng)子或增強(qiáng)子、核糖體結(jié)合位點(diǎn)、Kozak序列、起始密碼子、轉(zhuǎn)錄和/或翻譯終止信號(hào)如終止密碼子(最適當(dāng)?shù)氖强梢员灰换蚨鄠€(gè)抑制型tRNA分子抑制的終止密碼子),復(fù)制起點(diǎn),選擇標(biāo)記,和可以用于產(chǎn)生蛋白融合物(如N端或羧基端)的基因或基因部分如S轉(zhuǎn)移酶(GST)、β-葡糖醛酸糖苷酶(GUS)、組氨酸標(biāo)簽(HIS6)、綠色熒光蛋白(GFP)、黃色熒光蛋白(YFP)、藍(lán)色熒光蛋白(cyanfluorescentprotein)(CFP),可讀框(0RF)序列,和任何其它在各種分子生物學(xué)技術(shù)中可能期望的或使用的目的序列,包括用于同源重組的序列(例如用于基因靶向)。一方面,本發(fā)明提供制備雜合核酸分子群體的方法,包含(a)將至少一個(gè)含有一或多個(gè)重組位點(diǎn)的第一核酸分子群體和至少一個(gè)含有一或多個(gè)重組位點(diǎn)的靶核酸分子混合;和(b)使該至少第一群體的部分或全部核酸分子和該靶核酸分子的部分或全部重組,籍此形成雜合核酸分子群。在以上方法的某些具體實(shí)施方案中,通過(guò)將第一群核酸分子和靶核酸分子與一或多個(gè)重組蛋白在利于重組產(chǎn)生雜合核酸分子的條件下混合。在其它特定實(shí)施方案中,本發(fā)明方法還包含將該雜合核酸分子和至少一個(gè)包含一或多個(gè)重組位點(diǎn)的第二群核酸分子混合,以產(chǎn)生第二群產(chǎn)物核酸分子?;蛘撸梢詫⒌谝蝗后w、第二群體和靶核酸分子混合在一起,以便通過(guò)重組形成雜合群體。在其它特定實(shí)施方案中,本發(fā)明方法還包含選擇通過(guò)上述方法產(chǎn)生的雜合核酸分子群。在其它特定實(shí)施方案中,本發(fā)明方法還包含選出雜合核酸分子群并選擇除去第一核酸分子群、靶核酸分子和/或第二核酸分子群。在相關(guān)實(shí)施方案中,本發(fā)明提供使含有第一重組位點(diǎn)的第一核酸區(qū)段、含有第二和第三重組位點(diǎn)的第二核酸區(qū)段、和含有第四重組位點(diǎn)的第三核酸區(qū)段重組的方法,其中該第一、第二、或第三核酸區(qū)段可以是一致的核酸區(qū)段或核酸分子群,以便重組產(chǎn)生包含第一、第二和第三核酸區(qū)段的線性或閉合環(huán)狀產(chǎn)物。而且,可以使用含有或不含有重組位點(diǎn)并與第一或第三核酸區(qū)段同源或簡(jiǎn)并的寡核苷酸,擴(kuò)增這些重組產(chǎn)物的成員。因此,例如,通過(guò)使用特異針對(duì)第一或第三核酸區(qū)段的引物進(jìn)行擴(kuò)增,可以擴(kuò)增包含第一-第二-第三雜合分子的產(chǎn)物,而不會(huì)擴(kuò)增其它不需要的分子(例如包含第一-第二雜合分子的產(chǎn)物)。按此方式,可以使用擴(kuò)增選出期望的產(chǎn)物并選擇除去非期望的產(chǎn)物??梢栽O(shè)計(jì)該擴(kuò)增以便選出任何期望的產(chǎn)物或重組反應(yīng)的中間物。例如,可以將四個(gè)不同的分子(例如A、B、C、和D)接合起來(lái),并可以使用設(shè)計(jì)用于擴(kuò)增期望產(chǎn)物的引物(例如當(dāng)擴(kuò)增A-B-C相應(yīng)于分子A和C的引物,而擴(kuò)增A-B時(shí)相應(yīng)于分子A和B的引物)選出各種中間產(chǎn)物(例如A-B-C或A-B)。然后克隆所獲擴(kuò)增產(chǎn)物。在相關(guān)實(shí)施方案中,可以使用兩個(gè)或多個(gè)(例如2、3、4、5、6、7、8、9、10、11、12、13、15等)核酸區(qū)段實(shí)施上述方法。另一方面,本發(fā)明提供制備雜合核酸分子群的方法,其包含(a)將至少一個(gè)包含一或多個(gè)重組位點(diǎn)的第一核酸分子群和至少一個(gè)包含一或多個(gè)重組位點(diǎn)的第二核酸分子群混合;和(b)使該至少第一群體的全部或部分核酸分子和該至少第二群體的全部或部分核酸分子重組,籍此形成一或多個(gè)雜合核酸分子群。在上述方法的某些具體實(shí)施方案中,通過(guò)將第一群核酸分子和第二群核酸分子與一或多個(gè)重組蛋白在利于它們重組的條件下混合,以進(jìn)行重組。在其它具體實(shí)施方案中,本發(fā)明方法還包含將第一和第二群核酸分子與至少一個(gè)含有一或多個(gè)重組位點(diǎn)的第三群核酸分子混合。在其它實(shí)施方案中,本發(fā)明方法還包括選擇雜合核酸分子群。在再其它具體實(shí)施方案中,本發(fā)明方法還包含選出雜合核酸分子群并選擇除去該第一、第二和/或第三群核酸分子。其它實(shí)施方案中,本發(fā)明方法還包含選出或選擇除去共合體分子和/或副產(chǎn)物分子。本發(fā)明還包括通過(guò)以上方法制備雜合核酸分子群,和包含上述雜合核酸分子群的重組宿主細(xì)胞群體。在某些實(shí)施方案中,用于實(shí)施本發(fā)明的重組蛋白包含選自下組的一或多個(gè)蛋白質(zhì)Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、Cin、Tn3解離酶、TndX、XerC、XerD、和ΦC31。在具體實(shí)施方案中,重組位點(diǎn)包含一或多個(gè)選自下組的重組位點(diǎn)lox位點(diǎn);psi位點(diǎn);dif位點(diǎn);cer位點(diǎn);fri位點(diǎn);att位點(diǎn);和這些重組位點(diǎn)的保留進(jìn)行重組的能力的突變體、變體和衍生物。在一個(gè)特定的方面,本發(fā)明允許通過(guò)抑制一或多個(gè)終止密碼子以控制融合蛋白的表達(dá)。根據(jù)本發(fā)明,通過(guò)本發(fā)明接合起來(lái)的一或多個(gè)起始分子(例如1、2、3、4、5、7、10、12等)可以包含一或多個(gè)終止密碼子,這些密碼子可以被抑制以允許表達(dá)從第一起始分子通過(guò)鄰接的起始分子。例如,通過(guò)本發(fā)明接合起來(lái)的第一-第二-第三起始分子(當(dāng)該第一和第二分子均含有終止密碼子時(shí))可以通過(guò)抑制所有的終止密碼子而表達(dá)一個(gè)由該接合分子編碼的三聯(lián)體融合蛋白。而且,通過(guò)改變對(duì)所選終止密碼子的抑制,本發(fā)明允許選擇或控制融合蛋白表達(dá)。因此,通過(guò)抑制該第一-第二-第三分子的第一和第二分子間而非第二和第三分子間的終止密碼子,可以產(chǎn)生由第一和第二分子編碼的融合蛋白而不是三聯(lián)融合物。因此,不同終止密碼子的使用和抑制的可變控制使得可以產(chǎn)生由接合起來(lái)的目的起始核酸分子的全部或不同部分編碼的各種融合蛋白或其部分。一方面,可以在起始核酸分子或在起始分子所含的重組位點(diǎn)中的任何地方包括終止密碼子。優(yōu)選地,這些終止密碼子位于目的起始分子的末端或近末端,盡管這些終止密碼子可以包括在該分子內(nèi)部。另一方面,一或多個(gè)起始核酸分子可以包含目的靶基因或可讀框的全部或部分編碼序列,其中該編碼序列之后是終止密碼子。然后該密碼子后面可以跟隨允許接合第二起始分子的重組位點(diǎn)。在此類一些實(shí)施方案中,可以任選地通過(guò)抑制型tRNA分子抑制終止密碼子。編碼抑制型tRNA分子的基因可以在包含目的靶基因的相同載體上提供,或可以在不同載體上提供,或可以在包含該編碼序列的載體所要插入的宿主細(xì)胞的染色體中提供。在一些實(shí)施方案中,可以提供一個(gè)以上拷貝(例如2、3、4、5、7、10、12、15、20、30、50等個(gè)拷貝)的抑制型tRNA。在一些實(shí)施方案中,抑制型tRNA的轉(zhuǎn)錄可以在可調(diào)節(jié)(例如誘導(dǎo)型或阻遏型)啟動(dòng)子的控制下進(jìn)行。因此,一方面,本發(fā)明涉及表達(dá)一或多個(gè)融合蛋白(例如1、2、3、4、5、7、10、12、15、20、30、50等)的方法,包括(a)至少獲得包含至少一個(gè)重組位點(diǎn)和至少一個(gè)終止密碼子的第一核酸分子(優(yōu)選地該重組位點(diǎn)和/或終止密碼子位于所述第一核酸分子的一個(gè)或兩個(gè)末端或近末端)、和包含至少一個(gè)重組位點(diǎn)的第二核酸(優(yōu)選地該重組位點(diǎn)位于所述第二核酸分子的一個(gè)或兩個(gè)末端或近末端);(b)使所述第一和第二核酸分子通過(guò)所述重組位點(diǎn)的重組發(fā)生重組,由此產(chǎn)生包含所述至少一個(gè)終止密碼子和所述第一和第二分子的全部或部分的第三核酸分子;和(c)抑制所述至少一個(gè)終止密碼子,表達(dá)由所述第三分子編碼的一或多個(gè)肽或蛋白質(zhì)(例如2、3、4、5、7、10、12、15、20、30、50等)。而且,這里所述重組位點(diǎn)(例如具有各種重組特異性的重組位點(diǎn))可以在一、二或所有三種正向或反向讀框中含有終止密碼子。而且,在適當(dāng)?shù)那闆r下,可以對(duì)這些重組位點(diǎn)進(jìn)行設(shè)計(jì)以便消除一、二和/或所有三種正向或反向讀框中的終止密碼子。另一方面,本發(fā)明提供合成蛋白質(zhì)的方法,包含(a)提供包含后隨終止密碼子的編碼序列的至少第一核酸分子;(b)提供包含任選地后隨終止密碼子的編碼序列的至少第二核酸分子;(c)進(jìn)行重組以便這些核酸分子接合起來(lái);(d)將所述接合的核酸分子插入載體中以產(chǎn)生具有兩個(gè)符合讀框地連接的編碼序列的修飾載體;(e)用該修飾載體轉(zhuǎn)化編碼抑制型tRNA的宿主細(xì)胞;和(f)使此兩個(gè)編碼序列表達(dá)以便產(chǎn)生由此兩個(gè)編碼序列的至少一個(gè)部分編碼的融合蛋白,其中(a)和(b)的核酸分子的側(cè)翼均有至少一個(gè)重組位點(diǎn)。而且,該融合核酸分子或該載體可以包含至少一個(gè)可抑制的終止密碼子(例如琥珀、乳白和/或赭石密碼子)。此外,該第一或第二核酸分子可以在上述方法實(shí)施前就已經(jīng)存在于該載體中。在本發(fā)明具體實(shí)施方案中,載體和/或宿主細(xì)胞包含編碼至少一個(gè)抑制型tRNA分子的基因。在其它具體實(shí)施方案中,本發(fā)明方法還包括用包含編碼至少一個(gè)抑制型tRNA分子的基因的核酸分子轉(zhuǎn)化該宿主細(xì)胞。在再一具體實(shí)施方案中,融合蛋白可以包含由載體的至少一個(gè)部分編碼的N-或C-標(biāo)簽(例如谷胱甘肽S轉(zhuǎn)移酶、β-葡糖醛酸糖苷酶、綠色熒光蛋白、黃色熒光蛋白、紅色熒光蛋白、藍(lán)色熒光蛋白、麥芽糖結(jié)合蛋白、六組氨酸標(biāo)簽、表位標(biāo)簽等)。本發(fā)明還涉及表達(dá)一或多個(gè)融合蛋白(例如1、2、3、4、5、7、10、12、15、20、30、50等)的方法,包含(a)至少獲得包含至少一個(gè)重組位點(diǎn)的第一核酸分子(優(yōu)選地該重組位點(diǎn)位于所述第一核酸分子的一個(gè)或兩個(gè)末端或近末端)、和包含至少一個(gè)重組位點(diǎn)的第二核酸(優(yōu)選地該重組位點(diǎn)位于所述第二核酸分子的一個(gè)或兩個(gè)末端或近末端);(b)使所述至少第一和第二核酸分子通過(guò)所述重組位點(diǎn)的重組發(fā)生重組,由此產(chǎn)生包含所述至少第一和第二分子的全部或部分的第三核酸分子;和(c)表達(dá)由所述第三核酸分子編碼的一或多個(gè)肽或蛋白質(zhì)(例如2、3、4、5、7、10、12、15、20、30、50等)。在某些此類實(shí)施方案中,表達(dá)的融合蛋白的至少一個(gè)部分是由第三核酸分子編碼的,且至少另一部分是由第一和/或第二核酸分子的至少一個(gè)部分編碼的。該融合蛋白可以通過(guò)翻譯相應(yīng)于位于該第一和第二核酸分子間的重組位點(diǎn)的核酸來(lái)產(chǎn)生。因此,可以通過(guò)“通讀”相應(yīng)于用于連接兩個(gè)或多個(gè)核酸區(qū)段的重組位點(diǎn)的mRNA,表達(dá)融合蛋白。本發(fā)明還包括通過(guò)本發(fā)明方法產(chǎn)生的融合蛋白和編碼該融合蛋白的mRNA。正如以下更詳細(xì)討論的,以上討論的方法可以用于制備由不同核酸區(qū)段編碼的蛋白質(zhì)、以及編碼這些融合蛋白質(zhì)的核酸分子。因此,在一個(gè)一般的方面,本發(fā)明提供通過(guò)連接兩個(gè)或多個(gè)核酸區(qū)段而產(chǎn)生的核酸分子的表達(dá),制備融合蛋白的方法。在相關(guān)實(shí)施方案中,本發(fā)明提供通過(guò)連接兩個(gè)或多個(gè)核酸區(qū)段而產(chǎn)生的核酸分子的表達(dá),產(chǎn)生融合RNA的方法。這些RNA可以是mRNA或可以是所具有的活性非蛋白編碼功能的非翻譯RNA。這些RNA的例子包括核酶和tRNA。本發(fā)明還提供通過(guò)本發(fā)明方法產(chǎn)生的核酸分子、這些核酸分子的表達(dá)產(chǎn)物、用于制備這些表達(dá)產(chǎn)物的方法、含有這些核酸分子的重組宿主細(xì)胞、和制備這些宿主細(xì)胞的方法。正如以下詳細(xì)討論的,本發(fā)明還提供組合文庫(kù),可以對(duì)此組合文庫(kù)進(jìn)行篩選,以鑒定具有特定功能或活性的核酸分子和表達(dá)產(chǎn)物。在一個(gè)具體方面,本發(fā)明提供用于將兩個(gè)核酸分子或其部分接合入一或多個(gè)產(chǎn)物核酸分子中的材料和方法,其中每個(gè)核酸分子均含有至少一個(gè)重組位點(diǎn),所述接合的方式是通過(guò)在使位于一個(gè)核酸分子上的重組位點(diǎn)和位于另一核酸分子上的重組位點(diǎn)重組的條件下孵育這些分子。重組位點(diǎn)優(yōu)選位于起始核酸分子的末端或近末端。根據(jù)重組位點(diǎn)在起始分子中的定位,由此產(chǎn)生的產(chǎn)物分子將含有通過(guò)重組位點(diǎn)(其優(yōu)選是一個(gè)新的重組位點(diǎn))接合的第一和第二分子的全部或部分。例如,attB1重組位點(diǎn)和attP1重組位點(diǎn)間的重組導(dǎo)致產(chǎn)生一個(gè)attL1和/或attR1重組位點(diǎn)。在另一具體方面,本發(fā)明提供用于將兩個(gè)或多個(gè)核酸分子(例如2、3、4、5、7、10、12、15、20、30、50等)接合入一或多個(gè)產(chǎn)物核酸分子(例如1、2、3、4、5、7、10、12等)中的材料和方法,其中每個(gè)起始核酸分子均具有至少一個(gè)重組位點(diǎn),而且至少一個(gè)起始核酸分子具有至少兩個(gè)重組位點(diǎn)。這些重組位點(diǎn)優(yōu)選位于起始核酸分子的一個(gè)或兩個(gè)末端或近末端。因此,本發(fā)明提供將至少兩個(gè)核酸分子接合起來(lái)的方法,其中至少第一核酸分子含有至少一個(gè)重組位點(diǎn)而至少第二核酸分子含有兩個(gè)或多個(gè)重組位點(diǎn)。在存在至少一種重組蛋白的情況下,在足以將起始分子的全部或部分聯(lián)合以形成一或多個(gè)產(chǎn)物分子的條件下,孵育這些分子。由此產(chǎn)生的產(chǎn)物分子將含有通過(guò)重組位點(diǎn)(優(yōu)選是新的重組位點(diǎn))接合起來(lái)的每個(gè)起始分子的所有或部分。在另一具體方面,本發(fā)明提供將至少三個(gè)核酸分子(例如2、3、4、5、7、10、12、15、20、30、50等)接合起來(lái)的方法,其中這些分子具有至少一個(gè)重組位點(diǎn)并且至少一個(gè)起始核酸分子含有至少兩個(gè)重組位點(diǎn)。在存在至少一個(gè)重組蛋白的情況下孵育這些分子,可以提供一或多個(gè)含有起始分子全部或部分的產(chǎn)物分子(例如1、2、3、4、5、7、10、12、15、20、30、50等),其中所有分子均通過(guò)重組位點(diǎn)(優(yōu)選是新的重組位點(diǎn))接合。在另一具體實(shí)施方案中,本發(fā)明提供用于兩個(gè)或多個(gè)核酸分子(例如2、3、4、5、7、10、12、15、20、30、50等)接合起來(lái)的組合物和方法,其中的至少兩個(gè)分子(優(yōu)選所有分子)具有兩個(gè)或多個(gè)重組位點(diǎn)。位于每個(gè)分子上的重組位點(diǎn)優(yōu)選定位在起始核酸分子的末端或近末端。根據(jù)本發(fā)明方法,兩個(gè)或多個(gè)核酸分子或它們的部分通過(guò)重組反應(yīng)(例如在存在至少一個(gè)重組蛋白的情況下孵育這些分子)接合,以形成包含通過(guò)重組位點(diǎn)(優(yōu)選是新的重組位點(diǎn))接合的每個(gè)起始分子的全部或部分。在另一具體方面,本發(fā)明提供將至少三個(gè)核酸分子接合起來(lái)的組合物和方法,包括提供至少第一、第二和第三核酸分子,其中該第一核酸分子包含至少第一重組位點(diǎn),第二核酸分子包含至少第二和第三重組位點(diǎn)、而第三核酸分子包含至少第四重組位點(diǎn),其中該第一重組位點(diǎn)能夠與第二重組位點(diǎn)重組而第三重組位點(diǎn)能夠和第四重組位點(diǎn)重組,實(shí)施至少一個(gè)重組反應(yīng),以便該第一和第二重組位點(diǎn)重組而第三和第四重組位點(diǎn)重組,籍此將這些分子的全部或部分聯(lián)合起來(lái)以產(chǎn)生一或多個(gè)產(chǎn)物分子。因此,本發(fā)明一般涉及將n個(gè)核酸分子或區(qū)段聯(lián)合起來(lái)的方法,其中n為大于1的整數(shù)(例如2、3、4、5、7、10、12、15、20、30、50等),該方法包括步驟提供第1至第n個(gè)核酸分子或區(qū)段,從第2至第n-1的每個(gè)分子具有至少兩個(gè)重組位點(diǎn),而第1和第n個(gè)分子具有至少一個(gè)重組位點(diǎn)(優(yōu)選具有至少兩個(gè)重組位點(diǎn));和在足以使這些區(qū)段或分子的全部或部分重組以形成一或多個(gè)包含第1至第n每個(gè)分子或區(qū)段的全部或部分的產(chǎn)物分子的條件下,使這些分子或區(qū)段和一或多個(gè)重組蛋白(例如2、3、4等)接觸。優(yōu)選地,通過(guò)重組位點(diǎn)使分子接合(例如使第一分子上的第一重組位點(diǎn)和第二分子上的第二重組位點(diǎn)相互作用)將在這兩個(gè)分子的接合處產(chǎn)生一個(gè)新的重組位點(diǎn),并可以在每個(gè)分子與下一個(gè)分子接合的每個(gè)接合處產(chǎn)生一個(gè)新的重組位點(diǎn)。例如,當(dāng)將各具有至少兩個(gè)重組位點(diǎn)的許多分子(例如第一或“x”分子、第二或“y”分子、和第三或“z”分子)接合起來(lái)時(shí),則x分子上的第一個(gè)重組位點(diǎn)與y分子上的第二重組位點(diǎn)相互作用,而x分子上的第二個(gè)重組位點(diǎn)與z分子上的第一重組位點(diǎn)相互作用,以產(chǎn)生包含通過(guò)重組位點(diǎn)接合的y∶x∶z的雜合核酸分子。當(dāng)然,其它重組事件也可以產(chǎn)生雜合分子,包含通過(guò)重組位點(diǎn)接合的例如x∶y∶z、x∶z∶y、y∶z∶x、z∶x∶y和/或z∶y∶x或它們的片段??梢酝ㄟ^(guò)位于另一分子上的至少一個(gè)重組位點(diǎn)和位于產(chǎn)物分子上的至少一個(gè)重組位點(diǎn)間的重組(例如z分子上的第二重組位點(diǎn)和e分子上的第一重組位點(diǎn)相互作用等,和/或y分子上的第一重組位點(diǎn)和f分子上的第二重組位點(diǎn)相互作用等),在產(chǎn)物分子中加入其它分子。而且,包含y∶x∶z(或以上提及的其它序列)的雜合核酸分子可以通過(guò)y和z的游離末端上的重組位點(diǎn)的相互作用而環(huán)化??梢赃B續(xù)或同時(shí)地加入全部或部分的起始分子。在通過(guò)本發(fā)明方法接合的核酸區(qū)段含有一個(gè)或多個(gè)不具有重組位點(diǎn)的末端的情況下,可以使用連接酶或拓?fù)洚悩?gòu)酶(例如痘苗病毒的拓?fù)洚悩?gòu)酶,見(jiàn)美國(guó)專利5,766,891,整個(gè)公開(kāi)并入本文作為參考),將此末端或多個(gè)末端與相同核酸區(qū)段或另一核酸分子連接。除了接合多個(gè)分子外,本發(fā)明還提供置換產(chǎn)物分子所包含的一或多個(gè)分子(或它們的組合)的方法。例如,可以通過(guò)和包含一或多個(gè)重組位點(diǎn)的一個(gè)不同分子(m)的全部或部分重組,置換或替代產(chǎn)物分子包含的任何一個(gè)或多個(gè)n分子。因此,在一個(gè)例子中,通過(guò)m上的第一重組位點(diǎn)和位于x側(cè)翼的第一重組位點(diǎn)(例如y和x間的重組位點(diǎn))重組、而m上的第二重組位點(diǎn)和位于x側(cè)翼的第二重組位點(diǎn)(例如x和z間的重組位點(diǎn))重組,m可以置換上述y∶x∶z分子中的x,產(chǎn)生y∶m∶z??梢酝ㄟ^(guò)本發(fā)明分子上的一或多個(gè)重組位點(diǎn)和待替代的分子內(nèi)或上的一或多個(gè)重組位點(diǎn)重組,在本發(fā)明任何核酸分子內(nèi)或之上進(jìn)行多次的替代或置換。而且,可以通過(guò)目的分子內(nèi)的兩個(gè)或多個(gè)重組位點(diǎn)的重組產(chǎn)生缺失,以在本發(fā)明產(chǎn)物上造成一或多個(gè)不同大小的缺失(例如2、3、4、5、7、10、12等)。例如,為了在上述y∶x∶z(或它的其它排列)中造成缺失,位于x分子側(cè)翼的重組位點(diǎn)的重組將產(chǎn)生缺失x的新分子;即,該新分子將包含y∶z。因此,可以通過(guò)目的分子內(nèi)的定向重組,多次缺失、多次置換、及同時(shí)缺失和置換目的分子的不同部分。而且,本發(fā)明還提供在產(chǎn)物分子中插入一或多個(gè)分子(或其部分)的方法。例如,使用上述y∶x∶z分子進(jìn)行舉例說(shuō)明,包含一或多個(gè)重組位點(diǎn)的分子w可以被插入y和x之間,形成新的分子y∶w∶x∶z。在一個(gè)具體實(shí)施方案中,分子w側(cè)翼有l(wèi)oxP位點(diǎn),分子w的插入是由Cre重組酶介導(dǎo)w分子上的loxP位點(diǎn)與y和x分子上的相應(yīng)loxP位點(diǎn)間的重組而實(shí)現(xiàn)的。本領(lǐng)域技術(shù)人員知道,可以對(duì)以上進(jìn)行許多變化,而且這些變化包括在本發(fā)明的范圍內(nèi)。例如,包含一或多個(gè)重組位點(diǎn)的分子o可以被插入y和x間,根據(jù)起始分子形成新的分子(包含y∶o∶x∶z或y∶o∶w∶x∶z)。本文所述方法實(shí)質(zhì)上可以用于將任何數(shù)量的分子插入其它分子中。而且,可以連續(xù)地使用這些方法,以便例如制備具有多樣結(jié)構(gòu)的分子。根據(jù)起始核酸分子或區(qū)段、重組位點(diǎn)在這些分子上的位置、和這些位點(diǎn)的重組順序,通過(guò)本發(fā)明方法產(chǎn)生的產(chǎn)物分子可以包含起始分子(或它們的部分)的任何組合并可以是任何大小和任何形式(例如環(huán)狀、線性、超螺旋等)。重要的是,本發(fā)明提供了方法,通過(guò)該方法可以將核酸分子群(已知或未知的)和一或多個(gè)已知或未知的目的靶序列(例如2、3、4、5、7、10、12、15、20、30、50個(gè)等)或和其它核酸分子群(已知或未知的)組合,由此產(chǎn)生組合分子群(例如組合文庫(kù)),從這些組合分子群中可以獲得獨(dú)特的和/或新的分子(例如雜合分子)及這些分子編碼的蛋白質(zhì)或肽,并對(duì)它們作進(jìn)一步分析。在一個(gè)優(yōu)選方面,用于產(chǎn)生根據(jù)本發(fā)明的組合文庫(kù)的核酸分子群可以包含一群具有至少一個(gè)(優(yōu)選兩個(gè)或更多個(gè))重組位點(diǎn)(例如2、3、4、5、7、10、12、15等)的區(qū)段或分子。該分子群優(yōu)選從經(jīng)構(gòu)建含有這些重組位點(diǎn)的基因組或cDNA文庫(kù)(或它們的部分)或隨機(jī)核酸、擴(kuò)增產(chǎn)物(例如使用各種引物產(chǎn)生的PCR產(chǎn)物)和域(例如編碼相同或不同蛋白的不同蛋白域的核酸)獲得。因此,根據(jù)本發(fā)明,包含重組位點(diǎn)的第一群分子可以通過(guò)重組(定向和/或隨機(jī)方向)隨機(jī)地和包含重組位點(diǎn)的至少一個(gè)目的靶序列或第二群分子接合或組合,以產(chǎn)生第三群分子或雜合分子。根據(jù)本發(fā)明,來(lái)自各種不同來(lái)源的多群分子可以多次組合以產(chǎn)生一個(gè)所包含分子具有多種序列組合的新群體。例如,可以使第一群體、第二群體和第三群體重組以產(chǎn)生包含一群隨機(jī)三聯(lián)分子的第四群體(例如,該第四群體的一些或所有分子含有來(lái)自第一、第二和第三群的所有或部分區(qū)段)。在一個(gè)優(yōu)選方面,可以優(yōu)選地選擇通過(guò)此組合方法獲得的新產(chǎn)生的分子群(例如第三群體),并由此將其與初始分子(例如靶分子、和第一和第二群分子)及不需要的產(chǎn)物分子(例如共合體(cointegrates)和/或副產(chǎn)物分子)分離或分開(kāi)。此選擇可以通過(guò)分析或選擇存在的期望核酸融合物(使用診斷性引物進(jìn)行PCR)和/或存在的由期望核酸融合物編碼的蛋白的期望活性來(lái)實(shí)現(xiàn)。該選擇還可以通過(guò)正和/或負(fù)篩選來(lái)實(shí)現(xiàn)。根據(jù)本發(fā)明,在此負(fù)篩選方案中優(yōu)選使用一或多個(gè)毒性基因(例如2、3、4、5、7、10等)。本發(fā)明還可以將對(duì)期望融合產(chǎn)物(核酸和/或蛋白)的選擇與正和/或負(fù)篩選作組合使用。因此,本發(fā)明提供方法,通過(guò)該方法可以選擇重組克隆產(chǎn)生的產(chǎn)物分子群(或甚至是一特殊類型產(chǎn)物分子或特殊產(chǎn)物分子)并選擇除去插入片段供體、載體供體和共合體群體或類似地選出插入片段供體、載體供體、副產(chǎn)物和/或共合體并選擇除去產(chǎn)物分子群(見(jiàn)圖1)。參考圖2,在本發(fā)明重組合文庫(kù)(recombinatoriallibrary)方法中,本發(fā)明第一群分子(表示為區(qū)段A)可以作為插入片段供體分子群提供,而第二群分子(表示為區(qū)段B)可以作為第二插入片段供體分子群提供。當(dāng)這些區(qū)段被描述為線性片段時(shí),它們可以作為較大分子內(nèi)的區(qū)段,例如作為質(zhì)粒中的區(qū)段,而提供。本領(lǐng)域技術(shù)人員將明了,在此情況下,可以產(chǎn)生共合體分子(非圖1所顯示的分子)。例如,可以形成包含區(qū)段A和區(qū)段B插入片段供體的共合體。此外,還可以形成包含區(qū)段A和/或區(qū)段B插入片段供體分子及載體供體分子的共合體。本發(fā)明的篩選方法允許選擇除去插入片段供體分子和選擇除去各種共合體分子,并選出新產(chǎn)生的雜合分子群,該雜合分子群可以被稱作產(chǎn)物分子群。相反地,本發(fā)明篩選方法也可以允許選擇除產(chǎn)物并選出插入片段/載體供體、副產(chǎn)物和/或共合體。因此,本發(fā)明涉及產(chǎn)生雜合核酸分子群的方法,包括(a)將包含一或多個(gè)重組位點(diǎn)(例如2、3、4、5、7、10、12等)的至少第一核酸分子群和至少一個(gè)包含一或多個(gè)重組位點(diǎn)(例如2、3、4、5、7、10、12等)的目的靶核酸分子混合;(b)使所述至少第一群體的部分或全部分子與所述目的靶分子的所有或部分分子(優(yōu)選隨機(jī)地)重組,由此形成第三雜合分子群;和(c)任選地特異地選出所述第三雜合分子群。根據(jù)本發(fā)明,第三群體中含有的雜合分子優(yōu)選包含獲自第一群的分子的全部或部分及靶分子的全部或部分。分子的接合可以根據(jù)需要以定向或隨機(jī)的方式取向。在一個(gè)方面,用于產(chǎn)生所述第三群體的上述靶分子可以是DNA結(jié)合域或轉(zhuǎn)錄激活域,以致該第三雜合分子群可以用于本領(lǐng)域熟知的雙雜種篩選方法中。更具體地,本發(fā)明涉及產(chǎn)生組合分子群的方法,包括(a)獲得包含一或多個(gè)重組位點(diǎn)(例如2、3、4、5、7、10、12等)的至少第一核酸分子群、和包含至少一或多個(gè)重組位點(diǎn)(例如2、3、4、5、7、10、12等)的至少第二核酸分子群;(b)使至少所述第一群的一些或所有分子和至少所述第二群的一些或所有分子(優(yōu)選隨機(jī)地)重組,由此產(chǎn)生第三群雜合分子;和(c)任選地特異地選出所述第三雜合分子群。根據(jù)本發(fā)明,第三群中包含的所有或許多雜合分子優(yōu)選包含獲自第一群的分子的全部或部分及獲自第二群的分子的全部或部分。分子的接合可以根據(jù)需要以定向或隨機(jī)方式取向。根據(jù)本發(fā)明組合方法使用的核酸群可以包含合成的、基因組的或cDNA文庫(kù)(或其部分)的、隨機(jī)合成的序列或簡(jiǎn)并核苷酸、域等。優(yōu)選地,所用核酸分子群包含一群隨機(jī)分子,每個(gè)均具有至少兩個(gè)重組位點(diǎn),這些重組位點(diǎn)優(yōu)選彼此不相互重組并且優(yōu)選位于每個(gè)分子的兩個(gè)末端或近末端。通過(guò)本發(fā)明方法對(duì)分子群作隨機(jī)重組為產(chǎn)生具有顯著序列多樣性的分子群提供了一項(xiàng)有力技術(shù)。例如,具有約106種序列的第一文庫(kù)和具有約106種序列的第二群體重組產(chǎn)生具有約1012種序列的第三群體。本發(fā)明還提供制備和篩選文庫(kù)成員的核酸分子區(qū)段已經(jīng)過(guò)改變的組合文庫(kù)的方法。這些改變包括核酸區(qū)段的突變、改組、插入和/或缺失。具體地,本發(fā)明提供用于制備所含成員具有此突變的核酸文庫(kù)的方法和用于在現(xiàn)有文庫(kù)中導(dǎo)入這些突變的方法。在一個(gè)相關(guān)方面,本發(fā)明包括通過(guò)本發(fā)明方法產(chǎn)生的組合文庫(kù)、用于篩選該文庫(kù)以鑒定出編碼具有特定功能或活性的產(chǎn)物的成員的方法、以及這些文庫(kù)的表達(dá)產(chǎn)物(例如RNA、蛋白質(zhì)等)。而且,在與上述有關(guān)的方面,本發(fā)明為制備含有一或多個(gè)(例如1、2、3、4、5、10、15)相同核酸區(qū)段和一或多個(gè)來(lái)源于一或多個(gè)核酸分子群成員的核酸區(qū)段的核酸分子群提供了方法。制備這些核酸分子的一個(gè)方法涉及使用含有兩個(gè)重組位點(diǎn)的載體。將第一核酸區(qū)段(其編碼具有特定功能或活性(例如信號(hào)肽活性、DNA結(jié)合活性、對(duì)特定配體的親和力等)的蛋白質(zhì))插入第一個(gè)重組位點(diǎn)中,而將來(lái)源于核酸分子群的第二核酸區(qū)段插入第二個(gè)重組位點(diǎn)。而且,任選地,可以將這些核酸區(qū)段與調(diào)節(jié)轉(zhuǎn)錄的序列連接,籍此產(chǎn)生通過(guò)該融合序列產(chǎn)生的融合肽和RNA分子。然后可以篩選所獲的組合文庫(kù),以鑒定編碼具有特定功能或活性(例如轉(zhuǎn)錄激活活性;DNA結(jié)合活性;形成多聚體的能力;在亞細(xì)胞區(qū)室如內(nèi)質(zhì)網(wǎng)、細(xì)胞核、線粒體、葉綠體、細(xì)胞膜等的定位;等)的表達(dá)產(chǎn)物的核酸分子。當(dāng)在諸如上述那些方法中使用三個(gè)或更多個(gè)(例如3、4、5、6、8、10等)核酸區(qū)段時(shí),一或多個(gè)核酸區(qū)段可以保持不變而一或多個(gè)核酸區(qū)段可以來(lái)源于一或多個(gè)核酸分子群的成員。例如,在構(gòu)建一個(gè)四部分分子(表示為A-B-C-D)時(shí),A和D可以是具有已知功能的已知分子(例如HIS6等標(biāo)簽、啟動(dòng)子、轉(zhuǎn)錄或翻譯信號(hào)、選擇標(biāo)記等),而B(niǎo)和C分子可以來(lái)源于一或多個(gè)核酸分子群。還可以在任何數(shù)量的標(biāo)準(zhǔn)分子生物學(xué)技術(shù)或這些技術(shù)的組合(體外或體內(nèi))中,對(duì)本發(fā)明的所有產(chǎn)物分子作進(jìn)一步操作、分析、或使用。這些技術(shù)包括測(cè)序、擴(kuò)增、核酸分子、制備RNA轉(zhuǎn)錄本(例如通過(guò)使用RNA啟動(dòng)子如T7或SP6啟動(dòng)子轉(zhuǎn)錄產(chǎn)物分子)、表達(dá)蛋白質(zhì)或肽(例如,表達(dá)融合蛋白、表達(dá)抗體、表達(dá)激素等)、蛋白質(zhì)-蛋白質(zhì)相互作用(雙雜種或反向雙雜種分析)、同源重組或基因打靶、和組合文庫(kù)分析和操作。本發(fā)明還涉及將本發(fā)明核酸分子(優(yōu)選地通過(guò)重組)克隆至一或多個(gè)載體(例如2、3、4、5、7、10、12、15、20、30、50等)或通過(guò)加入某些功能性載體序列(如復(fù)制起點(diǎn))將本發(fā)明核酸分子轉(zhuǎn)化成載體。在一個(gè)優(yōu)選方面,重組在體外完成(例如在無(wú)細(xì)胞系統(tǒng)中),而且直接在體外進(jìn)行進(jìn)一步操作或分析。因此,將本發(fā)明分子導(dǎo)入宿主細(xì)胞和/或使其維持在宿主細(xì)胞中的能力并不構(gòu)成對(duì)進(jìn)一步分析和操作的限制。因此,通過(guò)直接體外操作或分析本發(fā)明分子,可以花費(fèi)較少的時(shí)間并實(shí)現(xiàn)更大的處理量?;蛘?,可以在宿主細(xì)胞傳代后進(jìn)行體外分析或操作,或可以直接在體內(nèi)進(jìn)行分析或操作(例如當(dāng)在宿主細(xì)胞、組織、器官或生物體中時(shí))。根據(jù)本發(fā)明,核酸合成步驟可以包含(a)將目的核酸分子或模板和一或多個(gè)引物(例如1、2、3、4、5、7、10、12、15、20、30、50等)及一或多個(gè)核苷酸(例如1、2、3或4)混合,以形成混合物;和(b)在足以合成與所述分子或模板的全部或部分互補(bǔ)的核酸分子的條件下,孵育所述混合物。然后可以將此合成的分子用作模板以進(jìn)一步合成與此第一合成的分子的全部或部分互補(bǔ)的核酸分子。由此,可以制備雙鏈核酸分子(例如DNA)。優(yōu)選地,該第二合成步驟是在存在一或多個(gè)引物和一或個(gè)核苷酸的情況下,并在足以合成與此第一核酸分子的全部或部分互補(bǔ)的第二核酸分子的條件下進(jìn)行的。典型地,一或多個(gè)核酸分子(例如1、2、3、4、5、7、10、12、15、20、30、50等)的合成在存在一或多種聚合酶(優(yōu)選可以是熱穩(wěn)定的或中溫的DNA聚合酶)的情況下進(jìn)行,但也可以在此合成反應(yīng)中使用逆轉(zhuǎn)錄酶。因此,用作其它核酸分子的合成模板的核酸分子可以是RNA、mRNA、DNA或非天然的或衍生的核酸分子。根據(jù)本發(fā)明,可以通過(guò)使用含有引物位點(diǎn)的起始核酸分子,在產(chǎn)物分子中摻入一或多個(gè)引物位點(diǎn)(例如2、3、4、5、7、10、12、15、20、30、50等),以便于核酸的合成。因此,通過(guò)本發(fā)明方法,可以根據(jù)引物位點(diǎn)在起始分子內(nèi)的定位和起始分子加入產(chǎn)物分子中的順序,將引物位點(diǎn)添加在產(chǎn)物分子中的一或多個(gè)期望位置上。根據(jù)本發(fā)明,測(cè)序步驟可以包括(a)將待測(cè)序的核酸分子和一或多個(gè)引物(例如1、2、3、4、5、7、10、12、15、20、30、50等)、一或多個(gè)核苷酸(例如1、2、3或4)及一或多個(gè)終止劑(例如1、2、3、4、或5)混合,以形成混合物;(b)在足以合成與待測(cè)序的所述分子的全部或部分互補(bǔ)的分子群的條件下,孵育所述混合物;和(c)分離所述群體以確定待測(cè)序的所述分子的全部或部分核苷酸序列。該測(cè)序步驟優(yōu)選在存在一或多種聚合酶(例如DNA聚合酶和/或逆轉(zhuǎn)錄酶)及一或多個(gè)引物的情況下進(jìn)行。用于測(cè)序的優(yōu)選終止劑包括核苷酸衍生物例如雙脫氧核苷酸(ddATP、ddTTP、ddGTP、ddCTP和它們的衍生物)。根據(jù)本發(fā)明,可以通過(guò)使用含有引物位點(diǎn)的起始核酸分子,將一或多個(gè)測(cè)序引物位點(diǎn)(例如1、2、3、4、5、7、10、12、15、20、30、50等)摻入產(chǎn)物分子中,以便于核酸測(cè)序。因此,通過(guò)本發(fā)明方法,可以根據(jù)起始分子中引物位點(diǎn)的位置和起始分子加入產(chǎn)物分子中的順序,將測(cè)序引物位點(diǎn)添加在產(chǎn)物分子中的一或多個(gè)期望位置上。根據(jù)本發(fā)明,蛋白質(zhì)表達(dá)步驟可以包括(a)獲得包含一或多個(gè)表達(dá)信號(hào)(例如1、2、3或4個(gè))的待表達(dá)核酸分子;和(b)在所述表達(dá)信號(hào)的控制下表達(dá)該核酸分子的全部或部分,籍此產(chǎn)生由所述分子或其部分編碼的肽或蛋白質(zhì)。在本文中,表達(dá)信號(hào)可以說(shuō)是與待表達(dá)的序列可操作連接的。所表達(dá)的蛋白質(zhì)或肽可以在宿主細(xì)胞中(體內(nèi))表達(dá),但也可以使用本領(lǐng)域熟知技術(shù)體外(例如在無(wú)細(xì)胞表達(dá)系統(tǒng)中)進(jìn)行表達(dá)。一旦蛋白質(zhì)或肽表達(dá)后,可以任選地分離或純化蛋白質(zhì)或肽產(chǎn)物。而且,可以將該表達(dá)的蛋白質(zhì)或肽用于各種蛋白質(zhì)分析技術(shù)中,包括雙雜種相互作用、蛋白質(zhì)功能分析、和激動(dòng)劑/拮抗劑-蛋白質(zhì)相互作用(例如通過(guò)藥物、化合物或其它肽刺激或抑制蛋白質(zhì)的功能)。而且,可以對(duì)表達(dá)的蛋白質(zhì)或肽進(jìn)行篩選以鑒定出具有特定生物學(xué)活性的那些蛋白質(zhì)或肽。該活性的例子包括對(duì)核酸分子(例如DNA或RNA)、蛋白質(zhì)或肽的結(jié)合親和力。具體地,可以篩選表達(dá)的蛋白質(zhì)或肽,以鑒定對(duì)其它蛋白質(zhì)或其本身具有結(jié)合親和力的那些蛋白質(zhì)或肽。對(duì)其本身具有結(jié)合親和力的蛋白質(zhì)或肽一般能夠形成多聚體或聚積物。對(duì)其本身和/或其它蛋白質(zhì)具有結(jié)合親和力的蛋白質(zhì)或肽常能夠形成或參與形成多蛋白復(fù)合物例如抗體、剪接體、多亞基酶、核糖體等。上述表達(dá)的蛋白質(zhì)或肽、編碼這些蛋白質(zhì)或的核酸分子、用于制備這些核酸分子的方法、用于產(chǎn)生含有這些核酸分子的重組宿主細(xì)胞的方法、通過(guò)這些方法產(chǎn)生的重組宿主細(xì)胞、和用于產(chǎn)生這些表達(dá)的蛋白質(zhì)或肽的方法也包含在本發(fā)明范圍內(nèi)。通過(guò)本發(fā)明制備的、尤其是從本發(fā)明組合分子的表達(dá)制備的、新的獨(dú)特雜合蛋白質(zhì)或肽(例如融合蛋白)一般可以用于許多應(yīng)用。更具體地,正如本領(lǐng)域技術(shù)人員明了的,可以對(duì)本發(fā)明雜合蛋白質(zhì)或肽進(jìn)行設(shè)計(jì)和選擇,以便鑒定出實(shí)質(zhì)上行使任何功能的那些蛋白質(zhì)或肽??梢允褂眠@些蛋白質(zhì)的應(yīng)用的例子包括治療、工業(yè)生產(chǎn)(例如微生物合成氨基酸或糖)、小分子鑒定和純化(例如通過(guò)親和層析)、等。根據(jù)本發(fā)明,可以通過(guò)使用含有一或多個(gè)轉(zhuǎn)錄或翻譯信號(hào)(例如1、2、3、4、5、7、10、12、15等)或調(diào)節(jié)序列、起始密碼子、終止信號(hào)、拼接供體/受體序列(例如內(nèi)含子序列)等的起始分子,將這些序列摻入產(chǎn)物分子中,以利于蛋白質(zhì)的表達(dá)。因此,通過(guò)本發(fā)明的方法,可以根據(jù)表達(dá)序列在起始分子中的定位和起始分子加入產(chǎn)物分子中的順序,將這些序列添加在產(chǎn)物分子中的一或多個(gè)期望位置上。另一方面,本發(fā)明提供實(shí)現(xiàn)核酸分子間同源重組的方法,包括(a)將包含一或多個(gè)重組位點(diǎn)的至少第一核酸分子和至少一個(gè)靶核酸分子混合,其中該第一和靶核酸分子具有一或多個(gè)同源序列;和(b)通過(guò)同源重組使該第一和靶核酸分子發(fā)生重組。在本發(fā)明的具體實(shí)施方案中,本發(fā)明的同源重組方法導(dǎo)致將第一核酸分子的全部或部分轉(zhuǎn)移至靶核酸分子中。在本發(fā)明的某些具體實(shí)施方案中,該第一核酸分子包含兩個(gè)或更多個(gè)與靶核酸分子序列同源的序列。在其它具體實(shí)施方案中,第一核酸分子的同源序列位于至少一個(gè)選擇標(biāo)記和/或一或多個(gè)重組位點(diǎn)的側(cè)翼。在再其它具體實(shí)施方案中,第一核酸分子的同源序列位于側(cè)翼有重組位點(diǎn)的至少一個(gè)選擇標(biāo)記的側(cè)翼。在其它具體實(shí)施方案中,第一核酸分子的同源序列位于調(diào)節(jié)轉(zhuǎn)錄的核酸區(qū)段的側(cè)翼。而且,根據(jù)本發(fā)明,同源重組可以包括(a)將包含一或多個(gè)重組位點(diǎn)(例如1、2、3、4、5、7、10、12、15、20、30、50等)的本發(fā)明至少第一核酸分子(優(yōu)選產(chǎn)物分子)和至少一個(gè)靶核酸分子(例如1、2、3、4、5、7、10、12等)混合,其中所述第一和靶分子具有一或多個(gè)同源序列(例如1、2、3、4、5、7等);和(b)通過(guò)同源重組使所述第一和靶核酸分子重組。該同源重組可以體外(例如在無(wú)細(xì)胞系統(tǒng)中)發(fā)生,但優(yōu)選在體內(nèi)(例如在宿主細(xì)胞中)進(jìn)行。優(yōu)選地,同源重組使得含有重組位點(diǎn)的本發(fā)明核酸分子(第一核酸分子)的全部或部分轉(zhuǎn)移至含有同源序列的靶核酸分子的一或多個(gè)位點(diǎn)(例如1、2、3、4、5、7等)。可以通過(guò)正或負(fù)選擇(例如使用選擇標(biāo)記)促進(jìn)該同源重組的選擇,以便選出期望的產(chǎn)物和/或選擇除去不期望的產(chǎn)物。在一個(gè)優(yōu)選方面,本發(fā)明核酸分子包含至少一個(gè)選擇標(biāo)記和至少兩個(gè)與靶分子同源的序列。優(yōu)選地,第一分子包含至少兩個(gè)位于至少一個(gè)選擇標(biāo)記側(cè)翼的同源序列。因此,本發(fā)明有利于構(gòu)建基因靶向核酸分子或載體,這些核酸分子或載體可以用于敲除或突變目的序列或基因(或改變現(xiàn)有序列,例如將突變的序列轉(zhuǎn)變?yōu)橐吧托蛄?,尤其是宿主或宿主細(xì)胞如動(dòng)物(包括人等動(dòng)物)、植物、昆蟲(chóng)、細(xì)菌、酵母等中的基因或序列、或這些宿主或宿主細(xì)胞中外來(lái)物如病毒的序列。該基因打靶(genetargeting)可以優(yōu)選包含使序列靶向該宿主細(xì)胞的基因組。該基因打靶可以體外(例如在無(wú)細(xì)胞系統(tǒng)中)或在體內(nèi)(例如在宿主細(xì)胞中)進(jìn)行。因此,在一個(gè)優(yōu)選方面,本發(fā)明涉及靶向或突變核苷酸序列或基因的方法,包括(a)獲得至少一個(gè)包含至少一或多個(gè)重組位點(diǎn)(及優(yōu)選包含一或多個(gè)選擇標(biāo)記)的本發(fā)明核酸分子,其中所述分子包含一或多個(gè)與感興趣的靶基因或核苷酸序列同源的核苷酸序列(所述一或多個(gè)同源序列在本發(fā)明分子上優(yōu)選位于一或多個(gè)選擇標(biāo)記(如1、2、3、4、5、7、10等)的側(cè)翼);和(b)將所述分子和一或多個(gè)感興趣的靶基因或核苷酸序列(例如1、2、3、4、5、7、10、12、15、20、30、50等)在足以使所述感興趣的靶核苷酸序列或基因和所述本發(fā)明分子之間在一或多個(gè)位點(diǎn)(例如1、2、3、4、5、7、10等)處發(fā)生同源重組的條件下接觸,籍此將本發(fā)明分子的全部或部分插入靶核苷酸序列或基因中。此打靶方法可以造成靶核酸或基因的缺失、激活、失活、部分失活、或部分激活,以致由該靶核酸或基因正常表達(dá)的表達(dá)產(chǎn)物(典型的是蛋白質(zhì)或肽)不再產(chǎn)生、或以較高或較低的水平產(chǎn)生、或在某種程度上產(chǎn)生可以導(dǎo)致較高或較低活性或?qū)е率Щ罨虿糠质Щ畹谋磉_(dá)產(chǎn)物的改變蛋白質(zhì)序列。優(yōu)選存在于本發(fā)明分子上的選擇標(biāo)記促進(jìn)了對(duì)其中同源重組事件成功的候選者(例如宿主細(xì)胞)的選擇。因此,本發(fā)明提供方法以制備含有通過(guò)本發(fā)明打靶方法產(chǎn)生的修飾核酸或基因的宿主細(xì)胞、組織、器官和動(dòng)物(例如轉(zhuǎn)基因動(dòng)物)。該修飾的核酸或基因優(yōu)選包含由本發(fā)明核酸分子提供的至少一個(gè)重組位點(diǎn)和/或至少一個(gè)選擇標(biāo)記。因此,更具體地,本發(fā)明涉及對(duì)核酸或基因進(jìn)行打靶或突變的方法,包括(a)獲得包含側(cè)翼有一或多個(gè)與目的靶核酸或基因同源的(例如1、2、3、4、5、7、10等)序列的一或多個(gè)重組位點(diǎn)(例如1、2、3、4、5、7、10、12、15、20、30、50等)及至少一個(gè)選擇標(biāo)記(例如1、2、3、4、5、7、10等)的至少一個(gè)本發(fā)明核酸分子;(b)將所述分子和一或多個(gè)目的靶核酸或基因(例如1、2、3、4、5、7、10、12、15、20、30、50等)在足以使所述目的靶核酸或基因和核酸分子之間在一或多個(gè)位點(diǎn)處發(fā)生同源重組的條件下接觸,籍此將本發(fā)明核酸分子的全部或部分插入(優(yōu)選地,將至少一個(gè)選擇標(biāo)記和/或至少一個(gè)重組位點(diǎn)插入)目的靶核酸或基因中;和(c)任選地,選出包含本發(fā)明核酸分子的全部或部分的目的靶核酸或基因,或選出含有其中包含了本發(fā)明核酸分子的全部或部分的靶核酸或基因的宿主細(xì)胞。優(yōu)選地,用于上述方法中的選擇標(biāo)記是正選擇標(biāo)記(例如抗生素抗性標(biāo)記如氨芐青霉素、四環(huán)素、卡那霉素、新霉素、和G-418抗性標(biāo)記)。在一個(gè)一般方面,本發(fā)明提供對(duì)靶基因或核苷酸序列進(jìn)行打靶或突變的方法,包括(a)獲得至少一個(gè)包含一或多個(gè)重組位點(diǎn)及一或多個(gè)選擇標(biāo)記的第一核酸分子,其中該第一核酸分子包含一或多個(gè)與靶基因或核苷酸序列同源的核苷酸序列;和(b)將該第一核酸分子和一或多個(gè)靶基因或核苷酸序列在足以使該靶基因或核苷酸序列和該第一核酸分子之間在一或多個(gè)位點(diǎn)處發(fā)生同源重組的條件下接觸,由此將該第一核酸分子的全部或部分插入靶基因或核苷酸序列中。在本發(fā)明的某些具體實(shí)施方案中,該第一核酸分子包含至少一個(gè)側(cè)翼有同源序列的選擇標(biāo)記。在其它具體實(shí)施方案中,該選擇標(biāo)記的側(cè)翼有同源序列。在再其它實(shí)施方案中,靶基因或核苷酸序列由于同源重組而失活。在再其它具體實(shí)施方案中,本發(fā)明方法還包括選出含有該靶基因或核苷酸序列的宿主細(xì)胞。在一些具體實(shí)施方案中,第一核酸分子中與靶基因或核苷酸序列同源的一或多個(gè)核苷酸序列的一或多個(gè)與靶基因或核苷酸序列并不100%一致。換言之,利于同源重組的核酸區(qū)段不必具有100%的序列一致性。然而,一般地,這些核酸區(qū)段將在它們的同源區(qū)域中具有至少70%一致性(例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、或至少99%)。在許多情況下,使用與其發(fā)生重組的核酸(即靶基因或核苷酸序列)不具有100%序列一致性的核酸區(qū)段來(lái)推動(dòng)同源重組,可能是有利的。這類情況的一個(gè)例子是當(dāng)同源核酸相應(yīng)于作為基因的靶核苷酸序列的一部分時(shí),而同源重組將導(dǎo)致在靶核苷酸序列中引入一或多個(gè)的序列改變。在一個(gè)相關(guān)例子中,同源核酸可以相應(yīng)于是完整基因的靶核苷酸序列。因此,同源重組導(dǎo)致靶基因的置換。該情況的另一例子是當(dāng)需要對(duì)在待發(fā)生同源重組的位點(diǎn)上與第一核酸分子的一或多個(gè)同源核苷酸序列相比具有不同核苷酸序列的生物體實(shí)行同源重組的時(shí)候。例如,當(dāng)待發(fā)生同源重組的生物體與從中獲得第一核酸分子的同源核苷酸序列的生物體是不同株或種時(shí)、或當(dāng)該生物體在重組位點(diǎn)處具有不同基因型時(shí),可以導(dǎo)致這些序列的差異。而且,利于重組的同源區(qū)域的長(zhǎng)度可以在大小上改變,但一般長(zhǎng)至少15個(gè)核苷酸(例如至少20個(gè)核苷酸、至少50個(gè)核苷酸、至少100個(gè)核苷酸、至少200個(gè)核苷酸、至少400個(gè)核苷酸、至少600個(gè)核苷酸、至少800個(gè)核苷酸、至少1000個(gè)核苷酸、至少1500個(gè)核苷酸、至少2000個(gè)核苷酸、至少2500個(gè)核苷酸、至少3000個(gè)核苷酸、至少3500個(gè)核苷酸、至少4000個(gè)核苷酸、至少4500個(gè)核苷酸、至少5000個(gè)核苷酸、至少5500個(gè)核苷酸、至少6000個(gè)核苷酸、至少6000個(gè)核苷酸等)。本發(fā)明還提供通過(guò)本文所述方法產(chǎn)生的重組宿主細(xì)胞,該宿主可以是原核宿主(例如細(xì)菌)或真核宿主(例如真菌(如酵母)、植物、或動(dòng)物(如昆蟲(chóng)、哺乳動(dòng)物包括人類、等)宿主)。在本發(fā)明另一方面,可以使用根據(jù)本發(fā)明引入所靶向的核酸或基因中的重組位點(diǎn),切除、置換、或除去插在目的靶核酸或基因中的核酸分子的全部或部分。因此,本發(fā)明允許體外或體內(nèi)除去該核酸分子,因此可以允許重新激活靶核酸或基因。在一些實(shí)施方案中,在鑒定和分離了含有按上述引入的改變的核酸或基因后,可以除去本發(fā)明分子中存在的選擇標(biāo)記。本發(fā)明還提供將本發(fā)明起始或產(chǎn)物核酸分子克隆至一或多個(gè)載體或?qū)⒈景l(fā)明產(chǎn)物分子轉(zhuǎn)化為一或多個(gè)載體的方法。在一個(gè)方面,該起始分子的重組導(dǎo)致產(chǎn)生一或多個(gè)產(chǎn)物分子,并將該產(chǎn)物分子克隆(優(yōu)選地通過(guò)重組)至一或多個(gè)載體中。在另一方面,將起始分子直接克隆至一或多個(gè)載體中,以便在載體中將多個(gè)起始分子接合在一起,由此產(chǎn)生含有本發(fā)明產(chǎn)物分子的載體。在另一方面,將起始分子直接克隆至一或多個(gè)載體中,以便這些起始分子不在載體中接合在一起(即,通過(guò)載體序列將起始分子分隔開(kāi))。在再另一方面,可以將產(chǎn)物分子和起始分子的組合按任何順序克隆至一或多個(gè)載體中,由此產(chǎn)生包含由最初起始分子和產(chǎn)物分子組合形成的新產(chǎn)物分子的載體。因此,本發(fā)明涉及克隆方法,包括(a)獲得至少一個(gè)包含重組位點(diǎn)的本發(fā)明核酸分子(例如1、2、3、4、5、7、10、12個(gè)等);和(b)將所述分子的全部或部分轉(zhuǎn)移至一或多個(gè)載體(例如1、2、3、4、5、7、10、12、15個(gè)等)中。優(yōu)選地,該載體包含一或多個(gè)重組位點(diǎn)(例如1、2、3、4、5、7、10、12、15、20、30、50等),而向載體中轉(zhuǎn)移分子優(yōu)選通過(guò)載體上的一或多個(gè)位點(diǎn)(例如1、2、3、4、5、7、10等)和本發(fā)明分子上的一或多個(gè)位點(diǎn)(例如1、2、3、4、5、7、10等)間的重組來(lái)完成。在另一方面,可以通過(guò)將必需的載體序列(例如復(fù)制起點(diǎn))包括在內(nèi),將本發(fā)明產(chǎn)物分子轉(zhuǎn)化為發(fā)揮載體功能的分子。因此,根據(jù)本發(fā)明,可以通過(guò)使用含有該序列的起始分子,將這些載體序列摻入產(chǎn)物分子中??梢愿鶕?jù)這些載體序列在起始分子中的位置以及起始分子加入產(chǎn)物分子中的順序,將這些序列添加在產(chǎn)物分子的一或多個(gè)期望位置上。因此,本發(fā)明使得可以通過(guò)將可能期望的任何數(shù)量的功能性元件(優(yōu)選地通過(guò)重組)并入載體中,常規(guī)構(gòu)建期望載體。含有產(chǎn)物分子的載體序列可以是線性的、或可以通過(guò)使產(chǎn)物分子內(nèi)的重組位點(diǎn)重組或通過(guò)本領(lǐng)域熟知的連接技術(shù),被轉(zhuǎn)化為環(huán)狀或超螺旋形式的。優(yōu)選地,該產(chǎn)物分子的環(huán)化通過(guò)位于產(chǎn)物分子兩個(gè)末端或近末端的重組位點(diǎn)的重組來(lái)實(shí)現(xiàn)、或通過(guò)使產(chǎn)物分子的末端連接以環(huán)化該分子。正如已知的,可以將線性或環(huán)狀產(chǎn)物分子導(dǎo)入一或多個(gè)宿主或宿主細(xì)胞中作進(jìn)一步操作。用于本發(fā)明的載體序列在使用時(shí)可以包含一或多個(gè)元件和/或功能序列和/或位點(diǎn)(或它們的組合),包括一或多個(gè)測(cè)序或擴(kuò)增引物位點(diǎn)(例如1、2、3、4、5、7、10等)、一或多個(gè)賦予翻譯終止抑制因子活性的序列(例如1、2、3、4、5、7、10等)如編碼抑制型tRNA分子的序列、一或多個(gè)選擇標(biāo)記(例如1、2、3、4、5、7或10個(gè)毒性基因、抗生素抗性基因等)、一或多個(gè)轉(zhuǎn)錄或翻譯位點(diǎn)或信號(hào)(例如1、2、3、4、5、7、10等)、一或多個(gè)轉(zhuǎn)錄或翻譯終止位點(diǎn)(例如1、2、3、4、5、7、10、12等)、一或多個(gè)允許切除例如相應(yīng)于重組位點(diǎn)或該位點(diǎn)翻譯的蛋白質(zhì)的RNA的拼接位點(diǎn)(例如1、2、3、4、5、7、10等)、一或多個(gè)標(biāo)簽序列(例如HIS6、GST、GUS、GFP、YFP、CFP、表位標(biāo)簽等)、一或多個(gè)限制性位點(diǎn)(例如1、2、3、4、5、7、10等)、一或多個(gè)重組位點(diǎn)(或它們的部分)(例如1、2、3、4、5、7、10、12、15、20、30、50等)、等。用于本發(fā)明的載體序列還可以包含可按本文所述被抑制以允許表達(dá)期望融合蛋白的終止密碼子。因此,根據(jù)本發(fā)明,可以使用載體序列向本發(fā)明的任何核酸分子中導(dǎo)入一或多個(gè)這樣的元件、功能序列和/或位點(diǎn),可以使用這些序列進(jìn)一步操作或分析該核酸分子。例如,載體提供的引物位點(diǎn)(優(yōu)選位于克隆在該載體中的插入片段兩邊)使得可以對(duì)克隆在該載體中的產(chǎn)物分子的全部或部分進(jìn)行測(cè)序或擴(kuò)增。此外,載體所包含的轉(zhuǎn)錄或調(diào)節(jié)序列使得由克隆在載體中的產(chǎn)物分子的全部或部分編碼的肽、多肽或蛋白質(zhì)可以得以表達(dá)。同樣,載體所提供的基因、基因部分或序列標(biāo)簽(例如GUS、GST、GFP、YFP、CFP、HIS標(biāo)簽、表位標(biāo)簽等)使得可以構(gòu)建和克隆在載體中的產(chǎn)物分子融合的基因融合物群體、或使得可以產(chǎn)生由載體提供的序列標(biāo)簽聯(lián)合克隆在該載體中的產(chǎn)物序列共同編碼的許多肽、多肽或蛋白融合物。這些基因、基因部分、或序列標(biāo)簽可以與任選地受抑制的終止密碼子組合使用,以便可以控制由克隆在載體中的目的序列和載體提供的基因或標(biāo)簽序列編碼的融合蛋白的表達(dá)。在一個(gè)結(jié)構(gòu)中,載體可以包含一或多個(gè)重組位點(diǎn)、一或多個(gè)終止密碼子和一或多個(gè)標(biāo)簽序列。在一些實(shí)施方案中,該標(biāo)簽序列可以與重組位點(diǎn)相鄰。任選地,可以將可抑制的終止密碼子摻入標(biāo)簽的序列中或摻入重組位點(diǎn)的序列中,以便使得可以控制標(biāo)簽序列向目的基因的添加。在此類實(shí)施方案中,可以通過(guò)重組克隆將目的基因插入載體中,以致標(biāo)簽和目的基因的編碼序列在同一讀框中。可以與翻譯起始信號(hào)(例如Shine-Delgarno序列、Kozak序列和/或IRES序列)一起提供目的基因,以便允許在終止密碼子未受抑制時(shí)表達(dá)具有天然N端的基因。而且,可以對(duì)位于編碼融合蛋白成分的核酸區(qū)段之間的重組位點(diǎn)進(jìn)行設(shè)計(jì),以便不編碼終止密碼子或在融合蛋白讀框中不編碼終止密碼子。還可以將目的基因和位于該編碼序列3’末端的終止密碼子(例如可抑制的終止密碼子)一起提供。類似地,當(dāng)從多個(gè)核酸區(qū)段(例如3、4、5、6、8、10等個(gè)區(qū)段)產(chǎn)生融合蛋白時(shí),可以省去每個(gè)核酸區(qū)段之間編碼終止密碼子的核酸,并且,如果期望的話,可以將編碼終止密碼子的核酸放置在融合蛋白編碼區(qū)的3’末端。在一些實(shí)施方案中,可以在目的基因的N和C端提供標(biāo)簽序列。任選地,位于N端的標(biāo)簽序列可以和終止密碼子一起提供,目的基因可以和終止密碼子一起提供,C端標(biāo)簽可以和終止密碼子一起提供。這些終止密碼子可以相同或不同。在一些實(shí)施方案中,N端標(biāo)簽的終止密碼子不同于目的基因的終止密碼子。在此類實(shí)施方案中,可以提供相應(yīng)于終止密碼子之一或兩者的抑制型tRNA。當(dāng)提供兩者時(shí),每個(gè)抑制型tRNA均可以獨(dú)立地在同一載體上、不同載體上、或在宿主細(xì)胞的基因組中提供。抑制型tRNA不必以相同方式提供,例如,一個(gè)可以在含有目的基因的載體上提供,而另一個(gè)可以在宿主細(xì)胞基因組中提供。根據(jù)表達(dá)信號(hào)(如啟動(dòng)子)的定位,表達(dá)期間終止密碼子的抑制使得可以產(chǎn)生在表達(dá)的蛋白質(zhì)的N和/或C端具有標(biāo)簽序列的融合肽。通過(guò)對(duì)終止密碼子不加抑制,可以表達(dá)不具有N和/或C端標(biāo)簽序列的目的序列。因此,本發(fā)明使得可以通過(guò)重組有效地構(gòu)建含有目的基因或序列(例如1、2、3、4、5、6、10或更多個(gè)ORF)的載體,以便根據(jù)需要控制融合蛋白的表達(dá)。優(yōu)選地,根據(jù)本發(fā)明克隆或構(gòu)建的本發(fā)明起始核酸分子或產(chǎn)物分子包含至少一個(gè)可讀框(ORF)(例如1、2、3、4、5、7、10、12、或15個(gè)ORF)。這些起始或產(chǎn)物分子還可以包含功能序列(例如引物位點(diǎn)、轉(zhuǎn)錄或翻譯位點(diǎn)或信號(hào)、終止位點(diǎn)(例如可以任選地抑制的終止密碼子)、復(fù)制起點(diǎn)等),并優(yōu)選地包含調(diào)節(jié)基因表達(dá)的序列(包括轉(zhuǎn)錄調(diào)節(jié)序列)和發(fā)揮內(nèi)部核糖體進(jìn)入位點(diǎn)(IRES)作用的序列。優(yōu)選地,至少一個(gè)起始或產(chǎn)物分子和/或載體包含發(fā)揮啟動(dòng)子功能的序列。這些起始或產(chǎn)物分子和/或載體還可以包含轉(zhuǎn)錄終止序列、選擇標(biāo)記、限制性酶識(shí)別位點(diǎn)等。在一些實(shí)施方案中,起始或產(chǎn)物分子和/或載體包含兩個(gè)拷貝的相同選擇標(biāo)記,每個(gè)拷貝的側(cè)翼有兩個(gè)重組位點(diǎn)。在其它實(shí)施方案中,起始或產(chǎn)物分子和/或載體包含兩個(gè)不同的選擇標(biāo)記,每個(gè)選擇標(biāo)記的側(cè)翼有兩個(gè)重組位點(diǎn)。在一些實(shí)施方案中,該選擇標(biāo)記中的一或多個(gè)可以是負(fù)選擇標(biāo)記(例如ccdB、kicB、單純皰疹病毒胸苷激酶、胞嘧啶脫氨酶等)。在一方面,本發(fā)明提供克隆核酸分子的方法,包括(a)提供側(cè)翼有第一和第二重組位點(diǎn)的第一核酸區(qū)段;(b)提供側(cè)翼有第三和第四重組位點(diǎn)的第二核酸區(qū)段,其中該第一或第二重組位點(diǎn)能夠和第三或第四重組位點(diǎn)重組;(c)進(jìn)行重組反應(yīng),以便這兩個(gè)核酸區(qū)段重組為一個(gè)單一的核酸分子;和(d)克隆此單一核酸分子。在這些方法的某些具體實(shí)施方案中,第一重組位點(diǎn)不能與第二和第四重組位點(diǎn)重組,而第二重組位點(diǎn)不能與第一和第三重組位點(diǎn)重組。在一個(gè)具體方面,本發(fā)明提供克隆方法,包括提供包含至少第一和第二重組位點(diǎn)的至少第一核酸分子和包含至少第三和第四重組位點(diǎn)的至少第二核酸分子,其中該第一或第二重組位點(diǎn)能夠與第三或第四重組位點(diǎn)重組;和進(jìn)行重組反應(yīng),以便這兩個(gè)核酸分子重組為一或多個(gè)產(chǎn)物核酸分子,并將此產(chǎn)物核酸分子克隆在一或多個(gè)載體中。優(yōu)選地,這些重組位點(diǎn)位于第一和/或第二核酸分子的側(cè)翼。而且,該克隆步驟優(yōu)選通過(guò)重組反應(yīng)將產(chǎn)物分子重組入包含一或多個(gè)重組位點(diǎn)的載體中,但該克隆步驟也可以通過(guò)本領(lǐng)域熟知的標(biāo)準(zhǔn)連接反應(yīng)來(lái)完成。一方面,克隆步驟包括使產(chǎn)物核酸分子中在第一次重組反應(yīng)中沒(méi)有反應(yīng)的位點(diǎn)和具有能夠和該未反應(yīng)的位點(diǎn)發(fā)生重組的重組位點(diǎn)的載體之間進(jìn)行重組反應(yīng)。另一方面,本發(fā)明提供克隆核酸分子的方法,包括(a)提供側(cè)翼有至少第一和第二重組位點(diǎn)的第一核酸區(qū)段和側(cè)翼有至少第三和第四重組位點(diǎn)的第二核酸區(qū)段,其中位于該第一和第二核酸區(qū)段側(cè)翼的每個(gè)重組位點(diǎn)均不能和位于該第一和第二核酸分子區(qū)段側(cè)翼的任何其它位點(diǎn)重組;(b)提供包含至少第五、第六、第七和第八重組位點(diǎn)的載體,其中該至少第五、第六、第七和第八重組位點(diǎn)的每一個(gè)均能夠與該至少第一、第二、第三和/或第四重組位點(diǎn)的一個(gè)重組;和(c)進(jìn)行重組反應(yīng),以便這兩個(gè)核酸區(qū)段重組進(jìn)入載體中,由此克隆該第一和第二核酸區(qū)段。在另一具體方面,本發(fā)明提供克隆方法,包括提供包含至少第一和第二重組位點(diǎn)的至少第一核酸分子和包含至少第三和第四重組位點(diǎn)的至少第二核酸分子,其中該第一、二、三或四重組位點(diǎn)均不能與其它任何位點(diǎn)發(fā)生重組;提供包含至少第五、第六、第七和第八重組位點(diǎn)的載體,其中該第五、第六、第七和第八重組位點(diǎn)每個(gè)均能夠與該第一、二、三或四重組位點(diǎn)中的一個(gè)重組;和進(jìn)行重組反應(yīng),以便至少所述第一和第二核酸分子重組進(jìn)入所述載體中。在再一方面,該方法可以允許克隆至少一個(gè)其它的核酸分子(例如,至少第三核酸分子),其中所述分子的側(cè)翼有第九和第10重組位點(diǎn)而其中該載體包含各能夠和該第九或第10重組位點(diǎn)重組的第11和第12重組位點(diǎn)。特別地,本發(fā)明還提供克隆方法,包括提供第一、第二和第三核酸分子,其中該第一核酸分子的側(cè)翼有至少第1和第2重組位點(diǎn),該第二核酸分子的側(cè)翼有至少第3和第4重組位點(diǎn)、而該第三核酸分子的側(cè)翼有至少第5和第6重組位點(diǎn),其中該第2重組位點(diǎn)能夠和第3重組位點(diǎn)重組,而該第4重組位點(diǎn)能夠和第5重組位點(diǎn)重組;提供具有至少第7和第8重組位點(diǎn)的載體,其中該第7重組位點(diǎn)能夠和第1重組位點(diǎn)反應(yīng)而該第8重組位點(diǎn)能夠和第6重組位點(diǎn)反應(yīng);和實(shí)施至少一次重組反應(yīng),以便該第2和第3重組位點(diǎn)重組、第4和第5重組位點(diǎn)重組、第1和第7重組位點(diǎn)重組、第6和第8重組位點(diǎn)重組,由此將該第一、二、三核酸區(qū)段克隆在所述載體中。在另一具體方面,本發(fā)明提供克隆方法,包括提供至少第1、2、3核酸分子,其中該第1核酸分子的側(cè)翼有第1和2重組位點(diǎn),該第2核酸分子的側(cè)翼有第3和4重組位點(diǎn)、而該第3核酸分子的側(cè)翼有第5和6重組位點(diǎn),其中該第2重組位點(diǎn)能夠和第3重組位點(diǎn)重組、而第1、4、5或6重組位點(diǎn)沒(méi)有一個(gè)能夠和第1至第6重組位點(diǎn)中的任一個(gè)重組;提供包含位于至少第一選擇標(biāo)記側(cè)翼的第7和第8重組位點(diǎn)、并包含位于至少第二選擇標(biāo)記側(cè)翼的第9和第10重組位點(diǎn)的一或多個(gè)載體,其中該第7至第10重組位點(diǎn)沒(méi)有一個(gè)能夠和該第7至第10重組位點(diǎn)中的任一個(gè)重組;實(shí)施至少一次重組反應(yīng),以便該第2和第3重組位點(diǎn)重組、第1和第4重組位點(diǎn)與第7和第8重組位點(diǎn)重組、而第5和第6重組位點(diǎn)與第9和第10重組位點(diǎn)重組,由此克隆該第1、2、3核酸區(qū)段。在一些實(shí)施方案中,這些選擇標(biāo)記可以相同或可以不同。而且,該一或多個(gè)選擇標(biāo)記(例如2、3、4、5、7等)可以是負(fù)選擇標(biāo)記。本發(fā)明還提供克隆n個(gè)核酸區(qū)段的方法,其中n是大于1的整數(shù),該方法包括(a)提供n個(gè)核酸區(qū)段,每個(gè)區(qū)段的側(cè)翼均有兩個(gè)不能彼此重組的重組位點(diǎn);(b)提供包含2n個(gè)重組位點(diǎn)的載體,其中此2n個(gè)重組位點(diǎn)中每個(gè)均能夠與位于該核酸區(qū)段之一側(cè)翼的其中一個(gè)重組位點(diǎn)重組;和(c)實(shí)施重組反應(yīng),以便該n個(gè)核酸區(qū)段重組進(jìn)入載體中,由此克隆該n個(gè)核酸區(qū)段。在具體實(shí)施方案中,該n個(gè)核酸區(qū)段和載體間的重組反應(yīng)是在一或多個(gè)重組蛋白存在時(shí)在利于該重組發(fā)生的條件下進(jìn)行的。在其它具體實(shí)施方案中,n是2、3、4或5。因此,一般地,本發(fā)明提供克隆n個(gè)核酸分子的方法,其中n是大于1的整數(shù),該方法包括步驟提供n個(gè)核酸分子,每個(gè)分子包含至少一個(gè)、優(yōu)選兩個(gè)重組位點(diǎn)(這兩個(gè)重組位點(diǎn)優(yōu)選位于n核酸分子的側(cè)翼);提供至少一個(gè)包含一或多個(gè)重組位點(diǎn)(優(yōu)選2n個(gè)重組位點(diǎn))的載體,其中載體所含重組位點(diǎn)能夠和此n個(gè)分子的重組位點(diǎn)重組;和實(shí)施重組反應(yīng),以便將該n個(gè)核酸分子插入所述載體中,由此克隆該n個(gè)核酸區(qū)段。這n個(gè)分子可以彼此相接地或毗鄰地插入載體中和/或可以插入載體的不同位置中。用于根據(jù)本發(fā)明的克隆的載體優(yōu)選包含n個(gè)拷貝的相同或不同選擇標(biāo)記,每個(gè)拷貝的選擇標(biāo)記的側(cè)翼有至少兩個(gè)重組位點(diǎn)。優(yōu)選地,這些選擇標(biāo)記中的一或多個(gè)是負(fù)選擇標(biāo)記。一般地,本發(fā)明還涉及克隆n個(gè)核酸分子的方法,其中n是大于1的整數(shù),該方法包括步驟提供第1至第n個(gè)核酸分子,每個(gè)分子的側(cè)翼有至少兩個(gè)重組位點(diǎn),其中對(duì)這些重組位點(diǎn)進(jìn)行選擇以便位于第i個(gè)區(qū)段,即ni,側(cè)翼的兩個(gè)重組位點(diǎn)中的一個(gè)與位于第ni-1區(qū)段側(cè)翼的重組位點(diǎn)中的一個(gè)反應(yīng),而位于第i區(qū)段,即ni,側(cè)翼的另一重組位點(diǎn)和位于第ni+1區(qū)段側(cè)翼的一個(gè)重組位點(diǎn)反應(yīng);提供包含至少兩個(gè)重組位點(diǎn)的載體,其中載體上的這兩個(gè)重組位點(diǎn)中的一個(gè)和第1核酸區(qū)段上的一個(gè)位點(diǎn)反應(yīng),而載體上的另一位點(diǎn)和第n個(gè)核酸區(qū)段上的一個(gè)重組位點(diǎn)反應(yīng)。根據(jù)需要并根據(jù)存在的功能元件,通過(guò)本發(fā)明方法克隆的核酸分子/區(qū)段可以是不同類型的并可以具有不同的功能。一方面,根據(jù)本發(fā)明克隆的至少一個(gè)核酸區(qū)段與能夠調(diào)節(jié)轉(zhuǎn)錄的序列(例如啟動(dòng)子、增強(qiáng)子、阻遏基因(repressor)等)可操作地連接。例如,至少一個(gè)核酸區(qū)段可以可操作地和啟動(dòng)子連接,該啟動(dòng)子可以是誘導(dǎo)型啟動(dòng)子或組成型啟動(dòng)子。在再其它具體實(shí)施方案中,從該克隆的核酸區(qū)段產(chǎn)生的RNA的翻譯導(dǎo)致產(chǎn)生融合蛋白或單個(gè)蛋白的全部或部分。在其它具體實(shí)施方案中,至少一個(gè)核酸區(qū)段編碼全部或部分的可讀框,而至少一個(gè)核酸區(qū)段含有能夠調(diào)節(jié)轉(zhuǎn)錄的序列(例如啟動(dòng)子、增強(qiáng)子、阻遏基因等)。在其它具體實(shí)施方案中,至少一個(gè)核酸區(qū)段在轉(zhuǎn)錄時(shí)產(chǎn)生有義RNA鏈,而至少一個(gè)核酸區(qū)段在轉(zhuǎn)錄時(shí)產(chǎn)生反義RNA鏈。在相關(guān)實(shí)施方案中,該有義RNA和反義RNA具有至少一個(gè)互補(bǔ)區(qū)域并能夠相互雜交。在其它具體實(shí)施方案中,至少兩個(gè)核酸區(qū)段的轉(zhuǎn)錄導(dǎo)致產(chǎn)生一個(gè)單一的RNA或兩個(gè)單獨(dú)的RNA。在各種具體實(shí)施方案中,這些核酸區(qū)段可以彼此連接、或可以在同一核酸分子中在空間上隔離。在特定實(shí)施方案中,該核酸區(qū)段包含一或多個(gè)文庫(kù)中的核酸分子。而且,這些文庫(kù)可以包含cDNA、合成的DNA、或基因組DNA。此外,這些文庫(kù)的核酸分子可以編碼抗體分子的可變區(qū)(例如,抗體輕鏈和重鏈的可變區(qū))。在特定實(shí)施方案中,本發(fā)明提供篩選方法,以鑒定編碼對(duì)一或多個(gè)抗原具有結(jié)合特異性的蛋白質(zhì)和/或具有一或多個(gè)活性(例如從細(xì)胞中分泌、亞細(xì)胞定位(如定位在內(nèi)質(zhì)網(wǎng)、細(xì)胞核、線粒體、葉綠體、細(xì)胞膜等)、配體結(jié)合活性(如小分子、對(duì)核酸、細(xì)胞表面受體、可溶性蛋白質(zhì)、金屬離子、結(jié)構(gòu)元件、蛋白相互作用域等的結(jié)合活性)、酶活性等)的蛋白質(zhì)。而且,使用本發(fā)明方法克隆的核酸分子/區(qū)段具有上述一或多個(gè)活性。在另一方面,本發(fā)明提供克隆至少一個(gè)核酸分子的方法,包括(a)提供至少第1、2、和3核酸區(qū)段,其中該第1核酸區(qū)段的側(cè)翼有至少第1和2重組位點(diǎn)、第2核酸區(qū)段的側(cè)翼有至少第3和4重組位點(diǎn)、而第3核酸區(qū)段的側(cè)翼有至少第5和6重組位點(diǎn),其中該第2重組位點(diǎn)能夠和第3重組位點(diǎn)重組,而第1、4、5或6重組位點(diǎn)中沒(méi)有一個(gè)能夠和該第1至第6重組位點(diǎn)中的任一個(gè)重組;(b)提供包含位于至少第一負(fù)選擇標(biāo)記側(cè)翼的第7和第8重組位點(diǎn)、并包含位于至少第二負(fù)選擇標(biāo)記側(cè)翼的第9和第10重組位點(diǎn)的載體,其中該第7至第10重組位點(diǎn)中沒(méi)有一個(gè)能夠和該第7至第10重組位點(diǎn)中的任一個(gè)重組;(c)實(shí)施第一重組反應(yīng),以便該第2和第3重組位點(diǎn)重組;和(d)實(shí)施第二重組反應(yīng),以便第1和第4重組位點(diǎn)與第7和第8重組位點(diǎn)重組、而第5和第6重組位點(diǎn)與第9和第10重組位點(diǎn)重組,由此克隆該第1、2、3核酸區(qū)段。在相關(guān)實(shí)施方案中,該第1和第2重組反應(yīng)是在一或多個(gè)重組蛋白存在時(shí)在利于該重組發(fā)生的條件下進(jìn)行的。該第1和第2重組反應(yīng)可以同時(shí)或相繼進(jìn)行。另一方面,本發(fā)明提供克隆至少一個(gè)核酸分子的方法,包括(a)提供第1、2、和3核酸區(qū)段,其中該第1核酸區(qū)段的側(cè)翼有第1和2重組位點(diǎn)、第2核酸區(qū)段的側(cè)翼有第3和4重組位點(diǎn)、而第3核酸區(qū)段的側(cè)翼有第5和6重組位點(diǎn),其中該第2重組位點(diǎn)能夠和第3重組位點(diǎn)重組,而第4重組位點(diǎn)能夠和第5重組位點(diǎn)重組;(b)提供包含第7和第8重組位點(diǎn)的載體;(c)實(shí)施至少一次重組反應(yīng),以便該第2和第3重組位點(diǎn)重組,第4和第5重組位點(diǎn)重組,第1和第6重組位點(diǎn)分別與第7和第8重組位點(diǎn)重組,由此克隆該第1、2、3核酸區(qū)段。在相關(guān)實(shí)施方案中,這些重組反應(yīng)是在一或多個(gè)重組蛋白存在時(shí)在利于該重組發(fā)生的條件下進(jìn)行的。在特定實(shí)施方案中,彼此發(fā)生重組的重組位點(diǎn)包含具有一致7堿基對(duì)重疊區(qū)的att位點(diǎn)。另一方面,本發(fā)明提供克隆n個(gè)核酸片段的方法,其中n是大于2的整數(shù),該方法包括(a)提供第1至第n個(gè)核酸區(qū)段,每個(gè)區(qū)段的側(cè)翼有至少兩個(gè)重組位點(diǎn),其中對(duì)這些重組位點(diǎn)進(jìn)行選擇以便位于第i個(gè)區(qū)段,即ni,側(cè)翼的兩個(gè)重組位點(diǎn)中的一個(gè)與位于第ni-1區(qū)段側(cè)翼的重組位點(diǎn)中的一個(gè)反應(yīng),而位于第i區(qū)段側(cè)翼的另一重組位點(diǎn)和位于第ni+1區(qū)段側(cè)翼的一個(gè)重組位點(diǎn)反應(yīng);(b)提供包含至少兩個(gè)重組位點(diǎn)的載體,其中載體上的這兩個(gè)重組位點(diǎn)中的一個(gè)和第1核酸區(qū)段上的一個(gè)位點(diǎn)反應(yīng),而載體上的另一位點(diǎn)和第n個(gè)核酸區(qū)段上的一個(gè)重組位點(diǎn)反應(yīng);和(c)實(shí)施至少一次重組反應(yīng),以便將所有的核酸片段重組至載體中。在具體實(shí)施方案中,該重組反應(yīng)在存在一或多個(gè)重組蛋白時(shí)在利于該重組發(fā)生的條件下進(jìn)行。在上述方法的具體實(shí)施方案中,將多個(gè)核酸區(qū)段插入另一核酸分子中。盡管這些方法可以有多種變化,但在具體實(shí)施方案中,將含有具有不同特異性的重組位點(diǎn)(例如attL1和attL2)的核酸區(qū)段插入含有一組以上關(guān)連重組位點(diǎn)(例如attR1和attR2)的載體中,其中每一組關(guān)連重組位點(diǎn)均位于負(fù)選擇標(biāo)記的側(cè)翼。因此,可以使用在關(guān)連位點(diǎn)的重組結(jié)果選出在一或多個(gè)重組位點(diǎn)經(jīng)歷了重組的核酸分子。插入載體中的核酸區(qū)段可以相同或不同。而且,這些核酸區(qū)段可以編碼表達(dá)產(chǎn)物或可以是轉(zhuǎn)錄控制序列。當(dāng)核酸區(qū)段編碼表達(dá)產(chǎn)物時(shí),可以使用本發(fā)明載體擴(kuò)增拷貝數(shù)或增加編碼產(chǎn)物的表達(dá)。而且,當(dāng)將核酸區(qū)段以正向和反向插入時(shí),可以使用本發(fā)明載體例如表達(dá)RNAi,見(jiàn)本文其它地方的描述。當(dāng)核酸區(qū)段編碼調(diào)節(jié)轉(zhuǎn)錄的序列(例如啟動(dòng)子、增強(qiáng)子等)時(shí),可以使用本發(fā)明載體將多個(gè)調(diào)節(jié)元件可操作地與編碼表達(dá)產(chǎn)物的核酸連接。例如,此性質(zhì)的載體可以通過(guò)提供多個(gè)與激活轉(zhuǎn)錄的蛋白質(zhì)結(jié)合的位點(diǎn),用于增加表達(dá)產(chǎn)物的表達(dá)量。類似地,例如可以通過(guò)提供多個(gè)與抑制轉(zhuǎn)錄的蛋白質(zhì)結(jié)合的位點(diǎn),使用此性質(zhì)的載體減少表達(dá)產(chǎn)物的表達(dá)量。例如,可以通過(guò)多個(gè)拷貝的編碼參與轉(zhuǎn)錄調(diào)節(jié)的因子的核酸分子的表達(dá),使用此性質(zhì)的載體增加或減少表達(dá)產(chǎn)物的表達(dá)量。與上述相關(guān)的其它實(shí)施方案將是本領(lǐng)域技術(shù)人員明了的。另一方面,本發(fā)明提供克隆至少一個(gè)核酸分子的方法,包括(a)提供第一群核酸分子,其中這些分子的全部或部分在側(cè)翼有至少第一和第二重組位點(diǎn);(b)提供側(cè)翼有至少第三和第四重組位點(diǎn)的至少一個(gè)核酸區(qū)段,其中該第一或第二重組位點(diǎn)能夠和第三或第四重組位點(diǎn)發(fā)生重組;(c)進(jìn)行重組反應(yīng),以便該群體中的所有或部分核酸分子與該區(qū)段重組,以形成第二群核酸分子;和(d)克隆該第二群核酸分子。在相關(guān)實(shí)施方案中,這些重組反應(yīng)是在存在一或多個(gè)重組蛋白時(shí)在利于該重組發(fā)生的條件下進(jìn)行的。在具體實(shí)施方案中,該第二群核酸分子編碼融合蛋白。在相關(guān)實(shí)施方案中,該核酸區(qū)段編碼的多肽包含編碼以下成員全部或部分的序列(優(yōu)選地N端和/或C端標(biāo)簽序列)免疫球蛋白的Fc部分、抗體、β-葡糖醛酸糖苷酶、熒光蛋白(例如綠色熒光蛋白、黃色熒光蛋白、紅色熒光蛋白、藍(lán)色熒光蛋白等)、轉(zhuǎn)錄激活域、參與翻譯的蛋白質(zhì)或域、蛋白質(zhì)定位標(biāo)簽、蛋白質(zhì)穩(wěn)定或脫穩(wěn)定序列、蛋白質(zhì)相互作用域、DNA的結(jié)合域、蛋白底物、純化標(biāo)簽(例如表位標(biāo)簽、麥芽糖結(jié)合蛋白、6組氨酸標(biāo)簽、谷胱苷肽S轉(zhuǎn)移酶等)、和表位標(biāo)簽。另一方面,本發(fā)明提供克隆至少一個(gè)核酸分子的方法,包括(a)提供第一群核酸分子,其中這些分子的全部或部分在側(cè)翼有至少第一和第二重組位點(diǎn);(b)提供第二群核酸分子,其中這些分子的全部或部分在側(cè)翼有第三和第四重組位點(diǎn),其中該第一或第二重組位點(diǎn)能夠和第三或第四重組位點(diǎn)重組;(c)實(shí)施重組反應(yīng),以便第一群中的所有或部分分子和第二群的一或多個(gè)分子重組,形成第三群核酸分子;和(d)克隆第三群核酸分子。在相關(guān)實(shí)施方案中,該重組反應(yīng)是在存在一或多個(gè)重組蛋白時(shí)在利于該重組發(fā)生的條件下進(jìn)行的。因此,一般地,本發(fā)明提供將至少兩個(gè)核酸區(qū)段接合起來(lái)(包括將核酸分子群接合起來(lái))的方法,該方法包括(a)提供至少兩個(gè)核酸區(qū)段(其中一個(gè)或兩者可以來(lái)源于一群分子或文庫(kù)分子),每個(gè)區(qū)段包含至少一個(gè)能夠和另一(或第二)區(qū)段上存在的重組位點(diǎn)發(fā)生重組的重組位點(diǎn);和(b)在使這些重組位點(diǎn)間發(fā)生重組的條件下將這些區(qū)段和一或多個(gè)重組蛋白接觸,由此使這些區(qū)段接合起來(lái)。本發(fā)明還提供包含通過(guò)該方法制備的這些相接合的核酸區(qū)段(或區(qū)段群)的組合物、包含這些相接合的核酸區(qū)段的宿主或宿主細(xì)胞(它們可以是宿主細(xì)胞群或重組宿主細(xì)胞)、和制備這些宿主或宿主細(xì)胞的方法(例如通過(guò)用本發(fā)明產(chǎn)物分子轉(zhuǎn)化或轉(zhuǎn)染這些細(xì)胞)。在具體實(shí)施方案中,本發(fā)明方法還包含將該相接合的核酸區(qū)段插入一或多個(gè)載體中。本發(fā)明還涉及含有這些載體的宿主或宿主細(xì)胞。在其它具體實(shí)施方案中,這兩個(gè)核酸區(qū)段的至少一個(gè)編碼具有一或多種可鑒定活性的表達(dá)產(chǎn)物(例如選擇標(biāo)記、酶、核酶等)。在再其它具體實(shí)施方案中,這兩個(gè)核酸區(qū)段的至少一個(gè)含有全部或部分的可讀框(ORF)。在另一方面,這兩個(gè)區(qū)段的至少一個(gè)含有能夠調(diào)節(jié)轉(zhuǎn)錄的序列(例如啟動(dòng)子、增強(qiáng)子、阻遏基因等)。在一個(gè)具體方面,一個(gè)區(qū)段編碼ORF而另一個(gè)編碼能夠調(diào)節(jié)轉(zhuǎn)錄和/或翻譯的序列,而重組反應(yīng)使得這些序列可操作地相連。在再其它具體實(shí)施方案中,這些核酸區(qū)段中的一或多個(gè)編碼選擇標(biāo)記或含有復(fù)制起點(diǎn)。在其它具體實(shí)施方案中,這些核酸區(qū)段的一些或所有含有一或多個(gè)文庫(kù)的核酸分子。在某些具體實(shí)施方案中,該一或多個(gè)文庫(kù)包含編碼抗體分子可變區(qū)的多核苷酸。在相關(guān)實(shí)施方案中,這些核酸區(qū)段的至少一個(gè)編碼用于連接抗體分子可變區(qū)的多肽接頭和/或一或多個(gè)文庫(kù)包含編碼抗體輕和重鏈可變區(qū)的多核苷酸。在具體實(shí)施方案中,本發(fā)明方法還包含至少一個(gè)篩選步驟以鑒定編碼具有一或多個(gè)可鑒定活性(例如對(duì)一或多個(gè)抗原的結(jié)合特異性、酶活性、與選擇標(biāo)記相關(guān)的活性等)的蛋白質(zhì)的核酸分子。因此,可以使用本發(fā)明產(chǎn)生修飾的表達(dá)產(chǎn)物(通過(guò)可變地連接不同區(qū)段和/或置換和/或缺失區(qū)段)和分析表達(dá)產(chǎn)物的期望活性。根據(jù)本發(fā)明,可以連接基因的部分和/或許多基因,以表達(dá)新蛋白質(zhì)或新化合物并選出令人感興趣的活性。正如本文所述,還可以使用對(duì)這些連接分子的替換和/或缺失,產(chǎn)生改變的或修飾的蛋白質(zhì)或化合物用于測(cè)試。一方面,可以通過(guò)本發(fā)明方法修飾生物學(xué)途徑,以便例如在特定的途徑中使用不同的酶或突變的酶(例如,連接在相同生物學(xué)途徑中參與反應(yīng)的不同酶或突變酶)。根據(jù)本發(fā)明對(duì)生物學(xué)途徑的此修飾將導(dǎo)致(1)產(chǎn)生潛在的新化合物如抗生素或糖或(2)獨(dú)有的蛋白質(zhì)翻譯后修飾(例如糖基化、唾液酸化(sialation)等)。本發(fā)明還使得可以通過(guò)操作或改變多聚體酶復(fù)合物的亞基產(chǎn)生新的酶。在其它具體實(shí)施方案中,本發(fā)明還提供改變細(xì)胞性質(zhì)的方法,包括將上述方法制備的核酸區(qū)段導(dǎo)入細(xì)胞中。在某些具體實(shí)施方案中,通過(guò)本發(fā)明方法改變或產(chǎn)生的細(xì)胞是真菌細(xì)胞或細(xì)菌細(xì)胞(例如大腸桿菌(Escherichiacoli))。本發(fā)明還提供改變生物學(xué)途徑和產(chǎn)生新的生物學(xué)途徑的方法。例如,可以使用本發(fā)明方法改變編碼參與產(chǎn)生特定途徑(例如導(dǎo)致抗生素產(chǎn)生的途徑)的產(chǎn)物的基因。這些改變包括缺失、置換和/或突變編碼參與該途徑的產(chǎn)物的一或多個(gè)基因。此外,可以對(duì)基因的區(qū)域進(jìn)行缺失或交換,然后篩選鑒定出例如具有特定性質(zhì)(例如特定甲基化方式)的途徑產(chǎn)物。而且,可以合并不同生物的行使相似但不同功能的基因以產(chǎn)生新的產(chǎn)物。而且,可以通過(guò)對(duì)特異功能性質(zhì)(例如抑制酶反應(yīng)的能力、對(duì)特定配體的結(jié)合親和力、抗微生物活性、抗病毒活性等)的篩選,鑒定出這些產(chǎn)物。因此,一方面,本發(fā)明提供篩選方法用于鑒定本發(fā)明核酸分子的表達(dá)產(chǎn)物所產(chǎn)生的化合物。而且,當(dāng)編碼參與特定生物學(xué)途徑或過(guò)程的一或多個(gè)表達(dá)產(chǎn)物的核酸區(qū)段被組裝在一或多個(gè)核酸分子時(shí),可以對(duì)這些分子的區(qū)域(例如編碼表達(dá)產(chǎn)物的區(qū)域)進(jìn)行缺失或置換以產(chǎn)生,例如,表達(dá)其它表達(dá)產(chǎn)物或改變的表達(dá)產(chǎn)物的核酸分子、或產(chǎn)生不表達(dá)參與該生物學(xué)途徑或過(guò)程的一或多個(gè)表達(dá)產(chǎn)物的核酸分子。而且,可以將編碼一或多個(gè)參與特定生物學(xué)途徑或過(guò)程的表達(dá)產(chǎn)物的核酸區(qū)段作為一個(gè)單獨(dú)的單位進(jìn)行缺失或插入。這些方法在產(chǎn)生和篩選新產(chǎn)物的過(guò)程中是有用的。尤其是,本發(fā)明還包括通過(guò)此處描述的核酸分子的表達(dá)產(chǎn)物而產(chǎn)生的新產(chǎn)物。另一方面,本發(fā)明提供制備和鑒定含有兩個(gè)或多個(gè)核酸區(qū)段的核酸分子的方法,其中所述核酸區(qū)段編碼參與相同生物學(xué)過(guò)程或生物學(xué)途徑、以及無(wú)關(guān)生物學(xué)過(guò)程或生物學(xué)途徑的基因產(chǎn)物,該方法包括(a)提供第一群核酸分子,該群核酸分子含有至少一個(gè)能夠和該第一群中其它分子重組的重組位點(diǎn);(b)在使第一群的核酸分子重組并產(chǎn)生第二群核酸分子的條件下,使這些核酸分子和一或多個(gè)重組蛋白接觸;和(c)篩選第二群核酸分子以鑒定編碼兩個(gè)或多個(gè)參與相同過(guò)程或途徑的產(chǎn)物的核酸分子。在本發(fā)明具體實(shí)施方案中,編碼兩個(gè)或多個(gè)參與相同過(guò)程或途徑的產(chǎn)物的核酸分子編碼蛋白質(zhì)或蛋白質(zhì)復(fù)合物的兩個(gè)不同域。在其它具體實(shí)施方案中,該蛋白質(zhì)是單鏈抗原結(jié)合蛋白。在再其它具體實(shí)施方案中,該蛋白復(fù)合物包含含有至少兩個(gè)單鏈抗原結(jié)合蛋白的抗體分子或多價(jià)抗原結(jié)合蛋白。本發(fā)明還提供類似于上述方法的方法,用于制備或鑒定含有兩個(gè)或多個(gè)編碼參與不同或無(wú)關(guān)生物學(xué)過(guò)程或生物學(xué)途徑的基因產(chǎn)物的核酸區(qū)段。本發(fā)明方法還可以用于確定細(xì)胞和/或組織中的基因表達(dá)譜(expressionprofile)。一個(gè)實(shí)施方案中,可以從細(xì)胞和/或組織中獲得RNA,并將其用于制備cDNA分子。然后可以將這些cDNA分子彼此連接并對(duì)其進(jìn)行測(cè)序以鑒定在細(xì)胞和/或組織中表達(dá)的基因、以及這些細(xì)胞和/或組織中RNA種類的豐度。因此,一方面,本發(fā)明提供方法用于鑒定在特定細(xì)胞和/或組織中表達(dá)的基因以及與其它RNA種類的量相比這些細(xì)胞和/或組織中存在的特定RNA種類的相對(duì)量。正如以下討論的,這些方法可以用于多種應(yīng)用中,包括診斷、發(fā)現(xiàn)基因、鑒定特定細(xì)胞和/或組織類型中表達(dá)的基因、鑒定特定細(xì)胞(例如與病理情況有關(guān)的細(xì)胞)中超量表達(dá)或表達(dá)不足的基因、篩選藥劑以鑒定改變基因表達(dá)的藥劑(例如治療劑)、等。而且,通過(guò)將使用本發(fā)明方法獲得的序列數(shù)據(jù)和公共數(shù)據(jù)庫(kù)中錄入的核酸序列比較,常常可以鑒定出可轉(zhuǎn)錄產(chǎn)生特定RNA種類或區(qū)段的基因。一般地,為了鑒定出轉(zhuǎn)錄產(chǎn)生RNA的基因,需要約10個(gè)核苷酸左右的序列數(shù)據(jù)。因此,一個(gè)特定方面,本發(fā)明提供確定細(xì)胞或組織中基因表達(dá)譜的方法,包括(a)從獲自細(xì)胞或組織的RNA產(chǎn)生至少一群cDNA分子,其中該群體中的各cDNA分子含有至少兩個(gè)能夠和相同或不同cDNA群中單個(gè)成員上存在的至少一個(gè)重組位點(diǎn)發(fā)生重組的重組位點(diǎn);(b)在導(dǎo)致(a)的核酸分子接合的條件下使這些核酸分子和一或多個(gè)重組蛋白接觸;和(c)測(cè)定接合的核酸分子的序列。在本發(fā)明具體實(shí)施方案中,將這些接合的核酸分子插入在插入位點(diǎn)側(cè)翼含有測(cè)序引物結(jié)合位點(diǎn)的載體中。在再其它具體實(shí)施方案中,這些接合的cDNA分子被attB重組位點(diǎn)分開(kāi)。在其它具體實(shí)施方案中,該接合的cDNA分子含有相應(yīng)于獲自細(xì)胞或組織的RNA的約10至約30個(gè)核苷酸。一旦確定了相應(yīng)于RNA表達(dá)產(chǎn)物的cDNA序列后,可以將這些序列和含有已知基因序列的數(shù)據(jù)庫(kù)比較,以確定在該特定細(xì)胞和/或組織中表達(dá)了哪些基因以及各基因的表達(dá)水平。而且,可以使用本發(fā)明方法測(cè)定在特定的條件下基因的表達(dá)水平,以確定這些條件是否可以導(dǎo)致一或多個(gè)基因的表達(dá)改變。這些條件的例子包括細(xì)胞基因表達(dá)產(chǎn)物的活性降低、營(yíng)養(yǎng)限制和/或缺乏、熱休克、低溫、與具有低或高離子強(qiáng)度的溶液接觸、暴露于化學(xué)劑(例如抗生素、化療劑、金屬離子、誘變劑等)、電離輻射等。因此,本發(fā)明提供方法以鑒定由于特定刺激而表現(xiàn)出表達(dá)改變的基因。本發(fā)明還提供用于鑒定參與細(xì)胞代謝(如病理情況)的基因的方法。例如,本發(fā)明方法可以用于確定特定株的細(xì)胞或表現(xiàn)出異常表型的細(xì)胞的表達(dá)譜。將特定株的細(xì)胞或表現(xiàn)出異常表型的細(xì)胞的表達(dá)譜與另一株的細(xì)胞或未表現(xiàn)出異常表型的細(xì)胞(在此稱作“參照細(xì)胞”)的表達(dá)譜作比較。通過(guò)比較特定株的細(xì)胞或表現(xiàn)出異常表型的細(xì)胞和適當(dāng)?shù)膮⒄占?xì)胞的基因表達(dá)譜,可以確定與該株或異常表型相關(guān)的表達(dá)特性。因此,一個(gè)特定的方面,本發(fā)明提供診斷方法,其中將表現(xiàn)出異常表型(如癌)的患者細(xì)胞的基因表達(dá)譜與未表現(xiàn)出異常表型的細(xì)胞的基因表達(dá)譜(即參照細(xì)胞)進(jìn)行比較。另一具體方面,本發(fā)明提供篩選治療劑(例如免疫刺激劑)的方法,包括(a)將細(xì)胞(例如人類細(xì)胞)暴露于候選治療劑,(b)確定該暴露的細(xì)胞的基因表達(dá)譜,(c)對(duì)該基因表達(dá)譜和未暴露于該候選治療劑的細(xì)胞(即參照細(xì)胞)的基因表達(dá)譜作比較。本發(fā)明還包括通過(guò)上述方法鑒定的治療劑。另一方面,本發(fā)明提供通過(guò)重組將分子和/或化合物或分子和/或化合物群與其它分子、化合物和/或支持物(優(yōu)選固體或半固體的)附著或結(jié)合的方法。用于本發(fā)明的適當(dāng)分子和化合物包括,但不限于,蛋白質(zhì)、多肽或肽、化學(xué)化合物、藥物、脂、脂蛋白、糖、激素、類固醇、抗體(或其部分)、抗原、酶(例如核酸酶、聚合酶等)、多糖、核苷和其衍生物、核苷酸和其衍生物、氨基酸和其衍生物、脂肪酸、受體、配體、半抗原、小分子(例如-COOH等活化基團(tuán))、結(jié)合分子(例如生物素、親和素、鏈霉親和素、A蛋白、B蛋白等)、生長(zhǎng)因子、金屬離子、細(xì)胞因子、核酶、或核酸分子(例如RNA、DNA、DNA/RNA雜合體、cDNA或cDNA文庫(kù)、雙鏈核酸、單鏈核酸、線性核酸、環(huán)狀核酸、超螺旋核酸等)、和前述兩種或多種的組合。在具體實(shí)施方案中,可以將分子直接或間接地和支持物連接在一起。而且,可以通過(guò)共價(jià)或非共價(jià)方式將分子和支持物連接在一起。為了舉例說(shuō)明的目的,核酸分子和支持物的間接非共價(jià)連接的一個(gè)例子是將對(duì)核酸分子表現(xiàn)出高度結(jié)合親和力的蛋白質(zhì)直接連接在支持物上。然后使含有該蛋白的支持物和這些核酸分子在適當(dāng)?shù)臈l件下接觸,從而導(dǎo)致這些核酸分子通過(guò)該蛋白質(zhì)非共價(jià)附著在支持物上。核酸分子/蛋白相互作用的關(guān)系可以是序列特異的或非序列特異的。另一方面,本發(fā)明提供包含(與支持物結(jié)合或未結(jié)合的)至少一個(gè)第一核酸分子的支持物,其中該第一核酸分子包含一或多個(gè)重組位點(diǎn)或其部分。在具體實(shí)施方案中,本發(fā)明支持物還包含通過(guò)第一核酸分子上的重組位點(diǎn)而與支持物結(jié)合的至少一個(gè)第二核酸分子或至少一個(gè)肽或蛋白質(zhì)分子或其它化合物。本發(fā)明還涉及包含(與支持物結(jié)合或未結(jié)合的)一或多個(gè)選自下組的成分的本發(fā)明支持物包含至少一個(gè)重組位點(diǎn)的一或多個(gè)核酸分子、一或多個(gè)重組蛋白、和包含至少一個(gè)重組位點(diǎn)的一或多個(gè)肽或化合物。另一方面,本發(fā)明提供使一或多個(gè)核酸分子、蛋白質(zhì)或肽分子、或其它化合物附著或結(jié)合支持物的方法,包括(a)獲得至少一個(gè)包含至少一個(gè)重組位點(diǎn)的核酸分子、蛋白質(zhì)或肽分子、其它化合物、或這些分子或化合物的群體,并獲得包含至少一個(gè)重組位點(diǎn)的支持物;和(b)使位于該至少一個(gè)核酸分子、蛋白質(zhì)或肽分子、其它化合物、或這些分子或化合物的群體上的一些或所有重組位點(diǎn)與支持物包含的全部或部分重組位點(diǎn)發(fā)生重組。在本發(fā)明具體實(shí)施方案中,這些方法還包括將一或多個(gè)核酸分子附著或結(jié)合在支持物上。在其它實(shí)施方案中,僅一個(gè)核酸分子與支持物直接連接。在再其它具體實(shí)施方案中,這些核酸分子形成微陣列。在甚至更具體的實(shí)施方案中,該微陣列形成DNA芯片。本發(fā)明還提供通過(guò)上述方法制備的支持物。在具體實(shí)施方案中,本發(fā)明支持物是固體或半固體。而且,正如以上討論的,可以直接或間接地使核酸分子和支持物連接。也正如以上討論的,可以通過(guò)共價(jià)或非共價(jià)方式使核酸分子和支持物連接。此外,可以通過(guò)與蛋白質(zhì)或小分子(例如具有活化基團(tuán)如-COOH的分子)的鍵合,使核酸分子和支持物連接。而且,可以通過(guò)不穩(wěn)定的或穩(wěn)定的鍵合,使核酸分子和支持物連接。另一方面,本發(fā)明提供將兩個(gè)或多個(gè)目的分子或化合物連接或接合在一起的方法,包括(a)提供至少第一和第二目的分子或化合物,每個(gè)第一和第二目的分子或化合物均包含至少一個(gè)重組位點(diǎn);(b)使第一目的分子或化合物的一些或所有重組位點(diǎn)與第二目的分子或化合物上的一些或所有重組位點(diǎn)發(fā)生重組。在本發(fā)明具體實(shí)施方案中,該方法還包含將含有重組位點(diǎn)的核酸分子附著在第一和第二目的分子或化合物。在其它具體實(shí)施方案中,至少一個(gè)目的分子或化合物包含蛋白質(zhì)或肽、核酸、糖、類固醇、或脂。在一些實(shí)施方案中,一或多個(gè)本發(fā)明化合物和/或分子(例如2、3、4、5、7、10、12、15、20、30、50等)可以包含一或兩個(gè)重組位點(diǎn)(例如2、3、4、5、7、10、12、15、20、30、50等)或其部分。這些分子和/或化合物可以是未標(biāo)記的或可以通過(guò)本領(lǐng)域熟知方法作可檢測(cè)標(biāo)記。可檢測(cè)標(biāo)記包括,但不限于,放射性標(biāo)記、質(zhì)量標(biāo)記(masslabel)、熒光標(biāo)記、化學(xué)發(fā)光標(biāo)記、生物發(fā)光標(biāo)記、和酶標(biāo)記。使用這些標(biāo)記可以允許對(duì)支持物上標(biāo)記分子和/或化合物的存在或不存在進(jìn)行檢測(cè)。因此,一般地,本發(fā)明涉及通過(guò)重組將任何數(shù)量的分子和/或化合物或分子和/或化合物群附著在支持物上,以及通過(guò)此方法制備的支持物。因此,這些化合物和/或分子可以通過(guò)含有重組位點(diǎn)或其部分的核酸接頭與支持物或結(jié)構(gòu)連接。這些接頭優(yōu)選是小接頭(例如,長(zhǎng)5、20、30、50、100、200、300、400或500個(gè)堿基對(duì))。因此,本發(fā)明包括包含一或多個(gè)根據(jù)本發(fā)明此方面可以使用的重組位點(diǎn)(或其部分)的支持物。因此,通過(guò)重組反應(yīng)可以使一或多個(gè)有待添加、附著或結(jié)合在支持物上的、具有一或多個(gè)重組位點(diǎn)或其部分的核酸分子、或蛋白質(zhì)、肽和/或其它分子和/或化合物和含有重組位點(diǎn)的支持物的重組,由此產(chǎn)生含有一或多個(gè)目的核酸分子、蛋白質(zhì)、肽和/或其它分子和/或化合物的支持物。使目的分子和/或化合物與支持物結(jié)合的重組反應(yīng)優(yōu)選在足以造成目的分子和/或化合物上的至少一個(gè)重組位點(diǎn)和支持物上存在的至少一個(gè)重組位點(diǎn)發(fā)生重組的條件下通過(guò)支持物和目的分子和/或化合物與至少一個(gè)重組蛋白的接觸而在體外進(jìn)行。本發(fā)明此方面對(duì)于在一或多個(gè)支持物(例如2、3、4、5、7、10、12等)上構(gòu)建核酸、或蛋白質(zhì)和/或其它分子和/或化合物的陣列是尤其有用的,因?yàn)橥ㄟ^(guò)重組這便于大量相同或不同的目的核酸、或蛋白質(zhì)和/或其它分子和/或化合物與支持物或支持物的不同部分的結(jié)合。因此,本發(fā)明涉及將一或多個(gè)(例如2、3、4、5、7、10、12、15、20、30、50等)核酸、或蛋白質(zhì)分子和/或其它分子和/或化合物附著或結(jié)合在支持物上的方法,該方法包括(a)獲得包含至少一個(gè)重組位點(diǎn)的至少第一分子和/或化合物或分子和/或化合物群(例如本發(fā)明起始核酸分子),并獲得包含至少一個(gè)重組位點(diǎn)的支持物(它也可以是本發(fā)明的起始分子);和(b)使所述至少第一分子和/或化合物或分子和/或化合物群上的一些或所有重組位點(diǎn)與支持物上的全部或部分重組位點(diǎn)發(fā)生重組。一旦將分子和/或化合物添加至支持物上后,支持物上這些分子和/或化合物的存在或不存在或位置都可以(例如通過(guò)使用可檢測(cè)的標(biāo)記)得到確定?;蛘?,可以進(jìn)一步通過(guò)熟知技術(shù)操作與支持物結(jié)合的分子和/或化合物。除了根據(jù)本發(fā)明使一或多個(gè)分子和/或化合物與支持物接合外,本發(fā)明還允許對(duì)支持物所含一或多個(gè)分子和/或化合物進(jìn)行置換、插入或缺失。正如本文所討論的,通過(guò)在目的分子和/或化合物內(nèi)的特異位點(diǎn)造成重組,可以除去或用另一目的分子或化合物置換分子和/或化合物的全部或部分。該過(guò)程還可以應(yīng)用于附著在支持物上的具有重組位點(diǎn)的分子和/或化合物。因此,除了向支持物添加全部或部分分子外,可以使用重組從支持物上除去或置換目的分子和/或化合物的全部或部分。根據(jù)本發(fā)明,正如本文所述,還操作或分析添加在支持物上的或從支持物上除去的分子和/或化合物。例如,對(duì)與支持物結(jié)合的或從支持物上除去的分子和/或化合物的進(jìn)一步分析或操作包括測(cè)序、雜交(DNA、RNA等)、擴(kuò)增、核酸合成、蛋白質(zhì)或肽表達(dá)、蛋白質(zhì)-DNA相互作用(雙雜種或反向雙雜種分析)、與其它分子和/或化合物的相互作用或結(jié)合研究、同源重組或基因打靶、和組合文庫(kù)分析和操作。這些操作可以在分子和/或化合物與支持物結(jié)合時(shí)或在分子和/或化合物自支持物上被除去后進(jìn)行。根據(jù)本發(fā)明,可以使用任何固體或半固體支持物,而且可以通過(guò)熟知技術(shù)添加含有重組位點(diǎn)(或其部分)的序列以便將核酸附著在支持物上。而且,可以通過(guò)本領(lǐng)域熟知技術(shù)在目的核酸、蛋白質(zhì)分子和/或其它分子和/或化合物上添加重組位點(diǎn)。而且,任何野生型或突變的重組位點(diǎn)、或相同或不同的重組位點(diǎn)的組合都可以用來(lái)向支持物添加或從支持物上除去目的分子和/或化合物。本發(fā)明還涉及包含一或多個(gè)重組位點(diǎn)(例如2、3、4、5、7、10、12、15、20、30、50等)或其部分的任何支持物、以及包含與所述支持物結(jié)合的具有一或多個(gè)重組位點(diǎn)(或其部分)的核酸、蛋白質(zhì)分子和/或其它分子和/或化合物的支持物。本發(fā)明還涉及包含本發(fā)明支持物的組合物。這些組合物還可以包含一或多個(gè)重組蛋白(優(yōu)選位點(diǎn)特異性重組蛋白)、適當(dāng)緩沖液(例如用于進(jìn)行重組的緩沖液)、核酸、蛋白質(zhì)分子和/或其它分子和/或化合物(優(yōu)選地包含可以不與支持物結(jié)合的重組位點(diǎn))、和任何其它用于使根據(jù)本發(fā)明的重組位點(diǎn)(和它們的組合)發(fā)生重組的試劑。本發(fā)明還涉及用于進(jìn)一步操作或分析本發(fā)明支持物、或附著于其上的核酸或蛋白質(zhì)分子或其它分子和/或化合物的組合物。對(duì)這些核酸、蛋白質(zhì)、和/或其它分子和/或化合物的進(jìn)一步操作和分析可以在它們與支持物結(jié)合時(shí),或在它們自支持物上被除去后進(jìn)行。這些組合物可以包含適當(dāng)?shù)木彌_液和酶如限制性酶、聚合酶、連接酶、重組蛋白等。另一方面,本發(fā)明提供使一或多個(gè)(例如2、3、4、5、7、10、12、15、20、30、50等)分子和/或化合物或分子和/或化合物群與一或多個(gè)相同或不同的分子和/或化合物或分子和/或化合物群附著或結(jié)合的方法。因此,一般地,本發(fā)明涉及通過(guò)重組對(duì)任何數(shù)量的分子和/或化合物或分子和/或化合物群進(jìn)行連接。正如本文所述,這些連接的分子和/或化合物可以是未標(biāo)記的或是可檢測(cè)標(biāo)記的。而且,這些連接的分子和/或化合物可以是通過(guò)共價(jià)或非共價(jià)方式連接的。適當(dāng)?shù)姆肿雍?化合物包括,但不限于,本文描述的那些,如核酸、蛋白質(zhì)或肽、化學(xué)化合物、藥物、脂、脂蛋白、激素等。一方面,可以通過(guò)重組,連接相同分子和/或化合物、或相同類型的分子和/或化合物(例如蛋白質(zhì)-蛋白質(zhì)、核酸-核酸等)。因此,一方面,可以將小分子和/或蛋白質(zhì)與重組位點(diǎn)連接起來(lái),然后使它們以各種組合彼此連接。另一方面,可以通過(guò)重組,連接不同的分子和/或化合物、或不同類型的分子和/或化合物(例如蛋白質(zhì)-核酸、核酸-配體、蛋白質(zhì)-配體等)。此外,還可以按本文所述通過(guò)重組將通過(guò)重組相連的分子和/或化合物(例如蛋白質(zhì)一蛋白質(zhì)、蛋白質(zhì)一配體等)附著在支持物或結(jié)構(gòu)上。由此,通過(guò)一或多個(gè)重組位點(diǎn)(或其部分)將產(chǎn)生的分子和/或化合物(任選地與支持物連接的)連接起來(lái)??梢允褂贸R?guī)技術(shù)將這些重組位點(diǎn)(或其部分)附著在分子如蛋白質(zhì)、肽、糖、類固醇和/或脂或它們的組合上,并可以使用本發(fā)明方法將含有重組位點(diǎn)的所獲分子和/或化合物連接起來(lái)。而且,所獲的相連分子和/或化合物可以通過(guò)一或多個(gè)重組位點(diǎn)與包含重組位點(diǎn)的其它分子和/或化合物結(jié)合。例如,可以使包含重組位點(diǎn)的核酸附著于目的分子上,并可以將包含相容重組位點(diǎn)的第二核酸附著于第二目的核酸上。這些位點(diǎn)間的重組導(dǎo)致這兩個(gè)分子通過(guò)小的核酸接頭連接起來(lái)。該核酸接頭可以根據(jù)需要是任何長(zhǎng)度的,但優(yōu)選小的接頭(例如長(zhǎng)約5至約500bp)。使用該方法,可以將蛋白質(zhì)、肽、核酸、糖、類固醇和/或脂或它們的組合附著在蛋白質(zhì)、肽、核酸、糖、類固醇和/或脂或它們的組合上。因此,本發(fā)明提供連接兩個(gè)或多個(gè)分子和/或化合物的方法,包括步驟(a)獲得至少第一和第二分子和/或化合物,所述分子和/或化合物均包含至少一個(gè)重組位點(diǎn)(或其部分);和(b)使所述第一分子和/或化合物上的一些或所有重組位點(diǎn)(或其部分)與所述第二分子和/或化合物上的全部或部分重組位點(diǎn)(或其部分)發(fā)生重組。在一些優(yōu)選實(shí)施方案中,可以使用常規(guī)偶聯(lián)技術(shù)將重組位點(diǎn)附著在目的分子上。例如,可以合成包含重組位點(diǎn)的寡核苷酸,以便將一或多個(gè)可以相同或不同的反應(yīng)性功能部分(例如2、3、4、5、7、10等)包括在內(nèi)。適當(dāng)?shù)姆磻?yīng)性功能部分包括,但不限于,氨基、環(huán)氧基、乙烯基、巰基等。包含一或多個(gè)反應(yīng)性功能部分的寡核苷酸的合成對(duì)于本領(lǐng)域是常規(guī)的。一旦合成后,包含一或多個(gè)反應(yīng)性功能部分的寡核苷酸可以被附著在目的分子或化合物上的一或多個(gè)(例如2、3、4、5、7、10等)活性基團(tuán)上。這些寡核苷酸可以通過(guò)一或多個(gè)反應(yīng)性功能部分與一或多個(gè)活性功能基團(tuán)的反應(yīng)直接地進(jìn)行附著。在一些實(shí)施方案中,可以使用能夠與寡核苷酸上存在的一或多個(gè)反應(yīng)性功能部分及目的分子上存在的一或多個(gè)活性基團(tuán)反應(yīng)的適當(dāng)連接基團(tuán),來(lái)實(shí)現(xiàn)該附著。在其它實(shí)施方案中,既可以使用直接附著也可以使用通過(guò)連接基團(tuán)實(shí)現(xiàn)的附著。本領(lǐng)域技術(shù)人員將明了,寡核苷酸上的反應(yīng)性功能部分可以和目的分子和/或化合物上的反應(yīng)性功能部分相同或不同。用于將寡核苷酸和目的分子偶聯(lián)在一起的適當(dāng)試劑和技術(shù)可以參見(jiàn)Hermanson,生物偶聯(lián)技術(shù)(BioconjugateTechniques),AcademicPressInc.,SanDiego,CA,1996。本發(fā)明還涉及用于實(shí)施本發(fā)明方法的試劑盒,尤其是用于制備本發(fā)明產(chǎn)物核酸分子或本發(fā)明的其它連接分子和/或化合物(例如蛋白質(zhì)-蛋白質(zhì)、核酸-蛋白質(zhì)等),或制備包含這些產(chǎn)物核酸分子或連接的分子和/或化合物的支持物的試劑盒。本發(fā)明還涉及用于向一或多個(gè)支持物上、或從一或多個(gè)支持物上添加和/或除去和/或置換核酸、蛋白質(zhì)和/或其它分子和/或化合物的試劑盒、用于制備和使用本發(fā)明組合文庫(kù)的試劑盒、以及用于根據(jù)本發(fā)明方法實(shí)施同源重組(尤其是基因打靶)的試劑盒。本發(fā)明試劑盒還可以包含用于進(jìn)一步操作通過(guò)本發(fā)明方法產(chǎn)生的含有重組位點(diǎn)的分子和/或化合物的其它成分。本發(fā)明試劑盒可以包含一或多個(gè)本發(fā)明核酸分子(尤其是包含一或多個(gè)重組位點(diǎn)并任選地包含一或多個(gè)反應(yīng)性功能部分的起始分子)、一或多個(gè)本發(fā)明分子和/或化合物、一或多個(gè)本發(fā)明支持物和/或一或多個(gè)本發(fā)明載體。這些試劑盒可以任選地包含一或多個(gè)選自下組的其它成分一或多個(gè)宿主細(xì)胞(例如2、3、4、5等)、一或多個(gè)用于將分子或化合物(例如通過(guò)轉(zhuǎn)染或轉(zhuǎn)化)引入一或多個(gè)宿主細(xì)胞中的試劑、一或多個(gè)核苷酸、一或多個(gè)聚合酶和/或逆轉(zhuǎn)錄酶(例如2、3、4、5等)、一或多個(gè)適當(dāng)?shù)木彌_液(例如2、3、4、5等)、一或多個(gè)引物(例如2、3、4、5、7、10、12、15、20、30、50等)、一或多個(gè)終止劑(例如2、3、4、5、7、10等)、一或多個(gè)用于構(gòu)建組合文庫(kù)的分子群(例如2、3、4、5、7、10、12、15、20、30、50等)、和一或多個(gè)組合文庫(kù)(例如2、3、4、5、7、10、12、15、20、30、50等)。本發(fā)明試劑盒還可以含有實(shí)施本發(fā)明的說(shuō)明或方案。另一方面,本發(fā)明提供用于對(duì)核酸區(qū)段進(jìn)行連接、缺失或置換的試劑盒,這些試劑盒包含至少一個(gè)選自下組的成分(1)一或多個(gè)重組蛋白或包含一或多個(gè)重組蛋白的組合物、和(2)至少一個(gè)包含一或多個(gè)重組位點(diǎn)的核酸分子(優(yōu)選具有至少兩種不同重組特異性的載體)。本發(fā)明試劑盒還可以包含一或多個(gè)選自下組的成分(a)包含額外的重組位點(diǎn)的其它核酸分子;(b)一或多個(gè)具有連接酶活性的酶;(c)一或多個(gè)具有聚合酶活性的酶;(d)一或多個(gè)具有逆轉(zhuǎn)錄酶活性的酶;(e)一或多個(gè)具有限制性內(nèi)切核酸酶活性的酶;(f)一或多個(gè)引物;(g)一或多個(gè)核酸文庫(kù);(h)一或多個(gè)支持物;(i)一或多個(gè)緩沖液;(j)一或多個(gè)去污劑或含有去污劑的溶液;(k)一或多個(gè)核苷酸;(1)一或多個(gè)終止劑;(m)一或多個(gè)轉(zhuǎn)染試劑;(n)一或多個(gè)宿主細(xì)胞;和(o)使用這些試劑盒成分的說(shuō)明書(shū)。而且,本發(fā)明試劑盒可以含有一或多個(gè)選自下組的重組蛋白Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、Cin、Tn3解離酶、ΦC31、TndX、XerC和XerD。此外,本發(fā)明試劑盒的重組位點(diǎn)一般具有不同重組特異性,每個(gè)均包含具有不同的7個(gè)堿基對(duì)重疊區(qū)域的att位點(diǎn)。在本發(fā)明具體實(shí)施方案中,這7堿基對(duì)重疊區(qū)域的頭3個(gè)核苷酸包含選自下組的核苷酸序列AAA,AAC,AAG,AAT,ACA,ACC,ACG,ACT,AGA,AGC,AGG,AGT,ATA,ATC,ATG;ATT,CAA,CAC,CAG,CAT,CCA,CCC,CCG,CCT,CGA,CGC,CGG,CGT,CTA,CTC,CTGCTT,GAA,GAC,GAG,GAT,GCA,GCC,GCG,GCT,GGA,GGC,GGG,GGT,GTA,GTC,GTG,GTT,TAA,TAC,TAG,TAT,TCA,TCC,TCG,TCT,TGA,TGC,TGG,TGT,TTA,TTC,TTG,和TTT.在具體實(shí)施方案中,本發(fā)明試劑盒含有包含一或多個(gè)能夠催化att位點(diǎn)間發(fā)生重組的重組蛋白的組合物。在相關(guān)實(shí)施方案中,這些組合物包含一或多個(gè)能夠催化attB×attP(BP)反應(yīng)、attL×attR(LR)反應(yīng)、或BP及LR反應(yīng)的重組蛋白。和本發(fā)明試劑盒一起提供的核酸文庫(kù)可以包含cDNA或基因組DNA。而且,這些文庫(kù)可以包含編碼抗體輕鏈和重鏈可變區(qū)的多核苷酸。本發(fā)明還涉及用于實(shí)施本發(fā)明方法的組合物、和在實(shí)施本發(fā)明方法時(shí)產(chǎn)生的組合物。尤其是,本發(fā)明包括通過(guò)本發(fā)明方法制備的核酸分子、用于制備含有這些核酸分子的宿主細(xì)胞的方法、通過(guò)這些方法制備的宿主細(xì)胞、和使用這些宿主細(xì)胞來(lái)產(chǎn)生這些核酸分子所編碼的產(chǎn)物(例如RNA、蛋白質(zhì)等)的方法、這些核酸分子所編碼的產(chǎn)物(例如RNA、蛋白質(zhì)等)。本發(fā)明組合物、方法和試劑盒優(yōu)選使用λ噬菌體位點(diǎn)特異性重組系統(tǒng)、更優(yōu)選使用可從Invitrogen公司,LifeTechnologiesDivision(Rockville,Maryland)獲得的GATEWAYTM重組克隆系統(tǒng),來(lái)制備和實(shí)施。GATEWAYTM克隆技術(shù)說(shuō)明手冊(cè)(Invitrogen公司,LifeTechnologiesDivision)更詳細(xì)地描述了這些系統(tǒng),其完整地并入本文作為參考。根據(jù)本領(lǐng)域知識(shí)、以及根據(jù)本發(fā)明的以下附圖和說(shuō)明、及權(quán)利要求,本領(lǐng)域普通技術(shù)人員將明了本發(fā)明的其它優(yōu)選實(shí)施方案。附圖簡(jiǎn)述圖1是基本重組克隆反應(yīng)的示意圖。圖2是使用本發(fā)明通過(guò)LR重組反應(yīng)克隆兩個(gè)核酸區(qū)段的示意圖。圖3示意了通過(guò)使用LR反應(yīng)將兩個(gè)核酸區(qū)段接合起來(lái)、并然后使用BP重組反應(yīng)將該接合的片段插入目的載體中,本發(fā)明在這些區(qū)段的克隆中的應(yīng)用。圖4示意了通過(guò)在BP反應(yīng)后實(shí)施LR反應(yīng),本發(fā)明在克隆兩個(gè)核酸區(qū)段中的應(yīng)用。圖5是克隆兩個(gè)具有attB位點(diǎn)的核酸區(qū)段的示意圖,方式是實(shí)施第一BP反應(yīng)以在一個(gè)區(qū)段上產(chǎn)生一個(gè)attL位點(diǎn)并在另一區(qū)段上產(chǎn)生一個(gè)attR位點(diǎn),之后通過(guò)LR反應(yīng)將這些區(qū)段合并在一起。在該過(guò)程的變體中,P1、P2和/或P3可以是寡核苷酸或線性核苷酸鏈。圖6是使用LR反應(yīng)將兩個(gè)核酸區(qū)段克隆在目的載體的兩個(gè)不同位點(diǎn)中的示意圖。圖7是使用BP反應(yīng)將兩個(gè)核酸區(qū)段克隆在一個(gè)載體的兩個(gè)不同位點(diǎn)中的示意圖。圖8是使用BR反應(yīng)將三個(gè)核酸區(qū)段克隆在三個(gè)載體中、使用LR反應(yīng)將這三個(gè)區(qū)段克隆在單一一個(gè)載體中、并產(chǎn)生由attB位點(diǎn)分隔開(kāi)的區(qū)段的示意圖。圖9是使用BR反應(yīng)將三個(gè)核酸區(qū)段克隆在一個(gè)單一載體中并產(chǎn)生被attR位點(diǎn)分隔開(kāi)的區(qū)段的示意圖。圖10是通過(guò)重組向支持物(帶陰影的框)添加一或多個(gè)相同或不同分子(核酸、蛋白質(zhì)/肽、糖、和/或其它化合物)的示意圖??瞻卓虼碇亟M位點(diǎn)。圖11是將多個(gè)分子和/或化合物(A和B)接合在一起的示意圖。該圖中所用標(biāo)記與圖10中的相應(yīng)。A和B的添加可以是同時(shí)的或是連續(xù)的。圖12是從支持物上缺失掉一部分分子或化合物(A)的示意圖。該圖所用標(biāo)記與圖10中的相應(yīng)。圖13是使用第二分子或化合物(C)置換一部分分子或化合物(A)的示意圖。該圖所用標(biāo)記與圖10中的相應(yīng)。圖14A是質(zhì)粒圖譜,其顯示了用于提供與目的基因的C端融合的結(jié)構(gòu)。supF編碼抑制基因功能。因此,當(dāng)supF表達(dá)時(shí),產(chǎn)生GUS-GST融合蛋白。在此方法的變體中,GUS可以使任何基因。圖14B是用于控制基因抑制和表達(dá)的方法的示意圖。該T7RNA聚合酶基因含有一或多個(gè)(顯示了兩個(gè))琥珀終止密碼子(標(biāo)記為“am”)代替酪氨酸密碼子。從誘導(dǎo)型啟動(dòng)子起始的滲漏(未誘導(dǎo)的)轉(zhuǎn)錄產(chǎn)生的supF不足以導(dǎo)致產(chǎn)生活性T7RNA聚合酶。誘導(dǎo)后,足量supF的產(chǎn)生導(dǎo)致活性T7RNA聚合酶的產(chǎn)生,這造成supF的表達(dá)增加,而這又進(jìn)一步造成T7RNA聚合酶的表達(dá)增加。T7RNA聚合酶進(jìn)一步誘導(dǎo)基因表達(dá)。而且,supF的表達(dá)通過(guò)抑制干擾性琥珀終止密碼子,導(dǎo)致在基因表達(dá)產(chǎn)物上加上了一個(gè)C端標(biāo)簽。圖15是質(zhì)粒圖譜,其顯示了用于產(chǎn)生目的基因的N和/或C端融合物的結(jié)構(gòu)。帶圓圈的數(shù)字代表琥珀、赭石或乳白終止密碼子。這些終止密碼子的抑制導(dǎo)致融合標(biāo)簽在N端、C端或兩端上的表達(dá)。在無(wú)抑制的情況下,產(chǎn)生本來(lái)的蛋白質(zhì)。圖16是使用LR反應(yīng)將4個(gè)獨(dú)立的DNA區(qū)段在一個(gè)步驟中插入目的載體的示意圖。具體地,將在5’末端具有attL1位點(diǎn)和在3’末端具有attL3位點(diǎn)的第一DNA區(qū)段與在5’末端具有attR3位點(diǎn)和在3’末端具有attL4位點(diǎn)的第二DNA區(qū)段連接。然后將該第二DNA區(qū)段與在5’末端具有attR4位點(diǎn)和在3’末端具有attL5位點(diǎn)的第三DNA區(qū)段連接。然后將該第三DNA區(qū)段與在5’末端具有attR5位點(diǎn)和在3’末端具有attL2位點(diǎn)的第四DNA區(qū)段連接。由此,通過(guò)與LRCLONASETM的反應(yīng),將此第一、二、三和四DNA區(qū)段插入含有側(cè)翼有attR1和attR2的ccdB基因的目的載體中。這些插入的DNA區(qū)段通過(guò)attB1、attB3、attB4、attB5和attB2位點(diǎn)彼此分開(kāi)并與載體序列分開(kāi)。圖17A和17B顯示了構(gòu)建根據(jù)以下在實(shí)施例18中陳述的方法制備的lux操縱子的示意圖。根據(jù)本發(fā)明,可以通過(guò)重組置換或缺失該操縱子的一或多個(gè)基因,以構(gòu)建一或多個(gè)修飾的操縱子,然后測(cè)試其活性和/或?qū)λ拗骷?xì)胞的影響。或者,可以在該操縱子的最初構(gòu)建中使用其它基因(包括變體和突變體)代替一或多個(gè)目的基因,由此產(chǎn)生一或多個(gè)修飾的操縱子。圖18是使用一個(gè)兩步驟、單載體程序?qū)?個(gè)獨(dú)立的DNA區(qū)段插入載體中的示意圖。具體地,將在5’末端具有attL1位點(diǎn)和在3’末端具有attL3位點(diǎn)的第一DNA區(qū)段(DNA-A)與在5’末端具有attR3位點(diǎn)和在3’末端具有attL4位點(diǎn)的第二DNA區(qū)段(DNA-B)連接。然后將該第二DNA區(qū)段與在5’末端具有attR4位點(diǎn)和在3’末端具有attL5位點(diǎn)的第三DNA區(qū)段(DNA-C)連接。將在5’末端具有attR1位點(diǎn)和在3’末端具有attL3位點(diǎn)的第四DNA區(qū)段(DNA-D)與在5’末端具有attR3位點(diǎn)和在3’末端具有attL4位點(diǎn)的第五DNA區(qū)段(DNA-E)連接。然后將該第五DNA區(qū)段與在5’末端具有attR4位點(diǎn)和在3’末端具有attL2位點(diǎn)的第六DNA區(qū)段(DNA-F)連接。然后將獲得的兩個(gè)分子(即DNA-A-DNA-B-DNA-C和DNA-D-DNA-E-DNA-F)插入該插入載體中。以上所有反應(yīng)均由LRCLONASETM催化。并使用LR反應(yīng)將該連接起來(lái)的DNA區(qū)段插入含有側(cè)翼有attR1和attR2位點(diǎn)的ccdB基因的目的載體中。這些插入的DNA區(qū)段通過(guò)attB1、attB3、attB4、attB5和attB2位點(diǎn)彼此分開(kāi)并與載體序列分開(kāi)。正如圖6所示,例如,可以將該組裝在一起的區(qū)段插入連續(xù)的或非連續(xù)的位點(diǎn)中。圖19是使用兩步驟、雙載體程序?qū)?個(gè)獨(dú)立的DNA區(qū)段插入載體中的示意圖。具體地,將在5’末端具有attB1位點(diǎn)和在3’末端具有attL3位點(diǎn)的第一DNA區(qū)段(DNA-A)與在5’末端具有attR3位點(diǎn)和在3’末端具有attL4位點(diǎn)的第二DNA區(qū)段(DNA-B)連接。然后將該第二DNA區(qū)段與在5’末端具有attR4位點(diǎn)和在3’末端具有attB5位點(diǎn)的第三DNA區(qū)段(DNA-C)連接。然后將此連接的DNA區(qū)段插入含有attP1和attP5位點(diǎn)的載體中。而且,將在5’末端具有attB5位點(diǎn)和在3’末端具有attL3位點(diǎn)的第四DNA區(qū)段(DNA-D)與在5’末端具有attR3位點(diǎn)和在3’末端具有attL4位點(diǎn)的第五DNA區(qū)段(DNA-E)連接。然后將該第五DNA區(qū)段與在5’末端具有attR4位點(diǎn)和在3’末端具有attB2位點(diǎn)的第六DNA區(qū)段(DNA-F)連接。然后將此連接的DNA區(qū)段插入含有attP1和attP2位點(diǎn)的載體中。在構(gòu)建了上述兩個(gè)載體(每個(gè)載體均含有三個(gè)插入的DNA區(qū)段)后,使這些質(zhì)粒和LRCLONASETM反應(yīng),以產(chǎn)生含有側(cè)翼有attB位點(diǎn)的這6個(gè)DNA區(qū)段(即,B1-DNA-A-B3-DNA-B-B4-DNA-C-B5-DNA-D-B3-B1-DNA-E-B4-DNA-F-B2)的另一質(zhì)粒。圖20A是含有兩個(gè)不同DNA插入片段的本發(fā)明示例性載體的示意圖,其中這兩個(gè)DNA插入片段由T7啟動(dòng)子按不同的方向驅(qū)動(dòng)轉(zhuǎn)錄。根據(jù)待產(chǎn)生的轉(zhuǎn)錄本的類型,DNA-A和/或DNA-B可以處于一定的方向,以致導(dǎo)致產(chǎn)生有義或反義RNA。圖20B是含有一個(gè)DNA插入片段的本發(fā)明示例性載體的示意圖,其中所述DNA插入片段由T7啟動(dòng)子按兩個(gè)不同的方向驅(qū)動(dòng)轉(zhuǎn)錄。因此,由一個(gè)啟動(dòng)子驅(qū)動(dòng)轉(zhuǎn)錄產(chǎn)生的RNA將是有義RNA,而由另一啟動(dòng)子驅(qū)動(dòng)轉(zhuǎn)錄產(chǎn)生的RNA是反義RNA。圖20C是含有兩個(gè)不同DNA插入片段的本發(fā)明示例性載體的示意圖,其中所述兩個(gè)DNA插入片段具有相同的核苷酸序列(即DNA-A),并由兩個(gè)不同的T7啟動(dòng)子按不同方向驅(qū)動(dòng)轉(zhuǎn)錄。在此實(shí)施例中,一個(gè)啟動(dòng)子驅(qū)動(dòng)轉(zhuǎn)錄而產(chǎn)生的RNA將是有義RNA,而另一啟動(dòng)子驅(qū)動(dòng)轉(zhuǎn)錄而產(chǎn)生的RNA將是反義RNA。圖20D是含有兩個(gè)DNA插入片段的本發(fā)明示例性載體的示意圖,其中所述兩個(gè)DNA插入片段以相反方向具有相同的核苷酸序列(即DNA-A),并由一個(gè)T7啟動(dòng)子驅(qū)動(dòng)轉(zhuǎn)錄。在這兩個(gè)拷貝的DNA-A和DNA-A插入片段之間不存在轉(zhuǎn)錄終止信號(hào)。一個(gè)區(qū)段的轉(zhuǎn)錄產(chǎn)生有義RNA,而另一區(qū)段的轉(zhuǎn)錄產(chǎn)生反義RNA。從該載體產(chǎn)生的RNA將出現(xiàn)分子內(nèi)雜交,因此將形成具有發(fā)夾轉(zhuǎn)角的雙鏈分子。圖20E是本發(fā)明兩個(gè)示例性載體的示意圖,這兩個(gè)載體含有具有相同核苷酸序列(即DNA-A)的DNA插入片段。這些插入片段的轉(zhuǎn)錄導(dǎo)致產(chǎn)生有義和反義RNA,這些RNA然后可以雜交以形成雙鏈RNA分子。圖21A是含有三個(gè)插入片段(標(biāo)記為“啟動(dòng)子”、“編碼序列”和“Kan”)的本發(fā)明示例性載體的示意圖。在此實(shí)施例中,插入的啟動(dòng)子驅(qū)動(dòng)編碼序列的表達(dá)。而且插入的DNA區(qū)段賦予了含有該載體的宿主以卡那霉素抗性。正如以下詳細(xì)討論的,相當(dāng)大量的載體成分(例如選擇標(biāo)記(如卡那霉素抗性基因)盒、ori盒、啟動(dòng)子盒、標(biāo)簽序列盒等)均可以被插入或用于構(gòu)建本發(fā)明載體。圖21B是含有4個(gè)插入片段(標(biāo)記為“啟動(dòng)子1”、“編碼序列1”、“啟動(dòng)子2”、和“編碼序列2”)的本發(fā)明示例性載體的示意圖。在此實(shí)施例中,啟動(dòng)子1驅(qū)動(dòng)編碼序列1表達(dá)、而啟動(dòng)子2驅(qū)動(dòng)編碼序列2表達(dá)。圖21C是用于同源重組的本發(fā)明示例性載體的示意圖。該載體含有4個(gè)插入片段,標(biāo)記為“5’同源區(qū)”、“NEO”、“DNA-A”、和“3’同源區(qū)”。在此實(shí)施例中,5’和3’同源區(qū)與選出將插入新霉素抗性標(biāo)記(“NEO”)和DNA區(qū)段(“DNA-A”)的染色體區(qū)域同源??梢詫?duì)此類靶向載體進(jìn)行設(shè)計(jì),以便對(duì)所靶向的核酸分子中存在的核酸進(jìn)行插入、缺失和/或置換。圖22A和22B示意了制備本發(fā)明靶向載體的方法。圖23顯示了采用隨機(jī)引發(fā)第一鏈逆轉(zhuǎn)錄、然后采用隨機(jī)引發(fā)進(jìn)行PCR對(duì)mRNA的擴(kuò)增。將這些擴(kuò)增產(chǎn)物分成n個(gè)庫(kù),每個(gè)庫(kù)用具有不同attB位點(diǎn)對(duì)的隨機(jī)引物擴(kuò)增?!癛”后綴顯示一些attB位點(diǎn)可以是相反方向。將具有標(biāo)準(zhǔn)或相反方向的attB位點(diǎn)用于不同的庫(kù),以產(chǎn)生以標(biāo)準(zhǔn)方向或反向連接attB位點(diǎn)的擴(kuò)增產(chǎn)物。當(dāng)這些位點(diǎn)與反向attP位點(diǎn)反應(yīng)時(shí),在進(jìn)入克隆(EntryClone)中形成attR位點(diǎn)而非attL位點(diǎn)。因此,庫(kù)與標(biāo)準(zhǔn)或反向attR的反應(yīng)將產(chǎn)生側(cè)翼有attR和attL位點(diǎn)的分子的混合物。通過(guò)凝膠純化依大小排列擴(kuò)增產(chǎn)物,然后采用GATEWAYTMBP反應(yīng)對(duì)其進(jìn)行克隆以制備進(jìn)入克隆,所述進(jìn)入克隆根據(jù)所用的attB位點(diǎn)和attP位點(diǎn)的取向每個(gè)均含有側(cè)翼有attL位點(diǎn)、attR位點(diǎn)或attL和attR的小插入片段。當(dāng)將進(jìn)入克隆混合在一起時(shí),這些插入克隆形成能夠被克隆在適當(dāng)目的載體中的多聯(lián)體,產(chǎn)生n個(gè)各被attB位點(diǎn)分隔開(kāi)的插入片段。對(duì)多個(gè)多聯(lián)體進(jìn)行測(cè)序,可以給出最初樣品中存在的mRNA分子的分布情況。圖24A-24C顯示了大量適用于本發(fā)明方法和組合物的att位點(diǎn)的序列(SEQIDNO1-36)。圖25A-25B顯示了大量含有插入片段的進(jìn)入克隆,所述插入片段包括N端標(biāo)簽或序列(N-標(biāo)簽)、可讀框(ORF)、C端標(biāo)簽或序列(C-標(biāo)簽)、選擇標(biāo)記(amp)、質(zhì)粒復(fù)制起點(diǎn)(ori)、和其它載體元件(例如loxP位點(diǎn))。每個(gè)進(jìn)入克隆的載體元件插入片段的側(cè)翼均有attL或attR位點(diǎn),以致這些載體元件可以在LRClonase反應(yīng)中連接在一起并形成新的載體結(jié)構(gòu)(顯示在圖25B中)。圖26A-26B顯示了構(gòu)建含有任何方向和特異性的attP位點(diǎn)的attP供體質(zhì)粒的過(guò)程。圖26A顯示了attP位點(diǎn)在attP供體質(zhì)粒中的4種排列,包括2個(gè)方向的直接重復(fù)和2個(gè)方向的反向重復(fù)attP位點(diǎn)。圖26A顯示的4個(gè)attP供體質(zhì)??梢宰鳛槟0澹吞禺惻cattP位點(diǎn)核心退火的PCR引物一起用于PCR反應(yīng),由此在PCR產(chǎn)物的末端產(chǎn)生具有任何期望特異性的attL或attR位點(diǎn)。對(duì)于待構(gòu)建的每個(gè)新attP供體載體,可以制備兩個(gè)這樣的PCR產(chǎn)物,一個(gè)由質(zhì)粒主鏈(ori-kan)組成,而另一個(gè)由ccdB和cat基因組成。在LRClonase反應(yīng)中使這些PCR產(chǎn)物一起反應(yīng),以產(chǎn)生帶有具有任何att位點(diǎn)特異性的任何取向的attP位點(diǎn)的新質(zhì)粒。圖27A顯示了連接兩個(gè)核酸區(qū)段A和B的方法,將這些區(qū)段克隆在兩個(gè)相似結(jié)構(gòu)的質(zhì)粒中。每個(gè)區(qū)段的側(cè)翼均有兩個(gè)重組位點(diǎn)。每個(gè)質(zhì)粒上的其中一個(gè)重組位點(diǎn)能夠和另一質(zhì)粒上的它的關(guān)連伙伴反應(yīng),而另兩個(gè)重組位點(diǎn)與存在的任何其它位點(diǎn)均不反應(yīng)。每個(gè)質(zhì)粒帶有一個(gè)獨(dú)特的復(fù)制起點(diǎn),該復(fù)制起點(diǎn)可以是或不是條件型的。每個(gè)質(zhì)粒還帶有正和負(fù)選擇標(biāo)記(分別是+smX和smY),使得能夠選擇除去和選出與特定標(biāo)記連接的元件。最后,每個(gè)質(zhì)粒帶有適當(dāng)放置的第三重組位點(diǎn)(在本例中是loxP),使得能夠缺失除去不期望的元件并保留期望的元件。在本例中,這兩個(gè)質(zhì)粒最初通過(guò)GatewayLxR反應(yīng)在L2和R2融合。這導(dǎo)致區(qū)段A和B通過(guò)B2重組位點(diǎn)并列,以及sm1和oriB通過(guò)P2重組位點(diǎn)并列。第二個(gè)圖塊中顯示了主鏈中位于一系列質(zhì)粒元件側(cè)翼的兩個(gè)loxP位點(diǎn)。加入Cre蛋白將使單個(gè)大質(zhì)粒解離為兩個(gè)較小的質(zhì)粒。這些質(zhì)粒中的一個(gè)將是帶有連接的A和B區(qū)段以及目前與sm2和+sm4連接的oriA的期望質(zhì)粒。其它質(zhì)粒帶有一組非必需的和/或不期望的元件。轉(zhuǎn)化適當(dāng)?shù)乃拗鞑㈦S后進(jìn)行適當(dāng)?shù)倪z傳選擇,將導(dǎo)致除去不期望的質(zhì)粒并同時(shí)保留期望質(zhì)粒。圖27B顯示了連接兩個(gè)嵌合核酸區(qū)段A-B和C-D(按以上圖27A中所示構(gòu)建的)的方法。將這些區(qū)段克隆在兩個(gè)相似結(jié)構(gòu)的質(zhì)粒中。每個(gè)區(qū)段的側(cè)翼均有兩個(gè)重組位點(diǎn)。每個(gè)質(zhì)粒上的其中一個(gè)重組位點(diǎn)能夠和另一質(zhì)粒上的它的關(guān)連伙伴反應(yīng),而另兩個(gè)重組位點(diǎn)與存在的任何其它位點(diǎn)均不反應(yīng)。在本例中,這兩個(gè)質(zhì)粒最初通過(guò)GatewayL×R反應(yīng)在L2和R2融合。這導(dǎo)致區(qū)段A和B通過(guò)B2重組位點(diǎn)并列,以及sm1和oriB通過(guò)P2重組位點(diǎn)并列。第二個(gè)圖塊中顯示了主鏈中位于一系列質(zhì)粒元件側(cè)翼的兩個(gè)loxP位點(diǎn)。加入Cre蛋白將使單個(gè)大質(zhì)粒解離為兩個(gè)較小的質(zhì)粒。這些質(zhì)粒中的一個(gè)將是帶有連接的A-B和C-D區(qū)段以及目前與sm2和+sm4連接的oriA的期望質(zhì)粒。其它質(zhì)粒帶有一組非必需的和/或不期望的元件。轉(zhuǎn)化適當(dāng)?shù)乃拗鞑㈦S后進(jìn)行適當(dāng)?shù)倪z傳選擇,將導(dǎo)致除去不期望的質(zhì)粒并同時(shí)保留期望質(zhì)粒。發(fā)明詳述定義在以下說(shuō)明中,廣泛使用了重組核酸技術(shù)中的許多術(shù)語(yǔ)。為了清晰和更為一致地理解說(shuō)明書(shū)和權(quán)利要求,包括這些術(shù)語(yǔ)被給予的范圍,我們提供以下定義。基因本文所用術(shù)語(yǔ)“基因”是指含有表達(dá)多肽、蛋白質(zhì)或非翻譯RNA(例如rRNA、tRNA、反義RNA)所必需的信息的核酸。當(dāng)基因編碼蛋白質(zhì)時(shí),正如本領(lǐng)域技術(shù)人員清楚地知道的,它包括啟動(dòng)子和結(jié)構(gòu)基因可讀框序列(ORF),產(chǎn)生基因產(chǎn)物所需的轉(zhuǎn)錄和反義機(jī)器不包括在基因的定義內(nèi)。當(dāng)基因編碼非翻譯RNA時(shí),它包括啟動(dòng)子和編碼非翻譯RNA的核酸。結(jié)構(gòu)基因本文所用詞語(yǔ)“結(jié)構(gòu)基因”是指該核酸可以轉(zhuǎn)錄產(chǎn)生信使RNA,而該信使RNA隨后可以翻譯出特異多肽特征性的氨基酸序列。宿主本文所用術(shù)語(yǔ)“宿主”是指任何可以成為復(fù)制型表達(dá)載體、克隆載體、或任何核酸分子的受體的原核或真核生物。該核酸分子可以含有,但不限于,結(jié)構(gòu)基因、轉(zhuǎn)錄調(diào)節(jié)序列(例如啟動(dòng)子、增強(qiáng)子、阻遏基因等)和/或復(fù)制起點(diǎn)。本文所用術(shù)語(yǔ)“宿主”、“宿主細(xì)胞”、“重組宿主”和“重組宿主細(xì)胞”可以互換使用。對(duì)于這些宿主的例子,見(jiàn)Maniatis等,分子克隆實(shí)驗(yàn)室手冊(cè)(MolecularCloningALaboratoryManual),ColdSpringHarborLaboratory,ColdSpringHarbor,紐約(1982)。轉(zhuǎn)錄調(diào)節(jié)序列本文所用詞語(yǔ)“轉(zhuǎn)錄調(diào)節(jié)序列”是指核酸分子上含有的任何構(gòu)型或幾何形狀的功能性核苷酸鏈,其作用是調(diào)節(jié)(1)一或多個(gè)結(jié)構(gòu)基因(例如2、3、4、5、7、10等)轉(zhuǎn)錄為信使RNA或(2)一或多個(gè)基因轉(zhuǎn)錄為非翻譯RNA。轉(zhuǎn)錄調(diào)節(jié)序列的例子包括,但不限于,啟動(dòng)子、增強(qiáng)子、阻遏基因等。啟動(dòng)子本文所用啟動(dòng)子是轉(zhuǎn)錄調(diào)節(jié)序列的一個(gè)例子,其明確地是一般被描述為鄰近起始密碼子的基因5’區(qū)的核酸或編碼非翻譯RNA的核酸。鄰近核酸區(qū)段的轉(zhuǎn)錄是在啟動(dòng)子區(qū)域起始的。阻遏型啟動(dòng)子的轉(zhuǎn)錄速率將響應(yīng)阻遏劑而降低。誘導(dǎo)型啟動(dòng)子的轉(zhuǎn)錄速率將響應(yīng)誘導(dǎo)劑而增加。組成型啟動(dòng)子的轉(zhuǎn)錄速率明確地是不受調(diào)節(jié)的,但它可以在一般代謝條件的影響下改變。插入片段本文所用術(shù)語(yǔ)“插入片段”是指作為較大核酸分子一部分的期望核酸區(qū)段。在許多情況下,插入片段將被導(dǎo)入較大的核酸分子中。例如,圖2中標(biāo)記為ccdB和DNA-A的核酸區(qū)段相對(duì)于該處所示的較大核酸分子而言是核酸插入片段。在大多數(shù)情況下,插入片段的側(cè)翼有重組位點(diǎn)(例如每個(gè)末端至少一個(gè)重組位點(diǎn))。然而,在某些實(shí)施方案中,插入片段僅在一個(gè)末端上含有重組位點(diǎn)。靶核酸分子本文所用詞語(yǔ)“靶核酸分子”是指目的核酸區(qū)段,優(yōu)選是有待使用本發(fā)明化合物和方法作用的核酸。這些靶核酸分子優(yōu)選含有一或多個(gè)基因(例如2、3、4、5、7、10、12、15、20、30、50等)或基因的部分。插入片段供體本文所用詞語(yǔ)“插入片段供體”是指帶有插入片段的本發(fā)明兩個(gè)親本核酸分子(例如RNA或DNA)之一(見(jiàn)圖1)。插入片段供體分子包含在兩邊側(cè)翼有重組位點(diǎn)的插入片段。插入片段供體可以是線性或環(huán)狀的。在本發(fā)明一個(gè)實(shí)施方案中,插入片段供體使環(huán)狀核酸分子,任選地是超螺旋的,并還在重組信號(hào)外包括克隆載體序列。當(dāng)使用一群插入片段或一群核酸區(qū)段來(lái)制備插入片段供體時(shí),獲得一群插入片段供體,并可以根據(jù)本發(fā)明使用它們。產(chǎn)物本文所用術(shù)語(yǔ)“術(shù)語(yǔ)”是指重組克隆程序中第二個(gè)重組事件后產(chǎn)生的包含A和D序列的一個(gè)期望子代分子(見(jiàn)圖1)。產(chǎn)物含有有待克隆或或亞克隆的核酸。根據(jù)本發(fā)明,當(dāng)使用一群插入片段供體時(shí),所獲的產(chǎn)物分子群將含有該群插入片段供體的插入片段的全部或部分,并優(yōu)選含有插入片段供體的原始分子的代表群。副產(chǎn)物本文所用術(shù)語(yǔ)“副產(chǎn)物”是指缺少期望進(jìn)行克隆或亞克隆的區(qū)段的子代分子(重組克隆程序中第二個(gè)重組事件后產(chǎn)生的新克隆)。共合體(cointegrate)本文所用術(shù)語(yǔ)“共合體”是指至少一個(gè)含有兩個(gè)親本(起始)分子的本發(fā)明重組中間核酸分子。共合體可以是線性的或環(huán)狀的。使用適當(dāng)?shù)乃拗骷?xì)胞株,例如大腸桿菌DB3.1(尤其是大腸桿菌LIBRARYEFFICIENCYDB3.1TM感受態(tài)細(xì)胞),并對(duì)共合體分子上存在的兩個(gè)選擇標(biāo)記進(jìn)行篩選,可以從共合體表達(dá)RNA和多肽。識(shí)別序列本文所用詞語(yǔ)“識(shí)別序列”是指蛋白質(zhì)、化學(xué)化合物、DNA或RNA分子(例如限制性內(nèi)切酶、修飾性甲基化酶、或重組酶)所識(shí)別和結(jié)合的一段特定序列。本發(fā)明中,識(shí)別序列通常是指重組位點(diǎn)。例如,Cre重組酶的識(shí)別序列是loxP,它是包含位于一段8堿基對(duì)核心序列兩側(cè)的兩個(gè)13堿基對(duì)反向重復(fù)(充當(dāng)重組酶結(jié)合位點(diǎn))的一段34個(gè)堿基對(duì)序列。(見(jiàn)Sauer,B.,CurrentOpinioninBiotechnology5521-527(1994)的圖1)。識(shí)別序列的其它例子有重組酶λ整合酶所識(shí)別的attB、attP、attL、和attR序列。attB是含有兩個(gè)9堿基對(duì)核心型Int結(jié)合位點(diǎn)和一個(gè)7堿基對(duì)重疊區(qū)的約25堿基對(duì)的序列。attP是含有核心型Int結(jié)合位點(diǎn)和臂型Int結(jié)合位點(diǎn)以及輔助蛋白質(zhì)整合宿主因子(IHF)、FIS和切除酶(Xis)的位點(diǎn)的一段約240個(gè)堿基對(duì)的序列。(見(jiàn)Landy,CurrentOpinioninBiotechnology3699-707(1993))。根據(jù)本發(fā)明還可以對(duì)這些位點(diǎn)進(jìn)行改造以增強(qiáng)本發(fā)明方法中產(chǎn)物的產(chǎn)量。當(dāng)經(jīng)改造的該位點(diǎn)缺少P1或H1域以使得重組反應(yīng)不可逆轉(zhuǎn)(例如attR或attP)時(shí),這些位點(diǎn)可以被稱作attR’或attP’以顯示這些位點(diǎn)的這些域已通過(guò)某種方式而被修飾。重組蛋白(recombinationprotein)本文所用詞語(yǔ)“重組蛋白”包括切除性或整合性蛋白質(zhì)、酶、輔因子、或參與涉及一或多個(gè)重組位點(diǎn)(例如2、3、4、5、7、10、12、15、20、30、50等)的重組反應(yīng)的相關(guān)蛋白,重組蛋白可以是野生型蛋白質(zhì)(見(jiàn)Landy,CurrentOpinioninBiotechnology3699-707(1993))、或其突變體、衍生物(例如含有重組蛋白序列或其片段的融合蛋白)、片段和變體。重組蛋白的例子包括Cre、Int、IHF、Xis、Flp、Fis、Hin、Gin、ΦC31、Cin、Tn3解離酶、TndX、XerC、XerD、TnpX、Hjc、Gin、SpCCE1和ParA。重組位點(diǎn)本文所用詞語(yǔ)“重組位點(diǎn)”是指參與整合/重組反應(yīng)的核酸分子上重組蛋白質(zhì)的識(shí)別序列。重組位點(diǎn)是該參與的核酸分子上被位點(diǎn)特異性重組蛋白質(zhì)在整合或重組初期識(shí)別和結(jié)合的不連續(xù)核酸片段或區(qū)段。例如,Cre重組酶的重組位點(diǎn)是loxP,它是由位于一段8堿基對(duì)核心序列兩側(cè)的兩個(gè)13堿基對(duì)反向重復(fù)(充當(dāng)重組酶結(jié)合位點(diǎn))組成的一段34個(gè)堿基對(duì)序列。見(jiàn)Sauer,B.,CurrentOpinioninBiotechnology5521-527(1994)的圖1。識(shí)別序列的其它例子包括此處所述attB、attP、attL、和attR序列,及它們的突變體、片段、變體和衍生物,這些識(shí)別序列被重組蛋白λInt和被輔助蛋白質(zhì)整合宿主因子(IHF)、FIS和切除酶(Xis)所識(shí)別。見(jiàn)Landy,CurrentOpinioninBiotechnology3699-707(1993)??梢酝ㄟ^(guò)任何多種已知方法向分子添加重組位點(diǎn)。例如,可以通過(guò)平末端連接、使用完全或部分隨機(jī)引物進(jìn)行PCR、或使用側(cè)翼有重組位點(diǎn)的限制性位點(diǎn)將核酸分子插入載體中,從而將重組位點(diǎn)添加到核酸分子上。重組克隆本文所用詞語(yǔ)“重組克隆”是指例如描述于美國(guó)專利5,888,732和6,143,557(其內(nèi)容完整地并入本文作為參考)中的一種方法,通過(guò)該方法核酸分子或這些分子群的區(qū)段可以在體外或體內(nèi)被交換、插入、置換、替代或修飾。優(yōu)選地,該克隆方法是一種體外方法。阻遏盒本文所用詞語(yǔ)“阻遏盒”是指存在于亞克隆載體中含有阻遏基因或選擇標(biāo)記的一段核酸區(qū)段。選擇標(biāo)記本文所用詞語(yǔ)“選擇標(biāo)記”是指通常在特定條件下,允許選出或選擇除去含有其的分子(如復(fù)制子)或細(xì)胞的一段核酸區(qū)段。這些標(biāo)記可以編碼一種活性,例如,但不限于,產(chǎn)生RNA、肽或蛋白質(zhì);或可以提供RNA、肽、蛋白質(zhì)、無(wú)機(jī)和有機(jī)化合物或組合物等的結(jié)合位點(diǎn)。選擇標(biāo)記的例子包括但不限于(1)所編碼產(chǎn)物提供對(duì)抗毒性化合物(如抗生素)的抗性的核酸區(qū)段;(2)所編碼產(chǎn)物為受體細(xì)胞中否則將缺少的產(chǎn)物(例如tRNA基因、營(yíng)養(yǎng)缺陷標(biāo)記)的核酸區(qū)段;(3)所編碼產(chǎn)物抑制基因產(chǎn)物活性的核酸區(qū)段;(4)所編碼產(chǎn)物可以容易地得到鑒別(例如,表型標(biāo)記如β-半乳糖苷酶、綠色熒光蛋白(GFP)、黃色熒光蛋白(YFP)、紅色熒光蛋白(RFP)、藍(lán)色熒光蛋白(CFP)、和細(xì)胞表面蛋白)的核酸區(qū)段;(5)與否則將有害于細(xì)胞生存和/或功能的產(chǎn)物結(jié)合的核酸區(qū)段;(6)抑制以上1-5號(hào)所述任何核酸區(qū)段的活性的核酸區(qū)段(例如反義寡核苷酸);(7)與修飾底物的產(chǎn)物(例如限制性內(nèi)切酶)結(jié)合的核酸區(qū)段;(8)能夠用于分離或鑒定期望分子的核酸區(qū)段(例如特異蛋白質(zhì)結(jié)合位點(diǎn));(9)編碼可能是非功能性的特異核苷酸序列(例如,用于分子亞群的PCR擴(kuò)增)的核酸區(qū)段;(10)當(dāng)缺少時(shí),將直接或間接地賦予對(duì)特定化合物的抗性或敏感性的核酸區(qū)段;和/或(11)所編碼產(chǎn)物在受體細(xì)胞中具有毒性(例如白喉毒素)或可將相對(duì)無(wú)毒化合物轉(zhuǎn)化為毒性化合物(例如單純皰疹病毒胸苷激酶、胞嘧啶脫氨酶)的核酸區(qū)段;(12)抑制含有它們的核酸分子的復(fù)制、分配或遺傳力的核酸區(qū)段;和/或(13)編碼條件型復(fù)制功能,如在某些宿主或宿主細(xì)胞株中或在某些環(huán)境條件(如溫度、營(yíng)養(yǎng)條件等)下復(fù)制,的核酸區(qū)段。選擇方案本文所用詞語(yǔ)“選擇方案”是指允許選擇、富集、或鑒定期望核酸分子或接觸它們(尤其是混合物中含有進(jìn)入克隆或載體、目的載體、供體載體、表達(dá)克隆或載體、任何中間物(例如共合體或復(fù)制子)、和/或副產(chǎn)物的產(chǎn)物或多個(gè)產(chǎn)物)的宿主細(xì)胞的任何方法。一方面,本發(fā)明選擇方案依賴于一或多個(gè)選擇標(biāo)記。一個(gè)實(shí)施方案的選擇方案有至少兩個(gè)在重組克隆過(guò)程中連接或未連接的成分。一個(gè)成分是選擇標(biāo)記。另一成分控制該選擇標(biāo)記在體外或體內(nèi)的表達(dá)、或含有帶選擇標(biāo)記的質(zhì)粒的細(xì)胞(或核酸分子例如復(fù)制子)的存活。一般地,此控制元件是選擇標(biāo)記的阻遏物或誘導(dǎo)物,但可以使用其它方式來(lái)控制選擇標(biāo)記的表達(dá)或活性。正如本領(lǐng)域技術(shù)人員易于明了的,是使用阻遏物還是激活物將取決于標(biāo)記是正還是負(fù)選擇、以及各種核酸區(qū)段的確切排列。在一些優(yōu)選實(shí)施方案中,該選擇方案導(dǎo)致選出或富集僅一或多個(gè)期望核酸分子(例如產(chǎn)物)。正如本文所定義的,核酸分子的選擇包括(a)選擇或富集期望DNA分子的存在(稱作“正選擇方案”),和(b)選擇除去或減少非期望DNA分子的核酸分子的存在(稱作“負(fù)選擇方案”)。在一個(gè)實(shí)施方案中,選擇方案(可以逆向進(jìn)行)可以采取三種形式中的一種,這將參照?qǐng)D1來(lái)進(jìn)行討論。此處以選擇標(biāo)記和針對(duì)它的阻遏基因作為例子,第一種選出含有區(qū)段D和缺少區(qū)段C的分子。第二種選擇除去含有區(qū)段C的分子并選出含有區(qū)段D的分子。第二種形式的可能實(shí)施方案是使核酸區(qū)段攜帶對(duì)于體外反應(yīng)產(chǎn)物待導(dǎo)入的細(xì)胞有毒性的基因。毒性基因可以是表達(dá)為毒性基因產(chǎn)物(毒性蛋白質(zhì)或RNA)的核酸,或可以是本身自然就具有毒性。(后一情況中,毒性基因應(yīng)理解為具有其“可遺傳性狀”的經(jīng)典定義。)這些毒性基因產(chǎn)物的例子是本領(lǐng)域熟知的,包括但不限于限制性內(nèi)切酶(如DpnI、Nla3等);細(xì)胞凋亡相關(guān)基因(如ASK1或bc1-2/ced-9家族成員);逆轉(zhuǎn)錄病毒的基因,包括人免疫缺陷病毒(HIV)的那些基因;防衛(wèi)素如NP-1;反向重復(fù)或成對(duì)的回文DNA序列;噬菌體的裂解基因如來(lái)自ΦX174或噬菌體T4的那些;抗生素敏感基因如rpsL;抗微生物敏感基因如pheS;質(zhì)粒致死基因(Killergene);所產(chǎn)生的基因產(chǎn)物對(duì)細(xì)菌有毒的真核轉(zhuǎn)錄載體基因如GATA-1;在缺少抑制功能時(shí)殺死宿主的基因,如kicB、ccdB、fx174E(Liu,Q.等,Curr.Biol.81300-1309(1998));及負(fù)面影響復(fù)制子穩(wěn)定性和/或復(fù)制的其它基因。或者,毒性基因可以是在體外可選擇的,例如限制性位點(diǎn)??刹僮鞯嘏c誘導(dǎo)型啟動(dòng)子連接的、編碼限制性內(nèi)切核酸酶的許多基因是已知的,并可以用于本發(fā)明。(見(jiàn),如美國(guó)專利4,960,707(DpnI和DpnII);5,000,333、5,082,784和5,192,675(KpnI);5,147,800(NgoAIII和NgoAI);5,179,015(FspI和HaeIII);5,200,333(HaeII和TaqI);5,248,605(HpaII);5,312,746(ClaI);5,231,021和5,304,480(XhoI和XhoII);5,334,526(AluI);5,470,740(NsiI);5,534,428(SstI/SacI);5,202,248(NcoI);5,139,942(NdeI);和5,098,839(PacI)。也參見(jiàn)Wilson,G.G.,Nucl.AcidsRes.192539-2566(1991);和Lunnen,K.D.等,Gene7425-32(1988)。)在第二種形式中,區(qū)段D帶有選擇標(biāo)記。該毒性基因?qū)⑶宄性撦d體供體、共合體和副產(chǎn)物分子的轉(zhuǎn)化體,同時(shí)該選擇標(biāo)記可以用于選出含有產(chǎn)物的細(xì)胞和選擇除去僅含有插入片段供體的細(xì)胞。第三種形式選出在同一分子上順式含有區(qū)段A和D的細(xì)胞,而非在不同分子上反式含有這兩個(gè)區(qū)段的細(xì)胞。這可以通過(guò)分成兩個(gè)無(wú)活性片段(各在區(qū)段A和D上)的選擇標(biāo)記來(lái)實(shí)現(xiàn)。這些片段相對(duì)重組位點(diǎn)按一定方式排列,以致當(dāng)這些區(qū)段被重組事件帶到一起時(shí),它們可以重新構(gòu)成一個(gè)功能性選擇標(biāo)記。例如,重組事件可以將啟動(dòng)子和結(jié)構(gòu)核酸分子(例如基因)連接在一起,可以將一個(gè)結(jié)構(gòu)核酸分子的兩個(gè)片段連接在一起,或可以將編碼存活所需的異二聚體基因產(chǎn)物的核酸分子連接在一起,或可以將一個(gè)復(fù)制子的各部分連接在一起。位點(diǎn)特異性重組酶本文所用詞語(yǔ)“位點(diǎn)特異性重組酶”是指一類典型至少具有以下4種活性(或其組合)的重組酶(1)識(shí)別特異核酸序列;(2)切割所述序列;(3)參與鏈交換的拓?fù)洚悩?gòu)酶活性;和(4)重新縫合切開(kāi)的核酸鏈的連接酶活性。見(jiàn)Sauer,B.,CurrentOpinionsinBiotechnology5521-527(1994)。保守性位點(diǎn)特異性重組不同于同源重組和轉(zhuǎn)座,因?yàn)樗鼘?duì)于兩個(gè)參加反應(yīng)的分子具有高度的序列特異性。鏈交換機(jī)制涉及在無(wú)DNA合成的情況下切割和重新連接特異核酸序列(Landy,A.(1989)Ann.Rev.Biochem.58913-949)。同源重組本文所用詞語(yǔ)“同源重組”是指核酸分子和相似核苷酸序列聯(lián)合并交換核苷酸鏈的過(guò)程。因此,在預(yù)定位置上有效地和第二核酸分子進(jìn)行同源重組的第一核酸分子的核苷酸序列將具有促進(jìn)第一核酸分子和第二核酸分子的預(yù)定位置之間交換核苷酸鏈的核苷酸序列。因此,第一核酸分子一般將具有足以和第二核酸分子的一部分互補(bǔ)的核苷酸序列,以便促進(jìn)核苷酸堿基配對(duì)。同源重組要求兩個(gè)參與重組的核酸中有同源序列,但不要求任何特異序列。按以上指出的,正如該詞語(yǔ)在此處的使用,發(fā)生在例如att位點(diǎn)等重組位點(diǎn)處的位點(diǎn)特異性重組不被認(rèn)為是“同源重組”。載體本文所用術(shù)語(yǔ)“載體”是指為插入片段提供有用的生物學(xué)或生物化學(xué)性質(zhì)的核酸分子(優(yōu)選DNA)。例子包括質(zhì)粒、噬菌體、自主復(fù)制序列(ARS)、著絲粒、和其它能夠在體外或在宿主細(xì)胞中復(fù)制或被復(fù)制、或?qū)⑵谕怂釁^(qū)段遞送至宿主細(xì)胞內(nèi)的期望位置的序列。載體可以具有一或多個(gè)限制性內(nèi)切核酸酶識(shí)別位點(diǎn)(例如2、3、4、5、7、10等),在此位點(diǎn)處可以按可確定的方式切開(kāi)序列而不失去載體的必需生物學(xué)功能,并且可以將核酸區(qū)段插入此位點(diǎn)中以便實(shí)現(xiàn)其復(fù)制和克隆。載體還可以提供引物位點(diǎn)(例如用于PCR的引物位點(diǎn))、轉(zhuǎn)錄和/或翻譯起始和/或調(diào)節(jié)位點(diǎn)、重組信號(hào)、復(fù)制子、選擇標(biāo)記等。清楚地,也可以應(yīng)用不要求使用重組、轉(zhuǎn)座或限制性酶而插入期望核酸片段的方法(例如,但不限于,PCR片段的尿嘧啶N糖基化酶(UDG)克隆(美國(guó)專利5,334,575和5,888,795,兩者均完整地并入本文作為參考)、TA克隆等),將片段克隆至克隆載體中以便根據(jù)本發(fā)明進(jìn)行使用。該克隆載體還可以含有一或多個(gè)適用于鑒定克隆載體所轉(zhuǎn)化的細(xì)胞的選擇標(biāo)記(例如2、3、4、5、7、10等)。亞克隆載體本文所用詞語(yǔ)“亞克隆載體”是指優(yōu)選包括適當(dāng)復(fù)制子的克隆載體,其包含環(huán)狀或線性核酸分子。在本發(fā)明中,亞克隆載體(圖1的區(qū)段D)還可以含有期望并入終產(chǎn)物中以作用于克隆的核酸插入片段或與之一起作用的功能性和/或調(diào)節(jié)性元件(圖1的區(qū)段A)。該亞克隆載體還可以含有選擇標(biāo)記(優(yōu)選DNA)。載體供體本文所用詞語(yǔ)“載體供體”是指本發(fā)明兩個(gè)親本核酸分子(例如RNA或DNA)之一,其帶有包含了將成為期望產(chǎn)物一部分的核酸載體的核酸區(qū)段。載體供體包含亞克隆載體D(或如果插入片段供體沒(méi)有已經(jīng)含有克隆載體,則可以將其稱作克隆載體)和側(cè)翼有重組位點(diǎn)的區(qū)段C(見(jiàn)圖1)。區(qū)段C和/或D可以含有按上述選擇方案有助于選擇期望子代產(chǎn)物分子的元件。重組信號(hào)可以相同或不同,并可以被相同或不同的重組酶作用。此外,載體供體可以是線性或環(huán)狀的。引物本文所用術(shù)語(yǔ)“引物”是指可以在核酸分子(例如DNA分子)的擴(kuò)增或聚合過(guò)程通過(guò)共價(jià)鍵合核苷酸單體而被延伸的單鏈或雙鏈寡核苷酸。一方面,引物可以是測(cè)序引物(例如通用測(cè)序引物)。另一方面,引物可以包含重組位點(diǎn)或其部分。銜接子本文所用術(shù)語(yǔ)“銜接子”是指包含一或多個(gè)重組位點(diǎn)(或這些重組位點(diǎn)的部分)的寡核苷酸或核酸片段或區(qū)段(優(yōu)選DNA),根據(jù)本發(fā)明它們可以被添加在環(huán)狀或線性插入片段供體分子以及本文所述其它核酸分子上。當(dāng)使用重組位點(diǎn)的部分時(shí),缺失的部分可以由插入片段供體分子提供。這些銜接子可以加在環(huán)狀或線性分子內(nèi)的任意位置上,但優(yōu)選將銜接子加在線性分子的一或兩個(gè)末端或近末端。優(yōu)選地,將銜接子置于目的特定核酸分子的兩邊(側(cè)翼)。根據(jù)本發(fā)明,可以通過(guò)標(biāo)準(zhǔn)重組技術(shù)(例如限制性消化和連接),將銜接子添加在目的核酸分子上。例如,可以通過(guò)以下方式將銜接子加在環(huán)狀分子上首先用適當(dāng)限制性酶消化該分子、將銜接子加在切割位點(diǎn)上并重新形成在切割位點(diǎn)含有銜接子的環(huán)狀分子。在其它方面,可以通過(guò)同源重組、RNA分子的整合等來(lái)添加銜接子?;蛘?,可以直接將銜接子和線性分子的一或多個(gè)、優(yōu)選兩個(gè)末端連接,由此產(chǎn)生在一或兩個(gè)末端具有銜接子的線性分子。在本發(fā)明一方面,可以將銜接子添加在一群線性分子(例如經(jīng)過(guò)切割或消化的cDNA文庫(kù)或基因組DNA)上,以形成在所述群體的全部或相當(dāng)大部分分子的一或優(yōu)選兩個(gè)末端含有銜接子的線性分子群。銜接子引物本文所用詞語(yǔ)“銜接子引物”是指包含一或多個(gè)重組位點(diǎn)(或這些重組位點(diǎn)的部分)的引物分子,根據(jù)本發(fā)明可以將其添加在本文所述環(huán)狀或線性核酸分子上。當(dāng)使用重組位點(diǎn)的部分時(shí),缺失的部分可以由本發(fā)明核酸分子(例如銜接子)提供??梢詫⑦@些銜接子引物添加在環(huán)狀或線性分子內(nèi)的任何位置上,但優(yōu)選將銜接子引物添加在線性分子的一或兩個(gè)末端或近末端。這些銜接子引物的例子以及根據(jù)本發(fā)明方法它們的用途顯示在本文實(shí)施例8中??梢允褂眠@些銜接子引物在各種情況下通過(guò)各種技術(shù)將一或多個(gè)重組位點(diǎn)或其部分添加在環(huán)狀或線性核酸分子上,所述技術(shù)包括但不限于擴(kuò)增(例如PCR)、連接(例如酶或化學(xué)/合成連接)、重組(例如同源或非同源(異常)重組)等。模板本文所用術(shù)語(yǔ)“模板”是指待擴(kuò)增、合成或測(cè)序的雙鏈或單鏈核酸分子。對(duì)于雙鏈DNA分子,優(yōu)選在可以對(duì)這些分子進(jìn)行擴(kuò)增、合成或測(cè)序之前將其雙鏈變性以形成第一和第二鏈,或可以直接使用該雙鏈分子作為模板。對(duì)于單鏈模板,在適合的條件下與和模板的至少一部分互補(bǔ)的引物進(jìn)行雜交,然后具有聚合酶活性的一或多種多肽(例如2、3、4、5或7種DNA聚合酶和/或逆轉(zhuǎn)錄轉(zhuǎn)錄酶)可以合成與該模板的全部或部分互補(bǔ)的分子?;蛘?,對(duì)于雙鏈模板,可以聯(lián)合使用一或多個(gè)轉(zhuǎn)錄調(diào)節(jié)序列(例如2、3、4、5、7或更多個(gè)啟動(dòng)子)和一或多個(gè)聚合酶,以制備與模板的全部或部分互補(bǔ)的核酸分子。根據(jù)本發(fā)明,新合成的分子可以和最初模板等長(zhǎng)或比最初模板短。在新合成分子的合成或延伸過(guò)程中錯(cuò)配摻入或鏈滑移(strandslippage)可以導(dǎo)致一或多個(gè)錯(cuò)配堿基對(duì)。因此,合成的分子不一定完全和模板互補(bǔ)。此外,可以在合成或擴(kuò)增過(guò)程中使用一群核酸模板以產(chǎn)生一群典型地代表了初始模板群的核酸分子。摻入本文所用術(shù)語(yǔ)“摻入”是指成為核酸(如DNA)分子或引物的一個(gè)部分。文庫(kù)本文所用術(shù)語(yǔ)“文庫(kù)”是指核酸分子(環(huán)狀或線性)的集合。在一個(gè)實(shí)施方案中,文庫(kù)可以包含大量(例如2、3、4、5、7、10、12、15、20、30、50、100、200、500、1000、5000、或更多個(gè))核酸分子,這些核酸分子可以或可以不來(lái)自于共同的生物、器官、組織或細(xì)胞來(lái)源。在另一實(shí)施方案中,文庫(kù)代表生物核酸容量的全部或部分或一個(gè)顯著部分(“基因組”文庫(kù)),或是代表細(xì)胞、組織、器官或生物中所表達(dá)核酸分子的全部或部分或一個(gè)顯著部分(來(lái)源于其中的cDNA文庫(kù)或區(qū)段)的一套核酸分子。文庫(kù)還可以包含通過(guò)從頭合成、誘變一或多個(gè)核酸分子等制備的具有隨機(jī)序列的核酸分子。這些文庫(kù)可以或可以不被包含在一或多個(gè)載體(例如2、3、4、5、7、10、12、15、20、30、50等)中。擴(kuò)增本文所用術(shù)語(yǔ)“擴(kuò)增”是指借助一或多種具有聚合酶活性的多肽(例如1、2、3、4或更多個(gè)核酸聚合酶或逆轉(zhuǎn)錄酶)、用于增加核酸分子拷貝數(shù)的任何體外方法。核酸擴(kuò)增導(dǎo)致核苷酸摻入DNA和/或RNA分子或引物中,籍此形成一個(gè)與模板互補(bǔ)的新核酸分子。所形成的核酸分子和其模板可以用作模板以合成其它核酸分子。正如本文所用,一個(gè)擴(kuò)增反應(yīng)可以由多個(gè)核酸復(fù)制循環(huán)組成。DNA擴(kuò)增反應(yīng)包括例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)。一個(gè)PCR反應(yīng)可以由5-100個(gè)循環(huán)的DNA分子變性及合成組成。核苷酸本文所用術(shù)語(yǔ)“核苷酸”是指堿基-糖-磷酸的組合。核苷酸是核酸分子(DNA和RNA)的單體單位。術(shù)語(yǔ)核苷酸包括核糖核苷三磷酸ATP、UTP、CTP、GTP及脫氧核糖核苷三磷酸如dATP、dCTP、dITP、dUTP、dGTP、dTTP,或它們的衍生物。這些衍生物包括,例如,[αS]dATP、7-脫氮dGTP和7-脫氮dATP。術(shù)語(yǔ)核苷酸在本文中還指雙脫氧核糖核苷三磷酸(ddNTP)和它們的衍生物。雙脫氧核糖核苷三磷酸的舉例說(shuō)明性例子包括,但不限于,ddATP、ddCTP、ddGTP、ddITP和ddTTP。根據(jù)本發(fā)明,“核苷酸”可以是未標(biāo)記的,或可以通過(guò)熟知技術(shù)作可檢測(cè)標(biāo)記??蓹z測(cè)標(biāo)記物包括,例如,放射性同位素、熒光標(biāo)記物、化學(xué)發(fā)光標(biāo)記物、生物發(fā)光標(biāo)記物和酶標(biāo)記物。核酸分子本文所用詞語(yǔ)“核酸分子”是指任何長(zhǎng)度的連續(xù)核苷酸(核糖NTP、dNTP或ddNTP、或它們的組合)序列,其可以編碼全長(zhǎng)多肽或其任何長(zhǎng)度的片段、或可以是非編碼的。本文所用術(shù)語(yǔ)“核酸分子”和“多核苷酸”可以互換使用并包括RNA和DNA。寡核苷酸本文所用術(shù)語(yǔ)“寡核苷酸”是指包含一段共價(jià)連接的核苷酸序列的合成或天然分子,所述核苷酸通過(guò)一個(gè)核苷酸戊糖的3’位和相鄰核苷酸戊糖的5’位之間的磷酸二酯鍵連接在一起。多肽本文所用術(shù)語(yǔ)“多肽”是指任何長(zhǎng)度的連續(xù)氨基酸序列。術(shù)語(yǔ)“肽”、“寡肽”、或“蛋白質(zhì)”在本文中可以和術(shù)語(yǔ)“多肽”互換使用。雜交本文所用術(shù)語(yǔ)“雜交”和“進(jìn)行雜交”是指兩個(gè)互補(bǔ)單鏈核酸分子(RNA和/或DNA)的堿基配對(duì)以給出雙鏈分子。正如本文所用,即使堿基配對(duì)并不完全互補(bǔ),兩個(gè)核酸分子也可以雜交。因此,只要使用適當(dāng)?shù)臈l件(這是本領(lǐng)域熟知的),錯(cuò)配的堿基并不妨礙兩個(gè)核酸分子的雜交。一些方面,“雜交”是在“嚴(yán)緊條件”下進(jìn)行?!皣?yán)緊條件”,該詞在本文中用于指42℃在以下溶液中孵育過(guò)夜,該溶液包含50%甲酰胺、5×SSC(750mMNaCl,75mM檸檬酸三鈉)、50mM磷酸鈉(pH7.6)、5×Denhardt氏溶液、10%葡聚糖硫酸酯、和20μg/ml經(jīng)剪切的變性鮭精DNA,之后在0.1×SSC中于約65℃洗滌濾膜。本文使用的其它重組核酸技術(shù)和分子細(xì)胞生物學(xué)領(lǐng)域術(shù)語(yǔ)一般可以被適用領(lǐng)域的普通技術(shù)人員所理解。概要本發(fā)明涉及重組接合兩個(gè)或多個(gè)區(qū)段或核酸分子或其它分子和/或化合物(或它們的組合)的方法、組合物和試劑盒。本發(fā)明還涉及優(yōu)選地通過(guò)重組位點(diǎn)或其部分,將該連接的核酸分子或其它分子和/或化合物附著在一或多個(gè)支持物或結(jié)構(gòu)上。因此,一般地,本發(fā)明涉及通過(guò)包含一或多個(gè)重組位點(diǎn)(例如2、3、4、5、7、10、12、15、20、30、50等)或其部分的核酸接頭連接任何數(shù)量的核酸或其它分子和/或化合物。根據(jù)起始材料,通過(guò)本發(fā)明產(chǎn)生的連接產(chǎn)物可以包含任何數(shù)量的相同或不同核酸或其它分子和/或化合物。該起始材料包括但不限于包含一或多個(gè)重組位點(diǎn)或其部分的任何核酸(或其衍生物如肽核酸(PNA))、化學(xué)化合物、可檢測(cè)的標(biāo)記分子(例如熒光分子和化學(xué)發(fā)光分子)、藥物、肽或蛋白、脂、糖和其它分子和/或化合物。根據(jù)本發(fā)明通過(guò)這些重組位點(diǎn)的重組,可以連接任何數(shù)量的該起始分子和/或化合物、或它們的組合,以產(chǎn)生本發(fā)明連接產(chǎn)物。此外,可以通過(guò)重組缺失、置換本發(fā)明連接產(chǎn)物中的某些部分或成分。在一些實(shí)施方案中,優(yōu)選通過(guò)重組克隆方法以及通過(guò)同源重組,可以將該接合的區(qū)段插入不同的核酸分子如載體中。因此,在一些實(shí)施方案中,本發(fā)明涉及通過(guò)重組反應(yīng)聯(lián)合兩個(gè)或更多個(gè)核酸區(qū)段(例如2、3、4、5、7、10、12、15、20、30、50等)并通過(guò)重組克隆將該接合的兩個(gè)或多個(gè)區(qū)段插入載體中來(lái)構(gòu)建核酸分子(RNA或DNA)。在通過(guò)重組反應(yīng)使該接合的核酸分子進(jìn)一步與其它核酸分子聯(lián)合的實(shí)施方案中,兩個(gè)重組事件(即,這些區(qū)段的接合和這些區(qū)段在載體中的插入)的時(shí)間選擇并不是關(guān)鍵的。也就是說(shuō),例如,是在插入載體之前將兩個(gè)或多個(gè)核酸區(qū)段接合在一起、還是首先使每個(gè)區(qū)段上的一個(gè)重組位點(diǎn)與載體上的重組位點(diǎn)反應(yīng)然后再使這些核酸區(qū)段上的重組位點(diǎn)彼此反應(yīng)以造成區(qū)段的接合,對(duì)于本發(fā)明不是關(guān)鍵的。而且,可以將核酸區(qū)段克隆在載體的任何一或多個(gè)位置中,而且不必彼此相鄰地插入,但在一些實(shí)施方案中,優(yōu)選兩個(gè)或多個(gè)該區(qū)段在載體內(nèi)接合。根據(jù)本發(fā)明,重組克隆允許有效地選擇和鑒定含有聯(lián)合的核酸區(qū)段的分子(尤其是載體)。因此,可以將兩個(gè)或多個(gè)目的核酸區(qū)段合并,并任選地將其插入適于進(jìn)一步操作該合并的核酸分子的單個(gè)載體中。在一個(gè)基本實(shí)施方案中,將至少兩個(gè)核酸區(qū)段(每個(gè)均包含至少一個(gè)重組位點(diǎn))和適當(dāng)?shù)闹亟M蛋白接觸,根據(jù)重組位點(diǎn)在分子中的位置,以使這兩個(gè)分子的全部或部分接合。每個(gè)單獨(dú)的核酸區(qū)段可以包含各種序列,包括但不限于適于用作引物位點(diǎn)的序列(例如可以與測(cè)序引物或擴(kuò)增引物等引物雜交以起始核酸合成、擴(kuò)增或測(cè)序的序列)、轉(zhuǎn)錄或翻譯信號(hào)或調(diào)節(jié)序列如啟動(dòng)子和/或增強(qiáng)子、核糖體結(jié)合位點(diǎn)、Kozak序列、起始密碼子、終止信號(hào)如終止密碼子、復(fù)制起點(diǎn)、重組位點(diǎn)(或其部分)、選擇標(biāo)記、和用以產(chǎn)生(例如N端或C端)融合蛋白的基因或基因部分如GST、GUS、GFP、YFP、CFP、麥芽糖結(jié)合蛋白、6組氨酸(HIS6)、表位、半抗原等和它們的組合。用于克隆這些區(qū)段的載體也可以包含這些功能序列(例如啟動(dòng)子、引物位點(diǎn)等)。在將包含這些序列的區(qū)段聯(lián)合起來(lái)并最佳地將這些序列克隆在一或多個(gè)載體(例如2、3、4、5、7、10、12、15等)中后,可以以多種方式操作這些分子,包括對(duì)靶核酸分子進(jìn)行測(cè)序或擴(kuò)增(即,通過(guò)使用整合序列所引入的至少一個(gè)引物位點(diǎn))、突變靶核酸分子(即,通過(guò)在靶核酸分子中或上實(shí)施插入、缺失或替換)、通過(guò)同源重組插入另一分子中、轉(zhuǎn)錄靶核酸分子、和從靶核酸分子或其部分表達(dá)蛋白質(zhì)(即通過(guò)這些區(qū)段和/或載體所含翻譯和/或轉(zhuǎn)錄信號(hào)的表達(dá))。本發(fā)明還涉及使用本文公開(kāi)的重組克隆方法制備組合文庫(kù)。因此,一或多個(gè)接合的核酸區(qū)段可以包含核酸文庫(kù)。該文庫(kù)可以包含例如相應(yīng)于編碼肽、多肽或蛋白序列的序列排列(permutations)的核酸分子??梢詫⑦@些排列與由單個(gè)序列組成的另一核酸區(qū)段相接合,或者,該第二核酸分子也可以是相應(yīng)于另一肽、多肽或蛋白質(zhì)序列的排列的文庫(kù),以便這兩個(gè)區(qū)段的接合可以產(chǎn)生代表這兩個(gè)肽、多肽、或蛋白質(zhì)序列的所有排列的所有可能組合的文庫(kù)。這些核酸區(qū)段可以是連續(xù)的或非連續(xù)的。組合文庫(kù)的用途的許多例子是本領(lǐng)域已知的。(見(jiàn)例如Waterhouse等,NucleicAcidsRes.,1993,第21卷第9期,2265-2266;Tsurushita等,Gene,1996,第172卷第1期,59-63頁(yè);Persson,Int.Rev.Immunol.1993,102-3153-163;Chanock等,InfectAgentsDis1993年6月23118-31;Burioni等,ResVirol19973月-4月1482161-4;Leung,Thromb.Haemost.1995年7月741373-6;Sandhu,Crit.Rev.Biotechnol.1992,125-6437-62和美國(guó)專利5,733,743、5,871,907和5,858,657,所有均特此并入本文作為參考。)當(dāng)本發(fā)明方法和組合物中所用一或多個(gè)核酸區(qū)段是突變的時(shí),這些區(qū)段可以含有(1)指定數(shù)量的突變或(2)平均指定數(shù)量的突變。而且,可以參考核酸區(qū)段本身或表達(dá)產(chǎn)物(例如這些核酸區(qū)段的多肽)對(duì)這些突變進(jìn)行記分。例如,可以突變文庫(kù)的核酸分子,以產(chǎn)生平均與最初文庫(kù)的相應(yīng)核酸分子有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%一致性的核酸分子。類似地,可以突變文庫(kù)的核酸分子,以產(chǎn)生所編碼多肽與最初文庫(kù)的相應(yīng)核酸分子所編碼的多肽平均有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%一致性的核酸分子。重組位點(diǎn)用于本發(fā)明的重組位點(diǎn)可以是能夠充當(dāng)重組反應(yīng)底物的任何核酸。這些重組位點(diǎn)可以是野生型或天然存在的重組位點(diǎn)、或是修飾的、變異的、衍生的或突變的重組位點(diǎn)。本發(fā)明所用重組位點(diǎn)的例子包括,但不限于,λ噬菌體的重組位點(diǎn)(如attP、attB、attL和attR及它們的突變體或衍生物)和來(lái)自其它噬菌體如phi80、P22、P2、186、P4和P1的重組位點(diǎn)(包括lox位點(diǎn)如loxP和loxP511)。在以下實(shí)施例9和以前的專利申請(qǐng)(1999年5月28日提交的美國(guó)申請(qǐng)60/136,744和2000年3月2日提交的美國(guó)申請(qǐng)09/517,466,特此并入并入作為參考)中,描述了突變的att位點(diǎn)(例如attB1-10、attP1-10、attR1-10和attL1-10)。具有獨(dú)特特異性的其它重組位點(diǎn)(即,第一位點(diǎn)與其相應(yīng)位點(diǎn)重組并且不與具有不同特異性的第二位點(diǎn)重組)是本領(lǐng)域技術(shù)人員已知的,并可以用于實(shí)施本發(fā)明??梢愿鶕?jù)本發(fā)明和指定的重組位點(diǎn)一起使用針對(duì)這些系統(tǒng)的相應(yīng)重組蛋白。提供用于本發(fā)明的重組位點(diǎn)和重組蛋白的其它系統(tǒng)包括釀酒酵母(Saccharomycescerevisiae)的FLP/FRT系統(tǒng)、解離酶家族(例如γδ、TndX、TnpX、Tn3解離酶、Hin、Hjc、Gin、SpCCE1、ParA和Cin)、和IS231和其它蘇云金芽孢桿菌(Bacillusthuringiensis)的可轉(zhuǎn)座因子。用于本發(fā)明的其它適當(dāng)重組系統(tǒng)包括大腸桿菌的XerC和XerD重組酶以及psi、dif和cer重組位點(diǎn)。其它適當(dāng)?shù)闹亟M位點(diǎn)可以參見(jiàn)頒發(fā)給Elledge和Liu的美國(guó)專利5,851,808,特此并入本文作為參考。用于本發(fā)明的優(yōu)選重組蛋白、和突變的、修飾的、變異的或衍生的重組位點(diǎn)包括描述于以下文獻(xiàn)中的那些美國(guó)專利5,888,732和6,143,557、以及基于美國(guó)臨時(shí)申請(qǐng)60/108,324(1998年11月13日提交)的美國(guó)申請(qǐng)09/438,358(1999年11月12日提交)、以及基于美國(guó)臨時(shí)申請(qǐng)60/136,744(1999年5月28日提交的)的美國(guó)申請(qǐng)09/517,466(2000年3月2日提交),以及與可從InvitrogenCorporation,LifeTechnologiesDivision(Rockville,MD)獲得的GATEWAYTM克隆技術(shù)有關(guān)的那些,所有這些文獻(xiàn)均引入本文作為參考??梢杂糜趯?shí)施本發(fā)明的重組位點(diǎn)的代表性例子包括以上提及的att位點(diǎn)。本發(fā)明人已確定,通過(guò)改變7堿基對(duì)重疊區(qū)域中或鄰近的核苷酸可以構(gòu)建特異地與其它att位點(diǎn)重組的att位點(diǎn)。因此,適用于本發(fā)明方法、組合物和載體的重組位點(diǎn)包括,但不限于,在15個(gè)堿基對(duì)的核心區(qū)域(GCTTTTTTATACTAA(SEQIDNO37))中具有1、2、3、4或更多個(gè)核苷酸堿基的插入、缺失或替代的那些重組位點(diǎn),所述核心區(qū)域在所有的4個(gè)野生型λatt位點(diǎn)(即attB、attP、attL和attR)中是一致的(見(jiàn)1998年6月7日提交的美國(guó)申請(qǐng)08/663,002(目前是美國(guó)專利5,888,732)和1998年10月23日提交的09/177,387,其更為詳細(xì)地描述了該核心區(qū)域,其公開(kāi)完整地并入本文作為參考)。適用于本發(fā)明方法、組合物、和載體的重組位點(diǎn)也包括在該15個(gè)堿基對(duì)核心區(qū)域(GCTTTTTTATACTAA(SEQIDNO37))中具有1、2、3、4或更多個(gè)核苷酸堿基的插入、缺失或替代、并與此15個(gè)堿基對(duì)核心區(qū)域至少50%一致、至少55%一致、至少60%一致、至少65%一致、至少70%一致、至少75%一致、至少80%一致、至少85%一致、至少90%一致、或至少95%一致的那些重組位點(diǎn)。類似地,attB1、attP1、attL1和attR1的核心區(qū)域彼此是一致的,同樣attB2、attP2、attL2和attR2的核心區(qū)域是一致的。適用于本發(fā)明的核酸方法還包括那些在該15堿基對(duì)核心區(qū)域(GCTTTTTTATACTAA(SEQIDNO37))的7個(gè)堿基對(duì)重疊區(qū)(TTTATAC,其被定義為整合酶蛋白的切割位點(diǎn)并是鏈交換發(fā)生的區(qū)域)中包含1、2、3、4或更多個(gè)核苷酸堿基的插入、缺失或替代的重組位點(diǎn)。這些突變體、片段、變體和衍生物的例子包括,但不限于,以下核酸,該核酸中(1)此7bp重疊區(qū)第1位的胸腺嘧啶缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或腺嘌呤;(2)此7bp重疊區(qū)第2位的胸腺嘧啶缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或腺嘌呤;(3)此7bp重疊區(qū)第3位的胸腺嘧啶缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或腺嘌呤;(4)此7bp重疊區(qū)第4位的腺嘌呤缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或胸腺嘧啶;(5)此7bp重疊區(qū)第5位的胸腺嘧啶缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或腺嘌呤;(6)此7bp重疊區(qū)第6位的腺嘌呤缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或胸腺嘧啶;(7)此7bp重疊區(qū)第7位的胞嘧啶缺失或被替代為鳥(niǎo)嘌呤、胸腺嘧啶、或腺嘌呤;或此7bp重疊區(qū)中具有一或多個(gè)此類缺失和/或替代的任何組合。下表1給出了上述7堿基對(duì)核心區(qū)域的核苷酸序列。正如以下實(shí)施例9-12中描述的,我們構(gòu)建了改變的att位點(diǎn),這些位點(diǎn)說(shuō)明(1)在此7堿基對(duì)重疊區(qū)的頭3個(gè)位置內(nèi)(TTTATAC)實(shí)行替代強(qiáng)烈地影響重組的特異性、(2)在最后4個(gè)位置中(TTTATAC)的替代僅部分地改變重組特異性、和(3)在此7bp重疊區(qū)之外但在該15個(gè)堿基對(duì)核心區(qū)域中進(jìn)行的核苷酸替代不影響重組的特異性但影響重組的效率。因此,本發(fā)明的核酸分子和方法包括那些包含或利用了1、2、3、4、5、6、8、10或更多個(gè)重組特異性受到影響的重組位點(diǎn)、尤其是包含或利用了一或多個(gè)(例如1、2、3、4、5、6、8、10、12、20、30、40、50等)可以基本上相應(yīng)于該15個(gè)堿基對(duì)核心區(qū)域的7堿基對(duì)重疊區(qū)但具有一或多個(gè)影響重組特異性的突變的不同重組位點(diǎn)的核酸分子和方法。尤其有利的此類分子可以包含一段共有序列例如NNNATAC,其中“N”是指任何核苷酸(即,可以是A、G、T/U或C)。優(yōu)選地,如果該共有序列中頭3個(gè)核苷酸的一個(gè)是T/U,那么該頭3個(gè)核苷酸的其它兩個(gè)中的至少一個(gè)不是T/U??梢詫⒚總€(gè)att位點(diǎn)(attB、attP、attL和attR)的核心序列分成由整合酶結(jié)合位點(diǎn)、整合酶切割位點(diǎn)和決定特異性的序列組成的功能單位。正如以下實(shí)施例12中討論的,整合酶頂端鏈(topstrand)切割位點(diǎn)后的頭3個(gè)位置被定義為特異性決定因子。在以下參考序列中用下劃線顯示了這3個(gè)位置CAACTTTTTTATACAAAGTTG(SEQIDNO38)。表1顯示了這3個(gè)位置的以下修飾(64種可能組合),該修飾可以用于制備能夠以高度特異性和其它在此7堿基對(duì)重疊區(qū)頭3個(gè)核苷酸具有相同序列的att位點(diǎn)重組的att位點(diǎn)。表2顯示了適用于本發(fā)明方法、組合物和載體的att位點(diǎn)7堿基對(duì)重疊區(qū)的代表性例子。本發(fā)明還包括包含一或多個(gè)(例如1、2、3、4、5、6、8、10、20、30、40、50等)表2所列核苷酸序列的核苷酸分子。因此,例如,一方面,本發(fā)明提供包含核苷酸序列GAAATAC、GATATAC、ACAATAC或TGCATAC的核酸分子。然而,在某些實(shí)施方案中,本發(fā)明不包括包含了本文圖24A-24C中或?qū)嵤├?中所給att位點(diǎn)核心區(qū)的核酸分子。正如以上提及的,改變位于上述3個(gè)堿基對(duì)區(qū)3’端的核苷酸也可以影響重組特異性。例如,在該7堿基對(duì)重疊區(qū)的最后4個(gè)位置中進(jìn)行改變也可以影響重組特異性。因此,本發(fā)明提供可以和關(guān)連伙伴重組的重組位點(diǎn)、以及含有這些重組位點(diǎn)的分子和制備、鑒定和使用這些位點(diǎn)的方法。以下實(shí)施例12中給出了可以用于鑒定這些位點(diǎn)的方法。這些重組位點(diǎn)的例子包括含有與關(guān)連伙伴聯(lián)合并重組的7堿基對(duì)重疊區(qū)的att位點(diǎn)。上表2中給出了這些7堿基對(duì)重疊區(qū)的具體例子的核苷酸序列。本發(fā)明其它實(shí)施方案包括分離的核酸分子,該分離的核酸分子包含與上表2給出的7bp重疊區(qū)核苷酸序列或SEQIDNO37所示15堿基對(duì)核心區(qū)至少50%一致、至少60%一致、至少70%一致、至少75%一致、至少80%一致、至少85%一致、至少90%一致、或至少95%一致的核苷酸序列,以及與任何這些核苷酸序列或其片段、變體、突變體、和衍生物互補(bǔ)的核苷酸序列。具有與編碼特定重組位點(diǎn)或其部分的參考核苷酸序列例如至少95%“一致”的核苷酸序列的多核苷酸,是指除了該多核苷酸序列可以在參考核苷酸序列的每100個(gè)核苷酸中包括至多5個(gè)點(diǎn)突變(例如插入、替換或缺失)外,該多核苷酸的核苷酸序列與參考序列是一致的。例如,為了獲得具有與參考attB1核苷酸序列(SEQIDNO5)至少95%一致的核苷酸序列的多核苷酸,可以在attB1參考序列中缺失或用另一核苷酸替代至多5%的核苷酸,或可以在attB1參考序列中插入高達(dá)attB1參考序列總核苷酸5%數(shù)量的核苷酸。該參考序列的這些突變可以發(fā)生在參考核苷酸序列的5’或3’端位置上或那些末端位置之間的任何位置上,或單個(gè)地散布在參考序列的核苷酸中或散布在參考序列的一或多個(gè)連續(xù)組中。實(shí)際上,可以使用已知計(jì)算機(jī)程序如DNAsis軟件(HitachiSoftware,SanBruno,California)進(jìn)行初期序列比對(duì)并隨后使用ESEE3.0版DNA/蛋白質(zhì)序列軟件(cabot@trog.mbb.sfu.ca)進(jìn)行多序列比對(duì),常規(guī)地確定任何具體的核酸分子是否與例如給定的重組位點(diǎn)核苷酸序列或其部分有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%一致性?;蛘?,可以使用BESTFIT程序(WisconsinSequenceAnalysisPackage,GeneticsComputerGroup,UniversityResearchPark,575ScienceDrive,Madison,WI53711)來(lái)確定,其中該程序使用局部同源性算法(Smith和Waterman,AdvancesinAppliedMathematics2482-489(1981))尋找兩個(gè)序列之間的最佳同源區(qū)段。根據(jù)本發(fā)明,當(dāng)使用DNAsis、ESEE、BESTFIF或任何其它序列比對(duì)程序來(lái)確定特定序列是否與參考序列有例如95%一致性時(shí),設(shè)置參數(shù)以便就全長(zhǎng)參考核苷酸序列計(jì)算一致性百分?jǐn)?shù)并允許在同源性中有達(dá)到參考序列核苷酸總數(shù)5%的空缺區(qū)(gap)。正如以上提及,一方面,本發(fā)明還提供構(gòu)建和/或鑒定適合與本發(fā)明核酸分子一起使用的重組位點(diǎn)方法,以及通過(guò)這些方法構(gòu)建和/或鑒定的重組位點(diǎn)。簡(jiǎn)而言之,本發(fā)明提供構(gòu)建和/或鑒定能夠和其它重組位點(diǎn)重組的重組位點(diǎn)的方法。例如,本發(fā)明提供構(gòu)建重組位點(diǎn)并鑒定這些重組位點(diǎn)是否與其它重組位點(diǎn)重組的方法。針對(duì)重組活性或特異性而篩選出的重組位點(diǎn)可以通過(guò)任何多種方法來(lái)構(gòu)建,包括定點(diǎn)誘變和隨機(jī)核酸合成。本發(fā)明還提供經(jīng)歷一次重組后以低頻率(例如在隨后的重組反應(yīng)中具有降低了至少5倍、至少10倍、至少50倍、至少100倍、或至少1000倍的重組活性)發(fā)生重組或基本上不能發(fā)生重組的“單次使用”重組位點(diǎn)。本發(fā)明還提供制備和使用含有該單次使用重組位點(diǎn)的核酸分子的方法和含有這些位點(diǎn)的分子。以下給出了可以用于產(chǎn)生和確定該單次使用重組位點(diǎn)的方法的例子。att系統(tǒng)核心整合酶結(jié)合位點(diǎn)包含一個(gè)具有以下核苷酸序列的被中斷的7堿基對(duì)反向重復(fù)------>.......<------caactttnnnnnnnaaagttg(SEQIDNO39),以及其可包含完全或非完全重復(fù)的變體??梢詫⒋酥貜?fù)元件再分為兩個(gè)由caac/gttg區(qū)段(下劃線)(位于中心未限定序列(用字母“h”表示的核苷酸)遠(yuǎn)側(cè))、和ttt/aaa區(qū)段(位于中心未指定序列近側(cè))組成的遠(yuǎn)端和/或近端域”。改變中心未限定區(qū)一邊或兩邊的遠(yuǎn)端和/或近端域的序列組成可以影響重組反應(yīng)的結(jié)果。影響的范圍和程度是所產(chǎn)生的具體改變以及特定重組事件(例如LR對(duì)BP反應(yīng))的函數(shù)。例如,可以認(rèn)為經(jīng)改變而具有以下核苷酸序列的attB位點(diǎn)------>.......<------caactttnnnnnnnaaacaag(SEQIDNO40),可以和關(guān)連attP發(fā)生功能性相互作用,并產(chǎn)生attL和attR。然而,后兩個(gè)重組位點(diǎn)不論那一個(gè)獲得了含有“caag”(位于以上所示序列的左邊)的區(qū)段都將在隨后的重組事件中喪失功能。以上僅是能夠在參與單次重組事件后造成att位點(diǎn)失去功能的核心整合酶結(jié)合序列中多種可能改變的一種。因此,可以通過(guò)改變毗鄰att位點(diǎn)7堿基對(duì)重疊區(qū)的7堿基對(duì)反向重復(fù)區(qū)的核苷酸,產(chǎn)生單次使用重組位點(diǎn)。該區(qū)域示意如下CAACTTT[7堿基對(duì)重疊區(qū)]AAAGTTG。在構(gòu)建單次使用重組位點(diǎn)時(shí),可以完全地缺失或用其它核苷酸替代序列CAACTTT或AAAGTTG(即7堿基對(duì)反向重復(fù)區(qū))的1、2、3、4或更多個(gè)核苷酸。這些7堿基對(duì)反向重復(fù)區(qū)相對(duì)于彼此而言是互補(bǔ)序列。因此,可以在任一7堿基對(duì)反向區(qū)中作改變以便產(chǎn)生單次使用重組位點(diǎn)。而且,當(dāng)DNA是雙鏈并存在一個(gè)7堿基對(duì)反向重復(fù)區(qū)時(shí),在另一鏈上也存在另一7堿基對(duì)反向重復(fù)區(qū)。使用序列CAACTTT進(jìn)行舉例說(shuō)明,可以形成單次使用重組位點(diǎn)的7堿基對(duì)反向重組區(qū)的例子包括,但不限于如下核酸分子,該核酸分子中(1)此7堿基對(duì)反向重復(fù)區(qū)第1位的胞嘧啶缺失或被替代為鳥(niǎo)嘌呤、腺嘌呤、或胸腺嘧啶;(2)此7堿基對(duì)反向重復(fù)區(qū)第2位的腺嘌呤缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或胸腺嘧啶;(3)此7堿基對(duì)反向重復(fù)區(qū)第3位的腺嘌呤缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或胸腺嘧啶;(4)此7堿基對(duì)反向重復(fù)區(qū)第4位的胞嘧啶缺失或被替代為鳥(niǎo)嘌呤、腺嘌呤、或胸腺嘧啶;(5)此7堿基對(duì)反向重復(fù)區(qū)第5位的胸腺嘧啶缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或腺嘌呤;(6)此7堿基對(duì)反向重復(fù)區(qū)第6位的胸腺嘧啶缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或腺嘌呤;(7)此7堿基對(duì)反向重復(fù)區(qū)第7位的胸腺嘧啶缺失或被替代為鳥(niǎo)嘌呤、胞嘧啶、或腺嘌呤;或此7堿基對(duì)反向重復(fù)區(qū)中具有1、2、3、4或更多個(gè)此類缺失和/或替代的任何組合。下表3給出了上述7堿基對(duì)反向區(qū)域的核苷酸序列的代表性例子。形成單次使用重組位點(diǎn)的核苷酸序列的代表性例子也可以通過(guò)將表4第1部分中給出了核苷酸序列與表4第2部分給出的核苷酸序列進(jìn)行組合來(lái)制備。也可以通過(guò)在這些區(qū)域內(nèi)部插入一或多個(gè)(例如1、2、3、4、5、6、7等)核苷酸,制備單次使用重組位點(diǎn)。在對(duì)于特定核酸區(qū)段而言需要防止重組事件的大多數(shù)情況下,可以將改變的序列定位在該核酸區(qū)段的近側(cè)。使用以下簡(jiǎn)圖進(jìn)行舉例說(shuō)明=5’核酸區(qū)段3’=caacttt[7堿基對(duì)重疊區(qū)]AAAGTTG,小寫(xiě)核苷酸序列代表7堿基對(duì)反向重組序列(即caacttt),當(dāng)尋求防止在所示核酸區(qū)段3’末端(即相對(duì)于該核苷酸區(qū)段的近側(cè)末端)發(fā)生重組時(shí),該序列一般具有經(jīng)插入、缺失和/或替代以形成單次使用重組位點(diǎn)的序列。因此,例如,可以使用單次重組反應(yīng)以將核酸區(qū)段整合在另一核酸分子中,然后該重組位點(diǎn)將有效地喪失功能從而防止該位點(diǎn)參與其它的重組反應(yīng)。類似地,可以將單次重組位點(diǎn)放置在核酸區(qū)段的兩個(gè)末端以便可以將該核酸區(qū)段整合在另一核酸分子中、或環(huán)化,并且甚至在重組酶存在時(shí)仍保持整合或環(huán)化??梢允褂枚喾N方法就功能活性(如經(jīng)過(guò)一次重組事件后不能再經(jīng)歷隨后的重組事件)篩選潛在的單次使用重組位點(diǎn)。例如,對(duì)于篩選重組位點(diǎn)以鑒定在單次重組事件后喪失功能的那些重組位點(diǎn)而言,可以進(jìn)行第一重組反應(yīng)以產(chǎn)生其中負(fù)選擇標(biāo)記與一或多個(gè)潛在缺陷性重組位點(diǎn)連接的質(zhì)粒。然后可以使該質(zhì)粒和包含類似地連接重組位點(diǎn)的正選擇標(biāo)記的另一核酸分子反應(yīng)。因此,設(shè)計(jì)該選擇系統(tǒng)以便重組的分子對(duì)陰性篩選敏感并通過(guò)正選擇選出不發(fā)生重組的分子。使用該系統(tǒng),然后可以直接地選出期望的單次使用核心位點(diǎn)突變體。本領(lǐng)域技術(shù)人員將明了,可以設(shè)計(jì)多種篩選試驗(yàn),以獲得與上述結(jié)果相同的結(jié)果。在許多情況下,可以對(duì)這些試驗(yàn)進(jìn)行設(shè)計(jì)以便發(fā)生初次重組事件、然后鑒定不能參與隨后重組事件的重組位點(diǎn)或選出含有這些重組位點(diǎn)的分子。相關(guān)篩選試驗(yàn)將導(dǎo)致選擇除去參與第二重組事件的核酸分子。而且,正如以上提及的,可以設(shè)計(jì)篩選試驗(yàn),以便選擇除去參與隨后重組事件的分子并選出不參與隨后重組事件的那些分子。在使大量的核酸區(qū)段彼此附著或?qū)嵤┒鄠€(gè)重組反應(yīng)時(shí),單次使用的重組位點(diǎn)對(duì)于降低重組頻率或防止重組是尤其有用的,因此,本發(fā)明還包括含有單次使用的重組位點(diǎn)的核酸分子、以及使用這些位點(diǎn)實(shí)施重組的方法。本發(fā)明核酸分子的構(gòu)建和用途正如以下更詳細(xì)討論的,一方面,本發(fā)明提供了一個(gè)用于構(gòu)建具有特定功能或活性的核酸分子的模式系統(tǒng)。本發(fā)明還提供使核酸分子群和一或多個(gè)已知或未知目的靶序列(例如2、3、4、5、7、10、12、15、20、30、50個(gè)等)或和其它核酸分子群(已知或未知的)聯(lián)合的方法,由此產(chǎn)生組合分子群(例如組合文庫(kù)),從該組合分子群中可以獲得獨(dú)特的和/或新的分子(例如雜合分子)以及這些分子所編碼的蛋白質(zhì)或肽,并可以對(duì)它們作進(jìn)一步分析。本發(fā)明還包括制備含有一個(gè)以上核酸插入片段(例如2、3、4、5、6、8、10、12、15、20、30、40、50等個(gè)插入片段)的載體的方法。本發(fā)明一個(gè)普通實(shí)施方案中,本發(fā)明載體是按以下方式制備的。獲得最終將插入目的載體中的核酸分子(例如購(gòu)買(mǎi)、通過(guò)PCR產(chǎn)生或通過(guò)使用逆轉(zhuǎn)錄酶制備cDNA來(lái)產(chǎn)生)。適當(dāng)?shù)闹亟M位點(diǎn)或可以在合成過(guò)程中摻入核酸分子的5’和3’末端、或可以在之后添加。在設(shè)法制備含有多核酸插入片段的載體時(shí),可以在一個(gè)反應(yīng)混合物中或在一系列反應(yīng)混合物中將這些插入片段插入載體中。例如,正如圖16所示,可以將多個(gè)核酸區(qū)段末端對(duì)末端連接、并通過(guò)在例如單個(gè)反應(yīng)混合物中進(jìn)行的反應(yīng)將其插入載體中??梢詫?duì)該反應(yīng)混合物中的這些核酸區(qū)段進(jìn)行設(shè)計(jì),以便5’和3’末端的重組位點(diǎn)可以導(dǎo)致這些核酸區(qū)段按特定的順序以及特定的5’至3’取向插入目標(biāo)載體中。或者,可以設(shè)計(jì)核酸區(qū)段,以便在不考慮順序、取向(即5’至3’取向)、插入片段的數(shù)量、和/或插入片段的數(shù)量和/或雙重插入片段的數(shù)量的情況下將其插入目的載體中。而且,在某些情況下,一或多個(gè)此核酸區(qū)段將僅在一個(gè)末端具有重組位點(diǎn)。而且,如果期望的話,此末端或這些末端可以通過(guò)使用例如連接酶或拓?fù)洚悩?gòu)酶與其它核酸區(qū)段相連接。作為例子,在5’端具有attR1位點(diǎn)的線性核酸分子可以和含有側(cè)翼有attL1位點(diǎn)和attL2位點(diǎn)的ccdB基因的目的載體重組。在LR反應(yīng)之前、期間或之后,可以例如通過(guò)限制性酶在ccdB基因相反側(cè)的attR2位點(diǎn)一邊上切割目的載體。因此,目的載體可以在切割和經(jīng)歷重組后成為線性的。而且,核酸分子的attR1位點(diǎn)將與目的載體的attL1位點(diǎn)重組,產(chǎn)生含有該核酸分子的線性載體。然后可以使用酶如連接酶或拓?fù)洚悩?gòu)酶將所獲線性產(chǎn)物環(huán)化。使用圖16所示實(shí)施方案舉例說(shuō)明本發(fā)明的另一方面,5’末端具有attL1位點(diǎn)而3’末端具有attL3位點(diǎn)的第一DNA片段通過(guò)重組與5’末端具有attR3位點(diǎn)而3’末端具有attL4位點(diǎn)的第二DNA片段附著。5’末端具有attR4位點(diǎn)而3’末端具有attL5位點(diǎn)的第三DNA片段通過(guò)重組與3’末端具有attL4位點(diǎn)的第二DNA片段附著。5’末端具有attR5位點(diǎn)而3’末端具有attL2位點(diǎn)的第四DNA片段通過(guò)重組與3’末端具有attL5位點(diǎn)的第三DNA片段附著。目的載體含有位于ccdB基因側(cè)翼的attR1位點(diǎn)和attR2位點(diǎn)。因此,當(dāng)與LRCLONASETM反應(yīng)時(shí),可以將第1、2、3和4DNA區(qū)段插入插入載體中,并以attB1、attB3、attB4、attB5和attB2位點(diǎn)作為側(cè)翼或被這些位點(diǎn)分開(kāi)。圖17A-17B顯示了組裝lus操縱子所涉及到的相似程序,以下實(shí)施例18對(duì)此進(jìn)行了描述。本領(lǐng)域技術(shù)人員將明了,圖16所示程序可以有多種變化。例如,可以使用attB、attP、attL和attR位點(diǎn)、以及其它重組位點(diǎn)的各種組合。類似地,可以使用各種選擇標(biāo)記、復(fù)制起點(diǎn)、啟動(dòng)子和其它遺傳元件。而且,可以在這些載體中加上允許整合在真核染色體中的區(qū)域(例如可轉(zhuǎn)座因子)。圖18顯示了將多個(gè)DNA區(qū)段插入載體中的多反應(yīng)方法的一個(gè)例子。在此示例性實(shí)施方案中,三個(gè)DNA區(qū)段在兩個(gè)不同的反應(yīng)混合物中彼此重組。然后在利于這兩個(gè)反應(yīng)混合物的產(chǎn)物之間發(fā)生重組并且利于連接產(chǎn)物插入載體(例如目的載體)中的條件下,將這些混合物中產(chǎn)生的產(chǎn)物混合在一起。該實(shí)施方案的優(yōu)點(diǎn)是(1)可以將DNA區(qū)段直接插入目的載體中而不需要預(yù)先插入另一載體中;和(2)可以使用相同的att位點(diǎn)以及其它重組位點(diǎn)制備各連接的DNA區(qū)段以便將其插入載體。本領(lǐng)域技術(shù)人員明了,本文所述方法可以有多種變體。例如,可以使用單次重組位點(diǎn)連接各核酸區(qū)段。因此,消除或降低了與核酸區(qū)段陣列參與不期望的重組反應(yīng)有關(guān)的潛在問(wèn)題。而且,可以使用上述程序通過(guò)各種途徑將大量核酸分子個(gè)體連接在一起。例如,可以隨機(jī)地、或按特定順序,在考慮或不考慮區(qū)段的5’至3’方向的情況下,連接核酸區(qū)段。而且,可以將一或多個(gè)核酸區(qū)段的相同拷貝摻入另一核酸分子中。因此,本發(fā)明還提供含有多拷貝的單個(gè)核酸區(qū)段的核酸分子。而且,可以使用對(duì)位于這些區(qū)段5’和3’末端的重組位點(diǎn)的篩選,確定連接然后插入例如載體中的相同核酸區(qū)段的確切數(shù)目。然后可以將這些載體插入宿主細(xì)胞,在該宿主細(xì)胞中它們能夠例如自主復(fù)制或整合在通常位于宿主細(xì)胞內(nèi)的一或多個(gè)核酸分子中(例如通過(guò)位點(diǎn)特異性重組或同源重組整合)。含有多拷貝核酸分子區(qū)段的核酸分子可以用于例如擴(kuò)增特定基因的拷貝數(shù)。因此,本發(fā)明還提供基因擴(kuò)增方法,含有多拷貝核酸區(qū)段的核酸分子、和含有本發(fā)明核酸分子的宿主細(xì)胞。作為另一實(shí)例,可以使用本發(fā)明方法將兩個(gè)不同的核酸區(qū)段連接起來(lái)。例如,可以將重組位點(diǎn)放置在這些區(qū)段上,以便這些區(qū)段交替連接(例如區(qū)段A+區(qū)段B+區(qū)段A+區(qū)段B,等)。當(dāng)需要使用增加拷貝數(shù)的核酸來(lái)增加產(chǎn)生的表達(dá)產(chǎn)物的量時(shí),具有此結(jié)構(gòu)的核酸分子是尤其有用的。在此情況下,“區(qū)段A”可以例如是包含ORF的核酸分子。因此,可以制備含有上述結(jié)構(gòu)并且在缺少誘導(dǎo)信號(hào)時(shí)不表達(dá)實(shí)質(zhì)量的區(qū)段B產(chǎn)物但在誘導(dǎo)時(shí)產(chǎn)生高水平的該產(chǎn)物的細(xì)胞。當(dāng)區(qū)段B表達(dá)產(chǎn)物對(duì)細(xì)胞有毒性時(shí),該系統(tǒng)尤其有用。因此,可以使用上述方法構(gòu)建并在不存在區(qū)段B表達(dá)產(chǎn)物導(dǎo)致的破壞性影響的情況下維持含有區(qū)段B的細(xì)胞。而且,然后可以使用對(duì)位于區(qū)段B中的ORF的誘導(dǎo)表達(dá),以便例如瞬時(shí)產(chǎn)生高水平的區(qū)段B表達(dá)產(chǎn)物。圖19顯示了將多個(gè)DNA區(qū)段插入載體的多步驟方法的另一實(shí)例。在此實(shí)施方案中,在不同的重組反應(yīng)中使三個(gè)DNA區(qū)段彼此連接,然后使用LR和BPCLONASETM反應(yīng)將它們插入不同的載體中。在構(gòu)建了這兩個(gè)載體后,使用LR反應(yīng)將插入的DNA區(qū)段轉(zhuǎn)移至另一載體中。這就導(dǎo)致所有的6個(gè)DNA區(qū)段插在單個(gè)目的載體中。本領(lǐng)域技術(shù)人員明了,圖19所示方法可以有多種變體并且這些變體包括在本發(fā)明范圍內(nèi)。使用本發(fā)明方法可以在一個(gè)步驟中連接的基因數(shù)目一般被可以使用的具有不同特異性的重組位點(diǎn)的數(shù)目所限制。而且,正如上述以及圖18和19所示意的,可以選擇重組位點(diǎn)以便在一個(gè)反應(yīng)中連接核酸區(qū)段并且其在之后的反應(yīng)中不參與重組。例如,再次使用圖18所給方法作為參考,可以使用attL和attR位點(diǎn)和LRClonaseTM制備一系列有序的核酸區(qū)段多聯(lián)體。然后可以將這些多聯(lián)體彼此連接,并任選地,使用其它LR反應(yīng)和其它核酸分子連接。該方法可以有多種變體。類似地,可以使用單次使用的重組位點(diǎn)防止核酸區(qū)段(一旦摻入另一核酸分子中后)參與隨后的重組反應(yīng)。單次重組位點(diǎn)的使用使得可以從基本上無(wú)限數(shù)量的單個(gè)核酸區(qū)段制備產(chǎn)生核酸分子。一方面,本發(fā)明還提供使在單個(gè)群體中的核酸分子彼此聯(lián)合或與其它分子或其它分子群聯(lián)合,籍此產(chǎn)生組合分子的方法,從所述組合分子還可以獲得獨(dú)特和/或新的分子(例如雜合分子)或這些分子編碼的蛋白質(zhì)或肽。本發(fā)明還為篩選核酸分子群以鑒定具有特定活性或編碼具有特定活性的表達(dá)產(chǎn)物(例如RNA或多肽)的那些核酸分子提供了方法。因此,本發(fā)明方法可以用于將編碼功能域(例如SH3、域、抗體結(jié)合位點(diǎn)、跨膜域、信號(hào)肽、酶活性位點(diǎn))的核酸區(qū)段按各種組合彼此聯(lián)合起來(lái)并可以用于鑒定這些方法產(chǎn)生的具有特定活性的產(chǎn)物。例如,可以通過(guò)以下方法鑒定含有轉(zhuǎn)錄調(diào)節(jié)序列的核酸區(qū)段。對(duì)基因組DNA文庫(kù)的核酸分子進(jìn)行修飾以便在其5’和3’端含有重組位點(diǎn)。然后將這些核酸分子插入目的載體中,以便它們位于選擇標(biāo)記的5’。由此,當(dāng)載體中選擇標(biāo)記與激活其轉(zhuǎn)錄的核酸分子可操作連接時(shí),選擇標(biāo)記將表達(dá)。因此,本發(fā)明還提供能夠激活轉(zhuǎn)錄的分離的核酸分子。在許多情況下,可以使用本發(fā)明的方法和/或組合物,鑒定激活轉(zhuǎn)錄的這些核酸分子。而且,由于一些轉(zhuǎn)錄調(diào)節(jié)序列以組織特異性方式激活基因表達(dá),因此可以使用本發(fā)明方法鑒定組織特異性轉(zhuǎn)錄調(diào)節(jié)序列。例如,當(dāng)需要鑒定在特定類型細(xì)胞或組織中激活轉(zhuǎn)錄的轉(zhuǎn)錄調(diào)節(jié)序列時(shí),可以在該類細(xì)胞或組織的細(xì)胞中實(shí)施上述篩選程序。類似地,當(dāng)需要鑒定在特定時(shí)間、特定發(fā)育階段、或特定孵育條件(例如特定溫度)下細(xì)胞中激活轉(zhuǎn)錄的調(diào)節(jié)序列時(shí),可以在適當(dāng)時(shí)間、在特定發(fā)育階段或在特定孵育條件下在細(xì)胞中實(shí)施上述篩選程序。一旦使用該方法鑒定出激活轉(zhuǎn)錄的序列后,可以測(cè)試該轉(zhuǎn)錄調(diào)節(jié)序列以確定其是否能夠在其它細(xì)胞類型或在非鑒定和/或選擇其的條件下激活轉(zhuǎn)錄。因此,一個(gè)一般方面,本發(fā)明提供構(gòu)建和/或鑒定轉(zhuǎn)錄調(diào)節(jié)序列的方法、以及含有與編碼表達(dá)產(chǎn)物的核酸區(qū)段可操作連接的通過(guò)本發(fā)明方法鑒定的轉(zhuǎn)錄調(diào)節(jié)序列的核酸分子、以及制備這些分子的方法。也可以使用類似于上述方法的方法鑒定復(fù)制起點(diǎn)。因此,本發(fā)明提供鑒定含有復(fù)制起點(diǎn)的核酸分子的方法、以及含有本發(fā)明方法鑒定的復(fù)制起點(diǎn)的核酸分子、和制備這些分子的方法。正如以下實(shí)施例1所述,因此,本發(fā)明尤其適合于構(gòu)建組合文庫(kù)。例如,還可以使用本發(fā)明方法“改組”編碼蛋白質(zhì)域和區(qū)的核酸分子以產(chǎn)生能夠用于表達(dá)具有特定性質(zhì)或活性的蛋白質(zhì)的新核酸分子。在此實(shí)施方案中,將編碼蛋白質(zhì)部分的核酸區(qū)段接合起來(lái)并然后就一或多種性質(zhì)或活性進(jìn)行篩選。這些組合文庫(kù)中的核酸區(qū)段可以按多種方法來(lái)制備,包括逆轉(zhuǎn)錄mRNA。可以使用諸如易錯(cuò)PCR等方法,產(chǎn)生這些文庫(kù)的核酸區(qū)段的改變形式。在許多應(yīng)用中,可能期望這些文庫(kù)中的核酸區(qū)段編碼蛋白質(zhì)的亞部分。在此時(shí),可以調(diào)整這些方法以產(chǎn)生其中大多數(shù)不合全長(zhǎng)ORF的核酸區(qū)段群。例如,這可以通過(guò)剪切cDNA文庫(kù)然后分離剪切的分子(例如使用聚丙烯酰胺或瓊脂糖凝膠電泳)來(lái)實(shí)現(xiàn)。然后可以對(duì)長(zhǎng)度在例如300-600核苷酸的片段(潛在地編碼100-200個(gè)氨基酸殘基的片段)進(jìn)行重組并使之插入載體中與轉(zhuǎn)錄調(diào)節(jié)序列可操作地連接。然后可以篩選該組合文庫(kù)的各成員多肽表達(dá)產(chǎn)物,以鑒定具有特定性質(zhì)或活性的那些。本發(fā)明還提供使用來(lái)源于基因組DNA的外顯子核酸制備組合文庫(kù)的方法。外顯子/內(nèi)含子拼接邊界是本領(lǐng)域已知的;因此,可以使用常規(guī)、本領(lǐng)域已知的方法無(wú)需過(guò)度實(shí)驗(yàn),即可鑒定出外顯子在基因組DNA中的定位。而且,可以使用相應(yīng)于內(nèi)含子/外顯子拼接邊界的引物產(chǎn)生相應(yīng)于外顯子序列的核酸分子。而且,然后可以將這些核酸分子彼此連接以產(chǎn)生包含相應(yīng)于外顯子序列的核酸分子的組合文庫(kù)。例如,可以使用相應(yīng)于內(nèi)含子/外顯子拼接邊界的引物,通過(guò)PCR產(chǎn)生相應(yīng)于外顯子序列的核酸分子。然后可以使用連接酶或使用含有重組位點(diǎn)的引物擴(kuò)增這些序列,將重組位點(diǎn)添加在所獲PCR產(chǎn)物的末端。然后可以使用重組反應(yīng)使這些PCR產(chǎn)物彼此連接并將其插入表達(dá)載體中。然后可以對(duì)所獲組合文庫(kù)進(jìn)行篩選以便鑒定出例如編碼具有特定功能或活性的多肽的核酸分子。而且,可以通過(guò)本文其它地方所述的方法通過(guò)拼接除去組合文庫(kù)核酸分子表達(dá)產(chǎn)物(例如RNA或蛋白質(zhì))中的重組位點(diǎn)。而且,用于產(chǎn)生組合文庫(kù)的核酸分子、以及組合文庫(kù)本身可以經(jīng)突變產(chǎn)生與相應(yīng)原始核酸分子平均至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%一致的核酸分子。類似地,用于產(chǎn)生組合文庫(kù)的核酸分子可以經(jīng)突變產(chǎn)生所編碼多肽與相應(yīng)原始核酸分子所編碼多肽平均至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%一致的核酸分子。一方面,本發(fā)明提供制備和鑒定生物學(xué)過(guò)程或生物學(xué)途徑的顯性/失活抑制基因(dominant/negativesuppressors)的方法。例如,可以就顯性/失活活性(dominant/negativeactivity)篩選上述組合文庫(kù)。一般,顯性/失活活性導(dǎo)致生物學(xué)過(guò)程或生物學(xué)途徑受到抑制。在大多數(shù)情況下,顯性/失活抑制基因通過(guò)和細(xì)胞成分的相互作用表現(xiàn)其作用。例如,許多顯性/失活抑制基因含有具有和一或多種細(xì)胞蛋白有關(guān)的結(jié)合活性的域但不具有和這些細(xì)胞蛋白相關(guān)的其它活性。盡管不欲受理論的束縛,但一旦在細(xì)胞中表達(dá)后顯性/失活抑制基因一般和一或多個(gè)細(xì)胞配體相互作用并阻斷由細(xì)胞蛋白造成的激活。因此,認(rèn)為顯性/失活抑制基因干擾正常細(xì)胞過(guò)程的一個(gè)機(jī)制是隔絕配體。顯性/失活活性可以由野生型蛋白質(zhì)中的突變,例如改變單個(gè)氨基酸殘基或缺失完整的蛋白區(qū),來(lái)產(chǎn)生。例如,Qury等,J.Biol.Chem.2752261-22614(2000)描述了缺失單個(gè)氨基酸殘基可導(dǎo)致顯性/失活活性的顯性/失活受體。蛋白質(zhì)片段也可以具有顯性/失活活性。例如,McNellis等,PlantCell81491-1503(1996),描述了組成型光形態(tài)發(fā)生蛋白1(COP1)的N端片段在阿布屬(Arabidopsis)幼苗中表達(dá)時(shí)具有顯性/失活活性。可以使用多種試驗(yàn)來(lái)篩選顯性/失活活性。例如,Maemura等,J.Biol.Chem.2743156-31570(1999)描述了稱作內(nèi)皮PAS域蛋白質(zhì)1(EPAS1)的轉(zhuǎn)錄因子具有顯性/失活活性的缺失突變。具體地,Maemura等證明,此EPAS1突變?cè)诩?xì)胞中的表達(dá)抑制了對(duì)VEGFmRNA產(chǎn)生的誘導(dǎo)(一種與野生型EPAS1有關(guān)的活性)。本發(fā)明還提供鑒定編碼具有特定功能或活性的多肽的核酸分子的方法、以及通過(guò)這些方法產(chǎn)生的核酸分子、這些核酸分子的表達(dá)產(chǎn)物、和含有這些核酸分子的宿主細(xì)胞。該功能或活性包括自細(xì)胞中分泌、酶活性、配體結(jié)合活性(即對(duì)金屬例子的結(jié)合親和力、細(xì)胞表面受體、核酸、可溶性蛋白質(zhì))、和使表達(dá)產(chǎn)物靶向亞細(xì)胞區(qū)室的能力(例如向線粒體、葉綠體、內(nèi)質(zhì)網(wǎng)等的定位)。一般可以對(duì)鑒定這些核酸分子的試驗(yàn)進(jìn)行設(shè)計(jì)以便鑒定與該多肽有關(guān)的功能或活性。本發(fā)明還提供方法,以鑒定編碼具有與其它多肽相互作用的區(qū)域的多肽的核酸分子。該方法的一個(gè)例子涉及使用雙雜種分析。見(jiàn)例如Fields等,美國(guó)專利5,667,973,整個(gè)公開(kāi)并入本文作為參考。更具體地,可以使用本發(fā)明方法制備編碼融合蛋白的核酸分子,所述融合蛋白是在當(dāng)與另一多肽(例如Gal4的C端域)緊鄰時(shí)表現(xiàn)出特定功能的多肽(例如Gal4的N端域)和配體所尋找的蛋白質(zhì)或蛋白質(zhì)區(qū)域之間構(gòu)成的。然后制備編碼前句中提及的其它多肽與組合文庫(kù)所編碼的蛋白質(zhì)區(qū)段之間構(gòu)成的融合物的其它核酸分子。由此,可以通過(guò)對(duì)兩個(gè)多肽彼此緊鄰所導(dǎo)致的相關(guān)活性進(jìn)行篩選,鑒定組合文庫(kù)中編碼期望配體的核酸區(qū)段。也可以通過(guò)本發(fā)明方法產(chǎn)生噬菌體和細(xì)菌表面展示文庫(kù),以鑒定具有特定功能活性(例如對(duì)于特定配體的結(jié)合活性)的域。例如,Kim等,Appl.Environ.Microbiol.66788-793(2000),描述了用于選擇性地篩選羧甲基纖維素酶(CMCase)的改良變體的細(xì)菌表面展示方法。根據(jù)本發(fā)明,突變的CMCase基因文庫(kù)可以通過(guò)DNA改組產(chǎn)生并與冰晶核蛋白(Inp)基因融合,這就導(dǎo)致產(chǎn)生展示在細(xì)菌細(xì)胞表面的融合蛋白。因此,本發(fā)明提供鑒定編碼與其它蛋白質(zhì)相互作用或具有特定功能活性的蛋白質(zhì)或蛋白質(zhì)區(qū)域的核酸區(qū)段的方法、以及通過(guò)這些方法鑒定的核酸區(qū)段、和這些核酸區(qū)段的多肽表達(dá)產(chǎn)物。一方面,本發(fā)明方法涉及制備組合文庫(kù)和篩選這些文庫(kù)以鑒定所編碼表達(dá)產(chǎn)物與其它蛋白質(zhì)相互作用或具有特定活性的核酸區(qū)段。在許多情況下,上述組合文庫(kù)將編碼融合蛋白。因此,本發(fā)明方法可以用于制備和鑒定編碼具有特定性質(zhì)、功能或活性的蛋白質(zhì)和蛋白質(zhì)變體的核酸分子。可易于測(cè)試的蛋白質(zhì)性質(zhì)的一個(gè)例子是溶解度。在產(chǎn)生不溶性GFP融合蛋白時(shí)GFP產(chǎn)生的熒光被淬滅。另外,當(dāng)適當(dāng)定位時(shí),蛋白質(zhì)相對(duì)少量氨基酸殘基(如1、2、3、4個(gè)等)的改變可改變?cè)摰鞍踪|(zhì)的溶解度。因此,表達(dá)GFP融合蛋白的組合文庫(kù)可用于分離改變了溶解度的蛋白質(zhì)或蛋白質(zhì)變體。在一個(gè)具體例子中,設(shè)計(jì)表達(dá)與單個(gè)不溶性多肽融合的GFP的組合文庫(kù)可用于分離編碼該多肽可溶性變體的核酸分子。本發(fā)明的方法可用于構(gòu)建含有兩個(gè)或多個(gè)核酸區(qū)段的核酸分子,其中一個(gè)核酸區(qū)段的表達(dá)被其它核酸區(qū)段之一的表達(dá)產(chǎn)物所促進(jìn)。例如,可以將一個(gè)核酸區(qū)段可操作地與T7聚合酶啟動(dòng)子連接,而另一核酸區(qū)段編碼T7聚合酶。由此,與T7聚合酶啟動(dòng)子可操作連接的核酸區(qū)段將在T7聚合酶表達(dá)時(shí)獲得表達(dá)。該系統(tǒng)的許多變體都屬于本發(fā)明范圍。例如,編碼具有上述特定活性的成分的核酸可以位于插有一或多個(gè)該核酸區(qū)段的載體中。本發(fā)明方法還可以用于構(gòu)建編碼多亞基酶的一個(gè)以上亞基的核酸分子。而且,該酶各亞基的表達(dá)均可以受到相同或不同啟動(dòng)子的調(diào)節(jié)。當(dāng)使用相同啟動(dòng)子驅(qū)動(dòng)編碼兩個(gè)或多個(gè)蛋白質(zhì)的核酸表達(dá)時(shí),該mRNA可以含有例如一或多個(gè)內(nèi)部核糖體進(jìn)入位點(diǎn)(IRES),這些位點(diǎn)使得可以翻譯位于5’大部分編碼序列3’端的RNA所編碼的蛋白質(zhì)。本發(fā)明方法可以用于構(gòu)建含有多種特定插入片段的核酸分子和細(xì)胞。因此,一方面,本發(fā)明方法可以用于制備含有多個(gè)編碼特定產(chǎn)物的基因的核酸分子和細(xì)胞。這些方法允許產(chǎn)生具有特定特征的核酸分子和生物體。例如,正如以下實(shí)施例18的討論,可以制備含有參與特定生學(xué)途徑的所用基因的核酸。這些基因可以各與不同轉(zhuǎn)錄調(diào)節(jié)序列或一或多個(gè)拷貝的相同轉(zhuǎn)錄調(diào)節(jié)序列連接。此外,參與相同或不同生物學(xué)途徑或生物學(xué)過(guò)程的基因可以可操作地與在存在相同或不同誘導(dǎo)劑時(shí)、在相同或不同的環(huán)境條件下(例如溫度)、或在相同或不同細(xì)胞類型中利于轉(zhuǎn)錄的轉(zhuǎn)錄調(diào)節(jié)序列連接。而且,當(dāng)基因編碼參與途徑或過(guò)程的多肽表達(dá)產(chǎn)物時(shí),這些表達(dá)產(chǎn)物的一或多個(gè)可以表達(dá)為融合蛋白。此外,可以使用本發(fā)明方法構(gòu)建含有編碼參與一個(gè)以上不同生物學(xué)途徑或生物學(xué)過(guò)程的基因產(chǎn)物的插入核酸區(qū)段的細(xì)胞。例如,還可以使用本發(fā)明方法修飾使用多位點(diǎn)重組系統(tǒng)構(gòu)建的多核酸區(qū)段陣列中的一或多個(gè)特定核酸區(qū)段。使用圖17B所示lux操縱子結(jié)構(gòu)進(jìn)行舉例說(shuō)明,在該實(shí)例中每個(gè)基因的側(cè)翼有具有不同重組特異性的attB位點(diǎn),該分子中一或多個(gè)特定核酸區(qū)段可以被另一核酸區(qū)段替代。例如,圖17B所示lux操縱子結(jié)構(gòu)中第二個(gè)編碼區(qū)域luxD可以通過(guò)含有該操縱子的載體和適當(dāng)?shù)馁|(zhì)粒(例如pDONR質(zhì)粒)反應(yīng)而被置換,以致luxD被含有attRx-ccdB-cat-attRy的元件置換,以產(chǎn)生其中l(wèi)uxD之前占據(jù)的座位成為具有attLx-基因-attLy構(gòu)型的進(jìn)入克隆的受體位點(diǎn)的載體(即產(chǎn)出結(jié)構(gòu))。然后使此載體產(chǎn)物和attLx-基因-attLy進(jìn)入克隆反應(yīng),這將導(dǎo)致attRx-ccdB-cat-attRy盒被側(cè)翼有attBx和attBy的新基因置換。在相關(guān)實(shí)施方案中,具有attLx-基因-attLy一般構(gòu)型的進(jìn)入克隆群可以和上述制備的產(chǎn)物載體反應(yīng),以便產(chǎn)生產(chǎn)出結(jié)構(gòu)群,并對(duì)于群體中任何指定結(jié)構(gòu)而言含有attRx-ccdB-cat-attRy的區(qū)段可以為側(cè)翼有attBx和attBy的另一核酸區(qū)段置換。因此,可以按平行方式排列指定核酸區(qū)段陣列的組成,而操縱子結(jié)構(gòu)中的其它基因基本上不受這些操作的影響。而且,可以將編碼參與一或多個(gè)特定生物學(xué)過(guò)程或途徑的表達(dá)產(chǎn)物的核酸區(qū)段重組在支持物上。例如,可以將具有帶重組位點(diǎn)的游離末端、并編碼參與生物學(xué)途徑或過(guò)程的三個(gè)酶之一的第一核酸分子附著在支持物上。然后將在至少一個(gè)末端具有能夠和附著在支持物上的核酸分子重組的重組位點(diǎn)的核酸分子文庫(kù)與支持物在利于重組的條件下接觸,導(dǎo)致第二核酸分子與第一核酸分子附著??梢允褂孟嗨瞥绦蚴沟谌怂岱肿优c第二核酸分子的游離末端附著。然后可以在生物學(xué)活性測(cè)試之前將這些所獲核酸產(chǎn)物從支持物上釋放出來(lái),或者可以在核酸產(chǎn)物仍與支持物附著時(shí)進(jìn)行這些分析。可以實(shí)施的分析的例子有用于檢測(cè)是否存在特定的核酸分子的雜交分析、針對(duì)連接的核酸分子的多肽表達(dá)產(chǎn)物的測(cè)試、或針對(duì)連接的核酸分子的多肽表達(dá)產(chǎn)物所產(chǎn)生的終產(chǎn)物(例如紫杉醇、氨基酸、糖等)的分析。在以上相關(guān)的實(shí)施方案中,可以循環(huán)使核酸區(qū)段附著在上述支持物上和離開(kāi)上述支持物。因此,在第二核酸分子和第一核酸分子重組后,可以例如使用第二重組反應(yīng)釋放該第二核酸分子。因此,一方面,本發(fā)明提供用于在核酸分子間實(shí)現(xiàn)重組的方法,其中該核酸分子中的至少一個(gè)與支持物結(jié)合。本發(fā)明還提供通過(guò)與支持物(例如固體和半固體支持物)上的核酸分子重組,鑒定參與相同生物學(xué)過(guò)程途徑的核酸分子的方法,因此,本發(fā)明提供方法用于篩選核酸文庫(kù)以鑒定編碼參與特定生物學(xué)過(guò)程或途徑的表達(dá)產(chǎn)物的核酸分子、并提供通過(guò)這些方法鑒定的核酸分子、從該核酸分子產(chǎn)生的表達(dá)產(chǎn)物、和通過(guò)這些生物學(xué)過(guò)程或途徑產(chǎn)生的產(chǎn)物。詞語(yǔ)“生物化學(xué)途徑”和“生物學(xué)途徑”是指生物體或細(xì)胞進(jìn)行的任何系列相關(guān)生物化學(xué)反應(yīng)。這些途徑可以包括但不限于生物合成或生物降解途徑、或能量產(chǎn)生或轉(zhuǎn)化途徑。本發(fā)明核酸分子可以用于多種應(yīng)用中。例如,本發(fā)明方法可以用于制備含有操縱子的所有結(jié)構(gòu)基因的末端載體。正如以下實(shí)施例18中討論的,使用獲自生物發(fā)光細(xì)菌Vibriofischert的編碼luxCDABE基因的核酸,我們已重新構(gòu)建了lux操縱子。而且,正如以上提及的,本發(fā)明核酸分子的表達(dá)產(chǎn)物,包括是相同或不同生物學(xué)途徑或過(guò)程的一部分的多蛋白,可以制成融合蛋白。這些融合蛋白可以含有利于純化(如6His標(biāo)簽)、使融合蛋白“靶向”特定的細(xì)胞區(qū)室(如信號(hào)肽)、利于溶解(如麥芽糖結(jié)合蛋白)、和/或改變克隆基因表達(dá)產(chǎn)物特性(例如抗體分子的Fc部分、綠色熒光蛋白(GFP)、黃色熒光蛋白(YFP)或藍(lán)色熒光蛋白(CFP))的氨基酸。本發(fā)明方法還可以用于制備當(dāng)表達(dá)時(shí)產(chǎn)生具有一種以上性質(zhì)、功能或活性的融合蛋白的核酸分子。該核酸分子的一個(gè)例子是編碼含有目的多肽(假單孢桿菌屬(Pseudomonas)外毒素域II)和促進(jìn)融合蛋白與目的細(xì)胞類型結(jié)合的多肽的三成分融合蛋白的分子。假單孢桿菌屬外毒素域II常賦予融合蛋白跨細(xì)胞膜定位的能力。因此,可以對(duì)表達(dá)產(chǎn)物進(jìn)行設(shè)計(jì),以便它定位在特定細(xì)胞類型中并跨越細(xì)胞膜。當(dāng)例如目的多肽有細(xì)胞毒性(例如誘導(dǎo)細(xì)胞凋亡)時(shí),此類表達(dá)產(chǎn)物將尤其有用。Pastan等在美國(guó)專利5,328,984中描述了編碼類似于上述蛋白質(zhì)的蛋白的核酸分子。而且,可以按一定方式產(chǎn)生表達(dá)產(chǎn)物以便促進(jìn)其向細(xì)胞外的運(yùn)輸。例如,可以將這些表達(dá)產(chǎn)物表達(dá)為含有可導(dǎo)致蛋白質(zhì)向細(xì)胞外運(yùn)輸?shù)男盘?hào)肽的融合蛋白。當(dāng)待向外運(yùn)輸?shù)牡鞍踪|(zhì)是與細(xì)胞外底物相互作用的酶時(shí),應(yīng)用向細(xì)胞外運(yùn)輸可能是理想的。一方面,本發(fā)明提供方法以制備編碼參與相同或不同生物學(xué)途徑或過(guò)程的一或多個(gè)表達(dá)產(chǎn)物的核酸分子、并提供含有這些核酸分子的細(xì)胞和這些生物途徑或過(guò)程產(chǎn)生的產(chǎn)物。例如,本發(fā)明方法可以用于構(gòu)建輸出參與相同或不同生物學(xué)過(guò)程的多個(gè)蛋白的細(xì)胞。因此,一方面,本發(fā)明提供用于將多個(gè)核酸區(qū)段克隆在細(xì)胞中的系統(tǒng),其中所述細(xì)胞輸出這些核酸區(qū)段表達(dá)產(chǎn)物中的一或多個(gè)基因產(chǎn)物(例如2、3、4、5、7、10、12、15、20、30、50等)。而且,這些表達(dá)產(chǎn)物可以在細(xì)胞外基質(zhì)(例如培養(yǎng)基、土壤、鹽沼等)中發(fā)揮功能(例如催化化學(xué)反應(yīng))。當(dāng)使用本發(fā)明方法制備和/或表達(dá)核酸分子時(shí),這些核酸分子可以編碼參與相同或不同過(guò)程(例如生物合成途徑、降解途徑)的表達(dá)產(chǎn)物。正如以下解釋的,當(dāng)需要向生物體提供廣泛功能特性時(shí),核酸分子可以編碼賦予生物體相對(duì)無(wú)關(guān)性質(zhì)的表達(dá)產(chǎn)物。而且,使用本發(fā)明方法可以制備編碼導(dǎo)致期望產(chǎn)物的生物合成途徑的所有或部分的核酸分子。而且,本發(fā)明方法可以用于產(chǎn)生編碼具有獨(dú)特性質(zhì)的表達(dá)產(chǎn)物的核酸分子。因此,本發(fā)明還提供制備新的生物途徑或過(guò)程終產(chǎn)物的方法。在此方面,本發(fā)明方法可以用于制備鑒別性的新化合物,包括治療劑。因此,一方面,本發(fā)明還提供藥物發(fā)現(xiàn)方法和通過(guò)這些方法鑒定的治療劑??梢酝ㄟ^(guò)經(jīng)本發(fā)明方法重新構(gòu)建和/或改變的生物學(xué)途徑或過(guò)程產(chǎn)生的終產(chǎn)物的例子包括化療劑(例如抗生素、抗病毒劑、紫杉醇)、糖、核苷酸、氨基酸、脂、核糖體、和膜包被細(xì)胞器、以及所有這些的新形式。因此,本發(fā)明方法可以用于制備使細(xì)胞能夠產(chǎn)生廣泛多種天然化合物以及這些化合物的修飾形式的核酸。這些化合物的例子包括屬于以下廣泛類別的那些化合物抗細(xì)菌治療劑、抗病毒治療劑、抗寄生蟲(chóng)治療劑、抗真菌治療劑、抗瘧疾治療劑、殺阿米巴治療劑、和抗腫瘤治療劑。由于微生物快速出現(xiàn)抗生素抗性,由此極為需要開(kāi)發(fā)新的抗生素。而且,人們推測(cè)微生物對(duì)沒(méi)有天然存在的等價(jià)物的新抗生素產(chǎn)生抗性的速度會(huì)較慢。因此,一方面,本發(fā)明提供制備新抗生素的方法、以及通過(guò)本發(fā)明方法產(chǎn)生的抗生素??梢允褂帽景l(fā)明方法制備的生物的一個(gè)例子是產(chǎn)生新抗生素藥劑的生物。Stassi等,Proc.Natl.Acad.Sci.USA957305-7309(1998)描述了由遺傳工程紅色糖多孢菌(Saccharopolysporaerythracea)細(xì)胞產(chǎn)生的乙基被取代的紅霉素衍生物新產(chǎn)物。因此,本發(fā)明方法可以用于在細(xì)胞中插入編碼產(chǎn)生新抗生素的蛋白質(zhì)的遺傳元件。本發(fā)明還包括通過(guò)這些方法產(chǎn)生的細(xì)胞、和使用這些細(xì)胞產(chǎn)生抗生素的方法、以及通過(guò)本發(fā)明方法制備的抗生素。所編碼產(chǎn)物參與多種治療劑的生物合成途徑的核酸分子是本領(lǐng)域已知的。例如,Martin,Appl.Microbiol.Biotechnol.50(1)1-15(1998)中描述了參與β-內(nèi)酰胺抗生素生物合成的基因和酶。因此,在特定方面,本發(fā)明包括制備這些抗生素和這些抗生素的改變形式的方法、以及這些抗生素本身。本發(fā)明還提供方法以制備抗細(xì)菌治療劑、抗病毒治療劑、抗寄生蟲(chóng)治療劑、抗真菌治療劑、抗瘧疾治療劑、殺阿米巴治療劑、和抗腫瘤治療劑和這些藥劑的改變形式、并提供這些藥劑本身??辜?xì)菌治療劑的例子包括青霉素、氨芐青霉素、阿莫西林、環(huán)青霉素、依匹西林、甲氧西林、萘夫西林、苯唑西林、氯唑西林、雙氯西林、氟氯西林、羧芐青霉素、頭孢氨芐、cepharadine、頭孢羥氨芐(cefadoxil)、頭孢克洛、頭孢西丁、頭孢噻肟、頭孢唑肟(cefinenoxine)、頭孢曲松、拉氧頭孢、亞胺培南、克拉維酸鹽、替卡西林、舒巴坦、紅霉素、新霉素、慶大霉素、鏈霉素、滅滴靈、氯霉素、克林霉素、林可霉素、喹諾酮、利福平、磺胺藥物、桿菌肽、多粘菌素B、萬(wàn)古霉素、多西環(huán)素、美他環(huán)素、米諾環(huán)素、四環(huán)素、兩性霉素B、環(huán)絲氨酸、環(huán)丙沙星、諾氟沙星、異煙肼、乙胺丁醇、和萘啶酸、以及所有這些化合物的衍生物和改變形式??共《局委焺┑睦影o(wú)環(huán)鳥(niǎo)苷、5-碘脫氧尿苷、三氮唑核苷、曲氟尿苷、阿糖腺苷(vidirabine)、雙脫氧胞苷、雙脫氧肌苷、疊氮胸苷和9-[1,3-二羥-2-丙氧甲基]鳥(niǎo)嘌呤、以及所有這些化合物的衍生物和改變形式。抗寄生蟲(chóng)治療劑的例子包括硫氯酚、乙胺嗪檸檬酸鹽、甲苯咪唑、美曲膦酯、氯硝柳胺、硝咪唑、奧沙尼喹(和其它奎寧衍生物)、哌嗪枸櫞酸鹽、吡喹酮、喹嘧啶雙羥萘酸鹽和噻苯噠唑、以及所有這些化合物的衍生物和改變形式??拐婢委焺┑睦影▋尚悦顾谺、克霉唑、氯苯甲氧咪唑硝酸鹽、氟胞嘧啶、灰黃霉素、酮康唑和雙氯苯咪唑、以及所有這些化合物的衍生物和改變形式??拐婢衔镆舶咔顾谹和papulocandinB。(見(jiàn)例如Komiyama等,Biol.Pharm.Bull.(1998)21(10)1013-1019)。)抗瘧疾治療劑的例子包括鹽酸氯喹、磷酸伯氨喹、息瘧定、硫酸奎寧、和鹽酸奎納克林、以及所有這些化合物的衍生物和改變形式??拱⒚装椭委焺┑睦影}酸脫氫吐根堿、二氫氯化物、雙碘喹啉、和硫酸paramomycin、以及所有這些化合物的衍生物和改變形式??鼓[瘤治療劑的例子包括氨魯米特、咪唑硫嘌呤、硫酸爭(zhēng)光霉素、白消安、卡氮芥、苯丁酸氮芥、順氯氨鉑、環(huán)磷酰胺、環(huán)孢霉素、cytarabidine、達(dá)卡巴嗪、放線菌素、柔紅霉素、阿霉素、紫杉醇、表鬼臼毒素吡喃葡糖苷、氟尿嘧啶、α干擾素、環(huán)己亞硝脲、巰基嘌呤、甲氨蝶呤、米托坦、鹽酸甲芐肼、硫鳥(niǎo)嘌呤、硫酸長(zhǎng)春堿和硫酸長(zhǎng)春新堿、以及這些化合物的衍生物和改變形式。其它抗微生物藥劑包括肽。Hancock等,美國(guó)專利6,040,435和Hancock等,Proc.Natl.Acad.Sci.USA978856-8861(2000)中公開(kāi)了抗微生物肽的例子。使用本發(fā)明方法還可以制備編碼多蛋白復(fù)合物的一個(gè)以上亞基的核酸分子。這些多蛋白復(fù)合物的例子包括剪接體、核糖體、人26S蛋白酶體、和酵母RNA聚合酶III。(見(jiàn)例如Saito等,Gene203(2)241-250(1997);Flores等,Proc.Natl.Acad.Sci.USA96(14)7815-7820(1999)。)本發(fā)明方法還可以用于部分合成非天然存在產(chǎn)物、以及這些產(chǎn)物的變體(例如新的變體)。例如,可以提供表達(dá)催化特定反應(yīng)的酶的微生物和這些生物正常不產(chǎn)生的前體物。當(dāng)這些前體充當(dāng)微生物所表達(dá)的酶的底物時(shí),可以產(chǎn)生新的化合物。此類“飼喂”過(guò)程在過(guò)去已被用于制備新抗生素。一方面,此類飼喂可以聯(lián)合表達(dá)上述組合文庫(kù)所編碼的酶的微生物一起使用。本發(fā)明方法可以用于(1)向細(xì)胞引入新的途徑或(2)改變現(xiàn)有細(xì)胞途徑,以便例如在產(chǎn)物合成過(guò)程中出現(xiàn)一或多個(gè)其它的催化步驟(例如2、3、4、5、7、10等)。本發(fā)明此應(yīng)用的一個(gè)例子涉及對(duì)細(xì)胞天然產(chǎn)生的蛋白質(zhì)進(jìn)行修飾。在此實(shí)例中,將編碼改變蛋白的一或多個(gè)催化步驟(例如編碼參與翻譯后修飾反應(yīng)的酶)的基因?qū)爰?xì)胞中。例如,可以將編碼參與ADP-核糖基化、糖基化、唾液酸化、乙酰化、泛素化、蘇氨酸轉(zhuǎn)化為D丙氨酸、生物素化、酰基化、酰胺化、甲?;?、羧化、形成GPI錨、羥基化、甲基化、豆蔻酰化、氧化、蛋白水解加工、磷酸化、異戊二烯化、外消旋作用、selenoylation、硫酸化、精氨?;拿傅幕虿迦爰?xì)胞中。以下文獻(xiàn)討論了蛋白的翻譯后修飾蛋白質(zhì)結(jié)構(gòu)和分子性質(zhì)(Proteins-StructureandMolecularPropertied),第2版,T.E.Creighton,W.H.FreemanandCompay,紐約,1993;Wold,F(xiàn).,蛋白質(zhì)翻譯后修飾觀點(diǎn)和性質(zhì),《蛋白質(zhì)的翻譯后共價(jià)修飾》(Post-translationalCovalentModificationofProteins)第1-12頁(yè),B.C.Johnson編,AcademicPress,紐約,1983;Seifter等,“對(duì)蛋白質(zhì)修飾和非蛋白質(zhì)輔因子的分子,”Meth.Enzymol.(1990)182626-646;和Rattan等,“蛋白質(zhì)合成翻譯后修飾和老化,”Ann.NYAcad.Sci.(1992)66348-62。本發(fā)明方法可以用于例如制備含有編碼參與信號(hào)轉(zhuǎn)導(dǎo)途徑的蛋白質(zhì)的核酸分子的細(xì)胞。而且,這些細(xì)胞可以用于篩選調(diào)節(jié)細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)的藥劑。例如,可以使用本發(fā)明方法制備表達(dá)響應(yīng)腫瘤壞死因子(TNF)所必需的所有成分的細(xì)胞。然后可以使用這些細(xì)胞篩選誘導(dǎo)TNF介導(dǎo)的反應(yīng)(TNF激動(dòng)劑)或阻斷TNF介導(dǎo)的反應(yīng)(TNF拮抗劑)的藥劑。因此,用于制備可以用于篩選細(xì)胞配體的激動(dòng)劑和拮抗劑的細(xì)胞的方法、以及通過(guò)這些方法產(chǎn)生的細(xì)胞,都包括在本發(fā)明范圍內(nèi)。使用本發(fā)明細(xì)胞鑒定細(xì)胞配體的激動(dòng)劑和拮抗劑的方法、以及通過(guò)本發(fā)明方法鑒定的激動(dòng)劑和拮抗劑也包括在本發(fā)明范圍內(nèi)。正如以上提及的,本發(fā)明方法還可以用于制備產(chǎn)生養(yǎng)料如糖和氨基酸的核酸和細(xì)胞。糖和氨基酸、以及其它碳源可以用于多種目的。例如,糖和氨基酸可以制備用于培養(yǎng)微生物、哺乳動(dòng)物細(xì)胞和植物細(xì)胞的培養(yǎng)基的成分。而且,可以將這些化合物加入人和家畜的食品中。糖和氨基酸用途的一個(gè)特殊例子是在配制嬰兒營(yíng)養(yǎng)配方中的使用。(見(jiàn)例如,Highman等,美國(guó)專利6,120,814)。因此,本發(fā)明還提供使用通過(guò)本發(fā)明方法產(chǎn)生的碳源制備的食品(例如嬰兒營(yíng)養(yǎng)配方)??梢允褂帽景l(fā)明所制備的細(xì)胞產(chǎn)生的碳源包括糖(例如葡萄糖、果糖、乳糖、糖蜜、纖維素水解物、粗糖水解物、和淀粉水解物)、有機(jī)酸(例如丙酮酸、乙酸、反丁烯二酸、蘋(píng)果酸和乳酸)、醇(丙三醇、1,3-丙二醇、和乙醇)、脂、脂肪酸、核苷酸、核苷、和氨基酸。(見(jiàn)例如Skraly等,Appl.Environ.Microbiol.6498-105(1998)。)可以使用本發(fā)明制備的生物的一個(gè)例子是獲得產(chǎn)生乙醇的能力的生物。例如,Deng等,Appl.Environ.Microbiol.65523-528(1999)描述了經(jīng)改造產(chǎn)生乙醇的藍(lán)細(xì)菌。因此,本發(fā)明方法可以用于將編碼參與產(chǎn)生乙醇的蛋白質(zhì)的遺傳元件插入細(xì)胞中。本發(fā)明還包括通過(guò)這些方法制備的細(xì)胞和使用這些細(xì)胞產(chǎn)生乙醇的方法??梢允褂帽景l(fā)明制備的生物的另一例子是獲得產(chǎn)生聚(3-羥基鏈烷羧酸酯)或增加量的聚(3-羥基鏈烷羧酸酯)能力的生物。聚(3-羥基鏈烷羧酸酯)是當(dāng)從細(xì)胞中提取出時(shí)具有塑膠樣性質(zhì)的化合物。(見(jiàn)例如Madison等,Microbiol.Molec.Biol.Rev.6321-53(1999)。)因此,本發(fā)明方法可以用于將編碼參與產(chǎn)生聚(3-羥基鏈烷羧酸酯)的蛋白質(zhì)的遺傳元件插入細(xì)胞中。本發(fā)明還包括通過(guò)這些方法產(chǎn)生的細(xì)胞和使用這些細(xì)胞制備聚(3-羥基鏈烷羧酸酯)的方法、以及聚(3-羥基鏈烷羧酸酯)衍生物和從聚(3-羥基鏈烷羧酸酯)形成的化合物??梢允褂帽景l(fā)明方法所制備的細(xì)胞產(chǎn)生的氨基酸包括苯丙氨酸、色氨酸、酪氨酸、亮氨酸、異亮氨酸、纈氨酸、谷氨酰胺、天門(mén)冬酰胺、精氨酸、賴氨酸、組氨酸、天冬氨酸、谷氨酸、丙氨酸、脯氨酸絲氨酸、蘇氨酸、甲硫氨酸、半胱氨酸、和甘氨酸。相當(dāng)多生物的參與氨基酸和氨基酸前體生物合成的基因和酶是本領(lǐng)域已知的。(見(jiàn)例如G.N.Cohen,“賴氨酸、甲硫氨酸和蘇氨酸的共同途徑”,第147-171頁(yè),《氨基酸生物合成和遺傳調(diào)節(jié)》(AminoAcidsBiosynthesisandGeneticRegulation),K.M.Herrmann和R.L.Somerville編,Addison-WelesleyPublishingCo.,Inc.,Reading,Mass.(1983)。)除了改變細(xì)胞以產(chǎn)生新化合物外,本發(fā)明方法還可以用于改造細(xì)胞以便它們超量產(chǎn)生或減少產(chǎn)生細(xì)胞正常代謝的產(chǎn)物。例如,Donnelly等,美國(guó)專利5,770,435描述了產(chǎn)生增加量的琥珀酸的大腸桿菌突變株。例如,可以利用本發(fā)明方法構(gòu)建編碼琥珀酸生物合成途徑中的酶的核酸分子。而且,可以在轉(zhuǎn)錄水平上調(diào)節(jié)這些酶中一或多個(gè)的表達(dá)。因此,將這些核酸分子導(dǎo)入上述大腸桿菌細(xì)胞中將有效地?cái)U(kuò)增琥珀酸生物合成途徑中的一或多個(gè)基因。而且,可以使這些基因中的一或多個(gè)與誘導(dǎo)型啟動(dòng)子(例如lacI啟動(dòng)子)可操作地連接,以便琥珀酸僅在存在誘導(dǎo)信號(hào)(例如IPTG)時(shí)才增加。本發(fā)明方法還可以用于制備產(chǎn)生可用于制造過(guò)程的成分和前體的核酸和細(xì)胞。這些成分的例子包括塑料、塑料樣化合物(例如聚酮化合物)、油皂、肥料、紙、合成橡膠、染料、油墨等。本發(fā)明還包括通過(guò)本發(fā)明方法和細(xì)胞產(chǎn)生的成分和前體。類似地,本發(fā)明方法制備的核酸分子還可以用于下調(diào)例如一或多個(gè)內(nèi)源性基因的表達(dá)。一個(gè)例子是使本發(fā)明方法所制備的核酸插入片段轉(zhuǎn)錄產(chǎn)生反義RNA。再有,可以將編碼反義RNA的核酸分子可操作地與可調(diào)節(jié)啟動(dòng)子連接。因此,本發(fā)明還包括用于制備可超量產(chǎn)生或減少產(chǎn)生細(xì)胞正常代謝產(chǎn)物的細(xì)胞的方法,以及通過(guò)這些方法制備的細(xì)胞。正如以上提及的,本發(fā)明方法制備的核酸分子可以用于改變生物的生理特性,以便該生物具有特定的性質(zhì)。例如,使用本發(fā)明載體可以將缺少產(chǎn)生具有特定糖基化模式的重組或天然蛋白質(zhì)所必需的特定酶的細(xì)胞導(dǎo)入細(xì)胞中。蛋白質(zhì)的糖基化模式在一定程度上是細(xì)胞類型和種類特異的(見(jiàn)例如Jarvis等,Curr.Opin.Biotechnol.9528-533(1998)。)因此,一方面,本發(fā)明提供方法以制備表現(xiàn)出改變的糖基化途徑的細(xì)胞、并提供通過(guò)這些方法制備的細(xì)胞、和這些細(xì)胞產(chǎn)生的糖基化化合物。該方法一般被稱作“糖基化工程”。Stanley,Glycobiology299-107(1992)。例如,可以使用本發(fā)明方法修飾不能糖基化蛋白質(zhì)的細(xì)菌細(xì)胞,以產(chǎn)生可糖基化蛋白質(zhì)的酶。這些酶的例子包括N-乙酰葡糖胺基轉(zhuǎn)移酶III和V、β-1,4-半乳糖基轉(zhuǎn)移酶、α-2,6-唾液酸轉(zhuǎn)移酶、α-2,3-唾液酸轉(zhuǎn)移酶、α-1,3-巖藻糖基轉(zhuǎn)移酶III和VI、和α-1,2-甘露糖基轉(zhuǎn)移酶。另一方面,本發(fā)明提供方法以制備表現(xiàn)出改變的代謝性質(zhì)的細(xì)胞,此改變的代謝性質(zhì)將導(dǎo)致這些細(xì)胞合成的化合物的量增加,本發(fā)明還提供通過(guò)這些方法制備的細(xì)胞和這些細(xì)胞所產(chǎn)生的產(chǎn)物。該方法的一個(gè)例子是制備產(chǎn)生增加量的生物學(xué)途徑前體的細(xì)胞。該方法在此被稱作代謝引導(dǎo)或漏過(guò)(metabolicchannelingorfunneling)。例如,當(dāng)需要制備產(chǎn)生增加量的絲氨酸的細(xì)胞時(shí),可以將編碼3-磷酸甘油酸產(chǎn)生途徑中的酶的核酸分子插入細(xì)胞中。任選地,還可以將編碼參與將3-磷酸甘油酸為絲氨酸的酶的核酸分子插入細(xì)胞中。在構(gòu)建含有細(xì)胞內(nèi)含量增加的前體庫(kù)化合物的細(xì)胞時(shí),有用的考慮參數(shù)包括該特定途徑中設(shè)定的速度限制和途徑通量。(見(jiàn)例如Kholodenko等,Biotechnol.Bioeng.59239-247(1997)。)聚酮化合物是通過(guò)一系列縮合和隨后的修飾從2-碳單位合成的多樣化合物大家族。許多種生物,包括真菌和許多細(xì)菌,尤其是放射菌類產(chǎn)生聚酮化合物。存在具有不同活性的多種聚酮化合物結(jié)構(gòu)和包含聚酮化合物的多種化合物。(見(jiàn)例如PCT公開(kāi)文本W(wǎng)O93/13663;WO95/08548;WO96/40968;97/02358;和98/27203;美國(guó)專利4,874,748;5,063,155;5,098,837;5,149,639;5,672,491;和5,712,146;和Fu等,1994,Biochemistry339321-9326;McDaniel等,1993,Science2621546-1550;和Rohr,1995,Angew.Chem.Int.Ed.Engl.34881-888,所有均并入本文作為參考)。聚酮合成酶(PKS)使用共同的機(jī)制策略組裝各種結(jié)構(gòu)的天然產(chǎn)物,所述策略依賴于在構(gòu)建最終反應(yīng)產(chǎn)物的一系列脫羧化縮合反應(yīng)中經(jīng)半胱氨酸殘基錨定聚酮化合物。PKS一般在類似脂肪酸生物合成的生物合成過(guò)程中催化從簡(jiǎn)單前體如丙酰CoA和甲基丙二酰CoA組裝復(fù)雜的天然產(chǎn)物。聚酮化合物的例子包括callystatinA、安三烯菌素A、放線菌紫素、納巴霉素、酒霉素、和苦霉素。一方面,本發(fā)明提供制備編碼一或多個(gè)PKS的核酸分子的方法、以及含有這些核酸分子的細(xì)胞和所獲的聚酮化合物產(chǎn)物。本發(fā)明還提供使用組合文庫(kù)制備新PKS的方法、和由這些新PKS產(chǎn)生的產(chǎn)物(例如新的大環(huán)內(nèi)酯抗生素),以及制備這些新PKS產(chǎn)物的方法。本發(fā)明方法還可以用于構(gòu)建對(duì)于降低各種化學(xué)劑毒性有用的微生物株。這些化學(xué)劑包括基于石油的污染物(例如氯化和非氯化的脂肪族化合物(例如C3-C36)、氯化或未氯化的芳香族化合物(例如C9-C22)、原油、精煉油、燃油(例如2、4、6號(hào)燃油)、柴油、汽油、液力油、煤油、苯、甲苯、乙苯、二甲苯、三甲基苯、萘、蒽、二氫苊、苊、苯并(a)蒽、苯并(a)芘、苯并(b)熒蒽、苯并(g,h,i)北、苯并(k)熒蒽、芘、二氯甲烷、1,1-二氯乙烷、氯仿、1,2-二氯丙烷、二溴氯甲烷、1,1,2-三氯乙烷、2-氯乙基乙烯基醚、四氯乙烯(PCE)、氯苯、1,2-二氯乙烷、1,1,1-三氯乙烷、溴二氯甲烷、反-1,3-二氯丙烯、順-1,3-二氯丙烯、溴仿、氯甲烷、溴甲烷、乙烯基氯、氯乙烷、1,1-二氯乙烷、反-1,2-二氯乙烷、三氯乙烯(TCE)、二氯苯、順-1,2-二氯乙烷、二溴甲烷、1,4-二氯丁烷、1,2,3-三氯丙烷、溴氯甲烷、2,2-二氯丙烷、1,2-二溴乙烷、1,3-二氯丙烷、溴苯、氯甲苯、三氯苯、反-1,4-二氯-2-丁烯和丁基苯)??梢允褂帽景l(fā)明方法制備的生物的一個(gè)例子是降解甲苯的生物。Panke等,Appl.Environ.Microbiol.64748-751(1998)描述了將甲苯以及幾種甲苯衍生物轉(zhuǎn)化為苯甲酸鹽的惡臭假單孢菌(Pseudomonaputida)菌株。因此,本發(fā)明方法可以用于在細(xì)胞中插入編碼將甲苯及其衍生物轉(zhuǎn)化為低毒性化合物的蛋白質(zhì)的遺傳元件。本發(fā)明還包括通過(guò)這些方法制備的細(xì)胞和使用這些細(xì)胞將甲苯及幾種甲苯衍生物轉(zhuǎn)化為低毒性化合物的方法。本發(fā)明方法還可以用于制備適合中和非石油劑如重金屬離子(如汞、銅、鎘、銀、金、亞碲酸鹽、亞硒酸鹽和鈾)的毒性的生物。例如可以中和汞毒性的方法包括還原汞離子以產(chǎn)生金屬汞然后進(jìn)行揮發(fā)。細(xì)菌中參與脫毒的基因描述在Miller,“Hg(II)和有機(jī)汞制劑的細(xì)菌脫毒”,EssaysBiochem.3417-30(1999)。在類球紅細(xì)菌(Rhodobactersphaeroide)菌株中鑒定到重金屬離子脫毒系統(tǒng)的另一例子(見(jiàn)O’Gara等,Appl.Environ.Microbiol.63(12)4713-4720(1997))。該菌株的亞碲酸鹽抗性似乎是由兩個(gè)座位賦予的。第一個(gè)遺傳座位含有4個(gè)基因;其中兩個(gè)基因(即trgA和trgB)當(dāng)插入另一細(xì)菌時(shí)可賦予增強(qiáng)的亞碲酸鹽抗性。該座位中另一基因cysK(半胱氨酸合成酶)的破壞導(dǎo)致亞碲酸鹽抗性降低。第二個(gè)遺傳座位含有telA基因。telA的失活導(dǎo)致與野生型菌株相比亞碲酸鹽抗性顯著降低。能夠中和化學(xué)劑毒性的微生物描述在例如Perriello,美國(guó)專利6,110,372中。適用于生物除污的微生物包括假單胞菌科(Pseudomonadaceae)、放線菌綱(Actinomycetes)、微球菌科(Micrococcaceae)、科(Vibrionaceae)、根瘤菌科(Rhizobiaceae)、噬細(xì)胞菌科(Cytophagaceae)、和棒狀桿菌科(Corynebacterium)。在使用本發(fā)明方法進(jìn)行修飾后適用于生物除污應(yīng)用的微生物的具體例子包括紅蒼白假單胞菌(Pseudomonasrubrisubalbicans)、銅綠假單胞菌(Pseudomonasaeruginosa)、爭(zhēng)論貪噬菌(Variovoraxparadoxus)、星狀諾卡氏菌(Nocardiaasteroides)、耐放射異常球菌(Deinococcusradiodurans)、限定諾卡氏菌(Nocardiarestricata)、產(chǎn)吲哚金黃桿菌(Chryseobacteriumindologenes)、食酸叢毛單胞菌(Comamonasacidovorans)、德氏食酸菌(Acidovoraxdelafieldii)、胭脂紅分枝桿菌(Rhodococcusrhodochrous)、紅串紅球菌(Rhodococcuserytlropolis)、酯香金桿菌(Aureobacteriumesteroaromaticum)、天牛金桿菌(Aureobacteriumsaperdae)、易變微球菌(Micrococcusvarians)、克氏微球菌(Micrococcuskristinae)、豚鼠氣單胞菌(Aeromonascaviae)、嗜麥芽糖寡養(yǎng)單胞菌(Stenotrophomonasmaltophilia)、嗜溫鞘氨醇桿菌(Sphingobateriumthalpophium)、Clavibactermichiganense、木糖氧化產(chǎn)堿菌(Alcaligenesxylosoxydans)、水生棒桿菌B(CorynebacteriumaquaticumB)和約氏噬纖維菌(Cytophagajohnsonae)。適于生物除污的生物還包括植物。例如,Meagher等在美國(guó)專利5,965,796中描述了表達(dá)金屬離子抗性蛋白并減少金屬離子如銅、汞、金、鎘、鉛和銀的離子的轉(zhuǎn)基因植物。而且,可以將編碼植物螯合肽的基因?qū)胫参镏幸栽黾又参矧想牡暮铣伞V参矧想氖枪入赘孰难苌?,其通過(guò)隔離來(lái)中和金屬離子的毒性。Corbett,“植物螯合肽的生物合成及重金屬脫毒功能”,Curr.Opin.Plant.biol.3(3)211-216(2000)中討論了許多植物種類中參與植物螯合肽合成的基因。在本發(fā)明方法修飾后適于生物除污應(yīng)用的具體植物包括家獨(dú)行菜(Lepidiumsativum)、芥菜(Brassicajuncea)、甘藍(lán)(Brassicaoleracea)、蕪菁(Brassicarapa)、Acenasativa、普通小麥(Triticumaestivum)、向日葵(Helianthusannuus)、細(xì)紀(jì)翦股穎(Colonialbentgrass)、草地早熟禾、宿根黑麥草(Perennialryegrass)、匍匐翦股穎(Creepingbentgrass)、絆根草(Bermudagrass)、野牛草、蜈蚣草、柳枝稷、結(jié)縷草、coastalpanicgrass、菠菜、高粱、煙草和玉米。制備轉(zhuǎn)基因植物的方法是本領(lǐng)域已知的,并正如以上提及的,描述在例如Meagher等,美國(guó)專利5,965,796。本發(fā)明方法還可以用于制備具有各種特性并含有相當(dāng)大量的插入基因的生物。正如以上提及的,本發(fā)明方法可以用于將幾乎無(wú)限制數(shù)量的核酸區(qū)段插入細(xì)胞中。例如,在一個(gè)具體實(shí)施方案中,本發(fā)明提供用于制備表達(dá)殺蟲(chóng)蛋白(例如蘇云金桿菌(Bacillusthurginiensis)的殺蟲(chóng)蛋白)的細(xì)胞的方法。(見(jiàn)例如Schnepf等,Microbiol.Molec.Biol.Rev.62775-806(1998)。)因此,本發(fā)明方法可以用于將編碼殺蟲(chóng)蛋白的遺傳元件插入細(xì)胞中。本發(fā)明還包括通過(guò)這些方法制備的細(xì)胞和使用這些細(xì)胞制備殺蟲(chóng)蛋白的方法。本發(fā)明還包括使用本發(fā)明制備的細(xì)胞(例如細(xì)菌或植物細(xì)胞)和殺蟲(chóng)蛋白控制昆蟲(chóng)群體的方法。在某些實(shí)施方案中,本發(fā)明方法制備的在本發(fā)明方法中使用的細(xì)胞是植物細(xì)胞。因此,一方面,本發(fā)明方法可以用于制備含有編碼一或多個(gè)非蛋白表達(dá)產(chǎn)物(例如功能性RNA如tRNA或核酶)的一或多個(gè)ORF和/或核酸區(qū)段的核酸分子。在本發(fā)明大多數(shù)實(shí)施方案中,編碼一或多個(gè)非蛋白表達(dá)產(chǎn)物的ORF和/或核酸區(qū)段的數(shù)目一般在約1至約300之間變動(dòng)(例如1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300等)。含有編碼一或多個(gè)非蛋白表達(dá)產(chǎn)物的一或多個(gè)ORF和/或核酸區(qū)段的核酸分子,對(duì)于改變生物使之具有例如以上所列舉的特性是尤其有用的。根據(jù)多種因素(包括存在的功能性區(qū)段數(shù)目),本發(fā)明核酸分子的大小將在尺寸上有相當(dāng)大的變化,但一般地,將在約0.5kb至約300kb之間(例如約0.5kb、約1kb、約2kb、約3kb、約4kb、約5kb、約7kb、約10kb、約12kb、約15kb、約20kb、約40kb、約60kb、約80kb、約100kb、約200kb、約300kb等)。在一個(gè)具體實(shí)施方案中,本發(fā)明還提供作為基因治療方案的一部分將本發(fā)明核酸分子導(dǎo)入動(dòng)物(例如人)和動(dòng)物細(xì)胞(例如人細(xì)胞)中的方法?;蛑委熓侵竿ㄟ^(guò)給患者施用表達(dá)的或可表達(dá)的核酸分子進(jìn)行的治療。在本發(fā)明許多實(shí)施方案中,本發(fā)明核酸分子將編碼一或多個(gè)介導(dǎo)至少一種治療效果的蛋白質(zhì)。因此,本發(fā)明提供用于基因治療的核酸分子和方法。本發(fā)明核酸分子可以用于制備設(shè)計(jì)以替換位于細(xì)胞基因組中的基因、缺失這些基因、或插入異源基因或基因群的基因治療載體。當(dāng)編碼核酸分子起到缺失或替換基因的功能時(shí),被缺失或替換的基因或多個(gè)基因可以導(dǎo)致“正常表型”或異常表型的表達(dá)。異常表型的一個(gè)例子是囊性纖維化疾病。而且,可以將基因治療載體穩(wěn)定地維持(例如通過(guò)同源重組整合在細(xì)胞核酸中)或非穩(wěn)定地維持在細(xì)胞中。而且,本發(fā)明核酸分子可以用于抑制“異常”表型、或彌補(bǔ)或補(bǔ)充由于內(nèi)源性基因表達(dá)導(dǎo)致的“正?!北硇汀TO(shè)計(jì)用于抑制異常表型的本發(fā)明核酸分子的一個(gè)例子是使該核酸分子的表達(dá)產(chǎn)物具有顯性/失活活性。設(shè)計(jì)用于補(bǔ)充正常表型的本發(fā)明核酸分子的一個(gè)例子是該核酸分子的導(dǎo)入有效地引起位于細(xì)胞中的基因的擴(kuò)增。而且,本發(fā)明核酸分子可以用于將所編碼表達(dá)產(chǎn)物參與了特定生物學(xué)途徑(例如氨基酸如賴氨酸、蘇氨酸的生物合成,等)的所有步驟、或參與這些途徑的一或多個(gè)步驟的核酸區(qū)段插入細(xì)胞中。事實(shí)上,可以對(duì)這些核酸分子進(jìn)行設(shè)計(jì)以擴(kuò)增編碼這些途徑中的表達(dá)產(chǎn)物的基因、將所編碼表達(dá)產(chǎn)物參與細(xì)胞中正常不存在的途徑的基因插入細(xì)胞中、或替換參與細(xì)胞中特定生物學(xué)途徑的一或多個(gè)步驟的一或多個(gè)基因。因此,本發(fā)明基因治療載體可以含有導(dǎo)致產(chǎn)生一或多個(gè)產(chǎn)物(例如1、2、3、4、5、8、10、15等)的核酸分子。這些載體,尤其是導(dǎo)致產(chǎn)生一個(gè)以上產(chǎn)物的那些載體,對(duì)于治療由于一個(gè)以上基因的表達(dá)或不表達(dá)造成的疾病和/或病癥、或?qū)τ谥委熞环N以上的疾病和/或病癥將是尤其有用的。因此,在相關(guān)方面,本發(fā)明提供表達(dá)一或多個(gè)表達(dá)產(chǎn)物(例如1或多個(gè)融合蛋白)的基因治療載體、制備這些載體的方法、使用本發(fā)明載體進(jìn)行基因治療的方法、該載體的表達(dá)產(chǎn)物(例如編碼的RNA和/或蛋白質(zhì))、和含有本發(fā)明載體的宿主細(xì)胞。對(duì)于基因治療方法的一般綜述,參見(jiàn)Goldspiel等1993,ClinicalPharmacy12488-505;Wu和Wu,1991,Biotherapy387-95;Tolstoshev,1993,Ann.Rev.Pharmacol.Toxicol.32573-596;Mulligan,1993,Science260926-932;和Morgan和Anderson,1993,Ann.Rev.Biochem.62191-217;May,1993,TIBTECH11(5)155-215)。可以使用的重組DNA
技術(shù)領(lǐng)域:
的通常已知方法描述于Ausubel等(編),1993,當(dāng)代分子生物學(xué)實(shí)驗(yàn)方案(CurrentProtocolsinMolecularBiology),JohnWiley&Sons,NY;和Kriegler,1990,基因轉(zhuǎn)移和表達(dá),實(shí)驗(yàn)室手冊(cè)(GeneTransferandExpression,ALaboratoryManual),Stocktonpress,NY。將本發(fā)明核酸分子遞送至患者體內(nèi)可以是直接的,在此情況下患者直接暴露于該核酸或攜帶核酸的載體,也可以是間接的,在此情況下首先在體外用核酸轉(zhuǎn)化細(xì)胞、然后將該細(xì)胞移植至患者體內(nèi)。這兩種方法分別稱作體內(nèi)或離體基因治療。在一個(gè)具體實(shí)施方案中,當(dāng)本發(fā)明核酸分子可以在體內(nèi)表達(dá)產(chǎn)生一或多個(gè)表達(dá)產(chǎn)物時(shí),體內(nèi)直接施用本發(fā)明核酸分子。這可以通過(guò)本領(lǐng)域許多已知的方法來(lái)實(shí)現(xiàn),例如通過(guò)構(gòu)建表達(dá)載體并進(jìn)行施用以便它們進(jìn)入細(xì)胞內(nèi)(例如通過(guò)施用缺陷性或減毒逆轉(zhuǎn)錄病毒載體或其它病毒載體進(jìn)行感染(見(jiàn)美國(guó)專利4,980,286)、通過(guò)直接注射裸DNA、通過(guò)用脂質(zhì)或細(xì)胞受體或轉(zhuǎn)染試劑包被、包在脂質(zhì)體、微粒、或微囊中、或通過(guò)將它們與已知進(jìn)入細(xì)胞核的肽連接然后施用、通過(guò)將它們與可經(jīng)歷受體介導(dǎo)的內(nèi)吞作用的配體連接然后施用(見(jiàn)例如Wu和Wu,1987,J.Biol.Chem.2624429-4432)(這可以用于靶向特異表達(dá)該受體的細(xì)胞類型),等)。在另一實(shí)施方案中,可以通過(guò)靶向特異受體,使本發(fā)明核酸分子體內(nèi)定向于細(xì)胞特異的攝取和表達(dá)(見(jiàn)例如,日期為1992年4月16日的PCT公開(kāi)文本W(wǎng)O92/06180(Wu等);日期為1992年12月23日的WO92/22635(Wilson等);日期為1992年11月26日的WO92/20316(Findeis等);日期為1993年6月22日的WO93/14188(Clarke等);日期為1993年10月14日的WO93/20221(Young))。或者,可以通過(guò)同源重組,將本發(fā)明核酸分子導(dǎo)入細(xì)胞內(nèi)并整合在宿主細(xì)胞DNA中進(jìn)行表達(dá)(Koller和Smithies,1989,Proc.Natl.Acad.Sci.USA868932-8935;Zijlstra等,1989,Nature342435-438)。圖21C和22B中顯示了適于該應(yīng)用的核酸結(jié)構(gòu)的例子。在另一具體實(shí)施方案中,使用含有編碼抗體或本發(fā)明其它抗原結(jié)合蛋白的核酸序列。例如,可以使用逆轉(zhuǎn)錄病毒載體(見(jiàn)Miller等,1993,Meth.Enzymol.217;581-599)。這些逆轉(zhuǎn)錄病毒被用于缺失對(duì)于病毒基因組的包裝和向宿主細(xì)胞DNA的整合不必要的逆轉(zhuǎn)錄病毒序列。將編碼用于基因治療的抗體的核酸序列克隆在有利于將基因遞送至患者體內(nèi)的一或多個(gè)載體上。關(guān)于逆轉(zhuǎn)錄載體的更多細(xì)節(jié)可以參見(jiàn)Boesen等,1994,Biotherapy6291-302,該文獻(xiàn)描述了使用逆轉(zhuǎn)錄病毒載體將mdr1基因遞送至造血干細(xì)胞中以使這些干細(xì)胞對(duì)化療具有更大的抗性。描述逆轉(zhuǎn)錄病毒載體在基因治療中的用途的其它文獻(xiàn)有Clowes等,1994,J.Clin.Invest.93644-651;Kiem等,1994,Blood831467-1473;Salmons知Gunzberg,1993,HumanGeneTherapy4129-141;和Grossman和Wilson,1993,Curr.Opin.inGeneticsandDevel.3110-114。腺病毒是能夠用于基因治療的其它病毒載體。腺病毒是尤其具有吸引力的將基因遞送至呼吸道上皮細(xì)胞的運(yùn)載工具,該載體的用途包括在本發(fā)明的范圍內(nèi)。腺病毒自然感染呼吸道上皮細(xì)胞,并在此引起輕微的疾病?;谙俨《镜倪f送系統(tǒng)的其它靶標(biāo)有肝、中樞神經(jīng)系統(tǒng)、內(nèi)皮細(xì)胞、和肌肉。腺病毒的優(yōu)點(diǎn)是能夠感染非分裂細(xì)胞。Kozarsy和Wilson,1993,當(dāng)前遺傳和發(fā)育觀點(diǎn)(CurrentOpinioninGeneticsandDevelopment)3499-503給出了基于腺病毒的基因治療的綜述。Bout等,1994,HumanGeneTherapy53-10展示了腺病毒載體在向恒河猴呼吸道上皮細(xì)胞轉(zhuǎn)移基因中的用途。腺病毒在基因治療中的用途的其它例子可以參見(jiàn)Rosenfeld等,1991,Science252431-434;Rosenfeld等,1992,Cell68143-155;Mastrangeli等,1993,J.Clin.Invest.91225-234;PCT公開(kāi)文本號(hào)WO94/12649和WO96/17053;美國(guó)專利5,998,205;和Wang等,1995,GeneTherapy2775-783,所有這些的公開(kāi)均完整地并入本文作為參考。在一個(gè)實(shí)施方案中,使用腺病毒載體。腺相關(guān)病毒(AAV)和皰疹病毒,以及從這些病毒制備的載體,也已被提議用于基因治療(Walsh等,1993,Proc.Soc.Exp.Biol.Med.204289-300;美國(guó)專利5,436,146;Wagstaff等,GeneTher.51566-70(1998))。皰疹病毒載體對(duì)于期望在神經(jīng)細(xì)胞中進(jìn)行基因表達(dá)的應(yīng)用是尤其有用的?;蛑委煹牧硪粋€(gè)方法涉及通過(guò)例如電穿孔、脂轉(zhuǎn)染、磷酸鈣介導(dǎo)的轉(zhuǎn)染、或病毒感染等方法在組織培養(yǎng)中將基因轉(zhuǎn)移至細(xì)胞。通常,轉(zhuǎn)移方法包括向細(xì)胞轉(zhuǎn)移選擇標(biāo)記。然后對(duì)細(xì)胞進(jìn)行選擇以分離攝取并正在表達(dá)該轉(zhuǎn)移的基因的細(xì)胞。然后將這些細(xì)胞遞送給患者。在此實(shí)施方案中,將核酸導(dǎo)入細(xì)胞中然后體內(nèi)施用所獲重組細(xì)胞。該導(dǎo)入可以通過(guò)本領(lǐng)域已知的任何方法來(lái)進(jìn)行,包括但不限于轉(zhuǎn)染、電穿孔、顯微注射、含有核酸序列的病毒或噬菌體載體感染、細(xì)胞融合、染色體介導(dǎo)的基因轉(zhuǎn)移、微細(xì)胞介導(dǎo)的基因轉(zhuǎn)移、原生質(zhì)球融合,等。用于將外源基因?qū)爰?xì)胞中的許多技術(shù)是本領(lǐng)域已知的(見(jiàn)例如Loeffler和Behr,1993,Meth.Enzymol.217599-618;Cohen等,1993,Meth.Enzymol.217618-644;Cline,1985,Pharmac.Ther.2969-92),并可以根據(jù)本發(fā)明進(jìn)行使用,只要不破壞受體細(xì)胞的必要發(fā)育和生理功能即可。該技術(shù)應(yīng)當(dāng)可以使核酸穩(wěn)定轉(zhuǎn)移至細(xì)胞中,以便核酸在細(xì)胞中是可表達(dá)的,并任選地可以被其子代細(xì)胞遺傳和表達(dá)??梢酝ㄟ^(guò)本領(lǐng)域各種已知方法將所獲重組細(xì)胞遞送至患者體內(nèi)。一般可以靜脈內(nèi)施用重組血細(xì)胞(例如造血干細(xì)胞或祖先細(xì)胞)。預(yù)計(jì)使用的細(xì)胞數(shù)量取決于期望的效果、患者的狀態(tài)等,并可以由本領(lǐng)域技術(shù)人員確定。為了基因治療目的可以導(dǎo)入核酸的細(xì)胞包括任何期望的可獲得細(xì)胞類型,并包括但不限于上皮細(xì)胞、內(nèi)皮細(xì)胞、角質(zhì)細(xì)胞、成纖維細(xì)胞、肌細(xì)胞、肝細(xì)胞;血液細(xì)胞如T淋巴細(xì)胞、B淋巴細(xì)胞、單核細(xì)胞、巨噬細(xì)胞、嗜中性粒細(xì)胞、嗜酸性粒細(xì)胞、巨核細(xì)胞、粒細(xì)胞;各種干細(xì)胞或祖先細(xì)胞,尤其是造血干細(xì)胞或祖先細(xì)胞(例如從骨髓、臍帶血、外周血、胎兒肝臟獲得的造血干細(xì)胞或祖先細(xì)胞)。在某一實(shí)施方案中,用于基因治療的細(xì)胞是患者的自體細(xì)胞。在使用重組細(xì)胞進(jìn)行基因治療的實(shí)施方案中,將編碼抗體或其它抗原結(jié)合蛋白的核酸序列導(dǎo)入細(xì)胞中,以便它們可以被細(xì)胞或其后代表達(dá),然后體內(nèi)施用該重組細(xì)胞以達(dá)到治療效果。在一個(gè)具體實(shí)施方案中,可以體外分離并維持的任何干細(xì)胞和/或祖先細(xì)胞都可以潛在地用于根據(jù)本發(fā)明的實(shí)施方案中(見(jiàn)例如PCT公開(kāi)文本W(wǎng)O94/08598(1994年4月28日);Stemple和Anderson,1992,Cell71973-985;Rheinwald,1980,Meth.CellBiol.21A229;和Pittelkow和Scott,1986,MayoClinicProc.61771)。在一個(gè)具體實(shí)施方案中,為了基因治療目的導(dǎo)入的核酸分子包含與編碼區(qū)可操作連接的誘導(dǎo)啟動(dòng)子,以致可以通過(guò)控制適當(dāng)轉(zhuǎn)錄誘導(dǎo)物的存在或不存在,控制該核酸分子的表達(dá)。本發(fā)明核酸分子還可以用于制備轉(zhuǎn)基因生物(例如動(dòng)物和植物)。任何物種的動(dòng)物,包括但不限于小鼠、大鼠、兔、倉(cāng)鼠、豚鼠、豬、微型豬(micropig)、山羊、綿羊、母牛和非人靈長(zhǎng)類動(dòng)物(例如狒狒、猴、和黑猩猩),均可以用于制備轉(zhuǎn)基因動(dòng)物。而且,任何種類的植物,包括但不限于家獨(dú)行菜、芥菜、甘藍(lán)、蕪菁、Acenasativa、普通小麥、向日葵、細(xì)紀(jì)翦股穎(Colonialbentgrass)、草地早熟禾、宿根黑麥草(Perennialryegrass)、匍匐翦股穎(Creepingbentgrass)、絆根草(Bermudagrass)、野牛草、蜈蚣草、柳枝稷、結(jié)縷草、coastalpanicgrass、菠菜、高粱、煙草和玉米,均可以用于制備轉(zhuǎn)基因植物。本領(lǐng)域已知的任何技術(shù)均可以用于將本發(fā)明核酸分子引入生物體中以產(chǎn)生轉(zhuǎn)基因生物的起始系。這些技術(shù)包括,但不限于,原核顯微注射(Paterson等,Appl.Microbiol.Biotechnol.40691-698(1994);Carver等,Biotechnology(NY)111263-1270(1993);Wright等,Biotechnology(NY)9830-834(1991);和Hoppe等,美國(guó)專利4,873,191(1981));逆轉(zhuǎn)錄病毒介導(dǎo)的向生殖細(xì)胞系(VanderPutten等,Proc.Natl.Acad.Sci.USA826148-6152(1985))、胚泡和胚胎的基因轉(zhuǎn)移;向胚胎干細(xì)胞的基因打靶(Thompson等,Cell56313-321(1989));細(xì)胞或胚胎的電穿孔(Lo,Mol.CellBiol.31803-1814(1983));使用基因槍導(dǎo)入本發(fā)明多核苷酸(見(jiàn)例如Ulmer等,Science2591745(1993);將核酸結(jié)構(gòu)導(dǎo)入胚胎多能干細(xì)胞中并將此干細(xì)胞轉(zhuǎn)移回胚泡中;和精子介導(dǎo)的基因轉(zhuǎn)移(Lavitran等,Cell57717-723(1989);等。對(duì)于這些技術(shù)的綜述,見(jiàn)Gordon等,“轉(zhuǎn)基因動(dòng)物”,Intl.Rev.Cytol.115171-229(1989),該文獻(xiàn)完整地并入本文作為參考。而且,本段落中引用的所有這些文獻(xiàn)的內(nèi)容均完整地并入本文。也見(jiàn)美國(guó)專利5,464,764(Capecchi等,正-負(fù)篩選方法和載體);美國(guó)專利5,631,153(Capecchi等,含有預(yù)先確定的基因組修飾的細(xì)胞和非人生物以及制備它們的正-負(fù)篩選方法和載體);美國(guó)專利4,736,866(Leder等,轉(zhuǎn)基因非人動(dòng)物);和美國(guó)專利4,873,191(Wagner等,受精卵的遺傳轉(zhuǎn)化),所有這些均完整地并入本文作為參考。本領(lǐng)域已知的任何技術(shù)均可以用于制備含有本發(fā)明核酸分子的轉(zhuǎn)基因克隆,例如向去核卵細(xì)胞核轉(zhuǎn)移來(lái)自經(jīng)誘導(dǎo)靜止的培養(yǎng)胚胎、胎兒、或成年細(xì)胞的細(xì)胞核(Campell等,Nature38064-66(1996);Wilmut等,Nature385810-81391997)),所有這些均完整地并入本文作為參考。本發(fā)明提供在其所有細(xì)胞中帶有本發(fā)明核酸分子的轉(zhuǎn)基因生物,以及并非所有細(xì)胞均帶有這些核酸分子的生物,即鑲嵌生物體或嵌合體。本發(fā)明核酸分子可以以單拷貝的形式、或以多拷貝如在多聯(lián)體中如頭對(duì)頭串聯(lián)或頭對(duì)尾串聯(lián)的形式整合。也可以選擇性地將本發(fā)明核酸分子導(dǎo)入特定細(xì)胞類型中并在其中激活,方式參見(jiàn)例如以下Lasko等的文獻(xiàn)(Lasko等,Proc.Natl.Acad.Sci.USA896232-6236(1992))。該細(xì)胞類型特異性激活所必需的調(diào)節(jié)序列將取決于具體的目的細(xì)胞類型,并是本領(lǐng)域技術(shù)人員明了的。當(dāng)期望使本發(fā)明核酸分子整合在內(nèi)源性基因的染色體位點(diǎn)中時(shí),這通常是通過(guò)基因打靶來(lái)實(shí)現(xiàn)的。簡(jiǎn)而言之,當(dāng)使用該技術(shù)時(shí),設(shè)計(jì)含有與內(nèi)源基因同源的一些核苷酸序列的載體,以便通過(guò)與染色體序列的同源重組整合在該內(nèi)源性基因核苷酸序列中并破壞其功能。還可以選擇性地將本發(fā)明核酸分子導(dǎo)入特定細(xì)胞類型中,由此使僅在此類型細(xì)胞中的內(nèi)源性基因失活,方式見(jiàn)例如以下Gu等的文獻(xiàn)(Gu等,Science265103-106(1994))。該細(xì)胞類型特異性失活所必需的調(diào)節(jié)序列取決于具體的目的細(xì)胞類型,并是本領(lǐng)域技術(shù)人員已知的。本段落引用的所有文獻(xiàn)的內(nèi)容均完整地并入本文作為參考。一旦產(chǎn)生了轉(zhuǎn)基因生物后,可以利用標(biāo)準(zhǔn)技術(shù)分析重組基因的表達(dá)。可以通過(guò)Southern印跡或PCR技術(shù)分析生物體的組織驗(yàn)證本發(fā)明核酸分子是否整合來(lái)進(jìn)行初步篩選。還可以使用以下技術(shù)評(píng)價(jià)本發(fā)明核酸分子在轉(zhuǎn)基因生物體的組織中的mRNA表達(dá)水平,這些技術(shù)包括但不限于Northern印跡分析從生物體獲得的組織樣品、原位雜交分析、和逆轉(zhuǎn)錄酶PCR(rt-PCR)。表達(dá)本發(fā)明核酸分子的組織樣品也可以使用特異針對(duì)這些核酸分子的表達(dá)產(chǎn)物的抗體來(lái)進(jìn)行免疫細(xì)胞化學(xué)或免疫組織化學(xué)評(píng)價(jià)。一旦產(chǎn)生了起始生物后,可以對(duì)它們進(jìn)行育種、近交、遠(yuǎn)交、或雜交育種以產(chǎn)生特定生物群落。育種策略的例子包括,但不限于對(duì)具有一個(gè)以上整合位點(diǎn)的起始生物進(jìn)行遠(yuǎn)交以建立分離系(separateline);對(duì)分離系進(jìn)行近交以便產(chǎn)生由于每拷貝本發(fā)明核酸分子的額外表達(dá)作用造成的較高水平表達(dá)本發(fā)明核酸分子的復(fù)合轉(zhuǎn)基因生物;對(duì)雜合轉(zhuǎn)基因生物進(jìn)行雜交以產(chǎn)生指定整合位點(diǎn)純合的生物,以便提高表達(dá)并消除通過(guò)DNA分析篩選生物的需要;對(duì)分離的純合系進(jìn)行雜交以產(chǎn)生復(fù)合的雜合或純合系;以及進(jìn)行育種以將本發(fā)明核酸分子放置在適合于目的實(shí)驗(yàn)?zāi)J降牟煌尘吧?。本發(fā)明轉(zhuǎn)基因和“敲除”生物的用途包括,但不限于,用于詳細(xì)闡明本發(fā)明核酸分子表達(dá)產(chǎn)物的生物學(xué)功能的模式系統(tǒng)(例如動(dòng)物模式系統(tǒng))、研究與本發(fā)明核酸分子表達(dá)產(chǎn)物的異常表達(dá)有關(guān)的疾病和/或病癥、以及篩選有效改善這些疾病和/或病癥的化合物。本領(lǐng)域技術(shù)人員將明了,在將本發(fā)明核酸分子導(dǎo)入后生動(dòng)物的許多情況中,可能期望將編碼表達(dá)產(chǎn)物的序列與組織特異性轉(zhuǎn)錄調(diào)節(jié)序列(例如組織特異性啟動(dòng)子)(此組織是期望表達(dá)產(chǎn)物在其中產(chǎn)生的組織)可操作地連接。該啟動(dòng)子可以用于促進(jìn)這些表達(dá)產(chǎn)物在期望組織中的產(chǎn)量。相當(dāng)大量的組織特異性啟動(dòng)子是本領(lǐng)域已知的。而且,本文其它地方描述了鑒定組織特異性轉(zhuǎn)錄調(diào)節(jié)序列的方法。宿主細(xì)胞本發(fā)明還涉及包含本發(fā)明一或多個(gè)(如2、3、4、5、7、10、12、15、20、30、50個(gè)等)核酸分子或載體,尤其是此處詳細(xì)描述的那些核酸分子和載體,的宿主細(xì)胞。根據(jù)本發(fā)明此方面可以使用的代表性宿主細(xì)胞包括,但不限于,細(xì)菌細(xì)胞、酵母細(xì)胞、昆蟲(chóng)細(xì)胞、植物細(xì)胞、和動(dòng)物細(xì)胞。優(yōu)選的細(xì)菌宿主細(xì)胞包括埃希氏菌屬(Escherichiaspp.)細(xì)胞(尤其是大腸桿菌(E.coli)細(xì)胞,最尤其是大腸桿菌菌株DH10B、Stb12、DH5α、DB3、DB3.1(優(yōu)選大腸桿菌LIBRARYEFFICIENCYDB3.1TM感受態(tài)細(xì)胞;InvitrogenCorporation,LifeTechnologiesDivision,Rockville,MD)、DB4和DB5(參見(jiàn)2000年3月2日提交的美國(guó)申請(qǐng)09/518,188和1999年3月2日提交的美國(guó)臨時(shí)申請(qǐng)60/122,392,其公開(kāi)文本完整地并入本文作為參考)、芽孢桿菌屬(Bacillusspp.)細(xì)胞(尤其是枯草芽孢桿菌(B.subtilis)和巨大芽孢桿菌(B.megaterium)細(xì)胞)、鏈霉菌屬(Streptomycesspp.)細(xì)胞、歐文氏桿菌屬(Erwiniaspp.)細(xì)胞、克雷白氏桿菌屬(Klebsiellaspp.)細(xì)胞、沙雷氏菌屬(Serratiaspp.)細(xì)胞(尤其是粘質(zhì)沙雷氏菌(S.marcessans)細(xì)胞)、假單胞菌屬(Pseudomonasspp.)細(xì)胞(尤其是銅綠假單胞菌(P.aeruginosa)細(xì)胞)、和沙門(mén)氏菌屬(Salmonellaspp.)細(xì)胞(尤其是鼠傷寒沙門(mén)氏菌(S.typhimurium)和傷寒沙門(mén)氏菌(S.typhi)細(xì)胞)。優(yōu)選的動(dòng)物宿主細(xì)胞包括昆蟲(chóng)細(xì)胞(最尤其是Drosophilamelanogaster細(xì)胞、草地貪夜蛾(Spodopterafrugiperda)Sf9和Sf21細(xì)胞、及粉紋夜蛾(Trichoplusa)High-Five細(xì)胞)、線蟲(chóng)細(xì)胞(尤其是C.elegans細(xì)胞)、鳥(niǎo)類細(xì)胞、兩棲類動(dòng)物細(xì)胞(尤其是(Xenopuslaevis)細(xì)胞)、爬行動(dòng)物細(xì)胞、和哺乳動(dòng)物細(xì)胞(最尤其是NIH3T3、CHO、COS、VERO、BHK和人細(xì)胞)。優(yōu)選的酵母細(xì)胞包括釀酒酵母細(xì)胞和巴斯德畢赤氏酵母(Pichiapastoris)細(xì)胞。這些和其它適合的宿主細(xì)胞均可以從商業(yè)途徑獲得,例如從InvitrogenCorporation,LifeTechnologiesDivision(Rockville,Mayland)、美國(guó)典型培養(yǎng)物保藏中心(Manassas,Virginia)、和農(nóng)業(yè)研究機(jī)構(gòu)保藏中心(NRRL;Peoria,Illinois)購(gòu)買(mǎi)獲得。向此處所述宿主細(xì)胞中導(dǎo)入本發(fā)明的核酸分子和/或載體,以產(chǎn)生包含本發(fā)明一或多個(gè)核酸分子和/或載體的方法是本領(lǐng)域普通技術(shù)人員熟悉的。例如,可以使用感染、轉(zhuǎn)導(dǎo)、轉(zhuǎn)染和轉(zhuǎn)化的熟知技術(shù),向宿主細(xì)胞中導(dǎo)入本發(fā)明核酸分子和/或載體。本發(fā)明核酸分子和/或載體可以單獨(dú)地或聯(lián)合其它核酸分子和/或載體和/或蛋白質(zhì)、肽或RNA一起導(dǎo)入?;蛘撸梢砸猿恋淼男问嚼缌姿徕}沉淀的形式,或和脂形成復(fù)合物的形式,向宿主細(xì)胞中導(dǎo)入本發(fā)明核酸分子和/或載體。也可以使用電穿孔將本發(fā)明核酸分子和/或載體導(dǎo)入宿主中。同樣,可以將此類分子導(dǎo)入化學(xué)感受態(tài)細(xì)胞例如大腸桿菌細(xì)胞中。如果載體是病毒,則可以體外對(duì)其進(jìn)行包裝或?qū)⑵鋵?dǎo)入包裝細(xì)胞中,然后可以將包裝病毒轉(zhuǎn)導(dǎo)至細(xì)胞中。因此,本發(fā)明核酸分子可以含有和/或編碼一或多個(gè)包裝信號(hào)(例如指導(dǎo)包裝病毒核酸分子的病毒包裝信號(hào))。因此,根據(jù)本發(fā)明的此方面,適于將本發(fā)明核酸分子和/或載體導(dǎo)入細(xì)胞中的廣泛多種技術(shù)是本領(lǐng)域技術(shù)人員熟知的和常規(guī)的。在以下文獻(xiàn)中對(duì)這些技術(shù)作了充分的綜述Sambrook,J.等,分子克隆實(shí)驗(yàn)室手冊(cè)(MolecularCloning,ALaboratoryManual)第2版,ColdSpringHarbor,NYColdSpringHarborLaboratoryPress,第16.30-16.55頁(yè)(1989);WatsonJ.D.等,重組DNA(RecombinantDNA)第2版,紐約W.H.FreemanandCo.,第213-234頁(yè)(1992);和Winnacker,E.-L.,從基因到克隆(FromGenestoClones),紐約VCHPublishers(1987),這些是詳細(xì)描述這些技術(shù)的許多實(shí)驗(yàn)室手冊(cè)的例子,為了它們的相關(guān)公開(kāi),將它們完整地并入本文作為參考。聚合酶本發(fā)明所用聚合酶包括但不限于聚合酶(DNA和RNA聚合酶)和逆轉(zhuǎn)錄酶。DNA聚合酶包括,但不限于,嗜熱棲熱菌(Thermusthermophilus)(Tth)DNA聚合酶、水生棲熱菌(Thermusaquaticus)(Taq)DNA聚合酶、那不勒斯棲熱袍菌(Thermotoganeopolitana)(Tne)DNA聚合酶、海棲熱袍菌(Thermotogamaritima)(Tma)DNA聚合酶、(Thermococcuslitoralis)(Tli或VENTTM)DNA聚合酶、激烈火球菌(Pyrococcusfuriosus)(Pfu)DNA聚合酶、DEEPVENTTMDNA聚合酶、Pyrococcuswoosii(Pwo)DNA聚合酶、火球菌屬物種(Pyrococcussp)KOD2(KOD)DNA聚合酶、嗜熱脂肪芽孢桿菌(Bacillussterothermophilus)(Bst)DNA聚合酶、Bacilluscaldophilus(Bca)DNA聚合酶、酸熱硫化熱菌(Sulfolobusacidoaldarius(Sac)DNA聚合酶、嗜酸熱原體(Thermoplasmaacidophilum)(Tac)DNA聚合酶、黃棲熱菌(Thermusflavus)(Tfl/Tub)DNA聚合酶、紅棲熱菌(Thermusruber)(Tru)DNA聚合酶、Thermusbrockianus(DYNAZYMETM)DNA聚合酶、熱自養(yǎng)甲烷桿菌(Methanobacteriumthermoautotrophicum)(Mth)DNA聚合酶、分枝桿菌屬(mycobacterium)DNA聚合酶(Mtb,Mlep)、大腸桿菌polIDNA聚合酶、T5DNA聚合酶、T7DNA聚合酶、和一般的polI型DNA聚合酶和它們的突變體、變體和衍生物。RNA聚合酶例如T3、T5和SP6及它們的突變體、變體和衍生物也均可以用于本發(fā)明。本發(fā)明所用核酸聚合酶可以是中溫的或嗜熱的,優(yōu)選嗜熱的。優(yōu)選的中溫DNA聚合酶包括可以從以下生物分離到的所有PolI家族DNA聚合酶(和它們的相應(yīng)Klenow片段)如大腸桿菌、流感嗜血桿菌(H.influenzae)、D.radiodurans、H.pylori、C.auratiacus、R.prowazekii、T.pallidum、Synechocystissp.、枯草芽孢桿菌(B.subtilis)、L.lactis、S.pneumoniae、M.tuberculosis、M.leprae、M.smegmatis、噬菌體L5、phi-C31、T7、T3、T5、SP01、SP02、釀酒酵母(S.cerevisiae)MIP-1、和真核生物C.elegans及D.melanogaster(Astatke,M.等,1998,J.Mol.Biol.278,147-165)的線粒體;分離自任何來(lái)源的polIII型DNA聚合酶,以及它們的突變體、衍生物或變體,等??梢栽诒景l(fā)明方法和組合物中使用的優(yōu)選熱穩(wěn)定DNA聚合酶包括Taq、Tne、Tma、Pfu、KOD、Tfl、Tth、Stoffel片段、VENTTM及DEEPVENTTMDNA聚合酶、和它們的突變體、變體和衍生物(美國(guó)專利5,436,149;美國(guó)專利4,889,818;美國(guó)專利4,965,188;美國(guó)專利5,079,352;美國(guó)專利5,614,365;美國(guó)專利5,374,553;美國(guó)專利5,270,179;美國(guó)專利5,047,342;美國(guó)專利5,512,462;WO92/06188;WO92/06200;WO96/10640;WO97/09451;Barnes,W.M.,Gene,11229-35(1992);Lawyer,F(xiàn).C.等,PCRMeth.Appl.2275-287(1993);Flaman,J.M.等,Nucl.AcidsRes.22(15)3259-3260(1994))。用于本發(fā)明的逆轉(zhuǎn)錄酶包括任何具有逆轉(zhuǎn)錄酶活性的酶。這些酶包括,但不限于,逆轉(zhuǎn)錄病毒的逆轉(zhuǎn)錄酶、逆轉(zhuǎn)座子的逆轉(zhuǎn)錄酶、乙型肝炎病毒的逆轉(zhuǎn)錄酶、花椰菜花葉病毒的逆轉(zhuǎn)錄酶、細(xì)菌的逆轉(zhuǎn)錄酶、TthDNA聚合酶、TaqDNA聚合酶(Saiki,R.K.等,Science239487-491(1988);美國(guó)專利4,889,818和4,965,188)、TneDNA聚合酶(WO96/10640和WO97/09451)、TmaDNA聚合酶(美國(guó)專利5,374,553)和它們的突變體、變體或衍生物(參見(jiàn)例如WO97/09451和WO98/47912)。用于本發(fā)明的優(yōu)選酶包括降低、基本上降低或消除了RNaseH活性的那些酶?!盎旧辖档土薘NaseH活性”的酶是指該酶具有少于約20%、更優(yōu)選少于約15%、10%或5%、最優(yōu)選少于約2%的相應(yīng)野生型或RNaseH+酶(如野生型Moloney鼠白血病病毒(M-MLV)、禽成髓細(xì)胞瘤病毒(AMV)或Rous肉瘤病毒(RSV)逆轉(zhuǎn)錄酶)的RNaseH活性。任何酶的RNaseH活性均可以通過(guò)多種測(cè)試方法來(lái)確定,這些方法例如描述于如美國(guó)專利5,244,797;Kotewicz,M.L.等,Nucl.Acids.Res.16265(1988);和Gerard,G.F.等,F(xiàn)OCUS14(5)91(1992)中的那些,所有這些文獻(xiàn)的公開(kāi)文本均完整地并入本文作為參考。用于本發(fā)明的尤其優(yōu)選多肽包括,但不限于,M-MLVH逆轉(zhuǎn)錄酶、RSVH-逆轉(zhuǎn)錄酶、AMVH-逆轉(zhuǎn)錄酶、RAV(Rous相關(guān)病毒)H-逆轉(zhuǎn)錄酶、MAV(成髓細(xì)胞瘤相關(guān)病毒)H-逆轉(zhuǎn)錄酶、HIVH-逆轉(zhuǎn)錄酶。(參見(jiàn)美國(guó)專利5,244,797和WO98/47912)。然而,本領(lǐng)域普通技術(shù)人員將理解,能夠從核糖核酸分子產(chǎn)生DNA分子(即具有逆轉(zhuǎn)錄酶活性)的任何酶均可以同等地應(yīng)用于本發(fā)明的組合物、方法和試劑盒中。用于本發(fā)明的具有聚合酶活性的酶可以從商業(yè)途徑獲得,例如從InvitrogenCorporation,LifeTechnologiesDivision(Rockville,Maryland);Perkin-Elmer(Branchburg,NewJersey);NewEnglandBiolabs(Beverly,Massachusetts);或BoehringerMannheimBiochemicals(Indianapolis,Indiana)獲得。用于本發(fā)明的具有逆轉(zhuǎn)錄酶活性的酶可以從商業(yè)途徑獲得,例如從InvitrogenCorporation,LifeTechnologiesDivision(Rockville,Maryland);Pharmacia(Piscataway,NewJersey);Sigma(SaintLouis,Missouri);或BoehringerMannheimBiochemicals(Indianapolis,Indiana)獲得。或者,可以根據(jù)本領(lǐng)域普通技術(shù)人員熟知的分離和純化天然蛋白質(zhì)的標(biāo)準(zhǔn)程序(參見(jiàn)例如Houts,G.E.等,J.Virol.29517(1979)),從其天然病毒或細(xì)菌來(lái)源分離具有聚合酶活性的聚合酶或逆轉(zhuǎn)錄酶。此外,這些聚合酶/逆轉(zhuǎn)錄酶可以通過(guò)本領(lǐng)域普通技術(shù)人員熟悉的重組DNA技術(shù)來(lái)制備(參見(jiàn)例如Kotewicz,M.L.等,Nucl.AcidsRes.16265(1988);美國(guó)專利5,244,797;WO98/47912;Soltis,D.A.和Skalka,A.M.,Proc.Natl.Acad.Sci.USA853372-3379(1988))。具有聚合酶活性和逆轉(zhuǎn)錄酶活性的酶的例子包括本申請(qǐng)中描述的所有那些。支持物和陣列根據(jù)本發(fā)明方法使用的支持物可以是任何適于附著包含一或多個(gè)重組位點(diǎn)或其部分的核酸分子的支持物或基質(zhì)??梢酝ㄟ^(guò)本領(lǐng)域熟知的任何技術(shù)或任何技術(shù)組合,將這些分子加載或結(jié)合(共價(jià)地或非共價(jià)地)在支持物上。本發(fā)明支持物可以包含硝酸纖維素、重氮纖維素、玻璃、聚苯乙烯(包括微量滴定板)、聚氯乙烯、聚丙烯、聚乙烯、聚偏二氟乙烯(PVDF)、葡聚糖、Sepharose、瓊脂、淀粉和尼龍。本發(fā)明支持物可以是任何形式或構(gòu)型,包括珠粒、濾器、膜、片、玻璃料、塞、柱等。固體支持物還可以包括多孔管(例如微量滴定板)例如12孔板、24孔板、48孔板、96孔板、和384孔板。優(yōu)選的床是由玻璃、乳膠、或磁性材料(磁性、順磁性或超順磁性(superparamagnetic)珠粒)制成的。在一個(gè)優(yōu)選方面,本發(fā)明方法可以用于制備蛋白質(zhì)或核酸分子(RNA或DNA)陣列或其它分子、化合物和/或物質(zhì)的陣列。這些陣列可以在微量板、載玻片、或標(biāo)準(zhǔn)的印跡膜上形成并可以根據(jù)陣列的格式和設(shè)計(jì)稱作微陣列或基因芯片。這些陣列的用途包括發(fā)現(xiàn)基因、給出基因表達(dá)概貌、基因分型(SNP分析、藥物基因組學(xué)、毒理遺傳學(xué))、和制備鈉米技術(shù)裝置。核酸陣列的合成和用途以及一般地核酸與支持物的附著已有描述(見(jiàn)例如美國(guó)專利5,436,327;美國(guó)專利5,800,992;美國(guó)專利5,445,9334;美國(guó)專利5,763,170;美國(guó)專利5,599,695和美國(guó)專利5,837,832)。Pirrung等美國(guó)專利5,143,854和Barrett等美國(guó)專利5,252,743中描述了將各種試劑附著在底物的位置確定的位點(diǎn)上的自動(dòng)程序。例如,二硫化物修飾的寡核苷酸可以使用二硫鍵與固體支持物附著。(見(jiàn)Roger等,Anal.Biochem.26623-30(1999)。)而且,二硫化物修飾的寡核苷酸可以使用固相合成成為肽核酸(PNA)。由此,可以將包含一或多個(gè)重組位點(diǎn)或其部分的核酸分子加載在一或多個(gè)支持物上(或可以加入該支持物上的陣列中),并可以將核酸、蛋白質(zhì)或其它分子和/或化合物通過(guò)本發(fā)明重組方法加在該支持物上。核酸和目的分子的偶聯(lián)是本領(lǐng)域已知的,因此,本發(fā)明普通技術(shù)人員可以根據(jù)本發(fā)明制備含有重組位點(diǎn)(或其部分)的分子和/或化合物以便和支持物(陣列格式的或其它格式的)附著。本質(zhì)上,任何可以想到的支持物都可以用于本發(fā)明。該支持物可以是生物的、非生物的、有機(jī)的、無(wú)機(jī)、或任何這些的組合,其存在形式有顆粒、鏈、沉淀、凝膠、片、管、球、容器、毛細(xì)管、墊、薄片、薄膜、板、載片、等。該支持物可以具有任何方便的形狀,例如盤(pán)形、方形、球形、圓形等。該支持物優(yōu)選是扁平的但可以采取各種其它表面構(gòu)型。例如,該支持物可以含有可用于合成或其它反應(yīng)的升高的或降低的區(qū)域。該支持物和其表面優(yōu)選形成剛性表面,以便本文所述反應(yīng)在其上進(jìn)行。也可以對(duì)該支持物和其表面進(jìn)行選擇以便提供適當(dāng)?shù)墓馕仗匦浴@?,該支持物可以是聚合的LangmuirBlodgett膜、官能化玻璃、Si、Ge、GaAs、GaP、SiO2、SIN4、修飾的硅、或廣泛多種凝膠或聚合物(如(聚)四氟乙烯、(聚)偏氟乙烯、聚苯乙烯、聚碳酸酯)之任一種、或它們的組合。根據(jù)本公開(kāi)的綜述,本領(lǐng)域技術(shù)人員將明了其它支持物材料。在一個(gè)優(yōu)選實(shí)施方案中,該支持物是扁平的玻璃或單晶硅。因此,本發(fā)明提供用于制備附著在支持物上的核酸分子陣列的方法。在一些實(shí)施方案中,這些核酸分子在它們的一或多個(gè)末端(例如1、2、3或4)具有重組位點(diǎn)。在一些其它實(shí)施方案中,直接將一個(gè)核酸分子與支持物、或支持物的特定部分結(jié)合,而將一或多個(gè)其它核酸分子通過(guò)與直接附著在支持物上的核酸分子的結(jié)合間接地附著在支持物上。在此情況下,直接與支持物附著的核酸分子提供了成核位點(diǎn),圍繞該位點(diǎn)可以構(gòu)建核酸陣列。本發(fā)明還提供用于將支持物彼此連接在一起和用于將結(jié)合在同一支持物上的分子連接在一起的方法。使用圖11非限制地舉例說(shuō)明該過(guò)程的一個(gè)實(shí)施方案中,可以將命名為RS6的重組位點(diǎn)放置在該圖下部分所示附著在支持物上的A/B組合物的RS5位點(diǎn)末端。而且,還可以將一個(gè)相同的組合物附著在相同或不同支持物的另一部分上。然后使用RS6位點(diǎn)間的重組將這兩個(gè)組合物連接起來(lái),由此使附著在相同支持物上的兩個(gè)支持物之間或附著在不同支持物上的兩個(gè)組合物之間鍵合。因此,本發(fā)明提供了方法,使得可以通過(guò)使用重組位點(diǎn)將與支持物結(jié)合的一或多個(gè)組合物連接起來(lái),從而使附著在相同支持物上的化合物發(fā)生交聯(lián)。本發(fā)明還提供了方法,使得可以使用重組位點(diǎn)將與分開(kāi)的支持物結(jié)合的一或多個(gè)組合物連接起來(lái),從而使分開(kāi)的支持物發(fā)生交聯(lián)。一方面,本發(fā)明提供含有通過(guò)本發(fā)明方法制備的核酸分子的支持物。在許多實(shí)施方案中,這些支持物上的核酸分子含有至少一個(gè)重組位點(diǎn)。在一些實(shí)施方案中,該重組位點(diǎn)在核酸分子附著在支持物上之前已進(jìn)行了重組。這些結(jié)合的核酸分子可以用于例如鑒定其它核酸分子(例如與該結(jié)合的核酸分子在嚴(yán)緊雜交條件下雜交的核酸分子)和對(duì)該結(jié)合的核酸分子具有結(jié)合親和力的蛋白質(zhì)。還可以從這些結(jié)合的核酸分子產(chǎn)生表達(dá)產(chǎn)物,而同時(shí)這些核酸分子仍保持與支持物結(jié)合。因此,本發(fā)明組合物和方法可以用于鑒定表達(dá)產(chǎn)物和這些表達(dá)產(chǎn)物所產(chǎn)生的產(chǎn)物。在其它實(shí)施方案中,與支持物結(jié)合的核酸分子在核酸分子附著在支持物上之后發(fā)生重組。正如已討論的,因此,這些結(jié)合的核酸分子可以用于鑒定所編碼的表達(dá)產(chǎn)物參與一個(gè)或特定數(shù)量的生物學(xué)過(guò)程或途徑的核酸分子。而且,可以從這些支持物上釋放與支持物結(jié)合的核酸分子。釋放核酸分子的方法包括限制性消化、重組和改變條件(例如溫度、鹽濃度等)以誘導(dǎo)與結(jié)合的核酸分子雜交的核酸分子發(fā)生解離。因此,本發(fā)明方法包括使用結(jié)合核酸分子的支持物來(lái)分離核酸分子。正如以上提及的,本發(fā)明提供了方法,使得可以篩選核酸文庫(kù)以鑒定所編碼的表達(dá)產(chǎn)物參與相同生物學(xué)過(guò)程或途徑的核酸分子。在具體實(shí)施方案中,這些方法包括(1)將包含至少一個(gè)重組位點(diǎn)的核酸分子附著在支持物上,(2)使該結(jié)合的核酸分子和核酸分子文庫(kù)在利于該結(jié)合的核酸分子和文庫(kù)核酸分子之間發(fā)生重組的條件下接觸,其中該文庫(kù)中各核酸分子均包含至少一個(gè)重組位點(diǎn),和(3)篩選通過(guò)重組形成的核酸分子的表達(dá)產(chǎn)物或這些核酸分子的表達(dá)產(chǎn)物所產(chǎn)生的產(chǎn)物。通過(guò)核酸分子和支持物的結(jié)合可以形成的組合物的例子是“基因芯片”,通常在本領(lǐng)域中稱作“DNA微陣列”或“基因組芯片”(見(jiàn)美國(guó)專利5,412,087和5,889,165;和PCT公開(kāi)文本W(wǎng)O97/02357、WO97/43450、WO98/20967、WO99/05574、WO99/05591和WO99/40105,所有這些公開(kāi)均完整地并入本文作為參考)。在本發(fā)明各種實(shí)施方案中,這些基因芯片可以含有本文所述的兩維或三維核酸陣列。本發(fā)明核酸陣列的可尋址性(adressability)意味著可以將與特定核苷酸序列結(jié)合的分子或化合物附著在陣列上。由此,可以將蛋白質(zhì)和其它核酸等成分附著在本發(fā)明核酸陣列的特定地點(diǎn)/位置。因此,一方面,本發(fā)明提供親和純化方法,包括(1)提供與包含至少一個(gè)重組位點(diǎn)的核酸分子結(jié)合的支持物,(2)使用重組反應(yīng)使一或多個(gè)其它核酸分子與支持物附著,(3)使該支持物與含有對(duì)結(jié)合在支持物上的核酸分子具有結(jié)合親和力的分子或化合物的組合物,在利于這些分子或化合物與結(jié)合在支持上的核酸分子結(jié)合的條件下,進(jìn)行接觸,(4)改變條件以促進(jìn)結(jié)合的分子或化合物的釋放,和(5)收集釋放的分子或化合物。核酸合成、擴(kuò)增和測(cè)序方法本發(fā)明可以聯(lián)合涉及核酸分子如DNA(包括cDNA)和RNA分子合成的任何方法一起應(yīng)用。這些方法包括,但不限于,核酸合成方法、核酸擴(kuò)增方法和核酸測(cè)序方法。可以使用這些方法制備本發(fā)明所用分子(例如起始分子)或進(jìn)一步操作本發(fā)明制備的分子或載體。根據(jù)本發(fā)明的此方面,核酸合成方法可以包含一或多個(gè)(例如2、3、4、5、7、10、12、15等)步驟。例如,本發(fā)明提供合成核酸分子的方法,其包括(a)將核酸模板(例如,本發(fā)明核酸分子或載體)和一或多個(gè)(例如2、3、4、5、7、10、12、15等)引物和一或多個(gè)(例如2、3、4、5、7等)具有聚合酶或逆轉(zhuǎn)錄酶活性的酶混合,以形成混合物;和(b)在足以產(chǎn)生和模板的全部或部分互補(bǔ)的第一核酸分子的條件下,孵育該混合物。根據(jù)本發(fā)明的此方面,核酸模板可以是DNA分子如cDNA分子或文庫(kù),或RNA分子如mRNA分子。足以允許合成發(fā)生的條件如pH、溫度、離子強(qiáng)度和孵育時(shí)間可以由本領(lǐng)域技術(shù)人員優(yōu)化。如果期望的話,可以在合成過(guò)程中或之后在該合成的分子上添加重組位點(diǎn)(見(jiàn)例如基于1997年10月24日提交的美國(guó)臨時(shí)專利申請(qǐng)60/065,930于98年10月23日提交的美國(guó)專利09/177,387)。根據(jù)本發(fā)明,可以從獲自天然來(lái)源如各種細(xì)胞、組織、器官或生物的核酸分子制備靶或模板核酸分子或文庫(kù)。可以用作核酸分子來(lái)源的細(xì)胞可以是原核細(xì)胞(細(xì)菌細(xì)胞,包括埃希氏桿菌屬、芽孢桿菌屬、沙雷氏菌屬(Serratia)、沙門(mén)氏菌屬(Salmonella)、葡萄球菌屬(Staphlococcus)、鏈球菌屬(Streptococcus)、梭狀芽胞桿菌屬(Clostridium)、衣原體(Chlamydia)、奈瑟氏球菌屬(Neisseria)、密螺旋體屬(Treponema)、支原體(Mycoplasma)、疏螺旋體屬(Borrelia)、軍團(tuán)菌屬(Legionella)、假單胞菌屬(Pseudomonas)、分支桿菌屬(Mycobacterium)、螺桿菌屬(Helicobacter)、歐文氏菌屬(Erwinia)、土壤桿菌屬(Agrobacterium)、根瘤菌屬(Rhizobium)、和鏈霉菌屬(Streptomyces)的種的細(xì)胞),或真核細(xì)胞(包括真菌(特別是酵母的)、植物、原生動(dòng)物及其它寄生物、和動(dòng)物包括昆蟲(chóng)(尤其是果蠅屬細(xì)胞)、線蟲(chóng)(尤其是Caenorhabditiselegans的細(xì)胞)、和哺乳動(dòng)物(尤其是人細(xì)胞)的細(xì)胞)。當(dāng)然,可以有利地使用的其它核酸合成技術(shù)將是本領(lǐng)域普通技術(shù)人員易于明了的。在本發(fā)明其它方面,本發(fā)明可以聯(lián)合擴(kuò)增或測(cè)序核酸分子的方法一起應(yīng)用。根據(jù)本發(fā)明的此方面,核酸擴(kuò)增方法可以包括將一或多個(gè)具有逆轉(zhuǎn)錄酶活性的多肽用于本領(lǐng)域通常稱作一步(例如一步RT-PCR)或兩步(例如兩步RT-PCR)逆轉(zhuǎn)錄酶-擴(kuò)增反應(yīng)的方法中。對(duì)于長(zhǎng)核酸分子(即長(zhǎng)度大于約3-5Kb)的擴(kuò)增,可以使用DNA聚合酶的組合,參見(jiàn)WO98/06736和WO95/16028。根據(jù)本發(fā)明,擴(kuò)增方法可以包含一或多個(gè)(例如2、3、4、5、7、10)步驟。例如,本發(fā)明提供擴(kuò)增核酸分子的方法,包含(a)將一或多個(gè)(例如2、3、4、5、7、10等)具有聚合酶活性的酶與一或多個(gè)(例如2、3、4、5、7、10、12、15、20、30、50、100等)核酸模板混合;和(b)在足以允許具有聚合酶活性的酶擴(kuò)增與模板的全部或部分互補(bǔ)的一或多個(gè)核酸分子的條件下,孵育該混合物。本發(fā)明還提供通過(guò)這些方法擴(kuò)增的核酸分子。如果期望的話,可以在擴(kuò)增過(guò)程中或之后在該擴(kuò)增的分子上添加重組位點(diǎn)(見(jiàn)例如基于1997年10月24日提交的美國(guó)臨時(shí)專利申請(qǐng)60/065,930于98年10月23日提交的美國(guó)專利09/177,387)。擴(kuò)增和分析核酸分子或片段的一般方法是本領(lǐng)域普通技術(shù)人員熟知的(參見(jiàn)例如美國(guó)專利4,683,195;4,683,202;和4,800,159;Innis,M.A.等編,PCR實(shí)驗(yàn)指南方法和應(yīng)用的指導(dǎo)(PCRProtocolsAGuidetoMethodsandApplications),SanDiego,CaliforniaAcademicPress,Inc.(1990);Griffin,H.G.和Griffin,A.M.編,PCR技術(shù)當(dāng)前的創(chuàng)新(PCRTechnologyCurrentInnovations),BocaRaton,F(xiàn)lorida;CRCPress(1994))。例如,根據(jù)本發(fā)明可以使用的擴(kuò)增方法包括PCR(美國(guó)專利4,683,195和4,683,292)、鏈置換擴(kuò)增(SDA;美國(guó)專利5,455,166;EP0684315)、和基于核酸序列的擴(kuò)增(NASBA;美國(guó)專利5,409,818;EP0329822)。典型地,這些擴(kuò)增方法包括(a)將一或多個(gè)具有聚合酶活性的酶與核酸樣品在存在一或多個(gè)引物的情況下混合;和(b)優(yōu)選通過(guò)PCR或等價(jià)的自動(dòng)擴(kuò)增技術(shù),擴(kuò)增該核酸樣品以產(chǎn)生大量擴(kuò)增的核酸片段。通過(guò)本發(fā)明方法進(jìn)行擴(kuò)增或合成后,可以分離擴(kuò)增的或合成的核酸片段作進(jìn)一步使用或表征。該步驟通??梢酝ㄟ^(guò)借助大小或任何物理或生物化學(xué)方法包括凝膠電泳、毛細(xì)管電泳、層析(包括分子篩、親和和免疫層析)、密度梯度離心和免疫吸附,分離擴(kuò)增的或合成的核酸片段來(lái)完成。尤其優(yōu)選通過(guò)凝膠電泳分離核酸片段,因?yàn)樗峁┝丝焖俸透咧貜?fù)性地靈敏分離許多核酸片段的手段、并允許直接同時(shí)地比較幾個(gè)核酸樣品中的這些片段。在另一優(yōu)選實(shí)施方案中,可以擴(kuò)展該方法以分離和表征這些片段或任何通過(guò)本發(fā)明方法擴(kuò)增或合成的核酸片段。因此,本發(fā)明還指向通過(guò)本發(fā)明擴(kuò)增或合成方法產(chǎn)生的分離的核酸分子。在該實(shí)施方案中,根據(jù)標(biāo)準(zhǔn)技術(shù)如電洗脫或物理切除,從用于鑒定的凝膠(見(jiàn)上)上取下一或多個(gè)擴(kuò)增的或合成的核酸片段。然后將這些分離的獨(dú)特核酸片段插入適于轉(zhuǎn)染或轉(zhuǎn)化多種原核(細(xì)菌)或真核(酵母、植物或動(dòng)物包括人和其它哺乳動(dòng)物)細(xì)胞的標(biāo)準(zhǔn)載體包括表達(dá)載體中?;蛘撸€可以通過(guò)例如測(cè)序(即,確定核酸片段的核苷酸序列)、通過(guò)以下描述的方法和本領(lǐng)域的其它標(biāo)準(zhǔn)方法(參見(jiàn)指向DNA測(cè)序方法的美國(guó)專利4,962,022和5,498,523),表征本發(fā)明方法所制備的核酸分子。根據(jù)本發(fā)明,核酸測(cè)序方法可以包含一或多個(gè)步驟。例如,本發(fā)明可以和用于測(cè)序核酸分子的方法聯(lián)合應(yīng)用,該方法包含(a)將具有聚合酶活性的酶和待測(cè)序的核酸分子、一或多個(gè)引物、一或多個(gè)核苷酸、及一或多個(gè)終止劑(例如雙脫氧核苷酸)混合,以形成混合物;(b)在足以合成和待測(cè)序分子的全部或部分互補(bǔ)的一群分子的條件下,孵育該混合物;和(c)分離該群體以確定待測(cè)序分子的全部或部分核苷酸序列??梢允褂玫暮怂釡y(cè)序技術(shù)包括例如描述于美國(guó)專利4,962,022和5,498,523公開(kāi)的那些雙脫氧測(cè)序方法。試劑盒另一方面,本發(fā)明提供可以和本發(fā)明一起使用的試劑盒。根據(jù)本發(fā)明此方面的試劑盒可以包含一或多個(gè)容器,這些容器可以含有選自下組的一或多個(gè)成分一或多個(gè)本發(fā)明的核酸分子或載體、本發(fā)明分子和/或化合物、本發(fā)明支持物、一或多個(gè)聚合酶、一或多個(gè)逆轉(zhuǎn)錄酶、一或多個(gè)重組蛋白(或其它實(shí)施本發(fā)明方法的酶)、一或多個(gè)緩沖液、一或多個(gè)去污劑、一或多個(gè)限制性內(nèi)切酶、一或多個(gè)核苷酸、一或多個(gè)終止劑(例如ddNTP)、一或多個(gè)轉(zhuǎn)染試劑、焦磷酸酶等。多種本發(fā)明核酸分子或載體可以和本發(fā)明一起使用。而且,由于本發(fā)明的模塊性(modularity),這些核酸分子和載體可以以廣泛多種方式組合。可以在本發(fā)明試劑盒中提供的核酸分子的例子包括含有以下序列的核酸分子啟動(dòng)子、信號(hào)肽、增強(qiáng)子、阻遏基因(repressor)、選擇標(biāo)記、轉(zhuǎn)錄信號(hào)、翻譯信號(hào)、引物雜交位點(diǎn)(例如用于測(cè)序或PCR的)、重組位點(diǎn)、限制性位點(diǎn)和多聚接頭、在抑制型tRNA存在時(shí)抑制翻譯終止的位點(diǎn)、抑制型tRNA編碼序列、編碼用于制備融合蛋白的域和/或區(qū)(例如6His標(biāo)簽)的序列、復(fù)制起點(diǎn)、端粒、著絲粒等。類似地,可以在本發(fā)明試劑盒中提供文庫(kù)。這些文庫(kù)可以是可復(fù)制核酸分子形式的,或它們可以包含與復(fù)制起點(diǎn)無(wú)關(guān)的核酸分子。正如本領(lǐng)域技術(shù)人員明了的,與復(fù)制起點(diǎn)無(wú)關(guān)的文庫(kù)核酸分子、以及其它核酸分子,可以被插入含有復(fù)制起點(diǎn)的其它核酸分子中,或是一次性試劑盒成分。而且,在一些實(shí)施方案中,本發(fā)明試劑盒中提供的文庫(kù)可以包含兩個(gè)成分(1)這些文庫(kù)的核酸分子和(2)5’和/或3’重組位點(diǎn)。在一些實(shí)施方案中,當(dāng)提供的文庫(kù)核酸分子具有5’和/或3’重組位點(diǎn)時(shí),可以使用重組反應(yīng)將這些分子插入載體中,這些載體也可以作為試劑盒成分提供。在其它實(shí)施方案中,可以在使用前將重組位點(diǎn)附著在文庫(kù)核酸分子上(例如通過(guò)使用連接酶,該連接酶也可以和試劑盒一起提供)。在此情況下,本試劑盒可以提供含有重組位點(diǎn)的核酸分子或可以用于產(chǎn)生重組位點(diǎn)的引物。本發(fā)明試劑盒提供的載體可以有極大的不同。在大多數(shù)情況下,這些載體將含有復(fù)制起點(diǎn),至少一個(gè)選擇標(biāo)記、和至少一個(gè)重組位點(diǎn)。例如,本發(fā)明試劑盒中提供的載體可以具有允許在兩個(gè)不同的位置處插入核酸分子的4個(gè)不同的重組位點(diǎn)。圖16示意顯示了此類載體。本文其它地方對(duì)本發(fā)明試劑盒提供的載體的其它屬性進(jìn)行了描述。本發(fā)明試劑盒還可以與引物一起提供。這些引物一般設(shè)計(jì)與具有特定核苷酸序列的分子退火。例如,這些引物可以設(shè)計(jì)用于PCR中擴(kuò)增特定的核酸分子。而且,本發(fā)明試劑盒提供的引物可以是設(shè)計(jì)與載體序列雜交的測(cè)序引物。因此,該引物一般作為試劑盒的一部分提供用于測(cè)定插入載體的核酸分子的序列。本發(fā)明試劑盒中可以提供一或多個(gè)緩沖液(例如1、2、3、4、5、8、10、15)。這些緩沖液可以按工作濃度提供,或可以按濃縮形式提供然后稀釋為工作濃度。這些緩沖液通常將含有鹽、金屬離子、輔因子、金屬離子螯合劑等,用于增強(qiáng)緩沖液本身或緩沖液中分子的穩(wěn)定活性。而且,可以以干燥形式或含水形式提供這些緩沖液。適用于本發(fā)明的支持物(例如固體支持物、半固體支持物、珠粒、多孔管等,以上作了更詳細(xì)的描述)也可以和本發(fā)明試劑盒一起提供。圖10-13顯示了支持物在本發(fā)明方法中的示例性用途。本發(fā)明試劑盒實(shí)際上可以含有上述或本文其它地方描述的各種成分的任何組合。本領(lǐng)域技術(shù)人員將明了,與本發(fā)明試劑盒一起提供的成分根據(jù)試劑盒的預(yù)期用途將有不同。因此,可以對(duì)試劑盒進(jìn)行設(shè)計(jì)以發(fā)揮本申請(qǐng)所述的各種功能,而且這些試劑盒的成分將由此改變。相關(guān)領(lǐng)域普通技術(shù)人員將明了,依據(jù)普通技術(shù)人員已知的知識(shí)從本文所包含的本發(fā)明描述出發(fā),本文所述方法和應(yīng)用的其它適合修改和改變將是十分明了的,而且可以進(jìn)行實(shí)施而不偏離本發(fā)明范圍或它的任何實(shí)施方案。目前我們已詳細(xì)描述了本發(fā)明,通過(guò)參考以下實(shí)施例可以更清楚地理解本發(fā)明,這些實(shí)施例僅為了舉例說(shuō)明的目而被包括在內(nèi),它們并不旨在限制本發(fā)明。1995年6月7日提交的美國(guó)申請(qǐng)08/486,139(現(xiàn)已放棄)、1996年6月7日提交的美國(guó)申請(qǐng)08/663,002(現(xiàn)在的美國(guó)專利5,888,732)、1999年1月12日提交的美國(guó)申請(qǐng)09/233,492、2000年11月7日頒布的美國(guó)專利6,143,557、1997年10月24日提交的美國(guó)申請(qǐng)66/065,930、1998年10月23日提交的美國(guó)申請(qǐng)09/177,387、1999年4月24日美國(guó)申請(qǐng)09/296,280、1999年4月24日提交的美國(guó)申請(qǐng)09/296,281、1998年11月13日提交的美國(guó)申請(qǐng)66/108,324、1999年11月12日提交的美國(guó)申請(qǐng)09/438,358、2000年10月25日提交的美國(guó)申請(qǐng)09/695,065、1999年11月2日提交的美國(guó)申請(qǐng)09/432,085、1999年3月2日提交的美國(guó)申請(qǐng)60/122,389、1999年3月23日提交的美國(guó)申請(qǐng)60/126,049、1999年5月28日提交的美國(guó)申請(qǐng)60/136,744、1999年3月2日提交的美國(guó)申請(qǐng)60/122,392、和1999年10月25日提交的美國(guó)申請(qǐng)60/161,403,所有這些的完整公開(kāi)并入本文作為參考。實(shí)施例實(shí)施例1使用LR反應(yīng)同時(shí)克隆兩個(gè)核酸區(qū)段可以使用本發(fā)明方法在單個(gè)反應(yīng)中克隆兩個(gè)核酸區(qū)段。本發(fā)明方法可以包含以下步驟提供側(cè)翼有第一和第二重組位點(diǎn)的第一核酸區(qū)段、提供側(cè)翼有第三和第四重組位點(diǎn)的第二核酸區(qū)段,其中該第一或第二重組位點(diǎn)能夠和第三或第四重組位點(diǎn)重組,實(shí)施重組反應(yīng)反應(yīng)以便使這兩個(gè)核酸區(qū)段重組為單個(gè)核酸分子,并克隆該單個(gè)核酸分子。參考圖2,可以提供側(cè)翼有重組位點(diǎn)的兩個(gè)核酸區(qū)段。本領(lǐng)域技術(shù)人員將明了,這些核酸區(qū)段可以作為不連續(xù)的片段或作為大核酸分子的一部分來(lái)提供,并可以是環(huán)狀并任選地是超螺旋或線性。可以對(duì)這些位點(diǎn)進(jìn)行選擇,以便一對(duì)反應(yīng)性位點(diǎn)的一個(gè)成員位于這兩個(gè)區(qū)段的每個(gè)的側(cè)翼。“反應(yīng)性位點(diǎn)對(duì)”是指在適當(dāng)酶和輔因子存在時(shí)能夠重組的兩個(gè)重組位點(diǎn)。例如,在一些優(yōu)選實(shí)施方案中,一個(gè)核酸分子可以包含attR位點(diǎn),而另一個(gè)包含與attR位點(diǎn)反應(yīng)的attL位點(diǎn)。由于LR反應(yīng)的產(chǎn)物是兩個(gè)分子,其中一個(gè)包含attB位點(diǎn)而一個(gè)包含attP位點(diǎn),因此可以對(duì)起始attL和attR位點(diǎn)的取向進(jìn)行安排,以便接合后這兩個(gè)起始核酸區(qū)段可以被包含attB位點(diǎn)或attP位點(diǎn)的核酸序列分隔開(kāi)。在一些優(yōu)選實(shí)施方案中,可以對(duì)這些位點(diǎn)進(jìn)行安排,以便在重組反應(yīng)后這兩個(gè)起始核酸區(qū)段被attB位點(diǎn)分隔開(kāi)。在其它優(yōu)選實(shí)施方案中,可以使用來(lái)自其它重組系統(tǒng)的重組位點(diǎn)。例如,在一起實(shí)施方案中,一或多個(gè)重組位點(diǎn)可以是lox位點(diǎn)或衍生物。在一些優(yōu)選實(shí)施方案中,來(lái)自一個(gè)以上重組系統(tǒng)的重組位點(diǎn)可以用于相同的結(jié)構(gòu)中。例如,一或多個(gè)重組位點(diǎn)可以是att位點(diǎn),而其它可以是lox位點(diǎn)。來(lái)自不同重組系統(tǒng)的位點(diǎn)的各種組合是本領(lǐng)域技術(shù)人員已知的,并且這些組合被認(rèn)為是在本發(fā)明范圍內(nèi)。正如圖2所示,核酸區(qū)段A(DNA-A)的側(cè)翼可以是具有獨(dú)特特異性的重組位點(diǎn),例如attL1和attL3位點(diǎn),而核酸區(qū)段B(DNA-B)的側(cè)翼可以是重組位點(diǎn)attR3和attL2。為了舉例說(shuō)明的目的,這些區(qū)段標(biāo)示為DNA。這不應(yīng)理解為將用于實(shí)施本發(fā)明的核酸限制為DNA而排除了其它核酸。此外,在此和之后的實(shí)施方案中,重組位點(diǎn)的設(shè)計(jì)僅旨在使所用重組位點(diǎn)具有不同的特異性并不應(yīng)理解為將本發(fā)明限制在使用具體引用的位點(diǎn)上。本領(lǐng)域技術(shù)人員能夠容易地將具體舉例說(shuō)明的位點(diǎn)對(duì)替換為其它位點(diǎn)對(duì)。attR3和attL3位點(diǎn)包含一個(gè)反應(yīng)性位點(diǎn)對(duì)??梢允褂闷渌?dú)特重組位點(diǎn)對(duì)放置在核酸區(qū)段側(cè)翼。例如,可以使用lox位點(diǎn)作為一反應(yīng)對(duì),而另一反應(yīng)對(duì)可以是att位點(diǎn),并將適當(dāng)?shù)闹亟M蛋白包括在該反應(yīng)中。同樣地,以上討論的重組位點(diǎn)可以按各種組合進(jìn)行使用。在此實(shí)施方案中,關(guān)鍵性的性質(zhì)只有位于各區(qū)段側(cè)翼的重組位點(diǎn)的性質(zhì)、反應(yīng)性位點(diǎn)對(duì)的一個(gè)成員(在此實(shí)施例中是LR對(duì)L3和R3)存在在一個(gè)核酸區(qū)段上,而反應(yīng)性對(duì)的另一成員存在于另一核酸區(qū)段上。可以將這兩個(gè)區(qū)段和適當(dāng)?shù)拿讣澳康妮d體接觸。目的載體包含側(cè)翼有兩個(gè)重組位點(diǎn)的適當(dāng)選擇標(biāo)記。在一些實(shí)施方案中,該選擇標(biāo)記可以是負(fù)選擇標(biāo)記(例如毒性基因如ccdB)。目的載體中的一個(gè)位點(diǎn)將與這些核酸區(qū)段之一上存在的一個(gè)位點(diǎn)相容,而目的載體中存在的另一位點(diǎn)的相容位點(diǎn)位于另一核酸區(qū)段上。在這兩個(gè)起始核酸區(qū)段之間不發(fā)生重組的情況下,起始核酸區(qū)段均不具有與目的載體中兩個(gè)位點(diǎn)相容的重組位點(diǎn)。因此,沒(méi)有一個(gè)起始核酸區(qū)段可以替換目的載體中存在的選擇標(biāo)記??梢栽诩s25℃孵育反應(yīng)混合物約60分鐘至約16小時(shí)。將反應(yīng)混合物的全部或部分用于轉(zhuǎn)化感受態(tài)微生物并篩選存在期望產(chǎn)物的微生物。在一些實(shí)施方案中,目的載體包含負(fù)選擇標(biāo)記,而轉(zhuǎn)化的微生物對(duì)目的載體上存在的負(fù)選擇標(biāo)記是敏感的。在允許進(jìn)行負(fù)選擇的條件下培養(yǎng)轉(zhuǎn)化的微生物,以便除去未含有期望重組產(chǎn)物的微生物。圖2中,所獲期望產(chǎn)物由被attB3位點(diǎn)分隔開(kāi)的、克隆在目的載體主鏈中的DNA-A和DNA-B組成。在本實(shí)施方案中,可以使用同類反應(yīng)(即LR反應(yīng))將兩個(gè)片段組合起來(lái)并將組合在一起的片段插入目的載體中。在一些實(shí)施方案中,可能不必控制一或多個(gè)核酸區(qū)段的取向并且可以將具有相同特異性的重組位點(diǎn)用在區(qū)段的兩個(gè)末端。參考圖2,如果區(qū)段A相對(duì)區(qū)段B的取向不是關(guān)鍵的,則可以將L1位點(diǎn)以反向重復(fù)的取向放置在區(qū)段A兩個(gè)末端的側(cè)翼,待與區(qū)段A接合的區(qū)段B末端可以具有R1位點(diǎn)。在區(qū)段A和B之間形成組合文庫(kù)的過(guò)程中,這可能對(duì)于產(chǎn)生額外的復(fù)雜性是有用的。即,區(qū)段可以以各種取向進(jìn)行接合,而且如果接合的一或兩個(gè)區(qū)段可以來(lái)源于一個(gè)文庫(kù),則根據(jù)本發(fā)明可以構(gòu)建包含隨機(jī)取向的雜合分子的新群體或文庫(kù)。盡管,在本實(shí)施例中,兩個(gè)起始區(qū)段間的重組顯示發(fā)生在和目的載體的重組反應(yīng)前,但重組反應(yīng)的次序并不重要。因此,在一些實(shí)施方案中,可能期望在這些區(qū)段間實(shí)施重組反應(yīng)并分離組合的區(qū)段??梢灾苯拥厥褂眠@些組合的區(qū)段,例如可以對(duì)其進(jìn)行擴(kuò)增、測(cè)序或?qū)⑵溆米骶€性表達(dá)元件,參見(jiàn)Sykes等(NatureBiotechnology17355-359,1999)。在一些實(shí)施方案中,可以按Tawfik等(NatureBiotechology16652-656,1998)所述方法包裹這些接合的區(qū)段,并隨后測(cè)試了一或多個(gè)期望性質(zhì)。在一些實(shí)施方案中,可以將該組合的區(qū)段用于體外表達(dá)RNA,例如將T7啟動(dòng)子或SP6啟動(dòng)子等啟動(dòng)子包括在其中一個(gè)區(qū)段上。該體外表達(dá)的RNA可以任選地在體外翻譯系統(tǒng)如兔網(wǎng)織紅細(xì)胞裂解物中翻譯。任選地,該接合區(qū)段可以進(jìn)一步與目的載體反應(yīng),導(dǎo)致該組合區(qū)段插入載體中。在一些情況下,可能期望分離包含其中一個(gè)區(qū)段和載體的中間物。對(duì)于將這些區(qū)段插入載體中,將兩個(gè)區(qū)段接合起來(lái)的重組反應(yīng)發(fā)生在區(qū)段和目的載體之間的重組反應(yīng)之前或之后并不是實(shí)施本發(fā)明所關(guān)鍵的。根據(jù)本發(fā)明,優(yōu)選進(jìn)行所有三個(gè)重組反應(yīng)(即,區(qū)段A和目的載體之間的反應(yīng)、區(qū)段B和目的載體之間的反應(yīng)、以及區(qū)段A和區(qū)段B之間的反應(yīng)),以便產(chǎn)生在其中兩個(gè)起始核酸區(qū)段現(xiàn)接合為一個(gè)單一分子的核酸分子。在一些實(shí)施方案中,可以選擇重組位點(diǎn)以便在插入載體后位于接合區(qū)段側(cè)翼的重組位點(diǎn)形成一對(duì)反應(yīng)性位點(diǎn)而該接合區(qū)段可以通過(guò)該側(cè)翼位點(diǎn)和適當(dāng)重組蛋白的反應(yīng)從載體中切除。參考圖2,如果用L1位點(diǎn)按相對(duì)區(qū)段B相反的方面替代區(qū)段B上的L2位點(diǎn)(即框的長(zhǎng)段,指示重組位點(diǎn)與該區(qū)段不相鄰)并用R1位點(diǎn)按相反方向替代載體中的R2位點(diǎn),則重組反應(yīng)將在載體中產(chǎn)生attP1位點(diǎn)。然后該attP1位點(diǎn)能夠和接合區(qū)段另一末端上的attB1位點(diǎn)反應(yīng)。因此,可以使用適合于BP反應(yīng)的重組蛋白切除該接合區(qū)段。本發(fā)明此實(shí)施方案尤其適合于構(gòu)建組合文庫(kù)。在一些優(yōu)選實(shí)施方案中,圖2的每個(gè)核酸區(qū)段都可以表示文庫(kù),每個(gè)文庫(kù)都可以具有待篩選的已知或未知核酸序列。在一些實(shí)施方案中,其中一或多個(gè)區(qū)段可以具有編碼指定肽、多肽或蛋白質(zhì)氨基酸序列的一或多種排列的序列。在一些實(shí)施方案中,每個(gè)區(qū)段都可以具有編碼蛋白質(zhì)域或編碼代表蛋白質(zhì)域序列各種排列的文庫(kù)的序列。例如,一個(gè)區(qū)段可以代表突變形式抗體輕鏈可變區(qū)文庫(kù),而另一區(qū)段可以代表突變形式抗體重鏈文庫(kù)。因此,重組將產(chǎn)生一群分子(例如抗體、單鏈抗原結(jié)合蛋白等),每個(gè)分子均潛在地含有獨(dú)特的序列組合因此也具有獨(dú)特的結(jié)合特異性。在其它優(yōu)選實(shí)施方案中,其中一個(gè)區(qū)段可以代表單個(gè)核酸序列,而另一個(gè)代表文庫(kù)。重組結(jié)果是一群序列,其中所有序列均具有一個(gè)共同部分而在另一部分是可變的。此類實(shí)施方案對(duì)于制備融合結(jié)構(gòu)文庫(kù)是有用的。例如,DNA-A可以包含一個(gè)指導(dǎo)表達(dá)的調(diào)節(jié)序列(即啟動(dòng)子)和一個(gè)編碼純化標(biāo)簽的序列。適當(dāng)?shù)募兓瘶?biāo)簽包括,但不限于,谷胱苷肽S轉(zhuǎn)移酶(GST)、麥芽糖結(jié)合蛋白(MBP)、表位、確定的氨基酸序列如表位、半抗原、6組氨酸(HIS6)等。DNA-B可以包括目的蛋白突變形式的文庫(kù)。可以測(cè)定所獲結(jié)構(gòu)的期望特性如酶活性或配體結(jié)合?;蛘?,DNA-B可以包含所獲融合分子的共同部分。在一個(gè)實(shí)施方案中,上述方法可以用于促進(jìn)啟動(dòng)子區(qū)或轉(zhuǎn)錄終止信號(hào)分別與結(jié)構(gòu)基因的5’末端或3’末端融合,產(chǎn)生例如通過(guò)在結(jié)構(gòu)基因上添加組織特異性啟動(dòng)子以設(shè)計(jì)用于在不同細(xì)胞背景中表達(dá)的表達(dá)盒。在一些實(shí)施方案中,其中一或多個(gè)區(qū)段可以是編碼隨機(jī)肽文庫(kù)成員的序列。該方法可以用于例如制備一群具有某種期望特性的分子。例如,一個(gè)區(qū)段可以含有編碼DNA結(jié)合域的序列,而另一個(gè)區(qū)段代表隨機(jī)肽文庫(kù)。可以就調(diào)節(jié)目的靶基因表達(dá)的能力對(duì)所獲群體進(jìn)行篩選。在其它實(shí)施方案中,兩個(gè)區(qū)段均可以是編碼隨機(jī)蛋白文庫(kù)成員的序列,并且可以測(cè)定所獲合成蛋白(例如融合蛋白)是否具有任何期望特性,例如與特定配體或受體結(jié)合或具有某種酶活性。這些核酸區(qū)段不必編碼氨基酸序列。例如,這兩個(gè)區(qū)段均可以指導(dǎo)不翻譯成蛋白質(zhì)的RNA分子的轉(zhuǎn)錄。這對(duì)于構(gòu)建tRNA分子、核酶和反義分子是有用的?;蛘?,一個(gè)區(qū)段可以指導(dǎo)非翻譯RNA分子的轉(zhuǎn)錄而另一個(gè)編碼蛋白質(zhì)。例如,DNA-A可以指導(dǎo)增強(qiáng)蛋白質(zhì)表達(dá)的非翻譯前導(dǎo)序列(例如腦心肌炎病毒前導(dǎo)序列(EMC前導(dǎo)序列))的轉(zhuǎn)錄,而DNA-B編碼目的肽、多肽或蛋白質(zhì)。在一些實(shí)施方案中,包含前導(dǎo)序列的區(qū)段還可以包含編碼氨基酸序列的序列。例如,DNA-A可以具有相應(yīng)于EMC前導(dǎo)序列的核酸序列以及一個(gè)純化標(biāo)簽,而DNA-B具有編碼目的肽、多肽或蛋白質(zhì)的核酸序列。上述方法對(duì)于制備單鏈抗原結(jié)合蛋白組合文庫(kù)是尤其有用的。制備單鏈抗原結(jié)合蛋白的方法是本領(lǐng)域已知的(見(jiàn)例如PCT公開(kāi)文本W(wǎng)O94/07921,該完整公開(kāi)并入本文作為參考)。使用圖6所示結(jié)構(gòu)進(jìn)行舉例說(shuō)明,DNA-A可以編碼例如突變形式的抗體輕鏈可變區(qū),而DNA-B可編碼例如突變形式的抗體輕鏈可變區(qū)。另外,DNA-A和DNA-B之間的間隔核酸可編碼連接輕鏈和重鏈的肽接頭。然后可以對(duì)表達(dá)單鏈抗原結(jié)合蛋白的細(xì)胞進(jìn)行篩選以鑒定可產(chǎn)生結(jié)合特定抗原的分子的細(xì)胞。上述方法可以有許多變體。例如,不使用圖6所示結(jié)構(gòu),可以使用如圖2所示的結(jié)構(gòu),并將接頭肽編碼區(qū)嵌在重組位點(diǎn)內(nèi)。這是上述內(nèi)含功能的重組位點(diǎn)的一個(gè)例子。作為另一例子,也可以制備由兩條抗體輕鏈和兩條抗體重鏈組成的單鏈抗原結(jié)合蛋白。可以對(duì)這些單鏈抗原結(jié)合蛋白進(jìn)行設(shè)計(jì)以便相連形成多價(jià)抗原結(jié)合復(fù)合物。再使用圖2所示結(jié)構(gòu)舉例說(shuō)明,DNA-A和DNA-B均可以編碼例如突變形式的抗體輕鏈可變區(qū)。在相似載體的相同位點(diǎn)或在設(shè)計(jì)用于插入4個(gè)核酸插入片段的載體的另一位點(diǎn)上,DNA-A和DNA-B均可以編碼例如突變形式的抗體重鏈可變區(qū)。然后可以篩選表達(dá)兩個(gè)單鏈抗原結(jié)合蛋白的細(xì)胞,以鑒定例如可產(chǎn)生具有針對(duì)特定抗原的特異性的多價(jià)抗原結(jié)合復(fù)合物的細(xì)胞。因此,本發(fā)明方法可以用于例如制備和篩選組合文庫(kù)以鑒定產(chǎn)生對(duì)特定表位具有特異性的抗原結(jié)合蛋白(例如抗體和/或包含重鏈可變區(qū)或輕鏈可變區(qū)的抗體片段或抗體片段復(fù)合物)的細(xì)胞。本發(fā)明也包括用于制備抗原結(jié)合蛋白的方法、和通過(guò)本發(fā)明方法制備的抗原結(jié)合蛋白。實(shí)施例2使用LR反應(yīng)同時(shí)克隆兩個(gè)核酸片段以將這些區(qū)段接合起來(lái)并使用BP反應(yīng)將這些區(qū)段插入載體中正如圖3所示,側(cè)翼有attB重組位點(diǎn)和attL重組位點(diǎn)的第一核酸區(qū)段可以和側(cè)翼有與第一核酸區(qū)段上的attL位點(diǎn)相容的attR重組位點(diǎn)以及可以與第一區(qū)段上attB位點(diǎn)相同或不同的attB位點(diǎn)的第二核酸區(qū)段接合。圖3顯示了兩個(gè)attB位點(diǎn)不同的實(shí)施方案。這兩個(gè)區(qū)段可以在BP反應(yīng)中和含有attP位點(diǎn)的載體接觸。隨后的LR反應(yīng)將產(chǎn)生由被attP位點(diǎn)或attB位點(diǎn)(LR反應(yīng)的產(chǎn)物)分開(kāi)的DNA-A和DNA-B組成的、克隆在載體主鏈中的產(chǎn)物。在圖3所示實(shí)施方案中,attL和attR位點(diǎn)按一定方式排列以致重組后這兩個(gè)區(qū)段間產(chǎn)生一個(gè)attP位點(diǎn)。在優(yōu)選實(shí)施方案中,重組后,這兩個(gè)區(qū)段可以被attB位點(diǎn)分開(kāi)。本領(lǐng)域技術(shù)人員無(wú)需繁瑣實(shí)驗(yàn)即可以容易地優(yōu)化用于實(shí)施上述反應(yīng)的條件。在一個(gè)典型反應(yīng)中,可以將約50ng至約100ng載體和待克隆的片段在適當(dāng)反應(yīng)條件下接觸。每個(gè)片段可以以約25∶1至約1∶25的載體∶片段摩爾比存在。在一些實(shí)施方案中,其中一或多個(gè)片段可以以約10∶1至1∶10的載體∶片段摩爾比存在。在一個(gè)優(yōu)選實(shí)施方案中,每個(gè)片段可以以約1∶1的載體∶片段摩爾比存在。典型地,可以將核酸溶解在水性緩沖液中然后加入反應(yīng)混合物。一組適當(dāng)?shù)臈l件是4μlCLONASETM酶混合物(例如InvitrogenCorp.,LifeTechnologiesDivision,Catl.Nos.11791-091和11789-013)、4μl5×反應(yīng)緩沖液和核酸及水,至終體積20μl。這典型地導(dǎo)致在20μlBP反應(yīng)中包括約200ngInt和約80ngIHF,而在20μlLR反應(yīng)中包括約150ngInt、約25ngIHF和30ngXis。在一些優(yōu)選實(shí)施方案中,尤其是attL位點(diǎn)和attR位點(diǎn)重組的那些實(shí)施方案中,終反應(yīng)混合物可以包括約50mMTrisHCl(pH7.5)、約1mMEDTA、約1mg/mlBSA、約75mMNaCl和約7.5mM亞精胺以及重組酶和待組合的核酸。在其它優(yōu)選實(shí)施方案中,尤其是attB位點(diǎn)和attP位點(diǎn)重組的那些實(shí)施方案中,終反應(yīng)混合物可以包括約25mMTrisHCl(pH7.5)、約5mMEDTA、約1mg/ml牛血清白蛋白(BSA)、約22mMNaCl和約5mM亞精胺。當(dāng)期望進(jìn)行BP和LR反應(yīng)而在之間不進(jìn)行核酸純化時(shí),首先可以進(jìn)行BP反應(yīng),然后通過(guò)加入LRCLONASETM酶和濃NaCl將反應(yīng)條件調(diào)節(jié)至約50mMNaCl、約3.8mM亞精胺、約3.4mMEDTA和約0.7mg/ml牛血清白蛋白(BSA)。可以在適當(dāng)?shù)臏囟认吕?2℃孵育反應(yīng)溶液約60分鐘至16小時(shí)。重組反應(yīng)后,該溶液可以用于轉(zhuǎn)化感受態(tài)宿主細(xì)胞并按上述篩選宿主細(xì)胞。以下是“單管”反應(yīng)實(shí)驗(yàn)方案的一個(gè)例子,該實(shí)驗(yàn)方案可以促進(jìn)PCR產(chǎn)物在一個(gè)單一試管內(nèi)發(fā)生的兩步驟反應(yīng)中直接轉(zhuǎn)移至表達(dá)克隆上。該實(shí)驗(yàn)方案也可以用于將基因從一個(gè)表達(dá)克隆質(zhì)粒主鏈轉(zhuǎn)移至另一個(gè)。首先在質(zhì)粒主鏈內(nèi)線性化該表達(dá)克隆,以便獲得BP反應(yīng)的最佳拓?fù)浣Y(jié)構(gòu)并消除由于共轉(zhuǎn)化導(dǎo)致的假陽(yáng)性集落。使用以下成分在1.5ml管中制備25μlBP反應(yīng)混合物attBDNA(100-200ng)1-12.5μlattPDNA(pDONR201)150ng/μl2.5μlBP反應(yīng)緩沖液5.0μlTE至20μlBPClonase5.0μl總體積25μl混合試管中內(nèi)容物并25℃孵育4小時(shí)、或更長(zhǎng)。如果從含有GATEWAYTMpDONR或pDEST載體上的選擇標(biāo)記(Kanr或ampr)的質(zhì)粒模板擴(kuò)增PCR產(chǎn)物,則可以用限制性內(nèi)切酶DpnI處理該P(yáng)CR產(chǎn)物以降解該質(zhì)粒。這些質(zhì)粒是轉(zhuǎn)化GATEWAYTM反應(yīng)物時(shí)假陽(yáng)性菌落的潛在來(lái)源。而且,當(dāng)用于PCR的模板或起始表達(dá)克隆具有和終目的載體相同的選擇標(biāo)記(例如ampr)時(shí),鋪在含有100μg/ml氨芐青霉素的LB平板上可以測(cè)定延續(xù)至LR反應(yīng)步驟的假陽(yáng)性菌落數(shù)量。將5μl反應(yīng)混合物轉(zhuǎn)移至加有0.5μl蛋白酶K溶液的不同管中。然后37℃孵育該管10分鐘。然后用1-2μl混合物轉(zhuǎn)化100μl感受態(tài)細(xì)胞,并鋪在含有50μg/ml卡那霉素的LB平板上。這就產(chǎn)生可以用于分離單個(gè)進(jìn)入克隆和用于評(píng)價(jià)BP反應(yīng)效率的菌落。將以下成分加入上述剩余的20μlBP反應(yīng)物中NaCl0.75M1μl目的載體150ng/μl3μlLRClonase6μl總體積30μl然后25℃孵育混合物2小時(shí),之后加入3μl蛋白酶K溶液,37℃再孵育10分鐘。然后使用1-2μl該混合物轉(zhuǎn)化100μl感受態(tài)細(xì)胞,然后將細(xì)胞鋪在含有100μg/ml氨芐青霉素的LB平板上。實(shí)施例3通過(guò)在BP反應(yīng)和隨后的LR反應(yīng)中將attB位點(diǎn)轉(zhuǎn)變?yōu)橐粚?duì)反應(yīng)性位點(diǎn)attL和attR,使用片段克隆PCR產(chǎn)物使用與實(shí)施例2所示相似的策略重組兩個(gè)PCR產(chǎn)物然后同時(shí)將它們克隆在載體主鏈中。由于attL和attR位點(diǎn)分別長(zhǎng)100和125個(gè)堿基對(duì),而且因?yàn)閍ttB位點(diǎn)長(zhǎng)25個(gè)堿基對(duì),因此可能期望將attB位點(diǎn)摻入PCR引物中。根據(jù)attB相對(duì)于轉(zhuǎn)移的核酸區(qū)段的取向,可以通過(guò)BP反應(yīng)將attB位點(diǎn)轉(zhuǎn)變?yōu)閍ttL或attR位點(diǎn)。因此,attB位點(diǎn)在attBPCR引物中的取向決定了attB位點(diǎn)是轉(zhuǎn)變成attL還是attR。這就使該GATEWAYTM系統(tǒng)和本發(fā)明方法可以極為靈活地使用多種具有獨(dú)特特異性的att位點(diǎn)。正如圖4所示,由側(cè)翼有具有不同特異性的突變attB位點(diǎn)(例如attB1和attB3)的區(qū)段A、和側(cè)翼有具有不同特異性的突變attB位點(diǎn)的區(qū)段B組成的兩個(gè)區(qū)段(例如PCR產(chǎn)物),其中區(qū)段A上的一個(gè)attB位點(diǎn)與區(qū)段B上的一個(gè)attB位點(diǎn)相同(例如區(qū)段B可以含有attB3和attB2位點(diǎn)),可以將這兩個(gè)區(qū)段接合起來(lái)并插入載體中。這些區(qū)段可以單獨(dú)地或一起和含有兩個(gè)attP位點(diǎn)的載體在BP反應(yīng)中發(fā)生反應(yīng)?;蛘撸@些attP位點(diǎn)可以存在于線性區(qū)段上。一個(gè)載體含有與區(qū)段A上存在的attB位點(diǎn)相容的attP位點(diǎn)(例如attP1和attP3位點(diǎn))。另一載體含有與區(qū)段B上存在的attB位點(diǎn)相容的attP位點(diǎn)(例如attP3和attP2位點(diǎn))。當(dāng)使用線性區(qū)段提供attP位點(diǎn)時(shí),每個(gè)attP位點(diǎn)均可以在區(qū)段上提供。attB3和attP3位點(diǎn)有一定取向以致在DNA-B區(qū)段的5’末端產(chǎn)生attR3位點(diǎn),而在區(qū)段A的3’末端產(chǎn)生attL3位點(diǎn)。將所獲進(jìn)入克隆與目的載體在隨后的LR反應(yīng)中混合以產(chǎn)生由被attB3位點(diǎn)分開(kāi)的DNA-A和DNA-B組成的、克隆在目的載體主鏈中的產(chǎn)物。我們已使用此基本方案連接了兩個(gè)區(qū)段,即與attR3-片段B-attL2進(jìn)入克隆反應(yīng)的attL1片段-A-attL3進(jìn)入克隆,并將該連接的片段插入目的載體中。為了制備適當(dāng)?shù)倪M(jìn)入克隆,我們構(gòu)建了由attP1-ccdB-attP3和attP3R-ccdB-attP2組成的兩個(gè)attP供體載體,以便它們能夠和適當(dāng)?shù)腶ttBPCR產(chǎn)物反應(yīng)以將attB位點(diǎn)轉(zhuǎn)化為attL和attR位點(diǎn)。名稱attP3R用于指attP3位點(diǎn)具有一定取向,以致與具有關(guān)連attB位點(diǎn)的DNA區(qū)段反應(yīng)可以導(dǎo)致在該區(qū)段上產(chǎn)生attR位點(diǎn)。圖4對(duì)此作了示意性表示,與區(qū)段A相比區(qū)段B上attB3的打點(diǎn)部分和劃線部分具有相反取向。在區(qū)段B上打點(diǎn)部分鄰近區(qū)段,而區(qū)段A上劃線部分鄰近區(qū)段。通過(guò)構(gòu)建以下DNA區(qū)段舉例說(shuō)明該方法,在該DNA區(qū)段中四環(huán)素抗性基因(tet)與β半乳糖苷酶基因重組以致這兩個(gè)基因在產(chǎn)物中被attB位點(diǎn)分隔開(kāi)。用5’-attB1和3’-attB3末端PCR擴(kuò)增該tet基因。用5’-attB3R和3’-attB3末端PCR擴(kuò)增lacZ基因。用聚乙二醇(PEG)沉淀這兩個(gè)PCR產(chǎn)物。使用標(biāo)準(zhǔn)操作將B1-tet-B3PCR產(chǎn)物和attP1-ccdB-attP3供體載體混合并和BPCLONASETM反應(yīng),以產(chǎn)生attL1-tet-attL3進(jìn)入克隆。使用標(biāo)準(zhǔn)技術(shù)分離正確的tet進(jìn)入克隆并制備質(zhì)粒DNA。按相似方式,將attB3R-lacZ-attB2PCR產(chǎn)物和attP3R-ccdB-attP2供體載體混合并與BPCLONASETM反應(yīng)以產(chǎn)生attR3-lacz-attL2進(jìn)入克隆。為了將這兩個(gè)區(qū)段接合在單個(gè)載體中,在20μl反應(yīng)體積中制備含有以下成分的LRCLONASETM反應(yīng)物60ng(25fmoles)超螺旋tet進(jìn)入克隆;75ng(20fmoles)超螺旋lacZ進(jìn)入克??;150ng(35fmoles)用NcoI線性化的pDEST6(描述在PCT公開(kāi)文本W(wǎng)O00/52027中,完整的公開(kāi)并入本文作為參考);4μl反應(yīng)緩沖液和4μlLRCLONASETM。終反應(yīng)混合物含有51mMTris·HCl、1mMEDTA、1mg/mlBSA、76mMNaCl、7.5mM亞精胺、160ngInt、35ngIHF和35ngXis。25℃孵育該反應(yīng)物過(guò)夜,用2μl蛋白酶K溶液(2mg/ml)終止反應(yīng)。使用2μl試樣轉(zhuǎn)化100μl大腸桿菌DH5αLE細(xì)胞并鋪在含有氨芐青霉素和XGal的平板上。在與細(xì)胞的轉(zhuǎn)化混合物中產(chǎn)生約35,000個(gè)菌落,效率為1.6×108cfu/μgpUCDNA。所有菌落均表現(xiàn)出藍(lán)色,說(shuō)明存在lacZ基因。在含有四環(huán)素和XGal的平板上對(duì)24個(gè)菌落劃線。測(cè)試的所有菌落,24/24,均抵抗四環(huán)素。使用12個(gè)菌落接種2ml含有氨芐青霉素的LB培養(yǎng)液用于小量制備。12/12小量制備物含有正確長(zhǎng)度(7kb)的超螺旋質(zhì)粒。在一些實(shí)施方案中,正如圖5所示,可以使兩個(gè)區(qū)段和含有單一重組位點(diǎn)的載體反應(yīng),以便將區(qū)段上的其中一個(gè)重組位點(diǎn)轉(zhuǎn)變?yōu)椴煌闹亟M位點(diǎn)。在一些實(shí)施方案中,含有attB位點(diǎn)的區(qū)段可以和具有attP位點(diǎn)的靶載體反應(yīng)。例如,區(qū)段A和B可以一起或單獨(dú)地和具有attP3位點(diǎn)的載體反應(yīng),以便將區(qū)段上的attB3位點(diǎn)分別轉(zhuǎn)變?yōu)閍ttL3和attR3。這樣,這兩個(gè)區(qū)段間的隨后LR反應(yīng)就導(dǎo)致它們通過(guò)attB位點(diǎn)相接合??梢允褂煤衋ttP位點(diǎn)的載體,在重組反應(yīng)之前、同時(shí)或之后將這些區(qū)段接合起來(lái),以便轉(zhuǎn)變這些位點(diǎn)以產(chǎn)生由側(cè)翼有attL1和attL3的DNA-A和側(cè)翼有attR3和attL2的DNA-B組成的共合體分子。隨后的LR反應(yīng)將產(chǎn)生由attB3分隔開(kāi)的DNA-A和DNA-B組成的、克隆在載體主鏈中的產(chǎn)物克隆。在一些實(shí)施方案中,設(shè)計(jì)以便將用于連接這些區(qū)段的attB轉(zhuǎn)變?yōu)橐粚?duì)反應(yīng)性位點(diǎn)attL和attR的attP位點(diǎn)可以以較短區(qū)段(例如限制性片段、合成的寡核苷酸雙鏈、或PCR片段)的形式提供。在BP反應(yīng)中包含線性片段的反應(yīng)物可能要求較長(zhǎng)的孵育時(shí)間,例如孵育過(guò)夜。也可以單獨(dú)通過(guò)PCR將attB位點(diǎn)轉(zhuǎn)變?yōu)閍ttL或attR位點(diǎn)。含有attL或attR位點(diǎn)的PCR引物可以用于擴(kuò)增在末端具有attB位點(diǎn)的區(qū)段。由于attL和attR的序列含有attB位點(diǎn)序列的一部分,因此在此情況下attB位點(diǎn)充當(dāng)可以和attL或attRPCR引物退火的重疊區(qū)。退火的attL或attR引物向PCR產(chǎn)物末端的延伸將產(chǎn)生融合模板,使用與attL或attR位點(diǎn)末端退火的側(cè)翼引物該模板可以用于PCR擴(kuò)增全長(zhǎng)PCR產(chǎn)物。PCR反應(yīng)的引物可以以單鏈寡核苷酸形式提供。在一些優(yōu)選實(shí)施方案中,這些引物以雙鏈形式,例如作為PCR反應(yīng)產(chǎn)物提供以擴(kuò)增attL或attR位點(diǎn)。實(shí)施例4將兩個(gè)或更多個(gè)核酸片段克隆在同一載體的不同位置可以同時(shí)將兩個(gè)或更多個(gè)核酸片段克隆在具有多組重組位點(diǎn)的載體的不同區(qū)域,每組重組位點(diǎn)位于一個(gè)選擇標(biāo)記側(cè)翼。在一些實(shí)施方案中,其中的一或多個(gè)選擇標(biāo)記可以是負(fù)選擇標(biāo)記。正如圖6所示,可以作為不連續(xù)片段或作為較大核酸分子如質(zhì)粒的一部分存在的兩個(gè)核酸區(qū)段A和B,可以同時(shí)被克隆在同一目的載體中。側(cè)翼有彼此不相重組的重組位點(diǎn)(例如attL1和attL2)的核酸區(qū)段A(DNA-A)、和側(cè)翼有彼此不相重組并且不與區(qū)段A側(cè)翼的位點(diǎn)重組的重組位點(diǎn)(例如attL3和attL4)的核酸區(qū)段B(DNA-B),可以在一個(gè)LR反應(yīng)中和目的載體組合。該目的載體將含有兩對(duì)重組位點(diǎn),每一對(duì)均經(jīng)過(guò)選擇以和位于其中一個(gè)區(qū)段側(cè)翼的位點(diǎn)重組。作為一個(gè)例子,圖6顯示了各位于ccdB負(fù)選擇標(biāo)記側(cè)翼的兩對(duì)attR位點(diǎn)(attR1/attR2和attR3/attR4)。這三個(gè)核酸可以在一個(gè)單一的LR反應(yīng)中組合。所獲產(chǎn)物將由克隆在目的載體不同區(qū)域的側(cè)翼有attB位點(diǎn)對(duì)的DNA-A和DNA-B組成。正如圖7所示,使用BP反應(yīng)可以以類似方式將核酸區(qū)段插入載體中。例如,側(cè)翼有重組位點(diǎn)attB1和attB2的DNA-A可以和側(cè)翼有重組位點(diǎn)attB3和attB4的DNA-B及含有attP位點(diǎn)的載體在BP反應(yīng)中組合。所獲產(chǎn)物將由克隆在載體不同區(qū)域的attL位點(diǎn)對(duì)之間的DNA-A和DNA-B組成。在一些實(shí)施方案中,可能期望將區(qū)段連續(xù)地插入靶載體中并分離包含僅其中一個(gè)區(qū)段的中間分子。所有位點(diǎn)并不一定都來(lái)源于相同重組系統(tǒng)。例如,一個(gè)區(qū)段的側(cè)翼可以是lox位點(diǎn),而另一區(qū)段的側(cè)翼有att位點(diǎn)。一個(gè)區(qū)段可以在一末端具有l(wèi)ox位點(diǎn),而在另一末端具有att位點(diǎn)或在一個(gè)末端具有frt位點(diǎn)。本領(lǐng)域技術(shù)人員可以設(shè)想出各種位點(diǎn)組合,這些組合均在本發(fā)明范圍內(nèi)。在一些實(shí)施方案中,正如圖6和7所示,可能期望分離反應(yīng)的中間物。例如,可能期望分離具有僅其中一個(gè)插入?yún)^(qū)段的載體。該中間物可以就如此使用或可以充當(dāng)隨后重組反應(yīng)的底物以便插入第二個(gè)區(qū)段。在一些實(shí)施方案中,本發(fā)明是克隆n個(gè)核酸區(qū)段的方法,其中n是大于1的整數(shù),該方法包括步驟提供n個(gè)核酸區(qū)段,每個(gè)區(qū)段的側(cè)翼有兩個(gè)獨(dú)特的重組位點(diǎn);提供包含2n個(gè)重組位點(diǎn)的載體,其中2n重組位點(diǎn)的每個(gè)均能夠和其中一個(gè)核酸區(qū)段側(cè)翼的其中一個(gè)重組位點(diǎn)重組;實(shí)施重組反應(yīng),以便使該n個(gè)核酸區(qū)段重組入載體中,籍此克隆此n個(gè)核酸區(qū)段。在其它實(shí)施方案中,該載體包含n個(gè)拷貝的選擇標(biāo)記,每個(gè)拷貝的選擇標(biāo)記側(cè)翼有兩個(gè)重組位點(diǎn)。在其它實(shí)施方案中,該載體包含兩個(gè)或更多個(gè)不同的選擇標(biāo)記,每個(gè)選擇標(biāo)記的側(cè)翼有兩個(gè)重組位點(diǎn)。在一些實(shí)施方案中,其中一或多個(gè)選擇標(biāo)記可以是負(fù)選擇標(biāo)記。在一些實(shí)施方案中,本發(fā)明提供克隆方法,包括步驟提供第1、2和3核酸區(qū)段,其中該第1核酸區(qū)段的側(cè)翼有第1和第2重組位點(diǎn),該第2核酸區(qū)段的側(cè)翼有第3和第4重組位點(diǎn)、而該第3核酸區(qū)段的側(cè)翼有第5和第6重組位點(diǎn),其中該第2重組位點(diǎn)能夠和第3重組位點(diǎn)重組,而第1、4、5、6重組位點(diǎn)均不能和第1至第6重組位點(diǎn)中的任一個(gè)重組;提供包含位于第一選擇標(biāo)記側(cè)翼的第7和第8重組位點(diǎn)以及位于第二選擇標(biāo)記側(cè)翼的第9和第10重組位點(diǎn)的載體,其中該第7至第10重組位點(diǎn)均不能與第7至第10重組位點(diǎn)中的任一個(gè)重組;實(shí)施第一重組反應(yīng),以便第2和第3重組位點(diǎn)發(fā)生重組;實(shí)施第二重組反應(yīng),以便第1和第4重組位點(diǎn)分別和第7和第8重組位點(diǎn)重組、而第5和第6重組與第9和第10重組位點(diǎn)重組,由此克隆該第1、2和3核酸區(qū)段。在一些實(shí)施方案中,核酸區(qū)段可以包含發(fā)揮啟動(dòng)子作用的序列。在一些實(shí)施方案中,該第1和第2核酸區(qū)段可以包含編碼多肽的序列,而重組將這兩個(gè)多肽放置在同一閱讀框中。在一些實(shí)施方案中,核酸區(qū)段可以包含發(fā)揮轉(zhuǎn)錄終止序列功能的序列。本發(fā)明為核酸和蛋白質(zhì)的模塊構(gòu)建提供了極為多樣的方法。插入的核酸區(qū)段和載體均可以含有經(jīng)過(guò)選擇的序列,以致可以賦予產(chǎn)物分子期望的特性。在以圖6和7作為例子的那些實(shí)施方案中,除了插入?yún)^(qū)段外,載體中與插入?yún)^(qū)段相鄰的一或多個(gè)部分以及分隔插入?yún)^(qū)段的載體部分可以含有一或多個(gè)經(jīng)選擇的序列。在一些實(shí)施方案中,這些選擇的序列可以編碼核酶、表位標(biāo)簽、結(jié)構(gòu)域、選擇標(biāo)記、內(nèi)部核糖體進(jìn)入序列、啟動(dòng)子、增強(qiáng)子、重組位點(diǎn)等。在一些優(yōu)選實(shí)施方案中,分隔插入?yún)^(qū)段的載體部分可以包括一或多個(gè)側(cè)翼有一對(duì)反應(yīng)性重組位點(diǎn)的選擇標(biāo)記,以及用于插入這些核酸區(qū)段的重組位點(diǎn)。該方法將尤其適合于構(gòu)建基因靶向載體。例如,重組位點(diǎn)對(duì)之間的載體區(qū)段可以編碼一或多個(gè)選擇標(biāo)記例如新霉素抗性基因。區(qū)段A和B可以含有經(jīng)選擇的核酸序列,以致它們與待破壞的基因靶標(biāo)的一部分一致或基本一致。在重組反應(yīng)后,目的載體將含有位于正選擇標(biāo)記側(cè)翼的目的基因的兩個(gè)部分。然后可以使用任何常規(guī)技術(shù),例如轉(zhuǎn)染,將該載體插入細(xì)胞中,于是載體上的目的基因部分可以和該基因的基因組拷貝的同源部分發(fā)生重組。含有該插入載體的細(xì)胞可以基于選擇標(biāo)記所賦予的一或多種特性進(jìn)行選擇,例如,在選擇標(biāo)記是新霉素抗性基因時(shí),可以基于細(xì)胞對(duì)G-418的抗性進(jìn)行選擇。在一些實(shí)施方案中,可以將一或多個(gè)負(fù)選擇標(biāo)記包括在不含靶基因區(qū)段和正選擇標(biāo)記的目的載體載體中。一或多個(gè)負(fù)選擇標(biāo)記的存在將允許選擇除去基因組中插入了完整的目的載體的細(xì)胞、或選擇除去目的載體在其中以染色體外方式維持的細(xì)胞。在一些優(yōu)選實(shí)施方案中,可以在用于插入核酸區(qū)段的重組位點(diǎn)的附近放置其它的重組位點(diǎn)。在可能期望在打靶后從所靶向的基因中除去選擇標(biāo)記的基因打靶應(yīng)用中,即所謂的“hitandrun”技術(shù),此類分子是有用的。本領(lǐng)域技術(shù)人員將明了,含有同源序列的區(qū)段并不必與基因序列相符。在一些情況下,可以對(duì)序列進(jìn)行選擇,以便其與基因外的染色體位置同源。該方法也十分適合于構(gòu)建雙順?lè)醋颖磉_(dá)載體。在一些實(shí)施方案中,含有雙順?lè)醋颖磉_(dá)元件的表達(dá)載體中,兩個(gè)結(jié)構(gòu)基因從一個(gè)啟動(dòng)子表達(dá)并通過(guò)內(nèi)部核糖體進(jìn)入序列(IRES,見(jiàn)Encarnacion,CurrentOpinioninBiotechnology10458-464(1999),特此并入本文作為參考)分開(kāi)??梢允褂眠@些載體從單一一個(gè)結(jié)構(gòu)表達(dá)兩個(gè)蛋白。在一些實(shí)施方案中,可以不必控制其中一或多個(gè)核酸區(qū)段的取向,而且可以在該區(qū)段的兩個(gè)末端使用相同特異性的重組位點(diǎn)。參考圖6,如果區(qū)段A相對(duì)于區(qū)段B的取向并不關(guān)鍵,則L1位點(diǎn)可以位于區(qū)段A側(cè)翼的兩個(gè)末端上,而載體裝備兩個(gè)R1位點(diǎn)。在形成區(qū)段A和B的組合文庫(kù)過(guò)程中,這可能對(duì)于產(chǎn)生額外的復(fù)雜性是有用的。實(shí)施例5將多個(gè)片段組合在載體的單個(gè)位點(diǎn)中在一些實(shí)施方案中,本發(fā)明提供克隆n個(gè)核酸區(qū)段的方法,其中n是大于1的整數(shù),該方法包括步驟提供第1至第n個(gè)核酸區(qū)段,每個(gè)區(qū)段的側(cè)翼有兩個(gè)獨(dú)特的重組位點(diǎn),其中這些重組位點(diǎn)經(jīng)選擇以致位于第i區(qū)段ni側(cè)翼的兩個(gè)重組位點(diǎn)之一和位于第ni-1區(qū)段側(cè)翼的重組位點(diǎn)之一反應(yīng),而位于第i區(qū)段側(cè)翼的另一重組位點(diǎn)與位于第ni+1區(qū)段側(cè)翼的重組位點(diǎn)之一反應(yīng);提供包含至少兩個(gè)重組位點(diǎn)的載體,其中載體上這兩個(gè)重組位點(diǎn)的一個(gè)與第1核酸區(qū)段上的一個(gè)位點(diǎn)反應(yīng),而載體上的另一位點(diǎn)和第n核酸區(qū)段上的一個(gè)重組位點(diǎn)反應(yīng)。本發(fā)明的再一目的是提供克隆方法,該方法包括步驟提供第1、2、3核酸區(qū)段,其中該第1核酸區(qū)段的側(cè)翼有第1和第2重組位點(diǎn)、第2核酸區(qū)段的側(cè)翼有第3和第4重組位點(diǎn)、而第3核酸區(qū)段的側(cè)翼有第5和第6重組位點(diǎn),其中該第2重組位點(diǎn)能夠和第3重組位點(diǎn)重組,而第4重組位點(diǎn)能夠和第5重組位點(diǎn)重組;提供具有至少第7和第8重組位點(diǎn)的載體,以便該第7重組位點(diǎn)能夠和第1重組位點(diǎn)反應(yīng)而第8重組位點(diǎn)能夠和第6重組位點(diǎn)反應(yīng);實(shí)施至少一次重組反應(yīng),以便第2和第3重組位點(diǎn)重組、第4和第5重組位點(diǎn)重組、第1和第7重組位點(diǎn)重組,而第6和第8重組位點(diǎn)重組,由此克隆該第1、2、3核酸區(qū)段。在一些實(shí)施方案中,至少一個(gè)核酸區(qū)段包含發(fā)揮啟動(dòng)子功能的序列。在一些實(shí)施方案中,至少兩個(gè)核酸區(qū)段包含編碼多肽的序列,而重組將這兩個(gè)多肽放入同一個(gè)閱讀框中。在一些實(shí)施方案中,至少一個(gè)核酸區(qū)段包含發(fā)揮轉(zhuǎn)錄終止序列功能的序列。在一些實(shí)施方案中,至少一個(gè)片段包含復(fù)制起點(diǎn)。在一些實(shí)施方案中,至少一個(gè)片段包含編碼選擇標(biāo)記的序列。此實(shí)施方案以圖8和9作為例子進(jìn)行說(shuō)明,在此情況下n=3。在此實(shí)施方案中,本發(fā)明提供克隆方法,該方法包括步驟提供第1、2、3核酸區(qū)段,其中該第1核酸區(qū)段的側(cè)翼有第1和第2重組位點(diǎn)、第2核酸區(qū)段的側(cè)翼有第3和第4重組位點(diǎn)、而第3核酸區(qū)段的側(cè)翼有第5和第6重組位點(diǎn),其中該第2重組位點(diǎn)能夠和第3重組位點(diǎn)重組,而第4重組位點(diǎn)能夠和第5重組位點(diǎn)重組;提供包含第7和第8重組位點(diǎn)的載體;并實(shí)施至少一次重組反應(yīng),以便第2和第3重組位點(diǎn)重組、第4和第5重組位點(diǎn)重組、第1和第6重組位點(diǎn)分別和第7和第8重組位點(diǎn)重組,由此克隆該第1、2、3核酸區(qū)段。正如以上討論的,當(dāng)指定區(qū)段的取向不關(guān)鍵時(shí),可以修飾本發(fā)明,將具有相同特異性的重組位點(diǎn)放置在指定區(qū)段的兩個(gè)末端,并相應(yīng)地調(diào)整鄰近區(qū)段的重組位點(diǎn)和/或載體中的重組位點(diǎn)。除了上述討論的在單個(gè)載體中組合兩個(gè)片段的用途外,此類實(shí)施方案可以用于從含有各種功能的單個(gè)片段構(gòu)建載體。因此,本發(fā)明提供構(gòu)建載體的模塊方法。在一些實(shí)施方案中,至少一個(gè)核酸區(qū)段包含發(fā)揮啟動(dòng)子功能的序列。在一些實(shí)施方案中,至少兩個(gè)核酸區(qū)段包含編碼多肽的序列,而重組將這兩個(gè)多肽放入同一閱讀框中。在一些實(shí)施方案中,至少一個(gè)片段包含復(fù)制起點(diǎn)。在一些實(shí)施方案中,至少一個(gè)片段包含編碼選擇標(biāo)記的序列。在一些實(shí)施方案中,一個(gè)片段可以包含編碼一個(gè)以上功能的序列。在一些實(shí)施方案中,一個(gè)片段可以包含編碼復(fù)制起點(diǎn)的序列和編碼選擇標(biāo)記的序列。當(dāng)使用本發(fā)明方法將多個(gè)核酸區(qū)段插入載體中時(shí),這些區(qū)段的表達(dá)可以由相同調(diào)節(jié)序列或不同調(diào)節(jié)序列驅(qū)動(dòng)。圖20A顯示含有兩個(gè)插入DNA區(qū)段的載體的一個(gè)例子,其表達(dá)由不同的啟動(dòng)子驅(qū)動(dòng)(即兩個(gè)不同T7啟動(dòng)子)。本發(fā)明方法還可以用于制備允許在體內(nèi)造成基因沉默的結(jié)構(gòu)。一個(gè)使基因沉默的方法涉及制備稱作干擾RNA(RNAinterference,RNAi)的雙鏈RNA。(見(jiàn)例如Mette等,EMBOJ.,195194-5201(2000))。本發(fā)明方法可以按多種方式用于制備RNAi等分子。因此,可以使用本發(fā)明核酸分子的表達(dá)產(chǎn)物造成基因表達(dá)的沉默。圖20B顯示了設(shè)計(jì)以產(chǎn)生RNAi的結(jié)構(gòu)的一個(gè)例子。在此結(jié)構(gòu)中,將DNA區(qū)段插入載體中,以便相應(yīng)于兩條鏈的RNA可以作為兩個(gè)不同的轉(zhuǎn)錄本產(chǎn)生。圖20C顯示了設(shè)計(jì)以產(chǎn)生RNAi的結(jié)構(gòu)的另一例子。在此結(jié)構(gòu)中,兩個(gè)拷貝的DNA區(qū)段被插入載體中以致也產(chǎn)生相應(yīng)于兩條鏈的RNA。圖20D顯示了設(shè)計(jì)以產(chǎn)生RNAi的結(jié)構(gòu)的再一例子。在該結(jié)構(gòu)中,將兩個(gè)拷貝的DNA區(qū)段插入載體中,以便相應(yīng)于兩條鏈的RNA以單個(gè)轉(zhuǎn)錄本的形式產(chǎn)生。圖20E顯示的示例性載體系統(tǒng)包含兩個(gè)載體,每個(gè)載體含有相同DNA區(qū)段的多個(gè)拷貝。這些DNA區(qū)段之一的表達(dá)導(dǎo)致產(chǎn)生有義RNA,而另一個(gè)的表達(dá)導(dǎo)致產(chǎn)生反義RNA。因此,從圖20B-20E給出的載體產(chǎn)生的RNA鏈將具有互補(bǔ)核苷酸序列,一般可以在生理?xiàng)l件下彼此雜交或發(fā)生分子內(nèi)雜交。設(shè)計(jì)以產(chǎn)生RNAi的核酸區(qū)段,如圖20B-20E所示載體,不一定與全長(zhǎng)基因或可讀框相對(duì)應(yīng)。例如,當(dāng)核酸區(qū)段相應(yīng)于ORF時(shí),該區(qū)段可以僅相應(yīng)于該ORF的一部分(例如該ORF5’和3’末端的50個(gè)核苷酸)。而且,盡管圖20B-20E顯示了設(shè)計(jì)以產(chǎn)生RNAi的載體,但核酸區(qū)段也可以以其它形式(例如插入宿主細(xì)胞的染色體中)發(fā)揮相同功能。例如,涉及使用RNAi和反義RNA等化合物的基因沉默方法,對(duì)于鑒定基因功能尤其有用。例如,基因沉默方法可以用于減低或防止一或多個(gè)基因在細(xì)胞或生物體中的表達(dá)。然后,可以使用與功能的選擇性抑制有關(guān)的表型表現(xiàn),確定此“沉默”基因的作用。作為一個(gè)例子,Chuang等,Proc.Natl.Acad.Sci.(USA)974985-4990(2000)證明,在鼠耳芥(Arbidopsisthaliana)中體內(nèi)產(chǎn)生RNAi可以改變基因活性。因此,本發(fā)明提供調(diào)節(jié)細(xì)胞和組織中核酸分子表達(dá)(包括RNAi和反義RNA的表達(dá))的方法。本發(fā)明還提供方法,以制備能夠用于產(chǎn)生相應(yīng)于DNA分子一或兩條鏈的RNA的核酸分子。類似地,本發(fā)明涉及用于有核酶參與的基因沉默的化合物和方法。尤其是,本發(fā)明提供反義RNA/核酶融合物,該融合物包含(1)相應(yīng)于靶基因的反義RNA和(2)切割RNA的一或多個(gè)核酶(例如,錘頭核酶、發(fā)夾核酶、δ核酶、四膜蟲(chóng)(Tetrahymena)L-21核酶等)。而且,本發(fā)明提供了表達(dá)這些融合物的載體、制備這些載體的方法、和使用這些載體抑制基因表達(dá)的方法。在一個(gè)實(shí)施方案中,構(gòu)建編碼與ccdB基因相鄰的核酶的目的載體,其中該ccdB基因的側(cè)翼有attR位點(diǎn)。使用LR反應(yīng),以便用當(dāng)表達(dá)時(shí)產(chǎn)生反義RNA分子的核酸分子替換該ccdB基因。由此,表達(dá)產(chǎn)物將導(dǎo)致產(chǎn)生通過(guò)attB位點(diǎn)編碼的間隔序列與核酶融合的反義序列。正如以下實(shí)施例13所討論的,如果期望的話,可以從該轉(zhuǎn)錄本中除去該attB位點(diǎn),或在某些情況下,可以將編碼核酶的核酸嵌在該attB位點(diǎn)中。例如,與核酶融合的反義分子的表達(dá)可以用于切割細(xì)胞中的特異RNA分子。這正是因?yàn)檗D(zhuǎn)錄本的反義RNA部分可以設(shè)計(jì)以便和特定的mRNA分子雜交。而且,轉(zhuǎn)錄本的核酶部分可以設(shè)計(jì)以切割與它雜交的RNA分子。例如,該核酶可以是切割雙鏈RNA的核酶(例如四膜蟲(chóng)L-21核酶)。實(shí)施例6使用抑制型tRNA產(chǎn)生融合蛋白上述近來(lái)發(fā)展的重組克隆技術(shù)允許將靶核酸從一個(gè)載體背景中快速移動(dòng)到一或多個(gè)其它載體背景中。因?yàn)橹亟M時(shí)間是位點(diǎn)特異性的,所有可以相對(duì)載體控制靶核酸的取向和閱讀框。這種控制使得構(gòu)建靶核酸序列和載體序列之間的融合成為一件簡(jiǎn)單的事。一般地說(shuō),可以以四種形式表達(dá)基因氨基和羧基端均是天然的,在任一端經(jīng)過(guò)修飾、或兩端均經(jīng)過(guò)修飾的形式。含有目的靶基因的結(jié)構(gòu)可以包括N端甲硫氨酸的ATG密碼子和羧基端的終止密碼子。常常該基因結(jié)構(gòu)包括可以位于ATG上游允許基因表達(dá)的翻譯起始序列tis,即tis-ATG-ORF-終止密碼子。此結(jié)構(gòu)允許基因表達(dá)成含有與天然未克隆蛋白相同的氨基和羧基氨基酸的蛋白質(zhì)。當(dāng)此結(jié)構(gòu)與氨基端蛋白標(biāo)簽如GST按符合閱讀框的方式融合時(shí),此標(biāo)簽具有其自己的tis,因此該結(jié)構(gòu)是tis-ATG-標(biāo)簽-tis-ORF-終止密碼子,而包含該ORF的tis的堿基將翻譯為標(biāo)簽和ORF之間的氨基酸。此外,在mRNA的內(nèi)部(即在ORF的ATG而非標(biāo)簽的ATG)可以預(yù)期一定水平的翻譯起始,導(dǎo)致一定量的天然蛋白質(zhì)表達(dá)而污染期望蛋白質(zhì)。DNA(小寫(xiě)字母)tis1-atg-標(biāo)簽-tis2-atg-orf-終止密碼子RNA(小寫(xiě)字母,斜體)tis1-atg-標(biāo)簽-tis2-atg-orf-終止密碼子蛋白質(zhì)(大寫(xiě)字母)ATG-標(biāo)簽-TIS2-ATG-ORF(tis1和終止密碼子不翻譯)+污染的ATG-ORF(ORF自tis2開(kāi)始翻譯)。使用重組克隆,構(gòu)建含有臨近重組位點(diǎn)的標(biāo)簽的載體,從而使標(biāo)簽和目的ORF的C和/或N端按符合閱讀框的方式融合,這對(duì)于本領(lǐng)域技術(shù)人員而言是簡(jiǎn)單的。如果能夠在多種載體中快速構(gòu)建大量克隆,則本領(lǐng)域需要使無(wú)需操作基因結(jié)構(gòu)本身而可以表達(dá)單個(gè)克隆基因的方式最大化。本發(fā)明使用一或多個(gè)抑制型tRNA抑制翻譯在終止密碼子處的終止,通過(guò)提供控制靶基因的C和/或N端融合表達(dá)的材料和方法滿足了此需要。因此,本發(fā)明提供了材料和方法,以制備側(cè)翼有重組位點(diǎn)的基因結(jié)構(gòu)。優(yōu)選地,在編碼目的蛋白質(zhì)的基因的C端使用編碼終止密碼子的序列來(lái)制備該結(jié)構(gòu)。在一些實(shí)施方案中,可以將終止密碼子置于基因臨近位置,例如在位于基因側(cè)翼的重組位點(diǎn)內(nèi)。可以通過(guò)重組將靶基因結(jié)構(gòu)轉(zhuǎn)移至能夠向目的基因提供各種C端或N端標(biāo)簽(例如GFP、GST、His標(biāo)簽、GUS等)的各種載體中。當(dāng)終止密碼子位于基因羧基端時(shí),在非抑制條件下(即當(dāng)抑制型tRNA不表達(dá)時(shí))將表達(dá)具有“天然”羧基末端氨基酸序列的基因,而在抑制條件下基因?qū)⒈磉_(dá)為羧基融合蛋白。本發(fā)明使用琥珀抑制基因supF為例,該基因是經(jīng)突變識(shí)別UAG終止密碼子的特定酪氨酸t(yī)RNA基因(tyrT)。本領(lǐng)域技術(shù)人員將明了,可以使用其它抑制基因和其它終止密碼子實(shí)施本發(fā)明。本實(shí)施例中,我們將編碼抑制型tRNA的基因摻入表達(dá)靶基因的載體。在其它實(shí)施方案中,編碼抑制型tRNA的基因可以存在于宿主細(xì)胞的基因組中。在再其它實(shí)施方案中,編碼抑制蛋白的基因可以位于不同的載體上并反式提供抑制蛋白。在此類實(shí)施方案中,含有抑制蛋白基因的載體可以具有經(jīng)選擇與含有基因結(jié)構(gòu)的載體相容的復(fù)制起點(diǎn)。該相容載體的選擇和制備屬于本領(lǐng)域普通技術(shù)。本領(lǐng)域技術(shù)人員將明了,對(duì)用于反式提供抑制型tRNA的適當(dāng)載體的選擇可以包括選擇適當(dāng)?shù)目股乜剐詷?biāo)記。例如,如果表達(dá)靶基因的載體含有針對(duì)一種抗生素的抗生素抗性標(biāo)記,則用于提供抑制型tRNA的載體可以編碼對(duì)另一抗生素的抗性。這就使得可以選出同時(shí)含有這兩個(gè)載體的宿主細(xì)胞。在一些優(yōu)選實(shí)施方案中,可以在上述所有實(shí)施方案中提供一個(gè)以上拷貝的抑制型tRNA。例如,可以提供含有多個(gè)拷貝編碼抑制型tRNA的基因的宿主細(xì)胞?;蛘撸梢栽谂c目的靶基因相同的載體背景中提供處于相同或不同啟動(dòng)子下的多個(gè)抑制型tRNA基因拷貝。在一些實(shí)施方案中,可以在與用于包含目的靶基因的載體不同的載體中提供多個(gè)拷貝的抑制型tRNA。在其它實(shí)施方案中,可以在含有編碼目的蛋白的基因的載體上和/或在另一載體上和/或在宿主細(xì)胞的基因組中或以上的組合中,提供一或多個(gè)拷貝的抑制型tRNA基因。當(dāng)提供一個(gè)以上拷貝的抑制型tRNA基因時(shí),這些基因可以從相同或不同的啟動(dòng)子表達(dá),而且這些啟動(dòng)子可以和用于表達(dá)編碼目的蛋白的基因的啟動(dòng)子相同或不同。在一些實(shí)施方案中,可以提供兩個(gè)或更多個(gè)不同的抑制型tRNA基因。在此類實(shí)施方案中,可以以多拷貝提供一或多種單個(gè)抑制基因,而且特定抑制型tRNA基因的拷貝數(shù)可以和另一抑制型tRNA基因的拷貝數(shù)相同或不同。每個(gè)抑制型tRNA基因獨(dú)立于任何其它抑制型tRNA基因可以在用于表達(dá)目的基因的載體上和/或不同載體上和/或宿主細(xì)胞的基因組中提供。在有些實(shí)施方案中,可以在一個(gè)以上的位置提供指定tRNA基因。例如,可以在含有目的基因的載體上提供一個(gè)拷貝的抑制型tRNA,而在另一載體上和/或在宿主細(xì)胞基因組中再提供一或多個(gè)拷貝。當(dāng)提供一個(gè)以上拷貝的抑制型tRNA基因時(shí),可以從相同或不同的啟動(dòng)子表達(dá)這些基因,而且這些啟動(dòng)子可以和用于表達(dá)編碼目的蛋白的基因的啟動(dòng)子相同或不同,并且可以和用于表達(dá)不同tRNA基因的啟動(dòng)子相同或不同。參考圖14,按符合閱讀框的方式克隆GUS基因與GST基因,兩者被TAG密碼子分開(kāi)。該質(zhì)粒還含有編碼抑制型tRNA的supF基因。將該質(zhì)粒導(dǎo)入宿主細(xì)胞中,在該細(xì)胞中大約60%的GUS基因表達(dá)為含有GST標(biāo)簽的融合蛋白。在對(duì)照實(shí)施方案中,當(dāng)從缺少supE基因的載體表達(dá)時(shí),含有相同GUS-終止密碼子-GST結(jié)構(gòu)的質(zhì)粒不表達(dá)產(chǎn)生可檢測(cè)量的融合蛋白。在此實(shí)施例中,supF基因作為含有GUS-GST融合物的mRNA的一部分表達(dá)。由于tRNA一般是從較大的RNA分子加工來(lái)的,所以此類結(jié)構(gòu)可以用于表達(dá)本發(fā)明抑制型tRNA。在其它實(shí)施方案中,含有tRNA序列的RNA可以與含有目的基因的mRNA分開(kāi)表達(dá)。在本發(fā)明一些實(shí)施方案中,目的靶基因和表達(dá)抑制型tRNA的基因可以由相同啟動(dòng)子控制。在其它實(shí)施方案中,目的靶基因可以從與抑制型tRNA的啟動(dòng)子不同的啟動(dòng)子表達(dá)。本領(lǐng)域技術(shù)人員將明了,在某些情況下,可能期望使用可調(diào)節(jié)的啟動(dòng)子控制抑制型tRNA和/或目的靶基因的表達(dá)。例如,可以通過(guò)lac啟動(dòng)子或其衍生物如tac啟動(dòng)子等啟動(dòng)子,控制目的靶基因和/或表達(dá)抑制型tRNA的基因。在所示實(shí)施方案中,目的靶基因和抑制型tRNA基因均從T7RNA聚合酶啟動(dòng)子表達(dá)。T7RNA聚合酶的誘導(dǎo)開(kāi)啟了目的基因(在本情況下是GUS)和將抑制型tRNA表達(dá)為一個(gè)RNA分子的一部分的supF基因兩者的表達(dá)。在一些優(yōu)選實(shí)施方案中,抑制型tRNA基因的表達(dá)可以處于與目的基因的啟動(dòng)子不同的啟動(dòng)子的控制下。在一些實(shí)施方案中,可以在靶基因表達(dá)前表達(dá)抑制基因。這就使得可以在需要抑制因子通過(guò)抑制終止密碼子來(lái)實(shí)現(xiàn)融合蛋白表達(dá)之前,將抑制因子的水平累積至一個(gè)高水平。例如,在抑制基因受控于可用IPTG誘導(dǎo)的啟動(dòng)子的本發(fā)明實(shí)施方案中,靶基因受控于T7RNA聚合酶啟動(dòng)子,而T7RNA聚合酶的表達(dá)又受到非IPTG的誘導(dǎo)信號(hào)如NaCl所誘導(dǎo)的啟動(dòng)子的控制,這樣就可以在誘導(dǎo)T7RNA聚合酶基因以及隨后表達(dá)目的基因之前,使用IPTG開(kāi)啟抑制型tRNA的表達(dá)。在一些優(yōu)選實(shí)施方案中,可以在誘導(dǎo)T7RNA聚合酶基因之前約15分鐘至約1小時(shí),誘導(dǎo)抑制型tRNA的表達(dá)。在一個(gè)優(yōu)選實(shí)施方案中,可以在誘導(dǎo)T7RNA聚合酶基因之前約15分鐘至約30分鐘,誘導(dǎo)抑制型tRNA的表達(dá)。在所示具體實(shí)施例中,T7RNA聚合酶基因的表達(dá)處于鹽可誘導(dǎo)的啟動(dòng)子的控制下。具有在鹽可誘導(dǎo)的啟動(dòng)子控制下的誘導(dǎo)型T7RNA聚合酶基因拷貝的細(xì)胞系可從InvitrogenCorp.,LifeTechnologiesDivision購(gòu)買(mǎi)獲得,產(chǎn)品名為BL21SI株。在一些優(yōu)選實(shí)施方案中,可以按反饋環(huán)形式安排目的靶基因和抑制型tRNA的表達(dá)。例如,可以將目的靶基因置于T7RNA聚合酶啟動(dòng)子的控制下,而將抑制基因置于T7啟動(dòng)子和lac啟動(dòng)子的控制下,T7RNA聚合酶基因本身由T7啟動(dòng)子和lac啟動(dòng)子轉(zhuǎn)錄,而且T7RNA聚合酶基因具有一個(gè)琥珀終止密碼子突變替代了正常的酪氨酸終止密碼子,例如(883個(gè)密碼子中的)第28位密碼子。在抑制因子的水平足夠高以能夠給出顯著抑制之前,不能產(chǎn)生活性T7RNA聚合酶。然后,由于T7聚合酶表達(dá)抑制基因以及其自身,該聚合酶的水平快速上升。在其它優(yōu)選實(shí)施方案中,僅抑制基因從T7RNA聚合酶啟動(dòng)子表達(dá)。此類實(shí)施方案無(wú)需產(chǎn)生過(guò)量T7RNA聚合酶即可給出高水平的抑制因子。在其它優(yōu)選實(shí)施方案中,T7RNA聚合酶基因具有一個(gè)以上的琥珀終止密碼子突變(見(jiàn)例如圖14B)。這就要求在產(chǎn)生有效的T7RNA聚合酶之前有較高水平的抑制因子。在本發(fā)明一些實(shí)施方案中,可能期望有一個(gè)以上可被一個(gè)以上抑制型tRNA抑制的終止密碼子。參考圖15,構(gòu)建載體以便允許從相同結(jié)構(gòu)中可調(diào)節(jié)地表達(dá)目的蛋白的N和/或C端融合物。圖15中第一標(biāo)簽序列TAG1是從圖中箭頭所指啟動(dòng)子表達(dá)。該標(biāo)簽序列包括與該標(biāo)簽同一閱讀框的終止密碼子。終止密碼子1可以位于標(biāo)簽序列的任何位置,并優(yōu)選位于標(biāo)簽序列的C端或近C端。該終止密碼子還可以位于重組位點(diǎn)RS1或內(nèi)部核糖體進(jìn)入序列(IRES)中。該結(jié)構(gòu)還包括一個(gè)包含終止密碼子2的目的基因。該第一標(biāo)簽和目的基因優(yōu)選位于同一閱讀框中,但將可造成移碼致使第一標(biāo)簽與目的基因同一閱讀框的序列包括在內(nèi)也屬于本發(fā)明范圍。終止密碼子2與目的基因同一閱讀框,并優(yōu)選位于該基因編碼序列的末端或近末端。任選地,可以將終止密碼子2置于重組位點(diǎn)RS2內(nèi)部。該結(jié)構(gòu)還包括與目的基因在同一閱讀框中的第2標(biāo)簽序列,在圖15中表示為T(mén)AG2,而且,該第二標(biāo)簽序列可以任選地包括和該第2標(biāo)簽在同一閱讀框中的終止密碼子3。在該結(jié)構(gòu)中,可以在第二標(biāo)簽的編碼序列后包括轉(zhuǎn)錄終止子(圖15中未顯示)。終止密碼子1、2和3可以相同或不同。在一些實(shí)施方案中,終止密碼子1、2和3是不同的。在1和2不同的實(shí)施方案中,可以使用相同的結(jié)構(gòu),通過(guò)改變適當(dāng)抑制型tRNA的表達(dá),表達(dá)N端融合物、C端融合物和天然蛋白質(zhì)。例如,為了表達(dá)天然蛋白,則不表達(dá)抑制型tRNA并由IRES控制蛋白的翻譯。當(dāng)期望表達(dá)N端融合物時(shí),則表達(dá)抑制終止密碼子1的抑制型tRNA,而為了產(chǎn)生C端融合物,則表達(dá)抑制終止密碼子2的抑制型tRNA。在一些情況下,可能期望表達(dá)雙重靶向目的蛋白,在此時(shí)可以表達(dá)抑制終止密碼子1和終止密碼子2的抑制型tRNA。為了清楚地理解,本發(fā)明通過(guò)舉例說(shuō)明和實(shí)施例作了一定詳細(xì)的描述,本領(lǐng)域普通技術(shù)人員將明了,可以通過(guò)在一個(gè)寬的相當(dāng)條件、配方和其它參數(shù)范圍內(nèi)修飾或改變本發(fā)明以實(shí)施本發(fā)明,而不影響本發(fā)明或其任何具體實(shí)施方案的范圍,而且,這些修飾或改變均旨在包括在所附權(quán)利要求的范圍內(nèi)。實(shí)施例7測(cè)試進(jìn)入載體和目的載體的功能作為本發(fā)明特定載體功能評(píng)價(jià)的一部分,重要的是功能性地測(cè)試載體重組的能力。該評(píng)價(jià)可以通過(guò)實(shí)施重組克隆反應(yīng),然后轉(zhuǎn)化大腸桿菌并對(duì)菌落形成單位進(jìn)行評(píng)分,來(lái)實(shí)現(xiàn)。然而,也可以進(jìn)行另一測(cè)試,通過(guò)瓊脂糖凝膠電泳,允許更快速更簡(jiǎn)單地評(píng)價(jià)指定進(jìn)入載體或目的載體的功能。以下描述了此體外測(cè)試方法。材料和方法使用質(zhì)粒模板pEZC1301和pEZC1313(描述在PCT公開(kāi)文本W(wǎng)O00/52027中,其完整公開(kāi)并入本文作為參考)(每個(gè)模板均含有一個(gè)單一的野生型att位點(diǎn)),分別制備含有attL或attR位點(diǎn)的PCR產(chǎn)物。用AlwNI使質(zhì)粒模板線性化,酚抽提,乙醇沉淀并溶解在TE中至lng/μl濃度。PCR引物(大寫(xiě)字母代表自野生型發(fā)生的堿基改變)attL1ggggagcctgcttttttGtacAaagttggcattataaaaaagcattgc(SEQIDNO41)attL2ggggagcctgctttCttGtacAaagttggcattataaaaaagcattgc(SEQIDNO42)attLrighttgttgccgggaagctagagtaa(SEQIDNO43)attR1ggggAcaagttTgtaCaaaaaagctgaacgagaaacgtaaaat(SEQIDNO44)attR2ggggAcaagttTgtaCaaGaaagctgaacgagaaacgtaaaat(SEQIDNO45)attRrightcagacggcatgatgaacctgaa(SEQIDNO46)將PCR引物溶解在TE中至500pmol/μl。制備由attL1+attLright引物、由attL2+attLright引物、由attR1+attRright引物、以及由attR2+attRright引物組成的引物混合物,每個(gè)混合物含有各引物20pmol/μl。PCR反應(yīng)1μl質(zhì)粒模板(1ng)1μl引物對(duì)(各20pmol)3μlH2O45μlPlatinumPCRSuperMix(InyitrogenCorp.,LifeTechnologiesDivision)循環(huán)條件(在MJ熱循環(huán)儀上進(jìn)行)95℃/2分鐘94℃/30秒58℃/30秒和72/1.5分鐘,25個(gè)循環(huán),72℃/5分鐘5℃/保持所獲attLPCR產(chǎn)物為1.5kb,而所獲attRPCR產(chǎn)物為1.0kb.PCR反應(yīng)物通過(guò)加入150μlH2O和100μl3XPEG/MgCl2溶液進(jìn)行PEG/MgCl2沉淀,之后離心。將PCR產(chǎn)物溶解在50μlTE中。通過(guò)凝膠電泳1μl對(duì)PCR產(chǎn)物進(jìn)行定量,估計(jì)為50-100ng/μl。按下述實(shí)施含有attL或attR位點(diǎn)的PCR產(chǎn)物和GATEWAYTM質(zhì)粒的重組反應(yīng)8μlH2O2μlattL或attRPCR產(chǎn)物(100-200ng)2μlGATEWAYTM質(zhì)粒(100ng)4μl5X目的緩沖液4μlGATEWAYTMLRClonaseTM酶混合物20μl總體積(可以在保持同樣化學(xué)計(jì)量的同時(shí),通過(guò)將成分的體積調(diào)整為上述的約1/4,將反應(yīng)物按比例下調(diào)為5μl的總體積)。將Clonase反應(yīng)物在25℃孵育2小時(shí)。然后在瓊脂糖凝膠上電泳10μl。通過(guò)attL1PCR產(chǎn)物(1.0kb)和attR1PCR產(chǎn)物(1.5kb)的反應(yīng),并通過(guò)attL2PCR產(chǎn)物和attR2PCR產(chǎn)物的類似反應(yīng),作為陽(yáng)性對(duì)照反應(yīng),可以觀察到較大(2.5kb)重組產(chǎn)物的形成。類似地,通過(guò)attL1PCR產(chǎn)物和attR2PCR產(chǎn)物的反應(yīng)以及反之或attLPCR產(chǎn)物和attL質(zhì)粒的反應(yīng),等,作為陰性對(duì)照。在另一測(cè)試方法中,為了測(cè)試attB進(jìn)入載體,我們使用了含有單個(gè)attP位點(diǎn)的質(zhì)粒。含有單個(gè)att位點(diǎn)的質(zhì)粒也可以用作重組底物一般地測(cè)試所有進(jìn)入載體和目的載體(即,含有attL,attR、attB和attP位點(diǎn)的那些載體)。這就消除了進(jìn)行PCR反應(yīng)的需要。結(jié)果與不含attL或attRPCR產(chǎn)物的對(duì)照反應(yīng)物相比,當(dāng)與含有att的適當(dāng)PCR產(chǎn)物反應(yīng)時(shí),目的質(zhì)粒和進(jìn)入質(zhì)粒形成能夠容易地在瓊脂糖凝膠上觀察到的線性重組分子。由此,可以例如通過(guò)進(jìn)行上述線性化分析確定根據(jù)本發(fā)明構(gòu)建的目的載體和進(jìn)入載體的功能。實(shí)施例8使用通用銜接子引物進(jìn)行PCR克隆如本文所述,使用GATEWAYTMPCR克隆系統(tǒng)(InvitrogenCorp.,LifeTechnologiesDivision;Rockville,MD)克隆PCR產(chǎn)物,需要在用于PCR反應(yīng)的基因特異性引物的末端添加attB位點(diǎn)(attB1和attB2)?,F(xiàn)有數(shù)據(jù)提示,使用者在基因特異性引物上添加了29bp(含有attB位點(diǎn)的25bp加上4個(gè)G殘基)。使用通用attB銜接子引物和與這些銜接子有指定重疊部分的較短基因特異性引物來(lái)產(chǎn)生含有attB的PCR產(chǎn)物,對(duì)于大量GATEWAYTMPCR克隆系統(tǒng)的使用者而言是有利的。以下實(shí)驗(yàn)使用通用attB銜接子引物和含有6bp至18bp各種長(zhǎng)度的重疊區(qū)的基因特異性引物證明了該策略的實(shí)用性。結(jié)果證明,具有10bp至18b重疊區(qū)的基因特異性引物可以和通用attB銜接子引物一起成功地用于PCR擴(kuò)增產(chǎn)生全長(zhǎng)PCR產(chǎn)物。然后,使用GATEWAYTMPCR克隆系統(tǒng),可以按指定方向高度忠實(shí)地成功克隆這些PCR產(chǎn)物。材料和結(jié)果為了闡明通用attB銜接子引物可以和含有部分attB位點(diǎn)的基因特異性引物用于PCR反應(yīng)中產(chǎn)生全長(zhǎng)PCR產(chǎn)物,我們選擇人血球蛋白cDNA一個(gè)256bp的小區(qū)域作為靶標(biāo),以致可以通過(guò)瓊脂糖凝膠電泳將中間長(zhǎng)度的產(chǎn)物與全長(zhǎng)產(chǎn)物區(qū)分開(kāi)。使用以下寡核苷酸B1-HgbGGGGACAAGTTTGTACAAAAAAGCAGGCT-5′-Hgb★(SEQIDNO47)B2-HgbGGGGACCACTTTGTACAAGAAAGCTGGGT-3′-Hgb★★(SEQIDNO48)18B1-HgbTGTACAAAAAAGCAGGCT-5′-Hgb(SEQIDNO49)18B2-HgbTGTACAAGAAAGCTGGGT-3′-Hgb(SEQIDNO50)15B1-HgbACAAAAAAGCAGGCT-5′-Hgb(SEQIDNO51)15B2-HgbACAAGAAAGCTGGGT-3′-Hgb(SEQIDNO52)12B1-HgbAAAAAGCAGGCT-5′-Hgb(SEQIDNO53)12B2-HgbAGAAAGCTGGGT-3′-Hgb(SEQIDNO54)11B1-HgbAAAAGCAGGCT-5′-Hgb(SEQIDNO55)11B2-HgbGAAAGCTGGGT-3′-Hgb(SEQIDNO56)10B1-HgbAAAGCAGGCT-5′-Hgb(SEQIDNO57)10B2-HgbAAAGCTGGGT-3′-Hgb(SEQIDNO58)9B1-HgbAAGCAGGCT-5′-Hgb9B2-HgbAAGCTGGGT-3′-Hgb8B1-HgbAGCAGGCT-5′-Hgb8B2-HgbAGCTGGGT-3′-Hgb7B1-HgbGCAGGCT-5′-Hgb7B2-HgbGCTGGGT-3′-Hgb6B1-HgbCAGGCT-5′-Hgb6B2-HgbCTGGGT-3′-HgbattB1銜接子GGGGACAAGTTTGTACAAAAAAGCAGGCT(SEQIDNO47)attB2銜接子GGGGACCACTTTGTACAAGAAAGCTGGGT(SEQIDNO48)★-5′-Hgb=GTCACTAGCCTGTGGAGCAAGA(SEQIDNO59)★★-3′-Hgb=AGGATGGCAGAGGGAGACGACA(SEQIDNO60)這些實(shí)驗(yàn)的目的在于開(kāi)發(fā)一種簡(jiǎn)單而有效的通用銜接子PCR方法以產(chǎn)生適用于GATEWAYTMPCR克隆系統(tǒng)的含有attB的PCR產(chǎn)物。該反應(yīng)混合物和熱循環(huán)條件應(yīng)簡(jiǎn)單而有效,以便該通用銜接子PCR方法可以常規(guī)地適用于任何PCR產(chǎn)物克隆應(yīng)用。首先我們發(fā)現(xiàn)了使用含有18bp和15bp重疊的基因特異性引物和通用attB引物能夠成功地主要擴(kuò)增全長(zhǎng)PCR產(chǎn)物的PCR條件。這些條件描述如下10pmol基因特異性引物10pmol通用attB銜接子引物1ng含有人血球蛋白cDNA的質(zhì)粒100ng人白細(xì)胞cDNA文庫(kù)DNA5μl10XPLATINUMTaqHiFi反應(yīng)緩沖液(InvitrogenCorp.,LifeTechnologiesDivision)2μl50mMMgSO41μl10mMdNTP0.2μlPLATINUMTaqHiFi(1.0個(gè)單位)加水至50μl總反應(yīng)體積循環(huán)條件為了評(píng)價(jià)該方法的效率,在3%瓊脂糖-1000凝膠上電泳50μlPCR反應(yīng)物的2μl(1/25)。當(dāng)重疊區(qū)為12bp或更少時(shí),含有一個(gè)或不含通用attB銜接子的較小中間產(chǎn)物在反應(yīng)物中占優(yōu)勢(shì)。通過(guò)滴定基因特異性引物和通用attB銜接子引物的量,對(duì)PCR反應(yīng)條件作進(jìn)一步優(yōu)化。出來(lái)所加引物的量不同外,按上述配制PCR反應(yīng)物0、1、3或10pmol基因特異性引物0、10、30或100pmol銜接子引物循環(huán)條件使用限制量的基因特異性引物(3pmol)和過(guò)量的銜接子引物(30pmol)減少了較小中間產(chǎn)物的量。使用這些反應(yīng)條件,我們將為了主要獲得全長(zhǎng)PCR產(chǎn)物所必需的重疊區(qū)減少至12bp。在以下PCR反應(yīng)中我們進(jìn)一步對(duì)基因特異性引物和銜接子引物的量作了優(yōu)化0、1、2或3pmol基因特異性引物;0、30、40或50pmol銜接子引物循環(huán)條件使用2pmol基因特異性引物和40pmol銜接子引物進(jìn)一步減少了中間產(chǎn)物的量并主要產(chǎn)生具有包含11bp重疊區(qū)的基因特異性引物的全長(zhǎng)PCR產(chǎn)物。在任何PCR應(yīng)用中,可以通過(guò)無(wú)銜接子對(duì)照評(píng)價(jià)PCR反應(yīng)是否成功。當(dāng)在標(biāo)準(zhǔn)瓊脂糖凝膠上電泳1/25至1/10PCR反應(yīng)物時(shí),使用限制量的基因特異性引物應(yīng)產(chǎn)生微弱的或幾乎不可見(jiàn)的條帶。加入通用attB銜接子引物應(yīng)產(chǎn)生強(qiáng)PCR反應(yīng),產(chǎn)物的整個(gè)產(chǎn)量要高得多。使用CONCERT快速PCR純化系統(tǒng)(大于500bp的PCR產(chǎn)物可以用PEG沉淀),從使用具有18bp、15bp、12bp、11bp和10bp重疊區(qū)的基因特異性引物進(jìn)行的反應(yīng)物中純化PCR產(chǎn)物。隨后使用GATEWAYTMPCR克隆系統(tǒng)(InvitrogenCorp.,LifeTechnologiesDivision;Rockyille,MD)將該純化的PCR產(chǎn)物克隆在含有attP的質(zhì)粒載體中,并轉(zhuǎn)化大腸桿菌。在適當(dāng)?shù)目股嘏囵B(yǎng)基上選擇菌落并計(jì)數(shù),然后通過(guò)PCR篩選具有正確插入片段和取向的菌落。從具有部分人β珠蛋白(Hgb)基因的質(zhì)??寺。胊ttB銜接子PCR產(chǎn)生的粗PCR產(chǎn)物(未純化的),也用于GATEWAYTMPCR克隆系統(tǒng)反應(yīng)中。使用全長(zhǎng)attBB1/B2-Hgb、12B1/B2、11B1/B2和10B1/B2attB重疊Hgb引物產(chǎn)生的PCR產(chǎn)物被成功地克隆在GATEWAYTMpENTR21attP載體(描述在PCT公開(kāi)文本W(wǎng)O00/52027中,其完整公開(kāi)并入本文作為參考)中。對(duì)于每個(gè)PCR產(chǎn)物測(cè)試了24個(gè)菌落(24×4=總共96),并通過(guò)PCR驗(yàn)證了每個(gè)菌落均含有正確插入片段。以下顯示了克隆效率,表示為cfu/ml有趣的是,重疊PCR產(chǎn)物的克隆效率比全長(zhǎng)attBPCR產(chǎn)物的克隆效率高,而且,可以推測(cè),正如在瓊脂糖凝膠上所觀察到的,銜接子PCR產(chǎn)物比全長(zhǎng)attBPCR產(chǎn)物稍微清楚。菌落產(chǎn)生量的差異也可以反映具有完整attB位點(diǎn)的PCR產(chǎn)物分子的比例。使用attB銜接子PCR方法,用具有12bpattB重疊區(qū)的PCR引物從白細(xì)胞cDNA文庫(kù)和自Hela總RNA制備的第一鏈cDNA擴(kuò)增不同大小的cDNA(從1至4kb)。盡管通過(guò)該方法能夠擴(kuò)增此4種cDNA中的三種,但也觀察到非特異擴(kuò)增產(chǎn)物,在某些條件下這些非特異產(chǎn)物將干擾基因特異性擴(kuò)增。此非特異產(chǎn)物是在僅含有attB銜接子引物且沒(méi)有任何基因特異性重疊引物存在的反應(yīng)物中擴(kuò)增產(chǎn)生的。我們通過(guò)增加PCR反應(yīng)的嚴(yán)緊性并降低attB銜接子PCR引物的濃度,減少了此非特異產(chǎn)物。這些結(jié)果說(shuō)明,本實(shí)施例描述的銜接子引物PCR方法可以極好地用于克隆基因。這些結(jié)果也證明我們開(kāi)發(fā)了一種簡(jiǎn)單而有效的方法,該方法允許使用與通用attB銜接子引物部分重疊的較短基因特異引物來(lái)擴(kuò)增與GATEWAYTMPCR克隆系統(tǒng)相容的PCR產(chǎn)物。在常規(guī)PCR克隆應(yīng)用中,推薦使用12bp的重疊區(qū)。因此,本實(shí)施例描述的方法可以減少基因特異性引物的長(zhǎng)度多達(dá)17個(gè)殘基或更多,對(duì)于大量使用GATEWAYTMPCR克隆系統(tǒng)而言,這就顯著節(jié)約了寡核苷酸的費(fèi)用。此外,使用本實(shí)施例描述的方法和分析,普通技術(shù)人員可以使用僅常規(guī)實(shí)驗(yàn),設(shè)計(jì)和使用基于或含有其它重組位點(diǎn)或其片段(如attL、attR、attP、lox、FRT等)的類似引物銜接子。作為向PCR引物添加29個(gè)堿基的替代方法,可以使用含有添加在模板特異性引物上的少至12個(gè)attB堿基的引物,以兩步PCR方案產(chǎn)生attBPCR產(chǎn)物。在第一步,使用含有attB的12個(gè)堿基的模板特異引物在10個(gè)PCR循環(huán)中擴(kuò)增靶基因。將該P(yáng)CR反應(yīng)物的一部分轉(zhuǎn)移至含有通用attB銜接子引物的第2PCR反應(yīng)物中以擴(kuò)增整個(gè)attBPCR產(chǎn)物。按以下所示,設(shè)計(jì)在5’末端具有attB1和attB2的12個(gè)堿基的模板特異性引物12attB1AAAAAGCAGGCTNN(SEQIDNO139)--正向模板特異性引物12attB2AGAAAGCTGGGTN(SEQIDNO140)--反向模板特異性引物一般地,將這些引物的模板特異性部分設(shè)計(jì)為具有大于50的Tm。最適退火溫度由引物的模板特異性部分的Tm確定。attB1銜接子引物GGGGACAAGTTTGTACAAAAAAGCAGGCT(SEQIDNO47)attB2銜接子引物GGGGACCACTTTGTACAAGAAAGCTGGGT(SEQIDNO48)制備50μl含有10pmol的各種模板特異性引物和適當(dāng)量的模板DNA的PCR反應(yīng)物。將含有此PCR反應(yīng)混合物的管子放置在熱循環(huán)儀并95度孵育2分鐘。按以下進(jìn)行10個(gè)PCR循環(huán)變性94℃15秒50-60℃退火30秒68℃延伸按每kb靶擴(kuò)增子1分鐘將10μlPCR反應(yīng)產(chǎn)物轉(zhuǎn)移至含有attB1和attB2銜接子引物各40pmol的40μlPCR反應(yīng)混合物中。然后將含有該混合物的管子放置在95度的熱循環(huán)儀中并孵育1分鐘。按以下進(jìn)行5個(gè)PCR循環(huán)變性94℃15秒45℃退火30秒68℃延伸按每kb靶擴(kuò)增子1分鐘然后按以下進(jìn)行15至20個(gè)PCR循環(huán)變性94℃15秒55℃退火30秒68℃延伸按每kb靶擴(kuò)增子1分鐘然后通過(guò)瓊脂糖凝膠電泳分析此擴(kuò)增產(chǎn)物。實(shí)施例9突變分析λ噬菌體的attL和attR位點(diǎn)位點(diǎn)特異性重組中att位點(diǎn)特異性的決定因素為了研究att位點(diǎn)特異性的決定因素,系統(tǒng)地誘變?chǔ)耸删w的attL和attR位點(diǎn),并檢測(cè)這些位點(diǎn)以精確地確定哪些突變?cè)斐蒩tt位點(diǎn)特異性的獨(dú)特改變。正如本文提及的,以前已將特異性的決定因子定位在所有4種att位點(diǎn)(attB、attP、attL和attR)均一致的15bp核心區(qū)(GCTTTTTTATACTAA(SEQIDNO37))中的7bp重疊區(qū)(TTTATAC,該區(qū)域被定義整合酶蛋白的切割位點(diǎn),并是發(fā)生鏈交換的區(qū)域)。因此,為了檢查att序列對(duì)位點(diǎn)特異性的影響,通過(guò)PCR產(chǎn)生突變的attL和attR位點(diǎn),并在體外位點(diǎn)特異性重組分析中測(cè)試這些位點(diǎn)。以此方式,在核心att位點(diǎn)的7bp重疊區(qū)內(nèi)制備所有可能的單堿基對(duì)變化,并在此7bp重疊區(qū)之外但在此15bp核心att位點(diǎn)中制備其它5個(gè)改變。在體外重組分析中使用各attRPCR底物測(cè)試所有的attLPCR底物。方法為了檢測(cè)突變的attL和attR位點(diǎn)的重組效率和特異性,發(fā)展了一種簡(jiǎn)單的體外位點(diǎn)特異性重組分析。由于attL和attR的核心區(qū)靠近這些位點(diǎn)的末端,因此可以將期望的核苷酸改變摻入PCR引物中并產(chǎn)生一系列含有突變的attL和attR位點(diǎn)的PCR產(chǎn)物。含有attL和attR位點(diǎn)的PCR產(chǎn)物在使用GATEWAYTMLRCLONASETM酶混合物(InvitrgenCorp.,LifeTechnologiesDivision,Rockyille,MD)的體外反應(yīng)中用作底物。1.5kbattLPCR產(chǎn)物和1.0kbattRPCR產(chǎn)物之間的重組導(dǎo)致產(chǎn)生一個(gè)2.5kb的重組分子,我們使用瓊脂糖凝膠電泳和溴化乙啶染色監(jiān)測(cè)該重組分子。質(zhì)粒模板pEZC1301和pEZC1313(描述在PCT公開(kāi)文本W(wǎng)O00/52027中,其完整公開(kāi)并入本文作為參考),每個(gè)模板分別含有一個(gè)野生型attL或attR位點(diǎn),使用這些質(zhì)粒模板制備重組底物。以下列出了在PCR反應(yīng)中用于產(chǎn)生用作LRCLONASETM反應(yīng)底物的attLPCR產(chǎn)物的引物(大寫(xiě)字母代表不同于野生型序列的改變,而下劃線是15bp核心att位點(diǎn)中的7bp重疊區(qū);使用類似的一組PCR引物制備含有匹配突變的attRPCR產(chǎn)物)GATEWAYTM位點(diǎn)(注意在GATEWAYTM質(zhì)粒中attL2序列以“accca”開(kāi)頭,而在本實(shí)施例中attL2位點(diǎn)以“agcct”開(kāi)頭,反映了核心區(qū)域外的野生型attL。)attL1ggggagcctgcttttttGtacAaagttggcattataaaaa-agcattgc(SEQIDNO41)attL2ggggagcctgctttCttGtacAaagttggcattataaaaa-agcattgc(SEQIDNO42)野生型attL0ggggagcctgcttttttatacttaagttggcattataaaaa-agcattgc(SEQIDNO61)從野生型改變單堿基attLT1AggggagcctgctttAttatactaagttggcattataaaaa-agcattgc(SEQIDNO62)attLT1CggggagcctgctttCttatactaagttggcattataaaaa-agcattgc(SEQIDNO63)attLT1GggggagcctgctttGttatactaagttggcattataaaaa-agcattgc(SEQIDNO64)attLT2AggggagcctgcttttAtatactaagttggcattataaaaa-agcattgc(SEQIDNO65)attLT2CggggagcctgcttttCtatactaagttggcattataaaaa-agcattgc(SEQIDNO66)attLT2GggggagcctgcttttGtatactaagttggcattataaaa-aagcattgc(SEQIDNO67)attLT3AggggagcctgctttttAatactaagttggcattataaaa-aagcattgc(SEQIDNO68)attLT3CggggagcctgctttttCatactaagttggcattataaaa-aagcattgc(SEQIDNO69)attLT3GggggagcctgctttttGatactaagttggcattataaaa-aagcattgc(SEQIDNO70)attLA4CggggagcctgcttttttCtactaagttggcattataaaa-aagcattgc(SEQIDNO71)attLA4GggggagcctgcttttttGtactaagttggcattataaaa-aagcattgc(SEQIDNO72)attLA4TggggagcctgcttttttTtactaagttggcattataaaa-aagcattgc(SEQIDNO73)attLT5AggggagcctgcttttttaAactaagttggcattataaaa-aagcattgc(SEQIDNO74)attLT5CggggagcctgcttttttaCactaagttggcattataaaa-aagcattgc(SEQIDNO75)attLT5GggggagcctgcttttttaGactaagttggcattataaaa-aagcattgc(SEQIDNO76)attLA6CggggagcctgcttttttatCctaagttggcattataaaa-aagcattgc(SEQIDNO77)attLA6GggggagcctgcttttttatGctaagttggcattataaaa-aagcattgc(SEQIDNO78)attLA6TggggagcctgcttttttatTctaagttggcattataaaa-aagcattgc(SEQIDNO79)attLC7AggggagcctgcttttttataAtaagttggcattataaaa-aagcattgc(SEQIDNO80)attLC7GggggagcctgcttttttataGtaagttggcattataaaa-aagcattgc(SEQIDNO81)attLC7TggggagcctgcttttttataTtaagttggcattataaaa-aagcattgc(SEQIDNO82)在7bp重疊外改變單堿基attL8ggggagcctActtttttatactaagttggcattataaaa-aagcattgc(SEQIDNO83)attL9ggggagcctgcCtttttatactaagttggcattataaaaa-agcattgc(SEQIDNO84)attL10ggggagcctgcttCtttatactaagttggcattataaaaa-agcattgc(SEQIDNO85)attL14ggggagcctgcttttttatacCaagttggcattataaaaa-agcattgc(SEQIDNO86)attL15ggggagcctgcttttttatactaGgttggcattataaaaa-agcattgc(SEQIDNO87)注意其中頭9個(gè)堿基是ggggagcca(即緊接15bp核心區(qū)之前的位置腺苷替代了胸苷)的其它載體,可以或可以不含有上述單堿基對(duì)替換(或缺失),這些載體也可以用于這些實(shí)驗(yàn)中。按下述實(shí)施含有attL和attR的PCR產(chǎn)物的重組反應(yīng)8μlH2O2μlattLPCR產(chǎn)物(100ng)2μlattRPCR產(chǎn)物(100ng)4μl5X緩沖液4μlGATEWAYTMLRCLONASETM酶混合物20μl總體積將CLONASETM反應(yīng)物25℃孵育2小時(shí)。加入2μl10XCLONASETM終止液(蛋白酶K,2mg/ml)以終止反應(yīng)。在1%瓊脂糖凝膠上電泳10μl反應(yīng)混合物。結(jié)果使用各attRPCR底物在體外重組分析中測(cè)試了每個(gè)attLPCR底物。結(jié)果顯示,7bp重疊區(qū)(TTTATAC)頭3位中的改變強(qiáng)烈地改變了重組的特異性。這些突變的att位點(diǎn)每個(gè)均與野生型一樣發(fā)生重組,但僅與它們的關(guān)連突變伙伴重組;沒(méi)有檢測(cè)到它們與任何其它att位點(diǎn)突變體的重組。相反,最后4個(gè)位置中的改變僅部分改變特異性;這些突變體與其關(guān)連突變體和野生型att重組,并且這些突變與除了在7bp重疊區(qū)頭3位中具有突變的那些突變att位點(diǎn)外的所有其它突變att位點(diǎn)部分重組。發(fā)現(xiàn)7bp重疊區(qū)外的改變不影響重組的特異性,但一些改變確實(shí)影響重組的效率?;谶@些結(jié)果,確定了以下att位點(diǎn)特異性的規(guī)則·僅7bp重疊區(qū)中的改變影響特異性?!ゎ^3位中的改變強(qiáng)烈地影響特異性?!ぷ詈?位中的改變微弱地影響特異性。通過(guò)該方法,我們還評(píng)價(jià)了影響重組反應(yīng)的整個(gè)效率的突變。在這些實(shí)驗(yàn)中,我們觀察到,當(dāng)與其關(guān)連attR伙伴反應(yīng)時(shí),attLT1A和attLC7T底物輕微地增加(少于2倍)重組效率。并觀察到減低重組效率(大約2-3倍)的突變,包括attLA6G、attL14和attL15。可以推測(cè),這些突變反映了可影響Int蛋白在核心att位點(diǎn)結(jié)合的改變。這些實(shí)驗(yàn)的結(jié)果證明,7bp重疊區(qū)頭3位(TTTATAC)中的改變強(qiáng)烈地改變了重組特異性(即,在頭3個(gè)胸苷中具有一或多個(gè)突變的att序列僅與其關(guān)連伙伴重組,而不會(huì)與任何其它att位點(diǎn)突變體交叉反應(yīng))。相反,最后4位(TTTATAC)中的突變僅部分改變特異性(即,在最后4位中具有一或多個(gè)突變的att位點(diǎn)將與野生型att位點(diǎn)及所有其它的att位點(diǎn)(除了在7bp重疊區(qū)頭3位的一或多個(gè)位置中具有突變的那些att位點(diǎn)外)有部分的交叉反應(yīng))。沒(méi)有發(fā)現(xiàn)7bp重疊區(qū)之外的突變影響重組特異性,但發(fā)現(xiàn)一些影響重組效率(即造成重組效率降低)。實(shí)施例10發(fā)現(xiàn)增強(qiáng)GATEWAYTM克隆反應(yīng)效率的att位點(diǎn)突變?cè)谠O(shè)計(jì)以了解att位點(diǎn)特異性的決定因子的實(shí)驗(yàn)中,我們?cè)赼ttL的核心區(qū)中進(jìn)行了點(diǎn)突變。然后在LR反應(yīng)中使含有這些突變attL序列的核酸分子和含有關(guān)連attR位點(diǎn)(即,含有相應(yīng)于attL位點(diǎn)中突變的那些突變的attR位點(diǎn)),并按上述確定重組效率。我們注意到位于att位點(diǎn)核心區(qū)中的幾個(gè)突變輕微地增加(少于2倍)或降低(2-4倍之間)重組反應(yīng)的效率(表5)。我們還注意到這些突變大概反映了分別增加或降低整合酶蛋白結(jié)合核心att位點(diǎn)的相對(duì)親和力的改變。文獻(xiàn)中對(duì)整合酶核心結(jié)合位點(diǎn)(CAACTTNNT)的共有序列作過(guò)推測(cè),但并未對(duì)此進(jìn)行直接測(cè)試(見(jiàn)例如,Ross和Landy,Cell33261-272(1983))。此共有核心整合酶結(jié)合序列是通過(guò)比較attP和attB中發(fā)現(xiàn)的4個(gè)核心att位點(diǎn)每一個(gè)的序列及與核心序列類似并且表現(xiàn)出與整合酶在體外結(jié)合的5個(gè)非att位點(diǎn)的序列而確立的。這些實(shí)驗(yàn)提示,可以鑒定出許多增加整合酶與核心att位點(diǎn)的結(jié)合并由此增加GATEWAYTM克隆反應(yīng)的效率的att位點(diǎn)突變。實(shí)施例11核心區(qū)突變對(duì)重組效率的影響為了直接地比較att位點(diǎn)核心區(qū)中突變的克隆效率,在attB1-tet-attB2PCR產(chǎn)物的attB2位點(diǎn)中制備單堿基改變。然后在BP反應(yīng)中,使含有這些突變attB2序列的核酸分子和含有非關(guān)連attP位點(diǎn)(即野生型attP2)的核酸分子反應(yīng),并按上述確定重組效率。與標(biāo)準(zhǔn)attB1-tet-attB2PCR產(chǎn)物相比,這些含有突變attB2的PCR產(chǎn)物的克隆效率顯示在表6中。正如以上提及的,與attB1-tet-attB2PCR產(chǎn)物相比,attB2.2位點(diǎn)中的單堿基改變使attB1-tet-attB2.2PCR產(chǎn)物的克隆效率增加131%。有趣的是,該突變改變了整合酶的attB2核心結(jié)合位點(diǎn),產(chǎn)生與提出的共有序列更緊密匹配的序列。進(jìn)行其它實(shí)驗(yàn),以直接地比較attB1-tet-attB2PCR產(chǎn)物的克隆效率和所含attB位點(diǎn)具有提出的整合酶核心結(jié)合位點(diǎn)共有序列的PCR產(chǎn)物的克隆效率。使用以下attB位點(diǎn)擴(kuò)增attB-tetPCR產(chǎn)物attB1ggggacaagtttgtacaaaaaagcaggct(SEQIDNO47)attBl.6ggggacaaCtttgtacaaaaaagTTggct(SEQIDNO104)attB2ggggaccactttgtacaagaaagctgggt(SEQIDNO48)attB2.10ggggacAactttgtacaagaaagTtgggt(SEQIDNO105)在300ng(100fmol)pDONR201(IvitrogenCorp.,LifeTechnologiesDivision,CatNo.11798-014)和80ng(80fmol)attB-tetPCR產(chǎn)物之間20μl體積中通過(guò)25℃孵育1.5小時(shí),進(jìn)行BP反應(yīng),產(chǎn)生pENTR201-tet進(jìn)入克隆。表7顯示了對(duì)上述attB位點(diǎn)在BP反應(yīng)中的克隆效率進(jìn)行的比較。這些結(jié)果證明,含有優(yōu)選與提出的整合酶核心結(jié)合位點(diǎn)的共有序列匹配的序列的attBPCR產(chǎn)物能夠以比標(biāo)準(zhǔn)GATEWAYTMattB1和attB2PCR產(chǎn)物高4倍的效率產(chǎn)生進(jìn)入克隆。然后通過(guò)LR反應(yīng)(300ng(64fmol)將以上制備的進(jìn)入克隆轉(zhuǎn)移至pDEST20(InvitrogenCorp.,LifeTechnologiesDivision,CatNo.11807-013),方式是使300ng(64fmole)pDEST20與50ng(77fmol)各pENTR201-tet進(jìn)入克隆在20μl體積中混合;孵育1小時(shí)(25℃孵育)。表8對(duì)這些反應(yīng)的克隆效率進(jìn)行了比較。這些結(jié)果證明,引入attB1.6和attB2.10中隨著基因轉(zhuǎn)移至進(jìn)入克隆的突變輕微地增加LR反應(yīng)的效率。因此,本發(fā)明不僅包括attB位點(diǎn)中增加重組效率的突變,還包括導(dǎo)致通過(guò)BP反應(yīng)產(chǎn)生的attL位點(diǎn)的相應(yīng)突變。為了檢驗(yàn)在一定PCR產(chǎn)物量范圍內(nèi)attBl.6-tet-attB2.10PCR產(chǎn)物克隆效率的增加,進(jìn)行與上述類似的實(shí)驗(yàn),在這些實(shí)驗(yàn)中加入反應(yīng)混合物中的attBPCR產(chǎn)物量經(jīng)過(guò)滴定。結(jié)果顯示在表9中。這些結(jié)果證明,在20ng量時(shí)使用attB1.6-tet-attB2.10PCR產(chǎn)物與標(biāo)準(zhǔn)attB1-tet-attB2PCR產(chǎn)物相比克隆效率增加6倍之多。實(shí)施例12測(cè)定最佳重組效率對(duì)attB序列的要求為了檢測(cè)對(duì)attB的序列要求并確定在簡(jiǎn)并attB位點(diǎn)群體中哪個(gè)attB位點(diǎn)可以以最高的效率進(jìn)行克隆,我們進(jìn)行了一系列實(shí)驗(yàn)。設(shè)計(jì)在attB位點(diǎn)的B臂中含有5個(gè)簡(jiǎn)并堿基的簡(jiǎn)并PCR引物。由此,這些簡(jiǎn)并序列在BP反應(yīng)中隨基因轉(zhuǎn)移至進(jìn)入克隆,并隨后在LR反應(yīng)中隨著基因被轉(zhuǎn)移至表達(dá)克隆中。因此,簡(jiǎn)并attB和attL位點(diǎn)群可以從attB向attL往返地循環(huán)多個(gè)周期。通過(guò)改變每個(gè)轉(zhuǎn)移步驟的反應(yīng)條件(例如,通過(guò)減少反應(yīng)時(shí)間和/或降低DNA濃度),可以在每個(gè)周期逐漸增加反應(yīng)的嚴(yán)緊性,由此富集更為有效地進(jìn)行反應(yīng)的attB和attL位點(diǎn)群。使用以下簡(jiǎn)并PCR引物從pUC18擴(kuò)增含有l(wèi)acZα片段的500bp片段(僅顯示每個(gè)引物的attB部分)attB1GGGGACAAGTTTGTACAAAAAAGCAGGCT(SEQIDNO47)attB1n16-20GGGGACAAGTTTGTACAAAnnnnnAGGCT(SEQIDNO106)attB1n21-25GGGGACAAGTTTGTACAAAAAAGCnnnnn(SEQIDNO107)attB2GGGGACCACTTTGTACAAGAAAGCTGGGT(SEQIDNO48)attB2n16-20GGGGACCACTTTGTACAAGnnnnnTGGGT(SEQIDNO108)attB2n21-25GGGGACCACTTTGTACAAGAAAGCnnnnn(SEQIDNO109)簡(jiǎn)并att位點(diǎn)的起始群體大小是45或1024個(gè)分子。通過(guò)兩個(gè)BP反應(yīng)和兩個(gè)LR反應(yīng)轉(zhuǎn)移4個(gè)不同的群體。使用每個(gè)反應(yīng)物進(jìn)行轉(zhuǎn)化后,通過(guò)在含有適當(dāng)選擇抗生素的液體培養(yǎng)基中培養(yǎng),擴(kuò)增轉(zhuǎn)化體群體。通過(guò)堿裂解小量制備法從克隆群體制備DNA,并用于以下反應(yīng)。以下顯示了BP和LR克隆反應(yīng)的結(jié)果。BP-1,過(guò)夜反應(yīng)LR-1,pENTR201-lacZa×pDEST20/EcoRI,1小時(shí)反應(yīng)BP-2,pEXP20-lacZa/ScaI×pDONR201,1小時(shí)反應(yīng)LR-2,pENTR201-lacZa×pDEST6/NcoI,1小時(shí)反應(yīng)這些結(jié)果證明,隨著每次連續(xù)的轉(zhuǎn)移,整個(gè)att位點(diǎn)群的克隆效率都會(huì)增加,而且在attB位點(diǎn)的定義上有極大的靈活性??梢詮纳鲜龇磻?yīng)物中分離特定克隆,單個(gè)地測(cè)試重組效率,并進(jìn)行測(cè)序。然后將這些新特異性和已知實(shí)例進(jìn)行比較,以指導(dǎo)設(shè)計(jì)具有新重組特異性的新序列。此外,基于上述富集和篩選方案,普通技術(shù)人員可以容易地確定和使用其它重組位點(diǎn)(例如其它att位點(diǎn)、lox、FRT等)中的序列,導(dǎo)致使用含有這些序列的重組反應(yīng)的特異性增加。實(shí)施例13將功能性成分嵌入重組位點(diǎn)中用于本發(fā)明的重組位點(diǎn)還可以具有嵌入的功能或性質(zhì)。嵌入的功能是指由重組位點(diǎn)中不直接與重組效率或特異性有關(guān)的核苷酸序列所賦予的功能或性質(zhì)。例如,重組位點(diǎn)可以含有蛋白質(zhì)編碼序列(例如蛋白內(nèi)含子編碼序列)、內(nèi)含子/外顯子拼接位點(diǎn)、復(fù)制起點(diǎn)、和/或終止密碼子。一般地,構(gòu)成重組位點(diǎn)的核酸鏈越長(zhǎng),越易于向該位點(diǎn)摻入嵌入功能或性質(zhì)。相反,重組位點(diǎn)越長(zhǎng)就越可能具有干擾期望功能或性質(zhì)的特征(例如終止密碼子)。而且,還可以制備具有一個(gè)以上(例如2、3、4、5等)嵌入功能或性質(zhì)的重組位點(diǎn)。正如以下解釋的,一方面,本發(fā)明提供方法用于從RNA分子去除重組位點(diǎn)編碼的核苷酸序列。該方法的一個(gè)例子應(yīng)用了內(nèi)含子/外顯子拼接位點(diǎn)以從RNA轉(zhuǎn)錄本中除去重組位點(diǎn)編碼的RNA。再有,正如以下闡述的,編碼這些內(nèi)含子/外顯子拼接位點(diǎn)的核苷酸序列可以完全地或部分地嵌在所編碼序列要從RNA分子中切除的重組位點(diǎn)中,或這些內(nèi)含子/外顯子拼接位點(diǎn)可以由臨近的核酸序列編碼。類似地,一個(gè)外顯子/內(nèi)含子拼接位點(diǎn)可以由重組位點(diǎn)編碼,而另一個(gè)內(nèi)含子/外顯子拼接位點(diǎn)可以由其它核苷酸序列(例如載體的核苷酸序列或目的核酸)編碼。核酸拼接討論于以下出版物中R.Reed,Curr.Opin.Genet.Devel.6215-220(1996);S.Mount,Nucl.Acids.Res.10459-472(1982);P.Sharp.Cell77805-815(1994);K.Nelson和M.Green,GenesandDevel.23319-329(1988);和T.Cooper和W.Mattox,Am.J.Hum.Genet.61259-266(1997)。在某些情況下,從RNA轉(zhuǎn)錄本中除去相應(yīng)于重組位點(diǎn)的RNA,或除去重組位點(diǎn)編碼的氨基酸殘基是有利的。可以有多種方式除去這些序列,而且可以發(fā)生在RNA或蛋白質(zhì)水平上。一種情況是,當(dāng)核酸分子的ORF按一定方向插入載體以旨在表達(dá)ORF編碼的氨基酸殘基和載體編碼的氨基酸殘基(例如GFP)之間的融合蛋白(例如GFP)時(shí),通常除去由重組位點(diǎn)轉(zhuǎn)錄產(chǎn)生的RNA是有利的。在此情況下,ORF和載體編碼序列之間存在插入的重組位點(diǎn)可以導(dǎo)致重組位點(diǎn)(1)向mRNA提供密碼子以導(dǎo)致在表達(dá)產(chǎn)物中包括額外的氨基酸殘基,(2)向mRNA提供終止密碼子以阻礙期望融合蛋白的產(chǎn)生,和/或(3)造成mRNA的閱讀框移動(dòng)以致兩個(gè)蛋白不按符合閱讀框”的方式融合。從mRNA分子中除去重組位點(diǎn)的一個(gè)方法涉及使用內(nèi)含子/外顯子拼接位點(diǎn)(即拼接供體和拼接受體位點(diǎn))??梢詫⑵唇游稽c(diǎn)適當(dāng)?shù)胤胖迷诙鄠€(gè)位置。使用設(shè)計(jì)以表達(dá)具有N端GFP融合物的插入ORF的目的載體作為例子,可以由位于GFP編碼序列3’的載體序列編碼第1個(gè)拼接位點(diǎn),而第2個(gè)拼接位點(diǎn)可以部分地嵌在分隔GFP編碼序列和ORF編碼序列的重組位點(diǎn)中。而且,該第2個(gè)拼接位點(diǎn)可以接近重組位點(diǎn)的3’末端或可以位于距離重組位點(diǎn)3’短距離(例如2、4、8、10、20個(gè)核苷酸)的位置。此外,根據(jù)重組位點(diǎn)的長(zhǎng)度,第2個(gè)拼接位點(diǎn)可以完全地嵌在重組位點(diǎn)中。上述方法的修改涉及連接在表達(dá)時(shí)導(dǎo)致產(chǎn)生融合蛋白的多個(gè)核酸區(qū)段。一個(gè)具體例子中,一個(gè)核酸區(qū)段編碼GFP而另一核酸區(qū)段含有目的ORF。每個(gè)這些區(qū)段的側(cè)翼都有重組位點(diǎn)。此外,編碼GFP的核酸區(qū)段在近其3’端含有內(nèi)含子/外顯子拼接位點(diǎn),而含有目的ORF的核酸區(qū)段在近其5’端也含有內(nèi)含子/外顯子拼接位點(diǎn)。重組后,編碼GFP的核酸區(qū)段位于編碼目的ORF的核酸區(qū)段的5’。而且,這些兩個(gè)核酸區(qū)段被位于內(nèi)含子/外顯子拼接位點(diǎn)側(cè)翼的重組位點(diǎn)分開(kāi)。由此在融合mRNA轉(zhuǎn)錄后介入的重組位點(diǎn)被切除。因此,一方面,本發(fā)明指向從本文所述核酸產(chǎn)生的轉(zhuǎn)錄本中除去重組位點(diǎn)轉(zhuǎn)錄產(chǎn)生的RNA的方法??梢杂糜趯?nèi)含子/外顯子拼接位點(diǎn)導(dǎo)入核酸區(qū)段的一個(gè)方法是借助PCR。例如,可以使用引物產(chǎn)生相應(yīng)于目的ORF并含有重組位點(diǎn)及內(nèi)含子/外顯子拼接位點(diǎn)的核酸區(qū)段。當(dāng)與另一核酸區(qū)段發(fā)生重組的核酸區(qū)段編碼不按可翻譯格式(translatableformat)產(chǎn)生的RNA時(shí),還可以使用上述方法除去相應(yīng)于重組位點(diǎn)的RNA。該情況的一個(gè)例子是以一定方式將核酸區(qū)段插入載體中,以致導(dǎo)致產(chǎn)生反義RNA。正如以下討論的,該反義RNA可以例如和編碼核酶的RNA融合。因此,本發(fā)明還提供方法用于從這些方法中除去相應(yīng)于重組位點(diǎn)的RNA。本發(fā)明還提供方法用于從蛋白表達(dá)產(chǎn)物中通過(guò)蛋白拼接除去重組位點(diǎn)所編碼的氨基酸序列。編碼蛋白拼接位點(diǎn)的核苷酸序列可以完全地或部分地嵌在所編碼氨基酸序列將從蛋白質(zhì)中切除的重組位點(diǎn)中,或者可以由相鄰核苷酸序列編碼蛋白質(zhì)拼接位點(diǎn)。類似地,一個(gè)蛋白質(zhì)拼接位點(diǎn)可以由重組位點(diǎn)編碼,而另一蛋白質(zhì)拼接位點(diǎn)可以由其它核苷酸序列(例如,載體的核酸序列或目的核酸)編碼。已經(jīng)顯示,蛋白質(zhì)拼接可以通過(guò)從蛋白質(zhì)分子中切除蛋白內(nèi)含子并連接側(cè)翼區(qū)段來(lái)進(jìn)行(見(jiàn)例如Derbyshire等,Proc.Natl.Acad.Sci(USA)951356-1357(1998))。簡(jiǎn)而言之,蛋白內(nèi)含子是翻譯后通過(guò)自催化拼接過(guò)程從蛋白質(zhì)中切除的氨基酸區(qū)段。相當(dāng)多的蛋白質(zhì)內(nèi)含子共有序列已得到鑒定。(見(jiàn)例如,Perler,NucleicAcidRes.27346-347(1999)。)類似于內(nèi)含子/外顯子拼接,N和C端內(nèi)含子基序顯示出參與蛋白質(zhì)拼接。因此,本發(fā)明還提供組合物和方法,用于從蛋白表達(dá)產(chǎn)物中通過(guò)蛋白質(zhì)拼接除去重組位點(diǎn)編碼的氨基酸殘基。具體地,本發(fā)明此方面涉及將編碼蛋白內(nèi)含子拼接位點(diǎn)的核酸序列放置在位于兩個(gè)編碼區(qū)之間的重組位點(diǎn)的5’和3’末端。由此,當(dāng)在適當(dāng)條件下孵育蛋白質(zhì)表達(dá)產(chǎn)物時(shí),即可切除這些重組位點(diǎn)編碼的氨基酸殘基。可以使用蛋白質(zhì)拼接除去重組位點(diǎn)編碼的全部或部分氨基酸序列。編碼蛋白內(nèi)含子的核苷酸序列可以全部地或部分地嵌在重組位點(diǎn)中或可以位于這些位點(diǎn)鄰近的位置。在某些情況下,可能期望在重組位點(diǎn)編碼的N和/或C末端氨基酸序列之外再除去相當(dāng)數(shù)量的氨基酸殘基。在此情況下,可以將蛋白內(nèi)含子的編碼序列放置在距離重組位點(diǎn)5’和/或3’一定距離的位置(例如30、50、75、100等個(gè)核苷酸)。盡管適合切除蛋白內(nèi)含子的條件可以隨具體的蛋白內(nèi)含子以及含有此蛋白內(nèi)含子的蛋白而變,但Chong等,Gene192271-281(1997)證明修飾的釀酒酵母(Saccharomycescerevisiae)蛋白內(nèi)含子(稱作SceVMA蛋白內(nèi)含子)可以被多種藥劑誘導(dǎo)而發(fā)生自切割,所述藥劑包括1,4-二硫蘇糖醇(DTT)、β-巰基乙醇和半胱氨酸。例如,可以通過(guò)在存在30mMDTT時(shí),于4℃孵育16小時(shí),以誘導(dǎo)蛋白內(nèi)含子的切除/拼接。實(shí)施例14在真核細(xì)胞中通過(guò)mRNA前體拼接從RNA轉(zhuǎn)錄本中除去att位點(diǎn)在后生動(dòng)物細(xì)胞中通過(guò)mRNA前體轉(zhuǎn)錄本的拼接除去內(nèi)含子所必需的共有RNA序列通常含有以下3個(gè)元件1).內(nèi)含子5’末端外顯子-AG|GTRAGT-內(nèi)含子;此處|表示內(nèi)含子和外顯子之間的邊界,而R=嘌呤核苷酸。此元件本文中被稱作(GT);2).內(nèi)含子3’末端內(nèi)含子-Yn-N-CAG|G-外顯子;此處Yn=富含嘧啶的10-12個(gè)核苷酸序列。此元件本文中被稱作(Yn-AG);3).內(nèi)含子中的分支點(diǎn),距離(Yn-AG)5’約20-40堿基的位置YNRA*Y;此處Y是嘧啶核苷酸而A*是參與最初的轉(zhuǎn)酯反應(yīng)以形成RNA套索的分支點(diǎn)腺苷。此元件在本文中稱作(BP-A*)。以上顯示的帶下劃線序列是高度保守的序列,并且一般被認(rèn)為是拼接活性所必需的;共有序列中其它核苷酸的高度保守性較低。1.attB拼接可以將這些拼接元件和含有att位點(diǎn)的GATEWAYTM載體在至少以下三個(gè)途徑中進(jìn)行組合以便通過(guò)RNA拼接除去attB1位點(diǎn)。方法1(GT)---(BP-A*)[attB1](Yn-AG)--ORF此方面中,利用了attB核心序列側(cè)翼5’核苷酸的靈活性,(BP-A*)元件就位于attB1的5’末端,而(Yn-AG)共有序列與attB1序列的3’末端合并。(GT)共有序列可以方便地位于(BP-A*)上游的10或更多個(gè)核苷酸處。這種排列的優(yōu)點(diǎn)是在attB1位點(diǎn)的3’末端和編碼ORF的序列之間需要加入最少的序列。使用此方法的一個(gè)潛在困難是(Yn-AG)中的富含嘧啶的序列與相對(duì)富含嘌呤的attB1序列重疊。因此,在某些情況下,attB1位點(diǎn)中足夠多以致允許有效拼接的核苷酸改變(至C或T)可能與有效的B×P重組是不相容的。在表達(dá)克隆中attB1中位于重組切割位點(diǎn)5’的序列是由目的載體提供的,而且該位點(diǎn)的3’序列來(lái)源于attB-PCR產(chǎn)物(大多數(shù)情況中)。如果拼接反應(yīng)旨在將編碼N端蛋白(由目的載體提供)的RNA與編碼另一ORF(由進(jìn)入克隆提供)的RNA在RNA水平上融合,則(GT)和(Yn-AT)的位置一般按一定方式定位,以便拼接產(chǎn)物維持期望的翻譯閱讀框。方法2(GT)---(BP-A*)[attB1](Yn-AG)-ORF在此方法中,(Yn-AG)共有序列緊鄰attB1位點(diǎn);因此,(BP-A*)元件中的分支點(diǎn)A*一般需要靠近attB1位點(diǎn)。因此,(Yn-AG)中與AG的距離一般不多于約40個(gè)核苷酸??梢詫?Yn-AG)序列作為引物銜接子的一部分來(lái)添加,前提是使用attB-PCR構(gòu)建進(jìn)入克隆。而且,可以使用利于有效拼接的共有(Yn-AG)序列設(shè)計(jì)該引物。在一些情況下,(BP-A*)和(Yn-AG)之間的attB1序列的存在可能會(huì)干擾拼接。如果這樣的話,則可以對(duì)attB1序列進(jìn)行突變以提供更佳的拼接序列。方法3(GI)---[attB1]-(BP-A*)---(Yn-AG)--ORF該方法使用的排列允許為包含(BP-A*)---(Yn-AG)的這些組合元件選擇最佳的拼接序列以及間隔序列。該組合的最小大小預(yù)期是約20個(gè)核苷酸。因此,該序列通常作為約45-50個(gè)核苷酸的attB1-引物銜接子添加至PCR產(chǎn)物上。類似的考慮應(yīng)用于設(shè)計(jì)允許從mRNA中通過(guò)拼接除去attB2位點(diǎn)的序列。但由于在此情況下,(BP-A*)和(Yn-AG)可以由目的載體提供,所以最有吸引力的選擇是ORF-(GT)[attB2]--(BP-A*)--(Yn-AG),此處(GT)和attB2之間的序列最小,從而降低了attB2-PCR銜接子引物的大小。適用于具體情況中的最小序列可以使用本文所述方法通過(guò)實(shí)驗(yàn)確定。制備拼接attB位點(diǎn)的載體的另一方式是直接構(gòu)建含有位于attB1和attB2位點(diǎn)側(cè)翼的拼接信號(hào)的載體。上述方法的主要區(qū)別是使用attB引物銜接子添加的任何序列(如在B和C中)都可以預(yù)先安裝在載體本身中靠近位于attB位點(diǎn)之間的多克隆位點(diǎn)。2.attL拼接編碼attL1和attL2位點(diǎn)的序列可以通過(guò)RNA拼接從轉(zhuǎn)錄本中除去。然而,attL的100個(gè)核苷酸長(zhǎng)度限制了對(duì)安排這些拼接序列元件的方式的選擇。一般將attL1放置在(BP-A*)和(Yn-AG)之間時(shí)該距離過(guò)大。一個(gè)可以使用的選擇方案是可以將這些元件的一個(gè)或兩個(gè)嵌在突變版本的attL1中。另一個(gè)方法是可以由attB-銜接子引物提供這些元件(即,(BP-A*)和(Yn-AG)),而可以由attP供體質(zhì)粒提供(GT)。通過(guò)這些元件在B×P反應(yīng)中的重組,可以產(chǎn)生用于拼接attB1的具有拼接位點(diǎn)的進(jìn)入克隆。類似地,對(duì)于attL2的拼接,(GT)和(Bp-A*)之間所能允許的序列長(zhǎng)度也沒(méi)有實(shí)際的限制。因此,可以在attB2銜接子引物上提供(GT),而由attP供體載體提供(BP-A*)和(Yn-AG)。對(duì)于此情況,attP供體載體一般需要含有真核啟動(dòng)子而且一般需要除去rrnB轉(zhuǎn)錄終止序列。(GT)和(BP-A*)之間attL2序列產(chǎn)生不利影響的可能性似乎是低的,但可能需要逐個(gè)案例地確定。從進(jìn)入克隆轉(zhuǎn)錄本中拼接除去attL序列的潛在優(yōu)點(diǎn)在于使用者可以直接將PCR產(chǎn)物作為進(jìn)入克隆來(lái)克隆和表達(dá),而無(wú)需再亞克隆在目的載體中。而且,在不減少LxR重組的情況下,我們的attL1序列中終止密碼子似乎是難于除去的,這些終止密碼子的存在對(duì)于與N端肽融合的ORF的翻譯并不重要。以上描述了RNA拼接在GATEWAYTM系統(tǒng)中的某些應(yīng)用,目的是除去ORF和N端序列之間的attB1和除去蛋白質(zhì)融合物的ORF序列和C端序列之間的attB2序列。其它應(yīng)用是本領(lǐng)域技術(shù)人員所明了的。而且,一個(gè)這樣的應(yīng)用是使用RNA拼接程序除去置于真核表達(dá)載體中編碼多個(gè)蛋白域的序列之間的att序列(作為基于GATEWAYTM重組的亞克隆反應(yīng)的結(jié)果),此處編碼各個(gè)域的ORF被att位點(diǎn)序列分隔開(kāi)。這些載體可以容易地通過(guò)具有多種特異性的att位點(diǎn)(例如att1、att2、att3、att4等)的GATEWAYTM重組來(lái)構(gòu)建。盡管該方法允許快速構(gòu)建蛋白融合物以及對(duì)編碼蛋白域的DNA序列進(jìn)行改組,但典型地這些重組產(chǎn)物將含有25bpattB位點(diǎn)(或100bpattL位點(diǎn))插在這些域之間,而通??赡芷谕ミ@些位點(diǎn)。描述的RNA拼接機(jī)制是除去這些介入序列的一個(gè)途徑。使用拼接除去多個(gè)蛋白質(zhì)域之間的att位點(diǎn)也使得使用attB和attP位點(diǎn)之間的GATEWAYTM重組反應(yīng)制備這些結(jié)構(gòu)變得實(shí)際可行,該反應(yīng)將產(chǎn)生attL和attR位點(diǎn)。這是因?yàn)樵谶m當(dāng)設(shè)計(jì)的載體中通過(guò)RNA拼接反應(yīng)可以除去任何類型的att序列(attB或attL)。在其它情況下,這將同樣可以用于通過(guò)拼接除去attR和/或attP位點(diǎn)。第二種應(yīng)用解決了獲得較大或稀少mRNA的拷貝的常見(jiàn)問(wèn)題。一些mRNA由于大尺寸和/或低豐度是難于進(jìn)行整體逆轉(zhuǎn)錄(成cDNA)的。常常是可以獲得cDNA的一個(gè)或兩個(gè)末端,但不能作為一個(gè)分子獲得整個(gè)序列。當(dāng)可以獲得一起組成整個(gè)mRNA序列的cDNA的兩個(gè)或更多個(gè)不同部分時(shí),可以確定這些cDNA序列的序列并使用PCR引物進(jìn)行合成。然后使用attB-引物可以通過(guò)PCR擴(kuò)增整個(gè)轉(zhuǎn)錄本的各非重疊部分。然后可以使用GATEWAYTM重組按適當(dāng)順序組合這些擴(kuò)增的序列。該重組產(chǎn)物將按適當(dāng)順序包含各個(gè)序列,但這些序列之間間隔att位點(diǎn)。只要有適當(dāng)?shù)霓D(zhuǎn)錄啟動(dòng)子和終止信號(hào),就可以使用這些結(jié)構(gòu)體外制備RNA以用于體外拼接反應(yīng)中,或使用允許在細(xì)胞內(nèi)經(jīng)RNA拼接后發(fā)生轉(zhuǎn)錄的適當(dāng)結(jié)構(gòu)轉(zhuǎn)染后生動(dòng)物的細(xì)胞。以此方式,然后可以制備真正的mRNA轉(zhuǎn)錄本。一些mRNA轉(zhuǎn)錄本可以直接地用于研究該拼接轉(zhuǎn)錄本編碼的蛋白質(zhì)的生物學(xué)功能?;蛘?,由于使用該方法可以大量地產(chǎn)生這些轉(zhuǎn)錄本,因此使得制備拼接RNA的cDNA拷貝更為可行。該cDNA缺少介入的att序列,可以用于在缺少適當(dāng)拼接機(jī)器的細(xì)胞(如大腸桿菌)中產(chǎn)生編碼的蛋白質(zhì)。該技術(shù)的第三種應(yīng)用使得可以制備由于低豐度或缺少適當(dāng)?shù)慕M織來(lái)源而難于獲得的mRNA的復(fù)制物。大多數(shù)后生動(dòng)物編碼蛋白質(zhì)的基因由被內(nèi)含子序列分開(kāi)的外顯子序列組成。無(wú)論何時(shí)可以通過(guò)生物信息學(xué)算法精確地從基因組DNA序列預(yù)測(cè)基因的外顯子-內(nèi)含子邊界,都可以合成含有外顯子序列的側(cè)翼有att位點(diǎn)序列的PCR產(chǎn)物。一旦適當(dāng)設(shè)計(jì)了這些產(chǎn)物側(cè)翼的att序列,即可使用GATEWAYTM重組按適當(dāng)順序使它們彼此連接,并同時(shí)保持正確的翻譯閱讀框。通過(guò)將適當(dāng)?shù)霓D(zhuǎn)錄信號(hào)包括在內(nèi),這些結(jié)構(gòu)可以充當(dāng)模板合成含有均被att序列分開(kāi)的有序排列外顯子序列的RNA轉(zhuǎn)錄本。如果在這些結(jié)構(gòu)中包括適當(dāng)?shù)钠唇有盘?hào),則產(chǎn)生的轉(zhuǎn)錄本可以通過(guò)后生動(dòng)物細(xì)胞的拼接反應(yīng)加工而產(chǎn)生相應(yīng)于天然產(chǎn)生的mRNA序列的核酸。而且,按上述制備的通過(guò)拼接轉(zhuǎn)錄本產(chǎn)生這些mRNA的細(xì)胞可以直接地用于研究生物學(xué)功能或作為期望mRNA的來(lái)源以產(chǎn)生其cDNA。或者,可以使用具有適當(dāng)組成的拼接提取物體外拼接這些結(jié)構(gòu)。實(shí)施例15確定細(xì)胞的基因表達(dá)譜本發(fā)明還提供組合物和方法用于克隆和測(cè)序多個(gè)cDNA分子。一般地,這些方法涉及制備cDNA分子多聯(lián)體并對(duì)這些分子進(jìn)行測(cè)序反應(yīng)以確定單個(gè)插入片段的核苷酸序列。這些方法對(duì)于確定特定細(xì)胞和/或組織的基因表達(dá)譜(expressionprofile)是尤其有用的。圖23中顯示了該方法的一個(gè)例子以及通過(guò)上述方法制備的載體。圖23所示載體含有一系列通過(guò)attB位點(diǎn)彼此連接的相對(duì)短cDNA插入片段(例如長(zhǎng)10、15、20、25、30、45或50個(gè)核苷酸)。圖23所示載體還含有鄰近c(diǎn)DNA插入位點(diǎn)兩邊的測(cè)序引物位點(diǎn)。作為細(xì)胞或組織中表達(dá)的基因的核酸分子可以通過(guò)各種方式被分割成相對(duì)小的片段,包括機(jī)械剪切、用一個(gè)或組合的限制性酶(例如NlaIII、Sau3A等)消化、或用幾乎或完全不具有序列特異性的內(nèi)切核酸酶(例如微球菌(Micrococcal)核酸酶,DNAseI等)。一般對(duì)條件進(jìn)行調(diào)整以便產(chǎn)生指定平均大小的核酸片段。而且,如果需要的話,可以在插入載體前分離具有特定大小的核酸片段?;诖笮》蛛x核酸分子的方法是本領(lǐng)域已知的,包括柱層析和凝膠電泳(例如瓊脂糖和聚丙烯酰胺凝膠電泳)??梢酝ㄟ^(guò)對(duì)本發(fā)明方法連接起來(lái)并使用本領(lǐng)域已知的標(biāo)準(zhǔn)方法將其插入測(cè)序載體中的核酸進(jìn)行測(cè)序以獲得核苷酸序列數(shù)據(jù)。在大多數(shù)情況下,測(cè)序載體中核酸插入片段的5’至3’方向和所測(cè)序的鏈均與確定細(xì)胞或組織的基因表達(dá)譜無(wú)關(guān)。這是因?yàn)橐话銦o(wú)論所測(cè)序的核酸區(qū)段的方向或所測(cè)序的鏈?zhǔn)窃鯓拥?,都可以確定測(cè)序核酸所來(lái)源的mRNA。因此,本發(fā)明提供方法以確定細(xì)胞和/或組織的基因表達(dá)譜。一方面,本發(fā)明提供確定細(xì)胞和/或組織的基因表達(dá)譜的方法,包括(a)從獲自細(xì)胞和/或組織的RNA制備一或多群cDNA分子,其中這些群體中的單個(gè)cDNA分子包含至少兩個(gè)能夠和位于相同或不同cDNA分子群的單個(gè)成員上的至少一個(gè)重組位點(diǎn)發(fā)生重組的重組位點(diǎn),(b)在造成(a)的核酸分子接合的條件下將這些核酸分子和一或多個(gè)重組蛋白接觸,和(c)確定該接合的核酸分子的序列。實(shí)施例16使用GATEWAYTM系統(tǒng)克隆Tet和lacZ基因?qū)⒁韵耡ttB位點(diǎn)加在通過(guò)標(biāo)準(zhǔn)方法合成的PCR引物上。我們按標(biāo)準(zhǔn)GATEWAYTM閱讀框(見(jiàn)GATEWAYTMGATEWAYTM克隆技術(shù)說(shuō)明手冊(cè)(InvitrogenCorp.,LifeTechnologiesDivision))顯示attB1和attB2位點(diǎn)并表示如下。可以按適當(dāng)方式改變attB5的閱讀框??梢赃x擇閱讀框以便產(chǎn)生融合蛋白。通過(guò)PCR擴(kuò)增編碼tet基因(用5’-attB1和3’-attB5引發(fā)的)和lac基因(用5’-attB5R和3’-attB2引發(fā)的)核酸區(qū)段并按下述使用聚乙二醇進(jìn)行沉淀。在50μlPCR反應(yīng)物中加入150μlTE,之后加入100μl30%PEG8000、30mMMgCl2。然后混合該溶液并以約10,000xg室溫離心15分鐘。然后除去PEG溶液并將沉淀溶解在TE中。將該B1-tet-B5PCR產(chǎn)物和attP1-ccdB-attP5供體載體(pDONR-P1/P5)混合,并使用標(biāo)準(zhǔn)方案(見(jiàn)本文實(shí)施例3)與BPCLONASETM反應(yīng),以產(chǎn)生attL1-tet-attL5進(jìn)入克隆。將B5R-lacZ-B2PCR產(chǎn)物和attP5R-ccdB-attP2供體載體(pDONR-P5R/P2)混合,并與BPCLONASETM反應(yīng)產(chǎn)生attR5-lacZ-attL2進(jìn)入克隆。在25℃孵育1-4小時(shí)后,加入2μl蛋白酶K(2mg/ml)終止BP反應(yīng)。然后用LR載體(即進(jìn)入克隆)轉(zhuǎn)化DH5α細(xì)胞,并鋪在LB-Kan平板上。25℃孵育過(guò)夜。從單個(gè)DH5α菌落小量制備DNA,并通過(guò)瓊脂糖凝膠電泳定量。在含有以下成分的20μl反應(yīng)體積中預(yù)備LRCLONASETM反應(yīng)物60ng(25fmol)的超螺旋tet進(jìn)入克隆75ng(20fmol)的超螺旋lacZ進(jìn)入克隆150ng(35fmol)用NcoI線性化的pDEST6(描述在PCT公開(kāi)文本W(wǎng)O00/52027中,其完整公開(kāi)本文作為參考)4μlLR4反應(yīng)緩沖液4μlLRCLONASETM反應(yīng)物在25℃孵育過(guò)夜,并用2μl蛋白酶K溶液(2mg/ml)終止。使用2μl轉(zhuǎn)化100μlLEDH5α細(xì)胞并鋪在含有XGal的LBamp平板上。以1.6×108cfu/μgpUCDNA的效率,轉(zhuǎn)化細(xì)胞的轉(zhuǎn)化混合物產(chǎn)生約35,000個(gè)菌落。將24個(gè)菌落挑取至含有四環(huán)素和XGal的平板上。24菌落中24個(gè)都是四環(huán)素抗性的。使用15個(gè)菌落接種2mlLBamp培養(yǎng)液用于小量制備。15/15個(gè)小量制備物含有正確長(zhǎng)度(8.8kb)的超螺旋質(zhì)粒。用EcoRV消化小量制備的DNA。觀察到的條帶圖與按正確方向克隆的兩個(gè)片段一致。所獲核酸產(chǎn)物由連接在一起并克隆在目的載體中的兩個(gè)片段組成。這兩個(gè)片段的結(jié)構(gòu)與插入目的載體中的一致,見(jiàn)下(箭頭指示attB位點(diǎn)相對(duì)重疊序列的方向)attB1→tet←attB5-lacZ←attB2。實(shí)施例17使用GATEWAYTM系統(tǒng)克隆tet、lacZ和neo基因?qū)⒁韵耡ttB位點(diǎn)加入通過(guò)標(biāo)準(zhǔn)方法合成的PCR引物中。我們按標(biāo)準(zhǔn)GATEWAYTM閱讀框(見(jiàn)GATEWAYTMGATEWAYTM克隆技術(shù)說(shuō)明手冊(cè)(InvitrogenCorp.,LifeTechnologiesDivision))顯示attB1和attB2位點(diǎn)并表示如下??梢杂墒褂谜咧付╝ttB5和attB21的閱讀框。通過(guò)PCR擴(kuò)增編碼tet基因(用5’-attB1和3’-attB5引發(fā)的)、Neo基因(用5’-attB5R和3’-attB21R引發(fā)的)和lacZ基因(用5’-attB21和3’-attB2引發(fā)的)核酸區(qū)段并使用聚乙二醇沉淀。將該B1-tet-B5PCR產(chǎn)物和attP1-ccdB-attP5供體載體(pDONR-P1/P5)混合,并使用標(biāo)準(zhǔn)方案與BPCLONASETM反應(yīng),以產(chǎn)生attL1-tet-attL3進(jìn)入克隆。將B5R-Neo-B21RPCR產(chǎn)物和attP5R-ccdB-attP21R供體載體(pDONR-P5R/P2)混合,并與BPCLONASETM反應(yīng)產(chǎn)生attR5-Neo-attR21進(jìn)入克隆。將B21-lacZ-B2PCR產(chǎn)物和attP21-ccdB-attP2供體載體(pDONR-P21/P2)混合并與BPCLONASETM反應(yīng)以產(chǎn)生attL21-lacZ-attL2進(jìn)入克隆。在含有以下成分的20μl反應(yīng)體積中預(yù)備LRCLONASETM反應(yīng)物40ng(17fmol)的超螺旋tet進(jìn)入克隆50ng(19fmol)的超螺旋或線性(VspI消化的)Neo進(jìn)入克隆75ng(20fmol)的超螺旋lacZ進(jìn)入克隆150ng(35fmol)NcoI線性化的pDEST64μlLR4反應(yīng)緩沖液(200mMTrisHCl(pH7.5)、4.75mMEDTA、4.8mg/mlBSA、445mMNaCl、47.5mM亞精胺)4μlLRCLONASETM反應(yīng)物在25℃孵育過(guò)夜,并用2μl蛋白酶K溶液(2mg/ml)終止。使用2μl轉(zhuǎn)化100μlDH5αLE細(xì)胞并鋪在含有XGal的LBamp平板上。在具有超螺旋進(jìn)入克隆的轉(zhuǎn)化混合物中產(chǎn)生約3,200個(gè)菌落。在使用含VspI消化的Neo進(jìn)入克隆的反應(yīng)物進(jìn)行的轉(zhuǎn)化混合物中產(chǎn)生5,300個(gè)菌落。感受態(tài)的效率為1.2×108cfu/μgpUCDNA。所有菌落均表現(xiàn)出藍(lán)色,指示存在lacZ基因。將9個(gè)菌落挑取至含有XGal的tet平板上。9菌落中9個(gè)都是四環(huán)素抗性的。使用9個(gè)菌落接種2mlLBamp培養(yǎng)液用于小量制備。9個(gè)小量制備物中9個(gè)含有正確長(zhǎng)度(11kb)的超螺旋質(zhì)粒。用EcoRV消化9個(gè)小量制備的DNA。觀察到的條帶圖與按正確方向克隆的三個(gè)片段一致。所獲核酸產(chǎn)物由連接在一起并克隆在目的載體中的三個(gè)片段組成。這三個(gè)片段的結(jié)構(gòu)與插入目的載體中的一致,見(jiàn)下(箭頭指示attB位點(diǎn)相對(duì)重疊序列的方向)attB1→tet←attB5-Neo-attB21→lacZ←attB2。實(shí)施例18使用GATEWAYTM和具有不同特異性的多個(gè)att位點(diǎn)克隆lux操縱子使用緊接以下列出的引物,擴(kuò)增費(fèi)氏弧菌(Vibriofischeria)基因組DNA的lux操縱子基因(luxA、luxb、luxC、luxD和luxE),以便在每個(gè)ORF的5’末端引入最佳的Shine-Delgarno和Kozak序列(ggaggtatataccatg(SEQIDNO118))并在3’末端引入T7啟動(dòng)子和終止密碼子(gaagctatagtgagtcgtatta)。表10.SD5’和T73’lux引物。SD5′luxAggaggtatataccatgAAGTTTGGAAATATTTGTTTTTC(SEQIDNO119)T73′luxAgaagctatagtgagtcgtattaTTTAGGTTCTTTTAAGAAAGGAGCGAC(SEQIDNO120)SD5′luxBggaggtatataccatgAAATTTGGATTATTTTTTCTAAAC(SEQIDNO121)T73′luxBgaagctatagtgagtcgtattaTGGTAAATTCATTTCGATTTTTTGG(SEQIDNO122)SD5′luxCggaggtatataccatgAATAAATGTATTCCAATGATAATTAATGG(SEQIDNO123)T73′luxCgaagctatagtgagtcgtattaTGGGACAAAAACTAAAAACTTATCTTCC(SEQIDNO124)SD5′luxDggaggtatataccatgAAAGATGAAAGTGCTTTTTTTACGATTG(SEQIDNO125)T73′luxDgaagctatagtgagtcgtattaAGCCAATTCTAATAATTCATTTTC(SEQIDNO126)SD5′luxEggaggtatataccatgACTGTCCATACTGAATATAAAAGAAATC(SEQIDNO127)T73′luxEgaagctatagtgagtcgtattaAATCCTTGATATTCTTTTGTATGACATTAGC(SEQIDNO128)使用緊接以下列出的attB-SD和attB-T7銜接子引物,以Shine-Delgarno和T7啟動(dòng)子序列作為引物位點(diǎn)進(jìn)一步擴(kuò)增PCR產(chǎn)物,以便向PCR產(chǎn)物的末端添加attB位點(diǎn)。表11attBSD和T7銜接子引物。B1.6SDGGGGACAACTTTGTACAAAAAAGTTGAAggaggtatataccatg(SEQIDNO129)B5T7GGGGACAACTTTGTATAATAAAGTTGgaagctatagtgagtcgt(SEQIDNO130)B5RSDGGGGACAACTTTATTATACAAAGTTGAAggaggtatataccatg(SEQIDNO131)B11T7GGGGACAACTTTGTATAGAAAAGTTGgaagctatagtgagtcgt(SEQIDNO132)B11RSDGGGGACAACTTTTCTATACAAAGTTGAAggaggtatataccatg(SEQIDNO133)B17T7GGGGACAACTTTGTATACAAAAGTTGgaagctatagtgagtcgt(SEQIDNO134)B17RSDGGGGACAACTTTTGTATACAAAGTTGAAggaggtatataccatg(SEQIDNO135)B21T7GGGGACAACTTTGTATTAAAAAGTTGgaagctatagtgagtcgt(SEQIDNO136)B21RSDGGGGACAACTTTTTAATACAAAGTTGAAggaggtatataccatg(SEQIDNO137)B2.10T7GGGGACAACTTTGTACAAGAAAGTTGgaagctatagtgagtcgt(SEQIDNO138)以此方式,產(chǎn)生以下attBPCR產(chǎn)物attB1.6-SD-luxC-T7-attB5attB5R-SD-luxD-T7-attVB11attB11R-SD-luxA-T7-attB17attB17R-SD-luxB-T7-attB21attB21R-SD-luxE-T7-attB2.10每個(gè)attBPCR產(chǎn)物都用聚乙二醇沉淀并與適當(dāng)?shù)腶ttP質(zhì)粒反應(yīng)產(chǎn)生每個(gè)luxORF的進(jìn)入克隆。表12.BP反應(yīng)設(shè)置25℃孵育反應(yīng)物過(guò)夜。每個(gè)反應(yīng)物通過(guò)加入2μl蛋白酶K(2mg/ml)溶液終止并37℃孵育10分鐘。使用每個(gè)反應(yīng)物的2μl轉(zhuǎn)化LEDH5α細(xì)胞。將每個(gè)轉(zhuǎn)化的100μl(1/10)鋪在含有50μg/ml卡那霉素的LB瓊脂上。通過(guò)快速小量制備分析確定,以從每個(gè)反應(yīng)物中分離適當(dāng)?shù)膒ENTR-lux克隆。用VspI消化luxA進(jìn)入克隆(pENTR-luxA)以在該質(zhì)粒骨架中線性化該質(zhì)粒。5個(gè)lux進(jìn)入克隆每個(gè)取等量(40ng)與150ngpDEST14在含有LR4緩沖液和LRClonase的單個(gè)LR反應(yīng)中混合。制備由無(wú)Clonase反應(yīng)和無(wú)pENTR/luxA反應(yīng)組成的陰性對(duì)照反應(yīng)。表13.LR反應(yīng)設(shè)置25℃孵育反應(yīng)物過(guò)夜。每個(gè)反應(yīng)物通過(guò)加入4μl蛋白酶K(2mg/ml)溶液終止并37℃孵育10分鐘。使用每個(gè)反應(yīng)物的2μl轉(zhuǎn)化LEDH5α細(xì)胞。將每個(gè)轉(zhuǎn)化的100μl(1/10)鋪在含有100μg/ml氨芐青霉素的LB瓊脂上。對(duì)于反應(yīng)1(無(wú)clonase)轉(zhuǎn)化沒(méi)有產(chǎn)生菌落,對(duì)于反應(yīng)2(無(wú)pENTRluxADNA)產(chǎn)生約200個(gè)菌落,對(duì)于反應(yīng)3(完整的反應(yīng))產(chǎn)生約2500個(gè)菌落。從反應(yīng)3挑取10個(gè)菌落并通過(guò)小量制備分析進(jìn)行檢測(cè)。基于超螺旋質(zhì)粒DNA的大小(10.3kb)并通過(guò)診斷限制性消化,所有10個(gè)克隆經(jīng)測(cè)定均是正確的。將合成的lux操縱子結(jié)構(gòu)轉(zhuǎn)化至BL21SI細(xì)胞中,并通過(guò)光度測(cè)定法監(jiān)測(cè)螢光素酶的活性。證明4個(gè)獨(dú)立的分離物在BL21SI細(xì)胞中產(chǎn)生可滴定的鹽誘導(dǎo)光。在含有pUCDNA的BL21SI細(xì)胞中沒(méi)有檢測(cè)到光。由于在大腸桿菌細(xì)胞中產(chǎn)生和檢測(cè)到光輻射,由此證實(shí)了所有5個(gè)lux基因的功能性活性。實(shí)施例19產(chǎn)生pDONR載體正如以上實(shí)施例(lux操縱子克隆),通過(guò)attBPCR克隆產(chǎn)生大量載體元件進(jìn)入克隆。對(duì)進(jìn)入克隆進(jìn)行設(shè)計(jì),以便當(dāng)一組4個(gè)載體元件進(jìn)入克隆一起反應(yīng)時(shí),每個(gè)載體元件連接在一起組成一個(gè)新載體(圖26A-26B)。在本實(shí)施例中,構(gòu)建了兩個(gè)新的attPDONOR載體。制備下組attBPCR產(chǎn)物attB21R-attP1-ccdB-cat-attP2-attB5attB5R-kan-attB11attB5R-amp-attB11attB11R-loxP-attB17attB17R-pUCori-attB21通過(guò)PEG沉淀純化每個(gè)attBPCR產(chǎn)物,并使之與適當(dāng)?shù)腶ttP質(zhì)粒反應(yīng)以產(chǎn)生每個(gè)載體元件的進(jìn)入克隆,見(jiàn)下表14BP反應(yīng)設(shè)置25℃孵育反應(yīng)物過(guò)夜。每個(gè)反應(yīng)通過(guò)加入2μl蛋白酶K(2mg/ml)溶液來(lái)終止,并在37℃孵育10分鐘。每個(gè)反應(yīng)物2μl用于轉(zhuǎn)化LEDH5α細(xì)胞。每個(gè)轉(zhuǎn)化取100μl(1/10)鋪在含有50μg/ml卡那霉素的LB瓊脂上。挑取菌落并通過(guò)快速小量制備分析用于分離以下pENTR克隆pENTR-attR21-attP1-ccdB-cat-attP2-attL5(分離自反應(yīng)2)pENTR-attR5-kan-attL11(分離自反應(yīng)4)pENTR-attR5-amp-attL11(分離自反應(yīng)6)pENTR-attR11-loxP-attL17(分離自反應(yīng)8)pENTR-attR17-ori-attL211(分離自反應(yīng)10)用VspI消化attR21-attP1-ccdB-cat-attP2-attL5進(jìn)入克隆以便在該質(zhì)粒骨架中線性化該質(zhì)粒。4個(gè)進(jìn)入克隆各取等量(40ng)在含有LR4緩沖液和LRClonase的單個(gè)LR反應(yīng)中混合。制備不含Clonase的反應(yīng)和不含pENTR-attR21-attP1-ccdB-cat-attP2-attL5DNA的反應(yīng),作為陰性對(duì)照。表15.LR反應(yīng)的設(shè)置25℃孵育反應(yīng)物過(guò)夜。向每個(gè)反應(yīng)加入4μl蛋白酶K(2mg/ml)并使用2μl轉(zhuǎn)化DB3.1細(xì)胞。將100μl(1/10)轉(zhuǎn)化物鋪在含有20μg/ml氯霉素和50μg/ml卡那霉素(反應(yīng)1、2和3)或20μg/ml氯霉素和100μg/ml氨芐青霉素(反應(yīng)物4)的LB瓊脂上。對(duì)于反應(yīng)3和4,轉(zhuǎn)化物分別產(chǎn)生約5000和10,000個(gè)菌落,而相比之下,對(duì)于反應(yīng)1(無(wú)clonase)構(gòu)成的陰性對(duì)照產(chǎn)生約500個(gè)菌落,而對(duì)于反應(yīng)2(無(wú)pENTR-attR21-attP1-ccdB-cat-attP2-attL5DNA)構(gòu)成的陰性對(duì)照產(chǎn)生80個(gè)菌落。從反應(yīng)3和4的培養(yǎng)物中挑取6個(gè)菌落并通過(guò)小量制備分析進(jìn)行檢測(cè)?;诔菪|(zhì)粒DNA的大小和通過(guò)診斷限制性消化,所有克隆經(jīng)確定均正確。通過(guò)測(cè)試克隆attBPCR產(chǎn)物的能力,該組裝的載體表現(xiàn)出是具有功能的。實(shí)施例20構(gòu)建用于MultisiteGateway的attPDONOR質(zhì)粒構(gòu)建含有以下attP位點(diǎn)排列的4個(gè)attPDONOR質(zhì)粒(圖26A)attPx⇒ccdB-Cat⇐attPy]]>attPx⇐ccdB-cat⇒attPy]]>attPxccdB-catattPyattPx⇐ccdB-cat⇒attPy]]>通過(guò)使用含有相容性限制性內(nèi)切核酸酶位點(diǎn)的引物,PCR擴(kuò)增attP位點(diǎn)和attPDONOR載體,來(lái)構(gòu)建這些質(zhì)粒。每個(gè)PCR產(chǎn)物用適當(dāng)限制性酶消化。消化的attPDONOR載體PCR產(chǎn)物經(jīng)脫磷酸化后與消化的attP位點(diǎn)連接。連接產(chǎn)物由含有以兩個(gè)方向克隆在pDONOR載體中的attP位點(diǎn)的質(zhì)粒組成。上述attP質(zhì)粒隨后用作PCR反應(yīng)模板(圖26B)。使用特異地與attP位點(diǎn)核心退火并由此在PCR產(chǎn)物末端產(chǎn)生具有任何期望特異性的attL或attR位點(diǎn)的引物,進(jìn)行PCR(見(jiàn)實(shí)施例9方法中使用的引物)。對(duì)于每個(gè)新的attPDONOR載體,產(chǎn)生兩個(gè)這樣的PCR產(chǎn)物,一個(gè)由質(zhì)粒骨架(ori-kan)組成而另一個(gè)由ccdB和cat基因組成。制備這些PCR產(chǎn)物并使其在LRClonase反應(yīng)中一起反應(yīng)以產(chǎn)生含有具有任何取向和特異性的attP位點(diǎn)的新質(zhì)粒。本說(shuō)明書(shū)中提及的所有出版物、專利、和專利申請(qǐng)均表現(xiàn)了本發(fā)明所屬領(lǐng)域的普通技術(shù)人員的水平,并在此并入作為參考,就如同將每個(gè)單獨(dú)的出版物、專利、或?qū)@暾?qǐng)具體而單獨(dú)地并入?yún)⒖家粯?。序列?amp;lt;110>Cheo,DavidBrasch,MichaelA.Temple,GaryF.Hartley,JamesL.Byrd,DevonR.N.<120>具有獨(dú)特特異性的多個(gè)重組位點(diǎn)在重組克隆中的用途<130>0942.501PC02<140>ToBeAssigned<141>2000-12-11<150>US60/169,983<151>1999-12-10<150>US60/188,020<151>2000-03-09<160>140<170>PatentInversion3.0<210>1<211>27<212>DNA<213>attB0<400>1agcctgcttttttatactaacttgagc27<210>2<211>27<212>DNA<213>attP0<400>2gttcagcttttttatactaagttggca27<210>3<211>27<212>DNA<213>attL0<400>3agcctgcttttttatactaagttggca27<210>4<211>27<212>DNA<213>attR0<400>4gttcagcttttttatactaacttgagc27<210>5<211>25<212>DNA<213>attB1<400>5agcctgcttttttgtacaaacttgt25<210>6<211>27<212>DNA<213>attP1<400>6gttcagcttttttgtacaaagttggca27<210>7<211>27<212>DNA<213>attL1<400>7agcctgcttttttgtacaaagttggca27<210>8<211>25<212>DNA<213>attR1<400>8gttcagcttttttgtacaaacttgt25<210>9<211>25<212>DNA<213>attB2<400>9acccagctttcttgtacaaagtggt25<210>10<211>27<212>DNA<213>attP2<400>10gttcagctttcttgtacaaagttggca27<210>11<211>27<212>DNA<213>attL2<400>11acccagctttcttgtacaaagttggca27<210>12<211>25<212>DNA<213>attR2<400>12gttcagctttcttgtacaaagtggt25<210>13<211>22<212>DNA<213>attB5<400>13caactttattatacaaagttgt22<210>14<211>27<212>DNA<213>attP5<400>14gttcaactttattatacaaagttggca27<210>15<211>24<212>DNA<213>attL5<400>15caactttattatacaaagttggca24<210>16<211>25<212>DNA<213>attR5<400>16gttcaactttattatacaaagttgt25<210>17<211>22<212>DNA<213>attB11<400>17caacttttctatacaaagttgt22<210>18<211>27<212>DNA<213>attP11<400>18gttcaacttttctatacaaagttggca27<210>19<211>24<212>DNA<213>attL11<400>19caacttttctatacaaagttggca24<210>20<211>25<212>DNA<213>attR11<400>20gttcaacttttctatacaaagttgt25<210>21<211>22<212>DNA<213>attB17<400>21caacttttgtatacaaagttgt22<210>22<211>27<212>DNA<213>attP17<400>22gttcaacttttgtatacaaagttggca27<210>23<211>24<212>DNA<213>attL17<400>23caacttttgtatacaaagttggca24<210>24<211>25<212>DNA<213>attR17<400>24gttcaacttttgtatacaaagttgt25<210>25<211>22<212>DNA<213>attB19<400>25caactttttcgtacaaagttgt22<210>26<211>27<212>DNA<213>attP19<400>26gttcaactttttcgtacaaagttggca27<210>27<211>24<212>DNA<213>attL19<400>27caactttttcgtacaaagttggca24<210>28<211>25<212>DNA<213>attR19<400>28gttcaactttttcgtacaaagttgt25<210>29<211>22<212>DNA<213>attB20<400>29caactttttggtacaaagttgt22<210>30<211>27<212>DNA<213>attP20<400>30gttcaactttttggtacaaagttggca27<210>31<211>24<212>DNA<213>attL20<400>31caactttttggtacaaagttggca24<210>32<211>25<212>DNA<213>attR20<400>32gttcaactttttggtacaaagttgt25<210>33<211>22<212>DNA<213>attB21<400>33caactttttaatacaaagttgt22<210>34<211>27<212>DNA<213>attP21<400>34gttcaactttttaatacaaagttggca27<210>35<211>24<212>DNA<213>attL21<400>35caactttttaatacaaagttggca24<210>36<211>25<212>DNA<213>attR21<400>36gttcaactttttaatacaaagttgt25<210>37<211>15<212>DNA<213>15bp核心區(qū)<400>37gcttttttatactaa15<210>38<211>21<212>DNA<213>參考序列<400>38caacttttttatacaaagttg21<210>39<211>21<212>DNA<213>att系統(tǒng)核心整合酶結(jié)合位點(diǎn)<220><221>misc_feature<222>(8)..()<223>n是任何核苷酸<220><221>misc_feature<222>(9)..()<223>n是任何核苷酸<220><221>misc_feature<222>(10)..()<223>n是任何核苷酸<220><221>misc_feature<222>(11)..()<223>n是任何核苷酸<220><221>misc_feature<222>(12)..()<223>n是任何核苷酸<220><221>misc_feature<222>(13)..()<223>n是任何核苷酸<220><221>misc_feature<222>(14)..()<223>n是任何核苷酸<400>39caactttnnnnnnnaaagttg21<210>40<211>17<212>DNA<213>attB的改變的位點(diǎn)<220><221>misc_feature<222>(8)..()<223>n是任何核苷酸<220><221>misc_feature<222>(9)..()<223>n是任何核苷酸<220><221>misc_feature<222>(10)..()<223>n是任何核苷酸<220><221>misc_feature<222>(11)..()<223>n是任何核苷酸<220><221>misc_feature<222>(12)..()<223>n是任何核苷酸<220><221>misc_feature<222>(13)..()<223>n是任何核苷酸<220><221>misc_featute<222>(14)..()<223>n是任何核苷酸<400>40caactttnnnnnnnaaa17<210>41<211>48<212>DNA<213>attL1PCR引物<400>41ggggagcctgcttttttgtacaaagttggcattataaaaaagcattgc48<210>42<211>48<212>DNA<213>attL2PCR引物<400>42ggggagcctgctttcttgtacaaagttggcattataaaaaagcattgc48<210>43<211>22<212>DNA<213>attL右PCR引物<400>43tgttgccgggaagctagagtaa22<210>44<211>43<212>DNA<213>attR1PCR引物<400>44ggggacaagtttgtacaaaaaagctgaacgagaaacgtaaaat43<210>45<211>43<212>DNA<213>attR2PCR引物<400>45ggggacaagtttgtacaagaaagctgaacgagaaacgtaaaat43<210>46<211>22<212>DNA<213>attR右PCR引物<400>46cagacggcatgatgaacctgaa22<210>47<211>29<212>DNA<213>attB1/B1-Hgb<400>47ggggacaagtttgtacaaaaaagcaggct29<210>48<211>29<212>DNA<213>attB2/B2-Hgb<400>48ggggaccactttgtacaagaaagctgggt29<210>49<211>18<212>DNA<213>18B1-Hgb<400>49tgtacaaaaaagcaggct18<210>50<211>18<212>DNA<213>18B2-Hgb<400>50tgtacaagaaagctgggt18<210>51<211>15<212>DNA<213>15B1-Hgb<400>51acaaaaaagcaggct15<210>52<211>15<212>DNA<213>15B2-Hgb<400>52acaagaaagctgggt15<210>53<211>12<212>DNA<213>12B1-Hgb<400>53aaaaagcaggct12<210>54<211>12<212>DNA<213>12B2-Hgb<400>54agaaagctgggt12<210>55<211>11<212>DNA<213>11B1-Hgb<400>55aaaagcaggct11<210>56<211>11<212>DNA<213>11B2-Hgb<400>56gaaagctgggt11<210>57<211>10<212>DNA<213>10B1-Hgb<400>57aaagcaggct10<210>58<211>10<212>DNA<213>10B2-Hgb<400>58aaagctgggt10<210>59<211>22<212>DNA<213>5′-Hgb<400>59gtcactagcctgtggagcaaga22<210>60<211>22<212>DNA<213>3′-Hgb<400>60aggatggcagagggagacgaca22<210>61<211>48<212>DNA<213>PCR引物attL0<400>61ggggagcctgcttttttatactaagttggcattataaaaaagcattgc48<210>62<211>48<212>DNA<213>PCR引物attLT1A<400>62ggggagcctgctttattatactaagttggcattataaaaaagcattgc48<210>63<211>48<212>DNA<213>PCR引物attLT1C<400>63ggggagcctgctttcttatactaagttggcattataaaaaagcattgc48<210>64<211>48<212>DNA<213>PCR引物attLT1G<400>64ggggagcctgctttgttatactaagttggcattataaaaaagcattgc48<210>65<211>48<212>DNA<213>PCR引物attLT2A<400>65ggggagcctgcttttatatactaagttggcattataaaaaagcattgc48<210>66<211>48<212>DNA<213>PCR引物attLT2C<400>66ggggagcctgcttttctatactaagttggcattataaaaaagcattgc48<210>67<211>48<212>DNA<213>PCR引物attLT2G<400>67ggggagcctgcttttgtatactaagttggcattataaaaaagcattgc48<210>68<211>48<212>DNA<213>PCR引物attLT3A<400>68ggggagcctgctttttaatactaagttggcattataaaaaagcattgc48<210>69<211>48<212>DNA<213>PCR引物attLT3C<400>69ggggagcctgctttttcatactaagttggcattataaaaaagcattgc48<210>70<211>48<212>DNA<213>PCR引物attLT3G<400>70ggggagcctgctttttgatactaagttggcattataaaaaagcattgc48<210>71<211>48<212>DNA<213>PCR引物attLA4C<400>71ggggagcctgcttttttctactaagttggcattataaaaaagcattgc48<210>72<211>48<212>DNA<213>PCR引物attLA4G<400>72ggggagcctgcttttttgtactaagttggcattataaaaaagcattgc48<210>73<211>48<212>DNA<213>PCR引物attLA4T<400>73ggggagcctgcttttttttactaagttggcattataaaaaagcattgc48<210>74<211>48<212>DNA<213>PCR引物attLT5A<400>74ggggagcctgcttttttaaactaagttggcattataaaaaagcattgc48<210>75<211>48<212>DNA<213>PCR引物attLT5C<400>75ggggagcctgcttttttacactaagttggcattataaaaaagcattgc48<210>76<211>48<212>DNA<213>PCR引物attLT5G<400>76ggggagcctgcttttttagactaagttggcattataaaaaagcattgc48<210>77<211>48<212>DNA<213>PCR引物attLA6C<400>77ggggagcctgcttttttatcctaagttggcattataaaaaagcattgc48<210>78<211>48<212>DNA<213>PCR引物attLA6G<400>78ggggagcctgcttttttatgctaagttggcattataaaaaagcattgc48<210>79<211>48<212>DNA<213>PCR引物attLA6T<400>79ggggagcctgcttttttattctaagttggcattataaaaaagcattgc48<210>80<211>48<212>DNA<213>PCR引物attLC7A<400>80ggggagcctgcttttttataataagttggcattataaaaaagcattgc48<210>81<211>48<212>DNA<213>PCR引物attLC7G<400>81ggggagcctgcttttttatagtaagttggcattataaaaaagcattgc48<210>82<211>48<212>DNA<213>PCR引物attLC7T<400>82ggggagcctgcttttttatattaagttggcattataaaaaagcattgc48<210>83<211>48<212>DNA<213>PCR引物attL8<400>83ggggagcctacttttttatactaagttggcattataaaaaagcattgc48<210>84<211>48<212>DNA<213>PCR引物attL9<400>84ggggagcctgcctttttatactaagttggcattataaaaaagcattgc48<210>85<211>48<212>DNA<213>PCR引物attL10<400>85ggggagcctgcttctttatactaagttggcattataaaaaagcattgc48<210>86<211>48<212>DNA<213>PCR引物attL14<400>86ggggagcctgcttttttataccaagttggcattataaaaaagcattgc48<210>87<211>48<212>DNA<213>PCR引物attL15<400>87ggggagcctgcttttttatactaggttggcattataaaaaagcattgc48<210>88<211>30<212>DNA<213>attL0<400>88agcctgcttttttatactaagttggcatta30<210>89<211>30<212>DNA<213>attL5<400>89agcctgctttattatactaagttggcatta30<210>90<211>30<212>DNA<213>attL6<400>90agcctgcttttttatattaagttggcatta30<210>91<211>30<212>DNA<213>attL13<400>91agcctgcttttttatgctaagttggcatta30<210>92<211>30<212>DNA<213>attL14<400>92agcctgcttttttataccaagttggcatta30<210>93<211>30<212>DNA<213>attL15<400>93agcctgcttttttatactaggttggcatta30<210>94<211>21<212>DNA<213>共有序列<220><221>misc_feature<222>(7)..()<223>n是任何核苷酸<220><221>misc_feature<222>(8)..()<223>n是任何核苷酸<220><221>misc_feature<222>(10)..()<223>n是任何核苷酸<220><221>misc_feature<222>(11)..()<223>n是任何核苷酸<220><221>misc_feature<222>(12)..()<223>n是任何核苷酸<220><221>misc_feature<222>(14)..()<223>n是任何核苷酸<220><221>misc_feature<222>(15)..()<223>n是任何核苷酸<400>94caacttnntnnnannaagttg21<210>95<211>25<212>DNA<213>attB0<400>95tcaagttagtataaaaaagcaggct25<210>96<211>29<212>DNA<213>attB2.1<400>96ggggaacactttgtacaagaaagctgggt29<210>97<211>29<212>DNA<213>attB2.2<400>97ggggacaactttgtacaagaaagctgggt29<210>98<211>29<212>DNA<213>attB2.3<400>98ggggacccctttgtacaagaaagctgggt29<210>99<211>29<212>DNA<213>attB2.4<400>99ggggaccaatttgtacaagaaagctgggt29<210>100<211>29<212>DNA<213>attB2.5<400>100ggggaccacgttgtacaagaaagctgggt29<210>101<211>29<212>DNA<213>attB2.6<400>101ggggaccactgtgtacaagaaagctgggt29<210>102<211>29<212>DNA<213>attB2.7<400>102ggggaccacttggtacaagaaagctgggt29<210>103<211>29<212>DNA<213>attB2.8<400>103ggggaccactttttacaagaaagctgggt29<210>104<211>29<212>DNA<213>attB1.6<400>104ggggacaactttgtacaaaaaagttggct29<210>105<211>29<212>DNA<213>attB2.10<400>105ggggacaactttgtacaagaaagttgggt29<210>106<211>29<212>DNA<213>attb1n16-20<220><221>misc_feature<222>(20)..()<223>n是任何核苷酸<220><221>misc_feature<222>(21)..()<223>n是任何核苷酸<220><221>misc_feature<222>(22)..()<223>n是任何核苷酸<220><221>misc_feature<222>(23)..()<223>n是任何核苷酸<220><221>misc_feature<222>(24)..()<223>n是任何核苷酸<400>106ggggacaagtttgtacaaannnnnaggct29<210>107<211>29<212>DNA<213>attb1n21-25<220><221>misc_feature<222>(25)..()<223>n是任何核苷酸<220><221>misc_feature<222>(26)..()<223>n是任何核苷酸<220><221>misc_feature<222>(27)..()<223>n是任何核苷酸<220><221>misc_feature<222>(28)..()<223>n是任何核苷酸<220><221>misc_feature<222>(29)..()<223>n是任何核苷酸<400>107ggggacaagtttgtacaaaaaagcnnnnn29<210>108<211>29<212>DNA<213>attb2n16-20<220><221>misc_feature<222>(20)..()<223>n是任何核苷酸<220><221>misc_feature<222>(21)..()<223>n是任何核苷酸<220><221>misc_feature<222>(22)..()<223>n是任何核苷酸<220><221>misc_feature<222>(23)..()<223>n是任何核苷酸<220><221>misc_feature<222>(24)..()<223>n是任何核苷酸<400>108ggggaccactttgtacaagnnnnntgggt29<210>109<211>29<212>DNA<213>attb2n21-25<220><221>misc_feature<222>(25)..()<223>n是任何核苷酸<220><221>misc_feature<222>(26)..()<223>n是任何核苷酸<220><221>misc_feature<222>(27)..()<223>n是任何核苷酸<220><221>misc_feature<222>(28)..()<223>n是任何核苷酸<220><221>misc_feature<222>(29)..()<223>n是任何核苷酸<400>109ggggaccactttgtacaagaaagcnnnnn29<210>110<211>28<212>DNA<213>attb1(片段a的5′末端)<220><221>misc_feature<222>(27)..()<223>n是任何核苷酸<220><221>misc_feature<222>(28)..()<223>n是任何核苷酸<400>110ggggacaactttgtacaaaaaagttgnn28<210>111<211>26<212>DNA<213>attb5(片段a的3′末端)<400>111ggggacaactttgtataataaagttg26<210>112<211>26<212>DNA<213>attb5r(片段b的5′末端)<400>112ggggacaactttattatacaaagttg26<210>113<211>26<212>DNA<213>attb2(片段b的3′末端)<220><221>misc_feature<222>(26)..()<223>n是任何核苷酸<400>113gggacaactttgtataataaagttgn26<210>114<211>28<212>DNA<213>attb1(片段a的5′末端)<220><221>misc_feature<222>(27)..()<223>n是任何核苷酸<220><221>misc_feature<222>(28)..()<223>n是任何核苷酸<400>114ggggacaactttgtacaaaaaagttgnn28<210>115<211>25<212>DNA<213>attb21R(片段b的3′末端)<400>115gggacaactttttaatacaaagttg25<210>116<211>26<212>DNA<213>attb21(片段c的5′末端)<400>116ggggacaactttgtattaaaaagttg26<210>117<211>27<212>DNA<213>attb2(片段c的3′末端)<220><221>misc_feature<222>(27)..()<223>n是任何核苷酸<400>117ggggacaactttgtataataaagttgn27<210>118<211>16<212>DNA<213>最佳shine-Delgarno和Kozak序列<400>118ggaggtatataccatg16<210>119<211>39<212>DNA<213>SD5′luxA<400>119ggaggtatataccatgaagtttggaaatatttgtttttc39<210>120<211>49<212>DNA<213>T73′luxA<400>120gaagctatagtgagtcgtattatttaggttcttttaagaaaggagcgac49<210>121<211>40<212>DNA<213>SD5′luxB<400>121ggaggtatataccatgaaatttggattattttttctaaac40<210>122<211>47<212>DNA<213>T73′luxB<400>122gaagctatagtgagtcgtattatggtaaattcatttcgattttttgg47<210>123<211>45<212>DNA<213>SD5′luxC<400>123ggaggtatataccatgaataaatgtattccaatgataattaatgg45<210>124<211>50<212>DNA<213>T73′luxC<400>124gaagctatagtgagtcgtattatgggacaaaaactaaaaacttatcttcc50<210>125<211>44<212>DNA<213>SD5′luxD<400>125ggaggtatataccatgaaagatgaaagtgctttttttacgattg44<210>126<211>46<212>DNA<213>T73′luxD<400>126gaagctatagtgagtcgtattaagccaattctaataattcattttc46<210>127<211>44<212>DNA<213>SD5′luxE<400>127ggaggtatataccatgactgtccatactgaatataaaagaaatc44<210>128<211>53<212>DNA<213>T73′luxE<400>128gaagctatagtgagtcgtattaaatccttgatattcttttgtatgacattagc53<210>129<211>44<212>DNA<213>B1.6SD<400>129ggggacaactttgtacaaaaaagttgaaggaggtatataccatg44<210>130<211>44<212>DNA<213>B5T7<400>130ggggacaactttgtataataaagttggaagctatagtgagtcgt44<210>131<211>44<212>DNA<213>B5RSD<400>131ggggacaactttattatacaaagttgaaggaggtatataccatg44<210>132<211>44<212>DNA<213>B11T7<400>132ggggacaactttgtatagaaaagttggaagctatagtgagtcgt44<210>133<211>44<212>DNA<213>B11RSD<400>133ggggacaacttttctatacaaagttgaaggaggtatataccatg44<210>134<211>44<212>DNA<213>B17T7<400>134ggggacaactttgtatacaaaagttggaagctatagtgagtcgt44<210>135<211>44<212>DNA<213>B17RSD<400>135ggggacaacttttgtatacaaagttgaaggaggtatataccatg44<210>136<211>44<212>DNA<213>B21T7<400>136ggggacaactttgtattaaaaagttggaagctatagtgagtcgt44<210>137<211>44<212>DNA<213>B21RSD<400>137ggggacaactttttaatacaaagttgaaggaggtatataccatg44<210>138<211>44<212>DNA<213>B2.10T7<400>138ggggacaactttgtacaagaaagttggaagctatagtgagtcgt44<210>139<211>14<212>DNA<213>12attB1正向的模板特異的引物<220><221>misc_feature<222>(13)..()<223>n是任何核苷酸<220><221>misc_feature<222>(14)..()<223>n是任何核苷酸<400>139aaaaagcaggctnn14<210>140<211>13<212>DNA<213>12attB2反向的模板特異的引物<220><221>misc_feature<222>(13)..()<223>n是任何核苷酸<400>140agaaagctgggtn1權(quán)利要求1.制備雜合核酸分子群的方法,包括(a)將至少第一群包含一或多個(gè)重組位點(diǎn)的核酸分子和至少一個(gè)包含一或多個(gè)重組位點(diǎn)的靶核酸分子混合;和(b)使該至少第一群的所有或一些核酸分子與所有或一些靶核酸分子重組,由此形成雜合核酸分子群。2.權(quán)利要求1的方法,其中通過(guò)將第一群核酸分子和靶核酸分子與一或多個(gè)重組蛋白在利于重組的條件下混合,造成重組。3.權(quán)利要求2的方法,其中重組蛋白包含一或多個(gè)選自下組的蛋白質(zhì)(a)Cre;(b)Int;(c)IHF;(d)Xis;(e)Fis;(f)Hin;(g)Gin;(h)Cin;(i)Tn3解離酶;(j)TndX;(k)XerC;和(l)XerD。4.權(quán)利要求1的方法,還包含將第一群核酸分子和靶核酸分子與至少第二群包含一或多個(gè)重組位點(diǎn)的核酸分子混合。5.權(quán)利要求1的方法,其中重組位點(diǎn)包含選自下組的一或多個(gè)重組位點(diǎn)(a)lox位點(diǎn);(b)psi位點(diǎn);(c)dif位點(diǎn);(d)cer位點(diǎn);(e)frt位點(diǎn);(f)att位點(diǎn);和(g)(a)、(b)、(c)、(d)、(e)或(f)重組位點(diǎn)保留進(jìn)行重組的能力的突變體、變體、和衍生物。6.權(quán)利要求1的方法,還包含選出雜合核酸分子群。7.權(quán)利要求1的方法,還包含選出雜合核酸分子群并選擇除去第一群核酸分子和除去靶核酸分子。8.權(quán)利要求7的方法,還包含選擇除去共合體分子和副產(chǎn)物分子。9.包含通過(guò)權(quán)利要求1的方法制備的雜合核酸分子群的組合物。10.包含通過(guò)權(quán)利要求1的方法制備的雜合核酸分子群的重組宿主細(xì)胞群。11.權(quán)利要求1的方法,其中所述重組發(fā)生在體外。12.制備重組宿主細(xì)胞群的方法,包括將通過(guò)權(quán)利要求1的方法制備的雜合核酸分子群導(dǎo)入宿主細(xì)胞。13.制備雜合核酸分子群的方法,包括(a)將至少第一群包含一或多個(gè)重組位點(diǎn)的核酸分子和至少第二群包含一或多個(gè)重組位點(diǎn)的核酸分子混合;和(b)使該至少第一群的一些或全部核酸分子與該至少第二群的全部或一些核酸分子重組,由此形成雜合核酸分子群。14.權(quán)利要求13的方法,其中通過(guò)將第一群核酸分子和第二群核酸分子與一或多個(gè)重組蛋白在利于重組的條件下混合,造成該重組。15.權(quán)利要求13的方法,其中所述重組發(fā)生在體外。16.在核酸分子間實(shí)施同源重組的方法,包括(a)將至少第一包含一或多個(gè)重組位點(diǎn)的核酸分子和至少一個(gè)靶核酸分子混合,其中該第一核酸分子和靶核酸分子具有一或多個(gè)同源序列;和(b)使該第一核酸分子和靶核酸分子通過(guò)同源重組進(jìn)行重組。17.權(quán)利要求16的方法,其中同源重組導(dǎo)致將第一核酸分子的全部或部分轉(zhuǎn)移至靶核酸分子中。18.權(quán)利要求16的方法,其中該第一核酸分子包含兩個(gè)或多個(gè)與靶核酸分子序列同源的序列。19.對(duì)靶基因或核苷酸序列進(jìn)行打靶或突變的方法,包括(a)獲得至少一個(gè)包含一或多個(gè)重組位點(diǎn)和一或多個(gè)選擇標(biāo)記的第一核酸分子,其中該第一核酸分子包含一或多個(gè)與靶基因或核苷酸序列同源的核苷酸序列;和(b)在足以造成靶基因或核苷酸序列和第一核酸分子之間在一或多個(gè)位點(diǎn)發(fā)生同源重組的條件下,使第一核酸分子和一或多個(gè)靶基因或核苷酸序列接觸,籍此造成第一核酸分子的全部或部分插入靶基因或核苷酸序列中。20.權(quán)利要求19的方法,其中靶基因或核苷酸序列被失活。21.權(quán)利要求19的方法,還包括選出含有靶基因或核苷酸序列的宿主細(xì)胞。22.通過(guò)權(quán)利要求21的方法制備的重組宿主細(xì)胞。23.克隆核酸分子的方法,包括(a)提供側(cè)翼有第1和第2重組位點(diǎn)的第1核酸區(qū)段;(b)提供側(cè)翼有第3和第4重組位點(diǎn)的第2核酸區(qū)段,其中該第1或第2重組位點(diǎn)能夠和第3或第4重組位點(diǎn)重組;(c)進(jìn)行重組反應(yīng)以致這兩個(gè)核酸區(qū)段重組為單一的核酸分子;和(d)克隆該單一核酸分子。24.權(quán)利要求23的方法,其中所述重組反應(yīng)發(fā)生在體外。25.克隆核酸分子的方法,包括(a)提供側(cè)翼有第1和第2重組位點(diǎn)的第1核酸區(qū)段和側(cè)翼有第3和第4重組位點(diǎn)的第2核酸區(qū)段,其中位于第1和第2核酸區(qū)段側(cè)翼的所有重組位點(diǎn)均不能夠和位于該第1和第2核酸區(qū)段側(cè)翼的任何其它位點(diǎn)重組;(b)提供包含第5、6、7和8重組位點(diǎn)的載體,其中該第5、6、7和8重組位點(diǎn)的每一個(gè)都能夠與該第1、2、3或4重組位點(diǎn)中的一個(gè)重組;和(c)進(jìn)行重組反應(yīng),以便這兩個(gè)核酸區(qū)段重組進(jìn)入該載體中,由此克隆該第1和第2核酸區(qū)段。26.權(quán)利要求25的方法,其中所述重組反應(yīng)發(fā)生在體外。27.克隆n個(gè)核酸區(qū)段的方法,其中n是大于1的整數(shù),該方法包括(a)提供n個(gè)核酸區(qū)段,每個(gè)區(qū)段的側(cè)翼有兩個(gè)不相互重組的重組位點(diǎn);(b)提供包含2n個(gè)重組位點(diǎn)的載體,其中該2n個(gè)重組位點(diǎn)的每一個(gè)均能夠與位于一個(gè)核酸區(qū)段側(cè)翼的重組位點(diǎn)之一重組;和(c)進(jìn)行重組反應(yīng),以便該n個(gè)核酸區(qū)段重組進(jìn)入該載體中,由此克隆該n個(gè)核酸區(qū)段。28.權(quán)利要求27的方法,其中所述重組反應(yīng)發(fā)生在體外。29.權(quán)利要求27的方法,其中n個(gè)核酸區(qū)段和載體之間的重組反應(yīng)在存在一或多個(gè)重組蛋白時(shí)在利于該重組的條件下進(jìn)行。30.權(quán)利要求29的方法,其中重組蛋白包含一或多個(gè)選自下組的蛋白質(zhì)(a)Cre;(b)Int;(c)IHF;(d)Xis;(e)Fis;(f)Hin;(g)Gin;(h)Cin;(i)Tn3解離酶;(j)TndX;(k)XerC;和(l)XerD。31.權(quán)利要求27的方法,其中核酸區(qū)段和載體的重組位點(diǎn)包含一或多個(gè)選自下組的重組位點(diǎn)(a)lox位點(diǎn);(b)psi位點(diǎn);(c)dif位點(diǎn);(d)cer位點(diǎn);(e)frt位點(diǎn);(f)att位點(diǎn);和(g)(a)、(b)、(c)、(d)、(e)或(f)重組位點(diǎn)的保留進(jìn)行重組的能力的突變體、變體、和衍生物。32.權(quán)利要求27的方法,其中n是2、3、4或5。33.權(quán)利要求27的方法,其中這些核酸區(qū)段的至少一個(gè)與能夠調(diào)節(jié)轉(zhuǎn)錄的序列可操作地連接。34.權(quán)利要求33的方法,其中能夠調(diào)節(jié)轉(zhuǎn)錄的序列選自(a)啟動(dòng)子;(b)增強(qiáng)子;和(c)阻遏基因。35.權(quán)利要求34的方法,其中啟動(dòng)子是誘導(dǎo)型啟動(dòng)子或組成型啟動(dòng)子。36.權(quán)利要求27的方法,其中從該克隆的核酸區(qū)段產(chǎn)生的RNA的翻譯導(dǎo)致產(chǎn)生融合蛋白。37.權(quán)利要求27的方法,其中這些核酸區(qū)段的至少一個(gè)編碼可讀框的全部或部分,而且這些核酸區(qū)段的至少一個(gè)含有能夠調(diào)節(jié)轉(zhuǎn)錄的序列。38.權(quán)利要求27的方法,其中這些核酸區(qū)段的至少一個(gè)在轉(zhuǎn)錄后產(chǎn)生有義RNA鏈,而且這些核酸區(qū)段的至少一個(gè)在轉(zhuǎn)錄后產(chǎn)生反義RNA。39.權(quán)利要求38的方法,其中有義RNA和反義RNA具有至少一個(gè)互補(bǔ)區(qū)并能夠彼此雜交。40.權(quán)利要求27的方法,其中至少兩個(gè)核酸區(qū)段的轉(zhuǎn)錄導(dǎo)致產(chǎn)生單個(gè)RNA。41.權(quán)利要求40的方法,其中至少一個(gè)核酸區(qū)段在轉(zhuǎn)錄后產(chǎn)生有義RNA鏈,而且至少一個(gè)核酸區(qū)段在轉(zhuǎn)錄后產(chǎn)生反義RNA鏈。42.權(quán)利要求41的方法,其中有義RNA和反義RNA具有至少一個(gè)互補(bǔ)區(qū)并能夠彼此雜交。43.權(quán)利要求27的方法,其中這些核酸區(qū)段包含一或多個(gè)文庫(kù)的核酸分子。44.權(quán)利要求43的方法,其中一或多個(gè)文庫(kù)包含cDNA或基因組DNA。45.權(quán)利要求43的方法,其中一或多個(gè)文庫(kù)包含編碼抗體分子可變區(qū)的核酸分子。46.權(quán)利要求45的方法,其中一或多個(gè)文庫(kù)包含編碼抗體輕鏈和重鏈可變區(qū)的核酸分子。47.權(quán)利要求27的方法,還包括篩選以鑒定編碼具有針對(duì)一或多種抗原的結(jié)合特異性的蛋白質(zhì)的核酸分子。48.權(quán)利要求27的方法,還包括篩選以鑒定編碼具有一或多種活性的蛋白質(zhì)的核酸分子。49.權(quán)利要求48的方法,其中活性包含一或多個(gè)選自下組的活性(a)從細(xì)胞中分泌;(b)亞細(xì)胞定位;(c)配體結(jié)合活性;和(d)酶活性。50.權(quán)利要求49的方法,其中蛋白質(zhì)位于內(nèi)質(zhì)網(wǎng)、細(xì)胞核、線粒體、葉綠體、或細(xì)胞膜。51.權(quán)利要求49的方法,其中該蛋白質(zhì)與選自下組的配體結(jié)合;(a)核酸;(b)細(xì)胞表面受體;(c)可溶性蛋白質(zhì);和(d)金屬離子。52.克隆至少一個(gè)核酸分子的方法,包括(a)提供第1、第2和第3核酸區(qū)段,其中該第1核酸區(qū)段側(cè)翼有第1和第2重組位點(diǎn),第2核酸區(qū)段的側(cè)翼有第3和第4重組位點(diǎn),而第3核酸區(qū)段的側(cè)翼有第5和第6重組位點(diǎn),其中該第2重組位點(diǎn)能夠和第3重組位點(diǎn)重組,而該第1、4、5或6重組位點(diǎn)均不能夠和該第1至第6重組位點(diǎn)中的任一個(gè)重組;(b)提供包含位于第1負(fù)選擇標(biāo)記側(cè)翼的第7和第8重組位點(diǎn)并包含位于第2負(fù)選擇標(biāo)記側(cè)翼的第9和第10重組位點(diǎn)的載體,其中該第7至第10重組位點(diǎn)均不能與該第7至第10重組位點(diǎn)中的任一個(gè)重組;(c)進(jìn)行第1重組反應(yīng),使得該第2和第3重組位點(diǎn)重組;和(d)進(jìn)行第2重組反應(yīng),使得該第1和第4重組位點(diǎn)與第7和第8重組位點(diǎn)重組,而第5和第6重組位點(diǎn)與第9和第10重組位點(diǎn)重組,由此克隆該第1、2和3核酸區(qū)段。53.權(quán)利要求52的方法,其中所述第1和第2重組反應(yīng)發(fā)生在體外。54.克隆至少一個(gè)核酸分子的方法,包括(a)提供第1、2和3核酸區(qū)段,其中該第1核酸區(qū)段的側(cè)翼有第1和第2重組位點(diǎn)、第2核酸區(qū)段的側(cè)翼有第3和第4重組位點(diǎn),而第3核酸區(qū)段的側(cè)翼有第5和第6重組位點(diǎn),其中該第2重組位點(diǎn)能夠和第3重組位點(diǎn)重組,而第4重組位點(diǎn)能夠和第5重組位點(diǎn)重組;(b)提供包含第7和第8重組位點(diǎn)的載體;和(c)進(jìn)行至少一個(gè)重組反應(yīng),使得該第2和第3重組位點(diǎn)重組,而第4和第5重組位點(diǎn)重組,第1和第6重組位點(diǎn)分別與第7和第8重組位點(diǎn)重組,由此克隆該第1、2和3核酸區(qū)段。55.權(quán)利要求54的方法,其中所述至少一個(gè)重組反應(yīng)發(fā)生在體外。56.權(quán)利要求54的方法,其中該重組反應(yīng)在存在一或多個(gè)重組蛋白時(shí)在利于該重組的條件下進(jìn)行。57.克隆n個(gè)核酸片段的方法,其中n是大于2的整數(shù),包括(a)提供第1至第n核酸區(qū)段,每個(gè)區(qū)段的側(cè)翼有兩個(gè)重組位點(diǎn),其中對(duì)這些重組位點(diǎn)進(jìn)行選擇以致位于第i區(qū)段ni側(cè)翼的兩個(gè)重組位點(diǎn)之一與位于第ni-1區(qū)段側(cè)翼的重組位點(diǎn)之一反應(yīng),而位于第i區(qū)段側(cè)翼的另一重組位點(diǎn)和位于第ni+1核酸區(qū)段側(cè)翼的重組位點(diǎn)之一反應(yīng);(b)提供含有至少兩個(gè)重組位點(diǎn)的載體,其中載體上的兩個(gè)重組位點(diǎn)之一可與第1核酸區(qū)段上的位點(diǎn)之一反應(yīng),載體上的另一個(gè)位點(diǎn)可與第n核酸區(qū)段上的重組位點(diǎn)反應(yīng);和(c)進(jìn)行至少一個(gè)重組反應(yīng)使得所有的核酸片段都重組進(jìn)入載體中。58.權(quán)利要求57的方法,其中所述至少一個(gè)重組反應(yīng)發(fā)生在體外。59.權(quán)利要求57的方法,其中重組反應(yīng)在存在一或多個(gè)重組蛋白時(shí)在有利于重組的條件下進(jìn)行。60.權(quán)利要求59的方法,其中重組蛋白包含選自下組的一或多個(gè)蛋白質(zhì)(a)Cre;(b)Int;(c)IHF;(d)Xis;(e)Fis;(f)Hin;(g)Gin;(h)Cin;(i)Tn3解離酶;(j)TndX;(k)XerC;和(l)XerD。61.權(quán)利要求57的方法,其中核酸區(qū)段和載體的重組位點(diǎn)包含一或多個(gè)選自下組的重組位點(diǎn)(a)lox位點(diǎn);(b)psi位點(diǎn);(c)dif位點(diǎn);(d)cer位點(diǎn);(e)frt位點(diǎn);(f)att位點(diǎn);和(g)(a)、(b)、(c)、(d)、(e)或(f)重組位點(diǎn)的保留進(jìn)行重組的能力的突變體、變體、和衍生物。62.權(quán)利要求61的方法,其中彼此重組的重組位點(diǎn)包含具有相同7堿基對(duì)重疊區(qū)的att位點(diǎn)。63.通過(guò)權(quán)利要求52的方法制備的核酸分子。64.克隆至少一個(gè)核酸分子的方法,包括(a)提供第一群核酸分子,其中這些分子的全部或部分的側(cè)翼有第1和第2重組位點(diǎn);(b)提供至少一個(gè)側(cè)翼有第3和第4重組位點(diǎn)的核酸區(qū)段,其中該第1或第2重組位點(diǎn)能夠與第3或第4重組位點(diǎn)重組;(c)進(jìn)行重組反應(yīng)以致在該群體中所有或部分核酸分子與該區(qū)段重組,形成第2群核酸分子;和(d)克隆第2群核酸分子。65.權(quán)利要求64的方法,其中所述重組反應(yīng)發(fā)生在體外。66.權(quán)利要求64的方法,其中第2群核酸分子編碼融合蛋白。67.權(quán)利要求64的方法,其中該核酸區(qū)段編碼選自下組的多肽(a)免疫球蛋白的Fc部分;(b)β-葡糖醛酸糖苷酶;(c)熒光蛋白;(d)純化標(biāo)簽;(e)和表位標(biāo)簽。68.權(quán)利要求67的方法,其中該核酸區(qū)段編碼選自下組的熒光蛋白(a)綠色熒光蛋白;(b)黃色熒光蛋白;(c)紅色熒光蛋白;和(d)藍(lán)色熒光蛋白。69.權(quán)利要求67的方法,其中該核酸區(qū)段編碼選自下組的純化標(biāo)簽(a)表位標(biāo)簽;(b)麥芽糖結(jié)合蛋白;(c)6組氨酸標(biāo)簽;和(d)谷胱苷肽S轉(zhuǎn)移酶。70.通過(guò)權(quán)利要求64的方法制備的核酸分子。71.克隆至少一個(gè)核酸分子的方法,包括(a)提供第一群核酸分子,其中這些分子中的所有或部分分子的側(cè)翼有至少第1和第2重組位點(diǎn);(b)提供第二群核酸分子,其中這些分子中的所有或部分分子的側(cè)翼有第3和第4重組位點(diǎn),其中該第1或第2重組位點(diǎn)能夠與第3或第4重組位點(diǎn)重組;(c)進(jìn)行重組反應(yīng),使得第一群中的所有或部分分子與第二群的一或多個(gè)分子重組,形成第三群核酸分子;和(d)克隆該第三群核酸分子。72.權(quán)利要求71的方法,其中所述重組反應(yīng)發(fā)生在體外。73.權(quán)利要求71的方法,其中該重組反應(yīng)在存在一或多個(gè)重組蛋白時(shí)在利于該重組的條件進(jìn)行。74.合成蛋白質(zhì)的方法,包括(a)提供包含編碼序列及隨后的終止密碼子的核酸分子,其中該核酸分子的側(cè)翼有至少一個(gè)重組位點(diǎn);(b)提供包含至少一個(gè)重組位點(diǎn)和編碼序列的載體;(c)進(jìn)行重組,使得核酸分子被插入載體中,產(chǎn)生具有兩個(gè)按讀框相連的編碼序列的修飾載體;(d)用該修飾載體轉(zhuǎn)化表達(dá)抑制型tRNA的宿主細(xì)胞;和(e)使這兩個(gè)編碼序列表達(dá),以致產(chǎn)生由這兩個(gè)編碼序列的至少一部分編碼的融合蛋白,其中該核酸分子或載體包含至少一個(gè)可抑制的終止密碼子。75.根據(jù)權(quán)利要求74的方法,其中該終止密碼子選自琥珀、乳白和赭石密碼子。76.根據(jù)權(quán)利要求74的方法,其中該載體包含編碼至少一個(gè)抑制型tRNA分子的基因。77.根據(jù)權(quán)利要求74的方法,其中宿主細(xì)胞的染色體包含編碼至少一個(gè)抑制型tRNA分子的基因。78.根據(jù)權(quán)利要求74的方法,還包括步驟用包含編碼至少一個(gè)抑制型tRNA分子的核酸分子轉(zhuǎn)化宿主細(xì)胞。79.根據(jù)權(quán)利要求74的方法,其中該融合蛋白包含由載體的至少一部分編碼的N-或C-端標(biāo)簽。80.根據(jù)權(quán)利要求79的方法,其中該標(biāo)簽選自(a)谷胱苷肽S轉(zhuǎn)移酶;(b)β-葡糖醛酸糖苷酶;(c)綠色熒光蛋白;(d)黃色熒光蛋白;(e)紅色熒光蛋白;(f)藍(lán)色熒光蛋白;(g)麥芽糖結(jié)合蛋白;(h)6組氨酸標(biāo)簽;和(i)表位標(biāo)簽。81.確定細(xì)胞或組織的基因表達(dá)譜的方法,包括(a)從獲自該細(xì)胞或組織的RNA產(chǎn)生至少一群cDNA分子,其中該群體的單個(gè)cDNA分子包含至少兩個(gè)能夠與相同或不同cDNA分子群?jiǎn)蝹€(gè)成員上存在的至少一個(gè)重組位點(diǎn)重組的重組位點(diǎn);(b)在造成這些核酸分子相接合的條件下,使(a)的核酸分子和一或多個(gè)重組蛋白接觸;和(c)確定該接合起來(lái)的核酸分子的序列。82.權(quán)利要求81的方法,其中將該接合起來(lái)的cDNA分子插入在插入位點(diǎn)側(cè)翼含有測(cè)序引物結(jié)合位點(diǎn)的載體中。83.權(quán)利要求81的方法,其中該接合起來(lái)的cDNA分子被attB重組位點(diǎn)分隔開(kāi)。84.權(quán)利要求83的方法,其中彼此重組的attB重組位點(diǎn)具有一致的7堿基對(duì)重疊區(qū)。85.權(quán)利要求81的方法,其中該接合起來(lái)的cDNA分子含有約10至約30個(gè)與獲自該細(xì)胞或組織的RNA相應(yīng)的核苷酸。86.制備和鑒定核酸分子的方法,其中該核酸分子含有兩個(gè)或多個(gè)編碼參與相同生物學(xué)過(guò)程或生物學(xué)途徑的基因產(chǎn)物的核酸區(qū)段,該方法包括(a)提供第一群核酸分子,該核酸分子包含至少一個(gè)能夠和第一群體中其它核酸分子重組的重組位點(diǎn);和(b)使第一群核酸分子與一或多個(gè)重組蛋白在造成這些核酸分子重組并產(chǎn)生第二群核酸分子的條件下接觸;和(c)篩選該第二群核酸分子以鑒定編碼兩個(gè)或更多參與相同過(guò)程或途徑的產(chǎn)物的核酸分子。87.權(quán)利要求86的方法,其中編碼參與相同過(guò)程或途徑的兩個(gè)或更多個(gè)產(chǎn)物的核酸分子編碼蛋白質(zhì)或蛋白質(zhì)復(fù)合物的兩個(gè)不同域。88.權(quán)利要求87的方法,其中該蛋白質(zhì)是單鏈抗原結(jié)合蛋白。89.權(quán)利要求88的方法,其中該蛋白復(fù)合物包含抗體分子或含有至少兩個(gè)單鏈抗原結(jié)合蛋白的多價(jià)抗原結(jié)合蛋白。90.通過(guò)權(quán)利要求86的方法制備的核酸分子。91.包含至少一個(gè)第一核酸分子的支持物,其中該第一核酸分子包含一或多個(gè)重組位點(diǎn)或其部分。92.權(quán)利要求91的支持物,還包含通過(guò)第一核酸分子上的重組位點(diǎn)與支持物結(jié)合的至少一個(gè)第二核酸分子或至少一個(gè)肽或蛋白質(zhì)分子。93.包含權(quán)利要求91的支持物和至少一個(gè)具有至少一個(gè)重組位點(diǎn)或其部分的第二核酸分子或蛋白質(zhì)或肽分子。94.使一或多個(gè)核酸分子、蛋白質(zhì)或肽分子、或其它化合物與支持物附著或結(jié)合的方法,包括(a)獲得至少一個(gè)包含至少一個(gè)重組位點(diǎn)的核酸分子、蛋白質(zhì)或肽分子、其它化合物、或這些分子或化合物的群體,并獲得包含至少一個(gè)重組位點(diǎn)的支持物;和(b)使該至少一個(gè)核酸分子、蛋白質(zhì)或肽分子、其它化合物、或這些分子或化合物的群體上的一些或全部重組位點(diǎn)與支持物所包含的全部或部分重組位點(diǎn)重組。95.權(quán)利要求94的方法,其中彼此重組的重組位點(diǎn)包含具有一致的7堿基對(duì)重疊區(qū)的att位點(diǎn)。96.權(quán)利要求94的方法,包括將一或多個(gè)核酸分子與支持物附著或結(jié)合。97.權(quán)利要求94的方法,其中僅一個(gè)核酸分子直接地與支持物連接。98.權(quán)利要求97的方法,其中這些核酸分子形成微陣列。99.權(quán)利要求98的方法,其中該微陣列形成DNA芯片。100.通過(guò)權(quán)利要求94的方法制備的支持物。101.權(quán)利要求100的支持物,其是固體的或半固體的。102.使兩個(gè)或多個(gè)目的分子或化合物連接或結(jié)合的方法,包括(a)提供至少第一和第二目的分子或化合物,第一和第二目的分子或化合物每一個(gè)都包含至少一個(gè)重組位點(diǎn);和(b)使第一目的分子或化合物上的一些或全部重組位點(diǎn)與第二目的分子或化合物上的一些或全部重組位點(diǎn)重組。103.權(quán)利要求102的方法,還包括使包含重組位點(diǎn)的核酸與該第一和第二目的分子或化合物附著。104.權(quán)利要求102的方法,其中至少一個(gè)目的分子或化合物是選自下組的分子或化合物(a)糖;(b)類固醇;和(c)脂質(zhì)。105.用于對(duì)核酸區(qū)段進(jìn)行接合、缺失或置換的試劑盒,該試劑盒包含(1)一或多個(gè)重組蛋白或包含一或多個(gè)重組蛋白的組合物,(2)至少一個(gè)包含具有至少兩種不同的重組特異性的一或多個(gè)重組位點(diǎn)的核酸分子;和(3)選自下組的一或多個(gè)成分(a)包含額外重組位點(diǎn)的核酸分子;(b)具有連接酶活性的一或多個(gè)酶;(c)具有聚合酶活性的一或多個(gè)酶;(d)具有逆轉(zhuǎn)錄酶活性的一或多個(gè)酶;(e)具有限制性內(nèi)切酶活性的一或多個(gè)酶;(f)一或多個(gè)引物;(g)一或多個(gè)核酸文庫(kù);(h)一或多個(gè)支持物;(i)一或多個(gè)緩沖液;(j)一或多個(gè)去污劑或含有去污劑的溶液;(k)一或多個(gè)核苷酸;(l)一或多個(gè)終止劑;(m)一或多個(gè)轉(zhuǎn)染試劑;(n)一或多個(gè)宿主細(xì)胞;和(o)使用試劑盒成分的說(shuō)明書(shū)。106.權(quán)利要求105的試劑盒,其中所述重組位點(diǎn)具有至少3個(gè)不同的重組特異性,每一個(gè)都包含具有不同7堿基對(duì)重疊區(qū)的att位點(diǎn)。107.權(quán)利要求105的試劑盒,其中包含一或多個(gè)重組蛋白的組合物能夠催化att位點(diǎn)間的重組。108.權(quán)利要求105的試劑盒,其中包含一或多個(gè)重組蛋白的組合物能夠催化BP反應(yīng)、LR反應(yīng)、或BP及LR反應(yīng)。全文摘要本發(fā)明提供用于重組克隆的組合物和方法。該組合物包括含有具有獨(dú)特特異性的多個(gè)重組位點(diǎn)的載體。該方法允許同時(shí)克隆兩個(gè)或多個(gè)不同的核酸分子。在一些實(shí)施方案中,將這些分子融合在一起,而在其它實(shí)施方案中,將這些分子插入載體的不同位點(diǎn)。一般地,本發(fā)明還提供通過(guò)重組將許多可以相同或不同的分子和/或化合物(如化學(xué)化合物、藥物、蛋白質(zhì)或肽、脂、核酸、糖等)連接或接合起來(lái)的方法。根據(jù)本發(fā)明,這些分子和/或化合物或這些分子和/或化合物的組合還可以通過(guò)重組與多種結(jié)構(gòu)或支持物結(jié)合。文檔編號(hào)C12P19/00GK1757724SQ200510103730公開(kāi)日2006年4月12日申請(qǐng)日期2000年12月11日優(yōu)先權(quán)日1999年12月10日發(fā)明者D·柴奧,M·A·布拉什,G·F·坦普爾,J·L·哈特雷,D·R·N·比爾德申請(qǐng)人:茵維特羅根公司