專利名稱::利用用于工程改造多種性質(zhì)的位點評價文庫對序列和活性關(guān)系進行系統(tǒng)評價的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明提供蛋白質(zhì)工程改造方法。具體地,本發(fā)明提供利用位點評價文庫(siteevaluationlibrary)的方法。
背景技術(shù):
:各種蛋白質(zhì)工程方法為本領(lǐng)域技術(shù)人員已知。一般地,為了獲得期望的蛋白質(zhì)性質(zhì),對蛋白質(zhì)進行修飾。在大部分方法中,對編碼蛋白質(zhì)的克隆基因的核苷酸序列進行突變,并且修飾的基因被表達以產(chǎn)生突變體,篩選所述突變體的目標活性。通常,將突變體性質(zhì)與野生型蛋白質(zhì)的性質(zhì)進行比較。在歷史上,蛋白質(zhì)設(shè)計方法被作為等同于在所有蛋白質(zhì)空間中找尋用于期望應(yīng)用的一種最好序列的問題進行研究。該問題極其困難并且是"NP難題(NPhard)"。在復(fù)雜性理論中,被定義為P類的問題被認為是容易的,對于它們的解存在有效的多項式-時間算法。NP難題問題是這樣的問題其有效的多項式-時間算法目前是未知的,并且如果任何NP難題問題可以被解決的話,則所有NP難題問題都可以被解決(參見例如Pierce禾BWinfree,ProteinEngineer"15:779-782[2002])。目前構(gòu)建和篩選文庫的策略一般涉及在整個序列中隨機地或者在蛋白質(zhì)內(nèi)確定的位置以控制的隨機方式產(chǎn)生蛋白質(zhì)序列多樣性。這些文庫一般具有大量成員,它們基本的目標性質(zhì)是"負向的",并且需要大量的數(shù)目被篩選以找到相對小量的正突變。一般地,負突變被忽略,并且只獲得正成員的序列信息。飽和誘變(Estell等,在WorldBiotechReport1984,vol.2:USA:OnlinePublications,London[1984],第181-187頁;和Wells等,Gene34:315-323[1985])是一項可被用于尋找蛋白質(zhì)空間中優(yōu)化蛋白質(zhì)幾種性質(zhì)的突變的技術(shù)。幾個研究小組已經(jīng)開發(fā)了鑒別將被飽和誘變改變的位點的策略(Reetz等,Angew.Chem.Int.Edn.,44:4192-4196[2005];Kato等,J,Mol.Biol"351:683-692[2005];和Sandberg等,Proc.Natl.Acad.Sci.,90:8367-8371[1993]),但是還沒有提出位點鑒別的通用系統(tǒng)。此外,因為大部分蛋白質(zhì)工程改造方法產(chǎn)生大量氨基酸突變選擇,所以一般需要對大量變體進行篩選以產(chǎn)生期望的蛋白質(zhì)性質(zhì)。一般地,反復(fù)進行篩選以產(chǎn)生有益的變體。因此,大部分方法是艱巨且費時的。本領(lǐng)域?qū)τ行У那耶a(chǎn)生期望結(jié)果的蛋白質(zhì)工程改造方法存在持續(xù)需求。
發(fā)明內(nèi)容本發(fā)明提供蛋白質(zhì)工程改造方法。具體地,本發(fā)明提供利用位點評價文庫的方法。特別地,本發(fā)明提供使用所獲得的關(guān)于許多期望性質(zhì)的信息的方法,以便合理且有效地設(shè)計將優(yōu)化那些性質(zhì)的文庫。在一些實施方式中,本發(fā)明提供設(shè)計對至少兩種期望性質(zhì)來說是改進的文庫的方法。本發(fā)明提供在蛋白質(zhì)的氨基酸序列內(nèi)鑒別在改進所述蛋白質(zhì)的期望性質(zhì)方面相關(guān)的位置的方法。在一些特別優(yōu)選的實施方式中,本發(fā)明提供確定哪些突變是期望的方法,以便產(chǎn)生具有這些期望性質(zhì)以及改進的性質(zhì)的蛋白質(zhì)。在一些另外特別優(yōu)選的實施方式中,本發(fā)明提供鑒別改進的具體百分數(shù)好于野生型蛋白質(zhì)(例如,對于一種性質(zhì)來說好于野生型的110%)的氨基酸位置和突變的方法。在仍是進一步優(yōu)選的實施方式中,本發(fā)明提供鑒別這樣的突變的方法,所述突變提供至少一個改進很多的性質(zhì)以及至少一個比野生型蛋白質(zhì)沒有顯著差的另外性質(zhì)(例如對于一種性質(zhì)來說,好于野生型的110%,但對于另外一個性質(zhì)沒有差于野生型的90%)。在仍是進一步優(yōu)選的實施方式中,基于該信息構(gòu)建文庫。在一些實施方式中,利用所有鑒別的突變構(gòu)建文庫,而在一些其它的實施方式中,利用所鑒別突變的子集構(gòu)建文庫。實際上,沒有意圖將文庫限于任何特定的突變數(shù)目和/或突變類型。本發(fā)明提供蛋白質(zhì)工程改造方法,其包括下列步驟提供蛋白質(zhì)變體文庫;在目標測試中測試所述蛋白質(zhì)變體文庫的至少一種目標性質(zhì);鑒別所述至少一種目標性質(zhì)的值的范圍;鑒別與所述目標測試中有利結(jié)果相關(guān)的所述值的范圍內(nèi)的最小值;并且提供多個具有至少一種突變的蛋白質(zhì)變體——其在所述至少一種目標性質(zhì)的所述范圍內(nèi)所述最小值之上,因此提供包含至少一種突變的蛋白質(zhì)變體文庫,并且其中所述文庫富含在所述目標測試中具有有利結(jié)果的成員。在一些實施方式中,所述有利結(jié)果對應(yīng)著在上述第一步驟中所提出的測試中觀測到的最大值的大于50。/。、60%、70%、80%、90%或95%的值。在一些可選的實施方式中,一個以上目標測試被用于本發(fā)明的方法中。在一些優(yōu)選的實施方式中,蛋白質(zhì)是酶。在一些特別優(yōu)選的實施方式中,所述酶選自蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。本發(fā)明還提供蛋白質(zhì)工程改造方法,其包括下列步驟提供蛋白質(zhì)變體文庫;在目標測試中測試所述蛋白質(zhì)變體文庫的至少兩種目標性質(zhì);鑒別所述至少兩種目標性質(zhì)的值的范圍;鑒別與目標測試中有利結(jié)果相關(guān)的值的范圍內(nèi)的最小值;并且提供在所述至少兩種目標性質(zhì)的范圍內(nèi)所述最小值之上的多個蛋白質(zhì)變體,因此提供富含在目標測試中具有有利結(jié)果的成員的蛋白質(zhì)變體文庫。權(quán)利要求5所述的方法,其中所述有利結(jié)果對應(yīng)著在上述第一步驟中所提出的測試中觀測到的最大值的大于50%、60%、70%、80%、90%或95%的值。在一些優(yōu)選的實施方式中,蛋白質(zhì)是酶。在一些特別優(yōu)選的實施方式中,所述酶選自蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。本發(fā)明還提供蛋白質(zhì)工程改造方法,其包括下列步驟提供野生型蛋白質(zhì)以及所述野生型蛋白質(zhì)的蛋白質(zhì)變體文庫;在目標測試中測試所述蛋白質(zhì)變體文庫和所述野生型蛋白質(zhì)的至少一種目標性質(zhì);鑒別所述至少一種目標性質(zhì)的值的范圍;鑒別與目標測試中有利結(jié)果相關(guān)的值的范圍內(nèi)的最小值;鑒別與野生型所獲得的結(jié)果比較具有有利的結(jié)果的蛋白質(zhì)變體,其中所述有利的結(jié)果是改進的目標性質(zhì);并且提供在所述至少一種目標性質(zhì)的范圍內(nèi)所述最小值之上的多個蛋白質(zhì)變體,因此提供富含在目標測試中具有有利結(jié)果的成員的改進蛋白質(zhì)變體文庫。在一些優(yōu)選的實施方式中,所述方法進一步包括確定性能指數(shù)的步驟,其中所述性能指數(shù)是通過用每個改進的蛋白質(zhì)變體所獲得的值除以所述野生型蛋白質(zhì)所獲得的值確定的。在一些特別優(yōu)選的實施方式中,所述方法進一步包括鑒別改進的蛋白質(zhì)變體的步驟,其中所述改進的蛋白質(zhì)變體在目標測試中達到大于1.1的性能指數(shù)。在一些另外的實施方式中,蛋白質(zhì)是酶。在一些特別優(yōu)選的實施方式中,所述酶選自蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。在一些可選的實施方式中,蛋白質(zhì)選自抗體和生長因子。在仍是另外優(yōu)選的實施方式中,所述野生型蛋白質(zhì)是選自下列的酶的成熟形式蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。在一些優(yōu)選的實施方式中,目標性質(zhì)選自電荷、洗滌性能、硬表面清潔性能、熱穩(wěn)定性、儲存穩(wěn)定性、洗滌劑穩(wěn)定性、底物結(jié)合、酶抑制、表達水平、反應(yīng)速率和底物降解。在一些實施方式中,野生型蛋白質(zhì)和蛋白質(zhì)變體是至少一種洗滌劑組合物的成份。在一些優(yōu)選實施方式中,洗滌性能是在具有5至12.0之間的pH、被配制成粉末狀或液體洗滌劑的洗滌劑組合物中測試的。本發(fā)明還提供在蛋白質(zhì)折疊內(nèi)生產(chǎn)改進的親代蛋白質(zhì)變體的方法,其包括在目標測定中跨目標性質(zhì)的范圍測定所述蛋白質(zhì)折疊內(nèi)測試蛋白質(zhì)的多個變體;鑒別在與所述目標測定中有利結(jié)果相關(guān)的所述目標性質(zhì)的所述范圍內(nèi)的最小值;在目標測定中測定所述蛋白質(zhì)折疊的親代蛋白質(zhì);并且通過在親代蛋白質(zhì)中引入氨基酸取代產(chǎn)生親代蛋白質(zhì)的改進的變體,使得改進的變體在目標性質(zhì)的范圍的最小值之上。在一些優(yōu)選的實施方式中,親代蛋白質(zhì)和測試蛋白質(zhì)是不同的。在一些實施方式中,所述方法進一步包括確定性能指數(shù)的步驟,其中所述性能指數(shù)是通過用改進的蛋白質(zhì)變體所獲得的值除以所述親代蛋白質(zhì)所獲得的值確定的。在一些實施方式中,測試蛋白質(zhì)和親代蛋白質(zhì)是酶。在一些特別優(yōu)選的實施方式中,所述酶選自蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。在一些可選的實施方式中,測試和親代蛋白質(zhì)選自抗體和生長因子。在仍是另外優(yōu)選的實施方式中,所述親代蛋白質(zhì)是選自下列的酶的成熟形式蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。在一些優(yōu)選的實施方式中,目標性質(zhì)選自電荷、洗滌性能、硬表面清潔性能、熱穩(wěn)定性、儲存穩(wěn)定性、洗滌穩(wěn)定性、底物結(jié)合、酶抑制、表達水平、反應(yīng)速率和底物降解。在一些實施方式中,測試和親代蛋白質(zhì)是至少一種洗滌劑組合物的成份。在一些可選的實施方式中,改進的蛋白質(zhì)變體是洗滌劑組合物的成份。在一些優(yōu)選的實施方式中,洗滌性能是在具有5至12.0之間的pH、被配制成粉末狀或液體洗滌劑的洗滌劑組合物中測試的。圖1提供每個性能所獲得的2851A厶Gapp值的分布。[13]圖2A提供與64個隨機選擇的文庫成員的AAG,值的實際分布相比,計算對于一千個隨機選擇的四個位點處突變的組合來說LAS穩(wěn)定性和角蛋白活性的AAGapp值的期望分布所得的結(jié)果。圖2B顯示對64個隨機選擇的文庫成員所觀測到的實際分布。具體實施例方式本發(fā)明涉及蛋白質(zhì)工程改造方法。具體地,本發(fā)明提供利用位點評價文庫的方法。對于實際目的來說,為了產(chǎn)生對于特定應(yīng)用來說最優(yōu)的蛋白質(zhì),在蛋白質(zhì)空間中找尋最好的序列通常不是必需的。對于大部分應(yīng)用來說,要解決的問題是鑒別至少一種滿足或超過許多性質(zhì)所需的最小值的蛋白質(zhì)序列。這需要具有對特定性質(zhì)有利的突變的知識以及對任何期望性質(zhì)不利的那些突變的知識。本發(fā)明提供通過在蛋白質(zhì)中鑒別那些可被改變以改進基本性質(zhì)并且將其它性質(zhì)的值保持在期望限度內(nèi)的位置而實現(xiàn)目標的方法。本發(fā)明提供通過在每個位點建立"位點評價文庫"評價蛋白質(zhì)內(nèi)所有位置的所有目標性質(zhì)的方法。在優(yōu)選的實施方式中,這些文庫在每個位置含有9-19個突變,并且被用于評價每個位置在工程改造蛋白質(zhì)和構(gòu)建文庫方面的應(yīng)用。相對親代酶對每個性質(zhì)進行測量,并且計算每個突變體相比野生型的表觀自由能差。這些德耳塔德耳塔G("即,AAG")表觀值然后被用于測定可加性。分析變體的理想方式是通過在目標過程中變體相比親代蛋白質(zhì)的自由能差。過程的吉布斯(Gibbs)自由能代表系統(tǒng)可做的功的最大量。與親代酶相比的自由能變化(AAG)如下給出△△G=-HTln(k變體/k親代)其中k,是變體酶的速率常數(shù),k靴是親代酶的速率常數(shù),R是氣體定律常數(shù)以及T是絕對溫度。大部分試驗沒有設(shè)計得允許測定真實的自由能,所以我們利用下列量△△Gapp=-RTIn(P變體/P親代)其中P變體是變體的性能值以及P親代是在相同條件下親代酶的性能值。對于數(shù)據(jù)分布和可加性,AAG^值可被期望以類似于AAG的方式表現(xiàn)。然而,因為AAG是與親代酶比較變體可以做的功的最大量,所以AAG^的量一般將低估了AAG并且將導(dǎo)致表現(xiàn)出增效的結(jié)果,原因在于兩個加和位置的性質(zhì)可能大于通過將它們的AAGapp值加在一起所預(yù)知的值。本發(fā)明的方法被用于設(shè)計有效的文庫,所述文庫被用于平行工程改造多個性質(zhì)。盡管本文描述的是"ASP"——189個氨基酸絲氨酸蛋白酶,但該方法適用于要工程改造的任何目標蛋白質(zhì)。ASP蛋白酶在絲氨酸蛋白酶的S1E家族中(參見,例如Rawlings等,NucleicAcidsRes.,34:D270-D272[2006])并且是灰鏈霉菌肽酶(streptogrisin)的同系物。衍生自纖維單胞菌屬菌株69B4(Ce//"fomomw"ra!'"6幼4)(DSM983316035)的成熟絲氨酸蛋白酶是189個氨基酸長(SEQIDNO:2),其含有由His32、Asp56和Serl37組成的催化三聯(lián)體,如下所示(其中催化三聯(lián)體以粗體和下劃線表示)FDVIGGNAYTIGGRSRCSIGFAVNGGFITAG玨CGRTGATTANPTG丁FAGSSFPGNfiYAFVRTGAGVNIXAQVNNYSGGRVQVAGHTAAPVGSAVCRSGSTTSGGSGNCRTGGTTFFQPVNPILQAYGLRMITTDSG§"SP(SEQIDNO:2)位點評價文庫(SELs)是如本文所述通過在189個位置中的每個位置上引入12至19個取代構(gòu)建的。189個位置處的2851個突變是利用三個不同的活性試驗和兩個不同的穩(wěn)定性試驗進行分析的。每個位置平均有15個突變。SEL變體數(shù)據(jù)的評價表I提供蛋白質(zhì)中一個位置即位置14的數(shù)據(jù)。<table>tableseeoriginaldocumentpage12</column></row><table>[22]對于每個位置,野生型氨基酸作為參考點被列出。在位置14,R014R代表野生型,并且R014X代表測量的每個突變。對于每種性質(zhì),16次測量被用于確定親代酶的AAG^平均值和標準偏差。親代平均值(p親代)歸一化為0,并且確定AAGapp的標準偏差(CJ親代)。這些值被用作分子的每個位置處每種性質(zhì)的參照,并且在表I中被列在R014R行。全部2851個突變體的結(jié)果總結(jié)被提供在表ii中。突變被分成兩類——"上升(UP)"和"下降(Down)"。如果AAG叩p是負的或者0,突變體是"上升",并且如果AAG^是正的,突變體是"下降"。突變是上升或下降的概率是通過數(shù)上升或下降的突變的個數(shù)并且將該個數(shù)除以突變的總數(shù)(即,在asp的情況下是2851)來確定的。對于特定性質(zhì),突變是下降的概率(即,p下降(pDown))被發(fā)現(xiàn)在84-94%的范圍內(nèi)。對于特定性質(zhì),突變是上升的概率(即,p上升(pUp))被發(fā)現(xiàn)在6-16%的范圍內(nèi)。這些數(shù)據(jù)表明,對一種性質(zhì)有利的累積突變需要所有其它的性質(zhì)將變差。表n.突變體的結(jié)果總結(jié)<table>tableseeoriginaldocumentpage13</column></row><table>每種性質(zhì)所獲得的2851個AAGapp值的分布顯示在圖1中。在一些實施方式中,所有性質(zhì)的分布被模擬為兩個或更多個高斯(Gaussian)分布的加和。這與文獻中報道的文庫的自由能分布一致(Lancet等,Proc,Natl.Acad.Sci.USA90:8367-8371[1993];禾QLu等,Proc.Natl.Acad.Sci.USA98:1410-1415[2001])。因此,每種性質(zhì)的平均AAG,值都基本上比親代酶差。對于具有P/?;蚋儆H代活性(AAGapp>2.7)的每個突變,該值任意地固定在1%,這是由于試驗系統(tǒng)中固有的誤差。對于每種性質(zhì),大量突變具有1%或更少的親代活性。對于這些數(shù)據(jù)并且對于呈現(xiàn)出多于5%的親代酶活性的突變體子集,計算平均值和標準偏差(參見表m)。2851個變體的每種性質(zhì)的平均AAGapp值在0.9至1.5千卡/摩爾之間變化,其對應(yīng)著親代酶活性的20%至7%。重要的是要注意,這些分布也代表著在隨機文庫中預(yù)期的AAG,值分布,其每個成員平均具有一個突變。表III.所有突變體的平均值和標準偏差具有《1%的親代酶活性的突變體的平均值和標準偏差<table>tableseeoriginaldocumentpage14</column></row><table>具有〉5%的親代酶活性的突變體的平均值和〗示準偏差<table>tableseeoriginaldocumentpage14</column></row><table>為了證明性質(zhì)之間的相關(guān)性,對位點評價數(shù)據(jù)進行測試。每種性質(zhì)的AAGapp值對每種其它的性質(zhì)作圖,并且相關(guān)系數(shù)被計算且顯示在表IV中。蛋白質(zhì)底物上兩種活性測量是相關(guān)的(r2=0.77),其中對合成肽底物AAPF具有活性的任一蛋白質(zhì)底物僅有弱的相關(guān)性(r2=0.53)。兩種穩(wěn)定性測量都不與活性測量相關(guān)或者相互之間不相關(guān)。<table>tableseeoriginaldocumentpage15</column></row><table>SEL位置數(shù)據(jù)的評價為了分析氨基酸序列內(nèi)的位置,定義了兩種類型的位點。"非生產(chǎn)性(unproductive)"位點沒有比親代酶好的突變,而"生產(chǎn)性(productive)"位點具有至少一個比親代酶好的取代。表V提供ASP的189個位置內(nèi)每個性質(zhì)的生產(chǎn)性和非生產(chǎn)性位點的數(shù)目。位點將是生產(chǎn)性的概率是通過生產(chǎn)性位點的數(shù)目除以位點總數(shù)(189)得到的。盡管任何突變將好于親代酶的概率低(即,6%-28%),但是給定位點將具有至少一個上升突變的概率非常高。表V.ASP中生產(chǎn)性和非生產(chǎn)性位點的數(shù)目和百分數(shù)<table>tableseeoriginaldocumentpage15</column></row><table>令人感興趣的是確定生產(chǎn)性和非生產(chǎn)性位點相對于ASP中的結(jié)構(gòu)特征(例如隱蔽氨基酸、相互作用的氨基酸、靠近活性位點的位置等)以及在進化中保守或可變化的序列位點是如何分布的。為了進行該確定,對ASP的結(jié)構(gòu)進行檢査,并且該序列與20個非冗長的同系物比對(Edgar,Nucl.AcidsRes.,32:1792-1797[2004])。結(jié)果被提供在表VI中。表VI.生產(chǎn)性和非生產(chǎn)性位點的分析<table>tableseeoriginaldocumentpage16</column></row><table>值得注意的是,對于所研究的性質(zhì),在ASP的疏水性核中沒有發(fā)現(xiàn)生產(chǎn)性位點。同樣令人感興趣的是注意到,酪蛋白活性的大部分生產(chǎn)性位點沒有一個接近催化三聯(lián)體。只有一個酪蛋白生產(chǎn)性位點(P118)與底物接觸。其余的酪蛋白生產(chǎn)性位點分布于整個蛋白質(zhì)上的可彎曲表面環(huán)??拷钚晕稽c處,沒有發(fā)現(xiàn)角蛋白活性的生產(chǎn)性位點。發(fā)現(xiàn)這些位點分布在整個分子的表面上。角蛋白生產(chǎn)性位點最接近的是R014,其距離催化絲氨酸(S137,Ca-Ca距離)幾乎仍有13A遠。LAS穩(wěn)定性生產(chǎn)性位點的位置遵循分布于整個蛋白質(zhì)的可彎曲表面環(huán)上的總體方案。這也適用于熱穩(wěn)定性生產(chǎn)性位點的位置,其中有一個例外C033與氨基酸序列中的H032具有范德華接觸并且與其連貫相鄰。基于序列對比,位點被鑒別為"保守的"(20個序列內(nèi)沒有差別)、"可變的"(在20個序列內(nèi)6個或以上不同的氨基酸)、或者相對于ASP"插入或缺失的位點"。預(yù)期的數(shù)目是從位點滿足給定條件并且對于給定性質(zhì)來說是生產(chǎn)性的或非生產(chǎn)性的概率來計算的。計算所觀測到的數(shù)目與預(yù)期的數(shù)目的比值;在1.4以上以及在0.6以下的數(shù)目被認為是表明特定類型位點過多表示或不足表示。截止值是基于從與每種類型位點的數(shù)目相匹配的IO個隨機產(chǎn)生的數(shù)據(jù)集的結(jié)果進行選擇的。發(fā)現(xiàn),對于蛋白酶對兩種蛋白質(zhì)底物的活性以及對LAS的穩(wěn)定性來說,隱蔽殘基和帶有幾個接觸的殘基與非生產(chǎn)性位點強烈相關(guān)。令人驚訝地,與生產(chǎn)性相比,靠近活性位點的位置被發(fā)現(xiàn)更有可能是非生產(chǎn)性的。在序列對比中,對于蛋白質(zhì)底物的活性以及對于LAS穩(wěn)定性來說,保守的位點尤其可能是非生產(chǎn)性的,而高可變位點以及插入或缺失的位點對于活性來說更有可能是生產(chǎn)性的,對穩(wěn)定性幾乎沒有作用。如實施例5所示,不管性質(zhì)的相關(guān)性如何,對任意性質(zhì)來說有害的突變與對每個其它的性質(zhì)來說有害的突變相關(guān)。只有少量的位置(5-10%)具有對全部性質(zhì)來說有害的突變。這些位置定義了"折疊"并且在進化中是保守的。這一點的隱含意思是,盡管對任意性質(zhì)來說有利突變的鑒別需要對那種性質(zhì)來說真正有預(yù)言性的篩選,但是對任意性質(zhì)來說可能有害的突變的鑒別可以通過任意篩選來完成。簡化的蛋白質(zhì)工程策略是用簡單的活性和/或穩(wěn)定性篩選建立SELs和進行篩選。有害的突變被鑒別并且那些具有很少有害突變的位置被用于建立文庫以及組合的突變被用于改進多個性質(zhì)。另外,挑選位于蛋白質(zhì)表面、具有很少相互作用并且在序列比對中可變的位點提供了高比例的生產(chǎn)性位點。位于分子內(nèi)部、具有很多接觸并且在進化中被強烈保守的位點將具有高的具有有害突變的概率并且應(yīng)當被避免。應(yīng)考慮到,任何分析序列和/或結(jié)構(gòu)信息的合適方法將被用于本發(fā)明,所述方法包括但不限于計算機和/或電子方法和/或程序。在實施例5中提供的表提供了對于兩種性質(zhì)中每一種來說具有多于5。/。wt活性和小于5%活性的變體數(shù)目的成對比較,以及這兩種性質(zhì)的相關(guān)系數(shù)。來自三種酶即ASP、ACT和NPRe的結(jié)果被顯示,盡管沒有意圖將本發(fā)明限于這些具體的酶,因為本文提供的方法被用于任何蛋白質(zhì)。酶(ASP、ACT禾卩NPRe)和試驗系統(tǒng)被詳細描述在美國專利申請序列號10/576,331、10/581,014、11/581,102禾tl11/583,334中,它們都被引入其全部內(nèi)容作為參考。此外,在2007年6月6日提交的美國臨時專利申請序列號60/933,312中提供的方法與本發(fā)明一起被使用。本文所用的性質(zhì)對于ASP來說是酪蛋白活性(CAS)、角蛋白活性(KER)、AAPF活性(AAPF)、LAS穩(wěn)定性(LAS)以及熱穩(wěn)定性;以及對于ACT來說是過酸形成(PAF)和過酸降解(PAD)。在這些實驗中,被發(fā)現(xiàn)相關(guān)(相關(guān)系數(shù)〉0.5)的性質(zhì)只有對于ASP來說的CAS、KER和AAPF。所有其它的性質(zhì)都是不相關(guān)的(相關(guān)系數(shù)<0.3)。不管性質(zhì)是不相關(guān)的這一事實,突變對于兩種性質(zhì)來說將有害的概率比偶然預(yù)期的高很多。在該表中,提供的是觀測到的變體數(shù)目與偶然預(yù)期的變體數(shù)目的計算比值。大于1的數(shù)表明正相關(guān),小于1的數(shù)表明負相關(guān)。文庫設(shè)計在一些特別優(yōu)選的實施方式中,位點評價文庫數(shù)據(jù)被用于組合文庫的設(shè)計。傳統(tǒng)的定向進化建立了隨機文庫并且對于單一性質(zhì)來說篩選了大量文庫,將這些組合并且重復(fù)該過程。正如幾個研究者已經(jīng)發(fā)現(xiàn)的(參見例如,Bloom等,Curr,Opin.Struct.Biol.,15:447-452[2005];Bloom等,Proc.Natl.Acad.Sci.USA103:5869-5874[2006];和Guo等,Pro"Natl.Acad.Sci.USA101:9205-9210[2004]),對于一種性質(zhì)來說正突變的累積通常導(dǎo)致其它性質(zhì)的下降。這也容易地顯示在表n中,因為任何突變對于任何性質(zhì)來說將是上升的概率小,任何突變將是下降的概率高(>85%),并且累積三個(3)以上的增加活性的突變將導(dǎo)致幾個其它性質(zhì)的下降的概率非常高。然而,該問題通過使用位點評價數(shù)據(jù)建立有利于多個性質(zhì)的文庫得以避免。非生產(chǎn)性位點將不被包括在組合文庫中,并且生產(chǎn)性位點進一步按照上升的突變的百分數(shù)來劃分。四個非相互作用位點的組(14-24-127-159)被用于設(shè)計文庫以一次性改進兩種性質(zhì),其中所述位點對于LAS穩(wěn)定性和角蛋白活性來說具有高百分數(shù)的上升突變(參見表vn)。表w.按位置的比親代蛋白好的變體百分數(shù)<table>tableseeoriginaldocumentpage19</column></row><table>假定位點具有相加性,預(yù)期的AAG,值是針對文庫計算的,并且與實際文庫所確定的值相比較。在一些實施方式中,對于性質(zhì)具有相加性的位點來說,結(jié)果通常一致。但是,在其它實施方式中——其中結(jié)果與預(yù)期不一致,它們不一致的方式提供了關(guān)于位點相互作用(一種或多種)、性質(zhì)不具相加性和/或所用的試驗的適當性的信息。計算對于一千個隨機選擇的四個位點處突變組合來說LAS穩(wěn)定性和角蛋白活性的AAG^值的預(yù)期分布,并且將其與64個隨機選擇的文庫成員的AAG,值的實際分布比較。結(jié)果顯示在圖2A中。圖2B顯示了對64個隨機選擇的文庫成員所觀測到的實際分布。該文庫明顯具有大量對于LAS穩(wěn)定性和角蛋白活性來說比親代酶好的成員。所觀測到的0.02千卡的角蛋白活性的平均值與-0.01千卡的預(yù)期平均值非常一致,這符合這些位點的相加性。對于LAS穩(wěn)定性結(jié)果來說,所觀測到的-1.13的平均值明顯超過-0.28的預(yù)期值,盡管標準偏差是相似的(參見表Vffl)。<table>tableseeoriginaldocumentpage20</column></row><table>在LAS穩(wěn)定性的情況下,SEL突變體的原始試驗低估了真實的AAG,值。對試驗進行改變,溫育溫度從25'C升高至35°C,因為大部分文庫成員在試驗條件下是穩(wěn)定的并且該文庫是在更嚴格的條件下進行試驗的。AAG,值被校正以將這一點考慮在內(nèi),但是假定符合標準偏差,該校正仍可能低估真實的AAG,值,并且位點對于LAS穩(wěn)定性來說仍可能具有相加性。定義除非另外說明,本發(fā)明的實施將包括在分子生物學(xué)、蛋白質(zhì)工程、微生物學(xué)和重組DNA中通常使用的常規(guī)技術(shù),其在本領(lǐng)域的技能范圍之內(nèi)。這樣的技術(shù)對于本領(lǐng)域普通技術(shù)人員而言是已知的,并且被描述在許多教材和參考書中(參見,例如Sambrook等,"MolecularCloning:ALaboratoryManual",第二版(ColdSpringHarbor),[1989];和Ausubel等,"CurrentProtocolsinMolecularBiology"[1987])。在本文中提及的所有專利、專利申請、文章和出版物,無論上文還是下文中提及,都由此明確并入本文作為參考。[42]除非本文中另外定義,本文中所使用的所有技術(shù)和科學(xué)術(shù)語具有與本發(fā)明所屬領(lǐng)域的普通技術(shù)人員所理解的含義相同的含義。例如,Singleton禾口Sainsbury,Z)/c"'o"or少o/M/cra6z'o/ogy朋dMo/ecw/"r5!'ofogy,第二版,JohnWileyandSons,NY(1994);以及Hale和Marham,T7e//a^erCo〃/m1D/W0wa7o/歷o/ogy,HarperPerennial,NY(1991)為本領(lǐng)域普通技術(shù)人員提供了在本發(fā)明中使用的許多術(shù)語的通用詞典。盡管和本文中描述的那些相似或等同的任何方法和材料在本發(fā)明的實踐中可以使用,但是優(yōu)選的方法和材料仍在本文中被描述。因此,通過整體參考說明書,下面即將被定義的術(shù)語被更全面地描述。同樣,如本文所使用,單數(shù)形式的"一(a)"、"一(an)"和"該(所述,the)"包括復(fù)數(shù)含義,除非上下文明確另行指出。數(shù)字范圍包括限定該范圍的數(shù)字。除非另外指出,分別地,核酸以5'到3'的方向從左到右書寫;氨基酸序列以氨基到羧基的方向從左到右書寫??梢岳斫?,本發(fā)明并不限于所述的具體方法、步驟和試劑,因為根據(jù)本領(lǐng)域技術(shù)人員使用它們的背景(上下文),它們可以變化。除非另外說明,本發(fā)明的實施利用了蛋白質(zhì)純化、分子生物學(xué)、微生物學(xué)、重組DNA技術(shù)和蛋白質(zhì)測序中的常規(guī)技術(shù),其全部在本領(lǐng)域技術(shù)人員的范圍之內(nèi)。而且,本文所提供的標題并非是對本發(fā)明的各個方面或各種實施方式的限制,其可以通過整體參考說明書而被擁有。因此,通過整體參考說明書,下面即將被定義的術(shù)語被更加充分地定義。但是,為了幫助理解本發(fā)明,下面定義了許多術(shù)語。如本文所使用,術(shù)語"蛋白酶"和"蛋白水解活性"是指這樣的蛋白質(zhì)或肽,其呈現(xiàn)出水解具有肽鍵的肽或底物的能力。存在許多眾所周知的用于測量蛋白水解活性的方法(Kalisz,"MicrobialProteinases,"在Fiechter(ed.),AdvancesinBiochemicalEngineering/Biotechnology,[1988]中)。例如,蛋白水解活性可以通過比較試驗來確定,所述比較試驗分析各個蛋白酶水解商業(yè)底物的能力。用于分析蛋白酶或蛋白水解活性的示例性底物包括但不限于二甲基酪蛋白(SigmaC-9801)、牛膠原(SigmaC-9879)、牛彈性蛋白(SigmaE-1625)和牛角蛋白(ICNBiomedical902111)。利用這些底物的比色分析在本領(lǐng)域是眾所周知的(參見,例如WO99/34011;和美國專利號6,376,450:兩者在此被引入作為參考)。pNA分析(參見,例如DelMar等,Anal.Biochem.,99:316-320[1979])在測定梯度洗脫期間收集的級分的活性酶濃度方面也是有用的。該分析測定當酶水解可溶合成底物丁二酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-對硝基苯胺(sAAPF-;NA)時,對硝基苯胺的釋放速率。水解反應(yīng)生產(chǎn)黃色的速率在分光光度計上410nm下進行測量并且與活性酶的濃度成比例。此外,280nm下吸光度測量可被用于測定總的蛋白質(zhì)濃度。活性酶/總蛋白質(zhì)比值給出了酶的純度。如本文所使用,術(shù)語"ASP蛋白酶"、"Asp蛋白酶"和"Asp"是指本文所述的絲氨酸蛋白酶。在一些優(yōu)選的實施方式中,Asp蛋白酶是本文設(shè)計為69B4蛋白酶的蛋白酶,其從纖維單胞菌屬菌株69B4中得到。因此,在優(yōu)選的實施方式中,術(shù)語"69B4蛋白酶"是指衍生自纖維單胞菌屬菌株69B4(DSM16035)的天然發(fā)生的成熟蛋白酶,其具有與SEQIDNO:2所提供的基本同一的氨基酸序列。在可選的實施方式中,本發(fā)明提供ASP蛋白酶的部分。術(shù)語"纖維單胞菌屬蛋白酶同系物"是指這樣的天然發(fā)生蛋白酶,其具有與衍生自纖維單胞菌屬菌株69B4或多核苷酸序列的成熟蛋白酶基本同一的氨基酸序列,所述多核苷酸序列編碼這樣的天然發(fā)生的蛋白酶并且該蛋白酶保留了被這樣的核酸編碼的絲氨酸蛋白酶的功能特性。在一些實施方式中,這些蛋白酶同系物被稱為"cellulomonadins,,。如本文所使用,術(shù)語"蛋白酶變體"、"ASP變體"、"ASP蛋白酶變體"和"69B蛋白酶變體"被用于指這樣的蛋白酶,其類似于野生型ASP,尤其在其功能上,但是在其氨基酸序列上具有突變,這使得它們在序列上不同于野生型蛋白酶。如本文所使用,"纖維單胞菌屬某些種(Ce〃w/omo"asM/7)"是指"纖維單胞菌(Ce//W/OWO"w)"屬內(nèi)的所有菌種,其是革蘭氏陽性細菌,被分類為纖維單孢菌(CW/w/omow&ceae)科、微球菌(M/cracocc/"eae)亞目、放線菌(Jc""omjceto/e力目、放線菌04c^2ok^en'a)門這些成員。應(yīng)當認識到,纖維單胞菌屬繼續(xù)經(jīng)歷分類學(xué)改組。因此,該屬意圖包括已經(jīng)被重新分類的菌種。[50]如本文所使用,"芽孢桿菌(S""7/W)屬"包括如本領(lǐng)域技術(shù)人員所熟知的"芽孢桿菌"屬內(nèi)的所有菌種,包括但不限于枯草芽孢桿菌(及wto'to)、地衣芽孢桿菌(及/&/^"^^^)、緩慢芽孢桿菌(及/e"^)、短芽孢桿菌(及^ev&)、嗜熱脂肪芽孢桿菌(^Wean^/zerwop/H'/ws)、嗜堿芽孢木干菌(及a汰a/op/n7iw)、解i定^j、芽f包桿菌(^awj^o/^wey^c/e/w)、克勞氏芽f包桿菌(及c/aww7)、耐鹽芽包桿菌(5./za/cxiMramO、巨大芽孢木干菌(及mega&n.ww)、7疑結(jié)芽f包桿菌(5.coagw/"m0、環(huán)狀芽孢桿菌(5.c/rcw/ara)、5./aw/w禾口蘇云金芽孢桿菌(及^mn'wg^i)。應(yīng)當認識到,芽孢桿菌屬繼續(xù)經(jīng)歷分類學(xué)改組。因此,該屬意圖包括已經(jīng)被重新分類的菌種,包括但不限于生物體例如嗜熱脂肪芽孢桿菌,其現(xiàn)在被命名為"嗜熱脂肪地芽孢桿菌(Geok"'〃wWearaAwmo;/H7"s)"。在氧存在下抗性內(nèi)生芽孢的生產(chǎn)被認為是芽孢桿菌屬的定義特征,盡管該特性也適用于最近命名的環(huán)脂酸芽孢桿菌屬(^//0^/oZ^"7/w)、兼性芽孢桿菌屬(爿m;/7/k!fc說w)、角率硫胺素芽孢桿菌屬""eM〃'm'k/c/〃w)、厭氧芽孢桿菌屬(v4"ox:j^鎖'〃ws)、矢豆芽孢桿菌屬(5rev/Za"'〃ws)、W/o6ac/〃ws、薄壁芽孢桿菌屬(Grac/貼flc///^)、喜鹽芽孢桿菌屬(//a/o6a"7/w)、類芽孢桿菌屬(戶aem'kc/〃w)、需鹽芽孢桿菌屬(<Sa//^c/〃w)、耐熱芽孢桿菌屬(77^mo&c/〃w)、解脲芽孢桿菌屬(f/mkcW/w)和枝芽抱桿菌屬(K>g7'Z>""'〃i/S)。術(shù)語"多核苷酸"和"核酸"一一其在本文可相互交換使用——是指任意長度的核苷酸聚合形式,核糖核苷酸或脫氧核糖核苷酸。這些術(shù)語包括但不限于單、雙或三鏈DNA、基因組DNA、cDNA、RNA、DNA-RNA雜合體、或者包含嘌呤和嘧啶堿基或者其它天然的、化學(xué)、生物化學(xué)修飾的、非天然或衍生的核苷酸堿基的聚合物。下列是多核苷酸非限制性實例基因、基因片段、染色體片段、ESTs(表達序列標記)、外顯子、內(nèi)含子、mRNA、tRNA、rRNA、核酶、cDNA、重組多核苷酸、支鏈多核苷酸、質(zhì)粒、載體、任意序列的分離DNA、任意序列的分離RNA、核酸探針和引物。在一些實施方式中,多核苷酸包括修飾的核苷酸,例如甲基化的核苷酸和核苷酸類似物、尿嘧啶(umcyl)、其它糖和連接基團如氟代核糖和硫醇酯(thioate)和核苷酸分支。在可選的實施方式中,核苷酸序列被非核苷酸成分中斷。如本文使用的,"DNA構(gòu)建物"和"轉(zhuǎn)化DNA"可交互使用,是指被用來將序列引入宿主細胞或生物體的DNA。該DNA可在體外用本領(lǐng)域技術(shù)人員熟知的PCR或其它合適的技術(shù)(一種或多種)產(chǎn)生。在特別優(yōu)選的實施方式中,DNA構(gòu)建物包括目標序列(如引入的(incoming)序列)。在一些實施方式中,序列可操作連接到另外的元件例如控制元件(如啟動子等)。DNA構(gòu)建物可進一步包括選擇性標記。它進一步包括兩側(cè)為同源盒(homologybox)的引入序列。在進一步的實施方式中,轉(zhuǎn)化DNA包括被加在末端的其它非同源序列(即填充序列(stuffersequence)或側(cè)翼)。在一些實施方式中,引入序列的末端被閉合,這樣,轉(zhuǎn)化DNA形成閉合環(huán)。轉(zhuǎn)化序列可以是野生型的、突變體或修飾的。在一些實施方式中,DNA構(gòu)建物包括與宿主細胞染色體同源的序列。在其它實施方式中,DNA構(gòu)建物包括非同源序列。一旦DNA構(gòu)建物在體外被組裝,它可被用于1)將異源序列插入到宿主細胞的期望靶序列中,和/或2)使宿主細胞染色體的區(qū)域發(fā)生突變(即用異源序列取代內(nèi)源序列),3)使靶基因缺失,和/或4)將復(fù)制質(zhì)粒引入宿主。如本文所使用,術(shù)語"表達盒"和"表達載體"是指重組或合成產(chǎn)生的核酸構(gòu)建物,其帶有允許特定核酸在靶細胞中轉(zhuǎn)錄的一系列特定核酸元件。重組表達盒可以被整合入質(zhì)粒、染色體、線粒體DNA、質(zhì)粒DNA、病毒、或核酸片段中。通常,除了其他序列以外,表達載體的重組表達盒部分包括待轉(zhuǎn)錄的核酸序列和啟動子。在優(yōu)選的實施方式中,表達載體具有在宿主細胞中整合和表達異源DNA片段的能力。許多原核和真核表達載體是商業(yè)上可得的。選擇合適的表達載體在本領(lǐng)域技術(shù)人員的知識范圍內(nèi)。術(shù)語"表達盒"在本文中與"DNA構(gòu)建物"和其語法等同詞互換使用。選擇合適的表達載體在本領(lǐng)域技術(shù)人員的知識范圍內(nèi)。如本文所使用,術(shù)語"載體"是指設(shè)計用于將核酸引入一種或多種細胞類型的多核苷酸構(gòu)建物。載體包括克隆載體、表達載體、穿梭載體、質(zhì)粒、盒等。在一些實施方式中,多核苷酸構(gòu)建物包括編碼蛋白酶的DNA序列(例如前體或成熟蛋白酶),其被可操作地連接到合適的前序列(如分泌序列等)上,所述前序列能實現(xiàn)DNA在合適的宿主中的表達。如本文所使用,術(shù)語"質(zhì)粒"是指用作克隆載體的環(huán)形雙鏈(ds)DNA構(gòu)建物,并且其在一些真核生物或原核生物中形成染色體外自我復(fù)制遺傳元件或者整合入該宿主染色體中。如本文在將核酸序列引入到細胞的上下文中所使用,術(shù)語"引入的(introduced)"是指任何適合于將所述核酸序列轉(zhuǎn)移至所述細胞的方法。這樣的引入方法包括但不限于原生質(zhì)體融合、轉(zhuǎn)染、轉(zhuǎn)化、接合和轉(zhuǎn)導(dǎo)(參見,例如Ferrari等,"在Hardwood等,(eds.),Bacillus,PlenumPublishingCorp.,第57-72頁,[1989]中)。如本文所使用,術(shù)語"轉(zhuǎn)化的(transformed)"和"穩(wěn)定轉(zhuǎn)化的(stablytransformed)"是指這樣的細胞,所述細胞具有被整合到其基因組的或者作為保持至少兩代的游離型質(zhì)粒的非天然(異源)多核苷酸序列。當核酸被置于與另一核酸序列的功能關(guān)系中時,該核酸是"可操作連接的"。例如,如果編碼分泌前導(dǎo)區(qū)(即,信號肽)的DNA被表達為參與多肽分泌的前蛋白(preprotein),那么該DNA便被可操作連接到所述多肽的DNA;如果啟動子或增強子影響序列的轉(zhuǎn)錄,那么其被可操作連接到編碼序列;或者如果核糖體結(jié)合位點被設(shè)置以有助于翻譯,那么該核糖體結(jié)合位點被可操作連接到編碼序列。一般來說,"可操作連接的"指,被連接的DNA序列是鄰近的,并且,在分泌前導(dǎo)區(qū)的情況下,被連接的DNA序列是鄰接的且處于閱讀框(readingphase)。然而,增強子不必是鄰接的。通過在方便的限制性位點的連接作用(ligation)來完成連接。如果這樣的位點不存在,合成的寡核苷酸銜接子或連接子依照傳統(tǒng)實踐被使用。如本文所使用,術(shù)語"基因"是指這樣的多核苷酸(例如,DNA片段),其編碼多肽,并且包括在編碼區(qū)域之前和之后的區(qū)域以及位于各編碼片段(外顯子)之間的間插序列(內(nèi)含子)。如本文使用,"同源基因"指來自不同但通常相關(guān)的物種的一對基因,其彼此相對應(yīng),并且彼此相同或非常相似。該術(shù)語包括由于物種形成(即新物種的發(fā)生)而分離的基因(例如直向同源基因),以及由于基因復(fù)制而分離的基因(例如共生同源基因)。如本文使用,"直向同源物"和"直向同源基因"指在不同物種中的基因,它們是通過物種形成從共同的祖先基因(即同源基因)進化來的。典型地,直向同源物在進化的過程中保留了相同的功能。直向同源物的鑒別在新測序的基因組中基因功能的可靠預(yù)測中是有用的。如本文使用,"共生同源物"和"共生同源基因"指在基因組中由于復(fù)制而關(guān)聯(lián)的基因。盡管直向同源物在進化的過程中保持了相同的功能,但是共生同源物進化出新的功能,即使一些功能通常是與原來的功能相關(guān)的。共生同源基因的實例包括但不限于編碼胰蛋白酶、胰凝乳蛋白酶、彈性蛋白酶和凝血酶的基因,所述酶都是絲氨酸蛋白酶并且在相同的物種里一起出現(xiàn)。如本文使用,如果蛋白質(zhì)具有相同的主要二級結(jié)構(gòu)——所述二級結(jié)構(gòu)為相同的排列且具有相同的拓撲連接,則所述蛋白質(zhì)就被定義為具有共同的"折疊"。具有相同折疊的不同蛋白質(zhì)常常具有大小和構(gòu)象不同的二級結(jié)構(gòu)外圍元件和翻轉(zhuǎn)區(qū)域。在一些情況下,這些不同的外圍區(qū)域可以占結(jié)構(gòu)的一半。一起放在相同折疊類型中的蛋白質(zhì)不一定具有共同的進化起源(例如,起因于蛋白質(zhì)的物理性質(zhì)和化學(xué)性質(zhì)的結(jié)構(gòu)相似性促成了某些堆積排列和鏈拓撲)。如本文使用,"同源性"指序列相似或相同,優(yōu)選相同。使用在本領(lǐng)域已知的標準技術(shù)(參見,例如Sm池和Waterman,Adv.Appl.Math"2:482[1981];Needleman和Wunsch,J.Mol.Biol"48:443[1970];Pearson禾卩Lipman,Proc.Natl.Acad.Sci.USA85:2444[1988];在WisconsinGeneticsSoftwarePackage(GeneticsComputerGroup,Madison,WI)中的程序例如GAP、BESTFIT、FASTA和TFASTA;和Devereux等,Nucl.AcidRes.,12:387-395[1984]),確定這種同源性。如本文使用,"類似序列(analogouss叫uence)"指這樣的序列,其中基因的功能與基于纖維單胞菌屬菌株69B4蛋白酶的基因基本上相同。此外,類似基因包括與纖維單胞菌屬菌株69B4蛋白酶的序列具有至少45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%的序列同一性??蛇x地,類似序列具有在纖維單胞菌屬菌株69B4蛋白酶區(qū)域中發(fā)現(xiàn)的基因的70%至100%的聯(lián)配,和/或具有至少5-10個之間的基因在與纖維單胞菌屬菌株69B4染色體內(nèi)的基因相聯(lián)配的區(qū)域中發(fā)現(xiàn)。在另外的實施方式中,多于一個的上述性質(zhì)適用于該序列。類似序列是通過已知的序列比對方法確定的。盡管如上下文所示,通常使用的比對方法是BLAST,但還有其它在比對序列中有用的方法。有用的算法的一個實例是PILEUP。PILEUP使用漸進(progressive)、成對的比對從一組相關(guān)序列中產(chǎn)生,序列聯(lián)配。它也可以作出樹圖,其顯示了用來產(chǎn)生聯(lián)配的群集(cluster;ng)關(guān)系。PILEUP使用簡化了的Feng和Doolittle漸進對比方法(Feng和Doolittle,J.Mol.Evol.,35:351-360[1987])。該方法與Higgins禾QSharp描述的方法(Higgins和Sharp,CABIOS5:151-153[1989])相似。有用的PILEUP參數(shù)包括缺省的空位加權(quán)(gapweight)3.00,缺省的空位長度(gaplength)加權(quán)0.10和加權(quán)的末端空位(weightedendgaps)。有用的算法的另一個實例是Altschul等描述的BLAST算法(Altschul等,J.Mol.Biol"215:403-410,[1990]和Karlin等,Pro"Natl.Acad.Sci.USA90:5873-5787[1993])。特別有用的BLAST程序是WU-BLAST-2程序(參見,Altschul等,Meth.Enzymol"266:460-480[1996])。WU-BLAST-2使用幾個搜索參數(shù),其中大多數(shù)被設(shè)定為默認值??烧{(diào)整的參數(shù)按照下列數(shù)值設(shè)定重疊范圍(overlapspan)=1、重疊分數(shù)(overlapfraction)=0.125、字串閾值(wordthreshold)(T)=11。HSPS和HSPS2參數(shù)是動態(tài)數(shù)值,其可以根據(jù)具體序列的組成和檢索目標序列的具體數(shù)據(jù)庫的組成,由程序自身確定。然而,數(shù)值可被調(diào)整以增加靈敏度。通過匹配的相同殘基的數(shù)目除以被比對區(qū)域中"較長,,序列的總殘基數(shù),確定氨基酸序列同一性的百分比數(shù)值。所述"較長,,序列是在比對區(qū)具有最多實際殘基的序列(WU-BLAST-2為了最大化比對分值而弓I入的空位忽略不計)。因此,"核酸序列同一性百分數(shù)(%)"被定義為與起始序列(即目標序列)的核苷酸殘基同一的核苷酸殘基在候選序列中所占的百分數(shù)。優(yōu)選的方法利用WU-BLAST-2的BLASTN模塊,其被設(shè)為默認參數(shù),其中重疊范圍和重疊分數(shù)分別設(shè)為l和0.125。[69]如本文使用,"重組的"包括表示這樣的細胞或載體,其已經(jīng)通過引入異源核酸序列而被修飾,或者該細胞是衍生自如此修飾的細胞。因此,例如,重組細胞表達沒有在細胞的天然(非重組)形式中以相同形式找到的基因,或者由于人類有意的干預(yù),重組細胞表達以另外的方式異常表達、不足表達或根本不表達的天然基因。"重組"(recombination)、"重組"(recombining)和產(chǎn)生"重組的"核酸通常是將兩個或多個核酸片段裝配,其中所述裝配產(chǎn)生嵌合基因。在優(yōu)選的實施方式中,突變體DNA序列用至少一個密碼子中的位點飽和誘變產(chǎn)生。在另一優(yōu)選的實施方式中,對兩個或以上的密碼子進行位點飽和誘變。在進一步的實施方式中,突變體DNA序列與野生型序列具有大于50%、大于55%、大于60%、大于65%、大于70%、大于75%、大于80%、大于85%、大于90%、大于95%、或大于98%的同源性。在可選的實施方式中,突變體DNA采用已知的任何誘變方法在體內(nèi)產(chǎn)生,例如,舉例來說,輻射、亞硝基胍等。然后將期望的DNA序列分離并且將其用在本文提供的方法中。如本文所使用,術(shù)語"擴增(amplification)"和"基因擴增(geneamplification)"是指,特定DNA序列不成比例地復(fù)制,以至于擴增基因存在的拷貝數(shù)比最初在基因組中存在的拷貝數(shù)高的過程。在一些實施方式中,通過在藥物(例如,可抑制酶的抑制劑)存在的情況下的生長對細胞進行選擇,導(dǎo)致編碼在該藥物存在的情形下生長所需的基因產(chǎn)物的內(nèi)源性基因擴增,或編碼這種基因產(chǎn)物的外源(即,輸入的)序列的擴增,或?qū)е聝煞N擴增。"擴增(amplification)"是涉及模板特異性的特殊情形的核酸復(fù)制。這是和非特異性模板復(fù)制(即,模板依賴性、但不依賴于特定模板的復(fù)制)相比較而言。模板特異性在此區(qū)別于復(fù)制的保真性(即,合成正確的多核苷酸序列)和核苷酸(核糖核苷酸或脫氧核糖核苷酸)特異性。模板特異性通常是就"靶"特異性而進行描述的。從某種意義上講,目標序列是"靶",因為它們被尋找以從其它核酸中挑選出來。擴增技術(shù)主要是針對這種挑選而設(shè)計的。如本文所使用,術(shù)語"引物"是指如在純化的限制性消化中天然存在或合成產(chǎn)生的寡核苷酸,當置于其中與核酸鏈互補的引物延伸產(chǎn)物的合成被誘導(dǎo)的條件下時(即,在核苷酸和誘導(dǎo)劑例如DNA聚合酶存在以及在合適的溫度和pH條件下),所述寡核苷酸能夠作為合成的起始點起作用。為了獲得最大的擴增效率,引物優(yōu)選是單鏈的,但可選地,可以是雙鏈的。如果是雙鏈,在用于制備延伸產(chǎn)物之前,首先處理引物,以將它的鏈分開。優(yōu)選地,引物是寡脫氧核糖核苷酸。引物必須足夠長,以在誘導(dǎo)劑存在的情況下啟動延伸產(chǎn)物的合成。引物的確切長度將取決于許多因素,包括溫度、引物來源和方法的使用。如本文所使用,術(shù)語"探針"是指在純化的限制性消化中天然存在或合成產(chǎn)生——重組或通過PCR擴增——的寡核苷酸(即,核苷酸的序列),其能夠與另一目標寡核苷酸雜交。探針可以是單鏈的或雙鏈的。探針可用于特定基因序列的檢測、鑒定和分離??梢灶A(yù)期,在本發(fā)明中使用的任何探針將用任何"報告分子"標記,以便在任何檢測系統(tǒng)中是可檢測的,包括但不限于酶系統(tǒng)(例如ELISA,以及基于酶的組織化學(xué)測定)、熒光系統(tǒng)、放射性系統(tǒng)和發(fā)光系統(tǒng)。本發(fā)明不意圖被限制于任何特定的檢測系統(tǒng)或標記。如本文所使用,當提及聚合酶鏈式反應(yīng)而使用時,術(shù)語"靶(target)"是指用于聚合酶鏈式反應(yīng)的引物所結(jié)合的核酸區(qū)域。因此,"靶"被尋找,以從其它核酸序列中分選出來。"片段(segment)"被定義為靶序列中的核酸區(qū)。如本文所使用,術(shù)語"聚合酶鏈式反應(yīng)"("PCR")是指美國專利第4,683,195、4,683,202和4,965,188號的方法,由此并入作為參考,其包括用于增加基因組DNA混合物中靶序列的片段濃度而不進行克隆或純化的方法。該擴增靶序列的過程由下列組成向含有期望靶序列的DNA混合物中引入大量過量的兩種寡核苷酸引物,隨后在DNA聚合酶存在下進行順序精確的熱循環(huán)。兩種引物與雙鏈靶序列中它們各自的鏈互補。為實現(xiàn)擴增,該混合物被變性,然后,將引物退火至靶分子內(nèi)它們的互補序列。退火之后,用聚合酶延伸引物,以形成一對新的互補鏈。變性、引物退火和聚合酶延伸的步驟可以被重復(fù)許多次(即,變性、退火和延伸構(gòu)成一個"循環(huán)";可以有無數(shù)個"循環(huán)"),以獲得高濃度的期望靶序列的擴增片段。期望靶序列的擴增片段的長度由引物相互之間的相對位置決定,因此,該長度是可控的參數(shù)。由于該過程的重復(fù)方面,本方法被稱為"聚合酶鏈式反應(yīng)"(下文稱為"PCR")。因為靶序列的期望擴增片段在混合物中變成主要的序列(在濃度方面),它們被描述為"PCR擴增的"。如本文所使用,術(shù)語"擴增試劑"是指除了引物、核酸模板和擴增酶之外擴增所需的那些試劑(脫氧核糖核苷三磷酸、緩沖液等等)。典型地,擴增試劑和其它反應(yīng)成分一起被放在和包含在反應(yīng)容器(試管、微孔等等)內(nèi)。如本文所使用,術(shù)語"RT-PCR"是指RNA序列的復(fù)制和擴增。在該方法中,反轉(zhuǎn)錄與PCR聯(lián)用,最通常地使用一個采用熱穩(wěn)定聚合酶的酶過程進行,如美國專利第5,322,770號中所描述,該專利并入本文作為參考。在RT-PCR中,由于聚合酶的反轉(zhuǎn)錄酶活性,RNA模板被轉(zhuǎn)化成cDNA,然后利用聚合酶的聚合活性進行擴增(即,如在其它PCR方法中)。如本文所使用,術(shù)語"限制性內(nèi)切核酸酶"和"限制性酶"指細菌酶,其每一個在特異性核苷酸序列上或在其附近切割雙鏈DNA。"限制性位點"指被特定限制性內(nèi)切核酸酶識別和切割的核苷酸序列,并且限制性位點通常是用于插入DNA片段的位點。在本發(fā)明某些實施方式中,限制性位點被設(shè)計到選擇標記中,以及被設(shè)計到DNA構(gòu)建物的5'和3'端。"同源重組"指在兩個DNA分子之間或成對染色體之間在同一的或接近同一的核苷酸序列位點上交換DNA片段。在優(yōu)選的實施方式中,染色體整合是同源重組。如本文所使用,"氨基酸"指肽或蛋白質(zhì)序列或其部分。術(shù)語"蛋白質(zhì)"、"肽"和"多肽"可以互相交換使用。如本文所使用,"目標蛋白質(zhì)(proteinofinterest)"和"目標多肽(polypeptideofinterest)"是指期望的或正被評價的蛋白質(zhì)/多肽。在一些實施方式中,目標蛋白質(zhì)在細胞內(nèi)被表達,而在其它實施方式中,它是分泌的多肽。在特別優(yōu)選的實施方式中,這些酶包括本發(fā)明的絲氨酸蛋白酶。在一些實施方式中,目標蛋白質(zhì)是分泌的多肽,其被融合到信號肽中(即在要被分泌的蛋白質(zhì)上進行氨基酸末端延伸)。幾乎所有分泌蛋白質(zhì)使用氨基酸末端蛋白質(zhì)延伸,其在前體蛋白穿越膜的靶向和易位中起關(guān)鍵作用。該延伸在膜轉(zhuǎn)運期間或之后立刻,通過信號肽酶進行蛋白水解除去。如果多核苷酸在其天然狀態(tài)下或者當通過本領(lǐng)域技術(shù)人員已知的方法操縱時能被轉(zhuǎn)錄或翻譯以產(chǎn)生RNA、多肽或其片段,該多核苷酸被說成"編碼"RNA或多肽。這樣的核酸的反義鏈也被說成編碼該序列。如本領(lǐng)域所知,DNA可被RNA聚合酶轉(zhuǎn)錄以產(chǎn)生RNA,但是RNA可以被反轉(zhuǎn)錄酶反轉(zhuǎn)錄以產(chǎn)生DNA。因此DNA可編碼RNA并且反之亦然。"宿主菌株"或"宿主細胞"指根據(jù)本發(fā)明對于包括DNA的表達載體來說合適的宿主。如果酶在宿主細胞中以比其在相應(yīng)的野生型細胞中表達的水平更高的水平表達,那么該酶在所述宿主細胞中被"過量表達(overexpressed),,。術(shù)語"蛋白質(zhì)"和"多肽"在本文中被相互交換使用。根據(jù)IUPAC-IUB生物化學(xué)命名聯(lián)合委員會(JointCommissiononBiochemicalNomenclature,JCBN)所定義的氨基酸3-字母密碼在整個本公開內(nèi)容中被使用。還應(yīng)當理解,由于遺傳密碼的簡并性,多肽可以被多于一個的核苷酸序列所編碼。"前序列(prosequence)"是位于信號序列和成熟蛋白酶之間的氨基酸序列,其對于蛋白酶的分泌來說是必需的。前序列的切割產(chǎn)生成熟活性蛋白酶。術(shù)語"信號序列"或"信號肽"是指可以參與到成熟或前體形式的蛋白質(zhì)的分泌中的任何核苷酸和/或氨基酸序列。這種信號序列的定義是一種功能性定義,意旨包括所有那些被蛋白質(zhì)基因的N-末端部分編碼的氨基酸序列,其參與到蛋白質(zhì)分泌的完成中。它們經(jīng)常但不是普遍地結(jié)合于蛋白質(zhì)的N-末端部分或者前體蛋白的N-末端部分。信號序列可以是內(nèi)源的或外源的。信號序列可以是通常與蛋白質(zhì)(例如蛋白酶)連接的,或者可以來自編碼另一分泌性蛋白質(zhì)的基因。一個示例性外源信號序列包括來自枯草芽胞桿菌屬枯草桿菌蛋白酶(Sa"7/船w6/他subtilisin)的信號序列的前七個氨基酸殘基,其被融合到來自緩慢芽胞桿菌(i5""Uew加)(ATCC21536)的枯草桿菌蛋白酶的信號序列的剩余部分。術(shù)語"雜合信號序列(hybridsignals叫uence)"是指這樣的信號序列,其中部分序列是從表達宿主中獲得的,被融合到要被表達的基因的信號序列中。在一些實施方式中,利用的是合成序列。術(shù)語"成熟"形式的蛋白質(zhì)或肽是指最終功能形式的蛋白質(zhì)或肽。例如,本發(fā)明的成熟形式的蛋白酶至少包括與SEQIDNO:2的殘基位置1-189同一的氨基酸序列。術(shù)語"前體"形式的蛋白質(zhì)或肽是指具有前序列的蛋白質(zhì)成熟形式,所述前序列被可操作連接到該蛋白質(zhì)的氨基或羰基末端。該前體還可具有可操作連接到該前序列的氨基末端的"信號"序列。該前體還可具有另外的多核苷酸,其參與到翻譯后的活動中(例如多核苷酸從中切割以離開成熟形式的蛋白質(zhì)或肽)。"天然發(fā)生的酶"是指具有與在自然界中發(fā)現(xiàn)的同一的、未修飾的氨基酸序列的酶。天然發(fā)生的酶包括天然酶,那些在特定微生物中天然表達的或者發(fā)現(xiàn)的酶。術(shù)語"衍生自"和"從……中獲得"不但是指蛋白酶由正被討論的微生物菌株產(chǎn)生或者可由其產(chǎn)生,而且是指蛋白酶被從這樣的菌株分離出的DNA序列編碼并且產(chǎn)生于含有這樣的DNA序列的宿主生物體。此外,該術(shù)語涉及這樣的蛋白酶,其被合成的和/或cDNA起源的DNA序列編碼并且其具有正被討論的蛋白酶的鑒別特性。作為例子,"衍生自芽孢桿菌屬(CW/"/畫o"m)的蛋白酶"是指那些具有蛋白水解活性的酶,其是由芽孢桿菌屬天然產(chǎn)生的,以及絲氨酸蛋白酶,像由芽孢桿菌屬來源產(chǎn)生的那些,但是其在使用遺傳工程技術(shù)的情況下是由用編碼所述絲氨酸蛋白酶的核酸轉(zhuǎn)化的非芽孢桿菌屬生物體產(chǎn)生的。在該定義范圍內(nèi)的"衍生物"通常保留了在野生型、天然或親代形式中所觀察到的特征蛋白水解活性,其保留程度達到該衍生物可作為野生型、天然或親代形式用于類似的目的。絲氨酸蛋白酶的功能衍生物包括天然發(fā)生的、合成地或重組地產(chǎn)生的肽或肽片段,其具有本發(fā)明的絲氨酸蛋白酶的一般特性。[96]術(shù)語"功能衍生物"是指這樣的核酸衍生物,其具有編碼絲氨酸蛋白酶的核酸的功能特性。編碼本發(fā)明的絲氨酸蛋白酶的核酸的功能衍生物包括天然發(fā)生的、合成地或重組地產(chǎn)生的核酸或片段并且編碼具有本發(fā)明特性的絲氨酸蛋白酶?;诒绢I(lǐng)域已知的遺傳密碼的簡并性,根據(jù)本發(fā)明所述的編碼絲氨酸蛋白酶的野生型核酸包括天然發(fā)生的等位基因和同系物。在兩種核酸或多肽序列的上下文中,術(shù)語"同一的"是指在兩種序列中當被比對最大對應(yīng)性時相同的殘基,如用下列序列比較或分析算法之一所測定。術(shù)語"最優(yōu)比對"是指給出最高百分數(shù)同一性得分的比對。[99]與兩種氨基酸、多核苷酸和/或基因序列(適當?shù)脑?相關(guān)的"百分數(shù)序列同一性"、"百分數(shù)氨基酸序列同一性"、"百分數(shù)基因序列同一性"和域"百分數(shù)核酸和/或多核苷酸序列同一性"是指當序列被最優(yōu)比對時在兩種序列中同一的殘基的百分數(shù)。因此,80%氨基酸序列同一性意味著在兩種最優(yōu)比對的多肽序列中80%的氨基酸是同一的。在兩種核酸或多肽的背景下,短語"基本上同一的(substantiallyidentical)"因此是指這樣的多核苷酸或多肽,采用標準參數(shù),使用程序或算法(例如BLAST、ALIGN和CLUSTAL),與參比序列相比時,其包括至少70%的序列同一性,優(yōu)選至少75%的序列同一性,優(yōu)選至少80%,優(yōu)選至少85%,優(yōu)選地至少90%,優(yōu)選地至少95%,優(yōu)選地至少97%,優(yōu)選地至少98%,和優(yōu)選地至少99%的序列同一性。兩個多肽基本同一的一個暗示是第一多肽與第二多肽在免疫學(xué)上是可交叉反應(yīng)的。典型地,由于保守氨基酸取代而不同的多肽在免疫學(xué)上是可交叉反應(yīng)的。因此,例如在兩種多肽僅僅由于保守取代而不同的情況下,多肽與第二多肽是基本同一的。兩種核酸序列基本同一的另一個暗示是兩個分子在嚴緊條件下相互雜交(例如在中到高嚴緊性的范圍內(nèi))。在該上下文中,短語"等價的(equivalent)"是指被一種多核苷酸編碼的絲氨酸蛋白酶,這種多核苷酸在中等到最大嚴緊性的條件下能雜交到具有如SEQIDNO:l所示的序列的多核苷酸中。例如,等價的意味著等價成熟絲氨酸蛋白酶包括與具有SEQIDNO:2的氨基酸序列的成熟芽孢桿菌屬絲氨酸蛋白酶具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%禾[1/或至少99%的序列同一性。術(shù)語"分離的(isolated)"或"純化的(purified)"是指從其原始環(huán)境(例如,如果它是天然發(fā)生的,則為自然環(huán)境)中去除的材料。例如,當材料在特定組合物中以比在天然發(fā)生的或野生型生物體中存在的濃度更高或更低的濃度存在或者與在從天然發(fā)生的或野生型生物表達后通常不存在的成分組合存在時,該材料被說成是"純化的"。例如,在活動物中存在的天然發(fā)生的多核苷酸或多肽沒有被分離,但是與天然系統(tǒng)中的一些或全部共存材料分開的相同的多核苷酸或多肽就是分離的。在一些實施方式中,這樣的多核苷酸是載體的部分,和/或這樣的多核苷酸或多肽是組合物的部分,并且因為這樣的載體或組合物不是其天然環(huán)境的部分,所以仍要被分離。在優(yōu)選的實施方式中,例如如果核酸或蛋白質(zhì)在電泳凝膠或印跡中基本產(chǎn)生一條帶,該核酸或蛋白質(zhì)被說成是純化的。當提及DNA序列被使用時,術(shù)語"分離的(isolated)"是指這樣的DNA序列,其已經(jīng)從其天然遺傳環(huán)境中除去并且因此不含其它外源的或不想要的編碼序列,并且處于適合用在基因工程蛋白質(zhì)生產(chǎn)系統(tǒng)中的形式。這樣分離的分子是與其自然環(huán)境分開的那些分子并且包括cDNA和基因組克隆。本發(fā)明的分離DNA分子不含其它與其通常締合的基因,但可以包括天然發(fā)生的5'和3'未翻譯的區(qū)域例如啟動子和終止子。締合區(qū)域的鑒別對本領(lǐng)域普通技術(shù)人員來說將是顯而易見的(參見,例如Dynan和Tijan,Nature316:774-78[1985])。術(shù)語"分離的DNA序列"可選地被稱為"克隆的DNA序列"。當提及蛋白質(zhì)被使用時,術(shù)語"分離的(isolated)"是指在除了其天然環(huán)境的條件下發(fā)現(xiàn)的蛋白質(zhì)。在優(yōu)選的形式下,分離的蛋白質(zhì)基本上不含其它蛋白質(zhì),尤其是其它同源蛋白質(zhì)。分離的蛋白質(zhì)10%以上純,優(yōu)選地20%以上純,并且甚至更優(yōu)選地30%以上純,如SDS-PAGE所測定。本發(fā)明進一步的方面包括高純度形式的蛋白質(zhì)(即,40%以上純,60%以上純,80%以上純,卯%以上純,95%以上純,97%以上純,以及甚至99%以上純),如SDS-PAGE所測定。如本文所使用,術(shù)語"組合誘變(combinationalmutagenesis)"是指其中產(chǎn)生起始序列變體文庫的方法。在這些文庫中,變體含有一種或多種選自預(yù)先確定的突變集的突變。此外,該方法提供引入隨機突變的手段,所述隨機突變不是預(yù)先確定的突變集的成員。在一些實施方式中,該方法包括在2000年10月26日提交的美國專利申請序列號09/699,250中所提出的那些方法,其在此被并入作為參考。在可選實施方式中,組合誘變方法包括商業(yè)上可得的試劑盒(例如,QuikChangeMultisite,Stratagene,SanDiego,CA)。如本文所使用,術(shù)語"突變體文庫"是指這樣的細胞群,其大部分基因組是同一的但是包括一個或多個基因的不同同源物。這樣的文庫可以被用于例如鑒別具有改進性狀的基因或操縱子。如本文所使用,術(shù)語"起始基因(startinggene)"是指編碼目標蛋白質(zhì)的目標基因,該目標蛋白質(zhì)采用本發(fā)明進行改進和/或改變。[108]如本文所使用,術(shù)語"多序列比對(multiplesequencealignment)"("MSA")是指采用算法(如ClustalW)比對的起始基因多個同系物的序列。如本文所使用,術(shù)語"共有序列"和"規(guī)范序列"是指特定蛋白質(zhì)或目標序列的所有變體與其比較的原始氨基酸序列。該術(shù)語還指列出在目標DNA序列中最經(jīng)常出現(xiàn)的核苷酸的序歹i」。對于基因的每個位置,該共有序列給出了在MSA中該位置最多的氨基酸。如本文所使用,術(shù)語"共有突變"是指起始基因的序列與共有序列的差別。共有突變通過比較起始基因的序列與從MSA中得到的共有序列進行鑒別。在一些實施方式中,共有突變被引入到起始基因中,致使它變得與共有序列更加類似。共有突變還包括這樣的氨基酸改變,其將起始基因中的氨基酸改變成與在該起始基因中該氨基酸的頻率相比在該位置在MSA中更頻繁地被發(fā)現(xiàn)的氨基酸。因此,術(shù)語共有突變包括所有這樣的單一氨基酸改變,其把該起始基因的氨基酸替換為在MSA中比該氨基酸更多的氨基酸。[111]如本文所使用,術(shù)語"原始標的(initialhit)"是指通過篩選組合共有誘變文庫鑒定的變體。在優(yōu)選的實施方式中,原始標的與起始基因相比具有改進的性能特性。如本文所使用,術(shù)語"改進標的(improvedhit)"是指通過篩選增強的組合共有誘變文庫鑒定的變體。如本文所使用,術(shù)語"改進突變"和"性能增強突變"是指當它被引入到起始基因時導(dǎo)致性能改進的突變。在一些優(yōu)選實施方式中,這些突變通過對在該方法的篩選步驟期間鑒定的標的測序進行鑒定。在大部分實施方式中,與未篩選的組合共有誘變文庫相比較,在標的中更經(jīng)常發(fā)現(xiàn)的突變很可能是改進突變。如本文所使用,術(shù)語"增強的組合共有誘變文庫"是指這樣的CCM文庫,其是基于對來自更早一輪的CCM誘變和篩選的結(jié)果進行篩選和/或測序而設(shè)計和構(gòu)建的。在一些實施方式中,增強的CCM文庫基于從更早一輪的CCM得到的原始標的的序列。在另外的實施方式中,增強的CCM被設(shè)計使得在原始標的中從更早一輪的誘變和篩選中經(jīng)常觀察到的突變被促成。在一些優(yōu)選的實施方式中,這是通過省去編碼性能降低的突變的引物或者通過增加編碼與在更早的CCM文庫中使用的其它引物相比性能增強的突變的引物濃度而實現(xiàn)的。如本文所使用,術(shù)語"性能降低的突變"是指與未篩選的組合共有誘變文庫比較,在組合共有誘變文庫中在篩選得到的標的中更不經(jīng)常被發(fā)現(xiàn)的突變。在優(yōu)選的實施方式中,篩選過程去除和/或降低了包含"性能降低的突變"的變體的豐度。如本文所使用,術(shù)語"功能分析(functionalassay)"是指提供蛋白質(zhì)活性表示的分析。在特別優(yōu)選的實施方式中,該術(shù)語是指這樣的分析系統(tǒng),其中分析蛋白質(zhì)以其通常能力起作用的能力。例如,在酶的情況下,功能分析涉及測定酶在催化反應(yīng)方面的效率。如本文所使用,術(shù)語"靶特性"是指要被改變的起始基因的特性。本發(fā)明沒有意圖限于任何特定的靶特性。然而,在一些優(yōu)選的實施方式中,靶特性是基因產(chǎn)物的穩(wěn)定性(例如,對變性、蛋白水解或其它降解因素的抗性),而在其它實施方式中,生產(chǎn)宿主的生產(chǎn)水平被改變。實際上,預(yù)期起始基因的任何特性在本發(fā)明中將是有用的。[118]如本文所使用,在核酸的上下文中,術(shù)語"特性"或其語法等價物是指可被選擇或檢測的核酸的任何特征或?qū)傩浴_@些特性包括但不限于,影響與多肽結(jié)合的特性、包含特定核酸的細胞所具有的特性、影響基因轉(zhuǎn)錄的特性(例如啟動子強度、啟動子識別、啟動子調(diào)節(jié)、增強子功能)、影響RNA加工的特性(例如RNA剪接、RNA穩(wěn)定性、RNA構(gòu)象和轉(zhuǎn)錄后修飾)、影響翻譯的特性(例如水平、調(diào)節(jié)、mRNA與核糖體蛋白質(zhì)的結(jié)合、翻譯后修飾)。例如,對于轉(zhuǎn)錄因子、聚合酶、調(diào)節(jié)因子等來說,核酸的結(jié)合位點可以被改變以產(chǎn)生期望的特征或者鑒定出不期望的特征。如本文所使用,在多肽(包括蛋白質(zhì))的上下文中,術(shù)語"特性"或其語法上的等價物是指可被選擇或檢測的多肽的任何特征或?qū)傩?。這些特性包括但不限于,氧化穩(wěn)定性、底物特異性、催化活性、熱穩(wěn)定性、堿穩(wěn)定性、pH活性分布、蛋白水解降解抗性、KM、kcat、k^/kM比值、蛋白質(zhì)折疊、誘導(dǎo)免疫應(yīng)答、與配體結(jié)合的能力、與受體結(jié)合的能力、被分泌的能力、在細胞表面上呈現(xiàn)的能力、低聚能力、發(fā)信號能力、刺激細胞增殖的能力、抑制細胞增殖的能力、誘導(dǎo)細胞凋亡的能力、通過磷酸化或糖基化修飾的能力和/或治療疾病的能力等。如本文所使用,術(shù)語"篩選"具有其在本領(lǐng)域的普通含義并且通常是多步驟過程。在第一步中,提供突變體核酸或來自其中的變體多肽。在第二步中,測定突變體核酸或變體多肽的特性。在第三步中,將測定的特性與相應(yīng)的前體核酸的特性、與相應(yīng)的天然發(fā)生的多肽的特性、或者與用于產(chǎn)生突變體核酸的起始材料(例如原始序列)的性質(zhì)相比較。對技術(shù)人員來說顯而易見的是,獲得具有改變的特性的核酸或蛋白質(zhì)的篩選程序取決于起始材料的性質(zhì),其改變意圖有利于產(chǎn)生突變體核酸。因此技術(shù)人員將理解,本發(fā)明沒有限于要篩選的任何特定特性,以及下面對特性的描述僅僅是列出了示例性的實例。篩選任何特定特性的方法通常在本領(lǐng)域中描述。例如,一種方法可以測定突變前后的結(jié)合、pH、特異性等,其中變化(change)預(yù)示著改變(alteration)。優(yōu)選地,篩選以高通量的方式進行,包括同時篩選多個樣品,包括但不限于,利用芯片、噬菌體展示以及多個底物和/或指示劑的分析。如本文所使用,在一些實施方式中,篩選包括選擇步驟,其中目標變體從變體群中富集。這些實施方式的實例包括選擇賦予宿主生物體生長優(yōu)勢的變體,以及噬菌體展示或任何其它展示方法,其中變體可以基于它們的結(jié)合或催化特性從變體群中捕獲。在優(yōu)選的實施方式中,變體文庫被暴露于應(yīng)力(熱、蛋白酶、變性),并且隨后仍完整的變體在篩選中被鑒別或者通過選擇被富集。該術(shù)語意圖包括任何適合于選擇的手段。事實上本發(fā)明沒有意圖限于任何特定的篩選方法。如本文所使用,術(shù)語"耙向隨機化(targetedrandomization)"是指產(chǎn)生多個序列的方法,其中一個或幾個位置被隨機化。在一些實施方式中,隨機化是徹底的(即,所有的四個核苷酸,A、T、G和C可以出現(xiàn)在隨機化的位置)。在可選的實施方式中,核苷酸的隨機化限于這四種核苷酸的子集。靶向隨機化可適用于編碼一個或幾個目標蛋白質(zhì)的序列的一個或幾個密碼子。當被表達時,所得文庫產(chǎn)生蛋白質(zhì)群,其中一個或多個氨基酸位置可以包含全部20個氨基酸的混合物或者氨基酸的子集,如通過隨機化密碼子的隨機化方案所測定。在一些實施方式中,由于密碼子的靶向或者隨機插入或缺失,從靶向隨機化產(chǎn)生的群的各成員在氨基酸數(shù)目上不同。在進一步的實施方式中,合成氨基酸被包括在產(chǎn)生的蛋白質(zhì)群中。在一些優(yōu)選的實施方式中,從靶向隨機化得到的群的大部分成員顯示出比起始基因更大的與共同序列的序列同源性。在一些實施方式中,該序列編碼一種或以上的目標蛋白質(zhì)。在可選實施方式中,該蛋白質(zhì)具有不同的生物學(xué)功能。在一些優(yōu)選的實施方式中,引入序列包括至少一個選擇標記。該序列可以編碼一種或以上的目標蛋白質(zhì)。它可以具有其它生物學(xué)功能。在許多情況下該引入序列將包括選擇性標記,例如賦予抗生素抗性的基因。[124]術(shù)語"修飾序列"和"修飾基因"在本文中可交互使用,是指包括天然發(fā)生的核酸序列的缺失、插入或中斷的序列。在一些優(yōu)選的實施方式中,修飾序列的表達產(chǎn)物是截短的蛋白質(zhì)(例如,如果修飾是該序列的缺失或中斷的話)。在一些特別優(yōu)選的實施方式中,截短的蛋白質(zhì)保留了生物學(xué)活性。在可選的實施方式中,修飾序列的表達產(chǎn)物是延長的蛋白質(zhì)(例如修飾包括插入到該核酸序列中)。在一些實施方式中,插入導(dǎo)致截短的蛋白質(zhì)(例如插入導(dǎo)致終止密碼子的形成時)。因此,插入可以產(chǎn)生截短的蛋白質(zhì)或延長的蛋白質(zhì)作為表達產(chǎn)物。如本文所使用,術(shù)語"突變體序列"和"突變體基因"可相互交換使用,并且指出現(xiàn)在宿主細胞的野生型序列中的至少一個密碼子具有變化的序列。突變體序列的表達產(chǎn)物是相對于野生型具有改變的氨基酸序列的蛋白質(zhì)。該表達產(chǎn)物可以具有改變的功能能力(例如提高的酶活性)。術(shù)語"誘變引物"或"誘變寡核苷酸"(在本文中可相互交換使用)意圖指寡核苷酸組合物,其對應(yīng)著模板序列的一部分并且其能雜交到其上。關(guān)于誘變引物,引物將不精確地與模板核酸匹配,引物中的錯配或多個錯配被用于將期望突變引入到核酸文庫中。如本文所使用,"非誘變引物"或"非誘變寡核苷酸"是指將與模板核酸精確匹配的寡核苷酸組合物。在本發(fā)明的一種實施方式中,只有誘變引物被使用。在本發(fā)明另一優(yōu)選的實施方式中,引物被設(shè)計以便對于其中包括誘變引物的至少一個區(qū)域來說還有非誘變引物被包括在寡核苷酸混合物中。通過加入誘變引物和與誘變引物中至少一種對應(yīng)的非誘變引物的混合物,可能產(chǎn)生其中存在各種組合突變模式的最終核酸文庫。例如,如果期望的是突變體核酸文庫的一些成員保留它們在某些位置的前體序列而其它成員是在這樣的位點上的突變體,那么非誘變引物提供對于給定殘基來說在核酸文庫內(nèi)獲得特定水平的非突變體成員的能力。本發(fā)明的方法利用了誘變和非誘變寡核苷酸,所述寡核苷酸一般長度在10-50個堿基,更優(yōu)選地長度在大約15-45個堿基。然而,為了獲得期望的誘變結(jié)果,使用比10個堿基更短或者比50個堿基更長的引物可能是必要的。至于相應(yīng)的誘變和非誘變引物,相應(yīng)的寡核苷酸具有相同的長度不是必需的,但是僅僅在與要被加入的突變對應(yīng)的區(qū)域中有重疊是必需的。引物可以根據(jù)本發(fā)明預(yù)先確定的比值加入。例如,如果期望的是通過調(diào)整加入的引物的量,所得文庫具有顯著水平的某一特定突變和更少量的在相同或不同位點上的不同突變,那么產(chǎn)生期望的偏倚文庫(biasedlibrary)是可能的??蛇x地,通過加入更少或更大量的非誘變引物,調(diào)節(jié)對應(yīng)的突變(一種或多種)在突變體核酸文庫中產(chǎn)生的頻率是可能的。如本文所使用,短語"鄰接突變(contiguousmutations)"是指在同一寡核苷酸引物內(nèi)存在的突變。例如,鄰接突變可以相互鄰接或者在其附近,然而它們將由同一引物引入到所得的突變體模板核酸中。如本文所使用,短語"非鄰接突變(discontiguousmutations)"是指存在于分開的寡核苷酸引物中的突變。例如,非鄰接突變將由分別制備的寡核苷酸引物引入到所得突變體模板核酸中。術(shù)語"野生型序列(wild-typesequence)"和"野生型基因(wild-typegene)"在本文中可互換使用,指代在宿主細胞中為天然的或天然發(fā)生的序列。在一些實施方式中,野生型序列是指作為蛋白質(zhì)工程改造項目的起點的目標序列。野生型序列可以編碼同源或異源蛋白質(zhì)。同源蛋白質(zhì)是宿主細胞在沒有干預(yù)的情況下產(chǎn)生的蛋白質(zhì)。異源蛋白質(zhì)是宿主細胞只因干預(yù)才產(chǎn)生的蛋白質(zhì)。如本文所使用,術(shù)語"抗體"是指免疫球蛋白??贵w包括但不限于從任何期望產(chǎn)生抗體的物種中直接得到的免疫球蛋白。此外,本發(fā)明包括修飾抗體。該術(shù)語還指這樣的抗體片段,所述抗體片段保留了結(jié)合到完整抗體結(jié)合的表位的能力并且包括多克隆抗體、單克隆抗體、嵌合抗體、抗獨特型(anti-ID)抗體??贵w片段包括但不限于互補決定區(qū)(CDRs)、單鏈片段可變區(qū)(scFv)、重鏈可變區(qū)(VH)、輕鏈可變區(qū)(VL)。多克隆和單克隆抗體也被本發(fā)明所包括。優(yōu)選地,該抗體是單克隆抗體。術(shù)語"氧化穩(wěn)定"是指在本發(fā)明的蛋白水解、水解、清潔或其它過程期間普遍存在的條件下,例如當暴露于或接觸漂白劑或氧化劑時,本發(fā)明的蛋白酶在給定時間內(nèi)保留規(guī)定量的酶活性。在一些實施方式中,在接觸漂白劑或氧化劑給定時間后,例如至少1分鐘、3分鐘、5分鐘、8分鐘、12分鐘、16分鐘、20分鐘等,蛋白酶保留至少50%、60%、70%、75%、80%、85%、卯%、92%、95%、96%、97%、98%、或99%的蛋白水解活性。在一些實施方式中,穩(wěn)定性如實施例所述測定。術(shù)語"螯合劑穩(wěn)定"是指在本發(fā)明的蛋白水解、水解、清潔或其它過程期間普遍存在的條件下,例如當暴露于或接觸螯合劑時,本發(fā)明的蛋白酶在給定時間內(nèi)保留規(guī)定量的酶活性。在一些實施方式中,在接觸螯合劑給定時間后,例如至少10分鐘、20分鐘、40分鐘、60分鐘、100分鐘等,該蛋白酶保留至少50%、60%、70%、75%、80%、85%、卯%、92%、95%、96%、97%、98%、或99%的蛋白水解活性。在一些實施方式中,螯合劑穩(wěn)定性如實施例所述測定。術(shù)語"熱穩(wěn)定(thermallystable)"和"熱穩(wěn)定(thermostable)"是指在本發(fā)明的蛋白水解、水解、清潔或其它過程期間普遍存在的條件下,例如當暴露于變化的溫度時,本發(fā)明的蛋白酶在暴露于確定的溫度給定的時間后保持規(guī)定量的酶活性。變化的溫度包括提高的或降低的溫度。在一些實施方式中,在暴露于變化的溫度給定時間后,例如至少60分鐘、120分鐘、180分鐘、240分鐘、300分鐘等,該蛋白酶保留至少50%、60%、70%、75%、80%、85%、90%、92%、95%、96%、97%、98%、或99%的蛋白水解活性。在一些實施方式中,該熱穩(wěn)定性如實施例所述測定。在氧化、螯合劑、熱和/或pH穩(wěn)定的蛋白酶的上下文中,術(shù)語"增強的穩(wěn)定性"是指與其它絲氨酸蛋白酶(例如枯草桿菌蛋白酶)和/或野生型酶相比在一定時間內(nèi)保留了更高的蛋白水解活性。在氧化、螯合劑、熱和/或pH穩(wěn)定的蛋白酶的上下文中,術(shù)語"減小的穩(wěn)定性"是指與其它絲氨酸蛋白酶(例如枯草桿菌蛋白酶)和/或野生型酶相比在一定時間內(nèi)保留了更小的蛋白水解活性。術(shù)語"清潔活性"是指在本發(fā)明的蛋白水解、水解、清潔或其它過程期間普遍存在的條件下蛋白酶所達到的清潔性能。在一些實施方式中,清潔性能是通過應(yīng)用各種與酶敏感污漬例如草、血液、奶或雞蛋蛋白質(zhì)相關(guān)的清潔試驗測定的,如在使該污漬經(jīng)歷標準洗滌條件后通過各種色譜法、分光光度法或其它定量方法所測定。示例性的試驗包括但不限于在WO99/34011和美國專利6,605,458(兩者在此被并入作為參考)中所述的那些試驗,以及實施例中所包括的那些方法。[137]術(shù)語蛋白酶的"清潔有效量"是指在此之前所述的蛋白酶在具體清潔組合物中達到期望水平酶活性所需的量。這樣的有效量可容易由本領(lǐng)域普通技術(shù)人員確定,并且基于許多因素,例如所使用的具體蛋白酶、清潔應(yīng)用、清潔組合物的具體組成、以及是需要液體還是干(例如顆粒、棒)的組合物等等。如本文所使用,術(shù)語"清潔附加物質(zhì)"意旨任何為期望的特定類型清潔組合物以及產(chǎn)品形式(例如液體、顆粒、粉末、棒、膏、噴射液、片、凝膠或泡沫狀組合物)所選擇的任何液體、固體或氣體物質(zhì),其中該物質(zhì)也優(yōu)選地與該組合物中所使用的蛋白酶相容。在一些實施方式中,顆粒狀組合物為"壓縮"形式,而在其它實施方式中,液體組合物為"濃縮"形式。在清潔活性的上下文中,術(shù)語"增強的性能"是指對某些酶敏感污漬例如雞蛋、奶、草或血液具有增強的或更大的清潔活性,如在標準洗滌循環(huán)和/或多個洗滌循環(huán)后通過常規(guī)評價所測定的。在清潔活性的上下文中,術(shù)語"減小的性能"是指對某些酶敏感污漬例如雞蛋、奶、草或血液具有降低的或更小的清潔活性,如在標準洗滌循環(huán)后通過常規(guī)評價所測定的。在清潔活性的上下文中,術(shù)語"比較性性能"是指比較性枯草桿菌蛋白酶(例如商業(yè)上可得的蛋白酶)的至少60%、至少70%、至少80%、至少90%、至少95%的清潔活性,比較性枯草桿菌蛋白酶包括但不限于OPTIMASETM蛋白酶(Genencor)、PURAFECTtm蛋白醇產(chǎn)品(Genencor)、SAVINASEtm蛋白酶(Novozymes)、BPN'-變體(參見例如,美國專利號Re34,606)、RELASE、DURAZYME、EVERLASE、KA麗ASEtm蛋白酶(Novozymes)、MAXACALTM、MAXAPEMTM、PROPERASETM蛋白酶(Genencor;也參見美國專利號Re34,606和美國專利號5,700,676;5,955,340;6,312,936;和6,482,628)和緩慢芽胞桿菌變體蛋白酶產(chǎn)品(例如在WO92/21760、WO95/23221和/或WO97/07770中描述的那些)。示例性枯草桿菌蛋白酶變體包括但不限于在與BPN'的76、101、103、104、120、159、167、170、194、195、217、232、235、236、245、248和/或252位置等價的殘基位置處具有取代或缺失的那些變體。清潔性能可以通過在各種與酶敏感污漬例如草、血液或奶相關(guān)的清潔試驗中比較本發(fā)明的蛋白酶與那些枯草桿菌蛋白酶而確定,如在標準洗滌循環(huán)條件后通過常用的分光光度計法或分析方法所測定的。如本文所使用,"織物清潔組合物(fabriccleaningcomposition)"包括手洗和機洗衣物洗滌劑組合物,其包括但不限于衣物添加組合物以及適合用于臟織物(例如衣物、亞麻布品和其它紡織材料)的浸泡和/或預(yù)處理的組合物。如本文所使用,"非織物清潔組合物(non-fabriccleaningcompositions)"包括非紡織品(即非織物)表面清潔組合物,其包括但不限于盤碟洗滌組合物、口腔清潔組合物、假牙清潔組合物和個人清潔組合物。本文"壓縮"形式的清潔組合物最好通過密度反映,并且從組成上來講通過無機填料鹽的量反映。無機填料鹽是粉末形式洗滌劑組合物的常規(guī)成分。在常規(guī)洗滌劑組合物中,填料鹽以大量存在,典型地按照重量計為總組合物的17-35%。相反,在壓縮組合物中,填料鹽以不超過總組合物15%的量存在。在一些實施方式中,填料鹽按重量計以不超過組合物的10%的量存在,或更優(yōu)選地不超過5%。在一些實施方式中,無機填料鹽選自堿金屬和堿土金屬的硫酸鹽和氯化物鹽。優(yōu)選的填料鹽是硫酸鈉。實驗本發(fā)明在下面的實施例中被進一步詳細地描述,所述實施例絕不意圖限制所要求保護的本發(fā)明的范圍。附圖意旨認為是本說明書的整體部分以及是對本發(fā)明的描述。所引用的參考文獻在本文被特別并入作為參考,盡管在本文被描述。下列實施例被提供以闡明但并非限制所要求保護的發(fā)明。在接下來的實驗公開內(nèi)容中,應(yīng)用了下列縮寫PI(蛋白酶抑制劑),ppm(百萬分率);M(摩爾濃度);mM(毫摩爾濃度);(微摩爾濃度);nM(納摩爾濃度);mol(摩爾);mmol(毫摩爾);(xmol(微摩爾);nmol(納摩爾);gm(克);mg(毫克);ng(微克);pg(皮克);L(升);ml和mL(毫升);nl和(iL(微升);cm(厘米);mm(毫米);pm(微米);nm(納米);U(單位);V(伏);MW(分子量);sec(秒);min(s)(分鐘/分鐘(復(fù)數(shù)));h(s)和hr(s)(小時/小時(復(fù)數(shù)));'C(攝氏度);QS(足夠量);ND(未進行);NA(不適用);rpm(轉(zhuǎn)/分鐘);H20(水);dH20(去離子水);HC1(鹽酸);aa(氨基酸);bp(堿基對);kb(千堿基對);kD(千道爾頓);cDNA(拷貝或互補DNA);DNA(脫氧核糖核酸);ssDNA(單鏈DNA);dsDNA(雙鏈DNA);dNTP(脫氧核苷三磷酸);RNA(核糖核酸);MgCl2(氯化鎂);NaCl(氯化鈉);w/v(重量/體積);v/v(體積/體積);g(重力);OD(光密度);Dulbecco磷酸鹽緩沖液(DPBS);SOC(2%細菌用胰化蛋白胨,0.5%細菌用酵母抽提物,10mMNaCl,2.5mMKC1);TerrificBroth(極品肉湯)(TB;12g/1細菌用胰化蛋白胨,24g/1甘油,2.31g/1KH2P04,禾卩12.54g/IK2HP04);OD,(280nm處的光密度);OD600(600nm處的光密度);A405(405nm處的吸光度);Vmax(酶催化反應(yīng)的最大初始速率);PAGE(聚丙烯酰胺凝膠電泳);PBS(磷酸鹽緩沖鹽水[150mMNaCl,10mM磷酸鈉緩沖劑,pH7.2]);PBST(PBS+0.25%TWEEN20);PEG(聚乙二醇);PCR(聚合酶鏈式反應(yīng));RT-PCR(反轉(zhuǎn)錄PCR);SDS(十二烷基硫酸鈉);Tris(三(羥甲基)氨基甲垸);HEPES(N-[2-羥乙基]哌嗪-N-[2-乙磺酸]);HBS(HEPES緩沖鹽水);Tris-HCl(三(羥甲基)氨基甲垸-鹽酸);Tricine(N-[三(羥甲基)-甲基]-甘氨酸);CHES(2-(N-環(huán)己氨基)乙磺酸);TAPS(3-{[三(羥甲基)-甲基]-氨基}-丙磺酸);CAPS(3-(環(huán)己氨基)-丙磺酸;DMSO(二甲基亞砜);DTT(1,4-二硫代-DL-蘇糖醇);SA(芥子酸(s,5-二甲氧基_4_羥基肉桂酸);TCA(三氯乙酸);Glut和GSH(還原型谷胱甘肽);GSSG(氧化型谷胱甘肽);TCEP(三[2-羧乙基]膦);Ci(居里);mCi(毫居里);gCi(微居里);HPLC(高壓液相色譜);RP-HPLC(反相高壓液相色譜);TLC(薄層層析);MALDI-TOF(基質(zhì)輔助激光解吸/電離-飛行時間);Ts(甲苯磺?;?;Bn(芐基);Ph(苯基);Ms(甲磺?;?;Et(乙基),Me(甲基);Taq(水生嗜熱桿菌(TTzerwmsa《w加'c^)DNA聚合酶);Klenow(DNA聚合酶I大(Klenow)片段);EGTA(乙二醇-雙(P-氨基乙基醚)N,N,N',N'-四乙酸);EDTA(乙二胺四乙酸);bla(f3-內(nèi)酰胺酶或氨芐青霉素抗性基因);HDL(高密度液體);MJResearch(MJResearch,Reno,NV);Baseclear(BaseclearBV,Inc.,Leiden,荷蘭);PerSeptive(PerSeptiveBiosystems,F(xiàn)mmingham,MA);ThermoFinnigan<formula>formulaseeoriginaldocumentpage45</formula>Gibbstown,NJ);Qiagen(Qiagen,Inc.,Valencia,CA);Biodesign(BiodesignIntl"Saco,緬因州);Aptagen(Aptagen,Inc.,Herndon,VA);Sorvall(Sorvallbrand,fromKendroLaboratoryProducts,Asheville,NC);MolecularDevices(MolecularDevices,Corp.,Sunnyvale,CA);R&DSystems(R&DSystems,Minneapolis,MN);Stratagene(StratageneCloningSystems,LaJolla,CA);Marsh(MarshBiosciences,Rochester,NY);Geneart(GeneartGmbH,Regensburg,德國);Bio隱Tek(Bio-TekInstruments,Winooski,VT);(Biacore(Biacore,Inc.,Piscataway,NJ);PeproTech(PeproTech,RockyHill,NJ);SynPep(SynPep,Dublin,CA);NewObjective(NewObjectivebrand;ScientificInstrumentServices,Inc.,Ringoes,NJ);Waters(Waters,Inc.,Milford,MA);MatrixScience(MatrixScience,Boston,MA);Dionex(Dionex,Corp.,Sunnyvale,CA);Monsanto(MonsantoCo.,St.Louis,MO);Wintershall(WintershallAG,Kassel,德國);BASF(BASFCo.,F(xiàn)lorhamPark,NJ);Huntsman(HuntsmanPetrochemicalCorp.,SaltLakeCity,UT);Enichem(EnichemIberica,Barcelona,西班牙);FlukaChemieAG(FlukaChemieAG,Buchs,瑞士);Gist-Brocades(Gist-Brocades,NV,Delft,荷蘭);DowCorning(DowCorningCorp.,Midland,MI);禾卩Microsoft(Microsoft,Inc,,Redmond,WA)。在下列實施例中使用的野生型絲氨酸蛋白酶被描述在US04/39006和US04/39066中,兩者通過引用以其全部內(nèi)容被并入于此。實施例l試驗在下列實施例中,使用了各種試驗例如蛋白質(zhì)測定、基于應(yīng)用的測試和基于穩(wěn)定性的測試。為了便于閱讀,下列實驗在下面被闡明并且在各個實施例中被涉及。在本發(fā)明的開發(fā)期間進行的任何實驗中,來自下面所提供方法的任何偏差都表示在實施例中。A.用于在96孔微量滴定板上蛋白質(zhì)含量測定的TCA試驗采用從微量滴定板過濾的培養(yǎng)物上清液開始試驗,其在33。C下在230RPM下?lián)u動并且濕潤通風(fēng)下生長4天。干凈的96-孔平底板被用于該實驗。首先,將100pL/L的0.25NHCl放置在孔中。然后,將50過濾的培養(yǎng)液加入到孔中。然后為了提供"空白"讀數(shù),測定405nm處的光散射/吸光度(在板讀數(shù)器上采用5秒混合模式)。為了測試,將100nL/孔的15。/。(w/v)TCA放置在板中并且在室溫下被溫育5至30min。然后測定405nm處的光散射/吸光度(在板讀數(shù)器上采用5秒混合模式)。通過從帶有TCA的測試讀數(shù)中減去空白(即沒有TCA)進行計算。如果期望的話,通過用已知的轉(zhuǎn)化因子對克隆的AAPF試驗的TCA讀數(shù)校準,可以產(chǎn)生標準曲線。然而,TCA結(jié)果與50至500ppm的蛋白質(zhì)濃度成線性關(guān)系,并且因此可以對酶性能直接作圖用于選擇性能好的變體的目的。B.在96孔微量滴定板上蛋白酶的suc-AAPF-pNA試驗在該試驗體系中,所用的試劑溶液是1.100mMTris/HCl,pH8.6,含有0.005%TWEEN-80(Tris緩沖劑)2.100mMTris緩沖劑,pH8.6,含有10mMCaCl2和0.005%TWEEN⑧畫80(Tris緩沖齊U)3.160mMsuc-AAPF-pNA的DMSO溶液(suc-AAPF-pNA貯存液)(Sigma:S-7388)為了制備suc-AAPF-pNA工作溶液,將1mlAAPF貯存液加入到100mlTris緩沖液中并且充分攪拌至少10秒。通過向每個孔中加入10pl稀釋的蛋白酶溶液,接著加入(快速)190|illmg/mlAAPF工作溶液,進行該試驗。該溶液被混合5秒,并且在25'C、MTP讀數(shù)器上讀出410nm處的吸光度變化。蛋白酶活性被表達為AU(活性AOD-min-1.ml'1)。C.角蛋白水解試驗在該試驗體系中,所使用的化學(xué)藥品和試劑溶液是角蛋白ICN902111清潔劑1.6g清潔劑被溶解在1000ml水中(pH=8.2)還加入0.6ml10,000gpg的CaC12/MgC12以及1190mgHEPES,得到分別為6gpg和5mM的硬度和緩沖強度。用NaOH調(diào)節(jié)pH至8.2??嗷撬?TNBS)SigmaP-2297(5%水溶液)試劑A將45.4gNa2B40710H20(Merck6308)和15ml4NNaOH溶解在一起至最終體積1000ml(如果需要的話通過加熱)試劑B將35.2gNaH2P041H20(Merck6346)禾卩0.6gNa2S03(Merck6657)溶解在一起至最終體積1000ml方法在溫育前,角蛋白一次以小部分在lOO(am網(wǎng)篩上進行篩選。然后,10g<100jam的角蛋白在室溫下在清潔劑溶液中被攪拌至少20分鐘,其中經(jīng)常地調(diào)節(jié)pH至8.2。最后該懸浮液在室溫下被離心分離20分鐘(Sorvall,GSA轉(zhuǎn)子,13,000rpm)。然后重復(fù)該過程。最終將濕的沉淀懸浮在清潔劑中至總體積200ml,在移液期間該懸浮液保持攪拌。在溫育之前,用Biohit多通道移液管和1200^槍頭(6次200^的分配并且分配得盡可能快以避免角蛋白在槍頭沉淀),將微量滴定板(MTPs)充填200pl底物/L。然后將10^過濾的培養(yǎng)物加入到含有底物的MTPs。該板被覆蓋上膠帶,放置在培養(yǎng)箱中并且在350rpm下在20。C下被溫育3小時(Innova4330[NewBrunswick])。溫育后該板在3000rpm下被離心分離3分鐘(Sigma6K15離心機)。在從該培養(yǎng)箱中取出第一塊板之前大約15分鐘,TNBS試劑通過每50ml試劑A混合1mlTNBS溶液進行制備。MTPs每個孔裝上60^TNBS試劑A。從溫育的板上將10^轉(zhuǎn)移至含有TNBS試劑A的MTPs上。該板被覆蓋上膠帶并且在室溫和500rpm下在臺式搖床(BMGThermostar)上搖動20分鐘。最后,向孔中加入200試劑B,在搖床上混合1分鐘并且用MTP讀數(shù)器測量405nm處的吸光度。角蛋白水解活性的計算得到的吸光度值被校正空白值(不含酶的底物)。所得吸光度提供對水解活性的測量。對于每個樣品(變體),計算該性能指數(shù)。該性能指數(shù)比較變體(真實值)和標準酶(理論值)在相同蛋白質(zhì)濃TWEEN⑧畫80:PIPES緩沖液(游離酸)度下的性能。此外,理論值可以采用標準酶的Langmuir方程的參數(shù)進行計算。大于1的性能指數(shù)(PI)(PI>1)認為是較好的變體(與標準[例如,野生型]相比),而為1的PI(PI=1)認為表現(xiàn)得與該標準一樣的變體,并且小于1的PI(PK1)認為比標準表現(xiàn)差的變體。因此,該PI鑒定出優(yōu)勝者以及在某種環(huán)境下的不期望使用的變體。[159]D.二甲基酪蛋白水解試驗(96孔)在該試驗體系中,所使用的化學(xué)藥品和試劑溶液為二甲基酪蛋白(DMC):SigmaC-9801SigmaP-8074將15.1gSigmaP-1851溶解在大約960ml水中;pH用4NNaOH調(diào)節(jié)至7.0,加入1ml5%TWEEN-80并將體積變?yōu)?000ml。PIPES和TWEEN-80的最終濃度分別為50mM和0.005%。SigmaP-2297(5%水溶液)將45.4gNa2B40710H20(Merck6308)和15ml4NNaOH溶解在一起至最終體積1000ml(如果需要的話通過加熱)將35.2gNaH2P041H20(Merck6346)禾口0.6gNa2S03(Merck6657)溶解在一起至最終體積1000ml方法為了制備底物,將4gDMC溶解在400mlPIPES緩沖液中。過濾的培養(yǎng)物上清液用PIPES緩沖液進行稀釋;生長板上對照的最終濃度為20ppm。然后,將10pl各個稀釋的上清液加入到MTP孔中的200)!l底物中。該MTP板被覆蓋上膠帶,搖動幾秒鐘并且在沒有攪動下放置在37"C的烘箱中2小時。在從該培養(yǎng)箱中取出第一塊板之前大約15分鐘,TNBS試劑通過每50ml試劑A混合1mlTNBS溶液制備。MTPs每個孔裝上60^TNBS試劑A。該溫育的板被搖動幾秒鐘,之后將10pi轉(zhuǎn)移至含有TNBS試劑A的MTPs上。該板被覆蓋上膠帶并且在室溫和500rpm下苦基磺酸(TNBS)試劑A:試劑B:在臺式搖床(BMGThermostar)上被搖動20分鐘。最后,向孔中加入200)il試劑B,在搖床上混合1分鐘并且用MTP讀數(shù)器測量405nm處的吸光度。二甲基酪蛋白水解活性的計算得到的吸光度值被校正空白值(不含酶的底物)。所得吸光度是水解活性的度量。樣品的(任意單位)具體活性通過將吸光度與測定的蛋白質(zhì)濃度相除進行計算。E.熱穩(wěn)定性試驗該試驗基于在緩沖培養(yǎng)物上清液加熱之前和之后二甲基酪蛋白的水解。使用與在二甲基酪蛋白水解試驗中所述相同的化學(xué)藥品和試劑溶液。方法過濾的培養(yǎng)物上清液用PIPES緩沖液稀釋至20ppm(基于生長板上對照的濃度)。然后,50pl的各個稀釋的上清液被置于MTP的空孔中。MTP板在60°C和400rpm下在正MS培養(yǎng)箱/搖床HT(ThermoLabsystems)上被溫育90分鐘。該板在冰上被冷卻5分鐘。然后,將10pl該溶液加入到含有200jal二甲基酪蛋白底物/孔的干凈MTP中。該MTP被覆蓋上膠帶,搖動幾秒鐘并且在沒有攪動下放置在37'C的烘箱中2小時。采用與DMC水解試驗所用相同的檢測方法。熱穩(wěn)定性計算樣品的殘余活性被表達為最終吸光度和初始吸光度的比值,兩者都校正了空白值。F.LAS穩(wěn)定性試驗測試蛋白酶在0.06%LAS(十二烷基苯磺酸鈉)存在下溫育后,測量LAS穩(wěn)定性,并且采用AAPF試驗測定殘余活性。試劑十二烷基苯磺酸的鈉鹽(=LAS):SigmaD-2525TWEEN-80:SigmaP-8074TRIS緩沖液(游離酸)將6.35gSigmaT-1378溶解在大約960ml水中;pH用4NHC1調(diào)節(jié)至8.2。TRIS的最終濃度為52.5mM。LAS貯存液制備10.5%LAS的MQ水溶液(=10.5g/100mlMQ)TRIS緩沖液-100mM/pH8.6(100mMTris/0.005%Tween80)TRIS-Ca緩沖液,pH8.6(100mMTris/10mMCaC12/0.005%Tween80)硬件平底MTPs:Costar(#9017)BiomekFXASYS微移液器SpectramaxMTP讀數(shù)器正MS培養(yǎng)箱/搖床Innova4330培養(yǎng)箱/搖床Biohit多通道移液管BMGThermostar搖床方法用52.5mMTris緩沖液pH8.2制備0.063%LAS溶液。AAPF工作溶液是通過向100ml(100mM)TRIS緩沖液,pH8.6中加入1ml100mg/mlAAPF貯存液(在DMSO中)制備的。為了稀釋該上清液,平底板被填充以稀釋緩沖液并且加入等份的上清液且充分混合。稀釋比取決于生長板上ASP-對照的濃度(AAPF活性)。期望的蛋白質(zhì)濃度為80ppm。將10pl稀釋的上清液加入到190|il0,063%LAS緩沖液/孔中。該MTP被覆蓋上膠帶,搖動幾秒鐘并且在200rpm的攪動下在25。C或35'C的烘箱(Innova4230)中放置60分鐘。在溫育10分鐘后初始活性(/=10分鐘)通過將每個孔中10^的混合物轉(zhuǎn)移至含有190^1AAPF工作溶液的干凈MTP中進行測定。這些溶液被充分混合并且AAPF活性用MTP讀數(shù)器進行測定(5分鐘內(nèi)并且在25'C下20個讀數(shù))。最終活性(/=60分鐘)是通過在溫育60分鐘后從該溫育板上取出另外的10pl溶液而測定的。然后如上所述測定AAPF活性。如下進行計算%殘余活性為["60值]*100/["10值]。實施例251從革蘭氏陽性嗜堿菌69B4中生產(chǎn)69B4蛋白酶該實施例提供了將纖維單胞菌屬菌株69B4用于初步分離本發(fā)明提供的新蛋白酶69B4的描述。該嗜堿微生物纖維單胞菌屬菌株69B4(DSM16035)是在37。C下在含有酪蛋白堿性培養(yǎng)基(gL")中被分離的(參見例如Duckworth等,F(xiàn)EMSMicrobiol.Ecol.,19:181-191[1996])。葡萄糖(Merck1.08342)10蛋白胨(Difco0118)酵母抽提物(Difco0127)K2HP041MgS04.7H200.2NaCl40Na2C0310酪蛋白20瓊脂20另外的堿性培養(yǎng)基(Grant嗜堿培養(yǎng)基)也被用于培養(yǎng)纖維單胞菌屬菌株69B4,如下所述提供Grant嗜堿培養(yǎng)基("GAM")溶液A(g'L—1)葡萄糖(Merck1.08342)10蛋白胨(Difco0118)5酵母抽提物(Difco0127)5K2HP041MgS04.7H200.2溶解在800ml蒸餾水中并且通過高壓滅菌進行滅菌。GAM溶液B(g'L")NaCl40Na2C0310溶解在200ml蒸餾水中并且通過高壓滅菌進行滅菌。[173]完全GAM培養(yǎng)基通過將溶液A(800ml)與溶液B(200ml)混合而制備。固體培養(yǎng)基通過加入瓊脂(2%w/v)制備。生長條件從剛剛解凍的培養(yǎng)物甘油小瓶中(作為冷凍的甘油被儲存(20%v/v,儲存在-80。C下的貯存物)),微生物采用接種環(huán)接種在瓊脂板上的上述Grant嗜堿培養(yǎng)基(GAM)上,并且在37。C下生長至少2天。一個菌落然后被用于接種500ml含有100mlpH10的GAM的搖動燒瓶。該燒瓶然后在280rpm下的旋轉(zhuǎn)搖床中于37"C被溫育1-2天直到獲得好的生長(根據(jù)目測)。然后,100ml肉湯培養(yǎng)基隨后用于接種7L含有5升GAM的發(fā)酵罐。發(fā)酵在37。C下進行2-3天以便得到蛋白酶的最大產(chǎn)量。整個過程通過以5L/min的速率將空氣注入葉輪區(qū)域以保持完全的好氧條件,所述葉輪在大約500rpm下旋轉(zhuǎn)。開始時將pH設(shè)定在pH10,但是在發(fā)酵期間沒有進行控制。69B4粗制酶樣品的制備從發(fā)酵罐中收集培養(yǎng)基肉湯,并且細胞在l(TC下通過以5000xg離心分離30min進行去除。所得上清液通過在SeitzEKS(SeitzSchenkFiltersystems)深度過濾進行澄清。所得無菌培養(yǎng)物上清液利用lOkDa截流量的超濾盒(PallOmega10kDaMinisette;Pall)通過超濾進一步濃縮將近10倍。所得濃縮粗制69B4樣品被冷凍并且被儲存在-2(TC下直至進一步使用。純化分離出細胞的培養(yǎng)基肉湯采用8k分子量截留量(MolecularWeightCutOffice,MWCO)的Spectra-Por7(Spectrum)透析管,相對于20mM(2-(4-嗎啉代)-乙磺酸("MES"),pH5.4,1mMCaCl2進行透析。進行透析過夜或者直至樣品的導(dǎo)電率小于或等于MES緩沖液的導(dǎo)電率。透析的酶樣品采用具有10x100mm(7.845mL)POROS高密度磺丙基(HighDensitySulfo-propyl)(HS)20(20微米)陽離子交換柱(PerSeptiveBiosystems)的BioCadVISION(AppliedBiosystems)進行純化。在將酶以5mL/min裝載在預(yù)先平衡的柱上之后,該柱以40mL/min被洗滌,pH梯度在25個柱體積內(nèi)從25mMMES,pH6.2,ImMCaCl2至25mM(N-[2-羥乙基]哌嗪-N'-[2-乙烷]磺酸[C8Hi8N204S,CAS#7365-45-9])("HEPES")pH8.0,1mMCaCl2。在該運行期間收集級分(8mL)。pH8.0洗脫步驟被保持5個柱體積,然后該酶用一梯度(在35個柱體積內(nèi)在同一緩沖液中0-100mMNaCl)進行洗脫。級分中的蛋白酶活性采用pNA試驗(sAAPF-pNA試驗;DelMar,等,同上)進行監(jiān)測。在40mMNaCl下洗脫的蛋白酶活性被濃縮并且緩沖液被交換(采用5KMWCOVIVAScience20mL濃縮器)成20mMMES,pH5.8,lmMCaCl2。該材料被用于酶的進一步表征。實施例3在枯草桿菌中生產(chǎn)ASP蛋白酶[177]在枯草桿菌中生產(chǎn)69B4蛋白酶(在本文還被稱為"ASP"、"Asp"、以及"ASP蛋白酶"和"Asp蛋白酶")的實驗被描述在美國專利申請序列號10/576,331中,其在此被并入作為參考。DNA序列(合成ASPDNA序列)被提供在下面,其中密碼子選擇適用于芽胞桿菌種,編碼野生型ASP前體蛋白CTTGGCTGGGGGTATGGCAGCACAAGCTAACGAACCGGCTCCTCCAGGATCTGCATTAGAGGCGTGGAAGACGGTTTTGGATGCTGCGCTGGAGGGTCATGATGATGTGCCTACGTGGTACGTCGACGTGCCTACGAATTCGGTAGTCGTTGCTGTAAAGGCAGGAGCCTTTTGTAGAAACGGACGAAACGCCTAGAACGATGTTCGACGTAATTGGAGGCAACGCATATACTATTGGCGGCCGGTCTAGATGTTCTATCGGATTCGCAGTAAACGGTGGCTTCATTACTGCCGGTCACTGCGGAAGAACAGGAGCCACTACTGCCAATCCGACTGGCACATTTGCAGGTAGCTCGTTTCCGGGAAATGATTATGCATTCGTCCGAACAGGGGCAGGAGTAAATTTGCTTGCCCAAGTCAATAACTACTCGGGCGGCAGAGTCCAAGTAGCAGGACATACGGCCGCACCAGTTGGATCTGCTGTATGCCGCTCAGGTAGCACTACAGGTTGGCATTGCGGAACTATCACGGCGCTGAATTCGTCTGTCACGTATCCAGAGGGAACAGTCCGAGGACTTATCCGCACGACGGTTTGTGCCGAACCAGGTGATAGCGGAGGTAGCCTTTTAGCGGGAAATCAAGCCCAAGGTGTCACGTCAGGTGGTTCTGGAAATTGTCGGACGGGGGGAACAACATTCTTTCAACCAGTCAACCCGATTTTGCAGGCTTACGGCCTGAGAATGATTAAGCTATGTTCAGGTCAACCGGAGCGGTACACATTCCGTCTGTCTCAATGGACCTAGCGGTGCGGACTTTGATTTGTATGTGCAGCGATGGAATGGCAGTAGCTGGGTAACCGACTCACCCTCCCCTGAfSEOIDNO:l)在上述序列中,粗體表示編碼成熟蛋白酶的DNA,標準字體表示前導(dǎo)序列,并且下劃線表示N-端和C-端前序列。合成ASP基因的表達合成ASP基因的表達被描述在美國專利申請序列號10/576,331中,其在此通過引用被并入。實施例4組合突變體和多突變文庫的生產(chǎn)[181]在該實施例中,用于構(gòu)建組合突變體和多突變文庫的方法被描述。組合突變體的構(gòu)建ASP組合突變體的構(gòu)建被描述在美國專利申請序列號10/576,331中,其在此通過引用被并入。多突變文庫構(gòu)建除了反應(yīng)中所用的引物濃度之外,多突變文庫如StratageneQCMS試劑盒所述進行構(gòu)建。具體地,1甲基化的、純化的pUC18-ASP質(zhì)粒(約70ng)與15|aL無菌蒸餾水、1.5pLdNTP、2.5(aL10x緩沖液、lpL酶混合物和1.0突變體引物混合物(總共100pmol引物)混合。該引物混合物是采用18個突變體引物(lOOpmol/VL)各10制備的;加入50ng各個Stratagene所推薦的文庫引物,導(dǎo)致在前一輪誘變中更少的突變。因此,該方案在目前這一輪誘變中被改變以在每個反應(yīng)中包括總共100pmol的引物。循環(huán)條件是在使用薄壁0.2mLPCR管的MJResearchPTC2-200熱循環(huán)控制裝置中95°C1分鐘,接著30個循環(huán)的95。Cl分鐘、55°Cl分鐘和65"12分鐘。反應(yīng)產(chǎn)物通過在37'C下溫育過夜、用lnLD;wI進行消化。加入另外0.5|iLDp"I,并且該反應(yīng)被溫育1小時。[184]接著,文庫DNA(誘變的單鏈pUC18-ASP產(chǎn)物)被電穿孔到電感受態(tài)大腸桿菌(五.co//)細胞(Invi加gen,目錄號C4040-52,OneShotTOP10ElectrocompTMco//,daw+)上,并且在含有100mg/L氨芐青霉素的瓊脂板上選擇性生長導(dǎo)致大腸桿菌細胞內(nèi)的ASP多突變文庫。收獲菌落(數(shù)以萬計)并且Qiagen旋轉(zhuǎn)小量制備(spinminiprep)DNA試劑盒(目錄號27106)用于通過Qiagen小量制備試劑盒手冊所述的步驟制備質(zhì)粒DNA。小量制備DNA用50ul該試劑盒中提供的Qiagen緩沖液EB進行洗脫。小量制備DNA用/^1和HindlIlDNA限制酶進行消化。ASP文庫片段混合物(尸WlxHindlll)被凝膠純化,并且采用為黏性末端通用克隆所推薦的Invitrogen方案,使用Invi加genT4DNA連接酶(目錄號15224-025),通過連接酶反應(yīng),克隆在4154堿基對HindlllxIpHPLT載體片段中。在另一方法中,合成ASP文庫片段通過GeneArt產(chǎn)生。這些ASP文庫片段也用戶WI和HindIII進行消化、純化,并且通過連接酶反應(yīng)克隆在4154堿基對Hindlllx戶WIpHPLT載體片段中。為了將連接反應(yīng)混合物直接轉(zhuǎn)化到芽胞桿菌細胞中,文庫DNA(克隆在pHPLT中的ASP文庫片段混合物)采用TempliPhi試劑盒(Amershamcat.#25-6400)進行擴增。為了該目的,1連接反應(yīng)混合物與5(iL來自TempliPhi試劑盒的樣品緩沖液混合,并且在95°C下加熱3分鐘以使DNA變性。該反應(yīng)被置于冰上冷卻2分鐘,然后暫時停止(spindown)。接著,加入來自TempliPhi試劑盒的5iaL反應(yīng)緩沖液和0.2|iLphi29聚合酶,并且該反應(yīng)在MJResearchPCR儀器上30。C下溫育4小時。phi29酶在反應(yīng)中通過在PCR儀器上于60。C溫育IO分鐘被熱失活。為了將該文庫轉(zhuǎn)化到芽胞桿菌中,0.1TempliPhi擴增反應(yīng)產(chǎn)物與500感受態(tài)枯草桿菌細胞AwprE,o;/W,△^gWfyW,Aa附〗必:.丫;^/尺;7W"-cowiO混合,接著在37。C下劇烈搖動1小時,并且100和500(iL在含有20ppm硫酸新霉素((Sigma,目錄號N-1876;每mg含有732嗎新霉素)和0.5%脫脂乳的HI-瓊脂板上鋪板。從該文庫挑選95個克隆進行測序。[188]誘變進行得很好,因為只有14%的克隆等于骨架序列(backbonesequence)(具有R014I-A064K-T086K-T116E-R123F的ASP),以及大約3%的克隆具有額外突變。剩余的被測序克隆(72%)全部是突變體,并且其中大約94%是獨特的突變體。該文庫的測序結(jié)果提供在下面的表4-l中。<table>tableseeoriginaldocumentpage57</column></row><table><table>tableseeoriginaldocumentpage58</column></row><table>實施例5對多個特性來說有害突變的相關(guān)性[189]在該實施例中,不管特性的相關(guān)性如何,例證了如下原則對任何特性的有害突變與對每個其它特性的有害突變相關(guān)。如本文所示,只有小數(shù)目的位置(5-10%)具有對所有特性都不利的突變。這些位置限定了折疊并且在進化中是保守的。這暗示,盡管對任何特性來說有利突變的鑒別需要對該特性進行真正預(yù)言性的篩選,但是對任何性質(zhì)來說可能有害的突變的鑒別可以采用任何篩選來完成,包括但不限于本文所提供的方法。變體酶(ASP、ACT和NPRe)如本文和在美國專利申請序列號10/576,331、10/581,014、11/581,102和11/583,334中所述生產(chǎn),所有這些專利文獻通過引用以其全部內(nèi)容并入本文。下面的表提供了許多對兩種特性中每一種來說具有多于5%wt活性和小于5%活性的變體的成對比較,以及這兩種特性的相關(guān)系數(shù)。在該實施例中所用的實驗體系也提供在這些應(yīng)用中。本文所用的特性對于ASP來說是酪蛋白活性(CAS)、角蛋白活性(KER)、AAPF活性(AAPF)、LAS穩(wěn)定性(LAS)和熱穩(wěn)定性;和對ACT來說是過酸形成(PAF)和過酸降解(PAD)。如下表所示,發(fā)現(xiàn)相關(guān)灘關(guān)系數(shù)〉0.5)的特性只有對ASP來說的CAS、KER禾BAAPF。其它全部是不相關(guān)的(相關(guān)系數(shù)<0.3)。不管特性不相關(guān)這一事實,一個突變對這兩種特性來說將是有害的概率要比偶然預(yù)期的大。在表中提供的是變體的觀測數(shù)目與偶然預(yù)期的數(shù)目的計算比值。大于1的數(shù)表明正相關(guān),并且小于1的數(shù)表明負相<table>tableseeoriginaldocumentpage59</column></row><table>表5-2.對于ASP來說CAS和AAPF的比較結(jié)果<table>tableseeoriginaldocumentpage59</column></row><table>表5-3.對于ASP來說CAS和LAS的比較結(jié)果<table>tableseeoriginaldocumentpage59</column></row><table><table>tableseeoriginaldocumentpage60</column></row><table>表5-4.對于ASP來說CAS和熱穩(wěn)定性的比較結(jié)果<table>tableseeoriginaldocumentpage60</column></row><table>表5-5.對于ASP來說KER和AAPF的比較結(jié)果<table>tableseeoriginaldocumentpage60</column></row><table><table>tableseeoriginaldocumentpage61</column></row><table>權(quán)利要求1.蛋白質(zhì)工程改造方法,其包括下列步驟a)提供蛋白質(zhì)變體文庫;b)在目標測試中測試所述蛋白質(zhì)變體文庫的至少一種目標性質(zhì);c)鑒別所述至少一種目標性質(zhì)的值的范圍;d)鑒別與所述目標測試中有利結(jié)果相關(guān)的所述值的范圍內(nèi)的最小值;并且e)提供多個具有至少一種在所述至少一種目標性質(zhì)的所述范圍內(nèi)所述最小值之上的突變的蛋白質(zhì)變體,因此提供包含至少一種突變的蛋白質(zhì)變體文庫,并且其中所述文庫富含在所述目標測試中具有所述有利結(jié)果的成員。2.權(quán)利要求l所述的方法,其中所述有利結(jié)果對應(yīng)著在步驟(a)的所述測試中觀測到的最大值的大于50%、60%、70%、80%、90%或95%的值。3.權(quán)利要求l所述的方法,其中所述蛋白質(zhì)是酶。4.權(quán)利要求2所述的方法,其中所述酶選自蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。5.蛋白質(zhì)工程改造方法,其包括下列步驟a)提供蛋白質(zhì)變體文庫;b)在目標測試中測試所述蛋白質(zhì)變體文庫的至少兩種目標性質(zhì);c)鑒別所述至少兩種目標性質(zhì)的值的范圍;d)鑒別與所述目標測試中有利結(jié)果相關(guān)的所述值的范圍內(nèi)的最小值;并且e)提供在所述至少兩種目標性質(zhì)的所述范圍內(nèi)所述最小值之上的多個蛋白質(zhì)變體,因此提供富含在所述目標測試中具有所述有利結(jié)果的成員的蛋白質(zhì)變體文庫。6.權(quán)利要求5所述的方法,其中所述有利結(jié)果對應(yīng)著在步驟(a)的所述測試中觀測到的最大值的大于50%、60%、70%、80%、90%或95%的值。7.權(quán)利要求5所述的方法,其中所述蛋白質(zhì)是酶。8.權(quán)利要求7所述的方法,其中所述酶選自蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。9.蛋白質(zhì)工程改造方法,其包括下列步驟a)提供野生型蛋白質(zhì)以及所述野生型蛋白質(zhì)的蛋白質(zhì)變體文庫;b)在目標測試中測試所述蛋白質(zhì)變體文庫和所述野生型蛋白質(zhì)的至少一種目標性質(zhì);c)鑒別所述至少一種目標性質(zhì)的值的范圍;d)鑒別與所述目標測試中有利結(jié)果相關(guān)的所述值的范圍內(nèi)的最小值;e)鑒別與所述野生型所獲得的結(jié)果比較具有有利結(jié)果的所述蛋白質(zhì)變體,其中所述有利結(jié)果是改進的目標性質(zhì);并且f)提供在所述至少一種目標性質(zhì)的所述范圍內(nèi)所述最小值之上的多個蛋白質(zhì)變體,因此提供富含在所述目標測試中具有所述有利結(jié)果的成員的改進蛋白質(zhì)變體文庫。10.權(quán)利要求9所述的方法,其進一步包括確定性能指數(shù)的步驟,其中所述性能指數(shù)是通過用每個所述改進蛋白質(zhì)變體所獲得的值除以所述野生型蛋白質(zhì)所獲得的值確定的。11.權(quán)利要求9所述的方法,其進一步包括鑒別所述改進蛋白質(zhì)變體的步驟,其中所述改進蛋白質(zhì)變體在所述目標測試中達到大于1.1的性能指數(shù)。12.權(quán)利要求9所述的方法,其中所述蛋白質(zhì)是酶。13.權(quán)利要求12所述的方法,其中所述酶選自蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。14.權(quán)利要求9所述的方法,其中所述蛋白質(zhì)選自抗體和生長因子。15.權(quán)利要求9所述的方法,其中所述野生型蛋白質(zhì)是選自下列的酶的成熟形式蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。16.權(quán)利要求9所述的方法,其中所述目標性質(zhì)選自電荷、洗滌性能、硬表面清潔性能、熱穩(wěn)定性、儲存穩(wěn)定性、洗滌劑穩(wěn)定性、底物結(jié)合、酶抑制、表達水平、反應(yīng)速率和底物降解。17.權(quán)利要求9所述的方法,其中所述野生型和所述蛋白質(zhì)變體是至少一種洗滌劑組合物的成分。18.權(quán)利要求16所述的方法,其中所述洗滌性能是在具有5至12.0之間的pH、被配制成粉末狀洗滌劑或液體洗滌劑的洗滌劑組合物中測試的。19.在蛋白質(zhì)折疊內(nèi)生產(chǎn)改進的親代蛋白質(zhì)變體的方法,其包括-a)在目標測定中跨目標性質(zhì)的范圍測定所述蛋白質(zhì)折疊內(nèi)測試蛋白質(zhì)的多個變體;b)鑒別在與所述目標測試中有利結(jié)果相關(guān)的所述目標性質(zhì)的所述范圍內(nèi)的最小值;c)在所述目標測定中測定所述蛋白質(zhì)折疊的親代蛋白質(zhì);并且d)通過在所述親代蛋白質(zhì)中引入氨基酸取代產(chǎn)生所述親代蛋白質(zhì)的改進變體,以使所述改進變體在所述目標性質(zhì)的所述范圍的所述最小值之上。20.權(quán)利要求19所述的方法,其中所述親代蛋白質(zhì)和所述測試蛋白質(zhì)是不同的。21.權(quán)利要求19所述的方法,其進一步包括確定性能指數(shù)的步驟,其中所述性能指數(shù)是通過用所述改進的蛋白質(zhì)變體所獲得的值除以所述親代蛋白質(zhì)所獲得的值確定的。22.權(quán)利要求19所述的方法,其中所述測試蛋白質(zhì)和所述親代蛋白質(zhì)是酶。23.權(quán)利要求22所述的方法,其中所述酶選自蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。24.權(quán)利要求23所述的方法,其中所述親代蛋白質(zhì)是選自下列的酶的成熟形式蛋白酶、轉(zhuǎn)移酶、金屬蛋白酶、酯酶、淀粉酶、纖維素酶、氧化酶、角質(zhì)酶和脂肪酶。25.權(quán)利要求19所述的方法,其中所述目標性質(zhì)選自電荷、洗滌性能、硬表面清潔性能、熱穩(wěn)定性、儲存穩(wěn)定性、洗滌劑穩(wěn)定性、底物結(jié)合、酶抑制、表達水平、反應(yīng)速率和底物降解。26.權(quán)利要求19所述的方法,其中所述測試蛋白質(zhì)和親代蛋白質(zhì)是至少一種洗滌劑組合物的成分。全文摘要本發(fā)明提供蛋白質(zhì)工程改造方法。具體地,本發(fā)明提供利用位點評價文庫設(shè)計優(yōu)化蛋白質(zhì)的兩種或多種性質(zhì)的文庫的方法。文檔編號C12N15/10GK101473036SQ200780023238公開日2009年7月1日申請日期2007年6月22日優(yōu)先權(quán)日2006年6月23日發(fā)明者D·A·埃斯特爾,W·埃赫勒申請人:丹尼斯科美國公司