国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于在細胞表面上表達多肽的組合物和方法與流程

      文檔序號:11528773閱讀:1320來源:國知局
      用于在細胞表面上表達多肽的組合物和方法與流程

      交叉參考

      本申請要求2014年11月10日申請的美國臨時專利申請第62/077,756號的權益,所述申請案以全文引用的方式并入本文中。



      背景技術:

      在真核細胞(例如,酵母細胞)表面上表達蛋白質,即稱為表面呈現(xiàn)的技術可以用于各種各樣的目的。舉例來說,因為酵母是真核的,所以將酵母用于表面呈現(xiàn)對(例如,經(jīng)由定向演化)改造和修飾哺乳動物蛋白來說非常適合,所述改造和修飾需要翻譯后修飾以用于有效折疊和活性(例如,細胞表面和分泌蛋白,如抗體、受體、細胞因子等)。在表面呈現(xiàn)的一個實例中,目標蛋白與aga2p蛋白融合,在配對期間,酵母自然地使用所述aga2p蛋白調節(jié)細胞-細胞接觸。目前的表面呈現(xiàn)方法需要表達多種基因,且在所呈現(xiàn)目標蛋白的空間可及性方面受到限制。在本領域中,需要以例如實現(xiàn)可調節(jié)的(“可調式”)可及性水平的方式實現(xiàn)目標蛋白的單順反子表達和表面呈現(xiàn)的組合物和方法。

      公開案

      博德(boder)等人,《自然·生物技術(natbiotechnol)》.1997年6月;15(6):553-7;美國專利申請?zhí)枺?0110076752



      技術實現(xiàn)要素:

      提供通過使目標蛋白(poi)與呈現(xiàn)部分(例如,具有信號多肽、莖多肽以及表面錨定多肽的部分)融合產生表面可及融合蛋白而在真核細胞(例如,哺乳動物細胞、真菌細胞、酵母細胞等)表面上呈現(xiàn)poi的方法和組合物。在一些情況下,將表面可及融合蛋白作為核酸的一部分(例如,重組表達載體)引入真核細胞中。提供包括對呈現(xiàn)部分(例如,具有信號多肽、莖多肽以及表面錨定多肽的部分)進行編碼的核苷酸序列的核酸。在一些情況下,本發(fā)明的核酸包括插入poi的插入位點。在一些情況下,本發(fā)明的核酸包括對poi進行編碼的核苷酸序列。在一些情況下,莖多肽是合成莖多肽,且本文中披露各種例示性合成莖多肽。在一些情況下,表面錨定多肽是糖基磷脂酰肌醇(gpi)錨定域。在一些情況下,gpi錨定域是合成gpi錨定域。在一些情況下,表面錨定多肽是跨膜域。

      提供用于測量試劑與poi的結合的方法(例如,確定試劑是否可以與poi結合)。還提供用于識別與poi結合的試劑的方法(例如,篩檢與給定poi結合的試劑的測試化合物);用于識別與給定試劑結合的多肽的方法(例如,當試劑以特定濃度存在時與試劑結合的多肽,例如識別以大于或等于預定值的親和力與試劑結合的多肽);以及用于產生與試劑結合的變體多肽的方法,所述變體多肽的親和力不同于(例如,大于)衍生出所述變體的多肽的親和力。

      還提供包括本發(fā)明組合物的各種組分的試劑盒,且所述試劑盒可以用于實踐本發(fā)明的方法。

      附圖說明

      圖1a-1c.使用長度可變的gpi錨定“莖”控制肽可及性。(圖1a)肽與酵母細胞表面連接的一個實施例的示意圖:分泌目標蛋白(poi)(此處是改造的sirpa變體cv1)作為表面可及融合蛋白,其中poi與以下融合:(i)信號多肽(其將蛋白質引向分泌路徑,但其可以經(jīng)由翻譯后加工與蛋白質割裂)、(ii)莖多肽(合成序列,其長度可以在廣泛長度范圍內改變)、(iii)gpi錨定物(例如,合成gpi錨定物)以及任選地(iv)表位標記(所示為ha表位標記)。(圖1b)實驗結果,其顯示莖長度(以氨基酸計)與以下3種標記探針的表面染色之間的關系:抗ha抗體(約150kd)、cd47-鏈霉親和素四聚體(約100kd)以及cd47-生物素單體(約15kda)。(圖1c)呈現(xiàn)與不同長度莖連接的cv-1的酵母的代表性流式細胞測量圖,所述不同長度莖同時染有抗ha抗體(alexa488)和cd47-生物素單體(alexa647)。測試莖序列的長度(以氨基酸的數(shù)目計)在各圖上方列出。

      圖2a-2b.本發(fā)明的組合物和方法與其它酵母菌株相容。(圖2a)肽與酵母細胞表面連接的示意圖。分泌改造的sirpa變體cv1作為與ha表位標記和長度為649個氨基酸的合成莖以及合成gpi錨定物的融合物(即,cv1是表達為表面可及融合多肽的目標蛋白(poi))。相比于圖1a-1c中所用的bj5465,用于這些實驗的酵母菌株是yvh10。yvh10酵母過度表達酵母蛋白質二硫鍵異構酶(pdi),使得所分泌含有二硫鍵的蛋白質能夠具有更大折疊能力。(圖2b)呈現(xiàn)與莖(649個氨基酸)連接的cv-1的yvh10酵母的代表性流式細胞測量圖,所述莖同時染有抗ha抗體(alexa488)和cd47-生物素單體(alexa647)。

      具體實施方式

      提供通過使目標蛋白(poi)與信號多肽、莖多肽以及表面錨定多肽融合產生表面可及融合蛋白而在真核細胞(例如,哺乳動物細胞、真菌細胞、酵母細胞等)表面上呈現(xiàn)poi的方法和組合物。在一些情況下,將表面可及融合蛋白作為核酸的一部分(例如,重組表達載體)引入真核細胞中。提供包括對信號多肽、莖多肽以及表面錨定多肽進行編碼的核苷酸序列的核酸。在一些情況下,本發(fā)明的核酸包括和插入poi的插入位點。在一些情況下,本發(fā)明的核酸包括對poi進行編碼的核苷酸序列。在一些情況下,莖多肽是合成莖多肽,且本文中披露各種例示性合成莖多肽。在一些情況下,表面錨定多肽是糖基磷脂酰肌醇(gpi)錨定域。在一些情況下,gpi錨定域是合成gpi錨定域。

      提供用于測量試劑與poi的結合的方法(例如,確定試劑是否可以與poi結合)。還提供用于識別與poi結合的試劑的方法(例如,篩檢與給定poi結合的試劑的測試化合物);用于識別與給定試劑結合的多肽的方法(例如,當試劑以特定濃度存在時與試劑結合的多肽,例如識別以大于或等于預定值的親和力與試劑結合的多肽);以及用于產生與試劑結合的變體多肽的方法,所述變體多肽的親和力不同于(例如,大于)衍生出所述變體的多肽的親和力。

      還提供包括本發(fā)明組合物的各種組分的試劑盒,且所述試劑盒可以用于實踐本發(fā)明的方法。

      在描述本方法和組合物之前,應理解本發(fā)明不限于所述特定方法或組合物,因此可理所當然地發(fā)生變化。還應理解,本文所用的術語只出于描述特定實施例的目的,而不希望具有限制性,因為本發(fā)明的范圍將僅由所附權利要求書限定。

      在提供數(shù)值范圍的情況下,應理解還專門披露所述范圍的上限與下限之間的每個中間值,直到下限單位的十分之一(除非上下文另外明確規(guī)定)。所述范圍內的任何所述值或中間值與那個所述范圍內的任何其它所述或中間值之間的每個更小范圍涵蓋于本發(fā)明中。這些更小范圍的上限和下限可以獨立地包括或不包括于所述范圍內,且本發(fā)明中還涵蓋其中任一限值包括于更小范圍內、兩個限值均不包括于更小范圍內或兩個限值均包括于更小范圍內的每個范圍(除了所述范圍內專門排除的任何限值之外)。在所述范圍包括限值中的一個或兩個的情況下,排除所包括的那些限值中的任一個或兩個的范圍也包括于本發(fā)明中。

      除非另外定義,否則本文所用的所有技術和科學術語均具有與本發(fā)明所屬領域的一般技術人員通常所理解相同的含義。雖然與本文所描述的類似或等效的任何方法和材料均可以用于本發(fā)明的實踐或測試,但現(xiàn)在描述一些潛在且優(yōu)選的方法和材料。本文提及的所有公開案均以引入的方式并入本文中,以披露且描述與所列公開案相關的方法和/或材料。應理解,在存在抵觸的范圍內,本發(fā)明取代了所并入公開案的任何披露內容。

      如所屬領域的技術人員在閱讀本發(fā)明后將明白,本文所描述和說明的個別實施例中的每一個均具有各別組分和特征,所述特征可以在不脫離本發(fā)明的范圍或精神的情況下輕易地與其它若干實施例中的任一個的特征分離或與其組合。任何所述方法均可以所述事件的順序或以邏輯上可能的任何其它順序來進行。

      必須指出,除非上下文另外明確規(guī)定,否則如本文和所附權利要求書中所用,單數(shù)形式“一(a/an)”和“所述(the)”包括復數(shù)個提及物。因此,舉例來說,對“細胞”的提及包括多個所述細胞,且對“所述肽”的提及包括提及所屬領域的技術人員已知的一或多個肽和其等效物,例如多肽等。

      提供本文所論述的公開案僅用于在本申請的申請日之前對其進行披露。不應將本文中的任何內容理解為承認本發(fā)明無權憑借先前發(fā)明而先于所述公開案。此外,所提供的公開日期可以不同于可能需要獨立確認的實際公開日期。

      定義

      在下文描述中,使用所屬領域中慣常使用的多個術語。為了清楚且連貫地理解本說明書與權利要求書和針對所述術語所給定的范圍,提供以下定義。

      術語“多肽”、“肽”和“蛋白質”在本文中可互換使用以指代氨基酸殘基的聚合物。所述術語也適用于氨基酸聚合物,其中一或多個氨基酸殘基是天然存在的相應氨基酸的人工化學模擬物,且適用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。

      術語“氨基酸”是指天然存在和合成的氨基酸,以及以與天然存在的氨基酸類似的方式起作用的氨基酸類似物和氨基酸模擬物。天然存在的氨基酸是由遺傳密碼編碼的氨基酸,以及后續(xù)被修飾的那些氨基酸,例如羥基脯氨酸、γ-羧基谷氨酸以及o-磷酸絲氨酸。氨基酸類似物是指基本化學結構與天然存在的氨基酸相同(即,α碳與氫、羧基、氨基以及r基團結合)的化合物,例如高絲氨酸、正亮氨酸、蛋氨酸亞砜、蛋氨酸甲基锍。所述類似物具有被修飾的r基團(例如,正亮氨酸)或被修飾的肽主鏈,但基本化學結構保持與天然存在的氨基酸相同。氨基酸模擬物是指結構不同于氨基酸的一般化學結構但以與天然存在的氨基酸類似的方式起作用的化合物。

      如當指代本發(fā)明組合物的組分(例如,合成莖多肽、合成表面錨定多肽、合成信號多肽等)時所用,術語“合成”意指非天然存在的組分。舉例來說,合成莖多肽按照定義包含非天然存在的氨基酸序列,合成表面錨定多肽按照定義包含非天然存在的氨基酸序列,且合成信號多肽按照定義包含非天然存在的氨基酸序列。

      在最廣泛的意義上使用術語“抗體”且具體地說,其涵蓋單克隆抗體(包括全長單克隆抗體)、多克隆抗體、多特異性抗體(例如,雙特異性抗體)以及抗體片段(例如,fab片段),只要其展現(xiàn)所要生物活性即可?!翱贵w(ab)”和“免疫球蛋白(ig)”是具有相同結構特征的糖蛋白。抗體對特定抗原展現(xiàn)結合特異性,而免疫球蛋白則包括缺乏抗原特異性的抗體和其它抗體類分子。后一種多肽例如是由淋巴系統(tǒng)在低水平上產生且由骨髓瘤在提高的水平上產生。

      “天然抗體和免疫球蛋白”通常是約150,000道爾頓的雜四聚體糖蛋白,由兩條相同的輕(l)鏈和兩條相同的重(h)鏈構成。每條輕鏈通過一個共價二硫鍵與重鏈連接,而在不同免疫球蛋白同型的重鏈之間二硫鍵的數(shù)目不同。每條重鏈和輕鏈還具有規(guī)則間隔的鏈內二硫橋鍵。每條重鏈在一端處具有可變域(vh),接著是多個恒定域。每條輕鏈在一端處具有可變域(vl)且在其另一端處具有恒定域;輕鏈的恒定域與重鏈的第一恒定域對齊,且輕鏈可變域與重鏈的可變域對齊。人們認為是特定氨基酸殘基形成了輕鏈與重鏈可變域之間的介面(科西亞(clothia)等人,《分子生物學雜志(j.mol.biol.)》186:651(1985);諾瓦特尼(novotny)和哈伯(haber),《美國國家科學院院刊(proc.natl.acad.sci.u.s.a.)》82:4592(1985))。

      術語“可變”是指如下事實:在抗體之間,可變域的某些部分在序列上廣泛不同,且用于每種特定抗體對其特定抗原的結合和特異性。然而,可變性并非均勻分布于整個抗體可變域中。其集中在三個稱為互補決定區(qū)(cdr)或高變區(qū)的區(qū)段,所述區(qū)段位于輕鏈和重鏈可變域中??勺冇虻母叨缺J夭糠址Q為框架(fr)。天然重鏈和輕鏈的可變域各自包含四個fr區(qū),其基本上采用b薄片構型,通過三個cdr連接,形成連接b薄片結構的環(huán),且在一些情況下形成b薄片結構的一部分。每條鏈中的cdr均通過fr區(qū)緊鄰在一起且與來自另一鏈的cdr促成抗體的抗原結合位點的形成(參見卡巴特(kabat)等人,《具有免疫學重要性的蛋白質序列(sequencesofproteinsofimmunologicalinterest)》,第五版,美國國立衛(wèi)生研究院(nationalinstituteofhealth),馬里蘭州貝塞斯達(bethesda,md.)(1991))。恒定域不直接參與抗體與抗原的結合,但展現(xiàn)各種效應子功能,如抗體參與抗體依賴性細胞毒性。

      抗體的消化(例如,使用如木瓜蛋白酶、無花果蛋白酶等酶)產生:兩個相同的抗原結合片段,稱為“fab”片段,每個片段均具有單個抗原結合位點;和殘余“fc”片段,其名稱反映其能夠輕易地結晶。胃蛋白酶處理產生f(ab')2片段,所述片段具有兩個抗原組合位點且仍然能夠交聯(lián)抗原。

      “fv”是含有完整的抗原識別和結合位點的最小抗體片段。在雙鏈fv物質中,這種區(qū)域是由一個重鏈可變域與一個輕鏈可變域經(jīng)由非共價緊密結合而成的二聚體組成。在單鏈fv物質(scfv)中,一個重鏈可變域與一個輕鏈可變域可以通過柔性肽連接子共價連接,因此輕鏈和重鏈可以類似于雙鏈fv物質的“二聚”結構結合。在這種構型中,每個可變域的三個cdr均相互作用以界定vh-vl二聚體表面上的抗原結合位點。六個cdr共同賦予抗體抗原結合特異性。然而,即使單個可變域(或包含僅三個對抗原具有特異性的cdr的fv的一半)也具有識別且結合抗原的能力,雖然親和力低于完整結合位點。關于scfv的綜述,參見普魯克通(pluckthun),《單克隆抗體的藥理學(thepharmacologyofmonoclonalantibodies)》,第113卷,羅森堡(rosenburg)和穆爾(moore)編,施普林格出版社(springer-verlag),紐約(newyork),第269-315頁(1994)。

      fab片段還含有輕鏈的恒定域和重鏈的第一恒定域(ch1)。fab'片段與fab片段的不同之處在于,重鏈ch1域的羧基末端增加了幾個殘基,包括一或多個來自抗體鉸鏈區(qū)的半胱氨酸。fab'-sh是本文關于fab'的名稱,其中恒定域的半胱氨酸殘基具有游離硫醇基。f(ab')2抗體片段最初產生為在其之間具有鉸鏈半胱氨酸的fab'片段對。還已知抗體片段的其它化學偶聯(lián)。

      如本文中所用,“抗體片段”和其所有語法變化形式定義為完整抗體的一部分,所述部分包含完整抗體的抗原結合位點或可變區(qū),其中所述部分不含完整抗體fc區(qū)的重鏈恒定域(即,ch2、ch3和ch4,這視抗體同型而定)??贵w片段的實例包括:fab、fab'、fab'-sh、f(ab')2以及fv片段;雙功能抗體;任何抗體片段,即主要結構由一個不間雜的鄰接氨基酸殘基序列組成的多肽(在本文中稱為“單鏈抗體片段”或“單鏈多肽”),包括(但不限于)(1)單鏈fv(scfv)分子,(2)含有僅一個輕鏈可變域的單鏈多肽或其含有輕鏈可變域的三個cdr的片段而無相關重鏈部分,(3)含有僅一個重鏈可變區(qū)的單鏈多肽或其含有重鏈可變區(qū)的三個cdr的片段而無相關輕鏈部分,以及(4)包含來自非人類物種的單個ig域或其它特定單域結合模塊的納米抗體;和由抗體片段形成的多特異性或多價結構。在包含一或多條重鏈的抗體片段中,重鏈可以含有完整抗體非fc區(qū)中存在的任何恒定域序列(例如,igg同型中的ch1),和/或可以含有完整抗體中存在的任何鉸鏈區(qū)序列,和/或可以含有與重鏈的鉸鏈區(qū)序列或恒定域序列融合或位于重鏈的鉸鏈區(qū)序列或恒定域序列中的亮氨酸拉鏈序列。

      如在本發(fā)明中所用,術語“表位”意指抗體互補位所結合的抗原上的任何抗原決定子。表位決定子通常由根據(jù)表面化學活性分組的分子(如氨基酸或糖側鏈)組成,且通常具有特定的三維結構特征以及特定的電荷特征。

      當在本文中使用時,術語“標記”是指直接或間接與分子共軛的可檢測化合物或組合物。舉例來說,試劑可以稱為“可檢測標記的”或可以稱為包括可檢測標記。標記本身可能是可檢測的(直接可檢測標記)(例如,放射性同位素標記、如熒光化學加合物的熒光標記等),或者標記可以是間接可檢測的,例如就酶促標記來說,酶可以催化底物化合物或組合物的化學改變,且反應產物是可檢測的。間接標記的一個實例是生物素,其可以使用鏈霉親和素檢測。任何適宜的直接或間接標記均可以用于本文所描述的組合物和方法。

      如本文中所用,術語“重組”意指特定核酸(dna或rna)是克隆、限制、聚合酶鏈反應(pcr)和/或接合步驟的各種組合的產物,所述步驟產生結構編碼序列或非編碼序列可區(qū)別于天然系統(tǒng)中存在的內源性核酸的構筑體。對多肽進行編碼的dna序列可以由cdna片段或由一連串合成寡核苷酸拼接以提供合成核酸,所述合成核酸能夠由細胞或無細胞轉錄與翻譯系統(tǒng)中所含有的重組轉錄單元表達。包含相關序列的基因組dna也可以用于形成重組基因或轉錄單元。在距離開放閱讀框5'或3'處可以存在未翻譯的dna序列,其中所述序列不干擾編碼區(qū)的控制或表達,且實際上可以通過各種機制用于調節(jié)所要產物的生產。對未翻譯的rna進行編碼的dna序列也可以視為重組的。因此,舉例來說,術語“重組”核酸是指非天然存在的核酸,例如,是通過人類干預使兩個以其它方式分離的序列區(qū)段人工組合而制得的核酸。這種人工組合往往通過化學合成手段或通過對分離的核酸區(qū)段進行人工控制(例如,通過基因工程技術)來實現(xiàn)。通常進行所述組合以用對同一氨基酸、保守氨基酸或非保守氨基酸進行編碼的密碼子代替密碼子。或者,進行所述組合以將具有所要功能的核酸區(qū)段連接在一起,從而產生所要功能組合。這種人工組合往往通過化學合成手段或通過對分離的核酸區(qū)段進行人工控制(例如,通過基因工程技術)來實現(xiàn)。當重組核酸對多肽進行編碼時,所編碼多肽的序列可以是天然存在的(“野生型”)或可以是天然存在的序列的變體(例如,突變體)。

      “載體”是另一dna區(qū)段(例如,“插入序列”)可以連接的復制子,如質體、噬菌體、病毒或粘質體,以使所連接的區(qū)段在細胞中復制和/或表達。“表達載體”是具有表達盒的載體(例如,具有作為表達盒的插入序列)?!氨磉_盒”包括可操作地連接于啟動子的dna序列(編碼或非編碼)?!翱刹僮鞯剡B接”是指一種并接,其中如此描述的組分處于允許其按預定方式發(fā)揮作用的關系。舉例來說,如果啟動子影響核苷酸序列的轉錄(例如,核苷酸序列的表達),那么啟動子可操作地連接于核苷酸序列。因此,術語“重組表達載體”或“dna構筑體”在本文中可互換使用以指代具有插入序列的表達載體,其中表達載體是重組的(即,包括非天然存在的序列)。重組表達載體通常出于表達和/或擴增插入序列的目的或用于構筑其它重組核苷酸序列而產生。

      組合物

      本發(fā)明提供通過將目標蛋白(poi)表達為表面可及融合蛋白而在細胞表面上表達poi(即,表面呈現(xiàn))的組合物和方法。術語“表面可及融合蛋白”在本文中用于描述具有信號多肽、目標蛋白(poi)、莖多肽以及表面錨定多肽的多肽。

      信號多肽

      術語“信號多肽”與“信號序列”在本文中可互換使用以指代存在于或接近分泌路徑蛋白質(例如,分泌蛋白、gpi錨定蛋白等)的n端的氨基酸序列,所述序列靶向蛋白質以將其傳送到內質網(wǎng)(er)的內腔中。如所屬領域中已知,信號序列在其長度和其氨基酸組成上極其可變。然而,信號序列的長度往往是約15-30個氨基酸,且通常包括5-10個疏水性氨基酸的嵌段。

      分泌路徑的許多蛋白質(例如,分泌蛋白)在翻譯(共翻譯)期間易位到er(例如,進入er內腔)。然而,一些小分泌蛋白(如酵母配對因子α(約70個氨基酸))在翻譯后轉移到er內腔中。來自不同蛋白質的信號序列可以互換地起作用。在一些情況下,信號序列在加工蛋白質期間斷裂(例如,不再存在于成熟蛋白質上)。因此,在一些情況下,本發(fā)明的信號多肽在加工表面可及融合蛋白期間斷裂(例如,不再存在于成熟蛋白質上,所述成熟蛋白質呈現(xiàn)在細胞表面上)。在一些情況下,信號多肽在加工蛋白質期間不發(fā)生斷裂(即,存在于成熟蛋白質中)。

      本發(fā)明的信號多肽可以天然存在于其受到表達的宿主細胞中,或可以是宿主細胞的異源多肽,只要其可操作以將表面可及融合蛋白轉移到分泌路徑中即可。本發(fā)明的信號多肽可以是具有良好特征的信號序列,或可以是衍生自分泌路徑的任何蛋白質的任何信號多肽。在一些情況下,本發(fā)明的信號多肽是合成信號多肽,即序列不以天然存在的蛋白質形式存在(相對于天然存在的蛋白質而修飾)。

      在一些實施例中,本發(fā)明的表面可及融合蛋白包括來自經(jīng)由翻譯后途徑進入er的蛋白質(或衍生自蛋白質)的信號多肽(在本文中稱為翻譯后信號多肽)。在一些實施例中,本發(fā)明的表面可及融合蛋白包括來自經(jīng)由預翻譯途徑進入er的蛋白質(或衍生自蛋白質)的信號多肽(在本文中稱為預翻譯信號多肽)。

      所屬領域的一般技術人員已知適用于本發(fā)明組合物、試劑盒以及方法的許多信號序列,且可以使用任何適宜的信號多肽。舉例來說,所屬領域的一般技術人員將能夠輕易地識別適用于本發(fā)明組合物、試劑盒以及方法的信號多肽??梢允褂迷谀繕怂拗骷毎?例如,真核細胞、哺乳動物細胞、真菌細胞、酵母細胞等)中起作用的任何適宜的信號多肽。信號序列的選擇可以考慮例如蛋白質呈現(xiàn)在細胞(例如,酵母細胞)表面的所要含量。舉例來說,當需要呈現(xiàn)高含量的蛋白質時,來自α配對因子的信號序列可以適用,但在一些情況下,在細胞表面需要較少蛋白質,且在所述情況下,可以使用其它信號多肽(例如,來自pho5p、suc2p等的信號肽)。

      在一些情況下,相對于表面可及融合蛋白將表達于其上的細胞類型,信號多肽是異源多肽。舉例來說,如果,將在酵母細胞中表達表面可及融合蛋白,那么信號多肽可以來自(例如,可以衍生自)除酵母細胞之外的細胞類型(例如,哺乳動物細胞、脊椎動物細胞、無脊椎動物細胞等),或來自不同種屬的酵母細胞,所述種屬不同于將在其中表達表面可及融合蛋白的種屬。

      在一些情況下,信號多肽來自(例如,衍生自)將表達表面可及融合蛋白的相同細胞類型(例如,在一些情況下來自相同種屬)。舉例來說,如果將在酵母細胞中表達表面可及融合蛋白,那么信號多肽可以來自酵母蛋白(例如,在一些情況下來自相同種屬的酵母)。例示性信號多肽包括(但不限于)來自(或衍生自)以下酵母蛋白的信號多肽:配對因子α、aga2p、pho5p以及suc2p。

      適合信號多肽的實例包括(但不限于)以下物質:

      來自配對因子α的信號多肽:

      mrfpsiftavlfaassalaapantttedetaqipaeavidysdlegdfdaaalplsnstnnglsstnttiasiaakeegvqldkrea(seqidno:11)

      來自配對因子α的信號多肽(更短):

      mrfpsiftavlfaassalaa(seqidno:12)

      來自aga2p的信號多肽

      mqllrcfsifsviasvlaq(seqidno:13)

      來自pho5p的信號多肽

      mfksvvysilaaslanag(seqidno:14)

      來自suc2p的信號多肽

      mllqaflfllagfaakisas(seqidno:15)

      來自天蠶抗菌肽-a的信號多肽(來自刻克羅普斯蠶蛾/天蠶蛾(hyalophoracecropia/cecropiamoth)):

      mnfsrifffvfacltalamvna(seqidno:16)

      來自基因銀行(genbank)aio03624.1的信號多肽

      mraflalifltfvmnvess(seqidno:17)

      在一些情況下,信號多肽所包括的氨基酸序列與seqidno:11-17中任一種所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。

      如下文更詳細地描述,在一些情況下,表面錨定多肽包括tm域(例如,ii型tm域),其位置使表面可及融合蛋白為ii型膜蛋白(即,表面錨定多肽的位置將接近表面可及融合蛋白的n端而非c端)。如所屬領域的一般技術人員將輕易地理解,在所述情況下,表面可及融合蛋白可以包括適于ii型膜蛋白的信號多肽。

      目標蛋白

      如本文中所用,術語“目標蛋白”、“poi”或“目標多肽”是指任何目標氨基酸序列。在一些情況下,poi是完整蛋白質(例如,天然存在的完整蛋白質、完整蛋白質的修飾形式等)。在一些情況下,poi是蛋白質的片段,且可以是任何目標片段。舉例來說,如果希望研究蛋白質特定部分(例如,域、胞外域、蛋白質結合域、酶促域、表位、無已知功能或疑似功能的蛋白質的一部分等)的結合或功能,那么目標特定部分可以稱為poi。衍生poi的蛋白質可以是任何蛋白質(例如,抗體、配位體、和受體、膜蛋白、分泌蛋白、胞內蛋白、定位于特定細胞器的蛋白質、胞質蛋白、酶等)。poi可以是天然存在的序列或非天然存在的序列(例如,合成氨基酸序列、天然存在的序列的突變/修飾形式等)。

      在一些情況下,在本發(fā)明的方法中使用多種poi(例如,兩種或更多種不同的poi)。在一些情況下,兩種或更多種不同poi中的至少兩種彼此相似。舉例來說,在一些情況下,本發(fā)明的方法是可以用于識別以較強或較弱親和力與特定化合物結合的變體的篩檢方法。因此,可以使用作為彼此變體(例如,通過誘變而產生)的多種poi。在一些情況下,兩種或更多種poi中的至少兩種在氨基酸序列中相差1到20個氨基酸(例如,1到19個氨基酸、1到18個氨基酸、1到17個氨基酸、1到16個氨基酸、1到15個氨基酸、1到14個氨基酸、1到13個氨基酸、1到12個氨基酸、1到11個氨基酸、1到10個氨基酸、1到9個氨基酸、1到8個氨基酸、1到7個氨基酸、1到6個氨基酸、1到5個氨基酸、1到4個氨基酸、1到3個氨基酸、1到2個氨基酸、或1個氨基酸)。

      莖多肽

      在本文中也稱為“合成莖多肽”的“莖多肽”是被設計成從細胞表面清除poi的合成序列(非天然存在的序列),且其具有惰性,因此poi與莖多肽不會相互作用。莖多肽打算提供poi與細胞表面的連接,同時允許poi在不受表面影響的情況下折疊(且在一些情況下起作用)。此外,使用合成莖多肽(例如,在一些情況下,外加合成表面錨定多肽,如合成gpi多肽)可以確保非所要重組不會在酵母基因組中出現(xiàn),所述基因組介于酵母基因組序列與對合成莖(和/或合成表面錨定多肽)進行編碼的核苷酸序列之間。

      可以用于設計莖多肽的設計特征包括:氨基酸序列中的低復雜性、多肽的整體酸性特征、多肽的高親水性、多肽中缺少規(guī)定的二級或三級結構特征、高密度的o連接的糖基化位點以及對莖多肽進行編碼的核苷酸序列中的低自身相似性。在一些情況下,將所有這些特征考慮在內,因此莖多肽的特征在于:低氨基酸序列復雜性、整體酸性特征、高親水性、缺少規(guī)定的二級或三級結構特征、高密度的o連接的糖基化位點,且對莖多肽進行編碼的核苷酸序列的特征在于低自身相似性。在一些情況下,莖多肽包含在表達于真核細胞(例如,酵母細胞)中后很大程度上o-糖基化的氨基酸序列。在一些情況下,本發(fā)明的莖多肽(和對莖多肽進行編碼的核苷酸序列)可以考慮(即,包括)上述特征中的任一種或全部(例如,以任何組合形式)。

      如上所述,在一些情況下,莖多肽包含在表達于真核細胞(例如,酵母細胞)中后很大程度上o-糖基化的氨基酸序列。在一些情況下,莖多肽(例如,合成莖多肽)在5個氨基酸跨度內所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)在10個氨基酸跨度內所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)在20個氨基酸跨度內所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)在50個氨基酸跨度內所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)在100個氨基酸跨度內所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)在200個氨基酸跨度內所包含的氨基酸序列具有1或更多個區(qū)(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、或7或更多個區(qū)),具有2到5個o連接的糖基化位點(例如,2到4個、2到3個、3到5個、3到4個、4到5個、2、3、4或5個o連接的糖基化位點)。

      在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列具有一或多個o連接的糖基化位點(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、7或更多個、8或更多個、9或更多個、或10或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列具有1到10個o連接的糖基化位點(例如,1到9個、1到8個、1到7個、2到10個、2到9個、2到8個、或2到7個o連接的糖基化位點)。

      在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每20個氨基酸具有1或更多個o連接的糖基化位點(例如,1.2或更多個、1.4或更多個、1.6或更多個、1.8或更多個、2或更多個、2.2或更多個、2.4或更多個、2.6或更多個、2.8或更多個、或3或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每40個氨基酸具有1或更多個o連接的糖基化位點(例如,1.2或更多個、1.4或更多個、1.6或更多個、1.8或更多個、2或更多個、2.2或更多個、2.4或更多個、2.6或更多個、2.8或更多個、或3或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每50個氨基酸具有1或更多個o連接的糖基化位點(例如,1.2或更多個、1.4或更多個、1.6或更多個、1.8或更多個、2或更多個、2.2或更多個、2.4或更多個、2.6或更多個、2.8或更多個、或3或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每100個氨基酸具有0.5或更多個o連接的糖基化位點(例如,0.6或更多個、0.7或更多個、0.8或更多個、0.9或更多個、1或更多個、1.1或更多個、1.2或更多個、1.3或更多個、1.5或更多個、或2或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每100個氨基酸具有1或更多個o連接的糖基化位點(例如,1.2或更多個、1.4或更多個、1.6或更多個、1.7或更多個、1.8或更多個、2或更多個、2.2或更多個、2.4或更多個、2.6或更多個、2.8或更多個、或3或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每200個氨基酸具有0.5或更多個o連接的糖基化位點(例如,0.6或更多個、0.7或更多個、0.8或更多個、0.9或更多個、1或更多個、1.1或更多個、1.2或更多個、1.3或更多個、1.5或更多個、或2或更多個o連接的糖基化位點)。在一些情況下,莖多肽(例如,合成莖多肽)所包含的氨基酸序列每200個氨基酸具有1或更多個o連接的糖基化位點(例如,1.2或更多個、1.4或更多個、1.6或更多個、1.7或更多個、1.8或更多個、2或更多個、2.2或更多個、2.4或更多個、2.6或更多個、2.8或更多個、或3或更多個o連接的糖基化位點)。

      莖多肽可以具有任何所要長度。舉例來說,在一些情況下,莖多肽包含長度在10到2000個氨基酸范圍內的多肽序列(例如,20到2000個氨基酸、50到2000個氨基酸、20到1500個氨基酸、50到1500個氨基酸、20到1000個氨基酸、50到1000個氨基酸、20到800個氨基酸、50到800個氨基酸、100到2000個氨基酸、100到1500個氨基酸、100到1000個氨基酸、100到800個氨基酸、10到100個氨基酸、20到100個氨基酸、40個氨基酸到100個氨基酸、101到200個氨基酸、201到300個氨基酸、301到400個氨基酸、401到500個氨基酸、501到600個氨基酸、601到700個氨基酸、701到800個氨基酸、801到900個氨基酸、901到1000個氨基酸、1001到1500個氨基酸、或1501到2000個氨基酸)。在一些情況下,莖多肽包含長度為10或更多個氨基酸的多肽序列(例如,20或更多個、30或更多個、40或更多個、50或更多個、60或更多個、70或更多個、80或更多個、90或更多個、100或更多個、125或更多個、150或更多個、200或更多個、250或更多個、300或更多個、350或更多個、400或更多個、450或更多個、或500或更多個氨基酸)。

      在一些情況下,莖多肽的長度可以用于使表面可及融合蛋白接近具有限定分子量的試劑。舉例來說,如果莖多肽較短(例如,100個氨基酸或更少),那么較大試劑則因為空間位阻而無法接近表面可及融合蛋白的poi。因此,可以“調節(jié)”莖多肽的長度來與所要試劑相匹配。舉例來說,如果將要篩檢化合物庫來與給定poi結合,但又僅關注低于一定分子量(閾值分子量)的化合物,那么則可以選擇一定長度的莖多肽以向高于所述閾值分子量的化合物提供空間位阻。換句話說,可以通過選擇適當長度的莖多肽以將針對給定poi的空間可及性“調節(jié)”到所要分子量截斷值。莖多肽的長度越大,空間位阻越小,且可及性越大(即,當莖多肽的長度增加,可以用于與表面可及融合蛋白的poi結合的試劑的尺寸也增加)。關于說明性實例,參見下文工作實例(圖1a-1c和圖2a-2b)。

      適合莖多肽包括(但不限于)此處提供的實例:

      s19(19個氨基酸)(seqidno:31)

      ggggsggggsgstgggggs

      s41(41個氨基酸)(seqidno:32)

      qtsspsreasvstsstsssasqssdptttssstvstpatga

      s232(232個氨基酸)(seqidno:33)

      qtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttss

      s465(465個氨基酸)(seqidno:34

      qtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpat

      s649(649個氨基酸)(seqidno:35)

      qtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpatshsqstvvttttittstgpvmstttaysssstsssessevqsvmsstpsststttssestsssstastspstsqtfetsptiggvpsttsfvstpttklshttstmtaqsdsksthssststedksstasavdestttststesttsvtsgtshsakesssnskvyssqtahssisvasspstk

      在一些情況下,本發(fā)明合成莖多肽所包括的氨基酸序列與seqidno:31-35中任一種(例如,32-35、33-35、34-35)所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。在一些情況下,本發(fā)明合成莖多肽所包括的氨基酸序列與seqidno:32-35中任一種所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。在一些情況下,本發(fā)明合成莖多肽所包括的氨基酸序列與seqidno:33-35中任一種所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。

      表面錨定多肽

      表面可及融合蛋白的本發(fā)明表面錨定多肽將融合蛋白錨定在細胞表面。在一些情況下,表面錨定多肽是(或衍生自)糖基磷脂酰肌醇(gpi)錨定域。各種細胞表面蛋白(包括酶、外殼蛋白、表面抗原以及粘附分子)經(jīng)由gpi錨定物與質膜連接(布里科夫(burikofer)等人.2002《美國實驗生物科學家聯(lián)合會雜志(fasebj)》15:545)。gpi是翻譯后添加的脂質錨定物;因此,與具有不同跨膜域且與特定細胞質延伸部分連接的常規(guī)多肽錨定物不同,gpi錨定物使用常見脂質結構來與膜連接,所述結構無關于與其連接的蛋白質(英格倫(englund)等人,阿努爾(annul)修訂.《生物化學(biochem)》.62:121(1993))。

      合成gpi錨定蛋白作為前體,其在n端或接近n端處具有可斷裂的疏水性信號序列,所述序列使蛋白質靶向內質網(wǎng)(er)的內腔,且在c端或接近c端處具有引導gpi錨定的可斷裂的信號序列(gpi錨定域)。在將gpi錨定物添加到具有gpi錨定域的蛋白質時,gpi錨定域的全部或一部分從蛋白質上斷裂開,且gpi錨定物與蛋白質連接。gpi錨定域包括通過親水性間隔區(qū)與gpi連接位點(ω位點)分離的疏水性區(qū)域。

      已在整個廣泛范圍的真核生物物種(從人類到昆蟲、酵母、細菌以及真菌)內識別gpi錨定蛋白。已識別許多蛋白質的gpi錨定域(例如,參見凱爾斯(cares)等人,《科學(science)》243:1196(1989))。已成功地將gpi錨定信號改造到其它蛋白質的c端上,并且將這些gpi錨定蛋白質覆蓋在細胞表面上且其具有功能性。(安德森(anderson)等人,p.n.a.s.93:5894(1996);不倫瑞克(brunschwig)等人,《免疫治療期刊(j.immunother)》.22:390(1999))。

      適合gpi錨定域的實例包括(但不限于)以下參考文獻中所披露的gpi錨定域:杜林,t.l.(doering,t.l.)等人.(1990)《生物化學雜志(j.biol.chem.)》265:611-614;麥康維爾,m.j.(mcconville,m.j.)等人.(1993)《生物化學雜志(biochem.j.)》294:305-324;以及pct公開案wo2003017944;所有文獻均以全文引用的方式并入本文中。

      任何適宜的gpi錨定域均可以用作表面錨定多肽。適用于本發(fā)明方法和組合物的gpi表面錨定多肽(例如,釀酒酵母(s.cerevisiae)蛋白中存在的gpi序列)的實例包括(但不限于):

      iqqnftstslmistyegkasiffsaelgsiiflllsyllf(seqidno:51)

      ekstnssssatsknagaamdmgffsagvgaaiagaaamll(seqidno:52)

      sllksaasatsssqssskskgaagiieiplifralaelynlvl(seqidno:53)

      ssgasssssksskgnaaimapigqttplvglltaiimsim(seqidno:54)

      aqanvsasassssssskkskgaapelvpatsfmgvvaavgvall(seqidno:55)

      gpgekarknnaapgpsnfnsiklfgvtagsaavagallll(seqidno:56)

      sstgmlsptsssstrkengghnlnppffarfitaifhhi(seqidno:57)

      ssfsssggssesttkkqnagykyrssfsfsllsfisyfll(seqidno:58)

      ykstvngkvasvmsnstngatagthiaygagafavgalll(seqidno:59)

      sgnlttstasatstsskrnvgdhivpslpltlisllfafi(seqidno:60)

      gkngaksqgsskkmensapknifidafkmsvyavftvlfsiif(seqidno:61)

      tgsssasssskskgvgnivnvsfsqsgylalfaglisall(seqidno:62)

      asgssthkknagnalvnysnlntntfigvlsvisavfgli(seqidno:63)

      edadedkddlkrkhrnsasisgpllplglcllfftfslff(seqidno:64)

      gpi表面錨定多肽可以來自(例如,衍生自)以下蛋白質,其包括(但不限于):配對型蛋白凝集素-a-1(aga1)、凝結蛋白(例如,flo1)、sed1、cwp1、cwp2、tip1、tir1/srp1、ccw14、cis3、cwp1、pir1以及pir3。在一些情況下,本發(fā)明表面錨定多肽所包含的氨基序列與seqidno:51-64中任一種所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(60%或更高、70%或更高、80%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。在一些情況下,本發(fā)明表面錨定多肽所包含的氨基序列與seqidno:51中所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(60%或更高、70%或更高、80%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。

      在一些情況下,表面錨定多肽是異源的(例如,相對于將在其中表達表面可及融合蛋白的宿主細胞,來自不同種屬或來自不同有機體的gpi錨定域)。使用異源表面錨定多肽(例如,在一些情況下,外加合成莖多肽)可以降低非所要重組將在酵母基因組中出現(xiàn)的概率,所述基因組介于酵母基因組序列與對異源表面錨定多肽(和/或合成莖多肽)進行編碼的核苷酸序列之間。

      在一些情況下,表面錨定多肽是合成多肽(即,包含非天然存在的氨基酸序列的表面錨定多肽)。使用合成表面錨定多肽(例如,合成gpi錨定域)(在一些情況下,外加合成莖多肽)可以降低非所要重組將在酵母基因組中出現(xiàn)的概率,所述基因組介于酵母基因組序列與對合成表面錨定多肽(和/或合成莖多肽)進行編碼的核苷酸序列之間。

      適合合成(例如,雜交)gpi表面錨定多肽的實例是:qiqssmveistyagsansvnagagagalflllslaii(seqidno:71)。

      在一些情況下,本發(fā)明表面錨定多肽(例如,gpi錨定域)所包含的氨基序列與seqidno:51-64和71中任一種所闡述的氨基酸序列(gpi錨定域氨基酸序列)的氨基酸序列一致性為60%或更高(60%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。在一些情況下,本發(fā)明合成表面錨定多肽所包含的氨基序列與seqidno:71中所闡述的氨基酸序列的氨基酸序列一致性為60%或更高(60%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。在一些情況下,本發(fā)明的合成表面錨定多肽包含seqidno:71中所闡述的氨基酸序列。

      因此,在一些情況下,表面可及融合蛋白包括gpi錨定域作為表面錨定多肽。因此,gpi錨定域可以位于信號多肽和莖多肽的c端。在所述情況下,poi將位于莖多肽的n端和信號多肽的c端(例如,介于信號多肽與莖多肽之間)。因此,在一些情況下(例如,當表面可及融合蛋白包括gpi錨定域作為表面錨定多肽時),從n端到c端,表面可及融合蛋白的組分包括信號多肽、poi、莖多肽(例如,合成莖多肽)以及表面錨定多肽(例如,gpi錨定域)。因此,在一些情況下,呈現(xiàn)部分(如下文所論述)和/或表面可及融合蛋白包括gpi錨定域作為表面錨定多肽。在一些情況下,表面可及融合蛋白還可以包括一或多個標記,如下文更加詳細地論述。

      在一些實施例中,表面錨定多肽包含插入細胞質膜中的跨膜(tm)域(例如,跨膜螺旋)。

      在一些情況下,表面可及融合蛋白是i型膜蛋白(例如,具有i型tm域作為表面錨定多肽)。因此,tm域可以位于信號多肽和莖多肽的c端。在所述情況下,poi將位于莖多肽的n端和信號多肽的c端(例如,介于信號多肽與莖多肽之間)。換句話說,在所述情況下,tm域的位置將接近表面可及融合蛋白的c端,且poi和莖多肽都將位于tm域的n端。因此,在一些情況下(例如,當表面可及融合蛋白是i型膜蛋白且包括tm域作為表面錨定多肽時),從n端到c端,表面可及融合蛋白的組分包括信號多肽、poi、莖多肽(例如,合成莖多肽)以及表面錨定多肽(例如,tm域、i型tm域)。因此,在一些情況下,呈現(xiàn)部分(如下文所論述)和/或表面可及融合蛋白包括i型tm域作為表面錨定多肽。在一些情況下,表面可及融合蛋白還可以包括一或多個標記,如下文更加詳細地論述。

      在一些情況下,表面可及融合蛋白是ii型膜蛋白(例如,具有ii型tm域作為表面錨定多肽)。因此,tm域可以位于信號多肽的c端和莖多肽的n端。在所述情況下,poi將位于莖多肽的c端。換句話說,在所述情況下,tm域的位置將接近表面可及融合蛋白的n端,且莖多肽和poi都將位于tm域的c端。因此,在一些情況下(例如,當表面可及融合蛋白是ii型膜蛋白且包括tm域作為表面錨定多肽時),從n端到c端,表面可及融合蛋白的組分包括信號多肽、表面錨定多肽(例如,tm域、ii型tm域)、莖多肽(例如,合成莖多肽)以及poi。因此,在一些情況下,呈現(xiàn)部分(如下文所論述)和/或表面可及融合蛋白包括ii型tm域作為表面錨定多肽。在一些情況下,表面可及融合蛋白還可以包括一或多個標記,如下文更加詳細地論述。

      標記

      在一些情況下,本發(fā)明的表面可及融合蛋白包括標記。如本文中所用,術語“標記”是包含可(直接和/或間接)檢測且提供輕易追蹤和/或純化的氨基酸序列的多肽。所屬領域的一般技術人員將已知適合標記的實例,且可以使用任何適宜的標記。適合標記的實例包括(但不限于)可直接檢測的標記(例如,熒光多肽,如綠色熒光蛋白(gfp)、yfp、rfp、cfp、mcherry、tdtomato等);和親和力標記(例如,組氨酸標記,如6xhis標記;血球凝集素(ha)標記;flag標記;myc標記等)。在一些情況下,表面可及融合蛋白包括多于一個標記。因此,在一些情況下,本發(fā)明的表面可及融合蛋白包括一或多個標記(2或更多個、3或更多個、或4或更多個標記,或1、2、3或4個標記)。

      標記可以位于表面可及融合蛋白內的任何位置。舉例來說,標記可以位于:(i)信號多肽的c端和poi的n端;和/或(ii)poi的c端和合成莖多肽的n端。在表面可及融合蛋白具有多于一個標記的情況下,標記可以位于poi的任一端(例如,一或多個標記位于信號多肽的c端和poi的n端,且一或多個標記位于poi的c端和合成莖多肽的n端)。在一些情況下,標記依次定位(即,彼此緊接)。

      表面可及融合蛋白

      本發(fā)明的表面可及融合蛋白是包括多種組分的單一蛋白質(例如,由多肽組分構成的蛋白質,所述多肽組分是模塊化的且通過肽鍵連接在一起,以使其構成單一蛋白質)。本發(fā)明表面可及融合蛋白的各種組分(例如,信號多肽、poi、標記、莖多肽、表面錨定多肽)可以直接相繼連接(無介入氨基酸),或者可以由連接子氨基酸(例如,任何數(shù)目的連接子氨基酸)隔開。舉例來說,在一些情況下,不存在將本發(fā)明表面可及融合蛋白的兩種給定組分隔開的氨基酸。在一些情況下,存在一或多個將本發(fā)明表面可及融合蛋白的兩種給定組分隔開的氨基酸(例如,2或更多個、3或更多個、4或更多個、5或更多個、6或更多個、7或更多個、8或更多個、9或更多個、10或更多個、15或更多個、20或更多個、25或更多個、30或更多個、或40或更多個氨基酸)。在一些情況下,存在20或更少個將本發(fā)明表面可及融合蛋白的兩種給定組分隔開的氨基酸(例如,15或更少個、10或更少個、9或更少個、8或更少個、7或更少個、6或更少個、5或更少個、4或更少個、3或更少個、或2或更少個氨基酸)。

      在一些情況下,本發(fā)明的表面可及融合蛋白由信號多肽、poi、莖多肽以及表面錨定多肽組成。在一些情況下,本發(fā)明的表面可及融合物由信號多肽、poi、莖多肽、表面錨定多肽以及一或多個標記組成。在一些情況下,本發(fā)明的表面可及融合蛋白基本上由信號多肽、poi、莖多肽以及表面錨定多肽組成。在一些情況下,本發(fā)明的表面可及融合物基本上由信號多肽、poi、莖多肽、表面錨定多肽以及一或多個標記組成。

      適合表面可及融合蛋白的兩個說明性實例描述于下文中。在所述兩個實例中,cv1是待呈現(xiàn)的poi。前述改造的蛋白質以高親和力與cd47結合。在以下兩個實例中,cv1在酵母細胞上呈現(xiàn)為表面可及融合蛋白,其系栓于莖(649個氨基酸)和兩個不同gpi錨定物中的一個上:

      “cv1pyds649hm”

      信號序列:配對因子α前導子(氨基酸1-87)(seqidno:11)

      目標蛋白:cv1(氨基酸90-208)(seqidno:7)

      ha表位標記(氨基酸211-219)(seqidno:8)

      莖:含649個氨基酸的莖(氨基酸220-868)(seqidno:35)

      表面錨定物:雜交gpi錨定域(氨基酸871-907)(seqidno:71)

      mrfpsiftavlfaassalaapantttedetaqipaeavidysdlegdfdaaalplsnstnnglsstnttiasiaakeegvqldkreasaeeelqiiqpdksvlvaagetatlrctitslfpvgpiqwfrgagpgrvliynqrqgpfprvttvsdttkrnnmdfsirignitpadagtyycikfrkgspddvefksgagtelsvrakpsgsypydvpdyaqtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpatshsqstvvttttittstgpvmstttaysssstsssessevqsvmsstpsststttssestsssstastspstsqtfetsptiggvpsttsfvstpttklshttstmtaqsdsksthssststedksstasavdestttststesttsvtsgtshsakesssnskvyssqtahssisvasspstkgaqiqssmveistyagsansvnagagagalflllslaii(seqidno:9)

      “cv1pyds649αm”

      信號序列:配對因子α前導子(氨基酸1-87)(seqidno:11)

      目標蛋白:cv1(氨基酸90-208)(seqidno:7)

      ha表位標記(氨基酸211-219)(seqidno:8)

      莖:含649個氨基酸的莖(氨基酸220-868)(seqidno:35)

      表面錨定物:agg1pgpi錨定域:(氨基酸871-910)(seqidno:51)

      mrfpsiftavlfaassalaapantttedetaqipaeavidysdlegdfdaaalplsnstnnglsstnttiasiaakeegvqldkreasaeeelqiiqpdksvlvaagetatlrctitslfpvgpiqwfrgagpgrvliynqrqgpfprvttvsdttkrnnmdfsirignitpadagtyycikfrkgspddvefksgagtelsvrakpsgsypydvpdyaqtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpatshsqstvvttttittstgpvmstttaysssstsssessevqsvmsstpsststttssestsssstastspstsqtfetsptiggvpsttsfvstpttklshttstmtaqsdsksthssststedksstasavdestttststesttsvtsgtshsakesssnskvyssqtahssisvasspstkgaiqqnftstslmistyegkasiffsaelgsiiflllsyllf(seqidno:10)

      核酸

      本發(fā)明的方面包括:用于表達表面可及融合蛋白的核酸、對表面可及融合蛋白進行編碼的核酸以及使用所述核酸的方法(例如,用以在細胞表面上表達表面可及融合蛋白、用于篩檢與表面可及融合蛋白結合的化合物、用于篩檢與目標化合物結合的多肽等)。在一些情況下,本發(fā)明的核酸是重組表達載體(例如,用于表達本發(fā)明的表面可及融合蛋白)。

      在一些情況下,用于表達表面可及融合蛋白的本發(fā)明核酸不包括對目標蛋白(poi)進行編碼的核苷酸序列。舉例來說,核酸可以是包括poi的前體(例如,介于對信號多肽和莖多肽進行編碼的核苷酸序列之間)。舉例來說,核酸可以包括對信號多肽、莖多肽以及表面錨定多肽(且在一些情況下,對標記)進行編碼的核苷酸序列,上述所有均可操作地連接于相同啟動子,其中啟動子在目標真核宿主細胞(例如,真核細胞、哺乳動物細胞、真菌細胞、酵母細胞、釀酒酵母細胞等)中具有功能性,但核酸可能不包括對poi進行編碼的核苷酸。在一些情況下,所述核酸是重組表達載體。

      在一些情況下,核酸(例如,重組表達載體)包括插入poi的插入位點。舉例來說,插入對poi進行編碼的核苷酸的插入位點可以存在于對以下進行編碼的核苷酸之間:信號多肽與莖多肽(信號:莖接合點)、信號多肽與標記(信號:標記接合點)、標記與莖多肽(標記:莖接合點)和/或第一標記與第二標記(標記:標記接合點)。在一些情況下,插入對poi進行編碼的核苷酸的插入位點與對莖多肽進行編碼的核苷酸相鄰定位。

      所屬領域的一般技術人員已知用于各種技術的插入位點,且可以使用任何適宜的插入位點。換句話說,插入位點可以用于任何控制核酸序列的方法。舉例來說,在一些情況下,插入位點可以是多克隆位點(例如,包括一或多個限制酶位點的位點)、用于接合獨立克隆的位點、用于基于重組的克隆的位點(例如,基于att位點的重組)、由基于crispr(例如,cas9)的技術所識別的核苷酸序列等。在一些情況下,插入位點可以由對本發(fā)明表面可及融合蛋白的一種組分進行編碼的核苷酸與對本發(fā)明表面可及融合蛋白的另一種組分進行編碼的核苷酸的接合點來限定(例如,信號:莖接合點、標記:莖接合點和/或標記:標記接合點),因此不存在介入核苷酸。插入位點可以具有任何所要長度,且不必與3'組分(例如,對莖多肽和表面錨定多肽進行編碼的核苷酸)同框,因為插入位點打算受到修飾(例如,在一些情況下被替換)以包括對目標蛋白進行編碼的核苷酸序列。所屬領域的一般技術人員將了解,在插入位點插入對poi進行編碼的核苷酸后,其需要與上游序列(例如,對信號多肽進行編碼的序列)和下游序列(例如,對莖多肽和表面錨定多肽進行編碼的序列)同框。

      因此,在一些情況下,(用于在細胞表面上表達目標多肽的)本發(fā)明核酸包括對呈現(xiàn)部分進行編碼的核苷酸序列。如本文所用,“呈現(xiàn)部分”是指除poi之外,本發(fā)明表面可及融合蛋白的組分的組合。舉例來說,呈現(xiàn)部分可以包括信號多肽、莖多肽(例如,合成莖多肽)以及表面錨定多肽(未必按所述順序)。在一些情況下,按從n端到c端的順序,呈現(xiàn)部分包括信號多肽、莖多肽(例如,合成莖多肽)以及表面錨定多肽(例如,gpi錨定域、i型tm域等)。在一些情況下,按從n端到c端的順序,呈現(xiàn)部分包括信號多肽、表面錨定多肽(例如,ii型tm域、來自ii型膜蛋白的tm域等)以及莖多肽(例如,合成莖多肽)。當本發(fā)明的核酸不包括poi時(例如,當核酸包括poi的插入位點時、當核酸打算用于插入對poi進行編碼的核苷酸序列時等),在插入對po進行編碼的核苷酸序列之前,對呈現(xiàn)部分的組分進行編碼的核苷酸不必彼此同框。舉例來說,其可以在插入對poi進行編碼的核苷酸序列之后彼此同框,因此所編碼的表面可及融合蛋白包括呈現(xiàn)部分的組分(即,信號多肽、莖多肽以及表面錨定多肽;其順序可以視上述表面錨定多肽的性質而變化)。在所述情況下,核酸仍然可以稱為包括對呈現(xiàn)部分進行編碼的核苷酸序列。

      在一些情況下,本發(fā)明的呈現(xiàn)部分包括信號多肽、莖多肽以及表面錨定多肽。在一些情況下,本發(fā)明的呈現(xiàn)部分包括信號多肽、莖多肽、表面錨定多肽以及一或多個標記。在一些情況下,本發(fā)明的呈現(xiàn)部分由信號多肽、莖多肽以及表面錨定多肽組成。在一些情況下,本發(fā)明的呈現(xiàn)部分由信號多肽、莖多肽、表面錨定多肽以及一或多個標記組成。在一些情況下,本發(fā)明的呈現(xiàn)部分基本上由信號多肽、莖多肽以及表面錨定多肽組成。在一些情況下,本發(fā)明的呈現(xiàn)部分基本上由信號多肽、莖多肽、表面錨定多肽以及一或多個標記組成。

      舉例來說,在一些情況下,(用于在細胞表面上表達目標多肽的)本發(fā)明核酸包括對以下進行編碼的核苷酸序列:(i)對信號多肽進行編碼的第一核苷酸序列;(ii)對合成莖多肽進行編碼的第二核苷酸序列;以及(iii)對表面錨定多肽進行編碼的第三核苷酸序列。在一些情況下,(i)、(ii)以及(iii)沿5'到3'方向相對于彼此定位并且可操作地連接于相同啟動子,其中啟動子在宿主細胞(例如,真核細胞、脊椎動物細胞、無脊椎動物細胞、哺乳動物細胞、真菌細胞、酵母細胞等)中具有功能性。在一些所述情況下,核酸包括插入對目標蛋白(poi)進行編碼的核苷酸序列的(上述)插入位點,其中插入位點位于(i)的3'處和(ii)的5'處。在一些情況下,核酸還包括對標記進行編碼的核苷酸序列(例如,其位置使其與對其它組分[(i)、(ii)以及(iii)]進行編碼的核苷酸序列中的至少一種同框)。

      在一些情況下(例如,當本發(fā)明的核酸包括對呈現(xiàn)部分進行編碼的核苷酸序列時),上文(i)、(ii)以及(iii)沿5'到3'方向相對于彼此定位,其順序為:(i)、(iii)以及(ii)(例如,當表面錨定多肽是tm域且表面可及融合蛋白將為ii型膜蛋白時),且可操作地連接于相同啟動子,其中啟動子在宿主細胞(例如,真核細胞、脊椎動物細胞、無脊椎動物細胞、哺乳動物細胞、真菌細胞、酵母細胞等)中具有功能性。在一些所述情況下,核酸包括插入對目標蛋白(poi)進行編碼的核苷酸序列的(上述)插入位點,其中插入位點位于(ii)的3'處。在一些情況下,核酸還包括對標記進行編碼的核苷酸序列(例如,其位置使其與對其它組分[(i)、(ii)以及(iii)]進行編碼的核苷酸序列中的至少一種同框)。

      對表面可及融合蛋白進行編碼的核酸包括對表面可及融合蛋白(具有信號多肽、目標蛋白(poi)、莖多肽以及表面錨定多肽的融合蛋白)(且在一些情況下,具有標記)進行編碼的核苷酸序列。在一些情況下,對表面可及融合蛋白進行編碼的核苷酸序列可操作地連接于啟動子,所述啟動子在目標真核宿主細胞(例如,真核細胞、哺乳動物細胞、真菌細胞、酵母細胞、釀酒酵母細胞等)中具有功能性。

      因此,在一些情況下,(例如,對表面可及融合蛋白進行編碼的)本發(fā)明核酸包括:(i)對信號多肽進行編碼的第一核苷酸序列;(ii)對目標蛋白(poi)進行編碼的第二核苷酸序列;(iii)對合成莖多肽進行編碼的第三核苷酸序列;以及(iv)對表面錨定多肽進行編碼的第四核苷酸序列。在一些所述情況下,(i)、(ii)、(iii)以及(iv)從5'到3'按[(i)、(ii)、(iii)以及(iv)]的順序定位,且彼此同框以使其共同對包括信號多肽、poi、莖多肽以及表面錨定多肽(例如,在一些情況下,按所述順序)的表面可及融合蛋白進行編碼。在一些情況下,所編碼的表面可及融合蛋白還包括標記,因此核酸包括對所述標記進行編碼的核苷酸序列。在一些情況下,對表面可及融合蛋白進行編碼的核苷酸序列可操作地連接于啟動子,所述啟動子在目標真核宿主細胞(例如,真核細胞、哺乳動物細胞、真菌細胞、酵母細胞、釀酒酵母細胞等)中具有功能性。

      在一些情況下,(例如,對表面可及融合蛋白進行編碼的)本發(fā)明核酸包括:(i)對信號多肽進行編碼的第一核苷酸序列;(ii)對表面錨定多肽(例如,當表面可及融合蛋白是ii型膜蛋白時,其為tm域)進行編碼的第二核苷酸序列;(iii)對合成莖多肽進行編碼的第三核苷酸序列;以及(iv)對目標蛋白(poi)進行編碼的第四核苷酸序列。在一些所述情況下,(i)、(ii)、(iii)以及(iv)從5'到3'按[(i)、(ii)、(iii)以及(iv)]的順序定位,且彼此同框以使其共同對包括信號多肽、表面錨定多肽、莖多肽以及poi(例如,在一些情況下,按所述順序)的表面可及融合蛋白進行編碼。在一些情況下,所編碼的表面可及融合蛋白還包括標記,因此核酸包括對所述標記進行編碼的核苷酸序列。在一些情況下,對表面可及融合蛋白進行編碼的核苷酸序列可操作地連接于啟動子,所述啟動子在目標真核宿主細胞(例如,真核細胞、哺乳動物細胞、真菌細胞、酵母細胞、釀酒酵母細胞等)中具有功能性。

      如本文所用,“啟動子序列”或“啟動子”是能夠結合rna聚合酶且引發(fā)下游(3'方向)編碼或非編碼序列的轉錄的dna調節(jié)區(qū)。出于本發(fā)明的目的,啟動子序列由轉錄引發(fā)位點在其3'端處定界,且向上游(5'方向)延伸,以包括以在背景上可檢測的水平引發(fā)轉錄所必需的至少最小數(shù)目的堿基或要素。啟動子序列內將存在引起rna聚合酶結合的蛋白質結合域。真核啟動子往往(而非始終)將含有“tata”框和“cat”框。包括誘導型啟動子的各種啟動子可以用于驅動本發(fā)明的各種載體。啟動子可以是構成性活性啟動子(即,在構成上處于活性/”啟用”狀態(tài)的啟動子)。啟動子可以是誘導型啟動子(即,狀態(tài)為活性/”啟用”或非活性/“停用”的啟動子由外部刺激控制,例如存在特定溫度、化合物或蛋白質)。

      可以使用任何適宜的啟動子,且所屬領域的一般技術人員可輕易地獲得許多啟動子。應了解,啟動子必須在表達表面可及融合蛋白的細胞(例如,真核細胞、真菌細胞、酵母細胞、脊椎動物細胞、哺乳動物細胞、無脊椎動物細胞等)中具有功能性。適用于酵母表達載體的啟動子的實例包括(但不限于):aox1啟動子、半乳糖誘導型啟動子(例如,pgal1、pgal1-10、pgal4、pgal10等)、磷酸甘油酸激酶(ppgk)啟動子、細胞色素c(pcyc1)啟動子、醇脫氫酶i(padh1)啟動子等。

      其它例示性啟動子包括(但不限于):sv40早期啟動子、鼠標乳腺腫瘤病毒長末端重復(ltr)啟動子;腺病毒主要晚期啟動子(admlp);單純性皰疹病毒(hsv)啟動子、巨細胞病毒(cmv)啟動子(如cmv即刻早期啟動子區(qū)域(cmvie))、勞斯氏肉瘤病毒(roussarcomavirus,rsv)啟動子、人類u6小核啟動子(u6)(宮岸(miyagishi)等人,《自然·生物技術(naturebiotechnology)》20,497-500(2002))、增強型u6啟動子(例如,夏(xia)等人,《核酸研究(nucleicacidsres.)》2003年9月1日;31(17))、人類h1啟動子(h1)等。

      誘導型啟動子的實例包括(但不限于):t7rna聚合酶啟動子、t3rna聚合酶啟動子、異丙基-β-d-硫代吡喃半乳糖苷(iptg)調節(jié)型啟動子、乳糖誘導型啟動子、熱休克啟動子、四環(huán)素調節(jié)型啟動子、類固醇調節(jié)型啟動子、金屬調節(jié)型啟動子、雌激素受體調節(jié)型啟動子等。因此,誘導型啟動子可以由包括(但不限于)以下的分子調節(jié):多西環(huán)素(doxycycline);rna聚合酶,例如t7rna聚合酶;雌激素受體;雌激素受體融合物等。

      上述核酸中的任一種均可以是重組表達載體(其可以包括用于表達本發(fā)明表面可及融合蛋白的任何適宜的啟動子,包括(但不限于)上述啟動子中的任一種)。在一些實施例中,本發(fā)明的重組表達載體在宿主細胞中是可操作的,以直接表達且呈現(xiàn)表面可及融合蛋白。在一些實施例中,本發(fā)明的重組表達載體在酵母細胞中是可操作的,以引導表面可及融合蛋白的表達和呈現(xiàn)。

      各種重組表達載體是所屬領域中所已知的且可購得,其滿足酵母中重組基因表達的各種要求。大部分酵母載體是穿梭載體,其含有允許對其進行選擇且在細菌(例如,大腸桿菌(e.coli))中擴增的序列,因此允許適宜的擴增和隨后的活體外變異。許多常見酵母穿梭載體來源于pbr322。其含有在大腸桿菌中促進保持高拷貝數(shù)的復制起點(例如,cole1復制起點)和可選擇性抗生素標記物(例如,β-內酰胺酶基因、四環(huán)素抗性基因,其分別賦予針對安比西林(ampicillin)和四環(huán)素的抗性)。特定酵母穿梭載體包括(但不限于)美國專利第5,866,404號和第6,897,353號中所描述的酵母穿梭載體。適用于實踐本文所描述方法(例如(但不限于)在如巴斯德畢赤酵母(pichiapastoris)(即,巴斯德畢赤酵母宿主細胞)的種屬中表達本發(fā)明的表面可及融合蛋白)的其它酵母載體描述于美國專利第5,707,828號、第6,730,499號、美國專利公開案第20060270041號以及pct公開案第wo2005040395號和第wo200231178號中。

      酵母載體可以含有標記物基因,所述標記物基因允許選擇含有所要質體的轉化子。最常使用的酵母標記物基因的實例包括(但不限于)ura3、his3、leu2、trp1以及l(fā)ys2,其與宿主細胞中的特定營養(yǎng)缺陷型突變體互補。因為ura3和lys2酵母標記物基因允許使用正選擇和負選擇方案,所以其具有額外優(yōu)點。也可以使用向酵母宿主細胞賦予顯性抗藥表現(xiàn)型的可選標記物基因,如分別賦予對潮霉素b和諾爾絲菌素的抗性的hph和nat基因(參見佐藤(sato)等人,《酵母(yeast)》22:583-591(2005))。大部分當前使用的酵母穿梭載體屬于以下三種廣泛類別中的一種:(i)整合型載體、(ii)自主復制的高拷貝數(shù)載體或(iii)自主復制的低拷貝數(shù)載體。

      許多適合的表達載體是所屬領域的技術人員所已知的,且許多表達載體是市售的。通過舉例提供以下載體;針對真核宿主細胞:pxt1、psg5(斯塔津(stratagene))、psvk3、pbpv、pmsg以及psvlsv40(法瑪西亞(pharmacia))。然而,可以使用任何其它載體,只要其與宿主細胞相容即可。

      在一些實施例中,重組表達載體是病毒構筑體,例如,重組腺相關病毒構筑體(參見例如,美國專利第7,078,387號)、重組腺病毒構筑體、重組慢病毒構筑體、重組逆轉錄病毒構筑體等。適合表達載體包括(但不限于):病毒載體(例如,基于以下的病毒載體:牛痘病毒;脊髓灰質炎病毒;腺病毒(參見例如,李(li)等人,《眼科研究與視力學(investopthalmolvissci)》35:25432549,1994;波納斯(borras)等人,《基因療法(genether)》6:515524,1999;李(li)和戴維森(davidson),《美國國家科學院院刊(pnas)》92:77007704,1995;坂本(sakamoto)等人,《人類基因療法(hgenether)》5:10881097,1999;wo94/12649、wo93/03769;wo93/19191;wo94/28938;wo95/11984以及wo95/00655);腺相關病毒(參見例如,阿里(ali)等人,《人類基因療法(humgenether)》9:8186,1998;弗蘭納里(flannery)等人,《美國國家科學院院刊》94:69166921,1997;班尼特(bennett)等人,《眼科研究與視力學》38:28572863,1997;久瑪麗(jomary)等人,《基因療法》4:683690,1997;羅玲(rolling)等人,《人類基因療法》10:641648,1999;阿里等人,《人類分子遺傳學(hummolgenet)》5:591594,1996;斯瑞瓦斯特娃(srivastava),wo93/09239;薩姆斯基(samulski)等人,《病毒學雜志(j.vir.)》(1989)63:3822-3828;蒙德爾森(mendelson)等人,《病毒學(virol.)》(1988)166:154-165;以及弗洛狄(flotte)等人,《美國國家科學院院刊》(1993)90:10613-10617);sv40;單純性皰疹病毒;人類免疫缺陷病毒(參見例如,三好(miyoshi)等人,《美國國家科學院院刊》94:1031923,1997;高橋(takahashi)等人,《病毒學雜志(jvirol)》73:78127816,1999);逆轉錄病毒載體(例如,鼠類白血病病毒、脾壞死病毒,以及衍生自逆轉錄病毒的載體,如勞斯氏肉瘤病毒(roussarcomavirus)、哈維肉瘤病毒(harveysarcomavirus)、禽白血病病毒、慢病毒、人類免疫缺陷病毒、骨髓增生性肉瘤病毒以及乳腺腫瘤病毒)等。

      視所用的宿主/載體系統(tǒng)而定,表達載體中可使用多種適合轉錄與翻譯控制要素(包括構成性和誘導型啟動子、轉錄增強子要素、轉錄終止子等)中的任一種(參見例如,比特(bitter)等人(1987)《酶學方法(methodsinenzymology)》,153:516-544)。

      在一些情況下,對本發(fā)明表面可及融合蛋白的組分進行編碼的核苷酸操作地連接到轉錄終止序列(例如,以促進適當?shù)膍rna加工)。因此,在一些情況下,本發(fā)明的重組表達載體包括終止序列。轉錄終止要素(終止序列)的實例包括(但不限于)若干酵母基因的終止序列,如cyc1、adh1、aro4、trp1、act1以及ypt1??梢允褂萌魏芜m宜的終止序列。

      具有對本發(fā)明表面可及融合蛋白進行編碼的核苷酸序列的本發(fā)明dna核酸的一個說明性實例是seqidno:6中所闡述的8584核苷酸(nt)載體。在此實例中,信號多肽是由核苷酸856-1113(seqidno:1)編碼的配對因子α前導子;目標蛋白(poi)是由核苷酸1123-1479(seqidno:2)編碼的cv1;合成莖多肽(649個氨基酸)由核苷酸1513-3459(seqidno:4)編碼;并且表面錨定多肽是由核苷酸3466-3576(seqidno:5)編碼的合成雜交gpi序列。此例示性核酸還具有對ha表位標記進行編碼的核苷酸(核苷酸1486-1512)(seqidno:3)。

      宿主細胞

      本發(fā)明的方面包括:包括上述表面可及融合蛋白和/或核酸(例如,用于表達表面可及融合蛋白的核酸和/或對表面可及融合蛋白進行編碼的核酸)的細胞(即,宿主細胞)。術語“宿主細胞”在本文中用于指代本發(fā)明的表面可及融合蛋白將在其中表達并呈現(xiàn)的細胞;或指代核酸在其中擴增的細胞。宿主細胞可以用于表達來自本發(fā)明核酸(如重組表達載體(例如,真核宿主細胞))的本發(fā)明表面可及融合蛋白,和/或使本發(fā)明的重組表達載體(例如,真核宿主細胞或原核宿主細胞)增殖。

      在一些情況下,本發(fā)明的宿主細胞是原核細胞。舉例來說,在一些情況下,出于增殖和/或純化重組表達載體的目的,(具有對表面可及融合蛋白進行編碼的核苷酸的)本發(fā)明重組表達載體處于原核細胞的內部。因此,在一些情況下,原核細胞(例如,細菌細胞,如大腸桿菌細胞)包括上述核酸(例如,重組表達載體)。

      在一些情況下,適合的宿主細胞是單細胞真核有機體的細胞、真菌細胞、酵母細胞、動物細胞、無脊椎動物(例如,果蠅、刺胞動物、棘皮動物、線蟲等)細胞、脊椎動物(例如,魚、兩棲動物、爬行動物、鳥、哺乳動物)細胞、哺乳動物(例如,豬、奶牛、山羊、綿羊、嚙齒動物、大鼠、小鼠、非人類靈長類動物、人類等)細胞等。

      在一些情況下,適合的宿主細胞是真菌細胞。任何真菌細胞(例如,任何適宜的真菌種屬)均為適合的。在一些情況下,適合的宿主細胞是酵母細胞??梢允褂萌魏芜m宜的酵母細胞種屬。適合酵母種屬(即,適合酵母細胞的種屬)的說明性實例包括(但不限于):釀酒酵母(saccharomycescerevisiae)、粟酒裂殖酵母(schizosaccharomycespombe)、啤酒酵母(saccharomycesuvaruium)、巴斯德畢赤酵母(合成巴斯德駒形氏酵母(komagataellapastoris))、多形漢遜酵母(hansenulapolymorpha)(合成擬多形緒方氏酵母(ogataeaparapolymorpha))、解脂耶羅威亞酵母(yarrowialipolytica)、樹干畢赤酵母(pichiastipitis)(合成木糖發(fā)酵酵母(scheffersomycesstipitis))、馬克斯克魯維酵母(kluyveromycesmarxianus)、嗜鞣管囊酵母(pachysolentannophilus)、博伊丁假絲酵母(candidaboidinii)、白假絲酵母(candidaalbicans)以及索諾拉沙漠假絲酵母(candidasorenensi)。

      引入核酸(例如,重組表達載體)的適合方法(也稱為“轉化”和/或“轉染”)包括(例如):病毒感染、轉染、脂質體轉染、核轉染、電穿孔、磷酸鈣沉淀、聚乙烯亞胺(pei)介導轉染、deae葡聚糖介導轉染、脂質體介導轉染、粒子槍技術、磷酸鈣沉淀、直接顯微注射、納米粒子介導核酸傳送(參見例如,帕尼亞姆(panyam)等人《先進藥物傳遞評論(advdrugdelivrev.)》2012年9月13日.pii:s0169-409x(12)00283-9.doi:10.1016/j.addr.2012.09.023)等。可以使用任何適宜的方法。

      對引入核酸方法的選擇通常視轉化的細胞類型和發(fā)生轉化的環(huán)境而定。舉例來說,當轉化真菌細胞(如酵母)時,可以使用如使用乙酸鋰、單股載體dna、和/或peg(在一些情況下,伴隨熱休克)的方案。所屬領域的一般技術人員將能夠輕易地確定將本發(fā)明的核酸引入所要宿主細胞中的適當方案。各種轉化方法的一般論述可以在奧斯貝(ausubel)等人,《精編分子生物學實驗指南(shortprotocolsinmolecularbiology)》,第3版,威利父子(wiley&sons),1995中找到。

      舉例來說,使細胞與包含本發(fā)明核酸的病毒粒子接觸以用于病毒載體傳送。逆轉錄病毒(例如,慢病毒)尤其適合。常用的逆轉錄病毒載體是“有缺陷的”,即無法產生增殖性感染所需的病毒蛋白。相反,載體的復制需要包裝細胞系中的生長。為了產生包含目標核酸的病毒粒子,通過包裝細胞系將包含所述核酸的逆轉錄病毒核酸包裝到病毒衣殼中。不同包裝細胞系提供并入衣殼中的不同包膜蛋白(單嗜性、雙嗜性或異嗜性),這種包膜蛋白決定病毒粒子針對細胞的特異性(對鼠類和大鼠具有單嗜性;對大部分哺乳動物(包括人類、狗和小鼠)細胞類型具有雙嗜性;并且對大部分哺乳動物細胞類型(除了鼠類細胞之外)具有異嗜性。適當包裝細胞系可以用于確保包裝的病毒粒子靶向細胞。將具有目標核酸的逆轉錄病毒載體引入包裝細胞系中的方法和收集由包裝系產生的病毒粒子的方法是所屬領域中已知的。

      方法

      本發(fā)明的方面包括使用上述表面可及融合蛋白和核酸的方法。所提供的方法用于:(i)在真核細胞中表達目標蛋白(poi)(例如,在真核細胞表面上呈現(xiàn)poi);(ii)測量試劑與poi的結合(例如,在一些情況下,確定試劑是否可以與poi結合);(iii)識別與poi結合的試劑(化合物)(例如,篩檢與poi結合的試劑的測試化合物);(iv)識別與試劑結合的多肽(例如,當試劑以特定濃度存在時與試劑結合的多肽,例如識別以大于或等于預定值的親和力與試劑結合的多肽);(v)產生與試劑結合的變體多肽,所述變體多肽的親和力不同于(例如,大于)衍生出所述變體的多肽的親和力等。

      (i)表達方法

      在一些實施例中,本發(fā)明的方法是在真核細胞中表達目標蛋白(poi)(例如,在真核細胞表面上呈現(xiàn)poi)的方法。所述方法包括:將包括poi的本發(fā)明表面可及融合蛋白引入細胞(例如,任何所要宿主細胞)中。舉例來說,所述方法可以包括:將具有對表面可及融合蛋白進行編碼的核苷酸序列的核酸引入真核細胞(例如,上述宿主細胞,如真菌細胞、酵母細胞、哺乳動物細胞等)中,其中表面可及融合蛋白包括信號多肽、poi、莖多肽以及表面錨定多肽(且在一些情況下,包括標記)。包括poi的表面可及融合蛋白可以通過以下方式引入細胞中:(i)直接作為蛋白質(例如,在一些情況下,使用蛋白質轉導域);(ii)作為對蛋白質進行編碼的rna;(iii)或作為對蛋白質進行編碼的dna。在一些情況下(例如,當表面可及融合蛋白作為dna引入細胞中時),對表面可及融合蛋白進行編碼的核苷酸可操作地連接于可在細胞中操作的啟動子。

      在一些情況下,在真核細胞中表達目標蛋白(poi)(例如,在真核細胞表面上呈現(xiàn)poi)的方法進一步包括下文所述方法步驟的任何組合。

      (ii)測量結合的方法

      在一些實施例中,本發(fā)明的方法是測量試劑與poi的結合(例如,在一些情況下,確定試劑是否可以與poi結合)的方法。測量試劑與poi的結合的方法可以包括在真核細胞(例如,任何目標真核宿主細胞,如哺乳動物細胞、真菌細胞、酵母細胞等)表面上呈現(xiàn)poi(例如,參見上文“表達方法”)。

      測量試劑與poi的結合的方法包括使真核細胞(通過在細胞表面上將poi呈現(xiàn)為表面可及融合蛋白來表達poi的細胞)與試劑接觸。試劑(在本文中也稱為“測試化合物”)可以是任何能與poi結合的試劑。舉例來說,適合試劑包括任何化學實體、藥劑、藥物、肽、抗體、抗體結合片段、小分子化合物,包括可以測試(例如,篩檢)其與一或多個poi的潛在結合的已知和潛在的治療化合物。舉例來說,在一些情況下,poi包括抗體的抗原結合域,且試劑(例如,測試試劑)是肽(在一些情況下是已知與抗體結合的肽變體)。在一些情況下,poi是針對抗體的表位(或已知表位的變體),且試劑是抗體或抗體的抗原結合域。在一些情況下,poi是配位體/受體對的配位體或受體結合區(qū)(或其變體)。

      在一些情況下,試劑包括可檢測標記(例如,可以直接或間接地檢測試劑)。在一些情況下,直接標記試劑(例如,試劑可以包括可直接檢測的加合物,如熒光加合物)。在一些情況下,間接標記試劑(例如,試劑可以包括可間接檢測的加合物,如生物素)。

      在一些情況下,測量與poi結合(即,與表面可及融合蛋白結合)的試劑量可以通過(例如,如下所述定量地或定性地)測量與表達表面可及融合蛋白的細胞結合的試劑量來實現(xiàn)。

      如本文中所用,“測量量”可以提供定性或定量結果,且因此,如本文中所用的短語涵蓋定量以及定性測量值。舉例來說,在一些情況下,當定性地測量量時,測量與poi結合的試劑量包括確定試劑是否與poi結合(例如,是否與表達包括poi的表面可及融合蛋白的細胞結合;在方案結束時是否存在等)。在一些情況下,測量與poi結合的試劑量包括確定試劑與poi的結合是否超過特定結合閾值。因此,在一些情況下,測量量的步驟包括確定試劑是否與poi結合的步驟(例如,與表面可及融合蛋白結合,與表達表面可及融合蛋白的細胞結合等)。在一些情況下,對量進行測量為是否存在試劑提供了單純的“是”或“否”測定結果。

      同樣地,在一些實施例中,測量量包括確定與表面可及融合蛋白結合的試劑量的定量測定值(例如,使用流式細胞測量術、elisa或任何其它可以定量地測量給定方案結束時所存在的(例如,最終洗滌步驟后所存在的)試劑量的方法。所結合試劑的量(含量)可以表示為與特定檢定相關的任意單位(例如,螢光單位,如平均熒光強度(mfi)),或者可以表示為具有規(guī)定單位的絕對值(例如,分子的數(shù)目(例如,mol)、蛋白質分子的數(shù)目、試劑的濃度等)。此外,可以比較定量測量的量(含量)與參考值的量,以導出表示標準化測量量的標準化值。因此,測量量的步驟可以是以定性方式(“存在”與“不存在”;“是,超過預定閾值”與“否,不超過預定閾值”;等)或以定量方式進行檢測。

      如流式細胞測量術和elisa的技術可以用于定性和定量測量步驟。舉例來說,兩種技術均可以用于(例如,以熒光單位,如平均熒光強度(mfi))測定所存在試劑的定量的量,還可以用于單純地確定存在量是否超過特定閾值。

      (iii)識別試劑的方法

      在一些實施例中,本發(fā)明的方法是識別與poi結合的試劑(化合物)(例如,篩檢與poi結合的試劑的測試化合物)的方法。識別與poi結合的試劑的方法包括:在真核細胞(例如,任何目標真核宿主細胞,如哺乳動物細胞、真菌細胞、酵母細胞等)表面上呈現(xiàn)poi,使細胞與試劑接觸,以及(定量地和/或定性地)測量與細胞結合的試劑量。

      在一些情況下,給定表面可及融合蛋白可以呈現(xiàn)于兩種或更多種細胞的表面上(例如,呈現(xiàn)于兩種或更多種單獨種群細胞的細胞表面上),且每種細胞(例如,每一單獨種群的細胞)均與不同試劑接觸。因此,可以篩檢兩種或更多種試劑(例如,試劑庫)以識別哪些(如果存在的話)試劑會與將poi表達為表面可及融合蛋白的細胞結合。

      如上所述,在一些情況下,poi包括抗體的抗原結合域,且試劑(例如,測試試劑)是肽(在一些情況下是已知與抗體結合的肽變體);在一些情況下,poi是針對抗體的表位(或已知表位的變體),且試劑是抗體或抗體的抗原結合域;并且在一些情況下,poi是配位體/受體對的配位體或受體結合區(qū)(或其變體)。在一些所述情況下,方法可以包括誘變步驟(例如,使用任何適宜的方法,如隨機或定點pcr方案)。舉例來說,可以產生兩種或更多種測試試劑(例如,測試試劑庫)(例如,作為彼此變體的兩種或更多種試劑),且試劑可以用于接觸表達本發(fā)明表面可及融合蛋白的細胞,且可以識別與細胞結合的那些試劑。

      在一些情況下,可以控制試劑的濃度,因此將僅識別出那些以特定(或更佳)親和力結合的試劑。在一些情況下,可以使用不同濃度的給定試劑來接觸每種細胞(例如,單獨種群的細胞)。因此,所述方法可以用于確定在不同的試劑濃度下,試劑與給定poi的結合是否得以維持(其例如可以用于估測試劑針對poi的親和力)。舉例來說,可以在10nm、100nm以及1000nm下使用試劑來接觸三種不同的細胞種群,每一細胞種群均表達相同的表面可及融合蛋白??梢栽诿糠N濃度下確定試劑是否結合,且可以估測結合親和力。舉例來說,相比于在1000nm下結合但在100nm或10nm下不結合的試劑,可以說在全部三種濃度下均結合的試劑以更高親和力與給定poi結合。

      在一些情況下,表達表面可及融合蛋白的細胞可以在同一時間(同時)與兩種或更多種試劑接觸,其中試劑彼此有區(qū)別(例如,其中每種試劑具有不同的可檢測標記)。作為說明性實例,給定細胞或給定種群的細胞可以與10種不同的試劑接觸,其中每種試劑包括不同的可檢測標記(例如,不同的熒光標記)。在適當洗滌后,可以(定量地和/或定性地)測量每種可檢測標記的量。舉例來說,可以使用所述方法來匯集多種不同的試劑,以從不與表面可及融合蛋白結合的試劑中識別與表面可及融合蛋白結合的試劑。

      (iv)識別多肽的方法

      在一些實施例中,本發(fā)明的方法是識別與試劑結合的多肽(例如,當試劑以特定濃度存在時與試劑結合的多肽,例如識別以大于或等于預定值的親和力與試劑結合的多肽)的方法。識別與試劑結合的多肽的方法包括在真核細胞(例如,任何目標真核宿主細胞,如哺乳動物細胞、真菌細胞、酵母細胞等)表面上呈現(xiàn)poi。所述方法可以與上文用于識別試劑的方法相同,而這時所使用的可以保持不變(或以特定濃度使用),但試劑用于接觸以下兩種或更多種細胞,其中兩種或更多種細胞中的至少兩種表達(正在呈現(xiàn))呈不同表面可及融合蛋白形式的不同poi??梢?定性地或定量地)測量試劑與每種細胞(或每一種群的細胞)的結合,且可以由此確定兩種或更多種poi中的哪些可以與給定試劑結合(或與給定濃度的給定試劑結合)。

      (v)產生變體多肽的方法

      在一些實施例中,本發(fā)明的方法是產生與試劑結合的變體多肽的方法,所述變體多肽的親和力不同于(例如,大于)衍生出所述變體的多肽的親和力。所述方法包括產生一或多種變體多肽的步驟(例如,使用任何適宜的方法來產生變體,如基于pcr的誘變)。舉例來說,除了將在表面可及融合蛋白的poi部分相差一或多個氨基酸之外,變體多肽將與初始表面可及融合蛋白相同。隨后,測量試劑與所產生變體中的一或多個的結合量將用于識別哪些變體會與試劑結合。

      如上所述,在一些情況下,poi包括抗體的抗原結合域,且試劑(例如,測試試劑)是肽(在一些情況下是已知與抗體結合的肽變體);在一些情況下,poi是針對抗體的表位(或已知表位的變體),且試劑是抗體或抗體的抗原結合域;并且在一些情況下,poi是配位體/受體對的配位體或受體結合區(qū)(或其變體)。在一些所述情況下,方法可以包括誘變步驟(例如,使用任何適宜的方法,如隨機或定點pcr方案)。舉例來說,可以產生兩種或更多種poi(兩種或更多種表面可及融合蛋白)(例如,從而產生表面可及融合蛋白庫)(例如,其中poi是彼此的變體和/或初始poi的變體)。隨后,試劑可以用于接觸表達兩種或更多種表面可及融合蛋白(變體)的細胞(例如,不同種群的細胞),且隨后可以識別與試劑結合的那些poi。

      與上文類似,在一些情況下,可以控制試劑的濃度,因此將僅識別出那些以特定(或更佳)親和力與試劑結合的poi。在一些情況下,可以使用不同濃度的給定試劑來接觸每種細胞(例如,單獨種群的細胞、細胞庫的多種復本等)。因此,所述方法可以用于僅識別當試劑以給定濃度存在時可以與給定試劑結合的那些poi。作為說明性實例,可以(經(jīng)由表達表面可及融合蛋白的接觸細胞)使兩種或更多種不同的poi與給定濃度(例如,100nm)的試劑接觸,且可以識別大量與試劑結合的poi。隨后,可以使用較低濃度的試劑(例如,10nm)重新篩檢poi,以限制所識別poi的數(shù)目。

      針對上文方法中的任一種或全部,可以使用各種對照。舉例來說,具有對照poi(或無poi)的表面可及融合蛋白可以用于向在不存在結合的情況下所預期的信號量提供對照。所屬領域的一般技術人員將輕易地設想所述各種對照,且可以使用任何適宜的對照。

      試劑盒

      還提供所述方法中使用的試劑盒。本發(fā)明的試劑盒可以包括上述表面可及融合蛋白和/或核酸中的任一種。舉例來說,在一些情況下,適合的試劑盒包括上述用于表達表面可及融合蛋白的核酸(例如,重組表達載體),或對表面可及融合蛋白進行編碼的核酸(例如,重組表達載體)。在一些情況下,試劑盒包括兩種或更多種dna核酸(例如,重組表達載體)。

      在一些情況下,試劑盒包括用于表達表面可及融合蛋白的兩種或更多種本發(fā)明的dna核酸(例如,重組表達載體)。試劑盒可以包括:包括對poi進行編碼的核苷酸的核酸、不包括對poi進行編碼的核苷酸的核酸、包括插入對poi進行編碼的核苷酸的插入位點的核酸等。在一些情況下,兩種或更多種dna核酸中的至少兩種包括插入poi的插入位點。

      在一些情況下,由兩種或更多種dna核酸中的至少兩種編碼的合成莖多肽具有不同長度。舉例來說,在一些情況下,由兩種或更多種dna核酸中的至少兩種編碼的莖多肽(例如,合成莖多肽)具有介于以下范圍內的長度:20到100個氨基酸、40個氨基酸到100個氨基酸、101到200個氨基酸、201到300個氨基酸、301到400個氨基酸、401到500個氨基酸、501到600個氨基酸、601到700個氨基酸、701到800個氨基酸、801到900個氨基酸、901到1000個氨基酸、或1001到1500個氨基酸。在一些情況下,由兩種或更多種dna核酸中的至少兩種編碼的合成莖多肽具有不同長度,且各具有介于以下范圍內的長度:20到100個氨基酸、40個氨基酸到100個氨基酸、101到200個氨基酸、201到300個氨基酸、301到400個氨基酸、401到500個氨基酸、501到600個氨基酸、601到700個氨基酸、701到800個氨基酸、801到900個氨基酸、901到1000個氨基酸、或1001到1500個氨基酸。因此,在一些情況下,試劑盒可以包括多種dna核酸(例如,用于表達本發(fā)明的表面可及融合蛋白),其中由多種dna核酸編碼的莖多肽涵蓋一定長度范圍。

      在一些情況下,由兩種或更多種dna核酸中的至少兩種編碼的合成莖多肽具有不同序列(例如,即使其長度相同)。

      作為說明性實例,試劑盒的一種核酸(例如,重組表達)可能對長度介于20到100個氨基酸范圍內的莖多肽進行編碼,且另一種可能對長度介于101到200個氨基酸范圍內的莖多肽進行編碼。換句話說,試劑盒可以具有對多種不同莖多肽(例如,長度和/或序列不同)進行編碼的多種核酸(例如,重組表達載體)。所述試劑盒將允許使用多種不同的表面可及融合蛋白來進行本發(fā)明的方法,即使在一些情況下不同融合蛋白的poi相同。同樣地,在一些情況下,兩種或更多種dna核酸中的至少兩種對以下進行編碼:不同信號多肽、不同標記(和/或標記的不同布置,即對標記進行編碼的核苷酸相對于另一編碼組分的不同定位)和/或不同表面錨定多肽(例如,不同gpi錨定物)。在一些情況下,兩種或更多種dna核酸中的至少兩種具有不同的插入位點。設想上文的任何或所有組合。

      上述試劑盒中的任一種可以進一步包括一或多種額外試劑,其中所述額外試劑可以選自:稀釋緩沖液;復原溶液;洗滌緩沖液;對照試劑;對照表達載體;試劑;具有本發(fā)明核酸的宿主細胞;不具有本發(fā)明核酸的宿主細胞(例如,用于表達表面可及融合蛋白的核酸、對表面可及融合蛋白進行編碼的核酸等)等。本發(fā)明試劑盒的組分可以處于單獨容器中(例如,不同試管、多孔板的不同孔等),且在一些情況下可以組合于單一容器中。

      除了上文組分之外,(在某些實施例中)本發(fā)明的試劑盒還可以進一步包括用于實踐本發(fā)明方法的說明。這些說明可以各種形式存在于本發(fā)明的試劑盒中,所述形式中的一或多種可以存在于試劑盒中??梢猿尸F(xiàn)這些說明的一種形式為適合媒介或基板(例如,上面印刷有信息的紙片)上的印刷信息,其處于試劑盒的包裝中,處于藥品說明書中等。這些說明的另一形式為上面已記錄有信息的計算機可讀媒介,例如磁盤、光盤(cd)、閃存驅動器等??梢猿尸F(xiàn)這些說明到另一形式為網(wǎng)址,可以經(jīng)由因特網(wǎng)使用所述網(wǎng)址在刪除的網(wǎng)站上獲得信息。

      效用

      本文所描述的組合物和方法可以用于研發(fā)新型真菌細胞(例如,新型酵母菌株)以用于各種目的,包括(但不限于)化學品和多肽的發(fā)酵生產。此外,本文所描述的組合物和方法可以用于各種研究目的,包括在酵母上表達誘變的蛋白質或其它組合庫。相比于其它方法,本文所描述的組合物和方法使用單順反子載體,使其能夠用于廣泛多種酵母菌株和種屬。此外,本文所描述的組合物和方法(例如,通過改變莖多肽的長度)來實現(xiàn)目標蛋白的選擇性(“可調式”)可及性,可以對其進行控制以限制底物或結合配偶體的分子量。在真核細胞(例如,真菌細胞、酵母細胞等)表面上表達蛋白質出于各種不同的目的而在業(yè)界得到廣泛使用。本文所描述的組合物和方法允許直接且簡單地表達任何與合成莖多肽融合的所要蛋白質(目標蛋白)。因為可以使用單順反子載體將poi呈現(xiàn)為表面可及融合蛋白的一部分,所以能將系統(tǒng)輕易地移植到各種酵母菌株和種屬中。

      現(xiàn)已充分地描述本發(fā)明,所屬領域的一般技術人員將明白,可以在不脫離本發(fā)明的精神或范圍的情況下作出各種改變和修改。

      實驗

      提出以下實例以便向所屬領域的一般技術人員完整地披露且描述如何制備和使用本發(fā)明,且并不打算限制本發(fā)明人視為其發(fā)明的范圍,也不打算表示下文實驗是所進行的全部或唯一實驗。已努力確保關于所用數(shù)值(例如,量、溫度等)的準確性,但應說明一些實驗誤差和偏差的原因。除非另外指示,否則份數(shù)是重量份,分子量是重量平均分子量,溫度是以攝氏度計,且壓力是大氣壓或接近大氣壓。

      本說明書中所引用的所有公開案和專利申請均以引用的方式并入本文中,就如同各個別公開案或專利申請專門且單獨地指出以引用的方式并入一般。

      本發(fā)明已根據(jù)特定實施例來描述,所述特定實施例由本發(fā)明人發(fā)現(xiàn)或提出以包含實踐本發(fā)明的優(yōu)選方式。所屬領域的技術人員應了解,根據(jù)本發(fā)明,在不脫離本發(fā)明的預定范圍的情況下,可以對舉例說明的特定實施例作出多種修改和改變。舉例來說,由于密碼子冗余,因此可以在不影響蛋白質序列的情況下,對潛在dna序列作出改變。此外,出于生物學功能等效性考量,可以不在種類或量上影響生物學作用的情況下,對蛋白質結構作出改變。希望所有所述修改包括于所附權利要求書的范圍內。

      實例

      實例1

      圖1a-1c描繪了使用長度可變的gpi-錨定“莖多肽”確定是否可以“調節(jié)”可及性而進行的實驗。用于這些實驗的酵母菌株是bj5465。圖1a描繪了肽與酵母細胞表面連接的一個實施例的示意圖:分泌目標蛋白(poi)(此處是改造的sirpa變體cv1)作為表面可及融合蛋白,其中poi與以下融合:(i)信號多肽(其將蛋白質引向分泌路徑,但其可以經(jīng)由翻譯后加工與蛋白質割裂)、(ii)莖多肽(合成序列,其長度可以在廣泛長度范圍內改變)、(iii)gpi錨定物(例如,合成gpi錨定物)以及任選地(iv)表位標記(所示為ha表位標記)。

      圖1b描繪了實驗結果,其顯示莖長度(以氨基酸計)與以下3種不同尺寸(不同分子量)的標記探針的表面染色之間的關系:抗ha抗體(約150kd)、cd47-鏈霉親和素四聚體(約100kd)(其與cv1,即用于這些實驗的poi結合)以及cd47-生物素單體(約15kda)(其同樣與cv1結合)。圖1c描繪了呈現(xiàn)與不同長度莖連接的cv-1的酵母的代表性流式細胞測量圖,所述不同長度莖同時染有抗ha抗體(alexa488)和cd47-生物素單體(alexa647)。測試莖序列的長度(以氨基酸的數(shù)目計)在各圖上方列出。數(shù)據(jù)顯示莖長度可以用于“選擇”特定分子量的化合物。舉例來說,y軸上所描繪的是150kd抗ha抗體的結合,當莖多肽長度為19或41個氨基酸時,其并未很好地結合于表面可及融合多肽,而當莖多肽長度為232、465或649個氨基酸時,發(fā)生結合。相反,即使當莖多肽長度為19個氨基酸時,cd47-生物素(x軸)仍與表面可及融合多肽結合,而當莖多肽長度為41、232、465或649個氨基酸時,結合更牢固。

      圖2a-2b描繪了用于確定本發(fā)明的組合物和方法是否與其它酵母菌株相容而進行的實驗。a)肽與酵母細胞表面連接的示意圖。分泌改造的sirpa變體cv1作為與ha表位標記和長度為649個氨基酸的合成莖以及合成gpi錨定物的融合物(即,cv1是表達為表面可及融合多肽的目標蛋白(poi))。相比于圖1a-1c中所用的bj5465,用于這些實驗的酵母菌株是yvh10。yvh10酵母過度表達酵母蛋白質二硫鍵異構酶(pdi),使得所分泌含有二硫鍵的蛋白質能夠具有更大折疊能力。b)呈現(xiàn)與莖(649個氨基酸)連接的cv-1的yvh10酵母的代表性流式細胞測量圖,所述莖同時染有抗ha抗體(alexa488)和cd47-生物素單體(alexa647)。因此,數(shù)據(jù)顯示,本發(fā)明的組合物和方法實際上與其它酵母菌株相容。

      實例2:針對高親和力pd-1結合的人類pd-l1蛋白的定向演化

      目標:識別以高親和力和特異性與t細胞表達的pd-1結合的pd-l1突變體,由此競爭性地抑制與pd-l1的互動,所述pd-l1表達于腫瘤細胞或腫瘤浸潤免疫細胞的表面上。

      方法:從與pd-1蛋白互動的區(qū)域中選擇人類pd-l1蛋白的穩(wěn)定子單元;選擇可能對這種互動至關重要的氨基酸殘基,且通過pcr和吉布森克隆(gibsoncloning)產生質體庫,所述質體對與連接gpi的錨定物連接的pd-l1突變體進行編碼(根據(jù)本專利中所描述的主要技術);用電穿孔將質體庫導入酵母或真菌菌株中;誘發(fā)突變體蛋白的表面呈現(xiàn);通過評估與標記的可溶性重組pd-1蛋白的互動來選擇高親和力結合子;在分離一片高親和力pd-1結合子后,從所得酵母種群中提取dna,且測定所存在變體的序列;分析序列的結合親和力,且組裝一致的變體序列以使結合親和力達到最大。

      實例3:針對高親和力il-2結合的人類il2rβ可溶性片段的定向演化

      目標:識別以高親和力和特異性與內源性il-2結合的細胞因子受體子單元il2rβ突變體,由此充當阻止il-2與內源性il-2受體復合物互動的競爭性儲集器。

      方法:從與il-2蛋白互動的區(qū)域中選擇人類il2rβ蛋白的穩(wěn)定子單元;選擇可能對這種互動至關重要的氨基酸殘基,且通過pcr和吉布森克隆產生質體庫,所述質體對與連接gpi的錨定物連接的il2rβ突變體進行編碼(根據(jù)本專利中所描述的主要技術);用電穿孔將質體庫導入酵母或真菌菌株中;誘發(fā)突變體蛋白的表面呈現(xiàn);通過評估與標記的可溶性重組子il-2蛋白的互動來選擇高親和力結合子;在分離一片高親和力il-2結合子后,從所得酵母種群中提取dna,且測定所存在變體的序列;分析序列的結合親和力,且組裝一致的變體序列以使結合親和力達到最大。

      實例4:人類抗體庫的酵母表面呈現(xiàn)

      目標:出于產生針對任何已知的細胞表面或分泌蛋白的高親和力、高特異性治療性人類單克隆抗體的目的,在酵母表面上將人類抗體結合域表達為抗原結合片段(fab)或單鏈可變片段(scfv)。

      方法:通過基因合成產生質體庫,所述質體對與連接gpi的錨定物融合的人類抗體結合區(qū)變體(呈fab或scfv形式)進行編碼(根據(jù)本專利中所描述的主要技術);用電穿孔將質體庫導入酵母或真菌菌株中;誘發(fā)抗體片段的表面呈現(xiàn);通過評估與標記的可溶性重組蛋白(其相當于蛋白質結合的所要區(qū)域)的互動來選擇高親和力結合子(例如,為了產生將與pd-1結合并阻止其與pd-l1互動的治療性抗體,將使用包括與pd-l1的互動區(qū)域的pd-1標記片段來淘選庫);在分離一片高親和力結合子后,從所得酵母種群中提取dna,且測定所存在抗體變體的序列;分析作為重組抗體的個別序列的結合親和力。

      實例5:替代性架構庫的酵母表面呈現(xiàn)

      目標:出于產生針對任何已知的細胞表面或分泌蛋白的高親和力、高特異性治療性人類單克隆抗體的目的,在酵母表面上表達替代性架構庫,其包括(但不限于)纖連蛋白、免疫球蛋白、打結素、達爾潘蛋白(darpin)、抗運載蛋白。

      方法:通過基因合成產生質體庫,所述質體對與連接gpi的錨定物融合的人類抗體結合區(qū)變體(呈fab或scfv形式)進行編碼(根據(jù)本專利中所描述的主要技術);用電穿孔將質體庫導入酵母或真菌菌株中;誘發(fā)替代性架構蛋白的表面呈現(xiàn);通過評估與標記的可溶性重組蛋白(其相當于蛋白質結合的所要區(qū)域)的互動來選擇高親和力結合子(例如,為了產生將與pd-1結合并阻止其與pd-l1互動的治療性替代架構蛋白質,將使用包括與pd-l1的互動區(qū)域的pd-1標記片段來淘選庫);在分離一片高親和力結合子后,從所得酵母種群中提取dna,且測定所存在替代性架構的序列;分析作為重組蛋白的個別序列的結合親和力。

      實例6:對翻譯的cdna進行酵母表面呈現(xiàn)從而以無偏性方式識別目標標靶的互動蛋白質

      目標:出于淘選目標蛋白以基于與目標蛋白的結合來識別新的互動配偶體的目的,在酵母表面上表達由cdna集合編碼的蛋白質,例如來自腫瘤衍生的細胞系或正常細胞類型。

      方法:通過基因合成產生質體庫,所述質體對與連接gpi的錨定物融合的目標細胞類型所衍生的cdna進行編碼(根據(jù)本專利中所描述的主要技術);用電穿孔將質體庫導入酵母或真菌菌株中;誘發(fā)替代性架構蛋白的表面呈現(xiàn);通過評估與標記的可溶性目標重組蛋白的互動來選擇高親和力結合子;在分離一片對與目標蛋白互動的蛋白質進行表達的酵母后,從所得酵母種群中提取dna,且測定所存在替代性架構的序列以識別負責cdna。

      序列表

      <110>阿龍·m·林

      安德魯·c·克魯瑟

      阿施施·曼格里克

      <120>用于在細胞表面上表達多肽的組合物和方法

      <130>stan-1154wo

      <150>us62/077,756

      <151>2014-11-10

      <160>71

      <170>patentinversion3.5

      <210>1

      <211>258

      <212>dna

      <213>人工序列

      <220>

      <223>合成序列

      <400>1

      atgagattcccatctatcttcaccgctgttttgttcgctgcttcttctgctttggctgct60

      ccagctaacaccaccaccgaagacgaaaccgctcaaatcccagctgaagctgttatcgac120

      tactctgacttggaaggtgacttcgacgctgctgctttgccattgtctaactctaccaac180

      aacggtttgtcttctaccaacaccaccatcgcttctatcgctgctaaggaagaaggtgtt240

      caattggacaagagagaa258

      <210>2

      <211>357

      <212>dna

      <213>人工序列

      <220>

      <223>合成序列

      <400>2

      gaggaggagctgcagattattcagcctgacaagtccgtgttggttgcagctggagagaca60

      gccactctgcgctgcactattacctctctgtttcctgtggggcccatccagtggttcaga120

      ggagctggaccaggccgggtattaatctacaatcaaaggcagggccccttcccccgggta180

      acaactgtttcagacactacaaagagaaacaacatggacttttccatccgcatcggtaac240

      atcaccccagcagatgccggcacctactactgtattaagttccggaaagggagccccgat300

      gacgtggagtttaagtctggagcaggcactgagctgtctgtgcgcgccaaaccctct357

      <210>3

      <211>27

      <212>dna

      <213>人工序列

      <220>

      <223>合成序列

      <400>3

      tacccatacgatgttccagattacgct27

      <210>4

      <211>1947

      <212>dna

      <213>人工序列

      <220>

      <223>合成序列

      <400>4

      caaacatcctcaccctctacagaagcatcagtatcaacctctagtacctcttcctctgct60

      tcacaatcatctgacccaactacaacatcttcgtccagttcatcgtcttccccatcttcc120

      caatctgaggaaatttcatcatcaccgacggtctcaactacaccatcaacttcttcatca180

      tcttcctcaatgacttcaaccaccacaacaaagtcaatctcaacttccactacaagttca240

      gctccagttacagatgtgacagtttcctcatcgcctagtaaatctacctctacttcgaca300

      agtacagaaacatctaaaacacctacttcaatgacagagtatacatctagtacatcgata360

      atttcgactccagttagtcactcgcagacaggtttgtcggcttcatcaagttcatcatct420

      acaacatccggttcttcgtccactaaatcagaaagttcgacaacatctggctcttcccag480

      tccgtggaatcaacctccagccacgccactgttcttgctaattccgcagaaatggtcaca540

      acatcctctagttcatcctcaacatccgaaatgtcattaactagtactgctaccagtgta600

      ccagtctcatctagtagcagtacgacatattctactagcgcatctacacaagccgtcact660

      acaacatcttcttccactgtatctacaacttcttctagtacaacgttaacaagcgcattc720

      acacattcttcaaccacatcgtccgaccagccacccagcgacactacaagtccatctacg780

      acacacgaacctcatgtaaccactcagacgtcatcagaaacatcttcttctaagtcatct840

      tctacttcttcttcaagtacatctcaaacctctgagtctgcaacaccatccgattccgta900

      tcacctggaagttctacatcaacatcttctagtagcacttctacttccacttctatttcc960

      agtggagaaacgacaacttcttcttcttcatcatctgccacgaccacttctaacagcgca1020

      accttgtcagtctctaccacacaaacttcgattgaagccagttcatctactacatctaca1080

      tctagttcaacaattacaacttcaagtagtagcgctcacatatcgtcgaaatctcaatct1140

      agtattacctatccctcttcctcgacatcttcatctacatcgtcctcaatttctagcgaa1200

      tctgaaagttttgaatcgacatcagcagaagatgctccatcaacagcaccttcatcaagt1260

      gtctcttctaagagttctacctctacaacatcaagcacatcgacatcttcaagcactcca1320

      tctccatcaccatcttccgtgagttcttcctccaccagctcattgacaacttctgctgta1380

      tcaacaccagctacctctcattctcaaagtactgtagtaaccaccactactattactaca1440

      tcaacaggtccagtgatgtctacgacaacagcttattcttctagttctactagcagctcg1500

      gaatcttctgaggttcagtctgtcatgtcatctacgcctagttcaacatcaacaacaacc1560

      agttcggaatctacttcatctagctccacagcttctacctcaccatcaacctcgcaaact1620

      ttcgaaacttctcctactataggaggtgtcccctcaaccacttcatttgtctctacgcca1680

      acaacgaaattgtcgcacactacttccactatgacagcacagtccgatagtaagtctacc1740

      cactcctcaagcacatcgacagaagataaatcatccactgcttctgcagttgacgaaagc1800

      actacaacatccacttccacggagtctactacatcagtaacatcaggcacctcccattcc1860

      gctaaagaatcttcgtcaaattctaaggtgtatagttcacagacagcacactcatccata1920

      agtgttgcatcatcacctagtacaaag1947

      <210>5

      <211>111

      <212>dna

      <213>人工序列

      <220>

      <223>合成序列

      <400>5

      caaatccaatcttctatggttgaaatctctacctacgctggttctgctaactctgttaac60

      gctggtgctggtgctggtgctttgttcttgttgttgtctttggctatcatc111

      <210>6

      <211>8584

      <212>dna

      <213>人工序列

      <220>

      <223>合成序列

      <400>6

      ggtacccgacaggttatcagcaacaacacagtcatatccattctcaattagctctaccac60

      agtgtgtgaaccaatgtatccagcaccacctgtaaccaaaacaattttagaagtactttc120

      actttgtaactgagctgtcatttatattgaattttcaaaaattcttactttttttttgga180

      tggacgcaaagaagtttaataatcatattacatggcattaccaccatatacatatccata240

      tacatatccatatctaatcttacttatatgttgtggaaatgtaaagagccccattatctt300

      agcctaaaaaaaccttctctttggaactttcagtaatacgcttaactgctcattgctata360

      ttgaagtacggattagaagccgccgagcgggtgacagccctccgaaggaagactctcctc420

      cgtgcgtcctcgtcttcaccggtcgcgttcctgaaacgcagatgtgcctcgcgccgcact480

      gctccgaacaataaagattctacaatactagcttttatggttatgaagaggaaaaattgg540

      cagtaacctggccccacaaaccttcaaatgaacgaatcaaattaacaaccataggatgat600

      aatgcgattagttttttagccttatttctggggtaattaatcagcgaagcgatgattttt660

      gatctattaacagatatataaatgcaaaaactgcataaccactttaactaatactttcaa720

      cattttcggtttgtattacttcttattcaaatgtaataaaagtatcaacaaaaaattgtt780

      aatatacctctatactttaacgtcaaggagaaaaaaccccggatcgaattcaaccctcac840

      taaagggcggccgccatgagattcccatctatcttcaccgctgttttgttcgctgcttct900

      tctgctttggctgctccagctaacaccaccaccgaagacgaaaccgctcaaatcccagct960

      gaagctgttatcgactactctgacttggaaggtgacttcgacgctgctgctttgccattg1020

      tctaactctaccaacaacggtttgtcttctaccaacaccaccatcgcttctatcgctgct1080

      aaggaagaaggtgttcaattggacaagagagaagctagcgcagaggaggagctgcagatt1140

      attcagcctgacaagtccgtgttggttgcagctggagagacagccactctgcgctgcact1200

      attacctctctgtttcctgtggggcccatccagtggttcagaggagctggaccaggccgg1260

      gtattaatctacaatcaaaggcagggccccttcccccgggtaacaactgtttcagacact1320

      acaaagagaaacaacatggacttttccatccgcatcggtaacatcaccccagcagatgcc1380

      ggcacctactactgtattaagttccggaaagggagccccgatgacgtggagtttaagtct1440

      ggagcaggcactgagctgtctgtgcgcgccaaaccctctggatcctacccatacgatgtt1500

      ccagattacgctcaaacatcctcaccctctacagaagcatcagtatcaacctctagtacc1560

      tcttcctctgcttcacaatcatctgacccaactacaacatcttcgtccagttcatcgtct1620

      tccccatcttcccaatctgaggaaatttcatcatcaccgacggtctcaactacaccatca1680

      acttcttcatcatcttcctcaatgacttcaaccaccacaacaaagtcaatctcaacttcc1740

      actacaagttcagctccagttacagatgtgacagtttcctcatcgcctagtaaatctacc1800

      tctacttcgacaagtacagaaacatctaaaacacctacttcaatgacagagtatacatct1860

      agtacatcgataatttcgactccagttagtcactcgcagacaggtttgtcggcttcatca1920

      agttcatcatctacaacatccggttcttcgtccactaaatcagaaagttcgacaacatct1980

      ggctcttcccagtccgtggaatcaacctccagccacgccactgttcttgctaattccgca2040

      gaaatggtcacaacatcctctagttcatcctcaacatccgaaatgtcattaactagtact2100

      gctaccagtgtaccagtctcatctagtagcagtacgacatattctactagcgcatctaca2160

      caagccgtcactacaacatcttcttccactgtatctacaacttcttctagtacaacgtta2220

      acaagcgcattcacacattcttcaaccacatcgtccgaccagccacccagcgacactaca2280

      agtccatctacgacacacgaacctcatgtaaccactcagacgtcatcagaaacatcttct2340

      tctaagtcatcttctacttcttcttcaagtacatctcaaacctctgagtctgcaacacca2400

      tccgattccgtatcacctggaagttctacatcaacatcttctagtagcacttctacttcc2460

      acttctatttccagtggagaaacgacaacttcttcttcttcatcatctgccacgaccact2520

      tctaacagcgcaaccttgtcagtctctaccacacaaacttcgattgaagccagttcatct2580

      actacatctacatctagttcaacaattacaacttcaagtagtagcgctcacatatcgtcg2640

      aaatctcaatctagtattacctatccctcttcctcgacatcttcatctacatcgtcctca2700

      atttctagcgaatctgaaagttttgaatcgacatcagcagaagatgctccatcaacagca2760

      ccttcatcaagtgtctcttctaagagttctacctctacaacatcaagcacatcgacatct2820

      tcaagcactccatctccatcaccatcttccgtgagttcttcctccaccagctcattgaca2880

      acttctgctgtatcaacaccagctacctctcattctcaaagtactgtagtaaccaccact2940

      actattactacatcaacaggtccagtgatgtctacgacaacagcttattcttctagttct3000

      actagcagctcggaatcttctgaggttcagtctgtcatgtcatctacgcctagttcaaca3060

      tcaacaacaaccagttcggaatctacttcatctagctccacagcttctacctcaccatca3120

      acctcgcaaactttcgaaacttctcctactataggaggtgtcccctcaaccacttcattt3180

      gtctctacgccaacaacgaaattgtcgcacactacttccactatgacagcacagtccgat3240

      agtaagtctacccactcctcaagcacatcgacagaagataaatcatccactgcttctgca3300

      gttgacgaaagcactacaacatccacttccacggagtctactacatcagtaacatcaggc3360

      acctcccattccgctaaagaatcttcgtcaaattctaaggtgtatagttcacagacagca3420

      cactcatccataagtgttgcatcatcacctagtacaaagggcgcccaaatccaatcttct3480

      atggttgaaatctctacctacgctggttctgctaactctgttaacgctggtgctggtgct3540

      ggtgctttgttcttgttgttgtctttggctatcatctaatgattaattaactcgagatct3600

      gataacaacagtgtagatgtaacaaaatcgactttgttcccactgtacttttagctcgta3660

      caaaatacaatatacttttcatttctccgtaaacaacatgttttcccatgtaatatcctt3720

      ttctatttttcgttccgttaccaactttacacatactttatatagctattcacttctata3780

      cactaaaaaactaagacaattttaattttgctgcctgccatatttcaatttgttataaat3840

      tcctataatttatcctattagtagctaaaaaaagatgaatgtgaatcgaatcctaagaga3900

      attgagctccaattcgccctatagtgagtcgtattacaattcactggccgtcgttttaca3960

      acgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccc4020

      cttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcg4080

      cagcctgaatggcgaatggcgcgacgcgccctgtagcggcgcattaagcgcggcgggtgt4140

      ggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgc4200

      tttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggg4260

      gctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgatta4320

      gggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgtt4380

      ggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctat4440

      ctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaa4500

      tgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgtttacaatttc4560

      ctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcaggcaagtgcac4620

      aaacaatacttaaataaatactactcagtaataacctatttcttagcatttttgacgaaa4680

      tttgctattttgttagagtcttttacaccatttgtctccacacctccgcttacatcaaca4740

      ccaataacgccatttaatctaagcgcatcaccaacattttctggcgtcagtccaccagct4800

      aacataaaatgtaagctttcggggctctcttgccttccaacccagtcagaaatcgagttc4860

      caatccaaaagttcacctgtcccacctgcttctgaatcaaacaagggaataaacgaatga4920

      ggtttctgtgaagctgcactgagtagtatgttgcagtcttttggaaatacgagtctttta4980

      ataactggcaaaccgaggaactcttggtattcttgccacgactcatctccatgcagttgg5040

      acgatatcaatgccgtaatcattgaccagagccaaaacatcctccttaggttgattacga5100

      aacacgccaaccaagtatttcggagtgcctgaactatttttatatgcttttacaagactt5160

      gaaattttccttgcaataaccgggtcaattgttctctttctattgggcacacatataata5220

      cccagcaagtcagcatcggaatctagagcacattctgcggcctctgtgctctgcaagccg5280

      caaactttcaccaatggaccagaactacctgtgaaattaataacagacatactccaagct5340

      gcctttgtgtgcttaatcacgtatactcacgtgctcaatagtcaccaatgccctccctct5400

      tggccctctccttttcttttttcgaccgaattaattcttaatcggcaaaaaaagaaaagc5460

      tccggatcaagattgtacgtaaggtgacaagctatttttcaataaagaatatcttccact5520

      actgccatctggcgtcataactgcaaagtacacatatattacgatgctgtctattaaatg5580

      cttcctatattatatatatagtaatgtcgtttatggtgcactctcagtacaatctgctct5640

      gatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgg5700

      gcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatg5760

      tgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgc5820

      ctatttttataggttaatgtcatgataataatggtttcttaggacggatcgcttgcctgt5880

      aacttacacgcgcctcgtatcttttaatgatggaataatttgggaatttactctgtgttt5940

      atttatttttatgttttgtatttggattttagaaagtaaataaagaaggtagaagagtta6000

      cggaatgaagaaaaaaaaataaacaaaggtttaaaaaatttcaacaaaaagcgtacttta6060

      catatatatttattagacaagaaaagcagattaaatagatatacattcgattaacgataa6120

      gtaaaatgtaaaatcacaggattttcgtgtgtggtcttctacacagacaagatgaaacaa6180

      ttcggcattaatacctgagagcaggaagagcaagataaaaggtagtatttgttggcgatc6240

      cccctagagtcttttacatcttcggaaaacaaaaactattttttctttaatttctttttt6300

      tactttctatttttaatttatatatttatattaaaaaatttaaattataattatttttat6360

      agcacgtgatgaaaaggacccaggtggcacttttcggggaaatgtgcgcggaacccctat6420

      ttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgata6480

      aatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgccct6540

      tattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaa6600

      agtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaa6660

      cagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttt6720

      taaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcgg6780

      tcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagca6840

      tcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataa6900

      cactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgctttttt6960

      tcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagc7020

      cataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaa7080

      actattaactggcgaactacttactctagcttcccggcaacaattaatagactggatgga7140

      ggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgc7200

      tgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccaga7260

      tggtaagccctcccgtatcgtagttatctacacgacgggcagtcaggcaactatggatga7320

      acgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcaga7380

      ccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggat7440

      ctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgtt7500

      ccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttct7560

      gcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgcc7620

      ggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagatacc7680

      aaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcacc7740

      gcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtc7800

      gtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctg7860

      aacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagata7920

      cctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggta7980

      tccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggggggaacgc8040

      ctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtg8100

      atgctcgtcaggggggccgagcctatggaaaaacgccagcaacgcggcctttttacggtt8160

      cctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgt8220

      ggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccga8280

      gcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccc8340

      cgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcggg8400

      cagtgagcgcaacgcaattaatgtgagttacctcactcattaggcaccccaggctttaca8460

      ctttatgcttccggctcctatgttgtgtggaattgtgagcggataacaatttcacacagg8520

      aaacagctatgaccatgattacgccaagctcggaattaaccctcactaaagggaacaaaa8580

      gctg8584

      <210>7

      <211>119

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>7

      gluglugluleuglnileileglnproasplysservalleuvalala

      151015

      alaglygluthralathrleuargcysthrilethrserleuphepro

      202530

      valglyproileglntrppheargglyalaglyproglyargvalleu

      354045

      iletyrasnglnargglnglypropheproargvalthrthrvalser

      505560

      aspthrthrlysargasnasnmetasppheserileargileglyasn

      65707580

      ilethrproalaaspalaglythrtyrtyrcysilelysphearglys

      859095

      glyserproaspaspvalgluphelysserglyalaglythrgluleu

      100105110

      servalargalalysproser

      115

      <210>8

      <211>9

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>8

      tyrprotyraspvalproasptyrala

      15

      <210>9

      <211>907

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>9

      metargpheproserilephethralavalleuphealaalaserser

      151015

      alaleualaalaproalaasnthrthrthrgluaspgluthralagln

      202530

      ileproalaglualavalileasptyrseraspleugluglyaspphe

      354045

      aspalaalaalaleuproleuserasnserthrasnasnglyleuser

      505560

      serthrasnthrthrilealaserilealaalalysglugluglyval

      65707580

      glnleuasplysargglualaseralagluglugluleuglnileile

      859095

      glnproasplysservalleuvalalaalaglygluthralathrleu

      100105110

      argcysthrilethrserleupheprovalglyproileglntrpphe

      115120125

      argglyalaglyproglyargvalleuiletyrasnglnargglngly

      130135140

      propheproargvalthrthrvalseraspthrthrlysargasnasn

      145150155160

      metasppheserileargileglyasnilethrproalaaspalagly

      165170175

      thrtyrtyrcysilelysphearglysglyserproaspaspvalglu

      180185190

      phelysserglyalaglythrgluleuservalargalalysproser

      195200205

      glysertyrprotyraspvalproasptyralaglnthrserserpro

      210215220

      serthrglualaservalserthrserserthrserserseralaser

      225230235240

      glnserseraspprothrthrthrserserserserserserserser

      245250255

      proserserglnserglugluileserserserprothrvalserthr

      260265270

      thrproserthrsersersersersersermetthrserthrthrthr

      275280285

      thrlysserileserthrserthrthrserseralaprovalthrasp

      290295300

      valthrvalserserserproserlysserthrserthrserthrser

      305310315320

      thrgluthrserlysthrprothrsermetthrglutyrthrserser

      325330335

      thrserileileserthrprovalserhisserglnthrglyleuser

      340345350

      alaserserserserserserthrthrserglyserserserthrlys

      355360365

      sergluserserthrthrserglyserserglnservalgluserthr

      370375380

      serserhisalathrvalleualaasnseralaglumetvalthrthr

      385390395400

      serserserserserserthrserglumetserleuthrserthrala

      405410415

      thrservalprovalserserserserserthrthrtyrserthrser

      420425430

      alaserthrglnalavalthrthrthrserserserthrvalserthr

      435440445

      thrserserserthrthrleuthrseralaphethrhisserserthr

      450455460

      thrserseraspglnproproseraspthrthrserproserthrthr

      465470475480

      hisgluprohisvalthrthrglnthrsersergluthrserserser

      485490495

      lysserserserthrserserserserthrserglnthrsergluser

      500505510

      alathrproseraspservalserproglyserserthrserthrser

      515520525

      serserserthrserthrserthrserileserserglygluthrthr

      530535540

      thrserserserserserseralathrthrthrserasnseralathr

      545550555560

      leuservalserthrthrglnthrserileglualaserserserthr

      565570575

      thrserthrserserserthrilethrthrserserserseralahis

      580585590

      ileserserlysserglnserserilethrtyrproserserserthr

      595600605

      serserserthrserserserileserserglusergluserpheglu

      610615620

      serthrseralagluaspalaproserthralaproserserserval

      625630635640

      serserlysserserthrserthrthrserserthrserthrserser

      645650655

      serthrproserproserproserservalserserserserthrser

      660665670

      serleuthrthrseralavalserthrproalathrserhissergln

      675680685

      serthrvalvalthrthrthrthrilethrthrserthrglyproval

      690695700

      metserthrthrthralatyrserserserserthrserserserglu

      705710715720

      sersergluvalglnservalmetserserthrproserserthrser

      725730735

      thrthrthrsersergluserthrserserserserthralaserthr

      740745750

      serproserthrserglnthrphegluthrserprothrileglygly

      755760765

      valproserthrthrserphevalserthrprothrthrlysleuser

      770775780

      histhrthrserthrmetthralaglnseraspserlysserthrhis

      785790795800

      serserserthrserthrgluasplysserserthralaseralaval

      805810815

      aspgluserthrthrthrserthrserthrgluserthrthrserval

      820825830

      thrserglythrserhisseralalysgluserserserasnserlys

      835840845

      valtyrserserglnthralahisserserileservalalaserser

      850855860

      proserthrlysglyalaglnileglnsersermetvalgluileser

      865870875880

      thrtyralaglyseralaasnservalasnalaglyalaglyalagly

      885890895

      alaleupheleuleuleuserleualaileile

      900905

      <210>10

      <211>910

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>10

      metargpheproserilephethralavalleuphealaalaserser

      151015

      alaleualaalaproalaasnthrthrthrgluaspgluthralagln

      202530

      ileproalaglualavalileasptyrseraspleugluglyaspphe

      354045

      aspalaalaalaleuproleuserasnserthrasnasnglyleuser

      505560

      serthrasnthrthrilealaserilealaalalysglugluglyval

      65707580

      glnleuasplysargglualaseralagluglugluleuglnileile

      859095

      glnproasplysservalleuvalalaalaglygluthralathrleu

      100105110

      argcysthrilethrserleupheprovalglyproileglntrpphe

      115120125

      argglyalaglyproglyargvalleuiletyrasnglnargglngly

      130135140

      propheproargvalthrthrvalseraspthrthrlysargasnasn

      145150155160

      metasppheserileargileglyasnilethrproalaaspalagly

      165170175

      thrtyrtyrcysilelysphearglysglyserproaspaspvalglu

      180185190

      phelysserglyalaglythrgluleuservalargalalysproser

      195200205

      glysertyrprotyraspvalproasptyralaglnthrserserpro

      210215220

      serthrglualaservalserthrserserthrserserseralaser

      225230235240

      glnserseraspprothrthrthrserserserserserserserser

      245250255

      proserserglnserglugluileserserserprothrvalserthr

      260265270

      thrproserthrsersersersersersermetthrserthrthrthr

      275280285

      thrlysserileserthrserthrthrserseralaprovalthrasp

      290295300

      valthrvalserserserproserlysserthrserthrserthrser

      305310315320

      thrgluthrserlysthrprothrsermetthrglutyrthrserser

      325330335

      thrserileileserthrprovalserhisserglnthrglyleuser

      340345350

      alaserserserserserserthrthrserglyserserserthrlys

      355360365

      sergluserserthrthrserglyserserglnservalgluserthr

      370375380

      serserhisalathrvalleualaasnseralaglumetvalthrthr

      385390395400

      serserserserserserthrserglumetserleuthrserthrala

      405410415

      thrservalprovalserserserserserthrthrtyrserthrser

      420425430

      alaserthrglnalavalthrthrthrserserserthrvalserthr

      435440445

      thrserserserthrthrleuthrseralaphethrhisserserthr

      450455460

      thrserseraspglnproproseraspthrthrserproserthrthr

      465470475480

      hisgluprohisvalthrthrglnthrsersergluthrserserser

      485490495

      lysserserserthrserserserserthrserglnthrsergluser

      500505510

      alathrproseraspservalserproglyserserthrserthrser

      515520525

      serserserthrserthrserthrserileserserglygluthrthr

      530535540

      thrserserserserserseralathrthrthrserasnseralathr

      545550555560

      leuservalserthrthrglnthrserileglualaserserserthr

      565570575

      thrserthrserserserthrilethrthrserserserseralahis

      580585590

      ileserserlysserglnserserilethrtyrproserserserthr

      595600605

      serserserthrserserserileserserglusergluserpheglu

      610615620

      serthrseralagluaspalaproserthralaproserserserval

      625630635640

      serserlysserserthrserthrthrserserthrserthrserser

      645650655

      serthrproserproserproserservalserserserserthrser

      660665670

      serleuthrthrseralavalserthrproalathrserhissergln

      675680685

      serthrvalvalthrthrthrthrilethrthrserthrglyproval

      690695700

      metserthrthrthralatyrserserserserthrserserserglu

      705710715720

      sersergluvalglnservalmetserserthrproserserthrser

      725730735

      thrthrthrsersergluserthrserserserserthralaserthr

      740745750

      serproserthrserglnthrphegluthrserprothrileglygly

      755760765

      valproserthrthrserphevalserthrprothrthrlysleuser

      770775780

      histhrthrserthrmetthralaglnseraspserlysserthrhis

      785790795800

      serserserthrserthrgluasplysserserthralaseralaval

      805810815

      aspgluserthrthrthrserthrserthrgluserthrthrserval

      820825830

      thrserglythrserhisseralalysgluserserserasnserlys

      835840845

      valtyrserserglnthralahisserserileservalalaserser

      850855860

      proserthrlysglyalaileglnglnasnphethrserthrserleu

      865870875880

      metileserthrtyrgluglylysalaserilephepheseralaglu

      885890895

      leuglyserileilepheleuleuleusertyrleuleuphe

      900905910

      <210>11

      <211>87

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>11

      metargpheproserilephethralavalleuphealaalaserser

      151015

      alaleualaalaproalaasnthrthrthrgluaspgluthralagln

      202530

      ileproalaglualavalileasptyrseraspleugluglyaspphe

      354045

      aspalaalaalaleuproleuserasnserthrasnasnglyleuser

      505560

      serthrasnthrthrilealaserilealaalalysglugluglyval

      65707580

      glnleuasplysarggluala

      85

      <210>12

      <211>20

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>12

      metargpheproserilephethralavalleuphealaalaserser

      151015

      alaleualaala

      20

      <210>13

      <211>19

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>13

      metglnleuleuargcyspheserilepheservalilealaserval

      151015

      leualagln

      <210>14

      <211>18

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>14

      metphelysservalvaltyrserileleualaalaserleualaasn

      151015

      alagly

      <210>15

      <211>20

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>15

      metleuleuglnalapheleupheleuleualaglyphealaalalys

      151015

      ileseralaser

      20

      <210>16

      <211>22

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>16

      metasnpheserargilephephephevalphealacysleuthrala

      151015

      leualametvalasnala

      20

      <210>17

      <211>19

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>17

      metargalapheleualaleuilepheleuthrphevalmetasnval

      151015

      gluserser

      <210>18

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>18

      000

      <210>19

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>19

      000

      <210>20

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>20

      000

      <210>21

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>21

      000

      <210>22

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>22

      000

      <210>23

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>23

      000

      <210>24

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>24

      000

      <210>25

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>25

      000

      <210>26

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>26

      000

      <210>27

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>27

      000

      <210>28

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>28

      000

      <210>29

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>29

      000

      <210>30

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>30

      000

      <210>31

      <211>19

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>31

      glyglyglyglyserglyglyglyglyserglyserthrglyglygly

      151015

      glyglyser

      <210>32

      <211>41

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>32

      glnthrserserproserargglualaservalserthrserserthr

      151015

      serserseralaserglnserseraspprothrthrthrserserser

      202530

      thrvalserthrproalathrglyala

      3540

      <210>33

      <211>232

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>33

      glnthrserserproserthrglualaservalserthrserserthr

      151015

      serserseralaserglnserseraspprothrthrthrserserser

      202530

      serserserserserproserserglnserglugluileserserser

      354045

      prothrvalserthrthrproserthrsersersersersersermet

      505560

      thrserthrthrthrthrlysserileserthrserthrthrserser

      65707580

      alaprovalthraspvalthrvalserserserproserlysserthr

      859095

      serthrserthrserthrgluthrserlysthrprothrsermetthr

      100105110

      glutyrthrserserthrserileileserthrprovalserhisser

      115120125

      glnthrglyleuseralaserserserserserserthrthrsergly

      130135140

      serserserthrlyssergluserserthrthrserglysersergln

      145150155160

      servalgluserthrserserhisalathrvalleualaasnserala

      165170175

      glumetvalthrthrserserserserserserthrserglumetser

      180185190

      leuthrserthralathrservalprovalserserserserserthr

      195200205

      thrtyrserthrseralaserthrglnalavalthrthrthrserser

      210215220

      serthrvalserthrthrserser

      225230

      <210>34

      <211>465

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>34

      glnthrserserproserthrglualaservalserthrserserthr

      151015

      serserseralaserglnserseraspprothrthrthrserserser

      202530

      serserserserserproserserglnserglugluileserserser

      354045

      prothrvalserthrthrproserthrsersersersersersermet

      505560

      thrserthrthrthrthrlysserileserthrserthrthrserser

      65707580

      alaprovalthraspvalthrvalserserserproserlysserthr

      859095

      serthrserthrserthrgluthrserlysthrprothrsermetthr

      100105110

      glutyrthrserserthrserileileserthrprovalserhisser

      115120125

      glnthrglyleuseralaserserserserserserthrthrsergly

      130135140

      serserserthrlyssergluserserthrthrserglysersergln

      145150155160

      servalgluserthrserserhisalathrvalleualaasnserala

      165170175

      glumetvalthrthrserserserserserserthrserglumetser

      180185190

      leuthrserthralathrservalprovalserserserserserthr

      195200205

      thrtyrserthrseralaserthrglnalavalthrthrthrserser

      210215220

      serthrvalserthrthrserserserthrthrleuthrseralaphe

      225230235240

      thrhisserserthrthrserseraspglnproproseraspthrthr

      245250255

      serproserthrthrhisgluprohisvalthrthrglnthrserser

      260265270

      gluthrserserserlysserserserthrserserserserthrser

      275280285

      glnthrsergluseralathrproseraspservalserproglyser

      290295300

      serthrserthrserserserserthrserthrserthrserileser

      305310315320

      serglygluthrthrthrserserserserserseralathrthrthr

      325330335

      serasnseralathrleuservalserthrthrglnthrserileglu

      340345350

      alaserserserthrthrserthrserserserthrilethrthrser

      355360365

      serserseralahisileserserlysserglnserserilethrtyr

      370375380

      proserserserthrserserserthrserserserileserserglu

      385390395400

      sergluserphegluserthrseralagluaspalaproserthrala

      405410415

      proserserservalserserlysserserthrserthrthrserser

      420425430

      thrserthrserserserthrproserproserproserservalser

      435440445

      serserserthrserserleuthrthrseralavalserthrproala

      450455460

      thr

      465

      <210>35

      <211>649

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>35

      glnthrserserproserthrglualaservalserthrserserthr

      151015

      serserseralaserglnserseraspprothrthrthrserserser

      202530

      serserserserserproserserglnserglugluileserserser

      354045

      prothrvalserthrthrproserthrsersersersersersermet

      505560

      thrserthrthrthrthrlysserileserthrserthrthrserser

      65707580

      alaprovalthraspvalthrvalserserserproserlysserthr

      859095

      serthrserthrserthrgluthrserlysthrprothrsermetthr

      100105110

      glutyrthrserserthrserileileserthrprovalserhisser

      115120125

      glnthrglyleuseralaserserserserserserthrthrsergly

      130135140

      serserserthrlyssergluserserthrthrserglysersergln

      145150155160

      servalgluserthrserserhisalathrvalleualaasnserala

      165170175

      glumetvalthrthrserserserserserserthrserglumetser

      180185190

      leuthrserthralathrservalprovalserserserserserthr

      195200205

      thrtyrserthrseralaserthrglnalavalthrthrthrserser

      210215220

      serthrvalserthrthrserserserthrthrleuthrseralaphe

      225230235240

      thrhisserserthrthrserseraspglnproproseraspthrthr

      245250255

      serproserthrthrhisgluprohisvalthrthrglnthrserser

      260265270

      gluthrserserserlysserserserthrserserserserthrser

      275280285

      glnthrsergluseralathrproseraspservalserproglyser

      290295300

      serthrserthrserserserserthrserthrserthrserileser

      305310315320

      serglygluthrthrthrserserserserserseralathrthrthr

      325330335

      serasnseralathrleuservalserthrthrglnthrserileglu

      340345350

      alaserserserthrthrserthrserserserthrilethrthrser

      355360365

      serserseralahisileserserlysserglnserserilethrtyr

      370375380

      proserserserthrserserserthrserserserileserserglu

      385390395400

      sergluserphegluserthrseralagluaspalaproserthrala

      405410415

      proserserservalserserlysserserthrserthrthrserser

      420425430

      thrserthrserserserthrproserproserproserservalser

      435440445

      serserserthrserserleuthrthrseralavalserthrproala

      450455460

      thrserhisserglnserthrvalvalthrthrthrthrilethrthr

      465470475480

      serthrglyprovalmetserthrthrthralatyrserserserser

      485490495

      thrserserserglusersergluvalglnservalmetserserthr

      500505510

      proserserthrserthrthrthrsersergluserthrserserser

      515520525

      serthralaserthrserproserthrserglnthrphegluthrser

      530535540

      prothrileglyglyvalproserthrthrserphevalserthrpro

      545550555560

      thrthrlysleuserhisthrthrserthrmetthralaglnserasp

      565570575

      serlysserthrhisserserserthrserthrgluasplysserser

      580585590

      thralaseralavalaspgluserthrthrthrserthrserthrglu

      595600605

      serthrthrservalthrserglythrserhisseralalysgluser

      610615620

      serserasnserlysvaltyrserserglnthralahisserserile

      625630635640

      servalalaserserproserthrlys

      645

      <210>36

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>36

      000

      <210>37

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>37

      000

      <210>38

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>38

      000

      <210>39

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>39

      000

      <210>40

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>40

      000

      <210>41

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>41

      000

      <210>42

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>42

      000

      <210>43

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>43

      000

      <210>44

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>44

      000

      <210>45

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>45

      000

      <210>46

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>46

      000

      <210>47

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>47

      000

      <210>48

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>48

      000

      <210>49

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>49

      000

      <210>50

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>50

      000

      <210>51

      <211>40

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>51

      ileglnglnasnphethrserthrserleumetileserthrtyrglu

      151015

      glylysalaserilephepheseralagluleuglyserileilephe

      202530

      leuleuleusertyrleuleuphe

      3540

      <210>52

      <211>40

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>52

      glulysserthrasnserserserseralathrserlysasnalagly

      151015

      alaalametaspmetglyphepheseralaglyvalglyalaalaile

      202530

      alaglyalaalaalametleuleu

      3540

      <210>53

      <211>43

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>53

      serleuleulysseralaalaseralathrserserserglnserser

      151015

      serlysserlysglyalaalaglyileilegluileproleuilephe

      202530

      argalaleualagluleutyrasnleuvalleu

      3540

      <210>54

      <211>40

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>54

      serserglyalaserserserserserlysserserlysglyasnala

      151015

      alailemetalaproileglyglnthrthrproleuvalglyleuleu

      202530

      thralaileilemetserilemet

      3540

      <210>55

      <211>44

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>55

      alaglnalaasnvalseralaseralaserserserserserserser

      151015

      lyslysserlysglyalaalaprogluleuvalproalathrserphe

      202530

      metglyvalvalalaalavalglyvalalaleuleu

      3540

      <210>56

      <211>40

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>56

      glyproglyglulysalaarglysasnasnalaalaproglyproser

      151015

      asnpheasnserilelysleupheglyvalthralaglyseralaala

      202530

      valalaglyalaleuleuleuleu

      3540

      <210>57

      <211>39

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>57

      serserthrglymetleuserprothrserserserserthrarglys

      151015

      gluasnglyglyhisasnleuasnproprophephealaargpheile

      202530

      thralailephehishisile

      35

      <210>58

      <211>40

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>58

      serserpheserserserglyglysersergluserthrthrlyslys

      151015

      glnasnalaglytyrlystyrargserserpheserpheserleuleu

      202530

      serpheilesertyrpheleuleu

      3540

      <210>59

      <211>40

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>59

      tyrlysserthrvalasnglylysvalalaservalmetserasnser

      151015

      thrasnglyalathralaglythrhisilealatyrglyalaglyala

      202530

      phealavalglyalaleuleuleu

      3540

      <210>60

      <211>40

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>60

      serglyasnleuthrthrserthralaseralathrserthrserser

      151015

      lysargasnvalglyasphisilevalproserleuproleuthrleu

      202530

      ileserleuleuphealapheile

      3540

      <210>61

      <211>43

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>61

      glylysasnglyalalysserglnglyserserlyslysmetgluasn

      151015

      seralaprolysasnilepheileaspalaphelysmetservaltyr

      202530

      alavalphethrvalleupheserileilephe

      3540

      <210>62

      <211>40

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>62

      thrglyserserseralaserserserserlysserlysglyvalgly

      151015

      asnilevalasnvalserpheserglnserglytyrleualaleuphe

      202530

      alaglyleuileseralaleuleu

      3540

      <210>63

      <211>40

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>63

      alaserglyserserthrhislyslysasnalaglyasnalaleuval

      151015

      asntyrserasnleuasnthrasnthrpheileglyvalleuserval

      202530

      ileseralavalpheglyleuile

      3540

      <210>64

      <211>40

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>64

      gluaspalaaspgluasplysaspaspleulysarglyshisargasn

      151015

      seralaserileserglyproleuleuproleuglyleucysleuleu

      202530

      phephethrpheserleuphephe

      3540

      <210>65

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>65

      000

      <210>66

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>66

      000

      <210>67

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>67

      000

      <210>68

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>68

      000

      <210>69

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>69

      000

      <210>70

      <211>0

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>70

      000

      <210>71

      <211>37

      <212>prt

      <213>人工序列

      <220>

      <223>合成序列

      <400>71

      glnileglnsersermetvalgluileserthrtyralaglyserala

      151015

      asnservalasnalaglyalaglyalaglyalaleupheleuleuleu

      202530

      serleualaileile

      35

      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1