專利名稱:人dna錯配修復(fù)蛋白的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及新鑒別的多核苷酸、由該多核苷酸編碼的多肽、這些多核苷酸和多肽的用途,以及這些多核苷酸和多肽的生產(chǎn)。更具體地,本發(fā)明的多肽為原核mutL4基因的人同系物,下文稱為hMLH1、hMLH2和hMLH3。
在原核生物和真核生物中,DNA錯配修復(fù)基因在改正DNA復(fù)制和遺傳重組過程中產(chǎn)生的錯誤方面起著主要作用。E.coli甲基指導(dǎo)的DNA錯配修復(fù)系統(tǒng)是目前為止了解得最清楚的DNA錯配修復(fù)系統(tǒng)。在E.coli中,這種修復(fù)途徑涉及增變基因mutS、mutL、mutH和uvrD的產(chǎn)物,這些基因的任何一種的突變體將揭示一種增變基因表型。MutS是一種DNA錯配結(jié)合蛋白,其起始這種修復(fù)過程,uvrD是DNA解旋酶,MutH是潛在的內(nèi)切核酸酶,其在半甲基化的GATC序列的未甲基化的鏈上內(nèi)切。MutL蛋白據(jù)信識別并結(jié)合到錯配-DNA-MutS-MutH復(fù)合體上以增加MutH蛋白的內(nèi)切核酸酶活性。當(dāng)未甲基化的DNA鏈被MutH切割后,需要單鏈DNA結(jié)合蛋白、DNA聚合酶III、外切核酸酶I和DNA連接酶以完成修復(fù)過程(Modrich P.,Annu.Rev.Genetics,25229-53(1991))。
E.coli MutLHS系統(tǒng)的組分在原核生物和真核生物的進化過程中似乎是保守的,遺傳學(xué)研究分析表明釀酒酵母具有類似于細菌MutLHS系統(tǒng)的錯配修復(fù)系統(tǒng)。在釀酒酵母中,至少兩種MutL同系物PMS1和MLH1已被報道,它們中的每一種的突變均導(dǎo)致有絲分裂增變基因表型(Prolla et al.,Mol.Cell.Biol.14407-415(1994))。在釀酒酵母中已發(fā)現(xiàn)至少三種MutS同系物,即MSH1、MSH2和MSH3,MSH2基因的破壞會影響核突變率。已發(fā)現(xiàn)釀酒酵母中的突變體MSH2、PMS1和MLH1顯現(xiàn)出增加的二核苷酸重復(fù)序列的擴展和收縮率(Strand et al.,Nature,365274-276(1993))。
已有報道一些人類腫瘤如肺癌、前列腺癌、卵巢癌、乳腺癌、結(jié)腸癌和胃癌顯示重復(fù)DNA序列的不穩(wěn)定性(Han et al.,Cancer,535087-5089(1993);Thibodeau et al.,Science260816-819(1993);Risinger et al.,Cancer 535100-5103(1993))。這種現(xiàn)象暗示缺少DNA錯配修復(fù)可能是這些腫瘤的發(fā)病原因。
直到最近,關(guān)于人的DNA錯配修復(fù)系統(tǒng)還知之甚少,已克隆了MutS基因的人同系物并發(fā)現(xiàn)其對遺傳性非息肉結(jié)腸癌(HNPCC)(Fishel et al.,Cell,751027-1038(1993)andLeach et al.,Cell,751215-1225(1993))。HNPCC首先連鎖到引起二核苷酸不穩(wěn)定性的染色體2p16的一個基因座上,然后證明一種DNA錯配修復(fù)蛋白(MutS)的同系物位于此基因座,并且在HNPCC患者中特異地觀察到在一些保守區(qū)域中有C→T的瞬時突變。遺傳性非息肉結(jié)腸癌是最常見的人類遺傳病,在西方國家感染率高至200個個體中有1個患者。
已經(jīng)證明遺傳性結(jié)腸癌可以由一些基因座的突變導(dǎo)致,與染色體5的一個基因連鎖的家族性腺瘤結(jié)腸息肉病(APC)造成了少數(shù)遺傳性結(jié)腸癌。遺傳性結(jié)腸癌還伴有Gardner’s綜合癥、Turcot’s綜合癥、Peutz-Jaeghers綜合癥以及幼年結(jié)腸息肉病。另外,遺傳性非息肉結(jié)腸癌可以占所有人結(jié)腸癌的5%。已經(jīng)證明所有不同類型的家族性結(jié)腸癌均是由常染色體顯性遺傳模式傳遞的。
HNPCC除了定位于染色體2的短臂外,還有一第二基因座連鎖于HNPCC傾向(Lindholm,et al.,Nature Genetics,5279-282(1993))。已經(jīng)證明在染色體3的短臂的多態(tài)標記與疾病基因座之間有一強連鎖。
這一發(fā)現(xiàn)提示在各種DNA錯配修復(fù)蛋白上的突變可能在人遺傳性疾病和癌癥的發(fā)病上起著重要作用。
HNPCC的臨床特征為其在結(jié)腸、子宮內(nèi)膜和其它器官的癌癥方面具有明顯的常染色體顯性遺傳傾向(Lynch,H.T.et al.,Gastroenterology,1041535-1549(1993))。在2p16和3p21-22鑒別出的與選自HNPCC血緣族的疾病連鎖的標記毫無疑問地證明其孟德爾特性(Peltomaki,P.et al.,Science,260810-812(1993))。HNPCC患者的腫瘤的特征是簡單重復(fù)序列(微衛(wèi)星)的廣泛的改變(Aaltonen,LA.,et al.,Science,260812-816(1993))。這種類型的遺傳不穩(wěn)定性最初在一子集(12-18%偶發(fā)結(jié)腸癌(獨特型))中觀察到。在細菌和酵母中的研究表明DNA錯配修復(fù)基因的缺陷可以產(chǎn)生類似的微衛(wèi)星的不穩(wěn)定性(Levinson,G.and Gutman,G.A.,Nuc.Acids Res.,155325-5338(1988)),并且假定錯配修復(fù)的不足導(dǎo)致了HNPCC(Stramd,M.et al.,Nature,365274-276(1993))。對HNPCC腫瘤細胞系提取物的分析表明錯配修復(fù)確實不足,從而對這一假設(shè)提供了支持(Parson,R.P.,et al.,Cell,751227-1236(1993))由于不是所有的HNPCC血緣族都能與同一基因座連鎖,并且由于在酵母中至少有三個基因可以產(chǎn)生類似的表型,所以看起來在一些HNPCC病例中有其它的錯配修復(fù)基因可能起作用。
hMLH1與酵母mutL-同系物yMLH1最同源,而hMLH2和hMLH3與酵母mutL-同系物yPMS1有更大的同源性(由于其與酵母PMS1基因的同源性,hMLH2和hMLH3在文獻中有時被稱作hPMS1和hPMS2)。在HNPCC患者的種系中,發(fā)現(xiàn)除了hMLH1,在染色體2q32上的hMLH2基因和在染色體7p22上的hMLH3基因也有突變。這樣使得涉及HNPCC的基因數(shù)加倍,并有助于解釋該病相對較高的發(fā)病率。
根據(jù)本發(fā)明的一個方面,提供了新的推定的成熟多肽hMLH1、hMLH2和hMLH3,以及該多肽的生物活性的和診斷用或治療用片段、類似物和衍生物,本發(fā)明的多肽是人源的。
根據(jù)本發(fā)明的另一個方面,提供了編碼這些多肽的分離的核酸分子,包括mRNA、DNA、cDNA、基因組DNA以及該核酸分子的生物活性的和診斷用或治療用片段、類似物和衍生物。
根據(jù)本發(fā)明的再一方面,提供了核酸探針,包括足夠長度的核酸分子以特異地與hMLH1、hMLH2和hMLH3序列雜交。
根據(jù)本發(fā)明的又一方面,提供了一種通過重組技術(shù)生產(chǎn)這些多肽的方法,該方法包括在促進所述蛋白表達的條件下培養(yǎng)含hMLH1、hMLH2和hMLH3核酸序列的重組原核和/或真核宿主細胞,隨后回收所述的蛋白質(zhì)。
根據(jù)本發(fā)明的另一方面,提供了為治療目的例如治療癌癥而使用這種多肽、或使用編碼這種多肽的多核苷酸的方法。
根據(jù)本發(fā)明的再一方面,提供了診斷與hMLH1、hMLH2和hMLH3核酸序列和由這些核酸序列編碼的蛋白的突變有關(guān)的疾病或疾病的易感性的方法。
根據(jù)本發(fā)明的又一方面,提供了為與科學(xué)研究、DNA合成和生產(chǎn)DNA載體有關(guān)的體外目的使用這種多肽、或使用編碼這種多肽的多核苷酸的方法。
本發(fā)明的這些及其它方面根據(jù)本文的教導(dǎo)對本領(lǐng)域熟練技術(shù)人員將是顯而易見的。
下述附圖旨在說明本發(fā)明的實施方案,并非限制本發(fā)明的范圍。
圖1示出人DNA修復(fù)蛋白hMLH1的cDNA序列及推導(dǎo)出的氨基酸序列,氨基酸由標準單字母縮寫表示。使用373自動DNA測序儀(Applied Biosystems,Inc.)進行測序,測序精確度預(yù)計大于97%。
圖2示出hMLH2的cDNA序列及推導(dǎo)出的氨基酸序列,氨基酸由標準單字母縮寫表示。
圖3示出hMLH3的cDNA序列及推導(dǎo)出的氨基酸序列,氨基酸由標準單字母縮寫表示。
圖4為使用MACAW(1.0版本)程序?qū)⑨劸平湍窹MS1(yPMS1)的預(yù)期氨基酸序列與hMLH2和hMLH3的氨基酸序列進行對比。保守區(qū)的氨基酸用大寫字母表示并根據(jù)其平均成對值涂黑。
圖5為hMLH2的突變分析。(A)對HNPCC患者CW中的轉(zhuǎn)錄終止突變的IVSP分析及定位。密碼子1-369的翻譯(泳道1),密碼子1-290的翻譯(泳道2),及密碼子1-214的翻譯(泳道3)。CW是由患者CW的cDNA翻譯而來,而NOR是由正常個體的cDNA翻譯而來。箭頭指出由于可能的終止突變導(dǎo)致的截短的多肽,并指出分子量標記(千道爾頓)。(B)CW的序列分析指出在密碼子233有一C到T的顛換(箭頭示出)。泳道1和3是衍生自對照患者的序列;泳道2是衍生自CW基因組DNA的序列。將每一測序混合物的ddA混合物載樣到相鄰泳道以利于比較,ddC,ddD和ddT混合物也同樣如此。
圖6為hMLH3的突變分析。(A)對患者GC的hMLH3的IVSP分析。泳道GC來自個體GC的成纖維細胞;泳道GCx來自患者GC的腫瘤;泳道NOR1和2來自正常對照個體。FL表示全長蛋白質(zhì),箭頭指示種系截短的多肽,并指出分子量標記(千道爾頓)。(B)患者GC的DNA的PCR分析顯示在腫瘤細胞的hMLH3的等位基因中均存在損害。使用5’擴增引物、3’擴增引物或在cDNA中缺失的區(qū)域(MID)中擴增的引物進行擴增反應(yīng)。泳道1為衍生自患者GC的成纖維細胞的DNA;泳道2為衍生自患者GC的腫瘤的DNA;泳道3為衍生自正常對照患者的DNA;泳道4為未加DNA模板的反應(yīng)。箭頭指示分子量(堿基對)。
根據(jù)本發(fā)明的一個方面,提供了分離出的核酸(多核苷酸),其編碼具有圖1,2和3的推導(dǎo)的氨基酸序列(SEQ ID No.2,4和6)的成熟多肽,或者編碼由ATCC保藏號75649,75651,75650(1994年1月25日保藏)的克隆的cDNA編碼的成熟多肽。
ATCC保藏號75649是一含有編碼人DNA修復(fù)蛋白的全長序列的cDNA克隆,本文稱為hMLH1;ATCC保藏號75651是一含有編碼人DNA修復(fù)蛋白的全長cDNA序列的cDNA克隆,本文稱為hMLH2;ATCC保藏號75650是一含有全長DNA序列的cDNA克隆,本文稱為hMLH3。
編碼本發(fā)明的多肽的多核苷酸可以得自一或多個由心、肺、前列腺、脾、肝、膽囊、胎兒腦和睪丸組織制備的文庫。hMLH1的多核苷酸由人膽囊cDNA文庫發(fā)現(xiàn)。另外從人小腦、八周胚胎、胎心、HSC172細胞和Jurket細胞cDNA文庫中得到了六個與hMLH1的N-末端相同的cDNA克隆。hMLH1基因含有一756個氨基酸的開放讀框,其編碼與細菌和酵母mutL蛋白具有同源性的一種85KD蛋白質(zhì)。然而,5’-非翻譯區(qū)從由胎心得到的cDNA克隆中獲得,用于延伸非翻譯區(qū)以設(shè)計寡核苷酸。
hMLH2基因衍生自人T細胞淋巴瘤cDNA文庫,該hMLH2 cDNA克隆識別一2769堿基對的開放讀框,其兩旁側(cè)均有框內(nèi)終止密碼子,其在結(jié)構(gòu)上與酵母PMS1家族相關(guān),并含有一開放讀框編碼934個氨基酸殘基的蛋白質(zhì)。該蛋白質(zhì)與酵母PMS1具有最高程度的同源性,整個蛋白質(zhì)有27%相同,82%相似。
在三種PMS相關(guān)蛋白質(zhì)中有顯著同源性的第二個區(qū)域在羧基末端,位于密碼子800-900之間。酵母PMS1蛋白與hMLH2和hMLH3蛋白在這一區(qū)域分別具有22%和47%的同源性,而這些蛋白質(zhì)與另一種酵母mutL同系物,yMLH1在這一區(qū)域幾乎未觀察到同源性。
hMLH3基因衍生自人子宮內(nèi)膜腫瘤cDNA文庫,該hMLH3 cDNA克隆識別一2586堿基對的開放讀框,其在結(jié)構(gòu)上與yPMS2蛋白家族相關(guān),并含有一開放讀框編碼862個氨基酸殘基的蛋白質(zhì)。該蛋白質(zhì)與yPMS2具有最高程度的同源性,整個氨基酸序列有32%相同,66%相似。
對hMHL1,hMHL2和hMHL3的鑒別是很明顯的,因為在由E.coli衍生的mutL同系物中保守的GFRGEAL功能區(qū)在hMHL1,hMHL2和hMHL3的氨基酸序列中是保守的。
本發(fā)明的多核苷酸可以是RNA形式,或DNA形式,DNA包括cDNA、基因組DNA和合成DNA,DNA可以是雙鏈或單鏈,并且如果是單鏈,則可以是編碼鏈或非編碼(反義)鏈。編碼成熟多肽的編碼序列可以與圖1、2和3所示的編碼序列(SEQ ID No.1)相同,或與保藏克隆的編碼序列相同,或者也可以是不同的編碼序列,該編碼序列由于遺傳密碼的豐余性或簡并性,與圖1、2和3的DNA或保藏的cDNA編碼相同的成熟多肽(SEQ ID No.2、4和6)。
編碼圖1、2和3的成熟多肽(SEQ ID No.2、4和6)或編碼由保藏的cDNA編碼的成熟多肽的多核苷酸可以包括成熟多肽的編碼序列;成熟多肽的編碼序列(和任選的另外的編碼序列)和非編碼序列如內(nèi)含子或成熟多肽編碼序列的5’和/或3’非編碼序列。
因此,術(shù)語“編碼多肽的多核苷酸”包含如下的多核苷酸,即僅包括多肽編碼序列的多核苷酸,以及包括另外的編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述多核苷酸的變異體,其編碼具有圖1、2和3的推導(dǎo)的氨基酸序列(SEQ ID No.2、4和6)的多肽或編碼由保藏的克隆的cDNA編碼的多肽的片段、類似物和衍生物。這些多核苷酸的變異體可以是天然發(fā)生的該多核苷酸的等位基因變異體,或是該多核苷酸的非天然發(fā)生的變異體。
因此,本發(fā)明包括編碼圖1、2和3所示的相同成熟多肽(SEQ ID No.2、4和6)或由保藏克隆的cDNA編碼的相同成熟多肽的多核苷酸,以及這些多核苷酸的變異體,所述變異體編碼圖1、2和3的多肽(SEQ ID No.2、4和6)或由保藏克隆的cDNA編碼的多肽的片段、衍生物或類似物。這些核苷酸變異體包括缺失變異體、置換變異體和增加或插入變異體。
如上所述,多核苷酸可以具有為圖1、2和3所示的編碼序列(SEQ ID No.1、3和5)的天然發(fā)生的等位基因變異體的編碼序列,或保藏克隆的編碼序列的天然發(fā)生變異體的編碼序列。如本領(lǐng)域所公知的,等位基因變異體是多核苷酸的另一種形式,其可以置換、缺失或增加一個或多個核苷酸,但基本上不改變編碼多肽的功能。
本發(fā)明的多核苷酸還可以具有符合讀框的與標記序列融合的編碼序列,其可用于純化本發(fā)明的多肽。標記序列可以是,例如,由pQE-9載體提供的六組氨酸標記物用于在細菌宿主中純化與該標記物融合的成熟多肽,或者,例如,當(dāng)使用哺乳動物宿主如COS-7細胞時,標記序列可以是血凝素標記物(HA)。HA標記物相應(yīng)于由流感病毒血凝素蛋白衍生的表位(Wilson,I.,et al.,Cell,37767(1984))。
本發(fā)明還涉及可與上述序列雜交的多核苷酸,條件是序列間具有至少50%、優(yōu)選70%的同一性。本發(fā)明特別涉及在嚴格條件下與上述多核苷酸雜交的多核苷酸。如本文所用的,術(shù)語“嚴格條件”是指雜交僅發(fā)生在序列間具有至少95%、優(yōu)選97%同一性的情況下。在一優(yōu)選的實施方案中,與上述多核苷酸雜交的多核苷酸編碼基本上保持了由圖1、2和3的cDNA(SEQ ID No.1、3和5)或保藏的cDNA編碼的成熟多肽的相同的生物學(xué)功能或活性的多肽。
本文所指的保藏物將根據(jù)國際承認的用于專利程序的微生物保藏的布達佩斯條約的規(guī)定期限保藏。這些保藏僅為本領(lǐng)域技術(shù)人員提供方便,而不是對根據(jù)35 U.S.C 112索取保藏物的許可。保藏物中所含的多核苷酸的序列以及該序列編碼的多肽的氨基酸序列引入本文作參考,并且在與本文的序列描述有抵觸時,其是參照。制造、使用或銷售保藏物需經(jīng)許可,而本文不授予這種許可。
本發(fā)明還涉及具有圖1、2和3的推導(dǎo)的氨基酸序列(SEQ ID No.2、4和6)或具有由保藏的cDNA編碼的氨基酸序列的多肽,以及這些多肽的片段、類似物和衍生物。
當(dāng)指圖1、2和3(SEQ ID No.2、4和6)的多肽或由保藏的cDNA編碼的多肽時,術(shù)語“片段”、“衍生物”和“類似物”是指基本上保持這些多肽的相同的生物學(xué)功能或活性的多肽。因此,類似物包括蛋白原,其可通過裂解蛋白原部分而激活以生產(chǎn)有活性的成熟多肽。
本發(fā)明的多肽可以是重組多肽、天然多肽或合成多肽,優(yōu)選重組多肽。
圖1、2和3(SEQ ID No.2、4和6)的多肽或由保藏的cDNA編碼的多肽的片段、衍生物或類似物可以是(i)其中的一或多個氨基酸殘基被保守或非保守的氨基酸殘基取代(優(yōu)選由保守的氨基酸殘基取代),并且這種取代的氨基酸殘基可以有遺傳密碼編碼,也可不是由遺傳密碼編碼,或者(ii)其中的一或多個氨基酸殘基包括一取代基,或者(iii)其中的成熟多肽與另一種化合物融合,所述化合物例如為增加多肽的半壽期的化合物(例如聚乙二醇)。這種片段、衍生物和類似物被視為屬于本領(lǐng)域熟練技術(shù)人員根據(jù)本文的教導(dǎo)而理解的范圍。
本發(fā)明的多肽和多核苷酸優(yōu)選地以分離的形式通過,并優(yōu)選純化至均一性。
術(shù)語“分離的”是指從其原始環(huán)境(例如,若其是天然存在的則是天然環(huán)境)中脫離的物質(zhì)。例如,存在于活體動物中的天然發(fā)生的多核苷酸或多肽不是分離的,但從一些或所有共存物質(zhì)中分離的相同的多核苷酸或多肽則是分離的。這種多核苷酸可以是載體的一部分和/或這種多核苷酸或多肽可以是某種組合物的一部分,并且如果這種載體或組合物不是其天然環(huán)境的一部分,則其還是分離的。
本發(fā)明還涉及包括本發(fā)明的多核苷酸的載體,用本發(fā)明的載體遺傳工程化的宿主細胞,以及用重組技術(shù)生產(chǎn)本發(fā)明的多肽。
宿主細胞用本發(fā)明的載體遺傳工程化(轉(zhuǎn)導(dǎo)或轉(zhuǎn)化或轉(zhuǎn)染),所述的載體可以是克隆載體或表達載體。載體可以是質(zhì)粒、病毒顆粒、噬菌體等。遺傳工程化的宿主細胞可以在改進的傳統(tǒng)營養(yǎng)培養(yǎng)基中培養(yǎng),改進培養(yǎng)基是為了激活啟動子,選擇轉(zhuǎn)化子或擴增hMLH1、hMHL2和hMLH3基因。培養(yǎng)條件如溫度、pH等是先前用于選擇用來病毒的宿主細胞的條件,其對本領(lǐng)域普通技術(shù)人員是顯而易見的。
本發(fā)明的多核苷酸可通過重組技術(shù)用于生產(chǎn)多肽,因此,例如,該多核苷酸可以包括在任一種表達載體中以表達多肽。這些載體包括染色體的、非染色體的和合成的DNA序列,例如SV40衍生物;細菌質(zhì)粒;噬菌體DNA;桿狀病毒;酵母質(zhì)粒;衍生于質(zhì)粒和噬菌體DNA的結(jié)合體的載體;病毒DNA如痘苗病毒、腺病毒、禽痘病毒和擬狂犬病毒。然而,也可使用任何其它載體,只要其在宿主中可復(fù)制和生存。
可通過多種程序?qū)⒑线m的DNA序列插入載體,通常,通過本領(lǐng)域公知的程序?qū)NA序列插入合適的限制性內(nèi)切酶位點。這些和其它程序?qū)儆诒绢I(lǐng)域熟練技術(shù)人員的范疇。
表達載體中的DNA序列與合適的表達調(diào)控序列(啟動子)連接以指導(dǎo)mRNA合成,作為這些啟動子的代表性例子,可提及的有LTR或SV40啟動子,E.coli lac或trp啟動子,λ噬菌體PL啟動子和其它公知用于控制基因在原核細胞或真核細胞或者病毒中表達的啟動子。表達載體還含有核糖體結(jié)合位點用于翻譯起始和轉(zhuǎn)錄終止子。載體還可包括用于擴增表達的合適的序列。
另外,表達載體優(yōu)選含有一或多個選擇標記基因以為選擇轉(zhuǎn)化的宿主細胞提供表型標記,如對于真核細胞培養(yǎng)為二氫葉酸還原酶或新霉素抗性,而在E.coli中例如為四環(huán)素或氨芐青霉素抗性。
可采用含有如上所述合適DNA序列以及合適啟動子或調(diào)控序列的載體轉(zhuǎn)化合適的宿主以使宿主表達蛋白質(zhì)。
作為合適的宿主的例子,可以提及的有細菌細胞,如E.coli、鏈霉菌、鼠傷寒沙門氏桿菌;真菌細胞,如酵母;昆蟲細胞如果蠅S2和粘蟲Sf9;動物細胞如CHO、COS或Bowes黑素瘤;腺病毒;植物細胞等。選擇合適的宿主細胞被視為屬于本領(lǐng)域熟練技術(shù)人員根據(jù)本文的教導(dǎo)而理解的范圍。
更具體地,本發(fā)明還包括重組構(gòu)建體,所述構(gòu)建體包含一或多種上述序列。該構(gòu)建體包括載體,如質(zhì)?;虿《据d體,在該載體中以正向或反向插入本發(fā)明的序列。在這一實施方案的一個優(yōu)選方面,該構(gòu)建體還包括調(diào)節(jié)序列,包括例如,與所述序列連接的啟動子。本領(lǐng)域熟練技術(shù)人員已知大量的合適的載體和啟動子,它們是可商購的。以下舉出載體的例子,細菌的載體pQE70,pQE60,pQE-9(Qiagen,Inc.),pbs,pD10,phagescript,psiX174,pbluescript SK,pbsks,pNH8A,pNH16a,pNH18A,pNH46A(Stratagene);ptrc99a,pKK223-3,pKK233-3,pDR540,pRIT5(Pharmacia)。真核載體pWLNEO,pSV2CAT,pOG44,pXT1,pSG(Stratagene),pSVK3,pBPV,pMSG,pSVL(Pharmacia)。然而,也可使用其它質(zhì)粒或載體,只要其可在宿主中復(fù)制和生存即可。
啟動子區(qū)可以選自使用CAT(氯霉素轉(zhuǎn)移酶)載體或其它帶有選擇性標記的載體的任何所需基因,兩個合適的載體是pKK232-8和pCM7。特別提到的細菌啟動子包括lacI,lacZ,T3,T7,gpt,lambda PR,PL和TRP;真核啟動子包括CMV立即早期,HSV胸腺嘧啶激酶,早期和晚期SV40,反轉(zhuǎn)錄病毒的LTR,和鼠金屬硫蛋白-I。選擇合適的載體和啟動子屬于本領(lǐng)域普通技術(shù)人員的水平范疇。
在另一實施方案中,本發(fā)明涉及含有上述構(gòu)架體的宿主細胞,所述的宿主細胞可以是高等真核細胞,如哺乳細胞,或低等真核細胞,如酵母細胞,或者宿主細胞可以是原核細胞,如細菌細胞??赏ㄟ^磷酸鈣轉(zhuǎn)染、DEAE-葡聚糖介導(dǎo)的轉(zhuǎn)染,或電穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))將構(gòu)建體導(dǎo)人宿主細胞。
可以用傳統(tǒng)的方式屬于宿主細胞中的構(gòu)建體以生產(chǎn)由重組序列編碼的基因產(chǎn)物。或者,也可通過常規(guī)的肽合成儀合成生產(chǎn)本發(fā)明的多肽。
在合適的啟動子的控制下,可以在哺乳細胞、酵母、細菌或其它細胞中表達成熟蛋白質(zhì),也可采用無細胞翻譯系統(tǒng)使用由本發(fā)明的DNA構(gòu)建體衍生的RNA生產(chǎn)這種蛋白質(zhì)。原核和真核宿主使用的合適的克隆和表達載體見Sambrook,et al,Molecular ClonningA Laboratory Manual,Second Edition,Cold Spring Harbor,N.Y.,(1989),該書引入本文作參考。
高等真核生物對編碼本發(fā)明的多肽的DNA的轉(zhuǎn)錄可通過在載體中插入一增強子序列而得以增加,增強子是約10-300bp的順式作用的DNA因子,其作用于啟動子以增加其轉(zhuǎn)錄。其例子包括位于復(fù)制起點晚期側(cè)100-270bp處的SV40增強子、巨細胞病毒早期啟動子增強子、位于復(fù)制起點晚期側(cè)的多瘤病毒增強子,以及腺病毒增強子。
通常,重組表達載體包括復(fù)制起點和選擇標記如E.coli的氨芐青霉素抗性基因和釀酒酵母的TRP1基因以允許宿主細胞的轉(zhuǎn)化,以及衍生于高表達基因的啟動子以指導(dǎo)下游結(jié)構(gòu)序列的轉(zhuǎn)錄。這種啟動子可以衍生于編碼糖酵解酶如3-磷酸甘油酸激酶(PGK)、α-因子、酸性磷酸酶、或熱休克蛋白的操縱子。
在合適的階段,雜合結(jié)構(gòu)序列裝配上翻譯起始和終止序列。任選地,雜合序列可以編碼一包括N-末端鑒別肽的融合蛋白質(zhì),以賦予所需的特征,如表達的重組產(chǎn)物的穩(wěn)定性和純化簡便性。
用于細菌的表達載體的構(gòu)建是通過將編碼所需蛋白質(zhì)的結(jié)構(gòu)DNA序列與合適的翻譯起始和終止信號一起插入帶有功能啟動子的可操縱閱讀相而完成。載體包括一或多種表型選擇標記及一個復(fù)制起點以確證載體保持在宿主中,并且,如果需要,可以在宿主中擴增。合適的用于轉(zhuǎn)化的原核宿主包括E.coli、枯草芽包桿菌、鼠傷寒沙門氏桿菌以及假單胞菌屬、鏈霉菌屬和葡萄球菌屬的各菌種,當(dāng)然,也可采用其它菌。
作為代表性而非限制性的例子,有用的細菌表達載體可以包括衍生于包含熟知的克隆載體pBR322(ATCC 37017)的遺傳因子的商購質(zhì)粒的選擇標記和細菌復(fù)制起點,這些商購質(zhì)粒包括,例如,pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden)和GEM1(Promega Biotec,Madison,WI,USA)。這些pBR322“骨架”部分與合適的啟動子及待表達的結(jié)構(gòu)序列結(jié)合。
轉(zhuǎn)化合適的宿主菌株并將宿主菌株培養(yǎng)至合適的細胞密度后,用合適的方法(如溫度改變或化學(xué)誘導(dǎo))誘導(dǎo)選定的啟動子,并繼續(xù)培養(yǎng)細胞一段時間。
典型地,細胞由離心收集,用物理或化學(xué)方法破碎,保留得到的粗提物以進一步純化。
用于表達的微生物細胞可用任何常規(guī)方法破碎,如凍-融循環(huán)、超聲處理、機械破碎,或使用細胞裂解試劑,這些方法是本領(lǐng)域熟練技術(shù)人員公知的。
也可使用各種哺乳細胞培養(yǎng)系統(tǒng)表達重組蛋白,哺乳細胞表達系統(tǒng)包括由Gluzman,Cell,23175(1981)描述的猴腎成纖維細胞COS-7細胞系,以及其它能表達相容載體的細胞系,如C127,3T3,CHO,Hela和BHK細胞系。哺乳類表達載體包括復(fù)制起點,合適的啟動子和增強子,以及任何必需的核糖體結(jié)合位點,多腺苷酸化位點,剪接供體和受體位點,轉(zhuǎn)錄終止序列,和5’旁側(cè)非轉(zhuǎn)錄序列??墒褂糜蒘V40剪接的DNA序列和多腺苷酸化位點以提供所需的非轉(zhuǎn)錄遺傳因子。
可通過硫酸銨或乙醇沉淀、酸抽提、陽離子或陰離子交換層析、羥基磷灰石層析和凝集素層析等方法從重組細胞培養(yǎng)物中回收并純化多肽。如果需要,可使用蛋白質(zhì)重折疊步驟以完成成熟蛋白的構(gòu)型,最后,可采用高效液相色譜(HPLC)進行最后的純化步驟。
本發(fā)明的多肽可以是天然純化的產(chǎn)物,或是化學(xué)合成過程的產(chǎn)物,或者通過重組技術(shù)從原核或真核宿主(例如,通過培養(yǎng)細菌、酵母、高等植物、昆蟲和哺乳類細胞)而生產(chǎn)。根據(jù)在重組生產(chǎn)過程中采用的宿主,本發(fā)明的多肽可以是糖基化的或非糖基化的。
根據(jù)本發(fā)明的另一方面,提供了用于確定癌癥特別是遺傳性癌癥易感性的方法。即,人修復(fù)蛋白(mutL的人同系物)的突變,尤其是本文所述的突變,預(yù)示著對癌癥的易感性,編碼這種人同系物的核酸序列可用來分析確證這種易感性。因此,如本文所述,這種分析可用來確定人DNA修復(fù)蛋白的突變,如缺失、截短、插入、移碼等,這種突變指示對癌癥的易感性。
例如,可通過DNA測序分析確證突變。從人患者中獲得組織樣品,包括但不限于血樣,用公知的方法加工此樣品以收集RNA,通過加入寡核苷酸引物,該引物由與mRNA的多腺苷酸序列雜交的多胸腺嘧啶殘基組成,從RNA樣品合成第一條cDNA鏈,加入反轉(zhuǎn)錄酶和脫氧核苷酸以合成第一條cDNA鏈。引物序列是根據(jù)本發(fā)明的DNA修復(fù)蛋白的DNA序列而合成,該引物序列通常由15-30、優(yōu)選18-25個人DNA修復(fù)基因的保守堿基組成,表1示出根據(jù)hMLH1的寡核苷酸引物序列的例子。引物是成對使用的(一條“有義”鏈和一條“反義”鏈)以通過PCR方法(Saiki et al.,Nature,324163-166(1986))擴增患者cDNA,從而,產(chǎn)生這種蛋白的三個重疊的患者cDNA的片段。表1還示出優(yōu)選的引物序列對。隨后將重疊的片段用一套引物序列進行雙脫氧測序,該套引物是在整個基因中約每200個堿基對之處根據(jù)相應(yīng)的cDNAD堿基對而合成的。
表1用PCR擴增基因所用的引物序列名稱 起始位點和排列序列758 sense-(-41)*GTTGAACATCTAGACGTCTC1319 sense-8 TCGTGGCAGGGGTTATTCG1321 sense-619 CTACCCAATGCCTCAACCG1322 sense-677 GAGAACTGATAGAAATTGGATG1314 sense-1548 GGGACATGAGGTTCTCCG1323 sense-1593 GGGCTGTGTGAATCCTCAG773 anti-53 CGGTTCACCACTGTCTCGTC1313 anti-971TCCAGGATGCTCTCCTCG1320 anti-1057 CAAGTCCTGGTAGCAAAGTC1315 anti-1760 ATGGCAAGGTCAAAGAGCG1316 anti-1837 CAACAATGTATTCAGXAAGTCC1317 anti-2340 TTGATACAACACTTTGTATCG1318 anti-2415 GGAATACTATCAGAAGGCAAGsense=有義,anti=反義*數(shù)字對應(yīng)于圖1的核苷酸序列的位置,該序列中ATG為1。優(yōu)選的引物序列對為758,13131319,1320660,1909725,19951680,25361727,2610表1所示核苷酸序列分別代表SEQ ID No.7-19。
表2列出了可以使用的寡核苷酸引物序列(有義和反義)的代表性例子,并且優(yōu)選的是使用整套的引物序列進行測序以確定患者DNA修復(fù)蛋白突變的位置。引物序列長度可為15-30堿基,優(yōu)選為18-25堿基。隨后,將從患者確定的序列信息與未突變的序列比較以確定是.存在任何突變。
表2用于測定擴增片段的序列的引物序列起始位點名稱數(shù)字 排列序列5282seq01sense-377*ACAGAGCAAGTTACTCAGATG5283seq02sense-552 GTACACAATGCAGGCATTAG5284seq03sense-904 AATGTGGATGTTAATGTGCAC5285seq04sense-1096CTGACCTCGTCTTCCTAC5286seq05sense-1276CAGCAAGATGAGGAGATGC5287seq06sense-1437GGAAATGGTGGAAGATGATTC5288seq07sense-1645CTTCTCAACACCAAGC5289seq08sense-1895GAAATTGATGAGGAAGGGAAC5295seq09sense-1921CTTCTGATTGACAACTATGTGC5294seq10sense-2202CACAGAAGATGGAAATATCCTG5293seq11sense-2370GTGTTGGTAGCACTTAAGAC5291seq12anti-525 TTTCCCATATTCTTCACTTG5290seq13anti-341 GTAACATGAGCCACATGGC5292seq14anti-46CCACTGTCTCGTCCAGCCGsense=有義,anti=反義*數(shù)字對應(yīng)于圖1的核苷酸序列的位置,該序列中ATG為1。表2所示核苷酸序列分別代表SEQ ID No.20-33。
在另一實施方案中,表2的引物序列可以用于PCR方法中擴增突變的區(qū)域,該區(qū)域可以經(jīng)測序并用作診斷以預(yù)測對這種突變基因的傾向。
或者,檢測本發(fā)明的基因中的突變的分析可以通過基于DBA序列差異的遺傳檢測而進行,其是通過檢測DNA片段在含或不含變性劑的凝膠中的電泳遷移率的改變而完成。較小序列的缺失或插入可通過高分辨率凝膠電泳觀察。不同序列的DNA片段可以在變性甲酰胺梯度凝膠中區(qū)分開,其中,根據(jù)其特異的解鏈或部分解鏈溫度,不同DNA片段的遷移停留在凝膠的不同位置(例如見Myers et al.,Science,2301242(1985))。
在特定位置的序列變化也可通過核酸酶保護試驗如RNase和S1保護或化學(xué)裂解方法而揭示(例如,Cotton et al.,PNAS,USA,854397-4401(1985))??赏ㄟ^RNase A消化或解鏈溫度的差異而將完全配對的序列與錯配的雙螺旋區(qū)分開。
因此,特定DNA序列的檢測可通過下述方法實現(xiàn),如雜交、RNase保護、化學(xué)裂解、Western印跡分析、直接DNA測序或使用限制性酶(例如,限制性片段長度多態(tài)性(RFLP))以及基因組DNA的Southern印跡分析。
除了更傳統(tǒng)的凝膠電泳和DNA測序外,還可應(yīng)用原位分析檢測突變。
本發(fā)明的多肽還可通過在體內(nèi)表達這種多肽而用于治療或防止癌癥,這種方法通常稱為“基因療法”。
因此,例如,可用編碼來自體內(nèi)的多肽的多核苷酸(DNA或RNA)對患者的細胞進行工程化,隨后將工程化的細胞再提供給需用多肽治療的患者,這些方法是本領(lǐng)域公知的。例如,可用含編碼本發(fā)明的多肽的RNA的反轉(zhuǎn)錄病毒顆粒利用本利用熟知的程序?qū)毎M行工程化。
類似地,例如也可通過本領(lǐng)域公知的程序在體內(nèi)對細胞進行工程化以在體內(nèi)表達多肽。如本領(lǐng)域所公知的,可將生產(chǎn)含編碼本發(fā)明的多肽的RNA的反轉(zhuǎn)錄病毒顆粒的生產(chǎn)者細胞給予患者以在體內(nèi)進行細胞的工程化并在體內(nèi)表達多肽。通過這種方法給予本發(fā)明的多肽的這些和其它方法對于本領(lǐng)域熟練技術(shù)人員根據(jù)本發(fā)明的教導(dǎo)是顯而易見的。例如,用于工程化細胞的表達載體可以不是反轉(zhuǎn)錄病毒,而是例如腺病毒,其在與回收的輸送載體結(jié)合后可用于在體內(nèi)工程化細胞。
本文所鑒定的每種cDNA序列或其部分可以各種方式用作多核苷酸試劑。該序列可用作診斷探針用于探測在特定細胞類型中是否存在特異的mRNA,另外,這些序列可用作適于用在遺傳連鎖分析(多態(tài)性)中的診斷探針。
本發(fā)明的序列還可用于染色體鑒定,該序列特異地定向于單個人染色體的特定位置并可與之雜交。另外,目前需要鑒定染色體上的特定位點,而現(xiàn)在只有很少幾種基于實際序列資料(重復(fù)多態(tài)性)的染色體標記試劑可以商購用于標記染色體位置。本發(fā)明的將DNA定位與染色體是將這些序列與相關(guān)疾病的基因聯(lián)系起來的非常重要的第一步。
簡而言之,可通過從cDNA制備PCR引物(優(yōu)選15-25bp)而將序列定位在染色體上。使用3’非翻譯區(qū)的計算機分析快速選擇跨度不超過基因組DNA的一個外顯子并因而不會使擴增復(fù)雜化的引物,隨后使用這些引物對含有單個人染色體的體細胞雜合子進行PCR篩選。只有那些含有相應(yīng)于引物的人基因的雜合子能得到擴增產(chǎn)物。
體細胞雜合子的PCR作圖是將特定DNA定位于特定染色體的一個快速程序。采用本發(fā)明相同的寡核苷酸引物,可以類似的方式將來自特定染色體的一組片段或大基因組克隆的集合體進行亞定位。其它的可類似用于染色體作圖的作圖策略包括原位雜交、用標記的流選的染色體進行的預(yù)篩選,以及通過雜交預(yù)選以構(gòu)建染色體-特異cDNA文庫。
cDNA克隆與中期染色體涂片的熒光原位雜交(FISH)可以用來提供精確的一步法染色體定位。這一技術(shù)可使用短至500或600bp的cDNA;然而,較大的克隆更易于與獨特的染色體位置結(jié)合以具有足夠的信號強度便于檢測。FISH需要使用衍生表達序列標記或EST的克隆,越長越好。例如,2000bp是好的,更好為4000bp,而超過4000則可能不是獲得好結(jié)果所必須的,因其時間不合理。此技術(shù)的綜述見Verma et al.,HumanChromosomesa Manual of Basic Techniques,Pergamon Press,New York(1988)。
一旦某一序列已被精確定位于染色體某一位置,則可比較該序列在染色體上的物理位置與遺傳圖譜資料的關(guān)系,這種資料例如可在V.McKusick,Mendelian Inheritance inMan中發(fā)現(xiàn)(可在線從Johns Hopkins University Welch Medical Library獲得)。隨后可通過連鎖分析(物理相鄰基因的共遺傳性)鑒別基因與已定位于相同染色體區(qū)的疾病之間的關(guān)系。
接著,必須確定感染個體和未感染個體之間的cDNA或基因組序列的差異,如果在一些或所有感染個體中觀察到某一突變而未在任何正常個體中觀察到這種突變,則該突變可能是該疾病的致病原。
應(yīng)用目前的物理作圖和遺傳作圖技術(shù)的分辨率,一種精確定位于與疾病有關(guān)的染色體區(qū)的cDNA可以是50-500個潛在的致病基因中的一個(這假定作圖分辨率為1兆堿基,并且每20kb為一個基因)。
使用含有hMLH2基因的5’區(qū)的基因組P1克隆(1670)已將hMLH2定位,對經(jīng)過復(fù)染顯帶的人中期染色體涂片的詳細分析表明hMLH2基因位于2q32帶。類似地,用含有hMLH3基因的3’區(qū)的基因組p1克隆(2053)將hMLH2定位,對經(jīng)過復(fù)染顯帶的人中期染色體涂片的詳細分析表明hMLH3基因位于7p22帶,即染色體7上的最遠帶。用各種基因組克隆分析表明hMLH3是一個全部位于染色體7上的相關(guān)基因亞族的一個成員。
多肽、其片段或其它衍生物、或其類似物、或表達其的細胞可用作免疫原生產(chǎn)抗體,這些抗體可以例如多克隆抗體或單克隆抗體。本發(fā)明還包括嵌合抗體、單鏈抗體、人源化抗體,以及Fab片段,或者Fab表達文庫的產(chǎn)物??墒褂矛F(xiàn)有技術(shù)中公知的各種程序生產(chǎn)這些抗體和片段。
抗對應(yīng)于本發(fā)明的序列的多肽的抗體可以通過將多肽直接注射給動物或?qū)⒍嚯慕o予動物、優(yōu)選非人而獲得,如此獲得的抗體隨后與多肽本身結(jié)合。以這種方式,僅編碼多肽的一個片段的序列也可用于生產(chǎn)與完整天然多肽結(jié)合的抗體,這種抗體隨后可用于從表達該多肽的組織中分離該多肽。
為制備單克隆抗體,可使用任何提供由連續(xù)細胞系培養(yǎng)物生產(chǎn)的抗體的技術(shù),例如雜交瘤技術(shù)(Kohler and Milstein,1975,Nature,256495-497),三瘤技術(shù),人B細胞雜交瘤技術(shù)(kozbor et al.,1983,Immunology Today 472),以及生產(chǎn)人單克隆多肽的EBV-雜交瘤技術(shù)(Cole,et al.,1985,in Monoclonal Antibodies and CancerTherapy,Alan R.Liss,Inc.,pp.77-96)。
用于生產(chǎn)單鏈抗體的技術(shù)(USP4.946,778)可以用來生產(chǎn)本發(fā)明的免疫原性多肽產(chǎn)物的單鏈抗體。另外,轉(zhuǎn)基因小鼠也可用來表達本發(fā)明的免疫原性多肽產(chǎn)物的人源化單鏈抗體。
以下將參照實施例進一步描述本發(fā)明,但是應(yīng)理解的是,本發(fā)明不受這些實施例的限制。除非另有說明,所有的份或量均為重量份或重量。
為促進對下述實施例的理解,以下將描述以下常用的方法和/或術(shù)語。
“質(zhì)?!钡拿菍⑿懽帜竝置于前面和/或后跟大寫字母和/或數(shù)字。本文的起始質(zhì)?;蛘呤巧藤彽玫降模蛘呤枪娍梢圆皇芟拗频氐玫降?,或者可以根據(jù)公布的程序由可得到的質(zhì)粒構(gòu)建的。另外,與所述的這些等效的質(zhì)粒是本領(lǐng)域公知的,并對本領(lǐng)域普通技術(shù)人員是顯而易見的。
DNA的“消化”是指用僅作用于DNA的特定序列的限制性酶對DNA的催化裂解。本文所用的各種限制性酶是可商購的,其反應(yīng)條件、輔因子和其它要求對于本領(lǐng)域普通技術(shù)人員是公知的。為分析目的,典型地,1μg質(zhì)?;駾NA片段使用約2單位的酶,反應(yīng)體積為20μl緩沖液;為分離DNA片段用于構(gòu)建質(zhì)粒的目的,典型地,在較大體積中用20-250單位酶消化5-50μg DNA。對特定限制性酶的合適的緩沖液和底物由廠商提供。通常使用37℃1小時的溫育時間,但可根據(jù)供應(yīng)商的指示而變化。消化后,將反應(yīng)物直接在聚丙烯酰胺凝膠上電泳以分離所需片段。
裂解片段的大小分離是根據(jù)Goeddel,D.et al.,Nucleic Acids Res.,84057(1980)所述在8%聚丙烯酰胺凝膠上進行。
“寡核苷酸”是指可化學(xué)合成的單鏈聚脫氧核苷酸或兩個互補的聚脫氧核苷酸鏈。這種合成的寡核苷酸沒有5’磷酸,并因此如果不在激酶的存在下用ATP加上磷酸則不能與另一寡核苷酸連接。合成的寡核苷酸將與沒有經(jīng)過脫磷酸化的片段連接。
“連接”是指在兩個雙鏈核酸片段之間形成磷酸二酯鍵的過程(Maniatis,T.,et al.,Id.,p.146)。除非另有說明,連接可以采用公知的緩沖液,在每0.5μg約等摩爾的待連接DNA片段使用10單位T4 DNA連接酶(“連接酶”)的條件下進行。
除非另有說明,使用Graham,F(xiàn).and Van der Eb.A.,Virology,52456-457(1973)的方法進行轉(zhuǎn)化。實施例1 hMLH1的細菌表達編碼人DNA錯配修復(fù)蛋白hMLH1,ATCC#75649的全長DNA序列首先用對應(yīng)于該DNA的5’和3’末端的PCR寡核苷酸引物進行擴增以合成插入片段。5’寡核苷酸引物的序列為5’CGGGATCCATGTCGTTCGTGGCAGGG 3’(SEQ ID N0.34),其含有一BamHI限制性酶位點,后接由起始密碼子開始的18個hMLH1編碼序列的核苷酸;3’引物序列為5’GCTCTAGATTAACACCTCTCAAAGAC 3’(SEQ ID NO.35),其含有互補于一XbaI位點的序列并位于基因的末端。限制性酶位點對應(yīng)于細菌表達載體pQE-9(Qiagen,Inc.,Chatsworth,CA)上的限制性酶位點,該質(zhì)粒載體編碼抗生素抗性(Amp′)、一個細菌復(fù)制起點(ori)、一個IPTG-可調(diào)控啟動子/操縱子(P/O)、一個核糖體結(jié)合位點(RBS)、一個6-組氨酸標記(6-His)和限制性酶克隆位點。用BamHI和XbaI消化pQE-9載體,隨后將插入片段連接到pQE-9載體,同時保持由細菌RBS起始的讀框。隨后用連接混合物轉(zhuǎn)化E.coli菌株M15/rep4(Qiagen,Inc.),該菌株含有多拷貝的表達1acI抑制子并賦予卡那霉素抗性(Kan′)的質(zhì)粒pREP4。在LB平板上培養(yǎng)轉(zhuǎn)化子并篩選氨芐青霉素/卡那霉素抗性克隆,從中分離質(zhì)粒DNA并用限制性分析確證。在補加Amp(100μg/ml)和Kan(25μg/ml)的液體LB培養(yǎng)基中將含有所需構(gòu)建物的克隆培養(yǎng)過夜(O/N),O/N培養(yǎng)物以1∶100-1∶250的比例接種到大體積培養(yǎng)物中,培養(yǎng)細胞至光密度600(O.D.600)為0.4-0.6。隨后加入IPTG(異丙基-B-D-硫代半乳糖吡喃糖苷)至終濃度為1mM,通過使lacI抑制子失活,IPTG誘導(dǎo)激活P/O,使基因表達水平提高。再培養(yǎng)細胞3-4小時,隨后離心(6000g,20分鐘)收集細胞,將細胞溶解在離液劑6M鹽酸胍中,澄清后,在使得與含6-His標記的蛋白質(zhì)緊密結(jié)合的條件下,通過鎳-螯合柱層析(Hochuli,E.et al.,Genetic Engineeting,Principles & Methods,1287-98(1990))從溶液中純化溶解的hMLH1。將蛋白質(zhì)從GnHCl中復(fù)性可通過幾種方法進行(Jaenieke,R.and Rudolph,R.,Protein Structure-A Practical Approach,IRLPress,New York(1990))。首先,采用透析步驟除去GnHCl,或者,可以將從Ni-螯合柱分離的純化蛋白質(zhì)結(jié)合到第二個柱上,該柱通過一遞減的線性GnHCl梯度,在結(jié)合到該柱的同時使得蛋白質(zhì)復(fù)性,隨后用含250mM咪唑、150mMNaCl、25mM Tris-HCl pH7.5和10%甘油的緩沖液洗脫該蛋白質(zhì)。最后,對含有5mM碳酸氫銨的貯存緩沖液透析溶解蛋白,用SDS-PAGE分析純化的蛋白質(zhì)。實施例2自發(fā)突變分析以檢測hMLH1、hMLH2和hMLH3的表達及與E.coli mutl的互補作用將pQE9hMLH1、pQE9hMLH2或pQE9hMLH3/GW3733轉(zhuǎn)化子進行自發(fā)突變分析,同時用質(zhì)粒載體pQE9轉(zhuǎn)化AB1157(k-12,argE3 hisG4,LeuB6 proA2 thr-1 ara-1 rpsL31 supE44tsx-33)和GW3733以分別用作陽性和陰性對照。
于37℃在LB氨芐青霉素培養(yǎng)基中將接種約100-1000個E.coli的15個2ml培養(yǎng)物培養(yǎng)至2×108細胞/ml,將10微升每個培養(yǎng)物稀釋并在LB氨芐青霉素培養(yǎng)基平板上鋪板以測定活細胞數(shù)。其余的每個培養(yǎng)物的細胞在鹽水中濃縮并在缺乏精氨酸的基本培養(yǎng)基平板上鋪板以檢測Arg的轉(zhuǎn)變。在表3中,每個培養(yǎng)物的突變平均數(shù)(m)是根據(jù)等式(r/m)-ln(m)=1.24(Lea et al.,J.Genetics 49264-285(1949))從每一分布的突變子的中間值(r)計算得來。每代的突變率記為m/N,N代表每個培養(yǎng)物的平均細胞數(shù)。
表3自發(fā)突變率菌株突變/代AB1157+載體(5.6±0.1)×10-9aGW3733+載體(1.1±0.2)×10-6aGW3733+phMLH1 (3.7±1.3)×10-7aGW3733+phMLH2 (3.1±0.6)×10-7bGW3733+phMLH3 (2.1±0.8)×10-7ba三次實驗的平均b四次實驗的平均功能互補結(jié)果顯示,人mutL可以部分補救E.coli mutL突變子表型,提示人mutL不僅成功地在細菌表達系統(tǒng)中表達,而且還在細菌中發(fā)揮功能。實施例3 hMLH1的染色體作圖根據(jù)HMLH1的cDNA的5’端序列設(shè)計一套寡核苷酸引物,該套引物跨越一94bp的區(qū)段。在聚合酶鏈反應(yīng)中以如下條件使用該套引物30秒,95℃1分鐘,56℃1分鐘,70℃重復(fù)這一循環(huán)32次,然后接一個5分鐘,70℃的循環(huán)。除體細胞雜種庫(Bios,Inc.)之外,使用人、小鼠和倉鼠DNA作為模板。在8%聚丙烯酰胺凝膠或3.5%瓊脂糖凝膠上分析反應(yīng)物,在人基因組DNA樣品和對應(yīng)于染色體3的體細胞雜種樣品中觀察到一94堿基對的帶。另外,使用其它體細胞雜種基因組DNA,hMLH1基因被定位于染色體3p。實施例4在HNPCC血緣族中確定hMLH1基因突變的方法從屬于HNPCC血緣族的人的組織樣品得到的RNA生產(chǎn)cDNA,該cDNA用作PCR模板,使用的引物為5’GCATCTAGACGTTTCCTTGGC 3’(SEQ ID NO.36)和5’CATCCAAGCTTCTGTTCCCG 3’(SEQ ID NO.37),使圖1的1-394密碼子得以擴增;5’GGGGTGCAGCAGCACATCG 3’(SEQ ID NO.38)和5’GGAGGCAGAATGTGTGAGCG 3’(SEQID NO.39),使圖1(SEQ ID NO.2)的326-729密碼子得以擴增;5’TCCCAAAGAAGGACTTGCT 3’(SEQ ID NO.40)和5’AGTATAAGTCTTAAGTGCTACC 3’(SEQID NO.41),使圖1(SEQ ID NO.2)的密碼子602-756和3’-非翻譯序列的128個核苷酸得以擴增,所有分析所用的PCR條件由35個下述循環(huán)構(gòu)成,即在San Sidransky,D.et al.,Science,252706(1991)所述的緩沖溶液中95℃30秒,52-58℃60-120秒,和70℃60-120秒。用T4多核苷酸激酶標記5’端的引物,采用SequiTherm聚合酶(Epicentre Technologies)對PCR產(chǎn)物進行測序。還測定了選定的外顯子的內(nèi)含子-外顯子分界區(qū)并分析了基因組PCR產(chǎn)物以證實所述結(jié)果。隨后對帶有可能的突變的PCR產(chǎn)物進行克隆和測序以證實直接測序的結(jié)果,將PCR產(chǎn)物克隆到Holton,T.A.andGraham,M.W.,Nucleic Acids Research,191156(1991)所述的T-加尾的載體中,并用T7聚合酶(United States Biochemical)測序。7個血緣族的感染個體均顯示hMLH1基因的578-632密碼子雜合缺失。這7個血緣族中的5個的起源可以追溯到一共同的祖先。密碼子578-632的周圍的基因組序列是如下確定,即根據(jù)廠商所述,通過用T4多核苷酸激酶標記的引物,采用SequiTherm聚合酶對P1克隆(含有全長hMLH1基因的人基因組P1文庫(Genome Systems))進行循環(huán)測序,并對基因組DNA的PCR產(chǎn)物測序。用于擴增含密碼子578-632的外顯子的引物為5’TTTATGGTTTCTCACCTGCC 3’(SEQID NO.42)和5’GTTATCTGCCCACCTCAGC 3’(SEQ ID NO.43),PCR產(chǎn)物包括該外顯子上游的內(nèi)含子C的105bp和下游的117bp。在血緣族中未觀察到PCR產(chǎn)物中的突變,所以RNA中的缺失不是由于簡單的剪接位點突變。發(fā)現(xiàn)密碼子578-632構(gòu)成了在上述血緣族的基因產(chǎn)物中缺失的一個單一的外顯子,該外顯子含有若干個高度保守的氨基酸。
在第二家族(L7)中,使用上述引物進行PCR,觀察到在密碼子727的第一個核苷酸(nt)起始的4bp缺失,這產(chǎn)生了一移碼,在下游166nt有一新終止密碼子,導(dǎo)致hMLH1的羧基末端29個氨基酸由53個不同的氨基酸置換,其中一些氨基酸是由3’非翻譯區(qū)的正常nt編碼的。
用上述引物進行PCR后在一不同的血緣族(L2516)中發(fā)現(xiàn)了一不同的突變,該突變由密碼子755-765之間的4bp的插入組成,所述的插入產(chǎn)生移碼并使ORF延伸包括正常終止密碼子下游的102個核苷酸(34個氨基酸)。因此,預(yù)計血緣族L7和L2516的突變均改變了hMLH1的C-末端。
當(dāng)血緣族太小而不能進行連鎖研究時,根據(jù)所編碼的蛋白質(zhì)的大小的變化確定hMLH1基因的可能的突變。用于hMLH1的偶聯(lián)的轉(zhuǎn)錄-翻譯的引物為,對于圖1的密碼子1-394,引物為5’GGATCCTAATACGACTCACTATAGGGAGACCACCATGGCATCTAGACGTTTCCCTTGGC3’(SEQ ID NO.44)和5’CATCCAAGCTTCTGTTCCCG 3’(SEQ ID NO.45);對于圖1(SEQ ID NO.2)的密碼子326-729,引物為5’GGATCCTAATACGACTCACTATAGGGAGACCACCATGGGGGTGCAGCAGCACATCG 3’(SEQ IDNO.46)和5’GGAGGCAGAATGTGTGAGCG 3’(SEQ ID NO.47)。產(chǎn)生的PCR產(chǎn)物具有T7聚合酶引導(dǎo)的轉(zhuǎn)錄的信號以及在5’末端起始翻譯的信號。使用來源于18個血緣族患者的原始淋巴樣細胞的RNA擴增2個產(chǎn)物,分別從密碼子1延伸到密碼子394或者由密碼子326延伸到密碼子729,隨后體外轉(zhuǎn)錄和翻譯該PCR產(chǎn)物,利用參入PCR引物中的轉(zhuǎn)錄-翻譯信號。如Powell,S.M.et al.,New England Journal of Medicine,3291982(1993)所述,使用40μCI的35S標記的甲硫氨酸,在偶聯(lián)的轉(zhuǎn)錄-翻譯反應(yīng)中使用PCR產(chǎn)物為模板,在樣品緩沖液中稀釋樣品,煮沸5分鐘,在含10-20%丙烯酰胺梯度的十二烷基硫酸鈉-聚丙烯酰胺凝膠上電泳分析樣品。干燥凝膠并放射顯影,所有樣品均顯示具有期望大小的多肽,但在一例中另外發(fā)現(xiàn)一種異常遷移的多肽。確定相關(guān)PCR產(chǎn)物的序列,并發(fā)現(xiàn)在密碼子347的第一個核苷酸(nt)起始有一371bp的缺失,這一變化是以雜合形式存在,產(chǎn)生一在密碼子346下游30nt處的新的終止密碼子的移碼,由此可以解釋所觀察到的截短的多肽。
檢查了4株顯示微衛(wèi)星不穩(wěn)定性的結(jié)腸癌細胞系,其中之一(細胞系H6)在這一檢測中顯示無正常肽,僅產(chǎn)生一種遷移為27kd的短產(chǎn)物。確定其相應(yīng)的cDNA的序列,發(fā)現(xiàn)在密碼子252有一C→A的顛換,產(chǎn)生Ser由終止密碼子的取代。與翻譯分析相符,在這一腫瘤的cDNA或基因組DNA中的正常C位置未見條帶,提示其喪失了有功能的hMLH1基因。
表4列出了這些測序分析的結(jié)果,在已知有結(jié)腸癌家族史的患者中發(fā)現(xiàn)了缺失,更具體地,10個家族中有9個顯示hMLH1突變。
表4 hMLH3中的突變的概括cDNA核苷酸 預(yù)期的樣品 密碼子 改變 編碼改變血緣族F2,F(xiàn)3,F(xiàn)6,F(xiàn)8 578-632 165bp缺失讀框內(nèi)缺失F10,F(xiàn)11,F(xiàn)52血緣族L7 727/728 4bp缺失 移碼及新氨基酸(TCACACATTC變?yōu)?的取代TCATTCT)血緣族L2516 755/756 4bp插C末端延伸(GTGTTAA變?yōu)镚TGTTTGTTAA)血緣族RA 347 371bp缺失 移碼及截短H6結(jié)腸癌 252 顛換(TCA變?yōu)門AA)絲氨酸變?yōu)榻K止實施例5 hMLH2的細菌表達和純化編碼hMLH2,ATCC#75651的DNA序列首先用對應(yīng)于該DNA的5’和3’末端的PCR寡核苷酸引物進行擴增以合成插人片段。5’寡核苷酸引物的序列為5’CGGGATCCATGAAACAATTGCCTGCGGC 3’(SEQ ID NO.48),其含有一BamHI限制性酶位點,后接由起始密碼子開始的17個hMLH2編碼序列的核苷酸;3’引物序列為5’GCTCTAGACCAGACTCATGCTGTTTT 3’(SEQ ID NO.49),其含有互補于一XbaI位點的序列并后接18個hMLH2的核苷酸。限制性酶位點對應(yīng)于細菌表達載體pQE-9(Qiagen,Inc.,Chatsworth,CA)上的限制性酶位點,該質(zhì)粒載體編碼抗生素抗性(Amp′)、一個細菌復(fù)制起點(ori)、一個IPTG-可調(diào)控啟動子/操縱子(P/O)、一個核糖體結(jié)合位點(RBS)、一個6-組氨酸標記(6-His)和限制性酶位點。用BamHI和XbaI消化擴增的序列和pQE-9載體,隨后將擴增的序列連接到pQE-9載體,并插入與編碼組氨酸標記和RBS序列相同的讀框。隨后用連接混合物轉(zhuǎn)化E.coli菌株M15/rep4(Qiagen,Inc.),該菌株含有多拷貝的表達lacI阻抑物并賦予那霉素抗性(Kan′)的質(zhì)粒pREP4。在LB平板上培養(yǎng)轉(zhuǎn)化子并篩選氨芐青霉素/卡那霉素抗性克隆,從中分離質(zhì)粒DNA并用限制性分析確證。在補加Amp(100μg/ml)和Kan(25μg/ml)的液體LB培養(yǎng)基中將含有所需構(gòu)建物的克隆培養(yǎng)過夜(O/N),O/N培養(yǎng)物以1∶100-1∶250的比例接種到大體積培養(yǎng)基中,培養(yǎng)細胞至光密度600(0.D.600)為0.4-0.6。隨后加入IPTG(異丙基-B-D-硫代半乳糖吡喃糖苷)至終濃度為1mM,通過使lacI阻抑物失活,IPTG誘導(dǎo)激活P/O,使基因表達水平提高。再培養(yǎng)細胞3-4小時,隨后離心(6000g,20分鐘)收集細胞,將細胞溶解在離液劑6M鹽酸胍中,澄清后,在使得與含6-His標記的蛋白質(zhì)緊密結(jié)合的條件下,通過鎳-螯合柱層析(Hochuli,E.et al.,GeneticEngineering,Principles & Methods,1287-98(1990))從溶液中純化溶解的hMLH2。將蛋白質(zhì)從GnHCl中復(fù)性可通過幾種方法進行(Jaenicke,R.and Rudolph,R.,ProteinStructure-A Practical Approach,IRL Press,New York(1990))。首先,采用透析步驟除去GnHCl,或者,可以將從Ni-螯合柱分離的純化蛋白質(zhì)結(jié)合到第二個柱上,該柱有一遞減的線性GnHCl梯度,在結(jié)合到該柱的同時使得蛋白質(zhì)復(fù)性,隨后用含250mM咪唑、150mM NaCl、25mM Tris-HCl pH7.5和10%甘油的緩沖液洗脫該蛋白質(zhì)。最后,對含有5mM碳酸氫銨的貯存緩沖液透析溶解蛋白,用SDS-PAGE分析純化的蛋白質(zhì)。實施例6 hMLH3的細菌表達和純化編碼hMLH3,ATCC#75650的DNA序列首先用對應(yīng)于該DNA序列的5’和3’末端的PCR寡核苷酸引物進行擴增以合成插入片段。5’寡核苷酸引物的序列為5’CGGGATCCATGGAGCGAGCTGAGAGC 3’(SEQ ID NO.50),其含有一BamHI限制性酶位點,后接18個由加工后的蛋白的推測的末端氨基酸起始的hMLH3編碼序列的核苷酸;3’引物序列為5’GCTCTAGAGTGAAGACTCTGTCT 3’(SEQ ID NO.51),其含有互補于一XbaI位點的序列并后接18個hMLH3的核苷酸。限制性酶位點對應(yīng)于細菌表達載體pQE-9(Qiagen,Inc.,Chatsworth,CA)上的限制性酶位點,該質(zhì)粒載體編碼抗生素抗性(Amp′)、一個細菌復(fù)制起點(ori)、一個IPTG-可調(diào)控啟動子/操縱子(P/O)、一個核糖體結(jié)合位點(RBS)、一個6-組氨酸標記(6-His)和限制性酶位點。用BamHI和XbaI消化擴增的序列和pQE-9載體,隨后將擴增的序列連接到pQE-9載體,并插入與編碼組氨酸標記和RBS序列相同的讀框。隨后用連接混合物轉(zhuǎn)化E.coli菌株M15/rep4(Qiagen,Inc.),該菌株含有多拷貝的表達lacI阻抑物并賦予卡那霉素抗性(Kan′)的質(zhì)粒pREP4。在LB平板上培養(yǎng)轉(zhuǎn)化子并篩選氨芐青霉素/卡那霉素抗性克隆,從中分離質(zhì)粒DNA并用限制性分析確證。在補加Amp(100μg/ml)和Kan(25μg/ml)的液體LB培養(yǎng)基中將含有所需構(gòu)建物的克隆培養(yǎng)過夜(O/N),O/N培養(yǎng)物以1∶100-1∶250的比例接種到大體積培養(yǎng)基中,培養(yǎng)細胞至光密度600(0.D.600)為0.4-0.6。隨后加入IPTG(異丙基-B-D-硫代半乳糖吡喃糖苷)至終濃度為1mM,通過使lacI阻抑物失活,IPTG誘導(dǎo)激活P/O,使基因表達水平提高。再培養(yǎng)細胞3-4小時,隨后離心(6000g,20分鐘)收集細胞,將細胞溶解在離液劑6M鹽酸胍中,澄清后,在使得與含6-His標記的蛋白質(zhì)緊密結(jié)合的條件下,通過鎳-螯合柱層析(Hochuli,E.etal.,Genetic Engineering,Principles & Methods,1287-98(1990))從溶液中純化溶解的stanniocalcin。將蛋白質(zhì)從GnHCl中復(fù)性可通過幾種方法進行(Jaenicke,R.andRudolph,R.,Protein Structure-A Practical Approach,IRL Press,New York(1990))。首先,采用透析步驟除去GnHCl,或者,可以將從Ni-螯合柱分離的純化蛋白質(zhì)結(jié)合到第二個柱上,該柱有一遞減的線性GnHCl梯度,在結(jié)合到該柱的同時使得蛋白質(zhì)復(fù)性,隨后用含250mM咪唑、150mM NaCl、25mM Tris-HCl pH7.5和10%甘油的緩沖液洗脫該蛋白質(zhì)。最后,對含有5mM碳酸氫銨的貯存緩沖液透析溶解蛋白,用SDS-PAGE分析純化的蛋白質(zhì)。實施例7在遺傳性癌癥中確定hMLH2和hMLH3突變的方法分離基因組克隆用用于選擇hMLH2和hMLH3的cDNA序列的引物通過PCR篩選人基因組P1文庫(Genomic Systems,Inc.),使用引物5’AAGCTGCTCTGTTAAAAGCG 3’(SEQ ID NO.52)和5’GCACCAGCATCCAAGGAG 3’(SEQ ID NO.53)分離兩個用于hMLH2的克隆并產(chǎn)生一133bp的產(chǎn)物。使用引物5’CAACCATGAGACACATCGC 3’(SEQ ID NO.54)和5’AGGTTAGTGAAGACTCTGTC 3’(SEQ ID NO.55)分離三個用于hMLH3的克隆并產(chǎn)生一121bp的產(chǎn)物。用地高辛配基脫氧尿嘧啶5’-三磷酸(Boehringer Manheim)對基因組克隆進行缺口翻譯,如Johnson,Cg.et al.,Methods Cell Biol.,3573-99(1991)所述進行FISH。使用非常過量的用于與表達的hMLH3基因座特異雜交的人cot-1DNA進行與hMLH3探針的雜交。用4,6-二氨基-2-苯基吲哚和碘化丙錠對染色體進行復(fù)染,產(chǎn)生C-和R-帶的組合。使用三帶濾色片(Chroma Technology,Brattleboro,VT)和冷電偶聯(lián)相機(Photometrics,Tucson,AZ)及可變激發(fā)波長濾色片(Johnson,Cv etal.,Genet.Anal.Tech.Appl.,875(1991))得到用于精確作圖的對比圖象。采用IseeGraphical Program System(Inovision Corporation,Durham,NC)進行圖象采集、分析和染色體切片長度測量。轉(zhuǎn)錄偶聯(lián)翻譯突變分析為進行IVSP分析,將hMLH2基因分成3個互相重疊的區(qū)段,第一個區(qū)段包括密碼子1-500,中間區(qū)段包括密碼子270-755,而最后一個區(qū)段包括密碼子48 5至翻譯終止位點密碼子933。用于第一區(qū)段的引物為5’GGATCCTAATACGACTCACTATAGGGAGACCACCATGGAACAATTGCCTGCGG 3’(SEQ ID NO.56)和5’CCTGCTCCACTCATCTGC 3’(SEQ ID NO.57);用于中間區(qū)段的引物為5’GGATCCTAATACGACTCACTATAGGGAGACCACCATGGAAGATATCTTAAAGTTAATCCG 3’(SEQ ID NO.58)和5,GGCTTCTTCTACTCTATATGG 3’(SEQ ID NO.59);用于最后區(qū)段的引物為5’GGATCCTAATACGACTCACTATAGGGAGACCACCATGGCAGGTCTTGAAAACTCTTCG 3’(SEQ ID NO.60)和5,AAAACAAGTCAGTGAATCCTC 3’(SEQ ID NO.61)。用于在患者CW中定位終止突變的引物全部使用與第一區(qū)段相同的5’引物。3’嵌套引物為5’AAGCACATCTGTTTCTGCTG 3’(SEQ ID NO.62)密碼子1-369;5’ACGAGTAGATTCCTTTAGGC 3’(SEQ ID NO.63)密碼子1-290;以及5’CAGAACTGACATGAGAGCC 3’(SEQ ID NO.64)密碼子1-214。
為分析hMLH3,將hMLH3 cDNA擴增為全長產(chǎn)物或2個重疊區(qū)段,用于全長hMLH3的引物為5’GGATCCTAATACGACTCACTATAGGGAGACCACCATGGAGCGAGCTGAGAGC 3’(SEQ ID NO.65)和5’AGGTTAGTGAAGACTCTGTC 3’(SEQ ID NO.66)(密碼子1-863)。對于區(qū)段1,有義引物與上述相同,反義引物為5’CTGAGGTCTCAGCAGGC 3’(SEQ ID NO.67)(密碼子1-472)。區(qū)段2的引物為5’GGATCCTAATACGACTCACTATAGGGAGACCACCATGGTGTCCATTTCCAGACTGCG 3’(SEQ ID NO.68)和5’AGGTTAGTGAAGACTCTGTC 3’(SEQ ID NO.69)(密碼子415-863)。如下進行擴增。
PCR產(chǎn)物含有供T7 RNA聚合酶轉(zhuǎn)錄和供其在5’末端翻譯起始的識別信號。在含有40μCi的36S-甲硫氨酸(NEN,Dupont)的偶聯(lián)轉(zhuǎn)錄-翻譯反應(yīng)物中PCR產(chǎn)物用作模板,在SDS樣品緩沖液中稀釋樣品,并在含10-20%丙烯酰胺梯度的SDS-聚丙烯酰胺凝膠上電泳分析樣品。凝膠經(jīng)固定、用EnHance(Dupont)處理、干燥后進行放射自顯影。RT-PCR和PCR產(chǎn)物的直接測序用Superscript II(Life Technologies)從原始淋巴樣細胞或腫瘤細胞的RNA產(chǎn)生cDNA,這些eDNA隨后用作PCR模板,所有擴增反應(yīng)的條件為在緩沖液中95℃30秒、52℃-62℃60-120秒和70℃60-120秒共35個循環(huán)。將PCR產(chǎn)物直接測序并克隆進T-加尾的克隆載體PCR2000(Invitrogen)并用T7聚合酶(United StatesBiochemical)測序。為PCR產(chǎn)物的直接測序,首先用苯酚氯仿抽提并用乙醇沉淀PCR反應(yīng)物。根據(jù)廠商所述,使用Sequitherm聚合酶(Epicentre Technologies)和γ-32P標記的引物對模板直接測序。內(nèi)含子/外顯子邊界及突變的基因組分析根據(jù)廠商所述,使用Sequitherm聚合酶和γ-32P標記的引物對P1克隆循環(huán)測序以確定內(nèi)含子/外顯子邊界。用于擴增含密碼子195-233的hMLH2外顯子的引物為5’TTATTTGGCAGAAAAGCAGAG 3’(SEQ ID NO.70)和5’TTAAAAGACTAACCTCTTGCC 3’(SEQ IDNO.71),其產(chǎn)生一215bp產(chǎn)物。使用引物5’CTGCTGTTATGAACAATATGG 3’(SEQ ID NO.72)對該產(chǎn)物循環(huán)測序。用于分析患者GC的hMLH3的基因組缺失的引物為對于5’區(qū)擴增為5’CAGAAGCAGTTGCAAAGCC 3’(SEQ ID NO.73)和5’AAACCGTACTCTTCACACAC 3’(SEQID NO.74),其產(chǎn)生一含密碼子233-257的74bp產(chǎn)物;引物5’GAGGAAAAGCTTTTGTTGGC3’(SEQ ID NO.75)和5’CAGTGGCTGCTGACTGAC 3’(SEQ ID NO.76),其產(chǎn)生一含密碼子34 7-377的93bp產(chǎn)物;以及引物5’TCCAGAACCAAGAAGGAGC 3’(SEQ ID NO.77)和5’TGAGGTCTCAGCAGGC 3’(SEQ ID NO.78),其產(chǎn)生一含密碼子439-472的99bp產(chǎn)物。
表5來自感染HNPCC的患者的HMLH2和HMLH3中的突變概括樣品 密碼子 核苷酸cDNA改變 基因組改變 預(yù)期的編碼改變HMLH2CW 233跳過外顯子 CAG→TAG GLN終止密碼子HMLH3MM、NS、TF 20 CGG→CAG CGG→CAG ARG→GLNGC 268-6691203bp缺失 缺失 符合讀框的缺失Gcx268-6691203bp缺失 缺失 移碼,截短根據(jù)上述教導(dǎo),本發(fā)明可有各種改進和變動,因此在所附權(quán)利要求的范圍內(nèi),本發(fā)明可以與所述不同的方式實施。
序列表(1)一般信息(i)申請人人體基因組科學(xué)有限公司(ii)發(fā)明名稱人DNA錯配修復(fù)蛋白(iii)序列數(shù)78(iv)聯(lián)系地址(A)聯(lián)系人CARELLA,BYRNE,BAIN,GILFILLAN,CECCHI,STEWART& OLSTEIN(B)街道6 BECKER FARM ROAD(C)城市ROSELAND(D)州新澤西州(E)國家美國(F)郵編07068(v)計算機可讀形式(A)媒介類型3.5寸軟盤(B)計算機IBM PS/2(C)操作系統(tǒng)MS-DOS(D)軟件WORD PERFECT 5.1(vi)本申請資料(A)申請?zhí)朠CT/US95/01035(B)申請日1995年1月25日(C)分類未分(v)在先申請資料(A)申請?zhí)?8/294,312(B)申請日1994年8月23日(C)分類(vi)在先申請資料(A)申請?zhí)?8/210,143(B)申請日1994年3月16日(C)分類(vii)在先申請資料(A)申請?zhí)?8/187,757(B)申請日1994年1月27日(C)分類(vi)律師/代理人信息
(A)姓名FERRAR0,GREGORY D.
(B)注冊號36,134(C)案號/文檔號325800-303(viii)通訊信息(A)電話201-994-1700(B)傳真201-994-1744(2)SEQ ID NO1的信息(i)序列特征(A)長度2525bp(B)類型核酸(C)鏈性單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO1GTTGAACATC TAGACGTTTC CTTGGCTCTT CTGGCGCCAA AATGTCGTTC GTGGCAGGGG 60TTATTCGGCG GCTGCACGAG ACAGTGGTGA ACCGCATCGC GGCGGGGGAA GTTATCCAGC120GGCCAGCTAA TGCTATCAAA GAGATGATTG AGAACTGTTT AGATGCAAAA TCCACAAGTA180TTCAAGTGAT TGTTAAAGAG GGAGGCCTGA AGTTGATTCA GATCCAAGAC AATGGCACCG240GGATCAGGAA AGAAGATCTG GATATTGTAT GTGAAAGTGT CACTACTAGT AAACTGCAGT300CCTTTGAGGA TTTAGCCAGT ATTTCTATCT ATGGCTTTCG AGGTGAGGCT TTGGCCAGCA360TAAGCCATGT GGCTCATGTT ACTATTACAA CGAAAACAGC TGATGGAAAG TGTGCATACA420GAGCAAGTTA CTCAGATGGA AAACTGAAAG CCCCTCCTAA ACCATGTGCT GGCAATCAAG480GGACCCAGAT CACGGTGGAG GACCTTTTTT ACAACATAGC CACGAGGAGA AAAGCTTTAA540AAAATCCAAG TGAAGAATAT GGGAAAATTT TGGAAGTTGT TGGCAGGTAT TCAGTACACA600ATGCAGGCAT TAGTTTCTCA GTTAAAAAAC AAGGAGAGAC AGTAGCTGAT GTTAGGACAC660TACCCAATGC CTCAACCGTG GACAATATTC GCTCCGTCTT GGGAAATGCT GTTAGTCGAG720AACTGATAGA AATTGGATGT GAGGATAAAA CCCTAGCCTT CAAAATGAAT GGTTACATAT780CCAATGCAAA CTACTCAGTG AAGAAGTGCA TCTTCTTACT CTTCATCAAC CATCGTCTGG840TAGAATCAAC TTCCTTGAGA AAAGCCATAG AAACAGTGTA TGCAGCCTAT TTGCCAAAAA900ACACACACCC ATTCCTGTAC CTCAGTTTAG AAATCAGTCC CCAGAATGTG GATGTTAATG960TGAACCCCAC AAAGCATGAA GTTCACTTCC TGCACGAGGA GAGCATCCTG GAGCGGGTGC 1020AGCAGCACAT CGAGAGCAAG CTCCTGGGCT CCAATTCCTC CAGGATGTAC TTCACCCAGA 1080CTTTGCTACC AGGACTTGCT GGCCCCTCTG GGGAGATGGT TAAATCCACA ACAAGTCTCA 1140CCTCGTCTTC TACTTCTGGA AGTAGTGATA AGGTCTATGC CCACCAGATG GTTCGTACAG 1200ATTCCCGGGA ACAGAAGCTT GATGCATTTC TGCAGCCTCT GAGCAAACCC CTGTCCAGTC 1260AGCCCCAGGC CATTGTCACA GAGGATAAGA CAGATATTTC TAGTGGCAGG GCTAGGCAGC 1320AAGATGAGGA GATGCTTGAA CTCCCAGCCC CTGCTGAAGT GGCTGCCAAA AATCAGAGCT 1380TGGAGGGGGA TACAACAAAG GGGACTTCAG AAATGTCAGA GAAGAGAGGA CCTACTTCCA 1440GCAACCCCAG AAAGAGACAT CGGGAAGATT CTGATCTCCA AATCCTCGAA GATGATTCCC 1500GAAAGGAAAT GACTGCAGCT TGTACCCCCC GGAGAAGGAT CATTAACCTC ACTAGTGTTT 1560TGAGTCTCCA GGAAGAAATT AATGAGCAGG GACATGAGGT TCTCCGGGAG ATGTTGCATA 1620ACCACTCCTT CGTGGGCTGT GTGAATCCTC AGTGGGCCTT GGCACAGCAT CAAACCAAGT 1680TATACCTTCT CAACACCACC AAGCTTAGTG AAGAACTGTT CTACCAGATA CTCATTTATG 1740ATTTTGCCAA TTTTGGTGTT CTCAGGTTAT CGGAGCCAGC ACCGCTCTTT GACCTTGCCA 1800TGCTTCCCTT ACATAGTCCA GAGAGTGGCT GGACAGAGGA AGATGGTCCC AAAGAAGGAC 1860TTGCTGAATA CATTGTTGAG TTTCTGAAGA AGAAGGCTGA GATGCTTGCA GACTATTTCT 1920CTTTGGAAAT TGATGAGGAA GGGAACCTGA TTGGATTACC CCTTCTGATT GACAACTATG 1980TGCCCCCTTT GGAGGGACTG CCTATCTTCA TTCTTCCACT AGCCACTGAG GTGAATTGGG 2040ACGAAGAAAA GGAATGTTTT GAAAGCCTCA GTAAAGAATG CGCTATGTTC TATTCCATCC 2100GGAAGCAGTA CATATCTGAG GAGTCGACCC TCTCAGGCCA GCAGAGTGAA GTGCCTGGCT 2160CCATTCCAAA CTCCTGGAAG TGGACTGTGG AACACATTGT CTATAAAGCC TTGCGCTCAC 2220ACATTCTGCC TCCTAAACAT TCCACAGAAG ATGGAAATAT CCTGCAGCTT GCTAACCTGC 2280CTGATCTATA CAAAGTCTTT GAGAGGTGTT AAATATGGTT ATTTATGCAC TGTGGGATGT 2340GTTCTTCTTT CTCTGTATTC CGATACAAAG TGTTGTACTA AAGTGTGATA TACAAAGTGT 2400ACCAACATAA GTGTTGGTAG CACTTAAGAC TTATACTTGC CTTCTGATAG TATTCCTTTA 2460TACACAGTGG ATTGATTATA AATAAATAGA TGTGTCTTAA CATAAAAAAA AAAAAAAAAA 2520AAAAA 2525(2)SEQ ID NO2的信息(i)序列特征(A)長度756個氨基酸(B)類型氨基酸(C)鏈性(D)拓撲結(jié)構(gòu)線性,(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO2Met Ser Phe Val Ala Gly Val Ile Arg Arg Leu Asp Glu Thr Val5 10 15Val Asn Arg Ile Ala Ala Gly Glu Val Ile Gln Arg Pro Ala Asn20 25 30Ala Ile Lys Glu Met Ile Glu Asn Cys Leu Asp Ala Lys Ser Thr35 40 45Ser Ile Gln Val Ile Val Lys Glu Gly Gly Leu Lys Leu Ile Gln50 55 60Ile Gln Asp Asn Gly Thr Gly Ile Arg Lys Glu Asp Leu Asp Ile65 70 75Val Cys Glu Arg Phe Thr Thr Ser Lys Leu Gln Ser Phe Glu Asp80 85 90Leu Ala Ser Ile Ser Thr Tyr Gly Phe Arg Gly Glu Ala Leu Ala95 100 105Ser Ile Ser His Val Ala His Val Thr Ile Thr Thr Lys Thr Ala110 115 120Asp Gly Lys Cys Ala Tyr Arg Ala Ser Tyr Ser Asp Gly Lys Leu125 130 135Lys Ala Pro Pro Lys Pro Cys Ala Gly Asn Gln Gly Thr Gln Ile140 145 150Thr Val Glu Asp Leu Phe Tyr Asn Ile Ala Thr Arg Arg Lys Ala155 160 165Leu Lys Asn Pro Ser Glu Glu Tyr Gly Lys Ile Leu Glu Val Val170 175 180Gly Arg Tyr Ser Val His Asn Ala Gly Ile Ser Phe Ser Val Lys185 190 195Lys Gln Gly Glu Thr Val Ala Asp Val Arg Thr Leu Pro Asn Ala200 205 210Ser Thr Val Asp Asn Ile Arg Ser Val Phe Gly Asn Ala Val Ser215 220 225Arg Glu Leu Ile Glu Ile Gly Cys Glu Asp Lys Thr Leu Ala Phe230 235 240Lys Met Asn Gly Tyr Ile Ser Asn Ala Asn Tyr Ser Val Lys Lys245 250 255Cys Ile Phe Leu Leu Phe Ile Asn His Arg Leu Val Glu Ser Thr260 265 270Ser Leu Arg Lys Ala Ile Glu Thr Val Tyr Ala Ala Tyr Leu Pro275 280 285Lys Asn Thr His Pro Phe Leu Tyr Leu Ser Leu Glu Ile Ser Pro290 295 300Gln Asn Val Asp Val Asn Val His Pro Thr Lys His Glu Val His
305 310 315Phe Leu His Glu Glu Ser Ile Leu Glu Arg Val Gln Gln Hls Ile320 325 330Glu Ser Lys Leu Leu Gly Ser Asn Ser Ser Arg Met Tyr Phe Thr335 340 345Gln Thr Leu Leu Pro Gly Leu Ala Ala Pro Ser Gly Glu Met Val350 355 360Lys Ser Thr Thr Ser Leu Thr Ser Ser Ser Thr Ser Gly Ser Ser365 370 375Asp Lys Val Tyr Ala His Gln Met Val Arg Thr Asp Ser Arg Glu380 385 390Gln Lys Leu Asp Ala Phe Leu Gln Pro Leu Ser Lys Pro Leu Ser395 400 405Ser Gln Pro Gln Ala Ile Val Thr Glu Asp Lys Thr Asp Ile Ser410 415 420Ser Gly Arg Ala Arg Gln Gln Asp Glu Glu Met Leu Glu Leu Pro425 430 435Ala Pro Ala Glu Val Ala Ala Lys Asn Gln Ser Leu Glu Gly Asp440 445 450Thr Thr Lys Gly Thr Ser Glu Met Ser Glu Lys Arg Gly Pro Thr455 460 465Ser Ser Asn Pro Arg Lys Arg His Arg Glu Asp Ser Asp Val Glu470 475 480Met Val Glu Asp Asp Ser Arg Lys Glu Met Thr Ala Ala Cys Thr485 490 495Pro Arg Arg Arg Ile Ile Asn Leu Thr Ser Val Leu Ser Leu Gln500 505 510Glu Glu Ile Asn Glu Gln Gly His Glu Val Leu Arg Glu Met Leu515 520 525His Asn His Ser Phe Val Gly Cys Val Asn Pro Gln Trp Ala Leu530 535 540Ala Gln His Gln Thr Lys Leu Tyr Leu Leu Asn Thr Thr Lys Leu545 550 555Ser Glu Glu Leu Phe Tyr Gln Ile Leu Ile Tyr Asp Phe Ala Asn560 565 570Phe Gly Val Leu Arg Leu Ser Glu Pro Ala Pro Leu Phe Asp Leu575 580 585Ala Met Leu Ala Leu Asp Ser Pro Glu Ser Gly Trp Thr Glu Glu590 595 600Asp Gly Pro Lys Glu Gly Leu Ala Glu Tyr Ile Val Glu Phe Leu605 610 615Lys Lys Lys Ala Glu Met Leu Ala Asp Tyr Phe Ser Leu Glu Ile620 625 630Asp Glu Glu Gly Asn Leu Ile Gly Leu Pro Leu Leu Thr Asp Asn635 640 645Tyr Val Pro Pro Leu Glu Gly Leu Pro Ile Phe Ile Leu Arg Leu650 655 660Ala Thr Glu Val Asn Trp Asp Glu Glu Lys Glu Cys Phe Glu Ser665 670 675Leu Ser Lys Glu Cys Ala Met Phe Tyr Ser Ile Arg Lys Gln Tyr680 685 690Ile Ser Glu Glu Ser Thr Leu Ser Gly Gln Gln Ser Glu Val Pro
695 700 705Gly Ser Ile Pro Asn Ser Trp Lys Trp Thr Val Glu His Ile Val710 715 720Tyr Lys Ala Leu Arg Ser His Ile Leu Pro Pro Lys His Phe Thr725 730 735Glu Asp Gly Asn Ile Leu Gln Leu Ala Asn Leu Pro Asp Leu Tyr740 745 750Lys Val Phe Glu Arg Cys755(2)SEQ ID NO3的信息(i)序列特征(A)長度3063bp(B)類型核酸(C)鏈性單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO3GGCACGAGTG GCTGCTTGCG GCTAGTGGAT GGTAATTGCC TGCCTCGCGC TAGCAGCAAG 60CTGCTCTGTT AAAAGCGAAA ATGAAACAAT TGCCTGCGGC AACAGTTCGA CTCCTTTCAA 120GTTCTCAGAT CATCACTTCG GTGGTCAGTG TTGTAAAAGA GCTTATTGAA AACTCCTTGG 180ATGCTGGTGC CACAAGCGTA GATGTTAAAC TGGAGAACTA TGGATTTGAT AAAATTGAGG 240TGCGAGATAA CGGGGAGGGT ATCAAGGCTG TTGATGCACC TGTAATGGCA ATGAAGTACT 300ACACCTCAAA AATAAATAGT CATGAAGATC TTGAAAATTT GACAACTTAC GGTTTTCGTG 360GAGAAGCCTT GGGGTCAATT TGTTGTATAG CTGAGGTTTT AATTACAACA AGAACGGCTG 420CTGATAATTT TAGCACCCAG TATGTTTTAG ATGGCAGTGG CCACATACTT TCTCAGAAAC 480CTTCACATCT TGGTCAAGGT ACAACTGTAA CTGCTTTAAG ATTATTTAAG AATCTACCTG 540TAAGAAAGCA GTTTTACTCA ACTGCAAAAA AATGTAAAGA TGAAATAAAA AAGATCCAAG 600ATCTCCTCAT GAGCTTTGGT ATCCTTAAAC CTGACTTAAG GATTGTCTTT GTACATAACA 660AGGCAGTTAT TTGGCAGAAA AGCAGAGTAT CAGATCACAA GATGGCTCTC ATGTCAGTTC 720TGGGGACTGC TGTTATGAAC AATATGGAAT CCTTTCAGTA CCACTCTGAA GAATCTCAGA 780TTTATCTCAG TGGATTTCTT CCAAAGTGTG ATGCAGACCA CTCTTTCACT AGTCTTTCAA 840CACCAGAAAG AAGTTTCATC TTCATAAACA GTCGACCAGT ACATCAAAAA GATATCTTAA 900AGTTAATCCG ACATCATTAC AATCTGAAAT GCCTAAAGGA ATCTACTCGT TTGTATCCTG 960TTTTCTTTCT GAAAATCGAT GTTCCTACAG CTGATGTTGA TGTAAATTTA ACACCAGATA 1020AAAGCCAAGT ATTATTACAA AATAAGGAAT CTGTTTTAAT TGCTCTTGAA AATCTGATGA 1080CGACTTGTTA TGGACCATTA CCTAGTACAA ATTCTTATGA AAATAATAAA ACAGATGTTT 1140CCGCAGCTGA CATCGTTCTT AGTAAAACAG CAGAAACAGA TGTGCTTTTT AATAAAGTGG 1200AATCATCTGG AAAGAATTAT TCAAATGTTG ATACTTCAGT CATTCCATTC CAAAATGATA 1260TGCATAATGA TGAATCTGGA AAAAACACTG ATGATTGTTT AAATCACCAG ATAAGTATTG 1320GTGACTTTGG TTATGGTCAT TGTAGTAGTG AAATTTCTAA CATTGATAAA AACACTAAGA 1380ATGCATTTCA GGACATTTCA ATGAGTAATG TATCATGGGA GAACTCTCAG ACGGAATATA 1440GTAAAACTTG TTTTATAAGT TCCGTTAAGC ACACCCAGTC AGAAAATGGC AATAAAGACC 1500ATATAGATGA GAGTGGGGAA AATGAGGAAG AAGCAGGTCT TGAAAACTCT TCGGAAATTT 1560CTGCAGATGA GTGGAGCAGG GGAAATATAC TTAAAAATTC AGTGGGAGAG AATATTGAAC 1620CTGTGAAAAT TTTAGTGCCT GAAAAAAGTT TACCATGTAA AGTAAGTAAT AATAATTATC 1680CAATCCCTGA ACAAATGAAT CTTAATGAAG ATTCATGTAA CAAAAAATCA AATGTAATAG 1740ATAATAAATC TGGAAAAGTT ACAGCTTATG ATTTACTTAG CAATCGAGTA ATCAAGAAAC 1800CCATGTCAGC AAGTGCTCTT TTTGTTCAAG ATCATCGTCC TCAGTTTCTC ATAGAAAATC 1860CTAAGACTAG TTTAGAGGAT GCAACACTAC AAATTGAAGA ACTGTGGAAG ACATTGAGTG 1920AAGAGGAAAA ACTGAAATAT GAAGAGAAGG CTACTAAAGA CTTGGNACGA TACAATAGTC 1980AAATGAAGAG AGCCATTGAA CAGGAGTCAC AAATGTCACT AAAAGATGGC AGAAAAAAGA 2040TAAAACCCAC CAGCGCATGG AATTTGGCCC AGAAGCACAA GTTAAAAACC TCATTATCTA 2100ATCAACCANA ACTTGATGAA CTCCTTCAGT CCCAAATTGA AAAAAGAAGG AGTCAAAATA 2160TTAAAATGGT ACAGATCCCC TTTTCTATGA AAAACTTAAA AATAAATTTT AAGAAACAAA 2220ACAAAGTTGA CTTAGAAGAG AAGGATGAAC CTTGCTTGAT CCACAATCTC AGGTTTCCTG 2280ATGCATGGCT AATGACATCC AAAACAGAGG TAATGTTATT AAATCCATAT AGAGTAGAAG 2340AAGCCCTGCT ATTTAAAAGA CTTCTTGAGA ATCATAAACT TCCTGCAGAG CCACTGGAAA 2400AGCCAATTAT GTTAACAGAG AGTCTTTTTA ATGGATCTCA TTATTTAGAC GTTTTATATA 2460AAATGACAGC AGATGACCAA AGATACAGTG GATCAACTTA CCTGTCTGAT CCTCGTCTTA 2520CAGCGAATGG TTTCAAGATA AAATTGATAC CAGGAGTTTC AATTACTGAA AATTACTTGG 2580AAATAGAAGG AATGGCTAAT TGTCTCCCAT TCTATGGAGT AGCAGATTTA AAAGAAATTC 2640TTAATGCTAT ATTAAACAGA AATGCAAAGG AAGTTTATGA ATGTAGACCT CGCAAAGTGA 2700TAAGTTATTT AGAGGGAGAA GCAGTGCGTC TATCCAGACA ATTACCCATG TACTTATCAA 2760AAGAGGACAT CCAAGACATT ATCTACAGAA TGAAGCACCA GTTTGGAAAT GAAATTAAAG 2820AGTGTGTTCA TGGTCGCCCA TTTTTTCATC ATTTAACCTA TCTTCCAGAA ACTACATGAT 2880TAAATATGTT TAAGAAGATT AGTTACCATT GAAATTGGTT CTGTCATAAA ACAGCATGAG 2940TCTGGTTTTA AATTATCTTT GTATTATGTG TCACATGGTT ATTTTTTAAA TGAGGATTCA 3000CTGACTTGTT TTTATATTGA AAAAAGTTCC ACGTATTGTA GAAAACGTAA ATAAACTAAT 3060AAC3063(2)SEQ ID NO4的信息(i)序列特征(A)長度931bp(B)類型氨基酸(C)鏈性(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(XI)(xi)序列描述SEO ID NO4Met Lys Gln Leu Pro Ala Ala Thr Val Arg Leu Leu Ser Ser Ser5 10 15Gln Ile Lle Thr Ser Val Val Ser Val Val Lys Glu Leu Ile Glu20 25 30Asn Ser Leu Asp Ala Gly Ala Thr Ser Val Asp Val Lys Leu Glu35 40 45Asn Tyr Gly Phe Asp Lys Ile Glu Val Arg Asp Asn Gly Glu Gly50 55 60Ile Lys Ala Val Asp Ala Pro Val Met Ala Met Lys Tyr Tyr Thr65 70 75Ser Lys Ile Asn Ser His Gly Asp Leu Glu Asn Leu Thr Thr Tyr80 85 90Gly Phe Arg Gly Glu Ala Leu Gly Ser Ile Cys Cys Ile Ala Glu95 100 105Val Leu Ile Thr Thr Arg Thr Ala Ala Asp Asn Phe Ser Thr Gln110 115 120Tyr Val Leu Asp Gly Ser Gly His Ile Leu Ser Gln Lys Pro Ser125 130 135His Leu Gly Gln Gly Thr Thr Val Thr Ala Leu Arg Leu Phe Lys140 145 150Asn Leu Pro Val Arg Lys Gln Phe Tyr Ser Thr Ala Lys Lys Cys155 160 165Lys Asp Glu Ile Lys Lys Ile Gln Asp Leu Leu Met Ser Phe Gly170 175 180Ile Leu Lys Pro Asp Leu Arg Ile Val Phe Val His Asn Lys Ala185 190 195Val Ile Trp Gln Lys Ser Arg Val Ser Asp His Lys Met Ala Leu
200 205 210Met Ser Val Leu Gly Thr Ala Val Met Asn Asn Met Glu Ser Phe215 220 225Gln Tyr His Ser Glu Glu Ser Gln Ile Tyr Leu Ser Gly Phe Leu230 235 240Pro Lys Cys Asp Ala Asp His Ser Phe Thr Ser Leu Ser Thr Pro245 250 255Glu Arg Ser Phe Ile Phe Ile Asn Ser Arg Pro Val His Gln Lys260 265 270Asp Ile Leu Lys Leu Ile Arg His His Tyr Asn Leu Lys Cys Leu275 280 285Lys GLu Ser Thr Arg Leu Tyr Pro Val Phe Phe Leu Lys Ile Asp290 295 300Val Pro Thr Ala Asp Val Asp Val Asn Leu Thr Pro Asp Lys Ser305 310 315Gln Val Leu Leu Gln Asn Lys Glu Ser Val Leu Ile Ala Leu Glu320 325 330Asn Leu Met Thr Thr Cys Tyr Gly Pro Leu Pro Ser Thr Asn Ser335 340 345Tyr Glu Asn Asn Lys Thr Asp Val Ser Ala Ala Asp Ile Val Leu350 355 360Ser Lys Thr Ala Glu Thr Asp Val Leu Phe Asn Lys Val Glu Ser365 370 375Ser Gly Lys Asn Tyr Ser Asn Val Asp Thr Ser Val Ile Pro Phe380 385 390Gln Asn Asp Met His Asn Asp Glu Ser Gly Lys Asn Thr Asp Asp395 400 405Cys Leu Asn His Gln Ile Ser Ile Gly Asp Phe Gly Tyr Gly His410 415 420Cys Ser Ser Glu Ile Ser Asn Ile Asp Lys Asn Thr Lys Asn Ala425 430 435Phe Gln Asp Ile Ser Met Ser Asn Val Ser Trp Glu Asn Ser Gln440 445 450Thr Glu Tyr Ser Lys Thr Cys Phe Ile Ser Ser Val Lys His Thr455 460 465Gln Ser Glu Asn Gly Asn Lys Asp His Ile Asp Glu Ser Gly Glu470 475 480Asn Glu Glu Glu Ala Gly Leu Glu Asn Ser Ser Glu Ile Ser Ala485 490 495Asp Glu Trp Ser Arg Gly Asn Ile Leu Lys Asn Ser Val Gly Glu500 505 510Asn Ile Glu Pro Val Lys Ile Leu Val Pro Glu Lys Ser Leu Pro515 520 525Cys Lys Val Ser Asn Asn Asn Tyr Pro Ile Pro Glu Gln Met Asn530 535 540Leu Asn Glu Asp Ser Cys Asn Lys Lys Ser Asn Val Ile Asp Asn545 550 555Lys Ser Gly Lys Val Thr Ala Tyr Asp Leu Leu Ser Asn Arg Val560 565 570Ile Lys Lys Pro Met Ser Ala Ser Ala Leu Phe Val Gln Asp His575 580 585Arg Pro Gln Phe Leu Ile Glu Asn Pro Lys Thr Ser Leu Glu Asp
590 595 600Ala Thr Leu Gln Ile Glu Glu Leu Trp Lys Thr Leu Ser Glu Glu605 610 615Glu Lys Leu Lys Tyr Glu Glu Lys Ala Thr Lys Asp Leu Xaa Arg620 625 630Tyr Asn Ser Gln Met Lys Arg Ala Ile Glu Gln Glu Ser Gln Met635 640 645Ser Leu Lys Asp Gly Arg Lys Lys Ile Lys Pro Thr Ser Ala Trp650 655 660Asn Leu Ala Gln Lys His Lys Leu Lys Thr Ser Leu Ser Asn Gln665 670 675Pro Xaa Leu Asp Glu Leu Leu Gln Ser Gln Ile Glu Lys Arg Arg680 685 690Ser Gln Asn Ile Lys Met Val Gln Ile Pro Phe Ser Met Lys Asn695 700 705Leu Lys Ile Asn Phe Lys Lys Gln Asn Lys Val Asp Leu Glu Glu710 715 720Lys Asp Glu Pro Cys Leu Ile His Asn Leu Arg Phe Pro Asp Ala725 730 735Trp Leu Met Thr Ser Lys Thr Glu Val Met Leu Leu Asn Pro Tyr740 745 750Arg Val Glu Glu Ala Leu Leu Phe Lys Arg Leu Leu Glu Asn His755 760 765Lys Leu Pro Ala Glu Pro Leu Glu Lys Pro Ile Met Leu Thr Glu770 775 780Ser Leu Phe Asn Gly Ser His Tyr Leu Asp Val Leu Tyr Lys Met785 790 795Thr Ala Asp Asp Gln Arg Tyr Ser Gly Ser Thr Tyr Leu Ser Asp800 805 810Pro Arg Leu Thr Ala Asn Gly Phe Lys Ile Lys Leu Ile Pro Gly815 820 825Val Ser Ile Thr Glu Asn Tyr Leu Glu Ile Glu Gly Met Ala Asn830 835 840Cys Leu Pro Phe Tyr Gly Val Ala Asp Leu Lys Glu Ile Leu Asn845 850 855Ala Ile Leu Asn Arg Asn Ala Lys Glu Val Tyr Glu Cys Arg Pro850 865 870Arg Lys Val Ile Ser Tyr Leu Glu Gly Glu Ala Va1 Arg Leu Ser875 880 885Arg Gln Leu Pro Met Tyr Leu Ser Lys Glu Asp Ile Gln Asp Ile890 895 900Ile Tyr Arg Met Lys His Gln Phe Gly Asn Glu Ile Lys Glu Cys905 910 915Val His Gly Arg Pro Phe Phe His His Leu Thr Tyr Leu Pro Glu920 925 930Thr(2)SEQ ID NO5的信息(i)序列特征(A)長度2771bp(B)類型核酸(C)鏈性單鏈
(D)拓樸結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO5CGAGGCGGAT CGGGTGTTGC ATCCATGGAG CGAGCTGAGA GCTCGAGTAC AGAACCTGCT 60AAGGCCATCA AACCTATTGA TCGGAAGTCA GTCCATCAGA TTTGCTCTGG GCAGGTGGTA 120CTGAGTCTAA GCACTGCGGT AAAGGAGTTA GTAGAAAACA GTCTGGATGC TGGTGCCACT 180AATATTGATC TAAAGCTTAA GGACTATGGA GTGGATCTTA TTGAAGTTTC AGACAATGGA 240TGTGGGGTAG AAGAAGAAAA CTTCGAAGGC TTAACTCTGA AACATCACAC ATCTAAGATT 300CAAGAGTTTG CCGACCTAAC TCAGGTTGAA ACTTTTGGCT TTCGGGGGGA AGCTCTGAGC 360TCACTTTGTG CACTGAGCGA TGTCACCATT TCTACCTGCC ACGCATCGGC GAAGGTTGGA 420ACTCGACTGA TGTTTGATCA CAATGGGAAA ATTATCCAGA AAACCCCCTA CCCCCGCCCC 480AGAGGGACCA CAGTCAGCGT GCAGCAGTTA TTTTCCACAC TACCTGTGCG CCATAAGGAA 540TTTCAAAGGA ATATTAAGAA GGAGTATGCC AAAATGGTCC AGGTCTTACA TGCATACTGT 600ATCATTTCAG CAGGCATCCG TGTAAGTTGC ACCAATCAGC TTGGACAAGG AAAACGACAG 660CCTGTGGTAT GCACAGGTGG AAGCCCCAGC ATAAAGGAAA ATATCGGCTC TGTGTTTGGG 720CAGAAGCAGT TGCAAAGCCT CATTCCTTTT GTTCAGCTGC CCCCTAGTGA CTCCGTGTGT 780GAAGAGTACG GTTTGAGCTG TTCGGATGCT CTGCATAATC TTTTTTACAT CTCAGGTTTC 840ATTTCACAAT GCACGCATGG AGTTGGAAGG AGTTCAACAG ACAGACAGTT TTTCTTTATC 900AACCGGCGGC CTTGTGACCC AGCAAAGGTC TGCAGACTCG TGAATGAGGT CTACCACATG 960TATAATCGAC ACCAGTATCC ATTTGTTGTT CTTAACATTT CTGTTGATTC AGAATGCGTT1020GATATCAATG TTACTCCAGA TAAAAGGCAA ATTTTGCTAC AAGAGGAAAA GCTTTTGTTG1080GCAGTTTTAA AGACCTCTTT GATAGGAATG TTTGATAGTG ATGTCAACAA GCTAAATGTC1140AGTCAGCAGC CACTGCTGGA TGTTGAAGGT AACTTAATAA AAATGCATGC AGCGGATTTG1200GAAAAGCCCA TGGTAGAAAA GCAGGATCAA TCCCCTTCAT TAAGGACTGG AGAAGAAAAA1260AAAGACGTGT CCATTTCCAG ACTGCGAGAG GCCTTTTCTC TTCGTCACAC AACAGAGAAC1320AAGCCTCACA GCCCAAAGAC TCCAGAACCA AGAAGGAGCC CTCTAGGACA GAAAAGGGGT1380ATGCTGTCTT CTAGCACTTC AGGTGCCATC TCTGACAAAG GCGTCCTGAG ACCTCAGAAA1440GAGGCAGTGA GTTCCAGTCA CGGACCCAGT GACCCTACGG ACAGAGCGGA GGTGGAGAAG1500GACTCGGGGC ACGGCAGCAC TTCCGTGGAT TCTGAGGGGT TCAGCATCCC AGACACGGGC1560AGTCACTGCA GCAGCGAGTA TGCGGCCAGC TCCCCAGGGG ACAGGGGCTC GCAGGAACAT1620GTGGACTCTC AGGAGAAAGC GCCTGAAACT GACGACTCTT TTTCAGATGT GGACTGCCAT1680TCAAACCAGG AAGATACCGG ATGTAAATTT CGAGTTTTGC CTCAGCCAAC TAATCTCGCA1740ACCCCAAACA CAAAGCGTTT TAAAAAAGAA GAAATTCTTT CCAGTTCTGA CATTTGTCAA1800AAGTTAGTAA ATACTCAGGA CATGTCAGCC TCTCAGGTTG ATGTAGCTGT GAAAATTAAT1860AAGAAAGTTG TGCCCCTGGA CTTTTCTATG AGTTCTTTAG CTAAACGAAT AAAGCAGTTA1920CATCATGAAG CACAGCAAAG TGAAGGGGAA CAGAATTACA GGAAGTTTAG GGCAAAGATT1980TGTCCTGGAG AAAATCAAGC AGCCGAAGAT GAACTAAGAA AAGAGATAAG TAAAACGATG2040TTTGCAGAAA TGGAAATCAT TGGTCAGTTT AACCTGGGAT TTATAATAAC CACACTGAAT2100GAGGATATCT TCATAGTGGA CCAGCATGCC ACGGACGAGA AGTATAACTT CGAGATGCTG2160CAGCAGCACA CCGTGCTCCA GGGGCAGACG CTCATAGCAC CTCAGACTCT CAACTTAACT2220GCTGrTAATG AAGCTGTTCT GATAGAAAAT CTGGAAATAT TTAGAAAGAA TGGCTTTGAT2280TTTGTTATCG ATGAAAATGC TCCAGTCACT GAAAGGGCTA AACTGATTTC CTTGCCAACT2340AGTAAAAACT GGACCTTCGG ACCCCAGGAC GTCGATGAAC TGATCTTCAT GCTGAGCGAC2400AGCCCTGGGG TCATGTGCCG GCCTTCCCGA GTCAAGCAGA TGTTTGCCTC CAGAGCCTGC2460CGGAAGTCGG TGATGATTGG GACTGCTCTT AACACAAGCG AGATGAAGAA ACTGATCACC2520CACATGGGGG AGATGGACCA CCCCTGGAAC TGTCCCCATG GAAGGCCAAC CATGAGACAC2580ATCGCCAACC TGGGTGTCAT TTCTCAGAAC TGACCGTAGT CACTGTATGG AATAATTGGT2640TTTATCGCAG ATTTTTATGT TTTGAAAGAC AGAGTCTTCA CTAACCTTTT TTGTTTTAAA2700ATGAAACCTG CTACTTAAAA AAAATACACA TCACACCCAT TTAAAAGTGA TCTTGAGAAC2760CTTTTCAAAC C 2771(2)SEQ ID NO6的信息(i)序列特征(A)長度862個氨基酸(B)類型氨基酸(C)鏈性
(D)拓樸結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO6Met Glu Arg Ala Glu Ser Ser Ser Thr Glu Pro Ala Lys Ala Ile5 10 15Lys Pro Ile Asp Arg Lys Ser Val His Gln Ile Cys Ser Gly Gln20 25 30Val Val Leu Ser Leu Ser Thr Ala Val Lys Glu Leu Val Glu Asn35 40 45Ser Leu Asp Ala Gly Ala Thr Asn Ile Asp Leu Lys Leu Lys Asp50 55 60Tyr Gly Val Asp Leu Ile Glu Val Ser Asp Asn Gly Cys Gly Val65 70 75Glu Glu Glu Asn Phe Glu Gly Leu Thr Leu Lys His His Thr Ser80 85 90Lys Ile Gln Glu Phe Ala Asp Leu Thr Gln Val Glu Thr Phe Gly95 100 105Phe Arg Gly Glu Ala Leu Ser Ser Leu Cys Ala Leu Ser Asp Val110 115 120Thr Ile Ser Thr Cys His Ala Ser Ala Lys Val Gly Thr Arg Leu125 130 135Met Phe Asp His Asn Gly Lys Ile Ile Gln Lys Thr Pro Tyr Pro140 145 150Arg Pro Arg Gly Thr Thr Val Ser Val Gln Gln Leu Phe Ser Thr155 160 165Leu Pro Val Arg His Lys Glu Phe Gln Arg Asn Ile Lys Lys Glu170 175 180Tyr Ala Lys Met Val Gln Val Leu His Ala Tyr Cys Ile Ile Ser185 190 195Ala Gly Ile Arg Val Ser Cys Thr Asn Gln Leu Gly Gln Gly Lys200 205 210Arg Gln Leu Trp Tyr Ala Gln Val Glu Ala Pro Ala Ile Lys Glu215 220 225Asn Ile Gly Ser Val Phe Gly Gln Lys Gln Leu Gln Ser Leu Ile230 235 240Pro Phe Val Gln Leu Pro Pro Ser Asp Ser Val Cys Glu Glu Tyr245 250 255Gly Leu Ser Cys Ser Asp Ala Leu His Asn Leu Phe Tyr Ile Ser260 265 270Gly Phe Ile Ser Gln Cys Thr Hls Gly Val Gly Arg Ser Ser Thr275 280 285Asp Arg Gln Phe Phe Phe Ile Asn Arg Arg Pro Cys Asp Pro Ala290 295 300Lys Val Cys Arg Leu Val Asn Glu Val Tyr His Met Tyr Asn Arg305 310 315His Gln Tyr Pro Phe Val Val Leu Asn Ile Ser Val Asp Ser Glu320 325 330Cys Val Asp Ile Asn Val Thr Pro Asp Lys Arg Gln Ile Leu Leu335 340 345Gln Glu Glu Lys Leu Leu Leu Ala Val Leu Lys Thr Ser Leu Ile350 355 360Gly Met Phe Asp Ser Asp Val Asn Lys Leu Asn Val Ser Gln Gln365 370 375Pro Leu Leu Asp Val Glu Gly Asn Leu Ile Lys Met His Ala Ala380 385 390Asp Leu Glu Lys Pro Met Val Glu Lys Gln Asp Gln Ser Pro Ser395 400 405Leu Arg Thr Gly Glu Glu Lys Lys Asp Val Ser Ile Ser Arg Leu410 415 420Arg Glu Ala Phe Ser Leu Arg His Thr Thr Glu Asn Lys Pro His425 430 435Ser Pro Lys Thr Pro Glu Pro Arg Arg Ser Pro Leu Gly Gln Lys440 445 450Arg Gly Met Leu Ser Ser Ser Thr Ser Gly Ala Ile Ser Asp Lys455 460 465Gly Val Leu Arg Pro Gln Lys Glu Ala Val Ser Ser Ser His Gly470 475 480Pro Ser Asp Pro Thr Asp Arg Ala Glu Val Glu Lys Asp Ser Gly485 490 495His Gly Ser Thr Ser Val Asp Ser Glu Gly Phe Ser Ile Pro Asp500 505 510Thr Gly Ser His Cys Ser Ser Glu Tyr Ala Ala Ser Ser Pro Gly515 520 525Asp Arg Gly Ser Gln Glu His Val Asp Ser Gln Glu Lys Ala Pro530 535 540Glu Thr Asp Asp Ser Phe Ser Asp Val Asp Cys His Ser Asn Gln545 550 555Glu Asp Thr Gly Cys Lys Phe Arg Val Leu Pro Gln Pro Thr Asn560 565 570Leu Ala Thr Pro Asn Thr Lys Arg Phe Lys Lys Glu Glu Ile Leu575 580 585Ser Ser Ser Asp Ile Cys Pro Gln Leu Val Asn Thr Gln Asp Met590 595 600Ser Ala Ser Gln Val Asp Val Ala Val Lys Ile Asn Lys Lys Val605 610 615Val Pro Leu Asp Phe Ser Met Ser Ser Leu Ala Lys Arg Ile Lys620 625 630Gln Leu His His Glu Ala Gln Gln Ser Glu Gly Glu Gln Asn Tyr635 640 645Arg Lys Phe Arg Ala Lys Ile Cys Pro Gly Glu Asn Gln Ala Ala650 655 660Glu Asp Glu Leu Arg Lys Glu Ile Ser Lys Thr Met Phe Ala Glu665 670 675Met Glu Ile Ile Gly Gln Phe Asn Leu Gly Phe Ile Ile Thr Thr680 685 690Leu Asn Glu Asp Ile Phe Ile Val Asp Glu His Ala Thr Asp Glu695 700 705Lys Tyr Asn Phe Glu Met Leu Gln Gln His Thr Val Leu Gln Gly710 715 720Gln Arg Leu Ile Ala Pro Glu Thr Leu Asn Leu Thr Ala Val Asn725 730 735Glu Ala Val Leu Ile Glu Asn Leu Glu Ile Phe Arg Lys Asn Gly740 745 750Phe Asp Phe Val Ile Asp Glu Asn Ala Pro Val Thr Glu Arg Ala755 760 765Lys Leu Ile Ser Leu Pro Thr Ser Lys Asn Trp Thr Phe Gly Pro770 775 780Gln Asp Val Asp Glu Leu Ile Phe Met Leu Ser Asp Ser Pro Gly785 790 795Val Met Cys Arg Pro Ser Arg Val Lys Gln Met Phe Ala Ser Arg800 805 810Ala Cys Arg Lys Ser Val Met Ile Gly Thr Ala Leu Asn Thr Ser815 820 825Glu Met Lys Lys Leu Ile Thr His Met Gly Glu Met Asp His Pro830 835 840Trp Asn Cys Pro His Gly Arg Pro Thr Met Arg His Ile Ala Asn845 850 855Leu Gly Val Ile Ser Gln Asn860(2)SEQ ID NO7的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO7GTTGAACATC TAGACGTCTC 20(2)SEQ ID NO8的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO8TCGGTGGCAGG GGTTATTCG(2)SEQ ID NO9的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO9CTACCCAATG CCTCAACCG 19(2)SEQ ID NO10的信息(i)序列特征(A)長度22bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO10GAGAACTGAT AGAAATTGGA TG 22(2)SEQ ID NO11的信息(i)序列特征(A)長度18bp
(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO11GGGACATGAG GTTCTCCG 18(2)SEQ ID NO12的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO12GGGCTGTGTG AATCCTCAG 19(2)SEQ ID NO13的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO13CGGTTCACCA CTGTCTCGTC 20(2)SEQ ID NO14的信息(i)序列特征(A)長度18bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO14TCCAGGATGC TCTCCTCG 18(2)SEQ ID NO15的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO15CAAGTCCTGG TAGCAAAGTC 20(2)SEQ ID NO16的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO16ATGGCAAGGT CAAAGAGCG 19(2)SEQ ID NO17的信息(i)序列特征(A)長度22bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO17CAACAATGTA TTCAGNAAGT CC 22(2)SEQ ID NO18的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO18TTGATACAAC ACTTTGTATC G 21(2)SEQ ID NO19的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO19GGAATACTAT CAGAAGGCAA G 21(2)SEQ ID NO20的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO20ACAGAGCAAG TTACTCAGAT G 21(2)SEQ ID NO21的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈
(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO21GTACACAATG CAGTCATTAG 20(2)SEQ ID NO22的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO22AATGTGGATG TTAATGTGCA C 21(2)SEQ ID NO23的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO23CTGACCTCGT CTTCCTAC 19(2)SEQ ID NO24的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO24CAGCAAGAGT AGGAGATGC 19(2)SEQ ID NO25的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO25GGAAATGGTG GAAGATGATT C 21(2)SEQ ID NO26的信息(i)序列特征(A)長度16bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO26CTTCTCAACA CCAAGC 16(2)SEQ ID NO27的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO27GAAATTGATG AGGAAGGGAA C 21(2)SEQ ID NO28的信息(i)序列特征(A)長度22bp
(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO28CTTCTGATTG ACAACTATGT GC 22(2)SEQ ID NO29的信息(i)序列特征(A)長度22bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO29CACAGAAGAT GGAAATATCCTG 22(2)SEQ ID NO30的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO30GTGTTGGTAG CACTTAAGAC 20(2)SEQ ID NO31的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO31TTTCCCATAT TCTTCACTTG 20(2)SEQ ID NO32的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO32GTAACATGAG CCACATGGC 19(2)SEQ ID NO33的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO33CCACTGTCTC TTCCAGCCG 19(2)SEQ ID NO34的信息(i)序列特征(A)長度26bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO34CGGGATCCAT GTCGTTCGTG GCAGGG 26(2)SEQ ID NO35的信息(i)序列特征(A)長度26bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO35GCTCTAGATT AACACCTCTC AAAGAC 26(2)SEQ ID NO36的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO36GCATCTAGAC GTTTCCTTGG C 21(2)SEQ ID NO37的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO37CATCCAAGCT TCTGTTCCCG 20(2)SEQ ID NO38的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈
(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO38GGGGTGCAGC AGCACATCG 19(2)SEQ ID NO39的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO39GGAGGCAGAA TGTGTGAGCG 20(2)SEQ ID NO40的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO40TCCCAAAGAA GGACTTGCT 19(2)SEQ ID NO41的信息(i)序列特征(A)長度22bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO41AGTATAAGTC TTAAGTGCTA CC 22(2)SEQ ID NO42的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO42TTTATGGTTT CTCACCTGCC 20(2)SEQ ID NO43的信息(i)序列特征(A)長度1.9bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO43GTTATCTGCC CACCTCAGC 19(2)SEQ ID NO44的信息(i)序列特征(A)長度59bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO44GGATCCTAAT ACGACTCACT ATAGGGAGAC CACCATGGCA TCTAGACGTT TCCCTTGGC 59(2)SEQ ID NO45的信息(i)序列特征(A)長度20bp
(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO45CATCCAAGCT TCTGTTCCCG 20(2)SEQ ID NO46的信息(i)序列特征(A)長度56bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO46GGATCCTAAT ACGACTCACT ATAGGGAGAC CACCATGGGG GTGCAGCAGC ACATCG56(2)SEQ ID NO47的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO47GGAGGCAGAA TGTGTGAGCG 20(2)SEQ ID NO48的信息(i)序列特征(A)長度28bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO48CGGGATCCAT GAAACAATTG CCTGCGGC 28(2)SEQ ID NO49的信息(i)序列特征(A)長度26bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO49GCTCTAGACC AGACTCATGC TGTTTT 26(2)SEQ ID NO50的信息(i)序列特征(A)長度26bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO50CGGGATCCCAT GGAGCGAGCT GAGAGC26(2)SEQ ID NO51的信息(i)序列特征(A)長度23bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO51GCTCTAGAGT GAAGACTCTG TCT23(2)SEQ ID NO52的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO52AAGCTGCTCT GTTAAAAGCG 20(2)SEQ ID NO53的信息(i)序列特征(A)長度18bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO53GCACCAGCAT CCAAGGAG 18(2)SEQ ID NO54的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO54CAACCATGAG ACACATCGC 19(2)SEQ ID NO55的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈
(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO55AGGTTAGTG AGACTCTGTC 20(2)SEQ ID NO56的信息(i)序列特征(A)長度53bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO56GGATCCTAAT ACGACTCACT ATAGGGAGAC CACCATGGAA CAATTGCCTG CGG 53(2)SEQ ID NO57的信息(i)序列特征(A)長度18bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO57CCTGCTCCAC TCATCTGC18(2)SEQ ID NO58的信息(i)序列特征(A)長度60bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO58GGATCCTAAT ACGACTCACT ATAGGGGAGAC CACCATGGAA GATATCTTAA AGTTAATCCG 60(2)SEQ ID NO59的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO59GGCTTCTTCT ACTCTATATG G 21(2)SEQ ID NO60的信息(i)序列特征(A)長度58bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO60GGATCCTAAT ACGACTCACT ATAGGGAGAC CACCATGGCA GGTCTTGAAA ACTCTTCG58(2)SEQ ID NO61的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO61AAAACAAGTC AGTGAATCCT C 21(2)SEQ ID NO62的信息(i)序列特征(A)長度20bp
(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO62AAGCACATCT GTTTCTGCTG20(2)SEQ ID NO63的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO63ACGAGTAGAT TCCTTTAGGC20(2)SEQ ID NO64的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO64CAGAACTGAC ATGAGAGCC 19(2)SEQ ID NO65的信息(i)序列特征(A)長度52bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO65GGATCCTAAT ACGACTCACT ATAGGGAGAC CACCATGGAG CGAGCTGAGA GC 52(2)SEQ ID NO66的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO66AGGTTAGTGA AGACTCTGTC 20(2)SEQ ID NO67的信息(i)序列特征(A)長度17bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO67CTGAGGTCTC AGCAGGC 17(2)SEQ ID NO68的信息(i)序列特征(A)長度57bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO68GGATCCTAAT ACGACTCACT ATAGGGAGAC CACCATGGTG TCCATTTTCCA GACTGCG 57(2)SEQ ID NO69的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO69AGGTTAGTGA AGACTCTGTC 20(2)SEQ ID NO70的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO70TTATTTGGCA GAAAAGCAGA G 21(2)SEQ ID NO71的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO71TTAAAAGACT AACCTCTTG C 21(2)SEQ ID NO72的信息(i)序列特征(A)長度21bp(B)類型核酸(C)鏈性單鏈
(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO72CTGCTGTTAT GAACAATATG G 21(2)SEQ ID NO73的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO73CAGAAGCAGT TGCAAAGCC 19(2)SEQ ID NO74的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO74AAACCGTACT CTTCACACAC20(2)SEQ ID NO75的信息(i)序列特征(A)長度20bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO75GAGGAAAAGC TTTTGTTGGC20(2)SEQ ID NO76的信息(i)序列特征(A)長度18bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO76CAGTGGCTGC TGACTGAC 18(2)SEQ ID NO77的信息(i)序列特征(A)長度19bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO77TCCAGAACCA AGAAGGAGC 19(2)SEQ ID NO78的信息(i)序列特征(A)長度16bp(B)類型核酸(C)鏈性單鏈(D)拓樸結(jié)構(gòu)線性(ii)分子類型寡核苷酸(xi)序列描述SEQ ID NO78TGAGGTCTCA GCAGGC 1權(quán)利要求
1.一種分離出的多核苷酸,選自如下一組(a)編碼具有SEQ ID NO.2的推導(dǎo)的氨基酸序列的多肽或者所述多肽的片段、類似物或衍生物的多核苷酸;(b)編碼具有由ATCC保藏號75649所含cDNA編碼的氨基酸序列的多肽的多核苷酸;(c)編碼具有SEQ ID NO.4的推導(dǎo)的氨基酸序列的多肽或者所述多肽的片段、類似物或衍生物的多核苷酸;(d)編碼具有由ATCC保藏號75651所含cDNA編碼的氨基酸序列的多肽的多核苷酸;(e)編碼具有SEQ ID NO.6的推導(dǎo)的氨基酸序列的多肽或者所述多肽的片段、類似物或衍生物的多核苷酸;以及(f)編碼具有由ATCC保藏號75650所含cDNA編碼的氨基酸序列的多肽的多核苷酸。
2.權(quán)利要求1的多核苷酸,其中該多核苷酸是DNA。
3.權(quán)利要求1的多核苷酸,其中該多核苷酸是RNA。
4.權(quán)利要求1的多核苷酸,其中該多核苷酸是基因組DNA。
5.權(quán)利要求1的多核苷酸,用于分析一樣品中的編碼人錯配修復(fù)蛋白的多核苷酸的突變,所述的多核苷酸包括ATCC保藏號75649的多核苷酸序列的至少15個并且不超過30個保守堿基的多核苷酸序列。
6.權(quán)利要求1的多核苷酸,用于分析一樣品中的編碼人錯配修復(fù)蛋白的多核苷酸的突變,所述的多核苷酸包括ATCC保藏號75651的多核苷酸序列的至少15個并且不超過30個保守堿基的多核苷酸序列。
7.權(quán)利要求1的多核苷酸,用于分析一樣品中編碼人錯配修復(fù)蛋白的多核苷酸的突變,所述多核苷酸包括ATCC保藏號75650的多核苷酸序列的至少15個并且不超過30個保守堿基的多核苷酸序列。
8.權(quán)利要求2的多核苷酸,其中所述的多核苷酸編碼具有SEQ ID No.2的推導(dǎo)的氨基酸序列的多肽。
9.權(quán)利要求2的多核苷酸,其中所述的多核苷酸編碼具有SEQ ID No.4的推導(dǎo)的氨基酸序列的多肽。
10.權(quán)利要求2的多核苷酸,其中所述的多核苷酸編碼具有SEQ ID No.6的推導(dǎo)的氨基酸序列的多肽。
11.權(quán)利要求2的多核苷酸,其中所述的多核苷酸編碼由ATCC保藏號75649的cDNA編碼的多肽。
12.權(quán)利要求2的多核苷酸,其中所述的多核苷酸編碼由ATCC保藏號75651的cDNA編碼的多肽。
13.權(quán)利要求2的多核苷酸,其中所述的多核苷酸編碼由ATCC保藏號75650的cDNA編碼的多肽。
14.權(quán)利要求1的多核苷酸,具有SEQ ID No.1的編碼序列。
15.權(quán)利要求1的多核苷酸,具有SEQ ID No.3的編碼序列。
16.權(quán)利要求1的多核苷酸,具有SEQ ID No.5的編碼序列。
17.含有權(quán)利要求2的DNA的載體。
18.用權(quán)利要求17的載體遺傳工程化的宿主細胞。
19.一種用于生產(chǎn)多肽的方法,包括用權(quán)利要求18的宿主細胞表達由所述DNA編碼的多肽。
20.生產(chǎn)能表達多肽的細胞的方法,包括用權(quán)利要求17的載體對細胞進行遺傳工程化。
21.可與權(quán)利要求2的DNA雜交并編碼具有hMHL1活性的多肽的分離的DNA。
22.可與權(quán)利要求2的DNA雜交并編碼具有hMHL2活性的多肽的分離的DNA。
23.可與權(quán)利要求2的DNA雜交并編碼具有hMHL3活性的多肽的分離的DNA。
24.一種多肽,選自如下一組(a)具有SEQ ID NO.2的推導(dǎo)的氨基酸序列的多肽及其片段、類似物和衍生物;(b)由ATCC保藏號75649的cDNA編碼的多肽及所述多肽的片段、類似物和衍生物;(c)具有SEQ ID NO.4的推導(dǎo)的氨基酸序列的多肽及其片段、類似物和衍生物;(d)由ATCC保藏號75651的cDNA編碼的多肽及所述多肽的片段、類似物和衍生物;(e)具有SEQ ID NO.6的推導(dǎo)的氨基酸序列的多肽及其片段、類似物和衍生物;以及(f)由ATCC保藏號75650的cDNA編碼的多肽及所述多肽的片段、類似物和衍生物。
25.權(quán)利要求15的多肽,其中該多肽是具有SEQ ID No.2的推導(dǎo)的氨基酸序列的hMHL1。
26.權(quán)利要求14的多肽,其中該多肽是具有SEQ ID No.4的推導(dǎo)的氨基酸序列的hMHL2。
27.權(quán)利要求14的多核苷酸,其中該多肽是具有SEQ ID No.6的推導(dǎo)的氨基酸序列的hMHL3。
28.用于診斷癌癥易感性的方法,包括確定取自患者的樣品中人錯配修復(fù)基因的突變,所述人錯配修復(fù)基因包括權(quán)利要求8的多核苷酸序列。
29.用于診斷癌癥易感性的方法,包括確定取自患者的樣品中人錯配修復(fù)基因的突變,所述人錯配修復(fù)基因包括權(quán)利要求9的DNA。
30.用于診斷癌癥易感性的方法,包括確定取自患者的樣品中人錯配修復(fù)基因的突變,所述人錯配修復(fù)基因包括權(quán)利要10的DNA。
31.用于診斷癌癥易感性的方法,包括確定取自患者的樣品中人錯配修復(fù)基因的突變,所述人錯配修復(fù)基因編碼細菌mutLDNA錯配修復(fù)基因的人同系物。
全文摘要
本發(fā)明公開了三種人DNA修復(fù)蛋白,編碼這種蛋白質(zhì)的DNA(RNA),以及通過重組技術(shù)生產(chǎn)這種蛋白質(zhì)的方法。一種人DNA修復(fù)蛋白,hMLH1已被定位于染色體3,hMLH2已被定位于染色體2,hMLH3已被定位于染色體7。本發(fā)明提供了診斷hMLH1、hMLH2和hMLH3基因中的改變的方法。
文檔編號C07K14/435GK1145097SQ95191911
公開日1997年3月12日 申請日期1995年1月25日 優(yōu)先權(quán)日1994年1月27日
發(fā)明者威廉·A·哈茲爾廷, 史蒂文·M·魯賓, 衛(wèi)穎飛, 馬克·D·亞當(dāng)斯, 羅伯特·D·弗萊施曼, 克萊爾·M·弗雷澤, 麗貝卡·A·富得那, 厄文·F·科克尼斯, 克雷格·A·羅森 申請人:人體基因組科學(xué)有限公司