專利名稱:具有抑癌功能的新的人蛋白及其編碼序列的制作方法
技術領域:
本發(fā)明屬于生物技術領域,具體地說,本發(fā)明涉及新的編碼具有抑癌功能的人蛋白的多核苷酸和此多核苷酸編碼的多肽。本發(fā)明還涉及此多核苷酸和多肽的用途和制備。
背景技術:
人基因組學研究目前是國際上的熱點,除人染色體DNA大規(guī)模測序,表達序列測序(EST)的方法外,還缺少從功能開始的篩選具有功能基因的高通量的方法。
癌癥是危害人類健康的主要疾病之一。為了有效地治療和預防腫瘤,目前人們已越來越關注腫瘤的基因治療。因此,本領域迫切需要開發(fā)研究具有抑癌功能的人蛋白及其激動劑/抑制劑。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一類新的具有抑癌功能的人蛋白多肽以及其片段、類似物和衍生物。
本發(fā)明的另一目的是提供編碼這些多肽的多核苷酸。
本發(fā)明的另一目的是提供生產(chǎn)這些多肽的方法以及該多肽和編碼序列的用途。
在本發(fā)明的第一方面,提供新穎的分離出的具有抑癌功能的蛋白多肽,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35、38;或其保守性變異多肽、或其活性片段、或其活性衍生物。
較佳地,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35、38。
在本發(fā)明的第二方面,提供了一種分離的多核苷酸,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。較佳地,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35、38。更佳地,該多核苷酸的序列選自下組SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36、39的編碼區(qū)序列或全長序列。
在本發(fā)明的第三方面,提供了含有上述多核苷酸的載體,以及被該載體轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞或者被上述多核苷酸直接轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞。
在本發(fā)明的第四方面,提供了制備具有抑癌功能的蛋白活性的多肽的制備方法,該方法包含(a)在適合表達具有抑癌功能的蛋白的條件下,培養(yǎng)上述被轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞;(b)從培養(yǎng)物中分離出具有抑癌功能的蛋白活性的多肽。
在本發(fā)明的第五方面,提供了與上述的具有抑癌功能的蛋白多肽特異性結(jié)合的抗體。還提供了可用于檢測的核酸分子,它含有上述的多核苷酸中連續(xù)10個核苷酸至全長核苷酸,較佳地它含有連續(xù)的約10-800個核苷酸。
在本發(fā)明的第六方面,提供了一種藥物組合物,它含有安全有效量的本發(fā)明的具有抑癌功能的蛋白多肽以及藥學上可接受的載體。這些藥物組合物可治療癌癥以及細胞異常增殖等病癥。
本發(fā)明的其它方面由于本文的公開內(nèi)容,對本領域的技術人員而言是顯而易見的。
具體實施例方式
3T3細胞是一種小鼠成纖維細胞(J.Cell.Biol.,17299,1963)(也稱為NIH/3T3細胞)。在癌癥研究領域中,常將外源基因(尤其是人基因)引入3T3細胞,觀察其對3T3細胞生長的影響情況。通常認為,對3T3細胞生長有影響的基因是癌癥相關基因,其中對3T3細胞生長有抑制作用的基因大多是抑癌基因,而對3T3細胞生長有促進作用的基因大多是(原)癌基因。
本發(fā)明采用大規(guī)模cDNA克隆轉(zhuǎn)染小鼠胚胎成纖維細胞,在獲得具有抑癌作用的基礎上,經(jīng)測序證明為新的基因,進一步得到全長cDNA克隆。DNA轉(zhuǎn)染試驗證明,本發(fā)明的具有抑癌功能的蛋白對3T3細胞具有抑制克隆形成的作用,其抑制率≥50%。
如本文所用,“分離的”是指物質(zhì)從其原始環(huán)境中分離出來(如果是天然的物質(zhì),原始環(huán)境即是天然環(huán)境)。如活體細胞內(nèi)的天然狀態(tài)下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態(tài)中同存在的其他物質(zhì)中分開,則為分離純化的。
如本文所用,“分離的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質(zhì)。本領域的技術人員能用標準的蛋白質(zhì)純化技術純化具有抑癌功能的蛋白。基本上純的多肽在非還原聚丙烯酰胺凝膠上能產(chǎn)生單一的主帶。
本發(fā)明的多肽可以是重組多肽、天然多肽、合成多肽,優(yōu)選重組多肽。本發(fā)明的多肽可以是天然純化的產(chǎn)物,或是化學合成的產(chǎn)物,或使用重組技術從原核或真核宿主(例如,細菌、酵母、高等植物、昆蟲和哺乳動物細胞)中產(chǎn)生。根據(jù)重組生產(chǎn)方案所用的宿主,本發(fā)明的多肽可以是糖基化的,或可以是非糖基化的。本發(fā)明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發(fā)明還包括具有抑癌功能的人蛋白的片段、衍生物和類似物。如本文所用,術語“片段”、“衍生物”和“類似物”是指基本上保持本發(fā)明的天然具有抑癌功能的人蛋白相同的生物學功能或活性的多肽。本發(fā)明的多肽片段、衍生物或類似物可以是(i)有一個或多個保守或非保守性氨基酸殘基(優(yōu)選保守性氨基酸殘基)被取代的多肽,而這樣的取代的氨基酸殘基可以是也可以不是由遺傳密碼編碼的,或(ii)在一個或多個氨基酸殘基中具有取代基團的多肽,或(iii)成熟多肽與另一個化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前導序列或分泌序列或用來純化此多肽的序列或蛋白原序列)。根據(jù)本文的教導,這些片段、衍生物和類似物屬于本領域熟練技術人員公知的范圍。
本發(fā)明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。以PP10513蛋白(在本申請中,蛋白質(zhì)的命名采用其克隆編號)為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO3所示的編碼區(qū)序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”對于PP10513而言是指編碼具有SEQ ID NO2的蛋白質(zhì),但與SEQ ID NO3所示的編碼區(qū)序列有差別的核酸序列。再以PP10764蛋白為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO6所示的編碼區(qū)序列相同或者是簡并的變異體;“簡并的變異體”對于PP10764而言是指編碼具有SEQ ID NO5的蛋白質(zhì),但與SEQ IDNO6所示的編碼區(qū)序列有差別的核酸序列。對于本發(fā)明的其他具有抑癌功能的蛋白,可依此類推。
編碼成熟多肽的多核苷酸包括只編碼成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術語“編碼多肽的多核苷酸”可以是包括編碼此多肽的多核苷酸,也可以是還包括附加編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的多肽或多肽的片段、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領域所知的,等位變異體是一個多核苷酸的替換形式,它可能是一個或多個核苷酸的取代、缺失或插入,但不會從實質(zhì)上改變其編碼的多肽的功能。
本發(fā)明還涉及與上述的序列雜交且兩個序列之間具有至少50%,較佳地至少70%,更佳地至少80%相同性的多核苷酸。本發(fā)明特別涉及在嚴格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中,“嚴格條件”是指(1)在較低離子強度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時加有變性劑,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時才發(fā)生雜交。并且,可雜交的多核苷酸編碼的多肽與SEQ IDNO2所示的成熟多肽有相同的生物學功能(以PP10513蛋白為例)和活性。
本發(fā)明還涉及與上述的序列雜交的核酸片段。如本文所用,“核酸片段”的長度至少含15個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸以上。核酸片段可用于核酸的擴增技術(如PCR)以確定和/或分離編碼具有抑癌功能的蛋白的多聚核苷酸。
本發(fā)明中的多肽和多核苷酸優(yōu)選以分離的形式提供,更佳地被純化至均質(zhì)。
本發(fā)明的DNA序列能用幾種方法獲得。例如,用本領域熟知的雜交技術分離DNA。這些技術包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源性核苷酸序列,和2)表達文庫的抗體篩選以檢出具有共同結(jié)構特征的克隆的DNA片段。
編碼具有抑癌功能的蛋白的特異DNA片段序列產(chǎn)生也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學合成DNA序列以獲得所需多肽的雙鏈DNA。
當需要的多肽產(chǎn)物的整個氨基酸序列已知時,DNA序列的直接化學合成是經(jīng)常選用的方法。如果所需的氨基酸的整個序列不清楚時,DNA序列的直接化學合成是不可能的,選用的方法是cDNA序列的分離。分離感興趣的cDNA的標準方法是從高表達該基因的供體細胞分離mRNA并進行逆轉(zhuǎn)錄,形成質(zhì)?;蚴删wcDNA文庫。提取mRNA的方法已有多種成熟的技術,試劑盒也可從商業(yè)途徑獲得(Qiagene)。而構建cDNA文庫也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold SpringHarbor Laboratory.New York,1989)。還可得到商業(yè)供應的cDNA文庫,如Clontech公司的不同cDNA文庫。當結(jié)合使用聚合酶反應技術時,即使極少的表達產(chǎn)物也能克隆。
可用常規(guī)方法從這些cDNA文庫中篩選本發(fā)明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交;(2)標志基因的功能出現(xiàn)或喪失;(3)測定具有抑癌功能的蛋白的轉(zhuǎn)錄本的水平;(4)通過免疫學技術或測定生物學活性,來檢測基因表達的蛋白產(chǎn)物。上述方法可單用,也可多種方法聯(lián)合應用。
在第(1)種方法中,雜交所用的探針是與本發(fā)明的多核苷酸的任何一部分同源,其長度至少15個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸。此外,探針的長度通常在2kb之內(nèi),較佳地為1kb之內(nèi)。此處所用的探針通常是在本發(fā)明的基因DNA序列信息的基礎上化學合成的DNA序列。本發(fā)明的基因本身或者片段當然可以用作探針。DNA探針的標記可用放射性同位素,熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中,檢測具有抑癌功能的蛋白基因表達的蛋白產(chǎn)物可用免疫學技術如Western印跡法,放射免疫沉淀法,酶聯(lián)免疫吸附法(ELISA)等。
應用PCR技術擴增DNA/RNA的方法(Saiki,et al.Science 1985;2301350-1354)被優(yōu)選用于獲得本發(fā)明的基因。特別是很難從文庫中得到全長的cDNA時,可優(yōu)選使用RACE法(RACE-cDNA末端快速擴增法),用于PCR的引物可根據(jù)本文所公開的本發(fā)明的序列信息適當?shù)剡x擇,并可用常規(guī)方法合成??捎贸R?guī)方法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
如上所述得到的本發(fā)明的基因,或者各種DNA片段等的核苷酸序列的測定可用常規(guī)方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,745463-5467)。這類核苷酸序列測定也可用商業(yè)測序試劑盒等。為了獲得全長的cDNA序列,測序需反復進行。有時需要測定多個克隆的cDNA序列,才能拼接成全長的cDNA序列。
本發(fā)明也涉及包含本發(fā)明多核苷酸的載體,以及用本發(fā)明載體或具有抑癌功能的蛋白編碼序列經(jīng)基因工程產(chǎn)生的宿主細胞,以及經(jīng)重組技術產(chǎn)生本發(fā)明所述多肽的方法。
通過常規(guī)的重組DNA技術(Science,1984;2241431),可利用本發(fā)明的多聚核苷酸序列可用來表達或生產(chǎn)重組的具有抑癌功能的蛋白多肽。一般來說有以下步驟(1).用本發(fā)明的編碼具有抑癌功能的人蛋白的多核苷酸(或變異體),或用含有該多核苷酸的重組表達載體轉(zhuǎn)化或轉(zhuǎn)導合適的宿主細胞;(2).在合適的培養(yǎng)基中培養(yǎng)的宿主細胞;(3).從培養(yǎng)基或細胞中分離、純化蛋白質(zhì)。
本發(fā)明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重組表達載體中。術語“重組表達載體”指本領域熟知的細菌質(zhì)粒、噬菌體、酵母質(zhì)粒、植物細胞病毒、哺乳動物細胞病毒如腺病毒、逆轉(zhuǎn)錄病毒或其他載體。在本發(fā)明中適用的載體包括但不限于在細菌中表達的基于T7的表達載體(Rosenberg,et al.Gene,1987,56125);在哺乳動物細胞中表達的pMSXND表達載體(Lee and Nathans,J Bio Chem.2633521,1988)和在昆蟲細胞中表達的來源于桿狀病毒的載體??傊?,只要能在宿主體內(nèi)復制和穩(wěn)定,任何質(zhì)粒和載體都可以用。表達載體的一個重要特征是通常含有復制起點、啟動子、標記基因和翻譯控制元件。
本領域的技術人員熟知的方法能用于構建含具有抑癌功能的人蛋白編碼DNA序列和合適的轉(zhuǎn)錄/翻譯控制信號的表達載體。這些方法包括體外重組DNA技術、DNA合成技術、體內(nèi)重組技術等(Sambroook,et al.)。所述的DNA序列可有效連接到表達載體中的適當啟動子上,以指導mRNA合成。這些啟動子的代表性例子有大腸桿菌的1ac或trp啟動子;λ噬菌體PL啟動子;真核啟動子包括CMV立即早期啟動子、早期和晚期SV40啟動子、反轉(zhuǎn)錄病毒的LTRs和其他一些已知的可控制基因在原核或真核細胞或其病毒中表達的啟動子。表達載體還包括翻譯起始用的核糖體結(jié)合位點和轉(zhuǎn)錄終止子。
此外,表達載體優(yōu)選地包含一個或多個選擇性標記基因,以提供用于選擇轉(zhuǎn)化的宿主細胞的表型性狀,如真核細胞培養(yǎng)用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP),或用于大腸桿菌的四環(huán)素或氨芐青霉素抗性。
包含上述的適當DNA序列以及適當啟動子或者控制序列的載體,可以用于轉(zhuǎn)化適當?shù)乃拗骷毎?,以使其能夠表達蛋白質(zhì)。
宿主細胞可以是原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高等真核細胞,如哺乳動物細胞。代表性例子有大腸桿菌,鏈霉菌屬;鼠傷寒沙門氏菌的細菌細胞;真菌細胞如酵母;植物細胞;果蠅S2或Sf9的昆蟲細胞;CHO、COS或Bowes黑素瘤細胞的動物細胞等。
本發(fā)明的多核苷酸在高等真核細胞中表達時,如果在載體中插入增強子序列時將會使轉(zhuǎn)錄得到增強。增強子是DNA的順式作用因子,通常大約有10到300個堿基對,作用于啟動子以增強基因的轉(zhuǎn)錄。可舉的例子包括在復制起始點晚期一側(cè)的100到270個堿基對的SV40增強子、在復制起始點晚期一側(cè)的多瘤增強子以及腺病毒增強子等。
本領域一般技術人員都清楚如何選擇適當?shù)妮d體、啟動子、增強子和宿主細胞。
用重組DNA轉(zhuǎn)化宿主細胞可用本領域技術人員熟知的常規(guī)技術進行。當宿主為原核生物如大腸桿菌時,能吸收DNA的感受態(tài)細胞可在指數(shù)生長期后收獲,用CaCl2法處理,所用的步驟在本領域眾所周知??晒┻x擇的是用MgCl2。如果需要,轉(zhuǎn)化也可用電穿孔的方法進行。當宿主是真核生物,可選用如下的DNA轉(zhuǎn)染方法磷酸鈣共沉淀法,常規(guī)機械方法如顯微注射、電穿孔、脂質(zhì)體包裝等。
獲得的轉(zhuǎn)化子可以用常規(guī)方法培養(yǎng),表達本發(fā)明的基因所編碼的多肽。根據(jù)所用的宿主細胞,培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細胞生長的條件下進行培養(yǎng)。當宿主細胞生長到適當?shù)募毎芏群螅煤线m的方法(如溫度轉(zhuǎn)換或化學誘導)誘導選擇的啟動子,將細胞再培養(yǎng)一段時間。
在上面的方法中的重組多肽可包被于細胞內(nèi)、細胞外或在細胞膜上表達或分泌到細胞外。如果需要,可利用其物理的、化學的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領域技術人員所熟知的。這些方法的例子包括但并不限于常規(guī)的復性處理、用蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術及這些方法的結(jié)合。
重組的具有抑癌功能的人蛋白或多肽有多方面的用途。這些用途包括(但不限于)直接做為藥物治療具有抑癌功能的蛋白功能低下或喪失所致的疾病,和用于篩選促進或?qū)咕哂幸职┕δ艿牡鞍坠δ艿目贵w、多肽或其它配體。例如,抗體可用于激活或抑制具有抑癌功能的人蛋白的功能。用表達的重組具有抑癌功能的人蛋白篩選多肽庫可用于尋找有治療價值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本發(fā)明也提供了篩選藥物以鑒定提高(激動劑)或阻遏(拮抗劑)具有抑癌功能的人蛋白的藥劑的方法。激動劑提高具有抑癌功能的人蛋白刺激細胞增殖等生物功能,而拮抗劑阻止和治療與細胞過度增殖有關的紊亂如各種癌癥。例如,能在藥物的存在下,將哺乳動物細胞或表達具有抑癌功能的人蛋白的膜制劑與標記的具有抑癌功能的人蛋白一起培養(yǎng)。然后測定藥物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。具有抑癌功能的人蛋白的拮抗劑可以與具有抑癌功能的人蛋白結(jié)合并消除其功能,或是抑制具有抑癌功能的人蛋白的產(chǎn)生,或是與多肽的活性位點結(jié)合使多肽不能發(fā)揮生物學功能。具有抑癌功能的人蛋白的拮抗劑可用于治療用途。
在篩選作為拮抗劑的化合物時,可以將本發(fā)明蛋白加入生物分析測定中,通過測定化合物影響具有抑癌功能的蛋白和其受體之間的相互作用來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。
本發(fā)明的多肽可直接用于疾病治療,例如,各種惡性腫瘤、和細胞異常增殖等。
本發(fā)明的多肽,及其片段、衍生物、類似物或它們的細胞可以用來作為抗原以生產(chǎn)抗體。這些抗體可以是多克隆或單克隆抗體。多克隆抗體可以通過將此多肽直接注射動物的方法得到。制備單克隆抗體的技術包括雜交瘤技術,三瘤技術,人B-細胞雜交瘤技術,EBV-雜交瘤技術等。
可以將本發(fā)明的多肽和拮抗劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發(fā)明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發(fā)明的藥用組合物成分。與這些容器一起,可以有由制造、使用或銷售藥品或生物制品的政府管理機構所給出的指示性提示,該提示反映出生產(chǎn)、使用或銷售的政府管理機構許可其在人體上施用。此外,本發(fā)明的多肽可以與其它的治療化合物結(jié)合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內(nèi)、腹膜內(nèi)、肌內(nèi)、皮下、鼻內(nèi)或皮內(nèi)的給藥途徑。具有抑癌功能的蛋白以有效地治療和/或預防具體的適應癥的量來給藥。施用于患者的具有抑癌功能的蛋白的量和劑量范圍將取決于許多因素,如給藥方式、待治療者的健康條件和診斷醫(yī)生的判斷。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多種治療目的?;蛑委熂夹g可用于治療由于具有抑癌功能的蛋白的無表達或異常/無活性的具有抑癌功能的蛋白的表達所致的細胞增殖、發(fā)育或代謝異常。重組的基因治療載體可用于治療具有抑癌功能的蛋白表達或活性異常所致的疾病。來源于病毒的表達載體如逆轉(zhuǎn)錄病毒、腺病毒、腺病毒相關病毒、單純皰疹病毒、細小病毒等可用于將具有抑癌功能的蛋白基因轉(zhuǎn)移至細胞內(nèi)。構建攜帶具有抑癌功能的蛋白基因的重組病毒載體的方法可見于已有文獻(Sambrook,etal.)。另外重組具有抑癌功能的人蛋白基因可包裝到脂質(zhì)體中轉(zhuǎn)移至細胞內(nèi)。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反義RNA和DNA)以及核酶也在本發(fā)明的范圍之內(nèi)。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機制是核酶分子與互補的靶RNA特異性雜交后進行核酸內(nèi)切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術獲得,如固相磷酸酰胺化學合成法合成寡核苷酸的技術已廣泛應用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內(nèi)轉(zhuǎn)錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動子的下游。為了增加核酸分子的穩(wěn)定性,可用多種方法對其進行修飾,如增加兩側(cè)的序列長度,核糖核苷之間的連接應用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
多聚核苷酸導入組織或細胞內(nèi)的方法包括將多聚核苷酸直接注入到體內(nèi)組織中;或在體外通過載體(如病毒、噬菌體或質(zhì)粒等)先將多聚核苷酸導入細胞中,再將細胞移植到體內(nèi)等。
本發(fā)明的多肽還可用作肽譜分析,例如,多肽可用物理的、化學或酶進行特異性切割,并進行一維或二維或三維的凝膠電泳分析。
本發(fā)明還提供了針對具有抑癌功能的人蛋白抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達文庫產(chǎn)生的片段。這些抗體可用常規(guī)方法制備??咕哂幸职┕δ艿娜说鞍椎目贵w可用于免疫組織化學技術中,檢測活檢標本中的具有抑癌功能的人蛋白。
與具有抑癌功能的人蛋白結(jié)合的單克隆抗體也可用放射性同位素標記,注入體內(nèi)可跟蹤其位置和分布。本發(fā)明中的抗體可用于治療或預防與具有抑癌功能的人蛋白相關的疾病。給予適當劑量的抗體可以刺激或阻斷具有抑癌功能的人蛋白的產(chǎn)生或活性。
抗體也可用于設計針對體內(nèi)某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高親和性的單克隆抗體可與細菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價結(jié)合。
多克隆抗體的生產(chǎn)可用具有抑癌功能的人蛋白或多肽免疫動物,如家兔,小鼠,大鼠等。多種佐劑可用于增強免疫反應,包括但不限于弗氏佐劑等。
具有抑癌功能的人蛋白單克隆抗體可用雜交瘤技術生產(chǎn)(Kohler and Milstein.Nature,1975,256495-497)。將人恒定區(qū)和非人源的可變區(qū)結(jié)合的嵌合抗體可用已有的技術生產(chǎn)(Morrison et al,PNAS,1985,816851)。而已有的生產(chǎn)單鏈抗體的技術(U.S.PatNo.4946778)也可用于生產(chǎn)抗具有抑癌功能的人蛋白的單鏈抗體。
能與本發(fā)明蛋白結(jié)合的多肽分子可通過篩選由各種可能組合的氨基酸結(jié)合于固相物組成的隨機多肽庫而獲得。篩選時,必須對具有抑癌功能的人蛋白分子進行標記。
本發(fā)明還涉及定量和定位檢測具有抑癌功能的人蛋白水平的診斷試驗方法。這些試驗是本領域所熟知的,且包括FISH測定和放射免疫測定。試驗中所檢測的具有抑癌功能的人蛋白水平,可以用作解釋具有抑癌功能的人蛋白在各種疾病中的重要性和用于診斷具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相關疾病的診斷和治療。在診斷方面,具有抑癌功能的蛋白的多聚核苷酸可用于檢測具有抑癌功能的蛋白的表達與否或在疾病狀態(tài)下具有抑癌功能的蛋白的異常表達。如具有抑癌功能的蛋白DNA序列可用于對活檢標本的雜交以判斷具有抑癌功能的蛋白的表達異常。雜交技術包括Southern印跡法,Northern印跡法、原位雜交等。這些技術方法都是公開的成熟技術,相關的試劑盒都可從商業(yè)途徑得到。本發(fā)明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為“基因芯片”)上,用于分析組織中基因的差異表達分析和基因診斷。用具有抑癌功能的蛋白特異的引物進行RNA-聚合酶鏈反應(RT-PCR)體外擴增也可檢測具有抑癌功能的蛋白的轉(zhuǎn)錄產(chǎn)物。
檢測具有抑癌功能的蛋白基因的突變也可用于診斷具有抑癌功能的蛋白相關的疾病。具有抑癌功能的蛋白突變的形式包括與正常野生型具有抑癌功能的蛋白DNA序列相比的點突變、易位、缺失、重組和其它任何異常等??捎靡延械募夹g如Southern印跡法、DNA序列分析、PCR和原位雜交檢測突變。另外,突變有可能影響蛋白的表達,因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發(fā)明的序列對染色體鑒定也是有價值的。這些序列會特異性地針對某條人染色體具體位置且并可以與其雜交。目前,需要鑒定染色體上的各基因的具體位點。然而現(xiàn)在只有很少的基于實際序列數(shù)據(jù)(重復多態(tài)性)的染色體標記物可用于標記染色體位置。為了將這些序列與疾病相關基因相關聯(lián)。第一步就是將本發(fā)明DNA序列定位于染色體上。
簡而言之,根據(jù)cDNA制備PCR引物(優(yōu)選15-35bp),可以將序列定位于染色體上。然后,將這些引物用于PCR篩選含各條人染色體的體細胞雜合細胞。只有那些含有相應于引物的人基因的雜合細胞會產(chǎn)生擴增的片段。
體細胞雜合細胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發(fā)明的的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實現(xiàn)亞定位。可用于染色體定位的其它類似策略包括原位雜交、用標記的流式分選的染色體預篩選和雜交預選,從而構建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進行熒光原位雜交(FISH),可以在一個步驟中精確地進行染色體定位。此技術的綜述,參見Verma等,Human Chromosomesa Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到準確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數(shù)據(jù)相關聯(lián)。這些數(shù)據(jù)可見于例如,V.Mckusick,Mendelian Inheritance in Man(可通過與Johns Hopkins University Welch Medical Library聯(lián)機獲得)。然后可通過連鎖分析,確定基因與業(yè)已定位到染色體區(qū)域上的疾病之間的關系。
接著,需要測定患病和未患病個體間的cDNA或基因組序列差異。如果在一些或所有的患病個體中觀察到某突變,而該突變在任何正常個體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個體,通常涉及首先尋找染色體中結(jié)構的變化,如從染色體水平可見的或用基于cDNA序列的PCR可檢測的缺失或易位。
本發(fā)明的具有抑癌功能的蛋白核苷酸全長序列或其片段通??梢杂肞CR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據(jù)本發(fā)明所公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按本領域技術人員已知的常規(guī)方法所制備的cDNA庫作為模板,擴增而得有關序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉(zhuǎn)入細胞,然后通過常規(guī)方法從增殖后的宿主細胞中分離得到有關序列。
此外,還可用人工合成的方法來合成有關序列,尤其是片段長度較短時。通常,通過先合成多個小片段,然后再進行連接可獲得序列很長的片段。
目前,已經(jīng)可以完全通過化學合成來編碼本發(fā)明蛋白(或其片段,或其衍生物)的DNA序列。然后可將該DNA序列引入本領域中的各種DNA分子(如載體)和細胞中。此外,還可通過化學合成將突變引入本發(fā)明蛋白序列中。
此外,由于本發(fā)明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,與來源于其他物種的同族蛋白相比,預計在施用于人時將具有更高的活性和/或更低的副作用(例如在人體內(nèi)的免疫原性更低或沒有)。
下面結(jié)合具體實施例,進一步闡述本發(fā)明。應理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(New YorkCold Spring Harbor LaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1cDNA基因的獲得及對小鼠NIH/3T3細胞克隆形成的抑制作用PP10513、PP10764、PP12100、PP12488、PP12494、PP12901、PP13275、PP13296和PP14214是通過用常規(guī)方法構建人胎盤cDNA文庫獲得的;FP497、FP585、FP588和FP757是通過用常規(guī)方法構建人胎兒cDNA文庫獲得的。取3、6、9月齡的胎盤組織(PP克隆)或胎兒組織(FP克隆),用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用pCMV-script TMXRcDNA文庫構建試劑盒(Stratagene公司)構建上述mRNA的cDNA文庫。其中反轉(zhuǎn)錄酶改用MMLV-RT-Superscript II(GIBCO BRL),反轉(zhuǎn)錄反應在42℃進行。轉(zhuǎn)化XL 10-Gold感受細胞,獲得了1×106cfu/μg滴度的cDNA文庫。第一輪隨機挑取cDNA克隆,其后以高豐度cDNA克隆和已證明有抑制癌細胞生長功能的cDNA克隆為探針,雜交篩選cDNA文庫,挑取弱陽性及陰性克隆。用Qiagen 96孔板質(zhì)粒抽提試劑盒,按廠家說明書進行質(zhì)粒DNA的提取。質(zhì)粒DNA和空載體同時轉(zhuǎn)染小鼠NIH/3T3細胞。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待轉(zhuǎn)染。每份DNA樣品中加0.74μl脂質(zhì)體及9.3μl無血清培液,混勻后,室溫放置10分鐘。每管中加150μl無血清培液,均分加入3孔生長于96孔板的小鼠NIH/3T3細胞中,37℃放置2小時,每孔再加50μl無血清培液,37℃24小時。每孔換100μl全培液,37℃24小時,換含G418的全培液100μl,37℃24-48小時,邊觀察,邊換G418濃度不等的培液。約2-3次后,直到鏡檢細胞有克隆形成,計數(shù)。發(fā)現(xiàn)上述克隆有抑制細胞克隆形成作用,結(jié)果如下表所示。
cDNA克隆轉(zhuǎn)染細胞(3T3)克隆形成情況
對cDNA克隆采用雙脫氧終止法,在ABI377 DNA自動測序儀上測定其一端近500bp的核苷酸序列。分析后,確定為新基因克隆,進行另一端測序,仍未獲得全長cDNA序列,設計引物,再次進行測序,直到獲得全長序列(SEQ ID NO1、4、7、10、13、16、19、22、25、28、31、34、37)。
實施例2從胎盤或胎兒cDNA中PCR獲得全長基因和重組蛋白的表達取3、6、9月齡的胎盤組織(PP克隆)或胎兒組織(FP克隆),用Trizol試劑(GIBCOBRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript II(GIBCO BRL),反轉(zhuǎn)錄酶在42℃進行反轉(zhuǎn)錄反應,獲得胎盤或胎兒cDNA。利用各個基因的特異引物(如下表所示),按97℃3’1個循環(huán)。94℃30″ 60℃30″ 72℃1’35個循環(huán),72℃10’1個循環(huán)進行PCR擴增,獲得含有完整開放閱讀框序列的各蛋白基因的擴增產(chǎn)物。擴增產(chǎn)物經(jīng)測序驗證,與實施例1測得的序列相符,隨后用常規(guī)技術將擴增產(chǎn)物轉(zhuǎn)入宿主細胞,獲得重組蛋白(SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35、38)。
基因特異引物
實施例3cDNA克隆序列分析1.PP10513A核苷酸序列(SEQ ID NO1)長度1494個堿基1 GAGAGAGAGC GAGAGAGAGA GAGAGAGAGA GAGAGAGAGA GAGAGAGAGA GAGAGCCTCC61 TTGGCAGACT GGGACACCAA CGCCTCTTCC CTCTTGGGCT GACACCGAGC TGTAAATGTC121 AGTGGACATT TAAATACTGC GGTTACACAT TCGATGTCCT GTCTGCAATG GAGCCGGGTT181 CTGTAAACAT AAGCTGCATG GCGAAATCGG ATCATCATCG CCCATCAAGC TCTTTGGCAG241 CAGTGCTGTA ATCAGTGCAA ACATTTATTT ATATAAATGC TCCCATCCCC TCGGCATGAA301 GATATACTTA GGCTCTCTCA ATGGACAGCC ACGCCACAAG CCCAGGAATG AGAGCTTGTC361 AGATACTGAG GCTGTTTTCA GAGCCAGTGT TCGGCTGAAG TGGCACAGAA GCTATCATTG421 TTTGCAAATC TCTGCTGCTT GTCAAGCCAC AGGGTTAAGT AACCCCGGAT GTTGCGAACA481 CTCTGAAGTG CTGACCTGCA GTGTCTTTTT GGATCACTGA GCCCTCAGGC AGACAGGCTG541 TACGTGGCCG ACACGTCATG GCTGCTGTCT TGCACTTAAC CCTCTTTATC TTTAGACCTT601 GATTGTGCAC CTGTTTCTCA TTGGAAGCTA ATGACAATCC ACGAAGCGGC TTGGCAGTGA661 CTTGTCTCTT GATTGTGTAA GGAGGGGTTG CCACATTCAC CCATGTTGTT GACTTTCAAC721 TGTACACTTG AAAACGTCAA AAGTCAGAGT AAGCATTGCC TCATGTCTCC GAGTGTAGCA781 ATTCTAGGAA AACTCTTCCG AATGGGTTTA AAGTCAAACA AATCCAATCA AAACAGACTT841 GCAGGGCCAG GCAGCGGTGG CTCATGCCTG CAATCCCAGC ACTTTGGGAA GCCAAGGTGG901 GCAGATCACT TGAGGTCAGG AGTTGGAGAC CAGCCTGGCC AACGTGGTGA GAGCCCATCT961 GTACTAAAAA TACAAAAATT TGCTGAGCCT GGTGGCAGGC GCCTGTAGTC TCAGCCTCCC1021 GAGTGGCTGG GACTACAGGC ACATGCAACC ACACCCGGCT CATGTTTTGC ATTTTTAGTA1081 CAGACCGGGT TTCACCGTGT TGGCCAGGAT CGTCTTGATA TCGTGACCTC GTGAACCGCC1141 CGCCTTGGCC TCCCAAAGTG CTGGGATGAC AGGTGTGAGA GTTCAGCAGT ATTAACTACA1201 TTCATGTTAA TGATGCGACC ATCACCAACA TTCATTTCCA GAACACTCTG TCCCCAGTAA1261 ACAACATGTC CCCGTTCCTC CCAGCCACTG GTACCTACCA TTCTACTTTC TGTTTGTATA
1321 AACTTGACAA CTCTAGGGTC CTCATATAAG TGGAATCCAG CTGGGCCCAG TGGCTCACAC1381 CTGTCATCCC GGCACTTTGG GAGGCCGAGG TGGGTGGATC ACGAGGTCAG GAGATTGAGA1441 CCATCCTGGC CAATATGGGG AAACCCCGTC TCTACTAAAA AAAATAAAAA AAAAB核苷酸序列(SEQ ID NO2)長度101個氨基酸1 MLLTFNCTLE NVKSQSKHCL MSPSVAILGK LFRMGLKSNK SNQNRLAGPG SGGSCLQSQH61 FGKPRWADHL RSGVGDQPGQ RGESPSVLKI QKFAEPGGRR LC.核苷酸及氨基酸組合序列(SEQ ID NO3)克隆號和蛋白名稱PP10513起始編碼子703 ATG 終止編碼子1006 TAG 蛋白質(zhì)分子量10947.08(注(1)給出的是起始和終止編碼子第一個核苷酸的位置,(2)分子量單位是道爾頓。)1 GAG AGA GAG CGA GAG AGA GAG AGA GAG AGA GAG AGA GAG AGA GAG AGA 4849 GAG AGA GCC TCC TTG GCA GAC TGG GAC ACC AAC GCC TCT TCC CTC TTG 9697 GGC TGA CAC CGA GCT GTA AAT GTC AGT GGA CAT TTA AAT ACT GCG GTT 144145 ACA CAT TCG ATG TCC TGT CTG CAA TGG AGC CGG GTT CTG TAA ACA TAA 192193 GCT GCA TGG CGA AAT CGG ATC ATC ATC GCC CAT CAA GCT CTT TGG CAG 240241 CAG TGC TGT AAT CAG TGC AAA CAT TTA TTT ATA TAA ATG CTC CCA TCC 288289 CCT CGG CAT GAA GAT ATA CTT AGG CTC TCT CAA TGG ACA GCC ACG CCA 336337 CAA GCC CAG GAA TGA GAG CTT GTC AGA TAC TGA GGC TGT TTT CAG AGC 384385 CAG TGT TCG GCT GAA GTG GCA CAG AAG CTA TCA TTG TTT GCA AAT CTC 432433 TGC TGC TTG TCA AGC CAC AGG GTT AAG TAA CCC CGG ATG TTG CGA ACA 480481 CTC TGA AGT GCT GAC CTG CAG TGT CTT TTT GGA TCA CTG AGC CCT CAG 528529 GCA GAC AGG CTG TAC GTG GCC GAC ACG TCA TGG CTG CTG TCT TGC ACT 576577 TAA CCC TCT TTA TCT TTA GAC CTT GAT TGT GCA CCT GTT TCT CAT TGG 624625 AAG CTA ATG ACA ATC CAC GAA GCG GCT TGG CAG TGA CTT GTC TCT TGA 672673 TTG TGT AAG GAG GGG TTG CCA CAT TCA CCC ATG TTG TTG ACT TTC AAC 7201 Met Leu Leu Thr Phe Asn 6721 TGT ACA CTT GAA AAC GTC AAA AGT CAG AGT AAG CAT TGC CTC ATG TCT 7687 Cys Thr Leu Glu Asn Val Lys Ser Gln Ser Lys His Cys Leu Met Ser 22769 CCG AGT GTA GCA ATT CTA GGA AAA CTC TTC CGA ATG GGT TTA AAG TCA 81623 Pro Ser Val Ala Ile Leu Gly Lys Leu Phe Arg Met Gly Leu Lys Ser 38817 AAC AAA TCC AAT CAA AAC AGA CTT GCA GGG CCA GGC AGC GGT GGC TCA 86439 Asn Lys Ser Asn Gln Asn Arg Leu Ala Gly Pro Gly Ser Gly Gly Ser 54865 TGC CTG CAA TCC CAG CAC TTT GGG AAG CCA AGG TGG GCA GAT CAC TTG 91255 Cys Leu Gln Ser Gln His Phe Gly Lys Pro Arg Trp Ala Asp His Leu 70913 AGG TCA GGA GTT GGA GAC CAG CCT GGC CAA CGT GGT GAG AGC CCA TCT 96071 Arg Ser Gly Val Gly Asp Gln Pro Gly Gln Arg Gly Glu Ser Pro Ser 86961 GTA CTA AAA ATA CAA AAA TTT GCT GAG CCT GGT GGC AGG CGC CTG TAG100887 Val Leu Lys Ile Gln Lys Phe Ala Glu Pro Gly Gly Arg Arg Leu *** 1021009 TCT CAG CCT CCC GAG TGG CTG GGA CTA CAG GCA CAT GCA ACC ACA CCC10561057 GGC TCA TGT TTT GCA TTT TTA GTA CAG ACC GGG TTT CAC CGT GTT GGC11041105 CAG GAT CGT CTT GAT ATC GTG ACC TCG TGA ACC GCC CGC CTT GGC CTC11521153 CCA AAG TGC TGG GAT GAC AGG TGT GAG AGT TCA GCA GTA TTA ACT ACA12001201 TTC ATG TTA ATG ATG CGA CCA TCA CCA ACA TTC ATT TCC AGA ACA CTC12481249 TGT CCC CAG TAA ACA ACA TGT CCC CGT TCC TCC CAG CCA CTG GTA CCT12961297 ACC ATT CTA CTT TCT GTT TGT ATA AAC TTG ACA ACT CTA GGG TCC TCA13441345 TAT AAG TGG AAT CCA GCT GGG CCC AGT GGC TCA CAC CTG TCA TCC CGG13921393 CAC TTT GGG AGG CCG AGG TGG GTG GAT CAC GAG GTC AGG AGA TTG AGA14401441 CCA TCC TGG CCA ATA TGG GGA AAC CCC GTC TCT ACT AAA AAA AAT AAA14881489 AAA AAA 14942.PPl0764A核苷酸序列(SEQ ID NO4)長度1598個堿基1 GTGCTCCTGT CTTCTGCTCC TCTAGTGAGC CATTCCTCTC CCTTGGAATT CATCAGAGTC61 ATCCCTGTAG AGCCCCCTTC CTGCCTCTCA ATTCCTCCTG CCTCACTTCC CAGGCTACTG121 CTGCTTCAAG ACAGTGACGT TTCTCTCCGG TCAGCTGTCA GGAGCGCTGG TGAGCTTCCT181 ACTGTGCCAC AAGGTGCGGG TGCTGGAGAC ACAGCTGAGC CTGGAAATGA GAGTGGGCAT241 CGCCGTGGTC ATCATGACTC CTCTGCGGCG TGGTCACCAT GTTGGTTCAC TGTGTTGGGC301 TCTTATTGAC GGGTCTCCTG CTAGGCCTGA CCTTGGGTGC CGGAGCCCTG CTGGCTTCTG361 AGCCTATCTA CCAACCACCT TCAGCCTGGG TGCCAGCTGG GGGGCTGGTG GGGCTGGCGC421 TGCTGGGAGC CCTGCTCACA CTTCGGTGGC CACGTCCATT CACAGTTCTG GGCACAACCC481 TGCTGGGTTC TGCAGTGCTT GTGGCCTGTG TTGACTACTT CCTGGAGGGG CTGGCACTGG541 GGAGTTGGCT GGGCCAACGC CTGCAGACAC TTCCAGCCTT GCCTTCTCTC TGCTGATATA601 GCTGGGTCTT ACTGGGGATC TGGCCAGCCT TGGGGGCCCT TGGAGCCCTG GCCCAGTGGA661 AGCTCGTGCC TGAGGAACAT GGAGGCCACG CTAATGAGTT ACTTCCAGAG TCTTCAAGAG721 TGCCAACTGG GACCAGGACC CCAGACCACA GCCCCCCACA CCGTCCTGGA CCTGGATTCT781 GACTGTGGTT CCACTGTACC CCTCACCTTA ATCTCTGGTT CTAACCAGAC CTGAGCCTAG841 ACTTCCACTT TTTCCCTTAC CCCTGTGAGG GCCTGGGAAC AGTAGGTGGG CAGGGTTTGA901 GCCCACAGGA CCTGCACACA AACTTCCCCA CCTCTTGGAC TTGGGGACAG GATCTGTGCC961 TCAACCCAGA CCAGCTTTGT AGGGATATGT TCCAAGAACA GAGAAGAGTC TTATGGGGAA1021 GGGGGAGGAA GGGAAGTATG AATATTTACC TCTGACCAAT AATAGAGGTG CCCTGGTCCC1081 CAAAGAAATT GACTCCCGAA TTCCCTCCAA GCCTTACCCA TATAGCTTTT GTTTGTTTGT1141 TTGTTTTCAG ACAAGGTCTT GTTCTGTCCA GTGCCGTGGC GTGACCACAG CTCATGACAA1201 CTTTGATTTC CCCGGCCCAA GCGAGCCTCT CATTCAGCCT CCTGAGTGGC TGGGACCACA1261 GACGCCACAC ACAGCTAATT TTTATGTATT CGTTTTTATT TTTTTGCAGA GACAGGGTCT1321 CCCTATGTTG CCCAAGCTGG TCTTGAACTC CTGGGCTCAA GTGATCCTCC TGCTTCAGCC1381 TCCCAAAGTG CTAGGATTAT AGCCACCGCA CCTCGTCTTG AAATAGCCTT TTAAATGTTC1441 ACCTCAGCTT GCCTCACAGT GGGTCTGTTC CTGGTTTCCC AGATGCATAA AGGAAGACAT1501 ATCCCTCCCC TGGGCAGCAA GGCTACAATG GGAGGGAGGG AGAACATGGG AGCATGTGAA1561 TAAAATGGCA TTAAATACTG AAAAAAAAAA AAAAAAAAB核苷酸序列(SEQ ID NO5)長度129個氨基酸1 MGKGEEGKYE YLPLTNNRGA LVPKEIDSRI PSKPYPYSFC LFVCFQTRSC SVQCRGVTTA61 HDNFDFPGPS EPLIQPPEWL GPQTPHTANF YVFVFIFLQR QGLPMLPKLV LNSWAQVILL121 LQPPKVLGLC.核苷酸及氨基酸組合序列(SEQ ID NO6)克隆號和蛋白名稱PP10764起始編碼子1013 ATG 終止編碼子1400 TAG 蛋白質(zhì)分子量14581.281G TGC TCC TGT CTT CTG CTC CTC TAG TGA GCC ATT CCT CTC CCT TGG4647 AAT TCA TCA GAG TCA TCC CTG TAG AGC CCC CTT CCT GCC TCT CAA TTC9495 CTC CTG CCT CAC TTC CCA GGC TAC TGC TGC TTC AAG ACA GTG ACG TTT 142143 CTC TCC GGT CAG CTG TCA GGA GCG CTG GTG AGC TTC CTA CTG TGC CAC 190191 AAG GTG CGG GTG CTG GAG ACA CAG CTG AGC CTG GAA ATG AGA GTG GGC 238239 ATC GCC GTG GTC ATC ATG ACT CCT CTG CGG CGT GGT CAC CAT GTT GGT 286287 TCA CTG TGT TGG GCT CTT ATT GAC GGG TCT CCT GCT AGG CCT GAC CTT 334335 GGG TGC CGG AGC CCT GCT GGC TTC TGA GCC TAT CTA CCA ACC ACC TTC 382383 AGC CTG GGT GCC AGC TGG GGG GCT GGT GGG GCT GGC GCT GCT GGG AGC 430431 CCT GCT CAC ACT TCG GTG GCC ACG TCC ATT CAC AGT TCT GGG CAC AAC 478479 CCT GCT GGG TTC TGC AGT GCT TGT GGC CTG TGT TGA CTA CTT CCT GGA 526527 GGG GCT GGC ACT GGG GAG TTG GCT GGG CCA ACG CCT GCA GAC ACT TCC 574575 AGC CTT GCC TTC TCT CTG CTG ATA TAG CTG GGT CTT ACT GGG GAT CTG 622623 GCC AGC CTT GGG GGC CCT TGG AGC CCT GGC CCA GTG GAA GCT CGT GCC 670671 TGA GGA ACA TGG AGG CCA CGC TAA TGA GTT ACT TCC AGA GTC TTC AAG 718719 AGT GCC AAC TGG GAC CAG GAC CCC AGA CCA CAG CCC CCC ACA CCG TCC 766767 TGG ACC TGG ATT CTG ACT GTG GTT CCA CTG TAC CCC TCA CCT TAA TCT 814815 CTG GTT CTA ACC AGA CCT GAG CCT AGA CTT CCA CTT TTT CCC TTA CCC 862863 CTG TGA GGG CCT GGG AAC ACT AGG TGG GCA GGG TTT GAG CCC ACA GGA 910911 CCT GCA CAC AAA CTT CCC CAC CTC TTG GAC TTG GGG ACA GGA TCT GTG 958959 CCT CAA CCC AGA CCA GCT TTG TAG GGA TAT GTT CCA AGA ACA GAG AAG10061007 AGT CTT ATG GGG AAG GGG GAG GAA GGG AAG TAT GAA TAT TTA CCT CTG10541 Met Gly Lys Gly Glu Glu Gly Lys Tyr Glu Tyr Leu Pro Leu 141055 ACC AAT AAT AGA GGT GCC CTG GTC CCC AAA GAA ATT GAC TCC CGA ATT110215 Thr Asn Asn Arg Gly Ala Leu Val Pro Lys Glu Ile Asp Ser Arg Ile 301103 CCC TCC AAG CCT TAC CCA TAT AGC TTT TGT TTG TTT GTT TGT TTT CAG115031 Pro Ser Lys Pro Tyr Pro Tyr Ser Phe Cys Leu Phe Val Cys Phe Gln 461151 ACA AGG TCT TGT TCT GTC CAG TGC CGT GGC GTG ACC ACA GCT CAT GAC119847 Thr Arg Ser Cys Ser Val Gln Cys Arg Gly Val Thr Thr Ala His Asp 621199 AAC TTT GAT TTC CCC GGC CCA AGC GAG CCT CTC ATT CAG CCT CCT GAG124663 Asn Phe Asp Phe Pro Gly Pro Ser Glu Pro Leu Ile Gln Pro Pro Glu 781247 TGG CTG GGA CCA CAG ACG CCA CAC ACA GCT AAT TTT TAT GTA TTC GTT129479 Trp Leu Gly Pro Gln Thr Pro His Thr Ala Asn Phe Tyr Val Phe Val 941295 TTT ATT TTT TTG CAG AGA CAG GGT CTC CCT ATG TTG CCC AAG CTG GTC134295 Phe Ile Phe Leu Gln Arg Gln Gly Leu Pro Met Leu Pro Lys Leu Val 1101343 TTG AAC TCC TGG GCT CAA GTG ATC CTC CTG CTT CAG CCT CCC AAA GTG1390111 Leu Asn Ser Trp Ala Gln Val Ile Leu Leu Leu Gln Pro Pro Lys Val 1261391 CTA GGA TTA TAG CCA CCG CAC CTC GTC TTG AAA TAG CCT TTT AAA TGT1438127 Leu Gly Leu *** 1301439 TCA CCT CAG CTT GCC TCA CAG TGG GTC TGT TCC TGG TTT CCC AGA TGC14861487 ATA AAG GAA GAC ATA TCC CTC CCC TGG GCA GCA AGG CTA CAA TGG GAG15341535 GGA GGG AGA ACA TGG GAG CAT GTG AAT AAA ATG GCA TTA AAT ACT GAA15821583 AAA AAA AAA AAA AAA A 15983.PP12100A核苷酸序列(SEQ ID NO7)長度1978個堿基1 GTGGGATTAC AGGCGTGAGC CACTGCACCC GACCCCAGAT ATGTTTTTAA GTCAGCCATT61 CCACATCGCT AAGTGCCCAT TGTGTAGAGA AGACTGATCT GAAATGCCTT GTGCCATGCA121 CCTGGGGCCA GACCCAGGCT GTGATTAAAG GGCGGCTTCA TATTCACAGT TGTTGGAGTG181 CTGTTAAATC TGGCTCTAAT CTAAAGTGTC TTTACTTTGA AAACCCCATG AATGTTTAGA241 GACTCGCCTT TAAACAGTGA ACCTCTGCCC TGGTGAATGT CTTGGCCGTC TGCCTCGAGG301 CCTAATTCAT GCTGGAGACA TCCTAGACAC TTTCTTTGCT GAATTTCATG ACCATAGCTA361 TTCCTCTTTA CCAGACACAG CACCTTCTTC CTGGTCTTGG CTAGAGATGC AGCAGTATTT421 GGGACTGACA TTACCTGAAG AGCACTTCCT ATCTAAGTAA CTGAACTACA GCACTGTCAC481 AACGCTGGCA TGACATAGAA GGCTCGCCAC ATCCTTCATG TGTTTAGATT TACTCCTAGT541 GTGCTGTGGG GCCAAATCGT GGACTCTTTT TTCCTATCTC TGTTCTTTCT AGATGATCTT601 GTTCAGTCCC CTAGCTTTAA ATTCTATCTG TAGGCCAATG ACCTCCAAAT GTATATCCAT661 AGCCCAGACC GACCCTCCAG ACTCCAGACT CACAGAGCTG ACTCTCTCAT ACAACTTCTC721 TATTTGGAAT CCTAATGGGC ATCTCAAATC CAACATGAGG CTGCCAATGG CGCTCTTGCT781 TTTTCCTCTC AAACCTTCCC TCTCTCATTT CCTCAACCCA GAAAATTGCT GCAGCACTTG841 ATCAGTGACT CAAGCCAGAA AGCTCAGCAG TCATCATCAG GTTCTCCCTC TTTCTCATGC901 CCAGGAGGAT GCGGGGGGCG GCCCCCTGCC CACACTCTGC TCCCTGGGAA GAAACGTGGG961 AAGCATGAGC CAGGCGTTGG GACCCAAGCC AAGTGTAGTC CCTGCCACAC CCATTTGCTT1021 TCCTTCCCAC AAGCTCTCCA GTCAGGCCAC TCTCCCTCTC CACTACTCAC CCTCGGCCAA1081 GCCGCACCTT GTCTGGCCTG GGTTACCACA GGGCCCTTGG CCTCTGTGGC TCGCATCCCT1141 CTCCAGCCCA CTTCTATCAC AAAGGCCAGT GGCAGCCCCT GTCCTGCCTC TGCCCAGACC1201 TTTAATGGCT TCCCACTGCT CTTGCAGCAA AACACATGTT CTTCACTGCC ACCTAGAATC1261 ATCTCAGCAT TGCCTGCTTG TCCAAACCCA CCTTCTACAC CTCTCTATTT CTCTTACTGG1321 CCTCCCTTCT GTTCCTTAAA TATACTAAGC CCTCCTGCAG GCCTGTACCT GCCTCCAGCT1381 CTTTATGCAC CTGGCTCACT CTTGGTCTTT GGGTCCCAGC TCAAACGTCA CCTCTTTAGA1441 GGGGCTGCCT TGTCTACCTA AATAAGCTCC TGCAAAAAAT GTCCAGCCAT TGGCACATAG1501 TAGGCCCCCT TATCCATGGG TTCACGTCTG CAGGTTCAGC TACCTGCAGT CAATCACAGT1561 CTGAAAATTG TGCAGTATTT TGAGAGAGAG ACCACATTGA CATAACTTTT ATTACAGTAT1621 ATTGTTATAA TTGTCCTATT TTATTGTTAT TGTTGTTACT CTTACTGTGC CTAATTTATA1681 AATTAGACTT TATCATGCTT TGGGAGGCAG AGGCAGAAGG TATCACTTGA GCCCGGGAGT1741 TCAGCCAAGA CCAGCCTGGG CCACACAGCA AGACCCCATC TCTACAAAAA AATTAATAAA1801 AGTAAAAAAT TAACCAAATG TGATGGTGCA CACCTGTGGT CCCAGCTACT CAGGAGGCTG1861 AGGCAGGAGG ATCACTTGAG CTCAGGAGGT TGAGGCTGCA GGGTGAGCTG TGATTTTGCC1921 ACAGTTCTAC AGCTTGGGTG AACAGAGGAA GACCCCTTTC AAAAAAAAAA AAAAAAAAB核苷酸序列(SEQ ID NO8)長度124個氨基酸1 MSQALGPKPS VVPATPICFP SHKLSSQATL PLHYSPSAKP HLVWPGLPQG PWPLWLASLS61 SPLLSQRPVA APVLPLPRPL MASHCSCSKT HVLHCHLESS QHCLLVQTHL LHLSISLTGL121 PSVPC.核苷酸及氨基酸組合序列(SEQ ID NO9)克隆號和蛋白名稱PP12100起始編碼子965 ATG 終止編碼子1337 TAA 蛋白質(zhì)分子量13279.951G TGG GAT TAC AGG CGT GAG CCA CTG CAC CCG ACC CCA GAT ATG TTT 4647 TTA AGT CAG CCA TTC CAC ATC GCT AAG TGC CCA TTG TGT AGA GAA GAC 9495 TGA TCT GAA ATG CCT TGT GCC ATG CAC CTG GGG CCA GAC CCA GGC TGT 142143 GAT TAA AGG GCG GCT TCA TAT TCA CAG TTG TTG GAG TGC TGT TAA ATC 190191 TGG CTC TAA TCT AAA GTG TCT TTA CTT TGA AAA CCC CAT GAA TGT TTA 238239 GAG ACT CGC CTT TAA ACA GTG AAC CTC TGC CCT GGT GAA TGT CTT GGC 286287 CGT CTG CCT CGA GGC CTA ATT CAT GCT GGA GAC ATC CTA GAC ACT TTC 334335 TTT GCT GAA TTT CAT GAC CAT AGC TAT TCC TCT TTA CCA GAC ACA GCA 382383 CCT TCT TCC TGG TCT TGG CTA GAG ATG CAG CAG TAT TTG GGA CTG ACA 430431 TTA CCT GAA GAG CAC TTC CTA TCT AAG TAA CTG AAC TAC AGC ACT GTC 478479 ACA ACG CTG GCA TGA CAT AGA AGG CTC GCC ACA TCC TTC ATG TGT TTA 526527 GAT TTA CTC CTA GTG TGC TGT GGG GCC AAA TCG TGG ACT CTT TTT TCC 574575 TAT CTC TGT TCT TTC TAG ATG ATC TTG TTC AGT CCC CTA GCT TTA AAT 622623 TCT ATC TGT AGG CCA ATG ACC TCC AAA TGT ATA TCC ATA GCC CAG ACC 670671 GAC CCT CCA GAC TCC AGA CTC ACA GAG CTG ACT CTC TCA TAC AAC TTC 718719 TCT ATT TGG AAT CCT AAT GGG CAT CTC AAA TCC AAC ATG AGG CTG CCA 766767 ATG GCG CTC TTG CTT TTT CCT CTC AAA CCT TCC CTC TCT CAT TTC CTC 814815 AAC CCA GAA AAT TGC TGC AGC ACT TGA TCA GTG ACT CAA GCC AGA AAG 862863 CTC AGC AGT CAT CAT CAG GTT CTC CCT CTT TCT CAT GCC CAG GAG GAT 910911 GCG GGG GGC GGC CCC CTG CCC ACA CTC TGC TCC CTG GGA AGA AAC GTG 958959 GGA AGC ATG AGC CAG GCG TTG GGA CCC AAG CCA AGT GTA GTC CCT GCC10061 Met Ser Gln Ala Leu Gly Pro Lys Pro Ser Val Val Pro Ala 141007 ACA CCC ATT TGC TTT CCT TCC CAC AAG CTC TCC AGT CAG GCC ACT CTC105415 Thr Pro Ile Cys Phe Pro Ser His Lys Leu Ser Ser Gln Ala Thr Leu 301055 CCT CTC CAC TAC TCA CCC TCG GCC AAG CCG CAC CTT GTC TGG CCT GGG110231 Pro Leu His Tyr Ser Pro Ser Ala Lys Pro His Leu Val Trp Pro Gly 461103 TTA CCA CAG GGC CCT TGG CCT CTG TGG CTC GCA TCC CTC TCC AGC CCA115047 Leu Pro Gln Gly Pro Trp Pro Leu Trp Leu Ala Ser Leu Ser Ser Pro 621151 CTT CTA TCA CAA AGG CCA GTG GCA GCC CCT GTC CTG CCT CTG CCC AGA119863 Leu Leu Ser Gln Arg Pro Val Ala Ala Pro Val Leu Pro Leu Pro Arg 781199 CCT TTA ATG GCT TCC CAC TGC TCT TGC AGC AAA ACA CAT GTT CTT CAC124679 Pro Leu Met Ala Ser His Cys Ser Cys Ser Lys Thr His Val Leu His 941247 TGC CAC CTA GAA TCA TCT CAG CAT TGC CTG CTT GTC CAA ACC CAC CTT129495 Cys His Leu Glu Ser Ser Gln His Cys Leu Leu Val Gln Thr His Leu 1101295 CTA CAC CTC TCT ATT TCT CTT ACT GGC CTC CCT TCT GTT CCT TAA ATA1342111 Leu His Leu Ser Ile Ser Leu Thr Gly Leu Pro Ser Val Pro *** 1251343 TAC TAA GCC CTC CTG CAG GCC TGT ACC TGC CTC CAG CTC TTT ATG CAC13901391 CTG GCT CAC TCT TGG TCT TTG GGT CCC AGC TCA AAC GTC ACC TCT TTA14381439 GAG GGG CTG CCT TGT CTA CCT AAA TAA GCT CCT GCA AAA AAT GTC CAG14861487 CCA TTG GCA CAT AGT AGG CCC CCT TAT CCA TGG GTT CAC GTC TGC AGG15341535 TTC AGC TAC CTG CAG TCA ATC ACA GTC TGA AAA TTG TGC AGT ATT TTG15821583 AGA GAG AGA CCA CAT TGA CAT AAC TTT TAT TAC AGT ATA TTG TTA TAA16301631 TTG TCC TAT TTT ATT GTT ATT GTT GTT ACT CTT ACT GTG CCT AAT TTA16781679 TAA ATT AGA CTT TAT CAT GCT TTG GGA GGC AGA GGC AGA AGG TAT CAC17261727 TTG AGC CCG GGA GTT CAG CCA AGA CCA GCC TGG GCC ACA CAG CAA GAC17741775 CCC ATC TCT ACA AAA AAA TTA ATA AAA GTA AAA AAT TAA CCA AAT GTG18221823 ATG GTG CAC ACC TGT GGT CCC AGC TAC TCA GGA GGC TGA GGC AGG AGG18701871 ATC ACT TGA GCT CAG GAG GTT GAG GCT GCA GGG TGA GCT GTG ATT TTG19181919 CCA CAG TTC TAC AGC TTG GGT GAA CAG AGG AAG ACC CCT TTC AAA AAA19661967 AAA AAA AAA AAA19784. PP12488A核苷酸序列(SEQ ID NO10)長度2371個堿基1 GGTGAGCGCC ACCCGGAGTC CCGCGCGCAA CTTTCAGGGC GCACTCGGCG GGGCGGCTGC61 GCGGCTGCCG GGACTCGGCG CGGGACTGCA TGGAGGCCAA GGAGAAGCAG CATCTGTTGG121 ACGCCAGGCC GGCAATCCGG TCATACACGG GATCTCTGTG GCAGGAAGGG GCTGGCTGGA181 TTCCTCTGCC CCGACCTGGC CTGGACTTGC AGGCCATTGA GCTGGCTGCC CAGAGCAACC241 ATCACTGCCA TGCTCAGAAG GGTCCTGACA GTCACTGTGA CCCCAAGAAG GGGAAGGCCC301 AGCGCCAGCT GTATGTAGCC TCTGCCATCT GCCTGTTGTT CATGATCGGA GAAGTCGTTG361 GTGGGTACCT GGCACACAGC TTGGCTGTCA TGACTGACGC AGCACACCTG CTCACTGACT421 TTGCCAGCAT GCTCATCAGC CTCTTCTCCC TCTGGATGTC CTCCCGGCCA GCCACCAAGA481 CCATGAACTT TGGCTGGCAG AGAGCTGAGA TCTTGGGAGC CCTGGTCTCT GTACTGTCCA541 TCTGGGTCGT GACGGGGGTA CTGGTGTACC TGGCTGTGGA GCGGCTGATC TCTGGGGACT601 ATGAAATTGA CGGGGGGACC ATGCTGATCA CGTCGGGCTG CGCTGTGGCT GTGAACATCA661 TAATGGGGTT GACCCTTCAC CAGTCTGGCC ATGGGCACAG CCACGGCACC ACCAACCAGC721 AGGAGGAGAA CCCCAGCGTC CGAGCTGCCT TCATCCATGT GATCGGCGAC TTTATGCAGA781 GCATGGGTGT CCTAGTGGCA GCCTATATTT TATACTTCAA GCCAGAATAC AAGTATGTAG841 ACCCCATCTG CACCTTCGTC TTCTCCATCC TGGTCCTGGG GACAACCTTG ACCATCCTGA901 GAGATGTGAT CCTGGTGTTG ATGGAAGGGA CCCCCAAGGG CGTTGACTTC ACAGCTGTTC961 GTGATCTGCT GCTGTCGGTG GAGGGGGTAG AAGCCCTGCA CAGCCTGCAT ATCTGGGCAC1021 TGACGGTGGC CCAGCCTGTT CTGTCTGTCC ACATCGCCAT TGCTCAGAAT ACAGACGCCC1081 AGGCTGTGCT GAAGACAGCC AGCAGCCGCC TCCAAGGGAA GTTCCACTTC CACACCGTGA1141 CCATCCAGAT CGAGGACTAC TCGGAGGACA TGAAGGACTG TCAGGCATGC CAGGGCCCCT1201 CAGACTGACT GCTCAGCCAG GCACCAACTG GGGCATGAAC AGGACCTGCA GGTGGCTGGA1261 CTGAGTGTCC CCCAGGCCCA GCCAGGACTT TGCCTACCCC AGCTGTGTTA TAAACCAGGT1321 CCCCCTCCTG ACCTCTGCCC CACTCCAGGA ATGGAGCTCT TCCCAGCCTC CCATCTGACT1381 ACAGCCAGGG TGGGGACTCA GCGGGTATAA AGCTAGTGTG ACCCTGCTCT TCCAGCTCCT1441 GGGCCAGCTC TGGAAGGGCT GTATTTGGGC CTAATCCTCA GCAACTGTTC TACCACTCGC1501 AGGGGCAAAG GTGGTGAGCC ACGGGACGTC CAAGGGGAGG CTGGCCCCAG CGCGCCCATA1561 CTGCCTGCCT CATGCCCCAT TCTCAGCCTG GCTGGCCTTT GCCTTTATGA ATCTGAGCCC1621 CTCCATCTGC CTATAGCAAT AGGCACGGGG GTGAGGACCC TCACACTCTC ATTTGAGCCT1681 CCCTGAGGCA GGGAGCCAGG AGGCACCTGA GGCCTATCTG TGCCTTAGTC ACTTCAGCTA1741 TGAGCCAAAT GTTCCCTTTC CTGGAGGGGA GAGGCTTCTT ACTAGGTAAG AGACAGGTTT1801 CCTCTTTCCT TATTTCCTCA GCTGTGCCAA CACAAAAAAC AACTTTGGCA CAGGTGGTGG1861 GCAGGGGGTA GAGAGATTTC AGCTTGGGTT CTGCACTAAC AGCCTCCAAG CCCCCTGGCA1921 CTTCTGTTGC CCTGAGAGTG TCCCAGGGGA TTCAGAGTCT CCAGAAAGAT ATGGCTGGGC1981 CAACTCTGTT GCCTACCTGG CCTGACCCAG TCGGAGCCTG ACATGGTGGA GGGAAAGGGA2041 GACAAGTGGG GCTGCACTCG GTCCAGAGGC CAGCTAGGAG GGAAACCGCA GCTTCCTGGG2101 GCTTGTGTGT GAAGATTCCT GACTTAGGGG TGGCTTTTGT TTACAAGATG CAAGAGGGGA2161 AACCTGTCCC CGACTCATCG AGACAACATG CCCAGTTATC AGGGAGTCCT GTGTCACAAG2221 GTCTGTCTCT GCCATTGTAA GCAAGTGCCT TGGGCGAGCT GGCCTCTGCC CCACAGTTTC2281 ATCTGTACAC CGACAGGGTT GATGCCTCCC TCACAGGGTT GAGAACAAGA GCCAGTTGGC2341 CAAGTAAAAA AAAAAAAAAA AAAAAAAAAA AB核苷酸序列(SEQ ID NO11)長度372個氨基酸1 MEAKEKQHLL DARPAIRSYT GSLWQEGAGW IPLPRPGLDL QAIELAAQSN HHCHAQKGPD61 SHCDPKKGKA QRQLYVASAI CLLFMIGEVV GGYLAHSLAV MTDAAHLLTD FASMLISLFS121 LWMSSRPATK TMNFGWQRAE ILGALVSVLS IWVVTGVLVY LAVERLISGD YEIDGGTMLI181 TSGCAVAVNI IMGLTLHQSG HGHSHGTTNQ QEENPSVRAA FIHVIGDFMQ SMGVLVAAYI241 LYFKPEYKYV DPICTFVFSI LVLGTTLTIL RDVILVLMEG TPKGVDFTAV RDLLLSVEGV301 EALHSLHIWA LTVAQPVLSV HIAIAQNTDA QAVLKTASSR LQGKFHFHTV TIQIEDYSED361 MKDCQACQGP SDC.核苷酸及氨基酸組合序列(SEQ ID NO12)克隆號和蛋白名稱PP12488起始編碼子90 ATG 終止編碼子1206 TGA 蛋白質(zhì)分子量40561.731 GG TGA GCG CCA CCC GGA GTC CCG CGC GCA ACT TTC AGG GCG CAC TCG 4748 GCG GGG CGG CTG CGC GGC TGC CGG GAC TCG GCG CGG GAC TGC ATG GAG 951 Met Glu 296 GCC AAG GAG AAG CAG CAT CTG TTG GAC GCC AGG CCG GCA ATC CGG TCA1433 Ala Lys Glu Lys Gln His Leu Leu Asp Ala Arg Pro Ala Ile Arg Ser 18144 TAC ACG GGA TCT CTG TGG CAG GAA GGG GCT GGC TGG ATT CCT CTG CCC19119 Tyr Thr Gly Ser Leu Trp Gln Glu Gly Ala Gly Trp Ile Pro Leu Pro 34192 CGA CCT GGC CTG GAC TTG CAG GCC ATT GAG CTG GCT GCC CAG AGC AAC23935 Arg Pro Gly Leu Asp Leu Gln Ala Ile Glu Leu Ala Ala Gln Ser Asn 50240 CAT CAC TGC CAT GCT CAG AAG GGT CCT GAC AGT CAC TGT GAC CCC AAG28751 His His Cys His Ala Gln Lys Gly Pro Asp Ser His Cys Asp Pro Lys 66288 AAG GGG AAG GCC CAG CGC CAG CTG TAT GTA GCC TCT GCC ATC TGC CTG33567 Lys Gly Lys Ala Gln Arg Gln Leu Tyr Val Ala Ser Ala Ile Cys Leu 82336 TTG TTC ATG ATC GGA GAA GTC GTT GGT GGG TAC CTG GCA CAC AGC TTG38383 Leu Phe Met Ile Gly Glu Val Val Gly Gly Tyr Leu Ala His Ser Leu 98384 GCT GTC ATG ACT GAC GCA GCA CAC CTG CTC ACT GAC TTT GCC AGC ATG43199 Ala Val Met Thr Asp Ala Ala His Leu Leu Thr Asp Phe Ala Ser Met 114432 CTC ATC AGC CTC TTC TCC CTC TGG ATG TCC TCC CGG CCA GCC ACC AAG 479115 Leu Ile Ser Leu Phe Ser Leu Trp Met Ser Ser Arg Pro Ala Thr Lys 130480 ACC ATG AAC TTT GGC TGG CAG AGA GCT GAG ATC TTG GGA GCC CTG GTC 527131 Thr Met Asn Phe Gly Trp Gln Arg Ala Glu Ile Leu Gly Ala Leu Val 146528 TCT GTA CTG TCC ATC TGG GTC GTG ACG GGG GTA CTG GTG TAC CTG GCT 575147 Ser Val Leu Ser Ile Trp Val Val Thr Gly Val Leu Val Tyr Leu Ala 162576 GTG GAG CGG CTG ATC TCT GGG GAC TAT GAA ATT GAC GGG GGG ACC ATG 623163 Val Glu Arg Leu Ile Ser Gly Asp Tyr Glu Ile Asp Gly Gly Thr Met 178624 CTG ATC ACG TCG GGC TGC GCT GTG GCT GTG AAC ATC ATA ATG GGG TTG 671179 Leu Ile Thr Ser Gly Cys Ala Val Ala Val Asn Ile Ile Met Gly Leu 194672 ACC CTT CAC CAG TCT GGC CAT GGG CAC AGC CAC GGC ACC ACC AAC CAG 719195 Thr Leu His Gln Ser Gly His Gly His Ser His Gly Thr Thr Asn Gln 210720 CAG GAG GAG AAC CCC AGC GTC CGA GCT GCC TTC ATC CAT GTG ATC GGC 767211 Gln Glu Glu Asn Pro Ser Val Arg Ala Ala Phe Ile His Val Ile Gly 226768 GAC TTT ATG CAG AGC ATG GGT GTC CTA GTG GCA GCC TAT ATT TTA TAC 815227 Asp Phe Met Gln Ser Met Gly Val Leu Val Ala Ala Tyr Ile Leu Tyr 242816 TTC AAG CCA GAA TAC AAG TAT GTA GAC CCC ATC TGC ACC TTC GTC TTC 863243 Phe Lys Pro Glu Tyr Lys Tyr Val Asp Pro Ile Cys Thr Phe Val Phe 258864 TCC ATC CTG GTC CTG GGG ACA ACC TTG ACC ATC CTG AGA GAT GTG ATC 911259 Ser Ile Leu Val Leu Gly Thr Thr Leu Thr Ile Leu Arg Asp Val Ile 274912 CTG GTG TTG ATG GAA GGG ACC CCC AAG GGC GTT GAC TTC ACA GCT GTT 959275 Leu Val Leu Met Glu Gly Thr Pro Lys Gly Val Asp Phe Thr Ala Val 290960 CGT GAT CTG CTG CTG TCG GTG GAG GGG GTA GAA GCC CTG CAC AGC CTG1007291 Arg Asp Leu Leu Leu Ser Val Glu Gly Val Glu Ala Leu His Ser Leu 3061008 CAT ATC TGG GCA CTG ACG GTG GCC CAG CCT GTT CTG TCT GTC CAC ATC1055307 His Ile Trp Ala Leu Thr Val Ala Gln Pro Val Leu Ser Val His Ile 3221056 GCC ATT GCT CAG AAT ACA GAC GCC CAG GCT GTG CTG AAG ACA GCC AGC1103323 Ala Ile Ala Gln Asn Thr Asp Ala Gln Ala Val Leu Lys Thr Ala Ser 3381104 AGC CGC CTC CAA GGG AAG TTC CAC TTC CAC ACC GTG ACC ATC CAG ATC1151339 Ser Arg Leu Gln Gly Lys Phe His Phe His Thr Val Thr Ile Gln Ile 3541152 GAG GAC TAC TCG GAG GAC ATG AAG GAC TGT CAG GCA TGC CAG GGC CCC1199355 Glu Asp Tyr Ser Glu Asp Met Lys Asp Cys Gln Ala Cys Gln Gly Pro 3701200 TCA GAC TGA CTG CTC AGC CAG GCA CCA ACT GGG GCA TGA ACA GGA CCT1247371 Ser Asp *** 3731248 GCA GGT GGC TGG ACT GAG TGT CCC CCA GGC CCA GCC AGG ACT TTG CCT12951296 ACC CCA GCT GTG TTA TAA ACC AGG TCC CCC TCC TGA CCT CTG CCC CAC13431344 TCC AGG AAT GGA GCT CTT CCC AGC CTC CCA TCT GAC TAC AGC CAG GGT13911392 GGG GAC TCA GCG GGT ATA AAG CTA GTG TGA CCC TGC TCT TCC AGC TCC14391440 TGG GCC AGC TCT GGA AGG GCT GTA TTT GGG CCT AAT CCT CAG CAA CTG14871488 TTC TAC CAC TCG CAG GGG CAA AGG TGG TGA GCC ACG GGA CGT CCA AGG15351536 GGA GGC TGG CCC CAG CGC GCC CAT ACT GCC TGC CTC ATG CCC CAT TCT15831584 CAG CCT GGC TGG CCT TTG CCT TTA TGA ATC TGA GCC CCT CCA TCT GCC16311632 TAT AGC AAT AGG CAC GGG GGT GAG GAC CCT CAC ACT CTC ATT TGA GCC16791680 TCC CTG AGG CAG GGA GCC AGG AGG CAC CTG AGG CCT ATC TGT GCC TTA17271728 GTC ACT TCA GCT ATG AGC CAA ATG TTC CCT TTC CTG GAG GGG AGA GGC17751776 TTC TTA CTA GGT AAG AGA CAG GTT TCC TCT TTC CTT ATT TCC TCA GCT 18231824 GTG CCA ACA CAA AAA ACA ACT TTG GCA CAG GTG GTG GGC AGG GGG TAG 18711872 AGA GAT TTC AGC TTG GGT TCT GCA CTA ACA GCC TCC AAG CCC CCT GGC 19191920 ACT TCT GTT GCC CTG AGA GTG TCC CAG GGG ATT CAG AGT CTC CAG AAA 19671968 GAT ATG GCT GGG CCA ACT CTG TTG CCT ACC TGG CCT GAC CCA GTC GGA 20152016 GCC TGA CAT GGT GGA GGG AAA GGG AGA CAA GTG GGG CTG CAC TCG GTC 20632064 CAG AGG CCA GCT AGG AGG GAA ACC GCA GCT TCC TGG GGC TTG TGT GTG 21112112 AAG ATT CCT GAC TTA GGG GTG GCT TTT GTT TAC AAG ATG CAA GAG GGG 21592160 AAA CCT GTC CCC GAC TCA TCG AGA CAA CAT GCC CAG TTA TCA GGG AGT 22072208 CCT GTG TCA CAA GGT CTG TCT CTG CCA TTG TAA GCA AGT GCC TTG GGC 22552256 GAG CTG GCC TCT GCC CCA CAG TTT CAT CTG TAC ACC GAC AGG GTT GAT 23032304 GCC TCC CTC ACA GGG TTG AGA ACA AGA GCC AGT TGG CCA AGT AAA AAA 23512352 AAA AAA AAA AAA AAA AAA AA 23715.PP12494A核苷酸序列(SEQ ID NO13)長度3401個堿基1 GCTTGACCCA TCCTCTACTT AGTCACTCTT ATAGAGCCCT GCATTTTCTT TTGTAGCATT61 TATGACATGT GTAATGTTAC ATTTGTTTGT GGGATTATTT AAGGAATGTC TGTCATGTGA121 GACAATAAGC TTTATGAGTA CAGGCACCTC TTCTGTCTTA TTTCCTATGC CCCAGCACAG181 TCCCTGACAT CTAGTAGACC TTCAAAAAGT TTTATGGAAT GAATGAGTGA ACAAATGATG241 CAAAGTGTTG GTTGCAGGAT ATCTCTCTCA GTCTTCCAAT TCTTAGGAGA TCAGAGGCAA301 GAGCTGGTGG CCTTTCACCG CCTGGCTACA GTGTACTACT CCCTGCACAT GTATGAGATG361 GCTGAGGACT GCTACCTGAA GACCCTGTCC CTCTGTCCAC CATGGCTGCA GAGTCCCAAG421 GAGGCCCTGT ACTATGCCAA GGTGTATTAT CGCCTGGGCA GACTCACCTT CTGCCAGCTG481 AAGGTAAGAG CCAGACTTCC CAGATTTCCT GACAGCCACC ACCCAACCAT TCTCCTTCCT541 GACTCAAAGA CAATGAGGAG CCTTTGTGGT GGAGCTGAGA AAACCAGAGT GCCAAGATGA601 GAAGTCTTGT CTCATAGGGT GAGGAGTGGC TTTACAGGGG ACATGGAAGC TCTTTCCACT661 TAACCCTGCT GAAGATCTCA AAGGTGCTCC CATCTTCGCT GAGGAGTAGA CCATGGTTCC721 TCTTTCTCCT TGCCTTGCCA CCATGTCTGT GGCTTCTTTA TCTGTCAGAT ACTACAGGCA781 CATTGCCTGT AAGTCTCTCA AGGGCCTATG GAAATATACA AGACCCCAAA ACAAAAGAAC841 TATAAGGTCT AAAATGAAGA TCAAAATGAA TACTTAAGAG TTTGTCCATA AAATGTTACA901 GACCAACTAG TCAACTGCAA CTCATTTCTT ATAAAGTAAT GTAAAGCTAC ATTTTATGAG961 AAATGTGGGT GCATATTAAC ATGTTTGAGA TAACGAGGTA TGGGGCCTTT AAACTAAGTA1021 TACTTAGATC TTAAGAAGGT TTTATCCCTG CTTCTCTTGC TTGCTGAATC TAGAACTTCT1081 TTTTTTGCTT GCTTGCTTTT TTTTTGGGAC AGGGTCTTGC TGTGTAGCCC AGGCTGGAGT1141 AGCATGGCTC AATCTTGGCT CACTACAGCC TCTGCATCTG GGGCTCAAGC AATCCTTCTA1201 CTTCAGCCTC CTCAGAAGCT GGGACCACAG GTGCACACCA CCACACCTGG CTAATTTTTG1261 TATTTTTTTG TAAAGATGGG GTTTCATCAT GTTGCCTGTC TCGAACTGCT GGACTCAAGC1321 AATCTGCCAA TCTTGGCCTC CCAAAATGGT GGGATTACAG GTGTAGTAGG CCATTATGCC1381 CACCCCAGAA CTTCTTATTA TTTTGGTGAC TTCTAGAGTT GTGTTGGTTG CAAATCTCTG1441 TTACAACCCT GACCCCCAAA CTGTGTCCCT AGGATTGGCT TCCTTTTACT AGAGGTCCCT1501 GTCCCCTGAA GCACAACCCT TAATCTCTTA ATATAGTGGC TTCTGAGTCA CTCCTGTGTT1561 TGGCCCCCAG GGAACCCTCA GGCAGCTCTG CTGTCCTTTT CTTATTTGCC AGGCTTTGCT1621 TCTGGCCTGA ATTAATTACT GACTTATGAG GGTTAATGGA AACCAGGCAG CCTTTTTGAG1681 TCTCACCCAA AGAAGCATCT GTTTCTCATC TTTACCATGT AGGGAGGGCC GGGGGTAGTG1741 AAGCACCCTC TAGCCATCTT GCCTCTGCCC CATAGCTCCC AGTAAGTGGT TCAGGGACAA1801 AGTGTGTGAT CTGATCATGT CAACCAAGAA CTCCACGGAT TGTAAAGGGA AAAACTCAGT1861 TCAAACTTCC TTAAGCAAAA AAGGCAACTT ACTGGCTCAA AGAATGTGAA GGCTGAGCTA1921 CAAATTTAAC TGCAGATAGC TCTGGATCCT GTTTCTCAAT CATCATCAGG GATTTCCCCA1981 CCTCTCATTG TATTCCTTGA CTCTGTATGT TTCTACTTTG CTTTGTTTCT TGGCCTTTTC2041 CCCTTCTAGC TACTGGCAGG TTCAAGTCCA CCTCTGAACC TGCCACTTCA GAGGGACTAT2101 TTTCCTTATT GAGACACAGT GGAAAGTCCC AGGGAGTGGC AGATGTAGGC CAAGTTTGGG2161 TCATGTACAC ATCCCTGAAG CACTGTGCCC AGGGCAATGA TGTTTCATGA TTGGCTGAGC2221 CTCAGTAAGG GACCACCTCT GTGCCTGGAG TGCAGGGCAC TGTGATTAGC AATGTCCCAA2281 GGACCACAGT GGAGGGAGAG AGGGGCTCCC TAAGGACTCA GGAGATGGGG ATTGGATGTT2341 GGGCAAACAA ACAAACAAAC AAACAAACAA AAAAAACTAG AGTGGCCAGC ACAGCCTCCT2401 AGCCTGTCCT GGAAGTGTTT GCTAATGCTG TCTCTTCTTT GCCCCCATAC CACGGGGTTA2461 GGATGCCCAT GATGCCACTG AGTACTTCCT TCTGGCCCTG GCAGCAGCGG TCCTGCTGGG2521 TGATGAGGAG CTTCAGGACA CCATTAGGAG CAGGCTGGAC AACATCTGCC AGAGCCCCCT2581 GTGGCACAGC AGGCCTCCGG GTGCTCCTCA GAGAGGGCGC GGTGGCTGAG TGGTGGTGGC2641 CTGGCCCTCT GAGGAAAGCT GTCCTGTCTC TGGACATTGT GCATGGCCAG ACTCTGACCC2701 CACTGCCCTA GGCTCTTAAA TACTCATTGG GAGGGTCCGA GTCCTTACCT GCCTAGCCCC2761 CTCATTTCAC AAGAAGAAGA ATGAAGTCCA GGAGGAGAAG GGCTCATTGC AGGCCACAGA2821 AAGATTTGAT GGTGCAGCGA TGAGAATTCC TGGTTCCAGG CTTTGCATCT GGAGCCTTTA2881 CCGGTTGACT GTTGCCTTCC ACACAAACAG CCTCTGAAAA GCACTTTCTC CATACATAAT2941 TCTGGAGAAG ATGAGGGATC TTGCCCTCCA GGAGCCTTCC TTCCTCCCCC AATGAGGAAA3001 TCAGTCACTG CACTGGTGCA AAGGCAAGCA GATTGGAATT TGTGCTCTTC ACCGATTTTC3061 TCAGGGAAAG ACCCCTTCCC CTTGCCAGCA GAGGAACCTG TAGTTTTTTC CATTTCTTTC3121 TTCAGAACCA AAGTATGTAT CACTCCTCAT GCTCACAGGG ATTGACAGGA GAGAATTCAC3181 CAGGATCTTA GCTCAAAAGA CACAGCCTCA GAATGGCCAG ATGGATTGCA CGAAACCTGA3241 CTTGGATTCA CCATCTTCCT CCTGCCATAA GGCTGTGCTC CCACATAACC TCCCAGAAGC3301 TCCAGGGAAG CTTTCCAAGA GCAAAGGCTT GGAAATTGAA TGTTAAGAAA ATTATGACAT3361 AAATTACATG TAAATAGTGA AAAAAAAAAA AAAAAAAAAA AB核苷酸序列(SEQ ID NO14)長度125個氨基酸1 MSEQMMQSVG CRISLSVFQF LGDQRQELVA FHRLATVYYS LHMYEMAEDC YLKTLSLCPP61 WLQSPKEALY YAKVYYRLGR LTFCQLKVRA RLPRFPDSHH PTILLPDSKT MRSLCGGAEK121 TRVPRC.核苷酸及氨基酸組合序列(SEQ ID NO15)克隆號和蛋白名稱PP12494起始編碼子223 ATG 終止編碼子598 TGA 蛋白質(zhì)分子量14596.401 GCT TGA CCC ATC CTC TAC TTA GTC ACT CTT ATA GAG CCC TGC ATT TTC 4849 TTT TGT AGC ATT TAT GAC ATG TGT AAT GTT ACA TTT GTT TGT GGG ATT 9697 ATT TAA GGA ATG TCT GTC ATG TGA GAC AAT AAG CTT TAT GAG TAC AGG 144145 CAC CTC TTC TGT CTT ATT TCC TAT GCC CCA GCA CAG TCC CTG ACA TCT 192193 AGT AGA CCT TCA AAA AGT TTT ATG GAA TGA ATG AGT GAA CAA ATG ATG 2401 Met Ser Glu Gln Met Met 6241 CAA AGT GTT GGT TGC AGG ATA TCT CTC TCA GTC TTC CAA TTC TTA GGA 2887 Gln Ser Val Gly Cys Arg Ile Ser Leu Ser Val Phe Gln Phe Leu Gly 22289 GAT CAG AGG CAA GAG CTG GTG GCC TTT CAC CGC CTG GCT ACA GTG TAC 33623 Asp Gln Arg Gln Glu Leu Val Ala Phe His Arg Leu Ala Thr Val Tyr 38337 TAC TCC CTG CAC ATG TAT GAG ATG GCT GAG GAC TGC TAC CTG AAG ACC 38439 Tyr Ser Leu His Met Tyr Glu Met Ala Glu Asp Cys Tyr Leu Lys Thr 54385 CTG TCC CTC TGT CCA CCA TGG CTG CAG AGT CCC AAG GAG GCC CTG TAC 43255 Leu Ser Leu Cys Pro Pro Trp Leu Gln Ser Pro Lys Glu Ala Leu Tyr 70433 TAT GCC AAG GTG TAT TAT CGC CTG GGC AGA CTC ACC TTC TGC CAG CTG 48071 Tyr Ala Lys Val Tyr Tyr Arg Leu Gly Arg Leu Thr Phe Cys Gln Leu 86481 AAG GTA AGA GCC AGA CTT CCC AGA TTT CCT GAC AGC CAC CAC CCA ACC 52887 Lys Val Arg Ala Arg Leu Pro Arg Phe Pro Asp Ser His His Pro Thr 102529 ATT CTC CTT CCT GAC TCA AAG ACA ATG AGG AGC CTT TGT GGT GGA GCT 576103 Ile Leu Leu Pro Asp Ser Lys Thr Met Arg Ser Leu Cys Gly Gly Ala 118577 GAG AAA ACC AGA GTG CCA AGA TGA GAA GTC TTG TCT CAT AGG GTG AGG 624119 Glu Lys Thr Arg Val Pro Arg *** 126625 AGT GGC TTT ACA GGG GAC ATG GAA GCT CTT TCC ACT TAA CCC TGC TGA 672673 AGA TCT CAA AGG TGC TCC CAT CTT CGC TGA GGA GTA GAC CAT GGT TCC 720721 TCT TTC TCC TTG CCT TGC CAC CAT GTC TGT GGC TTC TTT ATC TGT CAG 768769 ATA CTA CAG GCA CAT TGC CTG TAA GTC TCT CAA GGG CCT ATG GAA ATA 816817 TAC AAG ACC CCA AAA CAA AAG AAC TAT AAG GTC TAA AAT GAA GAT CAA 864865 AAT GAA TAC TTA AGA GTT TGT CCA TAA AAT GTT ACA GAC CAA CTA GTC 912913 AAC TGC AAC TCA TTT CTT ATA AAG TAA TGT AAA GCT ACA TTT TAT GAG 960961 AAA TGT GGG TGC ATA TTA ACA TGT TTG AGA TAA CGA GGT ATG GGG CCT10081009 TTA AAC TAA GTA TAC TTA GAT CTT AAG AAG GTT TTA TCC CTG CTT CTC10561057 TTG CTT GCT GAA TCT AGA ACT TCT TTT TTT GCT TGC TTG CTT TTT TTT11041105 TGG GAC AGG GTC TTG CTG TGT AGC CCA GGC TGG AGT AGC ATG GCT CAA11521153 TCT TGG CTC ACT ACA GCC TCT GCA TCT GGG GCT CAA GCA ATC CTT CTA12001201 CTT CAG CCT CCT CAG AAG CTG GGA CCA CAG GTG CAC ACC ACC ACA CCT12481249 GGC TAA TTT TTG TAT TTT TTT GTA AAG ATG GGG TTT CAT CAT GTT GCC12961297 TGT CTC GAA CTG CTG GAC TCA AGC AAT CTG CCA ATC TTG GCC TCC CAA13441345 AAT GGT GGG ATT ACA GGT GTA GTA GGC CAT TAT GCC CAC CCC AGA ACT13921393 TCT TAT TAT TTT GGT GAC TTC TAG AGT TGT GTT GGT TGC AAA TCT CTG14401441 TTA CAA CCC TGA CCC CCA AAC TGT GTC CCT AGG ATT GGC TTC CTT TTA14881489 CTA GAG GTC CCT GTC CCC TGA AGC ACA ACC CTT AAT CTC TTA ATA TAG15361537 TGG CTT CTG AGT CAC TCC TGT GTT TGG CCC CCA GGG AAC CCT CAG GCA15841585 GCT CTG CTG TCC TTT TCT TAT TTG CCA GGC TTT GCT TCT GGC CTG AAT16321633 TAA TTA CTG ACT TAT GAG GGT TAA TGG AAA CCA GGC AGC CTT TTT GAG16801681 TCT CAC CCA AAG AAG CAT CTG TTT CTC ATC TTT ACC ATG TAG GGA GGG17281729 CCG GGG GTA GTG AAG CAC CCT CTA GCC ATC TTG CCT CTG CCC CAT AGC17761777 TCC CAG TAA GTG GTT CAG GGA CAA AGT GTG TGA TCT GAT CAT GTC AAC18241825 CAA GAA CTC CAC GGA TTG TAA AGG GAA AAA CTC AGT TCA AAC TTC CTT18721873 AAG CAA AAA AGG CAA CTT ACT GGC TCA AAG AAT GTG AAG GCT GAG CTA19201921 CAA ATT TAA CTG CAG ATA GCT CTG GAT CCT GTT TCT CAA TCA TCA TCA19681969 GGG ATT TCC CCA CCT CTC ATT GTA TTC CTT GAC TCT GTA TGT TTC TAC20162017 TTT GCT TTG TTT CTT GGC CTT TTC CCC TTC TAG CTA CTG GCA GGT TCA20642065 AGT CCA CCT CTG AAC CTG CCA CTT CAG AGG GAC TAT TTT CCT TAT TGA21122113 GAC ACA GTG GAA AGT CCC AGG GAG TGG CAG ATG TAG GCC AAG TTT GGG21602161 TCA TGT ACA CAT CCC TGA AGC ACT GTG CCC AGG GCA ATG ATG TTT CAT22082209 GAT TGG CTG AGC CTC AGT AAG GGA CCA CCT CTG TGC CTG GAG TGC AGG22562257 GCA CTG TGA TTA GCA ATG TCC CAA GGA CCA CAG TGG AGG GAG AGA GGG23042305 GCT CCC TAA GGA CTC AGG AGA TGG GGA TTG GAT GTT GGG CAA ACA AAC23522353 AAA CAA ACA AAC AAA CAA AAA AAA CTA GAG TGG CCA GCA CAG CCT CCT24002401 AGC CTG TCC TGG AAG TGT TTG CTA ATG CTG TCT CTT CTT TGC CCC CAT24482449 ACC ACG GGG TTA GGA TGC CCA TGA TGC CAC TGA GTA CTT CCT TCT GGC24962497 CCT GGC AGC AGC GGT CCT GCT GGG TGA TGA GGA GCT TCA GGA CAC CAT25442545 TAG GAG CAG GCT GGA CAA CAT CTG CCA GAG CCC CCT GTG GCA CAG CAG25922593 GCC TCC GGG TGC TCC TCA GAG AGG GCG CGG TGG CTG AGT GGT GGT GGC26402641 CTG GCC CTC TGA GGA AAG CTG TCC TGT CTC TGG ACA TTG TGC ATG GCC26882689 AGA CTC TGA CCC CAC TGC CCT AGG CTC TTA AAT ACT CAT TGG GAG GGT27362737 CCG AGT CCT TAC CTG CCT AGC CCC CTC ATT TCA CAA GAA GAA GAA TGA27842785 AGT CCA GGA GGA GAA GGG CTC ATT GCA GGC CAC AGA AAG ATT TGA TGG28322833 TGC AGC GAT GAG AAT TCC TGG TTC CAG GCT TTG CAT CTG GAG CCT TTA28802881 CCG GTT GAC TGT TGC CTT CCA CAC AAA CAG CCT CTG AAA AGC ACT TTC 29282929 TCC ATA CAT AAT TCT GGA GAA GAT GAG GGA TCT TGC CCT CCA GGA GCC 29762977 TTC CTT CCT CCC CCA ATG AGG AAA TCA GTC ACT GCA CTG GTG CAA AGG 30243025 CAA GCA GAT TGG AAT TTG TGC TCT TCA CCG ATT TTC TCA GGG AAA GAC 30723073 CCC TTC CCC TTG CCA GCA GAG GAA CCT GTA GTT TTT TCC ATT TCT TTC 31203121 TTC AGA ACC AAA GTA TGT ATC ACT CCT CAT GCT CAC AGG GAT TGA CAG 31683169 GAG AGA ATT CAC CAG GAT CTT AGC TCA AAA GAC ACA GCC TCA GAA TGG 32163217 CCA GAT GGA TTG CAC GAA ACC TGA CTT GGA TTC ACC ATC TTC CTC CTG 32643265 CCA TAA GGC TGT GCT CCC ACA TAA CCT CCC AGA AGC TCC AGG GAA GCT 33123313 TTC CAA GAG CAA AGG CTT GGA AAT TGA ATG TTA AGA AAA TTA TGA CAT 33603361 AAA TTA CAT GTA AAT AGT GAA AAA AAA AAA AAA AAA AAA AA 34016.PP12901A核苷酸序列(SEQ ID NO16)長度2505個堿基1 GTGAAGAGGA CTTTGTCGGA AGCTCTCCTA AGAAACAAGC AGATGGAGTC AGGACTCCCT61 TAAGCTGCTC AGGGCTTGCC ACACCATTGT GTTGCATTCA GCCTGTCGTC TGATAAGCCC121 ACTTCTACAT CCCCAGCTGA CCAAGACCTT TGGCCTCAGC TAACATTTTC CATTGACAGT181 CTGCCCAAAC CCTTAAGACC CTATGCTAAC ATAGGGTCAG CAGCCTTCCA AGCCTTAAAA241 ATCCCCATCA ACAAGGTATC TGTGGGCCAG GGTCCAAAGC CTTCGCTGGG GGTCATTCCC301 ACCTTCCTCA CTAATTGTGC AGGATGCTTT TGCAGGGACA CCATTTTTCC ATTCCATACT361 GGGGCAGCCA GCCATTGAGT TTCAGCCCTT TAGGTGGAGC TCCCTCCCCG CCAGAACACT421 CTAGACAGCC AGCCAGCCCC TTTGTCTTTG GTTCCTGGGT TAGGAGAAAC AGGGCCACAG481 GGCGAGAGAG AAGATGTTTT CTCCTCCAGG CAAGAGTTGT CCCCTCCTTC TTGGTCCTCC541 CTTTTTGTCT TCTCAGTTGT TATTATTTTG CTGTGGTCAC CGGCAAAGCA GATGGTGGAT601 TGATTGCCAC TTATCACTGT CATGGTGCTG TCACTCTGCC TTTCCTCTAG AGGACACCAG661 TCCTCTTCCA CAGGGTCCTA CCCTCAGGCT CTTCCTTCCT GGGAGTTCAA GCCCCTGCCT721 CCTGTCCAGC GGCATCCTGG TAAGAAGCAA TAGAGCTTGA CCCGTGTTTC GTGGTTTGGA781 GCACCTGTTC AGTAGGACAG CCACCATCTT CAGAGTCCTG CGAGGGTCAG GGATATGACC841 TTCCTTGTCT TTAGTCACTT TAAGTAATGC TTTAGCTGGC TTAGCACAAG GGTTGGGCAC901 AGCAGGTCCC AGCAGCAGAG GTATCGCTCC AGCTGTGCTT AGGAGACCAG CCTTGGCCTG961 ATGTCTCTGC CTTGTCAGTT CATTCACCTG CTATCACAGT CTCCAGGGAT GAGGGCATCC1021 TCTTCTCTAA GAGTTCCCTA AACCAACAGG ACACTGTTAG GGAGTCAGGG GTAGTCTGCT1081 CTCAGTGCAG GTACATGCCA TCCTCCCCTT TTACTATTCA AGCCCAAATG TCATAATGTC1141 CAGCAACTGC CTAGTGGAGG ACTCAGGCGG GTGGACTGAC CTCCCTCCTG GGCAACCCCA1201 AACCTCCCGC CCCAAAGATC AGTTCCAGTG TGTGGGTTCA TTCAAATACT GGTGCTACCA1261 CTTGCCCAAG CTAATGAGTG TCTGGGGGAA ACCAAACAAA TATAGAGTGC CATAGAGCAC1321 ACAGCAGTGC TATACAAACT GAGTGGAAAG CTTCCAAATT CTGAGTTCCA ACCACTTGGG1381 ACTGTCCAGG ATTCTTTTGC CAATTGATTG TCCTACTGGC TGGGCGGCCC CCATATCAAT1441 TTCTTAACCA TTTCCAAAAC CCTCCCCTTT CTTCACCACC CCTTGTAGCG AGTTCAAGGG1501 ATTTTGGGAC TGGCTGGGCA CAGTGGCTCA TGCCTGTAAT CAGAGCACTT TGGGAGGCCG1561 AGGCAGGAGG ATCACTTGAG GTCAGGAGTT CAAGACCACC CTGGCCAACA TGGTGAAACC1621 CCGTCTCTAC CAAAAATACA AAAATTAGCC AGGCATGGTG GTGCACGCCT GTAATCCCAG1681 CTACTCAGGA GGCTGAGGCA GGAGAATCGC TTGAACCCAG GAAGCAGAGG TTGCAGCGAG1741 CTGAGATCAT GTCACGGTAC TCCAGCCTGG GTGACAGAGT GAGACTCTGT CTCAGAAACA1801 ACAGGGGGAT TTCAGGACTG ACCAAGAAAA AAAGATCTGA CCATTACTTA GCAATAGCAA1861 ACGATGAGCT TTATTTGGCA ACACTTTGAC AGGGTGGCAT GTAAGGGAAG TCCCATGAGG1921 GACGAGGCCA TCCAGAGGTT ACAGCCCCAG GATAGCCACT CAGAAGTACC GGAGGGTAGG1981 GGACTCAAGG AGGAGGGGAC TGCCAGGGAG GGGCTTATGT GTCAGATGAC GTGACTGAGC2041 AGCACCATGT ATCTGGATCC AATTTCTGAA GGGCAGCTGC GGCTTGGAAT CTTGTACTAC2101 CAGGTTTATT TTGTCTGTGG CTAGCAGATG TTGGGTGCAG TTTCATGGGG CATGCAAAGC2161 AGACAGGCTC TAAATGGCTA AAAATTAGTT TATATGGGCT ACGTTTGAAG CTATTGGATG2221 TGTCAAACTT TGAGTTTGGT GCCTGTGGAT TTTTGCAAAT CTGCCCTGAA GAAGTAAACA2281 ATAGAGGGGC AACACAGAGA AGCTATCTGA CTCATTAATA CAGCACTGCC TGATCAGGAA2341 ACAGAGGACA CAAATTAACA ATATCAGGAG GCCGGGCGCA GTGGCTCATG CCTGTAATCC2401 CAGCACTTGT GGAGGCTAAG GCAGGAGGAT TGCTTGAGTC CAGGAGTTTG AGACCAGCCT2461 AGGAAACATA GAGAGGTTGA TATCTGCAAA AAAAAAAACA AAAAAB核苷酸序列(SEQ ID NO17)長度108個氨基酸1 MLLQGHHFSI PYWGSQPLSF SPLGGAPSPP EHSRQPASPF VFGSWVRRNR ATGRERRCFL61 LQARVVPSFL VLPFCLLSCY YFAVVTGKAD GGLIATYHCH GAVTLPFLC.核苷酸及氨基酸組合序列(SEQ ID NO18)克隆號和蛋白名稱PP12901起始編碼子324 ATG 終止編碼子648 TAG 蛋白質(zhì)分子量11947.271 GT GAA GAG GAC TTT GTC GGA AGC TCT CCT AAG AAA CAA GCA GAT GGA 4748 GTC AGG ACT CCC TTA AGC TGC TCA GGG CTT GCC ACA CCA TTG TGT TGC 9596 ATT CAG CCT GTC GTC TGA TAA GCC CAC TTC TAC ATC CCC AGC TGA CCA 143144 AGA CCT TTG GCC TCA GCT AAC ATT TTC CAT TGA CAG TCT GCC CAA ACC 191192 CTT AAG ACC CTA TGC TAA CAT AGG GTC AGC AGC CTT CCA AGC CTT AAA 239240 AAT CCC CAT CAA CAA GGT ATC TGT GGG CCA GGG TCC AAA GCC TTC GCT 287288 GGG GGT CAT TCC CAC CTT CCT CAC TAA TTG TGC AGG ATG CTT TTG CAG 3351 Met Leu Leu Gln 4336 GGA CAC CAT TTT TCC ATT CCA TAC TGG GGC AGC CAG CCA TTG AGT TTC 3835 Gly His His Phe Ser Ile Pro Tyr Trp Gly Ser Gln Pro Leu Ser Phe 20384 AGC CCT TTA GGT GGA GCT CCC TCC CCG CCA GAA CAC TCT AGA CAG CCA 43121 Ser Pro Leu Gly Gly Ala Pro Ser Pro Pro Glu His Ser Arg Gln Pro 36432 GCC AGC CCC TTT GTC TTT GGT TCC TGG GTT AGG AGA AAC AGG GCC ACA 47937 Ala Ser Pro Phe Val Phe Gly Ser Trp Val Arg Arg Asn Arg Ala Thr 52480 GGG CGA GAG AGA AGA TGT TTT CTC CTC CAG GCA AGA GTT GTC CCC TCC 52753 Gly Arg Glu Arg Arg Cys Phe Leu Leu Gln Ala Arg Val Val Pro Ser 68528 TTC TTG GTC CTC CCT TTT TGT CTT CTC AGT TGT TAT TAT TTT GCT GTG 57569 Phe Leu Val Leu Pro Phe Cys Leu Leu Ser Cys Tyr Tyr Phe Ala Val 84576 GTC ACC GGC AAA GCA GAT GGT GGA TTG ATT GCC ACT TAT CAC TGT CAT 62385 Val Thr Gly Lys Ala Asp Gly Gly Leu Ile Ala Thr Tyr His Cys His 100624 GGT GCT GTC ACT CTG CCT TTC CTC TAG AGG ACA CCA GTC CTC TTC CAC 671101 Gly Ala Val Thr Leu Pro Phe Leu *** 109672 AGG GTC CTA CCC TCA GGC TCT TCC TTC CTG GGA GTT CAA GCC CCT GCC 719720 TCC TGT CCA GCG GCA TCC TGG TAA GAA GCA ATA GAG CTT GAC CCG TGT 767768 TTC GTG GTT TGG AGC ACC TGT TCA GTA GGA CAG CCA CCA TCT TCA GAG 815816 TCC TGC GAG GGT CAG GGA TAT GAC CTT CCT TGT CTT TAG TCA CTT TAA 863864 GTA ATG CTT TAG CTG GCT TAG CAC AAG GGT TGG GCA CAG CAG GTC CCA 911912 GCA GCA GAG GTA TCG CTC CAG CTG TGC TTA GGA GAC CAG CCT TGG CCT 959960 GAT GTC TCT GCC TTG TCA GTT CAT TCA CCT GCT ATC ACA GTC TCC AGG10071008 GAT GAG GGC ATC CTC TTC TCT AAG AGT TCC CTA AAC CAA CAG GAC ACT10551056 GTT AGG GAG TCA GGG GTA GTC TGC TCT CAG TGC AGG TAC ATG CCA TCC11031104 TCC CCT TTT ACT ATT CAA GCC CAA ATG TCA TAA TGT CCA GCA ACT GCC11511152 TAG TGG AGG ACT CAG GCG GGT GGA CTG ACC TCC CTC CTG GGC AAC CCC11991200 AAA CCT CCC GCC CCA AAG ATC AGT TCC AGT GTG TGG GTT CAT TCA AAT12471248 ACT GGT GCT ACC ACT TGC CCA AGC TAA TGA GTG TCT GGG GGA AAC CAA12951296 ACA AAT ATA GAG TGC CAT AGA GCA CAC AGC AGT GCT ATA CAA ACT GAG13431344 TGG AAA GCT TCC AAA TTC TGA GTT CCA ACC ACT TGG GAC TGT CCA GGA13911392 TTC TTT TGC CAA TTG ATT GTC CTA CTG GCT GGG CGG CCC CCA TAT CAA14391440 TTT CTT AAC CAT TTC CAA AAC CCT CCC CTT TCT TCA CCA CCC CTT GTA14871488 GCG AGT TCA AGG GAT TTT GGG ACT GGC TGG GCA CAG TGG CTC ATG CCT15351536 GTA ATC AGA GCA CTT TGG GAG GCC GAG GCA GGA GGA TCA CTT GAG GTC15831584 AGG AGT TCA AGA CCA CCC TGG CCA ACA TGG TGA AAC CCC GTC TCT ACC16311632 AAA AAT ACA AAA ATT AGC CAG GCA TGG TGG TGC ACG CCT GTA ATC CCA16791680 GCT ACT CAG GAG GCT GAG GCA GGA GAA TCG CTT GAA CCC AGG AAG CAG17271728 AGG TTG CAG CGA GCT GAG ATC ATG TCA CGG TAC TCC AGC CTG GGT GAC17751776 AGA GTG AGA CTC TGT CTC AGA AAC AAC AGG GGG ATT TCA GGA CTG ACC18231824 AAG AAA AAA AGA TCT GAC CAT TAC TTA GCA ATA GCA AAC GAT GAG CTT18711872 TAT TTG GCA ACA CTT TGA CAG GGT GGC ATG TAA GGG AAG TCC CAT GAG19191920 GGA CGA GGC CAT CCA GAG GTT ACA GCC CCA GGA TAG CCA CTC AGA AGT19671968 ACC GGA GGG TAG GGG ACT CAA GGA GGA GGG GAC TGC CAG GGA GGG GCT20152016 TAT GTG TCA GAT GAC GTG ACT GAG CAG CAC CAT GTA TCT GGA TCC AAT20632064 TTC TGA AGG GCA GCT GCG GCT TGG AAT CTT GTA CTA CCA GGT TTA TTT21112112 TGT CTG TGG CTA GCA GAT GTT GGG TGC AGT TTC ATG GGG CAT GCA AAG21592160 CAG ACA GGC TCT AAA TGG CTA AAA ATT AGT TTA TAT GGG CTA CGT TTG22072208 AAG CTA TTG GAT GTG TCA AAC TTT GAG TTT GGT GCC TGT GGA TTT TTG22552256 CAA ATC TGC CCT GAA GAA GTA AAC AAT AGA GGG GCA ACA CAG AGA AGC23032304 TAT CTG ACT CAT TAA TAC AGC ACT GCC TGA TCA GGA AAC AGA GGA CAC23512352 AAA TTA ACA ATA TCA GGA GGC CGG GCG CAG TGG CTC ATG CCT GTA ATC23992400 CCA GCA CTT GTG GAG GCT AAG GCA GGA GGA TTG CTT GAG TCC AGG AGT24472448 TTG AGA CCA GCC TAG GAA ACA TAG AGA GGT TGA TAT CTG CAA AAA AAA24952496 AAA CAA AAA A 25057.PP13275A核苷酸序列(SEQ ID NO19)長度3940個堿基1 GGGGAACAGC TGATCCGTCT GTTGGGAGGA CAGATATCTC AAGGCCAGGA TGGAAGAATC61 ACCACTAAGC CGGGCACCAT CCCGTGGTGG AGTCAACTTT CTCAATGTAG CCCGGACCTA121 CATCCCCAAC ACCAAGGTGG AATGTCACTA CACCCTTCCC CCAGGCACCA TGCCCAGTGC181 CAGTGACTGG ATTGGCATCT TCAAGGTGGA GGCTGCCTGT GTTCGGGATT ACCACACATT241 TGTGTGGTCT TCCGTGCCTG AAAGTACAAC TGATGGTTCC CCCATTCACA CCAGTGTCCA301 GTTCCAAGCC AGCTACCTGC CCAAACCAGG AGCTCAGCTC TACCAGTTCC GATATGTGAA361 CCGCCAGGGC CAGGTGTGTG GGCAGAGCCC CCCTTTCCAG TTCCGAGAGC CAAGGCCCAT421 GGATGAACTG GTGACCCTGG AGGAGGCTGA TGGGGGCTCT GACATCCTGC TGGTTGTCCC481 CAAGGCAACT GTGTTACAGA ACCAGCTCGA TGAGAGCCAG CAAGAACGGA ATGACCTGAT541 GCAGCTGAAG CTACAGCTGG AGGGACAGGT GACAGAGCTG AGGAGCCGAG TGCAGGAGCT601 CGAGAGGGCT CTGGCAACTG CCAGGCAGGA GCACACGGAG CTGATGGAAC AGTACAAGGG661 GATTTCCCGG TCCCATGGGG AGATCACAGA AGAGAGGGAC ATCCTGAGCC GGCAACAGGG721 AGACCATGTG GCACGCATCC TGGAGCTAGA GGATGACATC CAGACCATCA GTGAGAAAGT781 GCTGACGAAG GAAGTGGAGC TGGACAGGCT TAGAGACACA GTGAAGGCCC TGACTCGGGA841 ACAAGAAAAG CTCCTTGGGC AACTGAAAGA AGTACAAGCA GACAAGGAGC AAAGTGAGGC901 CGAGCTCCAA GTGGCACAAC AGGAGAACCA TCACTTAAAT TTGGACCTGA AGGAGGCGAA961 GAGCTGGCAA GAGGAGCAGA GTGCTCAGGC TCAGCGACTG AAAGACAAGG TGGCCCAGAT1021 GAAGGACACC CTAGGCCAGG CCCAGCAGCG GGTGGCCGAG CTGGAGCCCT TGAAGGAGCA1081 GCTTCGAGGG GCCCAGGAGC TTGCAGCCTC AAGCCAGCAG AAAGCCACCC TTCTTGGGGA1141 GGAGTTGGCC AGTGCAGCAG CAGCCAGGGA CCGCACCATA GCCGAACTAC ACCGCAGCCG1201 CCTGGAAGTG GCTGAAGTTA ACGGCAGGCT GGCTGAGCTC GGTTTGCACT TGAAGGAAGA1261 AAAATGCCAA TGGAGCAAGG AGCGGGCAGG GCTGCTGCAG AGTGTGGAGG CAGAGAAGGA1321 CAAGATCCTG AAGCTGAGTG CAGAGATACT TCGATTGGAG AAGGCAGTTC AGGAGGAGAG1381 GACCCAAAAC CAAGTGTTCA AGACTGAGCT GGCCCGGGAG AAGGATTCTA GCCTGGTACA1441 GTTGTCAGAA AGTAAGCGGG AGCTGACAGA GCTGCGGTCA GCCCTGCGTG TGCTCCAGAA1501 GGAAAAGGAG CAGTTACAGG AGGAGAAACA GGAATTGCTA GAGTACATGA GAAAGCTAGA1561 GGCCCGCCTG GAGAAGGTGG CAGATGAGAA GTGGAATGAG GATGCCACCA CAGAGGATGA1621 GGAGGCCGCT GTGGGGCTGA GCTGCCCGGC AGCTCTGACA GACTCAGAGG ACGAGTCCCC1681 AGAAGACATG AGGCTCCCAC CCTATGGCCT TTGTGAGCGT GGAGACCCAG GCTCCTCTCC1741 TGCTGGGCCT CGAGAGGCTT CTCCCCTTGT TGTCATCAGC CAGCCGGCTC CCATTTCTCC1801 TCACCTCTCT GGGCCAGCTG AGGACAGTAG CTCTGACTCG GAGGCTGAAG ATGAGAAGTC1861 AGTCCTGATG GCAGCTGTGC AGAGTGGGGG TGAGGAGGCC AACTTACTGC TTCCTGAACT1921 GGGCAGTGCC TTCTATGACA TGGCCAGGTG AGTTCAACCA GCAAGGCCAG GAGGGAGGTG1981 GGAGGAGGTC AGAGGGAAAG GGCATCTGTG TGGACAGTCA CCAGGCCCTG CTCCCAACCC2041 CTGCCCTTCT TGGCCTCAGC CAAGAAAAGG AGATACAGGT ATGGTTAACA AGGAAAATGA2101 CTCACTGCTC CAAATCCCAG ATGCCTTCAG GTAATCCCTA CCCCTATCTT ATCAATGCAC2161 TCAGAGGTCC TGCCTTTAAC TGGCTTCTAT GTTGTTCTAG CACCATCTTC TGCAGAGCCC2221 AAATTGCCCT GCTTCCCCTC TCTCCTGCCT CTACCCCTTC CCCAACCACC AGGTAGGTAC2281 CTAGGGTCCT CCGGGGAGGA AGGGAGGTGA CCATGGCCCC CAGGGATAGG AGCAGAGAGA2341 AGACTGGGAT CCAGCATCCA TCTGGCTACA ACTGAAATGC TTTCCCTCTT CCCTGACTTC2401 CCTGGGTAAC CCTTAGGGAA GGGAACCTAT AGAGGTGGGG GTTTCAGGTA TCAGATTGTC2461 CCCTTCTGCC TTCCCTTTTA TTCCCAGGTT CAAGGGGGCA GGCACAGGGA AGAGAGATTT2521 GATCATCTAG TCCCGGTTTT GCCTGGATGT GAGATGGGCT CAGGGCAGGG AGGGGGTGAT2581 GCTGTCATCC TTCTCGGCTG GAGCAGGAAG ATGAAGGACG ATGTCAGACT CATTTTCAGC2641 CTCATTAGGC AGCAGACGGA GATGGAGGGA GGAGAGCAGG AGGCTGGGGG ATGGGCTCTG2701 CACTGCAGAG ACCAGCAGGG ACTAAAGAAG AGAGGACATG GGGAACTGGA AAAATAAGCC2761 TTCCAGGATT GTGGGGAGAA AGACGCTGTG GGAGAGGCCA GGATGCTGCA TTAGGCACAG2821 GATAACCTGG GAACCCGGCA CATGGGTCCT GCTCTCCGAA GTCTGCAAGT CAAGAAGGGA2881 ACAGAGCACG CCGACCCTCT CCCTTTCCCC TCTGTCTCTC TTAGTGGCTT TACAGTGGGT2941 ACCCTGTCAG AAACCAGCAC TGGGGGCCCT GCCACCCCCA CATGGAAGGA GTGTCCTATC3001 TGTAAGGAGC GCTTTCCTGC TGAGAGTGAC AAGGATGCCC TGGAGGACCA CATGGATGGA3061 CACTTCTTTT TCAGCACCCA GGACCCCTTC ACCTTTGAGT GATCTTACTC CCTCGTACAT3121 GCACAAATAC ACACTCATGC ACACACACAC TCACACACAT GCATACACTT AGGTTTCATG3181 CCCATTTTCT ATCACACTGG GCTCCATGAT ATTCTGTTCC CTAAGAACTG CTTCTGTGTG3241 CCCTGTTTTC ATCCCAAGAT TTCTCACTTC ATCCTCTCCT ACCTGGCTCT TTTGTCCCAG3301 GGAAGGGGTG CCTGTTCGGA AGCAGTGGCT GAATTTATCC CCTGAAAGTG GTTTTGGAGG3361 AACCGGGATG GAGGAGGCCT TCCCCTGTGG GAATAGAATC GTCCACTCCT AGCCCTGGTT3421 GCTTCTGATA CACAGCCACT GCACACACAC ACTCACACTC ACACTCCCTT GTCTGATGCC3481 CCAAAGCCAA TTCCTGGGGC ACCCTACCCT CTCTTATTTG GAGTTTCCGT TGGTTTACCT3541 GAGTTTTCTC TGGGGTCTGC ACAGAGGCAG CAGCATGGAC ATCATGGCCT CTCAGGTCCC3601 TTTTGGTTCT CAGTTTCATT GGTTCCTCTT TCTGTTCCCC CATTGACTTC TGTGCCCCAC3661 CCTAGCCTTT TCCATAACCT TAGGTATTCA GTTTGGAGGG GTTTTTTGTA TTTTTGAGGA3721 TTCCTGTATT CTGTATCCTC TCCTCGCATC TCCTCACATG GAAAGAAATA ATGTATTTGT3781 GCCTTCTGTG AGGAATGGGG GGAACAAGTG GTCCCAGGTA TCCCCATTTC CAAGGCCCCC3841 CTCCCTCTCC AGGTCCCCCC ACAGCAATAA AAGCTTCCCC CTGATATCCC CAAAAAAAAA3901 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAAB核苷酸序列(SEQ ID NO20)長度633個氨基酸1 MEESPLSRAP SRGGVNFLNV ARTYIPNTKV ECHYTLPPGT MPSASDWIGI FKVEAACVRD61 YHTFVWSSVP ESTTDGSPIH TSVQFQASYL PKPGAQLYQF RYVNRQGQVC GQSPPFQFRE121 PRPMDELVTL EEADGGSDIL LVVPKATVLQ NQLDESQQER NDLMQLKLQL EGQVTELRSR181 VQELERALAT ARQEHTELME QYKGISRSHG EITEERDILS RQQGDHVARI LELEDDIQTI241 SEKVLTKEVE LDRLRDTVKA LTREQEKLLG QLKEVQADKE QSEAELQVAQ QENHHLNLDL301 KEAKSWQEEQ SAQAQRLKDK VAQMKDTLGQ AQQRVAELEP LKEQLRGAQE LAASSQQKAT361 LLGEELASAA AARDRTIAEL HRSRLEVAEV NGRLAELGLH LKEEKCQWSK ERAGLLQSVE421 AEKDKILKLS AEILRLEKAV QEERTQNQVF KTELAREKDS SLVQLSESKR ELTELRSALR481 VLQKEKEQLQ EEKQELLEYM RKLEARLEKV ADEKWNEDAT TEDEEAAVGL SCPAALTDSE541 DESPEDMRLP PYGLCERGDP GSSPAGPREA SPLVVISQPA PISPHLSGPA EDSSSDSEAE601 DEKSVLMAAV QSGGEEANLL LPELGSAFYD MARC.核苷酸及氨基酸組合序列(SEQ ID NO21)克隆號和蛋白名稱PP13275起始編碼子50 ATG 終止編碼子1949 TGA 蛋白質(zhì)分子量70974.611G GGG AAC AGC TGA TCC GTC TGT TGG GAG GAC AGA TAT CTC AAG GCC 4647 AGG ATG GAA GAA TCA CCA CTA AGC CGG GCA CCA TCC CGT GGT GGA GTC 941 Met Glu Glu Ser Pro Leu Ser Arg Ala Pro Ser Arg Gly Gly Val 1595 AAC TTT CTC AAT GTA GCC CGG ACC TAC ATC CCC AAC ACC AAG GTG GAA 14216 Asn Phe Leu Asn Val Ala Arg Thr Tyr Ile Pro Asn Thr Lys Val Glu 31143 TGT CAC TAC ACC CTT CCC CCA GGC ACC ATG CCC AGT GCC AGT GAC TGG 19032 Cys His Tyr Thr Leu Pro Pro Gly Thr Met Pro Ser Ala Ser Asp Trp 47191 ATT GGC ATC TTC AAG GTG GAG GCT GCC TGT GTT CGG GAT TAC CAC ACA 23848 Ile Gly Ile Phe Lys Val Glu Ala Ala Cys Val Arg Asp Tyr His Thr 63239 TTT GTG TGG TCT TCC GTG CCT GAA AGT ACA ACT GAT GGT TCC CCC ATT 28664 Phe Val Trp Ser Ser Val Pro Glu Ser Thr Thr Asp Gly Ser Pro Ile 79287 CAC ACC AGT GTC CAG TTC CAA GCC AGC TAC CTG CCC AAA CCA GGA GCT 33480 His Thr Ser Val Gln Phe Gln Ala Ser Tyr Leu Pro Lys Pro Gly Ala 95335 CAG CTC TAC CAG TTC CGA TAT GTG AAC CGC CAG GGC CAG GTG TGT GGG 38296 Gln Leu Tyr Gln Phe Arg Tyr Val Asn Arg Gln Gly Gln Val Cys Gly 111383 CAG AGC CCC CCT TTC CAG TTC CGA GAG CCA AGG CCC ATG GAT GAA CTG 430112 Gln Ser Pro Pro Phe Gln Phe Arg Glu Pro Arg Pro Met Asp Glu Leu 127431 GTG ACC CTG GAG GAG GCT GAT GGG GGC TCT GAC ATC CTG CTG GTT GTC 478128 Val Thr Leu Glu Glu Ala Asp Gly Gly Ser Asp Ile Leu Leu Val Val 143479 CCC AAG GCA ACT GTG TTA CAG AAC CAG CTC GAT GAG AGC CAG CAA GAA 526144 Pro Lys Ala Thr Val Leu Gln Asn Gln Leu Asp Glu Ser Gln Gln Glu 159527 CGG AAT GAC CTG ATG CAG CTG AAG CTA CAG CTG GAG GGA CAG GTG ACA 574160 Arg Asn Asp Leu Met Gln Leu Lys Leu Gln Leu Glu Gly Gln Val Thr 175575 GAG CTG AGG AGC CGA GTG CAG GAG CTC GAG AGG GCT CTG GCA ACT GCC 622176 Glu Leu Arg Ser Arg Val Gln Glu Leu Glu Arg Ala Leu Ala Thr Ala 191623 AGG CAG GAG CAC ACG GAG CTG ATG GAA CAG TAC AAG GGG ATT TCC CGG 670192 Arg Gln Glu His Thr Glu Leu Met Glu Gln Tyr Lys Gly Ile Ser Arg 207671 TCC CAT GGG GAG ATC ACA GAA GAG AGG GAC ATC CTG AGC CGG CAA CAG 718208 Ser His Gly Glu Ile Thr Glu Glu Arg Asp Ile Leu Ser Arg Gln Gln 223719 GGA GAC CAT GTG GCA CGC ATC CTG GAG CTA GAG GAT GAC ATC CAG ACC 766224 Gly Asp His Val Ala Arg Ile Leu Glu Leu Glu Asp Asp Ile Gln Thr 239767 ATC AGT GAG AAA GTG CTG ACG AAG GAA GTG GAG CTG GAC AGG CTT AGA 814240 Ile Ser Glu Lys Val Leu Thr Lys Glu Val Glu Leu Asp Arg Leu Arg 255815 GAC ACA GTG AAG GCC CTG ACT CGG GAA CAA GAA AAG CTC CTT GGG CAA 862256 Asp Thr Val Lys Ala Leu Thr Arg Glu Gln Glu Lys Leu Leu Gly Gln 271863 CTG AAA GAA GTA CAA GCA GAC AAG GAG CAA AGT GAG GCC GAG CTC CAA 910272 Leu Lys Glu Val Gln Ala Asp Lys Glu Gln Ser Glu Ala Glu Leu Gln 287911 GTG GCA CAA CAG GAG AAC CAT CAC TTA AAT TTG GAC CTG AAG GAG GCG 958288 Val Ala Gln Gln Glu Asn His His Leu Asn Leu Asp Leu Lys Glu Ala 303959 AAG AGC TGG CAA GAG GAG CAG AGT GCT CAG GCT CAG CGA CTG AAA GAC1006304 Lys Ser Trp Gln Glu Glu Gln Ser Ala Gln Ala Gln Arg Leu Lys Asp 3191007 AAG GTG GCC CAG ATG AAG GAC ACC CTA GGC CAG GCC CAG CAG CGG GTG1054320 Lys Val Ala Gln Met Lys Asp Thr Leu Gly Gln Ala Gln Gln Arg Val 3351055 GCC GAG CTG GAG CCC TTG AAG GAG CAG CTT CGA GGG GCC CAG GAG CTT1102336 Ala Glu Leu Glu Pro Leu Lys Glu Gln Leu Arg Gly Ala Gln Glu Leu 3511103 GCA GCC TCA AGC CAG CAG AAA GCC ACC CTT CTT GGG GAG GAG TTG GCC1150352 Ala Ala Ser Ser Gln Gln Lys Ala Thr Leu Leu Gly Glu Glu Leu Ala 3671151 AGT GCA GCA GCA GCC AGG GAC CGC ACC ATA GCC GAA CTA CAC CGC AGC1198368 Ser Ala Ala Ala Ala Arg Asp Arg Thr Ile Ala Glu Leu His Arg Ser 3831199 CGC CTG GAA GTG GCT GAA GTT AAC GGC AGG CTG GCT GAG CTC GGT TTG1246384 Arg Leu Glu Val Ala Glu Val Asn Gly Arg Leu Ala Glu Leu Gly Leu 3991247 CAC TTG AAG GAA GAA AAA TGC CAA TGG AGC AAG GAG CGG GCA GGG CTG1294400 His Leu Lys Glu Glu Lys Cys Gln Trp Ser Lys Glu Arg Ala Gly Leu 4151295 CTG CAG AGT GTG GAG GCA GAG AAG GAC AAG ATC CTG AAG CTG AGT GCA1342416 Leu Gln Ser Val Glu Ala Glu Lys Asp Lys Ile Leu Lys Leu Ser Ala 4311343 GAG ATA CTT CGA TTG GAG AAG GCA GTT CAG GAG GAG AGG ACC CAA AAC1390432 Glu Ile Leu Arg Leu Glu Lys Ala Val Gln Glu Glu Arg Thr Gln Asn 4471391 CAA GTG TTC AAG ACT GAG CTG GCC CGG GAG AAG GAT TCT AGC CTG GTA1438448 Gln Val Phe Lys Thr Glu Leu Ala Arg Glu Lys Asp Ser Ser Leu Val 4631439 CAG TTG TCA GAA AGT AAG CGG GAG CTG ACA GAG CTG CGG TCA GCC CTG1486464 Gln Leu Ser Glu Ser Lys Arg Glu Leu Thr Glu Leu Arg Ser Ala Leu 4791487 CGT GTG CTC CAG AAG GAA AAG GAG CAG TTA CAG GAG GAG AAA CAG GAA1534480 Arg Val Leu Gln Lys Glu Lys Glu Gln Leu Gln Glu Glu Lys Gln Glu 4951535 TTG CTA GAG TAC ATG AGA AAG CTA GAG GCC CGC CTG GAG AAG GTG GCA1582496 Leu Leu Glu Tyr Met Arg Lys Leu Glu Ala Arg Leu Glu Lys Val Ala 5111583 GAT GAG AAG TGG AAT GAG GAT GCC ACC ACA GAG GAT GAG GAG GCC GCT1630512 Asp Glu Lys Trp Asn Glu Asp Ala Thr Thr Glu Asp Glu Glu Ala Ala5271631 GTG GGG CTG AGC TGC CCG GCA GCT CTG ACA GAC TCA GAG GAC GAG TCC1678528 Val Gly Leu Ser Cys Pro Ala Ala Leu Thr Asp Ser Glu Asp Glu Ser 5431679 CCA GAA GAC ATG AGG CTC CCA CCC TAT GGC CTT TGT GAG CGT GGA GAC1726544 Pro Glu Asp Met Arg Leu Pro Pro Tyr Gly Leu Cys Glu Arg Gly Asp 5591727 CCA GGC TCC TCT CCT GCT GGG CCT CGA GAG GCT TCT CCC CTT GTT GTC1774560 Pro Gly Ser Ser Pro Ala Gly Pro Arg Glu Ala Ser Pro Leu Val Val 5751775 ATC AGC CAG CCG GCT CCC ATT TCT CCT CAC CTC TCT GGG CCA GCT GAG1822576 Ile Ser Gln Pro Ala Pro Ile Ser Pro His Leu Ser Gly Pro Ala Glu 5911823 GAC AGT AGC TCT GAC TCG GAG GCT GAA GAT GAG AAG TCA GTC CTG ATG1870592 Asp Ser Ser Ser Asp Ser Glu Ala Glu Asp Glu Lys Ser Val Leu Met 6071871 GCA GCT GTG CAG AGT GGG GGT GAG GAG GCC AAC TTA CTG CTT CCT GAA1918608 Ala Ala Val Gln Ser Gly Gly Glu Glu Ala Asn Leu Leu Leu Pro Glu 6231919 CTG GGC AGT GCC TTC TAT GAC ATG GCC AGG TGA GTT CAA CCA GCA AGG1966624 Leu Gly Ser Ala Phe Tyr Asp Met Ala Arg *** 6341967 CCA GGA GGG AGG TGG GAG GAG GTC AGA GGG AAA GGG CAT CTG TGT GGA20142015 CAG TCA CCA GGC CCT GCT CCC AAC CCC TGC CCT TCT TGG CCT CAG CCA20622063 AGA AAA GGA GAT ACA GGT ATG GTTAAC AAG GAA AAT GAC TCA CTG CTC 21102111 CAA ATC CCA GAT GCC TTC AGG TAA TCC CTA CCC CTA TCT TAT CAA TGC21582159 ACT CAG AGG TCC TGC CTT TAA CTG GCT TCT ATG TTG TTC TAG CAC CAT22062207 CTT CTG CAG AGC CCA AAT TGC CCT GCT TCC CCT CTC TCC TGC CTC TAC22542255 CCC TTC CCC AAC CAC CAG GTA GGT ACC TAG GGT CCT CCG GGG AGG AAG23022303 GGA GGT GAC CAT GGC CCC CAG GGA TAG GAG CAG AGA GAA GAC TGG GAT23502351 CCA GCA TCC ATC TGG CTA CAA CTG AAA TGC TTT CCC TCT TCC CTG ACT23982399 TCC CTG GGT AAC CCT TAG GGA AGG GAA CCT ATA GAG GTG GGG GTT TCA24462447 GGT ATC AGA TTG TCC CCT TCT GCC TTC CCT TTT ATT CCC AGG TTC AAG24942495 GGG GCA GGC ACA GGG AAG AGA GAT TTG ATC ATC TAG TCC CGG TTT TGC25422543 CTG GAT GTG AGA TGG GCT CAG GGC AGG GAG GGG GTG ATG CTG TCA TCC25902591 TTC TCG GCT GGA GCA GGA AGA TGA AGG ACG ATG TCA GAC TCA TTT TCA26382639 GCC TCA TTA GGC AGC AGA CGG AGA TGG AGG GAG GAG AGC AGG AGG CTG26862687 GGG GAT GGG CTC TGC ACT GCA GAG ACC AGC AGG GAC TAA AGA AGA GAG27342735 GAC ATG GGG AAC TGG AAA AAT AAG CCT TCC AGG ATT GTG GGG AGA AAG27822783 ACG CTG TGG GAG AGG CCA GGA TGC TGC ATT AGG CAC AGG ATA ACC TGG28302831 GAA CCC GGC ACA TGG GTC CTG CTC TCC GAA GTC TGC AAG TCA AGA AGG28782879 GAA CAG AGC ACG CCG ACC CTC TCC CTT TCC CCT CTG TCT CTC TTA GTG29262927 GCT TTA CAG TGG GTA CCC TGT CAG AAA CCA GCA CTG GGG GCC CTG CCA29742975 CCC CCA CAT GGA AGG AGT GTC CTA TCT GTA AGG AGC GCT TTC CTG CTG30223023 AGA GTG ACA AGG ATG CCC TGG AGG ACC ACA TGG ATG GAC ACT TCT TTT30703071 TCA GCA CCC AGG ACC CCT TCA CCT TTG AGT GAT CTT ACT CCC TCG TAC31183119 ATG CAC AAA TAC ACA CTC ATG CAC ACA CAC ACT CAC ACA CAT GCA TAC31663167 ACT TAG GTT TCA TGC CCA TTT TCT ATC ACA CTG GGC TCC ATG ATA TTC32143215 TGT TCC CTA AGA ACT GCT TCT GTG TGC CCT GTT TTC ATC CCA AGA TTT32623263 CTC ACT TCA TCC TCT CCT ACC TGG CTC TTT TGT CCC AGG GAA GGG GTG33103311 CCT GTT CGG AAG CAG TGG CTG AAT TTA TCC CCT GAA AGT GGT TTT GGA33583359 GGA ACC GGG ATG GAG GAG GCC TTC CCC TGT GGG AAT AGA ATC GTC CAC34063407 TCC TAG CCC TGG TTG CTT CTG ATA CAC AGC CAC TGC ACA CAC ACA CTC34543455 ACA CTC ACA CTC CCT TGT CTG ATG CCC CAA AGC CAA TTC CTG GGG CAC35023503 CCT ACC CTC TCT TAT TTG GAG TTT CCG TTG GTT TAC CTG AGT TTT CTC35503551 TGG GGT CTG CAC AGA GGC AGC AGC ATG GAC ATC ATG GCC TCT CAG GTC35983599 CCT TTT GGT TCT CAG TTT CAT TGG TTC CTC TTT CTG TTC CCC CAT TGA36463647 CTT CTG TGC CCC ACC CTA GCC TTT TCC ATA ACC TTA GGT ATT CAG TTT36943695 GGA GGG GTT TTT TGT ATT TTT GAG GAT TCC TGT ATT CTG TAT CCT CTC37423743 CTC GCA TCT CCT CAC ATG GAA AGA AAT AAT GTA TTT GTG CCT TCT GTG37903791 AGG AAT GGG GGG AAC AAG TGG TCC CAG GTA TCC CCA TTT CCA AGG CCC38383839 CCC TCC CTC TCC AGG TCC CCC CAC AGC AAT AAA AGC TTC CCC CTG ATA38863887 TCC CCA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA39343935 AAA AAA 39408.PP13296A核苷酸序列(SEQ ID NO22)長度2889個堿基1 GCTTATCCTA GCAATTGGGG CGCGGGCCTG TGAGCCAGTT GGAGTTGCGG CGGCGGGAAC61 GATTGGGCTG AGCAGAGGAC GACATGTTGC TTTTCGTGGA GGTAGCATCT AAAGGAACTG121 GTTTAAATCC TAATGCCAAA GTATGGCAAG AAATTGCTCC TGGAAATACT GATGCCACCC181 CAGTAACTCA TGGAACTGAA AGCTCTTGGC ATGAAATAGC AGCTACATCA GGTGCTCATC241 CTGAGGGTAA TGCAGAGCTC TCAGAAGATA TATGTAAAGA ATATGAAGTA ATGTATTCTT301 CATCTTGTGA AACCACAAGA AATACTACAG GCATTGAAGA ATCAACTGAT GGGATGATTT361 TAGGACCAGA AGATCTGAGT TACCAAATAT ATGATGTTTC CGGAGAAAGC AATTCAGCAG421 TTTCTACAGA AGACCTAAAA GAATGTCTGA AGAAACAATT AGAATTCTGT TTTTCACGAG481 AAAATTTGTC AAAGGATCTT TACTTGATAT CTCAAATGGA TAGTGATCAG TTCATCCCAA541 TTTGGACAGT TGCCAACATG GAAGAAATAA AAAAGTTGAC TACAGACCCT GATCTAATTC601 TTGAAGTGTT AAGATCTTCT CCCATGGTAC AAGTTGATGA GAAGGGTGAG AAAGTGAGAC661 CAAGTCATAA GCGTTGTATT GTAATTCTTA GAGAGATTCC TGAAACAACA CCAATAGAGG721 AAGTGAAAGG TTTGTTCAAA AGTGAAAACT GCCCCAAAGT GATAAGCTGT GAGTTTGCAC781 ACAATAGCAA CTGGTATATC ACTTTCCAGT CAGACACAGA TGCACAACAG GCTTTTAAAT841 ACTTAAGAGA AGAAGTTAAA ACATTTCAGG GCAAGCCAAT TATGGCAAGG ATAAAAGCCA901 TCAATACATT TTTTGCTAAG AATGGTTATC GATTAATGGA TTCTAGTATC TATAGTCACC961 CCATTCAAAC TCAAGCACAG TATGCCTCCC CAGTCTTTAT GCAGCCTGTA TATAATCCTC1021 ACCAACAGTA CTCGGTCTAT AGTATTGTGC CTCAGTCTTG GTCTCCAAAT CCTACACCTT1081 ACTTTGAAAC ACCACTGGCT CCCTTTCCCA ATGGTAGTTT TGTGAATGGC TTTAATTCGC1141 CAGGATCTTA TAAAACAAAT GCTGCTGCTA TGAATATGGG TCGACCATTC CAAAAAAATC1201 GTGTGAAGCC TCAGTTTAGG TCATCTGGTG GTTCAGAACA CTCAACAGAG GGCTCTGTAT1261 CCTTGGGGGA TGGACAGTTG AACAGATATA GTTCAAGAAA CTTTCCAGCT GAACGGCATA1321 ACCCCACAGT AACTGGGCAT CAGGAGCAAA CTTACCTTCA GAAGGAGACT TCCACTTTGC1381 AGGTGGAACA GAATGGGGAC TATGGTAGGG GCAGGAGAAC TCTCTTCAGA GGTCGAAGAC1441 GACGAGAAGA TGACAGGATC TCAAGACCTC ATCCTTCAAC AGCTGAATCA AAGGCTCCAA1501 CACCAAAGTT TGACTTATTA GCCTCAAATT TTCCACCTTT ACCTGGAAGT TCATCAAGAA1561 TGCCAGGTGA ACTCGTTTTG GAGACTAGGA TGTCTGATGT TGTTAAAGGT GTCTACAAAG1621 AAAAGGATAA TGAAGAGTTG ACAATTAGTT GCCCAGTGCC TGCAGATGAG CAGACAGAAT1681 GCACTTCTGC CCAGCAACTC AATATGAGTA CCAGTTCTCC ATGTGCTGCT GAGCTTACTG1741 CATTAAGCAC AACTCAGCAA GAAAAGGATC TAATAGAAGA TTCCTCTGTT CAGAAGGATG1801 GTCTCAATCA GACAACTATA CCAGTTTCTC CTCCAAGTAC TACAAAGCCA TCGAGGGCAA1861 GTACTGCTTC ACCATGTAAT AATAACATAA ATGCAGCTAC AGCTGTGGCT CTACAGGAAC1921 CCCGAAAGTT AAGTTATGCT GAAGTGTGCC AGAAGCCCCC TAAAGAGCCA TCTTCAGTTC1981 TTGTGCAGCC ACTACGGGAA CTTCGCTCCA ATGTGGTGTC TCCCACCAAA AATGAAGACA2041 ATGGAGCTCC TGAGAACTCC GTTGAGAAAC CACATGAGAA GCCAGAAGCA AGGGCTAGTA2101 AGGATTATTC TGGCTTCCGA GGCAATATAA TCCCCAGGGG AGCAGCAGGA AAAATCAGGG2161 AACAGAGACG CCAGTTTAGC CATAGGGCTA TACCTCAGGG AGTGACTCGA CGTAATGGCA2221 AAGAGCAATA TGTGCCACCC AGATCACCAA AGTAAAAAAC AACAAAACTA TTCAAAAACT2281 TCACTCTCTT CCCATTAAAC TTGAACTGTG GCTATATTGA ACTGTTTTGG AGGGGAGGGG2341 GTAGCCAGGA AGGAACAAGA GAAAGTACGT CCATTTCATT ATGGATTTTG GAGTTGTGAG2401 TGATAGGATC CGAAAATTCA TCTCTAATGT GGTTTTTAAA TGCTGGAGGA TTCCAATCAA2461 TATAAATATA TATATATATA CACACACATA TATAAAAAGT ATAATTTTTC TATTTTTGTT2521 TTTGGTTTTA ATTTGCAGAG ATTTGCTGCC AGGAATCAAT TTTGAGGGTT CAGATTTAGC2581 TTGGAAGAAA AAAAAGAAAC ATACATCCTT CAGTATAGGA GATGAGGGAA TGAGAGAAAA2641 TATTTTTTGA AAAAGCATTT CTGTAAAATT AGAAATTACT TTTTTTAATC TATTTAAAGT2701 TTGGCTTGAA GAATGCCATC TCTGACTATA TGGCCTTGTA TTGCAAAGCA GATCAGTGGC2761 TGGGGTGCCT GTTGTGGGTG TGAGTGTGTA CAAGAGCGAT TGAAGCCAAA TCTGTTGTCA2821 TGTTAGTAAA TGATTTGAAA ACTGAATGTA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA2881 AAAAAAAAAB核苷酸序列(SEQ ID NO23)長度723個氨基酸1 MLLFVEVASK GTGLNPNAKV WQEIAPGNTD ATPVTHGTES SWHEIAATSG AHPEGNAELS61 EDICKEYEVM YSSSCETTRN TTGIEESTDG MILGPEDLSY QIYDVSGESN SAVSTEDLKE121 CLKKQLEFCF SRENLSKDLY LISQMDSDQF IPIWTVANME EIKKLTTDPD LILEVLRSSP181 MVQVDEKGEK VRPSHKRCIV ILREIPETTP IEEVKGLFKS ENCPKVISCE FAHNSNWYIT241 FQSDTDAQQA FKYLREEVKT FQGKPIMARI KAINTFFAKN GYRLMDSSIY SHPIQTQAQY301 ASPVFMQPVY NPHQQYSVYS IVPQSWSPNP TPYFETPLAP FPNGSFVNGF NSPGSYKTNA361 AAMNMGRPFQ KNRVKPQFRS SGGSEHSTEG SVSLGDGQLN RYSSRNFPAE RHNPTVTGHQ421 EQTYLQKETS TLQVEQNGDY GRGRRTLFRG RRRREDDRIS RPHPSTAESK APTPKFDLLA481 SNFPPLPGSS SRMPGELVLE TRMSDVVKGV YKEKDNEELT ISCPVPADEQ TECTSAQQLN541 MSTSSPCAAE LTALSTTQQE KDLIEDSSVQ KDGLNQTTIP VSPPSTTKPS RASTASPCNN601 NINAATAVAL QEPRKLSYAE VCQKPPKEPS SVLVQPLREL RSNVVSPTKN EDNGAPENSV661 EKPHEKPEAR ASKDYSGFRG NIIPRGAAGK IREQRRQFSH RAIPQGVTRR NGKEQYVPPR721 SPKC.核苷酸及氨基酸組合序列(SEQ ID NO24)克隆號和蛋白名稱;PP13296起始編碼子84 ATG 終止編碼子2253 TAA 蛋白質(zhì)分子量80450.711 GC TTA TCC TAG CAA TTG GGG CGC GGG CCT GTG AGC CAG TTG GAG TTG 4748 CGG CGG CGG GAA CGA TTG GGC TGA GCA GAG GAC GAC ATG TTG CTT TTC 951 Met Leu Leu Phe 496 GTG GAG GTA GCA TCT AAA GGA ACT GGT TTA AAT CCT AAT GCC AAA GTA 1435 Val Glu Val Ala Ser Lys Gly Thr Gly Leu Asn Pro Asn Ala Lys Val 20144 TGG CAA GAA ATT GCT CCT GGA AAT ACT GAT GCC ACC CCA GTA ACT CAT 19121 Trp Gln Glu Ile Ala Pro Gly Asn Thr Asp Ala Thr Pro Val Thr His 36192 GGA ACT GAA AGC TCT TGG CAT GAA ATA GCA GCT ACA TCA GGT GCT CAT 23937 Gly Thr Glu Ser Ser Trp His Glu Ile Ala Ala Thr Ser Gly Ala His 52240 CCT GAG GGT AAT GCA GAG CTC TCA GAA GAT ATA TGT AAA GAA TAT GAA 28753 Pro Glu Gly Asn Ala Glu Leu Ser Glu Asp Ile Cys Lys Glu Tyr Glu 68288 GTA ATG TAT TCT TCA TCT TGT GAA ACC ACA AGA AAT ACT ACA GGC ATT 33569 Val Met Tyr Ser Ser Ser Cys Glu Thr Thr Arg Asn Thr Thr Gly Ile 84336 GAA GAA TCA ACT GAT GGG ATG ATT TTA GGA CCA GAA GAT CTG AGT TAC 38385 Glu Glu Ser Thr Asp Gly Met Ile Leu Gly Pro Glu Asp Leu Ser Tyr 100384 CAA ATA TAT GAT GTT TCC GGA GAA AGC AAT TCA GCA GTT TCT ACA GAA 431101 Gln Ile Tyr Asp Val Ser Gly Glu Ser Asn Ser Ala Val Ser Thr Glu 116432 GAC CTA AAA GAA TGT CTG AAG AAA CAA TTA GAA TTC TGT TTT TCA CGA 479117 Asp Leu Lys Glu Cys Leu Lys Lys Gln Leu Glu Phe Cys Phe Ser Arg 132480 GAA AAT TTG TCA AAG GAT CTT TAC TTG ATA TCT CAA ATG GAT AGT GAT 527133 Glu Asn Leu Ser Lys Asp Leu Tyr Leu Ile Ser Gln Met Asp Ser Asp 148528 CAG TTC ATC CCA ATT TGG ACA GTT GCC AAC ATG GAA GAA ATA AAA AAG 575149 Gln Phe Ile Pro Ile Trp Thr Val Ala Asn Met Glu Glu Ile Lys Lys 164576 TTG ACT ACA GAC CCT GAT CTA ATT CTT GAA GTG TTA AGA TCT TCT CCC 623165 Leu Thr Thr Asp Pro Asp Leu Ile Leu Glu Val Leu Arg Ser Ser Pro 180624 ATG GTA CAA GTT GAT GAG AAG GGT GAG AAA GTG AGA CCA AGT CAT AAG 671181 Met Val Gln Val Asp Glu Lys Gly Glu Lys Val Arg Pro Ser His Lys 196672 CGT TGT ATT GTA ATT CTT AGA GAG ATT CCT GAA ACA ACA CCA ATA GAG 719197 Arg Cys Ile Val Ile Leu Arg Glu Ile Pro Glu Thr Thr Pro Ile Glu 212720 GAA GTG AAA GGT TTG TTC AAA AGT GAA AAC TGC CCC AAA GTG ATA AGC 767213 Glu Val Lys Gly Leu Phe Lys Ser Glu Asn Cys Pro Lys Val Ile Ser 228768 TGT GAG TTT GCA CAC AAT AGC AAC TGG TAT ATC ACT TTC CAG TCA GAC 815229 Cys Glu Phe Ala His Asn Ser Asn Trp Tyr Ile Thr Phe Gln Ser Asp 244816 ACA GAT GCA CAA CAG GCT TTT AAA TAC TTA AGA GAA GAA GTT AAA ACA 863245 Thr Asp Ala Gln Gln Ala Phe Lys Tyr Leu Arg Glu Glu Val Lys Thr 260864 TTT CAG GGC AAG CCA ATT ATG GCA AGG ATA AAA GCC ATC AAT ACA TTT 911261 Phe Gln Gly Lys Pro Ile Met Ala Arg Ile Lys Ala Ile Asn Thr Phe 276912 TTT GCT AAG AAT GGT TAT CGA TTA ATG GAT TCT AGT ATC TAT AGT CAC 959277 Phe Ala Lys Asn Gly Tyr Arg Leu Met Asp Ser Ser Ile Tyr Ser His 292960 CCC ATT CAA ACT CAA GCA CAG TAT GCC TCC CCA GTC TTT ATG CAG CCT1007293 Pro Ile Gln Thr Gln Ala Gln Tyr Ala Ser Pro Val Phe Met Gln Pro 3081008 GTA TAT AAT CCT CAC CAA CAG TAC TCG GTC TAT AGT ATT GTG CCT CAG1055309 Val Tyr Asn Pro His Gln Gln Tyr Ser Val Tyr Ser Ile Val Pro Gln 3241056 TCT TGG TCT CCA AAT CCT ACA CCT TAC TTT GAA ACA CCA CTG GCT CCC1103325 Ser Trp Ser Pro Asn Pro Thr Pro Tyr Phe Glu Thr Pro Leu Ala Pro 3401104 TTT CCC AAT GGT AGT TTT GTG AAT GGC TTT AAT TCG CCA GGA TCT TAT1151341 Phe Pro Asn Gly Ser Phe Val Asn Gly Phe Asn Ser Pro Gly Ser Tyr 3561152 AAA ACA AAT GCT GCT GCT ATG AAT ATG GGT CGA CCA TTC CAA AAA AAT1199357 Lys Thr Asn Ala Ala Ala Met Asn Met Gly Arg Pro Phe Gln Lys Asn 3721200 CGT GTG AAG CCT CAG TTT AGG TCA TCT GGT GGT TCA GAA CAC TCA ACA1247373 Arg Val Lys Pro Gln Phe Arg Ser Ser Gly Gly Ser Glu His Ser Thr 3881248 GAG GGC TCT GTA TCC TTG GGG GAT GGA CAG TTG AAC AGA TAT AGT TCA1295389 Glu Gly Ser Val Ser Leu Gly Asp Gly Gln Leu Asn Arg Tyr Ser Ser 4041296 AGA AAC TTT CCA GCT GAA CGG CAT AAC CCC ACA GTA ACT GGG CAT CAG1343405 Arg Asn Phe Pro Ala Glu Arg His Asn Pro Thr Val Thr Gly His Gln 4201344 GAG CAA ACT TAC CTT CAG AAG GAG ACT TCC ACT TTG CAG GTG GAA CAG1391421 Glu Gln Thr Tyr Leu Gln Lys Glu Thr Ser Thr Leu Gln Val Glu Gln 4361392 AAT GGG GAC TAT GGT AGG GGC AGG AGA ACT CTC TTC AGA GGT CGA AGA1439437 Asn Gly Asp Tyr Gly Arg Gly Arg Arg Thr Leu Phe Arg Gly Arg Arg 4521440 CGA CGA GAA GAT GAC AGG ATC TCA AGA CCT CAT CCT TCA ACA GCT GAA1487453 Arg Arg Glu Asp Asp Arg Ile Ser Arg Pro His Pro Ser Thr Ala Glu 4681488 TCA AAG GCT CCA ACA CCA AAG TTT GAC TTA TTA GCC TCA AAT TTT CCA1535469 Ser Lys Ala Pro Thr Pro Lys Phe Asp Leu Leu Ala Ser Asn Phe Pro 4841536 CCT TTA CCT GGA AGT TCA TCA AGA ATG CCA GGT GAA CTC GTT TTG GAG1583485 Pro Leu Pro Gly Ser Ser Ser Arg Met Pro Gly Glu Leu Val Leu Glu 5001584 ACT AGG ATG TCT GAT GTT GTT AAA GGT GTC TAC AAA GAA AAG GAT AAT1631501 Thr Arg Met Ser Asp Val Val Lys Gly Val Tyr Lys Glu Lys Asp Asn 5161632 GAA GAG TTG ACA ATT AGT TGC CCA GTG CCT GCA GAT GAG CAG ACA GAA1679517 Glu Glu Leu Thr Ile Ser Cys Pro Val Pro Ala Asp Glu Gln Thr Glu 5321680 TGC ACT TCT GCC CAG CAA CTC AAT ATG AGT ACC AGT TCT CCA TGT GCT1727533 Cys Thr Ser Ala Gln Gln Leu Asn Met Ser Thr Ser Ser Pro Cys Ala 5481728 GCT GAG CTT ACT GCA TTA AGC ACA ACT CAG CAA GAA AAG GAT CTA ATA1775549 Ala Glu Leu Thr Ala Leu Ser Thr Thr Gln Gln Glu Lys Asp Leu Ile 5641776 GAA GAT TCC TCT GTT CAG AAG GAT GGT CTC AAT CAG ACA ACT ATA CCA1823565 Glu Asp Ser Ser Val Gln Lys Asp Gly Leu Asn Gln Thr Thr Ile Pro 5801824 GTT TCT CCT CCA AGT ACT ACA AAG CCA TCG AGG GCA AGT ACT GCT TCA1871581 Val Ser Pro Pro Ser Thr Thr Lys Pro Ser Arg Ala Ser Thr Ala Ser 5961872 CCA TGT AAT AAT AAC ATA AAT GCA GCT ACA GCT GTG GCT CTA CAG GAA1919597 Pro Cys Asn Asn Asn Ile Asn Ala Ala Thr Ala Val Ala Leu Gln Glu 6121920 CCC CGA AAG TTA AGT TAT GCT GAA GTG TGC CAG AAG CCC CCT AAA GAG1967613 Pro Arg Lys Leu Ser Tyr Ala Glu Val Cys Gln Lys Pro Pro Lys Glu 6281968 CCA TCT TCA GTT CTT GTG CAG CCA CTA CGG GAA CTT CGC TCC AAT GTG2015629 Pro Ser Ser Val Leu Val Gln Pro Leu Arg Glu Leu Arg Ser Asn Val 6442016 GTG TCT CCC ACC AAA AAT GAA GAC AAT GGA GCT CCT GAG AAC TCC GTT2063645 Val Ser Pro Thr Lys Asn Glu Asp Asn Gly Ala Pro Glu Asn Ser Val 6602064 GAG AAA CCA CAT GAG AAG CCA GAA GCA AGG GCT AGT AAG GAT TAT TCT2111661 Glu Lys Pro His Glu Lys Pro Glu Ala Arg Ala Ser Lys Asp Tyr Ser 6762112 GGC TTC CGA GGC AAT ATA ATC CCC AGG GGA GCA GCA GGA AAA ATC AGG2159677 Gly Phe Arg Gly Asn Ile Ile Pro Arg Gly Ala Ala Gly Lys Ile Arg 6922160 GAA CAG AGA CGC CAG TTT AGC CAT AGG GCT ATA CCT CAG GGA GTG ACT2207693 Glu Gln Arg Arg Gln Phe Ser His Arg Ala Ile Pro Gln Gly Val Thr 7082208 CGA CGT AAT GGC AAA GAG CAA TAT GTG CCA CCC AGA TCA CCA AAG TAA2255709 Arg Arg Asn Gly Lys Glu Gln Tyr Val Pro Pro Arg Ser Pro Lys *** 7242256 AAA ACA ACA AAA CTA TTC AAA AAC TTC ACT CTC TTC CCA TTA AAC TTG23032304 AAC TGT GGC TAT ATT GAA CTG TTT TGG AGG GGA GGG GGT AGC CAG GAA23512352 GGA ACA AGA GAA AGT ACG TCC ATT TCA TTA TGG ATT TTG GAG TTG TGA23992400 GTG ATA GGA TCC GAA AAT TCA TCT CTA ATG TGG TTT TTA AAT GCT GGA24472448 GGA TTC CAA TCA ATA TAA ATA TAT ATA TAT ATA CAC ACA CAT ATA TAA24952496 AAA GTA TAA TTT TTC TAT TTT TGT TTT TGG TTT TAA TTT GCA GAG ATT25432544 TGC TGC CAG GAA TCA ATT TTG AGG GTT CAG ATT TAG CTT GGA AGA AAA25912592 AAA AGA AAC ATA CAT CCT TCA GTA TAG GAG ATG AGG GAA TGA GAG AAA26392640 ATA TTT TTT GAA AAA GCA TTT CTG TAA AAT TAG AAA TTA CTT TTT TTA26872688 ATC TAT TTA AAG TTT GGC TTG AAG AAT GCC ATC TCT GAC TAT ATG GCC27352736 TTG TAT TGC AAA GCA GAT CAG TGG CTG GGG TGC CTG TTG TGG GTG TGA27832784 GTG TGT ACA AGA GCG ATT GAA GCC AAA TCT GTT GTC ATG TTA GTA AAT28312832 GAT TTG AAA ACT GAA TGT AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA28792880 AAA AAA AAA A 28899.PPl4214A核苷酸序列(SEQ ID NO25)長度717個堿基1 GCTTCGGATG ACTGCAGAAA ATAGTGTTTT GTAGTTCAAC AACTCAAGAC GAAGCTTATT61 TCTGAGGATA AGCTCTTTAA AGGCAAAGCT TTATTTTCAT CTCTCATCTT TTGTCCTCCT121 TAGCACAATG TAAAAAAGAA TAGTAATATC AGAACAGGAA GGAGGAATGG CTTGCTGGGG181 AGCCCATCCA GGACACTGGG AGCACATAGA GATTCACCCA TGTTTGTTGA ACTTAGAGTC241 ATTCTCATGC TTTTCTTTAT AATTCACACA TATATGCAGA GAAGATATGT TCTTGTTAAC301 ATTGTATACA ACATAGCCCC AAATATAGTA AGATCTATAC TAGATAATCC TAGATGAAAT361 GTTAGAGATG CTATATGATA CAACTGTGGC CATGACTGAG GAAAGGAGCT CACGCCCAGA421 GACTGGGCTG CTCTCCCGGA GGCCAAACCC AAGAAGGTCT GGCAAAGTCA GGCTCAGGGA481 GACTCTGCCC TGCTGCAGAC CTCGGTGTGG ACACACGCTG CATAGAGCTC TCCTTGAAAA541 CAGAGGGGTC TCAAGACATT CTGCCTACCT ATTAGCTTTT CTTTATTTTT TTAACTTTTT601 GGGGGGAAAA GTATTTTTGA GAAGTTTGTC TTGCAATGTA TTTATAAATA GTAAATAAAG661 TTTTTACCAT TAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAB核苷酸序列(SEQ ID NO26)長度99個氨基酸1 MLEMLYDTTV AMTEERSSRP ETGLLSRRPN PRRSGKVRLR ETLPCCRPRC GHTLHRALLE61 NRGVSRHSAY LLAFLYFFNF LGGKVFLRSL SCNVFINSKC.核苷酸及氨基酸組合序列(SEQ ID NO27)克隆號和蛋白名稱PPl4214起始編碼子359 ATG 終止編碼子656 TAA 蛋白質(zhì)分子量11447.781 G CTT CGG ATG ACT GCA GAA AAT AGT GTT TTG TAG TTC AAC AAC TCA4647 AGA CGA AGC TTA TTT CTG AGG ATA AGC TCT TTA AAG GCA AAG CTT TAT9495 TTT CAT CTC TCA TCT TTT GTC CTC CTT AGC ACA ATG TAA AAA AGA ATA 142143 GTA ATA TCA GAA CAG GAA GGA GGA ATG GCT TGC TGG GGA GCC CAT CCA 190191 GGA CAC TGG GAG CAC ATA GAG ATT CAC CCA TGT TTG TTG AAC TTA GAG 238239 TCA TTC TCA TGC TTT TCT TTA TAA TTC ACA CAT ATA TGC AGA GAA GAT 286287 ATG TTC TTG TTA ACA TTG TAT ACA ACA TAG CCC CAA ATA TAG TAA GAT 334335 CTA TAC TAG ATA ATC CTA GAT GAA ATG TTA GAG ATG CTA TAT GAT ACA 3821 Met Leu Glu Met Leu Tyr Asp Thr 8383 ACT GTG GCC ATG ACT GAG GAA AGG AGC TCA CGC CCA GAG ACT GGG CTG 4309 Thr Val Ala Met Thr Glu Glu Arg Ser Ser Arg Pro Glu Thr Gly Leu 24431 CTC TCC CGG AGG CCA AAC CCA AGA AGG TCT GGC AAA GTC AGG CTC AGG 47825 Leu Ser Arg Arg Pro Asn Pro Arg Arg Ser Gly Lys Val Arg Leu Arg 40479 GAG ACT CTG CCC TGC TGC AGA CCT CGG TGT GGA CAC ACG CTG CAT AGA 52641 Glu Thr Leu Pro Cys Cys Arg Pro Arg Cys Gly His Thr Leu His Arg 56527 GCT CTC CTT GAA AAC AGA GGG GTC TCA AGA CAT TCT GCC TAC CTA TTA 57457 Ala Leu Leu Glu Asn Arg Gly Val Ser Arg His Ser Ala Tyr Leu Leu 72575 GCT TTT CTT TAT TTT TTT AAC TTT TTG GGG GGA AAA GTA TTT TTG AGA 62273 Ala Phe Leu Tyr Phe Phe Asn Phe Leu Gly Gly Lys Val Phe Leu Arg 88623 AGT TTG TCT TGC AAT GTA TTT ATA AAT AGT AAA TAA AGT TTT TAC CAT 67089 Ser Leu Ser Cys Asn Val Phe Ile Asn Ser Lys *** 100671 TAA AAA AAA AAA AAA AAA AAA AAA AAAAAA AAA AAA AAA AAA AAA AA 71710. FP497A核苷酸序列(SEQ ID NO28)長度2444個堿基1 GACTGGACGG CAGGGAGTGG GGCTGTCATC ATCAGATGAG AGCTAAGGGG ACCCCCACCA61 GGGTGGCGGC AATGGCAGAG GGTAGGCAAA ACGCTTGTAT TTGCAACATA AGGTGAGATT121 TGACAGCTGA CCGAGGGTGG GAGCAGCAGC CAAAACCAAA AAAGCCAGAG GGAAGTTGCA181 AGCACAGAAA AAATAGAAGA TTTAATGGGA GAAATAACAA TAGCTGGCAT CTATTGAACA241 CTTACTGGGA GCTAGGTACA GGGCCCATTC ATTCATTCAT GCAATTAAAA CTTTTTTTAA301 GAAACGGGGT CTTGCTCTGT TGCCCAGGCT GGAGTGCAGT GGTGTGATCA CAGCTCACTG361 CAGCCTTGAA TTCCTGGCCT CAAGGAGTCC TCCCACCTCG GCCTCCTGTG TAGCTGGGAT421 TATAGGTACG TGCGGTACAC CTGGCTCCCT TTAAAAGTTT TTTGTAGAGG CAGGGCACAG481 TGGCTCACAC CTGTAATCCC AGCACTTTGG GAGGCCGAGG CAGGAGGATC ACAAGGTCAG541 GAGTTCGAGA CCAGCCTGAC CAACATGGTG AAACCCGTCT CTACTTAAAA TACAAAAATT601 AGCCGGGTGT GGTGGCGGGC GCCTGTAATC CCAGCTACTC AGGAGGCTGA GGCATGAGAC661 TTGCTTGAAC CCAGGAGGCG AAGGTTGCAG TGAGCCGAGA TCGCGCCACT GCACTCCAGC721 CTGGGTGACA GAACAAGACT CCGTCTCAAA AAAAAAAAAA AAGTTTCTTG TAGAGGCAGG781 GCCTTGCTTT GTTGCTGGTG CAATCACGGC TCACTGCATC CTCTAACTCC TGGCCTTAAG841 CAATCTTCTG TCCTCAGCCT CCCAAAGCAC TGGGATTACA GGCATGCATG ACCACACCTG901 GTCCCTGCCA TTGTTTATTG AGCACCTACT GAGTGCCATG TATTAAGTGC TGGGTATTTG961 TCAGTGGACA AAACAGATTA AAAAAATCAC AGCCCTTAGG AGCTTACCTT CTGGCAGGGG1021 CGTCAGACAA TAACACAGCA AGTGCTGAGG AAGAAACGGA GGCGGCAGGG AGCGTGGCAG1081 TTGAGCGTGG CCTTCATGGA GCTGCGACAG TGGTACTCGG GCAGGGGCAG CACGGAGGCT1141 GTGCGCCAGA GGAGGAGGAC TGAGGGGCAA GGGGGAGAGC TCTGGTTGGA AAGGCAGGGG1201 AGATTCTCCA GGGCCTTGCC GGTGCCAGTG ACAACTGGGG TTTTCCTGAG ACGGGACTGC1261 GAGGAATGGG GGCTCTCAGG CTTGAGAGGG CAAAGGTGGG TCTGGGATGC CGTCTGCCCA1321 CAGAGCCCCT TCCCCAACGG CTGCCCAGGC CAAGCCAACC CTGTTGGGTT GTGTGGTGTG1381 AGCCATGAAG CCGCTGCCAG GTTTGTACCT CAGGCGTGGT CGTGATGCCC CAGCTTCACC1441 GGCCCTGCCT GTGGGGACGT GGTGCCTGTG TGCGGGAGCC TGGGCCTCAG CCGAGGCCCT1501 GAGCTCCGGC ACTGCCCAGA ACCCAGCTCA GCGCTGGTAC TCAGCCCGCC CGCTGTGGCC1561 CTGGTGGAGT GGAGCACGTG CCCAGTGGGG GCTGGCCTTG TCCCATCGCG GACCTGTCCT1621 TTCCCGGGGC AGGGTGGTGT GGGAGAGGGT ATCAGGGACA TTTTCTGAGT CTGCTCTGTC1681 TCTGCCGCCC CTGCCCGAAC ACAGATTCTG AAAGTCAAGA AGACATCATC CGGAATATTG1741 CCAGGCACCT CGCCCAGGTC GGGGACAGCA TGGACCGTAG CATCCCTCCG GGCCTGGTGA1801 ACGGCCTGGC CCTGCAGCTC AGGAACACCA GCCGGTCGGA GGAGGACCGG AACAGGGACC1861 TGGCCACTGC CCTGGAGCAG CTGCTGCAGG CCTACCCTAG AGACATGGAG AAGGAGAAGA1921 CCATGCTGGT GCTGGCCCTG CTGCTGGCCA AGAAGGTGGC CAGTCACACG CCGTCCTTGC1981 TCCGTGATGT CTTTCACACA ACAGTGAATT TTATTAACCA GAACCTACGC ACCTACGTGA2041 GGAGCTTAGC CAGAAATGGG ATGGACTGAA CGGACAGTTC CAGAAGTGTG ACTGGCTAAA2101 GCTCGATGTG GTCACAGCTG TATAGCTGCT TCCAGTGTAG ACGGAGCCCT GGCATGTCAA2161 CAGCGTTCCT AAAGAAGACA GGCTGGAAAA TAACTGTGAC TTTTGTTTTA AAGACAATGT2221 TTAACTTATA ACCCCCTTTA AAATATTTAC ATTAATAAAC TTGAATGAAA ATGTCCCTTT2281 ACACCGGATT TGAATGGCCT TCATATCATC CCCACATGAA TCTGCACATC TGTAAATCTA2341 CACACGGGGC CTTTATTTCC CCTGGGCAGG GTCCCCCTTA AAAATTAAAT TGGAAAGCAG2401 GGTTCAAGGA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAB核苷酸序列(SEQ ID NO29)長度109個氨基酸1 MELRQWYSGR GSTEAVRQRR RTEGQGGELW LERQGRFSRA LPVPVTTGVF LRRDCEEWGL61 SGLRGQRWVW DAVCPQSPFP NGCPGQANPV GLCGVSHEAA ARFVPQAWSC.核苷酸及氨基酸組合序列(SEQ ID NO30)克隆號和蛋白名稱FP497起始編碼子1096 ATG 終止編碼子1423 TGA 蛋白質(zhì)分子量12226.161 GAC TGG ACG GCA GGG AGT GGG GCT GTC ATC ATC AGA TGA GAG CTA AGG 4849 GGA CCC CCA CCA GGG TGG CGG CAA TGG CAG AGG GTA GGC AAA ACG CTT 9697 GTA TTT GCA ACA TAA GGT GAG ATT TGA CAG CTG ACC GAG GGT GGG AGC 144145 AGC AGC CAA AAC CAA AAA AGC CAG AGG GAA GTT GCA AGC ACA GAA AAA 192193 ATA GAA GAT TTA ATG GGA GAA ATA ACA ATA GCT GGC ATC TAT TGA ACA 240241 CTT ACT GGG AGC TAG GTA CAG GGC CCA TTC ATT CAT TCA TGC AAT TAA 288289 AAC TTT TTT TAA GAA ACG GGG TCT TGC TCT GTT GCC CAG GCT GGA GTG 336337 CAG TGG TGT GAT CAC AGC TCA CTG CAG CCT TGA ATT CCT GGC CTC AAG 384385 GAG TCC TCC CAC CTC GGC CTC CTG TGT AGC TGG GAT TAT AGG TAC GTG 432433 CGG TAC ACC TGG CTC CCT TTA AAA GTT TTT TGT AGA GGC AGG GCA CAG 480481 TGG CTC ACA CCT GTA ATC CCA GCA CTT TGG GAG GCC GAG GCA GGA GGA 528529 TCA CAA GGT CAG GAG TTC GAG ACC AGC CTG ACC AAC ATG GTG AAA CCC 576577 GTC TCT ACT TAA AAT ACA AAA ATT AGC CGG GTG TGG TGG CGG GCG CCT 624625 GTA ATC CCA GCT ACT CAG GAG GCT GAG GCA TGA GAC TTG CTT GAA CCC 672673 AGG AGG CGA AGG TTG CAG TGA GCC GAG ATC GCG CCA CTG CAC TCC AGC 720721 CTG GGT GAC AGA ACA AGA CTC CGT CTC AAA AAA AAA AAA AAA GTT TCT 768769 TGT AGA GGC AGG GCC TTG CTT TGT TGC TGG TGC AAT CAC GGC TCA CTG 816817 CAT CCT CTA ACT CCT GGC CTT AAG CAA TCT TCT GTC CTC AGC CTC CCA 864865 AAG CAC TGG GAT TAC AGG CAT GCA TGA CCA CAC CTG GTC CCT GCC ATT 912913 GTT TAT TGA GCA CCT ACT GAG TGC CAT GTA TTA AGT GCT GGG TAT TTG 960961 TCA GTG GAC AAA ACA GAT TAA AAA AAT CAC AGC CCT TAG GAG CTT ACC10081009 TTC TGG CAG GGG CGT CAG ACA ATA ACA CAG CAA GTG CTG AGG AAG AAA10561057 CGG AGG CGG CAG GGA GCG TGG CAG TTG AGC GTG GCC TTC ATG GAG CTG11041 Met Glu Leu 31105 CGA CAG TGG TAC TCG GGC AGG GGC AGC ACG GAG GCT GTG CGC CAG AGG11524 Arg Gln Trp Tyr Ser Gly Arg Gly Ser Thr Glu Ala Val Arg Gln Arg 191153 AGG AGG ACT GAG GGG CAA GGG GGA GAG CTC TGG TTG GAA AGG CAG GGG120020 Arg Arg Thr Glu Gly Gln Gly Gly Glu Leu Trp Leu Glu Arg Gln Gly 351201 AGA TTC TCC AGG GCC TTG CCG GTG CCA GTG ACA ACT GGG GTT TTC CTG124836 Arg Phe Ser Arg Ala Leu Pro Val Pro Val Thr Thr Gly Val Phe Leu 511249 AGA CGG GAC TGC GAG GAA TGG GGG CTC TCA GGC TTG AGA GGG CAA AGG129652 Arg Arg Asp Cys Glu Glu Trp Gly Leu Ser Gly Leu Arg Gly Gln Arg 671297 TGG GTC TGG GAT GCC GTC TGC CCA CAG AGC CCC TTC CCC AAC GGC TGC134468 Trp Val Trp Asp Ala Val Cys Pro Gln Ser Pro Phe Pro Asn Gly Cys 831345 CCA GGC CAA GCC AAC CCT GTT GGG TTG TGT GGT GTG AGC CAT GAA GCC139284 Pro Gly Gln Ala Asn Pro Val Gly Leu Cys Gly Val Ser His Glu Ala 991393 GCT GCC AGG TTT GTA CCT CAG GCG TGG TCG TGA TGC CCC AGC TTC ACC1440100 Ala Ala Arg Phe Val Pro Gln Ala Trp Ser *** 1101441 GGC CCT GCC TGT GGG GAC GTG GTG CCT GTG TGC GGG AGC CTG GGC CTC14881489 AGC CGA GGC CCT GAG CTC CGG CAC TGC CCA GAA CCC AGC TCA GCG CTG15361537 GTA CTC AGC CCG CCC GCT GTG GCC CTG GTG GAG TGG AGC ACG TGC CCA15841585 GTG GGG GCT GGC CTT GTC CCA TCG CGG ACC TGT CCT TTC CCG GGG CAG16321633 GGT GGT GTG GGA GAG GGT ATC AGG GAC ATT TTC TGA GTC TGC TCT GTC16801681 TCT GCC GCC CCT GCC CGA ACA CAG ATT CTG AAA GTC AAG AAG ACA TCA17281729 TCC GGA ATA TTG CCA GGC ACC TCG CCC AGG TCG GGG ACA GCA TGG ACC17761777 GTA GCA TCC CTC CGG GCC TGG TGA ACG GCC TGG CCC TGC AGC TCA GGA18241825 ACA CCA GCC GGT CGG AGG AGG ACC GGA ACA GGG ACC TGG CCA CTG CCC18721873 TGG AGC AGC TGC TGC AGG CCT ACC CTA GAG ACA TGG AGA AGG AGA AGA19201921 CCA TGC TGG TGC TGG CCC TGC TGC TGG CCA AGA AGG TGG CCA GTC ACA19681969 CGC CGT CCT TGC TCC GTG ATG TCT TTC ACA CAA CAG TGA ATT TTA TTA20162017 ACC AGA ACC TAC GCA CCT ACG TGA GGA GCT TAG CCA GAA ATG GGA TGG20642065 ACT GAA CGG ACA GTT CCA GAA GTG TGA CTG GCT AAA GCT CGA TGT GGT21122113 CAC AGC TGT ATA GCT GCT TCC AGT GTA GAC GGA GCC CTG GCA TGT CAA21602161 CAG CGT TCC TAA AGA AGA CAG GCT GGA AAA TAA CTG TGA CTT TTG TTT22082209 TAA AGA CAA TGT TTA ACT TAT AAC CCC CTT TAA AAT ATT TAC ATT AAT22562257 AAA CTT GAA TGA AAA TGT CCC TTT ACA CCG GAT TTG AAT GGC CTT CAT23042305 ATC ATC CCC ACA TGA ATC TGC ACA TCT GTA AAT CTA CAC ACG GGG CCT23522353 TTA TTT CCC CTG GGC AGG GTC CCC CTT AAA AAT TAA ATT GGA AAG CAG24002401 GGT TCA AGG AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA 244411. FP585A核苷酸序列(SEQ ID NO31)長度1288個堿基1 GTGCTGGGCA GCTTGAGTTT TCCCCAGGCT GCTCTATTGT TGCCTGTAGC TGTGATTTTT61 CAGGCAGGCT GCTCCTCTGA GGACCACCCT TAACTGTCTA CCTAACTGGT TTTTCCTTTT121 CTTCTCCTCA TTTGTATTTA TGTATCAGTG TATTATGTAT TTATATACAC TTGGAGATAC181 AGTAAAATGT ACCTCTCACT GTGGGTTACC ATAAATACTG TAAATTTGAG AAACACTCTT241 TCAGGCCTGA GAGGAGCAGT GACAACAGTA GGGATGATCA AGTCAGATGT CCCTGGTACC301 CAGGAATGGC TGGATGAGAG AAGGAGACAG GGTGACCTGC CCCTGCCTAC AAACTCTAAC361 CCAGTTCTGT CCCTGGAGCT GTGTGACCCC GGACAAGGCC CTGCCCCTTT CCAGGCTGTC421 GTTGTCCTCA TCCAGCCTGG GAGAGGGTTG GCGCTGAGGC CCCCACCTTC TTGCCTGTTT481 CCTCCTGACC CCACCCCTTC CCCTCCTGCT GGGCAGATCC GAGTGAAGCC TGACAGGACC541 GGTGTGGTCA CGGATGGTGT GAAGCACTCC ATGAACCCCT TCTGTGAGAT CGCGGTGGAG601 GAGGCTGTGC GGCTCAAGGA GAAGAAGCTG GTGAAGGAGG TCATCGCCGT CAGCTGTGGG661 CCTGCACAGT GCCAGGAGAC GATTCGTACC GCCCTGGCCA TGGGTGCAGA CCGAGGTATC721 CACGTGGAGG TGCCCCCAGC AGAAGCAGAA CGCTTGGGTC CCCTGCAGGT GGCTCGGGTC781 CTGGCCAAGC TGGCAGAGAA GGAGAAGGTG GACCTGGTGC TGCTGGGCAA ACAGGCCATC841 GATGATGACT GTAACCAGAC AGGGCAGATG ACAGCTGGAT TTCTTGACTG GCCACAGGGC901 ACATTCGCCT CCCAGGTGAT GCTGGAGGGG GACAAGTTGA AAGTGGAGCG GGAGATCGAT961 GGGGGCCTGG AGACCCTGCG CCTGAAGCTG CCAGCTGTGG TGACAGCTGA CCTGAGGCTC1021 AACGAGCCCC GCTACGCCAC GCTGCCCAAC ATCATGAAAG CCAAGAAGAA GAAGATCGAG1081 GTGATCAAGC CTGGGGACCT GGGTGTGGAC CTGACCTCCA AGCTCTCTGT GATCAGTGTG1141 GAGGACCCGC CCCAGCGCAC GGCCGGCGTC AAGGTGGAGA CCACTGAGGA CCTGGTGGCC1201 AAGCTGAAGG AGATTGGGCG GATTTGAGCC CCTCCCAGAG ATGGCAATAA AACTGACTCT1261 CAACATCTAA AAAAAAAAAA AAAAAAAAB核苷酸序列(SEQ ID NO32)長度346個氨基酸1 MYLSLWVTIN TVNLRNTLSG LRGAVTTVGM IKSDVPGTQE WLDERRRQGD LPLPTNSNPV61 LSLELCDPGQ GPAPFQAVVV LIQPGRGLAL RPPPSCLFPP DPTPSPPAGQ IRVKPDRTGV121 VTDGVKHSMN PFCEIAVEEA VRLKEKKLVK EVIAVSCGPA QCQETIRTAL AMGADRGIHV181 EVPPAEAERL GPLQVARVLA KLAEKEKVDL VLLGKQAIDD DCNQTGQMTA GFLDWPQGTF241 ASQVMLEGDK LKVEREIDGG LETLRLKLPA VVTADLRLNE PRYATLPNIM KAKKKKIEVI301 KPGDLGVDLT SKLSVISVED PPQRTAGVKV ETTEDLVAKL KEIGRIC.核苷酸及氨基酸組合序列(SEQ ID NO33)克隆號和蛋白名稱FP585起始編碼子187 ATG 終止編碼子1225 TGA 蛋白質(zhì)分子量37462.561 GTG CTG GGC AGC TTG AGT TTT CCC CAG GCT GCT CTA TTG TTG CCT GTA 4849 GCT GTG ATT TTT CAG GCA GGC TGC TCC TCT GAG GAC CAC CCT TAA CTG 9697 TCT ACC TAA CTG GTT TTT CCT TTT CTT CTC CTC ATT TGT ATT TAT GTA 144145 TCA GTG TAT TAT GTA TTT ATA TAC ACT TGG AGA TAC AGT AAA ATG TAC 1921 Met Tyr 2193 CTC TCA CTG TGG GTT ACC ATA AAT ACT GTA AAT TTG AGA AAC ACT CTT 2403 Leu Ser Leu Trp Val Thr Ile Asn Thr Val Asn Leu Arg Asn Thr Leu 18241 TCA GGC CTG AGA GGA GCA GTG ACA ACA GTA GGG ATG ATC AAG TCA GAT 28819 Ser Gly Leu Arg Gly Ala Val Thr Thr Val Gly Met Ile Lys Ser Asp 34289 GTC CCT GGT ACC CAG GAA TGG CTG GAT GAG AGA AGG AGA CAG GGT GAC 33635 Val Pro Gly Thr Gln Glu Trp Leu Asp Glu Arg Arg Arg Gln Gly Asp 50337 CTG CCC CTG CCT ACA AAC TCT AAC CCA GTT CTG TCC CTG GAG CTG TGT 38451 Leu Pro Leu Pro Thr Asn Ser Asn Pro Val Leu Ser Leu Glu Leu Cys 66385 GAC CCC GGA CAA GGC CCT GCC CCT TTC CAG GCT GTC GTT GTC CTC ATC 43267 Asp Pro Gly Gln Gly Pro Ala Pro Phe Gln Ala Val Val Val Leu Ile 82433 CAG CCT GGG AGA GGG TTG GCG CTG AGG CCC CCA CCT TCT TGC CTG TTT 48083 Gln Pro Gly Arg Gly Leu Ala Leu Arg Pro Pro Pro Ser Cys Leu Phe 98481 CCT CCT GAC CCC ACC CCT TCC CCT CCT GCT GGG CAG ATC CGA GTG AAG 52899 Pro Pro Asp Pro Thr Pro Ser Pro Pro Ala Gly Gln Ile Arg Val Lys 114529 CCT GAC AGG ACC GGT GTG GTC ACG GAT GGT GTG AAG CAC TCC ATG AAC 576115 Pro Asp Arg Thr Gly Val Val Thr Asp Gly Val Lys His Ser Met Asn 130577 CCC TTC TGT GAG ATC GCG GTG GAG GAG GCT GTG CGG CTC AAG GAG AAG 624131 Pro Phe Cys Glu Ile Ala Val Glu Glu Ala Val Arg Leu Lys Glu Lys 146625 AAG CTG GTG AAG GAG GTC ATC GCC GTC AGC TGT GGG CCT GCA CAG TGC 672147 Lys Leu Val Lys Glu Val Ile Ala Val Ser Cys Gly Pro Ala Gln Cys 162673 CAG GAG ACG ATT CGT ACC GCC CTG GCC ATG GGT GCA GAC CGA GGT ATC 720163 Gln Glu Thr Ile Arg Thr Ala Leu Ala Met Gly Ala Asp Arg Gly Ile 178721 CAC GTG GAG GTG CCC CCA GCA GAA GCA GAA CGC TTG GGT CCC CTG CAG 768179 His Val Glu Val Pro Pro Ala Glu Ala Glu Arg Leu Gly Pro Leu Gln 194769 GTG GCT CGG GTC CTG GCC AAG CTG GCA GAG AAG GAG AAG GTG GAC CTG 816195 Val Ala Arg Val Leu Ala Lys Leu Ala Glu Lys Glu Lys Val Asp Leu 210817 GTG CTG CTG GGC AAA CAG GCC ATC GAT GAT GAC TGT AAC CAG ACA GGG 864211 Val Leu Leu Gly Lys Gln Ala Ile Asp Asp Asp Cys Asn Gln Thr Gly 226865 CAG ATG ACA GCT GGA TTT CTT GAC TGG CCA CAG GGC ACA TTC GCC TCC 912227 Gln Met Thr Ala Gly Phe Leu Asp Trp Pro Gln Gly Thr Phe Ala Ser 242913 CAG GTG ATG CTG GAG GGG GAC AAG TTG AAA GTG GAG CGG GAG ATC GAT 960243 Gln Val Met Leu Glu Gly Asp Lys Leu Lys Val Glu Arg Glu Ile Asp 258961 GGG GGC CTG GAG ACC CTG CGC CTG AAG CTG CCA GCT GTG GTG ACA GCT1008259 Gly Gly Leu Glu Thr Leu Arg Leu Lys Leu Pro Ala Val Val Thr Ala 2741009 GAC CTG AGG CTC AAC GAG CCC CGC TAC GCC ACG CTG CCC AAC ATC ATG1056275 Asp Leu Arg Leu Asn Glu Pro Arg Tyr Ala Thr Leu Pro Asn Ile Met 2901057 AAA GCC AAG AAG AAG AAG ATC GAG GTG ATCAAG CCT GGG GAC CTG GGT 1104291 Lys Ala Lys Lys Lys Lys Ile Glu Val Ile Lys Pro Gly Asp Leu Gly 3061105 GTG GAC CTG ACC TCC AAG CTC TCT GTG ATC AGT GTG GAG GAC CCG CCC1152307 Val Asp Leu Thr Ser Lys Leu Ser Val Ile Ser Val Glu Asp Pro Pro 3221153 CAG CGC ACG GCC GGC GTC AAG GTG GAG ACC ACT GAG GAC CTG GTG GCC1200323 Gln Arg Thr Ala Gly ValLys Val Glu Thr Thr Glu Asp Leu Val Ala 3381201 AAG CTG AAG GAG ATT GGG CGG ATT TGA GCC CCT CCC AGA GAT GGC AAT1248339 Lys Leu Lys Glu Ile Gly Arg Ile *** 3471249 AAA ACT GAC TCT CAA CAT CTA AAA AAA AAA AAA AAA AAA A 128812.FP588A核苷酸序列(SEQ ID NO34)長度2057個堿基1 GCCAAAGTGT TTTTGGTCAT TAACAGGAAG CATCTTTTCT ACATTACGGT TTCATGTGAC61 CAAATTATGG CCATAGTATT TCAGATTTAT TCATCCACTA AGTATTTATT AAGTACCTAT121 TCTGTGCTAG GTATCAGGTG CTGGGGCTAT AGCAGTAAGG AAAGTAAGTG GACAAAAGGA181 TTCCACACCT GTCACAGGCG CTGCCCCACT CCCTGAGTCA GGTGAGATGA GCTCCGGAAG241 GCAGGTGGGT AATGGATGAT GCTCACCTAG TGTTCCTTGG GCCATGAAGA TCAAATATTT301 CAGCCCCATA GGATGTGTAA GCTTGATTTC TGGTCATCTC TCCTTAAGGA ATCATGGACC361 ATTCATTATT TTGTTTAAAA GGACACATAA GAACGTACAT GTCTCAATAG AGTTACTGGT421 CACAGGACTG AACTGTGGTC ATGAAAGCCA AGCAACTTAC TTTCTGGCCT CCATATTGCT481 TTGTAGGAGA AATGATACTG ACAATGATGT CACACGAGGA GGGAAGCCAG GCACGAATCT541 GGTGGAGGTG CGGTCAGTTG TGACCAGCTT TGCAAAGGGA GCGGTGGGCG AGGCTGTGGT601 CTCTCCCAGG TGACCTCCAT CGCCATGCAG AGCTGCTCTC ACTTCTCCTC GGGAAAGGCC661 AGCGTCAGGT ATTCCTAGGA GGAAGCCCAG GTGTGTCCAG AGAACAGTAG TCTTGTTAGA721 ACTGGAAAAA TGTCTTATGG CCAGGTGGCC CCTGGTCTGA AGGAAAAATA GGAGCTGAGT781 GTGAACTTTT ATCACTCAGA AGATATAATC CACCTCTCCC CTCCTGCCCT TCGCTCCTGG841 GTTGGTTGTG AGGACAGTGC TTTGTGACAG CAGTGGAGCC CTGTCTGTCC TTCCGGGCTA901 GATTTCTTCT TTCTCTTATT CCTCCTGTTT CGTTGTATCC ACGATTTGTC GAGTTGCAGG961 GCTCACCCTT TCCTGAAGAA ACCATCTCTT TTCCCAGCTC CGCACCTTTG TCCGAGATGG1021 AGGCGTGTCC TCCCGCCCAT CCCCAGTGGG GGGTGTTCTG CCCATTCTCC AGAGCCCAGC1081 ACTGCTCCCA TCTCTTTTCC TCCCTCTCCT TCCCCTTGCT GTTACCTGCT GCCTTCTTGT1141 GCTCCCACTG CCCTTGGCCA TCCCTCTGTG TCATTGTGCG CTGTGGTGCA CCTGTCTTCT1201 CTACTACACC TTAAGAGCAG GACTCTGCCT CCTTCCTACC AGCACCTCAT GCAGCAAGTG1261 CTGCCAATAG CAGGCACCCA GCAGATAGCG AATGCACGAC TCCAAAACCC AGCTTTGCCT1321 CCTGGCTGTA GTTCAGACTA GCTGTGTGAC ACTGACCAAG ACACTTGACC TCTCTCAGAC1381 TCAGCTTCCT CCTTGAAGAC TGGGATGCTA TGTAGCTCAG AGGAAACATA CACCTGAAGG1441 TGCTGCCCCG GGGGGTGCAA TGACCTGTTA CTGAGGCTGG ATGGAGGATG GCATCCATCA1501 TCAGCTACAG GTGCCTCCTC TATCTACAGG TTCCTGCTCC ATCTATACTA GCCACCTCCT1561 GGACAAGGGC TCCAGTGTCC TCCATGACAC CAGCTTTCTC CAGAGCCTGT GCAGGATTTC1621 CTTCCTCTAC CCTGAATCAG GGTGATTCTT AAAGGACAGT TTCAGGAACA TATAGGGGCA1681 CTTGGGTAAT CTTGGTCAGT AACTGACCTT TAACTATCAT CCATGTGAAC ATCTACAGTT1741 AGGGATTTTC TTGGTGATGT TTGGCAAAAA GTAAAGAATT CCCCAAGTGT GAAGCCTCAT1801 TCATTCACTT ATTCAACAM TAGTTATTGA GCACCTACTA TGTGTTAGGC CCTGGGCCAG1861 GTGCTGGGAA TACAGCAGAG ACAGACCTGG CTCCTGCCCT CATGGAGTTT GCAGTCATTC1921 ATTCACTCAC TCGGTGACTT TGGACACCTC CCCCTCCTCT CTCCAGGCTT TAGATCTCTG1981 AGATTCTCTC TGAGTCTGGG ATGTAAAGAC AAAGTAAAAC CTGAAATCTG GAAAGCAAAA2041 AAAAAAAAAA AAAAAAAB核苷酸序列(SEQ ID NO35)長度109個氨基酸1 MKIKYFSPIG CVSLISGHLS LRNHGPFIIL FKRTHKNVHV SIELLVTGLN CGHESQATYF61 LASILLCRRN DTDNDVTRGG KPGTNLVEVR SVVTSFAKGA VGEAVVSPRC.核苷酸及氨基酸組合序列(SEQ ID NO36)克隆號和蛋白名稱FP588起始編碼子284 ATG 終止編碼子611 TGA 蛋白質(zhì)分子量11862.161G CCA AAG TGT TTT TGG TCA TTA ACA GGA AGC ATC TTT TCT ACA TTA 4647 CGG TTT CAT GTG ACC AAA TTA TGG CCA TAG TAT TTC AGA TTT ATT CAT 9495 CCA CTA AGT ATT TAT TAA GTA CCT ATT CTG TGC TAG GTA TCA GGT GCT 142143 GGG GCT ATA GCA GTA AGG AAA GTA AGT GGA CAA AAG GAT TCC ACA CCT 190191 GTC ACA GGC GCT GCC CCA CTC CCT GAG TCA GGT GAG ATG AGC TCC GGA 238239 AGG CAG GTG GGT AAT GGA TGA TGC TCA CCT AGT GTT CCT TGG GCC ATG 2861 Met 1287 AAG ATC AAA TAT TTC AGC CCC ATA GGA TGT GTA AGC TTG ATT TCT GGT 3342 Lys Ile Lys Tyr Phe Ser Pro Ile Gly Cys Val Ser Leu Ile Ser Gly 17335 CAT CTC TCC TTA AGG AAT CAT GGA CCA TTC ATT ATT TTG TTT AAA AGG 38218 His Leu Ser Leu Arg Asn His Gly Pro Phe Ile Ile Leu Phe Lys Arg 33383 ACA CAT AAG AAC GTA CAT GTC TCA ATA GAG TTA CTG GTC ACA GGA CTG 43034 Thr His Lys Asn Val His Val Ser Ile Glu Leu Leu Val Thr Gly Leu 49431 AAC TGT GGT CAT GAA AGC CAA GCA ACT TAC TTT CTG GCC TCC ATA TTG 47850 Asn Cys Gly His Glu Ser Gln Ala Thr Tyr Phe Leu Ala Ser Ile Leu 65479 CTT TGT AGG AGA AAT GAT ACT GAC AAT GAT GTC ACA CGA GGA GGG AAG 52666 Leu Cys Arg Arg Asn Asp Thr Asp Asn Asp Val Thr Arg Gly Gly Lys 81527 CCA GGC ACG AAT CTG GTG GAG GTG CGG TCA GTT GTG ACC AGC TTT GCA 57482 Pro Gly Thr Asn Leu Val Glu Val Arg Ser Val Val Thr Ser Phe Ala 97575 AAG GGA GCG GTG GGC GAG GCT GTG GTC TCT CCC AGG TGA CCT CCA TCG 62298 Lys Gly Ala Val Gly Glu Ala Val Val Ser Pro Arg *** 110623 CCA TGC AGA GCT GCT CTC ACT TCT CCT CGG GAA AGG CCA GCG TCA GGT 670671 ATT CCT AGG AGG AAG CCC AGG TGT GTC CAG AGA ACA GTA GTC TTG TTA 718719 GAA CTG GAA AAA TGT CTT ATG GCC AGG TGG CCC CTG GTC TGA AGG AAA 766767 AAT AGG AGC TGA GTG TGA ACT TTT ATC ACT CAG AAG ATA TAA TCC ACC 814815 TCT CCC CTC CTG CCC TTC GCT CCT GGG TTG GTT GTG AGG ACA GTG CTT 862863 TGT GAC AGC AGT GGA GCC CTG TCT GTC CTT CCG GGC TAG ATT TCT TCT 910911 TTC TCT TAT TCC TCC TGT TTC GTT GTA TCC ACG ATT TGT CGA GTT GCA 958959 GGG CTC ACC CTT TCC TGA AGA AAC CAT CTC TTT TCC CAG CTC CGC ACC10061007 TTT GTC CGA GAT GGA GGC GTG TCC TCC CGC CCA TCC CCA GTG GGG GGT10541055 GTT CTG CCC ATT CTC CAG AGC CCA GCA CTG CTC CCA TCT CTT TTC CTC11021103 CCT CTC CTT CCC CTT GCT GTT ACC TGC TGC CTT CTT GTG CTC CCA CTG11501151 CCC TTG GCC ATC CCT CTG TGT CAT TGT GCG CTG TGG TGC ACC TGT CTT11981199 CTC TAC TAC ACC TTA AGA GCA GGA CTC TGC CTC CTT CCT ACC AGC ACC12461247 TCA TGC AGC AAG TGC TGC CAA TAG CAG GCA CCC AGC AGA TAG CGA ATG12941295 CAC GAC TCC AAA ACC CAG CTT TGC CTC CTG GCT GTA GTT CAG ACT AGC13421343 TGT GTG ACA CTG ACC AAG ACA CTT GAC CTC TCl CAG ACT CAG CTT CCT13901391 CCT TGA AGA CTG GGA TGC TAT GTA GCT CAG AGG AAA CAT ACA CCT GAA14381439 GGT GCT GCC CCG GGG GGT GCA ATG ACC TGT TAC TGA GGC TGG ATG GAG14861487 GAT GGC ATC CAT CAT CAG CTA CAG GTG CCT CCT CTA TCT ACA GGT TCC15341535 TGC TCC ATC TAT ACT AGC CAC CTC CTG GAC AAG GGC TCC AGT GTC CTC15821583 CAT GAC ACC AGC TTT CTC CAG AGC CTG TGC AGG ATT TCC TTC CTC TAC16301631 CCT GAA TCA GGG TGA TTC TTA AAG GAC AGT TTC AGG AAC ATA TAG GGG16781679 CAC TTG GGT AAT CTT GGT CAG TAA CTG ACC TTT AAC TAT CAT CCA TGT17261727 GAA CAT CTA CAG TTA GGG ATT TTC TTG GTG ATG TTT GGC AAA AAG TAA17741775 AGA ATT CCC CAA GTG TGA AGC CTC ATT CAT TCA CTT ATT CAA CAA ATA18221823 GTT ATT GAG CAC CTA CTA TGT GTT AGG CCC TGG GCC AGG TGC TGG GAA18701871 TAC AGC AGA GAC AGA CCT GGC TCC TGC CCT CAT GGA GTT TGC AGT CAT19181919 TCA TTC ACT CAC TCG GTG ACT TTG GAC ACC TCC CCC TCC TCT CTC CAG19661967 GCT TTA GAT CTC TGA GAT TCT CTC TGA GTC TGG GAT GTA AAG ACA AAG20142015 TAA AAC CTG AAA TCT GGA AAG CAA AAA AAA AAA AAA AAA AAA A 205713. FP757A核苷酸序列(SEQ ID NO37)長度1932個堿基1 GGAATCATTT TTTGAGGAGC GGGGGTACAG TTTAGTTTTG TTTCTACTTT TACCTTTTTT61 TTAAAATTAT TTAACTCTTT ATAACATGAT TTTTAAATGT ACACAAAGAT AAAAGGAAAA121 TTACAATGAA CACCTGTGTT CTAGTCATTT GGCTTCAACA GCTGTTATTT TCCTTTAATA181 GATAAGTATG GAAGAGTGGA AGCTTGCTTT CATCTTACTC CTCTGCCTTT CTCCCTAAAA241 CTCTCTCTTC CCACCCTATT ACTCAGAAAT CTTTTCCTCA TTCTTTATGT GTACTGTAAT301 ATATTTCATG AATCTCATGT GAAATTTTCT CTGTAATACA TATAGTATTC AATCTGTAAC361 CACTAAGAGC ACTTTGCAGA GTTAAAAATC TGGGATTTAT AGCAGTATTA ATTTTATTTA421 ATAAACTATG AAGTTAAATA TAAATATCAT CTGGGGTTTA TAGCAGTATT AATTTTAACA481 AGTAAGCTTA ATGTCATTGT CTTTTAGCAA ACTGAAACCG TGTCAGTTCA GTCTTCGGTA541 TTGGGGAAGG GTGTAAAACA TCGACCCCCA CCAATCAAAC TTCCCTCAAG CTCAGGAAAT601 AGTTCCTCAG GTAACTATTT TACACCACAA CAGACAAGCA GCTTTCTCAA ATCTCCAACT661 CCTCCTCCTT CTTCTAAGCC ATCAAGTATT CCTCGGAAAT CATCTGTGGA TCTCAATCAA721 GTTAGCATGC TTTCTCCAGC TGCCCTATCA CCTGCCAGCT CATCACAAAG AACCACGGCC781 ACCCAGGTCA TGGCAAACTC TGCTGGACTT AACTTCATCA ATGTAGTGGG CTCTGTTTGT841 GGGGCCCAGG CTTTGATGAG TGGTCAAACC CCATGCTGGG CTGTAACACT GGTGCCATAA901 CTCCTGCAGG AATAAACCTG AGCGGCCTTC TACCCTCAGG AGGTCTGCTA CCAAATGCAC961 TGCCCAGTGC AATGCAGGCA GCTTCTCAAG CAGGTGTTCC ATTTGGTTTA AAAAATACTT1021 CAAGTCTCAG GCCCTTAAAT CTACTCCAGC TTCCAGGTGG TTCACTTATT TTTAACACTC1081 TGCAGCAGCA GCAACAGCAG CTCTCCCAGT TTACACCACA ACAACCTCAG CAGCCCACAA1141 CTTGTAGTCC TCAACAGCCA GGGGAGCAGG GTTCTGAGCA AGGTTCAACC AGTCAAGAAC1201 AGGCCTTATC TGCTCAGCAA GCTGCTGTTA TTAACCTTAC TGGAGTAGGA AGTTTTATGC1261 AGTCACAGGC AGCTGTGTTG TCTCAGCTTG GCTCTGCCGA GAACAGACCT GAGCAAAGCC1321 TTCCTCAGCA GAGATTCCAG CTCTCCTCTG CCTTTCAACA GCAGCAGCAA CAGATACAAC1381 AGTTGCGATT CTTGCAGCAT CAAATGGCTA TGGCAGCAGC AGCAGCACAA ACAGCTCAGC1441 TACATCATCA TCGGCATACA GGCAGCCAGT CAAAAAGTAA AATGAAGAGA GGCATGCCAA1501 CCACTCCAAA ATTTTGAGTC TTGCATTACT TTTTGTTCCT TTTTTAAAAA CACAAGAGCA1561 CTGAATCAAA AGAATTGAGT TTCTACTTTT TGTTTTTTTT AATGTGTCAG TATTTTACAT1621 TGCTAGATGT ACAAACTTTA TACAGAAGCA CAACCTTATC ATTTTTAAAT AAAAACAGGG1681 AAATGGTTTA ACAAACTAGG GTTGGTTTGC CTAAGTCATT GCTTTTTAAA AATGGTTTCA1741 CTATACATAA TATATATGGA AGTGACCTAA GAAATAATAG AAACATCTTT CAGAAGAATG1801 TAGTTTGATA TTTATTTAGT ATAAAACGTT TGTGCACAGT GTTAACAAAT ACAATTTTTA1861 CAAATCTGTT TTGAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA1921 AAAAAAAAAA AAB核苷酸序列(SEQ ID NO38)長度214個氨基酸1 MLGCNTGAIT PAGINLSGLL PSGGLLPNAL PSAMQAASQA GVPFGLKNTS SLRPLNLLQL61 PGGSLIFNTL QQQQQQLSQF TPQQPQQPTT CSPQQPGEQG SEQGSTSQEQ ALSAQQAAVI121 NLTGVGSFMQ SQAAVLSQLG SAENRPEQSL PQQRFQLSSA FQQQQQQIQQ LRFLQHQMAM181 AAAAAQTAQL HHHRHTGSQS KSKMKRGMPT TPKFC.核苷酸及氨基酸組合序列(SEQ ID NO39) 克隆號和蛋白名稱FP757起始編碼子873 ATG 終止編碼子1519 TGA 蛋白質(zhì)分子量22775.561 GG AAT CAT TTT TTG AGG AGC GGG GGT ACA GTT TAG TTT TGT TTC TAC 4748 TTT TAC CTT TTT TTT AAA ATT ATT TAA CTC TTT ATA ACA TGA TTT TTA 9596 AAT GTA CAC AAA GAT AAA AGG AAA ATT ACA ATG AAC ACC TGT GTT CTA 143144 GTC ATT TGG CTT CAA CAG CTG TTA TTT TCC TTT AAT AGA TAA GTA TGG 191192 AAG AGT GGA AGC TTG CTT TCA TCT TAC TCC TCT GCC TTT CTC CCT AAA 239240 ACT CTC TCT TCC CAC CCT ATT ACT CAG AAA TCT TTT CCT CAT TCT TTA 287288 TGT GTA CTG TAA TAT ATT TCA TGA ATC TCA TGT GAA ATT TTC TCT GTA 335336 ATA CAT ATA GTA TTC AAT CTG TAA CCA CTA AGA GCA CTT TGC AGA GTT 383384 AAA AAT CTG GGA TTT ATA GCA GTA TTA ATT TTA TTT AAT AAA CTA TGA 431432 AGT TAA ATA TAA ATA TCA TCT GGG GTT TAT AGC AGT ATT AAT TTT AAC 479480 AAG TAA GCT TAA TGT CAT TGT CTT TTA GCA AAC TGA AAC CGT GTC AGT 527528 TCA GTC TTC GGT ATT GGG GAA GGG TGT AAA ACA TCG ACC CCC ACC AAT 575576 CAA ACT TCC CTC AAG CTC AGG AAA TAG TTC CTC AGG TAA CTA TTT TAC 623624 ACC ACA ACA GAC AAG CAG CTT TCT CAA ATC TCC AAC TCC TCC TCC TTC 671672 TTC TAA GCC ATC AAG TAT TCC TCG GAA ATC ATC TGT GGA TCT CAA TCA 719720 AGT TAG CAT GCT TTC TCC AGC TGC CCT ATC ACC TGC CAG CTC ATC ACA 767768 AAG AAC CAC GGC CAC CCA GGT CAT GGC AAA CTC TGC TGG ACT TAA CTT 815816 CAT CAA TGT AGT GGG CTC TGT TTG TGG GGC CCA GGC TTT GAT GAG TGG 863864 TCA AAC CCC ATG CTG GGC TGT AAC ACT GGT GCC ATA ACT CCT GCA GGA 9111 Met Leu Gly Cys Asn Thr Gly Ala Ile Thr Pro Ala Gly 13912 ATA AAC CTG AGC GGC CTT CTA CCC TCA GGA GGT CTG CTA CCA AAT GCA 95914 Ile Asn Leu Ser Gly Leu Leu Pro Ser Gly Gly Leu Leu Pro Asn Ala 29960 CTG CCC AGT GCA ATG CAG GCA GCT TCT CAA GCA GGT GTT CCA TTT GGT 100730 Leu Pro Ser Ala Met Gln Ala Ala Ser Gln Ala Gly Val Pro Phe Gly 451008 TTA AAA AAT ACT TCA AGT CTC AGG CCC TTA AAT CTA CTC CAG CTT CCA 105546 Leu Lys Asn Thr Ser Ser Leu Arg Pro Leu Asn Leu Leu Gln Leu Pro 611056 GGT GGT TCA CTT ATT TTT AAC ACT CTG CAG CAG CAG CAA CAG CAG CTC 110362 Gly Gly Ser Leu Ile Phe Asn Thr Leu Gln Gln Gln Gln Gln Gln Leu 771104 TCC CAG TTT ACA CCA CAA CAA CCT CAG CAG CCC ACA ACT TGT AGT CCT 115178 Ser Gln Phe Thr Pro Gln Gln Pro Gln Gln Pro Thr Thr Cys Ser Pro 931152 CAA CAG CCA GGG GAG CAG GGT TCT GAG CAA GGT TCA ACC AGT CAA GAA 119994 Gln Gln Pro Gly Glu Gln Gly Ser Glu Gln Gly Ser Thr Ser Gln Glu 1091200 CAG GCC TTA TCT GCT CAG CAA GCT GCT GTT ATT AAC CTT ACT GGA GTA 1247110 Gln Ala Leu Ser Ala Gln Gln Ala Ala Val Ile Asn Leu Thr Gly Val 1251248 GGA AGT TTT ATG CAG TCA CAG GCA GCT GTG TTG TCT CAG CTT GGC TCT 1295126 Gly Ser Phe Met Gln Ser Gln Ala Ala Val Leu Ser Gln Leu Gly Ser 1411296 GCC GAG AAC AGA CCT GAG CAA AGC CTT CCT CAG CAG AGA TTC CAG CTC1343142 Ala Glu Asn Arg Pro Glu Gln Ser Leu Pro Gln Gln Arg Phe Gln Leu 1571344 TCC TCT GCC TTT CAA CAG CAG CAG CAA CAG ATA CAA CAG TTG CGA TTC1391158 Ser Ser Ala Phe Gln Gln Gln Gln Gln Gln Ile Gln Gln Leu Arg Phe 1731392 TTG CAG CAT CAA ATG GCT ATG GCA GCA GCA GCA GCA CAA ACA GCT CAG1439174 Leu Gln His Gln Met Ala Met Ala Ala Ala Ala Ala Gln Thr Ala Gln 1891440 CTA CAT CAT CAT CGG CAT ACA GGC AGC CAG TCA AAA AGT AAA ATG AAG1487190 Leu His His His Arg His Thr Gly Ser Gln Ser Lys Ser Lys Met Lys 2051488 AGA GGC ATG CCA ACC ACT CCA AAA TTT TGA GTC TTG CAT TAC TTT TTG1535206 Arg Gly Met Pro Thr Thr Pro Lys Phe *** 2151536 TTC CTT TTT TAA AAA CAC AAG AGC ACT GAA TCA AAA GAA TTG AGT TTC15831584 TAC TTT TTG TTT TTT TTA ATG TGT CAG TAT TTT ACA TTG CTA GAT GTA16311632 CAA ACT TTA TAC AGA AGC ACA ACC TTA TCA TTT TTA AAT AAA AAC AGG16791680 GAA ATG GTT TAA CAA ACT AGG GTT GGT TTG CCT AAG TCA TTG CTT TTT17271728 AAA AAT GGT TTC ACT ATA CAT AAT ATA TAT GGA AGT GAC CTA AGA AAT17751776 AAT AGA AAC ATC TTT CAG AAG AAT GTA GTT TGA TAT TTA TTT AGT ATA18231824 AAA CGT TTG TGC ACA GTG TTA ACA AAT ACA ATT TTT ACA AAT CTG TTT18711872 TGA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA19191920 AAA AAA AAA AAA A 193權利要求
1.一種分離的具有抑癌功能的人蛋白,其特征在于,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35、38;或其保守性變異多肽、或其活性片段、或其活性衍生物。
2.如權利要求1所述的多肽,其特征在于,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35、38。
3.一種分離的多核苷酸,其特征在于,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性;(a)編碼如權利要求1和2所述多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。
4.如權利要求3所述的多核苷酸,其特征在于,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35、38。
5.如權利要求3所述的多核苷酸,其特征在于,該多核苷酸的序列選自下組SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36、39的編碼區(qū)序列或全長序列。
6.一種載體,其特征在于,它含有權利要求3所述的多核苷酸。
7.一種遺傳工程化的宿主細胞,其特征在于,它是選自下組的一種宿主細胞(a)用權利要求6所述的載體轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞;(b)用權利要求3所述的多核苷酸轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞。
8.一種具有抑癌功能的人蛋白活性的多肽的制備方法,其特征在于,該方法包含(a)在適合表達具有抑癌功能的人蛋白的條件下,培養(yǎng)權利要求7所述的宿主細胞;(b)從培養(yǎng)物中分離出具有抑癌功能的人蛋白活性的多肽。
9.一種能與權利要求1所述的具有抑癌功能的人蛋白特異性結(jié)合的抗體。
10.一種藥物組合物,其特征在于,它含有安全有效量的權利要求1所述的多肽以及藥學上可接受的載體。
全文摘要
本發(fā)明公開了一類新的具有抑癌功能的人蛋白,編碼此多肽的多核苷酸和經(jīng)重組技術產(chǎn)生該多肽的方法。本發(fā)明還公開了此多肽用于治療多種疾病如癌癥等的方法。本發(fā)明還公開了抗此多肽的拮抗劑及其治療作用。本發(fā)明還公開了編碼這類新的具有抑癌功能的人蛋白的多核苷酸的用途。
文檔編號C12N15/10GK1403475SQ0112672
公開日2003年3月19日 申請日期2001年9月12日 優(yōu)先權日2001年9月12日
發(fā)明者顧健人, 楊勝利 申請人:上海新世界基因技術開發(fā)有限公司