專利名稱:具有抑制癌細胞生長功能的新的人蛋白及其編碼序列的制作方法
技術領域:
本發(fā)明屬于生物技術領域,具體地說,本發(fā)明涉及新的編碼具有抑癌功能的人蛋白的多核苷酸和此多核苷酸編碼的多肽。本發(fā)明還涉及此多核苷酸和多肽的用途和制備。
背景技術:
人基因組學研究目前是國際上的熱點,除人染色體DNA大規(guī)模測序,表達序列測序(EST)的方法外,還缺少從功能開始的篩選具有功能基因的高通量的方法。
癌癥是危害人類健康的主要疾病之一。為了有效地治療和預防腫瘤,目前人們已越來越關注腫瘤的基因治療。因此,本領域迫切需要開發(fā)研究具有抑癌功能的人蛋白及其激動劑/抑制劑。
發(fā)明內容
本發(fā)明的目的是提供一類新的具有抑癌功能的人蛋白多肽以及其片段、類似物和衍生物。
本發(fā)明的另一目的是提供編碼這些多肽的多核苷酸。
本發(fā)明的另一目的是提供生產這些多肽的方法以及該多肽和編碼序列的用途。
在本發(fā)明的第一方面,提供新穎的分離出的具有抑癌功能的蛋白多肽,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35;或其保守性變異多肽、或其活性片段、或其活性衍生物。
較佳地,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35。
在本發(fā)明的第二方面,提供了一種分離的多核苷酸,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。較佳地,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35。更佳地,該多核苷酸的序列選自下組SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36的編碼區(qū)序列或全長序列。
在本發(fā)明的第三方面,提供了含有上述多核苷酸的載體,以及被該載體轉化或轉導的宿主細胞或者被上述多核苷酸直接轉化或轉導的宿主細胞。
在本發(fā)明的第四方面,提供了制備具有抑癌功能的蛋白活性的多肽的制備方法,該方法包含(a)在適合表達具有抑癌功能的蛋白的條件下,培養(yǎng)上述被轉化或轉導的宿主細胞;(b)從培養(yǎng)物中分離出具有抑癌功能的蛋白活性的多肽。
在本發(fā)明的第五方面,提供了與上述的具有抑癌功能的蛋白多肽特異性結合的抗體。還提供了可用于檢測的核酸分子,它含有上述的多核苷酸中連續(xù)10個核苷酸至全長核苷酸,較佳地它含有連續(xù)的約10-800個核苷酸。
在本發(fā)明的第六方面,提供了一種藥物組合物,它含有安全有效量的本發(fā)明的具有抑癌功能的蛋白多肽以及藥學上可接受的載體。這些藥物組合物可治療癌癥以及細胞異常增殖等病癥。
本發(fā)明的其它方面由于本文的公開內容,對本領域的技術人員而言是顯而易見的。
具體實施例方式
本發(fā)明采用大規(guī)模cDNA克隆轉染癌細胞,在獲得具有抑癌作用的基礎上,經測序證明為新的基因,進一步得到全長cDNA克隆。DNA轉染試驗證明,本發(fā)明的具有抑癌功能的蛋白對癌細胞(肝癌細胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分離的”是指物質從其原始環(huán)境中分離出來(如果是天然的物質,原始環(huán)境即是天然環(huán)境)。如活體細胞內的天然狀態(tài)下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態(tài)中同存在的其他物質中分開,則為分離純化的。
如本文所用,“分離的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然與其相關的其它蛋白、脂類、糖類或其它物質。本領域的技術人員能用標準的蛋白質純化技術純化具有抑癌功能的蛋白。基本上純的多肽在非還原聚丙烯酰胺凝膠上能產生單一的主帶。
本發(fā)明的多肽可以是重組多肽、天然多肽、合成多肽,優(yōu)選重組多肽。本發(fā)明的多肽可以是天然純化的產物,或是化學合成的產物,或使用重組技術從原核或真核宿主(例如,細菌、酵母、高等植物、昆蟲和哺乳動物細胞)中產生。根據重組生產方案所用的宿主,本發(fā)明的多肽可以是糖基化的,或可以是非糖基化的。本發(fā)明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發(fā)明還包括具有抑癌功能的人蛋白的片段、衍生物和類似物。如本文所用,術語“片段”、“衍生物”和“類似物”是指基本上保持本發(fā)明的天然具有抑癌功能的人蛋白相同的生物學功能或活性的多肽。本發(fā)明的多肽片段、衍生物或類似物可以是(i)有一個或多個保守或非保守性氨基酸殘基(優(yōu)選保守性氨基酸殘基)被取代的多肽,而這樣的取代的氨基酸殘基可以是也可以不是由遺傳密碼編碼的,或(ii)在一個或多個氨基酸殘基中具有取代基團的多肽,或(iii)成熟多肽與另一個化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前導序列或分泌序列或用來純化此多肽的序列或蛋白原序列)。根據本文的教導,這些片段、衍生物和類似物屬于本領域熟練技術人員公知的范圍。
本發(fā)明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。以PP10187蛋白(在本申請中,蛋白質的命名采用其克隆編號)為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO3所示的編碼區(qū)序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”在本發(fā)明中是指編碼具有SEQ ID NO2的蛋白質,但與SEQ IDNO3所示的編碼區(qū)序列有差別的核酸序列。再以PP12104蛋白(在本申請中,蛋白質的命名采用其克隆編號)為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO6所示的編碼區(qū)序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”在本發(fā)明中是指編碼具有SEQ ID NO5的蛋白質,但與SEQ ID NO6所示的編碼區(qū)序列有差別的核酸序列。對于本發(fā)明的其他具有抑癌功能的蛋白,可依此類推。
編碼成熟多肽的多核苷酸包括只編碼成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術語“編碼多肽的多核苷酸”可以是包括編碼此多肽的多核苷酸,也可以是還包括附加編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的多肽或多肽的片段、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領域所知的,等位變異體是一個多核苷酸的替換形式,它可能是一個或多個核苷酸的取代、缺失或插入,但不會從實質上改變其編碼的多肽的功能。
本發(fā)明還涉及與上述的序列雜交且兩個序列之間具有至少50%,較佳地至少70%,更佳地至少80%相同性的多核苷酸。本發(fā)明特別涉及在嚴格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中,“嚴格條件”是指(1)在較低離子強度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時加有變性劑,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時才發(fā)生雜交。并且,可雜交的多核苷酸編碼的多肽與SEQ IDNO2所示的成熟多肽有相同的生物學功能(以PP10187蛋白為例)和活性。
本發(fā)明還涉及與上述的序列雜交的核酸片段。如本文所用,“核酸片段”的長度至少含15個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸以上。核酸片段可用于核酸的擴增技術(如PCR)以確定和/或分離編碼具有抑癌功能的蛋白的多聚核苷酸。
本發(fā)明中的多肽和多核苷酸優(yōu)選以分離的形式提供,更佳地被純化至均質。
本發(fā)明的DNA序列能用幾種方法獲得。例如,用本領域熟知的雜交技術分離DNA。這些技術包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源性核苷酸序列,和2)表達文庫的抗體篩選以檢出具有共同結構特征的克隆的DNA片段。
編碼具有抑癌功能的蛋白的特異DNA片段序列產生也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學合成DNA序列以獲得所需多肽的雙鏈DNA。
上述提到的方法中,分離基因組DNA最不常用。當需要的多肽產物的整個氨基酸序列已知時,DNA序列的直接化學合成是經常選用的方法。如果所需的氨基酸的整個序列不清楚時,DNA序列的直接化學合成是不可能的,選用的方法是cDNA序列的分離。分離感興趣的cDNA的標準方法是從高表達該基因的供體細胞分離mRNA并進行逆轉錄,形成質粒或噬菌體cDNA文庫。提取mRNA的方法已有多種成熟的技術,試劑盒也可從商業(yè)途徑獲得(Qiagene)。而構建cDNA文庫也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。還可得到商業(yè)供應的cDNA文庫,如Clontech公司的不同cDNA文庫。當結合使用聚合酶反應技術時,即使極少的表達產物也能克隆。
可用常規(guī)方法從這些cDNA文庫中篩選本發(fā)明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交;(2)標志基因的功能出現(xiàn)或喪失;(3)測定具有抑癌功能的蛋白的轉錄本的水平;(4)通過免疫學技術或測定生物學活性,來檢測基因表達的蛋白產物。上述方法可單用,也可多種方法聯(lián)合應用。
在第(1)種方法中,雜交所用的探針是與本發(fā)明的多核苷酸的任何一部分同源,其長度至少15個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸。此外,探針的長度通常在2kb之內,較佳地為1kb之內。此處所用的探針通常是在本發(fā)明的基因DNA序列信息的基礎上化學合成的DNA序列。本發(fā)明的基因本身或者片段當然可以用作探針。DNA探針的標記可用放射性同位素,熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中,檢測具有抑癌功能的蛋白基因表達的蛋白產物可用免疫學技術如Western印跡法,放射免疫沉淀法,酶聯(lián)免疫吸附法(ELISA)等。
應用PCR技術擴增DNA/RNA的方法(Saiki,et al.Science 1985;2301350-1354)被優(yōu)選用于獲得本發(fā)明的基因。特別是很難從文庫中得到全長的cDNA時,可優(yōu)選使用RACE法(RACE-cDNA末端快速擴增法),用于PCR的引物可根據本文所公開的本發(fā)明的序列信息適當地選擇,并可用常規(guī)方法合成??捎贸R?guī)方法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
如上所述得到的本發(fā)明的基因,或者各種DNA片段等的核苷酸序列的測定可用常規(guī)方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,745463-5467)。這類核苷酸序列測定也可用商業(yè)測序試劑盒等。為了獲得全長的cDNA序列,測序需反復進行。有時需要測定多個克隆的cDNA序列,才能拼接成全長的cDNA序列。
本發(fā)明也涉及包含本發(fā)明的多核苷酸的載體,以及用本發(fā)明的載體或具有抑癌功能的蛋白編碼序列經基因工程產生的宿主細胞,以及經重組技術產生本發(fā)明所述多肽的方法。
通過常規(guī)的重組DNA技術(Science,1984;2241431),可利用本發(fā)明的多聚核苷酸序列可用來表達或生產重組的具有抑癌功能的蛋白多肽。一般來說有以下步驟(1).用本發(fā)明的編碼具有抑癌功能的人蛋白的多核苷酸(或變異體),或用含有該多核苷酸的重組表達載體轉化或轉導合適的宿主細胞;(2).在合適的培養(yǎng)基中培養(yǎng)的宿主細胞;(3).從培養(yǎng)基或細胞中分離、純化蛋白質。
本發(fā)明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重組表達載體中。術語“重組表達載體”指本領域熟知的細菌質粒、噬菌體、酵母質粒、植物細胞病毒、哺乳動物細胞病毒如腺病毒、逆轉錄病毒或其他載體。在本發(fā)明中適用的載體包括但不限于在細菌中表達的基于T7的表達載體(Rosenberg,et al.Gene,1987,56125);在哺乳動物細胞中表達的pMSXND表達載體(Lee and Nathans,J Bio Chem.2633521,1988)和在昆蟲細胞中表達的來源于桿狀病毒的載體??傊灰茉谒拗黧w內復制和穩(wěn)定,任何質粒和載體都可以用。表達載體的一個重要特征是通常含有復制起點、啟動子、標記基因和翻譯控制元件。
本領域的技術人員熟知的方法能用于構建含具有抑癌功能的人蛋白編碼DNA序列和合適的轉錄/翻譯控制信號的表達載體。這些方法包括體外重組DNA技術、DNA合成技術、體內重組技術等(Sambroook,et al.)。所述的DNA序列可有效連接到表達載體中的適當啟動子上,以指導mRNA合成。這些啟動子的代表性例子有大腸桿菌的lac或trp啟動子;λ噬菌體PL啟動子;真核啟動子包括CMV立即早期啟動子、早期和晚期SV40啟動子、反轉錄病毒的LTRs和其他一些已知的可控制基因在原核或真核細胞或其病毒中表達的啟動子。表達載體還包括翻譯起始用的核糖體結合位點和轉錄終止子。
此外,表達載體優(yōu)選地包含一個或多個選擇性標記基因,以提供用于選擇轉化的宿主細胞的表型性狀,如真核細胞培養(yǎng)用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP),或用于大腸桿菌的四環(huán)素或氨芐青霉素抗性。
包含上述的適當DNA序列以及適當啟動子或者控制序列的載體,可以用于轉化適當的宿主細胞,以使其能夠表達蛋白質。
宿主細胞可以是原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高等真核細胞,如哺乳動物細胞。代表性例子有大腸桿菌,鏈霉菌屬;鼠傷寒沙門氏菌的細菌細胞;真菌細胞如酵母;植物細胞;果蠅S2或Sf9的昆蟲細胞;CHO、COS或Bowes黑素瘤細胞的動物細胞等。
本發(fā)明的多核苷酸在高等真核細胞中表達時,如果在載體中插入增強子序列時將會使轉錄得到增強。增強子是DNA的順式作用因子,通常大約有10到300個堿基對,作用于啟動子以增強基因的轉錄??膳e的例子包括在復制起始點晚期一側的100到270個堿基對的SV40增強子、在復制起始點晚期一側的多瘤增強子以及腺病毒增強子等。
本領域一般技術人員都清楚如何選擇適當的載體、啟動子、增強子和宿主細胞。
用重組DNA轉化宿主細胞可用本領域技術人員熟知的常規(guī)技術進行。當宿主為原核生物如大腸桿菌時,能吸收DNA的感受態(tài)細胞可在指數生長期后收獲,用CaCl2法處理,所用的步驟在本領域眾所周知??晒┻x擇的是用MgCl2。如果需要,轉化也可用電穿孔的方法進行。當宿主是真核生物,可選用如下的DNA轉染方法磷酸鈣共沉淀法,常規(guī)機械方法如顯微注射、電穿孔、脂質體包裝等。
獲得的轉化子可以用常規(guī)方法培養(yǎng),表達本發(fā)明的基因所編碼的多肽。根據所用的宿主細胞,培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細胞生長的條件下進行培養(yǎng)。當宿主細胞生長到適當的細胞密度后,用合適的方法(如溫度轉換或化學誘導)誘導選擇的啟動子,將細胞再培養(yǎng)一段時間。
在上面的方法中的重組多肽可包被于細胞內、細胞外或在細胞膜上表達或分泌到細胞外。如果需要,可利用其物理的、化學的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領域技術人員所熟知的。這些方法的例子包括但并不限于常規(guī)的復性處理、用蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術及這些方法的結合。
重組的具有抑癌功能的人蛋白或多肽有多方面的用途。這些用途包括(但不限于)直接做為藥物治療具有抑癌功能的蛋白功能低下或喪失所致的疾病(如癌癥),和用于篩選促進或對抗具有抑癌功能的蛋白功能的抗體、多肽或其它配體。例如,抗體可用于激活或抑制具有抑癌功能的人蛋白的功能。用表達的重組具有抑癌功能的人蛋白篩選多肽庫可用于尋找有治療價值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本發(fā)明也提供了篩選藥物以鑒定提高(激動劑)或阻遏(拮抗劑)具有抑癌功能的人蛋白的藥劑的方法。激動劑提高具有抑癌功能的人蛋白刺激細胞增殖等生物功能,而拮抗劑阻止和治療與細胞過度增殖有關的紊亂如各種癌癥。例如,能在藥物的存在下,將哺乳動物細胞或表達具有抑癌功能的人蛋白的膜制劑與標記的具有抑癌功能的人蛋白一起培養(yǎng)。然后測定藥物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。所述的拮抗劑可以與具有抑癌功能的人蛋白結合并消除其功能,或是抑制具有抑癌功能的人蛋白的產生,或是與多肽的活性位點結合使多肽不能發(fā)揮生物學功能。具有抑癌功能的人蛋白的拮抗劑可用于治療用途。
在篩選作為拮抗劑的化合物時,可以將本發(fā)明蛋白加入生物分析測定中,通過測定化合物影響具有抑癌功能的蛋白和其受體之間的相互作用來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。
本發(fā)明的多肽可直接用于疾病治療,例如,各種惡性腫瘤、和細胞異常增殖等。
本發(fā)明的多肽,及其片段、衍生物、類似物或它們的細胞可以用來作為抗原以生產抗體。這些抗體可以是多克隆或單克隆抗體。多克隆抗體可以通過將此多肽直接注射動物的方法得到。制備單克隆抗體的技術包括雜交瘤技術,三瘤技術,人B-細胞雜交瘤技術,EBV-雜交瘤技術等。
可以將本發(fā)明的多肽和拮抗劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發(fā)明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發(fā)明的藥用組合物成分。與這些容器一起,可以有由制造、使用或銷售藥品或生物制品的政府管理機構所給出的指示性提示,該提示反映出生產、使用或銷售的政府管理機構許可其在人體上施用。此外,本發(fā)明的多肽可以與其它的治療化合物結合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內、腹膜內、肌內、皮下、鼻內或皮內的給藥途徑。具有抑癌功能的蛋白以有效地治療和/或預防具體的適應癥的量來給藥。施用于患者的具有抑癌功能的蛋白的量和劑量范圍將取決于許多因素,如給藥方式、待治療者的健康條件和診斷醫(yī)生的判斷。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多種治療目的。基因治療技術可用于治療由于具有抑癌功能的蛋白的無表達或異常/無活性的具有抑癌功能的蛋白的表達所致的細胞增殖、發(fā)育或代謝異常。重組的基因治療載體可用于治療具有抑癌功能的蛋白表達或活性異常所致的疾病。來源于病毒的表達載體如逆轉錄病毒、腺病毒、腺病毒相關病毒、單純皰疹病毒、細小病毒等可用于將具有抑癌功能的蛋白基因轉移至細胞內。構建攜帶具有抑癌功能的蛋白基因的重組病毒載體的方法可見于已有文獻(Sambrook,etal.)。另外重組具有抑癌功能的人蛋白基因可包裝到脂質體中轉移至細胞內。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反義RNA和DNA)以及核酶也在本發(fā)明的范圍之內。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機制是核酶分子與互補的靶RNA特異性雜交后進行核酸內切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術獲得,如固相磷酸酰胺化學合成法合成寡核苷酸的技術已廣泛應用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內轉錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動子的下游。為了增加核酸分子的穩(wěn)定性,可用多種方法對其進行修飾,如增加兩側的序列長度,核糖核苷之間的連接應用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
多聚核苷酸導入組織或細胞內的方法包括將多聚核苷酸直接注入到體內組織中;或在體外通過載體(如病毒、噬菌體或質粒等)先將多聚核苷酸導入細胞中,再將細胞移植到體內等。
本發(fā)明的多肽還可用作肽譜分析,例如,多肽可用物理的、化學或酶進行特異性切割,并進行一維或二維或三維的凝膠電泳分析。
本發(fā)明還提供了針對具有抑癌功能的人蛋白抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達文庫產生的片段。這些抗體可用常規(guī)方法制備。抗具有抑癌功能的人蛋白的抗體可用于免疫組織化學技術中,檢測活檢標本中的具有抑癌功能的人蛋白。
與具有抑癌功能的人蛋白結合的單克隆抗體也可用放射性同位素標記,注入體內可跟蹤其位置和分布。本發(fā)明中的抗體可用于治療或預防與具有抑癌功能的人蛋白相關的疾病。給予適當劑量的抗體可以刺激或阻斷具有抑癌功能的人蛋白的產生或活性。
抗體也可用于設計針對體內某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高親和性的單克隆抗體可與細菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價結合。
多克隆抗體的生產可用具有抑癌功能的人蛋白或多肽免疫動物,如家兔,小鼠,大鼠等。多種佐劑可用于增強免疫反應,包括但不限于弗氏佐劑等。
具有抑癌功能的人蛋白單克隆抗體可用雜交瘤技術生產(Kohler and Milstein.Nature,1975,256495-497)。將人恒定區(qū)和非人源的可變區(qū)結合的嵌合抗體可用已有的技術生產(Morrison et al,PNAS,1985,816851)。而已有的生產單鏈抗體的技術(U.S.PatNo.4946778)也可用于生產抗具有抑癌功能的人蛋白的單鏈抗體。
能與本發(fā)明蛋白結合的多肽分子可通過篩選由各種可能組合的氨基酸結合于固相物組成的隨機多肽庫而獲得。篩選時,必須對具有抑癌功能的人蛋白分子進行標記。
本發(fā)明還涉及定量和定位檢測具有抑癌功能的人蛋白水平的診斷試驗方法。這些試驗是本領域所熟知的,且包括FISH測定和放射免疫測定。試驗中所檢測的具有抑癌功能的人蛋白水平,可以用作解釋具有抑癌功能的人蛋白在各種疾病中的重要性和用于診斷具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相關疾病的診斷和治療。在診斷方面,具有抑癌功能的蛋白的多聚核苷酸可用于檢測具有抑癌功能的蛋白的表達與否或在疾病狀態(tài)下具有抑癌功能的蛋白的異常表達。如具有抑癌功能的蛋白DNA序列可用于對活檢標本的雜交以判斷具有抑癌功能的蛋白的表達異常。雜交技術包括Southern印跡法,Northern印跡法、原位雜交等。這些技術方法都是公開的成熟技術,相關的試劑盒都可從商業(yè)途徑得到。本發(fā)明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為“基因芯片”)上,用于分析組織中基因的差異表達分析和基因診斷。用具有抑癌功能的蛋白特異的引物進行RNA-聚合酶鏈反應(RT-PCR)體外擴增也可檢測具有抑癌功能的蛋白的轉錄產物。
檢測具有抑癌功能的蛋白基因的突變也可用于診斷具有抑癌功能的蛋白相關的疾病。具有抑癌功能的蛋白突變的形式包括與正常野生型具有抑癌功能的蛋白DNA序列相比的點突變、易位、缺失、重組和其它任何異常等??捎靡延械募夹g如Southern印跡法、DNA序列分析、PCR和原位雜交檢測突變。另外,突變有可能影響蛋白的表達,因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發(fā)明的序列對染色體鑒定也是有價值的。這些序列會特異性地針對某條人染色體具體位置且并可以與其雜交。目前,需要鑒定染色體上的各基因的具體位點。然而現(xiàn)在只有很少的基于實際序列數據(重復多態(tài)性)的染色體標記物可用于標記染色體位置。為了將這些序列與疾病相關基因相關聯(lián)。第一步就是將本發(fā)明DNA序列定位于染色體上。
簡而言之,根據cDNA制備PCR引物(優(yōu)選15-35bp),可以將序列定位于染色體上。然后,將這些引物用于PCR篩選含各條人染色體的體細胞雜合細胞。只有那些含有相應于引物的人基因的雜合細胞會產生擴增的片段。
體細胞雜合細胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發(fā)明的的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實現(xiàn)亞定位??捎糜谌旧w定位的其它類似策略包括原位雜交、用標記的流式分選的染色體預篩選和雜交預選,從而構建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進行熒光原位雜交(FISH),可以在一個步驟中精確地進行染色體定位。此技術的綜述,參見Verma等,Human Chromosomesa Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到準確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數據相關聯(lián)。這些數據可見于例如,V.Mckusick,Mendelian Inheritance in Man(可通過與Johns Hopkins University Welch Medical Library聯(lián)機獲得)。然后可通過連鎖分析,確定基因與業(yè)已定位到染色體區(qū)域上的疾病之間的關系。
接著,需要測定患病和未患病個體間的cDNA或基因組序列差異。如果在一些或所有的患病個體中觀察到某突變,而該突變在任何正常個體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個體,通常涉及首先尋找染色體中結構的變化,如從染色體水平可見的或用基于cDNA序列的PCR可檢測的缺失或易位。
本發(fā)明的具有抑癌功能的蛋白核苷酸全長序列或其片段通??梢杂肞CR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據本發(fā)明所公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按本領域技術人員已知的常規(guī)方法所制備的cDNA庫作為模板,擴增而得有關序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉入細胞,然后通過常規(guī)方法從增殖后的宿主細胞中分離得到有關序列。
此外,還可用人工合成的方法來合成有關序列,尤其是片段長度較短時。通常,通過先合成多個小片段,然后再進行連接可獲得序列很長的片段。
目前,已經可以完全通過化學合成來編碼本發(fā)明蛋白(或其片段,或其衍生物)的DNA序列。然后可將該DNA序列引入本領域中的各種DNA分子(如載體)和細胞中。此外,還可通過化學合成將突變引入本發(fā)明蛋白序列中。
此外,由于本發(fā)明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,與來源于其他物種的同族蛋白相比,預計在施用于人時將具有更高的活性和/或更低的副作用(例如在人體內的免疫原性更低或沒有)。
下面結合具體實施例,進一步闡述本發(fā)明。應理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(New YorkCold Spring Harbor LaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1cDNA基因的獲得及對癌細胞克隆形成的抑制作用PP10187、PP12104、PP12585、PP14397、PP14434和PP14630是通過用常規(guī)方法構建人胎盤cDNA文庫獲得的;FP248、FP291、FP633、FP782、FP793和FP944是通過用常規(guī)方法構建人胎兒cDNA文庫獲得的。取3、6、9月齡的胎盤組織(PP克隆)或胎兒組織(FP克隆),用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文庫構建試劑盒(Stratagene公司)構建上述mRNA的cDNA文庫。其中反轉錄酶改用MMLV-RT-Superscript II(GIBCO BRL),反轉錄反應在42℃進行。轉化XL 10-Gold感受細胞,獲得了1×106cfu/μg cDNA滴度的cDNA文庫。第一輪隨機挑取cDNA克隆,其后以高豐度cDNA克隆和已證明有抑癌細胞生長功能的cDNA克隆為探針,雜交篩選cDNA文庫,挑取弱陽性及陰性克隆。用Qiagen 96孔板質粒抽提試劑盒,按廠家說明書進行質粒DNA的提取。質粒DNA和空載體同時轉染肝癌細胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待轉染。每份DNA樣品中加0.74μl脂質體及9.3μl無血清培液,混勻后,室溫放置10分鐘。每管中加150μl無血清培液,均分加入3孔生長于96孔板的7721細胞中,37℃放置2小時,每孔再加50μl無血清培液,37℃24小時。每孔換100μl全培液,37℃24小時,換含G418的全培液100μl,37℃24-48小時,邊觀察,邊換G418濃度不等的培液。約2-3次后,直到鏡檢細胞有克隆形成,計數。發(fā)現(xiàn)上述克隆有抑制癌細胞克隆形成作用,結果如下表所示。
cDNA克隆轉染細胞(7721)克隆形成情況
對cDNA克隆采用雙脫氧終止法,在ABI377 DNA自動測序儀上測定其一端近500bp的核苷酸序列。分析后,確定為新基因克隆,進行另一端測序,仍未獲得全長cDNA序列,設計引物,再次進行測序,直到獲得全長序列(SEQ ID NO1、4、7、10、13、16、19、22、25、28、31、34)。
實施例2從胎盤或胎兒cDNA中PCR獲得全長基因取3、6、9月齡的胎盤組織(PP克隆)或胎兒組織(FP克隆),用Trizol試劑(GIBCOBRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript II(GIBCO BRL),反轉錄酶在42℃進行反轉錄反應,獲得胎盤或胎兒cDNA。利用各個基因的特異引物(如下表所示),按97℃3′1個循環(huán)。94℃30″60℃ 30″72℃ 1’35個循環(huán),72℃10’1個循環(huán)進行PCR擴增,獲得含有完整開放閱讀框序列的各蛋白基因的擴增產物。擴增產物經測序驗證,與實施例1測得的序列相符,隨后用常規(guī)技術將擴增產物轉入宿主細胞,獲得重組蛋白(SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35)。
基因特異引物
實施例3cDNA克隆序列分析1.PP10187A核苷酸序列(SEQ ID NO1)長度1902個堿基1 GCGCGGCCGG GGCGGAGACT TCGGGCCCGG CTGGCGGGCG GCGCCGGGAG CGCGGGGGCG61 GCGGGCCCGG GTCGAGCATG TAGCGGCTGC TGGCGGCGGG GCTCCCGGGG CGGGCCGGGC121 GGGCCGCGGG AGCCGCACGC GGCGATATGG AAGAGGAGGG CAAGAAGGGC AAGAAGCCTG181 GAATTGTCTC GCCATTTAAA CGAGTATTCC TAAAAGGTGA AAAGAGTAGA GATAAGAAAG241 CCCATGAGAA GGTGACAGAG AGGCGCCCTC TGCACACTGT GGTGTTGTCA TTGCCTGAGC301 GCGTCGAGCC AGACAGACTG CTGAGCGACT ATATTGAGAA GGAGGTAAAG TATTTAGGTC361 AGTTAACGTC CATACCAGGA TACCTGAATC CCTCCAGTAG GACTGAAATC CTGCATTTCA421 TAGACAATGC AAAGAGAGCC CACCAGCTTC CGGGACACTT GACTCAGGAG CACGATGCTG481 TGCTCAGCCT GTCTGCGTAC AACGTCAAGC TGGCCTGGAG GGACGGGGAG GATATCATCC541 TCAGGGTGCC CATCCATGAC ATCGCCGCCG TCTCCTATGT TCGGGATGAC GCTGCACACC601 TGGTGGTCCT GAAGACAGCC CAGGACCCAG GGATCTCCCC CAGCCAGAGT CTGTGTGCGG661 AAAGTTCCAG AGGCCTCAGT GCAGGCTCCC TGTCGGAGAG TGCAGTTGGG CCCGTGGAGG721 CATGCTGCCT GGTCATCCTG GCTGCAGAGA GCAAGGTCGC TGCGGAGGAG CTTTGCTGTC781 TGCTAGGCCA GGTCTTCCAG GTTGTTTACA CGGAGTCCAC CATCGACTTT CTGGACAGAG841 CGATATTTGA TGGGGCCTCT ACCCCGACCC ACCACCTGTC CCTGCACAGC GATGACTCTT901 CTACAAAAGT GGACATTAAG GAGACCTACG AGGTGGAAGC CAGCACTTTC TGCTTCCCTG961 AATCTGTGGA TGTGGGTGGT GCATCACCCC ACAGCAAGAC CATCAGTGAG AGCGAGCTGA1021 GCGCCAGCGC CACTGAGCTG CTGCAGGACT ACATGCTGAC GCTGCGCACC AAGCTGTCAT1081 CACAGGAGAT CCAGCAGTTT GCAGCACTGC TGCACGAGTA CCGCAATGGG GCCTCTATCC1141 ACGAGTTCTG CATCAACCTG CGGCAGCTCT ACGGGGACAG CCGCAAGTTC CTGCTGCTTG1201 GTCTGAGGCC CTTCATCCCT GAGAAGGACA GCCAGCACTT CGAGAACTTC CTGGAGACCA1261 TTGGCGTGAA GGATGGCCGC GGCATCATCA CTGACAGCTT TGGCAGGCAC CGGCGGGCCC1321 TGAGCACCAC ATCCAGTTCC ACCACCAATG GGAACAGGGC CACGGGCAGC TCTGATGACC1381 GGTCGGCACC CTCAGAGGGG GATGAGTGGG ACCGCATGAT CTCGGACATC AGCAGCGACA1441 TTGAGGCGCT GGGCTGCAGC ATGGCCCAGG ACTCAGCATT ATGGACAGTG GATGGGGGGG1501 CACCCACACC TTCCGCGCAG TTGTCATAGG CCTTCCCAAA AGGAGCTGCC CAGACCTGGG1561 TGTCAGCCCT TGGTGGTGGC CAGGGAAAGG CGCCCGGTGC AAATGGCCCC GGGCGGCCCA1621 GGTCCTTTAC TGTGAAGGAG CAGGGAGCTG CCGAGGGACA CGAGCCTCAG TGCGGGGTGG1681 AAGGCTTTTT GCCTTGTCCA CCAGGGGTCA GCCAAGCCCT GCAGTGTGTC CCCGCTCGGG1741 GAGGGCCCGG CCGAGCGGGC AGGGAAAACC AGTCCTGTCG GCTGGGCCCT TGGACGGCTG1801 TCAGTTTTGC ACATGATGTT CCTATTGTAA CTCTCAGAGA CCTTAAAAAA AAGTTTACTG1861 CAATGTTAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAB核苷酸序列(SEQ ID NO2) 長度460個氨基酸1 MEEEGKKGKK PGIVSPFKRV FLKGEKSRDK KAHEKVTERR PLHTVVLSLP ERVEPDRLLS61 DYIEKEVKYL GQLTSIPGYL NPSSRTEILH FIDNAKRAHQ LPGHLTQEHD AVLSLSAYNV121 KLAWRDGEDI ILRVPIHDIA AVSYVRDDAA HLVVLKTAQD PGISPSQSLC AESSRGLSAG181 SLSESAVGPV EACCLVILAA ESKVAAEELC CLLGQVFQVV YTESTIDFLD RAIFDGASTP241 THHLSLHSDD SSTKVDIKET YEVEASTFCF PESVDVGGAS PHSKTISESE LSASATELLQ301 DYMLTLRTKL SSQEIQQFAA LLHEYRNGAS IHEFCINLRQ LYGDSRKFLL LGLRPFIPEK361 DSQHFENFLE TIGVKDGRGI ITDSFGRHRR ALSTTSSSTT NGNRATGSSD DRSAPSEGDE421 WDRMISDISS DIEALGCSMA QDSALWTVDG GAPTPSAQLSC.核苷酸及氨基酸組合序列(SEQ ID NO3)克隆號PP10187起始編碼子147 ATG 終止編碼子1527 TAG 蛋白質分子量50371.67(注(1)給出的是起始和終止編碼子第一個核苷酸的位置,(2)分子量單位是道爾頓)1 GC GCG GCC GGG GCG GAG ACT TCG GGC CCG GCT GGC GGG CGG CGC CGG 4748 GAG CGC GGG GGC GGC GGG CCC GGG TCG AGC ATG TAG CGG CTG CTG GCG 9596 GCG GGG CTC CCG GGG CGG GCC GGG CGG GCC GCG GGA GCC GCA CGC GGC143144 GAT ATG GAA GAG GAG GGC AAG AAG GGC AAG AAG CCT GGA ATT GTC TCG1911 Met Glu Glu Glu Gly Lys Lys Gly Lys Lys Pro Gly Ile Val Ser 15192 CCA TTT AAA CGA GTA TTC CTA AAA GGT GAA AAG AGT AGA GAT AAG AAA23916 Pro Phe Lys Arg Val Phe Leu Lys Gly Glu Lys Ser Arg Asp Lys Lys 31240 GCC CAT GAG AAG GTG ACA GAG AGG CGC CCT CTG CAC ACT GTG GTG TTG28732 Ala His Glu Lys Val Thr Glu Arg Arg Pro Leu His Thr Val Val Leu 47288 TCA TTG CCT GAG CGC GTC GAG CCA GAC AGA CTG CTG AGC GAC TAT ATT33548 Ser Leu Pro Glu Arg Val Glu Pro Asp Arg Leu Leu Ser Asp Tyr Ile 63336 GAG AAG GAG GTA AAG TAT TTA GGT CAG TTA ACG TCC ATA CCA GGA TAC38364 Glu Lys Glu Val Lys Tyr Leu Gly Gln Leu Thr Ser Ile Pro Gly Tyr 79384 CTG AAT CCC TCC AGT AGG ACT GAA ATC CTG CAT TTC ATA GAC AAT GCA43180 Leu Asn Pro Ser Ser Arg Thr Glu Ile Leu His Phe Ile Asp Asn Ala 95432 AAG AGA GCC CAC CAG CTT CCG GGA CAC TTG ACT CAG GAG CAC GAT GCT47996 Lys Arg Ala His Gln Leu Pro Gly His Leu Thr Gln Glu His Asp Ala111480 GTG CTC AGC CTG TCT GCG TAC AAC GTC AAG CTG GCC TGG AGG GAC GGG527112 Val Leu Ser Leu Ser Ala Tyr Asn Val Lys Leu Ala Trp Arg Asp Gly127528 GAG GAT ATC ATC CTC AGG GTG CCC ATC CAT GAC ATC GCC GCC GTC TCC575128 Glu Asp Ile Ile Leu Arg Val Pro Ile His Asp Ile Ala Ala Val Ser143576 TAT GTT CGG GAT GAC GCT GCA CAC CTG GTG GTC CTG AAG ACA GCC CAG623144 Tyr Val Arg Asp Asp Ala Ala His Leu Val Val Leu Lys Thr Ala Gln159624 GAC CCA GGG ATC TCC CCC AGC CAG AGT CTG TGT GCG GAA AGT TCC AGA671160 Asp Pro Gly Ile Ser Pro Ser Gln Ser Leu Cys Ala Glu Ser Ser Arg175672 GGC CTC AGT GCA GGC TCC CTG TCG GAG AGT GCA GTT GGG CCC GTG GAG719176 Gly Leu Ser Ala Gly Ser Leu Ser Glu Ser Ala Val Gly Pro Val Glu191720 GCA TGC TGC CTG GTC ATC CTG GCT GCA GAG AGC AAG GTC GCT GCG GAG767192 Ala Cys Cys Leu Val Ile Leu Ala Ala Glu Ser Lys Val Ala Ala Glu207768 GAG CTT TGC TGT CTG CTA GGC CAG GTC TTC CAG GTT GTT TAC ACG GAG815208 Glu Leu Cys Cys Leu Leu Gly Gln Val Phe Gln Val Val Tyr Thr Glu223816 TCC ACC ATC GAC TTT CTG GAC AGA GCG ATA TTT GAT GGG GCC TCT ACC863224 Ser Thr Ile Asp Phe Leu Asp Arg Ala Ile Phe Asp Gly Ala Ser Thr239864 CCG ACC CAC CAC CTG TCC CTG CAC AGC GAT GAC TCT TCT ACA AAA GTG911240 Pro Thr His His Leu Ser Leu His Ser Asp Asp Ser Ser Thr Lys Val255912 GAC ATT AAG GAG ACC TAC GAG GTG GAA GCC AGC ACT TTC TGC TTC CCT 959256 Asp Ile Lys Glu Thr Tyr Glu Val Glu Ala Ser Thr Phe Cys Phe Pro 271960 GAA TCT GTG GAT GTG GGT GGT GCA TCA CCC CAC AGC AAG ACC ATC AGT1007272 Glu Ser Val Asp Val Gly Gly Ala Ser Pro His Ser Lys Thr Ile Ser 2871008 GAG AGC GAG CTG AGC GCC AGC GCC ACT GAG CTG CTG CAG GAC TAC ATG1055288 Glu Ser Glu Leu Ser Ala Ser Ala Thr Glu Leu Leu Gln Asp Tyr Met 3031056 CTG ACG CTG CGC ACC AAG CTG TCA TCA CAG GAG ATC CAG CAG TTT GCA1103304 Leu Thr Leu Arg Thr Lys Leu Ser Ser Gln Glu Ile Gln Gin Phe Ala 3191104 GCA CTG CTG CAC GAG TAC CGC AAT GGG GCC TCT ATC CAC GAG TTC TGC1151320 Ala Leu Leu His Glu Tyr Arg Asn Gly Ala Ser Ile His Glu Phe Cys 3351152 ATC AAC CTG CGG CAG CTC TAC GGG GAC AGC CGC AAG TTC CTG CTG CTT1199336 Ile Asn Leu Arg Gln Leu Tyr Gly Asp Ser Arg Lys Phe Leu Leu Leu 3511200 GGT CTG AGG CCC TTC ATC CCT GAG AAG GAC AGC CAG CAC TTC GAG AAC1247352 Gly Leu Arg Pro Phe Ile Pro Glu Lys Asp Ser Gln His Phe Glu Asn 3671248 TTC CTG GAG ACC ATT GGC GTG AAG GAT GGC CGC GGC ATC ATC ACT GAC1295368 Phe Leu Glu Thr Ile Gly Val Lys Asp Gly Arg Gly Ile Ile Thr Asp 3831296 AGC TTT GGC AGG CAC CGG CGG GCC CTG AGC ACC ACA TCC AGT TCC ACC1343384 Ser Phe Gly Arg His Arg Arg Ala Leu Ser Thr Thr Ser Ser Ser Thr 3991344 ACC AAT GGG AAC AGG GCC ACG GGC AGC TCT GAT GAC CGG TCG GCA CCC1391400 Thr Asn Gly Asn Arg Ala Thr Gly Ser Ser Asp Asp Arg Ser Ala Pro 4151392 TCA GAG GGG GAT GAG TGG GAC CGC ATG ATC TCG GAC ATC AGC AGC GAC1439416 Ser Glu Gly Asp Glu Trp Asp Arg Met Ile Ser Asp Ile Ser Ser Asp 4311440 ATT GAG GCG CTG GGC TGC AGC ATG GCC CAG GAC TCA GCA TTA TGG ACA1487432 Ile Glu Ala Leu Gly Cys Ser Met Ala Gln Asp Ser Ala Leu Trp Thr 4471488 GTG GAT GGG GGG GCA CCC ACA CCT TCC GCG CAG TTG TCA TAG GCC TTC1535448 Val Asp Gly Gly Ala Pro Thr Pro Ser Ala Gln Leu Ser *** 4611536 CCA AAA GGA GCT GCC CAG ACC TGG GTG TCA GCC CTT GGT GGT GGC CAG15831584 GGA AAG GCG CCC GGT GCA AAT GGC CCC GGG CGG CCC AGG TCC TTT ACT16311632 GTG AAG GAG CAG GGA GCT GCC GAG GGA CAC GAG CCT CAG TGC GGG GTG16791680 GAA GGC TTT TTG CCT TGT CCA CCA GGG GTC AGC CAA GCC CTG CAG TGT17271728 GTC CCC GCT CGG GGA GGG CCC GGC CGA GCG GGC AGG GAA AAC CAG TCC17751776 TGT CGG CTG GGC CCT TGG ACG GCT GTC AGT TTT GCA CAT GAT GTT CCT18231824 ATT GTA ACT CTC AGA GAC CTT AAA AAA AAG TTT ACT GCA ATG TTA AAA18711872 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA A 19022.PP12104A核苷酸序列(SEQ ID NO4)長度884個堿基1 GGCCGTGGAG GCTCCAGGTG TTCTCTCTGC CCCAGCAGAG CCCGGCAGGA GCCCCAACAG61 GAAGCCAGCG CGGCATGGCT GCCACCGACT TCGTGCAGGA GATGCGCGCC GTGGGCGAGA121 GGCTGCTGCT CAAGCTGCAG AGACTGCCCC AGGCTGAGCC CGTGGAGATC GTGGCCTTCT181 CAGTCATCAT CCTTTTCACA GCTACTGTTC TGCTGTTGCT GCTGATAGCC TGCAGCTGCT241 GCTGCACTCA CTGCTGCTGC CCTGAGCGGA GAGGCAGGAA GGTCCAGGTG CAGCCGACAC301 CACCATGACG GACGGGCGAT GGCTGAGGAG AAGCTGGAGA GGAGATGGCC AATGCCATGA361 CACAGGCCAT CAGCCTGGCC CTGCAGCCCT TACCCCTCAA GACCAGGCTC CCCTGGCCCC421 AGCTCTGGCC CAGCCCAGGT ACCTGGACAC TGACAACTTG AGCCCTACCA AGGAAACAAG481 GGCTGGTATA GGTGCAAACC TCTCATCTGC CAGTGGACAC TGGGTGCTGG GGAGTCAGCT
541 GTTTCAAAGA CTGGGTCAAC TGCCTGGGCT TCTTCGCCTA CCTGCACTTT TTAACAAAAC601 AAGGAAGTAG GGGTCCCCAT ACCTTGATGG AGAACAGTCC CCACCTGTGG GCAATTGGCC661 CTTGGGGCTC TGCTGATACA TGCCAAAGAG GAGCAAGGCA ATCAGAGGGG CTTTGTGCAA721 TAGCTTCTGC ATCCGAGCTC CCGCCAGAGC GTGAGCATGT CAGTATTCTA GTCCAGTATT781 TGCCAGTTTC CAAGTAAAAG CTTTTGTGTT ACGTGAAAAA AAAAAAAAAA AAAAAAAAAA841 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAB核苷酸序列 (SEQ ID NO5) 長度101個氨基酸1 MTDGRWLRRS WRGDGQCHDT GHQPGPAALT PQDQAPLAPA LAQPRYLDTD NLSPTKETRA61 GIGANLSSAS GHWVLGSQLF QRLGQLPGLL RLPALFNKTR KC.核苷酸及氨基酸組合序列(SEQ ID NO6) 克隆號PP12104起始編碼子305 ATG 終止編碼子608 TAG蛋白質分子量 11008.831G GCC GTG GAG GCT CCA GGT GTT CTC TCT GCC CCA GCA GAG CCC GGC 4647 AGG AGC CCC AAC AGG AAG CCA GCG CGG CAT GGC TGC CAC CGA CTT CGT 9495 GCA GGA GAT GCG CGC CGT GGG CGA GAG GCT GCT GCT CAA GCT GCA GAG142143 ACT GCC CCA GGC TGA GCC CGT GGA GAT CGT GGC CTT CTC AGT CAT CAT190191 CCT TTT CAC AGC TAC TGT TCT GCT GTT GCT GCT GAT AGC CTG CAG CTG238239 CTG CTG CAC TCA CTG CTG CTG CCC TGA GCG GAG AGG CAG GAA GGT CCA286287 GGT GCA GCC GAC ACC ACC ATG ACG GAC GGG CGA TGG CTG AGG AGA AGC3341 Met Thr Asp Gly Arg Trp Leu Arg Arg Ser 10335 TGG AGA GGA GAT GGC CAA TGC CAT GAC ACA GGC CAT CAG CCT GGC CCT38211 Trp Arg Gly Asp Gly Gln Cys His Asp Thr Gly His Gln Pro Gly Pro 26383 GCA GCC CTT ACC CCT CAA GAC CAG GCT CCC CTG GCC CCA GCT CTG GCC43027 Ala Ala Leu Thr Pro Gln Asp Gln Ala Pro Leu Ala Pro Ala Leu Ala 42431 CAG CCC AGG TAC CTG GAC ACT GAC AAC TTG AGC CCT ACC AAG GAA ACA47843 Gln Pro Arg Tyr Leu Asp Thr Asp Asn Leu Ser Pro Thr Lys Glu Thr 58479 AGG GCT GGT ATA GGT GCA AAC CTC TCA TCT GCC AGT GGA CAC TGG GTG52659 Arg Ala Gly Ile Gly Ala Asn Leu Ser Ser Ala Ser Gly His Trp Val 74527 CTG GGG AGT CAG CTG TTT CAA AGA CTG GGT CAA CTG CCT GGG CTT CTT57475 Leu Gly Ser Gln Leu Phe Gln Arg Leu Gly Gln Leu Pro Gly Leu Leu 90575 CGC CTA CCT GCA CTT TTT AAC AAA ACA AGG AAG TAG GGG TCC CCA TAC62291 Arg Leu Pro Ala Leu Phe Asn Lys Thr Arg Lys ***102623 CTT GAT GGA GAA CAG TCC CCA CCT GTG GGC AAT TGG CCC TTG GGG CTC670671 TGC TGA TAC ATG CCA AAG AGG AGC AAG GCA ATC AGA GGG GCT TTG TGC718719 AAT AGC TTC TGC ATC CGA GCT CCC GCC AGA GCG TGA GCA TGT CAG TAT766767 TCT AGT CCA GTA TTT GCC AGT TTC CAA GTA AAA GCT TTT GTG TTA CGT814815 GAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA862863 AAA AAA AAA AAA AAA AAA AAA A 8843.PP12585A核苷酸序列(SEQ ID NO7)長度2855個堿基1 GCCTTTAACT CCCAGGAATT CATGGGCCAG CTGTATCAGT GGGAGCCCTT CACTGAAGTC61 CAGGGCTCCC AGCGCTGTGA ACTGAACTGC CGGCCCCGTG GCTTCCGCTT CTATGTCCGT121 CACACTGAAA AGGTCCAGGA TGGGACCCTG TGTCAGCCTG GAGCCCCTGA CATCTGTGTG181 GCTGGACGCT GTCTGAGCCC CGGCTGTGAT GGGATCCTTG GCTCTGGCAG GCGTCCTGAT241 GGCTGTGGAG TCTGTGGGGG TGATGATTCT ACCTGTCGCC TTGTTTCGGG GAACCTCACT301 GACCGAGGGG GCCCCCTGGG CTATCAGAAG ATCTTGTGGA TTCCAGCGGG AGCCTTGCGG361 CTCCAGATTG CCCAGCTCCG GCCTAGCTCC AACTACCTGG CACTTCGTGG CCCTGGGGGC421 CCGGTCCATC ATCAATGGGA ACTGGGCTGT GGATCCCCCT GGGTCCTACA GGGCCGGCGG481 GACCGTCTTT CGATATAACC GTCCTCCCAG GGAGGAGGGC AAAGGGGAGA GTCTGTCGGC541 TGAAGGCCCC ACCACCCAGC CTGTGGATGT CTATATGATC TTTCAGGAGG AAAACCCAGG601 CGTTTTTTAT CAGTATGTCA TCTCTTCACC TCCTCCAATC CTTGAGAACC CCACCCCAGA661 GCCCCCTGTC CCCCAGCTTC AGCCGGAGAT TCTGAGGGTG GAGCCCCCAC TTGCTCCGGC721 ACCCCGCCCA GCCCGGACCC CAGGCACCCT CCAGCGTCAG GTGCGGATCC CCCAGATGCC781 CGCCCCGCCC CATCCCAGGA CACCCCTGGG GTCTCCAGCT GCGTACTGGA AACGAGTGGG841 ACACTCTGCA TGCTCAGCGT CCTGCGGGAA AGGTGTCTGG CGCCCCATTT TCCTCTGCAT901 CTCCCGTGAG TCGGGAGAGG AACTGGATGA ACGCAGCTGT GCCGCGGGTG CCAGGCCCCC961 AGCCTCCCCT GAACCCTGCC ACGGCACCCC ATGCCCCCCA TACTGGGAGG CTGGCGAGTG1021 GACATCCTGC AGCCGCTCCT GTGGCCCCGG CACCCAGCAC CGCCAGCTGC AGTGCCGGCA1081 GGAATTTGGG GGGGGTGGCT CCTCGGTGCC CCCGGAGCGC TGTGGACATC TCCCCCGGCC1141 CAACATCACC CAGTCTTGCC AGCTGCGCCT CTGTGGCCAT TGGGAAGTTG GCTCTCCTTG1201 GAGCCAGTGC TCCGTGCGGT GCGGCCGGGG CCAGAGAAGC CGGCAGGTTC GCTGTGTTGG1261 GAACAACGGT GATGAAGTGA GCGAGCAGGA GTGTGCGTCA GGCCCCCCAC AGCCCCCCAG1321 CAGAGAGGCC TGTGACATGG GGCCCTGTAC TACTGCCTGG TTCCACAGCG ACTGGAGCTC1381 CAAGTGCTCA ACCGAGTGTG GGACGGGAAT CCAGCGGCGC TCTGTGGTCT GCCTTGGGAG1441 TGGGGCAGCC CTCGGGCCAG GCCAGGGGGA AGCAGGAGCA GGAACTGGGC AGAGCTGTCC1501 AACAGGGAAG CCGGCCCCCT GACATGCGCG CCTGCAGCCT GGGGCCCTGT GAGAGAACTT1561 GGCGCTGGTA CACAGGGCCC TGGGGTGAGT GCTCCTCCGA ATGTGGCTCT GGCACACAGC1621 GTAGAGACAT CATCTGTGTA TCCAAACTGG GGACGGAGTT CAACGTGACT TCTCCGAGCA1681 ACTGTTCTCA CCTCCCCAGG CCCCCTGCCC TGCAGCCCTG TCAAGGGCAG GCCTGCCAGG1741 ACCGATGGTT TTCCACGCCC TGGAGCCCAT GTTCTCGCTC CTGCCAAGGG GGAACGCAGA1801 CACGGGAGGT CCAGTGCCTG AGCACCAACC AGACCCTCAG CACCCGATGC CCTCCTCAAC1861 TGCGGCCCTC CAGGAAGCGC CCCTGTAACA GCCAACCCTG CAGCCAGCGC CCTGATGATC1921 AATGCAAGGA CAGCTCTCCA CATTGCCCCC TGGTGGTACA GGCCCGGCTC TGCGTCTACC1981 CCTACTACAC AGCCACCTGT TGCCGCTCTT GCGCACATGT CCTGGAGCGG TCTCCCCAGG2041 ATCCCTCCTG AAAGGGGTCC GGGGCACCTT CACGGTTTTC TGTGCCACCA TCGGTCACCC2101 ATTGATCGGC CCACTCTGAA CCCCCTGGCT CTCCAGCCTG TCCCAGTCTC AGCAGGGATG2161 TCCTCCAGGT GACAGAGGGT GGCAAGGTGA CTGACACAAA GTGACTTTCA GGGCTGTGGT2221 CAGGCCCATG TGGTGGTGTG ATGGGTGTGT GCACATATGC CTCAGGTGTG CTTTTGGGAC2281 TGCATGGATA TGTGTGTGCT CAAACGTGTA TCACTTTTCA AAAAGAGGTT ACACAGACTG2341 AGAAGGACAA GACCTGTTTC CTTGAGACTT TCCTAGGTGG AAAGGAAAGC AAGTCTGCAG2401 TTCCTTGCTA ATCTGAGCTA CTTAGAGTGT GGTCTCCCCA CCAACTCCAG TTTTGTGCCC2461 TAAGCCTCAT TTCTCATGTT CAGACCTCAC ATCTTCTAAG CCGCCCTGTG TCTCTGACCC2521 CTTCTCATTT GCCTAGTATC TCTGCCCCTG CCTCCCTAAT TAGCTAGGGC TGGGGTCAGC2581 CACTGCCAAT CCTGCCTTAC TCAGGAAGGC AGGAGGAAAG AGACTGCCTC TCCAGAGCAA2641 GGCCCAGCTG GGCAGAGGGT GAAAAAGAGA AATGTGAGCA TTCGTTCCCC CACCACCCCG2701 CCCAGCCCCT AGCCCCACTC CCTGCCTCCT GAAATGGTTC CCACCCAGAA CTAATTTATT2761 TTTTATTAAA GATGGTCATG ACAAATGGGA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA2821 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAB核苷酸序列(SEQ ID NO8)長度437個氨基酸1 MGSLALAGVL MAVESVGVMI LPVALFRGTS LTEGAPWAIR RSCGFQREPC GSRLPSSGLA61 PTTWHFVALG ARSIINGNWA VDPPGSYRAG GTVFRYNRPP REEGKGESLS AEGPTTQPVD121 VYMIFQEENP GVFYQYVISS PPPILENPTP EPPVPQLQPE ILRVEPPLAP APRPARTPGT181 LQRQVRIPQM PAPPHPRTPL GSPAAYWKRV GHSACSASCG KGVWRPIFLC ISRESGEELD241 ERSCAAGARP PASPEPCHGT PCPPYWEAGE WTSCSRSCGP GTQHRQLQCR QEFGGGGSSV301 PPERCGHLPR PNITQSCQLR LCGHWEVGSP WSQCSVRCGR GQRSRQVRCV GNNGDEVSEQ361 ECASGPPQPP SREACDMGPC TTAWFHSDWS SKCSTECGTG IQRRSVVCLG SGAALGPGQG
421 EAGAGTGQSC PTGKPAPC.核苷酸及氨基酸組合序列(SEQ ID NO9)克隆號PP12585起始編碼子209 ATG 終止編碼子1520 TGA 蛋白質分子量 46499.121G CCT TTA ACT CCC AGG AAT TCA TGG GCC AGC TGT ATC AGT GGG AGC 4647 CCT TCA CTG AAG TCC AGG GCT CCC AGC GCT GTG AAC TGA ACT GCC GGC 9495 CCC GTG GCT TCC GCT TCT ATG TCC GTC ACA CTG AAA AGG TCC AGG ATG 142143 GGA CCC TGT GTC AGC CTG GAG CCC CTG ACA TCT GTG TGG CTG GAC GCT 190191 GTC TGA GCC CCG GCT GTG ATG GGA TCC TTG GCT CTG GCA GGC GTC CTG 2381 Met Gly Ser Leu Ala Leu Ala Gly Val Leu 10239 ATG GCT GTG GAG TCT GTG GGG GTG ATG ATT CTA CCT GTC GCC TTG TTT 28611 Met Ala Val Glu Ser Val Gly Val Met Ile Leu Pro Val Ala Leu Phe 26287 CGG GGA ACC TCA CTG ACC GAG GGG GCC CCC TGG GCT ATC AGA AGA TCT 33427 Arg Gly Thr Ser Leu Thr Glu Gly Ala Pro Trp Ala Ile Arg Arg Ser 42335 TGT GGA TTC CAG CGG GAG CCT TGC GGC TCC AGA TTG CCC AGC TCC GGC 38243 Cys Gly Phe Gln Arg Glu Pro Cys Gly Ser Arg Leu Pro Ser Ser Gly 58383 CTA GCT CCA ACT ACC TGG CAC TTC GTG GCC CTG GGG GCC CGG TCC ATC 43059 Leu Ala Pro Thr Thr Trp His Phe Val Ala Leu Gly Ala Arg Ser Ile 74431 ATC AAT GGG AAC TGG GCT GTG GAT CCC CCT GGG TCC TAC AGG GCC GGC 47875 Ile Asn Gly Asn Trp Ala Val Asp Pro Pro Gly Ser Tyr Arg Ala Gly 90479 GGG ACC GTC TTT CGA TAT AAC CGT CCT CCC AGG GAG GAG GGC AAA GGG 52691 Gly Thr Val Phe Arg Tyr Asn Arg Pro Pro Arg Glu Glu Gly Lys Gly 106527 GAG AGT CTG TCG GCT GAA GGC CCC ACC ACC CAG CCT GTG GAT GTC TAT 574107 Glu Ser Leu Ser Ala Glu Gly Pro Thr Thr Gln Pro Val Asp Val Tyr 122575 ATG ATC TTT CAG GAG GAA AAC CCA GGC GTT TTT TAT CAG TAT GTC ATC 622123 Met Ile Phe Gln Glu Glu Asn Pro Gly Val Phe Tyr Gln Tyr Val Ile 138623 TCT TCA CCT CCT CCA ATC CTT GAG AAC CCC ACC CCA GAG CCC CCT GTC 670139 Ser Ser Pro Pro Pro Ile Leu Glu Asn Pro Thr Pro Glu Pro Pro Val 154671 CCC CAG CTT CAG CCG GAG ATT CTG AGG GTG GAG CCC CCA CTT GCT CCG 718155 Pro Gln Leu Gln Pro Glu Ile Leu Arg Val Glu Pro Pro Leu Ala Pro 170719 GCA CCC CGC CCA GCC CGG ACC CCA GGC ACC CTC CAG CGT CAG GTG CGG 766171 Ala Pro Arg Pro Ala Arg Thr Pro Gly Thr Leu Gln Arg Gln Val Arg 186767 ATC CCC CAG ATG CCC GCC CCG CCC CAT CCC AGG ACA CCC CTG GGG TCT 814187 Ile Pro Gln Met Pro Ala Pro Pro His Pro Arg Thr Pro Leu Gly Ser 202815 CCA GCT GCG TAC TGG AAA CGA GTG GGA CAC TCT GCA TGC TCA GCG TCC 862203 Pro Ala Ala Tyr Trp Lys Arg Val Gly His Ser Ala Cys Ser Ala Ser 218863 TGC GGG AAA GGT GTC TGG CGC CCC ATT TTC CTC TGC ATC TCC CGT GAG 910219 Cys Gly Lys Gly Val Trp Arg Pro Ile Phe Leu Cys Ile Ser Arg Glu 234911 TCG GGA GAG GAA CTG GAT GAA CGC AGC TGT GCC GCG GGT GCC AGG CCC 958235 Ser Gly Glu Glu Leu Asp Glu Arg Ser Cys Ala Ala Gly Ala Arg Pro 250959 CCA GCC TCC CCT GAA CCC TGC CAC GGC ACC CCA TGC CCC CCA TAC TGG1006251 Pro Ala Ser Pro Glu Pro Cys His Gly Thr Pro Cys Pro Pro Tyr Trp 2661007 GAG GCT GGC GAG TGG ACA TCC TGC AGC CGC TCC TGT GGC CCC GGC ACC1054267 Glu Ala Gly Glu Trp Thr Ser Cys Ser Arg Ser Cys Gly Pro Gly Thr 2821055 CAG CAC CGC CAG CTG CAG TGC CGG CAG GAA TTT GGG GGG GGT GGC TCC1102283 Gln His Arg Gln Leu Gln Cys Arg Gln Glu Phe Gly Gly Gly Gly Ser 2981103 TCG GTG CCC CCG GAG CGC TGT GGA CAT CTC CCC CGG CCC AAC ATC ACC1150299 Ser Val Pro Pro Glu Arg Cys Gly His Leu Pro Arg Pro Asn Ile Thr 3141151 CAG TCT TGC CAG CTG CGC CTC TGT GGC CAT TGG GAA GTT GGC TCT CCT1198315 Gln Ser Cys Gln Leu Arg Leu Cys Gly His Trp Glu Val Gly Ser Pro 3301199 TGG AGC CAG TGC TCC GTG CGG TGC GGC CGG GGC CAG AGA AGC CGG CAG1246331 Trp Ser Gln Cys Ser Val Arg Cys Gly Arg Gly Gln Arg Ser Arg Gln 3461247 GTT CGC TGT GTT GGG AAC AAC GGT GAT GAA GTG AGC GAG CAG GAG TGT1294347 Val Arg Cys Val Gly Asn Asn Gly Asp Glu Val Ser Glu Gln Glu Cys 3621295 GCG TCA GGC CCC CCA CAG CCC CCC AGC AGA GAG GCC TGT GAC ATG GGG1342363 Ala Ser Gly Pro Pro Gln Pro Pro Ser Arg Glu Ala Cys Asp Met Gly 3781343 CCC TGT ACT ACT GCC TGG TTC CAC AGC GAC TGG AGC TCC AAG TGC TCA1390379 Pro Cys Thr Thr Ala Trp Phe His Ser Asp Trp Ser Ser Lys Cys Ser 3941391 ACC GAG TGT GGG ACG GGA ATC CAG CGG CGC TCT GTG GTC TGC CTT GGG1438395 Thr Glu Cys Gly Thr Gly Ile Gln Arg Arg Ser Val Val Cys Leu Gly 4101439 AGT GGG GCA GCC CTC GGG CCA GGC CAG GGG GAA GCA GGA GCA GGA ACT1486411 Ser Gly Ala Ala Leu Gly Pro Gly Gln Gly Glu Ala Gly Ala Gly Thr 4261487 GGG CAG AGC TGT CCA ACA GGG AAG CCG GCC CCC TGA CAT GCG CGC CTG1534427 Gly Gln Ser Cys Pro Thr Gly Lys Pro Ala Pro *** 4381535 CAG CCT GGG GCC CTG TGA GAG AAC TTG GCG CTG GTA CAC AGG GCC CTG15821583 GGG TGA GTG CTC CTC CGA ATG TGG CTC TGG CAC ACA GCG TAG AGA CAT16301631 CAT CTG TGT ATC CAA ACT GGG GAC GGA GTT CAA CGT GAC TTC TCC GAG16781679 CAA CTG TTC TCA CCT CCC CAG GCC CCC TGC CCT GCA GCC CTG TCA AGG17261727 GCA GGC CTG CCA GGA CCG ATG GTT TTC CAC GCC CTG GAG CCC ATG TTC17741775 TCG CTC CTG CCA AGG GGG AAC GCA GAC ACG GGA GGT CCA GTG CCT GAG18221823 CAC CAA CCA GAC CCT CAG CAC CCG ATG CCC TCC TCA ACT GCG GCC CTC18701871 CAG GAA GCG CCC CTG TAA CAG CCA ACC CTG CAG CCA GCG CCC TGA TGA19181919 TCA ATG CAA GGA CAG CTC TCC ACA TTG CCC CCT GGT GGT ACA GGC CCG19661967 GCT CTG CGT CTA CCC CTA CTA CAC AGC CAC CTG TTG CCG CTC TTG CGC20142015 ACA TGT CCT GGA GCG GTC TCC CCA GGA TCC CTC CTG AAA GGG GTC CGG20622063 GGC ACC TTC ACG GTT TTC TGT GCC ACC ATC GGT CAC CCA TTG ATC GGC21102111 CCA CTC TGA ACC CCC TGG CTC TCC AGC CTG TCC CAG TCT CAG CAG GGA21582159 TGT CCT CCA GGT GAC AGA GGG TGG CAA GGT GAC TGA CAC AAA GTG ACT22062207 TTC AGG GCT GTG GTC AGG CCC ATG TGG TGG TGT GAT GGG TGT GTG CAC22542255 ATA TGC CTC AGG TGT GCT TTT GGG ACT GCA TGG ATA TGT GTG TGC TCA23022303 AAC GTG TAT CAC TTT TCA AAA AGA GGT TAC ACA GAC TGA GAA GGA CAA23502351 GAC CTG TTT CCT TGA GAC TTT CCT AGG TGG AAA GGA AAG CAA GTC TGC23982399 AGT TCC TTG CTA ATC TGA GCT ACT TAG AGT GTG GTC TCC CCA CCA ACT24462447 CCA GTT TTG TGC CCT AAG CCT CAT TTC TCA TGT TCA GAC CTC ACA TCT24942495 TCT AAG CCG CCC TGT GTC TCT GAC CCC TTC TCA TTT GCC TAG TAT CTC25422543 TGC CCC TGC CTC CCT AAT TAG CTA GGG CTG GGG TCA GCC ACT GCC AAT25902591 CCT GCC TTA CTC AGG AAG GCA GGA GGA AAG AGA CTG CCT CTC CAG AGC26382639 AAG GCC CAG CTG GGC AGA GGG TGA AAA AGA GAA ATG TGA GCA TTC GTT26862687 CCC CCA CCA CCC CGC CCA GCC CCT AGC CCC ACT CCC TGC CTC CTG AAA27342735 TGG TTC CCA CCC AGA ACT AAT TTA TTT TTT ATT AAA GAT GGT CAT GAC27822783 AAA TGG GAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA28302831 AAA AAA AAA AAA AAA AAA AAA AAA A28554.PP14397A核苷酸序列(SEQ ID NO10)長度1936個堿基1 GCTCATGGCG CCGGCGTCGC GGTTGCTCGC GCTCTGGGCG CTGGCGGCTG TGGCTCTACC61 CGGCTCCGGG GCGGAGGGCG ACGGCGGGTG GCGCCCGGGC GGGCCGGGGG CCGTGGCGGA121 GGAGGAGCGC TGCACGGTGG AGCGTCGGGC CGACCTCACC TACGCGGAGT TCGTGCAGCA181 GTACGCCTTC GTCAGGCCCG TCATCCTGCA GGGACTCACG GACAACTCGA GGTTCCGGGC241 CCTGTGCTCC CGCGACAGGT TGCTGGCTTC GTTTGGGGAC AGAGTGGTCC GGCTGAGCAC301 CGCCAACACC TACTCCTACC ACAAAGTGGA CTTGCCCTTC CAGGAGTATG TGGAGCAGCT361 GCTGCACCCC CAGGACCCCA CCTCCCTGGG CAATGACACC CTGTACTTCT TCGGGGACAA421 CAACTTCACC GAGTGGGCCT CTCTCTTTCG GCACTACTCC CCACCCCCAT TTGGCCTGCT481 GGGAACCGCT CCAGCTTACA GCTTTGGAAT CGCAGGAGCT GGCTCGGGGG TGCCCTTCCA541 CTGGCATGGA CCCGGGTACT CAGAAGTGAT CTACGGTCGT AAGCGCTGGT TCCTTTACCC601 ACCTGAGAAG ACGCCAGAGT TCCACCCCAA CAAGACCACG CTGGCCTGGC TCCGGGACAC661 ATACCCAGCC CTGCCACCGT CTGCACGGCC CCTGGAGTGT ACCATCCGGG CTGGTGAGGT721 GCTGTACTTC CCCGACCGCT GGTGGCATGC TACGCTCAAC CTTGACACCA GCGTCTTCAT781 CTCCACCTTC CTCGGCTAGC CAAAACAGCT GGCAGGACTG CCGGTCACAC ACCAGCACGT841 CCCACCTCGT GCTCACGGAT TTTATTACAC AGATAGTGGC GGCAATGGCC TCAGCCCAGC901 CCACCCTCAC CTGCTTTTCC AGCCCACAAA GGGGGACGAT CACGGCCCAG CAAAAGCGAT961 GCTGAGAGGG GAAACAGTCC AGAGTCCAAC AGCAGAACTT GGGGGAAGCG GTCGGGGTGG1021 CCAGGAACAT AAACTATGTA TAGGGGCCGG GGGCTTCTGC CCAGGGCTCC CCTGGACCAG1081 GACGCCAGGT AGGGCAGGGA ACCTCAGTAG TCCTCCACCC AGCCATTCTC AGAGATGAAT1141 GCGTCAATAA CCTCCTTCAT AGCCAAGTTG GGGATGAGCT GTTCCTGGGT CAGGGGGCTC1201 CGGGTCACGG GGTCAAAATG ACCCACACGC TGCAGTGACA AGAAGGGCAG AGGGCAGTCA1261 TGGGGCCCAG GACCATGCCA CTGGCCCTGC TCCCCCAGCC GCAGCCTCAC CTGCAGGTGC1321 TCCTCGATGT CCTTGCGGTC GTAGGTGATG CCACTGGGCG TGATGCACGG CTCCCGCATC1381 AGCTCAAAGC TGATCTTGCC ACACAGGTAG TCGGGGATGT CTCGCTTCTG TGGCACAGGG1441 GCACACGGTC AGAGGCTGAA AAGGGGCACT GCACGAGCAC CTGCCAGCCA TCGGCAGCAA1501 GCGACACACA CTCACCTTCC TCTTCTCATC CACCTGAGAA AAAAGCTCGT CCATGTCCGC1561 CATGTACTTG TCCTGTGAAG AGTTGAGTGC TGTGCTTGGG GGAGACACCC CACCTCCCTC1621 CTCCATGGGG CACAGACCCA ACACAAGGCG GGGATGCTCC CACGCCACGT GCACACACAC1681 AGACCCACAT GTGGGTGGGG GGCACCCTCA CGTGCTTGGC CTCAATGCAG GCCTGCTGGG1741 CCCGGACGTG GCTGTCGTCC TCATCACCCT CGTGGTTTCG CTGGCACTCT TCCAGCTCCC1801 TGGGGGTTGA CCAGGAGCCG GTCAGAGATG GACCTGGCCA GATGTCTGAC CACACCCCAA1861 TCTCAGAGCT AACATCCACA CTTCCCCACA TTTCCTGCTT GCCAGTAAAG CCTTCGATAA1921 AAAAAAAAAA AAAAAAB核苷酸序列(SEQ ID NO11)長度264個氨基酸1 MAPASRLLAL WALAAVALPG SGAEGDGGWR PGGPGAVAEE ERCTVERRAD LTYAEFVQQY61 AFVRPVILQG LTDNSRFRAL CSRDRLLASF GDRVVRLSTA NTYSYHKVDL PFQEYVEQLL121 HPQDPTSLGN DTLYFFGDNN FTEWASLFRH YSPPPFGLLG TAPAYSFGIA GAGSGVPFHW181 HGPGYSEVIY GRKRWFLYPP EKTPEFHPNK TTLAWLRDTY PALPPSARPL ECTIRAGEVL241 YFPDRWWHAT LNLDTSVFIS TFLGC.核苷酸及氨基酸組合序列 (SEQ ID NO12) 克隆號PP14397起始編碼子5 ATG 終止編碼子797 TAG 蛋白質分子量 29507.631G CTC ATG GCG CCG GCG TCG CGG TTG CTC GCG CTC TGG GCG CTG GCG461 Met Ala Pro Ala Ser Arg Leu Leu Ala Leu Trp Ala Leu Ala1447 GCT GTG GCT CTA CCC GGC TCC GGG GCG GAG GGC GAC GGC GGG TGG CGC9415 Ala Val Ala Leu Pro Gly Ser Gly Ala Glu Gly Asp Gly Gly Trp Arg 3095 CCG GGC GGG CCG GGG GCC GTG GCG GAG GAG GAG CGC TGC ACG GTG GAG 14231 Pro Gly Gly Pro Gly Ala Val Ala Glu Glu Glu Arg Cys Thr Val Glu 46143 CGT CGG GCC GAC CTC ACC TAC GCG GAG TTC GTG CAG CAG TAC GCC TTC 19047 Arg Arg Ala Asp Leu Thr Tyr Ala Glu Phe Val Gln Gln Tyr Ala Phe 62191 GTC AGG CCC GTC ATC CTG CAG GGA CTC ACG GAC AAC TCG AGG TTC CGG 23863 Val Arg Pro Val Ile Leu Gln Gly Leu Thr Asp Ash Ser Arg Phe Arg 78239 GCC CTG TGC TCC CGC GAC AGG TTG CTG GCT TCG TTT GGG GAC AGA GTG 28679 Ala Leu Cys Ser Arg Asp Arg Leu Leu Ala Ser Phe Gly Asp Arg Val 94287 GTC CGG CTG AGC ACC GCC AAC ACC TAC TCC TAC CAC AAA GTG GAC TTG 33495 Val Arg Leu Ser Thr Ala Asn Thr Tyr Ser Tyr His Lys Val Asp Leu 110335 CCC TTC CAG GAG TAT GTG GAG CAG CTG CTG CAC CCC CAG GAC CCC ACC 382111 Pro Phe Gln Glu Tyr Val Glu Gln Leu Leu His Pro Gln Asp Pro Thr 126383 TCC CTG GGC AAT GAC ACC CTG TAC TTC TTC GGG GAC AAC AAC TTC ACC 430127 Ser Leu Gly Asn Asp Thr Leu Tyr Phe Phe Gly Asp Asn Asn Phe Thr 142431 GAG TGG GCC TCT CTC TTT CGG CAC TAC TCC CCA CCC CCA TTT GGC CTG 478143 Glu Trp Ala Ser Leu Phe Arg His Tyr Ser Pro Pro Pro Phe Gly Leu 158479 CTG GGA ACC GCT CCA GCT TAC AGC TTT GGA ATC GCA GGA GCT GGC TCG 526159 Leu Gly Thr Ala Pro Ala Tyr Ser Phe Gly Ile Ala Gly Ala Gly Ser 174527 GGG GTG CCC TTC CAC TGG CAT GGA CCC GGG TAC TCA GAA GTG ATC TAC 574175 Gly Val Pro Phe His Trp His Gly Pro Gly Tyr Ser Glu Val Ile Tyr 190575 GGT CGT AAG CGC TGG TTC CTT TAC CCA CCT GAG AAG ACG CCA GAG TTC 622191 Gly Arg Lys Arg Trp Phe Leu Tyr Pro Pro Glu Lys Thr Pro Glu Phe 206623 CAC CCC AAC AAG ACC ACG CTG GCC TGG CTC CGG GAC ACA TAC CCA GCC 670207 His Pro Asn Lys Thr Thr Leu Ala Trp Leu Arg Asp Thr Tyr Pro Ala 222671 CTG CCA CCG TCT GCA CGG CCC CTG GAG TGT ACC ATC CGG GCT GGT GAG 718223 Leu Pro Pro Ser Ala Arg Pro Leu Glu Cys Thr Ile Arg Ala Gly Glu 238719 GTG CTG TAC TTC CCC GAC CGC TGG TGG CAT GCT ACG CTCAAC CTT GAC 766239 Val Leu Tyr Phe Pro Asp Arg Trp Trp His Ala Thr Leu Asn Leu Asp 254767 ACC AGC GTC TTC ATC TCC ACC TTC CTC GGC TAG CCA AAA CAG CTG GCA 814255 Thr Ser Val Phe Ile Ser Thr Phe Leu Gly *** 265815 GGA CTG CCG GTC ACA CAC CAG CAC GTC CCA CCT CGT GCT CAC GGA TTT 862863 TAT TAC ACA GAT AGT GGC GGC AAT GGC CTC AGC CCA GCC CAC CCT CAC 910911 CTG CTT TTC CAG CCC ACA AAG GGG GAC GAT CAC GGC CCA GCA AAA GCG 958959 ATG CTG AGA GGG GAA ACA GTC CAG AGT CCA ACA GCA GAA CTT GGG GGA10061007 AGC GGT CGG GGT GGC CAG GAA CAT AAA CTA TGT ATA GGG GCC GGG GGC10541055 TTC TGC CCA GGG CTC CCC TGG ACC AGG ACG CCA GGT AGG GCA GGG AAC11021103 CTC AGT AGT CCT CCA CCC AGC CAT TCT CAG AGA TGA ATG CGT CAA TAA11501151 CCT CCT TCA TAG CCA AGT TGG GGA TGA GCT GTT CCT GGG TCA GGG GGC11981199 TCC GGG TCA CGG GGT CAA AAT GAC CCA CAC GCT GCA GTG ACA AGA AGG12461247 GCA GAG GGC AGT CAT GGG GCC CAG GAC CAT GCC ACT GGC CCT GCT CCC12941295 CCA GCC GCA GCC TCA CCT GCA GGT GCT CCT CGA TGT CCT TGC GGT CGT13421343 AGG TGA TGC CAC TGG GCG TGA TGC ACG GCT CCC GCA TCA GCT CAA AGC13901391 TGA TCT TGC CAC ACA GGT AGT CGG GGA TGT CTC GCT TCT GTG GCA CAG14381439 GGG CAC ACG GTC AGA GGC TGA AAA GGG GCA CTG CAC GAG CAC CTG CCA14861487 GCC ATC GGC AGC AAG CGA CAC ACA CTC ACC TTC CTC TTC TCA TCC ACC15341535 TGA GAA AAA AGC TCG TCC ATG TCC GCC ATG TAC TTG TCC TGT GAA GAG15821583 TTG AGT GCT GTG CTT GGG GGA GAC ACC CCA CCT CCC TCC TCC ATG GGG16301631 CAC AGA CCC AAC ACA AGG CGG GGA TGC TCC CAC GCC ACG TGC ACA CAC16781679 ACA GAC CCA CAT GTG GGT GGG GGG CAC CCT CAC GTG CTT GGC CTC AAT17261727 GCA GGC CTG CTG GGC CCG GAC GTG GCT GTC GTC CTC ATC ACC CTC GTG17741775 GTT TCG CTG GCA CTC TTC CAG CTC CCT GGG GGT TGA CCA GGA GCC GGT18221823 CAG AGA TGG ACC TGG CCA GAT GTC TGA CCA CAC CCC AAT CTC AGA GCT18701871 AAC ATC CAC ACT TCC CCA CAT TTC CTG CTT GCC AGT AAA GCC TTC GAT19181919 AAA AAA AAA AAA AAA AAA19365.PP14434A核苷酸序列(SEQ ID NO13)長度4130個堿基1 GCTGAGTCGT CTTGGTCCCA GGAGCCAGTA GTGAAGGCAA CAGTCTGCCC ACCTGTGGAC61 ACCAGATCCT GGGAGCTCCT GGTTAGCAAG TGAGATCTCT GGGATGTCAG TGAGGCTGGT121 TGAAGACCAG AGGTAAACTG CAGAGGTCAC CACCCCCACC ATGTCCCAGG TGATGTCCAG181 CCCACTGCTG GCAGGAGGCC ATGCTGTCAG CTTGGCGCCT TGTGATGAGC CCAGGAGGAC241 CCTGCACCCA GCACCCAGCC CCAGCCTGCC ACCCCAGTGT TCTTACTACA CCACGGAAGG301 CTGGGGAGCC CAGGCCCTGA TGGCCCCCGT GCCCTGCATG GGGCCCCCTG GCCGACTCCA361 GCAAGCCCCA CAGGTGGAGG CCAAAACCAC CTGCTTCCTG CCGTCCCCTG GTGAGAAAGG421 CCTTGGGGAC CCCAGAGGAC CTTGACTCCT ACATTGACTT CTCACTGGAG AGCCTCAATC481 AGATGATCCT GGAACTGGAC CCCACCTTCC AGCTGCTTCC CCCAGGGACT GGGGGCTCCC541 AGGCTGAGCT GGCCCAGAGC ACCATGTCAA TGAGAAAGAA GGAGGAATCT GAAGCCTTGG601 ACATAAAGTA CATCGAGGTG ACCTCCGCCA GATCAAGGTG CCACGATGGC CCCCAGCACT661 GCTCCAGCCC CTCTGTCACC CCGCCCTTCG GCTCCCTTCG CAGTGGTGGC CTCCTCCTTT721 CCAGAGACGT CCCCCGAGAG ACACGAAGCA GCAGTGAGAG CCTCATCTTC TCTGGGAACC781 AGGGCAGGGG GCACCAGCGC CCTCTGCCCC CCTCAGAGGG TCTCTCCCCT CGACCCCCAA841 ATTCCCCCAG CATCTCAATC CCTTGCATGG GGAGCAAGGC CTCGAGCCCC CATGGTTTGG901 GCTCCCCGCT GGTGGCTTCT CCAAGACTGG AGAAGCGGCT GGGAGGCCTG GCCCCACAGC961 GGGGCAGCAG GATCTCTGTG CTGTCAGCCA GCCCAGTGTC TGATGTCAGC TATATGTTTG1021 GAAGCAGCCA GTCCCTTCTG CACTCAGCAA CTCCAGCCAT CAGTCATCTT CCAGATCCTT1081 GGAAAGTCCA GCCAACTCTT CCTCCAGCCT CCACAGCCTT GGCTCAGTGT CCCTGTGTAC1141 AAGACCCAGT GACTTCCAGG CTCCCAGAAA CCCCACCCTA ACCATGGGCC AACCCAGAAC1201 ACCCCACTCT CCACCACTGG CCAAAGAACA TGCCAGCAGC TGCCCCCCAT CCATCACCAA1261 CTCCATGGTG GACATACCCA TTGTGCTGAT CAACGGCTGG CCAGAACCAG GGTCTTCTCC1321 ACCCCAGCGG ACCCCAGGAC ACCAGAACTC CGTTCAACCT GGAGCTGCTT CTCCCAGCAA1381 CCCCTGTCCA GCCACCAGGA GCAACAGCCA GACCCTGTCA GATGCCCCCT TTACCACATG1441 CCCAGAGGGT CCCGCCAGGG ACATGCAGCC CACCATGAAG TTCGTGATGG ACACATCTAA1501 ATACTGGTTT AAGCCAAACA TCACCCGAGA GCAAGCAATC GAGCTGCTGA GGAAGGAGGA1561 GCCAGGGGCT TTTTGTCATA AGGGACAGCT CTTCATACCG AGGCTCCTTC GGCCTGGCCC1621 TGAAGGTGCA GGAGGTTCCC GCGTCTGCTC AGAGTCGACC AGGTGAGGAC AGCAATGACC1681 TCATCCGACA CTTCCTCATC GAGTCGTCTG CCAAAGGAGT GCATCTCAAA GGAGCAGATG1741 AGGAGCCCTA CTTTGGGAGC CTCTCTGCCT TCGTGTGCCA GCATTCCATC ATGGCCCTGG1801 CCCTGCCCTG CAAACTCACC ATCCCACAGA GAGAACTGGG AGGTGCAGAT GGGGCCTCGG1861 ACTCTACAGA CAGCCCAGCC TCCTGCCAGA AGAAATCTGC GGGCTGCCAC ACCCTGTACC1921 TGAGCTCAGT GAGCGTGGAG ACCCTGACTG GAGCCCTGGC CGTCAGAAAG CCATCTCCAC1981 CACCTTTGAG AGGGACATCC TCCCCACGCC CACCGTGGTC CACTTCAAAG TCACAGAGCA2041 GGGCATCACT CTGACTGATG TCCAGAGGAA GGTGTTTTTC CGGCGCCATT ACCCACTCAC2101 CACCCTCCGC TTCTGTGGTA TGGACCCTGA GCAACGGAAG TGGCAGAAGT ACTGCAAACC2161 CTCCTGGATC TTTGGGTTTG TGGCCAAGAG CCAGACAGAG CCTCAGGAGA ACGTATGCCA2221 CCTCTTTGCG GAGTATGACA TGGTCCAGCC AGCCTCGCAG GTCATCGGCC TGGTGACTGC2281 TCTGCTGCAG GACGCAGAAA GGATGTAGGG GAGAGACTGC CTGTGCACCT AACCAACACC2341 TCCAGGGGCT CGCTAAGGAG CCCCCCTCCA CCCCCTGAAT GGGTGTGGCT TGTGGCATAT2401 TGACAGACCA ATCTATGGGA CTAGGGGGAT TGGCATCAAG TTGACACCCT TGAACCTGCT2461 ATGGCCTTCA GCAGTCACCA TCATCCAGAC CCCCCGGGCC TCAGTTTCCT CAATCATAGA2521 AGAAGACCAA TAGACAAGAT CAGCTGTTCT TAGATGCTGG TGGGCATTTG AACATGCTCC2581 TCCATGATTC TGAAGCATGC ACACCTCTGA AGACCCCTGC ATGAAAATAA CCTCCAAGGA2641 CCCTCTGACC CCATCGACCT GGGCCCTGCC ACACAACAGT CTGAGCAAGA GACCTGCAGC2701 CCCTGTTTCG TGGCAGACAG CAGGTGCCTG GCGGTGACCC ACGGGGCTCC TGGCTTGCAG2761 CTGGTGATGG TCAAGAACTG ACTACAAAAC AGGAATGGAT AGACTCTATT TCCTTCCATA2821 TCTGTTCCTC TGTTCCTTTT CCCACTTTCT GGGTGGCTTT TTGGGTCCAC CCAGCCAGGA2881 TGCTGCAGGC CAAGCTGGGT GTGGTATTTA GGGCAGCTCA GCAGGGGGAA CTTGTCCCCA2941 TGGTCAGAGG AGACCCAGCT GTCCTGCACC CCCTTGCAGA TGAGTATCAC CCCATCTTTT3001 CTTTCCACTT GGTTTTTATT TTTATTTTTT TTTGAGACAG AGTCTCACTG TCACCCAGGC3061 TGAACTGCAG TGGTGTGATC TAGGCTCACT GCAACCTCCA CCTCCCAGGT TCAAGCAATT3121 ATCCTGCCTC AGGCTCCCAA GTAGCTGGGA TTACAGGCAT GTGCAACTCA CCCAGCTAAT3181 TTTGTATTTT TAGTAGAGAC AGGGTTTCAC CATGTTGGCC AGGCTGGTCT TGAACTCCTG3241 ACCGCAGTAA TCCACCTGCT TCGGCCTCCC AAAGTGCTGG GATTACAGGC GCAACGACCC3301 AGCCCAGCTT CTTTCCATTC CTTGATAGGC GAGTATTCCA AAGCTGGTAT CGTAGCTGCC3361 CTAATGTTGC ATATTAGGCG GCGGGGGCAG AGATAAGGGC CATCTCTCTG TGATTCTGCC3421 TCAGCTCCTG TCTTGCTGAG CCCTCCCCCA ACCCACGCTC CAACACACAC ACACACACAC3481 ACACACACAC ACACACACAC ACACACACAC ACACACACGC CCCTCTACTG CTATGTGGCT3541 TCAACCAGCC TCACAGCCAC ACGGGGGAAG CAGAGAGTCA AGAATGCAAA GAGGCCGCTT3601 CCCTAAGAGG CTTGGAGGAG CTGGGCTCTA TCCCACACCC ACCCCCACCC CACCCCCACC3661 CAGCCTCCAG AAGCTGGAAC CATTTCTCCC GCAGCCTGAG TTCCTAAGGA AACCACCCTA3721 CCGGGGTGGA AGGGAGGGTC AGGGAAGAAA CCCACTCTTG CTCTACGAGG AGCAAGTGCC3781 TGCCCCCTCC CAGCAGCCAG CCCTGCCAAA GTTGCATTAT CTTTGGCCAA GGCTGGGCCT3841 GACGGTTATG ATTTCAGCCC TGGGCCTGCA GGAGAGGCTG AGACCAGCCC ACCCAGCCAG3901 TGGTCGAGCA CTGCCCCGCC GCCAAAGTCT GCAGAATGTG AGATGAGGTT CTCAAGGTCA3961 CAGGCCCCAG TCCCAGCCTG GGGGCTGCAG AGGCCCCCAT ATACTCTGCT ACAGCTCCTA4021 TCATGAAAAA TAAAATGTTT GTCTTTGCAA AACAGTAAAA AAAAAAAAAA AAAAAAAAAA4081 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAAB核苷酸序列 (SEQ ID NO14) 長度232個氨基酸1 MILELDPTFQ LLPPGTGGSQ AELAQSTMSM RKKEESEALD IKYIEVTSAR SRCHDGPQHC61 SSPSVTPPFG SLRSGGLLLS RDVPRETRSS SESLIFSGNQ GRGHQRPLPP SEGLSPRPPN121 SPSISIPCMG SKASSPHGLG SPLVASPRLE KRLGGLAPQR GSRISVLSAS PVSDVSYMFG181 SSQSLLHSAT PAISHLPDPW KVQPTLPPAS TALAQCPCVQ DPVTSRLPET PPC.核苷酸及氨基酸組合序列 (SEQ ID NO15) 克隆號PP14434起始編碼子483 ATG 終止編碼子1179 TAA 蛋白質分子量24467.331 GC TGA GTC GTC TTG GTC CCA GGA GCC AGT AGT GAA GGC AAC AGT CTG 4748 CCC ACC TGT GGA CAC CAG ATC CTG GGA GCT CCT GGT TAG CAA GTG AGA 9596 TCT CTG GGA TGT CAG TGA GGC TGG TTG AAG ACC AGA GGT AAA CTG CAG143144 AGG TCA CCA CCC CCA CCA TGT CCC AGG TGA TGT CCA GCC CAC TGC TGG191192 CAG GAG GCC ATG CTG TCA GCT TGG CGC CTT GTG ATG AGC CCA GGA GGA239240 CCC TGC ACC CAG CAC CCA GCC CCA GCC TGC CAC CCC AGT GTT CTT ACT287288 ACA CCA CGG AAG GCT GGG GAG CCC AGG CCC TGA TGG CCC CCG TGC CCT335336 GCA TGG GGC CCC CTG GCC GAC TCC AGC AAG CCC CAC AGG TGG AGG CCA383384 AAA CCA CCT GCT TCC TGC CGT CCC CTG GTG AGA AAG GCC TTG GGG ACC431432 CCA GAG GAC CTT GAC TCC TAC ATT GAC TTC TCA CTG GAG AGC CTC AAT479480 CAG ATG ATC CTG GAA CTG GAC CCC ACC TTC CAG CTG CTT CCC CCA GGG5271 Met Ile Leu Glu Leu Asp Pro Thr Phe Gln Leu Leu Pro Pro Gly 15528 ACT GGG GGC TCC CAG GCT GAG CTG GCC CAG AGC ACC ATG TCA ATG AGA 57516 Thr Gly Gly Ser Gln Ala Glu Leu Ala Gln Ser Thr Met Ser Met Arg 31576 AAG AAG GAG GAA TCT GAA GCC TTG GAC ATA AAG TAC ATC GAG GTG ACC 62332 Lys Lys Glu Glu Ser Glu Ala Leu Asp Ile Lys Tyr Ile Glu Val Thr 47624 TCC GCC AGA TCA AGG TGC CAC GAT GGC CCC CAG CAC TGC TCC AGC CCC 67148 Ser Ala Arg Ser Arg Cys His Asp Gly Pro Gln His Cys Ser Ser Pro 63672 TCT GTC ACC CCG CCC TTC GGC TCC CTT CGC AGT GGT GGC CTC CTC CTT 71964 Ser Val Thr Pro Pro Phe Gly Ser Leu Arg Ser Gly Gly Leu Leu Leu 79720 TCC AGA GAC GTC CCC CGA GAG ACA CGA AGC AGC AGT GAG AGC CTC ATC 76780 Ser Arg Asp Val Pro Arg Glu Thr Arg Ser Ser Ser Glu Ser Leu Ile 95768 TTC TCT GGG AAC CAG GGC AGG GGG CAC CAG CGC CCT CTG CCC CCC TCA 81596 Phe Ser Gly Asn Gln Gly Arg Gly His Gln Arg Pro Leu Pro Pro Ser 111816 GAG GGT CTC TCC CCT CGA CCC CCA AAT TCC CCC AGC ATC TCA ATC CCT 863112 Glu Gly Leu Ser Pro Arg Pro Pro Asn Ser Pro Ser Ile Ser Ile Pro 127864 TGC ATG GGG AGC AAG GCC TCG AGC CCC CAT GGT TTG GGC TCC CCG CTG 911128 Cys Met Gly Ser Lys Ala Ser Ser Pro His Gly Leu Gly Ser Pro Leu 143912 GTG GCT TCT CCA AGA CTG GAG AAG CGG CTG GGA GGC CTG GCC CCA CAG 959144 Val Ala Ser Pro Arg Leu Glu Lys Arg Leu Gly Gly Leu Ala Pro Gln 159960 CGG GGC AGC AGG ATC TCT GTG CTG TCA GCC AGC CCA GTG TCT GAT GTC1007160 Arg Gly Ser Arg Ile Ser Val Leu Ser Ala Ser Pro Val Ser Asp Val 1751008 AGC TAT ATG TTT GGA AGC AGC CAG TCC CTT CTG CAC TCA GCA ACT CCA1055176 Ser Tyr Met Phe Gly Ser Ser Gln Ser Leu Leu His Ser Ala Thr Pro 1911056 GCC ATC AGT CAT CTT CCA GAT CCT TGG AAA GTC CAG CCA ACT CTT CCT1103192 Ala Ile Ser His Leu Pro Asp Pro Trp Lys Val Gln Pro Thr Leu Pro 2071104 CCA GCC TCC ACA GCC TTG GCT CAG TGT CCC TGT GTA CAA GAC CCA GTG1151208 Pro Ala Ser Thr Ala Leu Ala Gln Cys Pro Cys Val Gln Asp Pro Val 2231152 ACT TCC AGG CTC CCA GAA ACC CCA CCC TAA CCA TGG GCC AAC CCA GAA1199224 Thr Ser Arg Leu Pro Glu Thr Pro Pro *** 2331200 CAC CCC ACT CTC CAC CAC TGG CCA AAG AAC ATG CCA GCA GCT GCC CCC12471248 CAT CCA TCA CCA ACT CCA TGG TGG ACA TAC CCA TTG TGC TGA TCA ACG12951296 GCT GGC CAG AAC CAG GGT CTT CTC CAC CCC AGC GGA CCC CAG GAC ACC13431344 AGA ACT CCG TTC AAC CTG GAG CTG CTT CTC CCA GCA ACC CCT GTC CAG13911392 CCA CCA GGA GCA ACA GCC AGA CCC TGT CAG ATG CCC CCT TTA CCA CAT14391440 GCC CAG AGG GTC CCG CCA GGG ACA TGC AGC CCA CCA TGA AGT TCG TGA14871488 TGG ACA CAT CTA AAT ACT GGT TTA AGC CAA ACA TCA CCC GAG AGC AAG15351536 CAA TCG AGC TGC TGA GGA AGG AGG AGC CAG GGG CTT TTT GTC ATA AGG15831584 GAC AGC TCT TCA TAC CGA GGC TCC TTC GGC CTG GCC CTG AAG GTG CAG16311632 GAG GTT CCC GCG TCT GCT CAG AGT CGA CCA GGT GAG GAC AGC AAT GAC16791680 CTC ATC CGA CAC TTC CTC ATC GAG TCG TCT GCC AAA GGA GTG CAT CTC17271728 AAA GGA GCA GAT GAG GAG CCC TAC TTT GGG AGC CTC TCT GCC TTC GTG17751776 TGC CAG CAT TCC ATC ATG GCC CTG GCC CTG CCC TGC AAA CTC ACC ATC18231824 CCA CAG AGA GAA CTG GGA GGT GCA GAT GGG GCC TCG GAC TCT ACA GAC18711872 AGC CCA GCC TCC TGC CAG AAG AAA TCT GCG GGC TGC CAC ACC CTG TAC19191920 CTG AGC TCA GTG AGC GTG GAG ACC CTG ACT GGA GCC CTG GCC GTC AGA19671968 AAG CCA TCT CCA CCA CCT TTG AGA GGG ACA TCC TCC CCA CGC CCA CCG20152016 TGG TCC ACT TCA AAG TCA CAG AGC AGG GCA TCA CTC TGA CTG ATG TCC20632064 AGA GGA AGG TGT TTT TCC GGC GCC ATT ACC CAC TCA CCA CCC TCC GCT21112112 TCT GTG GTA TGG ACC CTG AGC AAC GGA AGT GGC AGA AGT ACT GCA AAC21592160 CCT CCT GGA TCT TTG GGT TTG TGG CCA AGA GCC AGA CAG AGC CTC AGG22072208 AGA ACG TAT GCC ACC TCT TTG CGG AGT ATG ACA TGG TCC AGC CAG CCT22552256 CGC AGG TCA TCG GCC TGG TGA CTG CTC TGC TGC AGG ACG CAG AAA GGA23032304 TGT AGG GGA GAG ACT GCC TGT GCA CCT AAC CAA CAC CTC CAG GGG CTC23512352 GCT AAG GAG CCC CCC TCC ACC CCC TGA ATG GGT GTG GCT TGT GGC ATA23992400 TTG ACA GAC CAA TCT ATG GGA CTA GGG GGA TTG GCA TCA AGT TGA CAC24472448 CCT TGA ACC TGC TAT GGC CTT CAG CAG TCA CCA TCA TCC AGA CCC CCC24952496 GGG CCT CAG TTT CCT CAA TCA TAG AAG AAG ACC AAT AGA CAA GAT CAG25432544 CTG TTC TTA GAT GCT GGT GGG CAT TTG AAC ATG CTC CTC CAT GAT TCT25912592 GAA GCA TGC ACA CCT CTG AAG ACC CCT GCA TGA AAA TAA CCT CCA AGG26392640 ACC CTC TGA CCC CAT CGA CCT GGG CCC TGC CAC ACA ACA GTC TGA GCA26872688 AGA GAC CTG CAG CCC CTG TTT CGT GGC AGA CAG CAG GTG CCT GGC GGT27352736 GAC CCA CGG GGC TCC TGG CTT GCA GCT GGT GAT GGT CAA GAA CTG ACT27832784 ACA AAA CAG GAA TGG ATA GAC TCT ATT TCC TTC CAT ATC TGT TCC TCT28312832 GTT CCT TTT CCC ACT TTC TGG GTG GCT TTT TGG GTC CAC CCA GCC AGG28792880 ATG CTG CAG GCC AAG CTG GGT GTG GTA TTT AGG GCA GCT CAG CAG GGG29272928 GAA CTT GTC CCC ATG GTC AGA GGA GAC CCA GCT GTC CTG CAC CCC CTT29752976 GCA GAT GAG TAT CAC CCC ATC TTT TCT TTC CAC TTG GTT TTT ATT TTT30233024 ATT TTT TTT TGA GAC AGA GTC TCA CTG TCA CCC AGG CTG AAC TGC AGT30713072 GGT GTG ATC TAG GCT CAC TGC AAC CTC CAC CTC CCA GGT TCA AGC AAT31193120 TAT CCT GCC TCA GGC TCC CAA GTA GCT GGG ATT ACA GGC ATG TGC AAC31673168 TCA CCC AGC TAA TTT TGT ATT TTT AGT AGA GAC AGG GTT TCA CCA TGT32153216 TGG CCA GGC TGG TCT TGA ACT CCT GAC CGC AGT AAT CCA CCT GCT TCG32633264 GCC TCC CAA AGT GCT GGG ATT ACA GGC GCA ACG ACC CAG CCC AGC TTC33113312 TTT CCA TTC CTT GAT AGG CGA GTA TTC CAA AGC TGG TAT CGT AGC TGC33593360 CCT AAT GTT GCA TAT TAG GCG GCG GGG GCA GAG ATA AGG GCC ATC TCT34073408 CTG TGA TTC TGC CTC AGC TCC TGT CTT GCT GAG CCC TCC CCC AAC CCA34553456 CGC TCC AAC ACA CAC ACA CAC ACA CAC ACA CAC ACA CAC ACA CAC ACA35033504 CAC ACA CAC ACA CAC GCC CCT CTA CTG CTA TGT GGC TTC AAC CAG CCT35513552 CAC AGC CAC ACG GGG GAA GCA GAG AGT CAA GAA TGC AAA GAG GCC GCT35993600 TCC CTA AGA GGC TTG GAG GAG CTG GGC TCT ATC CCA CAC CCA CCC CCA36473648 CCC CAC CCC CAC CCA GCC TCC AGA AGC TGG AAC CAT TTC TCC CGC AGC36953696 CTG AGT TCC TAA GGA AAC CAC CCT ACC GGG GTG GAA GGG AGG GTC AGG37433744 GAA GAA ACC CAC TCT TGC TCT ACG AGG AGC AAG TGC CTG CCC CCTCCC 37913792 AGC AGC CAG CCC TGC CAA AGT TGC ATT ATC TTT GGC CAA GGC TGG GCC38393840 TGA CGG TTA TGA TTT CAG CCC TGG GCC TGC AGG AGA GGC TGA GAC CAG38873888 CCC ACC CAG CCA GTG GTC GAG CAC TGC CCC GCC GCC AAA GTC TGC AGA39353936 ATG TGA GAT GAG GTT CTC AAG GTC ACA GGC CCC AGT CCC AGC CTG GGG39833984 GCT GCA GAG GCC CCC ATA TAC TCT GCT ACA GCT CCT ATC ATG AAA AAT40314032 AAA ATG TTT GTC TTT GCA AAA CAG TAA AAA AAA AAA AAA AAA AAA AAA40794080 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA41274128 AAA41306.PP14630A核苷酸序列(SEQ ID NO16)長度3128個堿基1 GTTGACCGCA GCCCAGGAGC CCATGCCGAA GAGAGCCACC AGCAGGGCCA GACACGCTTT61 GGCTCTCCTG GGAAGTGAAG ACTTCTTCTA GCTTGGAAGA AACAGAGAAA CAGATAGGAT121 GCAGAGCCGG AGTCAGAACA GGGTGAGACC AGGGGAACTG GGGGAGCCCC GGGCAGGAGC181 GCAGATGGGG AGGATTGGCT AAAACGTACC CAGCGGGACC GCCGGCAGGC AGGGAAGCAG241 GAAGCCGGCC CGAGTCGCTG CGGCCCCAGG GGAGGAGGCC GAAGGAGCGA GTGGAGCCCT301 CCTCTCCAGG GAGAGGCGGG GCTGGAGTCA ACGCCACCAC CACCCCAAGC CGGACGCCGG361 GAAAGGGCGC CTACCAGGAG GAGCCACGCA CACCCCAGGG CTTCACGGTG CCCGCGACCG421 CAAGAGCCAA GTCAGATCCC AGGGGAGTGG CCGGGACGGC TCTGCTCGGA GGGGCGCCGC481 CCTCTCGGTA CCGTCAGGTG GGCGACTCGG GAGCCGTCCG GTCCCTGCGC CTCCCGGTCC541 CGCGCCCAGT GCGCTCCCGC TCCAGTGCCG GCTTCCCGCC ACGCCGGGAC ACCGCCGTCC601 GGCCCAGGGA CGCCACCTCA GTCCGGAGCG CGCAGGACCC GGCAGCAGCC ACGACCCGAC661 TCACCCGTGG CGGTTCCGGG CCCGCCCCCG GCATGGCCCA CGACCGGAAG TCCCGCCCCG721 GAAGCTGGTC GGCGGGCGGG CGGGCGTTGA GAGGAACCGG GGGGTTGTCG GTCTATAAGC781 CTCGCCCGTT CCGCTCCCTG GGGCTTCCCC GAGCGCCGTC GGTGGTCATG GCTGCCCCAG841 CCTCCCGGCA GGTCCGACGC AGAGCCCGGG CAGCGCCGCG GGCCCCGCTC GGCCGAGGAC901 TGGTGGTGGG ACCGGCTGGC GCCGAGGGGC TCGGGGTACC ACCTGCTGCA GTCCGACAGC961 ATGCTGCTGG TGCTGTCCGA ACCCGGCCCC GCCCGGCCCC GCGCACAGCG CGCGCTTCCC1021 GCCGCACTCC CCGGCAGCCG CCCCGGGGCC CCAGCGCCGC GGCCAAGCCC AAGGCCGGGC1081 TCAGGTCCGA GGCGGCGGCC GCGCCCGCAC CCGCACCGGC ACCCACGCCC ACGCCCGAGG1141 AAGGGCCCGA CGCGGGCTGG GGAGACCGCA TTCCCTTGGA AATCCTGGTG CAGATTTTCG1201 GGTTGTTGGT GGCGGCGGAC GGCCCCATGC CCTTCCTGGG CAGGTAACGC TGGTGCCGGG1261 CCCGCCGCCG AGCGTAGCGG CTTGGGCCAG ACGTGGTCCG AGCGGTGGCC CGGGCGGGGG1321 CGGAGGGCGA AAGCATCGGA GCGCGCACCG CTCAGTCCGA GAGCGCAGCC CCTTAGGTGC1381 CCAGTTGGAG TCCCAGGAGC CCGGCTTTGA GCCGGGGTGT CTACTGCGCT GCGAGAGGGG1441 GGCATCGCCT ACGGAGGGGC CGGCACCCTC AGCACGCTGT CCTCCCAGGG CTGCGCGCGT1501 GTGCCGCCGC TGGCAGGAGG CCGCTTCCCA ACCCGCGCTC TGGCACACCG TGACCCTGTC1561 GTCCCCGCTG GTCGGCCGGC CTGCCAAGGG CGGGGTCAAG GCGGAGAAGA AGCTCCTTGC1621 TTCCCTGGAG TGGCTTATGC CCAATCGGTT TTCACAGCTC CAGAGGCTGA CCCTCATCCA1681 CTGGAAGTCT CAGGTACACC CCGTGTTGAA GGTGAGAGCT CCAGGCTGTC CTGCACATCA1741 GCTGTGACAC TCTGGGACTG TTCAGTACTC TAGGAAGTGG GTCAGGCACC TTGGGGGCCC1801 AACGCTGCTC CGTGGGGATG TCTGCCTGCC TGCCTGGTTC TCTTTTCCTG CTGTTTCCTC1861 CAGCAGGGAG GTATCAGAGG CGGGGACACC CAAGTAGGCC TGGCATGGGC AGAAAGGAGG1921 TCACAGCTAA GGCGGTAGAG TGGGGTTGGC ACCAGCCACT TGTCTGTTTC CCTTGTGGAT1981 CTTAGCCTGT CGTCTCCCAA CCCCAGCTGC CCCTCTGTCT CCCCGCAGCT GGTAGGTGAG2041 TGCTGTCCTC GGCTCACTTT CCTCAAGCTC TCCGGCTGCC ACGGTGTGAC TGCTGACGCT2101 CTGGTCATGC TAGCCAAAGC CTGCTGCCAG CTCCATAGCC TGGACCTACA GCACTCCATG2161 GTGGAGTCCA CAGCTGTGGT GAGCTTCTTG GAGGAGGCAG GGTCCCGAAT GCGCAAGTTG2221 TGGCTGACCT ACAGCTCCCA GACGACAGCC ATCCTGGGCG CACTGCTGGG CAGCTGCTGC2281 CCCCAGCTCC AGGTCCTGGA GGTGAGCACC GGCATCAACC GTAATAGCAT TCCCCTTCAG2341 CTGCCTGTCG AGGCTCTGCA GAAAGGCTGC CCTCAGCTCC AGGTGCTGCG GCTGTTGAAC2401 CTGATGTGGC TGCCCAAGCC TCCGGGACGA GGGGTGGCTC CCGGACCAGG CTTCCCTAGC2461 CTAGAGGAGC TCTGCCTGGC GAGCTCAACC TGCAACTTTG TGAGCAACGA GGTCCTGGGC2521 CGCCTACTCC ACGGCTCTCC CAACCTGCGC TTACTGGATC TTCGTGGCTG TGCGCGCATC2581 ACGCCGGCTG GCCTTCAGGA TCTGCCATGT CGGGAGCTGG AGCAGCTTCA TCTGGGCCTG2641 TATGGCACGT CAGACCGGCT GACTCTAGCC AAGGAGGGCA GCCCCTTTTT GACCCAGAAG2701 TGGTGCCATA CACTGCGAGA ACTGGACTTG AGTGGCCAGG GGTTCAGTGA GAAGGACCTG2761 GAGCAGGCCC TGGCTGCCTT CTTAAGCACC CCTGGGGGCT CACACCCAGC CCTGTGCTCT2821 CTTAACCTCA GGGGCACCCG GGTCACACCA AGCACTGTCA GCTCTGTGAT CAGCAGCTGC2881 CCGGGCCTGC TCTACCTCAA CCTGGAGTCC TGCCGCTGCC TTCCCCGGGG TCTGAAGCGG2941 GCCTACCGGG GCCTGGAGGA AGTCCAGTGG TGTCTGGAGC AGCTGCTCAC CAGCCCCTCA3001 CCCAGCTAGG CAGCCACAGA CCTGGGACAC CTCAGCCAGC TTGCCCACCC TCCACCTTTG3061 CCCAATTTCA GATATTTGAG CATTTTGTTA AAATAAAACA TTTTTAGGAA AAAAAAAAAA3121 AAAAAAAAB核苷酸序列(SEQ ID NO17)長度300個氨基酸1 MLAKACCGLH SLDLQHSMVE STAVVSFLEE AGSRMRKLWL TYSSQTTAIL GALLGSCCPQ61 LQVLEVSTGI NRNSIPLQLP VEALQKGCPQ LQVLRLLNLM WLPKPPGRGV APGPGFPSLE121 ELCLASSTCN FVSNEVLGRL LHGSPNLRLL DLRGCARITP AGLQDLPCRE LEQLHLGLYG181 TSDRLTLAKE GSPFLTQKWC HTLRELDLSG QGFSEKDLEQ ALAAFLSTPG GSHPALCSLN241 LRGTRVTPST VSSVISSCPG LLYLNLESCR CLPRGLKRAY RGLEEVQWCL EQLLTSPSPSC.核苷酸及氨基酸組合序列(SEQ ID NO18) 克隆號PP14630起始編碼子2107 ATG 終止編碼子3007 TAG 蛋白質分子量 32570.051 GTT GAC CGC AGC CCA GGA GCC CAT GCC GAA GAG AGC CAC CAG CAG GGC 4849 CAG ACA CGC TTT GGC TCT CCT GGG AAG TGA AGA CTT CTT CTA GCT TGG 9697 AAG AAA CAG AGA AAC AGA TAG GAT GCA GAG CCG GAG TCA GAA CAG GGT 144145 GAG ACC AGG GGA ACT GGG GGA GCC CCG GGC AGG AGC GCA GAT GGG GAG 192193 GAT TGG CTA AAA CGT ACC CAG CGG GAC CGC CGG GAG GCA GGG AAG CAG 240241 GAA GCC GGC CCG AGT CGC TGC GGC CCC AGG GGA GGA GGC CGA AGG AGC 288289 GAG TGG AGC CCT CCT CTC CAG GGA GAG GCG GGG CTG GAG TCA ACG CCA 336337 CCA CCA CCC CAA GCC GGA CGC CGG GAA AGG GCG CCT ACC AGG AGG AGC 384385 CAC GCA CAC CCC AGG GCT TCA CGG TGC CCG CGA CCG CAA GAG CCA AGT 432433 CAG ATC CCA GGG GAG TGG CCG GGA CGG CTC TGC TCG GAG GGG CGC CGC 480481 CCT CTC GGT ACC GTC AGG TGG GCG ACT CGG GAG CCG TCC GGT CCC TGC 528529 GCC TCC CGG TCC CGC GCC CAG TGC GCT CCC GCT CCA GTG CCG GCT TCC 576577 CGC CAC GCC GGG ACA CCG CCG TCC GGC CCA GGG ACG CCA CCT CAG TCC 624625 GGA GCG CGC AGG ACC CGG CAG CAG CCA CGA CCC GAC TCA CCC GTG GCG 672673 GTT CCG GGC CCG CCC CCG GCA TGG CCC ACG ACC GGA AGT CCC GCC CCG 720721 GAA GCT GGT CGG CGG GCG GGC GGG CGT TGA GAG GAA CCG GGG GGT TGT 768769 CGG TCT ATA AGC CTC GCC CGT TCC GCT CCC TGG GGC TTC CCC GAG CGC 816817 CGT CGG TGG TCA TGG CTG CCC CAG CCT CCC GGC AGG TCC GAC GCA GAG 864865 CCC GGG CAG CGC CGC GGG CCC CGC TCG GCC GAG GAC TGG TGG TGG GAC 912913 CGG CTG GCG CCG AGG GGC TCG GGG TAC CAC CTG CTG CAG TCC GAC AGC 960961 ATG CTG CTG GTG CTG TCC GAA CCC GGC CCC GCC CGG CCC CGC GCA CAG10081009 CGC GCG CTT CCC GCC GCA CTC CCC GGC AGC CGC CCC GGG GCC CCA GCG10561057 CCG CGG CCA AGC CCA AGG CCG GGC TCA GGT CCG AGG CGG CGG CCG CGC11041105 CCG CAC CCG CAC CGG CAC CCA CGC CCA CGC CCG AGG AAG GGC CCG ACG11521153 CGG GCT GGG GAG ACC GCA TTC CCT TGG AAA TCC TGG TGC AGA TTT TCG12001201 GGT TGT TGG TGG CGG CGG ACG GCC CCA TGC CCT TCC TGG GCA GGT AAC12481249 GCT GGT GCC GGG CCC GCC GCC GAG CGT AGC GGC TTG GGC CAG ACG TGG12961297 TCC GAG CGG TGG CCC GGG CGG GGG CGG AGG GCG AAA GCA TCG GAG CGC13441345 GCA CCG CTC AGT CCG AGA GCG CAG CCC CTT AGG TGC CCA GTT GGA GTC13921393 CCA GGA GCC CGG CTT TGA GCC GGG GTG TCT ACT GCG CTG CGA GAG GGG14401441 GGC ATC GCC TAC GGA GGG GCC GGC ACC CTC AGC ACG CTG TCC TCC CAG14881489 GGC TGC GCG CGT GTG CCG CCG CTG GCA GGA GGC CGC TTC CCA ACC CGC15361537 GCT CTG GCA CAC CGT GAC CCT GTC GTC CCC GCT GGT CGG CCG GCC TGC15841585 CAA GGG CGG GGT CAA GGC GGA GAA GAA GCT CCT TGC TTC CCT GGA GTG16321633 GCT TAT GCC CAA TCG GTT TTC ACA GCT CCA GAG GCT GAC CCT CAT CCA16801681 CTG GAA GTC TCA GGT ACA CCC CGT GTT GAA GGT GAG AGC TCC AGG CTG17281729 TCC TGC ACA TCA GCT GTG ACA CTC TGG GAC TGT TCA GTA CTC TAG GAA17761777 GTG GGT CAG GCA CCT TGG GGG CCC AAC GCT GCT CCG TGG GGA TGT CTG18241825 CCT GCC TGC CTG GTT CTC TTT TCC TGC TGT TTC CTC CAG CAG GGA GGT18721873 ATC AGA GGC GGG GAC ACC CAA GTA GGC CTG GCA TGG GCA GAA AGG AGG19201921 TCA CAG CTA AGG CGG TAG AGT GGG GTT GGC ACC AGC CAC TTG TCT GTT19681969 TCC CTT GTG GAT CTT AGC CTG TCG TCT CCC AAC CCC AGC TGC CCC TCT20162017 GTC TCC CCG CAG CTG GTA GGT GAG TGC TGT CCT CGG CTC ACT TTC CTC20642065 AAG CTC TCC GGC TGC CAC GGT GTG ACT GCT GAC GCT CTG GTC ATG CTA21121 Met Leu 22113 GCC AAA GCC TGC TGC CAG CTC CAT AGC CTG GAC CTA CAG CAC TCC ATG21603 Ala Lys Ala Cys Cys Gln Leu His Ser Leu Asp Leu Gln His Ser Met 182161 GTG GAG TCC ACA GCT GTG GTG AGC TTC TTG GAG GAG GCA GGG TCC CGA220819 Val Glu Ser Thr Ala Val Val Ser Phe Leu Glu Glu Ala Gly Ser Arg 342209 ATG CGC AAG TTG TGG CTG ACC TAC AGC TCC CAG ACG ACA GCC ATC CTG225635 Met Arg Lys Leu Trp Leu Thr Tyr Ser Ser Gln Thr Thr Ala Ile Leu 502257 GGC GCA CTG CTG GGC AGC TGC TGC CCC CAG CTC CAG GTC CTG GAG GTG230451 Gly Ala Leu Leu Gly Ser Cys Cys Pro Gln Leu Gln Val Leu Glu Val 662305 AGC ACC GGC ATC AAC CGT AAT AGC ATT CCC CTT CAG CTG CCT GTC GAG235267 Ser Thr Gly Ile Asn Arg Asn Ser Ile Pro Leu Gln Leu Pro Val Glu 822353 GCT CTG CAG AAA GGC TGC CCT CAG CTC CAG GTG CTG CGG CTG TTG AAC240083 Ala Leu Gln Lys Gly Cys Pro Gln Leu Gln Val Leu Arg Leu Leu Asn 982401 CTG ATG TGG CTG CCC AAG CCT CCG GGA CGA GGG GTG GCT CCC GGA CCA244899 Leu Met Trp Leu Pro Lys Pro Pro Gly Arg Gly Val Ala Pro Gly Pro 1142449 GGC TTC CCT AGC CTA GAG GAG CTC TGC CTG GCG AGC TCA ACC TGC AAC2496115 Gly Phe Pro Ser Leu Glu Glu Leu Cys Leu Ala Ser Ser Thr Cys Asn 1302497 TTT GTG AGC AAC GAG GTC CTG GGC CGC CTA CTC CAC GGC TCT CCC AAC2544131 Phe Val Ser Asn Glu Val Leu Gly Arg Leu Leu His Gly Ser Pro Asn 1462545 CTG CGC TTA CTG GAT CTT CGT GGC TGT GCG CGC ATC ACG CCG GCT GGC2592147 Leu Arg Leu Leu Asp Leu Arg Gly Cys Ala Arg Ile Thr Pro Ala Gly 1622593 CTT CAG GAT CTG CCA TGT CGG GAG CTG GAG CAG CTT CAT CTG GGC CTG2640163 Leu Gln Asp Leu Pro Cys Arg Glu Leu Glu Gln Leu His Leu Gly Leu 1782641 TAT GGC ACG TCA GAC CGG CTG ACT CTA GCC AAG GAG GGC AGC CCC TTT2688179 Tyr Gly Thr Ser Asp Arg Leu Thr Leu Ala Lys Glu Gly Ser Pro Phe 1942689 TTG ACC CAG AAG TGG TGC CAT ACA CTG CGA GAA CTG GAC TTG AGT GGC2736195 Leu Thr Gln Lys Trp Cys His Thr Leu Arg Glu Leu Asp Leu Ser Gly 2102737 CAG GGG TTC AGT GAG AAG GAC CTG GAG CAG GCC CTG GCT GCC TTC TTA2784211 Gln Gly Phe Ser Glu Lys Asp Leu Glu Gln Ala Leu Ala Ala Phe Leu 2262785 AGC ACC CCT GGG GGC TCA CAC CCA GCC CTG TGC TCT CTT AAC CTC AGG2832227 Ser Thr Pro Gly Gly Ser His Pro Ala Leu Cys Ser Leu Asn Leu Arg 2422833 GGC ACC CGG GTC ACA CCA AGC ACT GTC AGC TCT GTG ATC AGC AGC TGC2880243 Gly Thr Arg Val Thr Pro Ser Thr Val Ser Ser Val Ile Ser Ser Cys 2582881 CCG GGC CTG CTC TAC CTC AAC CTG GAG TCC TGC CGC TGC CTT CCC CGG2928259 Pro Gly Leu Leu Tyr Leu Asn Leu Glu Ser Cys Arg Cys Leu Pro Arg 2742929 GGT CTG AAG CGG GCC TAC CGG GGC CTG GAG GAA GTC CAG TGG TGT CTG2976275 Gly Leu Lys Arg Ala Tyr Arg Gly Leu Glu Glu Val Gln Trp Cys Leu 2902977 GAG CAG CTG CTC ACC AGC CCC TCA CCC AGC TAG GCA GCC ACA GAC CTG3024291 Glu Gln Leu Leu Thr Ser Pro Ser Pro Ser *** 3013025 GGA CAC CTC AGC CAG CTT GCC CAC CCT CCA CCT TTG CCC AAT TTC AGA30723073 TAT TTG AGC ATT TTG TTA AAA TAA AAC ATT TTT AGG AAA AAA AAA AAA31203121 AAA AAA AA 31287.FP248A核苷酸序列(SEQ ID NO19)長度2978個堿基1 GGCTTACTGC GGAACAGCAG GTTGGTGTCC ACAGCATTCA GCATCTGGAA CACGGCCTGG61 GGGTGGTAGC AGATGGTGTG GCCTGTGTAA CAGACGGGCA GCTGGTGGCT CAGGGCTCCC121 TGTCTCCTGG GGGGCTGTAG CCCACCCCTG CCCCTCTTCA GCCCCAAGCT CCTCCTCATC181 CACCCCCTTT CCTCTCTTGT GGGTGGTGAG TCAGGGAGGG TCAAGGGTGC TTGGGTGGGG241 GCAGGCCTGG GGGTCTTTAA GCCCGGCCTC GCCCTCCCAC CTATGAAGAG TGTCACCCAG301 GTCTTGATGT GGCAGGAGTG GCTGTGCAGG TAGCTGAGGG CCTGTGACAA GTGGATGCTG361 AATTCCTCCT GGCTGCGGGT CATCTGGCCG GAGGAGAGCA CACCTGGCTG GGACGGGCTG421 GGGGCCCTGG GCATACCAGG GTCCTCCAGC CCCAGTTTGC CTTGCCCAGC CCCTGGAGCT481 GCTATAGCAG CTGTGTGTGA GACGGGAGTG AATGGGGGAG CCGCAAGCCT GGTCTCCCCC541 ACTCCCTGGC CCTGTTCCTC CCCACCGATC CCAGGCCTCT CACCAGGCAG GTCCAGAGGA601 AGTGGCGGGC GCTGAGGCCC CTCTCCCAGG CCAGCGTGCA GAAGAGGGTG TGCAGTAGCC661 GCCAGCGGAG CAGCACAGCA CAGCGGTAGA AGGTGAACTT GGCCTGCTGC AGGGACAGGC721 GTGGAGGGTC ACCCACCGCC TATGTCTGAG CCCTTTCCCC TAGAGGCCAC AGGCCTCCAT781 GGGCACTGGA GGCAGCCTGC TGTGCGGGTG TTCCCTGGTT CTGTCCTGCT TGTGCCCCTC841 GGCAAGCCTC CCCGACCCTG GCAACAGCAC CTGGCCCCCC GGAGCCCAGG CTGGTCTGCC901 CGCGGCCCTG GCCCTGCCCC TTCCACGGTT GCCCCGTATC CTTTTCCCCA TGGCAGGGAG961 ACCCGCGAGG CCAAGCTCTG ACTTCGTGGG CTGTGCACAG GGCATGTGCT GCCACGGCAG1021 GCAGGGCACA GTCCATATTC ACACAAGCTC TGTGAGCTGC TGGACCCCCT GCCCCGTTAC1081 AGGGACTGGG GGCACAGCAG TGAGCAGAAA AGACCGGGTC CTGCCGCATC GACGGCAAGT1141 CTCGCTCGCA TGCGTGTGCG CAGTGGGGGA GCGGGCAGGC CAACTGTGGT CACAGAAACC1201 AGTGCAGATG GCCAGACCCT CTGCCCGCCA CTTGCTGCCC CGTGGGAGCT CCCCCAACTC1261 TCAGGCAGTG CTGCTGCCAT CCGTCTGCCC CGTACCCTGG CCTCCTGTGG GTCCCAGCCC1321 TGGCCAAGGT GAAGGCCTAT CACCTGCCTT TCCTGGGGTG GGCACTGACC GTGGCGACAG1381 CTGGGCATTG GTCCTTCAGG TGTAGGAGCA GGGGCACCAT GCTCTGGTGC ACCTGGGTCC1441 GCAGCCGCTC AGCTCCCTGT CTGCCATGGC CGCCACCAGG TCCCCGAACA GTGCCATGGC1501 TGCCGCCCGA ATCCCGTCCG CTCCTGCAAG GCAGAGGCTC AGAGGCACGG CCAGACCTGT1561 CCAGGGGTCC CAGCTTTGGT CCAAGTTGGG ACCCCACACC TTGTAGGGGT ACAACTCAGT1621 TCTTTCTGCA GGATTCCTTC ACCCAGGCTC TCGGCTCCCG GGGAAGGGAA GGGCTGGGGC1681 TCCCCCCTCA CACAGGGCTC TCTGGTGTCC CTGAGGATGT AAGAATCACA TCTCCCTTCT1741 ACCCACAACT GCATCCTGGC AGCCCAGGCC TCATGAATGC ATTTGAGGGG CGCCTATCCC1801 CCAGATTCCC CAGTGAAGGA AAAACAGCCA CGCTAACCGT GCTGACATGT CAGAAAGCAA1861 ATCTGGGTAG GCTGTCGTGG GGCCGGAGAC CACTGCACTT GGAGACTGAA CGTGAGAACT1921 AGTTCAGCCC TGTGGAGAAG GGGTGAGCGC CAGGGGCCCA CCCAGCCCAC CTGCTCAGTG1981 CCCACCTCAA CCGAGGGCCA CAAGCGGGCA GCTCCCCAGG GCCTGGGCCT CCCTGCTTGC2041 AGCTTGGGGT TCCCCCTTTG GCAGAGGAAG GGAGCTGGGT TGGGAGGAGG GTCCTGGAGG2101 GCGTGAGCAG GAGGTAGCCC CGCCCTGCCC CAGTGCTCAC GTCATTAAAG AAGGAGCGTG2161 TGCTGATGGC AACGCCGAGG CTCTGACTCC CTGTGCCCTG CGCGCCCAGG CGGTGCAGCG2221 TGTCTGACAC GGTGCCCATG ATGCACACGA TCACCTGGTC GCTGCTCTGG AAGAAGCCGT2281 CGAGCAAGGG CTGCAGCTGT CCCTGGAGCA GGCTTCCCTG GGGGTGGTGG CGGCTGGTGG2341 GCGGAGAGCA CTAGGACCCG CTGGCCCCAT GCCCCCGCCT CGTTCTCCCA CTTGACCCCC2401 TCACCCCATC TGCACTGGGT GGGGGGGTGG GGGGTGGTGA TTCAGAGCTG TGGGTCCCGG2461 CCTGGCCCTT CCCGCCATGG GGAGCTGTGG GTCCCGGCCT GGCCCTGCCC ACCGTGGGGA2521 GCTGTGCCCC TAACTGGGCT TTGTCCACCA GGAGCTGCGT GGTCTGGACA GGGTGGCCTC2581 TTTTCTTTTT TGAGACAGGG TCTCACACTG TCACCCAGGC TGGAGTACAG TGGTGTGACC2641 ATAGCTTACT GCAGCCTTGA CCTCCCAGGC TCAAGCAATC CTCCCAACAT AACCTCCTGA2701 GTAGCTGGGT CTACAGCCAG TTCCGTCTTC TCCACTTGAT TGCGTGTTTG CAGTGAGTTC2761 CTGAGTTATC GGGATGAATG GTCAGAAAGC AGTGTGCCCA CCAATGGATG TTTCCTGCCA2821 TTGGGCCCCT TAGCAGTGAC TTGGGTGCAA ACCAGGGTGA TTTTTACAAC TTTTAAACAA2881 GTTTAAAGCA ACTTTGTTGG CTTTCTTAGC TGTTTGCTTT GAAAATATTA AATTCATTTT2941 CAGCAAGTGA GTCATTCAAC AAAAAAAAAA AAAAAAAAB核苷酸序列(SEQ ID NO20)長度208個氨基酸1 MGTGGSLLCG CSLVLSCLCP SASLPDPGNS TWPPGAQAGL PAALALPLPR LPRILFPMAG61 RPARPSSDFV GCAQGMCCHG RQGTVHIHTS SVSCWTPCPV TGTGGTAVSR KDRVLPHRRQ121 VSLACVCAVG ERAGQLWSQK PVQMARPSAR HLLPRGSSPN SQAVLLPSVC PVPWPPVGPS181 PGQGEGLSPA FPGVGTDRGD SWALVLQVC.核苷酸及氨基酸組合序列(SEQ ID NO21)克隆號FP248起始編碼子779 ATG終止編碼子1403 TAG 蛋白質分子量 21374.621G GCT TAC TGC GGA ACA GCA GGT TGG TGT CCA CAG CAT TCA GCA TCT 4647 GGA ACA CGG CCT GGG GGT GGT AGC AGA TGG TGT GGC CTG TGT AAC AGA 9495 CGG GCA GCT GGT GGC TCA GGG CTC CCT GTC TCC TGG GGG GCT GTA GCC142143 CAC CCC TGC CCC TCT TCA GCC CCA AGC TCC TCC TCA TCC ACC CCC TTT190191 CCT CTC TTG TGG GTG GTG AGT CAG GGA GGG TCA AGG GTG CTT GGG TGG238239 GGG CAG GCC TGG GGG TCT TTA AGC CCG GCC TCG CCC TCC CAC CTA TGA286287 AGA GTG TCA CCC AGG TCT TGA TGT GGC AGG AGT GGC TGT GCA GGT AGC334335 TGA GGG CCT GTG ACA AGT GGA TGC TGA ATT CCT CCT GGC TGC GGG TCA382383 TCT GGC CGG AGG AGA GCA CAC CTG GCT GGG ACG GGC TGG GGG CCC TGG430431 GCA TAC CAG GGT CCT CCA GCC CCA GTT TGC CTT GCC CAG CCC CTG GAG478479 CTG CTA TAG CAG CTG TGT GTG AGA CGG GAG TGA ATG GGG GAG CCG CAA526527 GCC TGG TCT CCC CCA CTC CCT GGC CCT GTT CCT CCC CAC CGA TCC CAG574575 GCC TCT CAC CAG GCA GGT CCA GAG GAA GTG GCG GGC GCT GAG GCC CCT622623 CTC CCA GGC CAG CGT GCA GAA GAG GGT GTG CAG TAG CCG CCA GCG GAG670671 CAG CAC AGC ACA GCG GTA GAA GGT GAA CTT GGC CTG CTG CAG GGA CAG718719 GCG TGG AGG GTC ACC CAC CGC CTA TGT CTG AGC CCT TTC CCC TAG AGG766767 CCA CAG GCC TCC ATG GGC ACT GGA GGC AGC CTG CTG TGC GGG TGT TCC8141 Met Gly Thr Gly Gly Ser Leu Leu Cys Gly Cys Ser 12815 CTG GTT CTG TCC TGC TTG TGC CCC TCG GCA AGC CTC CCC GAC CCT GGC86213 Leu Val Leu Ser Cys Leu Cys Pro Ser Ala Ser Leu Pro Asp Pro Gly 28863 AAC AGC ACC TGG CCC CCC GGA GCC CAG GCT GGT CTG CCC GCG GCC CTG91029 Asn Ser Thr Trp Pro Pro Gly Ala Gln Ala Gly Leu Pro Ala Ala Leu 44911 GCC CTG CCC CTT CCA CGG TTG CCC CGT ATC CTT TTC CCC ATG GCA GGG95845 Ala Leu Pro Leu Pro Arg Leu Pro Arg Ile Leu Phe Pro Met Ala Gly 60959 AGA CCC GCG AGG CCA AGC TCT GAC TTC GTG GGC TGT GCA CAG GGC ATG 100661 Arg Pro Ala Arg Pro Ser Ser Asp Phe Val Gly Cys Ala Gln Gly Met 761007 TGC TGC CAC GGC AGG CAG GGC ACA GTC CAT ATT CAC ACA AGC TCT GTG 105477 Cys Cys His Gly Arg Gln Gly Thr Val His Ile His Thr Ser Ser Val 921055 AGC TGC TGG ACC CCC TGC CCC GTT ACA GGG ACT GGG GGC ACA GCA GTG 110293 Ser Cys Trp Thr Pro Cys Pro Val Thr Gly Thr Gly Gly Thr Ala Val1081103 AGC AGA AAA GAC CGG GTC CTG CCG CAT CGA CGG CAA GTC TCG CTC GCA 1150109 Ser Arg Lys Asp Arg Val Leu Pro His Arg Arg Gln Val Ser Leu Ala1241151 TGC GTG TGC GCA GTG GGG GAG CGG GCA GGC CAA CTG TGG TCA CAG AAA 1198125 Cys Val Cys Ala Val Gly Glu Arg Ala Gly Gln Leu Trp Ser Gln Lys1401199 CCA GTG CAG ATG GCC AGA CCC TCT GCC CGC CAC TTG CTG CCC CGT GGG 1246141 Pro Val Gln Met Ala Arg Pro Ser Ala Arg His Leu Leu Pro Arg Gly1561247 AGC TCC CCC AAC TCT CAG GCA GTG CTG CTG CCA TCC GTC TGC CCC GTA1294157 Ser Ser Pro Asn Ser Gln Ala Val Leu Leu Pro Ser Val Cys Pro Val 1721295 CCC TGG CCT CCT GTG GGT CCC AGC CCT GGC CAA GGT GAA GGC CTA TCA1342173 Pro Trp Pro Pro Val Gly Pro Ser Pro Gly Gln Gly Glu Gly Leu Ser 1881343 CCT GCC TTT CCT GGG GTG GGC ACT GAC CGT GGC GAC AGC TGG GCA TTG1390189 Pro Ala Phe Pro Gly Val Gly Thr Asp Arg Gly Asp Ser Trp Ala Leu 2041391 GTC CTT CAG GTG TAG GAG CAG GGG CAC CAT GCT CTG GTG CAC CTG GGT1438205 Val Leu Gln Val *** 2091439 CCG CAG CCG CTC AGC TCC CTG TCT GCC ATG GCC GCC ACC AGG TCC CCG14861487 AAC AGT GCC ATG GCT GCC GCC CGA ATC CCG TCC GCT CCT GCA AGG CAG15341535 AGG CTC AGA GGC ACG GCC AGA CCT GTC CAG GGG TCC CAG CTT TGG TCC15821583 AAG TTG GGA CCC CAC ACC TTG TAG GGG TAC AAC TCA GTT CTT TCT GCA16301631 GGA TTC CTT CAC CCA GGC TCT CGG CTC CCG GGG AAG GGA AGG GCT GGG16781679 GCT CCC CCC TCA CAC AGG GCT CTC TGG TGT CCC TGA GGA TGT AAG AAT17261727 CAC ATC TCC CTT CTA CCC ACA ACT GCA TCC TGG CAG CCC AGG CCT CAT17741775 GAA TGC ATT TGA GGG GCG CCT ATC CCC CAG ATT CCC CAG TGA AGG AAA18221823 AAC AGC CAC GCT AAC CGT GCT GAC ATG TCA GAA AGC AAA TCT GGG TAG18701871 GCT GTC GTG GGG CCG GAG ACC ACT GCA CTT GGA GAC TGA ACG TGA GAA19181919 CTA GTT CAG CCC TGT GGA GAA GGG GTG AGC GCC AGG GGC CCA CCC AGC19661967 CCA CCT GCT CAG TGC CCA CCT CAA CCG AGG GCC ACA AGC GGG CAG CTC20142015 CCC AGG GCC TGG GCC TCC CTG CTT GCA GCT TGG GGT TCC CCC TTT GGC20622063 AGA GGA AGG GAG CTG GGT TGG GAG GAG GGT CCT GGA GGG CGT GAG CAG21102111 GAG GTA GCC CCG CCC TGC CCC AGT GCT CAC GTC ATT AAA GAA GGA GCG21582159 TGT GCT GAT GGC AAC GCC GAG GCT CTG ACT CCC TGT GCC CTG CGC GCC22062207 CAG GCG GTG CAG CGT GTC TGA CAC GGT GCC CAT GAT GCA CAC GAT CAC22542255 CTG GTC GCT GCT CTG GAA GAA GCC GTC GAG CAA GGG CTG CAG CTG TCC23022303 CTG GAG CAG GCT TCC CTG GGG GTG GTG GCG GCT GGT GGG CGG AGA GCA23502351 CTA GGA CCC GCT GGC CCC ATG CCC CCG CCT CGT TCT CCC ACT TGA CCC23982399 CCT CAC CCC ATC TGC ACT GGG TGG GGG GGT GGG GGG TGG TGA TTC AGA24462447 GCT GTG GGT CCC GGC CTG GCC CTT CCC GCC ATG GGG AGC TGT GGG TCC24942495 CGG CCT GGC CCT GCC CAC CGT GGG GAG CTG TGC CCC TAA CTG GGC TTT25422543 GTC CAC CAG GAG CTG CGT GGT CTG GAC AGG GTG GCC TCT TTT CTT TTT25902591 TGA GAC AGG GTC TCA CAC TGT CAC CCA GGC TGG AGT ACA GTG GTG TGA26382639 CCA TAG CTT ACT GCA GCC TTG ACC TCC CAG GCT CAA GCA ATC CTC CCA26862687 ACA TAA CCT CCT GAG TAG CTG GGT CTA CAG CCA GTT CCG TCT TCT CCA27342735 CTT GAT TGC GTG TTT GCA GTG AGT TCC TGA GTT ATC GGG ATG AAT GGT27822783 CAG AAA GCA GTG TGC CCA CCA ATG GAT GTT TCC TGC CAT TGG GCC CCT28302831 TAG CAG TGA CTT GGG TGC AAA CCA GGG TGA TTT TTA CAA CTT TTA AAC28782879 AAG TTT AAA GCA ACT TTG TTG GCT TTC TTA GCT GTT TGC TTT GAA AAT29262927 ATT AAA TTC ATT TTC AGC AAG TGA GTC ATT CAA CAA AAA AAA AAA AAA29742975 AAA A 29788.FP291A核苷酸序列(SEQ ID NO22)長度2350個堿基1 GCTTTGCCCT GCAAGTGGAG TGGGCTCTGT TCTGGTCTTA GGAGGTCTGA AAGCAATACC61 AGCCCCTGCG CGTCTCACGC AGGCCCCAGC GTTAATTAAC CAGCAGTCGC TCCTGACAGC121 CAAGCCCCTG TATCATCTCC CAGGTCCAGG ACCCTGTGGG AGAAAGGGTC CGGCAAGTCA181 CAGACCCAGC CAGCGCAAAG GGCGATCGAG GAGAACCTTC CAGGAACCGT CCCAGATCCT241 AAACGTGAGG GTCTGCTGAG ATGCCCATCA TGGTAGATGA CATCATGAGG CTTCTGTGCT
301 CCATTTCCCA GGAGAGGAAG ATGAAGGCGG CCGTCAAGCA CTCTGGAAAG GGTGCCATGG361 TTGCGGGGGC AATGGCCTTC GTCGGTGGCT TGGTTGGTGG CCCACCAGGA ATAGCTGTTG421 GGGGGACTGT TGGGGGCCTG TTAGGTGCCT GGATGACGAG TGGACAGTTC AAGCCCGTTC481 CTCAGATCTT AATGGAGCTG CCCCCCGCTG AACAGCGGAA ACTTGTTAAC GAAGCCATGG541 CCATCATCGG GAACTTGGAC TGGACAGACG CTGTGCAGCT GACTGCTCTG GTCATGAGCA601 ACCAGGCCAT GCAGCAGAGG CTCTTGGCCA TGCTAACGAC CTATGTCACC AAAGAGCTGC661 AGGCTGAGAT CCGCTATGAG GACTAGGCCC CACCCCCTGG GGAGTGGGGC TCTCATTTTA721 GATGATTCTA TGGCTCATTG AAGGTGACCA GGGAATGGGG GAAGCCTGAC TTCTGGGAAA781 CTTGTCTATT ACCAGCATTG ATTGTAAGCC GCCATGCTAG TGCATTGTTG GACTGTCTTG841 CTGGAGAGGC ATCAGCCATG CCTCTTGGGC TGTGTGTGCC ATGGAAAGGT ACAGGCGTGC901 CTGCTGTGGG CATTCACGGA CAGCTTGGAG TCCTCCCGAT GACCATGTGG GTCTAAAAGG961 TTCTCATATT GTTGGCTGGC CGACCATAGC AGATGCTTCT TTTTCTATGA AGTGTACCTC1021 CAGGTACCTG TCACAGGATC GAATCCCCTT AGGCTCTGGG GTCTTGGGGT TCAGAGCCAG1081 CTCTTGTCAG GATTGTGCTA ACCTGCTGAG TGTTTCCTTC CCTTGGCTAA GGACTTCCCA1141 GTGGTCTCAT GGTGACAACT GTCCCTCCTT TGAGTGAAGC CACAGATGCC AGGCAGGCTC1201 TATGCTCTGC TACAGGCTAT GCCCTAGACG CTCTTGAGTA ACTTTAGTTT AGCTTGTAGG1261 AGCTTCTTCT GCCTCCTTAA GAAAAATCAT GGCACTTCAT TATTTTTTAT TTTCCATGTC1321 GATTCTGGAT TCTTTTTGTT CTCTACACTT TCGGAGCCTA AATTCATTTA GCTCTGTTTT1381 CTTTTTCTTC TTACTATGTT TCCTTGGGCT AGCCTTGAAG TCCTGGGCTC AAGCTACATA1441 GCTGGGACTG TAGGCTTGTG CCACCATACC TAGCTTTACC TCAAAGACTG TTGTCCACTC1501 TACTTTTCCT AAGCCCTCCC GTGCTCTCCT GTCTGCTGGC TGCAATCTAT AATTCATTTG1561 TGTGAAAAGA CAAAATTACC AATGACTTGA GTTCAGAGAT CCTAACATAG CTAGGTGCTG1621 TGGTGCAGAA CCATACCCAC GGTCCCAGAT AATTGAAAAG CCGAAGGGGG AACATCCTTG1681 GGCCCAGGAA TCCAAGGACA ACCGGACATT GTGGAAGCCA GGAGATAGGT GGGGACACAC1741 ACATCTTCTT AGTTGGCTTT TATTGCAGTC ACAGAATCAA GAGGCAGCAA GTGCCCTGGT1801 GAGACGGAGA GAGAGGGTGG ACAAGGGTGA GCAAGGGAAA GTGGAAACAG CAAGAAAACT1861 AGATTAACCT CCCGTGACAC TGGCTGTTTA TGGATTGGGC TAGCTTCGCC TCCATTTCCC1921 TAAGTGACAG AGGCTCAAAT CTGACATTGG CTTGTTTGTT TTCCTTGTGT TGTGGATGGA1981 AGCTAGGGCC TTGCATAGGC TAAGTGCCAC CCCTGAGCGC TGCTCCTAGT CCTCCTCTCT2041 GCTGATTCCC GCCCAGCCTG GTCCCAGCCC TTGAGTGACT CAGCTTTGGT CTGGTCGGTC2101 GGTCCCAGTG CTGGAGCTCA ACATCTAACA TTGTATCCAT TTGATTAAGT ATTTGATAAT2161 TCCTCCTTAT CCCTCCTTGG AGGTGCTCAC TCACGGAGGG CAGGAGCTAT GTGTCTCGGT2221 CACTTCTCCT GCCTCCAGCT TGCTCCTGCC TGGCACCATG GCTTTTGTGG GGTAGACACT2281 CAATAAATAT ATATTTTTAA AGCTAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA2341 AAAAAAAAAAB核苷酸序列(SEQ ID NO23)長度141個氨基酸1 MPIMVDDIMR LLCSISQERK MKAAVKHSGK GAMVAGAMAF VGGLVGGPPG IAVGGTVGGL61 LGAWMTSGQF KPVPQILMEL PPAEQRKLVN EAMAIIGNLD WTDAVQLTAL VMSNQAMQQR121 LLAMLTTYVT KELQAEIRYE DC.核苷酸及氨基酸組合序列(SEQ ID NO24) 克隆號FP291起始編碼子261 ATG 終止編碼子684 TAG 蛋白質分子量 15086.091 GC TTT GCC CTG CAA GTG GAG TGG GCT CTG TTC TGG TCT TAG GAG GTC 4748 TGA AAG CAA TAC CAG CCC CTG CGC GTC TCA CGC AGG CCC CAG CGT TAA 9596 TTA ACC AGC AGT CGC TCC TGA CAG CCA AGC CCC TGT ATC ATC TCC CAG143144 GTC CAG GAC CCT GTG GGA GAA AGG GTC CGG CAA GTC ACA GAC CCA GCC191192 AGC GCA AAG GGC GAT CGA GGA GAA CCT TCC AGG AAC CGT CCC AGA TCC239240 TAA ACG TGA GGG TCT GCT GAG ATG CCC ATC ATG GTA GAT GAC ATC ATG2871 Met Pro Ile Met Val Asp Asp Ile Met 9288 AGG CTT CTG TGC TCC ATT TCC CAG GAG AGG AAG ATG AAG GCG GCC GTC 33510 Arg Leu Leu Cys Ser Ile Ser Gln Glu Arg Lys Met Lys Ala Ala Val 25336 AAG CAC TCT GGA AAG GGT GCC ATG GTT GCG GGG GCA ATG GCC TTC GTC 38326 Lys His Ser Gly Lys Gly Ala Met Val Ala Gly Ala Met Ala Phe Val 41384 GGT GGC TTG GTT GGT GGC CCA CCA GGA ATA GCT GTT GGG GGG ACT GTT 43142 Gly Gly Leu Val Gly Gly Pro Pro Gly Ile Ala Val Gly Gly Thr Val 57432 GGG GGC CTG TTA GGT GCC TGG ATG ACG AGT GGA CAG TTC AAG CCC GTT 47958 Gly Gly Leu Leu Gly Ala Trp Met Thr Ser Gly Gln Phe Lys Pro Val 73480 CCT CAG ATC TTA ATG GAG CTG CCC CCC GCT GAA CAG CGG AAA CTT GTT 52774 Pro Gln Ile Leu Met Glu Leu Pro Pro Ala Glu Gln Arg Lys Leu Val 89528 AAC GAA GCC ATG GCC ATC ATC GGG AAC TTG GAC TGG ACA GAC GCT GTG 57590 Asn Glu Ala Met Ala Ile Ile Gly Asn Leu Asp Trp Thr Asp Ala Val 105576 CAG CTG ACT GCT CTG GTC ATG AGC AAC CAG GCC ATG CAG CAG AGG CTC 623106 Gln Leu Thr Ala Leu Val Met Ser Asn Gln Ala Met Gln Gln Arg Leu 121624 TTG GCC ATG CTA ACG ACC TAT GTC ACC AAA GAG CTG CAG GCT GAG ATC 671122 Leu Ala Met Leu Thr Thr Tyr Val Thr Lys Glu Leu Gln Ala Glu Ile 137672 CGC TAT GAG GAC TAG GCC CCA CCC CCT GGG GAG TGG GGC TCT CAT TTT 719138 Arg Tyr Glu Asp *** 142720 AGA TGA TTC TAT GGC TCA TTG AAG GTG ACC AGG GAA TGG GGG AAG CCT 767768 GAC TTC TGG GAA ACT TGT CTA TTA CCA GCA TTG ATT GTA AGC CGC CAT 815816 GCT AGT GCA TTG TTG GAC TGT CTT GCT GGA GAG GCA TCA GCC ATG CCT 863864 CTT GGG CTG TGT GTG CCA TGG AAA GGT ACA GGC GTG CCT GCT GTG GGC 911912 ATT CAC GGA CAG CTT GGA GTC CTC CCG ATG ACC ATG TGG GTC TAA AAG 959960 GTT CTC ATA TTG TTG GCT GGC CGA CCA TAG CAG ATG CTT CTT TTT CTA10071008 TGA AGT GTA CCT CCA GGT ACC TGT CAC AGG ATC GAA TCC CCT TAG GCT10551056 CTG GGG TCT TGG GGT TCA GAG CCA GCT CTT GTC AGG ATT GTG CTA ACC11031104 TGC TGA GTG TTT CCT TCC CTT GGC TAA GGA CTT CCC AGT GGT CTC ATG11511152 GTG ACA ACT GTC CCT CCT TTG AGT GAA GCC ACA GAT GCC AGG CAG GCT11991200 CTA TGC TCT GCT ACA GGC TAT GCC CTA GAC GCT CTT GAG TAA CTT TAG12471248 TTT AGC TTG TAG GAG CTT CTT CTG CCT CCT TAA GAA AAA TCA TGG CAC12951296 TTC ATT ATT TTT TAT TTT CCA TGT CGA TTC TGG ATT CTT TTT GTT CTC13431344 TAC ACT TTC GGA GCC TAA ATT CAT TTA GCT CTG TTT TCT TTT TCT TCT13911392 TAC TAT GTT TCC TTG GGC TAG CCT TGA AGT CCT GGG CTC AAG CTA CAT14391440 AGC TGG GAC TGT AGG CTT GTG CCA CCA TAC CTA GCT TTA CCT CAA AGA14871488 CTG TTG TCC ACT CTA CTT TTC CTA AGC CCT CCC GTG CTC TCC TGT CTG15351536 CTG GCT GCA ATC TAT AAT TCA TTT GTG TGA AAA GAC AAA ATT ACC AAT15831584 GAC TTG AGT TCA GAG ATC CTA ACA TAG CTA GGT GCT GTG GTG CAG AAC16311632 CAT ACC CAC GGT CCC AGA TAA TTG AAA AGC CGA AGG GGG AAC ATC CTT16791680 GGG CCC AGG AAT CCA AGG ACA ACC GGA CAT TGT GGA AGC CAG GAG ATA17271728 GGT GGG GAC ACA CAC ATC TTC TTA GTT GGC TTT TAT TGC AGT CAC AGA17751776 ATC AAG AGG CAG CAA GTG CCC TGG TGA GAC GGA GAG AGA GGG TGG ACA18231824 AGG GTG AGC AAG GGA AAG TGG AAA CAG CAA GAA AAC TAG ATT AAC CTC18711872 CCG TGA CAC TGG CTG TTT ATG GAT TGG GCT AGC TTC GCC TCC ATT TCC19191920 CTA AGT GAC AGA GGC TCA AAT CTG ACA TTG GCT TGT TTG TTT TCC TTG19671968 TGT TGT GGA TGG AAG CTA GGG CCT TGC ATA GGC TAA GTG CCA CCC CTG20152016 AGC GCT GCT CCT AGT CCT CCT CTC TGC TGA TTC CCG CCC AGC CTG GTC20632064 CCA GCC CTT GAG TGA CTC AGC TTT GGT CTG GTC GGT CGG TCC CAG TGC21112112 TGG AGC TCA ACA TCT AAC ATT GTA TCC ATT TGA TTA AGT ATT TGA TAA21592160 TTC CTC CTT ATC CCT CCT TGG AGG TGC TCA CTC ACG GAG GGC AGG AGC22072208 TAT GTG TCT CGG TCA CTT CTC CTG CCT CCA GCT TGC TCC TGC CTG GCA22552256 CCA TGG CTT TTG TGG GGT AGA CAC TCA ATA AAT ATA TAT TTT TAA AGC23032304 TAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA 23509.FP633A核苷酸序列(SEQ ID NO25)長度2375個堿基1 GCCAAAGGAG ACAAAGGATC ACCTGGATTT TATGGCAAAA AGGGTGCAAA AGGTGAAAAG61 GGGAATGCTG GCTTCCCTGG CCTCCCTGGA CCTGCTGGAG AACCAGGAAG ACATGGAAAG121 GATGGATTAA TGGGTAGTCC CGGTTTCAAG GGAGAAGCAG GATCCCCTGG TGCTCCGGGG181 CAGGATGGAA CACGGGGAGA GCCTACATGT GCATATGAGT TCAGCCACGT GAAAGAGTGA241 CCTGTACTTC TTTATGTCTC TTCACAAACT GTGGTCTTCA TATTCTTCAT GATTGCATCA301 GGAATCCCAG GATTTCCTGG AAACCGAGGA TTAATGGGCC AAAAGGGAGA AATTGGGCCT361 CCAGGACAGC AAGGAAAAAA AGGAGCCCCA GGGATGCCTG GTTTAATGGG AAGCAATGGC421 TCACCAGGCC AGCCTGGAAC ACCGGGATCT AAGGGAAGCA AAGGTGAACC TGGAATTCAA481 GGGATGCCTG GGGCTTCTGG GCTCAAGGGA GAACCAGGAG CAACGGGTTC CCCAGGAGAA541 CCAGGATACA TGGGTTTACC CGGGATTCAA GGAAAAAAGG GGGACAAAGG AAATCAAGGT601 GAAAAAGGTA TTCAGGGTCA AAAGGGAGAA AATGGAAGAC AGGGAATTCC AGGGCAACAG661 GGAATTCAAG GCCATCATGG TGCAAAAGGA GAGAGAGGTG AAAAGGGAGA ACCTGGTGTC721 CGAGGTGCCA TTGGATCAAA AGGAGAATCT GGGGTGGATG GCTTGATGGG GCCCGCAGGT781 CCTAAGGGGC AACCTGGGGA TCCAGGTCCT CAGGGACCCC CAGGTTTGGA TGGGAAGCCC841 GGAAGAGAGT TTTCAGAACA ATTTATTCGA CAAGTTTGCA CAGATGTAAT AAGAGGCCCA901 GAGGGTCCCA GAGGATTACC TGGTTTGCCA GGAAGAGATG GTGTTCCTGG ATTAGTGGGT961 GTCCCTGGAC GTCCAGGTGT CAGAGGATTA AAAGGCCTAC CAGGAAGAAA TGGGGAAAAA1021 GGGAGCCAAG GGTTTGGGTA TCCTGGAGAA CAAGGTCCTC CTGGTCCCCC AGGTCCAGAG1081 GGCCCTCCTG GAATAAGCAA AGAAGGTCCT CCAGGAGACC CAGGTCTCCC TGGCAAAGAT1141 GGAGACCATG GAAAACCTGG AATCCAAGGG CAACCAGGCC CCCCAGGCAT CTGCGACCCA1201 TCACTATGTT TTAGTGTAAT TGCCAGAAGA GATCCGTTCA GAAAAGGACC AAACTATTAG1261 TGTCTGATGC CTCATTCAGC AGCCTAGGCA TGGTGCTTTT TCTGTGGTCT TTTGCATCTC1321 AGGAAGATAA CCAACAGTAA TCCCTTGAAA AGAAACTTAA GTACCTCGGT GTTTTTATTT1381 TTTTTTTCTT ATGGAAAAAA ATATAAAAGA TCACATATAC TGATTTTAAA GGCTCCTCAG1441 TCATTTGGAG CCCTTGGATT AGCAGCATTA ATTAAATCTC AAGGGTTTCT TGTAAAGTCC1501 ATTTATGTTA ATCAAAGTTG AATATAAAAA TCCACCATTG CCTGTTAGCC AGTCAGTTTT1561 AGTCACTGTG AAATATTTCA CATTCAGCCT CCATGCAGTA GAGATTTGAG TTTAATTTCA1621 TGTCCATGTG ACTTTCATGT TTCCTATCTC ATAGCTCATG CTACTACATA AGCCAAAACA1681 TGTATCTCAT CATTGGAAGT AAGATCAGGG CTGATATTCA CCTGGGATAG ACAGTATTGG1741 TGAACTACTC ATTTACTACA GTGTCTCAGC CTTGATAAGG GGCAGTGGAT TGCCTGTTGT1801 TCGGTGTTGT GAATAGCACC TCTGAATAAG ATTAGAGTGT TTCTTAATTC ATTTCAAACT1861 CTAAAATTAG ATTAATGGTG GTGCTAAGAA AGAGTATTAA TTACTTTGGG AATGGTCAAA1921 ATTAACATTA AAAACATTTT AGACAAAAAG TTTCATTGTA CATTCAAAGA AAATGTAAGT1981 TTGGAAGTAC TAAAAGACTA TTTTATACTT GTTGATTAAT CGGAATGTTT GTTGTATGCC2041 TTCATTTTCC ATTTCACTTA TATGTGTATG TCCATATATG TTAATTTTCA TTGTAGCAAA2101 GCTAATGGAA ATAAAGCTAA TGCTCTAGTT GAAAGAAAAG GAAAACTCCT GAAATCCTAG2161 AATGTCTTGT TATTTTTAGC TGACTGTAAA ATATTATGAA CAGTCTTTGT GTATTGTGCT2221 TAATGCTTTT GTAAGAAACA GAATTTGAAA TATTTCATCC TTGTCATGCT CAAAATTTTG2281 TTACATGCTT GTTATTCAGA GTATAATAAA GTTTTGTACA GGCCTGAAAA AAAAAAAAAA2341 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAB核苷酸序列(SEQ ID NO26)長度323個氨基酸1 MIASGIPGFP GNRGLMGQKG EIGPPGQQGK KGAPGMPGLM GSNGSPGQPG TPGSKGSKGE61 PGIQGMPGAS GLKGEPGATG SPGEPGYMGL PGIQGKKGDK GNQGEKGIQG QKGENGRQGI
121 PGQQGIQGHH GAKGERGEKG EPGVRGAIGS KGESGVDGLM GPAGPKGQPG DPGPQGPPGL181 DGKPGREFSE QFIRQVCTDV IRGPEGPRGL PGLPGRDGVP GLVGVPGRPG VRGLKGLPGR241 NGEKGSQGFG YPGEQGPPGP PGPEGPPGIS KEGPPGDPGL PGKDGDHGKP GIQGQPGPPG301 ICDPSLCFSV IARRDPFRKG PNYC.核苷酸及氨基酸組合序列(SEQ ID NO27) 克隆號FP633起始編碼子 289 ATG 終止編碼子1258 TAG 蛋白質分子量31648.921 GCC AAA GGA GAC AAA GGA TCA CCT GGA TTT TAT GGC AAA AAG GGT GCA 4849 AAA GGT GAA AAG GGG AAT GCT GGC TTC CCT GGC CTC CCT GGA CCT GCT 9697 GGA GAA CCA GGA AGA CAT GGA AAG GAT GGA TTA ATG GGT AGT CCC GGT144145 TTC AAG GGA GAA GCA GGA TCC CCT GGT GCT CCG GGG CAG GAT GGA ACA192193 CGG GGA GAG CCT ACA TGT GCA TAT GAG TTC AGC CAC GTG AAA GAG TGA240241 CCT GTA CTT CTT TAT GTC TCT TCA CAA ACT GTG GTC TTC ATA TTC TTC288289 ATG ATT GCA TCA GGA ATC CCA GGA TTT CCT GGA AAC CGA GGA TTA ATG3361 Met Ile Ala Ser Gly Ile Pro Gly Phe Pro Gly Asn Arg Gly Leu Met 16337 GGC CAA AAG GGA GAA ATT GGG CCT CCA GGA CAG CAA GGA AAA AAA GGA38417 Gly Gln Lys Gly Glu Ile Gly Pro Pro Gly Gln Gln Gly Lys Lys Gly 32385 GCC CCA GGG ATG CCT GGT TTA ATG GGA AGC AAT GGC TCA CCA GGC CAG43233 Ala Pro Gly Met Pro Gly Leu Met Gly Ser Asn Gly Ser Pro Gly Gln 48433 CCT GGA ACA CCG GGA TCT AAG GGA AGC AAA GGT GAA CCT GGA ATT CAA48049 Pro Gly Thr Pro Gly Ser Lys Gly Ser Lys Gly Glu Pro Gly Ile Gln 64481 GGG ATG CCT GGG GCT TCT GGG CTC AAG GGA GAA CCA GGA GCA ACG GGT52865 Gly Met Pro Gly Ala Ser Gly Leu Lys Gly Glu Pro Gly Ala Thr Gly 80529 TCC CCA GGA GAA CCA GGA TAC ATG GGT TTA CCC GGG ATT CAA GGA AAA57681 Ser Pro Gly Glu Pro Gly Tyr Met Gly Leu Pro Gly Ile Gln Gly Lys 96577 AAG GGG GAC AAA GGA AAT CAA GGT GAA AAA GGT ATT CAG GGT CAA AAG62497 Lys Gly Asp Lys Gly Asn Gln Gly Glu Lys Gly Ile Gln Gly Gln Lys112625 GGA GAA AAT GGA AGA CAG GGA ATT CCA GGG CAA CAG GGA ATT CAA GGC672113 Gly Glu Asn Gly Arg Gln Gly Ile Pro Gly Gln Gln Gly Ile Gln Gly128673 CAT CAT GGT GCA AAA GGA GAG AGA GGT GAA AAG GGA GAA CCT GGT GTC720129 His His Gly Ala Lys Gly Glu Arg Gly Glu Lys Gly Glu Pro Gly Val144721 CGA GGT GCC ATT GGA TCA AAA GGA GAA TCT GGG GTG GAT GGC TTG ATG768145 Arg Gly Ala Ile Gly Ser Lys Gly Glu Ser Gly Val Asp Gly Leu Met160769 GGG CCC GCA GGT CCT AAG GGG CAA CCT GGG GAT CCA GGT CCT CAG GGA816161 Gly Pro Ala Gly Pro Lys Gly Gln Pro Gly Asp Pro Gly Pro Gln Gly176817 CCC CCA GGT TTG GAT GGG AAG CCC GGA AGA GAG TTT TCA GAA CAA TTT864177 Pro Pro Gly Leu Asp Gly Lys Pro Gly Arg Glu Phe Ser Glu Gln Phe192865 ATT CGA CAA GTT TGC ACA GAT GTA ATA AGA GGC CCA GAG GGT CCC AGA912193 Ile Arg Gln Val Cys Thr Asp Val Ile Arg Gly Pro Glu Gly Pro Arg208913 GGA TTA CCT GGT TTG CCA GGA AGA GAT GGT GTT CCT GGA TTA GTG GGT960209 Gly Leu Pro Gly Leu Pro Gly Arg Asp Gly Val Pro Gly Leu Val Gly224961 GTC CCT GGA CGT CCA GGT GTC AGA GGA TTA AAA GGC CTA CCA GGA AGA 1008225 Val Pro Gly Arg Pro Gly Val Arg Gly Leu Lys Gly Leu Pro Gly Arg2401009 AAT GGG GAA AAA GGG AGC CAA GGG TTT GGG TAT CCT GGA GAA CAA GGT 1056241 Asn Gly Glu Lys Gly Ser Gln Gly Phe Gly Tyr Pro Gly Glu Gln Gly2561057 CCT CCT GGT CCC CCA GGT CCA GAG GGC CCT CCT GGA ATA AGC AAA GAA 1104257 Pro Pro Gly Pro Pro Gly Pro Glu Gly Pro Pro Gly Ile Ser Lys Glu2721105 GGT CCT CCA GGA GAC CCA GGT CTC CCT GGC AAA GAT GGA GAC CAT GGA 1152273 Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Asp Gly Asp His Gly2881153 AAA CCT GGA ATC CAA GGG CAA CCA GGC CCC CCA GGC ATC TGC GAC CCA 1200289 Lys Pro Gly Ile Gln Gly Gln Pro Gly Pro Pro Gly Ile Cys Asp Pro3041201 TCA CTA TGT TTT AGT GTA ATT GCC AGA AGA GAT CCG TTC AGA AAA GGA 1248305 Ser Leu Cys Phe Ser Val Ile Ala Arg Arg Asp Pro Phe Arg Lys Gly3201249 CCA AAC TAT TAG TGT CTG ATG CCT CAT TCA GCA GCC TAG GCA TGG TGC 1296321 Pro Asn Tyr ***3241297 TTT TTC TGT GGT CTT TTG CAT CTC AGG AAG ATA ACC AAC AGT AAT CCC 13441345 TTG AAA AGA AAC TTA AGT ACC TCG GTG TTT TTA TTT TTT TTT TCT TAT 13921393 GGA AAA AAA TAT AAA AGA TCA CAT ATA CTG ATT TTA AAG GCT CCT CAG 14401441 TCA TTT GGA GCC CTT GGA TTA GCA GCA TTA ATT AAA TCT CAA GGG TTT 14881489 CTT GTA AAG TCC ATT TAT GTT AAT CAA AGT TGA ATA TAA AAA TCC ACC 15361537 ATT GCC TGT TAG CCA GTC AGT TTT AGT CAC TGT GAA ATA TTT CAC ATT 15841585 CAG CCT CCA TGC AGT AGA GAT TTG AGT TTA ATT TCA TGT CCA TGT GAC 16321633 TTT CAT GTT TCC TAT CTC ATA GCT CAT GCT ACT ACA TAA GCC AAA ACA 16801681 TGT ATC TCA TCA TTG GAA GTA AGA TCA GGG CTG ATA TTC ACC TGG GAT 17281729 AGA CAG TAT TGG TGA ACT ACT CAT TTA CTA CAG TGT CTC AGC CTT GAT 17761777 AAG GGG CAG TGG ATT GCC TGT TGT TCG GTG TTG TGA ATA GCA CCT CTG 18241825 AAT AAG ATT AGA GTG TTT CTT AAT TCA TTT CAA ACT CTA AAA TTA GAT 18721873 TAA TGG TGG TGC TAA GAA AGA GTA TTA ATT ACT TTG GGA ATG GTC AAA 19201921 ATT AAC ATT AAA AAC ATT TTA GAC AAA AAG TTT CAT TGT ACA TTC AAA 19681969 GAA AAT GTA AGT TTG GAA GTA CTA AAA GAC TAT TTT ATA CTT GTT GAT 20162017 TAA TCG GAA TGT TTG TTG TAT GCC TTC ATT TTC CAT TTC ACT TAT ATG 20642065 TGT ATG TCC ATA TAT GTT AAT TTT CAT TGT AGC AAA GCT AAT GGA AAT 21122113 AAA GCT AAT GCT CTA GTT GAA AGA AAA GGA AAA CTC CTG AAA TCC TAG 21602161 AAT GTC TTG TTA TTT TTA GCT GAC TGT AAA ATA TTA TGA ACA GTC TTT 22082209 GTG TAT TGT GCT TAA TGC TTT TGT AAG AAA CAG AAT TTG AAA TAT TTC 22562257 ATC CTT GTC ATG CTC AAA ATT TTG TTA CAT GCT TGT TAT TCA GAG TAT 23042305 AAT AAA GTT TTG TAC AGG CCT GAA AAA AAA AAA AAA AAA AAA AAA AAA 23522353 AAA AAA AAA AAA AAA AAA AAA AA237510.FP782A核苷酸序列(SEQ ID NO28)長度2630個堿基1 GGTTTTTATT CTGTTTATTA TATGTCTCTG TCTCTCTCTA TTGTGTGTGT GTGTGTGTGT61 GTGTGTGTGT GTGTGTGTGT GTGGTGCAGA AGTGCCACCC CCAGGGCCCT GTCAACCTCT121 CTTTTCTCCT CCATGGCTGT CTGCCTGCGT ATCTGTCTCT GAGAATCCTC GGGGCGGTCA181 GGGGATGTCA GGAGGGGAAG GAACCGCCCT CCCTATCTTG CTGCTCCTCT TGGCACTCAG241 GGGCACCTTC CATGGAGCCA GACCGGGTGG AGGGGCTTCT GGGATTTGGT GTCTGCTGCT301 GCCAGAGCAG GAACCCCCAG TCTAGGACTT GGGCATTTTA ACAGGGAGAA AGTAGTGGCT361 TCCCTTTTCT CTCTCTCCTC CTTTTTCCCT TTAAGCCCAC AGATTCAGGT CATGCCAAAA421 GCTCTCTGGT TGTAACCTGG AGACATGTGG AGGGGAATGG CGATGGGATT ATAGGACTCT481 CCCCATCTCG GGCCCTGACC CTGACCCTTG CCACCAACCC AAAGACAGCT GGTGGGTTTC541 CCCTTGGAGA CAATCCTGCG TTTGCCTGGG CCGGCCCTGG CTGCCCTCAG CTTTCGCTGA601 TCTGCCCGGC CTGGAGCCTC CCATCACCCC GCTTCTTGTT GGGCCTCAGG CACTGGTTAC661 CAGAAGGGGG TCTGGGTCTG CTCAGGATCA TGTTTTGTAG CACCTCCTGT TGGAGGGGTG721 GAGGGATGTT CCCCTGAGCC AGGCTGAGAC TAGAACCCCA TCTTCCCTGA GCCAGGCTGA
781 GACTAGAACC CCATCTTCCC CACCACGCCA CCCCTGTGGC TGCTACAGGA GCACAGTAGT841 GAAGGCCTGA GCTCCAGGTT TGAAAGACCC AACTGGAGCG TGGGGCGGGC AGGCAGGGGT901 TAGTGAAAGG ACACTTCCAG GGTTAGGACA GAGCATTTAG CCTTCTGGAA GAACCCCTGC961 CTGGGGTGGG ACTGTGCAGG CCAGAGAAGG TGGCATGGGC CTGAACCCAC CTGGACTGAC1021 TTCTGCACTG AAGCCACAGA TGGAGGGTAG GCTGGTGGGT GGGGGTGGTT CGTTCTCTAG1081 CCGGGGCAGA CACCCAGCTG GCTGGGTCCT TCCTCAGCCT TGCCTCCTCC TGTCCCCAAC1141 CCTTTCCTTT CCTCCTGCTT GCGGACTGCT TGGTCCCCTC TCCTTCCCTC CTTCCAGCTG1201 TTTCCTAGTT ACCACCTACC CCTGGCCGTG GACTGATCAG ACCAGCATTC AAAATAAAAG1261 TTTGTTCCAA GTTGACAGTG TGGTGCTCCC TGCCCAGCCC TCCAGGTGGA GGTGCTGCCA1321 CGGGAACGCA GTTCGTCTGC CTGCCCTGGG GCCCCTGGCG ACAGCTGGGA GCAGGGCAGT1381 GCTGTGAGGA GCCCAGCTTT CCCAGTCAGG CAGGCATGGC TTCCGTGTTC AGGCTCCCTC1441 ACCAGCTGGT GACACGGGAC AAGCTTACAA ACCTTCTCTG AACCTCAGTT TTCTCATTTA1501 CAAGAGCAAA GCCATCCATC ACCTTGTGTG GATTCAGAGA ATGTGAGGCC CTGGGGTGTC1561 CTACACAAGG GAAAGGCTTG CTCAGTGAGC GGTCTGCACA CCGTTAGCCA CCCTGCCACC1621 TCTGTGCCCT GGGCATGCTC CAAAGGAAAG CTCTGGCTGG GACTGCCAGG AGTCTCACAC1681 GCTCCTGTTG ACATTCCCAG CAGCCGCCCC TGAGGTCGAT GTTTGTTCTG TTTTTCTTTT1741 TCTTTTTTGA GACGGAGTCT CGCTGTGTTG CCAGGCTGGA GTGCAGTGGT GTGATCTCTG1801 CTCACTGCAA CCTCCGCCTG CCAGTTTCAA GTGATTCTCT GCCTCAGCCT TCTGAGTAGC1861 TGGGACTACA GGTGCACGCC ACCACGCCCA GCTAACTTTT TGTATTTTAG TAGAGACAGG1921 GTTTCGCCAT GTCGGCCAGG GTGGTCTTGA TCTCCTGACC TCATGATCCA CCCGCCTCAG1981 CCTCCCAAAG TGCTGGGATT ACAGGTATGA GCCACCGCAC CGGGCCTGTT CTATTTTTCT2041 AGTTAAGGGA ACTGAAGCTC AGAGAGGTGT CACCAGCAGG TGTTCATTCC CATGCCAGCC2101 TTGCCCCCCG GCTTTTCCCA GGCAGGCTCC TGCGTGCCCA CTGGCTCCAG CCTGGTCCTC2161 TGTCTCTTGG CTGCTTCACT CCTGCTCTTT GTCCCGACTC TGGCCCTGCT TACAGGGGCC2221 ACTACCTGCT GGTGCCTCCA TAACAAGCGT CTGGCGTTGA GACCCCTGGC ATGGCAGGGG2281 CTTTGGGGTC TGGTTTCCAC AAGGCTTAGC CATGGCAGAA CCTCGTTTTA TTTTAACTCT2341 TTGCCCCTAC AAACAAACAG CAGTACTTGC CAGAACCATT CTTGGGATTC AGGAGCTCGG2401 GCGACTGCCT TGGCCTCTGG CCGCACCCAG GAGGGTGGGG TTGGATCTGT GTAGTTGCCA2461 GGCCCACACC TGCCAGCAGG GGGCTGACTG GATCCATGCT TTACTGTGTT TAATGGGGGT2521 AACAGGGGTC CCTACAGCCC TCCCAGCTAA ACATTTGGAA CAAAACACCA GCCCTTTTGT2581 AGTGGATGCA GAATAAAATT GTTAATCCAA TCAAAAAAAA AAAAAAAAAAB核苷酸序列(SEQ ID NO29)長度130個氨基酸1 MGLNPPGLTS ALKPQMEGRL VGGGGSFSSR GRHPAGWVLP QPCLLLSPTL SFPPACGLLG61 PLSFPPSSCF LVTTYPWPWT DQTSIQNKSL FQVDSVVLPA QPSRWRCCHG NAVRLPALGP121 LATAGSRAVLC.核苷酸及氨基酸組合序列(SEQ ID NO30) 克隆號FP782起始編碼子995 ATG 終止編碼子1385 TGA蛋白質分子量13703.181G GTT TTT ATT CTG TTT ATT ATA TGT CTC TGT CTC TCT CTA TTG TGT 4647 GTG TGT GTG TGT GTG TGT GTG TGT GTG TGT GTG TGT GGT GCA GAA GTG 9495 CCA CCC CCA GGG CCC TGT CAA CCT CTC TTT TCT CCT CCA TGG CTG TCT142143 GCC TGC GTA TCT GTC TCT GAG AAT CCT CGG GGC GGT CAG GGG ATG TCA190191 GGA GGG GAA GGA ACC GCC CTC CCT ATC TTG CTG CTC CTC TTG GCA CTC238239 AGG GGC ACC TTC CAT GGA GCC AGA CCG GGT GGA GGG GCT TCT GGG ATT286287 TGG TGT CTG CTG CTG CCA GAG CAG GAA CCC CCA GTC TAG GAC TTG GGC334335 ATT TTA ACA GGG AGA AAG TAG TGG CTT CCC TTT TCT CTC TCT CCT CCT382383 TTT TCC CTT TAA GCC CAC AGA TTC AGG TCA TGC CAA AAG CTC TCT GGT430431 TGT AAC CTG GAG ACA TGT GGA GGG GAA TGG CGA TGG GAT TAT AGG ACT478479 CTC CCC ATC TCG GGC CCT GAC CCT GAC CCT TGC CAC CAA CCC AAA GAC526527 AGC TGG TGG GTT TCC CCT TGG AGA CAA TCC TGC GTT TGC CTG GGC CGG574575 CCC TGG CTG CCC TCA GCT TTC GCT GAT CTG CCC GGC CTG GAG CCT CCC 622623 ATC ACC CCG CTT CTT GTT GGG CCT CAG GCA CTG GTT ACC AGA AGG GGG 670671 TCT GGG TCT GCT CAG GAT CAT GTT TTG TAG CAC CTC CTG TTG GAG GGG 718719 TGG AGG GAT GTT CCC CTG AGC CAG GCT GAG ACT AGA ACC CCA TCT TCC 766767 CTG AGC CAG GCT GAG ACT AGA ACC CCA TCT TCC CCA CCA CGC CAC CCC 814815 TGT GGC TGC TAC AGG AGC ACA GTA GTG AAG GCC TGA GCT CCA GGT TTG 862863 AAA GAC CCA ACT GGA GCG TGG GGC GGG CAG GCA GGG GTT AGT GAA AGG 910911 ACA CTT CCA GGG TTA GGA CAG AGC ATT TAG CCT TCT GGA AGA ACC CCT 958959 GCC TGG GGT GGG ACT GTG CAG GCC AGA GAA GGT GGC ATG GGC CTG AAC10061 Met Gly Leu Asn 41007 CCA CCT GGA CTG ACT TCT GCA CTG AAG CCA CAG ATG GAG GGT AGG CTG10545 Pro Pro Gly Leu Thr Ser Ala Leu Lys Pro Gln Met Glu Gly Arg Leu 201055 GTG GGT GGG GGT GGT TCG TTC TCT AGC CGG GGC AGA CAC CCA GCT GGC110221 Val Gly Gly Gly Gly Ser Phe Ser Ser Arg Gly Arg His Pro Ala Gly 361103 TGG GTC CTT CCT CAG CCT TGC CTC CTC CTG TCC CCA ACC CTT TCC TTT115037 Trp Val Leu Pro Gln Pro Cys Leu Leu Leu Ser Pro Thr Leu Ser Phe 521151 CCT CCT GCT TGC GGA CTG CTT GGT CCC CTC TCC TTC CCT CCT TCC AGC119853 Pro Pro Ala Cys Gly Leu Leu Gly Pro Leu Ser Phe Pro Pro Ser Ser 681199 TGT TTC CTA GTT ACC ACC TAC CCC TGG CCG TGG ACT GAT CAG ACC AGC124669 Cys Phe Leu Val Thr Thr Tyr Pro Trp Pro Trp Thr Asp Gln Thr Ser 841247 ATT CAA AAT AAA AGT TTG TTC CAA GTT GAC AGT GTG GTG CTC CCT GCC129485 Ile Gln Asn Lys Ser Leu Phe Gln Val Asp Ser Val Val Leu Pro Ala 1001295 CAG CCC TCC AGG TGG AGG TGC TGC CAC GGG AAC GCA GTT CGT CTG CCT1342101 Gln Pro Ser Arg Trp Arg Cys Cys His Gly Asn Ala Val Arg Leu Pro 1161343 GCC CTG GGG CCC CTG GCG ACA GCT GGG AGC AGG GCA GTG CTG TGA GGA1390117 Ala Leu Gly Pro Leu Ala Thr Ala Gly Ser Arg Ala Val Leu *** 1311391 GCC CAG CTT TCC CAG TCA GGC AGG CAT GGC TTC CGT GTT CAG GCT CCC14381439 TCA CCA GCT GGT GAC ACG GGA CAA GCT TAC AAA CCT TCT CTG AAC CTC14861487 AGT TTT CTC ATT TAC AAG AGC AAA GCC ATC CAT CAC CTT GTG TGG ATT15341535 CAG AGA ATG TGA GGC CCT GGG GTG TCC TAC ACA AGG GAA AGG CTT GCT15821583 CAG TGA GCG GTC TGC ACA CCG TTA GCC ACC CTG CCA CCT CTG TGC CCT16301631 GGG CAT GCT CCA AAG GAA AGC TCT GGC TGG GAC TGC CAG GAG TCT CAC16781679 ACG CTC CTG TTG ACA TTC CCA GCA GCC GCC CCT GAG GTC GAT GTT TGT17261727 TCT GTT TTT CTT TTT CTT TTT TGA GAC GGA GTC TCG CTG TGT TGC CAG17741775 GCT GGA GTG CAG TGG TGT GAT CTC TGC TCA CTG CAA CCT CCG CCT GCC18221823 AGT TTC AAG TGA TTC TCT GCC TCA GCC TTC TGA GTA GCT GGG ACT ACA18701871 GGT GCA CGC CAC CAC GCC CAG CTA ACT TTT TGT ATT TTA GTA GAG ACA19181919 GGG TTT CGC CAT GTC GGC CAG GGT GGT CTT GAT CTC CTG ACC TCA TGA19661967 TCC ACC CGC CTC AGC CTC CCA AAG TGC TGG GAT TAC AGG TAT GAG CCA20142015 CCG CAC CGG GCC TGT TCT ATT TTT CTA GTT AAG GGA ACT GAA GCT CAG20622063 AGA GGT GTC ACC AGC AGG TGT TCA TTC CCA TGC CAG CCT TGC CCC CCG21102111 GCT TTT CCC AGG CAG GCT CCT GCG TGC CCA CTG GCT CCA GCC TGG TCC21582159 TCT GTC TCT TGG CTG CTT CAC TCC TGC TCT TTG TCC CGA CTC TGG CCC22062207 TGC TTA CAG GGG CCA CTA CCT GCT GGT GCC TCC ATA ACA AGC GTC TGG22542255 CGT TGA GAC CCC TGG CAT GGC AGG GGC TTT GGG GTC TGG TTT CCA CAA23022303 GGC TTA GCC ATG GCA GAA CCT CGT TTT ATT TTA ACT CTT TGC CCC TAC23502351 AAA CAA ACA GCA GTA CTT GCC AGA ACC ATT CTT GGG ATT CAG GAG CTC23982399 GGG CGA CTG CCT TGG CCT CTG GCC GCA CCC AGG AGG GTG GGG TTG GAT24462447 CTG TGT AGT TGC CAG GCC CAC ACC TGC CAG CAG GGG GCT GAC TGG ATC24942495 CAT GCT TTA CTG TGT TTA ATG GGG GTA ACA GGG GTC CCT ACA GCC CTC25422543 CCA GCT AAA CAT TTG GAA CAA AAC ACC AGC CCT TTT GTA GTG GAT GCA25902591 GAA TAA AAT TGT TAA TCC AAT CAA AAA AAA AAA AAA AAA A 263011.FP793A核苷酸序列(SEQ ID NO31)長度1694個堿基1 GCCCTCCCTG ACATTGCTGG CACACAGGCA TGATTGCTGG TTCCATTGGA TATGGATCTG61 GATTGTCAGC GTATTTGAAC AGTATTAAGG GAGGGTTTTG CAGTAGAGAC AGAAGGTGAC121 GTAAGGTGGT TCCTAAGGTG GGTTCGGTCA GTCCCCTAAT AGTTTGTTTT CAGTGTATTG181 AGACCAGGAG AATTGATTTA CTTCAGACCT ATTTTTTGAA ACTCCCTGTT GGTCTGGTGT241 CATGCGTTTA GAGAGACTCT GAACTTCGTT TTCTGTTTTC CTTAGATAAT GATAGCACTT301 CATGAGCACC ATATGTGAAG CACACATACG TTCTGTCTGA CTCTCAGAAC AGTGCCACAT361 TGGCATTGTC ATCATTTACA GATGACATCT GAGAGCTAGG GTGACTTGCC CAAGCCCAAG421 CAGCTGGTAG CAGAGTTGGG ATCTTAACCC TCACCACACC GGTGTTTTCA AGAGAGAACT481 TGGTCGTGGA GAACTGGAGA ACAGATACTG CCTAAGTTAC ATTTAGTTTT AGACTAATTT541 AATACTCCAT TTAAGAAACA AACAGAACAG CTGTGCAGTT AGGAAAGTGG AGGGGATTTG601 AATGAGGAGG AGGCGGGTTA GAGTTAGAAC CGTCTTTGCT GAACAAGTAG TGTGTTTGCA661 GAAAGGGAAG TTGAAGTTAC GTTGTCCTAA AATACAGCAA GGAAGAGGAG GTGCTTAATA721 CCACGGAAAA AAGTCTGTGT CATGTTTCTG TGAGGTTAAA AGTAATTTGA TAGTGTATGT781 CATGCTGCTG ACATATTCCA TGTGTTTGAT ATCTTCCCAG CAAAATAATC AGCTCTCATT841 TTCCCTTACA GAGTCAACTG TTCATTTTAT TTCAAAATTG GAGCATGTCG TCATGGAGAC901 AGGTGCTCTC GGTTGCACAA TAAACCGACG TTTAGCCAGA CCATTGCCCT CTTGAACATT961 TACCGTAACC CTCAAAACTC TTCCCAGTCT GCTGACGGTT TGCGCTGTGC CGTGAGCGAT1021 GTGGAGATGC AGGAACACTA TGATGAGTTT TTTGAGGAGG TTTTTACAGA AATGGAGGAG1081 AAGTATGGGG AAGTAGAGGA GATGAACGTC TGTGACAACC TGGGAGACCA CCTGGTGGGG1141 AACGTGTACG TCAAGTTTCG CCGTGAGGAA GATGCGGAAA AGGCTGTGAT TGACTTGAAT1201 AACCGTTGGT TTAATGGACA GCCGATCCAC GCCGAGCTGT CACCCGTGAC GGACTTCAGA1261 GAAGCCTGCT GCCGTCAGTA TGAGATGGGA GAATGCACAC GAGGCGGCTT CTGCAACTTC1321 ATGCATTTGA AGCCCATTTC CAGAGAGCTG CGGCGGGAGC TGTATGGCCG CCGTCGCAAG1381 AAGCATAGAT CAAGATCCCG ATCCCGGGAG CGTCGTTCTC GGTCTAGAGA CCGTGGTCGT1441 GGCGGTGGCG GTGGCGGTGG TGGAGGTGGC GGCGGACGGG AGCGTGACAG GAGGCGGTCG1501 AGAGATCGTG AAAGATCTGG GCGATTCTGA GCCATGCCAT TTTTACCTTA TGTCTGCTAG1561 AAAGTGTTGT AGTTGATTGA CCAAACCAGT TCATAAGGGG AATTTTTTTT AAAAAACAAC1621 AAAAAAAAAA ACATACAAAG ATGGGTTTCT GAATAAAATT TGTAGTGATA ACAGTAAAAA1681 AAAAAAAAAA AAAAB核苷酸序列(SEQ ID NO32)長度167個氨基酸1 MQEHYDEFFE EVFTEMEEKY GEVEEMNVCD NLGDHLVGNV YVKFRREEDA EKAVIDLNNR61 WFNGQPIHAE LSPVTDFREA CCRQYEMGEC TRGGFCNFMH LKPISRELRR ELYGRRRKKH121 RSRSRSRERR SRSRDRGRGG GGGGGGGGGG RERDRRRSRD RERSGRFC.核苷酸及氨基酸組合序列(SEQ ID NO33) 克隆號FP793起始編碼子 1027 ATG 終止編碼子1528 TGA 蛋白質分子量19713.961 GCC CTC CCT GAC ATT GCT GGC ACA CAG GCA TGA TTG CTG GTT CCA TTG 4849 GAT ATG GAT CTG GAT TGT CAG CGT ATT TGA ACA GTA TTA AGG GAG GGT 9697 TTT GCA GTA GAG ACA GAA GGT GAC GTA AGG TGG TTC CTA AGG TGG GTT144145 CGG TCA GTC CCC TAA TAG TTT GTT TTC AGT GTA TTG AGA CCA GGA GAA192193 TTG ATT TAC TTC AGA CCT ATT TTT TGA AAC TCC CTG TTG GTC TGG TGT240241 CAT GCG TTT AGA GAG ACT CTG AAC TTC GTT TTC TGT TTT CCT TAG ATA288289 ATG ATA GCA CTT CAT GAG CAC CAT ATG TGA AGC ACA CAT ACG TTC TGT336337 CTG ACT CTC AGA ACA GTG CCA CAT TGG CAT TGT CAT CAT TTA CAG ATG384385 ACA TCT GAG AGC TAG GGT GAC TTG CCC AAG CCC AAG CAG CTG GTA GCA432433 GAG TTG GGA TCT TAA CCC TCA CCA CAC CGG TGT TTT CAA GAG AGA ACT480481 TGG TCG TGG AGA ACT GGA GAA CAG ATA CTG CCT AAG TTA CAT TTA GTT528529 TTA GAC TAA TTT AAT ACT CCA TTT AAG AAA CAA ACA GAA CAG CTG TGC576577 AGT TAG GAA AGT GGA GGG GAT TTG AAT GAG GAG GAG GCG GGT TAG AGT624625 TAG AAC CGT CTT TGC TGA ACA AGT AGT GTG TTT GCA GAA AGG GAA GTT672673 GAA GTT ACG TTG TCC TAA AAT ACA GCA AGG AAG AGG AGG TGC TTA ATA720721 CCA CGG AAA AAA GTC TGT GTC ATG TTT CTG TGA GGT TAA AAG TAA TTT768769 GAT AGT GTA TGT CAT GCT GCT GAC ATA TTC CAT GTG TTT GAT ATC TTC816817 CCA GCA AAA TAA TCA GCT CTC ATT TTC CCT TAC AGA GTC AAC TGT TCA864865 TTT TAT TTC AAA ATT GGA GCA TGT CGT CAT GGA GAC AGG TGC TCT CGG912913 TTG CAC AAT AAA CCG ACG TTT AGC CAG ACC ATT GCC CTC TTG AAC ATT960961 TAC CGT AAC CCT CAA AAC TCT TCC CAG TCT GCT GAC GGT TTG CGC TGT 10081009 GCC GTG AGC GAT GTG GAG ATG CAG GAA CAC TAT GAT GAG TTT TTT GAG 10561 Met Gln Glu His Tyr Asp Glu Phe Phe Glu 101057 GAG GTT TTT ACA GAA ATG GAG GAG AAG TAT GGG GAA GTA GAG GAG ATG 110411 Glu Val Phe Thr Glu Met Glu Glu Lys Tyr Gly Glu Val Glu Glu Met 261105 AAC GTC TGT GAC AAC CTG GGA GAC CAC CTG GTG GGG AAC GTG TAC GTC 115227 Asn Val Cys Asp Asn Leu Gly Asp His Leu Val Gly Asn Val Tyr Val 421153 AAG TTT CGC CGT GAG GAA GAT GCG GAA AAG GCT GTG ATT GAC TTG AAT 120043 Lys Phe Arg Arg Glu Glu Asp Ala Glu Lys Ala Val Ile Asp Leu Asn 581201 AAC CGT TGG TTT AAT GGA CAG CCG ATC CAC GCC GAG CTG TCA CCC GTG 124859 Asn Arg Trp Phe Asn Gly Gln Pro Ile His Ala Glu Leu Ser Pro Val 741249 ACG GAC TTC AGA GAA GCC TGC TGC CGT CAG TAT GAG ATG GGA GAA TGC 129675 Thr Asp Phe Arg Glu Ala Cys Cys Arg Gln Tyr Glu Met Gly Glu Cys 901297 ACA CGA GGC GGC TTC TGC AAC TTC ATG CAT TTG AAG CCC ATT TCC AGA 134491 Thr Arg Gly Gly Phe Cys Asn Phe Met His Leu Lys Pro Ile Ser Arg1061345 GAG CTG CGG CGG GAG CTG TAT GGC CGC CGT CGC AAG AAG CAT AGA TCA 1392107 Glu Leu Arg Arg Glu Leu Tyr Gly Arg Arg Arg Lys Lys His Arg Ser1221393 AGA TCC CGA TCC CGG GAG CGT CGT TCT CGG TCT AGA GAC CGT GGT CGT 1440123 Arg Ser Arg Ser Arg Glu Arg Arg Ser Arg Ser Arg Asp Arg Gly Arg1381441 GGC GGT GGC GGT GGC GGT GGT GGA GGT GGC GGC GGA CGG GAG CGT GAC 1488139 Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Arg Glu Arg Asp1541489 AGG AGG CGG TCG AGA GAT CGT GAA AGA TCT GGG CGA TTC TGA GCC ATG 1536155 Arg Arg Arg Ser Arg Asp Arg Glu Arg Ser Gly Arg Phe ***1681537 CCA TTT TTA CCT TAT GTC TGC TAG AAA GTG TTG TAG TTG ATT GAC CAA 15841585 ACC AGT TCA TAA GGG GAA TTT TTT TTA AAA AAC AAC AAA AAA AAA AAC 16321633 ATA CAA AGA TGG GTT TCT GAA TAA AAT TTG TAG TGA TAA CAG TAA AAA 16801681 AAA AAA AAA AAA AA169412.FP944A核苷酸序列(SEQ ID NO34)長度2244個堿基1 GCCCAGTCTT GTGGCTTCAA ATGCTATCTG TGTGTGGATA GCTCCTCCAG TCCACACCTC61 TTTTCTGAAT CTTTTTTCAA ATTCACACAT GTGAATTTGA ATTCCAGGCT CATCACATCC121 AGGTGTGTTC CCCACACCTC CACCTGAATG TCTATTAGAA ATCTCACACC CCTCTTGTCC181 AAAACTGAGC TCTTGATCTT TAACCAGAAA CTTTATCTCA GCTATTGGCA ACTCCAGGTT241 TCTGTTTTGC TCAGGCCACA GACTTCAGAG TCATTCTCAC ACTGCCTTTT CTCTCATACA301 CCATTATGTA CCTGTCAGCA GGTCCCAAAT ATCTAGAATT TTGATTGCTT CACATCCCTA361 TAGCAACTCT CCTGGTTCAA GCCCATCATC ATCTGGATTT TTGGGAAGTG GTCTTAACTG421 GTGTGCTGCC CTTCCCCTCG GCTCTCAACC CTATTTTCAA CATAGCAGTC AGAATAATCT481 AAAATATAAA CCAGATCATA TCACTCCTCT GCTCAACACC CCCTCCCAAT ACCTTCATGT541 CATCCTCAGA GTTATTGTCC AAGCCTCTAA CTGTGGTCTA CAAGTCTTTA CATGATCTGT601 CCTGTTACAT TTTCCACTCT CGCTCCAGAC CTGACCTAAG AGGCTTTTCT CTGAACTTGC661 TAAACATGCT CTTACCTGAG GGTCCATTCC CACTGCCTCT GCCTGGAATG CTCTTCCCCA721 GACATGCATC TGCGTGGATC ATTTCCATGC CTCCTCAGGT CTTTGCCCTC ATGAAGCCTT781 CCCTGACAAC CCTATTTAAG ATTGTAATCC CCTCCCACAG TGGCCCCTAT CTGCTAGAGA841 CTGAATGTTT TTGTCCCCCC CAAAATTCCT ATGTTGAAGC CTTAATCTCA ACATAGGAGG901 TTTGGCCTTT GTGAGTTAGT TTTAGATGAG GTCATGTGGG TAATAGAATT AGTGCATTTA961 TAAGGGCGTG AAGAGCCCTC ACTGTGAGGA AACCAGAATG TAAGCCTTCA CCAGAACTTC1021 TTCATGCTGG CACCCTGGTC TTAGACTTCC CAGCCACTAG ATCTGTGAGA AAGAAATGTT1081 TGTTGTTTAA GCCACCCTGT CTATGGTACT CTTGTTACAG CAACCTGAAC TAAGACACTA1141 TCCCTCTCCC CTGCTTTCTT TTTCTGTTAT CACCATAATT AATGTTTTAC TTATATATGA1201 TTTGTTAATG TATGTCTCTT CCCACTAGAA ACCGAATTCT ATGACAGCAA GGGTTTTTGT1261 TTTCATTATT GTCATATTAC CTGTGCCTGG CATGTGATAA GCCCTAAGTA CTTGTTGACT1321 GAATTAACAT ATGAGATCTG TGAGTCTGAA AAAAGAAGTA CATCATTCCT TCACATGTCA1381 TTTTGAGCCA CTGTTAACAG ATTACATAAC TGTTATTGGA AGTGCCTCAC TACTCCATTT1441 GGAAAGTATT CCTGGAATAC ACGATGAATG ACTCAGTAGA AGTTCTGGCT ATGGGGGAGT1501 GCCATCAATA AATAAAAATA ATACCATTGC CTGTTGGTTA TAAGTTGCTG TCACAGACTA1561 TGAAGGTATT TGAATTGTAT TTTCAGGAAG AGAAACAGAT ATGCAACCAA TCTGATTTGG1621 TTCCACACCC TGCCACAGAA GTCCCAAAGG AGAAGCAAAT GCCACTTGTA GACTCAAACT1681 CTGGACTTCA TTCTCAGCAC CATCTCTTAA CCTACTGAGT AAATCCTATG AACCTGACTA1741 GGGTGGCAAC TGAAGTTGTA GTACTTTCTG TCTTCAAAGG AGGGTGAACC TGGAGTATGT1801 TGGAAGAAGT GTTAGGTTCA TTAGAGACAC CTCTTTCATA ACTGCTGTCA CCTAGAATGT1861 CTATTCTCTA AGCACCTTCT TGAAAGAAGC ACATTCCCCC AGGAGGAGGA AATGGTTTGT1921 TTTCTTTAGT GACAGTTGGC CCAGGATCCT AAGGTAAAGG AGTATGGGCA CTAGACAAAA1981 TGAGTTTTAT AATAGTCGAT TGGAAGGAAT GGAAGTTTTT GAATCACAGG CTTCTGCCTT2041 GAAAGGGCAA GTCCGTGGTG GTCATGAACC ACCCAGAGTG TGTACAAGGC TCCTGCCAGA2101 AGAAATGCCT GTAGGATTAA AAGCAAAACA GCAGAATCAA AAAGGAAGGG CACGATGATG2161 CCCAGGTGCA GCCTATATTA TTAACAGACA AGGAAAGAAT CCAAATAAAA GTTCTGTAAA2221 CCAAAAAAAA AAAAAAAAAA AAAAB核苷酸序列(SEQ ID NO35)長度119個氨基酸1 MSSSELLSKP LTVVYKSLHD LSCYIFHSRS RPDLRGFSLN LLNMLLPEGP FPLPLPGMLF61 PRHASAWIIS MPPQVFALMK PSLTTLFKIV IPSHSGPYLL ETECFCPPQN SYVEALISTC.核苷酸及氨基酸組合序列(SEQ ID NO36)克隆號FP944起始編碼子537 ATG 終止編碼子894 TAG 蛋白質分子量 13317.991 GC CCA GTC TTG TGG CTT CAA ATG CTA TCT GTG TGT GGA TAG CTC CTC 4748 CAG TCC ACA CCT CTT TTC TGA ATC TTT TTT CAA ATT CAC ACA TGT GAA 9596 TTT GAA TTC CAG GCT CAT CAC ATC CAG GTG TGT TCC CCA CAC CTC CAC143144 CTG AAT GTC TAT TAG AAA TCT CAC ACC CCT CTT GTC CAA AAC TGA GCT191192 CTT GAT CTT TAA CCA GAA ACT TTA TCT CAG CTA TTG GCA ACT CCA GGT239240 TTC TGT TTT GCT CAG GCC ACA GAC TTC AGA GTC ATT CTC ACA CTG CCT287288 TTT CTC TCA TAC ACC ATT ATG TAC CTG TCA GCA GGT CCC AAA TAT CTA335336 GAA TTT TGA TTG CTT CAC ATC CCT ATA GCA ACT CTC CTG GTT CAA GCC383384 CAT CAT CAT CTG GAT TTT TGG GAA GTG GTC TTA ACT GGT GTG CTG CCC431432 TTC CCC TCG GCT CTC AAC CCT ATT TTC AAC ATA GCA GTC AGA ATA ATC479480 TAA AAT ATA AAC CAG ATC ATA TCA CTC CTC TGC TCA ACA CCC CCT CCC 527528 AAT ACC TTC ATG TCA TCC TCA GAG TTA TTG TCC AAG CCT CTA ACT GTG 5751 Met Ser Ser Ser Glu Leu Leu Ser Lys Pro Leu Thr Val 13576 GTC TAC AAG TCT TTA CAT GAT CTG TCC TGT TAC ATT TTC CAC TCT CGC 62314 Val Tyr Lys Ser Leu His Asp Leu Ser Cys Tyr Ile Phe His Ser Arg 29624 TCC AGA CCT GAC CTA AGA GGC TTT TCT CTG AAC TTG CTA AAC ATG CTC 67130 Ser Arg Pro Asp Leu Arg Gly Phe Ser Leu Asn Leu Leu Asn Met Leu 45672 TTA CCT GAG GGT CCA TTC CCA CTG CCT CTG CCT GGA ATG CTC TTC CCC 71946 Leu Pro Glu Gly Pro Phe Pro Leu Pro Leu Pro Gly Met Leu Phe Pro 61720 AGA CAT GCA TCT GCG TGG ATC ATT TCC ATG CCT CCT CAG GTC TTT GCC 76762 Arg His Ala Ser Ala Trp Ile Ile Ser Met Pro Pro Gln Val Phe Ala 77768 CTC ATG AAG CCT TCC CTG ACA ACC CTA TTT AAG ATT GTA ATC CCC TCC 81578 Leu Met Lys Pro Ser Leu Thr Thr Leu Phe Lys Ile Val Ile Pro Ser 93816 CAC AGT GGC CCC TAT CTG CTA GAG ACT GAA TGT TTT TGT CCC CCC CAA 86394 His Ser Gly Pro Tyr Leu Leu Glu Thr Glu Cys Phe Cys Pro Pro Gln 109864 AAT TCC TAT GTT GAA GCC TTA ATC TCA ACA TAG GAG GTT TGG CCT TTG 911110 Asn Ser Tyr Val Glu Ala Leu Ile Ser Thr *** 120912 TGA GTT AGT TTT AGA TGA GGT CAT GTG GGT AAT AGA ATT AGT GCA TTT 959960 ATA AGG GCG TGA AGA GCC CTC ACT GTG AGG AAA CCA GAA TGT AAG CCT10071008 TCA CCA GAA CTT CTT CAT GCT GGC ACC CTG GTC TTA GAC TTC CCA GCC10551056 ACT AGA TCT GTG AGA AAG AAA TGT TTG TTG TTT AAG CCA CCC TGT CTA11031104 TGG TAC TCT TGT TAC AGC AAC CTG AAC TAA GAC ACT ATC CCT CTC CCC11511152 TGC TTT CTT TTT CTG TTA TCA CCA TAA TTA ATG TTT TAC TTA TAT ATG11991200 ATT TGT TAA TGT ATG TCT CTT CCC ACT AGA AAC CGA ATT CTA TGA CAG12471248 CAA GGG TTT TTG TTT TCA TTA TTG TCA TAT TAC CTG TGC CTG GCA TGT12951296 GAT AAG CCC TAA GTA CTT GTT GAC TGA ATT AAC ATA TGA GAT CTG TGA13431344 GTC TGA AAA AAG AAG TAC ATC ATT CCT TCA CAT GTC ATT TTG AGC CAC13911392 TGT TAA CAG ATT ACA TAA CTG TTA TTG GAA GTG CCT CAC TAC TCC ATT14391440 TGG AAA GTA TTC CTG GAA TAC ACG ATG AAT GAC TCA GTA GAA GTT CTG14871488 GCT ATG GGG GAG TGC CAT CAA TAA ATA AAA ATA ATA CCA TTG CCT GTT15351536 GGT TAT AAG TTG CTG TCA CAG ACT ATG AAG GTA TTT GAA TTG TAT TTT15831584 CAG GAA GAG AAA CAG ATA TGC AAC CAA TCT GAT TTG GTT CCA CAC CCT16311632 GCC ACA GAA GTC CCA AAG GAG AAG CAA ATG CCA CTT GTA GAC TCA AAC16791680 TCT GGA CTT CAT TCT CAG CAC CAT CTC TTA ACC TAC TGA GTA AAT CCT17271728 ATG AAC CTG ACT AGG GTG GCA ACT GAA GTT GTA GTA CTT TCT GTC TTC17751776 AAA GGA GGG TGA ACC TGG AGT ATG TTG GAA GAA GTG TTA GGT TCA TTA18231824 GAG ACA CCT CTT TCA TAA CTG CTG TCA CCT AGA ATG TCT ATT CTC TAA18711872 GCA CCT TCT TGA AAG AAG CAC ATT CCC CCA GGA GGA GGA AAT GGT TTG19191920 TTT TCT TTA GTG ACA GTT GGC CCA GGA TCC TAA GGT AAA GGA GTA TGG19671968 GCA CTA GAC AAA ATG AGT TTT ATA ATA GTC GAT TGG AAG GAA TGG AAG20152016 TTT TTG AAT CAC AGG CTT CTG CCT TGA AAG GGC AAG TCC GTG GTG GTC20632064 ATG AAC CAC CCA GAG TGT GTA CAA GGC TCC TGC CAG AAG AAA TGC CTG21112112 TAG GAT TAA AAG CAA AAC AGC AGA ATC AAA AAG GAA GGG CAC GAT GAT21592160 GCC CAG GTG CAG CCT ATA TTA TTA ACA GAC AAG GAA AGA ATC CAA ATA22072208 AAA GTT CTG TAA ACC AAA AAA AAA AAA AAA AAA AAA A 224權利要求
1.一種分離的具有抑癌功能的人蛋白,其特征在于,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35;或其保守性變異多肽、或其活性片段、或其活性衍生物。
2.如權利要求1所述的多肽,其特征在于,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35。
3.一種分離的多核苷酸,其特征在于,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼如權利要求1和2所述多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。
4.如權利要求3所述的多核苷酸,其特征在于,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35。
5.如權利要求3所述的多核苷酸,其特征在于,該多核苷酸的序列選自下組SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36的編碼區(qū)序列或全長序列。
6.一種載體,其特征在于,它含有權利要求3所述的多核苷酸。
7.一種遺傳工程化的宿主細胞,其特征在于,它是選自下組的一種宿主細胞(a)用權利要求6所述的載體轉化或轉導的宿主細胞;(b)用權利要求3所述的多核苷酸轉化或轉導的宿主細胞。
8.一種具有抑癌功能的人蛋白活性的多肽的制備方法,其特征在于,該方法包含(a)在適合表達具有抑癌功能的人蛋白的條件下,培養(yǎng)權利要求7所述的宿主細胞;(b)從培養(yǎng)物中分離出具有抑癌功能的人蛋白活性的多肽。
9.一種能與權利要求1所述的具有抑癌功能的人蛋白特異性結合的抗體。
10.一種藥物組合物,其特征在于,它含有安全有效量的權利要求1所述的蛋白以及藥學上可接受的載體。
全文摘要
本發(fā)明公開了一類新的具有抑癌功能的人蛋白,編碼此多肽的多核苷酸和經重組技術產生該多肽的方法。本發(fā)明還公開了此多肽用于治療多種疾病如癌癥等的方法。本發(fā)明還公開了抗此多肽的拮抗劑及其治療作用。本發(fā)明還公開了編碼這類新的具有抑癌功能的人蛋白的多核苷酸的用途。
文檔編號C12N15/64GK1403479SQ0112672
公開日2003年3月19日 申請日期2001年9月12日 優(yōu)先權日2001年9月12日
發(fā)明者顧健人, 楊勝利 申請人:上海新世界基因技術開發(fā)有限公司