專利名稱:早期肝細(xì)胞的產(chǎn)生及其用途的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及胚胎干細(xì)胞肝向分化。具體而言,本發(fā)明涉及非人哺乳動物胚胎干細(xì)胞定向分化為肝細(xì)胞的系統(tǒng)、技術(shù),以及由此所獲得的分化細(xì)胞的用途。
背景技術(shù):
GATA4和R)xa2是定型內(nèi)胚層發(fā)育和肝臟發(fā)生相關(guān)的核心轉(zhuǎn)錄因子。Foxa2和 GATA4可能作為先鋒因子,以一種預(yù)先結(jié)合基因的promoter/enhancer并改變其染色質(zhì)結(jié)構(gòu)的方式,在定型內(nèi)胚層(DE)細(xì)胞中調(diào)控Alb等肝臟發(fā)育相關(guān)基因的表達(dá),并且可能存在一種廣泛的共同調(diào)控的作用方式。因此,在DE細(xì)胞中尋找GATA4和R)xa2在全基因組的下游基因以及GATA4和R)xa2共同的下游基因,不僅能更好地闡明這一問題,而且能發(fā)掘更多的DE和肝臟發(fā)育相關(guān)的重要基因。但是,尋找兩者在早期胚胎發(fā)育中的下游基因這一方案目前存在兩大技術(shù)障礙第一、要從胚胎組織中分離到數(shù)量足夠做免疫共沉淀(Chromatin Immunoprecipitation, ChIP)的DE細(xì)胞十分困難;第二、要得到特定胚胎發(fā)育階段的高純度和同步的細(xì)胞群體有相當(dāng)難度。在全基因組水平定位蛋白和DNA的相互作用對于理解轉(zhuǎn)錄調(diào)控非常必要。轉(zhuǎn)錄因子結(jié)合位點的精確定位對于解讀多種生物學(xué)過程背后的轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)大有裨益。染色質(zhì)免疫共沉淀結(jié)合測序 Chromatin immunoprecipitationfollowed by sequencing (ChlP-seq) 是近年來興起的研究全基因組水平的DNA和轉(zhuǎn)錄因子等蛋白相互作用的一種新技術(shù)。最先使用ChlP-seq的研究工作發(fā)表在2007年。不同于之前的基于芯片雜交的ChIP_chip技術(shù),ChlP-seq技術(shù)中對目的DNA片段直接測序,因此,具有更高的分辨率,更低的背景噪音, 更大的基因組覆蓋率。目前,ChlP-seq正發(fā)展成一種研究轉(zhuǎn)錄調(diào)控必不可少的工具。針對以上技術(shù)障礙,本發(fā)明人利用ESC體外誘導(dǎo)分化產(chǎn)生的DE細(xì)胞作為模型來尋找GATA4和R)xa2在全基因組的下游基因以及GATA4和R)xa2在全基因組的共同下游基因。 這些基因信息已經(jīng)整理為兩個基因文庫和相關(guān)的生物信息學(xué)數(shù)據(jù)文庫。
發(fā)明內(nèi)容
本申請?zhí)峁┮环N基因芯片,該芯片包含至少一條表1、表2或表3所示的核苷酸序列。在一個具體實施方式
中,所述芯片含有表1、表2或表3所列核苷酸序列中的至少 100條核苷酸序列。在一個具體實施方式
中,所述芯片含有表1、表2或表3所列核苷酸序列中的至少 1000條核苷酸序列。在一個具體實施方式
中,所述芯片含有表3所列核苷酸序列中的至少1200條核苷酸序列。在一個具體實施方式
中,所述芯片含有表3所列核苷酸序列中的至少1600條核苷酸序列。
本申請?zhí)峁┮环N檢測基因表達(dá)水平的方法,該方法包括使生物學(xué)樣品與本申請的基因芯片接觸,以及檢測感興趣基因的表達(dá)。本申請?zhí)峁┮环N鑒定培養(yǎng)的多能干細(xì)胞是否發(fā)生了肝向分化的方法,該方法包括將所述培養(yǎng)的多能干細(xì)胞與本申請的基因芯片接觸,以及檢測感興趣基因的表達(dá),其中,如果在該基因芯片上獲得陽性結(jié)果,表明該多能干細(xì)胞發(fā)生了肝向分化。本申請?zhí)峁┮环N篩選發(fā)生了肝向分化的多能干細(xì)胞的方法,所述方法包括將所述多能干細(xì)胞與本申請的基因芯片接觸,以及檢測感興趣基因的表達(dá),其中,如果在該基因芯片上獲得陽性結(jié)果,表明該多能干細(xì)胞為肝向分化的多能干細(xì)胞。在一個具體實施方式
中,所述多能干細(xì)胞為哺乳動物多能干細(xì)胞。在一個具體實施方式
中,所述哺乳動物多能干細(xì)胞為非人哺乳動物多能干細(xì)胞。本申請也涉及Tcf 12 (Genbank ID :21406)在控制多能干細(xì)胞肝向分化中的應(yīng)用。
圖1中,(A)顯示ES細(xì)胞肝向誘導(dǎo)分化的模式圖,包括兩個階段由小鼠ES細(xì)胞分化為定型內(nèi)胚層細(xì)胞;由定型內(nèi)胚層細(xì)胞繼續(xù)分化到早期肝細(xì)胞;(B)顯示誘導(dǎo)第5天 (Day 5)細(xì)胞的典型形態(tài)(Scale bar,100 μ m) ; (C)顯示 FACS 分析Day 5 細(xì)胞中 CXCR4+ECD+ 或CXCR4+c-kit+DE細(xì)胞的比例以及c-kit和胞內(nèi)Foxa2共表達(dá)情況;(D)顯示定量PCR分析從Day 0到Day 5細(xì)胞中譜系相關(guān)基因表達(dá)的動態(tài)變化(Mean士 SEM ;η = 3) ; (E)顯示第 5天FACS分析的ESC和兩個細(xì)胞群(CXCR4+E⑶+,CXCR4+EOT_)中DE細(xì)胞相關(guān)基因的表達(dá)情況,如轉(zhuǎn)錄物的QPCR分析所示(數(shù)據(jù)顯示為Mean士SEM ;η = 3) ; (F)顯示第5天FACS分析的ESC和三個細(xì)胞群(CXCR4+ECD+,CXCR4+EOT and CXCIT4ECD+)中DE細(xì)胞相關(guān)基因的表達(dá)情況,如轉(zhuǎn)錄子的QPCR分析所示(數(shù)據(jù)顯示為Mean士SEM ;η = 3) ; (D)、(E)和(F)中,ESC 中的轉(zhuǎn)錄物水平歸一化到1。圖2顯示DE細(xì)胞被誘導(dǎo)分化為早期肝細(xì)胞。(A)顯示第7天對分化的細(xì)胞進(jìn)行 Afp免疫染色的圖像(下圖),上圖同一視野的相差圖(Scale bar, 100 μ m) ; (B)顯示第5和 7天的分化細(xì)胞中轉(zhuǎn)錄物的QPCR分析早期肝細(xì)胞標(biāo)記物的表達(dá)(數(shù)據(jù)顯示為Mean士SEM ; η = 3),第5天的轉(zhuǎn)錄物水平歸一化為1 ; (C)顯示第7天的分化細(xì)胞中胞內(nèi)Afp和胞外的EpCAM的FACS分析,圖中顯示了 Afp+或EpCAM+細(xì)胞的百分比;⑶顯示第5天的細(xì)胞經(jīng)MACS分選為兩種細(xì)胞(c-kit+細(xì)胞或c-kit_細(xì)胞)分化至第7天時的細(xì)胞形態(tài)學(xué);(E) 分別顯示4種細(xì)胞類型(第5天c-kit_細(xì)胞(D5c_)、第5天的c-kit+細(xì)胞(D5c+)、由第5 天的c_kit_細(xì)胞分化至第7天細(xì)胞(D7c_)和由第5天的c-kit+細(xì)胞分化至第7天細(xì)胞 (D7c+))中Afp和Ttr轉(zhuǎn)錄物的QPCR分析。D5c_細(xì)胞中的轉(zhuǎn)錄物水平歸一化為1 (數(shù)據(jù)顯示為 Mean士 SEM ;η = 3)。圖3顯示使用ChIP-Seq對第5天的DE細(xì)胞進(jìn)行分析所得的R)xa2和GATA4結(jié)合位點的全基因組圖譜。圖中顯示了相對于RefSeq基因的R)xa2 (A)和GATA(B)結(jié)合位點的分布,以及各位置的結(jié)合位點的百分比。圖4顯示了基序分析,顯示了 R)xa(A)或GATA(B)結(jié)合位點內(nèi)排在前三位的基序。圖5顯示R)xa2和GATA4結(jié)合的基因和他們的重疊部分。圖中,Venn圖顯示R)xa2 和GATA結(jié)合的基因的重疊部分,包含了位于TSS的士31Λ內(nèi)的結(jié)合峰。括號內(nèi)的數(shù)值是Foxa2或GATA4結(jié)合的全部基因總和。圖6顯示了 R)xa2結(jié)合㈧、GATA4結(jié)合⑶以及兩者都結(jié)合(C)的基因的GO分析。標(biāo)尺代表排在前8位的GO分類的富集顯著性P值。圖7顯示分化自Gata4_KD (A)、Foxa2_KD (B)或?qū)φ誆SCs的分化至第5天的細(xì)胞中隨機選擇的10個靶基因的轉(zhuǎn)錄物水平的QPCR分析。分化自對照ESC的第5天細(xì)胞的轉(zhuǎn)錄物水平歸一化為1 (數(shù)據(jù)顯示為Mean士 SEM ;η = 3) *Ρ < 0. 05 ;< 0. 01。圖8顯示了對DE發(fā)育重要的R)xa2和GATA4共結(jié)合基因。UCSC基因組瀏覽器中分另Ij以紫色和綠色痕跡顯示Foxa2和GATA4 ChiP-Seq數(shù)據(jù)集中Eomes (A)、Hhex(B)、 Sox 17 (C), Gsc (D), Gata4 (E), Foxa2 (F)基因座的wig形式測序讀數(shù)。各圖底部顯示了 RefSeq基因的痕跡。Foxa2和GATA4ChiP_Seq數(shù)據(jù)集之間的重疊峰分別由紅色盒表示。圖9顯示肝臟發(fā)育中Foxa2和GATA4共同結(jié)合的基因。UCSC基因組瀏覽器中分別以紫色和綠色痕跡顯示!^0X32和GATA4ChiP-Seq數(shù)據(jù)集中Afp (A)、Ttr (B)、Timd2 (C) 和HdxI(D)基因座的wig形式測序讀數(shù)。各圖底部顯示了 RefSeq基因的痕跡。Foxa2和 GATA4ChiP_Seq數(shù)據(jù)集之間的重疊峰分別由紅色盒表示。圖10顯示R)xa2/GATA4基序兩者中共同存在的峰以及ChiP-Seq數(shù)據(jù)中的非規(guī)范基序。其中,圖(A)顯示排在前3位的R)xa2或GATA4ChiP_Seq峰內(nèi)的非R)xa2或非GATA-2 基序。圖(B)和(C)顯示Verm圖譜,顯示含前10個R)xa2(B)或GATA4(C)基序的峰與含前三個非R)xa2(B)或非GATA4(C)基序的峰的重疊。括號中的數(shù)值是含有各基序的峰的數(shù)量。圖11顯示Tcf 12而非Tcf3結(jié)合具有非典型的基序的選擇位點。在第5天的細(xì)胞中使用抗Γ^οχε 、GATA4、Tcf3、Tcfl2的抗體進(jìn)行ChIP試驗,用IgG作為對照。采用QPCR 分析各因子對選自圖9B所示的R)xa2ChIP-Seq重疊峰(A)或圖9C所示的GATA4ChIP_Seq 重疊峰(B)中的位點的相對結(jié)合水平,并將其歸一化至輸入DNA(數(shù)據(jù)顯示為Mean士SEM ;η =3)圖12顯示第5天的DE細(xì)胞中1Tcf 12于R)xa2和GATA4共結(jié)合所選擇的位點。顯示了對第5天細(xì)胞中三中不同的順序(Foxa2-GATA4,F(xiàn)oxa2-Tcfl2和iTcf 12-GATA4)中的選定位點進(jìn)行^q-ChIP試驗的PCR結(jié)果,其中顯示了擴增自inputDNA、第1次ChIP DNA和各 Seq-ChIP DNA 的產(chǎn)物,引物靶向位點 Traf3ipl, Mrpl 15 和 Sgpp2 (圖 11)。
具體實施例方式本發(fā)明利用ChIP-Seq技術(shù),在ESCs體外分化得到的DE細(xì)胞中定位了 GATA4和 R)xa2在全基因組范圍的靶基因。分別得到6053個GATA4的靶基因(表2,表中的登陸號為各基因在Genbank中的ID)和3120個R)xa2的靶基因(表1,表中的登陸號為各基因在 Genbank中的ID)。有1721個基因(表3,表中的登陸號為各基因在Genbank中的ID)同時出現(xiàn)在兩組靶基因列表中,統(tǒng)計學(xué)分析顯示為極顯著的重合,這說明GATA4和R)xa2在全基因組范圍共有相當(dāng)多的靶基因。對靶基因進(jìn)行Gene Ontology(GO)分析,將得到的所有GO分類按照出現(xiàn)頻率進(jìn)行排序,GO分類中排在前8位的結(jié)果如下FoXa2靶基因的前8個GO中有4個是和發(fā)育或形態(tài)發(fā)生過程相關(guān)的,GATA4靶基因的GO中前6個都是和發(fā)育或形態(tài)發(fā)生過程相關(guān)的,而
5GATA4和R)xa2共有的靶基因的前8個GO全都是和發(fā)育或形態(tài)發(fā)生過程相關(guān)的。這說明在分化得到的DE細(xì)胞中,無論是GATA4還是R)xa2都主要調(diào)控發(fā)育相關(guān)的基因。而且,那些可能被GATA4和R)xa2共同調(diào)控的基因也絕大部分都是和發(fā)育過程相關(guān)的。通過GATA4或 Foxa2的Knockdown實驗驗證了 GATA4和R)xa2對靶基因的轉(zhuǎn)錄調(diào)控功能。選取一些DE發(fā)育和肝臟發(fā)生相關(guān)的關(guān)鍵基因,并在ChIP-Seq數(shù)據(jù)中查看了 GATA4 和R)xa2在其調(diào)控區(qū)上的峰分布(包含結(jié)合位置和結(jié)合強度的信息),結(jié)果發(fā)現(xiàn)在這些基因的調(diào)控區(qū)都存在毗鄰的或重合的GATA4和R)xa2的peaks,說明兩者在這些共有的靶基因上有緊鄰的或共同的結(jié)合位點。在這些基因中,包括DE發(fā)育相關(guān)的關(guān)鍵基因,如Eomes, Hhex, Soxl7, Gsc, GATA4,F(xiàn)oxa20此外,還包括對于DE的肝向分化必需卻還未在DE表達(dá)的基因,如 Afp,Ttr、Timd2。本發(fā)明首次揭示了肝向分化過程中轉(zhuǎn)錄因子R)xa2和GATA4在全基因組范圍內(nèi)的轉(zhuǎn)錄調(diào)控,這將為胚胎發(fā)育中的肝臟發(fā)生和ESC肝向分化兩方面的研究提供非常有用的信息。例如,利用GATA4和Foxa2分別結(jié)合的基因信息以及兩者共有的靶基因信息,用于制作基因芯片,利用基因芯片可高敏感地定量、定性檢測基因表達(dá)水平研究,這將為研究肝臟發(fā)生和干細(xì)胞的肝向分化過程的基因表達(dá)分析帶來極高的應(yīng)用價值。因此,本申請?zhí)峁┮环N基因芯片,所述基因芯片上包含有本發(fā)明表1、2或3所揭示的至少一條基因序列。該芯片可用于定量、定性檢測基因表達(dá)水平,研究肝臟發(fā)生和肝多潛能干細(xì)胞的肝向分化過程中的基因表達(dá)情況。該基因芯片所列出的基因,大部分將在肝臟發(fā)生和多潛能干細(xì)胞的肝向分化過程中表達(dá)。通過檢測待檢測的樣本,如果在該基因芯片上獲得陽性結(jié)果,則表明多能干細(xì)胞發(fā)生了肝向分化。本申請?zhí)峁┮环N檢測基因表達(dá)水平的方法,該方法包括使生物學(xué)樣品與本申請的基因芯片接觸,以及檢測感興趣基因的表達(dá)。該生物學(xué)樣品可來自,例如哺乳動物(如人、 小鼠等)的干細(xì)胞,例如來自分化過程中的干細(xì)胞。本申請不涉及人胚胎干細(xì)胞。本申請也包括所述基因芯片在定量、定性檢測基因表達(dá)水平中的用途,以及在研究肝臟發(fā)生和肝細(xì)胞的肝向分化過程中的基因表達(dá)情況中的用途??刹捎帽绢I(lǐng)域周知的技術(shù)制備本發(fā)明的基因芯片。本申請的基因芯片上可含有至少一條表1、表2或表3所列出的核苷酸序列。在一個實施方式中,本申請的基因芯片上含有表1所列核苷酸序列中的至少8、9、 10、11、12、13、14、15或更多到3120條(以及這些范圍內(nèi)的任意整數(shù))核苷酸序列。在一個實施方式中,本申請的基因芯片上含有表1所列核苷酸序列中的至少8、9、 10、11、12、13、14、15或更多到6053條(以及這些范圍內(nèi)的任意整數(shù))核苷酸序列。在一個實施方式中,本申請的基因芯片上含有表1所列核苷酸序列中的至少8、9、 10、11、12、13、14、15或更多到1721條(以及這些范圍內(nèi)的任意整數(shù))核苷酸序列。在一個具體實施方式
中,芯片上含有至少1500條、至少1800條、至少2000條、至少MOO條、至少觀00條、至少四00條、至少四50條、至少3000條表1所列出的核苷酸序列。在另一個具體實施例中,芯片上含有表1所列出的全部3120條核苷酸序列。在一個具體實施方式
中,在另一個芯片上含有至少1500條、至少1800條、至少 2000條、至少MOO條、至少洲00條、至少3000條、至少4000條、至少5000條、至少5500 條、至少5800條、至少6000條表2所列出的核苷酸序列。在另一個具體實施例中,芯片上含有表2所列出的全部6053條核苷酸序列。在一個具體實施方式
中,在另一個芯片上含有至少500條、600、700、800、900、 1000、1100、1200、1300、1400、1500、1600、1650、1680、1700 條表 3 所列出的核苷酸序列。在
另一個具體實施例中,芯片上含有表3所列出的全部1721條核苷酸序列。應(yīng)當(dāng)理解,對于基因芯片上存在的表1、2或3中的任意一條核苷酸序列而言,該核苷酸序列可存在于芯片上的多個位點。例如,對于Afp基因,其在芯片上的多個位點中存在。應(yīng)理解,雖然上文列出的一些具體的數(shù)值和范圍,但是本申請的芯片可含有1 3120中任意整數(shù)數(shù)量的表1的核苷酸序列,1 6053中任意整數(shù)數(shù)量的表2的核苷酸序列, 或者1 1720中任意整數(shù)數(shù)量的表3的核苷酸序列。可采用本領(lǐng)域周知的技術(shù)對芯片上的核苷酸序列進(jìn)行標(biāo)記。本申請的芯片可用于各種分化的(例如分化中的)多能干細(xì)胞的檢測。這些多能干細(xì)胞可來自各種哺乳動物,包括人、小鼠等。本申請的多能干細(xì)胞不包括人的胚胎干細(xì)胞。本申請的檢測、鑒定、篩選方法中所使用到的試劑是本領(lǐng)域常用的試劑。在獲得本申請的芯片之后,本領(lǐng)域技術(shù)人員可采用本領(lǐng)域的常規(guī)技術(shù)實施所述檢測、鑒定或篩選。本申請也涉及Tcfl2在控制多能干細(xì)胞肝向分化中的應(yīng)用。例如,通過調(diào)控Tcfl2 的表達(dá),可調(diào)節(jié)多能干細(xì)胞的肝向分化。以下將以具體實施方式
的形式描述本申請。除非另有說明,所列出的試劑等都是市售可得的試劑。實驗方法和材料1.1.1 細(xì)胞小鼠胚胎干細(xì)胞系E14. 1由中國科學(xué)院上海生物化學(xué)與細(xì)胞生物學(xué)研究所干細(xì)胞技術(shù)平臺提供。Ell. 5天的小鼠胎肝細(xì)胞取自ICR品系。1.1.2培養(yǎng)基和生長因子Neurobasal 培養(yǎng)基,DMEM/F12 培養(yǎng)基,N2,B27, BSA solution 購自 hvitrogen 公司。MTG 購自 Sigma 公司。Gelatin 和 Enzyme-Free Solution 購自 Millipore 公司, collagen IV 購自 BD 公司。生長因子activin A、BMP4、bFGF購于R&D公司。生長因子LIF購于Millipore公司。1.1.3 抗體FACS實驗的CXCR4、c_kit的抗體,同亞型對照IgG購于R&D公司。ChIP實驗的 Foxa2、GATA4、iTcf 12、Tcf3 的抗體和對照 IgG 購于 Santa Cruz 公司。1.1.4 質(zhì)粒pSIREN-RetroQ(Clontech)。1.1. 5試劑和試劑盒質(zhì)粒提取用的Maxi-pi^pkit,總 RNA抽提用的 RNeasy kit,QPCR用的 QuantiiTect SYBR Green PCR Mastermix購自 Qiagen 公司。ChIP 實驗用的Protein A magnetic beads,ProtenaseK和DTT購自hvitrogen公司,RNaseA購自Qiagen公司。其余試劑如無特別說明均購自Sigma公司。1. 2胚胎干細(xì)胞的培養(yǎng)和分化本文使用的是小鼠ES細(xì)胞系E14.1。誘導(dǎo)分化之前,用無酶溶液消化,傳入1 1 混合的 Neurobasal 和 DMEM/F12 培養(yǎng)基(含有 Ν2(0· 5χ),Β27(0· 5χ),0· 05% BSA solution, 0. 15mM MTG, 10ng/ml ΒΜΡ4,1000U/ml LIF),鋪在凝膠包被過的培養(yǎng)皿上。每天換液,如此傳2-3代后,消化ESCs用上述培養(yǎng)基(撤去BMP4和LIF,另添加30ng/ml activin Α)重懸,并鋪在小鼠膠原IV包被過的培養(yǎng)皿上培養(yǎng)5天,培養(yǎng)基隔天換液。做肝向分化時,分化到Day 5的細(xì)胞在相同培養(yǎng)基(另添加30ng/ml BMP4和lOng/ml bFGF)中繼續(xù)培養(yǎng)2天。1. 3shRNA載體構(gòu)建,逆轉(zhuǎn)錄病毒顆粒的包裝及ESCs的感染shRNA oligos采用hvitrogen官方網(wǎng)站提供的BLOCK-iT在線軟件設(shè)計 (https//rnaidesiRner. invitroRen. com/rnaiexpress/)。每對 oligos 退火后連接至Ij予頁先酶切過的逆轉(zhuǎn)錄病毒的RNAi載體pSIREN-RetroQ(Clontech)。測序確定裝入后,shRNA 質(zhì)粒和helper質(zhì)粒共轉(zhuǎn)HEK 293細(xì)胞以包裝逆轉(zhuǎn)錄病毒顆粒。Foxa2 的 shRNA 序列
Oligo 1SEQ ID NO:92: GATCCggagacLLLgggagagcLLLgTTCAAGAGACAMGCTCTCCCAAAGTCTCCTTTTTTGCTAGCGOligo 2SEQ ID N0:1 AATTCGCTAGCAAAAAAggagactttgggagagctttgTCTCTTGAACAAAGCTCTCCCAAAGTCTCCG
GATA4 的 shRNA 序列
Oligo 1SEQ ID N0:2 GATCCggttgtgtctacagcacaataTTCAAGAGATATTGTGCTGTAGACACAACCTTTTTTGCTAGCGOligo 2SEQ ID NO:3 AATTCGCTAGCAAAAAAggttgtgtctacagcacaataTCTCTTGAATATTGTGCTGTAGACACAACCG感染ESCs時,將ESCs和收到的經(jīng)過濾的病毒上清孵育,并在30°C離心1. 5小時。 然后撤去病毒上清,換成新鮮的ESC培養(yǎng)基。M小時后加入Puromycin以篩選成功感染的細(xì)胞。1.4流式細(xì)胞分析消化細(xì)胞,預(yù)冷的PBS (0. 5 % BSA)洗2_3次,然后用抗小鼠CXCR4,抗小鼠c_kit 或相應(yīng)的同亞型對照IgG作染色。1. 5總RNA的抽提,逆轉(zhuǎn)錄和實時定量PCR(QPCR)總RNA用RNeasy kit抽提并用隨機引物逆轉(zhuǎn)錄成cDNA。QPCR儀器 Mx3000Pcycler (Stratagene),試劑QuantiTect SYBR Green PCR Mastermix0程序如下1)94°C,15 分鐘2)擴增94°C,30 秒;60°C,30 秒;72°C,30 秒;循環(huán) 40 次
3)做溶解曲線以確定產(chǎn)物特異性。數(shù)據(jù)用MxftOsoftware(Mratagene)進(jìn)行分析。基因表達(dá)水平都?xì)w-的水平。QPCR的引物序列如下Q_Foxa2_FCAGCGGCCAGCGAGTTAAAGTATG(SEQ ID NO 4)Q_Foxa2_RCGTTCATGTTGCTCACGGAAGAGT(SEQ ID NO 5)Q_Gata4_FGGGCCAACCCTGGAAGACA(SEQ ID NO 6)Q_Gata4_RCACAGGTAGTGTCCCGTCCCATC(SEQ ID NO 7)Q_Afp_FCGAGGAGAAATGGTCCGGCTGT(SEQ ID NO 8)Q_Afp_RCCAGAGTTCACAGGGCTTGCTTC(SEQ I D NO :9)Q_Ttr_FTCGTACTGGAAGACACTTGGCATTT(SEQ ID NO :10)Q_Ttr_RCTGCGATGGTGTAGTGGCGATG(SEQ ID NO 11)Q-Pdpn-FGTCCACCTCAGCAACCTCAGACC(SEQ ID NO 12)Q-Pdpn-RCAAGACGCCAACTATGATTCCAACC(SEQ ID NO 13)Q-Notum-FGGCAGTCGGCGGTGGTTACTCT(SEQ ID NO :14)Q-Notum-RCCAGTACCTGTGCGTGTGTGTGG(SEQ ID NO 15)Q-Apoe-FCGAGTGGCAAAGCAACCAACC(SEQ ID NO 16)Q-Apoe-RCTTCCGTCATAGTGTCCTCCATCAG(SEQ ID NO 17)Q-Bcllla-FCGCCGCAAGCAAGGCAAA(SEQ ID NO 18)Q-Bcllla-RGCCCACAGGTGAGAAGGTCGTG (SEQ ID NO 19)Q-TbcId2b-FATCCGCCCACACACTTCCAG(SEQ ID NO :20)Q-TbcId2b-RAGTCCTGCTGTCCCACTTCATCA(SEQ ID NO :21)Q-Ric8-FGGACCGCACAGAGGAGTTCCA(SEQ ID NO 22)Q-Ric8-RAGGGCCAGAAGCACATCCAAACA(SEQ ID NO 23)Q-Fermt2-FGGGTGATGCTGAAGTTGGTGGAA(SEQ ID NO 24)Q-Fermt2-RGCAGGCGGAGCAGTTTGTG(SEQ ID NO 25)
Q-Nek2-FACGTTTGTTGGCACACCCTATTACA(SEQ ID NO 26)Q-Nek2-RGCGCCTGAACCTCCCTTCC(SEQ ID NO 27)Q-Zscan12-FGGTGGTGACTGTGCTGGAGGATTT(SEQ ID NO :28)Q-Zscanl2-RCACGCTGGGTTTCTGCTCTGTTG(SEQ ID NO :29)Q-Kdm2a-FGGCATCCCTGGAGTGGTTTCTTT (SEQ ID NO :30)Q-Kdm2a-RATTTGTTGGTTTGGAGCTTCTCTTCC(SEQ ID NO 31)Q-Nrp2-FCCGCCCACCATCATCTCCTC(SEQ ID NO 32)Q-Nrp2-RTGGATACTTCTCTGGAAACCCTGGA(SEQ ID NO 33)Q-Epha2-FAGCTCCGGGCAGTCGGTTTC(SEQ ID NO 34)Q-Epha2-RGTTCTGCATCAGGTCCCACCCTTT(SEQ ID NO :35)Q-Add3-FGATGGAGCAGAGGAAGCGAGTCA(SEQ ID NO 36)Q-Add3-RCGAGGAGAAGCCCGAGAAGGAG(SEQ ID NO 37)Q-Mllt4-FGTTTGTTGCGTATGATGAGGAGGAG(SEQ ID NO 38)
“化到Gapdh
Q-Mllt4-R TGCCAGGTAAGTCTGCGTCTTGG(SEQ ID NO 39)Q-Mrp137-F GACCAGCTCCTTTACCGGCACTT(SEQ ID NO :40)Q-Mrp137-R AGTAGGGCACCAGGCTCCAGAAA(SEQ ID NO 41)Q-Cask-F TGCTCAGTGGCTGTTTGCCTTT(SEQ ID NO 42)Q-Cask-R CATGCGGCGTACTAGGTCTTTGG(SEQ ID NO 43)Q-Bai2-F CGAGGGCACAGGAGAGGAGGT(SEQ ID NO :44)Q-Bai2-R AGCAGAACCCGAGGCATTAGGG(SEQ ID NO 45)Q-Fadsl-F AACCCAGCTTTGAACCCACCAAG(SEQ ID NO 46)Q-Fadsl-R AGAGGATGAAGGGCACCAAGGAA(SEQ ID NO 47)Q-Dazapl-F CGACGAAATCGGGAAGCTCTTTG(SEQ ID NO 48)Q-Dazapl-R TGACACAATCCACAACCTCACCATAC(SEQ ID NO 49)1. 6染色質(zhì)免疫共沉淀(ChIP)用分化到Day 5的細(xì)胞做ChIP吋,將約IO7個細(xì)胞在甲醛溶液中室溫交聯(lián)10 分鐘。加入Glycine至終濃度為0.125M以終止交聯(lián)。細(xì)胞用預(yù)冷的PBS清洗幾次,在裂解 緩沖液中重懸并裂解,將細(xì)胞浸在冰水浴中通過超聲將DNA打碎成200bp到500bp的短片 段。超聲儀器=Misonix 4000Sonicatoro保留1/30的超聲后全細(xì)胞裂解液用來抽提input DNA。剰余裂解液與預(yù)先和2. 5 ii g抗體或IgG孵育過的25 ill蛋白A磁珠懸液在4°C孵育 過夜。ChIP 抗體禾ロ IgG :anti-mFoxa2, anti_mGATA4,anti-mTcf3, anti_mTcfl2,正常山羊 /兔IgG。過夜后的珠先用RIPA溶液再用TE-NaCl溶液洗。然后加入洗脫液,并在65°C放 置15分鐘。將洗脫的IP產(chǎn)物和預(yù)留的全細(xì)胞裂解液在65°C過夜解交聯(lián)。用RNase A,蛋白 酶K和苯酚氯仿異戊醇先后純化和抽提DNA。最后用乙醇沉淀法,并重懸于100 u 1 IOmM Tris-HCl。用胎肝細(xì)胞做ChIP實驗時,在冰上分離并累積30-40個Ell. 5的小鼠胎肝組織。 收集到的組織在含甲醛的PBS中冰上勻漿并室溫交聯(lián)10分鐘。之后步驟同上述細(xì)胞 ChIP。ChIP的PCR引物序列如下ChIP_Afp_F6. 2_-2. 2 gggctcaggaagtgacaaacagaa(SEQ ID NO 50)ChIP_Afp_R6. 2__2. 2 gccctctccgttatctgccaca(SEQ ID NO :51)ChIP_Foxa2_F3_-0. 1 aatgctttgggcaccttggattt(SEQ ID NO :52)ChIP_Foxa2_R3_-0. 1 cggcctggagagacccgtttag(SEQ ID NO :53)ChIP_Afp_F8_-5. 7tcctcacaagatgccagattcca(SEQ ID NO :54)ChIP_Afp_R8_-5. 7gactttatgccctcaaatgaatgacg(SEQ ID NO :55)ChIP_Foxa2_F5_+6. 3 GGCCCTTCTGGTGTCTTCCTCAC(SEQ ID NO 56)ChIP_Foxa2_R5_+6. 3 GCCGCTGCACCCAGCAAT (SEQ ID NO :57)ChIP_Gata4_Fl. 2_+5. 5 ATGGAGGTGCAGTTTGGATGGA(SEQ ID NO 58)ChIP_Gata4_Rl. 2_+5. 5 CCAGGGAGTGGCAAGGGATAGA(SEQ ID NO 59)ChIP_Eomes_Fl_+9 GGCATTCCTAAGATGGAGTGTCAG(SEQ ID NO 60)ChIP_Eomes_Rl_+9GCCGGGTTCCCAGACCTT (SEQ ID NO :61)ChIP_Hhex_F2. 2_+2. 9 TCCATTATGCCAGGGCTTCACAC (SEQ ID NO 62)ChIP_Hhex_R2. 2_+2. 9 TTACCCTTGAGTCCTGCCTGGTT(SEQ ID NO :63)
ChIP_Ttr_F2. 2_-16. 2 GTGAGATAACCGCCCCTCTTCC(SEQ ID NO 64)ChIP_Ttr_R2. 2_-16. 2 TCTGGAGCCATGTCAGCCACT(SEQ ID NO :65)ChIP_Timd2_Fl. 2_+22. 6 GGTGTCCATTAGCAAGCCAGCA(SEQ ID NO :66)ChIP_Timd2_Rl. 2_+22. 6 GGTGGATGGGAAAGTGCAAGG(SEQ ID NO :67)ChIP_Soxl7_FlTGCCAGCTAATTGTGTTTGTCTGTG(SEQ ID NO 68)ChIP_Soxl7_RlGCAGATATGAAGGACGGGAGATTG(SEQ ID NO 69)ChIP_Pbxl_FlAACCAAACCCAAAGGCACATTCA (SEQ ID NO 70)ChIP_Pbxl_RlCAGGAGCGACTCTGGAGCTGTGT(SEQ ID NO :71)ChIP_Spagl6_FCTTCCTCTGGCCTCTTGGCAGGT(SEQ ID NO :72)ChIP_Spagl6_RCCATTTATCTGTGCTGTTTGCATTTGT(SEQ ID NO :73)ChIP_Epha4_FAGCTCTGGCTGGCTGGGAAGTT(SEQ ID NO :74)ChIP_Epha4_RCCATCACTGTATCCTGCTGGCTTG(SEQ ID NO 75)ChIP_Traf3ipl_FGGTGTGTTTTAGCTCCACGGAAGA(SEQ ID NO 76)ChIP_Traf3ipl_RTGCAGAGACGTTGAAATCCGAAA(SEQ ID NO 77)ChIP_Adiporl_FGCTGATGGATTGCTTTCAACACC(SEQ ID NO 78)ChIP_Adiporl_RAGACTGCTTGCCACACACCACTT(SEQ ID NO :79)ChIP_Pfdn2_FACGAGACCAAACAAGGCGGTAAA(SEQ ID NO 80)ChIP_Pfdn2_RGGGCTCAAGGAAGTAGACTCAGATGG(SEQ ID NO 81)ChIP_Mrpll5_F GCCTGGGCTTCCATTAACTGTCTC (SEQ ID NO 82)ChIP_Mrpll5_R GGGGCATTCTTAACCTGCTTCC(SEQ ID NO 83)ChIP_Boll_F ACCACAGCAGGGAGGGAGGAGA(SEQ ID NO 84)ChIP_Boll_R GCGCTGCACACCTTGGCTCTATC(SEQ ID NO 85)ChIP_Sgpp2_F AGCCTGGGGATTTGTCCTGCT(SEQ ID NO 86)ChIP_Sgpp2_R TCCACACAGGGATGCTTTCTCTCC(SEQ ID NO 87)ChIP_Dis312_F CCAGATCCTTTACCTCCTGTGTGATG(SEQ ID NO 88)ChIP_Dis312_R AAGAGTGCAGCGACCAAACCAAA(SEQ ID NO 89)ChIP_Gbx2_F GCACAGCAGGCATTGTTTGTAGGA(SEQ ID NO 90)ChIP_Gbx2_R CCGCAGGAGAGCTGCCAAGATAG(SEQ ID NO 91)1. 7Sequential ChIP(Seq-ChIP)此實驗分兩步ChIP,第一歩ChIP同上,只是洗脫時用60iU IOmM DTT溶液,并在 37°C放置30分鐘。50 u 1洗脫產(chǎn)物用裂解緩沖液稀釋到1ml,用作第二步ChIP的起始樣品, 第二步ChIP的抗體和珠準(zhǔn)備同普通ChIP—致,洗脫時用普通ChIP的洗脫液。后續(xù)DNA純 化和抽提同普通ChIP。1.8大規(guī)模平行測序(Massively Parallel Sequencing)以及數(shù)據(jù)分析ChIP-Seq文庫是用 Illumina ChIP-Seq library preparation kit 并根據(jù)使用說 明構(gòu)建的。簡單概括,約1 5ng的DNA進(jìn)行末端修復(fù)產(chǎn)生平端片斷,然后用Klenow exo-和 dATP在3 ’端加上dA單鏈末端。隨后,連接上11 luminaadaptors跑2 %瓊脂糖膠以去除多余 的adaptors,并分離出目的長度的模板,以便產(chǎn)生最佳的聚類和測序。用跑膠純化的片段作 為模板進(jìn)行18個循環(huán)的PCR擴增以富集最終的測序文庫。產(chǎn)生的文庫用Illumina GenomeAnalyzer II 測序。序列讀數(shù)用 SOAP[Li,R. ^,SOAP short oligonucleotide alignment program. Bioinformatics, 2008. 24(5) :ρ· 713-4.]定位到小鼠的基因組(mm9)上,允許最大4個錯配。定位到獨特基因組位點的讀數(shù)被保留做進(jìn)一步分析。算法TIR0E[Ho,L.等, An embryonic stem cell chromatin remodeling complex, esBAF, is an essential component of the core pluripotency transcriptional network. Proc Natl Acad Sci U S A,2009. 106(13) :p. 5187-91 ;Kallin, Ε. Μ.等 Genome—wide uH2A localization analysis highlights Bmil-dependent deposition of the mark at repressed genes. PLoS Genet, 2009. 5(6) :p. e 1000506.]被用來鑒定那些 P < 0. 01 的峰。為了確定 R)xa2 和GATA4的結(jié)合基因,峰被定位到基因啟動子區(qū)(士31Λ TSS)。1.9基序分析基序分析用DME2 進(jìn)行[Smith,A. D.等,Mining ChlP-chip data for transcription factor and cofactor binding sites. Bioinformatics,2005.21Suppl 1 :p. i403-12 ;Smith, A. D. , P. Sumazin 禾口 Μ· Q. Zhang, Identifying tissue-selective transcription factor binding sites invertebrate promoters. Proc Natl Acad Sci USA, 2005. 102 (5) :p. 1560-5.]。排在前 2000 名的 Foxa2 的結(jié)合位點和前 1500 名的GATA4結(jié)合位點及側(cè)翼序列作為+和-序列被輸入DME2。在運行DME2之前,簡單重復(fù)(單一重復(fù)> 5堿基如CCCCCC,和雙重復(fù)> 9堿基如ACACACACAC)被從+和-序列中移去。然后用默認(rèn)參數(shù)運行DME2得到8個核苷酸長度的排在最前的基序。最終的基序 logos 用 WebLogo 生成[Crooks, G. Ε.等,WebLogo :a sequence logo generator. Genome Res, 2004. 14(6) :p. 1188-90.]。運行 STORM[Schones, D. E.,A. D. Smith,和 Μ. Q. Zhang, Statistical significance of cis-regulatory modules. BMC Bioinformatics,2007. 8 p. 19.]用基序 PWM 來搜索 TRANSFAC 數(shù)據(jù)庫[Matys,V.等,TRANSFAC and its module TRANSCompel transcriptional gene regulation in eukaryotes. Nucleic Acids Res, 2006.34(Database issue) :p.D108—10.]。1.10統(tǒng)計分析進(jìn)行兩組之間比較的QPCR結(jié)果用Mudent's t test統(tǒng)計分析。兩組基因之間重疊的經(jīng)驗 P-value 用 Monte Carlo 模擬來計算。Fisher,s exact test 的 P-values 也被計算并用 Benjamini 禾口 Hochberg correction[Benjamini, Y. and Y. Hochberg, Controlling the False Discovery Rate—a Practicaland Powerful Approach to Multiple Testing. Journal of the RoyalStatistical Society Series B-Methodological,1995.57 (1) p. 289-300.]為多次測驗修正。2.結(jié)果1.建立胚胎干細(xì)胞肝向分化的技術(shù)系統(tǒng),該系統(tǒng)將ES細(xì)胞的肝向誘導(dǎo)分化分成兩個階段由小鼠ES細(xì)胞分化為定型內(nèi)胚層細(xì)胞;由定型內(nèi)胚層細(xì)胞繼續(xù)分化到早期肝細(xì)胞〔參見中國專利申請20081020M12. 8,本文將其全文以引用的方式納入本文?!?. 1由小鼠ES細(xì)胞到定型內(nèi)胚層細(xì)胞分化模型的建立本發(fā)明人建立了一個單層培養(yǎng)條件下的無血清誘導(dǎo)分化體系,分兩步將小鼠ESC 誘導(dǎo)成DE細(xì)胞,再接著誘導(dǎo)成早期肝細(xì)胞(圖1A)。第一步,在activinA的作用下以大約 50 % 的效率定向分化得到 DE 細(xì)胞(C)(CR4+ECD+ 或C)(CR4+c-kit+)。CXCR4+ECD+ 或CXCR4+c_kit+是廣泛用來表征DE細(xì)胞的兩套分子標(biāo)記組合。從ESC誘導(dǎo)5天后,培養(yǎng)體系中呈現(xiàn)一單層的上皮樣貼壁細(xì)胞,細(xì)胞與細(xì)胞之間呈典型的緊密連接狀(圖1B)。本發(fā)明人用流式細(xì)胞術(shù)(Fluorescent Activated CellSorting, FACS)分析了分化得到的細(xì)胞中 CXCR4+ECD+或 CXCR4+c-kit+群體的比例,DE的誘導(dǎo)效率維持在50-60%的水平(圖1C)。細(xì)胞表面與胞內(nèi)的雙染色FACS表明,DE重要的標(biāo)記基因R)xa2的表達(dá)局限在表征DE的CXCR4+c-kit+群體中(圖1C)。為了進(jìn)一步證明分化得到的DE細(xì)胞的真實“身份”,本發(fā)明人接著觀察了分化過程中整個細(xì)胞群體的基因動態(tài)表達(dá)情況。典型的DE標(biāo)記基因如R)xa2、GATA4、Gsc, Soxl7等都呈現(xiàn)非常顯著的上調(diào)(圖1D)。與定型內(nèi)胚層的前體細(xì)胞群體一一中內(nèi)胚層 (mesendoderm)分化有關(guān)的幾個基因如Brachyury、Eomes、Mixll等呈現(xiàn)上調(diào)又下調(diào)的動態(tài)表達(dá)特征(圖1D)。這些都與DE在體內(nèi)胚胎發(fā)育過程中的基因動態(tài)表達(dá)情況非常吻合。本發(fā)明人進(jìn)一步確認(rèn)了分化得到的CXCR4+E⑶+細(xì)胞的DE屬性。通過FACS分選不同的細(xì)胞群體,再經(jīng)RT-qPCR分析,本發(fā)明人觀察到幾個典型的DE標(biāo)記基因如R)xa2、 GATA4、(isc和Sox 17的表達(dá)顯著富集在CXCR4+E⑶+群體中(圖1E)。與此相反,CXCR4+E⑶-群體呈現(xiàn)泛中胚層的標(biāo)記基因Meoxl的高表達(dá)(圖1F)。這些基因表達(dá)的特征與之前本領(lǐng)域的文獻(xiàn)報道很吻合,即ESC體外分化得到的CXCR4+E⑶+和CXCR4+EOT_群體分別表征早期定型內(nèi)胚層和中胚層群體。本發(fā)明人同時觀察了在這一分化體系中,其他胚層細(xì)胞的產(chǎn)生情況。本發(fā)明人選取了 Rexl、Gatal、Sox7、Cdx2、Soxl 分別作為 ESC、造血中胚層(hematopoietic mesoderm)、 胚外內(nèi)胚層(VE)、滋養(yǎng)外胚層(trophectoderm)和神經(jīng)外胚層(neuroectoderm)細(xì)胞的分子標(biāo)記,發(fā)現(xiàn)他們的表達(dá)大都沒有顯著的上調(diào),基本維持在ESC本底的低表達(dá)水平(圖1D)。 本發(fā)明人也注意到,造血中胚層標(biāo)記基因fetal的表達(dá)水平在第5天發(fā)生了約15倍左右的上調(diào)。鑒于本發(fā)明人在第5天得到了一定數(shù)量的CXCR4+ECD—細(xì)胞群體,本發(fā)明人推測fetal 較低水平的上調(diào)可能由具備中胚層性質(zhì)的CXCR4+ECD_細(xì)胞群體所貢獻(xiàn)。但是相比DE標(biāo)記基因表達(dá)水平上千倍的上調(diào),本發(fā)明人仍然可以初步判斷,本發(fā)明人建立的ESC體外誘導(dǎo)分化方法是針對DE細(xì)胞較為特異的。如上提到的,VE細(xì)胞的生成是對從ESC往DE細(xì)胞分化的極大干擾。本發(fā)明人通過QPCR檢測了分化過程中VE的標(biāo)記基因Sox7,沒有發(fā)現(xiàn)它的表達(dá)水平較ESC本底的低水平發(fā)生變化(圖1D)。但是本發(fā)明人也注意到,本發(fā)明的分化體系在第5天也同時生成了一個CXCR4_EOT+的細(xì)胞小群體,而CXCR4_EOT+之前曾被報道可以表征ESC體外分化體系中的 VE細(xì)胞。為了嚴(yán)格排除來自VE細(xì)胞的干擾,于是本發(fā)明人檢測了這個CXCR4_ECD+群體的基因表達(dá)情況。代表VE的標(biāo)記基因Sox7在其中的表達(dá)量甚至低于ES細(xì)胞本底的水平(圖 1E),這意味著它不可能是VE細(xì)胞。有趣的是,本發(fā)明人反而觀察到這個群體呈現(xiàn)出Nanog 和Brachyury的高表達(dá),他們分別是從ESC到DE的中間態(tài)細(xì)胞一一上胚層(印iblast)和中內(nèi)胚層的分子標(biāo)記。這使得本發(fā)明人推斷這可能是一個ESC在往DE細(xì)胞的分化過程中產(chǎn)生的未同步化的不顯著的前體細(xì)胞群體。本發(fā)明人通過一系列的實驗證據(jù)證明了在本發(fā)明得到的DE高效分化系統(tǒng)中嚴(yán)格杜絕了 VE細(xì)胞的生成,這無論對于本發(fā)明人接下來的由DE細(xì)胞起始的肝向分化,還是在DE 細(xì)胞中進(jìn)行的ChIP實驗,都創(chuàng)造了非常便利的條件。
1. 2由定型內(nèi)胚層細(xì)胞繼續(xù)分化到早期肝細(xì)胞模型的建立根據(jù)已有的肝臟胚胎發(fā)生的知識,來自胚胎中的心肌組織(cardiac mesoderm)的 FGF信號和來自橫膈膜(s印turn transversum)的BMP信號對由DE往肝向分化起著至關(guān)重要的作用。本發(fā)明人在之前建立的ESC往DE的誘導(dǎo)培養(yǎng)系統(tǒng)的基礎(chǔ)上,在第5天分化得到的DE細(xì)胞的培養(yǎng)液中添加這兩個生長因子的重組蛋白,繼續(xù)誘導(dǎo)2天。第7天時,細(xì)胞呈現(xiàn)類似肝細(xì)胞的更為典型且一致的上皮樣形態(tài)(圖2A)。同時本發(fā)明人也檢測到了一些肝臟特異基因如Afp、Ttr、Timd2、Fabpl、Leap2的表達(dá)從第5天到第7天的顯著上調(diào)(圖2B)。 其中,Afp和Ttr兩個分子標(biāo)記的激活表達(dá)被廣泛用于表征DE細(xì)胞分化來的肝向細(xì)胞命運的獲得。除了 RNA水平的QPCR實驗,本發(fā)明人也在蛋白水平上,通過細(xì)胞免疫熒光 (Immunocytofluorescence, ICF)和胞內(nèi) FACS(intracellular FACS)實驗,確證了 Afp+細(xì)胞在第7天細(xì)胞中的比例超過60% (圖2A&2C)。本發(fā)明人還用FACS技術(shù)檢測了表達(dá)早期胎肝細(xì)胞的表面分子標(biāo)記EpCAM的細(xì)胞在誘導(dǎo)第7天的整個細(xì)胞群體中的比例。本發(fā)明人發(fā)現(xiàn)EpCAM+細(xì)胞占40%以上(圖2C)。這些指標(biāo)都說明,本發(fā)明人的ESC體外誘導(dǎo)系統(tǒng)可以高效地分化得到早期肝細(xì)胞。為了證實本發(fā)明人的體外分化系統(tǒng)與體內(nèi)胚胎發(fā)育的相關(guān)過程非常吻合,本發(fā)明人必須確證第7天產(chǎn)生的這些Afp+細(xì)胞是由DE而不是其它胚層細(xì)胞分化來的,因為其它胚層譜系來源的細(xì)胞也可能表達(dá)Afp,譬如VE。因此,本發(fā)明人利用磁珠分選(Magnetic Activated Cell Sorting,MACS)技術(shù)將分化第5天的細(xì)胞分離成c_kif和c_kit+兩個群體。因為在本發(fā)明人的分化系統(tǒng)中,第5天的細(xì)胞>94%都是CXCR4+(圖1C),所以可近似認(rèn)為c-kit+細(xì)胞群體可以指代表征DE的CXCR4+c-kit+細(xì)胞群體。本發(fā)明人將c_kit_和 c-kit+兩個群體的細(xì)胞分別在如上建立的肝向誘導(dǎo)條件下繼續(xù)培養(yǎng)2天。第7天,兩個群體的細(xì)胞呈現(xiàn)迥異的形態(tài)。由第5天的c-kit_群體分化得來的細(xì)胞在肝向誘導(dǎo)條件下,在第7天呈現(xiàn)散在分布的類間充質(zhì)樣形態(tài)(mesenchymal-like state)(圖2D)。相反地,由指代DE細(xì)胞的第5天的c-kit+群體分化得來的細(xì)胞,在同樣誘導(dǎo)條件下,在第7天則呈現(xiàn)成簇存在的上皮樣形態(tài)(印ithelial state),這與早期肝細(xì)胞的形態(tài)非常類似(圖2D)。除了形態(tài),本發(fā)明人進(jìn)一步檢測了這兩個細(xì)胞群體在第7天的基因表達(dá)情況。本發(fā)明人發(fā)現(xiàn)在由第5天的c-kit+群體分化得來的細(xì)胞中,早期肝臟標(biāo)記基因Afp和Ttr的表達(dá)水平要遠(yuǎn)高于來自第5天的c-kit_群體的細(xì)胞中的表達(dá)水平(圖2E)。這些結(jié)果都說明,本發(fā)明人在分化第7天的細(xì)胞中觀察到的早期肝臟基因的表達(dá),主要是由第5天的DE 細(xì)胞分化來的早期肝細(xì)胞貢獻(xiàn)的。2.在ESC衍生的DE細(xì)胞中利用ChIP-Seq技術(shù)分別尋找GATA4和R)xa2在全基因組的結(jié)合位點2. 1GATA4和Foxa2的ChIP-Seq在體外分化的DE細(xì)胞中進(jìn)行目前,對GATA4和R)xa2的轉(zhuǎn)錄調(diào)控機制的認(rèn)識主要來自于胚胎發(fā)育中對少數(shù)基因如Albumin等的研究,為了更清楚地理解兩者在胚胎發(fā)育過程中的下游基因和轉(zhuǎn)錄調(diào)控機制,需要通過高通量的技術(shù)手段找到更多的下游基因和在全基因組結(jié)合位點的信息。 染色質(zhì)免疫共沉淀結(jié)合大規(guī)模測序技術(shù)(Chromatin Immunoprecipitation followed by massively parallel Sequencing,ChIP-Seq)是近年來興起的用于研究轉(zhuǎn)錄因子等核蛋白
14與染色質(zhì)DNA結(jié)合關(guān)系的一種新興技術(shù)。已經(jīng)有實驗室通過此技術(shù)在成體肝細(xì)胞和肝癌細(xì)胞系中嘗試尋找了 Foxa2的全基因組的靶基因。本文將采用此技術(shù)尋找DE向肝細(xì)胞分化過程中GATA4和R)xa2的在全基因組的下游基因。ESCs體外分化得到的DE細(xì)胞不僅和胚胎發(fā)育中的DE細(xì)胞在各方面性質(zhì)上非常相似,而且細(xì)胞數(shù)量也很充足。因此,本發(fā)明人收獲了足夠數(shù)量的ESCs體外分化得到的DE細(xì)胞,并將其分為兩組,分別進(jìn)行GATA4的ChIP-Seq實驗和R)xa2的ChIP-Seq實驗,以尋找在Day 5的DE細(xì)胞中GATA4或R)xa2在全基因組的結(jié)合位點。2. 2GATA4和R)xa2的ChIP-Seq峰的數(shù)量和基因組位置ChIP-Seq實驗的初步測序結(jié)果為:GATA4共測到6,100,000個reads (序列), Foxa2共測到4,200,000個reads (序列)。隨后對其進(jìn)一步分析,首先,將所有的reads定位到小鼠的基因組上;然后,經(jīng)過篩選去掉重復(fù)的reads,只保留唯一的reads ;最后,將這些reads輸入TIROE軟件進(jìn)行二次篩選和分析,得到可信的峰(包含基因組定位和出現(xiàn)頻率的信息)。最終,分別得到75,867個GATA4的峰和32,056個R)xa2的峰(圖3)。這些峰代表轉(zhuǎn)錄因子在全基因組的所有可信結(jié)合位點。按照相對于基因(Refseq gene)的位置將峰歸為5類外顯子,內(nèi)含子,上游0-31Λ,上游3-101Λ,基因間的區(qū)域,并計算了每一類峰的百分比(圖3)。R)xa和GATA4在全基因組上不僅結(jié)合在與基因表達(dá)和調(diào)控相關(guān)的前4 類位置上,還以相當(dāng)高的比例結(jié)合在很多基因間的區(qū)域。2. 3GATA4 和 Foxa2 的 ChIP-Seq 峰的普通 ChIP 結(jié)合 PCR 驗證為了驗證ChIP-Seq這樣高通量測序技術(shù)找到的結(jié)合位點的真實性,從i^oxa和 GATA4的各自的峰中隨機挑選了一些結(jié)合位點進(jìn)行普通ChIP結(jié)合PCR的驗證,結(jié)果表明其陽性率約為93% :GATA4峰選擇的15個中有14個可以在PCR產(chǎn)物中檢測到,F(xiàn)oxa2峰選擇的14個中有13個可以在PCR產(chǎn)物中檢測到。由這個比較高的陽性率,可以認(rèn)為ChIP-Seq 得到的結(jié)合位點有很高的可信度。2. 4GATA4和R)xa2結(jié)合DNA序列的基序分析根據(jù)以上的峰信息,可以進(jìn)一步通過生物信息分析總結(jié)出GATA4或R)xa2結(jié)合DNA 序列的基序信息,從基序的信息可以反映轉(zhuǎn)錄因子結(jié)合的核心序列,兩者各自得到一個基序的列表,本發(fā)明人按照出現(xiàn)頻率和可信度等參數(shù)對這些基序進(jìn)行排序,在這里,本發(fā)明人只列出了排在前3位的GATA4或R)xa2的基序(圖4)。經(jīng)過比較,大部分排序高的R)xa2 的基序都和文獻(xiàn)報道地非常相似,而大部分排序高的GATA4的基序都含有已知的GATA家族轉(zhuǎn)錄因子的保守核心序列GATA (圖4顯示的是反義鏈),這又一次體現(xiàn)了 ChIP-Seq數(shù)據(jù)找到的結(jié)合位點的可靠性。此外,本文首次報道了 GATA4的基序,可以為預(yù)測GATA4的結(jié)合位點提供依據(jù)。2. 5GATA4和R)xa2在全基因組水平的各自靶基因和兩者共有的靶基因隨后,本文試圖得到GATA4或R)xa2的靶基因列表,以總結(jié)出兩者在此DE細(xì)胞中究竟結(jié)合哪些重要的基因。為了由結(jié)合位點的信息(峰)進(jìn)一步提煉出靶基因的列表,將 ChIP-Seq數(shù)據(jù)的所有峰對應(yīng)到RefSeq基因(來自NCBI基因庫)的promoter區(qū)(本文對 promoter區(qū)的定義為轉(zhuǎn)錄起始位點上下游各31Λ,即TSS士31Λ),然后將promoter區(qū)出現(xiàn)峰的RefSeq基因匯總起來,得到GATA4或R)xa2的靶基因列表,分別得到6053個GATA4的靶基因和3120個R)xa2的靶基因(圖5)。GATA4或R)xa2在DE細(xì)胞分化過程中的這些靶基因可能包含很多和分化過程相關(guān)的重要基因。之前在Alb基因上報道的GATA4和R)xa2的共結(jié)合與共調(diào)控現(xiàn)象,可能在其它一些肝臟發(fā)生相關(guān)的基因上也普遍存在,甚至有可能擴展到其它一些發(fā)育過程相關(guān)的基因上。為驗證這一假設(shè),本文首先比較了 GATA4和R)xa2各自的靶基因列表,發(fā)現(xiàn)兩者確實有很大程度的重合,有多達(dá)1721個基因同時出現(xiàn)在兩組靶基因列表中(圖5),統(tǒng)計學(xué)分析顯示這是極顯著的重合(Fisher exacttest P < 2. 2e-16, empirical P <0.001),這說明 GATA4和R)xa2在全基因組范圍共有相當(dāng)多的靶基因。這一結(jié)果暗示,GATA4和R)xa2在這一特定的發(fā)育背景下可能在全基因組范圍共結(jié)合甚至共調(diào)控很多基因。2. 6GATA4和Foxa2各自和共有的靴基因的Gene Ontology分析為了對GATA4和R)xa2各自的以及共有的靶基因有更明確的認(rèn)識,需要對這些靶基因按照已知的功能進(jìn)行分類。為此,對靶基因進(jìn)行Gene Ontology(GO)分析,將得到的所有GO分類按照出現(xiàn)頻率進(jìn)行排序,在此,只顯示GO分類中排在前8位的,結(jié)果如下F0Xa2 靶基因的前8個GO中有4個是和發(fā)育或形態(tài)發(fā)生過程相關(guān)的(圖6A),GATA4靶基因的GO 中前6個都是和發(fā)育或形態(tài)發(fā)生過程相關(guān)的(圖6B),而GATA4和R)xa2共有的靶基因的前8個GO全都是和發(fā)育或形態(tài)發(fā)生過程相關(guān)的(圖6C)。這一結(jié)果說明,在分化得到的DE 細(xì)胞中,無論是GATA4還是R)xa2都主要調(diào)控發(fā)育相關(guān)的基因。而且,那些可能被GATA4和 R)xa2共同調(diào)控的基因也絕大部分都是和發(fā)育過程相關(guān)的。2. 7驗證GATA4和R)xa2對靶基因的轉(zhuǎn)錄調(diào)控功能為了驗證GATA4或R)xa2的物理結(jié)合與基因轉(zhuǎn)錄調(diào)控的生物學(xué)功能之間的關(guān)聯(lián), 即從ChIP-Seq數(shù)據(jù)找到的GATA4或R)xa2的靶基因有多少是真正受其調(diào)控的。本發(fā)明人從GATA4和R)xa2的靶基因中分別隨機挑選了 10個,在分化到Day 5的fetta4-KD組或 Foxa2-KD組檢測其RNA水平,假設(shè)這些基因是被GATA4或R)xa2所調(diào)控的,那么GATA4或 Foxa2的剔除就必然影響它們的表達(dá)。結(jié)果發(fā)現(xiàn),與Control組相比,GATA4的10個結(jié)合基因中有5個的表達(dá)水平在Gata4被剔除后發(fā)生顯著的變化(圖7A),F(xiàn)oxa2的10個結(jié)合基因中有5個的表達(dá)水平在R)xa2被剔除后發(fā)生顯著的變化(圖7B)。這表明GATA4和 Foxa2對基因調(diào)控區(qū)的結(jié)合在很大程度上是和轉(zhuǎn)錄調(diào)控相關(guān)聯(lián)的,因此,從GATA4和Foxa2 的ChIP-Seq數(shù)據(jù)中可以找到很多真正的下游基因。2. 8. GATA4和R)xa2在DE細(xì)胞中共結(jié)合靶基因Zaret等曾報道了在體內(nèi)的DE細(xì)胞中GATA4和R)xa2共結(jié)合Alb上游的enhancer 序列并參與轉(zhuǎn)錄調(diào)控。而在上一節(jié)的ChIP-Seq數(shù)據(jù)分析中提到,GATA4和R)xa2在全基因組范圍內(nèi)有很多重合的靶基因。以上這些信息提示本發(fā)明人,GATA4和R)xa2在全基因組范圍可能存在廣泛的共結(jié)合甚至共調(diào)控關(guān)系。根據(jù)ChIP-Seq數(shù)據(jù),GATA4和R)xa2共有的靶基因中包括很多發(fā)育相關(guān)的重要基因。本文從中選取了一些DE發(fā)育和肝臟發(fā)生相關(guān)的關(guān)鍵基因,并在ChIP-Seq數(shù)據(jù)中查看了 GATA4和R)xa2在其調(diào)控區(qū)上的峰分布(包含結(jié)合位置和結(jié)合強度的信息),結(jié)果發(fā)現(xiàn)在這些基因的調(diào)控區(qū)都存在毗鄰的或重合的GATA4和R)xa2的峰,說明兩者在這些共有的靶基因上有緊鄰的或共同的結(jié)合位點。在這些基因中,包括DE發(fā)育相關(guān)的關(guān)鍵基因,如 Eomes (圖 8A),Hhex (圖 8B),Soxl7 (圖 8C),Gsc (圖 8D),GATA4 (圖 8E),F(xiàn)oxa2 (圖 8F)。 此外,還包括對于DE的肝向分化必需卻還未在DE表達(dá)的基因,如Afp (圖9A),Ttr (圖9B),Timd2(圖9C)。這些GATA4和R)xa2共有的靶基因上存在著如此緊鄰的各自結(jié)合位點,這一現(xiàn)象提示本發(fā)明人,兩者很有可能共結(jié)合這些靶基因,但是還必須排除另一種可能,就是兩者在不同的細(xì)胞群體中各自結(jié)合相同的位點,因為實驗中用到的Day 5的分化細(xì)胞不只包括DE細(xì)胞一個群體,而且GATA4在DE以外的細(xì)胞群體中也有微弱表達(dá)。因此,還需要更進(jìn)一步的實驗才能證明GATA4和R)xa2共結(jié)合這些發(fā)育相關(guān)的共有靶基因。3.在DE細(xì)胞中Tcf 12廣泛參與R)xa2和GATA4對靶基因的結(jié)合3. lFoxa2和GATA4結(jié)合的某些DNA序列包含E蛋白轉(zhuǎn)錄因子的基序Foxa2和GATA4對靶基因的結(jié)合可能需要其它轉(zhuǎn)錄因子的參與,我們可以從基序分析得到一些信息,如果其中包含其它已知轉(zhuǎn)錄因子的基序,那么,就極有可能找到其它參與結(jié)合的轉(zhuǎn)錄因子。從ChIP-Seq數(shù)據(jù)的分析中,我們意外的發(fā)現(xiàn),無論是GATA4還是R)xa2 的排序較高的基序中都有一些特殊的基序,與經(jīng)典的GATA4或R)xa2的基序所含的核心序列截然不同,但相互之間又很相似,對其進(jìn)行排序(圖10A)。這些特殊基序包含如下的簡并核心序列(仏/106(仏/106。將這一序列進(jìn)行檢索,發(fā)現(xiàn)很符合已被報道的E box家族轉(zhuǎn)錄因子的基序=CANNTG序列。這個序列的存在能夠指示E蛋白轉(zhuǎn)錄因子包括Tcf3/E2A, Tcf4/E2-2和Tcfl2/HEB的結(jié)合。接著,根據(jù)ChIP-Seq數(shù)據(jù)初步分析了 E蛋白轉(zhuǎn)錄因子參與GATA4或R)xa2結(jié)合的可能性。首先,從R)xa2的ChIP-Seq數(shù)據(jù)中,分別找出所有包含前3位E box基序的峰和所有包含前10位經(jīng)典的R)xa2基序的峰,計算這兩類峰重合的部分,有多達(dá)4 個重合的峰,即有4 個峰同時包含E box和R)xa2的基序(圖10B),統(tǒng)計學(xué)分析顯示重合極為顯著(Fisher exact test P < 2.加_16)。用同樣的方法分析GATA4 的ChIP-Seq數(shù)據(jù),分別找出所有包含前3位E box基序的峰和所有包含前10位經(jīng)典的 GATA4基序的峰,計算這兩類峰重合的部分,有多達(dá)560個重合的峰,即有560個峰同時包含E box和GATA4的基序(圖10C),統(tǒng)計學(xué)分析顯示重合極為顯著(Fisher exact te st P < 2. 2e-16)。這些同時包含兩類基序的峰所對應(yīng)的基因組上的位點在被R)xa2或GATA4 結(jié)合的情況下,有可能同時被mx)x的轉(zhuǎn)錄因子結(jié)合,而上面的計算結(jié)果啟示我們在全基因組范圍內(nèi)可能存在很多這樣的位點。3. 2Tcfl2在DE細(xì)胞中廣泛結(jié)合R)xa2和GATA4的靶基因為了驗證上述重合峰所對應(yīng)的位點是否同時被E box的轉(zhuǎn)錄因子結(jié)合,及鑒定E 蛋白是否參與了 GATA4或R)xa2的靶基因的轉(zhuǎn)錄調(diào)控,我們從同時包含E box和R)xa2的基序的峰(圖10B的4 個重合峰)中選擇了 5個,也從同時包含E box和GATA4的基序的峰(圖10C的560個重合峰)中選擇了 5個。針對這10個峰所對應(yīng)的基因組上的位點, 在Day 5的DE細(xì)胞中,分別用R)xa2,GATA4,Tcf 12和I~Cf3的抗體,以及對照IgG進(jìn)行了 ChIP-QPCR驗證。E-box的轉(zhuǎn)錄因子有很多,這里驗證了其中的兩個成員Tcfl2和I~Cf3,因為這兩個成員是基序分析中得分較高的,且根據(jù)已有的文獻(xiàn)兩者在很多發(fā)育過程中都有調(diào)控作用。另外,我們還注意到在同時包含E box和R)xa2的基序的峰對應(yīng)的位點附近,也存在GATA4的基序;而同時包含GATA4和 ^Π2的基序的峰對應(yīng)的位點附近,也存在R)xa2 的基序,因此,我們在每類位點上都同時驗證了 3類轉(zhuǎn)錄因子的結(jié)合。在R)xa2的5個峰對應(yīng)的位點上,F(xiàn)oxa2和Tcfl2都有很強的結(jié)合,而Tcf3不結(jié)合(圖11A);在GATA4的5個峰對應(yīng)的位點上,GATA4和Tcf 12都有很強的結(jié)合,而Tcf3不結(jié)合(圖11B)。由此,我們可以得出推論在DE細(xì)胞中,E蛋白Tcfl2有可能廣泛地參與了 Foxa2和GATA4各自對靶基因的結(jié)合。另外,我們還注意到在圖IOA的Foxa2和Tcfl2都結(jié)合的5個位點上,GATA4 也有較強的結(jié)合;而在圖IOB的GATA4和Tcf 12都結(jié)合的5個位點上,F(xiàn)oxa2也有較強的結(jié)合。這暗示,這些位點有可能被三者共結(jié)合。但是,由于Tcf 12的表達(dá)不只局限在DE細(xì)胞, 要證明以上的這些推論,還必需kq-ChIP實驗的進(jìn)一步證據(jù)。3. 3Tcfl2與R)xa2和GATA4在DE細(xì)胞中共結(jié)合靶基因的調(diào)控區(qū)為了證明Tcf 12能夠參與R)xa2和GATA4共結(jié)合靶基因,我們又針對以上這10 個位點,在Day 5的DE細(xì)胞中做了 3種不同抗體順序的sequential ChIP實驗Foxa2抗體-GATA4抗體,F(xiàn)oxa2抗體-Tcfl2抗體,Tcfl2抗體-GATA4抗體,其中任何一種順序都可以證明兩者的共結(jié)合,而綜合這三種順序的結(jié)果可以為三者的共結(jié)合提供很強的證據(jù)。結(jié)果發(fā)現(xiàn)在這10個位點中有3個位點在3種不同抗體順序的sequentialChIP產(chǎn)物中均能被檢測到(圖12第3,4,6列)。這一結(jié)果為證明R)xa2,GATA4和Tcf 12對靶基因的共結(jié)合提供了有力的證據(jù)。由此,可以推測,在DE細(xì)胞中,Tcfl2可以作為一個結(jié)合伙伴,與R)xa2 和GATA4 —起,三者共結(jié)合靶基因。以上已以具體實施方式
的形式對本發(fā)明做出了詳細(xì)的描述。應(yīng)理解,本申請的范圍并不限于上述具體實施例。在不偏離本申請精神的情況下對本發(fā)明做出的改動和變動都在本申請的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種基因芯片,其特征在于,該芯片包含至少一條表1、表2或表3所示的核苷酸序列。
2.如權(quán)利要求1所述的基因芯片,其特征在于,所述芯片含有表1、表2或表3所列核苷酸序列中的至少100條核苷酸序列。
3.如權(quán)利要求1所述的基因芯片,其特征在于,所述芯片含有表1、表2或表3所列核苷酸序列中的至少1000條核苷酸序列。
4.如權(quán)利要求1所述的基因芯片,其特征在于,所述芯片含有表3所列核苷酸序列中的至少1200條核苷酸序列。
5.如權(quán)利要求1所述的基因芯片,其特征在于,所述芯片含有表3所列核苷酸序列中的至少1600條核苷酸序列。
6.一種檢測基因表達(dá)水平的方法,該方法包括使生物學(xué)樣品與權(quán)利要求1 5中任一項所述的基因芯片接觸,以及檢測感興趣基因的表達(dá)。
7.一種鑒定培養(yǎng)的多能干細(xì)胞是否發(fā)生了肝向分化的方法,其特征在于,該方法包括將所述培養(yǎng)的多能干細(xì)胞與權(quán)利要求1 5中任一項所述的基因芯片接觸,以及檢測感興趣基因的表達(dá),其中,如果在該基因芯片上獲得陽性結(jié)果,表明該多能干細(xì)胞發(fā)生了肝向分化。
8.一種篩選發(fā)生了肝向分化的多能干細(xì)胞的方法,其特征在于,所述方法包括將所述多能干細(xì)胞與權(quán)利要求1 5中任一項所述的基因芯片接觸,以及檢測感興趣基因的表達(dá), 其中,如果在該基因芯片上獲得陽性結(jié)果,表明該多能干細(xì)胞為肝向分化的多能干細(xì)胞。
9.如權(quán)利要求7或8所述的方法,其特征在于,所述多能干細(xì)胞為哺乳動物多能干細(xì)胞。
10.Tcfl2在控制多能干細(xì)胞肝向分化中的應(yīng)用。
全文摘要
本發(fā)明涉及早期肝細(xì)胞的產(chǎn)生及其用途。具體而言,本發(fā)明涉及非人哺乳動物胚胎干細(xì)胞定向分化為肝細(xì)胞的系統(tǒng)、技術(shù),包括含有本發(fā)明所列基因的基因芯片。本發(fā)明還涉及使用所述基因芯片進(jìn)行檢測、鑒定和篩選的方法。
文檔編號C12N5/071GK102443622SQ201010297038
公開日2012年5月9日 申請日期2010年10月12日 優(yōu)先權(quán)日2010年10月12日
發(fā)明者何志穎, 王欣 申請人:中國科學(xué)院上海生命科學(xué)研究院