器官基因的組蛋白h3k9三甲基化表達(dá)差異的分析方法與基因模型的制作方法
【專利摘要】本發(fā)明涉及一種器官基因的組蛋白H3K9三甲基化表達(dá)差異的分析方法與基因模型,分析方法包括以下步驟:提取冷凍保存的標(biāo)本的組織樣本,研磨勻漿并用質(zhì)量百分?jǐn)?shù)為1%的甲醛處理,裂解細(xì)胞得到全細(xì)胞裂解液;在全細(xì)胞裂解液加入三甲基化組蛋白H3K9的抗體和磁珠,在4℃進(jìn)行孵育,提取DNA;構(gòu)建DNA文庫,進(jìn)行染色質(zhì)免疫沉淀測序分析,對有效數(shù)據(jù)進(jìn)行產(chǎn)量統(tǒng)計(jì),并與目的物種基因組序列進(jìn)行比對,根據(jù)轉(zhuǎn)錄因子結(jié)合位點(diǎn)和組蛋白修飾富集區(qū)域,獲取峰值相關(guān)基因;對所述峰值相關(guān)基因按照基因功能進(jìn)行聚類分析,并選取組蛋白H3K9三甲基化表達(dá)差異顯著的至少一基因。
【專利說明】器官基因的組蛋白H3K9三甲基化表達(dá)差異的分析方法與
基因模型
【【技術(shù)領(lǐng)域】】
[0001]本發(fā)明涉及組蛋白甲基化,尤其涉及一種器官基因的組蛋白H3K9三甲基化表達(dá)差異的分析方法與基因模型。
【【背景技術(shù)】】
[0002]在哺乳動(dòng)物基因組中,組蛋白可以有很多修飾形式,包括組蛋白末端的乙?;?、甲基化、磷酸化、泛素化、ADP (二磷酸腺苷)核糖基化等等,這些修飾都會(huì)影響基因的轉(zhuǎn)錄活性。組蛋白修飾最重要的表觀遺傳機(jī)制是控制基因表達(dá),因此其與細(xì)胞的增殖、發(fā)育和生存息息相關(guān)。對于組蛋白H3 (組蛋白H3的第9位賴氨酸殘基)在不同的組織和生物中已廣泛研究并證實(shí)組蛋白H3K9三甲基化(H3K9me3)與異染色質(zhì)形成,基因的表達(dá)和轉(zhuǎn)錄伸長率具有關(guān)聯(lián)性。
[0003]表觀遺傳學(xué)是研究基因的核苷酸序列不發(fā)生改變的情況下,基因表達(dá)和調(diào)控的可遺傳變化的過程和機(jī)制。與遺傳多態(tài)性不同,會(huì)發(fā)生非遺傳部分和可逆的DNA修飾。
[0004]甲基化發(fā)生在位于氨基末端的組蛋白尾部的五個(gè)主要的賴氨酸殘基(H3K4, H3K9, H3K27, H3K36, H4K20),以及一個(gè)球狀蛋白結(jié)構(gòu)域(H3K79)內(nèi)的賴氨酸殘基,這些賴氨酸可發(fā)生單甲基化、二甲基化和三甲基化。在各種不同的組蛋白賴氨酸甲基化模式中,由于H3K9的甲基化和抑制的染色質(zhì)相關(guān)而備受關(guān)注。H3K9三甲基化(H3K9me3)是翻譯后修飾,并且與異染色質(zhì)的形成和轉(zhuǎn)錄抑制相關(guān)聯(lián),也是基因轉(zhuǎn)錄沉默的標(biāo)志,具有重要的研究價(jià)值。
[0005]高通量技術(shù)具有高效的特點(diǎn),其可用來分析基因組中大量的基因表達(dá)情況同時(shí)研究病理過程中復(fù)雜的分子機(jī)理。ChlP-seq (Chromatin Immunoprecipitation -sequencing,染色質(zhì)免疫沉淀_測序)是染色質(zhì)免疫共沉淀后并結(jié)合高通量測序的方法,它能夠在全基因組中識別轉(zhuǎn)錄因子(TFs)和DNA結(jié)合蛋白的結(jié)合位點(diǎn)。隨著高通量測序平臺如Illumina公司的基因組分析以及SOLiD (使用連接法測序的一種高通量測序儀,Sequencing by Oligonucleotide Ligation and Detection)和芯片級別的抗體出現(xiàn),ChlP-seq已成為用于確定基因組中的功能元件的最廣泛使用的方法。與常用的ChIP_chip(Chromatin Immunoprecipitation-chip,染色質(zhì)免疫共沉淀-芯片)相比,ChlP-seq 具有更高的信噪比,更便宜以及更少量的樣本的優(yōu)勢。
[0006]目前,只有極少數(shù)研究比較分析哺乳動(dòng)物或人體組織的H3K9me3。
【
【發(fā)明內(nèi)容】
】
[0007]有鑒于此,有必要提出一種新的器官基因的組蛋白H3K9三甲基化表達(dá)差異的分析方法與基因模型。
[0008]本發(fā)明的一個(gè)技術(shù)方案是,器官基因的組蛋白H3K9三甲基化表達(dá)差異的分析方法,其包括以下步 驟:提取冷凍保存的標(biāo)本的組織樣本,研磨勻漿并用質(zhì)量百分?jǐn)?shù)為1%的甲醛處理,裂解細(xì)胞得到全細(xì)胞裂解液;在全細(xì)胞裂解液加入三甲基化組蛋白H3K9的抗體和磁珠,在4°C進(jìn)行孵育,提取DNA ;構(gòu)建DNA文庫,進(jìn)行染色質(zhì)免疫沉淀測序分析,對有效數(shù)據(jù)進(jìn)行產(chǎn)量統(tǒng)計(jì),并與目的物種基因組序列進(jìn)行比對,根據(jù)轉(zhuǎn)錄因子結(jié)合位點(diǎn)和組蛋白修飾富集區(qū)域,獲取峰值相關(guān)基因;對所述峰值相關(guān)基因按照基因功能進(jìn)行聚類分析,并選取組蛋白H3K9三甲基化表達(dá)差異顯著的至少一基因。
[0009]優(yōu)選的,所述分析方法中,所述標(biāo)本為心臟和/或脾臟。
[0010]優(yōu)選的,所述分析方法中,所述提取DNA后還進(jìn)行純化,然后再構(gòu)建DNA文庫。
[0011 ] 優(yōu)選的,所述分析方法中,所述純化采用快速PCR純化試劑盒進(jìn)行,純化之后還采用實(shí)時(shí)定量基因擴(kuò)增熒光檢測系統(tǒng)進(jìn)行驗(yàn)證。
[0012]優(yōu)選的,所述分析方法中,所述比對中,允許不超過2個(gè)堿基的錯(cuò)配。 [0013]優(yōu)選的,所述分析方法中,所述構(gòu)建DNA文庫中,對DNA片段末端修復(fù),3'端加A堿基,連接測序接頭,PCR擴(kuò)增及選擇DNA產(chǎn)物的片段大小,用于上機(jī)測序。
[0014]優(yōu)選的,所述分析方法中,選擇DNA產(chǎn)物的片段大小中,包括接頭序列在內(nèi)的片段大小為 100-300bp。
[0015]優(yōu)選的,所述分析方法中,所述有效數(shù)據(jù)為去除接頭和低質(zhì)量讀取后的下機(jī)數(shù)據(jù),其中低質(zhì)量讀取為每條讀取中堿基質(zhì)量值S 20個(gè)數(shù)大于等于50%,或者N堿基個(gè)數(shù)大于等于 10% O
[0016]優(yōu)選的,所述分析方法中,所述低質(zhì)量讀取為每條讀取中堿基質(zhì)量值S 18個(gè)數(shù)大于等于60%,或者N堿基個(gè)數(shù)大于等于15%。
[0017]本發(fā)明的又一技術(shù)方案是,一種基因模型,其包括采用上述任一分析方法所獲得的組蛋白H3K9三甲基化表達(dá)差異顯著的若干基因。
[0018]上述方案,通過分析器官H3K9三甲基化表達(dá)差異,從而確定出候選基因,這些基因與免疫,細(xì)胞信號轉(zhuǎn)導(dǎo),蛋白質(zhì)轉(zhuǎn)錄和合成渠道和運(yùn)輸和細(xì)胞外基質(zhì)等相關(guān),能夠作為中間結(jié)果的有效信息,為下一步的分析工作提供良好的信息支持和輔助數(shù)據(jù);并且,H3K9me3具有作為一個(gè)潛在的生物標(biāo)志物或表觀遺傳疾病治療靶點(diǎn)的意義。
【【專利附圖】
【附圖說明】】
[0019]圖1是一個(gè)實(shí)施例心臟的峰值在若干基因功能元件上的分布特征圖;
[0020]圖2是一個(gè)實(shí)施例脾臟的峰值在若干基因功能元件上的分布特征圖;
[0021]圖3是一個(gè)實(shí)施例的各樣本間所共同包含的基因和各自具有的特有的基因示意圖;
[0022]圖4是心臟的基因相關(guān)各位點(diǎn)所占的比例示意圖;
[0023]圖5是脾臟的基因相關(guān)各位點(diǎn)所占的比例示意圖;
[0024]圖6是兩個(gè)樣本中所共同包含的峰值區(qū)域富集度示意圖;
[0025]圖7是一個(gè)實(shí)施例的流程示意圖。
【【具體實(shí)施方式】】
[0026]下面結(jié)合附圖,對本發(fā)明的【具體實(shí)施方式】進(jìn)行詳細(xì)描述。
[0027]本發(fā)明通過采用ChlP-seq的技術(shù),比較分析人體器官心臟和脾臟之間在全基因組中H3K9me3的變化及差異情況,以便更好地認(rèn)識組織間的表觀遺傳差異,建立基因模型,作為下一步分析的基礎(chǔ),并通過數(shù)據(jù)分析,全面的描述了組織特異性表達(dá),功能及發(fā)展情況。
[0028]如圖7所示,本發(fā)明的一個(gè)實(shí)施例是,器官基因的組蛋白H3K9三甲基化表達(dá)差異的分析方法,其包括以下步驟:提取冷凍保存的標(biāo)本的組織樣本,研磨勻漿并用質(zhì)量百分?jǐn)?shù)為1%的甲醛處理,裂解細(xì)胞得到全細(xì)胞裂解液;在全細(xì)胞裂解液加入三甲基化組蛋白H3K9的抗體和磁珠(Beads),在4°C進(jìn)行孵育,提取DNA ;孵育時(shí)間不作限制,只需能夠完成孵育,最后實(shí)現(xiàn)DNA提取機(jī)殼。然后構(gòu)建DNA文庫,進(jìn)行染色質(zhì)免疫沉淀測序分析,對有效數(shù)據(jù)進(jìn)行產(chǎn)量統(tǒng)計(jì),并與目的物種基因組序列進(jìn)行比對,根據(jù)轉(zhuǎn)錄因子結(jié)合位點(diǎn)和組蛋白修飾富集區(qū)域,獲取峰值相關(guān)基因;對所述峰值相關(guān)基因按照基因功能進(jìn)行聚類分析,并選取組蛋白H3K9三甲基化表達(dá)差異顯著的至少一基因。優(yōu)選的,所述提取DNA后還進(jìn)行純化,然后再構(gòu)建所述DNA文庫。優(yōu)選的,所述純化采用快速PCR純化試劑盒進(jìn)行,純化之后還采用實(shí)時(shí)定量基因擴(kuò)增熒光檢測系統(tǒng)進(jìn)行驗(yàn)證。
[0029]優(yōu)選的,所述分析方法中,所述標(biāo)本為心臟或脾臟。關(guān)于下面相關(guān)實(shí)施例涉及樣本的合法性說明如下:實(shí)驗(yàn)采用兩組標(biāo)本,包括兩個(gè)心臟和兩個(gè)脾臟,均來自中國廣西桂林第一八一醫(yī)院腦死亡患者自愿捐贈(zèng)的器官。標(biāo)本放置于_80°C保存。標(biāo)本收集的方案與執(zhí)行均獲得廣西代謝性疾病重點(diǎn)實(shí)驗(yàn)室和第一八一醫(yī)院倫理委員會(huì)的批準(zhǔn)。器官捐贈(zèng)者均簽署了知情同意書。 [0030]優(yōu)選的,所述分析方法中,所述比對中,允許不超過2個(gè)堿基的錯(cuò)配。優(yōu)選的,所述分析方法中,所述構(gòu)建DNA文庫中,對DNA片段末端修復(fù),3 ^端加A堿基,連接測序接頭,PCR擴(kuò)增及選擇DNA產(chǎn)物的片段大小,用于上機(jī)測序。優(yōu)選的,所述分析方法中,選擇DNA產(chǎn)物的片段大小中,包括接頭序列在內(nèi)的片段大小為100-300bp。
[0031]優(yōu)選的,所述分析方法中,所述有效數(shù)據(jù)為去除接頭和低質(zhì)量讀取后的下機(jī)數(shù)據(jù),其中低質(zhì)量讀取為每條讀取中堿基質(zhì)量值20的個(gè)數(shù)大于等于50%,或者N堿基個(gè)數(shù)大于等于10%。優(yōu)選的,所述分析方法中,所述低質(zhì)量讀取為每條讀取中堿基質(zhì)量值18的個(gè)數(shù)大于等于60%,或者N堿基個(gè)數(shù)大于等于15%。
[0032]例如,采用染色質(zhì)免疫共沉淀方式,準(zhǔn)備ChIP Sequencing建庫。
[0033]首先,提取標(biāo)本的組織樣本,例如,從冰凍狀態(tài)拿到O至4°C,注意不要拿到常溫,待組織解凍后,參照BGI公布的程序進(jìn)行ChlP-seq實(shí)驗(yàn)方案。簡單的說,將組織樣本先研磨勻衆(zhòng)并用質(zhì)量百分?jǐn)?shù)為1%的甲醒處理細(xì)胞,使DNA-protein的相互結(jié)合作用被交聯(lián)固定,然后裂解細(xì)胞,得到全細(xì)胞裂解液,通過超聲處理,將基因組DNA打斷至100-500bp碎片,在細(xì)胞裂解液中加入特定的實(shí)驗(yàn)所需的三甲基化賴氨酸9的抗體和beads,并進(jìn)行4°C孵育。采用合適的實(shí)驗(yàn)條件進(jìn)行洗脫,并解交聯(lián),經(jīng)過交聯(lián)反轉(zhuǎn)和蛋白酶K處理后,DNA被沉淀提取出,在構(gòu)建DNA文庫前,先用QIA快速PCR純化試劑盒將DNA進(jìn)一步純化。通過qPCR(Real-time Quantitative PCR Detecting System,實(shí)時(shí)定量基因擴(kuò)增突光檢測系統(tǒng))對ChIP結(jié)果進(jìn)行驗(yàn)證,準(zhǔn)備好的ChIP后的DNA樣品可以用于ChIP Sequencing建庫。
[0034]ChIP Sequencing文庫構(gòu)建流程說明如下:先對DNA片段末端進(jìn)行修復(fù),3'端加A喊基,連接測序接頭,詳細(xì)步驟可參考Illumina公司Paired-End DNA Sample Prep kit。然后進(jìn)行PCR擴(kuò)增及DNA產(chǎn)物的片段大小選擇,優(yōu)選為100-300bp,包括接頭序列在內(nèi),合格的文庫用于上機(jī)測序。優(yōu)選的,DNA產(chǎn)物的片段大小為120至270bp。
[0035]然后進(jìn)行ChlP-seq分析。
[0036]ChIP DNA末端修復(fù),接頭連接以及擴(kuò)增等均按之前的進(jìn)行。從瓊脂糖凝膠中分離出大小約為49bp的片段,用Solexa/Illumina2G基因分析儀分析測序。與目的物種基因組序列進(jìn)行比對,其中參考基因組版本為Hgl9,比對軟件為S0AP2.21。比對過程中,允許不超過2個(gè)堿基的錯(cuò)配,優(yōu)選的,僅允許I個(gè)堿基的錯(cuò)配;其中比對到基因組上唯一位置的reads (唯一比對reads)將用于后續(xù)的信息分析。ChIP Sequencing reads在全基因組的分布包括唯一比對Reads在Repeats區(qū)域的分布;唯一比對Reads在各基因功能元件上的分布;唯一比對Reads的全基因組覆蓋深度。而全基因組Peak掃描,采用軟件MACS1.4.0,將基因組上的候選peak區(qū)延伸,得到一定長度的建模區(qū)域,根據(jù)此區(qū)域中所有唯一比對reads的情況,使用Poisson分布模型進(jìn)行檢驗(yàn),計(jì)算候選peak區(qū)域的p-value,若p_value〈l.00e-05,則認(rèn)為該區(qū)域是一個(gè)peak。MACS的目的是從ChlP-seq的數(shù)據(jù)集中找出轉(zhuǎn)錄因子結(jié)合位點(diǎn)和組蛋白修飾富集區(qū)域,而且不需要正常對照。
[0037]Peak相關(guān)基因的GO分析,GO是一種整合性、統(tǒng)一化、動(dòng)態(tài)開放實(shí)時(shí)更新的分類系統(tǒng)。其包括三大獨(dú)立的本體(Ontology):基因參與的生命過程(biological process),所處的細(xì)胞組份和元件(cellular component)及發(fā)揮的分子生物學(xué)功能(molecularfunction)。這三個(gè)ontology下面又可以獨(dú)立出不同的亞層次,層層向下構(gòu)成一個(gè)ontologies的樹型分支結(jié)構(gòu)。通過GO功能富集分析,可以知道peak相關(guān)基因涉及到哪些生物學(xué)功能的改變。通過GO功能分析可以將Peak相關(guān)基因按照基因功能進(jìn)行聚類分析。
[0038]數(shù)據(jù)處理與產(chǎn)出情況統(tǒng)計(jì)情況如下:測序完成后,對原始數(shù)據(jù)進(jìn)行去污染,去接頭及去除低質(zhì)量數(shù)據(jù)處理,統(tǒng)計(jì)clean data (有效數(shù)據(jù))產(chǎn)量,具體如下表1所示。
[0039]
【權(quán)利要求】
1.器官基因的組蛋白H3K9三甲基化表達(dá)差異的分析方法,其特征在于,包括以下步驟: 提取冷凍保存的標(biāo)本的組織樣本,研磨勻漿并用質(zhì)量百分?jǐn)?shù)為1%的甲醛處理,裂解細(xì)胞得到全細(xì)胞裂解液; 在全細(xì)胞裂解液加入三甲基化組蛋白H3K9的抗體和磁珠,在4°C進(jìn)行孵育,提取DNA ;構(gòu)建DNA文庫,進(jìn)行染色質(zhì)免疫沉淀測序分析,對有效數(shù)據(jù)進(jìn)行產(chǎn)量統(tǒng)計(jì),并與目的物種基因組序列進(jìn)行比對,根據(jù)轉(zhuǎn)錄因子結(jié)合位點(diǎn)和組蛋白修飾富集區(qū)域,獲取峰值相關(guān)基因; 對所述峰值相關(guān)基因按照基因功能進(jìn)行聚類分析,并選取組蛋白H3K9三甲基化表達(dá)差異顯著的至少一基因。
2.根據(jù)權(quán)利要求1所述分析方法,其特征在于,所述標(biāo)本為心臟和/或脾臟。
3.根據(jù)權(quán)利要求2所述分析方法,其特征在于,所述提取DNA后還進(jìn)行純化,然后再構(gòu)建DNA文庫。
4.根據(jù)權(quán)利要求3所述分析方法,其特征在于,所述純化采用快速PCR純化試劑盒進(jìn)行,純化之后還采用實(shí)時(shí)定量基因擴(kuò)增熒光檢測系統(tǒng)進(jìn)行驗(yàn)證。
5.根據(jù)權(quán)利要求4所述分析方法,其特征在于,所述比對中,允許不超過2個(gè)堿基的錯(cuò)配。
6.根據(jù)權(quán)利要求5所述分析方法,其特征在于,所述構(gòu)建DNA文庫中,對DNA片段末端修復(fù),3'端加A堿基,連接測`序接頭,PCR擴(kuò)增及選擇DNA產(chǎn)物的片段大小,用于上機(jī)測序。
7.根據(jù)權(quán)利要求6所述分析方法,其特征在于,選擇DNA產(chǎn)物的片段大小中,包括接頭序列在內(nèi)的片段大小為100-300bp。
8.根據(jù)權(quán)利要求7所述分析方法,其特征在于,所述有效數(shù)據(jù)為去除接頭和低質(zhì)量讀取后的下機(jī)數(shù)據(jù),其中低質(zhì)量讀取為每條讀取中堿基質(zhì)量值S 20個(gè)數(shù)大于等于50%,或者N堿基個(gè)數(shù)大于等于10%。
9.根據(jù)權(quán)利要求8所述分析方法,其特征在于,所述低質(zhì)量讀取為每條讀取中堿基質(zhì)量值=18個(gè)數(shù)大于等于60%,或者N堿基個(gè)數(shù)大于等于15%。
10.一種基因模型,其特征在于,包括采用如權(quán)利要求1至9任一所述分析方法所獲得的組蛋白H3K9三甲基化表達(dá)差異顯著的若干基因。
【文檔編號】C12Q1/68GK103667455SQ201310585954
【公開日】2014年3月26日 申請日期:2013年11月19日 優(yōu)先權(quán)日:2013年11月19日
【發(fā)明者】眭維國, 戴勇, 曹翠輝, 薛雯, 陳潔晶 申請人:眭維國, 戴勇