專利名稱:一種利用高通量測序技術(shù)發(fā)現(xiàn)新轉(zhuǎn)錄本的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于轉(zhuǎn)錄組學(xué)相關(guān)技術(shù)研究領(lǐng)域。通過對不同的轉(zhuǎn)錄組實(shí)驗(yàn)結(jié)果做差異分析、統(tǒng)計(jì)及實(shí)驗(yàn)驗(yàn)證,從而發(fā)現(xiàn)一些新的轉(zhuǎn)錄本。
背景技術(shù):
真核生物轉(zhuǎn)錄組的情況是非常復(fù)雜的,其中有大量的重疊轉(zhuǎn)錄本、轉(zhuǎn)錄的基因間區(qū)序列和大量的非編碼RNA。過去十幾年的研究轉(zhuǎn)錄組的技術(shù)有EST、芯片技術(shù)、SAGE、MPSS等。隨著近幾年測序技術(shù)的發(fā)展,新一代測序儀為主的RNA-Seq技術(shù)成為人們研究轉(zhuǎn)錄組的主要方法。RNA-Seq技術(shù)的最大特點(diǎn)就是它能夠提供其他方法無法比擬的數(shù)據(jù)通量,其中包括大量的表達(dá)豐度非常低的轉(zhuǎn)錄本信息,能夠盡可能的深度挖掘出轉(zhuǎn)錄組的信息,從而對整個(gè)轉(zhuǎn)錄組的情況得到更加全面的了解,在最大程度上揭示出轉(zhuǎn)錄情況的真實(shí)面貌。目前,根據(jù)不同的RNA提取方法,可以將RNA-seq技術(shù)分成兩類:mRNA-Seq及rmRNA-seq技術(shù)。兩項(xiàng)技術(shù)在實(shí)驗(yàn)流程上的主要差別在于,前者用Poly (T)寡聚核苷酸從總RNA中提取全部帶Poly (A)尾的RNA,主要部分是編碼基因所轉(zhuǎn)錄的mRNA ;而rmRNA-seq提取的是total RNA,除了編碼基因轉(zhuǎn)錄的mRNA,還有一些IncRNA,snRNA等等。通過比較這兩項(xiàng)技術(shù)的實(shí)驗(yàn)結(jié)果,不難發(fā)現(xiàn)一些新的未注釋的轉(zhuǎn)錄本。針對其中表達(dá)豐度比較高的轉(zhuǎn)錄本,可以設(shè)計(jì)實(shí)驗(yàn)證實(shí)其功能,從而發(fā)現(xiàn)一些新的具有生物學(xué)意義的IncRNA, snRNA等
坐寸ο
發(fā)明內(nèi)容
本發(fā)明對同 一樣本分別采用mRNA-seq及rmRNA-seq技術(shù)獲得轉(zhuǎn)錄組全基因組數(shù)據(jù)。結(jié)合NCBI上公開發(fā)表的全基因組注釋信息,把測序獲得的表達(dá)譜Tag定位到基因組上。比較基因組區(qū)域兩種技術(shù)獲得的表達(dá)譜數(shù)據(jù),做統(tǒng)計(jì)分析找出有顯著差異的區(qū)域(附圖中顯示了兩種技術(shù)結(jié)果中差異的部分)。其中尚未注釋的差異區(qū)域可能是新的轉(zhuǎn)錄本。針對其中表達(dá)豐度比較高的轉(zhuǎn)錄本,我們設(shè)計(jì)RT-PCR驗(yàn)證這些區(qū)域的生物學(xué)功能。
圖1兩種技術(shù)檢測到的基因組區(qū)域數(shù)目比較條形2rmRNA_seq技術(shù)檢測到的550kb左右的非編碼區(qū)
具體實(shí)施例方式1.RNA-Seq 實(shí)驗(yàn)準(zhǔn)備a)組織提取b)主要試劑Trizol, IObp DNA Ladder,pUC18DNA/Mspl 購于 TIANGEN,pGEM-T 載體、T4 連接酶,One Shot ToplOCompetent Cell 購于 Promega。其他常見試劑如氯仿(Chloroform)、異丙醇(Isopropanol)、乙醇(Ethanol)、苯酌.(Phenol)等。C)文庫構(gòu)建流程分為RNA提取(rmRNA-seq提取total RNA, mRNA-seq用Poly⑴寡聚核苷酸提取mRNA),rRNA去除,RNA打斷,反轉(zhuǎn)錄,PCR擴(kuò)增,建庫,庫檢,最后進(jìn)行SOLiD上機(jī)前準(zhǔn)備幾個(gè)步驟。2.數(shù)據(jù)分析a) SOLiD序列在基因組上的注釋b)統(tǒng)計(jì)分析篩選兩種技術(shù)差異檢測區(qū)域l)Possion 法去背景2)數(shù)據(jù)歸一化處理3)用卡方檢驗(yàn)法篩選出兩種技術(shù)差異檢測區(qū)域4)差異檢測區(qū)域基因組定位,即查看這些區(qū)域周圍是不是有其它基因。如果是在孤島區(qū),可能是個(gè)錯(cuò)誤檢測的信號,不予考慮5)設(shè)計(jì) RT-PCR 驗(yàn)證實(shí)駘實(shí)例取小鼠大腦組織, 用DNA測序平臺SOLID獲得轉(zhuǎn)錄組mRNA-seq及rmRNA-seq數(shù)據(jù)。對數(shù)據(jù)做前期處理,包括:消除背景噪聲、數(shù)據(jù)歸一化、統(tǒng)計(jì)檢驗(yàn)差異檢測區(qū)。最后發(fā)現(xiàn)rmRNA-seq技術(shù)除了能檢測到大部分的mRNA轉(zhuǎn)錄本,同時(shí)還有一些在基因區(qū)及基因間區(qū)表達(dá)的轉(zhuǎn)錄本。通過對這些差異檢測區(qū)域做基因組定位及RT-RCR驗(yàn)證,最后發(fā)現(xiàn)多個(gè)新的調(diào)控基因表達(dá)的IncRNA。以上是對本發(fā)明的描述而非限定,基于本發(fā)明思想的其它實(shí)施方式,均在本發(fā)明的保護(hù)范圍之中。
權(quán)利要求
1.一種高通量篩選基因組中新轉(zhuǎn)錄本的方法,其特征在于,針對rmRNA-seq及mRNA-seq實(shí)驗(yàn)結(jié)果間存在的差異,設(shè)計(jì)數(shù)據(jù)分析流程,篩選差異區(qū)域,并設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證,發(fā)現(xiàn)新轉(zhuǎn)錄本 。
全文摘要
本發(fā)明旨在提供一種檢測基因組中尚末注釋的新轉(zhuǎn)錄本的方法。該方法對同一樣本分別采用mRNA-seq及rmRNA-seq技術(shù)獲得轉(zhuǎn)錄組全基因組數(shù)據(jù)。比較基因組區(qū)域兩種技術(shù)獲得的表達(dá)譜結(jié)果,做統(tǒng)計(jì)分析找出有顯著差異的區(qū)域。針對其中表達(dá)豐度比較高差異區(qū)域,設(shè)計(jì)RT-PCR驗(yàn)證其生物學(xué)功能。此發(fā)明可以很好的應(yīng)用于高通量篩選基因組中新轉(zhuǎn)錄本。
文檔編號C12Q1/68GK103173523SQ20111043559
公開日2013年6月26日 申請日期2011年12月22日 優(yōu)先權(quán)日2011年12月22日
發(fā)明者曾華宗 申請人:上海聚類生物科技有限公司