国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種rna編輯位點(diǎn)的特征分析方法

      文檔序號(hào):9766126閱讀:1308來(lái)源:國(guó)知局
      一種rna編輯位點(diǎn)的特征分析方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明屬于生物技術(shù)領(lǐng)域,具體地說(shuō),本發(fā)明涉及一種RNA編輯位點(diǎn)的特征分析 方法。
      【背景技術(shù)】
      [0002] RNA編輯是指DNA轉(zhuǎn)錄之后、翻譯之前在RNA水平上發(fā)生的堿基的缺失、插入或置 換。在高等生物中,最主要的RNA編輯是堿基A到1(次黃嘿嶺核巧)的修飾,送種修飾,通 常是被ADAR蛋白酶催化產(chǎn)生的。由于在翻譯水平上,次黃嘿嶺核巧酸(I)被識(shí)別為鳥核巧 酸(G),因此在該位點(diǎn)的送種編輯,實(shí)際上是A到G的轉(zhuǎn)換。送種改變可能導(dǎo)致相關(guān)蛋白質(zhì) 結(jié)構(gòu)功能的改變,也可能改變生物體內(nèi)起調(diào)控作用的RNA的結(jié)構(gòu)功能的改變。根據(jù)相關(guān)文 獻(xiàn)報(bào)道表明,RNA編輯現(xiàn)象與癌癥的發(fā)生有密切聯(lián)系,因而成為了當(dāng)前癌癥方面研究的一個(gè) 新的研究思路及研究熱點(diǎn)。
      [0003] 由于實(shí)驗(yàn)技術(shù)需求較多的資源的投入,當(dāng)前的RNA編輯方面的研究著重于W信息 學(xué)的方式進(jìn)行RNA編輯位點(diǎn)的鑒定的發(fā)掘,并在此基礎(chǔ)上進(jìn)行了 RNA編輯位點(diǎn)的特征統(tǒng) 計(jì)(基因組上分布,序列模體等)及后續(xù)的一些分析工作。當(dāng)前癌癥方面RNA編輯的分析 工作主要集中在分析基因編碼區(qū),特別是外顯子區(qū)的非同義突變的研究。送主要是因?yàn)樗?種方式的編輯可W比較直觀的反映到對(duì)基因表達(dá)產(chǎn)物的影響。但從現(xiàn)有文獻(xiàn)中已經(jīng)鑒定 出的RNA編輯位點(diǎn)分布情況來(lái)看,送種發(fā)生在基因編碼區(qū)的RNA編輯,只占總體RNA編輯 位點(diǎn)中極少比例的一部分,更多的RNA編輯位點(diǎn)發(fā)生在基因的內(nèi)含子區(qū)及被稱為Alu的 SINE(Short Interspersed Nuclear Element)區(qū)域。
      [0004] 上述情況表明,RNA編輯的真正調(diào)控作用應(yīng)該W W上兩種區(qū)域的作用及特點(diǎn)密 不可分。送將是之后對(duì)RNA編輯方面研究的重點(diǎn)思路之一。與其他的DNA變異不同(如 snp,indel鑒定等),RNA編輯的生物學(xué)鑒定及分析尚處于起步階段,因此,缺乏統(tǒng)一的分析 思路及相關(guān)的軟硬件支持,送導(dǎo)致大量的精力被投入到了重復(fù)性的工作中。
      [0005] 因此,對(duì)RNA編輯方面的分析,迫切需要一些較為完善的技術(shù)方案對(duì)RNA編輯位點(diǎn) 數(shù)據(jù)進(jìn)行基本特征分析,使得為RNA編輯方面的研究更為方便、快速、準(zhǔn)確。

      【發(fā)明內(nèi)容】

      [0006] 本發(fā)明的目的在于提供一種RNA編輯位點(diǎn)的特征分析方法。
      [0007] 本發(fā)明的第一方面,提供了一種RNA編輯位點(diǎn)的特征分析方法,包括步驟:
      [000引 (1)對(duì)待分析樣本進(jìn)行測(cè)序,獲得DNA和RNA數(shù)據(jù);
      [000引似分析步驟(1)中獲得的數(shù)據(jù),得到RNA編輯位點(diǎn)數(shù)據(jù)集;
      [0010] (3)統(tǒng)計(jì)獲得所述RNA編輯位點(diǎn)數(shù)據(jù)集中RNA編輯位點(diǎn)上下游序列的RNA二級(jí) 結(jié)構(gòu)自由能分布曲線A ;優(yōu)選地,所述"上下游序列"的長(zhǎng)度為50bp - 2(K)bp ;更優(yōu)選地為 lOObpo
      [0011] 在另一優(yōu)選例中,所述RNA二級(jí)結(jié)構(gòu)自由能分布曲線的中位數(shù)位于-55~-70 ;優(yōu) 選地位于-60~-65。
      [0012] 在另一優(yōu)選例中,所述方法還包括步驟:
      [0013] (4)統(tǒng)計(jì)獲得對(duì)照RNA編輯位點(diǎn)數(shù)據(jù)庫(kù)中的RNA編輯位點(diǎn)上下游序列的RNA二級(jí) 結(jié)構(gòu)自由能分布曲線B,并將曲線A和曲線B進(jìn)行比對(duì)。如果曲線A和曲線B大致重合,說(shuō) 明步驟(2)中所獲得的RNA編輯位點(diǎn)數(shù)據(jù)集較為可靠。
      [0014] 在另一優(yōu)選例中,所述方法還包括步驟:
      [0015] (a)統(tǒng)計(jì)RNA編輯位點(diǎn)數(shù)據(jù)集中單編輯位點(diǎn)的編輯頻率,選取差異顯著的位點(diǎn)進(jìn) 行抑R矯正,獲得具顯著差異的位點(diǎn)作為后續(xù)分析的候選位點(diǎn);
      [0016] 化)對(duì)RNA編輯位點(diǎn)數(shù)據(jù)集進(jìn)行兩類樣本單個(gè)基因編輯位點(diǎn)統(tǒng)計(jì),并W該統(tǒng)計(jì)獲 取兩類樣本編輯位點(diǎn)數(shù)變化差異在較大(較佳地,差異變化在0.5倍W上)的及兩類樣本 各自獨(dú)有的發(fā)生編輯的基因,供后續(xù)進(jìn)行目的基因的篩選。
      [0017] 在另一優(yōu)選例中,所述方法還包括步驟:
      [001引統(tǒng)計(jì)所有樣本檢出的編輯位點(diǎn)上下游各IObp位置的各堿基出現(xiàn)頻率。
      [0019] 在另一優(yōu)選例中,所述步驟化)中所述兩類樣本為腫瘤樣本和對(duì)應(yīng)正常樣本。
      [0020] 在另一優(yōu)選例中,所述步驟(3)中使用的統(tǒng)計(jì)工具為RNA化Id軟件。
      [0021] 在另一優(yōu)選例中,所述步驟(1)中待分析樣本為群體樣本,所述群體樣本中樣本 數(shù)量> 50個(gè),合并測(cè)得的DNA和RNA數(shù)據(jù)進(jìn)行步驟似。
      [0022] 在另一優(yōu)選例中,所述步驟(1)中待分析樣本包括正常組織和/或腫瘤組織。
      [0023] 在另一優(yōu)選例中,所述樣本選自;正常人或癌癥患者。
      [0024] 在另一優(yōu)選例中,所述步驟(a)中,對(duì)RNA編輯位點(diǎn)進(jìn)行兩類樣本(比如,癌癥樣 本和對(duì)應(yīng)正常樣本)單編輯位點(diǎn)編輯頻率的統(tǒng)計(jì),并W該頻率進(jìn)行成對(duì)t檢驗(yàn),獲取每個(gè)位 點(diǎn)的差異顯著性值(P值),選取差異顯著的點(diǎn)(如P<〇. 05)進(jìn)行抑R過(guò)濾(設(shè)置P<0. 05), 獲得在兩類樣本中具顯著差異的位點(diǎn),作為后續(xù)分析的候選位點(diǎn)。
      [00巧]在另一優(yōu)選例中,所述方法包括步驟:
      [0026] 進(jìn)行兩類樣本及DARN邸數(shù)據(jù)庫(kù)的RNA編輯位點(diǎn)繪制維恩圖。
      [0027] 應(yīng)理解,在本發(fā)明范圍內(nèi)中,本發(fā)明的上述各技術(shù)特征和在下文(如實(shí)施例)中具 體描述的各技術(shù)特征之間都可W互相組合,從而構(gòu)成新的或優(yōu)選的技術(shù)方案。限于篇幅,在 此不再一一累述。
      【附圖說(shuō)明】
      [002引圖1顯示了實(shí)施例1中數(shù)據(jù)庫(kù)預(yù)測(cè)RNA編輯位點(diǎn),snp位點(diǎn)二級(jí)結(jié)構(gòu)最小自由能 分布圖(虛線為中位數(shù))。
      [0029] 圖2顯示了實(shí)施例1中RNA編輯位點(diǎn)上下游各IObp特征情況圖。
      [0030] 圖3顯示了實(shí)施例1中正常樣本,腫瘤樣本,DAR肥D數(shù)據(jù)庫(kù)編輯位點(diǎn)韋恩圖。 [003。 圖4顯示了實(shí)施例2中數(shù)據(jù)庫(kù)預(yù)測(cè)RNA編輯位點(diǎn),snp位點(diǎn)二級(jí)結(jié)構(gòu)最小自由能 分布圖(虛線為中位數(shù))。
      [0032] 圖5顯示了實(shí)施例2中RNA編輯位點(diǎn)上下游各IObp特征情況圖。
      [0033] 圖6顯示了實(shí)施例2中正常樣本,腫瘤樣本,DARN邸數(shù)據(jù)庫(kù)編輯位點(diǎn)韋恩圖。
      【具體實(shí)施方式】
      [0034] 本發(fā)明人通過(guò)廣泛而深入的研究,獲得一種RNA編輯位點(diǎn)的特征分析方法,實(shí)驗(yàn) 結(jié)果表明,所述方法能夠方便、快速地對(duì)RNA編輯位點(diǎn)數(shù)據(jù)的基本特征進(jìn)行分析,并得出準(zhǔn) 確的結(jié)果。
      [003引測(cè)序
      [0036] 在本發(fā)明中,可用常規(guī)的測(cè)序技術(shù)和平臺(tái)進(jìn)行測(cè)序。優(yōu)選的測(cè)序方法包括;Life Technologies 的 proton 或 PGM, Illumina HiSeq, ABI SOLiD, Roche 454 等測(cè)序儀器。
      [0037] 在本發(fā)明中,特別適合對(duì)本發(fā)明構(gòu)建的PCR -化ee文庫(kù)進(jìn)行測(cè)序的方法是Ion Proton法。在一優(yōu)選例中,將符合上機(jī)測(cè)序標(biāo)準(zhǔn)的文庫(kù)片段,使用化e Ion P;roton?System 進(jìn)行測(cè)序。
      [00測(cè)數(shù)據(jù)處理
      [0039] 在本發(fā)明的優(yōu)選例中,數(shù)據(jù)處理通常包括W下步驟;W NCBI數(shù)據(jù)庫(kù)中公布的人基 因組為參考標(biāo)準(zhǔn)。將測(cè)序的reads轉(zhuǎn)換為化Stq格式,并與人基因組序列比對(duì),確定匹配的 讀序(即比對(duì)上的讀序)。
      [0040] 數(shù)據(jù)處理可W用本領(lǐng)域采用的方法或軟件進(jìn)行,包括市售的軟件、公開(kāi)的軟件 (尤其是全部開(kāi)源的軟件)進(jìn)行。
      [0041] RNA編輯位點(diǎn)樣本的獲得
      [0042] 目前公開(kāi)的RNA編輯位點(diǎn)數(shù)據(jù)庫(kù)包括;DARNED數(shù)據(jù)庫(kù)(網(wǎng)址;httpV/darned. UCC. ie/)、RADAR數(shù)據(jù)庫(kù)(網(wǎng)址;http://rnaedit. com/).可W作為對(duì)照數(shù)據(jù)庫(kù)。通過(guò)上述 的數(shù)據(jù)庫(kù)也可W獲得本發(fā)明所涉及的待分析的RNA編輯位點(diǎn)數(shù)據(jù)。
      [0043] 此外,對(duì)于群體樣本RNA編輯位點(diǎn)數(shù)據(jù)的獲得,可W采用如下方法。
      [0044] 針對(duì)Illumina測(cè)序平臺(tái)生產(chǎn)的高通量測(cè)序數(shù)據(jù),所包括的RNA編輯位點(diǎn)檢測(cè)方 法,步驟如下:
      [004引 (1)比對(duì)
      [0046] (1. 1)獲得原始測(cè)序數(shù)據(jù),所述原始測(cè)序數(shù)據(jù)為群體樣本的測(cè)序數(shù)據(jù);
      [0047] 在本發(fā)明的一個(gè)較佳實(shí)施方式中,所述原始測(cè)序數(shù)據(jù)包括正常DNA、腫瘤DNA、正 常RNA、腫瘤RNA的高通量測(cè)序數(shù)據(jù);
      [0048] (1. 2)原始數(shù)據(jù)過(guò)濾,目的是過(guò)濾掉一些含有接頭或者質(zhì)量值比較低的片段,獲得 "干凈的"數(shù)據(jù);主要內(nèi)容有:
      [004引 a)去除含接頭的片段;當(dāng)片段被接頭污染時(shí),可能測(cè)到接頭序列,所W要
      [0050] 除接頭;
      [0051] 扣)去除N的比例較高(優(yōu)選地比例> 10% )的片段,N含量過(guò)高會(huì)引起比
      [0052] 對(duì)錯(cuò)誤;
      [0053] (iii)去除低質(zhì)量片段,測(cè)序時(shí)存在測(cè)錯(cuò)的概率,低質(zhì)量的片段有可能存在
      [0054] 測(cè)錯(cuò)的堿基。
      [00巧](1. 3)比對(duì),利用基于Bowtie的RNA-seq比對(duì)工具to地at將測(cè)序數(shù)據(jù)比對(duì)到參考 基因組上,生成bam格式的文件。
      [0056] (1.4)使用GATK(Genome Analysis Too化it)對(duì)比對(duì)結(jié)果的堿基質(zhì)量值校正。 illumin
      當(dāng)前第1頁(yè)1 2 3 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1