国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種利用測(cè)序技術(shù)分析豬乳腺組織基因表達(dá)差異的方法

      文檔序號(hào):400286閱讀:900來(lái)源:國(guó)知局
      專利名稱:一種利用測(cè)序技術(shù)分析豬乳腺組織基因表達(dá)差異的方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于動(dòng)物基因工程技術(shù)領(lǐng)域,尤其涉及一種利用測(cè)序技術(shù)分析豬乳腺組織基因表達(dá)差異的方法。
      背景技術(shù)
      金華豬又稱“金華兩頭烏”,是我國(guó)著名的優(yōu)良豬種之一,金華豬具有成熟早,肉質(zhì)好,繁殖率高等優(yōu)良性能,腌制成的“金華火腿”質(zhì)佳味香,外型美觀,蜚聲中外。產(chǎn)于浙江東陽(yáng)、義烏、金華等地。體型中等,耳下垂,頸短粗,背微凹,臀傾斜、蹄質(zhì)堅(jiān)實(shí)。全身被毛中間白,頭頸、臀尾黑。以早熟易肥、皮薄骨細(xì)、肉質(zhì)優(yōu)良、適于腌制火腿著稱。金華豬的毛色遺傳性比較穩(wěn)定,以中間白、兩頭烏為特征,純正的毛色在頭頂部和臀部為黑皮黑毛,其余多處均為白皮白毛,在黑白交界中,有黑皮白毛呈帶狀的暈。金華豬性成熟早,遺傳性穩(wěn)定,繁殖力強(qiáng)。金華豬雜種優(yōu)勢(shì)良好,已被廣泛用作雜交親本。肉脂品質(zhì)好,肌肉顏色鮮紅,系水力強(qiáng),細(xì)嫩多汁,富含肌肉脂肪。皮薄骨細(xì),頭小肢細(xì),胴體中皮骨比例低,可食部分多。繁殖力高,平均每胎產(chǎn)仔可達(dá)14頭以上,繁殖年限長(zhǎng),優(yōu)良母豬高產(chǎn)性能可持續(xù)8-9年,終生產(chǎn)仔20胎左右,乳頭數(shù)多,泌乳力強(qiáng),母性好,仔豬哺育率高。適應(yīng)性好,耐寒耐熱能力強(qiáng), 耐粗飼,能適應(yīng)我國(guó)大部分地區(qū)的氣候環(huán)境,多次出口到日本、法國(guó)、加拿大、泰國(guó)等國(guó)家。大約克豬原產(chǎn)于英國(guó),是世界分布最廣的瘦肉型豬代表品種。我國(guó)引入多年,由于其體形大,被毛全白,亦稱為大白豬,在各地均有飼養(yǎng),可作為第一母本或父本利用。具有生長(zhǎng)速度快、飼料利用率高、胴體瘦肉率高、肉色好、產(chǎn)仔多、適應(yīng)性強(qiáng)的優(yōu)良特點(diǎn).其體形高大,皮膚可有隱斑;頭頸較長(zhǎng),面寬微凹,耳向前直立;體軀長(zhǎng),背腰平直或微弓,腹線平, 胸寬深,后軀寬長(zhǎng)豐滿;有效乳頭6對(duì)以上.成年公豬體重250-300千克,成年母豬體重 230-250千克。通常利用的雜交方式是杜X長(zhǎng)X大或杜X大X長(zhǎng),即用長(zhǎng)白公(母)豬與大約克夏母(公)豬交配生產(chǎn),雜一代母豬再用杜洛克公豬(終端父本)雜交生產(chǎn)商品豬。這是目前世界上比較好的配合。我國(guó)用大約克夏豬作父本與本地豬進(jìn)行二元雜交或三元雜交,效果也很好??稍谖覈?guó)絕大部分地區(qū)飼養(yǎng),較適宜集約化養(yǎng)豬場(chǎng)、規(guī)模豬場(chǎng)。隨著新一代高通量測(cè)序技術(shù)的快速發(fā)展,建立在高通量測(cè)序基礎(chǔ)上的轉(zhuǎn)錄組測(cè)序技術(shù)已成為目前從全基因組水平研究基因表達(dá)和轉(zhuǎn)錄組分析的重要手段.轉(zhuǎn)錄水平的調(diào)控是生物體最主要的調(diào)控方式.在深度測(cè)序技術(shù)出現(xiàn)之前,高通量測(cè)定不同基因轉(zhuǎn)錄水平的主要手段是基因芯片,它可以對(duì)不同組織或不同發(fā)育階段的基因表達(dá)差異和模式進(jìn)行分析,而RNA-Seq技術(shù)最基本的應(yīng)用也是檢測(cè)基因的表達(dá)水平,它對(duì)同一樣品深度測(cè)序可以捕獲低表達(dá)的基因,而對(duì)大量樣品同時(shí)測(cè)序可以獲得樣品之間的表達(dá)差異。與基因芯片數(shù)據(jù)比較,RNA測(cè)序得到的是數(shù)字化的表達(dá)信號(hào),無(wú)需設(shè)計(jì)探針,能在全基因組范圍內(nèi)以單堿基分辨率檢測(cè)和量化轉(zhuǎn)錄片段,具有靈敏度高、分辨率高和應(yīng)用范圍廣等優(yōu)勢(shì)。除此之外, 研究人員還可以獲得轉(zhuǎn)錄本表達(dá)豐度、轉(zhuǎn)錄起始位點(diǎn)和可變剪切等重要信息。所以,建立在高通量測(cè)序基礎(chǔ)上的轉(zhuǎn)錄組研究已經(jīng)逐步取代基因芯片技術(shù)成為目前從全基因組水平研究基因表達(dá)的主流方法。Marioni et al. (2008)比較了轉(zhuǎn)錄組測(cè)序和傳統(tǒng)Microarray芯片技術(shù)在分析基因表達(dá)水平上的各自表現(xiàn),他們發(fā)現(xiàn)深度測(cè)序具有良好的可重復(fù)性,并且能發(fā)現(xiàn)更多的低表達(dá)的基因。Tang et al. (2009)等利用RNA-Seq對(duì)小鼠單個(gè)卵母細(xì)胞進(jìn)行表達(dá)譜分析,與芯片技術(shù)相比,高通量測(cè)序可以多檢測(cè)到75%的基因表達(dá),并且有8%_19% 的基因存在兩種以上的轉(zhuǎn)錄形式。Pan et al . O008)利用Solexa測(cè)序儀進(jìn)行了人的轉(zhuǎn)錄組測(cè)序,首次利用新一代測(cè)序數(shù)據(jù)發(fā)現(xiàn)和檢測(cè)了選擇性剪切,而且還用測(cè)序數(shù)據(jù)估計(jì)了外顯子。把高通量測(cè)序技術(shù)應(yīng)用到由mRNA逆轉(zhuǎn)錄生成的cDNA上,從而獲得來(lái)自不同際遇的 mRNA片段在特定樣本中的含量,這就是mRNA測(cè)序或mRNA-seq。同樣原理,各種類型的轉(zhuǎn)錄本都可以用深度測(cè)序技術(shù)進(jìn)行高通量定量檢測(cè),統(tǒng)稱作RNA-seq或RNA測(cè)序。

      發(fā)明內(nèi)容
      本發(fā)明目的在于針對(duì)現(xiàn)有技術(shù)的不足,提供一種利用測(cè)序技術(shù)分析豬乳腺組織基因表達(dá)差異的方法。該方法通過(guò)制備金華豬和大約克豬乳腺組織的cDNA文庫(kù)并進(jìn)行轉(zhuǎn)錄組測(cè)序分析來(lái)研究其基因表達(dá)情況,并進(jìn)行兩不同樣本的基因差異表達(dá)分析和差異基因GO 分析。本發(fā)明的目的是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的一種利用測(cè)序技術(shù)分析豬乳腺組織基因表達(dá)差異的方法,該方法包括以下步驟
      (1)總RNA的提取金華豬和大約克豬屠宰后,采集乳腺組織樣本,研缽置于高壓滅菌鍋中滅菌,然后將乳腺組織樣本放入研缽,倒入液氮,將乳腺組織樣本研磨成粉末狀態(tài);然后取樣品粉末50-100mg,移至已加入Iml Trizol試劑的2ml離心管中并混勻,室溫條件下靜置5-lOmin,讓樣品中核蛋白混合物完全裂解;在離心管中加入200ul氯仿,劇烈震蕩15 秒后,室溫條件下靜置2-aiiin ;
      然后放入離心機(jī)中,4°C、13000rpm離心15min,上層無(wú)色水相為RNA,下層紅色是酚、 氯仿層;吸取上層無(wú)色水相至一新的離心管中,加入500ul異丙醇(沉淀RNA),室溫條件下靜置IOmin ;然后4°C、13000rpm離心lOmin,RNA被沉淀,呈膠狀顆粒;棄上清,加入Iml用 DEPC水配置的體積百分比濃度為75%酒精,旋轉(zhuǎn)管子混勻;4°C、IOOOOrpm離心5min ;棄乙醇,沉淀物在室溫條件下干燥5-lOmin ;加入50ul體積百分比濃度為0. 1%的DEPC水溶解 RNA ;
      (2)構(gòu)建組織RNA-Seq 測(cè)序 cDNA 文庫(kù),采用 Illumina Satandard Kit 試劑盒,cDNA 文庫(kù)的制備主要包括以下子步驟(2. l)mRNA分離和片段化;用poly (T)寡聚核苷酸從上述2個(gè)總RNA池中抽取帶poly(A)尾的RNA,其中的主要部分就是編碼基因所轉(zhuǎn)錄的mRNA, 然后將所得的mRNA用裂解液在70攝氏度下裂解5分鐘;(2. 2) cDNA合成與末端修復(fù);利用N6隨機(jī)引物和反轉(zhuǎn)錄酶將片段化的mRNA合成cDNA —鏈,隨后用RNaseH和DNA多聚酶再將一鏈cDNA合成雙鏈cDNA,然后利用T4DNA多聚酶和KlenowDNA多聚酶對(duì)二鏈cDNA進(jìn)行末端修飾;(2. 3)連接5'和3'測(cè)序接頭;用Illumina adaptor mix和T4DNA酶將上述經(jīng)過(guò)末端修飾的cDNA連接到Illumina雙端測(cè)序接頭上,這樣得到將用于測(cè)序的cDNA ; (2. 4) PCR擴(kuò)增cDNA文庫(kù);在以上過(guò)程,將RNA隨機(jī)片段化和采用隨機(jī)引物進(jìn)行反轉(zhuǎn)錄,都是為了使所得cDNA片段較均勻地取自各個(gè)轉(zhuǎn)錄本,為了提高測(cè)序效率,一般采用電泳切膠法(瓊脂糖凝膠的質(zhì)量體積比濃度為0. 02g/ml),獲取長(zhǎng)度范圍在200-250bp的cDNA片段, 再經(jīng)過(guò)15個(gè)循環(huán)的PCR線性擴(kuò)增后,最后用QIAquick PCR purification KIT試劑盒富集和純化得到最終的cDNA文庫(kù);
      (3)采用IlluminaGA II X測(cè)序儀器對(duì)建庫(kù)產(chǎn)物進(jìn)行測(cè)序上述純化好的cDNA文庫(kù)放進(jìn)基因組分析泳道中,采用邊合成邊測(cè)序法,利用Illumina GA II χ測(cè)序平臺(tái)進(jìn)行5'和 3'雙向75nt長(zhǎng)度RNA-Seq測(cè)序,每個(gè)通道將產(chǎn)生數(shù)百萬(wàn)條原始的讀段(Read),Read的測(cè)序讀長(zhǎng)為75bp ;
      (4)RNA-Seq數(shù)據(jù)的基本處理,該步驟包括以下子步驟
      (4. 1)將測(cè)序數(shù)據(jù)定位到參考基因組獲得RNA-Seq的原始數(shù)據(jù)后,首先需要將所有測(cè)序讀段通過(guò)序列映射定位到Ensembl數(shù)據(jù)庫(kù)的豬基因組上,這需要使用TopHat軟件以及Bowtie軟件共同來(lái)完成;首先,通過(guò)Bowtie采用Burrows-Wheeler轉(zhuǎn)換將豬基因組按照一定規(guī)則壓縮并建立索引,然后采用Tophat軟件來(lái)查找和回溯來(lái)定位讀段;不過(guò)在讀段定位之前,需要按照Illumina標(biāo)準(zhǔn)程序?qū)ψx段進(jìn)行質(zhì)量過(guò)濾,Tophat允許每個(gè)讀段多重比對(duì),并且可以允許最多出現(xiàn)2個(gè)缺省的錯(cuò)配;定位的結(jié)果接著被用于鑒定可以表達(dá)的 “islands”,這也就是潛在的外顯子;如果存在有些讀段不能直接定位到參考基因組上,那么就會(huì)將這些讀段與Tophat數(shù)據(jù)庫(kù)中公認(rèn)的結(jié)合位點(diǎn)進(jìn)行比對(duì),從而可以簽訂出潛在的外顯子結(jié)合位點(diǎn);最后,讀段定位到基因組后采用SAM格式來(lái)存儲(chǔ),而鑒定的結(jié)合位點(diǎn)會(huì)以 BED文件保存;
      (4. 2)轉(zhuǎn)錄本簽訂上述憑借好的序列會(huì)進(jìn)一步使用Cuffinks軟件來(lái)預(yù)測(cè)新的轉(zhuǎn)錄本; RNA-Seq數(shù)據(jù)能在一定程度上推斷對(duì)于每一個(gè)轉(zhuǎn)錄本的表達(dá)水平,并檢測(cè)其在不同樣品間的差異表達(dá)和調(diào)控;因?yàn)镃uffinks軟件可以不依賴一致參考基因的轉(zhuǎn)錄本去預(yù)測(cè)未知的、 潛在的新的轉(zhuǎn)錄本,這就使得CufTinks軟件可以應(yīng)用于位置物種選擇性剪切和轉(zhuǎn)錄本的鑒定;預(yù)測(cè)的轉(zhuǎn)錄本會(huì)存儲(chǔ)在以transcript, expr命名的文件夾里,而簽訂的基因則會(huì)儲(chǔ)存在以genes, expr命名的文件夾下面;用FPKM進(jìn)行基因表達(dá)估計(jì),F(xiàn)PKM就是每百萬(wàn)讀段中來(lái)自于某基因外顯子每千堿基長(zhǎng)度的讀段數(shù),公式表示為=FPKM=(基因區(qū)段計(jì)數(shù)/基因長(zhǎng)度*測(cè)序深度)*109 ;最后預(yù)測(cè)的轉(zhuǎn)錄本和他們相關(guān)的外顯子會(huì)形成GTF格式文件,并被儲(chǔ)存在transcript, gtf文件夾下面;
      (4. 3)基因和轉(zhuǎn)錄本注釋一旦所有的讀段序列用Cuffinks軟件進(jìn)行組合后,組合轉(zhuǎn)錄本的GTF文件將和參考基因組一起進(jìn)行比對(duì);利用Cuffinks軟件中得Cuffcompare模塊可以對(duì)每個(gè)轉(zhuǎn)錄本是已知或未知進(jìn)行分類;這樣,所有的轉(zhuǎn)錄本包括與參考基因組匹配的(ClaSS-COde:u or -)或者包含在參考基因組內(nèi)的(class-c0de:c)以及發(fā)現(xiàn)新的轉(zhuǎn)錄本亞型(class-code ;j)和潛在的新的轉(zhuǎn)錄本(class-code:u or -)都會(huì)被簽訂出來(lái);一份包括所有預(yù)測(cè)的轉(zhuǎn)錄本和參考轉(zhuǎn)錄本的組合文件將會(huì)生成并被存儲(chǔ)在<Sample_Name>_ combined, gtf 文件下面;
      (5)比較兩種樣本中基因表達(dá)的差異用金華豬乳腺組織中FPKM值與大約克豬乳腺組織中FPKM值的比值的絕對(duì)表達(dá)倍數(shù)來(lái)表示金華豬和大約克豬乳腺組織中差異基因表達(dá)水平;
      (6)差異表達(dá)基因的GO分析基因功能聚類分析采用GO方法分析,使用功能基因注釋軟件包bioconducter分析組織中功能相關(guān)基因表達(dá)變化;一般來(lái)說(shuō),單個(gè)基因的表達(dá)情況的改變不能完全反應(yīng)特定細(xì)胞功能和通路的整體變化情況;因?yàn)樯飩€(gè)體的細(xì)胞功能的實(shí)現(xiàn)并不僅僅是依靠一兩個(gè)基因功能的改變來(lái)實(shí)現(xiàn)的;而基因本體(Gene Ontology, G0),也就是一套與基因有關(guān)的樹(shù)狀的詞匯表的引入為基因功能數(shù)據(jù)挖掘提供了新的思路;GO分析主要目的在于發(fā)掘出與基因差異表達(dá)現(xiàn)象關(guān)聯(lián)的特征基因功能類的組合;GO分析是根據(jù)挑選出的有注釋的差異基因,計(jì)算這些差異基因同GO分類中某個(gè)特定的分支的超幾何分布關(guān)系;通過(guò)GO分析可以找到富集差異基因的GO分類條目,尋找不同樣品間的差異基因可能和那些基因功能的改變有關(guān)。本發(fā)明的有益效果是,通過(guò)高通量測(cè)序(RNA-kq)技術(shù)對(duì)金華豬和大約克豬乳腺組織進(jìn)行全基因組表達(dá)譜分析,探討這兩個(gè)不同豬種的乳腺基因組表達(dá)差異,得到一系列重要的遺傳信息,為深入研究豬泌乳發(fā)育、泌乳過(guò)程中相關(guān)的基因功能和調(diào)控機(jī)制提供基礎(chǔ)材料。


      圖1是質(zhì)量體積比為0.06g/ml的聚丙烯酰胺凝膠電泳圖,圖中,第一泳道是 marker條帶,第二泳道是金華豬乳腺組織cDNA條帶,第三泳道是大約克豬乳腺組織cDNA條
      市ο
      具體實(shí)施例方式本發(fā)明利用測(cè)序技術(shù)分析豬乳腺組織基因表達(dá)差異的方法,包括以下步驟
      1、總RNA的提取金華豬和大約克豬屠宰后,采集乳腺組織樣本,研缽置于高壓滅菌鍋中滅菌,然后將乳腺組織樣本放入研缽,倒入液氮,將乳腺組織樣本研磨成粉末狀態(tài) ’然后取樣品粉末50-100mg,移至已加入Iml Trizol試劑的2ml離心管中并混勻,室溫條件下靜置5-lOmin,讓樣品中核蛋白混合物完全裂解;在離心管中加入200ul氯仿,劇烈震蕩15 秒后,室溫條件下靜置2-aiiin ;
      然后放入離心機(jī)中,4°C、13000rpm離心15min,上層無(wú)色水相為RNA,下層紅色是酚、 氯仿層;吸取上層無(wú)色水相至一新的離心管中,加入500ul異丙醇(沉淀RNA),室溫條件下靜置IOmin ;然后4°C、13000rpm離心lOmin,RNA被沉淀,呈膠狀顆粒;棄上清,加入Iml用 DEPC水配置的體積百分比濃度為75%酒精,旋轉(zhuǎn)管子混勻;4°C、IOOOOrpm離心5min ;棄乙醇,沉淀物在室溫條件下干燥5-lOmin ;加入50ul體積百分比濃度為0. 1%的DEPC水溶解 RNA。同時(shí),取出2ul進(jìn)行RNA完整性檢驗(yàn),另外取出Iul進(jìn)行RNA濃度和純度的測(cè)定,其余在-70°C保存?zhèn)溆谩?、構(gòu)建組織 RNA-Seq 測(cè)序 cDNA 文庫(kù),采用 Illumina Satandard Kit 試劑盒, cDNA文庫(kù)的制備主要包括以下步驟(l)mRNA分離和片段化;用poly (T)寡聚核苷酸從上述2個(gè)總RNA池中抽取帶poly(A)尾的RNA,其中的主要部分就是編碼基因所轉(zhuǎn)錄的mRNA, 然后將所得的mRNA用裂解液在70攝氏度下裂解5分鐘。(2) cDNA合成與末端修復(fù);利用 N6隨機(jī)引物和反轉(zhuǎn)錄酶將片段化的mRNA合成cDNA —鏈,隨后用RNaseH和DNA多聚酶再將一鏈cDNA合成雙鏈cDNA,然后利用T4DNA多聚酶和KlenowDNA多聚酶對(duì)二鏈cDNA進(jìn)行末端修飾。(3)連接5'和3'測(cè)序接頭;用Illumina adaptor mix和T4DNA酶將上述經(jīng)過(guò)末端修飾的cDNA連接到Illumina雙端測(cè)序接頭上,這樣得到將用于測(cè)序的cDNA。(4)PCR擴(kuò)增cDNA文庫(kù);在以上過(guò)程,將RNA隨機(jī)片段化和采用隨機(jī)引物進(jìn)行反轉(zhuǎn)錄,都是為了使所得 cDNA片段較均勻地取自各個(gè)轉(zhuǎn)錄本,為了提高測(cè)序效率,一般采用電泳切膠法(瓊脂糖凝膠的質(zhì)量體積比濃度為0. 02g/ml),獲取長(zhǎng)度范圍在200-250bp的cDNA片段,再經(jīng)過(guò)15個(gè)循環(huán)的PCR線性擴(kuò)增后,最后用QIAquick PCR purification KIT試劑盒富集和純化得到最終的cDNA文庫(kù)。3、采用Illumina GA II X測(cè)序儀器對(duì)建庫(kù)產(chǎn)物進(jìn)行測(cè)序上述純化好的cDNA文庫(kù)放進(jìn)基因組分析泳道中,采用邊合成邊測(cè)序法(sequencing by synthesis,SBS),利用 Illumina GA II χ測(cè)序平臺(tái)進(jìn)行5'和3'雙向75nt長(zhǎng)度RNA-Seq測(cè)序,每個(gè)通道將產(chǎn)生數(shù)百萬(wàn)條原始的讀段(Read),Read的測(cè)序讀長(zhǎng)為75bp。4、RNA-Seq數(shù)據(jù)的基本處理
      (1)將測(cè)序數(shù)據(jù)定位到參考基因組
      獲得RNA-Seq的原始數(shù)據(jù)后,首先需要將所有測(cè)序讀段通過(guò)序列映射定位到Ensembl 數(shù)據(jù)庫(kù)的豬基因組上(http:www. ensembl. org/info/data/ftp/index. html),這需要使用 TopHat軟件以及Bowtie軟件共同來(lái)完成。首先,通過(guò)Bowtie采用Burrows-Wheeler轉(zhuǎn)換將豬基因組按照一定規(guī)則壓縮并建立索引,然后采用Tophat軟件來(lái)查找和回溯來(lái)定位讀段。不過(guò)在讀段定位之前,需要按照Illumina標(biāo)準(zhǔn)程序?qū)ψx段進(jìn)行質(zhì)量過(guò)濾,Tophat允許每個(gè)讀段多重比對(duì),并且可以允許最多出現(xiàn)2個(gè)缺省的錯(cuò)配。定位的結(jié)果接著被用于鑒定可以表達(dá)的“islands”,這也就是潛在的外顯子。如果存在有些讀段不能直接定位到參考基因組上,那么就會(huì)將這些讀段與Tophat數(shù)據(jù)庫(kù)中公認(rèn)的結(jié)合位點(diǎn)進(jìn)行比對(duì),從而可以簽訂出潛在的外顯子結(jié)合位點(diǎn)(即剪切位點(diǎn))。最后,讀段定位到基因組后采用SAMGequence Alignment/Map)格式來(lái)存儲(chǔ),而鑒定的結(jié)合位點(diǎn)會(huì)以BED文件保存。(2)轉(zhuǎn)錄本簽訂
      上述憑借好的序列會(huì)進(jìn)一步使用Cuffinks軟件來(lái)預(yù)測(cè)新的轉(zhuǎn)錄本。RNA-Seq數(shù)據(jù)能在一定程度上推斷對(duì)于每一個(gè)轉(zhuǎn)錄本的表達(dá)水平,并檢測(cè)其在不同樣品間的差異表達(dá)和調(diào)控。因?yàn)镃uffinks軟件可以不依賴一致參考基因的轉(zhuǎn)錄本去預(yù)測(cè)未知的、潛在的新的轉(zhuǎn)錄本,這就使得CufTinks軟件可以應(yīng)用于位置物種選擇性剪切和轉(zhuǎn)錄本的鑒定。預(yù)測(cè)的轉(zhuǎn)錄本會(huì)存儲(chǔ)在以transcript, expr命名的文件夾里,而簽訂的基因則會(huì)儲(chǔ)存在以genes, expr 命名的文件夾下面。目前最常用的基因表達(dá)估計(jì)方法包括FPKM(Fragments Per Kilobases of exon per Million fragments mapped),就是每百萬(wàn)讀段中來(lái)自于某基因外顯子每千堿基長(zhǎng)度的讀段數(shù),公式表示為=FPKM=(基因區(qū)段計(jì)數(shù)/基因長(zhǎng)度*測(cè)序深度)*109。最后預(yù)測(cè)的轉(zhuǎn)錄本和他們相關(guān)的外顯子會(huì)形成GTF格式文件,并被儲(chǔ)存在transcript, gtf文件夾下面。(3)基因和轉(zhuǎn)錄本注釋
      一旦所有的讀段序列用Cuffinks軟件進(jìn)行組合后,組合轉(zhuǎn)錄本的GTF文件將和參考基因組一起進(jìn)行比對(duì)。利用Cuffinks軟件中得Cuffcompare模塊可以對(duì)每個(gè)轉(zhuǎn)錄本是已知或未知進(jìn)行分類。這樣,所有的轉(zhuǎn)錄本包括與參考基因組匹配的(class-code:!! or -)或者包含在參考基因組內(nèi)的(claSS-COde:C)以及發(fā)現(xiàn)新的轉(zhuǎn)錄本亞型(class-code ; j)和潛在的新的轉(zhuǎn)錄本(class-code:!! or -)都會(huì)被簽訂出來(lái)。一份包括所有預(yù)測(cè)的轉(zhuǎn)錄本和參考轉(zhuǎn)錄本的組合文件將會(huì)生成并被存儲(chǔ)在<Sample_Name>_COmbined. gtf文件下面。5、比較兩種樣本中基因表達(dá)的差異。這些差異一般可以用一些統(tǒng)計(jì)假設(shè)檢驗(yàn)方法檢測(cè),但這種檢驗(yàn)有時(shí)會(huì)受到測(cè)序深度、基因長(zhǎng)度等因素的影響,需要對(duì)結(jié)果進(jìn)行仔細(xì)分析,消除盡可能的混雜因素,必要時(shí)可以用讀段的絕對(duì)表達(dá)值倍數(shù)變化(fold-change)來(lái)作為補(bǔ)充。RNA測(cè)序數(shù)據(jù)是對(duì)提取出的RNA轉(zhuǎn)錄本中隨機(jī)進(jìn)行的短片段測(cè)序,如果一個(gè)轉(zhuǎn)錄本的豐度高,則深度測(cè)序后定位到其對(duì)應(yīng)的基因組區(qū)域的讀段也就多,可以通過(guò)對(duì)定位到基因外顯子區(qū)的讀段計(jì)數(shù)來(lái)估計(jì)基因表達(dá)水平。很顯然,讀段計(jì)數(shù)出了與基因真實(shí)表達(dá)水平成正比,還與基因長(zhǎng)度成正比,同時(shí)也與測(cè)序深度即測(cè)序?qū)嶒?yàn)中得到的總讀段數(shù)正相關(guān)。為了保持對(duì)不同基因和不同試驗(yàn)件估計(jì)的基因表達(dá)值的可比性,人們提出了 FPKM (fragment per kilobase of exon per million fragments mapped)的概念FPKM是每百萬(wàn)讀段中來(lái)自于某基因每千堿基長(zhǎng)度的讀段數(shù)。在本發(fā)明的試驗(yàn)中,金華豬和大約克豬乳腺組織中差異基因表達(dá)水平就是用金華豬乳腺組織中FPKM值與大約克豬乳腺組織中FPKM值的比值, 并且為了消除盡可能的混雜因素,我們采用絕對(duì)表達(dá)倍數(shù)表示。6、差異表達(dá)基因的GO (Gene Ontology)分析?;蚬δ芫垲惙治霾捎肎O方法分析,使用功能基因注釋軟件包bioconducter分析組織中功能相關(guān)基因表達(dá)變化。一般來(lái)說(shuō),單個(gè)基因的表達(dá)情況的改變不能完全反應(yīng)特定細(xì)胞功能和通路的整體變化情況。因?yàn)樯飩€(gè)體的細(xì)胞功能的實(shí)現(xiàn)并不僅僅是依靠一兩個(gè)基因功能的改變來(lái)實(shí)現(xiàn)的。而基因本體 (Gene Ontology, G0),也就是一套與基因有關(guān)的樹(shù)狀的詞匯表的引入為基因功能數(shù)據(jù)挖掘提供了新的思路。GO分析主要目的在于發(fā)掘出與基因差異表達(dá)現(xiàn)象關(guān)聯(lián)的特征基因功能類的組合。GO分析是根據(jù)挑選出的有注釋的差異基因,計(jì)算這些差異基因同GO分類中某個(gè)特定的分支的超幾何分布關(guān)系。通過(guò)GO分析可以找到富集差異基因的GO分類條目,尋找不同樣品間的差異基因可能和那些基因功能的改變有關(guān)。以下結(jié)合實(shí)施例來(lái)進(jìn)一步說(shuō)明本發(fā)明。1、總RNA的提取
      采集泌乳21天金華豬、大約克豬屠宰后迅速采集乳腺組織樣本,立刻裝入冷凍管中, 置入液氮中,按上述步驟提取總RNA。配制靜DEPC處理的電泳緩沖液50X TAE,高壓滅菌待用,用3%H202浸泡電泳槽15min,再用DEPC沖洗,然后倒入0. 5X TAE電泳緩沖液,用0. 5 X TAE電泳緩沖液制備1%瓊脂糖凝膠進(jìn)行電泳,在凝膠成像儀上觀察并拍照,初步評(píng)估RNA 質(zhì)量。2、測(cè)序cDNA文庫(kù)的構(gòu)建
      采用標(biāo)準(zhǔn)建庫(kù)方法,分別對(duì)金華豬和大約克豬乳腺組織總RNA,進(jìn)行測(cè)序文庫(kù)構(gòu)建,并用6. (FoTBEpolyacrylamide gel檢測(cè)條帶的準(zhǔn)確性。結(jié)果表明,文庫(kù)條帶均在350bp附近, 與目的條帶相符。檢測(cè)結(jié)果見(jiàn)圖1。3、Illumina Solexa測(cè)序結(jié)果基本處理
      其中RXJ樣品(金華)共測(cè)序獲得30,307,414的數(shù)據(jù)讀數(shù)(Reads),共計(jì)產(chǎn)生約2. 27G 的數(shù)據(jù)量,RXY樣品(大約克夏),共測(cè)序獲得31,M4,100的數(shù)據(jù)讀數(shù),共計(jì)產(chǎn)生約2. 34G的數(shù)據(jù)量。為了進(jìn)一步獲得測(cè)序數(shù)據(jù)與測(cè)序物種的基因信息的比對(duì)結(jié)果,我們對(duì)數(shù)據(jù)進(jìn)行了進(jìn)一步的統(tǒng)計(jì)分析。使用TopHat軟件將RNA-Seq測(cè)序數(shù)據(jù)定位到參考基因組。樣品RXJ 和RXY分別有30,378,936和31,沘5,299數(shù)據(jù)是可比對(duì)的(當(dāng)一個(gè)測(cè)序數(shù)據(jù)比對(duì)上Genome 一次,我們計(jì)算為一次Mappable,當(dāng)一個(gè)測(cè)序數(shù)據(jù)比對(duì)上Genome 二次則計(jì)數(shù)的Mappable為二,因此Mappable Reads數(shù)目有可能大于測(cè)序總讀數(shù)),18,744,172以及19,858,470的數(shù)據(jù)是比對(duì)上基因組的,其中比對(duì)上Transcripts的數(shù)目分別為12,628,373和12,461,893,比對(duì)上Intron的分別為308,360和569,356,比對(duì)上Genome的分別是4,286,671以及5, 264,186。4、新預(yù)測(cè)的兩個(gè)樣本的轉(zhuǎn)錄本、外顯子和內(nèi)含子的統(tǒng)計(jì)信息
      相對(duì)于既有的Ensembl上的GTF文件文件信息,利用豬基因組序列以及測(cè)序數(shù)據(jù),采用Cufflinks軟件來(lái)預(yù)測(cè)新的轉(zhuǎn)錄本.其中針對(duì)RXJ樣本,在染色體l(chrl)上,轉(zhuǎn)錄本 (Transcript)最短長(zhǎng)度為71nt,最長(zhǎng)為83Mnt,平均長(zhǎng)度為648. 6nt.其中包括的外顯子, 從1-57個(gè)外顯子不等,其中平均外顯子個(gè)數(shù)為2. 9個(gè).針對(duì)的外顯子長(zhǎng)度從4nt到4537nt 堿基長(zhǎng)度不等,平均長(zhǎng)度為221. 6nt.內(nèi)含子長(zhǎng)度從70nt到344474nt堿基不等,平均內(nèi)含子長(zhǎng)度為5434. 1.而針對(duì)RXY樣本,在染色體l(chrl)上,轉(zhuǎn)錄本CTranscript)最短長(zhǎng)度為71nt,最長(zhǎng)為9599nt,平均長(zhǎng)度為742. 6nt。其中包括的外顯子,從1到58個(gè)外顯子不等,其中平均外顯子個(gè)數(shù)為2. 9個(gè)。針對(duì)的外顯子長(zhǎng)度從4nt到5740nt堿基長(zhǎng)度不等,平均長(zhǎng)度為259. 9nt。內(nèi)含子長(zhǎng)度從70nt到^0700nt堿基不等,平均內(nèi)含子長(zhǎng)度為 5785.5nt。對(duì)于RXY樣品,所有染色體上預(yù)測(cè)的最長(zhǎng)的轉(zhuǎn)錄本有9871nt,位于chrMT,最短的只有71nt,位于chrl和chr2在內(nèi)的多條染色體上;所有染色體上預(yù)測(cè)的最大的外顯子個(gè)數(shù)有57個(gè),位于chrl,最長(zhǎng)的外顯子為8737nt,位于chrMT ;在所有染色體上預(yù)測(cè)的內(nèi)含子最長(zhǎng)有500000nt,位于chrll上,最短也為70nt。對(duì)于RXY樣品,所有染色體上預(yù)測(cè)的最長(zhǎng)的轉(zhuǎn)錄本有1485^t,位于chrl2上,最短的只有71nt,位于多條染色體上;所有染色體上預(yù)測(cè)的最大的外顯子個(gè)數(shù)有58個(gè),位于chrl上,最長(zhǎng)的外顯子為6870nt,位于chr2 ;在所有染色體上預(yù)測(cè)的內(nèi)含子最長(zhǎng)有448666nt,也位于chrll,最短的只有70nt,位于chrl在內(nèi)的多條染色體上。所以,通過(guò)比較可以看出RXJ樣本預(yù)測(cè)的最長(zhǎng)的轉(zhuǎn)錄本和最長(zhǎng)的內(nèi)含子都高于RXY樣本,但后者的最多外顯子個(gè)數(shù)以及最長(zhǎng)外顯子長(zhǎng)度都高于前者。5、基因差異表達(dá)分析
      在本研究中,金華豬、大約克豬差異表達(dá)基因四40個(gè),并且差異基因表達(dá)水平值的范圍是-20. 0722到17. 3563。在這些差異表達(dá)基因中,表達(dá)差異倍數(shù)大于2倍的有178個(gè),其中表達(dá)上調(diào)有96個(gè),下調(diào)有82個(gè)。從結(jié)果中發(fā)現(xiàn),差異表達(dá)基因上調(diào)的多余下調(diào)的。上調(diào)的基因有 SLK、SPTAN1、HMGCS1、ACOX1、ACLY 等,下調(diào)的基因有 ABHD6、PHGR1、CHI3L1、PPP1CB、 RNDl 等。6、差異表達(dá)基因的G0(Gene Ontology)分析
      在本實(shí)驗(yàn)中將差異表達(dá)的基因分別按照生物過(guò)程、細(xì)胞成分和分子功能進(jìn)行分類。顯著性GO分類1-生物學(xué)過(guò)程中涉及到的顯著功能有轉(zhuǎn)錄調(diào)控、信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞粘附、蛋白質(zhì)磷酸化、多細(xì)胞生物的發(fā)育調(diào)控、跨膜運(yùn)輸、蛋白質(zhì)運(yùn)輸、細(xì)胞凋亡、蛋白質(zhì)水解、細(xì)胞周期、 細(xì)胞分化等。顯著性分類2-細(xì)胞成分中涉及的顯著性功能有細(xì)胞質(zhì)、核、膜、膜的完整性、 質(zhì)膜、胞液、線粒體、高爾基體、內(nèi)質(zhì)網(wǎng)等。顯著性分類3-分子功能中涉及的顯著性功能有蛋白結(jié)合、金屬離子結(jié)合、核苷酸結(jié)合、鋅離子結(jié)合、ATP結(jié)合、水解酶活力、轉(zhuǎn)移酶活力、催化活力等。
      權(quán)利要求
      1. 一種利用測(cè)序技術(shù)分析豬乳腺組織基因表達(dá)差異的方法,其特征在于,該方法包括以下步驟(1)總RNA的提取金華豬和大約克豬屠宰后,采集乳腺組織樣本,研缽置于高壓滅菌鍋中滅菌,然后將乳腺組織樣本放入研缽,倒入液氮,將乳腺組織樣本研磨成粉末狀態(tài);然后取樣品粉末50-100mg,移至已加入Iml Trizol試劑的2ml離心管中并混勻,室溫條件下靜置5-lOmin,讓樣品中核蛋白混合物完全裂解;在離心管中加入200ul氯仿,劇烈震蕩15 秒后,室溫條件下靜置2-aiiin ;然后放入離心機(jī)中,4°C、13000rpm離心15min,上層無(wú)色水相為RNA,下層紅色是酚、 氯仿層;吸取上層無(wú)色水相至一新的離心管中,加入500ul異丙醇(沉淀RNA),室溫條件下靜置IOmin ;然后4°C、13000rpm離心lOmin,RNA被沉淀,呈膠狀顆粒;棄上清,加入Iml用 DEPC水配置的體積百分比濃度為75%酒精,旋轉(zhuǎn)管子混勻;4°C、IOOOOrpm離心5min ;棄乙醇,沉淀物在室溫條件下干燥5-lOmin ;加入50ul體積百分比濃度為0. 1%的DEPC水溶解 RNA ;(2)構(gòu)建組織RNA-Seq 測(cè)序 cDNA 文庫(kù),采用 Illumina Satandard Kit 試劑盒,cDNA 文庫(kù)的制備主要包括以下子步驟(2. l)mRNA分離和片段化;用poly (T)寡聚核苷酸從上述2個(gè)總RNA池中抽取帶poly(A)尾的RNA,其中的主要部分就是編碼基因所轉(zhuǎn)錄的mRNA, 然后將所得的mRNA用裂解液在70攝氏度下裂解5分鐘;(2. 2) cDNA合成與末端修復(fù);利用N6隨機(jī)引物和反轉(zhuǎn)錄酶將片段化的mRNA合成cDNA —鏈,隨后用RNaseH和DNA多聚酶再將一鏈cDNA合成雙鏈cDNA,然后利用T4DNA多聚酶和KlenowDNA多聚酶對(duì)二鏈cDNA進(jìn)行末端修飾;(2. 3)連接5'和3'測(cè)序接頭;用Illumina adaptor mix和T4DNA酶將上述經(jīng)過(guò)末端修飾的cDNA連接到Illumina雙端測(cè)序接頭上,這樣得到將用于測(cè)序的cDNA ; (2. 4) PCR擴(kuò)增cDNA文庫(kù);在以上過(guò)程,將RNA隨機(jī)片段化和采用隨機(jī)引物進(jìn)行反轉(zhuǎn)錄,都是為了使所得cDNA片段較均勻地取自各個(gè)轉(zhuǎn)錄本,為了提高測(cè)序效率,一般采用電泳切膠法(瓊脂糖凝膠的質(zhì)量體積比濃度為0. 02g/ml),獲取長(zhǎng)度范圍在200-250bp的cDNA片段, 再經(jīng)過(guò)15個(gè)循環(huán)的PCR線性擴(kuò)增后,最后用QIAquick PCR purification KIT試劑盒富集和純化得到最終的cDNA文庫(kù);(3)采用IlluminaGA II X測(cè)序儀器對(duì)建庫(kù)產(chǎn)物進(jìn)行測(cè)序上述純化好的cDNA文庫(kù)放進(jìn)基因組分析泳道中,采用邊合成邊測(cè)序法,利用Illumina GA II χ測(cè)序平臺(tái)進(jìn)行5'和 3'雙向75nt長(zhǎng)度RNA-Seq測(cè)序,每個(gè)通道將產(chǎn)生數(shù)百萬(wàn)條原始的讀段(Read),Read的測(cè)序讀長(zhǎng)為75bp ;(4)RNA-Seq數(shù)據(jù)的基本處理,該步驟包括以下子步驟(4. 1)將測(cè)序數(shù)據(jù)定位到參考基因組獲得RNA-Seq的原始數(shù)據(jù)后,首先需要將所有測(cè)序讀段通過(guò)序列映射定位到Ensembl數(shù)據(jù)庫(kù)的豬基因組上,這需要使用TopHat軟件以及Bowtie軟件共同來(lái)完成;首先,通過(guò)Bowtie采用Burrows-Wheeler轉(zhuǎn)換將豬基因組按照一定規(guī)則壓縮并建立索引,然后采用Tophat軟件來(lái)查找和回溯來(lái)定位讀段;不過(guò)在讀段定位之前,需要按照Illumina標(biāo)準(zhǔn)程序?qū)ψx段進(jìn)行質(zhì)量過(guò)濾,Tophat允許每個(gè)讀段多重比對(duì),并且可以允許最多出現(xiàn)2個(gè)缺省的錯(cuò)配;定位的結(jié)果接著被用于鑒定可以表達(dá)的 “islands”,這也就是潛在的外顯子;如果存在有些讀段不能直接定位到參考基因組上,那么就會(huì)將這些讀段與Tophat數(shù)據(jù)庫(kù)中公認(rèn)的結(jié)合位點(diǎn)進(jìn)行比對(duì),從而可以簽訂出潛在的外顯子結(jié)合位點(diǎn);最后,讀段定位到基因組后采用SAM格式來(lái)存儲(chǔ),而鑒定的結(jié)合位點(diǎn)會(huì)以 BED文件保存;(4. 2)轉(zhuǎn)錄本簽訂上述憑借好的序列會(huì)進(jìn)一步使用Cuffinks軟件來(lái)預(yù)測(cè)新的轉(zhuǎn)錄本; RNA-Seq數(shù)據(jù)能在一定程度上推斷對(duì)于每一個(gè)轉(zhuǎn)錄本的表達(dá)水平,并檢測(cè)其在不同樣品間的差異表達(dá)和調(diào)控;因?yàn)镃uffinks軟件可以不依賴一致參考基因的轉(zhuǎn)錄本去預(yù)測(cè)未知的、 潛在的新的轉(zhuǎn)錄本,這就使得CufTinks軟件可以應(yīng)用于位置物種選擇性剪切和轉(zhuǎn)錄本的鑒定;預(yù)測(cè)的轉(zhuǎn)錄本會(huì)存儲(chǔ)在以transcript, expr命名的文件夾里,而簽訂的基因則會(huì)儲(chǔ)存在以genes, expr命名的文件夾下面;用FPKM進(jìn)行基因表達(dá)估計(jì),F(xiàn)PKM就是每百萬(wàn)讀段中來(lái)自于某基因外顯子每千堿基長(zhǎng)度的讀段數(shù),公式表示為=FPKM=(基因區(qū)段計(jì)數(shù)/基因長(zhǎng)度*測(cè)序深度)*109 ;最后預(yù)測(cè)的轉(zhuǎn)錄本和他們相關(guān)的外顯子會(huì)形成GTF格式文件,并被儲(chǔ)存在transcript, gtf文件夾下面;(4. 3)基因和轉(zhuǎn)錄本注釋一旦所有的讀段序列用Cuffinks軟件進(jìn)行組合后,組合轉(zhuǎn)錄本的GTF文件將和參考基因組一起進(jìn)行比對(duì);利用Cuffinks軟件中得Cuffcompare模塊可以對(duì)每個(gè)轉(zhuǎn)錄本是已知或未知進(jìn)行分類;這樣,所有的轉(zhuǎn)錄本包括與參考基因組匹配的(ClaSS-COde:u or -)或者包含在參考基因組內(nèi)的(class-c0de:c)以及發(fā)現(xiàn)新的轉(zhuǎn)錄本亞型(class-code ;j)和潛在的新的轉(zhuǎn)錄本(class-code:u or _)都會(huì)被簽訂出來(lái);一份包括所有預(yù)測(cè)的轉(zhuǎn)錄本和參考轉(zhuǎn)錄本的組合文件將會(huì)生成并被存儲(chǔ)在<Sample_Name>_ combined, gtf 文件下面;(5)比較兩種樣本中基因表達(dá)的差異用金華豬乳腺組織中FPKM值與大約克豬乳腺組織中FPKM值的比值的絕對(duì)表達(dá)倍數(shù)來(lái)表示金華豬和大約克豬乳腺組織中差異基因表達(dá)水平;(6)差異表達(dá)基因的GO分析基因功能聚類分析采用GO方法分析,使用功能基因注釋軟件包bioconducter分析組織中功能相關(guān)基因表達(dá)變化;一般來(lái)說(shuō),單個(gè)基因的表達(dá)情況的改變不能完全反應(yīng)特定細(xì)胞功能和通路的整體變化情況;因?yàn)樯飩€(gè)體的細(xì)胞功能的實(shí)現(xiàn)并不僅僅是依靠一兩個(gè)基因功能的改變來(lái)實(shí)現(xiàn)的;而基因本體(Gene Ontology, G0),也就是一套與基因有關(guān)的樹(shù)狀的詞匯表的引入為基因功能數(shù)據(jù)挖掘提供了新的思路;GO分析主要目的在于發(fā)掘出與基因差異表達(dá)現(xiàn)象關(guān)聯(lián)的特征基因功能類的組合;GO分析是根據(jù)挑選出的有注釋的差異基因,計(jì)算這些差異基因同GO分類中某個(gè)特定的分支的超幾何分布關(guān)系;通過(guò)GO分析可以找到富集差異基因的GO分類條目,尋找不同樣品間的差異基因可能和那些基因功能的改變有關(guān)。
      全文摘要
      本發(fā)明公開(kāi)了一種利用測(cè)序技術(shù)分析豬乳腺組織基因表達(dá)差異的方法,分別構(gòu)建了金華豬和大約克豬乳腺組織cDNA的文庫(kù)并用基因組分析儀進(jìn)行測(cè)序,采用Cufflinks軟件預(yù)測(cè)了新的轉(zhuǎn)錄本信息;在此基礎(chǔ)上還對(duì)兩樣本測(cè)序結(jié)果進(jìn)行了比較分析,包括基因差異表達(dá)分析和差異表達(dá)基因的GeneOntology分析;本發(fā)明公開(kāi)了金華豬和大約克豬乳腺組織轉(zhuǎn)錄組測(cè)序的過(guò)程和結(jié)果,并對(duì)這些序列信息進(jìn)行了深入的統(tǒng)計(jì)分析和比較,以期為深入研究豬泌乳發(fā)育、泌乳過(guò)程中相關(guān)的基因功能和調(diào)控機(jī)制提供基礎(chǔ)材料。
      文檔編號(hào)C12Q1/68GK102409099SQ20111038581
      公開(kāi)日2012年4月11日 申請(qǐng)日期2011年11月29日 優(yōu)先權(quán)日2011年11月29日
      發(fā)明者張立凡, 彭靜, 徐寧迎, 王穎 申請(qǐng)人:浙江大學(xué)
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1