国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種利用文本挖掘進(jìn)行病毒及人類蛋白相互作用的方法

      文檔序號(hào):5872854閱讀:366來(lái)源:國(guó)知局
      專利名稱:一種利用文本挖掘進(jìn)行病毒及人類蛋白相互作用的方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于生物技術(shù)領(lǐng)域,涉及一種利用文獻(xiàn)挖掘技術(shù)進(jìn)行病毒與人類蛋白相互作用研究的方法。
      背景技術(shù)
      病毒是一種非細(xì)胞生命形態(tài),它由一個(gè)核酸長(zhǎng)鏈和蛋白質(zhì)外殼構(gòu)成,病毒沒(méi)有自己的代謝機(jī)構(gòu),沒(méi)有酶系統(tǒng)。因此病毒離開(kāi)了宿主細(xì)胞,就成了沒(méi)有任何生命活動(dòng)、也不能獨(dú)立自我繁殖的化學(xué)物質(zhì)。一旦進(jìn)入宿主細(xì)胞后,它就可以利用細(xì)胞中的物質(zhì)和能量以及復(fù)制、轉(zhuǎn)錄和轉(zhuǎn)譯的能力,按照它自己的核酸所包含的遺傳信息產(chǎn)生和它一樣的新一代病
      ο病毒的主要特征之一便是致瘤作用,有一些病毒能誘發(fā)良性腫瘤,如痘病毒科的兔纖維瘤病毒、人傳染性軟疣病毒和乳多泡病毒科的乳頭瘤病毒;另有一些能誘發(fā)惡性腫瘤,按其核酸種類可分為DNA腫瘤病毒和RNA腫瘤病毒。病毒在自身上表現(xiàn)代謝無(wú)活性,具感染性,對(duì)細(xì)胞有絕對(duì)的依存性,表現(xiàn)在存在于細(xì)胞外的病毒不具遺傳活性,但保留感染活性;當(dāng)病毒在宿主細(xì)胞內(nèi)是,病毒便復(fù)制、翻譯、表達(dá)自身核酸,已侵染細(xì)胞。對(duì)于宿主細(xì)胞,病毒的侵入,往往會(huì)導(dǎo)致宿主細(xì)胞蛋白表達(dá)模式的改變,抑制宿主蛋白基因的表達(dá),這種抑制將影響宿主細(xì)胞的正常生理功能并決定病毒的致病進(jìn)程和結(jié)果。最新研究表明,病毒對(duì)人類蛋白的抑制調(diào)控作用存在多種形式,本發(fā)明特提出一種假說(shuō)病毒通過(guò)自身基因表達(dá)蛋白,調(diào)控人類蛋白轉(zhuǎn)錄因子的表達(dá),再經(jīng)由特定表達(dá)的轉(zhuǎn)錄因子調(diào)控人類蛋白的表達(dá),這是病毒調(diào)控蛋白的一種形式。

      發(fā)明內(nèi)容
      本發(fā)明的方法主要研究的問(wèn)題是病毒與人類蛋白相互作用的關(guān)系,基于一種文獻(xiàn)挖掘技術(shù)研究找出病毒對(duì)人類蛋白的調(diào)控機(jī)制。因此我們提出一種病毒調(diào)控蛋白的假說(shuō), 其假說(shuō)為病毒不會(huì)直接調(diào)控人類目標(biāo)蛋白,而是通過(guò)調(diào)控相關(guān)的轉(zhuǎn)錄因子來(lái)間接調(diào)控目標(biāo)蛋白的表達(dá)。為此我們?cè)O(shè)計(jì)了如下流程1、利用文獻(xiàn)挖掘技術(shù)構(gòu)建病毒與人類基因的相互作用數(shù)據(jù)庫(kù)2、利用上述數(shù)據(jù)庫(kù)對(duì)病毒和人類蛋白進(jìn)行相互作用關(guān)系分析,并從中提取出轉(zhuǎn)錄因子基因3、對(duì)轉(zhuǎn)錄因子進(jìn)行調(diào)控蛋白預(yù)測(cè),預(yù)測(cè)出的調(diào)控蛋白即被認(rèn)為跟病毒存在間接的相互作用。4、對(duì)病毒與人類調(diào)控基因進(jìn)行實(shí)驗(yàn)驗(yàn)證,驗(yàn)證其表達(dá)調(diào)控關(guān)系


      圖1是本發(fā)明方法的實(shí)施流程2是使用文獻(xiàn)挖掘技術(shù)找出的HBV與人類蛋白基因的相互作用關(guān)系
      圖3是采用western blot實(shí)驗(yàn)驗(yàn)證HBV與人類蛋白基因IFNAR2表達(dá)調(diào)控關(guān)系的結(jié)果。實(shí)施方式本發(fā)明的方法將以HBV(乙型肝炎病毒)與人類蛋白的相互作用關(guān)系為例介紹本發(fā)明實(shí)施的具體方式。步驟1、構(gòu)建HBV與人類基因的相互作用數(shù)據(jù)庫(kù),從PubMed文獻(xiàn)摘要數(shù)據(jù)庫(kù)中下載 HBV與人類基因相互作用關(guān)系的相關(guān)文獻(xiàn),構(gòu)建數(shù)據(jù)庫(kù)。步驟為DDocument searching & formating 文檔搜索及格式化,利用關(guān)鍵詞進(jìn)行文檔搜索,并將文檔整理成XML格式。2)Sentence tokenlization using Lingpipe 利用 Lingpipe 工具包中的 Sentencetokenlization工具將摘要文本分離成單個(gè)句子。后續(xù)的分析是以句子為基本單位的。3) Human gene mention tagging using ABNER :利用 ABNER 軟件進(jìn)行人類基因的描述的定位。提取人類基因。4)Conjunction resolution 對(duì)于提取的基因的描述中,如“STAT3/5gene”將被解析成 STAT3gene 和 STAT5gene5) Gene name normalization based on Entrez database :由于自由文本中對(duì)于基因的名字比較混亂,需要將文章中的基因描述統(tǒng)一為官方基因符號(hào),以方便分析和比較。 基因符號(hào)以NCBI的entrez gene數(shù)據(jù)庫(kù)為準(zhǔn)。6)Verb tagging using Lingpipe and inhouse protein-protein interaction verbdictionary :先建立一個(gè)蛋白互作的 verb 詞典,包含如 repress, regulate, inhibit, interact, phosphorylate, downregulate, upregulate 等所有動(dòng)詞及其變型。詞典取材自 BioNLP 項(xiàng)目 Qittp //bionlp. sourceforge. net/)。然后利用 Lingpipe 工具包分離句子中蛋白互作的verb。并以此構(gòu)建文獻(xiàn)數(shù)據(jù)庫(kù)。步驟2、利用上述數(shù)據(jù)庫(kù)分析HBV與人類轉(zhuǎn)錄因子的相互作用關(guān)系。首先,成HBV 蛋白同義詞字典(匯編自entrez gene database),然后利用Lingpipe工具包分離句子,獲得HBV蛋白的描述,對(duì)數(shù)據(jù)庫(kù)進(jìn)行統(tǒng)計(jì)分析。分析結(jié)果表明HBV可以上調(diào)AP-l,NF-kappaB 等活性,抑制P53,E2F1等活性。步驟3、對(duì)步驟二得到的轉(zhuǎn)錄因子進(jìn)行調(diào)控蛋白預(yù)測(cè),主要方法是對(duì)人類所有的基因,提取其上游3000bp(堿基)序列,通過(guò)PWM算法(Pulseiidthmodulation),利用 m2transfac 1. O 軟件(http://www.gene_regulation.com/pub/programs.html)預(yù)測(cè)受上述轉(zhuǎn)錄因子調(diào)控的基因。步驟4、實(shí)驗(yàn)驗(yàn)證,從預(yù)測(cè)出的人類調(diào)控蛋白中篩選出蛋白基因IFNAR2表達(dá)的蛋白進(jìn)行western blot實(shí)驗(yàn)驗(yàn)證,驗(yàn)證其與HBV的表達(dá)調(diào)控關(guān)系,結(jié)果表明HBV與人類蛋白 IFNAR2之間具有間接的調(diào)控關(guān)系以上是對(duì)本發(fā)明的描述而非限定,基于本發(fā)明思想的其它實(shí)施方式,均在本發(fā)明的保護(hù)范圍之中。
      權(quán)利要求
      1.本發(fā)明所述的利用文獻(xiàn)挖掘技術(shù)進(jìn)行病毒與人類蛋白相互作用研究的方法,其主要特征在于步驟一,利用文獻(xiàn)挖掘技術(shù)構(gòu)建病毒與人類基因的相互作用數(shù)據(jù)庫(kù); 步驟二,利用步驟一所建數(shù)據(jù)庫(kù)分析病毒與人類蛋白的相互作用關(guān)系,提取出轉(zhuǎn)錄因子基因;步驟三,對(duì)轉(zhuǎn)錄因子進(jìn)行蛋白預(yù)測(cè),預(yù)測(cè)出調(diào)控蛋白及所調(diào)控人類基因; 步驟四,實(shí)驗(yàn)驗(yàn)證病毒與預(yù)測(cè)出的人類蛋白之間的表達(dá)調(diào)控關(guān)系。
      全文摘要
      本發(fā)明設(shè)計(jì)了一種利用文獻(xiàn)挖掘技術(shù)研究病毒與人類蛋白相互作用關(guān)系的方法,包括如下幾步主要流程步驟1,利用文獻(xiàn)挖掘技術(shù)構(gòu)建病毒與人類基因的相互作用數(shù)據(jù)庫(kù);步驟2,利用步驟一所建數(shù)據(jù)庫(kù)分析病毒與人類蛋白的相互作用關(guān)系,提取出轉(zhuǎn)錄因子基因;步驟3,對(duì)轉(zhuǎn)錄因子進(jìn)行蛋白預(yù)測(cè),預(yù)測(cè)出調(diào)控蛋白及所調(diào)控人類基因;步驟4,實(shí)驗(yàn)驗(yàn)證病毒與預(yù)測(cè)出的人類蛋白之間的表達(dá)調(diào)控關(guān)系。本方法的特點(diǎn)在于,引入了文獻(xiàn)挖掘技術(shù),篩選出受病毒蛋白調(diào)控的人類轉(zhuǎn)錄因子基因,并用實(shí)驗(yàn)驗(yàn)證病毒與人類蛋白的間接表達(dá)調(diào)控關(guān)系。
      文檔編號(hào)G01N33/53GK102268485SQ201010193130
      公開(kāi)日2011年12月7日 申請(qǐng)日期2010年6月4日 優(yōu)先權(quán)日2010年6月4日
      發(fā)明者曾華宗 申請(qǐng)人:上海聚類生物科技有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1