專利名稱:一種生物樣本完備性的評(píng)價(jià)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于生物樣本保存和利用技術(shù)領(lǐng)域,具體涉及一種在生物樣本庫(kù)系統(tǒng)中對(duì)樣本完備性進(jìn)行評(píng)價(jià)的方法。
背景技術(shù):
生物樣本是生命科學(xué)與醫(yī)藥研發(fā)領(lǐng)域的必備基礎(chǔ)和來(lái)源,用于診斷標(biāo)志物篩選和治療藥物研發(fā)等研究。生物樣本包含豐富的遺傳信息、疾病進(jìn)展信息、對(duì)治療的反應(yīng)信息等,且具有不可再生性,規(guī)范保存和利用的生物樣本已成為該領(lǐng)域最寶貴的資源,是實(shí)現(xiàn)科研成果快速產(chǎn)業(yè)化、實(shí)現(xiàn)“轉(zhuǎn)化醫(yī)學(xué)”研究目標(biāo)的重要保證。在遵循醫(yī)學(xué)倫理規(guī)范的前提下,國(guó)內(nèi)外已經(jīng)建立了各類不同規(guī)模的生物樣本庫(kù),特別是惡性腫瘤、心腦血管和血液病等各類重大疾病的生物樣本庫(kù)。生物樣本庫(kù)不僅需要保存核酸、蛋白質(zhì)、細(xì)胞、石蠟保存組織、 凍存組織和體液等實(shí)物,而且需要記錄相關(guān)的臨床、病理、檢驗(yàn)、影像、隨訪和樣本調(diào)用等資料。建立生物樣本庫(kù)不僅僅是一項(xiàng)簡(jiǎn)單的收集工作,而是要通過(guò)儲(chǔ)存和使用樣本參與臨床和科學(xué)研究,來(lái)實(shí)現(xiàn)生物樣本的醫(yī)療健康意義或某種經(jīng)濟(jì)目的。生物樣本對(duì)研究的貢獻(xiàn)實(shí)現(xiàn)于樣本被使用那一刻,在保存過(guò)程中難以評(píng)價(jià)其潛在貢獻(xiàn)大小。生物樣本的保存盡管尚無(wú)明確標(biāo)準(zhǔn),但一般要求是對(duì)于血液樣本要有患者姓名、性別、年齡、疾病種類等基本資料;對(duì)于組織樣本還要有病理資料。同時(shí)認(rèn)為生物樣本越齊全越好,包括1)生物樣本的實(shí)物和資料,如一例腫瘤樣本有血液、凍存組織、石蠟包埋組織等類型,有臨床資料、病理資料和檢驗(yàn)資料,好于僅有一管血液樣本和臨床資料的病例; 2)患者病情的跟蹤隨訪,如計(jì)算患者的生存期必須要有隨訪資料;3)獲得樣本的分子生物學(xué)信息,如疾病相關(guān)基因的突變檢測(cè);4)難以取得的樣本和資料,如早期腫瘤或低發(fā)病率的疾病。高水平研究項(xiàng)目通常要求多種形式的樣本實(shí)物和齊全的樣本資料,實(shí)物和資料的齊全程度(可稱之為完備性)反映了樣本可用于研究的潛在貢獻(xiàn)大小?,F(xiàn)在的生物樣本庫(kù)系統(tǒng)實(shí)現(xiàn)了樣本的分類和定位、資料的存儲(chǔ)和更新、樣本存放和取出等功能,用戶調(diào)用樣本過(guò)程為向樣本檢索系統(tǒng)輸入關(guān)鍵詞;系統(tǒng)列出包含關(guān)鍵詞的樣本;用戶從中選擇樣本用于研究。這些樣本的確符合用戶需求,但其中也包含了超出用戶需求的樣本。這種樣本調(diào)用方法容易導(dǎo)致兩種尷尬局面(1)符合高水平科研項(xiàng)目要求的生物樣本可能被用于低水平的項(xiàng)目,( 僅能用于低水平項(xiàng)目的生物樣本占用昂貴的儲(chǔ)存空間,造成了寶貴樣本和儲(chǔ)存空間的雙重浪費(fèi)。與樣本檢索流程比較,在文檔的信息檢索領(lǐng)域中,用戶搜索目的文檔的流程如下 向檢索系統(tǒng)輸入關(guān)鍵詞;檢索系統(tǒng)列出候選文檔/網(wǎng)頁(yè);使用TF*IDF等方法計(jì)算這些文檔和用戶關(guān)鍵詞之間的相關(guān)程度;按相關(guān)程度列出最符合用戶期望的文檔。與文檔檢索比較樣本檢索具有以下不同之處(1)不僅要列出符合本次檢索關(guān)鍵詞的結(jié)果,而且要區(qū)分這些結(jié)果中那些超出本次檢索要求,以及超出的程度;(2)樣本檢索的關(guān)鍵詞既有對(duì)應(yīng)樣本實(shí)物的,也有對(duì)應(yīng)樣本資料的,樣本用于研究需要有實(shí)物,沒(méi)有實(shí)物的話資料再多也無(wú)用, 反之也是;C3)部分字段涉及樣本庫(kù)的質(zhì)量、數(shù)量或有效期等控制條件,不適合用于評(píng)價(jià)樣
3本完備性;(4)與文檔相比,樣本庫(kù)的字段設(shè)置和保存相對(duì)規(guī)范,有利于檢索和評(píng)價(jià)。最大的不同之處,文檔可以無(wú)限拷貝,生物樣本卻不可再生,這就要求我們必須解決生物樣本的評(píng)價(jià)問(wèn)題,為用戶提供合格且合適的樣本,保留超出用戶需求的樣本,用于更高要求的研究。
發(fā)明內(nèi)容
本發(fā)明提供一種在生物樣本庫(kù)系統(tǒng)中對(duì)樣本完備性進(jìn)行評(píng)價(jià)的方法,通過(guò)在儲(chǔ)存子系統(tǒng)中保存樣本實(shí)物和樣本資料,在評(píng)分子系統(tǒng)中計(jì)算每個(gè)病例的實(shí)物完備性和資料完備性,以分別反映實(shí)物庫(kù)存和信息庫(kù)存,并將兩者以二次函數(shù)的關(guān)系合并作為生物樣本整體完備性的量化評(píng)價(jià)指標(biāo),最后在檢索子系統(tǒng)中為用戶提供按完備性排序的樣本列表,以便對(duì)完備性不同的生物樣本采取相應(yīng)的策略。本發(fā)明方法是在一個(gè)生物樣本庫(kù)系統(tǒng)中依次按照以下步驟實(shí)現(xiàn)的(1)在儲(chǔ)存子系統(tǒng)中保存樣本實(shí)物和樣本資料;在存儲(chǔ)子系統(tǒng)中列出樣本庫(kù)中所有待評(píng)價(jià)病例為集合P,統(tǒng)計(jì)病例總數(shù)為N ;列出與樣本實(shí)物相關(guān)的字段Wi為集合S ;列出與樣本資料相關(guān)的字段Wi為集合D ;統(tǒng)計(jì)病例集合中所有包含字段Wi的病例總數(shù),表示為 df (Wi);在進(jìn)行步驟(1)前先列出停用病例集合nP和停用字段集合nW,這些集合中的病例和字段不用于后續(xù)計(jì)算。(2)在評(píng)分子系統(tǒng)中,針對(duì)集合S,計(jì)算字段Wi和病例P的相關(guān)性評(píng)分korel (ρ, Wi),評(píng)分公式為
權(quán)利要求
1.一種生物樣本完備性的評(píng)價(jià)方法,是在一個(gè)生物樣本庫(kù)系統(tǒng)中依次按照以下步驟實(shí)現(xiàn)的(1)在儲(chǔ)存子系統(tǒng)中保存樣本實(shí)物和樣本資料,在存儲(chǔ)子系統(tǒng)中列出樣本庫(kù)中所有待評(píng)價(jià)病例為集合P,統(tǒng)計(jì)病例總數(shù)為N,列出與樣本實(shí)物相關(guān)的字段Wi為集合S,列出與樣本資料相關(guān)的字段Wi為集合D,統(tǒng)計(jì)病例集合中所有包含字段Wi的病例總數(shù),表示為 df (Wi);(2)在評(píng)分子系統(tǒng)中,針對(duì)集合S,計(jì)算字段Wi和病例ρ的相關(guān)性評(píng)分korel(p,Wi), 評(píng)分公式為
2.根據(jù)權(quán)利要求1所述的一種生物樣本完備性的評(píng)價(jià)方法,其特征在于,在進(jìn)行步驟 (1)前先列出停用病例集合nP和停用字段集合nW,這些集合中的病例和字段不用于后續(xù)計(jì)算。
全文摘要
本發(fā)明提供一種生物樣本完備性的評(píng)價(jià)方法,通過(guò)在儲(chǔ)存子系統(tǒng)中保存樣本實(shí)物和樣本資料,在評(píng)分子系統(tǒng)中計(jì)算每個(gè)病例的實(shí)物完備性和資料完備性,以分別反映實(shí)物庫(kù)存和信息庫(kù)存,并將兩者以二次函數(shù)的關(guān)系合并作為生物樣本整體完備性的量化評(píng)價(jià)指標(biāo),最后在檢索子系統(tǒng)中為用戶提供按完備性排序的樣本列表。本發(fā)明優(yōu)先使用符合用戶需求的低價(jià)值病例的樣本,保留超出用戶需求的高完備性的樣本,提高了生物樣本和樣本庫(kù)的利用效率。本發(fā)明的評(píng)分字段,其分值由該字段在病例中出現(xiàn)的次數(shù)計(jì)算而來(lái),天然反映了相應(yīng)病例的稀缺和重要程度,并且隨著新樣本的入庫(kù)和資料的更新,評(píng)分指標(biāo)的分值也隨之更新,具備了客觀、量化、全面、動(dòng)態(tài)更新的優(yōu)點(diǎn)。
文檔編號(hào)G06F19/00GK102289601SQ20111024795
公開(kāi)日2011年12月21日 申請(qǐng)日期2011年8月24日 優(yōu)先權(quán)日2011年8月24日
發(fā)明者周小宇, 葛維挺, 鄭樹(shù), 黃彥欽 申請(qǐng)人:浙江大學(xué)