本發(fā)明屬于生物信息分析自動(dòng)化,具體涉及一種測(cè)序數(shù)據(jù)的自動(dòng)判讀分析方法及裝置、設(shè)備、存儲(chǔ)介質(zhì)。
背景技術(shù):
1、高通量測(cè)序即二代測(cè)序(next-generation?sequencing,ngs)技術(shù),目前已廣泛應(yīng)用于腫瘤、遺傳病、感染性疾病以及無創(chuàng)產(chǎn)前檢測(cè)等領(lǐng)域,在腫瘤診斷與治療中的應(yīng)用更是精準(zhǔn)醫(yī)學(xué)的重要組成部分。
2、高通量測(cè)序可檢測(cè)的變異類型有單核苷酸變異(single?nucleotide?variants,snvs)、微小插入缺失突變(insert-deletion,indel)和結(jié)構(gòu)變異(structuralvariations,svs)。indel為基因組上小片段(<50bp)的插入或缺失。結(jié)構(gòu)變異主要包括拷貝數(shù)變異(copy?number?variants,cnvs)、染色體內(nèi)部的某個(gè)區(qū)域發(fā)生翻轉(zhuǎn)顛換、兩條染色體之間發(fā)生重排(inter-chromosome?translocation)等??截悢?shù)變異是大小在50bp到幾mb的dna片段的缺失、插入、倒置和重復(fù)等變異。基因融合(fusion)屬于染色體重排,兩個(gè)或者多個(gè)基因編碼區(qū)相連形成新的嵌合基因,產(chǎn)生新的融合蛋白。基因融合可能導(dǎo)致蛋白質(zhì)功能異?;虮磉_(dá)水平改變,從而引起一系列疾病,如慢性粒細(xì)胞性白血病、肺腺癌等。另外,腫瘤的ngs數(shù)據(jù)還可用于分析微衛(wèi)星不穩(wěn)定(microsatellite?instability,msi)、腫瘤突變負(fù)荷(tumor?mutation?burden,tmb)等腫瘤標(biāo)志物。
3、傳統(tǒng)的ngs數(shù)據(jù)分析可以分為一級(jí)、二級(jí)、三級(jí)分析。一級(jí)分析是利用測(cè)序技術(shù)將熒光信號(hào)轉(zhuǎn)換成四種堿基信號(hào)的過程,主要是basecall軟件通過堿基判讀技術(shù)和算法,從原始圖像中識(shí)別出堿基類型,將結(jié)果寫入cal文件,最終生成測(cè)序報(bào)告和fastq數(shù)據(jù),其流程基本一致。二級(jí)分析則是在一級(jí)分析的基礎(chǔ)上,對(duì)數(shù)據(jù)進(jìn)行更深入的處理,包括進(jìn)行序列質(zhì)量控制(去除低質(zhì)量序列和去除接頭序列等)、序列比對(duì)、變異篩選和注釋等。二級(jí)分析根據(jù)不同的分析目的,需要用到不同的分析方法,還需要整合不同的數(shù)據(jù)庫進(jìn)行注釋。一級(jí)分析和二級(jí)分析由生物信息分析人員完成,而三級(jí)分析則經(jīng)過生物信息分析人員進(jìn)一步變異篩選,再由解讀報(bào)告人員結(jié)合臨床信息對(duì)變異進(jìn)行進(jìn)一步分析和解讀。
4、ngs數(shù)據(jù)量大,數(shù)據(jù)分析流程復(fù)雜,可分析的變異類型多樣,整個(gè)分析過程涉及數(shù)據(jù)過濾、序列比對(duì)、變異注釋、變異篩選、變異分類和相關(guān)質(zhì)控等步驟,需要建立一個(gè)專業(yè)的、系統(tǒng)的數(shù)據(jù)分析流程。這些分析流程多為實(shí)驗(yàn)室自主開發(fā),流程復(fù)雜,需要根據(jù)實(shí)際應(yīng)用目的不同,檢測(cè)變異類型不同以及檢測(cè)項(xiàng)目不同等,采用不同的分析方法和變異篩選流程,這些都給生物信息分析和數(shù)據(jù)解讀報(bào)告人員提出較高的要求。
5、總而言之,相較于傳統(tǒng)的pcr檢測(cè),ngs數(shù)據(jù)分析質(zhì)量控制參數(shù)更多,由生信分析統(tǒng)計(jì)質(zhì)控信息后需要人工判讀,而現(xiàn)有針對(duì)ngs數(shù)據(jù)的分析流程復(fù)雜,分析效率低,自動(dòng)化解讀程度不高,導(dǎo)致過于依賴人工判讀,且數(shù)據(jù)解讀報(bào)告人員人工分析出錯(cuò)的概率較高。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種測(cè)序數(shù)據(jù)的自動(dòng)判讀分析方法及裝置、設(shè)備、存儲(chǔ)介質(zhì),可以提高自動(dòng)化解讀程度,提高分析效率,進(jìn)而減少對(duì)人工判讀的依賴,降低解讀報(bào)告分析出錯(cuò)率。
2、本發(fā)明第一方面公開一種測(cè)序數(shù)據(jù)的自動(dòng)判讀分析方法,包括:
3、響應(yīng)于第一數(shù)據(jù)分析指令,顯示對(duì)應(yīng)的第一數(shù)據(jù)分析界面;
4、根據(jù)在所述第一數(shù)據(jù)分析界面上被選中的目標(biāo)批次樣本,確定出所述目標(biāo)批次樣本的測(cè)序數(shù)據(jù);
5、根據(jù)質(zhì)控規(guī)則設(shè)置對(duì)應(yīng)的規(guī)則表達(dá)式,對(duì)所述目標(biāo)批次樣本的測(cè)序數(shù)據(jù)進(jìn)行自動(dòng)質(zhì)控判讀,獲得所述目標(biāo)批次樣本的質(zhì)控結(jié)果;
6、若所述質(zhì)控結(jié)果為全部通過,且檢測(cè)到針對(duì)上機(jī)批次的點(diǎn)擊指令,跳轉(zhuǎn)至第二數(shù)據(jù)分析界面;
7、在所述第二數(shù)據(jù)分析界面上顯示樣本列表以及目標(biāo)變異的相關(guān)信息,其中,所述目標(biāo)變異為所述樣本列表中被選中的樣本經(jīng)過數(shù)據(jù)過濾規(guī)則設(shè)置和報(bào)告規(guī)則設(shè)置的規(guī)則表達(dá)式雙層篩選后得到的變異位點(diǎn),所述相關(guān)信息至少包括所述目標(biāo)變異的唯一標(biāo)識(shí)、變異是否報(bào)告、變異的判讀結(jié)果和結(jié)果解釋;
8、響應(yīng)于在所述第二數(shù)據(jù)分析界面上輸入的提交指令,將所述目標(biāo)變異的相關(guān)信息提交到結(jié)果錄入界面,在所述結(jié)果錄入界面抓取報(bào)告單所需的要素內(nèi)容,根據(jù)所述要素內(nèi)容自動(dòng)填充生成所述目標(biāo)批次樣本的報(bào)告單;其中,所述要素內(nèi)容至少包括變異基因、變異位點(diǎn)、變異頻率和變異解釋。
9、在一些實(shí)施例中,根據(jù)質(zhì)控規(guī)則設(shè)置對(duì)應(yīng)的規(guī)則表達(dá)式,對(duì)所述目標(biāo)批次樣本的測(cè)序數(shù)據(jù)進(jìn)行自動(dòng)質(zhì)控判讀,獲得所述目標(biāo)批次樣本的質(zhì)控結(jié)果之后,所述方法還包括:
10、響應(yīng)于針對(duì)質(zhì)控分析界面入口的點(diǎn)擊指令,進(jìn)入質(zhì)控分析界面;
11、在所述質(zhì)控分析界面顯示所述質(zhì)控結(jié)果的具體信息,所述具體信息包括空白質(zhì)控、陰性質(zhì)控、陽性質(zhì)控和樣本內(nèi)控的質(zhì)控規(guī)則和抓取到的對(duì)應(yīng)數(shù)值。
12、在一些實(shí)施例中,根據(jù)質(zhì)控規(guī)則設(shè)置對(duì)應(yīng)的規(guī)則表達(dá)式,對(duì)所述目標(biāo)批次樣本的測(cè)序數(shù)據(jù)進(jìn)行自動(dòng)質(zhì)控判讀,獲得所述目標(biāo)批次樣本的質(zhì)控結(jié)果,包括:
13、根據(jù)質(zhì)控規(guī)則設(shè)置對(duì)應(yīng)的規(guī)則表達(dá)式中的變量名,匹配所述目標(biāo)批次樣本的測(cè)序數(shù)據(jù)與下機(jī)數(shù)據(jù)表格中的第一目標(biāo)數(shù)值;
14、根據(jù)質(zhì)控規(guī)則設(shè)置對(duì)應(yīng)的規(guī)則表達(dá)式,對(duì)所述第一目標(biāo)數(shù)據(jù)值進(jìn)行比較計(jì)算和邏輯計(jì)算,獲得所述目標(biāo)批次樣本的質(zhì)控結(jié)果。
15、在一些實(shí)施例中,響應(yīng)于第一數(shù)據(jù)分析指令,顯示對(duì)應(yīng)的第一數(shù)據(jù)分析界面之前,所述方法還包括:
16、響應(yīng)于質(zhì)控設(shè)置指令,顯示對(duì)應(yīng)的質(zhì)控設(shè)置界面;
17、檢測(cè)所述質(zhì)控設(shè)置界面上針對(duì)開啟的質(zhì)控類型的質(zhì)控參數(shù)設(shè)置指令,對(duì)各個(gè)開啟的質(zhì)控類型配置相應(yīng)的各個(gè)質(zhì)控參數(shù);
18、在各個(gè)所述質(zhì)控參數(shù)的規(guī)則配置界面中,接收所述規(guī)則配置界面導(dǎo)入的下機(jī)質(zhì)控信息表格的表頭,導(dǎo)入成功后,將表頭對(duì)應(yīng)列呈現(xiàn)在所述規(guī)則配置界面的名稱列中;
19、檢測(cè)針對(duì)所述名稱列中各個(gè)名稱的質(zhì)控開關(guān)指令,若任一名稱的質(zhì)控開關(guān)指令為開,根據(jù)輸入完成該名稱對(duì)應(yīng)的質(zhì)控規(guī)則設(shè)置。
20、在一些實(shí)施例中,根據(jù)輸入完成該名稱對(duì)應(yīng)的質(zhì)控規(guī)則設(shè)置,包括:
21、接收該名稱對(duì)應(yīng)的編輯按鍵的點(diǎn)擊指令,彈出該名稱對(duì)應(yīng)的規(guī)則定義對(duì)話框;檢測(cè)在該名稱對(duì)應(yīng)的規(guī)則定義對(duì)話框中輸入的規(guī)則表達(dá)式,以完成該名稱對(duì)應(yīng)的質(zhì)控規(guī)則設(shè)置。
22、在一些實(shí)施例中,響應(yīng)于第一數(shù)據(jù)分析指令,顯示對(duì)應(yīng)的第一數(shù)據(jù)分析界面之前,所述方法還包括:
23、響應(yīng)于數(shù)據(jù)分析配置指令,顯示對(duì)應(yīng)的數(shù)據(jù)分析配置界面;
24、檢測(cè)數(shù)據(jù)分析配置界面上針對(duì)規(guī)則配置入口的點(diǎn)擊指令,彈出數(shù)據(jù)過濾的規(guī)則定義對(duì)話框,檢測(cè)在數(shù)據(jù)過濾的規(guī)則定義對(duì)話框中輸入的規(guī)則表達(dá)式,以完成數(shù)據(jù)過濾規(guī)則設(shè)置。
25、在一些實(shí)施例中,響應(yīng)于第一數(shù)據(jù)分析指令,顯示對(duì)應(yīng)的第一數(shù)據(jù)分析界面之前,所述方法還包括:
26、響應(yīng)于項(xiàng)目配置指令,顯示對(duì)應(yīng)的項(xiàng)目配置界面;
27、根據(jù)在所述項(xiàng)目配置界面輸入的檢索因子,輸出對(duì)應(yīng)的檢測(cè)項(xiàng)目信息;
28、檢測(cè)針對(duì)所述檢測(cè)項(xiàng)目信息的編輯按鍵的點(diǎn)擊指令,彈出項(xiàng)目明細(xì)配置對(duì)話框;
29、檢測(cè)所述項(xiàng)目明細(xì)配置對(duì)話框中針對(duì)某一種目標(biāo)變異類型的生信文件的選擇指令,將該種目標(biāo)變異類型增加為該檢測(cè)項(xiàng)目需要報(bào)告的變異類型,并顯示所述目標(biāo)變異類型的報(bào)告規(guī)則設(shè)置入口;
30、檢測(cè)針對(duì)所述目標(biāo)變異類型的報(bào)告規(guī)則設(shè)置入口的點(diǎn)擊指令,彈出所述目標(biāo)變異類型的報(bào)告規(guī)則設(shè)置對(duì)話框,檢測(cè)在所述目標(biāo)變異類型的報(bào)告規(guī)則設(shè)置對(duì)話框中輸入的規(guī)則表達(dá)式,以完成報(bào)告規(guī)則設(shè)置。
31、本發(fā)明第二方面公開一種測(cè)序數(shù)據(jù)的自動(dòng)判讀分析裝置,包括:
32、第一顯示單元,用于響應(yīng)于第一數(shù)據(jù)分析指令,顯示對(duì)應(yīng)的第一數(shù)據(jù)分析界面;
33、確定單元,用于根據(jù)在所述第一數(shù)據(jù)分析界面上被選中的目標(biāo)批次樣本,確定出所述目標(biāo)批次樣本的測(cè)序數(shù)據(jù);
34、判讀單元,用于根據(jù)質(zhì)控規(guī)則設(shè)置對(duì)應(yīng)的規(guī)則表達(dá)式,對(duì)所述目標(biāo)批次樣本的測(cè)序數(shù)據(jù)進(jìn)行自動(dòng)質(zhì)控判讀,獲得所述目標(biāo)批次樣本的質(zhì)控結(jié)果;
35、跳轉(zhuǎn)單元,用于若所述質(zhì)控結(jié)果為全部通過,且檢測(cè)到針對(duì)上機(jī)批次的點(diǎn)擊指令,跳轉(zhuǎn)至第二數(shù)據(jù)分析界面;
36、第二顯示單元,用于在所述第二數(shù)據(jù)分析界面上顯示樣本列表以及目標(biāo)變異的相關(guān)信息,其中,所述目標(biāo)變異為所述樣本列表中被選中的樣本經(jīng)過數(shù)據(jù)過濾規(guī)則設(shè)置和報(bào)告規(guī)則設(shè)置的規(guī)則表達(dá)式雙層篩選后得到的變異位點(diǎn),所述相關(guān)信息至少包括所述目標(biāo)變異的唯一標(biāo)識(shí)、變異是否報(bào)告、變異的判讀結(jié)果和結(jié)果解釋;
37、提交單元,用于響應(yīng)于在所述第二數(shù)據(jù)分析界面上輸入的提交指令,將所述目標(biāo)變異的相關(guān)信息提交到結(jié)果錄入界面;
38、報(bào)告生成單元,用于在所述結(jié)果錄入界面抓取報(bào)告單所需的要素內(nèi)容,根據(jù)所述要素內(nèi)容自動(dòng)填充生成所述目標(biāo)批次樣本的報(bào)告單;其中,所述要素內(nèi)容至少包括變異基因、變異位點(diǎn)、變異頻率和變異解釋。
39、本發(fā)明第三方面公開一種電子設(shè)備,包括存儲(chǔ)有可執(zhí)行程序代碼的存儲(chǔ)器以及與所述存儲(chǔ)器耦合的處理器;所述處理器調(diào)用所述存儲(chǔ)器中存儲(chǔ)的所述可執(zhí)行程序代碼,用于執(zhí)行第一方面公開的測(cè)序數(shù)據(jù)的自動(dòng)判讀分析方法。
40、本發(fā)明第四方面公開一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序使得計(jì)算機(jī)執(zhí)行第一方面公開的測(cè)序數(shù)據(jù)的自動(dòng)判讀分析方法。
41、本發(fā)明的有益效果在于,根據(jù)質(zhì)控規(guī)則設(shè)置的規(guī)則表達(dá)式,對(duì)目標(biāo)批次樣本的測(cè)序數(shù)據(jù)進(jìn)行自動(dòng)質(zhì)控判讀,獲得質(zhì)控結(jié)果;若質(zhì)控結(jié)果為全部通過,顯示樣本列表以及樣本列表中被選中的樣本經(jīng)過數(shù)據(jù)過濾規(guī)則設(shè)置和報(bào)告規(guī)則設(shè)置的規(guī)則表達(dá)式雙層篩選后得到的目標(biāo)變異,從目標(biāo)變異的相關(guān)信息中抓取報(bào)告單所需的要素內(nèi)容,根據(jù)要素內(nèi)容自動(dòng)填充生成目標(biāo)批次樣本的報(bào)告單;其中,要素內(nèi)容至少包括變異基因、變異位點(diǎn)、變異頻率和變異解釋,從而通過自定義質(zhì)控規(guī)則設(shè)置、過濾規(guī)則設(shè)置和報(bào)告規(guī)則設(shè)置,實(shí)現(xiàn)質(zhì)量控制自動(dòng)判讀和變異自動(dòng)篩選,可以提高自動(dòng)化解讀程度,提高分析效率,進(jìn)而減少對(duì)人工判讀的依賴,降低解讀報(bào)告分析出錯(cuò)率。