一種針對(duì)icd起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法
【專利摘要】本發(fā)明公開一種針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,包括以下步驟:1)從ICD起搏器中導(dǎo)出PDF格式的報(bào)告文件;2)根據(jù)報(bào)告文件設(shè)置CRT參數(shù)抽取規(guī)則庫(kù);3)讀取文件內(nèi)容;4)掃描報(bào)告文件,并提取文本內(nèi)容;5)調(diào)用CRT參數(shù)抽取規(guī)則庫(kù),編程抽取符合抽取規(guī)則的數(shù)據(jù);6)將數(shù)據(jù)寫入數(shù)據(jù)庫(kù);該針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法能節(jié)省人力資源。
【專利說明】
一種針對(duì)I CD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及一種針對(duì)I⑶起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法。
【背景技術(shù)】
[0002]充血性心力衰竭是有較高死亡率的嚴(yán)重疾患,每年有成千上萬的患者死于心力衰竭。在過去的10余年中,在患者體內(nèi)植入CRT設(shè)備已經(jīng)成為治療該級(jí)別最顯著的非藥物治療方法。
[0003]患者植入CRT設(shè)備后,需要定期回醫(yī)院進(jìn)行隨訪,以便心血管??漆t(yī)生對(duì)CRT近期的工作進(jìn)行評(píng)價(jià),并結(jié)合CRT的診斷功能,優(yōu)化設(shè)備參數(shù)、調(diào)整治療方案。CRT設(shè)備植入患者回醫(yī)院進(jìn)行隨訪時(shí),心血管專科醫(yī)生工作流程如下一一通過CRT廠家提供的程控儀,讀取患者體內(nèi)的CRT程控?cái)?shù)據(jù)從CRT程儀器中的患者數(shù)據(jù)導(dǎo)出為PDF格式的隨訪報(bào)告,人工查閱報(bào)告中的各項(xiàng)參數(shù)指標(biāo),做出醫(yī)學(xué)判斷。將本次導(dǎo)出的報(bào)告進(jìn)行存檔,以便患者下次隨訪時(shí)進(jìn)行對(duì)比。
[0004]目前國(guó)內(nèi)外CRT廠家僅允許將程控?cái)?shù)據(jù)導(dǎo)出為TOF文件,不允許導(dǎo)出為excel、csv、xml等文件格式。由于PDF文件是典型的非結(jié)構(gòu)化數(shù)據(jù)格式,國(guó)內(nèi)臨床科研工作者進(jìn)行心血管領(lǐng)域的大數(shù)據(jù)研究時(shí),只能通過人工抄錄的方式從上述TOF文件中提取各項(xiàng)參數(shù)指標(biāo)。由于患者數(shù)量多、程控參數(shù)復(fù)雜,人工抄錄勞動(dòng)強(qiáng)度大。
【發(fā)明內(nèi)容】
[0005]本發(fā)明要解決的技術(shù)問題是提供一種能節(jié)省人力資源的針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法。
[0006]為解決上述問題,本發(fā)明采用如下技術(shù)方案:
一種針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,包括以下步驟:
1)從I⑶起搏器中導(dǎo)出I3DF格式的報(bào)告文件;
2)根據(jù)報(bào)告文件設(shè)置CRT參數(shù)抽取規(guī)則庫(kù);
3)讀取文件內(nèi)容;
4)掃描報(bào)告文件,并提取文本內(nèi)容;
5)調(diào)用CRT參數(shù)抽取規(guī)則庫(kù),編程抽取符合抽取規(guī)則的數(shù)據(jù);
6)將數(shù)據(jù)寫入數(shù)據(jù)庫(kù)。
[0007]作為優(yōu)選,所述CRT參數(shù)抽取規(guī)則庫(kù)的每條規(guī)則均對(duì)應(yīng)著報(bào)告文件中的一個(gè)指標(biāo)或參數(shù)。
[0008]作為優(yōu)選,所述步驟3)的具體實(shí)現(xiàn)方式為:
3.1)采用JAVA程序打開報(bào)告文件;
3.2)編程讀取報(bào)告文件。
[0009]作為優(yōu)選,所述步驟4)的具體實(shí)現(xiàn)方式為:
4.1)逐行掃描報(bào)告文件的內(nèi)容; 4.2)將每行的內(nèi)容提取出來。
[0010]作為優(yōu)選,所述步驟5)的具體實(shí)現(xiàn)方式為:
5.1)使用JAVA程序調(diào)用CRT參數(shù)抽取規(guī)則庫(kù);
5.2)在CRT參數(shù)抽取規(guī)則庫(kù)找到每行內(nèi)容的抽取規(guī)則;
5.3)根據(jù)抽取規(guī)則將報(bào)告文件中整行匹配的數(shù)據(jù)抽取出來;
作為優(yōu)選,所述步驟6 )的具體實(shí)現(xiàn)方式為:
6.6)編程將抽取出來的數(shù)據(jù)進(jìn)行匯總;
6.6)將匯總后的數(shù)據(jù)寫入數(shù)據(jù)庫(kù)。
[0011]作為優(yōu)選,所述數(shù)據(jù)庫(kù)為SQL數(shù)據(jù)庫(kù),功能強(qiáng)大、簡(jiǎn)單易學(xué)、使用方便。
[0012]作為優(yōu)選,所述編程均為JAVA編程,具有簡(jiǎn)單性、面向?qū)ο蟆⒎植际?、健壯性、安全性、平臺(tái)獨(dú)立與可移植性、多線程、動(dòng)態(tài)性等特點(diǎn),功能強(qiáng)大和簡(jiǎn)單易用。
[0013]本發(fā)明的有益效果為:采用計(jì)算機(jī)編程讀取PDF格式的CRT程控文件中的文本內(nèi)容,將文本內(nèi)容抽取出來并保存到數(shù)據(jù)庫(kù),并可導(dǎo)出成Excel和cvs等數(shù)據(jù)格式進(jìn)行統(tǒng)計(jì)分析,數(shù)據(jù)抽取效率和數(shù)據(jù)抽取準(zhǔn)確率高,徹底解決了人工抄錄模式難以管控質(zhì)量的難題,能節(jié)省人力資源,方便醫(yī)務(wù)人員工作,以便心血管??漆t(yī)生對(duì)CRT近期的工作進(jìn)行評(píng)價(jià),以便患者下次隨訪時(shí)進(jìn)行對(duì)比。
【附圖說明】
[0014]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0015]圖1為實(shí)施例2中的步驟5)的數(shù)據(jù)抽取流程圖。
【具體實(shí)施方式】
[0016]實(shí)施例1
一種針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,包括以下步驟:
1)從I⑶起搏器中導(dǎo)出I3DF格式的報(bào)告文件;
2)根據(jù)報(bào)告文件設(shè)置CRT參數(shù)抽取規(guī)則庫(kù);
3)讀取文件內(nèi)容;
4)掃描報(bào)告文件,并提取文本內(nèi)容;
5)調(diào)用CRT參數(shù)抽取規(guī)則庫(kù),編程抽取符合抽取規(guī)則的數(shù)據(jù),如圖1所示;
6)將數(shù)據(jù)寫入數(shù)據(jù)庫(kù)。
[0017]本實(shí)施例的有益效果為:采用計(jì)算機(jī)編程讀取TOF格式的CRT程控文件中的文本內(nèi)容,將文本內(nèi)容抽取出來并保存到數(shù)據(jù)庫(kù),并可導(dǎo)出成Excel和cvs等數(shù)據(jù)格式進(jìn)行統(tǒng)計(jì)分析,數(shù)據(jù)抽取效率和數(shù)據(jù)抽取準(zhǔn)確率高,徹底解決了人工抄錄模式難以管控質(zhì)量的難題,能節(jié)省人力資源,方便醫(yī)務(wù)人員工作,以便心血管專科醫(yī)生對(duì)CRT近期的工作進(jìn)行評(píng)價(jià),以便患者下次隨訪時(shí)進(jìn)行對(duì)比。
[0018]實(shí)施例2 一種針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,包括以下步驟:
1)從I⑶起搏器中導(dǎo)出I3DF格式的報(bào)告文件;
2)根據(jù)報(bào)告文件設(shè)置CRT參數(shù)抽取規(guī)則庫(kù);
3)采用JAVA編程打開報(bào)告文件,JAVA編程讀取報(bào)告文件;
4)逐行掃描報(bào)告文件的內(nèi)容,將每行的內(nèi)容提取出來;
5)使用JAVA編程調(diào)用CRT參數(shù)抽取規(guī)則庫(kù),在CRT參數(shù)抽取規(guī)則庫(kù)中找到每行內(nèi)容的抽取規(guī)則;根據(jù)抽取規(guī)則將報(bào)告文件中整行匹配的數(shù)據(jù)抽取出來,如圖1所示;
6)使用JAVA編程將抽取出來的數(shù)據(jù)進(jìn)行匯總;將匯總后的數(shù)據(jù)寫入SQL數(shù)據(jù)庫(kù)。
[0019]所述CRT參數(shù)抽取規(guī)則庫(kù)的每條規(guī)則均對(duì)應(yīng)著報(bào)告文件中的一個(gè)指標(biāo)或參數(shù),如設(shè)置了規(guī)則“體重=$ {體重} (kg)”后,當(dāng)輸入文本為“王強(qiáng),體重=89 (kg)”時(shí),JAVA程序則通過規(guī)則抽取數(shù)字“89”,并返回一下結(jié)果“體重=89”。
[0020]本實(shí)施例的有益效果為:采用JAVA編程讀取PDF格式的CRT程控文件中的文本內(nèi)容,將文本內(nèi)容抽取出來并保存到SQL數(shù)據(jù)庫(kù),并可導(dǎo)出成Excel和cvs等數(shù)據(jù)格式進(jìn)行統(tǒng)計(jì)分析,數(shù)據(jù)抽取效率和數(shù)據(jù)抽取準(zhǔn)確率高,徹底解決了人工抄錄模式難以管控質(zhì)量的難題,能節(jié)省人力資源,方便醫(yī)務(wù)人員工作,以便心血管??漆t(yī)生對(duì)CRT近期的工作進(jìn)行評(píng)價(jià),以便患者下次隨訪時(shí)進(jìn)行對(duì)比。
[0021]以上所述,僅為本發(fā)明的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何不經(jīng)過創(chuàng)造性勞動(dòng)想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:包括以下步驟:。2.1)從I⑶起搏器中導(dǎo)出PDF格式的報(bào)告文件; 2)根據(jù)報(bào)告文件設(shè)置CRT參數(shù)抽取規(guī)則庫(kù); 3)讀取文件內(nèi)容; 4)掃描報(bào)告文件,并提取文本內(nèi)容; 5)調(diào)用CRT參數(shù)抽取規(guī)則庫(kù),編程抽取符合抽取規(guī)則的數(shù)據(jù); 6)將數(shù)據(jù)寫入數(shù)據(jù)庫(kù)。3.根據(jù)權(quán)利要求1所述的針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述CRT參數(shù)抽取規(guī)則庫(kù)的每條規(guī)則均對(duì)應(yīng)著報(bào)告文件中的一個(gè)指標(biāo)或參數(shù)。4.根據(jù)權(quán)利要求2所述的針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟3)的具體實(shí)現(xiàn)方式為: 3.1)編程打開報(bào)告文件; 3.2)讀取報(bào)告文件。5.根據(jù)權(quán)利要求3所述的針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟4)的具體實(shí)現(xiàn)方式為: 4.1)逐行掃描報(bào)告文件的內(nèi)容; 4.2)將每行的內(nèi)容提取出來。6.根據(jù)權(quán)利要求4所述的針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟5)的具體實(shí)現(xiàn)方式為: 5.1)使用JAVA程序調(diào)用CRT參數(shù)抽取規(guī)則庫(kù); 5.2)在CRT參數(shù)抽取規(guī)則庫(kù)找到每行內(nèi)容的抽取規(guī)則; 5.3)根據(jù)抽取規(guī)則將報(bào)告文件中整行匹配的數(shù)據(jù)抽取出來; 根據(jù)權(quán)利要求5所述的針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟6)的具體實(shí)現(xiàn)方式為: 6.6)編程將抽取出來的數(shù)據(jù)進(jìn)行匯總; 6.6)將匯總后的數(shù)據(jù)寫入數(shù)據(jù)庫(kù)。7.根據(jù)權(quán)利要求6所述的針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述數(shù)據(jù)庫(kù)為SQL數(shù)據(jù)庫(kù)。8.根據(jù)權(quán)利要求7所述的針對(duì)ICD起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述編程均為JAVA編程。
【文檔編號(hào)】G06F17/30GK105912883SQ201610494115
【公開日】2016年8月31日
【申請(qǐng)日】2016年6月30日
【發(fā)明人】陳樣新, 毛涌泉, 羅超
【申請(qǐng)人】廣州市皓軒軟件科技有限公司