一種基于知識(shí)庫(kù)的智能病歷錄入平臺(tái)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于知識(shí)庫(kù)的智能病歷錄入平臺(tái),屬于智能病歷管理技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002]目前,醫(yī)療治療中,經(jīng)常需要針對(duì)各種各樣的病歷進(jìn)行管理,一般的產(chǎn)品中,存在以下幾點(diǎn)不足:1)沒(méi)有完整專業(yè)的病歷語(yǔ)境語(yǔ)料作為錄入的依據(jù),醫(yī)生需要較多的點(diǎn)擊、選擇才能完成錄入工作;2)不能根據(jù)已經(jīng)錄入的內(nèi)容切換更精確的語(yǔ)境;3)不能將已經(jīng)錄入的內(nèi)容結(jié)合歷史數(shù)據(jù)有效地預(yù)測(cè)下文;4)沒(méi)有基于歷史病歷數(shù)據(jù)的智能輔助診斷功能。對(duì)此,需要采用合適的方式予以改進(jìn)。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的在于提供一種基于知識(shí)庫(kù)的智能病歷錄入平臺(tái),通過(guò)對(duì)醫(yī)院歷史病歷進(jìn)行信息提取,形成智能病歷錄入平臺(tái)所需的語(yǔ)料知識(shí)庫(kù),以及智能輔助診斷所需的病案知識(shí)庫(kù),在此基礎(chǔ)上,實(shí)現(xiàn)病歷快捷錄入和智能輔助診斷;智能輔助診斷功能的目的是方便醫(yī)生參考?xì)v史病歷知識(shí),迅速做出判斷,加速病歷錄入。
[0004]為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下。
[0005]—種基于知識(shí)庫(kù)的智能病歷錄入平臺(tái),采用C/S架構(gòu),并擴(kuò)展至云計(jì)算架構(gòu),通過(guò)對(duì)醫(yī)院歷史病歷進(jìn)行信息提取,形成智能病歷錄入所需的語(yǔ)料和病案知識(shí)庫(kù),其具體操作流程如下:
[0006](1)授權(quán)人員上傳電子病歷到后臺(tái)業(yè)務(wù)管理模塊;
[0007](2)后臺(tái)業(yè)務(wù)管理模塊自動(dòng)掃描并批量處理電子病歷,從電子病歷中提取出字、詞、短語(yǔ)、短句以及病案實(shí)例并入庫(kù),同時(shí)訓(xùn)練出拼音分類、語(yǔ)境識(shí)別、錄入預(yù)測(cè)和智能輔助診斷四大模型;
[0008](3)智能病歷錄入模塊自動(dòng)從服務(wù)器端下載生成好的語(yǔ)料知識(shí)庫(kù)。用戶使用智能病歷錄入客戶端錄入病歷??蛻舳送ㄟ^(guò)糾錯(cuò)算法、語(yǔ)境識(shí)別算法以及預(yù)測(cè)算法為用戶提供高準(zhǔn)確度的候選項(xiàng);對(duì)于用戶自定義的或不在全部詞庫(kù)中的詞匯,通過(guò)對(duì)本地臨時(shí)詞庫(kù)的管理,自動(dòng)與服務(wù)器端同步,作為服務(wù)器詞庫(kù)的擴(kuò)展;
[0009](4)用戶通過(guò)手動(dòng)觸發(fā)智能病歷錄入客戶端的功能鍵,將當(dāng)前錄入的信息送至智能輔助診斷模塊進(jìn)行預(yù)處理,再通過(guò)消息接口送至后臺(tái)業(yè)務(wù)管理模塊,調(diào)用智能輔助診斷機(jī)器模型,為用戶推薦可能的診斷、用藥、檢驗(yàn)檢查及處理方法信息;用戶在輔助診斷信息的基礎(chǔ)上,能夠加快病歷的錄入。
[0010]上述基于知識(shí)庫(kù)的智能病歷錄入平臺(tái)由智能病歷錄入模塊、統(tǒng)一接口模塊、后臺(tái)業(yè)務(wù)管理模塊、統(tǒng)一數(shù)據(jù)庫(kù)訪問(wèn)模塊以及知識(shí)庫(kù)五部分組成,各部分模塊功能如下:
[0011](1)智能病歷錄入模塊:本模塊實(shí)現(xiàn)一種在歷史病歷知識(shí)庫(kù)基礎(chǔ)上的智能病歷錄入功能,尤其適用于門診電子病歷的錄入;本錄入功能,基于拼音輸入法,根據(jù)用戶所在科室、專業(yè)及所錄入的文本信息,智能識(shí)別語(yǔ)境,優(yōu)先在精確的歷史病歷語(yǔ)料庫(kù)中,為用戶提供高準(zhǔn)確度的候選項(xiàng);智能病歷錄入模塊包括以下六大子模塊:用戶注冊(cè)登錄模塊、輸入輸出模塊、算法模塊、詞庫(kù)模塊、輔助診斷模塊、升級(jí)管理模塊,其中,(a)用戶注冊(cè)登錄模塊支持未注冊(cè)用戶注冊(cè)、注冊(cè)用戶登錄,用戶參數(shù)設(shè)置;(b)輸入輸出模塊用于用戶錄入和向用戶系統(tǒng)輸出病歷;對(duì)于輸入部分,根據(jù)用戶輸入的拼音,通過(guò)拼音模式匹配判斷是否需要調(diào)用糾錯(cuò)算法,如果拼寫錯(cuò)誤,則平臺(tái)會(huì)自動(dòng)糾正,給出正確的發(fā)音;接著,根據(jù)正確的錄入,平臺(tái)根據(jù)用戶的輸入語(yǔ)境優(yōu)先選擇病歷知識(shí)庫(kù)詞匯作為候選項(xiàng),再通過(guò)點(diǎn)擊空格或者觸發(fā)系統(tǒng)熱鍵,調(diào)用錄入預(yù)測(cè)算法。如果不在病歷知識(shí)庫(kù)中的字或詞,則通過(guò)錄入模塊的基礎(chǔ)碼表及詞典實(shí)現(xiàn)。對(duì)于輸出部分,用戶通過(guò)點(diǎn)擊鼠標(biāo)或者敲擊鍵盤,完成從候選項(xiàng)到用戶系統(tǒng)的文字輸出。(c)算法模塊包括三大部分算法及其對(duì)應(yīng)的三大機(jī)器學(xué)習(xí)模型,分別是用于拼寫檢查的糾錯(cuò)算法、用于切換錄入依賴的語(yǔ)料庫(kù)的語(yǔ)境識(shí)別算法、用于生成候選項(xiàng)的錄入預(yù)測(cè)算法,其中,糾錯(cuò)算法是通過(guò)獲取錄入的拼音,調(diào)用基礎(chǔ)拼音校驗(yàn)算法識(shí)別諸如平/卷舌,f/h基礎(chǔ)錯(cuò)誤,接著調(diào)用拼音機(jī)器分類模型,優(yōu)先在歷史病歷語(yǔ)料庫(kù)中篩選最相似的拼音及對(duì)應(yīng)的字、詞或者短語(yǔ);如果可能存在錄入錯(cuò)誤,平臺(tái)提供的候選項(xiàng)由一個(gè)糾錯(cuò)后的詞匯加若干可匹配詞匯構(gòu)成;語(yǔ)境識(shí)別算法是通過(guò)用戶錄入的最近四個(gè)詞匯,根據(jù)這四個(gè)詞匯的詞性以及構(gòu)詞類型,實(shí)時(shí)調(diào)用語(yǔ)境識(shí)別模型,將候選項(xiàng)的選擇范圍逐步縮小到平臺(tái)定義的最小類別-病歷塊;當(dāng)用戶錄入完句號(hào)或者回車符后,語(yǔ)境識(shí)別算法將當(dāng)前語(yǔ)境重新初始化;錄入預(yù)測(cè)算法,是通過(guò)記錄用戶最近錄入的四個(gè)詞匯,及其詞性和構(gòu)詞類型,實(shí)時(shí)調(diào)用錄入預(yù)測(cè)模型生成最優(yōu)的候選項(xiàng)集,并根據(jù)上文內(nèi)容推薦最優(yōu)的下文,如:醫(yī)學(xué)單位、短語(yǔ)或短句。(d)詞庫(kù)模塊包括輸入法依賴的基礎(chǔ)碼表、詞匯表、專業(yè)詞匯表,以及用戶的臨時(shí)詞庫(kù)。當(dāng)用戶錄入拼音后,平臺(tái)會(huì)優(yōu)先調(diào)用錄入預(yù)測(cè)算法,此時(shí),候選項(xiàng)由歷史病歷詞匯和基礎(chǔ)詞匯共同構(gòu)成。當(dāng)用戶錄入的拼音,得不到或者得到空的錄入預(yù)測(cè)算法的返回結(jié)果,此時(shí),候選項(xiàng)僅由基礎(chǔ)詞庫(kù)的詞匯構(gòu)成。(e)輔助診斷模塊主要是將當(dāng)前錄入環(huán)境中用戶已經(jīng)錄入的詞匯及其構(gòu)詞類型進(jìn)行封裝通過(guò)統(tǒng)一接口模塊發(fā)送至后臺(tái)管理模塊,并將后臺(tái)返回的結(jié)果在錄入客戶端上顯示。(f)升級(jí)管理模塊負(fù)責(zé)定時(shí)向統(tǒng)一接口模塊發(fā)送軟件升級(jí)、詞庫(kù)升級(jí)查詢指令,并將返回的信息進(jìn)行展示。
[0012](2)統(tǒng)一接口模塊:本模塊實(shí)現(xiàn)智能病歷錄入客戶端同服務(wù)器端的統(tǒng)一通信適配、收發(fā)及調(diào)度功能。包括以下三大子模塊:消息適配器、消息發(fā)送和管理模塊以及調(diào)度中心:(a)消息適配器:消息模板管理,通過(guò)命令字適配并實(shí)例化各類消息。(b)消息發(fā)送和管理模塊:管理、封裝和轉(zhuǎn)發(fā)消息。(c)調(diào)度中心:實(shí)現(xiàn)消息同步或者異步調(diào)用。
[0013](3)后臺(tái)業(yè)務(wù)管理模塊:本模塊實(shí)現(xiàn)智能病歷錄入平臺(tái)的服務(wù)器端。統(tǒng)一管理用戶,提取歷史病歷信息以及計(jì)算病歷知識(shí)相關(guān)性以輔助診斷。本模塊包括四個(gè)子模塊:用戶管理、升級(jí)及同步管理、智能輔助診斷、病歷管理及信息提取。(a)用戶管理:用戶基本信息管理,權(quán)限管理。(b)升級(jí)及同步管理:對(duì)應(yīng)客戶端的升級(jí)管理模塊,實(shí)現(xiàn)升級(jí)業(yè)務(wù)邏輯的判斷。(c)智能輔助診斷:本模塊對(duì)應(yīng)客戶端的輔助診斷模塊,包括智能輔助診斷模型,通過(guò)對(duì)客戶端輸入的患者癥狀信息,匹配病案庫(kù)中的相關(guān)案例,計(jì)算各個(gè)特征的相關(guān)性,給用戶在診斷、用藥、檢查檢驗(yàn)以及處理方法方面的提示信息。(d)病歷管理及信息提取:本模塊集中處理歷史病歷文本,并將上傳的病歷進(jìn)行信息抽取入語(yǔ)料庫(kù)及病案數(shù)據(jù)庫(kù)。信息抽取流程為:
[0014](01)用戶指定若干份病歷作為機(jī)器學(xué)習(xí)的訓(xùn)練集,平臺(tái)依據(jù)基礎(chǔ)數(shù)據(jù)庫(kù),采用高精度反向最大匹配算法自動(dòng)標(biāo)注語(yǔ)料庫(kù),并提供交互式界面進(jìn)行人工核對(duì)。
[0015](02)人工校驗(yàn)修改完畢后,采用基于監(jiān)督的機(jī)器學(xué)習(xí)算法對(duì)剩余病歷進(jìn)行信息標(biāo)注,再結(jié)合句法規(guī)則庫(kù)提取病歷信息。
[0016](03)接著將所提取的語(yǔ)料庫(kù)按照科室、病歷塊來(lái)計(jì)算詞頻,形成轉(zhuǎn)移矩陣,生成拼音分類、語(yǔ)境識(shí)別、錄入預(yù)測(cè)三個(gè)模型;所提取的病人事實(shí)數(shù)據(jù)被入庫(kù)為智能輔助診斷提供數(shù)據(jù)源,生成智能輔助診斷模型;拼音分類、語(yǔ)境識(shí)別、錄入預(yù)測(cè)和智能輔助診斷四大模型的基本功能為:拼音分類模型,該模型以歷史病歷提取的字和詞,加上基礎(chǔ)詞匯為樣本,用拼音為特征進(jìn)行分類,每個(gè)拼音類別中將字、詞匯按詞頻由高到低排序,通過(guò)短文本相似度計(jì)算算法以及機(jī)器學(xué)習(xí)中基于監(jiān)督的分類模型進(jìn)行建模;根據(jù)輸入的拼音,輸出最優(yōu)的候選字或者詞;語(yǔ)境識(shí)別模型,該模型以歷史病歷提取的詞及其詞性和構(gòu)成類型為基礎(chǔ),通過(guò)非監(jiān)督的機(jī)器學(xué)習(xí)算法,自動(dòng)從病歷中提取出科室與高頻詞匯的概率模型,科室病歷塊與高頻詞匯的概率模型;從而實(shí)現(xiàn)根