本發(fā)明涉及一種建模方法,尤其是一種評(píng)估慢性病費(fèi)用的建模方法。
背景技術(shù):
風(fēng)險(xiǎn)評(píng)估建模方法作為慢性病健康管理風(fēng)險(xiǎn)評(píng)估的技術(shù)手段應(yīng)受到重視;健康管理的概念首先在美國(guó)提出,經(jīng)過(guò)二十多年的發(fā)展目前已成為一個(gè)新興產(chǎn)業(yè)和逐步興起的學(xué)科。健康管理是對(duì)個(gè)人和人群的各種健康危險(xiǎn)和健康保護(hù)因素進(jìn)行全面管理的過(guò)程,調(diào)動(dòng)個(gè)人、集體、社會(huì)的積極性,有效地利用有限的物力資源,控制疾病促進(jìn)健康,達(dá)到最大的健康效果。健康管理能夠幫助居民識(shí)別、控制健康危險(xiǎn)因素,實(shí)施個(gè)體化健康教育并指導(dǎo)醫(yī)療需求和醫(yī)療服務(wù),實(shí)現(xiàn)全程健康信息管理。健康風(fēng)險(xiǎn)評(píng)估作為健康管理的核心環(huán)節(jié),是對(duì)個(gè)人的健康狀況及未來(lái)患病和(或)死亡危險(xiǎn)性的量化評(píng)估,應(yīng)受到極大的重視。風(fēng)險(xiǎn)評(píng)估建模方法是實(shí)現(xiàn)健康風(fēng)險(xiǎn)評(píng)估的技術(shù)手段,合理應(yīng)用風(fēng)險(xiǎn)評(píng)估方法建立適宜的模型是慢性病預(yù)防控制的發(fā)展趨勢(shì)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,在此提供一種評(píng)估慢性病費(fèi)用的建模方法;該方法首先通過(guò)樣本篩選和特征選擇,再采用回歸模型,得到各影響因子對(duì)慢性病費(fèi)用的影響。與現(xiàn)有方法相比,該建模方法具有以下幾個(gè)優(yōu)點(diǎn):(1)在費(fèi)用回歸之前,通過(guò)樣本篩選和特征選擇,提高了模型的準(zhǔn)確度;(2)采用先驗(yàn)知識(shí)和數(shù)據(jù)挖掘技術(shù)相結(jié)合的半?yún)⒒鸩交貧w方法,提高了模型的效率;(3)可以直接量化出慢病的并發(fā)癥合并癥對(duì)其治療費(fèi)用的影響程度,為慢性病的醫(yī)療控費(fèi)提供依據(jù)。
本發(fā)明是這樣實(shí)現(xiàn)的,構(gòu)造一種評(píng)估慢性病費(fèi)用的建模方法,其特征在于,包括如下步驟:
(1)樣本篩選方法:首先設(shè)計(jì)策略,在全量樣本中確定出某種慢性疾病,再剔除該慢性疾病下的異常樣本;
(2)特征選擇方法:首先通過(guò)尋找頻繁項(xiàng)集的方法找到常見的并發(fā)癥合并癥,再納入對(duì)費(fèi)用可能產(chǎn)生影響的其他因素,結(jié)合半?yún)⒐烙?jì)的方法完成對(duì)特征的評(píng)估;
(3)使用(1)中篩選的樣本和(2)中選擇的特征,通過(guò)回歸方法擬合出費(fèi)用預(yù)測(cè)模型,得到合并癥并發(fā)癥對(duì)慢性病費(fèi)用的影響程度。
根據(jù)本發(fā)明所述的評(píng)估慢性病費(fèi)用的建模方法,其特征在于:樣本篩選包括慢性疾病選取和剔除異常樣本兩個(gè)步驟,所述的慢性疾病選取包括以下子步驟:
S101:根據(jù)患者就診記錄,按ICD_10亞目編碼,統(tǒng)計(jì)出患病人數(shù)最多的前n種疾??;
S102: 結(jié)合專家意見,從S101所述的前n種疾病中篩選出具有代表性的m種慢性疾?。?/p>
所述的剔除異常樣本包括以下子步驟:
S104:根據(jù)衛(wèi)生機(jī)構(gòu)類別,剔除掉療養(yǎng)院、醫(yī)養(yǎng)結(jié)合醫(yī)院的樣本;
S105:根據(jù)患者就診記錄,剔除住院總費(fèi)用為0的樣本;
S106:根據(jù)患者就診記錄中的“離院方式”,只保留“離院方式”為醫(yī)囑離院或者醫(yī)囑轉(zhuǎn)鄉(xiāng)鎮(zhèn)/社區(qū)衛(wèi)生院的樣本,剔除沒有完成完整治療路徑的樣本。
根據(jù)本發(fā)明所述的評(píng)估慢性病費(fèi)用的建模方法,其特征在于:所述的特征選擇方法包括選擇常見的合并癥并發(fā)癥、選擇影響費(fèi)用的其他因素、特征評(píng)價(jià)三個(gè)步驟,所述的選擇常見的合并癥并發(fā)癥包括以下子步驟:
S201:結(jié)合臨床醫(yī)生意見得到慢性病對(duì)應(yīng)的合并癥并發(fā)癥疾病列表,匯總患者在“其他診斷”中出現(xiàn)相應(yīng)的并發(fā)癥合并癥,通過(guò)數(shù)據(jù)挖掘FP-tree算法挖掘主診斷和并發(fā)癥合并癥頻繁一起出現(xiàn)的2項(xiàng)集;
S202:并發(fā)癥合并癥是否常見由二八法則決定,將輸出的頻繁項(xiàng)集按支持度從大到小排序,取能覆蓋80%樣本的前n個(gè)頻繁項(xiàng);
所述的選擇影響費(fèi)用的其他因素包括:
S203:從就診記錄中抽取出所有可能對(duì)費(fèi)用產(chǎn)生影響的因素,包括:年齡、性別、支付方式、是否手術(shù)、手術(shù)等級(jí)、出入院病情、住院期間病情、住院天數(shù)、醫(yī)療機(jī)構(gòu)隸屬關(guān)系、醫(yī)院等別等次、醫(yī)療機(jī)構(gòu)所在地區(qū);
所述的特征評(píng)價(jià)包括以下子步驟:
S204:通過(guò)專家評(píng)審,挑選影響費(fèi)用的因素,作為回歸模型的特征;
S205:在專家未納入考慮的特征中,通過(guò)逐步回歸的方法完成對(duì)特征評(píng)估。
本發(fā)明的優(yōu)點(diǎn)在于:本方法首先通過(guò)樣本篩選和特征選擇,再采用回歸模型,得到各影響因子對(duì)慢性病費(fèi)用的影響。與現(xiàn)有方法相比,該建模方法具有以下幾個(gè)優(yōu)點(diǎn):
(1)在費(fèi)用回歸之前,通過(guò)樣本篩選和特征選擇,提高了模型的準(zhǔn)確度;
(2)采用先驗(yàn)知識(shí)和數(shù)據(jù)挖掘技術(shù)相結(jié)合的半?yún)⒒鸩交貧w方法,提高了模型的效率;
(3)可以直接量化出慢病的并發(fā)癥合并癥對(duì)其治療費(fèi)用的影響程度,為慢性病的醫(yī)療控費(fèi)提供依據(jù)。
附圖說(shuō)明
圖1本發(fā)明的基本思想流程圖
圖2費(fèi)用影響因素示意圖
圖3費(fèi)用預(yù)測(cè)流程示意圖
圖4預(yù)測(cè)值和原始值的擬合曲線
圖5各點(diǎn)曲率值
圖6 高血壓不同級(jí)別醫(yī)院就診人次分布圖
圖7 高血壓患者的并發(fā)癥個(gè)數(shù)分布圖
圖8 并發(fā)癥與數(shù)量關(guān)系圖
圖9總費(fèi)用分布圖。
具體實(shí)施方式
下面將結(jié)合附圖對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明在此公開了一種評(píng)估慢性病費(fèi)用的建模方法;該方法首先通過(guò)樣本篩選和特征選擇,再采用回歸模型,得到各影響因子對(duì)慢性病費(fèi)用的影響。與現(xiàn)有方法相比,該建模方法具有以下幾個(gè)優(yōu)點(diǎn):(1)在費(fèi)用回歸之前,通過(guò)樣本篩選和特征選擇,提高了模型的準(zhǔn)確度;(2)采用先驗(yàn)知識(shí)和數(shù)據(jù)挖掘技術(shù)相結(jié)合的半?yún)⒒鸩交貧w方法,提高了模型的效率;(3)可以直接量化出慢病的并發(fā)癥合并癥對(duì)其治療費(fèi)用的影響程度,為慢性病的醫(yī)療控費(fèi)提供依據(jù)。
下面對(duì)本發(fā)明所述評(píng)估某種慢性病費(fèi)用的建模方法進(jìn)行詳細(xì)說(shuō)明:
如圖1所示,首先通過(guò)樣本篩選和特征選擇,再采用回歸模型,得到各影響因子對(duì)慢性病費(fèi)用的影響。以原發(fā)性高血壓為例詳細(xì)說(shuō)明具體實(shí)施步驟:
(1)樣本篩選:在病案首頁(yè)中進(jìn)行樣本篩選,統(tǒng)計(jì)出患病最多的前二十種疾病,選擇患病人數(shù)較多且具代表性的慢性疾?。涸l(fā)性高血壓為分析對(duì)象,共計(jì)130429例樣本。依次剔除衛(wèi)生機(jī)構(gòu)類別編號(hào)為“A6”的療養(yǎng)院或醫(yī)養(yǎng)結(jié)合醫(yī)療機(jī)構(gòu)的樣本、剔除住院總費(fèi)用為0的樣本、離院方式不為“醫(yī)囑離院”或“醫(yī)囑轉(zhuǎn)鄉(xiāng)鎮(zhèn)社區(qū)衛(wèi)生院”的樣本。
(2)特征選擇:由臨床專家提供原發(fā)性高血壓對(duì)應(yīng)的合并癥并發(fā)癥疾病列表,其中19%患者沒有出現(xiàn)并發(fā)癥/合并癥,81%患者都出現(xiàn)了并發(fā)癥/合并癥。在有并發(fā)癥/合并癥的患者中,將主診斷與并發(fā)癥合并癥作為輸入,通過(guò)FP-tree算法,輸出與原發(fā)性高血壓頻繁出現(xiàn)的2項(xiàng)集,并按照支持度從大到小排序。
排序名次為自變量,支持度為因變量,進(jìn)行多項(xiàng)式擬合。原則上,多項(xiàng)式次數(shù)越高,擬合出的結(jié)果也更準(zhǔn)確。最終得到20次多項(xiàng)式,擬合正確率達(dá)到99.55%。擬合的曲線如下圖4所示。并計(jì)算多項(xiàng)式Y(jié)上各點(diǎn)一階導(dǎo)數(shù),帶入曲率公式,得到曲線Y上各點(diǎn)的曲率。各點(diǎn)曲率如下圖5所示,可看到在第27個(gè)點(diǎn)時(shí),曲率發(fā)生了突變,此坐標(biāo)對(duì)應(yīng)的2項(xiàng)集即該疾病是否為常見并發(fā)癥的分界點(diǎn),所有大于該支持度的2項(xiàng)集都可視為出現(xiàn)次數(shù)頻繁的并發(fā)癥合并癥。因此將這些疾病歸為常見并發(fā)癥合并癥,作為多維特征納入到費(fèi)用預(yù)測(cè)模型中。
如圖3所示,綜合考慮患者并發(fā)癥合并癥、個(gè)體特征、病情、醫(yī)療機(jī)構(gòu)特征,選擇可能影響費(fèi)用的其他因子:1)年齡。參照世界衛(wèi)生組織( WHO)和我國(guó)對(duì)年齡的劃分,年齡按照0至6歲、7至17歲、18至40歲、41至65歲、66歲至72歲、73歲至84歲、85歲以后劃分;2)性別;3)支付方式;4)手術(shù)級(jí)別:分為無(wú)手術(shù)、技術(shù)難度較低、技術(shù)難度一般、技術(shù)難度較大、技術(shù)難度大;5)病情:由入院病情和住院期間是否出現(xiàn)病危和病重共同決定,入院或住院期間出現(xiàn)病危急都屬于病情嚴(yán)重,否則病情一般;6)住院天數(shù);7)醫(yī)療機(jī)構(gòu)隸屬關(guān)系:中央屬、省屬、省轄市屬、縣級(jí)市屬、縣屬、街道屬、鎮(zhèn)屬、鄉(xiāng)屬;8)醫(yī)院級(jí)別等次;9)醫(yī)院所在行政區(qū);10)27種常見的并發(fā)癥、合并癥;11)常見并發(fā)癥數(shù)量;12)不常見的并發(fā)癥數(shù)量:不常見并發(fā)癥數(shù)量統(tǒng)計(jì)時(shí),不包括ICD編碼以R、V、Y、Z開頭,因?yàn)檫@些編碼疾病只是對(duì)疾病的補(bǔ)充說(shuō)明,并不會(huì)對(duì)費(fèi)用產(chǎn)生影響;
結(jié)合先驗(yàn)知識(shí),對(duì)費(fèi)用產(chǎn)生影響的住院天數(shù)、是否手術(shù)、手術(shù)級(jí)別、年齡這幾維特征放入到模型,其他特征則通過(guò)逐步回歸的方法進(jìn)行篩選。
(3)回歸分析:最終篩選出的特征為:1)年齡段;2)病情;3)住院天數(shù);4)手術(shù)級(jí)別;5)26種并發(fā)癥/合并癥;6)常見并發(fā)癥數(shù)量;7)不常見的并發(fā)癥數(shù)量,將這些特征作為自變量,總費(fèi)用作為因變量,通過(guò)線性回歸,最終得到模型的擬合優(yōu)度為65.27%。根據(jù)擬合出的結(jié)果,可以得到各個(gè)特征對(duì)原發(fā)性高血壓費(fèi)用的影響程度。其中部分顯著性影響因子及其系數(shù)如表1所示。
表1:影響原發(fā)性高血壓的部分因子及其系數(shù)
下面結(jié)合合并癥/并發(fā)癥對(duì)慢性病費(fèi)用的影響進(jìn)行說(shuō)明:
1.1數(shù)據(jù)預(yù)處理:
1.1.1數(shù)據(jù)清洗:由于病案首頁(yè)來(lái)自于醫(yī)院HIS系統(tǒng),不同醫(yī)院疾病編碼填寫并不完全一致,例如,對(duì)于疾病編碼J47.x01,實(shí)際填寫中可能出現(xiàn)J47.X01,J47xx01,J47 01,因此先對(duì)數(shù)據(jù)進(jìn)行清洗,提高原始數(shù)據(jù)的完整性和一致性。由于疾病編碼icd-10前4位有具體的國(guó)際標(biāo)準(zhǔn),后兩位不同地方和不同醫(yī)院使用差異性較大,我們不考慮使用,我們主要考慮到前4位亞目錄。
1.2樣本篩選:
1.2.1疾病選?。和ㄟ^(guò)對(duì)住院病案首頁(yè)分析,找出患病最多的前二十種疾病,篩選患病人數(shù)較多且具代表性的慢性疾病完成分析,如:原發(fā)性高血壓和2型糖尿病,取ICD前四位即I10.x和E11.9。
1.2.2樣本細(xì)分:在所有主診斷為原發(fā)性高血壓的患者中,統(tǒng)計(jì)不同級(jí)別醫(yī)院的總診療人次、平均住院費(fèi)用、治愈率,如下表所示。從表中發(fā)現(xiàn),不同級(jí)別醫(yī)院的住院費(fèi)用相差很大,例如:三級(jí)甲等醫(yī)院平均住院費(fèi)用最高,為9248.01元,而醫(yī)院級(jí)別和等次為空的平均住院費(fèi)用最低,為1669.22元,兩者相差7579元。
從表中發(fā)現(xiàn),由于不同級(jí)別的醫(yī)院,收費(fèi)標(biāo)準(zhǔn)不一致,不同級(jí)別醫(yī)院的住院費(fèi)用相差很大,例如:三級(jí)甲等醫(yī)院平均住院費(fèi)用最高,為9248.01元,而未評(píng)級(jí)醫(yī)院平均住院費(fèi)用最低,為1669.22元,兩者相差7579元。為了排除醫(yī)院級(jí)別對(duì)費(fèi)用的影響,更加準(zhǔn)確地得到并發(fā)癥/合并癥對(duì)費(fèi)用的關(guān)系,因此,必須根據(jù)醫(yī)院等級(jí)來(lái)對(duì)樣本細(xì)分。
根據(jù)醫(yī)院級(jí)別細(xì)分主診斷為原發(fā)性高血壓的樣本,具體就診人次分布圖如下圖6所示。選取原發(fā)性高血壓樣本數(shù)量最多的二級(jí)甲等醫(yī)院樣本作為研究對(duì)象進(jìn)行探索性研究。
同時(shí),在表中看到,疾病治療過(guò)程和效果也對(duì)費(fèi)用存在顯著性影響。在病案首頁(yè)中沒有可以直接反映疾病治療效果的信息,但“離院方式”一定程度上反映了患者的治療路徑是否完整,病情是否得到控制。因此,按照離院方式對(duì)樣本做進(jìn)一步細(xì)分,選取離院方式為醫(yī)囑離院或者醫(yī)囑轉(zhuǎn)鄉(xiāng)鎮(zhèn)/社區(qū)衛(wèi)生院,這部分?jǐn)?shù)據(jù)表示疾病治療已經(jīng)達(dá)到醫(yī)生認(rèn)可的治療效果。
1.3特征選?。?/p>
1.3.1常見并發(fā)癥/合并癥:由于每種疾病下面可能產(chǎn)生很多并發(fā)癥/合并癥,例如原發(fā)性高血壓患者共有9077種并發(fā)癥/合并癥,但每種并發(fā)癥/合并癥出現(xiàn)頻率有高有低,也不是全都對(duì)費(fèi)用有顯著影響。因此通過(guò)該步驟,篩選出發(fā)生頻次較高的并發(fā)癥/合并癥作為模型特征,重點(diǎn)分析這些并發(fā)癥/合并癥對(duì)費(fèi)用的影響。
1.3.2影響費(fèi)用的其他因子:在病案記錄中發(fā)現(xiàn),即使同一級(jí)別同一疾病下的相同并發(fā)癥/合并癥,費(fèi)用也大相徑庭,其實(shí)除了并發(fā)癥/合并癥,年齡、是否手術(shù)、出入院病情、住院天數(shù)都對(duì)費(fèi)用可能有著重要影響。
將所有可能對(duì)費(fèi)用產(chǎn)生影響的因子放入特征矩陣中,通過(guò)逐步回歸的方法,確定影響費(fèi)用的因子。逐步回歸是:每引入一個(gè)解釋變量后都要進(jìn)行F檢驗(yàn),并對(duì)已經(jīng)選入的解釋變量逐個(gè)進(jìn)行t檢驗(yàn),當(dāng)原來(lái)引入的解釋變量由于后面解釋變量的引入變得不再顯著時(shí),則將其刪除。經(jīng)過(guò)逐步回歸,使得最后保留在模型中的解釋變量既是重要的,又沒有嚴(yán)重多重共線性。
1.4模型構(gòu)建:通過(guò)特征,擬合線性回歸模型,量化每種并發(fā)癥/合并癥對(duì)費(fèi)用的影響。并根據(jù)實(shí)驗(yàn)效果調(diào)整合并癥/并發(fā)癥的位數(shù)、是否引入交叉項(xiàng)和二次項(xiàng)、以及住院費(fèi)用是否取對(duì)數(shù)。
二、實(shí)驗(yàn)及結(jié)果分析:
2.2樣本篩選:本次實(shí)驗(yàn)樣本為:出院診斷主要診斷為原發(fā)性高血壓(I10),離院方式只取醫(yī)囑離院或醫(yī)囑轉(zhuǎn)社區(qū)衛(wèi)生服務(wù)機(jī)構(gòu)/鄉(xiāng)鎮(zhèn)衛(wèi)生院,醫(yī)院級(jí)別為二級(jí)甲等,共27235條記錄。
2.3特征選擇:
2.3.1常見并發(fā)癥/合并癥:并發(fā)癥/合并癥在“費(fèi)用-診斷表”表中體現(xiàn)為“其他診斷”,這些診斷大部分是按照ICD10編碼規(guī)范填寫了6位,但是后兩位不同的醫(yī)院有所差異,因此考慮是最多取到ICD10的前4位編碼。并發(fā)癥/合并癥數(shù)量統(tǒng)計(jì)。在費(fèi)用-診斷表選出所有高血壓患者,共計(jì)125434例病案數(shù),這部分患者中,出現(xiàn)并發(fā)癥個(gè)數(shù)分布如下圖7所示,其中19%高血壓患者沒有出現(xiàn)并發(fā)癥/合并癥,81%患者都出現(xiàn)了并發(fā)癥/合并癥。
統(tǒng)計(jì)出這些患者中出現(xiàn)的所有并發(fā)癥,以及出現(xiàn)總數(shù),并按出現(xiàn)總數(shù)從高到低排序。繪制折線圖,X軸代表ICD10編碼,Y軸代表患該并發(fā)癥的總病案數(shù)。
在折線圖8中發(fā)現(xiàn),極少數(shù)疾病出現(xiàn)次數(shù)特別高,占據(jù)了所有疾病出現(xiàn)總數(shù)的30%,一小部分疾病出現(xiàn)次數(shù)也比較高,還有絕大部分的疾病難得出現(xiàn),就是上述折線圖長(zhǎng)長(zhǎng)的尾巴。因此,需要通過(guò)計(jì)算,得到哪部分疾病屬于出現(xiàn)次數(shù)特別高,哪部分疾病屬于出現(xiàn)次數(shù)較高,哪部分疾病屬于不經(jīng)常出現(xiàn),也就是找到這些發(fā)生躍變的點(diǎn)。“出現(xiàn)次數(shù)較高”與“出現(xiàn)次數(shù)低”的分界點(diǎn)在折線圖中很難區(qū)分,借助長(zhǎng)尾理論,其中20%的疾病出現(xiàn)次數(shù)占據(jù)所有并發(fā)癥出現(xiàn)次數(shù)的80%,而其余80%的疾病出現(xiàn)次數(shù)只占所有并發(fā)癥的20%,因此,找到能覆蓋80%并發(fā)癥/合并癥的點(diǎn)即可,通過(guò)計(jì)算發(fā)現(xiàn),在第45個(gè)點(diǎn)時(shí),已經(jīng)可以覆蓋80.002%的并發(fā)癥,這個(gè)點(diǎn)也就是我們要找的分界點(diǎn)此外,在所有出現(xiàn)次數(shù)較高的疾病中間,還存在一個(gè)特殊的的分界點(diǎn)——“出現(xiàn)次數(shù)特別高”與“出現(xiàn)次數(shù)較高”的分界點(diǎn)。在折線圖中體現(xiàn)為最彎曲的拐點(diǎn),該點(diǎn)可以通過(guò)計(jì)算曲線的曲率,曲率最大的即是拐點(diǎn)。具體步驟如下:
a)用統(tǒng)計(jì)分析軟件Stata對(duì)上述數(shù)據(jù)進(jìn)行多項(xiàng)式擬合,原則上,多項(xiàng)式次數(shù)越高,擬合出的結(jié)果也更準(zhǔn)確。最終得到20次多項(xiàng)式,擬合正確率達(dá)到99.55%。
b)根據(jù),先計(jì)算y上各點(diǎn)y'和y''值,代入曲率公式,得到曲線上各點(diǎn)的曲率。
c)找到曲率最大點(diǎn)??煽吹皆诘?7個(gè)點(diǎn)時(shí),曲率發(fā)生了突變,也就是我們要找的“出現(xiàn)次數(shù)特別高的點(diǎn)”的分界點(diǎn)。
在上述分析中,我們找到了45種常見并發(fā)癥/合并癥,如下表所示。在本次分析中,也只關(guān)注這45種疾病對(duì)費(fèi)用的影響。同時(shí),還找到了27種出現(xiàn)次數(shù)特別頻繁的并發(fā)癥/合并癥,如下表中黃色部分。這對(duì)后期在臨床上重點(diǎn)關(guān)注和控制這些并發(fā)癥發(fā)生,有參考價(jià)值。
2.3.2選擇影響費(fèi)用的其他因子:
(1)年齡段:按照世界衛(wèi)生組織( WHO)和我國(guó)對(duì)年齡的劃分??紤]到高血壓患者中老年人最多,因此在65歲以上的老人用的是細(xì)粒度的劃分(0至6歲、7至17歲、18至40歲、41至65歲、66歲至72歲、73歲至84歲、85歲以后);
(2)病情:由入院病情和住院期間是否出現(xiàn)病危和病重共同決定,入院或住院期間出現(xiàn)病危急都屬于病情嚴(yán)重,否則病情一般;
(3)性別:女性為0,男性為1;
(4)住院天數(shù);
(5)手術(shù)級(jí)別:分為無(wú)手術(shù)、技術(shù)難度較低、技術(shù)難度一般、技術(shù)難度較大、技術(shù)難度大;
(6)常見的45種并發(fā)癥/合并癥(I25,I63,K29,E78,E11,I67,I50,I11,I70,K76,M47,E87,J44,N40,J98,I49,G45,M48,M51,I51,K80,I65,N28,I69,E79,G31,M81,I48,I10,J42,E14,M50,J20,J06,N20,N18,D64, I20, J18, R94, G47, M10, J43,I27,M17);
(7)常見并發(fā)癥數(shù)量;
(8)不常見的并發(fā)癥數(shù)量:不常見并發(fā)癥不包括ICD編碼以R、V、Y、Z開頭,因?yàn)檫@些編碼疾病只是對(duì)疾病的補(bǔ)充說(shuō)明;
(9)醫(yī)院所在行政區(qū),隸屬單位等。
2.3.3影響因子顯著性分析:
采用逐步回歸方法,篩選對(duì)費(fèi)用有顯著性影響因子。引入變量的檢驗(yàn)水準(zhǔn)取0.05, 剔除變量取0.05,最終得到對(duì)費(fèi)用有顯著影響的因子。
(1)年齡段
(2)病情
(4)住院天數(shù)
(5)手術(shù)級(jí)別
(6)26種并發(fā)癥/合并癥(J98、I70、E78、J44、M47、J18、J20、I63、M48、E11、I48、G31、M17、I65、I11、I50、I25、M51、I20、J42、D64、G45、M50、N40、R94、I10)
(7)常見并發(fā)癥數(shù)量
(8)不常見的并發(fā)癥數(shù)量
將上述影響因子的影響程度從大到小排序。
2.4影響因子對(duì)費(fèi)用的影響:
2.4.1總費(fèi)用分布情況:統(tǒng)計(jì)所有樣本的住院總費(fèi)用,并繪制分布直方圖,如圖9所示。從圖中可以看到,住院總費(fèi)用服從偏正態(tài)分布,將其取對(duì)數(shù)之后,可將置信區(qū)間轉(zhuǎn)換為正數(shù)范圍內(nèi),但我們分析中并不關(guān)心置信區(qū)間,因此住院總費(fèi)用可以不用轉(zhuǎn)換。
2.4.2建立回歸方程:使用統(tǒng)計(jì)分析工具SAS對(duì)總費(fèi)用做線性回歸,回歸效果如下圖2-7所示。其中最重要的指標(biāo)為R方,它反應(yīng)了回歸的效果,(代表實(shí)際值、代表預(yù)測(cè)值)。R方值越大,意味著殘差平方和越小,也就是模型的擬合效果越好。
其中,上述公式中參數(shù)值如下表
2.5結(jié)果說(shuō)明及分析:
2.5.1顯著性影響因子分析:從費(fèi)用顯著影響因子分析的結(jié)果中,可以得出住院天數(shù)、并發(fā)癥總數(shù)是影響高血壓費(fèi)用的最主要因子,隨著住院天數(shù)的增多,住院費(fèi)用會(huì)相應(yīng)增加,因此減少住院天數(shù)和并發(fā)癥數(shù)量是控制住院費(fèi)用的關(guān)鍵。
同時(shí)發(fā)現(xiàn),性別對(duì)高血壓費(fèi)用沒有顯著性影響,N18, K29,I67, K76,E87,I49, I51,K80,N28,I69,E79,M81,E14,J06,N20,G47, M10, J43,I27并發(fā)癥/合并癥對(duì)費(fèi)用也無(wú)顯著影響。在臨床上應(yīng)重點(diǎn)控制那些對(duì)住院費(fèi)用有顯著影響的并發(fā)癥/合并癥。
結(jié)論及展望:通過(guò)上述分析,可以看出,除了住院天數(shù)以外,并發(fā)癥/合并癥也對(duì)患者治療費(fèi)用產(chǎn)生很大影響。同時(shí),不同并發(fā)癥/ 合并癥對(duì)患者年治療費(fèi)用影響程度不同,其中其他呼吸性疾患影響程度最大,會(huì)使總住院費(fèi)用增加937.31元。
此外,高血壓的并發(fā)癥/合并癥的發(fā)生率也很高,81%的患者至少出現(xiàn)1種并發(fā)癥/合并癥,因此防止和降低并發(fā)癥的發(fā)生率,對(duì)降低高血壓的治療費(fèi)用將有著重要意義。
并發(fā)癥/合并癥取ICD_10編碼前4位:按ICD10前4位,統(tǒng)計(jì)出所有并發(fā)癥/合并癥及其出現(xiàn)次數(shù),選取能覆蓋80%的常見并發(fā)癥/合并癥,這些并發(fā)癥/合并癥共計(jì)99個(gè):
同樣選取年齡、病情等其他影響因子,逐步回歸的方法,得到回歸模型。
對(duì)所公開的實(shí)施例的上述說(shuō)明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來(lái)說(shuō)將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。