用于電子病歷特征提取的種群精英分布云協(xié)同均衡方法
【專利摘要】本發(fā)明公開一種用于電子病歷特征提取的種群精英分布云協(xié)同均衡方法。該方法首先在分布式云計算MapReduce框架下將大規(guī)模電子病歷分割到不同的進(jìn)化子種群中,提取各子種群最優(yōu)解Psolui;然后設(shè)計一種有限理性區(qū)域下N種群精英均衡優(yōu)勢策略,構(gòu)建分布式協(xié)同化動態(tài)精英演化區(qū)域Ω,使參與電子病歷特征提取的各子種群精英在各自平均權(quán)重概率下均能達(dá)到Nash均衡下優(yōu)勢區(qū)域Ζ;最后各子種群精英采用并行操作<keyi,valuei>機(jī)制在各自電子病區(qū)優(yōu)勢子區(qū)域中協(xié)同提取特征子集Fi,從而穩(wěn)定取得電子病歷全局均衡特征集。本發(fā)明能較好處理大規(guī)模電子病歷數(shù)據(jù)屬性間多維度復(fù)雜內(nèi)聯(lián)關(guān)系,提高大規(guī)模電子病歷特征并行提取效率。
【專利說明】用于電子病歷特征提取的種群精英分布云協(xié)同均衡方法
【技術(shù)領(lǐng)域】:
[0001] 本發(fā)明涉及到醫(yī)學(xué)信息智能處理領(lǐng)域,具體來說涉及用于電子病歷特征提取的種 群精英分布云協(xié)同均衡方法。
【背景技術(shù)】:
[0002] 電子病歷系統(tǒng)中存儲的醫(yī)療數(shù)據(jù)隱含著大量有用信息,提取出其中重要的醫(yī)學(xué)特 征和診斷規(guī)則是形成計算機(jī)智能臨床決策支持系統(tǒng)的關(guān)鍵,是眾多電子病歷智能應(yīng)用的核 心支撐技術(shù)。由于電子病歷系統(tǒng)中醫(yī)療數(shù)據(jù)屬性所具有的大規(guī)模性、多樣性、不確定性和動 態(tài)性等,給電子病歷特征的準(zhǔn)確提取帶來了較大困難,因此迫切需要考慮給出有效的方法 來解決大規(guī)模復(fù)雜電子病歷特征提取問題。
[0003] 然而目前大部分大規(guī)模并行特征提取算法是假設(shè)所有數(shù)據(jù)一次性裝入內(nèi)存中的, 這顯然無法滿足和適應(yīng)當(dāng)前醫(yī)療信息系統(tǒng)中大規(guī)模電子病歷數(shù)據(jù)特征提取的處理需求,而 且目前現(xiàn)有的大部分特征提取算法對大規(guī)模電子病歷特征提取時均存在著消耗時間和空 間量較大,無法處理病歷數(shù)據(jù)屬性間多維度復(fù)雜的內(nèi)聯(lián)關(guān)系,且往往不能保證最終提取的 病歷特征集為所求目標(biāo)的最優(yōu)病歷特征集等問題,這將意味著目前一般的特征提取算法不 能夠有效地應(yīng)用到實際大規(guī)模電子病歷多模式多角度特征提取中。在大數(shù)據(jù)背景下開展大 規(guī)模電子病歷特征提取方法研究,是目前電子病歷智能處理研究所面臨的新挑戰(zhàn)。
【發(fā)明內(nèi)容】
:
[0004] 本發(fā)明的目的是提供一種具有較好適應(yīng)性和可行性、具有較強(qiáng)全局收斂穩(wěn)定性、 具有較好可擴(kuò)展性的用于電子病歷特征提取的種群精英分布云協(xié)同均衡方法。
[0005] 本發(fā)明通過以下的技術(shù)方案實現(xiàn)的:
[0006] -種用于電子病歷特征提取的種群精英分布云協(xié)同均衡方法,具體步驟如下:
[0007] A、基于分布式云計算MapReduce框架將大規(guī)模電子病歷自適應(yīng)劃分至各子種群 SubpopuIationi*,采用量子蛙跳算法QSFLA作為各個子種群進(jìn)化算法,分別進(jìn)行各子種群 Subpopulationi演化,取得參與電子病歷特征提取的各子種群最優(yōu)解Psolu i,從而形成種 群全局最優(yōu)集為
[0008] PSOLU = Psoiu^PsoIu2+. . . . +Psolui+. . . +PsoIun;
[0009] B、設(shè)計一種有限理性區(qū)域下N種群精英均衡優(yōu)勢策略,構(gòu)建分布式協(xié)同化動態(tài)精 英演化區(qū)域Ω,使參與電子病歷特征提取的各子種群精英在各自平均權(quán)重概率下均能達(dá)到 Nash均衡下優(yōu)勢區(qū)域Z ;
[0010] C、構(gòu)造大規(guī)模電子病歷相應(yīng)病癥的形式背景并映射至進(jìn)化種群空間,建立電子病 歷特征提取進(jìn)化目標(biāo)優(yōu)化模S
【權(quán)利要求】
1. 一種用于電子病歷特征提取的種群精英分布云協(xié)同均衡方法,其特征在于:具體步 驟如下: A、 基于分布式云計算MapReduce框架將大規(guī)模電子病歷自適應(yīng)劃分至各子種群 SubpopuIationi*,采用量子蛙跳算法QSFLA作為各個子種群進(jìn)化算法,分別進(jìn)行各子種群 Subpopulationi演化,取得參與電子病歷特征提取的各子種群最優(yōu)解Psolui,從而形成種 群全局最優(yōu)集為 PSOLU=Psoiu^PsoIu2+. . . . +Psolui+. . . +PsoIun; B、 設(shè)計一種有限理性區(qū)域下N種群精英均衡優(yōu)勢策略,構(gòu)建分布式協(xié)同化動態(tài)精英 演化區(qū)域Ω,使參與電子病歷特征提取的各子種群精英在各自平均權(quán)重概率下均能達(dá)到 Nash均衡下優(yōu)勢區(qū)域Z; C、 構(gòu)造大規(guī)模電子病歷相應(yīng)病癥的形式背景并映射至進(jìn)化種群空間,建立電子病歷特 N 征提取進(jìn)化目標(biāo)優(yōu)化模型F(X) =min(C(x)) =Dxi,q:x;)為電子病歷特征函數(shù),Xi i=l 為電子病歷映射到種群空間的特征值,將電子病歷特征提取優(yōu)化問題轉(zhuǎn)化為進(jìn)化種群精 英在Nash均衡下優(yōu)勢區(qū)域目標(biāo)尋優(yōu)問題; D、 基于云計算的MapReduce框架,各子種群精英結(jié)合分布式協(xié)同云模型下各子種群并 行操作<keyi,value,機(jī)制對,提取各個劃分的電子病歷子區(qū)域特征子集Fi; E、 根據(jù)進(jìn)化子種群精英在各自對應(yīng)的電子病歷子區(qū)域上提取的特征子集Fi,獲取電子 病歷全局均衡特征集戈
F、 評估提取出的電子病歷全局均衡特征集,輸出電子病歷全局均衡優(yōu)勢特征集Ftjpt。
2. 根據(jù)權(quán)利要求1所述一種用于電子病歷特征提取的種群精英分布云協(xié)同均衡方法, 其特征在于:所述步驟A具體為:基于分布式云計算MapReduce框架的大規(guī)模電子病歷自 適應(yīng)劃分實現(xiàn)方法,該方法將大規(guī)模電子病歷自適應(yīng)劃分至各子種群SubpopuIationi,采 用量子蛙跳算法QSFLA作為各個子種群進(jìn)化算法進(jìn)行各子種群演化,取得參與電子病歷特 征提取的各子種群最優(yōu)解Psolui,從而形成全局最優(yōu)特征集,其步驟如下: 1) 、使用云計算的MapReduce框架,將整個進(jìn)化種群分割成N個子種群 Subpopulation1,…,Subpopulationi.",SubpopulationN; 2) 、每個子種群Subpopulationi與左右相鄰近的分布式協(xié)同子種群Subpopulationη 和Subpopulationi+1共享各自最優(yōu)解,加速整個種群的并行協(xié)同優(yōu)化能力; 3) 、采用量子娃跳算法QSFLA作為各個子種群51^?〇?11]^1:;[〇1^進(jìn)化算法,在每次迭 代結(jié)束,每個子種群以自適應(yīng)概率Pi產(chǎn)生其最優(yōu)解Psolui,其中自適應(yīng)概率Pi表示在 MapReduce框架上Kkeyi,valued動態(tài)概率,其計算公式定義如下:
公式中fj為子種群Subpopulationi中第j個一般協(xié)同進(jìn)化個體的最優(yōu)適應(yīng)度,r為子 種群Subpopulationi*協(xié)同進(jìn)化個體總數(shù),丨為子種群Subpopulationi中局部精英的 最優(yōu)適應(yīng)度,fEUTIST為整個種群全局精英的最優(yōu)適應(yīng)度; 4) 、建立MapReduce框架下各子種群Subpopulationi的并行操作〈keyi,value)鍵值, 其計算如下:
Valuei= w ^keyi; 5) 、采用存檔策略記錄下每個子種群Subpopulationi參與電子病歷特征提取的最優(yōu)解 Psolui,然后將所有子種群最優(yōu)解協(xié)同演化成整個種群全局整體最優(yōu)解PS0LU,其計算公式 定義如下:
3.根據(jù)權(quán)利要求1所述一種用于電子病歷特征提取的種群精英分布云協(xié)同均衡方法, 其特征在于:所述步驟B具體為:有限理性區(qū)域下N種群精英均衡優(yōu)勢策略實現(xiàn)方法,該方 法設(shè)計一種在有限理性區(qū)域下N種群精英均衡優(yōu)勢策略,構(gòu)建分布式協(xié)同化動態(tài)精英演化 區(qū)域Ω,使參與電子病歷特征提取的各子種群精英在各自平均權(quán)重概率下均能達(dá)到Nash 均衡下優(yōu)勢區(qū)域Z,其步驟如下: 1) 、初始化N個種群的有限理性區(qū)域為Ω,有限理性區(qū)域邊界Region1Sai,有 限理性區(qū)域邊界Regio%*β,,且兩個區(qū)域邊界滿足協(xié)同進(jìn)化精英的適應(yīng)度極值范圍 f;mm幺SAmax,f;mm為第i個精英最小適應(yīng)度,f;max為第i個精英最大適應(yīng)度, 從而取得有限理性區(qū)域Ω為
2) 、以第p個鄰域精英為基本精英點,則其有限理性區(qū)域邊界為 fpmaXj,fpmm為第P個鄰域精英最小適應(yīng)度,fpmM為第P個鄰域精英最大適應(yīng)度, 那么對于m個鄰域精英集,則有限理性區(qū)域Ω調(diào)整為動態(tài)精英區(qū)域如下:
3) 、判斷動態(tài)精英區(qū)域Ω中第i個精英精英解Tj(Xi)能否進(jìn)入穩(wěn)定的Nash均衡解集 [^,Pi],其判斷公式如下:
4) 、調(diào)整精英Nash均衡區(qū)域邊界半徑巧為
5) 、構(gòu)建有限理性區(qū)域下N種群精英進(jìn)入穩(wěn)定Nash均衡優(yōu)勢區(qū)域策略,首先設(shè)定Pni為 子種群精英在均衡區(qū)域邊界半徑Si范圍內(nèi)的概率,其中δi為邊界半徑移動值,且滿足 δi〈IarβiI,Ppi為子種群精英在均衡區(qū)域邊界半徑ri+δ1范圍內(nèi)的概率;然后計算子種 群所有平均權(quán)重概率得分WAPS為
?-Ρ, 0<Cj<(^-6|); 其中Wi = . ,nm' ,二z丨'丄s、ci為第土種群精英在均衡區(qū)域邊界半徑I-Ppp (ri-5j)<ci <(η+5|). 值; 6) 、各子種群精英在各自平均權(quán)重概率下均能達(dá)到的Nash均衡下優(yōu)勢區(qū)域Z為
【文檔編號】G06F19/00GK104462853SQ201410837453
【公開日】2015年3月25日 申請日期:2014年12月29日 優(yōu)先權(quán)日:2014年12月29日
【發(fā)明者】丁衛(wèi)平, 陳森博, 施佺, 董建成, 管致錦, 沈?qū)W華, 程學(xué)云, 李躍華 申請人:南通大學(xué)