本發(fā)明屬于數(shù)據(jù)挖掘與大數(shù)據(jù)分析技術領域,涉及面向婦女病診斷數(shù)據(jù)的預處理技術。
背景技術:
婦科疾病是指在非妊娠狀態(tài)下生殖器官各種疾病的總稱,由于女性生殖器官的特殊性,婦科疾病成為成年女性的常見病、多發(fā)病。其臨床表現(xiàn)多種多樣,病因復雜且常伴有多種嚴重并發(fā)癥,其發(fā)病率居高不下,近年呈大幅度上升趨勢,在基層更為突出。
我國婦女病診治優(yōu)勢資源主要集中在大中城市,擁有中高級技術職稱的婦產(chǎn)科醫(yī)師90%在縣以上醫(yī)療機構,主要是三級醫(yī)院。這些醫(yī)院普遍人滿為患,掛號難、診療難、繳費難、取藥難。與此相對的是,與群眾接觸最直接、最緊密的縣級醫(yī)院和鄉(xiāng)鎮(zhèn)衛(wèi)生院,設備設施落后、技術力量薄弱、人員素質(zhì)參差不齊、現(xiàn)代管理理念欠缺,高級技術職稱的婦產(chǎn)科醫(yī)師不足5%,基層醫(yī)生90%以上依賴“望、聞、問”診斷,誤診率達70%以上,80%患者得不到合理治療,抗生素濫用現(xiàn)象十分嚴重,遠高于WHO規(guī)定的30%,這種“需求在基層,技術在高層”的模式導致我國婦女病診治嚴重脫節(jié)。
由于得不到及時規(guī)范的治療,致使我國20%婦女終生被婦女病困擾,育齡婦女的早產(chǎn)、流產(chǎn)率達12%(世界平均不足6%),不孕不育高達15%,宮頸癌病變達20萬人/年(占全球1/3)。許多患者不得已從鄉(xiāng)村到城市求醫(yī),寄希望于大醫(yī)院、名醫(yī)生,路途遠的往返需要2-3天,由此造成的交通費食宿費每年多達1000多億元。
隨著互聯(lián)網(wǎng)與大數(shù)據(jù)技術的發(fā)展,開發(fā)婦女病智能診斷系統(tǒng),降低基層醫(yī)護人員的誤診率成為可能。數(shù)據(jù)預處理技術是開發(fā)婦女病智能診斷系統(tǒng)的關鍵技術,因此有必要對此技術開展全新的研究。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種面向婦科疾病智能化診斷的數(shù)據(jù)預處理技術,以提高婦科疾病智能診斷的準確率。
為了解決以上技術問題,本發(fā)明的采用的技術方案如下。
一種面向婦科疾病智能化診斷的數(shù)據(jù)預處理技術,其特征在于包括以下步驟:
步驟一,對采集到的數(shù)據(jù)進行缺失值處理;
步驟二,對經(jīng)過缺失值處理的數(shù)據(jù)進行異常值處理;
步驟三,對經(jīng)過異常值處理過的數(shù)據(jù)進行數(shù)據(jù)變換,使得數(shù)據(jù)都要歸一化,避免誤差。
所述缺失值處理包含以下8個規(guī)則,
規(guī)則1.1,“妊娠”與“產(chǎn)后”兩項指標都缺失的情況下,“妊娠”指標的值設置為“13~27周”,“產(chǎn)后”指標的值設置為“否”;
規(guī)則1.2,“生殖道既往感染史”的缺失值設置為“患有陰道炎、宮頸炎、盆腔炎”;
規(guī)則1.3,“患者主訴”的缺失值設置為“異味,外陰瘙癢,白帶量多”;
規(guī)則1.4,“外陰檢查”的缺失值設置為“紅腫”;
規(guī)則1.5,“陰道壁檢查”的缺失值設置為“粘膜出血”;
規(guī)則1.6,“宮頸壁檢查”的缺失值設置為“重度糜爛”;
規(guī)則1.7,“白帶檢查”的缺失值設置為為“異味、異常黃色”;
規(guī)則1.8,血液檢測各項指標的缺失值設置為參考值上限的1.2倍;
所述異常值處理包含以下2個規(guī)則,
規(guī)則2.1,當“妊娠”與“產(chǎn)后”兩項指標互斥時,保留“妊娠”指標的的值,將“產(chǎn)后”指標的值設置為“否”;
規(guī)則2.2,對于血液檢測各項指標,如果值大于參考值上限的2倍,則將該指標的值設置為參考值上限的2倍;
所述數(shù)據(jù)變換包含以下2個規(guī)則,
規(guī)則3.1,對于“妊娠”,“產(chǎn)后”,“生殖道既往感染史”,“患者主訴”,“外陰檢查”,“陰道壁檢查”,“宮頸壁檢查”,“白帶檢查”中的各項指標,設置布爾型變量用以表示各個指標的取值,如果指標成立,則該指標對應的布爾型變量的值為1,否則為0。
規(guī)則3.2,對于血液檢測中的各項指標,將其指標值與下限的差除以參考值的上限與下限的差得到的商作為變換后的值。
本發(fā)明具有有益效果。數(shù)據(jù)預處理是保證婦科疾病診斷準確性的關鍵技術。本發(fā)明充分考慮了婦科疾病數(shù)據(jù)的特征,通過對采集到的數(shù)據(jù)進行缺失值處理、對經(jīng)過缺失值處理的數(shù)據(jù)進行異常值處理、對經(jīng)過異常值處理過的數(shù)據(jù)進行數(shù)據(jù)變換等技術方法,能顯著提高婦科疾病診斷診斷的準確性。
具體實施方式
下面結(jié)合實施例對本發(fā)明的技術方案做進一步詳細說明。
對某個病人進行婦科疾病診斷,表1為某個病人的原始檢查表。
表1.某個病人的原始檢查表
將表1的信息,依本發(fā)明的數(shù)據(jù)預處理方法進行處理后,得預處理后的值如表2所示。
表2病人的數(shù)據(jù)預處理后的檢查表
表2的數(shù)據(jù)完全符合數(shù)據(jù)挖掘的要求,可以作為婦科病智能診斷的學習案例。