專(zhuān)利名稱(chēng):一種基于連續(xù)條件屬性的粗糙集論域空間降維方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種粗糙集理論的論域空間降維方法,具體涉及一種基于連續(xù)條件 屬性的粗糙集論域空間降維方法,為粗糙集知識(shí)獲取提供了良好途徑,用于信息處理領(lǐng)域。
背景技術(shù):
在現(xiàn)代網(wǎng)絡(luò)信息時(shí)代,計(jì)算機(jī)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)以及網(wǎng)絡(luò)信息技術(shù)的飛速發(fā)展,使 得各行業(yè)的數(shù)據(jù)和信息量程爆炸方式增長(zhǎng)。今天我們擁有越來(lái)越多的數(shù)據(jù),規(guī)模積累到了 海量數(shù)據(jù)的程度。然而,現(xiàn)代企業(yè)預(yù)想在信息化社會(huì)中立足,不得不從數(shù)據(jù)中尋求有用的知 識(shí)。即如從大量的、雜亂無(wú)章的、強(qiáng)干擾的數(shù)據(jù)中挖掘到潛在的、有利用價(jià)值的信息(有用知 識(shí)),這給人類(lèi)的智能信息處理能力提出了前所未有的挑戰(zhàn),同時(shí)也為有洞察力、捷足先登 的企業(yè)帶來(lái)了巨大的機(jī)遇。由此智能理論產(chǎn)生了一個(gè)嶄新的研究領(lǐng)域一數(shù)據(jù)挖掘和知識(shí)發(fā) 現(xiàn)。粗糙集理論是處理含糊和不精確性問(wèn)題的新型數(shù)學(xué)工具之一,已被廣泛應(yīng)用于數(shù) 據(jù)挖掘,機(jī)器學(xué)習(xí),人工智能以及故障診斷等領(lǐng)域,成為近年的科學(xué)研究熱點(diǎn)。論域是粗糙 集模型所討論的問(wèn)題空間,是由大量論域?qū)ο蠹磾?shù)據(jù)記錄所組成的。論域維數(shù)即論域?qū)ο?的自身屬性列數(shù)和論域?qū)ο髷?shù)量(即行數(shù))的總稱(chēng)。論域維數(shù)代表了問(wèn)題的復(fù)雜程度,將直 接影響粗糙集計(jì)算模塊的計(jì)算效率。因此,通過(guò)合理的降維方法,將對(duì)屬性約簡(jiǎn)、規(guī)則發(fā)現(xiàn) 等問(wèn)題有著積極的意義。目前論域空間的降維問(wèn)題,基本上停留在領(lǐng)域?qū)<医?jīng)驗(yàn)性確定的 階段,還不能達(dá)到面向量化的、面向約簡(jiǎn)和規(guī)則產(chǎn)生指標(biāo)的整體性程度。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有粗糙集論域空間降維方法的不足和缺陷,提供一種新的 粗糙集論域空間降維方法,實(shí)現(xiàn)高質(zhì)量的論域空間降維和快速的運(yùn)算,滿(mǎn)足分類(lèi)學(xué)習(xí)的實(shí)
際需要。為了實(shí)現(xiàn)這樣的目的,本發(fā)明基于連續(xù)屬性測(cè)量誤差 的客觀特點(diǎn),考慮論域?qū)ο蟮臈l件屬性全部為連續(xù)屬性,決策屬 性為離散屬性的項(xiàng)目數(shù)據(jù)特征,研究論域空間的降維問(wèn)題,定義
權(quán)利要求
一種基于連續(xù)條件屬性的粗糙集論域空間降維方法,定義為粗糙集降維的度量,其特征在于,包括如下步驟(1)輸入信息系統(tǒng),其中是對(duì)象的非空有限集合,是屬性的非空有限集合,獲取數(shù)據(jù)集(論域矩陣)的初始維數(shù);(2)參數(shù)初始化,其中表示論域矩陣中定位的基準(zhǔn)行中的第列條件屬性值;表示論域矩陣中與基準(zhǔn)行所比較的第行中的第列條件屬性值;表示屬性的最大取值;表示屬性的最小取值;表示連續(xù)屬性的誤差因子,用以控制論域空間的降維效果;(3)計(jì)算連續(xù)屬性全距離CAWD數(shù)值,如果連續(xù)屬性全距離在給定誤差之內(nèi),則合并兩論域?qū)ο螅⒈槐容^的xi對(duì)象清零;如果連續(xù)屬性全距離不在給定誤差之內(nèi),則不能合并兩論域?qū)ο螅瑫r(shí)i=i+1,繼續(xù)搜索,直至i=n;(4)如果定位的基準(zhǔn)行等于n,即計(jì)算完畢;否則跳回步驟(3),繼續(xù)合并對(duì)象的處理;(5)最后,以論域空間中所有的非零對(duì)象組成降維的論域空間。2010105297904100001dest_path_image001.jpg,342850dest_path_image002.jpg,2010105297904100001dest_path_image003.jpg,953960dest_path_image004.jpg,2010105297904100001dest_path_image005.jpg,166635dest_path_image006.jpg,2010105297904100001dest_path_image007.jpg,495986dest_path_image008.jpg,757203dest_path_image006.jpg,222819dest_path_image010.jpg,544079dest_path_image007.jpg,2010105297904100001dest_path_image011.jpg,360725dest_path_image012.jpg,2010105297904100001dest_path_image013.jpg,222371dest_path_image012.jpg,745756dest_path_image014.jpg,2010105297904100001dest_path_image015.jpg
全文摘要
本發(fā)明公開(kāi)了一種基于連續(xù)條件屬性的粗糙集論域空間降維方法,定義為粗糙集降維的度量,通過(guò)限定連續(xù)屬性全距離的誤差范圍來(lái)規(guī)定兩論域?qū)ο蠛喜⒌臈l件僅當(dāng)兩個(gè)論域?qū)ο蟮乃袟l件屬性值的距離全部滿(mǎn)足規(guī)定的距離范圍時(shí),CAWD才會(huì)取值為0,表示該兩個(gè)比較對(duì)象可以認(rèn)為相同,可以進(jìn)行合并,以此消除了不影響知識(shí)發(fā)現(xiàn)的局部測(cè)量誤差,同時(shí)在對(duì)CAWD=0的兩個(gè)論域?qū)ο筮M(jìn)行合并后,論域空間的維數(shù)將會(huì)在縱向減少一維,即由n維減小為n-1維,降維效果明顯。
文檔編號(hào)G06F17/30GK101963997SQ201010529790
公開(kāi)日2011年2月2日 申請(qǐng)日期2010年11月3日 優(yōu)先權(quán)日2010年11月3日
發(fā)明者向陽(yáng), 張艷, 李翠玲 申請(qǐng)人:上海海事大學(xué)