專(zhuān)利名稱(chēng):一種最小最大局部結(jié)構(gòu)信息的特征選擇方法
一種最小最大局部結(jié)構(gòu)信息的特征選擇方法技術(shù)領(lǐng)域:
本發(fā)明 涉及特征選擇的方法,特別涉及最小最大局部結(jié)構(gòu)信息的特征選擇方法。背景技術(shù):
在許多機(jī)器學(xué)習(xí)任務(wù)中,常常會(huì)碰到許多高維數(shù)據(jù),如計(jì)算視覺(jué)和模式識(shí)別中的人臉圖像、數(shù)據(jù)挖掘中的文本數(shù)據(jù)等,在處理高維數(shù)據(jù)時(shí),需要很長(zhǎng)的處理時(shí)間和可觀的存儲(chǔ)空間,所以在進(jìn)行分類(lèi)、聚類(lèi)等機(jī)器學(xué)習(xí)任務(wù)前,需要對(duì)高維數(shù)據(jù)進(jìn)行降維預(yù)處理,如特征選擇和特征提取,目的是獲得一個(gè)低維的特征子集。
一般地,特征選擇分為捆綁式和濾波式,捆綁式是利用現(xiàn)有的分類(lèi)器來(lái)評(píng)價(jià)各個(gè)特征子集,從而找出最優(yōu)的特征子集。對(duì)于某一個(gè)特定的分類(lèi)器而言,捆綁法可以獲得較好效果,但它需要分類(lèi)器在各個(gè)特征子集進(jìn)行訓(xùn)練,導(dǎo)致計(jì)算復(fù)雜度非常高;濾波式則直接利用一個(gè)準(zhǔn)則函數(shù),如Fisher Score、LaplacianScore等,來(lái)評(píng)價(jià)每個(gè)特征的優(yōu)劣,濾波式特征選擇方法又分為無(wú)監(jiān)督和有監(jiān)督兩種,實(shí)際應(yīng)用中,由于獲取標(biāo)簽數(shù)據(jù)非常難且成本高, 而獲得無(wú)標(biāo)簽數(shù)據(jù)很容易,所以無(wú)監(jiān)督濾波式特征選擇方法一直得到很大的關(guān)注。
在機(jī)器學(xué)習(xí)中,流行學(xué)習(xí)一直是關(guān)注的焦點(diǎn),為了反映潛在的數(shù)據(jù)流行結(jié)構(gòu),提出了諸如IS0MAP、拉普拉斯特征映射、局部線性嵌入、局部保持投影和近鄰保持投影等特征提取方法和無(wú)監(jiān)督的特征選擇方法Laplacian Score,Laplacian Score利用局部不變性保證特征子集保持?jǐn)?shù)據(jù)流行結(jié)構(gòu),但局部結(jié)構(gòu)信息之間的關(guān)系并未考慮,而這種局部結(jié)構(gòu)信息間的關(guān)系在機(jī)器學(xué)習(xí)任務(wù)扮演重要作用,因此所獲得的特征子集所具備的表示能力有所欠缺。
發(fā)明內(nèi)容
本發(fā)明的目的就是解決現(xiàn)有技術(shù)中的問(wèn)題,提出一種最小最大局部結(jié)構(gòu)信息的特征選擇方法,提供一種無(wú)監(jiān)督的特征選擇準(zhǔn)則,使所獲得的特征子集具有更好的表示能力。
為實(shí)現(xiàn)上述目的,本發(fā)明提出了一種最小最大局部結(jié)構(gòu)信息的特征選擇方法,包括如下步驟
A)構(gòu)建一個(gè)全局圖G和對(duì)應(yīng)的權(quán)矩陣W,
權(quán)利要求
1.一種最小最大局部結(jié)構(gòu)信息的特征選擇方法,其特征在于包括如下步驟 A)構(gòu)建一個(gè)全局圖G和對(duì)應(yīng)的權(quán)矩陣W,
2.如權(quán)利要求I所述的一種最小最大局部結(jié)構(gòu)信息的特征選擇方法,其特征在于所述 D)步驟中
3.如權(quán)利要求I所述的一種最小最大局部結(jié)構(gòu)信息的特征選擇方法,其特征在于所述D)步驟中提出的最小最大信息準(zhǔn)則MMLSp
4.如權(quán)利要求3所述的一種最小最大局部結(jié)構(gòu)信息的特征選擇方法,其特征在于所述D)步驟中Var(f;)是第r個(gè)特征的方差,1¥和1是權(quán)矩陣,所述0 < a < 1,且
5.如權(quán)利要求I至4中任一項(xiàng)所述的一種最小最大局部結(jié)構(gòu)信息的特征選擇方法,其特征在于所述D)步驟中提出的最小最大信息準(zhǔn)則MMLSp包括如下過(guò)程因?yàn)閃w+Wb = W,故
全文摘要
本發(fā)明公開(kāi)了一種最小最大局部結(jié)構(gòu)信息的特征選擇方法,包括以下步驟構(gòu)建一個(gè)全局圖G和對(duì)應(yīng)的權(quán)矩陣W;根據(jù)A)步驟中的全局圖G和權(quán)矩陣W,構(gòu)建一個(gè)近鄰圖Gw和對(duì)應(yīng)的權(quán)矩陣Ww;根據(jù)B)步驟中計(jì)算所得的權(quán)矩陣Ww,計(jì)算權(quán)矩陣A=Ww-αW,對(duì)角矩陣D和拉普拉斯矩陣L=D-A,其中0≤α≤1;計(jì)算各個(gè)特征的最小最大局部結(jié)構(gòu)信息的拉普拉斯指標(biāo)MMLSr;根據(jù)D)步驟中獲得的拉普拉斯指標(biāo)MMLSr大小,依次選出d個(gè)最小拉普拉斯指標(biāo)MMLSr對(duì)應(yīng)的特征,構(gòu)成特征子集。本發(fā)明提供一種無(wú)監(jiān)督的特征選擇準(zhǔn)則,通過(guò)引入局部?jī)?nèi)結(jié)構(gòu)信息和局部間結(jié)構(gòu)信息,通過(guò)最小局部?jī)?nèi)結(jié)構(gòu)信息來(lái)保持各類(lèi)數(shù)據(jù)潛在的流行結(jié)構(gòu),通過(guò)最大局部間結(jié)構(gòu)信息來(lái)釋放類(lèi)之間的信息,從而選擇出更具表示能力的特征子集。
文檔編號(hào)G06K9/62GK102982346SQ20121051312
公開(kāi)日2013年3月20日 申請(qǐng)日期2012年11月30日 優(yōu)先權(quán)日2012年11月30日
發(fā)明者蔣云良, 胡文軍, 顧永跟, 王娟 申請(qǐng)人:湖州師范學(xué)院