一種聚類(lèi)簇獲取方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,特別涉及一種聚類(lèi)簇獲取方法及裝置。
【背景技術(shù)】
[0002]目前,企業(yè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)量越來(lái)越大,這些數(shù)據(jù)中包含了許多有利于商業(yè)運(yùn)作、提高競(jìng)爭(zhēng)力的信息,為改進(jìn)和優(yōu)化事務(wù)決策,提高企業(yè)的競(jìng)爭(zhēng)力,需要即時(shí)準(zhǔn)確地對(duì)這些信息做出準(zhǔn)確的分析。
[0003]例如,對(duì)于零售業(yè)中客戶滿意度數(shù)據(jù)的空間分布問(wèn)題中,通常對(duì)規(guī)則空間分布的樣本數(shù)據(jù)為數(shù)據(jù)基礎(chǔ)采用局部最優(yōu)策略實(shí)現(xiàn)樣本數(shù)據(jù)中的聚類(lèi)簇的獲取。
[0004]但上述方案得到的聚類(lèi)簇由于其數(shù)據(jù)基礎(chǔ)具有局限性,使得由此獲取到的該聚類(lèi)簇準(zhǔn)確性較低。
【發(fā)明內(nèi)容】
[0005]本申請(qǐng)所要解決的技術(shù)問(wèn)題是提供一種聚類(lèi)簇獲取方法及裝置,用以解決現(xiàn)有技術(shù)中通過(guò)對(duì)規(guī)則空間分布的樣本數(shù)據(jù)采用局部最優(yōu)策略獲取聚類(lèi)簇時(shí),獲取到的聚類(lèi)簇具有局限性,使得該聚類(lèi)簇準(zhǔn)確性較低的技術(shù)問(wèn)題。
[0006]本申請(qǐng)?zhí)峁┝艘环N聚類(lèi)簇獲取方法,包括:
[0007]獲取目標(biāo)數(shù)據(jù),所述目標(biāo)數(shù)據(jù)包括多個(gè)第一數(shù)據(jù)項(xiàng);
[0008]對(duì)所述目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng)進(jìn)行初始聚類(lèi)分析,得到所述目標(biāo)數(shù)據(jù)中的聚類(lèi)集合,所述聚類(lèi)集合中包括多個(gè)第二數(shù)據(jù)項(xiàng);
[0009]依據(jù)所述目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng),獲取所述聚類(lèi)集合中的聚類(lèi)簇,所述聚類(lèi)族包括多個(gè)第三數(shù)據(jù)項(xiàng)。
[0010]上述方法,優(yōu)選的,所述對(duì)所述目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng)進(jìn)行初始聚類(lèi)分析,得到所述目標(biāo)數(shù)據(jù)中的聚類(lèi)集合,包括:
[0011]利用遺傳算法確定所述目標(biāo)數(shù)據(jù)中第一數(shù)據(jù)項(xiàng)中的全局最優(yōu)數(shù)據(jù)項(xiàng)作為第二數(shù)據(jù)項(xiàng);
[0012]將所述第二數(shù)據(jù)項(xiàng)進(jìn)行組合,得到所述目標(biāo)數(shù)據(jù)中的聚類(lèi)集合。
[0013]上述方法,優(yōu)選的,依據(jù)所述目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng),獲取所述聚類(lèi)集合中的聚類(lèi)簇,包括:
[0014]對(duì)于每個(gè)所述第一數(shù)據(jù)項(xiàng),分別獲取所述第一數(shù)據(jù)項(xiàng)與所述聚類(lèi)集合中每個(gè)第二數(shù)據(jù)項(xiàng)之間的近鄰函數(shù)值;
[0015]依據(jù)所述第一數(shù)據(jù)項(xiàng)對(duì)應(yīng)的每個(gè)近鄰函數(shù)值,確定最小的近鄰函數(shù)值對(duì)應(yīng)的第二數(shù)據(jù)項(xiàng)為第三數(shù)據(jù)項(xiàng);
[0016]將每個(gè)所述第一數(shù)據(jù)項(xiàng)各自對(duì)應(yīng)的第三數(shù)據(jù)項(xiàng)進(jìn)行組合,生成聚類(lèi)簇。
[0017]上述方法,優(yōu)選的,所述分別獲取所述第一數(shù)據(jù)項(xiàng)與所述聚類(lèi)集合中每個(gè)第二數(shù)據(jù)項(xiàng)之間的近鄰函數(shù)值,包括:
[0018]分別獲取所述第一數(shù)據(jù)項(xiàng)對(duì)每個(gè)所述第二數(shù)據(jù)項(xiàng)的第一近鄰系數(shù);
[0019]分別獲取每個(gè)所述第二數(shù)據(jù)項(xiàng)對(duì)所述第一數(shù)據(jù)項(xiàng)的第二近鄰系數(shù);
[0020]依據(jù)所述第一近鄰系數(shù)和所述第二近鄰系數(shù),分別獲取所述第一數(shù)據(jù)項(xiàng)與所述聚類(lèi)集合中每個(gè)第二數(shù)據(jù)項(xiàng)之間的近鄰函數(shù)值。
[0021]本申請(qǐng)還提供了一種聚類(lèi)簇獲取裝置,包括:
[0022]數(shù)據(jù)獲取單元,用于獲取目標(biāo)數(shù)據(jù),所述目標(biāo)數(shù)據(jù)包括多個(gè)第一數(shù)據(jù)項(xiàng);
[0023]初始聚類(lèi)單元,用于對(duì)所述目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng)進(jìn)行初始聚類(lèi)分析,得到所述目標(biāo)數(shù)據(jù)中的聚類(lèi)集合,所述聚類(lèi)集合中包括多個(gè)第二數(shù)據(jù)項(xiàng);
[0024]聚類(lèi)簇獲取單元,用于依據(jù)所述目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng),獲取所述聚類(lèi)集合中的聚類(lèi)簇;
[0025]其中,所述聚類(lèi)簇包括多個(gè)第三數(shù)據(jù)項(xiàng)。
[0026]上述裝置,優(yōu)選的,所述初始聚類(lèi)單元包括:
[0027]最優(yōu)確定子單元,用于利用遺傳算法確定所述目標(biāo)數(shù)據(jù)中第一數(shù)據(jù)項(xiàng)中的全局最優(yōu)數(shù)據(jù)項(xiàng)作為第二數(shù)據(jù)項(xiàng);
[0028]數(shù)據(jù)項(xiàng)組合子單元,用于將所述第二數(shù)據(jù)項(xiàng)進(jìn)行組合,得到所述目標(biāo)數(shù)據(jù)中的聚類(lèi)集合。
[0029]上述裝置,優(yōu)選的,所述聚類(lèi)簇獲取單元包括:
[0030]值獲取子單元,用于對(duì)每個(gè)所述第一數(shù)據(jù)項(xiàng),分別獲取所述第一數(shù)據(jù)項(xiàng)與所述聚類(lèi)集合中每個(gè)第二數(shù)據(jù)項(xiàng)之間的近鄰函數(shù)值;
[0031]最小確定子單元,用于依據(jù)所述第一數(shù)據(jù)項(xiàng)對(duì)應(yīng)的每個(gè)近鄰函數(shù)值,確定最小的近鄰函數(shù)值對(duì)應(yīng)的第二數(shù)據(jù)項(xiàng)為第三數(shù)據(jù)項(xiàng);
[0032]簇生成子單元,用于將每個(gè)所述第一數(shù)據(jù)項(xiàng)各自對(duì)應(yīng)的第三數(shù)據(jù)項(xiàng)進(jìn)行組合,生成聚類(lèi)簇。
[0033]上述裝置,優(yōu)選的,所述值獲取子單元包括:
[0034]第一系數(shù)獲取模塊,用于分別獲取所述第一數(shù)據(jù)項(xiàng)對(duì)每個(gè)所述第二數(shù)據(jù)項(xiàng)的第一近鄰系數(shù);
[0035]第二系數(shù)獲取模塊,用于分別獲取每個(gè)所述第二數(shù)據(jù)項(xiàng)對(duì)所述第一數(shù)據(jù)項(xiàng)的第二近鄰系數(shù);
[0036]近鄰值獲取模塊,用于依據(jù)所述第一近鄰系數(shù)和所述第二近鄰系數(shù),分別獲取所述第一數(shù)據(jù)項(xiàng)與所述聚類(lèi)集合中每個(gè)第二數(shù)據(jù)項(xiàng)之間的近鄰函數(shù)值。
[0037]由上述方案可知,本申請(qǐng)?zhí)峁┑囊环N聚類(lèi)簇獲取方法及裝置,通過(guò)獲取樣本的目標(biāo)數(shù)據(jù),進(jìn)而對(duì)該目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng)進(jìn)行第一次的初始聚類(lèi)分析,得到該目標(biāo)數(shù)據(jù)中的初始聚類(lèi)集合,進(jìn)而對(duì)該聚類(lèi)集合進(jìn)行第二次分析,即為依據(jù)目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng),獲取聚類(lèi)集合中的聚類(lèi)簇,將聚類(lèi)簇中的數(shù)據(jù)作為最優(yōu)決策參考依據(jù)提供給用戶。本申請(qǐng)通過(guò)對(duì)目標(biāo)數(shù)據(jù)進(jìn)行兩次聚類(lèi)分析,提高最終得到的聚類(lèi)簇的準(zhǔn)確性。
【附圖說(shuō)明】
[0038]為了更清楚地說(shuō)明本申請(qǐng)實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本申請(qǐng)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0039]圖1為本申請(qǐng)?zhí)峁┑囊环N聚類(lèi)簇獲取方法實(shí)施例一的流程圖;
[0040]圖2為本申請(qǐng)?zhí)峁┑囊环N聚類(lèi)簇獲取方法實(shí)施例二的部分流程圖;
[0041]圖3為本申請(qǐng)?zhí)峁┑囊环N聚類(lèi)簇獲取方法實(shí)施例三的部分流程圖;
[0042]圖4為本申請(qǐng)實(shí)施例三的另一部分流程圖;
[0043]圖5為本申請(qǐng)?zhí)峁┑囊环N聚類(lèi)簇獲取裝置實(shí)施例四的結(jié)構(gòu)示意圖;
[0044]圖6為本申請(qǐng)?zhí)峁┑囊环N聚類(lèi)簇獲取裝置實(shí)施例五的部分結(jié)構(gòu)示意圖;
[0045]圖7為本申請(qǐng)?zhí)峁┑囊环N聚類(lèi)簇獲取裝置實(shí)施例六的部分結(jié)構(gòu)示意圖;
[0046]圖8為本申請(qǐng)實(shí)施例六的另一部分結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0047]下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本申請(qǐng)保護(hù)的范圍。
[0048]參考圖1,為本申請(qǐng)?zhí)峁┑囊环N聚類(lèi)簇獲取方法實(shí)施例一的流程圖,所述方法用于獲取樣本數(shù)據(jù)中的聚類(lèi)簇,以作為用戶做出最優(yōu)決策的參考依據(jù)。其中,所述方法可以包括以下步驟:
[0049]步驟101:獲取目標(biāo)數(shù)據(jù)。
[0050]其中,所述目標(biāo)數(shù)據(jù)中包括多個(gè)第一數(shù)據(jù)項(xiàng)。所述目標(biāo)數(shù)據(jù)即為樣本數(shù)據(jù),如在各個(gè)零售商中統(tǒng)計(jì)獲取購(gòu)買(mǎi)香煙的客戶相關(guān)數(shù)據(jù),這些樣本數(shù)據(jù)中可以包括多個(gè)樣本數(shù)據(jù)項(xiàng),即為所述第一數(shù)據(jù)項(xiàng),每個(gè)第一數(shù)據(jù)項(xiàng)中可以包括如購(gòu)買(mǎi)香煙的客戶的分布地址信息、購(gòu)買(mǎi)時(shí)間信息等數(shù)據(jù)信息。
[0051]步驟102:對(duì)所述目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng)進(jìn)行初始聚類(lèi)分析,得到所述目標(biāo)數(shù)據(jù)中的聚類(lèi)集合。
[0052]其中,所述聚類(lèi)集合中可以包括多個(gè)第二數(shù)據(jù)項(xiàng)。
[0053]需要說(shuō)明的是,所述步驟102中可以通過(guò)對(duì)所述目標(biāo)數(shù)據(jù)中的每個(gè)第一數(shù)據(jù)項(xiàng)之間進(jìn)行初始聚類(lèi)分析,在所述目標(biāo)數(shù)據(jù)的第一數(shù)據(jù)項(xiàng)中提取到滿足初始聚類(lèi)分析條件的數(shù)據(jù)項(xiàng)作為第二數(shù)據(jù)項(xiàng),由此得到所述目標(biāo)數(shù)據(jù)中的聚類(lèi)集合。
[0054]步驟103:依據(jù)所述目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng),獲取所述聚類(lèi)集合中的聚類(lèi)簇。
[0055]其中,所述聚類(lèi)簇中可以包括多個(gè)第三數(shù)據(jù)項(xiàng)。
[0056]需要說(shuō)明的是,所述步驟103是指,依據(jù)所述目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng),對(duì)所述聚類(lèi)集合中的第二數(shù)據(jù)項(xiàng)進(jìn)行最優(yōu)項(xiàng)分析,提取該聚類(lèi)集合中的數(shù)據(jù)項(xiàng)作為第三數(shù)據(jù)項(xiàng),由此得到聚類(lèi)簇。
[0057]由上述方案可知,本申請(qǐng)?zhí)峁┑囊环N聚類(lèi)簇獲取方法實(shí)施例一,通過(guò)獲取樣本的目標(biāo)數(shù)據(jù),進(jìn)而對(duì)該目標(biāo)數(shù)據(jù)中的第一數(shù)據(jù)項(xiàng)進(jìn)行第一次的初始聚類(lèi)分析,得到該目標(biāo)數(shù)據(jù)中的初