一種獲取課程關(guān)聯(lián)度的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種獲取課程關(guān)聯(lián)度的方法及系統(tǒng),該方法包括:將兩門課程的成績數(shù)據(jù)分別按照成績的分?jǐn)?shù)劃分為預(yù)設(shè)的等級,得到兩門課程的離散化成績數(shù)據(jù);將同一學(xué)生的兩門課程的離散化成績數(shù)據(jù)之間的等級關(guān)系生成對應(yīng)的規(guī)則,計算每條規(guī)則對應(yīng)的支持度,提取支持度大于或等于預(yù)設(shè)閾值的規(guī)則,得到原始規(guī)則集合;利用啟發(fā)式算法將所述原始規(guī)則集合劃分為正常規(guī)則集合和異常規(guī)則集合;分別計算異常規(guī)則集合中對應(yīng)的異常規(guī)則的支持度的和以及正常規(guī)則集合中對應(yīng)的正常規(guī)則的支持度的和,根據(jù)所述異常規(guī)則的支持度的和與所述正常規(guī)則的支持度的和計算兩門課程關(guān)聯(lián)度。本發(fā)明能夠準(zhǔn)確獲取課程間的關(guān)聯(lián)度,為教學(xué)過程中課程推薦提供有效的技術(shù)支持。
【專利說明】一種獲取課程關(guān)聯(lián)度的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘【技術(shù)領(lǐng)域】,尤其涉及一種獲取課程關(guān)聯(lián)度的方法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著社會對于教育的重視,越來越來多的人開始參與到在校學(xué)習(xí)。于此同時帶來 的是大量的教學(xué)數(shù)據(jù)的產(chǎn)生,如何有效的利用這些教學(xué)數(shù)據(jù)成為了研宄的熱點問題。數(shù)據(jù) 挖掘技術(shù)是一種能夠在大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律的技術(shù)。由于數(shù)據(jù)本身的復(fù)雜性,所以一般普 適的算法無法直接應(yīng)用到數(shù)據(jù)上,這就需要針對挖掘的目標(biāo)提出新的數(shù)據(jù)挖掘方法或者新 的模型。
[0003]目前,對于關(guān)聯(lián)性分析,國內(nèi)外已經(jīng)有人提出了一些算法,主要包括:
[0004] Aporior算法:該算法是一種挖掘頻繁項集的算法。頻繁項集挖掘通過將已有的 頻繁項集合進行連接,不斷篩選滿足頻繁度的項集,通過迭代上面的過程最終得到所有的 頻繁項目集合。關(guān)聯(lián)規(guī)則挖掘是通過將每條頻繁項集進行分割得到關(guān)聯(lián)規(guī)則,根據(jù)最小置 信篩選出強關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘算法只能挖掘出關(guān)聯(lián)規(guī)則,無法給出兩個事物間的關(guān) 聯(lián)度。
[0005] FP-Tree算法:為了解決算法時間復(fù)雜度過高的問題,研宄人員提出了,通過將規(guī) 則壓縮到一個樹中,避免每次篩選的時候再次掃描數(shù)據(jù)庫,能夠有效的提高算法的效率。
[0006] 上述算法能夠挖掘關(guān)聯(lián)規(guī)則,但是無法對數(shù)據(jù)關(guān)聯(lián)度進行度量。
【發(fā)明內(nèi)容】
[0007](一)要解決的技術(shù)問題
[0008] 本發(fā)明提供一種獲取課程關(guān)聯(lián)度的方法及系統(tǒng),準(zhǔn)確獲取課程間的關(guān)聯(lián)度,為教 學(xué)過程中課程推薦提供有效的技術(shù)支持。
[0009](二)技術(shù)方案
[0010] 為解決上述技術(shù)問題,本發(fā)明提供一種獲取課程關(guān)聯(lián)度的方法,該方法包括:
[0011] 將兩門課程的成績數(shù)據(jù)分別按照成績的分?jǐn)?shù)劃分為預(yù)設(shè)的等級,得到兩門課程的 離散化成績數(shù)據(jù);
[0012] 將同一學(xué)生的兩門課程的離散化成績數(shù)據(jù)之間的等級關(guān)系生成對應(yīng)的規(guī)則,計算 每條規(guī)則對應(yīng)的支持度,提取支持度大于或等于預(yù)設(shè)閾值的規(guī)則,得到原始規(guī)則集合;
[0013] 利用啟發(fā)式算法將所述原始規(guī)則集合劃分為正常規(guī)則集合和異常規(guī)則集合;
[0014] 分別計算異常規(guī)則集合中對應(yīng)的異常規(guī)則的支持度的和以及正常規(guī)則集合中對 應(yīng)的正常規(guī)則的支持度的和,根據(jù)所述異常規(guī)則的支持度的和與所述正常規(guī)則的支持度的 和計算兩門課程關(guān)聯(lián)度。
[0015] 優(yōu)選地,在所述將兩門課程的成績數(shù)據(jù)分別按照成績的分?jǐn)?shù)劃分為預(yù)設(shè)個等級之 前,所述方法還包括:
[0016] 將兩門課程的成績數(shù)據(jù)按照統(tǒng)一標(biāo)準(zhǔn)進行數(shù)據(jù)歸一化處理,得到兩門課程的標(biāo)準(zhǔn) 成績數(shù)據(jù)。
[0017] 優(yōu)選地,規(guī)則對應(yīng)的支持度的計算公式具體如下:
[0018] 支持度=規(guī)則對應(yīng)的數(shù)量/規(guī)則集合的數(shù)量。
[0019] 優(yōu)選地,在所述將兩門課程的成績數(shù)據(jù)分別按照成績的分?jǐn)?shù)劃分為預(yù)設(shè)個等級之 后,所述方法還包括:
[0020] 對所述預(yù)設(shè)個等級進行排序。
[0021] 優(yōu)選地,所述利用啟發(fā)式算法將所述原始規(guī)則集合劃分為正常規(guī)則集合和異常規(guī) 則集合,具體包括:
[0022] 步驟1 :分別計算所述原始規(guī)則集合中每個規(guī)則對應(yīng)的交叉點的數(shù)量、等級差以 及每個規(guī)則的趨勢,其中,若兩條規(guī)則對應(yīng)的等級是升降交叉關(guān)系,則兩條規(guī)則均存在交叉 點,等級差為同一學(xué)生的兩門課程的離散化成績數(shù)據(jù)之間的等級差的絕對值,規(guī)則的趨勢 包括同一學(xué)生兩門課程的離散化成績數(shù)據(jù)之間的等級的上升和下降;
[0023] 步驟2 :在所述原始規(guī)則集合中選取交叉點最多的規(guī)則加入到異常規(guī)則集合中, 如果集合中規(guī)則的交叉點相同,則在交叉點相同的規(guī)則中選擇等級差最大的規(guī)則加入到異 常規(guī)則集合中,如果集合中規(guī)則的等級差都相同,則選擇與大部分規(guī)則的趨勢相反的規(guī)則 加入到異常規(guī)則集合中,如果集合中規(guī)則的趨勢都相同,則選擇支持度最低的規(guī)則加入到 異常規(guī)則集合中;
[0024] 步驟3 :當(dāng)有規(guī)則加入到異常規(guī)則集合時,再次執(zhí)行步驟1,判斷剩余規(guī)則集合中 是否存在交叉點,若沒有,則跳轉(zhuǎn)到步驟4,否則再次執(zhí)行步驟2。
[0025] 步驟4:遍歷異常規(guī)則集合,將任一個異常規(guī)則加入到正常規(guī)則集合中,如果所述 正常規(guī)則集合中不存在交叉點,那么繼續(xù)添加,如果存在交叉點,跳過該交叉點,如果存在 兩個異常規(guī)則都能使得正常規(guī)則集合繼續(xù)保持正常,且兩個異常規(guī)則同時加入正常規(guī)則集 合時會出現(xiàn)交叉點,則在所述兩個異常規(guī)則在選擇支持度高的規(guī)則加入正常規(guī)則集合中。
[0026] 優(yōu)選地,所述根據(jù)所述異常規(guī)則的支持度的和與所述正常規(guī)則的支持度的和計算 兩門課程關(guān)聯(lián)度,具體公式如下:
[0027]
【權(quán)利要求】
1. 一種獲取課程關(guān)聯(lián)度的方法,其特征在于,所述方法包括: 將兩門課程的成績數(shù)據(jù)分別按照成績的分?jǐn)?shù)劃分為預(yù)設(shè)的等級,得到兩門課程的離散 化成績數(shù)據(jù); 將同一學(xué)生的兩門課程的離散化成績數(shù)據(jù)之間的等級關(guān)系生成對應(yīng)的規(guī)則,計算每條 規(guī)則對應(yīng)的支持度,提取支持度大于或等于預(yù)設(shè)閾值的規(guī)則,得到原始規(guī)則集合; 利用啟發(fā)式算法將所述原始規(guī)則集合劃分為正常規(guī)則集合和異常規(guī)則集合; 分別計算異常規(guī)則集合中對應(yīng)的異常規(guī)則的支持度的和以及正常規(guī)則集合中對應(yīng)的 正常規(guī)則的支持度的和,根據(jù)所述異常規(guī)則的支持度的和與所述正常規(guī)則的支持度的和計 算兩門課程關(guān)聯(lián)度。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述將兩門課程的成績數(shù)據(jù)分別按照 成績的分?jǐn)?shù)劃分為預(yù)設(shè)個等級之前,所述方法還包括: 將兩門課程的成績數(shù)據(jù)按照統(tǒng)一標(biāo)準(zhǔn)進行數(shù)據(jù)歸一化處理,得到兩門課程的標(biāo)準(zhǔn)成績 數(shù)據(jù)。
3. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,規(guī)則對應(yīng)的支持度的計算公式具體如 下: 支持度=規(guī)則對應(yīng)的數(shù)量/規(guī)則集合的數(shù)量。
4. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,在所述將兩門課程的成績數(shù)據(jù)分別按 照成績的分?jǐn)?shù)劃分為預(yù)設(shè)個等級之后,所述方法還包括: 對所述預(yù)設(shè)個等級進行排序。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述利用啟發(fā)式算法將所述原始規(guī)則集 合劃分為正常規(guī)則集合和異常規(guī)則集合,具體包括: 步驟1 :分別計算所述原始規(guī)則集合中每個規(guī)則對應(yīng)的交叉點的數(shù)量、等級差以及每 個規(guī)則的趨勢,其中,若兩條規(guī)則對應(yīng)的等級是升降交叉關(guān)系,則兩條規(guī)則均存在交叉點, 等級差為同一學(xué)生的兩門課程的離散化成績數(shù)據(jù)之間的等級差的絕對值,規(guī)則的趨勢包括 同一學(xué)生兩門課程的離散化成績數(shù)據(jù)之間的等級的上升和下降; 步驟2 :在所述原始規(guī)則集合中選取交叉點最多的規(guī)則加入到異常規(guī)則集合中,如果 集合中規(guī)則的交叉點相同,則在交叉點相同的規(guī)則中選擇等級差最大的規(guī)則加入到異常規(guī) 則集合中,如果集合中規(guī)則的等級差都相同,則選擇與大部分規(guī)則的趨勢相反的規(guī)則加入 到異常規(guī)則集合中,如果集合中規(guī)則的趨勢都相同,則選擇支持度最低的規(guī)則加入到異常 規(guī)則集合中; 步驟3 :當(dāng)有規(guī)則加入到異常規(guī)則集合時,再次執(zhí)行步驟1,判斷剩余規(guī)則集合中是否 存在交叉點,若沒有,則跳轉(zhuǎn)到步驟4,否則再次執(zhí)行步驟2。 步驟4:遍歷異常規(guī)則集合,將任一個異常規(guī)則加入到正常規(guī)則集合中,如果所述正常 規(guī)則集合中不存在交叉點,那么繼續(xù)添加,如果存在交叉點,跳過該交叉點,如果存在兩個 異常規(guī)則都能使得正常規(guī)則集合繼續(xù)保持正常,且兩個異常規(guī)則同時加入正常規(guī)則集合時 會出現(xiàn)交叉點,則在所述兩個異常規(guī)則在選擇支持度高的規(guī)則加入正常規(guī)則集合中。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述異常規(guī)則的支持度的和與 所述正常規(guī)則的支持度的和計算兩門課程關(guān)聯(lián)度,具體公式如下:
其中,Sim表示關(guān)聯(lián)度,Sim值越小對應(yīng)的關(guān)聯(lián)度越小,Sim值越大對應(yīng)的關(guān)聯(lián)度越大,N表示正常規(guī)則集合,D表示異常規(guī)則集合,Support表示相應(yīng)的規(guī)則集合中規(guī)則的支持度 和。
7. -種獲取課程關(guān)聯(lián)度的系統(tǒng),其特征在于,所述系統(tǒng)包括: 數(shù)據(jù)離散化模塊,用于將兩門課程的成績數(shù)據(jù)分別按照成績的分?jǐn)?shù)劃分為預(yù)設(shè)的等 級,得到兩門課程的離散化成績數(shù)據(jù); 原始規(guī)則集合生成模塊,用于將同一學(xué)生的兩門課程的離散化成績數(shù)據(jù)之間的等級關(guān) 系生成對應(yīng)的規(guī)則,計算每條規(guī)則對應(yīng)的支持度,提取支持度大于或等于預(yù)設(shè)閾值的規(guī)則, 得到原始規(guī)則集合; 規(guī)則劃分模塊,用于利用啟發(fā)式算法將所述原始規(guī)則集合劃分為正常規(guī)則集合和異常 規(guī)則集合; 關(guān)聯(lián)度計算模塊,用于分別計算異常規(guī)則集合中對應(yīng)的異常規(guī)則的支持度的和以及正 常規(guī)則集合中對應(yīng)的正常規(guī)則的支持度的和,根據(jù)所述異常規(guī)則的支持度的和與所述正常 規(guī)則的支持度的和計算兩門課程關(guān)聯(lián)度。
8. 根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 數(shù)據(jù)歸一化模塊,用于在將兩門課程的成績數(shù)據(jù)分別按照成績的分?jǐn)?shù)劃分為預(yù)設(shè)個等 級之前,將兩門課程的成績數(shù)據(jù)按照統(tǒng)一標(biāo)準(zhǔn)進行數(shù)據(jù)歸一化處理,得到兩門課程的標(biāo)準(zhǔn) 成績數(shù)據(jù)。
9. 根據(jù)權(quán)利要求7或8所述的系統(tǒng),其特征在于,規(guī)則對應(yīng)的支持度的計算公式具體如 下: 支持度=規(guī)則對應(yīng)的數(shù)量/規(guī)則集合的數(shù)量。
10. 根據(jù)權(quán)利要求7或8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括: 等級排序模塊,用于在將兩門課程的成績數(shù)據(jù)分別按照成績的分?jǐn)?shù)劃分為預(yù)設(shè)個等級 之后,對所述預(yù)設(shè)個等級進行排序。
【文檔編號】G06F19/00GK104484554SQ201410693920
【公開日】2015年4月1日 申請日期:2014年11月26日 優(yōu)先權(quán)日:2014年11月26日
【發(fā)明者】高小鵬, 阮帥, 季書帆, 姜博, 萬寒, 龍翔 申請人:北京航空航天大學(xué)