本發(fā)明涉及教育數(shù)據(jù)挖掘技術(shù)領(lǐng)域,尤其涉及一種時序化的學(xué)生認知診斷方法。
背景技術(shù):
認知診斷是傳統(tǒng)考試測驗與評價的一種改進與完善。一般的教育考試,特別是大規(guī)模的考試,只提供考試分數(shù)。然而由單一的分數(shù),既不能得到學(xué)生具體掌握或未掌握什么知識的結(jié)論,也不能得到學(xué)生做錯試題的原因,以進行補救;對于相同分數(shù)的學(xué)生,更無法得到他們之間可能存在的知識狀態(tài)和認知結(jié)構(gòu)的差異。傳統(tǒng)考試提供的信息已不太適合學(xué)生發(fā)展的需要,認知診斷的主要任務(wù)是根據(jù)學(xué)生的差異,挖掘出更多認知加工信息。認知診斷通過測驗獲得學(xué)生在測驗上(可觀察)的反應(yīng)(測試結(jié)果),從而推知學(xué)生不可觀察的知識狀態(tài)。
認知診斷是對學(xué)生長時間學(xué)習(xí)的狀態(tài)評估,是智能化個性教學(xué)的重要內(nèi)容。準(zhǔn)確的認知診斷,可以幫助學(xué)生清楚地對自身這段時間學(xué)習(xí)情況準(zhǔn)確認知,同時可以輔助家長和老師為學(xué)生制定個性化的學(xué)習(xí)策略。因而如何長時間地、準(zhǔn)確地診斷學(xué)生知識掌握程度的變化,一直是教育數(shù)據(jù)挖掘領(lǐng)域探索的一個重要問題。
目前,關(guān)于認知診斷的方法主要有以下幾種:
1)基于單個時刻的能力值診斷
基于項目反應(yīng)理論(irt)僅通過學(xué)生在試題上的答題情況,通過對題目特征函數(shù)的運算,來推測學(xué)生的能力。irt的題目參數(shù)有:難度、區(qū)分度和猜測程度。根據(jù)參數(shù)的不同,特征函數(shù)可分為單參數(shù)模型(難度)、雙參數(shù)模型(難度、區(qū)分度)和三參數(shù)模型(難度、區(qū)分度、猜測參數(shù))等。將學(xué)生建模為一維連續(xù)能力值,并以這一個單一的能力值表示學(xué)生的綜合能力。在irt模型下,學(xué)生被刻畫成一個具有單一能力值的對象,除題目自身的因素(區(qū)分度、難度、猜測度)之外,學(xué)生在題目上的表現(xiàn)情況僅受到這單一綜合能力的影響。
2)基于單個時刻的知識掌握診斷
在引入了知識點相關(guān)的能力維度后,有學(xué)者提出試題所關(guān)聯(lián)的知識點信息(q矩陣),并且認為一個試題所考察的多個知識點之間的相互作用有“連接性的”(需要掌握考察的所有知識點才能有機會答對試題)和“補償性的”(只要掌握所考察的其中一個相關(guān)知識點就能得分)。該方法屬于多維離散認知診斷模型(dina),且該dina模型認為知識點間的相互作用是“連接性的”。dina模型除了使用學(xué)生在試題上的答題情況之外還引入了試題知識點關(guān)聯(lián)矩陣(q矩陣),通過聯(lián)合更多的教育領(lǐng)域內(nèi)特有的信息對學(xué)生的知識點掌握程度進行診斷,并將學(xué)生建模成一個在多維知識點上的能力向量,其中向量的每一維的值均是0-1的,表示學(xué)生是否掌握了對應(yīng)維度上的知識點。dina模型可以進一步結(jié)合試題上的猜測和失誤參數(shù),預(yù)測學(xué)生在試題上的表現(xiàn)情況。
3)基于多個時刻的能力值診斷。
考慮到學(xué)習(xí)如同跑馬拉松,是一個循序漸進的長期過程。單一時刻的靜態(tài)認知診斷方法已經(jīng)遠遠不能滿足學(xué)生日益增長的需求,有學(xué)者提出基于時序化的認知診斷技術(shù),該類技術(shù)主要可以分為以下兩種模型:時序化的irt模型和bkt模型及其相關(guān)改進。時序化irt技術(shù)主要是在傳統(tǒng)的irt模型中加入時間的因素,認為學(xué)生的能力值隨時間的變化符合特定的規(guī)律可以用線性函數(shù)擬合,從而根據(jù)學(xué)生歷史的多次測試的答題數(shù)據(jù),得到學(xué)生在不同時刻的能力值。bkt模型被廣泛應(yīng)用到智能指導(dǎo)系統(tǒng)中,該應(yīng)用場景的數(shù)據(jù)有一個鮮明的特征,對于同一道試題或者問題,應(yīng)試者會在不同時刻多次反復(fù)作答。該模型使用隱馬爾科夫方法對學(xué)生的知識掌握進行建模,同時定義了四個概率:初始的能力值,t時刻知識點掌握程度的轉(zhuǎn)化概率,犯錯的概率以及猜測的概率用于表征學(xué)生在每個時刻的表現(xiàn)和狀態(tài)。
上述認知診斷方法中,基于單個時刻的能力值診斷以及知識掌握診斷雖然可以準(zhǔn)確地得到學(xué)生在特定時刻的能力值或者知識掌握程度,但是該方法是靜態(tài)的,僅能對一場考試的數(shù)據(jù)進行分析,無法適用于學(xué)生長時間學(xué)習(xí)的動態(tài)評估?;诙鄠€時刻的能力值診斷方法,雖然可以得到學(xué)生在不同時刻的能力值,以及準(zhǔn)確預(yù)測學(xué)生在下一個時刻的得分,但是該能力值沒有實際意義,更無法解釋學(xué)生的能力值是如何變化的,一個單維的能力值因為缺乏解釋意義,實際的價值不大,該方法只能診斷出學(xué)生在不同時刻的能力值提升或者下降了,但是無法得知學(xué)生在哪方面的知識上退步需要加強,在哪些方面已經(jīng)足夠熟練不需要再額外增加訓(xùn)練。因此,采用現(xiàn)有的認知診斷方法,難以精準(zhǔn)地捕獲學(xué)生長時間學(xué)習(xí)過程中對各個知識點的掌握程度的變化情況,以及有依據(jù)地解釋什么因素導(dǎo)致了學(xué)生的變化,例如新學(xué)習(xí)了某個知識點,或者時間間隔太長遺忘等。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種時序化的學(xué)生認知診斷方法,通過對試題信息以及學(xué)生答題情況,進行連續(xù)、長時間地分析處理,可以精準(zhǔn)地分析學(xué)生在不同時間段的整體能力水平和知識掌握程度。
本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的:
一種時序化的學(xué)生認知診斷方法,包括:
獲取多個學(xué)生的歷史答題信息;
根據(jù)獲取到的歷史答題信息使用時序化認知診斷方法進行建模,獲得知識點掌握程度以及經(jīng)過偏序限制后的試題-知識點相關(guān)性矩陣;
根據(jù)知識點掌握程度以及經(jīng)過偏序限制后的試題-知識點相關(guān)性矩陣對某一學(xué)生下一個時間段的知識點掌握程度以及所做試題上的得分進行預(yù)測。
所述根據(jù)獲取到的歷史答題信息使用時序化認知診斷方法進行建模包括:
初始化能力向量u、試題-知識點相關(guān)性矩陣v,以及實體的難度參數(shù)b,則學(xué)生獲得得分為r的后驗概率表示為:
其中,t為總時間段數(shù),n為總學(xué)生數(shù)量,m為總試題數(shù),
給定試題關(guān)聯(lián)的q矩陣,|q|=m×k:
其中,k為知識點數(shù)量;
定義如下偏序關(guān)系:對于試題j,如果其與知識點q的關(guān)系為qjq=1,與知識點p的關(guān)系為qjp=0,則認為對于試題j,知識點q比知識點p更相關(guān);
則有:
上式中,
將給定的q矩陣,轉(zhuǎn)換得到訓(xùn)練數(shù)據(jù)三元組:
令模型學(xué)習(xí)到試題-知識點相關(guān)性矩陣,并能夠保持所定義的偏序關(guān)系,即極大化試題-知識點相關(guān)性矩陣v在給定偏序關(guān)系
上式中,
對試題-知識點相關(guān)性矩陣v的后驗概率同時取對數(shù)可以得到如下形式:
上式中,λ為正則化參數(shù);
加入偏序關(guān)系之后,對于某次考試,能夠得到各學(xué)生的一維知識點掌握程度,再基于學(xué)習(xí)曲線與遺忘曲線來捕捉某一學(xué)生不同考試的能力值變化;
假設(shè)學(xué)生i在第t個時間段的能力值服從均值為
上式中,
第t時間段學(xué)生i對知識點k的掌握程度的計算公式為:
其中,αi為學(xué)生i的個性化參數(shù),
學(xué)生i在第t個時間段的遺忘部分
其中,
學(xué)生i在第t時間段的學(xué)習(xí)部分
其中,
該方法還包括:
結(jié)合偏序關(guān)系,遺忘,以及學(xué)習(xí)三個部分,得到模型最終的損失函數(shù)e:
其中,λu與λv均為正則化參數(shù),iij表示學(xué)生i是否做過試題j,iij=1代表學(xué)生i做過試題j,否則表示沒做過我們可以根據(jù)上式定義的損失函數(shù);
采用梯度下降的更新算法,在每一輪迭代中,分別利用損失函數(shù)對知識點掌握程度參數(shù)u、試題-知識點相關(guān)程度參數(shù)v、每個學(xué)生個性化參數(shù)α、以及試題的難度參數(shù)b求偏導(dǎo)數(shù),并進行參數(shù)更新和求解,直至模型收斂,最終輸出學(xué)生在1~t個時間段內(nèi)的知識點掌握程度,以及經(jīng)過偏序限制得到的試題-知識點相關(guān)矩陣。
根據(jù)知識點掌握程度以及經(jīng)過偏序限制后的試題-知識點相關(guān)性矩陣對某一學(xué)生下一時間段的知識點掌握程度以及所做試題上的得分進行預(yù)測包括:
能力向量包含了第t時間段學(xué)生i對知識點1~k的掌握程度
其中,
第t+1個時間段學(xué)生i的得分預(yù)測公式為:
其中,
由上述本發(fā)明提供的技術(shù)方案可以看出,針對學(xué)生歷史答題信息,按照時間段進行劃分,運用類似項目反應(yīng)理論irt的形式結(jié)合教育學(xué)領(lǐng)域的先驗知識(q矩陣)將學(xué)生的能力值對應(yīng)到一個時間段所考察的每一維知識點上;對于不同時間段之間的知識點掌握程度的變化,該方法引入教育學(xué)領(lǐng)域兩大經(jīng)典理論—遺忘曲線和學(xué)習(xí)曲線對學(xué)生不同時間段的知識點維度進行建模,進而更加準(zhǔn)確地診斷分析學(xué)生在不同時間段時知識點掌握程度的變化情況(遺忘較多還是學(xué)習(xí)進步較多),彌補了現(xiàn)有方法缺乏動態(tài)性和極強解釋性的弊端。
附圖說明
為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他附圖。
圖1為本發(fā)明實施例提供的一種時序化的學(xué)生認知診斷方法的流程圖。
具體實施方式
下面結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明的保護范圍。
實施例
本發(fā)明實施例提供一種時序化的學(xué)生認知診斷方法,如圖1所示,其主要包括如下步驟:
步驟11、獲取多個學(xué)生的歷史答題信息。
每一學(xué)生的歷史答題信息可以包括:包括答題時間、已答題目所涉及的知識點(q矩陣)和各技能考查情況(即題目信息)、以及用戶的答題結(jié)果(對或錯)等。所述題目信息以及q矩陣由教育學(xué)專家預(yù)先標(biāo)注所得,每一學(xué)生的歷史答題信息可從在線學(xué)習(xí)平臺智學(xué)網(wǎng)獲得。
步驟12、根據(jù)獲取到的歷史答題信息使用時序化認知診斷方法進行建模,獲得知識點掌握程度以及經(jīng)過偏序限制后的試題-知識點相關(guān)性矩陣。
首先要初始化知識點掌握程度參數(shù)u、試題-知識點相關(guān)性矩陣v,以及試題的難度參數(shù)b,則在已知參數(shù)u、v、b之后,學(xué)生獲得得分為r的概率可以表示為:
其中,
在上式中,學(xué)生的能力向量u是沒有實際意義的,為了實現(xiàn)將學(xué)生的能力向量u對應(yīng)到相應(yīng)的知識點上,給定試題關(guān)聯(lián)的q矩陣,|q|=m×k:
其中,k為知識點數(shù)量;
定義如下偏序關(guān)系:對于試題j,如果其與知識點q的關(guān)系為qjq=1,與知識點p的關(guān)系為qjp=0,則認為對于試題j,知識點q比知識點p更相關(guān);
則有:
上式中,
將給定的q矩陣,轉(zhuǎn)換得到訓(xùn)練數(shù)據(jù)三元組:dt:(m×k×k)
這相當(dāng)于極大化試題-知識點相關(guān)性矩陣v在給定偏序關(guān)系
上式中,
對試題-知識點相關(guān)性矩陣v的后驗概率同時取對數(shù)可以得到如下形式:
其中
加入偏序關(guān)系之后,對于某次考試,能夠得到各個學(xué)生的一維知識點掌握程度,為了實現(xiàn)時序化的建模,kpt模型參考教育學(xué)領(lǐng)域的兩大經(jīng)典理論:學(xué)習(xí)曲線和遺忘曲線來捕捉某一學(xué)生不同考試的能力值變化;具體如下:
假設(shè)學(xué)生i在第t個時間段內(nèi)的知識點掌握程度服從均值為
其中
在第t個時間段內(nèi),學(xué)生i對知識點k的掌握程度的計算公式為:
其中,αi為學(xué)生i的個性化參數(shù),
對于遺忘部分,艾賓浩斯遺忘曲線認為人的記憶力隨時間的推遲遺忘幅度會逐漸減小,借鑒這個思想,學(xué)生i在第t個時間段的遺忘部分
其中,
而知識或者技能的掌握會隨著練習(xí)次數(shù)的增加先迅速升高再逐漸趨于平緩,具體的,學(xué)生i在第t個時間段的學(xué)習(xí)部分
其中,
結(jié)合偏序關(guān)系,遺忘,以及學(xué)習(xí)三個部分,我們可以得到模型最終的損失函數(shù)e如下公式所示:
其中,λu與λv均為正則化參數(shù),iij表示學(xué)生i是否做過試題j,iij=1代表學(xué)生i做過試題j,否則表示沒做過。我們可以根據(jù)上式定義的損失函數(shù),采用梯度下降的更新算法,在每一輪迭代中,分別利用損失函數(shù)對學(xué)生的知識點掌握程度參數(shù)u、試題-知識點相關(guān)程度參數(shù)v、每個學(xué)生個性化參數(shù)α、以及試題的難度參數(shù)b求偏導(dǎo)數(shù),并進行參數(shù)更新和求解,直至模型收斂,會輸出學(xué)生在1~t個時間段內(nèi)的知識點掌握程度,以及經(jīng)過偏序限制得到的試題-知識點相關(guān)矩陣。能力向量是對學(xué)生在這t個時間段的長期動態(tài)診斷結(jié)果,可以幫助學(xué)生對于過去這段時間的學(xué)習(xí)狀態(tài)做詳細的總結(jié),同時制定下階段的針對性學(xué)習(xí)策略。
步驟13、根據(jù)知識點掌握程度以及經(jīng)過偏序限制后的試題-知識點相關(guān)性矩陣對某一學(xué)生下一時間段的知識點掌握程度以及所做試題上的得分進行預(yù)測。
能力向量包含了在第t個時間段內(nèi),學(xué)生i對知識點1~k的掌握程度
其中,
第t+1時間段,學(xué)生i在所做試題上的得分預(yù)測公式為:
其中,
本發(fā)明上述方案,針對學(xué)生歷史答題信息,按照時間段進行劃分,運用類似項目反應(yīng)理論irt的形式結(jié)合教育學(xué)領(lǐng)域的先驗知識(q矩陣)將學(xué)生的能力值對應(yīng)到一場考試所考察的每一維知識點上;對于不同時間段之間的知識點掌握程度的變化,該方法引入教育學(xué)領(lǐng)域兩大經(jīng)典理論—遺忘曲線和學(xué)習(xí)曲線對學(xué)生不同時間段內(nèi)的知識點維度進行建模,進而更加準(zhǔn)確地診斷分析學(xué)生在不同時間段內(nèi)知識點掌握程度的變化情況(遺忘較多還是學(xué)習(xí)進步較多),彌補了現(xiàn)有方法缺乏動態(tài)性和極強解釋性的弊端。
通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實施例可以通過軟件實現(xiàn),也可以借助軟件加必要的通用硬件平臺的方式來實現(xiàn)?;谶@樣的理解,上述實施例的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來,該軟件產(chǎn)品可以存儲在一個非易失性存儲介質(zhì)(可以是cd-rom,u盤,移動硬盤等)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述的方法。
以上所述,僅為本發(fā)明較佳的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明披露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)該以權(quán)利要求書的保護范圍為準(zhǔn)。