>[0112] 步驟406,根據(jù)待驗(yàn)證用戶證據(jù)數(shù)據(jù)和獲得的證據(jù)驗(yàn)證結(jié)果提取對(duì)應(yīng)預(yù)設(shè)分類條 件特征的待驗(yàn)證特征值。
[0113] 根據(jù)待驗(yàn)證用戶證據(jù)數(shù)據(jù)和其所對(duì)應(yīng)的證據(jù)驗(yàn)證結(jié)果,來提取相應(yīng)的對(duì)應(yīng)預(yù)設(shè)分 類條件特征的待驗(yàn)證特征值。這里提取的預(yù)設(shè)分類條件特征的種類與待驗(yàn)證用戶證據(jù)數(shù)據(jù) 的種類相關(guān)。一個(gè)待驗(yàn)證用戶證據(jù)數(shù)據(jù)可以提取對(duì)應(yīng)多個(gè)預(yù)設(shè)分類條件特征的待驗(yàn)證特征 值。
[0114] 舉例說明,若一種待驗(yàn)證用戶證據(jù)數(shù)據(jù)為兩個(gè)歷史密碼數(shù)據(jù),證據(jù)驗(yàn)證結(jié)果為兩 個(gè)歷史密碼數(shù)據(jù)一個(gè)正確而另一個(gè)錯(cuò)誤。相應(yīng)的預(yù)設(shè)分類條件特征為"是否有正確的歷史 密碼數(shù)據(jù)"和"正確的歷史密碼數(shù)據(jù)的個(gè)數(shù)是否為2個(gè)以上",則提取的對(duì)應(yīng)這兩個(gè)預(yù)設(shè)分 類條件特征的待驗(yàn)證特征值分別為"是"和"否"。
[0115] 步驟408,從決策樹分類器的根結(jié)點(diǎn)處的分類條件開始,根據(jù)對(duì)應(yīng)預(yù)設(shè)分類條件特 征的待驗(yàn)證特征值逐層判斷分類直至葉結(jié)點(diǎn),根據(jù)該葉結(jié)點(diǎn)處的用戶身份分類結(jié)果確定對(duì) 應(yīng)待驗(yàn)證用戶標(biāo)識(shí)的身份驗(yàn)證結(jié)果。
[0116] 具體地,根據(jù)對(duì)應(yīng)預(yù)設(shè)分類條件特征的待驗(yàn)證特征值,先根據(jù)決策樹分類器的根 結(jié)點(diǎn)處的分類條件來判斷分類,到達(dá)根結(jié)點(diǎn)的一個(gè)孩子結(jié)點(diǎn),然后再依據(jù)根結(jié)點(diǎn)的孩子結(jié) 點(diǎn)處的分類條件來判斷分類,到達(dá)第三層的結(jié)點(diǎn),依此類推。直至葉結(jié)點(diǎn)時(shí)若找到一條葉結(jié) 點(diǎn)處的身份分類結(jié)果為合法用戶的判斷路徑,則確定該次身份驗(yàn)證的身份驗(yàn)證結(jié)果為合法 用戶或者身份驗(yàn)證通過。若無法找到任何一條葉結(jié)點(diǎn)處的身份分類結(jié)果為合法用戶的判斷 路徑,則確定該次身份驗(yàn)證的身份驗(yàn)證結(jié)果為非法用戶或者身份驗(yàn)證未通過。在一個(gè)實(shí)施 例中,決策樹分類器根據(jù)上述任一實(shí)施例中的分類器訓(xùn)練方法訓(xùn)練獲得。
[0117] 上述身份驗(yàn)證方法,身份驗(yàn)證服務(wù)器響應(yīng)于用戶終端的身份驗(yàn)證請(qǐng)求進(jìn)行身份驗(yàn) 證,先對(duì)身份驗(yàn)證請(qǐng)求所攜帶的待驗(yàn)證用戶證據(jù)數(shù)據(jù)進(jìn)行驗(yàn)證,再根據(jù)該驗(yàn)證結(jié)果提取預(yù) 設(shè)分類條件特征所對(duì)應(yīng)的待驗(yàn)證特征值,從而利用決策樹分類器從根結(jié)點(diǎn)處的分類條件開 始,根據(jù)每種預(yù)設(shè)分類條件特征所對(duì)應(yīng)的待驗(yàn)證特征值逐層判斷分類直至獲得身份驗(yàn)證結(jié) 果。這樣進(jìn)行身份驗(yàn)證不僅考慮了每個(gè)待驗(yàn)證用戶證據(jù)的各自的對(duì)錯(cuò),還考慮了各種預(yù)設(shè) 分類條件特征所對(duì)應(yīng)的待驗(yàn)證特征值彼此之間的相關(guān)性,身份驗(yàn)證結(jié)果準(zhǔn)確性高。
[0118] 下面用另一個(gè)具體應(yīng)用場景來說明上述身份驗(yàn)證方法的原理,該應(yīng)用場景以該身 份驗(yàn)證方法應(yīng)用于身份驗(yàn)證服務(wù)器來舉例說明。具體包括如下步驟:
[0119] 將上述訓(xùn)練獲得的決策樹分類器應(yīng)用于上述身份驗(yàn)證方法中以進(jìn)行身份驗(yàn)證,首 先身份驗(yàn)證服務(wù)器接收用戶終端發(fā)來的攜帶有待驗(yàn)證用戶標(biāo)識(shí)和待驗(yàn)證用戶證據(jù)數(shù)據(jù)的 身份驗(yàn)證請(qǐng)求。然后獲取對(duì)應(yīng)待驗(yàn)證用戶標(biāo)識(shí)的用戶數(shù)據(jù),根據(jù)獲取的用戶數(shù)據(jù)對(duì)待驗(yàn)證 用戶證據(jù)數(shù)據(jù)進(jìn)行驗(yàn)證而獲得證據(jù)驗(yàn)證結(jié)果。比如用戶提交的待驗(yàn)證用戶證據(jù)數(shù)據(jù)和據(jù)以 獲得的證據(jù)驗(yàn)證結(jié)果如表三所示:
[0122] 根據(jù)待驗(yàn)證用戶證據(jù)數(shù)據(jù)和獲得的證據(jù)驗(yàn)證結(jié)果提取對(duì)應(yīng)預(yù)設(shè)分類條件特征的 待驗(yàn)證特征值,比如根據(jù)表三中的待驗(yàn)證用戶證據(jù)數(shù)據(jù)和相應(yīng)的證據(jù)驗(yàn)證結(jié)果提取的對(duì)應(yīng) 預(yù)設(shè)分類條件特征的待驗(yàn)證特征值如表四所示:
[0123] 表四:
[0124]
[0125] 從決策樹分類器的根結(jié)點(diǎn)處的分類條件開始,根據(jù)對(duì)應(yīng)預(yù)設(shè)分類條件特征的待驗(yàn) 證特征值逐層判斷分類直至葉結(jié)點(diǎn),該葉結(jié)點(diǎn)處的用戶身份分類結(jié)果為身份驗(yàn)證通過,則 確定此次對(duì)應(yīng)待驗(yàn)證用戶標(biāo)識(shí)的身份驗(yàn)證的身份驗(yàn)證結(jié)果為身份驗(yàn)證通過。此時(shí)可通過預(yù) 設(shè)通信方式,比如電子郵件、短信等告知提出身份驗(yàn)證請(qǐng)求的用戶身份驗(yàn)證通過,并引導(dǎo)其 修改對(duì)應(yīng)該待驗(yàn)證用戶標(biāo)識(shí)的登錄口令。
[0126] 如圖6所示,在一個(gè)實(shí)施例中,提供了一種分類器訓(xùn)練裝置,該裝置包括訓(xùn)練樣本 集獲取模塊602、根結(jié)點(diǎn)訓(xùn)練模塊604、內(nèi)部結(jié)點(diǎn)訓(xùn)練模塊606和葉結(jié)點(diǎn)訓(xùn)練模塊608。
[0127] 訓(xùn)練樣本集獲取模塊602,用于獲取訓(xùn)練樣本集;訓(xùn)練樣本集中的每個(gè)訓(xùn)練樣本 包括用戶身份屬性和對(duì)應(yīng)預(yù)設(shè)分類條件特征的特征值。
[0128] 訓(xùn)練樣本集是用于訓(xùn)練決策樹分類器的訓(xùn)練樣本的集合,其中的每個(gè)訓(xùn)練樣本包 括用戶身份屬性和預(yù)設(shè)分類條件特征各自對(duì)應(yīng)的特征值,且預(yù)設(shè)分類條件特征的種類數(shù)為 兩個(gè)以上。用戶身份屬性為合法用戶和非法用戶中的一種,分別表示相應(yīng)的訓(xùn)練樣本是通 過或未通過身份驗(yàn)證的樣本數(shù)據(jù)。訓(xùn)練樣本集中既存在用戶身份屬性為合法用戶的訓(xùn)練樣 本,也存在用戶身份屬性為非法用戶的訓(xùn)練樣本。
[0129] 在一個(gè)實(shí)施例中,預(yù)設(shè)分類條件特征可以包括但不限于是否有好友輔助驗(yàn)證,參 與好友輔助驗(yàn)證且輔助驗(yàn)證通過的好友個(gè)數(shù)是否超過預(yù)設(shè)個(gè)數(shù)閾值,是否有正確的歷史密 碼數(shù)據(jù)、正確的歷史密碼數(shù)據(jù)的量化分?jǐn)?shù)是否超過第一預(yù)設(shè)分?jǐn)?shù)閾值、是否有正確的賬號(hào) 常用地信息、正確的賬號(hào)常用地信息的量化分?jǐn)?shù)是否超過第二預(yù)設(shè)分?jǐn)?shù)閾值,用戶是否處 于國外異地和密碼變更次數(shù)是否在預(yù)設(shè)次數(shù)范圍內(nèi)中的至少兩種。特征值是相應(yīng)的預(yù)設(shè)分 類條件特征的具體取值,但并非限定其必須用數(shù)值表示。
[0130] 根結(jié)點(diǎn)訓(xùn)練模塊604,用于根據(jù)一種預(yù)設(shè)分類條件特征確定根結(jié)點(diǎn)處的分類條件, 根據(jù)根結(jié)點(diǎn)處的分類條件將訓(xùn)練樣本集中的訓(xùn)練樣本進(jìn)行分類,獲得對(duì)應(yīng)根結(jié)點(diǎn)的孩子結(jié) 點(diǎn)的分類子集;將根結(jié)點(diǎn)的孩子結(jié)點(diǎn)作為當(dāng)前結(jié)點(diǎn)。
[0131] 對(duì)決策樹的訓(xùn)練從根結(jié)點(diǎn)開始,根結(jié)點(diǎn)訓(xùn)練模塊604具體用于根據(jù)訓(xùn)練樣本集中 的訓(xùn)練樣本的多種預(yù)設(shè)分類條件特征中選擇的一種來確定根結(jié)點(diǎn)處的分類條件。最終訓(xùn)練 獲得的決策樹分類器包括若干結(jié)點(diǎn),其中非葉結(jié)點(diǎn)處對(duì)應(yīng)有分類條件,而葉結(jié)點(diǎn)處則對(duì)應(yīng) 有用戶身份分類結(jié)果。
[0132] 確定根結(jié)點(diǎn)處的分類條件后,根結(jié)點(diǎn)訓(xùn)練模塊604可用于根據(jù)根結(jié)點(diǎn)處的分類條 件,或者依據(jù)用于確定根結(jié)點(diǎn)處的分類條件的預(yù)設(shè)分類條件特征來將訓(xùn)練樣本集中的訓(xùn)練 樣本進(jìn)行分類,從而獲得對(duì)應(yīng)根結(jié)點(diǎn)的孩子結(jié)點(diǎn)的分類子集,根結(jié)點(diǎn)的每個(gè)孩子結(jié)點(diǎn)對(duì)應(yīng) 一個(gè)分類子集。這樣獲得的每個(gè)分類子集中的訓(xùn)練樣本的對(duì)應(yīng)用于確定根結(jié)點(diǎn)處的分類條 件的預(yù)設(shè)分類條件特征的特征值都相同。
[0133] 在一個(gè)實(shí)施例中,根結(jié)點(diǎn)訓(xùn)練模塊604可用于先根據(jù)訓(xùn)練樣本集中用戶身份屬性 為合法用戶和非法用戶的訓(xùn)練樣本的數(shù)量來計(jì)算決策信息熵,然后計(jì)算訓(xùn)練樣本集中每種 預(yù)設(shè)分類條件特征的每種特征值所對(duì)應(yīng)的分類信息熵并據(jù)以計(jì)算平均信息期望,然后再用 決策信息熵減去平均信息期望來計(jì)算信息增益,根據(jù)信息增益最大的預(yù)設(shè)分類條件特征來 確定根結(jié)點(diǎn)處的分類條件。
[0134] 在一個(gè)實(shí)施例中,根結(jié)點(diǎn)訓(xùn)練模塊604可用于統(tǒng)計(jì)訓(xùn)練樣本集中每種預(yù)設(shè)分類條 件特征的每種特征值所對(duì)應(yīng)的用戶身份屬性為合法用戶的訓(xùn)練樣本的數(shù)量,根據(jù)訓(xùn)練樣本 集中對(duì)應(yīng)統(tǒng)計(jì)的數(shù)量最多的特征值所對(duì)應(yīng)的預(yù)設(shè)分類條件特征來確定根結(jié)點(diǎn)處的分類條 件。本實(shí)施例中,根結(jié)點(diǎn)訓(xùn)練模塊604用于在訓(xùn)練樣本集的范圍內(nèi),統(tǒng)計(jì)每種預(yù)設(shè)分類條件 特征的每種特征值所對(duì)應(yīng)的用戶屬性為合法用戶的訓(xùn)練樣本的數(shù)量,對(duì)應(yīng)統(tǒng)計(jì)的數(shù)量最多 的特征值所對(duì)應(yīng)的預(yù)設(shè)分類條件特征具有更好的識(shí)別出合法用戶的性能。這里選擇預(yù)設(shè)分 類條件特征時(shí)傾向于能夠更好的識(shí)別出合法用戶的預(yù)設(shè)分類條件特征,這樣根據(jù)對(duì)應(yīng)統(tǒng)計(jì) 的數(shù)量最多的特征值所對(duì)應(yīng)的預(yù)設(shè)分類條件特征來確定根結(jié)點(diǎn)處的分類條件,使得根結(jié)點(diǎn) 處的分類條件能夠更好地區(qū)分出合法用戶。
[0135] 當(dāng)前結(jié)點(diǎn)是指當(dāng)前要訓(xùn)練的結(jié)點(diǎn),將根結(jié)點(diǎn)作為當(dāng)前結(jié)點(diǎn)是對(duì)當(dāng)前結(jié)點(diǎn)賦初值, 從而便于對(duì)當(dāng)前結(jié)點(diǎn)進(jìn)行循環(huán)處理。
[0136] 內(nèi)部結(jié)點(diǎn)訓(xùn)練模塊606,用于根據(jù)另一種預(yù)設(shè)分類條件特征確定當(dāng)前結(jié)點(diǎn)處的分 類條件,根據(jù)當(dāng)前結(jié)點(diǎn)處的分類條件對(duì)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類子集中的訓(xùn)練樣本進(jìn)行分 類,獲得對(duì)應(yīng)當(dāng)前結(jié)點(diǎn)的孩子結(jié)點(diǎn)的分類子集;還用于將當(dāng)前結(jié)點(diǎn)的孩子結(jié)點(diǎn)作為當(dāng)前結(jié) 點(diǎn),繼續(xù)執(zhí)行根據(jù)另一種預(yù)設(shè)分類條件特征確定當(dāng)前結(jié)點(diǎn)處的分類條件,根據(jù)當(dāng)前結(jié)點(diǎn)處 的分類條件對(duì)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類子集中的訓(xùn)練樣本進(jìn)行分類,獲得對(duì)應(yīng)當(dāng)前結(jié)點(diǎn)的孩 子結(jié)點(diǎn)的分類子集,直至當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類子集中各個(gè)訓(xùn)練樣本的相同的預(yù)設(shè)分類條 件特征所對(duì)應(yīng)的特征值分別相同或者當(dāng)前結(jié)點(diǎn)的層數(shù)達(dá)到指定層數(shù)。
[0137] 另一種預(yù)設(shè)分類條件特征是指區(qū)別于用于確定當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的當(dāng)前路徑中的 各個(gè)結(jié)點(diǎn)處的分類條件的預(yù)設(shè)分類條件特征的預(yù)設(shè)分類條件特征。當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的當(dāng)前 路徑是指從根結(jié)點(diǎn)開始到當(dāng)前結(jié)點(diǎn)的路徑,若當(dāng)前結(jié)點(diǎn)為根結(jié)點(diǎn),則當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的當(dāng) 前路徑為根結(jié)點(diǎn)本身。內(nèi)部結(jié)點(diǎn)訓(xùn)練模塊606用于根據(jù)另一種預(yù)設(shè)分類條件特征確定當(dāng)前 結(jié)點(diǎn)處的分類條件后,再依據(jù)當(dāng)前結(jié)點(diǎn)處的分類條件或用于確定當(dāng)前結(jié)點(diǎn)處的分類條件的 預(yù)設(shè)分類條件特征來將當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類子集分類,從而獲得對(duì)應(yīng)當(dāng)前結(jié)點(diǎn)的孩子結(jié) 點(diǎn)的分類子集,當(dāng)前結(jié)點(diǎn)的每個(gè)孩子結(jié)點(diǎn)對(duì)應(yīng)一個(gè)分類子集。這樣獲得的每個(gè)分類子集中 的訓(xùn)練樣本的對(duì)應(yīng)用于確定根結(jié)點(diǎn)處的分類條件的預(yù)設(shè)分類條件特征的特征值都相同。
[0138] 在一個(gè)實(shí)施例中,內(nèi)部結(jié)點(diǎn)訓(xùn)練模塊606可用于對(duì)于當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的當(dāng)前路 徑,除去已用于確定當(dāng)前路徑中的各個(gè)結(jié)點(diǎn)處的分類條件的預(yù)設(shè)分類條件特征后,得到剩 余預(yù)設(shè)分類條件特征;然后根據(jù)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類子集中用戶身份屬性為合法用戶和 非法用戶的訓(xùn)練樣本的數(shù)量來計(jì)算對(duì)應(yīng)當(dāng)前結(jié)點(diǎn)的決策信息熵,然后計(jì)算當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng) 的分類子集中每種剩余預(yù)設(shè)分類條件特征的每種特征值所對(duì)應(yīng)的分類信息熵并據(jù)以計(jì)算 平均信息期望,然后再用當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的決策信息熵減去該平均信息期望來計(jì)算信息增 益,從而根據(jù)信息增益最大的剩余預(yù)設(shè)分類條件特征來確定當(dāng)前結(jié)點(diǎn)處的分類條件。
[0139] 在一個(gè)實(shí)施例中,內(nèi)部結(jié)點(diǎn)訓(xùn)練模塊606可用于確定當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的除去已用 于確定當(dāng)前路徑中的結(jié)點(diǎn)處的分類條件的預(yù)設(shè)分類條件特征的剩余預(yù)設(shè)分類條件特征,統(tǒng) 計(jì)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類子集中每種剩余預(yù)設(shè)分類條件特征的每種特征值所對(duì)應(yīng)的用戶 身份屬性為合法用戶的訓(xùn)練樣本的數(shù)量,根據(jù)當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的統(tǒng)計(jì)的數(shù)量最多的特征值 所對(duì)應(yīng)的剩余預(yù)設(shè)分類條件特征來確定當(dāng)前結(jié)點(diǎn)處的分類條件。
[0140] 具體地,對(duì)于當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的當(dāng)前路徑,內(nèi)部結(jié)點(diǎn)訓(xùn)練模塊606用于除去已用 于確定當(dāng)前路徑中的各個(gè)結(jié)點(diǎn)處的分類條件的預(yù)設(shè)分類條件特征后,得到剩余預(yù)設(shè)分類條 件特征。內(nèi)部結(jié)點(diǎn)訓(xùn)練模塊606用于在當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類子集的范圍內(nèi),統(tǒng)計(jì)每種剩 余預(yù)設(shè)分類條件特征的每種特征值所對(duì)應(yīng)的用戶屬性為合法用戶的訓(xùn)練樣本的數(shù)量,這樣 在當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類子集的范圍內(nèi),對(duì)應(yīng)統(tǒng)計(jì)的數(shù)量最多的特征值所對(duì)應(yīng)的剩余預(yù)設(shè) 分類條件特征具有更好的識(shí)別出合法用戶的性能。內(nèi)部結(jié)點(diǎn)訓(xùn)練模塊606用于根據(jù)對(duì)應(yīng)統(tǒng) 計(jì)的數(shù)量最多的特征值所對(duì)應(yīng)的剩余預(yù)設(shè)分類條件特征來確定當(dāng)前結(jié)點(diǎn)處的分類條件,使 得當(dāng)前結(jié)點(diǎn)處的分類條件能夠更好地區(qū)分出合法用戶。
[0141] 確定當(dāng)前結(jié)點(diǎn)處的分類條件后,需要進(jìn)一步訓(xùn)練當(dāng)前結(jié)點(diǎn)的孩子結(jié)點(diǎn),將當(dāng)前結(jié) 點(diǎn)的每個(gè)孩子結(jié)點(diǎn)分別作為當(dāng)前結(jié)點(diǎn)進(jìn)行訓(xùn)練。內(nèi)部結(jié)點(diǎn)訓(xùn)練模塊606用于判斷是否結(jié)束 循環(huán),若對(duì)于當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類子集中的訓(xùn)練樣本,對(duì)應(yīng)相同的預(yù)設(shè)分類條件特征的 特征值分別是相同的,說明當(dāng)前結(jié)點(diǎn)所對(duì)應(yīng)的分類子集中的訓(xùn)練樣本已經(jīng)無法依據(jù)預(yù)設(shè)分 類條件特征進(jìn)行進(jìn)一步分