国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置、存儲(chǔ)設(shè)備及網(wǎng)絡(luò)設(shè)備與流程

      文檔序號(hào):11515438閱讀:323來源:國(guó)知局
      數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置、存儲(chǔ)設(shè)備及網(wǎng)絡(luò)設(shè)備與流程

      本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及基于機(jī)器學(xué)習(xí)的數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)處理方法、一種數(shù)據(jù)處理裝置、一種存儲(chǔ)設(shè)備及一種網(wǎng)絡(luò)設(shè)備。



      背景技術(shù):

      帶標(biāo)注結(jié)果的樣本數(shù)據(jù)如標(biāo)注了人臉位置的圖像數(shù)據(jù),或標(biāo)注了人臉表情的圖像數(shù)據(jù),或標(biāo)注了人物年齡的語(yǔ)音數(shù)據(jù)等是用于機(jī)器進(jìn)行訓(xùn)練學(xué)習(xí)的對(duì)象,是機(jī)器學(xué)習(xí)的基礎(chǔ)。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,基于機(jī)器學(xué)習(xí)的各類互聯(lián)網(wǎng)系統(tǒng)對(duì)樣本數(shù)據(jù)的需求日益增大;例如:隨著深度神經(jīng)網(wǎng)絡(luò)的層級(jí)數(shù)量的增加,深度神經(jīng)網(wǎng)絡(luò)需要的樣本數(shù)據(jù)的數(shù)量可能達(dá)到數(shù)億;再如:社交推薦系統(tǒng)為了獲得較為精準(zhǔn)有效的社交推薦,其可能需要的樣本數(shù)據(jù)的數(shù)量甚至可達(dá)數(shù)千億。然而,與大需求相矛盾的互聯(lián)網(wǎng)現(xiàn)狀則是普遍缺乏樣本數(shù)據(jù),造成此矛盾問題的主要原因,是目前樣本數(shù)據(jù)的標(biāo)注過程由專門的標(biāo)注人員人工完成,成本較高且使得互聯(lián)網(wǎng)中的樣本數(shù)據(jù)稀缺匱乏。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置、存儲(chǔ)設(shè)備及網(wǎng)絡(luò)設(shè)備,能夠降低樣本數(shù)據(jù)的標(biāo)注成本,擴(kuò)充互聯(lián)網(wǎng)中樣本數(shù)據(jù)的數(shù)量。

      一方面,本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理方法,可包括:

      獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);

      向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注;

      采集所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù);

      采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

      優(yōu)選地,所述驗(yàn)證系統(tǒng)包括標(biāo)注模式和驗(yàn)證模式,且所述驗(yàn)證系統(tǒng)包含樣本庫(kù)和素材庫(kù);

      所述樣本庫(kù)包括至少一條樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;所述素材庫(kù)包括至少一個(gè)素材數(shù)據(jù),所述素材數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;

      所述標(biāo)注模式用于對(duì)所述樣本庫(kù)中的各樣本數(shù)據(jù)進(jìn)行標(biāo)注;所述驗(yàn)證模式用于采用所述素材庫(kù)中的各素材數(shù)據(jù)對(duì)進(jìn)入驗(yàn)證系統(tǒng)的用戶進(jìn)行身份驗(yàn)證。

      優(yōu)選地,所述獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù)之前,還包括:

      當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶;

      若進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶,則啟動(dòng)驗(yàn)證系統(tǒng)的標(biāo)注模式,并在所述標(biāo)注模式下獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);

      若進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶,則啟動(dòng)驗(yàn)證系統(tǒng)的驗(yàn)證模式,并在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述進(jìn)入驗(yàn)證系統(tǒng)的用戶進(jìn)行身份驗(yàn)證。

      優(yōu)選地,所述當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶,包括:

      當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的歷史標(biāo)注信息,所述歷史標(biāo)注信息記錄了所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的標(biāo)注模式下對(duì)所述樣本庫(kù)中的樣本數(shù)據(jù)進(jìn)行標(biāo)注的頻次;

      若所述頻次小于預(yù)設(shè)第一閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;

      若所述頻次大于或等于第一預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      優(yōu)選地,所述當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶,包括:

      當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的標(biāo)識(shí);

      若所述標(biāo)識(shí)為預(yù)設(shè)的備選用戶標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;

      若所述標(biāo)識(shí)并非預(yù)設(shè)的備選用戶標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      優(yōu)選地,所述當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶,包括:

      當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的歷史驗(yàn)證信息,所述歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率;

      若所述成功率大于或等于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;

      若所述成功率小于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      優(yōu)選地,所述向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注,包括:

      為所述目標(biāo)樣本數(shù)據(jù)設(shè)置標(biāo)注方式,所述標(biāo)注方式包括以下任一種:選擇方式和輸入方式;

      若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,向所述至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),并將所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)待選標(biāo)注數(shù)據(jù)輸出至所述至少一個(gè)目標(biāo)用戶進(jìn)行選擇;

      若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為輸入方式,向所述至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),并顯示輸入框以使所述至少一個(gè)目標(biāo)用戶在所述輸入框輸入所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

      優(yōu)選地,所述采集所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù)之后,還包括:

      向所述至少一個(gè)目標(biāo)用戶輸出驗(yàn)證失敗提示信息,并從所述標(biāo)注模式切換至所述驗(yàn)證模式;

      在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述至少一個(gè)目標(biāo)用戶進(jìn)行身份驗(yàn)證。

      優(yōu)選地,所述采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果之后,還包括:

      將所述目標(biāo)樣本數(shù)據(jù)及其標(biāo)注結(jié)果作為新的素材數(shù)據(jù)添加至所述素材庫(kù)中。

      另一方面,本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理裝置,可包括:

      獲取單元,用于獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);

      輸出單元,用于向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注;

      采集單元,用于采集所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù);

      學(xué)習(xí)單元,用于采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

      優(yōu)選地,所述驗(yàn)證系統(tǒng)包括標(biāo)注模式和驗(yàn)證模式,且所述驗(yàn)證系統(tǒng)包含樣本庫(kù)和素材庫(kù);

      所述樣本庫(kù)包括至少一條樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;所述素材庫(kù)包括至少一個(gè)素材數(shù)據(jù),所述素材數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;

      所述標(biāo)注模式用于對(duì)所述樣本庫(kù)中的各樣本數(shù)據(jù)進(jìn)行標(biāo)注;所述驗(yàn)證模式用于采用所述素材庫(kù)中的各素材數(shù)據(jù)對(duì)進(jìn)入驗(yàn)證系統(tǒng)的用戶進(jìn)行身份驗(yàn)證。

      優(yōu)選地,該數(shù)據(jù)處理裝置還包括:

      判斷單元,用于當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶;

      處理單元,用于若進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶,則啟動(dòng)驗(yàn)證系統(tǒng)的標(biāo)注模式,并在所述標(biāo)注模式下通知所述獲取單元獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);或者用于若進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶,則啟動(dòng)驗(yàn)證系統(tǒng)的驗(yàn)證模式,并在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述進(jìn)入驗(yàn)證系統(tǒng)的用戶進(jìn)行身份驗(yàn)證。

      優(yōu)選地,在一種實(shí)施方式中,所述判斷單元包括:

      第一信息獲取單元,用于當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的歷史標(biāo)注信息,所述歷史標(biāo)注信息記錄了所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的標(biāo)注模式下對(duì)所述樣本庫(kù)中的樣本數(shù)據(jù)進(jìn)行標(biāo)注的頻次;

      第一確定單元,用于若所述頻次小于預(yù)設(shè)第一閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;或用于若所述頻次大于或等于第一預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      優(yōu)選地,在另一種實(shí)施方式中,所述判斷單元包括:

      標(biāo)識(shí)獲取單元,用于當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的標(biāo)識(shí);

      第二確定單元,用于若所述標(biāo)識(shí)為預(yù)設(shè)的備選用戶標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;或用于若所述標(biāo)識(shí)并非預(yù)設(shè)的備選用戶標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      優(yōu)選地,在又一種實(shí)施方式中,所述判斷單元包括:

      第二信息獲取單元,用于當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的歷史驗(yàn)證信息,所述歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率;

      第三確定單元,用于若所述成功率大于或等于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;或用于若所述成功率小于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      優(yōu)選地,所述輸出單元包括:

      方式設(shè)置單元,用于為所述目標(biāo)樣本數(shù)據(jù)設(shè)置標(biāo)注方式,所述標(biāo)注方式包括以下任一種:選擇方式和輸入方式;

      數(shù)據(jù)輸出單元,用于若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,向所述至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),并將所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)待選標(biāo)注數(shù)據(jù)輸出至所述至少一個(gè)目標(biāo)用戶進(jìn)行選擇;或用于若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為輸入方式,向所述至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),并顯示輸入框以使所述至少一個(gè)目標(biāo)用戶在所述輸入框輸入所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

      優(yōu)選地,該數(shù)據(jù)處理裝置還包括:

      提示單元,用于向所述至少一個(gè)目標(biāo)用戶輸出驗(yàn)證失敗提示信息,并從所述標(biāo)注模式切換至所述驗(yàn)證模式,并通知所述處理單元在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述至少一個(gè)目標(biāo)用戶進(jìn)行身份驗(yàn)證。

      優(yōu)選地,該數(shù)據(jù)處理裝置還包括:

      添加單元,用于將所述目標(biāo)樣本數(shù)據(jù)及其標(biāo)注結(jié)果作為新的素材數(shù)據(jù)添加至所述素材庫(kù)中。

      再一方面,本發(fā)明實(shí)施例提供一種存儲(chǔ)設(shè)備,所述存儲(chǔ)設(shè)備存儲(chǔ)有一條或一條以上指令,所述一條或一條以上指令適于由處理器加載并執(zhí)行本發(fā)明實(shí)施例所述的數(shù)據(jù)處理方法。

      再一方面,本發(fā)明實(shí)施例提供一種網(wǎng)絡(luò)設(shè)備,包括:

      處理器,適于實(shí)現(xiàn)一條或一條以上指令;以及,

      存儲(chǔ)設(shè)備,所述存儲(chǔ)設(shè)備存儲(chǔ)有一條或一條以上指令,所述一條或一條以上指令適于由所述處理器加載并執(zhí)行本發(fā)明實(shí)施例所述的數(shù)據(jù)處理方法。

      本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶在驗(yàn)證過程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量;進(jìn)一步,帶標(biāo)注結(jié)果的樣本數(shù)據(jù)又可以作為已知答案的驗(yàn)證素材,擴(kuò)充互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中素材數(shù)據(jù)的數(shù)量。

      附圖說明

      為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

      圖1為本發(fā)明實(shí)施例提供的一種標(biāo)注頁(yè)面的示意圖;

      圖2為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法的流程圖;

      圖3為本發(fā)明實(shí)施例提供的另一種數(shù)據(jù)處理方法的流程圖;

      圖4a為本發(fā)明實(shí)施例提供的另一種標(biāo)注頁(yè)面的示意圖;

      圖4b為本發(fā)明實(shí)施例提供的另一種標(biāo)注頁(yè)面的示意圖;

      圖4c為本發(fā)明實(shí)施例提供的又一種標(biāo)注頁(yè)面的示意圖;

      圖5為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖;

      圖6為本發(fā)明實(shí)施例提供的一種網(wǎng)絡(luò)設(shè)備的結(jié)構(gòu)示意圖。

      具體實(shí)施方式

      下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。

      機(jī)器學(xué)習(xí)是一種涉及多領(lǐng)域交叉學(xué)科的技術(shù),主要涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科,其用于專門研究機(jī)器如何模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為以獲取新知識(shí)或新技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。此處的機(jī)器可指計(jì)算機(jī)、電子計(jì)算機(jī)、神經(jīng)計(jì)算機(jī)等等設(shè)備。目前,機(jī)器學(xué)習(xí)被廣泛應(yīng)用于各類互聯(lián)網(wǎng)場(chǎng)景中,例如可應(yīng)用于:數(shù)據(jù)挖掘場(chǎng)景、計(jì)算機(jī)視覺場(chǎng)景、自然語(yǔ)言處理場(chǎng)景、神經(jīng)網(wǎng)絡(luò)的構(gòu)建場(chǎng)景、信息推薦場(chǎng)景等等。帶標(biāo)注結(jié)果的樣本數(shù)據(jù)是用于機(jī)器進(jìn)行訓(xùn)練學(xué)習(xí)的對(duì)象,是機(jī)器學(xué)習(xí)的基礎(chǔ),例如:標(biāo)注了人臉位置的圖像數(shù)據(jù)可作為機(jī)器學(xué)習(xí)的樣本數(shù)據(jù);或者,標(biāo)注了人臉表情的圖像數(shù)據(jù)可作為機(jī)器學(xué)習(xí)的樣本數(shù)據(jù);或者,標(biāo)注了人物年齡的語(yǔ)音數(shù)據(jù)可作為機(jī)器學(xué)習(xí)的樣本數(shù)據(jù);等等。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,基于機(jī)器學(xué)習(xí)的各類互聯(lián)網(wǎng)系統(tǒng)對(duì)樣本數(shù)據(jù)的需求日益增大;例如:隨著深度神經(jīng)網(wǎng)絡(luò)的層級(jí)數(shù)量的增加,深度神經(jīng)網(wǎng)絡(luò)需要的樣本數(shù)據(jù)的數(shù)量可能達(dá)到數(shù)億;再如:社交推薦系統(tǒng)為了獲得較為精準(zhǔn)有效的社交推薦,其可能需要的樣本數(shù)據(jù)的數(shù)量甚至可達(dá)數(shù)千億。然而,與大需求相矛盾的互聯(lián)網(wǎng)現(xiàn)狀則是普遍缺乏樣本數(shù)據(jù),這主要表現(xiàn)為兩方面,一方面是樣本數(shù)據(jù)的種類匱乏;例如:互聯(lián)網(wǎng)中可能存在關(guān)于人臉位置的樣本數(shù)據(jù),但是關(guān)于人臉性別、人臉年齡、人臉表情、人臉姿勢(shì)等樣本數(shù)據(jù)卻十分缺乏。另一方面是樣本數(shù)據(jù)的數(shù)量嚴(yán)重不足;例如:目前存在于互聯(lián)網(wǎng)中的關(guān)于語(yǔ)音、物體、動(dòng)物、自動(dòng)駕駛等各類樣本數(shù)據(jù)的量較少。造成此矛盾問題的主要原因,是目前樣本數(shù)據(jù)的標(biāo)注過程由專門的標(biāo)注人員人工完成,成本較高且使得互聯(lián)網(wǎng)中的樣本數(shù)據(jù)稀缺匱乏。

      實(shí)際上,一個(gè)樣本數(shù)據(jù)的一次標(biāo)注過程需要的是“短暫的注意力”;例如:針對(duì)某張照片或者某段語(yǔ)音體現(xiàn)出的情緒指數(shù)進(jìn)行標(biāo)注時(shí),假設(shè)情緒指數(shù)設(shè)置如下:1、沮喪;2、一般沮喪;3、平和;4、開心;5、很開心;此標(biāo)注過程僅需要標(biāo)注人員在該照片或語(yǔ)音持續(xù)數(shù)秒的注意力即可完成。仔細(xì)分析可知,互聯(lián)網(wǎng)本身即可提供大量這類“短暫的注意力”,例如:為了保證互聯(lián)網(wǎng)用戶在應(yīng)用登錄、電子商務(wù)過程或其他應(yīng)用場(chǎng)景中的安全性,互聯(lián)網(wǎng)場(chǎng)景通常設(shè)有驗(yàn)證系統(tǒng),該驗(yàn)證系統(tǒng)要求用戶進(jìn)行諸如輸入驗(yàn)證碼等身份驗(yàn)證步驟,此類驗(yàn)證步驟需要用戶付出“短暫的注意力”認(rèn)真看驗(yàn)證碼圖片、認(rèn)真輸入正確結(jié)果以便盡快通過驗(yàn)證?;诖?,本發(fā)明實(shí)施例利用互聯(lián)網(wǎng)所提供的大量“短暫的注意力”,收集多個(gè)互聯(lián)網(wǎng)用戶在身份驗(yàn)證過程中通過“短暫的注意力”所產(chǎn)生的較為可靠的輸出來實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,并且基于機(jī)器學(xué)習(xí)獲得樣本數(shù)據(jù)的標(biāo)注結(jié)果,大大降低樣本數(shù)據(jù)的標(biāo)注成本,擴(kuò)充互聯(lián)網(wǎng)中樣本數(shù)據(jù)的數(shù)量。本發(fā)明實(shí)施例的主要思想如下:傳統(tǒng)的驗(yàn)證系統(tǒng)僅包含驗(yàn)證模式,也就是說用戶進(jìn)入驗(yàn)證系統(tǒng)即在驗(yàn)證模式下執(zhí)行身份驗(yàn)證的步驟,例如:某用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),在驗(yàn)證模式下向用戶輸出驗(yàn)證碼圖片,要求用戶填寫并提交正確的驗(yàn)證碼以通過驗(yàn)證。本發(fā)明實(shí)施例的驗(yàn)證系統(tǒng)在驗(yàn)證模式的基礎(chǔ)上增加標(biāo)注模式,例如:用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),首先在標(biāo)注模式下完成對(duì)樣本數(shù)據(jù)的標(biāo)注,再切換至驗(yàn)證模式下向用戶輸出驗(yàn)證碼圖片要求用戶填寫并提交正確的驗(yàn)證碼以通過驗(yàn)證。

      下面結(jié)合圖1對(duì)本發(fā)明實(shí)施例的方案進(jìn)行簡(jiǎn)單闡述。假設(shè)要對(duì)圖1所示人臉照片體現(xiàn)出的情緒指數(shù)進(jìn)行標(biāo)注,并設(shè)置情緒指數(shù)如下:1、沮喪;2、一般沮喪;3、平和;4、開心;5、很開心;那么,本發(fā)明實(shí)施例的方案如下:當(dāng)互聯(lián)網(wǎng)中的用戶a進(jìn)入驗(yàn)證系統(tǒng)時(shí),首先在標(biāo)注模式下對(duì)用戶a展示該人臉照片及情緒指數(shù)選項(xiàng)要求用戶a選擇;同理,對(duì)進(jìn)入驗(yàn)證系統(tǒng)的互聯(lián)網(wǎng)的用戶b、用戶c、用戶d等其他用戶在標(biāo)注模式下展示同一張人臉照片及情緒指數(shù)要求其進(jìn)行情緒指數(shù)的選擇;可以理解的是,用戶對(duì)情緒指數(shù)的選擇可能是真實(shí)的、隨意的,甚至是無意義的。本發(fā)明實(shí)施例一方面收集所有用戶對(duì)同一張人臉照片所選擇的情緒指數(shù),這些選擇數(shù)據(jù)必然具有一定的分布規(guī)律,采用機(jī)器學(xué)習(xí)方法識(shí)別其中的有效數(shù)據(jù),最后得到該人臉照片關(guān)于情緒指數(shù)的標(biāo)注結(jié)果。另一方面在收集到各用戶所選擇的情緒指數(shù)之后,分別向各用戶輸出如“錯(cuò)誤,請(qǐng)重新選擇”類似的驗(yàn)證失敗提示信息,然后從標(biāo)注模式切換至驗(yàn)證模式并在驗(yàn)證模式下采用互聯(lián)網(wǎng)已有的素材數(shù)據(jù)對(duì)各用戶進(jìn)行重新驗(yàn)證,例如向用戶輸出驗(yàn)證碼圖片要求用戶填寫并提交正確的驗(yàn)證碼以通過驗(yàn)證。由上述例子可知,本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶在驗(yàn)證過程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量;進(jìn)一步,帶標(biāo)注結(jié)果的樣本數(shù)據(jù)又可以作為已知答案的驗(yàn)證素材,擴(kuò)充互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中素材數(shù)據(jù)的數(shù)量。

      基于上述描述,本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理方法,請(qǐng)參見圖2,該方法可包括以下步驟s101-步驟s104。

      s101,獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù)。

      傳統(tǒng)的驗(yàn)證系統(tǒng)是提供身份驗(yàn)證服務(wù)的系統(tǒng),例如:互聯(lián)網(wǎng)用戶進(jìn)行應(yīng)用登錄、電子商務(wù)等過程中會(huì)進(jìn)入驗(yàn)證系統(tǒng)進(jìn)行身份驗(yàn)證,如輸出驗(yàn)證碼圖片要求用戶填寫并提交正確驗(yàn)證碼以確認(rèn)為非機(jī)器操作,以保證登錄或交易安全。本發(fā)明實(shí)施例的驗(yàn)證系統(tǒng)在提供身份驗(yàn)證服務(wù)的同時(shí),還提供樣本標(biāo)注服務(wù);按照上述例子:在互聯(lián)網(wǎng)用戶進(jìn)行應(yīng)用登錄、電子商務(wù)等過程中進(jìn)入驗(yàn)證系統(tǒng)進(jìn)行身份驗(yàn)證之前,首先讓互聯(lián)網(wǎng)用戶完成對(duì)樣本數(shù)據(jù)的標(biāo)注并收集互聯(lián)網(wǎng)用戶的標(biāo)注數(shù)據(jù),然后再對(duì)互聯(lián)網(wǎng)用戶執(zhí)行如輸出驗(yàn)證碼圖片要求用戶填寫并提交正確驗(yàn)證碼的驗(yàn)證步驟。本發(fā)明實(shí)施例中,所述驗(yàn)證系統(tǒng)包括標(biāo)注模式和驗(yàn)證模式,且所述驗(yàn)證系統(tǒng)包含樣本庫(kù)和素材庫(kù);所述樣本庫(kù)包括至少一條樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;所述素材庫(kù)包括至少一個(gè)素材數(shù)據(jù),所述素材數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本。所述標(biāo)注模式用于對(duì)所述樣本庫(kù)中的各樣本數(shù)據(jù)進(jìn)行標(biāo)注;所述驗(yàn)證模式用于采用所述素材庫(kù)中的各素材數(shù)據(jù)對(duì)進(jìn)入驗(yàn)證系統(tǒng)的用戶進(jìn)行身份驗(yàn)證。本步驟中,可從樣本庫(kù)中隨機(jī)選取一個(gè)樣本數(shù)據(jù)作為目標(biāo)樣本數(shù)據(jù),或者,根據(jù)實(shí)際需要從樣本庫(kù)中指定一個(gè)樣本數(shù)據(jù)作為目標(biāo)樣本數(shù)據(jù)。

      s102,向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注。

      可按照一定的格式輸出目標(biāo)樣本數(shù)據(jù),例如:可以在輸出目標(biāo)樣本數(shù)據(jù)的同時(shí)輸出該目標(biāo)樣本數(shù)據(jù)的一些可選的標(biāo)注數(shù)據(jù),這樣目標(biāo)用戶可以通過選擇一個(gè)標(biāo)注數(shù)據(jù)來完成對(duì)目標(biāo)樣本數(shù)據(jù)的標(biāo)注;或者,可以在輸出目標(biāo)樣本數(shù)據(jù)的同時(shí)顯示輸入框,這樣目標(biāo)用戶可以通過手動(dòng)輸入標(biāo)注數(shù)據(jù)來完成對(duì)目標(biāo)樣本數(shù)據(jù)的標(biāo)注。

      s103,采集所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù)。

      每個(gè)目標(biāo)用戶對(duì)目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注會(huì)產(chǎn)生標(biāo)注數(shù)據(jù),如圖1所示,假設(shè)用戶a選擇“3、平和”,那么“3、平和”即為用戶a對(duì)人臉照片進(jìn)行標(biāo)注產(chǎn)生的標(biāo)注數(shù)據(jù);同理,用戶b選擇“2、一般沮喪”,那么“2、一般沮喪”為用戶b對(duì)人臉照片標(biāo)注產(chǎn)生的標(biāo)注數(shù)據(jù)。本步驟s103收集每一個(gè)目標(biāo)用戶分別對(duì)目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的標(biāo)注數(shù)據(jù)。

      s104,采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

      目標(biāo)樣本數(shù)據(jù)的各標(biāo)注數(shù)據(jù)可能是真實(shí)的、隨意的,甚至是無意義的,但是這些標(biāo)注數(shù)據(jù)必然具有一定的分布規(guī)律,可以采用機(jī)器學(xué)習(xí)算法對(duì)這些標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,得到目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果;此處,機(jī)器學(xué)習(xí)算法可以包括但不限于:異常檢測(cè)算法、協(xié)同過濾算法、決策樹算法、最優(yōu)化算法等等。

      本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶在驗(yàn)證過程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量。

      本發(fā)明實(shí)施例提供另一種數(shù)據(jù)處理方法,請(qǐng)參見圖3,該方法可包括以下步驟s201-步驟s208。

      s201,當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶;若判斷結(jié)果為是,確定進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶,進(jìn)而轉(zhuǎn)入執(zhí)行s202;若判斷結(jié)果為否,確定進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶,進(jìn)入轉(zhuǎn)入執(zhí)行s208。

      本發(fā)明實(shí)施例可以借助于所有互聯(lián)網(wǎng)用戶對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)注;但為了提升用戶體驗(yàn),優(yōu)選地,可選取一部分互聯(lián)網(wǎng)用戶作為目標(biāo)用戶來對(duì)樣本數(shù)據(jù)進(jìn)行標(biāo)注;步驟s201的判斷過程即是確定目標(biāo)用戶的過程;具體實(shí)現(xiàn)中,步驟s201至少包括以下三種可行的實(shí)施方式:

      在一種可行的實(shí)施方式中,步驟s201可包括以下步驟s11-s13:

      s11,當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的歷史標(biāo)注信息,所述歷史標(biāo)注信息記錄了所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的標(biāo)注模式下對(duì)所述樣本庫(kù)中的樣本數(shù)據(jù)進(jìn)行標(biāo)注的頻次。

      s12,若所述頻次小于預(yù)設(shè)第一閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶。

      s13,若所述頻次大于或等于第一預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      步驟s11-s13采用的是隨機(jī)方式確定目標(biāo)用戶,即根據(jù)歷史標(biāo)注的頻次隨機(jī)選取目標(biāo)用戶。其中,一個(gè)用戶的歷史標(biāo)注信息記錄了該用戶在預(yù)定周期內(nèi)執(zhí)行標(biāo)注操作的總次數(shù);比如:某用戶a在最近一個(gè)小時(shí)內(nèi)分別對(duì)樣本數(shù)據(jù)a進(jìn)行一次標(biāo)注,對(duì)樣本數(shù)據(jù)b進(jìn)行兩次標(biāo)注,對(duì)樣本數(shù)據(jù)c進(jìn)行一次標(biāo)注;那么,用戶a的歷史標(biāo)注信息記錄該用戶a的標(biāo)注頻次為4次/小時(shí)。一個(gè)用戶對(duì)應(yīng)一個(gè)歷史標(biāo)注信息,各用戶的歷史標(biāo)注信息可存儲(chǔ)至本地或云端存儲(chǔ)空間中,并根據(jù)用戶的標(biāo)注操作進(jìn)行實(shí)時(shí)更新,因此可以從本地或云端存儲(chǔ)空間中獲得用戶的歷史標(biāo)注信息。第一預(yù)設(shè)閥值可以根據(jù)實(shí)際需要進(jìn)行確定,例如:該第一預(yù)設(shè)閥值可以為5次/小時(shí),2次/分鐘等等。如果某用戶的標(biāo)注頻次大于或等于第一預(yù)設(shè)閥值,表明該用戶在預(yù)設(shè)周期內(nèi)已經(jīng)進(jìn)行過多次樣本數(shù)據(jù)的標(biāo)注操作,若驗(yàn)證過程中過于頻繁要求該用戶進(jìn)行標(biāo)注操作可能會(huì)影響該用戶的使用體驗(yàn),因此可將該用戶確定為普通用戶,當(dāng)前預(yù)設(shè)周期內(nèi)不再進(jìn)行標(biāo)注操作;反之,如果某用戶的標(biāo)注頻次小于第一預(yù)設(shè)閥值,表明該用戶在預(yù)設(shè)周期內(nèi)進(jìn)行樣本數(shù)據(jù)的標(biāo)注操作次數(shù)較少,若驗(yàn)證過程中再次要求該用戶進(jìn)行標(biāo)注操作并不會(huì)影響該用戶的使用體驗(yàn),因此可將該用戶確定為目標(biāo)用戶進(jìn)入后續(xù)流程執(zhí)行標(biāo)注操作。

      在另一種可行的實(shí)施方式中,該s201可包括以下步驟s21-s23。

      s21,當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的標(biāo)識(shí)。

      s22,若所述標(biāo)識(shí)為預(yù)設(shè)的備選用戶標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶。

      s23,若所述標(biāo)識(shí)并非預(yù)設(shè)的備選用戶標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      步驟s21-s23采用的是定向方式確定目標(biāo)用戶,即預(yù)先選定一些目標(biāo)用戶。其中,預(yù)設(shè)的備選用戶標(biāo)識(shí)是預(yù)先選取的目標(biāo)用戶的標(biāo)識(shí);此處的標(biāo)識(shí)可以包括但不限于:即時(shí)通訊標(biāo)識(shí)(如qq號(hào)、微信號(hào)等)、sns標(biāo)識(shí)(如微博號(hào)、博客號(hào)等)、通信標(biāo)識(shí)(如手機(jī)號(hào)、座機(jī)號(hào)等)、email號(hào)等等。如果進(jìn)入驗(yàn)證系統(tǒng)的用戶標(biāo)識(shí)是預(yù)設(shè)的備選用戶標(biāo)識(shí),則可確定該用戶為目標(biāo)用戶;否則確定該用戶為普通用戶。

      在又一種可行的實(shí)施方式中,該s201可包括以下步驟s31-s33。

      s31,當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的歷史驗(yàn)證信息,所述歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率。

      s32,若所述成功率大于或等于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶。

      s33,若所述成功率小于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      步驟s31-s33采用的是篩選方式確定目標(biāo)用戶,即根據(jù)歷史驗(yàn)證的成功率篩選符合條件的目標(biāo)用戶。其中,一個(gè)用戶的歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率;比如:某用戶a在以驗(yàn)證碼進(jìn)行身份驗(yàn)證的過程中,第1次至第n-1次所提交的驗(yàn)證碼均錯(cuò)誤,在第n次提交正確驗(yàn)證碼,那么用戶a的成功率為1/n(n為正整數(shù))。一個(gè)用戶對(duì)應(yīng)一個(gè)歷史驗(yàn)證信息,各用戶的歷史驗(yàn)證信息可存儲(chǔ)至本地或云端存儲(chǔ)空間中,并根據(jù)用戶的驗(yàn)證過程進(jìn)行實(shí)時(shí)更新,因此可以從本地或云端存儲(chǔ)空間中獲得用戶的歷史驗(yàn)證信息。第二預(yù)設(shè)閥值可以根據(jù)實(shí)際需要進(jìn)行確定,例如:該第二預(yù)設(shè)閥值可以為1/2,1/3等等。如果某用戶的驗(yàn)證成功率大于或等于第二預(yù)設(shè)閥值,表明該用戶通常較為認(rèn)真的完成驗(yàn)證過程,其提交的數(shù)據(jù)較為真實(shí)且可信度較高,適于將該用戶確定為目標(biāo)用戶以進(jìn)行樣本數(shù)據(jù)的標(biāo)注操作。反之如果某用戶的驗(yàn)證成功率小于第二預(yù)設(shè)閥值,表明該用戶在驗(yàn)證過程通常表現(xiàn)得較為隨意,其提交的數(shù)據(jù)真實(shí)性較低且可信度較低,不適于讓該用戶來執(zhí)行樣本數(shù)據(jù)的標(biāo)注操作,因此可將該用戶確定為普通用戶。

      實(shí)際應(yīng)用中,上述三種實(shí)施方式可靈活選擇,如果確定目標(biāo)用戶進(jìn)入驗(yàn)證系統(tǒng),則轉(zhuǎn)入步驟s202在標(biāo)注模式下執(zhí)行后續(xù)對(duì)目標(biāo)樣本數(shù)據(jù)的標(biāo)注過程;如果確定是普通用戶進(jìn)入驗(yàn)證系統(tǒng),那么轉(zhuǎn)入步驟s208在驗(yàn)證模式下對(duì)該普通用戶進(jìn)行身份驗(yàn)證。

      s202,啟動(dòng)驗(yàn)證系統(tǒng)的標(biāo)注模式,并在所述標(biāo)注模式下獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù)。

      本步驟s202可參見圖2所示的步驟s101,在此不贅述。其中,目標(biāo)樣本數(shù)據(jù)是樣本庫(kù)中的任一個(gè)樣本數(shù)據(jù),其可以為圖像,例如:人臉圖像、動(dòng)物圖像等等;其也可以是語(yǔ)音,例如:一段人說話的語(yǔ)音、一段歌曲等等;其還可以是文本,例如:一句話、一個(gè)單詞等等。

      s203,向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注。

      根據(jù)目標(biāo)樣本數(shù)據(jù)的類型可靈活選擇輸出方式,例如:若目標(biāo)樣本數(shù)據(jù)為圖像、文本,那么可以通過顯示方式進(jìn)行輸出;再如:若目標(biāo)樣本數(shù)據(jù)為語(yǔ)音,那么可通過喇叭播放方式進(jìn)行輸出。輸出目標(biāo)樣本數(shù)據(jù)的目的在于讓目標(biāo)用戶通過感官系統(tǒng)(眼、耳、口、鼻)認(rèn)知目標(biāo)樣本數(shù)據(jù),并通過聽說讀寫完成對(duì)目標(biāo)樣本數(shù)據(jù)的標(biāo)注。具體實(shí)現(xiàn)中,步驟s203可具體包括以下步驟s41-s43。

      s41,為所述目標(biāo)樣本數(shù)據(jù)設(shè)置標(biāo)注方式,所述標(biāo)注方式包括以下任一種:選擇方式和輸入方式。

      s42,若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,向所述至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),并將所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)待選標(biāo)注數(shù)據(jù)輸出至所述至少一個(gè)目標(biāo)用戶進(jìn)行選擇。

      s43,若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為輸入方式,向所述至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),并顯示輸入框以使所述至少一個(gè)目標(biāo)用戶在所述輸入框輸入所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

      步驟s41-s43定義了目標(biāo)用戶采用何種方式對(duì)目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注;具體地,若目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,則在輸出目標(biāo)樣本數(shù)據(jù)的同時(shí)顯示至少一個(gè)待選標(biāo)注數(shù)據(jù),目標(biāo)用戶直接選擇一個(gè)標(biāo)注數(shù)據(jù)即可完成對(duì)目標(biāo)樣本數(shù)據(jù)的標(biāo)注;此處,至少一個(gè)待選標(biāo)注數(shù)據(jù)既可以被封裝為選項(xiàng)(如圖1所示),此時(shí)目標(biāo)用戶可點(diǎn)擊選項(xiàng)從而選中一個(gè)標(biāo)注數(shù)據(jù)。至少一個(gè)待選標(biāo)注數(shù)據(jù)也可以被封裝至滑動(dòng)區(qū)域(如圖4a所示),此時(shí)目標(biāo)用戶通過在滑動(dòng)區(qū)域操作滑塊來選中一個(gè)標(biāo)注數(shù)據(jù)。若目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為為輸入方式,則在輸出目標(biāo)樣本數(shù)據(jù)的同時(shí)顯示輸入框,由目標(biāo)用戶在輸入框中直接輸入標(biāo)注數(shù)據(jù)完成標(biāo)注;此處,輸入框可以是文本輸入框(如圖4b所示),也可以是語(yǔ)音輸入框(如圖4c所示)。

      s204,采集所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù);之后,轉(zhuǎn)入執(zhí)行步驟s205-s206;并且,轉(zhuǎn)入執(zhí)行步驟s207-s208。

      s205,采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

      步驟s204-s205可以參見圖2所示實(shí)施例的步驟s103-s104,在此不贅述。

      s206,將所述目標(biāo)樣本數(shù)據(jù)及其標(biāo)注結(jié)果作為新的素材數(shù)據(jù)添加至所述素材庫(kù)中。

      s207,向所述至少一個(gè)目標(biāo)用戶輸出驗(yàn)證失敗提示信息,并從所述標(biāo)注模式切換至所述驗(yàn)證模式。

      s208,啟動(dòng)驗(yàn)證系統(tǒng)的驗(yàn)證模式,并在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述進(jìn)入驗(yàn)證系統(tǒng)的用戶進(jìn)行身份驗(yàn)證。

      本發(fā)明實(shí)施例中,步驟s204收集到至少一個(gè)目標(biāo)用戶的標(biāo)注數(shù)據(jù)之后,會(huì)進(jìn)入兩個(gè)處理邏輯,其中一個(gè)處理邏輯為步驟s205-s206;另一個(gè)處理邏輯為步驟s207-s208。一方面,如果步驟s204收集到的標(biāo)注數(shù)據(jù)達(dá)到預(yù)設(shè)數(shù)量之后,此處的預(yù)設(shè)數(shù)量可根據(jù)實(shí)際需要進(jìn)行設(shè)定,為了保證準(zhǔn)確性,通??蓪㈩A(yù)設(shè)數(shù)量設(shè)置較大,如幾百、幾千、幾萬(wàn)等,以保證有足夠數(shù)量的標(biāo)注數(shù)據(jù);然后進(jìn)入步驟s205-s206通過機(jī)器學(xué)習(xí)算法對(duì)至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)得到目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果,至此獲得了一個(gè)帶標(biāo)注結(jié)果的、可用于機(jī)器學(xué)習(xí)訓(xùn)練的樣本數(shù)據(jù);最后將該帶有標(biāo)注結(jié)果的目標(biāo)樣本數(shù)據(jù)作為素材數(shù)據(jù)添加至素材庫(kù)中,這樣既擴(kuò)充了互聯(lián)網(wǎng)中用于訓(xùn)練學(xué)習(xí)的樣本數(shù)據(jù),又?jǐn)U充了互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中用于身份驗(yàn)證的素材數(shù)據(jù)。另一方面,步驟s204收集到各目標(biāo)用戶的標(biāo)注數(shù)據(jù)之后,會(huì)進(jìn)入步驟s207-s208分別向各目標(biāo)用戶輸出諸如“錯(cuò)誤,請(qǐng)重新選擇”,或者“錯(cuò)誤,請(qǐng)重新輸入”等驗(yàn)證失敗提示信息,以提醒目標(biāo)用戶重新在驗(yàn)證模式下進(jìn)行身份驗(yàn)證。

      本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶在驗(yàn)證過程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量;進(jìn)一步,帶標(biāo)注結(jié)果的樣本數(shù)據(jù)又可以作為已知答案的驗(yàn)證素材,擴(kuò)充互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中素材數(shù)據(jù)的數(shù)量?;谏鲜龇椒▽?shí)施例的描述,本發(fā)明實(shí)施例還公開了一種數(shù)據(jù)處理裝置,該數(shù)據(jù)處理裝置可以是一個(gè)計(jì)算機(jī)程序(包括程序代碼),且該計(jì)算機(jī)程序可以運(yùn)行于終端(如pc(personalcomputer,個(gè)人計(jì)算機(jī))、手機(jī)等)、單個(gè)服務(wù)器或集群服務(wù)設(shè)備等網(wǎng)絡(luò)設(shè)備中以用來執(zhí)行圖2-圖3任一實(shí)施例所示的數(shù)據(jù)處理方法。請(qǐng)一并參見圖5,該數(shù)據(jù)處理裝置運(yùn)行如下單元:

      獲取單元101,用于獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù)。

      輸出單元102,用于向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注。

      采集單元103,用于采集所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù)。

      學(xué)習(xí)單元104,用于采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

      具體實(shí)現(xiàn)中,所述驗(yàn)證系統(tǒng)包括標(biāo)注模式和驗(yàn)證模式,且所述驗(yàn)證系統(tǒng)包含樣本庫(kù)和素材庫(kù);

      所述樣本庫(kù)包括至少一條樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;所述素材庫(kù)包括至少一個(gè)素材數(shù)據(jù),所述素材數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;

      所述標(biāo)注模式用于對(duì)所述樣本庫(kù)中的各樣本數(shù)據(jù)進(jìn)行標(biāo)注;所述驗(yàn)證模式用于采用所述素材庫(kù)中的各素材數(shù)據(jù)對(duì)進(jìn)入驗(yàn)證系統(tǒng)的用戶進(jìn)行身份驗(yàn)證。

      具體實(shí)現(xiàn)中,該該數(shù)據(jù)處理裝置還運(yùn)行如下單元:

      判斷單元105,用于當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶。

      處理單元106,用于若進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶,則啟動(dòng)驗(yàn)證系統(tǒng)的標(biāo)注模式,并在所述標(biāo)注模式下通知所述獲取單元獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);或者用于若進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶,則啟動(dòng)驗(yàn)證系統(tǒng)的驗(yàn)證模式,并在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述進(jìn)入驗(yàn)證系統(tǒng)的用戶進(jìn)行身份驗(yàn)證。

      在一種可行的實(shí)施方式中,該數(shù)據(jù)處理裝置在運(yùn)行所述判斷單元105的過程中具體運(yùn)行如下單元:

      第一信息獲取單元1001,用于當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的歷史標(biāo)注信息,所述歷史標(biāo)注信息記錄了所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的標(biāo)注模式下對(duì)所述樣本庫(kù)中的樣本數(shù)據(jù)進(jìn)行標(biāo)注的頻次。

      第一確定單元1002,用于若所述頻次小于預(yù)設(shè)第一閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;或用于若所述頻次大于或等于第一預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      在另一種可行的實(shí)施方式中,該數(shù)據(jù)處理裝置在運(yùn)行所述判斷單元105的過程中具體運(yùn)行如下單元:

      標(biāo)識(shí)獲取單元1011,用于當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的標(biāo)識(shí)。

      第二確定單元1012,用于若所述標(biāo)識(shí)為預(yù)設(shè)的備選用戶標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;或用于若所述標(biāo)識(shí)并非預(yù)設(shè)的備選用戶標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      在又一種可行的實(shí)施方式中,該數(shù)據(jù)處理裝置在運(yùn)行所述判斷單元105的過程中具體運(yùn)行如下單元:

      第二信息獲取單元1111,用于當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的歷史驗(yàn)證信息,所述歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率。

      第三確定單元1112,用于若所述成功率大于或等于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;或用于若所述成功率小于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      具體實(shí)現(xiàn)中,該數(shù)據(jù)處理裝置在運(yùn)行所述輸出單元102的過程中具體運(yùn)行如下單元:

      方式設(shè)置單元2001,用于為所述目標(biāo)樣本數(shù)據(jù)設(shè)置標(biāo)注方式,所述標(biāo)注方式包括以下任一種:選擇方式和輸入方式。

      數(shù)據(jù)輸出單元2002,用于若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,向所述至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),并將所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)待選標(biāo)注數(shù)據(jù)輸出至所述至少一個(gè)目標(biāo)用戶進(jìn)行選擇;或用于若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為輸入方式,向所述至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),并顯示輸入框以使所述至少一個(gè)目標(biāo)用戶在所述輸入框輸入所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

      具體實(shí)現(xiàn)中,該數(shù)據(jù)處理裝置還運(yùn)行如下單元:

      提示單元107,用于向所述至少一個(gè)目標(biāo)用戶輸出驗(yàn)證失敗提示信息,并從所述標(biāo)注模式切換至所述驗(yàn)證模式,并通知所述處理單元在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述至少一個(gè)目標(biāo)用戶進(jìn)行身份驗(yàn)證。

      具體實(shí)現(xiàn)中,該數(shù)據(jù)處理裝置還運(yùn)行如下單元:

      添加單元108,用于將所述目標(biāo)樣本數(shù)據(jù)及其標(biāo)注結(jié)果作為新的素材數(shù)據(jù)添加至所述素材庫(kù)中。

      根據(jù)本發(fā)明的一個(gè)實(shí)施例,圖2所示的數(shù)據(jù)處理方法涉及的各步驟可以是由圖5所示的數(shù)據(jù)處理裝置中的各個(gè)單元來執(zhí)行的。例如,圖2中所示的步驟s101-s104可以分別由圖5中所示的獲取單元101、輸出單元102、采集單元103和學(xué)習(xí)單元104來執(zhí)行。

      根據(jù)本發(fā)明的另一個(gè)實(shí)施例,圖3所示的數(shù)據(jù)處理方法涉及的各步驟也可以是由圖5所示的數(shù)據(jù)處理裝置中的各個(gè)單元來執(zhí)行的。例如,圖3中所示的步驟s201-s208可以由圖5中所示的判斷單元105、獲取單元101、輸出單元102、采集單元103、學(xué)習(xí)單元104、處理單元106、添加單元108和提示單元107來執(zhí)行;其中,圖3中所示的步驟s11,s12-s13可以由圖5中所示的第一信息獲取單元1001和第一確定單元1002來執(zhí)行;步驟s21,s22-s23可以由圖5中所示的標(biāo)識(shí)獲取單元1011和第二確定單元1012來執(zhí)行;步驟s31,s32-s33可以由圖5中所示的第二信息獲取單元1111和第三確定單元1112來執(zhí)行;步驟s41-s42可以由圖5中所示的方式設(shè)置單元2001和數(shù)據(jù)輸出單元2002來執(zhí)行。

      根據(jù)本發(fā)明的再一個(gè)實(shí)施例,圖5所示的數(shù)據(jù)處理裝置中的各個(gè)單元可以分別或全部合并為一個(gè)或若干個(gè)另外的單元來構(gòu)成,或者其中的某個(gè)(些)單元還可以再拆分為功能上更小的多個(gè)單元來構(gòu)成,這可以實(shí)現(xiàn)同樣的操作,而不影響本發(fā)明的實(shí)施例的技術(shù)效果的實(shí)現(xiàn)。上述單元是基于邏輯功能劃分的,在實(shí)際應(yīng)用中,一個(gè)單元的功能也可以由多個(gè)單元來實(shí)現(xiàn),或者多個(gè)單元的功能由一個(gè)單元實(shí)現(xiàn)。在本發(fā)明的其它實(shí)施例中,數(shù)據(jù)處理裝置也可以包括其它單元,在實(shí)際應(yīng)用中,這些功能也可以由其它單元協(xié)助實(shí)現(xiàn),并且可以由多個(gè)單元協(xié)作實(shí)現(xiàn)。

      根據(jù)本發(fā)明的又一個(gè)實(shí)施例,可以通過在包括中央處理單元(cpu)、隨機(jī)存取存儲(chǔ)設(shè)備(ram)、只讀存儲(chǔ)設(shè)備(rom)等處理元件和存儲(chǔ)元件的例如計(jì)算機(jī)的通用計(jì)算設(shè)備上運(yùn)行能夠執(zhí)行如圖2或圖3中所示的數(shù)據(jù)處理方法,來構(gòu)造如圖5中所示的數(shù)據(jù)處理裝置設(shè)備,以及來實(shí)現(xiàn)根據(jù)本發(fā)明的實(shí)施例的數(shù)據(jù)處理方法。所述計(jì)算機(jī)程序可以記載于例如計(jì)算機(jī)可讀記錄介質(zhì)上,并通過計(jì)算機(jī)可讀記錄介質(zhì)裝載于上述計(jì)算設(shè)備中,并在其中運(yùn)行。

      本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶在驗(yàn)證過程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量;進(jìn)一步,帶標(biāo)注結(jié)果的樣本數(shù)據(jù)又可以作為已知答案的驗(yàn)證素材,擴(kuò)充互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中素材數(shù)據(jù)的數(shù)量。

      本發(fā)明實(shí)施例還提供了一種網(wǎng)絡(luò)設(shè)備,該網(wǎng)絡(luò)設(shè)備可以是諸如pc(personalcomputer,個(gè)人計(jì)算機(jī))、手機(jī)、pda(平板電腦)等終端設(shè)備,也可以是諸如應(yīng)用服務(wù)器、集群服務(wù)器等服務(wù)設(shè)備。請(qǐng)參見圖6,該網(wǎng)絡(luò)設(shè)備的內(nèi)部結(jié)構(gòu)可包括但不限于:處理器、網(wǎng)絡(luò)接口及存儲(chǔ)器。其中,網(wǎng)絡(luò)設(shè)備內(nèi)的處理器、網(wǎng)絡(luò)接口及存儲(chǔ)器可通過總線或其他方式連接,在本發(fā)明實(shí)施例所示圖6中以通過總線連接為例。

      其中,處理器(或稱cpu(centralprocessingunit,中央處理器))是網(wǎng)絡(luò)設(shè)備的計(jì)算核心以及控制核心。網(wǎng)絡(luò)接口可選的可以包括標(biāo)準(zhǔn)的有線接口、無線接口(如wi-fi、移動(dòng)通信接口等)。存儲(chǔ)設(shè)備(memory)是網(wǎng)絡(luò)設(shè)備中的記憶設(shè)備,用于存放程序和數(shù)據(jù)??梢岳斫獾氖牵颂幍拇鎯?chǔ)設(shè)備可以是高速ram存儲(chǔ)設(shè)備,也可以是非不穩(wěn)定的存儲(chǔ)設(shè)備(non-volatilememory),例如至少一個(gè)磁盤存儲(chǔ)設(shè)備;可選的還可以是至少一個(gè)位于遠(yuǎn)離前述處理器的存儲(chǔ)裝置。存儲(chǔ)設(shè)備提供存儲(chǔ)空間,該存儲(chǔ)空間存儲(chǔ)了網(wǎng)絡(luò)設(shè)備的操作系統(tǒng),可包括但不限于:windows系統(tǒng)(一種操作系統(tǒng))、linux(一種操作系統(tǒng))、android(安卓,一種移動(dòng)操作系統(tǒng))系統(tǒng)、ios(一種移動(dòng)操作系統(tǒng))系統(tǒng)等等,本發(fā)明對(duì)此并不作限定;并且,在該存儲(chǔ)空間中還存放了適于被處理器加載并執(zhí)行的一條或一條以上的指令,這些指令可以是一個(gè)或一個(gè)以上的計(jì)算機(jī)程序(包括程序代碼)。

      在本發(fā)明實(shí)施例中,處理器加載并執(zhí)行存儲(chǔ)設(shè)備中存放的一條或一條以上指令,以實(shí)現(xiàn)上述圖2-圖3所示方法流程的相應(yīng)步驟;具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行如下步驟:

      獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);

      向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注;

      采集所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù);

      采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果。

      所述驗(yàn)證系統(tǒng)包括標(biāo)注模式和驗(yàn)證模式,且所述驗(yàn)證系統(tǒng)包含樣本庫(kù)和素材庫(kù);

      所述樣本庫(kù)包括至少一條樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;所述素材庫(kù)包括至少一個(gè)素材數(shù)據(jù),所述素材數(shù)據(jù)包括以下任一種:圖像、語(yǔ)音和文本;

      所述標(biāo)注模式用于對(duì)所述樣本庫(kù)中的各樣本數(shù)據(jù)進(jìn)行標(biāo)注;所述驗(yàn)證模式用于采用所述素材庫(kù)中的各素材數(shù)據(jù)對(duì)進(jìn)入驗(yàn)證系統(tǒng)的用戶進(jìn)行身份驗(yàn)證。

      具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù)的步驟之前,還執(zhí)行如下步驟:

      當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶;

      若進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶,則啟動(dòng)驗(yàn)證系統(tǒng)的標(biāo)注模式,并在所述標(biāo)注模式下獲取驗(yàn)證系統(tǒng)中待處理的目標(biāo)樣本數(shù)據(jù);

      若進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶,則啟動(dòng)驗(yàn)證系統(tǒng)的驗(yàn)證模式,并在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述進(jìn)入驗(yàn)證系統(tǒng)的用戶進(jìn)行身份驗(yàn)證。

      具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶的步驟時(shí),具體執(zhí)行如下步驟:

      當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的歷史標(biāo)注信息,所述歷史標(biāo)注信息記錄了所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的標(biāo)注模式下對(duì)所述樣本庫(kù)中的樣本數(shù)據(jù)進(jìn)行標(biāo)注的頻次;

      若所述頻次小于預(yù)設(shè)第一閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;

      若所述頻次大于或等于第一預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶的步驟時(shí),具體執(zhí)行如下步驟:

      當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的標(biāo)識(shí);

      若所述標(biāo)識(shí)為預(yù)設(shè)的備選用戶標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;

      若所述標(biāo)識(shí)并非預(yù)設(shè)的備選用戶標(biāo)識(shí),則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),判斷進(jìn)入驗(yàn)證系統(tǒng)的用戶是否為目標(biāo)用戶的步驟時(shí),具體執(zhí)行如下步驟:

      當(dāng)檢測(cè)到任一用戶進(jìn)入驗(yàn)證系統(tǒng)時(shí),獲取所述進(jìn)入驗(yàn)證系統(tǒng)的用戶的歷史驗(yàn)證信息,所述歷史驗(yàn)證信息記錄所述進(jìn)入驗(yàn)證系統(tǒng)的用戶在驗(yàn)證系統(tǒng)的驗(yàn)證模式下進(jìn)行身份驗(yàn)證的成功率;

      若所述成功率大于或等于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為目標(biāo)用戶;

      若所述成功率小于第二預(yù)設(shè)閥值,則確定所述進(jìn)入驗(yàn)證系統(tǒng)的用戶為普通用戶。

      具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述向進(jìn)入所述驗(yàn)證系統(tǒng)的至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),以使所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注的步驟時(shí),具體執(zhí)行如下步驟:

      為所述目標(biāo)樣本數(shù)據(jù)設(shè)置標(biāo)注方式,所述標(biāo)注方式包括以下任一種:選擇方式和輸入方式;

      若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為選擇方式,向所述至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),并將所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的至少一個(gè)待選標(biāo)注數(shù)據(jù)輸出至所述至少一個(gè)目標(biāo)用戶進(jìn)行選擇;

      若所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注方式為輸入方式,向所述至少一個(gè)目標(biāo)用戶輸出所述目標(biāo)樣本數(shù)據(jù),并顯示輸入框以使所述至少一個(gè)目標(biāo)用戶在所述輸入框輸入所述目標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。

      具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述采集所述至少一個(gè)目標(biāo)用戶對(duì)所述目標(biāo)樣本數(shù)據(jù)進(jìn)行標(biāo)注所產(chǎn)生的至少一個(gè)標(biāo)注數(shù)據(jù)步驟之后,還執(zhí)行如下步驟:

      向所述至少一個(gè)目標(biāo)用戶輸出驗(yàn)證失敗提示信息,并從所述標(biāo)注模式切換至所述驗(yàn)證模式;

      在所述驗(yàn)證模式下從所述素材庫(kù)中選取一個(gè)素材數(shù)據(jù)對(duì)所述至少一個(gè)目標(biāo)用戶進(jìn)行身份驗(yàn)證。

      具體實(shí)現(xiàn)中,存儲(chǔ)設(shè)備中的一條或一條以上指令由處理器加載并執(zhí)行所述采用機(jī)器學(xué)習(xí)算法對(duì)所述目標(biāo)樣本數(shù)據(jù)的至少一個(gè)標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)處理,獲得所述目標(biāo)樣本數(shù)據(jù)的標(biāo)注結(jié)果的步驟之后,還執(zhí)行如下步驟:

      將所述目標(biāo)樣本數(shù)據(jù)及其標(biāo)注結(jié)果作為新的素材數(shù)據(jù)添加至所述素材庫(kù)中。

      本發(fā)明實(shí)施例可挖掘利用互聯(lián)網(wǎng)用戶在驗(yàn)證過程中碎片化的短暫的注意力,大規(guī)模、分散地借助用戶實(shí)現(xiàn)樣本數(shù)據(jù)的標(biāo)注,擴(kuò)充互聯(lián)網(wǎng)樣本數(shù)據(jù)的數(shù)量;進(jìn)一步,帶標(biāo)注結(jié)果的樣本數(shù)據(jù)又可以作為已知答案的驗(yàn)證素材,擴(kuò)充互聯(lián)網(wǎng)驗(yàn)證系統(tǒng)中素材數(shù)據(jù)的數(shù)量。

      在本說明書的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)上述術(shù)語(yǔ)的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。

      此外,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是至少兩個(gè),例如兩個(gè),三個(gè)等,除非另有明確具體的限定。

      流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。

      應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(pga),現(xiàn)場(chǎng)可編程門陣列(fpga)等。此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。

      以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。

      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1