專利名稱:用于確定是否接受登記對象的系統(tǒng)、方法以及計(jì)算機(jī)程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域:
此處所述的實(shí)施例總體上涉及數(shù)據(jù)處理,具體而言,涉及生物測定系統(tǒng)中的登記(enrollment)。
背景技術(shù):
生物測定學(xué)是用于測量并且統(tǒng)計(jì)分析生物學(xué)數(shù)據(jù)的科學(xué)技術(shù)。生物測定是用于識別登記者的身份或者驗(yàn)證所聲稱的身份的、可測量的物理特性或者個(gè)人行為特性。一般來說,生物測定學(xué)統(tǒng)計(jì)性地測量特定的人類解剖學(xué)和生理學(xué)特性,這些特性對于個(gè)體而言是唯一的。生物測定學(xué)的示例包括指紋、視網(wǎng)膜掃描、講話者(語音)識別、簽字識別以及手跡認(rèn)識。
生物測定學(xué)可以用于識別和/或驗(yàn)證。在識別過程中,可以把對象(例如,某人)的生物測定樣本(即,生物測定輸入)與存儲在生物測定系統(tǒng)中的生物測定數(shù)據(jù)進(jìn)行比較,以便確立該對象的身份。驗(yàn)證(亦稱鑒定)是用于驗(yàn)證一個(gè)對象是該對象所號稱的那個(gè)對象的過程。識別是用于確定給定對象身份的過程。驗(yàn)證的目標(biāo)在于確定該對象(也稱為申請人)是真正的已登記對象(也稱為真實(shí)或有效對象)還是冒名頂替者。
講話者驗(yàn)證系統(tǒng)(亦稱語音驗(yàn)證系統(tǒng))試圖把正進(jìn)行其身份驗(yàn)證的講話者的語音與已知的語音相匹配。講話者驗(yàn)證系統(tǒng)有助于提供通過使用語音發(fā)聲來確保安全訪問的手段。由申請人在試圖訪問時(shí)提供字或者短語的口頭提交或者僅僅提供一個(gè)講話者單獨(dú)說出的隨機(jī)選擇的字或者短語的樣本,以便通過講話者識別和/或講話者驗(yàn)證系統(tǒng)。真正的申請人是發(fā)聲與和所聲稱的身份相關(guān)聯(lián)的已知特性相匹配的人。
在生物測定系統(tǒng)中,可以把登記定義為從某人(即,某對象)那里收集生物測定數(shù)據(jù)樣本(即,生物測定輸入)并隨后把所述數(shù)據(jù)存儲在基準(zhǔn)模板中的初始過程,其中所述基準(zhǔn)模板表示將用于稍后進(jìn)行的比較中的對象身份。在登記過程中,對象可以把生物測定輸入(例如,語音、指紋等等)提供給生物測定數(shù)據(jù)獲取系統(tǒng)。因?yàn)榄h(huán)境中的細(xì)微變化就會改變所獲取的生物測定的特性,所以通常獲取某人的多個(gè)生物測定數(shù)據(jù)樣本,以便為該對象創(chuàng)建基準(zhǔn)模板。然而,由于生物測定學(xué)不充分的獨(dú)特性,所以也許難以依照在識別和/或驗(yàn)證的過程中允許系統(tǒng)在以后識別某人的方式將該人登記到這樣的生物測定系統(tǒng)中。把這種情況稱為登記失敗。登記失敗情況可因?yàn)楦鞣N原因而發(fā)生,諸如生物測定學(xué)不充分的獨(dú)特性(例如,經(jīng)常廣泛從事手工作業(yè)的人員指紋磨損的非常嚴(yán)重以至于無法被獲取),難以提供一致的生物測定數(shù)據(jù)的生物測定實(shí)現(xiàn)方式(例如,由于視網(wǎng)膜識別系統(tǒng)所要求的精確度而使相當(dāng)高比例的人員不能在這種系統(tǒng)中登記)。
登記失敗情況的比率(稱為“登記失敗率”)是可用來衡量生物測定系統(tǒng)性能的一個(gè)衡量標(biāo)準(zhǔn)??梢园训怯浭÷识x為在為對象創(chuàng)建適當(dāng)?shù)牡怯浤0宓倪^程中一個(gè)給定生物測定系統(tǒng)的失敗率。登記失敗機(jī)制通常被用于在登記過程中通過從所述系統(tǒng)中消除不可靠的生物測定數(shù)據(jù)/對象而進(jìn)行的質(zhì)量控制。
發(fā)明內(nèi)容
本發(fā)明描述了一種用于根據(jù)一個(gè)對象的生物測定輸入來確定接受還是拒絕向生物測定系統(tǒng)進(jìn)行登記的該對象的系統(tǒng)、方法以及計(jì)算機(jī)程序產(chǎn)品的實(shí)施例。根據(jù)一個(gè)實(shí)施例,可以根據(jù)從自對象中獲得的生物測定輸入的第一實(shí)例(例如,第一次出現(xiàn))中提取的特征向量來生成基準(zhǔn)模板??梢园褟淖运鰧ο螳@得的生物測定輸入的第二實(shí)例(例如,第二次出現(xiàn))中提取的特征向量與所述基準(zhǔn)模板進(jìn)行比較,以便基于生物測定輸入的第一和第二實(shí)例之間的相似/相異程度來生成匹配得分。生物測定輸入的第二實(shí)例包括生物測定輸入的第一實(shí)例的重復(fù)。如果該匹配得分符合閾值標(biāo)準(zhǔn),則可以接受所述對象登記到生物測定系統(tǒng)中。
然而,如果匹配得分未能符合閾值標(biāo)準(zhǔn),那么可以拒絕所述對象登記到生物測定系統(tǒng)中。所述閾值標(biāo)準(zhǔn)可以基于有效(或者真實(shí))對象和冒名頂替者之間的相等差錯(cuò)率。所述相等差錯(cuò)率可以通過有效對象的概率密度函數(shù)和冒名頂替者概率密度函數(shù)之間的交點(diǎn)來定義。
在一個(gè)實(shí)施例中,所述生物測定輸入中的每一個(gè)均包括語音發(fā)聲。在這樣的實(shí)施例中,每次語音發(fā)聲的持續(xù)時(shí)間可以小于三秒左右。在另一個(gè)實(shí)現(xiàn)方式中,每次語音發(fā)聲的持續(xù)時(shí)間小于兩秒左右。
所述匹配得分可以包括失真得分,其表示生物測定輸入第二實(shí)例的特征向量與根據(jù)從生物測定輸入的第一實(shí)例提取出的特征向量而生成的所述模板的失真度。在一個(gè)實(shí)施例中,所述基準(zhǔn)模板可以包括十六個(gè)或更少的代碼字,并且在一種實(shí)現(xiàn)方式中,可以包括八個(gè)代碼字的基準(zhǔn)模板。
在一個(gè)實(shí)施例中,還可以把從該對象的生物測定輸入的第三實(shí)例(例如第三次出現(xiàn))中提取出的特征向量與所述基準(zhǔn)模板相比較,以便基于該生物測定輸入的第一和第三實(shí)例之間的相似/相異程度來生成匹配得分。
對象的登記可以包括至少基于生物測定輸入的第一和第二實(shí)例來生成該對象的代碼簿。
圖1是根據(jù)例證性實(shí)施例的示例性生物測定登記系統(tǒng)的示意性框圖;圖2是用于實(shí)現(xiàn)根據(jù)例證性實(shí)施例的登記失敗機(jī)制的示例性過程的流程圖;圖3是根據(jù)利用語音的生物測定系統(tǒng)的例證性實(shí)施例、用于生成閾值的示例性訓(xùn)練過程的流程圖;并且圖4是以短期語音發(fā)聲作為生物測定輸入來實(shí)現(xiàn)的例證性生物測定系統(tǒng)的累積概率密度函數(shù)的圖解表示圖。
具體實(shí)施例方式
此處描述了用于實(shí)現(xiàn)一個(gè)過程的實(shí)施例,所述過程用于確定對于為用戶創(chuàng)建一個(gè)用在生物測定驗(yàn)證和/或識別系統(tǒng)中的唯一基準(zhǔn)模板而言,諸如用戶語音質(zhì)量之類的用戶生物測定輸入的質(zhì)量是否足夠可靠。這種機(jī)制的實(shí)現(xiàn)方式通過就先前不正確地拒絕了真實(shí)或者有效對象(例如,真實(shí)的語音發(fā)聲者)或者不正確地接受了冒名頂替者提供幫助,以此來幫助改善生物測定系統(tǒng)的性能。例如,可以使用此處所述的各種實(shí)施例來檢測所獲取的生物測定的不一致性,并且由此檢測生物測定系統(tǒng)的登記失敗狀態(tài)。
一般說來,可以根據(jù)從自對象中獲得的生物測定輸入(例如語音發(fā)聲)的第一實(shí)例(例如,第一次出現(xiàn))中提取出的特征向量來生成基準(zhǔn)模板??梢园褟淖运鰧ο螳@得的生物測定輸入的第二實(shí)例(例如,第二次出現(xiàn))中提取出的特征向量與所述基準(zhǔn)模板進(jìn)行比較,以便基于該生物測定輸入的第一和第二實(shí)例之間的相似/相異程度來生成匹配得分。所述生物測定輸入的第二實(shí)例包括生物測定輸入的第一實(shí)例的重復(fù)。如果匹配得分符合閾值標(biāo)準(zhǔn),則可以接受將所述對象登記到生物測定系統(tǒng)中。然而,如果匹配得分不能符合閾值標(biāo)準(zhǔn),那么可以拒絕將所述對象登記到生物測定系統(tǒng)中。所述閾值標(biāo)準(zhǔn)可以基于有效(或者真實(shí))對象和冒名頂替者之間的相等差錯(cuò)率。所述相等差錯(cuò)率可以通過有效對象的概率密度函數(shù)和冒名頂替者概率密度函數(shù)之間的交點(diǎn)來定義。在一個(gè)實(shí)施例中,可以從對象的生物測定輸入的第三實(shí)例(例如第三次出現(xiàn))中提取特征向量,并將其與所述基準(zhǔn)模板相比較,以便基于生物測定輸入的第一和第三實(shí)例之間的相似/相異程度來生成匹配得分。在一種實(shí)現(xiàn)方式中,每次語音發(fā)聲的持續(xù)時(shí)間可以小于三秒左右。在另一個(gè)實(shí)現(xiàn)方式中,每次語音發(fā)聲的持續(xù)時(shí)間可以小于兩秒左右。所述匹配得分可以包括失真得分,該失真得分用于表示生物測定輸入的第二實(shí)例的特征向量與根據(jù)從生物測定輸入的第一實(shí)例提取出的特征向量而生成的所述模板的失真度。
圖1是根據(jù)例證性實(shí)施例的可以用于實(shí)現(xiàn)登記失敗機(jī)制的示例性生物測定登記系統(tǒng)100的示意性框圖。在此示例性的生物測定登記系統(tǒng)100中,用戶的生物測定輸入102(例如,用戶進(jìn)行的語音發(fā)聲)可以通過數(shù)據(jù)獲取部件104來獲取。在所述生物測定輸入包括由用戶進(jìn)行語音發(fā)聲的實(shí)施例中,語音發(fā)聲例如可以包括由用戶講出的密碼。所述數(shù)據(jù)獲取部件104可以記錄用戶的生物測定輸入,并且向特征提取部件106提供所獲取的生物測定輸入。在一個(gè)實(shí)施例中,所述數(shù)據(jù)獲取部件可以包括緩沖器,用于臨時(shí)存儲所述生物測定輸入。在語音發(fā)聲實(shí)現(xiàn)方式中,可以把緩沖器稱為輸入語音發(fā)聲緩沖器。所述特征提取部件106處理所獲取的生物測定輸入,以便提取出被稱為特征向量的生物測定輸入的特性特征。特征向量例如可以包括該生物測定輸入的唯一、可識別的特征。
可以把提取出的特征向量提供給登記部件108(也稱為“登記失敗判定部件”),該部件可以通過分析提取出的特征向量、基于生物測定輸入的質(zhì)量來確定是否把該用戶登記在生物測定系統(tǒng)中。在生物測定輸入包括語音發(fā)聲的實(shí)現(xiàn)方式中,所述登記部件可以確定對于生成唯一的用戶語音模式而言,所記錄的語音發(fā)聲是否具有足夠的質(zhì)量,其中所述的用戶語音模式以后可以用于識別所述用戶。如果所述登記部件108確定所記錄的生物測定輸入可用于創(chuàng)建用戶的唯一模式(即,確定所提取的特征具有足夠的或者非常好的質(zhì)量),那么可以按照“No(否)”分支,模板生成部件110可以使用例如模式匹配技術(shù)、基于提取出的特征向量來生成用戶模板。所生成的模板可以存儲在模板數(shù)據(jù)庫112中。在生物測定輸入是語音的實(shí)現(xiàn)方式中,所生成的模板可以包括用戶的唯一聲波紋。
反之,如果所述登記部件108確定所記錄的生物測定輸入無法用于創(chuàng)建用戶的唯一模式(換言之,生物測定輸入的質(zhì)量太差以至于無法用于生物測定系統(tǒng)),那么可以生成登記失敗錯(cuò)誤(如“Yes(是)”分支所示)。
圖2是用于實(shí)現(xiàn)根據(jù)例證性實(shí)施例的登記失敗機(jī)制的示例性過程200的流程圖。此過程200例如可以作為生物測定登記過程的前身或者作為一部分來實(shí)現(xiàn),以便用于生物測定驗(yàn)證和/或識別系統(tǒng)。此過程200的實(shí)施例可以用于使用語音發(fā)聲作為用戶生物測定輸入的生物測定系統(tǒng)中(這種生物測定系統(tǒng)可以稱為“語音生物測定系統(tǒng)”),并且在使用短期發(fā)聲的語音生物測定系統(tǒng)中尤其有用,諸如語音發(fā)聲的持續(xù)時(shí)間為兩、三秒或更少的系統(tǒng)。此過程200的實(shí)施例可以使用圖1的示例性系統(tǒng)100來執(zhí)行。
作為過程200的一部分,可以提示用戶提供用戶生物測定輸入的多個(gè)樣本。例如,在一種實(shí)現(xiàn)方式中,所述登記系統(tǒng)可以要求用戶提供相同語音發(fā)聲的至少兩次重復(fù)(例如,所講密碼)?,F(xiàn)在,將在用戶提供相同生物測定輸入的至少三次重復(fù)(例如,相同語音發(fā)聲的至少三次重復(fù))的環(huán)境下來描述過程200的實(shí)施例。
可以在數(shù)據(jù)獲取操作202中獲得用戶的初始生物測定輸入。在一個(gè)實(shí)施例中,響應(yīng)于呈現(xiàn)給用戶的適當(dāng)提示,可以從所述用戶那里獲得此初始生物測定輸入。在圖1的示例性系統(tǒng)100中,所述數(shù)據(jù)獲取操作202可以通過數(shù)據(jù)獲取部件104來執(zhí)行。在語音實(shí)現(xiàn)方式中,所獲得的生物測定輸入例如可以包括用戶講出的密碼。
在特征提取操作204中、從在提取操作202中獲取的生物測定輸入中提取特征向量。在示例性的系統(tǒng)100中,所述提取操作204可以通過特征提取部件106來執(zhí)行。
在判定206,如果用戶的生物測定輸入是從所述用戶接收的初始生物測定輸入(即,“第一實(shí)例”或者“第一重復(fù)”),那么重復(fù)次數(shù)等于一,并按照“Yes”分支,在生成模板操作208中基于初始生物測定輸入的特征向量來生成該用戶的預(yù)備模板(或者“基準(zhǔn)模板”)。可以把所生成的用戶預(yù)備模板存儲在模板數(shù)據(jù)庫210中。在語音發(fā)聲實(shí)現(xiàn)方式中,如果語音發(fā)聲的持續(xù)時(shí)間很短(即,小于兩至三秒),生物測定輸入可能沒有展現(xiàn)出很多的語音變化。因此,可以利用小型的模板來為這些有限的語音變化建模,所述小型模板諸如八至十六點(diǎn)向量量化代碼簿。在這種實(shí)現(xiàn)方式中,使用更大規(guī)模的代碼簿可能引起可利用的有限數(shù)據(jù)的過擬合(over fitting)。
在生成了基準(zhǔn)模板之后,返回212,并且從通過第二遍執(zhí)行操作202和204而自用戶處獲得的生物測定輸入的第二重復(fù)(或者“第二實(shí)例”)中提取特征向量。例如,響應(yīng)于對用戶的相應(yīng)提示(例如,請求),可以從用戶那里獲得生物測定的第二實(shí)例。
在進(jìn)行第二遍判定206的過程中,對于第二生物測定輸入(即,重復(fù)數(shù)不等于一),按照“No”分支,在模式匹配操作214中,把從生物測定輸入的第二重復(fù)中提取出的特征向量與從預(yù)備模板數(shù)據(jù)庫210檢索出的用戶預(yù)備模板進(jìn)行比較。例如,在一個(gè)實(shí)施例中,把從生物測定輸入的第二重復(fù)中提取的特征向量與生物測定輸入的第一重復(fù)的特征向量進(jìn)行比較。把表示第二生物測定輸入的特征向量與預(yù)備模板的特征向量之間的相似/相異程度的匹配得分(例如,失真得分)作為模式匹配操作214的比較結(jié)果而輸出。
在閾值判定216中,可以把所輸出的匹配得分與從登記失敗判定閾值數(shù)據(jù)存儲器218中獲得的閾值相比較。如果在判定216中,所述匹配得分超出閾值(例如,失真得分表明在第一和第二生物測定輸入之間存在有過多差異(即,第二生物測定輸入與第一生物測定輸入非常不同)),則確定第二生物測定輸入的質(zhì)量不足以用在登記中,并在操作220中生成登記失敗錯(cuò)誤(以此來表明登記失敗狀態(tài)),并拒絕所述樣本。在一個(gè)實(shí)施例中,可以從中提供用于判定216的閾值的所述登記失敗判定閾值數(shù)據(jù)存儲器218可以通過離線訓(xùn)練和統(tǒng)計(jì)分析過程來填充(populated)。
另一方面,如果所述匹配得分小于閾值(例如,失真得分表明第一和第二生物統(tǒng)計(jì)學(xué)之間的差異在使用所述生物測定輸入在生物測定系統(tǒng)中登記用戶的相似性的可接受范圍之內(nèi),(即,這些生物測定輸入可用于在生物測定系統(tǒng)中登記用戶)),那么可以使用至少第一和第二生物測定輸入來進(jìn)行進(jìn)一步處理,以便在進(jìn)一步接受的采樣操作222中、將所述用戶登記到生物測定系統(tǒng)中。
對生物測定輸入的第三重復(fù)(或者“第三生物測定輸入”)重復(fù)過程200。在該過程的所述迭代過程中,從第三生物測定輸入中提取出的特征向量(參見操作204)還可以與根據(jù)第一生物測定輸入的特征向量而生成的基準(zhǔn)模板相比較,以便確定第三生物測定輸入的特征向量是否在與第一生物測定輸入特征向量足以不同的范圍之內(nèi),并因此適用于在生物測定系統(tǒng)中登記所述用戶。
在一個(gè)實(shí)施例中,可以提示用戶在至少通過操作216處理了第二重復(fù)之后提供所述生物測定輸入的第三重復(fù)。在另一個(gè)實(shí)施例中,所述第二和第三生物測定輸入可以由用戶一個(gè)接一個(gè)地提供。在這樣的實(shí)施例中,所述第二和第三生物測定輸入可以被并行處理(即,相對同時(shí)或者并行地執(zhí)行過程200的兩次迭代),或者所述第三生物測定輸入可以被緩存在所述系統(tǒng)中,并且在第二生物測定輸入之后被處理(即,順序地、相繼地執(zhí)行過程200的兩次迭代)。
正如前面提到的那樣,從中提供用于判定216的閾值的所述登記失敗判定閾值數(shù)據(jù)存儲器218可以通過離線訓(xùn)練和統(tǒng)計(jì)分析過程來填充。圖3是根據(jù)利用語音(即,語音發(fā)聲)的生物測定系統(tǒng)的例證性實(shí)施例來生成閾值的示例性過程300的流程圖。雖然就語音生物測定系統(tǒng)描述了所述過程,但是應(yīng)該理解的是,此過程的實(shí)施例可以在使用其它類型的生物測定輸入的生物測定系統(tǒng)中實(shí)現(xiàn)。在這樣的過程300中生成的閾值可以用于圖2所示的過程200的實(shí)施例。具體地,由過程300生成的閾值可以用于登記失敗閾值確定216,并且可以存儲在閾值數(shù)據(jù)庫218中。在一個(gè)實(shí)施例中,所述訓(xùn)練過程300可以與圖2的過程200離線執(zhí)行。
所述閾值生成過程300可以利用訓(xùn)練數(shù)據(jù)庫302,該訓(xùn)練數(shù)據(jù)庫302包含來自一組給定講話者的一組語音發(fā)聲(例如,所講密碼),其中每個(gè)講話者均使其相關(guān)語音發(fā)聲的多個(gè)重復(fù)存儲在訓(xùn)練數(shù)據(jù)庫302中。例如,對于每個(gè)講話者來說,所述訓(xùn)練數(shù)據(jù)庫可以包含由給定講話者所講的密碼的多個(gè)重復(fù)的副本。在實(shí)現(xiàn)為短期間發(fā)聲的實(shí)施例中,數(shù)據(jù)庫中的所有發(fā)聲可以包括短期間發(fā)聲(例如,小于兩或者三秒的語音)。
對于訓(xùn)練數(shù)據(jù)庫302中的每個(gè)講話者來說,可以在特征提取操作304中、從所存儲的該特定講話者的語音發(fā)聲(即,生物測定輸入)中提取出特征向量,并用于在模板生成操作306中(例如使用模式匹配技術(shù))生成所述講話者的模板。在實(shí)現(xiàn)為短發(fā)聲的實(shí)施例中,所生成的基準(zhǔn)模板可以包括使用低復(fù)雜性和/或低計(jì)算的模式匹配技術(shù)而生成的八和/或十六點(diǎn)基準(zhǔn)模板,其中所述模式匹配技術(shù)能夠生成八和/或十六點(diǎn)基準(zhǔn)模板??梢园阉傻哪0宕鎯υ谀0鍞?shù)據(jù)庫308中。
所述閾值生成過程300還可以利用測試數(shù)據(jù)庫310,它是訓(xùn)練數(shù)據(jù)庫的副本,以便使測試數(shù)據(jù)庫310包含來自同一組講話者的相同語音發(fā)聲的副本,這些語音發(fā)聲與訓(xùn)練數(shù)據(jù)庫302中包含的那些相同(應(yīng)該注意的是,訓(xùn)練和測試數(shù)據(jù)庫可以是各自專用的)。在特征提取操作312中(與操作304相似),可以為每位講話者從存儲在測試數(shù)據(jù)庫中的多個(gè)語音發(fā)聲重復(fù)中提取特征向量。所述模板生成過程包括對所講密碼的多個(gè)重復(fù)的特征提取以及用于生成八或者十六點(diǎn)基準(zhǔn)模板的模式匹配技術(shù)。對于每位講話者來說,從所述模板數(shù)據(jù)庫308檢索出在操作306中生成的模板,并在模式匹配操作314中將其與在操作312中提取出的講話者的特征向量進(jìn)行比較。把來自測試數(shù)據(jù)庫的每位講話者的生物測定數(shù)據(jù)與所述模板的相應(yīng)特征向量和/或代碼字進(jìn)行匹配,以便獲得針對每位講話者的匹配得分,該匹配得分反映出從測試數(shù)據(jù)庫中的、給定講話者的發(fā)聲中提取出的特征向量與該模板的那些特征向量(即,從自訓(xùn)練數(shù)據(jù)庫中獲得的發(fā)聲副本中提取出的特征向量)之間的相似/相異程度。這些匹配得分包括一組可以被存儲在有效及冒名頂替者匹配得分?jǐn)?shù)據(jù)庫316中的有效匹配得分(或者真實(shí)用戶匹配得分)。
使用過程300,還可以為冒名頂替者生成匹配得分(“冒名頂替者匹配得分”)。為了生成冒名頂替者匹配得分,所述模式匹配操作314可以進(jìn)一步涉及把每個(gè)講話者的、具有講話者講出的密碼而非所預(yù)料的密碼(由有效講話者講出的無效密碼)的生物測定數(shù)據(jù)與有效密碼的模板進(jìn)行比較。根據(jù)此比較生成的匹配得分可以包括一組可以被存儲在匹配得分?jǐn)?shù)據(jù)庫316中的冒名頂替者得分。所述冒名頂替者匹配得分還可以包括通過對有效/真實(shí)講話者的不完整語音發(fā)聲的比較而推導(dǎo)出的得分。在一個(gè)實(shí)施例中,還可以把來自測試數(shù)據(jù)庫的每位講話者的生物測定數(shù)據(jù)與所有其他講話者的模板進(jìn)行匹配,并且把通過此比較得出的得分包括在該組冒名頂替者匹配得分中。
在過程300中生成的有效匹配得分和冒名頂替者匹配得分的分布可以通過累積分布來建模。
圖4是以短期語音發(fā)聲作為生物測定輸入來實(shí)現(xiàn)的例證性生物測定系統(tǒng)的累積概率密度函數(shù)的圖解表示400。如圖4所示,所述概率密度函數(shù)圖表400具有用于匹配分值(例如,失真分值)的軸402和概率軸404。該組有效匹配得分408(即,有效(或者真實(shí))對象的概率密度函數(shù))的正常曲線與該組冒名頂替者匹配得分410(即,冒名頂替者的概率密度函數(shù))之間的交點(diǎn)406(也稱為“臨界閾值”或者“相等差錯(cuò)率”或者“交叉差錯(cuò)率”)表示有效講話者和冒名頂替者之間的最大間隔點(diǎn)。在所述臨界閾值處,誤接受(即,系統(tǒng)接受冒名頂替者)的比例等于誤拒絕的比例(即,系統(tǒng)拒絕有效對象)。
在利用短期間語音發(fā)聲實(shí)現(xiàn)的示例性生物測定系統(tǒng)中,人們已經(jīng)注意到,如果有效講話者的匹配得分落入臨界閾值的1.33倍的范圍內(nèi),那么這樣的講話者的語音質(zhì)量對于生物測定系統(tǒng)隨后進(jìn)行接受/拒絕判定而言是足夠可靠的。此閾值組有助于不完全拒絕有效講話者所講的密碼。為了生成所述閾值,被清除的匹配得分對應(yīng)于通過將利用所講密碼的三個(gè)重復(fù)而生成的模板與測試密碼進(jìn)行比較而生成的匹配得分。在實(shí)際的在線登記過程中,密碼的重復(fù)可以與使用該密碼的一個(gè)重復(fù)而生成的模板進(jìn)行比較。在這種實(shí)現(xiàn)方式中,當(dāng)與脫機(jī)訓(xùn)練匹配得分的得分范圍相比時(shí),這些匹配得分具有不同的得分范圍,并將增加臨界閾值的33%考慮到所述得分范圍的變化中。
據(jù)此,示例性的登記失敗(FTE)閾值可以如下計(jì)算FTE閾值=臨界閾值+0.33×臨界閾值可以把計(jì)算出的登記失敗閾值存儲在閾值數(shù)據(jù)庫(例如,圖2中的數(shù)據(jù)庫218)中,并且在講話者向系統(tǒng)進(jìn)行登記的期間可用來進(jìn)行判定(例如,圖2中的判定216)。
此處所述的登記失敗機(jī)制的各種實(shí)施例可以通過提供屏幕或者過濾器來幫助防止極度不可靠的用戶向給定生物測定系統(tǒng)進(jìn)行注冊而實(shí)現(xiàn),以便改善生物測定系統(tǒng)(例如,語音生物測定系統(tǒng))的性能。由于模板很小(即,模板具有較小的存儲器容量),故登記失敗機(jī)制的實(shí)施例可以用于低復(fù)雜性的、使用固定的短期口述密碼的生物測定系統(tǒng)。
此處所述的各種實(shí)施例還可以使用包括計(jì)算機(jī)軟件、固件、硬件或者它們的任何組合或者子集的計(jì)算機(jī)編程或工程技術(shù)來實(shí)現(xiàn)。雖然此處提出的部件可以描述為具有各種子部件,但是各種子部件也可以被認(rèn)為是所述系統(tǒng)的部件。例如,在系統(tǒng)的任何部件上執(zhí)行的特定軟件模塊也可以被認(rèn)為是系統(tǒng)的部件。另外,本發(fā)明實(shí)施例或部件可以在具有諸如微處理器之類的中央處理單元以及經(jīng)由總線互聯(lián)的多個(gè)其他單元的計(jì)算機(jī)上實(shí)現(xiàn)。這種計(jì)算機(jī)還可以包括隨機(jī)存取存儲器(RAM),只讀存儲器(ROM),用于連接諸如盤存儲單元以及打印機(jī)之類的外圍設(shè)備至總線的I/O適配器,用于連接諸如鍵盤、鼠標(biāo)、揚(yáng)聲器、麥克風(fēng)之類的各種用戶接口裝置和/或其他諸如觸摸屏或者數(shù)字相機(jī)的用戶接口裝置至所述總線的用戶接口適配器,用于連接計(jì)算機(jī)至通信網(wǎng)絡(luò)(例如數(shù)據(jù)處理網(wǎng)絡(luò))的通信適配器以及用于連接總線至顯示裝置的顯示適配器。所述計(jì)算機(jī)可以利用諸如Microsoft Windows操作系統(tǒng)(O/S)、Macintosh O/S、Linux O/S和/或UNIX O/S之類的操作系統(tǒng)。本領(lǐng)域中普通技術(shù)人員將理解的是,實(shí)施例還可以在不同于所提及的這些平臺以及操作系統(tǒng)上實(shí)現(xiàn)。
本發(fā)明的實(shí)施例還可以使用計(jì)算機(jī)程序語言來實(shí)現(xiàn),所述語言諸如ActiveX、Java、C以及C++語言之類的,并且利用面向?qū)ο缶幊谭椒▉韺?shí)現(xiàn)。任何由此生成的具有計(jì)算機(jī)可讀代碼的程序都可以在一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)內(nèi)被具體實(shí)現(xiàn)或者被提供,由此構(gòu)成計(jì)算機(jī)程序產(chǎn)品(即,一種制造產(chǎn)品)。計(jì)算機(jī)可讀介質(zhì)例如可以是固定(硬)驅(qū)動器、軟盤、光盤、磁帶、諸如只讀存儲器(ROM)等等的半導(dǎo)體存儲器、或者諸如互聯(lián)網(wǎng)或者其他通信網(wǎng)絡(luò)或者鏈路的任何發(fā)送/接收媒介。可以制作包含計(jì)算機(jī)代碼的制造物,和/或通過直接執(zhí)行來自一個(gè)介質(zhì)的代碼、通過把代碼從一個(gè)介質(zhì)復(fù)制到另一個(gè)介質(zhì)或者通過經(jīng)由網(wǎng)絡(luò)來傳輸所述代碼來使用它。
所屬領(lǐng)域普通技術(shù)人員將很容易能夠把軟件與適當(dāng)?shù)耐ㄓ没蛘邔S糜?jì)算機(jī)硬件結(jié)合以便創(chuàng)建計(jì)算機(jī)系統(tǒng)或者計(jì)算機(jī)子系統(tǒng),由此來實(shí)現(xiàn)此處所述的各種實(shí)施例。
雖然已經(jīng)描述了各種實(shí)施例,但是僅僅通過舉例來體現(xiàn)它們,而不是限制性的。由此,任何實(shí)施例的廣度和范圍不應(yīng)該受到任何上述示例性實(shí)施例的限制,而是僅僅根據(jù)如下的權(quán)利要求書及其等效物來限定。
權(quán)利要求
1.一種用于確定是否接受登記對象的方法,包括根據(jù)從對象的生物測定輸入的第一實(shí)例中提取出的特征向量來生成模板;把從對象的生物測定輸入的第二實(shí)例中提取出的特征向量與所述模板進(jìn)行比較,以便基于所述生物測定輸入的第一和第二實(shí)例之間的相似度來生成匹配得分;以及如果所述匹配得分符合閾值標(biāo)準(zhǔn),則接受向生物測定系統(tǒng)中進(jìn)行登記的所述對象。
2.如權(quán)利要求1所述的方法,其中如果所述匹配得分不符合閾值標(biāo)準(zhǔn),則拒絕向所述生物測定系統(tǒng)中進(jìn)行登記的所述對象。
3.如權(quán)利要求1所述的方法,其中每個(gè)生物測定輸入包括語音發(fā)聲。
4.如權(quán)利要求3所述的方法,其中每次語音發(fā)聲的持續(xù)時(shí)間小于三秒左右。
5.如權(quán)利要求1所述的方法,其中所述匹配得分包括失真得分。
6.如權(quán)利要求1所述的方法,其中所述模板包括十六個(gè)或更少的代碼字。
7.如權(quán)利要求1所述的方法,其中所述模板包括八個(gè)代碼字。
8.如權(quán)利要求1所述的方法,其中登記包括基于所述生物測定輸入的至少第一和第二實(shí)例來為所述對象生成代碼簿。
9.如權(quán)利要求1所述的方法,還包括將從所述對象的生物測定輸入的第三實(shí)例中提取出的特征向量與所述模板進(jìn)行比較,以便基于所述生物測定輸入的第一和第三實(shí)例之間的相似度來生成匹配得分。
10.如權(quán)利要求1所述的方法,其中所述閾值標(biāo)準(zhǔn)基于相等差錯(cuò)率。
11.如權(quán)利要求10所述的方法,其中所述相等差錯(cuò)率可以通過有效對象的概率密度函數(shù)和冒名頂替者的概率密度函數(shù)之間的交點(diǎn)來定義。
12.一種用于確定是否接受登記對象的系統(tǒng),包括用于根據(jù)從對象的生物測定輸入的第一實(shí)例中提取出的特征向量來生成模板的裝置;用于把從對象的生物測定輸入的第二實(shí)例中提取出的特征向量與所述模板進(jìn)行比較、以便基于所述生物測定輸入的第一和第二實(shí)例之間的相似度來生成匹配得分的裝置;以及用于在所述匹配得分符合閾值標(biāo)準(zhǔn)的情況下接受向所述生物測定系統(tǒng)中進(jìn)行登記的所述對象的裝置。
13.如權(quán)利要求12所述的系統(tǒng),其中如果所述匹配得分不符合閾值標(biāo)準(zhǔn),則拒絕向所述生物測定系統(tǒng)中進(jìn)行登記的所述對象。
14.如權(quán)利要求12所述的系統(tǒng),其中每個(gè)生物測定輸入包括語音發(fā)聲。
15.如權(quán)利要求14所述的系統(tǒng),其中每次語音發(fā)聲的持續(xù)時(shí)間小于三秒左右。
16.如權(quán)利要求12所述的系統(tǒng),其中所述模板包括十六個(gè)或更少的代碼字。
17.一種用于確定是否接受登記對象的計(jì)算機(jī)程序產(chǎn)品,包括用于根據(jù)從對象的生物測定輸入的第一實(shí)例中提取出的特征向量來生成模板的計(jì)算機(jī)代碼;用于把從對象的生物測定輸入的第二實(shí)例中提取出的特征向量與所述模板進(jìn)行比較、以便基于所述生物測定輸入的第一和第二實(shí)例之間的相似度來生成匹配得分的計(jì)算機(jī)代碼;以及用于如果所述匹配得分符合閾值標(biāo)準(zhǔn)、則接受向生物測定計(jì)算機(jī)程序產(chǎn)品中進(jìn)行登記的所述對象的計(jì)算機(jī)代碼。
18.如權(quán)利要求17所述的計(jì)算機(jī)程序產(chǎn)品,其中如果所述匹配得分不符合閾值標(biāo)準(zhǔn),則拒絕向所述生物測定計(jì)算機(jī)程序產(chǎn)品中進(jìn)行登記的所述對象。
19.如權(quán)利要求17所述的所述計(jì)算機(jī)程序產(chǎn)品,其中每個(gè)生物測定輸入包括語音發(fā)聲。
20.如權(quán)利要求19所述的所述計(jì)算機(jī)程序產(chǎn)品,其中每次語音發(fā)聲的持續(xù)時(shí)間小于三秒左右。
全文摘要
本發(fā)明提供了一種用于確定是否接受在生物測定系統(tǒng)中登記對象的系統(tǒng)、方法以及計(jì)算機(jī)程序產(chǎn)品的實(shí)施例。根據(jù)一個(gè)實(shí)施例,可以根據(jù)從對象中獲得的生物測定輸入的第一實(shí)例中提取的特征向量來生成模板。把從生物測定輸入的第二實(shí)例中提取的特征向量與所述模板進(jìn)行比較,以便基于所述生物測定輸入的第一和第二實(shí)例之間的相似度來生成匹配得分。如果匹配得分符合閾值標(biāo)準(zhǔn),則可以接受向生物測定系統(tǒng)中進(jìn)行登記的所述對象。
文檔編號G06K7/00GK1841402SQ20051013419
公開日2006年10月4日 申請日期2005年12月27日 優(yōu)先權(quán)日2005年3月31日
發(fā)明者普拉布哈·森達(dá)拉姆 申請人:株式會社日立制作所