專利名稱:通過匹配取得的指紋來匹配數(shù)據(jù)對(duì)象的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于匹配指紋的方法和設(shè)備。
背景技術(shù):
指紋技術(shù)被用于識(shí)別媒體內(nèi)容(比如音頻或視頻)。音頻或視頻片斷通過從其中提取指紋來識(shí)別,并且在數(shù)據(jù)庫中查找所提取的指紋,在該數(shù)據(jù)庫中存儲(chǔ)已知內(nèi)容的指紋。如果所提取指紋和存儲(chǔ)指紋之間被認(rèn)為有足夠的相似性時(shí),該內(nèi)容被識(shí)別。
多媒體指紋的最初目的是一種建立兩個(gè)多媒體對(duì)象之間的感知等同的有效機(jī)制不是通過比較對(duì)象本身(典型地較大),而是比較相關(guān)聯(lián)地指紋(設(shè)計(jì)得較小)。在多數(shù)使用指紋技術(shù)的系統(tǒng)中,大量多媒體對(duì)象的指紋與其相關(guān)的元數(shù)據(jù)(例如在歌曲信息的情況下,藝術(shù)家的名字、標(biāo)題和唱片)一同存儲(chǔ)在數(shù)據(jù)庫中。指紋作為元數(shù)據(jù)的索引。隨即通過計(jì)算指紋并且將其在指紋/元數(shù)據(jù)數(shù)據(jù)庫中作為查詢來取得未識(shí)別多媒體內(nèi)容的元數(shù)據(jù)。使用指紋而不是多媒體內(nèi)容本身的優(yōu)點(diǎn)在三個(gè)方面減小了對(duì)內(nèi)存/存儲(chǔ)器的要求因?yàn)橹讣y相對(duì)較??;有效的比較因?yàn)橹X不相關(guān)性已經(jīng)從指紋中去除;以及有效的查找因?yàn)楸徊檎业臄?shù)據(jù)組較小。
指紋可被認(rèn)為是對(duì)象的簡(jiǎn)短摘要。因此,指紋函數(shù)可映射包含大量比特的對(duì)象X到僅有有限幾個(gè)比特的指紋F。指紋系統(tǒng)有五個(gè)主要參數(shù)魯棒性,可靠性,指紋尺寸,顆粒度以及查找速度(或縮放性)。
系統(tǒng)的魯棒性程度決定當(dāng)呈現(xiàn)信號(hào)退化的情況下,特定對(duì)象是否可從指紋中正確識(shí)別。為了達(dá)到高魯棒性,指紋F應(yīng)當(dāng)基于知覺特征,其對(duì)于信號(hào)退化是不變的(至少在某個(gè)程度上)。優(yōu)選的,嚴(yán)重的退化信號(hào)將仍產(chǎn)生類似于原始未退化信號(hào)的指紋的指紋?!罢`拒絕率”(FRR)通常用來表示指紋系統(tǒng)的魯棒性的尺度。當(dāng)知覺相似的對(duì)象的指紋過于不同而導(dǎo)致肯定的鑒別就會(huì)產(chǎn)生誤拒絕。
指紋系統(tǒng)的可靠性指對(duì)象多久被錯(cuò)誤識(shí)別一次。換句話說,可靠性涉及“誤接受率”(FAR)——即兩個(gè)不同對(duì)象被錯(cuò)誤宣告為相同的概率。
顯然,指紋尺寸對(duì)于任何指紋系統(tǒng)都很重要。通常,指紋尺寸越小,就有越多的指紋可被存儲(chǔ)在數(shù)據(jù)庫中。指紋尺寸經(jīng)常以比特每秒來表示并且很大程度上取決于需要用于指紋數(shù)據(jù)庫服務(wù)器的內(nèi)存資源。
顆粒度是一個(gè)取決于應(yīng)用的參數(shù),并且其涉及為了識(shí)別對(duì)象,對(duì)象的特定取樣需要有多長(zhǎng)(大)。
查找速度(或縮放性),顧名思義,指用于在指紋數(shù)據(jù)庫中找到指紋所需要的時(shí)間。
上述五個(gè)基本參數(shù)對(duì)彼此都有很大的影響。例如,為了達(dá)到較低的顆粒度,需要提取較大的指紋來獲得相等的可靠性。這是因?yàn)檎`接受率與指紋尺寸是相反關(guān)系的事實(shí)。另一個(gè)實(shí)例當(dāng)設(shè)計(jì)更魯棒的指紋時(shí)通常將增加查找速度。
在討論了指紋系統(tǒng)的基本參數(shù)后,將進(jìn)行典型指紋系統(tǒng)的概括描述。
指紋可基于從原始音頻或視頻信號(hào)中提取的特征向量。這些向量可關(guān)于相關(guān)的元數(shù)據(jù)(例如標(biāo)題、作者等)存儲(chǔ)在數(shù)據(jù)庫中。基于未知信號(hào)的接收,特征向量被從該未知信號(hào)中提取,其隨后被用作對(duì)指紋數(shù)據(jù)庫的查詢。如果查詢特征向量和其在數(shù)據(jù)庫中的最佳匹配之間的距離低于給出的閾值,那么兩個(gè)對(duì)象將被宣告為等同并且返回相關(guān)的元數(shù)據(jù)即被識(shí)別的接收內(nèi)容。
在匹配過程中使用的閾值是誤接受率(FAR)和誤拒絕率(FRR)之間的折衷。例如,增加閾值(即增加兩個(gè)指紋之間可接受的“距離”而仍使這些指紋被判斷為相似)會(huì)增加FAR,但同時(shí)其減小FRR。FAR和FRR之間的折衷通常通過被稱為Neyman-Pearson的方式來實(shí)現(xiàn)。這意味著所選擇的閾值是將FAR保持在預(yù)指定、可接受的水平以下的最小值。FRR不用來決定閾值,但其僅從所選擇的閾值中產(chǎn)生。
US2002/0178410A1(Haitsma,Kalker,Baggen和Oostveen)公開了一種用于產(chǎn)生和匹配多媒體內(nèi)容的指紋的方法和設(shè)備。在這篇文獻(xiàn)中,第4頁描述了如果取得的兩個(gè)指紋模塊H1和H2之間的漢明(Hamming)距離小于某個(gè)閾值T,兩個(gè)3秒的音頻剪輯如何被宣告為相似。
為了分析對(duì)閾值T的選擇,US2002/0178410的作者假設(shè)指紋提取過程產(chǎn)生隨機(jī)i.i.d.(獨(dú)立恒等分布)的比特。然后比特誤碼的數(shù)量將具有參數(shù)(n,p)的二項(xiàng)式分布,其中n等于提取的比特?cái)?shù)以及p(=0.5)是提取比特0或1的概率。因?yàn)閚較大,二項(xiàng)式分布可通過具有平均值為μ=np以及標(biāo)準(zhǔn)偏移為σ=np(1-p)]]>的正態(tài)分布來近似。給出指紋模塊H1,那么根據(jù)H1隨機(jī)選擇的指紋模塊H2具有小于T=αn的誤碼的概率如下給出FAR=12π∫(1-2α)n∞e-x22dx=12erfc(1-2α2n)=12erfc(1-2T2n)---(1)]]>但是,實(shí)際上魯棒的指紋沿時(shí)間軸具有高的相關(guān)性。這可能因?yàn)榈讓拥囊曨l序列的較大時(shí)間相關(guān)性,或者因?yàn)橐纛l幀的重疊。音頻指紋的實(shí)驗(yàn)顯示誤碼比特的數(shù)量是正態(tài)分布的,但是標(biāo)準(zhǔn)偏移是在i.i.d.情況下的大約三倍。因此等式(1)被修改為包括因子3。
FAR=12erfc(1-2T32n)---(2)]]>以上的方式假設(shè)指紋之間的分布是固定的。雖然這對(duì)于某些技術(shù)來說是合理的假設(shè),但是對(duì)于視頻指紋的情況絕對(duì)不是這樣。在視頻指紋中,視頻中“活動(dòng)”的數(shù)量直接反應(yīng)在指紋比特的相關(guān)性上延長(zhǎng)的靜止畫面產(chǎn)生恒定(即非常高相關(guān))的指紋,而“瞬間的”音頻剪輯將在指紋比特之間產(chǎn)生非常低的相關(guān)性。這種非固定導(dǎo)致了在決定適當(dāng)?shù)拈撝禃r(shí)的問題。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例的目的是提出一種用于提供自適應(yīng)閾值技術(shù)的配置。
根據(jù)本發(fā)明的第一方面,提供一種比較查詢指紋和候選指紋的方法,該方法特征在于包括決定查詢指紋和/或候選指紋的統(tǒng)計(jì)模式;并且在統(tǒng)計(jì)模式的基礎(chǔ)上,取得閾值距離,使得查詢指紋和候選指紋在該閾值距離內(nèi)將被宣告為相似。
本發(fā)明的第二方面提供一種匹配查詢對(duì)象和已知對(duì)象的方法,其中表示多個(gè)候選對(duì)象的多個(gè)候選指紋被預(yù)存儲(chǔ)在數(shù)據(jù)庫中,該方法包括接收作為查詢對(duì)象一部分的信息信號(hào)并從中建立查詢指紋以及將查詢指紋和數(shù)據(jù)庫中的候選指紋進(jìn)行比較,該方法特征在于其進(jìn)一步包括以下步驟決定查詢指紋和/或候選指紋的統(tǒng)計(jì)模式;并且在統(tǒng)計(jì)模式的基礎(chǔ)上,取得閾值距離,使得查詢指紋和候選指紋在該閾值距離內(nèi)將被宣告為相似。
在第一和第二方面的方法中,基于特定指紋的統(tǒng)計(jì)模式取得閾值提供了自適應(yīng)閾值設(shè)置,其根據(jù)查詢指紋類型/在任意閾值系統(tǒng)的應(yīng)用上給出改善匹配質(zhì)量的內(nèi)部特征來優(yōu)化F.A.R.。
優(yōu)選的,如果候選指紋被發(fā)現(xiàn)與查詢指紋相差的距離小于閾值距離,并且候選和查詢指紋之間的距離小于任何其它候選指紋和查詢指紋之間的距離,那么候選指紋被宣告為最佳匹配候選指紋并且由最佳匹配候選指紋所表示的候選對(duì)象以及由查詢指紋所表示的查詢對(duì)象被認(rèn)為相同。
優(yōu)選的,統(tǒng)計(jì)模式包括在查詢指紋和/或候選指紋中執(zhí)行內(nèi)部相關(guān)的結(jié)果。
優(yōu)選的,指紋包括二進(jìn)制值并且查詢指紋的統(tǒng)計(jì)模式通過決定對(duì)于查詢指紋的轉(zhuǎn)變概率q來計(jì)算,該轉(zhuǎn)變概率通過決定查詢指紋幀F(xiàn)(m,k)中有多少比特與在它們之前的指紋幀F(xiàn)(m,k-1)中相應(yīng)的比特不同并且將轉(zhuǎn)變的數(shù)量除以最大值M*(k-1)來得到,該最大值可在如果所有的指紋比特相對(duì)于它們之前的相應(yīng)比特都處于相反狀態(tài)時(shí)獲得,其中每個(gè)指紋每幀包括M比特并且跨越K幀,其中k是幀索引號(hào)(取值范圍從0到K)以及m是一幀中的比特索引號(hào)(取值范圍從0到M)。
然后閾值距離T可通過以下基于希望的誤接受率(FAR)的等式計(jì)算FAR=12erfc(1-2T2n1+(1-2q)2)1-(1-2q)2)---(4)]]>第三方面,本發(fā)明提供一種用于匹配查詢對(duì)象和已知對(duì)象的設(shè)備,該設(shè)備包括指紋提取模塊,其接收作為查詢對(duì)象一部分的信息信號(hào)并從中建立查詢指紋,以及指紋匹配模塊,其將查詢指紋和存儲(chǔ)在數(shù)據(jù)庫中的一個(gè)或多個(gè)候選指紋進(jìn)行比較,該設(shè)備特征在于其進(jìn)一步包括統(tǒng)計(jì)模塊,用于決定查詢指紋和/或一個(gè)或多個(gè)候選指紋的統(tǒng)計(jì)模式;閾值決定器,在統(tǒng)計(jì)模式的基礎(chǔ)上取得閾值距離T,使得查詢指紋和候選指紋在該閾值距離內(nèi)將被宣告為相似;以及鑒別模塊,其被配置以使得如果候選指紋被發(fā)現(xiàn)與查詢指紋相差的距離小于閾值距離T,并且候選和查詢指紋之間的距離小于任何其它候選指紋和查詢指紋之間的距離,那么候選指紋被宣告為最佳匹配候選指紋并且由最佳匹配候選指紋所表示的候選對(duì)象以及由查詢指紋所表示的查詢對(duì)象被認(rèn)為相同。
為了更好地理解本發(fā)明,并且顯示相同的實(shí)施例如何被實(shí)現(xiàn),將通過實(shí)例的方法參考以下附圖,其中圖1表示說明根據(jù)本發(fā)明實(shí)施例的具有自適應(yīng)閾值的指紋識(shí)別方法的功能模塊圖;圖2是解釋根據(jù)本發(fā)明實(shí)施例的通常包括在尋找和匹配指紋中的過程的流程圖;圖3是說明根據(jù)本發(fā)明實(shí)施例的通常用于決定自適應(yīng)閾值的方法的流程圖;圖4是說明根據(jù)本發(fā)明實(shí)施例的特定自適應(yīng)閾值設(shè)定方法的流程圖。
具體實(shí)施例方式
參見圖1,表示了劃分成客戶端100和數(shù)據(jù)庫服務(wù)器端200的功能模塊圖。在客戶端,通過指紋提取模塊110接收對(duì)象并且為對(duì)象計(jì)算查詢指紋F。查詢指紋F一方面?zhèn)鬟f給統(tǒng)計(jì)模塊120并且另一方面也傳遞給數(shù)據(jù)庫服務(wù)器端200。統(tǒng)計(jì)模塊120決定查詢指紋F的隨機(jī)性/相關(guān)性的尺度(例如其決定內(nèi)部相關(guān)性)并且將該信息傳遞給閾值決定器130。閾值決定器130基于來自模塊120的信息自適應(yīng)地設(shè)置閾值水平T并且將該閾值水平T傳遞給數(shù)據(jù)庫服務(wù)器端200。
在數(shù)據(jù)庫服務(wù)器端200,匹配模塊210從客戶端100接收查詢指紋F并且在已知指紋的數(shù)據(jù)庫中查找與該指紋最佳匹配的指紋。然后最佳匹配信息傳遞給閾值比較模塊220來決定最佳匹配候選指紋是否足夠接近(在閾值距離T之內(nèi))查詢指紋,來決定輸入對(duì)象和對(duì)應(yīng)于候選指紋的匹配對(duì)象之間的一致性。在指紋F使用二進(jìn)制值的情況下,閾值比較模塊220可例如,比較指紋模塊H1和與數(shù)據(jù)庫210中的最佳匹配者相關(guān)的指紋模塊H2之間的漢明距離,以檢查兩個(gè)模塊之間的漢明距離是否在從閾值決定模塊130提供給比較模塊220的閾值距離T以下。鑒別模塊230作出鑒別判決使得如果兩個(gè)取得的指紋模塊之間的漢明距離在閾值距離T以下,那么未識(shí)別的查詢對(duì)象被宣告為與在數(shù)據(jù)庫中發(fā)現(xiàn)的對(duì)象相似并且返回相關(guān)的元數(shù)據(jù)。
在以上的描述中查詢指紋F和閾值T是從客戶端100發(fā)送到數(shù)據(jù)庫服務(wù)器端200。在此當(dāng)然,應(yīng)當(dāng)注意的是閾值T也可在數(shù)據(jù)庫服務(wù)器端200中決定,并且因此對(duì)于上述模塊圖的修改也是當(dāng)然可行的。
現(xiàn)參見圖2,示出了一個(gè)流程圖,其解釋圖1的模塊圖的部件在查找和匹配指紋時(shí)的操作。
在步驟S100,對(duì)象取樣(例如在視頻的情況下一個(gè)短的“剪輯”)被接收并且基于該取樣決定查詢指紋。該查詢指紋可根據(jù)任何適當(dāng)?shù)默F(xiàn)有方法(比如在US2002/0178410A1中公開)來決定。在步驟S200(從路徑“A”到達(dá)),用于查詢指紋的閾值被根據(jù)查詢指紋的特定特征(隨機(jī)性/相關(guān)性)來決定。
在步驟S300,其與步驟S200同時(shí)執(zhí)行,查詢指紋與數(shù)據(jù)庫服務(wù)器端200所保持的指紋相匹配,返回最佳匹配候選者。同樣,匹配過程也可按照傳統(tǒng)地執(zhí)行,使得返回查詢指紋最接近匹配者。
在步驟S300,查詢指紋和最佳匹配候選者之間的“距離”將被決定,在步驟S400,其檢查該“距離”是否小于步驟S200中決定的閾值距離。如果查詢指紋和最佳匹配候選者之間的距離在步驟S400被發(fā)現(xiàn)大于閾值,那么在步驟S500中返回沒有找到查詢對(duì)象的匹配對(duì)象的結(jié)果。否則,如果查詢指紋和最佳匹配候選指紋之間的距離在步驟S400中小于閾值距離,那么在步驟S600就宣告查詢對(duì)象和數(shù)據(jù)庫中關(guān)于最佳匹配候選者的對(duì)象之間的匹配。然后最佳匹配對(duì)象的元數(shù)據(jù)等將被返回給用戶。
在圖2中,由虛線表示的路徑“A”從步驟S100指向步驟S200表示基于查詢指紋來設(shè)置閾值T=T1的一種選擇。但是可替換的,路徑“A”也可被忽略并且閾值T=T2可基于最佳匹配候選者的特征。這種可能性由從S300到S200的可替換路徑B表示。
還有一種替換,閾值T可基于查詢指紋和最佳匹配候選指紋二者的特性的結(jié)合,例如將閾值設(shè)置在所取得的兩個(gè)自適應(yīng)閾值T1,T2之間的平均值。
圖3是說明通常用于自適應(yīng)地決定給定閾值的方法的流程圖。
在步驟S210,接收查詢候選指紋并且決定指紋隨機(jī)性的尺度,然后在步驟S220根據(jù)在步驟S210找到的隨機(jī)性的尺度設(shè)置閾值距離。
可從以上和關(guān)于圖1的解釋中理解,在比較中使用的閾值T(T1或T2)自適應(yīng)于查詢指紋或/和最佳匹配候選者中之一的隨機(jī)性/相關(guān)性。更特別的,在對(duì)查詢指紋決定閾值的情況下,查詢指紋的相關(guān)性被決定并且從該相關(guān)性中計(jì)算匹配時(shí)將使用的閾值。內(nèi)部相關(guān)性被發(fā)現(xiàn)為越不隨機(jī),那么在不對(duì)FRR產(chǎn)生相反作用的情況下閾值距離T就越小。
如上所述,閾值是基于查詢指紋、最佳匹配指紋或二者的結(jié)合的內(nèi)部相關(guān)性來決定的。在指紋是二進(jìn)制并且指紋比特表現(xiàn)類似馬爾可夫(Markov)過程的情況下,可通過自適應(yīng)設(shè)置閾值來獲得一種解決方法。
對(duì)自適應(yīng)閾值設(shè)置問題的解決方法如圖4所示。在步驟S221,決定查詢的指紋的內(nèi)部相關(guān)性,在步驟S222指紋的轉(zhuǎn)變概率基于內(nèi)部相關(guān)性決定,以及在步驟S223,同時(shí)基于轉(zhuǎn)變概率(如下所解釋)和希望的誤接受率來自適應(yīng)設(shè)置閾值距離。
設(shè)定指紋每幀包括M比特并且跨越K幀。在這種情況下,指紋可由F(m,k)表示,其中k是幀索引號(hào)(取值范圍從0到K-1)以及m是一幀中的比特索引號(hào)(取值范圍從0到M-1)。設(shè)定q通過(q=Pr ob[bit(m,k)≠bit(m,k-1)])表示從幀k中提取出的指紋比特不等于幀k-1中相應(yīng)的指紋比特的概率。這個(gè)概率q被稱為轉(zhuǎn)變概率q。在相關(guān)性通過以下因子增長(zhǎng)(相對(duì)于完全隨機(jī)比特,其中q=1/2)的情況下1+(1-2q)21-(1-2q)2---(3)]]>結(jié)果是,誤接受率FAR通過以下關(guān)系式描述
FAR=12erfc(1-2T2n1+(1-2q)2)1-(1-2q)2)---(4)]]>使用上述關(guān)系式來從希望FAR以及計(jì)算的轉(zhuǎn)換概率q中計(jì)算自適應(yīng)閾值將被概括為以下提取指紋F決定指紋F的轉(zhuǎn)換概率q,如下決定多少指紋比特F(m,k)與它們之前的F(m,k-1)中的不同。
將在步驟(a)中計(jì)算的轉(zhuǎn)變的數(shù)量除以理論最大值M*(k-1)來決定轉(zhuǎn)換概率q=(比特轉(zhuǎn)變的數(shù)量)/(M*(K-1)),該最大值可在如果對(duì)于每一幀所有的指紋比特相對(duì)于前一幀中的比特都處于相反狀態(tài)時(shí)獲得。
從計(jì)算的值q和使用關(guān)系式(4)的定義預(yù)約定的誤接受率中決定將被用于匹配特定查詢指紋F的閾值T。
通過上述,閾值T可被自適應(yīng)地設(shè)置為T=T1(基于上述查詢指紋的相關(guān)性)或T=T2(基于上述最佳匹配指紋的相關(guān)性),或T=T3(基于T1,T2的結(jié)合[例如T=(T1+T2)2]]>])。然后,如果漢明距離小于T,就在判定步驟中宣告底層對(duì)象是相同的。
在本發(fā)明以上的特定實(shí)例中,閾值距離基于特定查詢?nèi)踊驅(qū)嶋H上特定候選取樣或取樣組的內(nèi)部特征自適應(yīng)地設(shè)置。但是,當(dāng)特定實(shí)例采用隨機(jī)性/相關(guān)性作為內(nèi)部特征進(jìn)行描述,還應(yīng)當(dāng)認(rèn)識(shí)到其它類型的統(tǒng)計(jì)分布也可被應(yīng)用到信息信號(hào)的某些類型上,并且因此本發(fā)明可被合理地?cái)U(kuò)展來根據(jù)任何給出的可應(yīng)用“統(tǒng)計(jì)模式”來提供自適應(yīng)閾值,預(yù)期查詢?nèi)踊蚝蜻x取樣指紋符合該統(tǒng)計(jì)模式。
此外,本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到當(dāng)圖2到圖4的流程圖表示了用于實(shí)現(xiàn)本發(fā)明的一種配置,其它的配置也是可能的。例如,除了在圖2的步驟S300中返回單個(gè)的最佳匹配候選者之外,閾值距離之內(nèi)的多個(gè)接近的匹配候選者可被返回并同時(shí)處理(或次之按序列處理)來由此計(jì)算“最佳”匹配。本發(fā)明也可使用被稱為“修剪”技術(shù)來應(yīng)用,其中如果很明顯它們不可能匹配那么數(shù)據(jù)庫中的某些候選者可被立即丟棄——然后查找/匹配可在大大減小的查找空間中進(jìn)行。
根據(jù)本發(fā)明的實(shí)施例,公開了用于設(shè)置自適應(yīng)閾值的方法和設(shè)備,其中閾值取決于指紋的特定特征。該特定方法非常適用于匹配視頻內(nèi)容,但是不限于此。所描述的技術(shù)可應(yīng)用到多種不同的技術(shù)領(lǐng)域和多種不同的信號(hào)類型,包括但是不限于音頻信號(hào)、視頻信號(hào)、多媒體信號(hào)。
本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到上述過程可通過軟件、硬件或任何適用的結(jié)合來實(shí)現(xiàn)。
總之,本發(fā)明設(shè)計(jì)用于指紋匹配的方法和設(shè)備。本發(fā)明設(shè)備的一個(gè)實(shí)施例包括提供指紋提取模塊(110),指紋匹配模塊(210),統(tǒng)計(jì)模塊(120)和鑒別模塊。指紋提取模塊(110),其接收作為查詢對(duì)象一部分的信息信號(hào)并建立查詢指紋。指紋匹配模塊(210),其將查詢指紋和存儲(chǔ)在數(shù)據(jù)庫(215)中的候選指紋進(jìn)行比較來找到至少一個(gè)可能的最佳匹配候選者。同時(shí),統(tǒng)計(jì)模塊決定查詢指紋的統(tǒng)計(jì)模式從而,例如決定查詢指紋的統(tǒng)計(jì)分布。閾值決定器(120),在查詢指紋的分布的基礎(chǔ)上被配置以取得自適應(yīng)閾值距離T,使得查詢指紋和可能最佳匹配候選者在該閾值距離內(nèi)將被鑒別模塊(130)宣告為相似。通過根據(jù)查詢指紋的統(tǒng)計(jì)分布以自適應(yīng)方式設(shè)置閾值,可達(dá)到改善的誤接受率F.A.R.和其它優(yōu)點(diǎn)。
權(quán)利要求
1.一種比較查詢指紋和候選指紋的方法,該方法特征在于包括決定查詢指紋和/或候選指紋的統(tǒng)計(jì)模式,并且在統(tǒng)計(jì)模式的基礎(chǔ)上,取得閾值距離,使得查詢指紋和候選指紋在該閾值距離內(nèi)將被宣告為相似。
2.一種匹配查詢對(duì)象和已知對(duì)象的方法,其中表示多個(gè)候選對(duì)象的多個(gè)候選指紋被預(yù)存儲(chǔ)在數(shù)據(jù)庫中,該方法包括接收作為查詢對(duì)象一部分的信息信號(hào)并從中建立查詢指紋,以及將查詢指紋和數(shù)據(jù)庫中的候選指紋進(jìn)行比較,該方法特征在于其進(jìn)一步包括以下步驟決定查詢指紋和/或候選指紋的統(tǒng)計(jì)模式;并且在統(tǒng)計(jì)模式的基礎(chǔ)上,取得閾值距離,使得查詢指紋和候選指紋在該閾值距離內(nèi)將被宣告為相似。
3.如權(quán)利要求1或2所述的方法,其中如果候選指紋被發(fā)現(xiàn)與查詢指紋相差的距離小于閾值距離,并且候選和查詢指紋之間的距離小于任何其它候選指紋和查詢指紋之間的距離,那么候選指紋被宣告為最佳匹配候選指紋,并且由最佳匹配候選指紋所表示的候選對(duì)象以及由查詢指紋所表示的查詢對(duì)象被認(rèn)為相同。
4.如權(quán)利要求1、2或3所述的方法,其中統(tǒng)計(jì)模式包括在查詢指紋和/或候選指紋中執(zhí)行內(nèi)部相關(guān)的結(jié)果。
5.如權(quán)利要求4所述的方法,其中指紋包括多個(gè)包括二進(jìn)制值的幀并且查詢指紋的統(tǒng)計(jì)模式通過決定對(duì)于查詢指紋的轉(zhuǎn)變概率q來計(jì)算,該轉(zhuǎn)變概率通過決定查詢指紋的一幀F(xiàn)(m,k)中有多少比特與在它們之前的指紋幀F(xiàn)(m,k-1)中相應(yīng)的比特不同,并且將轉(zhuǎn)變的數(shù)量除以最大值M*(k-1)來得到,該最大值可在如果所有的指紋比特相對(duì)于它們之前的相應(yīng)比特都處于相反狀態(tài)時(shí)獲得,其中每個(gè)指紋包括每幀M比特并且跨越K幀,其中k是幀索引號(hào)(取值范圍從0到K)以及m是一幀中的比特索引號(hào)(取值范圍從0到M)。
6.如權(quán)利要求5所述的方法,其中閾值距離T可通過以下基于希望的誤接受率(FAR)的等式計(jì)算FAR=12erfc(1-2T2n1+(1-2q)21-(1-2q)2)]]>
7.一種用于匹配查詢對(duì)象和已知對(duì)象的設(shè)備,該設(shè)備包括指紋提取模塊(110),其接收作為查詢對(duì)象一部分的信息信號(hào)并從中建立查詢指紋,以及指紋匹配模塊(210),其將查詢指紋和存儲(chǔ)在數(shù)據(jù)庫(215)中的一個(gè)或多個(gè)候選指紋進(jìn)行比較,該設(shè)備特征在于其進(jìn)一步包括統(tǒng)計(jì)模塊(120),用于決定查詢指紋和/或一個(gè)或多個(gè)候選指紋的統(tǒng)計(jì)模式;閾值決定器(120),在統(tǒng)計(jì)模式的基礎(chǔ)上取得閾值距離T,使得查詢指紋和可能最佳匹配候選指紋在該閾值距離內(nèi)將被宣告為相似;以及鑒別模塊(230),其被配置以使得如果候選指紋被發(fā)現(xiàn)與查詢指紋相差的距離小于閾值距離T,并且候選和查詢指紋之間的距離小于任何其它候選指紋和查詢指紋之間的距離,那么候選指紋被宣告為最佳匹配候選指紋,并且由最佳匹配候選指紋所表示的候選對(duì)象以及由查詢指紋所表示的查詢對(duì)象被認(rèn)為相同。
8.如權(quán)利要求7所述的設(shè)備,其中統(tǒng)計(jì)模塊(120)在查詢指紋和/或一個(gè)或多個(gè)候選指紋中執(zhí)行內(nèi)部相關(guān)。
9.如權(quán)利要求8所述的方法,其中指紋包括多個(gè)包括二進(jìn)制值的幀并且統(tǒng)計(jì)模塊(120)通過決定對(duì)于查詢指紋的轉(zhuǎn)變概率q來計(jì)算查詢指紋或/和候選指紋的統(tǒng)計(jì)模式,該轉(zhuǎn)變概率通過決定查詢指紋的一幀F(xiàn)(m,k)中有多少比特與在它們之前的指紋幀F(xiàn)(m,k-1)中相應(yīng)的比特不同,并且將轉(zhuǎn)變的數(shù)量除以最大值M*(k-1)來得到,該最大值可在如果所有的指紋比特相對(duì)于它們之前的相應(yīng)比特都處于相反狀態(tài)時(shí)獲得,其中每個(gè)指紋每幀包括M比特并且跨越K幀,其中k是幀索引號(hào)(取值范圍從0到K)以及m是一幀中的比特索引號(hào)(取值范圍從0到M)。
10.如權(quán)利要求9所述的方法,其中閾值決定器(130)可通過以下基于希望的誤接受率(FAR)的等式計(jì)算閾值距離TFAR=12erfc(1-2T2n1+(1-2q)21-(1-2q)2)]]>
全文摘要
本發(fā)明涉及一種用于通過提取和比較所述數(shù)據(jù)對(duì)象的指紋來匹配查詢數(shù)據(jù)對(duì)象和候選數(shù)據(jù)對(duì)象的方法和設(shè)備。在本發(fā)明設(shè)備的實(shí)施例中包括提供指紋提取模塊(110),指紋匹配模塊(210),統(tǒng)計(jì)模塊(120)和鑒別模塊。指紋提取模塊(110)接收作為查詢對(duì)象一部分的信息信號(hào)并建立查詢指紋。指紋匹配模塊(210)比較查詢指紋和存儲(chǔ)在數(shù)據(jù)庫(215)中的候選指紋來找到至少可能的最佳匹配候選者。同時(shí),統(tǒng)計(jì)模塊決定查詢指紋的統(tǒng)計(jì)模式從而,例如決定查詢指紋中的某些信息的統(tǒng)計(jì)分布。閾值決定器(120),在查詢指紋的分布的基礎(chǔ)上被配置以取得自適應(yīng)閾值距離T,使得查詢指紋和可能最佳匹配候選者在該閾值距離內(nèi)將被鑒別模塊(130)宣告為相似。通過設(shè)置取決于從查詢和/或候選指紋中取得的統(tǒng)計(jì)數(shù)據(jù)的閾值,可達(dá)到改善的誤接受率F.A.R.。
文檔編號(hào)G10L25/48GK1882984SQ200480033941
公開日2006年12月20日 申請(qǐng)日期2004年11月8日 優(yōu)先權(quán)日2003年11月18日
發(fā)明者J·C·烏斯特維恩, A·A·C·M·卡爾克, J·A·海特斯馬 申請(qǐng)人:皇家飛利浦電子股份有限公司