人臉圖片人名識別方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種人臉圖片人名識別方法和裝置,主要涉及計算機【技術(shù)領(lǐng)域】,主要目的在于準確識別出人臉圖片中的人臉的人名。方法包括:從目標人臉圖片對應的文本中提取人名;對目標人臉圖片進行人臉識別,識別出目標人臉圖片的相似人臉圖片,并獲取相似人臉圖片中人臉的人名;根據(jù)文本中的人名,以及相似人臉圖片中人臉的人名,確定目標人臉圖片中人臉的人名。根據(jù)本發(fā)明,將通過人臉識別技術(shù)識別出的相似人臉的人名和從對應文本中得到的人名綜合考慮,無疑能夠更加準確地確定目標人臉圖片中的人臉的人名。
【專利說明】人臉圖片人名識別方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機【技術(shù)領(lǐng)域】,具體而言,涉及一種人臉圖片人名識別方法和裝置。
【背景技術(shù)】
[0002]目前,人臉識別技術(shù)正在逐漸發(fā)展,但是由于人臉圖片往往存在光線、角度等方面的問題,容易造成難以準確識別出人臉對應人物的人名。
[0003]例如,某條新聞信息中報道了明星A的演唱會情況,并插入了具有明星A的臉部的照片,但基于現(xiàn)有的人臉識別技術(shù)進行識別后,得到結(jié)果為:照片中的人臉可能是明星A,也可能是明星B,且是明星B的可能性更大一些。此時,基于前述的人臉識別技術(shù)的識別結(jié)果來確定照片中人臉的人名,則非常容易出現(xiàn)錯誤。由此可見,僅基于人臉識別技術(shù)來確定人臉圖片中的人臉的人名,準確率是較低的。
【發(fā)明內(nèi)容】
[0004]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的人臉圖片人名識別方法和裝置。
[0005]依據(jù)本發(fā)明的一個方面,提供了一種人臉圖片人名識別方法,其包括:從目標人臉圖片對應的文本中提取人名;對所述目標人臉圖片進行人臉識別,識別出所述目標人臉圖片的相似人臉圖片,并獲取所述相似人臉圖片中人臉的人名;根據(jù)所述文本中的人名,以及所述相似人臉圖片中人臉的人名,確定所述目標人臉圖片中人臉的人名。
[0006]可選地,前述的方法,根據(jù)所述文本中的人名,以及所述相似人臉圖片中人臉的人名,確定所述目標人臉圖片中人臉的人名,具體包括:根據(jù)所述文本的屬性和/或所述文本與所述文本中人名之間的關(guān)系,為所述文本中的人名計算第一分值;根據(jù)所述相似人臉圖片與所述目標人臉圖片的相似度,為所述相似人臉圖片中人臉的人名計算第二分值;根據(jù)相同人名具有的第一分值和第二分值計算結(jié)果分值,并根據(jù)結(jié)果分值的大小確定所述目標人臉圖片中人臉的人名。
[0007]可選地,前述的方法,根據(jù)所述文本的屬性和/或所述文本與所述文本中人名之間的關(guān)系,為所述文本中的人名計算第一分值,具體包括:根據(jù)所述文本的屬性為所述文本中的人名計算第一子分值,根據(jù)所述文本與所述文本中人名的關(guān)系計算第二子分值,根據(jù)所述第一子分值和所述第二子分值計算所述第一分值。
[0008]可選地,前述的方法,所述文本的屬性包括:所述文本的類型、所述文本的所在位置和/或所述文本的發(fā)布者;所述文本與所述文本中的人名的關(guān)系包括:所述文本中的人名在所述文本中的位置和/或出現(xiàn)次數(shù)。
[0009]可選地,前述的方法,對所述目標人臉圖片進行人臉識別,識別出所述目標人臉圖片的相似人臉圖片,具體包括:獲取已收集的人臉圖片的特征,以及獲取所述目標人臉圖片的特征;將所述已收集的人臉圖片的特征與所述目標人臉圖片的特征進行比較,并根據(jù)比較結(jié)果確定所述相似人臉圖片。
[0010]可選地,前述的方法,根據(jù)相同人名具有的第一分值和第二分值計算結(jié)果分值,具體包括:計算所述相同人名具有的第一分值與預設(shè)的第一權(quán)值的乘積,以及所述相同人名具有的第二分值與預設(shè)的第二權(quán)值的乘積,并根據(jù)得到的乘積計算所述結(jié)果分值。
[0011]可選地,前述的方法,所述文本包括所述目標人臉圖片對應的文檔中的標題、正文和/或所述目標人臉圖片的環(huán)繞文本。
[0012]依據(jù)本發(fā)明的一個方面,還提供了一種人臉圖片人名識別裝置,其包括:人名提取模塊,用于從目標人臉圖片對應的文本中提取人名;人臉識別模塊,用于對所述目標人臉圖片進行人臉識別,識別出所述目標人臉圖片的相似人臉圖片,并獲取所述相似人臉圖片中人臉的人名;人名確定模塊,用于根據(jù)所述文本中的人名,以及所述相似人臉圖片中人臉的人名,確定所述目標人臉圖片中人臉的人名。
[0013]可選地,前述的裝置,所述人名確定模塊包括:第一分值計算模塊,用于根據(jù)所述文本的屬性和/或所述文本與所述文本中人名之間的關(guān)系,為所述文本中的人名計算第一分值;第二分值計算模塊,用于根據(jù)所述相似人臉圖片與所述目標人臉圖片的相似度,為所述相似人臉圖片中人臉的人名計算第二分值;結(jié)果分值計算模塊,用于根據(jù)相同人名具有的第一分值和第二分值計算結(jié)果分值,并根據(jù)結(jié)果分值的大小確定所述目標人臉圖片中人臉的人名。
[0014]可選地,前述的裝置,所述第一分值計算模塊根據(jù)所述文本的屬性為所述文本中的人名計算第一子分值,根據(jù)所述文本與所述文本中人名的關(guān)系計算第二子分值,根據(jù)所述第一子分值和所述第二子分值計算所述第一分值。
[0015]可選地,前述的裝置,所述文本的屬性包括:所述文本的類型、所述文本的所在位置和/或所述文本的發(fā)布者;所述文本與所述文本中的人名的關(guān)系包括:所述文本中的人名在所述文本中的位置和/或出現(xiàn)次數(shù)。
[0016]可選地,前述的裝置,所述人臉識別模塊包括:特征提取模塊,用于獲取已收集的人臉圖片的特征,以及獲取所述目標人臉圖片的特征;特征比較模塊,用于將所述已收集的人臉圖片的特征與所述目標人臉圖片的特征進行比較,并根據(jù)比較結(jié)果確定所述相似人臉圖片。
[0017]可選地,前述的裝置,所述結(jié)果分值計算模塊計算所述相同人名具有的第一分值與預設(shè)的第一權(quán)值的乘積,以及所述相同人名具有的第二分值與預設(shè)的第二權(quán)值的乘積,并根據(jù)得到的乘積計算所述結(jié)果分值。
[0018]可選地,前述的裝置,所述文本包括所述目標人臉圖片對應的文檔中的標題、正文和/或所述目標人臉圖片的環(huán)繞文本。
[0019]根據(jù)以上技術(shù)方案,可知本發(fā)明的人臉圖片人名識別方法和裝置至少具有以下優(yōu)占-
^ \\\.
[0020]在本發(fā)明的技術(shù)方案中,不但利用人臉識別技術(shù)來對目標人臉圖片進行了識別,并且考慮到目標人臉圖片對應的文本中所包含的人名,這是因為目標人臉圖片對應的文本往往與目標人臉圖片之間具有較緊密的關(guān)系,所以文本中涉及的人名包含了目標人臉圖片中人臉的人名,而將通過人臉識別技術(shù)識別出的相似人臉的人名和從對應文本中得到的人名綜合考慮,無疑能夠更加準確地確定目標人臉圖片中的人臉的人名。
[0021]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
【專利附圖】
【附圖說明】
[0022]通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0023]圖1示出了根據(jù)本發(fā)明的一個實施例的人臉圖片人名識別方法的流程圖;
[0024]圖2示出了根據(jù)本發(fā)明的一個實施例的人臉圖片人名識別方法的原理示意圖;
[0025]圖3示出了根據(jù)本發(fā)明的一個實施例的人臉圖片人名識別方法的局部流程圖;
[0026]圖4示出了根據(jù)本發(fā)明的一個實施例的人臉圖片人名識別方法的局部流程圖;
[0027]圖5示出了根據(jù)本發(fā)明的一個實施例的人臉圖片人名識別裝置的框圖;
[0028]圖6示出了根據(jù)本發(fā)明的一個實施例的人臉圖片人名識別裝置的模塊框圖;
[0029]圖7示出了根據(jù)本發(fā)明的一個實施例的人臉圖片人名識別裝置的模塊框圖。
【具體實施方式】
[0030]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
[0031]如圖1所示,本發(fā)明的一個實施例提供了一種人臉圖片人名識別方法,其包括:
[0032]步驟110,從目標人臉圖片對應的文本中提取人名。在本實施例中,對于文本的類型不做限制,例如,當目標人臉圖片位于一則新聞消息中時,則文本可以是該新聞消息的新聞內(nèi)容;當目標人臉圖片位于一篇科技文檔中時,則文本可以是該目標人臉圖片的上下文內(nèi)容。在本實施例中,目標人臉圖片通常與其對應文本之間存在緊密的聯(lián)系,所以可以確定文本中很可能存在著目標人臉圖片中的人臉的人名,例如,一則新聞消息中提供了一張明星的個人照片,而新聞內(nèi)容報道了明星的演唱會情況,則新聞內(nèi)容中提供了明星照片中明星的人名;一篇科技文檔提供了一張科學家的照片,且照片下方的文本是對于該科學家的生平介紹,則照片下方文本中提供了科學家的人名。文本中所提取的人名數(shù)量為一個或多個。
[0033]步驟120,對目標人臉圖片進行人臉識別,識別出目標人臉圖片的相似人臉圖片,并獲取相似人臉圖片中人臉的人名。在本實施例中,基于人臉識別技術(shù)識別出了目標人臉圖片的相似人臉圖片,且對所采用的人臉識別技術(shù)不進行限制,現(xiàn)有的任何人臉識別技術(shù)均可用于本實施例的技術(shù)方案。在本實施例中,可以在數(shù)據(jù)庫中預存儲大量已收集的人臉圖片以及每張人臉圖片中人臉的人名,則通過人臉識別技術(shù)可以從數(shù)據(jù)庫中找到相似人臉圖片,并能夠確定相似人臉圖片的人名。通過人臉識別技術(shù)得到的人名數(shù)量為一個或多個。
[0034]步驟130,根據(jù)文本中的人名,以及相似人臉圖片中人臉的人名,確定目標人臉圖片中人臉的人名。在本實施例中,由于綜合考慮了人臉識別技術(shù)識別出的人名以及文本中包含的人名,所以能夠更加準確地確定目標人臉圖片中人臉的人名。在本實施例中,對于如何確定目標人臉圖片中人臉的人名的方式不做限制,例如,對于一張新聞消息中的人臉圖片,從該新聞消息的新聞內(nèi)容中提取了“張三、李四”兩個人名,通過人臉識別方式得到了目標人臉圖片的兩張相似人臉圖片,并確定該兩張相似人臉圖片的名字分別為“李四、王五”,則同時被兩種方式獲取的“李四”的準確性比較較高,所以將“李四”確定為目標人臉圖片中人臉的人名;而假如,從該新聞消息的新聞內(nèi)容中提取了“張三”一個人名,通過人臉識別方式得到了目標人臉圖片的一張相似人臉圖片,并確定該相似人臉圖片的名字為“李四”,則以人臉識別技術(shù)得到的結(jié)果為準,將“李四”確定為目標人臉圖片中人臉圖片。
[0035]在本實施例的技術(shù)方案中,因為目標人臉圖片對應的文本往往與目標人臉圖片之間具有較緊密的關(guān)系,所以文本中涉及的人名包含了目標人臉圖片中人臉的人名,而將通過人臉識別技術(shù)識別出的相似人臉的人名和從對應文本中得到的人名綜合考慮,如示意圖圖2所示,無疑能夠更加準確地確定目標人臉圖片中的人臉的人名。
[0036]如圖3所示,本發(fā)明的另一個實施例提供了一種人臉圖片人名識別方法,步驟130具體包括:
[0037]步驟131,根據(jù)文本的屬性和/或文本與文本中人名之間的關(guān)系,為文本中的人名計算第一分值。在本實施例中,文本的不同屬性、文本與文本中人名之間的不同關(guān)系,能夠反映人名為目標人臉圖片中人臉的人名的可能性高低。例如,當文本的屬性為文本的類型時,例如,一則新聞消息中提供了一張明星的個人照片,而新聞內(nèi)容報道了明星的演唱會清況,則新聞內(nèi)容中的人名有很大可能是明星的人名,則文本中每個人名的第一分值可設(shè)置為90分;一篇文學作品中提供了一張作者的照片,而其正文中包含的人名可能只是作品主角而非作者的人名,則文本中每個人名的第一分值可設(shè)置為10分。同理,當文本與文本中人名的關(guān)系為人名在文本中出現(xiàn)的次數(shù)時,例如,一則配有人臉圖片的新聞消息中,人名I出現(xiàn)了 9次,而人名2出現(xiàn)了一次,則容易理解人名I更可能是人臉圖片中人臉的人名,所以人名I的第一分值可以設(shè)置為80分,而人名2的第一分值可設(shè)置為20分。本實施例中,對文本的屬性、文本與文本中人名之間的關(guān)系不做限制。
[0038]步驟132,根據(jù)相似人臉圖片與目標人臉圖片的相似度,為相似人臉圖片中人臉的人名計算第二分值。在本實施例中,容易理解,相似度更高的相似人臉圖片中的人臉更可能與目標人臉圖片中的人臉為同一張人臉,所以相似度較高的目標人臉圖片應該具有更高的分值。假設(shè)返回的K張相似圖片中,人名Namei出現(xiàn)了 M次,對應的相似度分別為Similarity」,計算其第二分值:
M
[0039]Name1- ^ Similari Iyj
―棚J=I
[0040]為便于計算,可將其進行標準化:
, Namei
Aame7- =—-—-
[0041]一 ^c--; v
Similari ty i
y=i
[0042]需要說明的是,上述各個公式并不是實現(xiàn)本發(fā)明的唯一公式,僅作為實施例的一種實現(xiàn)方式。技術(shù)人員可以根據(jù)業(yè)務需要對公式做適當變形,依然落在本發(fā)明的范圍之內(nèi),例如增添參數(shù)或倍數(shù)值等。
[0043]步驟133,根據(jù)相同人名具有的第一分值和第二分值計算結(jié)果分值,并根據(jù)結(jié)果分值的大小確定目標人臉圖片中人臉的人名。在本實施例中,第一分值和第二分值都反映了所獲得的人名為目標人臉圖片中人臉的人名的可能性高低,所以綜合第一分值和第二分值得到的結(jié)果分值,更能夠反映每個人名是否為目標人臉圖片中人臉的人名的可能性,則按結(jié)果分值的大小選擇相應的人名作為目標人臉圖片中人臉的人名,準確程度非常高。在本實施例中,對結(jié)果分值的計算方式不進行限制,例如,其可以是第一分值與第二分值的相加或相乘。例如,人名I的第一分值為80分、第二分值為60分,人名2的第一分值為90分、第二分值為20分,人名3只有第一分值為50分,結(jié)果分值的計算方式為第一分值和第二分值相加,則人名I的結(jié)果分值為140分、人名2的結(jié)果分值為110分,人名3的結(jié)果分值為50分,則選擇人名I作為目標人臉圖片的人名。
[0044]在本實施例的技術(shù)方案中,基于文本的屬性、文本與文本中人名之間的關(guān)系得到的第一分值、基于相似人臉圖片與目標人臉圖片的相似度得到的第二分值,都反映了每個人名為目標人臉圖片中人臉的人名的可能性高低,所以按照綜合第一分值和第二分值得到的結(jié)果分值來選取人名作為目標人臉圖片中人臉的人名,這種方式的準確性很高,尤其適用于通過文本提取、通過人臉識別技術(shù)得到了多個候選人名的情況。
[0045]本發(fā)明的另一個實施例提供了一種人臉圖片人名識別方法,步驟131,具體包括:
[0046]根據(jù)文本的屬性為文本中的人名計算第一子分值,根據(jù)文本與文本中人名的關(guān)系計算第二子分值,根據(jù)第一子分值和第二子分值計算第一分值。在本實施例中,同時考慮了文本的屬性、文本與文本中人名的關(guān)系,所以計算得到的第一分值明顯能夠反映每個人名為目標人臉圖片中人臉的人名的可能性高低。
[0047]例如,假設(shè)文本與文本中的人名的關(guān)系為人名在文本中的位置,容易理解人名出現(xiàn)的位置會反映出該人名是否為目標人臉圖片中人臉的人名的可能性高低,比如新聞消息中的最先出現(xiàn)的人名往往就是其中的人臉圖片中人臉的人名,而較后位置出現(xiàn)的人名為目標人臉圖片中人臉的人名的可能性較低,所以第一子分值也能夠反映出該人名是否為目標人臉圖片中人臉的人名的可能性高低。
[0048]例如,假設(shè)文本的屬性為文本的類型,則一張人臉圖片可能有多個文本,其類型可以能是人臉圖片的標題、內(nèi)容、環(huán)繞文本等;文本的類型不同,其能反映目標人臉圖片中人臉的人名的能力也不同,比如一張人臉圖片對應的標題是“明星A、明星B被封國際明星”,從標題僅能獲得這張人臉圖片可能包含的人名;再結(jié)合目標人臉圖片對應的正文內(nèi)容“中國新生代當紅人氣明星A”就可以找到這張圖片對應的人臉的人名。所以,第二子分值也能夠反映出該人名是否為目標人臉圖片中人臉的人名的可能性高低。
[0049]由于同一人名可能出現(xiàn)在P個文本中,所以采用以下方式計算人名第一分值Namei:
K
[0050]他肥‘=Y^Weightp X ^ightposii1e
P=I
[0051]假設(shè)共出現(xiàn)人名N個,可以將人名第一分值標準化:
, Namei
/feme, = —-^~
[0052]?
[0053]其中,Weightp為第一子分值,Weightposit1n為第二子分值。
[0054]需要說明的是,上述各個公式并不是實現(xiàn)本發(fā)明的唯一公式,僅作為實施例的一種實現(xiàn)方式。技術(shù)人員可以根據(jù)業(yè)務需要對公式做適當變形,依然落在本發(fā)明的范圍之內(nèi),例如增添參數(shù)或倍數(shù)值等。
[0055]本發(fā)明的另一個實施例提供了一種人臉圖片人名識別方法,文本的屬性包括但不限于:文本的類型、文本的所在位置和/或文本的發(fā)布者。在本實施例中,對于文本的類型,例如,標題中的人名為目標人臉圖片中人臉的人名的可能性較高,而正文中的人名為目標人臉圖片中人臉的人名的可能性較較低;對于文本的所在位置,文本位于知名網(wǎng)站則人名為目標人臉圖片中人臉的人名的可能性較高,而文本位于非知名網(wǎng)站則人名為目標人臉圖片中人臉的人名的可能性較較低;對于文本的發(fā)布者,較權(quán)威者發(fā)布文本中的人名為目標人臉圖片中人臉的人名的可能性較高,而非權(quán)威者發(fā)布的文本的人名為目標人臉圖片中人臉的人名的可能性較較低。
[0056]文本與文本中的人名的關(guān)系包括但不限于:文本中的人名在文本中的位置和/或出現(xiàn)次數(shù)。在本實施例中,對于文本中的人名在文本中的位置,例如,文本中較前位置的人名為目標人臉圖片中人臉的人名的可能性較高,而文本中較后位置的人名為目標人臉圖片中人臉的人名的可能性較較低。
[0057]如圖4所示,本發(fā)明的另一個實施例提供了一種人臉圖片人名識別方法,步驟120具體包括:
[0058]步驟121,獲取已收集的人臉圖片的特征,以及獲取目標人臉圖片的特征。在本實施例中,基于人臉特征提取,并通過圖像處理算法,檢測出人臉圖片中人臉的位置,并提取人臉的相關(guān)特征,多個特征形成多維向量以用于進行比較,例如,400維的向量。
[0059]步驟122,將已收集的人臉圖片的特征與目標人臉圖片的特征進行比較,并根據(jù)比較結(jié)果確定相似人臉圖片。在本實施例中,通過特征比較的方式,提供了一種有效地識別相似人臉圖片的方式。
[0060]本發(fā)明的另一個實施例提供了一種人臉圖片人名識別方法,步驟130具體包括:
[0061]計算相同人名具有的第一分值與預設(shè)的第一權(quán)值的乘積,以及相同人名具有的第二分值與預設(shè)的第二權(quán)值的乘積,并根據(jù)得到的乘積計算結(jié)果分值。
[0062]在本實施例中,第一權(quán)值和第二權(quán)值反映了正文和人臉識別兩種方式的重要程度,如第一權(quán)值設(shè)置得較大,則說明用戶較看重文本提取的結(jié)果,如第二權(quán)值設(shè)置得較大,則說明用戶較看重人臉識別的結(jié)果;因此,如果文本來源的可信度較高,則可以將第一權(quán)值設(shè)置得較大,如果人臉識別的算法較優(yōu),則可以將第二權(quán)值設(shè)置得較大,本實施例的技術(shù)方案有利于用戶調(diào)整第一分值和第二分值的影響程度,從而獲得最合理的結(jié)果分值。
[0063]基于前述實施例的公式,對于人名Namei計算其結(jié)果分值:
[0064]-^amei = Namei^t x Weighty + Name。x Weightfare
[0065]然后找出結(jié)果分值最高的人名:
[0066]Name = MAX (Namei)
[0067]如果所選人名的得分大于指定閾值Threshold,則將此人名作為目標人臉圖片中人臉的人名進行輸出。
[0068]需要說明的是,上述各個公式并不是實現(xiàn)本發(fā)明的唯一公式,僅作為實施例的一種實現(xiàn)方式。技術(shù)人員可以根據(jù)業(yè)務需要對公式做適當變形,依然落在本發(fā)明的范圍之內(nèi),例如增添參數(shù)或倍數(shù)值等。
[0069]本發(fā)明的另一個實施例提供了一種人臉圖片人名識別方法,文本包括但不限于目標人臉圖片對應的文檔中的標題、正文和/或目標人臉圖片的環(huán)繞文本。
[0070]如圖5所示,本發(fā)明的另一個實施例提供了一種人臉圖片人名識別裝置,其包括:
[0071]人名提取模塊510,用于從目標人臉圖片對應的文本中提取人名。在本實施例中,對于文本的類型不做限制,例如,當目標人臉圖片位于一則新聞消息中時,則文本可以是該新聞消息的新聞內(nèi)容;當目標人臉圖片位于一篇科技文檔中時,則文本可以是該目標人臉圖片的上下文內(nèi)容。在本實施例中,目標人臉圖片通常與其對應文本之間存在緊密的聯(lián)系,所以可以確定文本中很可能存在著目標人臉圖片中的人臉的人名,例如,一則新聞消息中提供了一張明星的個人照片,而新聞內(nèi)容報道了明星的演唱會情況,則新聞內(nèi)容中提供了明星照片中明星的人名;一篇科技文檔提供了一張科學家的照片,且照片下方的文本是對于該科學家的生平介紹,則照片下方文本中提供了科學家的人名。文本中所提取的人名數(shù)量為一個或多個。
[0072]人臉識別模塊520,用于對目標人臉圖片進行人臉識別,識別出目標人臉圖片的相似人臉圖片,并獲取相似人臉圖片中人臉的人名。在本實施例中,基于人臉識別技術(shù)識別出了目標人臉圖片的相似人臉圖片,且對所采用的人臉識別技術(shù)不進行限制,現(xiàn)有的任何人臉識別技術(shù)均可用于本實施例的技術(shù)方案。在本實施例中,可以在數(shù)據(jù)庫中預存儲大量已收集的人臉圖片以及每張人臉圖片中人臉的人名,則通過人臉識別技術(shù)可以從數(shù)據(jù)庫中找到相似人臉圖片,并能夠確定相似人臉圖片的人名。通過人臉識別技術(shù)得到的人名數(shù)量為一個或多個。
[0073]人名確定模塊530,用于根據(jù)文本中的人名,以及相似人臉圖片中人臉的人名,確定目標人臉圖片中人臉的人名。在本實施例中,由于綜合考慮了人臉識別技術(shù)識別出的人名以及文本中包含的人名,所以能夠更加準確地確定目標人臉圖片中人臉的人名。在本實施例中,對于如何確定目標人臉圖片中人臉的人名的方式不做限制,例如,對于一張新聞消息中的人臉圖片,從該新聞消息的新聞內(nèi)容中提取了“張三、李四”兩個人名,通過人臉識別方式得到了目標人臉圖片的兩張相似人臉圖片,并確定該兩張相似人臉圖片的名字分別為“李四、王五”,則同時被兩種方式獲取的“李四”的準確性比較較高,所以將“李四”確定為目標人臉圖片中人臉的人名;而假如,從該新聞消息的新聞內(nèi)容中提取了“張三”一個人名,通過人臉識別方式得到了目標人臉圖片的一張相似人臉圖片,并確定該相似人臉圖片的名字為“李四”,則以人臉識別技術(shù)得到的結(jié)果為準,將“李四”確定為目標人臉圖片中人臉圖片。
[0074]在本實施例的技術(shù)方案中,因為目標人臉圖片對應的文本往往與目標人臉圖片之間具有較緊密的關(guān)系,所以文本中涉及的人名包含了目標人臉圖片中人臉的人名,而將通過人臉識別技術(shù)識別出的相似人臉的人名和從對應文本中得到的人名綜合考慮,如示意圖圖2所示,無疑能夠更加準確地確定目標人臉圖片中的人臉的人名。
[0075]如圖6所示,本發(fā)明的另一個實施例提供了一種人臉圖片人名識別裝置,人名確定模塊530包括:
[0076]第一分值計算模塊531,用于根據(jù)文本的屬性和/或文本與文本中人名之間的關(guān)系,為文本中的人名計算第一分值。在本實施例中,文本的不同屬性、文本與文本中人名之間的不同關(guān)系,能夠反映人名為目標人臉圖片中人臉的人名的可能性高低。例如,當文本的屬性為文本的類型時,例如,一則新聞消息中提供了一張明星的個人照片,而新聞內(nèi)容報道了明星的演唱會情況,則新聞內(nèi)容中的人名有很大可能是明星的人名,則文本中每個人名的第一分值可設(shè)置為90分;一篇文學作品中提供了一張作者的照片,而其正文中包含的人名可能只是作品主角而非作者的人名,則文本中每個人名的第一分值可設(shè)置為10分。同理,當文本與文本中人名的關(guān)系為人名在文本中出現(xiàn)的次數(shù)時,例如,一則配有人臉圖片的新聞消息中,人名I出現(xiàn)了 9次,而人名2出現(xiàn)了一次,則容易理解人名I更可能是人臉圖片中人臉的人名,所以人名I的第一分值可以設(shè)置為80分,而人名2的第一分值可設(shè)置為20分。本實施例中,對文本的屬性、文本與文本中人名之間的關(guān)系不做限制。
[0077]第二分值計算模塊532,用于根據(jù)相似人臉圖片與目標人臉圖片的相似度,為相似人臉圖片中人臉的人名計算第二分值。在本實施例中,容易理解,相似度更高的相似人臉圖片中的人臉更可能與目標人臉圖片中的人臉為同一張人臉,所以相似度較高的目標人臉圖片應該具有更高的分值。假設(shè)返回的K張相似圖片中,人名Namei出現(xiàn)了 M次,對應的相似度分別為Similarity」,計算其第二分值:
M
[0078]Name1 = ^ Similarityf
'J=I
[0079]為便于計算,可將其進行標準化:
,Name:
Name, =—-—-
[0080]+ c..?.Similari ty3
J=I
[0081]需要說明的是,上述各個公式并不是實現(xiàn)本發(fā)明的唯一公式,僅作為實施例的一種實現(xiàn)方式。技術(shù)人員可以根據(jù)業(yè)務需要對公式做適當變形,依然落在本發(fā)明的范圍之內(nèi),例如增添參數(shù)或倍數(shù)值等。
[0082]結(jié)果分值計算模塊533,用于根據(jù)相同人名具有的第一分值和第二分值計算結(jié)果分值,并根據(jù)結(jié)果分值的大小確定目標人臉圖片中人臉的人名。在本實施例中,第一分值和第二分值都反映了所獲得的人名為目標人臉圖片中人臉的人名的可能性高低,所以綜合第一分值和第二分值得到的結(jié)果分值,更能夠反映每個人名是否為目標人臉圖片中人臉的人名的可能性,則按結(jié)果分值的大小選擇相應的人名作為目標人臉圖片中人臉的人名,準確程度非常高。在本實施例中,對結(jié)果分值的計算方式不進行限制,例如,其可以是第一分值與第二分值的相加或相乘。例如,人名I的第一分值為80分、第二分值為60分,人名2的第一分值為90分、第二分值為20分,人名3只有第一分值為50分,結(jié)果分值的計算方式為第一分值和第二分值相加,則人名I的結(jié)果分值為140分、人名2的結(jié)果分值為110分,人名3的結(jié)果分值為50分,則選擇人名I作為目標人臉圖片的人名。
[0083]在本實施例的技術(shù)方案中,基于文本的屬性、文本與文本中人名之間的關(guān)系得到的第一分值、基于相似人臉圖片與目標人臉圖片的相似度得到的第二分值,都反映了每個人名為目標人臉圖片中人臉的人名的可能性高低,所以按照綜合第一分值和第二分值得到的結(jié)果分值來選取人名作為目標人臉圖片中人臉的人名,這種方式的準確性很高,尤其適用于通過文本提取、通過人臉識別技術(shù)得到了多個候選人名的情況。
[0084]本發(fā)明的另一個實施例提供了一種人臉圖片人名識別裝置,第一分值計算模塊531根據(jù)文本的屬性為文本中的人名計算第一子分值,根據(jù)文本與文本中人名的關(guān)系計算第二子分值,根據(jù)第一子分值和第二子分值計算第一分值。在本實施例中,同時考慮了文本的屬性、文本與文本中人名的關(guān)系,所以計算得到的第一分值明顯能夠反映每個人名為目標人臉圖片中人臉的人名的可能性高低。
[0085]例如,假設(shè)文本與文本中的人名的關(guān)系為人名在文本中的位置,容易理解人名出現(xiàn)的位置會反映出該人名是否為目標人臉圖片中人臉的人名的可能性高低,比如新聞消息中的最先出現(xiàn)的人名往往就是其中的人臉圖片中人臉的人名,而較后位置出現(xiàn)的人名為目標人臉圖片中人臉的人名的可能性較低,所以第一子分值也能夠反映出該人名是否為目標人臉圖片中人臉的人名的可能性高低。
[0086]例如,假設(shè)文本的屬性為文本的類型,則一張人臉圖片可能有多個文本,其類型可以能是人臉圖片的標題、內(nèi)容、環(huán)繞文本等;文本的類型不同,其能反映目標人臉圖片中人臉的人名的能力也不同,比如一張人臉圖片對應的標題是“明星A、明星B被封國際明星”,從標題僅能獲得這張人臉圖片可能包含的人名;再結(jié)合目標人臉圖片對應的正文內(nèi)容“中國新生代當紅人氣明星A”就可以找到這張圖片對應的人臉的人名。所以,第二子分值也能夠反映出該人名是否為目標人臉圖片中人臉的人名的可能性高低。
[0087]由于同一人名可能出現(xiàn)在P個文本中,所以采用以下方式計算人名第一分值Namei:
K
[0088]^amew = YjWeightp x Zfeightp05ifi0fl
P=I
[0089]假設(shè)共出現(xiàn)人名N個,可以將人名第一分值標準化:
, Name1
Tfeme, = —--—^
_0]- YName
QText
[0091]其中,Weightp為第一子分值,Weightposit1n為第二子分值。
[0092]需要說明的是,上述各個公式并不是實現(xiàn)本發(fā)明的唯一公式,僅作為實施例的一種實現(xiàn)方式。技術(shù)人員可以根據(jù)業(yè)務需要對公式做適當變形,依然落在本發(fā)明的范圍之內(nèi),例如增添參數(shù)或倍數(shù)值等。
[0093]本發(fā)明的另一個實施例提供了一種人臉圖片人名識別裝置,文本的屬性包括但不限于:文本的類型、文本的所在位置和/或文本的發(fā)布者。在本實施例中,對于文本的類型,例如,標題中的人名為目標人臉圖片中人臉的人名的可能性較高,而正文中的人名為目標人臉圖片中人臉的人名的可能性較較低;對于文本的所在位置,文本位于知名網(wǎng)站則人名為目標人臉圖片中人臉的人名的可能性較高,而文本位于非知名網(wǎng)站則人名為目標人臉圖片中人臉的人名的可能性較較低;對于文本的發(fā)布者,較權(quán)威者發(fā)布文本中的人名為目標人臉圖片中人臉的人名的可能性較高,而非權(quán)威者發(fā)布的文本的人名為目標人臉圖片中人臉的人名的可能性較較低。
[0094]文本與文本中的人名的關(guān)系包括但不限于:文本中的人名在文本中的位置和/或出現(xiàn)次數(shù)。在本實施例中,對于文本中的人名在文本中的位置,例如,文本中較前位置的人名為目標人臉圖片中人臉的人名的可能性較高,而文本中較后位置的人名為目標人臉圖片中人臉的人名的可能性較較低。
[0095]如圖7所示,本發(fā)明的另一個實施例提供了一種人臉圖片人名識別裝置,人臉識別模塊520包括:
[0096]特征提取模塊521,用于獲取已收集的人臉圖片的特征,以及獲取目標人臉圖片的特征。在本實施例中,基于人臉特征提取,并通過圖像處理算法,檢測出人臉圖片中人臉的位置,并提取人臉的相關(guān)特征,多個特征形成多維向量以用于進行比較,例如,400維的向量。
[0097]特征比較模塊522,用于將已收集的人臉圖片的特征與目標人臉圖片的特征進行比較,并根據(jù)比較結(jié)果確定相似人臉圖片。在本實施例中,通過特征比較的方式,提供了一種有效地識別相似人臉圖片的方式。
[0098]本發(fā)明的另一個實施例提供了一種人臉圖片人名識別裝置,結(jié)果分值計算模塊533計算相同人名具有的第一分值與預設(shè)的第一權(quán)值的乘積,以及相同人名具有的第二分值與預設(shè)的第二權(quán)值的乘積,并根據(jù)得到的乘積計算結(jié)果分值。在本實施例中,第一權(quán)值和第二權(quán)值反映了正文和人臉識別兩種方式的重要程度,如第一權(quán)值設(shè)置得較大,則說明用戶較看重文本提取的結(jié)果,如第二權(quán)值設(shè)置得較大,則說明用戶較看重人臉識別的結(jié)果;因此,如果文本來源的可信度較高,則可以將第一權(quán)值設(shè)置得較大,如果人臉識別的算法較優(yōu),則可以將第二權(quán)值設(shè)置得較大,本實施例的技術(shù)方案有利于用戶調(diào)整第一分值和第二分值的影響程度,從而獲得最合理的結(jié)果分值。
[0099]基于前述實施例的公式,對于人名Namei計算其結(jié)果分值:
[0100]^amei = Nameir x Weight7ext + Namei x Weighttire
[0101]然后找出結(jié)果分值最高的人名:
[0102]Name = MAX (Namei)
[0103]如果所選人名的得分大于指定閾值Threshold,則將此人名作為目標人臉圖片中人臉的人名進行輸出。
[0104]需要說明的是,上述各個公式并不是實現(xiàn)本發(fā)明的唯一公式,僅作為實施例的一種實現(xiàn)方式。技術(shù)人員可以根據(jù)業(yè)務需要對公式做適當變形,依然落在本發(fā)明的范圍之內(nèi),例如增添參數(shù)或倍數(shù)值等。
[0105]本發(fā)明的另一個實施例提供了一種人臉圖片人名識別裝置,文本包括但不限于目標人臉圖片對應的文檔中的標題、正文和/或目標人臉圖片的環(huán)繞文本。
[0106]在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
[0107]在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
[0108]類似地,應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循【具體實施方式】的權(quán)利要求書由此明確地并入該【具體實施方式】,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
[0109]本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進行自適應性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中。可以把實施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
[0110]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
[0111]本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的人臉圖片人名識別裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0112]應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
【權(quán)利要求】
1.一種人臉圖片人名識別方法,其包括: 從目標人臉圖片對應的文本中提取人名; 對所述目標人臉圖片進行人臉識別,識別出所述目標人臉圖片的相似人臉圖片,并獲取所述相似人臉圖片中人臉的人名; 根據(jù)所述文本中的人名,以及所述相似人臉圖片中人臉的人名,確定所述目標人臉圖片中人臉的人名。
2.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)所述文本中的人名,以及所述相似人臉圖片中人臉的人名,確定所述目標人臉圖片中人臉的人名,具體包括: 根據(jù)所述文本的屬性和/或所述文本與所述文本中人名之間的關(guān)系,為所述文本中的人名計算第一分值; 根據(jù)所述相似人臉圖片與所述目標人臉圖片的相似度,為所述相似人臉圖片中人臉的人名計算第二分值; 根據(jù)相同人名具有的第一分值和第二分值計算結(jié)果分值,并根據(jù)結(jié)果分值的大小確定所述目標人臉圖片中人臉的人名。
3.根據(jù)權(quán)利要求1-2任一項所述的方法,其中,根據(jù)所述文本的屬性和/或所述文本與所述文本中人名之間的關(guān)系,為所述文本中的人名計算第一分值,具體包括: 根據(jù)所述文本的屬性為所述文本中的人名計算第一子分值,根據(jù)所述文本與所述文本中人名的關(guān)系計算第二子分值,根據(jù)所述第一子分值和所述第二子分值計算所述第一分值。
4.根據(jù)權(quán)利要求1-3任一項所述的方法,其中, 所述文本的屬性包括:所述文本的類型、所述文本的所在位置和/或所述文本的發(fā)布者; 所述文本與所述文本中的人名的關(guān)系包括:所述文本中的人名在所述文本中的位置和/或出現(xiàn)次數(shù)。
5.根據(jù)權(quán)利要求1-4任一項所述的方法,其中,對所述目標人臉圖片進行人臉識別,識別出所述目標人臉圖片的相似人臉圖片,具體包括: 獲取已收集的人臉圖片的特征,以及獲取所述目標人臉圖片的特征; 將所述已收集的人臉圖片的特征與所述目標人臉圖片的特征進行比較,并根據(jù)比較結(jié)果確定所述相似人臉圖片。
6.根據(jù)權(quán)利要求1-5任一項所述的方法,其中,根據(jù)相同人名具有的第一分值和第二分值計算結(jié)果分值,具體包括: 計算所述相同人名具有的第一分值與預設(shè)的第一權(quán)值的乘積,以及所述相同人名具有的第二分值與預設(shè)的第二權(quán)值的乘積,并根據(jù)得到的乘積計算所述結(jié)果分值。
7.根據(jù)權(quán)利要求1-6中任一項所述的方法,其中, 所述文本包括所述目標人臉圖片對應的文檔中的標題、正文和/或所述目標人臉圖片的環(huán)繞文本。
8.—種人臉圖片人名識別裝置,其包括: 人名提取模塊,用于從目標人臉圖片對應的文本中提取人名; 人臉識別模塊,用于對所述目標人臉圖片進行人臉識別,識別出所述目標人臉圖片的相似人臉圖片,并獲取所述相似人臉圖片中人臉的人名; 人名確定模塊,用于根據(jù)所述文本中的人名,以及所述相似人臉圖片中人臉的人名,確定所述目標人臉圖片中人臉的人名。
9.根據(jù)權(quán)利要求8所述的裝置,其中,所述人名確定模塊包括: 第一分值計算模塊,用于根據(jù)所述文本的屬性和/或所述文本與所述文本中人名之間的關(guān)系,為所述文本中的人名計算第一分值; 第二分值計算模塊,用于根據(jù)所述相似人臉圖片與所述目標人臉圖片的相似度,為所述相似人臉圖片中人臉的人名計算第二分值; 結(jié)果分值計算模塊,用于根據(jù)相同人名具有的第一分值和第二分值計算結(jié)果分值,并根據(jù)結(jié)果分值的大小確定所述目標人臉圖片中人臉的人名。
10.根據(jù)權(quán)利要求8-9任一項所述的裝置,其中, 所述第一分值計算模塊根據(jù)所述文本的屬性為所述文本中的人名計算第一子分值,根據(jù)所述文本與所述文本中人名的關(guān)系計算第二子分值,根據(jù)所述第一子分值和所述第二子分值計算所述第一分值。
【文檔編號】G06K9/00GK104281842SQ201410539153
【公開日】2015年1月14日 申請日期:2014年10月13日 優(yōu)先權(quán)日:2014年10月13日
【發(fā)明者】薛紅霞, 陶哲, 胡金輝 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司