国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      獲取圖像描述信息的方法及裝置以及分類器訓(xùn)練方法

      文檔序號:6428021閱讀:206來源:國知局
      專利名稱:獲取圖像描述信息的方法及裝置以及分類器訓(xùn)練方法
      技術(shù)領(lǐng)域
      本發(fā)明一般地涉及圖像處理技術(shù)領(lǐng)域,尤其是一種獲取圖像描述信息的方法及裝置,分類器訓(xùn)練方法,以及圖像識別方法和裝置。
      背景技術(shù)
      隨著計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的迅速發(fā)展,在許多領(lǐng)域中,數(shù)字圖像的數(shù)量和復(fù)雜度都呈現(xiàn)出爆炸性的增長趨勢。因此,如何對這些海量圖像進(jìn)行快速有效的管理自然而然成為我們面臨的ー個(gè)挑戰(zhàn)課題,主要包括對這些圖像的訪問、存取、組織、檢索等。為了滿足這ー需求,自上個(gè)世紀(jì)九十年代以來,各個(gè)領(lǐng)域的研究人員和學(xué)者已經(jīng)投入了很多精力對圖像識別技術(shù)進(jìn)行研究,并開發(fā)出一些有效的技術(shù)和系統(tǒng)。
      ·
      在圖像識別系統(tǒng)中,根據(jù)圖像中的特征,如顔色、紋理和形狀特征,計(jì)算圖像間的距離,即確定圖像之間的相似度,完成圖像識別的功能。例如,對10類對象Cl. . . ClO進(jìn)行識另IJ,那么首先需要為每ー個(gè)類別(從Cl到C10)準(zhǔn)備ー些圖像,即訓(xùn)練圖像集(訓(xùn)練樣本),包含對象Cl的圖像組成Cl的訓(xùn)練圖像集,包含對象C2的圖像組成C2的訓(xùn)練圖像集...;然后,從這些訓(xùn)練圖像集中提取圖像特征;最后,根據(jù)這些圖像特征構(gòu)建模型。在識別階段,當(dāng)給定ー個(gè)待識別圖像時(shí),首先從該圖像中提取圖像特征,然后,利用之前構(gòu)建的模型判斷該圖像的類別,完成識別功能。然而,一幅圖像往往包含復(fù)雜的內(nèi)容,如包括前景對象和背景部分,而在圖像識別時(shí)往往只是針對前景對象,如果在識別過程提取圖像特征時(shí),對于整個(gè)圖像中的前景對象和背景部分毫無差別,會導(dǎo)致圖像識別的準(zhǔn)確度下降。因此,在提取圖像特征之前,如何盡可能的減小背景部分的影響,獲得更準(zhǔn)確的圖像描述信息是非常重要的。

      發(fā)明內(nèi)容
      有鑒于此,本發(fā)明實(shí)施例提供了一種圖像描述信息的獲取方法及裝置,能夠減小圖像中背景部分的影響,獲得更準(zhǔn)確的圖像描述信息。根據(jù)本發(fā)明實(shí)施例的ー個(gè)方面,提供一種基于多幅圖像獲取圖像描述信息的方法,包括分割所述多幅圖像,獲得所述多幅圖像的子圖像;基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子;基于所述子圖像的相似度因子計(jì)算所述子圖像所對應(yīng)的圖像的描述信息。根據(jù)本發(fā)明實(shí)施例的另ー個(gè)方面,提供一種分類器訓(xùn)練方法,包括利用上述基于多幅圖像獲取圖像描述信息的方法,將訓(xùn)練圖像作為所述多幅圖像,計(jì)算所述訓(xùn)練圖像的圖像描述信息;基于所述訓(xùn)練圖像的圖像描述信息訓(xùn)練分類器。根據(jù)本發(fā)明實(shí)施例的再ー個(gè)方面,提供ー種圖像識別方法,包括利用上述基于多幅圖像獲取圖像描述信息的方法,將待識別圖像與訓(xùn)練圖像共同作為所述多幅圖像,計(jì)算所述待識別圖像的圖像描述信息;基于所述待識別圖像的圖像描述信息,利用基于上述分類器訓(xùn)練方法訓(xùn)練的分類器,對所述待識別圖像進(jìn)行識別分類。根據(jù)本發(fā)明實(shí)施例的另ー個(gè)方面,提供一種基于多幅圖像獲取圖像描述信息的裝置,包括圖像分割単元,被配置成分割所述多幅圖像,獲得所述多幅圖像的子圖像;因子獲取單元,被配置成基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子;信息獲取單元,被配置成基于所述子圖像的相似度因子計(jì)算所述子圖像所對應(yīng)的圖像的描述信息。根據(jù)本發(fā)明實(shí)施例的另ー個(gè)方面,提供ー種圖像識別裝置,包括 如上所述的圖像描述信息獲取裝置,用于獲取待識別圖像的圖像描述信息;分類器,被配置為基于所述待識別圖像的圖像描述信息,對所述待識別圖像進(jìn)行識別分類。另外,根據(jù)本發(fā)明的另一方面,還提供了ー種存儲介質(zhì)。所述存儲介質(zhì)包括機(jī)器可讀的程序代碼,當(dāng)在信息處理設(shè)備上執(zhí)行所述程序代碼時(shí),所述程序代碼使得所述信息處理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述基于多幅圖像獲取圖像描述信息的方法。此外,根據(jù)本發(fā)明的再一方面,還提供了 ー種程序產(chǎn)品。所述程序產(chǎn)品包括機(jī)器可執(zhí)行的指令,當(dāng)在信息處理設(shè)備上執(zhí)行所述指令吋,所述指令使得所述信息處理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述基于多幅圖像獲取圖像描述信息的方法。根據(jù)本發(fā)明實(shí)施例的上述ー種方法,通過計(jì)算每一幅圖像中不同區(qū)域的子圖像的相似度因子,標(biāo)明了該圖像中各區(qū)域的重要度,從而在獲得圖像的描述信息時(shí),可以根據(jù)該圖像的特征及其對應(yīng)的相似度因子進(jìn)行計(jì)算,從而使圖像中重要度大的區(qū)域的特征占有較大的比重,而重要度小的區(qū)域的特征占有較小的比重,例如使圖像中前景對象在最終的特征中占有較大的比重,而背景內(nèi)容占有較小的比重,有效的減小了背景噪聲的影響,獲得了更準(zhǔn)確的圖像描述信息。在下面的說明書部分中給出本發(fā)明實(shí)施例的其他方面,其中,詳細(xì)說明用于充分地公開本發(fā)明實(shí)施例的優(yōu)選實(shí)施例,而不對其施加限定。


      下面結(jié)合具體的實(shí)施例,并參照附圖,對本發(fā)明實(shí)施例的上述和其它目的和優(yōu)點(diǎn)做進(jìn)ー步的描述。在附圖中,相同的或?qū)?yīng)的技術(shù)特征或部件將采用相同或?qū)?yīng)的附圖標(biāo)記來表示。圖I是示出作為本發(fā)明實(shí)施例提供一種基于多幅圖像獲取圖像描述信息的方法的流程圖;圖2是示出作為本發(fā)明實(shí)施例提供的分割圖像的方法流程圖;圖3是示出作為本發(fā)明實(shí)施例提供的ー種分割方式下獲得的圖像的示意圖;圖4是示出作為本發(fā)明實(shí)施例提供的另ー種分割方式下獲得的圖像的示意圖;圖5是示出作為本發(fā)明實(shí)施例提供的各子圖像的相似度因子的獲得方法流程圖6是示出作為本發(fā)明實(shí)施例提供的ー種分割方式下獲得的圖像權(quán)值矩陣的示意圖;圖7是示出作為本發(fā)明實(shí)施例提供的另ー種分割方式下獲得的圖像權(quán)值矩陣的示意圖 ;圖8是示出作為本發(fā)明實(shí)施例提供基于子圖像的相似度因子計(jì)算子圖像所對應(yīng)的圖像的描述信息的方法流程圖;圖9是示出作為本發(fā)明實(shí)施例提供的兩種分割方式下最終獲得的圖像權(quán)值矩陣的不意圖;圖10是示出作為本發(fā)明實(shí)施例提供的圖像特征點(diǎn)的示意圖;圖11是示出作為本發(fā)明實(shí)施例提供的一種基于多幅圖像獲取圖像描述信息的裝置的不意圖;圖12是示出作為本發(fā)明實(shí)施例提供的ー種圖像識別裝置的結(jié)構(gòu)示意圖;圖13是示出作為本發(fā)明的實(shí)施例中所采用的信息處理設(shè)備的個(gè)人計(jì)算機(jī)的示例性結(jié)構(gòu)的框圖。
      具體實(shí)施例方式
      下面參照附圖來說明本發(fā)明的實(shí)施例。參見圖1,本發(fā)明實(shí)施例提供的一種基于多幅圖像獲取圖像描述信息的方法包括SlOl :分割多幅圖像,獲得多幅圖像的子圖像。本發(fā)明實(shí)施例中,該多幅圖像可以是ー個(gè)訓(xùn)練圖像集。在獲取各圖像的描述信息時(shí),首先對該多幅圖像進(jìn)行分割獲得多幅圖像的子圖像,該分割過程可以采用ー種分割方式對每幅圖像進(jìn)行一次分割,也可以采用多種不同的分割方式對每幅圖像進(jìn)行多次分割。具體分割時(shí),可以采用網(wǎng)格劃分的方法進(jìn)行分割,將圖像分割成NXM的矩形區(qū)域,或者是三角形或多邊形網(wǎng)格,而且網(wǎng)格不要求是均勻的;此外,也可以采用各種現(xiàn)有的或者未來開發(fā)出的圖像分割算法,按圖像的內(nèi)容和/或視覺特征和/或其他特征進(jìn)行分割。其中,采用多種分割方式分割圖像時(shí),對同一圖像的分割方式盡量不同,在對多幅圖像的同一次分割中,不同圖像盡量采用相同的分割方式。S102:基于子圖像相互之間的特征相似性,獲得子圖像的相似度因子。在獲得各圖像的子圖像后,可以對每個(gè)子圖像提取特征,例如,顔色、形狀和紋理特征,然后計(jì)算該多幅圖像中各子圖像的特征之間的相似性,獲得各子圖像的相似度因子,某一子圖像與其它子圖像的相似度越高,該子圖像的相似度因子值也就越大。對于同一訓(xùn)練圖像集中的各圖像,相似度因子高的子圖像更有可能是其圖像中的關(guān)鍵區(qū)域,例如圖像中的前景對象。其中,用于計(jì)算子圖像相似度因子的方法有多種,例如采用排序(ranking)的方法對該多幅圖像中的所有子圖像進(jìn)行處理,如man ifold ranking或者pagerank技術(shù)等,其中,manifold ranking技術(shù)可參見作者為Dengyong Zhou,Jason Weston,Arthur Gretton,
      Ranking on Data Manifold,in Proceeding of the Advances in Neura丄Information Processing Systems 2003中的參考文獻(xiàn);pagerank技術(shù)可參見美國專利Method for node ranking in a linked database (公開號6,285,999,申請日2001 年9 月 4 日),美國專利 Method for scoring documents in a linked database (公開號6,799,176,申請日2004 年 9 月 28 日),美國專利 Method for node ranking in a linkeddatabase (公開號7, 058, 628,申請日2006 年 6 月 6 日),及美國專利 Scoring documentsin a linked database (公開號7,269,587,申請日2007年9月11日)。文獻(xiàn)的全部內(nèi)容通過此處的引用而全部結(jié)合到本申請中。按照各子圖像特征之間的相似性對各子圖像進(jìn)行排序,獲得各子圖像對應(yīng)的排名(rank)值,將該rank值作為對應(yīng)子圖像的相似度因子。其中,根據(jù)對多幅圖像的分割方式可以有不同的相似度因子計(jì)算方法,具體請參照后續(xù)實(shí)施例的描述。S103:基于子圖像的相似度因子計(jì)算子圖像所對應(yīng)的圖像的描述信息。在獲得圖像的描述信息時(shí),即可對圖像每ー個(gè)位置處的特征,按照該位置對應(yīng)的相似度因子進(jìn)行加權(quán)。各圖像中不同位置對應(yīng)的相似度因子與該圖像的分割方式相關(guān),對于采用ー種分割方式分割所述多幅圖像的情形,各圖像不同位置對應(yīng)的相似度因子即為該位置所對應(yīng)的子圖像的相似度因子,對于采用多種分割方式分割所述多幅圖像的情形,各 圖像不同位置對應(yīng)的相似度因子可以根據(jù)該位置所對應(yīng)的多個(gè)子圖像的相似度因子獲得。具體請參見后續(xù)實(shí)施例的描述。本發(fā)明實(shí)施例通過計(jì)算每一幅圖像中不同區(qū)域的子圖像的相似度因子,標(biāo)明了該圖像中各區(qū)域的重要度,從而在獲得圖像的描述信息時(shí),可以根據(jù)該圖像的特征及其對應(yīng)的相似度因子(即重要度)進(jìn)行計(jì)算,從而使圖像中重要度大的區(qū)域的特征占有較大的比重,而重要度小的區(qū)域的特征占有較小的比重,例如使圖像中前景對象在最終的特征中占有較大的比重,而背景內(nèi)容占有較小的比重,有效的減小了背景噪聲的影響,獲得了更準(zhǔn)確的圖像描述信息。在本發(fā)明的另ー實(shí)施例中,以采用兩種不同的分割方式分割多幅圖像為例進(jìn)行說明。如圖2所示,該分割圖像的過程可以包括以下步驟S201,將多幅圖像中的每幅圖像分割成2X2(或者其他數(shù)值)的矩形區(qū)域。如圖3所示,以其中一幅圖像A為例,分割后的圖像包括子圖像a、b、C、d。S202,將上述多幅圖像中的每幅圖像分割為3X3(或者其他數(shù)值)的矩形區(qū)域。如圖4所示,仍以圖像A為例,分割后的圖像包括子圖像e、f、g、h、i、j、k、I、m。以上兩個(gè)步驟互不相干,其順序可以根據(jù)需要調(diào)整,在其他實(shí)施例中,分割方式可以有更多種,此處不再一一贅述。以上述分割方式為例,各子圖像的相似度因子可以通過以下方法獲得,如圖5所示,該方法可以包括S501,提取所有子圖像的特征。該特征提取方法可以采用現(xiàn)有技術(shù)中的任何圖像特征提取技木,此處不再贅述。本實(shí)施例中的所有子圖像為上述多種分割方式下獲得的所有子圖像。S502,按照所有子圖像特征之間的相似性,對所有子圖像進(jìn)行排序,獲得各子圖像的排名值。在本實(shí)施例中,采用manifold ranking方法進(jìn)行排序,對多幅圖像進(jìn)行上述兩次分割后共得到N個(gè)子圖像,記為A1, ...,An。經(jīng)特征提取后,每個(gè)子圖像都生成一個(gè)特征向量,并將這些特征向量記為f1;... fN。首先初始化用向量R = Qr1, . . . , rN]表示各子圖像的rank值,并初始化為I,其中rN表示第N個(gè)子圖像的rank值(排名值);計(jì)算任意兩個(gè)特征向量も、fj之間的距離,記為Clijtl舉例計(jì)算可以采用歐式距離等方法來完成;根據(jù)子圖像特征向量之間的距離Clij,為每一個(gè)子圖像確定其k近鄰子圖像。即與某個(gè)子圖像距離最小的前k個(gè)子圖像作為該子圖像的k近鄰子圖像。其中,k為經(jīng)驗(yàn)參數(shù)。計(jì)算相似度矩陣W(affinity matrix);相似度矩陣根據(jù)子圖像特征向量之間的距 離得到,其大小為NxN矩陣,矩陣的每一行、每一列都對應(yīng)ー個(gè)子圖像。Wu表示矩陣中第i行、第j列的元素,σ為經(jīng)驗(yàn)參數(shù),可取所有du的平均值,或者其他經(jīng)驗(yàn)值。
      iexp(-^/2cr2)如果/;(或/プ)屬于/バ或/;)的k近鄰
      「1O矩陣W的歸ー化。S = D_1/2WD_1/2,其中,D是ー個(gè)對角矩陣,對角線上元素的值等于W中對應(yīng)行上元素的值的和;按照下式循環(huán)迭代,直到收斂R(t+1) = a * S * R(t) + (l_a) * I其中,a是
      之間的ー個(gè)經(jīng)驗(yàn)參數(shù),一般取接近于I的值。R(t+1)和R(t)分別表示在第t+Ι和第t次迭代時(shí)子圖像的rank值。S為上述對W進(jìn)行歸一化后得到的矩陣。獲得的各子圖像的排名值(Rank值)即可作為各子圖像的相似度因子。在另ー實(shí)施例中,各子圖像的相似度因子還可以通過其它方法獲得,例如,仍以上述圖3、4所示的兩種分割方式為例,在獲得兩種分割方式下多幅圖像的子圖像后,提取各子圖像的特征,然后對每ー種分割方式,基于該分割方式獲得的所有子圖像特征相互之間的相似性,獲得各子圖像的相似度因子。具體的,不是對兩種分割方式下的所有子圖像按照特征相似性進(jìn)行排序,而是針對不同的分割方式,對每一分割方式下獲得的所有子圖像進(jìn)行排序,也即進(jìn)行兩次排序,分別獲得各子圖像的相似度因子。對于更多種分割方式下,子圖像相似度因子的獲得方法也可以采用類似上述兩種方式,分別是基于所有分割方式獲得的所有子圖像的特征相互之間的相似性,獲得各子圖像的相似度因子;或者,對每ー種分割方式,基于該分割方式獲得的所有子圖像的特征相互之間的相似性,獲得各子圖像的相似度因子。當(dāng)然,在另ー實(shí)施例中,如果對上述多幅圖像采用的是ー種分割方式,則只需對獲得的所有子圖像進(jìn)行特征提取,然后根據(jù)子圖像特征之間的相似性計(jì)算各子圖像的相似度因子即可。在獲得各子圖像的相似度因子后,在本發(fā)明實(shí)施例中,如圖8所示,基于子圖像的相似度因子計(jì)算子圖像所對應(yīng)的圖像的描述信息,可以包括S801,根據(jù)各子圖像的相似度因子,獲得圖像的權(quán)值矩陣。在獲得各子圖像的相似度因子之后,根據(jù)各子圖像在圖像中的位置,即可獲得用于表征圖像各區(qū)域重要度的該圖像的權(quán)值矩陣。若采用多種分割方式對多幅圖像進(jìn)行分割,則不同分割方式下可獲得對應(yīng)的權(quán)值矩陣,如圖6、7所示,其中圖6所示的權(quán)值矩陣對應(yīng)于該圖像在如圖3所示的分割方式下獲得的各子圖像的相似度因子,圖7所示的權(quán)值矩陣對應(yīng)于同一圖像在如圖4所示的分割方式下獲得的各子圖像的相似度因子。則該圖像最終的權(quán)值矩陣可以基于圖6、7所示的權(quán)值矩陣獲得,具體的可以采用兩權(quán)值矩陣疊加的方式獲得,該疊加可以是圖6、7中重疊區(qū)域的相似度因子的相加,或相乘,或其它任何體現(xiàn)疊加效果的數(shù)學(xué)變換,例如最終該圖像權(quán)值矩陣如圖9所示,為對圖6、7所示的權(quán)值矩陣的疊加,也即對圖6、7中重疊區(qū)域的相似度因子的相加,該圖9所示的權(quán)值矩陣即表明了該圖像不同區(qū)域的重要性。若采用ー種分割方式對多幅圖像進(jìn)行分割,如只采用圖3所示的分割方式進(jìn)行分害I],則根據(jù)各子圖像在圖像中的位置獲得的圖6所示的權(quán)值矩陣即為該圖像最終的權(quán)值矩陣。在獲得圖像的權(quán)值矩陣后,后續(xù)即可利用該圖像的權(quán)值矩陣對圖像中的特征加權(quán),形成圖像的描述信息。
      S802,提取圖像的特征。該特征的提取可以采用傳統(tǒng)的方法,例如顔色直方圖、邊緣方向直方圖、局部特征等。該步驟802與步驟801可同時(shí)進(jìn)行或根據(jù)需要調(diào)整順序,此處不作限定。S803,根據(jù)圖像的權(quán)值矩陣,確定提取的圖像特征所處的位置所對應(yīng)的相似度因子。在獲得圖像的權(quán)值矩陣后,即獲得該圖像不同位置處所對應(yīng)的相似度因子,也即權(quán)值,進(jìn)而即可根據(jù)提取的圖像特征所在的位置,確定該位置處的相似度因子。以圖9所示的權(quán)值矩陣為例,提取的圖像特征所對應(yīng)的相似度因子即為該特征在圖9中的位置所對應(yīng)的權(quán)值。S804,根據(jù)該位置所對應(yīng)的相似度因子,對提取的特征進(jìn)行加權(quán),以獲得圖像的描述信息。以邊緣方向直方圖為例來說明,假設(shè)要生成的邊緣方向直方圖包含180個(gè)bin,即每個(gè)bin對應(yīng)于O度到180度邊緣方向區(qū)間中的I度,將該直方圖記為H。如圖10中的4個(gè)特征點(diǎn)a、b、c、d。假設(shè)這四個(gè)點(diǎn)對應(yīng)的邊緣方向分別為30度、45度、120度、30度。計(jì)算邊緣方向直方圖時(shí),需要遍歷圖像中的每個(gè)特征點(diǎn),并統(tǒng)計(jì)在各個(gè)邊緣方向上的特征點(diǎn)的個(gè)數(shù)。以圖10中的4個(gè)特征點(diǎn)為例當(dāng)遇到第一個(gè)特征點(diǎn)a時(shí),該特征點(diǎn)的邊緣方向?yàn)?0度,因此,需要在與30度對應(yīng)的直方圖bin上加上該特征點(diǎn)對應(yīng)的權(quán)值O. 4,得到H(30) = O. 4 ;同上述過程類似,對于特征點(diǎn)b和C,需要在與45度和120對應(yīng)的直方圖bin上加上b和c點(diǎn)對應(yīng)的權(quán)值,得到H(45) = O. 6,H(120) = O. 4 ;當(dāng)遇到第4個(gè)特征點(diǎn)d時(shí),該特征點(diǎn)的邊緣方向?yàn)?0度,因此,需要在與30度對應(yīng)的直方圖bin上加上該特征點(diǎn)對應(yīng)的權(quán)值O. 4。在之前的過程中,已經(jīng)得到H(30) = O. 4,所以,統(tǒng)計(jì)特征點(diǎn)d后,新的值為H(30) = O. 4+0. 4 = 0.8。H (30) = O. 4 a 點(diǎn)H (45) = O. 6 b 點(diǎn)
      H (120) =0.4 c 點(diǎn)H (30) = O. 4+0. 4 = O. 8 d 點(diǎn)通過圖像特征對應(yīng)位置處相似度因子的獲得,及根據(jù)相似度因子對特征的加權(quán),使前景對象在最終的特征中占有較大的比重,而背景內(nèi)容占有較小的比重,達(dá)到了減小背景噪聲的目的。在本發(fā)明的另ー實(shí)施例中,在對圖像每ー個(gè)位置的特征按照該位置所對應(yīng)的多個(gè)子圖像的相似度因子而得到的權(quán)值加權(quán)之前,可以先對不同分割方式下獲得的子圖像的相似度因子進(jìn)行歸一化,然后再對圖像每ー個(gè)位置的特征按照該位置所對應(yīng)的多個(gè)子圖像的歸ー化后的相似度因子而得到的權(quán)值加權(quán)。基于上述獲得圖像描述信息的方法,本發(fā)明實(shí)施例還提供一種分類器訓(xùn)練方法,該方法首先將訓(xùn)練圖像集中的訓(xùn)練圖像作為上述實(shí)施例中的多幅圖像,然后利用上述方法獲得訓(xùn)練圖像的圖像描述信息,然后基于該訓(xùn)練圖像的圖像描述信息訓(xùn)練分類器?!せ谏鲜鰣D像描述信息的方法,本發(fā)明實(shí)施例還提供ー種圖像識別方法,該方法首先將待識別圖像和訓(xùn)練圖像集中的訓(xùn)練圖像共同作為上述實(shí)施例中的多幅圖像,然后利用上述實(shí)施例的方法獲得待識別圖像的圖像描述信息,基于該待識別圖像的圖像描述信息,利用上述實(shí)施例提供的分類器對該待識別圖像進(jìn)行識別分類。本發(fā)明實(shí)施例還提供了一種基于多幅圖像的獲取圖像描述信息的裝置,如圖11所示,該裝置可以包括圖像分割単元1101,被配置成分割多幅圖像,獲得該多幅圖像的子圖像;因子獲取單元1102,被配置成基于子圖像相互之間的特征相似性,獲得子圖像的相似度因子;信息獲取單元1103,被配置成基于子圖像的相似度因子計(jì)算子圖像所對應(yīng)的圖像的描述信息。信息獲取單元具體可以被配置成對圖像每ー個(gè)位置的特征按照所對應(yīng)的相似度因子加權(quán)。圖像分割単元1101對該多幅圖像進(jìn)行分割獲得多幅圖像的子圖像,該分割過程可以采用ー種分割方式對每幅圖像進(jìn)行一次分割,也可以采用多種不同的分割方式對每幅圖像進(jìn)行多次分割,在獲得各圖像的子圖像后,因子獲取單元1102對每個(gè)子圖像提取特征,然后計(jì)算該多幅圖像中各子圖像的特征之間的相似性,獲得各子圖像的相似度因子,信息獲取單元1103,即可對圖像每ー個(gè)位置處的特征,按照該位置對應(yīng)的相似度因子進(jìn)行加權(quán),計(jì)算子圖像所對應(yīng)的圖像的描述信息。本發(fā)明實(shí)施例通過上述単元計(jì)算每一幅圖像中不同區(qū)域的子圖像的相似度因子,標(biāo)明了該圖像中各區(qū)域的重要度,從而在獲得圖像的描述信息時(shí),可以根據(jù)該圖像的特征及其對應(yīng)的相似度因子進(jìn)行計(jì)算,從而使圖像中重要度大的區(qū)域的特征占有較大的比重,而重要度小的區(qū)域的特征占有較小的比重,例如使圖像中前景對象在最終的特征中占有較大的比重,而背景內(nèi)容占有較小的比重,有效的減小了背景噪聲的影響,獲得了更準(zhǔn)確的圖像描述信息。在本發(fā)明的另ー實(shí)施例中,圖像分割単元,被進(jìn)ー步配置成按照多種不同的分割方式分割每一幅圖像;因子獲取單元,被進(jìn)ー步配置成對每ー種分割方式,基于該分割方式獲得的所有子圖像相互之間的特征相似性,獲得各子圖像的相似度因子,具體的可以采用ranking的方法,對子圖像進(jìn)行排序,獲得各子圖像的rank值;信息獲取單元,被進(jìn)ー步配置成對圖像每ー個(gè)位置的特征按照基于所述位置所對應(yīng)的多個(gè)子圖像的相似度因子得到的權(quán)值加權(quán)。在本發(fā)明的另ー實(shí)施例中,因子獲取單元,還可以被進(jìn)ー步配置成基于所有分割方式獲得的所有子圖像相互之間的特征相似性,獲得各子圖像的相似度因子。在本發(fā)明的另ー實(shí)施例中,信息獲取單元,還可以被進(jìn)ー步配置成對圖像每ー個(gè)位置的特征按照所述位置所對應(yīng)的子圖像的相似度因子加權(quán)。在本發(fā)明的另ー實(shí)施例中,該裝置還可以包括歸ー化単元,被配置成在所述對圖像每ー個(gè)位置的特征按照所述位置所對應(yīng)的多個(gè)子圖像的相似度因子而得到的權(quán)值加權(quán)之前,對不同分割方式下獲得的子圖像的相似度因子進(jìn)行歸一化,然后再由所述信息獲取単元對圖像每ー個(gè)位置的特征按照所述位置所對應(yīng)的多個(gè)子圖像的歸ー化后的相似度因子而得到的權(quán)值加權(quán)。
      在本發(fā)明的另ー實(shí)施例中,如圖12所示,為ー種圖像識別裝置,該裝置可以包括圖像描述信息獲取裝置1201,用于獲取待識別圖像的圖像描述信息。分類器1202,被配置為基于待識別圖像的圖像描述信息,對待識別圖像進(jìn)行識別分類。其中,圖像描述信息獲取裝置1201與前述實(shí)施例中的基于多幅圖像的獲取圖像描述信息的裝置類似,此處不再贅述,將待識別圖像作為上述多幅圖像中的其中一幅圖像,該圖像描述信息獲取裝置1201獲取待識別圖像的圖像描述信息后,由分類器1202基于該待識別圖像的圖像描述信息,對待識別圖像進(jìn)行識別分類,其中,該分類器1202采用前述實(shí)施例中的分類器訓(xùn)練方法進(jìn)行訓(xùn)練。另外,還應(yīng)該指出的是,上述系列處理和裝置也可以通過軟件和/或固件實(shí)現(xiàn)。在通過軟件和/或固件實(shí)現(xiàn)的情況下,從存儲介質(zhì)或網(wǎng)絡(luò)向具有專用硬件結(jié)構(gòu)的計(jì)算機(jī),例如圖13所示的通用個(gè)人計(jì)算機(jī)1300安裝構(gòu)成該軟件的程序,該計(jì)算機(jī)在安裝有各種程序時(shí),能夠執(zhí)行各種功能等等。在圖13中,中央處理單元(CPU) 1301根據(jù)只讀存儲器(ROM) 1302中存儲的程序或從存儲部分1308加載到隨機(jī)存取存儲器(RAM) 1303的程序執(zhí)行各種處理。在RAM 1303中,也根據(jù)需要存儲當(dāng)CPU 1301執(zhí)行各種處理等等時(shí)所需的數(shù)據(jù)。CPU 130UR0M 1302和RAM 1303經(jīng)由總線1304彼此連接。輸入/輸出接ロ 1305也連接到總線1304。下述部件連接到輸入/輸出接ロ 1305 :輸入部分1306,包括鍵盤、鼠標(biāo)等等;輸出部分1307,包括顯示器,比如陰極射線管(CRT)、液晶顯示器(IXD)等等,和揚(yáng)聲器等等;存儲部分1308,包括硬盤等等;和通信部分1309,包括網(wǎng)絡(luò)接ロ卡比如LAN卡、調(diào)制解調(diào)器等等。通信部分1309經(jīng)由網(wǎng)絡(luò)比如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動器1310也連接到輸入/輸出接ロ 1305??刹鹦督橘|(zhì)1311比如磁盤、光盤、磁光盤、半導(dǎo)體存儲器等等根據(jù)需要被安裝在驅(qū)動器1310上,使得從中讀出的計(jì)算機(jī)程序根據(jù)需要被安裝到存儲部分1308中。在通過軟件實(shí)現(xiàn)上述系列處理的情況下,從網(wǎng)絡(luò)比如因特網(wǎng)或存儲介質(zhì)比如可拆卸介質(zhì)1311安裝構(gòu)成軟件的程序。
      本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這種存儲介質(zhì)不局限于圖13所示的其中存儲有程序、與設(shè)備相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)1311??刹鹦督橘|(zhì)1311的例子包含磁盤(包含軟盤(注冊商標(biāo)))、光盤(包含光盤只讀存儲器(⑶-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD)(注冊商標(biāo)))和半導(dǎo)體存儲器?;蛘?,存儲介質(zhì)可以是ROM 1302、存儲部分1308中包含的硬盤等等,其中存有程序,并且與包含它們的設(shè)備一起被分發(fā)給用戶。還需要指出的是,執(zhí)行上述系列處理的步驟可以自然地按照說明的順序按時(shí)間順序執(zhí)行,但是并不需要一定按照時(shí)間順序執(zhí)行。某些步驟可以并行或彼此獨(dú)立地執(zhí)行。雖然已經(jīng)詳細(xì)說明了本發(fā)明及其優(yōu)點(diǎn),但是應(yīng)當(dāng)理解在不脫離由所附的權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下可以進(jìn)行各種改變、替代和變換。而且,本發(fā)明實(shí)施例的術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他 要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情
      況下,由語句“包括ー個(gè)......”限定的要素,并不排除在包括所述要素的過程、方法、物品
      或者設(shè)備中還存在另外的相同要素。關(guān)于包括以上實(shí)施例的實(shí)施方式,還公開下述附記附記I. 一種基于多幅圖像獲取圖像描述信息的方法,包括分割所述多幅圖像,獲得所述多幅圖像的子圖像;基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子;基于所述子圖像的相似度因子計(jì)算所述子圖像所對應(yīng)的圖像的描述信息。附記2.根據(jù)附記I所述的方法,其中,基于所述子圖像的相似度因子計(jì)算所述子圖像所對應(yīng)的圖像的描述信息的處理包括對圖像每ー個(gè)位置的特征按照所對應(yīng)的相似度因子加權(quán)。附記3.根據(jù)附記2所述的方法,對圖像每ー個(gè)位置的特征按照所對應(yīng)的相似度因子加權(quán)的處理包括對圖像每ー個(gè)位置的特征按照所述位置所對應(yīng)的子圖像的相似度因子加權(quán)。附記4.根據(jù)附記2所述的方法,其中,所述分割所述多幅圖像包括按照多種不同的分割方式分割每一幅圖像;其中,對圖像每ー個(gè)位置的特征按照所對應(yīng)的相似度因子加權(quán)的處理包括對圖像每ー個(gè)位置的特征按照基于所述位置所對應(yīng)的多個(gè)子圖像的相似度因子得到的權(quán)值加權(quán)。附記5.根據(jù)附記4所述的方法,其中,獲得所述子圖像的相似度因子的處理包括對每ー種分割方式,基于該分割方式獲得的所有子圖像相互之間的特征相似性,獲得各子圖像的相似度因子。附記6.根據(jù)附記4所述的方法,其中,獲得所述子圖像的相似度因子的處理包括基于所有分割方式獲得的所有子圖像相互之間的特征相似性,獲得各子圖像的相似度因子。
      附記7.根據(jù)附記4所述的方法,其中,在對圖像每ー個(gè)位置的特征按照基于所述位置所對應(yīng)的多個(gè)子圖像的相似度因子得到的權(quán)值加權(quán)之前,還包括對不同分割方式下獲得的子圖像的相似度因子進(jìn)行歸一化。附記8.根據(jù)附記I所述的方法,其中,獲得所述子圖像的相似度因子的處理包括采用排序的方法,基于所述子圖像相互之間的特征相似性,對所述子圖像進(jìn)行排序,獲得各子圖像的排名值,將獲得的各子圖像的排名值作為各子圖像的相似度因子。附記9. 一種分類器訓(xùn)練方法,包括利用如附記1-8所述的方法,將訓(xùn)練圖像作為所述多幅圖像,計(jì)算所述訓(xùn)練圖像的圖像描述信息; 基于所述訓(xùn)練圖像的圖像描述信息訓(xùn)練分類器。附記10. —種圖像識別方法,包括利用如附記1-8所述的方法,將待識別圖像與訓(xùn)練圖像共同作為所述多幅圖像,計(jì)算所述待識別圖像的圖像描述信息;基于所述待識別圖像的圖像描述信息,利用基于附記9的方法訓(xùn)練的分類器,對所述待識別圖像進(jìn)行識別分類。附記11. 一種基于多幅圖像獲取圖像描述信息的裝置,包括圖像分割単元,被配置成分割所述多幅圖像,獲得所述多幅圖像的子圖像;因子獲取單元,被配置成基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子;信息獲取單元,被配置成基于所述子圖像的相似度因子計(jì)算所述子圖像所對應(yīng)的圖像的描述信息。附記12.根據(jù)附記11所述的裝置,其中,所述信息獲取單元被進(jìn)ー步配置成對圖像每ー個(gè)位置的特征按照所對應(yīng)的相似度因子加權(quán)。附記13.根據(jù)附記12所述的裝置,其中,所述信息獲取單元被進(jìn)ー步配置成對圖像每ー個(gè)位置的特征按照所述位置所對應(yīng)的子圖像的相似度因子加權(quán)。附記14.根據(jù)附記12所述的裝置,其中,所述圖像分割単元被進(jìn)ー步配置成按照多種不同的分割方式分割每一幅圖像;所述信息獲取單元被進(jìn)ー步配置成對圖像每ー個(gè)位置的特征按照基于所述位置所對應(yīng)的多個(gè)子圖像的相似度因子得到的權(quán)值加權(quán)。附記15.根據(jù)附記14所述的裝置,其中,所述因子獲取單元被進(jìn)ー步配置成對每ー種分割方式,基于該分割方式獲得的所有子圖像相互之間的特征相似性,獲得各子圖像的相似度因子。附記16.根據(jù)附記14所述的裝置,其中,所述因子獲取單元被進(jìn)ー步配置成基于所有分割方式獲得的所有子圖像相互之間的特征相似性,獲得各子圖像的相似度因子。附記17.根據(jù)附記14所述的裝置,還包括
      歸ー化単元,被配置成在所述對圖像每ー個(gè)位置的特征按照所述位置所對應(yīng)的多個(gè)子圖像的相似度因子而得到的權(quán)值加權(quán)之前,對不同分割方式下獲得的子圖像的相似度因子進(jìn)行歸一化。附記18.根據(jù)附記11所述的裝置,其中,所述因子獲取單元被進(jìn)ー步配置成采用排序的方法,基于所述子圖像相互之間的特征相似性,對所述子圖像進(jìn)行排序,獲得各子圖像的排名值,將獲得的各子圖像的排名值作為各子圖像的相似度因子。附記19. ー種圖像識別裝置,包括 如附記11-18所述的圖像描述信息獲取裝置,用于獲取待識別圖像的圖像描述信息;分類器,被配置為基于所述待識別圖像的圖像描述信息,對所述待識別圖像進(jìn)行識別分類。
      權(quán)利要求
      1.一種基于多幅圖像獲取圖像描述信息的方法,包括 分割所述多幅圖像,獲得所述多幅圖像的子圖像; 基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子; 基于所述子圖像的相似度因子計(jì)算所述子圖像所對應(yīng)的圖像的描述信息。
      2.根據(jù)權(quán)利要求I所述的方法,其中,基于所述子圖像的相似度因子計(jì)算所述子圖像所對應(yīng)的圖像的描述信息的處理包括 對圖像每一個(gè)位置的特征按照所對應(yīng)的相似度因子加權(quán)。
      3.根據(jù)權(quán)利要求2所述的方法,對圖像每一個(gè)位置的特征按照所對應(yīng)的相似度因子加權(quán)的處理包括 對圖像每一個(gè)位置的特征按照所述位置所對應(yīng)的子圖像的相似度因子加權(quán)。
      4.根據(jù)權(quán)利要求2所述的方法,其中,所述分割所述多幅圖像包括 按照多種不同的分割方式分割每一幅圖像; 其中,對圖像每一個(gè)位置的特征按照所對應(yīng)的相似度因子加權(quán)的處理包括 對圖像每一個(gè)位置的特征按照基于所述位置所對應(yīng)的多個(gè)子圖像的相似度因子得到的權(quán)值加權(quán)。
      5.根據(jù)權(quán)利要求4所述的方法,其中,獲得所述子圖像的相似度因子的處理包括 對每一種分割方式,基于該分割方式獲得的所有子圖像相互之間的特征相似性,獲得各子圖像的相似度因子。
      6.根據(jù)權(quán)利要求4所述的方法,其中,獲得所述子圖像的相似度因子的處理包括 基于所有分割方式獲得的所有子圖像相互之間的特征相似性,獲得各子圖像的相似度因子。
      7.根據(jù)權(quán)利要求4所述的方法,其中,在對圖像每一個(gè)位置的特征按照基于所述位置所對應(yīng)的多個(gè)子圖像的相似度因子得到的權(quán)值加權(quán)之前,還包括 對不同分割方式下獲得的子圖像的相似度因子進(jìn)行歸一化。
      8.根據(jù)權(quán)利要求I所述的方法,其中,獲得所述子圖像的相似度因子的處理包括 采用排序的方法,基于所述子圖像相互之間的特征相似性,對所述子圖像進(jìn)行排序,獲得各子圖像的排名值,將獲得的各子圖像的排名值作為各子圖像的相似度因子。
      9.一種分類器訓(xùn)練方法,包括 利用如權(quán)利要求1-8所述的方法,將訓(xùn)練圖像作為所述多幅圖像,計(jì)算所述訓(xùn)練圖像的圖像描述信息; 基于所述訓(xùn)練圖像的圖像描述信息訓(xùn)練分類器。
      10.一種基于多幅圖像獲取圖像描述信息的裝置,包括 圖像分割單元,被配置成分割所述多幅圖像,獲得所述多幅圖像的子圖像; 因子獲取單元,被配置成基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子; 信息獲取單元,被配置成基于所述子圖像的相似度因子計(jì)算所述子圖像所對應(yīng)的圖像的描述信息。
      全文摘要
      本發(fā)明實(shí)施例公開了一種獲取圖像描述信息的方法及裝置以及分類器訓(xùn)練方法。獲取圖像描述信息的方法包括分割所述多幅圖像,獲得所述多幅圖像的子圖像;基于所述子圖像相互之間的特征相似性,獲得所述子圖像的相似度因子;基于所述子圖像的相似度因子計(jì)算所述子圖像所對應(yīng)的圖像的描述信息。本發(fā)明實(shí)施例在獲得圖像的描述信息時(shí),可以根據(jù)該圖像的特征及其對應(yīng)的相似度因子進(jìn)行計(jì)算,從而使圖像中重要度大的區(qū)域的特征占有較大的比重,而重要度小的區(qū)域的特征占有較小的比重,例如使圖像中前景對象在最終的特征中占有較大的比重,而背景內(nèi)容占有較小的比重,有效的減小了背景噪聲的影響,獲得了更準(zhǔn)確的圖像描述信息。
      文檔編號G06K9/64GK102855497SQ20111018893
      公開日2013年1月2日 申請日期2011年6月27日 優(yōu)先權(quán)日2011年6月27日
      發(fā)明者劉汝杰, 中村秋吾, 上原祐介 申請人:富士通株式會社
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1