圖像處理設(shè)備和圖像處理方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及一種圖像處理設(shè)備和圖像處理方法。
【背景技術(shù)】
[0002]非專利文獻(xiàn)I (Lazebnik,“Beyond Bags of Features: Spatial Pyramid MatchingforRecognizing Natural Scene Categories”,計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(Conferenceon Computer Vis1n and Pattern Recognit1n),第 2169-2178 頁(2006))公開了下述技術(shù),其中,圖像被分為多個(gè)區(qū)域以利用通過各劃分區(qū)域的圖像特征的整合獲得的特征向量來執(zhí)行圖像識(shí)別。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的在于提供一種圖像處理設(shè)備和圖像處理方法,其能夠改進(jìn)從圖像識(shí)別處特定種類的對(duì)象的準(zhǔn)確性。
[0004]根據(jù)本發(fā)明的第一方面,提供了一種圖像處理設(shè)備,其包括第一獲取部,所述第一獲取部獲取待處理圖像;設(shè)置部,所述設(shè)置部在待處理圖像中設(shè)置多個(gè)部分圖像區(qū)域;第二獲取部,所述第二獲取部獲取第一識(shí)別結(jié)果,該第一識(shí)別結(jié)果指示特定種類的對(duì)象包括在多個(gè)部分圖像區(qū)域中的每一個(gè)中的可能性;以及生成部,所述生成部基于多個(gè)部分圖像區(qū)域中的每一個(gè)的第一識(shí)別結(jié)果生成第二識(shí)別結(jié)果,該第二識(shí)別結(jié)果指示特定種類的對(duì)象被包括在待處理圖像中的可能性。
[0005]根據(jù)本發(fā)明的第二方面,圖像處理設(shè)備進(jìn)一步包括提取部,所述提取部從各多個(gè)部分圖像區(qū)域的第一識(shí)別結(jié)果中提取第一識(shí)別結(jié)果的一部分。生成部基于由提取部提取的第一識(shí)別結(jié)果生成第二識(shí)別結(jié)果,該第二識(shí)別結(jié)果指示特定種類的對(duì)象被包括在待處理圖像中的可能性。
[0006]根據(jù)本發(fā)明的第三方面,在圖像處理設(shè)備中,第一識(shí)別結(jié)果是包括特定種類的對(duì)象的幾率。提取部從各多個(gè)部分圖像區(qū)域的第一識(shí)別結(jié)果中提取從具有最高幾率的第一識(shí)別結(jié)果開始計(jì)數(shù)的預(yù)定數(shù)目或比率的第一識(shí)別結(jié)果。
[0007]根據(jù)本發(fā)明的第四方面,在圖像處理設(shè)備中,第一識(shí)別結(jié)果是包括特定種類的對(duì)象的幾率。提取部從各多個(gè)部分圖像區(qū)域的第一識(shí)別結(jié)果中提取具有高于或等于閾值的幾率的第一識(shí)別結(jié)果。
[0008]根據(jù)本發(fā)明的第五方面,在圖像處理設(shè)備中,第一識(shí)別結(jié)果是包括特定種類的對(duì)象的幾率。生成部基于是各多個(gè)部分圖像區(qū)域的第一識(shí)別結(jié)果的幾率的和或乘積或具有高于或等于閾值的幾率的第一識(shí)別結(jié)果的數(shù)目與具有低于閾值的幾率的第一識(shí)別結(jié)果的數(shù)目之間的比較的結(jié)果生成第二識(shí)別結(jié)果,該第二識(shí)別結(jié)果指示特定種類的對(duì)象被包括在待處理圖像中的可能性。
[0009]根據(jù)本發(fā)明的第六方面,圖像處理設(shè)備進(jìn)一步包括使得識(shí)別器基于為包括特定種類的對(duì)象的一個(gè)或多個(gè)樣本圖像中的每一個(gè)設(shè)置的部分圖像區(qū)域中的每一個(gè)的圖像特征學(xué)習(xí)特定種類的對(duì)象的識(shí)別條件的單元。第二獲取部基于部分圖像區(qū)域的圖像特征利用識(shí)別器獲取第一識(shí)別結(jié)果,該第一識(shí)別結(jié)果指示特定種類的對(duì)象包括在多個(gè)部分圖像區(qū)域中的每一個(gè)中的可能性。
[0010]根據(jù)本發(fā)明的第七方面,圖像處理設(shè)備進(jìn)一步包括部分區(qū)域信息學(xué)習(xí)部,該部分區(qū)域信息學(xué)習(xí)部學(xué)習(xí)關(guān)于在樣本圖像中設(shè)置的部分圖像區(qū)域中的每一個(gè)的位置和大小的特征。設(shè)置部基于由部分區(qū)域信息學(xué)習(xí)部學(xué)習(xí)的關(guān)于部分圖像區(qū)域中的每一個(gè)的位置和大小的特征在待處理圖像中設(shè)置多個(gè)部分圖像區(qū)域。
[0011]根據(jù)本發(fā)明的第八方面,在圖像處理設(shè)備中,基于部分圖像區(qū)域中包括的一個(gè)或更多個(gè)像素中的每一個(gè)的局部特征的分布生成部分圖像區(qū)域中的每一個(gè)的圖像特征。
[0012]根據(jù)本發(fā)明的第九方面,在圖像處理設(shè)備中,設(shè)置部設(shè)置多個(gè)部分圖像區(qū)域使得在待處理圖像中設(shè)置的多個(gè)部分圖像區(qū)域中的至少一些彼此交疊。
[0013]根據(jù)本發(fā)明的第十方面,提供了一種圖像處理方法,所述圖像處理方法包括下述步驟:獲取待處理圖像;在待處理圖像中設(shè)置多個(gè)部分圖像區(qū)域;獲取第一識(shí)別結(jié)果,所述第一識(shí)別結(jié)果指示特定種類的對(duì)象包括在多個(gè)部分圖像區(qū)域中的每一個(gè)中的可能性;以及基于多個(gè)部分圖像區(qū)域中的每一個(gè)的第一識(shí)別結(jié)果生成第二識(shí)別結(jié)果,所述第二識(shí)別結(jié)果指示特定種類的對(duì)象包括在待處理圖像中的可能性。
[0014]根據(jù)本發(fā)明的第一方面,與不采用上述構(gòu)造的情況相比,能夠使用具有包括特定種類的對(duì)象的不同可能性的多個(gè)部分圖像區(qū)域的識(shí)別的結(jié)果改進(jìn)從圖像識(shí)別特定種類的對(duì)象的準(zhǔn)確性。
[0015]根據(jù)本發(fā)明的第二方面,與不采用上述構(gòu)造的情況相比,能夠使用具有包括特定種類的對(duì)象的不同可能性的多個(gè)部分圖像區(qū)域的識(shí)別的結(jié)果的一部分改進(jìn)從圖像識(shí)別特定種類的對(duì)象的準(zhǔn)確性。
[0016]根據(jù)本發(fā)明的第三方面,與不采用上述構(gòu)造的情況相比,能夠使用圖像中設(shè)置的部分圖像區(qū)域中具有包括特定種類的對(duì)象的最高可能性的部分圖像區(qū)域的識(shí)別的結(jié)果改進(jìn)從圖像識(shí)別特定種類的對(duì)象的準(zhǔn)確性。
[0017]根據(jù)本發(fā)明的第四方面,與不采用上述構(gòu)造的情況相比,能夠使用圖像中設(shè)置的部分圖像區(qū)域中具有包括特定種類的對(duì)象的較高可能性的部分圖像區(qū)域的識(shí)別的結(jié)果改進(jìn)從圖像識(shí)別特定種類的對(duì)象的準(zhǔn)確性。
[0018]根據(jù)本發(fā)明的第五方面,與不采用上述構(gòu)造的情況相比,能夠使用具有包括特定種類的對(duì)象的不同可能性的多個(gè)部分圖像區(qū)域的識(shí)別的所有結(jié)果改進(jìn)從圖像識(shí)別特定種類的對(duì)象的準(zhǔn)確性。
[0019]根據(jù)本發(fā)明的第六方面,與不采用上述構(gòu)造的情況相比,能夠準(zhǔn)確地識(shí)別特定種類的對(duì)象包括在圖像中設(shè)置的部分圖像區(qū)域中的每一個(gè)中的可能性。
[0020]根據(jù)本發(fā)明的第七方面,與不采用上述構(gòu)造的情況相比,能夠設(shè)置具有適合于圖像中待識(shí)別對(duì)象的大小和位置的部分圖像區(qū)域。
[0021]根據(jù)本發(fā)明的第八方面,與不采用上述構(gòu)造的情況相比,能夠減少對(duì)象的形狀和亮度的變化對(duì)于識(shí)別準(zhǔn)確性的影響。
[0022]根據(jù)本發(fā)明的第九方面,與不采用上述構(gòu)造的情況相比,能夠增加包括待識(shí)別對(duì)象的部分圖像區(qū)域的數(shù)目。
【附圖說明】
[0023]下面將基于附圖詳細(xì)描述本發(fā)明的示例性實(shí)施方式,其中:
[0024]圖1示出了根據(jù)關(guān)于學(xué)習(xí)處理的示例性實(shí)施方式的圖像處理設(shè)備的示例性功能;
[0025]圖2示出了關(guān)于識(shí)別處理的圖像處理設(shè)備的示例性功能;
[0026]圖3示出了示例性目標(biāo)圖像;
[0027]圖4示出了為目標(biāo)圖像設(shè)置的示例性多個(gè)識(shí)別目標(biāo)區(qū)域;
[0028]圖5是用于描述整合識(shí)別結(jié)果的示例性處理的圖;
[0029]圖6是示出學(xué)習(xí)處理的示例的流程圖;
[0030]圖7是示出計(jì)算局部特征值的示例性處理的流程圖;
[0031]圖8是示出具有識(shí)別器的示例性學(xué)習(xí)處理的流程圖;以及
[0032]圖9A和圖9B是示出識(shí)別處理的示例的流程圖。
【具體實(shí)施方式】
[0033]這里將參考附圖描述本發(fā)明的示例性實(shí)施方式。根據(jù)示例性實(shí)施方式的圖像處理設(shè)備10是使得識(shí)別器學(xué)習(xí)一個(gè)或多個(gè)種類的對(duì)象的圖像特征并且執(zhí)行處理以利用識(shí)別器識(shí)別待處理圖像中的對(duì)象(主體)的計(jì)算機(jī)。
[0034]現(xiàn)在將描述根據(jù)本示例性實(shí)施方式的圖像處理設(shè)備10執(zhí)行的示例性處理的概況。圖像處理設(shè)備10對(duì)于其中拍攝的對(duì)象的種類相同的樣本圖像設(shè)置一個(gè)或更多個(gè)部分圖像區(qū)域并且基于設(shè)置的部分圖像區(qū)域的圖像特征利用識(shí)別器對(duì)于每個(gè)對(duì)象種類執(zhí)行學(xué)習(xí)處理。圖像處理設(shè)備10對(duì)于其中拍攝的對(duì)象的種類不相同的目標(biāo)圖像設(shè)置多個(gè)部分圖像區(qū)域,基于設(shè)置的多個(gè)部分圖像區(qū)域的圖像特征利用識(shí)別器執(zhí)行識(shí)別處理,并且將多個(gè)部分圖像區(qū)域的識(shí)別的結(jié)果彼此整合以確定關(guān)于目標(biāo)圖像中拍攝的對(duì)象的信息。
[0035]1.功能塊的描述
[0036]現(xiàn)在將參考圖1和圖2中所示的功能框圖描述根據(jù)本示例性實(shí)施方式的圖像處理設(shè)備10的示例性功能。
[0037]1-1.關(guān)于學(xué)習(xí)處理的功能塊的描述
[0038]圖1示出了圖像處理設(shè)備10的功能中關(guān)于利用機(jī)器學(xué)習(xí)模型(識(shí)別器)學(xué)習(xí)對(duì)象的圖像特征的處理的示例性功能。
[0039]參考圖1,圖像處理設(shè)備10包括學(xué)習(xí)信息接受部11、樣本圖像獲取部12、局部圖像特征生成部13、局部圖像特征聚類設(shè)置部14、局部圖像特征量化部15、學(xué)習(xí)區(qū)域設(shè)置部16、矩形特征值生成部17、矩形特征值存儲(chǔ)器18、機(jī)器學(xué)習(xí)部19和識(shí)別模型參數(shù)存儲(chǔ)器20。
[0040]上述圖像處理設(shè)備10中的塊的功能可以由計(jì)算機(jī)來實(shí)現(xiàn),其包括控制器(例如,中央處理單元(CPU))、存儲(chǔ)器、輸入輸出部(其向外部裝置發(fā)送數(shù)據(jù)以及從其接收數(shù)據(jù))等等,并且讀出計(jì)算機(jī)可讀信息存儲(chǔ)介質(zhì)中存儲(chǔ)的程序以執(zhí)行讀出的程序。該程序可以經(jīng)由諸如光盤、磁盤、磁帶、磁光盤或閃存的信息存儲(chǔ)介質(zhì)提供給是計(jì)算機(jī)的圖像處理設(shè)備10,或者可以經(jīng)由諸如互聯(lián)網(wǎng)的數(shù)據(jù)通信網(wǎng)絡(luò)提供給圖像處理設(shè)備10?,F(xiàn)在將詳細(xì)描述圖1中所示的塊的功能。
[0041]學(xué)習(xí)信息接受部11從例如連接到圖像處理設(shè)備10的輸入設(shè)備或外部裝置(用戶終端等等)接受學(xué)習(xí)信息。例如,學(xué)習(xí)信息接受部11可以接受在學(xué)習(xí)中使用的樣本圖像的文件路徑、指定樣本圖像中在學(xué)習(xí)處理中使用的部分圖像區(qū)域(學(xué)習(xí)區(qū)域)的區(qū)域指定數(shù)據(jù)和/或關(guān)于利用樣本圖像學(xué)習(xí)的對(duì)象的類型的信息。
[0042]樣本圖像獲取部12基于由學(xué)習(xí)信息接受部11接受的學(xué)習(xí)信息獲取在學(xué)習(xí)處理時(shí)使用的樣本圖像。例如,樣本圖像獲取部12可以基于由學(xué)習(xí)信息接受部11接受的樣本的文件路徑獲取樣本??梢詮膱D像處理設(shè)備10中的存儲(chǔ)器獲取樣本圖像或者