圖像處理裝置、程序及圖像處理方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及圖像處理裝置、程序及圖像處理方法等。
【背景技術(shù)】
[0002]近年來,在機器學(xué)習(xí)的領(lǐng)域中推進著有監(jiān)督學(xué)習(xí)的研究。關(guān)于使用作為學(xué)習(xí)的結(jié)果而生成的判別器(分類器)判別(分類)圖像的內(nèi)容時的特有情況,可以考慮想要檢測圖像中的對象物的位置的情況。另外,也可以考慮將僅部分地攝入有表示正解標簽的對象物等的圖像分類的情況。例如,在專利文獻I中公開了對于這樣的圖像根據(jù)對象圖像的一部分的特征量進行分類的發(fā)明。
[0003]另外,通常在學(xué)習(xí)中使用的示教數(shù)據(jù)越多,所生成的判別器(分類器)的判別精度(分類精度)越高,能夠?qū)o標簽數(shù)據(jù)自動進行正確的標簽賦予。
[0004]但是,示教數(shù)據(jù)的正解標簽幾乎都是由人手動賦予的。因此,難以準備大量的示教數(shù)據(jù)、示教數(shù)據(jù)的生成成本非常大的情況居多。
[0005]因此,作為發(fā)展有監(jiān)督學(xué)習(xí)的方法之一,有不僅使用帶正解標簽的數(shù)據(jù)、而且也使用無標簽數(shù)據(jù)作為示教數(shù)據(jù)的半監(jiān)督學(xué)習(xí)的方法。并且,在該半監(jiān)督學(xué)習(xí)中,作為主要將圖像數(shù)據(jù)作為學(xué)習(xí)/判別對象的方法,提出了從帶正解標簽的圖像生成新的圖像并用于學(xué)習(xí)中的生成型學(xué)習(xí)的方法。
[0006]現(xiàn)有技術(shù)文獻
[0007]專利文獻
[0008]專利文獻1:日本特開2008 - 282267號公報發(fā)明概要
[0009]發(fā)明要解決的問題
[0010]為了進行分類器的學(xué)習(xí),需要準備圖像中的對象物的位置和形狀等作為示教數(shù)據(jù),該分類器用于從諸如部分地包含表示正解標簽的場景或者物體的圖像中檢測物體(對象物)等的位置。但是,與對圖像賦予該圖像所屬的類別的標簽的作業(yè)相比,手動生成物體的位置和形狀信息的作業(yè)是更費功夫的作業(yè)。其結(jié)果是,導(dǎo)致能夠準備的示教數(shù)據(jù)數(shù)量減少,作為學(xué)習(xí)結(jié)果的分類器的性能也下降。
[0011]另外,當(dāng)在“在從帶正解標簽的圖像生成了新的圖像的情況下,新的圖像的正解標簽與原來的圖像的正解標簽相同”這一前提下生成新的圖像時,只能以正解標簽不變的程度對帶正解標簽的圖像賦予變化,存在不能生成許多新的圖像的問題。因此,在這種情況下,不能充分增加示教數(shù)據(jù)的數(shù)量,不能充分提高判別器的判別精度。
[0012]另一方面,在假設(shè)“在生成新的圖像時正解標簽也可以變化”的情況下,作為從帶正解標簽的圖像生成新的圖像的方法,例如可以考慮如下的方法:將原來的帶正解標簽的圖像分割為多個圖像,由人對重新生成的圖像組賦予正解標簽,并作為新的示教數(shù)據(jù)用于學(xué)習(xí)中。在這種情況下,雖然能夠充分增加示教數(shù)據(jù)的數(shù)量,但是存在示教數(shù)據(jù)的標簽賦予成本龐大的問題。
【發(fā)明內(nèi)容】
[0013]
[0014]根據(jù)本發(fā)明的幾種方式能夠提供圖像處理裝置、程序及圖像處理方法等,在使用部分地攝入有表現(xiàn)正解標簽的物體等的學(xué)習(xí)圖像進行學(xué)習(xí)的情況下,僅通過對學(xué)習(xí)圖像進行標簽賦予,即可進行物體的位置檢測。
[0015]另外,根據(jù)本發(fā)明的幾種方式能夠提供圖像處理裝置、程序及圖像處理方法等,在使用部分地攝入有表示正解標簽的物體等的學(xué)習(xí)圖像進行學(xué)習(xí)的情況下,僅通過對學(xué)習(xí)圖像進行標簽賦予,即可進行物體等的位置的檢測,提高所生成的分類器的分類精度。
[0016]用于解決問題的手段
[0017]本發(fā)明的一種方式涉及圖像處理裝置,該圖像處理裝置包括:輸入受理部,其進行受理學(xué)習(xí)圖像和所述學(xué)習(xí)圖像的正解標簽的輸入的處理;處理部,其進行用于將圖像分類的分類器數(shù)據(jù)和用于生成所述分類器數(shù)據(jù)的處理對象圖像的生成處理;以及存儲部,其存儲所生成的所述分類器數(shù)據(jù),所述處理部生成所述處理對象圖像,并計算所述處理對象圖像的特征量,根據(jù)示教數(shù)據(jù)生成所述分類器數(shù)據(jù),根據(jù)所述學(xué)習(xí)圖像或者所述處理對象圖像生成圖像組,使用所述分類器數(shù)據(jù)將所生成的所述圖像組的各個圖像分類,計算所述各個圖像的分類分數(shù),根據(jù)計算出的所述分類分數(shù)和所述圖像組再次生成所述處理對象圖像,所述處理對象圖像是所述學(xué)習(xí)圖像的整體圖像或者部分圖像,所述示教數(shù)據(jù)是所述特征量和對與所述特征量對應(yīng)的所述學(xué)習(xí)圖像賦予的所述正解標簽的組。
[0018]在本發(fā)明的一種方式中,僅通過對學(xué)習(xí)圖像賦予正解標簽,即可自動生成新的處理對象圖像,并修正或者增加示教數(shù)據(jù)來進行學(xué)習(xí)。
[0019]新的處理對象圖像是根據(jù)圖像組的各個圖像的分類結(jié)果及分類分數(shù)生成的,并被自動賦予與所生成的處理對象圖像的內(nèi)容對應(yīng)的正解標簽。即,能夠自動生成更加正確地表現(xiàn)正解標簽表示的內(nèi)容的處理對象圖像。因此,能夠削減示教數(shù)據(jù)的生成成本,將較多的示教數(shù)據(jù)用于學(xué)習(xí)中。
[0020]因此,在使用部分地攝入有表現(xiàn)正解標簽的物體等的學(xué)習(xí)圖像進行學(xué)習(xí)的情況下,僅通過對學(xué)習(xí)圖像進行標簽賦予,即可進行圖像中的物體的位置檢測,還能夠提高所生成的分類器數(shù)據(jù)的分類精度。
[0021]另外,在本發(fā)明的一種方式中也可以是,所述處理部根據(jù)新的示教數(shù)據(jù),再次生成所述分類器數(shù)據(jù),所述新的示教數(shù)據(jù)是再次生成的所述處理對象圖像、和在再次生成所述處理對象圖像時對從所述圖像組中選擇的選擇圖像賦予的正解標簽的組。
[0022]由此,對于與對原來的學(xué)習(xí)圖像賦予的正解標簽表示的內(nèi)容不同的內(nèi)容的圖像,也能夠進行追加學(xué)習(xí)等。
[0023]另外,在本發(fā)明的一種方式中也可以是,所述處理部進行所述圖像組的所述各個圖像的所述分類分數(shù)與所給的閾值的比較處理,從所述圖像組中選擇被計算出所述所給的閾值以上的所述分類分數(shù)的圖像作為選擇圖像,根據(jù)選擇圖像組再次生成所述處理對象圖像。
[0024]由此,能夠選擇攝入相同對象物的可能性大的圖像作為選擇圖像,來生成處理對象圖像等。
[0025]另外,在本發(fā)明的一種方式中也可以是,所述處理部每當(dāng)進行再次生成所述處理對象圖像的處理時,變更在與所述分類分數(shù)的所述比較處理中使用的所述所給的閾值。
[0026]由此,能夠防止正解標簽表示的區(qū)域的一部分被從處理對象圖像中刪除等。
[0027]另外,在本發(fā)明的一種方式中也可以是,所述處理部將所述學(xué)習(xí)圖像的所述整體圖像設(shè)定為最初的所述處理對象圖像。
[0028]由此,即使是在學(xué)習(xí)的初始階段中,也能夠削減在學(xué)習(xí)圖像中指定作為處理對象圖像的區(qū)域的成本等。
[0029]另外,在本發(fā)明的一種方式中也可以是,所述處理部生成像素數(shù)或者面積比前一次的所述處理對象圖像小的所述處理對象圖像。
[0030]由此,能夠?qū)⒄鈽撕灡硎镜膬?nèi)容以外的部分刪除,使用正解標簽表示的對象物占據(jù)的面積(比率)較大的圖像作為處理對象圖像進行學(xué)習(xí)等。
[0031]另外,在本發(fā)明的一種方式中也可以是,所述處理部根據(jù)所述學(xué)習(xí)圖像生成所述圖像組,并生成像素數(shù)或者面積比前一次的所述處理對象圖像大的所述處理對象圖像。
[0032]由此,能夠再次生成包括在以前的處理對象圖像的生成處理中錯誤刪除的區(qū)域在內(nèi)的處理對象圖像,而進行學(xué)習(xí)等。
[0033]另外,在本發(fā)明的一種方式中也可以是,所述處理部反復(fù)所給的次數(shù)進行所述分類器數(shù)據(jù)和所述處理對象圖像的所述生成處理。
[0034]由此,能夠按照能夠維持規(guī)定的性價比的次數(shù)進行分類器數(shù)據(jù)和處理對象圖像的生成處理等。
[0035]另外,在本發(fā)明的一種方式中也可以是,所述處理部在前一次的所述處理對象圖像與本次的所述處理對象圖像的面積或者像素數(shù)之差小于所給的閾值的情況下,結(jié)束所述分類器數(shù)據(jù)和所述處理對象圖像的所述生成處理的反復(fù)。
[0036]由此,能夠按照能夠維持規(guī)定的性價比的次數(shù)進行分類器數(shù)據(jù)和處理對象圖像的生成處理等。
[0037]另外,在本發(fā)明的一種方式中也可以是,所述處理部將所述學(xué)習(xí)圖像或者所述處理對象圖像分割為多個區(qū)域,并生成作為所述多個區(qū)域中的各個區(qū)域的圖像的集合的所述圖像組。
[0038]由此,不需花費重新拍攝用于學(xué)習(xí)的圖像的成本即可進行準備等。
[0039]另外,在本發(fā)明的一種方式中也可以是,所述處理部將所述學(xué)習(xí)圖像或者所述處理對象圖像重復(fù)分割為多個區(qū)域,并生成作為所述多個區(qū)域中的各個區(qū)域的圖像的集合的所述圖像組。
[0040]由此,能夠容易通過學(xué)習(xí)生成有效的處理對象圖像等。
[0041]另外,在本發(fā)明的一種方式中也可以是,所述處理部將所述學(xué)習(xí)圖像或者所述處理對象圖像過度分割為多個區(qū)域,并生成作為所述多個區(qū)域中的各個區(qū)域的圖像的集合的所述圖像組。
[0042]由此,能夠根據(jù)輪廓/顏色信息更正確地判定對象物和背景的邊界等。
[0043]另外,在本發(fā)明的一種方式中也可以是,所述處理部每當(dāng)進行所述分類器數(shù)據(jù)和所述處理對象圖像的所述生成處理時,變更所述學(xué)習(xí)圖像或者所述處理對象圖像的分割尺寸。
[0044]由此,能夠使所生成的處理對象圖像的輪廓成為沿著所賦予的正解標簽表示的對象物的輪廓的形狀等。
[0045]另外,在本發(fā)明的一種方式中也可以是,所述處理部使顯示部顯示處理對象圖像組,取得針對所述處理對象圖像組的修正指示信息,根據(jù)所述修正指示信息進行所述處理對象圖像組的修正處理。
[0046]由此,能夠修正處理對象圖像組中對學(xué)習(xí)結(jié)果產(chǎn)生不良影響的處理對象圖像等。
[0047]另外,在本發(fā)明的一種方式中也可以是,所述處理部使所述顯示部一覽顯示所述處理對象圖像組,從所述處理對象圖像組中取得不要的所述處理對象圖像的指定信息作為所述修正指示信息,并從所述處理對象圖像組中刪除所述指定信息表示的所