專利名稱:圖像識別方法以及攝像裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及確定圖像中的對象(類型,category)的技術(shù),特別涉及在拍攝時高精度地進行風(fēng)景等場景檢測并能夠進行適當(dāng)?shù)恼障鄼C設(shè)定的圖像識別方法以及攝像裝置。
背景技術(shù):
伴隨數(shù)字照相機或帶照相機的便攜電話的普及,用戶使用這樣的設(shè)備在各種場景中進行拍攝的機會增加。在這樣的場景之中,通過識別被攝體而設(shè)定正確的照相機參數(shù),由此可以得到高質(zhì)量的照片。
在專利文獻l中,公開出具有如下功能的圖像處理裝置除了從攝像圖像中得到的信息以夕卜,還根據(jù)從照相機內(nèi)的時鐘、溫度計、GPS圖像中得到的信息等,推測攝像者在該條件下可能會最常用的拍攝模式并向攝像者提示。
另外,在該文獻中,還公開出識別被攝體,并+艮據(jù)其種類來推測拍攝場景的技術(shù)。
專利文獻1:日本特開2007 - 184733號z〉報
但是,在專利文獻l的圖像處理裝置中,為了得到用于推測拍攝模式的信息,需要傳感器、GPS等硬件結(jié)構(gòu),所以難以安裝到已有的照相機模塊中。另外,難以擺脫數(shù)字照相機的小型化、向便攜電話搭載時的物理或成本上的制約。'
另一方面,作為一般的被攝體識別技術(shù),有模板匹配、基于特征點提取的形狀(輪廓)識別等方法。但是,在希望識別山、天空等人們識別為風(fēng)景那樣的被攝體(以下稱為風(fēng)景被攝體)的情況下,由于在這些風(fēng)景被攝體中不存在特定的形狀,所以不容易正確地識別。另外,在希望應(yīng)對所有圖案時,存在模板數(shù)據(jù)變得龐大這樣的問題。
發(fā)明內(nèi)容
本發(fā)明是鑒于上述情況而完成的,其目的在于提供一種圖像識別方法,在不需要硬件等結(jié)構(gòu)的情況下能夠僅通過圖像處理來判別拍攝場景,而且,在不使用龐大的模板數(shù)據(jù)的情況下能夠高精度地識別風(fēng)吝妯媼汰
、, 、 , I w
為了解決上述課題,本發(fā)明提供一種圖像識別方法,通過計算機處理,根據(jù)輸入的圖像數(shù)據(jù)的塊圖像的特征量,將該塊圖像分類為預(yù)
定的多個類型,其特征在于,包括塊圖像生成步驟,將上述圖像數(shù)據(jù)分割為多個塊而生成塊圖像;圖像特征量運算步驟,利用塊圖像的顏色空間信息以及頻率分量,運算出各個塊圖像的特征量;分離超平面運算步驟,讀入針對每個塊附有類型的教師數(shù)據(jù)圖像,針對教師數(shù)據(jù)圖像的塊的每一個運算出圖像特征量,學(xué)習(xí)成為識別各類型的邊界的分離超平面;以及類型判定步驟,對于新獲取的圖像,執(zhí)行塊圖像生成步驟和圖像特征量運算步驟,計算出塊圖像的圖像特征量,利用從各類型的分離超平面起的距離判定該塊圖像所屬的類型。
在本發(fā)明中,不只是使用塊圖像的顏色空間信息,而且還使用頻率分量,將這些作為特征量,根據(jù)預(yù)先利用教師數(shù)據(jù)得到的從分離超平面起的距離來判定類型。
將針對每個塊附有類型的樣本圖像作為教師數(shù)據(jù),運算出圖像特
征量空間中的每個類型的分離超平面,以該分離超平面數(shù)據(jù)為基準,針對每個塊判別新獲取的圖像的類型。
優(yōu)選為,在圖像特征量運算步驟中,將塊圖像在顏色空間上分割為多個等級并對每個等級的出現(xiàn)次數(shù)進行檢測,并且運算出塊內(nèi)的像素間標(biāo)準偏差,另一方面將該塊圖像進一步分為多個小塊,計算出該小塊的表示濃淡變化的頻率分量,根據(jù)該頻率分量,對于該小塊所屬的塊內(nèi),針對水平方向與垂直方向中的至少一個方向,運算出頻率分量的偏移,將出現(xiàn)次數(shù)、像素間標(biāo)準偏差、頻率分量以及頻率分量的偏移作為圖像特征量進行運算。
5通過不只是使用塊圖像的顏色分量,而且還使用塊內(nèi)的頻率分量的偏移,由此抑制了塊分割數(shù),從而能夠高精度地進行識別。
本發(fā)明的圖像識別方法還包括匹配檢查步驟,在該匹配檢查步驟中,保存類型間的不匹配條件,在根據(jù)該不匹配條件與周圍的塊圖像的類型變更了新獲取的圖像的塊圖像的類型之后,對鄰接的同一類型的塊進行分組,對于該分組后的塊群,根據(jù)不匹配條件評價類型判定有無合理性。
該不匹配條件由針對塊圖像單體的不匹配條件和針對塊圖像的組的不匹配條件構(gòu)成。例如,在只有一個塊的類型與周圍鄰接塊的類型不同的情況下,使其與周圍塊的類型一致。此時,如果將從分離超平面起的距離加到該條件使得根據(jù)從分離超平面起的距離在正的距離大的情況下不變更時,可以實現(xiàn)更正確的修改。
針對塊群的不匹配條件例如是在"天空"之上不會出現(xiàn)"海"這樣的判定位置關(guān)系的矛盾的條件。
而且,該匹配檢查步驟的結(jié)果,輸出被評價為有合理性的塊群的類型。由此,可以高精度地識別塊群的類型。
另外,如果使用上述圖像特征量,則即使塊分割數(shù)為一定,判定精度也高,但對于不同類型的邊界的塊,通過進一步分割為小塊來判定類型,由此可以更精密地進行判定。另外,在圖像處理中,通過在不同類型的塊群的邊界上檢測邊緣、邊角,由此可以高效地進行圖像處理。
另外,本發(fā)明提供一種攝像裝置,通過上述圖像識別方法來識別
圖像的類型,其特征在于,具備拍攝條件保存單元,針對每個類型存儲攝像裝置的參數(shù)的設(shè)定條件和拍攝后的圖像處理方法;攝像單
元,在拍攝時,根據(jù)通過上述圖像識別方法輸出的拍攝對象圖像的類
型,設(shè)定攝像裝置的參數(shù)并進行拍攝,獲取攝像圖像;以及圖像處理單元,對該攝像圖像通過針對該類型的圖像處理方法執(zhí)行圖像處理。在本發(fā)明中,使用通過所謂預(yù)覽得到的圖像的類型判定的緒果,調(diào)整照相機參數(shù)(例如自動/手動模式、快門速度、曝光)等而進行拍攝,并在拍攝之后進而進行與該類型對應(yīng)的圖像處理(例如輪廓強調(diào)、色調(diào)校正等)。另外,通過使用圖像的類型判定的結(jié)果,向用戶提示最佳的拍攝模式,可以輔助用戶選擇拍攝模式。
而且,本發(fā)明提供一種攝像裝置,通過上述圖像識別方法來識別
圖像的類型,其特征在于,具備程序儲存單元,與類型對應(yīng)關(guān)聯(lián)地儲存應(yīng)執(zhí)行的程序;程序選擇單元,在程序儲存單元中儲存有與通過上述圖像識別方法識別的類型對應(yīng)關(guān)聯(lián)的程序的情況下,選擇該程序;以及程序執(zhí)行單元,執(zhí)行由程序選擇單元選擇的程序。
在本發(fā)明中,自動地、或者基于在監(jiān)視器畫面上的顯示輸出之后的用戶選擇,啟動與利用圖像識別方法判定的類型對應(yīng)的程序,由此可以實現(xiàn)操作的簡化、高效化。
根據(jù)本發(fā)明,將顏色空間信息和頻率分量作為圖像特征量,預(yù)先使用教師數(shù)據(jù),根據(jù)每個類型的圖像特征量計算出分離超平面,對于成為類型判定的對象的圖像,利用該塊的圖像特征量的從各類型的分離超平面起的距離,判定該塊的類型,所以即使是沒有特征性的一定形狀,且不適合模板匹配那樣的風(fēng)景被攝體,也可以高精度地識別對
圖1是實現(xiàn)本發(fā)明的實施方式的圖像識別方法的判別器的概要說明圖。
圖2是本發(fā)明的第一實施方式的判別器10的功能框圖。
圖3是本發(fā)明的實施方式的頻率分量處理的說明圖。
圖4是使用了本發(fā)明的實施方式的柱狀圖的顏色分量處理的說明圖。
圖5是示出本發(fā)明的實施方式的特征量空間與分離平面的關(guān)系的概要圖。
圖6是特征量空間為二維時的分離超平面的概要圖。圖7是圖2的圖像特征量數(shù)據(jù)的結(jié)構(gòu)例子。
7圖8是圖2的分離超平面數(shù)據(jù)的結(jié)構(gòu)例子。 圖9是圖2的結(jié)果文件的數(shù)據(jù)結(jié)構(gòu)圖。
圖IO是示出圖2的匹配檢查單元37的塊單位的類型修改步驟的 流程圖。
圖11是圖10的處理中使用的修改閾值表的數(shù)據(jù)結(jié)構(gòu)例子。
圖12是例示出圖9的圖像上的塊組的位置關(guān)系的概要圖。
圖13是示出圖2的匹配檢查單元37的塊群匹配性判定步驟的流程圖。
圖14是圖13的處理中使用的不匹配條件表。 圖15是本發(fā)明的第二實施方式的攝像裝置的框圖。 圖16是圖15的參數(shù)設(shè)定單元3具備的參數(shù)表的數(shù)據(jù)例子。 圖17是圖15的圖像處理單元6具備的校正處理表的數(shù)據(jù)例子。 圖18是示出攝像裝置的液晶監(jiān)視器上顯示的被攝體與拍攝模式 的選擇畫面的一個例子的圖。
圖19是本發(fā)明的第三實施方式的攝像裝置的框圖。
圖20是本發(fā)明的第三實施方式的按類型的塊群的說明圖。
符號說明
1攝像裝置
2攝像元件
3參數(shù)設(shè)定單元
4快門操作檢測單元
5累積單元
6圖像處理單元
7程序選擇單元
8程序儲存單元
9程序執(zhí)行單元
10判別器
20存儲部
21對象圖像保存區(qū)域22教師數(shù)據(jù)保存區(qū)域
23塊圖像保存區(qū)域
24圖像特征量數(shù)據(jù)保存區(qū)域
25分離超平面數(shù)據(jù)保存區(qū)域
26結(jié)果文件
30運算部
31圖像數(shù)據(jù)輸入單元
32塊圖像生成單元
33圖像特征量運算單元
34分離超平面運算單元
35類型判定單元
36分組單元
37匹配檢查單元
38輸出單元
50 二維條形碼
具體實施例方式
以下,說明本發(fā)明的實施方式。圖l是實現(xiàn)本實施方式的圖像識 別方法的判別器的概要說明圖。在此,以將風(fēng)景被攝體分成山、天空、 海、紅葉、夕陽、櫻花這六個類型的情況為例子進行說明。但是,本 發(fā)明不限于此。
在圖1中,判別器10由通用的計算機系統(tǒng)構(gòu)成,首先接收輸入 圖像,并分割為塊。然后,根據(jù)各塊計算出后述的圖像特征量,針對 每個塊進行在塊中存在哪一種風(fēng)景被攝體、或者是否不明確這樣的判 定,并輸出其判定結(jié)果。
向判別器10預(yù)先提供在標(biāo)簽上附有正確解釋的風(fēng)景圖像的圖像 塊作為教師數(shù)據(jù),使其學(xué)習(xí)分類方法。
例如,利用4皮廣泛用作學(xué)習(xí)算法的線性SVM的專用庫liblinear (http: 〃www.csie.ntu.edu.tw廠cjlin/liblinear),輸入每個類型的圖
9像特征量,計算出分離超平面。將其進行存儲,對于新獲取的識別對 象的圖像(以下稱為對象圖像)求出其圖像特征量,計算出針對每個 類型存儲的從分離超平面起的距離,判定為該距離為最大正值的類型 是相當(dāng)于該塊的類型。
以下,說明判別器10的結(jié)構(gòu)與動作。
圖2是本實施方式的判別器10的功能框圖。在此,判別器10
具有存儲數(shù)據(jù)的存儲部20和執(zhí)行運算處理的運算部30。運算部30具
有輸入圖像數(shù)據(jù)并儲存到存儲部20的圖像數(shù)據(jù)輸入單元31;將輸
入的圖像數(shù)據(jù)分割為預(yù)定的多個塊的塊圖像生成單元32;塊圖像的圖
像特征量運算單元33;根據(jù)教師數(shù)據(jù)運算出分離超平面的分離超平面
運算單元34;根據(jù)輸入圖像的圖像特征量和分離超平面數(shù)據(jù)判定塊所
屬的類型的類型判定單元35;對類型分類后的塊進行分組而形成塊群
的塊圖像分組單元36;針對各個塊或塊群,根據(jù)其類型彼此的位置關(guān)
系來檢查是否沒有矛盾的匹配檢查單元;以及輸出每個塊的類型以及
組信息的輸出單元38。各單元31~38可以通過程序作為CPU的處理
(步驟)執(zhí)行。
(1.利用教師數(shù)據(jù)生成分離超平面數(shù)據(jù)的處理)
首先,對判別器IO輸入教師數(shù)據(jù)。教師數(shù)據(jù)是在標(biāo)簽上附有正 確解釋的類型的圖像塊。
除了上述六種風(fēng)景被攝體的類型以外,還加上人工物、黑、白這 三個類型。這是因為,即使以識別風(fēng)景被攝體為目的,也要避免對沒 有拍攝有風(fēng)景被攝體的圖像硬進行類型分類的情況。通過加上這樣的 所謂消極類型,可以提高作為本來的識別對象的風(fēng)景3皮攝體的類型分 類的精度。消極類型不限于上述例子,而也可以任意設(shè)定。另外,也 可以將風(fēng)景被攝體以外的類型作為消極類型并集中為一個類型。
輸入的教師數(shù)據(jù)經(jīng)由圖像數(shù)據(jù)輸入單元31保存到存儲部20的教 師數(shù)據(jù)保存區(qū)域22中。
接下來,由圖像特征量運算單元33計算出針對教師數(shù)據(jù)的各塊 圖像的圖像特征量數(shù)據(jù)。以下,說明圖像特征量數(shù)據(jù)的計算方法。
(圖像特征量的計算方法) 圖像特征量是使用塊的顏色空間信息和頻率分量求出的。
(1) 顏色空間信息
作為顏色空間,使用YUV空間,對于Y、 U、 V分別計測8個 等級的強度的每一個強度在32x32塊中出現(xiàn)的頻度。
另外,YUV值的像素間的標(biāo)準偏差在顏色的偏量大的情況、顏 色的分布被分為幾個組那樣的情況下表示大的值,對人工物的識別是 有效的,所以加入到特征量是有效果的。
具體而言,如圖4所示,使用以縱軸為次數(shù)、以4黃軸為等級的柱 狀圖,將各顏色分量值0~255分為8個簇(cluster),并計測出現(xiàn) 次數(shù)。因此,制作出各顏色分量次數(shù)7自由度x3-21自由度、21維 空間。
(2) 頻率信息
為了檢測塊的復(fù)雜度、規(guī)則性,利用空間頻率分量進行的分析是 有效的。例如,在對相同的色調(diào)的天空與海進行比較的情況下,由于 一般后者的高頻分量更多,所以除了顏色分量信息以外還通過將空間 頻率分量設(shè)為特征量,由此可以進行類型分類。
另外,山表與海雖然在色調(diào)上幾乎沒有差異且具有高頻分量多的 傾向,但由于在海的表面上摻入有由波紋形成的水平方向的線的情況 較多,且具有垂直方向的頻率分量與水平方向相比有意地變高這樣的 特征,所以通過以頻率分量偏向于垂直方向和水平方向的哪一個的情 況作為特征量進行獲取,由此可以進行類型分類。
對于頻率信息,具體而言進行以下處理。
(51) 將32x32像素的塊進一步分割為8x8的16個小塊。
(52) 獲取每個8x8的小塊的頻率分量。
(53) 從各小塊獲取64個各頻率分量并合計。另外,對于頻率 分量,也可以通過適當(dāng)間隔剔除、或?qū)εR近的頻率分量進行平均化等 來減少信息量。頻率變換也可以使用作為已知的技術(shù)的阿達瑪(Hadamard)變 換和DCT變換的方法中的某一個。
接下來,說明頻率偏移的計算方法。
在頻率分量中存在X方向與Y方向的頻率分量,圖3的斜線部 分是X方向、灰色是Y方向的分量。在本實施方式中,獲取X方向 的分量之和與Y方向的分量之和并計算其比率。
通過該計算結(jié)果,如果比率小,則可以判定為X方向與Y方向 的圖像的復(fù)雜度相等,在比率大的情況下,可以判定為在哪一方向上 圖像的復(fù)雜度大。例如,在某一方向的波紋圖案那樣的圖像、具體而 言在Y方向上有豎條紋的圖案中,X方向的分量相對Y方向的分量的 比率大。
接下來,由分離超平面運算單元34使用通過上述算法求出的圖 像特征量數(shù)據(jù)和教師數(shù)據(jù)的每個塊的類型信息來求出分離超平面數(shù) 據(jù),并保存到分離超平面數(shù)據(jù)保存區(qū)域25中。 (分離超平面數(shù)據(jù)的計算方法)
在本實施例中說明使用了支持向量機(Support vector machines,以下稱為SVM)的例子。SVM是針對提供的教師數(shù)據(jù)的 集合,根據(jù)各教師數(shù)據(jù)所屬的類型計算出分離超平面,并用分離超平 面分離為各類型的方法。
分離超平面是針對每個類型運算出的。在此,作為例子,以運算 類型"海"的分離超平面的情況為例子進行說明。
在獲取了規(guī)定數(shù)的樣本圖像之后,圖像特征量運算單元33針對 每個塊獲取特征量。
此時,成為教師數(shù)據(jù)的樣本圖像內(nèi)的塊分別附有類型,賦予了 "海"、"山"、其他上述的類型。此時,也可以賦予消極類型。
在SVM中,在學(xué)習(xí)關(guān)于"海"的分類的情況下,在d維特征量空 間中,設(shè)定分割為賦予了"海"類型的特征量數(shù)據(jù)的區(qū)域、與賦予了 "海,,以外的類型的特征量數(shù)據(jù)的區(qū)域這兩個類(class)這樣的分離平 面。圖5示出將d設(shè)為二維時的特征量空間的概念。此時,分離平面
12可以被設(shè)定多個,但計算出與兩個類的最端的坐標(biāo)的距離最大(所謂 余量最大)的分離平面。此時的分離平面是對于要求出的類型"海,,的 分離超平面。
將d維特征量數(shù)據(jù)設(shè)為X- (Xl、 x2.....xd),矢量=(Wl、
w2.....wd)、常數(shù)c,則分離超平面如下表示。
W!Xi + W2X2 +…+ wdxd + c = 0( 1 )
在成為判別對象的塊被輸入到后述的類型判定單元35時,由圖 像特征量運算單元33計算出所得到的d維的特征量數(shù)據(jù)F= (Xl、
x2..... xd),根據(jù)用式(1)表示的特征量空間中的與每個類型的分
離超平面的距離,判定屬于哪個類型。
分離超平面運算單元34與上述"海"的例子同樣地對于各類型求 出分離超平面,并保存到分離超平面數(shù)據(jù)保存區(qū)域25中。圖6是將 特征量空間設(shè)為二維,并對于"海"、"山"、"天空"類型進行了學(xué)習(xí)時 的分離超平面的概念圖。
(2.對象圖像的類型化處理) (圖像輸入處理) 輸入的對象圖像通過圖像數(shù)據(jù)輸入單元31保存到存儲部20的對 象圖像保存區(qū)域21中。 (塊分割處理)
該輸入圖像通過塊圖像生成單元32被分割為預(yù)定的規(guī)定數(shù)、例 如32x32個塊并儲存到塊圖像保存區(qū)域23中。另外,塊圖像也可以 與源圖像關(guān)聯(lián)地僅保存表示各塊的開頭的地址信息。該塊的大小與作 為上述教師數(shù)據(jù)提供的塊的大小相同。 (圖像特征量運算處理)
接下來,通過上述圖像特征量運算單元33的處理,計算出每個 塊的圖像特征量數(shù)據(jù)并儲存到圖像特征量數(shù)據(jù)保存區(qū)域24中。圖7 是每個塊的圖像特征量數(shù)據(jù)的例子。在此,xl、 x2、 x3…是各特征量 數(shù)據(jù)。
(類型判定處理)接下來,由類型判定單元35根據(jù)輸入圖像的各塊的圖像特征量 的從分離超平面起的距離,判定該塊屬于哪個類型。
具體而言,在每個類型的上式(1)的左邊代入通過圖像特征量 運算處理求出的特征量數(shù)據(jù),計算出分離超平面與特征量空間中的坐
標(biāo)(Xl、 x2..... xd)之間的帶符號的距離并儲存到分離超平面數(shù)據(jù)
保存區(qū)域25中(參照圖8)。然后,判定該距離成為最大正值的類型 是該塊所屬的類型,將該判定結(jié)果保存到結(jié)果文件26中。圖9是結(jié) 果文件的數(shù)據(jù)結(jié)構(gòu)例子。在該圖中,塊NO.對應(yīng)于對象圖像的被劃分 為32x32的各塊圖像。另外,針對每個塊對應(yīng)關(guān)聯(lián)了所判定的類型。
此時,在對于任一類型都取負的距離時、或在屬于消極類型的情 況下,設(shè)定為表示不羼于任一類型的"不明確"、或?qū)㈩愋驮O(shè)為空。 (匹配檢查處理)
接下來,由匹配性檢查單元37對該結(jié)果文件26的各塊的類型進
行檢查^f參改。
圖IO是示出塊單位的類型修改步驟的流程圖。
首先,將某塊作為著眼塊,判定在與該著眼塊鄰接的塊中規(guī)定數(shù) (例如三個方向)以上的塊的類型是否與著眼塊的類型不同(S102), 在"是,,的情況下,訪問圖11所示的修改閾值表,提取成為與該類型 對應(yīng)的閾值的從分離超平面起的距離(S103),然后,判定著眼塊的 從分離超平面起的距離是所提取的閾值以上還是以下(S104),在閾 值以下的情況下,將著眼塊變更為與周圍的類型相同的類型(S105)。
在基于分離超平面來判定類型時,如果將距離條件設(shè)得過嚴,則 本來屬于該類型的部分被判定為不屬于該類型的傾向變強。另一方 面,如果過松,則不屬于該類型的部分也被誤認定為屬于該類型的傾 向變強。可以通過調(diào)整匹配檢查的闊值來設(shè)定為實用的水平。
在修改了每個塊的類型之后,由分組單元36對鄰接的相同類型 的塊進行分組,形成塊群(參照圖9以及圖12)。而且,匹配性檢查 單元37針對該塊群也判定是否沒有矛盾,并保存該判定結(jié)果。
圖13是示出匹配檢查單元37的塊群匹配性判定步驟的流程圖。對于某著眼塊群,訪問不匹配條件表并依次取出不匹配條件,判
定是否對應(yīng)于該條件。圖14示出不匹配條件。在該圖中,不匹配條 件由包含條件和上下關(guān)系位置條件構(gòu)成,例如,對于條件NO.l的"海" 而言,"海"是不會包含"天空"的,如果類型為"海"的塊覆蓋"天空"類 型的塊的周圍,則判定在類型判定上存在錯誤、即不匹配。另外,對 于條件NO.2的"天空"而言,在"天空"之上存在"海"、并且在天空之 下存在"山"的情況被判定為存在不匹配。對于各塊群,判定這些條件。 另外,在該匹配檢查的結(jié)果,當(dāng)存在不匹配的情況下,也可以輸出表 示該意思的消息,也可以對于存在不匹配的塊群的邊界的塊進行如下 修改處理分別向從分離超平面起的距離、或與修改閾值表的閾值之 差大的一方的類型依次對應(yīng)。另外,在屬于塊群中的塊數(shù)為針對每個 類型預(yù)先規(guī)定的規(guī)定值以下的情況下,也可以進行4吏該塊群的類型成 為無效等處理。
然后,該對象圖像的類型信息、以及判定結(jié)果經(jīng)由輸出單元38 而輸出。
以上,根據(jù)本實施方式,在塊圍像的顏色空間中根據(jù)強度而等級 化為多個等級,并將每個等級的出現(xiàn)次數(shù)、像素間標(biāo)準偏差、表示濃 淡變化的頻率分量、以及塊內(nèi)的頻率分量的偏移設(shè)為圖像特征量,所 以可以高精度地進行識別。
接下來,對本發(fā)明的第二實施方式進行說明。圖15是安裝了圖 2的判別器10的攝像裝置的框圖。在該圖中,攝像裝置1包括生成 被攝體的圖像信號的攝像元件2;檢測快門操作并輸出圖像累積指令 的快門操作檢測單元4;接收來自快門操作檢測單元4的圖像累積指 令,累積從攝像元件2輸出的圖像信號的累積單元5;校正所累積的 圖像數(shù)據(jù)的圖像處理單元6;判別器10;以及根據(jù)從判別器10輸出 的類型數(shù)據(jù)設(shè)定攝像元件2的參數(shù)的參數(shù)設(shè)定單元3。
在此,判別器10雖然基本上具有圖2所示的結(jié)構(gòu),但在向攝像 裝置1安裝時,預(yù)先保存另外計算出的分離超平面數(shù)據(jù),所以可以省 略分離超平面運算單元34。以下,說明具有上述結(jié)構(gòu)的攝像裝置1的動作。在快門操作前的預(yù)覽模式下從攝像元件2輸出的圖像信號被輸 入到判別器IO。在判別器10中,對該圖像信號執(zhí)行第一實施方式中 說明的動作,輸出針對圖像塊群的類型。參數(shù)設(shè)定單元3具備圖16 所示的將類型與參數(shù)對應(yīng)關(guān)聯(lián)的參數(shù)表,并參照該表來進行攝像元件 2的快門速度、曝光時間、其他模式設(shè)定。之后,快門操作檢測單元4在檢測到快門被按下時,將該定時通 知給攝像元件2,并且將從攝像元件2輸出的圖像信號累積到累積單 元5中。該累積的圖像數(shù)據(jù)被讀入到圖像處理單元6,根據(jù)從判別器 IO輸出的該圖像的類型數(shù)據(jù),按照圖17所示的將類型與校正處理對 應(yīng)關(guān)聯(lián)的校正處理數(shù)據(jù),執(zhí)行相應(yīng)的校正處理。根據(jù)本實施方式,使用通過預(yù)覽得到的圖像數(shù)據(jù)的類型判定的結(jié) 果,調(diào)整攝像裝置的參數(shù)而進行拍攝,在拍攝之后進而進行與該類型 對應(yīng)的圖像處理,所以無需使用戶進行復(fù)雜的參數(shù)設(shè)定操作,就可以 生成高質(zhì)量的攝像圖像。另外,本發(fā)明可以在不脫離其要旨的范圍內(nèi)進行各種變形而實 施。例如,在上述實施方式中,以所謂的風(fēng)景被攝體為例子進行了說 明,但不限于被攝體是否為風(fēng)景的情況,例如當(dāng)然可以包括人、人工 物等適用于任意類型。另外,如圖18所示,也可以根據(jù)識別出的風(fēng)景被攝體來提示用 戶利用的可能性高的拍攝模式,以使進行選擇。通過進行與所選擇的 模式對應(yīng)的參數(shù)設(shè)定、圖像處理,可以生成與用戶的希望對應(yīng)的高質(zhì) 量的圖像。接下來,說明本發(fā)明的第三實施方式。圖19是本實施方式的攝 像裝置的框圖。與圖15的區(qū)別點在于,代替參數(shù)設(shè)定單元3,設(shè)置有 與類型對應(yīng)關(guān)聯(lián)地儲存程序的程序儲存單元8;輸入由判別器10判別 的類型,在保存在程序儲存單元8內(nèi)的程序中選擇與該類型對應(yīng)關(guān)聯(lián) 的程序的程序選擇單元7;以及執(zhí)行由選擇單元7選擇的程序的程序 執(zhí)行單元9。以下,以對表示了圖20 U)所示的二維條形碼50的名片進行 拍攝的情況為例子,說明攝像裝置l的動作。首先,預(yù)先使判別器IO通過在實施方式1中iJL明的方法,利用 二維條形碼的教育數(shù)據(jù)進行學(xué)習(xí),并保存該分離超平面數(shù)據(jù)。通過使用該攝像裝置1對帶二維條形碼的名片進行拍攝,從攝像 元件2輸出的名片的圖像信號被輸入到判別器10。在判別器10中, 對該名片圖像執(zhí)行在第一實施方式中說明的動作,輸出每個圖像塊群 的類型。判別器10由于具備二維條形碼的分離超平面數(shù)據(jù),所以在 該情況下,將圖20 (b)的A部的用粗框表示的塊群識別為二維條形 碼的類型,輸出塊群與類型信息。程序選擇單元7在輸入了該類型數(shù)據(jù)后,選擇保存在程序儲存單 元8中的二維條形碼讀取程序,并提交給程序執(zhí)行單元9。然后,程 序執(zhí)行單元9啟動從程序選擇單元7提交來的二維條形碼讀取程序。二維條形碼讀取程序在啟動之后,將攝像單元的設(shè)置設(shè)定為焦距 短的微距拍攝模式,對圖像處理單元6請求二維條形碼區(qū)域的圖像數(shù) 據(jù)。圖像處理單元6判斷輸入圖像是否為二維條形碼圖像數(shù)據(jù),將二 維條形碼區(qū)域的圖像提交給程序執(zhí)行單元9。由程序執(zhí)行單元9執(zhí)行 的二維條形碼讀取程序處理二維條形碼圖像,獲取包含在其中的信 息,并作為結(jié)果而輸出。以上,對于二維條形碼的情況說明了攝像裝置1的動作,但只要 與類型對應(yīng)地存在應(yīng)啟動的程序,則可以進行同樣動作。例如,如果與文字信息的類型對應(yīng)關(guān)聯(lián)地儲存有OCR程序,則 判別器IO將圖20 (b)的B部識別為文字信息,啟動OCR程序,可 以讀取B部的文字信息。根據(jù)本實施方式,由于將類型與程序?qū)?yīng)關(guān)聯(lián)地保存,根據(jù)從判 別器輸出的類型數(shù)據(jù),執(zhí)行對應(yīng)的程序,所以操作性提高。而且,通 過與基于圖像處理單元的校正處理連動,從而可以提高程序處理的精 度。1權(quán)利要求
1.一種圖像識別方法,通過計算機處理,根據(jù)輸入的圖像數(shù)據(jù)的塊圖像的特征量,將該塊圖像分類為預(yù)定的多個類型,其特征在于,包括塊圖像生成步驟,將上述圖像數(shù)據(jù)分割為多個塊而生成塊圖像;圖像特征量運算步驟,利用塊圖像的顏色空間信息以及頻率分量,運算出各個上述塊圖像的特征量;分離超平面運算步驟,讀入針對每個塊附有類型的教師數(shù)據(jù)圖像,針對上述教師數(shù)據(jù)圖像的塊的每一個運算出圖像特征量,學(xué)習(xí)成為識別各類型的邊界的分離超平面;以及類型判定步驟,對于新獲取的圖像,執(zhí)行上述塊圖像生成步驟和上述圖像特征量運算步驟,計算出塊圖像的圖像特征量,利用特征量空間中的從各類型的分離超平面起的距離判定該塊圖像所屬的類型。
2. 根據(jù)權(quán)利要求1所述的圖像識別方法,其特征在于,在上述圖像特征量運算步驟中,將上述塊圖像在顏色空間上分割為多個等級 并對每個等級的出現(xiàn)次數(shù)進行檢測,并且運算出塊內(nèi)的像素間標(biāo)準偏差,另一方面將該塊圖像進一步分為多個小塊,計算出該小塊的表示 濃淡變化的頻率分量,根據(jù)該頻率分量,對于該小塊所屬的塊內(nèi),針 對水平方向與垂直方向中的至少一個方向,運算出上迷頻率分量的偏移,將上述出現(xiàn)次數(shù)、上述# 素間標(biāo)準偏差、上述頻率分量以及上述 頻率分量的偏移作為圖像特征量進行運算。
3. 根據(jù)權(quán)利要求1或2所述的圖像識別方法,其特征在于,包括保存類型間的不匹配條件,參照上述新獲取的圖像的塊圖像的周 圍的塊,根據(jù)上述周圍的塊的參照結(jié)果與上述不匹配條件,變更上述 新獲取的圖像的塊圖像的類型的步驟;以及匹配檢查步驟,對鄰接的同一類型的塊進行分組,對于該分組后 的塊群,根據(jù)上述不匹配條件,評價類型判定有無合理性。
4. 根據(jù)權(quán)利要求3所述的圖像識別方法,其特征在于,上述匹 配檢查步驟的結(jié)果,輸出被評價為有合理性的塊群的類型。
5. —種攝像裝置,通過權(quán)利要求1~4中的任意一項所述的圖像 識別方法來識別圖像的類型,其特征在于,具備拍攝條件保存單元,針對每個類型存儲攝像裝置的參數(shù)的設(shè)定條 件和拍攝后的圖像處理方法;攝像單元,在拍攝時,根據(jù)通過上述圖像識別方法輸出的拍攝對 象圖像的類型,設(shè)定上述攝像裝置的參數(shù),獲取攝像圖像;以及圖像處理單元,對該攝像圖像通過針對該類型的上述圖像處理方 法執(zhí)行圖像處理。
6. —種攝像裝置,通過權(quán)利要求1~4中的任意一項所述的圖像 識別方法來識別圖像的類型,其特征在于,具備程序儲存單元,與類型對應(yīng)關(guān)聯(lián)地儲存應(yīng)執(zhí)行的程序; 程序選擇單元,在上述程序儲存單元中儲存有與通過上述圖像識 別方法識別的類型對應(yīng)關(guān)聯(lián)的程序的情況下,選擇該程序;以及 程序執(zhí)行單元,執(zhí)行由上述程序選擇單元選擇的程序。
全文摘要
本發(fā)明提供一種圖像識別方法以及攝像裝置,在使用由攝像裝置拍攝的圖像的塊圖像的特征量來識別對象時,抑制CPU的處理成本,高精度地識別對象。將圖像數(shù)據(jù)分割為多個塊而生成塊圖像,利用塊圖像的顏色空間信息以及頻率分量來運算出各個塊圖像的特征量。另外,作為教師數(shù)據(jù),預(yù)先運算出每個類型的圖像特征量,并使用該特征量來計算出成為識別類型的邊界的分離超平面,對于新獲取的圖像也同樣地計算出塊圖像的圖像特征量,利用從各類型的分離超平面起的距離,判定該塊圖像所屬的類型。
文檔編號G06K9/62GK101650783SQ200910165538
公開日2010年2月17日 申請日期2009年7月29日 優(yōu)先權(quán)日2008年8月13日
發(fā)明者安田泰代, 平賀督基, 棚瀨寧, 椎野壽樹, 浜田哲也, 鈴木敬 申請人:株式會社Ntt都科摩;株式會社摩如富