專利名稱:影像場景辨識方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種影像辨識方法,特別是涉及一種影像自動場景辨識方法。
背景技術(shù):
目前, 一般數(shù)字影像獲取器如數(shù)字相機等在攝影時容易受到使用者的技術(shù) 與影像周圍光源與背景的影響,而使得影像失真。因此, 一般數(shù)字影像獲取器 如數(shù)字相機等多半使用許多場景模式以輔助使用者加強所拍攝的影像品質(zhì)。一 般常見的場景模式如山、海、花、雪地與人物等是事先設(shè)定好對焦、曝光、色 彩調(diào)整或白平衡等參數(shù),其都預設(shè)于數(shù)字影像獲取器當中以供使用者依照攝影 時的現(xiàn)實情況來選擇使用。
然而,一般數(shù)字影像獲取器雖具有諸多場景模式供使用者依現(xiàn)實情況選擇 較為適宜的模式來做拍攝,但是使用者必須手動調(diào)整場景模式才能選用,當使 用者疏忽或者是無法自行判斷適當?shù)膱鼍澳J綍r,將造成拍攝影像品質(zhì)無法有 效提升,甚至使得影像品質(zhì)更加不良。
如上所述,由于一般數(shù)字影像獲取器無法自動辨識拍攝時的影像場景,使 用者必須自行判斷現(xiàn)實狀況后手動選用適當?shù)膱鼍澳J?,因此造成使用者于?攝上相當不便。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題在于提供一種影像場景辨識方法,以解決先前 技術(shù)中的一般數(shù)字影像獲取器無法自動辨識拍攝時的影像場景而使得使用者 必須自行判斷現(xiàn)實狀況后手動選用適當?shù)膱鼍澳J降膯栴}。
為了解決上述技術(shù)問題,本發(fā)明提供一種影像場景辨識方法,其特點在于,
該步驟包括檢測一影像;分割該影像以得到多個影像單元;取得每一該影像 單元的一色彩特征與一結(jié)構(gòu)特征;根據(jù)每一該影像單元的該色彩特征與該結(jié)構(gòu) 特征定義出每一該影像單元的一標的類別;以及分析該影像所包含的每一該影
3像單元的該標的類別以選定相應該影像的一場景模式。
上述影像場景辨識方法,其特點在于,該定義該標的類別的步驟包括利 用一數(shù)據(jù)庫比較及定義出每一該影像單元的該標的類別。
上述影像場景辨識方法,其特點在于,還包括利用一類神經(jīng)網(wǎng)絡(luò)建立該 數(shù)據(jù)庫。
上述影像場景辨識方法,其特點在于,建立該數(shù)據(jù)庫的步驟,包括提供 大量的標準的該標的類別給該類神經(jīng)網(wǎng)絡(luò);以及通過該類神經(jīng)網(wǎng)絡(luò)學習提供的 該標準的該標的類別而建立該數(shù)據(jù)庫。
上述影像場景辨識方法,其特點在于,選定相應該影像的該場景模式的步 驟,包括通過分析與統(tǒng)計所有該影像單元所屬的該標的類別的數(shù)量與配置情 形而選定該場景模式。
上述影像場景辨識方法,其特點在于,還包括提供至少一標準的該標的 類別給該類神經(jīng)網(wǎng)絡(luò);以及通過該類神經(jīng)網(wǎng)絡(luò)學習提供的該標準的該標的類別 而更新該數(shù)據(jù)庫的內(nèi)容。
通過本發(fā)明的技術(shù)手段,可達到自動辨識影像場景,進而增加數(shù)字攝影的 便利性以及提高拍攝影像的品質(zhì)。因此,使用者在使用應用本發(fā)明的數(shù)字影像 獲取器進行拍攝時,不必手動選用場景模式,可由數(shù)字影像獲取器自動辨識并 選定場景模式。
以下結(jié)合附圖和具體實施例對本發(fā)明進行詳細描述,但不作為對本發(fā)明的 限定。
圖1為本發(fā)明一實施例的影像場景辨識方法流程圖2為本發(fā)明一實施例的影像場景辨識模型示意圖3為本發(fā)明一實施例的類神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)庫學習模型示意圖4為本發(fā)明一實施例的類神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)庫建立流程圖;以及
圖5為本發(fā)明一實施例的類神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)庫更新流程圖。
其中,附圖標記-
100 影像 110 影像單元
120 色彩特征 130 結(jié)構(gòu)特征200 數(shù)據(jù)庫 250 類神經(jīng)網(wǎng)絡(luò)
300 標的類別 400 場景模式
具體實施例方式
請參照圖1,為根據(jù)本發(fā)明一實施例的影像場景辨識方法的流程圖。
如圖1所示,步驟IO, 一開始先對一影像進行檢測。接著,步驟20,分 割影像以得到多個影像單元。步驟30,跟著取得每一影像單元的一色彩特征 與一結(jié)構(gòu)特征。然后,步驟40,根據(jù)每一影像單元的色彩特征與結(jié)構(gòu)特征定 義出每一影像單元的標的類別。最后,步驟50,分析及統(tǒng)計影像所包含的每 一影像單元的標的類別以選定相應影像的一場景模式,作為影像的場景模式。
請參照圖2,為在根據(jù)本發(fā)明的影像場景辨識方法上, 一實施例的影像場 景辨識模型的示意圖。如圖2所示,首先檢測一影像100并將影像100分割成 九個影像單元110。
在此為了方便說明僅分割成九個影像單元110,然其并非用以限定本發(fā)明
的實施方式,僅為示例性說明,在實施上還可分割成更多個影像單元iio。
接著,在得到九個影像單元110之后,抽取每一影像單元110的兩種主要 特征,也即取得每一影像單元110的色彩特征120與結(jié)構(gòu)特征130。
其中,色彩特征120如藍、綠與黃等顏色。結(jié)構(gòu)特征130如物質(zhì)的表面組 成等結(jié)構(gòu)。
然后,根據(jù)每一影像單元110的色彩特征120與結(jié)構(gòu)特征130,利用一數(shù) 據(jù)庫200定義出每一影像單元110的標的類別300,因此可得到九個標的類別 300。于數(shù)據(jù)庫200中會儲存有每種標的類別300與其所對應的色彩特征120 與結(jié)構(gòu)特征130。
其中,標的類別300如天空、皮膚、水與沙等類別。
最后,分析所得到的九個標的類別300,通過統(tǒng)計結(jié)果選定一場景模式 400,以作為影像100的場景。
其中,場景模式400如海景、雪景、高山、藍天、花海與人物等。
于本實施例中,影像場景辨識模型先通過檢測得到一影像100,再將影像 100分割成九個影像單元110,每一影像單元110抽取出色彩特征120與結(jié)構(gòu) 特征130,接著通過數(shù)據(jù)庫200定義出九個標的類別300,最后通過分析統(tǒng)計而得到相應于影像100的一場景模式400。
以拍攝海灘上的人物為例, 一開始先對包含沙灘、海水與人物的影像進行 檢測。然后將檢測到的影像分割成多個影像單元。此時,每一個影像單元所包 含的部分都不一樣,有的是人物的皮膚,有的是海水或沙子。換句話說,影像 在分割后可產(chǎn)生有包含皮膚的影像單元、包含沙子的影像單元與包含海水的影 像單元。然后將包含皮膚的影像單元、包含沙子的影像單元與包含海水的影像 單元各自抽取出色彩特征與結(jié)構(gòu)特征。其中,皮膚、沙子與海水的色彩特征都 不同,結(jié)構(gòu)特征也不一樣。然后根據(jù)每一影像單元的色彩特征與結(jié)構(gòu)特征定義 出每一影像單元的標的類別。例如根據(jù)色彩特征與結(jié)構(gòu)特征會將包含皮膚的 影像單元判定為代表皮膚的標的類別、將包含沙子的影像單元判定為代表沙子 的標的類別,而將包含海水的影像單元判定為代表海水的標的類別。最后分析 與統(tǒng)計影像所包含的每一影像單元所對應的標的類別,如皮膚、沙子與海水的 數(shù)量與配置情形,而辨識影像場景是海灘上的人物照,進而影像獲取器如相機 的場景模式將自動設(shè)定為海灘人物照模式。
請參照圖3,為在根據(jù)本發(fā)明的影像場景辨識方法中, 一實施例的類神經(jīng)
網(wǎng)絡(luò)數(shù)據(jù)庫的學習模型的示意圖。
如圖3所示, 一開始先將多個標的類別300,如天空、皮膚、水與沙等, 個別抽取出色彩特征120與結(jié)構(gòu)特征130等資料。然后,將每一個標的類別 300的色彩特征120與結(jié)構(gòu)特征130的資料輸入到類神經(jīng)網(wǎng)絡(luò)250以供學習之 用。最后類神經(jīng)網(wǎng)絡(luò)250通過學習過程而建立一數(shù)據(jù)庫200,即類神經(jīng)網(wǎng)絡(luò)數(shù) 據(jù)庫,以供于場景辨識過程中比對出各影像單元的標的類別300。
類神經(jīng)網(wǎng)絡(luò)250是一種模仿人類神經(jīng)系統(tǒng)且具有學習能力的運算結(jié)構(gòu),由 許多運算單元之間眾多連結(jié)所組成,運算單元是以平行且分散的方式運作,可 以同時處理大量的數(shù)據(jù)。
請參照圖4,為在根據(jù)本發(fā)明的影像場景辨識方法中, 一實施例的類神經(jīng)
網(wǎng)絡(luò)數(shù)據(jù)庫建立流程圖。
如圖4所示,步驟60,可提供大量的標的類別300供類神經(jīng)網(wǎng)絡(luò)250,步
驟70,讓類神經(jīng)網(wǎng)絡(luò)250學習并建立數(shù)據(jù)庫200,以供辨識各標的類別犯0。 再者,此類神經(jīng)網(wǎng)絡(luò)250也可內(nèi)建于前述實施例的影像場景辨識模型中。 請參照圖5,為在根據(jù)本發(fā)明的影像場景辨識方法中, 一實施例的類神經(jīng)
6網(wǎng)絡(luò)數(shù)據(jù)庫更新流程圖。
如圖5所示,步驟80,使用者可將取得的至少一標準標的類別300提供 給類神經(jīng)網(wǎng)絡(luò)250,步驟90,類神經(jīng)網(wǎng)絡(luò)250進而學習并更新數(shù)據(jù)庫200中所 儲存的標的類別300與色彩特征120和結(jié)構(gòu)特征130的對應關(guān)系。
綜上所述,通過本發(fā)明的技術(shù)手段,可達到自動辨識影像場景,以增加數(shù) 字攝影的便利性以及提高拍攝影像的品質(zhì)。簡言之,使用者在使用應用本發(fā)明 的數(shù)字影像獲取器進行拍攝時不必手動選用場景模式,可由數(shù)字影像獲取器根 據(jù)本發(fā)明的影像場景辨識方法而自動辨識并選定較佳場景模式。
當然,本發(fā)明還可有其他多種實施例,在不背離本發(fā)明精神及其實質(zhì)的情 況下,熟悉本領(lǐng)域的技術(shù)人員可根據(jù)本發(fā)明做出各種相應的改變和變形,但這 些相應的改變和變形都應屬于本發(fā)明權(quán)利要求的保護范圍。
權(quán)利要求
1、一種影像場景辨識方法,其特征在于,該步驟包括檢測一影像;分割該影像以得到多個影像單元;取得每一該影像單元的一色彩特征與一結(jié)構(gòu)特征;根據(jù)每一該影像單元的該色彩特征與該結(jié)構(gòu)特征定義出每一該影像單元的一標的類別;以及分析該影像所包含的每一該影像單元的該標的類別以選定相應該影像的一場景模式。
2、 根據(jù)權(quán)利要求1所述的影像場景辨識方法,其特征在于,該定義該標 的類別的步驟包括利用一數(shù)據(jù)庫比較及定義出每一該影像單元的該標的類 別。
3、 根據(jù)權(quán)利要求2所述的影像場景辨識方法,其特征在于,還包括利用一類神經(jīng)網(wǎng)絡(luò)建立該數(shù)據(jù)庫。
4、 根據(jù)權(quán)利要求3所述的影像場景辨識方法,其特征在于,建立該數(shù)據(jù) 庫的步驟,包括提供大量的標準的該標的類別給該類神經(jīng)網(wǎng)絡(luò);以及 通過該類神經(jīng)網(wǎng)絡(luò)學習提供的該標準的該標的類別而建立該數(shù)據(jù)庫。
5、 根據(jù)權(quán)利要求1所述的影像場景辨識方法,其特征在于,選定相應該 影像的該場景模式的步驟,包括通過分析與統(tǒng)計所有該影像單元所屬的該標的類別的數(shù)量與配置情形而選定該場景模式。
6、 根據(jù)權(quán)利要求3所述的影像場景辨識方法,其特征在于,還包括提供至少一標準的該標的類別給該類神經(jīng)網(wǎng)絡(luò);以及通過該類神經(jīng)網(wǎng)絡(luò)學習提供的該標準的該標的類別而更新該數(shù)據(jù)庫的內(nèi)容。
全文摘要
本發(fā)明涉及一種影像場景辨識方法,該步驟包括檢測一影像;分割該影像以得到多個影像單元;取得每一該影像單元的色彩特征與結(jié)構(gòu)特征;根據(jù)每一該影像單元的該色彩特征與該結(jié)構(gòu)特征定義出每一該影像單元的標的類別;以及分析該影像所包含的每一該影像單元的該標的類別以選定相應該影像的場景模式。通過本發(fā)明,可達到自動辨識影像場景,進而增加數(shù)字攝影的便利性以及提高拍攝影像的品質(zhì),使用者不必手動選用場景模式,可由數(shù)字影像獲取器自動辨識并選定場景模式。
文檔編號H04N5/232GK101489044SQ200810002369
公開日2009年7月22日 申請日期2008年1月15日 優(yōu)先權(quán)日2008年1月15日
發(fā)明者林升甫, 陳皇村 申請人:華晶科技股份有限公司