專利名稱:數(shù)碼相機中自適應(yīng)自動聚焦方法
技術(shù)領(lǐng)域:
本發(fā)明是一種數(shù)碼相機中的自動聚焦技術(shù),屬于數(shù)碼相機的圖像處理的技術(shù)領(lǐng)域。
背景技術(shù):
從基本原理上來說,自動聚焦方法可以分為兩大類一類是主動方法;另一類是被動方法。主動方法是基于鏡頭與被拍攝物體之間距離測量的測距方法,根據(jù)被拍攝物體的情況調(diào)整光學(xué)系統(tǒng),主動方法的特征是通過接收主動發(fā)射的電磁波或聲波的反射波來測量物體的距離和方位,并根據(jù)光學(xué)成像原理計算最佳聚焦位置,然后通過信息處理器來控制電機以實現(xiàn)自動聚焦,因此這種方法稱為主動方法。由于需要附加的測距設(shè)備,因此采用這種方法的儀器一般體積較大,攜帶不方便,價格較高,并且對于近距離的情況不太適用。
被動方法指利用光學(xué)系統(tǒng)所獲取圖像本身所自有的信息來實現(xiàn)自動聚焦,經(jīng)過鏡頭位置的調(diào)節(jié)以獲取最清晰的聚焦圖像,這種方法通常也稱為基于數(shù)字圖像處理的自動聚焦方法。該方法可以通過軟件實現(xiàn)自動調(diào)焦,即通過固定的算法對數(shù)字圖像內(nèi)在包含的信息進行相應(yīng)處理,得到相應(yīng)的控制量,驅(qū)動步進電機,帶動鏡頭前后移動,直到獲得聚焦清楚的圖像。由于被動方法不需要額外的測距設(shè)備,因此采用這種方法的儀器一般體積較小,攜帶方便,使用靈活,可應(yīng)用于數(shù)碼相機等光學(xué)系統(tǒng)中。采用被動方法實現(xiàn)自動聚焦的一個關(guān)鍵問題是如何設(shè)計有效的圖像清晰度評價函數(shù)來判斷圖像是否清晰。一個理想的圖像清晰度評價函數(shù)應(yīng)具有無偏性,所得到的最佳聚焦位置應(yīng)同圖像清晰度評價函數(shù)的最大值相對應(yīng),同時還應(yīng)具有較好的抗噪聲能力和較小的運算復(fù)雜度。
根據(jù)光學(xué)成像原理,在焦距f,物距u以及像距v之間滿足如下關(guān)系1f=1u+1v---(1)]]>
理想聚焦情況是物平面上的每一個點所發(fā)出的光線,經(jīng)過透鏡折射后仍交于一點。即每一個物點都對應(yīng)一個像點。當(dāng)一個物體的物平面到透鏡的距離為u時,觀察平面到透鏡的距離為v時,所得到的圖像為最清晰的聚焦圖像,此時觀察平面位于聚焦平面上。若觀察平面偏離了聚焦平面,物平面上每一點所發(fā)出的光線則會在觀察平面上形成一個模糊圓,也就是產(chǎn)生了離焦圖像,這時的圖像將變得模糊。如果觀察平面距離聚焦平面越遠(yuǎn),那么在觀察平面上所產(chǎn)生的圖像也就越模糊。如果存在多個物距u大小不同的物體時,并且這多個物體的物距u都遠(yuǎn)大于透鏡本身的焦距f,那么這多個物體所發(fā)射的光線在到達(dá)透鏡時都可以近似為平行光,它們的像距v都可近似為透鏡的焦距f,即v=ufu-f≈f---(2)]]>這時,如果觀察平面位于透鏡的焦平面時,這多個物體所成的像最為清晰,因此可以同時得到這多個物體清晰的聚焦圖像。目前的聚焦方法大多是針對這一情況進行的研究。但如果在多個物體中至少存在一個物體的物距u同焦距f相比不能視為無窮大時,那么當(dāng)與透鏡距離不同的多個物體所發(fā)出的光線經(jīng)過透鏡折射后,各個物體經(jīng)過透鏡后的像距v也不相同。此時,無論觀察平面處在哪一個位置,都不可能同時得到所有這些物體所生成的清晰圖像,而目前的技術(shù)針對這一情況的研究較少。另外,傳統(tǒng)的圖像清晰度評價函數(shù)要求滿足單峰性,而在這種情況下,性能良好的圖像清晰度評價函數(shù)往往不會出現(xiàn)單峰的情況,這是因為多個物體的像距不同的緣故,圖像清晰度評價函數(shù)往往會在不同物體的像距位置處出現(xiàn)多個峰值。
一般而言,聚焦越準(zhǔn)確的圖像,它的高頻分量也就越多,邊緣細(xì)節(jié)部分也就越銳利;而離焦的圖像,它的高頻分量受到損失,邊緣部分就顯得相對平滑,離焦程度越明顯的圖像,它的高頻分量損失也就越多,圖像邊緣部分也就越平滑,圖像也就越模糊。因此,可以對圖像進行二維DCT變換,將圖像由空域變換到頻域,得到二維DCT系數(shù),二維DCT系數(shù)較好的體現(xiàn)了圖像的頻率信息,其中高頻信息主要反映了圖像的邊緣細(xì)節(jié)部分,于是可以取二維DCT系數(shù)中的高頻分量的能量作為圖像清晰度的評價準(zhǔn)則,從而構(gòu)造圖像清晰度評價函數(shù)。然而就二維DCT系數(shù)而言,很難嚴(yán)格地區(qū)分哪些二維DCT系數(shù)屬于高頻成分,通常的方法是去除二維DCT系數(shù)的直流系數(shù),而將交流系數(shù)的能量作為圖像清晰度的評價準(zhǔn)則,這樣就會將二維DCT系數(shù)的低頻成分和高頻成分同等地對待,這就導(dǎo)致這種方法往往不能滿足圖像清晰度評價函數(shù)的要求,進而容易造成聚焦不準(zhǔn)確的情況。
發(fā)明內(nèi)容
技術(shù)問題本發(fā)明的目的是提供一種數(shù)碼相機中自適應(yīng)自動聚焦方法,該方法定義了一個感興趣的窗口區(qū)域,該窗口的大小可以根據(jù)圖像的分辨率進行自適應(yīng)地調(diào)整,以適應(yīng)不同的拍攝要求,當(dāng)不同物體與透鏡的距離不相同時,可以將感興趣的物體鎖定在這個窗口區(qū)域,從而對感興趣的物體實現(xiàn)自動聚焦。
技術(shù)方案由于距離透鏡不同的物體,在經(jīng)過透鏡折射后所對應(yīng)的像平面與透鏡的距離也不相同,當(dāng)至少有一個物體的物距u同焦距f相比不能視為無窮大時,將會出現(xiàn)當(dāng)其中一個物體所成的像聚焦清晰時其他物體所成的像將變得模糊的情況。而目前的自動聚焦方法針對這一問題研究較少。
鏡頭系統(tǒng)實際上可以等效為一個低通濾波系統(tǒng)。處于聚焦?fàn)顟B(tài)時的圖像,其高頻成分相對豐富,圖像的邊緣細(xì)節(jié)部分清晰;而處于離焦?fàn)顟B(tài)時的圖像,其高頻成分受到損失,圖像的邊緣細(xì)節(jié)部分也就顯得模糊,而且離焦程度越大,這種現(xiàn)象表現(xiàn)得也就越明顯。從這個角度出發(fā),可以選取圖像中高頻成分的能量作為清晰度的評價標(biāo)準(zhǔn),構(gòu)造圖像清晰度評價函數(shù),而對圖像進行二維DCT變換后,得到的二維DCT系數(shù)就體現(xiàn)了圖像的頻率特征。目前的方法通常是將二維DCT系數(shù)的直流成分去除,將交流成分的能量作為圖像清晰度的評價準(zhǔn)則,然而交流成分中既包含高頻成分,也同時包含大量的低頻成分,這種方法將高頻成分和低頻成分同等地處理,存在理論上的不足,并在實際操作中往往使聚焦不準(zhǔn)確。
為此,提供了一種加權(quán)的二維DCT系數(shù)方法,這種方法首先將二維DCT的直流系數(shù)去除,然后對二維DCT系數(shù)的低頻成分和高頻成分區(qū)別對待,將不同的頻率成分賦予不同的權(quán)重,將高頻成分賦予較大的權(quán)重,而將低頻成分賦予較小的權(quán)重。DCT系數(shù)的頻率越高,所賦予的權(quán)重也就越大。這樣可以將高頻成分明顯地突出出來,而對于低頻成分也具有一定的抑制作用。因此,該方法要優(yōu)于傳統(tǒng)的二維DCT方法。
在通常情況下,人的注意力都會集中于圖像的中間區(qū)域,具體地說,當(dāng)拍攝照片時人總是習(xí)慣于將自己感興趣的內(nèi)容放在圖像的中間區(qū)域。在實際拍攝景物時,如果存在多個物距不同的物體,并且至少有一個物體的物距同焦距相比不能視為無窮大時,那么這時不同物距的物體將具有不同的像距,因此在觀察平面不可能同時清晰地顯示出不同物距的物體所成的像。對此必須有所取舍,提供了將圖像的中間區(qū)域作為整幅圖像的“重點”的方法來解決這一問題,具體地說,將中間區(qū)域所對應(yīng)的聚焦平面作為整幅圖像的聚焦平面,其中中間區(qū)域的大小至關(guān)重要,如果窗口過大,有可能會造成窗口內(nèi)感興趣的物體所占的區(qū)域小于其周圍背景所占的區(qū)域,這樣聚焦的結(jié)果可能會將周圍背景進行聚焦,而此時感興趣的物體卻可能處于離焦?fàn)顟B(tài);如果窗口過小,則可能會丟失部分感興趣物體的區(qū)域。因此,需要對窗口大小進行折中考慮。另外考慮到所需不同分辨率圖像的要求,為此提供了一種能根據(jù)所需分辨率自適應(yīng)地調(diào)節(jié)大小的窗口區(qū)域。具體地說,將二維原始圖像的行和列分別進行三等分,然后分別取行和列的1/3中間部分的相交區(qū)域作為感興趣的窗口,于是窗口的面積占整幅圖像面積的1/9,可以看出這時窗口的大小可以隨著圖像的分辨率做自適應(yīng)地調(diào)整,在拍攝圖像時,可將感興趣的目標(biāo)鎖定在中間窗口,這樣就可利用后續(xù)的圖像清晰度評價函數(shù)和搜索策略僅對感興趣的目標(biāo)進行自動聚焦。
然后提供了一種新的圖像清晰度評價函數(shù)。對圖像中間窗口的子圖像,利用圖像清晰度評價函數(shù)來判斷其清晰度。將子圖像進行二維DCT變換后,得到二維DCT系數(shù),由于二維DCT系數(shù)的低頻成分和高頻成分對圖像清晰度的影響不同,為此,提供了一種加權(quán)二維DCT系數(shù)方法。
本發(fā)明的數(shù)碼相機中自適應(yīng)自動聚焦方法,其步驟為a、用數(shù)碼相機采集原始的彩色圖像;b、根據(jù)原始圖像的分辨率大小,采用自適應(yīng)窗口的方法將原始圖像彩色中間區(qū)域作為子圖像剪切出來;c、將彩色的子圖像轉(zhuǎn)換為灰度圖象;d、對灰度子圖像進行二維DCT變換,獲得二維DCT系數(shù);e、對二維DCT系數(shù)按照其頻率的大小進行自適應(yīng)加權(quán),計算圖像清晰度評價函數(shù);f、根據(jù)圖像清晰度評價函數(shù),采用一種全程的搜索策略控制步進電機的移動,搜索出清晰的聚焦圖像。
其中自適應(yīng)窗口的方法的具體步驟為首先計算原始圖像的分辨率大小,根據(jù)原始圖像的分辨率將二維原始圖像的行和列分別進行三等分,然后分別取行和列的中間部分相交的區(qū)域作為感興趣的窗口,于是窗口的面積占整幅圖像面積的九分之一大小,最后將該窗口中的圖像作為子圖像從原始圖像中剪切出來。
其中光學(xué)自動聚焦中圖像清晰度評價函數(shù)中加權(quán)二維DCT系數(shù)方法,其步驟為1.)設(shè)I(x,y)表示分辨率為M×N的灰度圖像在像素點(x,y)的灰度值,則灰度圖像的二維DCT變換定義為F(u,v)=C(u)C(v)Σm=0M-1Σn=0N-1I(x,y)cosπ(2m+1)u2Mcosπ(2n+1)v2N]]>其中u和v分別表示頻域中的行頻率和列頻率,F(xiàn)(u,v)稱為圖像I(x,y)的二維DCT系數(shù),其中C(u)和C(v)分別由下式定義C(u)=1Mu=02M1≤u≤M-1,C(v)=1Nv=02N1≤v≤N-1]]>2.)去除二維DCT系數(shù)的直流系數(shù),剩余的其他系數(shù)則為交流系數(shù),按照二維DCT系數(shù)頻率的大小,對交流系數(shù)進行自適應(yīng)加權(quán)來計算圖像清晰度評價函數(shù),計算公式如下E1=Σu=0M-1Σv=0N-1[(u+v)F(u,v)2]]]>E2=Σu=0M-1Σv=0N-1[(u+v)|F(u,v)|]]]>其中,E1和E2分別表示圖像清晰度評價函數(shù)中的平方能量和絕對值能量,M和N分別表示二維DCT系數(shù)中的行數(shù)和列數(shù),u和v分別表示頻域中的行頻率和列頻率,并且u和v不同時為零。
其中全程的搜索策略是根據(jù)圖像清晰度評價函數(shù)來搜索最清晰的聚焦圖像。由于圖像清晰度評價函數(shù)可能會出現(xiàn)多峰的情況,所以如果采用傳統(tǒng)的搜索策略將可能收斂到局部峰值,而全程搜索策略可解決這一問題,其方法為首先采用較大的步長進行全程搜索,并記錄每一步搜索時的評價函數(shù)值,得到評價函數(shù)曲線的變化情況,然后通過步進電機將鏡頭移動到最大值的前一步長位置處,在最大值的前后位置進行小步長精確搜索,直至搜索到清晰的聚焦圖像為止。該搜索方法不僅適用于多峰的情況,同時對單峰的情況也同樣適用。
有益效果本發(fā)明的有益效果是,當(dāng)拍攝圖像時如果存在距離鏡頭不同的多個物體,那么僅將感興趣的物體鎖定在中間窗口,在中間窗口占據(jù)較大區(qū)域,將對其進行自動聚焦,得到感興趣物體的清晰圖像。同時采用中間窗口方法也有效地降低了計算復(fù)雜度,縮短了聚焦所需的時間。
本發(fā)明的另一個有益效果是,提供了計算加權(quán)DCT系數(shù)能量的兩種方法,更好的滿足了圖像清晰度評價函數(shù)的要求,使聚焦判斷更加準(zhǔn)確。
圖1是多個物體光學(xué)成像的原理圖。
圖2是本發(fā)明實現(xiàn)自動聚焦的控制流程示意圖。
其中有第一物體A、第二物體B、第一物體的像A’、第二物體的像B’、焦距f。
具體實施例方式
數(shù)碼相機中自適應(yīng)自動聚焦方法其步驟為a、用數(shù)碼相機采集原始的彩色圖像;b、根據(jù)原始圖像的分辨率大小,采用自適應(yīng)窗口的方法將原始圖像彩色中間區(qū)域作為子圖像剪切出來;c、將彩色的子圖像轉(zhuǎn)換為灰度圖象;d、對灰度子圖像進行二維DCT變換,獲得二維DCT系數(shù);e、對二維DCT系數(shù)按照其頻率的大小進行自適應(yīng)加權(quán),計算圖像清晰度評價函數(shù);f、根據(jù)圖像清晰度評價函數(shù),采用一種全程的搜索策略控制步進電機的移動,搜索出清晰的聚焦圖像。
其中自適應(yīng)窗口的方法的具體步驟為首先計算原始圖像的分辨率大小,根據(jù)原始圖像的分辨率將二維原始圖像的行和列分別進行三等分,然后分別取行和列的中間部分相交的區(qū)域作為感興趣的窗口,于是窗口的面積占整幅圖像面積的九分之一大小,最后將該窗口中的圖像作為子圖像從原始圖像中剪切出來。
設(shè)I(x,y)表示分辨率為M×N的子圖像在像素點(x,y)的灰度值,則子圖像的二維離散DCT變換定義為F(u,v)=C(u)C(v)Σm=0M-1Σn=0N-1I(x,y)cosπ(2m+1)u2Mcosπ(2n+1)v2N---(3)]]>其中C(u)和C(v)分別由下式定義C(u)=1Mu=02M1≤u≤M-1,C(v)=1Nv=02N1≤v≤N-1]]>F(u,v)稱為圖像I(x,y)的二維DCT系數(shù),然后去除二維DCT系數(shù)的直流系數(shù),剩余的其他系數(shù)則為交流系數(shù),在交流系數(shù)中,既有高頻成分同時也有低頻成分,而不同的頻率成分對圖像的清晰度影響不同,為此,提供了一種將不同的頻率成分賦予不同權(quán)重的方法,頻率越高的DCT系數(shù)所賦予的權(quán)重也就越大,即E1=Σu=0M-1Σv=0N-1[(u+v)F(u,v)2]---(4)]]>其中,頻率分量u和v不同時為零。從式(4)可以看出,當(dāng)頻率越高時,所賦予的高頻能量的權(quán)重也就越大,這更符合圖像清晰度評價函數(shù)的要求,考慮到式(4)采用的是平方能量,所需的運算量較高,為此,還提供了一種絕對值能量的方法E2=Σu=0M-1Σv=0N-1[(u+v)|F(u,v)|]---(5)]]>其中,頻率分量u和v不同時為零。從式(5)中可以看出,采用絕對值計算能量后,代替了平方運算,在保證清晰度評價函數(shù)性能的前提下,可降低運算量。
實現(xiàn)自動聚焦的主要步驟如附圖2所示,首先采集原始圖像,根據(jù)原始圖像分辨率的大小,將二維的原始圖像的行和列分別進行三等分,取行和列中間相交的部分,并將行和列相交部分的區(qū)域剪切出來作為中間窗口,后續(xù)操作將僅對中間窗口的子圖像進行處理。
如果圖像的分辨率較高,可以根據(jù)分辨率的大小對圖像進行適當(dāng)?shù)某闃?,在保證實現(xiàn)自動聚焦的前提下可以減少數(shù)據(jù)量,然后將彩色圖像轉(zhuǎn)換成灰度圖像,轉(zhuǎn)換公式如下I=13(R+G+B)---(6)]]>其中,R、G和B分別表示彩色圖像的紅色、綠色和藍(lán)色分量,I為轉(zhuǎn)換后的灰度圖像,每個灰度值由8bits表示。然后對灰度圖像進行二維DCT變換,得到二維DCT系數(shù)。
然后根據(jù)式(4)或(5),計算圖像清晰度評價函數(shù)值,由于圖像清晰度評價函數(shù)往往會出現(xiàn)多峰的情況,為此可采用一種全程的搜索策略方法。該搜索方法首先采用較大的步長全程搜索一遍,并記錄圖像清晰度評價函數(shù)曲線,然后將鏡頭移動到函數(shù)最大值的前一位置在最大值附近進行小步長搜索,直至搜索到圖像清晰度準(zhǔn)則函數(shù)極值點為止,這樣可以解決在多個峰值出現(xiàn)的情況下搜索最大值的問題。此時所對應(yīng)的圖像即為清晰的聚焦圖像。
權(quán)利要求
1.一種數(shù)碼相機中自適應(yīng)自動聚焦方法,其特征在于其步驟為a、用數(shù)碼相機采集原始的彩色圖像;b、根據(jù)原始圖像的分辨率大小,采用自適應(yīng)窗口的方法將原始圖像彩色中間區(qū)域作為子圖像剪切出來;c、將彩色的子圖像轉(zhuǎn)換為灰度圖象;d、對灰度子圖像進行二維DCT變換,獲得二維DCT系數(shù);e、對二維DCT系數(shù)按照其頻率的大小進行自適應(yīng)加權(quán),計算圖像清晰度評價函數(shù);f、根據(jù)圖像清晰度評價函數(shù),采用一種全程的搜索策略控制步進電機的移動,搜索出清晰的聚焦圖像。
2.根據(jù)權(quán)利要求1所述的數(shù)碼相機中自適應(yīng)自動聚焦方法,其特征在于其中自適應(yīng)窗口的方法的具體步驟為首先計算原始圖像的分辨率大小,根據(jù)原始圖像的分辨率將二維原始圖像的行和列分別進行三等分,然后分別取行和列的中間部分相交的區(qū)域作為感興趣的窗口,于是窗口的面積占整幅圖像面積的九分之一大小,最后將該窗口中的圖像作為子圖像從原始圖像中剪切出來。
3.根據(jù)權(quán)利要求1所述的數(shù)碼相機中自適應(yīng)自動聚焦方法,其特征在于其中光學(xué)自動聚焦中圖像清晰度評價函數(shù)中加權(quán)二維DCT系數(shù)方法,其步驟為1.)設(shè)I(x,y)表示分辨率為M×N的灰度圖像在像素點(x,y)的灰度值,則灰度圖像的二維離散DCT變換定義為F(u,v)=C(u)C(v)Σm=0M-1Σn=0N-1I(x,y)cosπ(2m+1)u2Mcosπ(2n+1)v2N]]>其中u和v分別表示頻域中的行頻率和列頻率,F(xiàn)(u,v)稱為圖像I(x,y)的二維DCT系數(shù),其中C(u)和C(v)分別由下式定義C(u)=1Mu=02M1≤u≤M-1,C(v)=1Nv=02N1≤v≤N-1]]>2.)去除二維DCT系數(shù)的直流系數(shù),剩余的其他系數(shù)則為交流系數(shù),按照二維DCT系數(shù)頻率的大小,對交流系數(shù)進行自適應(yīng)加權(quán)來計算圖像清晰度評價函數(shù),計算公式如下E1=Σu=0M-1Σv=0N-1[(u+v)F(u,v)2]]]>E2=Σu=0M-1Σv=0N-1[(u+v)|F(u,v)|]]]>其中,E1和E2分別表示圖像清晰度評價函數(shù)中的平方能量和絕對值能量,M和N分別表示二維DCT系數(shù)中的行數(shù)和列數(shù),u和v分別表示頻域中的行頻率和列頻率,并且u和v不同時為零。
全文摘要
數(shù)碼相機中自適應(yīng)自動聚焦方法是數(shù)碼相機的圖像處理的技術(shù),其處理步驟為a、用數(shù)碼相機采集原始的彩色圖像;b、根據(jù)原始圖像的分辨率大小,采用自適應(yīng)窗口的方法將原始圖像彩色中間區(qū)域作為子圖像剪切出來;c、將彩色的子圖像轉(zhuǎn)換為灰度圖象;d、對灰度子圖像進行二維DCT變換,獲得二維DCT系數(shù);e、對二維DCT系數(shù)按照其頻率的大小進行自適應(yīng)加權(quán),計算圖像清晰度評價函數(shù);f、根據(jù)圖像清晰度評價函數(shù),采用一種全程的搜索策略控制步進電機的移動,搜索出清晰的聚焦圖像。該方法定義了一個感興趣的窗口區(qū)域,該窗口的大小可以根據(jù)圖像的分辨率進行自適應(yīng)地調(diào)整,以適應(yīng)不同的拍攝要求。
文檔編號H04N5/232GK1877438SQ20061008832
公開日2006年12月13日 申請日期2006年7月10日 優(yōu)先權(quán)日2006年7月10日
發(fā)明者韓柯, 朱秀昌, 劉峰, 胡棟, 馮荃, 朱軼凡, 干宗良 申請人:南京郵電大學(xué)