專(zhuān)利名稱(chēng):用于視頻編碼運(yùn)動(dòng)估計(jì)的搜索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于視頻編碼運(yùn)動(dòng)估計(jì)的搜索方法,尤其涉及一種針對(duì)信源編碼 的需要,基于菱形和三角形自適應(yīng)的視頻編碼運(yùn)動(dòng)估計(jì)搜索方法,屬于數(shù)字圖像處理技術(shù) 領(lǐng)域。
背景技術(shù):
運(yùn)動(dòng)估計(jì)是從視頻序列中抽取運(yùn)動(dòng)信息的一整套技術(shù)。它是整個(gè)視頻編碼解決 方案中計(jì)算量最大的部分,通常在一個(gè)視頻壓縮運(yùn)算中運(yùn)動(dòng)估計(jì)約占總計(jì)算量的50% 60%。因此,運(yùn)動(dòng)估計(jì)性能的優(yōu)劣直接影響到整個(gè)視頻編碼解決方案的運(yùn)行效率和整個(gè)視 頻序列的重構(gòu)質(zhì)量,尋找簡(jiǎn)單、高效、快速的運(yùn)動(dòng)估計(jì)方法是至關(guān)重要的。在各種運(yùn)動(dòng)估計(jì)方法中,塊匹配方法具有簡(jiǎn)單、高效的優(yōu)點(diǎn),因此被很多國(guó)際視頻 編碼標(biāo)準(zhǔn)所采納,并得到廣泛的應(yīng)用?;趬K匹配的運(yùn)動(dòng)估計(jì)方法是減少時(shí)間冗余信息的 有效解決方案。另一方面,目前用于運(yùn)動(dòng)估計(jì)的搜索方法有很多種,其中全搜索運(yùn)動(dòng)估計(jì)方法 (Full Search method,簡(jiǎn)寫(xiě)為FS)的優(yōu)點(diǎn)是產(chǎn)生的殘差系數(shù)最小,但其巨大的時(shí)間開(kāi)銷(xiāo)和 計(jì)算量是實(shí)時(shí)視頻編碼解決方案所不能接受的。同時(shí),盡管FS能搜索到精度最高的運(yùn)動(dòng)矢 量,但其運(yùn)動(dòng)矢量場(chǎng)未必均勻,從而造成總體的編碼效率不一定最優(yōu)。為了減少FS方法的運(yùn)動(dòng)估計(jì)搜索復(fù)雜度,現(xiàn)在已經(jīng)出現(xiàn)了許多改進(jìn)的運(yùn)動(dòng)估計(jì) 方法,如 Jain 提出的二維對(duì)數(shù)搜索方法(TwoDimensional Logarithmic Search, TDLS), 跟蹤最小失真方向并降低了計(jì)算復(fù)雜度。另一種著名方法是三步搜索方法(Three Step Search, TSS),它在搜索窗內(nèi)只搜索25個(gè)點(diǎn),而FS要搜索225個(gè)點(diǎn)。后來(lái)有很多方法針對(duì) TSS做了進(jìn)一步的修改,例如新三步搜索方法(New ThreeStep Search, NTSS),該方法在第 一步進(jìn)行了中心偏置模式處理。另一種是有效的三步搜索方法(Efficient Three Step Search, ETSS),該方法在第一步應(yīng)用了小菱形模式,并且在搜索區(qū)域內(nèi)不限制搜索步驟。 Puri等人提出了混合TDLS和TSS的正交搜索方法(Orthogonalkarch,OS)。Ghanbari提 出的交叉搜索方法(Cross Search,CS)和TDLS十分相似。Po等人應(yīng)用了真實(shí)視頻序列的 中心偏置特性提出了四步搜索方法(Four-st印Search, 4SS). 2000年Zhu等人提出了菱 形搜索方法(Diamond karch,DQ,該方法以其卓越的搜索精度和搜索速度被廣泛應(yīng)用。DS搜索方法的一個(gè)實(shí)施示例如圖1所示。它有兩個(gè)不同的固定模式,一個(gè)是大菱 形搜索模式 LDSP (Large Diamond Search Pattern),另一個(gè)小菱形搜索模式 SDSP (Small Diamond Search Pattern) 0該搜索方法能夠十分精確地找到全局最小點(diǎn)。然而,DS搜索方 法的處理過(guò)程中一直使用固定的搜索模式,沒(méi)有考慮視頻序列的內(nèi)容特性和運(yùn)動(dòng)復(fù)雜度, 將會(huì)搜索一些沒(méi)有必要的點(diǎn),從而造成計(jì)算資源的浪費(fèi)。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明所要解決的技術(shù)問(wèn)題在于提供一種新的視頻編碼運(yùn)動(dòng)估計(jì)搜索方法。該搜索方法針對(duì)信源編碼的需要,基于菱形和三角形自適應(yīng)進(jìn)行視頻編 碼運(yùn)動(dòng)估計(jì)。為實(shí)現(xiàn)上述的發(fā)明目的,本發(fā)明采用下述的技術(shù)方案一種用于視頻編碼運(yùn)動(dòng)估計(jì)的搜索方法,其特征在于包括如下的步驟第1步如果初始搜索點(diǎn)0的絕對(duì)差值和小于預(yù)定閾值,則搜索結(jié)束,否則進(jìn)入菱 形搜索模式;先計(jì)算菱形的四個(gè)頂點(diǎn)A、B、C和D的絕對(duì)差值和;如果初始搜索點(diǎn)0的絕對(duì) 差值和最小,則搜索結(jié)束;如果絕對(duì)差值和最小的點(diǎn)為該菱形的頂點(diǎn)A,則進(jìn)入第2步;第2步比較B、C、D和0的絕對(duì)差值和;如B或D點(diǎn)的絕對(duì)差值和為最小值,則進(jìn) 入第6步;否則進(jìn)入第一三角形搜索模式,該第一三角形搜索模式是以第1步中的頂點(diǎn)A為 外心,以X、Y和Z為頂點(diǎn)的等腰三角形;分別計(jì)算Χ、Υ和Z的絕對(duì)差值和并與A的絕對(duì)差值 和比較,如A點(diǎn)的絕對(duì)差值和最小,則搜索結(jié)束;如X點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第3步; 如Y點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第4步;如Z點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第5步;第3步進(jìn)入第二三角形搜索模式,該第二三角形搜索模式是以頂點(diǎn)X為外心,以 Β、Υ’和V為頂點(diǎn)的等腰三角形;分別計(jì)算Y’、V的絕對(duì)差值和并與X的絕對(duì)差值和比較, 如X點(diǎn)的絕對(duì)差值和最小,則搜索結(jié)束;如Y’點(diǎn)的絕對(duì)差值和最小,則返回第3步;如Z’點(diǎn) 的絕對(duì)差值和最小,則進(jìn)入第4步;第4步進(jìn)入第三三角形搜索模式,該第三三角形搜索模式是以頂點(diǎn)Y為外心,以 X’、Y’和Z’為頂點(diǎn)的等腰三角形;分別計(jì)算X’、Y’、Z’的絕對(duì)差值和并與Y的絕對(duì)差值和 比較,如Y點(diǎn)的絕對(duì)差值和最小,則搜索結(jié)束;如Y’點(diǎn)的絕對(duì)差值和最小,則返回第4步;如 V點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第5步;如V點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第3步;第5步進(jìn)入第四三角形搜索模式,該第四三角形搜索模式是以頂點(diǎn)Z為外心,以 D、V和Y為頂點(diǎn)的等腰三角形;分別計(jì)算V、Y’的絕對(duì)差值和并與Z的絕對(duì)差值和比較, 如Z點(diǎn)的絕對(duì)差值和最小,則搜索結(jié)束;如Y’點(diǎn)的絕對(duì)差值和最小,則返回第5步;如X’點(diǎn) 的絕對(duì)差值和最小,則進(jìn)入第4步;第6步進(jìn)入第五三角形搜索模式,該第五三角形搜索模式是以A、X和Y為頂點(diǎn)的 等腰三角形;分別計(jì)算Χ、γ的絕對(duì)差值和并與A的絕對(duì)差值和比較,如A點(diǎn)的絕對(duì)差值和最 小,則搜索結(jié)束;如X或Y點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第7步;第7步進(jìn)入第六三角形搜索模式,在X點(diǎn)的絕對(duì)差值和最小的情況下,該第六三 角形搜索模式是以Χ、Α’和B’為頂點(diǎn)的等腰三角形;分別計(jì)算Α’、B’的絕對(duì)差值和并與X 的絕對(duì)差值和比較,如X點(diǎn)的絕對(duì)差值和最小,則搜索結(jié)束;否則重復(fù)第7步;在Y點(diǎn)的絕對(duì) 差值和最小的情況下依此類(lèi)推。其中,在第1步中,將當(dāng)前編碼塊左上角坐標(biāo)加上前一編碼塊的預(yù)測(cè)運(yùn)動(dòng)矢量在 參考幀中的坐標(biāo)位置定義為初始搜索點(diǎn)0。編碼塊的預(yù)測(cè)運(yùn)動(dòng)矢量為相鄰塊運(yùn)動(dòng)矢量的中 值,其中相鄰塊包括參考幀中的時(shí)域相鄰塊和當(dāng)前幀中所述編碼塊的三個(gè)空域相鄰塊。所述菱形搜索模式是以初始搜索點(diǎn)0為中心,步長(zhǎng)為1個(gè)像素點(diǎn)向左、右、上和下 擴(kuò)展形成的一個(gè)菱形。所述閾值用于檢測(cè)出靜止塊和準(zhǔn)靜止塊,對(duì)靜止塊和準(zhǔn)靜止塊直接中止搜索。本發(fā)明所提供的基于菱形和三角形自適應(yīng)的視頻編碼運(yùn)動(dòng)估計(jì)搜索方法可以自 適應(yīng)地選擇初始搜索點(diǎn)以避免陷于局部最小,在搜索過(guò)程中針對(duì)視頻序列的內(nèi)容特性和運(yùn)動(dòng)復(fù)雜度自適應(yīng)的選擇菱形模式和三角形模式進(jìn)行搜索,在保證圖像質(zhì)量的前提下極大的 提高了運(yùn)動(dòng)估計(jì)的搜索速度。
下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明。圖1為現(xiàn)有DS搜索方法的搜索示例圖;圖2為通過(guò)預(yù)測(cè)運(yùn)動(dòng)矢量確定初始搜索點(diǎn)的示意圖;圖 3(a) 圖 3(d)分另Ij 為 “Beijing Weather Girl,,、“WomanDrinking,,、 "Circus" and "Mobile Hands”視頻序列的預(yù)測(cè)運(yùn)動(dòng)矢量差分分布圖;圖4(a) 圖4(f)為本發(fā)明所提供的基于菱形和三角形自適應(yīng)的視頻編碼運(yùn)動(dòng)估 計(jì)搜索方法的搜索策略示意圖;圖5(a)為“Beijing Weather Girl”視頻序列的搜索點(diǎn)數(shù)比較曲線(xiàn)圖,圖5 (b)為 "Beijing Weather Girl”視頻序列的峰值信噪比的比較曲線(xiàn)圖;圖6 (a)為“Woman Drinking”視頻序列的搜索點(diǎn)數(shù)比較曲線(xiàn)圖,圖6 (b)為“Woman Drinking"視頻序列的峰值信噪比的比較曲線(xiàn)圖;圖7(a)為“Circus”視頻序列的搜索點(diǎn)數(shù)比較曲線(xiàn)圖,圖7(b)為“Circus,,視頻 序列的峰值信噪比的比較曲線(xiàn)圖;圖8(a)為“Mobile Hands”視頻序列的搜索點(diǎn)數(shù)比較曲線(xiàn)圖,08(b)為“Mobile Hands,,視頻序列的峰值信噪比的比較曲線(xiàn)圖。
具體實(shí)施例方式本專(zhuān)利申請(qǐng)?zhí)岢隽艘环N基于菱形和三角形自適應(yīng)的視頻編碼運(yùn)動(dòng)估計(jì)搜索(簡(jiǎn) 稱(chēng)為DTAS)方法。該DTAS方法的基本思路在于首先利用空域和時(shí)域相鄰塊的預(yù)測(cè)運(yùn)動(dòng)矢 量確定初始搜索點(diǎn),然后根據(jù)視頻序列運(yùn)動(dòng)矢量的方向選擇不同的搜索策略,對(duì)靜止塊和 準(zhǔn)靜止塊直接中止搜索,在搜索過(guò)程中針對(duì)視頻序列的內(nèi)容特性和運(yùn)動(dòng)復(fù)雜度自適應(yīng)地選 擇菱形模式和三角形模式,從而在保證搜索精度的同時(shí)有效地提高了搜索速度。參考圖2,首先通過(guò)預(yù)測(cè)運(yùn)動(dòng)矢量確定初始搜索點(diǎn)0。為了取得一個(gè)盡可能靠近全 局最小點(diǎn)的初始搜索點(diǎn),選擇合適的預(yù)測(cè)運(yùn)動(dòng)矢量顯得十分重要。為了獲得當(dāng)前塊精確的 預(yù)測(cè)運(yùn)動(dòng)矢量,需要考慮2個(gè)因素1)包含相鄰塊區(qū)域(R0Q的確定。2~)計(jì)算預(yù)測(cè)運(yùn)動(dòng)矢 量的方法。包含相鄰塊區(qū)域(ROS)定義如下R0S = {MB0,MB1,MB2,MB3},其中MBO表示參考 幀中時(shí)域相鄰塊,而其它3個(gè)塊MBi表示當(dāng)前幀中編碼塊的空域相鄰塊。如果相鄰塊的運(yùn) 動(dòng)矢量為MV0,MV1,MV2和MV3,那么編碼塊的預(yù)測(cè)運(yùn)動(dòng)矢量MVcmrent為相鄰塊運(yùn)動(dòng)矢量的中 值。定義如下MVcurrent = median(MV0,MVl, MV2, MV3)當(dāng)前編碼塊左上角坐標(biāo)加上前一編碼塊的預(yù)測(cè)運(yùn)動(dòng)矢量MV。umnt在參考幀中的坐 標(biāo)位置定義為初始搜索點(diǎn)0。自適應(yīng)運(yùn)動(dòng)估計(jì)的目的就是通過(guò)選擇合適的初始搜索點(diǎn)在搜索區(qū)域內(nèi)有效地適 應(yīng)移動(dòng)對(duì)象,這樣做的好處在于容易找到真正合適的運(yùn)動(dòng)矢量并減少計(jì)算量。在本DTAS方法中,采用絕對(duì)差值和(SAD)為塊匹配失真函數(shù)。SAD的定義為
權(quán)利要求
1.一種用于視頻編碼運(yùn)動(dòng)估計(jì)的搜索方法,其特征在于包括如下的步驟第1步如果初始搜索點(diǎn)(0)的絕對(duì)差值和小于預(yù)定閾值,則搜索結(jié)束,否則進(jìn)入菱形 搜索模式;先計(jì)算菱形的四個(gè)頂點(diǎn)(A)、(B)、(C)和(D)的絕對(duì)差值和;如果初始搜索點(diǎn)(0) 的絕對(duì)差值和最小,則搜索結(jié)束;如果絕對(duì)差值和最小的點(diǎn)為該菱形的頂點(diǎn)(A),則進(jìn)入第 2步。第2步比較(B)、(C)、(D)和(0)的絕對(duì)差值和;如(B)或(D)點(diǎn)的絕對(duì)差值和為最 小值,則進(jìn)入第6步;否則進(jìn)入第一三角形搜索模式,該第一三角形搜索模式是以第1步中 的頂點(diǎn)(A)為外心,以(X)、(Y)和(Z)為頂點(diǎn)的等腰三角形;分別計(jì)算(X)、(Y)和(Z)的 絕對(duì)差值和并與(A)的絕對(duì)差值和比較,如(A)點(diǎn)的絕對(duì)差值和最小,則搜索結(jié)束;如(X) 點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第3步;如⑴點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第4步;如(Z)點(diǎn) 的絕對(duì)差值和最小,則進(jìn)入第5步;第3步進(jìn)入第二三角形搜索模式,該第二三角形搜索模式是以頂點(diǎn)(X)為外心,以 (B)、(Y,)和(Z,)為頂點(diǎn)的等腰三角形;分別計(jì)算(Y,)、(Z,)的絕對(duì)差值和并與(X)的 絕對(duì)差值和比較,如⑴點(diǎn)的絕對(duì)差值和最小,則搜索結(jié)束;如(Y’)點(diǎn)的絕對(duì)差值和最小, 則返回第3步;如(Z’ )點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第4步;第4步進(jìn)入第三三角形搜索模式,該第三三角形搜索模式是以頂點(diǎn)(Y)為外心,以 (X,)、(Y,)和(Z,)為頂點(diǎn)的等腰三角形;分別計(jì)算(X,)、(Y,)、(Z,)的絕對(duì)差值和并與 ⑴的絕對(duì)差值和比較,如⑴點(diǎn)的絕對(duì)差值和最小,則搜索結(jié)束;如(Y’)點(diǎn)的絕對(duì)差值和 最小,則返回第4步;如(Z’ )點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第5步;如(X’ )點(diǎn)的絕對(duì)差值 和最小,則進(jìn)入第3步;第5步進(jìn)入第四三角形搜索模式,該第四三角形搜索模式是以頂點(diǎn)(Z)為外心,以 (D)、(X,)和(Y)為頂點(diǎn)的等腰三角形;分別計(jì)算(X,)、(Y,)的絕對(duì)差值和并與(Z)的絕 對(duì)差值和比較,如(Z)點(diǎn)的絕對(duì)差值和最小,則搜索結(jié)束;如(Y’)點(diǎn)的絕對(duì)差值和最小,則 返回第5步;如(X’ )點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第4步;第6步進(jìn)入第五三角形搜索模式,該第五三角形搜索模式是以(A)、(X)和(Y)為頂點(diǎn) 的等腰三角形;分別計(jì)算(X)、⑴的絕對(duì)差值和并與㈧的絕對(duì)差值和比較,如㈧點(diǎn)的絕 對(duì)差值和最小,則搜索結(jié)束;如(X)或(Y)點(diǎn)的絕對(duì)差值和最小,則進(jìn)入第7步;第7步進(jìn)入第六三角形搜索模式,在(X)點(diǎn)的絕對(duì)差值和最小的情況下,該第六三角 形搜索模式是以(X)、(A’ )和(B’ )為頂點(diǎn)的等腰三角形;分別計(jì)算(A’)、(B’)的絕對(duì)差 值和并與(X)的絕對(duì)差值和比較,如(X)點(diǎn)的絕對(duì)差值和最小,則搜索結(jié)束;否則重復(fù)第7 步;在(Y)點(diǎn)的絕對(duì)差值和最小的情況下依此類(lèi)推。
2.如權(quán)利要求1所述的用于視頻編碼運(yùn)動(dòng)估計(jì)的搜索方法,其特征在于在第1步中,將當(dāng)前編碼塊左上角坐標(biāo)加上前一編碼塊的預(yù)測(cè)運(yùn)動(dòng)矢量在參考幀中的 坐標(biāo)位置定義為初始搜索點(diǎn)(0)。
3.如權(quán)利要求2所述的用于視頻編碼運(yùn)動(dòng)估計(jì)的搜索方法,其特征在于編碼塊的預(yù)測(cè)運(yùn)動(dòng)矢量為相鄰塊運(yùn)動(dòng)矢量的中值,其中相鄰塊包括參考幀中的時(shí)域相 鄰塊和當(dāng)前幀中所述編碼塊的三個(gè)空域相鄰塊。
4.如權(quán)利要求1所述的用于視頻編碼運(yùn)動(dòng)估計(jì)的搜索方法,其特征在于在第1步中,所述菱形搜索模式是以初始搜索點(diǎn)(0)為中心,步長(zhǎng)為1個(gè)像素點(diǎn)向左、右、上和下擴(kuò)展形成的一個(gè)菱形。
5.如權(quán)利要求1所述的用于視頻編碼運(yùn)動(dòng)估計(jì)的搜索方法,其特征在于在第1步中,所述閾值用于檢測(cè)出靜止塊和準(zhǔn)靜止塊,對(duì)靜止塊和準(zhǔn)靜止塊直接中止 搜索。
6.如權(quán)利要求5所述的用于視頻編碼運(yùn)動(dòng)估計(jì)的搜索方法,其特征在于 所述閾值為512。
全文摘要
本發(fā)明公開(kāi)了一種用于視頻編碼運(yùn)動(dòng)估計(jì)的搜索方法。該搜索方法首先利用空域和時(shí)域相鄰塊的預(yù)測(cè)運(yùn)動(dòng)矢量確定初始搜索點(diǎn),然后根據(jù)視頻序列運(yùn)動(dòng)矢量的方向選擇不同的搜索策略,對(duì)靜止塊和準(zhǔn)靜止塊直接中止搜索,在搜索過(guò)程中針對(duì)視頻序列的內(nèi)容特性和運(yùn)動(dòng)復(fù)雜度自適應(yīng)地選擇菱形模式和三角形模式,從而在保證搜索精度的同時(shí)有效地提高了搜索速度。
文檔編號(hào)H04N7/26GK102075748SQ20101060925
公開(kāi)日2011年5月25日 申請(qǐng)日期2010年12月27日 優(yōu)先權(quán)日2010年12月27日
發(fā)明者于明, 劉林生, 張東, 歐陽(yáng)國(guó)勝, 羅永倫 申請(qǐng)人:北京自動(dòng)測(cè)試技術(shù)研究所