專(zhuān)利名稱(chēng):Rho-域量度的制作方法
RHO-域量度相關(guān)申請(qǐng)的交叉引用本申請(qǐng)涉及同時(shí)提交的題為“Video Classification Systems and Methods (視頻分類(lèi)系統(tǒng)和方法)”、“Video Analytics for Security Systems and Methods (用于安全系統(tǒng)和方法的視頻分析學(xué))”以及“Systems And Methods for Video ContentAnalysis (用于視頻內(nèi)容分析的系統(tǒng)和方法)”的專(zhuān)利申請(qǐng),這些文獻(xiàn)專(zhuān)門(mén)通過(guò)援引包含于此。附圖
簡(jiǎn)述圖I示出幀的一個(gè)示例,該示例表現(xiàn)出宏塊中非零系數(shù)(NZ)的存在。圖2是示出NZ(P)和量化參數(shù)的指數(shù)關(guān)系的例子的圖表。圖3是不出作為理論值和實(shí)際值之間的遞歸加權(quán)差的P _域偏移量度Θ的圖表。圖4是示出視頻產(chǎn)生系統(tǒng)的簡(jiǎn)化方框圖。圖5是示出視頻質(zhì)量量化參數(shù)之間的線(xiàn)性關(guān)系的圖表。圖6是根據(jù)本發(fā)明某些方面的模式判決算法視頻編碼的過(guò)程的流程圖。圖7是示出在本發(fā)明某些實(shí)施例中采用的處理系統(tǒng)的簡(jiǎn)化方框示意圖。發(fā)明的詳細(xì)描述現(xiàn)在參照附圖對(duì)本發(fā)明的實(shí)施例作詳細(xì)描述,這些附圖作為解說(shuō)性示例提供以使本領(lǐng)域內(nèi)技術(shù)人員能夠?qū)崿F(xiàn)本發(fā)明。顯然,下面的附圖和示例不旨在將本發(fā)明的范圍限制在單個(gè)實(shí)施例,而是可通過(guò)互換所述或所示要素的一些或全部而令其它實(shí)施例變得可能。只要是適宜的,在所有附圖中將使用相同的附圖標(biāo)記來(lái)表示相同或相似的部件。在這些實(shí)施例的某些要素可使用已知組件部分或全部實(shí)現(xiàn)的情形下,僅對(duì)這些已知組件中對(duì)理解本發(fā)明而言必要的那些部分進(jìn)行描述,并省去對(duì)這些已知組件的其它部分的詳細(xì)說(shuō)明以不至于使本發(fā)明晦澀難懂。在本說(shuō)明書(shū)中,示出單一組件的實(shí)施例不應(yīng)當(dāng)視為限制;相反,本發(fā)明旨在涵蓋包含多個(gè)同一組件的其它實(shí)施例,反之亦然,除非在本文中明確聲明其它情形。此外,申請(qǐng)人不打算使說(shuō)明書(shū)或權(quán)利要求書(shū)中的任一術(shù)語(yǔ)歸結(jié)于一個(gè)不常見(jiàn)或特殊的含 義,除非明確如此闡述。此外,本發(fā)明涵蓋本文中通過(guò)解說(shuō)引述的部件的所有目前和將來(lái)知道的等效物。本發(fā)明的某些實(shí)施例提供一種創(chuàng)新的P-域量度Θ以及應(yīng)用該量度的系統(tǒng)和方法。在一些實(shí)施例中,P-域中的P的定義可以認(rèn)為是在視頻編碼過(guò)程中轉(zhuǎn)換和量化之后的非零系數(shù)的數(shù)目。另外,在這里使用術(shù)語(yǔ)“NZ”來(lái)表征P,其中NZ可理解為表示在例如H. 264視頻標(biāo)準(zhǔn)等視頻標(biāo)準(zhǔn)下量化每個(gè)16 X 16像素宏塊(MB)之后的非零系數(shù)的數(shù)目。描述NZ計(jì)算的一個(gè)示例示出于圖I中。已通過(guò)理論和實(shí)驗(yàn)證實(shí)P與視頻文本編碼位速率具有線(xiàn)性關(guān)系??偟貋?lái)說(shuō),所提出的P-域源模型和模型將位速率R看作P的函數(shù),P是經(jīng)量化的系數(shù)中O所占的百分比。可以理解,P隨著量化步長(zhǎng)QP而單調(diào)遞增,這意味著在兩者之間存在一一映射關(guān)系。因此,某些實(shí)施例提供基于這些特性的幀級(jí)速率控制算法。一些實(shí)施例可利用能改善對(duì)R-P函數(shù)準(zhǔn)確估算的多種適合算法中的任何一種??赏ㄟ^(guò)指數(shù)方程對(duì)NZ(P)和QP的關(guān)系進(jìn)行建模,如圖2所示。虛線(xiàn)22表征來(lái)自編碼的實(shí)際幀級(jí)NZ相對(duì)于QP點(diǎn)的關(guān)系,而實(shí)線(xiàn)23表征指數(shù)函數(shù)模型化。可從該指數(shù)模型中獲得NZ相對(duì)于QP的關(guān)系表。在某些實(shí)施例中,P -域偏移量度Θ可定義為理論NZ_QP曲線(xiàn)和實(shí)際NZ_QP曲線(xiàn)之間的遞歸加權(quán)比,如圖3中所示。一曲線(xiàn)33代表理論NZ_QP曲線(xiàn)而第二曲線(xiàn)32代表在編碼過(guò)程中測(cè)得的實(shí)際的NZ相對(duì)于QP的曲線(xiàn)。曲線(xiàn)32、33之間的一種差異可表示為偏移量度Θ,偏移Θ是視頻編碼中的一個(gè)重要量度,并被用來(lái)確定序列的運(yùn)動(dòng)復(fù)雜度,從而確定經(jīng)編碼的視頻質(zhì)量、確定短場(chǎng)景剪切和確定用于最好地滿(mǎn)足預(yù)定義位速率預(yù)算的實(shí)際QP。利用P-域偏移量度Θ的視頻產(chǎn)生系統(tǒng)及其應(yīng)用的一個(gè)示例中的諸要素的相互配合和相互作用示出于圖4中。所采用的硬件和軟件的結(jié)合一般是根據(jù)場(chǎng)合需要而確定的,且只是為了便于描述而給出圖4中描繪的配置。視頻編碼器400 —般就每個(gè)MB和/或每個(gè)幀產(chǎn)生多個(gè)非零系數(shù)(NZ),作為其視頻編碼過(guò)程的副產(chǎn)物。處理NZ信息,并將P-域偏移量度Θ計(jì)算作為元數(shù)據(jù)402,以饋送給各種感興趣的算法。偏移Θ的優(yōu)勢(shì)在某些實(shí)施例中,多個(gè)特征可與P域偏移量度Θ關(guān)聯(lián),并能從這些特征中得到某些優(yōu)勢(shì)。此外,可優(yōu)化硬件、軟件和各算法以使所得到的優(yōu)勢(shì)最大化。在某些實(shí)施例中,可使用Θ對(duì)視頻運(yùn)動(dòng)復(fù)雜度進(jìn)行分類(lèi)。一種模式判決系統(tǒng)404可利用P-域量度Θ來(lái)獲得優(yōu)化的判決過(guò)程??蓪⑵痞ǘx為理論NZ_QP曲線(xiàn)與從編碼過(guò)程獲得的實(shí)際曲線(xiàn)的加權(quán)差。經(jīng)歸一化的Θ在值I. O周?chē)▌?dòng)。小于I的θ值表不實(shí)際編碼的位速率大于預(yù)期的位速率,這暗示著已遇到更復(fù)雜的運(yùn)動(dòng)背景內(nèi)容。大于I. O的Θ值表示較少的NZ被編碼,這暗示著已遇到較平滑的運(yùn)動(dòng)內(nèi)容。在一些實(shí)施例中,可使用Θ來(lái)計(jì)算經(jīng)編碼的視頻質(zhì)量曲線(xiàn)Lq。經(jīng)編碼的視頻質(zhì)量Q與在例如圖4所示的編碼過(guò)程中使用的量化參數(shù)QP具有線(xiàn)性關(guān)系。線(xiàn)性模型Q_QP可從實(shí)驗(yàn)數(shù)據(jù)獲得。Q_QP線(xiàn)性模型可基于偏移Θ來(lái)調(diào)整S卩,質(zhì)量和QP關(guān)系是擬編碼的視頻內(nèi)容的運(yùn)動(dòng)復(fù)雜度的函數(shù)。經(jīng)調(diào)整的0_0 模型可充當(dāng)視頻內(nèi)容的目標(biāo)質(zhì)量曲線(xiàn)。如果設(shè)定了目標(biāo)質(zhì)量,則實(shí)際QP是偏移Θ的函數(shù),并能得到QP和Θ的關(guān)系表。目標(biāo)質(zhì)量視頻編碼算法可使用簡(jiǎn)單的查表操作來(lái)實(shí)現(xiàn)。在某些實(shí)施例中,可使用Θ來(lái)確定視頻場(chǎng)景的變化。從實(shí)驗(yàn)可以看出,非零系數(shù)(NZ)的數(shù)目在場(chǎng)景變化P-幀中增加了多倍,這是因?yàn)樵趫?chǎng)景變化幀及其基準(zhǔn)幀之間缺乏臨時(shí)關(guān)聯(lián)。因此,某些實(shí)施例利用偏移Θ以良好的強(qiáng)健度和非常低的計(jì)算復(fù)雜度來(lái)確定場(chǎng)
景變化。某些實(shí)施例將Θ和NZ_QP曲線(xiàn)結(jié)合以獲得更準(zhǔn)確的位速率??烧{(diào)整NZ_QP曲線(xiàn)以反映對(duì)于給定視頻序列的更準(zhǔn)確的編碼位速率。因此,可在偏移量度Θ的輔助下達(dá)到更準(zhǔn)確的速率控制編碼。示例恒定位速率(CBR)控制某些實(shí)施例基于涉及視頻場(chǎng)景變化的前述偏移Θ特征并整合Θ和NZ_QP曲線(xiàn),使用高效且準(zhǔn)確的恒定位速率控制方法和算法406。為了闡述的目的,將一組圖象(GOP)定義為從內(nèi)部編碼的幀(“I-幀”)開(kāi)始并隨后是多個(gè)內(nèi)部預(yù)測(cè)幀(“P/B-幀”)的一組圖象??筛鶕?jù)每個(gè)GOP的目標(biāo)位速率,將目標(biāo)位預(yù)算賦予每個(gè)I幀或P/B幀?;谶f歸加權(quán)偏移Θ的經(jīng)調(diào)整的NZ-QP表可反映基于更準(zhǔn)確內(nèi)容的NZ-QP關(guān)系??蓪?duì)擬編碼的當(dāng)前幀適應(yīng)性、地估算預(yù)測(cè)的NZ值,并可從NZ_QP曲線(xiàn)計(jì)算出量化參數(shù)QP以控制當(dāng)前幀的位速率。如果偏移Θ突然改變至閾值之上,則可指出場(chǎng)景變化的檢測(cè)結(jié)果,并可重置速率控制算法。通過(guò)利用偏移Θ,可設(shè)計(jì)和實(shí)現(xiàn)成本有效且強(qiáng)健的CBR算法。示例質(zhì)量約束的可變位速率(VBR)控制在CBR狀況涉及視頻運(yùn)動(dòng)和不定復(fù)雜度的某些實(shí)施例中,每個(gè)幀可被賦予相同位速率并以該位速率編碼,這導(dǎo)致視頻質(zhì)量的臨時(shí)差異。人類(lèi)視覺(jué)系統(tǒng)理論建議人類(lèi)的視覺(jué)對(duì)運(yùn)動(dòng)變化(時(shí)間方向)和紋理復(fù)雜度(空間視頻內(nèi)容)敏感。因此,可通過(guò)將更多的位分配給處于時(shí)間和空間變化的視頻幀,并通過(guò)將較少的位分配給平滑的運(yùn)動(dòng)和文本簡(jiǎn)單的視頻幀同時(shí)利用量度Θ仍然維持一目標(biāo)最低視頻質(zhì)量(質(zhì)量約束),來(lái)提供一質(zhì)量約束的可變位速率算法408。如前所述,可使用對(duì)視頻運(yùn)動(dòng)復(fù)雜度作出分類(lèi)的算法和方法來(lái)對(duì)運(yùn)動(dòng)/文本變化的幀作出分類(lèi)。如前面進(jìn)一步描述的,可使用9_(^表以及QP和Θ的關(guān)系表用預(yù)定義的最低質(zhì)量約束平滑的幀和紋理簡(jiǎn)單的幀??墒褂糜嘘P(guān)視頻場(chǎng)景變化的前述的偏移Θ特征并整合Θ和NZ_QP曲線(xiàn)來(lái)將經(jīng)編碼的位控制至目標(biāo)位速率。 示例網(wǎng)絡(luò)適應(yīng)性可變幀速率控制當(dāng)回放通過(guò)網(wǎng)絡(luò)傳輸?shù)囊曨l流時(shí),網(wǎng)絡(luò)波動(dòng)會(huì)嚴(yán)重地影響用戶(hù)的感受質(zhì)量(QOP)。為了適應(yīng)網(wǎng)絡(luò)波動(dòng),可在rho-域量度Θ的輔助下設(shè)計(jì)網(wǎng)絡(luò)適應(yīng)性可變幀速率算法410??刹捎媚承┣笆龅南到y(tǒng)和方法來(lái)獲得適當(dāng)?shù)目勺儙俾?VFR)算法,如圖6所示。在步驟600,網(wǎng)絡(luò)提供反饋,該反饋包括用戶(hù)定義的最低視頻質(zhì)量、視頻信道優(yōu)先級(jí)以及網(wǎng)絡(luò)帶寬可用性。在步驟602,基于偏移Θ及其對(duì)應(yīng)的速率控制實(shí)現(xiàn)來(lái)計(jì)算量化參數(shù)QP。在步驟604并基于偏移Θ,可因此相應(yīng)地對(duì)視頻運(yùn)動(dòng)復(fù)雜度作分類(lèi),并可計(jì)算相對(duì)于最低質(zhì)量需求的新的量化參數(shù)QP_1。在步驟606,計(jì)算QP和QP_1之間的量化參數(shù)差Diff_QP?;贒iff_QP和預(yù)先計(jì)算出的Diff_QP相對(duì)于幀速率的關(guān)系表,可獲得擬編碼的新幀速率。在某些實(shí)施例中,高優(yōu)先級(jí)信道的幀速率盡可能地維持不變。如果遇到較大的Diff_QP,可推薦和/或執(zhí)行編碼圖象分辨率的規(guī)模下調(diào)(downsizing)(例如從 Dl 至 CIF)。系統(tǒng)描述現(xiàn)在轉(zhuǎn)向圖7,本發(fā)明的某些實(shí)施例利用一處理系統(tǒng),該處理系統(tǒng)包括被部署成執(zhí)行前述某些步驟的至少一個(gè)計(jì)算系統(tǒng)70。計(jì)算系統(tǒng)70可以是市面上可購(gòu)得的系統(tǒng),該系統(tǒng)執(zhí)行例如Microsoft Windows , UNIX或其變體、Linux、實(shí)時(shí)操作系統(tǒng)和/或私人操作系統(tǒng)等市面上可購(gòu)得的操作系統(tǒng)。可調(diào)整、配置和/或設(shè)計(jì)計(jì)算系統(tǒng)的架構(gòu),以將其整合入處理系統(tǒng)中、嵌入到圖象捕獲系統(tǒng)、通信設(shè)備和/或圖形處理系統(tǒng)中的一個(gè)或多個(gè)中。在一個(gè)示例中,計(jì)算系統(tǒng)70包括總線(xiàn)702和/或用來(lái)在處理器之間通信的其他機(jī)制,不管這些處理器是與計(jì)算系統(tǒng)70集成的處理器(例如704、705)還是位于不同的、可能是物理上分離的計(jì)算系統(tǒng)700中的處理器。一般來(lái)說(shuō),處理器704和/或705包括CISC或RISC計(jì)算處理器和/或一個(gè)或多個(gè)數(shù)字信號(hào)處理器。在一些實(shí)施例中,處理器704和/或705可實(shí)現(xiàn)在定制設(shè)備中和/或作為可配置的定序器來(lái)執(zhí)行。設(shè)備驅(qū)動(dòng)器703可提供輸出信號(hào),該輸出信號(hào)用來(lái)控制內(nèi)部和外部組件并在處理器704、705之間通信。計(jì)算系統(tǒng)70 —般還包括存儲(chǔ)器706,該存儲(chǔ)器706可包括隨機(jī)存取存儲(chǔ)器(RAM)、靜態(tài)存儲(chǔ)器、高速緩沖存儲(chǔ)器、閃存和任何其他合適類(lèi)型的能耦合至總線(xiàn)702的存儲(chǔ)設(shè)備中的一種或多種。存儲(chǔ)器706可用來(lái)存儲(chǔ)指令和數(shù)據(jù),該指令和數(shù)據(jù)能使一個(gè)或多個(gè)處理器704、705執(zhí)行所需的過(guò)程。主存儲(chǔ)器706可用于存儲(chǔ)瞬時(shí)數(shù)據(jù)和/或臨時(shí)數(shù)據(jù),例如在由處理器704或705執(zhí)行指令期間產(chǎn)生和/或使用的變量和中間信息。計(jì)算系統(tǒng)70 —般還包括非易失性存儲(chǔ)設(shè)備,例如只讀存儲(chǔ)器(ROM) 708、閃存、存儲(chǔ)卡或類(lèi)似物;非易失性存儲(chǔ)設(shè)備可連接至總線(xiàn)702,但也可等同地使用耦合至總線(xiàn)702的高速通用串行總線(xiàn)(USB)、防火墻或其它這類(lèi)總線(xiàn)進(jìn)行連接。非易失性存儲(chǔ)設(shè)備可用于存儲(chǔ)配置、以及其它信息,所述其它信息包括由處理器704和/或705執(zhí)行的指令。非易失性存儲(chǔ)設(shè)備也可包括海量存儲(chǔ)設(shè)備710,例如磁盤(pán)、光盤(pán)、閃存盤(pán),該海量存儲(chǔ)設(shè)備710可直接或間接地耦合至總線(xiàn)702,并用來(lái)存儲(chǔ)擬由處理器704和/或705執(zhí)行的指令,以及其它信息。在一些實(shí)施例中,計(jì)算系統(tǒng)70可按通信方式耦合至例如IXD平板顯示器等顯示系統(tǒng)712,包括觸摸屏顯示器、場(chǎng)致發(fā)光顯示器、等離子體顯示器、陰極射線(xiàn)管,或能夠被配置和適配成接收信息并將信息顯示給計(jì)算系統(tǒng)70使用者的其它顯示設(shè)備。一般來(lái)說(shuō),設(shè)備驅(qū)動(dòng)器703可包括顯示驅(qū)動(dòng)器、圖形適配器,和/或維持顯示的數(shù)字表示并將該數(shù)字表示轉(zhuǎn)換成用于驅(qū)動(dòng)顯示系統(tǒng)712的信號(hào)的其它模塊。顯示系統(tǒng)712也可包括從由系統(tǒng)700提供的信號(hào)中生成顯示的邏輯或軟件。在這一點(diǎn)上,顯示器712可作為遠(yuǎn)程終端來(lái)提供,或在會(huì)議 期間在一不同的計(jì)算系統(tǒng)70上提供。輸入設(shè)備714 —般在本地提供或通過(guò)遠(yuǎn)程系統(tǒng)提供,且一般提供字母數(shù)字輸入以及光標(biāo)控制716輸入(例如鼠標(biāo)、跟蹤球等)。應(yīng)當(dāng)理解,可將輸入和輸出提供給例如PDA、薄箋式電腦等無(wú)線(xiàn)設(shè)備,或經(jīng)適當(dāng)配置用以顯示圖像并提供用戶(hù)輸入的其它系統(tǒng)。根據(jù)本發(fā)明的一個(gè)實(shí)施例,所描述的本發(fā)明的一些部分可通過(guò)計(jì)算系統(tǒng)70來(lái)實(shí)現(xiàn)。處理器704執(zhí)行一個(gè)或多個(gè)指令序列。例如,在已經(jīng)從例如存儲(chǔ)設(shè)備710等計(jì)算機(jī)可讀介質(zhì)接收到指令之后,這些指令可存儲(chǔ)在主存儲(chǔ)器706內(nèi)。執(zhí)行主存儲(chǔ)器706中包含的指令序列使處理器704根據(jù)本發(fā)明的某些方面執(zhí)行過(guò)程步驟。在某些實(shí)施例中,可由執(zhí)行專(zhuān)項(xiàng)功能的嵌入式計(jì)算系統(tǒng)來(lái)提供功能,其中嵌入式系統(tǒng)采用硬件和軟件的定制組合來(lái)執(zhí)行一組預(yù)定義的任務(wù)。因此,本發(fā)明的實(shí)施例不限于硬件電路和軟件的任何特定的組合。術(shù)語(yǔ)“計(jì)算機(jī)可讀介質(zhì)”用來(lái)定義能夠存儲(chǔ)指令和其它數(shù)據(jù)并將其提供至處理器704和/或705的任何介質(zhì),尤其在所述指令將由處理器704和/或705執(zhí)行,和/或由處理系統(tǒng)的其它外圍設(shè)備執(zhí)行的情形下。這種介質(zhì)可包括非易失性存儲(chǔ)設(shè)備、易失性存儲(chǔ)設(shè)備以及傳輸媒體。非易失性存儲(chǔ)設(shè)備可體現(xiàn)為例如光盤(pán)或磁盤(pán)(包括DVD、CD-ROM和藍(lán)光盤(pán))之類(lèi)的媒體。存儲(chǔ)設(shè)備可在本地提供并實(shí)體靠近處理器704、705,或者一般通過(guò)使用網(wǎng)絡(luò)連接來(lái)遠(yuǎn)程地提供。非易失性存儲(chǔ)設(shè)備可從計(jì)算系統(tǒng)704中移去,如同那些使用包括USB等標(biāo)準(zhǔn)接口而能方便地連接于計(jì)算機(jī)或從計(jì)算機(jī)斷開(kāi)的藍(lán)光、DVD或⑶存儲(chǔ)器或記憶卡或者記憶棒那樣。因此,計(jì)算機(jī)可讀媒體可包括軟盤(pán)、柔性盤(pán)、硬盤(pán)、磁帶、任何其它磁性介質(zhì)、CD-ROM、DVD、藍(lán)光、任何其它光學(xué)介質(zhì)、穿孔卡片、紙帶、具有孔圖案的任何其它物理介質(zhì)、RAM、PROM、EPROM、FLASH/EEPR0M、任何其它存儲(chǔ)器芯片或磁帶盒,或者計(jì)算機(jī)可從中讀取內(nèi)容的任意其它介質(zhì)。傳輸媒體可用來(lái)連接處理系統(tǒng)的部件和/或計(jì)算系統(tǒng)70的組件。該媒體可包括雙絞線(xiàn)、同軸電纜、銅線(xiàn)和光纖。傳輸媒體也可包括無(wú)線(xiàn)媒體,例如無(wú)線(xiàn)電波、聲波和光波。在特定的無(wú)線(xiàn)電頻率(RF)下,可使用光纖和紅外(IR)數(shù)據(jù)通信。各種形式的計(jì)算機(jī)可讀媒體可參與提供指令和數(shù)據(jù)以供處理器704和/或705執(zhí)行。例如,最初可從遠(yuǎn)端計(jì)算機(jī)的磁盤(pán)中撿取指令,并通過(guò)網(wǎng)絡(luò)或調(diào)制解調(diào)器將指令傳輸至計(jì)算系統(tǒng)70。指令可選擇地在執(zhí)行前或執(zhí)行期間存儲(chǔ)在不同的存儲(chǔ)設(shè)備中或存儲(chǔ)在存儲(chǔ)設(shè)備的不同部分中。計(jì)算系統(tǒng)70可包括通信接口 718,該通信接口 718提供在網(wǎng)絡(luò)720上的雙向數(shù)據(jù)通信,網(wǎng)絡(luò)720可包括局域網(wǎng)722、廣域網(wǎng)或兩者的某些組合。例如,綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)可結(jié)合局域網(wǎng)(LAN)予以使用。在另一示例中,LAN可包括無(wú)線(xiàn)鏈路。網(wǎng)絡(luò)鏈路720 —般提供通過(guò)一個(gè)或多個(gè)網(wǎng)絡(luò)至其它數(shù)據(jù)設(shè)備的數(shù)據(jù)通信。例如,網(wǎng)絡(luò)鏈路720可提供通過(guò)局域網(wǎng)722至主計(jì)算機(jī)724或至例如互聯(lián)網(wǎng)728等廣域網(wǎng)的連接。局域網(wǎng)722和互聯(lián)網(wǎng)728兩者均可使用攜帶數(shù)字?jǐn)?shù)據(jù)流的電信號(hào)、電磁信號(hào)或光信號(hào)。計(jì)算系統(tǒng)70可使用一個(gè)或多個(gè)網(wǎng)絡(luò)來(lái)發(fā)送消息和數(shù)據(jù),包括程序碼和其它信息。在互聯(lián)網(wǎng)的示例中,服務(wù)器730可通過(guò)互聯(lián)網(wǎng)728發(fā)送對(duì)一應(yīng)用程序的請(qǐng)求碼,并可作為響應(yīng)接收一下載的應(yīng)用,該下載的應(yīng)用提供或增添如前面示例中描述的那些功能性模塊。接收的碼可由處理器704和/或705執(zhí)行。 本發(fā)明某些方面的附加說(shuō)明本發(fā)明的前述說(shuō)明是解說(shuō)性而非限定性的。例如,本領(lǐng)域內(nèi)技術(shù)人員應(yīng)當(dāng)理解,本發(fā)明可通過(guò)前述功能和能力的各種組合來(lái)實(shí)現(xiàn),并可包括比前述更少或更多的部件。下面闡述本發(fā)明的某些附加方面和特征,并且這些附加方面和特征可使用前面更詳細(xì)描述的功能和部件來(lái)獲得,如本領(lǐng)域內(nèi)技術(shù)人員在受到本公開(kāi)教示后所能理解的那樣。本發(fā)明的某些實(shí)施例提供視頻編碼器、系統(tǒng)和方法,用于表征視頻變化過(guò)程。一些這樣的實(shí)施例包括維持信息,其中所述信息將從宏塊的量化中預(yù)期得到的多個(gè)非零系數(shù)與視頻編碼過(guò)程中使用的一個(gè)或多個(gè)量化參數(shù)相關(guān)聯(lián)。一些這樣的實(shí)施例包括在宏塊的視頻編碼期間產(chǎn)生實(shí)際的非零系數(shù)。一些這樣的實(shí)施例包括計(jì)算偏移量度,該偏移量度表示實(shí)際的非零系數(shù)和預(yù)期的非零系數(shù)之間的加權(quán)差。一些這樣的實(shí)施例包括使用偏移量度來(lái)調(diào)整視頻編碼過(guò)程。在一些這樣的實(shí)施例中,視頻編碼過(guò)程被調(diào)整,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。在一些這樣的實(shí)施例中,使用偏移量度調(diào)整視頻編碼過(guò)程包括基于偏移量度的歸一化值來(lái)調(diào)整量化參數(shù)。在一些這樣的實(shí)施例中,視頻編碼質(zhì)量和量化參數(shù)之間的關(guān)系是擬編碼的視頻幀序列的運(yùn)動(dòng)復(fù)雜度的函數(shù)。在一些這樣的實(shí)施例中,歸一化偏移量度值在值I. O周?chē)儎?dòng)。在一些這樣的實(shí)施例中,大于I. O的歸一化偏移量度值指示大于預(yù)期的編碼位速率。在一些這樣的實(shí)施例中,歸一化偏移量度值的增加指示運(yùn)動(dòng)背景內(nèi)容的復(fù)雜度的增加。在一些這樣的實(shí)施例中,量化參數(shù)是偏移量度的函數(shù)。在一些這樣的實(shí)施例中,使用偏移量度來(lái)調(diào)整視頻編碼過(guò)程包括使用偏移量度來(lái)選擇量化參數(shù)以對(duì)一表格作出索引。一些這樣的實(shí)施例包括使用偏移量度選擇編碼模式的步驟。在一些這樣的實(shí)施例中,選擇編碼模式以為幀編碼維持恒定位速率。一些這樣的實(shí)施例包括基于幀序列之間的時(shí)間和空間變化,將多個(gè)位分配給多個(gè)幀的步驟。在一些這樣的實(shí)施例中,位被分配以維持目標(biāo)最低視頻質(zhì)量。本發(fā)明的某些實(shí)施例提供視頻編碼器和相關(guān)的方法。一些這樣的實(shí)施例包括存儲(chǔ)設(shè)備,該存儲(chǔ)設(shè)備配置成維持信息,其中所述信息將從宏塊的量化中預(yù)期得到的多個(gè)非零系數(shù)與視頻編碼過(guò)程中所用的一個(gè)或多個(gè)量化參數(shù)相關(guān)聯(lián)。一些這樣的實(shí)施例包括編碼器,該編碼器配置成接收視頻幀序列并對(duì)這些視頻幀內(nèi)的宏塊進(jìn)行編碼。在一些這樣的實(shí)施例中,編碼器在宏塊的視頻編碼期間產(chǎn)生實(shí)際的非零系數(shù)。一些這樣的實(shí)施例包括受編碼器控制的量化參數(shù)的表。在一些這樣的實(shí)施例中,編碼器使用偏移量度來(lái)選擇當(dāng)前宏塊的量化參數(shù),其中所述偏移量度表示實(shí)際的非零系數(shù)和預(yù)期的非零系數(shù)之間的加權(quán)差。在一些這樣的實(shí)施例中,視頻編碼過(guò)程被調(diào)整,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。在一些這樣的實(shí)施例中,量化參數(shù)是使用偏移量度的歸一化值選擇的。在一些這樣的實(shí)施例中,選擇量化參數(shù)以達(dá)到目標(biāo)視頻編碼質(zhì)量。在一些這樣的實(shí)施例中,視頻編碼質(zhì)量和量化參數(shù)是通過(guò)視頻幀序列的運(yùn)動(dòng)復(fù)雜度的函數(shù)關(guān)聯(lián)的。在一些這樣的實(shí)施例中,該方法是由視頻編碼器中被配置成執(zhí)行一個(gè)或多個(gè)計(jì)算機(jī)程序模塊的處理器實(shí)現(xiàn)的。盡管已參照特定示例性實(shí)施例對(duì)本發(fā)明進(jìn)行了描述,然而本領(lǐng)域內(nèi)普通技術(shù)人員 顯然知道,可對(duì)這些實(shí)施例作出各種修改和變化而不脫離本發(fā)明較寬的精神和范圍。因此,說(shuō)明書(shū)和附圖被認(rèn)為是解說(shuō)性而非限制性意義。
權(quán)利要求
1.一種用于表征視頻編碼過(guò)程的方法,包括下列步驟 維持信息,其中所述信息將從宏塊的量化中預(yù)期得到的多個(gè)非零系數(shù)與視頻編碼過(guò)程中使用的一個(gè)或多個(gè)量化參數(shù)相關(guān)聯(lián); 在所述宏塊的視頻編碼期間,產(chǎn)生實(shí)際的非零系數(shù); 計(jì)算偏移量度,其中所述偏移量度表示所述實(shí)際的非零系數(shù)和所述預(yù)期的非零系數(shù)之間的加權(quán)差; 使用所述偏移量度調(diào)整所述視頻編碼過(guò)程,其中所述視頻編碼過(guò)程被調(diào)整,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。
2.如權(quán)利要求I所述的方法,其特征在于,使用偏移量度調(diào)整視頻編碼過(guò)程的所述步驟包括基于所述偏移量度的歸一化值調(diào)整所述量化參數(shù)。
3.如權(quán)利要求2所述的方法,其特征在于,視頻編碼質(zhì)量和量化參數(shù)之間的關(guān)系是擬編碼的視頻幀序列的運(yùn)動(dòng)復(fù)雜度的函數(shù)。
4.如權(quán)利要求2或3所述的方法,其特征在于,所述歸一化偏移量度值在值I.O周?chē)儎?dòng),其中大于I. O的歸一化偏差量度值指示大于預(yù)期的編碼位速率。
5.如權(quán)利要求2或3所述的方法,其特征在于,所述歸一化偏移量度值的增加指示運(yùn)動(dòng)背景內(nèi)容的復(fù)雜度的增加。
6.如權(quán)利要求2-5中任何一項(xiàng)所述的方法,其特征在于,所述量化參數(shù)是所述偏移量度的函數(shù)。
7.如權(quán)利要求2-6中任何一項(xiàng)所述的方法,其特征在于,使用偏移量度來(lái)調(diào)整視頻編碼過(guò)程的所述步驟包括使用偏移量度來(lái)選擇量化參數(shù)以對(duì)表格作出索引。
8.如權(quán)利要求1-7中任何一項(xiàng)所述的方法,其特征在于,還包括使用所述偏移量度來(lái)選擇編碼模式的步驟,其中選擇所述編碼模式以為幀編碼維持恒定位速率。
9.如權(quán)利要求1-7中任何一項(xiàng)所述的方法,其特征在于,還包括基于幀序列之間的時(shí)間和空間變化將多個(gè)位分配給多個(gè)幀的步驟,其中分配所述多個(gè)位以維持目標(biāo)最低視頻質(zhì)量。
10.一種視頻編碼器,包括 存儲(chǔ)設(shè)備,所述存儲(chǔ)設(shè)備配置成維持信息,其中所述信息將從宏塊的量化中預(yù)期得到的多個(gè)非零系數(shù)與視頻編碼過(guò)程中使用的一個(gè)或多個(gè)量化參數(shù)相關(guān)聯(lián);編碼器,所述編碼器配置成接收視頻幀序列并對(duì)所述視頻幀內(nèi)的宏塊進(jìn)行編碼,其中所述編碼器在所述宏塊的視頻編碼期間產(chǎn)生實(shí)際的非零系數(shù); 受編碼器控制的量化參數(shù)表,其中所述編碼器使用偏移量度來(lái)選擇當(dāng)前宏塊的量化參數(shù),其中所述偏移量表示所述實(shí)際的非零系數(shù)和所述預(yù)期的非零系數(shù)之間的加權(quán)差,所述視頻編碼過(guò)程被調(diào)整,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。
11.如權(quán)利要求10所述的視頻編碼器,其特征在于,所述量化參數(shù)是使用所述偏移量度的歸一化值來(lái)選擇的。
12.如權(quán)利要求10或11所述的視頻編碼器,其特征在于,選擇所述量化參數(shù)以達(dá)到目標(biāo)視頻編碼質(zhì)量。
13.如權(quán)利要求12所述的視頻編碼器,其特征在于,視頻編碼質(zhì)量和量化參數(shù)是通過(guò)視頻幀序列的運(yùn)動(dòng)復(fù)雜度的函數(shù)關(guān)聯(lián)的。
14.一種視頻編碼的方法,所述方法由視頻編碼器中被配置成執(zhí)行一個(gè)或多個(gè)計(jì)算機(jī)程序模塊的處理器執(zhí)行,所述方法包括下列步驟 在處理器上執(zhí)行一個(gè)或多個(gè)計(jì)算機(jī)程序模塊,所述一個(gè)或多個(gè)計(jì)算機(jī)程序模塊配置成維持信息,其中所述信息將從宏塊的量化中預(yù)期得到的多個(gè)非零系數(shù)與視頻編碼過(guò)程中使用的一個(gè)或多個(gè)量化參數(shù)相關(guān)聯(lián); 在處理器上執(zhí)行一個(gè)或多個(gè)計(jì)算機(jī)程序模塊,所述一個(gè)或多個(gè)計(jì)算機(jī)程序模塊配置成在所述宏塊的視頻編碼期間產(chǎn)生實(shí)際的非零系數(shù); 在處理器上執(zhí)行一個(gè)或多個(gè)計(jì)算機(jī)程序模塊,所述一個(gè)或多個(gè)計(jì)算機(jī)程序模塊配置成計(jì)算表示所述實(shí)際的非零系數(shù)和所述預(yù)期的非零系數(shù)之間的加權(quán)差的偏移量度; 在處理器上執(zhí)行一個(gè)或多個(gè)計(jì)算機(jī)程序模塊,所述一個(gè)或多個(gè)計(jì)算機(jī)程序模塊配置成使用所述偏移量度調(diào)整視頻編碼過(guò)程,其中所述視頻編碼過(guò)程被調(diào)整,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。
15.如權(quán)利要求14所述的方法,其特征在于,使用偏移量度調(diào)整視頻編碼過(guò)程的所述步驟包括基于所述偏移量度的歸一化值來(lái)調(diào)整所述量化參數(shù)。
16.如權(quán)利要求15所述的方法,其特征在于,視頻編碼質(zhì)量和量化參數(shù)之間的關(guān)系是擬編碼的視頻幀序列的運(yùn)動(dòng)復(fù)雜度的函數(shù)。
17.如權(quán)利要求15或16所述的方法,其特征在于,所述歸一化偏移量度值在值I.O周?chē)儎?dòng),其中大于I. O的歸一化偏差量度值指示大于預(yù)期的編碼位速率。
18.如權(quán)利要求15或16所述的方法,其特征在于,所述歸一化偏移量度值的增加指示運(yùn)動(dòng)背景內(nèi)容的復(fù)雜度的增加。
全文摘要
記載了視頻編碼器、系統(tǒng)和方法,所述視頻編碼器、系統(tǒng)和方法表征了使用ρ-域偏移量度的視頻編碼過(guò)程。偏移量度表示實(shí)際的非零系數(shù)和預(yù)期的非零系數(shù)之間的加權(quán)差,所述實(shí)際系數(shù)和預(yù)期系數(shù)對(duì)應(yīng)于視頻幀的視頻編碼期間對(duì)該視頻幀內(nèi)的宏塊的量化。通過(guò)基于偏移量度的歸一化值來(lái)選擇量化參數(shù),用所述偏移量度調(diào)整視頻編碼過(guò)程,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。量化參數(shù)可從使用偏移量度來(lái)索引的表中選擇。
文檔編號(hào)H04N7/26GK102714722SQ201080061990
公開(kāi)日2012年10月3日 申請(qǐng)日期2010年9月2日 優(yōu)先權(quán)日2010年9月2日
發(fā)明者F·尤, F·施, 吳琦, 王標(biāo), 鮑鎧 申請(qǐng)人:英特賽爾美國(guó)股份有限公司