專利名稱:用于對視頻進(jìn)行編碼的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本公開一般性地涉及計(jì)算機(jī)圖形處理和顯示系統(tǒng),并且更具體地涉及用于利用版 本選擇(versioning)來對視頻進(jìn)行編碼的系統(tǒng)和方法。
背景技術(shù):
過去,基于磁帶的標(biāo)清視頻重編碼曾經(jīng)是機(jī)械處理,其中壓縮員 (compressionist)或視頻質(zhì)量工程師基于他們的視覺發(fā)現(xiàn)而驗(yàn)證源的視頻質(zhì)量、編碼或重 編碼(修復(fù))以及所請求的視頻偽像修復(fù)。參考圖1,例示了用于對視頻進(jìn)行編碼的傳統(tǒng) 磁帶工作流程。一般地,獲取包含視頻的磁帶10。然后將該磁帶加載至磁帶驅(qū)動器12上 以被編碼系統(tǒng)導(dǎo)入(ingest)。多種編碼/重編碼參數(shù)將被應(yīng)用至視頻14,并且該視頻將被 編碼16而產(chǎn)生編碼后文件18。壓縮員將通過可用的濾波、數(shù)字視頻減噪器、壓縮和其他硬 件/軟件基本上重運(yùn)行(例如多次迭代)基于磁帶的內(nèi)容20,以得到期望的重編碼后視頻 輸出結(jié)果22。重編碼的多次迭代可以是編碼器驅(qū)動的重編碼或QC(質(zhì)量控制)驅(qū)動的重編 碼。編碼器驅(qū)動的重編碼是基于對比特率分配、視頻質(zhì)量/偽像、峰值信噪比或它們的任意 組合的一些統(tǒng)計(jì)分析而進(jìn)行的自動的(也可以是手動的)重編碼。QC驅(qū)動的編碼是壓縮員 或視頻質(zhì)量工程師驅(qū)動的重編碼,以改善可能由于被編碼的視頻內(nèi)容的高度隨機(jī)的性質(zhì)而 被上述統(tǒng)計(jì)分析處理遺漏的視頻質(zhì)量。在此期間所使用的壓縮編解碼器是簡單的和容易理解的。這對于標(biāo)清盤格式來說 是足夠的,這是因?yàn)橛捎谳^舊的光存儲介質(zhì)的物理限制所以被編碼的視頻特征的容量很 普通。并且,基于磁帶的分發(fā)(例如VHS磁帶、DLT等)是導(dǎo)入至用于標(biāo)清制片(production) 的不同的視頻部件(avenue)的優(yōu)選手段,這是因?yàn)閷τ谠撎囟ǖ闹破?,資源(asset)更少、 可管理并被很好地服務(wù)。但是,該處理是耗時(shí)并且易錯的。進(jìn)一步地,傳統(tǒng)的磁帶工作流程 不保留除最后修復(fù)之外的修復(fù)的歷史,并且因此不允許各修復(fù)版本之間的比較。隨著較新的具有所支持的諸如H. 264 (AVC)之類的高級編解碼器、以及具有對于 視頻質(zhì)量的更優(yōu)的壓縮比的光存儲空間的介質(zhì)的出現(xiàn),利用該附加的盤空間以用于其他的 附加值內(nèi)容(諸如游戲、額外視頻內(nèi)容、采訪、音樂會、畫中畫、以及客戶/消費(fèi)者當(dāng)前所需 求的事件)變得可能。這實(shí)質(zhì)上增加了高清視頻內(nèi)容的全(sheer)容量、增加了復(fù)雜度 (多個系統(tǒng)、軟件等)和成功的編碼所需的時(shí)間、強(qiáng)調(diào)了對數(shù)字內(nèi)容的更好的管理/理解的 需要、增加了附加值材料(但這具有更短的完成該附加內(nèi)容材料的轉(zhuǎn)變(turn around)時(shí) 間)。使用舊的傳統(tǒng)的標(biāo)清制片工作流程將不是可行的提議。這要求了將高清制片移向無 磁帶的分發(fā),以使得該處理在成本方面更高效,這是因?yàn)檫@將需要更少的物理資源(D5磁 帶、DLT等)來跟蹤和存儲,并且使得數(shù)字地操縱/工作更容易。因此,存在對以下技術(shù)的需要所述技術(shù)克服傳統(tǒng)的無磁帶數(shù)字工作流程的劣勢并且更好地管理重編碼處理,所述技術(shù)通過使能壓縮員的知識的重使用性而增加壓縮員的 效率、允許多個重編碼屬性/工具的應(yīng)用、并且提供容易的使用和控制。
發(fā)明內(nèi)容
提供了一種用于對視頻進(jìn)行編碼的系統(tǒng)和方法。本公開的系統(tǒng)和方法提供了利用 版本選擇而進(jìn)行的重編碼,以允許對場景/鏡頭的控制、組織以及在重編碼處理期間對重 編碼歷史的呈現(xiàn),上述全部都是在全部質(zhì)量改善重編碼工作期間所必需的。本公開的系統(tǒng) 和方法在建立解決方案的庫的同時(shí)減少了完成多個重編碼所需的時(shí)間,并且提供和促進(jìn)跨 多個編碼任務(wù)的重使用性。根據(jù)本公開的一個方面,提供了一種用于對視頻編碼的方法,該方法包括步驟基 于第一編碼參數(shù)生成第一版本的編碼后視頻;基于第二編碼參數(shù)生成第二版本的編碼后視 頻;基于所述第一和第二版本的編碼后視頻生成比較數(shù)據(jù);以及顯示所述第一和第二版本 的編碼后視頻和所述比較數(shù)據(jù)。所述比較數(shù)據(jù)是視頻偽像列表、視頻文件尺寸和編碼參數(shù) 中的至少一個。根據(jù)本公開的另一方面,提供了一種用于對視頻進(jìn)行編碼的系統(tǒng),其包括編碼 器,用于基于第一編碼參數(shù)生成第一版本的編碼后視頻,并且基于第二重編碼參數(shù)生成至 少一個第二版本的編碼后視頻;比較器,用于基于所述第一版本的編碼后視頻和所述至少 一個第二版本的編碼后視頻生成比較數(shù)據(jù);以及用戶界面,用于顯示所述第一版本的編碼 后視頻和所述至少一個第二版本的編碼后視頻和所述比較數(shù)據(jù)。根據(jù)本公開的又一方面,提供了一種可由機(jī)器讀取的程序存儲設(shè)備,其切實(shí)包含 可由該機(jī)器執(zhí)行以執(zhí)行用于對視頻進(jìn)行編碼的方法步驟的指令的程序,所述方法包括基 于第一編碼參數(shù)生成第一版本的編碼后視頻;基于第二重編碼參數(shù)生成至少一個第二版本 的編碼后視頻;基于所述第一版本的編碼后視頻和所述至少一個第二版本的編碼后視頻生 成比較數(shù)據(jù);以及顯示所述第一版本的編碼后視頻和所述至少一個第二版本的編碼后視頻 和所述比較數(shù)據(jù)。
本公開的這些和其他方面、特征和優(yōu)勢將從對優(yōu)選實(shí)施例的以下詳細(xì)描述中被描 述或者變得明顯,將結(jié)合附圖閱讀所述優(yōu)選實(shí)施例的以下詳細(xì)描述。在附圖中,貫穿各視圖,相似的參考標(biāo)號表示相似的元件。圖1例示了根據(jù)現(xiàn)有技術(shù)的用于從磁帶對視頻進(jìn)行編碼的工作流程;圖2例示了根據(jù)本公開的一方面的用于對視頻進(jìn)行編碼的無磁帶工作流程;圖3為對根據(jù)本公開的一方面的用于對視頻進(jìn)行編碼的系統(tǒng)的示例性圖示;圖4為根據(jù)本公開的一方面的用于對視頻進(jìn)行編碼的示例性方法的流程圖;圖5例示了根據(jù)本公開的一方面的用于選擇將被重編碼的鏡頭/場景的示例性屏 幕截圖;圖6例示了根據(jù)本公開的另一方面的用于選擇將被重編碼的視頻的鏡頭/場景的 另一示例性屏幕截圖;圖7-10例示了根據(jù)本公開的一方面的用于控制對視頻的重編碼、用于控制對視頻的重編碼的版本選擇、以及用于向視頻應(yīng)用至少一個重編碼參數(shù)的若干示例性屏幕截 圖;應(yīng)當(dāng)理解,附圖以例示本公開的構(gòu)思為目的,并且不一定是用于例示本公開的唯
一可能配置。
具體實(shí)施例方式應(yīng)當(dāng)理解,可以以多種形式的硬件、軟件或其組合來實(shí)施圖中所示的元件。優(yōu)選 地,在一個或多個適當(dāng)編程的通用設(shè)備(可以包括處理器、存儲器和輸入/輸出接口)上以 硬件和軟件的組合來實(shí)施這些元件。本描述例示本公開的原理。因此應(yīng)理解本領(lǐng)域技術(shù)人員將能夠設(shè)計(jì)出雖然未在這 里明確描述或示出、但是體現(xiàn)本公開的原理并且包括在本公開的原理的精神和范圍內(nèi)的各 種布置。這里所敘述的所有例子和條件語句意在教學(xué)目的,以幫助讀者理解由發(fā)明人貢獻(xiàn) 以促進(jìn)本領(lǐng)域技術(shù)的本公開的原理和構(gòu)思,并被解釋為不限制為這樣具體敘述的例子和條 件。此外,這里敘述本公開的原理、方面、以及實(shí)施例的所有陳述、以及本公開的具體 例子意在包含本公開的結(jié)構(gòu)的和功能的等價(jià)物。另外,意在這樣的等價(jià)物包括當(dāng)前已知的 等價(jià)物以及將來發(fā)展的等價(jià)物,即,無論結(jié)構(gòu)如何、執(zhí)行相同功能的所開發(fā)的任何元件。因此,例如,本領(lǐng)域技術(shù)人員將理解這里呈現(xiàn)的框圖表示體現(xiàn)本公開的原理的示 例電路的概念性視圖。類似地,將理解任何流程圖示、流程圖、狀態(tài)轉(zhuǎn)換圖、偽代碼等等表 示各種處理,所述各種處理可以基本上在計(jì)算機(jī)可讀介質(zhì)中表示,并因此由計(jì)算機(jī)或處理 器執(zhí)行,無論這樣的計(jì)算機(jī)或處理器是否被明確示出。附圖中所示的各種元件的功能可以通過使用專用硬件以及能夠與適合的軟件相 關(guān)聯(lián)而執(zhí)行軟件的硬件來提供。當(dāng)由處理器提供時(shí),所述功能可以由單個專用處理器、單個 共享處理器、或其中一些可以被共享的多個獨(dú)立處理器提供。此外,術(shù)語“處理器”或“控制 器”的明確使用不應(yīng)被解釋為唯一地代表能夠執(zhí)行軟件的硬件,其也可以隱含地、不受限制 地包括數(shù)字信號處理器(“DSP”)硬件、用于存儲軟件的只讀存儲器(“ROM”)、隨機(jī)存取存 儲器(“RAM”)、以及非易失性存儲裝置。也可以包括其它的傳統(tǒng)的和/或定制的硬件。類似地,附圖中所示的任何開關(guān)只 是概念性的。它們的功能可以通過程序邏輯的操作、通過專用邏輯、通過程序控制和專用邏 輯間的交互作用、或甚至手動地執(zhí)行,具體技術(shù)可由實(shí)施者選擇,如從上下文中被更具體地 理解的。在本權(quán)利要求書中,表示為執(zhí)行指定功能的部件的任何元件意在包含執(zhí)行該功能 的任何手段,所述手段包括例如,a)執(zhí)行該功能的電路元件的組合,或者b)任何形式的軟 件,因此包括與用于執(zhí)行該軟件的適合的電路結(jié)合以執(zhí)行該功能的固件、微代碼等等。由這 樣的權(quán)利要求書限定的本公開歸于這樣的事實(shí)由各種所敘述的部件提供的功能以權(quán)利要 求書要求的方式組合并集合。因此認(rèn)為能夠提供那些功能的任何部件等價(jià)于這里所示的 那些部件。提供了用于對視頻進(jìn)行編碼的系統(tǒng)和方法。本公開的系統(tǒng)和方法提供利用版本選擇而進(jìn)行的重編碼,以允許對場景/鏡頭的控制、組織以及在重編碼處理期間對重編碼歷 史的呈現(xiàn),上述全部都是在全部質(zhì)量改善重編碼工作期間所必需的。參考圖2,例示了根據(jù) 本公開的用于對視頻進(jìn)行編碼的無磁帶工作流程。在圖2的工作流程中,經(jīng)由磁帶驅(qū)動器 播放視頻磁帶,并且將視頻磁帶捕捉并且轉(zhuǎn)換為數(shù)字格式13。在內(nèi)容被捕捉并且轉(zhuǎn)換為數(shù) 字格式之后,在完全的數(shù)字工作流程(例如在計(jì)算機(jī)上)中進(jìn)行處理變得容易。全部圖像 濾波器是軟件驅(qū)動的或利用專門的硬件加速來執(zhí)行。這允許壓縮員或視頻質(zhì)量工程師容易 地使用專用軟件或硬件向視頻內(nèi)容應(yīng)用修復(fù)。如下面將要描述的那樣,本公開的系統(tǒng)將具 有專用軟件和/或硬件以允許用戶(例如壓縮員或視頻質(zhì)量工程師)選擇要進(jìn)行重編碼的 特定的鏡頭/場景或特定的進(jìn)/出幀;允許用戶指定所應(yīng)用的重編碼參數(shù);以及允許使用 集成的視頻播放器來回放內(nèi)容。該系統(tǒng)和方法將允許重編碼的多次迭代,并且使得可以進(jìn) 行精細(xì)的(granular)改善。本公開的系統(tǒng)和方法可以保存每次迭代并且編譯修復(fù)的歷史, 從而允許多個重編碼(修復(fù))、編碼和其源之間的比較。進(jìn)一步地,該系統(tǒng)和方法包括預(yù)設(shè) 修復(fù)的庫(library),以顯著地減少執(zhí)行修復(fù)的時(shí)間。現(xiàn)在參考附圖,在圖3中示出了根據(jù)本公開的實(shí)施例的示例系統(tǒng)100??梢蕴峁?描設(shè)備103以將膠片印片(print) 104 (例如攝像機(jī)原始的膠片負(fù)片)掃描為數(shù)字格式(例 如Cineon格式或SMPTE DPX文件)。掃描設(shè)備103可以包括例如電視電影(telecine)設(shè) 備或任何將從膠片生成視頻輸出的設(shè)備(諸如例如具有視頻輸出的Arri LocPro )。可替 代地,可以直接使用來自后期處理或數(shù)字?jǐn)z像機(jī)106的文件(例如已經(jīng)處于計(jì)算機(jī)可讀形 式的文件)。計(jì)算機(jī)可讀文件的可能的源為AVID 編輯器、DPX文件、D5磁帶等。掃描后的膠片印片被輸入至后期處理設(shè)備102(例如計(jì)算機(jī))。在具有諸如一個 或多個中央處理單元(CPU)、存儲器110 (諸如隨機(jī)存取存儲器(RAM)和/或只讀存儲器 (ROM))和輸入/輸出(I/O)用戶接口 112 (諸如鍵盤、光標(biāo)控制設(shè)備(例如鼠標(biāo)或操縱桿) 和顯示設(shè)備)之類的硬件的各種已知計(jì)算機(jī)平臺中的任何一種上實(shí)施所述計(jì)算機(jī)。該計(jì)算 機(jī)平臺還包括操作系統(tǒng)和微指令代碼。在這里所描述的各種處理和功能可以是微指令代碼 的部分或經(jīng)由操作系統(tǒng)執(zhí)行的軟件應(yīng)用程序的部分(或其組合)。在一個實(shí)施例中,該軟 件應(yīng)用程序被切實(shí)包含在程序存儲設(shè)備上,該軟件應(yīng)用程序可以被上載至任何合適的機(jī)器 (諸如后期處理設(shè)備102)上并且由所述合適的機(jī)器執(zhí)行。另外,各種其他周邊設(shè)備可以通 過各種接口和總線結(jié)構(gòu)與該計(jì)算機(jī)平臺連接,所述多種接口和總線結(jié)構(gòu)諸如并行端口、串 行端口或通用串行總線(USB)。其他周邊設(shè)備可以包括附加的存儲設(shè)備127和打印機(jī)128。 可以采用打印機(jī)128來打印膠片的修訂后版本126,例如膠片的重編碼后版本,其中作為下 面所描述的技術(shù)的結(jié)果,一個或多個場景可能已經(jīng)被更改或修復(fù)??商娲?,可以直接將已經(jīng)處于計(jì)算機(jī)可讀形式的文件/膠片印片106 (例如數(shù)字 電影,其例如可以被存儲在外部硬盤驅(qū)動器127上)輸入至計(jì)算機(jī)102中。注意到這里所 使用的術(shù)語“膠片,,可以指膠片印片或數(shù)字電影。軟件程序包括在存儲器110中存儲的編碼版本選擇模塊114以對視頻進(jìn)行編碼/ 重編碼。編碼版本選擇模塊114將包括交互以執(zhí)行在本公開中所提供的各種功能和特征的 各種模塊。編碼版本選擇模塊114可以包括鏡頭/場景檢測器116,其被配置為確定視頻 (例如影片或電影)的至少一個鏡頭或場景。編碼模塊114進(jìn)一步包括重編碼參數(shù)118,其 被配置為選擇編碼/重編碼參數(shù)和向所檢測的鏡頭/場景應(yīng)用編碼/重編碼參數(shù)。示例重編碼參數(shù)包括改變特定鏡頭/場景的比特率的DeltaRate,從鏡頭/場景去除塊偽像的去 塊濾波器(Deblocking Filter)等。提供編碼器120以將所導(dǎo)入的視頻編碼為至少一個數(shù) 字格式。示例編碼器包括MPEG-4 (H. 264)、MPEG-2、QuickTime等。編碼版本選擇模塊114 將向所編碼的視頻的每個版本指派版本號或指示。提供預(yù)設(shè)修復(fù)的庫122以基于給定的條件而向視頻鏡頭或場景應(yīng)用至少一個或 多個修復(fù)。預(yù)設(shè)修復(fù)的庫122為解決特定偽像的重編碼參數(shù)的集合。用戶可以通過首先選 擇鏡頭/場景、然后基于在該鏡頭/場景中發(fā)現(xiàn)的偽像而選擇現(xiàn)存的已經(jīng)創(chuàng)建的預(yù)設(shè),來應(yīng) 用特定的預(yù)設(shè)。還可以基于用戶創(chuàng)建的分類來應(yīng)用預(yù)設(shè)。此外,這些預(yù)設(shè)將被保存,以稍后 在必要時(shí)跨相似的視頻編碼項(xiàng)目而使用。編碼版本選擇模塊114進(jìn)一步包括視頻播放器124以對視頻鏡頭/場景進(jìn)行解碼 并且對用戶使視頻可視化。提供比較器126以比較相同的鏡頭/場景的至少兩個視頻的數(shù) 據(jù),并且向用戶顯示比較數(shù)據(jù)。圖4為根據(jù)本公開的一方面的用于對視頻進(jìn)行編碼的示例方法的流程圖。初始 地,后期處理設(shè)備102獲取或輸入視頻內(nèi)容(步驟202)。后期處理設(shè)備102可以通過獲得 處于計(jì)算機(jī)可讀格式的數(shù)字原版(master)圖像文件來獲取視頻內(nèi)容。可以通過利用數(shù)字 攝像機(jī)捕捉運(yùn)動圖像的時(shí)間序列來獲取數(shù)字視頻文件。可替代地,可以通過傳統(tǒng)的膠片類 型的攝像機(jī)來捕捉視頻序列。在該情況中,經(jīng)由掃描設(shè)備103掃描膠片。應(yīng)當(dāng)理解,無論影片被掃描還是已經(jīng)處于數(shù)字格式,影片的數(shù)字文件將包括關(guān)于 幀的位置的指示或信息,例如幀號、從影片開始起的時(shí)間等。數(shù)字圖像文件的每幀將包括一 個圖像,例如Ii,I2,...,In。在視頻被輸入之后,視頻被導(dǎo)入,并且生成視頻內(nèi)容數(shù)據(jù)(204)。引入該步驟以將 來自不同的源的視頻數(shù)據(jù)準(zhǔn)備為編碼器可接受的格式,例如從10比特DPX格式到8比特 YUV格式。這可能需要根據(jù)需要降低圖像的比特深度,保存可以在編碼處理中使用的附加的 色彩元數(shù)據(jù)信息等。從所導(dǎo)入的視頻,向該視頻應(yīng)用若干算法或功能以導(dǎo)出內(nèi)容數(shù)據(jù),例如 元數(shù)據(jù)。例如,經(jīng)由鏡頭/場景檢測器116應(yīng)用場景/鏡頭檢測算法以將完整的視頻分割 為場景/鏡頭;還可以使用漸隱(fade)/溶解(dissolve)檢測算法。所生成的其他內(nèi)容數(shù) 據(jù)包括直方圖、基于色彩的分類、相似場景檢測、比特率、幀分類、縮略圖等。接著,在步驟206中,利用編碼器12對視頻進(jìn)行編碼。第一編碼產(chǎn)生版本0或基/ 參考編碼版本。其他全部版本將與該版本比較以根據(jù)需要進(jìn)行視頻質(zhì)量改善,或在相應(yīng)鏡 頭/場景的版本之間進(jìn)行比較。在步驟208中,確定是否可以進(jìn)一步改善或需要重編碼任何鏡頭/場景編碼???以在第一編碼期間自動地改善視頻鏡頭/場景的質(zhì)量。壓縮員可以視覺地檢查鏡頭/場景 以確定進(jìn)一步的重編碼是否是必要的。如果確定了不必要進(jìn)行任何進(jìn)一步的重編碼,則將 在步驟220處輸出最終編碼后視頻。否則,如果進(jìn)一步的重編碼是必要的,則該方法將通過 應(yīng)用預(yù)設(shè)或單獨(dú)的重編碼參數(shù)而繼續(xù)至步驟210。在步驟210中,將由用戶選擇鏡頭/場景、向該鏡頭/場景指派版本號或指示,并 且將指派新的重編碼參數(shù)或從重編碼參數(shù)列表118中選擇新的重編碼參數(shù)??商娲?,用 戶或壓縮員可以從可以包括一個或多個重編碼參數(shù)的預(yù)設(shè)修復(fù)的庫122中選擇。應(yīng)當(dāng)理 解,用戶可以選擇要進(jìn)行重編碼處理的鏡頭/場景的一個或多個幀。
然后執(zhí)行對所選擇的鏡頭/場景的重編碼(步驟212),并且然后經(jīng)由視頻播放器 124回放重編碼后的版本并且經(jīng)由比較器126將所述重編碼后的版本與所選擇的鏡頭/場 景的先前的版本比較(步驟214),以驗(yàn)證視頻或重編碼質(zhì)量。在一個實(shí)施例中,將通過經(jīng)由 視頻播放器124在分割的屏幕中顯示重編碼后的版本和先前的版本來視覺地比較這些視 頻。如下面將與圖6和7相關(guān)而描述的那樣,還可以簡單地通過選擇/檢查特定的版本并 且視覺地區(qū)分該鏡頭/場景版本的數(shù)據(jù)來比較諸如平均比特率等級、編碼幀類型、峰值信 噪比等之類的比較數(shù)據(jù)(或元數(shù)據(jù))。為了連續(xù)性而在全部時(shí)間選擇每個鏡頭/場景的一 個版本。還可以顯示諸如在視頻的編碼后和重編碼后版本中檢測到的視頻偽像的列表、視 頻文件尺寸、和為所選擇的版本采用的特定的編碼參數(shù)之類的其他比較數(shù)據(jù)。在基于在步驟210中所選擇的重編碼參數(shù)執(zhí)行重編碼之后,確定對鏡頭/場景的 重編碼是否令人滿意、或是否應(yīng)當(dāng)應(yīng)用其他不同的重編碼參數(shù)(步驟216)。該確定是使用 分割的視頻或可視化比較數(shù)據(jù)的視覺/手動處理。在一個實(shí)施例中,用戶或壓縮員將基于 比較數(shù)據(jù)(例如峰值信噪比)的可視化而將若干所生成的版本中偽像相對少的一個選擇為 最終版本的編碼后視頻。在其他實(shí)施例中,用戶或壓縮員將基于由視頻播放器124進(jìn)行的 至少兩個所選擇的版本的分割的可視化而將若干所生成的版本中偽像相對少的一個選擇 為最終版本的編碼后視頻。如果對鏡頭/場景的重編碼不令人滿意,則進(jìn)程將返回至步驟 210,并且將應(yīng)用其他重編碼參數(shù)。否則,進(jìn)程將前進(jìn)至步驟218。在步驟218中,然后確定對于與完整的視頻剪輯或電影相關(guān)聯(lián)的全部鏡頭/場景 來說編碼和重編碼是否令人滿意。如果存在要重編碼的其他鏡頭/場景,則進(jìn)程將返回至 步驟210,并且將選擇另一鏡頭/場景。否則,如果對于全部鏡頭/場景來說編碼和重編碼 是令人滿意的,則在例如存儲設(shè)備127中存儲最終編碼后視頻,并且可以獲取最終編碼后 視頻以進(jìn)行回放(步驟220)。進(jìn)一步地,可以在代表運(yùn)動畫面或剪輯的完整版本的單個數(shù) 字文件130中存儲運(yùn)動畫面或視頻剪輯的鏡頭/場景。可以為了之后的獲取而在存儲設(shè)備 127中存儲數(shù)字文件130,所述之后的獲取例如為打印編碼后視頻的磁帶或膠片版本。圖5-圖10例示了根據(jù)本公開的一方面的用于控制對視頻的重編碼和用于向視頻 應(yīng)用至少一個重編碼參數(shù)的若干示例性屏幕截圖。參考圖5,例示了用來選擇要進(jìn)行重編碼的特定鏡頭/場景的第一表示。提供了界 面500,其示出其上已經(jīng)執(zhí)行的鏡頭/場景檢測的整個特征的縮略圖表示的一部分??梢詫?縮略圖選擇為對要進(jìn)行重編碼的區(qū)域標(biāo)記進(jìn)(mark-in)(例如,開始)和標(biāo)記出(mark-out) (例如結(jié)束)??梢栽趫鼍皩踊驇瑢訄?zhí)行這些選擇并且確定要進(jìn)行重編碼的特定區(qū)域。在 圖5中,由縮略圖502表示視頻的所檢測的鏡頭/場景。在選擇特定的鏡頭/場景縮略圖 504時(shí),與所選擇的鏡頭/場景相關(guān)聯(lián)的幀被向用戶顯示為縮略圖506。界面500包括區(qū)塊508,其用于通過拖曳并放入重編碼類別或通過在縮略圖自身 上點(diǎn)擊而使用上下文菜單,來添加要進(jìn)行重編碼的鏡頭。場景502可以被簡單地放入用戶 定義的彩色的類別508中。在一個實(shí)施例中,類別的顏色將標(biāo)識視頻偽像、復(fù)雜度、鏡頭/ 場景閃爍等。界面500還包括區(qū)塊510,其示出屬于以上所選擇的類別508的各個場景。這 些縮略圖示出屬于所選擇/所高亮的類別內(nèi)的鏡頭/場景的第一幀。參考圖6,例示了用來在幀層選擇要進(jìn)行重編碼的特定的鏡頭/場景的第二表示。 提供了表示(重)編碼后視頻流的附加屬性或元數(shù)據(jù)的另一界面600。例如,可以基于編碼后流的屬性來使用比特率圖形來標(biāo)記進(jìn)和標(biāo)記出需要質(zhì)量增強(qiáng)的區(qū)域。這里,由標(biāo)記602、 604和陰影區(qū)域606表示標(biāo)記進(jìn)/標(biāo)記出。提供用于在添加重編碼之前應(yīng)用用于重編碼的 附加參數(shù)的區(qū)塊608。圖7-圖10例示了根據(jù)本公開的一方面的用于使得壓縮員或視頻質(zhì)量工程師能夠 控制對視頻的重編碼以及向視頻應(yīng)用至少一個重編碼參數(shù),并且允許壓縮員或視頻質(zhì)量工 程師選擇視頻偽像相對少的重編碼版本的若干示例性屏幕截圖。根據(jù)本公開的各個方面, 壓縮員或視頻質(zhì)量工程師可以提供被在更精細(xì)的(granule)層級應(yīng)用至相同場景內(nèi)的各 個幀的多個附加重編碼參數(shù)。圖7示出了用于在類別層選擇附加的重編碼設(shè)置屬性的界面700。區(qū)塊702示出 了樹狀列表,其包含由用戶使用上述選擇組件所請求的重編碼區(qū)域,例如與圖5和6相關(guān)而 描述的鏡頭/場景或幀。該樹包括1)類別-重編碼場景作為部分的編組,即它允許向作為 其部分的全部場景應(yīng)用相似的重編碼屬性;2)場景號的范圍_包括重編碼作為部分的開始 和結(jié)束場景;3)版本-利用進(jìn)展?fàn)顟B(tài)信息而執(zhí)行的重編碼的版本(復(fù)選框提供了選擇壓縮 員認(rèn)為適合或解決全部視頻偽像的版本的方式);以及(4)幀范圍-其中應(yīng)用重編碼屬性。 以此方式,用戶界面700將顯示鏡頭/場景或幀的版本指示的歷史。區(qū)塊704示出了隨時(shí) 間建立以解決普遍的重編碼問題的預(yù)設(shè)的列表,例如預(yù)設(shè)修復(fù)的庫122。這些預(yù)設(shè)作為可以 被使用或與其他壓縮員/用戶共享以加速解決問題的重編碼工具包。區(qū)塊706例示了可以 被指派的分類名、以及可以與分類相關(guān)聯(lián)以使分類所服務(wù)的目的更好地被理解的附加文本 數(shù)據(jù)。區(qū)塊708例示了可以被應(yīng)用以解決視頻偽像的重編碼參數(shù)名的列表。區(qū)塊708中所 示的濾波器或重編碼參數(shù)屬于區(qū)塊704中所選擇的預(yù)設(shè),并且在不同的預(yù)設(shè)被選擇時(shí),該 列表將改變。區(qū)塊710是用戶將選擇被應(yīng)用的重編碼參數(shù)的強(qiáng)度的地方。區(qū)塊712包括用 來開始所選擇的重編碼或開始對目前還沒有完成重編碼的全部進(jìn)行重編碼的按鈕。使用圖6和7的界面600、700,然后執(zhí)行在區(qū)塊702中所選擇的鏡頭/場景上的重 編碼(如上述步驟212中所述),并且然后經(jīng)由視頻播放器124回放重編碼后的版本并且經(jīng) 由比較器126將所述重編碼后的版本與所選擇的鏡頭/場景的先前的版本比較(如上述步 驟214中所述)以驗(yàn)證視頻或重編碼質(zhì)量。在一個實(shí)施例中,將通過經(jīng)由視頻播放器124 在分割的屏幕中顯示重編碼后的版本和先前的版本來視覺地比較這些視頻。在另一實(shí)施例 中,還可以簡單地通過選擇/檢查特定的版本702并且視覺地區(qū)分該鏡頭/場景版本的圖6 的陰影區(qū)域606中的數(shù)據(jù)來比較諸如平均比特率等級、編碼幀類型、峰值信噪比(PSNR)等 之類的比較數(shù)據(jù)(也被稱作元數(shù)據(jù)),其中界面600將作為比較器126。這里,通過在視頻 的版本之間選擇,界面600將在每個版本的元數(shù)據(jù)之間切換(toggle)以由用戶或壓縮員進(jìn) 行視覺檢查。例如,用戶可以在兩個不同的版本的視頻之間切換以觀察每個視頻的PSNR數(shù) 據(jù),其中PSNR越高則視頻質(zhì)量越好。圖8示出了用于在場景層選擇附加的重編碼設(shè)置屬性的界面800。在區(qū)塊802中, 選擇場景層節(jié)點(diǎn)。示出了被重編碼的場景的場景號。區(qū)塊804例示了該區(qū)域與關(guān)于被重編 碼的場景的文本數(shù)據(jù)相關(guān)聯(lián)。區(qū)塊806提供了在該特定場景的不同階段或版本之間進(jìn)行選 擇和比較的全部選項(xiàng)的列表。該列表包括源版本-這是場景的實(shí)際源導(dǎo)入版本-這是場景的導(dǎo)入版本
編碼后版本_這是場景的第一編碼后版本重編碼版本X.YY-這些是由壓縮員請求的重編碼。X.YY示出了重編碼的代 (generation)和歷史。X是主版本,而YY示出副版本。使用X. YY版本指示,用戶可以判斷 出重編碼的進(jìn)展。例如,版本選擇方法的一種表示可以如下所示版本1. 00-利用特定的重編碼參數(shù)進(jìn)行重編碼的第一嘗試。版本1. 10-利用具有一些附加或進(jìn)一步的精煉的以上參數(shù)進(jìn)行的重編碼的第二 嘗試。版本1. 00為父版本,其提供用來開始重編碼的實(shí)際參數(shù)集合。版本1. 11-利用一些附加參數(shù)進(jìn)一步精煉版本1. 10的嘗試。版本2. 00-利用不同的重編碼參數(shù)集合進(jìn)行重編碼的全新的嘗試。以上例子還示出了用戶怎樣可以推導(dǎo)出隨后的改善編碼質(zhì)量的重編碼的進(jìn)展。這 允許用戶更好地理解重編碼進(jìn)程并且通過對相同的場景同時(shí)嘗試不同的重編碼集合來快 速地收窄至質(zhì)量編碼,從而改善壓縮員的生產(chǎn)率并且改善質(zhì)量。選擇任何兩個版本將允許 壓縮員使用集成了分割的屏幕的視頻播放器124而將重編碼后版本一起比較。以此方式, 可以容易地發(fā)現(xiàn)并且選擇版本之間的質(zhì)量改善,從而改善最終編碼后視頻流。再次參考圖8,區(qū)塊808提供了以分割的屏幕模式啟動視頻播放器以比較在區(qū)塊 806中所選擇的兩個版本的按鈕。區(qū)塊810中所提供的按鈕以全屏模式啟動視頻播放器以 播放所選擇的場景的導(dǎo)入的視頻流或重編碼后的視頻流。圖9例示了用于在版本層選擇附加的重編碼設(shè)置屬性的界面900。區(qū)塊902提供 了各個鏡頭/場景的版本的列表,例如版本X.YY。這些是由壓縮員請求的重編碼。X.YY示 出了重編碼的代和歷史。X是主版本而YY示出副版本。使用X.YY,用戶可以判斷出重編碼 的進(jìn)展。圖9的區(qū)塊904允許用戶將附加的文本數(shù)據(jù)與所選擇的版本相關(guān)聯(lián)。圖10示出了用于在幀范圍層選擇附加的重編碼設(shè)置屬性的界面1000。區(qū)塊1002 示出了將與所選擇的特定的場景一同被重編碼的幀號。使用與圖5和6相關(guān)而描述的選擇 要進(jìn)行重編碼的鏡頭/場景的上述表示中的一個來確定該選擇。區(qū)塊1004示出了隨時(shí)間建 立并且可被應(yīng)用于幀以解決普遍的重編碼偽像的預(yù)設(shè)的列表,例如預(yù)設(shè)修復(fù)的庫122。這些 預(yù)設(shè)可以與其他用戶共享。區(qū)塊1006允許用戶添加附加的幀范圍。這使得壓縮員能夠向 原始的所選擇的范圍選擇內(nèi)的特定的幀定制和應(yīng)用不同的重編碼參數(shù)。區(qū)塊1008使得用 戶能夠向類別層應(yīng)用(復(fù)制)當(dāng)前所選擇的重編碼參數(shù)集合。以此方式,壓縮員可以容易 地將經(jīng)過測試的修復(fù)版本應(yīng)用到具有相似的問題鏡頭/場景的整個類別。區(qū)塊1010提供 可以應(yīng)用到幀范圍層的重編碼參數(shù)的列表,并且區(qū)塊1012使得壓縮員能夠選擇場景類型。 壓縮員可以選擇或變更重編碼參數(shù)的強(qiáng)度。描述了用于利用版本選擇對視頻進(jìn)行重編碼的系統(tǒng)和方法。該系統(tǒng)和方法的實(shí)施 和理解是簡單和直觀的;該系統(tǒng)和方法改善和增加了對編碼和重編碼處理的控制,并且允 許遞增的(incremental)視頻質(zhì)量改善/增強(qiáng)、領(lǐng)悟(insight),并且提供關(guān)于重編碼修復(fù) 的歷史。進(jìn)一步地,該系統(tǒng)和方法允許用戶隨時(shí)間保存和建立庫/知識庫,并且使能跨多個 編碼任務(wù)或與其他用戶一同的重使用性,以實(shí)現(xiàn)快速生產(chǎn);并且提供對數(shù)字工作流程/工 具處理(導(dǎo)入、濾波、編碼或重編碼)的效果的更好的理解、以及對壓縮視頻輸出內(nèi)的質(zhì)量 問題/偽像的比較和除錯的理解。另外,本公開的系統(tǒng)和方法減少了完成修復(fù)特征編碼所 需的用戶/人工小時(shí)數(shù),并且產(chǎn)生增加的生產(chǎn)率和生產(chǎn)量。
雖然在這里已經(jīng)詳細(xì)地示出和描述了并入本公開的教導(dǎo)的實(shí)施例,但本領(lǐng)域技術(shù) 人員可以容易地設(shè)計(jì)出仍然并入這些教導(dǎo)的許多其他的改變的實(shí)施例。已經(jīng)對用于對視頻 進(jìn)行編碼的系統(tǒng)和方法描述了優(yōu)選實(shí)施例(其意圖是例示性的而非限制性的),但應(yīng)當(dāng)注 意,本領(lǐng)域技術(shù)人員可以鑒于以上教導(dǎo)進(jìn)行修改和變化。因此應(yīng)當(dāng)理解,可以在所公開的本 公開的特定實(shí)施例中進(jìn)行在如由權(quán)利要求書所概括的本公開的范圍中的改變。
權(quán)利要求
一種用于對視頻進(jìn)行編碼的方法,該方法包括步驟基于第一編碼參數(shù)生成第一版本的編碼后視頻(206);基于第二重編碼參數(shù)生成至少一個第二版本的編碼后視頻(212);基于所述第一版本的編碼后視頻和所述至少一個第二版本的編碼后視頻生成比較數(shù)據(jù)(214);以及顯示所述第一版本的編碼后視頻和所述至少一個第二版本的編碼后視頻和所述比較數(shù)據(jù)(214)。
2.根據(jù)權(quán)利要求1所述的方法,其中所述比較數(shù)據(jù)是從所述第一版本的編碼后視頻和 所述至少一個第二版本的編碼后視頻生成的視頻偽像列表、視頻文件尺寸、編碼參數(shù)和元 數(shù)據(jù)中的至少一個。
3.根據(jù)權(quán)利要求2所述的方法,其中所生成的元數(shù)據(jù)是平均比特率、視頻幀結(jié)構(gòu)和峰 值信噪比中的至少一個。
4.根據(jù)權(quán)利要求1所述的方法,其中所述第一版本的編碼后視頻和所述至少一個第二 版本的編碼后視頻是場景和幀中的至少一個。
5.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括基于所述比較數(shù)據(jù)的可視化而將所述至 少一個第二版本中偽像相對少的一個選擇為最終版本的編碼后視頻(216、218)。
6.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括基于所述第一版本的編碼后視頻和所述 至少一個第二版本的編碼后視頻的分割的可視化而將所述至少一個第二版本中偽像相對 少的一個選擇為最終版本的編碼后視頻(216、218)。
7.根據(jù)權(quán)利要求1所述的方法,其中生成至少一個第二版本的編碼后視頻包括對所述 至少一個第二版本中的每一個指派版本指示(210)。
8.根據(jù)權(quán)利要求7所述的方法,其進(jìn)一步包括顯示所述版本指示的歷史。
9.根據(jù)權(quán)利要求1所述的方法,其中生成至少一個第二版本的編碼后視頻包括基于預(yù) 定的視頻偽像而應(yīng)用至少兩個重編碼參數(shù)。
10.一種用于對視頻進(jìn)行編碼的系統(tǒng)(100),其包括編碼器(120),用于基于第一編碼參數(shù)生成第一版本的編碼后視頻,并且基于第二重編 碼參數(shù)生成至少一個第二版本的編碼后視頻;比較器(126),用于基于所述第一版本的編碼后視頻和所述至少一個第二版本的編碼 后視頻生成比較數(shù)據(jù);以及用戶界面(112),用于顯示所述第一版本的編碼后視頻和所述至少一個第二版本的編 碼后視頻和所述比較數(shù)據(jù)。
11.根據(jù)權(quán)利要求10所述的系統(tǒng)(100),其中所述比較數(shù)據(jù)是從所述第一版本的編碼 后視頻和所述至少一個第二版本的編碼后視頻生成的視頻偽像列表、視頻文件尺寸、編碼 參數(shù)和元數(shù)據(jù)中的至少一個。
12.根據(jù)權(quán)利要求11所述的系統(tǒng)(100),其中所生成的元數(shù)據(jù)是平均比特率、視頻幀結(jié) 構(gòu)和峰值信噪比中的至少一個。
13.根據(jù)權(quán)利要求10所述的系統(tǒng)(100),其中所述第一版本的編碼后視頻和所述至少 一個第二版本的編碼后視頻是場景和幀中的至少一個。
14.根據(jù)權(quán)利要求10所述的系統(tǒng)(100),其中所述比較器(126)被配置為生成所述比較數(shù)據(jù)的可視化,其中所述用戶界面(112)被配置為基于所述比較數(shù)據(jù)的可視化而將所述 至少一個第二版本中偽像相對少的一個選擇為最終版本的編碼后視頻。
15.根據(jù)權(quán)利要求10所述的系統(tǒng)(100),其進(jìn)一步包括視頻播放器(124),其用于顯示 所述第一版本的編碼后視頻和所述至少一個第二版本的編碼后視頻的分割的可視化,其中 所述用戶界面(112)被配置為基于所述第一版本的編碼后視頻和所述至少一個第二版本 的編碼后視頻的分割的可視化而將所述至少一個第二版本中偽像相對少的一個選擇為最 終版本的編碼后視頻。
16.根據(jù)權(quán)利要求10所述的系統(tǒng)(100),其進(jìn)一步包括編碼版本選擇模塊(114),用于 對所述至少一個第二版本中的每一個指派版本指示。
17.根據(jù)權(quán)利要求16所述的系統(tǒng)(100),其中用戶界面(112)被配置為顯示所述版本 指示的歷史。
18.根據(jù)權(quán)利要求10所述的系統(tǒng)(100),其進(jìn)一步包括多個預(yù)定編碼修復(fù)(122),所述 多個預(yù)定編碼修復(fù)中的每一個包括至少一個重編碼參數(shù),其中所述編碼器(120)被配置為 基于預(yù)定的偽像應(yīng)用所述多個預(yù)定編碼修復(fù)中的至少一個。
19.一種可由機(jī)器讀取的程序存儲設(shè)備,其切實(shí)包含可由該機(jī)器執(zhí)行以執(zhí)行用于對視 頻進(jìn)行編碼的方法步驟的指令的程序,所述方法包括基于第一編碼參數(shù)生成第一版本的編碼后視頻(206);基于第二重編碼參數(shù)生成至少一個第二版本的編碼后視頻(212);基于所述第一版本的編碼后視頻和所述至少一個第二版本的編碼后視頻生成比較數(shù) 據(jù)(214);以及顯示所述第一版本的編碼后視頻和所述至少一個第二版本的編碼后視頻和所述比較 數(shù)據(jù)(214)。
20.根據(jù)權(quán)利要求19所述的程序存儲設(shè)備,其中所述比較數(shù)據(jù)是從所述第一版本的編 碼后視頻和所述至少一個第二版本的編碼后視頻生成的視頻偽像列表、視頻文件尺寸、編 碼參數(shù)和元數(shù)據(jù)中的至少一個。
全文摘要
提供了一種利用版本選擇對視頻進(jìn)行編碼來允許對場景/鏡頭的控制、組織以及對重編碼歷史的呈現(xiàn)的系統(tǒng)和方法。本公開的系統(tǒng)和方法提供了基于第一編碼參數(shù)生成第一版本的編碼后視頻(206);基于第二重編碼參數(shù)生成至少一個第二版本的編碼后視頻(212);基于所述第一版本的編碼后視頻和所述至少一個第二版本的編碼后視頻生成比較數(shù)據(jù)(214);以及顯示所述第一版本的編碼后視頻和所述至少一個第二版本的編碼后視頻和所述比較數(shù)據(jù)(214)。所述比較數(shù)據(jù)是從所述第一版本的編碼后視頻和所述至少一個第二版本的編碼后視頻生成的視頻偽像列表、視頻文件尺寸、編碼參數(shù)和元數(shù)據(jù)中的至少一個。
文檔編號H04N7/24GK101868977SQ200880116442
公開日2010年10月20日 申請日期2008年11月12日 優(yōu)先權(quán)日2007年11月15日
發(fā)明者阿南德·卡普爾 申請人:湯姆森特許公司