專利名稱:高保真代碼轉(zhuǎn)換的制作方法
技術(shù)領(lǐng)域:
描述了高保真代碼轉(zhuǎn)換。例如,一種視頻代碼轉(zhuǎn)換器從源格式的壓縮視頻中提取句法元素,并使用句法元素用于在壓縮目標(biāo)格式的視頻時(shí)對(duì)決策進(jìn)行編碼。
背景技術(shù):
隨著通過(guò)因特網(wǎng)對(duì)DVD和視頻傳遞的引入,數(shù)字視頻變得越來(lái)越常見(jiàn)。工程師使用各種技術(shù)來(lái)有效地處理數(shù)字視頻,同時(shí)維持其質(zhì)量。為理解這些技術(shù),理解計(jì)算機(jī)中如何表示并處理視頻信息是有幫助的。
I.計(jì)算機(jī)中視頻信息的表示計(jì)算機(jī)將視頻信息作為表示信息的一系列數(shù)字來(lái)處理。單個(gè)數(shù)字通常表示圖像的一個(gè)圖像元素[“像素”]的亮度值。有若干因素影響視頻信息的質(zhì)量,包括樣值深度、分辨率和幀速率。
樣值深度(或精度)指示用于表示樣值的數(shù)字的范圍。當(dāng)對(duì)于樣值可能的值越多,則質(zhì)量越高,因?yàn)閿?shù)字可捕捉亮度中微小的變化。具有較高分辨率的視頻往往看上去比其它視頻更清新,而具有較高幀速率的視頻往往看上去比其它視頻更平滑。對(duì)于所有這些因素,對(duì)高質(zhì)量的折衷是儲(chǔ)存和發(fā)送信息的成本,如表1所示。
表1對(duì)原始視頻的不同質(zhì)量級(jí)別的比特率諸如用于HDTV的高分辨率格式對(duì)原始視頻使用甚至更高的比特率。盡管比特率很高,然而公司和消費(fèi)者越來(lái)越依賴于計(jì)算機(jī)來(lái)創(chuàng)建、編輯、分發(fā)和回放視頻內(nèi)容。為此,工程師使用壓縮(也稱為編碼)來(lái)降低數(shù)字視頻的比特率。壓縮通過(guò)將信息轉(zhuǎn)換成較低比特率的形式降低了儲(chǔ)存和發(fā)送信息的成本。解壓(也稱為解碼)從壓縮的形式重建原始信息的版本。壓縮的兩種類別為無(wú)損和有損。
無(wú)損壓縮通過(guò)去除冗余度來(lái)降低信息的比特率。例如,10個(gè)紅色像素的序列在壓縮中被表示為用于“紅”的代碼和數(shù)字10,并且該序列較佳地在解壓中重建。無(wú)損壓縮降低了比特率而不損害質(zhì)量,但是只能將比特率降低到某一點(diǎn)。比特率的降低受信息復(fù)雜度的限制。熵編碼是無(wú)損壓縮的另一術(shù)語(yǔ)。
相反,采用有損壓縮,質(zhì)量受到損害,但是比特率的降低更顯著。例如,10個(gè)像素的序列,其每一個(gè)具有紅色的略微不同的色調(diào),該序列被近似為具有相同的“紅”色的10個(gè)像素。有損壓縮可通過(guò)去除更多質(zhì)量來(lái)更多地降低比特率,但是損失的質(zhì)量無(wú)法恢復(fù)。有損壓縮通常結(jié)合無(wú)損壓縮一起使用一有損壓縮降低視頻的復(fù)雜度和質(zhì)量,從而在隨后的無(wú)損壓縮中可以更大程度地降低比特率。例如,10像素的序列,其每一個(gè)具有紅色的略微不同的色調(diào),該序列在壓縮中被表示為用于“紅”的代碼和數(shù)字10。在解壓中,原始的序列被重建為具有相同的“紅”色的10個(gè)像素。
各種國(guó)際標(biāo)準(zhǔn)著眼于視頻壓縮、解壓和壓縮視頻的句法。這些標(biāo)準(zhǔn)包括MPEG-1、MPEG-2、MPEG-4、H.261、H.262和H.264/AVT/JVT。除這些標(biāo)準(zhǔn)外,各個(gè)公司提供了視頻壓縮和解壓產(chǎn)品。這些產(chǎn)品包括來(lái)自微軟公司的WindowsMedia Video工具的各種版本。這些標(biāo)準(zhǔn)和產(chǎn)品的每一個(gè)都使用了無(wú)損和有損壓縮技術(shù)的不同組合,在過(guò)去,廣播和電纜行業(yè)采用了各種類型的MPEG-2(和MPEG-1)用于視頻內(nèi)容的采集、提供、生產(chǎn)和傳送。結(jié)果,尤其是以MPEG-2格式,有大量的傳統(tǒng)、歸檔的內(nèi)容。然而,作為一種壓縮格式,MPEG-2在與諸如WMV版本9[“WMV9”]等更新近的格式相比并不特別有效。這些行業(yè)越來(lái)越多地被WMV9的編碼效率以及WMV9用于廣播產(chǎn)品和分發(fā)工作流應(yīng)用的多樣性所吸引,這些工作流應(yīng)用包括播音(on-air)備份、對(duì)機(jī)頂盒的視頻點(diǎn)播傳送、發(fā)送回傳傳輸、以及高分辨率視頻的瀏覽代理的創(chuàng)建。這些行業(yè)的問(wèn)題是如何將傳統(tǒng)的MPEG-2內(nèi)容有效地轉(zhuǎn)換成WMV9用于更有效的處理和分發(fā)。
II.代碼轉(zhuǎn)換不同的設(shè)備和終端用戶具有不同的存儲(chǔ)和發(fā)送容量以及不同的質(zhì)量要求。另外,不同的設(shè)備和終端用戶可使用不同的壓縮格式。一般而言,代碼轉(zhuǎn)換將壓縮的信息從一種比特率、質(zhì)量或格式轉(zhuǎn)換成另一種比特率、質(zhì)量或格式的壓縮信息。不同的代碼轉(zhuǎn)換器使用不同的技術(shù)。
同類代碼轉(zhuǎn)換器在代碼轉(zhuǎn)換期間對(duì)解壓和壓縮使用同一格式,例如,將高比特率MPEG-2壓縮視頻轉(zhuǎn)換成較低比特率的MPEG-2壓縮視頻。異類代碼轉(zhuǎn)換器對(duì)解壓和壓縮使用不同的格式,例如,將MPEG-2壓縮視頻轉(zhuǎn)換成H.261壓縮視頻。對(duì)于同類代碼轉(zhuǎn)換器的描述,請(qǐng)參閱例如由Shanableh等人的名為“Transcodingof Video into Different Encoding Formats(將視頻代碼轉(zhuǎn)換成不同的編碼格式)”的文章。
某些代碼轉(zhuǎn)換器完全解壓壓縮信息,然后完全重新壓縮該信息。單純代碼轉(zhuǎn)換僅層疊解壓和重新壓縮階段。其它代碼轉(zhuǎn)換器僅部分地解壓所壓縮的信息、重新壓縮所解壓的信息、以及令其它仍被壓縮的元素作為代碼轉(zhuǎn)換的一部分通過(guò)。運(yùn)動(dòng)圖像和電視工程師協(xié)會(huì)[“SMPTE”]產(chǎn)生了一種指定在從MPEG-2壓縮視頻代碼轉(zhuǎn)換到MPEG-2壓縮視頻時(shí)所使用的信息的標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)列出了MPEG-2句法元素,以及用于以相同或不同的比特率從MPEG-2壓縮視頻代碼轉(zhuǎn)換成MPEG-2壓縮視頻的相關(guān)的、導(dǎo)出的參數(shù)。見(jiàn)SMPTE的“SMPTE 327M-2000-MPEG-2VideoRecoding Data Set(SMPTE 327M-2000-MPEG-2視頻記錄數(shù)據(jù)集)”,第9頁(yè)(2000年1月)。部分解壓代碼轉(zhuǎn)換器通常重復(fù)使用壓縮的信息以降低代碼轉(zhuǎn)換過(guò)程的復(fù)雜度,從而避免了第二種壓縮中諸如運(yùn)動(dòng)估計(jì)和代碼模式判斷等資源密集型操作。
在解壓之后,可對(duì)視頻進(jìn)行重新采樣、重新量化或其它處理。盡管這有時(shí)候?qū)τ诮档捅忍芈驶虼_保格式兼容性是必需的,然而這些處理可引入與第二種壓縮相關(guān)聯(lián)的必要損失之外的損失。例如,假定73Mbit/s的視頻被壓縮成4Mbit/s的MPEG-2視頻,然后被代碼轉(zhuǎn)換成2.8Mbit/s的H.261視頻。代碼轉(zhuǎn)換損失可使經(jīng)代碼轉(zhuǎn)換的H.261視頻的質(zhì)量比73Mbit/s視頻直接被壓縮成2.8Mbit/s的H.261視頻時(shí)的質(zhì)量更差。
即使在代碼轉(zhuǎn)換成同一格式時(shí),單純代碼轉(zhuǎn)換通常也引入高代碼轉(zhuǎn)換失真。每次代碼轉(zhuǎn)換的質(zhì)量損失被估算成大約為1-2dB(以峰值信號(hào)與噪聲之比[“PSNR”]損失表示)。串接的代碼轉(zhuǎn)換可導(dǎo)致在每一次生成時(shí)圖像質(zhì)量的損失,并且視頻質(zhì)量在若干變換之后可能是無(wú)法接受的。即使在更溫和的復(fù)雜度的廣播產(chǎn)品鏈中,5dB的損失也是常見(jiàn)的。此外,重復(fù)的量化過(guò)程會(huì)導(dǎo)致在各個(gè)量化性能損失之上或之外的總體重新量化性能損失。
關(guān)于部分解壓代碼轉(zhuǎn)換器的更多信息,可參考例如以下文章(1)Assuncao等人的“Transcoding of Single-Layer MPEG Video Into Lower Rates(將單層MPEG視頻代碼轉(zhuǎn)換成較低的速率)”;以及(2)Keesman等人的“Transeoding of MPEGBitstreams(MPEG比特流的代碼轉(zhuǎn)換)”。關(guān)于也使用來(lái)自壓縮信息的句法元素來(lái)影響第二種壓縮中的代碼決策的代碼轉(zhuǎn)換器的更多信息,可參考例如以下文章(3)Knee等人的“Seamless Concatenation-A 21stCentury Dream(無(wú)縫串接-21世紀(jì)的夢(mèng)想)”;(4)Sun等人的“Architectures for MPEG Compressed bitstreamScaling(用于MPEG壓縮比特流縮放的體系結(jié)構(gòu))”;以及(5)Tudor等人的“Real-Time Transcoding of MPEG-2Video Bit Streams(MPEG-2視頻比特流的實(shí)時(shí)代碼轉(zhuǎn)換)”。關(guān)于通過(guò)改變量化來(lái)降低比特率的代碼轉(zhuǎn)換器的描述,可參考例如參考文獻(xiàn)(3)、(4)和(5),以及以下文章Assuncao等人的“Buffer Analysisand Control in CBR Video Transcoding(CBR視頻代碼轉(zhuǎn)換中的緩沖區(qū)分析和控制)”。關(guān)于代碼轉(zhuǎn)換中的速率控制的描述,可參考例如參考文獻(xiàn)(5)和(6)。
不論現(xiàn)有視頻代碼轉(zhuǎn)換器的優(yōu)點(diǎn)如何,它們都沒(méi)有本發(fā)明的各個(gè)不同方面的優(yōu)點(diǎn)。具體地,上文提及的參考文獻(xiàn)主要著眼于同類代碼轉(zhuǎn)換解決方案,而忽視了對(duì)異類代碼轉(zhuǎn)化解決方案的需求。另外,在這些參考文獻(xiàn)討論代碼轉(zhuǎn)化中壓縮信息的重復(fù)使用時(shí),它們通常強(qiáng)調(diào)為降低代碼轉(zhuǎn)換復(fù)雜度的重復(fù)使用。一些參考文獻(xiàn)在降低質(zhì)量損失方面描述了重復(fù)使用,但是未示出在代碼轉(zhuǎn)換中如何有效地重復(fù)使用信息,并同時(shí)利用第二壓縮級(jí)的壓縮效率。尤其是,在先前的視頻代碼轉(zhuǎn)換器允許比特率降低的意義上,質(zhì)量受損,并且在先前的代碼轉(zhuǎn)換器保持了質(zhì)量的意義上,在比特率中沒(méi)有任何降低。先前的視頻代碼轉(zhuǎn)換器未以既充分地保持質(zhì)量又充分地降低比特率的方式來(lái)進(jìn)行代碼轉(zhuǎn)換。
發(fā)明內(nèi)容
概括而言,描述了用于高保真代碼轉(zhuǎn)換的各種策略。采用這些策略,例如,視頻代碼轉(zhuǎn)換器以既充分保持質(zhì)量又充分降低比特率的方式將視頻從源格式代碼轉(zhuǎn)換成目標(biāo)格式。各種策略可組合使用或單獨(dú)使用。
依照第一策略,一種工具將視頻從源格式代碼轉(zhuǎn)換成同一比特率或較低比特率的目標(biāo)格式。該工具解壓源格式的壓縮視頻,并獲取壓縮視頻的多個(gè)單元的類型值。該類型值可以是圖像類型值、宏塊編碼類型值和/或其它信息。當(dāng)該工具重新壓縮視頻時(shí),該工具至少部分地基于獲取的類型值作出某些編碼決策,以幫助該工具匹配目標(biāo)格式和源格式的壓縮視頻之間的質(zhì)量。該工具獨(dú)立地作出其它編碼決策,以利用目標(biāo)格式的壓縮效率來(lái)降低比特率。
依照第二策略,一種工具解壓一種格式的壓縮視頻,并獲取該壓縮視頻的量化級(jí)別。當(dāng)該工具以另一格式壓縮該視頻時(shí),該工具將該視頻量化到可與所獲取的量化級(jí)別比較的程度,以減少格式的壓縮視頻之間的質(zhì)量差異。同時(shí),第二種格式的壓縮效率充分地降低了比特率。
依照第三策略,一種工具解壓第一格式的壓縮視頻,并重新壓縮該視頻。該工具使用了具有一次通過(guò)可變比特率編碼的第二格式編碼器,但是調(diào)節(jié)壓縮參數(shù)來(lái)以恒定或相對(duì)恒定的比特率產(chǎn)生第二格式的壓縮視頻。
當(dāng)參考附圖閱讀以下實(shí)施例的詳細(xì)描述時(shí),可以清楚本發(fā)明的這些和其它特征和優(yōu)點(diǎn)。
圖1是其中可實(shí)現(xiàn)所描述的實(shí)施例的合適的計(jì)算環(huán)境的框圖。
圖2是其中可實(shí)現(xiàn)所描述的實(shí)施例的視頻代碼轉(zhuǎn)換器的框圖。
圖3是代碼轉(zhuǎn)換器的DMO體系結(jié)構(gòu)的框圖。
圖4是結(jié)合了圖3的代碼轉(zhuǎn)換器的濾波器圖的框圖。
圖5所示是在代碼轉(zhuǎn)換成目標(biāo)格式時(shí)用于獲取并使用源格式壓縮視頻的重新編碼數(shù)據(jù)集元素的技術(shù)的流程圖。
圖6所示是在代碼轉(zhuǎn)換成目標(biāo)格式時(shí)用于獲取并使用源格式壓縮視頻的量化級(jí)別的技術(shù)的流程圖。
圖7所示是代碼轉(zhuǎn)換時(shí)用于速率控制的技術(shù)的流程圖。
圖8是一個(gè)實(shí)現(xiàn)中用于成比例的速率控制機(jī)制的框圖。
圖9是另一實(shí)現(xiàn)中用于成比例的速率控制機(jī)制的偽代碼清單。
具體實(shí)施例方式
所描述的實(shí)施例針對(duì)的是用于高保真代碼轉(zhuǎn)換的技術(shù)和工具。例如,視頻代碼轉(zhuǎn)換器執(zhí)行視頻第一有損壓縮格式到第二有損壓縮格式的高保真轉(zhuǎn)換。這允許兩種格式之間的互操作性,同時(shí)降低了代碼轉(zhuǎn)換損失并充分地保持了質(zhì)量。同時(shí),第二格式的壓縮效率導(dǎo)致了輸出比特率充分地低于輸入比特率。
關(guān)鍵的觀察來(lái)自于在單純代碼轉(zhuǎn)換期間在逐圖像的基礎(chǔ)上對(duì)所使用的比特?cái)?shù)的比較。彈出代碼轉(zhuǎn)換中的質(zhì)量損失部分地起源于兩種不同的壓縮格式中用于壓縮同一圖像的比特?cái)?shù)的不一致。當(dāng)過(guò)少的比特用于圖像的重新壓縮時(shí),引入額外的失真的風(fēng)險(xiǎn)將增加,并且質(zhì)量損失會(huì)影響后續(xù)的圖像。例如,如果一個(gè)圖像用作后續(xù)圖像的運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像,則代碼轉(zhuǎn)換器必須通過(guò)花費(fèi)額外的比特來(lái)對(duì)預(yù)測(cè)圖像的預(yù)測(cè)剩余量進(jìn)行編碼,以補(bǔ)償參考圖像中的質(zhì)量損失。另一方面,當(dāng)過(guò)多的比特用于圖像的重新壓縮時(shí),保持的“質(zhì)量”遠(yuǎn)低于人類觀察者的可見(jiàn)度閾值,因此浪費(fèi)了可用于其它圖像的比特。會(huì)造成或加重進(jìn)行中的比特不足的問(wèn)題,這很可能會(huì)損害后續(xù)圖像的質(zhì)量。
此處描述的各種技術(shù)和工具在確定如何有效地使用比特用于重新壓縮時(shí),使用來(lái)自或關(guān)于源格式壓縮視頻的信息。該信息可在對(duì)源格式壓縮視頻進(jìn)行解碼過(guò)程中或從另一來(lái)源獲取或?qū)С?。代碼轉(zhuǎn)換器中的規(guī)則定義了如何使用目標(biāo)格式句法元素并基于源格式信息作出編碼決策。結(jié)果,經(jīng)代碼轉(zhuǎn)換的圖像的質(zhì)量充分地匹配源格式壓縮圖像的質(zhì)量。在對(duì)比特率的任何總差異進(jìn)行調(diào)整之后,用于以目標(biāo)格式壓縮圖像的比特?cái)?shù)概略地追隨用于以源格式壓縮同一圖像的比特?cái)?shù)。
在某些實(shí)施例中,代碼轉(zhuǎn)換器使用諸如源格式句法元素等信息作為重新編碼期間的暗示(被實(shí)現(xiàn)為代碼轉(zhuǎn)換規(guī)則。這允許跨兩種壓縮格式維護(hù)某些對(duì)應(yīng)的句法元素和編碼決策。通過(guò)不將圖像壓縮到遠(yuǎn)低于其先前的質(zhì)量級(jí)別之下,代碼轉(zhuǎn)換器降低了引入新的人為干擾的風(fēng)險(xiǎn)(例如,由于太過(guò)于粗糙的量化)。代碼轉(zhuǎn)換器也避免分配比特來(lái)對(duì)噪聲編碼或保持低于可見(jiàn)閾值的質(zhì)量。在原始編碼器用有損壓縮保存比特的區(qū)域中,代碼轉(zhuǎn)換的質(zhì)量被降低,因?yàn)橐暂^高質(zhì)量進(jìn)行代碼轉(zhuǎn)換將不會(huì)對(duì)改進(jìn)原始內(nèi)容的保真度起任何作用,而是相反會(huì)引入量化噪聲或放大由第一代碼轉(zhuǎn)換引入的量化噪聲。由此,經(jīng)代碼轉(zhuǎn)換的視頻遵循容限內(nèi)輸入視頻的質(zhì)量和比特率模式。
在某些實(shí)施例中,代碼轉(zhuǎn)換器強(qiáng)迫目標(biāo)格式編碼器使用來(lái)自源格式壓縮視頻的圖像類型(如,I、P或B)用于以目標(biāo)格式壓縮的對(duì)應(yīng)圖像。這可幫助代碼轉(zhuǎn)換器匹配源和目標(biāo)格式之間的壓縮視頻中的質(zhì)量,并可幫助保持快進(jìn)、塊倒和其它訪問(wèn)功能。在某些實(shí)施例中,代碼轉(zhuǎn)換器在以目標(biāo)格式壓縮時(shí)使用來(lái)自源格式壓縮視頻的宏塊間/內(nèi)編碼類型?;蛘?,代碼轉(zhuǎn)換器使用來(lái)自源格式壓縮視頻的半幀/幀編碼決策信息。這些技術(shù)也可幫助代碼轉(zhuǎn)換器匹配源和目標(biāo)格式之間的壓縮視頻的質(zhì)量。同時(shí),代碼轉(zhuǎn)換器給予目標(biāo)格式編碼器充分利用額外的壓縮機(jī)會(huì)來(lái)降低總體比特率的自由度。
在某些實(shí)施例中,代碼轉(zhuǎn)換器將源格式壓縮視頻的量化級(jí)別映射到目標(biāo)格式壓縮視頻。例如,代碼轉(zhuǎn)換器將宏塊層量化級(jí)別映射到目標(biāo)格式壓縮視頻的對(duì)應(yīng)宏塊。當(dāng)格式是MPEG-2和WMV9時(shí),代碼轉(zhuǎn)換器可使用WMV9的差分量化器信令機(jī)制將MPEG-2量化級(jí)別映射到WMV9宏塊。
在某些實(shí)施例中,應(yīng)用對(duì)視頻編碼器的一次通過(guò)可變比特率模式的外部、成比例的速率控制,以用恒定或相對(duì)恒定的比特率產(chǎn)生輸出。這允許代碼轉(zhuǎn)換器以恒定的比特率模式或可變的比特率模式操作。
在各種示例實(shí)現(xiàn)中,視頻代碼轉(zhuǎn)換器執(zhí)行MPEG-2編碼的視頻到WMV9編碼的視頻的高保真轉(zhuǎn)換,同時(shí)對(duì)于典型的序列將比特率降低了20-30%。代碼轉(zhuǎn)換器保持了圖像和宏塊類型,并仔細(xì)地映射量化級(jí)別映射以減少代碼轉(zhuǎn)換損失。代碼轉(zhuǎn)換對(duì)于MPEG-2為主要格式的高質(zhì)量視頻生產(chǎn)者和廣播者尤其有用。其它應(yīng)用涉及用于一種類型消費(fèi)者設(shè)備(如,PC上的MPEG-2)和另一種類型的消費(fèi)者設(shè)備(如膝上電腦上的WMV9)的格式之間的代碼轉(zhuǎn)換。
可選地,代碼轉(zhuǎn)換器執(zhí)行除MPEG-2到WMV9之外的轉(zhuǎn)換。例如,代碼轉(zhuǎn)換器在MPEG-2和H.264之間、MPEG-2和VC-9之間或另一對(duì)視頻格式之間進(jìn)行轉(zhuǎn)換?;蛘?,代碼轉(zhuǎn)換器轉(zhuǎn)換除視頻之外的信息。除視頻代碼轉(zhuǎn)換器之外的處理工具可實(shí)現(xiàn)這些技術(shù)的一個(gè)或多個(gè)。
盡管此處在某些地方描述了各種代碼轉(zhuǎn)換技術(shù)作為單個(gè)、集成系統(tǒng)的一部分,然而這些技術(shù)可被單獨(dú)、可能與其它技術(shù)相組合地應(yīng)用。此外,盡管為了演示目的以特定的、順序次序描述了各種技術(shù)的操作,然而可以理解,這一描述方式包含了操作順序中微小的重新排列,除非要求特定的排序。例如,順序地描述的操作在某些情況下可以被重新排列或并發(fā)地執(zhí)行。此外,為簡(jiǎn)化的目的,流程圖可能未示出可結(jié)合其它技術(shù)使用特定技術(shù)的各種方式。
I.計(jì)算環(huán)境圖1示出了其中可實(shí)現(xiàn)所描述的實(shí)施例的合適的計(jì)算環(huán)境(100)的概括示例。計(jì)算環(huán)境(100)并非暗示對(duì)使用范圍或功能的任何限制,因?yàn)檫@些技術(shù)和工具可以在不同的通用或?qū)S糜?jì)算環(huán)境中實(shí)現(xiàn)。
參考圖1,計(jì)算環(huán)境(100)包括至少一個(gè)處理單元(110)和存儲(chǔ)器(120)。在圖1中,這一最基本的配置(130)包括在虛線內(nèi)。處理單元(110)執(zhí)行計(jì)算機(jī)可執(zhí)行指令,并且可以是真實(shí)或虛擬處理器。在多處理器系統(tǒng)中,多個(gè)處理單元執(zhí)行計(jì)算機(jī)可執(zhí)行指令以提高處理能力。存儲(chǔ)器(120)可以是易失性存儲(chǔ)器(如,寄存器、高速緩存、RAM)、非易失性存儲(chǔ)器(如,ROM、EEPROM、閃存等),或兩者的某一組合。存儲(chǔ)器(120)儲(chǔ)存實(shí)現(xiàn)高保真代碼轉(zhuǎn)換的軟件(180)。
計(jì)算環(huán)境可以具有額外的特征。在圖1中,計(jì)算環(huán)境(100)包括存儲(chǔ)(140)、一個(gè)或多個(gè)輸入設(shè)備(150)、一個(gè)或多個(gè)輸出設(shè)備(160)以及一個(gè)或多個(gè)通信連接(170)。諸如總線、控制器或網(wǎng)絡(luò)等互連機(jī)制(未示出)將計(jì)算環(huán)境(100)的組件互連。通常,操作系統(tǒng)軟件(未示出)為在計(jì)算環(huán)境(100)中執(zhí)行的其它軟件提供了操作環(huán)境,并協(xié)調(diào)了計(jì)算環(huán)境(100)中的組件的活動(dòng)。
存儲(chǔ)(140)可以是可移動(dòng)或不可移動(dòng)的,并包括磁盤、磁帶或磁盒、CD-ROM、CD-RW、DVD或可用于儲(chǔ)存信息并可在計(jì)算環(huán)境(100)內(nèi)訪問(wèn)的任一其它機(jī)制。存儲(chǔ)(140)儲(chǔ)存軟件(180)的指令。
輸入設(shè)備(150)可以是諸如鍵盤、鼠標(biāo)、筆或跟蹤球等觸摸式輸入設(shè)備、語(yǔ)音輸入設(shè)備、掃描設(shè)備或向計(jì)算環(huán)境(100)提供輸入的另一設(shè)備。對(duì)于音頻或視頻,輸入設(shè)備(150)可以是聲卡、視頻卡、TV調(diào)諧卡或接受模擬或數(shù)字形式的音頻或視頻輸入的類似設(shè)備,或者將音頻或視頻樣值讀入到計(jì)算環(huán)境(100)中的CD-ROM或CD-RW。輸出設(shè)備(160)可以是顯示器、打印機(jī)、揚(yáng)聲器、CD刻錄機(jī)或提供來(lái)自計(jì)算環(huán)境(100)的輸出的另一設(shè)備。
通信連接(170)啟用了通過(guò)通信介質(zhì)到另一計(jì)算實(shí)體的通信。通信介質(zhì)在已調(diào)制數(shù)據(jù)信號(hào)中傳達(dá)諸如計(jì)算機(jī)可執(zhí)行指令、音頻或視頻輸入或輸出或其它數(shù)據(jù)等信息。已調(diào)制數(shù)據(jù)信號(hào)是以對(duì)信號(hào)中的信息進(jìn)行編碼的方式設(shè)置或改變其一個(gè)或多個(gè)特征的信號(hào)。作為示例而非局限,通信介質(zhì)包括用電學(xué)、光學(xué)、RF紅外、聲學(xué)或其它載波實(shí)現(xiàn)的有線或無(wú)線技術(shù)。
這些技術(shù)和工具可在計(jì)算機(jī)可讀介質(zhì)的通用上下文中描述。計(jì)算機(jī)可讀介質(zhì)是可在計(jì)算環(huán)境內(nèi)訪問(wèn)的任何可用介質(zhì)。作為示例而非局限,對(duì)于計(jì)算環(huán)境(100),計(jì)算機(jī)可讀介質(zhì)包括存儲(chǔ)器(120)、存儲(chǔ)(140)、通信介質(zhì)以及上述的任一個(gè)的組合。
這些技術(shù)和工具可以在諸如包括在真實(shí)或虛擬目標(biāo)處理器上的計(jì)算環(huán)境中執(zhí)行的程序模塊中的計(jì)算機(jī)可執(zhí)行指令的通用上下文中描述。一般而言,程序模塊包括例程、程序、庫(kù)、對(duì)象、類、組件、數(shù)據(jù)結(jié)構(gòu)等等,它們執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。如各個(gè)實(shí)施例中所需要的,程序模塊的功能可以被組合或在程序模塊之間分離。用于程序模塊的計(jì)算機(jī)可執(zhí)行指令可以在本地或分布式計(jì)算環(huán)境中執(zhí)行。
為了演示的目的,詳細(xì)描述使用了諸如“確定”、“生成”、“調(diào)整”和“應(yīng)用”等術(shù)語(yǔ),來(lái)描述計(jì)算環(huán)境中的計(jì)算機(jī)操作。這些術(shù)語(yǔ)是計(jì)算機(jī)執(zhí)行的操作的高級(jí)抽象,不應(yīng)當(dāng)與人類所執(zhí)行的動(dòng)作混淆。對(duì)應(yīng)于這些術(shù)語(yǔ)的實(shí)際計(jì)算機(jī)操作可根據(jù)實(shí)現(xiàn)來(lái)變化。
II.視頻代碼轉(zhuǎn)換器圖2示出了其中可實(shí)現(xiàn)所描述的實(shí)施例的廣義視頻代碼轉(zhuǎn)換器(200)。圖2的代碼轉(zhuǎn)換器可被實(shí)現(xiàn)為如圖3所示的DirectX媒體對(duì)象[“DMO”](300)。DMO進(jìn)而可被結(jié)合到圖4的系統(tǒng)濾波器中。這一體系結(jié)構(gòu)簡(jiǎn)化了代碼轉(zhuǎn)換器的集成、提供了使用各種源格式解碼器的任一個(gè)的靈活性、并簡(jiǎn)化了額外功能的添加。
A.廣義視頻代碼轉(zhuǎn)換器代碼轉(zhuǎn)換器(200)具有各種模塊,包括源格式解碼器和比特流語(yǔ)法分析器(210)、重新編碼數(shù)據(jù)集處理器(220)、以及目標(biāo)格式編碼器(230)。代碼轉(zhuǎn)換器(200)內(nèi)各模塊之間示出的關(guān)系表明代碼轉(zhuǎn)換器(200)中的一般信息流;為簡(jiǎn)化的目的,未示出其它關(guān)系。
總體上,代碼轉(zhuǎn)換器(200)接收以源格式壓縮的視頻(205)、解碼該視頻、重新編碼該視頻、并產(chǎn)生以目標(biāo)格式壓縮的視頻(235)。例如,源格式是MPEG-2格式,而目標(biāo)格式是WMV9,但是其它格式對(duì)也是可能的。關(guān)于MPEG-2的附加細(xì)節(jié),請(qǐng)參考MPEG-2標(biāo)準(zhǔn)(也稱為H.262標(biāo)準(zhǔn)),其揭示通過(guò)引用結(jié)合于此。關(guān)于WMV9的附加細(xì)節(jié),請(qǐng)參考2003年7月18日提交的美國(guó)臨時(shí)專利申請(qǐng)序列號(hào)60/488,710,其揭示通過(guò)引用結(jié)合于此。
代碼轉(zhuǎn)換器(200)處理視頻圖像,視頻圖像可以是視頻幀、視頻半幀或幀和半幀的組合。代碼轉(zhuǎn)換器(200)中的解壓和壓縮是基于塊的,并使用諸如4∶2∶0等色彩格式,在這一情況下,每一宏塊[“MB”]包括4個(gè)8×8的亮度塊(有時(shí)候作為一個(gè)16×16的MB來(lái)處理)以及兩個(gè)8×8的色度塊?;蛘?,壓縮和解壓是基于對(duì)象的,使用不同的MB或塊格式,或在不同大小或配置的像素集上執(zhí)行操作。
參考圖2,源格式解碼器和比特流語(yǔ)法分析器(210)接收源格式的壓縮視頻(205)。解碼器(210)解碼視頻(205)、產(chǎn)生經(jīng)加碼的視頻(215)用于代碼轉(zhuǎn)換??墒褂孟嗤虿煌慕?jīng)解碼視頻作為由終端用戶預(yù)覽的視頻(213)。解碼器(210)的組件按壓縮格式和實(shí)現(xiàn)而變化,但是通常包括熵解碼器、反量化器、反頻率變換器和運(yùn)動(dòng)補(bǔ)償器。解碼器(210)完全解壓視頻(205)以產(chǎn)生用于代碼轉(zhuǎn)換的視頻(215)。
比特流語(yǔ)法分析器(210)可與解碼器(210)集成或分離,它提取用于對(duì)視頻重新編碼的數(shù)據(jù)元素集(217)。例如,這些元素包括圖像類型、MB幀內(nèi)/幀間編碼模式以及幀/半幀決策信息。對(duì)于MPEG-2句法元素的描述,請(qǐng)參考“SMPTE327M-2000-MPEG-2 Video Recoding Data Set(SMPTE 327M-3000-MPEG-2視頻記錄數(shù)據(jù)集)”,其揭示通過(guò)引用結(jié)合于此。或者,該數(shù)據(jù)元素集(217)包括其它和/或另外的元素。重新編碼數(shù)據(jù)處理器(220)處理并包裝提取的元素,用于控制重新壓縮。
目標(biāo)格式編碼器(230)依照目標(biāo)格式對(duì)視頻(215)進(jìn)行重新編碼。目標(biāo)格式編碼器(230)本身包括執(zhí)行實(shí)際壓縮的編碼器模塊(232),以及用于控制壓縮的質(zhì)量和/或速率的編碼器控制模塊(234)。編碼器控制模塊(234)將元素從源格式視頻轉(zhuǎn)換成用于編碼器模塊(232)的控制信號(hào)以及用于目標(biāo)格式壓縮視頻的等效參數(shù)。編碼器模塊(232)產(chǎn)生目標(biāo)格式的壓縮視頻(235),它可被路由到目標(biāo)格式解碼器模塊用于預(yù)覽目的,或被路由到另一模塊用于其它反饋目的。編碼器模塊(232)的組件可按壓縮格式和實(shí)現(xiàn)變化,但是通常包括圖像預(yù)處理器(用于采樣速率轉(zhuǎn)換、濾波等)、運(yùn)動(dòng)估計(jì)器/補(bǔ)償器、頻率變換器、量化器和熵編碼器,以及必要的解碼組件。
視頻代碼轉(zhuǎn)換器的特定實(shí)施例可使用廣義代碼轉(zhuǎn)換器(200)的變異或補(bǔ)充版本。根據(jù)所期望的代碼轉(zhuǎn)換的實(shí)現(xiàn)和類型,代碼轉(zhuǎn)換器的模塊可被添加、省略、分割成多個(gè)模塊、與其它模塊組合、和/或用類似的模塊替換。在一個(gè)替換實(shí)施例中,具有不同模塊和/或模塊的其它配置的代碼轉(zhuǎn)換器執(zhí)行所描述的技術(shù)的一個(gè)或多個(gè)。
B.代碼轉(zhuǎn)換器的內(nèi)部體系結(jié)構(gòu)圖3示出了DMO(300)的內(nèi)部體系結(jié)構(gòu)。總體上,DMO(300)的視頻模塊具有兩個(gè)輸入管腳和一個(gè)輸出管腳。輸入管腳用于未壓縮的視頻(302)和源格式(如,MPEG-2)壓縮視頻(304),而輸出管腳用于目標(biāo)格式(如,WMV9)壓縮視頻(342)。
目標(biāo)格式視頻編碼器(310)接收未壓縮的視頻(302),并在圖像準(zhǔn)備好用于壓縮時(shí)向源格式參數(shù)語(yǔ)法分析器(320)發(fā)送通知(312)。作為返回,編碼器(310)接收用于作出編碼決策的信息。通知/返回協(xié)議可被實(shí)現(xiàn)為兩個(gè)組件之間的回叫功能,或用某一其它機(jī)制來(lái)實(shí)現(xiàn)。與視頻編碼同步,當(dāng)進(jìn)行編碼時(shí),一次對(duì)幾個(gè)圖像提取信息。或者,代碼轉(zhuǎn)換器使用不同的定時(shí)。
語(yǔ)法分析器(320)接收對(duì)應(yīng)的源格式壓縮視頻(304),并從其中提取句法元素,以獲取關(guān)于源視頻中的視頻圖像的信息。語(yǔ)法分析器(320)從壓縮視頻(304)中提取任一或所有嵌入的句法元素,并導(dǎo)出元素。例如,語(yǔ)法分析器(320)提取SMPTE MPEG-2重新編碼數(shù)據(jù)集的子集?;蛘?,語(yǔ)法分析器(320)提取其它和/或另外的元素。根據(jù)句法元素,語(yǔ)法分析器(320)可作出編碼決策,并參數(shù)化句法元素和編碼決策用于作為返回參數(shù)(322)傳送給編碼器(310)。使用返回參數(shù)(322),編碼器(310)產(chǎn)生了目標(biāo)格式的壓縮視頻。
在單獨(dú)的路徑中,目標(biāo)格式(如,WMA9)音頻編碼器(330)接收未壓縮的音頻(328)并產(chǎn)生目標(biāo)格式的壓縮音頻。
隊(duì)列和緩沖區(qū)管理模塊(340)從編碼器(310、330)接收壓縮的視頻和壓縮的音頻,并產(chǎn)生目標(biāo)格式的壓縮視頻(342)和目標(biāo)格式的壓縮音頻(344)作為同步的輸出。隊(duì)列和緩沖區(qū)管理模塊(340)可包括用于速率控制目的的一個(gè)或多個(gè)緩沖區(qū),并可向編碼器(310、330)提供反饋以調(diào)節(jié)質(zhì)量和/或速率。
C.使用代碼轉(zhuǎn)換器的濾波器4示出了結(jié)合了代碼轉(zhuǎn)換器的DMO(300)作為濾波器的濾波器圖實(shí)現(xiàn)(400)。集體上,該系統(tǒng)實(shí)現(xiàn)了音頻和視頻的代碼轉(zhuǎn)換、壓縮音頻和視頻多路復(fù)用、以及作為最終輸出的有效輸出格式(如,ASF)文件的創(chuàng)建。
代碼轉(zhuǎn)換以多路復(fù)用的源格式(如,MPEG-2)文件作為輸入開(kāi)始。源格式的源濾波器(410)表示從網(wǎng)絡(luò)流、文件等播放出的源格式的視頻流。源格式流分路器(420)將源格式流分路成壓縮的音頻和壓縮的視頻子流,并將通過(guò)單個(gè)管腳這些傳遞到TEE(430)。TEE(430)將它在其輸入管腳上接收的信息傳遞到其每一輸出管腳。(接收信息的濾波器將使用某些信息,并忽略其余的信息。)源格式視頻解碼器(440)對(duì)壓縮的視頻子流進(jìn)行解碼,并產(chǎn)生未壓縮的視頻。源格式(如,AES)音頻解碼器(450)對(duì)壓縮的音頻子流進(jìn)行解碼,并產(chǎn)生未壓縮的音頻。
代碼轉(zhuǎn)換器濾波器(300)接收未壓縮的視頻和未壓縮的音頻,以及來(lái)自TEE(430)原始輸出,它包括源格式的壓縮視頻子流。代碼轉(zhuǎn)換器濾波器(300)的組件如上所述地操作,從而產(chǎn)生了目標(biāo)格式(如,WMV9)的壓縮視頻和目標(biāo)格式(如,WMA9)的壓縮音頻。記錄器/多路復(fù)用器(490)將此壓縮信息以及頭部信息一起組合到輸出格式文件中,該文件被儲(chǔ)存和/或發(fā)送。
盡管濾波器圖(400)可表示代碼轉(zhuǎn)換器的僅軟件實(shí)現(xiàn),然而其它實(shí)現(xiàn)使用了硬件、固件和軟件的組合用于代碼轉(zhuǎn)換,具有更快代碼轉(zhuǎn)換的預(yù)期益處。
III.保留類型句法元素在某些實(shí)施例中,視頻代碼轉(zhuǎn)換器在從源格式到目標(biāo)格式的代碼轉(zhuǎn)換期間保留了圖像類型、MB編碼類型、幀/半幀編碼決策信息、和/或其它信息。代碼轉(zhuǎn)換器使用這些信息用于目標(biāo)格式壓縮中的代碼決策和/或設(shè)置等效參數(shù)。這幫助了代碼轉(zhuǎn)換器匹配源格式壓縮視頻的質(zhì)量。同時(shí),代碼轉(zhuǎn)換器給予目標(biāo)格式編碼器對(duì)視頻作出各種其它編碼決策的自由度,以充分利用壓縮效率并降低總比特率。
圖5示出了在代碼轉(zhuǎn)換期間獲取并使用源格式壓縮視頻的重新編碼數(shù)據(jù)集元素的技術(shù)(500)。源格式解碼器對(duì)源格式的壓縮視頻進(jìn)行解壓(510),從而產(chǎn)生未壓縮的視頻。例如,解壓是完全解壓。
代碼轉(zhuǎn)換器獲取(520)源格式壓縮視頻的重新編碼數(shù)據(jù)集元素。為獲取(520)這些元素,代碼轉(zhuǎn)換器在解碼(如,從緩沖的副本中)之前、期間或之后對(duì)源格式壓縮視頻進(jìn)行語(yǔ)法分析。或者,單獨(dú)發(fā)信號(hào)通知或提供重新編碼數(shù)據(jù)集元素。這些元素是源格式的句法元素或從源格式句法元素導(dǎo)出的元素,例如,圖像類型值、幀內(nèi)/幀間MB編碼類型值、以及半幀/幀信息?;蛘?,代碼轉(zhuǎn)換器獲取其它和/或另外的元素。
目標(biāo)格式編碼器重新壓縮(530)未壓縮的視頻,從而產(chǎn)生目標(biāo)格式的壓縮視頻。在完成這一過(guò)程時(shí),編碼器在作出編碼決策時(shí)使用了重新編碼數(shù)據(jù)集。代碼轉(zhuǎn)換器也可傳遞目標(biāo)格式壓縮中的參數(shù)的某些元素。以此方式,編碼器在以目標(biāo)格式壓縮視頻時(shí)粗略地遵循源格式壓縮視頻的質(zhì)量。編碼器獨(dú)立地作出各種其它決策,以降低比特率而不惡化質(zhì)量。例如,編碼器作出各種預(yù)測(cè)模式?jīng)Q策和/或變換大小決策,以更好地將編碼適應(yīng)于本地化的模式,由此降低了比特率?;蛘?,編碼器用循環(huán)濾波、亮度補(bǔ)償、更多運(yùn)動(dòng)矢量和/或提高的運(yùn)動(dòng)矢量精度對(duì)運(yùn)動(dòng)補(bǔ)償計(jì)算新運(yùn)動(dòng)矢量,以改進(jìn)經(jīng)運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè),由此降低了預(yù)測(cè)余量的比特率。來(lái)自源格式壓縮視頻的運(yùn)動(dòng)矢量信息可在某些運(yùn)動(dòng)估計(jì)決策中使用(如,通過(guò)提供起始點(diǎn)來(lái)加快估計(jì)),并在其它運(yùn)動(dòng)估計(jì)決策中被忽略(如,考慮到循環(huán)濾波、亮度補(bǔ)償?shù)?,找出確切的運(yùn)動(dòng)矢量)。
代碼轉(zhuǎn)換器可在開(kāi)始重新壓縮(530)前完成解壓(510)。更常見(jiàn)的是,代碼轉(zhuǎn)換器對(duì)圖像、圖像組或視頻的其它持續(xù)時(shí)間并發(fā)地執(zhí)行技術(shù)(500)的各階段。
IV.映射量化級(jí)別在某些實(shí)施例中,視頻代碼轉(zhuǎn)換器在進(jìn)行代碼轉(zhuǎn)換時(shí)將源格式的壓縮視頻的量化級(jí)別映射到目標(biāo)格式的壓縮視頻。這一映射建立了源和目標(biāo)壓縮視頻格式中的量化器步長(zhǎng)的等價(jià)性,并有助于代碼轉(zhuǎn)換器保持質(zhì)量和降低代碼轉(zhuǎn)化損失。
圖6示出了在代碼轉(zhuǎn)換期間獲取和使用源格式壓縮視頻的量化級(jí)別的技術(shù)(600)。源格式解碼器對(duì)源格式壓縮視頻進(jìn)行解壓(610),從而產(chǎn)生了未壓縮的視頻。例如,解壓是完全解壓。
代碼轉(zhuǎn)換器獲取(620)源格式壓縮視頻的量化級(jí)別。為獲取(620)該級(jí)別,代碼轉(zhuǎn)換器在解碼之前、期間或之后對(duì)源格式壓縮視頻進(jìn)行語(yǔ)法分析?;蛘?,單獨(dú)地發(fā)信號(hào)通知或提供該級(jí)別。例如,量化級(jí)別是用于均勻量化的每MB量化步長(zhǎng)值?;蛘?,代碼轉(zhuǎn)換器獲取其它和/或附加類型的量化級(jí)別。
下一步,目標(biāo)格式編碼器重新壓縮(630)未壓縮的視頻,從而產(chǎn)生了目標(biāo)格式壓縮視頻。在完成這一過(guò)程時(shí),編碼器在作出量化決策時(shí)使用了所獲取的量化級(jí)別。例如,編碼器基于源格式壓縮視頻中對(duì)應(yīng)圖像的MB的每MB量化步長(zhǎng)值的平均值來(lái)設(shè)置圖像的量化值?;蛘撸幋a器基于源格式壓縮視頻中對(duì)應(yīng)MB的每MB量化步長(zhǎng)值設(shè)置MB的量化值。這幫助編碼器在以目標(biāo)格式壓縮時(shí)匹配源格式壓縮視頻的質(zhì)量。如前一章節(jié)中所描述的,編碼器可作出各種其它決策,以降低比特率,而不惡化質(zhì)量。
代碼轉(zhuǎn)換器可在開(kāi)始重新壓縮(630)前完成解壓(610)。更常見(jiàn)的是,代碼轉(zhuǎn)換器對(duì)圖像、圖像組或視頻的其它持續(xù)時(shí)間并發(fā)地執(zhí)行技術(shù)(600)的各階段。
V.代碼轉(zhuǎn)換中的速率控制在某些實(shí)施例中,視頻代碼轉(zhuǎn)換器在進(jìn)行代碼轉(zhuǎn)換時(shí)使用了速率控制。例如,速率控制允許代碼轉(zhuǎn)換器控制比特率以滿足因特網(wǎng)流傳送或其它應(yīng)用的恒定比特率約束,而同時(shí)保持接近源格式壓縮視頻的質(zhì)量。
圖7示出了代碼轉(zhuǎn)換中用于速率控制的技術(shù)(700)。源格式解碼器對(duì)源格式壓縮的視頻進(jìn)行解壓(710),從而產(chǎn)生了未壓縮視頻。例如,解壓是完全解壓。如前一章節(jié)中所描述的,代碼轉(zhuǎn)換器獲取(720)源格式壓縮視頻的量化級(jí)別。代碼轉(zhuǎn)換器為目標(biāo)格式的壓縮視頻中的一個(gè)單元設(shè)置目標(biāo)量化級(jí)別。例如,如前一章節(jié)中所描述的,編碼器為圖像或MB分配量化級(jí)別。
代碼轉(zhuǎn)換器基于一個(gè)或多個(gè)速率準(zhǔn)則調(diào)整(740)目標(biāo)量化級(jí)別(在閾值內(nèi))。閾值防止代碼轉(zhuǎn)換器偏離源格式壓縮視頻的對(duì)應(yīng)量化級(jí)別太上或太下,這有助于保持壓縮視頻質(zhì)量在目標(biāo)和源格式之間接近。速率準(zhǔn)則基于緩沖區(qū)充滿度級(jí)別、為該單元所分配的比特?cái)?shù)和實(shí)際用于編碼該單元的比特?cái)?shù)之間的偏差、和/或其它因素。為該單元所分配的比特?cái)?shù)可基于期望的比特率、圖像類型和/或圖像編碼復(fù)雜度,或者它可以基于源壓縮格式中的同一單元所使用的比特(適當(dāng)?shù)乜s放)。另外,編碼器可調(diào)整量化以考慮到復(fù)雜度的局部變化??傮w上,代碼轉(zhuǎn)換器令量化變得粗糙以向著目標(biāo)降低比特率,或令量化變得更精細(xì)以向著目標(biāo)提高比特率。代碼轉(zhuǎn)換器在實(shí)現(xiàn)目標(biāo)比特率時(shí)也可試圖控制質(zhì)量級(jí)別中的波動(dòng)。
在調(diào)整(740)了單元的量化級(jí)別之后,代碼轉(zhuǎn)換器確定(750)代碼轉(zhuǎn)換是否已完成,如果否,則通過(guò)為下一單元設(shè)置(730)目標(biāo)量化級(jí)別而繼續(xù)。代碼轉(zhuǎn)換器可在開(kāi)始設(shè)置(730)和調(diào)整(740)速率控制前完成解壓(710)。更常見(jiàn)的是,代碼轉(zhuǎn)換器對(duì)圖像、圖像組或視頻的其它持續(xù)時(shí)間并發(fā)地執(zhí)行技術(shù)(700)的各階段。
VI.組合的實(shí)現(xiàn)盡管可獨(dú)立并單獨(dú)地應(yīng)用上述技術(shù),然而它們也可在單個(gè)、集成的系統(tǒng)中組合。在一個(gè)實(shí)現(xiàn)中,代碼轉(zhuǎn)換器將MPEG-2視頻轉(zhuǎn)換成WMV9視頻。
代碼轉(zhuǎn)換器考慮MPEG-2句法和語(yǔ)義元素,并使用允許在MPEG-2壓縮和WMV9壓縮之間維持句法元素和代碼決策的一組規(guī)則。具體地,代碼轉(zhuǎn)換器使用MPEG-2重新編碼數(shù)據(jù)集(如在SMPTE 327M-2000中所描述的)的子集,它從解碼子系統(tǒng)中的MPEG-2視頻導(dǎo)出。代碼轉(zhuǎn)換器使用MPEG-2重新編碼數(shù)據(jù)作為編碼子系統(tǒng)中的起始點(diǎn),從而為從其編碼的WMV9作出了編碼決策,并將某些項(xiàng)推進(jìn)到WMV9比特流。由此,代碼轉(zhuǎn)換器依照WMV9編碼器的具體需求和代碼轉(zhuǎn)換情形保留或修改了各個(gè)MPEG-2編碼參數(shù)。
代碼轉(zhuǎn)換器解決了以下問(wèn)題。給定由MPEG-2編碼的一組視頻圖像,在用WMV9重新編碼同一圖像時(shí)代碼轉(zhuǎn)換器應(yīng)當(dāng)如何分配比特和質(zhì)量(量化)?在代碼轉(zhuǎn)換中,代碼轉(zhuǎn)換爭(zhēng)取避免(或至少顯著地降低)代碼轉(zhuǎn)換損失,而充分地保持質(zhì)量。代碼轉(zhuǎn)換器不消耗過(guò)多的比特來(lái)保持處于可感知性/可視性閾值之下的質(zhì)量。同時(shí),代碼轉(zhuǎn)換器充分利用了WMV9的額外壓縮效率來(lái)以低于MPEG-2壓縮輸入的比特率的比特率產(chǎn)生輸出。
代碼轉(zhuǎn)換器在單次通過(guò)中操作,在一次通過(guò)視頻序列中并發(fā)地解壓MPEG-2壓縮視頻、收集重新編碼數(shù)據(jù)集元素、以及重新壓縮視頻。具有充足的與實(shí)現(xiàn)相關(guān)的定制,單次通過(guò)代碼轉(zhuǎn)換可在各種流傳送情形中使用,其MPEG-2輸入和WMV9輸出是實(shí)時(shí)或幾乎實(shí)時(shí)的?;蛘?,代碼轉(zhuǎn)換器可對(duì)整個(gè)序列解壓,并儲(chǔ)存序列范圍的統(tǒng)計(jì)量,然后啟動(dòng)代碼轉(zhuǎn)換。這一多次通過(guò)代碼轉(zhuǎn)換可提高質(zhì)量,但是實(shí)質(zhì)上需要更多的計(jì)算時(shí)間,由此令在產(chǎn)品中實(shí)現(xiàn)變得很困難。
A.廣播和電纜應(yīng)用代碼轉(zhuǎn)換器的質(zhì)量保持方面對(duì)于廣播和電纜行業(yè)是有意義的。代碼轉(zhuǎn)換器啟用了現(xiàn)有內(nèi)容從MPEG-2到WMV9的有效轉(zhuǎn)換,以利用WMV9的效率,或簡(jiǎn)單地允許兩種格式間的互操作性。對(duì)無(wú)縫的MPEG-2到WMV9代碼轉(zhuǎn)換的潛在應(yīng)用覆蓋了各種各樣的情形,包括生產(chǎn)、編輯、存儲(chǔ)和消費(fèi)。本節(jié)主要著眼于對(duì)廣播和電纜“全過(guò)程(vertical)”的應(yīng)用,其商業(yè)操作跨越了生產(chǎn)和分發(fā)活動(dòng)的范圍。
1.用于VOD和PVR的內(nèi)容轉(zhuǎn)換內(nèi)容消費(fèi)的主導(dǎo)模型曾經(jīng)是內(nèi)容推(push)模型。當(dāng)今,內(nèi)容拉(pull)模型變得越來(lái)越常見(jiàn),其中,在消費(fèi)者決定觀看什么內(nèi)容以及何時(shí)觀看之后才傳送內(nèi)容。兩種技術(shù)促進(jìn)了這一改變。第一種技術(shù)是視頻點(diǎn)播[“VOD”],第二種技術(shù)是個(gè)人視頻記錄器[“PVR”]。
由于帶寬和存儲(chǔ)的節(jié)省,VOD和PVR都得益于MPEG-2-WMV9代碼轉(zhuǎn)換。VOD和PVR以大規(guī)模實(shí)現(xiàn),并且?guī)捁?jié)省的累積效果可導(dǎo)致大量的成本節(jié)省。采用VOD,操作員將MPEG-2壓縮拉伸到可接受質(zhì)量視頻的限制,因此代碼轉(zhuǎn)換到另一格式應(yīng)當(dāng)避免任何進(jìn)一步的質(zhì)量降低。當(dāng)代碼轉(zhuǎn)換器將MPEG-2 VOD內(nèi)容轉(zhuǎn)換成WMV9格式時(shí),它降低了比特率,同時(shí)保持了視頻質(zhì)量。
2.用于向空中播放(play to air)的內(nèi)容轉(zhuǎn)換視頻服務(wù)器視頻服務(wù)器日常地?cái)z取并播放出內(nèi)部地以MPEG-2格式儲(chǔ)存的視頻。被編輯的資產(chǎn)以MPEG-2重新攝取,或被代碼轉(zhuǎn)換成MPEG-2,以適合生產(chǎn)鏈。WMV9的壓縮效率降低了廣播設(shè)施內(nèi)的網(wǎng)絡(luò)帶寬和存儲(chǔ)要求。
代碼轉(zhuǎn)換器以低于原始的比特率將演播室攝取的內(nèi)容轉(zhuǎn)換成WMV9格式,而同時(shí)保持了質(zhì)量。這一重新格式化的內(nèi)容可用較小的覆蓋區(qū)(footprint)儲(chǔ)存,并用降低的網(wǎng)絡(luò)帶寬發(fā)送到播放服務(wù)器。廣播設(shè)施可使用WMV9內(nèi)容用于向空中的播放、空中備份或從遠(yuǎn)程站點(diǎn)的災(zāi)難恢復(fù)。在最后一個(gè)情況下,由于視頻和可能通過(guò)廣域網(wǎng)傳輸,來(lái)自降低的比特率的成本節(jié)省甚至更大。
3.用于內(nèi)容審閱的代理創(chuàng)建用于內(nèi)容審閱的代理創(chuàng)建當(dāng)前是WMV9的一個(gè)普及使用。盡管MPEG-2可對(duì)廣播設(shè)施內(nèi)視頻的提供和分發(fā)起作用,然而它本質(zhì)上不是流格式,并且當(dāng)應(yīng)用與較低分辨率和比特率時(shí)縮放較差。需要一種較低的速率代理來(lái)審閱被歸檔的內(nèi)容以及要被播放到空中的攝取內(nèi)容。
代碼轉(zhuǎn)換器創(chuàng)建了仍為原始幀速率的較低比特率和較低分辨率WMV9文件。在代理低比特率視頻中保持了原始視頻的時(shí)間碼。代碼轉(zhuǎn)換器可結(jié)合允許用戶預(yù)覽代理、作出剪切和其它編輯、以及創(chuàng)建用于編輯的決策列表的內(nèi)容播放器一起使用。
4.用于回傳運(yùn)輸傳送的內(nèi)容轉(zhuǎn)換廣播公司日常地使用回傳運(yùn)輸傳送來(lái)將內(nèi)容發(fā)送到其分支機(jī)構(gòu)用于本地空中廣播。內(nèi)容辛迪加組織者通過(guò)租用的光纖或衛(wèi)星信道使用回傳運(yùn)輸傳送來(lái)將視頻發(fā)送到其客戶。MPEG-2是用于這些和其它設(shè)施間傳輸?shù)囊环N常見(jiàn)中間傳送格式,它具有適當(dāng)?shù)臈l件訪問(wèn)解碼器。在回傳運(yùn)輸應(yīng)用中,即使小的比特率增益也可導(dǎo)致大的成本節(jié)省。中間格式是透明的,它為WMV9的采用提供了一種強(qiáng)健的推動(dòng)力,作為更有效的傳送格式。
B.使用圖像編碼類型MPEG-2和WMV9都使用了三種基本的圖像編碼類型幀內(nèi)[“I”]、單向預(yù)測(cè)[“P”]和雙向預(yù)測(cè)[“B”]。在MPEG-2和WMV9之間有兩種編碼和解碼這些圖像類型的差異。WMV9通常具有更好的壓縮效率,對(duì)同一質(zhì)量降低了比特率。因此,代碼轉(zhuǎn)換的目標(biāo)是在輸入視頻流和經(jīng)代碼轉(zhuǎn)換的視頻流之間不保持本質(zhì)上的比特分配。MPEG-2和WMV9之間的編碼工具差異消除了對(duì)這類嚴(yán)格追隨的需求。另一方面,來(lái)自MPEG-2壓縮視頻的每圖像和相對(duì)比特分配作為對(duì)WMV9編碼器的通用引導(dǎo)是有幫助的,因?yàn)閷?shí)質(zhì)上過(guò)分配比特將不會(huì)影響圖像質(zhì)量。實(shí)際上,使用圖像類型信息來(lái)引導(dǎo)代碼決策可顯著地提高代碼轉(zhuǎn)換效率。
每一MPEG-2圖像類型具有比特率和質(zhì)量含意,因?yàn)楦鶕?jù)圖像類型,在已編碼的圖像與原始圖像的保真度之間有顯著的差異。I圖像表示全刷新,它在運(yùn)動(dòng)補(bǔ)償、重建等中結(jié)束誤差傳播。代碼轉(zhuǎn)換誤差傳播也以新的I圖像結(jié)束。I圖像通常比其它圖像消耗更多的比特。由此,插入I圖像對(duì)比特率產(chǎn)生不利的影響,但是往往能通過(guò)降低傳播誤差來(lái)提高感知質(zhì)量。
代碼轉(zhuǎn)換器在若干情況下在源格式壓縮視頻和目標(biāo)格式壓縮視頻之間匹配I圖像類型。為改進(jìn)相對(duì)于代碼轉(zhuǎn)換誤差、發(fā)送誤差或其它誤差的傳播的彈性,代碼轉(zhuǎn)換器在目標(biāo)格式壓縮視頻中使用I圖像。或者,當(dāng)使用了GOP模式匹配時(shí)(見(jiàn)下文),代碼轉(zhuǎn)換器匹配I圖像類型。WMV9編碼器可將I圖像的確切位置向前或向后調(diào)整幾個(gè)圖像,以充分利用對(duì)序列專用的編碼效率。
P圖像使用前向預(yù)測(cè)(從先前的參考圖像),而B(niǎo)圖像可使用前向和/或后向預(yù)測(cè)。通常,P圖像比B圖像消耗更多的比特。P圖像可用作運(yùn)動(dòng)補(bǔ)償?shù)膮⒖紙D像。B圖像不被任何其它圖像參考,因此B圖像內(nèi)的誤差是本地化的。
當(dāng)允許目標(biāo)格式壓縮視頻的比特率匹配源格式壓縮視頻的比特率時(shí),代碼轉(zhuǎn)換器保留了最高質(zhì)量代碼轉(zhuǎn)換的圖像編碼類型。然而,對(duì)于降低了比特率的代碼轉(zhuǎn)換,這一圖像類型匹配可阻礙必要的比特率降低。因此,代碼轉(zhuǎn)換器在WMV9壓縮視頻中選擇性地用P圖像替代I圖像,或降低I圖像的頻率。通過(guò)用B圖像替換P圖像可以獲得進(jìn)一步的比特率降低。代碼轉(zhuǎn)換器在所有的代碼轉(zhuǎn)換情形中將B圖像映射到B圖像。
C.使用圖像模式組圖像組[“GOP”]是依照?qǐng)D像類型模式的圖像排列。MPEG-2 GOP可包括I圖像,之后跟隨若干P圖像作為錨(anchor),在錨之間的是B圖像,例如,I、B、B、P、B、B、P、B、B、P、B、B。MPEG-2視頻流通常使用大小為12幀的GOP用于電影內(nèi)容,或者15幀用于電視內(nèi)容。不同的GOP模式提供了對(duì)隨機(jī)訪問(wèn)、快進(jìn)、快倒或其它訪問(wèn)功能的各種級(jí)別的支持。相反,WMV9視頻通常具有更不頻繁的I圖像,默認(rèn)設(shè)置是每10秒插入一個(gè)I圖像。
代碼轉(zhuǎn)換器在各種情況下可在輸入視頻和經(jīng)代碼轉(zhuǎn)換的視頻之間匹配GOP模式(尤其是I圖像的位置)。當(dāng)在源和目標(biāo)格式壓縮視頻之間需要對(duì)應(yīng)的隨機(jī)訪問(wèn)、快進(jìn)、快倒或其它訪問(wèn)功能時(shí),代碼轉(zhuǎn)換器匹配GOP模式。作為對(duì)質(zhì)量的試探,匹配GOP模式往往導(dǎo)致匹配比特率,后者往往導(dǎo)致匹配質(zhì)量。一旦在WMV9視頻中依照GOP模式定位了I圖像,則可定位P圖像和B圖像以與MPEG-2視頻中的P和B圖像位置相符合。
D.使用幀/半幀編碼決策信息MPEG-2允許將整個(gè)序列編碼為幀或半幀。后者的使用較不常見(jiàn),因?yàn)榘霂幋a模式在壓縮快速移動(dòng)內(nèi)容時(shí)準(zhǔn)許幀補(bǔ)償效率的損失??傮w上,幀編碼經(jīng)常勝過(guò)半幀編碼。
當(dāng)對(duì)幀編碼的圖像進(jìn)行代碼轉(zhuǎn)換時(shí),代碼轉(zhuǎn)換器讓W(xué)MV9編碼器的內(nèi)部決策機(jī)制確定每一MB的半幀/幀編碼類型。代碼轉(zhuǎn)換器不自動(dòng)實(shí)施半幀編碼?;蛘?,代碼轉(zhuǎn)換器對(duì)所有的圖像類型在MB層或其它層匹配半幀/幀編碼類型決策。例如,當(dāng)MPEG-2壓縮視頻使用半幀圖像時(shí),代碼轉(zhuǎn)換器迫使WMV9編碼器使用隔行掃描的半幀圖像。以此方式匹配幀/半幀圖像類型期望能夠與代碼轉(zhuǎn)換中的類型匹配的其它示例一樣提高代碼轉(zhuǎn)換效率。
E.使用宏塊幀內(nèi)/幀間信息在MPEG-2和WMV9中,P圖像和B圖像中的MB可被幀內(nèi)編碼(不使用來(lái)自參考幀的預(yù)測(cè))或幀間編碼(使用來(lái)自參考幀的預(yù)測(cè))。例如,當(dāng)運(yùn)動(dòng)補(bǔ)償失敗或給出差的結(jié)果時(shí)(例如,大的預(yù)測(cè)余量),則使用幀內(nèi)編碼。當(dāng)MB包括對(duì)其在參考圖像中沒(méi)有好的匹配的新展示的內(nèi)容(如新對(duì)象或新展現(xiàn)的背景)時(shí),運(yùn)動(dòng)補(bǔ)償可能失敗。
在某些實(shí)現(xiàn)中,代碼轉(zhuǎn)換器保持幀內(nèi)/幀間編碼類型決策,并在WMV9視頻中在非I圖像的MB層上選擇性地重新應(yīng)用這些決策。用于在MB級(jí)匹配幀內(nèi)編碼類型的一個(gè)動(dòng)機(jī)是它確保了所考慮的MB的高質(zhì)量(以更高的比特率為代價(jià))。
F.在圖像級(jí)匹配量化MPEG-2和WMV9使用變換系數(shù)的均勻量化。系數(shù)按照比特精度、允許的量化器步長(zhǎng)數(shù)、以及允許的量化器步長(zhǎng)范圍被類似地表示。這便于將量化用作在MPEG-2視頻和WMV9視頻之間匹配質(zhì)量的驅(qū)動(dòng)機(jī)制。通過(guò)跟蹤MPEG-2壓縮視頻和WMV9壓縮視頻之間的量化級(jí)別,代碼轉(zhuǎn)換器引導(dǎo)WMV9編碼,使得不會(huì)使用過(guò)少或過(guò)多的比特。使用合適的比特?cái)?shù)來(lái)壓縮每一圖像有助于保持質(zhì)量并降低代碼轉(zhuǎn)換損失。
在代碼轉(zhuǎn)換器中,MPEG-2語(yǔ)法分析器為MPEG-2視頻中的給定圖像的每一MB提取量化器比例。對(duì)于WMV9視頻中的圖像的圖像級(jí)量化,代碼轉(zhuǎn)換器對(duì)MPEG-2視頻的圖像中非跳過(guò)MB的MPEG-2量化比例求平均值。代碼轉(zhuǎn)換器對(duì)WMV9圖像使用圖像級(jí)量化器比例的平均值(對(duì)圖像內(nèi)的MB使用圖像級(jí)量化器比例)。
如果代碼轉(zhuǎn)換器使用速率控制,則代碼轉(zhuǎn)換器可調(diào)整圖像級(jí)量化器比例來(lái)滿足當(dāng)前的速率約束。在任一情況下,代碼轉(zhuǎn)換器將量化級(jí)別維持在MPEG-2視頻中對(duì)應(yīng)的量化級(jí)別的容限之內(nèi)。
G.在宏塊級(jí)匹配量化圖像級(jí)量化級(jí)別控制不提供細(xì)粒度的質(zhì)量/速率控制。為更接近地在MPEG-2視頻和WMV9視頻之間進(jìn)行匹配,代碼轉(zhuǎn)換器在MB級(jí)匹配量化。WMV9允許在MB級(jí)設(shè)置量化器級(jí)別(有時(shí)候稱為DQUANT特征)。
采用DQUANT,WMV9編碼器可對(duì)個(gè)別的MB調(diào)整量化級(jí)別。代碼轉(zhuǎn)換器促使WMV9編碼器依照MPEG-2視頻的各自對(duì)應(yīng)的MB的量化器值來(lái)使用量化。如果代碼轉(zhuǎn)換器使用了速率控制,代碼轉(zhuǎn)換器可調(diào)整每一MB的量化器級(jí)別,以滿足當(dāng)前的速率約束。再一次,在任一情況下,代碼轉(zhuǎn)換器將量化級(jí)別維持在MPEG-2視頻的對(duì)應(yīng)量化級(jí)別的容限之內(nèi)。
WMV9MB跳過(guò)決策不被調(diào)整。換言之,不強(qiáng)制在WMV9視頻中要對(duì)MB編碼,這僅僅是因?yàn)閷?duì)應(yīng)的MB在MPEG-2視頻中被編碼。
H.恒定比特率控制在許多情況下,代碼轉(zhuǎn)換器以低于MPEG-2輸入的比特率的可變比特率產(chǎn)生輸出WMV9視頻。在其它情況下,代碼轉(zhuǎn)換器以等于或低于MPEG-2輸入的比特率的固定或相對(duì)固定比特率產(chǎn)生WMV9輸出。為此,盡管有變化的圖像類型和場(chǎng)景復(fù)雜度,代碼轉(zhuǎn)換器仍使用WMV9編碼器的默認(rèn)可變比特率模式之上的速率控制來(lái)幫助維持固定的輸出比特率。
代碼轉(zhuǎn)換器可使用三步驟處理用于速率控制(1)目標(biāo)比特分配、(2)基于虛擬緩沖區(qū)準(zhǔn)則對(duì)量化的粗糙控制、以及(3)精細(xì)自適應(yīng)控制以將量化值調(diào)整到本地變化。目標(biāo)比特分配可按圖像類型和圖像復(fù)雜度變化,例如,向I圖像分配比同一質(zhì)量的P圖像更多的比特,而向P圖像分配比同一質(zhì)量的B圖像更多的比特。提取的圖像類型值可用于向不同的圖像分配比特。向復(fù)雜圖像分配比同一質(zhì)量的簡(jiǎn)單圖像更多的比特,其中復(fù)雜度是根據(jù)對(duì)內(nèi)容或編碼結(jié)果的分析來(lái)估計(jì)的。
代碼轉(zhuǎn)換器使用來(lái)自WMV9編碼器的反饋來(lái)根據(jù)超額或不足的比特調(diào)整量化級(jí)別。具體地,代碼轉(zhuǎn)換器以與速率緩沖區(qū)充滿程度成比例地縮放量化步長(zhǎng)。這迫使輸出符合期望的速率,而避免了緩沖區(qū)上溢或下溢。當(dāng)輸出比特率目標(biāo)合理時(shí),代碼轉(zhuǎn)換器仍可實(shí)現(xiàn)無(wú)縫的代碼轉(zhuǎn)換。代碼轉(zhuǎn)換器也可應(yīng)用心理視覺(jué)(psychovisual)準(zhǔn)則。只要滿足了圖像、圖像組或內(nèi)容的其它持續(xù)時(shí)間的恒定比特率約束,代碼轉(zhuǎn)換器就可以給予WMV9編碼器在持續(xù)時(shí)間內(nèi)有效地分配比特以滿足質(zhì)量約束的靈活度。
1.第一CBR實(shí)現(xiàn)圖8示出了第一成比例速率控制機(jī)制(800),它使用了依照從目標(biāo)比特分配的偏差的加權(quán)。最終的比特分配按照要編碼的圖像或MB的加權(quán)量化器步長(zhǎng)(862)來(lái)表達(dá)。分配的比特和用于編碼圖像的實(shí)際比特之間的偏差用于縮放目標(biāo)量化器步長(zhǎng)大小(844),其中,目標(biāo)量化器步長(zhǎng)大小(844)從源格式壓縮視頻中導(dǎo)出。
若干策略對(duì)初始比特分配(802)都是可能的。一種簡(jiǎn)單的方法是基于比特率(比特/秒)除以幀速率(幀/秒)來(lái)向每一單元分配比特。對(duì)每一單元的比特分配也可基于源格式中使用的對(duì)應(yīng)的比特?cái)?shù),它由目標(biāo)與源比特率之比來(lái)縮放。或者,該機(jī)制如上所述地開(kāi)始,但是基于目標(biāo)格式的圖像類型修改分配,而仍符合恒定比特率準(zhǔn)則。
實(shí)際用于編碼圖像的比特(882)從為圖像分配的比特(802)中減去。這產(chǎn)生了所分配的比特和所使用的比特之間的偏差。為構(gòu)建滯后效應(yīng),使用從若干過(guò)去的圖像的偏差來(lái)影響量化器縮放。偏差在延遲緩沖區(qū)(820、830)中延遲,并由閾值縮放因子(822、832)加權(quán)。例如,閾值縮放因子是.5,以對(duì)先前的兩個(gè)圖像的每一個(gè)的偏差給予相同的權(quán)值?;蛘撸騼蓚€(gè)先前的圖像中較新近的那個(gè)給予更大的權(quán)值(如,.7與.3)。加權(quán)的偏差被組合,并被路由到閾值評(píng)估器(840)。
閾值評(píng)估器(840)接收調(diào)整的偏差,并計(jì)算量化縮放因子(842)以應(yīng)用于目標(biāo)量化步長(zhǎng)(844)。盡管圖8示出了量化步長(zhǎng)因子(842)為乘數(shù),然而該因子(842)也可以按照要添加的量或要從目標(biāo)量化步長(zhǎng)(844)中減去的量來(lái)表達(dá)。閾值評(píng)估器(840)可限制縮放的幅度來(lái)防止從一個(gè)圖像到另一個(gè)的圖像質(zhì)量中的大的變化。
2.第二CBR實(shí)現(xiàn)圖9示出了部分的第二成比例速率控制機(jī)制的偽代碼(900),它使用了依照緩沖區(qū)滿程度級(jí)別加權(quán)。在這一實(shí)現(xiàn)中,目標(biāo)比特分配g_nAvgBPF被假定為恒定的,且等于目標(biāo)比特率除以每秒的幀數(shù)。項(xiàng)pInvomingParameter表示編碼最后一個(gè)圖像所消耗的總比特?cái)?shù)。這些項(xiàng)調(diào)整了g_nCurrentBufferLever,它是以恒定的速率耗盡并以可變速率填滿的虛擬緩沖區(qū)的緩沖區(qū)級(jí)別。
緩沖區(qū)級(jí)別被限于0到g_nMaxBufSize的范圍,取決于應(yīng)用。在一種情況下,g_nMaxBufSize以目標(biāo)比特率被初始化成5秒的視頻。緩沖區(qū)充滿程度nBufferFraction通過(guò)將g_nCurrentBufferLevel除以g_nMaxBufSize來(lái)計(jì)算。緩沖區(qū)滿程度按照ADJUST_SCALE確定了縮放的量,它是實(shí)驗(yàn)上導(dǎo)出的值。例如,如果ADJUST_SCALE是20,則量化縮放因子q_nQPAdjust在-10和10的范圍內(nèi)變化,如果緩沖區(qū)半充滿,則nBufferFraction為.5,而q_nQPAdjust為0。當(dāng)緩沖區(qū)達(dá)到充滿狀態(tài)時(shí),q_nQPAdjust達(dá)到10,以向上縮放(或遞增)量化步長(zhǎng),由此促使比特率的下降以歸一化緩沖區(qū)充滿程度。另一方面,當(dāng)緩沖區(qū)達(dá)到空狀態(tài)時(shí),q_nQPAdjust達(dá)到-10,以向下縮放(或遞減)量化步長(zhǎng),由此促使比特率的提高以歸一化緩沖區(qū)充滿程度。在圖9的偽代碼(900)中,不使用過(guò)去已編碼的圖像之外的加權(quán)。
I.雜項(xiàng)系統(tǒng)問(wèn)題為在代碼轉(zhuǎn)換中產(chǎn)生增益,代碼轉(zhuǎn)換規(guī)則考慮其中使用代碼轉(zhuǎn)換器的系統(tǒng)環(huán)境的各種細(xì)節(jié)。這些細(xì)節(jié)中的其中一些影響圖像質(zhì)量。其它細(xì)節(jié)影響實(shí)現(xiàn)的速度和效率。
1.色彩采樣MPEG-2對(duì)隔行掃描和逐行掃描的圖像使用4∶2∶0的色彩采樣。另外,對(duì)標(biāo)準(zhǔn)定義視頻,支持4∶2∶2色彩采樣的單獨(dú)特性。WMV9對(duì)逐行掃描和隔行掃描視頻都使用4∶2∶0的色彩采樣。當(dāng)從4∶2∶0的MPEG-2視頻代碼轉(zhuǎn)換成4∶2∶0的WMV9視頻時(shí),代碼轉(zhuǎn)換器處理經(jīng)解碼的視頻而不進(jìn)行樣值轉(zhuǎn)換,這有助于避免在壓縮階段之外的人為干擾。
或者,目標(biāo)格式編碼器可使用另一色彩采樣格式,例如,用于隔行掃描視頻的4∶1∶1。如果從4∶2∶0采樣到4∶1∶1采樣的轉(zhuǎn)換是必要的,則代碼轉(zhuǎn)換器在垂直方向上按2的因子對(duì)色彩分量進(jìn)行上采樣(up-sample),并在垂直方向上執(zhí)行基于半幀的濾波以降低隔行掃描人為干擾。代碼轉(zhuǎn)換器在水平方向上使用標(biāo)準(zhǔn)半帶寬濾波對(duì)色彩分量進(jìn)行下采樣(donw-sample)。對(duì)于使用4∶2∶2色彩采樣的源視頻,4∶1∶1是最簡(jiǎn)單的目標(biāo)模式。
當(dāng)視頻在多種色彩采樣模式之間切換時(shí),代碼轉(zhuǎn)換器可只選擇并使用一種色彩采樣模式來(lái)避免連續(xù)地處理不同的色彩采樣過(guò)程的復(fù)雜度?;蛘撸a轉(zhuǎn)換器可在逐幀或其它基礎(chǔ)上切換色彩采樣模式。
代碼轉(zhuǎn)換器避免了色彩空間轉(zhuǎn)換,如在亮度/色度色彩空間和紅/綠/藍(lán)色彩空間中的轉(zhuǎn)換。MPEG-2和WMV9視頻都在亮度/色度空間中操作,因此色彩轉(zhuǎn)換是不必要的。
2. 3∶2下拉模式電視以大約每秒60個(gè)半幀顯示NTSC視頻。相反,電影內(nèi)容是以每秒24個(gè)視頻幀來(lái)顯示的。電視電影轉(zhuǎn)換過(guò)程將視頻從電視速率轉(zhuǎn)換到電影速率,而逆電視電影過(guò)程從電影轉(zhuǎn)換到電視。電影通常使用3∶2的下拉模式來(lái)轉(zhuǎn)換成電視速率,依照該模式,從第一電影幀中拉出三個(gè)半幀(例如,通過(guò)重復(fù)一個(gè)半幀),從下一電影幀中拉出兩個(gè)半幀,依此類推。
對(duì)于逆電視電影,MPEG-2允許在基本流中的3∶2下來(lái)模式信息。這允許顯示設(shè)備以每秒60個(gè)半幀來(lái)顯示內(nèi)容。類似地,WMV9執(zhí)行逆電視電影檢測(cè),并在基本解碼器之外處理。采用某些版本的WMV,逆電視電影信息在WMV比特流中發(fā)信號(hào)通知。然而,在其它版本中,基本流的句法不包括逆電視電影信息的元素,因此逆電視電影信息在ASF級(jí)上傳遞,并由回放設(shè)備的組件提取和應(yīng)用。
代碼轉(zhuǎn)換器如下地處理每秒24幀的電影內(nèi)容。代碼轉(zhuǎn)換器從MPEG-2視頻中導(dǎo)出3∶2下拉模式,作為兩個(gè)標(biāo)志“最高半幀優(yōu)先”和“重復(fù)第一個(gè)半幀”。這些標(biāo)志的其中一個(gè)或兩者被保存用于視頻的每一已編碼幀(在基礎(chǔ)流中或在ASF級(jí))。結(jié)果,模式中由于編輯或其它原因的打斷被保存。代碼轉(zhuǎn)換器用各種代碼轉(zhuǎn)換規(guī)則重新壓縮幀。在顯示設(shè)備處,以每秒約60個(gè)半幀使用保存的逆電視電影信息來(lái)播放內(nèi)容。這一解決方案對(duì)純電影內(nèi)容能起作用。對(duì)于混合的電影和電視內(nèi)容,代碼轉(zhuǎn)換器將電影內(nèi)容作為電視內(nèi)容來(lái)處理,以簡(jiǎn)化處理。
3.循環(huán)濾波循環(huán)濾波通過(guò)平滑量化相關(guān)的成塊的人為干擾的效應(yīng)來(lái)改進(jìn)圖像質(zhì)量。這令參考圖像能對(duì)后續(xù)的運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償起更好的作用。在WMV9中使用循環(huán)濾波能夠緩和來(lái)自前一壓縮周期的壓縮人為干擾,而不對(duì)這類人為干擾進(jìn)行循環(huán)濾波可降低后續(xù)壓縮的有效性。代碼轉(zhuǎn)換器允許在WMV9編碼器中進(jìn)行循環(huán)濾波。
4.量化比例和量化矩陣MPEG-2提供了比特流的序列頭部中的明確的量化矩陣,用于某些圖像類型。MPEG-2中的默認(rèn)量化矩陣對(duì)I圖像是非平面的,而對(duì)其它類型的圖像是平面的。相反,WMV9跨所有的圖像類型使用了平面量化矩陣,但是為平面量化0周圍的死區(qū)(dead zone)的寬度提供了兩種變異。(非平面量化在WMV9中仍可被實(shí)現(xiàn)為僅編碼器過(guò)程。)為代碼轉(zhuǎn)換的目的,對(duì)幀間編碼的塊使用較細(xì)的量化器比例看似不改進(jìn)圖像質(zhì)量,因?yàn)樵谙惹暗膲嚎s中丟失的信息不能用較細(xì)的量化來(lái)恢復(fù)。因此,作為一種代碼轉(zhuǎn)換規(guī)則,WMV9編碼器不超過(guò)對(duì)應(yīng)的MPEG-2編碼的MB的量化比例,因此在適當(dāng)時(shí)調(diào)整了量化矩陣。對(duì)于非幀間塊,WMV9編碼器使用的量化器比例可合理地超出對(duì)應(yīng)的MPEG-2MB的量化器比例,因?yàn)閃MV9支持更復(fù)雜的預(yù)測(cè)模式和更精確的運(yùn)動(dòng)矢量。代碼轉(zhuǎn)換器可基于期望的質(zhì)量設(shè)置在不同的死區(qū)寬度之間選擇,以精細(xì)地調(diào)整量化。
5.MV模式MPEG-2一般對(duì)每一MB提供了一個(gè)運(yùn)動(dòng)矢量。對(duì)于半幀編碼的MB,對(duì)MB的每一半幀生成一個(gè)運(yùn)動(dòng)矢量。WMV9允許每一MB多達(dá)四個(gè)運(yùn)動(dòng)矢量,這允許個(gè)更細(xì)粒度的運(yùn)動(dòng)補(bǔ)償,以適應(yīng)于本地化的變化,但是以額外的比特為代價(jià)來(lái)發(fā)信號(hào)通知運(yùn)動(dòng)矢量。代碼轉(zhuǎn)換器在WMV9編碼器中允許每一MB四個(gè)運(yùn)動(dòng)矢量。
6.快速整數(shù)變換
MPEG-2使用了標(biāo)準(zhǔn)的DCT。WMV9在某些模式中允許DCT,但是其它模式使用了快速的、基于整數(shù)的變換,它與使用MPEG-2風(fēng)格的DCT相比加快了處理速度。在質(zhì)量方面,快速的、基于整數(shù)的變換的總體性能類似于標(biāo)準(zhǔn)的DCT一快速的、基于整數(shù)的變換與DCT相比本質(zhì)上不改進(jìn)質(zhì)量。
然而,由于變換中的差異,從MPEG-2視頻中導(dǎo)出的DCT系數(shù)不能簡(jiǎn)單地在WMV9中重復(fù)使用。這不是顯著的性能損失,因?yàn)閃MV9在新的運(yùn)動(dòng)估計(jì)和補(bǔ)償之后無(wú)論如何都要重新計(jì)算變換系數(shù),并且因?yàn)榭焖俚?、基于整?shù)的變換在計(jì)算時(shí)間上有較小的性能損失。
7.亮度補(bǔ)償亮度補(bǔ)償允許將參考圖像中的像素重新映射到縮放和/或位移的像素值。這可幫助保存漸顯和漸隱序列中的比特。盡管MPEG-2不使用亮度補(bǔ)償,但是代碼轉(zhuǎn)換器可在WMV9編碼器中允許亮度補(bǔ)償。
8.可變大小變換WMV9編碼器可使用可變大小變化,它是從MPEG-2的顯著偏差。變換的塊大小是在局部自適應(yīng)性和編碼開(kāi)銷之間折衷的參數(shù)。當(dāng)期望對(duì)局部變化自適應(yīng)時(shí),較小的變換大小是較佳的。對(duì)變換大小的適當(dāng)選擇可降低阻尼振蕩和其它人為干擾,它們是由于對(duì)包括內(nèi)容邊界的塊的高頻變換系數(shù)的粗糙量化而引起的。
9.運(yùn)動(dòng)矢量精度在MPEG-2中,運(yùn)動(dòng)矢量被限于半像素的精度;在WMV9中允許四分之一像素精度的運(yùn)動(dòng)矢量。四分之一像素精度可能提供編碼效率中的增益。盡管在先前有損壓縮之后不能提高M(jìn)PEG-2視頻的質(zhì)量,但是四分之一像素精度的運(yùn)動(dòng)補(bǔ)償有助于以同一或更低的比特率保持質(zhì)量。
10.重疊和其它預(yù)測(cè)模式WMV9中對(duì)運(yùn)動(dòng)矢量、預(yù)測(cè)誤差和其它值的預(yù)測(cè)模式的豐富的可用性將WMV9從MPEG-2區(qū)分開(kāi)來(lái)。一般而言,代碼轉(zhuǎn)換器在WMV9編碼器中不限制這些模式的選擇。一個(gè)例外是對(duì)于半幀編碼的MB。如果MPEG-2視頻使用了MB的幀編碼,則迫使WMV9編碼器采用同一模式可降低代碼轉(zhuǎn)換損失。
11.長(zhǎng)或擴(kuò)展范圍的運(yùn)動(dòng)矢量長(zhǎng)或擴(kuò)展范圍的運(yùn)動(dòng)矢量在P圖像的水平和垂直方向上擴(kuò)展了運(yùn)動(dòng)矢量的范圍。
在MPEG-2比特流中發(fā)信號(hào)通知的運(yùn)動(dòng)矢量信息可用作代碼轉(zhuǎn)換期間WMV9編碼器中運(yùn)動(dòng)估計(jì)的起始點(diǎn),這可能加快WMV9編碼器中的運(yùn)動(dòng)估計(jì)過(guò)程的速度。采用MPEG-2運(yùn)動(dòng)矢量作為引導(dǎo),WMV9編碼器也可減小運(yùn)動(dòng)估計(jì)搜索范圍的大小。
VII.結(jié)果采用上述技術(shù),代碼轉(zhuǎn)換器實(shí)現(xiàn)了從MPEG-2到WMV9的高保真轉(zhuǎn)換。高保真轉(zhuǎn)換對(duì)無(wú)法容忍先前編碼的內(nèi)容的較低保真度表示的高質(zhì)量視頻的生產(chǎn)商和廣播商而言是極其重要的。作為參考點(diǎn),45dB的PSNR被認(rèn)為對(duì)于代碼轉(zhuǎn)換是高的,并且MPEG-2一WMV9代碼轉(zhuǎn)換器經(jīng)常超出該標(biāo)記。
第一組測(cè)試將MPEG-2的圖像大小與使用單純的代碼轉(zhuǎn)換器轉(zhuǎn)換的WMV9視頻的圖像大小進(jìn)行比較。對(duì)于WMV9視頻的許多圖像,所使用的比特?cái)?shù)要么遠(yuǎn)高于向?qū)?yīng)的MPEG-2圖像所使用的比特?cái)?shù),要么遠(yuǎn)低于該比特?cái)?shù)。
第二組測(cè)試將MPEG-2視頻的圖像大小與使用改進(jìn)的代碼轉(zhuǎn)換器轉(zhuǎn)換的WMV9視頻的圖像大小進(jìn)行比較。采用這一測(cè)試,每一WMV9圖像所使用的比特?cái)?shù)一致地低于每一MPEG-2圖像所使用的比特?cái)?shù),并且總體使用模式的峰值和谷值在兩種視頻序列之間匹配。
后續(xù)的測(cè)試在不進(jìn)行速率控制的情況下以各種比特率將單純代碼轉(zhuǎn)換的質(zhì)量和改進(jìn)的代碼轉(zhuǎn)換的質(zhì)量進(jìn)行比較。這些測(cè)試示出改進(jìn)的代碼轉(zhuǎn)換的充分和一致增益優(yōu)于對(duì)同一MPEG-2內(nèi)容的單純代碼轉(zhuǎn)換。對(duì)于這些測(cè)試,對(duì)于I圖像和P圖像,MPEG-2量化器比例參數(shù)在WMV9視頻中在MB級(jí)上匹配。對(duì)于B圖像,使用了圖像級(jí)匹配。測(cè)試了短(5秒)和長(zhǎng)(30秒)序列。WMV9視頻所得的比特率平均大約比MPEG-2視頻低25%。對(duì)于單純代碼轉(zhuǎn)換和改進(jìn)的代碼轉(zhuǎn)換兩者,與MPEG-2視頻相比,對(duì)于經(jīng)代碼轉(zhuǎn)換的WMV9視頻,平均PSNR超過(guò)40dB。與單純代碼轉(zhuǎn)換相比,改進(jìn)的代碼轉(zhuǎn)換對(duì)于亮度一致地平均要好.5dB(對(duì)于色度平均1dB)。這一差異對(duì)應(yīng)于10%和20%之間的比特率增益,這意味著與改進(jìn)的代碼轉(zhuǎn)換相比,在單純代碼轉(zhuǎn)換中必須使用多10%到20%的比特來(lái)獲取質(zhì)量。觀察者測(cè)試確認(rèn)了這些結(jié)果,這些觀察者將改進(jìn)的代碼轉(zhuǎn)換結(jié)果一致地標(biāo)識(shí)為質(zhì)量上優(yōu)于同一比特率的單純代碼轉(zhuǎn)換結(jié)果的質(zhì)量。
其它測(cè)試對(duì)于MB編碼類型將使用代碼轉(zhuǎn)換規(guī)則和不使用代碼轉(zhuǎn)換規(guī)則的結(jié)果進(jìn)行比較。對(duì)于非I圖像,代碼轉(zhuǎn)換器迫使MPEG-2幀內(nèi)MB在WMV9視頻中具有對(duì)應(yīng)的幀內(nèi)MB,但是允許WMV9編碼器決定如何對(duì)在MPEG-2視頻中為幀間類型的MB進(jìn)行編碼。代碼轉(zhuǎn)換器也在所有圖像類型中匹配半幀和幀編碼決策。采用這些規(guī)則,改進(jìn)的代碼轉(zhuǎn)換的質(zhì)量要比單純代碼轉(zhuǎn)換的質(zhì)量高得多,但是與不采用宏塊類型規(guī)則相比,PSNR增益較小。PSNR改進(jìn)對(duì)于亮度平均在.2dB和.3dB之間(對(duì)于色度為.8dB)。
其它測(cè)試結(jié)合其它規(guī)則評(píng)估了成比例的速率控制。發(fā)現(xiàn)輸出比特率在目標(biāo)速率參數(shù)的1%之內(nèi),同時(shí)避免了緩沖區(qū)上溢和下溢。如果輸出比特率被設(shè)為充分低于匹配MPEG-2量化級(jí)別時(shí)所獲取的比特率,則代碼轉(zhuǎn)換器的質(zhì)量保持方面失敗。然而,對(duì)于調(diào)節(jié)速率和質(zhì)量,速率控制仍是一個(gè)有用的特征。作為規(guī)則,代碼轉(zhuǎn)換器的輸出可被設(shè)為大約比輸入的壓縮視頻低25%的比特率,以利用WMV9編碼器的壓縮效率,而同時(shí)仍保持質(zhì)量和避免代碼轉(zhuǎn)換損失。
參考所描述的實(shí)施例描述并示出了本發(fā)明的原理之后,可以認(rèn)識(shí)到,所描述的實(shí)施例可以在不脫離這些原理的情況下在排列和細(xì)節(jié)上進(jìn)行修改。應(yīng)當(dāng)理解,此處所描述的程序、過(guò)程或方法不與任何特定類型的計(jì)算環(huán)境相關(guān)或限于任何特定類型的計(jì)算環(huán)境,除非另外指明。各種類型的通用或?qū)S糜?jì)算環(huán)境可用于此處所描述的教導(dǎo)或依照此處描述的教導(dǎo)來(lái)執(zhí)行操作。以軟件示出的所描述的實(shí)施例的元素可以用硬件來(lái)實(shí)現(xiàn),反之亦然。
鑒于可應(yīng)用本發(fā)明的原理的許多可能的實(shí)施例,將本發(fā)明要求保護(hù)為所有這樣的實(shí)施例都落入所附權(quán)利要求書(shū)及其等效技術(shù)方案的范圍和精神之內(nèi)。
權(quán)利要求
1.一種用于將視頻從源格式代碼轉(zhuǎn)換成較低比特率的目標(biāo)格式的方法,其特征在于,所述方法包括獲取源格式的壓縮視頻的多個(gè)單元的類型值;解壓源格式的壓縮視頻;以及重新壓縮所述視頻以產(chǎn)生目標(biāo)格式的壓縮視頻,包括至少部分地基于所獲取的類型作出第一編碼決策以幫助在目標(biāo)格式和源格式的相應(yīng)壓縮視頻之間進(jìn)行匹配,并還包括獨(dú)立地作出第二編碼決策以利用目標(biāo)格式的壓縮效率來(lái)降低比特率。
2.如權(quán)利要求1所述的方法,其特征在于,獲取所述類型值包括對(duì)所述源格式壓縮視頻進(jìn)行語(yǔ)法分析。
3.如權(quán)利要求1所述的方法,其特征在于,獨(dú)立地作出第二編碼決策包括計(jì)算用于運(yùn)動(dòng)補(bǔ)償?shù)男逻\(yùn)動(dòng)矢量,并且其中,對(duì)來(lái)自所述源格式壓縮視頻的運(yùn)動(dòng)矢量信息的使用加快了用于計(jì)算所述新運(yùn)動(dòng)矢量的運(yùn)動(dòng)估計(jì)的速度。
4.如權(quán)利要求3所述的方法,其特征在于,所述運(yùn)動(dòng)估計(jì)和補(bǔ)償使用了循環(huán)濾波和亮度補(bǔ)償。
5.如權(quán)利要求3所述的方法,其特征在于,所述運(yùn)動(dòng)估計(jì)和補(bǔ)償使用每宏塊多達(dá)四個(gè)運(yùn)動(dòng)矢量,以及四分之一像素的運(yùn)動(dòng)矢量精度。
6.如權(quán)利要求1所述的方法,其特征在于,獨(dú)立地作出第二編碼決策包括選擇可變大小頻率變換的大小。
7.如權(quán)利要求1所述的方法,其特征在于,獨(dú)立地作出第二編碼決策包括為運(yùn)動(dòng)矢量或預(yù)測(cè)余量選擇預(yù)測(cè)模式。
8.如權(quán)利要求1所述的方法,其特征在于,所述解壓包括對(duì)所述壓縮視頻進(jìn)行全解壓。
9.如權(quán)利要求1所述的方法,其特征在于,所述源格式的壓縮和所述目標(biāo)格式的壓縮使用了不同的頻率變換。
10.如權(quán)利要求1所述的方法,其特征在于,所述源格式的壓縮和所述目標(biāo)格式的壓縮使用了不同的熵編碼。
11.一種儲(chǔ)存計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令用于促使用其編程的計(jì)算機(jī)系統(tǒng)執(zhí)行權(quán)利要求1所述的方法。
12.如權(quán)利要求1所述的方法,其特征在于,所述多個(gè)單元是視頻圖像,并且其中,所述類型值是包括I圖像、P圖像和B圖像的圖像類型值。
13.如權(quán)利要求1所述的方法,其特征在于,對(duì)于基本上所有的一個(gè)或多個(gè)視頻圖像,所述目標(biāo)格式壓縮視頻的比特率在逐圖像的基礎(chǔ)上等于或低于所述源格式壓縮視頻的比特率。
14.如權(quán)利要求1所述的方法,其特征在于,所述多個(gè)單元是宏塊,并且其中,所述多個(gè)類型值是宏塊編碼類型值。
15.如權(quán)利要求14所述的方法,其特征在于,所述宏塊包括幀內(nèi)編碼宏塊和幀間編碼宏塊,并且其中,所述宏塊編碼類型值包括幀內(nèi)和幀間。
16.如權(quán)利要求1所述的方法,其特征在于,所述源格式是MPEG-2格式,并且所述目標(biāo)格式是WMV9格式。
17.一種將視頻從第一格式代碼轉(zhuǎn)換成較低比特率的第二格式的方法,其特征在于,所述方法包括獲取所述第一格式壓縮視頻的多個(gè)圖像的圖像類型值;對(duì)所述第一格式壓縮視頻完全解壓;以及重新壓縮所述視頻以產(chǎn)生第二格式的壓縮視頻,包括至少部分地基于所獲得的圖像類型值作出圖像類型決策,還包括執(zhí)行運(yùn)動(dòng)估計(jì)和補(bǔ)償以利用第二格式的壓縮效率來(lái)降低比特率。
18.如權(quán)利要求17所述的方法,其特征在于,所述第二格式的運(yùn)動(dòng)估計(jì)和補(bǔ)償與所述第一格式的運(yùn)動(dòng)估計(jì)和補(bǔ)償在循環(huán)濾波的使用、每一宏塊的運(yùn)動(dòng)矢量數(shù)、亮度補(bǔ)償?shù)氖褂煤?或運(yùn)動(dòng)矢量精度方面不同。
19.如權(quán)利要求17所述的方法,其特征在于,所述第一格式和所述第二格式使用不同的頻率變換。
20.一種儲(chǔ)存了計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令用于促使用其編程的計(jì)算機(jī)系統(tǒng)執(zhí)行權(quán)利要求17所述的方法。
21.如權(quán)利要求17所述的方法,其特征在于,所述圖像類型值包括I圖像、P圖像和B圖像。
22.如權(quán)利要求17所述的方法,其特征在于,所述重新壓縮包括使用所述圖像類型值以在所述第一格式的壓縮視頻和所述第二格式的壓縮視頻之間匹配一個(gè)或多個(gè)圖像位置。
23.如權(quán)利要求17所述的方法,其特征在于,所述重新壓縮包括使用所述圖像類型以在所述第一格式的壓縮視頻和所述第二格式的壓縮視頻之間匹配圖像結(jié)構(gòu)組。
24.一種對(duì)視頻進(jìn)行代碼轉(zhuǎn)換的方法,其特征在于,包括獲取第一格式的壓縮視頻的幀/半幀信息;對(duì)所述第一格式的壓縮視頻完全解壓;以及重新壓縮所述視頻以產(chǎn)生與所述第一格式不同的第二格式的壓縮視頻,包括至少部分地基于所獲取的幀/半幀信息作出編碼決策以幫助將所述第二格式的壓縮視頻的質(zhì)量與所述第一格式的壓縮視頻的質(zhì)量進(jìn)行匹配。
25.如權(quán)利要求24所述的方法,其特征在于,所述重新壓縮包括在所述第二格式的壓縮視頻中在宏塊級(jí)設(shè)置半幀/幀類型。
26.如權(quán)利要求24所述的方法,其特征在于,所述重新壓縮包括在所述第二格式的壓縮視頻中在圖像層設(shè)置半幀/幀類型。
27.如權(quán)利要求24所述的方法,其特征在于,所述第二格式的壓縮視頻具有的比特率低于所述第一格式的壓縮視頻的比特率。
28.如權(quán)利要求24所述的方法,其特征在于,所述重新壓縮包括執(zhí)行運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償以利用所述第二格式的壓縮效率來(lái)降低比特率。
29.一種儲(chǔ)存計(jì)算機(jī)可讀指令的計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)可讀指令用于促使用其編程的計(jì)算機(jī)系統(tǒng)執(zhí)行權(quán)利要求24所述的方法。
30.一種對(duì)視頻進(jìn)行代碼轉(zhuǎn)換的方法,其特征在于,包括獲取第一格式的壓縮視頻的量化級(jí)別;對(duì)所述第一格式的壓縮視頻解壓;以及重新壓縮所述視頻以產(chǎn)生第二格式的壓縮視頻,包括至少部分地基于所獲取的量化級(jí)別設(shè)置所述第二格式壓縮視頻的量化級(jí)別,其中,所述第一格式的壓縮和所述第二格式的壓縮使用了不同的頻率變換。
31.如權(quán)利要求30所述的方法,其特征在于,所述第一格式的壓縮使用了DCT,而所述第二格式的壓縮使用了快速整數(shù)變換。
32.一種儲(chǔ)存計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令用于促使由其編程的計(jì)算機(jī)系統(tǒng)執(zhí)行權(quán)利要求30所述的方法。
33.如權(quán)利要求30所述的方法,其特征在于,所獲取的量化級(jí)別用于所述第一格式的壓縮視頻的宏塊。
34.如權(quán)利要求30所述的方法,其特征在于,所述重新壓縮包括至少部分地基于所獲取的量化級(jí)別的平均值設(shè)置所述第二格式壓縮視頻的視頻圖像的量化級(jí)別。
35.如權(quán)利要求30所述的方法,其特征在于,所述重新壓縮包括至少部分地基于所獲取的量化級(jí)別之一設(shè)置所述第二格式壓縮視頻的宏塊的量化級(jí)別。
36.如權(quán)利要求30所述的方法,其特征在于,還包括在應(yīng)用所述量化級(jí)別前調(diào)整所獲取的量化級(jí)別用于速率控制。
37.如權(quán)利要求30所述的方法,其特征在于,考慮所獲取的量化級(jí)別有助于將所述第二格式壓縮視頻的質(zhì)量與所述第一格式的壓縮視頻的質(zhì)量進(jìn)行匹配。
38.一種對(duì)視頻進(jìn)行代碼轉(zhuǎn)換的方法,其特征在于,包括獲取第一格式的壓縮視頻的多個(gè)宏塊的每宏塊量化級(jí)別;對(duì)所述第一格式壓縮視頻進(jìn)行解壓;以及重新壓縮所述視頻以產(chǎn)生第二格式的壓縮視頻,包括至少部分地基于所獲取的量化級(jí)別設(shè)置所述第二格式的壓縮視頻的對(duì)應(yīng)宏塊的量化級(jí)別。
39.一種儲(chǔ)存計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令用于促使用其編程的計(jì)算機(jī)系統(tǒng)執(zhí)行權(quán)利要求38所述的方法。
40.如權(quán)利要求38所述的方法,其特征在于,所述第二格式使用了在宏塊層的差分量化級(jí)別信令。
41.如權(quán)利要求38所述的方法,其特征在于,所述量化級(jí)別是量化步長(zhǎng)大小。
42.如權(quán)利要求38所述的方法,其特征在于,還包括在應(yīng)用所述量化級(jí)別之前調(diào)整所獲取的量化級(jí)別用于速率控制。
43.一種對(duì)視頻進(jìn)行代碼轉(zhuǎn)換的方法,其特征在于,包括獲取第一格式的壓縮視頻的量化級(jí)別;對(duì)所述第一格式的壓縮視頻進(jìn)行解壓;以及重新壓縮所述視頻以產(chǎn)生第二格式的壓縮視頻,包括將所述第二格式的壓縮視頻量化到可與所獲取的量化級(jí)別比較的程度,以減少所述第一和第二格式的相應(yīng)壓縮視頻之間的質(zhì)量差異,其中,所述第二格式的壓縮效率與所述第一格式的壓縮視頻相比,充分地降低了所述第二格式的壓縮視頻的比特率。
44.如權(quán)利要求43所述的方法,其特征在于,包括對(duì)所述第一和第二格式的相應(yīng)壓縮視頻,在圖像級(jí)跟蹤量化或比特率。
45.如權(quán)利要求43所述的方法,其特征在于,包括對(duì)所述第一和第二格式的相應(yīng)壓縮視頻,在宏塊級(jí)跟蹤量化或比特率。
46.如權(quán)利要求42所述的方法,其特征在于,所述第二格式的壓縮效率與所述第一格式的壓縮視頻相比,將所述第二格式的壓縮視頻的比特率降低了至少20%。
47.如權(quán)利要求43所述的方法,其特征在于,所述第二格式的壓縮視頻和所述第一格式的壓縮視頻之間的質(zhì)量總體差異低于可視性閾值。
48.如權(quán)利要求43所述的方法,其特征在于,所述第二格式的運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償在循環(huán)濾波的使用、每一宏塊的運(yùn)動(dòng)矢量數(shù)、亮度補(bǔ)償?shù)氖褂煤?或運(yùn)動(dòng)矢量精度方面不同于所述第一格式的運(yùn)動(dòng)估計(jì)和補(bǔ)償。
49.如權(quán)利要求43所述的方法,其特征在于,所述第二格式的壓縮使用了可變大小的頻率變換。
50.如權(quán)利要求43所述的方法,其特征在于,所述第二格式的壓縮和所述第一格式的壓縮對(duì)運(yùn)動(dòng)矢量和/或預(yù)測(cè)余量使用了不同的預(yù)測(cè)模式。
51.如權(quán)利要求43所述的方法,其特征在于,所述第二格式的壓縮和所述第一格式的壓縮使用了不同的熵編碼。
52.一種儲(chǔ)存計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令用于促使用其編程的計(jì)算機(jī)系統(tǒng)執(zhí)行權(quán)利要求43所述的方法。
53.一種對(duì)視頻進(jìn)行代碼轉(zhuǎn)換的方法,其特征在于,包括對(duì)第一格式的壓縮視頻進(jìn)行解壓;以及使用具有默認(rèn)一次通過(guò)可變比特率編碼的第二格式編碼器重新壓縮所述視頻以產(chǎn)生第二格式的壓縮視頻,包括通過(guò)與一個(gè)或多個(gè)速率控制準(zhǔn)則成比例地改變質(zhì)量和比特率來(lái)調(diào)節(jié)所述第二格式編碼器的壓縮參數(shù),以產(chǎn)生恒定或相對(duì)恒定比特率的第二格式壓縮視頻。
54.如權(quán)利要求53所述的方法,其特征在于,所述一個(gè)或多個(gè)速率控制準(zhǔn)則至少部分地基于緩沖區(qū)充滿程度值。
55.如權(quán)利要求53所述的方法,其特征在于,所述一個(gè)或多個(gè)速率控制準(zhǔn)則至少部分地基于分配的比特和對(duì)先前的視頻所使用的比特之間的偏差。
56.一種儲(chǔ)存計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)可執(zhí)行指令用于促使用其編程的計(jì)算機(jī)系統(tǒng)執(zhí)行權(quán)利要求53所述的方法。
全文摘要
描述了一種高保真代碼轉(zhuǎn)換技術(shù)。例如,一視頻代碼轉(zhuǎn)換器獲取源格式壓縮視頻的重新編碼數(shù)據(jù)集元素,并在以目標(biāo)格式壓縮該視頻時(shí)使用這些元素用于編碼決策和/或等效的參數(shù)。這允許跨兩種格式維持句法元素和編碼決策,包括圖像類型、幀內(nèi)/幀間宏塊編碼類型、半幀/幀編碼決策和/或量化級(jí)別。這幫助了代碼轉(zhuǎn)換器在源和目標(biāo)格式之間匹配壓縮視頻的質(zhì)量,從而降低了代碼轉(zhuǎn)換損失。同時(shí),代碼轉(zhuǎn)換器給予目標(biāo)格式編碼器充分利用額外的壓縮機(jī)會(huì)來(lái)降低總體比特率的自由度。代碼轉(zhuǎn)換器可應(yīng)用成比例的速率控制,以產(chǎn)生恒定或相對(duì)恒定比特率的輸出。
文檔編號(hào)H03M7/36GK1684518SQ20051006664
公開(kāi)日2005年10月19日 申請(qǐng)日期2005年4月15日 優(yōu)先權(quán)日2004年4月15日
發(fā)明者J·永格施瓦, K·慕克吉, R·D·格林 申請(qǐng)人:微軟公司