專利名稱:用于在單個(gè)盤上的標(biāo)準(zhǔn)清晰度和高清晰度視頻格式的混合可伸縮編碼器、方法和媒體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻編碼解碼器,具體涉及用于在單個(gè)數(shù)字視頻盤上集合水平數(shù)據(jù)的標(biāo)準(zhǔn)清晰度和高清晰度版本的視頻編碼解碼器。
背景技術(shù):
視頻數(shù)據(jù)一般被視頻編碼器和解碼器(統(tǒng)稱為“CODEC”)以比特流的形式處理,并且被存儲(chǔ)在數(shù)字視頻盤(“DVD”)媒體上。存在一種使用MPEG-2解碼器的紅色激光DVD播放機(jī)的實(shí)際安裝用戶方。用于MPEG-2編碼的紅色激光器件導(dǎo)致足夠支持通常的電影的標(biāo)準(zhǔn)清晰度(“SD”)版本的存儲(chǔ)容量,同時(shí)對(duì)于在同一盤上支持這些電影的高清晰度(“HD”)版本存在極大興趣。不幸的是,使用MPEG-2的紅色激光播放機(jī)的安裝用戶方不足以支持保存通常電影的標(biāo)準(zhǔn)清晰度和高清晰度版本的存儲(chǔ)容量。
紅色激光和藍(lán)色激光技術(shù)已經(jīng)被考慮來(lái)達(dá)到足以支持高清晰度記錄(“HD-DVD”)的存儲(chǔ)容量。藍(lán)色激光技術(shù)具有使用MPEG-2來(lái)提供用于在一個(gè)盤上保存多個(gè)高數(shù)量HD電影的足夠存儲(chǔ)量的優(yōu)點(diǎn),但是使用藍(lán)色激光來(lái)取代紅色激光器件的安裝用戶方在經(jīng)濟(jì)上還不可行。因此,需要這樣的一種可以用于HD-DVD的編碼方案,它也可以支持在由使用MPEG-2解碼器的當(dāng)前的紅色激光器件可讀的同一盤上的SD-DVD。
因此,使用紅色激光HD-DVD,期望在單個(gè)盤上除了HD版本之外還存儲(chǔ)可以由具有MPEG-2解碼器的當(dāng)前播放機(jī)讀取的電影的SD版本。這將意味著內(nèi)容建立者不必除了SD盤之外還制作一個(gè)獨(dú)立的HD-DVD盤,并且零售商需要使用僅僅一個(gè)庫(kù)存單位(“SKU”)來(lái)庫(kù)存每個(gè)電影僅僅一個(gè)盤。這可以避免一些問(wèn)題,諸如對(duì)于廣播高清晰度電視(“HDTV”)遇到的那些問(wèn)題,其中,廣播公司直到銷售出更多HD套件才發(fā)送HD,但是消費(fèi)者直到有更多的HD內(nèi)容可以獲得時(shí)才購(gòu)買HD套件。
本發(fā)明假定使用單面的存儲(chǔ)媒體。雖然雙面盤是用于獲得更多的存儲(chǔ)量的一種選擇,但是對(duì)于使用盤的兩面有一些阻礙因素。這部分是因?yàn)橄率鋈秉c(diǎn)成本增加,并且在兩面上存儲(chǔ)內(nèi)容與通常被置于盤的一面上的標(biāo)簽沖突。因此,用于HD-DVD的下述手段種的每一個(gè)具有很大的缺點(diǎn)和不足(i)藍(lán)色激光技術(shù),(ii)雙面紅色激光盤和(iii)用于電影的HD和SD版本的獨(dú)立紅色激光盤。
發(fā)明內(nèi)容
通過(guò)混合可伸縮(scalable)編碼器、方法和媒體來(lái)處理現(xiàn)有技術(shù)的這些和其他缺陷和缺點(diǎn),所述混合可伸縮編碼器、方法和媒體用于將視頻信號(hào)數(shù)據(jù)處理為多個(gè)塊轉(zhuǎn)換系數(shù),所述多個(gè)塊轉(zhuǎn)換系數(shù)用于在雙重的、標(biāo)準(zhǔn)清晰度和高清晰度盤上包括的基本層和增強(qiáng)層的每個(gè)。所述編碼器包括雙層分解單元,用于將原始高清晰度信號(hào)數(shù)據(jù)序列分解為基本層數(shù)據(jù)和增強(qiáng)層數(shù)據(jù);標(biāo)準(zhǔn)清晰度編碼器,它耦接到所述分解單元,用于將基本層數(shù)據(jù)編碼為體現(xiàn)標(biāo)準(zhǔn)清晰度數(shù)據(jù)序列的基本層比特流;高清晰度編碼器,它耦接到所述分解單元和所述標(biāo)準(zhǔn)清晰度編碼器,用于將在高清晰度數(shù)據(jù)和標(biāo)準(zhǔn)清晰度數(shù)據(jù)之間的差編碼為體現(xiàn)高清晰度數(shù)據(jù)序列的增強(qiáng)層比特流。
通過(guò)參照附圖而讀取的、下面的例證實(shí)施例的說(shuō)明,本發(fā)明的這些和其他方面、特點(diǎn)和優(yōu)點(diǎn)將變得清楚。
本發(fā)明使用按照下述示意圖的、用于在單個(gè)數(shù)字視頻盤(“DVD”)上集合標(biāo)準(zhǔn)清晰度(“SD”)和高清晰度(“HD”)的混合可伸縮視頻CODEC,其中圖1示出了按照本發(fā)明的原理的混合可伸縮編碼器的方框圖;圖2示出了按照本發(fā)明的原理的、可用于圖1的編碼器的下采樣算法的方框圖;圖3示出了按照本發(fā)明的原理的、可用于圖1的編碼器的轉(zhuǎn)換系數(shù)的方框圖;圖4示出了按照本發(fā)明的原理的、可用于圖1的編碼器的內(nèi)插算法的方框圖;圖5示出了按照本發(fā)明的原理的、可用于圖1的編碼器的運(yùn)動(dòng)補(bǔ)償濾波的方框圖;圖6示出了按照本發(fā)明的原理的、混合可伸縮編碼器的另一個(gè)實(shí)施例的方框圖;圖7示出了按照本發(fā)明的原理的混合可伸縮解碼器的方框圖。
具體實(shí)施例方式
我們已經(jīng)認(rèn)識(shí)到需要、并且考慮了使用至少兩種手段來(lái)在單個(gè)紅色激光盤上提供電影的標(biāo)準(zhǔn)清晰度(“SD”)和高清晰度(“HD”)版本。第一種手段是提供使用紅色激光的單個(gè)盤的SD和HD,它具有同時(shí)聯(lián)播(simulcast)的、用于SD的MPEG-2和用于HD的H.26L。第二種手段是提供使用紅色激光的單個(gè)盤SD和HD,它具有對(duì)于基本層使用MPEG-2和對(duì)于增強(qiáng)層使用改進(jìn)H.26L的混合可伸縮手段。
為了在一個(gè)盤上存儲(chǔ)SD和HD,現(xiàn)在考慮同時(shí)聯(lián)播和可伸縮這兩種選擇。由于紅色激光DVD的存儲(chǔ)容量限制,MPEG-2可能對(duì)HD播放機(jī)來(lái)說(shuō)不足。同時(shí)聯(lián)播手段在盤上記錄獨(dú)立的MPEG-2SD和H.26LHD流,而可伸縮手段對(duì)于基本層使用MPEG-2和對(duì)于增強(qiáng)層使用改進(jìn)的H.26L。
為了比較,考慮7、8和9Mbps的總比特率。對(duì)于這些總比特率的每個(gè),表1和2分別呈現(xiàn)用于幾種不同情況的、所公開的混合可伸縮和同時(shí)聯(lián)播手段的所估計(jì)的性能。所述性能是以等同的MPEG-2HD比特率被估計(jì)的。一種特定情況的等同的MPEG-2HD比特率是MPEG-2比特率,需要它來(lái)實(shí)現(xiàn)與這種情況下的HD層類似的質(zhì)量。
表1所估計(jì)的混合可伸縮性能 表2.所估計(jì)的同時(shí)聯(lián)播性能 對(duì)于每個(gè)總比特率,列出了兩個(gè)不同的SD比特率3和4Mbps。另外,相對(duì)于H.26L與MPEG-2使用兩個(gè)不同的改進(jìn)系數(shù)2和2.5。這意味著考慮以比特率的2倍或2.5倍的MPEG-2提供與以比特率1倍的H.26L類似的質(zhì)量。
通過(guò)將HD比特率乘以H.26L改進(jìn)系數(shù)而獲得表2的同時(shí)聯(lián)播情況下的性能。通過(guò)下述方式來(lái)獲得表1的混合可伸縮手段的估計(jì)性能將HD比特率乘以H.26L改進(jìn)系數(shù)、加上SD比特率、并且乘以系數(shù)0.9以補(bǔ)償由于可伸縮性而導(dǎo)致的編碼效率的損失。所述0.9系數(shù)是基于先前經(jīng)驗(yàn)的估計(jì)值。
表1和2中的陰影行表示可以預(yù)期提供HD-DVD的足夠質(zhì)量的情況。比較所述表,在表1中有更多的行被加陰影。查看表2,可以看出,對(duì)于用于提供可接受的質(zhì)量的同時(shí)聯(lián)播手段,或者1)H.26L必須相對(duì)于MPEG-2提供2.5X的改進(jìn),并且3Mbps必須對(duì)于SD層足夠,或者2)必須使用9Mbps來(lái)用于總的視頻比特率,并且3Mbps必須對(duì)于SD層足夠,或者3)必須使用9Mbps來(lái)用于總的視頻比特率,并且H.26L必須相對(duì)于MPEG-2提供2.5X的改進(jìn)。
對(duì)于可伸縮的情況,所述性能將不足以用于邊界情況,其中,1)用于計(jì)算等同的MPEG-2HD比特率的公式太樂(lè)觀,或者2)僅僅7Mbps被允許用于總比特率,并且改進(jìn)的H.26L相對(duì)于MPEG-2不提供2.5X的改進(jìn),或者3)4Mbps必須用于SD層,不允許9Mbps的總視頻比特率,并且H.26L不提供2.5X的改進(jìn)。
因此,本發(fā)明的實(shí)施例允許從雙層單面的紅色激光DVD盤讀取電影的兩個(gè)版本——一個(gè)標(biāo)準(zhǔn)清晰度(“SD”)和一個(gè)高清晰度(“HD”)——而不需要第二次存儲(chǔ)在SD版本中包括的信息來(lái)作為HD版本的一部分。使用混合MPEG-2和改進(jìn)的H.26L可伸縮性來(lái)進(jìn)行所述編碼。對(duì)于基本層的MPEG-2的使用提供了可以由當(dāng)前的SD DVD播放機(jī)可以播放的SD比特流。使用改進(jìn)的H.26L(也被稱為JVT或MPEG-4第10部分或AVC)方案來(lái)編碼增強(qiáng)層以提供將SD和HD電影都置于單個(gè)盤上所需要的編碼效率。除了DVD媒體之外,本發(fā)明也可以被應(yīng)用到流式和/或易失性內(nèi)容,諸如流式因特網(wǎng)視頻。
下面的說(shuō)明僅僅說(shuō)明了本發(fā)明的原理。因此應(yīng)當(dāng)明白,本領(lǐng)域的技術(shù)人員將能夠設(shè)計(jì)各種方案,它們雖然在此不明確地說(shuō)明和示出但是包含本發(fā)明的原理,并且被包括在其精神和范圍內(nèi)。而且,在此所述的所有示例和條件語(yǔ)言主要意欲清楚地僅僅用于教學(xué)目的以幫助讀者明白本發(fā)明的原理和由發(fā)明人貢獻(xiàn)來(lái)發(fā)展本領(lǐng)域的思想,并且被理解為不限定這樣的具體所述的示例和條件。而且,在此敘述本發(fā)明的原理、方面和實(shí)施例的所有說(shuō)明及其具體示例意欲涵蓋結(jié)構(gòu)的及其功能的等同內(nèi)容。另外,這樣的等同內(nèi)容意欲包括當(dāng)前已知的等同內(nèi)容以及未來(lái)開發(fā)的等同內(nèi)容、即所開發(fā)的執(zhí)行同一功能而與結(jié)構(gòu)無(wú)關(guān)的任何元件。
因此,例如,本領(lǐng)域的技術(shù)人員可以明白,在此的方框圖表示體現(xiàn)本發(fā)明的原理的概念視圖或說(shuō)明性電路。類似地,可以明白,任何流程圖、狀態(tài)轉(zhuǎn)換圖、偽代碼等表示可以以計(jì)算機(jī)可讀媒體實(shí)際表示、并且由計(jì)算機(jī)或處理器執(zhí)行的各種處理,而不論是否這樣的計(jì)算機(jī)或處理器被明確地示出。
可以通過(guò)使用專用硬件以及能夠與適當(dāng)?shù)能浖嚓P(guān)聯(lián)地執(zhí)行軟件的硬件來(lái)提供在附圖中示出的各種元件的功能。當(dāng)由處理器提供時(shí),所述功能的提供可以通過(guò)單個(gè)專用處理器、單個(gè)共享處理器或多個(gè)獨(dú)立處理器,其中一些可以被共享。而且,術(shù)語(yǔ)“處理器”或“控制器”的明確使用不應(yīng)當(dāng)被理解為僅僅指示能夠執(zhí)行軟件的硬件,而是可以沒(méi)有限定地隱含包括數(shù)字信號(hào)處理器(“DSP”)硬件、用于存儲(chǔ)軟件的只讀存儲(chǔ)器(“ROM”)、隨機(jī)存取存儲(chǔ)器(“RAM”)和非易失性存儲(chǔ)器。也可以包括其他傳統(tǒng)和/或常規(guī)的硬件。類似地,在附圖中示出的開關(guān)僅僅是概念上的。可以通過(guò)程序邏輯的操作、通過(guò)專用邏輯、通過(guò)程序控制和專用邏輯的交互或甚至手工地執(zhí)行它們的功能,其中,由從上下文更具體地理解實(shí)現(xiàn)者可選擇的特定技術(shù)。
在其權(quán)利要求中,被表達(dá)為用于執(zhí)行特定功能的部件的任何元件易于涵蓋用于執(zhí)行那個(gè)功能的任何方式,包括例如a)執(zhí)行那個(gè)功能的電路元件的組合或b)與適當(dāng)電路組合的任何形式——包括固件、微代碼等——的軟件,所述適當(dāng)電路用于執(zhí)行那個(gè)軟件以執(zhí)行所述功能。由這樣的權(quán)利要求限定的本發(fā)明在于下述事實(shí)由各種所述部件提供的功能以權(quán)利要求所提出的方式被組合和放置在一起。因此申請(qǐng)人將可以提供那些功能的任何手段看作等同于在此所示的那些。
如圖1所示,附圖標(biāo)號(hào)100一般地指示混合可伸縮編碼器。編碼器100包括兩層分解單元110,用于接收原始的HD序列。分解單元110以信號(hào)通信而耦接到MPEG-2編碼器112,MPEG-2編碼器112從所述分解單元接收基本層像素,并且提供基本層比特流輸出。MPEG-2編碼器112耦接到SD幀緩沖器114,并且向緩沖器提供重建的基本像素。緩沖器114以反饋信號(hào)通信而耦接到編碼器112,并且還耦接到內(nèi)插器116。內(nèi)插器116耦接到求和塊118的第一輸入,求和塊118的輸出耦接到限幅器120。限幅器120繼而耦接到HD幀緩沖器122,而它耦接到改進(jìn)的H.26L編碼器124。編碼器124的輸入耦接到分解單元110,并且一個(gè)輸出耦接到求和塊118的第二輸入,用于向求和塊提供重建的增強(qiáng)層像素。編碼器124提供增強(qiáng)層比特流輸出。
轉(zhuǎn)向圖2,附圖標(biāo)號(hào)200一般地指示下采樣算法。示意地,原始HD塊210是A16×16,但是被劃分為分別四個(gè)8×8子塊220、230、240和250。分別通過(guò)8×8整數(shù)變換器221、231、241和251來(lái)向每個(gè)子塊并行應(yīng)用8×8整數(shù)變換。接著,分別通過(guò)低頻子塊提取器222、232、242和252來(lái)對(duì)每個(gè)被變換的子塊執(zhí)行低通濾波。低通濾波的子塊然后分別被零填充(zero-padder)塊223、233、243和253在需要的情況下填充零為5×4子塊。然后分別由5×4逆變換器224、234、244和254向每個(gè)被填充零的子塊應(yīng)用逆變換,以便分別提供新子塊225、235、245和255,它們構(gòu)成一個(gè)新塊212。通過(guò)與11×9零填充器216耦接的10×8整數(shù)變換器214來(lái)向所述新塊212應(yīng)用整數(shù)變換。零填充器216繼而耦接到用于提供基本層像素B11×9的11×9逆變換器218。與對(duì)于8×8塊的簡(jiǎn)單獨(dú)立操作相比較,圖2所示的下采樣方法的優(yōu)點(diǎn)是在采樣速率轉(zhuǎn)換比上更靈活。對(duì)于圖2所示的特定實(shí)施例,SD層的水平分辨率是HD水平分辨率的9/16,并且SD層的垂直分辨率是HD垂直分辨率的11/16。
如果獨(dú)立地處理8×8塊,這些比率是不可能的,因?yàn)樗鲎儞Q比率將是對(duì)于在1和7之間的某個(gè)整數(shù)P的P/8的形式。
現(xiàn)在轉(zhuǎn)向圖3,通過(guò)附圖標(biāo)號(hào)300來(lái)一般地表示8×8子塊。子塊300對(duì)應(yīng)于圖2的子塊220、230、240和250。子塊300包括基本層310和增強(qiáng)層312變換系數(shù),其中,對(duì)于基本層,提取在每個(gè)8×8系數(shù)塊的左上角中的系數(shù)310的5×4子塊的子集。在8×8塊中的剩余系數(shù)312是增強(qiáng)層系數(shù)。
如圖4所示,由附圖標(biāo)號(hào)400來(lái)一般地表示內(nèi)插算法。所述算法400包括11×9整數(shù)變換器410,用于變換B11×9的重建版本,它被表示為B’11×9。塊410導(dǎo)致10×8刪截塊412,它導(dǎo)致用于輸出中間塊416的10×8逆變換塊414。塊416分別包括四個(gè)子劃分的子塊460、470、480和490。分別由5×4整數(shù)變換器462、472、482和492來(lái)向這些子塊的每個(gè)應(yīng)用整數(shù)變換。接著,分別通過(guò)8×8零填充器464、474、484和494來(lái)將所變換的子塊填充零。然后,所述零填充的、被變換的子塊分別被8×8逆變換器466、476、486和496逆變換,以形成對(duì)應(yīng)的新子塊468、478、488和498,它們一起構(gòu)成B’16×16塊418。
轉(zhuǎn)向圖5,由附圖標(biāo)號(hào)500來(lái)一般地表示運(yùn)動(dòng)補(bǔ)償濾波器。濾波器500包括8×8整數(shù)變換器510,用于變換輸入P8×8。變換器510耦接到用于將基本層系數(shù)設(shè)置為零的分配單元512。所述分配單元512繼而耦接到用于提供輸出P’8×8的逆變換器514。
現(xiàn)在轉(zhuǎn)向圖6,附圖標(biāo)號(hào)600一般地表示混合可伸縮編碼器的另一個(gè)實(shí)施例。編碼器600類似于圖1的編碼器100,但是具有用于完成分解的下采樣單元。因此,所述編碼器包括下采樣單元610,用于接收原始HD序列和下采樣以提供基本層像素。編碼器600也包括第一求和塊611,用于在非反相輸入接收原始HD序列。下采樣單元610以信號(hào)通信而耦接到用于從下采樣單元接收基本層像素的MPEG-2編碼器612,并且提供基本層比特流輸出。所述MPEG-2編碼器612耦接到SD幀緩沖器614,并且向所述緩沖器提供重建的基本像素。緩沖器614以反饋信號(hào)通信來(lái)耦接到編碼器612,并且還耦接到內(nèi)插器616。內(nèi)插器616耦接到第一求和塊611的反相輸入。內(nèi)插器616還耦接到第二求和塊618的第一輸入,第二求和塊618的輸出耦接到限幅器620。限幅器620繼而耦接到HD幀緩沖器622,HD幀緩沖器622耦接到改進(jìn)的H.26L編碼器624。編碼器624的一個(gè)輸入耦接到第一求和塊611的輸出,用于接收增強(qiáng)層像素,并且其一個(gè)輸出耦接到到第二求和塊618的第二輸入,用于向第二求和塊618提供重建的增強(qiáng)層像素。編碼器624提供增強(qiáng)層比特流輸出。
如圖7所示,附圖標(biāo)號(hào)700一般地表示混合可伸縮解碼器。解碼器700包括MPEG-2解碼器710,用于接收基本層比特流。MPEG-2解碼器耦接到SD幀緩沖器712,用于緩沖標(biāo)準(zhǔn)清晰度的幀。SD幀緩沖器712提供適合于SD顯示器的輸出,并且耦接回MPEG-2解碼器710。MPEG-2解碼器還耦接到內(nèi)插器714,它繼而耦接到兩層合成單元或求和塊718?;旌峡缮炜s解碼器器700還包括改進(jìn)的JVT解碼器716,用于接收增強(qiáng)層比特流。改進(jìn)的JVT解碼器耦接到求和塊718的第二非反相輸入。求和塊718的輸出耦接到限幅單元720,它繼而耦接到HD幀緩沖器722。HD幀緩沖器722提供適合于HD顯示器的輸出,并且也耦接回改進(jìn)的JVT解碼器716。在操作中,例證的混合可伸縮方案對(duì)于基本層胡斯亞MPEG-2編碼和對(duì)于增強(qiáng)層使用改進(jìn)的H.26L編碼。在例證系統(tǒng)中,HD層的分辨率是1280×720,SD層是704×480。
圖1示出了例證混合可伸縮編碼器的高層方框圖。首先,將原始HD材料分解為包含原始序列的低頻內(nèi)容的基本層和包含原始序列的高頻內(nèi)容的增強(qiáng)層。使用MPEG-2(或其他適合的SD方案)來(lái)編碼基本層,并且使用H.26L的改進(jìn)版本(或其他適合的HD方案)來(lái)編碼增強(qiáng)層。在本發(fā)明的一個(gè)例證實(shí)施例中,以交織的方式在盤上記錄基本和增強(qiáng)比特流。通過(guò)內(nèi)插重建的基本層像素和向重建的增強(qiáng)層像素加上所述結(jié)果來(lái)獲得重建的HD幀。
混合可伸縮解碼器的一個(gè)例證實(shí)施例包括MPEG-2解碼器、改進(jìn)的H.26L解碼器和用于基本層的內(nèi)插器。所述內(nèi)插器和H.26L解碼器的輸出被求和以形成重建的HD幀。
為了提供兩層的分解,圖2示出了用于下采樣輸入的HD塊A16×16以獲得基本層像素塊B11×9的算法。圖2所示的處理量將很大,除了在圖中的每個(gè)步驟可以被寫為矩陣變換,因此有可能實(shí)現(xiàn)下述整個(gè)程序先乘以用于水平下采樣的矩陣(D1),隨后乘以用于垂直下采樣的矩陣(D2)。
一般,可能優(yōu)選用于建立SD幀的基于變換的下采樣,但是可以有這樣的應(yīng)用,其中,應(yīng)當(dāng)使用替代實(shí)施例空間域FIR濾波來(lái)避免可能從濾波和/或下采樣的變換類型產(chǎn)生的非自然現(xiàn)象。
向回參見圖2,下采樣的第一部分工作在8×8塊上。對(duì)于基本層,在每個(gè)8×8系數(shù)塊的左上角的系數(shù)的5×4子塊的子集(或可能整個(gè)5×4子塊)被提取,如圖3所示。由圖3的灰色區(qū)域表示的、在8×8塊中的剩余系數(shù)是增強(qiáng)層系數(shù)。
通過(guò)將少于所述5×4左上塊的一組系數(shù)置于基本層并且然后零填充為5×4,實(shí)現(xiàn)了基本層的低通濾波。在可伸縮方案的整個(gè)編碼效率上,將小數(shù)量的系數(shù)置于基本層用于兩個(gè)目的。第一,然后使用更有效的H.26L增強(qiáng)層編碼來(lái)編碼更多的數(shù)據(jù)。第二,對(duì)于給定的基本層比特率,在基本層中,較小數(shù)量的基本層系數(shù)可以被編碼到較好的精度,因此,在增強(qiáng)層中不需要改進(jìn)這些系數(shù)。這是實(shí)現(xiàn)用于計(jì)算在表1中給出的所估計(jì)的性能數(shù)字的90%效率的關(guān)鍵。在替代實(shí)施例中,基本層的系數(shù)的選擇可以是預(yù)定的或自適應(yīng)的。下采樣變換矩陣(D1)和(D2)依賴于在基本層中使用哪些系數(shù),因此如果所述選擇是自適應(yīng)的,則或者存儲(chǔ)多個(gè)版本的(D1)和(D2),或者以兩步而不是一步來(lái)執(zhí)行圖2的處理。
對(duì)于基本層處理,塊B11×9形成SD幀的一部分。使用MPEG-2來(lái)編碼那個(gè)SD幀,并且在SD幀緩沖器中存儲(chǔ)所重建的幀。B11×9的重建版本、被表示為B’11×9,被內(nèi)插以形成16×16塊B’16×16。圖4示出了所述內(nèi)插算法。像在下采樣的情況那樣,可以使用兩個(gè)矩陣的相乘來(lái)實(shí)現(xiàn)所述內(nèi)插。首先,先乘以矩陣(D4)垂直地內(nèi)插,然后后乘以(D3)水平地內(nèi)插。從原始數(shù)據(jù)減去內(nèi)插的塊B’16×16以形成增強(qiáng)層塊(E16×16)。
使用用于增強(qiáng)層編碼的改進(jìn)版本H.26L來(lái)編碼所述塊(E16×16)。用于編碼增強(qiáng)層的、對(duì)于H.26L進(jìn)行的兩種改進(jìn)包括a)在運(yùn)動(dòng)補(bǔ)償單元中使用額外的濾波步驟。在執(zhí)行子像素內(nèi)插后,從預(yù)測(cè)中去除低頻內(nèi)容。圖5中圖解了用于執(zhí)行這個(gè)任務(wù)的處理。它可以被實(shí)現(xiàn)為先乘以矩陣(D5),后乘以矩陣(D6)。矩陣(D5)和(D6)依賴于在基本層中編碼哪些系數(shù),因此如果自適應(yīng)地進(jìn)行在編碼器中的基本層系數(shù)的選擇,則必須以信號(hào)向解碼器通知這種選擇。這個(gè)參數(shù)可以僅僅在畫面層改變,在這種情況下開銷不大。
b)從非可伸縮的H.26L以不同的順序來(lái)掃描變換系數(shù)。新的掃描順序?qū)⑺械幕緦酉禂?shù)置于開端,后隨增強(qiáng)層系數(shù)。
除了對(duì)于H.26L編碼器進(jìn)行的兩種改進(jìn)之外,還對(duì)編碼模式進(jìn)行一些限制。首先,在增強(qiáng)層中不允許H.26L的4×4、4×8、8×4運(yùn)動(dòng)補(bǔ)償模式。試驗(yàn)顯示,這些模式在HD分辨率下不很有用,因此對(duì)于編碼器的這種約束對(duì)于編碼效率影響不很大。所作出的第二種限制是僅僅作為H.26L的自適應(yīng)塊變換特性的一部分的8×8變換用于亮度。
向回參見圖1,增強(qiáng)層系數(shù)被重建并且加到被內(nèi)插的重建基本層像素以形成重建的HD幀。這些重建的HD幀被用作用于編碼未來(lái)的增強(qiáng)層數(shù)據(jù)的參考幀。
可以通過(guò)用于在盤上存儲(chǔ)所述兩個(gè)層的兩種替代方式之一來(lái)實(shí)現(xiàn)在盤上的比特流的交織。它們是1)使用DVD的多角度/無(wú)縫分支特征?;玖鲗⒈淮鎯?chǔ)為角度一,并且增強(qiáng)層將被存儲(chǔ)為其他的角度。僅僅角度一可由當(dāng)前的DVD播放機(jī)播放。當(dāng)前的DVD標(biāo)準(zhǔn)指定了對(duì)于多個(gè)角度和無(wú)縫分支的多個(gè)約束(例如最大跳躍扇區(qū)、最小緩沖扇區(qū)),如果滿足這些約束的話,則應(yīng)當(dāng)保證無(wú)縫的重放。
2)使用用于增強(qiáng)層的其他流ID。因?yàn)楫?dāng)前的DVD僅僅使用流ID0xE0來(lái)存儲(chǔ)視頻流,因此可以使用其他的流ID來(lái)存儲(chǔ)增強(qiáng)層。
本發(fā)明提供了同時(shí)從單個(gè)盤解碼兩個(gè)比特流以獲得HD版本或解碼單個(gè)比特流以獲得SD版本的能力。內(nèi)容提供商可以仍然選擇在例如它們要對(duì)于電影的HD版本充值的情況下釋放用于SD和HD的兩個(gè)獨(dú)立的盤。新的播放機(jī)除了可伸縮流之外還播放具有非可伸縮H.26L流的盤。本發(fā)明的實(shí)施例可以記錄內(nèi)容建立者、視頻商店和消費(fèi)者以在新的HD播放機(jī)已經(jīng)達(dá)到平衡僅僅具有HD的盤的建立、銷售和購(gòu)買的安裝數(shù)量之前建立HD材料的庫(kù)存。
因此,所公開的CODEC的優(yōu)選實(shí)施例包括兩個(gè)特點(diǎn)(i)用于下采樣的新方法,它將低頻變換系數(shù)置于基本層中,并且將高頻變換系數(shù)置于增強(qiáng)層中,并且比先前的方法在采樣速率變換比率上具有更大的靈活性;(ii)用于降低基本層比特率的方法,它不要求在增強(qiáng)層中改進(jìn)基本層系數(shù)。
本發(fā)明的這些和其他特點(diǎn)和優(yōu)點(diǎn)可以容易地被相關(guān)領(lǐng)域的普通技術(shù)人員根據(jù)在此的教程而確定。應(yīng)當(dāng)明白,本發(fā)明的教程可以以硬件、軟件、固件、專用處理器或其組合的各種形式來(lái)實(shí)現(xiàn)。
更優(yōu)選的是,本發(fā)明的教程被實(shí)現(xiàn)為硬件和軟件的組合。而且,所述軟件最好被實(shí)現(xiàn)為在程序存儲(chǔ)單元上確實(shí)地體現(xiàn)的應(yīng)用程序。這個(gè)應(yīng)用程序可以被上載到包括任何適當(dāng)?shù)募軜?gòu)的機(jī)器,并且由其執(zhí)行。優(yōu)選的是,所述機(jī)器被實(shí)現(xiàn)在計(jì)算機(jī)平臺(tái)上,所述計(jì)算機(jī)平臺(tái)具有硬件,諸如一個(gè)或多個(gè)中央處理單元(“CPU”)、隨機(jī)存取存儲(chǔ)器(“RAM”)和輸入/輸出(“I/O”)接口。所述計(jì)算機(jī)平臺(tái)也可以包括操作系統(tǒng)和微指令代碼。在此所述的各種處理和功能可以是微指令代碼的一部分或應(yīng)用程序的一部分或其組合,它們可以由CPU執(zhí)行。另外,各種其他外圍單元可以連接到計(jì)算機(jī)平臺(tái),諸如附加的數(shù)據(jù)存儲(chǔ)單元和打印單元。
還應(yīng)當(dāng)明白,因?yàn)樵诟綀D中所述的構(gòu)成系統(tǒng)部件和方法的一些最好以軟件來(lái)實(shí)現(xiàn),因此在所述系統(tǒng)部件或處理功能塊之間的實(shí)際連接可以根據(jù)編程本發(fā)明的方式而不同。在給出在此的教程的情況下,相關(guān)領(lǐng)域的普通技術(shù)人員將能夠考慮本發(fā)明的這些和類似的實(shí)現(xiàn)方式或配置。
雖然在此參照附圖而說(shuō)明了說(shuō)明性實(shí)施例,但是應(yīng)當(dāng)明白,本發(fā)明不限于那些精確的實(shí)施例,可以在不脫離本發(fā)明的范圍或精神的情況下由相關(guān)領(lǐng)域的普通技術(shù)人員在其中進(jìn)行各種改變和改進(jìn)。所有這樣的改變和改進(jìn)意欲被包括在所附的權(quán)利要求所給出的本發(fā)明的范圍中。
權(quán)利要求
1.一種編碼器(100),用于將信號(hào)數(shù)據(jù)編碼為用于基本層和增強(qiáng)層的每個(gè)的多個(gè)塊變換系數(shù),所述編碼器包括雙層分解單元(110),用于將原始高清晰度信號(hào)數(shù)據(jù)序列分解為基本層數(shù)據(jù)和增強(qiáng)層數(shù)據(jù);標(biāo)準(zhǔn)清晰度編碼器(112),它耦接到所述分解單元,用于將基本層數(shù)據(jù)編碼為體現(xiàn)標(biāo)準(zhǔn)清晰度數(shù)據(jù)序列的基本層比特流;高清晰度編碼器(124),它耦接到所述分解單元和所述標(biāo)準(zhǔn)清晰度編碼器,用于將在高清晰度數(shù)據(jù)和標(biāo)準(zhǔn)清晰度數(shù)據(jù)之間的差編碼為體現(xiàn)高清晰度數(shù)據(jù)序列的增強(qiáng)層比特流。
2.按照權(quán)利要求1的編碼器,其中,所述分解單元包括下采樣單元(610)。
3.按照權(quán)利要求1的編碼器,其中,所述信號(hào)數(shù)據(jù)包括視頻像素?cái)?shù)據(jù)。
4.按照權(quán)利要求1的編碼器,其中,所述標(biāo)準(zhǔn)清晰度編碼器滿足MPEG-2標(biāo)準(zhǔn)。
5.按照權(quán)利要求1的編碼器,其中,所述高清晰度編碼器滿足改進(jìn)的H.26L標(biāo)準(zhǔn)。
6.按照權(quán)利要求1的編碼器,還包括標(biāo)準(zhǔn)清晰度幀緩沖器,它與所述標(biāo)準(zhǔn)清晰度編碼器進(jìn)行信號(hào)通信,用于保持重建的基本層數(shù)據(jù)。
7.按照權(quán)利要求1的編碼器,還包括高清晰度幀緩沖器,它與所述高清晰度編碼器進(jìn)行信號(hào)通信,用于保持重建的增強(qiáng)層數(shù)據(jù)。
8.按照權(quán)利要求1的編碼器,還包括內(nèi)插單元,它耦接在所述標(biāo)準(zhǔn)清晰度編碼器和高清晰度編碼器之間,用于向?qū)?yīng)于高清晰度數(shù)據(jù)的格式中內(nèi)插所述標(biāo)準(zhǔn)清晰度數(shù)據(jù)。
9.一種編碼器,用于將信號(hào)數(shù)據(jù)編碼為用于基本層和增強(qiáng)層的每個(gè)的多個(gè)塊變換系數(shù),所述編碼器包括接收器部件,用于接收原始高清晰度信號(hào)數(shù)據(jù)序列;分解部件,用于將所述原始高清晰度信號(hào)數(shù)據(jù)序列分解為基本層數(shù)據(jù)和增強(qiáng)層數(shù)據(jù);基本層編碼部件,用于將所述基本層數(shù)據(jù)編碼為體現(xiàn)標(biāo)準(zhǔn)清晰度數(shù)據(jù)序列的基本層比特流;和增強(qiáng)層編碼部件,用于僅僅將在高清晰度數(shù)據(jù)和標(biāo)準(zhǔn)清晰度數(shù)據(jù)之間的差編碼為體現(xiàn)高清晰度數(shù)據(jù)序列的增強(qiáng)層比特流。
10.一種用于將信號(hào)數(shù)據(jù)編碼為用于基本層和增強(qiáng)層的每個(gè)的多個(gè)塊變換系數(shù)的方法,所述方法包括接收(610,611)原始高清晰度信號(hào)數(shù)據(jù)序列;將所述原始高清晰度信號(hào)數(shù)據(jù)序列分解(610,611)為基本層數(shù)據(jù)和增強(qiáng)層數(shù)據(jù);將所述基本層數(shù)據(jù)編碼(612)為體現(xiàn)標(biāo)準(zhǔn)清晰度數(shù)據(jù)序列的基本層比特流;和僅僅將在高清晰度數(shù)據(jù)和標(biāo)準(zhǔn)清晰度數(shù)據(jù)之間的差編碼(624)為體現(xiàn)高清晰度數(shù)據(jù)序列的增強(qiáng)層比特流。
11.一種以信號(hào)數(shù)據(jù)編碼的數(shù)字視頻盤,包括用于基本層和增強(qiáng)層的每個(gè)的多個(gè)塊變換系數(shù),所述系數(shù)一起表示原始高清晰度信號(hào)數(shù)據(jù)序列,數(shù)字視頻盤的基本層具有體現(xiàn)標(biāo)準(zhǔn)清晰度數(shù)據(jù)序列的系數(shù),并且數(shù)字視頻盤的增強(qiáng)層具有體現(xiàn)在高清晰度數(shù)據(jù)序列和標(biāo)準(zhǔn)清晰度數(shù)據(jù)序列之間的差的系數(shù)。
12.按照權(quán)利要求11的數(shù)字視頻盤,其中,所述基本層系數(shù)可以由紅色激光視頻盤播放機(jī)讀取。
13.按照權(quán)利要求12的數(shù)字視頻盤,其中,所述增強(qiáng)層系數(shù)可以由紅色激光視頻盤播放機(jī)讀取。
14.按照權(quán)利要求11的數(shù)字視頻盤,其中,所述基本層系數(shù)以MPEG-2代碼被編碼。
15.按照權(quán)利要求14的數(shù)字視頻盤,其中,所述增強(qiáng)層系數(shù)以改進(jìn)的H.26L代碼被編碼。
16.按照權(quán)利要求11的數(shù)字視頻盤,其中,使用DVD的多角度/無(wú)縫分支特性來(lái)交織所述增強(qiáng)層。
17.按照權(quán)利要求11的數(shù)字視頻盤,其中,使用增強(qiáng)層的流標(biāo)識(shí)號(hào)而不是0×E0來(lái)交織增強(qiáng)層。
全文摘要
公開了一種混合可伸縮編碼器(100,600)、方法和媒體,用于將視頻信號(hào)數(shù)據(jù)處理為多個(gè)塊轉(zhuǎn)換系數(shù),所述多個(gè)塊轉(zhuǎn)換系數(shù)用于在雙重的、標(biāo)準(zhǔn)清晰度和高清晰度盤上包括的基本層和增強(qiáng)層的每個(gè)。所述編碼器(100,600)包括雙層分解單元(110),用于將原始高清晰度信號(hào)數(shù)據(jù)序列分解為基本層數(shù)據(jù)和增強(qiáng)層數(shù)據(jù);標(biāo)準(zhǔn)清晰度編碼器(112),它耦接到所述分解單元,用于將基本層數(shù)據(jù)編碼為體現(xiàn)標(biāo)準(zhǔn)清晰度數(shù)據(jù)序列的基本層比特流;高清晰度編碼器(124),它耦接到所述分解單元和所述標(biāo)準(zhǔn)清晰度編碼器,用于將在高清晰度數(shù)據(jù)和標(biāo)準(zhǔn)清晰度數(shù)據(jù)之間的差編碼為體現(xiàn)高清晰度數(shù)據(jù)序列的增強(qiáng)層比特流。
文檔編號(hào)H04N7/46GK1720731SQ200380105117
公開日2006年1月11日 申請(qǐng)日期2003年11月13日 優(yōu)先權(quán)日2002年12月3日
發(fā)明者瑪麗·L·科默, 林書 申請(qǐng)人:湯姆森特許公司