專利名稱:數(shù)字圖像編碼的制作方法
背景I.發(fā)明領(lǐng)域本發(fā)明一般涉及數(shù)據(jù)壓縮,尤其涉及用于數(shù)字圖像數(shù)據(jù)壓縮的編碼參數(shù)的生成。
II.相關(guān)技術(shù)描述壓縮是多媒體分發(fā)和/或放映的一個關(guān)鍵因素。有效的數(shù)字壓縮能降低成本并且提高數(shù)字通信系統(tǒng)中放映的已解壓圖像信息的質(zhì)量。數(shù)字壓縮技術(shù)的一種英語是在運(yùn)動圖片產(chǎn)業(yè)中,或者具體在“數(shù)字影院”系統(tǒng)中。
一般而言,數(shù)字影院是指高質(zhì)量影片的電子分發(fā)和顯示,所述高質(zhì)量影片已經(jīng)被轉(zhuǎn)換成用于存儲、傳輸和顯示的數(shù)字電子表示。因?yàn)閿?shù)據(jù)量的緣故,數(shù)字電子表示形式的影片被壓縮和分發(fā)以便重放。雖然有各種壓縮算法來降低用于存儲和/或傳輸高質(zhì)量電子圖像的比特率,然而即使最有效的壓縮也會導(dǎo)致由于諸如一圖像幀內(nèi)細(xì)節(jié)數(shù)量或細(xì)節(jié)排列等原因,一些被壓縮的圖像部分會有高比特率。
然而,高比特率可能延遲和/或停止解碼器重發(fā)一影片。因此,具有高比特率的被壓縮圖像部分會延遲和/或停止解碼器,因此需要監(jiān)視和控制被壓縮的數(shù)據(jù)比特率。
發(fā)明內(nèi)容
這里公開的實(shí)施例通過為數(shù)據(jù)處理系統(tǒng)中的安全提供一種方法而解決了上述需求。所述實(shí)施例能夠生成用于對數(shù)字圖像信息進(jìn)行編碼的一組參數(shù)??梢源_定所述參數(shù)產(chǎn)生低于所選閾值的被壓縮數(shù)據(jù)比特率,使得解碼器不會在影片重放期間停止。因此,可以根據(jù)所述參數(shù)來控制和限制被壓縮的數(shù)據(jù)比特率。
在一實(shí)施例中,一裝置包括用于把圖像信息轉(zhuǎn)換成數(shù)字圖像信息的源發(fā)生器。與源發(fā)生器耦合的編碼器被配置成從源發(fā)生器接收數(shù)字圖像信息,并且包括與第一圖像壓縮器耦合的參數(shù)發(fā)生器。參數(shù)發(fā)生器至少輸出第一組參數(shù),第一圖像壓縮器使用所述第一組參數(shù)來壓縮所述數(shù)字圖像信息。
參數(shù)發(fā)生器可包括與處理器耦合的第二圖像壓縮器。處理器輸出第二組參數(shù),第二圖像壓縮器使用所述第二組參數(shù)來壓縮所述數(shù)字信息。處理器調(diào)整第二組參數(shù)并且如果第二組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率,則輸出第三組參數(shù)作為第二組參數(shù),否則,則輸出第二組參數(shù)作為第一組參數(shù)?;蛘撸瑓?shù)發(fā)生器可包括用于輸出第一組參數(shù)的處理器。然后,處理器調(diào)整第一組參數(shù),如果第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率,則產(chǎn)生第二組參數(shù),并且輸出第二組參數(shù)作為第一組參數(shù)。
在另一實(shí)施例中,一種用于對數(shù)字圖像信息進(jìn)行編碼的方法包括產(chǎn)生和輸出至少第一組參數(shù)、使用所述第一組參數(shù)來壓縮數(shù)字圖像信息、并且調(diào)整第一組參數(shù),如果第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率則產(chǎn)生第二組參數(shù)、以及輸出第二組參數(shù)作為第一組參數(shù)。這里,第一組參數(shù)可以基于統(tǒng)計(jì)分析來調(diào)整。
在進(jìn)一步的實(shí)施例中,一種用于對數(shù)字圖像信息進(jìn)行編碼的裝置包括用于輸出至少第一組參數(shù)的裝置、以及使用第一組參數(shù)來壓縮數(shù)字圖像信息的第一裝置。這里,用于輸出至少第一組參數(shù)的裝置可包括使用第二組參數(shù)來壓縮數(shù)字信息的裝置、用于輸出第二組參數(shù)的裝置、用于調(diào)整第二組參數(shù)以產(chǎn)生第三組參數(shù)的裝置、以及如果第二組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率則輸出第三組參數(shù)作為第二組參數(shù)、否則輸出第二組參數(shù)作為第一組參數(shù)的裝置?;蛘撸糜谳敵鲋辽俚谝唤M參數(shù)的裝置可包括用于調(diào)整第一組參數(shù)以便在第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率時產(chǎn)生第二組參數(shù)的裝置;以及用于輸出第二組參數(shù)作為第一組參數(shù)的裝置。
下面將參照附圖詳細(xì)描述各個實(shí)施例,附圖中相同的標(biāo)號表示相同的元件,其中圖1示出數(shù)字影院系統(tǒng)的一個實(shí)施例;圖2示出編碼器的一個實(shí)施例;圖3示出編碼器的另一實(shí)施例;圖4是用于產(chǎn)生一組編碼參數(shù)的一實(shí)施例框圖;圖5示出圖像壓縮器的一個實(shí)施例;圖6示出圖像幀的統(tǒng)計(jì)分析;以及圖7示出用于逐區(qū)域的被壓縮圖像數(shù)據(jù)的統(tǒng)計(jì)分析。
具體實(shí)施例方式
一般而言,所述實(shí)施例能夠生成用于對數(shù)據(jù)進(jìn)行編碼的最終參數(shù)。在一實(shí)施例中,所述參數(shù)基于從參數(shù)的使用而產(chǎn)生的數(shù)據(jù)比特來產(chǎn)生或設(shè)置。更具體地說,生成最終參數(shù),使得從參數(shù)的使用而產(chǎn)生的數(shù)據(jù)比特率不超出所選的或目標(biāo)的數(shù)據(jù)比特率。所選的數(shù)據(jù)比特率取決于各個實(shí)施例的不同實(shí)現(xiàn)方式。例如,所選的閾值會是受限帶寬所允許的最大比特率。在某些實(shí)現(xiàn)方式中,緩沖可用于使比特率在一段時間內(nèi)超出最大比特率。因而在某些實(shí)施例中,所選的閾值會是在一段時間內(nèi)的平均比特率。
在一種應(yīng)用中,可以生成用于對數(shù)字圖像信息進(jìn)行編碼的參數(shù)。因此,可以在數(shù)字影院內(nèi)實(shí)現(xiàn)各個實(shí)施例來產(chǎn)生用于對數(shù)字圖像信息進(jìn)行編碼的參數(shù)。
數(shù)字影院會包括音頻/視頻節(jié)目的電子生成、壓縮、加密和存儲,比如劇院系統(tǒng)、劇院、劇院綜合建筑和/或放映系統(tǒng)中的運(yùn)動圖片。因而,本發(fā)明可應(yīng)用于多種位置中圖像和音頻信息的放映,比如在劇院或劇院綜合建筑、戶外露天劇場、汽車劇場、城市禮堂、學(xué)校和特別餐館。為說明起見,本發(fā)明會參照劇院或劇院綜合建筑來描述。然而,本領(lǐng)域的技術(shù)人員容易理解,本發(fā)明可應(yīng)用于其它類型的位置、系統(tǒng)和場所。
同樣,如這里公開的,術(shù)語“節(jié)目”是指用于在影院、電視和/或任何其它放映系統(tǒng)和/或位置中顯示的一個或多個影片。術(shù)語“影片”是指任何運(yùn)動的圖片,包括、但不限于運(yùn)動圖片的全部或一部分、視頻剪輯、商業(yè)廣告、戲劇或它們的組合。影片的圖像部分會由單幀(即靜止圖像)、單幀靜止圖像的序列或者短期或長期的運(yùn)動圖像序列組成。術(shù)語“存儲介質(zhì)”是指任一個或多個存儲裝置,包括緩沖器、高容量數(shù)據(jù)存儲設(shè)備,比如數(shù)字化視頻光盤(DVD)或可移動硬驅(qū)(RHD)。術(shù)語“加密”是指使用多種加密技術(shù)的任一種來處理各個信源的數(shù)字?jǐn)?shù)據(jù)流的裝置,所述技術(shù)以不知道密鑰值就難以恢復(fù)原始數(shù)據(jù)序列的方式,使用用秘密數(shù)字值(“密鑰”)產(chǎn)生的序列對所述數(shù)字流直接加密。
圖1中說明了數(shù)字影院系統(tǒng)100的一個實(shí)施例。數(shù)字影院系統(tǒng)100包括兩個主要系統(tǒng)至少一個中央設(shè)備或集線器102以及至少一個放映或劇院子系統(tǒng)104。集線器102和劇院子系統(tǒng)104可以用類似于待批美國專利申請序列號09/564,174和09/563,880的設(shè)計(jì)來實(shí)現(xiàn),這兩個申請都于2000年5月3日提交并被轉(zhuǎn)讓給本發(fā)明的受讓人,兩者都通過引用被結(jié)合于此。
一般而言,集線器102包括用于接收節(jié)目材料并將其轉(zhuǎn)換成節(jié)目的數(shù)字形式的源發(fā)生器110。數(shù)字信息由編碼器120使用預(yù)先選擇的格式或過程來壓縮,并且由集線器存儲模塊130保存在存儲介質(zhì)上。這里,節(jié)目材料包括圖像信息和音頻信息的其一或兩者。因而,數(shù)字信息可包括圖像信息和音頻信息的其一或兩者。網(wǎng)絡(luò)管理器140監(jiān)視控制信息并將其發(fā)送到源發(fā)生器110、編碼器120和集線器存儲模塊130。數(shù)字信息也可由編碼器120加密。在這種情況下,集線器102可任選地包括有條件的訪問管理器150以提供特定的電子監(jiān)控信息,使得只有特定的位置,例如劇院,被授權(quán)來顯示特定的節(jié)目。
應(yīng)該注意到,盡管源發(fā)生器110和編碼器120是圖1所示的集線器102的部分,然而源發(fā)生器110或編碼器120中的任一或兩者可位于諸如影片或電視制作室這樣的分開設(shè)備中。同樣,一些數(shù)據(jù)不需要源發(fā)生器110的轉(zhuǎn)換。例如,可以通過數(shù)碼相機(jī)或任何其它數(shù)字信息發(fā)生設(shè)備把數(shù)字信息提供給編碼器120。
劇院子系統(tǒng)104可包括控制一個或多個觀眾席模塊170的劇院管理器160,每個觀眾席模塊170都包括一解碼器175。在劇院管理器160的控制下,來自集線器102的被壓縮數(shù)字信息被接收、由解碼器175解碼、被解密(如果必要)并且由觀眾席模塊170播放。被壓縮的信息可以通過存儲媒介接收或者可以實(shí)時地被發(fā)送。同樣,被壓縮信息可以在被解碼前被準(zhǔn)備成所選的序列、尺寸和數(shù)據(jù)。
一般而言,輸入到編碼器120內(nèi)的數(shù)據(jù)流由圖像幀組成。一個圖像幀一般被分成幾部分,一部分可被分成幾個數(shù)據(jù)塊,一個數(shù)據(jù)塊可被分成若干像素,像素是圖像的最小單位。每個圖像幀都包括整數(shù)個部分,每個圖像部分都表示一組16個連續(xù)掃描行的圖像信息。在這種情況下,每個數(shù)據(jù)塊對應(yīng)于該圖像幀上的16×16像素塊。同樣,一幀可被分成偶數(shù)和奇數(shù)個部分,從而形成偶數(shù)半幀和奇數(shù)半幀。在一實(shí)施例中,半幀是由解碼器處理的被壓縮數(shù)據(jù)信息的基本分組。此外,一個圖像像素通常在紅、綠和藍(lán)(RGB)色彩分量系統(tǒng)中表示。然而,由于人眼對亮度變化較為敏感,對色度編碼較不敏感,因此在視頻壓縮中一般使用YCbCr色彩空間來表示圖像像素。YCbCr色彩空間是RGB分量的線性變換,其中Y是色度分量,Cb和Cr是色彩分量。如果一幀被分成偶數(shù)/奇數(shù)個幀,就會有與分量Y、Cb和Cr相對應(yīng)的三個偶數(shù)半幀和三個奇數(shù)半幀。
在上述描述中,一部分可表示除16條連續(xù)掃描行以外的一組連續(xù)掃描行。同樣,也可以使用劇院相同或不同色彩分量數(shù)的不同色彩空間來表示一圖像像素。
圖2示出編碼器200的一個實(shí)施例,其包括圖像壓縮器205、音頻壓縮器215、后端處理器230和參數(shù)發(fā)生器250。當(dāng)編碼器200接收數(shù)字信息時,參數(shù)發(fā)生器250產(chǎn)生并輸出至少用于數(shù)字圖像數(shù)據(jù)壓縮的最終編碼參數(shù)。然后,圖像壓縮器205使用來自參數(shù)發(fā)生器250的最終編碼參數(shù)來壓縮數(shù)字圖像信息。
圖像壓縮器205可以逐區(qū)域地壓縮數(shù)字圖像數(shù)據(jù)。這里,一個區(qū)域可以是一圖像幀的一部分、一個圖像幀、或是多個圖像幀。編碼器200可包括存儲介質(zhì)(未示出),比如緩沖器,它能夠逐區(qū)域地壓縮數(shù)字圖像數(shù)據(jù)。此外,圖像壓縮器205可以使用任何數(shù)量的壓縮技術(shù)來壓縮數(shù)字圖像信息。根據(jù)該壓縮技術(shù),參數(shù)發(fā)生器250產(chǎn)生并輸出一類或多類編碼參數(shù),下文中稱為參數(shù)組。為了產(chǎn)生最終的參數(shù)組,參數(shù)發(fā)生器250可包括第二圖像壓縮器252以及與圖像壓縮器205和252耦合的處理器254。
數(shù)字圖像信息最初由第二圖像壓縮器252使用第一組參數(shù)來壓縮。圖像壓縮器252在與圖像壓縮器205的壓縮過程相類似的過程中壓縮數(shù)字圖像信息。同樣,第一組參數(shù)可以是系統(tǒng)中保存的缺省參數(shù)組,或是由系統(tǒng)用戶在編碼過程期間手動選擇的參數(shù)組。在壓縮后,處理器254分析為被壓縮數(shù)據(jù)產(chǎn)生的比特率。
在一實(shí)施例中,處理器254確定第一組參數(shù)的使用是否導(dǎo)致劇院所選數(shù)據(jù)比特率的任何被壓縮數(shù)據(jù)的區(qū)域。例如,處理器254設(shè)定一條件以確定所產(chǎn)生的數(shù)據(jù)比特率是否大于所選的閾值。所選的閾值可以根據(jù)系統(tǒng)被設(shè)為受限帶寬所允許的最大比特率和/或在一段時間內(nèi)的平均比特率。
如果對于一區(qū)域不滿足該條件,處理器254就會自動改變或調(diào)整一個或多個參數(shù)來產(chǎn)生第二組參數(shù)。第二組參數(shù)被輸出作為第一組參數(shù),不滿足條件的區(qū)域由圖像壓縮器252使用新的第一組參數(shù)再次壓縮。當(dāng)數(shù)據(jù)比特率滿足設(shè)定的條件時,處理器254輸出所產(chǎn)生的這組參數(shù)作為最終參數(shù)組,圖像壓縮器205使用來自處理器254的最終參數(shù)組來壓縮數(shù)字圖像信息。
在另一實(shí)施例中,處理器254自動向系統(tǒng)用戶顯示具有所選數(shù)據(jù)比特率的被壓縮數(shù)據(jù)的區(qū)域。例如,可以顯示其數(shù)據(jù)比特率大于所選閾值的區(qū)域。根據(jù)顯示內(nèi)容,系統(tǒng)用戶能調(diào)整一個或多個參數(shù)以產(chǎn)生第二組參數(shù),第二組參數(shù)被輸出作為第一組參數(shù)。然后,這種區(qū)域由圖像壓縮器252用新的第一組參數(shù)再次壓縮。當(dāng)沒有具有所選數(shù)據(jù)比特率的區(qū)域時,處理器254輸出所產(chǎn)生的第一組參數(shù),作為到壓縮器205的最終參數(shù)組。
數(shù)字信息的音頻部分一般被傳送到音頻壓縮器215用于壓縮。音頻壓縮器215也可以用任何數(shù)量的壓縮技術(shù)來壓縮數(shù)字音頻圖像信息。被壓縮的數(shù)字信息被接收并由后端處理器230處理。例如,被壓縮的圖像和音頻信息可以用多種已知加密技術(shù)中的任一種來加密。被壓縮的信息可以與同步信息一起被復(fù)用并被分組化。這里,同步信息能夠在劇院子系統(tǒng)104處以時間對齊的方式回放圖像和音頻流的信息。在另一實(shí)施例中,圖像和音頻信息也可以被分開處理,而不是被復(fù)用,然后被分開地分組化。經(jīng)處理的圖像和音頻信息會被發(fā)送到集線器存儲介質(zhì)130用于存儲在存儲介質(zhì)上。
在上述實(shí)施例中,數(shù)字圖像和音頻信息可以在壓縮前被保存在幀緩沖器(未示出)中。同樣,圖像壓縮器205、音頻壓縮器215、后端處理器230和參數(shù)發(fā)生器250中的一個或多個能夠在一個或多個專用集成電路(ASIC)或電路卡部件中實(shí)現(xiàn)。此外,圖像壓縮器205、音頻壓縮器215、后端處理器230和參數(shù)發(fā)生器250中的一個或多個能由軟件、固件或軟件、固件和硬件的組合來實(shí)現(xiàn)。在一實(shí)施例中,參數(shù)發(fā)生器250在第一ASIC中實(shí)現(xiàn),圖像壓縮器205在第二ASIC中實(shí)現(xiàn)。兩個ASIC在幀時間上有偏移,使得一個ASIC提供編碼參數(shù),第二ASIC使用所述編碼參數(shù)來壓縮數(shù)據(jù)。
圖3示出編碼器300的另一實(shí)施例,其包括圖像壓縮器310、音頻壓縮器320、后端處理器330和參數(shù)發(fā)生器350。類似于編碼器200,在編碼器200接收數(shù)字信息時,參數(shù)發(fā)生器260輸出至少用于數(shù)字圖像數(shù)據(jù)壓縮的一組參數(shù)。圖像壓縮器310使用來自參數(shù)發(fā)生器350的這組參數(shù)來壓縮數(shù)字圖像信息。
在編碼器200中,編碼器300的圖像壓縮器305會逐區(qū)域地壓縮數(shù)字圖像數(shù)據(jù)。編碼器300可包括存儲介質(zhì)(未示出),比如緩沖器,其能夠逐區(qū)域地壓縮數(shù)字圖像數(shù)據(jù)。同樣,根據(jù)壓縮技術(shù),參數(shù)發(fā)生器350輸出一類或多類編碼參數(shù)。
然而,在編碼器300中,為了產(chǎn)生最終參數(shù)組未實(shí)現(xiàn)分開的圖像壓縮器。根據(jù)需要,圖像壓縮器310使用參數(shù)發(fā)生器350輸出的一組參數(shù)對數(shù)字圖像數(shù)據(jù)進(jìn)行重復(fù)壓縮。數(shù)字圖像信息由圖像壓縮器310使用第一組參數(shù)來壓縮,然后,處理器354分析為被壓縮數(shù)據(jù)產(chǎn)生的比特率。根據(jù)所述分析,參數(shù)發(fā)生器350能調(diào)整第一組參數(shù)來產(chǎn)生第二組參數(shù),或者把第一組參數(shù)確定為最終的參數(shù)組。
在編碼器300的一個實(shí)施例中,處理器354確定第一參數(shù)的使用是否導(dǎo)致劇院所選數(shù)據(jù)比特率的任何被壓縮數(shù)據(jù)的區(qū)域。例如,處理器354設(shè)定一條件以確定該比特率是否大于所選的閾值。這里,所選的閾值也被設(shè)為受限帶寬所允許的最大比特率和/或一段時間內(nèi)的平均比特率。如果對于一區(qū)域不滿足該條件,處理器354就自動地改變或調(diào)整一個或多個參數(shù)來產(chǎn)生第二組參數(shù)。于是輸出第二組參數(shù)作為第一組參數(shù),圖像壓縮器310使用新的第一組參數(shù)再次壓縮不滿足條件的區(qū)域。當(dāng)數(shù)據(jù)比特率滿足設(shè)定的條件時,處理器354會輸出第一組參數(shù)作為最終的參數(shù)組,圖像壓縮器310能使用最終的參數(shù)組來壓縮數(shù)字圖像信息?;蛘?,當(dāng)數(shù)據(jù)比特率滿足所設(shè)定的條件時,處理器354會把所產(chǎn)生的第一組參數(shù)確定為最終參數(shù)組,并且停止壓縮該區(qū)域。
在編碼器300的另一實(shí)施例中,處理器354自動向系統(tǒng)用戶顯示具有所選數(shù)據(jù)比特率的被壓縮數(shù)據(jù)的區(qū)域。例如,可以顯示其數(shù)據(jù)比特率大于所選閾值的區(qū)域。根據(jù)顯示內(nèi)容,系統(tǒng)用戶可以調(diào)整一個或多個參數(shù)來產(chǎn)生并輸出第二組參數(shù)作為第一組參數(shù)。然后這些區(qū)域由圖像壓縮器320用新的第一組參數(shù)再次壓縮。在沒有具有所選數(shù)據(jù)比特率的區(qū)域時,處理器354可以輸出所產(chǎn)生的第一組參數(shù),作為供壓縮器310壓縮的最終參數(shù)組,并且能簡單地終止壓縮。
數(shù)字信息的音頻部分被傳送到音頻壓縮器320用于壓縮,后端處理器330像編碼器200中那樣處理被壓縮的信息。
在上述實(shí)施例中,第一組參數(shù)可以是缺省的參數(shù)組,或可像編碼器200中那樣手動選擇。同樣,數(shù)字圖像和音頻信息可以在壓縮前被保存在幀緩沖器(未示出)中。而且,類似于編碼器200,圖像壓縮器310、音頻壓縮器320、后端處理器330和參數(shù)發(fā)生器350中的一個或多個可以在一個或多個ASIC和/或電路卡部件中實(shí)現(xiàn)。圖像壓縮器310、音頻壓縮器320、后端處理器330和參數(shù)發(fā)生器350中的一個或多個可由軟件、固件或軟件、固件和硬件的組合來實(shí)現(xiàn)。
圖4示出產(chǎn)生用于圖像數(shù)據(jù)壓縮的一組參數(shù)的一種方法的實(shí)施例。在接收后,圖像數(shù)據(jù)用第一組參數(shù)來壓縮(方框410)。如上所述,圖像數(shù)據(jù)可以逐區(qū)域地被壓縮。此后,把壓縮所產(chǎn)生的數(shù)據(jù)比特率與所選的閾值T相比較(方框420)。這里,數(shù)據(jù)比特率可由系統(tǒng)自動地分析和比較,或者可由系統(tǒng)用戶手動地分析和比較。同樣,閾值T根據(jù)一比特率來確定,使得解碼器175不會在解碼期間停止。所選的閾值T根據(jù)系統(tǒng)被設(shè)為受限帶寬所允許的最大比特率和/或一段時間內(nèi)的平均比特率。
如果一區(qū)域的數(shù)據(jù)比特率大于所述閾值,則調(diào)整第一組參數(shù)以便為所述區(qū)域產(chǎn)生第二組參數(shù)(方框430)。第二組參數(shù)被輸出作為第一組參數(shù)(方框440)并且用新的第一組參數(shù)再次壓縮與該區(qū)域相對應(yīng)的數(shù)字圖像數(shù)據(jù)(方框410)。所產(chǎn)生的數(shù)據(jù)比特率再次與所選的閾值相比較(方框420)。當(dāng)一組參數(shù)導(dǎo)致圖像的數(shù)據(jù)比特率不大于所述閾值時,該組參數(shù)被確定為用于壓縮圖像信息的最終參數(shù)(方框450)。
在調(diào)整參數(shù)時,可以調(diào)整一個或多個參數(shù)。同樣,該組參數(shù)內(nèi)的參數(shù)類型取決于壓縮技術(shù)。圖5示出圖像壓縮器500的一個實(shí)施例。
圖像壓縮器500包括變換模塊510、量化模塊520和可變長度編碼(VLC)模塊530。變換模塊510把數(shù)字圖像信息從空間域轉(zhuǎn)換到頻域,并且產(chǎn)生變換系數(shù)。量化模塊520使用量化步距(Q-步距)來量化變換參數(shù),VLC 530使用可變長度編碼技術(shù)來壓縮經(jīng)量化的變換系數(shù)。
在一實(shí)施例中,變換模塊510可以是離散余弦變換(DCT)模塊,它被時間采樣的信號轉(zhuǎn)換成同一信號的頻率表示。例如,圖像壓縮器500使用自適應(yīng)大小的DCT(ABSDCT)技術(shù)來處理數(shù)字圖像信號,該ABSDCT技術(shù)在美國專利號5,021,345和5,452,104中描述。
每一個亮度和色度分量都被傳送到塊交織器(未示出)。向塊交織器呈現(xiàn)16×16的塊,塊交織器對16×16塊內(nèi)的圖像采樣排序以產(chǎn)生供DCT分析的多個塊和合成數(shù)據(jù)子塊。在一實(shí)施例中,一個16×16 DCT應(yīng)用于第一排序,四個8×8 DCT應(yīng)用于第二排序,16個4×4 DCT應(yīng)用于第三排序,64個2×2 DCT應(yīng)用于第四排序。在執(zhí)行DCT后,大多數(shù)圖像信號能量都會聚集在少量DCT系數(shù)中。
對于16×16塊以及每個子塊,分析經(jīng)變換的系數(shù)以確定對該塊或子塊編碼所需的比特?cái)?shù)。于是,為表示圖像分段而選擇要求最少比特?cái)?shù)進(jìn)行編碼的塊或子塊的組合。例如,為表示圖像分段可以選擇兩個8×子塊、六個4×4子塊和八個2×2子塊。然后,所選的塊或子塊的組合被正確排序。然后,DCT系數(shù)值經(jīng)受進(jìn)一步的處理,比如但不限于圖5所示的量化和可變長度編碼。
而且,在一實(shí)施例中,DCT系數(shù)可以使用加權(quán)函數(shù)來量化,比如對人眼最優(yōu)的頻率權(quán)重掩碼(FWM)。如果與ABSDCT結(jié)合使用,則每個塊大小(16×16、8×8、4×4和2×2)會有一個不同的FWM表。也會有至少三個不同組的FWM表,每組對應(yīng)于每個分量Y、Cb和Cr。
同樣,在一實(shí)施例中,VLC 430會包括一哈夫曼引擎,其用于對非零的AC系數(shù)值以及零值的運(yùn)轉(zhuǎn)周期進(jìn)行哈夫曼編碼。也就是,哈夫曼碼表示非零AC系數(shù)前的零的個數(shù)、以及該非零AC系數(shù)的尺寸(用于放映所需的最小比特?cái)?shù))。因而,DCT系數(shù)經(jīng)運(yùn)轉(zhuǎn)周期編碼以產(chǎn)生零值運(yùn)轉(zhuǎn)周期和后續(xù)非零AC系數(shù)的相應(yīng)尺寸的不同對。這里,可以使用鋸齒形掃描或其它掃描模式來增加零值周期。然后使用這些表格根據(jù)編碼出現(xiàn)的概率向不同的經(jīng)運(yùn)轉(zhuǎn)周期編碼的對分配編碼。短編碼被分配給出現(xiàn)較頻繁的對,較長的編碼被分配給出現(xiàn)較不頻繁的對。哈夫曼編碼后附有AC系數(shù)的實(shí)際值,并被發(fā)送。
對于編碼和解碼,哈夫曼編碼表分別被保存在編碼器120和解碼器175中。此外,可以使用一個或多個哈夫曼編碼表。例如,在使用YcbCr色彩空間時,可以使用至少三個不同的哈夫曼編碼表,每個編碼表用于各自的色彩分量Y、Cb和Cr。
如上所述,數(shù)字圖像數(shù)據(jù)可以用許多不同技術(shù)之一或組合來壓縮,包括但不限于ABSDCT、量化、用FWM的量化以及哈夫曼編碼。參數(shù)組取決于壓縮技術(shù)并可調(diào)整以影響比特率。例如,通過增加Q步距,數(shù)據(jù)比特率減小。這里,調(diào)整Q步距的增量可以是固定的或是以任何尺寸手動地變化。同樣,可以為圖像幀的一部分產(chǎn)生不統(tǒng)一的Q步距組。
如果實(shí)現(xiàn)ABSDCT,該參數(shù)組會包括一閾值(下文中稱為ABSDCT閾值),該閾值控制圖像幀怎樣被分成不同的塊和/或子塊。例如,ABSDCT閾值可以是對2×2子塊、4×4子塊和/或8×8子塊的數(shù)量限制。在這種情況下,提高ABSDCT閾值會改進(jìn)圖像質(zhì)量,但也會提高比特率。降低ABSDCT閾值可能影響圖像質(zhì)量但會降低比特率。
如果為量化而使用FWM表,則參數(shù)組會包括FWM表。而且,如果使用了哈夫曼編碼,則參數(shù)組會包括哈夫曼編碼表。使用不同的FWM表和/或不同的哈夫曼編碼表會影響并降低比特率。
因此在某些實(shí)施例中,一組參數(shù)可包括Q步距、ABSDCT閾值、FWM表和哈夫曼編碼表中的一個或它們的組合,因而,如果從一組參數(shù)產(chǎn)生的數(shù)據(jù)比特率大于所選的閾值,則可以調(diào)整一個或多個上述參數(shù)。例如,可以降低Q步距,提高ABSDCT閾值、應(yīng)用不同的FWM表以及/或者使用不同的哈夫曼編碼表。
在調(diào)整至少包括兩個參數(shù)的參數(shù)組時,一次可調(diào)整一個參數(shù)來得出該參數(shù)組?;蛘撸淮慰烧{(diào)整多個參數(shù)來得出該參數(shù)組。同樣,在調(diào)整參數(shù)時能使用統(tǒng)計(jì)分析。在這一情況下,在參數(shù)發(fā)生器250和350中可實(shí)現(xiàn)統(tǒng)計(jì)量發(fā)生器(未示出)以產(chǎn)生統(tǒng)計(jì)分析?;蛘撸y(tǒng)計(jì)分析可由處理器254或354產(chǎn)生。根據(jù)統(tǒng)計(jì)分析,系統(tǒng)或系統(tǒng)用戶能調(diào)整一個或多個參數(shù)以降低比特率。
統(tǒng)計(jì)分析的一個實(shí)施例可包括分析圖像的每像素比特。假定所選的比特率閾值為T,圖6示出一個圖像幀的每像素比特分析。如圖所示,像素n到m超出比特率閾值T。因而,調(diào)整一個或多個參數(shù),并且再次壓縮圖像幀。此外,圖7示出逐區(qū)域壓縮的圖像的比特率分析。這里,一個區(qū)域可以是一個或多個16×16塊、一個或多個部分、一個或多個半幀、或者一個或多個圖像幀。如圖所示,區(qū)域2和3高于閾值。因而,區(qū)域2和3的一個或多個參數(shù)可被調(diào)整和再次壓縮以降低比特率。
還可以執(zhí)行進(jìn)一步的分析來確定編碼參數(shù)的有效性。例如,假定一圖像幀對于ABSDCT有16×16個數(shù)據(jù)塊且子塊大小為8×8、4×4和2×2。這里,一圖像幀的統(tǒng)計(jì)量可以是25%的16×16塊、5%的8×8塊、20%的4×4塊以及50%的2×2塊。這里,可能期望少于50%的2×2塊的圖像幀分配。在這種情況下,為了減少比特率,子塊2×2的數(shù)目會受ABSDCT閾值所限制。同樣,哈夫曼編碼期間在哈夫曼編碼表中使用的編碼百分比也表明哈夫曼編碼的有效性。例如,如果僅使用了5%的編碼,則使用不同的哈夫曼編碼表會導(dǎo)致減少了的比特率。
因此,各個實(shí)施例也能壓縮要被監(jiān)視和控制的數(shù)字圖像信息以產(chǎn)生所選的比特率。特別是,壓縮的數(shù)據(jù)比特率會受限制,使得沒有圖像部分會導(dǎo)致可能在解碼期間停止解碼器的高比特率。
被壓縮的信息從集線器102被發(fā)送到劇院子系統(tǒng)104。被壓縮的信息可以被存儲在集線器存儲模塊130中并在物理上被傳輸。被壓縮的信息或其部分也可以使用任何無線和/或有線的傳輸方法被發(fā)送到劇院子系統(tǒng)104。被壓縮信息的無線和/或有線傳輸允許影片的實(shí)時傳遞和回放。
當(dāng)要瀏覽一節(jié)目時,節(jié)目信息可通過劇院管理器160被檢索并傳送到觀眾席模塊170。每個觀眾席模塊170可以處理并顯示與同一劇院子系統(tǒng)104中的其它觀眾席模塊170所不同的節(jié)目,或者一個或多個觀眾席模塊170能同時處理和顯示同一節(jié)目。
在觀眾席170處,根據(jù)需要,被壓縮的信息被解密,并且使用與編碼器120處所使用的壓縮算法相反的解壓縮算法來解壓縮。例如,如果圖像壓縮是基于ABSDCT算法,則解壓縮過程會包括可變長度解碼、IDCT和DCT塊組合解交織。經(jīng)解壓縮的圖像信息此后被轉(zhuǎn)換成供顯示的標(biāo)準(zhǔn)視頻格式(或是模擬或是數(shù)字格式),并且顯示圖像。還解壓并提供了音頻信息供圖像節(jié)目的回放。
上述實(shí)施例能夠監(jiān)視、控制和限制被編碼器壓縮的數(shù)據(jù)的比特率。結(jié)果,解碼器由于高數(shù)據(jù)速率而延遲的概率大大降低。同樣,通過根據(jù)統(tǒng)計(jì)分析來控制數(shù)據(jù)比特率,也能使對圖像質(zhì)量的影響最小。因此,能夠更有效地解碼和回放數(shù)字?jǐn)?shù)據(jù)。
應(yīng)該注意到,上述實(shí)施例僅僅是示例性的,并應(yīng)被視為限制本發(fā)明。本發(fā)明的描述是說明性的,而不是限制權(quán)利要求的范圍。這樣,本發(fā)明的原理能容易地應(yīng)用于其它類型的裝置,許多替換、修改和變化對于本領(lǐng)域的技術(shù)人員將顯而易見。
權(quán)利要求
1.一種裝置,包括源發(fā)生器,被配置成把圖像信息轉(zhuǎn)換成數(shù)字圖像信息;以及與源發(fā)生器耦合的編碼器,所述編碼器被配置成從源發(fā)生器接收數(shù)字圖像信息,并包括用于輸出至少第一組參數(shù)的參數(shù)發(fā)生器;與所述參數(shù)發(fā)生器耦合的第一圖像處理器,所述第一圖像處理器用第一組參數(shù)來壓縮數(shù)字圖像信息。
2.如權(quán)利要求1所述的裝置,其特征在于,所述參數(shù)發(fā)生器包括第二圖像處理器,其用第二組參數(shù)來壓縮數(shù)字信息;與所述第一和第二圖像處理器耦合的處理器,所述處理器用于輸出第二組參數(shù),如果第二組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率,則所述處理器調(diào)整第二組參數(shù)并輸出第三組參數(shù)作為第二組參數(shù),否則,則輸出第二組參數(shù)作為第一組參數(shù)。
3.如權(quán)利要求2所述的裝置,其特征在于,所述參數(shù)發(fā)生器還包括與所述處理器耦合的統(tǒng)計(jì)量發(fā)生器,所述統(tǒng)計(jì)量發(fā)生器被配置成產(chǎn)生一統(tǒng)計(jì)分析;且其中所述處理器根據(jù)所述統(tǒng)計(jì)分析來調(diào)整第二組參數(shù)。
4.如權(quán)利要求1所述的裝置,其特征在于,所述參數(shù)發(fā)生器包括用于處理第一組參數(shù)的處理器,如果第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率,所述處理器就調(diào)整第一組參數(shù)以產(chǎn)生第二組參數(shù),并且輸出第二組參數(shù)作為第一組參數(shù)。
5.如權(quán)利要求4所述的裝置,其特征在于,所述參數(shù)發(fā)生器還包括與所述處理器耦合的統(tǒng)計(jì)量發(fā)生器,所述統(tǒng)計(jì)量發(fā)生器被配置成產(chǎn)生一統(tǒng)計(jì)分析;且其中所述處理器根據(jù)所述統(tǒng)計(jì)分析來調(diào)整第一組參數(shù)。
6.如權(quán)利要求5所述的裝置,其特征在于,所述統(tǒng)計(jì)分析或包括分析圖像的每像素比特、或確定第一組參數(shù)的有效性。
7.如任一前述權(quán)利要求所述的裝置,其特征在于,所述第一組參數(shù)包括Q步距,所述第一圖像壓縮器包括變換模塊,用于把數(shù)字圖像信息從空間域轉(zhuǎn)換為頻域,所述變換模塊用于產(chǎn)生變換系數(shù);量化模塊,其使用Q步距來量化所述變換系數(shù);以及可變長度編碼模塊,用于壓縮經(jīng)量化的變換系數(shù)。
8.如權(quán)利要求7所述的裝置,其特征在于,所述第一組參數(shù)還包括頻率權(quán)重掩碼FWM表,所述量化模塊用FWM表和Q步距來量化所述變換系數(shù)。
9.如權(quán)利要求7或8所述的裝置,其特征在于,所述第一組參數(shù)還包括哈夫曼編碼表,可變長度編碼模塊包括一哈夫曼引擎,其使用哈夫曼編碼表來壓縮經(jīng)量化的變換系數(shù)。
10.如權(quán)利要求7或從屬于其的任一權(quán)利要求8-9所述的裝置,其特征在于,所述第一組參數(shù)還包括一自適應(yīng)塊尺寸離散變換ABSDCT閾值,所述變換模塊包括一ABSDCT模塊,其根據(jù)ABSDCT閾值使用ABSDCT把數(shù)字圖像信息從空間域轉(zhuǎn)換為頻域。
11.如任一前述權(quán)利要求所述的裝置,其特征在于,所述數(shù)字圖像信息至少是影片的一部分。
12.一種用于對數(shù)字圖像信息進(jìn)行編碼的方法,包括產(chǎn)生并輸出至少第一組參數(shù);使用所述第一組參數(shù)來壓縮所述數(shù)字圖像信息;以及如果第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率則調(diào)整第一組參數(shù)以產(chǎn)生第二組參數(shù),并且輸出第二組參數(shù)作為第一組參數(shù)。
13.如權(quán)利要求12所述的方法,其特征在于,壓縮所述數(shù)字圖像信息包括把所述數(shù)字圖像信息從空間域轉(zhuǎn)換為頻域并產(chǎn)生變換系數(shù);用第一Q步距來量化所述變換系數(shù);以及對經(jīng)量化的變換系數(shù)進(jìn)行可變長度編碼。
14.如權(quán)利要求13所述的方法,其特征在于,所述第一組參數(shù)包括第一Q步距,調(diào)整所述第一組參數(shù)包括如果第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率則調(diào)整第一Q步距以產(chǎn)生第二組參數(shù),并且輸出第二組參數(shù)作為第一組參數(shù)。
15.如權(quán)利要求13或14所述的方法,其特征在于,量化所述變換系數(shù)包括使用第一Q步距和第一頻率權(quán)重掩碼FWM表來量化所述變換系數(shù)。
16.如權(quán)利要求15所述的方法,其特征在于,所述第一組參數(shù)包括第一Q步距和FWM表,其中調(diào)整第一組參數(shù)包括如果第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率,則調(diào)整第一Q步距和第一FWM表中的任一或兩者以產(chǎn)生第二組參數(shù),以及輸出第二組參數(shù)作為第一組參數(shù)。
17.如權(quán)利要求13或從屬于其的任一權(quán)利要求14-16所述的方法,其特征在于,轉(zhuǎn)換數(shù)字圖像信息包括根據(jù)第一ABSDCT閾值使用ABSDCT來轉(zhuǎn)換所述數(shù)字圖像信息。
18.如權(quán)利要求17所述的方法,其特征在于,所述第一組參照包括第一Q步距和第一ABSDCT閾值,其中調(diào)整第一組參數(shù)包括如果第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率,則調(diào)整第一Q步距和第一ABSDCT閾值中的任一或兩者以產(chǎn)生第二組參數(shù),以及輸出第二組參數(shù)作為第一組參數(shù)。
19.如權(quán)利要求18所述的方法,其特征在于,所述可變長度編碼包括使用第一哈夫曼編碼表對經(jīng)量化的變換系數(shù)進(jìn)行哈夫曼編碼。
20.如權(quán)利要求19所述的方法,其特征在于,所述第一組參數(shù)包括第一Q步距和第一哈夫曼編碼表,其中調(diào)整第一組參數(shù)包括如果第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率,則調(diào)整第一Q步距和第一哈夫曼編碼表中的任一或兩者以產(chǎn)生第二組參數(shù),以及輸出第二組參數(shù)作為第一組參數(shù)。
21.如權(quán)利要求12或從屬于其的任一權(quán)利要求13-20所述的方法,其特征在于,所述調(diào)整第一組參數(shù)包括根據(jù)統(tǒng)計(jì)分析調(diào)整第一組參數(shù)以產(chǎn)生第二組參數(shù)。
22.如權(quán)利要求21所述的方法,其特征在于,所述調(diào)整第一組參數(shù)包括根據(jù)每像素比特分析調(diào)整第一組參數(shù)以確定第一組參數(shù)的使用是否會導(dǎo)致所選的數(shù)據(jù)比特率。
23.如權(quán)利要求12或從屬于其的任一權(quán)利要求13-22所述的方法,其特征在于,所述所選的比特率取決于受限帶寬所允許的最大比特率或一段時間內(nèi)的平均比特率之一。
24.一種用于對數(shù)字圖像信息進(jìn)行編碼的裝置,包括用于輸出至少第一組參數(shù)的裝置;以及使用所述第一組參數(shù)來壓縮所述數(shù)字圖像信息的第一裝置。
25.如權(quán)利要求24所述的裝置,其特征在于,所述用于輸出至少第一組參數(shù)的裝置包括使用第二組參數(shù)來壓縮所述數(shù)字信息的第二裝置;用于輸出第二組參數(shù)的裝置;用于調(diào)整第二組參數(shù)以產(chǎn)生第三組參數(shù)的裝置;以及如果第二組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率則輸出第三組參數(shù)作為第二組參數(shù)、否則輸出第二組參數(shù)作為第一組參數(shù)的裝置。
26.如權(quán)利要求24所述的裝置,其特征在于,所述用于輸出至少第一組參數(shù)的裝置包括如果第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率則調(diào)整第一組參數(shù)以產(chǎn)生第二組參數(shù)的裝置;以及用于輸出第二組參數(shù)作為第一組參數(shù)的裝置。
27.一種用于對數(shù)字圖像信息進(jìn)行編碼的裝置,包括用于輸出至少第一組參數(shù)的參數(shù)發(fā)生器;與所述參數(shù)發(fā)生器耦合的第一圖像壓縮器,所述第一圖像壓縮器使用所述第一組參數(shù)來壓縮所述數(shù)字圖像信息。
28.如權(quán)利要求27所述的裝置,其特征在于,所述參數(shù)發(fā)生器包括使用第二組參數(shù)來壓縮所述數(shù)字信息的第二圖像壓縮器;與所述第一和第二圖像壓縮器耦合的處理器,所述處理器用于輸出第二組參數(shù),如果第二組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率,則所述處理器調(diào)整第二組參數(shù)并輸出第三組參數(shù)作為第二組參數(shù),否則輸出第二組參數(shù)作為第一組參數(shù)。
29.如權(quán)利要求27所述的裝置,其特征在于,所述參數(shù)發(fā)生器包括用于輸出第一組參數(shù)的處理器,如果第一組參數(shù)的使用導(dǎo)致所選的數(shù)據(jù)比特率,則所述處理器調(diào)整第一組參數(shù)以產(chǎn)生第二組參數(shù),并且輸出第二組參數(shù)作為第一組參數(shù)。
全文摘要
公開了一種用于限制被壓縮數(shù)據(jù)的比特率的裝置和方法。所述裝置和方法能夠根據(jù)從不同參數(shù)的使用中而產(chǎn)生的數(shù)據(jù)比特率來生成用于對數(shù)字圖像數(shù)據(jù)進(jìn)行編碼的參數(shù)。在一實(shí)施例中,執(zhí)行一統(tǒng)計(jì)分析來確定所述不同的參數(shù)。參數(shù)的使用導(dǎo)致一比特率,該比特率會阻止解碼器在解壓縮期間延遲而同時允許編碼器不影響質(zhì)量地進(jìn)行壓縮。因此,能實(shí)現(xiàn)更有效的編碼和解碼。
文檔編號G06K9/36GK1672166SQ03817996
公開日2005年9月21日 申請日期2003年7月29日 優(yōu)先權(quán)日2002年7月29日
發(fā)明者S·戈文達(dá)斯瓦彌, B·T·富奇, A·C·愛爾文, K·S·賽格拉簡 申請人:高通股份有限公司