視頻自適應優(yōu)化的方法及裝置的制作方法

文檔序號：7851342閱讀：274來源：國知局

專利名稱：視頻自適應優(yōu)化的方法及裝置的制作方法
技術領域：
本發(fā)明屬于視頻優(yōu)化領域，尤其涉及視頻自適應優(yōu)化的方法及裝置。
背景技術：
目前，人們可以很方便的從互聯網上找到自己喜歡的視頻文件，但是視頻文件的清晰度和色彩卻不盡如人意，隨著多媒體技術的發(fā)展，人們對視頻質量和形式的要求越來越尚?，F有技術中，通過調整視頻數據的亮度或色階來優(yōu)化輸入的視頻數據，由于現有的視頻優(yōu)化方法調整的參數過于單一，且為了方便，通常是設置ー個固定值統(tǒng)ー調整所有輸入的視頻數據，因此采用現有視頻優(yōu)化方法難以獲取清晰、色彩艷麗的圖像。

發(fā)明內容
本發(fā)明實施例提供了一種視頻自適應優(yōu)化的方法，g在解決現有方法難以獲取清晰、色彩艷麗的圖像的問題。本發(fā)明實施例是這樣實現的，一種視頻自適應優(yōu)化的方法，所述方法包括下述步驟步驟a，讀取多媒體文件，并分離所述多媒體文件的音頻文件和視頻文件；步驟b，解碼分離的視頻文件，并讀取解碼后的視頻文件的ー幀圖像數據；步驟c，分別抽取所述幀圖像數據的R、G、B通道的通道數據，根據每個通道的通道數據來設置每個通道的低設置閾值和高設置閾值；步驟d，將圖像數據的R、G、B三種通道的通道數據分別與其對應的低設置閾值和高設置閾值比較，井根據比較結果設置相應通道的通道數據；步驟e，將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量，井分別處理分離的高頻分量和低頻分量；步驟f·，將經過處理的高頻分量和低頻分量重新合成ー幀圖像數據；步驟g，計算所述重新合成的一幀圖像數據的直方圖，井根據計算結果與預設的伽瑪值表調整所述重新合成的一幀圖像數據的伽瑪值，所述預設的伽瑪值表存儲了直方圖與伽瑪值的對應關系；步驟h，將伽瑪值調整后的圖像數據與其對應的音頻數據重新組合并輸出；重復執(zhí)行步驟b至步驟h，直到多媒體文件的視頻文件全部處理結束。本發(fā)明實施例的另ー目的在于提供一種視頻自適應優(yōu)化的裝置，所述裝置包括音視頻文件分離單元，用于讀取多媒體文件，井分離所述多媒體文件的音頻文件和視頻文件；圖像數據幀讀取単元，用于解碼分離的視頻文件，并讀取解碼后的視頻文件的一幀圖像數據；高低閾值設置単元，用于分別抽取所述幀圖像數據的R、G、B通道的通道數據，根據每個通道的通道數據來設置每個通道的低設置閾值和高設置閾值；圖像數據重置単元，用于將圖像數據的R、G、B三種通道的通道數據分別與其對應的低設置閾值和高設置閾值比較，井根據比較結果設置相應通道的通道數據；高低頻分量處理單元，用于將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量，井分別處理分離的高頻分量和低頻分量；圖像幀重新合成単元，用于將經過處理的高頻分量和低頻分量重新合成一幀圖像數據；伽瑪值調整単元，用于計算所述重新合成的一幀圖像數據的直方圖，井根據計算結果與預設的伽瑪值表調整所述重新合成的一幀圖像數據的伽瑪值，所述預設的伽瑪值表存儲了直方圖與伽瑪值的對應關系；音視頻數據輸出単元，用于將伽瑪值調整后的圖像數據與其對應的音頻數據重新組合并輸出；重復執(zhí)行圖像數據幀讀取單元至音視頻數據輸出單元，直到多媒體文件的視頻文件全部處理結束。在本發(fā)明實施例中，能夠使圖像以最佳觀賞方式展現給用戶，實現視頻的最佳優(yōu)化，對整部影片實現自適應的最佳視頻優(yōu)化，改善視頻的觀賞效果。

圖I是本發(fā)明第一實施例提供的一種視頻自適應優(yōu)化的方法的流程示意圖；圖2是本發(fā)明第二實施例提供的一種視頻自適應優(yōu)化的裝置的結構示意圖。
具體實施例方式為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白，以下結合附圖及實施例，對本發(fā)明進行進ー步詳細說明。應當理解，此處所描述的具體實施例僅僅用以解釋本發(fā)明，并不用于限定本發(fā)明。本發(fā)明實施例中，根據每ー幀圖像數據的特征，調整適合本幀圖像的最佳對比度、飽和度、銳度和伽馬值。本發(fā)明實施例提供了ー種視頻自適應優(yōu)化的方法及裝置。所述方法包括步驟a，讀取多媒體文件，并分離所述多媒體文件的音頻文件和視頻文件；步驟b，解碼分離的視頻文件，并讀取解碼后的視頻文件的ー幀圖像數據；步驟C，分別抽取所述幀圖像數據的R、G、B通道的通道數據，根據每個通道的通道數據來設置每個通道的低設置閾值和高設置閾值；步驟d，將圖像數據的R、G、B三種通道的通道數據分別與其對應的低設置閾值和高設置閾值比較，井根據比較結果設置相應通道的通道數據；步驟e，將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量，井分別處理分離的高頻分量和低頻分量；步驟f，將經過處理的高頻分量和低頻分量重新合成ー幀圖像數據；步驟g，計算所述重新合成的一幀圖像數據的直方圖，井根據計算結果與預設的伽瑪值表調整所述重新合成的一幀圖像數據的伽瑪值，所述預設的伽瑪值表存儲了直方圖與伽瑪值的對應關系；步驟h，將伽瑪值調整后的圖像數據與其對應的音頻數據重新組合并輸出；重復執(zhí)行步驟b至步驟h，直到多媒體文件的視頻文件全部處理結束。所述裝置包括音視頻文件分離單元，用于讀取多媒體文件，井分離所述多媒體文件的音頻文件和視頻文件；圖像數據幀讀取単元，用于解碼分離的視頻文件，并讀取解碼后的視頻文件的一幀圖像數據；
高低閾值設置単元，用于分別抽取所述幀圖像數據的R、G、B通道的通道數據，根據每個通道的通道數據來設置每個通道的低設置閾值和高設置閾值；圖像數據重置単元，用于將圖像數據的R、G、B三種通道的通道數據分別與其對應的低設置閾值和高設置閾值比較，井根據比較結果設置相應通道的通道數據；高低頻分量處理單元，用于將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量，井分別處理分離的高頻分量和低頻分量；圖像幀重新合成単元，用于將經過處理的高頻分量和低頻分量重新合成一幀圖像數據；伽瑪值調整単元，用于計算所述重新合成的一幀圖像數據的直方圖，井根據計算結果與預設的伽瑪值表調整所述重新合成的一幀圖像數據的伽瑪值，所述預設的伽瑪值表存儲了直方圖與伽瑪值的對應關系；音視頻數據輸出単元，用于將伽瑪值調整后的圖像數據與其對應的音頻數據重新組合并輸出；重復執(zhí)行圖像數據幀讀取單元至音視頻數據輸出單元，直到多媒體文件的視頻文件全部處理結束。在本發(fā)明實施例中，能夠使圖像以最佳觀賞方式展現給用戶，實現視頻的最佳優(yōu)化，對整部影片實現自適應的最佳視頻優(yōu)化，改善視頻的觀賞效果。為了說明本發(fā)明所述的技術方案，下面通過具體實施例來進行說明。實施例一:圖I示出了本發(fā)明第一實施例提供的一種視頻自適應優(yōu)化的方法的流程，為了便于說明，僅示出了與本實施例相關的部分步驟SI I，讀取多媒體文件，并分離該多媒體文件的音頻文件和視頻文件。本實施例的多媒體文件可以為音頻視頻交錯格式(Audio Video Interleaved,AVI)、視窗媒體播放音樂(Windows Media Audio,WMA)等多種格式，ー個多媒體文件同時包括音頻文件和視頻文件。進ー步地，分離多媒體文件的音頻文件和視頻文件之后，分別將音頻文件放入音頻緩存以便從音頻文件中解碼出對應的音頻數據，將視頻文件放入視頻緩存。步驟S12，解碼分離的視頻文件，并讀取解碼后的視頻文件的一幀圖像數據。本實施例中，對多媒體文件分離出來的視頻文件進行解碼，并從解碼后的視頻文件中讀取ー幀圖像數據，以便后續(xù)的處理。步驟S13，分別抽取該幀圖像數據的R、G、B通道的通道數據，根據每個通道的通道數據來設置每個通道的低設置閾值和高設置閾值。本實施例中，每ー幀圖像數據都是由R、G、B三種通道的通道數據組成的。分別統(tǒng)計三種通道的通道數據可獲知未經過處理的通道數據所在的數據域，進而據此設置三種通道的低設置閾值和高設置閾值。步驟S14，將圖像數據的R、G、B三種通道的通道數據分別與其對應的低設置閾值和高設置閾值比較，井根據比較結果設置相應通道的通道數據。本實施例中，由于未經過處理的通道數據所在的數據域通常較窄，因此通過重新設置，通道數據可獲得較寬的數據域。比如，假設ー幀圖像數據的R、G、B三種通道的通道數據在30 200之間，則該幀圖像數據的低設置閾值可設置為40，高設置閾值可設置為190。將R通道的所有數據分別與40和190比較，小于40的通道數據設置為0，大于190的通道數據設置為255，這樣R、G、B三種通道的通道數據的數據域從30 200變?yōu)镺 255，延展了通道數據的數據域，從而調整了 RGB通道的色階，提升了圖像的對比度和色彩飽和度，使圖像看起來更加艷麗和通透。步驟S15，將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量，井分別處理分離的高頻分量和低頻分量。本實施例中，通過高斯濾波，將圖像數據的三種通道數據分離為高頻分量和低頻分量，井根據高頻分量和低頻分量在整幀圖像所起作用的不同，分別執(zhí)行不同的處理。步驟S16，將經過處理的高頻分量和低頻分量重新合成一幀圖像數據。本實施例中，當分別對圖像數據的高頻分量和低頻分量處理后，根據處理后的高頻分量和低頻分量重構新的一幀圖像數據。步驟S17，計算該重新合成的一幀圖像數據的直方圖，井根據計算結果與預設的伽瑪值表調整該重新合成的一幀圖像數據的伽瑪值，該預設的伽瑪值表存儲了直方圖與伽瑪值的對應關系。本實施例中，計算重構的圖像數據的直方圖，并將獲得的直方圖中的各個數據與預設的伽瑪值表進行比較，進而根據比較結果自動調整圖像數據的伽瑪值，使得圖像太明亮的區(qū)域(或影像過曝的區(qū)域)能夠稍微調暗，而太黑暗的部分能夠調亮，増加影片的寬容度。其中，預設的伽瑪值表存儲了直方圖中的至少2個數據與伽瑪值的對應關系，以便保證不同直方圖的圖像數據盡量對應不同的伽瑪值，使得伽瑪值調整后的圖像更加清晰、艷麗。步驟S18，將伽瑪值調整后的圖像數據與其對應的音頻數據重新組合并輸出。本實施例中，同步伽瑪值調整后的圖像數據與其對應的音頻數據，并輸出同步后的音視頻數據。步驟S19，重復執(zhí)行步驟S12至步驟S18，直到多媒體文件的視頻文件全部處理結束。本實施例中，對每ー幀圖像數據都執(zhí)行步驟S12至步驟S18，直到多媒體文件播放結束。在本發(fā)明實施例中，根據每ー幀圖像數據的特征，調整適合本幀圖像的最佳對比度、飽和度、銳度和伽馬值，從而能夠使本幀圖像以最佳觀賞方式展現給用戶，實現視頻的最佳優(yōu)化。又因為對每ー幀圖像實現最佳優(yōu)化，因此能夠對整部影片實現自適應的最佳視頻優(yōu)化，解決視頻文件在播放的過程中不通透，灰蒙，銳度不佳、色彩不夠艷麗的現象，改善視頻的觀賞效果。作為本發(fā)明一優(yōu)選實施例，將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量，井分別處理分離的高頻分量和低頻分量的步驟具體包括Al、通過高斯濾波將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量。本實施例中，圖像f(x，y)的空間低頻部分可以通過高斯低通濾波器獲取，公式如下
權利要求
1.一種視頻自適應優(yōu)化的方法，其特征在于，所述方法包括下述步驟步驟a，讀取多媒體文件，井分離所述多媒體文件的音頻文件和視頻文件；步驟b，解碼分離的視頻文件，并讀取解碼后的視頻文件的ー幀圖像數據；步驟c，分別抽取所述幀圖像數據的R、G、B通道的通道數據，根據每個通道的通道數據來設置每個通道的低設置閾值和高設置閾值；步驟d，將圖像數據的R、G、B三種通道的通道數據分別與其對應的低設置閾值和高設置閾值比較，井根據比較結果設置相應通道的通道數據；步驟e，將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量，井分別處理分離的高頻分量和低頻分量；步驟f，將經過處理的高頻分量和低頻分量重新合成ー幀圖像數據；步驟g，計算所述重新合成的一幀圖像數據的直方圖，井根據計算結果與預設的伽瑪值表調整所述重新合成的一幀圖像數據的伽瑪值，所述預設的伽瑪值表存儲了直方圖與伽瑪值的對應關系；步驟h，將伽瑪值調整后的圖像數據與其對應的音頻數據重新組合并輸出；重復執(zhí)行步驟b至步驟h，直到多媒體文件的視頻文件全部處理結束。
2.如權利要求I所述的方法，其特征在于，所述將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量，井分別處理分離的高頻分量和低頻分量的步驟具體包括通過高斯濾波將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量；結合灰度形態(tài)學運算和人眼的亮度調制方式對高頻分量進行增強；對低頻分量的顔色、飽和度等參數進行調整。
3.如權利要求2所述的方法，其特征在干，所述結合灰度形態(tài)學運算和人眼的亮度調制方式對高頻分量進行增強的步驟具體包括將原始圖像的高頻分量進行形態(tài)學的開運算，再減去原始圖像的高頻分量，得到相對峰值；用原始圖像的高頻分量減去形態(tài)學的閉運算后的原始圖像的高頻分量，得到相對谷值；原始圖像的高頻分量加上相對峰值，再減去相對谷值。
4.如權利要求I所述的方法，其特征在于，在將伽瑪值調整后的圖像數據與其對應的音頻數據重新組合并輸出的步驟之前，進ー步包括下述步驟計算伽瑪值調整后的圖像數據的視頻分辨率，判斷計算的視頻分辨率是否小于720P，并根據判斷結果選擇是否執(zhí)行視頻插值操作。
5.如權利要求4所述的方法，其特征在干，所述根據判斷結果選擇是否執(zhí)行視頻插值操作的步驟具體包括在計算的視頻分辨率小于720P時，采用立方卷積插值運算將圖像數據插值到720P，否貝1J，輸出圖像數據。
6.一種視頻自適應優(yōu)化的裝置，其特征在于，所述裝置包括音視頻文件分離單元，用于讀取多媒體文件，井分離所述多媒體文件的音頻文件和視頻文件；圖像數據幀讀取単元，用于解碼分離的視頻文件，并讀取解碼后的視頻文件的ー幀圖像數據；高低閾值設置単元，用于分別抽取所述幀圖像數據的R、G、B通道的通道數據，根據每個通道的通道數據來設置每個通道的低設置閾值和高設置閾值；圖像數據重置単元，用于將圖像數據的R、G、B三種通道的通道數據分別與其對應的低設置閾值和高設置閾值比較，井根據比較結果設置相應通道的通道數據；高低頻分量處理單元，用于將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量，井分別處理分離的高頻分量和低頻分量；圖像幀重新合成単元，用于將經過處理的高頻分量和低頻分量重新合成一幀圖像數據；伽瑪值調整単元，用于計算所述重新合成的一幀圖像數據的直方圖，井根據計算結果與預設的伽瑪值表調整所述重新合成的一幀圖像數據的伽瑪值，所述預設的伽瑪值表存儲了直方圖與伽瑪值的對應關系；音視頻數據輸出単元，用于將伽瑪值調整后的圖像數據與其對應的音頻數據重新組合并輸出；重復執(zhí)行圖像數據幀讀取単元至音視頻數據輸出単元，直到多媒體文件的視頻文件全部處理結束。
7.如權利要求6所述的裝置，其特征在于，所述高低頻分量處理單元包括高低頻分量分離模塊，用于通過高斯濾波將經過低設置閾值和高設置閾值重新設置的通道數據分離為高頻分量和低頻分量；高頻分量處理模塊，用于結合灰度形態(tài)學運算和人眼的亮度調制方式對高頻分量進行增強；低頻分量處理模塊，用于對低頻分量的顔色、飽和度進行調整。
8.如權利要求7所述的裝置，其特征在于，所述高頻分量處理模塊包括相對峰值確定模塊，用于將原始圖像的高頻分量進行形態(tài)學的開運算，再減去原始圖像的高頻分量，得到相對峰值；相對谷值確定模塊，用于使用原始圖像的高頻分量減去形態(tài)學的閉運算后的原始圖像的高頻分量，得到相對谷值；高頻分量處理結果獲取模塊，用于將原始圖像的高頻分量加上相對峰值，再減去相對谷值。
9.如權利要求6所述的裝置，其特征在于，所述裝置包括視頻分辨率判斷単元，用于計算伽瑪值調整后的圖像數據的視頻分辨率，判斷計算的視頻分辨率是否小于720P ；插值操作選擇單元，用于根據判斷結果選擇是否執(zhí)行視頻插值操作。
10.如權利要求9所述的裝置，其特征在于，所述插值操作選擇單元包括插值模塊，用于在計算的視頻分辨率小于720P時，采用立方卷積插值運算將圖像數據插值到720P ；數據輸出模塊，用于在視頻分辨率大于或等于720P吋，輸出圖像數據。
全文摘要
本發(fā)明適用于視頻優(yōu)化領域，提供了視頻自適應優(yōu)化的方法及裝置。所述方法包括a，分離音頻文件和視頻文件；b，讀取視頻文件的一幀圖像數據；c，抽取幀圖像數據的通道數據，根據通道數據來設置低設置閾值和高設置閾值；d，將通道數據分別與其對應的低設置閾值和高設置閾值比較，根據比較結果設置相應通道的通道數據；e，將通道數據分離為高頻分量和低頻分量并處理；f，合成一幀圖像數據；g，調整新的幀圖像數據的伽瑪值；h，將圖像數據與其對應的音頻數據重新組合并輸出；重復執(zhí)行b至h，直到視頻文件全部處理結束。本發(fā)明實施例能夠改善視頻的觀賞效果。
文檔編號H04N9/64GK102695062SQ201210151359
公開日2012年9月26日申請日期2012年5月15日優(yōu)先權日2012年5月15日
發(fā)明者嚴帥領, 余潘虎, 王慧婧申請人:Tcl集團股份有限公司

完整全部詳細技術資料下載