專(zhuān)利名稱(chēng):一種視頻字幕處理裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻處理領(lǐng)域,特別涉及一種字幕處理裝置及方法。
背景技術(shù):
隨著計(jì)算機(jī)技術(shù)、多媒體技術(shù)的飛速發(fā)展,視頻播放設(shè)備日趨繁多,即4、 手機(jī)由于它們方便攜帶的優(yōu)勢(shì),成為最受歡迎的視頻播放設(shè)備。然而,這些便 攜式設(shè)備在具有其優(yōu)勢(shì)的同時(shí),由于其顯示屏的大小有限,會(huì)導(dǎo)致視頻字幕過(guò) 小,用戶(hù)閱讀困難的問(wèn)題出現(xiàn)。
由于一般情況下,視頻文件都帶有與視頻相關(guān)的字幕文件,用戶(hù)可以用相 應(yīng)的字幕編輯軟件對(duì)字幕進(jìn)行編輯,這樣可以達(dá)到放大字幕的效果。然而,還 存在一些^L頻文件,并沒(méi)有自己的字幕文件,要想對(duì)這些浮見(jiàn)頻文件中的字幕進(jìn) 行放大,用戶(hù)則無(wú),人下手。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種視頻字幕處理裝置,不依賴(lài)于字幕
文件,實(shí)現(xiàn)對(duì)—見(jiàn)頻中的字幕進(jìn)行處理。
本發(fā)明的目的還在于提供一種視頻字幕處理方法,不依賴(lài)于文件字幕,實(shí)
現(xiàn)對(duì)視頻中的字幕進(jìn)行處理。
為達(dá)到上述目的, 一種視頻字幕處理裝置,包括 字幕檢測(cè)提取模塊,檢測(cè)并提取出視頻圖像中的字幕區(qū)域; 字幕處理模塊,用于根據(jù)確定的字幕顯示參數(shù)對(duì)所述提取出的字幕區(qū)域進(jìn)
行處理。
視頻圖像處理模塊,用于對(duì)提取出字幕區(qū)域的視頻圖像進(jìn)行處理;
5
字幕疊加模塊,用于將處理后的字幕區(qū)域與處理后的視頻圖像進(jìn)行疊加。
所述視頻圖像處理模塊,包括
視頻圖像縮小單元,用于將所述提取出字幕區(qū)域的視頻圖像縮小到預(yù)設(shè)的 顯示尺寸;
視頻圖像修復(fù)單元,用于對(duì)縮小后的視頻圖像中的字幕區(qū)域進(jìn)行修復(fù)。 所述視頻圖像處理模塊,包括
視頻圖像修復(fù)單元,用于對(duì)所述提取出字幕區(qū)域的視頻圖像中的字幕區(qū)域 進(jìn)行修復(fù);
視頻圖像縮小單元,用于將修復(fù)后的視頻圖像縮小到預(yù)設(shè)的顯示尺寸。 所述字幕顯示參數(shù)包括字幕大小參數(shù)和顯示位置參數(shù); 所述字幕處理模塊包括,
字幕大小參數(shù)存儲(chǔ)單元,用于存儲(chǔ)預(yù)設(shè)的字幕大小參數(shù); 顯示位置確定單元,用于確定字幕在預(yù)設(shè)尺寸大小的視頻圖像中的顯示位 置參數(shù);
字符識(shí)別單元,用于對(duì)所述提取出的字幕區(qū)域完成單個(gè)字符的分割,還用 于對(duì)分割得到的單個(gè)字符進(jìn)行分析,得到相應(yīng)的文字信息,并根據(jù)文字信息在 字符庫(kù)中找到單個(gè)字符所對(duì)應(yīng)的字符影像信息;
字幕處理單元,用于根據(jù)在字符庫(kù)查找到的單個(gè)字符的影像信息和所述字 幕大小存儲(chǔ)單元中存儲(chǔ)的字幕大小參數(shù),對(duì)視頻圖像的字幕進(jìn)行處理。
所述字幕大小參數(shù)為字幕的字號(hào)大小。
所述字幕顯示參數(shù)包括放大倍數(shù)參數(shù)、字幕間的行距參數(shù)和顯示位置參數(shù); 所述字幕處理^f莫塊包括
放大尺寸確定單元,用于確定允許字幕放大的最大倍數(shù)參數(shù); 字幕參數(shù)存儲(chǔ)單元,用于存儲(chǔ)字幕的參數(shù),包括字幕間的行距參數(shù); 顯示位置確定單元,用于根據(jù)每幀視頻圖像中字幕的行數(shù),確定第一行字 幕的顯示位置參數(shù)。
一行字幕區(qū)域進(jìn)行放大處理。
背景去除單元,用于將放大后的字幕區(qū)域中除字幕的區(qū)域灰度值設(shè)為0。 所述允許字幕放大的最大倍數(shù)為預(yù)設(shè)尺寸大小的視頻圖像寬度與第 一幀視
頻圖像中最長(zhǎng)字幕區(qū)域長(zhǎng)度之商。
所述字幕處理模塊還包括字幕拆分單元,用于當(dāng)一行字幕的長(zhǎng)度大于視 頻圖像寬度時(shí),對(duì)一行字幕進(jìn)行拆分。
本發(fā)明還提供一種^L頻字幕處理方法,該方法包括
1) 檢測(cè)當(dāng)前幀視頻圖像中是否含有字幕區(qū)域,如果含有則提取字幕區(qū)域, 執(zhí)行步驟3),否則,執(zhí)行步驟2);
2) 對(duì)當(dāng)前幀視頻圖像進(jìn)行縮小處理,并獲取下一幀圖像,返回步驟l);
3 )對(duì)提取的字幕區(qū)域進(jìn)行處理,并確定其在預(yù)設(shè)尺寸大小的視頻圖像中的 顯示位置,執(zhí)行步驟4);
4) 對(duì)提取出字幕區(qū)域的視頻圖像進(jìn)行縮小和修復(fù)處理,執(zhí)行步驟5);
5) 將處理后的字幕區(qū)域和處理后的視頻圖像進(jìn)行疊加。 所述對(duì)提取的字幕進(jìn)行處理為
將提取的字幕區(qū)域進(jìn)行單個(gè)字符切分,并對(duì)字符進(jìn)行分析,得到字幕的文 字信息;
根據(jù)單個(gè)字符的文字信息在字符庫(kù)中找到其所對(duì)應(yīng)的字符影像信息;
根據(jù)在字符庫(kù)查找到的單個(gè)字符的影像信息和所預(yù)設(shè)的字幕大小參數(shù),對(duì) 視頻圖像的字幕進(jìn)行處理。
所述對(duì)揭3又的字幕進(jìn)行處理為
將預(yù)設(shè)尺寸大小的視頻圖像寬度與第 一幀視頻圖像中最長(zhǎng)字幕區(qū)域長(zhǎng)度之
商作為允許視頻字幕放大的最大倍數(shù);
根據(jù)用戶(hù)需要對(duì)所提取的每一行字幕區(qū)域在所確定的允許視頻字幕放大的 最大倍數(shù)的范圍內(nèi)進(jìn)行放大處理。
將放大后的字幕區(qū)域中除字幕的區(qū)域灰度值設(shè)為o 。
由以上的技術(shù)方案可見(jiàn),本發(fā)明提供的視頻字幕處理裝置及方法,通過(guò)對(duì) 從視頻圖像中提取出的字幕區(qū)域進(jìn)行處理,解決了現(xiàn)有技術(shù)無(wú)法對(duì)未帶有字幕 文件的視頻文件進(jìn)行字幕編輯的問(wèn)題,滿(mǎn)足了用戶(hù)在視頻圖像在縮小后調(diào)整字 幕大小的需求。
而且本發(fā)明對(duì)原始視頻圖像進(jìn)行了修復(fù)處理,避免了由于放大字幕而導(dǎo)致 的視頻圖像出現(xiàn)斑痕的問(wèn)題。
圖l是本發(fā)明提供的一種視頻字幕處理裝置的結(jié)構(gòu)示意圖; 圖2是本發(fā)明提供的一種視頻字幕處理裝置的結(jié)構(gòu)實(shí)施例示意圖; 圖3是本發(fā)明提供的另一種視頻字幕處理裝置的結(jié)構(gòu)實(shí)施例示意圖; 圖4是本發(fā)明提供的一種視頻字幕處理方法的流程實(shí)施例示意圖。
具體實(shí)施例方式
為使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下參照附圖并舉實(shí) 施例,對(duì)本發(fā)明進(jìn)一 步詳細(xì)說(shuō)明。
圖l是本發(fā)明提供的一種視頻字幕處理裝置,該裝置包括
字幕檢測(cè)提取模塊101,檢測(cè)視頻數(shù)據(jù)中是否存在字幕區(qū)域,如果有,則 將字幕區(qū)域提取出來(lái),發(fā)送給字幕處理模塊102,并將提取出字幕的視頻圖像 數(shù)據(jù)發(fā)送給視頻圖像處理模塊103;
字幕處理模塊102,用于根據(jù)用戶(hù)需要或顯示屏的大小確定字幕顯示的參 數(shù),對(duì)來(lái)自字幕檢測(cè)提取模塊101的字幕數(shù)據(jù)進(jìn)行處理,并將處理后的結(jié)果發(fā) 送給字幕疊加模塊104;
其中字幕顯示的參數(shù)包括字幕的大小參數(shù)和字幕顯示的位置參數(shù)。
視頻圖像處理模塊103,用于對(duì)來(lái)自字^f企測(cè)提取模塊101的視頻圖像數(shù) 據(jù)進(jìn)行處理,并將處理后的結(jié)果發(fā)送給字幕疊加一莫塊104;
字幕疊加模塊104,用于將處理后的字幕區(qū)域與處理后的視頻圖像進(jìn)行疊加。
圖2是本發(fā)明提供的一種視頻字幕處理裝置的結(jié)構(gòu)實(shí)施例示意圖,其中以 視頻圖像的大小等于顯示器大小為例。在本實(shí)施中,該裝置包括字幕檢測(cè)提 取模塊、字幕處理模塊、視頻圖像處理模塊、字幕疊加模塊,其中
字幕檢測(cè)提取模塊,根據(jù)來(lái)自視頻解碼模塊的視頻數(shù)據(jù)檢測(cè)視頻數(shù)據(jù)中是 否存在字幕區(qū)域,如果有,則將字幕區(qū)域提取出來(lái),發(fā)送給字幕處理模塊,并 將提取出字幕的視頻圖像數(shù)據(jù)發(fā)送給視頻圖像處理模塊;
字幕處理模塊包括字幕大小參數(shù)存儲(chǔ)單元201,字符識(shí)別單元202,字幕處 理單元203和顯示位置確定單元204。
其中,字幕大小參數(shù)存儲(chǔ)單元201,用于存儲(chǔ)預(yù)設(shè)的字幕大小參數(shù),可以 是顯示字幕的字號(hào)大小。
字符識(shí)別單元202,用于對(duì)提取到的字幕區(qū)域采用動(dòng)態(tài)局部閾值法對(duì)字幕 區(qū)域二值化,同時(shí)進(jìn)行候選區(qū)域增強(qiáng)和重采樣,并通過(guò)區(qū)域垂直投影法探測(cè)準(zhǔn) 則對(duì)孤立噪聲進(jìn)行濾除,對(duì)粘連字符進(jìn)行自適應(yīng)分裂,對(duì)斷裂字符進(jìn)行自適應(yīng) 合并,完成單個(gè)字符的分割;
還用于對(duì)分割得到的單個(gè)字符進(jìn)行分析,得到相應(yīng)的文字信息,并根據(jù)單 個(gè)字符的文字信息在字符庫(kù)中找到對(duì)應(yīng)的字符影像信息。從單個(gè)字符獲得文字 信息的方法有很多,在這里使用OCR識(shí)別技術(shù)。
字幕處理單元203,用于根據(jù)在字符庫(kù)查找到的字符圖像影像和字幕大小 存儲(chǔ)單元201中存儲(chǔ)的字幕大小參數(shù),對(duì)對(duì)識(shí)別出來(lái)的單個(gè)字符進(jìn)行處理。例 如,字幕參數(shù)存儲(chǔ)單元201中存儲(chǔ)的字幕大小參數(shù)是表示字號(hào)為"小四,,的信 息,經(jīng)字符識(shí)別出兩個(gè)字符文本信息"你"、"好,,,在字符庫(kù)中找到這兩個(gè)字符 的圖像信息,將"你"、"好,'這兩個(gè)字的字號(hào)轉(zhuǎn)換為"小四"大小的字符。
顯示位置確定單元204,用于確定字幕在顯示器中顯示的位置,包括水平 方向4立置和垂直方向4立置。
其中水平方向位置的確定,需要保證最長(zhǎng)的那行字幕的左端至少不超過(guò)顯 示器的左邊緣,垂直方向位置的確定,需要保證最接近顯示器最底端的那行字 幕的最低點(diǎn)至少不超出顯示器的最底端。
進(jìn)一步地,由于字幕被放大,可能會(huì)出現(xiàn),原本能夠在一行里顯示的字幕, 在放大后卻顯示不了 ,這樣就需要根據(jù)放大后的字幕大小參數(shù)統(tǒng)計(jì)在預(yù)定的顯
示尺寸下一行最多能顯示的字符個(gè)數(shù),即顯示器的寬度大于等于N ( N為大于等 于1的自然數(shù)一 )個(gè)字符的寬度之和,小于N+l個(gè)字符的寬度之和。
視頻圖像處理模塊包括視頻圖像修復(fù)單元205和視頻圖像縮小單元206, 在本實(shí)施例中,由于視頻圖像處理中,不管先對(duì)圖像進(jìn)行修復(fù)還是先對(duì)圖像進(jìn) 行縮小,都不會(huì)影響視頻圖像的顯示效果,所以來(lái)自視頻解碼模塊的視頻數(shù)據(jù) 既可以先在視頻圖像修復(fù)單元205中進(jìn)行處理,也可以先在視頻圖像縮小單元 206中進(jìn)行處理。
其中,視頻圖像在視頻圖像修復(fù)單元205中進(jìn)行的處理,具體為首先, 讀取字幕檢測(cè)提取模塊所檢測(cè)到的字幕區(qū)域的位置信息,比如,字幕區(qū)域的最 小外接區(qū)域,將檢測(cè)到的字幕區(qū)域的位置信息映射到視頻圖像中,并將所映射 到的區(qū)域用一種顏色表示,然后,使用紋理修復(fù)算法對(duì)所映射到的區(qū)域進(jìn)行修 復(fù)處理。本領(lǐng)域內(nèi)的普通技術(shù)人員可以采用公知的最小外接區(qū)域的計(jì)算方法和 紋理修復(fù)算法實(shí)現(xiàn)本實(shí)施方案,此處不再贅述。
在視頻圖像處理模塊中,對(duì)視頻圖像還要進(jìn)行另一步處理,那就是在視頻 圖像縮小單元206中進(jìn)行圖像的縮小處理。其縮小的倍數(shù)等于原視頻圖像大小 與所需顯示的視頻圖像的大小的商。 一般的,所需顯示的視頻圖像的大小為視 頻圖像全屏?xí)r的大小,即為當(dāng)前顯示屏幕的大小。
經(jīng)視頻圖像處理模塊處理后的視頻圖像數(shù)據(jù)和視頻圖像參數(shù),被發(fā)送到字 幕疊加模塊中,其中視頻圖像參數(shù)包括視頻圖像長(zhǎng)度和寬度。 字幕疊加模塊,用于將處理后的字幕區(qū)域與處理后的視頻圖像進(jìn)行疊加。
圖3是本發(fā)明提供的另一種視頻字幕處理裝置的結(jié)構(gòu)實(shí)施例示意圖。在本 實(shí)施例中,該裝置包括字幕檢測(cè)提取模塊、字幕處理模塊、視頻圖像處理模 塊、字幕疊加模塊。
其中,除字幕處理模塊的結(jié)構(gòu)有所變化,其他各模塊的結(jié)構(gòu)及功能相同, 在這里就不贅述了。
字幕處理模塊包括放大尺寸確定單元301、字幕參數(shù)存儲(chǔ)單元302、顯示位 置確定單元303、字幕處理單元3Q4和背景去除單元305。
放大尺寸確定單元301,用于確定允許字幕放大的最大放大倍數(shù)參數(shù)。獲 取第 一幀視頻圖像中長(zhǎng)度最長(zhǎng)的字幕區(qū)域長(zhǎng)度信息,最大的放大倍數(shù)為顯示器 寬度與該最長(zhǎng)字幕區(qū)域長(zhǎng)度之商。
字幕參數(shù)存儲(chǔ)單元302,用于存儲(chǔ)字幕的參數(shù),包括字幕的行距參數(shù)。
顯示位置確定單元303,用于根據(jù)每幀視頻圖像中字幕的行數(shù),確定第一 行字幕的顯示位置參數(shù)。比如,如果一幀視頻圖像的字幕為1行,那么可以確 定第一行字幕的顯示位置與顯示器最底端的距離為顯示器高度的1/9;如果一 幀視頻圖像的字幕為3行,那么可以確定第一行字幕的顯示位置與顯示器最底 端的距離為顯示器高度的1/3。對(duì)于第一行字幕的顯示位置的確定,可以根據(jù) 用戶(hù)的需要進(jìn)行設(shè)定。第二行字幕的顯示位置與顯示器最底端的距離為第 一行 字幕的顯示位置、字幕顯示的行距和放大后字符高度之和,以此類(lèi)推。
字幕處理單元304,根據(jù)放大尺寸確定單元301的所確定的放大倍數(shù)對(duì)所 提取的每一行字幕區(qū)域進(jìn)行放大處理。
背景去除單元305,用于將放大后的字幕區(qū)域中除字幕的區(qū)域灰度值設(shè)為 0。首先找出背景區(qū)域。在本實(shí)施例中,釆用八叉樹(shù)顏色量化算法對(duì)字幕區(qū)域二 值化后,運(yùn)用形態(tài)處理的方法找到已得到字幕以及包含字幕所有邊緣像素的區(qū) 域,剩下來(lái)的區(qū)域便是字幕區(qū)域的背景部分。將這一部分區(qū)域的灰度值設(shè)為0。
由于背景去除與字幕處理這兩個(gè)步驟并沒(méi)有先后要求,因此,這兩個(gè)單元 的連接關(guān)系可以與本實(shí)施例示意圖中所示的關(guān)系不同。
進(jìn)一步地,由于這樣并不能避免出現(xiàn)一行字幕的寬度大于顯示器的寬度, 所以在這里增設(shè)字幕拆分單元。首先判斷一行字幕的寬度是否大于顯示器的寬 度,如果大于,則對(duì)該行字幕進(jìn)行拆分??梢詫@示器的右邊緣作為預(yù)測(cè)的拆 分位置。
更進(jìn)一步地,為了避免這個(gè)預(yù)測(cè)位置不在兩個(gè)字之間,即在某個(gè)字符上, 則在這個(gè)預(yù)測(cè)位置附近采用局部二值化及垂直投影分割的方法,判斷其是否在 兩個(gè)字符之間,如果則,則將這個(gè)預(yù)測(cè)位置作為拆分位置,如果不是,則將預(yù) 測(cè)位置向左平移,并重復(fù)上述判斷過(guò)程,直到找到兩個(gè)字符的中間位置,將其 作為拆分位置。
根據(jù)上述裝置,本發(fā)明還提供一種視頻字幕裝置的方法。圖4是本發(fā)明提 供的 一種^^頻字幕處理的方法的實(shí)施例示意圖。該方法有以下步驟
步驟401,檢測(cè)當(dāng)前幀視頻圖像中是否含有字幕區(qū)域,如果含有,則提取字 幕區(qū)域執(zhí)行步驟403;如果不含有,執(zhí)行步驟402;
步驟402,對(duì)當(dāng)前幀視頻圖像進(jìn)行縮小處理,并獲取下一幀圖像,返回步驟 401;
步驟4 0 3 ,對(duì)才是取的字幕區(qū)域進(jìn)行處理;
本步驟具體為將提取的字幕區(qū)域進(jìn)行單個(gè)字符切分,并對(duì)字符進(jìn)行分析, 得到字符的文字信息,根據(jù)字符的文字信息在字符庫(kù)中找到每個(gè)字符的字符影 像;
然后,根據(jù)預(yù)設(shè)的字幕大小參數(shù)和在字符庫(kù)中查找到的字符影像和對(duì)視頻圖 像的字幕進(jìn)行處理。。
這個(gè)步驟還可以為將顯示器寬度與第一幀圖像最長(zhǎng)字幕區(qū)域的長(zhǎng)度之商作 為字幕區(qū)域的最大放大倍數(shù),根據(jù)用戶(hù)的需要對(duì)視頻圖像中的字幕進(jìn)行放大處 理。
由于字幕區(qū)域的長(zhǎng)度不一,有可能出現(xiàn)字幕放大后的長(zhǎng)度超過(guò)顯示器的寬 度,因此本步驟進(jìn)一步包括字幕拆分過(guò)程??梢詫@示器的右邊緣位置作為預(yù) 測(cè)位置,為了避免這個(gè)預(yù)測(cè)位置不在兩個(gè)字之間,即在某個(gè)字符上,則在這個(gè) 預(yù)測(cè)位置附近采用局部二值化及垂直投影分割的方法,判斷其是否在兩個(gè)字符 之間,如果則,則將這個(gè)預(yù)測(cè)位置作為拆分位置,如果不是,則將預(yù)測(cè)位置向 左平移,并重復(fù)上述判斷過(guò)程,直到找到兩個(gè)字符的中間位置,將其作為拆分 位置。
步驟404,確定字幕的顯示位置。 本步驟包括確定水平方向位置和垂直方向位置。
其中水平方向位置的確定,需要保證最長(zhǎng)的那行字幕的左端至少不超過(guò)顯 示器的左邊緣,垂直方向位置的確定,需要保證最接近顯示器最底端的那行字 幕的最低點(diǎn)至少不超出顯示器的最底端。
步驟405,對(duì)提取字幕后的視頻圖像進(jìn)行縮小和修復(fù)處理。 本步驟中對(duì)提取字幕后的視頻圖像進(jìn)行的兩個(gè)處理過(guò)程的先后關(guān)系不固定, 其中對(duì)視頻圖像進(jìn)行修復(fù)處理,主要是對(duì)字幕區(qū)域的修復(fù)。 步驟406,將處理后的字幕與處理后的視頻圖像進(jìn)行疊加。 由上述的實(shí)施例可見(jiàn),本發(fā)明提供的視頻字幕處理裝置及方法,通過(guò)對(duì)從 視頻圖像中提取出的字幕區(qū)域進(jìn)行處理,解決了現(xiàn)有技術(shù)無(wú)法對(duì)未帶有字幕文 件的視頻文件進(jìn)行字幕編輯的問(wèn)題,滿(mǎn)足了用戶(hù)在視頻圖像在縮小后調(diào)整字幕 大小的需求。
而且本發(fā)明對(duì)原始視頻圖像進(jìn)行了修復(fù)處理,避免了由于放大字幕而導(dǎo)致 的視頻圖像出現(xiàn)斑痕的問(wèn)題。
通過(guò)上述的說(shuō)明,上述本發(fā)明的實(shí)施例是以示例的目的而展開(kāi),本技術(shù)領(lǐng) 域中的普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,以上的實(shí)施例僅是用來(lái)說(shuō)明本發(fā)明,而并非 用作為對(duì)本發(fā)明的限定,只要在本發(fā)明的實(shí)質(zhì)精神范圍內(nèi),對(duì)以上所述實(shí)施例 的變化、變型都將落在本發(fā)明權(quán)利要求書(shū)的范圍內(nèi)。
權(quán)利要求
1、一種視頻字幕處理裝置,其特征在于,該裝置包括字幕檢測(cè)提取模塊,檢測(cè)并提取出視頻圖像中的字幕區(qū)域;字幕處理模塊,用于根據(jù)確定的字幕顯示參數(shù)對(duì)所述提取出的字幕區(qū)域進(jìn)行處理。
2、 如權(quán)利要求l所述的裝置,其特征在于,該裝置還包括 視頻圖像處理模塊,用于對(duì)提取出字幕區(qū)域的視頻圖像進(jìn)行處理; 字幕疊加模塊,用于將處理后的字幕區(qū)域與處理后的視頻圖像進(jìn)行疊加。
3、 如權(quán)利要求2所述的裝置,其特征在于,所述視頻圖像處理模塊,包括 視頻圖像縮小單元,用于將所述提取出字幕區(qū)域的視頻圖像縮小到預(yù)設(shè)的顯示尺寸;視頻圖像修復(fù)單元,用于對(duì)縮小后的視頻圖像中的字幕區(qū)域進(jìn)行修復(fù)。
4、 如權(quán)利要求2所述的裝置,其特征在于,所述視頻圖像處理模塊,包括 視頻圖像修復(fù)單元,用于對(duì)所述提取出字幕區(qū)域的視頻圖像中的字幕區(qū)域進(jìn)行修復(fù);視頻圖像縮小單元,用于將修復(fù)后的視頻圖像縮小到預(yù)設(shè)的顯示尺寸。
5、 如權(quán)利要求l所述的裝置,其特征在于所述字幕顯示參數(shù)包括字幕大 小參凄t禾口顯示4立置參凄丈;所述字幕處理模塊包括,字幕大小參數(shù)存儲(chǔ)單元,用于存儲(chǔ)預(yù)設(shè)的字幕大小參數(shù); 顯示位置確定單元,用于確定字幕在預(yù)設(shè)尺寸大小的視頻圖像中的顯示位 置參數(shù);字符識(shí)別單元,用于對(duì)所述提取出的字幕區(qū)域完成單個(gè)字符的分割,還用 于對(duì)分割得到的單個(gè)字符進(jìn)行分析,得到相應(yīng)的文字信息,并纟艮據(jù)文字信息在字符庫(kù)中找到單個(gè)字符所對(duì)應(yīng)的字符影像信息;字幕處理單元,用于才艮據(jù)在字符庫(kù)查找到的單個(gè)字符的影^象信息和所述字 幕大小存儲(chǔ)單元中存儲(chǔ)的字幕大小參數(shù),對(duì)視頻圖像的字幕進(jìn)行處理。
6、 如權(quán)利要求5所述的裝置,其特征在于所述字幕大小參數(shù)為字幕的字 號(hào)大小。
7、 如權(quán)利要求1所述的裝置,其特征在于所述字幕顯示參數(shù)包括放大倍 數(shù)參數(shù)、字幕間的行距參數(shù)和顯示位置參數(shù);所述字幕處理模塊包括,放大尺寸確定單元,用于確定允許字幕放大的最大倍數(shù)參數(shù); 字幕參數(shù)存儲(chǔ)單元,用于存儲(chǔ)字幕的參數(shù),包括字幕間的行距參數(shù); 顯示位置確定單元,用于根據(jù)每幀視頻圖像中字幕的行數(shù),確定第一行字幕的顯示位置參數(shù)。字幕處理單元,根據(jù)放大尺寸確定單元的所確定的放大倍數(shù)對(duì)所提取的每一行字幕區(qū)域進(jìn)行放大處理。背景去除單元,用于將放大后的字幕區(qū)域中除字幕的區(qū)域灰度值設(shè)為0。
8、 如權(quán)利要求7所述的裝置,其特征在于所述允許字幕放大的最大倍數(shù) 為預(yù)設(shè)尺寸大小的視頻圖像寬度與第一幀視頻圖像中最長(zhǎng)字幕區(qū)域長(zhǎng)度之商。
9、 如權(quán)利要求7所述的裝置,其特征在于,所述字幕處理模塊還包括字 幕拆分單元,用于當(dāng)一行字幕的長(zhǎng)度大于視頻圖像寬度時(shí),對(duì)一行字幕進(jìn)行拆 分。
10、 一種視頻字幕處理方法,其特征在于,該方法包括1) 檢測(cè)當(dāng)前幀視頻圖像中是否含有字幕區(qū)域,如果含有則提取字幕區(qū)域, 執(zhí)行步驟3),否則,執(zhí)行步驟2);2) 對(duì)當(dāng)前幀視頻圖像進(jìn)行縮小處理,并獲取下一幀圖像,返回步驟l);3) 對(duì)提取的字幕區(qū)域進(jìn)行處理,并確定其在預(yù)設(shè)尺寸大小的視頻圖像中的 顯示位置,執(zhí)行步驟4);4 )對(duì)提取出字幕區(qū)域的視頻圖像進(jìn)行縮小和修復(fù)處理,執(zhí)行步驟5 );5 )將處理后的字幕區(qū)域和處理后的視頻圖像進(jìn)行疊加。
11、 如權(quán)利要求IO所述的方法,其特征在于所述對(duì)提取的字幕進(jìn)行處理為將提取的字幕區(qū)域進(jìn)行單個(gè)字符切分,并對(duì)字符進(jìn)行分析,得到字幕的文字 信息;才艮據(jù)單個(gè)字符的文字信息在字符庫(kù)中找到其所對(duì)應(yīng)的字符影j象信息;根據(jù)在字符庫(kù)查找到的單個(gè)字符的影像信息和所預(yù)設(shè)的字幕大小參數(shù),對(duì)視 頻圖像的字幕進(jìn)行處理。
12、 如權(quán)利要求1Q所述的方法,其特征在于,所述對(duì)提取的字幕進(jìn)行處理為將預(yù)設(shè)尺寸大小的視頻圖像寬度與第 一幀碎見(jiàn)頻圖像中最長(zhǎng)字幕區(qū)域長(zhǎng)度之 商作為允許視頻字幕放大的最大倍數(shù);根據(jù)用戶(hù)需要對(duì)所提取的每一行字幕區(qū)域在所確定的允許視頻字幕放大的 最大倍數(shù)的范圍內(nèi)進(jìn)行放大處理。將放大后的字幕區(qū)域中除字幕的區(qū)域灰度值設(shè)為o。
全文摘要
本發(fā)明提供的視頻字幕處理裝置及方法,通過(guò)對(duì)從視頻圖像中提取出的字幕區(qū)域進(jìn)行處理,解決了現(xiàn)有技術(shù)無(wú)法對(duì)未帶有字幕文件的視頻文件進(jìn)行字幕編輯的問(wèn)題,滿(mǎn)足了用戶(hù)在視頻圖像在縮小后調(diào)整字幕大小的需求。而且本發(fā)明對(duì)原始視頻圖像進(jìn)行了修復(fù)處理,避免了由于放大字幕而導(dǎo)致的視頻圖像出現(xiàn)斑痕的問(wèn)題。
文檔編號(hào)H04N5/278GK101360193SQ200810119340
公開(kāi)日2009年2月4日 申請(qǐng)日期2008年9月4日 優(yōu)先權(quán)日2008年9月4日
發(fā)明者黨寧娜, 律 謝 申請(qǐng)人:北京中星微電子有限公司