一種視頻字幕處理裝置及方法

文檔序號(hào)：7696348閱讀：153來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>電子通信裝置的制造及其應(yīng)用技術(shù)

專(zhuān)利名稱(chēng)：一種視頻字幕處理裝置及方法
技術(shù)領(lǐng)域：
本發(fā)明涉及視頻處理領(lǐng)域，特別涉及一種字幕處理裝置及方法。
背景技術(shù)：
隨著計(jì)算機(jī)技術(shù)、多媒體技術(shù)的飛速發(fā)展，視頻播放設(shè)備日趨繁多，即4、手機(jī)由于它們方便攜帶的優(yōu)勢(shì)，成為最受歡迎的視頻播放設(shè)備。然而，這些便攜式設(shè)備在具有其優(yōu)勢(shì)的同時(shí)，由于其顯示屏的大小有限，會(huì)導(dǎo)致視頻字幕過(guò) 小，用戶(hù)閱讀困難的問(wèn)題出現(xiàn)。
由于一般情況下，視頻文件都帶有與視頻相關(guān)的字幕文件，用戶(hù)可以用相應(yīng)的字幕編輯軟件對(duì)字幕進(jìn)行編輯，這樣可以達(dá)到放大字幕的效果。然而，還存在一些^L頻文件，并沒(méi)有自己的字幕文件，要想對(duì)這些浮見(jiàn)頻文件中的字幕進(jìn) 行放大，用戶(hù)則無(wú),人下手。

發(fā)明內(nèi)容
有鑒于此，本發(fā)明的目的在于提供一種視頻字幕處理裝置，不依賴(lài)于字幕
文件，實(shí)現(xiàn)對(duì)—見(jiàn)頻中的字幕進(jìn)行處理。
本發(fā)明的目的還在于提供一種視頻字幕處理方法，不依賴(lài)于文件字幕，實(shí)
現(xiàn)對(duì)視頻中的字幕進(jìn)行處理。
為達(dá)到上述目的，一種視頻字幕處理裝置，包括字幕檢測(cè)提取模塊，檢測(cè)并提取出視頻圖像中的字幕區(qū)域；字幕處理模塊，用于根據(jù)確定的字幕顯示參數(shù)對(duì)所述提取出的字幕區(qū)域進(jìn)
行處理。
視頻圖像處理模塊，用于對(duì)提取出字幕區(qū)域的視頻圖像進(jìn)行處理；
5
字幕疊加模塊，用于將處理后的字幕區(qū)域與處理后的視頻圖像進(jìn)行疊加。
所述視頻圖像處理模塊，包括
視頻圖像縮小單元，用于將所述提取出字幕區(qū)域的視頻圖像縮小到預(yù)設(shè)的顯示尺寸；
視頻圖像修復(fù)單元，用于對(duì)縮小后的視頻圖像中的字幕區(qū)域進(jìn)行修復(fù)。所述視頻圖像處理模塊，包括
視頻圖像修復(fù)單元，用于對(duì)所述提取出字幕區(qū)域的視頻圖像中的字幕區(qū)域進(jìn)行修復(fù)；
視頻圖像縮小單元，用于將修復(fù)后的視頻圖像縮小到預(yù)設(shè)的顯示尺寸。所述字幕顯示參數(shù)包括字幕大小參數(shù)和顯示位置參數(shù)；所述字幕處理模塊包括，
字幕大小參數(shù)存儲(chǔ)單元，用于存儲(chǔ)預(yù)設(shè)的字幕大小參數(shù)；顯示位置確定單元，用于確定字幕在預(yù)設(shè)尺寸大小的視頻圖像中的顯示位置參數(shù)；
字符識(shí)別單元，用于對(duì)所述提取出的字幕區(qū)域完成單個(gè)字符的分割，還用于對(duì)分割得到的單個(gè)字符進(jìn)行分析，得到相應(yīng)的文字信息，并根據(jù)文字信息在字符庫(kù)中找到單個(gè)字符所對(duì)應(yīng)的字符影像信息；
字幕處理單元，用于根據(jù)在字符庫(kù)查找到的單個(gè)字符的影像信息和所述字幕大小存儲(chǔ)單元中存儲(chǔ)的字幕大小參數(shù)，對(duì)視頻圖像的字幕進(jìn)行處理。
所述字幕大小參數(shù)為字幕的字號(hào)大小。
所述字幕顯示參數(shù)包括放大倍數(shù)參數(shù)、字幕間的行距參數(shù)和顯示位置參數(shù)；所述字幕處理^f莫塊包括
放大尺寸確定單元，用于確定允許字幕放大的最大倍數(shù)參數(shù)；字幕參數(shù)存儲(chǔ)單元，用于存儲(chǔ)字幕的參數(shù)，包括字幕間的行距參數(shù)；顯示位置確定單元，用于根據(jù)每幀視頻圖像中字幕的行數(shù)，確定第一行字幕的顯示位置參數(shù)。
一行字幕區(qū)域進(jìn)行放大處理。
背景去除單元，用于將放大后的字幕區(qū)域中除字幕的區(qū)域灰度值設(shè)為0。所述允許字幕放大的最大倍數(shù)為預(yù)設(shè)尺寸大小的視頻圖像寬度與第一幀視
頻圖像中最長(zhǎng)字幕區(qū)域長(zhǎng)度之商。
所述字幕處理模塊還包括字幕拆分單元，用于當(dāng)一行字幕的長(zhǎng)度大于視頻圖像寬度時(shí)，對(duì)一行字幕進(jìn)行拆分。
本發(fā)明還提供一種^L頻字幕處理方法，該方法包括
1) 檢測(cè)當(dāng)前幀視頻圖像中是否含有字幕區(qū)域，如果含有則提取字幕區(qū)域，執(zhí)行步驟3)，否則，執(zhí)行步驟2);
2) 對(duì)當(dāng)前幀視頻圖像進(jìn)行縮小處理，并獲取下一幀圖像，返回步驟l);
3 )對(duì)提取的字幕區(qū)域進(jìn)行處理，并確定其在預(yù)設(shè)尺寸大小的視頻圖像中的顯示位置，執(zhí)行步驟4);
4) 對(duì)提取出字幕區(qū)域的視頻圖像進(jìn)行縮小和修復(fù)處理，執(zhí)行步驟5);
5) 將處理后的字幕區(qū)域和處理后的視頻圖像進(jìn)行疊加。所述對(duì)提取的字幕進(jìn)行處理為
將提取的字幕區(qū)域進(jìn)行單個(gè)字符切分，并對(duì)字符進(jìn)行分析，得到字幕的文字信息；
根據(jù)單個(gè)字符的文字信息在字符庫(kù)中找到其所對(duì)應(yīng)的字符影像信息；
根據(jù)在字符庫(kù)查找到的單個(gè)字符的影像信息和所預(yù)設(shè)的字幕大小參數(shù)，對(duì) 視頻圖像的字幕進(jìn)行處理。
所述對(duì)揭3又的字幕進(jìn)行處理為
將預(yù)設(shè)尺寸大小的視頻圖像寬度與第一幀視頻圖像中最長(zhǎng)字幕區(qū)域長(zhǎng)度之
商作為允許視頻字幕放大的最大倍數(shù)；
根據(jù)用戶(hù)需要對(duì)所提取的每一行字幕區(qū)域在所確定的允許視頻字幕放大的最大倍數(shù)的范圍內(nèi)進(jìn)行放大處理。
將放大后的字幕區(qū)域中除字幕的區(qū)域灰度值設(shè)為o 。
由以上的技術(shù)方案可見(jiàn)，本發(fā)明提供的視頻字幕處理裝置及方法，通過(guò)對(duì) 從視頻圖像中提取出的字幕區(qū)域進(jìn)行處理，解決了現(xiàn)有技術(shù)無(wú)法對(duì)未帶有字幕文件的視頻文件進(jìn)行字幕編輯的問(wèn)題，滿(mǎn)足了用戶(hù)在視頻圖像在縮小后調(diào)整字幕大小的需求。
而且本發(fā)明對(duì)原始視頻圖像進(jìn)行了修復(fù)處理，避免了由于放大字幕而導(dǎo)致的視頻圖像出現(xiàn)斑痕的問(wèn)題。

圖l是本發(fā)明提供的一種視頻字幕處理裝置的結(jié)構(gòu)示意圖；圖2是本發(fā)明提供的一種視頻字幕處理裝置的結(jié)構(gòu)實(shí)施例示意圖；圖3是本發(fā)明提供的另一種視頻字幕處理裝置的結(jié)構(gòu)實(shí)施例示意圖；圖4是本發(fā)明提供的一種視頻字幕處理方法的流程實(shí)施例示意圖。
具體實(shí)施例方式
為使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白，以下參照附圖并舉實(shí) 施例，對(duì)本發(fā)明進(jìn)一步詳細(xì)說(shuō)明。
圖l是本發(fā)明提供的一種視頻字幕處理裝置，該裝置包括
字幕檢測(cè)提取模塊101，檢測(cè)視頻數(shù)據(jù)中是否存在字幕區(qū)域，如果有，則將字幕區(qū)域提取出來(lái)，發(fā)送給字幕處理模塊102，并將提取出字幕的視頻圖像數(shù)據(jù)發(fā)送給視頻圖像處理模塊103;
字幕處理模塊102,用于根據(jù)用戶(hù)需要或顯示屏的大小確定字幕顯示的參數(shù)，對(duì)來(lái)自字幕檢測(cè)提取模塊101的字幕數(shù)據(jù)進(jìn)行處理，并將處理后的結(jié)果發(fā) 送給字幕疊加模塊104;
其中字幕顯示的參數(shù)包括字幕的大小參數(shù)和字幕顯示的位置參數(shù)。
視頻圖像處理模塊103，用于對(duì)來(lái)自字^f企測(cè)提取模塊101的視頻圖像數(shù) 據(jù)進(jìn)行處理，并將處理后的結(jié)果發(fā)送給字幕疊加一莫塊104;
字幕疊加模塊104,用于將處理后的字幕區(qū)域與處理后的視頻圖像進(jìn)行疊加。
圖2是本發(fā)明提供的一種視頻字幕處理裝置的結(jié)構(gòu)實(shí)施例示意圖，其中以視頻圖像的大小等于顯示器大小為例。在本實(shí)施中，該裝置包括字幕檢測(cè)提取模塊、字幕處理模塊、視頻圖像處理模塊、字幕疊加模塊，其中
字幕檢測(cè)提取模塊，根據(jù)來(lái)自視頻解碼模塊的視頻數(shù)據(jù)檢測(cè)視頻數(shù)據(jù)中是否存在字幕區(qū)域，如果有，則將字幕區(qū)域提取出來(lái)，發(fā)送給字幕處理模塊，并將提取出字幕的視頻圖像數(shù)據(jù)發(fā)送給視頻圖像處理模塊；
字幕處理模塊包括字幕大小參數(shù)存儲(chǔ)單元201,字符識(shí)別單元202,字幕處理單元203和顯示位置確定單元204。
其中，字幕大小參數(shù)存儲(chǔ)單元201,用于存儲(chǔ)預(yù)設(shè)的字幕大小參數(shù)，可以是顯示字幕的字號(hào)大小。
字符識(shí)別單元202,用于對(duì)提取到的字幕區(qū)域采用動(dòng)態(tài)局部閾值法對(duì)字幕區(qū)域二值化，同時(shí)進(jìn)行候選區(qū)域增強(qiáng)和重采樣，并通過(guò)區(qū)域垂直投影法探測(cè)準(zhǔn) 則對(duì)孤立噪聲進(jìn)行濾除，對(duì)粘連字符進(jìn)行自適應(yīng)分裂，對(duì)斷裂字符進(jìn)行自適應(yīng) 合并，完成單個(gè)字符的分割；
還用于對(duì)分割得到的單個(gè)字符進(jìn)行分析，得到相應(yīng)的文字信息，并根據(jù)單個(gè)字符的文字信息在字符庫(kù)中找到對(duì)應(yīng)的字符影像信息。從單個(gè)字符獲得文字信息的方法有很多，在這里使用OCR識(shí)別技術(shù)。
字幕處理單元203，用于根據(jù)在字符庫(kù)查找到的字符圖像影像和字幕大小存儲(chǔ)單元201中存儲(chǔ)的字幕大小參數(shù)，對(duì)對(duì)識(shí)別出來(lái)的單個(gè)字符進(jìn)行處理。例如，字幕參數(shù)存儲(chǔ)單元201中存儲(chǔ)的字幕大小參數(shù)是表示字號(hào)為"小四，，的信息，經(jīng)字符識(shí)別出兩個(gè)字符文本信息"你"、"好，，，在字符庫(kù)中找到這兩個(gè)字符的圖像信息，將"你"、"好，'這兩個(gè)字的字號(hào)轉(zhuǎn)換為"小四"大小的字符。
顯示位置確定單元204，用于確定字幕在顯示器中顯示的位置，包括水平方向4立置和垂直方向4立置。
其中水平方向位置的確定，需要保證最長(zhǎng)的那行字幕的左端至少不超過(guò)顯示器的左邊緣，垂直方向位置的確定，需要保證最接近顯示器最底端的那行字幕的最低點(diǎn)至少不超出顯示器的最底端。
進(jìn)一步地，由于字幕被放大，可能會(huì)出現(xiàn)，原本能夠在一行里顯示的字幕，在放大后卻顯示不了，這樣就需要根據(jù)放大后的字幕大小參數(shù)統(tǒng)計(jì)在預(yù)定的顯
示尺寸下一行最多能顯示的字符個(gè)數(shù)，即顯示器的寬度大于等于N ( N為大于等于1的自然數(shù)一 )個(gè)字符的寬度之和，小于N+l個(gè)字符的寬度之和。
視頻圖像處理模塊包括視頻圖像修復(fù)單元205和視頻圖像縮小單元206, 在本實(shí)施例中，由于視頻圖像處理中，不管先對(duì)圖像進(jìn)行修復(fù)還是先對(duì)圖像進(jìn) 行縮小，都不會(huì)影響視頻圖像的顯示效果，所以來(lái)自視頻解碼模塊的視頻數(shù)據(jù) 既可以先在視頻圖像修復(fù)單元205中進(jìn)行處理，也可以先在視頻圖像縮小單元 206中進(jìn)行處理。
其中，視頻圖像在視頻圖像修復(fù)單元205中進(jìn)行的處理，具體為首先，讀取字幕檢測(cè)提取模塊所檢測(cè)到的字幕區(qū)域的位置信息，比如，字幕區(qū)域的最小外接區(qū)域，將檢測(cè)到的字幕區(qū)域的位置信息映射到視頻圖像中，并將所映射到的區(qū)域用一種顏色表示，然后，使用紋理修復(fù)算法對(duì)所映射到的區(qū)域進(jìn)行修復(fù)處理。本領(lǐng)域內(nèi)的普通技術(shù)人員可以采用公知的最小外接區(qū)域的計(jì)算方法和紋理修復(fù)算法實(shí)現(xiàn)本實(shí)施方案，此處不再贅述。
在視頻圖像處理模塊中，對(duì)視頻圖像還要進(jìn)行另一步處理，那就是在視頻圖像縮小單元206中進(jìn)行圖像的縮小處理。其縮小的倍數(shù)等于原視頻圖像大小與所需顯示的視頻圖像的大小的商。一般的，所需顯示的視頻圖像的大小為視頻圖像全屏?xí)r的大小，即為當(dāng)前顯示屏幕的大小。
經(jīng)視頻圖像處理模塊處理后的視頻圖像數(shù)據(jù)和視頻圖像參數(shù)，被發(fā)送到字幕疊加模塊中，其中視頻圖像參數(shù)包括視頻圖像長(zhǎng)度和寬度。字幕疊加模塊，用于將處理后的字幕區(qū)域與處理后的視頻圖像進(jìn)行疊加。
圖3是本發(fā)明提供的另一種視頻字幕處理裝置的結(jié)構(gòu)實(shí)施例示意圖。在本實(shí)施例中，該裝置包括字幕檢測(cè)提取模塊、字幕處理模塊、視頻圖像處理模塊、字幕疊加模塊。
其中，除字幕處理模塊的結(jié)構(gòu)有所變化，其他各模塊的結(jié)構(gòu)及功能相同，在這里就不贅述了。
字幕處理模塊包括放大尺寸確定單元301、字幕參數(shù)存儲(chǔ)單元302、顯示位置確定單元303、字幕處理單元3Q4和背景去除單元305。
放大尺寸確定單元301,用于確定允許字幕放大的最大放大倍數(shù)參數(shù)。獲取第一幀視頻圖像中長(zhǎng)度最長(zhǎng)的字幕區(qū)域長(zhǎng)度信息，最大的放大倍數(shù)為顯示器寬度與該最長(zhǎng)字幕區(qū)域長(zhǎng)度之商。
字幕參數(shù)存儲(chǔ)單元302，用于存儲(chǔ)字幕的參數(shù)，包括字幕的行距參數(shù)。
顯示位置確定單元303,用于根據(jù)每幀視頻圖像中字幕的行數(shù)，確定第一行字幕的顯示位置參數(shù)。比如，如果一幀視頻圖像的字幕為1行，那么可以確定第一行字幕的顯示位置與顯示器最底端的距離為顯示器高度的1/9;如果一幀視頻圖像的字幕為3行，那么可以確定第一行字幕的顯示位置與顯示器最底端的距離為顯示器高度的1/3。對(duì)于第一行字幕的顯示位置的確定，可以根據(jù) 用戶(hù)的需要進(jìn)行設(shè)定。第二行字幕的顯示位置與顯示器最底端的距離為第一行字幕的顯示位置、字幕顯示的行距和放大后字符高度之和，以此類(lèi)推。
字幕處理單元304，根據(jù)放大尺寸確定單元301的所確定的放大倍數(shù)對(duì)所提取的每一行字幕區(qū)域進(jìn)行放大處理。
背景去除單元305,用于將放大后的字幕區(qū)域中除字幕的區(qū)域灰度值設(shè)為 0。首先找出背景區(qū)域。在本實(shí)施例中，釆用八叉樹(shù)顏色量化算法對(duì)字幕區(qū)域二值化后，運(yùn)用形態(tài)處理的方法找到已得到字幕以及包含字幕所有邊緣像素的區(qū) 域，剩下來(lái)的區(qū)域便是字幕區(qū)域的背景部分。將這一部分區(qū)域的灰度值設(shè)為0。
由于背景去除與字幕處理這兩個(gè)步驟并沒(méi)有先后要求，因此，這兩個(gè)單元的連接關(guān)系可以與本實(shí)施例示意圖中所示的關(guān)系不同。
進(jìn)一步地，由于這樣并不能避免出現(xiàn)一行字幕的寬度大于顯示器的寬度，所以在這里增設(shè)字幕拆分單元。首先判斷一行字幕的寬度是否大于顯示器的寬度，如果大于，則對(duì)該行字幕進(jìn)行拆分?？梢詫@示器的右邊緣作為預(yù)測(cè)的拆分位置。
更進(jìn)一步地，為了避免這個(gè)預(yù)測(cè)位置不在兩個(gè)字之間，即在某個(gè)字符上，則在這個(gè)預(yù)測(cè)位置附近采用局部二值化及垂直投影分割的方法，判斷其是否在兩個(gè)字符之間，如果則，則將這個(gè)預(yù)測(cè)位置作為拆分位置，如果不是，則將預(yù) 測(cè)位置向左平移，并重復(fù)上述判斷過(guò)程，直到找到兩個(gè)字符的中間位置，將其作為拆分位置。
根據(jù)上述裝置，本發(fā)明還提供一種視頻字幕裝置的方法。圖4是本發(fā)明提供的一種^^頻字幕處理的方法的實(shí)施例示意圖。該方法有以下步驟
步驟401,檢測(cè)當(dāng)前幀視頻圖像中是否含有字幕區(qū)域，如果含有，則提取字幕區(qū)域執(zhí)行步驟403;如果不含有，執(zhí)行步驟402;
步驟402,對(duì)當(dāng)前幀視頻圖像進(jìn)行縮小處理，并獲取下一幀圖像，返回步驟 401;
步驟4 0 3 ，對(duì)才是取的字幕區(qū)域進(jìn)行處理；
本步驟具體為將提取的字幕區(qū)域進(jìn)行單個(gè)字符切分，并對(duì)字符進(jìn)行分析，得到字符的文字信息，根據(jù)字符的文字信息在字符庫(kù)中找到每個(gè)字符的字符影像；
然后，根據(jù)預(yù)設(shè)的字幕大小參數(shù)和在字符庫(kù)中查找到的字符影像和對(duì)視頻圖像的字幕進(jìn)行處理。。
這個(gè)步驟還可以為將顯示器寬度與第一幀圖像最長(zhǎng)字幕區(qū)域的長(zhǎng)度之商作為字幕區(qū)域的最大放大倍數(shù)，根據(jù)用戶(hù)的需要對(duì)視頻圖像中的字幕進(jìn)行放大處理。
由于字幕區(qū)域的長(zhǎng)度不一，有可能出現(xiàn)字幕放大后的長(zhǎng)度超過(guò)顯示器的寬度，因此本步驟進(jìn)一步包括字幕拆分過(guò)程?？梢詫@示器的右邊緣位置作為預(yù) 測(cè)位置，為了避免這個(gè)預(yù)測(cè)位置不在兩個(gè)字之間，即在某個(gè)字符上，則在這個(gè) 預(yù)測(cè)位置附近采用局部二值化及垂直投影分割的方法，判斷其是否在兩個(gè)字符之間，如果則，則將這個(gè)預(yù)測(cè)位置作為拆分位置，如果不是，則將預(yù)測(cè)位置向左平移，并重復(fù)上述判斷過(guò)程，直到找到兩個(gè)字符的中間位置，將其作為拆分位置。
步驟404,確定字幕的顯示位置。本步驟包括確定水平方向位置和垂直方向位置。
其中水平方向位置的確定，需要保證最長(zhǎng)的那行字幕的左端至少不超過(guò)顯示器的左邊緣，垂直方向位置的確定，需要保證最接近顯示器最底端的那行字幕的最低點(diǎn)至少不超出顯示器的最底端。
步驟405,對(duì)提取字幕后的視頻圖像進(jìn)行縮小和修復(fù)處理。本步驟中對(duì)提取字幕后的視頻圖像進(jìn)行的兩個(gè)處理過(guò)程的先后關(guān)系不固定，其中對(duì)視頻圖像進(jìn)行修復(fù)處理，主要是對(duì)字幕區(qū)域的修復(fù)。步驟406,將處理后的字幕與處理后的視頻圖像進(jìn)行疊加。由上述的實(shí)施例可見(jiàn)，本發(fā)明提供的視頻字幕處理裝置及方法，通過(guò)對(duì)從視頻圖像中提取出的字幕區(qū)域進(jìn)行處理，解決了現(xiàn)有技術(shù)無(wú)法對(duì)未帶有字幕文件的視頻文件進(jìn)行字幕編輯的問(wèn)題，滿(mǎn)足了用戶(hù)在視頻圖像在縮小后調(diào)整字幕大小的需求。
而且本發(fā)明對(duì)原始視頻圖像進(jìn)行了修復(fù)處理，避免了由于放大字幕而導(dǎo)致的視頻圖像出現(xiàn)斑痕的問(wèn)題。
通過(guò)上述的說(shuō)明，上述本發(fā)明的實(shí)施例是以示例的目的而展開(kāi)，本技術(shù)領(lǐng) 域中的普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到，以上的實(shí)施例僅是用來(lái)說(shuō)明本發(fā)明，而并非用作為對(duì)本發(fā)明的限定，只要在本發(fā)明的實(shí)質(zhì)精神范圍內(nèi)，對(duì)以上所述實(shí)施例的變化、變型都將落在本發(fā)明權(quán)利要求書(shū)的范圍內(nèi)。
權(quán)利要求
1、一種視頻字幕處理裝置，其特征在于，該裝置包括字幕檢測(cè)提取模塊，檢測(cè)并提取出視頻圖像中的字幕區(qū)域；字幕處理模塊，用于根據(jù)確定的字幕顯示參數(shù)對(duì)所述提取出的字幕區(qū)域進(jìn)行處理。
2、如權(quán)利要求l所述的裝置，其特征在于，該裝置還包括視頻圖像處理模塊，用于對(duì)提取出字幕區(qū)域的視頻圖像進(jìn)行處理；字幕疊加模塊，用于將處理后的字幕區(qū)域與處理后的視頻圖像進(jìn)行疊加。
3、如權(quán)利要求2所述的裝置，其特征在于，所述視頻圖像處理模塊，包括視頻圖像縮小單元，用于將所述提取出字幕區(qū)域的視頻圖像縮小到預(yù)設(shè)的顯示尺寸；視頻圖像修復(fù)單元，用于對(duì)縮小后的視頻圖像中的字幕區(qū)域進(jìn)行修復(fù)。
4、如權(quán)利要求2所述的裝置，其特征在于，所述視頻圖像處理模塊，包括視頻圖像修復(fù)單元，用于對(duì)所述提取出字幕區(qū)域的視頻圖像中的字幕區(qū)域進(jìn)行修復(fù)；視頻圖像縮小單元，用于將修復(fù)后的視頻圖像縮小到預(yù)設(shè)的顯示尺寸。
5、如權(quán)利要求l所述的裝置，其特征在于所述字幕顯示參數(shù)包括字幕大小參凄t禾口顯示4立置參凄丈；所述字幕處理模塊包括，字幕大小參數(shù)存儲(chǔ)單元，用于存儲(chǔ)預(yù)設(shè)的字幕大小參數(shù)；顯示位置確定單元，用于確定字幕在預(yù)設(shè)尺寸大小的視頻圖像中的顯示位置參數(shù)；字符識(shí)別單元，用于對(duì)所述提取出的字幕區(qū)域完成單個(gè)字符的分割，還用于對(duì)分割得到的單個(gè)字符進(jìn)行分析，得到相應(yīng)的文字信息，并纟艮據(jù)文字信息在字符庫(kù)中找到單個(gè)字符所對(duì)應(yīng)的字符影像信息；字幕處理單元，用于才艮據(jù)在字符庫(kù)查找到的單個(gè)字符的影^象信息和所述字幕大小存儲(chǔ)單元中存儲(chǔ)的字幕大小參數(shù)，對(duì)視頻圖像的字幕進(jìn)行處理。
6、如權(quán)利要求5所述的裝置，其特征在于所述字幕大小參數(shù)為字幕的字號(hào)大小。
7、如權(quán)利要求1所述的裝置，其特征在于所述字幕顯示參數(shù)包括放大倍數(shù)參數(shù)、字幕間的行距參數(shù)和顯示位置參數(shù)；所述字幕處理模塊包括，放大尺寸確定單元，用于確定允許字幕放大的最大倍數(shù)參數(shù)；字幕參數(shù)存儲(chǔ)單元，用于存儲(chǔ)字幕的參數(shù)，包括字幕間的行距參數(shù)；顯示位置確定單元，用于根據(jù)每幀視頻圖像中字幕的行數(shù)，確定第一行字幕的顯示位置參數(shù)。字幕處理單元，根據(jù)放大尺寸確定單元的所確定的放大倍數(shù)對(duì)所提取的每一行字幕區(qū)域進(jìn)行放大處理。背景去除單元，用于將放大后的字幕區(qū)域中除字幕的區(qū)域灰度值設(shè)為0。
8、如權(quán)利要求7所述的裝置，其特征在于所述允許字幕放大的最大倍數(shù) 為預(yù)設(shè)尺寸大小的視頻圖像寬度與第一幀視頻圖像中最長(zhǎng)字幕區(qū)域長(zhǎng)度之商。
9、如權(quán)利要求7所述的裝置，其特征在于，所述字幕處理模塊還包括字幕拆分單元，用于當(dāng)一行字幕的長(zhǎng)度大于視頻圖像寬度時(shí)，對(duì)一行字幕進(jìn)行拆分。
10、一種視頻字幕處理方法，其特征在于，該方法包括1) 檢測(cè)當(dāng)前幀視頻圖像中是否含有字幕區(qū)域，如果含有則提取字幕區(qū)域，執(zhí)行步驟3)，否則，執(zhí)行步驟2);2) 對(duì)當(dāng)前幀視頻圖像進(jìn)行縮小處理，并獲取下一幀圖像，返回步驟l);3) 對(duì)提取的字幕區(qū)域進(jìn)行處理，并確定其在預(yù)設(shè)尺寸大小的視頻圖像中的顯示位置，執(zhí)行步驟4);4 )對(duì)提取出字幕區(qū)域的視頻圖像進(jìn)行縮小和修復(fù)處理，執(zhí)行步驟5 );5 )將處理后的字幕區(qū)域和處理后的視頻圖像進(jìn)行疊加。
11、如權(quán)利要求IO所述的方法，其特征在于所述對(duì)提取的字幕進(jìn)行處理為將提取的字幕區(qū)域進(jìn)行單個(gè)字符切分，并對(duì)字符進(jìn)行分析，得到字幕的文字信息；才艮據(jù)單個(gè)字符的文字信息在字符庫(kù)中找到其所對(duì)應(yīng)的字符影j象信息；根據(jù)在字符庫(kù)查找到的單個(gè)字符的影像信息和所預(yù)設(shè)的字幕大小參數(shù)，對(duì)視頻圖像的字幕進(jìn)行處理。
12、如權(quán)利要求1Q所述的方法，其特征在于，所述對(duì)提取的字幕進(jìn)行處理為將預(yù)設(shè)尺寸大小的視頻圖像寬度與第一幀碎見(jiàn)頻圖像中最長(zhǎng)字幕區(qū)域長(zhǎng)度之商作為允許視頻字幕放大的最大倍數(shù)；根據(jù)用戶(hù)需要對(duì)所提取的每一行字幕區(qū)域在所確定的允許視頻字幕放大的最大倍數(shù)的范圍內(nèi)進(jìn)行放大處理。將放大后的字幕區(qū)域中除字幕的區(qū)域灰度值設(shè)為o。
全文摘要
本發(fā)明提供的視頻字幕處理裝置及方法，通過(guò)對(duì)從視頻圖像中提取出的字幕區(qū)域進(jìn)行處理，解決了現(xiàn)有技術(shù)無(wú)法對(duì)未帶有字幕文件的視頻文件進(jìn)行字幕編輯的問(wèn)題，滿(mǎn)足了用戶(hù)在視頻圖像在縮小后調(diào)整字幕大小的需求。而且本發(fā)明對(duì)原始視頻圖像進(jìn)行了修復(fù)處理，避免了由于放大字幕而導(dǎo)致的視頻圖像出現(xiàn)斑痕的問(wèn)題。
文檔編號(hào)H04N5/278GK101360193SQ200810119340
公開(kāi)日2009年2月4日申請(qǐng)日期2008年9月4日優(yōu)先權(quán)日2008年9月4日
發(fā)明者黨寧娜, 律謝申請(qǐng)人:北京中星微電子有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：謝律;黨寧娜
技術(shù)所有人：北京中星微電子有限公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開(kāi)發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開(kāi)發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車(chē)檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車(chē)電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

濕熱處理的方法和裝置相關(guān)技術(shù)

視頻去字幕的方法相關(guān)技術(shù)

視頻字幕制作軟件相關(guān)技術(shù)

生活污水處理裝置相關(guān)技術(shù)

污水處理裝置相關(guān)技術(shù)

軟化水處理裝置相關(guān)技術(shù)

汽車(chē)尾氣處理裝置相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種視頻字幕處理裝置及方法