一種多通道純文本幀監(jiān)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息處理領(lǐng)域,尤其涉及一種多通道純文本幀監(jiān)測方法。
【背景技術(shù)】
[0002] 中國數(shù)字電視網(wǎng)絡(luò)經(jīng)過近幾年發(fā)展,已經(jīng)形成相當(dāng)規(guī)模,電視節(jié)目數(shù)字化已全面 普及。為了監(jiān)測下屬電視臺(tái)節(jié)目的播出質(zhì)量以及播出內(nèi)容是否符合規(guī)定,國家及很多省市 都建立監(jiān)管中心對下屬電視臺(tái)播出的節(jié)目進(jìn)行監(jiān)測和監(jiān)控,各個(gè)監(jiān)測點(diǎn)地節(jié)目都需通過專 用網(wǎng)絡(luò)回傳至監(jiān)管中心。在內(nèi)容層分析中,須要對純文本幀進(jìn)行分析,并結(jié)合靜幀分析,及 音頻特征分析,并將分析結(jié)果中的異常上報(bào)網(wǎng)管平臺(tái)。
[0003] 現(xiàn)有方案為在嵌入式平臺(tái)進(jìn)行圖像編碼打包,并通過網(wǎng)絡(luò)上傳至云端/服務(wù)器, 由服務(wù)器端對視頻流進(jìn)行解碼分析,然而現(xiàn)有技術(shù)由于網(wǎng)絡(luò)傳輸帶寬的限制,必須對視頻 流進(jìn)行編碼傳輸再解碼分析,難以做到直接對原始視頻流進(jìn)行分析,并導(dǎo)致分析過程效率 低,實(shí)時(shí)性差。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明所要解決的技術(shù)問題在于提供一種高效的視頻純文本幀檢測方法,本發(fā)明 使用DSP匯編編碼,無須編解碼及傳輸處理,可以實(shí)現(xiàn)對視頻流的實(shí)時(shí)分析,顯著地提升分 析效率,并且不受帶寬的限制。
[0005] 本發(fā)明是這樣實(shí)現(xiàn)的,一種多通道純文本幀監(jiān)測方法,包括以下步驟:
[0006] S1、獲取原始視頻幀圖像數(shù)據(jù);
[0007] S2、獲取所述原始視頻幀圖像的二值化圖像;
[0008] S3、排除所述二值化圖像中的非文本區(qū)域;
[0009] S4、獲取所述二值化圖像中的疑似目標(biāo)文本區(qū)域,并根據(jù)所述疑似目標(biāo)文本區(qū)域 提取二進(jìn)制模板;
[0010] S5、根據(jù)所述二進(jìn)制模板獲取原始視頻幀圖像數(shù)據(jù)中的文本區(qū)域信息。
[0011] 優(yōu)選的,S2中首先對所述原始視頻幀圖像進(jìn)行去噪和圖像模糊處理,然后對處理 后的圖像進(jìn)行邊緣檢測,并對檢測后的圖像進(jìn)行二值化處理。
[0012] 優(yōu)選的,所述去噪和圖像模糊處理使用巴特沃斯低通濾波算法,所述巴特沃斯低 通濾波算法的傳遞函數(shù)為
其中u,v為二維坐標(biāo),D(u,v)表示當(dāng) 前坐標(biāo)到頻域矩形中心的距離,Dc!表示截止頻率,n表示階數(shù)。
[0013] 優(yōu)選的,所述傳遞函數(shù)中,高清圖像處理時(shí)DQ= 934;標(biāo)清圖像處理時(shí)DQ= 498。
[0014] 優(yōu)選的,所述傳遞函數(shù)中,階數(shù)為1。
[0015] 優(yōu)選的,所述邊緣檢測使用索貝爾邊緣檢測算法,所述索貝爾邊緣算子A為
[0016] 優(yōu)選的,所述二值化處理使用最大類間方差二值化算法。
[0017] 優(yōu)選的,S3中首先對所述二值化圖像進(jìn)行腐蝕和補(bǔ)償腐蝕處理,所述腐蝕和補(bǔ)償 腐蝕處理用于吞噬掉所述二值化圖像中明顯不符合文本區(qū)域形狀要求的小形狀目標(biāo);然后 對處理后的圖像進(jìn)行區(qū)域填充,并對填充后的圖像進(jìn)行形態(tài)學(xué)濾波。
[0018] 優(yōu)選的,所述區(qū)域填充使用開運(yùn)算,所述形態(tài)學(xué)濾波用于根據(jù)大小、填充區(qū)域和位 置三要素排除非文本區(qū)域。
[0019] 優(yōu)選的,S4中首先在排除非文本區(qū)域后的圖像中進(jìn)行文本目標(biāo)區(qū)域識(shí)別,獲得疑 似目標(biāo)文本區(qū)域,然后對疑似目標(biāo)文本區(qū)域進(jìn)行邊界裁剪,從而獲得邊界清晰的疑似目標(biāo) 文本區(qū)域的二進(jìn)制模板,所述二進(jìn)制模板包含所述疑似目標(biāo)文本區(qū)域的邊界位置信息。
[0020] 優(yōu)選的,S5中將所述二進(jìn)制模板與原始視頻幀圖像進(jìn)行比對,所述文本區(qū)域信息 為原始視頻幀圖像落入所述二進(jìn)制模板區(qū)域內(nèi)的信息。
[0021] 優(yōu)選的,S5后對所述文本區(qū)域信息進(jìn)行分析,分析內(nèi)容包括灰度、亮度和色度;并 判斷文本區(qū)域內(nèi)容是否異常,若異常,則產(chǎn)生報(bào)警信息。
[0022] 優(yōu)選的,S1中所述原始視頻幀圖像數(shù)據(jù)為SDI中直接輸出的視頻數(shù)據(jù)。
[0023] 實(shí)施本發(fā)明,具有如下有益效果:
[0024] 本發(fā)明提供了一種高效的視頻純文本幀檢測方法,本發(fā)明可實(shí)時(shí)對4路標(biāo)清節(jié)目 或2路高清節(jié)目進(jìn)行實(shí)時(shí)純文本幀檢測。與現(xiàn)有技術(shù)相比,本技術(shù)基于高性能嵌入式系統(tǒng), 核心算法模塊使用DSP匯編編碼,無須編解碼及傳輸處理,實(shí)現(xiàn)實(shí)時(shí)原始視頻里純文本分 析,具有高效,高性能、高穩(wěn)定性特點(diǎn),且占用空間小,具有很高的性價(jià)比,并且不受帶寬的 限制。
【附圖說明】
[0025] 圖1是一種高效的視頻純文本幀檢測方法的流程圖。
【具體實(shí)施方式】
[0026] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明作進(jìn)一 步地詳細(xì)描述。
[0027] 本發(fā)明實(shí)施例提供了一種多通道純文本幀監(jiān)測方法,如圖1所示,包括以下步驟:
[0028] S1、獲取原始視頻幀圖像數(shù)據(jù);
[0029] S2、獲取所述原始視頻幀圖像的二值化圖像;
[0030] S3、排除所述二值化圖像中的非文本區(qū)域;
[0031] S4、獲取所述二值化圖像中的疑似目標(biāo)文本區(qū)域,并根據(jù)所述疑似目標(biāo)文本區(qū)域 提取二進(jìn)制模板;
[0032] S5、根據(jù)所述二進(jìn)制模板獲取原始視頻幀圖像數(shù)據(jù)中的文本區(qū)域信息。
[0033] 優(yōu)選的,S2中首先對所述原始視頻幀圖像進(jìn)行去噪和圖像模糊處理,然后對處理 后的圖像進(jìn)行邊緣檢測,并對檢測后的圖像進(jìn)行二值化處理。
[0034] 優(yōu)選的,所述去噪和圖像模糊處理使用巴特沃斯低通濾波算法,所述巴特沃斯低 通濾波算法的傳遞函數(shù)為
,其中u,v為二維坐標(biāo),D(u,v)表示當(dāng) 前坐標(biāo)到頻域矩形中心的距離,Dc!表示截止頻率,n表示階數(shù)。
[0035] 優(yōu)選的,所述傳遞函數(shù)中,高清圖像處理時(shí)DQ= 934 ;標(biāo)清圖像處理時(shí)D。= 498。
[0036] 優(yōu)選的,所述傳遞函數(shù)中,階數(shù)為1。
[0037] 優(yōu)選的,所述邊緣檢測使用索貝爾邊緣檢測算法,所述索貝爾邊緣算子A為
[0038] 優(yōu)選的,所述二值化處理使用最大類間方差二值化算法。
[0039] 優(yōu)選的,S3中首先對所述二值化圖像進(jìn)行腐蝕和補(bǔ)償腐蝕處理,所述腐蝕和補(bǔ)償 腐蝕處理用于吞噬掉所述二值化圖像中明顯不符合文本區(qū)域形狀要求的小形狀目標(biāo);然后 對處理后的圖像進(jìn)行區(qū)域填充,并對填充后的圖像進(jìn)行形態(tài)學(xué)濾波。
[0040] 優(yōu)選的,所述區(qū)域填充使用開運(yùn)算,所述形態(tài)學(xué)濾波用于根據(jù)大小、填充區(qū)域和位 置三要素排除非文本區(qū)域。
[0041] 優(yōu)選的,S4中首先在排除非文本區(qū)域后的圖像中進(jìn)行文本目標(biāo)區(qū)域識(shí)別,獲得疑 似目標(biāo)文本區(qū)域,然后對疑似目標(biāo)文本區(qū)域進(jìn)行邊界裁剪,從而獲得邊界清晰的疑似目標(biāo) 文本區(qū)域的二進(jìn)制模板,所述二進(jìn)制模板包含所述疑似目標(biāo)文本區(qū)域的邊界位置信息。
[0042] 優(yōu)選的,S5中將所述二進(jìn)制模板與原始視頻幀圖像進(jìn)行比對,所述文本區(qū)域信息 為原始視頻幀圖像落入所述二進(jìn)制模板區(qū)域內(nèi)的信息。
[0043] 優(yōu)選的,S5后對所述文本區(qū)域信息進(jìn)行分析,分析內(nèi)容包括灰度、亮度和色度;并 判斷文本區(qū)域內(nèi)容是否異常,若異常,則產(chǎn)生報(bào)警信息。
[0044] 優(yōu)選的,S1中所述原始視頻幀圖像數(shù)據(jù)為SDI中直接輸出的視頻數(shù)據(jù)。
[0045] 本方法使用DSP匯編編碼,無須編解碼及傳輸處理,處理能力為在DM8168平臺(tái)下, 可實(shí)現(xiàn)4路標(biāo)清視頻或2路高清視頻的實(shí)時(shí)純文本分析。
[0046] 以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范 圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。
【主權(quán)項(xiàng)】
1. 一種多通道純文本幀監(jiān)測方法,其特征在于,包括以下步驟: 51、 獲取原始視頻幀圖像數(shù)據(jù); 52、 獲取所述原始視頻幀圖像的二值化圖像; 53、 排除所述二值化圖像中的非文本區(qū)域; 54、 獲取所述二值化圖像中的疑似目標(biāo)文本區(qū)域,并根據(jù)所述疑似目標(biāo)文本區(qū)域提取 二進(jìn)制模板; 55、 根據(jù)所述二進(jìn)制模板獲取原始視頻幀圖像數(shù)據(jù)中的文本區(qū)域信息。2. 根據(jù)權(quán)利要求1所述的一種多通道純文本幀監(jiān)測方法,其特征在于,S2中首先對所 述原始視頻幀圖像進(jìn)行去噪和圖像模糊處理,然后對處理后的圖像進(jìn)行邊緣檢測,并對檢 測后的圖像進(jìn)行二值化處理。3. 根據(jù)權(quán)利要求2所述的一種多通道純文本幀監(jiān)測方法,其特征在于,所述去噪和 圖像模糊處理使用巴特沃斯低通濾波算法,所述巴特沃斯低通濾波算法的傳遞函數(shù)為,其中u, V為二維坐標(biāo),D(u, V)表示當(dāng)前坐標(biāo)到頻域矩形中心的 距離,Dtl表示截止頻率,η表示階數(shù)。4. 根據(jù)權(quán)利要求3所述的一種多通道純文本幀監(jiān)測方法,其特征在于,所述傳遞函數(shù) 中,高清圖像處理時(shí)Dtl= 934 ;標(biāo)清圖像處理時(shí)D。= 498。5. 根據(jù)權(quán)利要求3所述的一種多通道純文本幀監(jiān)測方法,其特征在于,所述傳遞函數(shù) 中,階數(shù)為1。6. 根據(jù)權(quán)利要求2-5中任意一項(xiàng)所述的一種多通道純文本幀監(jiān)測方法,其特征在于, 所述邊緣檢測使用索貝爾邊緣檢測算法,所述索貝爾邊緣算子Δ為7. 根據(jù)權(quán)利要求6中所述的一種多通道純文本幀監(jiān)測方法,其特征在于,所述二值化 處理使用最大類間方差二值化算法。8. 根據(jù)權(quán)利要求7所述的一種多通道純文本幀監(jiān)測方法,其特征在于,S3中首先對所 述二值化圖像進(jìn)行腐蝕和補(bǔ)償腐蝕處理,所述腐蝕和補(bǔ)償腐蝕處理用于吞噬掉所述二值化 圖像中明顯不符合文本區(qū)域形狀要求的小形狀目標(biāo);然后對處理后的圖像進(jìn)行區(qū)域填充, 并對填充后的圖像進(jìn)行形態(tài)學(xué)濾波。9. 根據(jù)權(quán)利要求8所述的一種多通道純文本幀監(jiān)測方法,其特征在于,所述區(qū)域填充 使用開運(yùn)算,所述形態(tài)學(xué)濾波用于根據(jù)大小、填充區(qū)域和位置三要素排除非文本區(qū)域。10. 根據(jù)權(quán)利要求9中所述的一種多通道純文本幀監(jiān)測方法,其特征在于,S4中首先在 排除非文本區(qū)域后的圖像中進(jìn)行文本目標(biāo)區(qū)域識(shí)別,獲得疑似目標(biāo)文本區(qū)域,然后對疑似 目標(biāo)文本區(qū)域進(jìn)行邊界裁剪,從而獲得邊界清晰的疑似目標(biāo)文本區(qū)域的二進(jìn)制模板,所述 二進(jìn)制模板包含所述疑似目標(biāo)文本區(qū)域的邊界位置信息。11. 根據(jù)權(quán)利要求10中所述的一種多通道純文本幀監(jiān)測方法,其特征在于,S5中將所 述二進(jìn)制模板與原始視頻幀圖像進(jìn)行比對,所述文本區(qū)域信息為原始視頻幀圖像落入所述 二進(jìn)制模板區(qū)域內(nèi)的信息。12. 根據(jù)權(quán)利要求11所述一種多通道純文本幀監(jiān)測方法,其特征在于,S5后對所述文 本區(qū)域信息進(jìn)行分析,分析內(nèi)容包括灰度、亮度和色度;并判斷文本區(qū)域內(nèi)容是否異常,若 異常,則產(chǎn)生報(bào)警信息。13. 根據(jù)權(quán)利要求12所述一種多通道純文本幀監(jiān)測方法,其特征在于,Sl中所述原始 視頻幀圖像數(shù)據(jù)為SDI中直接輸出的視頻數(shù)據(jù)。
【專利摘要】一種多通道純文本幀監(jiān)測方法,本發(fā)明提供了一種高效的視頻純文本幀檢測方法,實(shí)時(shí)獲取SDI中輸出的原始視頻流,并對視頻流進(jìn)行純文本的辨識(shí)和分析,從而進(jìn)行純文本幀監(jiān)測。本發(fā)明可實(shí)時(shí)對4路標(biāo)清節(jié)目或2路高清節(jié)目進(jìn)行實(shí)時(shí)純文本幀檢測。與現(xiàn)有技術(shù)相比,本技術(shù)基于高性能嵌入式系統(tǒng),核心算法模塊使用DSP匯編編碼,無須編解碼及傳輸處理,實(shí)現(xiàn)實(shí)時(shí)原始視頻里純文本分析,具有高效,高性能、高穩(wěn)定性特點(diǎn),且占用空間小,具有很高的性價(jià)比,并且不受帶寬的限制。
【IPC分類】H04N21/234, G06K9/00
【公開號(hào)】CN104980765
【申請?zhí)枴緾N201510329201
【發(fā)明人】林曉東
【申請人】北京博威康技術(shù)有限公司
【公開日】2015年10月14日
【申請日】2015年6月15日