一種視頻碼流過濾方法和過濾節(jié)點(diǎn)的制作方法

文檔序號(hào)：7960783閱讀：137來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：一種視頻碼流過濾方法和過濾節(jié)點(diǎn)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及多媒體通信技術(shù)，特別涉及一種多媒體通信過程中的視頻碼流過濾方法和過濾節(jié)點(diǎn)。
背景技術(shù)：
流媒體(Streaming Media)作為一種基本的多媒體通信形式，派生出了眾多的多媒體通信業(yè)務(wù)形式會(huì)議電視/可視電話，IPTV，VOD，即時(shí)通信等等。因此流媒體將成為下一代網(wǎng)絡(luò)NGN(Next Generation Network)上的基本通信形式。尤其是近幾年來(lái)國(guó)內(nèi)外IPTV(Internet Protocol Television，IP電視)業(yè)務(wù)的快速興起，流媒體在網(wǎng)絡(luò)上的應(yīng)用也在急速發(fā)展。
流媒體上的一類業(yè)務(wù)比如IPTV和VOD(Video on Demand，視頻點(diǎn)播)，都是以提供視頻音頻內(nèi)容為功能的。內(nèi)容的范圍非常廣闊，包括影視節(jié)目、新聞、體育比賽、演唱會(huì)等等。各個(gè)國(guó)家，尤其是我國(guó)，對(duì)于內(nèi)容的安全和監(jiān)控一直是高度重視的，都有相關(guān)的法律。從保護(hù)未成年人角度出發(fā)，各國(guó)也有相關(guān)的規(guī)定。同時(shí)，在運(yùn)營(yíng)商/ISP(Internet Service Provider，因特網(wǎng)服務(wù)提供商)和內(nèi)容提供商那里也有這樣的需求。國(guó)內(nèi)即將大規(guī)模開展IPTV的運(yùn)營(yíng)，那么首先一個(gè)問題是如何保證有效的內(nèi)容監(jiān)控和過濾，把有害的內(nèi)容屏蔽掉，不解決這個(gè)問題，IPTV在國(guó)內(nèi)的運(yùn)營(yíng)將無(wú)從談起，國(guó)家相關(guān)部門也不可能發(fā)放牌照。因此，這個(gè)問題的解決對(duì)于推動(dòng)IPTV產(chǎn)業(yè)的發(fā)展有著重要的意義。對(duì)于內(nèi)容安全，通常的理解包括兩個(gè)方面1、對(duì)于內(nèi)容的保護(hù)，防止內(nèi)容被沒有權(quán)限的用戶接收；比如防止盜看電視節(jié)目等。對(duì)于這類入侵，有很多成熟技術(shù)，比如加密(Encryption)和加擾(Scrambling)、認(rèn)證鑒權(quán)、以及數(shù)字版權(quán)管理DRM(DigitalRight Management)等。
2、對(duì)于有害和非法內(nèi)容的入侵的防范，保護(hù)的對(duì)象是內(nèi)容攻擊的對(duì)象，通常是受眾。
所謂內(nèi)容過濾，就是對(duì)于內(nèi)容的某些屬性進(jìn)行處理和判斷，這些內(nèi)容屬性可以包括內(nèi)容提供商的名字、內(nèi)容的URL(Universal Resource Locator通用資源定位器，網(wǎng)址是一類重要的URL)、內(nèi)容提供服務(wù)器的IP地址等，以及媒體流以數(shù)據(jù)包封裝情況下的數(shù)據(jù)包的包頭(packet header)信息、包中的信息等?？梢钥闯?，這種處理和過濾也是按照由淺入深的層次進(jìn)行的。
現(xiàn)有技術(shù)一主要是依據(jù)內(nèi)容的外部特征，或者叫做淺層特征來(lái)進(jìn)行內(nèi)容過濾。其中最典型的例子是基于URL的過濾，其原理如圖1所示內(nèi)容過濾設(shè)備位于網(wǎng)絡(luò)上的核心網(wǎng)和邊緣接入網(wǎng)之間，那么是來(lái)自內(nèi)容源的媒體流到達(dá)接收終端之間的必由之路關(guān)口，在實(shí)際中，可以和企業(yè)網(wǎng)的代理、NAT(NetworkAddress Translator，網(wǎng)絡(luò)地址翻譯設(shè)備)/FW(Firewall，防火墻)放在同一個(gè)網(wǎng)絡(luò)位置，對(duì)于寬帶家庭用戶的情況，可以和BAS(Broadband AdministrationSystem，寬帶管理系統(tǒng))/BRAS(Broadband Registration and Admission System，寬帶注冊(cè)和準(zhǔn)入系統(tǒng))、DISLAM放在同一個(gè)位置，或者放在ISP的POP(Pointof Presence，存在點(diǎn))上。
過濾設(shè)備自己有內(nèi)部數(shù)據(jù)庫(kù)，存有多個(gè)內(nèi)容源URL的信息，根據(jù)這個(gè)數(shù)據(jù)庫(kù)就可以判斷一部分內(nèi)容源是否有害，并屏蔽有害內(nèi)容源、放行無(wú)害內(nèi)容源。同時(shí)，還有很多提供第三方服務(wù)的內(nèi)容分級(jí)服務(wù)商，他們的數(shù)據(jù)庫(kù)更加豐富和專業(yè)，內(nèi)容過濾設(shè)備也可以和這種第三方服務(wù)商連接，使用他們的服務(wù)來(lái)進(jìn)行基于URL的過濾。
現(xiàn)有技術(shù)一存在如下問題1、錯(cuò)殺問題根據(jù)基于URL的過濾，可能把無(wú)害的內(nèi)容過濾掉了，比如有的網(wǎng)站提供視頻節(jié)目點(diǎn)播，其中有些節(jié)目是有害的，但是有些是健康的電影，僅根據(jù)URL無(wú)法區(qū)分；2、錯(cuò)放問題有些URL可能因?yàn)樵诜旨?jí)體制中被認(rèn)為是資質(zhì)優(yōu)良的網(wǎng)站，可能也會(huì)出問題(被黑客攻擊冒充其網(wǎng)址，或者自己有違法的企圖等)；3、采用基于URL的過濾，通常也還需要第三方的評(píng)級(jí)體系，這樣的評(píng)級(jí)體系是有的，有些收費(fèi)的評(píng)級(jí)服務(wù)商專門提供評(píng)級(jí)服務(wù)。但是他們的結(jié)果也不能完全準(zhǔn)確和窮盡網(wǎng)絡(luò)上所有的內(nèi)容。并且網(wǎng)絡(luò)上的內(nèi)容也是經(jīng)常變化的，任何一個(gè)評(píng)級(jí)體系也不可能及時(shí)跟上這些變化。
對(duì)于要求非常高的應(yīng)用場(chǎng)景，比如面向全國(guó)公眾的IPTV，如果一旦有有害內(nèi)容尤其是政治敏感內(nèi)容入侵成功，造成的危害是巨大的。必須做到萬(wàn)無(wú)一失，因此采用淺層次的過濾都是不可靠的。必須采用最深層次的內(nèi)容過濾，即視頻音頻數(shù)據(jù)本身的過濾，比如對(duì)于圖像的識(shí)別，識(shí)別其中的有害場(chǎng)景(暴力、色情等)、有害文字信息(字幕)、特定人物的面孔等等。
要達(dá)到很高的過濾正確率，必須深入到最深的層次，即內(nèi)容數(shù)據(jù)本身。這個(gè)方面屬于目前研究熱點(diǎn)，深度包過濾DPF(Deep Packet Filtering)。
現(xiàn)有技術(shù)二深度DPF基于人工的深度內(nèi)容設(shè)別，這種情況下，內(nèi)容過濾設(shè)備能夠?qū)τ诿襟w流進(jìn)行解碼并將內(nèi)容播放出來(lái)(假設(shè)加密不是問題，因?yàn)榧用艿膯栴}可以通過通信設(shè)備的合法監(jiān)聽要求解決)，供人工監(jiān)控者審查。如果發(fā)現(xiàn)有問題，監(jiān)控者立即采取措施，切斷有害內(nèi)容，同時(shí)切換到一段無(wú)害的內(nèi)容比如公益廣告等。當(dāng)然在內(nèi)容過濾設(shè)備之后必須有一個(gè)相當(dāng)大容量的延遲設(shè)備，來(lái)延遲有害內(nèi)容，給監(jiān)控人員一定的判斷和反應(yīng)處置時(shí)間(比如5秒)。
現(xiàn)有技術(shù)二存在如下問題1、缺乏通用性和可擴(kuò)展性顯然人工的方法無(wú)法適應(yīng)未來(lái)網(wǎng)絡(luò)的需求。通用性差，可擴(kuò)展性差。并且人工判別，判別標(biāo)準(zhǔn)和人的教育、文化水平和意識(shí)形態(tài)等很主觀的因素有關(guān)，無(wú)法做到標(biāo)準(zhǔn)一致；2、無(wú)法適用于IPTV的情況以上人工方法可以適用于電視節(jié)目的監(jiān)控，但是對(duì)于IPTV非常不適合。因?yàn)镮PTV內(nèi)容數(shù)量巨大，網(wǎng)絡(luò)上的內(nèi)容源數(shù)量更多，因此靠人工幾乎無(wú)法勝任；3、有大的延遲，不能適用于雙方實(shí)時(shí)通信的情況流媒體在雙向的情況下，要求延時(shí)不能超過400ms，人工判別不可能做到這么低的延時(shí)。但是雙向通信中，比如視頻聊天卻是很容易存在有害內(nèi)容的地方。

發(fā)明內(nèi)容
本發(fā)明提供一種多媒體通信過程中的視頻碼流過濾方法和過濾節(jié)點(diǎn)，以解決現(xiàn)有基于人工識(shí)別的深度內(nèi)容過濾方法效率低，缺乏通用性的問題。
本發(fā)明所述一種多媒體通信過程中的視頻碼流過濾方法，包括如下步驟A、從多媒體通信過程中傳輸?shù)囊曨l碼流中獲取待檢測(cè)的幀內(nèi)編碼幀，部分解碼該幀內(nèi)編碼幀圖像；B、識(shí)別所述內(nèi)編碼幀圖像中是否包含有害內(nèi)容，如果是則切斷所述視頻碼流的播放；否則播放該視頻碼流。
所述步驟A中還包括獲取并部分解碼所述幀內(nèi)編碼幀之前和/或之后相鄰的一定數(shù)目幀的圖像；所述步驟B中還包括，利用所述相鄰幀的圖像輔助識(shí)別所述幀內(nèi)編碼幀圖像。
所述步驟A中，所述待檢測(cè)的幀內(nèi)編碼幀包括所述視頻碼流中的每一個(gè)幀內(nèi)編碼幀，根據(jù)包含幀內(nèi)編碼幀的數(shù)據(jù)包的包頭中相應(yīng)設(shè)置的幀內(nèi)編碼幀標(biāo)識(shí)信息進(jìn)行識(shí)別。
所述步驟A中，所述待檢測(cè)的幀內(nèi)編碼幀為所述視頻碼流中包含的每一個(gè)場(chǎng)景中的第一個(gè)幀內(nèi)編碼幀。
所述方法中還包括如下步驟根據(jù)視頻數(shù)據(jù)包的結(jié)構(gòu)信息對(duì)所述的視頻碼流進(jìn)行場(chǎng)景分割；和/或，根據(jù)視頻流的統(tǒng)計(jì)信息對(duì)所述的視頻碼流進(jìn)行場(chǎng)景分割。
所述方法中，當(dāng)所述視頻碼流采用H.264協(xié)議編碼時(shí)，所述的幀內(nèi)編碼幀是指包含幀內(nèi)編碼條帶或宏塊MB最多的幀，該幀標(biāo)識(shí)有瞬時(shí)解碼刷新IDR標(biāo)志。
所述方法還同時(shí)包括利用預(yù)存的有害通用資源定位器URL信息庫(kù)，對(duì)多媒體通信過程中的相關(guān)信令進(jìn)行基于URL的過濾。
所述步驟B中還同時(shí)包括記錄識(shí)別出的有害內(nèi)容的相關(guān)URL信息并根據(jù)歷史記錄對(duì)該URL信息進(jìn)行評(píng)級(jí)，如果該URL信息達(dá)到設(shè)定的級(jí)別則將該URL信息添加到有害URL信息庫(kù)中。
所述方法還同時(shí)包括識(shí)別所述視頻碼流對(duì)應(yīng)的音頻碼流中是否包含有害聲音，如果是則切斷所述視頻碼流的播放；否則繼續(xù)播放該視頻碼流。
所述步驟B中，將所述幀內(nèi)編碼幀圖像輸入自動(dòng)識(shí)別模塊，自動(dòng)識(shí)別模塊將預(yù)存的有害內(nèi)容數(shù)據(jù)庫(kù)中的有害內(nèi)容與所述幀內(nèi)編碼幀圖像中包含的相關(guān)內(nèi)容進(jìn)行逐一比對(duì)來(lái)進(jìn)行有害內(nèi)容的自動(dòng)識(shí)別；和/或?qū)⑺鰩瑑?nèi)編碼幀圖像顯示給監(jiān)控者來(lái)進(jìn)行有害內(nèi)容的人工識(shí)別。
當(dāng)人工識(shí)別和自動(dòng)識(shí)別同時(shí)進(jìn)行時(shí)，如果二者的識(shí)別結(jié)果出現(xiàn)不一致，則優(yōu)先執(zhí)行自動(dòng)識(shí)別模塊或監(jiān)控者的判決結(jié)果。
當(dāng)人工識(shí)別和自動(dòng)識(shí)別同時(shí)進(jìn)行時(shí)，由自動(dòng)識(shí)別模塊和監(jiān)控者分別根據(jù)預(yù)先設(shè)定的規(guī)則，為識(shí)別出的有害內(nèi)容給出相應(yīng)的有害程度分值，然后對(duì)兩個(gè)分值進(jìn)行加權(quán)處理后得到最終執(zhí)行的判決結(jié)果，當(dāng)僅收到一方為認(rèn)定的有害內(nèi)容給出的分值時(shí)，默認(rèn)另一方為該內(nèi)容給出的分值為零。
所述的加權(quán)處理方法為SI＝(WM×SM+WH×SH)/(WM+WH)其中，WM和WH表示自動(dòng)識(shí)別模塊和監(jiān)控者的權(quán)值，WM和WH之間的相對(duì)大小表示了對(duì)識(shí)別結(jié)果的信任度，SM和SH分別自動(dòng)識(shí)別模塊和監(jiān)控者給出的分?jǐn)?shù)，如果SI大于一個(gè)給定值，則判決結(jié)果為有害，否則判決結(jié)果為無(wú)害，WM、WH和給定值分別根據(jù)經(jīng)驗(yàn)值設(shè)定。
所述方法還同時(shí)包括錄制識(shí)別出的有害內(nèi)容，當(dāng)人工識(shí)別和自動(dòng)識(shí)別同時(shí)進(jìn)行時(shí)，如果自動(dòng)識(shí)別和人工識(shí)別結(jié)果不一致并最終執(zhí)行了人工識(shí)別的有害判決結(jié)果，則學(xué)習(xí)被識(shí)別出的有害內(nèi)容并將學(xué)習(xí)結(jié)果添加到有害內(nèi)容數(shù)據(jù)庫(kù)中。
所述的有害內(nèi)容至少包括如下之一有害圖像、有害疊加文字或符號(hào)、特定人臉圖像。
所述的過濾方法中，切斷播放所述視頻碼流的同時(shí)，啟動(dòng)播放備用無(wú)害視頻碼流。
所述方法還同時(shí)包括錄制并保存指定時(shí)段播放的視頻碼流。
所述方法還同時(shí)包括將有害內(nèi)容的識(shí)別情況記錄在日志并生成日志報(bào)告。
所述方法還同時(shí)包括根據(jù)識(shí)別有害內(nèi)容所需要的時(shí)間，延遲播放所述視頻碼流。
本發(fā)明所述一種多媒體通信過程中的視頻碼流過濾節(jié)點(diǎn)，包括視頻碼流延遲模塊，用于接收多媒體通信過程中待播放的視頻碼流并延遲輸出該視頻碼；開關(guān)模塊，連接所述視頻碼流延遲模塊，用于切斷該視頻碼流延遲模塊輸出的視頻碼流；幀內(nèi)編碼幀檢測(cè)/解碼模塊，用于從多媒體通信過程中待播放視頻碼流中獲取待檢測(cè)的幀內(nèi)編碼幀或者該幀內(nèi)編碼幀及其之前和/或之后的相鄰的一定數(shù)目幀，部分解碼獲取的相鄰幀的圖像；有害內(nèi)容識(shí)別模塊，連接所述幀內(nèi)編碼幀檢測(cè)/解碼模塊，用于識(shí)別所述圖像中是否包含有害內(nèi)容，如果是則輸出相應(yīng)的控制信號(hào)；判決模塊，連接在有害內(nèi)容識(shí)別模塊和開關(guān)模塊之間，用于接收到所述控制信號(hào)時(shí)向所述開關(guān)模塊輸出斷開所述視頻碼流的觸發(fā)信號(hào)。
所述的過濾節(jié)點(diǎn)還包括場(chǎng)景分割模塊，連接所述幀內(nèi)編碼幀檢測(cè)/解碼模塊，用于接收待播放的視頻碼流并對(duì)該視頻碼流進(jìn)行場(chǎng)景分割。
所述的過濾節(jié)點(diǎn)還包括基于URL的過濾模塊，用于接收多媒體通信的相關(guān)信令，并利用預(yù)存的有害通用資源定位器URL信息庫(kù)對(duì)所述相關(guān)信令進(jìn)行基于URL的過濾。
URL記錄和評(píng)級(jí)模塊，用于記錄有害內(nèi)容的相關(guān)URL信息并根據(jù)歷史記錄對(duì)該URL信息進(jìn)行評(píng)級(jí)，如果該URL信息達(dá)到設(shè)定的級(jí)別則將該URL信息添加到有害URL信息庫(kù)中；URL評(píng)級(jí)數(shù)據(jù)庫(kù)，用于保存URL評(píng)級(jí)的規(guī)則和歷史記錄。
所述的有害內(nèi)容識(shí)別模塊包括自動(dòng)識(shí)別子模塊，連接在所述幀內(nèi)編碼幀檢測(cè)/解碼模塊和判決模塊之間，用于將有害內(nèi)容數(shù)據(jù)庫(kù)中的有害內(nèi)容與所述幀內(nèi)編碼幀圖像中包含的相關(guān)內(nèi)容進(jìn)行逐一比對(duì)來(lái)進(jìn)行有害內(nèi)容的自動(dòng)識(shí)別；和/或人工識(shí)別子模塊，該人工識(shí)別子模塊具體包括幀內(nèi)編碼幀圖像顯示單元和監(jiān)控指令輸入單元，其中，幀內(nèi)編碼幀圖像顯示單元連接所述幀內(nèi)編碼幀檢測(cè)/解碼模塊，用于將所述幀內(nèi)編碼幀圖像顯示給監(jiān)控者進(jìn)行有害內(nèi)容的人工識(shí)別；監(jiān)控指令輸入單元連接所述判決模塊，用于接收到監(jiān)控者在識(shí)別出有害內(nèi)容時(shí)輸入的切斷指令時(shí)，向所述判決模塊輸出所述控制信號(hào)。
根據(jù)有害內(nèi)容的類型，所述自動(dòng)識(shí)別子模塊至少包括如下之一有害圖像識(shí)別單元和相連接的有害圖像數(shù)據(jù)庫(kù)、有害疊加文字/符號(hào)識(shí)別單元和相連接的有害疊加文字/符號(hào)數(shù)據(jù)庫(kù)、人臉識(shí)別單元和相連接的人臉數(shù)據(jù)庫(kù)；其中，有害圖像識(shí)別單元、有害疊加文字/符號(hào)識(shí)別單元和人臉識(shí)別單元并行連接在所述幀內(nèi)編碼幀檢測(cè)/解碼模塊和判決模塊之間，分別對(duì)所述幀內(nèi)編碼幀圖像中是否包含相應(yīng)的有害內(nèi)容進(jìn)行識(shí)別。
當(dāng)所述有害內(nèi)容識(shí)別模塊中同時(shí)包含有自動(dòng)識(shí)別子模塊和指令輸入子模塊時(shí)，所述判決模塊中包括第一判決單元，接收所述自動(dòng)識(shí)別子模塊輸出的控制信號(hào)；第二判決單元，接收所述操作界面子模塊輸出的控制信號(hào)；聯(lián)合判決單元，分別連接所述第一判決單元和第二判決單元，用于根據(jù)設(shè)定的規(guī)則優(yōu)先執(zhí)行第一判決單元或第二判決單元的控制信號(hào)；或者，所述自動(dòng)識(shí)別子模塊和監(jiān)控者分別根據(jù)預(yù)先設(shè)定的規(guī)則，為識(shí)別出的有害內(nèi)容給出相應(yīng)的有害程度分值，聯(lián)合判決單元對(duì)兩個(gè)分值進(jìn)行加權(quán)處理后得到最終執(zhí)行的判決結(jié)果，當(dāng)僅收到一方為認(rèn)定的有害內(nèi)容給出的分值時(shí)，默認(rèn)另一方為該內(nèi)容給出的分值為零。
所述判決模塊中還包括第三判決單元，用于接收到所述視頻碼流對(duì)應(yīng)的音頻碼流的有害聲音判決結(jié)果時(shí)，直接或通過聯(lián)合判決單元向所述開關(guān)模塊輸出斷開所述視頻碼流的控制指令。
所述過濾節(jié)點(diǎn)還包括有害內(nèi)容錄制模塊，分別連接所述幀內(nèi)編碼幀檢測(cè)/解碼模塊和判決模塊，所述判決模塊觸發(fā)斷開所述視頻碼流的同時(shí)，啟動(dòng)該有害內(nèi)容錄制模塊錄制識(shí)別出的有害內(nèi)容；錄制內(nèi)容存儲(chǔ)模塊，連接所述有害內(nèi)容錄制模塊，用于保存錄制的有害內(nèi)容。
所述過濾節(jié)點(diǎn)還包括有害內(nèi)容學(xué)習(xí)模塊，連接所述錄制內(nèi)容存儲(chǔ)模塊，用于當(dāng)自動(dòng)識(shí)別子模塊和監(jiān)控者的對(duì)該內(nèi)容的識(shí)別結(jié)果不一致并最終執(zhí)行了監(jiān)控者的有害判決結(jié)果時(shí)，學(xué)習(xí)該有害內(nèi)容并將學(xué)習(xí)結(jié)果添加到有害內(nèi)容數(shù)據(jù)庫(kù)中。
當(dāng)自動(dòng)識(shí)別子模塊根據(jù)有害內(nèi)容的類型分別設(shè)置時(shí)，所述有害內(nèi)容學(xué)習(xí)模塊對(duì)應(yīng)包括如下之一圖像學(xué)習(xí)單元，連接有害圖像數(shù)據(jù)庫(kù)，用于學(xué)習(xí)有害圖像并將學(xué)習(xí)結(jié)果添加到有害圖像數(shù)據(jù)庫(kù)中；疊加文字/符號(hào)學(xué)習(xí)單元，連接有害疊加文字/符號(hào)數(shù)據(jù)庫(kù)，用于學(xué)習(xí)有害疊加文字/符號(hào)并將學(xué)習(xí)結(jié)果添加到有害疊加文字/符號(hào)數(shù)據(jù)庫(kù)中；人臉學(xué)習(xí)單元，連接人臉數(shù)據(jù)庫(kù)，用于學(xué)習(xí)人臉圖像并將學(xué)習(xí)結(jié)果添加到人臉數(shù)據(jù)庫(kù)中。
所述過濾節(jié)點(diǎn)還包括
操作界面模塊，用于輸入相關(guān)參數(shù)或操作指令；視頻內(nèi)容錄制模塊，連接所述操作界面模塊和錄制內(nèi)容存儲(chǔ)模塊之間，錄制監(jiān)控者指定時(shí)段的視頻流并存儲(chǔ)到錄制內(nèi)容存儲(chǔ)模塊。
當(dāng)自動(dòng)識(shí)別子模塊中包含有害圖像識(shí)別單元時(shí)，所述過濾節(jié)點(diǎn)還包括特征網(wǎng)絡(luò)模塊，連接在所述操作界面模塊和有害圖像數(shù)據(jù)庫(kù)之間，用于向所述有害圖像數(shù)據(jù)庫(kù)中輸入/調(diào)整特征網(wǎng)絡(luò)模型和/或事件特征模板。
所述過濾節(jié)點(diǎn)還包括參數(shù)設(shè)置模塊，連接在所述操作界面模塊和場(chǎng)景分割模塊之間，用于向所述場(chǎng)景分割模塊中輸入/調(diào)整進(jìn)行場(chǎng)景分割所需的相關(guān)參數(shù)。
所述過濾節(jié)點(diǎn)還包括判決規(guī)則設(shè)置模塊，連接在所述操作界面模塊和判決模塊之間，用于向所述判決模塊輸入/調(diào)整控制信號(hào)的判決規(guī)則；和/或評(píng)級(jí)規(guī)則設(shè)置模塊，連接在所述操作界面模塊和URL評(píng)級(jí)數(shù)據(jù)庫(kù)之間，用于向所述URL評(píng)級(jí)數(shù)據(jù)庫(kù)中輸入/調(diào)整評(píng)級(jí)規(guī)則。
所述過濾節(jié)點(diǎn)還包括替換片源庫(kù)，連接所述開關(guān)模塊為轉(zhuǎn)換開關(guān)，該轉(zhuǎn)換開關(guān)在斷開所述視頻碼流的同時(shí)，接通該替換片源庫(kù)。
所述過濾節(jié)點(diǎn)還包括主控模塊，分別連接該過濾節(jié)點(diǎn)中的其他任何一個(gè)模塊、子模塊或單元，用于進(jìn)行運(yùn)行控制；日志報(bào)告模塊，分別連接該過濾節(jié)點(diǎn)中的其他任何一個(gè)模塊、子模塊或單元，用于生成并輸出該過濾節(jié)點(diǎn)的運(yùn)行日志。
所述過濾節(jié)點(diǎn)還包括外部控制模塊，連接所述主控模塊，用于完成和外部控制設(shè)備的數(shù)據(jù)/信令交互。
所述過濾節(jié)點(diǎn)還包括控制指令模塊，連接在操作界面模塊和主控模塊之間，用于接受人類監(jiān)控者的指令。
當(dāng)所述過濾節(jié)點(diǎn)同時(shí)包括所述監(jiān)控指令輸入單元時(shí)，該監(jiān)控指令輸入單元設(shè)置在該控制指令模塊中。
本發(fā)明的有益效果如下本發(fā)明提供的一種多媒體通信過程中的視頻碼流過濾方法，只需要部分解碼視頻碼流中的I幀圖像或者該I幀以及之前和/或之后相鄰的一定數(shù)目幀的圖像，不需要解碼其他絕大多數(shù)據(jù)幀的圖像，減小了處理復(fù)雜度，縮短了視頻碼流播放的延遲時(shí)間，提高了視頻內(nèi)容深度過濾的效率；本發(fā)明進(jìn)一步基于場(chǎng)景分割技術(shù)，部分解碼每一個(gè)場(chǎng)景中的第一幀圖像或者該第一幀以及之前和/或之后相鄰的一定數(shù)目幀的圖像，并利用解碼的圖像進(jìn)行識(shí)別，在保證識(shí)別可靠性的同時(shí)一定程度的減少了需要解碼的數(shù)據(jù)幀，使處理復(fù)雜獨(dú)進(jìn)一步降低；本發(fā)明所述方法基于現(xiàn)有有害內(nèi)容的自動(dòng)識(shí)別技術(shù)，可以高效的實(shí)現(xiàn)自動(dòng)識(shí)別過濾，保證了常見有害內(nèi)容的快速有效識(shí)別；本發(fā)明所述方法同時(shí)可以和人工識(shí)別機(jī)制配合使用，可以防止新發(fā)生有害內(nèi)容的漏查；本發(fā)明還提供有害內(nèi)容學(xué)習(xí)機(jī)制，在人工識(shí)別出新發(fā)生有害內(nèi)容時(shí)，可以學(xué)習(xí)并添加到有害內(nèi)容數(shù)據(jù)庫(kù)中；本發(fā)明多數(shù)方法還可以同時(shí)采用現(xiàn)有的基于URL的過濾技術(shù)，可以在信令層面禁止有害內(nèi)容的來(lái)源；并且，發(fā)明進(jìn)一步提供了有害內(nèi)容的URL信息評(píng)級(jí)機(jī)制，可以逐步發(fā)現(xiàn)新的有害URL源，并將新的有害URL源及時(shí)添加到有害URL信息庫(kù)中；本發(fā)明所述方法還提供日志報(bào)告機(jī)制，可以記錄視頻碼流過濾過程中的各種事件；本發(fā)明所述的視頻碼流過濾節(jié)點(diǎn)可以方便實(shí)現(xiàn)本發(fā)明所述的方法，具有很好的通用性；顯然，應(yīng)用本發(fā)明技術(shù)方案可以解決目前IPTV、數(shù)字電視等多媒體業(yè)務(wù)中的內(nèi)容安全問題，保證這些業(yè)務(wù)提供的安全可靠。

圖1為現(xiàn)有基于內(nèi)容的URL進(jìn)行過濾的原理示意圖；圖2為本發(fā)明視頻序列中幀和場(chǎng)景的關(guān)系示意圖；圖3為本發(fā)明場(chǎng)景、幀和視頻碼流中數(shù)據(jù)包之間的對(duì)應(yīng)關(guān)系示意圖；圖4為本發(fā)明特征網(wǎng)絡(luò)模型的一個(gè)示例圖；圖5為本發(fā)明所述的一種視頻碼流內(nèi)容過濾方法的流程示意圖；圖6-圖9為實(shí)現(xiàn)本發(fā)明所述視頻碼流過濾方法的一種視頻碼流過濾節(jié)點(diǎn)的主要結(jié)構(gòu)示意圖。
具體實(shí)施例方式
本發(fā)明提供一種設(shè)置在網(wǎng)絡(luò)種合適位置上的視頻碼流過濾節(jié)點(diǎn)(Node)，該過濾節(jié)點(diǎn)可以實(shí)現(xiàn)對(duì)于流式視頻中的內(nèi)容進(jìn)行自動(dòng)過濾和人工過濾，并可以同時(shí)基于URL的過濾或者類似的淺層過濾方法進(jìn)行過濾。
下面首先給出本發(fā)明的視頻內(nèi)容的自動(dòng)過濾方法，本發(fā)明的自動(dòng)過濾方法是將視頻碼流中的I幀作為待檢測(cè)對(duì)象，解碼I幀后還原出I幀圖像進(jìn)行有害內(nèi)容的識(shí)別，具體包括兩種方法，一種是將所有的I幀進(jìn)行解碼并還原，另一種是將每一個(gè)場(chǎng)景中的第一個(gè)I幀進(jìn)行解碼還原。視頻碼流中，包含I幀的數(shù)據(jù)包的包頭中相應(yīng)設(shè)置有I幀標(biāo)識(shí)，可以進(jìn)行識(shí)別。
下面詳細(xì)說明第二種方法，參閱圖2，圖2所示為視頻序列中幀和場(chǎng)景的關(guān)系示意圖，對(duì)于通過過濾節(jié)點(diǎn)的視頻碼流，首先分割成不同的場(chǎng)景(Scene)，將原來(lái)作為一個(gè)由多個(gè)幀(Frame)組成的視頻序列，分割成不同場(chǎng)景組成的場(chǎng)景序列。一個(gè)場(chǎng)景包含不等個(gè)數(shù)的幀，每個(gè)場(chǎng)景內(nèi)部的各個(gè)幀在背景和前景上基本相同，只是存在一定的運(yùn)動(dòng)。可以理解成一個(gè)鏡頭，鏡頭切換的時(shí)候，產(chǎn)生新的場(chǎng)景。
對(duì)于分割場(chǎng)景，必須說明的是，場(chǎng)景本來(lái)是在視頻內(nèi)容拍攝(鏡頭切換)和制作(加入特效比如兩個(gè)鏡頭之間的3D過渡效果等)的時(shí)候已經(jīng)產(chǎn)生了的。在過濾節(jié)點(diǎn)上進(jìn)行場(chǎng)景分割就是要把視頻碼流中的碼流分成一段一段的，每一段對(duì)應(yīng)于原來(lái)的一個(gè)場(chǎng)景。當(dāng)然因?yàn)槟壳暗膱?chǎng)景設(shè)別技術(shù)還不能做到100％的識(shí)別精度，因此可能最終在過濾節(jié)點(diǎn)上分割出來(lái)的場(chǎng)景和視頻碼流中固有的場(chǎng)景不完全一致，但是不影響本發(fā)明的應(yīng)用。
參閱圖3，圖3為場(chǎng)景、幀和視頻碼流中數(shù)據(jù)包之間的對(duì)應(yīng)關(guān)系示意圖，因?yàn)橐曨l碼流是從流媒體服務(wù)器(Streaming Media Server)等設(shè)備發(fā)出來(lái)的，是在壓縮后進(jìn)行了打包(Packetization)，和具體的打包協(xié)議無(wú)關(guān))的，包是按照時(shí)間順序發(fā)出的，每個(gè)包都有對(duì)應(yīng)的序列號(hào)或者時(shí)間戳(Time Stamp等)，根據(jù)這些信息就過濾節(jié)點(diǎn)就可以正確重構(gòu)包的原來(lái)順序，從而把包和場(chǎng)景進(jìn)行對(duì)應(yīng)。因此，最終是一個(gè)場(chǎng)景對(duì)應(yīng)于一系列的視頻數(shù)據(jù)包。
其實(shí)，過濾節(jié)點(diǎn)只要識(shí)別每個(gè)場(chǎng)景的第一幀就可以了，這樣就能夠把所有的場(chǎng)景分割出來(lái)，在一個(gè)場(chǎng)景第一幀和下一個(gè)場(chǎng)景第一幀之間的所有幀都屬于該場(chǎng)景。一般來(lái)說，一個(gè)場(chǎng)景中存在至少一個(gè)I幀(幀內(nèi)編碼幀)，所謂I幀是對(duì)于P(預(yù)測(cè)編碼幀)幀和B幀(雙向預(yù)測(cè)編碼幀)而言的。I幀的編碼完全由其本身決定，而不需要依賴其他幀，而P幀要依賴其前面的參考幀才能解碼，B幀則要依賴其前后的參考幀才能解碼。因此I幀的解碼最為簡(jiǎn)單。只要是基于DCT變換+熵編碼思想的壓縮編碼標(biāo)準(zhǔn)中，比如ITU H.26x系列和MPEG系列，I幀的解碼都只需要進(jìn)行反熵編碼，去量化和反DCT變換就可以了，不需要運(yùn)動(dòng)補(bǔ)償。因此解碼的計(jì)算量最少。其他類型的幀，比如P幀，要從視頻碼流中解碼該P(yáng)幀，則需要解碼其前面若干個(gè)P幀，一直到前面離它最近的一個(gè)I幀。但是對(duì)于I幀，則只需要解碼該I幀本身。兩相比較，解碼的復(fù)雜度相差巨大。其實(shí)在編碼器中，雖然標(biāo)準(zhǔn)一般沒有強(qiáng)制規(guī)定，但是一般來(lái)說，在場(chǎng)景發(fā)生變化時(shí)都會(huì)加入I幀，場(chǎng)景的第一幀往往就是I幀。對(duì)于H.264這類新的標(biāo)準(zhǔn)中，視頻碼流中可能沒有完整的I幀，而只是一個(gè)幀的某個(gè)部分進(jìn)行幀內(nèi)編碼比如一個(gè)條帶(Slice)可以獨(dú)立進(jìn)行幀內(nèi)編碼。對(duì)于可能不存在完整I幀的這種情況，可以定義一些修正的選取準(zhǔn)則比如選取存在幀內(nèi)編碼條帶或者宏塊MB(Macroblock)最多的幀。對(duì)于一般的編碼協(xié)議，都有標(biāo)識(shí)機(jī)制來(lái)標(biāo)識(shí)I幀或者幀內(nèi)編碼的條帶等。比如在ITU的H.264標(biāo)準(zhǔn)中，是通過瞬時(shí)解碼刷新IDR(Instantaneous Decoding Refresh)標(biāo)志來(lái)標(biāo)識(shí)的。因此過濾節(jié)點(diǎn)依據(jù)這些具體的標(biāo)識(shí)就可以正確提取I幀或者幀內(nèi)編碼的條帶/宏塊等。
為了能夠精確識(shí)別，還可以同時(shí)部分解碼I幀之前及之后的相鄰幾幀相鄰圖像，用于輔助識(shí)別I幀圖像，根據(jù)經(jīng)驗(yàn)，在絕大多數(shù)情況下，一般取5幀就可以達(dá)到精確識(shí)別的目的了。當(dāng)然，也可以在解碼出的I幀圖像的精度無(wú)法進(jìn)行精確識(shí)別時(shí)，再部分解碼I幀之前及之后的相鄰幾幀相鄰圖像，用于輔助識(shí)別I幀圖像。
為了表述方便，下面以I幀為例進(jìn)行說明。可能在一個(gè)場(chǎng)景內(nèi)(鏡頭比較長(zhǎng))，存在多個(gè)I幀，那么規(guī)定一個(gè)場(chǎng)景內(nèi)選取第一個(gè)I幀。
在獲得了一個(gè)場(chǎng)景內(nèi)的第一個(gè)I幀后，過濾節(jié)點(diǎn)解碼該I幀并還原該I幀圖像，然后對(duì)該幀圖像進(jìn)行識(shí)別，包括以下兩種識(shí)別方式1、人工識(shí)別，將I幀圖像顯示出來(lái)供人類監(jiān)控者察看以實(shí)現(xiàn)人工過濾功能；2、自動(dòng)識(shí)別，將I幀圖像輸入自動(dòng)識(shí)別模塊中，利用有害內(nèi)容數(shù)據(jù)庫(kù)進(jìn)行自動(dòng)的比對(duì)識(shí)別，如果發(fā)現(xiàn)馬上切斷視頻碼流的播放并報(bào)告給人類監(jiān)控者進(jìn)行處理，現(xiàn)有技術(shù)中可以進(jìn)行自動(dòng)識(shí)別的有害內(nèi)容包括下述方面1)、對(duì)于有害的圖像內(nèi)容進(jìn)行自動(dòng)識(shí)別，比如淫穢、暴力等場(chǎng)景，該圖像識(shí)別技術(shù)屬于成熟的已有技術(shù)；2)、對(duì)于有害的疊加文字或者符號(hào)進(jìn)行識(shí)別。首先經(jīng)過處理，將文字或者符號(hào)所在區(qū)域定位出來(lái)，然后識(shí)別是垂直方向還是水平方向，再具體進(jìn)行文字和背景的分割，最后把處理的結(jié)果送入一個(gè)已有的光學(xué)文字識(shí)別OCR(Optical Character Recognition)模塊進(jìn)行識(shí)別。將識(shí)別結(jié)果和數(shù)據(jù)庫(kù)進(jìn)行匹配，如果和數(shù)據(jù)庫(kù)中的有害判斷條件匹配成功，則確定為有害疊加文字或者符號(hào)，該疊加文字或者符號(hào)的識(shí)別技術(shù)屬于成熟的已有技術(shù)；3)、對(duì)于圖像中可能存在的特定人臉進(jìn)行識(shí)別，將該幀圖像直接送入已有的人臉識(shí)別模塊進(jìn)行識(shí)別。當(dāng)然已有人臉識(shí)別模塊的數(shù)據(jù)庫(kù)中的數(shù)據(jù)由內(nèi)容監(jiān)控部門自行建立，其中可以根據(jù)需要存儲(chǔ)各類人臉嫌疑犯、重要人物、恐怖分子等，該人臉識(shí)別技術(shù)屬于成熟的已有技術(shù)。
當(dāng)人工識(shí)別和自動(dòng)識(shí)別同時(shí)采用時(shí)，可以定義判斷條件1、完全以自動(dòng)識(shí)別模塊的識(shí)別結(jié)果為準(zhǔn)。
2、完全以人類監(jiān)控者的識(shí)別結(jié)果為準(zhǔn)。
3、介于兩者之間的，要同時(shí)參考以上兩種識(shí)別結(jié)果，給出聯(lián)合判決。一個(gè)實(shí)施例是基于分?jǐn)?shù)的加權(quán)平均。自動(dòng)識(shí)別模塊和人類監(jiān)控者不但要判定是否有害，還有給出有害的分?jǐn)?shù)，比如從0-100，有害程度越高，分?jǐn)?shù)越高，0表示無(wú)害。那么將自動(dòng)識(shí)別模塊的分?jǐn)?shù)和人類監(jiān)控者的分?jǐn)?shù)加權(quán)相加如下SI＝(WM×SM+WH×SH)/(WM+WH)其中WM和WH表示自動(dòng)識(shí)別模塊和人類監(jiān)控者的權(quán)值。兩者之間的相對(duì)大小表示了更加信任自動(dòng)識(shí)別模塊還是人類，SM和SH分別表示自動(dòng)識(shí)別模塊和人類給出的分?jǐn)?shù)。如果最終得到的綜合分?jǐn)?shù)SI大于一個(gè)給定的值，比如50，那么聯(lián)合判決是有害，否則是無(wú)害，如果僅有一方識(shí)別出有害內(nèi)容并給出了有害內(nèi)容的分值，則可以默認(rèn)另一方對(duì)該內(nèi)容給出的分值為0。
上述判斷條件可以根據(jù)具體情況靈活使用，當(dāng)然在實(shí)際中，還可以制定更為詳細(xì)的綜合判決規(guī)則。
一旦發(fā)現(xiàn)有害內(nèi)容，采取的措施可以是1、馬上切斷有害視頻碼流和相應(yīng)的音頻碼流，以及相關(guān)聯(lián)的其他媒體流；2、插播無(wú)害內(nèi)容(公益廣告或者系統(tǒng)檢修等文字)。
過濾節(jié)點(diǎn)還應(yīng)該具有學(xué)習(xí)功能，如果有害內(nèi)容不是自動(dòng)識(shí)別模塊自動(dòng)發(fā)現(xiàn)的，而是人類監(jiān)控者發(fā)現(xiàn)的，或者通過其他渠道發(fā)現(xiàn)的，那么過濾節(jié)點(diǎn)中的學(xué)習(xí)模塊就要學(xué)寫該有害視頻碼流。為了學(xué)習(xí)系統(tǒng)需要把每個(gè)被監(jiān)控的碼流進(jìn)行一定時(shí)間長(zhǎng)度的存儲(chǔ)比如(10分鐘，考慮到需要的容量，這個(gè)時(shí)間長(zhǎng)度應(yīng)該進(jìn)行最佳地調(diào)整)。為了進(jìn)一步降低需要的存儲(chǔ)容量，可以對(duì)于每個(gè)場(chǎng)景只存儲(chǔ)其用于識(shí)別的I幀。一旦人類監(jiān)控者發(fā)現(xiàn)有害內(nèi)容發(fā)生于某個(gè)時(shí)刻t前后，那么學(xué)習(xí)模塊就要把t-TW/2到t+TW/2(TW為學(xué)習(xí)的時(shí)間窗口長(zhǎng)度，比如30秒)內(nèi)對(duì)應(yīng)的場(chǎng)景的I幀從數(shù)據(jù)庫(kù)中讀取出來(lái)，進(jìn)行學(xué)習(xí)。經(jīng)過學(xué)習(xí)，自動(dòng)識(shí)別模塊以后就可以識(shí)別此類相關(guān)的場(chǎng)景。學(xué)習(xí)的方法有很多，包括人工智能(ArtificialIntelligence)、模糊推理(Fuzzy Logic)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network)等。
當(dāng)同時(shí)基于URL進(jìn)行過濾時(shí)，過濾節(jié)點(diǎn)還要“記住”有害內(nèi)容所來(lái)自內(nèi)容源的URL和其它相關(guān)信息，存入對(duì)應(yīng)的“嫌疑”數(shù)據(jù)庫(kù)，并根據(jù)歷史記錄對(duì)URL和其它相關(guān)信息進(jìn)行評(píng)級(jí)。對(duì)于存入這個(gè)“嫌疑”數(shù)據(jù)庫(kù)的URL，也是需要一些更加精細(xì)的處理。如果某個(gè)合法的URL只是因?yàn)橐恍┎铄e(cuò)或者被別人假冒了URL播放了有害內(nèi)容，那么雖然被存入了“嫌疑”數(shù)據(jù)庫(kù)，只要以后不再發(fā)生，經(jīng)過一段時(shí)間可以消除其“嫌疑”，相反，如果多次發(fā)現(xiàn)某個(gè)URL的不良行為，就可以確定為“黑名單”，從而進(jìn)行完全屏蔽。也可以把信息和第三方URL評(píng)級(jí)服務(wù)提供商的數(shù)據(jù)庫(kù)進(jìn)行共享，把過濾節(jié)點(diǎn)的識(shí)別結(jié)果發(fā)送給第三方評(píng)級(jí)服務(wù)提供商數(shù)據(jù)庫(kù)，這樣可以進(jìn)行互利互惠的合作。
本發(fā)明用到的場(chǎng)景分割技術(shù)一般包括以下兩種1、通過視頻數(shù)據(jù)包中的結(jié)構(gòu)信息(比如運(yùn)動(dòng)向量)等對(duì)于圖像中的運(yùn)動(dòng)區(qū)域進(jìn)行估計(jì)，可以判斷多大區(qū)域在運(yùn)動(dòng)、運(yùn)動(dòng)方向，運(yùn)動(dòng)模式(單向運(yùn)動(dòng)，往復(fù)運(yùn)動(dòng)等等)，運(yùn)動(dòng)幅度大小等，從而判斷哪些幀在運(yùn)動(dòng)模式上比較相似，運(yùn)動(dòng)模式相似的幀一般屬于同一個(gè)場(chǎng)景；2、通過視頻碼流的統(tǒng)計(jì)信息進(jìn)行分析，將視頻碼流中比特率看成關(guān)于時(shí)間的隨機(jī)過程，然后進(jìn)行統(tǒng)計(jì)建模(Statistical Modelling)，從而利用統(tǒng)計(jì)模型估算場(chǎng)景的開始和結(jié)束的位置。
以上兩種技術(shù)都不需要解碼，因此都具有很高的效率。但是和解碼之后再進(jìn)行的場(chǎng)景分割技術(shù)(比如直方圖求差等)相比，一個(gè)缺點(diǎn)就是分割精度相對(duì)較低。這個(gè)缺點(diǎn)可以通過調(diào)整場(chǎng)景分割模塊的參數(shù)(比如一些門限值)來(lái)進(jìn)行解決。將參數(shù)設(shè)置得非常靈敏有可能導(dǎo)致的結(jié)果是可能把原本一個(gè)場(chǎng)景分割成了多個(gè)場(chǎng)景(過分割)，而不要發(fā)生把原本多個(gè)場(chǎng)景分割成了一個(gè)場(chǎng)景(欠分割)。
一種兩級(jí)的視頻有害內(nèi)容過濾技術(shù)可以解決這類問題。其基本思想是對(duì)于圖像特征進(jìn)行分層定義，一般分成兩個(gè)大的層面，即語(yǔ)義(Semantic或者叫做概念Conceptual)層面特征，以及事件(Event)層面特征。例如圖4所示，如果要檢測(cè)的最高的語(yǔ)義特征是“室外場(chǎng)景”，對(duì)應(yīng)的較低層面語(yǔ)義特征包括是“海灘”、“山林”、“原野”等等，進(jìn)一步有對(duì)應(yīng)更低層面的語(yǔ)義特征，最后到事件特征，比如一座山，或者一片樹木。每個(gè)事件特征都有具體的識(shí)別方法，比如識(shí)別道路，人的運(yùn)動(dòng)等。采用這種兩層識(shí)別方法的好處是把可以自動(dòng)識(shí)別的低級(jí)特征和人類可以理解的高級(jí)特征結(jié)合起來(lái)，這樣的對(duì)應(yīng)關(guān)系可以形成一個(gè)特征網(wǎng)絡(luò)模型。
同樣道理，可以建立“色情”，“暴力”等概念的特征網(wǎng)絡(luò)模型，建立特征網(wǎng)絡(luò)模型需要根據(jù)人類的理解認(rèn)知過程的機(jī)理和特定領(lǐng)域的專家知識(shí)，屬于現(xiàn)有技術(shù)，本發(fā)明不做進(jìn)一步描述。本發(fā)明提供的是一個(gè)輸入接口，通過該接口，人類專家可以定義特征網(wǎng)絡(luò)模型的表達(dá)形式，而過濾節(jié)點(diǎn)可以根據(jù)這個(gè)特征網(wǎng)絡(luò)模型進(jìn)行自動(dòng)識(shí)別工作。
用于本發(fā)明的有害疊加文字和圖形符號(hào)的過濾方法，不需要解碼即可定位到圖像中的疊加字幕和圖形符號(hào)區(qū)域，然后把他們提取出來(lái)，經(jīng)過一定的背景前景分割，輸入一個(gè)OCR(Optical Character Recognition，光學(xué)字符識(shí)別)模塊進(jìn)行識(shí)別，通過對(duì)于視頻碼流中數(shù)據(jù)包中離散余玄變換DCT(Discrete CosineTransform)系數(shù)的處理，可以定為出包含疊加文字或者圖形符號(hào)的矩形區(qū)域，然后通過對(duì)于該區(qū)域的水平和垂直投影(Projection，實(shí)際上就是沿著通過該區(qū)域的所有水平或者垂直直線，對(duì)于直線上的像素亮度進(jìn)行積分求和，從而得到一個(gè)一維亮度分布曲線)，判斷文字或者符號(hào)的走向，然后利用類似的投影方法進(jìn)行行和字的分割。
本發(fā)明所述的過濾節(jié)點(diǎn)還可以實(shí)現(xiàn)日志記錄功能，并和外部控制設(shè)備相連，實(shí)現(xiàn)與外不控制設(shè)備的數(shù)據(jù)和信令交互。
綜上所述，本發(fā)明首先提供了一種基于I幀的深度內(nèi)容過濾方法，如圖5所示，每一個(gè)待檢測(cè)I幀的識(shí)別處理方法包括如下步驟S1、從多媒體通信過程中待播放視頻碼流中荻取一個(gè)待檢測(cè)的I幀以及該I幀之前和之后的相鄰幾幀；待檢測(cè)的I幀可以包括視頻碼流中的每一個(gè)I幀，根據(jù)包含I幀的數(shù)據(jù)包的包頭中相應(yīng)設(shè)置的I幀標(biāo)識(shí)信息進(jìn)行識(shí)別；也可以只將視頻碼流中包含的每一個(gè)場(chǎng)景中的第一個(gè)I幀作為待檢測(cè)的I幀。一個(gè)場(chǎng)景中的第一幀一般為該場(chǎng)景的I幀，當(dāng)視頻碼流采用H.264協(xié)議編碼時(shí)，I幀是指包含幀內(nèi)編碼條帶或宏塊MB最多的幀，該幀標(biāo)識(shí)有瞬時(shí)解碼刷新IDR標(biāo)志。
S2、部分解碼該待檢測(cè)的I幀及其前后的若干幀圖像；也可以在解碼出的I幀圖像的精度無(wú)法進(jìn)行精確識(shí)別時(shí)，再部分解碼I幀之前及之后的相鄰幾幀相鄰圖像，用于輔助識(shí)別I幀圖像。
S3、識(shí)別該I幀圖像中是否包含有害內(nèi)容，如果是則執(zhí)行步驟S4；否則執(zhí)行步驟S5；S4、立即切斷該視頻碼流的播放；在切斷該視頻碼流的播放的同時(shí)，還可以啟動(dòng)播放替換視頻源。
S5、繼續(xù)播放該視頻碼流。
如果基于場(chǎng)景分割技術(shù)，則在獲取待檢測(cè)幀之前，先對(duì)視頻碼流進(jìn)行場(chǎng)景分割，然后將每一個(gè)場(chǎng)景中的第一幀作為待檢測(cè)幀，部分解碼該第一幀或幀該第一幀以及之前和/或之后相鄰的一定數(shù)目幀。
本發(fā)明所述方法可以和現(xiàn)有的基于URL的過濾配合使用，基于URL的過濾可以對(duì)多媒體通信過程中的相關(guān)信令進(jìn)行過濾，如果相關(guān)信令中包含有害URL信息，則拒絕執(zhí)行該信令，從而防止接收來(lái)自有害URL源的視頻碼流。
本發(fā)明在基于URL的過濾的同時(shí)，還提供了有害URL信息評(píng)級(jí)機(jī)制，可以防止錯(cuò)殺偶發(fā)有害URL信息，并發(fā)現(xiàn)新的有害URL信息，然后及時(shí)將新發(fā)現(xiàn)的有害URL信息添加到有害URL信息庫(kù)中。
本發(fā)明所述方法中，具體識(shí)別方法可以采用人工識(shí)別和自動(dòng)識(shí)別，一般情況下，同時(shí)采用兩種識(shí)別方法可以得到更高的效率和更保險(xiǎn)的識(shí)別，這時(shí)，可以設(shè)定優(yōu)先執(zhí)行人工識(shí)別或自動(dòng)識(shí)別的判決結(jié)果，當(dāng)然，也可以綜合考慮雙方的判決結(jié)果以便得到更負(fù)責(zé)任的控制模式。
本發(fā)明所述方法還提供內(nèi)容錄制機(jī)制，包括對(duì)識(shí)別出的有害內(nèi)容的錄制和指定時(shí)段中播放的視頻碼流的錄制，對(duì)有害內(nèi)容進(jìn)行錄制的目的在于如果自動(dòng)識(shí)別中沒有儲(chǔ)存的有害內(nèi)容信息被人工識(shí)別出來(lái)，則本發(fā)明還提供學(xué)習(xí)機(jī)制保證新出現(xiàn)的有害內(nèi)容及時(shí)的添加到自動(dòng)識(shí)別機(jī)制的有害內(nèi)容數(shù)據(jù)庫(kù)中；對(duì)指定時(shí)段中播放的視頻碼流錄制目的在于可以進(jìn)一步檢查來(lái)自特定URL源的視頻碼流，或者在視頻碼流中的有害內(nèi)容被漏查后，為以后的學(xué)習(xí)提供資料。
本發(fā)明所述方法還同時(shí)提供日志記錄和報(bào)告機(jī)制，對(duì)視頻碼流的過濾過程進(jìn)行記錄并可以生成日志報(bào)告。
如圖6所示，為實(shí)現(xiàn)本發(fā)明所述的視頻碼流過濾方法，本發(fā)明提供的視頻碼流過濾結(jié)點(diǎn)主要包括視頻碼流延遲模塊，用于接收多媒體通信過程中待播放的視頻碼流并延遲輸出該視頻碼；具體延遲時(shí)間根據(jù)識(shí)別有害內(nèi)容的所需要的經(jīng)驗(yàn)時(shí)間確定；開關(guān)模塊，連接所述視頻碼流延遲模塊，用于切斷該視頻碼流延遲模塊輸出的視頻碼流；I幀檢測(cè)/解碼模塊，用于從多媒體通信過程中待播放視頻碼流中獲取待檢測(cè)的I幀I幀之前及之后的相鄰幾幀，部分解碼待檢測(cè)的I幀圖像以及該I幀之前及之后的相鄰幾幀相鄰圖像；當(dāng)然，也可以在解碼出的I幀圖像的精度無(wú)法進(jìn)行精確識(shí)別時(shí)，再?gòu)囊曨l碼流延遲模塊中獲取該I幀之前及之后的相鄰幾幀，并部分解碼I幀之前及之后的相鄰幾幀相鄰圖像，用于輔助識(shí)別I幀圖像，這時(shí)，I幀檢測(cè)/解碼模塊同時(shí)連接視頻碼流延遲模塊。
有害內(nèi)容識(shí)別模塊，連接所述I幀檢測(cè)/解碼模塊，用于識(shí)別所述I幀圖像中是否包含有害內(nèi)容，如果是則輸出相應(yīng)的控制信號(hào)；判決模塊，連接在有害內(nèi)容識(shí)別模塊和開關(guān)模塊之間，用于接收到所述控制信號(hào)時(shí)向所述開關(guān)模塊輸出斷開所述視頻碼流的觸發(fā)信號(hào)；如果基于場(chǎng)景分割技術(shù)獲取待檢測(cè)的I幀，則過濾節(jié)點(diǎn)還包括場(chǎng)景分割模塊，連接I幀檢測(cè)/解碼模塊，用于和視頻碼流延遲模塊并行接收待播放的視頻碼流并對(duì)該視頻碼流進(jìn)行場(chǎng)景分割；如圖7所示，圖7為有害內(nèi)容識(shí)別模塊和判決模塊的一種機(jī)構(gòu)示意圖，其中有害內(nèi)容識(shí)別模塊中包括實(shí)現(xiàn)自動(dòng)識(shí)別功能的自動(dòng)識(shí)別子模塊，連接在所述I幀檢測(cè)/解碼模塊和判決模塊之間，用于將有害內(nèi)容數(shù)據(jù)庫(kù)中的有害內(nèi)容與所述I幀圖像中包含的相關(guān)內(nèi)容進(jìn)行逐一比對(duì)來(lái)進(jìn)行有害內(nèi)容的自動(dòng)識(shí)別；根據(jù)有害內(nèi)容的類型，自動(dòng)識(shí)別子模塊進(jìn)一步包括有害圖像識(shí)別單元和相連接的有害圖像數(shù)據(jù)庫(kù)、有害疊加文字/符號(hào)識(shí)別單元和相連接的有害疊加文字/符號(hào)數(shù)據(jù)庫(kù)、人臉識(shí)別單元和相連接的人臉數(shù)據(jù)庫(kù)，并行對(duì)所述I幀圖像中是否包含相應(yīng)的有害內(nèi)容進(jìn)行識(shí)別。其中，有害圖像數(shù)據(jù)庫(kù)中還保存有害圖像內(nèi)容識(shí)別的各種已有特征網(wǎng)絡(luò)(每次人類輸入的特征網(wǎng)絡(luò)都存儲(chǔ)在這里)和識(shí)別低級(jí)事件特征的各種模板，比如統(tǒng)計(jì)直方圖模板等；有害文字和符號(hào)數(shù)據(jù)庫(kù)存儲(chǔ)各種有害文字和符號(hào)的模板，比如反動(dòng)和色情的詞匯俚語(yǔ)等，還有已知的有害圖形符號(hào)，比如納粹符號(hào)等；人臉數(shù)據(jù)庫(kù)為人臉識(shí)別模塊提供必要數(shù)據(jù)和各種模板，比如嫌疑犯、被檢控對(duì)象，重要人物的人臉模板等；有害內(nèi)容識(shí)別模塊中還包括用于實(shí)現(xiàn)人工識(shí)別功能人工識(shí)別子模塊，該人工識(shí)別子模塊中具體包括I幀圖像顯示單元和監(jiān)控指令輸入單元，其中，I幀圖像顯示單元連接所述I幀檢測(cè)/解碼模塊，用于將所述I幀圖像顯示給監(jiān)控者進(jìn)行有害內(nèi)容的人工識(shí)別；監(jiān)控指令輸入單元連接所述判決模塊，用于接收到監(jiān)控者在識(shí)別出有害內(nèi)容時(shí)輸入的切斷指令時(shí)，向所述判決模塊輸出所述控制信號(hào)。
判決模塊中相應(yīng)的包括第一判決單元，接收所述自動(dòng)識(shí)別子模塊輸出的控制信號(hào)；第二判決單元，接收所述操作界面子模塊輸出的控制信號(hào)；聯(lián)合判決單元，分別連接所述第一判決單元和第二判決單元，用于根據(jù)設(shè)定的規(guī)則優(yōu)先執(zhí)行第一判決單元或第二判決單元的控制信號(hào)；或者，所述自動(dòng)識(shí)別子模塊和監(jiān)控者分別根據(jù)預(yù)先設(shè)定的規(guī)則，為識(shí)別出的有害內(nèi)容給出相應(yīng)的有害程度分值，聯(lián)合判決單元對(duì)兩個(gè)分值進(jìn)行加權(quán)處理后得到最終執(zhí)行的判決結(jié)果，當(dāng)僅收到一方為認(rèn)定的有害內(nèi)容給出的分值時(shí)，默認(rèn)另一方為該內(nèi)容給出的分值為零；很多情況下，單獨(dú)根據(jù)視頻可能不足以判斷內(nèi)容是否有害，還要聯(lián)合音頻的判決結(jié)果，因此本模塊可以引入來(lái)自本節(jié)點(diǎn)外部的音頻內(nèi)容過濾結(jié)果作為一個(gè)輸入，所以判決模塊中還包括第三判決單元，用于接收到所述視頻碼流對(duì)應(yīng)的音頻碼流的有害聲音判決結(jié)果時(shí)直接向所述開關(guān)模塊輸出斷開所述視頻碼流的觸發(fā)信號(hào)，或通過聯(lián)合判決單元向所述開關(guān)模塊輸出斷開所述視頻碼流的觸發(fā)信號(hào)，圖7中所示結(jié)構(gòu)為后一種實(shí)現(xiàn)方式。
仍參閱圖6，視頻碼流過濾結(jié)點(diǎn)中還可以同時(shí)包括基于URL的過濾模塊，用于接收多媒體通信的相關(guān)信令，并利用預(yù)存的有害通用資源定位器URL信息庫(kù)對(duì)所述相關(guān)信令進(jìn)行基于URL的過濾，如果判斷某個(gè)URL為有害，則禁止相應(yīng)的信令建立過程，從而使得對(duì)于內(nèi)容的請(qǐng)求和發(fā)送無(wú)法正確進(jìn)行；該過濾節(jié)點(diǎn)還可以包括URL記錄和評(píng)級(jí)模塊和URL評(píng)級(jí)數(shù)據(jù)庫(kù)，其中，URL記錄和評(píng)級(jí)模塊用于記錄有害內(nèi)容的URL信息，URL評(píng)級(jí)數(shù)據(jù)庫(kù)用于記錄URL評(píng)級(jí)數(shù)據(jù)；URL記錄和評(píng)級(jí)模塊根據(jù)一個(gè)URL以前發(fā)生不良行為的頻率和嚴(yán)重性，進(jìn)行評(píng)級(jí)調(diào)整，如果該URL信息達(dá)到設(shè)定的級(jí)別則將該URL信息添加到有害URL信息庫(kù)中。這樣可以保證，不會(huì)因?yàn)槟硞€(gè)URL偶然的問題，而被永遠(yuǎn)封殺，還可以向第三方評(píng)級(jí)服務(wù)上輸出記錄和評(píng)級(jí)結(jié)果。
URL記錄和評(píng)級(jí)模塊除了進(jìn)行記錄和評(píng)級(jí)外，還作為URL評(píng)級(jí)數(shù)據(jù)庫(kù)模塊對(duì)外的接口。除了主控模塊外的其它模塊和數(shù)據(jù)庫(kù)都沒有直接連線，都要通過URL記錄和評(píng)級(jí)模塊來(lái)訪問數(shù)據(jù)庫(kù)。
因此數(shù)據(jù)庫(kù)只有和URL記錄和評(píng)級(jí)模塊以及主控模塊有連線。URL記錄和評(píng)級(jí)模塊和以下模塊有連線主控模塊；URL評(píng)級(jí)數(shù)據(jù)庫(kù)模塊；判決模塊，判決結(jié)果引入來(lái)給相關(guān)聯(lián)的URL評(píng)分定級(jí)；學(xué)習(xí)模塊，學(xué)習(xí)過程中可能要參考數(shù)據(jù)庫(kù)的數(shù)據(jù)；有害內(nèi)容識(shí)別模塊在識(shí)別過程中，可能需要使用到數(shù)據(jù)庫(kù)中的URL數(shù)據(jù)。一個(gè)例子是如果視頻中疊加了一個(gè)字幕，告訴觀眾去訪問某個(gè)URL，比如非法網(wǎng)站，那么也是要進(jìn)行識(shí)別和控制的。
仍參閱圖6，該過濾節(jié)點(diǎn)還包括有害內(nèi)容錄制模塊，分別連接所述I幀檢測(cè)/解碼模塊和判決模塊，所述判決模塊觸發(fā)斷開所述視頻碼流的同時(shí)，啟動(dòng)該有害內(nèi)容錄制模塊錄制識(shí)別出的有害內(nèi)容；錄制的時(shí)間窗口長(zhǎng)度TW可以由人類監(jiān)控者指定；視頻內(nèi)容錄制模塊，用于錄制監(jiān)控者指定時(shí)段的視頻流并存儲(chǔ)到錄制內(nèi)容存儲(chǔ)模塊；錄制的時(shí)間窗口長(zhǎng)度TW可以由人類監(jiān)控者指定；一般情況下，有害內(nèi)容錄制模塊和視頻內(nèi)容錄制模塊合并設(shè)置為一個(gè)錄制模塊；錄制內(nèi)容存儲(chǔ)模塊，分別連接有害內(nèi)容錄制模塊和視頻內(nèi)容錄制模塊(即錄制模塊)，用于保存錄制的有害內(nèi)容。
仍參閱圖6，該過濾節(jié)點(diǎn)還包括有害內(nèi)容學(xué)習(xí)模塊，連接所述錄制內(nèi)容存儲(chǔ)模塊，用于當(dāng)自動(dòng)識(shí)別子模塊和監(jiān)控者的對(duì)該內(nèi)容的識(shí)別結(jié)果不一致并最終執(zhí)行了監(jiān)控者的有害判決結(jié)果時(shí)，學(xué)習(xí)該有害內(nèi)容并將學(xué)習(xí)結(jié)果添加到有害內(nèi)容數(shù)據(jù)庫(kù)中。
如圖8所示，當(dāng)自動(dòng)識(shí)別子模塊根據(jù)有害內(nèi)容的類型分別設(shè)置時(shí)，有害內(nèi)容學(xué)習(xí)模塊對(duì)應(yīng)包括圖像學(xué)習(xí)單元，連接有害圖像數(shù)據(jù)庫(kù)，用于學(xué)習(xí)有害圖像并將學(xué)習(xí)結(jié)果添加到有害圖像數(shù)據(jù)庫(kù)中；疊加文字/符號(hào)學(xué)習(xí)單元，連接有害疊加文字/符號(hào)數(shù)據(jù)庫(kù)，用于學(xué)習(xí)有害疊加文字/符號(hào)并將學(xué)習(xí)結(jié)果添加到有害疊加文字/符號(hào)數(shù)據(jù)庫(kù)中；人臉學(xué)習(xí)單元，連接人臉數(shù)據(jù)庫(kù)，用于學(xué)習(xí)人臉圖像并將學(xué)習(xí)結(jié)果添加到人臉數(shù)據(jù)庫(kù)中。
如圖9所示，為實(shí)現(xiàn)對(duì)過濾節(jié)點(diǎn)的控制以及參數(shù)的設(shè)置，該過濾結(jié)點(diǎn)還包括以下結(jié)構(gòu)操作界面模塊，用于輸入相關(guān)參數(shù)或操作指令；為人類監(jiān)控者提供操作界面包括用戶圖形界面和命令行等方式。
特征網(wǎng)絡(luò)模塊，連接在所述操作界面模塊和有害圖像數(shù)據(jù)庫(kù)之間，用于向所述有害圖像識(shí)別單元輸入/調(diào)整特征網(wǎng)絡(luò)模型和/或事件特征模板。
參數(shù)設(shè)置模塊，連接在所述操作界面模塊和場(chǎng)景分割模塊之間，用于向所述場(chǎng)景分割模塊中輸入/調(diào)整進(jìn)行場(chǎng)景分割所需的相關(guān)參數(shù)。
判決規(guī)則設(shè)置模塊，連接在所述操作界面模塊和判決模塊之間，用于向所述判決模塊輸入/調(diào)整控制信號(hào)的判決規(guī)則；評(píng)級(jí)規(guī)則設(shè)置模塊，連接在所述操作界面模塊和URL評(píng)級(jí)數(shù)據(jù)庫(kù)之間，用于向所述URL評(píng)級(jí)數(shù)據(jù)庫(kù)中輸入/調(diào)整評(píng)級(jí)規(guī)則；主控模塊，分別連接該過濾節(jié)點(diǎn)中的其他任何一個(gè)模塊、子模塊或單元，該模塊是本過濾節(jié)點(diǎn)的中心模塊，起到控制全部其它模塊、子模塊或單元的作用；日志報(bào)告模塊，分別連接該過濾節(jié)點(diǎn)中的其他任何一個(gè)模塊、子模塊或單元，用于對(duì)于本節(jié)點(diǎn)的運(yùn)行狀態(tài)和發(fā)生的事件以及內(nèi)容過濾的結(jié)果等進(jìn)行日志記錄和報(bào)告生成。
外部控制模塊，連接所述主控模塊，用于完成和外部控制設(shè)備的數(shù)據(jù)/信令交互。因?yàn)楸竟?jié)點(diǎn)在網(wǎng)絡(luò)位置上和媒體網(wǎng)關(guān)等其它網(wǎng)絡(luò)設(shè)備部署在同一網(wǎng)絡(luò)位置，甚至在物理設(shè)備形態(tài)上，可以和媒體網(wǎng)關(guān)等實(shí)現(xiàn)在同一個(gè)物理設(shè)備中。因此，很可能接受外部控制設(shè)備比如網(wǎng)關(guān)控制器的控制，并且向外部設(shè)備上報(bào)信息，控制命令和數(shù)據(jù)上報(bào)采用的通信協(xié)議可以是H.248/MGCP(Media GatewayControl Protocol)等，本模塊完成和外部控制設(shè)備的數(shù)據(jù)交互等。
控制指令模塊，連接在操作界面模塊和主控模塊之間，用于接受人類監(jiān)控者的指令，比如切斷有害的視頻碼流，用無(wú)害碼流替代、啟動(dòng)或者禁止基于URL的過濾功能、重新啟動(dòng)本節(jié)點(diǎn)等；前述的監(jiān)控指令輸入單元可以設(shè)置在該控制指令模塊中；最后需要說明，本發(fā)明的過濾節(jié)點(diǎn)可以部署在網(wǎng)絡(luò)上，對(duì)于網(wǎng)絡(luò)位置并沒有嚴(yán)格指定。其實(shí)可以部署在內(nèi)容源到用戶終端之間的任何網(wǎng)絡(luò)位置上，只要所要過濾的媒體流通過該網(wǎng)絡(luò)位置就可以。在極端情況下，可以部署在用戶終端上，那么就相當(dāng)于在終端內(nèi)置了一個(gè)內(nèi)容過濾子系統(tǒng)。
需要說明的是，視頻碼流被加密并不影響本發(fā)明技術(shù)方案的實(shí)施，視頻碼流的加密有以下兩種可能1、來(lái)自合法的內(nèi)容源的內(nèi)容，如果經(jīng)過DRM等手段加密，作為國(guó)家機(jī)關(guān)的內(nèi)容監(jiān)控部門可以獲取密鑰；2、來(lái)自非法內(nèi)容源的內(nèi)容，其目的是要散布有害內(nèi)容，需要廣大的網(wǎng)絡(luò)人群能夠接收到，必然不加密或者采用較低級(jí)的加密手段，因此可以方便解密。
本發(fā)明的上述方法中，有害內(nèi)容的特定分級(jí)標(biāo)準(zhǔn)和相應(yīng)的識(shí)別標(biāo)準(zhǔn)根據(jù)實(shí)際應(yīng)用場(chǎng)景確定，具體標(biāo)準(zhǔn)或識(shí)別方法并不限定本發(fā)明的保護(hù)范圍。
顯然，本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣，倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi)，則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
權(quán)利要求
1.一種多媒體通信過程中的視頻碼流過濾方法，其特征在于，包括如下步驟A、從多媒體通信過程中傳輸?shù)囊曨l碼流中獲取待檢測(cè)的幀內(nèi)編碼幀，部分解碼該幀內(nèi)編碼幀圖像；B、識(shí)別所述幀內(nèi)編碼幀圖像中是否包含有害內(nèi)容，如果是則切斷所述視頻碼流的播放；否則播放該視頻碼流。
2.如權(quán)利要求1所述的過濾方法，其特征在于，所述步驟A中還包括獲取并部分解碼所述幀內(nèi)編碼幀之前和/或之后相鄰的一定數(shù)目幀的圖像；所述步驟B中還包括，利用所述相鄰幀的圖像輔助識(shí)別所述幀內(nèi)編碼幀圖像。
3.如權(quán)利要求1所述的過濾方法，其特征在于，所述步驟A中，所述待檢測(cè)的幀內(nèi)編碼幀包括所述視頻碼流中的每一個(gè)幀內(nèi)編碼幀，根據(jù)包含幀內(nèi)編碼幀的數(shù)據(jù)包的包頭中相應(yīng)設(shè)置的幀內(nèi)編碼幀標(biāo)識(shí)信息進(jìn)行識(shí)別。
4.如權(quán)利要求1所述的過濾方法，其特征在于，所述步驟A中，所述待檢測(cè)的幀內(nèi)編碼幀為所述視頻碼流中包含的每一個(gè)場(chǎng)景中的第一個(gè)幀內(nèi)編碼幀。
5.如權(quán)利要求4所述的過濾方法，其特征在于，所述方法中還包括如下步驟根據(jù)視頻數(shù)據(jù)包的結(jié)構(gòu)信息對(duì)所述的視頻碼流進(jìn)行場(chǎng)景分割；和/或，根據(jù)視頻流的統(tǒng)計(jì)信息對(duì)所述的視頻碼流進(jìn)行場(chǎng)景分割。
6.如權(quán)利要求1-4任意之一所述的過濾方法，其特征在于，所述方法中，當(dāng)所述視頻碼流采用H.264協(xié)議編碼時(shí)，所述的幀內(nèi)編碼幀是指包含幀內(nèi)編碼條帶或宏塊最多的幀，該幀標(biāo)識(shí)有瞬時(shí)解碼刷新標(biāo)志。
7.如權(quán)利要求1所述的過濾方法，其特征在于，所述方法還同時(shí)包括利用預(yù)存的有害通用資源定位器URL信息庫(kù)，對(duì)多媒體通信過程中的相關(guān)信令進(jìn)行基于URL的過濾。
8.如權(quán)利要求7所述的過濾方法，其特征在于，所述步驟B中還同時(shí)包括記錄識(shí)別出的有害內(nèi)容的相關(guān)URL信息并根據(jù)歷史記錄對(duì)該URL信息進(jìn)行評(píng)級(jí)，如果該URL信息達(dá)到設(shè)定的級(jí)別則將該URL信息添加到有害URL信息庫(kù)中。
9.如權(quán)利要求1所述的過濾方法，其特征在于，所述方法還同時(shí)包括識(shí)別所述視頻碼流對(duì)應(yīng)的音頻碼流中是否包含有害聲音，如果是則切斷所述視頻碼流的播放；否則繼續(xù)播放該視頻碼流。
10.如權(quán)利要求1所述的過濾方法，其特征在于，所述步驟B中，將所述幀內(nèi)編碼幀圖像輸入自動(dòng)識(shí)別模塊，自動(dòng)識(shí)別模塊將預(yù)存的有害內(nèi)容數(shù)據(jù)庫(kù)中的有害內(nèi)容與所述幀內(nèi)編碼幀圖像中包含的相關(guān)內(nèi)容進(jìn)行逐一比對(duì)來(lái)進(jìn)行有害內(nèi)容的自動(dòng)識(shí)別；和/或?qū)⑺鰩瑑?nèi)編碼幀圖像顯示給監(jiān)控者來(lái)進(jìn)行有害內(nèi)容的人工識(shí)別。
11.如權(quán)利要求10所述的過濾方法，其特征在于，當(dāng)人工識(shí)別和自動(dòng)識(shí)別同時(shí)進(jìn)行時(shí)，如果二者的識(shí)別結(jié)果出現(xiàn)不一致，則優(yōu)先執(zhí)行自動(dòng)識(shí)別模塊或監(jiān)控者的判決結(jié)果。
12.如權(quán)利要求10所述的過濾方法，其特征在于，當(dāng)人工識(shí)別和自動(dòng)識(shí)別同時(shí)進(jìn)行時(shí)，由自動(dòng)識(shí)別模塊和監(jiān)控者分別根據(jù)預(yù)先設(shè)定的規(guī)則，為識(shí)別出的有害內(nèi)容給出相應(yīng)的有害程度分值，然后對(duì)兩個(gè)分值進(jìn)行加權(quán)處理后得到最終執(zhí)行的判決結(jié)果，當(dāng)僅收到一方為認(rèn)定的有害內(nèi)容給出的分值時(shí)，默認(rèn)另一方為該內(nèi)容給出的分值為零。
13.如權(quán)利要求12所述的過濾方法，其特征在于，所述的加權(quán)處理方法為SI＝(WM×SM+WH×SH)/(WM+WH)其中，WM和WH表示自動(dòng)識(shí)別模塊和監(jiān)控者的權(quán)值，WM和WH之間的相對(duì)大小表示了對(duì)識(shí)別結(jié)果的信任度，SM和SH分別自動(dòng)識(shí)別模塊和監(jiān)控者給出的分?jǐn)?shù)，如果SI大于一個(gè)給定值，則判決結(jié)果為有害，否則判決結(jié)果為無(wú)害，WM、WH和給定值分別根據(jù)經(jīng)驗(yàn)值設(shè)定。
14.如權(quán)利要求11或12所述的過濾方法，其特征在于，所述方法還同時(shí)包括錄制識(shí)別出的有害內(nèi)容，當(dāng)人工識(shí)別和自動(dòng)識(shí)別同時(shí)進(jìn)行時(shí)，如果自動(dòng)識(shí)別和人工識(shí)別結(jié)果不一致并最終執(zhí)行了人工識(shí)別的有害判決結(jié)果，則學(xué)習(xí)被識(shí)別出的有害內(nèi)容并將學(xué)習(xí)結(jié)果添加到有害內(nèi)容數(shù)據(jù)庫(kù)中。
15.如權(quán)利要求1所述的過濾方法，其特征在于，所述的有害內(nèi)容至少包括如下之一有害圖像、有害疊加文字或符號(hào)、特定人臉圖像。
16.如權(quán)利要求1或9所述的過濾方法，其特征在于，切斷播放所述視頻碼流的同時(shí)，啟動(dòng)播放備用無(wú)害視頻碼流。
17.如權(quán)利要求1所述的過濾方法，其特征在于，所述方法還同時(shí)包括錄制并保存指定時(shí)段播放的視頻碼流。
18.如權(quán)利要求1所述的過濾方法，其特征在于，所述方法還同時(shí)包括將有害內(nèi)容的識(shí)別情況記錄在日志并生成日志報(bào)告。
19.如權(quán)利要求1所述的過濾方法，其特征在于，所述方法還同時(shí)包括根據(jù)識(shí)別有害內(nèi)容所需要的時(shí)間，延遲播放所述視頻碼流。
20.一種多媒體通信過程中的視頻碼流過濾節(jié)點(diǎn)，包括視頻碼流延遲模塊，用于接收多媒體通信過程中待播放的視頻碼流并延遲輸出該視頻碼；開關(guān)模塊，連接所述視頻碼流延遲模塊，用于切斷該視頻碼流延遲模塊輸出的視頻碼流；其特征在于，所述過濾節(jié)點(diǎn)還包括幀內(nèi)編碼幀檢測(cè)/解碼模塊，用于從多媒體通信過程中待播放視頻碼流中獲取待檢測(cè)的幀內(nèi)編碼幀或者該幀內(nèi)編碼幀及其之前和/或之后的相鄰的一定數(shù)目幀，部分解碼獲取的相鄰幀的圖像；有害內(nèi)容識(shí)別模塊，連接所述幀內(nèi)編碼幀檢測(cè)/解碼模塊，用于識(shí)別所述圖像中是否包含有害內(nèi)容，如果是則輸出相應(yīng)的控制信號(hào)；判決模塊，連接在有害內(nèi)容識(shí)別模塊和開關(guān)模塊之間，用于接收到所述控制信號(hào)時(shí)向所述開關(guān)模塊輸出斷開所述視頻碼流的觸發(fā)信號(hào)。
21.如權(quán)利要求20所述的過濾節(jié)點(diǎn)，其特征在于，該過濾節(jié)點(diǎn)還包括場(chǎng)景分割模塊，連接所述幀內(nèi)編碼幀檢測(cè)/解碼模塊，用于接收待播放的視頻碼流并對(duì)該視頻碼流進(jìn)行場(chǎng)景分割。
22.如權(quán)利要求20所述的過濾節(jié)點(diǎn)，其特征在于，該過濾節(jié)點(diǎn)還包括基于URL的過濾模塊，用于接收多媒體通信的相關(guān)信令，并利用預(yù)存的有害通用資源定位器URL信息庫(kù)對(duì)所述相關(guān)信令進(jìn)行基于URL的過濾。
23.如權(quán)利要求22所述的過濾節(jié)點(diǎn)，其特征在于，該過濾節(jié)點(diǎn)還包括URL記錄和評(píng)級(jí)模塊，用于記錄有害內(nèi)容的相關(guān)URL信息并根據(jù)歷史記錄對(duì)該URL信息進(jìn)行評(píng)級(jí)，如果該URL信息達(dá)到設(shè)定的級(jí)別則將該URL信息添加到有害URL信息庫(kù)中；URL評(píng)級(jí)數(shù)據(jù)庫(kù)，用于保存URL評(píng)級(jí)的規(guī)則和歷史記錄。
24.如權(quán)利要求23所述的過濾節(jié)點(diǎn)，其特征在于，所述的有害內(nèi)容識(shí)別模塊包括自動(dòng)識(shí)別子模塊，連接在所述幀內(nèi)編碼幀檢測(cè)/解碼模塊和判決模塊之間，用于將有害內(nèi)容數(shù)據(jù)庫(kù)中的有害內(nèi)容與所述幀內(nèi)編碼幀圖像中包含的相關(guān)內(nèi)容進(jìn)行逐一比對(duì)來(lái)進(jìn)行有害內(nèi)容的自動(dòng)識(shí)別；和/或人工識(shí)別子模塊，該人工識(shí)別子模塊具體包括幀內(nèi)編碼幀圖像顯示單元和監(jiān)控指令輸入單元，其中，幀內(nèi)編碼幀圖像顯示單元連接所述幀內(nèi)編碼幀檢測(cè)/解碼模塊，用于將所述幀內(nèi)編碼幀圖像顯示給監(jiān)控者進(jìn)行有害內(nèi)容的人工識(shí)別；監(jiān)控指令輸入單元連接所述判決模塊，用于接收到監(jiān)控者在識(shí)別出有害內(nèi)容時(shí)輸入的切斷指令時(shí)，向所述判決模塊輸出所述控制信號(hào)。
25.如權(quán)利要求24所述的過濾節(jié)點(diǎn)，其特征在于，根據(jù)有害內(nèi)容的類型，所述自動(dòng)識(shí)別子模塊至少包括如下之一有害圖像識(shí)別單元和相連接的有害圖像數(shù)據(jù)庫(kù)、有害疊加文字/符號(hào)識(shí)別單元和相連接的有害疊加文字/符號(hào)數(shù)據(jù)庫(kù)、人臉識(shí)別單元和相連接的人臉數(shù)據(jù)庫(kù)；其中，有害圖像識(shí)別單元、有害疊加文字/符號(hào)識(shí)別單元和人臉識(shí)別單元并行連接在所述幀內(nèi)編碼幀檢測(cè)/解碼模塊和判決模塊之間，分別對(duì)所述幀內(nèi)編碼幀圖像中是否包含相應(yīng)的有害內(nèi)容進(jìn)行識(shí)別。
26.如權(quán)利要求25所述的過濾節(jié)點(diǎn)，其特征在于，當(dāng)所述有害內(nèi)容識(shí)別模塊中同時(shí)包含有自動(dòng)識(shí)別子模塊和指令輸入子模塊時(shí)，所述判決模塊中包括第一判決單元，接收所述自動(dòng)識(shí)別子模塊輸出的控制信號(hào)；第二判決單元，接收所述操作界面子模塊輸出的控制信號(hào)；聯(lián)合判決單元，分別連接所述第一判決單元和第二判決單元，用于根據(jù)設(shè)定的規(guī)則優(yōu)先執(zhí)行第一判決單元或第二判決單元的控制信號(hào)；或者，所述自動(dòng)識(shí)別子模塊和監(jiān)控者分別根據(jù)預(yù)先設(shè)定的規(guī)則，為識(shí)別出的有害內(nèi)容給出相應(yīng)的有害程度分值，聯(lián)合判決單元對(duì)兩個(gè)分值進(jìn)行加權(quán)處理后得到最終執(zhí)行的判決結(jié)果，當(dāng)僅收到一方為認(rèn)定的有害內(nèi)容給出的分值時(shí)，默認(rèn)另一方為該內(nèi)容給出的分值為零。
27.如權(quán)利要求26所述的過濾節(jié)點(diǎn)，其特征在于，所述判決模塊中還包括第三判決單元，用于接收到所述視頻碼流對(duì)應(yīng)的音頻碼流的有害聲音判決結(jié)果時(shí)，直接或通過聯(lián)合判決單元向所述開關(guān)模塊輸出斷開所述視頻碼流的控制指令。
28.如權(quán)利要求18或25所述的過濾節(jié)點(diǎn)，其特征在于，所述過濾節(jié)點(diǎn)還包括有害內(nèi)容錄制模塊，分別連接所述幀內(nèi)編碼幀檢測(cè)/解碼模塊和判決模塊，所述判決模塊觸發(fā)斷開所述視頻碼流的同時(shí)，啟動(dòng)該有害內(nèi)容錄制模塊錄制識(shí)別出的有害內(nèi)容；錄制內(nèi)容存儲(chǔ)模塊，連接所述有害內(nèi)容錄制模塊，用于保存錄制的有害內(nèi)容。
29.如權(quán)利要求28所述的過濾節(jié)點(diǎn)，其特征在于，所述過濾節(jié)點(diǎn)還包括有害內(nèi)容學(xué)習(xí)模塊，連接所述錄制內(nèi)容存儲(chǔ)模塊，用于當(dāng)自動(dòng)識(shí)別子模塊和監(jiān)控者的對(duì)該內(nèi)容的識(shí)別結(jié)果不一致并最終執(zhí)行了監(jiān)控者的有害判決結(jié)果時(shí)，學(xué)習(xí)該有害內(nèi)容并將學(xué)習(xí)結(jié)果添加到有害內(nèi)容數(shù)據(jù)庫(kù)中。
30.如權(quán)利要求28所述的過濾節(jié)點(diǎn)，其特征在于，當(dāng)自動(dòng)識(shí)別子模塊根據(jù)有害內(nèi)容的類型分別設(shè)置時(shí)，所述有害內(nèi)容學(xué)習(xí)模塊對(duì)應(yīng)包括如下之一圖像學(xué)習(xí)單元，連接有害圖像數(shù)據(jù)庫(kù)，用于學(xué)習(xí)有害圖像并將學(xué)習(xí)結(jié)果添加到有害圖像數(shù)據(jù)庫(kù)中；疊加文字/符號(hào)學(xué)習(xí)單元，連接有害疊加文字/符號(hào)數(shù)據(jù)庫(kù)，用于學(xué)習(xí)有害疊加文字/符號(hào)并將學(xué)習(xí)結(jié)果添加到有害疊加文字/符號(hào)數(shù)據(jù)庫(kù)中；人臉學(xué)習(xí)單元，連接人臉數(shù)據(jù)庫(kù)，用于學(xué)習(xí)人臉圖像并將學(xué)習(xí)結(jié)果添加到人臉數(shù)據(jù)庫(kù)中。
31.如權(quán)利要求28所述的過濾節(jié)點(diǎn)，其特征在于，所述過濾節(jié)點(diǎn)還包括操作界面模塊，用于輸入相關(guān)參數(shù)或操作指令；視頻內(nèi)容錄制模塊，連接所述操作界面模塊和錄制內(nèi)容存儲(chǔ)模塊之間，錄制監(jiān)控者指定時(shí)段的視頻流并存儲(chǔ)到錄制內(nèi)容存儲(chǔ)模塊。
32.如權(quán)利要求31所述的過濾節(jié)點(diǎn)，其特征在于，當(dāng)自動(dòng)識(shí)別子模塊中包含有害圖像識(shí)別單元時(shí)，所述過濾節(jié)點(diǎn)還包括特征網(wǎng)絡(luò)模塊，連接在所述操作界面模塊和有害圖像數(shù)據(jù)庫(kù)之間，用于向所述有害圖像數(shù)據(jù)庫(kù)中輸入/調(diào)整特征網(wǎng)絡(luò)模型和/或事件特征模板。
33.如權(quán)利要求32所述的過濾節(jié)點(diǎn)，其特征在于，所述過濾節(jié)點(diǎn)還包括參數(shù)設(shè)置模塊，連接在所述操作界面模塊和場(chǎng)景分割模塊之間，用于向所述場(chǎng)景分割模塊中輸入/調(diào)整進(jìn)行場(chǎng)景分割所需的相關(guān)參數(shù)。
34.如權(quán)利要求32所述的過濾節(jié)點(diǎn)，其特征在于，所述過濾節(jié)點(diǎn)還包括判決規(guī)則設(shè)置模塊，連接在所述操作界面模塊和判決模塊之間，用于向所述判決模塊輸入/調(diào)整控制信號(hào)的判決規(guī)則；和/或評(píng)級(jí)規(guī)則設(shè)置模塊，連接在所述操作界面模塊和URL評(píng)級(jí)數(shù)據(jù)庫(kù)之間，用于向所述URL評(píng)級(jí)數(shù)據(jù)庫(kù)中輸入/調(diào)整評(píng)級(jí)規(guī)則。
35.如權(quán)利要求18所述的過濾節(jié)點(diǎn)，其特征在于，所述過濾節(jié)點(diǎn)還包括替換片源庫(kù)，連接所述開關(guān)模塊為轉(zhuǎn)換開關(guān)，該轉(zhuǎn)換開關(guān)在斷開所述視頻碼流的同時(shí)，接通該替換片源庫(kù)。
36.如權(quán)利要求22-35所述的過濾節(jié)點(diǎn)，其特征在于，所述過濾節(jié)點(diǎn)還包括主控模塊，分別連接該過濾節(jié)點(diǎn)中的其他任何一個(gè)模塊、子模塊或單元，用于進(jìn)行運(yùn)行控制；日志報(bào)告模塊，分別連接該過濾節(jié)點(diǎn)中的其他任何一個(gè)模塊、子模塊或單元，用于生成并輸出該過濾節(jié)點(diǎn)的運(yùn)行日志。
37.如權(quán)利要求36所述的過濾節(jié)點(diǎn)，其特征在于，所述過濾節(jié)點(diǎn)還包括外部控制模塊，連接所述主控模塊，用于完成和外部控制設(shè)備的數(shù)據(jù)/信令交互。
38.如權(quán)利要求36所述的過濾節(jié)點(diǎn)，其特征在于，所述過濾節(jié)點(diǎn)還包括控制指令模塊，連接在操作界面模塊和主控模塊之間，用于接受人類監(jiān)控者的指令。
39.如權(quán)利要求38所述的過濾節(jié)點(diǎn)，其特征在于，當(dāng)所述過濾節(jié)點(diǎn)同時(shí)包括所述監(jiān)控指令輸入單元時(shí)，該監(jiān)控指令輸入單元設(shè)置在該控制指令模塊中。
全文摘要
本發(fā)明涉及多媒體通信技術(shù)，特別涉及一種多媒體通信過程中的視頻碼流過濾方法和過濾節(jié)點(diǎn)，以解決現(xiàn)有基于人工識(shí)別的深度內(nèi)容過濾方法效率低，缺乏通用性的問題。本發(fā)明提供的過濾方法只需要部分解碼視頻碼流中的部分?jǐn)?shù)據(jù)，進(jìn)一步基于場(chǎng)景分割技術(shù)進(jìn)行識(shí)別。本發(fā)明所述方法可以基于現(xiàn)有有害內(nèi)容的自動(dòng)識(shí)別技術(shù)，可以高效的實(shí)現(xiàn)自動(dòng)識(shí)別過濾并和人工識(shí)別機(jī)制配合使用，還可以同時(shí)采用現(xiàn)有的基于URL的過濾技術(shù)。本發(fā)明的過濾節(jié)點(diǎn)主要包括視頻碼流延遲模塊、開關(guān)模塊、I幀檢測(cè)/解碼模塊、符合特定分類定性分級(jí)標(biāo)準(zhǔn)的內(nèi)容識(shí)別模塊和判決模塊，本發(fā)明技術(shù)方案減少了需要解碼的數(shù)據(jù)數(shù)量，降低了處理復(fù)雜度。
文檔編號(hào)H04N7/16GK1968408SQ20061007902
公開日2007年5月23日申請(qǐng)日期2006年4月30日優(yōu)先權(quán)日2006年4月30日
發(fā)明者羅忠申請(qǐng)人:華為技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：羅忠
技術(shù)所有人：華為技術(shù)有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

視頻碼流相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種視頻碼流過濾方法和過濾節(jié)點(diǎn)的制作方法