央視臺標(biāo)的識別方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種央視臺標(biāo)的識別方法及裝置,涉及信息識別技術(shù)領(lǐng)域,本發(fā)明不再采用臺標(biāo)全局識別,而是充分考慮央視臺標(biāo)的特點和數(shù)字信息,獲取包括待識別臺標(biāo)的臺標(biāo)區(qū)域,在所述待識別臺標(biāo)為央視臺標(biāo)時,提取所述臺標(biāo)區(qū)域中的數(shù)字區(qū)域,對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別,根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字,將央視臺標(biāo)的標(biāo)志和識別的數(shù)字之間的組合作為識別結(jié)果,從而降低了時間復(fù)雜度,能夠?qū)ρ胍暸_標(biāo)進(jìn)行快速識別。
【專利說明】
央視臺標(biāo)的識別方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及信息識別技術(shù)領(lǐng)域,特別涉及一種央視臺標(biāo)的識別方法及裝置。
【背景技術(shù)】
[0002] 智能電視正順應(yīng)"高清化"、"網(wǎng)絡(luò)化"、"智能化"的趨勢迅速發(fā)展,具備從因特網(wǎng)、 視頻設(shè)備、計算機(jī)等多種渠道獲得節(jié)目內(nèi)容、通過信息融合的方式將消費者最需要的內(nèi)容 在大屏幕上清晰展現(xiàn)的功能。與傳統(tǒng)電視相比,智能電視為用戶提供了更加快捷、智能、人 性化的應(yīng)用服務(wù)。
[0003] 智能電視包含大量點播視頻、直播節(jié)目,絕大多數(shù)的電視節(jié)目保留了節(jié)目出品方 的臺標(biāo)。臺標(biāo)是區(qū)分電視臺的重要標(biāo)志,包含了電視臺臺名、節(jié)目來源、節(jié)目取向等重要的 語義信息,是實現(xiàn)視頻分析、理解和檢索的重要語義源。臺標(biāo)識別技術(shù)的實現(xiàn),將有效實現(xiàn) 節(jié)目單功能,并對理解用戶喜好、投放增值服務(wù)具有十分重要的意義。
[0004] 現(xiàn)有技術(shù)中在對臺標(biāo)進(jìn)行識別時,通常采用以下兩種方案:
[0005] 第一種方案:基于單幀圖像的臺標(biāo)識別方案。該種方法以邊緣距離變換矩陣作為 特征,均采用模板匹配的方式,包括全局邊緣匹配(滑動窗口遍歷整個臺標(biāo)區(qū)域)、分塊匹配 (采用人工方式過濾非邊緣)、顏色形狀匹配(顏色和形狀特征同時匹配,為節(jié)目搜索進(jìn)行分 類排序)等。
[0006] 第二種方案:基于多幀圖像的臺標(biāo)識別方法。該種方案通??刹捎靡韵氯N方法: 一、利用連續(xù)多幀視頻幀序列的敏感區(qū)域(即臺標(biāo)區(qū)域)像素點的特征值變化來分割圖像, 并進(jìn)行邊緣檢測,采用滑動窗口和分塊方法進(jìn)行匹配識別。二、綜合利用顏色和形狀特征, 根據(jù)時空不變性在幀序列中分割臺標(biāo),利用空間分布直方圖結(jié)合HSV彩色直方圖對特征進(jìn) 行有效描述,最后利用SUV完成臺標(biāo)識別。方法三:計算相鄰幀圖像的變化,提取臺標(biāo)及其Hu 不變矩,并根據(jù)候選集合和預(yù)設(shè)準(zhǔn)則得到識別結(jié)果等。
[0007] 但現(xiàn)有技術(shù)中,模板匹配等方式均采用臺標(biāo)全局識別,未充分考慮央視臺標(biāo)的特 點和數(shù)字信息,時間復(fù)雜度較高,難以保證央視臺標(biāo)的快速識別。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明實施例提供一種央視臺標(biāo)的識別方法及裝置,用以解決現(xiàn)有技術(shù)中時間復(fù) 雜度較高,難以保證央視臺標(biāo)的快速識別的缺陷。
[0009] 本發(fā)明實施例提供一種央視臺標(biāo)的識別方法,所述方法包括:
[0010] 獲取包括待識別臺標(biāo)的臺標(biāo)區(qū)域;
[0011]在所述待識別臺標(biāo)為央視臺標(biāo)時,提取所述臺標(biāo)區(qū)域中的數(shù)字區(qū)域;
[0012] 對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別;
[0013] 根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字;
[0014] 將央視臺標(biāo)的標(biāo)志和識別的數(shù)字之間的組合作為所述待識別臺標(biāo)的識別結(jié)果。
[0015] 本發(fā)明實施例提供一種央視臺標(biāo)的識別裝置,所述裝置包括:
[0016 ]區(qū)域獲取單元,用于獲取包括待識別臺標(biāo)的臺標(biāo)區(qū)域;
[0017]區(qū)域提取單元,用于在所述待識別臺標(biāo)為央視臺標(biāo)時,提取所述臺標(biāo)區(qū)域中的數(shù) 字區(qū)域;
[0018] 位數(shù)判別單元,用于對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別;
[0019] 數(shù)字識別單元,用于根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字;
[0020] 結(jié)果獲取單元,用于將央視臺標(biāo)的標(biāo)志和識別的數(shù)字之間的組合作為所述待識別 臺標(biāo)的識別結(jié)果。
[0021] 本發(fā)明不再采用臺標(biāo)全局識別,而是充分考慮央視臺標(biāo)的特點和數(shù)字信息,獲取 包括待識別臺標(biāo)的臺標(biāo)區(qū)域,在所述待識別臺標(biāo)為央視臺標(biāo)時,提取所述臺標(biāo)區(qū)域中的數(shù) 字區(qū)域,對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別,根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字, 將央視臺標(biāo)的標(biāo)志和識別的數(shù)字之間的組合作為識別結(jié)果,從而降低了時間復(fù)雜度,能夠 對央視臺標(biāo)進(jìn)行快速識別。
【附圖說明】
[0022] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根 據(jù)這些附圖獲得其他的附圖。
[0023] 圖1是本發(fā)明一種實施方式的央視臺標(biāo)的識別方法的流程圖;
[0024] 圖2是本發(fā)明一種實施方式的央視臺標(biāo)的識別方法的流程圖;
[0025] 圖3是本發(fā)明一種實施方式的央視臺標(biāo)的識別裝置的結(jié)構(gòu)框圖。
【具體實施方式】
[0026]下面結(jié)合附圖和實施例,對本發(fā)明的【具體實施方式】作進(jìn)一步詳細(xì)描述。以下實施 例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
[0027] 圖1是本發(fā)明一種實施方式的央視臺標(biāo)的識別方法的流程圖;參照圖1,所述方法 包括:
[0028] S101:獲取包括待識別臺標(biāo)的臺標(biāo)區(qū)域;
[0029] 需要說明的是,所述臺標(biāo)區(qū)域即為僅包括待識別臺標(biāo)的區(qū)域。
[0030] 可理解的是,所述臺標(biāo)區(qū)域可通過多種方式進(jìn)行提取,為了防止隨機(jī)噪聲、畫面噪 聲等噪聲對臺標(biāo)識別的影響,本實施方式中,通過以下步驟獲取包括待識別臺標(biāo)的臺標(biāo)區(qū) 域:
[0031] (1)從包括待識別臺標(biāo)的視頻的預(yù)設(shè)區(qū)域內(nèi)獲取視頻幀圖像序列;
[0032] 根據(jù)先驗知識,電視臺臺標(biāo)基本全部位于視頻幀圖像的左上角(當(dāng)然,若處于其他 位置,也可根據(jù)需要進(jìn)行適應(yīng)性調(diào)整即可),因此臺標(biāo)檢測時,只需提取固定的左上角區(qū)域 (即預(yù)設(shè)區(qū)域)作為臺標(biāo)檢測區(qū)域即可?,F(xiàn)有的臺標(biāo)識別方法一般按照最優(yōu)區(qū)域規(guī)則(GSR) 獲取臺標(biāo)區(qū)域,本實施方式與現(xiàn)有的臺標(biāo)識別方法不同之處在于:(1)計算所有臺標(biāo)在各視 頻幀圖像中有效識別的比例位置;(2)計算所有比例位置的最大范圍作為臺標(biāo)區(qū)域分割的 區(qū)域。以1920*1080的視頻為例,臺標(biāo)分割區(qū)域為--行開始位置80(1/24),列開始位置40 (1/27),行寬450(15/64),列寬180(1/6),區(qū)域分割效果如圖2和圖3所示,當(dāng)然,所述比例位 置可根據(jù)需要進(jìn)行適當(dāng)調(diào)整,本實施方式對此不加以限制。
[0033]為消除圖像中無關(guān)的信息、恢復(fù)或增強(qiáng)有用的相關(guān)信息,提高特征的可檢測性,最 大限度地簡化數(shù)據(jù),以確保識別的可靠性,本實施方式中,可對各視頻幀圖像進(jìn)行預(yù)處理, 所述預(yù)處理包括:區(qū)域分割、灰度化和圖像增強(qiáng)中的至少一種,當(dāng)然,還可包括其他處理過 程,本實施方式對此不加以限制。
[0034] 所述預(yù)處理可采用公式Gray = 0.33R+0.59G+0.11B進(jìn)行灰度化,當(dāng)然,也可通過三 通道平均值法或三通道最大值法等方式替代,其中,Gray為像素的灰度值,R為像素的紅色 分量,G為像素的綠色分量,B為像素的藍(lán)色分量。
[0035]所述圖像增強(qiáng)的目的是突出臺標(biāo)區(qū)域有效信息,如圖標(biāo)、文字、數(shù)字等,圖像增強(qiáng) 采用0~255灰度級的灰度拉伸,也可用直方圖變換法替代。
[0036] (2)對各視頻幀圖像進(jìn)行邊緣提??;
[0037]可理解的是,邊緣是圖像灰度變化劇烈之處,邊緣提取是臺標(biāo)識別的關(guān)鍵,邊緣的 完整程度直接影響臺標(biāo)識別結(jié)果,當(dāng)然,邊緣提取的方法有很多,如0&111^、11?、5〇1^1、拉普 拉斯算子法等。綜合考慮去噪、邊緣完整性、邊緣定位精度等要求,本實施方式中采用Canny 邊緣檢測方法。
[0038]在具體實現(xiàn)中,Canny邊緣檢測方法的參數(shù)設(shè)置為:弱邊緣閾值50,強(qiáng)邊緣閾值 200,當(dāng)然,也可根據(jù)需要進(jìn)行適當(dāng)浮動,例如,閾值在±10的范圍內(nèi)進(jìn)行浮動。
[0039] (3)將各視頻幀圖像的邊緣進(jìn)行合成;
[0040]在具體實現(xiàn)中,可根據(jù)所述視頻幀圖像的數(shù)量來確定對應(yīng)的預(yù)設(shè)圖像閾值,再根 據(jù)所述各邊緣點在視頻幀圖像的數(shù)量是否低于所述預(yù)設(shè)圖像閾值來判斷是否保留該邊緣 點。
[0041] 也就是說,預(yù)先建立視頻幀圖像的數(shù)量與預(yù)設(shè)圖像閾值之間的對應(yīng)關(guān)系,根據(jù)所 述視頻幀圖像的數(shù)量查找對應(yīng)關(guān)系,以確定對應(yīng)的預(yù)設(shè)圖像閾值,在具有各邊緣點在視頻 幀圖像的數(shù)量低于所述預(yù)設(shè)圖像閾值時,不保留該邊緣點,在各邊緣點在視頻幀圖像的數(shù) 量高于等于所述預(yù)設(shè)圖像閾值時,保留該邊緣點。
[0042] 下面以一個具體的實施例來說明將各視頻幀圖像的邊緣進(jìn)行合成,但不限定本發(fā) 明的保護(hù)范圍:設(shè)N為視頻幀圖像的數(shù)量,X為預(yù)設(shè)圖像閾值。
[0043] 當(dāng)N = 6時,相應(yīng)地,X = 4,也就是說,只有邊緣點在4個以上(包括4)的視頻幀圖像 中存在時才保留,若邊緣點在3個以下(包括3)的視頻幀圖像中存在時則舍棄;
[0044] 當(dāng)6>N>3時,相應(yīng)地,X = 3,也就是說,只有邊緣點在3個以上(包括3)的視頻幀圖像 中存在時才保留,若邊緣點在2個以下(包括2)的視頻幀圖像中存在時則舍棄;
[0045] 當(dāng)3時,相應(yīng)地,X = N,也就是說,只有邊緣點在所有視頻幀圖像中存在時才保 留,其他情況均舍棄。
[0046] 當(dāng)然,所述對應(yīng)關(guān)系中的參數(shù)可根據(jù)圖像的分辨率進(jìn)行調(diào)整,本實施方式對此不 加以限制。
[0047] 由于邊緣噪聲、黑邊和非必要文字等均會對識別準(zhǔn)確率造成影響,為進(jìn)一步提高 識別準(zhǔn)確率,可合成的邊緣進(jìn)行優(yōu)化處理,本實施方式中,所述優(yōu)化處理包括:邊緣噪聲刪 除、黑邊去除和非必要文字刪除中的至少一種。
[0048] (4)獲取合成的邊緣的最小外接矩陣;
[0049] (5)按照所述最小外接矩陣分別對各視頻幀圖像進(jìn)行分割,并將分割出的圖像通 過加權(quán)平均的方式進(jìn)行合成,以獲得包括待識別臺標(biāo)的臺標(biāo)區(qū)域。
[0050] S102:在所述待識別臺標(biāo)為央視臺標(biāo)時,提取所述臺標(biāo)區(qū)域中的數(shù)字區(qū)域;
[0051] 需要說明的是,所述央視臺標(biāo)包含標(biāo)志(即CCTV)、文字和數(shù)字,常見央視臺標(biāo)的差 異在于文字和數(shù)字。模式識別領(lǐng)域中,數(shù)字識別比文字識別容易、穩(wěn)定、快速。同時,央視臺 標(biāo)的數(shù)字可單獨描述具體頻道,從而本實施方式將去除臺標(biāo)區(qū)域中的文字(如"綜合"、"財 經(jīng)"等),提取臺標(biāo)區(qū)域中的數(shù)字(即1、2等)。其中,文字處于臺標(biāo)下方并與標(biāo)志有明顯的像 素間隔,可設(shè)置預(yù)設(shè)像素間隔,通過所述提取的邊緣中與標(biāo)志之間的像素間隔是否超過預(yù) 設(shè)像素間隔,在超過預(yù)設(shè)像素間隔時,則確認(rèn)為文字,對其進(jìn)行刪除,故而,下述臺標(biāo)區(qū)域即 為僅包括數(shù)字和標(biāo)志的區(qū)域。
[0052] 可理解的是,所述數(shù)字區(qū)域位于所述臺標(biāo)區(qū)域內(nèi),并且存在一定的位置關(guān)系,因 此,可預(yù)先建立所述臺標(biāo)區(qū)域和數(shù)字區(qū)域之間的位置關(guān)系,再根據(jù)所述數(shù)字區(qū)域的位置信 息對所述圖像進(jìn)行分割處理,以獲得所述數(shù)字區(qū)域。
[0053] 對于臺標(biāo)區(qū)域而言,數(shù)字區(qū)域和標(biāo)志區(qū)域(即CCTV所在區(qū)域)之間存在如下對應(yīng)關(guān) 系:
[0054] (1)數(shù)字區(qū)域位于標(biāo)志區(qū)域右側(cè),所占寬度大約等于標(biāo)志區(qū)域的1/4;
[0055] (2)數(shù)字區(qū)域和標(biāo)志區(qū)域中的字母等尚,約占央視臺標(biāo)整體尚度的0.8。
[0056] 故而,可根據(jù)所述臺標(biāo)區(qū)域和數(shù)字區(qū)域之間的位置關(guān)系提取所述臺標(biāo)區(qū)域中的數(shù) 字區(qū)域。
[0057] 另外,為了便于對數(shù)字區(qū)域中的數(shù)字進(jìn)行識別,可對所述數(shù)字區(qū)域中的數(shù)字部分 和背景部分進(jìn)行二值化處理,設(shè)數(shù)字部分設(shè)為白色,背景部分設(shè)為黑色。
[0058] 由于所述數(shù)字區(qū)域四個角的位置容易產(chǎn)生白色像素塊/點,并且所述數(shù)字區(qū)域中 還存在噪聲點,這些干擾信息會對數(shù)字識別造成影響,本實施方式中,可對二值化后的數(shù)字 區(qū)域進(jìn)行干擾信息刪除。
[0059] 在具體實現(xiàn)中,可根據(jù)以下方式刪除所述數(shù)字區(qū)域四個角的白色像素塊/點:設(shè)所 述數(shù)字區(qū)域的水平寬度為W(等于0.25Wa,Wa為所述臺標(biāo)區(qū)域的寬度)、豎直長度為Η(等于Ha, Ha為所述臺標(biāo)區(qū)域的高度),各像素點灰度值為gray(i,j),i為像素點豎直行坐標(biāo),j為像素 點水平列坐標(biāo),變換后的灰度值為Gray (i,j),
[0061] 對于所述數(shù)字區(qū)域中的噪聲點,則可進(jìn)行噪聲濾波,進(jìn)一步削弱和減少噪聲點影 響。
[0062] S103:對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別;
[0063] 可理解的是,對提取的數(shù)字區(qū)域進(jìn)行判別可通過多種方式,本實施方式中,按列對 所述數(shù)字區(qū)域中各像素的灰度值進(jìn)行投影,以構(gòu)成長度為所述數(shù)字區(qū)域水平寬度的投影向 量,在一列投影向量中具有超過預(yù)設(shè)數(shù)量的屬于數(shù)字部分的像素時,將該列投影向量進(jìn)行 標(biāo)識,若存在相鄰兩個被標(biāo)識的投影向量之間的最小距離大于預(yù)設(shè)距離,則將所述數(shù)字判 別結(jié)果設(shè)為兩位,否則將所述數(shù)字判別結(jié)果設(shè)為一位。
[0064] S104:根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字;
[0065] 為進(jìn)一步提高數(shù)字識別的效率,本實施方式中,可通過以下3個步驟根據(jù)位數(shù)判別 結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字:
[0066] (1)獲取數(shù)字區(qū)域中的白色像素區(qū)域A,并計算A的水平寬度w和豎直行寬h。如果h/ w>2,則該臺標(biāo)為CCTV-1的臺標(biāo)。否則進(jìn)入(2)。
[0067] (2)對所述數(shù)字區(qū)域進(jìn)行邊緣提取,如果按行*列分塊為m*n個子塊,具體如表1所 示。構(gòu)建邊緣點概率空間分布直方圖,與標(biāo)準(zhǔn)〇、2~9的數(shù)字圖像邊緣點概率空間分布直方 圖計算匹配概率。
[0068] 表1分塊參數(shù)
[0070] (3)根據(jù)數(shù)字判別結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字。如果數(shù)字判別結(jié)果為一位,則 臺標(biāo)為CCTV-1、CCTV-10~CCTV15的概率為0,如果數(shù)字判別結(jié)果為兩位,則臺標(biāo)為CCTV1~ CCTV9的概率均為0,從而完成所述數(shù)字區(qū)域中的數(shù)字識別。
[0071]考慮識別是否準(zhǔn)確的問題,本實施方式中,根據(jù)所述位數(shù)判別結(jié)果將所述數(shù)字區(qū) 域與標(biāo)準(zhǔn)數(shù)字進(jìn)行匹配,在最高匹配率和次高匹配率不相等時,按照所述最高匹配率對應(yīng) 的標(biāo)準(zhǔn)數(shù)字作為所述數(shù)字區(qū)域中的數(shù)字。
[0072] S105:將央視臺標(biāo)的標(biāo)志和識別的數(shù)字之間的組合作為識別結(jié)果。
[0073] 本實施方式不再采用臺標(biāo)全局識別,而是充分考慮央視臺標(biāo)的特點和數(shù)字信息, 獲取包括待識別臺標(biāo)的臺標(biāo)區(qū)域,在所述待識別臺標(biāo)為央視臺標(biāo)時,提取所述臺標(biāo)區(qū)域中 的數(shù)字區(qū)域,對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別,根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中的 數(shù)字,將央視臺標(biāo)的標(biāo)志和識別的數(shù)字之間的組合作為識別結(jié)果,從而降低了時間復(fù)雜度, 能夠?qū)ρ胍暸_標(biāo)進(jìn)行快速識別。
[0074] 圖2是本發(fā)明一種實施方式的央視臺標(biāo)的識別方法的流程圖;參照圖2,所述方法 包括:
[0075] S201:獲取包括待識別臺標(biāo)的臺標(biāo)區(qū)域;
[0076]步驟S201與圖1所示的實施方式的步驟S101相同,在此不再贅述。
[0077] S202:根據(jù)臺標(biāo)區(qū)域的長寬比、灰度和顏色判斷臺標(biāo)區(qū)域中的待識別臺標(biāo)是否為 央視臺標(biāo);
[0078] 可理解的是,判斷臺標(biāo)區(qū)域中的待識別臺標(biāo)是否為央視臺標(biāo)時,可采用多種方式, 為保證判斷的準(zhǔn)確率,本實施方式中,根據(jù)臺標(biāo)區(qū)域的長寬比、灰度和顏色判斷臺標(biāo)區(qū)域中 的待識別臺標(biāo)是否為央視臺標(biāo)。
[0079]研究發(fā)現(xiàn),央視臺標(biāo)相對衛(wèi)視臺標(biāo)、地方臺標(biāo)的特點和差異發(fā)現(xiàn):(1)長寬比差異, 央視臺標(biāo)的長寬比(長:豎直方向長度;寬:水平方向?qū)挾?普遍明顯小于其他臺標(biāo);(2)央視 臺標(biāo)的彩色圖有廣泛的白色像素特征,尤其表現(xiàn)在左側(cè)2/3處;(3)央視臺標(biāo)的灰度圖分塊 后,子塊之間滿足灰度接近的相關(guān)約束,如均值、方差等。
[0080] 故而,可通過所述臺標(biāo)區(qū)域的長寬比、灰度和顏色的不同來對所述臺標(biāo)區(qū)域進(jìn)行 分類。
[0081] 由于長寬比是臺標(biāo)最直接的特征之一。故而,可先對所述臺標(biāo)區(qū)域通過長寬比進(jìn) 行初步判斷,也就是說,先計算各臺標(biāo)區(qū)域的長寬比,計算長寬比的方法為:計算臺標(biāo)區(qū)域 的長度Η和寬度W,長寬比ratio=W/H。
[0082] 央視臺標(biāo)的rat i 〇通常在0.3以下,故而,可構(gòu)建的初步判斷條件為:rat i 〇〈0.3。但 是,內(nèi)蒙古衛(wèi)視、重慶衛(wèi)視、北京衛(wèi)視等衛(wèi)視臺(包括這些衛(wèi)視的地方臺)臺標(biāo)的ratio均在 〇. 3以下,故而,可通過長寬比篩選后,再通過灰度和顏色進(jìn)行再次篩選。
[0083] 通過灰度和顏色進(jìn)行再次篩選時,可根據(jù)以下判斷條件進(jìn)行分類,也就是說,設(shè)置 以下用于進(jìn)一步判斷的條件:
[0084] (1)所述臺標(biāo)區(qū)域左上角的第一預(yù)設(shè)范圍內(nèi)的紅色分量和所述臺標(biāo)區(qū)域右下角的 第二預(yù)設(shè)范圍內(nèi)的紅色分量的均值小于預(yù)設(shè)紅色分量。
[0085]也就是說,可將臺標(biāo)區(qū)域按行*列分為5*3子塊(當(dāng)然,也可通過6*3或4*3等方式進(jìn) 行分塊),提取左上角的第一個子塊areal(即第一預(yù)設(shè)范圍)和右下角的第一個子塊area2 (即第二預(yù)設(shè)范圍)。央視臺標(biāo)和重慶衛(wèi)視臺標(biāo)、北京衛(wèi)視臺標(biāo)等在這兩個區(qū)域的紅色分布 截然不同。
[0086 ] 綜合干擾臺標(biāo)和央視臺標(biāo)的顏色特征,可構(gòu)建條件1 (即Condi t i on 1)--area 1和 area2的紅色均值小于150。
[0087] (2)所述臺標(biāo)區(qū)域左側(cè)第三預(yù)設(shè)范圍內(nèi)的灰度均值小于預(yù)設(shè)灰度值。
[0088] 考慮Conditionl的容錯性和央視臺標(biāo)半透明的特點,取子塊area3。可以臺標(biāo)區(qū)域 的寬度方向50個像素為標(biāo)準(zhǔn),取臺標(biāo)區(qū)域最左8列像素(即寬的4/25)構(gòu)成area3(即第三預(yù) 設(shè)范圍)。
[0089] 分析干擾臺標(biāo)和CCTV臺標(biāo)在area3的灰度差異,構(gòu)建條件2(Condition2)-- area3的灰度均值小于100。
[0090] 可理解的是,可通過三通道經(jīng)典合成法Gray = 0 · 33R+0 · 59G+0 · 11B來獲得灰度圖 像,也可通過三通道最大值法、三通道平均值法等,本實施方式對此不加以限制。
[0091] (3)將所述臺標(biāo)區(qū)域分割為至少4個部分,分割后的預(yù)設(shè)部分之間的像素均值的絕 對差不超過預(yù)設(shè)絕對差;
[0092] 由于Conditionl和Condition2只包含了各子塊的自身信息,需將約束擴(kuò)展至子塊 間的關(guān)系。分析發(fā)現(xiàn),臺標(biāo)區(qū)域中的文字、數(shù)字像素主要位于臺標(biāo)區(qū)域的后1/3列。為此,將 臺標(biāo)區(qū)域按照行*列分為2*3子塊(當(dāng)然,也可通過3*3等方式進(jìn)行分塊),取前2*2子塊(即分 割后的預(yù)設(shè)部分)分別表不為
[0093] 多樣本嚴(yán)格計算發(fā)現(xiàn),CCTV臺標(biāo)在這4個子塊處基本如下條件:
[0094] 條件 3(Condition3)--area4、area5、area6 和 area7 的均值之絕對差不超過 100〇
[0095] (4)分割后的預(yù)設(shè)部分之間的像素均值的方差不超過預(yù)設(shè)方差。
[0096] 也就是說,以上4個子塊的像素均值的方差均有不同,故而,CCTV臺標(biāo)在這4個子塊 處滿足如下條件:
[0097] 條件4(Condition4)--&代&4、&代&5、&代&6和&代&7的均值序列之方差不超過 1600〇
[0098] 某臺標(biāo)樣本同時滿足以上Conditionl~Condition4時,可將其判斷為央視臺標(biāo), 否則判斷為非央視臺標(biāo)。上述條件同時判斷時,準(zhǔn)確率最高,實驗證明,缺少任意一項條件 均會提高多樣本分類的錯誤率。
[0099] S203:在所述待識別臺標(biāo)為央視臺標(biāo)時,提取所述臺標(biāo)區(qū)域中的數(shù)字區(qū)域;
[0100] S204:對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別;
[0101] S205:根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字;
[0102] S206:將央視臺的臺標(biāo)和識別的數(shù)字之間的組合作為識別結(jié)果。
[0103] 步驟S203~S206與圖1所示的實施方式的步驟S102~S105相同,在此不再贅述。
[0104] 經(jīng)蒙特卡洛試驗,通過本實施方式的方法對CCTV1~CCTV15的識別結(jié)果如表2所 示,表2給出了各CCTV臺標(biāo)的識別時間,均在1 s左右。表2驗證了本實施方式的方法的高精 度、快速和穩(wěn)定性。
[0105] CCTV3、5、6、8的識別失敗概率最高,在5 %以內(nèi)。原因在于:3和8非常接近,5和6比 較接近,邊緣分塊空間分布直方圖的差異只有1~2個子塊,易造成最高匹配率和次高率相 同。
[0106] 表2 CCTV電視臺臺標(biāo)的識別結(jié)果
[0109] 對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域 技術(shù)人員應(yīng)該知悉,本發(fā)明實施例并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明實施 例,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書 中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作并不一定是本發(fā)明實施例所必須的。
[0110] 圖3是本發(fā)明一種實施方式的央視臺標(biāo)的識別裝置的結(jié)構(gòu)框圖;參照圖3,所述裝 置包括:
[0111] 區(qū)域獲取單元301,用于獲取包括待識別臺標(biāo)的臺標(biāo)區(qū)域;
[0112] 區(qū)域提取單元302,用于在所述待識別臺標(biāo)為央視臺標(biāo)時,提取所述臺標(biāo)區(qū)域中的 數(shù)字區(qū)域;
[0113] 位數(shù)判別單元303,用于對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別;
[0114] 數(shù)字識別單元304,用于根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字;
[0115]結(jié)果獲取單元305,用于將央視臺標(biāo)的標(biāo)志和識別的數(shù)字之間的組合作為所述待 識別臺標(biāo)的識別結(jié)果。
[0116] 在本發(fā)明的一種可選實施例中,所述位數(shù)判別單元,進(jìn)一步用于按列對所述數(shù)字 區(qū)域中各像素的灰度值進(jìn)行投影,以構(gòu)成長度為所述數(shù)字區(qū)域水平寬度的投影向量,在當(dāng) 前列投影向量中具有超過預(yù)設(shè)數(shù)量的屬于數(shù)字部分的像素時,將所述當(dāng)前列投影向量進(jìn)行 標(biāo)識,若存在相鄰兩個被標(biāo)識的投影向量之間的最小距離大于預(yù)設(shè)距離,則將所述數(shù)字判 別結(jié)果設(shè)為兩位,否則將所述數(shù)字判別結(jié)果設(shè)為一位。
[0117] 在本發(fā)明的一種可選實施例中,所述數(shù)字識別單元,進(jìn)一步用于根據(jù)所述位數(shù)判 別結(jié)果將所述數(shù)字區(qū)域與標(biāo)準(zhǔn)數(shù)字進(jìn)行匹配,在最高匹配率和次高匹配率不相等時,按照 所述最高匹配率對應(yīng)的標(biāo)準(zhǔn)數(shù)字作為所述數(shù)字區(qū)域中的數(shù)字。
[0118] 在本發(fā)明的一種可選實施例中,所述區(qū)域獲取單元,進(jìn)一步用于從包括待識別臺 標(biāo)的視頻的預(yù)設(shè)區(qū)域內(nèi)獲取視頻幀圖像序列,對各視頻幀圖像進(jìn)行邊緣提取,將各視頻幀 圖像的邊緣進(jìn)行合成,獲取合成的邊緣的最小外接矩陣,按照所述最小外接矩陣分別對各 視頻幀圖像進(jìn)行分割,并將分割出的圖像通過加權(quán)平均的方式進(jìn)行合成,以獲得包括待識 別臺標(biāo)的臺標(biāo)區(qū)域。
[0119] 在本發(fā)明的一種可選實施例中,所述裝置還包括:
[0120] 臺標(biāo)分類單元,用于根據(jù)臺標(biāo)區(qū)域的長寬比、灰度和顏色判斷臺標(biāo)區(qū)域中的待識 別臺標(biāo)是否為央視臺標(biāo)。
[0121] 對于系統(tǒng)實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān) 之處參見方法實施例的部分說明即可。
[0122] 應(yīng)當(dāng)注意的是,在本發(fā)明的系統(tǒng)的各個部件中,根據(jù)其要實現(xiàn)的功能而對其中的 部件進(jìn)行了邏輯劃分,但是,本發(fā)明不受限于此,可以根據(jù)需要對各個部件進(jìn)行重新劃分或 者組合,例如,可以將一些部件組合為單個部件,或者可以將一些部件進(jìn)一步分解為更多的 子部件。
[0123] 本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行 的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實踐中使用 微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的系統(tǒng)中的一些或者全部部 件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全 部的設(shè)備或者裝置程序(例如,計算機(jī)程序和計算機(jī)程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序 可以存儲在計算機(jī)可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以 從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0124] 應(yīng)該注意的是上述實施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng) 域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中, 不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞"包含"不排除存在未 列在權(quán)利要求中的元件或步驟。位于元件之前的單詞"一"或"一個"不排除存在多個這樣的 元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計算機(jī)來實 現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項 來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名 稱。
[0125]以上實施例僅適于說明本發(fā)明,而并非對本發(fā)明的限制,有關(guān)技術(shù)領(lǐng)域的普通技 術(shù)人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等 同的技術(shù)方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護(hù)范圍應(yīng)由權(quán)利要求限定。
【主權(quán)項】
1. 一種央視臺標(biāo)的識別方法,其特征在于,所述方法包括: 獲取包括待識別臺標(biāo)的臺標(biāo)區(qū)域; 在所述待識別臺標(biāo)為央視臺標(biāo)時,提取所述臺標(biāo)區(qū)域中的數(shù)字區(qū)域; 對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別; 根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字; 將央視臺標(biāo)的標(biāo)志和識別的數(shù)字之間的組合作為所述待識別臺標(biāo)的識別結(jié)果。2. 如權(quán)利要求1所述的方法,其特征在于,所述對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別,進(jìn)一 步包括: 按列對所述數(shù)字區(qū)域中各像素的灰度值進(jìn)行投影,以構(gòu)成長度為所述數(shù)字區(qū)域水平寬 度的投影向量,在當(dāng)前列投影向量中具有超過預(yù)設(shè)數(shù)量的屬于數(shù)字部分的像素時,將所述 當(dāng)前列投影向量進(jìn)行標(biāo)識,若存在相鄰兩個被標(biāo)識的投影向量之間的最小距離大于預(yù)設(shè)距 離,則將所述數(shù)字判別結(jié)果設(shè)為兩位,否則將所述數(shù)字判別結(jié)果設(shè)為一位。3. 如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中 的數(shù)字,進(jìn)一步包括: 根據(jù)所述位數(shù)判別結(jié)果將所述數(shù)字區(qū)域與標(biāo)準(zhǔn)數(shù)字進(jìn)行匹配,在最高匹配率和次高匹 配率不相等時,按照所述最高匹配率對應(yīng)的標(biāo)準(zhǔn)數(shù)字作為所述數(shù)字區(qū)域中的數(shù)字。4. 如權(quán)利要求1~3中任一項所述的方法,其特征在于,所述獲取包括待識別臺標(biāo)的臺 標(biāo)區(qū)域,進(jìn)一步包括: 從包括待識別臺標(biāo)的視頻的預(yù)設(shè)區(qū)域內(nèi)獲取視頻幀圖像序列,對各視頻幀圖像進(jìn)行邊 緣提取,將各視頻幀圖像的邊緣進(jìn)行合成,獲取合成的邊緣的最小外接矩陣,按照所述最小 外接矩陣分別對各視頻幀圖像進(jìn)行分割,并將分割出的圖像通過加權(quán)平均的方式進(jìn)行合 成,以獲得包括待識別臺標(biāo)的臺標(biāo)區(qū)域。5. 如權(quán)利要求1~3中任一項所述的方法,其特征在于,所述在所述待識別臺標(biāo)為央視 臺標(biāo)時,提取所述臺標(biāo)區(qū)域中的數(shù)字區(qū)域之前,所述方法還包括: 根據(jù)臺標(biāo)區(qū)域的長寬比、灰度和顏色判斷臺標(biāo)區(qū)域中的待識別臺標(biāo)是否為央視臺標(biāo)。6. -種央視臺標(biāo)的識別裝置,其特征在于,所述裝置包括: 區(qū)域獲取單元,用于獲取包括待識別臺標(biāo)的臺標(biāo)區(qū)域; 區(qū)域提取單元,用于在所述待識別臺標(biāo)為央視臺標(biāo)時,提取所述臺標(biāo)區(qū)域中的數(shù)字區(qū) 域; 位數(shù)判別單元,用于對提取的數(shù)字區(qū)域進(jìn)行位數(shù)判別; 數(shù)字識別單元,用于根據(jù)位數(shù)判別結(jié)果識別所述數(shù)字區(qū)域中的數(shù)字; 結(jié)果獲取單元,用于將央視臺標(biāo)的標(biāo)志和識別的數(shù)字之間的組合作為所述待識別臺標(biāo) 的識別結(jié)果。7. 如權(quán)利要求6所述的裝置,其特征在于,所述位數(shù)判別單元,進(jìn)一步用于按列對所述 數(shù)字區(qū)域中各像素的灰度值進(jìn)行投影,以構(gòu)成長度為所述數(shù)字區(qū)域水平寬度的投影向量, 在當(dāng)前列投影向量中具有超過預(yù)設(shè)數(shù)量的屬于數(shù)字部分的像素時,將所述當(dāng)前列投影向量 進(jìn)行標(biāo)識,若存在相鄰兩個被標(biāo)識的投影向量之間的最小距離大于預(yù)設(shè)距離,則將所述數(shù) 字判別結(jié)果設(shè)為兩位,否則將所述數(shù)字判別結(jié)果設(shè)為一位。8. 如權(quán)利要求6所述的裝置,其特征在于,所述數(shù)字識別單元,進(jìn)一步用于根據(jù)所述位 數(shù)判別結(jié)果將所述數(shù)字區(qū)域與標(biāo)準(zhǔn)數(shù)字進(jìn)行匹配,在最高匹配率和次高匹配率不相等時, 按照所述最高匹配率對應(yīng)的標(biāo)準(zhǔn)數(shù)字作為所述數(shù)字區(qū)域中的數(shù)字。9. 如權(quán)利要求6~8中任一項所述的裝置,其特征在于,所述區(qū)域獲取單元,進(jìn)一步用于 從包括待識別臺標(biāo)的視頻的預(yù)設(shè)區(qū)域內(nèi)獲取視頻幀圖像序列,對各視頻幀圖像進(jìn)行邊緣提 取,將各視頻幀圖像的邊緣進(jìn)行合成,獲取合成的邊緣的最小外接矩陣,按照所述最小外接 矩陣分別對各視頻幀圖像進(jìn)行分割,并將分割出的圖像通過加權(quán)平均的方式進(jìn)行合成,以 獲得包括待識別臺標(biāo)的臺標(biāo)區(qū)域。10. 如權(quán)利要求6~8中任一項所述的裝置,其特征在于,所述裝置還包括: 臺標(biāo)分類單元,用于根據(jù)臺標(biāo)區(qū)域的長寬比、灰度和顏色判斷臺標(biāo)區(qū)域中的待識別臺 標(biāo)是否為央視臺標(biāo)。
【文檔編號】G06K9/32GK105868681SQ201510823560
【公開日】2016年8月17日
【申請日】2015年11月24日
【發(fā)明人】何小坤
【申請人】樂視致新電子科技(天津)有限公司