本發(fā)明涉及電子
技術(shù)領(lǐng)域:
,尤其涉及一種多媒體處理方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
:在多媒體分享時,人們喜歡對多媒體進(jìn)行各種個性化編輯處理,例如增加字幕、增加圖標(biāo)、增加logo、涂鴉等。這些編輯處理能夠大大地豐富多媒體內(nèi)容,滿足用戶的個性化需求。目前的多媒體編輯通常是采用后處理方式,即拍攝完多媒體后通過用戶終端上的編輯軟件對多媒體進(jìn)行個性化編輯處理,但由于無法獲知多媒體內(nèi)容中所包含的各種屬性信息,而僅僅是對多媒體本身進(jìn)行處理,使得多媒體編輯處理的形式比較局限,降低了多媒體編輯處理的多樣性。技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例提供一種多媒體處理方法、裝置、電子設(shè)備及存儲介質(zhì),可以解決多媒體編輯處理形式單一的問題。本發(fā)明實(shí)施例第一方面提供了一種多媒體處理方法,包括:識別目標(biāo)多媒體中包含的目標(biāo)對象;獲取所述目標(biāo)對象對應(yīng)的屬性值;生成與所述屬性值對應(yīng)的指示信息,并將所述指示信息添加到所述目標(biāo)多媒體中??蛇x的,所述獲取所述目標(biāo)對象對應(yīng)的屬性值,包括:根據(jù)預(yù)設(shè)對象和預(yù)設(shè)屬性值的對應(yīng)關(guān)系,在預(yù)設(shè)的數(shù)據(jù)庫中查找所述目標(biāo)對象對應(yīng)的屬性值??蛇x的,所述將所述指示信息添加到所述目標(biāo)多媒體中之后,還包括:采用預(yù)設(shè)顯示方式在所述目標(biāo)多媒體中顯示所述指示信息,所述預(yù)設(shè)顯示方式包括預(yù)設(shè)顯示位置和預(yù)設(shè)顯示效果??蛇x的,所述目標(biāo)多媒體包括多幀圖像;所述識別目標(biāo)多媒體中包含的目標(biāo)對象,包括:采用圖像識別算法分別對所述多幀圖像中的每幀圖像中包含的目標(biāo)對象進(jìn)行識別??蛇x的,所述方法還包括:接收針對所述指示信息的操作指令,所述操作指令包括放大指令、縮小指令、修改指令以及刪除指令中的任一種;根據(jù)所述操作指令對所述指示信息進(jìn)行操作。本發(fā)明實(shí)施例第二方面提供了一種多媒體處理裝置,所述裝置包括:對象識別模塊,用于識別目標(biāo)多媒體中包含的目標(biāo)對象;信息獲取模塊,用于獲取所述目標(biāo)對象對應(yīng)的屬性值;信息添加模塊,用于生成與所述屬性值對應(yīng)的指示信息,并將所述指示信息添加到所述目標(biāo)多媒體中??蛇x的,所述信息獲取模塊具體用于:根據(jù)預(yù)設(shè)對象和預(yù)設(shè)屬性值的對應(yīng)關(guān)系,在預(yù)設(shè)的數(shù)據(jù)庫中查找所述目標(biāo)對象對應(yīng)的屬性值。可選的,所述裝置還包括:信息顯示模塊,用于采用預(yù)設(shè)顯示方式在所述目標(biāo)多媒體中顯示所述指示信息,所述預(yù)設(shè)顯示方式包括預(yù)設(shè)顯示位置和預(yù)設(shè)顯示效果。可選的,所述目標(biāo)多媒體包括多幀圖像;所述對象識別模塊具體用于:采用圖像識別算法分別對所述多幀圖像中的每幀圖像中包含的目標(biāo)對象進(jìn)行識別??蛇x的,所述裝置還包括:指令接收模塊,用于接收針對所述指示信息的操作指令,所述操作指令包括放大指令、縮小指令、修改指令以及刪除指令中的任一種;操作執(zhí)行模塊,用于根據(jù)所述操作指令對所述指示信息進(jìn)行操作。本發(fā)明實(shí)施例第三方面提供一種計(jì)算機(jī)存儲介質(zhì),其特征在于,所述計(jì)算機(jī)存儲介質(zhì)存儲有多條指令,所述指令適于由處理器加載并執(zhí)行上述第一方面的方法。本發(fā)明實(shí)施例第四方面提供一種電子設(shè)備,包括:處理器和存儲器;其中,所述存儲器存儲有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時實(shí)現(xiàn)上述第一方面的方法。本發(fā)明實(shí)施例第五方面提供一種應(yīng)用程序,包括程序指令,所述程序指令當(dāng)被執(zhí)行時用于執(zhí)行上述第一方面的方法。在本發(fā)明實(shí)施中,多媒體處理裝置通過識別目標(biāo)多媒體中包含的目標(biāo)對象,并獲取目標(biāo)對象對應(yīng)的屬性值,生成與屬性值對應(yīng)的指示信息后將該指示信息添加到目標(biāo)多媒體中?,F(xiàn)有技術(shù)中由于無法獲知多媒體內(nèi)容中所包含的各種屬性信息,而僅僅能對多媒體本身進(jìn)行處理,與現(xiàn)有技術(shù)相比,本發(fā)明可以自動采集多媒體內(nèi)容中所包含的各種屬性信息,并可將這些屬性信息添加至多媒體中,豐富了多媒體編輯處理形式,增加了多媒體編輯處理的多樣性。附圖說明為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施例提供的一種多媒體處理方法的流程示意圖;圖2是本發(fā)明實(shí)施例提供的另一種多媒體處理方法的流程示意圖;圖3是本發(fā)明實(shí)施例提供的一種目標(biāo)多媒體的界面示意圖;圖4(a)是本發(fā)明實(shí)施例提供的一種指示信息顯示方式的界面示意圖;圖4(b)是本發(fā)明實(shí)施例提供的另一種指示信息顯示方式的界面示意圖;圖5是本發(fā)明實(shí)施例提供的一種多媒體處理裝置的結(jié)構(gòu)示意圖;圖6是本發(fā)明實(shí)施例提供的另一種多媒體處理裝置的結(jié)構(gòu)示意圖;圖7是本發(fā)明實(shí)施例提供的一種電子設(shè)備的結(jié)構(gòu)示意圖。具體實(shí)施方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有付出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。需要說明的是,在本發(fā)明實(shí)施例中使用的術(shù)語是僅僅出于描述特定實(shí)施例的目的,而非旨在限制本發(fā)明。在本發(fā)明實(shí)施例和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義。還應(yīng)當(dāng)理解,本文中使用的術(shù)語“和/或”是指并包含一個或多個相關(guān)聯(lián)的列出項(xiàng)目的任何或所有可能組合。另外,本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”、“第三”和“第四”等是用于區(qū)別不同對象,而不是用于描述特定順序。此外,術(shù)語“包括”和“具有”以及它們?nèi)魏巫冃?,意圖在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備沒有限定于已列出的步驟或單元,而是可選地還包括沒有列出的步驟或單元,或可選地還包括對于這些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。本發(fā)明實(shí)施例提供的多媒體處理方法可以應(yīng)用于多媒體個性化編輯應(yīng)用場景,例如:多媒體處理裝置通過識別目標(biāo)多媒體中包含的目標(biāo)對象,并獲取目標(biāo)對象對應(yīng)的屬性值,生成與屬性值對應(yīng)的指示信息后將該指示信息添加到目標(biāo)多媒體中?,F(xiàn)有技術(shù)中由于無法獲知多媒體內(nèi)容中所包含的各種屬性信息,而僅僅能對多媒體本身進(jìn)行處理,與現(xiàn)有技術(shù)相比,本發(fā)明可以自動采集多媒體內(nèi)容中所包含的各種屬性信息,并可將這些屬性信息添加至多媒體中,豐富了多媒體編輯處理形式,增加了多媒體編輯處理的多樣性。本發(fā)明實(shí)施例涉及的多媒體處理裝置可以是任何具備存儲和通信功能的設(shè)備,例如:平板電腦、手機(jī)、電子閱讀器、個人計(jì)算機(jī)(personalcomputer,pc)、筆記本電腦、車載設(shè)備、網(wǎng)絡(luò)電視、可穿戴設(shè)備等設(shè)備。下面將結(jié)合附圖1-附圖4,對本發(fā)明實(shí)施例提供的多媒體處理方法進(jìn)行詳細(xì)介紹。請參見圖1,為本發(fā)明實(shí)施例提供了一種多媒體處理方法的流程示意圖。如圖1所示,本發(fā)明實(shí)施例的所述方法可以包括以下步驟s101-步驟s103。s101,識別目標(biāo)多媒體中包含的目標(biāo)對象。具體的,所述目標(biāo)多媒體可以為所拍攝的圖片或視頻,在目標(biāo)多媒體中可以包括背景區(qū)域以及對象。所述識別目標(biāo)多媒體中包含的目標(biāo)對象,可以理解的是,多媒體處理裝置可采用圖像識別技術(shù)識別目標(biāo)對象。其中,圖像識別是指利用計(jì)算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。一般工業(yè)使用中,采用工業(yè)相機(jī)拍攝圖片,然后再利用軟件根據(jù)圖片灰階差做進(jìn)一步識別處理,圖像識別軟件國外代表的有康耐視等,國內(nèi)代表的有圖智能等。其中,常見的一種圖像識別技術(shù)為“泛魔”識別模型,它是一種以特征分析為基礎(chǔ)的圖像識別系統(tǒng)?!胺耗А弊R別模型系統(tǒng)的圖像識別共有4個層次。第一層是執(zhí)行最簡單任務(wù)的“映象鬼”,它們只記錄外界的原始形象,正像視網(wǎng)膜獲得外界刺激的映象,然后由“特征鬼”進(jìn)一步分析這個映象。在分析過程中,每個“特征鬼”都去尋找與自己有關(guān)的圖像特征。例如,在識別英文字母時,每個特征鬼負(fù)責(zé)報(bào)告字母的一種特征及其數(shù)量,如垂直線、水平線、斜線、直角、銳角,不連續(xù)曲線和連續(xù)曲線等;再由“認(rèn)知鬼”接收“特征鬼”的反應(yīng),每個“認(rèn)知鬼”都從“特征鬼”的反應(yīng)中尋找與自己負(fù)責(zé)識別的圖像有關(guān)的特征,發(fā)現(xiàn)了這種特征時它就“叫喊”,發(fā)現(xiàn)的特征越多,“叫喊”聲越大;最后,“決策鬼”根據(jù)許多“認(rèn)知鬼”“叫喊”聲的大小,選擇叫喊聲最大的“認(rèn)知鬼”的反應(yīng)作為所要識別的圖像。例如,在識別字母r時,“映象鬼”先對r進(jìn)行編碼,把信息傳遞給"特征鬼"作進(jìn)一步加工,這時會有5個“特征鬼”分別報(bào)告圖像所包括的一條垂線、兩條水平線,一條斜線,三個直角和一條不連續(xù)曲線。然后許多"認(rèn)知鬼"則根據(jù)所報(bào)告的這些特征及其數(shù)量來識別是否是自己負(fù)責(zé)的字母。這時d、p、r鬼都會有反應(yīng),但p鬼只有4個特征與其符合,并有一特征(斜線)與其不符合;d鬼只有3個特征與其符合,并有兩個特征(斜線、直角)與其不符合;只有r鬼有5個特征與其符合,而且這5個特征又包括了r的全部特征,所以r鬼的叫喊聲最大,因此“決策鬼”就很容易地作出選擇r的決定。另外,形狀匹配算法也是一種常見的圖像識別技術(shù),形狀是用于目標(biāo)識別的重要特征,也是對目標(biāo)范圍的二值圖像的表示。通常其表示方式分兩類,編碼方式,如鏈碼、游程碼、freeman碼等;簡化方式,如差值、多項(xiàng)式、多邊形逼近、和特征點(diǎn)檢測等。通過特征計(jì)算能夠提取出圖像中特定形狀的目標(biāo)。目前有很多成熟算法能夠輕松提取出圓形、方形、三角形等目標(biāo)。例如,一種基于加窗hough變換的圓形檢測算法。檢測原理為:檢測出圓形形狀之后,得到圓的半徑值,和目標(biāo)圓形形狀半徑值進(jìn)行相似性比對。再例如,一種基于加窗hough變換的任意三角形檢測算法。檢測原理為:在圖像中選擇適當(dāng)大小的窗口,以窗口中心為坐標(biāo)原點(diǎn)對窗口內(nèi)圖像作hough變化,在圖像的hough域中檢測直線段,滑動窗口,從檢測出的直線段中找出滿足三角形條件的線段組合,然后定位這些線段構(gòu)成的三角形。改變線段的長度條件或者角度條件還可以檢測直角三角形,等腰三角形,等邊三角形等特殊三角形。再例如,一種島校檢測圖像中是否有三角形的算法。該方法利用區(qū)域填充及三角形三邊的長度面積之間的關(guān)系實(shí)現(xiàn)三角形目標(biāo)檢測??蛇x的,所述目標(biāo)多媒體包括多幀圖像,則采用圖像識別算法分別對所述多幀圖像中的每幀圖像中包含的目標(biāo)對象進(jìn)行識別。可選的,若所述目標(biāo)多媒體中包含有相同的目標(biāo)對象,則將其中的任一個作為目標(biāo)對象。s102,獲取所述目標(biāo)對象對應(yīng)的屬性值。具體的,所述目標(biāo)對象可以為對象標(biāo)識或?qū)ο蟮刂?。其中,所述對象?biāo)識可以為對象的形狀或名稱,所述對象地址是關(guān)于目標(biāo)對象在服務(wù)器上的存儲地址,如統(tǒng)一資源定位符(uniformresourcelocator,url)。所述屬性值可以包括對象熱量值、對象種類、對象尺寸、對象產(chǎn)地、對象功能等相關(guān)信息。在一種可行的實(shí)施方式中,所述多媒體處理裝置根據(jù)預(yù)設(shè)對象和預(yù)設(shè)屬性值的對應(yīng)關(guān)系,在預(yù)設(shè)的數(shù)據(jù)庫中查找所述目標(biāo)對象對應(yīng)的屬性值。在另一種可行的實(shí)施方式中,所述多媒體處理裝置訪問目標(biāo)對象的存儲地址對應(yīng)的網(wǎng)頁信息,對該網(wǎng)頁信息進(jìn)行解析以提取目標(biāo)對象的屬性值。在又一種可行的實(shí)施方式中,所述多媒體處理裝置向網(wǎng)絡(luò)服務(wù)器發(fā)送目標(biāo)對象的屬性值查找請求,并接收網(wǎng)絡(luò)服務(wù)器反饋的查找結(jié)果??蛇x的,所述查找請求中可攜帶所述目標(biāo)對象的對象標(biāo)識,以使網(wǎng)絡(luò)服務(wù)器查找對象標(biāo)識對應(yīng)的屬性值。s103,生成與所述屬性值對應(yīng)的指示信息,并將所述指示信息添加到所述目標(biāo)多媒體中。具體的,多媒體處理裝置生成標(biāo)識屬性值的指示信息后,將該指示信息添加到目標(biāo)多媒體中。所述指示信息可以為標(biāo)簽,也可以為列表,可將所述指示信息添加到所述目標(biāo)對象所在的位置或預(yù)設(shè)位置。若在同一目標(biāo)多媒體中包括多個目標(biāo)對象,則將生成的指示信息分別添加到對應(yīng)的對象所在的位置或預(yù)設(shè)位置。在本發(fā)明實(shí)施中,多媒體處理裝置通過識別目標(biāo)多媒體中包含的目標(biāo)對象,并獲取目標(biāo)對象對應(yīng)的屬性值,生成與屬性值對應(yīng)的指示信息后將該指示信息添加到目標(biāo)多媒體中?,F(xiàn)有技術(shù)中由于無法獲知多媒體內(nèi)容中所包含的各種屬性信息,而僅僅能對多媒體本身進(jìn)行處理,與現(xiàn)有技術(shù)相比,本發(fā)明可以自動采集多媒體內(nèi)容中所包含的各種屬性信息,并可將這些屬性信息添加至多媒體中,豐富了多媒體編輯處理形式,增加了多媒體編輯處理的多樣性。請參見圖2,為本發(fā)明實(shí)施例提供了另一種多媒體處理方法的流程示意圖。如圖2所示,本發(fā)明實(shí)施例的所述方法可以包括以下步驟s201-步驟s206。s201,識別目標(biāo)多媒體中包含的目標(biāo)對象。具體的,所述目標(biāo)多媒體可以為所拍攝的圖片或視頻,在目標(biāo)多媒體中可以包括背景區(qū)域以及對象。如圖3所示的圖片a,其中a1、a2和a3為a中所包含的目標(biāo)對象,其余部分為背景區(qū)域。具體實(shí)施中,多媒體處理裝置可采用圖像識別技術(shù)識別目標(biāo)對象。其中,圖像識別是指利用計(jì)算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。一般工業(yè)使用中,采用工業(yè)相機(jī)拍攝圖片,然后再利用軟件根據(jù)圖片灰階差做進(jìn)一步識別處理,圖像識別軟件國外代表的有康耐視等,國內(nèi)代表的有圖智能等。其中,常見的一種圖像識別技術(shù)為“泛魔”識別模型,它是一種以特征分析為基礎(chǔ)的圖像識別系統(tǒng)?!胺耗А弊R別模型系統(tǒng)的圖像識別共有4個層次。第一層是執(zhí)行最簡單任務(wù)的“映象鬼”,它們只記錄外界的原始形象,正像視網(wǎng)膜獲得外界刺激的映象,然后由“特征鬼”進(jìn)一步分析這個映象。在分析過程中,每個“特征鬼”都去尋找與自己有關(guān)的圖像特征。例如,在識別英文字母時,每個特征鬼負(fù)責(zé)報(bào)告字母的一種特征及其數(shù)量,如垂直線、水平線、斜線、直角、銳角,不連續(xù)曲線和連續(xù)曲線等;再由“認(rèn)知鬼”接收“特征鬼”的反應(yīng),每個“認(rèn)知鬼”都從“特征鬼”的反應(yīng)中尋找與自己負(fù)責(zé)識別的圖像有關(guān)的特征,發(fā)現(xiàn)了這種特征時它就“叫喊”,發(fā)現(xiàn)的特征越多,“叫喊”聲越大;最后,“決策鬼”根據(jù)許多“認(rèn)知鬼”“叫喊”聲的大小,選擇叫喊聲最大的“認(rèn)知鬼”的反應(yīng)作為所要識別的圖像。例如,在識別字母r時,“映象鬼”先對r進(jìn)行編碼,把信息傳遞給"特征鬼"作進(jìn)一步加工,這時會有5個“特征鬼”分別報(bào)告圖像所包括的一條垂線、兩條水平線,一條斜線,三個直角和一條不連續(xù)曲線。然后許多"認(rèn)知鬼"則根據(jù)所報(bào)告的這些特征及其數(shù)量來識別是否是自己負(fù)責(zé)的字母。這時d、p、r鬼都會有反應(yīng),但p鬼只有4個特征與其符合,并有一特征(斜線)與其不符合;d鬼只有3個特征與其符合,并有兩個特征(斜線、直角)與其不符合;只有r鬼有5個特征與其符合,而且這5個特征又包括了r的全部特征,所以r鬼的叫喊聲最大,因此“決策鬼”就很容易地作出選擇r的決定。另外,形狀匹配算法也是一種常見的圖像識別技術(shù),形狀是用于目標(biāo)識別的重要特征,也是對目標(biāo)范圍的二值圖像的表示。通常其表示方式分兩類,編碼方式,如鏈碼、游程碼、freeman碼等;簡化方式,如差值、多項(xiàng)式、多邊形逼近、和特征點(diǎn)檢測等。通過特征計(jì)算能夠提取出圖像中特定形狀的目標(biāo)。目前有很多成熟算法能夠輕松提取出圓形、方形、三角形等目標(biāo)。例如,一種基于加窗hough變換的圓形檢測算法。檢測原理為:檢測出圓形形狀之后,得到圓的半徑值,和目標(biāo)圓形形狀半徑值進(jìn)行相似性比對。再例如,一種基于加窗hough變換的任意三角形檢測算法。檢測原理為:在圖像中選擇適當(dāng)大小的窗口,以窗口中心為坐標(biāo)原點(diǎn)對窗口內(nèi)圖像作hough變化,在圖像的hough域中檢測直線段,滑動窗口,從檢測出的直線段中找出滿足三角形條件的線段組合,然后定位這些線段構(gòu)成的三角形。改變線段的長度條件或者角度條件還可以檢測直角三角形,等腰三角形,等邊三角形等特殊三角形。再例如,一種島校檢測圖像中是否有三角形的算法。該方法利用區(qū)域填充及三角形三邊的長度面積之間的關(guān)系實(shí)現(xiàn)三角形目標(biāo)檢測??蛇x的,所述目標(biāo)多媒體包括多幀圖像,則采用圖像識別算法分別對所述多幀圖像中的每幀圖像中包含的目標(biāo)對象進(jìn)行識別。s202,根據(jù)預(yù)設(shè)對象和預(yù)設(shè)屬性值的對應(yīng)關(guān)系,在預(yù)設(shè)的數(shù)據(jù)庫中查找所述目標(biāo)對象對應(yīng)的屬性值。具體的,所述預(yù)設(shè)對象可以為對象標(biāo)識、對象地址。其中,所述對象標(biāo)識可以為對象的形狀或名稱,所述對象地址是關(guān)于目標(biāo)對象的存儲地址,如統(tǒng)一資源定位符url。取屬性值為卡路里值,如表1所示為預(yù)設(shè)對象與預(yù)設(shè)卡路里值的映射關(guān)系表,該映射關(guān)系表存儲在預(yù)設(shè)的數(shù)據(jù)庫中,當(dāng)多媒體處理裝置獲取到目標(biāo)對象時,則可根據(jù)該映射表查找到相應(yīng)的卡路里值。例如,若目標(biāo)對象為蘋果,則對應(yīng)的卡路里值為52cal。表1對象卡路里值(cal)花椰菜24雞蛋144牛奶54蘋果52s203,生成與所述屬性值對應(yīng)的指示信息,并將所述指示信息添加到所述目標(biāo)多媒體中。具體的,多媒體處理裝置生成標(biāo)識屬性值的指示信息后,將該指示信息添加到目標(biāo)多媒體中。所述指示信息可以為標(biāo)簽,也可以為列表,可將所述指示信息添加到所述目標(biāo)對象所在的位置或預(yù)設(shè)指定位置。若在同一目標(biāo)多媒體中包括多個目標(biāo)對象,則將生成的指示信息分別添加到對應(yīng)的對象所在的位置或預(yù)設(shè)的位置。例如,如圖4(a)所示為其中的一種指示信息顯示方式,圖4(b)為另一種指示信息的顯示方式。s204,采用預(yù)設(shè)顯示方式在所述目標(biāo)多媒體中顯示所述指示信息。具體的,所述多媒體處理裝置采用預(yù)設(shè)顯示方式對所述指示信息進(jìn)行顯示。其中,所述預(yù)設(shè)顯示方式是所述多媒體處理裝置自定義設(shè)置的,包括預(yù)設(shè)顯示位置和預(yù)設(shè)顯示效果??蛇x的,所述多媒體處理裝置根據(jù)生成所述指示信息的時間,將所述指示信息按照時間先后順序在預(yù)設(shè)顯示區(qū)域中進(jìn)行顯示??蛇x的,預(yù)設(shè)顯示區(qū)域可以疊加在多媒體顯示區(qū)域上方,例如,預(yù)設(shè)顯示區(qū)域以透明方式疊加在多媒體顯示區(qū)域上方,這樣可以使多媒體顯示區(qū)域和預(yù)設(shè)顯示區(qū)域的顯示大小達(dá)到最大化;或者多媒體顯示區(qū)域和預(yù)設(shè)顯示區(qū)域可以在顯示界面的不同位置,具體不限定。s205,接收針對所述指示信息的操作指令,所述操作指令包括放大指令、縮小指令、修改指令以及刪除指令中的任一種。s206,根據(jù)所述操作指令對所述指示信息進(jìn)行操作。具體的,當(dāng)用戶針對所述指示信息進(jìn)行操作時,多媒體處理裝置則接收到操作指令,并執(zhí)行指令對應(yīng)的操作。這樣能夠提高用戶在多媒體編輯中對指示信息的可操作性。例如,若用戶想要更改指示信息的顯示方式,則進(jìn)行顯示方式修改操作,若當(dāng)前的顯示方式為從顯示界面的右下方顯示出來,向左滾動同時逐漸變小至目標(biāo)對象所在的位置,此時則切換為先通過放大方式凸顯預(yù)設(shè)時間,預(yù)設(shè)時間過后縮小至目標(biāo)對象所在的位置。又例如,若多媒體處理裝置接收到針對指示信息的刪除指令,則刪除對應(yīng)的指示信息。在本發(fā)明實(shí)施中,多媒體處理裝置通過識別目標(biāo)多媒體中包含的目標(biāo)對象,并在預(yù)設(shè)數(shù)據(jù)庫中查找到目標(biāo)對象對應(yīng)的屬性值,生成與屬性值對應(yīng)的指示信息后將該指示信息添加到目標(biāo)多媒體中,通過采用預(yù)設(shè)顯示方式顯示該指示信息,同時還可根據(jù)針對該指示信息輸入添加、刪除、修改等操作對指示信息進(jìn)行處理?,F(xiàn)有技術(shù)中由于無法獲知多媒體內(nèi)容中所包含的各種屬性信息,而僅僅能對多媒體本身進(jìn)行處理,與現(xiàn)有技術(shù)相比,本發(fā)明可以自動采集多媒體內(nèi)容中所包含的各種屬性信息,并可將這些屬性信息添加至多媒體中,豐富了多媒體編輯處理形式,增加了多媒體編輯處理的多樣性。請參見圖5,為本發(fā)明實(shí)施例提供了一種多媒體處理裝置的結(jié)構(gòu)示意圖。如圖5所示,本發(fā)明實(shí)施例的所述多媒體處理裝置1可以包括:對象識別模塊11、信息獲取模塊12和信息添加模塊13。對象識別模塊11,用于識別目標(biāo)多媒體中包含的目標(biāo)對象。所述目標(biāo)多媒體可以為所拍攝的圖片或視頻,在目標(biāo)多媒體中可以包括背景區(qū)域以及對象。如圖3所示的圖片a,其中a1、a2和a3為a中所包含的目標(biāo)對象,其余部分為背景區(qū)域。具體實(shí)施中,對象識別模塊可采用圖像識別技術(shù)識別目標(biāo)對象。其中,圖像識別是指利用計(jì)算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。一般工業(yè)使用中,采用工業(yè)相機(jī)拍攝圖片,然后再利用軟件根據(jù)圖片灰階差做進(jìn)一步識別處理,圖像識別軟件國外代表的有康耐視等,國內(nèi)代表的有圖智能等。其中,常見的一種圖像識別技術(shù)為“泛魔”識別模型,它是一種以特征分析為基礎(chǔ)的圖像識別系統(tǒng)。“泛魔”識別模型系統(tǒng)的圖像識別共有4個層次。第一層是執(zhí)行最簡單任務(wù)的“映象鬼”,它們只記錄外界的原始形象,正像視網(wǎng)膜獲得外界刺激的映象,然后由“特征鬼”進(jìn)一步分析這個映象。在分析過程中,每個“特征鬼”都去尋找與自己有關(guān)的圖像特征。例如,在識別英文字母時,每個特征鬼負(fù)責(zé)報(bào)告字母的一種特征及其數(shù)量,如垂直線、水平線、斜線、直角、銳角,不連續(xù)曲線和連續(xù)曲線等;再由“認(rèn)知鬼”接收“特征鬼”的反應(yīng),每個“認(rèn)知鬼”都從“特征鬼”的反應(yīng)中尋找與自己負(fù)責(zé)識別的圖像有關(guān)的特征,發(fā)現(xiàn)了這種特征時它就“叫喊”,發(fā)現(xiàn)的特征越多,“叫喊”聲越大;最后,“決策鬼”根據(jù)許多“認(rèn)知鬼”“叫喊”聲的大小,選擇叫喊聲最大的“認(rèn)知鬼”的反應(yīng)作為所要識別的圖像。例如,在識別字母r時,“映象鬼”先對r進(jìn)行編碼,把信息傳遞給"特征鬼"作進(jìn)一步加工,這時會有5個“特征鬼”分別報(bào)告圖像所包括的一條垂線、兩條水平線,一條斜線,三個直角和一條不連續(xù)曲線。然后許多"認(rèn)知鬼"則根據(jù)所報(bào)告的這些特征及其數(shù)量來識別是否是自己負(fù)責(zé)的字母。這時d、p、r鬼都會有反應(yīng),但p鬼只有4個特征與其符合,并有一特征(斜線)與其不符合;d鬼只有3個特征與其符合,并有兩個特征(斜線、直角)與其不符合;只有r鬼有5個特征與其符合,而且這5個特征又包括了r的全部特征,所以r鬼的叫喊聲最大,因此“決策鬼”就很容易地作出選擇r的決定。另外,形狀匹配算法也是一種常見的圖像識別技術(shù),形狀是用于目標(biāo)識別的重要特征,也是對目標(biāo)范圍的二值圖像的表示。通常其表示方式分兩類,編碼方式,如鏈碼、游程碼、freeman碼等;簡化方式,如差值、多項(xiàng)式、多邊形逼近、和特征點(diǎn)檢測等。通過特征計(jì)算能夠提取出圖像中特定形狀的目標(biāo)。目前有很多成熟算法能夠輕松提取出圓形、方形、三角形等目標(biāo)。例如,一種基于加窗hough變換的圓形檢測算法。檢測原理為:檢測出圓形形狀之后,得到圓的半徑值,和目標(biāo)圓形形狀半徑值進(jìn)行相似性比對。再例如,一種基于加窗hough變換的任意三角形檢測算法。檢測原理為:在圖像中選擇適當(dāng)大小的窗口,以窗口中心為坐標(biāo)原點(diǎn)對窗口內(nèi)圖像作hough變化,在圖像的hough域中檢測直線段,滑動窗口,從檢測出的直線段中找出滿足三角形條件的線段組合,然后定位這些線段構(gòu)成的三角形。改變線段的長度條件或者角度條件還可以檢測直角三角形,等腰三角形,等邊三角形等特殊三角形。再例如,一種島校檢測圖像中是否有三角形的算法。該方法利用區(qū)域填充及三角形三邊的長度面積之間的關(guān)系實(shí)現(xiàn)三角形目標(biāo)檢測??蛇x的,所述目標(biāo)多媒體包括多幀圖像,則采用圖像識別算法分別對所述多幀圖像中的每幀圖像中包含的目標(biāo)對象進(jìn)行識別??蛇x的,所述目標(biāo)多媒體包括多幀圖像;所述對象識別模塊11具體用于:采用圖像識別算法分別對所述多幀圖像中的每幀圖像中包含的目標(biāo)對象進(jìn)行識別。信息獲取模塊12,用于獲取所述目標(biāo)對象對應(yīng)的屬性值??蛇x的,所述信息獲取模塊12具體用于:根據(jù)預(yù)設(shè)對象和預(yù)設(shè)屬性值的對應(yīng)關(guān)系,在預(yù)設(shè)的數(shù)據(jù)庫中查找所述目標(biāo)對象對應(yīng)的屬性值。可選的,信息獲取模塊具體用于訪問目標(biāo)對象的存儲地址對應(yīng)的網(wǎng)頁信息,對該網(wǎng)頁信息進(jìn)行解析以提取目標(biāo)對象的屬性值??蛇x的,信息獲取模塊具體用于向網(wǎng)絡(luò)服務(wù)器發(fā)送目標(biāo)對象的屬性值查找請求,并接收網(wǎng)絡(luò)服務(wù)器反饋的查找結(jié)果。信息添加模塊13,用于生成與所述屬性值對應(yīng)的指示信息,并將所述指示信息添加到所述目標(biāo)多媒體中。具體的,信息添加模塊生成標(biāo)識屬性值的指示信息后,將該指示信息添加到目標(biāo)多媒體中。所述指示信息可以為標(biāo)簽,也可以為列表,可將所述指示信息添加到所述目標(biāo)對象所在的位置。若在同一目標(biāo)多媒體中包括多個目標(biāo)對象,則將生成的指示信息分別添加到對應(yīng)的對象所在的位置??蛇x的,如圖6所示,所述裝置1還包括:信息顯示模塊14,用于采用預(yù)設(shè)顯示方式在所述目標(biāo)多媒體中顯示所述指示信息,所述預(yù)設(shè)顯示方式包括預(yù)設(shè)顯示位置和預(yù)設(shè)顯示效果。具體的,所述信息顯示模塊采用預(yù)設(shè)顯示方式對所述指示信息進(jìn)行顯示。其中,所述預(yù)設(shè)顯示方式是所述多媒體處理裝置自定義設(shè)置的,包括預(yù)設(shè)顯示位置和預(yù)設(shè)顯示效果??蛇x的,所述信息顯示模塊根據(jù)生成所述指示信息的時間,將所述指示信息按照時間先后順序在預(yù)設(shè)顯示區(qū)域中進(jìn)行顯示??蛇x的,預(yù)設(shè)顯示區(qū)域可以疊加在多媒體顯示區(qū)域上方,例如,預(yù)設(shè)顯示區(qū)域以透明方式疊加在多媒體顯示區(qū)域上方,這樣可以使多媒體顯示區(qū)域和預(yù)設(shè)顯示區(qū)域的顯示大小達(dá)到最大化;或者多媒體顯示區(qū)域和預(yù)設(shè)顯示區(qū)域可以在顯示界面的不同位置,具體不限定??蛇x的,如圖6所示,所述裝置1還包括:指令接收模塊15,用于接收針對所述指示信息的操作指令,所述操作指令包括放大指令、縮小指令、修改指令以及刪除指令中的任一種;操作執(zhí)行模塊16,用于根據(jù)所述操作指令對所述指示信息進(jìn)行操作。具體的,當(dāng)用戶針對所述指示信息進(jìn)行操作時,指令接收模塊則接收到操作指令,操作執(zhí)行模塊執(zhí)行指令對應(yīng)的操作。這樣能夠提高用戶在視頻直播群組中對交互圖片數(shù)據(jù)的可操作性。例如,若用戶想要更改指示信息的顯示方式,則進(jìn)行顯示方式修改操作,若當(dāng)前的顯示方式為從顯示界面的右下方顯示出來,向左滾動同時逐漸變小至目標(biāo)對象所在的位置,此時則切換為先通過放大方式凸顯預(yù)設(shè)時間,預(yù)設(shè)時間過后縮小至目標(biāo)對象所在的位置。又例如,若指令接收模塊接收到針對指示信息的刪除指令,操作執(zhí)行模塊則刪除對應(yīng)的指示信息。在本發(fā)明實(shí)施中,多媒體處理裝置通過識別目標(biāo)多媒體中包含的目標(biāo)對象,并在預(yù)設(shè)數(shù)據(jù)庫中查找到目標(biāo)對象對應(yīng)的屬性值,生成與屬性值對應(yīng)的指示信息后將該指示信息添加到目標(biāo)多媒體中,通過采用預(yù)設(shè)顯示方式顯示該指示信息,同時還可根據(jù)針對該指示信息輸入添加、刪除、修改等操作對指示信息進(jìn)行處理?,F(xiàn)有技術(shù)中由于無法獲知多媒體內(nèi)容中所包含的各種屬性信息,而僅僅能對多媒體本身進(jìn)行處理,與現(xiàn)有技術(shù)相比,本發(fā)明可以自動采集多媒體內(nèi)容中所包含的各種屬性信息,并可將這些屬性信息添加至多媒體中,豐富了多媒體編輯處理形式,增加了多媒體編輯處理的多樣性。請參見圖7,為本發(fā)明實(shí)施例提供了一種電子設(shè)備的結(jié)構(gòu)示意圖。如圖7所示,所述電子設(shè)備1000可以包括:至少一個處理器1001,例如cpu,至少一個網(wǎng)絡(luò)接口1004,用戶接口1003,存儲器1005,至少一個通信總線1002。其中,通信總線1002用于實(shí)現(xiàn)這些組件之間的連接通信。其中,用戶接口1003可以包括顯示屏(display)、鍵盤(keyboard),可選用戶接口1003還可以包括標(biāo)準(zhǔn)的有線接口、無線接口。網(wǎng)絡(luò)接口1004可選的可以包括標(biāo)準(zhǔn)的有線接口、無線接口(如wi-fi接口)。存儲器1005可以是高速ram存儲器,也可以是非不穩(wěn)定的存儲器(non-volatilememory),例如至少一個磁盤存儲器。存儲器1005可選的還可以是至少一個位于遠(yuǎn)離前述處理器1001的存儲裝置。如圖7所示,作為一種計(jì)算機(jī)存儲介質(zhì)的存儲器1005中可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊、用戶接口模塊以及多媒體處理應(yīng)用程序。在圖7所示的電子設(shè)備1000中,用戶接口1003主要用于為用戶提供輸入的接口;而處理器1001可以用于調(diào)用存儲器1005中存儲的多媒體處理應(yīng)用程序,并具體執(zhí)行以下操作:識別目標(biāo)多媒體中包含的目標(biāo)對象;獲取所述目標(biāo)對象對應(yīng)的屬性值;生成與所述屬性值對應(yīng)的指示信息,并將所述指示信息添加到所述目標(biāo)多媒體中。在一個實(shí)施例中,所述處理器1001在執(zhí)行獲取所述目標(biāo)對象對應(yīng)的屬性值時,具體執(zhí)行以下步驟:根據(jù)預(yù)設(shè)對象和預(yù)設(shè)屬性值的對應(yīng)關(guān)系,在預(yù)設(shè)的數(shù)據(jù)庫中查找所述目標(biāo)對象對應(yīng)的屬性值。在一個實(shí)施例中,所述處理器1001在執(zhí)行將所述指示信息添加到所述目標(biāo)多媒體中之后,具體執(zhí)行以下步驟:采用預(yù)設(shè)顯示方式在所述目標(biāo)多媒體中顯示所述指示信息,所述預(yù)設(shè)顯示方式包括預(yù)設(shè)顯示位置和預(yù)設(shè)顯示效果。在一個實(shí)施例中,所述目標(biāo)多媒體包括多幀圖像;所述處理器1001在執(zhí)行識別目標(biāo)多媒體中包含的目標(biāo)對象時,具體執(zhí)行以下步驟:采用圖像識別算法分別對所述多幀圖像中的每幀圖像中包含的目標(biāo)對象進(jìn)行識別。在一個實(shí)施例中,所述處理器1001還執(zhí)行以下步驟:接收針對所述指示信息的操作指令,所述操作指令包括放大指令、縮小指令、修改指令以及刪除指令中的任一種;根據(jù)所述操作指令對所述指示信息進(jìn)行操作。本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)存儲介質(zhì)(非臨時性計(jì)算機(jī)可讀存儲介質(zhì)),所述計(jì)算機(jī)存儲介質(zhì)存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包括程序信令,所述程序信令當(dāng)被計(jì)算機(jī)執(zhí)行時使所述計(jì)算機(jī)執(zhí)行如前述實(shí)施例所述的方法,所述計(jì)算機(jī)可以為上述提到的多媒體處理裝置或電子設(shè)備的一部分。上述非臨時性計(jì)算機(jī)可讀存儲介質(zhì)可以采用一個或多個計(jì)算機(jī)可讀的介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號介質(zhì)或者計(jì)算機(jī)可讀存儲介質(zhì)。計(jì)算機(jī)可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤、硬盤、隨機(jī)存取存儲器(ram)、只讀存儲器(readonlymemory;以下簡稱:rom)、可擦式可編程只讀存儲器(erasableprogrammablereadonlymemory;以下簡稱:eprom)或閃存、光纖、便攜式緊湊磁盤只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。計(jì)算機(jī)可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括——但不限于——電磁信號、光信號或上述的任意合適的組合。計(jì)算機(jī)可讀的信號介質(zhì)還可以是計(jì)算機(jī)可讀存儲介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括——但不限于——無線、電線、光纜、rf等等,或者上述的任意合適的組合??梢砸砸环N或多種程序設(shè)計(jì)語言或其組合來編寫用于執(zhí)行本申請操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語言—諸如java、smalltalk、c++,還包括常規(guī)的過程式程序設(shè)計(jì)語言—諸如“c”語言或類似的程序設(shè)計(jì)語言。程序代碼可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過任意種類的網(wǎng)絡(luò)——包括局域網(wǎng)(localareanetwork;以下簡稱:lan)或廣域網(wǎng)(wideareanetwork;以下簡稱:wan)連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。本申請實(shí)施例還提供一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)上述計(jì)算機(jī)程序產(chǎn)品中的指令由處理器執(zhí)行時,可以實(shí)現(xiàn)本申請圖1或圖2所示實(shí)施例提供的多媒體處理方法。通過以上的實(shí)施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,僅以上述各功能模塊的劃分進(jìn)行舉例說明,實(shí)際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對應(yīng)過程,在此不再贅述。在本申請所提供的幾個實(shí)施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述模塊或單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。另外,在本申請各個實(shí)施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時,可以存儲在一個計(jì)算機(jī)可讀取存儲介質(zhì)中。基于這樣的理解,本申請的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本申請各個實(shí)施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(readonlymemory;以下簡稱:rom)、隨機(jī)存取存儲器(randomaccessmemory;以下簡稱:ram)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。以上所述,僅為本申請的具體實(shí)施方式,但本申請的保護(hù)范圍并不局限于此,任何熟悉本
技術(shù)領(lǐng)域:
的技術(shù)人員在本申請揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本申請的保護(hù)范圍之內(nèi)。因此,本申請的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。當(dāng)前第1頁12