一種基于圖片內(nèi)容播放音樂的方法及裝置制造方法
【專利摘要】本公開是關于一種基于圖片內(nèi)容播放音樂的方法及裝置,該方法包括:獲取圖庫中的目標圖片和所述目標圖片的圖片標識;提取所述目標圖片的圖像特征;利用預先生成的場景判定模型判定出所述目標圖片的圖像特征對應的場景標簽;確定與所述場景標簽對應的場景音樂標識;建立所述圖片標識與所述場景音樂標識的對應關系;在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述場景音樂標識對應的音樂文件。本公開提供的方案可以根據(jù)圖片內(nèi)容播放適合的音樂,從而降低用戶的操作復雜度,并節(jié)省用戶的時間。
【專利說明】—種基于圖片內(nèi)容播放音樂的方法及裝置
【技術領域】
[0001]本發(fā)明涉及通信【技術領域】,更具體的說,涉及基于圖片內(nèi)容播放音樂的方法及裝置。
【背景技術】
[0002]人們在瀏覽相冊或圖庫中的圖片時,通常會播放一些音樂。有時,用戶為了更好的體驗圖片中的氛圍,通常會選擇一些與當前查看的圖片相匹配的音樂。例如,用戶在瀏覽自己在海邊游玩的圖片時,會播放一些歡快的音樂,使自己更好的融入圖片中愉悅的場景。又如,用戶在瀏覽朋友婚禮的圖片時,會播放一些與婚禮有關的音樂,如婚禮進行曲等。再如,用戶在瀏覽恐怖圖片時,會播放一些詭異或驚悚的音樂,以烘托恐怖氣氛,使用戶充分的體驗恐怖氛圍。
[0003]在研究和實踐過程中,發(fā)明人發(fā)現(xiàn)上述相關技術至少存在以下問題:
[0004]由于用戶在瀏覽圖片時,在一段時間內(nèi)可能會查看多張不同內(nèi)容的圖片。例如,用戶在10分鐘之內(nèi)查看了海邊游玩的圖片、朋友婚禮的圖片和恐怖圖片,所以用戶在查看多張不同內(nèi)容的圖片時,經(jīng)常需要手動的去切換適合當前圖片的音樂,以使自己更好的融入當前圖片的場景。但是經(jīng)常的去手動切換與當前瀏覽的圖片相匹配的音樂,會增加用戶的操作復雜度;而且,用戶可能很難在短時間內(nèi)查找到與當前瀏覽的圖片相匹配的音樂,所以用戶在查找與當前瀏覽的圖片相匹配的音樂類型時可能會浪費大量的時間。
[0005]因此,如何根據(jù)圖片內(nèi)容播放適合的音樂,成為目前亟需解決的問題。
【發(fā)明內(nèi)容】
[0006]為克服相關技術中存在的問題,本公開提供一種基于圖片內(nèi)容播放音樂的方法及裝置,根據(jù)圖片內(nèi)容播放適合的音樂,從而降低用戶的操作復雜度,并節(jié)省用戶的時間。
[0007]根據(jù)本公開實施例的第一方面,提供一種基于圖片內(nèi)容播放音樂的方法,包括:
[0008]獲取圖庫中的目標圖片和所述目標圖片的圖片標識;
[0009]提取所述目標圖片的圖像特征;
[0010]利用預先生成的場景判定模型判定出所述目標圖片的圖像特征對應的場景標簽;
[0011 ] 確定與所述場景標簽對應的場景音樂標識;
[0012]建立所述圖片標識與所述場景音樂標識的對應關系;
[0013]在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述場景音樂標識對應的音樂文件。
[0014]可選的,所述方法還包括:
[0015]創(chuàng)建場景標簽;
[0016]獲取與每個場景標簽對應的指定場景圖片;
[0017]提取所述每個場景標簽對應的指定場景圖片的圖像特征;
[0018]利用預設機器學習方法對所述每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
[0019]可選的,所述方法還包括:
[0020]判斷所述場景標簽是否為人臉圖像;
[0021]在所述場景標簽為所述人臉圖像時,利用預先生成的人臉判定模型判定出所述目標圖片的圖像特征對應的表情標簽,確定與所述表情標簽對應的表情首樂標識,建立所述圖片標識與所述表情音樂標識的對應關系,在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述表情音樂標識對應的音樂文件;
[0022]在所述場景標簽不為所述人臉圖像時,執(zhí)行所述確定與所述場景標簽對應的音樂標識的步驟。
[0023]可選的,所述方法還包括:
[0024]創(chuàng)建表情標簽;
[0025]獲取與每個表情標簽對應的指定表情圖片;
[0026]提取所述每個場景標簽對應的指定表情圖片的圖像特征;
[0027]利用預設機器學習方法對所述每個場景標簽對應的指定表情圖片的圖像特征進行訓練,生成所述人臉判定模型。
[0028]可選的,在所述建立所述圖片標識與所述場景音樂標識的對應關系之后,所述方法還包括:
[0029]判斷所述圖庫中是否存在未被所述場景判定模型判定過的圖片;
[0030]在所述圖庫中存在未被所述場景判定模型判定過的圖片時,將所述圖庫中未被所述場景判定模型判定過的圖片確定為目標圖片,并獲取所述目標圖片的圖片標識,執(zhí)行所述提取所述目標圖片的圖像特征的步驟;
[0031]在所述圖庫中不存在未被所述場景判定模型判定過的圖片時,執(zhí)行所述在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述場景音樂標識對應的音樂文件的步驟。
[0032]根據(jù)本公開實施例的第二方面,提供一種基于圖片內(nèi)容播放音樂的裝置,包括:
[0033]第一獲取模塊,用于獲取圖庫中的目標圖片和所述目標圖片的圖片標識;
[0034]第一提取模塊,用于提取所述目標圖片的圖像特征;
[0035]判定模塊,用于利用預先生成的場景判定模型判定出所述目標圖片的圖像特征對應的場景標簽;
[0036]確定模塊,用于確定與所述場景標簽對應的場景音樂標識;
[0037]建立模塊,用于建立所述圖片標識與所述場景音樂標識的對應關系;
[0038]播放模塊,用于在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述場景音樂標識對應的音樂文件。
[0039]可選的,所述裝置還包括:
[0040]場景標簽創(chuàng)建模塊,用于創(chuàng)建場景標簽;
[0041]第二獲取模塊,用于獲取與每個場景標簽對應的指定場景圖片;
[0042]第二提取模塊,用于提取所述每個場景標簽對應的指定場景圖片的圖像特征;
[0043]場景訓練模塊,用于利用預設機器學習方法對所述每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
[0044]可選的,所述裝置還包括:
[0045]第一判斷模塊,用于判斷所述場景標簽是否為人臉圖像;
[0046]第一執(zhí)行模塊,用于在所述場景標簽為所述人臉圖像時,利用預先生成的人臉判定模型判定出所述目標圖片的圖像特征對應的表情標簽,確定與所述表情標簽對應的表情音樂標識,建立所述圖片標識與所述表情音樂標識的對應關系,在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述表情音樂標識對應的音樂文件;在所述場景標簽不為所述人臉圖像時,執(zhí)行所述確定模塊。
[0047]可選的,所述裝置還包括:
[0048]表情標簽創(chuàng)建模塊,用于創(chuàng)建表情標簽;
[0049]第三獲取模塊,用于獲取與每個表情標簽對應的指定表情圖片;
[0050]第三提取模塊,用于提取所述每個場景標簽對應的指定表情圖片的圖像特征;
[0051]人臉訓練模塊,用于利用預設機器學習方法對所述每個場景標簽對應的指定表情圖片的圖像特征進行訓練,生成所述人臉判定模型。
[0052]可選的,所述裝置還包括:
[0053]第二判斷模塊,用于判斷所述圖庫中是否存在未被所述場景判定模型判定過的圖片;
[0054]第二執(zhí)行模塊,用于在所述圖庫中存在未被所述場景判定模型判定過的圖片時,將所述圖庫中未被所述場景判定模型判定過的圖片確定為目標圖片,并獲取所述目標圖片的圖片標識,執(zhí)行所述第一提取模塊;在所述圖庫中不存在未被所述場景判定模型判定過的圖片時,執(zhí)行所述播放模塊。
[0055]根據(jù)本公開實施例的第三方面,提供一種基于圖片內(nèi)容播放音樂的裝置,包括:
[0056]處理器;
[0057]用于存儲處理器可執(zhí)行指令的存儲器;
[0058]其中,所述處理器被配置為:
[0059]獲取圖庫中的目標圖片和所述目標圖片的圖片標識;
[0060]提取所述目標圖片的圖像特征;
[0061]利用預先生成的場景判定模型判定出所述目標圖片的圖像特征對應的場景標簽;
[0062]確定與所述場景標簽對應的場景音樂標識;
[0063]建立所述圖片標識與所述場景音樂標識的對應關系;
[0064]在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述場景音樂標識對應的音樂文件。
[0065]本公開的實施例提供的技術方案可以包括以下有益效果:利用預先生成的場景判定模型判定出目標圖片的圖像特征對應的場景標簽,再利用場景標簽與場景音樂標識的對應關系建立圖片標識與場景音樂標識的對應關系,一旦接收到打開圖片標識對應的目標圖片的指令,便會播放場景音樂標識對應的音樂文件。因此,本公開提供的方案可以根據(jù)圖片內(nèi)容播放適合的音樂,從而降低用戶的操作復雜度,并節(jié)省用戶的時間。
[0066]應當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
【專利附圖】
【附圖說明】
[0067]此處的附圖被并入說明書中并構成本說明書的一部分,示出了符合本發(fā)明的實施例,并與說明書一起用于解釋本發(fā)明的原理。
[0068]圖1是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的方法的流程圖。
[0069]圖2是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的方法的流程圖。
[0070]圖3是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的裝置的示意圖。
[0071]圖4是根據(jù)一示例性實施例示出的另一種基于圖片內(nèi)容播放音樂的裝置的示意圖。
[0072]圖5是根據(jù)一示例性實施例示出的又一種基于圖片內(nèi)容播放音樂的裝置的示意圖。
[0073]圖6是根據(jù)一示例性實施例示出的又一種基于圖片內(nèi)容播放音樂的裝置的示意圖。
[0074]圖7是根據(jù)一示例性實施例示出的又一種基于圖片內(nèi)容播放音樂的裝置的示意圖。
[0075]圖8是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的裝置的框圖。
【具體實施方式】
[0076]這里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本發(fā)明相一致的所有實施方式。相反,它們僅是與如所附權利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
[0077]實施例一
[0078]圖1是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的方法的流程圖,如圖1所示,圖1所示的基于圖片內(nèi)容播放音樂的方法可以用于終端中。本公開提供的基于圖片內(nèi)容播放音樂的方法可以根據(jù)圖片內(nèi)容播放適合的音樂,從而降低用戶的操作復雜度,并節(jié)省用戶的時間,進而提高了用戶的體驗度。該方法包括以下步驟。
[0079]在步驟Sll中,獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0080]其中,圖庫中可以存放至少一張目標圖片。目標圖片可以為各種格式的圖片類型,例如,目標圖片可以為BMP或JPG等各種類型的圖片。目標圖片的圖片標識為唯一確定目標圖片的標識,例如,目標圖片的圖片標識可以為目標圖片的名稱。
[0081]在步驟S12中,提取目標圖片的圖像特征。
[0082]其中,目標圖片的圖像特征可以為目標圖片的H0G(Histogram of OrientedGradient,方向梯度直方圖)特征,當然,圖像特征也可以為其他類型的特征,所以圖像特征并不局限于HOG特征。
[0083]在步驟S13中,利用預先生成的場景判定模型判定出目標圖片的圖像特征對應的場景標簽。
[0084]其中,場景標簽可以為多種類型的標簽,例如,場景標簽可以包括寵物、風景和人像等類型,場景標簽可以由用戶預先自行設定。場景判定模型為預先生成的一種判定模型,場景判定模型用于識別出目標圖片的圖像特征對應哪一種場景標簽,例如,目標圖片為一張小貓的圖片,那么場景判定模型便可以識別出目標圖片的圖像特征對應的場景標簽為寵物。又如,目標圖片為一張中年男子的圖片,那么場景判定模型便可以識別出目標圖片的圖像特征對應的場景標簽為人像。再如,目標圖片為一張桂林山水的圖片,那么場景判定模型便可以識別出目標圖片的圖像特征對應的場景標簽為風景。
[0085]另外,場景判定模型可以通過以下步驟進行生成:第一步,創(chuàng)建場景標簽;第二步,獲取與每個場景標簽對應的指定場景圖片;第三步,提取每個場景標簽對應的指定場景圖片的圖像特征;第四步,利用預設機器學習方法對每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
[0086]下面舉例說明上述生成場景判定模型的步驟。首先,創(chuàng)建三個場景標簽,這三個場景標簽分別為寵物、風景和人像。其次,分別收集寵物圖片、風景圖片和人像圖片各一萬張,其中,收集到的一萬張寵物圖片可以包括貓類、狗類、蛇類、寵物鼠類和魚類等與寵物相關的圖片,收集到的一萬張風景圖片可以包括高山、河水、沙漠、海邊、樹木、草地、瀑布、彩虹、云彩和名勝古跡等與風景相關的圖片,收集到的一萬張人像圖片可以包括兒童面部圖像、老人面部圖像、少女面部圖像和成人面部圖像等與人像相關的圖片。再次,將收集到的三萬張圖片縮放到統(tǒng)一大小,例如,將這三萬張圖片均縮放到分辨率為200X200的大小。然后,分別提取出縮放后的三萬張圖片的圖像特征,例如,分別提取出縮放后的三萬張圖片的HOG特征。最后,利用預設機器學習方法對三個場景標簽分別對應的一萬張場景圖片的圖像特征進行訓練以生成場景判定模型,例如,預設機器學習方法可以為SVM(Support VectorMachine,支持向量機)方法,通過SVM方法可以訓練出一個場景判定模型,這個場景判定模型可以識別出與寵物、風景和人像相近似的圖片,并判定出該圖片屬于上述三種場景標簽中的哪種場景標簽。
[0087]在步驟S14中,確定與場景標簽對應的場景音樂標識。
[0088]其中,場景音樂標識可以為音樂文件的名稱,也可以為一個具有多個音樂文件的音樂文件夾的名稱。場景標簽與場景音樂標識的對應關系可以是用戶預先建立好的,例如,假設場景標簽包括寵物標簽、風景標簽和人像標簽,用戶分別建立寵物標簽與場景音樂標識A的對應關系、風景標簽與場景首樂標識B的對應關系和人像標簽與場景首樂標識C的對應關系。在用戶建立場景標簽與場景音樂標識的對應關系的過程中,用戶可以選擇一些與場景標簽相匹配的場景音樂標識,例如,對于寵物標簽,可以選擇音樂節(jié)奏較為歡快、愉悅的音樂類型;又如,對于風景標簽,可以選擇一些古典音樂類型。
[0089]在步驟S15中,建立圖片標識與場景首樂標識的對應關系。
[0090]其中,在選擇好場景音樂標識后,建立圖片標識與場景音樂標識的對應關系,以便于在打開圖片標識對應的目標圖片時,能夠播放場景音樂標識對應的音樂文件。
[0091]在步驟S16中,在接收到打開圖片標識對應的目標圖片的指令時,播放場景音樂標識對應的音樂文件。
[0092]其中,每個場景音樂標識均對應有一個或多個音樂文件。如果一個場景音樂標識對應有一個音樂文件,那么在接收到打開圖片標識對應的目標圖片的指令時,播放場景音樂標識對應的一個音樂文件;如果一個場景音樂標識對應有對個音樂文件,那么在接收到打開圖片標識對應的目標圖片的指令時,依次播放場景音樂標識對應的多個音樂文件。
[0093]在圖1所示的實施例中,本公開利用預先生成的場景判定模型判定出目標圖片的圖像特征對應的場景標簽,再利用場景標簽與場景音樂標識的對應關系建立圖片標識與場景音樂標識的對應關系,一旦接收到打開圖片標識對應的目標圖片的指令,便會播放場景音樂標識對應的音樂文件。因此,本公開提供的方案可以根據(jù)圖片內(nèi)容播放適合的音樂,從而降低用戶的操作復雜度,并節(jié)省用戶的時間。
[0094]在本公開的一個可選的實施例中,在步驟S15之后,且在步驟S16之前,本公開提供的方法還可以包括以下步驟:判斷圖庫中是否存在未被場景判定模型判定過的圖片;在圖庫中存在未被場景判定模型判定過的圖片時,將圖庫中未被場景判定模型判定過的圖片確定為目標圖片,并獲取目標圖片的圖片標識,執(zhí)行步驟S12;在圖庫中不存在未被場景判定模型判定過的圖片時,執(zhí)行步驟S16。這樣做的目的是,可以使圖庫中所有的圖片均與不同的場景音樂標識建立對應關系,從而保證用戶在打開圖庫中的任意一個圖片時,都會播放與場景音樂標識對應的音樂文件。
[0095]實施例二
[0096]圖2是根據(jù)一示例性實施例示出的另一種基于圖片內(nèi)容播放音樂的方法的流程圖,如圖2所示,圖2所示的基于圖片內(nèi)容播放音樂的方法可以用于終端中。其中,本實施例是在實施例一的基礎上進行的改進,所以本實施例中與實施例一的相同之處請參見實施例一即可。本公開提供的基于圖片內(nèi)容播放音樂的方法可以對具有人臉圖像的目標圖片單獨的進行人臉表情的判定,根據(jù)不同的人臉表情播放出與人臉表情相適應的音樂文件,從而提高了用戶的體驗度。該方法包括以下步驟。
[0097]在步驟S21中,獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0098]在步驟S22中,提取目標圖片的圖像特征。
[0099]在步驟S23中,利用預先生成的場景判定模型判定出目標圖片的圖像特征對應的場景標簽。
[0100]在步驟S24中,判斷場景標簽是否為人臉圖像,如果是,則執(zhí)行步驟S25 ;否則,執(zhí)行步驟S26。
[0101]在步驟S25中,利用預先生成的人臉判定模型判定出目標圖片的圖像特征對應的表情標簽,確定與表情標簽對應的表情首樂標識,建立圖片標識與表情首樂標識的對應關系,在接收到打開圖片標識對應的目標圖片的指令時,播放表情音樂標識對應的音樂文件。
[0102]其中,由于人臉圖像的表情較為多樣,所以為了使不同表情的人臉圖像對應不同的音樂,需要再劃分出幾種表情標簽,以使人臉判定模型判定出目標圖片的圖像特征對應的表情標簽。例如,表情標簽可以包括大笑、驚奇和生氣等標簽,表情標簽可以由用戶預先自行設定。人臉判定模型為預先生成的一種判定模型,人臉判定模型用于識別出目標圖片的圖像特征對應哪一種表情標簽,例如,目標圖片為一張?zhí)幱诖笮顟B(tài)的人臉圖片,那么人臉判定模型便可以識別出目標圖片的圖像特征對應的表情標簽為大笑。
[0103]另外,人臉判定模型可以通過以下步驟進行生成:第一步,創(chuàng)建表情標簽;第二步,獲取與每個表情標簽對應的指定表情圖片;第二步,提取每個場景標簽對應的指定表情圖片的圖像特征;第四步,利用預設機器學習方法對每個場景標簽對應的指定表情圖片的圖像特征進行訓練,生成所述人臉判定模型。
[0104]下面舉例說明上述生成人臉判定模型的步驟。首先,創(chuàng)建三個表情標簽,這三個表情標簽分別為大笑、驚奇和生氣。其次,分別收集人臉大笑圖片、人臉驚奇圖片和人臉生氣圖片各一萬張,其中,收集到的一萬張人臉大笑圖片可以包括兒童的人臉大笑圖片、少女的人臉大笑圖片、成年人的人臉大笑圖片和老人的人臉大笑圖片等與人臉大笑相關的圖片,收集到的一萬張人臉驚奇圖片可以包括兒童的人臉驚奇圖片、少女的人臉驚奇圖片、成年人的人臉驚奇圖片和老人的人臉驚奇圖片等與人臉驚奇相關的圖片,收集到的一萬張人臉驚奇圖片可以包括兒童的人臉生氣圖片、少女的人臉生氣圖片、成年人的人臉生氣圖片和老人的人臉生氣圖片等與人臉驚奇相關的圖片。再次,將收集到的三萬張圖片縮放到統(tǒng)一大小,例如,將這三萬張圖片均縮放到分辨率為120X120的大小。然后,分別提取出縮放后的三萬張圖片的圖像特征,例如,分別提取出縮放后的三萬張圖片的gabor紋理特征。最后,利用預設機器學習方法對三個表情標簽分別對應的一萬張人臉表情圖片的圖像特征進行訓練以生成人臉判定模型,例如,預設機器學習方法可以為SVM方法,通過SVM方法可以訓練出一個人臉判定模型,這個人臉判定模型可以識別出與大笑、驚奇和生氣相近似的圖片,并判定出該圖片屬于上述三種表情標簽中的哪種表情標簽。
[0105]另外,表情音樂標識可以為音樂文件的名稱,也可以為一個具有多個音樂文件的音樂文件夾的名稱。表情標簽與表情音樂標識的對應關系是預先建立好的,例如,假設表情標簽包括大笑標簽、驚奇標簽和生氣標簽,分別建立大笑標簽與表情音樂標識A的對應關系、驚奇標簽與表情首樂標識B的對應關系和生氣標簽與表情首樂標識C的對應關系。在建立表情標簽與表情音樂標識的對應關系的過程中,可以選擇一些與表情標簽相匹配的表情音樂標識,例如,對于大笑標簽,可以選擇音樂節(jié)奏較為喜慶的音樂類型。在選擇好表情音樂標識后,建立圖片標識與表情音樂標識的對應關系,以便于在打開圖片標識對應的目標圖片時,能夠播放表情音樂標識對應的音樂文件。而且,每個表情音樂標識均對應有一個或多個音樂文件。如果一個表情音樂標識對應有一個音樂文件,那么在接收到打開圖片標識對應的目標圖片的指令時,播放表情音樂標識對應的一個音樂文件;如果一個表情音樂標識對應有對個音樂文件,那么在接收到打開圖片標識對應的目標圖片的指令時,依次播放表情音樂標識對應的多個音樂文件。
[0106]在步驟S26中,確定與場景標簽對應的場景音樂標識。
[0107]在步驟S27中,建立圖片標識與場景首樂標識的對應關系。
[0108]在步驟S28中,在接收到打開圖片標識對應的目標圖片的指令時,播放場景音樂標識對應的音樂文件。
[0109]在圖2所示的實施例中,本公開提供的方案在目標圖片的圖像特征對應的場景標簽為人臉圖像時,可以確定出該目標圖片的圖像特征對應的表情標簽,從而在接收到打開圖片標識對應的目標圖片的指令時,播放表情音樂標識對應的音樂文件,所以本公開可以對具有人臉圖像的目標圖片單獨的進行人臉表情的判定,最終根據(jù)不同的人臉表情播放出與人臉表情相適應的音樂文件,進而提高了用戶的體驗度。
[0110]實施例三
[0111]圖3是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的裝置的示意圖。本公開提供的基于圖片內(nèi)容播放音樂的裝置可以根據(jù)圖片內(nèi)容播放適合的音樂,從而降低用戶的操作復雜度,并節(jié)省用戶的時間,進而提高了用戶的體驗度。參照圖3,該裝置包括第一獲取模塊11、第一提取模塊12、判定模塊13、確定模塊14、建立模塊15和播放模塊16。其中:
[0112]第一獲取模塊11,用于獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0113]第一提取模塊12,用于提取目標圖片的圖像特征。
[0114]判定模塊13,用于利用預先生成的場景判定模型判定出目標圖片的圖像特征對應的場景標簽。
[0115]確定模塊14,用于確定與場景標簽對應的場景音樂標識。
[0116]建立模塊15,用于建立圖片標識與場景音樂標識的對應關系。
[0117]播放模塊16,用于在接收到打開圖片標識對應的目標圖片的指令時,播放場景音樂標識對應的音樂文件。
[0118]圖4是根據(jù)一示例性實施例示出的另一種基于圖片內(nèi)容播放音樂的裝置的示意圖。參照圖4,該裝置包括場景標簽創(chuàng)建模塊21、第二獲取模塊22、第二提取模塊23、場景訓練模塊24、第一獲取模塊25、第一提取模塊26、判定模塊27、確定模塊28、建立模塊29和播放模塊210。其中:
[0119]場景標簽創(chuàng)建模塊21,用于創(chuàng)建場景標簽。
[0120]第二獲取模塊22,用于獲取與每個場景標簽對應的指定場景圖片。
[0121]第二提取模塊23,用于提取每個場景標簽對應的指定場景圖片的圖像特征。
[0122]場景訓練模塊24,用于利用預設機器學習方法對每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
[0123]第一獲取模塊25,用于獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0124]第一提取模塊26,用于提取目標圖片的圖像特征。
[0125]判定模塊27,用于利用預先生成的場景判定模型判定出目標圖片的圖像特征對應的場景標簽。
[0126]確定模塊28,用于確定與場景標簽對應的場景音樂標識。
[0127]建立模塊29,用于建立圖片標識與場景音樂標識的對應關系。
[0128]播放模塊210,用于在接收到打開圖片標識對應的目標圖片的指令時,播放場景音樂標識對應的音樂文件。
[0129]圖5是根據(jù)一示例性實施例示出的又一種基于圖片內(nèi)容播放音樂的裝置的示意圖。參照圖5,該裝置包括第一獲取模塊31、第一提取模塊32、判定模塊33、第一判斷模塊34、第一執(zhí)行模塊35、確定模塊36、建立模塊37和播放模塊38。其中:
[0130]第一獲取模塊31,用于獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0131]第一提取模塊32,用于提取目標圖片的圖像特征。
[0132]判定模塊33,用于利用預先生成的場景判定模型判定出目標圖片的圖像特征對應的場景標簽。
[0133]第一判斷模塊34,用于判斷場景標簽是否為人臉圖像。
[0134]第一執(zhí)行模塊35,用于在場景標簽為人臉圖像時,利用預先生成的人臉判定模型判定出目標圖片的圖像特征對應的表情標簽,確定與表情標簽對應的表情首樂標識,建立圖片標識與表情首樂標識的對應關系,在接收到打開圖片標識對應的目標圖片的指令時,播放表情音樂標識對應的音樂文件。在場景標簽不為人臉圖像時,執(zhí)行確定模塊36。
[0135]確定模塊36,用于確定與場景標簽對應的場景音樂標識。
[0136]建立模塊37,用于建立圖片標識與場景音樂標識的對應關系。
[0137]播放模塊38,用于在接收到打開圖片標識對應的目標圖片的指令時,播放場景音樂標識對應的音樂文件。
[0138]圖6是根據(jù)一示例性實施例示出的又一種基于圖片內(nèi)容播放音樂的裝置的示意圖。參照圖6,該裝置包括表情標簽創(chuàng)建模塊41、第三獲取模塊42、第三提取模塊43、人臉訓練模塊44、第一獲取模塊45、第一提取模塊46、判定模塊47、第一判斷模塊48、第一執(zhí)行模塊49、確定模塊410、建立模塊411和播放模塊412。其中:
[0139]表情標簽創(chuàng)建模塊41,用于創(chuàng)建表情標簽。
[0140]第三獲取模塊42,用于獲取與每個表情標簽對應的指定表情圖片。
[0141]第三提取模塊43,用于提取每個場景標簽對應的指定表情圖片的圖像特征。
[0142]人臉訓練模塊44,用于利用預設機器學習方法對每個場景標簽對應的指定表情圖片的圖像特征進行訓練,生成所述人臉判定模型。
[0143]第一獲取模塊45,用于獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0144]第一提取模塊46,用于提取目標圖片的圖像特征。
[0145]判定模塊47,用于利用預先生成的場景判定模型判定出目標圖片的圖像特征對應的場景標簽。
[0146]第一判斷模塊48,用于判斷場景標簽是否為人臉圖像。
[0147]第一執(zhí)行模塊49,用于在場景標簽為人臉圖像時,利用預先生成的人臉判定模型判定出目標圖片的圖像特征對應的表情標簽,確定與表情標簽對應的表情首樂標識,建立圖片標識與表情首樂標識的對應關系,在接收到打開圖片標識對應的目標圖片的指令時,播放表情音樂標識對應的音樂文件。在場景標簽不為人臉圖像時,執(zhí)行確定模塊36。
[0148]確定模塊410,用于確定與場景標簽對應的場景音樂標識。
[0149]建立模塊411,用于建立圖片標識與場景音樂標識的對應關系。
[0150]播放模塊412,用于在接收到打開圖片標識對應的目標圖片的指令時,播放場景音樂標識對應的音樂文件。
[0151]圖7是根據(jù)一示例性實施例示出的又一種基于圖片內(nèi)容播放音樂的裝置的示意圖。參照圖7,該裝置包括第一獲取模塊51、第一提取模塊52、判定模塊53、確定模塊54、建立模塊55、第二判斷模塊56、第二執(zhí)行模塊57和播放模塊58。其中:
[0152]第一獲取模塊51,用于獲取圖庫中的目標圖片和目標圖片的圖片標識。
[0153]第一提取模塊52,用于提取目標圖片的圖像特征。
[0154]判定模塊53,用于利用預先生成的場景判定模型判定出目標圖片的圖像特征對應的場景標簽。
[0155]確定模塊54,用于確定與場景標簽對應的場景音樂標識。
[0156]建立模塊55,用于建立圖片標識與場景音樂標識的對應關系。
[0157]第二判斷模塊56,用于判斷圖庫中是否存在未被場景判定模型判定過的圖片。
[0158]第二執(zhí)行模塊57,用于在圖庫中存在未被場景判定模型判定過的圖片時,將圖庫中未被場景判定模型判定過的圖片確定為目標圖片,并獲取目標圖片的圖片標識,執(zhí)行第一提取模塊52。在圖庫中不存在未被場景判定模型判定過的圖片時,執(zhí)行播放模塊58。
[0159]播放模塊58,用于在接收到打開圖片標識對應的目標圖片的指令時,播放場景音樂標識對應的音樂文件。
[0160]實施例四
[0161]圖8是根據(jù)一示例性實施例示出的一種基于圖片內(nèi)容播放音樂的裝置800的框圖。例如,裝置800可以是移動電話,計算機,數(shù)字廣播終端,消息收發(fā)設備,游戲控制臺,平板設備,醫(yī)療設備,健身設備,個人數(shù)字助理等。
[0162]參照圖8,裝置800可以包括以下一個或多個組件:處理組件802,存儲器804,電源組件806,多媒體組件808,音頻組件810,輸入/輸出(I/O)的接口 812,傳感器組件814,以及通信組件816。
[0163]處理組件802通常控制裝置800的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機操作和記錄操作相關聯(lián)的操作。處理組件802可以包括一個或多個處理器820來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件802可以包括一個或多個模塊,便于處理組件802和其他組件之間的交互。例如,處理組件802可以包括多媒體模塊,以方便多媒體組件808和處理組件802之間的交互。
[0164]存儲器804被配置為存儲各種類型的數(shù)據(jù)以支持在裝置800的操作。這些數(shù)據(jù)的示例包括用于在裝置800上操作的任何應用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲器804可以由任何類型的易失性或非易失性存儲設備或者它們的組合實現(xiàn),如靜態(tài)隨機存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(ROM),磁存儲器,快閃存儲器,磁盤或光盤。
[0165]電源組件806為裝置800的各種組件提供電力。電源組件806可以包括電源管理系統(tǒng),一個或多個電源,及其他與為裝置800生成、管理和分配電力相關聯(lián)的組件。
[0166]多媒體組件808包括在裝置800和用戶之間的提供一個輸出接口的屏幕。在一些實施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。觸摸傳感器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與觸摸或滑動操作相關的持續(xù)時間和壓力。在一些實施例中,多媒體組件808包括一個前置攝像頭和/或后置攝像頭。當裝置800處于操作模式,如拍攝模式或視頻模式時,前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學透鏡系統(tǒng)或具有焦距和光學變焦能力。
[0167]音頻組件810被配置為輸出和/或輸入音頻信號。例如,音頻組件810包括一個麥克風(MIC),當裝置800處于操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器804或經(jīng)由通信組件816發(fā)送。在一些實施例中,音頻組件810還包括一個揚聲器,用于輸出音頻信號。
[0168]I/O接口 812為處理組件802和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
[0169]傳感器組件814包括一個或多個傳感器,用于為裝置800提供各個方面的狀態(tài)評估。例如,傳感器組件814可以檢測到裝置800的打開/關閉狀態(tài),組件的相對定位,例如組件為裝置800的顯示器和小鍵盤,傳感器組件814還可以檢測裝置800或裝置800 —個組件的位置改變,用戶與裝置800接觸的存在或不存在,裝置800方位或加速/減速和裝置800的溫度變化。傳感器組件814可以包括接近傳感器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件814還可以包括光傳感器,如CMOS或CXD圖像傳感器,用于在成像應用中使用。在一些實施例中,該傳感器組件814還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
[0170]通信組件816被配置為便于裝置800和其他設備之間有線或無線方式的通信。裝置800可以接入基于通信標準的無線網(wǎng)絡,如WiFi,2G或3G,或它們的組合。在一個示例性實施例中,通信組件816經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關信息。在一個示例性實施例中,通信組件816還包括近場通信(NFC)模塊,以促進短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術,紅外數(shù)據(jù)協(xié)會(IrDA)技術,超寬帶(UWB)技術,藍牙(BT)技術和其他技術來實現(xiàn)。
[0171]在示例性實施例中,裝置800可以被一個或多個應用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設備(DSro)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現(xiàn),用于執(zhí)行上述方法。
[0172]在示例性實施例中,還提供了一種包括指令的非臨時性計算機可讀存儲介質(zhì),例如包括指令的存儲器804,上述指令可由裝置800的處理器820執(zhí)行以完成上述方法。例如,非臨時性計算機可讀存儲介質(zhì)可以是ROM、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲設備等。
[0173]一種非臨時性計算機可讀存儲介質(zhì),當存儲介質(zhì)中的指令由移動終端的處理器執(zhí)行時,使得移動終端能夠執(zhí)行一種基于圖片內(nèi)容播放音樂的方法,方法包括:獲取圖庫中的目標圖片和目標圖片的圖片標識;提取目標圖片的圖像特征;利用預先生成的場景判定模型判定出目標圖片的圖像特征對應的場景標簽;確定與場景標簽對應的場景音樂標識;建立圖片標識與場景音樂標識的對應關系;在接收到打開圖片標識對應的目標圖片的指令時,播放場景音樂標識對應的音樂文件。
[0174]本領域技術人員在考慮說明書及實踐這里公開的發(fā)明后,將容易想到本發(fā)明的其它實施方案。本申請旨在涵蓋本發(fā)明的任何變型、用途或者適應性變化,這些變型、用途或者適應性變化遵循本發(fā)明的一般性原理并包括本公開未公開的本【技術領域】中的公知常識或慣用技術手段。說明書和實施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權利要求指出。
[0175]應當理解的是,本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結構,并且可以在不脫離其范圍進行各種修改和改變。本發(fā)明的范圍僅由所附的權利要求來限制。
【權利要求】
1.一種基于圖片內(nèi)容播放音樂的方法,其特征在于,包括: 獲取圖庫中的目標圖片和所述目標圖片的圖片標識; 提取所述目標圖片的圖像特征; 利用預先生成的場景判定模型判定出所述目標圖片的圖像特征對應的場景標簽; 確定與所述場景標簽對應的場景音樂標識; 建立所述圖片標識與所述場景音樂標識的對應關系; 在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述場景音樂標識對應的首樂文件。
2.根據(jù)權利要求1所述的基于圖片內(nèi)容播放音樂的方法,其特征在于,所述方法還包括: 創(chuàng)建場景標簽; 獲取與每個場景標簽對應的指定場景圖片; 提取所述每個場景標簽對應的指定場景圖片的圖像特征; 利用預設機器學習方法對所述每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
3.根據(jù)權利要求1所述的基于圖片內(nèi)容播放音樂的方法,其特征在于,所述方法還包括: 判斷所述場景標簽是否為人臉圖像; 在所述場景標簽為所述人臉圖像時,利用預先生成的人臉判定模型判定出所述目標圖片的圖像特征對應的表情標簽,確定與所述表情標簽對應的表情音樂標識,建立所述圖片標識與所述表情音樂標識的對應關系,在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述表情音樂標識對應的音樂文件; 在所述場景標簽不為所述人臉圖像時,執(zhí)行所述確定與所述場景標簽對應的音樂標識的步驟。
4.根據(jù)權利要求3所述的基于圖片內(nèi)容播放音樂的方法,其特征在于,所述方法還包括: 創(chuàng)建表情標簽; 獲取與每個表情標簽對應的指定表情圖片; 提取所述每個場景標簽對應的指定表情圖片的圖像特征; 利用預設機器學習方法對所述每個場景標簽對應的指定表情圖片的圖像特征進行訓練,生成所述人臉判定模型。
5.根據(jù)權利要求1所述的基于圖片內(nèi)容播放音樂的方法,其特征在于,所述方法還包括: 判斷所述圖庫中是否存在未被所述場景判定模型判定過的圖片; 在所述圖庫中存在未被所述場景判定模型判定過的圖片時,將所述圖庫中未被所述場景判定模型判定過的圖片確定為目標圖片,并獲取所述目標圖片的圖片標識,執(zhí)行所述提取所述目標圖片的圖像特征的步驟; 在所述圖庫中不存在未被所述場景判定模型判定過的圖片時,執(zhí)行所述在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述場景音樂標識對應的音樂文件的步驟。
6.一種基于圖片內(nèi)容播放音樂的裝置,其特征在于,包括: 第一獲取模塊,用于獲取圖庫中的目標圖片和所述目標圖片的圖片標識; 第一提取模塊,用于提取所述目標圖片的圖像特征; 判定模塊,用于利用預先生成的場景判定模型判定出所述目標圖片的圖像特征對應的場景標簽; 確定模塊,用于確定與所述場景標簽對應的場景音樂標識; 建立模塊,用于建立所述圖片標識與所述場景音樂標識的對應關系; 播放模塊,用于在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述場景首樂標識對應的首樂文件。
7.根據(jù)權利要求6所述的基于圖片內(nèi)容播放音樂的裝置,其特征在于,所述裝置還包括: 場景標簽創(chuàng)建模塊,用于創(chuàng)建場景標簽; 第二獲取模塊,用于獲取與每個場景標簽對應的指定場景圖片; 第二提取模塊,用于提取所述每個場景標簽對應的指定場景圖片的圖像特征; 場景訓練模塊,用于利用預設機器學習方法對所述每個場景標簽對應的指定場景圖片的圖像特征進行訓練,生成所述場景判定模型。
8.根據(jù)權利要求6所述的基于圖片內(nèi)容播放音樂的裝置,其特征在于,所述裝置還包括: 第一判斷模塊,用于判斷所述場景標簽是否為人臉圖像; 第一執(zhí)行模塊,用于在所述場景標簽為所述人臉圖像時,利用預先生成的人臉判定模型判定出所述目標圖片的圖像特征對應的表情標簽,確定與所述表情標簽對應的表情音樂標識,建立所述圖片標識與所述表情音樂標識的對應關系,在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述表情音樂標識對應的音樂文件;在所述場景標簽不為所述人臉圖像時,執(zhí)行所述確定模塊。
9.根據(jù)權利要求8所述的基于圖片內(nèi)容播放音樂的裝置,其特征在于,所述裝置還包括: 表情標簽創(chuàng)建模塊,用于創(chuàng)建表情標簽; 第三獲取模塊,用于獲取與每個表情標簽對應的指定表情圖片; 第三提取模塊,用于提取所述每個場景標簽對應的指定表情圖片的圖像特征; 人臉訓練模塊,用于利用預設機器學習方法對所述每個場景標簽對應的指定表情圖片的圖像特征進行訓練,生成所述人臉判定模型。
10.根據(jù)權利要求6所述的基于圖片內(nèi)容播放音樂的裝置,其特征在于,所述裝置還包括:第二判斷模塊,用于判斷所述圖庫中是否存在未被所述場景判定模型判定過的圖片;第二執(zhí)行模塊,用于在所述圖庫中存在未被所述場景判定模型判定過的圖片時,將所述圖庫中未被所述場景判定模型判定過的圖片確定為目標圖片,并獲取所述目標圖片的圖片標識,執(zhí)行所述第一提取模塊;在所述圖庫中不存在未被所述場景判定模型判定過的圖片時,執(zhí)行所述播放模塊。
11.一種基于圖片內(nèi)容播放音樂的裝置,其特征在于,包括: 處理器; 用于存儲處理器可執(zhí)行指令的存儲器; 其中,所述處理器被配置為: 獲取圖庫中的目標圖片和所述目標圖片的圖片標識; 提取所述目標圖片的圖像特征; 利用預先生成的場景判定模型判定出所述目標圖片的圖像特征對應的場景標簽; 確定與所述場景標簽對應的場景音樂標識; 建立所述圖片標識與所述場景音樂標識的對應關系; 在接收到打開所述圖片標識對應的目標圖片的指令時,播放所述場景音樂標識對應的音樂文件。
【文檔編號】G11B31/00GK104268547SQ201410432877
【公開日】2015年1月7日 申請日期:2014年8月28日 優(yōu)先權日:2014年8月28日
【發(fā)明者】張濤, 陳志軍, 秦秋平 申請人:小米科技有限責任公司