本發(fā)明涉及網絡通信技術領域,特別涉及一種構建樂譜庫的方法和裝置。
背景技術:
隨著網絡通信技術的發(fā)展,多媒體服務器的功能越來越強大;多媒體服務器向終端從發(fā)送歌曲時,不僅可以向終端發(fā)送歌曲,還能夠向終端發(fā)送歌曲的樂譜,以使終端在播放歌曲的同時,在當前播放界面上顯示歌曲的樂譜。因此,多媒體服務器向終端發(fā)送歌曲的樂譜之前,需要構建樂譜庫。
目前,多媒體服務器在構建樂譜庫時,多媒體服務器先獲取提供樂譜的目標網站的網址,根據該目標網站的網址,從目標網站中爬取包含樂譜的圖像。該圖像中往往包含該樂譜的歌曲的名稱;然后人工從該圖像中識別出該樂譜的歌曲的名稱。多媒體服務器將該歌曲的名稱和包含該樂譜的圖像對應關系添加到樂譜庫中。
在實現本發(fā)明的過程中,發(fā)明人發(fā)現現有技術至少存在以下問題:
由于目標網站中包含樂譜的圖像往往為用戶上傳的,該圖像中可能包含錯誤的樂譜,從而導致多媒體服務器構建樂譜庫中包含錯誤的樂譜,也即上述方法構建樂譜庫的準確性差。
技術實現要素:
為了解決現有技術的問題,本發(fā)明提供了一種構建樂譜庫的方法和裝置。技術方案如下:
第一方面,本發(fā)明實施例提供了一種構建樂譜庫的方法,所述方法包括:
從目標網站中爬取樂譜,以及,從所述目標網站中爬取所述樂譜對應的多媒體文件的標識;
根據所述多媒體文件的標識,獲取所述多媒體文件;
根據所述樂譜和所述多媒體文件,驗證所述樂譜與所述多媒體文件是否匹配;
如果所述樂譜與所述多媒體文件匹配,將所述樂譜和所述多媒體文件的標識的對應關系添加到樂譜庫中。
可選的,所述根據所述樂譜和所述多媒體文件,驗證所述樂譜與所述多媒體文件是否匹配,包括:
根據所述樂譜和所述多媒體文件,通過預設相似度算法,確定所述樂譜和所述多媒體文件之間的相似度;
如果所述相似度超過預設閾值,確定所述樂譜與所述多媒體文件匹配。
可選的,所述根據所述樂譜和所述多媒體文件,通過預設相似度算法,確定所述樂譜和所述多媒體文件之間的相似度之前,所述方法還包括:
獲取預設數目個樣本樂譜、每個樣本樂譜對應的多媒體文件,以及,所述每個樣本樂譜和每個多媒體文件之間的相似度;
根據所述每個樣本樂譜、所述每個樣本樂譜對應的多媒體文件,以及,所述每個樣本樂譜和每個多媒體文件之間的相似度,通過迭代算法,對所述預設相似度算法進行優(yōu)化。
可選的,所述將所述樂譜和所述多媒體文件的標識的對應關系添加到樂譜庫中之前,所述方法還包括:
將指定標注信息添加到所述樂譜中,所述指定標注信息用于標注多媒體服務器。
可選的,所述將所述樂譜和所述多媒體文件的標識的對應關系添加到樂譜庫中之后,所述方法還包括:
接收終端發(fā)送的反饋信息,所述反饋信息中包括所述樂譜中待校正的音符標識和校正后的音符;
根據所述音符標識,將所述樂譜中待校正的音符修改為所述校正后的音符。
可選的,所述根據所述音符標識,將所述樂譜中待校正的音符修改為所述校正后的音符之前,所述方法還包括:
統計接收所述反饋信息的接收次數;
如果所述接收次數超過預設次數,執(zhí)行所述根據所述音符標識,將所述樂譜中待校正的音符修改為所述校正后的音符的步驟。
可選的,所述從目標網站中爬取樂譜,包括:
獲取所述目標網站的標識,根據所述目標網站的標識,獲取所述目標網站中樂譜所在的位置信息;
根據所述目標網站的標識和所述位置信息,在所述目標網站中確定所述位置信息對應的爬取區(qū)域;
從所述爬取區(qū)域中爬取所述樂譜。
可選的,所述從所述爬取區(qū)域中爬取所述樂譜,包括:
從所述爬取區(qū)域中爬取包含所述樂譜的圖像;
從所述圖像中識別出所述樂譜的音符序列和節(jié)拍標識,將所述音符序列和所述節(jié)拍標識組成所述樂譜。
可選的,所述從所述目標網站中爬取所述樂譜對應的多媒體文件的標識,包括:
從所述目標網站中爬取文字信息,從所述文字信息中提取所述樂譜對應的多媒體文件的標識。
可選的,如果從所述目標網站中沒有爬取到所述多媒體文件的標識,所述方法還包括:
根據所述樂譜,從多媒體文件庫中選擇與所述樂譜匹配的多媒體文件;
將所述樂譜和選擇的多媒體文件的標識的對應關系添加到樂譜庫中。
可選的,所述根據所述樂譜,從多媒體文件庫中選擇與所述樂譜匹配的多媒體文件,包括:
獲取所述多媒體文件庫中的每個多媒體文件;
根據所述樂譜和所述每個多媒體文件,通過預設相似度算法,確定所述樂譜與所述每個多媒體文件之間的相似度;
根據所述樂譜與所述每個多媒體文件之間的相似度,從所述多媒體文件庫中選擇相似度滿足預設條件的多媒體文件;
將選擇的多媒體文件確定為與所述樂譜匹配的多媒體文件。
第二方面,本發(fā)明實施例提供了一種構建樂譜庫的裝置,所述裝置包括:
第一爬取模塊,用于從目標網站中爬取樂譜;
第二爬取模塊,用于從所述目標網站中爬取所述樂譜對應的多媒體文件的標識。
第一獲取模塊,用于根據所述多媒體文件的標識,獲取所述多媒體文件。
驗證模塊,用于根據所述樂譜和所述多媒體文件,驗證所述樂譜與所述多媒體文件是否匹配。
第一添加模塊,用于如果所述樂譜與所述多媒體文件匹配,將所述樂譜和所述多媒體文件的標識的對應關系添加到樂譜庫中。
可選的,所述驗證模塊,包括:
第一確定單元,用于根據所述樂譜和所述多媒體文件,通過預設相似度算法,確定所述樂譜和所述多媒體文件之間的相似度;
第二確定單元,用于如果所述相似度超過預設閾值,確定所述樂譜與所述多媒體文件匹配。
可選的,所述裝置還包括:
第二獲取模塊,用于獲取預設數目個樣本樂譜、每個樣本樂譜對應的多媒體文件,以及,所述每個樣本樂譜和每個多媒體文件之間的相似度;
優(yōu)化模塊,用于根據所述每個樣本樂譜、所述每個樣本樂譜對應的多媒體文件,以及,所述每個樣本樂譜和每個多媒體文件之間的相似度,通過迭代算法,對所述預設相似度算法進行優(yōu)化。
可選的,所述裝置還包括:
第二添加模塊,用于將指定標注信息添加到所述樂譜中,所述指定標注信息用于標注多媒體服務器。
可選的,所述裝置還包括:
接收模塊,用于接收終端發(fā)送的反饋信息,所述反饋信息中包括所述樂譜中待校正的音符標識和校正后的音符;
修改模塊,用于根據所述音符標識,將所述樂譜中待校正的音符修改為所述校正后的音符。
可選的,所述裝置還包括:
統計模塊,用于統計接收所述反饋信息的接收次數;
所述修改模塊,還用于如果所述接收次數超過預設次數,執(zhí)行所述根據所述音符標識,將所述樂譜中待校正的音符修改為所述校正后的音符。
可選的,所述第一爬取模塊,包括:
第一獲取單元,用于獲取所述目標網站的標識,根據所述目標網站的標識,獲取所述目標網站中樂譜所在的位置信息;
第三確定單元,用于根據所述目標網站的標識和所述位置信息,在所述目標網站中確定所述位置信息對應的爬取區(qū)域;
爬取單元,用于從所述爬取區(qū)域中爬取所述樂譜。
可選的,所述爬取單元,還用于從所述爬取區(qū)域中爬取包含所述樂譜的圖像;從所述圖像中識別出所述樂譜的音符序列和節(jié)拍標識,將所述音符序列和所述節(jié)拍標識組成所述樂譜。
可選的,所述第二爬取模塊,還用于從所述目標網站中爬取文字信息,從所述文字信息中提取所述樂譜對應的多媒體文件的標識。
可選的,如果從所述目標網站中沒有爬取到所述多媒體文件的標識,所述裝置還包括:
選擇模塊,用于根據所述樂譜,從多媒體文件庫中選擇與所述樂譜匹配的多媒體文件;
第三添加模塊,用于將所述樂譜和選擇的多媒體文件的標識的對應關系添加到樂譜庫中。
可選的,所述選擇模塊,包括:
第二獲取單元,用于獲取所述多媒體文件庫中的每個多媒體文件;
第四確定單元,用于根據所述樂譜和所述每個多媒體文件,通過預設相似度算法,確定所述樂譜與所述每個多媒體文件之間的相似度;
選擇單元,用于根據所述樂譜與所述每個多媒體文件之間的相似度,從所述多媒體文件庫中選擇相似度滿足預設條件的多媒體文件;
第五確定單元,用于將選擇的多媒體文件確定為與所述樂譜匹配的多媒體文件。
本發(fā)明實施例中,多媒體服務器從目標網站中爬取樂譜和該樂譜對應的多媒體文件的標識,獲取該樂譜對應的多媒體文件,并通過驗證該樂譜與該多媒體文件是否匹配,如果該樂譜與該多媒體文件匹配,才將該樂譜和該多媒體文件的標識的對應關系添加到樂譜庫中,使得多媒體服務器構建的樂譜庫中每個樂譜均與該樂譜對應的多媒體文件匹配,提高了多媒體服務器構建樂譜庫的準確性。
附圖說明
圖1是本發(fā)明實施例提供的一種構建樂譜庫的方法流程圖;
圖2是本發(fā)明實施例提供的一種構建樂譜庫的方法流程圖;
圖3是本發(fā)明實施例提供的一種構建樂譜庫的裝置結構示意圖;
圖4是本發(fā)明實施例提供的一種構建樂譜庫的裝置結構示意圖。
具體實施方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明實施方式作進一步地詳細描述。
本發(fā)明實施例提供了一種構建樂譜庫的方法,該方法的執(zhí)行主體可以為多媒體服務器,該多媒體服務器可以為音頻服務器或者視頻服務器等,參見圖1,該方法包括:
步驟101:從目標網站中爬取樂譜,以及,從目標網站中爬取該樂譜對應的多媒體文件的標識。
步驟102:根據多媒體文件的標識,獲取該多媒體文件。
步驟103:根據該樂譜和該多媒體文件,驗證該樂譜與該多媒體文件是否匹配。
步驟104:如果該樂譜與該多媒體文件匹配,將該樂譜和該多媒體文件的標識的對應關系添加到樂譜庫中。
可選的,根據該樂譜和該多媒體文件,驗證該樂譜與該多媒體文件是否匹配,包括:
根據該樂譜和該多媒體文件,通過預設相似度算法,確定該樂譜和該多媒體文件之間的相似度;
如果該相似度超過預設閾值,確定該樂譜與該多媒體文件匹配。
可選的,根據該樂譜和該多媒體文件,通過預設相似度算法,確定該樂譜和該多媒體文件之間的相似度之前,該方法還包括:
獲取預設數目的樣本樂譜、每個樣本樂譜對應的多媒體文件,以及,每個樣本樂譜和每個多媒體文件之間的相似度;
根據每個樣本樂譜、每個樣本樂譜對應的多媒體文件,以及,每個樣本樂譜和每個多媒體文件之間的相似度,通過迭代算法,對該預設相似度算法進行優(yōu)化。
可選的,將該樂譜和該多媒體文件的標識的對應關系添加到樂譜庫中之前,該方法還包括:
將指定標注信息添加到該樂譜中,該指定標注信息用于標注多媒體服務器。
可選的,將該樂譜和該多媒體文件的標識的對應關系添加到樂譜庫中之后,該方法還包括:
接收終端發(fā)送的反饋信息,該反饋信息中包括該樂譜中待校正的音符標識和校正后的音符;
根據該音符標識,將該樂譜中待校正的音符修改為該校正后的音符。
可選的,根據該音符標識,將該樂譜中待校正的音符修改為該校正后的音符之前,該方法還包括:
統計接收該反饋信息的接收次數;
如果該接收次數超過預設次數,執(zhí)行根據該音符標識,將該樂譜中待校正的音符修改為該校正后的音符的步驟。
可選的,從目標網站中爬取樂譜,包括:
獲取目標網站的標識,根據目標網站的標識,獲取該目標網站中樂譜所在的位置信息;
根據該目標網站的標識和該位置信息,在該目標網站中確定該位置信息對應的爬取區(qū)域;
從該爬取區(qū)域中爬取樂譜。
可選的,從該爬取區(qū)域中爬取樂譜,包括:
從該爬取區(qū)域中爬取包含該樂譜的圖像;
從該圖像中識別出該樂譜的音符序列和節(jié)拍標識,將該音符序列和該節(jié)拍標識組成該樂譜。
可選的,從目標網站中爬取該樂譜對應的多媒體文件的標識,包括:
從目標網站中的指定區(qū)域爬取文字信息,從該文字信息中提取該樂譜對應的多媒體文件的標識。
可選的,如果從目標網站中沒有爬取到該多媒體文件的標識,該方法還包括:
根據該樂譜,從多媒體文件庫中選擇與該樂譜匹配的多媒體文件;
將該樂譜和選擇的多媒體文件的標識的對應關系添加到樂譜庫中。
可選的,根據該樂譜,從多媒體文件庫中選擇與該樂譜匹配的多媒體文件,包括:
獲取多媒體文件庫中的每個多媒體文件的多媒體文件;
根據該樂譜和該每個多媒體文件的多媒體文件,通過預設相似度算法,確定該樂譜與該每個多媒體文件之間的相似度;
根據該樂譜與該每個多媒體文件之間的相似度,從該多媒體文件庫中選擇相似度滿足預設條件的多媒體文件;
將選擇的多媒體文件確定為與該樂譜匹配的多媒體文件。
本發(fā)明實施例中,多媒體服務器從目標網站中爬取樂譜和該樂譜對應的多媒體文件的標識,獲取該樂譜對應的多媒體文件,并通過驗證該樂譜與該多媒體文件是否匹配,如果該樂譜與該多媒體文件匹配,才將該樂譜和該多媒體文件的標識的對應關系添加到樂譜庫中,使得多媒體服務器構建的樂譜庫中每個樂譜均與該樂譜對應的多媒體文件匹配,提高了多媒體服務器構建樂譜庫的準確性。
本發(fā)明實施例提供了一種構建樂譜庫的方法,該方法的執(zhí)行主體可以為多媒體服務器,參見圖2,該方法包括:
步驟201:多媒體服務器從目標網站中爬取樂譜,以及,從目標網站中爬取該樂譜對應的多媒體文件的標識。
本步驟可以通過以下步驟2011-2014實現,包括:
步驟2011:多媒體服務器獲取目標網站的標識,根據目標網站的標識,獲取該目標網站中樂譜所在的位置信息。
多媒體服務器中事先存儲一個網站標識列表,該網站標識列表中包括至少一個網站的標識;在本步驟中,多媒體服務器從該網站標識列表中獲取一個網站的標識作為目標網站的標識。需要說明的是,如果該網站標識列表中包括多個網站的標識時,多媒體服務器也可以從該網站標識列表中獲取多個網站的標識,將每個網站的標識都作為目標網站的標識。
本步驟中,該目標網站中有至少一個樂譜,多媒體服務器預先存儲了該目標網站中該至少一個樂譜所在的位置信息和該目標網站的標識的對應關系,因此,多媒體服務器根據目標網站的標識,獲取該目標網站中樂譜所在的位置信息的步驟可以為:
多媒體服務器根據該目標網站的標識,從目標網站的標識和該至少一個樂譜所在的位置信息的對應關系中,確定該目標網站中至少一個樂譜所在的位置信息。
其中,該目標網站的標識可以為該目標網站的地址。該樂譜所在的位置信息可以為樂譜在該目標網站的網頁中的具體字段位置。
本發(fā)明實施例中,多媒體服務器可以將樂譜所在的位置信息存儲到位置信息列表中。多媒體服務器定期更新該網站標識列表和該位置信息列表。
步驟2012:多媒體服務器根據該目標網站的標識和該位置信息,在該目標網站中確定該位置信息對應的爬取區(qū)域。
多媒體服務器根據該目標網站的標識,確定該目標網站;根據該位置信息,在該目標網站中確定該位置信息對應的爬取區(qū)域。
步驟2013:多媒體服務器從該爬取區(qū)域中爬取樂譜。
本發(fā)明實施例中,多媒體服務器從該爬取區(qū)域中爬取的是一張包含該樂譜的圖像,多媒體服務器并不能直接讀取出該圖像中的樂譜包含的音符序列和節(jié)拍標識,多媒體服務器還需要對該圖像做進一步的處理,才能得到該多媒體服務器能夠讀取并識別的樂譜,因此,本步驟可以為:多媒體服務器從該爬取區(qū)域中爬取包含該樂譜的圖像;多媒體服務器從該圖像中識別出該樂譜的音符序列和節(jié)拍標識,將該音符序列和該節(jié)拍標識組成該樂譜。
本步驟中,多媒體服務器從該爬取區(qū)域爬取到包含該樂譜的圖像后,多媒體服務器可以通過預設的識別算法,識別出該樂譜中每個音符在該圖像中的位置,以及該樂譜的節(jié)拍標識,根據該樂譜中每個音符在該圖像中的位置,將該樂譜包括的多個音符的組合為音符序列,并將該音符序列和該節(jié)拍標識組成樂譜。
其中,該音符序列和該節(jié)拍標識組成的樂譜可以為電子樂譜,多媒體服務器存儲了該電子樂譜中音符序列的聲學特征,例如該音符序列對應的音高、旋律等;該預設的識別算法可以根據用戶需要設置并更改,本發(fā)明實施例對此不做具體限定。例如,該預設的識別算法可以為基于OCR(Optical Character Recognition,光學字符識別)與音符頻譜自動識別算法。
步驟2014:多媒體服務器從目標網站中爬取該樂譜對應的多媒體文件的標識。
本發(fā)明實施例中,目標網站中還可以包含文字信息,該文字信息中存儲了該樂譜對應的多媒體文件的標識,多媒體服務器還可以從該目標網站爬取該文字信息,進而獲取該樂譜對應的多媒體的標識。相應的,本步驟可以為:
多媒體服務器從目標網站中指定區(qū)域爬取文字信息,從該文字信息中提取該樂譜對應的多媒體文件的標識。
本步驟中,該指定區(qū)域可以為該目標網站中該樂譜所在的位置信息的周圍區(qū)域,例如,該指定區(qū)域為該樂譜所在的網頁地址中該樂譜所在的當前字段的前一行字段或者后一行字段等。
該多媒體服務器預先存儲了該目標網站的指定區(qū)域的標識,多媒體服務器獲取該指定區(qū)域的標識,根據該指定區(qū)域的標識,從該指定區(qū)域的標識對應的目標網站的指定區(qū)域中,獲取該文字信息。
其中,該指定區(qū)域的標識可以根據用戶需要設置并更改,本發(fā)明實施例對此不作具體限定,例如,該指定區(qū)域的標識可以為該目標網站的地址和該指定區(qū)域在網頁中的字段。
步驟202:多媒體服務器根據多媒體文件的標識,獲取該多媒體文件。
本發(fā)明實施例中,多媒體服務器中存儲了多個多媒體文件的標識和多媒體文件的對應關系,多媒體服務器根據爬取到的多媒體文件的標識,從多媒體文件的標識和多媒體文件的對應關系中,確定出該多媒體文件的標識對應的多媒體文件。
其中,該多媒體文件的標識可以根據用戶需要設置并更改,本發(fā)明實施例對此不作具體限定。例如,該多媒體文件的標識可以為該多媒體文件對應的歌曲名稱。
本發(fā)明實施例提供的一種可能的設計中,如果多媒體服務器從目標網站中沒有爬取到該多媒體文件的標識,多媒體服務器無法根據多媒體文件的標識,獲取該多媒體文件,對應的,多媒體服務器獲取多媒體服務器中存儲的多媒體文件庫,從該多媒體文件庫中獲取多個多媒體文件。
步驟203:多媒體服務器根據該樂譜和該多媒體文件,驗證該樂譜與該多媒體文件是否匹配。
本步驟中,多媒體服務器獲取樂譜和該樂譜對應的多媒體文件之后,為了提高構建的樂譜庫中每一個多媒體文件對應的樂譜的準確性,多媒體服務器還可以驗證該樂譜與該多媒體文件是否匹配,其中,多媒體服務器可以通過預設相似度算法,計算該樂譜和該多媒體文件之間的相似度,進而驗證該樂譜與該多媒體文件是否匹配,具體的,本步驟可以通過以下步驟2031-2032實現。
步驟2031:多媒體服務器根據該樂譜和該多媒體文件,通過預設相似度算法,確定該樂譜和該多媒體文件之間的相似度。
本發(fā)明實施例中,該預設相似度算法可以根據用戶需要設置并更改,本發(fā)明實施例對此不作具體限定,例如,該預設相似度算法可以為基于色度特征和動態(tài)時間的卷曲算法。
其中,多媒體服務器根據該預設相似度算法,計算該樂譜和該多媒體文件之間的相似度之前,為了提高根據該預設相似度算法計算出的相似度的準確性,多媒體服務器還可以先對該預設相似度算法進行優(yōu)化,具體的,多媒體服務器對該預設相似度算法進行優(yōu)化的步驟可以為:多媒體服務器獲取預設數目的樣本樂譜、每個樣本樂譜對應的多媒體文件,以及,每個樣本樂譜和每個多媒體文件之間的相似度;多媒體服務器根據每個樣本樂譜、每個樣本樂譜對應的多媒體文件,以及,每個樣本樂譜和每個多媒體文件之間的相似度,通過迭代算法,對該預設相似度算法進行優(yōu)化。
需要說明的是,多媒體服務器預先存儲了該多個樣本樂譜和每個樣本樂譜對應的多媒體文件之間的相似度,多媒體服務器對該預設相似度算法進行優(yōu)化時,多媒體服務器從該多個樣本樂譜中,獲取預設數目個樣本樂譜,并獲取每個樣本樂譜對應多媒體文件,多媒體服務器通過迭代算法,將該多個樣本樂譜和每個樣本樂譜對應的多媒體文件代入到該預設相似度算法中,計算該樣本樂譜和該多媒體文件之間的相似度,根據該相似度和多媒體服務器中存儲的該樣本樂譜和該多媒體文件之間的相似度,對該預設相似度算法進行優(yōu)化。
其中,多媒體服務器根據該相似度和多媒體服務器中存儲的該樣本樂譜和該多媒體文件之間的相似度,對該預設相似度算法進行優(yōu)化的步驟可以為:
多媒體服務器獲取多媒體服務器中存儲的該樣本樂譜和該多媒體文件之間的相似度,將該相似度與多媒體服務器中存儲的相似度進行比對,根據該相似度和該多媒體服務器中存儲的相似度,調整該預設相似度算法的參數,確定出使得該相似度和該多媒體服務器存儲的相似度最接近時的參數,并將該參數寫入該預設相似度算法中,進而對該預設相似度算法進行優(yōu)化。
然后,多媒體服務器根據該樂譜和該多媒體文件,通過優(yōu)化后的預設相似度算法,確定該樂譜和該多媒體文件之間的相似度。
其中,多媒體服務器計算該樂譜和該多媒體文件的相似度時,多媒體服務器通過該多媒體文件的音頻信號,根據該樂譜和該音頻信號,確定該樂譜和該多媒體文件之間的相似度,因此,本步驟可以為:
多媒體服務器提取該多媒體文件中包括的音頻信號,根據該音頻信號和該樂譜,將該樂譜和該音頻信號代入該優(yōu)化后的預設相似度算法,計算該樂譜和該音頻信號之間的相似度,進而確定出該樂譜和該多媒體文件之間的相似度。
步驟2032:如果該相似度超過預設閾值,多媒體服務器確定該樂譜與該多媒體文件匹配。
本步驟中,多媒體服務器根據該樂譜和該多媒體文件之間的相似度,確定該樂譜和該多媒體文件是否匹配:如果該相似度超過預設閾值,多媒體服務器確定該樂譜與該多媒體文件匹配;如果該相似度不超過預設閾值,多媒體服務器確定該樂譜與該多媒體文件不匹配。
其中,該預設閾值可以根據用戶需要設置并更改,本發(fā)明實施例對此不做具體限定,例如,該預設閾值可以90%、95%等。
如果該樂譜與該多媒體文件匹配,執(zhí)行步驟204;如果該樂譜和該多媒體文件不匹配,丟棄該樂譜。
步驟204:如果該樂譜與該多媒體文件匹配,多媒體服務器將該樂譜和該多媒體文件的標識的對應關系添加到樂譜庫中。
本步驟中,如果該樂譜與該多媒體文件匹配,多媒體服務器將該樂譜和該多媒體文件的標識的對應關系添加到樂譜中之前,多媒體服務器還可以在該樂譜中添加多媒體服務器的版權歸屬標識,具體過程可以為:多媒體服務器將指定標注信息添加到該樂譜中,該指定標注信息用于標注該多媒體服務器。
本步驟中,該指定標注信息可以根據用戶需要設置并更改,本發(fā)明實施例對此不做具體限定,例如,該指定標注信息可以為該多媒體服務器的地址或者該多媒體服務器的名稱等。
然后,多媒體服務器再將該添加指定標注信息后的樂譜和該多媒體文件的標識的對應關系添加到該樂譜庫中。
這樣,多媒體服務器根據每個多媒體文件對應的樂譜,構建該多媒體文件庫對應的樂譜庫。
本發(fā)明實施例提供的一種可能的設計中,如果多媒體服務器從目標網站中沒有爬取到該多媒體文件的標識,多媒體服務器獲取多媒體服務器中存儲的多媒體文件庫,從該多媒體文件庫中獲取多個多媒體文件,進而從該多個多媒體文件中選擇與該樂譜匹配的多媒體文件,具體過程可以為:
多媒體服務器獲取多媒體文件庫中的每個多媒體文件;多媒體服務器根據該樂譜和該每個多媒體文件,通過預設相似度算法,確定該樂譜與該每個多媒體文件之間的相似度;多媒體服務器根據該樂譜與該每個多媒體文件之間的相似度,從該多媒體文件庫中選擇相似度滿足預設條件的多媒體文件;多媒體服務器將選擇的多媒體文件確定為與該樂譜匹配的多媒體文件。
進而,多媒體服務器將該樂譜和選擇的多媒體文件的標識的對應關系添加到樂譜庫中。
本步驟中,多媒體服務器確定該樂譜與該每個多媒體文件之間的相似度的實現方式同步驟203的實現方式一致,此處不再一一贅述。
其中,該預設條件可以根據用戶需要設置并更改,本發(fā)明實施例對此不做具體限定。例如,該預設條件可以為相似度最高且達到預設閾值。
本發(fā)明實施例提供的一種可能的設計中,多媒體服務器將該樂譜錄入到該樂譜庫中之后,多媒體服務器可以通過以下步驟205,根據終端發(fā)送的反饋信息,對該樂譜進行進一步的優(yōu)化。
步驟205:多媒體服務器接收終端發(fā)送的反饋信息,該反饋信息中包括該樂譜中待校正的音符標識和校正后的音符;多媒體服務器根據該音符標識,將該樂譜中待校正的音符修改為該校正后的音符。
本發(fā)明實施例中,多媒體服務器可以向終端提供終端一個反饋入口,終端向用戶顯示樂譜時,終端在當前界面提供反饋按鈕,用戶查看該樂譜時,如果發(fā)現該樂譜中存在待校正的音符,可以觸發(fā)該反饋按鈕,在彈出的反饋輸入框輸入反饋信息,當終端檢測到用戶在反饋輸入框中輸入的反饋信息時,終端獲取該反饋信息,并通過該反饋入口,向多媒體服務器發(fā)送該反饋信息。
其中,該反饋信息中至少包括樂譜中待校正的音符標識,以及校正后的音符,便于多媒體服務器根據該待校正的音符標識,將樂譜中待校正的音符修改為校正后的音符。
本步驟中,多媒體服務器根據該待校正的音符標識,將樂譜中待校正的音符修改為校正后的音符的步驟之前,為了提高校正的準確性,對于每個樂譜,當多媒體服務器接收反饋信息的接收次數超過預設次數時,多媒體服務器才對該樂譜進行校正,因此,
本步驟可以為:多媒體服務器統計接收該反饋信息的接收次數;如果該接收次數超過預設次數,多媒體服務器執(zhí)行根據該音符標識,將該樂譜中待校正的音符修改為該校正后的音符的步驟。
其中,該預設次數可以根據用戶需要設置并更改,本發(fā)明實施例對此不做具體限定,例如,該預設次數可以10次、35次等。
本發(fā)明實施例提供的一種可能設計中,該反饋信息中除包括樂譜中待校正的音符標識,以及校正后的音符以外,該反饋信息還可以包括用戶對該樂譜的評論信息,例如,該評論信息可以為用戶對該樂譜的點贊評論或者用戶輸入的文字評論等。多媒體服務器還可以根據用戶的評論信息,對該樂譜進行進一步的校正。
本發(fā)明實施例中,多媒體服務器從目標網站中爬取樂譜和該樂譜對應的多媒體文件的標識,獲取該樂譜對應的多媒體文件,并通過驗證該樂譜與該多媒體文件是否匹配,如果該樂譜與該多媒體文件匹配,才將該樂譜和該多媒體文件的標識的對應關系添加到樂譜庫中,使得多媒體服務器構建的樂譜庫中每個樂譜均與該樂譜對應的多媒體文件匹配,提高了多媒體服務器構建樂譜庫的準確性。
本發(fā)明實施例提供了一種構建樂譜庫的裝置,該裝置可應用在多媒體服務器上,參見圖3,該裝置包括第一爬取模塊301,第二爬取模塊302,第一獲取模塊303,驗證模塊304和第一添加模塊305。
該第一爬取模塊301,用于從目標網站中爬取樂譜;
該第二爬取模塊302,用于從該目標網站中爬取該樂譜對應的多媒體文件的標識;
該第一獲取模塊303,用于根據該多媒體文件的標識,獲取該多媒體文件;
該驗證模塊304,用于根據該樂譜和該多媒體文件,驗證該樂譜與該多媒體文件是否匹配;
該第一添加模塊305,用于如果該樂譜與該多媒體文件匹配,將該樂譜和該多媒體文件的標識的對應關系添加到樂譜庫中。
可選的,該驗證模塊304,包括:
第一確定單元,用于根據該樂譜和該多媒體文件,通過預設相似度算法,確定該樂譜和該多媒體文件之間的相似度;
第二確定單元,用于如果該相似度超過預設閾值,確定該樂譜與該多媒體文件匹配。
可選的,該裝置還包括:
第二獲取模塊,用于獲取預設數目個樣本樂譜、每個樣本樂譜對應的多媒體文件,以及,該每個樣本樂譜和每個多媒體文件之間的相似度;
優(yōu)化模塊,用于根據該每個樣本樂譜、該每個樣本樂譜對應的多媒體文件,以及,該每個樣本樂譜和每個多媒體文件之間的相似度,通過迭代算法,對該預設相似度算法進行優(yōu)化。
可選的,該裝置還包括:
第二添加模塊,用于將指定標注信息添加到所述樂譜中,該指定標注信息用于標注多媒體服務器。
可選的,該裝置還包括:
接收模塊,用于接收終端發(fā)送的反饋信息,該反饋信息中包括該樂譜中待校正的音符標識和校正后的音符;
修改模塊,用于根據該音符標識,將該樂譜中待校正的音符修改為該校正后的音符。
可選的,該裝置還包括:
統計模塊,用于統計接收該反饋信息的接收次數;
該修改模塊,還用于如果該接收次數超過預設次數,執(zhí)行該根據該音符標識,將該樂譜中待校正的音符修改為該校正后的音符。
可選的,該第一爬取模塊301,包括:
第一獲取單元,用于獲取該目標網站的標識,根據該目標網站的標識,獲取該目標網站中樂譜所在的位置信息;
第三確定單元,用于根據該目標網站的標識和該位置信息,在該目標網站中確定該位置信息對應的爬取區(qū)域;
爬取單元,用于從該爬取區(qū)域中爬取該樂譜。
可選的,該爬取單元,還用于從該爬取區(qū)域中爬取包含該樂譜的圖像;從該圖像中識別出該樂譜的音符序列和節(jié)拍標識,將該音符序列和該節(jié)拍標識組成該樂譜。
可選的,該第二爬取模塊302,還用于從該目標網站中爬取文字信息,從該文字信息中提取該樂譜對應的多媒體文件的標識。
可選的,如果從該目標網站中沒有爬取到該多媒體文件的標識,該裝置還包括:
選擇模塊,用于根據該樂譜,從多媒體文件庫中選擇與該樂譜匹配的多媒體文件;
第三添加模塊,用于將該樂譜和選擇的多媒體文件的標識的對應關系添加到樂譜庫中。
可選的,該選擇模塊,包括:
第二獲取單元,用于獲取該多媒體文件庫中的每個多媒體文件;
第四確定單元,用于根據該樂譜和該每個多媒體文件,通過預設相似度算法,確定該樂譜與該每個多媒體文件之間的相似度;
選擇單元,用于根據該樂譜與該每個多媒體文件之間的相似度,從該多媒體文件庫中選擇相似度滿足預設條件的多媒體文件;
第五確定單元,用于將選擇的多媒體文件確定為與該樂譜匹配的多媒體文件。
本發(fā)明實施例中,多媒體服務器從目標網站中爬取樂譜和該樂譜對應的多媒體文件的標識,獲取該樂譜對應的多媒體文件,并通過驗證該樂譜與該多媒體文件是否匹配,如果該樂譜與該多媒體文件匹配,才將該樂譜和該多媒體文件的標識的對應關系添加到樂譜庫中,使得多媒體服務器構建的樂譜庫中每個樂譜均與該樂譜對應的多媒體文件匹配,提高了多媒體服務器構建樂譜庫的準確性。
需要說明的是:上述實施例提供的構建樂譜庫裝置在構建樂譜庫時,僅以上述各功能模塊的劃分進行舉例說明,實際應用中,可以根據需要而將上述功能分配由不同的功能模塊完成,即將裝置的內部結構劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的構建樂譜庫的裝置與構建樂譜庫的方法實施例屬于同一構思,其具體實現過程詳見方法實施例,這里不再贅述。
圖4是本發(fā)明實施例提供的一種多媒體服務器的結構示意圖;該多媒體服務器400可因配置或性能不同而產生比較大的差異,可以包括一個或一個以上中央處理器(central processing units,CPU)422(例如,一個或一個以上處理器)和存儲器432,一個或一個以上存儲應用程序442或數據444的存儲介質430(例如一個或一個以上海量存儲設備)。其中,存儲器432和存儲介質430可以是短暫存儲或持久存儲。存儲在存儲介質430的程序可以包括一個或一個以上模塊(圖示沒標出),每個模塊可以包括對多媒體服務器中的一系列指令操作。更進一步地,中央處理器422可以設置為與存儲介質430通信,在異常注入系統400上執(zhí)行存儲介質430中的一系列指令操作。
異常注入系統400還可以包括一個或一個以上電源426,一個或一個以上有線或無線網絡接口450,一個或一個以上輸入輸出接口454,一個或一個以上鍵盤456,和/或,一個或一個以上操作系統441,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
該多媒體服務器400可以用于執(zhí)行上述實施例提供的構建樂譜庫的方法中多媒體服務器所執(zhí)行的步驟。
本領域普通技術人員可以理解實現上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質中,上述提到的存儲介質可以是只讀存儲器,磁盤或光盤等。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。