專利名稱:自動(dòng)獲得音樂文件中的特征片斷的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及對(duì)音樂文件進(jìn)行處理的方法和系統(tǒng),特別的本發(fā)明涉及自動(dòng)獲得音樂文件中的特征片斷的方法和系統(tǒng)。
背景技術(shù):
傳統(tǒng)的歌曲搜索方式主要是以文字輸入為主,比如用戶通過輸入歌名、作曲、詞作者等信息從而獲得返回的歌曲結(jié)果。近年來哼唱搜索(Query by Humming,QbH),打破了傳統(tǒng)的文字搜索方式,提供了一種全新的聲音搜索方式。用戶哼唱一段歌曲或者一段旋律作為系統(tǒng)的輸入,哼唱搜索系統(tǒng)通過檢索數(shù)據(jù)庫得到返回的歌曲或樂曲結(jié)果。Musipedia是一種以哼唱或者鍵盤敲擊等為用戶輸入的QbH產(chǎn)品。Midomi是一種QbH網(wǎng)絡(luò)服務(wù),其目前主要提供英語、日語、中文和西班牙文的哼唱檢索服務(wù)。Timebot是一種以哼唱、曲調(diào)、旋律等為用戶輸入的QbH產(chǎn)品。MPEG-7標(biāo)準(zhǔn)中也將QbH搜索列入其中。如何在海量的音樂文件內(nèi)進(jìn)行快速有效的搜索是哼唱搜索技術(shù)發(fā)展中一直追求的一個(gè)目標(biāo)。
發(fā)明內(nèi)容
本發(fā)明的發(fā)明人發(fā)現(xiàn)如果能夠減少哼唱搜索中音樂文件的搜索數(shù)據(jù)量則可以提高檢索的速度。通常情況下,每個(gè)音樂文件都有自己最有代表性的一些片段(比如歌曲的副歌部分),而這些最有代表性的片段往往更容易被人們所記住,因此在哼唱搜索中,這些片段更容易被用戶所哼唱作為搜索的檢索式(query)。如何尋找音樂文件中的有代表性的片段(特征片段)是一個(gè)需要解決的問題。如果能夠通過自動(dòng)的方式確定出音樂文件中的特征片段,則可以大大節(jié)省人力成本,從而確保通過搜索特征片段進(jìn)行哼唱搜索更具操作性。本發(fā)明提供了一種自動(dòng)獲得音樂文件中的特征片斷的方法,包括接收音樂文件; 將所述音樂文件轉(zhuǎn)換為字符串;對(duì)所述字符串中的至少一個(gè)字符串片段按照音樂特征進(jìn)行評(píng)估;以及根據(jù)評(píng)估結(jié)果,確定所述字符串中的至少一個(gè)字符串片段對(duì)應(yīng)的至少一個(gè)音樂片斷作為特征片斷。本發(fā)明還提供了一種自動(dòng)獲得音樂文件中的特征片斷的系統(tǒng),包括接收裝置,用于接收音樂文件;轉(zhuǎn)換裝置,用于將所述音樂文件轉(zhuǎn)換為字符串;評(píng)估裝置,用于對(duì)所述字符串中的至少一個(gè)字符串片段按照音樂特征進(jìn)行評(píng)估;以及確定裝置,用于根據(jù)評(píng)估結(jié)果, 確定所述字符串中的至少一個(gè)字符串片段對(duì)應(yīng)的至少一個(gè)音樂片斷作為特征片斷。通過本發(fā)明中的自動(dòng)獲得音樂文件中的特征片斷的技術(shù),可以自動(dòng)的獲得音樂文件中最具代表性的片段。對(duì)這些有代表性的片段進(jìn)行搜索可以在保證搜索效果的同時(shí)大大降低搜索的用時(shí),同時(shí)減少待搜索數(shù)據(jù)的存儲(chǔ)量,節(jié)省存儲(chǔ)空間。特別是對(duì)于一些移動(dòng)終端而言,其存儲(chǔ)空間有限,如果可以僅僅存儲(chǔ)音樂文件的特征片段,則可以在本地實(shí)現(xiàn)快速的哼唱搜索。除了哼唱搜索以外,自動(dòng)獲得音樂文件中的特征片斷的技術(shù)還有很多其它的應(yīng)用需求。比如,自動(dòng)的實(shí)現(xiàn)手機(jī)彩鈴(color ring)的提取。眾所周知,手機(jī)彩鈴的時(shí)長是有一定限制的,因此自動(dòng)提取音樂文件中的特征片段作為手機(jī)彩鈴可以節(jié)省大量的人力成本。再如,本發(fā)明中的技術(shù)還可以被用來實(shí)現(xiàn)音樂文件的預(yù)覽,從而讓瀏覽者可以很快確定某個(gè)音樂文件是否是自己想要的。特別的,按照很多國家或者地區(qū)的著作權(quán)法,未經(jīng)權(quán)利人同意在網(wǎng)絡(luò)上提供音樂文件的復(fù)制件是侵權(quán)行為,但是僅僅提供一小段音樂文件的特征片段作為摘要(snippet)供網(wǎng)絡(luò)用戶在進(jìn)行網(wǎng)絡(luò)搜歌過程中預(yù)覽也許在一些國家和地區(qū)能夠被認(rèn)為是合理使用。上述僅僅簡(jiǎn)單列舉了本發(fā)明幾種可能的應(yīng)用場(chǎng)景,但是本發(fā)明并不限于任何上述應(yīng)用場(chǎng)景,而是可以適用于任何需要自動(dòng)獲得音樂文件特征片斷的應(yīng)用。
本說明中所參考的附圖只用于示例本發(fā)明的典型實(shí)施例,不應(yīng)該認(rèn)為是對(duì)本發(fā)明范圍的限制。圖1示出了一種自動(dòng)獲得音樂文件中的特征片斷的方法的流程圖。圖2示出了按照本發(fā)明的一個(gè)實(shí)施例對(duì)字符串中的至少一個(gè)字符串片段按照音樂特征進(jìn)行評(píng)估的流程圖。圖3示出了按照本發(fā)明的一個(gè)實(shí)施例根據(jù)評(píng)估結(jié)果確定字符串中的至少一個(gè)字符串片段對(duì)應(yīng)的至少一個(gè)音樂片斷作為特征片斷的流程圖。圖4示出了一種自動(dòng)獲得音樂文件中的特征片斷的系統(tǒng)的框圖。圖5示出了按照本發(fā)明的一個(gè)實(shí)施例的評(píng)估裝置的系統(tǒng)框圖。
具體實(shí)施例方式下列討論中,提供大量具體的細(xì)節(jié)以幫助徹底了解本發(fā)明。然而,很顯然對(duì)于本領(lǐng)域技術(shù)人員來說,即使沒有這些具體細(xì)節(jié),并不影響對(duì)本發(fā)明的理解。并且應(yīng)該認(rèn)識(shí)到,使用如下的任何具體術(shù)語僅僅是為了方便描述,因此,本發(fā)明不應(yīng)當(dāng)局限于只用在這樣的術(shù)語所表示和/或暗示的任何特定應(yīng)用中。圖1示出了一種自動(dòng)獲得音樂文件中的特征片斷的方法的流程圖。在步驟101中接收音樂文件。所述音樂文件可以包括由歌手演唱的歌曲也可以包括由用樂器彈出的樂曲。所述音樂文件可以以各種文件格式(如WAV、MP3、WMA等等)存儲(chǔ)。在步驟103中將所述音樂文件轉(zhuǎn)換為字符串?,F(xiàn)有技術(shù)中已經(jīng)披露了一些將音樂文件轉(zhuǎn)換為字符串的方法,比如軟件產(chǎn)品htelliScore Ensemble (http //3d2f. com/p rograms/14-967-intelliscore-ensemble-mp3-to-midi-converter-download. shtml)就可以將多種格式的音樂文件轉(zhuǎn)換為MIDI音樂。進(jìn)一步對(duì)MIDI音樂進(jìn)行符號(hào)化,則可以將其轉(zhuǎn)換成真正的字符串。有很多的軟件產(chǎn)品能夠用于將MIDI音樂轉(zhuǎn)換為字符串,比如 MIDIFile2Text 1. 1 (http//www. softpedia. com/downloadTag/MIDI+to+Text)。所述字符串既可以是音樂文件的簡(jiǎn)譜(比如”3 I……),也可以是對(duì)簡(jiǎn)譜的進(jìn)一步處理結(jié)果,比如進(jìn)一步對(duì)所述音樂文件的簡(jiǎn)譜中的音高或者音節(jié)長度中任意一個(gè)進(jìn)行標(biāo)準(zhǔn)化表示。對(duì)音高進(jìn)行標(biāo)準(zhǔn)化表示可以是對(duì)音調(diào)高低進(jìn)行統(tǒng)一的數(shù)字化表示,m ^ 9。對(duì)音節(jié)長度進(jìn)行標(biāo)準(zhǔn)化表示可以為對(duì)音節(jié)長度進(jìn)行統(tǒng)一的數(shù)字化表示,如3 — 3 3 3。此外,還可以對(duì)簡(jiǎn)譜講行其它的標(biāo)準(zhǔn)化表示以講一步使其數(shù)字化,如9 10 2313 3 3 5 - 9,10,2,3,3,3, 3,5。上述列舉了對(duì)音樂文件的簡(jiǎn)譜進(jìn)行進(jìn)一步處理的幾個(gè)實(shí)例,這些進(jìn)一步處理方案可以進(jìn)一步提高確定特征片段的準(zhǔn)確性。但是上述實(shí)例并不構(gòu)成對(duì)本發(fā)明的限制,實(shí)際上根據(jù)實(shí)際應(yīng)用的需求,以及考慮到對(duì)計(jì)算成本的要求,也可以不進(jìn)行上述對(duì)簡(jiǎn)譜的進(jìn)一步處理, 比如可以簡(jiǎn)單的將“3 · ”表示為“3”,而不考慮音節(jié)長度的問題。在步驟105中對(duì)所述字符串中的至少一個(gè)字符串片段按照音樂特征進(jìn)行評(píng)估。所述音樂特征可以是音樂片段重復(fù)次數(shù)、平均音高、片段出現(xiàn)位置、片段長度、半音比重或者其它的音樂特征中的一種或多種的組合。對(duì)所述字符串中的至少一個(gè)字符串片段進(jìn)行評(píng)估的具體內(nèi)容將在后文中展開更詳細(xì)的說明。在步驟107中根據(jù)評(píng)估結(jié)果,確定所述字符串中的至少一個(gè)字符串片段對(duì)應(yīng)的至少一個(gè)音樂片斷作為特征片斷。圖2示出了按照本發(fā)明的一個(gè)實(shí)施例對(duì)字符串中的至少一個(gè)字符串片段按照音樂特征進(jìn)行評(píng)估的流程圖。步驟201,203描述了按照本發(fā)明的一個(gè)實(shí)施例如果所述音樂特征為音樂片段的重復(fù),所述評(píng)估步驟的進(jìn)一步實(shí)現(xiàn)細(xì)節(jié)。步驟211描述了按照本發(fā)明的一個(gè)實(shí)施例如果所述音樂特征為平均音高,所述評(píng)估步驟的進(jìn)一步實(shí)現(xiàn)細(xì)節(jié)。步驟213描述了按照本發(fā)明的一個(gè)實(shí)施例如果所述音樂特征為片段出現(xiàn)位置,所述評(píng)估步驟的進(jìn)一步實(shí)現(xiàn)細(xì)節(jié)。步驟215描述了按照本發(fā)明的一個(gè)實(shí)施例如果所述音樂特征為片段長度,所述評(píng)估步驟的進(jìn)一步實(shí)現(xiàn)細(xì)節(jié)。步驟217描述了按照本發(fā)明的一個(gè)實(shí)施例如果所述音樂特征為半音比重,所述評(píng)估步驟的進(jìn)一步實(shí)現(xiàn)細(xì)節(jié)。按照本發(fā)明的一個(gè)實(shí)施例,如果所述音樂特征為音樂片段重復(fù)次數(shù),在所述評(píng)估步驟中將確定重復(fù)的音樂片段,比如歌曲的副歌部分,并對(duì)字符串片段的重復(fù)次數(shù)進(jìn)行計(jì)算,得到的計(jì)算結(jié)果作為該音樂特征(即音樂片段重復(fù)次數(shù))的取值。比如《北京歡迎你》 這首歌中,存在兩個(gè)重復(fù)的字符串片段,分別為字符串片段A和B,片段A為“35323233…… 2033”,片段B為“35856……觀11”,全曲排列是AABAABBBBB。因此片段A的重復(fù)次數(shù)為4, 片段B的重復(fù)次數(shù)為6。按照本發(fā)明的另一個(gè)實(shí)施例,不僅能夠計(jì)算音樂片段的簡(jiǎn)單重復(fù),還能夠計(jì)算音樂片段的變調(diào)重復(fù)(比如升調(diào)重復(fù)或者降調(diào)重復(fù))。比如《雪絨花》(Edelweiss)這首歌中, 從字符串片段“345666”到字符串片段“567888”就屬于升調(diào)重復(fù)。類似的變調(diào)重復(fù)現(xiàn)象在很多歌曲中都是很比較常見的,對(duì)變調(diào)重復(fù)進(jìn)行統(tǒng)計(jì)可以更全面準(zhǔn)確的確定音樂文件中有代表性的片段。為了能夠統(tǒng)計(jì)變調(diào)重復(fù),在步驟201中處理所述字符串以獲得所述字符串的差分表示。比如對(duì)《雪絨花》中的字符串片段“345666”進(jìn)行處理,使后一個(gè)數(shù)字減去前一個(gè)數(shù)字,得到差分表示后的字符串片段為“11100”,同理對(duì)字符串片段“567888”按照同樣的規(guī)則進(jìn)行處理,也可以得到差分表示后的字符串片段“11100”。對(duì)字符串進(jìn)行差分表示可以尋找出音樂文件中的變調(diào)重復(fù)的片段。當(dāng)然本發(fā)明并不限于上述列舉的差分計(jì)算規(guī)貝U,而是還可以使用任何差分計(jì)算規(guī)則,比如用前一個(gè)數(shù)字減去后一個(gè)數(shù)字,或者用相隔的兩個(gè)數(shù)字進(jìn)行相減等等。獲得字符串片段的差分表示后,在步驟203中計(jì)算所述差分表示中的至少一個(gè)字符串片段的重復(fù)次數(shù)。比如在《雪絨花》中字符串片段“345666”出現(xiàn)了 1 次,“567888”出現(xiàn)了 2次,利用本實(shí)施例中的差分表示方法,可以計(jì)算字符串片段“345666” 的重復(fù)次數(shù)為3次。
6
按照本發(fā)明的另一個(gè)實(shí)施例,所述音樂特征為平均音高(average pitch),在步驟211中計(jì)算所述字符串中的至少一個(gè)字符串片段所對(duì)應(yīng)的音樂片段的平均音高,作為該音樂特征的取值。比如《北京歡迎你》這首歌中片段A為“35323233……2033”,其字符串長度為52,片段B為“35856……觀11”,其字符串長度為43。片段A的平均音高為
(3+5+3+2+3+2+3+3+......+2+0+3+3) /52 = 3.3,片段 B 的平均音高為(3+5+8+5+6+......
+2+8+1+1)/43 = 4. 2。在很多情況下,平均音高較高的音樂片段成為特征片段的可能性會(huì)比較大,比如很多副歌部分的平均音高都比較高。因此對(duì)平均音高進(jìn)行計(jì)算可以更準(zhǔn)確的確定特征片段。按照本發(fā)明的另一個(gè)實(shí)施例,所述音樂特征為片段出現(xiàn)位置(segment location),在步驟221中判斷所述字符串中的至少一個(gè)字符串片段在整個(gè)字符串中的出現(xiàn)位置。通常情況下,排在曲尾的比非排在曲尾的音樂片段更有可能成為特征片段。因此可以在步驟221中進(jìn)一步根據(jù)字符串片段的出現(xiàn)位置對(duì)其進(jìn)行打分,作為該音樂特征(片段出現(xiàn)位置)的取值。比如《北京歡迎你》這首歌中全曲排列是AABAABBBBB,片段B在曲尾, 打分為1,片段A不在曲尾,打分為0。當(dāng)然本發(fā)明并不限于上述打分方式,而是可以應(yīng)用其它的打分方式,比如將音樂文件,分為曲頭(如全曲長度的前20%)、曲中(如全曲長度的中間60% )、曲尾(如全曲長度的后20% ),并且根據(jù)音樂片段的出現(xiàn)位置按照一定條件進(jìn)行打分。按照本發(fā)明的另一個(gè)實(shí)施例,所述音樂特征為片段長度(segment length),在步驟231中計(jì)算所述字符串中的至少一個(gè)字符串片段的片段長度,作為該音樂特征(片段長度)的取值。比如《北京歡迎你》中片段A的字符串長度為52,片段B的字符串長度為43。按照本發(fā)明的另一個(gè)實(shí)施例,所述音樂特征為半音比重(semitone percentage), 在步驟Ml中計(jì)算所述字符串中的至少一個(gè)字符串片段所對(duì)應(yīng)的音樂片段的半音比重,作為該音樂特征(半音比重)的取值。在一些音樂文件中,音樂片段中所含半音的數(shù)量越多, 音樂片段成為特征片段的可能性就越大。12345671為一個(gè)八度的八個(gè)音,各音之音的關(guān)系并不相同,分為全音和半音兩種,34之間和71之間是半音,其它相鄰兩音間是全音。因此長度為8的字符串片段“34345677”中存在兩個(gè)半音,其半音比重為2/8。上述僅以五種音樂特征為例進(jìn)行說明,本發(fā)明還可以適用于其它的音樂特征。并且本發(fā)明不僅適用于一種音樂特征,而是還可以將多種音樂特征進(jìn)行結(jié)合,對(duì)所述字符串中的至少一個(gè)字符串片段進(jìn)行綜合評(píng)估。按照本發(fā)明的一個(gè)實(shí)施例,在步驟105中對(duì)所述字符串中的至少一個(gè)字符串片段進(jìn)行評(píng)估可以進(jìn)一步包括對(duì)所述字符串中超過預(yù)定長度的至少一個(gè)字符串片段進(jìn)行評(píng)估。 理論上,一個(gè)長度為N的字符串可以分割為長度為η的字符串片段(η大于等于1且小于 N)。實(shí)際上,將字符串分割為長度過小的字符串片段對(duì)分析音樂文件中的特征片段可能沒有太多作用。比如在實(shí)際操作中,將長度為N的字符串分割為N個(gè)長度為1的字符串片段的可能性比較小。因此按照本實(shí)施,可以只對(duì)所述字符串中超過預(yù)定長度(比如5)的字符串片段進(jìn)行上述評(píng)估。圖3示出了按照本發(fā)明的一個(gè)實(shí)施例根據(jù)評(píng)估結(jié)果確定字符串中的至少一個(gè)字符串片段對(duì)應(yīng)的至少一個(gè)音樂片斷作為特征片斷的流程圖。在步驟301中獲得訓(xùn)練數(shù)據(jù)包括給定的音樂文件及其特征片段。經(jīng)過對(duì)訓(xùn)練數(shù)據(jù)中音樂文件的特征片段的在音樂特征上的取值進(jìn)行分析可以確定成為特征片段的一些分類規(guī)則,從而將這些分類規(guī)則適用于新的音樂文件,以找出新的音樂文件中的特征片段。在一個(gè)例子中,訓(xùn)練數(shù)據(jù)中的音樂文件可以是一些歌曲,其特征片段可以這些歌曲的彩鈴,所述彩鈴可以是手工指定的歌曲中比較有代表性的音樂片段。在步驟303中將所述音樂文件及其特征片段轉(zhuǎn)化為字符串,并進(jìn)行文本對(duì)齊 (textual alignment),也就是將特征片段的字符串在音樂文件全曲對(duì)應(yīng)的字符串中進(jìn)行定位,比如定位“ 567,,在“ 1234567,,的尾部??蛇x的,在步驟305中還可以通過聲音驗(yàn)證(sound validation)對(duì)上述對(duì)齊的文本進(jìn)行校正。在303步驟中的文本對(duì)齊可能存在誤差。導(dǎo)致誤差的原因可能有很多,比如在轉(zhuǎn)換成字符串的過程中出現(xiàn)錯(cuò)誤等等。因此為了確保正確的將特征片段的字符串片段定位到整個(gè)歌曲的字符串中,還可以在步驟305中進(jìn)行聲音驗(yàn)證,比如確定字符串“567”所對(duì)應(yīng)的特征片段的聲音確實(shí)出現(xiàn)在字符串“1234567”所對(duì)應(yīng)的特征片段的尾部。比較兩個(gè)聲音片段是否一樣,可以通過比較兩個(gè)聲音片段的音頻、音調(diào)、強(qiáng)度等特征來進(jìn)行。一些現(xiàn)有產(chǎn)品或技述已經(jīng)能夠提供類似的聲音比較,比如產(chǎn)品Similarity。在步驟307中計(jì)算特征片段在一種或多種音樂特征上的取值。所述音樂特征可以是音樂片段重復(fù)次數(shù)(包括音樂片段的簡(jiǎn)單重復(fù)或表調(diào)重復(fù))、平均音高、片段出現(xiàn)位置、 片段長度、半音比重或者其它的音樂特征中的一種或多種的組合。上文中已經(jīng)詳細(xì)介紹了如何計(jì)算每種音樂特征上的取值,這部分內(nèi)容在此不再贅述。在步驟309中將所述特征片段在一種或多種音樂特征上的取值輸入分類器,形成分類規(guī)則。決策樹是一種最簡(jiǎn)單的分類器。通過記錄大量特征片段在一種或多種音樂特征上的取值來構(gòu)建決策樹,可以獲得成為特征片段的一些規(guī)則,作為分類規(guī)則,比如下面所示的分類規(guī)則1 分類規(guī)則1 =(音樂片段的重復(fù)次數(shù)> 5)&(平均音高> 4)&(片段出現(xiàn)位置> 0)&(片段長度> 20)&(半音比重>=0)所述分類規(guī)則可以用來判斷某個(gè)字符串片段所對(duì)應(yīng)的音樂片段是否是特征片段。仍然以《北京歡迎你》這首歌為例進(jìn)行說明,全曲字符串分為A、B兩個(gè)片段,片段A為
"35323233......2033”,片段 B 為“35856......2811”,其全曲排列為 AABAABBBBB。A、B 兩個(gè)字
符串片段在各個(gè)音樂特征上的取值如下表1所示
權(quán)利要求
1.一種自動(dòng)獲得音樂文件中的特征片斷的方法,包括 接收音樂文件;將所述音樂文件轉(zhuǎn)換為字符串;對(duì)所述字符串中的至少一個(gè)字符串片段按照音樂特征進(jìn)行評(píng)估;以及根據(jù)評(píng)估結(jié)果,確定所述字符串中的至少一個(gè)字符串片段對(duì)應(yīng)的至少一個(gè)音樂片斷作為特征片斷。
2.如權(quán)利要求1所述的方法,其中所述轉(zhuǎn)換步驟進(jìn)一步包括 按照音調(diào)或者音節(jié)長度中的至少一個(gè)對(duì)所述字符串進(jìn)行標(biāo)準(zhǔn)化表示。
3.如權(quán)利要求1所述的方法,所述評(píng)估步驟進(jìn)一步包括對(duì)所述字符串中超過預(yù)定長度的至少一個(gè)字符串片段進(jìn)行評(píng)估。
4.如權(quán)利要求1所述的方法,其中所述音樂特征包括音樂片段重復(fù)次數(shù),并且所述評(píng)估步驟進(jìn)一步包括處理所述字符串以獲得所述字符串的差分表示;以及計(jì)算所述差分表示中的至少一個(gè)字符串片段的重復(fù)次數(shù)。
5.如權(quán)利要求1-4中任意一個(gè)所述的方法,其中所述音樂特征包括平均音高,并且所述評(píng)估步驟進(jìn)一步包括計(jì)算所述字符串中的至少一個(gè)字符串片段所對(duì)應(yīng)的音樂片段的平均音高。
6.如權(quán)利要求1-4中任意一個(gè)所述的方法,其中所述音樂特征包括片段出現(xiàn)位置,并且所述評(píng)估步驟進(jìn)一步包括判斷所述字符串中的至少一個(gè)字符串片段在整個(gè)字符串中的出現(xiàn)位置。
7.如權(quán)利要求1-4中任意一個(gè)所述的方法,其中所述音樂特征包括片段長度,并且所述評(píng)估步驟進(jìn)一步包括計(jì)算所述字符串中的至少一個(gè)字符串片段的片段長度。
8.如權(quán)利要求1-4中任意一個(gè)所述的方法,其中所述音樂特征包括半音比重,并且所述評(píng)估步驟進(jìn)一步包括計(jì)算所述字符串中的至少一個(gè)字符串片段所對(duì)應(yīng)的音樂片段的半音比重。
9.如權(quán)利要求1-4中任意一個(gè)所述的方法,其中所述確定步驟進(jìn)一步包括使用經(jīng)訓(xùn)練數(shù)據(jù)訓(xùn)練過的分類器來確定特征片斷,其中所述訓(xùn)練數(shù)據(jù)包括給定的音樂文件及其特征片段。
10.如權(quán)利要求1-4中任意一個(gè)所述的方法,其中所述確定步驟進(jìn)一步包括對(duì)所述字符串中的不同字符串片段的評(píng)估結(jié)果進(jìn)行比較,進(jìn)而根據(jù)比較結(jié)果確定特征片段。
11.如權(quán)利要求1-4中任意一個(gè)所述的方法,其中所述確定步驟進(jìn)一步包括 將所述字符串中的至少一個(gè)字符串片段對(duì)應(yīng)的多個(gè)音樂片斷組合作為特征片斷。
12.一種自動(dòng)獲得音樂文件中的特征片斷的系統(tǒng),包括 接收裝置,用于接收音樂文件;轉(zhuǎn)換裝置,用于將所述音樂文件轉(zhuǎn)換為字符串;評(píng)估裝置,用于對(duì)所述字符串中的至少一個(gè)字符串片段按照音樂特征進(jìn)行評(píng)估;以及確定裝置,用于根據(jù)評(píng)估結(jié)果,確定所述字符串中的至少一個(gè)字符串片段對(duì)應(yīng)的至少一個(gè)音樂片斷作為特征片斷。
13.如權(quán)利要求12所述的系統(tǒng),其中所述轉(zhuǎn)換裝置進(jìn)一步包括標(biāo)準(zhǔn)化裝置,用于按照音調(diào)或者音節(jié)長度中的至少一個(gè)對(duì)所述字符串進(jìn)行標(biāo)準(zhǔn)化表示。
14.如權(quán)利要求12所述的系統(tǒng),其中所述評(píng)估裝置進(jìn)一步用于對(duì)所述字符串中超過預(yù)定長度的至少一個(gè)字符串片段進(jìn)行評(píng)估。
15.如權(quán)利要求12所述的系統(tǒng),其中所述音樂特征包括音樂片段重復(fù)次數(shù),并且所述評(píng)估裝置進(jìn)一步包括處理裝置,用于處理所述字符串以獲得所述字符串的差分表示;以及重復(fù)次數(shù)計(jì)算裝置,用于計(jì)算所述差分表示中的至少一個(gè)字符串片段的重復(fù)次數(shù)。
16.如權(quán)利要求12-15中任意一個(gè)所述的系統(tǒng),其中所述音樂特征包括平均音高,并且所述評(píng)估裝置進(jìn)一步包括平均音高計(jì)算裝置,用于計(jì)算所述字符串中的至少一個(gè)字符串片段所對(duì)應(yīng)的音樂片段的平均音高。
17.如權(quán)利要求12-15中任意一個(gè)所述的系統(tǒng),其中所述音樂特征包括片段出現(xiàn)位置, 并且所述評(píng)估裝置進(jìn)一步包括位置判斷裝置,用于判斷所述字符串中的至少一個(gè)字符串片段在整個(gè)字符串中的出現(xiàn)位置。
18.如權(quán)利要求12-15中任意一個(gè)所述的系統(tǒng),其中所述音樂特征包括片段長度,并且所述評(píng)估裝置進(jìn)一步包括片段長度計(jì)算裝置,用于計(jì)算所述字符串中的至少一個(gè)字符串片段的片段長度。
19.如權(quán)利要求12-15中任意一個(gè)所述的系統(tǒng),其中所述音樂特征包括半音比重,并且所述評(píng)估裝置進(jìn)一步包括比重計(jì)算裝置,用于計(jì)算所述字符串中的至少一個(gè)字符串片段所對(duì)應(yīng)的音樂片段的半音比重。
20.如權(quán)利要求12-15中任意一個(gè)所述的系統(tǒng),其中所述確定裝置進(jìn)一步使用經(jīng)訓(xùn)練數(shù)據(jù)訓(xùn)練過的分類器來確定特征片斷,其中所述訓(xùn)練數(shù)據(jù)包括音樂文件及指定的特征片段。
21.如權(quán)利要求12-15中任意一個(gè)所述的系統(tǒng),其中所述確定裝置進(jìn)一步對(duì)所述字符串中的不同字符串片段的評(píng)估結(jié)果進(jìn)行比較,進(jìn)而根據(jù)比較結(jié)果確定特征片段。
22.如權(quán)利要求12-15中任意一個(gè)所述的系統(tǒng),其中所述確定裝置進(jìn)一步將所述字符串中的至少一個(gè)字符串片段對(duì)應(yīng)的多個(gè)音樂片斷組合作為特征片斷。
全文摘要
本發(fā)明提供了一種自動(dòng)獲得音樂文件中的特征片斷的方法,包括接收音樂文件;將所述音樂文件轉(zhuǎn)換為字符串;對(duì)所述字符串中的至少一個(gè)字符串片段按照音樂特征進(jìn)行評(píng)估;以及根據(jù)評(píng)估結(jié)果,確定所述字符串中的至少一個(gè)字符串片段對(duì)應(yīng)的至少一個(gè)音樂片斷作為特征片斷。并且本發(fā)明還提供了一種自動(dòng)獲得音樂文件中的特征片斷的系統(tǒng)。通過本發(fā)明中的自動(dòng)獲得音樂文件中的特征片斷的技術(shù),可以自動(dòng)的獲得音樂文件中最具代表性的片段。對(duì)這些有代表性的片段進(jìn)行搜索可以在保證搜索效果的同時(shí)大大降低搜索的用時(shí),同時(shí)減少待搜索數(shù)據(jù)的存儲(chǔ)量,節(jié)省存儲(chǔ)空間。
文檔編號(hào)G06F17/30GK102541965SQ20101062474
公開日2012年7月4日 申請(qǐng)日期2010年12月30日 優(yōu)先權(quán)日2010年12月30日
發(fā)明者包勝華, 楊新穎, 蘇中, 陳健 申請(qǐng)人:國際商業(yè)機(jī)器公司