專利名稱:信息處理設(shè)備、信息處理方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種信息處理設(shè)備、信息處理方法和程序。本發(fā)明尤其涉及一種信息處理設(shè)備、信息處理方法和程序,用于自動(dòng)創(chuàng)建用于從如歌曲數(shù)據(jù)的內(nèi)容數(shù)據(jù)提取特征的算法。
背景技術(shù):
已經(jīng)提出了有關(guān)自動(dòng)創(chuàng)建算法的各發(fā)明,將歌曲數(shù)據(jù)輸入該算法或從該算法輸出歌曲數(shù)據(jù)的特征(歌曲的速度、亮度、歡樂氣氛等)(例如,參見專利文獻(xiàn)1)。
美國(guó)專利No.0181401A1發(fā)明內(nèi)容[本發(fā)明要解決的問題]上述專利申請(qǐng),如圖1中所示,提出了創(chuàng)建用于按特征類型提取各特征的特征提取算法。在提取各特征中涉及的計(jì)算是巨大的,并且包括大量的冗余。
因此期望開發(fā)一種用于創(chuàng)建算法的方法,所述算法能夠用最小的冗余通過計(jì)算從歌曲數(shù)據(jù)快速提取各特征。
鑒于上面的情況已經(jīng)做出本發(fā)明,并且提供了各種安排,用于創(chuàng)建一種算法,其能夠從如歌曲數(shù)據(jù)的輸入內(nèi)容數(shù)據(jù)中高度精確地快速提取各特征。
在實(shí)現(xiàn)本發(fā)明中并且按照其一個(gè)實(shí)施例,提供了一種信息處理設(shè)備,其創(chuàng)建特征檢測(cè)算法,用于從內(nèi)容數(shù)據(jù)檢測(cè)各特征,所述信息處理設(shè)備包括低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,用于基于最近一代的各表達(dá)式列表,通過學(xué)習(xí)創(chuàng)建下一代表達(dá)式列表,其每個(gè)由多個(gè)低級(jí)特征提取表達(dá)式構(gòu)成,所述各低級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入所述內(nèi)容數(shù)據(jù)或與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的元數(shù)據(jù),并從該表達(dá)式輸出各低級(jí)特征;計(jì)算裝置,用于利用由所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置創(chuàng)建的所述下一代的各表達(dá)式列表,計(jì)算所述各低級(jí)特征;以及高級(jí)特征提取表達(dá)式創(chuàng)建裝置,用于基于訓(xùn)練數(shù)據(jù),通過學(xué)習(xí)創(chuàng)建各高級(jí)特征提取表達(dá)式,所述訓(xùn)練數(shù)據(jù)由先前提供的與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的真實(shí)的各高級(jí)特征構(gòu)成,所述各高級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入由所述計(jì)算裝置計(jì)算的所述各低級(jí)特征,并從該表達(dá)式輸出所述內(nèi)容數(shù)據(jù)的各高級(jí)特征特性。
優(yōu)選地,所述高級(jí)特征提取表達(dá)式創(chuàng)建裝置,可以至少計(jì)算在所述各高級(jí)特征提取表達(dá)式中的所述各低級(jí)特征的各貢獻(xiàn)比率、或創(chuàng)建的各高級(jí)特征提取表達(dá)式的各精度級(jí)別;以及所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,至少基于所述各高級(jí)特征提取表達(dá)式中的所述各低級(jí)特征的各貢獻(xiàn)比率、或所述各高級(jí)特征提取表達(dá)式的各精度級(jí)別,可以更新所述各低級(jí)特征提取表達(dá)式,其構(gòu)成所述各低級(jí)特征提取表達(dá)式列表,所述各精度級(jí)別和所述各貢獻(xiàn)比率,已經(jīng)通過所述高級(jí)特征提取表達(dá)式創(chuàng)建裝置計(jì)算。
優(yōu)選地,所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,可以隨機(jī)地創(chuàng)建各第一代表達(dá)式列表。
優(yōu)選地,所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,通過選擇過程、交叉(cross)過程和突變(mutation)過程中的至少一個(gè),基于所述最近一代的各表達(dá)式列表,利用遺傳(genetic)算法可以創(chuàng)建所述下一代表達(dá)式列表。
優(yōu)選地,所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,可以創(chuàng)建所述下一代表達(dá)式列表,其每個(gè)由預(yù)定常數(shù)個(gè)低級(jí)特征提取表達(dá)式構(gòu)成。
優(yōu)選地,所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,可以創(chuàng)建所述下一代表達(dá)式列表,其每個(gè)由預(yù)定常數(shù)個(gè)低級(jí)特征提取表達(dá)式構(gòu)成,所述低級(jí)特征提取表達(dá)式在每次創(chuàng)建每個(gè)所述列表時(shí)隨機(jī)確定。
優(yōu)選地,所述高級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,可以至少計(jì)算所述各高級(jí)特征提取表達(dá)式中的所述各低級(jí)特征的各貢獻(xiàn)比率、或創(chuàng)建的各高級(jí)特征提取表達(dá)式的各評(píng)估值;以及所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,至少基于所述各高級(jí)特征提取表達(dá)式中的所述各低級(jí)特征的各貢獻(xiàn)比率、或所述各高級(jí)特征提取表達(dá)式的各評(píng)估值,可以更新所述各低級(jí)特征提取表達(dá)式,其構(gòu)成所述各低級(jí)特征提取表達(dá)式列表,所述各評(píng)估值和所述各貢獻(xiàn)比率已經(jīng)通過所述高級(jí)特征提取表達(dá)式創(chuàng)建裝置計(jì)算。
根據(jù)本發(fā)明的另一個(gè)實(shí)施例,提供了一種信息處理方法,其隨信息處理設(shè)備使用,該信息處理設(shè)備創(chuàng)建特征檢測(cè)算法,該算法用于從內(nèi)容數(shù)據(jù)檢測(cè)各特征,所述信息處理方法包括步驟基于最近一代的各表達(dá)式列表,通過學(xué)習(xí)創(chuàng)建下一代表達(dá)式列表,其每個(gè)由多個(gè)低級(jí)特征提取表達(dá)式構(gòu)成,所述各低級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入所述內(nèi)容數(shù)據(jù)或與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的元數(shù)據(jù),并從該表達(dá)式輸出各低級(jí)特征;利用創(chuàng)建的下一代的各表達(dá)式列表,計(jì)算所述各低級(jí)特征;以及基于訓(xùn)練數(shù)據(jù),通過學(xué)習(xí)創(chuàng)建各高級(jí)特征提取表達(dá)式,所述訓(xùn)練數(shù)據(jù)由先前提供的、與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的真實(shí)的各高級(jí)特征構(gòu)成,所述各高級(jí)特征提取表達(dá)式是這樣一種表達(dá)式向該表達(dá)式輸入計(jì)算的各低級(jí)特征,并從該表達(dá)式輸出所述內(nèi)容數(shù)據(jù)的各高級(jí)特征特性。
按照本發(fā)明的進(jìn)一步的實(shí)施例,提供了一種用于控制信息處理設(shè)備的程序,該信息處理設(shè)備創(chuàng)建特征檢測(cè)算法,該算法用于從內(nèi)容數(shù)據(jù)檢測(cè)各特征,所述程序使得所述信息處理設(shè)備的計(jì)算機(jī)執(zhí)行包括如下步驟的過程基于最近一代的各表達(dá)式列表,通過學(xué)習(xí)創(chuàng)建下一代表達(dá)式列表,其每個(gè)由多個(gè)低級(jí)特征提取表達(dá)式構(gòu)成,所述各低級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入所述內(nèi)容數(shù)據(jù)或與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的元數(shù)據(jù),并從該表達(dá)式輸出各低級(jí)特征;利用創(chuàng)建的下一代的各表達(dá)式列表,計(jì)算所述各低級(jí)特征;以及基于訓(xùn)練數(shù)據(jù),通過學(xué)習(xí)創(chuàng)建各高級(jí)特征提取表達(dá)式,所述訓(xùn)練數(shù)據(jù)由先前提供的與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的真實(shí)的各高級(jí)特征構(gòu)成,所述各高級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入計(jì)算的各低級(jí)特征,并從該表達(dá)式輸出所述內(nèi)容數(shù)據(jù)的高級(jí)特征特性。
在使用如上所概括的、本發(fā)明各實(shí)施例的任何一個(gè)的情形中,基于最近一代的各表達(dá)式列表,通過學(xué)習(xí)首先創(chuàng)建下一代表達(dá)式列表,其每個(gè)由多個(gè)低級(jí)特征提取表達(dá)式構(gòu)成,所述各低級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入所述內(nèi)容數(shù)據(jù)、或與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的元數(shù)據(jù),并從該表達(dá)式輸出各低級(jí)特征。利用創(chuàng)建的所述下一代的各表達(dá)式列表,計(jì)算所述各低級(jí)特征。基于訓(xùn)練數(shù)據(jù),通過學(xué)習(xí)創(chuàng)建各高級(jí)特征提取表達(dá)式,所述訓(xùn)練數(shù)據(jù)由先前提供的、與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的真實(shí)的各高級(jí)特征構(gòu)成,所述各高級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入計(jì)算的所述各低級(jí)特征,并從該表達(dá)式輸出所述內(nèi)容數(shù)據(jù)的各高級(jí)特征特性。
本發(fā)明的各實(shí)施例,如上所概括的那樣,使得能夠從輸入的如歌曲數(shù)據(jù)的內(nèi)容數(shù)據(jù)高度精確地快速提取各特征。
圖1是解釋過去的特征提取算法的示意圖。
圖2是概述按照本發(fā)明的特征提取算法創(chuàng)建設(shè)備創(chuàng)建的特征提取算法的示意圖。
圖3是示出典型的低級(jí)特征提取表達(dá)式的示意圖。
圖4是示出典型的高級(jí)特征提取表達(dá)式的示意圖。
圖5是示出按照本發(fā)明的特征提取算法創(chuàng)建設(shè)備的第一結(jié)構(gòu)性實(shí)例的框圖。
圖6是示出構(gòu)成特征提取算法創(chuàng)建設(shè)備的部分的高級(jí)特征計(jì)算部分的結(jié)構(gòu)性實(shí)例的框圖。
圖7是構(gòu)成特征提取算法學(xué)習(xí)過程的各步驟的流程圖。
圖8是示出典型的低級(jí)特征提取表達(dá)式列表的示意圖。
圖9是構(gòu)成低級(jí)特征提取表達(dá)式列表創(chuàng)建過程的各步驟的流程圖。
圖10是構(gòu)成由作為圖5中的部分結(jié)構(gòu)的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分執(zhí)行的、第一代列表隨機(jī)創(chuàng)建過程的各步驟的流程圖。
圖11是示出如何典型地描述低級(jí)特征提取表達(dá)式的示意圖。
圖12是列出輸入數(shù)據(jù)的實(shí)例的表格視圖。
圖13是解釋輸入數(shù)據(jù)“Wav”的示意圖。
圖14是解釋輸入數(shù)據(jù)“Chord(和弦)”的示意圖。
圖15是解釋輸入數(shù)據(jù)“Key(調(diào))”的示意圖。
圖16是解釋用于支持低級(jí)特征提取表達(dá)式的維度的示意圖。
圖17是構(gòu)成下一代列表遺傳創(chuàng)建過程的各步驟的流程圖。
圖18是構(gòu)成由作為圖5中的部分結(jié)構(gòu)的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分執(zhí)行的、選擇創(chuàng)建過程的各步驟的流程圖。
圖19是構(gòu)成由作為圖5中的部分結(jié)構(gòu)的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分執(zhí)行的、交叉創(chuàng)建過程的各步驟的流程圖。
圖20是構(gòu)成由作為圖5中的部分結(jié)構(gòu)的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分執(zhí)行的、突變創(chuàng)建過程的各步驟的流程圖。
圖21是解釋使用運(yùn)算符“均值(mean)”的計(jì)算的示意圖。
圖22是解釋由低級(jí)特征計(jì)算部分的處理的示意圖。
圖23是解釋訓(xùn)練數(shù)據(jù)的各實(shí)例的示意圖。
圖24是構(gòu)成由作為圖5的部分結(jié)構(gòu)的高級(jí)特征提取表達(dá)式學(xué)習(xí)部分執(zhí)行的、高級(jí)特征提取表達(dá)式學(xué)習(xí)過程的各步驟的流程圖。
圖25是解釋學(xué)習(xí)算法的圖形表示。
圖26是解釋另一個(gè)學(xué)習(xí)算法的圖形表示。
圖27是解釋另一個(gè)學(xué)習(xí)算法的圖形表示。
圖28是解釋另一個(gè)學(xué)習(xí)算法的圖形表示。
圖29是解釋另一個(gè)學(xué)習(xí)算法的圖形表示。
圖30是解釋另一個(gè)學(xué)習(xí)算法的圖形表示。
圖31是解釋另一個(gè)學(xué)習(xí)算法的圖形表示。
圖32是解釋另一個(gè)學(xué)習(xí)算法的圖形表示。
圖33是解釋另一個(gè)學(xué)習(xí)算法的圖形表示。
圖34是構(gòu)成基于學(xué)習(xí)算法、并且由作為圖5的部分結(jié)構(gòu)的高級(jí)特征提取表達(dá)式學(xué)習(xí)部分執(zhí)行的、學(xué)習(xí)過程的各步驟的流程圖。
圖35是示出各運(yùn)算符的典型組合的示意圖。
圖36是示出各運(yùn)算符的另一個(gè)典型組合的示意圖。
圖37是構(gòu)成新的運(yùn)算符創(chuàng)建過程的各步驟的流程圖。
圖38是構(gòu)成高精度高級(jí)特征計(jì)算過程的各步驟的流程圖。
圖39是構(gòu)成高精度拒絕過程的各步驟的流程圖。
圖40是示出按照本發(fā)明的特征提取算法創(chuàng)建設(shè)備的第二結(jié)構(gòu)實(shí)例的框圖。
圖41是構(gòu)成由作為圖40中的部分結(jié)構(gòu)的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分執(zhí)行的、第一代列表隨機(jī)創(chuàng)建過程的各步驟的流程圖。
圖42是構(gòu)成由作為圖40中的部分結(jié)構(gòu)的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分執(zhí)行的、選擇創(chuàng)建過程的各步驟的流程圖。
圖43是構(gòu)成由作為圖40中的部分結(jié)構(gòu)的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分執(zhí)行的、交叉創(chuàng)建過程的各步驟的流程圖。
圖44是構(gòu)成由作為圖40中的部分結(jié)構(gòu)的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分執(zhí)行的、突變創(chuàng)建過程的各步驟的流程圖。
圖45是構(gòu)成由作為圖40的部分結(jié)構(gòu)的高級(jí)特征提取表達(dá)式學(xué)習(xí)部分執(zhí)行的、高級(jí)特征提取表達(dá)式學(xué)習(xí)過程的各步驟的流程圖。
圖46是構(gòu)成基于學(xué)習(xí)算法、并且由作為圖5的部分結(jié)構(gòu)的高級(jí)特征提取表達(dá)式學(xué)習(xí)部分執(zhí)行的、學(xué)習(xí)過程的各步驟的流程圖。
圖47是示出通用個(gè)人計(jì)算機(jī)的典型結(jié)構(gòu)的框圖。
20特征提取算法創(chuàng)建設(shè)備,21低級(jí)特征提取表達(dá)式列表創(chuàng)建部分,22運(yùn)算符組合檢測(cè)部分,23運(yùn)算符創(chuàng)建部分,24低級(jí)特征計(jì)算部分,25 高級(jí)特征提取表達(dá)式學(xué)習(xí)部分,26高級(jí)特征計(jì)算部分,27控制部分,41低級(jí)特征計(jì)算部分,42高級(jí)特征計(jì)算部分,43平方誤差計(jì)算部分,44拒絕區(qū)域提取表達(dá)式學(xué)習(xí)部分,45特征提取精度計(jì)算部分,60特征提取算法創(chuàng)建設(shè)備,61低級(jí)特征提取表達(dá)式列表創(chuàng)建部分,62高級(jí)特征計(jì)算部分,100個(gè)人計(jì)算機(jī),101 CPU,111記錄介質(zhì)具體實(shí)施方式
現(xiàn)在將參照附圖描述本發(fā)明的優(yōu)選實(shí)施例。
圖2是概述按照本發(fā)明、由特征提取算法創(chuàng)建設(shè)備20(圖5)或60(圖40)創(chuàng)建的特征提取算法的示意圖。
該特征提取算法11由兩個(gè)部分組成低級(jí)特征提取部分12,內(nèi)容數(shù)據(jù)(歌曲數(shù)據(jù))和與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的元數(shù)據(jù)(屬性數(shù)據(jù))被輸入其中,并且從其中輸出各低級(jí)特征;以及高級(jí)特征提取部分14,各低級(jí)特征被輸入其中,并且從其中輸出各高級(jí)特征。
低級(jí)特征提取部分12具有低級(jí)特征提取表達(dá)式列表13,其包括多如“m”個(gè)的低級(jí)特征提取表達(dá)式,每個(gè)具有至少一個(gè)運(yùn)算符的組合,利用其對(duì)輸入數(shù)據(jù)執(zhí)行預(yù)定運(yùn)算。該低級(jí)特征提取部分12因此將“m”個(gè)低級(jí)特征輸出到高級(jí)特征提取部分14。
構(gòu)成低級(jí)特征提取表達(dá)式列表13的低級(jí)特征提取表達(dá)式的數(shù)“m”,在如圖5所示的特征提取算法創(chuàng)建設(shè)備20的情形中,是預(yù)定的常數(shù)。對(duì)于圖40中的特征提取算法創(chuàng)建設(shè)備60,該數(shù)“m”是隨機(jī)確定的數(shù)。
圖3是示出典型的低級(jí)特征提取表達(dá)式的示意圖。
作為舉例,圖3的部分A中的低級(jí)特征提取表達(dá)式f1輸入波形數(shù)據(jù),作為一種類型的歌曲數(shù)據(jù),計(jì)算在涉及的各通道(例如,左和右)之間的輸入波形數(shù)據(jù)的各均值,在時(shí)間軸上將計(jì)算的各均值進(jìn)行快速傅立葉變換(FFT),從該FFT結(jié)果獲取頻率的標(biāo)準(zhǔn)偏差(StDev),并且輸出作為結(jié)果的標(biāo)準(zhǔn)偏差作為低級(jí)特征“a”。
作為另一個(gè)實(shí)例,圖3的部分B中的低級(jí)特征提取表達(dá)式f2輸入和弦進(jìn)行(chord progression)數(shù)據(jù),作為另一種類型的歌曲數(shù)據(jù),獲取時(shí)間軸上的小三和弦(minor chords)的發(fā)生率(incidence)(比率(ratio)),并且輸出作為結(jié)果的發(fā)生率作為低級(jí)特征“b”。
由低級(jí)特征提取部分12輸出的低級(jí)特征本身不必是有意義的值。
高級(jí)特征提取部分14擁有“k”個(gè)高級(jí)特征提取表達(dá)式,其輸入“m”個(gè)低級(jí)特征,對(duì)輸入的“m”個(gè)低級(jí)特征的至少一個(gè),執(zhí)行相對(duì)簡(jiǎn)單的計(jì)算(算術(shù)運(yùn)算、乘方(raise to power)等),并且輸出運(yùn)算結(jié)果作為高級(jí)特征。該高級(jí)特征提取部分14因此輸出“k”個(gè)高級(jí)特征。
圖4是示出典型的高級(jí)特征提取表達(dá)式的示意圖。
示例性地,圖4的部分A中的高級(jí)特征提取表達(dá)式F1對(duì)低級(jí)特征“a”、“b”、“c”、“d”和“e”執(zhí)行算術(shù)運(yùn)算,并且輸出運(yùn)算的結(jié)果,作為構(gòu)成單個(gè)高級(jí)特征的速度值。
作為另一個(gè)實(shí)例,圖4的部分B中的低級(jí)特征提取表達(dá)式F2對(duì)低級(jí)特征“a”、“c”、“d”和“e”執(zhí)行算術(shù)運(yùn)算并且乘方,并且輸出運(yùn)算的結(jié)果,作為構(gòu)成另一個(gè)單個(gè)高級(jí)特征的亮度值。
圖5是示出按照本發(fā)明的特征提取算法創(chuàng)建設(shè)備20的第一結(jié)構(gòu)性實(shí)例的框圖。
該特征提取算法創(chuàng)建設(shè)備20基于遺傳算法,通過學(xué)習(xí)創(chuàng)建最佳的低級(jí)和高級(jí)特征提取表達(dá)式。
特征提取算法創(chuàng)建設(shè)備20包括5個(gè)主要部分低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,其創(chuàng)建“n”個(gè)低級(jí)特征提取表達(dá)式列表,其每個(gè)包括“m”個(gè)低級(jí)特征提取表達(dá)式;低級(jí)特征計(jì)算部分24,其輸入“n”個(gè)低級(jí)特征提取表達(dá)式列表中的“j”個(gè)歌曲的輸入數(shù)據(jù)(內(nèi)容數(shù)據(jù)和元數(shù)據(jù)),并且計(jì)算與每個(gè)輸入數(shù)據(jù)項(xiàng)相對(duì)應(yīng)的“m”個(gè)低級(jí)特征的“n”個(gè)組合,所述“n”個(gè)低級(jí)特征提取表達(dá)式列表由低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21提供;高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,其基于訓(xùn)練數(shù)據(jù)(與“j”個(gè)歌曲的每個(gè)相對(duì)應(yīng)的“k”個(gè)高級(jí)特征),通過學(xué)習(xí)估計(jì)高級(jí)特征提取表達(dá)式,所述訓(xùn)練數(shù)據(jù)對(duì)應(yīng)于由低級(jí)特征計(jì)算部分24輸出的各低級(jí)特征的“n”個(gè)組合;高級(jí)特征計(jì)算部分26,其使用通過遺傳學(xué)習(xí)最終創(chuàng)建的高級(jí)特征提取表達(dá)式,計(jì)算高級(jí)特征;以及控制部分27,其控制由涉及的各部分執(zhí)行的各循環(huán)。
在接下來的描述中,基于遺傳算法的學(xué)習(xí)還可以被稱作為遺傳學(xué)習(xí)。
低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,隨機(jī)地創(chuàng)建低級(jí)特征提取表達(dá)式列表,其每個(gè)包括“m”(預(yù)定的常數(shù))個(gè)第一代的低級(jí)特征提取表達(dá)式。對(duì)于第二和隨后的各代中的每代,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,基于最后代的低級(jí)特征提取表達(dá)式列表,使用各低級(jí)特征,通過學(xué)習(xí)典型地創(chuàng)建低級(jí)特征提取表達(dá)式列表。
低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21中并入的運(yùn)算符組合檢測(cè)部分22,檢測(cè)在創(chuàng)建的低級(jí)特征提取表達(dá)式中頻繁出現(xiàn)的多個(gè)運(yùn)算符的組合。運(yùn)算符創(chuàng)建部分23,將由運(yùn)算符組合檢測(cè)部分22檢測(cè)的多個(gè)運(yùn)算符的組合,注冊(cè)為新的運(yùn)算符。
高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,創(chuàng)建與“n”個(gè)低級(jí)特征的每一個(gè)相對(duì)應(yīng)的“k”個(gè)高級(jí)特征提取表達(dá)式,計(jì)算每個(gè)高級(jí)特征提取表達(dá)式中的每個(gè)低級(jí)特征的貢獻(xiàn)比率、以及每個(gè)高級(jí)特征提取表達(dá)式的估計(jì)的精度級(jí)別,并且輸出各計(jì)算結(jié)果到低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21。對(duì)于學(xué)習(xí)的最近一代,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,從“n”個(gè)低級(jí)特征提取表達(dá)式列表中,選擇構(gòu)成低級(jí)特征提取表達(dá)式列表的“m”個(gè)低級(jí)特征提取表達(dá)式,所述低級(jí)特征提取表達(dá)式列表具有獲取的各高級(jí)特征的最高均值精度,并且與對(duì)應(yīng)于所述列表的“k”個(gè)高級(jí)特征提取表達(dá)式一起,將選擇的“m”個(gè)低級(jí)特征提取表達(dá)式,提供給高級(jí)特征計(jì)算部分26。
高級(jí)特征計(jì)算部分26,利用由高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25最終提供的低級(jí)和高級(jí)特征提取表達(dá)式,計(jì)算高級(jí)特征。
圖6是示出高級(jí)特征計(jì)算部分26的詳細(xì)的結(jié)構(gòu)實(shí)例的框圖。
高級(jí)特征計(jì)算部分26包括5個(gè)主要部分低級(jí)特征計(jì)算部分41,用于通過將輸入數(shù)據(jù)(內(nèi)容數(shù)據(jù)和與該內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的元數(shù)據(jù))代入最終獲取的低級(jí)特征提取表達(dá)式列表,計(jì)算各低級(jí)特征;高級(jí)特征計(jì)算部分42,用于通過將由低級(jí)特征計(jì)算部分41計(jì)算的各低級(jí)特征,代入最終獲取的高級(jí)特征提取表達(dá)式,計(jì)算高級(jí)特征;平方誤差計(jì)算部分43,用于計(jì)算一方面由高級(jí)特征計(jì)算部分42計(jì)算的高級(jí)特征,并且另一方面訓(xùn)練數(shù)據(jù)(與輸入數(shù)據(jù)相對(duì)應(yīng)的真正的高級(jí)特征)之間的平方誤差;拒絕區(qū)域提取表達(dá)式學(xué)習(xí)部分44,用于通過學(xué)習(xí)創(chuàng)建拒絕區(qū)域提取表達(dá)式,向該拒絕區(qū)域提取表達(dá)式輸入由低級(jí)特征計(jì)算部分41計(jì)算的各低級(jí)特征,并且從該拒絕區(qū)域提取表達(dá)式輸出由平方誤差計(jì)算部分43計(jì)算的平方誤差;以及特征提取精度計(jì)算部分45,用于將輸入數(shù)據(jù),代入由拒絕區(qū)域提取表達(dá)式學(xué)習(xí)部分44創(chuàng)建的拒絕區(qū)域提取表達(dá)式,估計(jì)關(guān)于輸入數(shù)據(jù)計(jì)算的、高級(jí)特征的特征提取精度級(jí)別(平方誤差),并且只要該估計(jì)的特征提取精度級(jí)別高于預(yù)定的閾值,則使高級(jí)特征計(jì)算部分42計(jì)算該高級(jí)特征。
下面描述作為本發(fā)明的第一實(shí)施例的特征提取算法創(chuàng)建設(shè)備20的工作。
圖7是構(gòu)成特征提取算法創(chuàng)建過程的各步驟的流程圖。其是特征提取算法創(chuàng)建設(shè)備20的基本操作。
在步驟S1,控制部分27通過將學(xué)習(xí)循環(huán)參數(shù)G初始化為“1”,開始學(xué)習(xí)循環(huán)。該學(xué)習(xí)循環(huán)被重復(fù)與預(yù)定的學(xué)習(xí)計(jì)數(shù)“g”一樣多的次數(shù)。
在步驟S2,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,創(chuàng)建“n”個(gè)低級(jí)特征提取表達(dá)式列表,其每個(gè)包括“m”個(gè)低級(jí)特征提取表達(dá)式,并且輸出創(chuàng)建的各列表到低級(jí)特征計(jì)算部分24,如圖8中所示。
下面參照?qǐng)D9的流程圖,詳細(xì)描述步驟S2(即,低級(jí)特征提取表達(dá)式列表創(chuàng)建過程)的過程。
在步驟S11,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21檢查以便確定要?jiǎng)?chuàng)建的各低級(jí)特征提取表達(dá)式列表是否是第一代的。如果學(xué)習(xí)循環(huán)參數(shù)G被設(shè)置為“0”,則要?jiǎng)?chuàng)建的各低級(jí)特征提取表達(dá)式列表被發(fā)現(xiàn)是第一代的。
當(dāng)因?yàn)閷W(xué)習(xí)循環(huán)參數(shù)G被設(shè)置為“0”,而發(fā)現(xiàn)要?jiǎng)?chuàng)建的各低級(jí)特征提取表達(dá)式列表是第一代的時(shí),到達(dá)步驟S12。在步驟S12,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,隨機(jī)創(chuàng)建第一代的低級(jí)特征提取表達(dá)式列表。
相反,如果要?jiǎng)?chuàng)建的低級(jí)特征提取表達(dá)式列表被發(fā)現(xiàn)不是第一代的時(shí),則到達(dá)步驟S13。在步驟S13,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,基于最近一代的各低級(jí)特征提取表達(dá)式列表,使用遺傳算法,按遺傳方式創(chuàng)建下一代的各低級(jí)特征提取表達(dá)式列表。
下面參照?qǐng)D10的流程圖,詳細(xì)描述S12的過程(即,第一代列表隨機(jī)創(chuàng)建過程)。
在步驟S21,控制部分27通過將列表循環(huán)參數(shù)N初始化為“1”,開始列表循環(huán)。該列表循環(huán)被重復(fù)與預(yù)定的列表計(jì)數(shù)“n”一樣多的次數(shù)。
在步驟S22,控制部分27通過將表達(dá)式循環(huán)參數(shù)M初始化為“1”,開始表達(dá)式循環(huán)。該表達(dá)式循環(huán)被重復(fù)與低級(jí)特征提取表達(dá)式的數(shù)“m”相同的次數(shù),所述低級(jí)特征提取表達(dá)式構(gòu)成單個(gè)低級(jí)特征提取表達(dá)式列表。
下面參照?qǐng)D11解釋,在表達(dá)式循環(huán)期間,創(chuàng)建的各低級(jí)特征提取表達(dá)式典型地是如何描述的。
輸入數(shù)據(jù)在低級(jí)特征提取表達(dá)式的最左位置描述。在該輸入數(shù)據(jù)的右邊,是按它們進(jìn)行運(yùn)算的次序描述的一個(gè)或多個(gè)運(yùn)算符。每個(gè)運(yùn)算符按需要可以包括過程對(duì)稱軸和參數(shù)。
在如圖11所示的低級(jí)特征提取表達(dá)式的情形,輸入數(shù)據(jù)是“12TonesM”,并且各操作符是“32#Differential”、“32#MaxIndex”、“16#LPF_;0.861”等。圖示性地,輸入數(shù)據(jù)“12TonesM”指示單聲道PCM(脈沖編碼調(diào)制聲音源)波形數(shù)據(jù)出現(xiàn)在時(shí)間軸方向。標(biāo)注“48#”代表通道軸,“32#”代表頻率和間隔軸,而“16#”代表時(shí)間軸。運(yùn)算符中的參數(shù)“0.861”應(yīng)用于低通濾波,并且圖示性地表示濾波過程的閾值頻率。
回到圖10中的步驟S23,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,在要?jiǎng)?chuàng)建的第N個(gè)低級(jí)特征提取表達(dá)式列表(下文又被稱作為列表N)中,隨機(jī)確定第M個(gè)低級(jí)特征提取表達(dá)式(在下文中又稱作為低級(jí)特征提取表達(dá)式M)的輸入數(shù)據(jù)。
典型的輸入數(shù)據(jù)類型可以包括“Wav”、“12Tones(12音)”、“Chord”、和“Key”,如圖12所示。
輸入數(shù)據(jù)“WAV”是如圖13中所示的PCM波形數(shù)據(jù),并且涉及的支持(holding)維度是時(shí)間和通道軸。輸入數(shù)據(jù)“12Tones”是由時(shí)間軸上的間隔分析的PCM波形數(shù)據(jù),并且支持維度是時(shí)間和間隔軸。輸入數(shù)據(jù)“Chord”表示如圖14中所示的歌曲和弦進(jìn)行(C、C#、D、...,Bm),并且支持維度是時(shí)間和間隔軸。輸入數(shù)據(jù)“Key”表示歌曲調(diào)(C、C#、D、...、B),并且支持維度是時(shí)間和間隔軸。
回到圖10中的步驟S24,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21隨機(jī)地確定,在要?jiǎng)?chuàng)建的列表N中用于低級(jí)特征提取表達(dá)式M的參數(shù)和過程對(duì)稱軸。
各參數(shù)類型可以包括均值(Mean),快速傅立葉變換(FFT)、標(biāo)準(zhǔn)偏差(StDev)、發(fā)生率(比率)、低通濾波器(LPF)、高通濾波器(HPF)、絕對(duì)值(ABS)、微分(Differential(微分))、最大值(MaxIndex)和無偏方差(UVariance)。過程對(duì)稱軸可以表現(xiàn)為對(duì)已經(jīng)確定的特定運(yùn)算符是固定的。在這樣的情形,采用對(duì)關(guān)注的運(yùn)算符中的參數(shù)固定的過程對(duì)稱軸。如果確定的運(yùn)算符表現(xiàn)出需要特定參數(shù),則該參數(shù)被設(shè)置為隨機(jī)值或預(yù)定的值。
在步驟S25中,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,檢查以便確定在直到該時(shí)間點(diǎn)(point in time)創(chuàng)建的列表N中,由低級(jí)特征提取表達(dá)式M的計(jì)算結(jié)果,是標(biāo)量(scalar)(一維)還是最多預(yù)定數(shù)目的維度(例如,如1或2的小數(shù)目)。如果在步驟S25中檢查結(jié)果是負(fù)的,則再次到達(dá)步驟S24,并且多添加一個(gè)運(yùn)算符。重復(fù)步驟S24和S25,計(jì)算結(jié)果中的支持維度的數(shù)目如圖16所示那樣降低。如果在步驟S25中,在列表N中由低級(jí)特征提取表達(dá)式M計(jì)算的結(jié)果,是標(biāo)量或至多預(yù)定的小數(shù)目的維度(例如,1或2),則到達(dá)步驟S26。
在步驟S26,控制部分27檢查以便確定表達(dá)式循環(huán)參數(shù)M是否小于最大值“m”。如果表達(dá)式循環(huán)參數(shù)M被發(fā)現(xiàn)小于最大值“m”,則參數(shù)M被增加“1”,并且再次到達(dá)步驟S23。相反,如果表達(dá)式循環(huán)參數(shù)M未被發(fā)現(xiàn)小于最大值“m”(即如果參數(shù)M等于最大值“m”),則退出表達(dá)式循環(huán),并且到達(dá)步驟S27。因此由直到該點(diǎn)的處理,創(chuàng)建第N個(gè)低級(jí)特征提取表達(dá)式列表。
在步驟S27,控制部分27檢查以便確定列表循環(huán)參數(shù)N是否小于最大值“n”。如果列表循環(huán)參數(shù)N被發(fā)現(xiàn)小于最大值“n”,則參數(shù)N被增加“1”,并且再次到達(dá)步驟S22。另一方面,如果列表循環(huán)參數(shù)N未被發(fā)現(xiàn)小于最大值“n”(即,如果參數(shù)N等于最大值“n”),則退出列表循環(huán),并且第一代列表隨機(jī)創(chuàng)建過程被終止。因此由直到該點(diǎn)的處理,創(chuàng)建第一代的多如“n”個(gè)的低級(jí)特征提取表達(dá)式列表。
下面參照?qǐng)D17的流程圖,詳細(xì)描述用于創(chuàng)建在圖9的步驟S13中的第二和隨后的各代的各低級(jí)特征提取表達(dá)式列表的過程(即,下一代列表遺傳創(chuàng)建過程)。
在步驟S31,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21隨機(jī)地確定3個(gè)數(shù)目選擇計(jì)數(shù)“ns”,表示從要?jiǎng)?chuàng)建的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,應(yīng)用了遺傳算法選擇的列表的數(shù)目;交叉計(jì)數(shù)“nx”,表示應(yīng)用了遺傳算法交叉的列表的數(shù)目;以及突變計(jì)數(shù)“nm”,指示應(yīng)用了遺傳算法突變的列表的數(shù)目。該選擇計(jì)數(shù)“ns”、交叉計(jì)數(shù)“nx”和突變計(jì)數(shù)“nm”的總和等于“n”。作為替代,該選擇計(jì)數(shù)“ns”、交叉計(jì)數(shù)“nx”和突變計(jì)數(shù)“nm”每個(gè)可以是預(yù)定的常數(shù)。
在步驟S32,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,使用總計(jì)達(dá)(amounting to)選擇計(jì)數(shù)“ns”的低級(jí)特征提取表達(dá)式列表,創(chuàng)建多如“ns”個(gè)的低級(jí)特征提取表達(dá)式列表,所述“ns”從最近一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中確定。在步驟S33中,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,使用總計(jì)達(dá)交叉計(jì)數(shù)“nx”的低級(jí)特征提取表達(dá)式列表,創(chuàng)建多如“nx”個(gè)的低級(jí)特征提取表達(dá)式列表,所述“nx”從最近一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中確定。在步驟S34中,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,使用總計(jì)達(dá)突變計(jì)數(shù)“nm”的低級(jí)特征提取表達(dá)式列表,創(chuàng)建多如“nm”個(gè)的低級(jí)特征提取表達(dá)式列表,所述“nm”從最近一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中確定。
下面詳細(xì)描述步驟S32至S34中的每個(gè)的過程。
現(xiàn)在將參照?qǐng)D18的流程圖,詳細(xì)描述步驟S32的選擇創(chuàng)建過程。該選擇創(chuàng)建過程,從下一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,創(chuàng)建總計(jì)達(dá)選擇計(jì)數(shù)“ns”的低級(jí)特征提取表達(dá)式列表。
在步驟S41,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,按各高級(jí)特征提取表達(dá)式的均值估計(jì)精度級(jí)別的降序,排序最近一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表,所述各高級(jí)特征提取表達(dá)式,從高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25輸入。在步驟S42,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,從最近一代的經(jīng)排序的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,采用頂端的“ns”個(gè)低級(jí)特征提取表達(dá)式列表,作為下一代的低級(jí)特征提取表達(dá)式列表。這使得選擇創(chuàng)建過程結(jié)束。
現(xiàn)在將參照?qǐng)D19的流程圖,詳細(xì)描述圖17的步驟S33的交叉創(chuàng)建過程。該交叉創(chuàng)建過程,從下一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,創(chuàng)建總計(jì)達(dá)交叉計(jì)數(shù)“nx”的低級(jí)特征提取表達(dá)式列表。
在步驟S51,控制部分27通過初始化交叉循環(huán)參數(shù)NX為“1”,開始交叉循環(huán)。交叉循環(huán)被重復(fù)與交叉計(jì)數(shù)“nx”一樣多的次數(shù)。
在步驟S52,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,在隨機(jī)選擇兩個(gè)低級(jí)特征提取表達(dá)式列表A和B之前,加權(quán)最近一代的各低級(jí)特征提取表達(dá)式列表,以便按由高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25輸出的、高級(jí)特征提取表達(dá)式的、均值估計(jì)精度級(jí)別的降序,導(dǎo)出(induce)該列表的優(yōu)先部分。在該過程的選擇期間,由如上所述的選擇創(chuàng)建過程選擇的“ns”個(gè)低級(jí)特征提取表達(dá)式列表,可以從候選者列表中排除,或可以作為部分候選者列表而保持原樣。
在步驟S53,控制部分27通過初始化表達(dá)式循環(huán)參數(shù)M為“1”,開始表達(dá)式循環(huán)。該表達(dá)式循環(huán)被重復(fù)與表達(dá)式的數(shù)“m”一樣多的次數(shù),所述表達(dá)式包括在單個(gè)低級(jí)特征提取表達(dá)式列表中。
在步驟S54,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,在隨機(jī)選擇單個(gè)低級(jí)特征提取表達(dá)式(包括在下一代的低級(jí)特征提取表達(dá)式列表內(nèi))之前,加權(quán)在低級(jí)特征提取表達(dá)式列表A和B中的“2m”個(gè)低級(jí)特征提取表達(dá)式,以便按各高級(jí)特征提取表達(dá)式的各貢獻(xiàn)比率的降序,導(dǎo)出各表達(dá)式的優(yōu)先部分,所述各高級(jí)特征提取表達(dá)式由高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25輸出。
在步驟S55,控制部分27檢查以便確定表達(dá)式循環(huán)參數(shù)M是否小于最大值“m”。如果表達(dá)式循環(huán)參數(shù)M被發(fā)現(xiàn)小于最大值“m”,則參數(shù)M被增加“1”,并且再次到達(dá)步驟S54。相反,如果表達(dá)式循環(huán)參數(shù)M未被發(fā)現(xiàn)小于最大值“m”(即如果參數(shù)M等于最大值“m”),則退出表達(dá)式循環(huán),并且到達(dá)步驟S56。因此在構(gòu)成表達(dá)式循環(huán)的步驟S53至S55中,創(chuàng)建單個(gè)低級(jí)特征提取表達(dá)式列表。
在步驟S56,控制部分27檢查以便確定交叉循環(huán)參數(shù)NX是否小于最大值“nx”。如果交叉循環(huán)參數(shù)NX被發(fā)現(xiàn)小于最大值“nx”,則參數(shù)NX被增加“1”,并且再次到達(dá)步驟S52。另一方面,如果交叉循環(huán)參數(shù)NX未被發(fā)現(xiàn)小于最大值“nx”(即如果參數(shù)NX等于最大值“nx”),則退出交叉循環(huán),并且交叉創(chuàng)建過程被終止。因此由已經(jīng)執(zhí)行的交叉循環(huán),創(chuàng)建總計(jì)達(dá)交叉計(jì)數(shù)“nx”的低級(jí)特征提取表達(dá)式列表。
現(xiàn)在將參照?qǐng)D20的流程圖,詳細(xì)描述圖17中的步驟S34的突變創(chuàng)建過程。該突變創(chuàng)建過程,從下一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,創(chuàng)建總計(jì)達(dá)突變計(jì)數(shù)“nm”的低級(jí)特征提取表達(dá)式列表。
在步驟S61,控制部分27通過初始化突變循環(huán)參數(shù)NM為“1”,開始突變循環(huán)。突變循環(huán)被重復(fù)與突變計(jì)數(shù)“nm”一樣多的次數(shù)。
在步驟S62,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,在隨機(jī)選擇單個(gè)低級(jí)特征提取表達(dá)式列表A之前,加權(quán)最近一代的各低級(jí)特征提取表達(dá)式列表,以便按各高級(jí)特征提取表達(dá)式的均值估計(jì)精度級(jí)別的降序,導(dǎo)出各列表的優(yōu)先部分,所述各高級(jí)特征提取表達(dá)式由高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25輸出。在該過程的選擇期間,由如上所述的選擇創(chuàng)建過程選擇的“ns”個(gè)低級(jí)特征提取表達(dá)式列表,可以從各候選者列表中排除,或可以作為部分候選者列表而保持原樣。同樣,上面的交叉創(chuàng)建過程的步驟S52中選擇的各低級(jí)特征提取表達(dá)式列表,可以從各候選者列表中排除,或可以作為各部分候選者列表而保持原樣。
在步驟S63,控制部分27通過初始化表達(dá)式循環(huán)參數(shù)M為“1”,開始表達(dá)式循環(huán)。該表達(dá)式循環(huán)被重復(fù)與各表達(dá)式的數(shù)“m”一樣多的次數(shù),所述各表達(dá)式包括在單個(gè)低級(jí)特征提取表達(dá)式列表中。
在步驟S64,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,檢查以便確定在低級(jí)特征提取表達(dá)式列表A中的“m”個(gè)低級(jí)特征提取表達(dá)式中,使用第M個(gè)低級(jí)特征提取表達(dá)式計(jì)算的低級(jí)特征的貢獻(xiàn)比率,是否低于在低級(jí)特征提取表達(dá)式列表A中,使用其它低級(jí)特征提取表達(dá)式計(jì)算的低級(jí)特征的各貢獻(xiàn)比率。更具體地講,進(jìn)行檢查以確定使用第M個(gè)低級(jí)特征提取表達(dá)式計(jì)算的低級(jí)特征的貢獻(xiàn)比率,是否低于在低級(jí)特征提取表達(dá)式列表A中,使用“m”個(gè)低級(jí)特征提取表達(dá)式計(jì)算的貢獻(xiàn)比率序列中的預(yù)定比率。
如果在步驟S64,使用第M個(gè)低級(jí)特征提取表達(dá)式計(jì)算的低級(jí)特征的貢獻(xiàn)比率,被發(fā)現(xiàn)低于其他,則到達(dá)步驟S65。在步驟S65,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,隨機(jī)地突變包括在下一代的低級(jí)特征提取表達(dá)式列表中的第M個(gè)低級(jí)特征提取表達(dá)式。
如果在步驟S64,使用第M個(gè)低級(jí)特征提取表達(dá)式計(jì)算的低級(jí)特征的貢獻(xiàn)比率,未被發(fā)現(xiàn)低于其他,則到達(dá)步驟S66。在步驟S66,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,將第M個(gè)低級(jí)特征提取表達(dá)式,添加到下一代的低級(jí)特征提取表達(dá)式列表,而不突變存在置疑的表達(dá)式。
在步驟S67,控制部分27檢查以便確定表達(dá)式循環(huán)參數(shù)M是否小于最大值“m”。如果表達(dá)式循環(huán)參數(shù)M被發(fā)現(xiàn)小于最大值“m”,則表達(dá)式循環(huán)參數(shù)M被增加“1”,并且再次到達(dá)步驟S64。另一方面,如果表達(dá)式循環(huán)參數(shù)M未被發(fā)現(xiàn)小于最大值“m”(即,如果參數(shù)M等于最大值“m”),則退出表達(dá)式循環(huán),并且到達(dá)步驟S68。因此在構(gòu)成表達(dá)式循環(huán)的步驟S63至S67中,創(chuàng)建單個(gè)的低級(jí)特征提取表達(dá)式列表。
在步驟S68,控制部分27檢查以便確定突變循環(huán)參數(shù)NM是否小于最大值“ nm”。如果突變循環(huán)參數(shù)NM被發(fā)現(xiàn)小于最大值“nm”,則突變循環(huán)參數(shù)NM被增加“1”,并且再次到達(dá)步驟S62。另一方面,如果突變循環(huán)參數(shù)NM未被發(fā)現(xiàn)小于最大值“nm”(即如果參數(shù)NM等于最大值“nm”),則退出突變循環(huán),并且突變創(chuàng)建過程被終止。因此由直達(dá)該點(diǎn)的處理,創(chuàng)建總計(jì)達(dá)突變計(jì)數(shù)“nm”的各低級(jí)特征提取表達(dá)式列表。
按照如上所述的下一代列表遺傳創(chuàng)建過程,具有高估計(jì)精度級(jí)別的最近一代的各低級(jí)特征提取表達(dá)式列表,被發(fā)送到下一代,而具有高貢獻(xiàn)比率的最近一代的各低級(jí)特征提取表達(dá)式也一樣。具有低估計(jì)精度級(jí)別和貢獻(xiàn)比率的那些被放棄,而不發(fā)送到下一代。即,隨著各代進(jìn)展,各低級(jí)特征提取表達(dá)式列表的估計(jì)精度級(jí)別被期望改進(jìn),而各低級(jí)特征提取表達(dá)式的貢獻(xiàn)比率也一樣。
返回到圖7,如上面討論那樣創(chuàng)建的下一代的各低級(jí)特征提取表達(dá)式列表,由低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21輸出到低級(jí)特征計(jì)算部分24。在步驟S3,低級(jí)特征計(jì)算部分24,通過將“j”個(gè)歌曲C1至Cj的輸入數(shù)據(jù)(內(nèi)容數(shù)據(jù)和元數(shù)據(jù)),代入到“n”個(gè)低級(jí)特征提取表達(dá)式列表的每個(gè),計(jì)算各低級(jí)特征,所述低級(jí)特征提取表達(dá)式列表,從低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21輸入。
假定“j”個(gè)歌曲的輸入每個(gè)數(shù)據(jù)項(xiàng)目被預(yù)先提供有多如“k”個(gè)的訓(xùn)練數(shù)據(jù)項(xiàng)目(即,對(duì)應(yīng)于各高級(jí)特征)。
作為舉例,假定低級(jí)特征計(jì)算部分24如圖21的部分A所示的那樣,通過涉及“#16Mean”運(yùn)算符的計(jì)算,對(duì)其支持維度是間隔和時(shí)間軸的輸入數(shù)據(jù)運(yùn)算。在此情形中,在用作過程對(duì)稱軸的時(shí)間軸上,計(jì)算每個(gè)間隔處的均值,如圖21的部分B描述的那樣。該計(jì)算導(dǎo)致各低級(jí)特征提取表達(dá)式的“n”個(gè)組合(每個(gè)組合由“m”個(gè)低級(jí)特征構(gòu)成),每個(gè)組合對(duì)應(yīng)于每個(gè)輸入數(shù)據(jù)項(xiàng)目,如同圖22所示的那樣。作為結(jié)果的“n”個(gè)低級(jí)特征提取表達(dá)式組合,被輸出到高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25。
回到圖7中的步驟S4,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,基于從低級(jí)特征計(jì)算部分24輸入的”n”個(gè)低級(jí)特征、以及相對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)(即,如圖23所示,與每個(gè)輸入數(shù)據(jù)項(xiàng)目(關(guān)于歌曲C1至Cj)相對(duì)應(yīng)的“k”個(gè)類型的高級(jí)特征),通過學(xué)習(xí),估計(jì)(即,創(chuàng)建)“n”個(gè)高級(jí)特征提取表達(dá)式組合,每個(gè)高級(jí)特征提取表達(dá)式組合包括“k”個(gè)高級(jí)特征提取表達(dá)式。高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,進(jìn)一步計(jì)算每個(gè)高級(jí)特征提取表達(dá)式中的每個(gè)低級(jí)特征的貢獻(xiàn)比率、以及每個(gè)高級(jí)特征提取表達(dá)式的估計(jì)的精度級(jí)別,并且將計(jì)算結(jié)果輸出到低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21。
現(xiàn)在參照?qǐng)D24的流程圖,在下文詳細(xì)描述步驟S4的高級(jí)特征提取表達(dá)式學(xué)習(xí)過程。
在步驟S71,控制部分27通過初始化列表循環(huán)參數(shù)N為“1”,開始列表循環(huán)。該列表循環(huán)被重復(fù)與預(yù)定的列表計(jì)數(shù)“n”一樣多的次數(shù)。在步驟S72,控制部分27通過初始化訓(xùn)練數(shù)據(jù)循環(huán)參數(shù)K為“1”,開始訓(xùn)練數(shù)據(jù)循環(huán)。該訓(xùn)練數(shù)據(jù)循環(huán)被重復(fù)與預(yù)定訓(xùn)練數(shù)據(jù)類型計(jì)數(shù)“k”一樣多的次數(shù)。
在步驟S73,控制部分27通過初始化算法循環(huán)參數(shù)A為“1”,開始算法循環(huán)。該算法循環(huán)被重復(fù)與預(yù)定的學(xué)習(xí)算法類型計(jì)數(shù)“a”一樣多的次數(shù)。
作為實(shí)例,可以認(rèn)為存在4種學(xué)習(xí)算法類型回歸(regression)(回歸分析)、分類(分級(jí))、SVM(支持矢量機(jī))和GP(遺傳編程)。
可以提供兩種“回歸”類型的學(xué)習(xí)算法。如圖25所示,一種算法涉及以一種方式學(xué)習(xí)參數(shù)“bn”,使得在假定訓(xùn)練數(shù)據(jù)與各低級(jí)特征線性相關(guān)時(shí),訓(xùn)練數(shù)據(jù)和項(xiàng)目Y之間的平方誤差被最小化。另一種算法,如圖26所示,涉及以一種方式學(xué)習(xí)參數(shù)“bnm”,使得在假定訓(xùn)練數(shù)據(jù)與各低級(jí)特征非線性相關(guān)時(shí),訓(xùn)練數(shù)據(jù)和項(xiàng)目Y之間的平方誤差被最小化。
可以提供三種主要的“分類”類型的學(xué)習(xí)算法。一種算法,如圖27所示,涉及計(jì)算給定項(xiàng)目與不同類(圖27的實(shí)例中的男聲類和女聲類)的每個(gè)的中心的歐幾里得(Euclidian)距離“d”,并且將所述項(xiàng)目分入一類,至該類的計(jì)算的歐幾里得距離“d”最短。另一種算法,如圖28所示,涉及計(jì)算給定項(xiàng)目的相關(guān)系數(shù)“correl”,所述給定項(xiàng)目與不同類(圖28的實(shí)例中的男聲類和女聲類)的每個(gè)的均值矢量有關(guān),并且將所述項(xiàng)目分入涉及相關(guān)系數(shù)“correl”最大的類。另一種算法,如圖29所示,涉及計(jì)算給定項(xiàng)目與不同分類(圖29的實(shí)例中的男聲類和女聲類)的每個(gè)的中心的馬哈拉諾比斯距離(Mahalanobis)距離“d”,并且將所述項(xiàng)目分入一類,至該類的計(jì)算的馬哈拉諾比斯距離“d”最短。
還可能考慮兩種“分類”類型的學(xué)習(xí)算法變體(variation)。一種變體,如圖30的部分A所示,涉及具有用多個(gè)類表示的、不同類的組(圖30的實(shí)例中的男和女聲類的組)的每個(gè)的分布,計(jì)算給定項(xiàng)目從不同類的每個(gè)的中心的歐幾里得距離“d”,并且將所述項(xiàng)目分入一類,至該類的計(jì)算的歐幾里得距離“d”最短。另一種變體,如圖30的部分B所示,涉及具有用多個(gè)類表示的、不同類的組(圖30的實(shí)例中的男和女聲類的組)的每個(gè)的分布,計(jì)算給定項(xiàng)目從不同類的每個(gè)的中心的馬哈拉諾比斯距離(Mahalanobis)距離“d”,并且將所述項(xiàng)目分入一類,至該類的計(jì)算的馬哈拉諾比斯距離“d”最短。
可以提供一種“SVM”類型的學(xué)習(xí)算法。該算法如圖31所示,涉及具有用支持矢量表示的各類(圖31的實(shí)例中的男和女聲類)之間的邊界平面,和用此方法學(xué)習(xí)參數(shù)“bnm”,以便最大化一方面區(qū)分各類的不連續(xù)平面、以及另一方面邊界平面附近的各矢量之間的距離(余量)。
可以提供3種“GP”類型的學(xué)習(xí)算法。一種算法如圖32所示,涉及通過遺傳編程,創(chuàng)建組合各低級(jí)特征的表達(dá)式。另一種算法,如圖33的部分A所示,涉及交叉表達(dá)式,其每個(gè)表達(dá)式組合了各低級(jí)特征。另一種算法,如圖33的部分B所示,涉及突變組合各低級(jí)特征的表達(dá)式。
如果上面概述的學(xué)習(xí)算法全部被采用,則將存在用于使用的11種學(xué)習(xí)算法。
回到圖24的步驟S74,控制部分27通過初始化交叉確認(rèn)循環(huán)參數(shù)C為“1”,開始交叉確認(rèn)循環(huán)。該交叉確認(rèn)循環(huán)被重復(fù)與預(yù)定的交叉確認(rèn)計(jì)數(shù)“c”一樣多的次數(shù)。
在步驟S75,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,從多如“k”個(gè)的訓(xùn)練數(shù)據(jù)類型中,將大約“j”個(gè)歌曲的第K個(gè)類型的訓(xùn)練數(shù)據(jù)(真正的高級(jí)特征),隨機(jī)地二分為學(xué)習(xí)使用數(shù)據(jù)和評(píng)估使用數(shù)據(jù)。在下面的描述中,將為學(xué)習(xí)使用分類的訓(xùn)練數(shù)據(jù)稱作為學(xué)習(xí)數(shù)據(jù),而將為評(píng)估使用分類的訓(xùn)練數(shù)據(jù)稱作為評(píng)估數(shù)據(jù)。
在步驟S76,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,通過學(xué)習(xí)估計(jì)高級(jí)特征提取表達(dá)式,該學(xué)習(xí)涉及將第a個(gè)學(xué)習(xí)算法應(yīng)用到相對(duì)應(yīng)的學(xué)習(xí)數(shù)據(jù)、以及使用第N個(gè)低級(jí)特征提取表達(dá)式列表計(jì)算的“m”個(gè)低級(jí)特征的組合。在所述學(xué)習(xí)期間,“m”個(gè)低級(jí)特征的一些被遺傳地選擇來使用,以便降低計(jì)算量,并且抑制過度的學(xué)習(xí)(over-learning)(過度的適合)。
作為選擇各低級(jí)特征的標(biāo)準(zhǔn),使用作為函數(shù)的、稱作為AIC(Akaike信息標(biāo)準(zhǔn))的信息數(shù)量標(biāo)準(zhǔn)、或稱作為BIC(貝葉斯信息標(biāo)準(zhǔn))的信息數(shù)量標(biāo)準(zhǔn)。該AIC和BIC每個(gè)都被用作用于選擇學(xué)習(xí)模型的標(biāo)準(zhǔn)(此情形中關(guān)于選擇的各低級(jí)特征)。所述學(xué)習(xí)模型的值越小,則所述模型越好(即,高度地被評(píng)估)。
所述AIC用下面的表達(dá)式定義AIC=-2×最大對(duì)數(shù)似然+2×自由參數(shù)計(jì)數(shù)如果“回歸(線性)”類型的學(xué)習(xí)算法被采用(如圖25中的情形),則自由參數(shù)計(jì)數(shù)=n+1以及對(duì)數(shù)似然=0.5×學(xué)習(xí)數(shù)據(jù)計(jì)數(shù)×((log(2∏)+1+log(均方誤差))使得AIC=學(xué)習(xí)數(shù)據(jù)計(jì)數(shù)×((log(2∏)+1+log(均方誤差))+2×(n+1)所述BIC用下面的表達(dá)式定義BIC=-2×最大對(duì)數(shù)似然+log(學(xué)習(xí)數(shù)據(jù)計(jì)數(shù))×自由參數(shù)計(jì)數(shù)作為實(shí)例,如果“回歸(線性)”類型的學(xué)習(xí)算法被采用(如圖25中的情形),則BIC=學(xué)習(xí)數(shù)據(jù)計(jì)數(shù)×((log(2∏)+1+log(均方誤差))+log(學(xué)習(xí)數(shù)據(jù)計(jì)數(shù))×(n+1)與AIC相比,注意到,所述BIC不管學(xué)習(xí)數(shù)據(jù)的正在增長(zhǎng)的數(shù)量,而其值的增加可忽略。
現(xiàn)在將參照?qǐng)D34,描述步驟S76中基于學(xué)習(xí)算法的學(xué)習(xí)過程。對(duì)于該學(xué)習(xí)過程,如上面討論的那樣,計(jì)算的“m”個(gè)低級(jí)特征的一些被遺傳地選擇來使用,以便降低計(jì)算量,并且抑制過度的學(xué)習(xí)(過度的適合)。
在步驟S91,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,從“m”個(gè)低級(jí)特征(用于在學(xué)習(xí)中使用)通過隨機(jī)選擇,創(chuàng)建多如“p”個(gè)低級(jí)特征的初始群體(initialpopulation)。
在步驟S92,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,使用遺傳算法(GA)開始特征選擇循環(huán)?;贕A的特征選擇循環(huán)被重復(fù),直到特定條件在后續(xù)的步驟S98中被滿足。
在步驟S93,控制部分27通過初始化初始群體循環(huán)參數(shù)P為“1”,開始初始群體循環(huán)。該初始群體循環(huán)被重復(fù)與步驟S91中創(chuàng)建的、低級(jí)特征的初始群體的數(shù)量“p”一樣多的次數(shù)。
在步驟S94,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,從訓(xùn)練數(shù)據(jù)中通過學(xué)習(xí)估計(jì)高級(jí)特征提取表達(dá)式,該學(xué)習(xí)涉及將第A個(gè)學(xué)習(xí)算法應(yīng)用到各低級(jí)特征和相對(duì)應(yīng)的學(xué)習(xí)數(shù)據(jù),所述各低級(jí)特征被包括在第P個(gè)初始群體中。
在步驟S95,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,計(jì)算信息數(shù)量標(biāo)準(zhǔn)AIC或BIC,作為以步驟S94的結(jié)果獲得的高級(jí)特征的評(píng)估值。
在步驟S96,控制部分27檢查以便確定初始群體參數(shù)P是否小于最大值“P”。如果初始群體參數(shù)P被發(fā)現(xiàn)小于最大值“p”,則所述初始群體循環(huán)參數(shù)P被增加“1”,并且再次到達(dá)步驟S94。另一方面,如果初始群體參數(shù)P未被發(fā)現(xiàn)小于最大值“p”(即如果參數(shù)P等于最大值“p”),則退出初始群體循環(huán),并且到達(dá)步驟S97。因此信息數(shù)量標(biāo)準(zhǔn)AIC或BIC,通過構(gòu)成初始群體循環(huán)的S96,被獲取為用于高級(jí)特征提取表達(dá)式的評(píng)估值,所述高級(jí)特征提取表達(dá)式從步驟S93中的每個(gè)初始群體學(xué)習(xí)。
在步驟S97,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,遺傳性地更新“p”個(gè)由各低級(jí)特征組成的初始群體,以便被用于學(xué)習(xí)。更具體地講,如在圖17的步驟S32至S34,初始群體通過選擇、交叉和突變被更新。所述更新意圖在于,改進(jìn)以隨機(jī)方式從初始創(chuàng)建的初始群體獲取的、高級(jí)特征提取表達(dá)式的評(píng)估值。
在步驟S98,控制部分27檢查以便確定在對(duì)應(yīng)于“p”個(gè)初始群體的各高級(jí)特征提取表達(dá)式中,具有最高評(píng)估值(即,最小信息數(shù)量標(biāo)準(zhǔn))的高級(jí)特征提取表達(dá)式,在繼每個(gè)基于GA的特征選擇循環(huán)之后,是否被發(fā)現(xiàn)具有其被改進(jìn)的評(píng)估值(即,信息數(shù)量標(biāo)準(zhǔn)被降低)。如果在步驟S98中的檢查的結(jié)果是肯定的,則再次到達(dá)步驟S93,并且所述特征選擇循環(huán)被重復(fù)。另一方面,可能發(fā)生在與“p”個(gè)初始群體相對(duì)應(yīng)的各表達(dá)式中,具有最高評(píng)估值的高級(jí)特征提取表達(dá)式,在繼重復(fù)的基于GA的特征選擇循環(huán)之后,未被發(fā)現(xiàn)具有其被改進(jìn)的評(píng)估值(即,信息數(shù)量標(biāo)準(zhǔn)未被降低)。在此情形中,退出基于GA的特征選擇循環(huán),并且具有最高評(píng)估值的高級(jí)特征提取表達(dá)式,被輸出到下流的過程(即,至圖24中的步驟S77)。這使得基于學(xué)習(xí)算法的學(xué)習(xí)過程結(jié)束。
步驟S91中選擇的各低級(jí)特征的數(shù)目可能被固定。在此情形中,各低級(jí)特征的必要數(shù)量可以使用相關(guān)訓(xùn)練數(shù)據(jù)的熵獲得。同樣,可以對(duì)各主分量分析所述訓(xùn)練數(shù)據(jù),并且可以將各低級(jí)特征的數(shù)量設(shè)置為等于分析的各主分量的數(shù)量。
回到在圖24中的步驟S77,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,使用相關(guān)的評(píng)估數(shù)據(jù),評(píng)估具有步驟S76中獲取的、最高評(píng)估值的高級(jí)特征提取表達(dá)式。更具體地講,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,使用獲取的高級(jí)特征提取表達(dá)式計(jì)算高級(jí)特征,以便發(fā)現(xiàn)在計(jì)算的結(jié)果和存在置疑的評(píng)估數(shù)據(jù)之間的平方誤差。
在步驟S78,控制部分27檢查以便確定交叉確認(rèn)循環(huán)參數(shù)C是否小于最大值“c”。如果交叉確認(rèn)循環(huán)參數(shù)C被發(fā)現(xiàn)小于最大值“c”,則參數(shù)C被增加“1”,并且再次到達(dá)步驟S75。另一方面,如果交叉確認(rèn)循環(huán)參數(shù)C未被發(fā)現(xiàn)小于最大值“c”(即如果參數(shù)C等于最大值“c”),則退出交叉確認(rèn)循環(huán),并且到達(dá)步驟S79。因此,多如“c”個(gè)的高級(jí)特征提取表達(dá)式被獲取,作為構(gòu)成交叉確認(rèn)循環(huán)的步驟S74至S78中的學(xué)習(xí)的結(jié)果。因?yàn)閷W(xué)習(xí)數(shù)據(jù)和評(píng)估數(shù)據(jù)通過交叉確認(rèn)循環(huán)被隨機(jī)地變換,所以可能驗(yàn)證該高級(jí)特征提取表達(dá)式?jīng)]有被過度學(xué)習(xí)。
在步驟S79,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,從通過交叉確認(rèn)循環(huán)獲取的“c”個(gè)高級(jí)特征提取表達(dá)式中,選擇具有從步驟S77獲得的、最高評(píng)估值的高級(jí)特征提取表達(dá)式。
在步驟S80,控制部分27檢查以便確定算法循環(huán)參數(shù)A是否小于最大值“ a”。如果算法循環(huán)參數(shù)A被發(fā)現(xiàn)小于最大值“a”,則參數(shù)A被增加“1”,并且再次到達(dá)步驟S74。另一方面,如果算法循環(huán)參數(shù)A未被發(fā)現(xiàn)小于最大值“a”(即如果參數(shù)A等于最大值“a”),則退出所述算法循環(huán),并且到達(dá)步驟S81。因此在構(gòu)成所述算法循環(huán)的步驟S73至S80中,獲取使用“a”個(gè)學(xué)習(xí)算法學(xué)習(xí)的第K個(gè)類型的、多如“a”個(gè)的高級(jí)特征提取表達(dá)式。
在步驟S81,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,從通過所述算法循環(huán)學(xué)習(xí)的“a”個(gè)高級(jí)特征提取表達(dá)式中,選擇具有從步驟S77獲得的、最高評(píng)估值的高級(jí)特征提取表達(dá)式。
在步驟S82,控制部分27檢查以便確定訓(xùn)練數(shù)據(jù)循環(huán)參數(shù)K是否小于最大值“k”。如果訓(xùn)練數(shù)據(jù)循環(huán)參數(shù)K被發(fā)現(xiàn)小于最大值“k”,則參數(shù)K被增加“1”,并且再次到達(dá)步驟S73。另一方面,如果訓(xùn)練數(shù)據(jù)循環(huán)參數(shù)K未被發(fā)現(xiàn)小于最大值“k”(即如果參數(shù)K等于最大值“k”),則退出所述訓(xùn)練數(shù)據(jù)循環(huán),并且到達(dá)步驟S83。因此在構(gòu)成所述訓(xùn)練數(shù)據(jù)循環(huán)的步驟S72至S82中,獲取與第N個(gè)低級(jí)特征提取表達(dá)式列表相對(duì)應(yīng)的、多如“k”個(gè)的高級(jí)特征提取表達(dá)式。
在步驟S83,控制部分27檢查以便確定列表循環(huán)參數(shù)N是否小于最大值“n”。如果列表循環(huán)參數(shù)N被發(fā)現(xiàn)小于最大值“n”,則參數(shù)N被增加“1”,并且再次到達(dá)步驟S72。另一方面,如果列表循環(huán)參數(shù)N未被發(fā)現(xiàn)小于最大值“n”(即如果參數(shù)N等于最大值“n”),則退出所述列表循環(huán),并且到達(dá)步驟S84。因此在構(gòu)成所述列表循環(huán)的步驟S71至S83中,獲取與n個(gè)低級(jí)特征提取表達(dá)式列表的每個(gè)相對(duì)應(yīng)的、多如“k”個(gè)的高級(jí)特征提取表達(dá)式。
在步驟S84,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,計(jì)算“k”個(gè)高級(jí)特征提取表達(dá)式的每個(gè)的估計(jì)的精確度級(jí)別,所述k”個(gè)高級(jí)特征提取表達(dá)式與每個(gè)高級(jí)特征提取表達(dá)式中的每個(gè)低級(jí)特征的貢獻(xiàn)比率、以及獲取的“n”個(gè)低級(jí)特征提取表達(dá)式列表的每個(gè)相對(duì)應(yīng),并且將計(jì)算結(jié)果輸出到低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21。這使得高級(jí)特征提取表達(dá)式學(xué)習(xí)過程結(jié)束。
回到圖7的步驟S5,控制部分27檢查以便確定學(xué)習(xí)循環(huán)參數(shù)G是否小于最大值“g”。如果學(xué)習(xí)循環(huán)參數(shù)G被發(fā)現(xiàn)小于最大值“g”,則參數(shù)G被增加“ 1”,并且再次到達(dá)步驟S2。另一方面,如果學(xué)習(xí)循環(huán)參數(shù)G未被發(fā)現(xiàn)小于最大值“g”(即如果參數(shù)G等于最大值“g”),則退出所述學(xué)習(xí)循環(huán),并且到達(dá)步驟S6。步驟S1至S5構(gòu)成特征提取算法學(xué)習(xí)過程。繼該過程之后的步驟S6,是用于使用特征提取算法計(jì)算各高級(jí)特征的過程。
在步驟S6,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,從通過學(xué)習(xí)獲得的最近一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,將“m”個(gè)低級(jí)特征提取表達(dá)式,與對(duì)應(yīng)于該列表的“k”個(gè)高級(jí)特征提取表達(dá)式一起,提供給高級(jí)特征計(jì)算部分26,所述“m”個(gè)低級(jí)特征提取表達(dá)式組成具有獲取的各高級(jí)特征的最高均值精確度級(jí)別的列表。
在步驟S7,高級(jí)特征計(jì)算部分26,利用最近從高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25提供的高級(jí)特征提取表達(dá)式、以及低級(jí)特征提取表達(dá)式,計(jì)算具有高精度的高級(jí)特征。隨后將參照?qǐng)D38和后續(xù)的附圖,描述步驟S7的高精度高級(jí)特征計(jì)算過程。
前面的段落完成了由特征提取算法創(chuàng)建設(shè)備20執(zhí)行的特征提取算法創(chuàng)建過程的描述。
接下來將描述,繼由如上所述的特征提取算法創(chuàng)建過程中,步驟S1至S6構(gòu)成的重復(fù)的學(xué)習(xí)循環(huán)之后,隨著低級(jí)特征提取表達(dá)式列表的各代的進(jìn)展(如當(dāng)?shù)图?jí)特征提取表達(dá)式的貢獻(xiàn)比率已經(jīng)改進(jìn)、或當(dāng)相對(duì)應(yīng)的高級(jí)特征提取表達(dá)式的估計(jì)的精度級(jí)別已經(jīng)被提升時(shí)),要執(zhí)行的新的運(yùn)算符創(chuàng)建過程。
當(dāng)各低級(jí)特征提取表達(dá)式列表的當(dāng)前代被新的代替換時(shí),多個(gè)運(yùn)算符的排列(permutation)(以后簡(jiǎn)單地被稱作為運(yùn)算符組合)可以頻繁地出現(xiàn)在如圖35所示的不同的低級(jí)特征表達(dá)式中。在此情形中,頻繁地出現(xiàn)在不同的低級(jí)特征表達(dá)式的多個(gè)運(yùn)算符的組合,可以被認(rèn)為是單個(gè)的新操作符,并且由低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21注冊(cè)為這樣用于使用。
在圖35的實(shí)例中,顯示3運(yùn)算符組合“32#FFT、Log、32#FFT”,其出現(xiàn)在5個(gè)低級(jí)特征提取表達(dá)式中。如果操作符組合“32#FFT、Log、32#FFT”按圖示被注冊(cè)為一個(gè)運(yùn)算符“NewOperator 1”,則下一代和后續(xù)的各代的各低級(jí)特征提取表達(dá)式,將包括如圖36所示的運(yùn)算符“NewOperator1”。
下面將參照?qǐng)D37的流程圖,描述新的運(yùn)算符創(chuàng)建。在步驟S101中,運(yùn)算符組合檢測(cè)部分22,創(chuàng)建預(yù)定數(shù)量的運(yùn)算符(例如,1至5個(gè)運(yùn)算符)的排列(序列組合)。在此過程中要?jiǎng)?chuàng)建的運(yùn)算符組合的數(shù)量被假定為“og”。
在步驟S102,控制部分27通過將組合循環(huán)參數(shù)OG初始化為“1”,開始組合循環(huán)。該組合循環(huán)被重復(fù)與運(yùn)算符組合計(jì)數(shù)“og”一樣多的次數(shù)。
在步驟S103,第og個(gè)運(yùn)算符組合的運(yùn)算符組合發(fā)生頻率“Count(計(jì)數(shù))”被初始化為“1”。在步驟S104,控制部分27通過將列表循環(huán)參數(shù)N初始化為“0”,開始列表循環(huán)。該列表循環(huán)被重復(fù)與預(yù)定列表計(jì)數(shù)“n”一樣多的次數(shù)。在步驟S105,控制部分27通過初始化表達(dá)式循環(huán)參數(shù)M為“1”,開始表達(dá)式循環(huán)。該表達(dá)式循環(huán)被重復(fù)與低級(jí)特征提取表達(dá)式的數(shù)量“m”一樣多的次數(shù),所述低級(jí)特征提取表達(dá)式構(gòu)成單個(gè)低級(jí)特征提取表達(dá)式列表。
在步驟S106,運(yùn)算符組合檢測(cè)部分22檢查以便確定第og個(gè)運(yùn)算符組合是否存在于第M個(gè)低級(jí)特征提取表達(dá)式中,作為第N個(gè)低級(jí)特征提取表達(dá)式列表的部分。如果第og個(gè)運(yùn)算符組合被發(fā)現(xiàn)存在于該表達(dá)式,則到達(dá)步驟S107,并且發(fā)生頻率“Count”被增加“1”。另一方面,如果第og個(gè)運(yùn)算符組合沒有被發(fā)現(xiàn)存在,則步驟S107被跳過,并且到達(dá)步驟S108。
在步驟S108,控制部分27檢查以便確定表達(dá)式循環(huán)參數(shù)M是否小于最大值“m”。如果表達(dá)式循環(huán)參數(shù)M被發(fā)現(xiàn)小于最大值“m”,則參數(shù)M被增加“1”,并且再次到達(dá)步驟S106。另一方面,如果表達(dá)式循環(huán)參數(shù)M未被發(fā)現(xiàn)小于最大值“m”(即如果參數(shù)M等于最大值“m”),則退出表達(dá)式循環(huán),并且到達(dá)步驟S109。
在步驟S109,控制部分27檢查以便確定列表循環(huán)參數(shù)N是否小于最大值“n”。如果列表循環(huán)參數(shù)N被發(fā)現(xiàn)小于最大值“n”,則列表循環(huán)參數(shù)N被增加“1”,并且再次到達(dá)步驟S105。另一方面,如果列表循環(huán)參數(shù)N未被發(fā)現(xiàn)小于最大值“n”(即如果參數(shù)N等于最大值“n”),則退出列表循環(huán),并且到達(dá)步驟S110。
在步驟S110,控制部分27檢查以便確定組合循環(huán)參數(shù)OG是否小于最大值“og”。如果組合循環(huán)參數(shù)OG被發(fā)現(xiàn)小于最大值“og”,則參數(shù)OG被增加“1”,并且再次到達(dá)步驟S103。另一方面,如果組合循環(huán)參數(shù)OG未被發(fā)現(xiàn)小于最大值“og”(即如果參數(shù)OG等于最大值“og”),則退出組合循環(huán),并且到達(dá)步驟S110。因此由直達(dá)此點(diǎn)的處理,檢測(cè)所有運(yùn)算符組合的每個(gè)的發(fā)生頻率“Count”。
在步驟S111,運(yùn)算符組合檢測(cè)部分22,提取其發(fā)生頻率“Count”高于預(yù)定閾值的運(yùn)算符組合,并且將提取的組合輸出到運(yùn)算符創(chuàng)建部分23。在步驟S112,運(yùn)算符創(chuàng)建部分23,將從運(yùn)算符組合檢測(cè)部分22輸入的運(yùn)算符組合,注冊(cè)為新運(yùn)算符。這使得該新運(yùn)算符創(chuàng)建過程結(jié)束。
按照新運(yùn)算符創(chuàng)建過程,如上面討論的那樣,頻繁出現(xiàn)的各運(yùn)算符的組合,即在計(jì)算高級(jí)特征中被認(rèn)為有效的各運(yùn)算符的組合,被注冊(cè)為單個(gè)運(yùn)算符,用于在下一代和后續(xù)的各代的低級(jí)特征提取表達(dá)式中使用。這提升了創(chuàng)建低級(jí)特征提取表達(dá)式的速度、以及表達(dá)式各代的進(jìn)展的速度。因此可能在早些階段檢測(cè)有效的各低級(jí)特征提取表達(dá)式。新運(yùn)算符創(chuàng)建過程的另一個(gè)好處,是對(duì)用于手動(dòng)檢測(cè)的有效運(yùn)算符組合的自動(dòng)檢測(cè)。
下面參照?qǐng)D38的流程圖,更詳細(xì)地描述圖7的步驟S7中的上面概述的高精度高級(jí)特征計(jì)算過程。
在步驟S141,高級(jí)特征計(jì)算部分26執(zhí)行高精度拒絕過程,以便從最終從高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25提供的那些表達(dá)式中,僅選擇產(chǎn)生高精度結(jié)果的各高級(jí)特征提取表達(dá)式。
高精度拒絕過程基于這樣的假定在一方面各高級(jí)特征的各精度級(jí)別和另一方面的各低級(jí)特征的各值之間存在因果(casual)關(guān)系。在這樣的前提下,該過程涉及通過學(xué)習(xí)獲取拒絕區(qū)域提取表達(dá)式,向所述拒絕區(qū)域提取表達(dá)式輸入各低級(jí)特征、并從其中輸出高級(jí)特征的精度級(jí)別。下面參照?qǐng)D39的流程圖,詳細(xì)描述高精度拒絕過程。
在步驟S151,高級(jí)特征計(jì)算部分26中的低級(jí)特征計(jì)算部分41,獲取最終的低級(jí)特征提取表達(dá)式列表。高級(jí)特征計(jì)算部分26中的高級(jí)特征計(jì)算部分42,獲得最終的高級(jí)特征提取表達(dá)式。
在步驟S152,控制部分27通過初始化內(nèi)容循環(huán)參數(shù)J為“1”,開始內(nèi)容循環(huán)。該內(nèi)容循環(huán)被重復(fù)與輸入的數(shù)據(jù)項(xiàng)目(內(nèi)容數(shù)據(jù)和元數(shù)據(jù))的數(shù)量“j”一樣多的次數(shù),所述輸入的數(shù)據(jù)項(xiàng)目可被提前提供,用于執(zhí)行高精度拒絕過程。假定與準(zhǔn)備的輸入數(shù)據(jù)相對(duì)應(yīng)的各高級(jí)特征,還被提供為訓(xùn)練數(shù)據(jù)。
在步驟S153,低級(jí)特征計(jì)算部分41將第L個(gè)輸入數(shù)據(jù)項(xiàng)目,代入在步驟S151中獲取的最終的低級(jí)特征提取表達(dá)式列表,并且將從各計(jì)算中產(chǎn)生的“m”個(gè)低級(jí)特征輸出到高級(jí)特征計(jì)算部分42、和拒絕區(qū)域提取表達(dá)式學(xué)習(xí)部分44。該高級(jí)特征計(jì)算部分42,將從低級(jí)特征計(jì)算部分41輸入的“m”個(gè)低級(jí)特征,代入在步驟S151中獲取的最終的高級(jí)特征提取表達(dá)式中,并且將從這些計(jì)算產(chǎn)生的高級(jí)特征輸出到平方誤差計(jì)算部分43。
在步驟S154,平方誤差計(jì)算部分43,計(jì)算從高級(jí)特征計(jì)算部分42輸入的高級(jí)特征和訓(xùn)練數(shù)據(jù)(即,與輸入數(shù)據(jù)相對(duì)應(yīng)的真實(shí)的高級(jí)特征)之間的平方誤差,并且將該計(jì)算的結(jié)果輸出到拒絕區(qū)域提取表達(dá)式學(xué)習(xí)部分44。由此計(jì)算的平方誤差,表示由高級(jí)特征計(jì)算部分42計(jì)算的高級(jí)特征提取表達(dá)式的精度(該計(jì)算的精度被稱作為特征提取精度)。
在步驟S155,控制部分27檢查以便確定內(nèi)容循環(huán)參數(shù)J是否小于最大值“j”。如果內(nèi)容循環(huán)參數(shù)J被發(fā)現(xiàn)小于最大值“j”,則參數(shù)J被增加“1”,并且再次到達(dá)步驟S153。另一方面,如果內(nèi)容循環(huán)參數(shù)J未被發(fā)現(xiàn)小于最大值“j”(即如果參數(shù)J等于最大值“j”),則退出表達(dá)式循環(huán),并且到達(dá)步驟S156。由此在構(gòu)成內(nèi)容循環(huán)的步驟S151至S155中,獲取與每個(gè)輸入數(shù)據(jù)項(xiàng)目相對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)和計(jì)算的高級(jí)特征之間的平方誤差。
在步驟S156,拒絕區(qū)域提取表達(dá)式學(xué)習(xí)部分44,基于從低級(jí)特征計(jì)算部分41輸入的各低級(jí)特征、和從平方誤差計(jì)算部分43輸入的平方誤差,通過學(xué)習(xí)創(chuàng)建拒絕區(qū)域提取表達(dá)式,對(duì)其輸入各低級(jí)特征,并且從其中輸出利用輸入的數(shù)量計(jì)算的高級(jí)特征的特征提取精度。由此創(chuàng)建的拒絕區(qū)域提取表達(dá)式被提供給特征提取精度計(jì)算部分45。這完成了高精度拒絕過程,并且將控制傳遞給圖38中的步驟S142。
在步驟S142,低級(jí)特征計(jì)算部分41,將希望獲取其高級(jí)特征的歌曲的輸入數(shù)據(jù),代入最終的低級(jí)特征提取表達(dá)式列表,以便獲得各低級(jí)特征。該低級(jí)特征計(jì)算部分41,將這些計(jì)算的結(jié)果輸出到高級(jí)特征計(jì)算部分42、和特征提取精度計(jì)算部分45。
在步驟S143,特征提取精度計(jì)算部分45,將從低級(jí)特征計(jì)算部分41輸入的各低級(jí)特征,代入從拒絕區(qū)域提取表達(dá)式學(xué)習(xí)部分44提供的拒絕區(qū)域提取表達(dá)式,以便計(jì)算高級(jí)特征的特征提取精度,所述高級(jí)特征利用輸入的各低級(jí)特征(即,關(guān)于由高級(jí)特征計(jì)算部分42計(jì)算的高級(jí)特征估計(jì)的平方誤差)計(jì)算。
在步驟S144,特征提取精度計(jì)算部分45檢查以便確定步驟S143中計(jì)算的特征提取精度是否高于預(yù)定的閾值。如果計(jì)算的特征提取精度被發(fā)現(xiàn)高于閾值,則到達(dá)步驟S145。在步驟S145,該特征提取精度計(jì)算部分45使得高級(jí)特征計(jì)算部分42計(jì)算高級(jí)特征。該高級(jí)特征計(jì)算部分42,將在步驟S142中從低級(jí)特征計(jì)算部分41輸入的“m”個(gè)低級(jí)特征,代入最終的高級(jí)特征提取表達(dá)式,以便計(jì)算所述高級(jí)特征。在此點(diǎn)計(jì)算的高級(jí)特征是最終的輸出。這完成了高精度高級(jí)特征計(jì)算過程。
如果在步驟S144,計(jì)算的特征提取精度被發(fā)現(xiàn)低于預(yù)定的閾值,則步驟S145被跳過,并且該高精度高級(jí)特征計(jì)算過程結(jié)束。
如上所述的高精度高級(jí)特征計(jì)算過程,使得可能利用高級(jí)特征提取表達(dá)式估計(jì)高級(jí)特征的精度。因?yàn)檫@些不希望實(shí)現(xiàn)高精度級(jí)別的高級(jí)特征被從計(jì)算中排除,所以消除了浪費(fèi)的計(jì)算。
如上所述,由作為本發(fā)明的第一實(shí)施例實(shí)踐的、特征提取算法創(chuàng)建設(shè)備20執(zhí)行的特征提取算法學(xué)習(xí)過程,允許用于從歌曲數(shù)據(jù)提取相關(guān)特征的各算法的快速和高度精確的創(chuàng)建。該學(xué)習(xí)過程還使得可能用最小的計(jì)算僅僅獲取高精度級(jí)別的各高級(jí)特征。
下面描述的是作為本發(fā)明的第二實(shí)施例實(shí)踐的特征提取算法創(chuàng)建設(shè)備60的工作。圖40是示出特征提取算法創(chuàng)建設(shè)備60的典型結(jié)構(gòu)的框圖。
該特征提取算法創(chuàng)建設(shè)備60,利用低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61、和高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65,分別替換在特征提取算法創(chuàng)建設(shè)備20中的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21、和高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25。
在特征提取算法創(chuàng)建設(shè)備60和特征提取算法創(chuàng)建設(shè)備20之間存在一些差異。一個(gè)差異是,盡管低級(jí)特征提取表達(dá)式列表(由特征提取算法創(chuàng)建設(shè)備20的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21創(chuàng)建)中的各表達(dá)式的數(shù)量“m”是常數(shù),但是在每個(gè)低級(jí)特征提取表達(dá)式列表(由特征提取算法創(chuàng)建設(shè)備60的低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61創(chuàng)建)中的各表達(dá)式的數(shù)量“m”是隨機(jī)確定的。
另一個(gè)差異是,盡管特征提取算法創(chuàng)建設(shè)備20的高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25,將作為反饋的估計(jì)的精度級(jí)別和貢獻(xiàn)比率,輸出到低級(jí)特征提取表達(dá)式列表創(chuàng)建部分21,但是特征提取算法創(chuàng)建設(shè)備60的高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65,將作為反饋的評(píng)估值和貢獻(xiàn)比率,輸出到低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61。
除了低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61和高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65之外,特征提取算法創(chuàng)建設(shè)備60的各部件具有與特征提取算法創(chuàng)建設(shè)備20中的實(shí)質(zhì)上類似的對(duì)應(yīng)物。該類似的部件由相同的參考標(biāo)號(hào)指定,并且將不進(jìn)一步描述。
現(xiàn)在將再次參照前面用來解釋上面的特征提取算法創(chuàng)建設(shè)備20的某些附圖,描述特征提取算法創(chuàng)建設(shè)備60的工作。
下面參照?qǐng)D7的流程圖,描述特征提取算法創(chuàng)建過程,其是特征提取算法創(chuàng)建設(shè)備60的基本操作。
在步驟S1,控制部分27通過將學(xué)習(xí)循環(huán)參數(shù)G初始化為“1”,開始學(xué)習(xí)循環(huán)。該學(xué)習(xí)循環(huán)被重復(fù)與由用戶圖示性地提前確定的學(xué)習(xí)計(jì)數(shù)“g”一樣多的次數(shù)。
在步驟S2,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,創(chuàng)建“n”個(gè)低級(jí)特征提取表達(dá)式列表,并且將創(chuàng)建的各列表輸出到低級(jí)特征計(jì)算部分24。
下面通過參照?qǐng)D9的流程圖,詳細(xì)描述步驟S2的過程(低級(jí)特征提取表達(dá)式列表創(chuàng)建過程)。
在步驟S11,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61檢查以便確定要?jiǎng)?chuàng)建的低級(jí)特征提取表達(dá)式列表是否是第一代的。如果所述學(xué)習(xí)循環(huán)參數(shù)G被設(shè)置為“0”,則要?jiǎng)?chuàng)建的低級(jí)特征提取表達(dá)式列表被發(fā)現(xiàn)是第一代的。
當(dāng)要?jiǎng)?chuàng)建的低級(jí)特征提取表達(dá)式列表,被發(fā)現(xiàn)因?yàn)閷W(xué)習(xí)循環(huán)參數(shù)G被設(shè)置為“0”而是第一代的時(shí),到達(dá)步驟S12。在步驟S12,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,隨機(jī)創(chuàng)建第一代的低級(jí)特征提取表達(dá)式列表。
相反,如果要?jiǎng)?chuàng)建的低級(jí)特征提取表達(dá)式列表未被發(fā)現(xiàn)是第一代的時(shí),則到達(dá)步驟S13。在步驟S13,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61基于最近一代的低級(jí)特征提取表達(dá)式列表,利用遺傳算法,遺傳地創(chuàng)建下一代的低級(jí)特征提取表達(dá)式列表。
下面參照?qǐng)D41的流程圖,詳細(xì)描述由低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61執(zhí)行的、步驟S12中的第一代列表隨機(jī)創(chuàng)建過程。
在步驟S171,控制部分27通過將列表循環(huán)參數(shù)N初始化為“1”,開始列表循環(huán)。該列表循環(huán)被重復(fù)與預(yù)定的列表計(jì)數(shù)“n”一樣多的次數(shù)。
在步驟S172,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,隨機(jī)確定低級(jí)特征提取表達(dá)式的數(shù)量“m”,所述低級(jí)特征提取表達(dá)式構(gòu)成第一代的要?jiǎng)?chuàng)建的第N個(gè)低級(jí)特征提取表達(dá)式列表。
在步驟S173,控制部分27通過將表達(dá)式循環(huán)參數(shù)M初始化為“1”,開始表達(dá)式循環(huán)。該表達(dá)式循環(huán)被重復(fù)與低級(jí)特征提取表達(dá)式的數(shù)量“m”一樣多的次數(shù),所述低級(jí)特征提取表達(dá)式構(gòu)成單個(gè)的低級(jí)特征提取表達(dá)式列表。
在步驟S174,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,隨機(jī)確定輸入數(shù)據(jù),其用于要?jiǎng)?chuàng)建的第N個(gè)低級(jí)特征提取表達(dá)式列表(也被稱作為列表N)中的、第M個(gè)低級(jí)特征提取表達(dá)式(又被稱作為低級(jí)特征提取表達(dá)式M)。
在步驟S175,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,隨機(jī)確定要?jiǎng)?chuàng)建的列表N中的低級(jí)特征提取表達(dá)式M的過程對(duì)稱軸和參數(shù)。
在步驟S176,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61檢查以便確定直達(dá)該時(shí)間點(diǎn)創(chuàng)建的列表N中,由低級(jí)特征提取表達(dá)式M計(jì)算的結(jié)果,是標(biāo)量(一維)還是至多預(yù)定的維度(例如,如1或2的小的數(shù)目)。如果在步驟S176中的檢查結(jié)果是負(fù),則再次到達(dá)步驟S175,并且多添加一個(gè)運(yùn)算符。重復(fù)步驟S175和S176,在計(jì)算的結(jié)果中的支持維度的數(shù)量如圖16所示那樣降低。如果在步驟S176中,由列表N中的低級(jí)特征提取表達(dá)式M計(jì)算的結(jié)果,是標(biāo)量或至多預(yù)定的小數(shù)量的維度(例如1或2),則到達(dá)步驟S177。
在步驟S177,控制部分27檢查以便確定表達(dá)式循環(huán)參數(shù)M是否小于最大值“m”。如果表達(dá)式循環(huán)參數(shù)M被發(fā)現(xiàn)小于最大值“m”,則參數(shù)M被增加“1”,并且再次到達(dá)步驟S174。相反,如果表達(dá)式循環(huán)參數(shù)M未被發(fā)現(xiàn)小于最大值“m”(即如果參數(shù)M等于最大值“m”),則退出表達(dá)式循環(huán),并且到達(dá)步驟S178。因此在上面的步驟S173至S177中,創(chuàng)建第一代的第N個(gè)低級(jí)特征提取表達(dá)式列表。
在步驟S178,控制部分27檢查以便確定列表循環(huán)參數(shù)N是否小于最大值“n”。如果列表循環(huán)參數(shù)N被發(fā)現(xiàn)小于最大值“n”,則參數(shù)N被增加“1”,并且再次到達(dá)步驟S172。另一方面,如果列表循環(huán)參數(shù)N未被發(fā)現(xiàn)小于最大值“n”(即如果參數(shù)N等于最大值“n”),則退出所述列表循環(huán),并且終止第一代列表隨機(jī)創(chuàng)建過程。因此由直達(dá)此點(diǎn)的處理,創(chuàng)建第一代的多如“n”個(gè)的低級(jí)特征提取表達(dá)式列表,每個(gè)列表具有不同數(shù)目“m”個(gè)表達(dá)式。
下面參照?qǐng)D17的流程圖詳細(xì)描述的是,由低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61執(zhí)行的過程,用于在圖9的步驟13中創(chuàng)建第二和后續(xù)的各代的低級(jí)特征提取表達(dá)式列表(即,下一代的列表遺傳創(chuàng)建過程)。
在步驟S31,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61隨機(jī)確定3個(gè)數(shù)量選擇計(jì)數(shù)“ns”,表示從要?jiǎng)?chuàng)建的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,應(yīng)用了遺傳算法選擇的列表的數(shù)目;交叉計(jì)數(shù)“nx”,表示應(yīng)用了遺傳算法交叉的列表的數(shù)目;以及突變計(jì)數(shù)“nm”,指示應(yīng)用了遺傳算法突變的列表的數(shù)目。該選擇計(jì)數(shù)“ns”、交叉計(jì)數(shù)“nx”和突變計(jì)數(shù)“nm”的總和等于“n”。作為替代,該選擇計(jì)數(shù)“ns”、交叉計(jì)數(shù)“nx”和突變計(jì)數(shù)“nm”每個(gè)可以是預(yù)定的常數(shù)。
在步驟S32,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,使用總計(jì)達(dá)選擇計(jì)數(shù)“ns”的低級(jí)特征提取表達(dá)式列表,創(chuàng)建多如“ns”個(gè)的低級(jí)特征提取表達(dá)式列表,所述“ns”從最近一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表確定。在步驟S33中,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,使用總計(jì)達(dá)交叉計(jì)數(shù)“nx”的低級(jí)特征提取表達(dá)式列表,創(chuàng)建多如“nx”個(gè)的低級(jí)特征提取表達(dá)式列表,所述“nx”從最近一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表確定。在步驟S34中,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,使用總計(jì)達(dá)突變計(jì)數(shù)“nm”的低級(jí)特征提取表達(dá)式列表,創(chuàng)建多如“nm”個(gè)的低級(jí)特征提取表達(dá)式列表,所述“nm”從最近一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表確定。
下面詳細(xì)描述步驟S32至S34中的每個(gè)的過程。
現(xiàn)在將參照?qǐng)D42的流程圖,詳細(xì)描述由低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61執(zhí)行的、步驟S32的選擇創(chuàng)建過程。該選擇創(chuàng)建過程從下一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,創(chuàng)建總計(jì)達(dá)選擇計(jì)數(shù)“ns”的低級(jí)特征提取表達(dá)式列表。
在步驟S181,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,按高級(jí)特征提取表達(dá)式的各均值評(píng)估值的降序,排序最近一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表,所述高級(jí)特征提取表達(dá)式從高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65輸入。在步驟S182,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,從最近一代的經(jīng)排序的“n”個(gè)低級(jí)特征提取表達(dá)式列表,采用頂端的“ns”個(gè)低級(jí)特征提取表達(dá)式列表,作為下一代的低級(jí)特征提取表達(dá)式列表。這使得選擇創(chuàng)建過程結(jié)束。
現(xiàn)在將參照?qǐng)D43的流程圖,詳細(xì)描述由低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61執(zhí)行的、圖17中的步驟S33的交叉創(chuàng)建過程。該交叉創(chuàng)建過程從下一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,創(chuàng)建總計(jì)達(dá)交叉計(jì)數(shù)“nx”的低級(jí)特征提取表達(dá)式列表。
在步驟S191,控制部分27通過初始化交叉循環(huán)參數(shù)NX為“1”,開始交叉循環(huán)。交叉循環(huán)被重復(fù)與交叉計(jì)數(shù)“nx”一樣多的次數(shù)。
在步驟S192,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,在隨機(jī)選擇兩個(gè)低級(jí)特征提取表達(dá)式列表A和B之前,加權(quán)最近一代的低級(jí)特征提取表達(dá)式列表,以便按高級(jí)特征提取表達(dá)式的各均值評(píng)估值的降序,導(dǎo)出該列表的優(yōu)先部分,所述高級(jí)特征提取表達(dá)式由高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65輸出。在該過程的選擇期間,由如上所述的選擇創(chuàng)建過程選擇的“ns”個(gè)低級(jí)特征提取表達(dá)式列表,可以從候選者列表中排除,或可以作為部分候選者列表而保持原樣。
在步驟S193,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61在如下定義的范圍內(nèi),在通過后續(xù)的表達(dá)式循環(huán)要?jiǎng)?chuàng)建的每個(gè)低級(jí)特征提取表達(dá)式列表中,隨機(jī)確定數(shù)量“m”個(gè)的表達(dá)式m=((列表A中的表達(dá)式數(shù)目+列表B中的表達(dá)式數(shù)目)/2)±m(xù)r其中,“mr”是預(yù)定值。
在步驟S194,控制部分27通過初始化表達(dá)式循環(huán)參數(shù)M為“1”,開始表達(dá)式循環(huán)。該表達(dá)式循環(huán)被重復(fù)與步驟S193中隨機(jī)確定的表達(dá)式計(jì)數(shù)“m”一樣多的次數(shù)。
在步驟S195,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,在隨機(jī)選擇單個(gè)低級(jí)特征提取表達(dá)式列表(包括在下一代的低級(jí)特征提取表達(dá)式列表中)之前,加權(quán)低級(jí)特征提取表達(dá)式列表A和B中的所有低級(jí)特征提取表達(dá)式,以便按高級(jí)特征提取表達(dá)式的各貢獻(xiàn)比率的降序,導(dǎo)出各表達(dá)式的優(yōu)先部分,所述高級(jí)特征提取表達(dá)式由高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65輸出。
在步驟S196,控制部分27檢查以便確定表達(dá)式循環(huán)參數(shù)M是否小于最大值“m”。如果表達(dá)式循環(huán)參數(shù)M被發(fā)現(xiàn)小于最大值“m”,則參數(shù)M被增加“ 1”,并且再次到達(dá)步驟S195。相反,如果表達(dá)式循環(huán)參數(shù)M未被發(fā)現(xiàn)小于最大值“m”(即如果參數(shù)M等于最大值“m”),則退出表達(dá)式循環(huán),并且到達(dá)步驟S197。因此在構(gòu)成表達(dá)式循環(huán)的步驟S194至S196中,創(chuàng)建單個(gè)的低級(jí)特征提取表達(dá)式列表。
在步驟S197中,控制部分27檢查以便確定交叉循環(huán)參數(shù)NX是否小于最大值“nx”。如果交叉循環(huán)參數(shù)NX被發(fā)現(xiàn)小于最大值“nx”,則參數(shù)NX被增加“1”,并且再次到達(dá)步驟S192。另一方面,如果交叉循環(huán)參數(shù)NX未被發(fā)現(xiàn)小于最大值“nx ”(即如果參數(shù)NX等于最大值“nx”),則退出交叉循環(huán),并且交叉創(chuàng)建過程被終止。因此由已經(jīng)執(zhí)行的交叉循環(huán),創(chuàng)建總計(jì)達(dá)交叉計(jì)數(shù)“nx”的低級(jí)特征提取表達(dá)式列表。
現(xiàn)在將參照?qǐng)D44的流程圖,詳細(xì)描述由低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61執(zhí)行的、圖17中的步驟S34的突變創(chuàng)建過程。該突變創(chuàng)建過程,從下一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,創(chuàng)建總計(jì)達(dá)突變計(jì)數(shù)“nm”的低級(jí)特征提取表達(dá)式列表。
在步驟S201,控制部分27通過初始化突變循環(huán)參數(shù)NM為“1”,開始突變循環(huán)。突變循環(huán)被重復(fù)與突變計(jì)數(shù)“nm”一樣多的次數(shù)。
在步驟S202,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,在隨機(jī)選擇單個(gè)低級(jí)特征提取表達(dá)式列表A之前,加權(quán)最近一代的低級(jí)特征提取表達(dá)式列表,以便按高級(jí)特征提取表達(dá)式的各均值評(píng)估值的降序,導(dǎo)出各列表的優(yōu)先部分,所述高級(jí)特征提取表達(dá)式由高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65輸出。在該過程的選擇期間,由如上所述的選擇創(chuàng)建過程選擇的“ns”個(gè)低級(jí)特征提取表達(dá)式列表,可以從候選者列表中排除,或可以作為部分候選者列表而保持原樣。同樣,在上面的交叉創(chuàng)建過程的步驟S192中選擇的低級(jí)特征提取表達(dá)式列表,可以從候選者列表中排除,或可以作為部分候選者列表而保持原樣。
在步驟S203,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61通過后續(xù)的表達(dá)式循環(huán),在要?jiǎng)?chuàng)建的每個(gè)低級(jí)特征提取表達(dá)式列表中,隨機(jī)地確定數(shù)量“m”個(gè)的表達(dá)式。
更具體地講,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61在如下定義的范圍內(nèi),在步驟S203,隨機(jī)地確定每個(gè)低級(jí)特征提取表達(dá)式列表的表達(dá)式計(jì)數(shù)“m”m=列表A中的表達(dá)式數(shù)目±m(xù)r其中,“mr”是預(yù)定值。
在步驟S204,控制部分27通過初始化表達(dá)式循環(huán)參數(shù)M為“1”,開始表達(dá)式循環(huán)。該表達(dá)式循環(huán)被重復(fù)與步驟S203中隨機(jī)確定的表達(dá)式計(jì)數(shù)“m”一樣多的次數(shù)。
在步驟S205,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,檢查以便確定從低級(jí)特征提取表達(dá)式列表A中的所有低級(jí)特征提取表達(dá)式中,使用第M個(gè)低級(jí)特征提取表達(dá)式計(jì)算的低級(jí)特征的貢獻(xiàn)比率,是否小于低級(jí)特征提取表達(dá)式列表A中,使用其它低級(jí)特征提取表達(dá)式計(jì)算的各低級(jí)特征的各貢獻(xiàn)比率。更具體地講,進(jìn)行檢查以確定使用第M個(gè)低級(jí)特征提取表達(dá)式計(jì)算的低級(jí)特征的貢獻(xiàn)比率,是否低于在低級(jí)特征提取表達(dá)式列表A中,使用所有低級(jí)特征提取表達(dá)式計(jì)算的各貢獻(xiàn)比率序列中的預(yù)定比率。
如果在步驟S205,使用第M個(gè)低級(jí)特征提取表達(dá)式計(jì)算的低級(jí)特征的貢獻(xiàn)比率,被發(fā)現(xiàn)低于其他,則到達(dá)步驟S206。在步驟S206,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,隨機(jī)地突變第M個(gè)低級(jí)特征提取表達(dá)式,其包含在下一代的低級(jí)特征提取表達(dá)式列表中。
如果在步驟S205中,使用第M個(gè)低級(jí)特征提取表達(dá)式計(jì)算的低級(jí)特征的貢獻(xiàn)比率,未被發(fā)現(xiàn)低于其他,則到達(dá)步驟S207。在步驟S207,低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61,將第M個(gè)低級(jí)特征提取表達(dá)式添加到下一代的低級(jí)特征提取表達(dá)式列表,而不突變存在置疑的表達(dá)式。
如果隨機(jī)確定的表達(dá)式計(jì)數(shù)“m”被發(fā)現(xiàn)大于低級(jí)特征提取表達(dá)式的數(shù)量,所述低級(jí)特征提取表達(dá)式構(gòu)成低級(jí)特征提取表達(dá)式列表A,則當(dāng)表達(dá)式循環(huán)參數(shù)M超過列表A的低級(jí)特征提取表達(dá)式計(jì)數(shù)時(shí),步驟S205的檢查被忽略。在此點(diǎn),低級(jí)特征提取表達(dá)式被隨機(jī)地創(chuàng)建,并且被添加到下一代的低級(jí)特征提取表達(dá)式列表。
在步驟S208,控制部分27檢查以便確定表達(dá)式循環(huán)參數(shù)M是否小于最大值“m”。如果表達(dá)式循環(huán)參數(shù)M被發(fā)現(xiàn)小于最大值“m”,則表達(dá)式循環(huán)參數(shù)M被增加“1”,并且再次到達(dá)步驟S205。另一方面,如果表達(dá)式循環(huán)參數(shù)M未被發(fā)現(xiàn)小于最大值“m”(即,如果參數(shù)M等于最大值“m”),則退出表達(dá)式循環(huán),并且到達(dá)步驟S209。
因此在上述的步驟S203至S208中,創(chuàng)建單個(gè)的低級(jí)特征提取表達(dá)式列表。
在步驟S209,控制部分27檢查以便確定突變循環(huán)參數(shù)NM是否小于最大值“nm”。如果突變循環(huán)參數(shù)NM被發(fā)現(xiàn)小于最大值“nm”,則突變循環(huán)參數(shù)NM被增加“1”,并且再次到達(dá)步驟S202。另一方面,如果突變循環(huán)參數(shù)NM未被發(fā)現(xiàn)小于最大值“nm”(即如果參數(shù)NM等于最大值“nm”),則退出突變循環(huán),并且突變創(chuàng)建過程被終止。因此由直達(dá)該點(diǎn)的處理,創(chuàng)建總計(jì)達(dá)突變計(jì)數(shù)“nm”的低級(jí)特征提取表達(dá)式列表。
按照如上所述的、由低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61執(zhí)行的下一代列表遺傳創(chuàng)建過程,具有高評(píng)估值的、最近一代的低級(jí)特征提取表達(dá)式列表被發(fā)送到下一代,而具有高貢獻(xiàn)比率的、最近一代的低級(jí)特征提取表達(dá)式也一樣。具有低評(píng)估值和貢獻(xiàn)比率的那些被放棄,而不發(fā)送到下一代。即,隨著各代進(jìn)展,低級(jí)特征提取表達(dá)式列表的各評(píng)估值被期望改進(jìn),而各低級(jí)特征提取表達(dá)式列表的貢獻(xiàn)比率也一樣。
返回到圖7,如上述討論創(chuàng)建的下一代的低級(jí)特征提取表達(dá)式列表,由低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61輸出到低級(jí)特征計(jì)算部分24。在步驟S3,低級(jí)特征計(jì)算部分24通過將“j”個(gè)歌曲C1至Cj的輸入數(shù)據(jù)(內(nèi)容數(shù)據(jù)和元數(shù)據(jù)),代入從低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61輸入的、“n”個(gè)低級(jí)特征提取表達(dá)式列表的每個(gè),計(jì)算各低級(jí)特征。將產(chǎn)生的“n”個(gè)低級(jí)特征輸出到高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65。
在步驟S4,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65,基于從低級(jí)特征計(jì)算部分24輸入的“n”個(gè)低級(jí)特征、以及對(duì)應(yīng)的訓(xùn)練數(shù)據(jù),通過學(xué)習(xí)估計(jì)(即,創(chuàng)建)“n”個(gè)高級(jí)特征提取表達(dá)式組合,每個(gè)高級(jí)特征提取表達(dá)式組合包括“k”個(gè)高級(jí)特征提取表達(dá)式。高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65,進(jìn)一步計(jì)算每個(gè)高級(jí)特征提取表達(dá)式中的每個(gè)低級(jí)特征的貢獻(xiàn)比率、以及每個(gè)高級(jí)特征提取表達(dá)式的評(píng)估值,并且將計(jì)算結(jié)果輸出到低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61。
現(xiàn)在參照?qǐng)D45的流程圖,在下文詳細(xì)描述由高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65執(zhí)行的、步驟S4的高級(jí)特征提取表達(dá)式學(xué)習(xí)過程。
在步驟S211,控制部分27通過初始化列表循環(huán)參數(shù)N為“1”,開始列表循環(huán)。該列表循環(huán)被重復(fù)與預(yù)定的列表計(jì)數(shù)“n”一樣多的次數(shù)。在步驟S212,控制部分27通過初始化訓(xùn)練數(shù)據(jù)循環(huán)參數(shù)K為“1”,開始訓(xùn)練數(shù)據(jù)循環(huán)。該訓(xùn)練數(shù)據(jù)循環(huán)被重復(fù)與預(yù)定的訓(xùn)練數(shù)據(jù)類型的計(jì)數(shù)“k”一樣多的次數(shù)。
在步驟S213,控制部分27通過初始化算法循環(huán)參數(shù)A為“1”,開始算法循環(huán)。該算法循環(huán)被重復(fù)與預(yù)定的學(xué)習(xí)算法類型的計(jì)數(shù)“a”一樣多的次數(shù)。在所述算法循環(huán)中使用的是和上面結(jié)合特征提取算法創(chuàng)建設(shè)備20討論的相同類型的算法。
在步驟S214,控制部分27通過初始化交叉確認(rèn)循環(huán)參數(shù)C為“1”,開始交叉確認(rèn)循環(huán)。該交叉確認(rèn)循環(huán)被重復(fù)與預(yù)定交叉確認(rèn)計(jì)數(shù)“c”一樣多的次數(shù)。
在步驟S215,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65,從多如“k”個(gè)的訓(xùn)練數(shù)據(jù)類型中,將大約“j”個(gè)歌曲的第K個(gè)類型的訓(xùn)練數(shù)據(jù)(真正的高級(jí)特征),隨機(jī)地二分為學(xué)習(xí)使用數(shù)據(jù)和評(píng)估使用數(shù)據(jù)。在下面的描述中,將為學(xué)習(xí)使用分類的訓(xùn)練數(shù)據(jù)稱作為學(xué)習(xí)數(shù)據(jù),而將為評(píng)估使用分類的訓(xùn)練數(shù)據(jù)稱作為評(píng)估數(shù)據(jù)。
在步驟S216,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65通過學(xué)習(xí)估計(jì)高級(jí)特征提取表達(dá)式,該學(xué)習(xí)涉及將第a個(gè)學(xué)習(xí)算法應(yīng)用到相對(duì)應(yīng)的學(xué)習(xí)數(shù)據(jù)、以及使用第N個(gè)低級(jí)特征提取表達(dá)式列表計(jì)算的多個(gè)低級(jí)特征的組合。
上面的學(xué)習(xí)過程,與由高級(jí)特征提取表達(dá)式學(xué)習(xí)部分25實(shí)現(xiàn)的不同,使用了利用第N個(gè)低級(jí)特征提取表達(dá)式列表計(jì)算的所有低級(jí)特征(該計(jì)算的結(jié)果被稱作為低級(jí)特征組合)。這將高級(jí)特征提取表達(dá)式的評(píng)估值轉(zhuǎn)化為一值,其適當(dāng)考慮原始的低級(jí)特征的數(shù)目是否足夠大。
下面參照?qǐng)D46描述的是,基于由高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65執(zhí)行的、步驟S216中的學(xué)習(xí)算法的學(xué)習(xí)過程。
在步驟S231,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65,從訓(xùn)練數(shù)據(jù)中通過學(xué)習(xí)估計(jì)高級(jí)特征提取表達(dá)式,該學(xué)習(xí)涉及將第A個(gè)學(xué)習(xí)算法應(yīng)用到學(xué)習(xí)數(shù)據(jù)和低級(jí)特征的組合。
在步驟S232,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65計(jì)算信息數(shù)量標(biāo)準(zhǔn)AIC或BIC,作為從前面的步驟獲得的高級(jí)特征的評(píng)估值。這使得基于學(xué)習(xí)算法的學(xué)習(xí)過程結(jié)束。
回到圖45的步驟S217,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65使用所述評(píng)估數(shù)據(jù),評(píng)估步驟S216中獲取的高級(jí)特征提取表達(dá)式。更具體地講,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65,使用獲取的高級(jí)特征提取表達(dá)式計(jì)算高級(jí)特征,并且找出計(jì)算的高級(jí)特征和評(píng)估數(shù)據(jù)之間的平方誤差。
在步驟S218,控制部分27檢查以便確定交叉確認(rèn)循環(huán)參數(shù)C是否小于最大值“c”。如果交叉確認(rèn)循環(huán)參數(shù)C被發(fā)現(xiàn)小于最大值“c”,則參數(shù)C被增加“1”,并且再次到達(dá)步驟S215。另一方面,如果交叉確認(rèn)循環(huán)參數(shù)C未被發(fā)現(xiàn)小于最大值“c”(即如果參數(shù)C等于最大值“c”),則退出交叉確認(rèn)循環(huán),并且到達(dá)步驟S219。多如“c”個(gè)的高級(jí)特征提取表達(dá)式被因此獲取,作為構(gòu)成交叉確認(rèn)循環(huán)的步驟S214至S218中的學(xué)習(xí)的結(jié)果。因?yàn)閷W(xué)習(xí)數(shù)據(jù)和評(píng)估數(shù)據(jù)通過交叉確認(rèn)循環(huán)被隨機(jī)地變換,所以可能驗(yàn)證該高級(jí)特征提取表達(dá)式?jīng)]有被過度學(xué)習(xí)。
在步驟S219,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65從通過交叉確認(rèn)循環(huán)獲取的“c”個(gè)高級(jí)特征提取表達(dá)式中,選擇具有從步驟S217獲得的最高評(píng)估值的高級(jí)特征提取表達(dá)式。
在步驟S220,控制部分27檢查以便確定算法循環(huán)參數(shù)A是否小于最大值“a”。如果算法循環(huán)參數(shù)A被發(fā)現(xiàn)小于最大值“a”,則參數(shù)A被增加“1”,并且再次到達(dá)步驟S214。另一方面,如果算法循環(huán)參數(shù)A未被發(fā)現(xiàn)小于最大值“a”(即如果參數(shù)A等于最大值“a”),則退出所述算法循環(huán),并且到達(dá)步驟S221。因此在構(gòu)成所述算法循環(huán)的步驟S213至S220中,獲取使用“a”個(gè)學(xué)習(xí)算法學(xué)習(xí)的、第K個(gè)類型的多如“a”個(gè)的高級(jí)特征提取表達(dá)式。
在步驟S221,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65從通過所述算法循環(huán)學(xué)習(xí)的“a”個(gè)高級(jí)特征提取表達(dá)式中,選擇具有從步驟S217獲得的最高評(píng)估值的高級(jí)特征提取表達(dá)式。
在步驟S222,控制部分27檢查以便確定訓(xùn)練數(shù)據(jù)循環(huán)參數(shù)K是否小于最大值“k”。如果訓(xùn)練數(shù)據(jù)循環(huán)參數(shù)K被發(fā)現(xiàn)小于最大值“k”,則參數(shù)K被增加“1”,并且再次到達(dá)步驟S213。另一方面,如果訓(xùn)練數(shù)據(jù)循環(huán)參數(shù)K未被發(fā)現(xiàn)小于最大值“k”(即如果參數(shù)K等于最大值“k”),則退出所述訓(xùn)練數(shù)據(jù)循環(huán),并且到達(dá)步驟S223。因此在構(gòu)成所述訓(xùn)練數(shù)據(jù)循環(huán)的步驟S212至S222中,獲取與第N個(gè)低級(jí)特征提取表達(dá)式列表相對(duì)應(yīng)的、多如“k”個(gè)的高級(jí)特征提取表達(dá)式。
在步驟S223,控制部分27檢查以便確定列表循環(huán)參數(shù)N是否小于最大值“n”。如果列表循環(huán)參數(shù)N被發(fā)現(xiàn)小于最大值“n”,則參數(shù)N被增加“1”,并且再次到達(dá)步驟S212。另一方面,如果列表循環(huán)參數(shù)N未被發(fā)現(xiàn)小于最大值“n”(即如果參數(shù)N等于最大值“n”),則退出所述列表循環(huán),并且到達(dá)步驟S224。因此在構(gòu)成所述列表循環(huán)的步驟S221至S223中,獲取與第n個(gè)低級(jí)特征提取表達(dá)式列表的每個(gè)相對(duì)應(yīng)的、多如“k”個(gè)的高級(jí)特征提取表達(dá)式。
在步驟S224,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65,計(jì)算與獲取的“n”個(gè)低級(jí)特征提取表達(dá)式列表的每個(gè)相對(duì)應(yīng)的、“k”個(gè)高級(jí)特征提取表達(dá)式的每個(gè)的貢獻(xiàn)比率,并且將計(jì)算結(jié)果與在步驟S217中計(jì)算的高級(jí)特征提取表達(dá)式的評(píng)估值一起,輸出到低級(jí)特征提取表達(dá)式列表創(chuàng)建部分61。這使得高級(jí)特征提取表達(dá)式學(xué)習(xí)過程結(jié)束。
回到圖7的步驟S5,控制部分27檢查以便確定學(xué)習(xí)循環(huán)參數(shù)G是否小于最大值“g”。如果學(xué)習(xí)循環(huán)參數(shù)G被發(fā)現(xiàn)小于最大值“g”,則參數(shù)G被增加“1”,并且再次到達(dá)步驟S2。另一方面,如果學(xué)習(xí)循環(huán)參數(shù)G未被發(fā)現(xiàn)小于最大值“g”(即如果參數(shù)G等于最大值“g”),則退出所述學(xué)習(xí)循環(huán),并且到達(dá)步驟S6。步驟S1至S5構(gòu)成特征提取算法學(xué)習(xí)過程。繼該過程之后的步驟S6,是用于使用特征提取算法計(jì)算各高級(jí)特征的過程。
在步驟S6,高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65,從通過學(xué)習(xí)獲得的最近一代的“n”個(gè)低級(jí)特征提取表達(dá)式列表中,將構(gòu)成列表的低級(jí)特征提取表達(dá)式,與對(duì)應(yīng)于該列表的“k”個(gè)高級(jí)特征提取表達(dá)式一起,提供給高級(jí)特征計(jì)算部分26,所述列表具有獲取的各高級(jí)特征的均值評(píng)估值。
在步驟S7,高級(jí)特征計(jì)算部分26利用最近從高級(jí)特征提取表達(dá)式學(xué)習(xí)部分65提供的高級(jí)特征提取表達(dá)式、和低級(jí)特征提取表達(dá)式,計(jì)算具有高精度的高級(jí)特征。已經(jīng)結(jié)合特征提取算法創(chuàng)建設(shè)備20討論了步驟S7的高精度高級(jí)特征計(jì)算過程,并因此在下面將不進(jìn)一步描述。
前面的段落完成了由特征提取算法創(chuàng)建設(shè)備60執(zhí)行的特征提取算法創(chuàng)建過程的描述。
按照如本發(fā)明的第二實(shí)施例的、由特征提取算法創(chuàng)建設(shè)備60執(zhí)行的如上所述的特征提取算法學(xué)習(xí)過程,可能精確和快速地創(chuàng)建用于從歌曲數(shù)據(jù)提取相關(guān)特征的算法。該過程還允許用顯著小量的計(jì)算獲取高度精確的高級(jí)特征。
特別值得注意的是,隨機(jī)確定構(gòu)成每個(gè)低級(jí)特征提取表達(dá)式列表的數(shù)量“m”個(gè)表達(dá)式的能力。這與由特征提取算法創(chuàng)建設(shè)備20執(zhí)行的特征提取算法學(xué)習(xí)過程不同,其有助于避免通過繁重和潛在不精確的處理,處理太多的低級(jí)特征,從而有助于產(chǎn)生具有高精度的結(jié)果。
本發(fā)明不僅可以被應(yīng)用來從歌曲數(shù)據(jù)獲取各高級(jí)特征,而且從包括視頻數(shù)據(jù)的多樣化目錄中的內(nèi)容數(shù)據(jù)獲得各高級(jí)特征。
如上所述的一系列的步驟和過程可以由硬件或軟件執(zhí)行。對(duì)于要進(jìn)行的基于軟件的處理,構(gòu)成軟件的程序可以提前被并入用于程序執(zhí)行的計(jì)算機(jī)專用硬件,或在使用時(shí)從適合的記錄介質(zhì)安裝到如圖47所示的通用個(gè)人計(jì)算機(jī)、或類似的能夠基于安裝的程序執(zhí)行多樣化功能的裝備。
如圖47所示的個(gè)人計(jì)算機(jī)100并入CPU(中央處理單元)101。輸入/輸出接口105通過總線104被連接到CPU 101。該總線104被連接到ROM(只讀存儲(chǔ)器)102和RAM(隨機(jī)存取存儲(chǔ)器)103。
輸入/輸出接口105被連接到輸入設(shè)備106、輸出設(shè)備107、存儲(chǔ)設(shè)備108和通信設(shè)備109。輸入設(shè)備106包括如由用戶操作的鍵盤和鼠標(biāo)的輸入設(shè)備元件,以便輸入操作命令。該輸出設(shè)備107包括如在其上顯示操作屏幕和其他信息的CRT(陰極射線管)或LCD(液晶顯示器)的顯示設(shè)備。該存儲(chǔ)設(shè)備108典型地由容納程序和數(shù)據(jù)的硬盤驅(qū)動(dòng)器構(gòu)成。該通信設(shè)備109由在如因特網(wǎng)的網(wǎng)絡(luò)上進(jìn)行通信的modem和/或LAN(局域網(wǎng))適配器形成。該輸入/輸出接口105被進(jìn)一步連接到驅(qū)動(dòng)器110,其寫入數(shù)據(jù)到記錄介質(zhì)111并從記錄介質(zhì)111讀取數(shù)據(jù),所述記錄介質(zhì)111是如磁盤(包括軟盤)、光盤(包括CD-ROM(致密盤只讀存儲(chǔ)器))和DVD(數(shù)字多功能盤))、磁光盤(包括MD(迷你盤))或半導(dǎo)體存儲(chǔ)器。
用于使得個(gè)人計(jì)算機(jī)100執(zhí)行如上所述步驟和過程的程序,在被提交到計(jì)算機(jī)100之前被存儲(chǔ)在記錄介質(zhì)111。該程序由驅(qū)動(dòng)器110從記錄介質(zhì)100讀取,并且被安裝到在存儲(chǔ)設(shè)備108中的硬盤設(shè)備上。在存儲(chǔ)設(shè)備108中保持的程序被從此處加載到RAM 103,以便響應(yīng)于由用戶通過輸入設(shè)備106輸入的命令,基于由CPU 101發(fā)出的指令執(zhí)行。
在本說明書中,基于存儲(chǔ)的程序執(zhí)行的各步驟,不僅表示要按描述的序列執(zhí)行的過程(即,基于時(shí)間的序列),而且表示可以并行地或單個(gè)地或者不按時(shí)間地執(zhí)行的過程。
該程序可以由單個(gè)計(jì)算機(jī)或基于分布式的多個(gè)計(jì)算機(jī)處理。所述程序還可以被傳輸?shù)竭b遠(yuǎn)位置的計(jì)算機(jī)或多個(gè)計(jì)算機(jī)用于執(zhí)行。
在本說明書中,術(shù)語“系統(tǒng)”指由多個(gè)組件裝置構(gòu)成的整體配置。
本領(lǐng)域技術(shù)人員應(yīng)該理解,各種修改、組合和子組合以及變更可依賴于設(shè)計(jì)要求和其它因素發(fā)生,只要它們?cè)跈?quán)利要求書或其等效物的范圍內(nèi)。
權(quán)利要求
1.一種信息處理設(shè)備,其創(chuàng)建特征檢測(cè)算法,用于從內(nèi)容數(shù)據(jù)檢測(cè)各特征,所述信息處理設(shè)備包括低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,用于基于最近一代的各表達(dá)式列表,通過學(xué)習(xí)創(chuàng)建下一代表達(dá)式列表,其每個(gè)由多個(gè)低級(jí)特征提取表達(dá)式構(gòu)成,所述各低級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入所述內(nèi)容數(shù)據(jù)或與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的元數(shù)據(jù),并從該表達(dá)式輸出各低級(jí)特征;計(jì)算裝置,用于利用由所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置創(chuàng)建的所述下一代的各表達(dá)式列表,計(jì)算所述各低級(jí)特征;以及高級(jí)特征提取表達(dá)式創(chuàng)建裝置,用于基于訓(xùn)練數(shù)據(jù),通過學(xué)習(xí)創(chuàng)建各高級(jí)特征提取表達(dá)式,所述訓(xùn)練數(shù)據(jù)由先前提供的與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的真實(shí)的各高級(jí)特征構(gòu)成,所述各高級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入由所述計(jì)算裝置計(jì)算的所述各低級(jí)特征,并從該表達(dá)式輸出所述內(nèi)容數(shù)據(jù)的各高級(jí)特征特性。
2.如權(quán)利要求1所述的信息處理設(shè)備,其中所述高級(jí)特征提取表達(dá)式創(chuàng)建裝置,至少計(jì)算在所述各高級(jí)特征提取表達(dá)式中的所述各低級(jí)特征的各貢獻(xiàn)比率、或創(chuàng)建的各高級(jí)特征提取表達(dá)式的各精度級(jí)別;以及其中所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,至少基于所述各高級(jí)特征提取表達(dá)式中的所述各低級(jí)特征的各貢獻(xiàn)比率、或所述各高級(jí)特征提取表達(dá)式的各精度級(jí)別,更新所述各低級(jí)特征提取表達(dá)式,其構(gòu)成所述各低級(jí)特征提取表達(dá)式列表,所述各精度級(jí)別和所述各貢獻(xiàn)比率,已經(jīng)通過所述高級(jí)特征提取表達(dá)式創(chuàng)建裝置計(jì)算。
3.如權(quán)利要求1所述的信息處理設(shè)備,其中所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,隨機(jī)地創(chuàng)建各第一代表達(dá)式列表。
4.如權(quán)利要求1所述的信息處理設(shè)備,其中所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,通過選擇過程、交叉過程和突變過程中的至少一個(gè),基于所述最近一代的各表達(dá)式列表,利用遺傳算法創(chuàng)建所述下一代表達(dá)式列表。
5.如權(quán)利要求1所述的信息處理設(shè)備,其中所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,創(chuàng)建所述下一代表達(dá)式列表,其每個(gè)由預(yù)定常數(shù)個(gè)低級(jí)特征提取表達(dá)式構(gòu)成。
6.如權(quán)利要求1所述的信息處理設(shè)備,其中所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,創(chuàng)建所述下一代表達(dá)式列表,其每個(gè)由預(yù)定常數(shù)個(gè)低級(jí)特征提取表達(dá)式構(gòu)成,所述低級(jí)特征提取表達(dá)式在每次創(chuàng)建每個(gè)所述列表時(shí)隨機(jī)確定。
7.如權(quán)利要求6所述的信息處理設(shè)備,其中所述高級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,至少計(jì)算所述各高級(jí)特征提取表達(dá)式中的所述各低級(jí)特征的各貢獻(xiàn)比率、或創(chuàng)建的各高級(jí)特征提取表達(dá)式的各評(píng)估值;以及其中所述低級(jí)特征提取表達(dá)式列表創(chuàng)建裝置,至少基于所述各高級(jí)特征提取表達(dá)式中的所述各低級(jí)特征的各貢獻(xiàn)比率、或所述各高級(jí)特征提取表達(dá)式的各評(píng)估值,更新所述各低級(jí)特征提取表達(dá)式,其構(gòu)成所述各低級(jí)特征提取表達(dá)式列表,所述各評(píng)估值和所述各貢獻(xiàn)比率已經(jīng)通過所述高級(jí)特征提取表達(dá)式創(chuàng)建裝置計(jì)算。
8.一種信息處理方法,其隨信息處理設(shè)備使用,該信息處理設(shè)備創(chuàng)建特征檢測(cè)算法,該算法用于從內(nèi)容數(shù)據(jù)檢測(cè)各特征,所述信息處理方法包括以下步驟基于最近一代的各表達(dá)式列表,通過學(xué)習(xí)創(chuàng)建下一代表達(dá)式列表,其每個(gè)由多個(gè)低級(jí)特征提取表達(dá)式構(gòu)成,所述各低級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入所述內(nèi)容數(shù)據(jù)或與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的元數(shù)據(jù),并從該表達(dá)式輸出各低級(jí)特征;利用創(chuàng)建的下一代的各表達(dá)式列表,計(jì)算所述各低級(jí)特征;以及基于訓(xùn)練數(shù)據(jù),通過學(xué)習(xí)創(chuàng)建各高級(jí)特征提取表達(dá)式,所述訓(xùn)練數(shù)據(jù)由先前提供的、與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的真實(shí)的各高級(jí)特征構(gòu)成,所述各高級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入計(jì)算的各低級(jí)特征,并從該表達(dá)式輸出所述內(nèi)容數(shù)據(jù)的各高級(jí)特征特性。
9.一種用于控制信息處理設(shè)備的程序,該信息處理設(shè)備創(chuàng)建特征檢測(cè)算法,該算法用于從內(nèi)容數(shù)據(jù)檢測(cè)各特征,所述程序使得所述信息處理設(shè)備的計(jì)算機(jī)執(zhí)行包括如下步驟的過程基于最近一代的各表達(dá)式列表,通過學(xué)習(xí)創(chuàng)建下一代表達(dá)式列表,其每個(gè)由多個(gè)低級(jí)特征提取表達(dá)式構(gòu)成,所述各低級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入所述內(nèi)容數(shù)據(jù)或與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的元數(shù)據(jù),并從該表達(dá)式輸出各低級(jí)特征;利用創(chuàng)建的下一代的各表達(dá)式列表,計(jì)算所述各低級(jí)特征;以及基于訓(xùn)練數(shù)據(jù),通過學(xué)習(xí)創(chuàng)建各高級(jí)特征提取表達(dá)式,所述訓(xùn)練數(shù)據(jù)由先前提供的與所述內(nèi)容數(shù)據(jù)相對(duì)應(yīng)的真實(shí)的各高級(jí)特征構(gòu)成,所述各高級(jí)特征提取表達(dá)式是這樣的表達(dá)式向該表達(dá)式輸入計(jì)算的各低級(jí)特征,并從該表達(dá)式輸出所述內(nèi)容數(shù)據(jù)的高級(jí)特征特性。
全文摘要
一種信息處理設(shè)備、信息處理方法和程序,用于創(chuàng)建一種算法,其用于從如歌曲作品的內(nèi)容數(shù)據(jù),以數(shù)據(jù)高精確度、并且短時(shí)間地提取相應(yīng)的特征值。特征值提取算法創(chuàng)建設(shè)備(20)包括低級(jí)特征值提取公式列表創(chuàng)建部分(21),用于創(chuàng)建包含m個(gè)低級(jí)特征值提取公式的n個(gè)低級(jí)特征值提取公式列表;低級(jí)特征值計(jì)算部分(24),用于通過將j個(gè)音樂作品上的輸入數(shù)據(jù)代入n個(gè)低級(jí)特征值提取列表,確定對(duì)應(yīng)于輸入數(shù)據(jù)的各個(gè)項(xiàng)目的m種低級(jí)特征值的n個(gè)集合;以及高級(jí)特征值提取公式學(xué)習(xí)部分(25),用于通過從對(duì)應(yīng)于低級(jí)特征值輸出的n個(gè)集合的教導(dǎo)數(shù)據(jù)(對(duì)應(yīng)于各j音樂作品的高級(jí)特征值的k個(gè)項(xiàng)目)學(xué)習(xí),估計(jì)高級(jí)特征值提取公式。本發(fā)明可應(yīng)用于獲取音樂作品或視頻的高級(jí)特征值的系統(tǒng)。
文檔編號(hào)G10K15/02GK101091204SQ20068000157
公開日2007年12月19日 申請(qǐng)日期2006年10月25日 優(yōu)先權(quán)日2005年10月25日
發(fā)明者小林由幸 申請(qǐng)人:索尼株式會(huì)社