用于獲取節(jié)目信息的處理方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種用于獲取節(jié)目信息的處理方法和系統(tǒng)。
【背景技術(shù)】
[0002]用戶如果需要獲取電視臺(tái)節(jié)目信息時(shí),可以通過搜索引擎搜索電視節(jié)目信息,或者到相關(guān)電視臺(tái)官網(wǎng)瀏覽電視節(jié)目信息等。
[0003]但是,這些方式都需要用戶首先判斷出要搜索的電視臺(tái),再查詢相應(yīng)的節(jié)目信息,主要依賴用戶的判斷和輸入。
【發(fā)明內(nèi)容】
[0004]本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0005]為此,本發(fā)明的一個(gè)目的在于提出一種用于獲取節(jié)目信息的處理方法,該方法可以實(shí)現(xiàn)系統(tǒng)根據(jù)音頻數(shù)據(jù)主動(dòng)得到識(shí)別結(jié)果,降低對(duì)用戶的依賴,提高效率和準(zhǔn)確度。
[0006]本發(fā)明的另一個(gè)目的在于提出一種用于獲取節(jié)目信息的處理系統(tǒng)。
[0007]為達(dá)到上述目的,本發(fā)明第一方面實(shí)施例提出的用于獲取節(jié)目信息的處理方法,包括:獲取識(shí)別模型,所述識(shí)別模型是對(duì)接收的特征數(shù)據(jù)進(jìn)行訓(xùn)練后得到的,所述特征數(shù)據(jù)是根據(jù)音頻數(shù)據(jù)得到的,所述音頻數(shù)據(jù)是從源數(shù)據(jù)流中獲取的;接收要識(shí)別的特征數(shù)據(jù),并根據(jù)所述識(shí)別模型對(duì)所述要識(shí)別的特征數(shù)據(jù)進(jìn)行識(shí)別,得到識(shí)別結(jié)果,所述要識(shí)別的特征數(shù)據(jù)是根據(jù)要識(shí)別的音頻數(shù)據(jù)得到的。
[0008]本發(fā)明第一方面實(shí)施例提出的用于獲取節(jié)目信息的處理方法,通過獲取識(shí)別模型,并根據(jù)識(shí)別模型獲取識(shí)別結(jié)果,可以實(shí)現(xiàn)系統(tǒng)根據(jù)音頻數(shù)據(jù)主動(dòng)得到識(shí)別結(jié)果,降低對(duì)用戶的依賴,提高效率和準(zhǔn)確度。
[0009]為達(dá)到上述目的,本發(fā)明第二方面實(shí)施例提出的用于獲取節(jié)目信息的處理系統(tǒng),包括解碼器,所述解碼器包括:訓(xùn)練模塊,用于獲取識(shí)別模型,所述識(shí)別模型是對(duì)接收的特征數(shù)據(jù)進(jìn)行訓(xùn)練后得到的,所述特征數(shù)據(jù)是根據(jù)音頻數(shù)據(jù)得到的,所述音頻數(shù)據(jù)是從源數(shù)據(jù)流中獲取的;識(shí)別模塊,用于接收要識(shí)別的特征數(shù)據(jù),并根據(jù)所述識(shí)別模型對(duì)所述要識(shí)別的特征數(shù)據(jù)進(jìn)行識(shí)別,得到識(shí)別結(jié)果,所述要識(shí)別的特征數(shù)據(jù)是根據(jù)要識(shí)別的音頻數(shù)據(jù)得到的。
[0010]本發(fā)明第二方面實(shí)施例提出的用于獲取節(jié)目信息的處理系統(tǒng),通過獲取識(shí)別模型,并根據(jù)識(shí)別模型獲取識(shí)別結(jié)果,可以實(shí)現(xiàn)系統(tǒng)根據(jù)音頻數(shù)據(jù)主動(dòng)得到識(shí)別結(jié)果,降低對(duì)用戶的依賴,提高效率和準(zhǔn)確度。
[0011]本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
【附圖說明】
[0012]本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
[0013]圖1是本發(fā)明一實(shí)施例提出的用于獲取節(jié)目信息的處理方法的流程示意圖;
[0014]圖2是本發(fā)明實(shí)施例中獲取節(jié)目信息的系統(tǒng)結(jié)構(gòu)示意圖;
[0015]圖3是本發(fā)明另一實(shí)施例提出的用于獲取節(jié)目信息的處理方法的流程示意圖;
[0016]圖4是本發(fā)明實(shí)施例中特征提取的流程示意圖;
[0017]圖5是本發(fā)明實(shí)施例中頻域圖的示意圖;
[0018]圖6是本發(fā)明實(shí)施例中chroma域的示意圖;
[0019]圖7是本發(fā)明實(shí)施例中比特圖的示意圖;
[0020]圖8是本發(fā)明實(shí)施例中訓(xùn)練流程的示意圖;
[0021]圖9是本發(fā)明實(shí)施例中識(shí)別流程的示意圖;
[0022]圖10是本發(fā)明另一實(shí)施例提出的用于獲取節(jié)目信息的處理系統(tǒng)的結(jié)構(gòu)示意圖;
[0023]圖11是本發(fā)明另一實(shí)施例提出的用于獲取節(jié)目信息的處理系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0024]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。相反,本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
[0025]圖1是本發(fā)明一實(shí)施例提出的用于獲取節(jié)目信息的處理方法的流程示意圖,該方法包括:
[0026]Sll:獲取識(shí)別模型,所述識(shí)別模型是對(duì)接收的特征數(shù)據(jù)進(jìn)行訓(xùn)練后得到的,所述特征數(shù)據(jù)是根據(jù)音頻數(shù)據(jù)得到的,所述音頻數(shù)據(jù)是從源數(shù)據(jù)流中獲取的。
[0027]本發(fā)明實(shí)施例中,以識(shí)別電視臺(tái)為例,相應(yīng)的,節(jié)目信息是指電視臺(tái)的節(jié)目信息,節(jié)目信息例如節(jié)目單等。可以理解的是,本發(fā)明實(shí)施例的方法也可以應(yīng)用到其他基于音頻的識(shí)別領(lǐng)域,例如也可以用于識(shí)別僅存在音頻數(shù)據(jù)的電臺(tái),進(jìn)而獲取電臺(tái)的節(jié)目單等。
[0028]本發(fā)明實(shí)施例中,用于電視臺(tái)識(shí)別的裝置位于服務(wù)端,該裝置可以稱為解碼器(decoder)。解碼器可以基于識(shí)別模型,識(shí)別要識(shí)別的音頻數(shù)據(jù)來自的電視臺(tái)。
[0029]一個(gè)實(shí)施例中,為了提高可靠性,解碼器可以采用備份方式,相應(yīng)的,多個(gè)解碼器可以組成解碼器集群。進(jìn)一步的,可以在不同的地理區(qū)域上設(shè)置不同的解碼器集群。例如,參見圖2,對(duì)應(yīng)北京地區(qū)設(shè)置一個(gè)解碼器集群21,對(duì)應(yīng)杭州地區(qū)設(shè)置另一個(gè)解碼器集群22,每個(gè)解碼器集群內(nèi)包括多個(gè)解碼器,多個(gè)是指至少兩個(gè)。為了保證實(shí)時(shí)性,降低延時(shí),同一個(gè)解碼器集群內(nèi)的多個(gè)解碼器位于同一個(gè)子網(wǎng)下,例如位于同一個(gè)子網(wǎng)下的同一個(gè)物理機(jī)房?jī)?nèi)。
[0030]由于可以采用備份方式,因此,所述獲取識(shí)別模型,包括:
[0031 ] 從自身節(jié)點(diǎn)獲取識(shí)別模型,所述識(shí)別模型是自身節(jié)點(diǎn)對(duì)接收的特征數(shù)據(jù)進(jìn)行訓(xùn)練后得到的;或者,
[0032]從備份節(jié)點(diǎn)獲取識(shí)別模塊,所述識(shí)別模型是備份節(jié)點(diǎn)對(duì)接收的特征數(shù)據(jù)進(jìn)行訓(xùn)練后得到的。
[0033]可以理解的是,備份節(jié)點(diǎn)可以是專門用于獲取并存儲(chǔ)識(shí)別模型的節(jié)點(diǎn),該備份節(jié)點(diǎn)可以不用于識(shí)別,或者,備份節(jié)點(diǎn)可以與普通節(jié)點(diǎn)相同,可以用于獲取識(shí)別模型以及用于識(shí)別。以一個(gè)解碼器可以作為其他解碼器的備份節(jié)點(diǎn)為例,當(dāng)需要從備份節(jié)點(diǎn)獲取識(shí)別模型時(shí),不同解碼器可以相互通信,獲取其他解碼器是否可用或者負(fù)載情況等,以確定用于提供識(shí)別模型的備份節(jié)點(diǎn)。
[0034]識(shí)別模型是解碼器對(duì)接收的特征數(shù)據(jù)進(jìn)行訓(xùn)練后得到的。
[0035]以電視臺(tái)的識(shí)別為例,參見圖3,另一實(shí)施例中,該方法還可以包括:
[0036]S31:接收電視臺(tái)實(shí)時(shí)發(fā)送的電視信號(hào)對(duì)應(yīng)的傳輸流,并從所述傳輸流中提取出音頻數(shù)據(jù);
[0037]S32:對(duì)所述音頻數(shù)據(jù)進(jìn)行特征提取,獲取所述特征數(shù)據(jù)。
[0038]參見圖2,在每個(gè)電視臺(tái)的機(jī)房?jī)?nèi),可以設(shè)置音頻數(shù)據(jù)提取模塊23和特征數(shù)據(jù)提取模塊24。
[0039]音頻數(shù)據(jù)提取模塊23接收電視臺(tái)實(shí)時(shí)發(fā)送的電視信號(hào)對(duì)應(yīng)的傳輸流(TransportStream, TS),并從所述傳輸流中提取出音頻數(shù)據(jù)。音頻數(shù)據(jù)例如為高級(jí)音頻編碼(AdvancedAud1 Coding,AAC或者ACC)數(shù)據(jù)。其中,TS中的視頻數(shù)據(jù)和音頻數(shù)據(jù)可以具有不同的標(biāo)識(shí)信息,從而根據(jù)標(biāo)識(shí)信息提取出音頻數(shù)據(jù)。
[0040]電視臺(tái)與音頻數(shù)據(jù)提取模塊之間可以采用用戶數(shù)據(jù)報(bào)協(xié)議(User DatagramProtocol,UDP)進(jìn)行通信。例如,電視臺(tái)對(duì)外開放一個(gè)Μ)Ρ端口,電視臺(tái)通過該UDP端口將TS實(shí)時(shí)輸入到音頻數(shù)據(jù)提取模塊。
[0041]特征數(shù)據(jù)提取模塊24對(duì)所述音頻數(shù)據(jù)進(jìn)行特征提取,獲取所述特征數(shù)據(jù)。
[0042]本實(shí)施例中,音頻數(shù)據(jù)提取模塊和特征數(shù)據(jù)提取模塊可以位于同一個(gè)物理設(shè)備內(nèi)。
[0043]由于音頻數(shù)據(jù)的數(shù)據(jù)量較大,為了降低數(shù)據(jù)量可以對(duì)音頻數(shù)據(jù)進(jìn)行特征提取,得到數(shù)據(jù)量較小的特征數(shù)據(jù)。當(dāng)然,可以理解的是,如果不考慮數(shù)據(jù)量等問題,用于識(shí)別模型訓(xùn)練的特征數(shù)據(jù)也可以是音頻數(shù)據(jù)本身。
[0044]一個(gè)實(shí)施例中,參見圖4,所述對(duì)所述音頻數(shù)據(jù)進(jìn)行特征提取,獲取所述特征數(shù)據(jù),包括:
[0045]S41:對(duì)所述音頻數(shù)據(jù)進(jìn)行短時(shí)快速傅氏變換(Fast Fourier Transformat1n,FFT),得到所述音頻數(shù)據(jù)對(duì)應(yīng)的頻域數(shù)據(jù)。
[0046]可以理解的是,在進(jìn)行特征提取之前,可以將從TS中提取的ACC音頻數(shù)據(jù)進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換為其他形式的音頻數(shù)據(jù),以方便處理。本實(shí)施例中,假設(shè)在提取出ACC音頻數(shù)據(jù)后,先將ACC音頻數(shù)據(jù)轉(zhuǎn)換為脈沖編碼調(diào)制(Pulse Code Modulat1n, PCM)音頻數(shù)據(jù)。
[0047]例如,以每幀(通常是0.032秒)為單位,對(duì)ACC音頻數(shù)據(jù)進(jìn)行采樣和量化后,得到一幀的PCM音頻數(shù)據(jù)。PCM音頻數(shù)據(jù)的采樣率和量化位數(shù)是可設(shè)置的,例如,采樣率是16KHz,量化位數(shù)是16b。在將ACC音頻數(shù)據(jù)轉(zhuǎn)換為PCM音頻數(shù)據(jù)后,可以將PCM音頻數(shù)據(jù)存儲(chǔ)在隊(duì)列中,等待特征提取。因此,進(jìn)行特征提取的音頻數(shù)據(jù)可以具體是指以每幀為單位的PCM音頻數(shù)據(jù)。
[0048]在進(jìn)行特征提取時(shí),可以先對(duì)音頻數(shù)據(jù)進(jìn)行短時(shí)FFT,短時(shí)FFT是指在音頻數(shù)據(jù)上乘以時(shí)間窗