專利名稱:通過分割的特征比較而自動(dòng)生成播放列表的方法和設(shè)備的制作方法
通過分割的特征比較而自動(dòng)生成播放列表的方法和設(shè)備 發(fā)明領(lǐng)域
本發(fā)明涉及用于自動(dòng)地生成例如歌曲之類的內(nèi)容項(xiàng)目的播放列表的
方法和設(shè)備。特別地,它涉及與一個(gè)種子內(nèi)容項(xiàng)目(seed content item) 相似的內(nèi)容項(xiàng)目的自動(dòng)播放列表的生成。
背景技術(shù):
多媒體消費(fèi)者設(shè)備(consumer devices)在處理能力方面正在擴(kuò)充, 并且能夠給用戶提供更多先進(jìn)的多媒體內(nèi)容瀏覽、導(dǎo)航以及檢索特征???以預(yù)料,由于存儲(chǔ)容量和連接帶寬的增加,消費(fèi)者將可以訪問龐大的內(nèi)容 項(xiàng)目的數(shù)據(jù)庫。因此,存在著日益增長的需求去提供用于輔助用戶的有效 的瀏覽、導(dǎo)航以及檢索系統(tǒng)。
已存在許多已知的系統(tǒng),用于內(nèi)容項(xiàng)目的檢索和用于播放列表的自動(dòng) 生成。這些系統(tǒng)中的一些起到這樣的作用,即基于內(nèi)容項(xiàng)目與某一種子(或 參考)內(nèi)容項(xiàng)目的相似性而從大規(guī)模的數(shù)據(jù)庫中選擇內(nèi)容項(xiàng)目。在這種系 統(tǒng)中,被存儲(chǔ)在數(shù)據(jù)庫中的所有內(nèi)容項(xiàng)目被預(yù)先分析,并且它們的典型特 征被存儲(chǔ)在一個(gè)元數(shù)據(jù)的數(shù)據(jù)庫中。用戶提供一個(gè)種子內(nèi)容項(xiàng)目(有與其 相關(guān)聯(lián)的一個(gè)分類),然后這個(gè)系統(tǒng)通過比較相應(yīng)的典型特征之間的相似 程度(或者相應(yīng)內(nèi)容項(xiàng)目分類之間的相似性)來檢索相似的內(nèi)容項(xiàng)目。然 而,這些已知的系統(tǒng)不檢索將被用戶認(rèn)為與種子內(nèi)容項(xiàng)目相似的所有內(nèi)容 項(xiàng)目。
發(fā)明概述
本發(fā)明的目的在于提供一種方法,它提高了所生成的播放列表的感知
根據(jù)本發(fā)明的一個(gè)方面,這是通過一種方法來實(shí)現(xiàn)的,該方法用于自 動(dòng)地生成候選內(nèi)容項(xiàng)目的播放列表,該候選內(nèi)容項(xiàng)目具有與種子內(nèi)容項(xiàng)目
特征相似的特征,該方法包括以下步驟將種子內(nèi)容項(xiàng)目的至少一個(gè)特征 與候選內(nèi)容項(xiàng)目的至少一個(gè)特征進(jìn)行比較以識(shí)別所述候選內(nèi)容項(xiàng)目中與 種子內(nèi)容項(xiàng)目相似的特定候選內(nèi)容項(xiàng)目;以及將被識(shí)別的候選內(nèi)容項(xiàng)目加 入播放列表,其中種子內(nèi)容項(xiàng)目的該至少一個(gè)特征和/或候選內(nèi)容項(xiàng)目的 該至少一個(gè)特征包括多個(gè)特征,該多個(gè)特征代表種子內(nèi)容項(xiàng)目和/或候選內(nèi)容項(xiàng)目的不同部分。種子內(nèi)容項(xiàng)目和/或候選內(nèi)容項(xiàng)目的多個(gè)特征與種 子內(nèi)容項(xiàng)目或候選內(nèi)容項(xiàng)目的至少一個(gè)特征相比較。
根據(jù)本發(fā)明的另一個(gè)方面,這也是通過一種設(shè)備來實(shí)現(xiàn)的,該設(shè)備用 于自動(dòng)地生成候選內(nèi)容項(xiàng)目的播放列表,該候選內(nèi)容項(xiàng)目具有與種子內(nèi)容
項(xiàng)目特征相似的特征,該生成器包括 一個(gè)比較器,用于將種子內(nèi)容項(xiàng)目 的至少一個(gè)特征與每個(gè)候選內(nèi)容項(xiàng)目的至少一個(gè)特征進(jìn)行比4交以識(shí)別所 述候選內(nèi)容項(xiàng)目中與種子內(nèi)容項(xiàng)目相似的特定候選內(nèi)容項(xiàng)目;以及一個(gè)編 輯器,用于將被識(shí)別的候選內(nèi)容項(xiàng)目加入播放列表,其中該種子內(nèi)容項(xiàng)目 的至少一個(gè)特征和/或候選內(nèi)容項(xiàng)目的至少一個(gè)特征包括多個(gè)特征,該多 個(gè)特征代表種子內(nèi)容項(xiàng)目和/或候選內(nèi)容項(xiàng)目的不同部分。
例如, 一條合成的音頻內(nèi)容項(xiàng)目可以有三個(gè)不同的部分古典、語音 (speech)和流行。使用一個(gè)已知的分類器,這將被嚴(yán)格地分類為古典、 語音或流行之一。結(jié)果,被生成的播放列表可能僅僅包括這一個(gè)分類的候 選歌曲和/或可能僅僅包括其一個(gè)分類與種子歌曲的分類相似的候選歌曲 (例如,如果具有流行部分的候選歌曲也有古典部分且僅該古典部分被用 于比較這兩首歌曲,則對于流行分類的種子歌曲,該候選歌曲可能不被列 入)。為了克服這一點(diǎn),根據(jù)本發(fā)明的一個(gè)實(shí)施例,在上述例子的情形下, 來自每一部分的特征(三組特征)的一個(gè)記錄會(huì)被保存從古典部分所提 耳又出來的一組、來自于語音部分的一組和來自于流4于部分的一組,以及在 數(shù)據(jù)庫中內(nèi)容是與三組特征相鏈接的。這就意味著,分類器將要把這樣一 首歌曲分類為古典、語音和流行。從而,如果內(nèi)容項(xiàng)目的內(nèi)容變化很大, 則它將通過較大量的特征矢量來代表,這些特征矢量將更準(zhǔn)確地代表該內(nèi) 容的特性,這與現(xiàn)存的系統(tǒng)相反,后者將試圖用單一特征矢量來代表特性。 這導(dǎo)致了相似內(nèi)容項(xiàng)目的一個(gè)改進(jìn)的播放列表。
這個(gè)特征可以是一個(gè)單一特征,例如, 一個(gè)值代表節(jié)奏或者一個(gè)分類, 或者它可以是一個(gè)特征矢量。該方法可以從一個(gè)內(nèi)容項(xiàng)目中、或者從與該 內(nèi)容項(xiàng)目相關(guān)聯(lián)的元數(shù)據(jù)標(biāo)簽或者數(shù)據(jù)庫登錄項(xiàng)中提取特征。
在一個(gè)優(yōu)選的實(shí)施例中,多個(gè)候選內(nèi)容項(xiàng)目中的每一個(gè)和種子內(nèi)容項(xiàng) 目被分割為許多幀(frame);以及從每一幀中提取至少一個(gè)特征矢量以 提供內(nèi)容項(xiàng)目的多個(gè)特征矢量。
這個(gè)分割提供了一個(gè)預(yù)先處理的步驟,并且該特征矢量能用一個(gè)現(xiàn)存 的分類器提取出來。因此,分類器的修改不是必需的。附圖的簡述為了更完整地理解本發(fā)明,作為例子,以下面的說明結(jié)合伴隨的附圖作為參考,其中
圖1示意了根據(jù)本發(fā)明的第一個(gè)實(shí)施例的方法的步驟;圖2示意了根據(jù)本發(fā)明的第二個(gè)實(shí)施例的方法的步驟;以及圖3圖示了根據(jù)本發(fā)明的第三個(gè)實(shí)施例的所提取的特征矢量的分布。優(yōu)選實(shí)施例的詳述為了描述這些實(shí)施例的目的,僅僅內(nèi)容項(xiàng)目的音頻內(nèi)容的特征矢量的 提取將被描述。然而,可以理解,本方法可能可應(yīng)用于內(nèi)容項(xiàng)目的剩余內(nèi) 容的特征的提取。內(nèi)容項(xiàng)目可以包括模擬或者數(shù)字多媒體內(nèi)容、音樂軌道、 歌曲等等的一個(gè)文件。根據(jù)第一個(gè)實(shí)施例的方法現(xiàn)在將以圖l作為參考進(jìn)行說明。到來的音 頻x首先被分割為有任意選擇的長度的幀x, ,步驟IOI。幀的長度可以有 相同的預(yù)先確定的長度或者可以隨機(jī)地變化。對于每一個(gè)音頻分段(或幀) x ,,特征矢量是使用已知技術(shù)而被提取出的,步驟103,以及被存儲(chǔ)在特 征數(shù)據(jù)庫中,步驟105。令M^為在候選內(nèi)容項(xiàng)目(歌曲)中的分段數(shù)目,以及〖2/為在種 子內(nèi)容項(xiàng)目(歌曲)中的分段數(shù)目。而且,令F,.a和巧,w分別為對應(yīng)于種 子和候選歌曲的第k個(gè)和第m個(gè)分段的特征矢量。于是,在播放列表生成 過程中被分割的種子歌曲(用s表示)和被分割的候選歌曲(用j表示)之間的距離由下式給出符合預(yù)先確定的距離準(zhǔn)則的若干候選歌曲可以^f皮選擇。例如,這些歌 曲可以以距離增長的次序在播放列表中列出。用戶可以選擇最高的(比方30個(gè))匹配來創(chuàng)建播放列表??商鎿Q地,對于D(巧,F(xiàn)/)的最大閾值可以被預(yù)先確定,以及僅僅具有低于閾值的距離的那些內(nèi)容項(xiàng)目(歌曲)被選擇 用于播放列表。在第二個(gè)實(shí)施例中,分割是通過比較在特征矢量中的瞬時(shí)改變而被實(shí) 現(xiàn)的。本實(shí)施例的簡單示意被示于圖2中。這可以通過以下方式被實(shí)現(xiàn), 即通過在步驟205連續(xù)地平均在步驟201中所提取的特征矢量,直到在 步驟203中在特征統(tǒng)計(jì)中的瞬時(shí)改變超過了某一閾值T。無論何時(shí)這個(gè)過程發(fā)生,都設(shè)置分割邊界、重置平均緩沖器207,以及將分段特征矢量寫 入特征數(shù)據(jù)庫,步驟209。這個(gè)過程被重復(fù)直至達(dá)到歌曲結(jié)尾。這個(gè)方法 的優(yōu)點(diǎn)在于,它提供了在每首歌曲的特征數(shù)目和特征的代表之間的 一個(gè)較 好折衷。瞬時(shí)改變可以以幾種方式進(jìn)行計(jì)算。 一些例子是瞬時(shí)改變是在 局部平均(local mean),漂移監(jiān)控(drifting monitoring)等等中的改 變。再次以第 一 個(gè)實(shí)施例作為參考進(jìn)行說明,符合預(yù)先確定的距離準(zhǔn)則的 許多候選歌曲可以被選擇以生成播放列表。在第三個(gè)實(shí)施例中,通過分析矢量的分布來提取特征矢量以及確定典 型的特征矢量。這種分布的一個(gè)簡單例子被示于圖3中。在這個(gè)例子中,特征F1、 F2和F3被取作典型的特征。這樣,歌曲分 割就不是必需的了。根據(jù)本實(shí)施例的方法只是著眼于統(tǒng)計(jì)量,并且采用局 部最大值作為典型特征。如果存在幾個(gè)局部最大值,則會(huì)提取多個(gè)典型特 征。如果僅有一個(gè)最大值,那么歌曲就只有一個(gè)典型特征。再次以第 一 個(gè)實(shí)施例作為參考進(jìn)行說明,符合預(yù)先確定的距離準(zhǔn)則的 若干候選歌曲可以被選擇以生成播放列表。結(jié)果,在這個(gè)過程中播放列表確的(無噪聲的)被隨機(jī)化的播放列表。雖然本發(fā)明的優(yōu)選實(shí)施例在伴隨的附圖中已被舉例說明以及在前述 的詳細(xì)說明中被說明了,但是將理解本發(fā)明不限于所公開的實(shí)施例,而 是在不脫離下面權(quán)利要求中所陳述的本發(fā)明范圍的情況下,能有多種修改。
權(quán)利要求
1.一種用于自動(dòng)生成候選內(nèi)容項(xiàng)目的播放列表的方法,該候選內(nèi)容項(xiàng)目具有與種子內(nèi)容項(xiàng)目特征相似的特征,該方法包括以下步驟將種子內(nèi)容項(xiàng)目的至少一個(gè)特征與候選內(nèi)容項(xiàng)目的至少一個(gè)特征進(jìn)行比較以識(shí)別所述候選內(nèi)容項(xiàng)目中與種子內(nèi)容項(xiàng)目相似的特定候選內(nèi)容項(xiàng)目;以及將被識(shí)別的候選內(nèi)容項(xiàng)目加入播放列表,其中種子內(nèi)容項(xiàng)目的該至少一個(gè)特征和/或候選內(nèi)容項(xiàng)目的該至少一個(gè)特征包括多個(gè)特征,該多個(gè)特征代表種子內(nèi)容項(xiàng)目和/或候選內(nèi)容項(xiàng)目的不同部分。
2. 根據(jù)權(quán)利要求l的方法,進(jìn)一步包括以下步驟 將多個(gè)候選內(nèi)容項(xiàng)目中的每一個(gè)和/或種子內(nèi)容項(xiàng)目分割為多個(gè)幀; 將至少一個(gè)特征從每一幀中提取出來以提供內(nèi)容項(xiàng)目的多個(gè)特征。
3. 根據(jù)權(quán)利要求2的方法,其中幀具有預(yù)先確定的長度。
4. 根據(jù)權(quán)利要求3的方法,其中每一個(gè)幀有相同的長度。
5. 根據(jù)權(quán)利要求2的方法,其中分割是基于候選內(nèi)容項(xiàng)目和/或種子 內(nèi)容項(xiàng)目的內(nèi)容。
6. 根據(jù)權(quán)利要求2的方法,其中所述多個(gè)幀的邊界由在所述候選內(nèi) 容項(xiàng)目和/或種子內(nèi)容項(xiàng)目的特征中的瞬時(shí)改變確定。
7. 根據(jù)以上權(quán)利要求任意之一的方法,其中將種子內(nèi)容項(xiàng)目的至少 一個(gè)特征與候選內(nèi)容項(xiàng)目的至少一個(gè)特征進(jìn)行比較的步驟進(jìn)一步包括確定特征之間的距離的步驟以及選擇具有最短距離的至少 一個(gè)候選 內(nèi)容項(xiàng)目以加入播放列表的步驟。
8. —種用于自動(dòng)地生成候選內(nèi)容項(xiàng)目的播放列表的設(shè)備,該候選內(nèi) 容項(xiàng)目具有與種子內(nèi)容項(xiàng)目特征相似的特征,該生成器包括一個(gè)比較器,用于將種子內(nèi)容項(xiàng)目的至少一個(gè)特征與每個(gè)候選內(nèi)容項(xiàng)目的至少一個(gè)特征進(jìn)行比較,以識(shí)別所述候選內(nèi)容項(xiàng)目中與種子內(nèi)容項(xiàng)目相似的特定候選內(nèi)容項(xiàng)目;以及一個(gè)編輯器,用于將被識(shí)別的候選內(nèi)容項(xiàng)目加入播放列表, 其中種子內(nèi)容項(xiàng)目的至少一個(gè)特征和/或候選內(nèi)容項(xiàng)目的至少一個(gè)特征包括多個(gè)特征,該多個(gè)特征代表種子內(nèi)容項(xiàng)目和/或候選內(nèi)容項(xiàng)目的不同部分。
9. 一種計(jì)算機(jī)程序產(chǎn)品,包括用于執(zhí)行根據(jù)權(quán)利要求1至7任意之 一的方法的多個(gè)程序代碼部分。
全文摘要
內(nèi)容項(xiàng)目,例如歌曲的播放列表,可被自動(dòng)地生成,其中具有與種子內(nèi)容項(xiàng)目特征相似的特征的內(nèi)容項(xiàng)目可被選擇。種子內(nèi)容項(xiàng)目的至少一個(gè)特征與每個(gè)候選內(nèi)容項(xiàng)目的至少一個(gè)特征相比較,以識(shí)別所述的候選內(nèi)容項(xiàng)目中與種子內(nèi)容項(xiàng)目相似的特定的候選內(nèi)容項(xiàng)目。被識(shí)別的候選內(nèi)容項(xiàng)目然后被加入到播放列表。多個(gè)特征代表(例如提取自)多個(gè)候選內(nèi)容項(xiàng)目的不同部分,和/或種子內(nèi)容項(xiàng)目的多個(gè)特征代表(例如提取自)種子內(nèi)容項(xiàng)目的不同部分。種子內(nèi)容項(xiàng)目和/或候選內(nèi)容項(xiàng)目的多個(gè)特征與種子內(nèi)容項(xiàng)目或候選內(nèi)容項(xiàng)目的至少一個(gè)特征相比較。
文檔編號(hào)G11B27/10GK101278350SQ200680036131
公開日2008年10月1日 申請日期2006年9月1日 優(yōu)先權(quán)日2005年9月29日
發(fā)明者A·N·勒馬, J·F·阿普里 申請人:皇家飛利浦電子股份有限公司