国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種歌聲位置檢測方法及裝置制造方法

      文檔序號:2827380閱讀:154來源:國知局
      一種歌聲位置檢測方法及裝置制造方法
      【專利摘要】本發(fā)明實(shí)施例公開了歌聲位置檢測方法及裝置,應(yīng)用于信息處理【技術(shù)領(lǐng)域】。歌聲位置檢測裝置會將待檢測歌曲劃分為多幀歌曲,并獲取每一幀歌曲的特征,如果某一幀歌曲的特征滿足第一策略,則得到了包含歌聲的一幀歌曲,則儲存該幀歌曲的標(biāo)識信息;為了更準(zhǔn)確得到歌聲位置,還需要進(jìn)一步地將上述位置確定的結(jié)果與通過第二策略得到的位置進(jìn)行比較得到最終結(jié)果,具體地,將待檢測歌曲的所有幀歌曲中,特征滿足第二策略的第一個幀歌曲的標(biāo)識信息,與上述儲存的標(biāo)識信息進(jìn)行比較,選擇某一個標(biāo)識信息對應(yīng)幀歌曲的位置作為歌聲的位置,這樣得到的歌聲位置較為準(zhǔn)確。本實(shí)施例的方法可以快速準(zhǔn)確地檢測出歌聲位置。
      【專利說明】一種歌聲位置檢測方法及裝置

      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及centroidspectral centroid歌聲位置檢測方法及裝置信息處理技術(shù) 領(lǐng)域,特別涉及歌聲位置檢測方法及裝置。

      【背景技術(shù)】
      [0002] 在音樂的分析中,對于歌聲的分析是一個很重要的課題,尤其是在流行音樂中,歌 聲部分的分析,首先是定位歌聲的位置?,F(xiàn)有的歌聲位置檢測方法,有些是完全根據(jù)經(jīng)驗(yàn)對 所有的歌曲都按照同樣的時間點(diǎn)來截取一段歌曲,然后對這段歌曲進(jìn)行分析,雖然這一方 法符合大部分音樂特性,但是存在著一定的缺陷,畢竟,歌曲種類千差萬別,必然會出現(xiàn)所 截取的歌曲段并不是有效段的情況。另外一些方法,主要是探究更好的提取流行音樂的歌 聲部分,然而這類方法的計算量很大,不適合廣泛的應(yīng)用。


      【發(fā)明內(nèi)容】

      [0003] 本發(fā)明實(shí)施例提供歌聲位置檢測方法及裝置,快速準(zhǔn)確地檢測出歌聲位置。
      [0004] 本發(fā)明實(shí)施例提供一種歌聲位置檢測方法,包括:
      [0005] 獲取待檢測歌曲或經(jīng)過至少一次處理后的待檢測歌曲中當(dāng)前幀歌曲的特征,所述 待檢測歌曲劃分為多巾貞歌曲;
      [0006] 如果所述當(dāng)前幀歌曲的特征滿足預(yù)置的第一策略,儲存所述當(dāng)前幀歌曲的標(biāo)識信 息;
      [0007] 將所述待檢測歌曲的所有幀歌曲中,特征滿足預(yù)置的第二策略的第一個幀歌曲的 標(biāo)識信息,與儲存的所述標(biāo)識信息進(jìn)行比較,選擇某一標(biāo)識信息對應(yīng)幀歌曲所在位置作為 所述待檢測歌曲中包含歌聲的位置;
      [0008] 其中,所述選擇的標(biāo)識信息對應(yīng)幀歌曲排在所述待檢測歌曲較后的位置。
      [0009] 本發(fā)明實(shí)施例提供一種歌聲位置檢測裝置,包括:
      [0010] 特征獲取單元,用于獲取待檢測歌曲或經(jīng)過至少一次處理后的待檢測歌曲中當(dāng)前 幀歌曲的特征,所述待檢測歌曲劃分為多幀歌曲;
      [0011] 儲存單元,用于如果所述特征獲取單元獲取的當(dāng)前幀歌曲的特征滿足預(yù)置的第一 策略,儲存所述當(dāng)前幀歌曲的標(biāo)識信息;
      [0012] 比較選擇單元,用于將所述待檢測歌曲的所有幀歌曲中,特征滿足預(yù)置的第二策 略的第一個幀歌曲的標(biāo)識信息,與儲存單元儲存的所述標(biāo)識信息進(jìn)行比較,選擇某一標(biāo)識 信息對應(yīng)幀歌曲所在位置作為所述待檢測歌曲中包含歌聲的位置;
      [0013] 其中,所述選擇的標(biāo)識信息對應(yīng)幀歌曲排在所述待檢測歌曲較后的位置。
      [0014] 本實(shí)施例中,歌聲位置檢測裝置會將待檢測歌曲劃分為多幀歌曲,并獲取每一幀 歌曲的特征,如果某一幀歌曲的特征滿足第一策略,則得到了包含歌聲的一幀歌曲,則儲存 該幀歌曲的標(biāo)識信息;為了更準(zhǔn)確得到歌聲位置,還需要進(jìn)一步地將上述位置確定的結(jié)果 與通過第二策略得到的位置進(jìn)行比較得到最終結(jié)果,具體地,將待檢測歌曲的所有幀歌曲 中,特征滿足第二策略的第一個幀歌曲的標(biāo)識信息,與上述儲存的標(biāo)識信息進(jìn)行比較,選擇 某一個標(biāo)識信息對應(yīng)幀歌曲的位置作為歌聲的位置,這樣得到的歌聲位置較為準(zhǔn)確。且由 于本實(shí)施例中在獲取歌曲的特征時以幀為單位,而一幀歌曲的長度較少,則在得到一幀歌 曲的特征時,相比得到整個歌曲的特征的計算量少,進(jìn)而使得本實(shí)施例中整個歌聲位置檢 測的流程所花費(fèi)時間少。綜上所述,本實(shí)施例的方法可以快速準(zhǔn)確地檢測出歌聲位置。

      【專利附圖】

      【附圖說明】
      [0015] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可 以根據(jù)這些附圖獲得其他的附圖。
      [0016] 圖1是本發(fā)明實(shí)施例提供的一種歌聲位置檢測方法的流程圖;
      [0017] 圖2是本發(fā)明實(shí)施例提供的另一種歌聲位置檢測方法的流程圖;
      [0018] 圖3是本發(fā)明應(yīng)用實(shí)施例中提供的一種歌聲位置檢測方法的流程圖;
      [0019] 圖4是本發(fā)明實(shí)施例提供的一種歌聲位置檢測裝置的結(jié)構(gòu)圖;
      [0020] 圖5是本發(fā)明實(shí)施例提供的另一種歌聲位置檢測裝置的結(jié)構(gòu)圖;
      [0021] 圖6是本發(fā)明實(shí)施例提供的另一種歌聲位置檢測裝置的結(jié)構(gòu)圖。

      【具體實(shí)施方式】
      [0022] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
      [0023] 本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語"第一"、"第二"、"第三""第 四"等(如果存在)是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該 理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例例如能夠以 除了在這里圖示或描述的那些以外的順序?qū)嵤4送?,術(shù)語"包括"和"具有"以及他們的任 何變形,意圖在于覆蓋不排它的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、 產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ?這些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
      [0024] 本發(fā)明實(shí)施例提供一種歌聲位置檢測方法,主要是檢測出某一段歌曲中的唱歌聲 部分的位置,該方法可以被廣泛應(yīng)用在歌聲相關(guān)分析系統(tǒng)中前端處理的歌聲位置檢測過程 中,比如應(yīng)用在歌唱者身份識別、音樂檢索和歌曲指紋匹配等領(lǐng)域,本實(shí)施例的方法是歌聲 位置檢測裝置所執(zhí)行的方法,流程圖如圖1所示,包括:
      [0025] 步驟101,獲取待檢測歌曲或經(jīng)過至少一次處理后的待檢測歌曲中當(dāng)前幀歌曲的 特征,該待檢測歌曲劃分為多幀歌曲。其中至少一次處理可以包括帶通濾波等處理,是為了 更好且準(zhǔn)確地得到歌曲的特征的處理。
      [0026] 可以理解,本實(shí)施例中,歌聲位置檢測裝置首先要將待檢測歌曲劃分為多幀歌曲, 分別計算每一幀歌曲的特征,這里歌曲的特征可以包括能量特征、過零率和譜通量,其中 過零率是某一幀歌曲中信號樣本改變符號的次數(shù),用來估計歌曲信號的過零頻率;譜通量 用來描述歌曲信號的頻譜變化率。且獲取歌曲的特征還可以包括其它特征,比如譜差異 (spectral difference)和譜矩心(spectral centroid)等。
      [0027] 步驟102,判斷當(dāng)前幀歌曲的特征是否滿足預(yù)置的第一策略,如果滿足,則執(zhí)行步 驟103,如果不滿足,則需要針對待檢測歌曲中下一幀歌曲返回執(zhí)行上述步驟101。
      [0028] 這里預(yù)置的第一策略可以是用戶預(yù)先設(shè)置在歌聲位置檢測裝置中的,是能說明在 某一幀歌曲中包含了歌聲的策略,且針對不同的特征有不同的策略,比如對于能量特征,一 般情況下,歌曲中包含歌聲部分的能量大于純音樂部分的能量,則一幀歌曲的能量需要超 過預(yù)置的第一閾值;對于過零率,一般情況下包含人聲的部分過零率比較高,則一幀歌曲的 過零率需要超過預(yù)置的第二閾值;對于譜通量,一幀歌曲的譜通量需要超過預(yù)置的第三閾 值。上述第一閾值到第三閾值是歌曲中包含歌聲部分時,一般情況下,該部分歌曲信號所具 有的特征值。
      [0029] 步驟103,儲存當(dāng)前幀歌曲的標(biāo)識信息,這里當(dāng)前幀歌曲的標(biāo)識信息是用于標(biāo)識當(dāng) 前幀歌曲是哪一幀的歌曲,比如能標(biāo)識當(dāng)前幀歌曲是哪一幀的幀索引等信息。
      [0030] 步驟104,當(dāng)對待檢測歌曲的所有幀歌曲都執(zhí)行了上述步驟101到102,并對部分 幀歌曲執(zhí)行了上述步驟103之后,歌聲位置檢測裝置還需要得到待檢測歌曲的所有幀歌曲 中,特征滿足預(yù)置的第二策略的第一個幀歌曲的標(biāo)識信息,并將該標(biāo)識信息與上述步驟103 中儲存的標(biāo)識信息進(jìn)行比較。
      [0031] 其中預(yù)置的第二策略可以包括某一個特征(比如能量特征、過零率或譜通量等)超 過預(yù)置的值,其中由于歌曲的能量特征比較重要,在實(shí)際實(shí)現(xiàn)時,一般是將預(yù)置的第二策略 設(shè)置為:一幀歌曲的能量超過預(yù)置的值。這里得到的第一幀歌曲是指在所有幀歌曲中第一 個能滿足第二策略的一幀歌曲,說明,從該幀歌曲開始,以后的歌曲中會包含歌聲部分。
      [0032] 步驟105,選擇某一標(biāo)識信息對應(yīng)幀歌曲所在位置作為待檢測歌曲中包含歌聲的 位置。
      [0033] 如果用幀索引來表示上述標(biāo)識信息,且?guī)饕前凑者f增的方式來標(biāo)識每一幀歌 曲,則如果標(biāo)識信息即幀索引較大,該標(biāo)識信息所標(biāo)識的一幀歌曲排在待檢測歌曲較后的 位置,因此,在執(zhí)行本步驟的選擇時,由于在一段歌曲中,歌聲并不一定是連續(xù)地包含在歌 曲中,也就是說歌曲中包含歌聲的位置有多處,這里可以選擇標(biāo)識信息較大的多幀歌曲所 在位置作為待檢測歌曲中包含歌聲的位置。
      [0034] 可見,本實(shí)施例中,歌聲位置檢測裝置會將待檢測歌曲劃分為多幀歌曲,并獲取每 一幀歌曲的特征,如果某一幀歌曲的特征滿足第一策略,則得到了包含歌聲的一幀歌曲,則 儲存該幀歌曲的標(biāo)識信息;為了更準(zhǔn)確得到歌聲位置,還需要進(jìn)一步地將上述位置確定的 結(jié)果與通過第二策略得到的位置進(jìn)行比較得到最終結(jié)果,具體地,將待檢測歌曲的所有幀 歌曲中,特征滿足第二策略的第一個幀歌曲的標(biāo)識信息,與上述儲存的標(biāo)識信息進(jìn)行比較, 選擇某一個標(biāo)識信息對應(yīng)幀歌曲的位置作為歌聲的位置,這樣得到的歌聲位置較為準(zhǔn)確。 且由于本實(shí)施例中在獲取歌曲的特征時以幀為單位,而一幀歌曲的長度較少,則在得到一 幀歌曲的特征時,相比得到整個歌曲的特征的計算量少,進(jìn)而使得本實(shí)施例中整個歌聲位 置檢測的流程所花費(fèi)時間少。綜上所述,本實(shí)施例的方法可以快速準(zhǔn)確地檢測出歌聲位置。
      [0035] 參考圖2所示,在另一個具體的實(shí)施例中,歌聲位置檢測裝置在針對能量特征和 過零率執(zhí)行上述不足后101之前,還可以執(zhí)行步驟201 ;且在執(zhí)行完上述步驟101之后,需 要先執(zhí)行步驟202后再執(zhí)行步驟102,具體地:
      [0036] 步驟202,對待檢測歌曲進(jìn)行帶通濾波。
      [0037] 由于人聲(即歌聲)的頻帶一般處于340?2500Hz以內(nèi),則在獲取歌曲的特征之 前,有必要去除歌聲頻帶以外的成分,以突出人聲的影響,具體地,可以采用如無限脈沖響 應(yīng)(Infinite Impulse Response, IIR)帶通數(shù)字濾波器等對待檢測歌曲進(jìn)行帶通濾波。
      [0038] 且該帶通濾波的主要是針對能量特征和過零率,對于譜通量來說是表示幀間頻譜 的變化速率,反應(yīng)的是頻譜在時間上的起伏,加了帶通濾波后,對于非歌聲頻譜會有消弱, 獲取的歌聲部分和非歌聲部分的頻譜在時間上的差異會存在不可靠性,因此,在計算譜通 量時,不需要對歌曲進(jìn)行帶通濾波。
      [0039] 步驟201,如果當(dāng)前幀歌曲為待檢測歌曲中前段部分歌曲,則對獲取的所述當(dāng)前幀 歌曲的特征進(jìn)行抑制,即將特征值設(shè)置在閾值以下,這里個閾值可以是歌曲中不包含歌聲 的閾值。
      [0040] 由于歌曲之間的特征是千差萬別的,但在一般情況下,一首歌曲的前一段,往往是 前奏部分,沒有歌聲,為了不讓前奏中歌曲的特征值過大而干擾最終的檢測結(jié)果,需要對前 奏部分的特征值進(jìn)行抑制。而其中前奏部分的設(shè)定可以是用戶根據(jù)實(shí)際預(yù)置在歌聲位置檢 測裝置中的,比如設(shè)置一個待檢測歌曲中前20s的部分歌曲為前奏部分。
      [0041] 在另一個具體的實(shí)施例中,歌聲位置檢測裝置具體在執(zhí)行上述步驟101時,根據(jù) 特征的不同,有不同的獲取方法,具體地:
      [0042] (1)特征為能量特征

      【權(quán)利要求】
      1. 一種歌聲位置檢測方法,其特征在于,包括: 獲取待檢測歌曲或經(jīng)過至少一次處理后的待檢測歌曲中當(dāng)前幀歌曲的特征,所述待檢 測歌曲劃分為多巾貞歌曲; 如果所述當(dāng)前幀歌曲的特征滿足預(yù)置的第一策略,儲存所述當(dāng)前幀歌曲的標(biāo)識信息; 將所述待檢測歌曲的所有幀歌曲中,特征滿足預(yù)置的第二策略的第一個幀歌曲的標(biāo)識 信息,與儲存的所述標(biāo)識信息進(jìn)行比較,選擇某一標(biāo)識信息對應(yīng)幀歌曲所在位置作為所述 待檢測歌曲中包含歌聲的位直; 其中,所述選擇的標(biāo)識信息對應(yīng)幀歌曲排在所述待檢測歌曲較后的位置。
      2. 如權(quán)利要求1所述的方法,其特征在于,所述獲取的待檢測歌曲中當(dāng)前幀歌曲的特 征包括:能量特征、過零率和譜通量; 所述預(yù)置的第一策略包括:一幀歌曲的能量大于預(yù)置的第一閾值,過零率大于預(yù)置的 第二閾值,且譜通量大于預(yù)置的第三閾值; 所述預(yù)置的第二策略包括:一幀歌曲的某一特征大于預(yù)置的值。
      3. 如權(quán)利要求1所述的方法,其特征在于,所述獲取待檢測歌曲或經(jīng)過至少一次處理 后的待檢測歌曲中當(dāng)如巾貞歌曲的特征之后,還包括: 如果所述當(dāng)前幀歌曲為所述待檢測歌曲中前段部分歌曲,則對獲取的所述當(dāng)前幀歌曲 的特征進(jìn)行抑制。
      4. 如權(quán)利要求2或3所述的方法,其特征在于,如果所述特征為能量特征,則所述獲取 待檢測歌曲中當(dāng)如巾貞歌曲的特征,具體包括: 計算所述當(dāng)前幀歌曲的信號的平方和; 用所述平方和與所述待檢測歌曲中所有幀歌曲的信號的平方和的最大值的商作為所 述當(dāng)前幀歌曲的能量特征。
      5. 如權(quán)利要求2或3所述的方法,其特征在于,如果所述特征為過零率,則所述獲取待 檢測歌曲中當(dāng)前幀歌曲的特征,具體包括: 計算所述當(dāng)前幀歌曲的信號中樣本改變符號的次數(shù); 用所述次數(shù)與所述待檢測歌曲中所有幀歌曲的信號對應(yīng)樣本改變符號次數(shù)的最大值 的商作為所述當(dāng)前幀歌曲的過零率。
      6. 如權(quán)利要求4或5所述的方法,其特征在于,所述獲取待檢測歌曲中當(dāng)前幀歌曲的特 征之前,還包括: 對所述待檢測歌曲進(jìn)行帶通濾波; 所述獲取經(jīng)過至少一次處理后的待檢測歌曲中當(dāng)前幀歌曲的特征,具體包括:獲取經(jīng) 過所述帶通濾波后的待檢測歌曲中當(dāng)前幀歌曲的特征。
      7. 如權(quán)利要求2或3所述的方法,其特征在于,如果所述特征為譜通量,則所述獲取待 檢測歌曲中當(dāng)前幀歌曲的特征,具體包括: 計算所述當(dāng)前幀歌曲的信號與前一幀歌曲的信號歸一化頻譜系數(shù)的差的平方和,并將 所述平方和作為所述當(dāng)前幀歌曲的譜通量。
      8. -種歌聲位置檢測裝置,其特征在于,包括: 特征獲取單元,用于獲取待檢測歌曲或經(jīng)過至少一次處理后的待檢測歌曲中當(dāng)前幀歌 曲的特征,所述待檢測歌曲劃分為多幀歌曲; 儲存單元,用于如果所述特征獲取單元獲取的當(dāng)前幀歌曲的特征滿足預(yù)置的第一策 略,儲存所述當(dāng)前幀歌曲的標(biāo)識信息; 比較選擇單元,用于將所述待檢測歌曲的所有幀歌曲中,特征滿足預(yù)置的第二策略的 第一個幀歌曲的標(biāo)識信息,與儲存單元儲存的所述標(biāo)識信息進(jìn)行比較,選擇某一標(biāo)識信息 對應(yīng)幀歌曲所在位置作為所述待檢測歌曲中包含歌聲的位置; 其中,所述選擇的標(biāo)識信息對應(yīng)幀歌曲排在所述待檢測歌曲較后的位置。
      9. 如權(quán)利要求8所述的裝置,其特征在于,還包括: 抑制單元,用于如果所述當(dāng)前幀歌曲為所述待檢測歌曲中前段部分歌曲,則對獲取的 所述當(dāng)前幀歌曲的特征進(jìn)行抑制。
      10. 如權(quán)利要求8或9所述的裝置,其特征在于,所述特征獲取單元,具體包括: 能量特征計算單元,用于計算所述當(dāng)前幀歌曲的信號的平方和;用所述平方和與所 述待檢測歌曲中所有幀歌曲的信號的平方和的最大值的商作為所述當(dāng)前幀歌曲的能量特 征; 過零計算單元,用于計算所述當(dāng)前幀歌曲的信號中樣本改變符號的次數(shù);用所述次數(shù) 與所述待檢測歌曲中所有幀歌曲的信號對應(yīng)樣本改變符號次數(shù)的最大值的商作為所述當(dāng) 前幀歌曲的過零率。
      11. 如權(quán)利要求10所述的裝置,其特征在于,還包括: 濾波單元,用于對所述待檢測歌曲進(jìn)行帶通濾波; 則所述特征獲取單元,具體用于獲取經(jīng)過所述帶通濾波后的待檢測歌曲中當(dāng)前幀歌曲 的特征。
      12. 如權(quán)利要求8或9所述的裝置,其特征在于,所述特征獲取單元,具體包括: 譜通量計算單元,用于計算所述當(dāng)前幀歌曲的信號與前一幀歌曲的信號歸一化頻譜系 數(shù)的差的平方和,并將所述平方和作為所述當(dāng)前幀歌曲的譜通量。
      【文檔編號】G10L25/48GK104091600SQ201410109432
      【公開日】2014年10月8日 申請日期:2014年3月21日 優(yōu)先權(quán)日:2014年3月21日
      【發(fā)明者】孔令城 申請人:騰訊科技(深圳)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1