国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種大數(shù)據(jù)語(yǔ)音分類方法

      文檔序號(hào):8382010閱讀:268來(lái)源:國(guó)知局
      一種大數(shù)據(jù)語(yǔ)音分類方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及一種大數(shù)據(jù)語(yǔ)音分類方法。
      【背景技術(shù)】
      [0002] 隨著移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,帶有數(shù)字?jǐn)z像頭智能手機(jī)、平板電腦越來(lái)越多的進(jìn) 入人們的生活,很容易產(chǎn)生大量的個(gè)人語(yǔ)音信息。雖然利用時(shí)間和目錄對(duì)語(yǔ)音數(shù)據(jù)進(jìn)行管 理是一種常見(jiàn)的方法,但是缺乏語(yǔ)義層面對(duì)語(yǔ)音進(jìn)行有效的管理。因此利用監(jiān)督學(xué)習(xí)方法, 通過(guò)學(xué)習(xí)人工標(biāo)注數(shù)據(jù),以獲得語(yǔ)音分類模型,然后對(duì)沒(méi)有標(biāo)注的語(yǔ)音進(jìn)行自動(dòng)語(yǔ)音分類。 由于語(yǔ)音通常的特征維數(shù)非常高,因此傅里葉變換法有助于識(shí)別性能的提高。
      [0003] 傳統(tǒng)的全局線性傅里葉變換方法主要是基于線性的,其中線性判別分析被廣泛地 應(yīng)用在模式分類問(wèn)題上。線性判別分析法主要通過(guò)最大化類間距離的同時(shí)使類內(nèi)樣本間距 離最小,從而實(shí)現(xiàn)不同類別之間的可分性。但是,大數(shù)據(jù)圖像分類面臨著類別數(shù)巨大,需要 分類的樣本數(shù)量巨大等困難。線性判別分析對(duì)于大數(shù)據(jù)而言,使用成本是比較高的,為了獲 得一定的分類性能,它需要人工大量的標(biāo)注樣本。這使得語(yǔ)音分類軟件開(kāi)發(fā)成本大量增加, 需要人工大量的標(biāo)注樣本。
      [0004] 因此,尋找一個(gè)需要標(biāo)注少量樣本即可得到滿足要求的自動(dòng)語(yǔ)音分類方法是非常 必要的。

      【發(fā)明內(nèi)容】

      [0005] 本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種大數(shù)據(jù)語(yǔ)音分類方法,減少軟件開(kāi)發(fā)成 本,合理對(duì)大量的語(yǔ)音數(shù)據(jù)進(jìn)行有效地分類,辨別以及處理。
      [0006] 本發(fā)明解決上述技術(shù)問(wèn)題的技術(shù)方案如下:一種大數(shù)據(jù)語(yǔ)音分類方法,包括如下 步驟:
      [0007] 1)收集語(yǔ)音樣本作為訓(xùn)練集;
      [0008] 2)尋找大數(shù)據(jù)語(yǔ)音分類最優(yōu)的頻譜矩陣;
      [0009] 3)對(duì)無(wú)標(biāo)注數(shù)據(jù)進(jìn)行頻譜分析;
      [0010] 4)對(duì)頻譜數(shù)據(jù)采用頻段對(duì)大數(shù)據(jù)語(yǔ)音進(jìn)行分類。
      [0011] 優(yōu)選地,所述尋找大數(shù)據(jù)語(yǔ)音分類最優(yōu)的頻譜矩陣,包括以下步驟:
      [0012] 步驟1、建立局部?jī)?yōu)化目標(biāo)函數(shù);
      [0013] 步驟2、建立全局優(yōu)化目標(biāo)函數(shù);
      [0014] 步驟3、利用傅里葉變換算法:將新的全局優(yōu)化目標(biāo)的問(wèn)題轉(zhuǎn)換為求廣義特征值 問(wèn)題,大數(shù)據(jù)語(yǔ)音分類最優(yōu)的頻譜矩陣由式子
      【主權(quán)項(xiàng)】
      1. 一種大數(shù)據(jù)語(yǔ)音分類方法,其特征在于,包括如下步驟: 1) 收集語(yǔ)音樣本作為訓(xùn)練集; 2) 尋找大數(shù)據(jù)語(yǔ)音分類最優(yōu)的頻譜矩陣; 3) 對(duì)無(wú)標(biāo)注數(shù)據(jù)進(jìn)行頻譜分析; 4) 對(duì)頻譜數(shù)據(jù)采用頻段對(duì)大數(shù)據(jù)語(yǔ)音進(jìn)行分類。
      2. 根據(jù)權(quán)利要求1所述的大數(shù)據(jù)語(yǔ)音分類方法,其特征在于,所述尋找大數(shù)據(jù)語(yǔ)音分 類最優(yōu)的頻譜矩陣,包括以下步驟: 步驟1、建立局部?jī)?yōu)化目標(biāo)函數(shù); 步驟2、建立全局優(yōu)化目標(biāo)函數(shù); 步驟3、利用傅里葉變換算法:將新的全局優(yōu)化目標(biāo)的問(wèn)題轉(zhuǎn)換為求廣義特征值問(wèn)題,
      t 大數(shù)據(jù)語(yǔ)音分類最優(yōu)的頻譜矩陣由式子 的前m 個(gè)最小特征值對(duì)應(yīng)的X(n,k)。
      【專利摘要】本發(fā)明公開(kāi)了一種大數(shù)據(jù)語(yǔ)音分類方法,包括如下步驟:1)收集語(yǔ)音樣本作為訓(xùn)練集;2)尋找大數(shù)據(jù)語(yǔ)音分類最優(yōu)的頻譜矩陣;3)對(duì)無(wú)標(biāo)注數(shù)據(jù)進(jìn)行頻譜分析;4)對(duì)頻譜數(shù)據(jù)采用頻段對(duì)大數(shù)據(jù)語(yǔ)音進(jìn)行分類。利用本發(fā)明提出的方法,能夠有效地找出大數(shù)據(jù)情況下,不同語(yǔ)音數(shù)據(jù)的特征信息從而得到各類相關(guān)數(shù)據(jù)的有效分類,有效地減少訓(xùn)練過(guò)程中的存儲(chǔ)成本,其分類準(zhǔn)確度高于現(xiàn)有技術(shù)。
      【IPC分類】G10L15-08
      【公開(kāi)號(hào)】CN104700833
      【申請(qǐng)?zhí)枴緾N201410844027
      【發(fā)明人】高輝, 尚成輝
      【申請(qǐng)人】蕪湖樂(lè)銳思信息咨詢有限公司
      【公開(kāi)日】2015年6月10日
      【申請(qǐng)日】2014年12月29日
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1